説明

モジュラーDNA結合ドメインおよび使用方法

本発明は、ポリペプチドによってDNA配列内の塩基対を選択的に認識する方法、DNA配列内の1つ以上の塩基対を特異的に認識する修飾されたポリペプチド、およびポリペプチドによって特異的に認識され得るように修飾されるDNA、および特異的DNA標的化におけるポリペプチドおよびDNAの使用、ならびに細胞中の標的遺伝子の発現を調節する方法に言及する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ポリペプチドによって標的DNA配列内の塩基対を選択的に認識する方法、標的DNA配列内の1つ以上の塩基対を特異的に認識する修飾されたポリペプチド、およびポリペプチドによって特異的に認識され得るように修飾されるDNA、および特異的DNA標的化におけるポリペプチドおよびDNAの使用、ならびに細胞中の標的遺伝子の発現を調節する方法に関する。
【背景技術】
【0002】
キサントモナス属の植物病原性細菌は、多くの重要な作物に重度の疾患を引き起こす。この細菌は、大型転写活性化因子様(TAL)/AvrBs3様エフェクターファミリーのメンバーを含むエフェクターの備蓄を、III型分泌系を介して、植物細胞へと転座させる(Kay&Bonas(2009)Curr.Opin.Microbiol.12:37−43、White&Yang(2009)Plant Physiol.doi:10.1104/pp.1109.139360、Schornack et al.(2006)J.Plant Physiol.163:256−272)。キサントモナスの主要な病原性因子であるTALエフェクターは、縦列反復の中央ドメイン、核局在シグナル(NLS)、および活性化ドメイン(AD)を含有し、植物細胞中の転写因子として作用する(Kay et al.(2007)Science318:648−651、Roemer et al.(2007)Science318:645−648、Gu et al.(2005)Nature435、1122−1125、図1a)。このエフェクターファミリーのタイプメンバーである、キサントモナス・カンペストリス・パソバー・ベシカトリアからのAvrBs3は、17.5反復を含有し、トウガラシ植物内のBs3抵抗性遺伝子を含むUPA(AvrBs3によって上方制御された)遺伝子の発現を誘発する(Kay et al.(2007)Science318:648−651、Roemer et al.(2007)Science318:645−648、Marois et al.(2002)Mol.Plant−Microbe Interact.15:637−646)。TALエフェクター内での反復の数および順序が、その比活性を決定する(Herbers et al.(1992)Nature356:172−174)。この反復がAvrBs3のDNA結合に必須であり、新規DNA結合ドメインを構成することが示された(Kay et al.(2007)Science318:648−651)。このドメインがどのようにDNAに接触するか、および何が特異性を決定するかは依然として謎である。
【0003】
選択的遺伝子発現は、タンパク質転写因子の、遺伝子の制御性領域内での特異的ヌクレオチド配列との相互作用を介して仲介される。DNA結合タンパク質ドメインが、異なるDNA配列間を識別することができる様態は、分化および発生における遺伝子発現の制御等の、極めて重要なプロセスを理解するのに重要な議題である。
【0004】
所望のDNA標的を認識するDNA結合ドメインを特異的に設計および生成する能力は、バイオテクノロジーにおいて非常に望ましい。かかる能力は、標的DNA結合によって遺伝子発現を調節する能力を備えるカスタム転写因子の開発に有用であり得る。例としては、所望の標的DNA配列に特異的な、カスタム亜鉛フィンガーDNA結合タンパク質の設計を用いて行われる大規模な操作が挙げられる(Choo et al.(1994)Nature372:645、Pomerantz et al.,(1995)Science267:93−96、Liu et al.,Proc.Natl.Acad.Sci.USA94:5525−5530(1997)、Guan et al.(2002)Proc.Natl.Acad.Sci.USA99:13296−13301、米国特許第7,273,923号、米国特許第7,220,719号)。さらに、デザイナーDNA結合ドメインを含有するポリペプチドは、ポリペプチド内のヌクレアーゼ触媒ドメイン等のドメインを修飾するDNAの組み込みによって、実際の標的DNA配列を修飾するために利用することができる。かかる例としては、非特異的ヌクレアーゼドメインと組み合わせた、メガヌクレアーゼ/ホーミングエンドヌクレアーゼDNA認識部位のDNA結合ドメイン(米国特許出願第2007/0141038号を参照されたい)、修飾されたメガヌクレアーゼDNA認識部位および/または同一のまたは異なるメガヌクレアーゼからのヌクレアーゼドメイン(米国特許出願公開第20090271881号を参照されたい)、および典型的にFokI等のIIS型制限エンドヌクレアーゼからの、ヌクレアーゼ活性を備えるドメインと組み合わせた亜鉛フィンガードメイン(Bibikova et al.(2003)Science300:764、Urnov et al.(2005)Nature435,646、Skukla,et al.(2009)Nature459,437−441、Townsend et al.(2009)Nature459:442445、Kim et al.(1996)Proc.NatlAcad.Sci USA93:1156−1160、米国特許第7,163,824号)が挙げられる。カスタム亜鉛フィンガーDNA結合ドメインを特定するために利用される現在の方法は、所望のDNA特異性を備えるマルチフィンガードメインを生成するために、大型無作為化ライブラリ(典型的に10超のサイズ)を利用する、組み合わせ選択に基づく方法を採用する(Greisman&Pabo(1997)Science275:657−661、Hurt et al.(2003)Proc NatlAcad Sci USA100:12271−12276、Isalan et al.(2001)Nat Biotechnol19:656−660。かかる方法は、時間がかかり、技術的に要求が厳しく、かつ潜在的に相当の費用がかかる。DNA結合ポリペプチドの操作のための、単純な認識コードの特定は、所望のヌクレオチド標的を認識するDNA結合ドメインを設計するための現在の方法を上回る有意な前進を表すであろう。
【発明の概要】
【0005】
本発明は、DNA配列内の塩基対を選択的に認識するポリペプチドを産生する方法を提供し、この方法は、反復ドメインを含むポリペプチドを合成することを含み、ここで反復ドメインは、転写活性化因子様(TAL)エフェクターに由来する少なくとも1つの反復単位を含み、ここで反復単位は、DNA配列内の塩基対の認識を決定する高度可変領域を含み、ここで反復単位は、DNA配列内の1つの塩基対の認識に関与する。本発明のこれらのポリペプチドは、本発明の反復単位を含み、その後、最終目的ベクターへと組み立てることができる、標的ベクター内の反復単位を事前組み立てすることによるモジュラーアプローチによって構築することができる。本発明は、この方法で産生されるポリペプチド、ならびにポリペプチドをコードするDNA配列、およびかかるDNA配列を含む宿主生物および細胞を提供する。
【0006】
本発明は、ポリペプチドによって、標的DNA配列内の塩基対を選択的に認識する方法を提供し、ここでポリペプチドは、反復単位を含む少なくとも1つの反復ドメインを含み、ここで反復単位は、各々、標的DNA配列内の塩基対の認識を決定する高度可変領域を含む。
【0007】
より具体的には、本発明者らは、標的DNA配列内の塩基対の選択的認識に関与する、DNA結合ポリペプチド内におけるアミノ酸を決定した。認識コードの解明と共に、ポリペプチド内で選択されたアミノ酸によって標的DNA配列内の特異的塩基対を認識するための一般原則が決定された。本発明者らは、異なる長さの反復単位配列の部分である特定タイプの反復単位が、1つの規定/特異的塩基対を認識する能力を有することを見出している。反復ドメインを形成する各反復単位内で、高度可変領域は、標的DNA配列内の塩基対の特異的な認識に関与する。
【0008】
したがって、本発明は、反復単位を含む少なくとも1つの反復ドメインを含むポリペプチドによって、標的DNA配列内の塩基対を選択的に認識する方法だけでなく、ポリペプチド内の反復ドメインによって、選択的に認識される標的DNA配列が生成され得る方法も提供する。
【0009】
本発明はまた、特異的DNA配列を認識するポリペプチドを構築する方法を提供する。本発明のこれらのポリペプチドは、本発明の反復単位を含み、その後、最終目的ベクターへと組み立てることができる、標的ベクター内の反復単位を事前組み立てすることによるモジュラーアプローチによって構築することができる。
【0010】
本発明はまた、目的の標的DNA配列に特異的なモジュラー反復単位を構築すること、ポリペプチドが今度は標的DNAを認識することを可能にするために、反復単位の付加によってポリペプチドを修飾すること、修飾されたポリペプチドが標的DNA配列を認識することを可能にするために、修飾されたポリペプチドを原核または真核細胞中に導入または発現すること、およびかかる認識の結果として、細胞中の標的遺伝子の発現を調節することによる、遺伝子発現の標的調節のための方法を提供する。
【0011】
本発明はまた、標的DNA配列を認識する、本発明の少なくとも1つの反復ドメインを含むポリペプチドの構築による、標的DNA配列の指向性修飾のための方法を提供し、ポリペプチドはまた、標的DNAを修飾することができる機能ドメインを含有し(部位特異的組み換え、ドナー標的配列の制限または統合を介して等)、それによって複合ゲノム内の標的DNA修飾を可能にする。
【0012】
本発明はさらに、反復単位を含む少なくとも1つの反復ドメインを含む修飾されたポリペプチドの産生を提供し、ここで反復単位の各々の内の高度可変領域は、標的DNA配列内の塩基対の選択的認識を決定する。
【0013】
本発明のさらなる実施形態では、上述の反復ドメインを含有するポリペプチドをコードするDNAが提供される。
【0014】
本発明のさらなる実施形態では、標的DNA配列内に位置する1つ以上の塩基対の各々が、対応する反復単位を有する反復ドメインを含むポリペプチドによって特異的に認識され得るように、標的DNA配列内に位置する1つ以上の塩基対を含むように修飾されるDNAが提供され、各反復単位は、DNA内の対応する塩基対の認識を決定する高度可変領域を含む。
【0015】
本発明のさらなる実施形態では、ポリペプチドおよびDNAの使用が提供される。さらに、本発明の単離された核酸分子、および本発明のコード配列によってコードされるタンパク質またはポリペプチドで形質転換された植物、植物部分、種子、植物細胞、および他の非ヒト宿主細胞が提供される。またさらに、本明細書に記載されるポリペプチドおよびDNAは、動物およびヒト細胞、ならびに真菌または植物等の他の生物の細胞に導入することができる。
【0016】
要約すると、本発明は、ポリペプチドによって、標的DNA配列内の塩基対を選択的に認識する方法に焦点を合わせ、ここでポリペプチドは、反復単位を含む少なくとも1つの反復ドメインを含み、ここで各反復単位は、標的DNA配列内の塩基対の認識を決定する高度可変領域を含有し、ここで連続した反復単位は、標的DNA配列内の連続した塩基対に相当する。
【図面の簡単な説明】
【0017】
【図1】TALエフェクターのDNA標的特異性のためのモデル。(A)TALエフェクターは、中央縦列反復単位(赤色)、核局在シグナル(NLS)、および活性化ドメイン(AD)を含有する。AvrBs3の第1反復のアミノ酸配列。高度可変アミノ酸12および13は、灰色で網掛けされている。(B)17.5個のAvrBs3反復単位の12位および13位における高度可変アミノ酸は、UPAボックスコンセンサス(21)に対して整列される。(C)誘発遺伝子のプロモーター内のTALエフェクターの反復単位および予測標的配列は、手動で整列された。各反復内の高度可変アミノ酸に相当する上部DNA鎖内のヌクレオチドは、8つのエフェクターと、実験的に特定された標的遺伝子との次の組み合わせに基づいて数えられた:AvrBs3/Bs3、UPA10、UPA12、UPA14、UPA19、UPA20、UPA21、UPA23、UPA25、AvrBs3Δrep16/Bs3−E、AvrBs3Δrep109/Bs3、AvrHah1/Bs3、AvrXa27/Xa27、PthXo1/Xa13、PthXo6/OsTFX1、PthXo7/OsTFIIAγ1(図5参照)。優性の組み合わせ(n>4)は、灰色で網掛けされている。アスタリスクは、この反復タイプでアミノ酸13が欠損していることを示す。(D)高度可変アミノ酸12および13(この研究で実験的に証明された)に基づく反復タイプのDNA標的特異性コード(R=A/G、N=A/C/G/T)。
【図2】Hax2、Hax3、およびHax4の標的DNA配列。(A)Hax2、Hax3、およびHax4反復単位、ならびに予測標的DNA特異性(Haxボックス)のアミノ酸12および13。(B)Haxボックスは、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。(C)Haxエフェクターによる、Haxボックスの特異的誘発性。GUSレポーター構築物は、それぞれ35S主導型hax2、hax3、hax4、および空のT−DNA(−)と共に、A.ツメファシエンスを介してN.ベンサミアナに共送達された(エラーバーは標準偏差を示す、n=3試料、4−MU、4−メチルウンベリフェロン)。35S::uidA(+)は、対照として機能した。葉片は、X−Gluc(5−ブロモ−4−クロロ−3−インドリル−β−D−グルクロニド)で染色された。
【図3】反復タイプのDNA塩基対認識特異性。(A)Hax4誘導体およびArtXボックス誘導体は、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。(B)NG、HD、NI、およびNS反復単位の特異性。反復タイプ標的塩基中で置換された、Hax4ボックス誘導体のHax4誘発性(灰色の背景)。(C)NN反復単位の特異性。人工エフェクターArtX1および予測標的DNA配列。NN反復標的塩基中で置換された、ArtX1ボックス誘導体のArtX1誘発性(灰色の背景)。(D)人工エフェクターArtX2およびArtX3ならびに誘導DNA標的配列。(E)人工エフェクターによる、ArtXボックスの特異的誘発性。(A)〜(E)GUSレポーター構築物は、それぞれ35S主導型hax4、artX1、artX2、またはartX3遺伝子、および空のT−DNA(−)と共に、A.ツメファシエンスを介してN.ベンサミアナへと共送達された。35S::uidA(+)は、対照として機能した。葉片は、X−Glucで染色された。定量データについては、図11を参照されたい。
【図4】最小数の反復単位が、転写活性化に必要とされる。(A)異なる数(0.5〜15.5個)のHD反復単位(合計1.5〜16.5個の反復単位)を備える、人工ArtHDエフェクター。(B)TAおよび17CからなるArtHD標的ボックスは、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。(C)異なる数の反復単位を備えるArtHDエフェクターによるプロモーター活性化。35S主導型エフェクター遺伝子または空のT−DNA(−)は、GUSレポーター構築物と共に、A.ツメファシエンスを介してN.ベンサミアナへと共送達された(エラーバーは標準偏差を示す、n=3試料、4−MU)。35S::uidA(+)は、対照として機能した。葉片は、X−Glucで染色された。
【図5】誘発遺伝子のプロモーター内のDNA標的配列の、TALエフェクター反復単位の高度可変アミノ酸12および13との整列。(A)AvrBs3、AvrBs3Δrep16、AvrBs3Δrep109、およびAvrHah1の反復単位は、トウガラシECW−30R Bs3遺伝子のプロモーター内のUPAボックスに対して整列された(受入番号:EU078684)。AvrBs3Δrep16およびAvrBs3Δrep109は、それぞれ、反復単位11〜14および反復単位12〜14が欠失した、AvrBs3の欠失誘導体である。AvrBs3、AvrBs3Δrep109、およびAvrHah1は、ECW−30R植物中のHRを誘発するが、AvrBs3Δrep16は、誘発しない。(B)AvrBs3、AvrBs3Δrep16、AvrBs3Δrep109、およびAvrHah1の反復単位は、トウガラシECW Bs3−E遺伝子のプロモーター内の非機能UPAボックスに対して整列された(受入番号:EU078683)。AvrBs3Δrep16は、トウガラシECW植物中のHRを誘発するが、AvrBs3、AvrBs3Δrep109、またはAvrHah1は、誘発しない。(C)AvrXa27の反復単位は、イネXa27遺伝子のプロモーター内の推定標的配列に対して整列された。Xa27(受入番号:AY986492)は、イネ品種IRBB27中のAvrXa27によって誘発され、HRをもたらすが、イネ品種IR24中のxa27(受入番号:AY986491)は誘発されない。(D)PthXo1の反復単位は、イネXa13/Os8N3遺伝子のプロモーター内の推定標的配列に対して整列された。Xa13(受入番号:DQ421396)は、イネ品種IR24中のPthXo1によって誘発され、感受性をもたらすが、イネ品種IRBB13中のxa13(受入番号:DQ421394)は、誘発されない。(E)PthXo6の反復単位は、イネOsTFX1遺伝子のプロモーター内の推定標的配列に対して整列された(受入番号:AK108319)。OsTFX1は、イネ品種IR24中のPthXo6によって誘発される。(F)PthXo7の反復単位は、イネOsTFIIAγ1遺伝子のプロモーター内の推定標的配列に対して整列された(CB097192)。OsTFIIAγ1は、イネ品種IR24中のPthXo7によって誘発される。(A)〜(F)DNA配列の上部の数字は、コード領域内の第1ATGまでのヌクレオチド距離を示す。我々の予測標的特異性とマッチしていない反復/塩基の組み合わせ(アミノ酸12/13:NI=A、HD=C、NG=T、NS=A/C/G/T、NN=A/G、IG=T)は、赤色で色付けされる。未知の標的DNA特異性を備える反復単位は、緑色で色付けされる。
【図6】AvrBs3Δrep16によって保護されるDNA領域は、AvrBs3でのDNA領域よりも4bp短い。AvrBs3およびAvrBs3Δrep16とのDNaseIフットプリント分析の要約(図7、8を参照されたい)。(A)それぞれ、AvrBs3およびAvrBs3Δrep16によって保護される、Bs3(上)およびBs3−E(中央)プロモーター配列。DNaseIフットプリントは、Bs3プロモーターの、AvrBs3で保護されたセンス鎖の37ヌクレオチドおよびアンチセンス鎖の36ヌクレオチド、ならびにBs3−Eプロモーターの、AvrBs3Δrep16で保護されたセンス鎖の30ヌクレオチドおよびアンチセンス鎖の32ヌクレオチドを示した。UPAボックスおよび予測AvrBs3Δrep16ボックスは、下線を引かれている。AvrBs3およびAvrBs3Δrep16によって保護される、UPA20−ubm−r16(下部)プロモーター配列。UPA20−ubmr16プロモーターは、AvrBs3およびAvrBs3Δrep16の両方による認識をもたらす、2bp置換(GA〜CT、太字イタリック体)を備えるUPA20プロモーター誘導体である。DNaseIフットプリントは、センス鎖の35ヌクレオチドおよびアンチセンス鎖の34ヌクレオチドが、AvrBs3によって保護され(UPAボックスは、下線を引かれている)、センス鎖の31ヌクレオチドおよびアンチセンス鎖の32ヌクレオチドが、AvrBs3Δrep16によって保護されることを示した(AvrBs3Δrep16ボックスは、下線を引かれている)。緑色(AvrBs3)または赤色(AvrBs3Δrep16)で網掛けされたDNA領域は、いずれの実験においても、低タンパク質量(等しいモル濃度のDNAおよびタンパク質ダイマー)であっても、それぞれ、AvrBs3およびAvrBs3Δrep16によって保護されたコアフットプリントを指す。灰色で網掛けされたDNA領域は、所定のタンパク質による全てのタンパク質濃度での、4つの実験全てにおいて、保護されなかったヌクレオチドを指す。AvrBs3保護領域およびAvrBs3Δrep16保護領域の5’末端は、同一であることに注意されたい。垂直破線は、DNA内で1つの反復が1つの塩基対に接触するという我々のモデルを確証する、AvrBs3保護プロモーター領域およびAvrBs3Δrep16保護プロモーター領域の3’末端の間の差異を示す。(B)UPA20−ubm−r16プロモーター内のAvrBs3およびAvrBs3Δrep16標的DNA配列の、AvrBs3およびAvrBs3Δrep16反復領域との整列(12位および13位における高度可変アミノ酸)。我々の予測標的特異性と、マッチしていない反復/塩基の組み合わせ(アミノ酸12/13:NI=A、HD=C、NG=T、NS=A/C/G/T)は、赤で色付けされる。
【図7】AvrBs3によって保護されるBs3およびAvrBs3Δrep16によって保護されるBs3−Eプロモーター配列。代表的なDNaseIフットプリント実験が示される。Bs3プロモーター配列上のAvrBs3DNaseIフットプリント(A、上部/センスDNA鎖;B、下部/アンチセンスDNA鎖)。Bs3−Eプロモーター配列上のAvrBs3Δrep16DNaseIフットプリント(C、上部、センスDNA鎖;D、下部アンチセンスDNA鎖)。(A)〜(D)(上)蛍光標識されたPCR産物は、それぞれ、His6::AvrBs3、His6::AvrBs3Δrep16、およびBSAの、5xモル過剰(タンパク質ダイマーに対して算出)でインキュベートされ、DNaseIで処理され、キャピラリーシーケンサー上で分析された。電気泳動図のy軸は、任意スケール上の、PCR産物の5’−6−FAM標識化センス鎖(a、c)または5’−HEX標識化アンチセンス鎖(b、d)に相当する、相対的な蛍光強度を示す。それぞれ、His6::AvrBs3(緑色)またはHis6::AvrBs3Δrep16(赤色)との反応、およびBSA(黒色、陰性対照)についてのトレースが重ねられている。陰性対照と比較した、それぞれ、AvrBs3またはAvrBs3Δrep16存在時のピーク高の低減は、保護に対応する。保護領域は、緑色(AvrBs3)または赤色(AvrBs3Δrep16)垂直線によって示される。(中央)DNA配列の電気泳動図。数字の付いたオレンジ色のピークは、DNAヌクレオチドサイズ標準に相当する。DNA配列内のエフェクターの予測標的ボックスは、下線を引かれている。カバーされるヌクレオチドは、緑色(AvrBs3)または赤色(AvrBs3Δrep16)ボックスによって印を付けられる。下部の数字は、それぞれ、AvrBs3(a、b)またはAvrBs3Δrep16(c、d)の存在時の、転写開始点(+1)に相対的なヌクレオチド位置を指す。(下)それぞれ、Bs3(a、b)またはBs3−E(c、d)プロモーターから増幅された、DNaseIフットプリントに使用されるDNAPCR産物。1本DNA鎖上の保護領域は、灰色のボックスによって示される。下部の数字は、それぞれ、AvrBs3(a、b)またはAvrBs3Δrep16(c、d)の存在時の、転写開始点(+1)に相対的なヌクレオチド位置を指す。実験は、3回反復され、類似した結果となった。
【図8】AvrBs3およびAvrBs3Δrep16によって保護される、UPA20−ubm−r16プロモーター配列。代表的なDNaseIフットプリント実験。UPA20−ubm−r16プロモーター配列上のAvrBs3およびAvrBs3Δrep16DNaseIフットプリント(A)、上部、センスDNA鎖;(B)下部、アンチセンスDNA鎖)。(上)蛍光標識されたPCR産物は、それぞれ、His6::AvrBs3、His6::AvrBs3Δrep16、およびBSAの、5xモル過剰(タンパク質ダイマーに対して算出)でインキュベートされ、DNaseIで処理され、キャピラリーシーケンサー上で分析された。電気泳動図のy軸は、任意スケール上の、PCR産物の5’−6−FAM標識化センス鎖(a)または5’−HEX標識化アンチセンス鎖(b)に相当する、相対的な蛍光強度を示す。His6::AvrBs3(緑色)、His6::AvrBs3Δrep16(赤色)、および陰性対照BSA(黒色)との反応についてのトレースが重ねられている。陰性対照と比較した、AvrBs3およびAvrBs3Δrep16存在時のピーク高の低減は、保護に対応する。保護領域は、緑色(AvrBs3)および赤色(AvrBs3Δrep16)垂直線によって示される。(中央)DNA配列の電気泳動図。数字の付いたオレンジ色のピークは、DNAヌクレオチドサイズ標準に相当する。AvrBs3によってカバーされるヌクレオチドは、緑色線および緑色ボックスによって印を付けられ(UPAボックスは下線を引かれている)、AvrBs3Δrep16によってカバーされるヌクレオチドは、赤色線および赤色ボックスによって印を付けられる(AvrBs3Δrep16ボックスは下線を引かれている)。UPA20−ubm−r16突然変異(GA〜CT)は、イタリック体で示される。(下)UPA20−ubm−r16プロモーターから増幅された、DNaseIフットプリントに使用されるDNAPCR産物。1本DNA鎖上の保護領域は、灰色のボックスによって示される。下部の数字は、AvrBs3の存在時の、UPA20野生型プロモーターの転写開始点(+1)に相対的なヌクレオチド位置を指す。実験は、3回反復され、類似した結果となった。
【図9】GUSレポーター構築物。標的DNA配列(TALエフェクターボックス)は、ミニトマトBs4プロモーター(41)(pBs4、−50〜+25)配列の5’に挿入され、GATEWAY組み換えによって、プロモーターレスuidA(β−グルクロニダーゼ、GUS)遺伝子attB1、attB2;GATEWAY組み換え部位への融合を構築する、A.ツメファシエンスT−DNAベクターpGWB330へと転移される。
【図10】Hax3内の推定反復0の認識特異性。(A)Hax3反復単位のアミノ酸12および13、ならびに反復0に相当する位置で置換を備える4つの潜在的標的Hax3ボックス。(B)標的ボックスは、ミニトマトBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。(C)A.ツメファシエンスを介して、GUSレポーター構築物と共にN.ベンサミアナ葉細胞へと共送達された、35S主導型hax3または空のT−DNA(−)を備えるGUS活性(4−MU、4−メチルウンベリフェロン、n=3、エラーバーは標準偏差を示す)。定性検定のために、葉片は、X−Glucで染色された。実験は、2回反復され、類似した結果となった。
【図11】反復タイプのDNA塩基対認識特異性。Hax4誘導体およびArtXボックス誘導体は、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。図3に対する定量データ。(A)NG、HD、NI、およびNS反復単位の特異性。反復タイプ標的塩基中で置換された、Hax4ボックス誘導体のHax4誘発性。(B)NN反復単位の特異性。NN反復標的塩基中で置換された、ArtX1ボックス誘導体のArtX1誘発性。(C)それぞれ、人工エフェクターArtX1、ArtX2、およびArtX3による、ArtXボックスの特異的誘発性。(A)〜(C)GUSレポーター構築物は、それぞれ、35S主導型hax4、artX1、artX2、artX3遺伝子(灰色バー)、および空のT−DNA(a、b、白色バー、c、−)と共に、A.ツメファシエンスを介してN.ベンサミアナ葉細胞へと共送達された(n=3、エラーバーは標準偏差を示す)。35S::uidA(+)は、対照として機能した。実験は、3回行われ、類似した結果となった。
【図12】AvrXa10のための予測標的DNA配列。(A)AvrXa10反復単位のアミノ酸12および13、ならびに予測NNタイプ反復特異性AまたはGを備える2つの潜在的標的ボックス。(B)AvrXa10標的ボックスは、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。(C)A.ツメファシエンスを介して、GUSレポーター構築物と共に、N.ベンサミアナ葉細胞へと共送達された、35S主導型avrXa10、hax3(特異性対照)、または空のT−DNA(−)のGUS検定。35S::uidA(+)は、構成的対照として機能した(n=3、エラーバーは標準偏差を示す)。定性検定のために、葉片は、X−Glucで染色された。実験は、3回行われ、類似した結果となった。
【図13】Hax2内の反復タイプの認識特異性。(A)Hax2反復単位のアミノ酸12および13、ならびに反復タイプIGのための4つの潜在的標的Hax2ボックス。(B)Hax2標的ボックスは、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。(C)A.ツメファシエンスを介して、GUSレポーター構築物と共に、N.ベンサミアナ葉細胞へと共送達された、35Sプロモーター主導型hax2または空のT−DNA(−)のGUS検定。35S::uidA(+)は、構成的対照として機能した(n=3、エラーバーは標準偏差を示す。定性検定のために、葉片は、X−Glucで染色された。実験は、3回行われ、類似した結果となった。
【図14】Hax2は、A.タリアナにおけるPAP1の発現を誘発する。(A)A.タリアナの葉は、それぞれ、hax2、hax3、およびhax4の35S主導型発現のためのT−DNA構築物を送達する、A.ツメファシエンス株で植菌された。hax2の発現は、アントシアニン産生を示唆する紫色色素沈着を誘発するが、hax3およびhax4の発現は、その限りではない。植菌7日後に写真が撮られた。(B)エタノール誘発性プロモーターの制御下でhax2を担持する、トランスジェニックA.タリアナ株。トランス遺伝子の発現を誘発するために、分離T2集団の植物は、10%エタノールを噴霧された。hax2−トランスジェニック植物のみが、アントシアニンを蓄積した。植菌6日後に写真が撮られた。(C)10%エタノールで噴霧する前(−)およびその24時間後(+)の、3つの独立したA.タリアナ株のhax2−トランスジェニック植物からのcDNAでの、hax2(29サイクル)、PAP1(32サイクル)、および伸長因子Tu(EF−Tu、32サイクル)の半定量的RT−PCR。(D)Hax2反復単位のアミノ酸12および13、ならびにHax2の標的DNA配列。(E)A.タリアナCol−0からのPAP1のプロモーターは、不完全Hax2ボックスを含有する。予測Hax2ボックスとのミスマッチは、赤で色付けされる。推定TATAボックス、天然転写開始部位(+1)、およびPAP1コード配列の第1コドンが示される。
【図15】表1.TALエフェクターの予測DNA標的配列。表は、TALエフェクターの反復配列および反復単位のアミノ酸12および13から使用される予測DNA標的配列を示す。注釈は以下を示す。(A)Xcv、キサントモナス・カンペストリス・パソバー・ベシカトリア;Xg、キサントモナス・ガルドネリーXca、キサントモナス・カンペストリス・パソバー・アルモラシア;Xoo、キサントモナス・オリゼ・パソバー・オリゼ;Xac、キサントモナス・アクソノポディス・パソバー・シトリ;Xau、キサントモナス・シトリ・パソバー・アウランティフォリ;Xcm、キサントモナス・カンペストリス・パソバー・マルバセアラム;Xam、キサントモナス・アクソノポディス・パソバー・マニホティス;Xoc、キサントモナス・オリゼ・パソバー・オリジコラ。(B)星印(*)は、アミノ酸13の欠失を示す。(C)反復単位のアミノ酸12および13から推定される標的DNA特異性。チミジンヌクレオチドは、推定反復0の特異性に起因して、5’末端に付加される。2本鎖DNAの上部(センス)鎖の配列は、不明瞭なコードで提供される(R=A/G、N=A/C/G/T、?=未知の特異性)。
【図16】AvrBs3、Hax2、Hax3、Hax4のタンパク質配列。タンパク質配列の各々について、N末端、C末端、ならびに単一反復配列が示される。
【図17】エフェクターARTBs4は、ミニマルBs4プロモーターの発現を誘発する。(A)Hax4反復単位のアミノ酸12および13および予測標的DNA特異性(Hax4ボックス)。Hax4ボックスと比較して、Hax4(mut)ボックスは、4つの塩基対置換を含有する。(B)人工エフェクターARTBs4反復単位のアミノ酸12および13および予測標的DNA特異性(ARTBs4ボックス)。(C)Hax4ボックスは、ミニマルBs4プロモーターの前で、GUSレポーターベクターへとクローン化された。ARTBs4ボックスは、ミニマルBs4プロモーター内に天然に存在する。(D)それぞれ、Hax4およびARTBs4による、Hax4およびARTBs4ボックスの特異的誘発性。GUSレポーター構築物は、それぞれ、35S主導型hax4(灰色バー)、ARTBs4(白色バー)、および空のT−DNA(ev、黒色バー)と共に、アグロバクテリウムツメファシエンスを介してN.ベンサミアナへと共送達された(エラーバーは標準偏差を示す)。4−MU、4−メチルウンベリフェロン。35S::uidA(GUS、灰色バー)は、対照として機能した。葉片は、X−Gluc(5−ブロモ−4−クロロ−3−インドリル−β−D−グルクロニド)で染色された。
【図18】反復ドメインおよびエフェクターの「ゴールデンゲート」クローン化についての図表。(A)個々の反復単位(または他のタンパク質ドメイン)からなる形成ブロックは、特異的オーバーハングを生成する隣接するII型制限酵素標的部位(例えば、BsaI)で、サブクローン化される。マッチングオーバーハングは、同一文字(A〜O)で示される。異なる反復タイプは、各位置に対する形成ブロックとしてクローン化される(例えば、反復1、反復2等)。反復特異性は以下の通りである:NI=A、HD=C、NG=T、NN=G、またはA。(B)形成ブロックは、「ゴールデンゲート」クローン化を用いて(制限連結)、マッチングオーバーハングの連結によって、標的ベクターへと組み立てられる。概して、得られた組立て産物は、クローン化に使用される標的部位のいずれも含有しない。
【図19】ゴールデンゲートクローン化を介する、デザイナーエフェクターの生成のための代替的方法。図19A〜Dは、下の実施例3に開示される方法で説明される種々のベクターを示し、またこの方法の概略図を提供する。
【発明を実施するための形態】
【0018】
<配列表>
添付の図および配列表に列挙されるヌクレオチドおよびアミノ酸配列は、ヌクレオチド塩基の標準文字略号およびアミノ酸の1文字コードを用いて示される。ヌクレオチド配列は、配列の5’末端で始まり、3’末端へと前進する(すなわち、各ラインの左から右へ)、標準慣例に従う。各核酸配列の1本鎖のみが示されるが、表示される鎖の任意の参照によって、相補鎖が含まれることが理解される。アミノ酸配列は、アミノ末端で始まり、カルボキシ末端へと前進する(すなわち、各ラインの左から右へ)、標準慣例に従う。
【0019】
次に本発明は、これ以降、添付の図面を参照してより完全に説明され、ここで、全てではないが幾つかの本発明の実施形態が示される。実際に、これらの発明は、多くの異なる形態で具体化されてもよく、本明細書に示される実施形態に限定されるものとして解釈されるべきではなく、むしろ、これらの実施形態は、本開示が適用可能な法的要求事項を満たすように提供される。全体にわたって、同様の数字は、同様の要素を指す。
【0020】
当業者には、前述の説明および関連する図面に提示される教示の利益を有する、本発明に付随する、本明細書に示される本発明の多くの修正および他の実施形態が想定されるであろう。したがって、本発明が開示される特定の実施形態に限定されてはならないこと、また、修正および他の実施形態が特許請求の範囲に含まれるように意図されることを理解されたい。本明細書には特定の用語が使用されているが、それらは包括的かつ記述的な意味合いで使用されたものにすぎず、制限を目的としたものではない。
【0021】
本開示全体にわたって使用される幾つかの用語は、本明細書の下で定義される。
【0022】
「反復ドメイン」という用語は、ポリペプチド内に存在するとき、標的DNA特異性を付与するモジュラー反復単位からなる、TALエフェクターからのDNA認識ドメインまたは開示される方法を用いて作製されるその人工版を説明するために使用される。反復単位からなる反復ドメインは、DNA配列標的が所望され、それがTALエフェクターにおける使用に限定されない、任意のポリペプチドに付与することができる。
【0023】
「反復単位」という用語は、標的DNA配列内の塩基対の認識を決定する1つのアミノ酸または2つの隣接アミノ酸を含有する、TALエフェクターからの反復ドメインのモジュラー部分またはその人工版を説明するために使用される。反復単位は、一緒になって規定の標的DNA配列を認識し、反復ドメインを構成する。反復単位は、DNA配列標的が所望され、それがTALエフェクターにおける使用に限定されない、任意のポリペプチドに付加することができる。
【0024】
「認識コード」という用語は、反復単位の12位および13位のアミノ酸と、かかるアミノ酸が次の通りの認識を付与する、標的DNA配列内の対応するDNA塩基対との関係を説明するために使用される:C/Gの認識のためのHD、A/Tの認識のためのNI、T/Aの認識のためのNG、C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS、G/CまたはA/Tの認識のためのNN、T/Aの認識のためのIG、C/Gの認識のためのN、C/GまたはT/Aの認識のためのHG、T/Aの認識のためのH、およびG/Cの認識のためのNK。
【0025】
本明細書で使用されるとき、「エフェクター」(または「エフェクタータンパク質」もしくは「エフェクターポリペプチド」)は、ポリペプチドが標的DNA配列を認識することができる、構築物またはそれらのコードされたポリペプチド産物に言及する。エフェクタータンパク質は、1.5個以上の反復単位からなる反復ドメイン含み、また制御性ドメイン等の1つ以上の機能ドメインを含んでもよい。本発明の好ましい実施形態では、「エフェクター」は、追加的に、遺伝子発現の制御等の効果を発揮することができる。本発明は、特に生物学的な機構には依存していないが、標的DNA配列を認識する本発明のタンパク質またはポリペプチドは、標的DNA配列に結合すると考えられる。
【0026】
「天然産」という用語は、人間によって産生されることとは異なり、天然で見出すことのできる対象物を説明するために使用される。例えば、自然界の源から単離することができ、研究所の人間によって意図的に修飾されていない生物(ウイルスを含む)中に存在するポリペプチド配列またはポリヌクレオチド配列は、天然産とされる。概して、天然産という用語は、種に典型的であろうような個体等の、野生型個体中に存在する対象物を指す。
【0027】
遺伝子の「発現を調節する」、「発現を阻害する」、および「発現を活性化する」という用語は、遺伝子の転写を活性化または阻害する、本発明のポリペプチドの能力を指す。活性化は、後に続く転写阻害の防止(すなわち、遺伝子発現の抑制の防止)を含み、阻害は、後に続く転写活性化の防止(すなわち、遺伝子活性化の防止)を含む。調節は、標的遺伝子の発現によって間接にまたは直接に影響を受ける、任意のパラメータを決定することによって検定することができる。かかるパラメータには、例えば、RNAまたはタンパク質レベルの変化、タンパク質活性の変化、産物レベルの変化、下流遺伝子発現の変化、レポーター遺伝子転写の変化(ルシフェラーゼ、CAT、ベータ−ガラクトシダーゼ、GFP(例えば、Mistili&Spector(1997)NatureBiotechnology15:961−964を参照されたい);シグナル伝達の変化、リン酸化および脱リン酸化、受容体−リガンド相互作用、二次メッセンジャー濃度(例えば、cGMP、cAMP、IP3、およびCa2+)、細胞増殖、血管新生、インビトロ、インビボ、ならびにエクスビボが含まれる。かかる機能効果は、例えば、化学発光、蛍光、熱量反応、抗体結合、誘発性マーカー、リガンド結合検定を介する、例えば、RNAまたはタンパク質レベルの測定、RNA安定性の測定、下流またはレポーター遺伝子発現の特定;cGMPおよびイノシトール三リン酸(IP3)等の細胞内二次メッセンジャーの変化;細胞内カルシウムレベルの変化;サイトカイン放出等、当業者に既知の任意の手段によって測定することができる。

【0028】
「制御性ドメイン」は、転写調節活性を有する、タンパク質またはタンパク質部分配列を指す。典型的に、制御性ドメインは、転写を調節するために、本発明のポリペプチドに共有結合または非共有結合される。代替的に、本発明のポリペプチドは、制御性ドメインなしに単独で作用するか、または転写を調節するための多重制御性ドメインと共に作用することができる。そこから制御性ドメインを得ることができる転写因子ポリペプチドには、制御転写および基礎転写に関与するポリペプチドが含まれる。かかるポリペプチドには、転写因子、それらのエフェクタードメイン、共活性化因子、サイレンサー、核内ホルモン受容体が含まれる(例えば、核酸要素に関与するタンパク質および転写の概説については、Goodrich et al.(1996)Cell84:825 30を参照されたく、一般的な転写因子は、Barnes&Adcock(1995)Clin.Exp.Allergy25 Suppl.2:46 9およびRoeder(1996)Methods Enzymol.273:165 71に概説される)。転写因子を専門とするデータベースは既知である(例えば、Science(1995)269:630を参照されたい)。核内ホルモン受容体転写因子は、例えば、Rosen et al.(1995)J.Med.Chem.38:4855 74に記載される。転写因子のC/EBPファミリーは、Wedel et al.(1995)Immunobiology193:171 85に概説される。核内ホルモン受容体によって転写制御を仲介する共活性化因子および共抑制因子は、例えば、Meier(1996)Eur.J.Endocrinol.134(2):158 9、Kaiser et al.(1996)Trends Biochem.Sci.21:342 5、およびUtley et al.(1998)Nature394:498 502)に概説される。GATA転写因子は、造血の制御に関与し、例えば、Simon(1995)Nat.Genet.11:9 11、Weiss et al.(1995)Exp.Hematol.23:99−107に記載される。TATAボックス結合タンパク質(TBP)およびその関連するTAFポリペプチド(TAF30、TAF55、TAF80、TAF110、TAF150、およびTAF250を含む)は、Goodrich&Tjian(1994)Curr.Opin.CellBiol.6:403 9およびHurley(1996)Curr.Opin.Struct.Biol.6:69 75に記載される。転写因子のSTATファミリーは、例えば、BarahmおよびPour et al.(1996)Curr.Top.Microbiol.Immunol.211:121 8に概説される。疾患に関与する転写因子は、Aso et al.(1996)J.Clin.Invest.97:1561 9に概説される。遺伝子制御に関与するポリペプチドを修飾するキナーゼ、ホスファターゼ、および他のタンパク質はまた、本発明のポリペプチドのための制御性ドメインとしても有用である。かかる修飾因子は、例えば、ホルモンによって仲介される、転写のスイッチオンまたはオフにしばしば関与する。転写制御に関与するキナーゼは、Davis(1995)Mol.Reprod.Dev.42:459 67,Jackson et al.(1993)Adv.Second Messenger Phosphoprotein Res.28:279 86、およびBoulikas(1995)Crit.Rev.Eukaryot.Gene Expr.5:1 77に概説される一方で、ホスファターゼは、例えば、Schonthal&Semin(1995)Cancer Biol.6:239 48に概説される。核内チロシンキナーゼは、Wang(1994)Trends Biochem.Sci.19:373 6に記載される。有用なドメインは、発癌遺伝子の遺伝子産物(例えば、myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mosファミリーメンバー)ならびにそれらの関連する因子および修飾因子から得ることができる。発癌遺伝子は、例えば、Cooper,Oncogenes,2nd ed.,The Jones and Bartlett Series in Biology,Boston,Mass.,Jones and Bartlett Publishers,1995に記載される。ets転写因子は、Waslylk et al.(1993)Eur.J.Biochem.211:7 18およびCrepieux et al.(1994)Crit.Rev.Oncog.5:615 38に概説される。Myc発癌遺伝子は、例えば、Ryan et al.(1996)Biochem.J.314:713 21に概説される。junおよびfos転写因子は、例えば、The Fos and Jun Families of Transcription Factors,Angel&Herrlich,eds.(1994)に記載される。max発癌遺伝子は、Hurlin et al.Cold Spring Harb.Symp.Quant.Biol.59:109 16に概説される。myb遺伝子ファミリーは、Kanei−Ishii et al.(1996)Curr.Top.Microbiol.Immunol.211:89 98に概説される。mosファミリーは、Yew et al.(1993)Curr.Opin.Genet.Dev.3:19 25に概説される。本発明のポリペプチドは、DNA修復酵素ならびにそれらの関連する因子および修飾因子から得られる、制御性ドメインを含み得る。DNA修復システムは、例えば、Vos(1992)Curr.Opin.CellBiol.4:385 95、Sancar(1995)Ann.Rev.Genet.29:69 105、Lehmann(1995)Genet.Eng.17:1 19、およびWood(1996)Ann.Rev.Biochem.65:135 67に概説される。DNA再構成酵素ならびにそれらの関連する因子および修飾因子はまた、制御性ドメインとして使用することができる(例えば、Gangloff et al.(1994)ExperientiA50:261 9、Sadowski(1993)FASEB J.7:760 7を参照されたい)。
【0029】
同様に、制御性ドメインは、DNA修飾酵素(例えば、DNAメチルトランスフェラーゼ、トポイソメラーゼ、ヘリカーゼ、リガーゼ、キナーゼ、ホスファターゼ、ポリメラーゼ)ならびにそれらの関連する因子および修飾因子に由来し得る。ヘリカーゼは、Matson et al.(1994)Bioessays6:13 22に概説され、メチルトランスフェラーゼは、Cheng(1995)Curr.Opin.Struct.Biol.5:4 10に記載される。ヒストンデアセチラーゼ(WolffeScience272:371 2(1996))等の、クロマチン関連タンパク質およびそれらの修飾因子(例えば、キナーゼ、アセチラーゼ、およびデアセチラーゼ)はまた、選択のエフェクターへの付加のためのドメインとしても有用である。好ましい一実施形態では、制御性ドメインは、転写抑制因子として作用するDNAメチルトランスフェラーゼである(例えば、Van den Wyngaert et al.FEBS Lett.426:283 289(1998)、Flynn et al.J.Mol.Biol.279:101 116(1998)、Okano et al.Nucleic Acids Res.26:2536 2540(1998)、およびZardo&Caiafa,J.Biol.Chem.273:16517 16520(1998)を参照されたい)。別の好ましい実施形態では、Fok1等のエンドヌクレアーゼは、転写抑制因子として使用され、それは遺伝子切断を介して作用する(例えば、国際公開第95/09233号、および国際出願PCT/US94/01201号を参照されたい)。クロマチンおよびDNA構造、移動および局在化ならびにそれらの関連する因子および修飾因子を制御する因子;微生物に由来する因子(例えば、原核生物、真核生物、およびウイルス)、ならびにそれらに関連するまたはそれらを修飾する因子はまた、キメラタンパク質を得るためにも使用することができる。一実施形態では、リコンビナーゼおよびインテグラーゼは、制御性ドメインとして使用される。一実施形態では、ヒストンアセチルトランスフェラーゼは、転写活性化因子として使用される(例えば、Jin&Scotto(1998)Mol.Cell.Biol.18:4377 4384、Wolffe(1996)Science272:371 372、Taunton et al.Science272:408 411(1996)、およびHassig et al.PNAS 95:3519 3524(1998)を参照されたい)。別の実施形態では、ヒストンデアセチラーゼは、転写抑制因子として使用される(例えば、Jin&Scotto(1998)Mol.Cell.Biol.18:4377 4384、Syntichaki&Thireos(1998)J.Biol.Chem.273:24414 24419、Sakaguchi et al.(1998)Genes Dev.12:2831 2841;およびMartinez et al.(1998)J.Biol.Chem.273:23781 23785を参照されたい)。
【0030】
本明細書で使用されるとき、「遺伝子」は、任意にイントロンを含有するコード配列、ならびにコード配列の発現および転写物の非翻訳部分の転写を制御する制御領域を含む、核酸分子またはその部分を指す。したがって、「遺伝子」という用語は、コード配列の他に、プロモーター、エンハンサー、5’非翻訳領域、3’非翻訳領域、終結シグナル、ポリアデニル化領域等の制御配列を含む。遺伝子の制御配列は、コード領域の近位に、同領域内に、または同領域の遠位に位置してもよい。
【0031】
本明細書で使用されるとき、「標的遺伝子」は、その発現が本発明のポリペプチドによって調節されようとしている遺伝子を指す。
【0032】
本明細書で使用されるとき、「植物」は、特徴的に胚を産生し、葉緑体を含有し、セルロース細胞壁を有し、かつ移動力を欠く、植物界の種々の光合成、真核性多細胞生物のいずれをも指す。本明細書で使用されるとき、「植物」は、種子、懸濁培養、胚、分裂組織領域、カルス組織、葉、根、芽、配偶体、胞子体、花粉、小胞子、およびそれらの子孫を含む、任意の発生段階での、任意の植物または植物の部分を含む。挿し穂、および細胞または組織培養物もまた含まれる。本発明と任せて使用される「植物組織」という用語は、全植物、植物細胞、植物器官、例えば、葉、茎、根、分裂組織、植物種子、プロトプラスト、カルス、細胞培養物、ならびに構造および/または機能単位に組織化される植物細胞の任意の群を含むが、それらに限定されない。
【0033】
本明細書で使用されるとき、「植物細胞中の標的遺伝子の発現を調節する」は、本発明のポリペプチドを用いて、単独でまたは他の転写および/または翻訳制御性因子、または植物細胞中のかかるポリペプチドをコードする核酸と組み合わせて、植物細胞中の標的遺伝子の発現を増加させること(活性化)または減少させること(抑制)を指す。
【0034】
本明細書で使用されるとき、「標的DNA配列」は、それに対するタンパク質による認識が所望される、2本鎖DNAの一部を指す。一実施形態では、「標的DNA配列」は、遺伝子に対してその発現の程度を変化させることによって、所望の表現型の結果が達成され得る、遺伝子に対する転写制御要素の全てまたは部分である。転写制御要素は、プロモーター、エンハンサー、例えば、ステロイド反応要素、熱ショック反応要素、金属反応要素等の他の反応要素、制御要素結合部位、オペレーター、および/またはサイレンサー等の陽性および陰性対照要素を含む。転写制御要素は、ウイルス性、真核性、または原核性であり得る。「標的DNA配列」はまた、タンパク質に結合することができる下流または上流配列を含み、それによって転写を調節、典型的には防止する。
【0035】
本明細書における「DNA」または「DNA配列」という用語の使用は、本発明を、DNAを含むポリヌクレオチド分子に限定するようには意図されていない。当業者であれば、本発明の方法および組成物が、デオキシリボヌクレオチド(すなわち、DNA)、リボヌクレオチド(すなわち、RNA)、またはリボヌクレオチドおよびデオキシリボヌクレオチドの組み合わせからなるポリヌクレオチド分子を包含することを認識するであろう。かかるデオキシリボヌクレオチドおよびリボヌクレオチドには、合成、天然産、および非天然産であり、参照核酸と類似した結合特性を有し、かつ参照ヌクレオチドと類似した方法で代謝される、ヌクレオチド類似体または修飾骨格残基もしくは結合を含むが、それらに限定されない天然産分子および合成類似体の両方が含まれる。かかる類似体の例としては、制限なしに、ホスホロチオエート、ホスホロアミデート、メチルホスホネート、キラル−メチルホスホネート、2−O−メチルリボヌクレオチド、ペプチド−核酸(PNA)が挙げられる。本発明のポリヌクレオチド分子はまた、1本鎖形態、2本鎖形態、ヘアピン、ステム‐アンド‐ループ構造等を含むが、それらに限定されない、ポリヌクレオチド分子の全ての形態も包含する。さらに、当業者は、本明細書に開示されるDNA配列がまた、その例示的ヌクレオチド配列の補体も包含することを理解する。
【0036】
本明細書で使用されるとき、「標的DNA配列に特異的に結合する」とは、本発明のポリペプチドの、特異的標的DNA配列への結合親和性が、同一のポリペプチドの、概して同等であるが非標的のDNA配列への結合親和性よりも統計的に高いことを意味する。それはまた、本発明の反復ドメインの、検出可能なほどに大規模な、例えば、非標的DNA配列へのその結合よりも、少なくとも背景を1.5倍上回る、特異的標的DNA配列への結合、および非標的DNA配列の実質的な排除を指す。各DNA配列に対する本発明のKdのポリペプチドは、ポリペプチド結合特異性を査定するために、特定の標的DNA配列とすることができる。
【0037】
本明細書で使用されるとき、「標的遺伝子内の標的DNA配列」とは、標的DNA配列に対する本発明のポリペプチドの認識が、標的遺伝子の発現を調節するであろう点で、標的DNA配列と標的遺伝子との間の機能関係を指す。標的DNA配列は、物理的に、標的遺伝子の境界の内側のどこにでも、例えば、5’末端、コード領域、3’末端、cDNAでコードされた領域の外側の上流および下流領域、またはエンハンサーもしくは他の制御性領域の内側に位置してもよく、また標的遺伝子の近位または遠位であってもよい。
【0038】
本明細書で使用されるとき、「内因性」とは、それがそこへ導入される標的遺伝子または宿主細胞に天然に関連する、核酸またはタンパク質配列を指す。
【0039】
本明細書で使用されるとき、「外因性」とは、それがそこへ導入される標的遺伝子または宿主細胞に天然に関連しない、核酸またはタンパク質配列を指し、天然産核酸の非天然産複数コピー、例えば、DNA配列、または非天然産ゲノム位置に位置する天然産核酸配列を含む。
【0040】
本明細書で使用されるとき、「遺伝子組み換え植物(またはトランスジェニック植物)」とは、そのゲノム内に外因性ポリヌクレオチドを含む植物を指す。概して、および好ましくは、外因性ポリヌクレオチドは、ポリヌクレオチドが連続する世代に伝えられるように、ゲノム内で安定的に統合される。外因性ポリヌクレオチドは、単独でまたは組み換え発現カセットの部分として、ゲノムに統合されてもよい。「トランスジェニック」は、任意の細胞、細胞株、カルス、組織、植物部分または植物を含むように本明細書で使用され、その遺伝子型は、最初にそのように変化させられたトランスジェニック、ならびに最初のトランスジェニックからの性交雑または無性繁殖によって作り出されたトランスジェニックを含む外因性核酸の存在によって変化させられている。本明細書で使用されるとき、「トランスジェニック」という用語は、従来の植物育種法による、または無作為交配、非組み換えウイルス感染、非組み換え細菌形質転換、非組み換え転位、もしくは自然突然変異等の自然発生イベントによる、ゲノムの変化(染色体のまたは染色体外の)を包含しない。
【0041】
本明細書で使用されるとき、「ミニマルプロモーター」または実質的に類似した用語は、不活性であるか、または上流活性化の非存在時で大幅に低減されたプロモーター活性を有するプロモーター要素、特にTATA要素を指す。好適な転写因子の存在時で、ミニマルプロモーターは、転写を可能にするために機能する。
【0042】
本明細書で使用されるとき、「抑制因子タンパク質」または「抑制因子」は、それぞれ、転写または翻訳を防止するために、DNAのオペレーターまたはRNAに結合するタンパク質を指す。
【0043】
本明細書で使用されるとき、「抑制」は、抑制因子タンパク質の、DNAまたはmRNA上の特異的部位への結合による、転写または翻訳の阻害を指す。好ましくは、抑制は、少なくとも1.5倍、より好ましくは少なくとも2倍、およびさらにより好ましくは少なくとも5倍の、転写または翻訳レベルの有意な変化を含む。
【0044】
本明細書で使用されるとき、「活性化因子タンパク質」または「活性化因子」は、それぞれ、転写または翻訳を亢進させるために、DNAのオペレーターまたはRNAに結合するタンパク質を指す。
【0045】
本明細書で使用されるとき、「活性化」は、活性化因子タンパク質の、DNAまたはmRNA上の特異的部位への結合による、転写または翻訳の亢進を指す。好ましくは、活性化は、少なくとも1.5倍、より好ましくは少なくとも2倍、およびさらにより好ましくは少なくとも5倍の、転写または翻訳レベルの有意な変化を含む。
【0046】
本明細書で使用されるとき、、分子の「誘導体」または「類似体」は、分子に由来する部分またはその修飾版を指す。
【0047】
本明細書で使用されるとき、「転写活性化因子様(TAL)エフェクターに由来する反復単位」は、TALエフェクターからの反復単位、または本明細書に開示される方法のいずれかによって産生される1つ以上のTALエフェクターの修飾版もしくは人工版を指す。
【0048】
以下で、III型分泌系を介して植物細胞へと転座される、転写活性化因子様(TAL)エフェクターファミリーに関連して、本発明が具体的に説明される。このエフェクターファミリーのタイプメンバーは、AvrBs3である。したがって、TALエフェクターファミリーはまた、タンパク質のAvrBs3様ファミリーと名付けられる。双方の発現は、同義的に使用され、相互交換され得る。AvrBs3様ファミリーの非限定的例は、次の通りである:AvrBs4ならびにHaxサブファミリーHax2、Hax3、およびHax4のメンバー、ならびにBrg11。AvrBs3およびそのファミリーの他のメンバーは、標的遺伝子のプロモーター域内のそれらの特異的DNA配列への結合能力、およびこれらの遺伝子の発現の誘発に特徴付けられる。それらは、それらが植物遺伝子の転写活性化因子として作用することを可能にする、保存された構造特徴を有する。AvrBs3様ファミリーおよび相同エフェクターは、典型的に、それらのC末端領域において、核局在化配列(NLS)および転写活性化ドメイン(AD)を有する。中央領域は、典型的に34〜35個のアミノ酸の反復単位を含有する。反復単位は、ほぼ同一であるが、特定の位置で可変であり、これらの位置がどのようにタンパク質のヌクレオチド配列結合特異性を決定するかが、近年見出されている。
【0049】
AvrBs3について、反復単位がDNAへの結合に関与することが示された。AvrBs3およびおそらくAvrBs3−ファミリーの他のメンバーのDNA結合特異性は、タンパク質の中央反復ドメインによって仲介されるようである。この反復ドメインは、17.5個の反復単位のAvrBs3にあり、相同タンパク質は、各々典型的に34個のアミノ酸である1.5〜33.5個の反復単位からなる。他の反復単位長もまた既知である(例えば、30、33、35、39、40、42個のアミノ酸)。反復ドメイン内の最後の反復は、通常、19〜20アミノ酸長の半反復のみである。個々の反復単位は、概して同一でない。それらは、特定の可変アミノ酸位置で異なり、これらのうち12位および13位は、高度可変である一方で、4位、11位、24位、および32位は、高い頻度であるが、12および13よりは低い頻度で異なる(他の位置での変形も生じるが、より低い頻度である)。キサントモナスからの異なるAvrBs3様タンパク質の比較は、80〜97%の全体的配列同一性を示し、このうちほとんどの差異は、反復ドメインに限定される。例えば、AvrBs3およびAvrBs3様ファミリーメンバーAvrBs4は、AvrBs3に対するAvrBs4のC末端における4つのアミノ酸欠失を除いて、それらの反復ドメイン領域において排他的に異なる。
【0050】
図16では、AvrBs3のアミノ酸配列、ならびにHax−サブファミリーのメンバーのアミノ酸配列が示される。反復単位は、本発明にとって特に重要であり、それは、12位および13位の高度可変アミノ酸ならびに4位および24位の可変アミノ酸を除いて同一である。したがって、これらのタンパク質の各反復単位は、単独で提供される。
【0051】
上述の通り、反復ドメイン内の反復単位が、AvrBs3−ファミリーのIII型エフェクタータンパク質の認識または結合能力および特異性を決定することはすでに説明されている。しかしながら、根底にある原則は、本発明まで知られていなかった。
【0052】
本発明は、反復ドメイン内の1つの反復単位が、標的DNA配列内の1つの特異的DNA塩基対の認識に関与することを発見している。この知見は、しかしながら、本発明の1つの要素にすぎない。本発明は、反復ドメインの各反復単位内の高度可変領域が、標的DNA配列内の1つの特異的DNA塩基対の認識に関与することをさらに発見している。反復単位内で、高度可変領域(アミノ酸12位および13位に対応する)は、典型的にこの認識特異性に関与する。したがって、これらのアミノ酸における各変形は、標的DNA認識、また好ましくは認識能力における、対応する変形を反映する。
【0053】
本明細書で使用されるとき、「高度可変領域」は、本発明の反復単位の12位および13位または同等の位置を意味することが意図される。本発明の12位および13位は、AvrBs3および本明細書に開示される他のTALエフェクターの完全長反復単位における12位および13位に相当することが認識される。「同等の位置」とは、本発明の反復単位における、それぞれ、12位および13位に対応する位置を意図する。任意の反復単位を、AvrBs3の完全長反復単位と整列させることによって、かかる同等の位置を容易に決定することができる。
【0054】
したがって、DNA結合タンパク質の反復ドメイン内の1つの反復単位は、標的DNA内の1つの塩基対を認識し、反復単位内、典型的に反復単位の高度可変領域内の1つのアミノ酸または2つの隣接アミノ酸残基は、標的DNA内のどの塩基対が認識されるかを決定することが初めて示されている。この知見に基づいて、当業者は、反復ドメインのその反復単位内のポリペプチドを、所望の標的DNA配列内の塩基対を特異的に標的とするように修飾することによって、目的の標的DNA配列内の塩基対を特異的に標的とすることができるであろう。この知見に基づいて、本発明は、異なる反復タイプのDNA標的特異性のための認識コードを特定しており、実験的に裏付けられ得た複数のTALエフェクターの標的DNA配列を予測することができた。これはさらに、TALエフェクターによって制御される宿主遺伝子の特定を促進するであろう。標的DNA内の塩基の線形配列を認識する反復単位の線形配列は、新規DNA−タンパク質相互作用である。高い特異性でDNAを標的とするために、本発明によって特定される、反復ドメインのモジュラー構造および認識コードは、種々の技術分野で使用するための特異的DNA結合ドメインの効率的設計を可能にする。
【0055】
本発明の一実施形態では、反復ドメインは、転写因子に、例えば、植物で活性な転写因子に、特に好ましくは、III型エフェクタータンパク質に、例えば、AvrBs3様ファミリーのエフェクターに含まれる。しかしながら、一方の反復ドメイン内の反復単位と、他方の標的DNA内の塩基配列との間の相関を発見した後、反復ドメインのモジュラー構造は、特異的標的DNA配列を標的とするために使用されよう任意のタンパク質で使用され得る。反復単位を含む反復ドメインを、反復単位が、1反復単位当たり1つの高度可変領域を含むために修飾され、高度可変領域が、標的DNA配列内の塩基対の認識を決定する、ポリペプチドに導入することによって、規定の標的DNA配列に対する多種多様のタンパク質の認識が有効となるであろう。
【0056】
反復ドメイン内の1つの反復単位は、DNA内の1つの塩基対の特異的認識に関与することが見出されているため、複数の反復単位は、互いに組み合わされ得、ここで各反復単位は、標的DNA配列内の特異的塩基対に対する各反復単位の認識に関与する高度可変領域を含む。
【0057】
特異的アミノ酸のための特異的コドンを得るために、特異的にDNA配列を修飾する技術は、当該技術分野で既知である。
【0058】
突然変異およびポリヌクレオチド変化のための方法は、広範に記載されている。例えば、Kunkel(1985)Proc.Natl.Acad.Sci.USA82:488−492、Kunkel et al.(1987)Methods in Enzymol154:367−382、米国特許第4,873,192号、WalkerおよびGaastra,eds.(1983)Techniques in Molecular Biology(MacMillan Publishing Company,New York)、および引用される参考文献を参照されたい。これらの全ての公開物は、参照により本明細書に組み込まれる。
【0059】
次の例は、新たな反復単位を構築し、標的DNA配列内で塩基対を特異的に認識する人工的に構築された反復単位の特異的結合活性を試験する方法を提供する。
【0060】
当業者は、反復ドメイン内で使用される反復単位の数を、所定の実験によって把握することができる。概して、少なくとも1.5個の反復単位が最小であると考えられるが、典型的に少なくとも約8つの反復単位が使用されるであろう。半分のサイズの反復単位を使用することができるため、反復単位は、完全な反復単位である必要はない。さらに、本明細書に開示される方法およびポリペプチドは、特定の数の反復単位を備える反復ドメインに確かに依存する。したがって、本発明のポリペプチドは、例えば、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、18.5、19、19.5、20、20.5、21、21.5、22、22.5、23、23.5、24、24.5、25、25.5、26、26.5、27、27.5、28、28.5、29、29.5、30、30.5、31、31.5、32、32.5、33、33.5、34、34.5、35、35.5、36、36.5、37、37.5、38、38.5、39、39.5、40、40.5、41、41.5、42、42.5、43、43.5、44、44.5、46、46.5、47、47.5、48、48.5、49、49.5、50、50.5個またはそれを超える反復単位を含むことができる。典型的に、AvrBs3は、17.5個の反復単位を含有し、UPA(AvrBs3によって上方制御される)遺伝子の発現を誘発する。反復単位の数および順序は、対応する活性およびDNA認識特異性を決定するであろう。さらなる例として、AvrBs3ファミリーメンバーHax2は、21.5個の反復単位、Hax3は、11.5個の反復単位、Hax4は、14.5個の反復単位を含む。好ましくは、本発明のポリペプチドは、約8〜約39個の反復単位を含む。より好ましくは、本発明のポリペプチドは、約11.5〜約33.5個の反復単位を含む。
【0061】
34個のアミノ酸(1文字コードで)を備える反復の典型的なコンセンサス配列が下に示される:
LTPEQVVAIASNGGGKQALETVQRLLPVLCQAHG
【0062】
35個のアミノ酸(1文字コードで)を備える反復単位についてのさらなるコンセンサス配列は、次の通りである:
LTPEQVVAIASNGGGKQALETVQRLLPVLCQAPHD
【0063】
本発明の一実施形態で使用され得る反復単位は、上述のコンセンサス配列との、少なくとも35%、40%、50%、60%、70%、75%、80%、85%、90%、または95%の同一性を有する。好ましい実施形態では、AvrBs3、Hax2、Hax3、およびHax4の反復配列、ならびにAvrBs3−ファミリーのさらなるメンバーが使用される。これらのメンバーの反復単位配列は、図16に示される。これらの反復単位配列は、アミノ酸の1つ以上を置換することによって修飾され得る。修飾された反復単位配列は、AvrBs3−ファミリー配列の原メンバーの原反復配列との、少なくとも35%、40%、50%、60%、70%,75%、80%、85%、90%、または95%の同一性を有する。好ましい実施形態では、12位および13位のアミノ酸が変化させられる。さらなる実施形態では、4位、11位、24位、および32位のアミノ酸が変化させられる。好ましくは、1反復当たりのアミノ酸の数は、1反復単位当たり20〜45個のアミノ酸、さらに32〜40個のアミノ酸、またさらに32〜39個のアミノ酸、およびさらに任意に32、34、35、または39個のアミノ酸の範囲にある。
【0064】
具体的には、反復単位内の高度可変領域が、標的DNA配列内の1つの塩基対の特異的認識を決定する。より具体的には、本発明は、反復単位内の12位および13位で見出されるアミノ酸と、標的DNA配列内の塩基対との間の認識特異性の次の相関を見出している:
・C/Gの認識のためのHD
・A/Tの認識のためのNI
・T/Aの認識のためのNG
・C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS
・G/CまたはA/Tの認識のためのNN
・T/Aの認識のためのIG
・C/GまたはT/Aの認識のためのN
・T/Aの認識のためのHG
・T/Aの認識のためのH
・G/Cの認識のためのNK。
【0065】
アミノ酸は、1文字コードで表されることに留意しなければならない。ヌクレオチドは、塩基対として提供され、ここで第1の塩基は、上部鎖に位置し、第2の塩基は、下部鎖に位置する;例えば、C/Gとは、Cが上部鎖に位置し、Gが下部鎖に位置することを意味する。
【0066】
単一アミノ酸NおよびHそれぞれに関しては、AvrBs3のアミノ酸13は、他の反復単位を備える多重アミノ酸配列整列によって比較されたとき、反復単位から欠損していると思われる。

【0067】
本発明の一実施形態では、AvrBs3様タンパク質のN末端ドメインは、Tに対する認識特異性、反復の認識特異性の5’を付与する。
【0068】
本発明の特に好ましい実施形態では、タンパク質ファミリーAvrBs3の反復単位が使用される。このタンパク質ファミリーのメンバーの例は、上で特定されている。特に、タンパク質ファミリーのメンバーは、vrBs3のアミノ酸配列に対して、特にAvrBs3の反復単位のアミノ酸配列に対して、少なくとも95%、少なくとも90%、少なくとも80%、少なくとも85%、少なくとも70%、少なくとも75%、少なくとも60%、少なくとも50%、少なくとも40%、または少なくとも35%のアミノ酸相同性を有する。これを念頭に置くと、反復単位内の高度可変領域は、AvrBs3ファミリーのメンバーの間のアミノ酸比較によって推定され得る。特に好ましい実施形態では、アミノ酸は、AvrBs3の反復単位の12位および13位にある。しかしながら、可変領域はまた、異なるアミノ酸位置に位置してもよい。可変位置の例としては、アミノ酸番号4、11、24、および32が挙げられる。本発明のさらなる実施形態では、DNA配列内の塩基対の特異的認識に関与するアミノ酸は、典型的に、AvrBs3ファミリーのメンバーの間で異ならない位置、または可変であるが、高度可変ではない位置に位置する。
【0069】
要約すると、本発明者らは、反復単位が、DNA配列上の1つの塩基対の認識を決定すること、および反復単位内の高度可変領域が、対応する反復単位の認識特異性を決定することを見出した。したがって、反復単位の配列は、標的DNA配列内の塩基対の特異的線形順序と相関する。本発明は、AvrBs3に関するこの相関を見出しており、タンパク質のAvrBs3様ファミリーの代表的な数のメンバーに関してそれを検証している。AvrBs3様ファミリーメンバーに関して、34個または他のアミノ酸長の反復単位内の12位および13位のアミノ酸残基は、AvrBs3様タンパク質の規定の結合特異性と相関する。この中核的原則の発見は、遺伝子発現の調節および標的ゲノム操作を含むが、それらに限定されない種々の用途のために、その同族標的DNAテンプレートでポリペプチドを特製する強力なツールを提供する。
【0070】
本発明では、反復単位内に標的DNA配列内の塩基対の認識を決定する高度可変領域が含まれる、反復単位を備える反復ドメインを含む、ポリペプチドが設計され得る。本発明の一実施形態では、各反復単位は、1つの標的DNA配列内の塩基対の認識を決定する高度可変領域を含む。さらなる実施形態では、標的DNA配列内の塩基対を特異的に認識しない、1または2つの反復単位が、反復ドメイン内に含まれる。本発明によって見出された認識コードを考慮すると、各反復単位が1つの標的DNA配列内の塩基対の特異的認識に関与する、反復単位のモジュラー配列は、実行可能である。結果として、反復単位の配列は、標的DNA配列内の塩基対の配列に対応し、その結果1つの反復単位は、1つの塩基対にマッチする。
【0071】
標的DNA配列が既知であり、それに対するタンパク質による認識が所望されるのであれば、当業者は、特異的認識アミノ酸配列を含む、モジュラーの一連の反復単位を特異的に構築し、これらの反復単位を、所望の標的DNA配列の認識および結合を可能にするために適切な順序で、ポリペプチドへと組み立てることができる。本発明のモジュラー反復単位DNA結合ドメインと組み合わされることによって、任意のポリペプチドが修飾され得る。かかる例としては、転写活性化因子および抑制因子タンパク質であるポリペプチド、抵抗性仲介タンパク質、ヌクレアーゼ、トポイソメラーゼ、リガーゼ、インテグラーゼ、リコンビナーゼ、リゾルバーゼ、メチラーゼ、アセチラーゼ、デメチラーゼ、デアセチラーゼ、ならびにDNA、RNA、またはタンパク質を修飾することができる任意の他のポリペプチドが含まれる。
【0072】
本発明のモジュラー反復単位DNA結合ドメインは、転写制御性領域および翻訳末端領域を含むが、それらに限定されない、任意の他の制御性領域で機能するために、核局在化シグナル等の細胞区画局在化シグナルと組み合わせることができる。
【0073】
本発明のさらなる実施形態では、これらのモジュール設計された反復単位は、反復ドメインによる結合の結果、DNAの近位に配置されるとき、DNAを切断することができるエンドヌクレアーゼドメインと組み合わされる。かかるエンドヌクレアーゼ切断は、真菌、植物、および動物を含む真核生物中の相同組み換えの率を刺激することが知られる。部位特異的エンドヌクレアーゼ切断の結果として、特異的部位の相同組み換えを刺激する能力は、部位特異的切断を行わなかった場合に可能である頻度よりもはるかに高い頻度で、特異的部位の目的のDNA配列を統合した、形質転換された細胞の回復を可能にする。加えて、反復ドメインおよびエンドヌクレアーゼドメインから形成されるポリペプチドによって引き起こされる切断等のエンドヌクレアーゼ切断は、時に、切断の部位で配列を変化させる方法で細胞DNA代謝機構によって、例えば、変化していない配列と比較して、切断の部位で短挿入または欠失を引き起こすことによって修復される。これらの配列変化は、例えば、タンパク質−コード配列を、非機能タンパク質を作製するために変化させること、スプライス部位を、遺伝子転写物が適切に切断されないように修飾すること、非機能転写物を作成すること、遺伝子のプロモーター配列を、それがもはや適切に転写されないように変化させること等による、遺伝子またはタンパク質の機能の不活性化を引き起こし得る。
【0074】
部位特異的エンドヌクレアーゼを用いてDNAを切断することは、切断の領域内の相同組み換えの率を増加させ得る。幾つかの実施形態では、Fok I(フラボバクテリウム・オケアノコイテス)エンドヌクレアーゼは、DNA切断を誘発するために、エフェクター内で利用されてもよい。Fok Iエンドヌクレアーゼドメインは、DNA結合ドメインから独立して機能し、典型的にダイマーとして、2本鎖DNAを切断する(Li et al.(1992)Proc.Natl.Acad.Sci.U.S.A89(10):4275−4279、およびKim et al.(1996)Proc.Natl.Acad.Sci.U.S.A93(3):1156−1160、参考文献の開示は、参照によりその全体が本明細書に組み込まれる)。1本鎖FokIダイマーもまた開発され、また利用することができる(Mino et al.(2009)J.Biotechnol.140:156−161)。所望の標的DNA配列の認識のための反復ドメイン、ならびに亜鉛フィンガーヌクレアーゼを採用する、従来行われた作業に類似した、標的DNA配列のまたはその近辺のDNA切断を誘発する、FokIエンドヌクレアーゼドメインを含有するエフェクターを構築することができる(Townsend et al.(2009)Nature459:442−445、Shukla et al.(2009)Nature459,437−441、これらの参考文献の全ては、参照によりその全体が本明細書に組み込まれる)。かかるエフェクターの比較は、Bibikova et al.(2003)Science300,764、Urnov et al.(2005)Nature435,646、Wright et al.(2005)ThePlant Journal 44:693−705、および米国特許第7,163,824号および同第7,001,768号の通り、亜鉛フィンガーヌクレアーゼについて報告されるそれらの使用に類似する、付加、欠失、および他の修飾を含むゲノムの標的変化の生成を可能にし得、参考文献および特許の全ては、参照によりその全体が本明細書に組み込まれる。
【0075】
FokIエンドヌクレアーゼドメインは、PCRによって、標準方法で調製される海洋細菌フラボバクテリウム・オケアノコイテス(ATCC)のゲノムDNAからクローン化され得る。FokIエンドヌクレアーゼの配列は、Pubmed(受入番号M28828および受入番号J04623、情報の開示は、参照によりその全体が本明細書に組み込まれる)上で入手可能である。
【0076】
サッカロマイセス・セレビシエ酵母からのI−SceIエンドヌクレアーゼは、相同組み換えの率を増加させるDNA切断を産生するために使用されている。I−SceIは、18bp認識配列を有するミトコンドリアイントロンによってコードされるエンドヌクレアーゼであり、したがって所定のDNA内、さらには大型ゲノム内の非常に低い頻度の認識部位である(Thierry et al.(1991)Nucleic Acids Res.19(1):189−190、参考文献の開示は、参照によりその全体が本明細書に組み込まれる)。I−SceIによって認識される切断部位の低頻度のために、それは相同組み換えを亢進するための使用に好適である。DNA切断を誘発するための、I−SceIの使用に関するさらなる説明は、米国特許出願第20090305402号に見出され得、この特許は、参照によりその全体が本明細書に組み込まれる。
【0077】
I−SceIのための認識部位は、さまざまな異なるシステムに導入されている。後に続く、I−SceIでのこの部位の切断は、その部位が導入されている位置で、相同組み換えを増加させる。相同組み換えの亢進された頻度は、Xenopus卵母細胞、マウスゲノム、およびタバコ植物ニコチアナ・プルムバギニフォリアのゲノムDNAの染色体外DNAに導入されたI−SceI部位を用いて得られている。例えば、Segal et al.(1995)Proc.Natl.Acad.Sci.U.S.A.92(3):806−810、Choulika et al.(1995)Mol.CellBiol.15(4):1968−1973、およびPuchta et al.(1993)Nucleic Acids Res.21(22):5034−5040を参照されたく、参考文献の開示は、参照によりその全体が本明細書に組み込まれる。非相同DNA結合ドメインと共に作動する任意の他のエンドヌクレアーゼドメインは、エフェクター内で利用され得、I−SceIエンドヌクレアーゼは、1つのかかる非限定的例であることが理解されるであろう。DNA認識およびI−SceI等の結合ドメインを有する、エンドヌクレアーゼの使用の限定は、認識部位が所望の位置にまだ存在しない場合、かかる部位が、その部位で相同組み換えを亢進させるために、エンドヌクレアーゼの使用前に、所望の位置で相同組み換えの標準方法によって導入されなければならないことである。既知のエンドヌクレアーゼを修飾することによってまたは1つ以上のかかるエンドヌクレアーゼのキメラ版を作製することによって等の、新規標的DNA配列を認識する、新規エンドヌクレアーゼの設計および合成を可能にする方法が報告されており、こうして目的の内因性標的DNA配列を切断する、かかる操作されたエンドヌクレアーゼドメインの生成のための道が開かれている(Chevalier et al.(2002)MolecularCell10:895−905、国際公開第2007/060495号、国際公開第2009/095793号、Fajardo−Sanchez et al.(2008)Nucleic Acids Res.36:2163−2173、公開および参考文献の双方は、参照によりそれらの全体が組み込まれる)。このため、DNA結合活性を非機能にするが、DNA切断機能は活性に保つために、および上のFokIの使用に類似したDNA切断を誘発するように、エフェクター内で同様に操作されたエンドヌクレアーゼ切断ドメインを利用するために、かかるエンドヌクレアーゼドメインが同様に操作され得ることが構想され得る。かかる用途では、標的DNA配列認識は、好ましくは、エフェクターの反復ドメインによって提供されるであろうが、DNA切断は、操作されたエンドヌクレアーゼドメインによって遂行されるであろう。
【0078】
上述の通り、エフェクターは、所望の特異的標的配列のための特異的認識を備える反復ドメインを含む。好ましい実施形態では、エフェクターは、内因性染色体DNA配列に特異的に結合する。特異的核酸配列またはより好ましくは特異的内因性染色体配列は、相同組み換えを亢進させることが所望される核酸領域内の任意の配列であり得る。例えば、核酸領域は、その中で点突然変異もしくは欠失等の突然変異を導入することが所望される遺伝子を含有する領域、またはそこへ所望の表現型を付与する遺伝子を導入することが所望される領域であってもよい。
【0079】
さらなる実施形態は、その中で所望の付加が導入されている、修飾された植物を生成する方法に関する。方法は、そこへ修飾を導入することが所望される、内因性標的DNA配列を含む植物細胞を得ることと、内因性標的DNA配列に結合する反復ドメイン、およびエンドヌクレアーゼドメインを含むエフェクターを用いて、内因性標的DNA配列内で2本鎖切断を生成することと、内因性標的DNAの少なくとも一部と相同な配列を含む外因性核酸を、外因性核酸と内因性標的DNA配列との間で相同組み換えが生じることを可能にする条件下で、植物細胞に導入することと、相同組み換えが生じている植物細胞から植物を生成することと、を含み得る。他の実施形態は、上述および本明細書の方法に従って作製される、遺伝子組み換え細胞および植物に関する。標的DNA配列は、人工または天然産であり得ることに留意すべきである。かかる方法は、当該技術分野で既知であり、かかる目的で利用される技術および方法を用いて、任意の生物(動物、ヒト、真菌、卵菌細菌、およびウイルスを含むような非限定的生物)において使用され得ることは理解されるであろう。
【0080】
本発明のさらなる実施形態では、これらのモジュール設計された反復ドメインは、遺伝子の、例えば、植物遺伝子、動物遺伝子、真菌遺伝子、卵菌遺伝子、ウイルス遺伝子、またはヒト遺伝子の発現の調節または制御に関与する1つ以上のドメインと組み合わされる。亜鉛フィンガードメインを含有するDNA結合ポリペプチドを生成することによって、遺伝子発現を調節する方法は、当該技術分野で既知である(米国特許第7,285,416号、同第7,521,241号、同第7,361,635号、同第7,273,923号、同第7,262,054号、同第7,220,719号、同第7,070,934号、同第7,013,219号、同第6,979,539号、同第6,933,113号、同第6,824,978号、これらの特許の各々は、参照によりその全体が本明細書に組み込まれる)。例えば、AvrBs3様ファミリーのこれらのエフェクターは、特異的標的DNA配列に結合するために修飾される。かかるポリペプチドは、例えば、遺伝子の転写を活性化、抑制、または他の方法で調節するために、目的の遺伝子のプロモーター内の遺伝的制御領域、または目的の遺伝子のための他の制御性領域に特異的に結合するように本発明の方法によって修飾される、転写活性化因子または転写の抑制因子タンパク質であり得る。
【0081】
本発明のさらなる実施形態では、標的DNA配列は、天然産反復ドメインによってまたは修飾され反復ドメインによって、特異的に認識されるために修飾される。一例として、AvrBs3様ファミリーのメンバーのための標的DNA配列は、対応するAvrBs3エフェクターによって誘発され得る、新規の制御可能なプロモーターを生成するために、プロモーターに挿入することができる。二次的な誘発性システムは、トランス活性化因子および標的遺伝子を用いて構築することができ、ここでトランス活性化因子は、ポリペプチドであり、ここでポリペプチドは、標的遺伝子に結合し、発現を誘発する本発明の反復単位を含む、少なくとも1つの反復ドメインを含む。トランス活性化因子および標的遺伝子は、1つの細胞株に導入することができるが、また異なる細胞株に存在し、後に遺伝子移入されてもよい。さらなる実施形態では、疾患抵抗性植物は、本発明のポリペプチドを含有する反復ドメインの標的DNA配列を、抵抗性仲介遺伝子を活性化させることによって発現後に植物の防御反応をもたらす遺伝子の前に挿入することによって、構築することができる。
【0082】
さらなる実施形態では、カスタムDNA結合ポリペプチドは、反復単位タイプを再配列させることによって構築することができ、こうして新規標的DNA結合特異性を備える反復ドメインの生成を可能にする。個々の反復単位は、典型的クローン化戦略を排除するDNAレベルでほぼ同一である。本発明は、本発明の反復ドメインを備えるカスタムポリペプチドを組み立てるための、迅速で安価な戦略を提供する。かかるポリペプチドのクローン化汎用性を改善するために、2ステップの組み立て方法が設計された。この方法は、それらの標的DNA認識および結合特異性を研究するために、新規反復タイプを備えるポリペプチドを組み立てるために使用された。
【0083】
つまり、任意のDNA配列は、互いの特異的認識および結合を促進するために修飾されたDNA配列に結合するであろう反復単位からなる反復ドメインを有する、ポリペプチドを特異的に標的とするために、塩基対を、遺伝子または遺伝的制御要素の任意のDNA領域または特異的領域に導入することによって、本発明のポリペプチドを含有する反復ドメインによる結合を可能にするように修飾され得る。
【0084】
本発明は、ポリペプチドを認識し、好ましくはそれに結合する真のモジュラーDNAが、効率的に産生され得ることを示しており、ここでポリペプチドの結合モチーフは、特異的塩基対の組み合わせの、それらの認識能力に基づいて選択される反復単位からなる反復ドメインである。したがって、標的DNA内に存在する塩基対の配列を単に考慮することによって、および反復単位を、そこに結合するために必要な特徴を有する結合モチーフとして、適切な順序で組み合わせることによって、任意の所望の標的DNA配列に結合することができるポリペプチドを設計することは、十分に当業者の能力の範囲内であるはずである。標的DNAの既知の配列の長さが長いほど、ポリペプチドに含まれ得るモジュラー反復単位の数は多い。例えば、既知の配列が9塩基長にすぎない場合、上で定義される通り、9つの反復単位は、ポリペプチドに含まれ得る。既知の配列が27塩基長である場合、最大27個の反復単位がポリペプチドに含まれ得る。標的DNA配列が長いほど、ゲノム内の他の場所のDNAの、任意の他の所定の部分における、その発現の可能性は低い。
【0085】
さらに、ポリペプチドへの組み込みのために選択されたそれらの反復単位は、それらの結合特徴を修飾するために人工的に修飾され得る。代替的に(または追加的に)、反復単位の長さおよびアミノ酸配列は、その結合特徴が影響を受けない限り、異なり得る。
【0086】
概して、標的DNA配列に対する高親和性および高特異性を有するような反復単位を選択することが好ましいであろう。
【0087】
本明細書に記載される通り、エフェクターは、任意の選択の内因性遺伝子の発現の制御のために、任意の好適な標的部位を認識するように設計され得る。制御に好適な内因性遺伝子の例としては、VEGF、CCR5、ERアルファ、Her2/Neu、Tat、Rev、HBV C、S、X、およびP、LDL−R、PEPCK、CYP7、フィブリノゲン、ApoB、Apo E、Apo(a)、レニン、NF−カッパB、I−カッパB、TNF−アルファ、FASリガンド、アミロイド前駆体タンパク質、心房性ナトリウム利尿因子、ob−レプチン、ucp−1、IL−1、IL−2、IL−3、IL−4、IL−5、IL−6、IL−12、G−CSF、GM−CSF、Epo、PDGF、PAF、p53、Rb、胎児ヘモグロビン、ジストロフィン、ウトロフィン、GDNF、NGF、IGF−1、VEGF受容体fltおよびflk、トポイソメラーゼ、テロメラーゼ、bcl−2、サイクリン、アンギオスタチン、IGF、ICAM−1、STATS、c−myc、c−myb、TH、PTI−1、ポリガラクチュロナーゼ、EPSP合成酵素、FAD2−1、デルタ−12デサチュラーゼ、デルタ−9デサチュラーゼ、デルタ−15デサチュラーゼ、アセチル−CoAカルボキシラーゼ、アシル−ACP−チオエステラーゼ、ADP−グルコースピロホスホリラーゼ、デンプン合成酵素、セルロース合成酵素、ショ糖合成酵素、細胞老化関連遺伝子、重金属キレート剤、脂肪酸ヒドロペルオキシドリアーゼ、ウイルス遺伝子、原虫遺伝子、真菌遺伝子、および細菌遺伝子が挙げられる。概して、制御される好適な遺伝子には、リンフォカイン、増殖因子、分裂促進因子、走化因子、癌活性因子、受容体、カリウムチャネル、G−タンパク質、シグナル伝達分子、疾患抵抗性遺伝子、および他の疾患関連遺伝が含まれる。
【0088】
別の態様では、細胞中の標的遺伝子の発現を調節する方法が提供される。細胞は、好ましくは植物細胞、ヒト細胞、動物細胞、真菌細胞、または任意の他の生存細胞であってもよい。細胞は、ポリペプチドを含有し、ここでポリペプチドは、反復単位を含む、少なくとも1つの反復ドメインを含み、これらの反復単位は、高度可変領域を含有し、各反復単位は、標的DNA配列内の1塩基対の認識に関与する。ポリペプチドは、ポリペプチドをコードするDNAとして導入されるか、またはポリペプチドは、当該技術分野で既知の方法によって、それ自体が細胞へ導入される。どのように導入されるかに関わらず、ポリペプチドは、塩基対の標的DNAを特異的に認識し、好ましくはそれに結合し、また標的遺伝子の発現を調節する、少なくとも1つの反復ドメインを含むはずである。好ましい実施形態では、全ての反復単位は、標的DNA配列内の塩基対の認識を決定する高度可変領域を含有する。
【0089】
エフェクターの、細胞への取り込みを促進するために、本発明のエフェクターに結合され得るペプチド配列の例としては、以下が挙げられるが、それらに限定されない:HIVのtatタンパク質の11アミノ酸ペプチド;p16タンパク質のアミノ酸84 103に対応する20残基ペプチド配列(Fahraeus et al.(1996)Current Biology6:84を参照されたい);Antennapediaのホメオドメインの60−アミノ酸長の第3ヘリックス(Derossi et al.(1994)J.Biol.Chem.269:10444);カポジ線維芽細胞増殖因子(K−FGF)h領域等のシグナルペプチドのh領域;またはHSVからのVP22転座ドメイン(Elliot&O’Hare(1997)Cell 88:223 233)。亢進された細胞取り込みを提供する、他の好適な化学的部分もまた、エフェクターに化学的に結合され得る。
【0090】
毒素分子もまた、細胞膜を横切ってポリペプチドを輸送する能力を有する。しばしば、かかる分子は、少なくとも次の2つの部分からなる(「2要素毒素」と呼ばれる):転座もしくは結合ドメインまたはポリペプチド、および別個の毒素ドメインまたはポリペプチド。典型的に、転座ドメインまたはポリペプチドは、細胞受容体に結合し、次いで毒素は、細胞中に輸送される。Clostridiumパーフリンジェンス・イオータ毒素、ジフテリア毒素(DT)、緑膿菌外毒素A(PE)、百日咳毒素(PT)、Bacillusアンスラシス毒素、および百日咳アデニレートシクラーゼ(CYA)を含む、複数の細菌毒素は、内部融合物またはアミノ末端融合物として細胞のサイトゾルにペプチドを送達する試みにおいて使用されている(Arora et al.(1993)J.Biol.Chem.268:3334 3341、Perelle et al.(1993)Infect.Immun.61:5147 5156(1993)、Stenmark et al.(1991)J.CellBiol.113:1025 1032(1991)、Donnelly et al.(1993)Proc.Natl.Acad.Sci.USA90:3530 3534、Carbonetti et al.(1995)Abstr.Annu.Meet.Am.Soc.Microbiol.95:295、Sebo et al.(1995)Infect.Immun.63:3851 3857、Klimpel et al.(1992)Proc.Natl.Acad.Sci.USA89:10277 10281、およびNovak et al.(1992)J.Biol.Chem.267:17186 17193)。
【0091】
エフェクターもまた、リポソームおよびイムノリポソーム等のリポソーム誘導体を介して、動物細胞中、好ましくは哺乳動物細胞中に導入することができる。「リポソーム」という用語は、水相を包み込む、1つ以上の同心性の状態の脂質二重層からなる小胞を指す。水相は、典型的に、細胞に送達されるべき化合物、この場合はエフェクターを含有する。リポソームは、形質膜と融合して、それによってサイトゾル中にエフェクターを放出する。代替的に、リポソームは、食細胞化されるかまたは輸送小胞の状態で細胞によって取り込まれる。リポソームは、いったんエンドソームまたは食胞において、輸送小胞の膜を分解するか、またはこれと融合するかのいずれかであり、そしてその内容物を放出する。
【0092】
本発明は、特に、植物および農業技術の分野に関する。一態様では、本発明は、植物細胞中の標的遺伝子の発現を調節する方法に向けられ、この方法は、本発明に従って修飾されたポリペプチドを植物細胞に提供することを含み、ポリペプチドは、標的遺伝子内の標的ヌクレオチド配列またはその相補鎖を特異的に認識することができ、またポリペプチドが標的ヌクレオチド配列を認識すること、特にそれに結合することを可能にし、それによって植物細胞中の標的遺伝子の発現が調節される。
【0093】
ポリペプチドは、当該技術分野で既知の任意の好適な方法を介して植物細胞に提供され得る。例えば、タンパク質は、外因性で植物細胞に付加され得、植物細胞は、ポリペプチドが植物細胞に導入され、標的ヌクレオチド配列に結合し、植物細胞中の標的遺伝子の発現を制御するような条件下で維持される。代替的に、ポリペプチドをコードするヌクレオチド配列、例えば、DNAまたはRNAは、植物細胞中で発現され得、植物細胞は、発現されたポリペプチドが、標的ヌクレオチド配列に結合し、植物細胞中の標的遺伝子の発現を制御するような条件下で維持される。
【0094】
植物細胞中の標的遺伝子の発現を調節するための好ましい方法は、次のステップを含む:a)本発明に従って修飾されたポリペプチドのための発現システムを植物細胞に提供すること(ポリペプチドは、標的遺伝子の発現制御因子、好ましくはプロモーター内の標的ヌクレオチド配列、またはその相補鎖を特異的に認識すること、および好ましくはそこに結合することができる);およびb)ポリペプチドが産生され、標的ヌクレオチド配列に結合し、それによって植物細胞中の標的遺伝子の発現が調節されるような条件下で、植物細胞を培養すること。
【0095】
本方法によって、任意の標的ヌクレオチド配列を調節することができる。例えば、標的ヌクレオチド配列は、標的遺伝子に対して内因性または外因性であってもよい。本発明の実施形態では、標的ヌクレオチド配列は、生存細胞中に存在し得るか、またはインビトロで存在してもよい。特定の実施形態では、標的ヌクレオチド配列は、植物に対して内因性である。標的ヌクレオチド配列は、標的遺伝子に関連する任意の好適な場所に位置してもよい。例えば、標的ヌクレオチド配列は、標的遺伝子のコード領域の上流または下流であってもよい。代替的に、標的ヌクレオチド配列は、標的遺伝子のコード領域内にある。好ましくは、標的ヌクレオチド配列は、遺伝子のプロモーターである。
【0096】
本方法によって、任意の標的遺伝子を調節することができる。例えば、標的遺伝子は、ペプチド、タンパク質、オリゴヌクレオチド、核酸、ビタミン、オリゴ糖、炭水化物、脂質、または小分子の生合成、修飾、細胞輸送、代謝、および分解に影響を及ぼす産物をコードすることができる。さらに、エフェクターは、増加された疾患抵抗性、構造多糖類および貯蔵多糖類の修飾、風味、タンパク質、および脂肪酸、果実成熟、産出量、色、栄養的特性、改善された貯蔵能等の形質について、植物を操作するために使用することができる。
【0097】
したがって、本発明は、標的細胞中の目的の遺伝子の発現を変化させる方法を提供し、それは以下を含む:目的の遺伝子の構造領域および/または制御性領域のDNA配列の少なくとも部分を決定すること(必要な場合);本発明に従って修飾された反復単位を含むポリペプチドを、既知の配列のDNA上の特異的塩基対を認識するように設計すること、および修飾されたポリペプチドを標的細胞中(好ましくはその核内)に存在させること。(DNA配列は、それが既知である場合、決定される必要がないことは明白であろう。)
【0098】
制御性領域は、目的の遺伝子の構造領域からかなり遠隔であり得る(例えば、遠位エンハンサー配列または類似体)。
【0099】
加えて、ポリペプチドは、有利に、他のタンパク質からの機能ドメイン(例えば、制限エンドヌクレアーゼ、リコンビナーゼ、レプリカーゼ、インテグラーゼ等からの触媒ドメイン)またはさらに「合成」エフェクタードメインを含んでもよい。ポリペプチドはまた、核局在化シグナル等の活性化シグナルまたはプロセシングシグナルを含んでもよい。これらは、ポリペプチドの、核内標的(ゲノムDNA等の)への結合を亢進させるために、細胞の核に対するポリペプチドを標的とする際に特に有用である。
【0100】
修飾されたポリペプチドは、ポリペプチドの発現を誘発するDNAの細胞への送達の結果として、細胞中のインサイツで合成されてもよい。DNAの送達を促進する方法は、当業者に周知であり、例えば、組み換えウイルスベクター(例えば、レトロウイルス、アデノウイルス)、リポソーム等を含む。代替的に、修飾されたポリペプチドは、細胞の外側で作製され、次いで細胞へ送達され得る。送達は、ポリペプチドをリポソーム等へ組み込むことによって、またはポリペプチドを標的部分(抗体もしくはホルモン分子の結合部分、または膜遷移ドメイン、または真菌もしくは卵菌エフェクターの転座ドメイン、または細菌毒素の典型的A−Bファミリーの細胞結合Bドメイン等)に結合させることによって、促進され得る。実際に、遺伝子発現を制御する際の、本発明の修飾されたタンパク質の1つの有意な利点は、標的細胞のタンパク質の、ベクターを用いない送達であろう。
【0101】
本発明の知り得る限り、標的DNA配列内の塩基対を特異的に認識することができる、修飾された反復単位を含有するポリペプチドの設計、および遺伝子発現の調節におけるその成功的使用(本明細書に記載される通り)は、かつて一度も示されていなかった。したがって、本明細書に開示される本発明の躍進は、植物中の使用を超えて拡大する、多数の可能性を提示する。本発明の一実施形態では、エフェクターポリペプチドは、疾患関連遺伝子の発現を制御する際の治療的使用および/または予防的使用のために設計される。例えば、ポリペプチドは、ヒト、他の動物、または植物における外来遺伝子(例えば、細菌またはウイルス病原体の遺伝子)の発現を阻害するため、または突然変異した宿主遺伝子(発癌遺伝子等)の発現を修飾するために使用することができる。
【0102】
したがって、本発明はまた、疾患関連遺伝子の発現を阻害することができるエフェクターポリペプチドを提供する。典型的にポリペプチドは、天然産ポリペプチドではなかろうが、疾患関連遺伝子の発現を阻害するように特異的に設計されるであろう。簡便に、エフェクターポリペプチドは、本発明の方法のいずれかによって設計されるであろう。
【0103】
本発明はまた、ゲノム操作の分野に関する。エフェクターポリペプチドは、ゲノム内の特異的DNA配列を標的とするために、本発明に従って生成され得る。ポリペプチドは、標的DNA配列の修飾を誘発する活性を含有するように修飾されてもよい(例えば、標的配列の部位特異的組み換えまたは統合)。この方法は、複合ゲノム内の標的DNA修飾を可能にする。
【0104】
本発明のさらなる実施形態では、少なくとも1つの反復単位を含む反復ドメインを含むように修飾されたポリペプチドが提供され、反復単位は、DNA配列内の塩基対の選択的認識を決定するための高度可変領域を有する。
【0105】
好ましい実施形態では、ポリペプチドは、反復単位内に、次の塩基対の1つの認識を決定するために、次の群から選択される高度可変領域を含む:
・C/Gの認識のためのHD
・A/Tの認識のためのNI
・T/Aの認識のためのNG
・C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS
・G/CまたはA/Tの認識のためのNN
・T/Aの認識のためのIG
・C/GまたはT/Aの認識のためのN
・T/Aの認識のためのHG
・T/Aの認識のためのH
・G/Cの認識のためのNK。
【0106】
本発明はまた、前述のポリペプチドのいずれか1つをコードするDNAを含む。
【0107】
さらなる実施形態では、塩基対が、反復単位を含む少なくとも1つの反復ドメインを含むポリペプチドによって特異的に認識され得るように、標的DNA配列内に位置する塩基対を含むために修飾されるDNAが提供され、この反復単位は、DNA内の塩基対の認識を決定する高度可変領域を有する。任意の一実施形態では、塩基対は、遺伝子発現制御配列内に位置する。反復ドメインのモジュラー組立てに起因して、塩基対の配列は、反復ドメインによって特異的に標的とされ得る。
【0108】
本発明の代替的実施形態では、DNAは、次の高度可変領域の1つによって選択的認識および決定された認識を受容するために、次の群から選択される塩基対によって修飾される:
・HDによる認識のためのC/G
・NIによる認識のためのA/T
・NGによる認識のためのT/A
・NSによる認識のためのCTまたはA/TまたはT/AまたはG/C
・NNによる認識のためのG/CまたはA/T
・IGによる認識のためのT/A。
・Nによる認識のためのC/GまたはT/A
・HGによる認識のためのT/A
・Hによる認識のためのT/A
・NKによる認識のためのG/C。
【0109】
さらに別の態様では、本発明は、本発明に記載のポリペプチドをそこに結合させることによって、試料混合物中に存在する目的の核酸配列を修飾する方法を提供し、それはポリペプチドが目的の配列を認識すること、および好ましくはそこに特異的に結合することを可能にするために、試料混合物を、目的の配列の少なくとも一部に対する親和性を有するポリペプチドと接触させることを含む。
【0110】
本明細書で使用されるとき、「修飾する」という用語は、配列が、単にポリペプチドの結合によって修飾されると考えられることを意味することが意図される。それは、ヌクレオチドの配列が変更されることを示唆することを意図されていないが、かかる変更(およびその他)は、ポリペプチドの、目的の核酸への結合に続いて起こり得る。簡便に、核酸配列は、DNAである。
【0111】
目的の核酸の修飾(モジュラー反復単位を含有するように修飾されたポリペプチドによる、そこへの結合という意味で)は、幾つかの方法のうちのいずれかで検出され得る(例えば、ゲル移動度シフト検定、標識化ポリペプチド標識の使用は、放射性、蛍光、酵素、またはビオチン/ストレプトアビジン標識を含み得る)。
【0112】
目的の核酸配列の修飾(およびその検出)が、必要とされる全てであってもよい(例えば、疾患の診断の際に)。しかしながら、望ましくは、さらなる試料のプロセシングが行われる。簡便に、ポリペプチド(およびそこに特異的に結合する核酸配列)は、試料の残りから分離される。有利に、ポリペプチド−DNA複合体は、かかる分離を促進するために、固相支持体に結合される。例えば、ポリペプチドは、アクリルアミドもしくはアガロースゲルマトリックス中に存在してもよいか、またはより好ましくは、膜の表面上またはマイクロタイタープレートのウェル中で固定化される。
【0113】
本発明の一実施形態では、反復単位を含む前記反復ドメインは、標的認識および好ましくはDNA配列内の1つ以上の特異的塩基対の結合を達成するために、細菌、ウイルス、真菌、卵菌、ヒト、動物、または植物ポリペプチドに挿入され、任意に、ここでの前記反復単位は、DNA配列内の1つ以上の塩基対に対する事前選択された特異的結合活性を得るために、さらに任意に修飾されるタンパク質のAvrBs3様ファミリーの反復ドメインに由来する。
【0114】
本発明は、単離されたまたは実質的に精製された、ポリヌクレオチドまたはタンパク質組成物を包含する。「単離された」または「精製された」、ポリヌクレオチドもしくはタンパク質、またはその生物学的に活性な部分は、通常、その天然産環境で見出されるポリヌクレオチドまたはタンパク質に伴うか、またはそれらと相互作用する構成要素が実質的にまたは本質的にない。したがって、単離されたまたは精製された、ポリヌクレオチドまたはタンパク質は、組み換え技術によって産生されるとき、他の細胞物質または培養媒体が実質的にないか、または化学的に合成されるとき、化学的前駆体または他の化学物質が実質的にない。任意に、「単離された」ポリヌクレオチドは、ポリヌクレオチドがそこに由来する生物のゲノムDNA内のポリヌクレオチドに天然に隣接した(すなわち、ポリヌクレオチドの5’および3’末端に位置する配列)配列(任意にタンパク質コード配列)がない。例えば、種々の実施形態では、単離されたポリヌクレオチドは、ポリヌクレオチドがそこに由来する細胞のゲノムDNA内のポリヌクレオチドに天然に隣接した、約5kb、4kb、3kb、2kb、1kb、0.5kb、または0.1kb未満のヌクレオチド配列を含有することができる。実質的に細胞物質のないタンパク質は、約30%、20%、10%、5%、または1%(乾燥重量で)未満の汚染タンパク質を有するタンパク質の調製を含む。本発明のタンパク質またはその生物学的に活性な部分が、組み換えにより産生されるとき、任意に、培養媒体は、約30%、20%、10%、5%、または1%(乾燥重量で)未満の化学的前駆体または目的の非タンパク質化学物質に相当する。
【0115】
開示されるDNA配列およびそれによってコードされたタンパク質の、フラグメントおよび変異体もまた、本発明によって包含される。「フラグメント」とは、DNA配列の一部またはアミノ酸配列の一部、およびしたがってそれによってコードされたタンパク質を意図する。コード配列を含むDNA配列のフラグメントは、天然タンパク質の生物学的活性を保持するタンパク質フラグメント、およびしたがって本明細書に記載される標的DNA配列に対するDNA認識または結合活性をコードしてもよい。代替的に、DNA配列のフラグメントは、概して生物学的活性を保持するタンパク質をコードしないか、またはプロモーター活性を保持しない、ハイブリダイゼーションプローブとして有用である。したがって、DNA配列のフラグメントは、少なくとも約20ヌクレオチド、約50ヌクレオチド、約100ヌクレオチドから、本発明の最大完全長ポリヌクレオチドの範囲に及んでもよい。
【0116】
「変異体」は、実質的に類似した配列を意味することが意図される。DNA配列について、変異体は、5’および/または3’末端で欠失(すなわち、トランケーション)を有するDNA配列、天然ポリヌクレオチド内の1つ以上の内部部位での1つ以上のヌクレオチドの欠失および/または付加、ならびに/または天然ポリヌクレオチド内の1つ以上の部位での1つ以上のヌクレオチドの置換を含む。本明細書で使用されるとき、「天然」DNA配列またはポリペプチドは、それぞれ、天然産DNA配列またはアミノ酸配列を含む。DNA配列について、保存的変異体は、遺伝的コードの縮重のために、本発明のポリペプチドのアミノ酸配列をコードするそれらの配列を含む。変異体DNA配列はまた、例えば、部位特異的突然変異を用いることによって生成されるが、本発明のタンパク質を依然としてコードするDNA配列等の、合成的に誘発されたDNA配列を含む。概して、本発明の特定のDNA配列の変異体は、本明細書の他の箇所に記載される配列整列プログラムおよびパラメータによって決定される、その特定のポリヌクレオチドに対して、少なくとも約70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するであろう。
【0117】
本発明の特定のDNA配列の変異体(すなわち、参照DNA配列)はまた、変異体DNA配列によってコードされたポリペプチドと、参照DNA配列によってコードされたポリペプチドとの間の、配列同一性の百分率の比較によって評価され得る。任意の2つのポリペプチドの間の百分率配列同一性は、本明細書の他の箇所に記載される配列整列プログラムおよびパラメータを用いて算出され得る。本発明のポリヌクレオチドの任意の所定の対が、それらがコードする2つのポリペプチドによって共有される配列同一性の百分率の比較によって評価される場合、2つのコードされたポリペプチドの間の配列同一性の百分率は、少なくとも約70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える同一性である。
【0118】
「変異体」タンパク質は、天然タンパク質のN末端および/またはC末端での1つ以上のアミノ酸の欠失(いわゆるトランケーション)によって、天然タンパク質に由来するタンパク質、天然タンパク質中の1つ以上の内部部位での1つ以上のアミノ酸の欠失および/または付加、または天然タンパク質中の1つ以上の部位での1つ以上のアミノ酸の置換を意味することが意図される。本発明によって包含される変異体タンパク質は、生物学的に活性であり、つまり、それらは本明細書に記載される天然タンパク質の所望の生物学的活性をプロセスし続ける。かかる変異体は、例えば、遺伝的多型から、または人間による操作からもたらされてもよい。本発明のタンパク質の生物学的に活性な変異体は、本明細書の他の箇所に記載される配列整列プログラムおよびパラメータによって決定される、天然タンパク質のアミノ酸配列に対して、少なくとも約70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するであろう。本発明のタンパク質の生物学的に活性な変異体は、わずか1〜15個のアミノ酸残基、6〜10、わずか5、わずか4、3、2、またはさらに1つのアミノ酸残基等のわずか1〜10個の差で、そのタンパク質から異なってもよい。
【0119】
本発明のタンパク質は、アミノ酸置換、欠失、トランケーション、および挿入を含む種々の方法で変化させられ得る。かかる操作のための方法は、概して当該技術分野で既知である。例えば、タンパク質のアミノ酸配列変異体およびフラグメントは、DNA内の突然変異によって調製され得る。突然変異およびポリヌクレオチド変化のための方法は、当該技術分野で周知である。例えば、Kunkel(1985)Proc.Natl.Acad.Sci.USA82:488−492、Kunkel et al.(1987)Methods in Enzymol.154:367−382、米国特許第4,873,192号、WalkerおよびGaastra,eds.(1983)Techniques in Molecular Biology(MacMillan Publishing Company,New York)、および引用される参考文献を参照されたい。目的のタンパク質の生物学的活性に影響を及ぼさない適切なアミノ酸置換に関する指導は、Dayhoff et al.(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)のモデルで見出され得、それは参照により本明細書に組み込まれる。1つのアミノ酸を、類似した特性を有する別の分子と置換する等の保存的置換が最適であってもよい。
【0120】
本明細書で包含される、タンパク質配列の欠失、挿入、および置換は、タンパク質の特徴の根本的な変化をもたらすことが予測されていない。しかしながら、それを行う前に置換、欠失、または挿入の正確な影響を予測することが困難な場合、当業者は、本明細書の他の箇所に記載される、または当該技術分野で既知の、所定のスクリーニング検定によってこの影響が評価されるであろうことを理解するであろう。
【0121】
変異体DNA配列およびタンパク質はまた、DNAシャフリング等の突然変異誘発手順および組み替え誘導手順に由来する配列およびタンパク質を包含する。かかるDNAシャフリングのための戦略は、当該技術分野で既知である。例えば、Stemmer(1994)Proc.Natl.Acad.Sci.USA91:10747−10751、Stemmer(1994)Nature370:389−391、Crameri et al.(1997)NatureBiotech.15:436−438、Moore et al.(1997)J.Mol.Biol.272:336−347、Zhang et al.(1997)Proc.Natl.Acad.Sci.USA94:4504−4509、Crameri et al.(1998)Nature391:288−291、および米国特許第5,605,793号および同第5,837,458号を参照されたい。
【0122】
PCRアプローチでは、オリゴヌクレオチドプライマーは、目的の任意の生物から抽出されたcDNAまたはゲノムDNAからの対応するDNA配列を増幅するPCR反応で使用するために、設計することができる。PCRプライマーおよびPCRクローン化を設計する方法は、概して当該技術分野で既知であり、Sambrook et al.(1989)Molecular Cloning:ALaboratoryManual(2d ed.,Cold Spring Harbor LaboratoryPress,Plainview,New York)に開示される。また、Innis et al.,eds.(1990)PCR Protocols:AGuideto Methods and Applications(Academic Press,New York)、InnisおよびGelfand,eds.(1995)PCR Strategies(Academic Press,New York)、およびInnisおよびGelfand,eds.(1999)PCR Methods Manual(Academic Press,New York)も参照されたい。PCRの既知の方法は、対形成されたプライマー、入れ子式プライマー、単一特異的プライマー、縮重プライマー、遺伝子特異的プライマー、ベクター特異的プライマー、部分的にミスマッチのプライマー等を用いる方法を含むが、それらに限定されない。
【0123】
ハイブリダイゼーション技術では、既知のポリヌクレオチドの全てまたは部分は、選択された生物からクローン化されたゲノムDNAフラグメントまたはcDNAフラグメント(すなわち、ゲノムまたはcDNAライブラリ)の集団中に存在する他の対応するポリヌクレオチドと、選択的にハイブリッド形成するプローブとして使用される。ハイブリダイゼーションプローブは、ゲノムDNAフラグメント、cDNAフラグメント、RNAフラグメント、または他のオリゴヌクレオチドであってもよく、32P等の検出可能な基、または任意の他の検出可能なマーカーでラベル化されてもよい。したがって、例えば、ハイブリダイゼーションのためのプローブは、本発明のDNA配列に基づいて、合成オリゴヌクレオチドを標識化することによって作製され得る。ハイブリダイゼーションのためのプローブの調製ならびにcDNAおよびゲノムライブラリの構築のための方法は、概して当該技術分野で既知であり、Sambrook et al.(1989)Molecular Cloning:ALaboratoryManual(2d ed.,Cold Spring Harbor LaboratoryPress,Plainview,New York)に開示される。
【0124】
かかる配列のハイブリダイゼーションは、厳格な条件下で行われてもよい。「厳格な条件」または「厳格なハイブリダイゼーション条件」とは、プローブが、他の配列よりも、検出可能なほどに大規模に(例えば、少なくとも背景を2倍上回る)、その標的配列とハイブリッド形成するような条件が意図される。厳格な条件は、配列依存性であり、異なる状況において異なるであろう。ハイブリダイゼーションおよび/または洗浄条件の厳格度を制御することによって、プローブと100%相補的な標的配列が特定され得る(相同プロービング)。代替的に、厳格度条件は、低い程度の類似性が検出されるように、配列内の一部のミスマッチを許容するように調節され得る(非相同プロービング)。概して、プローブは、約1000ヌクレオチド長未満、任意に500ヌクレオチド長未満である。
【0125】
典型的に、厳格な条件は、塩濃度が、pH7.0〜8.3で約1.5M Naイオン未満、典型的に約0.01〜1.0M Naイオン濃度(または他の塩)であり、温度が、短いプローブ(例えば、10〜50ヌクレオチド)の場合少なくとも約30℃、および長いプローブ(例えば、50ヌクレオチド超)の場合少なくとも約60℃であるような条件であろう。厳格な条件はまた、ホルムアミド等の不安定化剤の付加によって達成されてもよい。例示的な低厳格度条件は、30〜35%ホルムアミド、1M NaCl、1%SDS(ドデシル硫酸ナトリウム)の緩衝溶液との37℃でのハイブリダイゼーション、および1X〜2X SSC(20X SSC=3.0M NaCl/0.3Mクエン酸三ナトリウム)中の50〜55℃での洗浄を含む。例示的な中程度の厳格度条件は、40〜45%ホルムアミド、1.0M NaCl、1%SDS中の37℃でのハイブリダイゼーション、および0.5X〜1X SSC中の55〜60℃での洗浄を含む。例示的な高厳格度条件は、50%ホルムアミド、1M NaCl、1%SDS中の37℃でのハイブリダイゼーション、および0.1X SSC中の60〜65℃での洗浄を含む。任意に、洗浄緩衝液は、約0.1%〜約1%SDSを含んでもよい。ハイブリダイゼーションの期間は、概して約24時間未満、通常約4〜約12時間である。洗浄時間の期間は、少なくとも平衡に到達するために十分な時間の長さであろう。
【0126】
特異性は、典型的にポストハイブリダイゼーション洗浄の関数であり、このうち重要な因子は、最終洗浄溶液のイオン強度および温度である。DNA−DNAハイブリッドについて、Tは、MeinkothおよびWahl(1984)Anal.Biochem.138:267−284:T=81.5℃+16.6(対数M)+0.41(GC%)−0.61(形成%)−500/Lの方程式から概算され得、式中、Mは、一価陽イオンのモル濃度、GC%は、DNA内のグアノシンおよびシトシンヌクレオチドの百分率、形成%は、ハイブリダイゼーション溶液中のホルムアミドの百分率、かつLは、塩基対のハイブリッドの長さである。Tは、相補標的配列の50%が、完全にマッチしたプローブとハイブリッド形成する温度(規定のイオン強度およびpH下で)である。Tは、各1%のミスマッチにつき約1℃減少させられ、したがって、T、ハイブリダイゼーション、および/または洗浄条件は、所望の同一性を備える配列とハイブリッド形成するように調節され得る。例えば、90%以上の同一性を備える配列が求められる場合、Tは10℃減少させられ得る。概して、厳格な条件は、規定のイオン強度およびpHで、特定の配列およびその補体についての熱融点(T)よりも、約5℃低くなるように選択される。しかしながら、非常に厳格な条件は、熱融点(T)よりも1、2、3、もしくは4℃低いハイブリダイゼーションおよび/または洗浄を利用することができ、中程度に厳格な条件は、熱融点(T)よりも6、7、8、9、もしくは10℃低いハイブリダイゼーションおよび/または洗浄を利用することができ、低い厳格度条件は、熱融点(T)よりも11、12、13、14、15、もしくは20℃低いハイブリダイゼーションおよび/または洗浄を利用することができる。当業者は、ハイブリダイゼーションおよび/または洗浄溶液の厳格度の変形が、方程式、ハイブリダイゼーションおよび洗浄組成物、ならびに所望のTを用いて、本質的に説明されていることを理解するであろう。所望のミスマッチの程度が、45℃未満(水溶液)または32℃未満(ホルムアミド溶液)のTをもたらす場合、高い温度が使用され得るように、SSC濃度を増加させることが最適である。核酸のハイブリダイゼーションの広範な指導は、Tijssen(1993)LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,Part I,Chapter 2(Elsevier,New York)、およびAusubel et al.,eds.(1995)Current Protocols in Molecular Biology,Chapter 2(GreenePublishing and Wiley−Interscience,New York)で見出される。Sambrook et al.(1989)Molecular Cloning:ALaboratoryManual(2d ed.,Cold Spring Harbor LaboratoryPress,Plainview,New York)を参照されたい。
【0127】
本発明のDNA配列およびタンパク質は、ヌクレオチドまたはアミノ酸配列を含むポリヌクレオチド分子およびタンパク質を包含する、つまり、本明細書に開示されるDNA配列とまたはアミノ酸配列と十分に同一であることが理解される。本明細書で使用されるとき、「十分に同一」という用語は、第1および第2のアミノ酸またはヌクレオチド配列が、共通の構造ドメインおよび/または共通の機能活性を有するように、第2のアミノ酸またはヌクレオチド配列に対して、十分な数もしくは最小の数の、同一もしくは同等の(例えば、類似した側鎖を備える)アミノ酸残基またはヌクレオチドを含有する第1のアミノ酸またはヌクレオチド配列を指す。例えば、少なくとも約70%の同一性、好ましくは75%の同一性、より好ましくは85%、90%、95%、96%、97%、98%、または99%の同一性を有する共通の構造ドメインを含有するアミノ酸またはヌクレオチド配列は、本明細書で十分に同一であるとして定義される。
【0128】
2つのアミノ酸配列のまたは2つの核酸の百分率同一性を決定するために、配列は、最適な比較目的で整列される。2つの配列の間の百分率同一性は、配列によって共有される同一位置の数の関数(すなわち、百分率同一性=同一位置の数/位置の合計数(例えば、重複位置)×100)である。一実施形態では、2つの配列は、同一の長さである。2つの配列の間の百分率同一性は、ギャップを許容しながら、または許容せずに、下記の技術に類似した技術を用いて決定され得る。百分率同一性を算出する際には、典型的に正確なマッチが数えられる。
【0129】
2つの配列の間の百分率同一性の決定は、数学的アルゴリズムを用いて達成され得る。2つの配列の比較に利用される数学的アルゴリズムの、好ましい、非限定的例は、KarlinおよびAltschul(1993)Proc.Natl.Acad.Sci.USA90:5873−5877にあるように修飾された、KarlinおよびAltschul(1990)Proc.Natl.Acad.Sci.USA87:2264のアルゴリズムである。かかるアルゴリズムは、Altschul et al.(1990)J.Mol.Biol.215:403のNBLASTおよびXBLASTプログラムに組み込まれる。BLASTヌクレオチド検索は、本発明のポリヌクレオチド分子と相同なヌクレオチド配列を得るために、NBLASTプログラム、スコア=100、語長=12で行うことができる。BLASTタンパク質検索は、本発明のタンパク質分子と相同なアミノ酸配列を得るために、XBLASTプログラム、スコア=50、語長=3で行うことができる。比較目的のためのギャップ整列を得るために、Altschul et al.(1997)Nucleic Acids Res.25:3389に記載されるGapped BLASTを利用することができる。代替的に、分子の間の距離関係を検出する反復検索を行うために、PSI−Blastを使用することができる。上掲のAltschul et al.(1997)を参照されたい。BLAST、Gapped BLAST、およびPSI−Blastプログラムを利用するとき、それぞれのプログラム(例えば、XBLASTおよびNBLAST)のデフォルトパラメータを使用することができる。http://www.ncbi.nlm.nih.govを参照されたい。配列の比較に利用される数学的アルゴリズムの別の好ましい、非限定的例は、MyersおよびMiller(1988)CABIOS 4:11−17のアルゴリズムである。かかるアルゴリズムは、ALIGNプログラム(2.0版)に組み込まれ、それは、GCG配列整列ソフトウェアパッケージの部分である。アミノ酸配列を比較するためにALIGNプログラムを利用するとき、PAM120重量残基表、12のギャップ長ペナルティ、および4のギャップペナルティを使用することができる。整列はまた、検査によって手動で行われてもよい。
【0130】
特に指示しない限り、本明細書で提供される配列同一性/類似性値は、本発明の完全長配列を用いておよびアルゴリズムClustalW(Nucleic Acid Research,22(22):4673−4680,1994)の平均による多重整列を用いて、ソフトウェアパッケージVector NTI SuiteVersion7に含まれるプログラムAlignXを用いて(InforMax,Inc.,Bethesda,MD,USA)デフォルトパラメータを用いて、またはそれらの任意の同等のプログラムを用いて、得られる値を指す。「同等のプログラム」とは、問題となる任意の2つの配列のために、デフォルトパラメータを用いて、CLUSTALW(1.83版)によって生成される対応する整列と比較されたとき、同一ヌクレオチドまたはアミノ酸残基マッチならびに配列同一性の同一の百分率を有する整列を生成する、任意の配列比較プログラムが意図される(European Bioinformatics Institutewebsite:http://www.ebi.ac.uk/Tools/clustalw/index.htmlにて入手可能)。
【0131】
本発明のDNA配列は、細菌、真菌、藻類、植物、および動物を含むが、それらに限定されない、任意の原核性細胞もしくは真核性細胞および/または目的の生物中の発現のための発現カセット中に提供され得る。カセットは、本発明のDNA配列に作動可能に結合された5’および3’制御配列を含むであろう。「作動可能に結合された」とは、2つ以上の要素の間の機能結合を意味することが意図される。例えば、目的のポリヌクレオチドまたは遺伝子と、制御配列(すなわち、プロモーター)との間の作動可能な結合は、目的のポリヌクレオチドの発現を可能にする機能結合である。作動可能に結合された要素は、隣接または非隣接であってもよい。2つのタンパク質コード領域の結合を指すために使用されるとき、作動可能に結合されたとは、コード領域が、同一の読み枠内にあることが意図される。カセットは、生物に共形質転換される少なくとも1つのさらなる遺伝子をさらに含有してもよい。代替的に、さらなる遺伝子は、多重発現カセット上に提供され得る。かかる発現カセットには、DNA配列の挿入を制御性領域の転写の調節下に置くための、複数の制限部位および/または組み換え部位が提供される。発現カセットは、選択可能なマーカー遺伝子をさらに含有してもよい。
【0132】
発現カセットは、転写の5’−3’方向に、植物もしくは他の生物または非ヒト宿主細胞中で機能的である、転写および翻訳開始領域(すなわち、プロモーター)、本発明のDNA配列、ならびに転写および翻訳末端領域(すなわち、末端領域)を含むであろう。制御性領域(すなわち、プロモーター、転写制御性領域、および翻訳末端領域)および/または本発明のDNA配列は、天然/宿主細胞にまたは互いに類似してもよい。代替的に、本発明の制御性領域および/またはDNA配列は、宿主細胞とまたは互いに非相同であってもよい。配列に関連して本明細書で使用されるとき、「非相同」は、外来種に由来する配列であるか、または、同一の種に由来する場合、人間の意図的な介入によって、組成および/またはゲノム遺伝子座においてその天然形態から実質的に修飾された配列である。例えば、非相同ポリヌクレオチドに作動可能に結合されたプロモーターは、ポリヌクレオチドが由来する種とは異なる種に由来するか、または、同一の/類似した種に由来する場合、1つまたは双方は、それらの原型および/またはゲノム遺伝子座から実質的に修飾されるか、またはプロモーターは、作動可能に結合されたポリヌクレオチドのための天然プロモーターでない。本明細書で使用されるとき、キメラ遺伝子は、コード配列と非相同な転写開始領域に作動可能に結合されたコード配列を含む。
【0133】
末端領域は、転写開始領域を備える天然であってもよく、作動可能に結合された目的のDNA配列を備える天然であってもよく、宿主を備える天然であってもよく、またはプロモーター、目的のDNA配列、植物宿主、またはそれらの任意の組み合わせに対して別の源に由来してもよい(すなわち、外来または非相同)。簡便な末端領域で使用するための植物は、オクトピン合成酵素およびノパリン合成酵素末端領域等の、A.ツメファシエンスのTi−プラスミドから入手可能である。また、Guerineau et al.(1991)Mol.Gen.Genet.262:141−144、Proudfoot(1991)Cell64:671−674、Sanfacon et al.(1991)Genes Dev.5:141−149、Mogen et al.(1990)Plant Cell2:1261−1272、Munroe et al.(1990)Gene91:151−158、Ballas et al.(1989)Nucleic Acids Res.17:7891−7903、およびJoshi et al.(1987)Nucleic Acids Res.15:9627−9639も参照されたい。
【0134】
適切な場合、ポリヌクレオチドは、形質転換生物中の増加された発現のために最適化されてもよい。つまり、ポリヌクレオチドは、改善された発現のために、宿主から好まれるコドンを用いて、合成することができる。宿主優先コドン用途の考察については、例えば、CampbellおよびGowri(1990)Plant Physiol.92:1−11を参照されたい。宿主優先遺伝子、特に植物優先遺伝子を合成する方法は、当該技術分野で入手可能である。例えば、米国特許第5,380,831号および同第5,436,391号、ならびにMurray et al.(1989)Nucleic Acids Res.17:477−498を参照されたく、それらは参照により本明細書に組みこまれる。
【0135】
さらなる配列修飾は、細胞宿主中の遺伝子発現を亢進させることが知られる。これらは、偽性ポリアデニル化シグナル、エクソン−イントロンスプライス部位シグナル、トランスポゾン様反復、および遺伝子発現に有害であり得る他のかかる特徴のはっきりした配列をコードする配列の排除を含む。配列のG−C含量は、宿主細胞中で発現される既知の遺伝子を参照することによって算出される、所定の細胞宿主に平均的なレベルに調節されてもよい。可能な場合、配列は、予測ヘアピン二次性mRNA構造を回避するように修飾される。
【0136】
発現カセットは、5’リーダー配列をさらに含有してもよい。かかるリーダー配列は、翻訳を亢進させるように作用することができる。翻訳リーダーは、当該技術分野で既知であり、以下を含む:ピコルナウイルスリーダー、例えば、EMCVリーダー(脳心筋炎5’非コード領域)(Elroy−Stein et al.(1989)Proc.Natl.Acad.Sci.USA86:6126−6130)、ポティウイルスリーダー、例えば、TEVリーダー(Tobacco Etchウイルス)(Gallie et al.(1995)Gene165(2):233−238)、MDMVリーダー(MaizeDwarf Mosaic ウイルス)(Virology154:9−20)、およびヒト免疫グロブリン重鎖結合タンパク質(BiP)(Macejak et al.(1991)Nature353:90−94)、アルファルファモザイクウイルスのコートタンパク質mRNAからの非翻訳リーダー(AMV RNA4)(Jobling et al.(1987)Nature325:622−625)、タバコモザイクウイルスリーダー(TMV)(Gallie et al.(1989)in Molecular Biologyof RNA,ed.Cech(Liss,New York),pp.237−256)、およびメイズクロロティックモットルウイルスリーダー(MCMV)(Lommel et al.(1991)Virology81:382−385)。また、Della−Cioppa et al.(1987)Plant Physiol.84:965−968も参照されたい。
【0137】
発現カセットを調製する際には、DNA配列を正しい方向、また必要に応じて、正しい読み枠内に提供することができるように、種々のDNAフラグメントを操作してもよい。この目的のために、DNAフラグメントを結合させるためにアダプターまたはリンカーを採用してもよいか、または簡便な制限部位を提供すること、過剰なDNAを除去すること、制限部位を除去すること等の他の操作を伴ってもよい。この目的で、インビトロ突然変異、プライマー修復、制限、アニール、再置換、例えば、転移および塩基転換を伴ってもよい。
【0138】
幾つかのプロモーターを、本発明の実践に使用することができる。プロモーターは、目的の宿主および所望の結果に基づいて選択することができる。核酸は、植物中の発現のために、構成的、組織優先、または他のプロモーターと組み合わせることができる。かかる構成的プロモーターには、例えば、コアCaMV35Sプロモーター(Odell et al.(1985)Nature313:810−812)、イネアクチン(McElroy et al.(1990)Plant Cell2:163−171)、ユビキチン(Christensen et al.(1989)Plant Mol.Biol.12:619−632、およびChristensen et al.(1992)Plant Mol.Biol.18:675−689)、pEMU(Last et al.(1991)Theor.Appl.Genet.81:581−588)、MAS(Velten et al.(1984)EMBO J.3:2723−2730)、ALSプロモーター(米国特許第5,659,026号)等が含まれる。他の構成的プロモーターには、例えば、米国特許第5,608,149号、同第5,608,144号、同第5,604,121号、同第5,569,597号、同第5,466,785号、同第5,399,680号、同第5,268,463号、同第5,608,142号、および同第6,177,611号が含まれる。
【0139】
組織優先プロモーターは、特定の宿主組織内での亢進された発現を標的とするために利用することができる。植物に使用するためのかかる組織優先プロモーターは、葉優先プロモーター、根優先プロモーター、種優先プロモーター、および茎優先プロモーターを含むが、それらに限定されない。組織優先プロモーターは、Yamamoto et al.(1997)Plant J.12(2):255−265、Kawamata et al.(1997)Plant CellPhysiol.38(7):792−803、Hansen et al.(1997)Mol.Gen Genet.254(3):337−343、Russell et al.(1997)Transgenic Res.6(2):157−168、Rinehart et al.(1996)Plant Physiol.112(3):1331−1341、Van Camp et al.(1996)Plant Physiol.112(2):525−535、Canevascini et al.(1996)Plant Physiol.112(2):513−524、Yamamoto et al.(1994)Plant CellPhysiol.35(5):773−778、Lam(1994)Results Probl.CellDiffer.20:181−196、Orozco et al.(1993)Plant MolBiol.23(6):1129−1138、Matsuoka et al.(1993)Proc Natl.Acad.Sci.USA90(20):9586−9590、およびGuevara−Garcia et al.(1993)Plant J.4(3):495−505を含む。かかるプロモーターは、必要な場合、低発現のために修飾することができる。
【0140】
概して、誘発性プロモーターから、特に病原体誘発性プロモーターから、遺伝子を発現することが有益であろう。かかるプロモーターは、例えば、PRタンパク質、SARタンパク質、ベータ−1,3−グルカナーゼ、キチナーゼ等の、病原関連タンパク質(PRタンパク質)からのプロモーターを含み、それは、病原体による感染に続いて誘発される。例えば、Redolfi et al.(1983)Neth.J.Plant Pathol.89:245−254、Uknes et al.(1992)Plant Cell4:645−656、およびVan Loon(1985)Plant Mol.Virol.4:111−116を参照されたい。また、国際公開第99/43819号も参照されたく、それは参照により本明細書に組み込まれる。
【0141】
病原体感染の部位で、またはその付近で局在的に発現されるプロモーターが目的である。例えば、Marineau et al.(1987)Plant Mol.Biol.9:335−342、Matton et al.(1989)Molecular Plant−MicrobeInteractions 2:325−331、Somsisch et al.(1986)Proc.Natl.Acad.Sci.USA83:2427−2430、Somsisch et al.(1988)Mol.Gen.Genet.2:93−98、およびYang(1996)Proc.Natl.Acad.Sci.USA93:14972−14977を参照されたい。また、Chen et al.(1996)Plant J.10:955−966、Zhang et al.(1994)Proc.Natl.Acad.Sci.USA91:2507−2511、Warner et al.(1993)Plant J.3:191−201、Siebertz et al.(1989)Plant Cell1:961−968、米国特許第5,750,386号(線虫誘発性)、および引用される参考文献も参照されたい。トウモロコシPRms遺伝子のための誘発性プロモーターを特に目的とし、その発現は、病原体フザリウム・モニリフォルメによって誘発される(例えば、Cordero et al.(1992)Physiol.Mol.Plant Path.41:189−200)を参照されたい。
【0142】
化学調節プロモーターは、外因性化学調節因子の適用を通じて、植物中の遺伝子の発現を調節するために使用することができる。目的に依存して、プロモーターは、化学の適用が遺伝子発現を誘発する場合、化学誘発性プロモーターであってもよく、化学の適用が遺伝子発現を抑制する場合、化学抑制性プロモーターであってもよい。化学誘発性プロモーターは、当該技術分野で既知であり、ベンゼンスルホンアミド除草剤解毒剤によって活性化される、トウモロコシIn2−2プロモーター、出芽前除草剤として使用される疎水性求電子化合物によって活性化される、トウモロコシGSTプロモーター、およびサリチル酸によって活性化される、タバコPR−1aプロモーターを含むが、それらに限定されない。目的の他の化学制御性プロモーターは、ステロイド反応性プロモーター(例えば、Schena et al.(1991)Proc.Natl.Acad.Sci.USA88:10421−10425およびMcNellis et al.(1998)Plant J.14(2):247−257の糖質コルチコイド誘発性プロモーターを参照されたい)ならびにテトラサイクリン誘発性およびテトラサイクリン抑制性プロモーターを含み(例えば、Gatz et al.(1991)Mol.Gen.Genet.227:229−237、および米国特許第5,814,618号および同第5,789,156号を参照されたい)、それらは参照により本明細書に組み込まれる。
【0143】
発現カセットはまた、形質転換された細胞の選択のために、選択可能なマーカー遺伝子も含む。選択可能なマーカー遺伝子は、形質転換された細胞または組織の選択に利用される。マーカー遺伝子は、ネオマイシンホスホトランスフェラーゼII(NEO)およびヒグロマイシンホスホトランスフェラーゼ(HPT)をコードする遺伝子等の、抗生物質抵抗性をコードする遺伝子、ならびにグルホシネートアンモニウム、ブロモキシニル、イミダゾリノン、および2,4−ジクロロフェノキシ酢酸(2,4−D)等の除草化合物に対する抵抗性を付与する遺伝子を含む。さらなる選択可能なマーカーは、β−ガラクトシダーゼ等の表現型マーカーおよび緑色蛍光タンパク質(GFP)(Su et al.(2004)BiotechnolBioeng 85:610−9およびFetter et al.(2004)Plant Cell16:215−28)、青緑色蛍光タンパク質(CYP)(Bolte et al.(2004)J.CellScience117:943−54およびKato et al.(2002)Plant Physiol129:913−42)、および黄色蛍光タンパク質(EvrogenからのPhiYFP(商標)、Bolte et al.(2004)J.CellScience117:943−54を参照されたい)等の蛍光タンパク質を含む。さらなる選択可能なマーカーについては、概して、Yarranton(1992)Curr.Opin.Biotech.3:506−511、Christopherson et al.(1992)Proc.Natl.Acad.Sci.USA89:6314−6318、Yao et al.(1992)Cell71:63−72、Reznikoff(1992)Mol.Microbiol.6:2419−2422、Barkley et al.(1980)in TheOperon、pp.177−220、Hu et al.(1987)Cell48:555−566、Brown et al.(1987)Cell49:603−612、Figge et al.(1988)Cell52:713−722、Deuschle et al.(1989)Proc.Natl.Acad.Aci.USA86:5400−5404、Fuerst et al.(1989)Proc.Natl.Acad.Sci.USA86:2549−2553、Deuschle et al.(1990)Science248:480−483、Gossen(1993)Ph.D.Thesis,Universityof Heidelberg、Reines et al.(1993)Proc.Natl.Acad.Sci.USA90:1917−1921、Labow et al.(1990)Mol.Cell.Biol.10:3343−3356、Zambretti et al.(1992)Proc.Natl.Acad.Sci.USA89:3952−3956、Baim et al.(1991)Proc.Natl.Acad.Sci.USA88:5072−5076、Wyborski et al.(1991)Nucleic Acids Res.19:4647−4653、HillenおよびWissman(1989)Topics Mol.Struc.Biol.10:143−162、Degenkolb et al.(1991)Antimicrob.Agents Chemother.35:1591−1595、Kleinschnidt et al.(1988)Biochemistry27:1094−1104、Bonin(1993)Ph.D.Thesis,Universityof Heidelberg;Gossen et al.(1992)Proc.Natl.Acad.Sci.USA89:5547−5551、Oliva et al.(1992)Antimicrob.Agents Chemother.36:913−919、Hlavka et al.(1985)Handbook of ExperimentalPharmacology,Vol.78( Springer−Verlag,Berlin)、Gill et al.(1988)Nature334:721−724を参照されたい。かかる開示は、参照により本明細書に組み込まれる。
【0144】
上の選択可能なマーカー遺伝子の一覧は、限定的するものとは意図されていない。本発明で、任意の選択可能なマーカー遺伝子を使用することができる。
【0145】
植物を形質転換するための、多数の植物形質転換ベクターおよび方法が入手可能である。例えば、An,G.et al.(1986)Plant Pysiol.,81:301−305、Fry,J.,et al.(1987)Plant CellRep.6:321−325、Block,M.(1988)Theor.ApplGenet.76:767−774、Hinchee,et al.(1990)Stadler.Genet.Symp.203212.203−212、Cousins,et al.(1991)Aust.J.Plant Physiol.18:481−494、Chee,P.P.およびSlightom,J.L.(1992)Gene.118:255−260、Christou,et al.(1992)Trends.Biotechnol.10:239−246、D’Halluin,et al.(1992)Bio/Technol.10:309−314、Dhir,et al.(1992)Plant Physiol.99:81−88、Casas et al.(1993)Proc.Nat.Acad Sci.USA90:11212−11216、Christou,P.(1993)In Vitro Cell.Dev.Biol.−Plant;29P:119−124、Davies,et al.(1993)Plant CellRep.12:180−183、Dong,J.A.およびMchughen,A.(1993)Plant Sci.91:139−148、Franklin,C.I.およびTrieu,T.N.(1993)Plant.Physiol.102:167、Golovkin,et al.(1993)Plant Sci.90:41−52、Guo Chin Sci.Bull.38:2072−2078、Asano,et al.(1994)Plant CellRep.13、Ayeres N.M.およびPark,W.D.(1994)Crit.Rev.Plant.Sci.13:219−239、Barcelo,et al.(1994)Plant.J.5:583−592、Becker,et al.(1994)Plant.J.5:299−307、Borkowska et al.(1994)Acta.PhysiolPlant.16:225−230、Christou,P.(1994)Agro.Food.Ind.Hi Tech.5:17−27、Eapen et al.(1994)Plant CellRep.13:582−586、Hartman,et al.(1994)Bio−Technology12:919923;Ritala,et al.(1994)Plant.Mol.Biol.24:317−325;およびWan,Y.C.およびLemaux,P.G.(1994)Plant Physiol.104:3748を参照されたい。
【0146】
本発明の方法は、DNA配列を含むポリヌクレオチド構築物を、宿主細胞に導入することを含む。「導入する」とは、構築物が宿主細胞の内部へのアクセスを得るような様態で、ポリヌクレオチド構築物を植物に提示することが意図される。本発明の方法は、ポリヌクレオチド構築物が宿主の1つの細胞の内部へのアクセスを得る限り、ポリヌクレオチド構築物を宿主細胞へ導入するための特定の方法に依存しない。ポリヌクレオチド構築物を細菌、植物、真菌、および動物に導入する方法は、当該技術分野で既知であり、安定的形質転換方法、一過性形質転換方法、およびウイルス仲介方法を含むが、それらに限定されない。
【0147】
「安定的形質転換」とは、植物に導入されたポリヌクレオチド構築物が宿主のゲノムに統合し、それらの子孫によって受け継がれることができることが意図される。「一過性形質転換」とは、宿主に導入されたポリヌクレオチド構築物が宿主のゲノムに統合しないことが意図される。
【0148】
植物および植物細胞の形質転換について、本発明のDNA配列は、標準技術を用いて、目的の宿主細胞または生物中のDNA配列の発現に好適な、当該技術分野で既知の任意のベクターに挿入される。ベクターの選択は、好ましい形質転換技術および形質転換される標的宿主の種に依存する。
【0149】
植物発現カセットを構築し、外来核酸を植物に導入する手法は、概して当該技術分野で既知であり、すでに説明されている。例えば、外来DNAは、腫瘍誘発(Ti)プラスミドベクターを用いて、植物に導入することができる。外来DNA送達に利用される他の方法は、PEG仲介型プロトプラスト形質転換、エレクトロポレーション、微量注入ウィスカ、および直接のDNA取り込みのための遺伝子銃または微粒子銃の使用を含む。かかる方法は、当該技術分野で既知である(Vasil et al.に対する米国特許第5,405,765号、Bilang et al.(1991)Gene100:247−250、Scheid et al.、(1991)Mol.Gen.Genet.,228:104−112、Guerche et al.,(1987)Plant Science52:111−116、Neuhause et al.,(1987)Theor.ApplGenet.75:30−36、Klein et al.,(1987)Nature327:70−73、Howell et al.,(1980)Science208:1265、Horsch et al.,(1985)Science227:1229−1231、DeBlock et al.,(1989)Plant Physiology91:694−701、Methods for Plant Molecular Biology(WeissbachおよびWeissbach,eds.)Academic Press,Inc.(1988)、およびMethods in Plant Molecular Biology(SchulerおよびZielinski,eds.)Academic Press、Inc.(1989)。形質転換の方法は、形質転換される植物細胞、使用されるベクターの安定性、遺伝子産物の発現レベル、および他のパラメータに依存する。
【0150】
本発明のDNA配列は、植物をウイルスまたはウイルス性の核酸に接触させることによって、植物に導入されてもよい。概して、かかる方法は、本発明のポリヌクレオチド構築物をウイルス性のDNAまたはRNA分子に組み込むことを含む。本発明のタンパク質がウイルス性のポリタンパク質の一部として最初に合成されてもよく、次いでインビボまたはインビトロでのタンパク質分解によってプロセスされて、所望の組み換えタンパク質を産生してもよいことが認識される。さらに、本発明のプロモーターが、ウイルス性のRNポリメラーゼによって転写に利用されるプロモーターも包含することが認識される。ウイルス性のDNAまたはRNA分子を用いて、ポリヌクレオチド構築物を植物に導入し、そこでコードされたタンパク質を発現させる方法は当該技術分野で既知である。例えば、米国特許第5,889,191号、同第5,889,190号、同第5,866,785号、同第5,589,367号、および同第5,316,931号を参照されたく、それらは参照により本明細書に組み込まれる。
【0151】
特定の実施形態では、種々の一過性形質転換方法を用いて、本発明のDNA配列を、植物に提供することができる。かかる一過性形質転換方法は、タンパク質またはその変異体およびフラグメントの植物への直接導入、またはタンパク質をコードする転写物の植物への導入を含むが、それらに限定されない。かかる方法は、例えば、微量注入法または微粒子銃法を含む。例えば、Crossway et al.(1986)MolGen.Genet.202:179−185、Nomura et al.(1986)Plant Sci.44:53−58、Hepler et al.(1994)Proc.Natl.Acad.Sci.91:2176−2180、およびHush et al.(1994)TheJournalof CellScience107:775−784を参照されたく、参考文献の全ては、参照により本明細書に組み込まれる。代替的に、ポリヌクレオチドは、当該技術分野で既知の技術を用いて、一過性で植物に形質転換することができる。かかる技術は、下記のアグロバクテリウムツメファシエンス仲介型一過性発現を含む。
【0152】
形質転換された細胞は、従来の方法に従って、植物中で増殖されてもよい。例えば、McCormick et al.(1986)Plant CellReports5:81−84を参照されたい。次いでこれらの植物は増殖され、同一の形質転換株または異なる株のいずれかで受粉され、所望の表現型特徴の構成的発現を有する、得られたハイブリッドが特定されてもよい。所望の表現型特徴の発現が安定的に維持され、受け継がれることを確実にするために、2つ以上の世代が増殖されてもよく、次いで所望の表現型特徴の発現が達成されたことを確実にするために、種子が採取されてもよい。このようにして、本発明は、本発明のポリヌクレオチド構築物、例えば、それらのゲノムに安定的に組み込まれる、本発明の発現カセットを有する形質転換種子(「トランスジェニック種子」とも称される)を提供する。
【0153】
本発明は、単子葉類および双子葉類を含むが、それらに限定されない、任意の植物種子の形質転換に使用されてもよい。特に目的とする植物、および目的の種子を提供する穀物植物には、油糧種子植物、マメ科植物、およびアラビドプシス・タリアナが含まれるが、それらに限定されない。目的の種子には、トウモロコシ、コムギ、オオムギ、イネ、ソルガム、ライ等の穀物種子が含まれる。油糧種子植物には、ワタ、ダイズ、ベニバナ、ヒマワリ、アブラナ属、トウモロコシ、アルファルファ、ヤシ、ココナッツ等が含まれる。マメ科植物には、マメおよびエンドウマメが含まれる。マメには、グアー、イナゴマメ、コロハ、ダイズ、インゲンマメ、ササゲ、リョクトウ、ライマメ、ソラマメ、レンズマメ、ヒヨコマメ等が含まれる。
【0154】
本明細書で使用されるとき、植物という用語は、植物細胞、植物プロトプラスト、植物をそこから再生することができる植物細胞組織培養物、植物カルス、植物群落、および植物中または胚、花粉、胚珠、種子、葉、花、枝、果実、根、根端、葯等の植物部分中で無処置の植物細胞を含む。再生植物の子孫、変異体、および突然変異体もまた、これらの部分が、導入されたポリヌクレオチドを含むという条件で、本発明の範囲内に含まれる。
【0155】
本発明はさらに、本発明のDNA配列の、細菌細胞、酵母細胞、他の真菌細胞、ヒト細胞、および他の動物細胞を含むが、それらに限定されない非植物宿主細胞への導入を包含する。加えて、本発明は、安定的方法および一過性形質転換方法の両方による、DNA配列の、動物および他の生物への導入を包含する。
【0156】
本明細書で説明される通り、本発明のDNA配列を、これらの真核性システムにおいて発現することができる。酵母中の非相同ポリヌクレオチドの合成は、周知である(Sherman et al.(1982)Methods in Yeast Genetics,Cold Spring Harbor Laboratory)。真核性タンパク質の産生のために、広範に利用される2つの酵母は、サッカロミセス・セルビシエおよびピキア・パストリスである。サッカロミセスおよびピキア中での発現のためのベクター、株、およびプロトコルは、当該技術分野で既知であり、商業供給者(例えば、Invitrogen)から入手可能である。好適なベクターは、通常、所望に応じて、3−ホスホグリセリン酸キナーゼまたはオキシダーゼを含むプロモーター、および複製の起点、末端配列等の発現制御配列を有する。
【0157】
本発明の配列はまた、哺乳類起源または昆虫起源の細胞培養物をトランスフェクトする際の使用のために、種々の発現ベクターに連結されることができる。ペプチドの産生に有用な例示的な細胞培養物は、哺乳類細胞である。無処置のタンパク質を発現することができる幾つかの好適な宿主細胞株は、当該技術分野で開発されており、HEK293、BHK21、およびCHO細胞株を含む。これらの細胞のための発現ベクターは、複製の起点、プロモーター(例えば、CMVプロモーター、HSV tkプロモーター、またはpgk(ホスホグリセリン酸キナーゼ)プロモーター)、エンハンサー(Queen et al.(1986)Immunol.Rev.89:49)等の発現制御配列、およびリボソーム結合部位、RNAスプライス部位、ポリアデニル化部位(例えば、SV40大型T AgポリA付加部位)等の必要なプロセシング情報部位、および転写終結配列を含んでもよい。本発明のタンパク質の産生に有用な他の動物細胞は、例えば、American TypeCultureCollectionから入手可能である。
【0158】
昆虫細胞中で本発明のタンパク質を発現するための適切なベクターは、通常、SF9バキュロウイルスに由来する。好適な昆虫細胞株には、カ幼虫、カイコ、ヨトウムシ、ガ、およびSchneider細胞株等のDrosophila細胞株が含まれる(Schneider(1987)J.Embyol.Exp.Morphol.27:353−365を参照されたい)。
【0159】
酵母に関しては、高等動物または植物宿主細胞が採用されるとき、ポリアデニル化または転写終結配列は、典型的にベクターに組み込まれる。終結配列の例は、ウシ増殖ホルモン遺伝子からのポリアデニル化配列である。転写物の正確なスプライシングのための配列がまた含まれてもよい。スプライシング配列の例は、SV40からのVP1イントロンである(Sprague et al.(1983)J.Virol.45:773−781)。追加的に、宿主細胞中の複製を制御するための遺伝子配列は、ウシパピローマウイルス型ベクターで見出されるベクター等のベクターに組み込まれてもよい(Saveria−Campo(1985)DNACloning Vol.II APracticalApproach,D.M.Glover,Ed.,IRLPress,Arlington,Va.,pp.213−238)。
【0160】
動物および下等真核性(例えば、酵母)宿主細胞は、種々の手段によるトランスフェクションに適格であるか、または適格にされる。DNAを動物細胞に導入する、周知の方法が複数存在する。これらには以下が含まれる:リン酸カルシウム沈殿、受容細胞の、DNAを含有する細菌プロトプラストとの融合、受容細胞の、DNAを含有するリポソームでの処置、DEAEデキストリン、エレクトロポレーション、遺伝子銃、およびDNAの、細胞への直接微量注入。トランスフェクトされた細胞は、当該技術分野で周知の手段によって培養される(Kuchler(1997)BiochemicalMethods in Cell Culture and Virology,Dowden,Hutchinson and Ross,Inc.)。
【0161】
最も頻繁には、原核生物は、大腸菌の種々の株に代表されるが、他の微生物菌株がまた本発明の方法で使用されてもよい。一般的に使用される原核対照配列は、本明細書で、リボソーム結合配列と共に、任意にオペレーターを供える、転写開始のためのプロモーターを含むように定義され、ベータラクタマーゼ(ペニシリナーゼ)および乳糖(lac)プロモーターシステム(Chang et al.(1977)Nature198:1056)、トリプトファン(trp)プロモーターシステム(Goeddel et al.(1980)Nucleic Acids Res.8:4057)、ならびにラムダ誘導P LプロモーターおよびN遺伝子リボソーム結合部位(Shimatake et al.(1981)Nature292:128)等の一般的に使用されるプロモーターを含む。選択マーカーの、大腸菌中にトランスフェクトされたDNAベクターへの組み込みもまた有用である。かかるマーカーの例としては、アンピシリン、テトラサイクリン、またはクロラムフェニコールに対する抵抗性を特定する遺伝子が挙げられる。
【0162】
ベクターは、適切な宿主細胞の導入を可能にするために選択される。細菌ベクターは、典型的にプラスミドまたはファージに由来する。適切な細菌細胞は、ファージベクター粒子に感染するか、またはネイキッドファージベクターDNAでトランスフェクトされる。プラスミドベクターが使用される場合、細菌細胞は、プラスミドベクターDNAでトランスフェクトされる。本発明のタンパク質を発現するための発現システムは、バチルス属菌およびサルモネラ(Palva et al.(1983)Gene22:229−235)、Mosbach et al.(1983)Nature302:543−545)を用いて入手可能である。
【0163】
融合タンパク質に関して、「作動可能に結合された」は、2つ以上の要素またはドメインの間の機能結合を意味することが意図される。1つ以上のアミノ酸のリンカーは、2つ以上の要素の所望の機能を維持するために、2つ以上の要素の各々の間に挿入されてもよいことが認識される。
【0164】
本発明の一実施形態では、融合タンパク質は、少なくとも1つのタンパク質またはその部分もしくはドメインに作動可能に結合された本発明の反復ドメインを含む。本発明の特定の実施形態では、タンパク質またはその部分もしくはドメインは、DNAまたはRNAを修飾することができるタンパク質またはその機能部分もしくはドメインを含む。他の実施形態では、タンパク質またはその機能部分もしくはドメインは、転写活性化因子または転写抑制因子として機能することができる。好ましいタンパク質には、転写活性化因子、転写抑制因子、抵抗性仲介タンパク質、ヌクレアーゼ、トポイソメラーゼ、リガーゼ、インテグラーゼ、リコンビナーゼ、リゾルバーゼ、メチラーゼ、アセチラーゼ、デメチラーゼ、およびデアセチラーゼが含まれるが、それらに限定されない。
【0165】
次の実施例は、例示の目的で提供され、限定を目的としない。
【実施例】
【0166】
実施例1:TALエフェクターのDNA特異性のための塩基の特定
AvrBs3が、誘発標的遺伝子内のプロモーター要素であるUPAボックスに直接に結合するという事実に促され(Kay et al.(2007)Science318,648−651、Roemer et al.(2007)Science318:645−648)、我々は、DNA配列特異性のための塩基を調査した。各反復領域は、概して34個のアミノ酸からなり、反復単位は、ほぼ同一であるが、アミノ酸12および13は、高度可変である(Schornack et al.(2006)J.Plant Physiol.163:256−272、図1A)。AvrBs3のC最末端の反復は、その最初の20個のアミノ酸においてのみ他の反復単位との配列類似性を示し、したがって半反復と称される。反復単位は、それらの高度可変な第12および第13アミノ酸に基づいて、異なる反復タイプに分類することができる(図1B)。UPAボックス(18(20)/19(21)bp)のサイズは、AvrBs3中の反復単位の数(17.5個)にほぼ対応するため、我々は、AvrBs3の1つの反復単位が、1つの特異的DNA塩基対に接触するという可能性を考えた。AvrBs3の反復タイプ(各反復のアミノ酸12および13)がUPAボックスに投影されるとき、特定の反復タイプが、標的DNA内の特異的塩基対と相関することが明白となる。例えば、HDおよびNI反復単位は、それぞれ、CおよびAへの強い選好を有する(図1B)。簡潔にするために、上部(センス)DNA鎖の塩基のみを指定する。我々の認識特異性のモデルは、4つの反復単位(Δ11〜14、図5A、B)を欠く、AvrBs3反復欠失誘導体AvrBs3Δrep16が、より短いおよび異なる標的DNA配列を認識するという事実によって支持される(図5〜8)。AvrBs3誘発性トウガラシ遺伝子のUPAボックスの配列比較、および突然変異分析に基づいて、AvrBs3の標的DNAボックスは、AvrBs3の反復単位の数よりも1bp長いようである。加えて、Tは、第1反復の予測認識特異性の直前に、UPAボックスの5’末端で保存される(図1)。興味深いことに、アミノ酸配列保存の欠如にもかかわらず、第1反復および反復領域に先行するタンパク質領域の二次構造予測は、類似性を示す。これは、反復0と名付けられる、さらなる反復を示唆する(図1B)。
【0167】
我々のモデル(図1B)をさらに立証および拡大するために、それらの反復単位の配列に基づいて、キサントモナスTALエフェクターの未知の標的DNA配列を予測し、また推定結合部位の存在について、既知のTAL標的遺伝子のプロモーターおよびそれらの対立遺伝子を検査した。我々は、対応するTALエフェクターに応答して誘発される、対立遺伝子のプロモーター内の予測された特異性にマッチする配列を特定したが、非誘発性対立遺伝子内ではそれを特定しなかった(図5C〜F)。これらのボックスの存在は、誘発遺伝子が、対応するTALエフェクターの直接標的であることを示唆する。標的DNA配列内の異なる反復タイプについてのDNA塩基の頻度に基づいて、8つのTALエフェクターを用いて、特定の反復タイプのDNA標的特異性のためのコードを推定した(図1C、D、図5)。
【0168】
我々のモデルを実験的に検証するために、アブラナ科病原体X.カンペストリス・パソバーアルモラシア(22)からのTALエフェクターHax2(21.5個の反復単位)、Hax3(11.5個の反復単位)、およびHax4(14.5個の反復単位)についての標的DNA配列を予測した。Hax3およびHax4は、DNA結合および遺伝子活性化が実験的に示されているAvrBs3に存在する反復タイプを排他的に含有するため、第1に、Hax3およびHax4についての標的DNAボックスを誘導した(アミノ酸12/13:NI、HD、NG、NS、図1A、図2A)。Hax3およびHax4標的ボックスを、非常に弱い基礎活性を有する、ミニ(−55〜+25)トマトBs4プロモーターの前に配置し(Schornack et al.(2005)Mol.Plant−MicrobeInteract.18:1215−1225、図2B、図9)、プロモーターレスuidA(β−グルクロニダーゼ、GUS)レポーター遺伝子を誘導した。一過性発現研究のために、レポーター構築物を、アグロバクテリウム仲介型T−DNA送達を用いて、カリフラワーモザイクウイルス35S−プロモーター誘導性エフェクター遺伝子hax3およびhax4と共に、ニコチアナ・ベンサミアナ葉にトランスフェクトした。定性および定量GUS検定により、Hax3ボックスまたはHax4ボックスを含有するプロモーターが、対応するエフェクターの存在時に、強力におよび特異的に誘発されることが示された(図2C)。同様に、Hax3の予測標的DNA配列内の第1のヌクレオチド(T)の重要性に対処し、5’末端にA、C、G、またはTのいずれかを備える4つの異なるHax3ボックスを生成した(図10A、B)。N.ベンサミアナにおけるhax3とレポーター構築物との共発現は、5’Tを備えるHax3ボックスを含有するプロモーターのみが、Hax3の存在時に強力に誘発される一方で、他がより弱い活性化をもたらすことが示された(図10C)。これは、0位がHax3および同様の他のTALエフェクターのプロモーター活性化特異性に寄与することを示す。幾つかの反復タイプがより広範な特異性を付与する、すなわち、1つを超える塩基を認識する可能性に対処するために、Hax4ボックスを置換した(図3A、B)。一過性GUS検定により、Hax4中のNI反復単位、HD反復単位、およびNG反復単位が、それぞれ、塩基A、C、およびTの認識を強力に選好する一方で、NS反復単位が、4つの塩基全てを認識することが示された(図3B、図11)。複数のTALエフェクターが、NN反復単位を含有するため(図5および図15、表1)、NN反復単位を備える人工TALエフェクターである、ArtX1を生成し、我々のコードを用いて、対応するDNA認識配列を推定した(図3C)。ArtX1ボックス誘導体の分析により、NN反復単位が、AおよびGの両方を認識し、中でもGを選好することが示された(図3C)。この結果は、NN反復単位に相当する位置でAまたはGのいずれかを含有するイネにおける、天然AvrXa27ボックスの我々の予測を裏付ける(図5C)。加えて、AvrXa10のNN反復単位に相当する位置でAまたはGのいずれかを備える、2つの潜在的なAvrXa10ボックスを誘導した。双方のレポーター構築物は、AvrXa10によって効率的に誘発された(図12)。まとめると、これらのデータは、幾つかの反復タイプが、特異的塩基対を認識する一方で、他がより柔軟であることを強力に示唆する。
【0169】
Hax2は、典型的な34個のアミノ酸の反復単位の代わりに、1反復当たり35個のアミノ酸を含有するため、例外的TALエフェクターである(Kay et al.(2005)Mol.Plant−MicrobeInteract.18:838−848)。加えて、Hax2は、その第2反復内で希有なアミノ酸の組み合わせを含有する(アミノ酸12/13:IG、図2A)。Hax2ボックスの対応する第3塩基を置換し、一過性検定を用いて、エフェクターHax2を備えるレポーター遺伝子活性化を分析した。これにより、IG反復が、Tに対する特異性を付与することが示された(図13)。Hax2ボックスは、Hax2によるプロモーター活性化をもたらすのみであるが、Hax3またはHax4によるプロモーター活性化をもたらさない(図2C)。これは、35個のアミノ酸の反復単位が、34個のアミノ酸の反復単位と同様に機能することを示す。これは、35個のアミノ酸反復単位を含有するTALエフェクターAvrHah1が、Bs3仲介型抵抗性を誘発するという事実によって支持される(Schornack et al.(2008)New Phytol.179:546−556)。AvrHah1の反復タイプは、Bs3プロモーター内のUPAボックスとマッチする(図5A、B)。
【0170】
興味深いことに、アラビドプシス・タリアナにおけるhax2の発現は、紫色の葉をもたらし、それはアントシアニンの蓄積を示す(図14A、B)。Hax2標的遺伝子を特定するために、縮重Hax2ボックス配列でのパターン検索(Patmatch,TAIR;www.arabidopsis.org)を用いて、A.タリアナゲノムのプロモーター領域を分析した。推定Hax2標的遺伝子の1つは、アントシアニン生合成を制御するMYB転写因子PAP1(At1G56650)をコードする(Borevitz et al.(2000)Plant Cell12:2383−2394)。PAP1転写物レベルの半定量的分析により、PAP1の発現が、Hax2によって強力に誘発されることが示された(図14C)。PAP1プロモーター領域の目視検査により、最適以下のHax2ボックスの存在が示された(図14D、E)。TALエフェクター反復タイプのためのコード(図1D)および上述のデータに基づいて、その幾つかは重要な病原性因子であるさらなるTALエフェクターのための推定標的DNA配列を予測した(図15、表1)。
【0171】
TALエフェクター内の反復数は、1.5〜28.5個の範囲に及ぶため、少ない反復単位を備えるエフェクターが遺伝子発現を活性化し得るかどうかは、主要な議題である。したがって、反復単位の数が、標的遺伝子発現にどのように影響を及ぼすかを試験した。このために、Hax3のN末端領域およびC末端領域ならびに0.5〜15.5個のHD反復単位を備える反復ドメインを含有する人工エフェクターを構築した(Cに対する特異性)。技術的理由により、全てのケースで第1反復は、NIであった(Aに対する特異性)。対応する標的DNAボックスは、TAに続く17個のC残基からなる(図4A、B)。一過性Bs4−プロモーターGUS検定を用いて、N.ベンサミアナにおける人工エフェクターによるプロモーター活性化を測定した。遺伝子誘発のために少なくとも6.5個の反復単位が必要とされた一方で、10.5個以上の反復単位が、強力なレポーター遺伝子活性化をもたらした(図4C)。これらのデータは、反復単位の最小数が、人工標的DNAボックスを認識し、遺伝子発現を活性化させる必要があることを示す。この結果はまた、より少ない反復数を備えるエフェクターが、主に非活性であることを示唆する。TALエフェクターの反復領域が、連続した標的DNA配列に対応する連続的性質を有することが示されている。したがって、新規DNA結合特異性を備えるエフェクターを生成することは、実行可能であるはずである。各々無作為に組み立てられた12.5個の反復単位(図3C、D)を備える、3つの人工エフェクターを生成し(ArtX1、ArtX2、ArtX3)、予測標的DNA配列を含有するBs4プロモーター−レポーター融合の誘発について試験した。3つの人工エフェクター全ては、対応する標的DNAボックスの存在時に、GUSレポーターのみを強力におよび特異的に誘発した(図3E、図11)。1つの反復単位が、各反復のアミノ酸12および13を介してDNA内の1つの塩基対に接触するという、TALエフェクターの認識特異性についての我々のモデルは、TALエフェクターの結合特異性およびの植物標的遺伝子の特定を予測することを可能にする。多くのTALエフェクターは、主な病原性因子であるため、植物標的遺伝子の知識は、キサントモナズ(xanthomonads)によって引き起こされる植物疾患発生の我々の理解を大幅に高めるであろう。加えて、我々は、特異的DNA結合ドメインを備える転写因子として作用する、人工エフェクターの設計に成功した。従来、亜鉛フィンガー単位の縦列配列を含有する亜鉛フィンガー転写因子は、特異的標的DNA配列に結合するように操作されている。
【0172】
同様に、TALエフェクターは、容易に再配列することができる線形DNA結合特異性を有する。TALエフェクター内の反復領域の仮定右手型高次へリックス構造が、遺伝物質の右手型ヘリックスとの相互作用に対する潜在的機構を直接に示唆することは、我々の注意を免れなかった。標的DNAと複合体を形成するTALエフェクターの、新規DNA結合ドメインの構造を決定することは重要であろう。
【0173】
次の段落は、本発明のさらなる実施形態を説明する。
【0174】
1)天然産AvrBs3相同タンパク質のDNA結合特異性の予測および抵抗性植物の生成。
AvrBs3ファミリーの天然産エフェクターの反復ドメインの反復単位は、対応するDNA結合特異性をコードする。これらの認識配列は、認識コードで予測することができる。
【0175】
予測認識配列の、トランスジェニック植物における遺伝子の前の人工挿入は、対応するAvrBs3様エフェクターが植物細胞に転座される場合(例えば、細菌感染の間に)、遺伝子の発現をもたらす。
【0176】
認識配列が、その発現が植物の防御反応(抵抗性仲介遺伝子)をもたらす遺伝子の前に挿入される場合、かかる構築されたトランスジェニック植物は、対応するエフェクターを転座させる植物病原体細菌の感染に対して抵抗性である。
【0177】
2)その発現がAvrBs3−ファミリーの特異的エフェクターによって誘発される植物遺伝子の特定
植物遺伝子のプロモーター領域内のAvrBs3ファミリーの、対応するエフェクターのDNA標的配列の予測は、エフェクターによるこれらの遺伝子の誘発性発現のための指標である。本発明に従う方法を用いて、誘発性植物遺伝子を予測することが可能である。予測は、特に、配列されたゲノム内で明快である。
【0178】
3)発現システムにおける転写活性化因子としての、他のエフェクターの使用
Hax3およびHax4の使用に類似して、AvrBs3ファミリーの他のメンバーの予測DNA結合配列は、対応するAvrBs3エフェクターによって誘導することができる新規制御可能なプロモーターを生成するために、プロモーターに挿入することができる。
【0179】
4)二次的な誘発性システムの構築
2つの構築物を植物に導入する。第1に、その発現が誘発性プロモーターの制御下にあるhax3遺伝子である。第2に、プロモーター内にHax3ボックスを含有する標的遺伝子である。hax3の発現の誘発は、次いで標的遺伝子の発現を誘発するHax3タンパク質の産生をもたらす。説明される2成分性構築物は、標的遺伝子の可変の発現を可能にする、2倍の発現スイッチをもたらす。トランス活性化因子および標的遺伝子もまた、最初に異なる植物株に存在してもよく、自由に遺伝子移入されてもよい。これに類似して、Hax4および対応するHax4ボックスを使用することができる。このシステムはまた、AvrBs3ファミリーの他のメンバーまたは人工誘導体および予測DNA標的配列と共に使用することもできる。このシステムの機能は、すでに検証することができた。その天然プロモーターの制御下で誘発性avrBs3遺伝子ならびにBs3遺伝子を含有し、その発現がAvrBs3によって誘発され得る、トランスジェニックアラビドプシス・タリアナ植物を構築した。avrBs3の発現の誘発は、Bs3の発現、したがって細胞死をもたらす。国際公開第2009/042753号を参照されたく、それは参照により本明細書に組み込まれる。
【0180】
5)疾患抵抗性植物の構築
AvrBs3類似エフェクターのDNA標的配列が、その発現が植物の防御反応(抵抗性仲介遺伝子)をもたらす遺伝子の前に挿入される場合、対応するように構築されたトランスジェニック植物は、植物病原体生物の感染に対して抵抗性となり、このエフェクターを有効にするであろう。かかる抵抗性仲介遺伝子は、例えば、生物/病原体の分散を防止する局在細胞死をもたらすことができるか、または植物細胞の基礎抵抗性もしくは全身抵抗性を誘発することができる。
【0181】
6)特異的DNA配列の検出のための反復ドメインの生成、およびそれに続く遺伝子の転写の誘発
中央反復ドメインのモジュラー構造は、明確なDNA結合特異性の標的構築、およびこれと共に、選択された植物遺伝子の転写の誘発を可能にする。DNA結合特異性は、新規エフェクター−DNAボックス変異体が標的遺伝子の発現の誘発性のために生成されるように、標的遺伝子の前に人工的に挿入することができる。さらに、生物中の天然産DNA配列を認識する反復ドメインを構築することができる。このアプローチの利点は、本発明の対応するエフェクターが、この生物の細胞中に存在する場合、非トランスジェニック生物中の任意の遺伝子の発現が、誘発され得るということである。
【0182】
エフェクターの導入は、異なる方法で行うことができる:
(1)タンパク質輸送システムで細菌を介して転移する(例えば、III型分泌系);
(2)人工AvrBs3タンパク質での細胞衝撃;
(3)遺伝子移入、アグロバクテリウム、ウイルスベクター、もしくは細胞衝撃を介する、エフェクターの産生をもたらすDNAセグメントの転移;または
(4)標的細胞によってエフェクタータンパク質の取り込みをもたらす他の方法。
【0183】
AvrBs3ファミリーのエフェクターの中央反復ドメインは、DNA結合ドメインの新規タイプである(Kay et al.,2007)。単一の反復単位の特異性の解読は、現在、この領域のDNA結合特異性の標的適合を可能にしている。DNA結合領域は、配列特異的効果を生成するために、他の機能ドメインと翻訳的に融合することができる。かかるタンパク質融合の4つの例を下に提供する。
【0184】
7)生存生物の細胞中の遺伝子の誘発性発現のための転写活性化因子の構築
AvrBs3様ファミリーのエフェクターは、植物細胞中の遺伝子の発現を誘発する。このために、タンパク質のC末端は、必須であり、それはタンパク質の植物核への移入を仲介する、転写活性化ドメインおよび核局在配列を含有する。AvrBs3相同タンパク質のC末端は、それが真菌、動物、またはヒト系における遺伝子の発現を仲介するような方法で、修飾することができる。それによって、ヒト、他の動物、または真菌において転写活性化因子として機能するエフェクターを構築することができる。したがって、本発明に従う方法は、植物だけでなく、他の生存生物にも適用することができる。
【0185】
8)転写抑制因子としてのエフェクターの使用
反復ドメインのDNA結合特異性は、特異的抑制因子として作用するエフェクターを構築するために、タンパク質融合体内の他のドメイン共に使用することができる。これらのエフェクターは、それらが標的遺伝子のプロモーターに結合するような方法で生成されている、DNA結合特異性を示す。転写活性化因子であるTALエフェクターと対照的に、これらのエフェクターは、標的遺伝子の発現をブロックするために構築される。典型的抑制因子と同様に、これらのエフェクターは、それらの標的DNA配列の認識またはそこへの結合によってプロモーター配列をカバーし、さもなければ標的遺伝子の発現を制御する因子に対して、それらをアクセス不可能にすることが予測される。代替的に、または加えて、反復ドメインは、EARモチーフ等の転写抑制ドメインに融合することができる(Ohta et al.Plant Cell13:1959−1968(2001))。
【0186】
9)特異的配列の標識化および単離のための反復ドメインの使用
反復ドメインの、特異的標的DNA配列を認識する能力は、特異的DNA配列を標識化するために、他のドメインと共に使用することができる。C末端側GFP(「緑色蛍光タンパク質」)は、例えば、所望のDNA配列を検出する人工反復ドメインに融合することができる。この融合タンパク質は、インビボおよびインビトロで、対応するDNA配列に結合する。この配列の染色体上の位置を、融合GFPタンパク質を用いて局在化することができる。類似した方法では、タンパク質の細胞局在(例えば、FISHによって)を可能にする他のタンパク質ドメインを、細胞のゲノム内の対応するDNA配列に対するタンパク質を標的とする、特異的人工反復ドメインに融合することができる。加えて、本発明の反復ドメインのDNA認識特異性は、特異的DNA配列を単離するために使用することができる。このために、AvrBs3様タンパク質をマトリックスに固定化することができ、マッチング配列を含有する対応するDNA分子と相互作用する。したがって、特異的DNA配列を、DNA分子の混合物から単離することができる。
【0187】
10)DNAのエンドヌクレアーゼ切断のための反復ドメインの使用
反復ドメインのDNA認識特異性は、DNAを特異的に切断するために、好適な制限エンドヌクレアーゼと融合することができる。したがって、反復ドメインの列特異的結合は、エンドヌクレアーゼが、所望の位置でDNAを特異的に切断するように、少数の特異的配列に対する融合タンパク質の局在をもたらす。亜鉛フィンガーヌクレアーゼを用いて行われた作業に類似して、標的DNA配列の認識を用いて、FokI等の非特異的ヌクレアーゼを、特異的エンドヌクレアーゼに変化させることができる。例えば、2つのエフェクターDNA標的部位の間の最適距離は、2つのFokIドメインの二量体化を支持するのに必要であろう距離に決定されるであろう。これは、2つのDNA結合部位が、異なるサイズのスペーサー配列によって分離される構築物の収集を分析することによって達成されるであろう。このアプローチを用いることにより、ヌクレアーゼ仲介型DNA切断が生じることを可能にする距離、および異なるDNA配列を標的とするさらなるエフェクターヌクレアーゼの機能分析を決定することが可能となる。代替的アプローチでは、新規に開発された1本鎖FokIダイマー(Mino et al.(2009)J Biotechnol140:156−161)が採用される。このアプローチでは、2つのFokI触媒ドメインは、本発明の単反復ドメインに転写的に融合される。したがって、対応するヌクレアーゼの機能性は、2つの異なるタンパク質上に位置する、2つのFokIドメインの分子内二量体化にもはや依存しない。このタイプの構築は、亜鉛フィンガーベースのDNA結合モチーフの背景において首尾よく使用されている。さらに、これらの方法は、複合DNA−分子内の少数の位置のみでの非常に特異的な切断を可能にする。これらの方法は、とりわけ、インビボで2本鎖切断を導入するために、およびこれらの位置でドナーDNAを選択的に組み込むために使用することができる。これらの方法はまた、トランス遺伝子を特異的に挿入するためにも使用することができる。
【0188】
11)カスタム設計された反復順序を備える反復ドメインの構築
反復ドメインの個々の反復単位の間の高い類似性に起因して、上述のカスタムDNA結合ポリペプチドの構築は、従来のクローン化方法を用いる方法を通じては実行できない可能性がある。この実施例に詳述される通り、Bs4プロモーター(図17B、C)等の、目的のプロモーター内の所望のDNA配列にマッチする反復単位順序を備える反復ドメインは、本発明の認識コードに基づいて決定される。「ゴールデンゲート」クローン化を用いて、特異的11.5個の反復単位順序の生成を達成した(Engler et al.(2008)PLoS ONE3:e3647)。形成ブロックとして、Hax3のN末端およびC末端、ならびに11.5個の反復単位に類似した12個の個々の反復単位をサブクローン化した。各形成ブロックは、フラグメントの、カスタムエフェクターポリペプチドへの秩序組立てを可能にする、個々の隣接BsaI部位(図18)を含有した。エフェクター(ARTBs4)を、合計14個のフラグメントから、カスタムエフェクターポリペプチドの、植物細胞中のN末端側標識GFP融合(図18)としてのアグロバクテリウム仲介型の発現を可能にするBsaI適合性バイナリーベクターへと正確に組み立てた。
【0189】
12)ウイルス抑制因子としてのエフェクターの使用
反復ドメインのヌクレオチド結合特異性は、細胞中のウイルス複製を妨害するエフェクターを設計するために使用することができる。これらのエフェクターは、ウイルスの複製起点におけるヌクレオチド配列およびウイルス機能に重要な他の配列に対して標的化された、ヌクレオチド結合特異性を示すであろう。ウイルス機能をブロックするために、さらなるタンパク質ドメインがこれらの反復ドメインに融合される必要はない。それらは、プロモーター、エンハンサー、長末端反復単位、および内部リボソーム進入部位を含む、複製の起点または他の主要な配列を、それらに結合し、かつウイルスによりコードされたRNA依存性RNAポリメラーゼ、ヌクレオキャプシドタンパク質、およびインテグラーゼを含む、ウイルス複製およびウイルス機能に関与する、宿主もしくはウイルス因子に対してそれらをアクセス不可能にすることによりカバーすることによって、典型的抑制因子と同様に作用する、このタイプの戦略は、亜鉛フィンガータンパク質で首尾よく使用されている(Sera(2005)J.Vir.79:2614−2619、Takenaka et al.(2007)NuclAcids Symposium Series 51:429−430)。
【0190】
約すると、本発明は、本発明の方法のいずれかで使用されるであろう単離された核酸分子、ならびにそれらのゲノムに安定的に組み込まれた非相同ポリヌクレオチドおよび上述のヌクレオチド分子を含む形質転換植物をさらに含み、それらは好ましくはプロモーター要素に作動可能に結合され、かつ/または目的の遺伝子に作動可能に結合される。形質転換植物は、好ましくは単子葉類または双子葉類である。本発明はまた、形質転換植物の種子を含む。本発明は、本発明のポリヌクレオチドまたは本発明のポリペプチドのいずれかで形質転換されたヒトおよび非ヒト宿主細胞を含む。本発明のヌクレオチドおよびポリペプチドのいずれかと組み合わせて使用されるプロモーターは、好ましくは組織特異的プロモーター、化学誘発性プロモーター、および病原体誘発性プロモーターである。
【0191】
本発明を、動物および植物システムにおいて使用することができる一方で、1つの好ましい任意の実施形態は、植物中のシステムにおける使用に言及する。植物という用語は、植物細胞、植物プロトプラスト、植物をそこから再生することができる植物細胞組織培養物、植物カルス、植物群落、および植物中または胚、花粉、胚珠、種子、葉、花、枝、果実、根、根端、葯等の植物部分中で無処置の植物細胞を含む。これらの部分が、導入されたポリヌクレオチドを含むという条件で、再生植物の子孫、変異体、および突然変異体もまた、本発明の範囲内である。
【0192】
物質および方法
細菌株および増殖条件。エスケリキア・コリを溶原培養液(LB)中で37℃で、アグロバクテリウムツメファシエンスGV3101を酵母エキス培養液(YEB)中で30℃で培養し、適切な抗生物質を補充した。
【0193】
植物物質および植菌。ニコチアナベンサミアナ植物を、16時間の光および40〜60%の湿度を保ちながら、グリーンハウスで栽培した(日中および夜間温度は、それぞれ23℃および19℃)。5〜7週間目の植物の成熟葉を、前述の通り、無針注射器を用いてアグロバクテリウムで植菌した(S1)。植菌された植物を、16時間の光、22℃および18℃の夜間温度を保ちながら、グロースチャンバ(PercivalScientific)に移した。
【0194】
人工エフェクターの構築。修飾された反復領域を備えるエフェクターの構築は、Esp3I(Fermentas)制限フラグメントの連結に基づいた。Esp3Iは、その認識配列の外側を切断し、典型的に1反復当たり1回である。本発明のエフェクターの生成のためのGATEWAY(Invitrogen)適合性ENTRYベクターを構築するために、hax3のN末端およびC末端を、校正ポリメラーゼ(HotStar HiFidelityPolymeraseKit;Qiagen)を用いて、PCRによって増幅し、SOE(重複伸長によるスプライシング)−PCRによって組み合わせ、pCR8/GW/TOPOに挿入し、1.5個の反復単位を備えるhax3誘導体を得た(pC3SE26、第1反復=NI、最後の半反復=NG)。開始コドンに先行する1bpフレームシフトを、GATEWAY組み換え(Invitrogen)を用いて、フレーム内N末端融合を可能にするために部位特異的突然変異によって挿入し、pC3SEIFを得た。単一の反復単位を、ほとんどの反復単位および反復特異的逆方向プライマーへの順方向プライマー結合を用いて、TALエフェクターから増幅した。双方のプライマーは、天然に存在するEsp3I部位を含んだ。1つを超える反復の増幅を回避するために、テンプレートDNAを、PCR反応前にEsp3Iで分解した。PCR産物を、Esp3Iで分解し、Esp3I分解pC3SE26へとクローン化し、単一の反復がEsp3Iで切除され得る2.5個の反復単位を備えるHax3誘導体を得た(HD反復=Hax3の反復5、NI反復=Hax3の反復11、NG反復=Hax4の反復4、NN反復=Hax4の反復4のG13N突然変異体)。ArtHDエフェクター骨格構築物は、最後の半反復がHD反復に突然変異した、Hax3のN末端およびC末端らなる。得られた構築物を、Esp3Iによって制限し、脱リン酸化した。反復単位をコードするDNAフラグメントを、単一のHD反復を含有するpC3SE26誘導体から、Esp3Iで切除し、アガロースゲルを介して精製した。コンカテマー連結を促進するために、ベクターへのモル過剰の挿入を用いて、連結を行い、大腸菌へ形質転換した。反復単位の数を、StuIおよびHincIIを用いて、組み換えプラスミド中で決定した。上述の反復単位をコードするDNAフラグメントを、クローン化された単一のNI、HD、NN、およびNG反復単位(それぞれ、A、C、G/A、およびTに対する特異性)から単離することによって、反復タイプの無作為の組み合わせを備えるArtX1−3エフェクターを生成した。フラグメントを、ベクターpC3SEIFを備えるコンカテマー連結反応物に、各々等しいモル濃度で付加した。12.5個の反復単位を備える本発明のエフェクターを含有するプラスミドを、後に続く分析のために選択した。N末端GFPエフェクター融合の発現のために、エフェクターを、GATEWAY組み換え(Invitrogen)によってpGWB6(S2)へとクローン化した。オリゴヌクレオチド配列は、要望に応じて入手可能である。全ての構築物を配列した。
【0195】
GUSレポーター構築物。ミニマルBs4プロモーターをPCRによって増幅し、5’末端(S3、図S5)に標的DNAボックスを備えるpENTR/D−TOPO(Invitrogen)に挿入した。プロモーター誘導体を、プロモーターレスuidA遺伝子を含有するpGWB3(S2)へとクローン化した。
【0196】
hax2トランスジェニックA.タリアナの構築。hax2を、誘発性alcAプロモーターの制御下で、アスペルギルス・ニデュランスから、35S主導型alcRエタノール依存性調節因子遺伝子およびnptII選択マーカーを含有する、バイナリーT−DNAベクターbinSRNACatN(Zeneca Agrochemicals)のGATEWAY適合性誘導体へとクローン化した。AlcRは、alcAプロモーターのエタノール依存性誘発を誘導する(S4)。これらの遺伝子を含有するT−DNAを、フローラルディップ植菌を用いて、A.ツメファシエンスを介して、A.タリアナCol−0に形質転換した(S5)。形質転換体を、滅菌培地上のカナマイシン抵抗性植物として選択した。
【0197】
人工エフェクター、ARTBs4の構築。11.5個の特異的秩序の反復単位を備えるエフェクターを組み立てるために、「ゴールデンゲート」クローン化(Engler et al.(2008)PLoS ONE3:e3647)を使用した。Hax3のN末端およびC末端、ならびに11.5個の反復単位に類似した12個の個々の反復単位をサブクローン化した。各形成ブロックは、フラグメントの、人工エフェクターへの秩序組立てを可能にする、個々の隣接BsaI部位を含有した。任意の所望の反復組成物を備えるエフェクターの標的組立てのために、反復単位の形成ブロックレパートリーを伸長した。DNA内の4つの天然塩基(A、C、G、およびT)のいずれかに対する標的特異性を可能にするために、1反復単位当たりアミノ酸12および13に基づいて、4つの異なる反復タイプを選択した。4つの反復タイプおよびそれらの特異性は以下の通りである:NI=A、HD=C、NG=T、NN=GまたはA。普遍的に適用可能な組立てキットを生成するために、4つの反復単位タイプの各々に相当する4つの単位を、12個の反復位置の各々に対する隣接BsaI部位を用いてクローン化した。合計48個の形成ブロックは、4つの反復単位タイプの任意の組成で、11.5個の反復単位を備えるエフェクターを組み立てるために使用することができるライブラリに類似する。
【0198】
β−グルクロニダーゼ(GUS)検定。一過性GUS検定のために、エフェクター構築物およびGUSレポーター構築物を送達するアグロバクテリウム株を、1:1で混合し、0.8のOD600でニコチアナベンサミアナ葉に植菌した。前述の通り、2つの葉片(直径0.9cm)を、浸透2日後に試料採取し(dpi)、4−メチル−ウンベリフェリル−β−D−グルクロニド(MUG)を用いて、定量GUS活性を決定した(S1)。Bradford検定(BioRad)を用いて、タンパク質を定量化した。データは、異なる植物からの3回分の試料に相当する。定性GUS検定のために、葉片を2dpiで試料採取し、X−Gluc(5−ブロモ−4−クロロ−3−インドリル−β−D−グルクロニド)染色溶液(S3)中でインキュベートし、エタノール中で脱染し、乾燥させた。実験を少なくとも2回行い、類似した結果となった。
【0199】
hax2、hax3、およびhax4の発現。hax2、hax3、およびhax4を、pAGH2、pAGH3、およびpAGH4を用いて、構成的カリフラワーモザイクウイルス35Sプロモーターの制御下で、植物中で発現させた(S6)。
【0200】
DNaseIフットプリント。記載される通り(S7)、次の修飾を用いてDNaseIフットプリントを行った:テンプレートおよびPhusion DNAポリメラーゼ(Finnzymes)として、それぞれ、プラスミドpCRBluntII−TOPO::FPBs3(−211〜+108のBs3プロモーターフラグメント)およびpCRBluntII−TOPO::FPBs3−E(−224〜+108のBs3−Eプロモーターフラグメント)を用いて、Bs3およびBs3−EプロモーターDNAの蛍光標識されたPCR産物を生成した。テンプレートおよびPhusion DNAポリメラーゼ(Finnzymes)として、プラスミドpCRBluntII−TOPO::FPU20−ubm−r16(ubm−r16突然変異を含有する、−213〜+86のUPA20プロモーターフラグメント(S7)を用いて、UPA20−ubm−r16プロモーターDNAの蛍光標識されたPCR産物を生成した。製造業者の指示に従って、Thermo SequenaseDyePrimer ManualCycleSequencing Kit(USB)を用いて、プラスミドpCRBluntII−TOPO::FPBs3、pCRBluntII−TOPO::FPBs3−E、およびpCRBluntII−TOPO::FPU20−ubm−r16を配列した。内部遺伝子GeneScan−500LIZ SizeStandard(Applied Biosystems)を、DNAフラグメントサイズを決定するために使用した。
【0201】
実施例2:Gヌクレオチドに結合するTAL反復単位の特定
TALエフェクターのDNA結合ドメインは、縦列配列された34アミノ酸反復単位からなる。反復単位のアミノ酸配列は、DNA標的特異性を定める12位および13位の2つの隣接した高度可変残基(HVR)を除いて、主に保存されている(Boch et al.(2009)Science326:1509−1512、Moscou&Bogdanove(2009)Science326:1501)。機能分析は、A(NI)、C(HD)、T(NG、IG)に優先的に結合するか、またはGおよびA(NN)に同等によく結合するHVRモチーフを特定した(Boch et al.(2009)Science326:1509−1512)。バイオインフォマティクス分析により、所定のプロモーター−TALエフェクター相互作用におけるHVRが、Gに特異的にマッチすることが示された(Moscou&Bogdanove(2009)Science326:1501)。しかしながら、この分析は、単一の(HN&NA)または2つの(NK)相互作用部位に基づいていた。我々の見解では、相互作用部位の数は、HVR特異性についての信頼できる結論に達するには少なすぎる。それにもかかわらず、これらのHVRは、Gへの特異的結合を仲介し得る好適な候補であると考えることができる。
【0202】
未知の特異性を備えるHVRの標的特異性を明確にするために、s3プロモーター内のAvrBs3とUPAボックスとの間の、よく特徴付けられた相互作用を利用した。部位特異的突然変異を用いて、第5および第6反復単位内のHVR NIをNKによって置換し、AvrBs3−NK5/6を得た。野生型Bs3プロモーター内の第5および第6反復のNI残基は双方ともAヌクレオチドにマッチした。部位特異的突然変異を用いて、Bs3プロモーター内の2つのAヌクレオチドを、2つのC、G、およびTヌクレオチドによって置換した。野生型Bs3プロモーターおよび3つのプロモーター突然変異体をuidAレポーター遺伝子に融合し、ニコチアナベンサミアナ葉における野生型AvrBs3またはAvrBs3−NK5/6のいずれかと組み合わせて、アグロバクテリウムツメファシエンス一過性発現を介して試験した。GUS検定により、AvrBs3−NK5/6が、「GG」Bs3プロモーター突然変異体との組み合わせにおいてのみGUSレポーターを活性化させる一方で、AvrBs3が、Bs3野生型プロモーター構築物との組み合わせにおいてのみそれを活性化させることが示された。
【0203】
我々の分析は、NKがGと特異的に対形成し、したがって、より多くの特異的反復配列を生成する選択肢、またGリッチ標的配列を特異的に標的とする選択肢を提供することを示唆する。
【0204】
実施例3:ゴールデンゲートクローン化を介する、デザイナーエフェクターの生成のための方法
TALエフェクターのDNA結合ドメインは、縦列配列された34アミノ酸反復単位(REF)からなる。反復単位のアミノ酸配列は、DNA標的特異性を定める12位および13位の2つの隣接した高度可変残基(HVR)を除いて、主に保存されている(Boch et al.(2009)Science326:1509−1512、Moscou&Bogdanove(2009)Science326:1501)。異なるHVRモチーフは、異なるレベルの特異性で、個々のA、C、G、またはTヌクレオチドに結合する。重要なことに、統計的分析は、縦列配列された反復単位が、隣接単位の特異性を干渉しないことを示唆する(Moscou&Bogdanove(2009)Science326:1501)。したがって、事前に特徴付けられた特異性を備える反復単位のモジュラー組立ては、所望のDNA特異性を備えるDNA−認識モジュールの生成のための効率的な方法を提供する可能性が高い。
【0205】
しかしながら、所望の反復ドメインをコードするDNA構築物の生成は、反復単位がほぼ同一であるという事実に起因して難易度が高い。過去に、我々は、所望のHVR組成を備える17.5個の反復単位をコードするエフェクター遺伝子を生成するために、化学合成を使用していた。DNAレベルで反復単位の間の差異を最大化するために、遺伝的コードの縮重を利用した。DNA配列をコードする17.5個の反復単位のコドン最適化配列は、対応するTALエフェクター野生型遺伝子と対照的に、PCR増幅可能であり、PCRベースの突然変異に従う。我々の知見はまた、エフェクター反復ドメインの化学合成が、概して実行可能であることも示す。しかしながら、化学合成では、所望のHVR組成を備える、多数のエフェクターの迅速でコスト効率の高い生成が可能でない。さらに、このアプローチでは、20個以上の反復単位を備える反復ドメインの生成が可能でない可能性が最も高いであろう。
【0206】
近年開発された「ゴールデンゲートクローン化」は、所望の組成物の反復単位配列の生成ための代替的アプローチを提供する。この戦略は、それらの認識配列の外側を切断する、IIS型制限酵素の使用に基づく。4bp粘着末端を作り出す、IIS型酵素BsaIを用いて作業を行う。IIS型酵素において、認識および切断部位は分離しているという事実に起因して、BsaI制限によって、原則として、マルチフラグメント連結のための塩基を提供する256(4)個の異なる粘着末端を生成することができる。切断部位の適切な設計によって、IIS型制限酵素によって切断される2つ以上のフラグメントは、原制限部位を欠く産物に連結することができる(Engler et al.(2008)PLoS ONE3:e3647、Engler et al.(2009)PLoS ONE4:e5553)。
【0207】
しかしながら実際には、この方法に対して2つの限界が存在する。幾つかの反応におけるエキソヌクレアーゼ活性に起因して、1本鎖オーバーハングDNA粘着末端は、4塩基から3塩基に減少し、事実上、適合する粘着末端の数を16(2)個のみにする。第2に、連結反応の効率は、多数の挿入に伴い急激に減少するため、天然産の機能TALエフェクターで典型的に見出されるような、17.5個の反復単位を備えるエフェクターを作り出すことが必要となるほどである。これらの限界を回避するために、20、30、40、またはそれを超える反復単位のエフェクターの効率的産生を可能にする、2段階連結プロセスを設計した。
【0208】
我々の「反復−配列形成キット」の基盤は、個々の反復単位(1プラスミド当たり1つの反復単位)を含有する一連の「挿入プラスミド」、一連の10個の反復単位からなる反復ドメインを含有する「中間体ベクター」、ならびにTALエフェクターのN末端およびC末端非反復領域を含有する1つの「受容体ベクター」である。全ての反復単位は、BsaI認識部位が挿入プラスミドにおける挿入に隣接するような方法で設計される。
【0209】
マルチフラグメント連結の説明を簡略化するために、本明細書では、反復単位遺伝子の異なる末端を大文字で定義し(粘着末端の配列オーバーハングの代わりに)、それらの配向(反復単位のN末端またはC末端)を角括弧内のNまたはC(例えば、A[C])で示す。第1反復単位遺伝子を含有する挿入プラスミドは、BsaI処置がA[N]およびB[C]末端を作り出すような方法で設計される。第2反復単位遺伝子は、BsaI切断後にB[N]およびC[C]末端を有する一方で、第3反復単位遺伝子を備える挿入プラスミドのBsaI切断は、C[N]およびD[C]末端等をもたらす。適合する末端のみが融合され得るため、第1反復単位遺伝子のB[C]末端は、第2反復単位遺伝子のB[N]末端に特異的に融合するであろう。同様に、第2反復単位遺伝子のC[C]末端は、第3反復単位遺伝子のC[N]末端に特異的に連結し、他も同様であろう。
【0210】
BsaI分解は、設計された隣接反復単位のみと適合する、4bp粘着オーバーハングを備える反復単位を放出する。BsaI認識部位自体は、切断された挿入プラスミドベクター内に残り、放出された挿入部分は、BsaI認識部位を有さない。反復単位は、切断−連結反応(切断および連結が同時に起こる)において、オーバーハング末端によって特定される順序で共に結合される。BsaIおよびリガーゼの同時作用に起因して、反復単位の挿入ドナーベクターへの再連結は、これがBsaI認識部位を回復させるため、回避される。対照的に、所望の連結産物は、BsaI認識部位を欠いている。この実験的設計は、このクローン化手順を高効率にする。
【0211】
特異的塩基配列を認識するように設計されるエフェクターを生成するために、各反復単位位置のための4つの変異体を作製する。これらの変異体は、特異的ヌクレオチド認識特異性を備える個々の反復単位である(例えば、C塩基の認識のための12位および13位におけるHD残基、AのためのNI等)。各位置のための変異体を、各反復単位のために適切な粘着末端を用いて作製し、例えば、所望のDNA認識に基づいて選択し、反復単位1のために4つの潜在的な挿入プラスミドが存在するように、反復単位1のためにA[N]およびB[C]末端を作製する。異なるヌクレオチド認識特異性ならびにB[N]およびC[C]末端を備える、反復単位2のための4つの変異体が存在し、各反復位置についても同様である。
【0212】
連結を2段階で行う。第1段階では、10個の反復単位を中間体ベクターに組み合わせる。異なる一連の10個の反復単位を、中間体ベクター中に組み合わせることができる。中間体ベクター1は、反復単位1〜10を含有し、中間体ベクター2は、反復単位11〜20を含有し、他も同様である。第2段階では、単独で組み立てられた10個の反復単位を、受容体ベクターに組み合わせる。受容体ベクターはまた、最終構築物において10、20、30、40個、または他の10の倍数の反復単位からなる完全なエフェクターが組み立てられるように、エフェクターのN末端およびC末端非反復領域を含有する。中間体ベクターは、10個の反復単位フラグメントを導入するための挿入部分においてBsaI部位を有し、また隣接ベクター配列において隣接BpiI部位も有する。BpiIは、BsaIとは異なる認識部位を備える、別のIIS型酵素である。BsaIを用いて、10個の反復単位を最初に「中間体ベクター」に組み立て、BpiIを用いて、組み立てられた10mersを1つのフラグメントとして放出する。このフラグメントを、TALエフェクターのN末端およびC末端非反復領域の間でBpiI部位を含有する受容体ベクターとの、BpiI切断−リガーゼ反応において連結する。この場合、2〜4つの挿入のみを受容体ベクターへと連結する。これは、各連結を高特異的にし、40個以上の反復単位を容易に組み立てることを可能にする。
【0213】
反復単位配列がその中で最終的にクローン化される受容体ベクターは、GATEWAYEntryクローンを代表し、したがってエフェクターの、任意の所望の発現構築物への組み換えベースの転移を可能にする。現在、受容体ベクターは、TAL−タイプ転写因子を生成するように設計される。しかしながら、わずかな修飾により、受容体ベクターは、FokIエンドヌクレアーゼまたは他の所望の機能ドメインへの、反復配列の融合も可能にする。
【0214】
この方法の概略図を、図19A〜Dに提供する。
【0215】
実施例4:標的DNA−特異的ヌクレアーゼの産生および試験
標的DNA配列およびFokIヌクレアーゼ(「TAL−type−ヌクレアーゼ」)を認識する、本発明の反復ドメインを含む融合タンパク質を、本明細書に開示される方法または当該技術分野で既知の方法のいずれかによって説明される通りに産生する。対応する標的DNAでのインキュベーションによって、融合タンパク質を、ヌクレアーゼ活性について試験する。反復ドメインDNA標的部位を、プラスミドベクターの多重クローン化部位へとクローン化する(例えば、ブルースクリプト)。陰性対照として、TALヌクレアーゼ標的部位を含有しない「空のベクター」または突然変異でクローン化された標的部位のいずれかを使用する。DNA基質のTALタイプヌクレアーゼでの処置の前に、ベクターを、ベクター骨格内で切断する好適な標準エンドヌクレアーゼでの処置によって直線化する。この直線化されたベクターを、インビトロで生成された反復ドメイン−FokIヌクレアーゼ融合タンパク質でインキュベートし、産物をアガロースゲル電気泳動によって分析する。ゲル電気泳動における2つのDNAフラグメントの検出は、特異的ヌクレアーゼ仲介型切断のための指標である。対照的に、反復ドメインによって認識される標的部位を含有しない陰性対照は、反復ドメイン−FokIヌクレアーゼ融合タンパク質での処置による影響を受けない。反復ドメイン−FokIヌクレアーゼ融合タンパク質を生成するために、インビトロ遺伝子発現およびタンパク質合成のための、DNA主導型、無細胞システムを使用する(例えば、T7High−Yield Protein Expression System;Promega)。かかるシステムを使用するために、反復ドメイン−FokIヌクレアーゼ融合タンパク質ヌクレオチド配列を、T7RNAポリメラーゼの前にクローン化する。インビトロ転写および翻訳を介して産生されるかかる融合タンパク質を、さらなる精製を行わずにDNA切断検定で使用する。
【0216】
本明細書で、冠詞「a」および「an」は、冠詞の文法的対象物の1つ以上(すなわち、少なくとも1つ)を指すために使用される。例として、「要素(an element)」は、1つ以上の要素を示す。
【0217】
本明細書全体にわたって、単語「含むこと(comprising)」または「含む(comprises)」もしくは「含むこと(comprising)」等の変形は、指定の要素、整数もしくはステップ、または要素、整数もしくはステップの群を含むことを意味することが理解されるであろうが、任意の他の要素、整数もしくはステップ、または要素、整数もしくはステップの群を除外するものではない。
【0218】
本明細書で言及される全ての公開物および特許出願は、本発明がそれに付随している当業者のレベルの指標である。全ての公開物および特許出願は、各個々の公開物または特許出願が、参照により組み込まれることを具体的に個々に示されているのと同じ程度に、参照により本明細書に組み込まれる。追加的に、次の特許出願の各々は、これにより参照されてその全体が本明細書に組み込まれる:2009年1月12日に出願されたDE第10 2009 004 659.3号、2009年7月13日に出願されたEP第09165328号、および2009年7月13日に出願されたUS第61/225,043号。
【0219】
前述の発明は、明確な理解の目的で、例示および実施例として幾らか詳細に説明されたが、添付の特許請求の範囲内で特定の変更および修正が行われてもよいことは、明白であろう。

【特許請求の範囲】
【請求項1】
標的DNA配列内の少なくとも1つの塩基対を選択的に認識するポリペプチドを産生する方法であって、前記方法は、反復ドメインを含むポリペプチドを合成することを含み、前記反復ドメインは、転写活性化因子様(TAL)エフェクターに由来する少なくとも1つの反復単位を含み、前記反復単位は、前記標的DNA配列内の塩基対の認識を決定する高度可変領域を含み、前記反復単位は、前記DNA配列内の1つの塩基対の前記認識に関与し、かつ前記高度可変領域は、
(a) C/Gの認識のためのHD、
(b) A/Tの認識のためのNI、
(c) T/Aの認識のためのNG、
(d) C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS、
(e) G/CまたはA/Tの認識のためのNN、
(f) T/Aの認識のためのIG、
(g) C/Gの認識のためのN、
(h) C/GまたはT/Aの認識のためのHG、
(i) T/Aの認識のためのH、および
(j) G/Cの認識のためのNKからなる群から選択されるメンバーを含む、方法。
【請求項2】
前記高度可変領域は、前記反復単位内のアミノ酸12および13に対応する、請求項1に記載の方法。
【請求項3】
前記反復ドメインは、1.5〜40.5個の反復単位を含む、請求項1または2に記載の方法。
【請求項4】
前記反復ドメインは、11.5〜33.5個の反復単位を含む、請求項1または2に記載の方法。
【請求項5】
前記ポリペプチドは、前記反復ドメインに作動可能に結合された少なくとも1つの追加ドメインをさらに含む、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記追加ドメインは、細菌、ウイルス、真菌、卵菌、ヒト、動物、植物、もしくは人工タンパク質、またはそれらの一部を含む、請求項5に記載の方法。
【請求項7】
前記追加ドメインは、DNAまたはRNAを修飾することができる、タンパク質またはその機能部分もしくはドメインを含む、請求項6に記載の方法。
【請求項8】
前記追加ドメインは、転写活性化因子、転写抑制因子、抵抗性仲介タンパク質、ヌクレアーゼ、トポイソメラーゼ、リガーゼ、インテグラーゼ、リコンビナーゼ、リゾルバーゼ、メチラーゼ、アセチラーゼ、デメチラーゼ、およびデアセチラーゼからなる群から選択されるタンパク質またはその機能部分もしくはドメインを含む、請求項6に記載の方法。
【請求項9】
前記ポリペプチドの前記反復ドメインは、前記ポリペプチドをコードするDNA配列を発現することによって合成され、前記ポリペプチドをコードする前記DNA配列は、その後、前記ポリペプチドをコードする前記DNA配列を含む最終ベクターへと組み立てられる1つ以上の標的ベクター内で、前記反復単位を事前組み立てすることによって組み立てられる、請求項1〜8のいずれか一項に記載の方法。
【請求項10】
前記反復単位は、30〜40個のアミノ酸を含む、請求項1〜9のいずれか一項に記載の方法。
【請求項11】
前記反復単位は、33、34、35、または39個のアミノ酸を含む、請求項10に記載の方法。
【請求項12】
前記ポリペプチドは、前記標的DNA配列内の、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の塩基対を認識する、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
前記ポリペプチドは、前記標的DNA配列内の全ての塩基対を認識する、請求項12に記載の方法。
【請求項14】
前記ポリペプチドは、前記標的DNA配列に結合することができる、請求項12に記載の方法。
【請求項15】
請求項1〜14のいずれか一項に記載の方法によって産生される、ポリペプチド。
【請求項16】
前記ポリペプチドは、天然産でない、請求項15に記載のポリペプチド。
【請求項17】
請求項1〜14のいずれか一項に記載の方法によって産生される前記ポリペプチドのためのコード配列を含む、DNA。
【請求項18】
前記DNAは、天然産でない、請求項17に記載のDNA。
【請求項19】
請求項17に記載のDNAに作動可能に結合されたプロモーターを含む、発現カセット。
【請求項20】
請求項19に記載の発現カセットを含む、非ヒト宿主細胞。
【請求項21】
前記宿主細胞は、細菌細胞、真菌細胞、動物細胞、または植物細胞である、請求項20に記載の宿主細胞。
【請求項22】
請求項19に記載の発現カセットを含む、形質転換された、非ヒト生物。
【請求項23】
前記生物は、真菌、動物、または植物である、請求項22に記載の形質転換生物。
【請求項24】
ポリペプチドによって、DNA配列内の塩基対を選択的に認識する方法であって、前記方法は、反復ドメインを含むポリペプチドを構築することを含み、前記反復ドメインは、TALエフェクターに由来する少なくとも1つの反復単位を含み、前記反復単位は、前記DNA配列内の塩基対の認識を決定する高度可変領域を含み、前記反復単位は、前記DNA配列内の1つの塩基対の前記認識に関与し、かつ前記高度可変領域は、
(a) C/Gの認識のためのHD、
(b) A/Tの認識のためのNI、
(c) T/Aの認識のためのNG、
(d) C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS、
(e) G/CまたはA/Tの認識のためのNN、
(f) T/Aの認識のためのIG、
(g) C/Gの認識のためのN、
(h) C/GまたはT/Aの認識のためのHG、
(i) T/Aの認識のためのH、および
(j) G/Cの認識のためのNKからなる群から選択されるメンバーを含む、方法。
【請求項25】
前記高度可変領域は、前記反復単位内のアミノ酸12および13に対応する、請求項24に記載の方法。
【請求項26】
前記反復ドメインは、1.5〜40.5個の反復単位を含む、請求項24または25に記載の方法。
【請求項27】
前記反復ドメインは、11.5〜33.5個の反復単位を含む、請求項24または25に記載の方法。
【請求項28】
前記ポリペプチドは、前記反復ドメインに作動可能に結合された少なくとも1つの追加ドメインをさらに含む、請求項24〜27のいずれか一項に記載の方法。
【請求項29】
前記反復単位は、30〜40個のアミノ酸を含む、請求項24〜28のいずれか一項に記載の方法。
【請求項30】
前記反復単位は、33、34、35、または39個のアミノ酸を含む、請求項29に記載の方法。
【請求項31】
反復単位を含む前記反復ドメインは、標的認識および好ましくはDNA配列内の1つ以上の特異的塩基対の結合を達成するために、細菌、ウイルス、真菌、卵菌、ヒト、動物、または植物ポリペプチドに挿入され、任意に、前記反復単位は、DNA配列内の1つ以上の塩基対に対する事前選択された比活性を得るために、さらに任意に修飾されるAvrBs3様エフェクターの前記反復ドメインに由来する、請求項24〜30のいずれか一項に記載の方法。
【請求項32】
前記反復単位を含む前記反復ドメインは、遺伝子の転写を制御するポリペプチド内、任意に転写活性化因子または抑制因子タンパク質内、任意にAvrBs3様タンパク質内、例えば、AvrBs3またはHaxエフェクタータンパク質内に含有される、請求項24〜31のいずれか一項に記載の方法。
【請求項33】
反復ドメインの前記N末端領域は、前記反復単位の認識特異性のT/A5’に対する認識特異性を付与する、請求項24〜32のいずれか一項に記載の方法。
【請求項34】
前記DNA配列内の前記塩基対は、遺伝子と組み合わされた発現制御要素に挿入され、前記発現制御要素は、前記遺伝子の前記発現を特異的に制御するために、前記発現制御要素に位置する前記塩基対を認識する前記反復単位内の、前記高度可変領域を含む転写制御タンパク質によって標的化され、前記発現制御要素は、好ましくはプロモーターである、請求項24〜33のいずれか一項に記載の方法。
【請求項35】
前記遺伝子は、疾患抵抗性生物を得るための抵抗性仲介遺伝子であって、前記発現制御要素は、任意にAvrBs3様エフェクタータンパク質のための前記標的配列である、請求項31に記載の方法。
【請求項36】
細胞中の標的遺伝子の発現を調節する方法であって、ポリペプチドを含有する細胞が提供され、前記ポリペプチドは、反復ドメインを含み、前記反復ドメインは、TALエフェクターに由来する少なくとも1つの反復単位を含み、前記反復単位は、DNA配列内の塩基対の認識を決定する高度可変領域を含み、前記反復単位は、前記DNA配列内の1つの塩基対の前記認識に関与し、かつ前記高度可変領域は、
(a) C/Gの認識のためのHD、
(b) A/Tの認識のためのNI、
(c) T/Aの認識のためのNG、
(d) C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS、
(e) G/CまたはA/Tの認識のためのNN、
(f) T/Aの認識のためのIG、
(g) C/Gの認識のためのN、
(h) C/GまたはT/Aの認識のためのHG、
(i) T/Aの認識のためのH、および
(j) G/Cの認識のためのNKからなる群から選択されるメンバーを含む、方法。
【請求項37】
反復ドメインを含むポリペプチドであって、前記反復ドメインは、TALエフェクターに由来する少なくとも1つの反復単位を含み、前記反復単位は、DNA配列内の塩基対の認識を決定する高度可変領域を含み、前記反復単位は、前記DNA配列内の1つの塩基対の前記認識に関与し、かつ前記高度可変領域は、
(a) C/Gの認識のためのHD、
(b) A/Tの認識のためのNI、
(c) T/Aの認識のためのNG、
(d) C/GまたはA/TまたはT/AまたはG/Cの認識のためのNS、
(e) G/CまたはA/Tの認識のためのNN、
(f) T/Aの認識のためのIG、
(g) C/Gの認識のためのN、
(h) C/GまたはT/Aの認識のためのHG、
(i) T/Aの認識のためのH、および
(j) G/Cの認識のためのNKからなる群から選択されるメンバーを含む、ポリペプチド。
【請求項38】
請求項37に記載のポリペプチドのためのコード配列を含む、DNA。
【請求項39】
標的DNA配列内に位置する塩基対が、反復ドメインを含むポリペプチドによって特異的に認識され得るように、前記塩基対を含むように修飾されるDNAであって、前記反復ドメインは、TALエフェクターに由来する少なくとも1つの反復単位を含み、前記反復単位は、前記DNA配列内の塩基対の認識を決定する高度可変領域を含み、前記反復単位は、前記DNA配列内の1つの塩基対の前記認識に関与し、前記高度可変領域による選択的および決定された認識を受容するために、前記塩基対は、
(a) HDによる認識のためのC/G、
(b) NIによる認識のためのA/T、
(c) NGによる認識のためのT/A、
(d) NSによる認識のためのCTまたはA/TまたはT/AまたはG/C、
(e) NNによる認識のためのG/CまたはA/T、
(f) IGによる認識のためのT/A、
(g) Nによる認識のためのC/GまたはT/A、
(h) HGによる認識のためのT/A、
(i) Hによる認識のためのT/A、および
(j) NKによる認識のためのG/Cからなる群から選択される、DNA。
【請求項40】
前記塩基対は、プロモーターまたは他の遺伝子制御配列内に位置する、請求項39に記載のDNA。
【請求項41】
前記DNAは、天然産でない、請求項39に記載のDNA。
【請求項42】
請求項39に記載のDNAを含む、ベクター。
【請求項43】
請求項39に記載のDNAを含む、非ヒト宿主細胞。
【請求項44】
前記宿主細胞は、細菌細胞、真菌細胞、動物細胞、または植物細胞である、請求項43に記載の宿主細胞。
【請求項45】
請求項39に記載のDNAを含む、形質転換された、非ヒト生物。
【請求項46】
前記生物は、真菌、動物、または植物である、請求項45に記載の形質転換生物。
【請求項47】
反復ドメインを含むポリペプチドによって選択的に認識される、標的DNA配列を含むDNAを産生する方法であって、前記反復ドメインは、TALエフェクターに由来する少なくとも1つの反復単位を含み、前記反復単位は、前記標的DNA配列内で塩基対の認識を決定する高度可変領域を含み、前記反復単位は、前記標的DNA配列内で1つの塩基対の前記認識に関与し、前記方法は、前記反復単位によって認識されることができる塩基対を含む、DNAを合成することを含み、前記塩基対は、
(a) HDによる認識のためのC/G、
(b) NIによる認識のためのA/T、
(c) NGによる認識のためのT/A、
(d) NSによる認識のためのCTまたはA/TまたはT/AまたはG/C、
(e) NNによる認識のためのG/CまたはA/T、
(f) IGによる認識のためのT/A、
(g) Nによる認識のためのC/GまたはT/A、
(h) HGによる認識のためのT/A、
(i) Hによる認識のためのT/A、および
(j) NKによる認識のためのG/Cからなる群から選択される、方法。

【図1】
image rotate

【図2】
image rotate

【図3−1】
image rotate

【図3−2】
image rotate

【図4】
image rotate

【図5−1】
image rotate

【図5−2】
image rotate

【図6】
image rotate

【図7−1】
image rotate

【図7−2】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15−1】
image rotate

【図15−2】
image rotate

【図16A】
image rotate

【図16B】
image rotate

【図16C】
image rotate

【図16D】
image rotate

【図16E】
image rotate

【図16F】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19A−1】
image rotate

【図19A−2】
image rotate

【図19A−3】
image rotate

【図19B】
image rotate

【図19C−1】
image rotate

【図19C−2】
image rotate

【図19C−3】
image rotate

【図19D−1】
image rotate

【図19D−2】
image rotate


【公表番号】特表2012−514976(P2012−514976A)
【公表日】平成24年7月5日(2012.7.5)
【国際特許分類】
【出願番号】特願2011−544945(P2011−544945)
【出願日】平成22年1月12日(2010.1.12)
【国際出願番号】PCT/IB2010/000154
【国際公開番号】WO2010/079430
【国際公開日】平成22年7月15日(2010.7.15)
【出願人】(511169759)
【出願人】(511169760)
【出願人】(511169771)
【出願人】(511169782)
【Fターム(参考)】