合成核酸分子組成物および調製方法
【課題】特定の宿主細胞における発現のための、不適切または意図しない転写調節配列の導入を伴わない、変更されたコドン使用を有する合成核酸分子の提供。
【解決手段】少なくとも300ヌクレオチドの、ポリペプチドに関するコード領域を含む合成核酸分子であって、ポリペプチドをコードする野生型核酸配列と、コドンの25%より多くが異なるコドン組成を有し、そして上記異なるコドンでのコドンの無作為選択から得られるような配列の平均数に対して、少なくとも3倍少ない転写調節配列を有し、ここで、上記転写調節配列は、転写因子結合配列、イントロスプライス部位、ポリ(A)付加部位、およびプロモーター配列からなる群より選択され、そしてここで、上記合成核酸分子によりコードされる上記ポリペプチドは、上記野生型核酸配列によりコードされる上記ポリペプチドに対して、少なくとも85%の配列同一性を有する、合成核酸分子。
【解決手段】少なくとも300ヌクレオチドの、ポリペプチドに関するコード領域を含む合成核酸分子であって、ポリペプチドをコードする野生型核酸配列と、コドンの25%より多くが異なるコドン組成を有し、そして上記異なるコドンでのコドンの無作為選択から得られるような配列の平均数に対して、少なくとも3倍少ない転写調節配列を有し、ここで、上記転写調節配列は、転写因子結合配列、イントロスプライス部位、ポリ(A)付加部位、およびプロモーター配列からなる群より選択され、そしてここで、上記合成核酸分子によりコードされる上記ポリペプチドは、上記野生型核酸配列によりコードされる上記ポリペプチドに対して、少なくとも85%の配列同一性を有する、合成核酸分子。
【発明の詳細な説明】
【技術分野】
【0001】
(政府の権利の主張)
本発明は、米合衆国政府からの助成金(National Science Foundationからの助成金DMI−9402762)を少なくとも一部用いてなされた。政府は、本発明に特定の権利を有する。
【背景技術】
【0002】
(発明の背景)
転写(DNA配列からのRNA分子の合成)は、遺伝子発現の最初の工程である。DNA転写を調節する配列としては、プロモーター配列、ポリアデニル化シグナル、転写因子結合部位およびエンハンサーエレメントが挙げられる。プロモーターは、転写を特異的に開始し得るDNA配列であり、3つの一般領域からなる。コアプロモーターは、RNAポリメラーゼおよびその補因子がDNAに結合する配列である。コアプロモーターの直ぐ上流は、活性化複合体のアセンブリを担う(この活性化複合体は、次いで、ポリメラーゼ複合体を補充する)いくつかの転写因子結合部位を含む、近位プロモーターである。近位プロモーターのさらに上流に位置する遠位プロモーターもまた、転写因子結合部位を含む。転写終結およびポリアデニル化は、転写開始のように、部位特異的であり、そして規定された配列によってコードされる。エンハンサーは、調節領域であり、複数の転写因子結合部位を含み、この複数の転写因子結合部位は、エンハンサーおよびプロモーターが同じDNA分子内に配置される限り、プロモーターに関するエンハンサーの配向および距離に関係なく、応答性プロモーターからの転写レベルを有意に増大させ得る。遺伝子から産生される転写物の量はまた、転写後の機構によって調節され得、最も重要なことは、スプライスドナー配列とスプライスアクセプター配列との間で、一次転写物から介在配列(イントロン)を除去するRNAスプライシングである。
【0003】
自然選択とは、表現型レベルで生じる遺伝型−環境相互作用が、個体の差示的生殖の成功を導き、従って、集団の遺伝子プールの改変を導くという仮説である。
【0004】
自然選択によって作用される核酸分子のいくつかの特性としては、コドン使用頻度、RNA二次構造、イントロンスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用が挙げられる。遺伝暗号の縮重性に起因して、これらの特性は、対応するアミノ酸配列を変更することなく自然選択によって最適化され得る。
ある条件下では、ポリペプチドをコードする天然のヌクレオチド配列を合成的に変更して、ポリペプチドを代替の適用のためにより適合させることが有用である。一般的な例は、外来宿主細胞において発現される場合に、遺伝子のコドン使用頻度を変更することである。遺伝暗号の重複性は、アミノ酸が複数のコドンによってコードされることを可能にするが、異なる生物は、他を上回っていくつかのコドンを好む。非ネイティブの宿主細胞におけるタンパク質翻訳の効率は、コドン使用頻度を調節することによって実質的に増大され得るが、同じ遺伝子産物を維持する(特許文献1;特許文献2および特許文献3)。
しかし、コドン使用を変更することは、次に、不適切な転写調節配列の合成核酸分子への意図しない導入を生じ得る。これは、転写に悪影響を与え、合成DNAの異常な発現を生じる。異常な発現は、発現の正常レベルまたは予測されたレベルからの逸脱として定義される。例えば、プロモーターの下流に位置する転写因子結合部位は、プロモーター活性をもたらすことが実証されている(非特許文献1;非特許文献2;非特許文献3;非特許文献4)。さらに、活性を発揮し、そしてプロモーター配列の非存在下でDNA転写レベルの上昇を生じるエンハンサーエレメント、またはプロモーター配列の非存在下で遺伝子発現の基底レベルを増大させる転写調節配列の存在は、稀なことではない。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許第5,096,825号明細書
【特許文献2】米国特許第5,670,356号明細書
【特許文献3】米国特許第5,874,304号明細書
【非特許文献】
【0006】
【非特許文献1】Michaelら、「EMBO.J」、1990年、9、481
【非特許文献2】Lambら、「Mol.Reprod,Devel.」、1998年、51、218
【非特許文献3】Johnsonら、「Mol.Reprod,Devel」、1998年、50、377
【非特許文献4】Jonesら、「Mol.Cell.Biol.」、1997年、17、6970
【発明の概要】
【発明が解決しようとする課題】
【0007】
従って、特定の宿主細胞における発現のために、不適切または意図しない転写調節配列の導入もまた伴わずに、変更されたコドン使用を有する合成核酸分子を作製するための方法が必要である。
【課題を解決するための手段】
【0008】
本発明は、以下を提供する:
(項目1) 少なくとも300ヌクレオチドの、ポリペプチドに関するコード領域を含む合成核酸分子であって、上記核酸分子は、ポリペプチドをコードする野生型核酸配列と、コドンの25%より多くが異なるコドン組成を有し、そして上記異なるコドンでのコドンの無作為選択から得られるような配列の平均数に対して、少なくとも3倍少ない転写調節配列を有し、
ここで、上記転写調節配列は、転写因子結合配列、イントロスプライス部位、ポリ(A)付加部位、およびプロモーター配列からなる群より選択され、そしてここで、上記合成核酸分子によりコードされる上記ポリペプチドは、上記野生型核酸配列によりコードされる上記ポリペプチドに対して、少なくとも85%の配列同一性を有する、合成核酸分子。(項目2) 上記合成核酸分子が、少なくとも5倍少ない転写調節配列を有する、項目1に記載の合成核酸分子。
(項目3) 上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの35%より多くが異なる、項目1に記載の合成核酸分子。
(項目4) 上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの45%より多くが異なる、項目1に記載の合成核酸分子。
(項目5) 上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの55%より多くが異なる、項目1に記載の合成核酸分子。
(項目6) 上記異なるコドンの多数が、所望の宿主細胞の好ましいコドンである、項目1に記載の合成核酸分子。
(項目7) 上記合成核酸分子が、レポーター分子をコードする、項目1に記載の合成核酸分子。
(項目8) 上記合成核酸分子が、選択可能なマーカータンパク質をコードする、項目1に記載の合成核酸分子。
(項目9) 上記合成核酸分子が、ルシフェラーゼをコードする、項目1に記載の合成核酸分子。
(項目10) 上記野生型核酸配列が、Renillaルシフェラーゼをコードする、項目9に記載の合成核酸分子。
(項目11) 上記野生型核酸配列が、甲虫ルシフェラーゼをコードする、項目9に記載の合成核酸分子。
(項目12) 上記合成核酸分子が、224位のアミノ酸バリンをコードする、項目11に記載の合成核酸分子。
(項目13) 上記合成核酸分子が、224位のアミノ酸ヒスチジン、247位のヒスチジン、346位のイソロイシン、348位のグルタミン、またはこれらのいずれかの組み合わせをコードする、項目11に記載の合成核酸分子。
(項目14) 上記合成核酸分子において異なるコドンの多数が、哺乳動物においてより頻繁に用いられる、項目1に記載の合成核酸分子。
(項目15) 上記合成核酸分子において異なるコドンの大多数が、ヒトにおいて好ましいコドンである、項目1に記載の合成核酸分子。
(項目16) 上記合成核酸分子において異なるコドンの大多数が、植物において好ましいコドンである、項目1に記載の合成核酸分子。
(項目17) 上記合成核酸分子が、配列番号21(Rlucver2)または配列番号22(Rluc−最終)を含む、項目9に記載の合成核酸分子。
(項目18) 上記合成核酸分子が、配列番号7(GRver5)、配列番号8(GRver6)、配列番号9(GRver5.1)、または配列番号297(GRver5.1)を含む、項目9に記載の合成核酸分子。
(項目19) 上記合成核酸分子が、配列番号14(RDver5)、配列番号15(RDver7)、配列番号16(RDver5.1)、配列番号299(RDver5.1)、配列番号17(RDver5.2)、配列番号18(RD156−1H9)、または配列番号301(RD156−1H9)を含む、項目9に記載の合成核酸分子。
(項目20) 上記異なるコドンの大多数が、ヒトのコドンCGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGCおよびTTCである、項目15に記載の合成核酸分子。
(項目21) 上記異なるコドンの大多数が、ヒトのコドンCGC、CTG、TCT、ACC、CCA、GCC、GGC、GTC、およびATC、またはコドンCGT、TTG、AGC、ACT、CCT、GCT、GGT、GTG、およびATTである、項目15に記載の合成核酸分子。
(項目22) 上記異なるコドンの大多数が、植物のコドンCGC、CTT、TCT、TCC、ACC、CCA、CCT、GCT、GGA、GTG、ATC、ATT、AAG、AAC、CAA、CAC、GAG、GAC、TAC、TGCおよびTTCである、項目16に記載の合成核酸分子。
(項目23) 上記異なるコドンの大多数が、植物のコドンCGC、CTT、TCT、ACC、CCA、GTC、GGA、GTC、およびATC、またはコドンCGT、TGG、AGC、ACT、CCT、GCC、GGT、GTG、およびATTである、項目16に記載の合成核酸分子。
(項目24) 上記合成核酸分子が、上記野生型核酸配列のレベルよりも、より高いレベルで、哺乳動物宿主細胞において発現される、項目1に記載の合成核酸分子。
(項目25) 上記合成核酸分子が、増加した数の、CTGまたはTTGのロイシンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目26) 上記合成核酸分子が、増加した数の、GTGまたはGTCのバリンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目27) 上記合成核酸分子が、増加した数の、GGCまたはGGTのグリシンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目28) 上記合成核酸分子が、増加した数の、ATCまたはATTのイソロイシンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目29) 上記合成核酸分子が、増加した数の、CCAまたはCCTのプロリンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目30) 上記合成核酸分子が、増加した数の、CGCまたはCGTのアルギニンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目31) 上記合成核酸分子が、増加した数の、AGCまたはTCTのセリンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目32) 上記合成核酸分子が、増加した数の、ACCまたはACTのスレオニンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目33) 上記合成核酸分子が、増加した数の、GCCまたはGCTのアラニンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目34) 上記異なる合成核酸分子におけるコドンが、上記野生型核酸配列における対応するコドンと同じアミノ酸をコードする、項目1に記載の合成核酸分子。
(項目35) 項目1に記載の合成核酸分子を含む、プラスミド。
(項目36) 細胞におけるプロモーター機能に連結した項目1に記載の合成核酸分子を含む、発現ベクター。
(項目37) 上記合成核酸分子が、Kozakコンセンサス配列に作動可能に連結される、項目36に記載の発現ベクター。
(項目38) 上記プロモーターが、哺乳動物細胞において機能的である、項目36に記載の発現ベクター。
(項目39) 上記プロモーターが、ヒト細胞において機能的である、項目36に記載の発現ベクター。
(項目40) 上記プロモーターが、植物細胞において機能的である、項目36に記載の発現ベクター。
(項目41) 上記発現ベクターが、マルチクローニング部位をさらに含む、項目36に記載の発現ベクター。
(項目42) 上記発現ベクターが、上記プロモーターと上記合成核酸分子との間に配置された、マルチクローニング部位を含む、項目41に記載の発現ベクター。
(項目43) 上記発現ベクターが、上記合成核酸分子から下流に配置されたマルチクローニング部位を含む、項目41に記載の発現ベクター。
(項目44) 項目36に記載の発現ベクターを含む、宿主細胞。
(項目45) 適切な容器手段内に、項目36に記載の発現ベクターを含む、レポーター遺伝子発現キット。
(項目46) 配列番号9(GRver5.1)または配列番号18(RD156−1H9)によりコードされる、単離されたポリペプチド。
(項目47) 配列番号22(Rluc−最終)、配列番号9(GRver5.1)、配列番号18(RD156−1H9)、配列番号297(GRver5.1)、配列番号301(RD156−1H9)、またはこれらの相補鎖に対して、ストリンジェントなハイブリダイゼーション条件下でハイブリダイズする、ポリヌクレオチド。
(項目48) オープンリーディングフレームを含む、合成核酸分子を調製する方法であって、上記方法は、以下:
a) 少なくとも100アミノ酸を有するポリペプチドをコードする親核酸配列における複数の転写調節配列を変化させて、上記親核酸配列に対して少なくとも3倍少ない転写調節配列を有する合成核酸分子を得る工程であって、ここで、上記転写調節配列は、転写因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列、およびプロモーター配列からなる群より選択される、工程;ならびに
b) 減少した数の転写調節配列を有する上記合成核酸配列中のコドンの25%より多くを変化させて、さらなる合成核酸分子を得る工程であって、ここで、変化させたコドンは、増加した数の転写調節配列を生じない工程であり、ここで、上記さらなる合成核酸分子は、上記親核酸配列によりコードされる上記ポリペプチドに対して、少なくとも85%のアミノ酸配列同一性を有するポリペプチドをコードする、工程、
を包含する、方法。
(項目49) オープンリーディングフレームを含む、合成核酸分子を調製する方法であって、上記方法は、以下:
a) 少なくとも100アミノ酸を有するポリペプチドをコードする親核酸配列中のコドンの25%より多くを変化させて、コドンが変化した合成核酸分子を得る工程、および
b) 上記コドンが変化した合成核酸分子中の複数の転写調節配列を変化させて、異なるコドンでのコドンの無作為選択を有する合成核酸分子に対して、少なくとも3倍少ない転写調節配列を有する、さらなる合成核酸分子を得る工程であって、ここで、上記転写調節配列は、転写因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列、およびプロモーター配列からなる群より選択される工程であり、ここで、上記さらなる合成核酸分子は、上記親核酸配列によりコードされるポリペプチドに対して、少なくとも85%のアミノ酸配列同一性を有するポリペプチドをコードする、工程、
を包含する、方法。
(項目50) 上記親核酸配列が、レポーター分子をコードする、項目48または49に記載の方法。
(項目51) 上記親核酸配列が、ルシフェラーゼをコードする、項目48または49に記載の方法。
(項目52) 上記合成核酸分子が、上記親核酸配列に対して、中程度のストリンジェシーハイブリダイゼーション条件下でハイブリダイズする、項目48または49に記載の方法。
(項目53) 上記変化したコドンが、上記親核酸配列における対応するコドンと同じアミノ酸をコードする、項目48または49に記載の方法。
(項目54) 項目48または49に記載の方法によって調製される、さらなる合成核酸分子である、合成核酸分子。
(項目55) ポリペプチドをコードする親核酸配列のコドンが違うバージョンである、少なくとも2つの合成核酸分子を調製する方法であって、上記方法は、以下:
a) 親核酸配列を変化させて、増加した数の第1の複数のコドンを有する合成核酸分子を得る工程であって、上記増加した数の第1の複数のコドンは、上記親核酸配列における上記コドンの数に関連して、選択された宿主細胞においてより頻繁に用いられる、工程;および
b) 親核酸配列を変化させて、増加した数の第2の複数のコドンを有するさらなる合成核酸分子を得る工程であって、上記増加した数の第2の複数のコドンは、上記親核酸配列における上記コドンの数に関連して、上記宿主細胞においてより頻繁に用いられる、工程、
を包含し、
ここで、上記第1の複数のコドンは、上記第2の複数のコドンと異なり、そしてここで、上記合成核酸分子および上記さらなる合成核酸分子は、同じポリペプチドをコードする、方法。
(項目56) 項目55に記載の方法であって、上記方法は、上記合成核酸分子、上記さらなる合成核酸分子、またはこれらの両方において、複数の転写調節配列を変化させて、少なくとも1つのなおさらなる合成核酸分子を得る工程であって、上記なおさらなる合成核酸分子は、上記合成核酸分子、上記さらなる合成核酸分子、またはこれらの両方に対して、少なくとも3倍少ない転写調節配列を有する、工程、をさらに包含する、方法。
(項目57) 項目55に記載の方法であって、上記方法は、上記第1の合成配列中の少なくとも1つのコドンを変化させて、第1の改変された合成配列を得る工程であって、上記第1の改変された合成配列は、上記第1の合成核酸配列によりコードされるポリペプチドに対して、少なくとも1つのアミノ酸置換を有するポリペプチドをコードする、工程、をさらに包含する、方法。
(項目58) 項目56に記載の方法であって、上記方法は、上記第2の合成核酸配列中の少なくとも1つのコドンを変化させて、第2の改変された合成配列を得る工程であって、上記第2の改変された合成配列は、上記第1の合成核酸配列によりコードされるポリペプチドに対して、少なくとも1つのアミノ酸置換を有するポリペプチドをコードする工程、をさらに包含する、方法。
(項目59) 上記合成配列が、ルシフェラーゼをコードする、項目55に記載の方法。
(項目60) 上記合成核酸分子が、同一の条件下で、細胞または細胞抽出物中の上記野生型核酸配列のレベルの少なくとも110%であるレベルで発現される、項目1に記載の合成核酸分子。
(項目61) 項目1に記載の合成核酸分子であって、上記合成核酸分子によりコードされるポリペプチドが、上記野生型核酸配列によりコードされるポリペプチドに対して、少なくとも90%の連続する配列同一性を有する、合成核酸分子。
(項目62) 項目1に記載の合成核酸分子であって、上記合成核酸分子によりコードされるポリペプチドは、上記野生型核酸配列によりコードされるポリペプチドに対して、アミノ酸配列が同一である、合成核酸分子。
(項目63) 親核酸配列を含むベクターに対して、少なくとも3倍少ない転写調節配列を有する合成核酸分子を含む、ベクターであって、ここで、上記転写調節配列は、転写調節因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、およびプロモーター配列からなる群より選択される、ベクター。
(項目64) 上記合成核酸分子が、ポリペプチドをコードしない、項目63に記載のベクター。
(項目65) 項目48または49に記載の方法であって、上記方法は、上記さらなる合成核酸分子を変化させて、上記親核酸配列によりコードされるポリペプチドに対して、少なくとも1つのアミノ酸置換を有するポリペプチドをコードさせる工程をさらに包含する、方法。
(項目66) 項目48または49に記載の方法であって、ここで、上記転写調節配列の変化は、上記合成核酸分子によりコードされるポリペプチドへとアミノ酸置換を導入しない、方法。
(発明の要旨)
本発明は、ポリペプチドコード領域の少なくとも300ヌクレオチドを含み、ポリペプチドをコードする野生型核酸配列とは25%より多いコドンが異なるコドン組成を有し、そして異なるコドンが無作為(ランダム)に選択される場合に生じるよりも、少なくとも3倍少ない、好ましくは少なくとも5倍少ない転写調節配列を有する、合成核酸分子を提供する。好ましくは、この合成核酸分子は、それが由来する、天然に存在する(ネイティブまたは野生型の)ポリペプチド(タンパク質)のアミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%同一なアミノ酸配列を有するポリペプチドをコードする。従って、いくつかの特定のアミノ酸変化がまた、合成核酸分子によってコードされるポリペプチドの特定の表現型特徴を変更することが所望され得ることが認識される。好ましくは、アミノ酸配列同一性は、少なくとも100連続アミノ酸残基にわたる。本発明の1つの実施形態において、異なる合成核酸分子中のコドンは、好ましくは、野生型核酸分子中の対応するコドンと同じアミノ酸をコードする。
【0009】
合成核酸分子において減少される転写調節配列としては、以下が挙げられるが、これらに限定されない:転写因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列およびプロモーター配列の任意の組み合わせ。転写調節配列は、当該分野で周知である。
【0010】
本発明の合成核酸分子は、30%、35%、40%より多いか、または45%より多い、例えば、50%、55%、60%より多いコドンが、野生型核酸配列のコドンとは異なるコドン組成を有することが好ましい。本発明における使用のために好ましいコドンは、特定の生物において同じアミノ酸について、少なくとも1つの他のコドンよりも高頻度で使用され、そしてより好ましくは、この生物において低使用頻度ではなく、そして合成核酸分子の発現についてクローニングまたはスクリーニングするために使用される生物(例えば、E.coli)において低使用頻度ではない。さらに、特定のアミノ酸(すなわち、3つ以上のコドンを有するアミノ酸)について好ましいコドンは、他の(好ましくない)コドンよりも高頻度で使用される2つ以上のコドンを含み得る。1つの生物において別の生物におけるよりも高頻度で使用される、合成核酸分子中のコドンの存在は、そのコドンをより高頻度で使用する生物の細胞に導入される場合、その細胞において野生型または親の核酸分子の発現よりも高レベルで発現される合成核酸分子を生じる。例えば、本発明の合成核酸分子は、同一条件(例えば、細胞培養条件、ベクター骨格など)下で、細胞または細胞抽出物における野生型核酸配列の発現レベルの、少なくとも約110%、例えば、150%、200%、500%以上(1000%、5000%、または10000%)のレベルで発現される。
【0011】
本発明の1つの実施形態において、異なるコドンは、哺乳動物においてより高頻度で使用されるが、本発明の別の実施形態において、異なるコドンは、植物においてより高頻度で使用される。特定の型の哺乳動物(例えば、ヒト)は、別の型の哺乳動物とは異なるセットの好適なコドンを有し得る。同様に、特定の型の植物は、別の型の植物とは異なる好適なセットのコドンを有し得る。本発明の1つの実施形態において、異なるコドンの大多数は、所望の宿主細胞において好ましいコドンである。哺乳動物(例えば、ヒト)および植物について好ましいコドンは、当該分野で公知である(例えば、Wadaら、1990)。例えば、好ましいヒトコドンとしては、以下が挙げられるが、これらに限定されない:CGC(Arg)、CTG(Leu)、TCT(Ser)、AGC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCC(Ala)、GGC(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAG(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)およびTTC(Phe)(Wadaら、1990)。従って、本発明の好ましい「ヒト化」合成核酸分子は、増大した数の好ましいヒトコドン(例えば、CGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGC、TTCまたはこれらの任意の組み合わせ)を有することによって、野生型の核酸配列とは異なるコドン組成を有する。例えば、本発明の合成核酸分子は、野生型の核酸配列に対して、増大した数のロイシンをコードするコドン、CTGまたはTTG、バリンをコードするコドン、GTGまたはGTC、グリシンをコードするコドン、GGCまたはGGT、イソロイシンをコードするATCまたはATT、プロリンをコードするコドン、CCAまたはCCT、アルギニンをコードするコドン、CGCまたはCGT、セリンをコードするコドン、AGCまたはTCT、スレオニンをコードするコドン、ACCまたはACT、アラニンをコードするコドン、GCCまたはGCT、あるいはこれらの任意の組み合わせを有し得る。同様に、植物においてより高頻度で使用される増大した数のコドンを有する合成核酸分子は、以下:CGC(Arg)、CTT(Leu)、TCT(Ser)、TCC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCT(Ser)、GGA(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAA(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)、TTC(Phe)またはこれらの任意の組み合わせ(Murrayら、1989)が挙げられるが、これらに限定されない増大した数の植物コドンを有することによって、野生型または親の核酸配列とは異なるコドン組成を有する。好ましいコドンは、異なる型の植物について異なり得る(Wadaら、1990)。
【0012】
コドンの選択は、例えば、増大した数のヌクレオチド置換または減少した数の転写調節配列を有することが望まれる、多くの因子によって影響され得る。ある(例えば、転写因子結合部位の除去を可能にする)環境下で、好ましくないコドンを、好ましいコドン以外のコドンまたは最も好ましいコドン以外のコドンによって置換することが所望であり得る。例えば、合成核酸分子のコドンが異なるバージョンを調製する他の条件下で、好ましいコドン対は、多数のミスマッチ塩基および上記の基準に基づいて選択される。
【0013】
1つの生物において他の生物におけるよりも、より高頻度で使用される、合成核酸分子中のコドンの存在は、これらのコドンを使用する生物の細胞に導入される場合に、この細胞において野生型または親の核酸配列の発現レベルよりも高いレベルで発現される合成核酸分子を生じる。
【0014】
本発明の合成核酸分子は、選択マーカータンパク質またはレポータータンパク質をコードし得る。しかし、本発明は、合成レポーター遺伝子または合成選択マーカー遺伝子に限定されない、任意の核酸を適用する。レポーター分子である本発明の合成核酸分子の1つの実施形態において、この合成核酸分子は、野生型または親のRenillaルシフェラーゼまたは甲虫ルシフェラーゼの核酸配列とは異なるコドン組成を有するルシフェラーゼをコードする。本発明の合成コメツキムシルシフェラーゼ核酸分子は、必要に応じて、224位でアミノ酸バリンをコードし得るか(すなわち、これは、緑色光を発する)、または必要に応じて、224位でアミノ酸ヒスチジン、247位でアミノ酸ヒスチジン、346位でアミノ酸イソロイシン、348位でアミノ酸グルタミン、またはこれらの組み合わせをコードし得る(すなわち、これは、赤色光を発する)。野生型Renillaルシフェラーゼに関連する好ましい合成ルシフェラーゼ核酸分子としては、配列番号21(Rlucver2)または配列番号22(Rluc−最終(Rluc−final))が挙げられるが、これらに限定されない。コメツキムシルシフェラーゼ核酸配列に関連する好ましい合成ルシフェラーゼ核酸分子としては、以下が挙げられるが、これらに限定されない:配列番号7(GRver5)、配列番号8(GR6)、配列番号9(GRver5.1)、配列番号14(RDver5)、配列番号15(RD7)、配列番号16(RDver5.1)、配列番号17(RDver5.2)または配列番号18(RD156−1H9)。
【0015】
本発明はまた、発現カセットを提供する。本発明の発現カセットは、細胞において機能的なプロモーターに作動可能に連結した、本発明の合成核酸分子を含む。好ましいプロモーターは、哺乳動物細胞において機能的であるプロモーター、および植物細胞において機能的であるプロモーターである。必要に応じて、この発現カセットは、他の配列(例えば、制限酵素認識配列およびKozak配列)を含み得、そしてより大きいポリヌクレオチド分子(例えば、プラスミド、コスミド、人工染色体またはベクター(例えば、ウイルスベクター))の一部であり得る。
【0016】
本発明の合成核酸分子を含む宿主細胞、単離されたポリペプチド(例えば、本発明の合成核酸分子によってコードされる融合ポリペプチド)および組成物、ならびに適切な容器手段中に本発明の合成核酸分子またはこれによってコードされるポリペプチドを含み、必要に応じて指示手段を含むキットがまた提供される。好ましい単離されたポリペプチドとしては、配列番号31(GRver5.1)、配列番号226(Rluc−最終)または配列番号223(RD156−1H9)が挙げられるが、これらに限定されない。
【0017】
本発明はまた、親核酸配列(野生型または別の合成核酸配列のいずれか)を遺伝的に変更することによって、本発明の合成核酸分子を調製する方法を提供する。この方法を使用して、少なくとも100アミノ酸を含むポリペプチドをコードする合成核酸分子を調製し得る。本発明の1つの実施形態は、レポータータンパク質または選択マーカータンパク質をコードする合成遺伝子の調製である。本発明の方法を使用して、コドン使用頻度を変更し、そして任意のオープンリーディングフレーム中の転写調節配列の数を減少させるか、またはベクター骨格中の転写調節部位の数を減少させ得る。好ましくは、合成核酸分子中のコドン使用頻度は、この核酸分子の発現が所望される宿主生物の使用頻度を反映して変更されるが、親核酸分子に対して潜在的な転写調節配列の数もまた減少させる。
【0018】
従って、本発明は、オープンリーディングフレームを含む合成核酸分子を調節するための方法を提供する。この方法は、少なくとも100アミノ酸を有するポリペプチドをコードする親(野生型または合成)核酸配列中の複数の転写調節配列を変更(例えば、減少または排除)して、減少した数の転写調節配列を有し、そして好ましくは親核酸分子と同じアミノ酸をコードする合成核酸分子を得る工程を包含する。この転写調節配列は、転写因子結合部位、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列およびプロモーター配列からなる群より選択され、そして得られた合成核酸分子は、親核酸配列と比較して、少なくとも3倍少ない、好ましくは5倍少ない転写調節配列を有する。この方法はまた、減少した数の転写調節配列を有する合成核酸配列中のコドンの25%より多くを変更して、さらなる合成核酸分子を得る工程を包含し、ここで、変更されたコドンは、減少した数の転写調節配列を有する合成核酸分子中および/または親核酸配列中の、対応する位置と同じアミノ酸をコードする。好ましくは、変更されたコドンは、転写調節配列の増大を生じない。好ましくは、さらなる合成核酸分子は、親核酸配列によってコードされるポリペプチドのアミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%の連続アミノ酸同一性を有するポリペプチドをコードする。
【0019】
あるいは、この方法は、少なくとも100アミノ酸を有するポリペプチドをコードする親核酸配列中の25%より多いコドンを変更して、コドンが変更された合成核酸分子を得る工程を包含し、ここで、変更されたコドンは、親核酸配列中の対応する位置に存在するアミノ酸と同じアミノ酸をコードする。次いで、コドンが変更された合成核酸分子中の複数の転写調節配列が変更されて、さらなる合成核酸分子を得る。好ましくは、変更されたコドンは、転写調節配列の増大を生じない。また、好ましくは、このさらなる合成核酸分子は、親核酸分子によってコードされるポリペプチドのアミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%の連続アミノ酸配列同一性を有するポリペプチドをコードする。本発明の方法によって調製される、合成(さらなる合成を含む)核酸分子もまた、提供される。
【0020】
本明細書中以下に記載されるように、本発明の方法を、コメツキムシルシフェラーゼおよびRenillaルシフェラーゼの核酸配列を用いて使用した。これらの核酸分子は両方ともルシフェラーゼタンパク質をコードするが、これらは、完全に異なる科に由来し、進化的に広く分離されている。これらのタンパク質は、無関係のアミノ酸配列(タンパク質構造)を有し、そして異なる化学的基質を使用する。これらが「ルシフェラーゼ」との名称を共有するという事実は、これらが、同じ科または大まかに類似する科に由来することを意味するとは解釈されるべきではない。これらの方法は、他の所望の物理的特性または生化学的特性(タンパク質の半減期を含む)に負の効果をもたらすことなく、有意に増大した哺乳動物発現レベルを示す合成ルシフェラーゼ核酸分子を生成し、既知の転写調節エレメントの大部分をまた欠いた。
【0021】
本発明はまた、高度に関連したポリペプチドをコードする少なくとも2つの合成核酸分子を提供するが、これらの合成核酸分子は、互いに増大した数のヌクレオチド差異を有する。これらの差異は、これらの分子が両方とも1つの細胞中に存在する場合、2つの合成核酸分子間の組換え頻度を減少させる(すなわち、これらは、合成核酸分子の「コドンが異なる」バージョンである)。従って、本発明は、ポリペプチドをコードする親核酸分子のコドンが異なるバージョンである、少なくとも2つの合成核酸分子を調製するための方法を提供する。この方法は、親核酸分子を変更して、親核酸分子中に存在するコドンの数に対して増大した数の、選択された宿主細胞中でより高頻度で使用される第一の複数のコドンを有する、第一の合成核酸分子を得る工程を包含する。必要に応じて、この第一の合成核酸分子はまた、親核酸配列と比較して、減少した数の転写調節配列を有する。この親核酸分子もまた変更されて、親核酸配列中のコドンの数に対して増大した数の、宿主細胞中でより高頻度で使用される第二の複数のコドンを有する第二の合成核酸分子が得られ、ここで、第一の複数のコドンは、第二の複数のコドンとは異なり、そして、この第一および第二の合成核酸分子は、好ましくは、同じポリペプチドをコードする。必要に応じて、第二の合成核酸分子は、親核酸分子と比較して減少した数の転写調節配列を有する。次いで、合成分子のいずれかまたは両方は、さらに改変され得る。
明らかに、本発明は、多くの遺伝子を用いる適用、そして生命科学研究、農業遺伝学、遺伝子治療、発生科学および創薬を含むがこれらに限定されない、多くの科学分野にわたる適用を有する。
【図面の簡単な説明】
【0022】
【図1】図1は、コドンおよびこれらが対応するアミノ酸を示す。
【図2−1】図2は、以下のヌクレオチド配列比較を示す:黄緑色(YG)コメツキムシルシフェラーゼ核酸配列(YG#81−6G01;配列番号2)および種々の合成緑色(GR)コメツキムシルシフェラーゼ核酸配列(GRver1、配列番号3;GRver2、配列番号4;GRver3、配列番号5;GRver4、配列番号6;GRver5、配列番号7;GR6、配列番号8;GRver5.1、配列番号9)、および種々の赤色(RD)コメツキムシルシフェラーゼ核酸配列(RDver1、配列番号10;RDver2、配列番号11;RDver3、配列番号12;RDver4、配列番号13;RDver5、配列番号14;RD7、配列番号15;RDver5.1、配列番号16;RDver5.2、配列番号17;RD156−1H9、配列番号18)。四角で囲まれたヌクレオチドは、配列番号2における相同な位置に存在するヌクレオチドと異なるヌクレオチドである。
【図2−2】図2−1の続き。
【図2−3】図2−2の続き。
【図2−4】図2−3の続き。
【図2−5】図2−4の続き。
【図2−6】図2−5の続き。
【図2−7】図2−6の続き。
【図2−8】図2−7の続き。
【図2−9】図2−8の続き。
【図2−10】図2−9の続き。
【図2−11】図2−10の続き。
【図2−12】図2−11の続き。
【図2−13】図2−12の続き。
【図2−14】図2−13の続き。
【図3−1】図3は、以下のアミノ酸配列比較を示す:YGコメツキムシルシフェラーゼアミノ酸配列(YG#81−6G01、配列番号24)および種々の合成GRコメツキムシルシフェラーゼアミノ酸配列(GRver1、配列番号25;GRver2、配列番号26;GRver3、配列番号27;GRver4、配列番号28;GRver5、配列番号29;GR6、配列番号30;GRver5.1、配列番号31)、および種々の赤色(RD)コメツキムシルシフェラーゼアミノ酸配列(RDver1、配列番号32;RDver2、配列番号33;RDver3、配列番号34;RDver4、配列番号218;RDver5、配列番号219;RD7、配列番号220;RDver5.1、配列番号221;RDver5.2、配列番号222;RD156−1H9、配列番号223)。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号24中の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図3−2】図3−1の続き。
【図3−3】図3−2の続き。
【図3−4】図3−3の続き。
【図3−5】図3−4の続き。
【図4】図4は、YG#81−6G01、GRver1、RDver1、GRver5、およびRDver5、およびヒト(HUM)におけるコドン使用頻度、ならびにYG#81−6G01、GRver5、RDver5、およびヒトにおける相対的コドン使用頻度を示す。
【図5A】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5B】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5C】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5D】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5E】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5F】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5G】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5H】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5I】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5J】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5K】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図6−1】図6は、合成GR/RDルシフェラーゼ遺伝子を調製するために用いられるオリゴヌクレオチド(配列番号35〜245)を示す。
【図6−2】図6−1の続き。
【図6−3】図6−2の続き。
【図6−4】図6−3の続き。
【図7−1】図7は、以下のヌクレオチド配列比較を示す:野生型Renilla reniformisルシフェラーゼ核酸配列(GenBank登録番号M63501)(RELLUC、配列番号19)、および種々の合成Renillaルシフェラーゼ核酸配列(Rlucver1、配列番号20;Rlucver2、配列番号21;Rluc−最終、配列番号22)。四角で囲まれたヌクレオチドは、配列番号19の相同な位置に存在するヌクレオチドと異なるヌクレオチドである。
【図7−2】図7−1の続き。
【図7−3】図7−2の続き。
【図8】図8は、以下のアミノ酸配列比較を示す:野生型Renilla reniformisルシフェラーゼアミノ酸配列(RELLUC、配列番号224)、および種々の合成Renilla reniformisルシフェラーゼアミノ酸配列(Rlucver1、配列番号225;Rlucver2、配列番号226;Rluc−最終、配列番号227)。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号224の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図9A】図9は、野生型(A) 対 合成(B)Renillaルシフェラーゼ遺伝子のコドン使用頻度を示す。選択された生物体におけるコドン使用頻度は、例えば、Wadaら、1990;Sharpら、1988;Aotaら、1988;およびSharpら、1987を、そして、植物コドンについては、Murrayら、1989を参照のこと。
【図9B】図9は、野生型(A) 対 (B)Renillaルシフェラーゼ遺伝子のコドン使用頻度を示す。選択された生物体におけるコドン使用頻度は、例えば、Wadaら、1990;Sharpら、1988;Aotaら、1988;およびSharpら、1987を、そして、植物コドンについては、Murrayら、1989を参照のこと。
【図10】図10は、合成Renillaルシフェラーゼ遺伝子を調製するために用いられるオリゴヌクレオチド(配列番号246〜292)を示す。
【図11−1】図11は、以下のヌクレオチド配列比較を示す:野生型黄緑色(YG)コメツキムシルシフェラーゼ核酸配列(LUCPPLYG、配列番号1)および合成緑色コメツキムシルシフェラーゼ核酸配列(GRver5.1、配列番号9)、および合成赤色コメツキムシルシフェラーゼ核酸配列(RD156−1H9、配列番号18)。四角で囲まれたヌクレオチドは、配列番号1の相同な位置に存在するヌクレオチドと異なるヌクレオチドである。両方の合成配列は、LUCPPLYGと、コドンの25%を超えて異なるコドン組成を有し、そして異なるコドンにおけるコドンの無作為選択に対して、少なくとも3倍少ない転写調節配列を有する。
【図11−2】図11−1の続き。
【図11−3】図11−2の続き。
【図12】図12は、以下のアミノ酸配列比較を示す:野生型YGコメツキムシルシフェラーゼアミノ酸配列(LUCPPLYG、配列番号23)および合成GRコメツキムシルシフェラーゼアミノ酸配列(GRver5.1、配列番号31)および赤色(RD)コメツキムシルシフェラーゼアミノ酸配列(RD156−1H9、配列番号223)。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号23の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図13−1】図13は、pRLベクターシリーズを示す。全てのベクターは、本明細書中でさらに記載されるような、Renilla野生型または合成遺伝子を含む。図13Aは、pGL3ベクター(Promega Corp.)中のRenillaルシフェラーゼ遺伝子を示す。図13Bは、Renillaルシフェラーゼコリポーターベクターシリーズを示す。pRL−TKは、単純疱疹ウイルス(HSV)tkプロモーターを有し;pRL−SV40は、SV40ウイルス初期エンハンサー/プロモーターを有し;pRL−CMVは、サイトメガロウイルス(CMV)エンハンサーおよび最初期プロモーターを有し;pRL−nullは、MCS(マルチクローニング部位)を有するが、プロモーターもエンハンサーも有さず;pRL−TK(Int−)は、他のプラスミドに存在するイントロンを有さないHSV/tkプロモーターを有し;pR−GL3Bは、pGL−3基本骨格(Promega Corp.)を有し;pR−GL3 TKは、HSV tkプロモーターを有するpR−GL3基本骨格を有する。
【図13−2】図13は、pRLベクターシリーズを示す。全てのベクターは、本明細書中でさらに記載されるような、Renilla野生型または合成遺伝子を含む。図13Aは、pGL3ベクター(Promega Corp.)中のRenillaルシフェラーゼ遺伝子を示す。図13Bは、Renillaルシフェラーゼコリポーターベクターシリーズを示す。pRL−TKは、単純疱疹ウイルス(HSV)tkプロモーターを有し;pRL−SV40は、SV40ウイルス初期エンハンサー/プロモーターを有し;pRL−CMVは、サイトメガロウイルス(CMV)エンハンサーおよび最初期プロモーターを有し;pRL−nullは、MCS(マルチクローニング部位)を有するが、プロモーターもエンハンサーも有さず;pRL−TK(Int−)は、他のプラスミドに存在するイントロンを有さないHSV/tkプロモーターを有し;pR−GL3Bは、pGL−3基本骨格(Promega Corp.)を有し;pR−GL3 TKは、HSV tkプロモーターを有する基本骨格を有する。
【図13−3】図13−2の続き。
【図14】図14は、CHO細胞における、合成(Rluc−最終(Rluc−final)RenillaルシフェラーゼおよびネイティブRenillaルシフェラーゼの半減期を示す。
【図15A】図15は、Renillaルシフェラーゼ核酸配列のインビトロでの転写/翻訳を示す。A)t=0〜60分;B)直線範囲。
【図15B】図15は、Renillaルシフェラーゼ核酸配列のインビトロでの転写/翻訳を示す。A)t=0〜60分;B)直線範囲。
【図15C】図15は、ウサギ網状赤血球溶解物における、ネイティブRenillaルシフェラーゼRNAおよび合成(Rluc−最終)RenillaルシフェラーゼRNAのインビトロでの翻訳を示す。RNAを定量し、そして同じ量を、図15A〜Bに示される翻訳反応と同じ様に用いた。C)t=0〜60分;D)直線範囲。
【図15D】図15は、ウサギ網状赤血球溶解物における、ネイティブRenillaルシフェラーゼRNAおよび合成(Rluc−最終)RenillaルシフェラーゼRNAのインビトロでの翻訳を示す。RNAを定量し、そして同じ量を、図15A〜Bに示される翻訳反応と同じ様に用いた。C)t=0〜60分;D)直線範囲。
【図15E】図15は、コムギ麦芽抽出物における、ネイティブRenillaRNAおよび合成(Rluc−最終)RenillaRNAの翻訳を示す。E)t=0〜60分;F)直線範囲。
【図15F】図15は、コムギ麦芽における、ネイティブRenillaルシフェラーゼRNAおよび合成(Rluc−最終)RenillaルシフェラーゼRNAのインビトロでの翻訳を示す。E)t=0〜60分;F)直線範囲。
【図16−1】図16は、合成Renilla核酸配列からの高い発現が、同時トランスフェクションアッセイにおけるプロモーター干渉の危険性を減らしたことを示す。CHO細胞を、以下を用いて同時トランスフェクトした:一定量(50ng)のホタルルシフェラーゼ発現ベクター(pGL3コントロールベクター(SV40のプロモーターおよびエンハンサーを有する);Luc+)、ならびにネイティブRenillaルシフェラーゼ遺伝子(0ng、50ng、100ng、500ng、1μg、または2μg)および合成Renillaルシフェラーゼ遺伝子(0ng、5ng、10ng、50ng、100ng、または200ng)を有するpRLベクター。
【図16−2】図16−1の続き。
【図17A】図17Aは、ホタルおよびコメツキムシのルシフェラーゼにより触媒される反応を示す。
【図17B】図17Bは、Renillaルシフェラーゼにより触媒される反応を示す。
【図18−1】図18は、pGL3ベクターにおけるコメツキムシルシフェラーゼのヌクレオチド配列および推定アミノ酸配列を示す(pGL3中のGRver5.1、配列番号298をコードする配列番号297;pGL3中のRDver5.1、配列番号300をコードする配列番号299;およびpGL3中のRD156−1H9、配列番号302をコードする配列番号301)。GRver5.1核酸配列、RDver5.1核酸配列、およびRD156−1H9核酸配列を、pGL3ベクターにクローニングするために、開始コドンにNco I部位を有するオリゴヌクレオチドを用いた。このことにより、2位でのバリンへのアミノ酸置換を生じた。
【図18−2】図18−1の続き。
【図18−3】図18−2の続き。
【図18−4】図18−3の続き。
【発明を実施するための形態】
【0023】
(発明の詳細な説明)
(定義)
用語「遺伝子」とは、本明細書中で使用される場合、ポリペプチドまたはタンパク質前駆体の生成に必要なコード配列を含むDNA配列をいう。このポリペプチドは、全長コード配列によってコードされ得るか、または所望のタンパク質特性が維持される限り、コード配列の任意の部分によってコードされ得る。
【0024】
「核酸」は、本明細書中で使用される場合、共有結合したヌクレオチド配列であり、1つのヌクレオチドのペントースの3’位は、次のペントースの5’位に、ホスホジエステル基によって連結され、そしてヌクレオチド残基(塩基)は、特定の配列(すなわち、ヌクレオチドの直線的な順番)で結合される。「ポリヌクレオチド」は、本明細書中で使用される場合、約100ヌクレオチド長より長い配列を含む核酸である。「オリゴヌクレオチド」は、本明細書中で使用される場合、短いポリヌクレオチドまたはポリヌクレオチドの一部である。オリゴヌクレオチドは、代表的に、約2〜約100塩基の配列を含む。単語「オリゴ」は、時々、単語「オリゴヌクレオチド」の代わりに使用される。
【0025】
核酸分子は、「5’末端(5’端)」および「3’末端(3’端)」を有するといわれる。なぜなら、核酸ホスホジエステル結合は、引き続くモノヌクレオチドのペントース環の5’炭素と3’炭素との間で生じるからである。新しい結合が5’炭素に対して生じるポリヌクレオチドの末端が、5’末端ヌクレオチドである。新しい結合が3’炭素に対して生じるポリヌクレオチドの末端が、3’末端ヌクレオチドである。本明細書中で使用される場合、末端ヌクレオチドは、3’末端または5’末端の末端位置のヌクレオチドである。
【0026】
DNA分子は、「5’端」および「3’端」を有するといわれる。なぜなら、モノヌクレオチドは、1つのモノヌクレオチドのペントース環の5’ホスフェートが、ホスホジエステル結合を介して一方向で、隣のペントースの3’酸素に結合するような様式で反応して、オリゴヌクレオチドを作製するからである。従って、オリゴヌクレオチドの末端は、その5’ホスフェートがモノヌクレオチドペントース環の3’酸素に連結されない場合、「5’端」と称され、そしてその3’酸素が引き続くモノヌクレオチドペントース環の5’ホスフェートに連結されない場合、「3’端」と称される。
【0027】
本明細書中で使用される場合、核酸配列はまた、より大きなオリゴヌクレオチドまたはポリヌクレオチドの内部である場合さえ、5’端および3’端を有するといわれ得る。直線状DNA分子または環状DNA分子のいずれかにおいて、別個のエレメントは、「下流」または3’エレメントの「上流」または5’であるといわれる。この専門用語は、転写が、DNA鎖に沿って、5’から3’への様式で進むという事実を反映する。代表的に、連結された遺伝子の転写を指向するプロモーターエレメントまたはエンハンサーエレメントは、一般に、コード領域の5’または上流に位置する。しかし、エンハンサーエレメントは、プロモーターエレメントおよびコード領域の3’に位置する場合にさえ、その効果を発揮し得る。転写終結シグナルおよびポリアデニル化シグナルは、コード領域の3’または下流に位置する。
【0028】
用語「コドン」は、本明細書中で使用される場合、基本的な遺伝暗号(遺伝コード)単位であり、ポリペプチド鎖に取りこまれる特定のアミノ酸、または開始シグナルもしくは停止シグナルを特定する、3ヌクレオチドの配列からなる。図1は、コドン表を含む。用語「コード領域」は、構造遺伝子に関して使用される場合、mRNA分子の翻訳の結果としての、新生ポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列をいう。代表的に、コード領域は、開始メチオニンをコードするヌクレオチドトリプレット「ATG」による5’側の境界があり、かつ終止コドン(例えば、TAA、TAG、TGA)による3’側の境界がある。いくつかの場合、コード領域は、ヌクレオチドトリプレット「TTG」によって開始されることもまた公知である。
【0029】
「タンパク質」および「ポリペプチド」によって、長さまたは翻訳後修飾(例えば、グリコシル化またはリン酸化)に関わらず、任意の鎖のアミノ酸を意味する。本発明の合成遺伝子はまた、天然に存在するタンパク質またはそのポリペプチドフラグメントの改変体をコードし得る。好ましくは、このようなタンパク質ポリペプチドは、それが由来する天然に存在する(ネイティブの)アミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%同一である、アミノ酸配列を有する。
【0030】
ポリペプチド分子は、「アミノ末端」(N末端)および「カルボキシ末端」(C末端)を有するといわれる。なぜなら、ペプチド結合は、第一のアミノ酸残基の骨格アミノ基と第二のアミノ酸残基の骨格カルボキシル基との間で生じるからである。ポリペプチド配列に関して、用語「N末端」および「C末端」は、それぞれ、ポリペプチドのN末端領域およびC末端領域の部分を含むポリペプチド領域をいう。ポリペプチドのN末端領域部分を含む配列は、ポリペプチド鎖のN末端半分由来のアミノ酸を優勢に含むが、このような配列に限定されない。例えば、N末端配列は、ポリペプチドのN末端半分およびC末端半分の両方に由来する塩基を含む、ポリペプチド配列の内部部分を含み得る。同じことがC末端にも適用される。N末端領域およびC末端領域は、必ずしもそうである必要はないが、それぞれ、ポリペプチドの最終的なN末端およびC末端を規定するアミノ酸を含み得る。
【0031】
用語「野生型」は、本明細書中で使用される場合、天然に存在する供給源から単離された遺伝子または遺伝子産物の特徴を有する、遺伝子または遺伝子産物をいう。野生型遺伝子は、ある集団において最も頻繁に観察され、従って、この遺伝子の「野生型」形態と任意に称される。対照的に、用語「変異体」は、野生型の遺伝子または遺伝子産物と比較した場合に、配列および/または機能的特性における改変(すなわち、変更された特徴)を示す遺伝子または遺伝子産物をいう。天然に存在する変異体が単離され得ることが留意される;これらは、野生型の遺伝子または遺伝子産物と比較した場合に、変更された特徴を有するという事実によって、同定される。
【0032】
用語「相補的」または「相補性」は、塩基対形成法則によって関連する、ヌクレオチドの配列に関して使用される。例えば、配列5’「A−G−T」3’について、これは、配列3’「T−C−A」5’に相補的である。相補性は、「部分的」であり得、この場合、いくつかの核酸塩基は、塩基対形成法則に従って一致される。あるいは、「完全」または「全体的」な相補性が、核酸間に存在し得る。核酸鎖環の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して、有意な影響を有する。これは、増幅反応、および核酸のハイブリダイゼーションに依存する検出方法において特に重要である。
【0033】
用語「組換えタンパク質」または「組換えポリペプチド」は、本明細書中で使用される場合、組換えDNA分子から発現されるタンパク質分子をいう。対照的に、用語「ネイティブタンパク質」は、本明細書中で使用されて、天然に存在する(すなわち、非組換え)供給源から単離されたタンパク質を示す。分子生物学的技術を使用して、タンパク質のネイティブ形態と比較して、同一の特性を有するタンパク質の組換え形態を生成する。
【0034】
用語「融合タンパク質」および「融合パートナー」とは、外因性タンパク質フラグメント(例えば、非ルシフェラーゼタンパク質からなる融合パートナー)に連結された目的のタンパク質(例えば、ルシフェラーゼ)を含む、キメラタンパク質をいう。この融合パートナーは、宿主細胞において発現される場合にタンパク質の可溶性を増強し得、例えば、宿主細胞もしくは培養物上清またはこれら両方からの組換え融合タンパク質の精製を可能にする、親和性タグ(アフィニティータグ)を提供し得る。所望の場合、この融合パートナーは、当該分野で公知の種々の酵素的方法または化学的方法によって、目的のタンパク質から除去され得る。
【0035】
用語「細胞」、「細胞株」、「宿主細胞」は、本明細書中で使用される場合、相互変換可能に使用され、このような名称の全ては、これらの名称の子孫または潜在的子孫を含む。「形質転換細胞」は、合成遺伝子を含むDNA分子が導入された細胞(またはその祖先)を意味する。必要に応じて、本発明の合成遺伝子は、合成遺伝子によってコードされるタンパク質またはポリペプチドを産生し得る安定に形質転換された細胞株を作製するように、適切な細胞株に導入され得る。このような細胞株を構築するためのベクター、細胞および方法は、当該分野で周知である(例えば、Ausubelら(前出))。語「形質転換体」または「形質転換細胞」は、移入の数に関わらず、元々の形質転換細胞に由来する、初代形質転換細胞を含む。全ての子孫は、意図した変異または偶発的な変異に起因して、DNA内容が正確に同一でなくてもよい。それにもかかわらず、元々の形質転換細胞においてスクリーニングされたのと同じ機能性を有する変異子孫は、形質転換体の定義に含まれる。
【0036】
核酸は、異なる型の変異を含むことが公知である。「点」変異とは、単一塩基位置での、野生型配列からのヌクレオチドの配列の変更をいう。変異はまた、1以上の塩基の挿入または欠失をいい得、その結果、核酸配列は、野生型配列とは異なる。
【0037】
用語「相同性」とは、相補性の程度をいう。部分的な相同性または完全な相同性(すなわち、同一性)が存在する。相同性は、配列分析ソフトウェア(例えば、Sequence Analysis Software Package of the Genetics Computer Group.University of Wisconsin Biotechnology Center.1710 University Avenue.Madison,WI 53705)を使用して、しばしば測定される。このようなソフトウェアは、種々の置換、欠失、挿入および他の改変に対して相同性の程度を割り当てることによって、類似する配列を一致させる。保存的置換としては、代表的に、以下の群内の置換が挙げられる:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン。
【0038】
「部分的に相補的な」配列は、完全に相補的な配列が標的核酸にハイブリダイゼーションすることを少なくとも部分的に阻害し、機能的用語「実質的に相同」を使用して言及される配列である。完全に相補的な配列の標的配列へのハイブリダイゼーションの阻害は、低いストリンジェンシー条件下でのハイブリダイゼーションアッセイ(サザンブロットまたはノザンブロット、溶液ハイブリダイゼーションなど)を使用して試験され得る。実質的に相同な配列またはプローブは、低いストリンジェンシー条件下で、標的配列に対する完全な相同体の結合(すなわち、ハイブリダイゼーション)と競合するか、またはこの結合を阻害する。低いストリンジェンシーの条件は、非特異的結合を許容するというわけではない;低いストリンジェンシーの条件は、2つの配列の互いに対する結合が、特異的(すなわち、選択的)相互作用であることを必要とする。非特異的結合の非存在は、部分的な程度の相補性(例えば、約30%未満の同一性)さえも欠く、第二の標的の使用によって、試験され得る。この場合、非特異的結合の非存在下で、プローブは、第二の非特異的標的にハイブリダイズしない。
【0039】
cDNAクローンまたはゲノムクローンのような二本鎖核酸配列を参照して使用される場合、用語「実質的に相同」は、本明細書中に記載されるような低ストリンジェンシー条件下で、二本鎖核酸配列のいずれかの鎖または両方の鎖にハイブリダイズし得る任意のプローブをいう。
【0040】
「プローブ」は、探索されるべき変性核酸の配列に対して、選択されたストリンジェンシー条件下で結合されるに十分な相補性となる(その長さに関連して)ように設計されたオリゴヌクレオチドをいう。
【0041】
「ハイブリダイゼーション」および「結合」は、プローブおよび変性融解核酸の文脈において、交換可能に使用される。変性された核酸にハイブリダイズまたは結合されるプローブは、そのポリヌクレオチドにおける相補配列に対して塩基対形成される。特定のプローブが、そのポリヌクレオチドと塩基対形成されたまま維持されるか否かは、相補性の程度、プローブの長さ、および結合条件のストリンジェンシーに依存する。ストリンジェンシーが高くなればなるほど、相補性の程度はより高くなければならず、および/または、プローブはより長くなければならない。
【0042】
用語「ハイブリダイゼーション」は、相補的核酸鎖の対形成を参照して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度(すなわち、核酸鎖の間の会合の強度)は、当該分野で周知の多くの因子によって影響を及ぼされる。この因子としては、核酸間の相補性の程度、塩濃度、形成されるハイブリッドのTm(融解温度)、他の成分の存在(例えば、ポリエチレングリコールの存在または非存在)、ハイブリダイズする鎖のモル濃度、および核酸鎖のG:C含量のような条件によって関与され影響される条件のストリンジェンシーが挙げられる。
【0043】
用語「ストリンジェンシー」は、温度、イオン強度、および他の化合物の存在に関する条件(この条件下で、核酸のハイブリダイゼーションを実施する)を参照して使用される。「高ストリンジェンシー」条件では、核酸の塩基対形成は、高頻度の相補性塩基配列を有する核酸フラグメントの間でのみ起こる。従って、「中程度の」または「低い」ストリンジェンシーの条件が、一緒にハイブリダイズまたはアニールされるべき互いに対して完全には相補的でない核酸を所望する場合にしばしば必要とされる。当該分野は、多数の等価な条件が、中程度のストリンジェンシー条件または低いストリンジェンシー条件を含むように使用され得ることを十分に知っている。ハイブリダイゼーション条件の選択は、一般的に、当業者に明らかであり、そして通常、ハイブリダイゼーションの目的、ハイブリダイゼーションの型(DNA−DNAまたはDNA−RNA)、および配列間で所望される関連性のレベルによって導かれる(この方法の一般的な考察として、例えば、Sambrookら,1989;Nucleic Acid Hybridization,A Practical Approach,IRL Press,Washington D.C.,1985)。
【0044】
核酸二重鎖の安定性は、ミスマッチ塩基の数の増加につれて減少し、そしてさらに、ハイブリッド二重鎖におけるミスマッチの相対的位置に依存して、より高い程度またはより低い程度まで減少されることが知られている。従って、ハイブリダイゼーションのストリンジェンシーを使用して、このような二重鎖の安定性を最大化または最少化し得る。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの温度を調整することによって;ハイブリダイゼーション混合物中におけるヘリックス不安定化剤(例えば、ホルムアミド)のパーセンテージを調整することによって;ならびに洗浄溶液の温度および/または塩濃度を調整することによって、変更され得る。フィルターハイブリダイゼーションについて、ハイブリダイゼーションの最終的なストリンジェンシーは、しばしば、ハイブリダイゼーション後の洗浄に使用される塩濃度および/または温度によって決定される。
【0045】
「高ストリンジェンシー条件」は、核酸のハイブリダイゼーションを参照して使用される場合、約500ヌクレオチド長のプローブを使用する場合において、5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2Oおよび1.85g/l EDTA(pHをNaOHで7.4に調整))、0.5%SDS、5×デンハルト試薬および100μg/ml変性サケ精子DNAからなる溶液中における42℃での結合またはハイブリダイゼーションに続いて、0.1×SSPE、1.0%SDSを含む溶液中において42℃で洗浄するのと等価な条件を含む。
【0046】
「中程度のストリンジェンシー条件」は、核酸のハイブリダイゼーションを参照して使用される場合、約500ヌクレオチド長のプローブを使用する場合において、5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2Oおよび1.85g/l EDTA(pHをNaOHで7.4に調整))、0.5%SDS、5×デンハルト試薬および100μg/ml変性サケ精子DNAからなる溶液中における42℃での結合またはハイブリダイゼーションに続いて、1.0×SSPE、1.0%SDSを含む溶液中において42℃で洗浄するのと等価な条件を含む。
【0047】
「低いストリンジェンシー条件」は、約500ヌクレオチド長のプローブを使用する場合において、5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2Oおよび1.85g/l EDTA(pHをNaOHで7.4に調整))、0.1%SDS、5×デンハルト試薬[50×デンハルトは、500mlあたりに、5gのFicoll(Type400、Pharmacia)、5gのBSA(Fraction V;Sigma)を含む]および100g/ml変性サケ精子DNAからなる溶液中における42℃での結合またはハイブリダイゼーションに続いて、5×SSPE、0.1%SDSを含む溶液中において42℃で洗浄するのと等価な条件を含む。
【0048】
用語「Tm」は、「融解温度」を参照して使用される。融解温度は、二本鎖核酸分子の集団のうちの50%が、解離されて一本鎖になる温度である。核酸のTmを算出するための方程式は、当該分野で周知である。ハイブリッド核酸のTmはしばしば、1M塩におけるハイブリダイゼーションアッセイから採択される式を使用して推定され、そして一般的に、PCRプライマーについてのTmを算出するために使用されるのは、以下である:[(A+Tの数)×2℃+(G+Cの数)×4℃](C.R.Newtonら,PCR,第2版,Springer−Verlag(New York,1997),24頁)。この式は、20ヌクレオチドよりも長いプライマーについては不正確であることが見出された(同書)。Tm値に関する別の単純な推定は、以下の式によって算出され得る:核酸が1M NaClでの水溶液中にある場合、Tm=81.5+0.41(%G+C)(例えば、AndersonおよびYoung,Quantitative Filter Hybridization,Nucleic Acid Hybridization,1985)。他のより複雑化した計算が、当該分野において存在し、それは構造および配列の特徴を、Tmの算出のための考慮に入れる。算出されたTmは、単なる推定に過ぎず;最適温度は一般的に、経験的に決定される。
【0049】
用語「単離された」は、「単離されたオリゴヌクレオチド」または「単離されたポリヌクレオチド」におけるように、核酸に関連して使用される場合、同定され、かつその供給源において通常関連付けられる少なくとも1つの夾雑物から分離されている核酸配列をいう。従って、単離された核酸は、その天然において見出される形態または設定とは異なる形態または設定において存在する。対照的に、単離されていない核酸(例えば、DNAおよびRNA)は、それが天然において存在する状態で見出される。例えば、所定のDNA配列(例えば、遺伝子)は、隣接する遺伝子と近位で宿主細胞の染色体において見出され;RNA配列(例えば、特定のタンパク質をコードする特定のmRNA配列)は、多くのタンパク質をコードする多数の他のmRNAとの混合物として、細胞中において見出される。しかし、単離された核酸としては、例示として、その核酸を通常発現している細胞におけるこのような核酸であって、ここでこの核酸が天然の細胞の染色体位置とは異なる染色体位置にある核酸、またはさもなくば、天然において見出される核酸配列とは異なる核酸配列によって隣接されている核酸が挙げられる。単離された核酸またはオリゴヌクレオチドは、一本鎖または二本鎖の形態で存在し得る。単離された核酸またはオリゴヌクレオチドが、タンパク質を発現するように利用される場合、そのオリゴヌクレオチドは、最少でもセンス鎖またはコード鎖を含む(すなわち、オリゴヌクレオチドは一本鎖であり得る)が、センス鎖およびアンチセンス鎖の両方を含み得る(すなわち、オリゴヌクレオチドは、二本鎖であり得る)。
【0050】
用語「単離された」は、「単離されたタンパク質」または「単離されたポリペプチド」におけるように、ポリペプチドに関連して使用される場合、同定され、かつその供給源において通常関連付けられる少なくとも1つの夾雑物から分離されているポリペプチドをいう。従って、単離されたポリペプチドは、その天然において見出される形態または設定とは異なる形態または設定において存在する。対照的に、単離されていないポリペプチド(例えば、タンパク質および酵素)は、それが天然において存在する状態で見出される。
【0051】
用語「精製された」または「精製する(ために)」とは、目的の成分(例えば、タンパク質または核酸)からいくらかの夾雑物を取り除く任意のプロセスの結果を意味する。これにより、サンプル中における精製成分のパーセントは増加する。
【0052】
用語「作動可能に連結された」は、本明細書中で使用される場合、所定の遺伝子の転写および/または所望のタンパク質分子の合成を指示し得る核酸分子が生成されるような様式における核酸配列の連結をいう。この用語はまた、機能的(例えば、酵素的に活性な、結合パートナーに結合し得る、阻害し得る、など)なタンパク質またはポリペプチドが生成されるような様式でアミノ酸をコードする配列の連結をいう。
【0053】
用語「組換えDNA分子」は、天然において通常一緒に見出されない少なくとも2つのヌクレオチド配列を含むハイブリッドDNA配列を意味する。用語「ベクター」は、DNAのフラグメントが挿入またはクローン化され得、そして細胞中にDNAセグメントを移入するために使用され得、そして細胞中において複製可能であり得る核酸分子を参照して使用される。ベクターは、プラスミド、バクテリオファージ、ウイルス、コスミドなどに由来し得る。
【0054】
用語「組換えベクター」および「発現ベクター」は、本明細書中で使用される場合、所望のコード配列と、特定の宿主生物における作動可能に連結されたコード配列の発現のために必要とされる適切なDNA配列またはRNA配列とを含む、DNA配列またはRNA配列をいう。原核生物発現ベクターは、プロモーター、リボソーム結合部位、宿主細胞における自律複製のための複製起点、そしておそらく他の配列(例えば、任意のオペレーター配列、任意の制限酵素部位)を含む。プロモーターは、RNAポリメラーゼをDNAに結合させ、そしてRNA合成を開始させるように指示するDNA配列として規定される。真核生物発現ベクターは、プロモーターと、必要に応じて、ポリアデニル化シグナルと、必要に応じて、エンハンサー配列とを含む。
【0055】
用語「遺伝子をコードするヌクレオチド配列を有するポリヌクレオチド」は、遺伝子のコード領域を含む核酸配列、または換言すると、遺伝子産物をコードする核酸配列を意味する。コード領域は、cDNAの形態、ゲノムDNAの形態、またはRNAの形態のいずれかで存在し得る。DNAの形態で存在する場合、オリゴヌクレオチドは、一本鎖(すなわち、センス鎖)であっても二本鎖であってもよい。適切な制御エレメント(例えば、エンハンサー/プロモーター、スプライス連結部、ポリアデニル化シグナルなど)は、必要に応じて遺伝子のコード領域に密接して位置付けられて、一次RNA転写物の転写の適切な開始および/または正確なプロセシングを可能にし得る。あるいは、本発明の発現ベクターにおいて利用されるコード領域は、内因性エンハンサー/プロモーター、スプライス連結部、介在配列、ポリアデニル化シグナルなどを含み得る。さらなる実施形態では、コード領域は、内因性制御エレメントおよび外因性制御エレメントの両方の組み合わせを含み得る。
【0056】
用語「転写調節エレメント」または「転写調節配列」は、核酸配列の発現のいくつかの局面を制御する遺伝子エレメントまたは配列をいう。例えば、プロモーターは、作動可能に連結されたコード領域の転写開始を促進する調節エレメントである。他の調節エレメントとしては、転写因子結合部位、スプライシングシグナル、ポリアデニル化シグナル、終結シグナル、およびエンハンサーエレメントが挙げられるが、これらに限定されない。
【0057】
真核生物における転写制御シグナルは、「プロモーター」および「エンハンサー」エレメントを含む。プロモーターおよびエンハンサーは、転写に関与する細胞性タンパク質と特異的に相互作用するDNA配列の短いアレイからなる(Maniatisら,1987)。プロモーターおよびエンハンサーエレメントは、種々の真核生物供給源(酵母細胞、昆虫細胞および哺乳動物細胞における遺伝子を含む)から単離されている。プロモーターおよびエンハンサーエレメントはまた、ウイルスからも単離されており、そして類似の制御エレメント(例えば、プロモーター)はまた、原核生物においても見出されている。特定のプロモーターおよびエンハンサーの選択は、目的のタンパク質を発現させるために使用される細胞型に依存する。いくつかの真核生物プロモーターおよびエンハンサーは、広範な宿主範囲を有するが、他のプロモーターおよびエンハンサーは、限られた細胞型のサブセットにおいて機能的である(概説として、Vossら,1986;およびManiatisら,1987を参照のこと)。例えば、SV40初期遺伝子エンハンサーは、多くの哺乳動物種由来の広範な種々の細胞型において非常に活性であり、そして哺乳動物細胞におけるタンパク質の発現のために広範に使用されている(Dijkemaら,1985)。広範な哺乳動物細胞型において活性なプロモーター/エンハンサーエレメントの他の2つの例は、ヒト延長因子1遺伝子由来のプロモーター/エンハンサーエレメント(Uetsukiら,1989;Kimら,1990;ならびにMizushimaおよびNagata,1990)、およびラウス肉腫ウイルス(Gormanら,1982);およびヒトサイトメガロウイルス(Boshartら,1985)の長末端反復由来のプロモーター/エンハンサーエレメントである。
【0058】
用語「プロモーター/エンハンサー」は、プロモーター機能およびエンハンサー機能(すなわち、上記のような、プロモーターエレメントおよびエンハンサーエレメントによって提供される機能)の両方を提供し得る配列を含むDNAセグメントを示す。例えば、レトロウイルスの長末端反復は、プロモーター機能およびエンハンサー機能の両方を含む。エンハンサー/プロモーターは、「内因性」であっても、「外因性」であっても、「異種性(heterologous)」であってもよい。「内因性」エンハンサー/プロモーターは、ゲノム中において所定の遺伝子と天然で連結されているものである。「外因性」または「異種性」のエンハンサー/プロモーターは、遺伝子操作(すなわち、分子生物学技術)によって遺伝子に並置されて位置付けられ、その結果、その遺伝子の転写が、連結されたエンハンサー/プロモーターにより指示されるものである。
【0059】
発現ベクターにおける「スプライシングシグナル」の存在は、しばしば、真核生物宿主細胞において組換え転写物のより高いレベルの発現を引き起こす。スプライシングシグナルは、一次RNA転写物からのイントロンの除去を媒介し、そしてスプライスドナーおよびアクセプター部位から構成される(Sambrookら,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring
Harbor Laboratory Press,New York,1989,16.7−16.8)。一般的に使用されるスプライスドナーおよびアクセプター部位は、SV40の16S RNA由来のスプライス連結部である。
【0060】
真核生物細胞における組換えDNA配列の効率的な発現は、生じる転写物の効率的な終結およびポリアデニル化を指示するシグナルの発現を必要とする。転写終結シグナルは一般的に、ポリアデニル化シグナルの下流に見出され、そして数百ヌクレオチド長である。用語「ポリ(A)部位」または「ポリ(A)配列」は、本明細書中で使用される場合、新生RNA転写物の終結およびポリアデニル化の両方を指示するDNA配列を示す。組換え転写物の効率的なポリアデニル化が望ましい。なぜなら、ポリ(A)テイルを欠失する転写物は、不安定であり、そして迅速に分解されるからである。発現ベクターにおいて利用されるポリ(A)シグナルは、「異種性」であっても「内因性」であってもよい。内因性ポリ(A)シグナルは、ゲノム中において所定遺伝子のコード領域の3’末端に天然で見出されるシグナルである。異種性ポリ(A)シグナルは、1つの遺伝子から単離され、そして別の遺伝子に対して3’側に位置付けられるシグナルである。通常使用される異種性ポリ(A)シグナルは、SV40ポリ(A)シグナルである。SV40ポリ(A)シグナルは、237bpのBamHI/BclI制限フラグメントに含まれ、そして終結およびポリアデニル化の両方を指示する(Sambrook,前出,16.6−16.7)。
【0061】
真核生物発現ベクターはまた、「ウイルスレプリコン」または「ウイルス複製起点」を含み得る。ウイルスレプリコンは、適切な複製因子を発現する宿主細胞においてベクターの染色体外複製を可能にするウイルスDNA配列である。SV40またはポリオーマウイルスの複製起点のいずれかを含むベクターは、適切なウイルスT抗原を発現する細胞において、高コピー数まで(104コピー/細胞まで)複製する。対照的に、ウシパピローマウイルスまたはエプスタイン−バーウイルス由来のレプリコンを含むベクターは、低コピー数(約100コピー/細胞)で、染色体外で複製する。
【0062】
用語「インビトロ」は、人工環境および人工環境において生じるプロセスまたは反応をいう。インビトロ環境としては、試験管および細胞溶解産物が挙げられるが、これらに限定されない。用語「インサイチュ」は、細胞培養物をいう。用語「インビボ」は、天然の環境(例えば、動物または細胞)、および天然の環境において生じるプロセスまたは反応をいう。
【0063】
用語「発現系」は、目的の遺伝子の発現を決定する(例えば、検出する)ための任意のアッセイまたはシステムをいう。分子生物学の分野における当業者は、任意の広範な種々の発現系が使用され得ることを理解する。広範な適切な哺乳動物細胞は、広範な供給源(例えば、American Type Culture Collection,Rockland,MD)から利用可能である。形質転換またはトランスフェクションの方法および発現ビヒクルの選択は、選択される宿主系に依存する。形質転換方法およびトランスフェクション方法は、例えば、Ausubelら,Current Protocols
in Molecular Biology.John Wiley & Sons,New York.1992に記載されている。発現系としては、インビトロ遺伝子発現アッセイが挙げられ、ここでは、目的の遺伝子(例えば、レポーター遺伝子)を調節配列に連結し、そしてこの遺伝子の発現を、この遺伝子の発現を阻害または誘導する因子で処理した後にモニターする。遺伝子発現の検出は、任意の適切な手段(発現されたmRNAまたはタンパク質(例えば、レポーター遺伝子の検出可能な生成物)の検出が挙げられるが、これに限定されない)を通してか、または目的の遺伝子を発現する細胞の表現型における検出可能な変化を通してなされ得る。発現系はまた、切断事象または他の核酸もしくは細胞の変化を検出するアッセイを含み得る。
【0064】
用語「酵素」は、化学的反応および生物学的反応の触媒を担う分子または分子凝集体をいう。このような分子は、代表的にはタンパク質であるが、短いペプチド、RNA、リボザイム、抗体および他の分子も含み得る。化学的反応および生物学的反応を触媒する分子は、「酵素活性を有する」または「触媒活性を有する」といわれる。
【0065】
本明細書中で同定されるすべてのアミノ酸残基は、天然のL−立体配置である。標準的なポリペプチドの命名法(J.Biol.Chem.,243,3557(1969)を参照のこと)と一致して、アミノ酸残基の略語は、以下の対応表に示される通りである。
【0066】
対応表
一文字 三文字 アミノ酸
Y Tyr L−チロシン
G Gly グリシン
F Phe L−フェニルアラニン
M Met L−メチオニン
A Ala L−アラニン
S Ser L−セリン
I Ile L−イソロイシン
L Leu L−ロイシン
T Thr L−スレオニン
V Val L−バリン
P Pro L−プロリン
K Lys L−リジン
H His L−ヒスチジン
Q Gln L−グルタミン
E Glu L−グルタミン酸
W Trp L−トリプトファン
R Arg L−アルギニン
D Asp L−アスパラギン酸
N Asn L−アスパラギン
C Cys L−システイン。
【0067】
用語「配列相同性」は、2つの核酸配列間の塩基マッチの割合または2つのアミノ酸配列間のアミノ酸マッチの割合を意味する。配列相同性は、パーセンテージ(例えば、50%)として表され、このパーセンテージは、いくつかの他の配列と比較される一つの配列からの配列の長さに対するマッチの割合を示す。ギャップ(2つの配列のいずれかにおける)は、マッチするのを最大化するために許容され;15塩基以下のギャップ長が通常使用され、6塩基以下が好ましく、2塩基以下がより好ましい。プローブまたは処理としてオリゴヌクレオチドを使用する場合、標的核酸とオリゴヌクレオチド配列との間の配列相同性は、一般的に、20個の可能なオリゴヌクレオチド塩基対マッチのうちの17個以上の標的塩基マッチ(85%)であり;好ましくは、10個の可能な塩基対マッチのうちの9個以上のマッチ(90%)であり;そしてより好ましくは、20個の可能な塩基対マッチのうちの19個以上のマッチ(95%)である。
【0068】
2つのアミノ酸配列は、それらの配列の間に部分的または完全な同一性が存在する場合に相同である。例えば、85%相同性は、最大マッチのために2つの配列を整列する場合に、85%のアミノ酸が同一であることを意味する。ギャップ(マッチされる2つの配列のいずれかにおける)は、マッチを最大にするにおいて許容され;5個以下のギャップ長が好ましく、2個以下がより好ましい。あるいはまたは好ましくは、2つのタンパク質配列(または、少なくとも100アミノ酸長のものに由来するポリペプチド配列)は、この用語が本明細書中で使用される場合、それらが変異データマトリクスおよび6以上のギャップペナルティを用いてプログラムALIGNを使用して、5(標準偏差単位)よりも高いアラインメントスコアを有する場合に相同である。Dayhoff,M.O.,Atlas of Protein Sequence and Structure,1972,第5巻,National Biomedical Research Foundation,101−110頁,およびこの巻に対する補遺2,1−10頁を参照のこと。2つの配列またはそれらの部分は、より好ましくは、ALIGNプログラムを使用して最適に整列される場合に、それらのアミノ酸が85%以上同一である場合に相同である。
【0069】
以下の用語は、2つ以上のポリヌクレオチドの間の配列関連性を記載するために使用される:「参照配列」、「比較ウィンドウ」、「配列同一性」、「配列同一性のパーセンテージ」および「実質的同一性」。「参照配列」は、配列比較のための基準として使用される、規定された配列である;参照配列は、例えば、配列表において提供される全長cDNAまたは遺伝子配列のセグメントのような、より長い配列のサブセットであり得るか、または完全cDNAまたは遺伝子配列を含み得る。一般的に、参照配列は、少なくとも20ヌクレオチド長であり、しばしば、少なくとも25ヌクレオチド長であり、そしてしばしば、少なくとも50ヌクレオチド長である。2つのポリヌクレオチドは、各々(1)2つのポリヌクレオチドの間で類似である配列(すなわち、完全なポリヌクレオチド配列の部分)を含み得、そして(2)2つのポリヌクレオチドの間で相違する配列をさらに含み得るので、2つ(またはより多く)のポリヌクレオチドの間の配列比較は、代表的に、配列類似性の局所領域を同定および比較するために、「比較ウィンドウ」にわたって2つのポリヌクレオチドの配列を比較することによって実施される。
【0070】
「比較ウィンドウ」は、本明細書中で使用される場合、少なくとも20個連続するヌクレオチドの概念的なセグメントをいい、そしてここで、比較ウィンドウにおけるポリヌクレオチド配列の部分は、2つの配列の最適アラインメントのために参照配列(これは、付加も欠失も含まない)に対して比較される場合に、20%以下の付加または欠失(すなわち、ギャップ)を含み得る。
【0071】
比較のために配列をアラインメントする方法は、当該分野で周知である。従って、任意の2つの配列間のパーセント同一性の決定は、数学的なアルゴリズムを使用して達成され得る。このような数学的アルゴリズムの好ましく非制限的な例は、MyersおよびMiller(1988)のアルゴリズム;SmithおよびWaterman(1981)の局所的相同性アルゴリズム;NeedlemanおよびWunsch(1970)の相同性アラインメントアルゴリズム;PearsonおよびLipman(1988)の類似性検索方法;KarlinおよびAltschul(1990)のアルゴリズム、KarlinおよびAltschul(1993)におけるような改変である。
【0072】
これらの数学的アルゴリズムのコンピューター実行が、配列同一性を決定するための配列比較のために利用され得る。このような実行としては、以下が挙げられるが、これらに限定されない:PC/GeneプログラムにおけるCLUSTAL(Intelligenetics,Mountain View,Californiaから利用可能);ALIGNプログラム(バージョン2.0)およびWisconsin Genetics
Software Package,バージョン8におけるGAP、BESTFIT、BLAST、FASTA、およびTFASTA(Genetics Computer Group(GCG),575 Science Drive,Madison,Wisconsin,USAから利用可能)。これらのプログラムを使用するアラインメントは、デフォルトパラメーターを使用して実施され得る。CLUSTALプログラムは、Higginsら(1988);Higginsら(1989);Corpetら(1988);Huangら(1992);およびPearsonら(1994)によって十分に記載されている。ALIGNプログラムは、MyersおよびMiller(前出)のアルゴリズムに基づく。Altschulら(1990)のBLASTプログラムは、KarlinおよびAltschul(前出)のアルゴリズムに基づく。比較目的のためにギャップ形成されたアラインメントを得るために、Gapped BLAST(BLAST 2.0における)が、Altschulら(1997)に記載のように利用され得る。あるいは、PSI−BLAST(BLAST2.0における)を使用して、分子間の遠い関係を検出する反復検索を実施し得る。Altschulら(前出)を参照のこと。BLAST、Gapped BLAST、PSI−BLASTを使用する場合、それぞれのプログラム(例えば、ヌクレオチド配列についてのBLASTN、タンパク質についてのBLASTX)のデフォルトパラメーターを使用し得る。http://www.ncbi.nlm.nih.gov.を参照のこと。アラインメントはまた、目視によって手動で実施され得る。
【0073】
用語「配列同一性」は、比較ウィンドウにわたって、2つのポリヌクレオチド配列が同一(すなわち、ヌクレオチド対ヌクレオチド基準で)であることを意味する。用語「配列同一性のパーセンテージ」は、2つのポリヌクレオチド配列が、比較ウィンドウにわたって、規定された割合のヌクレオチドについて同一(すなわち、ヌクレオチド対ヌクレオチド基準で)であることを意味する。用語「配列同一性のパーセンテージ」は、比較ウィンドウにわたって最適に整列された2つの配列を比較する工程、両方の配列において同一の核酸塩基(例えば、A、T、C、G、U、またはI)が存在する位置の数を決定して、マッチした位置の数を算出する工程、比較ウィンドウにおける位置の総数(すなわち、ウィンドウサイズ)でマッチした位置の数を除算する工程、およびこの結果に100を乗算して、配列同一性のパーセンテージを算出する工程によって算出される。用語「実質的同一性」は、本明細書中で使用される場合、ポリヌクレオチド配列の特徴を示し、ここでは、ポリヌクレオチドは、少なくとも20ヌクレオチドの位置の比較ウィンドウにわたって、しばしば、少なくとも20〜50ヌクレオチドのウィンドウにわたって、そして好ましくは、少なくとも300ヌクレオチドで、参照配列に対して比較される場合に、少なくとも60%、好ましくは少なくとも65%、より好ましくは少なくとも70%、約85%まで、そしてさらにより好ましくは、少なくとも90〜95%、一般的により好ましくは少なくとも99%の配列同一性を有する配列を含み、ここで、配列同一性のパーセンテージは、比較ウィンドウにわたって参照配列の合計20%以下の欠失または付加を含み得るポリヌクレオチド配列に対して参照配列を比較することによって算出される。参照配列は、より長い配列のサブセットであり得る。
【0074】
ポリペプチドに適用される場合、用語「実質的同一性」は、2つのペプチド配列が、例えば、デフォルトギャップ重を使用してプログラムGAPまたはBESTFITによって最適に整列される場合に、少なくとも約85%の配列同一性、好ましくは少なくとも約90%の配列同一性、より好ましくは、少なくとも約95%の配列同一性、そして最も好ましくは、少なくとも約99%の配列同一性を共有することを意味する。
【0075】
(本発明の合成核酸分子および方法)
本発明は、合成核酸分子を含む組成物、ならびに、所望の特徴(特定の細胞型において発現される場合での減少した不適切な転写特徴または意図されていない転写特徴を含む)を有するポリペプチドまたはタンパク質として効率的に発現される合成核酸分子を生成するこれらの分子を調製するための方法を提供する。
【0076】
自然選択とは、表現型レベルで起こる遺伝子型−環境の相互作用が、個体の示差的な生殖の成功へと導き、これにより、集団の遺伝子プールの改変へと導くという仮説である。一般に、天然で見出されるタンパク質のアミノ酸配列は、自然選択によって最適化を受けたと認められる。しかし、アミノ酸は、顕著にはタンパク質の活性に寄与しないタンパク質配列内に存在し、そしてこれらのアミノ酸は、ほとんどまたは全く意義なく、他のアミノ酸に変更され得る。さらに、タンパク質は、その天然の環境以外で有用であり得るか、またはその自然選択条件とは異なる目的のために有用であり得る。これらの環境において、アミノ酸配列は、種々の適用におけるその用途のために、タンパク質をより良く適合させるように合成的に変更され得る。
【0077】
同様に、タンパク質をコードする核酸配列はまた、自然選択によって最適化される。コードするDNAとその転写されるRNAとの間の関係は、DNAに対するいかなる変化も、生じるRNAに影響を及ぼすような関係である。従って、自然選択は、両方の分子に同時に働きかける。しかし、この関係は、核酸とタンパク質との間には存在しない。複数のコドンが同一のアミノ酸をコードするので、多くの異なるヌクレオチド配列が、同一のタンパク質をコードし得る。500アミノ酸から構成される特定のタンパク質は、理論上では、10150個よりも多くの異なる核酸配列によってコードされ得る。
【0078】
自然選択は、核酸に対して作用して、対応するタンパク質の適切なコードを達成する。おそらく、核酸分子の他の特性もまた、自然選択によって作用される。これらの特性としては、コドン使用頻度、RNAの二次構造、イントロンスプライシングの効率、および転写因子または他の核酸結合タンパク質との相互作用が挙げられる。これらの他の特性は、タンパク質の翻訳効率および生じる表現型を変更し得る。遺伝コードの冗長性質が理由で、これらの他の性質は、対応するアミノ酸配列を変更することなく、自然選択によって最適化され得る。
【0079】
いくつかの条件下では、タンパク質をコードする天然のヌクレオチド配列を、代替的適用のためにこのタンパク質をより良く適合させるように合成的に変更することが有用である。一般的な例は、それを外来宿主において発現させる場合に、遺伝子のコドン使用頻度を変更することである。遺伝コードの冗長性は、アミノ酸が複数のコドンによってコードされることを可能にするが、異なる生物は、他と比較していくつかのコドンを好む。コドン使用頻度は、進化学的に大きく離れた歴史を有する生物について最も異なる傾向がある。進化学的に遠い生物の間で遺伝子を転移させる場合、タンパク質翻訳の効率は、コドン使用頻度を調整することによって実質的に増加され得ることが見出されている(米国特許第5,096,825号、同第5,670,356号、および同第5,874,304号を参照のこと)。
【0080】
進化の距離に関する必要性に起因して、レポーター遺伝子のコドン使用頻度は、しばしば、実験細胞の最適なコドン使用頻度に対応しない。例としては、β−ガラクトシダーゼ(β−gal)レポーター遺伝子およびクロラムフェニコールアセチルトランスフェラーゼ(cat)レポーター遺伝子(これらは、E.coliに由来し、そして哺乳動物細胞において一般的に使用される);β−グルクロニダーゼ(gus)レポーター遺伝子(これは、E.coliに由来し、そして植物細胞において一般的に使用される);ホタルルシフェラーゼ(luc)レポーター遺伝子(これは、昆虫に由来し、そして植物細胞および哺乳動物細胞において一般的に使用される);Renillaルシフェラーゼレポーター遺伝子およびグリーン蛍光タンパク質(gfp)レポーター遺伝子(これらは、腔腸動物に由来し、そして植物細胞および哺乳動物細胞において一般的に使用される)が挙げられる。レポーター遺伝子発現の高感度な定量を達成するために、その遺伝子産物の活性は、実験宿主細胞に対して内因性であってはならない。従って、レポーター遺伝子は、通常、独特かつ特有の表現型を有する生物から選択される。結果として、これらの生物は、しばしば、実験宿主細胞から広範に離れた進化歴を有する。
【0081】
以前に、より最適なコドン使用頻度を有するが、同じ遺伝子産物をなおコードする遺伝子を作製するために、合成核酸配列は、既存のコドンを、実験宿主細胞に一般的により好ましいコドンと置換することによって作製された(米国特許第5,096,825号、同第5,670,356号、および同第5,874,304号を参照のこと)。結果は、合成遺伝子のコドン使用頻度における正味の改善であった。しかし、他の特性の最適化は考慮されず、そのため、これらの合成遺伝子は、自然淘汰によって最適化された遺伝子を反映しなかったようである。
【0082】
詳細には、コドン使用頻度における改善は、タンパク質への翻訳におけるRNA配列の役割に基づいて、RNA配列の最適化に対してのみ意図されている。このように、以前に記載された方法は、合成遺伝子の配列が、RNAへの転写におけるDNAの役割にどのように影響するかに取り組まなかった。最も注目すべきには、転写因子が合成DNAとどのように相互作用し得、そして結果として遺伝子転写をどのように調節し得るか、またはさもなければどのように影響し得るかについて、考慮されなかった。天然に見出される遺伝子について、そのDNAは、ネイティブな宿主細胞によって最適に転写され、そしてRNAを生成し、このRNAが、適切にフォールディングされる遺伝子産物をコードする。対照的に、合成遺伝子は、以前に、転写特性について最適化されなかった。むしろ、この特性は、無視されていたか、または成り行きに任されていた。
【0083】
この問題は、全ての遺伝子について重要であるが、実験宿主細胞における転写挙動を定量化するために最も一般的に使用されるレポーター遺伝子について、特に重要である。何百もの転写因子が、異なる生理学的条件下の異なる細胞型において同定されているが、おそらくより多くの存在が、依然同定されていない。これらの転写因子の全ては、導入された遺伝子の転写に影響を及ぼし得る。本発明の有用な合成レポーター遺伝子は、その遺伝子の構造が変更されているので、宿主細胞の内因性の転写特性に影響を及ぼすかまたは混乱させる最小の危険性を有する。特に有用な合成レポーター遺伝子は、新しいセットの実験条件下および/または広範な種々の実験条件下で所望の特性を有する。これらの特性を最良に達成するために、合成遺伝子の構造は、広範囲の宿主細胞内および生理学的条件下で転写因子と相互作用する最小の可能性を有するべきである。レポーター遺伝子と宿主細胞の内因性転写因子との間の潜在的な相互作用を最小化することは、特定の実験下での遺伝子の不適切な転写特性の危険性を減少し、種々の環境下での遺伝子の適応性を増加し、そして得られる実験データの容認を増加することによって、レポーター遺伝子の価値を増加する。
【0084】
対照的に、元の宿主生物由来のゲノムクローンまたはcDNAクローンに基づく、ネイティブヌクレオチド配列を含むレポーター遺伝子は、外因性宿主において発現された場合に、転写因子と相互作用し得る。この危険性は、2つの状況から生じる。第1に、ネイティブヌクレオチド配列は、ネイティブ宿主生物内での遺伝子の転写に影響を及ぼすように自然淘汰を介して最適化された配列を含む。しかし、これらの配列はまた、その遺伝子が外因性宿主中で発現された場合にも、転写に影響を及ぼし得(すなわち、無関係に)、従って、レポーター遺伝子としてのその能力を干渉する。第2に、そのヌクレオチド配列は、ネイティブ宿主生物中に存在せず、そして従って、その自然淘汰に関与しなかった転写因子と、不用意に相互作用し得る。このような不用意な相互作用の可能性は、レポーター遺伝子の実験細胞とネイティブ生物との間の進化の距離が大きいほど増加する。
【0085】
転写因子とのこれらの潜在的相互作用は、コドン使用頻度における改変を有する合成レポーター遺伝子を使用する場合に、おそらく破壊される。しかし、コドン使用頻度のみに基づいてコドンを選択することによって設計された合成レポーター遺伝子配列は、他の意図されない転写因子結合部位を含む可能性がある。なぜなら、合成遺伝子は、不適切な転写活性を矯正するように自然淘汰の利益を受けていないからである。転写因子との不用意な相互作用はまた、コードされるアミノ酸配列が人為的に変更される場合(例えば、アミノ酸置換を導入するために)にいつも生じ得る。同様に、これらの変化は、自然淘汰に供されておらず、従って、所望でない特性を示し得る。
【0086】
従って、本発明は、合成核酸配列を調製するための方法を提供し、この合成配列は、特定の宿主細胞において発現された場合に、転写因子とのその核酸の所望でない相互作用の危険性を減少し、それによって、不適切な転写特性または意図されない転写特性を減少する。好ましくは、この方法は、特定の宿主細胞についての改善されたコドン使用頻度を含み、かつ転写因子結合部位の出現が減少された、合成遺伝子を生じる。本発明はまた、転写因子結合部位の出現が減少され、かつさらなる有利な構造特性を有する、改善されたコドン使用頻度を含む合成遺伝子を調製する方法を提供する。このようなさらなる特性としては、不適切なRNAスプライシング接合部、ポリ(A)付加シグナル、所望でない制限部位、リボソーム結合部位および二次構造モチーフ(例えば、ヘアピンループ)の非存在が挙げられる。
【0087】
同じタンパク質または非常に類似するタンパク質(「コドン相違」バージョン)をコードする、2つの合成遺伝子を調製する方法もまた提供される。好ましくは、この2つの合成遺伝子は、共通のポリヌクレオチドプローブ配列にハイブリダイズする能力が減少されているか、または生存細胞に一緒に存在する場合に組み換わる危険性が減少されている。組換えを検出するために、隣接配列に相補的なプライマーを使用するレポーター配列のPCR増幅、およびその増幅された配列の配列決定が、使用され得る。
【0088】
本発明の合成核酸分子についてのコドンを選択するために、好ましいコドンは、選択された宿主細胞において相対的に高いコドン使用頻度を有し、そしてそれらの導入は、相対的に少ない転写因子結合部位の導入、相対的に少ない他の所望でない構造特性の導入、および必要に応じて、非常に類似するタンパク質をコードする別の遺伝子とその合成遺伝子とを識別する特徴の導入を生じる。従って、本発明の方法によって得られる合成核酸産物は、改善されたコドン使用頻度に起因する発現レベルの改善、所望でない転写調節配列の数の減少に起因する不適切な転写挙動の危険性の減少、および必要に応じて、合成配列を選択するために使用され得る他の基準に起因する任意のさらなる特性を有する、合成遺伝子である。
【0089】
本発明は、任意の核酸配列(例えば、ネイティブ配列(例えば、cDNA)またはインビトロで操作された配列)を使用して、例えば、特定の変更(例えば、制限酵素認識部位の導入または除去、異なるアミノ酸をコードするかまたは融合タンパク質をコードするようなコドン変更)を導入し得るか、または核酸分子のGCまたはAT含量(組成%)を変更し得る。さらに、本発明の方法は、任意の遺伝子に有用であるが、特に、レポーター遺伝子ならびにレポーター遺伝子の発現に関連する他の遺伝子(例えば、選択マーカー)に有用である。好ましい遺伝子としては、ラクタマーゼ(β−gal)、ネオマイシン耐性(Neo)、CAT、GUS、ガラクトピラノシド、GFP、キシロシダーゼ、チミジンキナーゼ、アラビノシダーゼなどをコードする遺伝子が挙げられるが、これらに限定されない。本明細書中で使用される場合、「マーカー遺伝子」または「レポーター遺伝子」は、その遺伝子を発現する細胞に別の表現型を付与し、そしてその遺伝子を有する細胞がその遺伝子を有さない細胞と識別されるのを可能にする遺伝子である。このような遺伝子は、選択マーカーまたはスクリーニングマーカーのいずれかをコードし得、これは、そのマーカーが、化学的手段によって(すなわち、選択薬剤(例えば、除草剤、抗生物質など)の使用によって)「選択」し得る形質を付与するか否か、またはそのマーカーが、観察もしくは試験を介して(すなわち、「スクリーニング」によって)同定し得る、単なる「レポーター」形質であるか否かに依存する。本開示のエレメントは、特定のマーカー遺伝子の使用を介して詳細に例示される。もちろん、適切なマーカー遺伝子またはレポーター遺伝子の多くの例が、当該分野で公知であり、そして本発明の実施において使用され得る。従って、以下の議論は、網羅的ではなく例示的であることが理解される。本明細書中に開示される技術および当該分野で公知の一般的な組換え技術を考慮して、本発明は、任意の遺伝子の変更を可能にする。
【0090】
例示的なマーカー遺伝子としては、neo遺伝子、β−gal遺伝子、gus遺伝子、cat遺伝子、gpt遺伝子、hyg遺伝子、hisD遺伝子、ble遺伝子、mprt遺伝子、bar遺伝子、ニトリラーゼ遺伝子、変異体アセトラクテートシンターゼ遺伝子(ALS)またはアセト酸(acetoacid)シンターゼ遺伝子(AAS)、メトトレキサート耐性dhfr遺伝子、デラポン(delapon)デハロゲナーゼ遺伝子、変異されたアントラニレートシンターゼ遺伝子(これは、5−メチルトリプトファンに対する耐性を付与する)(WO97/26366)、R遺伝子座遺伝子、β−ラクタマーゼ遺伝子、xylE遺伝子、α−アミラーゼ遺伝子、チロシナーゼ遺伝子、ルシフェラーゼ(luc)遺伝子(例えば、Renilla reniformisルシフェラーゼ遺伝子、ホタルルシフェラーゼ遺伝子、またはコメツキムシルシフェラーゼ(Pyrophorus plagiophthalamus)遺伝子)、エクオリン遺伝子、またはグリーン蛍光タンパク質遺伝子が挙げられるが、これらに限定されない。用語、選択マーカー遺伝子またはスクリーニングマーカー遺伝子には、形質転換された細胞について同定または選択する手段として、その分泌が検出され得る、「分泌マーカー」をコードする遺伝子も含まれる。その例には、抗体相互作用によって同定され得る分泌抗原をコードするマーカー、またはその触媒活性によって検出され得る分泌酵素でさえ含まれる。分泌タンパク質は、多くのクラスに分類され、これらには、小さい拡散性のタンパク質(例えば、ELISAによって検出可能な)、および細胞膜に挿入または捕捉されるタンパク質が挙げられる。
【0091】
本発明の方法は、反復プロセス(しかし、これに限定されない)によって行われ得る。このプロセスは、特定の種におけるコドン使用頻度に基づいて、標的分子(例えば、ネイティブヌクレオチド配列)において各アミノ酸に対する好ましいコドンを割り当てる工程、好ましいコドンを有する核酸配列において潜在的な転写調節配列(例えば、転写因子結合部位)を同定する工程(例えば、このような結合部位のデータベースを使用して)、必要に応じて、他の所望でない配列を同定する工程、および所望でない転写因子結合部位または他の配列が存在する位置を代替的なコドン(すなわち、同じアミノ酸をコードする)で置換する工程を包含する。コドン相違バージョンについて、代替的な好ましいコドンが、各バージョンにおいて置換される。必要な場合、潜在的な転写因子配列または他の所望でない配列の同定および除去は、ヌクレオチド配列が、最大数の好ましいコドンを含み、そして最小数の所望でない配列(転写調節配列または他の所望でない配列を含む)を含むことが達成されるまで、繰り返され得る。また、必要に応じて、所望の配列(例えば、制限酵素認識部位)が、導入され得る。合成核酸分子が設計および構築された後、その親核酸配列に対する特性が、当該分野で周知の方法によって決定され得る。例えば、特定の細胞における一連のベクター中の合成核酸分子および標的核酸分子の発現が、比較され得る。
【0092】
従って、一般に、本発明の方法は、標的核酸配列(例えば、ベクター骨格)、レポーター遺伝子または選択マーカー遺伝子、および目的の宿主細胞(例えば、植物(双子葉植物または単子葉植物)細胞、真菌細胞、酵母細胞または哺乳動物細胞)を同定する工程を包含する。好ましい宿主細胞は、哺乳動物宿主細胞(例えば、CHO細胞、COS細胞、293細胞、Hela細胞、CV−1細胞およびNIH3T3細胞)である。宿主細胞における好ましいコドン使用頻度、および必要に応じて、宿主細胞における低いコドン使用頻度(例えば、高い使用頻度の哺乳動物コドンならびに低い使用頻度のE.coliコドンおよび哺乳動物コドン)に基づいて、置き換えられるべきコドンが、決定される。2つの合成核酸分子のコドン相違バージョンについて、代替的な好ましいコドンが、各バージョンに導入される。従って、2より多いコドンを有するアミノ酸について、ある好ましいコドンが、あるバージョンに導入され、そして別の好ましいコドンが、他のバージョンに導入される。6つのコドンを有するアミノ酸について、最も多数の不対合塩基を有する2つのコドンが同定され、一方が、一方のバージョンに導入され、そして他方のコドンが、他方のバージョンに導入される。置き換えられるべきコドンの選択と同時に、その選択の後に、またはその選択の前に、標的配列における所望の配列および所望でない配列(例えば、所望でない転写調節配列)が、同定される。これらの配列は、EPD、NNPD、REBASE、TRANSFAC、TESS、GenePro、MAR(www.ncgr.org/MAR−search)およびBCM Gene Finder(本明細書中にさらに記載される)のようなデータベースおよびソフトウェアを使用して同定され得る。これらの配列が同定された後、改変が導入される。一旦、所望の合成核酸配列が得られると、それは、当該分野で周知の方法(例えば、重複プライマーを用いるPCR)によって調製され得、そして、その構造特性および機能特性(相同性%、特定の配列(例えば、制限部位)の存在または非存在、変化されたコドンの割合(例えば、特定のコドンの使用頻度の増加または減少)および発現率が挙げられるが、これらに限定されない)が、標的核酸配列と比較される。
【0093】
以下に記載されるように、この方法を使用して、Renilla reniformisルシフェラーゼをコードする合成レポーター遺伝子、および2つのコメツキムシルシフェラーゼ(一方は、緑色の光を放出し、もう一方は、赤色の光を放出する)をコードする合成レポーター遺伝子を作製した。両方の系について、これらの合成遺伝子は、そのタンパク質の対応するネイティブ遺伝子または親遺伝子よりも、はるかに高いレベルの発現を支持する。さらに、ネイティブ遺伝子および親遺伝子は、哺乳動物細胞において発現させた場合に、特異な転写特性を示し、これは、合成遺伝子では示されなかった。詳細には、ネイティブ遺伝子または親遺伝子の基礎発現は、比較的高い。さらに、その発現は、公知のプロモーターの非存在下でエンハンサー配列によって非常に高いレベルに誘導される。これらの合成遺伝子は、より低い基礎発現を示し、特異なエンハンサー挙動を示さない。おそらく、このエンハンサーは、合成遺伝子には存在しない、ネイティブ遺伝子において見出される転写エレメントを活性化している。これらの結果は、合成遺伝子核酸配列がレポーター遺伝子として優れた性能を示すことを、明らかに示す。
【0094】
(本発明の分子の例示的使用)
本発明の合成遺伝子は、好ましくは、それらのネイティブ対応物と同じ(または、ほとんど同じ)タンパク質をコードするが、改善されたコドン使用頻度を有し、コード領域における既知の転写調節エレメントが大きく欠失されている(少数のアミノ酸変化が、ネイティブの対応タンパク質の特性を増強するため(例えば、ルシフェラーゼの発光を増強するため)に所望され得ることが認識される)。これは、合成遺伝子がコードするタンパク質の発現レベルを増加し、そしてそのタンパク質の特異な発現の危険性を減少する。例えば、弱いプロモーターによって媒介され得る遺伝子調節の多くの重要な事象の研究は、レポータータンパク質の不適切な発現からの不十分なレポーターシグナルによって制限される。本明細書中に記載の合成ルシフェラーゼ遺伝子は、発現レベルの大きい増加(これが、検出感度の増加を可能にする)に起因して、弱いプロモーター活性の検出を可能にする。また、いくつかの選択マーカーの使用は、外因性細胞におけるそのマーカーの発現によって制限され得る。従って、細胞に対する改善されたコドン使用頻度を有し、そして他の所望でない配列(例えば、転写因子結合部位)が減少された合成選択マーカー遺伝子は、さもなければこれらのマーカーの宿主として望ましくなかった細胞における、これらのマーカーの使用を可能にし得る。
【0095】
プロモーターのクロストーク(crosstalk)は、共レポーター遺伝子を使用してトランスフェクション効率を正規化する場合の、別の問題点である。合成遺伝子の増強された発現によって、強力なプロモーターを含むDNAの量が減少され得るか、または弱いプロモーターを含むDNAを使用して、共レポーターの発現を駆動し得る。さらに、本発明の合成レポーター遺伝子からのバックグラウンド発現が、減少され得る。この特徴は、合成レポーター遺伝子からの散発性の発現を最小化し、そして他の調節経路から生じる干渉を減少することによって、合成レポーター遺伝子をより望ましくする。
【0096】
画像化システム(これは、インビボでの生物学的研究または薬物スクリーニングに使用され得る)におけるレポーター遺伝子の使用は、本発明の合成遺伝子についての別の用途である。これらの発現レベルの増加に起因して、合成遺伝子によってコードされるタンパク質は、画像化システムによってより容易に検出可能である。実際に、合成Renillaルシフェラーゼ遺伝子を使用して、トランスフェクトされたCHO細胞における発光は、計測器の補助なしで可視的に検出された。
【0097】
さらに、合成遺伝子は、融合タンパク質(例えば、分泌リーダー配列または細胞局在化配列を有する融合体)を発現させるため、トランスフェクトするのが困難な細胞(例えば、初代細胞)における転写を研究するため、および/または、調節経路および遺伝エレメントの分析を改善するために使用され得る。他の用途としては、以下が挙げられるが、これらに限定されない:極度の感度を必要とする稀少な事象の検出(例えば、RNA再コード化(recording)の研究)、IRESとの使用、インビトロ翻訳またはインビトロ転写−翻訳連結系(例えば、TNT(Promega Corp.,Madison,WI)の効率を改善するため、異なる宿主生物(例えば、植物、真菌など)に対して最適化されるレポーターの研究、薬物毒性をモニターするための共レポーターとしての複数の遺伝子の使用、マルチウェルアッセイにおけるレポーター分子として、および薬物スクリーニングにおけるレポーター分子(異なるシグナル伝達経路および他の調節機構によるレポーターシグナルの可能な干渉を最小化する利点を有する)として)。
【0098】
さらに、本発明の核酸分子の用途としては、以下が挙げられる:蛍光活性化細胞選別(FACS)、蛍光顕微鏡、インビトロおよびインビボでの遺伝子発現レベルを検出および/または測定するため(例えば、プロモーター強度の決定するため)、細胞内局在化または標的化(融合タンパク質)、マーカーとして、較正において、キットにおいて(例えば、二重(dual)アッセイのため)、インビボ画像化のため、調節経路および遺伝エレメントを分析するため、およびマルチウェル形式において)。
【0099】
ルシフェラーゼをコードする合成DNAについて、合成コメツキムシルシフェラーゼの使用は、二重レポーターの測定のような利点を提供する。Renillaルシフェラーゼは、インビボ画像化により適切であるので(なぜなら、これは、ホタルルシフェラーゼと異なり、反応のためにATPにもMg2+にも依存しないからであり、そしてセレンテラジンは、ルシフェリンよりも細胞膜により透過性であるからである)、合成Renillaルシフェラーゼ遺伝子は、インビボで使用され得る。さらに、合成Renillaルシフェラーゼは、例えば、生物学的分析のため、または薬物スクリーニングプラットフォームにおける、二重ルシフェラーゼアッセイにおける改善された忠実度および感度を有する。
【0100】
(ルシフェラーゼ遺伝子を使用する本発明の実証)
コメツキムシルシフェラーゼおよびRenillaルシフェラーゼのレポーター遺伝子を使用して、本発明を実証した。なぜなら、これらがコードするタンパク質によって触媒される反応は、ほとんどの遺伝子の産物よりも、定量することが有意に容易であるからである。しかし、本発明を実証する目的のために、これらは、一般的な遺伝子を代表する。
【0101】
コメツキムシルシフェラーゼ遺伝子およびRenillaルシフェラーゼ遺伝子は、「ルシフェラーゼ」という名前を共有するが、これは、これらが、同じ遺伝子ファミリーを起源とすることを意味すると解釈されるべきではない。これらの2つのルシフェラーゼタンパク質は、進化的に異なり;これらは、本質的に異なる形質および物理的構造を有し、これらは、広範に異なる基質を使用し(図17)、そしてこれらは、完全に異なる遺伝子ファミリーから進化した。コメツキムシルシフェラーゼは、61kDのサイズであり、ルシフェリンを基質として使用し、そしてCoAシンテターゼから進化した。Renillaルシフェラーゼは、ウミシイタケRenilla Reniformisを起源とし、これは、35kDのサイズであり、基質としてセレンテラジンを使用して、そしてαβヒドロラーゼから進化した。これらの2つの酵素の唯一の共有される形質は、これらが触媒する反応が、光の放出を生じることである。これらは、任意の他の2つの酵素が、例えば、単に、それらが触媒する反応が熱を生じるので類似であるというのと同様に、光の放出を生じることについて類似しない。
【0102】
生物発光は、ルシフェラーゼ媒介酸化反応の結果として特定の生物において生成される光である。ルシフェラーゼ遺伝子(例えば、発光性の甲虫、ウミシイタケ由来の遺伝子、および、特に、Photinus pyralis(北米の一般的なホタル)由来のルシフェラーゼ)は、現在最もポピュラーな発光レポーター遺伝子である。発光レポーター遺伝子アッセイの総説については、Bronsteinら(1994)に、そして甲虫の生物発光の進化の総説については、Wood(1995)に、言及されている。ホタルおよびコメツキムシのルシフェラーゼ(17A)およびRenillaルシフェラーゼ(17B)の各々によって触媒される反応の例示については、図17を参照のこと。
【0103】
ホタルルシフェラーゼおよびRenillaルシフェラーゼは、発光アッセイの簡便性、感度および直線範囲に起因して、遺伝子レポーターとして非常に価値がある。今日、ルシフェラーゼは、実質的に全てのタイプの実験生物系(原核生物および真核生物の細胞培養物、トランスジェニック植物および動物、ならびに無細胞発現系が挙げられるが、これらに限定されない)において使用される。ホタルルシフェラーゼ酵素は、特定の北米の甲虫Photinus pyralisに由来する。ホタルルシフェラーゼ酵素およびコメツキムシルシフェラーゼ酵素は、モノマータンパク質(61kDa)であり、これは、ATPおよびO2を使用する甲虫ルシフェリンの一酸素原子付加を介して、光を生成する(図17A)。Renillaルシフェラーゼは、ウミシイタケRenilla reniformisに由来する。Renillaルシフェラーゼ酵素は、36kDaのモノマータンパク質であり、これは、O2およびセレンテラジンを利用して光を生じる(図17B)。
【0104】
ホタルルシフェラーゼをコードする遺伝子は、Photinus pyralisからクローニングされ、そしてE.coliにおいて活性な酵素を生成することが実証されている(de Wetら、1987)。ホタルルシフェラーゼをコードするcDNA(luc)は、動物細胞、植物細胞および微生物細胞において遺伝子活性をレポートするための選り抜きの遺伝子として支持を獲得し続けている。ホタルルシフェラーゼ反応(CoAの付加によって修飾され、持続的な光の放出を生じる)は、トランスフェクトされた細胞または組織の小さいサンプル中のホタルルシフェラーゼ発現を定量するための、極めて高感度かつ迅速なインビトロアッセイを提供する。
【0105】
遺伝子レポーターとしてホタルルシフェラーゼまたはコメツキムシルシフェラーゼを使用するために、ルシフェラーゼを発現する細胞の抽出物を基質(甲虫ルシフェリン、Mg2+、ATPおよびO2)と混合し、そして発光を即座に測定する。アッセイは、非常に迅速かつ高感度であり、ほとんど労力なく遺伝子発現データを提供する。従来のホタルルシフェラーゼアッセイは、そのアッセイ試薬に補酵素Aを含めて、より高い酵素ターンオーバーおよびより大きい発光強度を生じることによって、さらに改善された(Promega Luciferase Assay Reagent、カタログ番号E1500、Promega Corporation、Madison、Wis.)。この試薬を使用して、ルシフェラーゼ活性は、ルミノメーターまたはシンチレーションカウンターにおいて容易に測定され得る。ホタルルシフェラーゼ活性およびコメツキムシルシフェラーゼ活性はまた、増殖培地にルシフェリンを添加することによって、培養物中の生存細胞において検出され得る。このインサイチュ発光は、甲虫ルシフェリンが細胞膜およびペルオキシソーム膜を通って拡散する能力、ならびにサイトゾルおよびペルオキシソームにおけるATPおよびO2の細胞内利用能に依存する。
【0106】
さらに、レポーター遺伝子は、転写事象を測定するために広範に使用されるが、それらの有用性は、レポーター発現の忠実度および効率によって制限され得る。例えば、米国特許第5,670,356号において、ホタルルシフェラーゼ遺伝子(luc+と呼ばれる)は、ルシフェラーゼ発現のレベルを改善するように改変された。より高いレベルの発現が観察されたが、より高い発現が調節の制御を改善することは決定されなかった。
【0107】
本発明を、以下の非限定的な実施例によってさらに説明する。
【0108】
(実施例1)
(合成コメツキムシ(RDおよびGR)ルシフェラーゼ核酸分子)
LucPplYGは、黄色−緑色の発光を放出する、野生型コメツキムシルシフェラーゼである(Wood、1989)。YG#81−6G01と名付けられたLucPplYGの変異体を想定した。YG#81−6G01は、ペルオキシソーム標的化シグナルを欠き、ルシフェリンおよびATPに対する低いKMを有し、野生型と比較した場合に、シグナル安定性の増加および温度安定性の増加を有する(PCT/WO9914336)。YG#81−6G01を、第224位のAlaをValに変化させること(A224Vは、緑色シフト化変異である)によって緑色の発光を放出するように変異させたか、またはアミノ酸置換A224H、S247H、N346IおよびH348Q(赤色シフト化変異セット)を同時に導入することによって赤色の発光を放出するように変異させた(PCT/WO9518853)。
【0109】
YG#81−6G01を親遺伝子として使用して、2つの合成遺伝子配列を設計した。1つは、緑色発光(GR)を放出するルシフェラーゼをコードし、1つは、赤色発光(RD)を放出するルシフェラーゼをコードする。両方の遺伝子を、1)哺乳動物細胞における発現のために最適化されたコドン使用頻度を有するように;2)転写調節部位(哺乳動物転写因子結合部位、スプライス部位、ポリ(A)付加部位、およびプロモーター、ならびに原核生物(E.coli)調節部位を含む)の数を減少するように;3)所望でない制限部位(例えば、標準的なクローニング手順を妨げる可能性のある制限部位)を欠失するように;および4)両方が同じ細胞内に存在する場合に遺伝子再編成を最小化するために、互いに比較して低いDNA配列同一性を有するように、設計した。さらに、所望の配列(例えば、Kozak配列または制限酵素認識部位)を、同定および導入し得る。
【0110】
全ての設計基準が、同時に上手く等しく達成され得るわけではない。以下の優先度を、転写調節部位の減少について確立した:最も高い優先度を、転写因子(TF)結合部位の除去に与え、次いで、スプライス部位およびポリ(A)付加部位の除去に与え、そして最後に、原核生物調節部位の除去に与えた。調節部位を除去する場合、ストラテジーは、最も重要な変化が最後に生じるのを確実にするように、より低い重要な変化から最も高い重要な変化へと研究することであった。次いで、配列を、新しいより低い優先度の部位の出現について再確認し、必要な場合、さらなる変化を施した。従って、本明細書中に記載されるコンピュータープログラムを使用する、合成GR遺伝子配列およびRD遺伝子配列を設計するためのプロセスは、以下に詳述する5つの必要に応じて繰り返される工程を含んだ。
1.コドン使用頻度を最適化し、そしてA224Vの変化を与えて、GRver1を作製し、また別に、A224H、S247H、N346IおよびH348Qの変化を与えて、RDver1を作製した。これらの特定のアミノ酸変化は、配列に対する以後の全ての操作を通して維持された。
2.所望でない制限部位、原核生物調節部位、スプライス部位、ポリ(A)部位を除去し、それによって、GRver2およびRDver2を作製した。
3.転写因子結合部位を除去し(1回目の処理)、そして任意の新しく作製された所望でない部位(上記工程2に列挙されるような)を除去し、それによって、GRver3およびRDver3を作製した。
4.上記工程3によって作製された転写因子結合部位を除去し(2回目の処理)、そして任意の新しく作製された所望でない部位(上記工程2に列挙されるような)を除去し、それによって、GRver4およびRDver4を作製した。
5.上記工程4によって作製された転写因子結合部位を除去し(3回目の処理)、そして上記工程2に列挙される部位の非存在を確認し、それによって、GRver5およびRDver5を作製した。
6.GRver5およびRDver5の設計された配列のフラグメントに対応する合成オリゴヌクレオチド(図6および10)を使用するPCRによって、実際の遺伝子を構築し、それによって、GR6およびRD7を作製した。GR6は、配列決定において、アミノ酸第49位のセリン残基がアスパラギンに変異され、そしてアミノ酸第230位のプロリンがセリンに変異されている(S49N、P230S)ことが見出された。RD7は、配列決定において、アミノ酸第36位のヒスチジンがチロシンに変異されていること(H36Y)が見出された。これらの変化は、PCRプロセス中に生じた。
7.上記工程6に記載される変異(GR6についてS49N、P230S、およびRD7についてH36Y)を戻して、GRver5.1およびRDver5.1を作製した。
8.RDver5.1を、第351位のアルギニンコドンをグリシンコドンに変化させること(R351G)によってさらに改変し、それによって、RDver5.1と比較して改善されたスペクトル特性を有するRDver5.2を作製した。
9.RDver5.2を、発光強度を増加するようにさらに変異させ、それによって、RD156−1H9を作製した。これは、4つのさらなるアミノ酸変化(M2I、S349T、K488T、E538V)および3つのサイレントな単一の塩基変化をコードする(配列番号18)。
【0111】
(1.コドン使用頻度を最適化し、そして発光色を決定する変異を導入する)
この設計工程についての開始遺伝子配列は、YG#81−6G01(配列番号2)であった。
【0112】
a)コドン使用頻度を最適化する:
このストラテジーは、ヒト細胞における最適な発現のためのコドン使用頻度を適用すること、および同時に、E.coliの低い使用頻度のコドンを回避することである。これらの要件に基づいて、2より多いコドンを有する全てのアミノ酸について、ヒト細胞における発現に最良の2つのコドンを選択した(Wadaら、1990を参照のこと)。6つのコドンを有するアミノ酸についてのコドン対の選択において、その選択を、以下の最も多い不対合塩基数を有する対へ偏らせ、最小の配列同一性を有するGR遺伝子およびRD遺伝子の設計を行った(コドン相違):
Arg:CGC/CGT Leu:CTG/TTG Ser:TCT/AGC
Thr:ACC/ACT Pro:CCA/CCT Ala:GCC/GCT
Gly:GGC/GGT Val:GTC/GTG Ile:ATC/ATT
このコドン選択に基づいて、YG#81−6G01ルシフェラーゼタンパク質配列をコードする2つの遺伝子配列を、コンピューターで作成した。この2つの遺伝子を、最小のDNA配列同一性、および同時に、密接に類似するコドン使用頻度を有するように設計した。これを達成するために、この2つの遺伝子における各コドンを、代替的な様式(例えば、Arg(n)は、遺伝子1においてCGCであり、遺伝子2においてCGTであり、そしてArg(n+1)は、遺伝子1においてCGTであり、そして遺伝子2においてCGCである)で、上記の限定されたリストからのコドンによって置き換えた。
【0113】
この設計プロセスにおける後の工程について、変化が、他の設計基準を満たすために、この限定された最適なコドン選択に対して成されるべきであることが予測されたが、哺乳動物細胞における低い使用頻度の以下のコドンは、より高い優先度の基準を満たすために必要でない限り、使用しなかった:
Arg:CGA Leu:CTA Ser:TCG
Pro:CCG Val:GTA Ile:ATA
また、E.coliにおける低い使用頻度の以下のコドンを、妥当である場合に、回避した(これらのうちの3つが哺乳動物細胞についての低い使用頻度のリストに適合することに留意する):
Arg:CGA/CGG/AGA/AGG
Leu:CTA Pro:CCC Ile:ATA。
【0114】
(b)ルミネッセンス色を決定する変異を導入する)
上記のように、2つのコドンを最適化したこの遺伝子配列のうちの一方に、1つの緑色シフト変異を導入し、もう一方に、4つの赤色シフト変異を導入した。
【0115】
この最初の設計工程からの2つの出力(output)配列を、GRver1(バージョン1 GR)およびRDver1(バージョン1 RD)と名付けた。これらのDNA配列は、63%同一である(594個のミスマッチ)が、これらのDNA配列がコードするタンパク質は、ルミネッセンス色を決定する4つのアミノ酸だけが異なる(DNA配列およびタンパク質配列のアラインメントについて、図2および図3を参照のこと)。
【0116】
表1および表2は、例として、ヒト遺伝子、親遺伝子YG#81−6G01、コドンを最適化した合成遺伝子GRver1およびRDver1、ならびに設計プロセス中工程5が完了した後の最終バージョンの合成遺伝子(GRver5およびRDver5)における、バリンおよびロイシンについてのコドン使用頻度を示す。コドン変化の完全な要約について、図4および5を参照のこと。
【0117】
【表1】
【0118】
【表2】
(2.下線を付した制限部位、原核生物調節部位、スプライス部位、およびポリ(A)付加部位を除去する)
この設計工程のための開始遺伝子配列は、GRver1およびRDver1であった。
【0119】
(a)下線を付した制限部位を除去する)
下線を付した制限部位の存在および位置を確認するために、両方の合成遺伝子の配列を、標準的な配列分析ソフトウェア(GenePro ver6.10、Riverside Scientific Ent.)を使用して、制限酵素認識配列のデータベース(REBASE ver.712、http://www.neb.com/rebase)に対して比較した。具体的には、以下の制限酵素を、望ましくないものとして分類した:
−BamH I、Xho I、Sfi I、Kpn I、Sac I、Mlu I、Nhe I、Sma I、Xho I、Bgl II、Hind III、Nco I、Nar I、Xba I、Hpa I、Sal I、
−一般的に使用される他のクローニング部位:EcoR I、EcoR V、Cla I、
−(複合構築物のために一般的に使用される)8塩基カッター、
−(N末端融合物を可能にする)BstE II、
−(T−ベクタークローニングのために使用されるA/T突出を生成し得る)Xcm I。
【0120】
合成遺伝子中に見出される望ましくない制限部位を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化の指針に従って変更した。
【0121】
(b)原核生物(E.coli)調節配列を除去する)
原核生物調節配列の存在および位置を確認するために、標準的配列分析ソフトウェア(GenePro)を使用して、両方の合成遺伝子の配列を、以下のコンセンサス配列の存在について検索した:
−TATAAT(プロモーターの−10プリブノウボックス)
−AGGAまたはGGAG(リボソーム結合部位;下流12塩基以内にあるメチオニンコドンと対合した場合にのみ、考慮される)。
【0122】
合成遺伝子において見出された場合に、このような調節配列を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化指針に従って変更した。
【0123】
(c)スプライシング部位を除去する)
スプライシング部位の存在および位置を確認するために、標準的配列分析ソフトウェア(GenePro)を使用して、各合成遺伝子の一次RNA転写物に対応するDNA鎖を、以下のコンセンサス配列(Watsonら、1983を参照のこと)の存在について検索した:
−スプライシングドナー配列:AG|GTRAGT(エキソン|イントロン)。
この検索は、AGGTRAGについて実施し、そしてより低いストリンジェンシーでGGTRAGTについて実施した;
−スプライシングアクセプター部位:(Y)nNCAG|G(イントロン|エキソン)。この検索は、n=1を用いて実施した。
合成遺伝子において見出されるスプライシング部位を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化の指針に従って変更した。一方の遺伝子におけるスプライシングアクセプター部位は、一般的に、他方の遺伝子にその部位を導入することなく除去するのが困難であった。なぜなら、そのスプライシングアクセプター部位は、2つのGlnコドン(CAG)のうちの1つを含む傾向があったからである。そのスプライシングアクセプター部位を、その2つの遺伝子間のわずかに増加した配列同一性を犠牲にして、両方の遺伝子中のGlnコドンをCAAで置換することによって除去した。
【0124】
(d)ポリ(A)付加部位を除去する)
ポリ(A)付加部位の存在および位置を確認するために、両方の合成遺伝子の配列を、標準的な配列分析ソフトウェア(GenePro)を使用して、以下のコンセンサス配列の存在について検索した:−AATAAA。合成遺伝子中に見出される各ポリ(A)付加部位を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化の指針に従って変更した。この第2の設計工程からの2つの出力(output)配列を、GRver2およびRDver2と名付けた。これらのDNA配列は、63%同一(590個のミスマッチ)である(図2および図3)。
【0125】
(3.転写因子(TF)結合部位を除去し、その後、工程2a〜2dを反復する)
この設計工程のための開始遺伝子配列は、GRver2およびRDver2であった。
【0126】
潜在的TF結合部位の存在、位置および正体を確認するために、両方の合成遺伝子の配列を、転写因子結合部位のデータベース(TRANSFAC v3.2)を検索するための問合せ配列として使用した。このTRANSFACデータベース(http://transfac.gbf.de/TRANSFAC/index:html)は、遺伝子調節DNA配列(TF結合部位)およびその配列に結合しかつその配列を介して作用するタンパク質(TF)に関する情報を、保有する。TRANSFAC Release 3.2のSITE表は、4,401件の個々の(推定)TF結合部位(真核生物遺伝子中のTF結合部位、変異誘発研究と無作為オリゴヌクレオチド混合物または特定の理論的要因に基づくインビトロ選択手順とから生じる人工配列中のTF結合部位、および(FaisstおよびMeyer、1992からの)コンセンサス結合配列を含む)を含む。
【0127】
これらの合成遺伝子配列中のこれらのTF結合部位を位置決めおよび提示するために使用されるソフトウェアツールは、TESS(Transcription Element Search Software、http://agave.humgen.upenn.edu/tess/index.html)であった。フィルターを通した文字列に基づく検索オプションを、以下のユーザー定義検索パラメーターとともに使用した:−Factor Selection Attribute:Organism Classification
−Search Pattern:Mammalia
−Max.Allowable Mismatch %:0
−Min.element length:5
−Min.log−likelihood:10。
このパラメーター選択は、少なくとも5塩基長の哺乳動物TF結合部位(このデータベース中の4,401件のうち約1,400件)のみがこの検索に含まれることを、特定する。このパラメーター選択はさらに、その問合せ配列における完全一致と最小対数尤度(LLH)スコア10とを有するTF結合部位のみが、報告されることを、特定する。このLLHスコア付け法は、2を非曖昧(unambiguous)一致に、1を部分的曖昧(partially ambiguous)一致(例えば、AまたはTがWに一致する)に、そして0を「N」に対する一致に割り当てる。例えば、上記に特定されるパラメーターを用いた検索は、TATAA(配列番号240)(LLH=10)、STRATG(配列番号241)(LLH=10)、およびMTTNCNNMA(配列番号242)(LLH=10)について「ヒット」(陽性の結果または一致)であるがTRATG(配列番号243)(LLH=9)について「ヒット」でない、「ヒット」を、これらの4つのTF結合部位がその問合せ配列中に存在する場合に、生じる。その検索パラメーターを再評価するために、より低いストリンジェンシーでの試験を、この設計プロセスの最後に実施した。
【0128】
既知のTF結合部位を含むモック(mock)問合せ配列を用いてTESSを試験した場合、このプログラムは、その問合せ配列の3’末端で終わる部位に対する一致を報告することができないことが、見出された。従って、この問題を排除するために、すべての問合せ配列の3’末端に、余分なヌクレオチドを付加した。
【0129】
上記のパラメーターを使用するTF結合部位についての最初の検索により、2つの合成遺伝子(GRver2およびRDver2)の各々について、約100個の転写因子結合部位(ヒット)が見出された。上記1aに記載されたコドン最適化の指針に従ってその合成遺伝子配列の1つ以上のコドンを変化させることによって、すべての部位を除去した。しかし、いくつかのこれらの変化が、新規なTF結合部位、他の調節配列、および新規な制限部位を生じることが、予期された。従って、工程2a〜2dを記載されるように反復し、そして4つの新規な制限部位および2つの新規なスプライス部位を除去した。この第3の設計工程から生じた2つの出力(output)配列を、GRver3およびRDver3と名付けた。これらのDNA配列は、66%同一(541個のミスマッチ)である(図2および3)。
【0130】
(4.新規な転写因子(TF)結合部位を除去し、その後、工程2a〜2dを反復する)
この設計工程のための開始遺伝子配列は、GRver3およびRDver3であった。
【0131】
この第4の工程は、工程3に記載されるプロセスの繰返しである。新たに導入されたTF結合部位についての検索により、この2つの合成遺伝子の各々について約50ヒットを得た。上記1aに記載されるコドン最適化の指針にほぼ従って、これらの合成遺伝子配列の1つ以上のコドンを変更することによって、すべての部位を除去した。しかし、より高コドン使用頻度〜中程度のコドン使用頻度を使用して、すべてのTF結合部位の除去が可能となった。GR遺伝子とRD遺伝子との間の低い配列同一性を維持することの優先度が、最も低かった。その後、工程2a〜2dを、記載される通り反復した。この第4の設計工程からの2つの出力(output)配列を、GRver4およびRDver4と名付けた。これらのDNA配列は、68%同一(506個のミスマッチ)である(図2および3)。
【0132】
(5.新規な転写因子(TF)結合部位を除去し、その後、工程2a〜2dを反復する)
この設計工程のための開始遺伝子配列は、GRver4およびRDver4であった。
【0133】
この第5の工程は、上記工程3に記載されるプロセスの別の繰返しである。工程4において導入された新規なTF結合部位についての検索により、この2つの合成遺伝子の各々について約20個のヒットを得た。上記1aに記載されるコドン最適化の指針にほぼ従ってこれらの合成遺伝子配列の1つ以上のコドンを変更することによって、すべての部位を除去した。しかし、より高使用頻度〜中程度の使用頻度を使用して(これらは、すべて「好ましい」と見なされる)、すべてのTF結合部位の除去が可能となった。GR遺伝子とRD遺伝子との間の低い配列同一性を維持することが、優先度が最も低かった。その後、工程2a〜2dを、記載されるように反復した。1つのアクセプタースプライス部位だけが、除去され得なかった。最終工程として、工程3にて特定した両方の遺伝子中のすべてのTF結合部位が存在しないことを、確認した。この第5および最後の設計工程からの2つの出力(output)配列を、GRver5およびRDver5と名付けた。これらのDNA配列は、69%同一(504個のミスマッチ)である(図2および図3)。
【0134】
(GRver5およびRDver5のさらなる進化)
(a)より低ストリンジェンシーのパラメーターをTESSに使用する)
TF結合部位についての検索を、上記工程3に記載されるように反復したが、さらに低ストリンジェントなユーザー定義パラメーターを用いた:
−LLHを10の代わりに9に設定すると、新しいヒットを生じなかった;
−LLHを0〜8(両端を含む)に設定すると、2つのさらなる部位MAMAG(22ヒット)およびCTKTK(24ヒット)についてのヒットを生じた;
−LLHを8にそして最小エレメント長を4に設定すると、この検索により、AP−1、NF−1、およびc−Mybについての異なる4塩基部位を(上記の2つの部位に加えて)得た。これらの部位は、より長い各コンセンサス部位の短縮バージョンであり、これらの部位を、上記工程3〜5で除去した。
新たな部位を導入することなくこれらの部位を完全に除去することを試みることは現実的ではなく、従って、さらなる変化を作製しなかった。
【0135】
(b)異なるデータベースを検索する)
Eukaryotic Promoter Database(リリース45)は、真核生物遺伝子の信頼できるようにマッピングされた転写開始部位(1253個の配列)についての情報を含む。このデータベースを、National Center for Biotechnology Informationサイト(http://www.ncbi.nlm.nih.gov/cgi−bin/BLAST)において、(ほぼ同一の配列を迅速に発見するように最適化した)デフォルトパラメーター(Altschulら、1990を参照のこと)とともにBLASTN 1.4.11を使用して、検索した。このアプローチを試験するために、SV40プロモーターとエンハンサーとを含むpGL3−Controlベクター配列の一部を、問合せ配列として使用し、SV40配列に対する予期されたヒットを得た。上記の2つの合成遺伝子を問合せ配列として使用した場合、ヒットは見出されなかった。
【0136】
(GRver5合成遺伝子特性およびRDver5合成遺伝子特性の要約)
両方の遺伝子(この段階で、これらはなお、コンピューターにおける単なる「仮想」配列である)は、哺乳動物の高使用頻度コドンを強く支持しかつ哺乳動物およびE.coliの低使用頻度コドンを最小にする、コドン使用頻度を有する。図4は、親遺伝子のコドン使用頻度と種々の合成遺伝子バージョンの要約を示す。
【0137】
両方の遺伝子はまた、4つより多くの非曖昧(unambiguous)塩基からなる真核生物TF結合部位、ドナースプライス部位およびアクセプター部位(1つの例外:GRver5は、1つのスプライスアクセプター部位を含む)、ポリ(A)付加部位、特定の原核生物(E.coli)調節配列、および望ましくない制限部位を完全に欠く。
【0138】
GRver5とRDver5との間の遺伝子配列同一性は、たった69%(504個のミスマッチ)であるが、一方、それにコードされるタンパク質は、99%同一(4つのアミノ酸ミスマッチ)である。図2および3を参照のこと。親配列YG#81−6G01とこれらとの同一性は、74%(GRver5)および73%(RDver5)である。図2を参照のこと。これらの塩基組成は、親YG#81−6G01についての40.2%GCに対して、49.9%GC(GRver5)および49.5%GC(RDver5)である。
【0139】
(合成遺伝子の構築)
これらの2つの合成遺伝子は、熱サイクラーにおいて合成オリゴヌクレオチドからアセンブルした後、全長遺伝子をPCR増幅することによって(Stemmerら(1995)Gene.164、pp.49〜53と同様に)、構築した。合成遺伝子の設計目的を妨げる意図せぬ変異は、修正した。
【0140】
(a)合成オリゴヌクレオチドの設計)
これらの合成オリゴヌクレオチドは、主に40マーであり、これらは集合として、各設計遺伝子(1,626bp)の完全鎖およびクローニングに必要な隣接領域の両方をコードする(各遺伝子について合計1,950bp;図6)。1つの鎖を特定するすべてのオリゴヌクレオチドの5’境界および3’境界を、一般的には、向かい側の鎖を特定するオリゴヌクレオチドの境界に対して平均20塩基のずれ/重なりを生じる様式で、配置した。
【0141】
両方の遺伝子の隣接領域の末端は、増幅プライマー(pRAMtailup:5’−gtactgagacgacgccagcccaagcttaggcctgagtg(配列番号229)およびpRAMtaildn:5’−ggcatgagcgtgaactgactgaactagcggccgccgag(配列番号230))の末端と一致して、本発明者らのE.coliベクターpRAM(WO99/14336)中への遺伝子クローニングを可能にした。
【0142】
合計183個のオリゴヌクレオチドを設計した(図6):上流隣接配列および下流隣接配列を集合としてコードする15個のオリゴヌクレオチド(両方の遺伝子について同一;配列番号35〜49)と、その2つの遺伝子の両方の鎖をコードする168個のオリゴヌクレオチド(4×42)(配列番号50〜217)である。
【0143】
183個すべてのオリゴヌクレオチドを、OLIGOソフトウェア(Wojciech
RychlikによるOLIGO 4.0 Primer Analysis Software(コピーライト)1989〜1991)のヘアピン分析に通して、潜在的に有害な分子内ループ形成を同定した。この分析結果を評価するための指針を、Sims博士(Sigma−Genosys Custom Gene Synthesis Department)の推奨に従って設定した:ΔG<−10であるヘアピンを形成するオリゴは回避しなければならない。このオリゴヌクレオチドの3’末端を含む、ΔG≦−7であるヘアピンを形成するオリゴもまた回避すべてきであるが、全体でΔG≦−5であるオリゴは、本願について問題を提起するはずがない。この分析により、ΔGが−7.1と−4.9との間であるヘアピンを形成することができる、23個のオリゴヌクレオチドが同定された。これらのうち、5つは、3’末端をブロックするかまたはほぼブロックした(0〜3個の遊離塩基)。そしてこれらを、その3’末端の1〜4塩基を除去しそして隣接オリゴヌクレオチドにその1〜4塩基を付加することによって、再設計した。
【0144】
ポリ(A)テイルと相補的な配列を包含するこの40マーオリゴヌクレオチドは、非常に低い複雑度の3’末端(13個連続するT塩基)を有した。高い複雑度の3’末端を有するが、向かい合う鎖上の相補的オリゴヌクレオチド(20塩基の代わりに11塩基)の1つと結果的に重複が減少した、さらなる40マーを設計した。
【0145】
これらのオリゴは、熱サイクラーベースのアセンブル反応における使用のために設計されたが、これらは、遺伝子構築のために連結ベースのプロトコルにおいても使用され得る。このアプローチにおいて、これらのオリゴヌクレオチドは、対合様式でアニーリングされ、そして生じた短い二本鎖フラグメントが、付着突出を使用して連結される。しかし、このためには、すべてのオリゴヌクレオチドがリン酸化されていることが、必要である。
【0146】
(b)遺伝子のアセンブルおよび増幅)
第1の工程において、この2つの合成遺伝子各々を、98個のオリゴヌクレオチドから別の反応にてアセンブルさせた。各反応について、総容積は50μlであった:
0.5μMオリゴヌクレオチド(=各オリゴ0.25pmol)
1.0U Taq DNAポリメラーゼ
0.02U Pfu DNAポリメラーゼ
2mM MgCl2
0.2mM dNTP(各々)
0.1%ゼラチン
サイクリング条件:(94℃で30秒、52℃で30秒間、および72℃で30秒間)×55サイクル。
【0147】
第2の工程において、アセンブルした各合成遺伝子を、別の反応にて増幅した。各反応についての総容積は、50μlであった:
2.5μlアセンブル反応液
5.0U Taq DNAポリメラーゼ
0.1U Pfu DNAポリメラーゼ
1M各プライマー(pRAMtailup、pRAMtaildn)
2mM MgCl2
0.2mM dNTP(各々)
サイクリング条件(94℃で20秒、65℃で60秒、72℃で3分)×30サイクル。
【0148】
アセンブルされそして増幅された遺伝子を、pRAMベクター中にサブクローニングし、そしてE.coli中にて発現させて、1〜2%の発光GRクローンまたは蛍光RDクローンを得た。5つのGRクローンおよび5つのRDクローンを単離し、そしてさらに分析した。この5つのGRクローンのうち、3つが、正確なインサートサイズを有した。この3つのうち、1つは、弱く発光し、そして1つは、変化した制限パターンを有した。5つのRDクローンのうち、2つは、正確なサイズのインサートを有し、変化した制限パターンを有した。これらのうちの1つは、弱く発光した。全体として、この分析は、これらの遺伝子における多数の変異の存在を示した。これらは、アセンブル反応および増幅反応において導入されたエラーの結果である可能性が高い。
【0149】
(c)修正アセンブルおよび増幅)
全長合成遺伝子中に存在するこの多数の変異を除去するために、本発明者らは、プルーフリーディングDNAポリメラーゼTliを使用して、各遺伝子についてさらなるアセンブル反応および増幅反応を実施した。このアセンブル反応は、98個のGRオリゴヌクレオチドまたはRDオリゴヌクレオチドに加えて、上記の変異を含む対応する全長クローン由来の少量のDNAを含んだ。このことにより、これらのオリゴが、テンプレート中に存在する変異を修正することが可能になる。
【0150】
以下のアセンブル反応を、合成遺伝子各々について実施した。各反応についての総容積は、50μlであった:
0.5μMオリゴヌクレオチド(=各オリゴ0.25pmol)
0.016pmolプラスミド(正確なインサートサイズを含むクローンの混合物)
2.5U Tli DNAポリメラーゼ
2mM MgCl2
0.2mM dNTP(各々)
0.1%ゼラチン
サイクリング条件:94℃で30秒、その後、(94℃で30秒、52℃で30秒間、および72℃で30秒間)×55サイクル、その後、72℃で5分間。
【0151】
以下の増幅反応を、これらのアセンブル反応液各々に対して実施した。各増幅反応についての総体積は、50μlであった:
1〜5μlアセンブル反応液
40pmol各プライマー(pRAMtailup、pRAMtaildn)
2.5U Tli DNAポリメラーゼ
2mM MgCl2
0.2mM dNTP(各々)
サイクリング条件:94℃で30秒、その後、(94℃で20秒、65℃で60秒間、および72℃で3分間)×30サイクル、その後、72℃で5分間。
【0152】
修正アセンブル工程および増幅工程から得られた遺伝子を、pRAMベクター中にサブクローニングし、そしてE.coliにおいて発現させ、75%の発光GRクローンまたは発光RDクローンを得た。44個のGRクローンおよび44個のRDクローンを、本発明者らのスクリーニングロボット(WO99/14336)を用いて分析した。6つの最良のGRクローンおよびRDクローンを手で分析し、そして1つの最良のGRクローンおよびRDクローン(GR6およびRD7)を、選択した。GR6の配列分析により、コード領域における2つの点変異が明らかになった。この点変異は、両方とも、アミノ酸置換(S49NおよびP230S)を生じた。RD7の配列分析により、コード領域において3つの点変異が明らかになった。この点変異のうちの1つは、アミノ酸置換(H36Y)を生じた。サイレント点変異はいずれも、この合成遺伝子の全体的設計基準と矛盾するいかなる調節部位または制限部位も、導入しなかったことを確認した。
【0153】
(d)意図しないアミノ酸置換の逆転)
GR6合成遺伝子およびRD7合成遺伝子中に存在する意図しないアミノ酸置換を、GRver5設計配列およびRDver5設計配列と一致するような部位特異的変異誘発によって逆転し、それにより、GRver5.1およびRDver5.1を作製した。変異した領域のDNA配列を、配列分析によって確認した。
【0154】
(e)スペクトル特性を改善する)
RDver5.1遺伝子を、アミノ酸変化(R351G)を導入することによりこの遺伝子のスペクトル特性を改善するようにさらに改変し、それにより、RDver5.2を作製した。
【0155】
(RD遺伝子およびGR遺伝子を含む、pGL3ベクター)
親コメツキムシルシフェラーゼYG#81−6G01(「YG」)、ならびに合成コメツキムシルシフェラーゼ遺伝子GRver5.1(「GR」)、RDver5.2(「RD」)、およびRD156−1H9を、この4つのpGL3レポーターベクター(Promega Corp.)中にクローニングした:
−pGL3−Basic=プロモーターなし、エンハンサーなし
−pGL3−Control=SV40プロモーター、SV40エンハンサー
−pGL3−Enhancer=SV40エンハンサー(ルシフェラーゼコード配列の3’側)
−pGL3−Promoter=SV40プロモーター。
GR合成遺伝子およびRD合成遺伝子のアセンブルにおいて使用したプライマーは、pRAMベクター中へのそれらの遺伝子のクローニングを容易にした。哺乳動物細胞における分析のためのpGL3ベクター(Promega Corp.,Madison、WI)中にこれらの遺伝子を導入するために、pRAMベクター中の各遺伝子(pRAM RDver5.1、pRAM GRver5.1、およびpRAM RD156−1H9)を、それらの遺伝子の5’末端にNco I部位をそして3’末端にXba I部位を導入するように増幅した。pRAM RDver5.1についてのプライマーおよびpRAM
GRver5.1についてのプライマーは、以下であった:
GR→5’GGA TCC CAT GGT GAA GCG TGA GAA 3’(配列番号231)または
RD→5’GGA TCC CAT GGT GAA ACG CGA 3’(配列番号232)および
5’CTA GCT TTT TTT TCT AGA TAA TCA TGA AGA C 3’(配列番号233)。
pRAM RD156−1H9についてのプライマーは、以下であった:
5’GCG TAG CCA TGG TAA AGC GTG AGA AAA ATG TC 3’(配列番号295)および
5’CCG ACT CTA GAT TAC TAA CCG CCG GCC TTC ACC 3’(配列番号296)。
このPCRは、以下を含んだ:
100ng DNAプラスミド
1μM上流プライマー
1μM下流プライマー
0.2mM dNTP
1×緩衝液(Promega Corp.)
5単位 Pfu DNAポリメラーゼ(Promega Corp.)
50μlにする滅菌ナノピュア水。
【0156】
このサイクリングパラメーターは、以下であった:94℃で5分;(94℃で30秒;55℃で1分;および72℃で3分)×15サイクル。精製PCR生成物を、Nco IおよびXbaIで消化し、NcoIおよびXbaIで消化したpGL3−controlと連結し、そしてこの連結生成物を、E.coliに導入した。これらのルシフェラーゼ遺伝子を他のpGL3レポーターベクター(basic、promoterおよびenhancer)に挿入するために、これらのルシフェラーゼ遺伝子の各々を含むpGL3−controlを、Nco IおよびXba Iで消化し、これもNco IおよびXba Iで消化した他のpGL3ベクターと連結し、そしてこの連結生成物を、E.coliに導入した。pGL3ベクター中のGRver5.1核酸配列およびRDver5.1(およびRD156−1H9(下記参照))核酸配列によりコードされるポリペプチドは、そのオリゴヌクレオチド中の開始コドンのNcoI部位の結果として、2位がバリンになるアミノ酸置換を有することに、注意されたい。
【0157】
内部Nco I部位およびXba I部位が原因で、YG#81−6G01中のネイティブ遺伝子を、コード領域の上流にあるHind III部位から下流にあるHpa I部位まで増幅した。これは、GRクローンおよびRDクローン中に見出される隣接配列を含んだ。上流プライマー(5’−CAA AAA GCT TGG CAT TCC GGT ACT GTT GGT AAA GCC ACC ATG GTG AAG CGA GAG−3’;配列番号234)および下流プライマー(5’−CAA TTG TTG TTG TTA ACT TGT TTA TT−3’;配列番号235)を、YG#81−6G01と混合し、そして上記のPCR条件を使用して増幅した。精製PCR生成物をNco IおよびXba Iで消化し、これもまたHind IIIおよびHpa Iで消化したpGL−controlと連結し、そしてこの連結生成物を、E.coli中に導入した。他のpGL3レポーターベクター(basic、promoter、およびenhancer)中にYG#81−6G01を挿入するために、YG#81−6G01を含むpGL3−controlベクターをNco IおよびXba Iで消化し、そしてこれもまたNco IおよびXba Iで消化した他のpGL3ベクターと連結し、そしてこの連結した生成物を、E.coli中に導入した。このpGL3ベクター中のYG#81−6G01のクローンは、塩基786にてAの代わりにCを有し、これにより、残基262にてPheからLeuへのアミノ酸配列の変化を生じることに、注意されたい(図2は、pGL3ベクター中に導入する前の、YG#81−6G01の配列を示す)。262位の変化したアミノ酸が酵素の生化学に影響したか否かを決定するために、YG#81−6G01のクローンを、元の配列と似るように変異させた。その後、両方のクローンを、E.coliにおける発現、物理的安定性、基質結合、およびルミネッセンス出力動態について試験した。有意な差異は、見出されなかった。
【0158】
合成遺伝子から発現された部分精製酵素および親遺伝子から発現された部分精製酵素を使用して、ルシフェリンおよびATPについてのKmを決定した(表3を参照のこと)。
【0159】
(表3)
【0160】
【表3】
インビトロでの真核生物転写/翻訳反応もまた、製造業者の指示に従って、PromegaのTNT T7 Quickシステムを使用して行った。ルミネッセンスレベルは、合成GR遺伝子および合成RD遺伝子について、(ルミノメーターのスペクトル感度について補正した)親遺伝子と比較して、それぞれ、(反応時間に依存して)1〜37倍および1〜77倍高かった。
【0161】
合成コメツキムシルシフェラーゼ遺伝子および野生型コメツキムシ遺伝子が、哺乳動物細胞において改善した発現を有するか否かを試験するために、この合成遺伝子および親遺伝子の各々を、一連のpGL3ベクター中にクローニングし、そしてCHO細胞中に導入した(表8)。すべての場合において、合成コメツキムシ遺伝子が、ネイティブ遺伝子より高い発現を示した。詳細には、合成GR遺伝子の発現および合成RD遺伝子の発現は、親の発現よりも、それぞれ、1900倍および40倍高かった(トランスフェクション効率を、ネイティブRenillaルシフェラーゼ遺伝子との比較により正規化した)。さらに、(basicベクター対controlベクターの)このデータは、これらの合成遺伝子が、基礎レベル転写を減少させたことを、示す。
【0162】
さらに、ネイティブ遺伝子と合成遺伝子との間でこのcontrolに関する活性の割合が比較される、enhancerベクターを用いた実験において、このデータは、これらの合成遺伝子が、異常な転写特徴を有する危険が減少していることを、示した。特に、親遺伝子は、ベクター中のエンハンサーにより活性化される、1つ以上の内部転写調節配列を含むようであった。従って、親遺伝子は、レポーター遺伝子として適切ではないが、合成GR遺伝子および合成RD遺伝子は、きれいなレポーター応答を示した(トランスフェクション効率を、ネイティブRenillaルシフェラーゼ遺伝子との比較により正規化した)。表9を参照のこと。
【0163】
クローン名ならびにヌクレオチド配列およびアミノ酸配列についてのそれらの対応する配列番号を、以下の表4に列挙する。
【0164】
【表4】
(実施例2:RDルシフェラーゼ遺伝子の評価)
RDver5.2を、そのルシフェラーゼ強度を増大させるために変異させ、それにより、4つのさらなるアミノ酸変化(M2I、S349T、K−488T、E538V)および3つのサイレント点変異(配列番号18)を有するRD156−1H9を作製した。
【0165】
a)部位特異的変異誘発:
最初のストラテジーは、部位特異的変異誘発を使用することであった。H348Qに対してGR合成遺伝子とRD合成遺伝子との間には4つのアミノ酸差異があり、このことにより、赤色に対する最大の寄与がもたらされる。従って、この置換はまた、低い発光を導き得るタンパク質における構造的変化を引き起こし得る。この領域近辺の最適化は、発光を増大させ得る。以下の位置を、変異のために選択した:
1.S344(ルシフェリンの結合ポケットの端にある)−このコドンを無作為化する
2.A245(厳密に保存されているが、348に最も近く、活性部位ポケットの端にある)−このコドンを無作為化する
3.I347(保存されておらず、配列中の348の隣にある)−疎水性アミノ酸のみに変異させる
4.S349(保存されておらず、配列中の348の隣にある)−S,T,A,Pのみに変異させる。
【0166】
上記の位置で変異させるように設計したオリゴヌクレオチドを、部位特異的変異誘発実験(WO99/14336)に用い、得られた変異体を、発光強度についてスクリーニングした。発光強度においてはほとんどバリエーションがなく、約25%のみが発光した。さらに詳細な分析のために、クローンを拾って、スクリーニングロボット(PCT/WO9914336)を用いて分析した。RDver5.2より高い発光強度(LI)のクローンはなかったが、クローンのうちの4つがルシフェリンおよびATPについてわずかに低い複合Kmを有した(Km)。
【0167】
b)方向付けられた進化:
方向付けられた進化のために用いたプロトコルおよび手順は、PCT/WO9914336に詳細に記載される。低いKmを有する4つのクローン由来のDNAを組み合わせ、ランダム変異体の3つのライブラリーを生成した。このライブラリーを、ロボットを用いてスクリーニングし、最高のLIを有するクローンを選択した。これらのクローンをともにシャッフルし、別のロボットスクリーニングにより、46℃のインキュベーション温度で完了した。最高のLI値を有する3つのクローンは、RD156−0B4、RD156−1A5、およびRD156−1H9であった。
【0168】
c)分析
最高のLI値を有する3つのクローンを、手動分析のために選択して、それらの発光強度がRDver5.2より高いことを確認し、それらのスペクトル特性が弱められていないことを確実にする。クローンのうちの1つがわずかに緑色にシフトし、他の全てのものは、RDver5.2のスペクトル特性を維持した(表5)。
【0169】
【表5】
RDver5.2に対するルシフェリンのKm値および発光強度を、いくつかの独立した実験において3つ全てのクローンについて決定した。全ての細胞サンプルを、CCLR溶解緩衝液(E1483,Promega Corp.,Madison,WI)で処理し、緩衝液(25mM HEPES pH7.8,5% グリセロール,1mg/ml BSA,150mM NaCl)に1:10希釈した。表7は、細菌細胞における発現からの結果(Lum:光学密度に対して正規化した発光値;独立した実験の測定値を前のスラッシュにより分けている)をまとめる。RD156−1H9(最高の発光強度(5〜10倍の増加)を有するクローン)はまた、ルシフェリンについて約2倍高いKmを有する。
【0170】
【表6】
表7は、照度計光電子倍増管のスペクトル感度の較正ありまたはなしで、GRver5.1に対して正規化したRD156−1H9、GRver5.1およびRDver5.2の発光強度間の比較を示す。較正した場合、クローンRD156−1H9の発光強度は、GRver5.1より約2倍低いだけであった。クローンRD156−1H9についてのルシフェリンKmは、GRver5.1より約40倍高い。RD156−1H9は、少なくとも2時間にわたり50℃で熱安定性である。
【0171】
【表7】
表8および表9は、CHO細胞におけるルシフェラーゼ発現レベルの比較を示す。表8は、ホタルルシフェラーゼ遺伝子と比較した、コントロールベクターからの発現レベルのみを示す(RLU=相対光単位)。表9は、pGL3−コントロールにおける発現レベルの%として計算した4つ全てのpGL3ベクターにおける発現レベルの比較を示す。
【0172】
【表8】
【0173】
【表9】
(実施例3:合成Renillaルシフェラーゼ核酸分子)
調製した合成Renillaルシフェラーゼ遺伝子は、以下を含む:1)導入されたコザック配列、2)哺乳動物(ヒト)発現のために最適化されたコドン使用頻度、3)所望でない制限部位の減少または排除、4)原核生物性調節部位の除去(リボソーム結合部位およびTATAボックス)、5)スプライス部位およびポリ(A)付加部位の除去、および6)哺乳動物転写因子結合配列の減少または排除。
【0174】
合成Renillaルシフェラーゼ遺伝子のコンピューター補助による設計のプロセスは、コドン最適化、ならびに転写因子結合部位および他の調節部位、ならびに制限部位に除去の回数を反復することは、3つの工程で記載され得る:
1.野生型Renillaルシフェラーゼ遺伝子を親遺伝子として用いて、コドン使用頻度を最適化し、1つのアミノ酸を変化させて(T→A)、コザックコンセンサス配列を生成し、所望でない制限部位を排除し、それにより、合成遺伝子Rlucver1を作製した。
2.原核生物性調節部位、スプライス部位、ポリ(A)部位および転写因子(TF)結合部位を除去する(第1の試み)。次いで、新たに作製したTF結合部位を除去する。次いで、新たに作製した所望でない制限酵素部位、原核生物性調節部位、スプライス部位、およびポリ(A)部位を、新たなTF結合部位を導入することなく除去する。このことにより、Rlucver2を作製した。
3.Rlucver2の3つの塩基を変化させることにより、Rluc−最終を作製した。
4.次いで、実際の遺伝子を、Rluc−最終を設計した配列に対応する合成オリゴヌクレオチドから構築した。アセンブリプロセスまたはPCRプロセスから得られた全ての変異を正した。この遺伝子は、Rluc−最終(配列番号22)であり、配列番号227のアミノ酸配列をコードする。
【0175】
(コドン選択)
GenbankのRenilla reniformisルシフェラーゼ配列(登録番号M63501、配列番号19)で開始して、ヒト細胞における最適な発現のためのコドン使用頻度に基づいて、およびE.coliの低使用頻度コドンを避けるために、コドンを選択した。ヒト細胞における発現のための最良の1つのコドン(または類似の頻度で見出された場合は、最良の2つのコドン)を1を超えるコドンに対して、全てのアミノ酸のために選択した(Wada et al.,1990):
【0176】
【化1】
1つのアミノ酸に対して2つのコドンが選択された場合、これらのコドンを、交互にして使用した。合成遺伝子についての他の基準を満たすために、最初の最適コドン選択を、後にある程度まで改変した。例えば、コザック配列の導入は、2位のアミノ酸のAlaに関してGCTの使用を必要とした(以下を参照のこと)。
【0177】
哺乳動物細胞における以下の低使用頻度コドンは、必要でなければ用いなかった:Arg:CGA、CGU;Leu:CTA、UUA;Ser:TCG;Pro:CCG;Val:GTA;およびIle:ATA。以下のE.coliにおける低使用頻度コドンはまた、妥当な場合は避けた(これらのうちの3つが哺乳動物細胞についての低使用頻度リストに適合することに注意のこと):Arg:CGA/CGG/AGA/AGG,Leu:CTA;Pro:CCC;Ile:ATA。
【0178】
(コザック配列の導入)
コザック配列:5’aaccATGGCT3’(配列番号293)(NcoI部位に下線を付し、コード領域は、大文字で示す)を、合成Renillaルシフェラーゼ遺伝子に導入した。コザック配列の導入により、2番目のアミノ酸がThrからAla(GCT)に変化する。
【0179】
(所望でない制限部位の除去)
REBASE ver.808(1998年8月1日に更新;制限酵素データベース;www.neb.com/rebase)を用いて、実施例1に記載のように、所望でない制限部位を同定した。以下の所望でない制限部位(実施例1に記載のものに加えて)を、実施例1に記載のプロセスに従って除去した:EcoICRI、NdeI、NsiI、SphI、SpeI、XmaI、PstI。
【0180】
これらの変化全てが組み込まれたRenillaルシフェラーゼ(Rluc)のバージョンは、Rlucver1である。
【0181】
(原核生物性(E.coli)調節配列、スプライス部位、およびポリ(A)部位の除去)
転写調節部位を排除することに関する優先事項およびプロセスは、実施例1に記載のとおりであった。
【0182】
(TF結合部位の除去)
実施例1に記載のものと同じプロセス、ツール、および基準を用いたが、TRANSFACデータベースのより新たなバージョン3.3を用いた。
【0183】
Rlucver1から原核生物性調節配列スプライス部位およびポリ(A)部位を除去した後、TF結合部位に関する最初の検索を行うと、約60がヒットした。全ての部位を、合成Renilla遺伝子のアミノ酸を改変することなく、除去され得る3つの例外に関して排除した:
1.CAC−結合タンパク質T00076に関して、63位の部位がWの2つのコドン(TGGTGG)から構成される;
2.myc−DF1 T00517に関して、522位の部位は、KMVについてのコドン(AAN ATG GTN)から構成される;
3.myc−DF1 T00517に関して、885位の部位は、EMGについてのコドン(GAR ATG GGN)から構成される。
【0184】
(新たに導入した)TF結合部位に関して、その後に2回目の検索を行うと、約20がヒットした。全ての新たな部位を、上記の3つの部位を残して排除した。最後に、任意の新たに導入した制限部位、原核生物性調節配列、スプライス部位およびポリ(A)部位を、可能な場合、新たなTF結合部位を導入せずに除去した。
【0185】
Rlucver2を得た(配列番号21および226)。
【0186】
実施例1と同様に、低いストリンジェンシーの検索パラメーターが、TESSフィルターにかけた文字列検索により特定されて、合成Renilla遺伝子をさらに評価した。
【0187】
LLHが10から9に減少し、最小のエレメントの長さが5から4に減少した場合、TESSフィルターにかけた文字列検索をしても、新たにヒットしなかった。上記に列挙したパラメーター変化に加えて、生物分類を哺乳動物から脊索動物に拡大した場合、この検索により、さらに4つのTF結合部位のみが得られた。Min LLHが8から0にさらに減少すると、この検索により、組み合わされたさらに2つの5塩基の部位(MAMAGおよびCTKTK)が示され、Rlucver2において4つの適合およびいくつかの4塩基の部位を有した。また、実施例1と同様に、Rlucver2を、EPD(真核生物プロモーターデータベース,リリース45)の登録に対してヒットするかをチェックした。3つのヒットを決定した(Mus musculusプロモーターH−2L^dに対して1つ(Cell,44,261(1986)、単純ヘルペスウイルスI型プロモーターb’g’2.7kbに対して1つ、およびHomo sapiens DHFRプロモーターに対して1つ(J.Mol.Biol.,176,169(1984))。しかし、Rlucver2に対してさらなる変化は行わなかった。
【0188】
(Rlucver2についての特性のまとめ)
−30全ての低使用頻度コドンを排除した。コザック配列の導入により、2番目のアミノ酸がThrからAlaに変化した;
−塩基組成:55.7% GC(Renilla野生型親遺伝子:36.5%);
−1つの所望でない制限部位は排除できなかった:488位のEcoRV;
−合成遺伝子は、原核生物性プロモーター配列を有さないが、867〜73位の1つの潜在的に機能的なリボソーム結合部位(RBS)(Metコドンの約13塩基上流)は排除できなかった;
−全てのポリ(A)付加部位を排除した;
−スプライス部位:2つのドナースプライス部位は排除できなかった(両方とも、アミノ酸配列MGKを共有する);
−TF部位:4つを超える明白な塩基のコンセンサスを有する全ての部位を、アミノ酸配列に対する変更を避けるための優先度に起因する3つの例外を除いて、排除した(約280のTF結合部位を除いた)。
合成Renillaルシフェラーゼ配列を図7および8に示す。コドン使用頻度の比較を、図9に示す。
【0189】
pGL3に導入される場合、Rluc−最終は、コザック配列(CACCATGGCT)を有する。Rlucver2に対するRluc−最終における変化を、遺伝子アセンブリの間に導入した。一方の変更は、619位におけるCからAへの変化であり、これは、真核生物プロモーター配列を排除し、遺伝子をアセンブルするために用いられる、対応するオリゴヌクレオチドにおけるヘアピン構造の安定性を減少させた。他方の変更は、218〜220位におけるCGCからAGAへの変更を含んでいた(PCRのためのより良好なオリゴヌクレオチドが生じた)。
【0190】
(遺伝子アセンブリストラテジー)
合成Renillaルシフェラーゼのために用いた遺伝子アセンブリプロトコルは、実施例1に記載のプロトコルと類似していた。使用したオリゴヌクレオチドを、図10に示す。
【0191】
【化2】
得られた合成遺伝子フラグメントを、NcoIおよびXbaIを用いてpRAMベクターにクローニングした。正確なサイズの挿入物を有する2つのコドンを、配列決定した。6つの変異のうち4つを各クローンから合成遺伝子において見出した。これらの変異は、部位特異的変異誘発により固定され(Promega Corp.,Madison,WIのGene Editor)、これら2つの遺伝子間で正確な領域を交換した。正しくされた遺伝子を、配列決定により確認した。
【0192】
(他のベクター)
pGL−3コントロールベクター骨格における合成Renillaルシフェラーゼ遺伝子のための発現ベクターを調製するために、5μgのpGL3−コントロールを、2μlの各酵素および5μlの10×緩衝液Bを含有する50μlの最終容量(ナノピュア水を用いて、50μlの容量にする)中でNcoIおよびXbaIで消化した。消化反応系を、37℃で2時間インキュベートし、混合物全体を、1×TAE中で1%アガロースゲル上で泳動した。所望のベクター骨格フラグメントを、QiagenのQIAquickゲル抽出キットを用いて精製した。
【0193】
ネイティブなRenillaルシフェラーゼ遺伝子フラグメントを、2つのオリゴヌクレオチド、NcoI−RL−FおよびXbaI−RL−Rを用いてpGL3−コントロールベクターにクローニングし、テンプレートとしてpRL−CMVを用いて、ネイティブなRenillaルシフェラーゼ遺伝子をPCR増幅した。NcoI−RL−Fについての配列は、以下のとおりである:
【0194】
【化3】
XbaI−RL−Rについての配列は、以下のとおりである
【0195】
【化4】
PCR反応を以下のとおりに行った:
反応混合物(100μlについて):
DNAテンプレート(プラスミド) 1.0μl(1.0ng/μl 最終)
10×Rec.緩衝液 10.0μl(Stratagene Corp.)
dNTP(各25mM) 1.0μl(最終250μM)
プライマー1(10μM) 2.0μl(0.2μM 最終)
プライマー2(10μM) 2.0μl(0.2μM 最終)
Pfu DNAポリメラーゼ 2.0μl(2.5U/μl,Stratagene Corp.)
82μlの2回蒸留水
PCR反応系:
94℃で2分間加熱;(94℃で20秒;65℃で1分;72℃で2分;次いで72℃で5分)×25サイクル、次いで、氷上でインキュベートする。PCR増幅したフラグメントをゲルから切り出し、DNAを精製し、−20℃で保存した。
【0196】
ネイティブのRenillaルシフェラーゼ遺伝子フラグメントをpGL3−コントロールベクターに導入するために、ネイティブのRenillaルシフェラーゼ遺伝子のPCR産物(RAM−RL合成)5μgを、NcoIおよびXbaIを用いて消化した。所望のRenillaルシフェラーゼ遺伝子フラグメントを精製し、−20℃で保存した。
【0197】
次いで、100ngの挿入物および100ngのpGL3−コントロールベクター骨格を、制限酵素NcoIおよびXbaIで消化し、ともに連結した。次いで、2μlの連結混合物を、JM109コンピテント細胞に形質転換した。8つのアンピシリン耐性クローンを拾い、それらのDNAを単離した。pGL3−コントロール−ネイティブおよびpGL3−コントロール−合成の各陽性クローンからの各DNAを精製した。ベクター中のネイティブの遺伝子および合成遺伝子の正確な配列を、DNA配列決定により確認した。
【0198】
合成Renillaルシフェラーゼ遺伝子により哺乳動物細胞における発現が改善されたか否かを決定するために、この遺伝子を、SV40プロモーターおよびSV40初期エンハンサーの制御下で、哺乳動物発現ベクターpGL3−コントロールベクターにクローニングした(図13A)。ネイティブのRenillaルシフェラーゼ遺伝子をまた、pGL−3コントロールベクターにクローニングし、その結果、合成遺伝子およびネイティブの遺伝子からの発現を比較した。次いで、これらの発現ベクターを、4つの一般的な哺乳動物細胞株(CHO、NIH3T3、HelaおよびCV−1;表10)にトランスフェクトし、合成遺伝子 対 ネイティブの遺伝子に関して、ベクター間の発現レベルを比較した。使用したDNAの量は、合成遺伝子が、異なる発現レベルで構成的に増大されることを確認するために、2つの異なるレベルの量であった。結果は、これらの細胞における合成Renillaルシフェラーゼ遺伝子に関して、70〜600倍の発現を示す(表10)。
【0199】
【表10】
ルシフェラーゼレポーターの1つの重要な利点は、その短いタンパク質半減期である。増強した発現はまた、長期化したタンパク質半減期から生じ得、そうであるならば、このことは、新たな遺伝子の所望されない欠点を与える。この可能性は、シクロヘキシミド追跡(cycloheximide chase)(「CHX追跡」)実験により除外される(図14)。このことにより、タンパク質半減期の増大は、ヒト化Renillaルシフェラーゼ遺伝子から生じないことが実証される。
【0200】
発現における増加が、確実に発現ベクター骨格に限定されず、プロモーター特異的および/または細胞特異的であるようにするために、合成Renilla遺伝子(Rluc−最終)およびネイティブのRenilla遺伝子を異なるベクター骨格に、異なるプロモーターの制御下でクローニングした(図13B)。この合成遺伝子は、その野生型対応物と比較して、常に発現が増加している(表11)。
【0201】
【表11】
【0202】
【表12】
(図13Aに示されるベクター骨格)
減少した見せかけの発現の場合、合成遺伝子は、プロモーターなしのベクターにおいてより低い基本的レベルの転写を示すはずである。合成Renillaルシフェラーゼ遺伝子およびネイティブのRenillaルシフェラーゼ遺伝子を、pGL3−基本ベクターにクローニングして、転写の基本的レベルを比較した。合成遺伝子自体は増加した発現効率を有するので、プロモーターなしのベクターからの活性により、基本的転写の差異を判断するために直接比較することはできず、むしろ、このことは、コントロールベクターを参照して、プロモーターなしのベクターからの活性の%を比較することにより考慮される(基本的ベクターからの発現は、プロモーターエレメントおよびエンハンサーエレメント両方を有する完全に機能的なベクターにおける発現により区別した)。このデータは、合成Renillaルシフェラーゼが、ネイティブの遺伝子より低いレベルの基本的転写を有することを実証する(表12)。
【0203】
エンハンサーが、プロモーター活性を実質的に刺激することが当業者に周知である。合成遺伝子は、不適切な転写特性の危険性を減少したか否かを試験するために、ネイティブ遺伝子および合成遺伝子を、エンハンサーエレメントを有するベクター(pGL3−エンハンサーベクター)に導入した。合成遺伝子は、より高い発現効率を有するので、エンハンサーの存在下で転写レベルを比較するために、両方の活性を直接比較することはできない。しかし、このことは、コントロールベクターを参照して、エンハンサーベクターから活性の%を用いることにより考慮される(エンハンサーの存在下での発現は、プロモーターエレメントおよびエンハンサーエレメント両方を有する完全に機能的なベクターにおける発現により区別した)。このような結果は、ネイティブな遺伝子が存在する場合、エンハンサー単独で、コントロールの42〜124%の転写を刺激することが可能であることを示す。しかし、ネイティブの遺伝子が、同じベクター中で合成遺伝子により置換されると、活性のみが、同じエンハンサーおよび強力なSV40プロモーターが用いられる場合、この値の1〜5%を構成するにすぎない。このことは、合成遺伝子が、見せかけの発現の危険性を減少させたことを明らかに示す(表12)。
【0204】
合成Renilla遺伝子(Rluc−最終)をインビトロ系で用いて、ネイティブの遺伝子と翻訳効率を比較した。T7 quick coupled transcription/translation system(Promega Corp.,Madison,WI)において、pRL−nullネイティブプラスミド(T7プロモーターの制御下でネイティブRenillaルシフェラーゼ遺伝子を有する)または同じ量のpRL−null−合成プラスミド(T7プロモーターの制御下で合成Remaillaルシフェラーゼ遺伝子を有する)を、TNT反応混合物に添加し、ルシフェラーゼ活性を、5分毎に60分まで測定した。二重ルシフェラーゼアッセイキット(Promega Corp.)を用いて、Renillaルシフェラーゼ活性を測定した。このデータは、改善された発現が、合成遺伝子から得られることを示した(図15A、B)。合成遺伝子の翻訳効率の増大をさらに証明するために、RNAをインビトロ転写系により調製し、次いで、精製した。pRL−null(ネイティブまたは合成)ベクターを、BamHIで直鎖状にした。DNAを複数回のフェノール−クロロホルム抽出、続いて複数回のエタノール沈殿により精製した。インビトロT7転写系を用いてRNAを調製した。DNAテンプレートを、RNaseを含まないDNaseを用いて除去し、RNAを、フェノール−クロロホルム抽出、続いて、複数回のイソプロパノール沈殿により精製した。次いで、同じ量の精製RNA(合成遺伝子またはネイティブの遺伝子のいずれか)を、ウサギ網状赤血球溶解物(図15C、D)または小麦胚芽溶解物(図15E、F)に添加した。再び、合成Renillaルシフェラーゼ遺伝子RNAは、ネイティブのRenillaルシフェラーゼ遺伝子RNAより多くのルシフェラーゼを生成した。これらのデータは、翻訳効率が、合成配列により改善されることを示唆する。なぜ合成遺伝子が小麦胚芽中で高度に発現されるのかを決定するために、植物のコドン使用頻度を決定した。高等植物において最も低い使用頻度のコドンは、哺乳動物におけるものと一致した。
【0205】
レポーター遺伝子アッセイは、転写調節事象を研究するために広く用いられている。これは、同時トランスフェクション実験においてしばしば行われ、このアッセイにおいて、試験プロモーターを含む1次レポーター構築物とともに、構成的レポーターの制御下で第2のコントロールレポーターが、サンプル間のトランスフェクション効率を含む実験変動を正規化するために内部コントロールとして細胞にトランスフェクトされる。コントロールレポーターシグナル、コントロールレポーターと1次レポーターとの間の潜在的プロモーターのやりとり(cross talk)、ならびに実験条件によるコントロールレポーターの潜在的な調節は、信頼性のある補レポーター(co−receptor)ベクターを選択するための重要な局面である。
【0206】
上記のように、合成Renillaルシフェラーゼ遺伝子を、異なるプロモーターの下で異なるベクター骨格にクローニングすることにより、ベクター構築物を作製する。全ての構築物は、試験した3つの哺乳動物細胞株においてより高い発現を示した(表11)。従って、発現効率が良好になるにつれて、合成Renillaルシフェラーゼは、哺乳動物細胞にトランスフェクトされた場合、より高いシグナルを発する。
【0207】
より高いシグナルが得られるので、同じレポーターシグナルを達成するためにはより低い活性しか必要とせず、このことは、プロモーターの干渉という危険性を減少させる。50ngのpGL3−コントロール(ホタルluc+)+ネイティブpRL−TKプラスミドの5つの異なる量(50、100、500、1000または2000ng)または合成pRL−TK(5、10、50、100、または200ng)の5つの異なる量で、CHO細胞をトランスフェクトした。各トランスフェクションに、pUC19キャリアDNAを総量3μg DNAまで添加した。10倍低いpRL−TK DNAにより、ネイティブの遺伝子と同様または大きいシグナルを与える(1次レポーターpGL3−コントロールからの発現を阻害するという危険性が減少している)ことを実証する実験が、図16に示される。
【0208】
実験的処理により、ときおり、遺伝子内の不可解な部位が活性化され得、補レポーター発現の誘導または抑制が引き起こされ、このことは、トランスフェクション効率の正規化のための補レポーターとしてその機能を弱める。1つの例は、MCF−7細胞をトランスフェクトした場合、TPAが、野生型遺伝子を有する補レポーターベクターの発現を誘導することである。500ngのpRL−TK(ネイティブ)、5μgのネイティブpRG−Bおよび合成pRG−B、2.5μgのネイティブpRG−TKおよび合成pRG−TKをMCF−7細胞のウェルごとにトランスフェクトした。100ng/ウェルのpGL3−コントロール(ホタルluc+)を、全てのRLプラスミドに対して同時トランスフェクトした。キャリアDNAであるpUC19を用いて、総DNAを5.1μg/ウェルでトランスフェクトした。15.3μlのTransFastトランスフェクション試薬(Promega Corp.,Madison,WI)をウェルごとに添加した。16時間後、細胞をトリプシン処理し、プールし、6ウェルディッシュの6つのウェルに分割し、8時間にわたりウェルに接着させた。次いで、3つのウェルを、0.2nMの腫瘍プロモーター、TPA(ホルボール−12−ミリステート−13−アセテート、Calbiochem #524400−S)で処理し、3つのウェルを20μlのDMSOでモック処理した。細胞をTPAを添加して24時間後に、0.4mlのPassive Lysis Bufferを用いて回収した。この結果は、合成遺伝子を用いることによって、実験適刺激による補レポーター発現の所望でない変化が避けられ得ることを示した(表13)。このことは、合成遺伝子を用いることにより、異常な発現の危険性が減少され得ることを示す。
【0209】
【表13】
【0210】
【表14】
【0211】
【表15】
すべての刊行物、特許および特許出願は、本明細書中に参考として援用される。前述の明細書において、本発明は、その特定の好ましい実施形態に関して記載され、多くの詳細が例示の目的で記載されてきたが、本発明は、さらなる実施形態が可能であり、本明細書中の詳細の特定のものが本発明の基本的な原理から逸脱することなくかなり変化され得ることは、当業者に明らかである。
【技術分野】
【0001】
(政府の権利の主張)
本発明は、米合衆国政府からの助成金(National Science Foundationからの助成金DMI−9402762)を少なくとも一部用いてなされた。政府は、本発明に特定の権利を有する。
【背景技術】
【0002】
(発明の背景)
転写(DNA配列からのRNA分子の合成)は、遺伝子発現の最初の工程である。DNA転写を調節する配列としては、プロモーター配列、ポリアデニル化シグナル、転写因子結合部位およびエンハンサーエレメントが挙げられる。プロモーターは、転写を特異的に開始し得るDNA配列であり、3つの一般領域からなる。コアプロモーターは、RNAポリメラーゼおよびその補因子がDNAに結合する配列である。コアプロモーターの直ぐ上流は、活性化複合体のアセンブリを担う(この活性化複合体は、次いで、ポリメラーゼ複合体を補充する)いくつかの転写因子結合部位を含む、近位プロモーターである。近位プロモーターのさらに上流に位置する遠位プロモーターもまた、転写因子結合部位を含む。転写終結およびポリアデニル化は、転写開始のように、部位特異的であり、そして規定された配列によってコードされる。エンハンサーは、調節領域であり、複数の転写因子結合部位を含み、この複数の転写因子結合部位は、エンハンサーおよびプロモーターが同じDNA分子内に配置される限り、プロモーターに関するエンハンサーの配向および距離に関係なく、応答性プロモーターからの転写レベルを有意に増大させ得る。遺伝子から産生される転写物の量はまた、転写後の機構によって調節され得、最も重要なことは、スプライスドナー配列とスプライスアクセプター配列との間で、一次転写物から介在配列(イントロン)を除去するRNAスプライシングである。
【0003】
自然選択とは、表現型レベルで生じる遺伝型−環境相互作用が、個体の差示的生殖の成功を導き、従って、集団の遺伝子プールの改変を導くという仮説である。
【0004】
自然選択によって作用される核酸分子のいくつかの特性としては、コドン使用頻度、RNA二次構造、イントロンスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用が挙げられる。遺伝暗号の縮重性に起因して、これらの特性は、対応するアミノ酸配列を変更することなく自然選択によって最適化され得る。
ある条件下では、ポリペプチドをコードする天然のヌクレオチド配列を合成的に変更して、ポリペプチドを代替の適用のためにより適合させることが有用である。一般的な例は、外来宿主細胞において発現される場合に、遺伝子のコドン使用頻度を変更することである。遺伝暗号の重複性は、アミノ酸が複数のコドンによってコードされることを可能にするが、異なる生物は、他を上回っていくつかのコドンを好む。非ネイティブの宿主細胞におけるタンパク質翻訳の効率は、コドン使用頻度を調節することによって実質的に増大され得るが、同じ遺伝子産物を維持する(特許文献1;特許文献2および特許文献3)。
しかし、コドン使用を変更することは、次に、不適切な転写調節配列の合成核酸分子への意図しない導入を生じ得る。これは、転写に悪影響を与え、合成DNAの異常な発現を生じる。異常な発現は、発現の正常レベルまたは予測されたレベルからの逸脱として定義される。例えば、プロモーターの下流に位置する転写因子結合部位は、プロモーター活性をもたらすことが実証されている(非特許文献1;非特許文献2;非特許文献3;非特許文献4)。さらに、活性を発揮し、そしてプロモーター配列の非存在下でDNA転写レベルの上昇を生じるエンハンサーエレメント、またはプロモーター配列の非存在下で遺伝子発現の基底レベルを増大させる転写調節配列の存在は、稀なことではない。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許第5,096,825号明細書
【特許文献2】米国特許第5,670,356号明細書
【特許文献3】米国特許第5,874,304号明細書
【非特許文献】
【0006】
【非特許文献1】Michaelら、「EMBO.J」、1990年、9、481
【非特許文献2】Lambら、「Mol.Reprod,Devel.」、1998年、51、218
【非特許文献3】Johnsonら、「Mol.Reprod,Devel」、1998年、50、377
【非特許文献4】Jonesら、「Mol.Cell.Biol.」、1997年、17、6970
【発明の概要】
【発明が解決しようとする課題】
【0007】
従って、特定の宿主細胞における発現のために、不適切または意図しない転写調節配列の導入もまた伴わずに、変更されたコドン使用を有する合成核酸分子を作製するための方法が必要である。
【課題を解決するための手段】
【0008】
本発明は、以下を提供する:
(項目1) 少なくとも300ヌクレオチドの、ポリペプチドに関するコード領域を含む合成核酸分子であって、上記核酸分子は、ポリペプチドをコードする野生型核酸配列と、コドンの25%より多くが異なるコドン組成を有し、そして上記異なるコドンでのコドンの無作為選択から得られるような配列の平均数に対して、少なくとも3倍少ない転写調節配列を有し、
ここで、上記転写調節配列は、転写因子結合配列、イントロスプライス部位、ポリ(A)付加部位、およびプロモーター配列からなる群より選択され、そしてここで、上記合成核酸分子によりコードされる上記ポリペプチドは、上記野生型核酸配列によりコードされる上記ポリペプチドに対して、少なくとも85%の配列同一性を有する、合成核酸分子。(項目2) 上記合成核酸分子が、少なくとも5倍少ない転写調節配列を有する、項目1に記載の合成核酸分子。
(項目3) 上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの35%より多くが異なる、項目1に記載の合成核酸分子。
(項目4) 上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの45%より多くが異なる、項目1に記載の合成核酸分子。
(項目5) 上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの55%より多くが異なる、項目1に記載の合成核酸分子。
(項目6) 上記異なるコドンの多数が、所望の宿主細胞の好ましいコドンである、項目1に記載の合成核酸分子。
(項目7) 上記合成核酸分子が、レポーター分子をコードする、項目1に記載の合成核酸分子。
(項目8) 上記合成核酸分子が、選択可能なマーカータンパク質をコードする、項目1に記載の合成核酸分子。
(項目9) 上記合成核酸分子が、ルシフェラーゼをコードする、項目1に記載の合成核酸分子。
(項目10) 上記野生型核酸配列が、Renillaルシフェラーゼをコードする、項目9に記載の合成核酸分子。
(項目11) 上記野生型核酸配列が、甲虫ルシフェラーゼをコードする、項目9に記載の合成核酸分子。
(項目12) 上記合成核酸分子が、224位のアミノ酸バリンをコードする、項目11に記載の合成核酸分子。
(項目13) 上記合成核酸分子が、224位のアミノ酸ヒスチジン、247位のヒスチジン、346位のイソロイシン、348位のグルタミン、またはこれらのいずれかの組み合わせをコードする、項目11に記載の合成核酸分子。
(項目14) 上記合成核酸分子において異なるコドンの多数が、哺乳動物においてより頻繁に用いられる、項目1に記載の合成核酸分子。
(項目15) 上記合成核酸分子において異なるコドンの大多数が、ヒトにおいて好ましいコドンである、項目1に記載の合成核酸分子。
(項目16) 上記合成核酸分子において異なるコドンの大多数が、植物において好ましいコドンである、項目1に記載の合成核酸分子。
(項目17) 上記合成核酸分子が、配列番号21(Rlucver2)または配列番号22(Rluc−最終)を含む、項目9に記載の合成核酸分子。
(項目18) 上記合成核酸分子が、配列番号7(GRver5)、配列番号8(GRver6)、配列番号9(GRver5.1)、または配列番号297(GRver5.1)を含む、項目9に記載の合成核酸分子。
(項目19) 上記合成核酸分子が、配列番号14(RDver5)、配列番号15(RDver7)、配列番号16(RDver5.1)、配列番号299(RDver5.1)、配列番号17(RDver5.2)、配列番号18(RD156−1H9)、または配列番号301(RD156−1H9)を含む、項目9に記載の合成核酸分子。
(項目20) 上記異なるコドンの大多数が、ヒトのコドンCGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGCおよびTTCである、項目15に記載の合成核酸分子。
(項目21) 上記異なるコドンの大多数が、ヒトのコドンCGC、CTG、TCT、ACC、CCA、GCC、GGC、GTC、およびATC、またはコドンCGT、TTG、AGC、ACT、CCT、GCT、GGT、GTG、およびATTである、項目15に記載の合成核酸分子。
(項目22) 上記異なるコドンの大多数が、植物のコドンCGC、CTT、TCT、TCC、ACC、CCA、CCT、GCT、GGA、GTG、ATC、ATT、AAG、AAC、CAA、CAC、GAG、GAC、TAC、TGCおよびTTCである、項目16に記載の合成核酸分子。
(項目23) 上記異なるコドンの大多数が、植物のコドンCGC、CTT、TCT、ACC、CCA、GTC、GGA、GTC、およびATC、またはコドンCGT、TGG、AGC、ACT、CCT、GCC、GGT、GTG、およびATTである、項目16に記載の合成核酸分子。
(項目24) 上記合成核酸分子が、上記野生型核酸配列のレベルよりも、より高いレベルで、哺乳動物宿主細胞において発現される、項目1に記載の合成核酸分子。
(項目25) 上記合成核酸分子が、増加した数の、CTGまたはTTGのロイシンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目26) 上記合成核酸分子が、増加した数の、GTGまたはGTCのバリンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目27) 上記合成核酸分子が、増加した数の、GGCまたはGGTのグリシンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目28) 上記合成核酸分子が、増加した数の、ATCまたはATTのイソロイシンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目29) 上記合成核酸分子が、増加した数の、CCAまたはCCTのプロリンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目30) 上記合成核酸分子が、増加した数の、CGCまたはCGTのアルギニンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目31) 上記合成核酸分子が、増加した数の、AGCまたはTCTのセリンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目32) 上記合成核酸分子が、増加した数の、ACCまたはACTのスレオニンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目33) 上記合成核酸分子が、増加した数の、GCCまたはGCTのアラニンをコードするコドンを有する、項目1に記載の合成核酸分子。
(項目34) 上記異なる合成核酸分子におけるコドンが、上記野生型核酸配列における対応するコドンと同じアミノ酸をコードする、項目1に記載の合成核酸分子。
(項目35) 項目1に記載の合成核酸分子を含む、プラスミド。
(項目36) 細胞におけるプロモーター機能に連結した項目1に記載の合成核酸分子を含む、発現ベクター。
(項目37) 上記合成核酸分子が、Kozakコンセンサス配列に作動可能に連結される、項目36に記載の発現ベクター。
(項目38) 上記プロモーターが、哺乳動物細胞において機能的である、項目36に記載の発現ベクター。
(項目39) 上記プロモーターが、ヒト細胞において機能的である、項目36に記載の発現ベクター。
(項目40) 上記プロモーターが、植物細胞において機能的である、項目36に記載の発現ベクター。
(項目41) 上記発現ベクターが、マルチクローニング部位をさらに含む、項目36に記載の発現ベクター。
(項目42) 上記発現ベクターが、上記プロモーターと上記合成核酸分子との間に配置された、マルチクローニング部位を含む、項目41に記載の発現ベクター。
(項目43) 上記発現ベクターが、上記合成核酸分子から下流に配置されたマルチクローニング部位を含む、項目41に記載の発現ベクター。
(項目44) 項目36に記載の発現ベクターを含む、宿主細胞。
(項目45) 適切な容器手段内に、項目36に記載の発現ベクターを含む、レポーター遺伝子発現キット。
(項目46) 配列番号9(GRver5.1)または配列番号18(RD156−1H9)によりコードされる、単離されたポリペプチド。
(項目47) 配列番号22(Rluc−最終)、配列番号9(GRver5.1)、配列番号18(RD156−1H9)、配列番号297(GRver5.1)、配列番号301(RD156−1H9)、またはこれらの相補鎖に対して、ストリンジェントなハイブリダイゼーション条件下でハイブリダイズする、ポリヌクレオチド。
(項目48) オープンリーディングフレームを含む、合成核酸分子を調製する方法であって、上記方法は、以下:
a) 少なくとも100アミノ酸を有するポリペプチドをコードする親核酸配列における複数の転写調節配列を変化させて、上記親核酸配列に対して少なくとも3倍少ない転写調節配列を有する合成核酸分子を得る工程であって、ここで、上記転写調節配列は、転写因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列、およびプロモーター配列からなる群より選択される、工程;ならびに
b) 減少した数の転写調節配列を有する上記合成核酸配列中のコドンの25%より多くを変化させて、さらなる合成核酸分子を得る工程であって、ここで、変化させたコドンは、増加した数の転写調節配列を生じない工程であり、ここで、上記さらなる合成核酸分子は、上記親核酸配列によりコードされる上記ポリペプチドに対して、少なくとも85%のアミノ酸配列同一性を有するポリペプチドをコードする、工程、
を包含する、方法。
(項目49) オープンリーディングフレームを含む、合成核酸分子を調製する方法であって、上記方法は、以下:
a) 少なくとも100アミノ酸を有するポリペプチドをコードする親核酸配列中のコドンの25%より多くを変化させて、コドンが変化した合成核酸分子を得る工程、および
b) 上記コドンが変化した合成核酸分子中の複数の転写調節配列を変化させて、異なるコドンでのコドンの無作為選択を有する合成核酸分子に対して、少なくとも3倍少ない転写調節配列を有する、さらなる合成核酸分子を得る工程であって、ここで、上記転写調節配列は、転写因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列、およびプロモーター配列からなる群より選択される工程であり、ここで、上記さらなる合成核酸分子は、上記親核酸配列によりコードされるポリペプチドに対して、少なくとも85%のアミノ酸配列同一性を有するポリペプチドをコードする、工程、
を包含する、方法。
(項目50) 上記親核酸配列が、レポーター分子をコードする、項目48または49に記載の方法。
(項目51) 上記親核酸配列が、ルシフェラーゼをコードする、項目48または49に記載の方法。
(項目52) 上記合成核酸分子が、上記親核酸配列に対して、中程度のストリンジェシーハイブリダイゼーション条件下でハイブリダイズする、項目48または49に記載の方法。
(項目53) 上記変化したコドンが、上記親核酸配列における対応するコドンと同じアミノ酸をコードする、項目48または49に記載の方法。
(項目54) 項目48または49に記載の方法によって調製される、さらなる合成核酸分子である、合成核酸分子。
(項目55) ポリペプチドをコードする親核酸配列のコドンが違うバージョンである、少なくとも2つの合成核酸分子を調製する方法であって、上記方法は、以下:
a) 親核酸配列を変化させて、増加した数の第1の複数のコドンを有する合成核酸分子を得る工程であって、上記増加した数の第1の複数のコドンは、上記親核酸配列における上記コドンの数に関連して、選択された宿主細胞においてより頻繁に用いられる、工程;および
b) 親核酸配列を変化させて、増加した数の第2の複数のコドンを有するさらなる合成核酸分子を得る工程であって、上記増加した数の第2の複数のコドンは、上記親核酸配列における上記コドンの数に関連して、上記宿主細胞においてより頻繁に用いられる、工程、
を包含し、
ここで、上記第1の複数のコドンは、上記第2の複数のコドンと異なり、そしてここで、上記合成核酸分子および上記さらなる合成核酸分子は、同じポリペプチドをコードする、方法。
(項目56) 項目55に記載の方法であって、上記方法は、上記合成核酸分子、上記さらなる合成核酸分子、またはこれらの両方において、複数の転写調節配列を変化させて、少なくとも1つのなおさらなる合成核酸分子を得る工程であって、上記なおさらなる合成核酸分子は、上記合成核酸分子、上記さらなる合成核酸分子、またはこれらの両方に対して、少なくとも3倍少ない転写調節配列を有する、工程、をさらに包含する、方法。
(項目57) 項目55に記載の方法であって、上記方法は、上記第1の合成配列中の少なくとも1つのコドンを変化させて、第1の改変された合成配列を得る工程であって、上記第1の改変された合成配列は、上記第1の合成核酸配列によりコードされるポリペプチドに対して、少なくとも1つのアミノ酸置換を有するポリペプチドをコードする、工程、をさらに包含する、方法。
(項目58) 項目56に記載の方法であって、上記方法は、上記第2の合成核酸配列中の少なくとも1つのコドンを変化させて、第2の改変された合成配列を得る工程であって、上記第2の改変された合成配列は、上記第1の合成核酸配列によりコードされるポリペプチドに対して、少なくとも1つのアミノ酸置換を有するポリペプチドをコードする工程、をさらに包含する、方法。
(項目59) 上記合成配列が、ルシフェラーゼをコードする、項目55に記載の方法。
(項目60) 上記合成核酸分子が、同一の条件下で、細胞または細胞抽出物中の上記野生型核酸配列のレベルの少なくとも110%であるレベルで発現される、項目1に記載の合成核酸分子。
(項目61) 項目1に記載の合成核酸分子であって、上記合成核酸分子によりコードされるポリペプチドが、上記野生型核酸配列によりコードされるポリペプチドに対して、少なくとも90%の連続する配列同一性を有する、合成核酸分子。
(項目62) 項目1に記載の合成核酸分子であって、上記合成核酸分子によりコードされるポリペプチドは、上記野生型核酸配列によりコードされるポリペプチドに対して、アミノ酸配列が同一である、合成核酸分子。
(項目63) 親核酸配列を含むベクターに対して、少なくとも3倍少ない転写調節配列を有する合成核酸分子を含む、ベクターであって、ここで、上記転写調節配列は、転写調節因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、およびプロモーター配列からなる群より選択される、ベクター。
(項目64) 上記合成核酸分子が、ポリペプチドをコードしない、項目63に記載のベクター。
(項目65) 項目48または49に記載の方法であって、上記方法は、上記さらなる合成核酸分子を変化させて、上記親核酸配列によりコードされるポリペプチドに対して、少なくとも1つのアミノ酸置換を有するポリペプチドをコードさせる工程をさらに包含する、方法。
(項目66) 項目48または49に記載の方法であって、ここで、上記転写調節配列の変化は、上記合成核酸分子によりコードされるポリペプチドへとアミノ酸置換を導入しない、方法。
(発明の要旨)
本発明は、ポリペプチドコード領域の少なくとも300ヌクレオチドを含み、ポリペプチドをコードする野生型核酸配列とは25%より多いコドンが異なるコドン組成を有し、そして異なるコドンが無作為(ランダム)に選択される場合に生じるよりも、少なくとも3倍少ない、好ましくは少なくとも5倍少ない転写調節配列を有する、合成核酸分子を提供する。好ましくは、この合成核酸分子は、それが由来する、天然に存在する(ネイティブまたは野生型の)ポリペプチド(タンパク質)のアミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%同一なアミノ酸配列を有するポリペプチドをコードする。従って、いくつかの特定のアミノ酸変化がまた、合成核酸分子によってコードされるポリペプチドの特定の表現型特徴を変更することが所望され得ることが認識される。好ましくは、アミノ酸配列同一性は、少なくとも100連続アミノ酸残基にわたる。本発明の1つの実施形態において、異なる合成核酸分子中のコドンは、好ましくは、野生型核酸分子中の対応するコドンと同じアミノ酸をコードする。
【0009】
合成核酸分子において減少される転写調節配列としては、以下が挙げられるが、これらに限定されない:転写因子結合配列、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列およびプロモーター配列の任意の組み合わせ。転写調節配列は、当該分野で周知である。
【0010】
本発明の合成核酸分子は、30%、35%、40%より多いか、または45%より多い、例えば、50%、55%、60%より多いコドンが、野生型核酸配列のコドンとは異なるコドン組成を有することが好ましい。本発明における使用のために好ましいコドンは、特定の生物において同じアミノ酸について、少なくとも1つの他のコドンよりも高頻度で使用され、そしてより好ましくは、この生物において低使用頻度ではなく、そして合成核酸分子の発現についてクローニングまたはスクリーニングするために使用される生物(例えば、E.coli)において低使用頻度ではない。さらに、特定のアミノ酸(すなわち、3つ以上のコドンを有するアミノ酸)について好ましいコドンは、他の(好ましくない)コドンよりも高頻度で使用される2つ以上のコドンを含み得る。1つの生物において別の生物におけるよりも高頻度で使用される、合成核酸分子中のコドンの存在は、そのコドンをより高頻度で使用する生物の細胞に導入される場合、その細胞において野生型または親の核酸分子の発現よりも高レベルで発現される合成核酸分子を生じる。例えば、本発明の合成核酸分子は、同一条件(例えば、細胞培養条件、ベクター骨格など)下で、細胞または細胞抽出物における野生型核酸配列の発現レベルの、少なくとも約110%、例えば、150%、200%、500%以上(1000%、5000%、または10000%)のレベルで発現される。
【0011】
本発明の1つの実施形態において、異なるコドンは、哺乳動物においてより高頻度で使用されるが、本発明の別の実施形態において、異なるコドンは、植物においてより高頻度で使用される。特定の型の哺乳動物(例えば、ヒト)は、別の型の哺乳動物とは異なるセットの好適なコドンを有し得る。同様に、特定の型の植物は、別の型の植物とは異なる好適なセットのコドンを有し得る。本発明の1つの実施形態において、異なるコドンの大多数は、所望の宿主細胞において好ましいコドンである。哺乳動物(例えば、ヒト)および植物について好ましいコドンは、当該分野で公知である(例えば、Wadaら、1990)。例えば、好ましいヒトコドンとしては、以下が挙げられるが、これらに限定されない:CGC(Arg)、CTG(Leu)、TCT(Ser)、AGC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCC(Ala)、GGC(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAG(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)およびTTC(Phe)(Wadaら、1990)。従って、本発明の好ましい「ヒト化」合成核酸分子は、増大した数の好ましいヒトコドン(例えば、CGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGC、TTCまたはこれらの任意の組み合わせ)を有することによって、野生型の核酸配列とは異なるコドン組成を有する。例えば、本発明の合成核酸分子は、野生型の核酸配列に対して、増大した数のロイシンをコードするコドン、CTGまたはTTG、バリンをコードするコドン、GTGまたはGTC、グリシンをコードするコドン、GGCまたはGGT、イソロイシンをコードするATCまたはATT、プロリンをコードするコドン、CCAまたはCCT、アルギニンをコードするコドン、CGCまたはCGT、セリンをコードするコドン、AGCまたはTCT、スレオニンをコードするコドン、ACCまたはACT、アラニンをコードするコドン、GCCまたはGCT、あるいはこれらの任意の組み合わせを有し得る。同様に、植物においてより高頻度で使用される増大した数のコドンを有する合成核酸分子は、以下:CGC(Arg)、CTT(Leu)、TCT(Ser)、TCC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCT(Ser)、GGA(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAA(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)、TTC(Phe)またはこれらの任意の組み合わせ(Murrayら、1989)が挙げられるが、これらに限定されない増大した数の植物コドンを有することによって、野生型または親の核酸配列とは異なるコドン組成を有する。好ましいコドンは、異なる型の植物について異なり得る(Wadaら、1990)。
【0012】
コドンの選択は、例えば、増大した数のヌクレオチド置換または減少した数の転写調節配列を有することが望まれる、多くの因子によって影響され得る。ある(例えば、転写因子結合部位の除去を可能にする)環境下で、好ましくないコドンを、好ましいコドン以外のコドンまたは最も好ましいコドン以外のコドンによって置換することが所望であり得る。例えば、合成核酸分子のコドンが異なるバージョンを調製する他の条件下で、好ましいコドン対は、多数のミスマッチ塩基および上記の基準に基づいて選択される。
【0013】
1つの生物において他の生物におけるよりも、より高頻度で使用される、合成核酸分子中のコドンの存在は、これらのコドンを使用する生物の細胞に導入される場合に、この細胞において野生型または親の核酸配列の発現レベルよりも高いレベルで発現される合成核酸分子を生じる。
【0014】
本発明の合成核酸分子は、選択マーカータンパク質またはレポータータンパク質をコードし得る。しかし、本発明は、合成レポーター遺伝子または合成選択マーカー遺伝子に限定されない、任意の核酸を適用する。レポーター分子である本発明の合成核酸分子の1つの実施形態において、この合成核酸分子は、野生型または親のRenillaルシフェラーゼまたは甲虫ルシフェラーゼの核酸配列とは異なるコドン組成を有するルシフェラーゼをコードする。本発明の合成コメツキムシルシフェラーゼ核酸分子は、必要に応じて、224位でアミノ酸バリンをコードし得るか(すなわち、これは、緑色光を発する)、または必要に応じて、224位でアミノ酸ヒスチジン、247位でアミノ酸ヒスチジン、346位でアミノ酸イソロイシン、348位でアミノ酸グルタミン、またはこれらの組み合わせをコードし得る(すなわち、これは、赤色光を発する)。野生型Renillaルシフェラーゼに関連する好ましい合成ルシフェラーゼ核酸分子としては、配列番号21(Rlucver2)または配列番号22(Rluc−最終(Rluc−final))が挙げられるが、これらに限定されない。コメツキムシルシフェラーゼ核酸配列に関連する好ましい合成ルシフェラーゼ核酸分子としては、以下が挙げられるが、これらに限定されない:配列番号7(GRver5)、配列番号8(GR6)、配列番号9(GRver5.1)、配列番号14(RDver5)、配列番号15(RD7)、配列番号16(RDver5.1)、配列番号17(RDver5.2)または配列番号18(RD156−1H9)。
【0015】
本発明はまた、発現カセットを提供する。本発明の発現カセットは、細胞において機能的なプロモーターに作動可能に連結した、本発明の合成核酸分子を含む。好ましいプロモーターは、哺乳動物細胞において機能的であるプロモーター、および植物細胞において機能的であるプロモーターである。必要に応じて、この発現カセットは、他の配列(例えば、制限酵素認識配列およびKozak配列)を含み得、そしてより大きいポリヌクレオチド分子(例えば、プラスミド、コスミド、人工染色体またはベクター(例えば、ウイルスベクター))の一部であり得る。
【0016】
本発明の合成核酸分子を含む宿主細胞、単離されたポリペプチド(例えば、本発明の合成核酸分子によってコードされる融合ポリペプチド)および組成物、ならびに適切な容器手段中に本発明の合成核酸分子またはこれによってコードされるポリペプチドを含み、必要に応じて指示手段を含むキットがまた提供される。好ましい単離されたポリペプチドとしては、配列番号31(GRver5.1)、配列番号226(Rluc−最終)または配列番号223(RD156−1H9)が挙げられるが、これらに限定されない。
【0017】
本発明はまた、親核酸配列(野生型または別の合成核酸配列のいずれか)を遺伝的に変更することによって、本発明の合成核酸分子を調製する方法を提供する。この方法を使用して、少なくとも100アミノ酸を含むポリペプチドをコードする合成核酸分子を調製し得る。本発明の1つの実施形態は、レポータータンパク質または選択マーカータンパク質をコードする合成遺伝子の調製である。本発明の方法を使用して、コドン使用頻度を変更し、そして任意のオープンリーディングフレーム中の転写調節配列の数を減少させるか、またはベクター骨格中の転写調節部位の数を減少させ得る。好ましくは、合成核酸分子中のコドン使用頻度は、この核酸分子の発現が所望される宿主生物の使用頻度を反映して変更されるが、親核酸分子に対して潜在的な転写調節配列の数もまた減少させる。
【0018】
従って、本発明は、オープンリーディングフレームを含む合成核酸分子を調節するための方法を提供する。この方法は、少なくとも100アミノ酸を有するポリペプチドをコードする親(野生型または合成)核酸配列中の複数の転写調節配列を変更(例えば、減少または排除)して、減少した数の転写調節配列を有し、そして好ましくは親核酸分子と同じアミノ酸をコードする合成核酸分子を得る工程を包含する。この転写調節配列は、転写因子結合部位、イントロンスプライス部位、ポリ(A)付加部位、エンハンサー配列およびプロモーター配列からなる群より選択され、そして得られた合成核酸分子は、親核酸配列と比較して、少なくとも3倍少ない、好ましくは5倍少ない転写調節配列を有する。この方法はまた、減少した数の転写調節配列を有する合成核酸配列中のコドンの25%より多くを変更して、さらなる合成核酸分子を得る工程を包含し、ここで、変更されたコドンは、減少した数の転写調節配列を有する合成核酸分子中および/または親核酸配列中の、対応する位置と同じアミノ酸をコードする。好ましくは、変更されたコドンは、転写調節配列の増大を生じない。好ましくは、さらなる合成核酸分子は、親核酸配列によってコードされるポリペプチドのアミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%の連続アミノ酸同一性を有するポリペプチドをコードする。
【0019】
あるいは、この方法は、少なくとも100アミノ酸を有するポリペプチドをコードする親核酸配列中の25%より多いコドンを変更して、コドンが変更された合成核酸分子を得る工程を包含し、ここで、変更されたコドンは、親核酸配列中の対応する位置に存在するアミノ酸と同じアミノ酸をコードする。次いで、コドンが変更された合成核酸分子中の複数の転写調節配列が変更されて、さらなる合成核酸分子を得る。好ましくは、変更されたコドンは、転写調節配列の増大を生じない。また、好ましくは、このさらなる合成核酸分子は、親核酸分子によってコードされるポリペプチドのアミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%の連続アミノ酸配列同一性を有するポリペプチドをコードする。本発明の方法によって調製される、合成(さらなる合成を含む)核酸分子もまた、提供される。
【0020】
本明細書中以下に記載されるように、本発明の方法を、コメツキムシルシフェラーゼおよびRenillaルシフェラーゼの核酸配列を用いて使用した。これらの核酸分子は両方ともルシフェラーゼタンパク質をコードするが、これらは、完全に異なる科に由来し、進化的に広く分離されている。これらのタンパク質は、無関係のアミノ酸配列(タンパク質構造)を有し、そして異なる化学的基質を使用する。これらが「ルシフェラーゼ」との名称を共有するという事実は、これらが、同じ科または大まかに類似する科に由来することを意味するとは解釈されるべきではない。これらの方法は、他の所望の物理的特性または生化学的特性(タンパク質の半減期を含む)に負の効果をもたらすことなく、有意に増大した哺乳動物発現レベルを示す合成ルシフェラーゼ核酸分子を生成し、既知の転写調節エレメントの大部分をまた欠いた。
【0021】
本発明はまた、高度に関連したポリペプチドをコードする少なくとも2つの合成核酸分子を提供するが、これらの合成核酸分子は、互いに増大した数のヌクレオチド差異を有する。これらの差異は、これらの分子が両方とも1つの細胞中に存在する場合、2つの合成核酸分子間の組換え頻度を減少させる(すなわち、これらは、合成核酸分子の「コドンが異なる」バージョンである)。従って、本発明は、ポリペプチドをコードする親核酸分子のコドンが異なるバージョンである、少なくとも2つの合成核酸分子を調製するための方法を提供する。この方法は、親核酸分子を変更して、親核酸分子中に存在するコドンの数に対して増大した数の、選択された宿主細胞中でより高頻度で使用される第一の複数のコドンを有する、第一の合成核酸分子を得る工程を包含する。必要に応じて、この第一の合成核酸分子はまた、親核酸配列と比較して、減少した数の転写調節配列を有する。この親核酸分子もまた変更されて、親核酸配列中のコドンの数に対して増大した数の、宿主細胞中でより高頻度で使用される第二の複数のコドンを有する第二の合成核酸分子が得られ、ここで、第一の複数のコドンは、第二の複数のコドンとは異なり、そして、この第一および第二の合成核酸分子は、好ましくは、同じポリペプチドをコードする。必要に応じて、第二の合成核酸分子は、親核酸分子と比較して減少した数の転写調節配列を有する。次いで、合成分子のいずれかまたは両方は、さらに改変され得る。
明らかに、本発明は、多くの遺伝子を用いる適用、そして生命科学研究、農業遺伝学、遺伝子治療、発生科学および創薬を含むがこれらに限定されない、多くの科学分野にわたる適用を有する。
【図面の簡単な説明】
【0022】
【図1】図1は、コドンおよびこれらが対応するアミノ酸を示す。
【図2−1】図2は、以下のヌクレオチド配列比較を示す:黄緑色(YG)コメツキムシルシフェラーゼ核酸配列(YG#81−6G01;配列番号2)および種々の合成緑色(GR)コメツキムシルシフェラーゼ核酸配列(GRver1、配列番号3;GRver2、配列番号4;GRver3、配列番号5;GRver4、配列番号6;GRver5、配列番号7;GR6、配列番号8;GRver5.1、配列番号9)、および種々の赤色(RD)コメツキムシルシフェラーゼ核酸配列(RDver1、配列番号10;RDver2、配列番号11;RDver3、配列番号12;RDver4、配列番号13;RDver5、配列番号14;RD7、配列番号15;RDver5.1、配列番号16;RDver5.2、配列番号17;RD156−1H9、配列番号18)。四角で囲まれたヌクレオチドは、配列番号2における相同な位置に存在するヌクレオチドと異なるヌクレオチドである。
【図2−2】図2−1の続き。
【図2−3】図2−2の続き。
【図2−4】図2−3の続き。
【図2−5】図2−4の続き。
【図2−6】図2−5の続き。
【図2−7】図2−6の続き。
【図2−8】図2−7の続き。
【図2−9】図2−8の続き。
【図2−10】図2−9の続き。
【図2−11】図2−10の続き。
【図2−12】図2−11の続き。
【図2−13】図2−12の続き。
【図2−14】図2−13の続き。
【図3−1】図3は、以下のアミノ酸配列比較を示す:YGコメツキムシルシフェラーゼアミノ酸配列(YG#81−6G01、配列番号24)および種々の合成GRコメツキムシルシフェラーゼアミノ酸配列(GRver1、配列番号25;GRver2、配列番号26;GRver3、配列番号27;GRver4、配列番号28;GRver5、配列番号29;GR6、配列番号30;GRver5.1、配列番号31)、および種々の赤色(RD)コメツキムシルシフェラーゼアミノ酸配列(RDver1、配列番号32;RDver2、配列番号33;RDver3、配列番号34;RDver4、配列番号218;RDver5、配列番号219;RD7、配列番号220;RDver5.1、配列番号221;RDver5.2、配列番号222;RD156−1H9、配列番号223)。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号24中の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図3−2】図3−1の続き。
【図3−3】図3−2の続き。
【図3−4】図3−3の続き。
【図3−5】図3−4の続き。
【図4】図4は、YG#81−6G01、GRver1、RDver1、GRver5、およびRDver5、およびヒト(HUM)におけるコドン使用頻度、ならびにYG#81−6G01、GRver5、RDver5、およびヒトにおける相対的コドン使用頻度を示す。
【図5A】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5B】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5C】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5D】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5E】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5F】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5G】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5H】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5I】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5J】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図5K】図5は、以下に関するコドン使用頻度を示す:YG#81−6G01(図5A)、およびGR/RD合成核酸配列、GRver1(図5B)、RDver1(図5C)、GRver2(図5D)、RDver2(図5E)、GRver3(図5F)、RDver3(図5G)、GRver4(図5H)、RDver4(図5I)、GRver5(図5J)、RDver5(図5K)。
【図6−1】図6は、合成GR/RDルシフェラーゼ遺伝子を調製するために用いられるオリゴヌクレオチド(配列番号35〜245)を示す。
【図6−2】図6−1の続き。
【図6−3】図6−2の続き。
【図6−4】図6−3の続き。
【図7−1】図7は、以下のヌクレオチド配列比較を示す:野生型Renilla reniformisルシフェラーゼ核酸配列(GenBank登録番号M63501)(RELLUC、配列番号19)、および種々の合成Renillaルシフェラーゼ核酸配列(Rlucver1、配列番号20;Rlucver2、配列番号21;Rluc−最終、配列番号22)。四角で囲まれたヌクレオチドは、配列番号19の相同な位置に存在するヌクレオチドと異なるヌクレオチドである。
【図7−2】図7−1の続き。
【図7−3】図7−2の続き。
【図8】図8は、以下のアミノ酸配列比較を示す:野生型Renilla reniformisルシフェラーゼアミノ酸配列(RELLUC、配列番号224)、および種々の合成Renilla reniformisルシフェラーゼアミノ酸配列(Rlucver1、配列番号225;Rlucver2、配列番号226;Rluc−最終、配列番号227)。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号224の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図9A】図9は、野生型(A) 対 合成(B)Renillaルシフェラーゼ遺伝子のコドン使用頻度を示す。選択された生物体におけるコドン使用頻度は、例えば、Wadaら、1990;Sharpら、1988;Aotaら、1988;およびSharpら、1987を、そして、植物コドンについては、Murrayら、1989を参照のこと。
【図9B】図9は、野生型(A) 対 (B)Renillaルシフェラーゼ遺伝子のコドン使用頻度を示す。選択された生物体におけるコドン使用頻度は、例えば、Wadaら、1990;Sharpら、1988;Aotaら、1988;およびSharpら、1987を、そして、植物コドンについては、Murrayら、1989を参照のこと。
【図10】図10は、合成Renillaルシフェラーゼ遺伝子を調製するために用いられるオリゴヌクレオチド(配列番号246〜292)を示す。
【図11−1】図11は、以下のヌクレオチド配列比較を示す:野生型黄緑色(YG)コメツキムシルシフェラーゼ核酸配列(LUCPPLYG、配列番号1)および合成緑色コメツキムシルシフェラーゼ核酸配列(GRver5.1、配列番号9)、および合成赤色コメツキムシルシフェラーゼ核酸配列(RD156−1H9、配列番号18)。四角で囲まれたヌクレオチドは、配列番号1の相同な位置に存在するヌクレオチドと異なるヌクレオチドである。両方の合成配列は、LUCPPLYGと、コドンの25%を超えて異なるコドン組成を有し、そして異なるコドンにおけるコドンの無作為選択に対して、少なくとも3倍少ない転写調節配列を有する。
【図11−2】図11−1の続き。
【図11−3】図11−2の続き。
【図12】図12は、以下のアミノ酸配列比較を示す:野生型YGコメツキムシルシフェラーゼアミノ酸配列(LUCPPLYG、配列番号23)および合成GRコメツキムシルシフェラーゼアミノ酸配列(GRver5.1、配列番号31)および赤色(RD)コメツキムシルシフェラーゼアミノ酸配列(RD156−1H9、配列番号223)。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号23の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図13−1】図13は、pRLベクターシリーズを示す。全てのベクターは、本明細書中でさらに記載されるような、Renilla野生型または合成遺伝子を含む。図13Aは、pGL3ベクター(Promega Corp.)中のRenillaルシフェラーゼ遺伝子を示す。図13Bは、Renillaルシフェラーゼコリポーターベクターシリーズを示す。pRL−TKは、単純疱疹ウイルス(HSV)tkプロモーターを有し;pRL−SV40は、SV40ウイルス初期エンハンサー/プロモーターを有し;pRL−CMVは、サイトメガロウイルス(CMV)エンハンサーおよび最初期プロモーターを有し;pRL−nullは、MCS(マルチクローニング部位)を有するが、プロモーターもエンハンサーも有さず;pRL−TK(Int−)は、他のプラスミドに存在するイントロンを有さないHSV/tkプロモーターを有し;pR−GL3Bは、pGL−3基本骨格(Promega Corp.)を有し;pR−GL3 TKは、HSV tkプロモーターを有するpR−GL3基本骨格を有する。
【図13−2】図13は、pRLベクターシリーズを示す。全てのベクターは、本明細書中でさらに記載されるような、Renilla野生型または合成遺伝子を含む。図13Aは、pGL3ベクター(Promega Corp.)中のRenillaルシフェラーゼ遺伝子を示す。図13Bは、Renillaルシフェラーゼコリポーターベクターシリーズを示す。pRL−TKは、単純疱疹ウイルス(HSV)tkプロモーターを有し;pRL−SV40は、SV40ウイルス初期エンハンサー/プロモーターを有し;pRL−CMVは、サイトメガロウイルス(CMV)エンハンサーおよび最初期プロモーターを有し;pRL−nullは、MCS(マルチクローニング部位)を有するが、プロモーターもエンハンサーも有さず;pRL−TK(Int−)は、他のプラスミドに存在するイントロンを有さないHSV/tkプロモーターを有し;pR−GL3Bは、pGL−3基本骨格(Promega Corp.)を有し;pR−GL3 TKは、HSV tkプロモーターを有する基本骨格を有する。
【図13−3】図13−2の続き。
【図14】図14は、CHO細胞における、合成(Rluc−最終(Rluc−final)RenillaルシフェラーゼおよびネイティブRenillaルシフェラーゼの半減期を示す。
【図15A】図15は、Renillaルシフェラーゼ核酸配列のインビトロでの転写/翻訳を示す。A)t=0〜60分;B)直線範囲。
【図15B】図15は、Renillaルシフェラーゼ核酸配列のインビトロでの転写/翻訳を示す。A)t=0〜60分;B)直線範囲。
【図15C】図15は、ウサギ網状赤血球溶解物における、ネイティブRenillaルシフェラーゼRNAおよび合成(Rluc−最終)RenillaルシフェラーゼRNAのインビトロでの翻訳を示す。RNAを定量し、そして同じ量を、図15A〜Bに示される翻訳反応と同じ様に用いた。C)t=0〜60分;D)直線範囲。
【図15D】図15は、ウサギ網状赤血球溶解物における、ネイティブRenillaルシフェラーゼRNAおよび合成(Rluc−最終)RenillaルシフェラーゼRNAのインビトロでの翻訳を示す。RNAを定量し、そして同じ量を、図15A〜Bに示される翻訳反応と同じ様に用いた。C)t=0〜60分;D)直線範囲。
【図15E】図15は、コムギ麦芽抽出物における、ネイティブRenillaRNAおよび合成(Rluc−最終)RenillaRNAの翻訳を示す。E)t=0〜60分;F)直線範囲。
【図15F】図15は、コムギ麦芽における、ネイティブRenillaルシフェラーゼRNAおよび合成(Rluc−最終)RenillaルシフェラーゼRNAのインビトロでの翻訳を示す。E)t=0〜60分;F)直線範囲。
【図16−1】図16は、合成Renilla核酸配列からの高い発現が、同時トランスフェクションアッセイにおけるプロモーター干渉の危険性を減らしたことを示す。CHO細胞を、以下を用いて同時トランスフェクトした:一定量(50ng)のホタルルシフェラーゼ発現ベクター(pGL3コントロールベクター(SV40のプロモーターおよびエンハンサーを有する);Luc+)、ならびにネイティブRenillaルシフェラーゼ遺伝子(0ng、50ng、100ng、500ng、1μg、または2μg)および合成Renillaルシフェラーゼ遺伝子(0ng、5ng、10ng、50ng、100ng、または200ng)を有するpRLベクター。
【図16−2】図16−1の続き。
【図17A】図17Aは、ホタルおよびコメツキムシのルシフェラーゼにより触媒される反応を示す。
【図17B】図17Bは、Renillaルシフェラーゼにより触媒される反応を示す。
【図18−1】図18は、pGL3ベクターにおけるコメツキムシルシフェラーゼのヌクレオチド配列および推定アミノ酸配列を示す(pGL3中のGRver5.1、配列番号298をコードする配列番号297;pGL3中のRDver5.1、配列番号300をコードする配列番号299;およびpGL3中のRD156−1H9、配列番号302をコードする配列番号301)。GRver5.1核酸配列、RDver5.1核酸配列、およびRD156−1H9核酸配列を、pGL3ベクターにクローニングするために、開始コドンにNco I部位を有するオリゴヌクレオチドを用いた。このことにより、2位でのバリンへのアミノ酸置換を生じた。
【図18−2】図18−1の続き。
【図18−3】図18−2の続き。
【図18−4】図18−3の続き。
【発明を実施するための形態】
【0023】
(発明の詳細な説明)
(定義)
用語「遺伝子」とは、本明細書中で使用される場合、ポリペプチドまたはタンパク質前駆体の生成に必要なコード配列を含むDNA配列をいう。このポリペプチドは、全長コード配列によってコードされ得るか、または所望のタンパク質特性が維持される限り、コード配列の任意の部分によってコードされ得る。
【0024】
「核酸」は、本明細書中で使用される場合、共有結合したヌクレオチド配列であり、1つのヌクレオチドのペントースの3’位は、次のペントースの5’位に、ホスホジエステル基によって連結され、そしてヌクレオチド残基(塩基)は、特定の配列(すなわち、ヌクレオチドの直線的な順番)で結合される。「ポリヌクレオチド」は、本明細書中で使用される場合、約100ヌクレオチド長より長い配列を含む核酸である。「オリゴヌクレオチド」は、本明細書中で使用される場合、短いポリヌクレオチドまたはポリヌクレオチドの一部である。オリゴヌクレオチドは、代表的に、約2〜約100塩基の配列を含む。単語「オリゴ」は、時々、単語「オリゴヌクレオチド」の代わりに使用される。
【0025】
核酸分子は、「5’末端(5’端)」および「3’末端(3’端)」を有するといわれる。なぜなら、核酸ホスホジエステル結合は、引き続くモノヌクレオチドのペントース環の5’炭素と3’炭素との間で生じるからである。新しい結合が5’炭素に対して生じるポリヌクレオチドの末端が、5’末端ヌクレオチドである。新しい結合が3’炭素に対して生じるポリヌクレオチドの末端が、3’末端ヌクレオチドである。本明細書中で使用される場合、末端ヌクレオチドは、3’末端または5’末端の末端位置のヌクレオチドである。
【0026】
DNA分子は、「5’端」および「3’端」を有するといわれる。なぜなら、モノヌクレオチドは、1つのモノヌクレオチドのペントース環の5’ホスフェートが、ホスホジエステル結合を介して一方向で、隣のペントースの3’酸素に結合するような様式で反応して、オリゴヌクレオチドを作製するからである。従って、オリゴヌクレオチドの末端は、その5’ホスフェートがモノヌクレオチドペントース環の3’酸素に連結されない場合、「5’端」と称され、そしてその3’酸素が引き続くモノヌクレオチドペントース環の5’ホスフェートに連結されない場合、「3’端」と称される。
【0027】
本明細書中で使用される場合、核酸配列はまた、より大きなオリゴヌクレオチドまたはポリヌクレオチドの内部である場合さえ、5’端および3’端を有するといわれ得る。直線状DNA分子または環状DNA分子のいずれかにおいて、別個のエレメントは、「下流」または3’エレメントの「上流」または5’であるといわれる。この専門用語は、転写が、DNA鎖に沿って、5’から3’への様式で進むという事実を反映する。代表的に、連結された遺伝子の転写を指向するプロモーターエレメントまたはエンハンサーエレメントは、一般に、コード領域の5’または上流に位置する。しかし、エンハンサーエレメントは、プロモーターエレメントおよびコード領域の3’に位置する場合にさえ、その効果を発揮し得る。転写終結シグナルおよびポリアデニル化シグナルは、コード領域の3’または下流に位置する。
【0028】
用語「コドン」は、本明細書中で使用される場合、基本的な遺伝暗号(遺伝コード)単位であり、ポリペプチド鎖に取りこまれる特定のアミノ酸、または開始シグナルもしくは停止シグナルを特定する、3ヌクレオチドの配列からなる。図1は、コドン表を含む。用語「コード領域」は、構造遺伝子に関して使用される場合、mRNA分子の翻訳の結果としての、新生ポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列をいう。代表的に、コード領域は、開始メチオニンをコードするヌクレオチドトリプレット「ATG」による5’側の境界があり、かつ終止コドン(例えば、TAA、TAG、TGA)による3’側の境界がある。いくつかの場合、コード領域は、ヌクレオチドトリプレット「TTG」によって開始されることもまた公知である。
【0029】
「タンパク質」および「ポリペプチド」によって、長さまたは翻訳後修飾(例えば、グリコシル化またはリン酸化)に関わらず、任意の鎖のアミノ酸を意味する。本発明の合成遺伝子はまた、天然に存在するタンパク質またはそのポリペプチドフラグメントの改変体をコードし得る。好ましくは、このようなタンパク質ポリペプチドは、それが由来する天然に存在する(ネイティブの)アミノ酸配列に対して、少なくとも85%、好ましくは90%、そして最も好ましくは95%または99%同一である、アミノ酸配列を有する。
【0030】
ポリペプチド分子は、「アミノ末端」(N末端)および「カルボキシ末端」(C末端)を有するといわれる。なぜなら、ペプチド結合は、第一のアミノ酸残基の骨格アミノ基と第二のアミノ酸残基の骨格カルボキシル基との間で生じるからである。ポリペプチド配列に関して、用語「N末端」および「C末端」は、それぞれ、ポリペプチドのN末端領域およびC末端領域の部分を含むポリペプチド領域をいう。ポリペプチドのN末端領域部分を含む配列は、ポリペプチド鎖のN末端半分由来のアミノ酸を優勢に含むが、このような配列に限定されない。例えば、N末端配列は、ポリペプチドのN末端半分およびC末端半分の両方に由来する塩基を含む、ポリペプチド配列の内部部分を含み得る。同じことがC末端にも適用される。N末端領域およびC末端領域は、必ずしもそうである必要はないが、それぞれ、ポリペプチドの最終的なN末端およびC末端を規定するアミノ酸を含み得る。
【0031】
用語「野生型」は、本明細書中で使用される場合、天然に存在する供給源から単離された遺伝子または遺伝子産物の特徴を有する、遺伝子または遺伝子産物をいう。野生型遺伝子は、ある集団において最も頻繁に観察され、従って、この遺伝子の「野生型」形態と任意に称される。対照的に、用語「変異体」は、野生型の遺伝子または遺伝子産物と比較した場合に、配列および/または機能的特性における改変(すなわち、変更された特徴)を示す遺伝子または遺伝子産物をいう。天然に存在する変異体が単離され得ることが留意される;これらは、野生型の遺伝子または遺伝子産物と比較した場合に、変更された特徴を有するという事実によって、同定される。
【0032】
用語「相補的」または「相補性」は、塩基対形成法則によって関連する、ヌクレオチドの配列に関して使用される。例えば、配列5’「A−G−T」3’について、これは、配列3’「T−C−A」5’に相補的である。相補性は、「部分的」であり得、この場合、いくつかの核酸塩基は、塩基対形成法則に従って一致される。あるいは、「完全」または「全体的」な相補性が、核酸間に存在し得る。核酸鎖環の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して、有意な影響を有する。これは、増幅反応、および核酸のハイブリダイゼーションに依存する検出方法において特に重要である。
【0033】
用語「組換えタンパク質」または「組換えポリペプチド」は、本明細書中で使用される場合、組換えDNA分子から発現されるタンパク質分子をいう。対照的に、用語「ネイティブタンパク質」は、本明細書中で使用されて、天然に存在する(すなわち、非組換え)供給源から単離されたタンパク質を示す。分子生物学的技術を使用して、タンパク質のネイティブ形態と比較して、同一の特性を有するタンパク質の組換え形態を生成する。
【0034】
用語「融合タンパク質」および「融合パートナー」とは、外因性タンパク質フラグメント(例えば、非ルシフェラーゼタンパク質からなる融合パートナー)に連結された目的のタンパク質(例えば、ルシフェラーゼ)を含む、キメラタンパク質をいう。この融合パートナーは、宿主細胞において発現される場合にタンパク質の可溶性を増強し得、例えば、宿主細胞もしくは培養物上清またはこれら両方からの組換え融合タンパク質の精製を可能にする、親和性タグ(アフィニティータグ)を提供し得る。所望の場合、この融合パートナーは、当該分野で公知の種々の酵素的方法または化学的方法によって、目的のタンパク質から除去され得る。
【0035】
用語「細胞」、「細胞株」、「宿主細胞」は、本明細書中で使用される場合、相互変換可能に使用され、このような名称の全ては、これらの名称の子孫または潜在的子孫を含む。「形質転換細胞」は、合成遺伝子を含むDNA分子が導入された細胞(またはその祖先)を意味する。必要に応じて、本発明の合成遺伝子は、合成遺伝子によってコードされるタンパク質またはポリペプチドを産生し得る安定に形質転換された細胞株を作製するように、適切な細胞株に導入され得る。このような細胞株を構築するためのベクター、細胞および方法は、当該分野で周知である(例えば、Ausubelら(前出))。語「形質転換体」または「形質転換細胞」は、移入の数に関わらず、元々の形質転換細胞に由来する、初代形質転換細胞を含む。全ての子孫は、意図した変異または偶発的な変異に起因して、DNA内容が正確に同一でなくてもよい。それにもかかわらず、元々の形質転換細胞においてスクリーニングされたのと同じ機能性を有する変異子孫は、形質転換体の定義に含まれる。
【0036】
核酸は、異なる型の変異を含むことが公知である。「点」変異とは、単一塩基位置での、野生型配列からのヌクレオチドの配列の変更をいう。変異はまた、1以上の塩基の挿入または欠失をいい得、その結果、核酸配列は、野生型配列とは異なる。
【0037】
用語「相同性」とは、相補性の程度をいう。部分的な相同性または完全な相同性(すなわち、同一性)が存在する。相同性は、配列分析ソフトウェア(例えば、Sequence Analysis Software Package of the Genetics Computer Group.University of Wisconsin Biotechnology Center.1710 University Avenue.Madison,WI 53705)を使用して、しばしば測定される。このようなソフトウェアは、種々の置換、欠失、挿入および他の改変に対して相同性の程度を割り当てることによって、類似する配列を一致させる。保存的置換としては、代表的に、以下の群内の置換が挙げられる:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン。
【0038】
「部分的に相補的な」配列は、完全に相補的な配列が標的核酸にハイブリダイゼーションすることを少なくとも部分的に阻害し、機能的用語「実質的に相同」を使用して言及される配列である。完全に相補的な配列の標的配列へのハイブリダイゼーションの阻害は、低いストリンジェンシー条件下でのハイブリダイゼーションアッセイ(サザンブロットまたはノザンブロット、溶液ハイブリダイゼーションなど)を使用して試験され得る。実質的に相同な配列またはプローブは、低いストリンジェンシー条件下で、標的配列に対する完全な相同体の結合(すなわち、ハイブリダイゼーション)と競合するか、またはこの結合を阻害する。低いストリンジェンシーの条件は、非特異的結合を許容するというわけではない;低いストリンジェンシーの条件は、2つの配列の互いに対する結合が、特異的(すなわち、選択的)相互作用であることを必要とする。非特異的結合の非存在は、部分的な程度の相補性(例えば、約30%未満の同一性)さえも欠く、第二の標的の使用によって、試験され得る。この場合、非特異的結合の非存在下で、プローブは、第二の非特異的標的にハイブリダイズしない。
【0039】
cDNAクローンまたはゲノムクローンのような二本鎖核酸配列を参照して使用される場合、用語「実質的に相同」は、本明細書中に記載されるような低ストリンジェンシー条件下で、二本鎖核酸配列のいずれかの鎖または両方の鎖にハイブリダイズし得る任意のプローブをいう。
【0040】
「プローブ」は、探索されるべき変性核酸の配列に対して、選択されたストリンジェンシー条件下で結合されるに十分な相補性となる(その長さに関連して)ように設計されたオリゴヌクレオチドをいう。
【0041】
「ハイブリダイゼーション」および「結合」は、プローブおよび変性融解核酸の文脈において、交換可能に使用される。変性された核酸にハイブリダイズまたは結合されるプローブは、そのポリヌクレオチドにおける相補配列に対して塩基対形成される。特定のプローブが、そのポリヌクレオチドと塩基対形成されたまま維持されるか否かは、相補性の程度、プローブの長さ、および結合条件のストリンジェンシーに依存する。ストリンジェンシーが高くなればなるほど、相補性の程度はより高くなければならず、および/または、プローブはより長くなければならない。
【0042】
用語「ハイブリダイゼーション」は、相補的核酸鎖の対形成を参照して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度(すなわち、核酸鎖の間の会合の強度)は、当該分野で周知の多くの因子によって影響を及ぼされる。この因子としては、核酸間の相補性の程度、塩濃度、形成されるハイブリッドのTm(融解温度)、他の成分の存在(例えば、ポリエチレングリコールの存在または非存在)、ハイブリダイズする鎖のモル濃度、および核酸鎖のG:C含量のような条件によって関与され影響される条件のストリンジェンシーが挙げられる。
【0043】
用語「ストリンジェンシー」は、温度、イオン強度、および他の化合物の存在に関する条件(この条件下で、核酸のハイブリダイゼーションを実施する)を参照して使用される。「高ストリンジェンシー」条件では、核酸の塩基対形成は、高頻度の相補性塩基配列を有する核酸フラグメントの間でのみ起こる。従って、「中程度の」または「低い」ストリンジェンシーの条件が、一緒にハイブリダイズまたはアニールされるべき互いに対して完全には相補的でない核酸を所望する場合にしばしば必要とされる。当該分野は、多数の等価な条件が、中程度のストリンジェンシー条件または低いストリンジェンシー条件を含むように使用され得ることを十分に知っている。ハイブリダイゼーション条件の選択は、一般的に、当業者に明らかであり、そして通常、ハイブリダイゼーションの目的、ハイブリダイゼーションの型(DNA−DNAまたはDNA−RNA)、および配列間で所望される関連性のレベルによって導かれる(この方法の一般的な考察として、例えば、Sambrookら,1989;Nucleic Acid Hybridization,A Practical Approach,IRL Press,Washington D.C.,1985)。
【0044】
核酸二重鎖の安定性は、ミスマッチ塩基の数の増加につれて減少し、そしてさらに、ハイブリッド二重鎖におけるミスマッチの相対的位置に依存して、より高い程度またはより低い程度まで減少されることが知られている。従って、ハイブリダイゼーションのストリンジェンシーを使用して、このような二重鎖の安定性を最大化または最少化し得る。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの温度を調整することによって;ハイブリダイゼーション混合物中におけるヘリックス不安定化剤(例えば、ホルムアミド)のパーセンテージを調整することによって;ならびに洗浄溶液の温度および/または塩濃度を調整することによって、変更され得る。フィルターハイブリダイゼーションについて、ハイブリダイゼーションの最終的なストリンジェンシーは、しばしば、ハイブリダイゼーション後の洗浄に使用される塩濃度および/または温度によって決定される。
【0045】
「高ストリンジェンシー条件」は、核酸のハイブリダイゼーションを参照して使用される場合、約500ヌクレオチド長のプローブを使用する場合において、5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2Oおよび1.85g/l EDTA(pHをNaOHで7.4に調整))、0.5%SDS、5×デンハルト試薬および100μg/ml変性サケ精子DNAからなる溶液中における42℃での結合またはハイブリダイゼーションに続いて、0.1×SSPE、1.0%SDSを含む溶液中において42℃で洗浄するのと等価な条件を含む。
【0046】
「中程度のストリンジェンシー条件」は、核酸のハイブリダイゼーションを参照して使用される場合、約500ヌクレオチド長のプローブを使用する場合において、5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2Oおよび1.85g/l EDTA(pHをNaOHで7.4に調整))、0.5%SDS、5×デンハルト試薬および100μg/ml変性サケ精子DNAからなる溶液中における42℃での結合またはハイブリダイゼーションに続いて、1.0×SSPE、1.0%SDSを含む溶液中において42℃で洗浄するのと等価な条件を含む。
【0047】
「低いストリンジェンシー条件」は、約500ヌクレオチド長のプローブを使用する場合において、5×SSPE(43.8g/l NaCl,6.9g/l NaH2PO4H2Oおよび1.85g/l EDTA(pHをNaOHで7.4に調整))、0.1%SDS、5×デンハルト試薬[50×デンハルトは、500mlあたりに、5gのFicoll(Type400、Pharmacia)、5gのBSA(Fraction V;Sigma)を含む]および100g/ml変性サケ精子DNAからなる溶液中における42℃での結合またはハイブリダイゼーションに続いて、5×SSPE、0.1%SDSを含む溶液中において42℃で洗浄するのと等価な条件を含む。
【0048】
用語「Tm」は、「融解温度」を参照して使用される。融解温度は、二本鎖核酸分子の集団のうちの50%が、解離されて一本鎖になる温度である。核酸のTmを算出するための方程式は、当該分野で周知である。ハイブリッド核酸のTmはしばしば、1M塩におけるハイブリダイゼーションアッセイから採択される式を使用して推定され、そして一般的に、PCRプライマーについてのTmを算出するために使用されるのは、以下である:[(A+Tの数)×2℃+(G+Cの数)×4℃](C.R.Newtonら,PCR,第2版,Springer−Verlag(New York,1997),24頁)。この式は、20ヌクレオチドよりも長いプライマーについては不正確であることが見出された(同書)。Tm値に関する別の単純な推定は、以下の式によって算出され得る:核酸が1M NaClでの水溶液中にある場合、Tm=81.5+0.41(%G+C)(例えば、AndersonおよびYoung,Quantitative Filter Hybridization,Nucleic Acid Hybridization,1985)。他のより複雑化した計算が、当該分野において存在し、それは構造および配列の特徴を、Tmの算出のための考慮に入れる。算出されたTmは、単なる推定に過ぎず;最適温度は一般的に、経験的に決定される。
【0049】
用語「単離された」は、「単離されたオリゴヌクレオチド」または「単離されたポリヌクレオチド」におけるように、核酸に関連して使用される場合、同定され、かつその供給源において通常関連付けられる少なくとも1つの夾雑物から分離されている核酸配列をいう。従って、単離された核酸は、その天然において見出される形態または設定とは異なる形態または設定において存在する。対照的に、単離されていない核酸(例えば、DNAおよびRNA)は、それが天然において存在する状態で見出される。例えば、所定のDNA配列(例えば、遺伝子)は、隣接する遺伝子と近位で宿主細胞の染色体において見出され;RNA配列(例えば、特定のタンパク質をコードする特定のmRNA配列)は、多くのタンパク質をコードする多数の他のmRNAとの混合物として、細胞中において見出される。しかし、単離された核酸としては、例示として、その核酸を通常発現している細胞におけるこのような核酸であって、ここでこの核酸が天然の細胞の染色体位置とは異なる染色体位置にある核酸、またはさもなくば、天然において見出される核酸配列とは異なる核酸配列によって隣接されている核酸が挙げられる。単離された核酸またはオリゴヌクレオチドは、一本鎖または二本鎖の形態で存在し得る。単離された核酸またはオリゴヌクレオチドが、タンパク質を発現するように利用される場合、そのオリゴヌクレオチドは、最少でもセンス鎖またはコード鎖を含む(すなわち、オリゴヌクレオチドは一本鎖であり得る)が、センス鎖およびアンチセンス鎖の両方を含み得る(すなわち、オリゴヌクレオチドは、二本鎖であり得る)。
【0050】
用語「単離された」は、「単離されたタンパク質」または「単離されたポリペプチド」におけるように、ポリペプチドに関連して使用される場合、同定され、かつその供給源において通常関連付けられる少なくとも1つの夾雑物から分離されているポリペプチドをいう。従って、単離されたポリペプチドは、その天然において見出される形態または設定とは異なる形態または設定において存在する。対照的に、単離されていないポリペプチド(例えば、タンパク質および酵素)は、それが天然において存在する状態で見出される。
【0051】
用語「精製された」または「精製する(ために)」とは、目的の成分(例えば、タンパク質または核酸)からいくらかの夾雑物を取り除く任意のプロセスの結果を意味する。これにより、サンプル中における精製成分のパーセントは増加する。
【0052】
用語「作動可能に連結された」は、本明細書中で使用される場合、所定の遺伝子の転写および/または所望のタンパク質分子の合成を指示し得る核酸分子が生成されるような様式における核酸配列の連結をいう。この用語はまた、機能的(例えば、酵素的に活性な、結合パートナーに結合し得る、阻害し得る、など)なタンパク質またはポリペプチドが生成されるような様式でアミノ酸をコードする配列の連結をいう。
【0053】
用語「組換えDNA分子」は、天然において通常一緒に見出されない少なくとも2つのヌクレオチド配列を含むハイブリッドDNA配列を意味する。用語「ベクター」は、DNAのフラグメントが挿入またはクローン化され得、そして細胞中にDNAセグメントを移入するために使用され得、そして細胞中において複製可能であり得る核酸分子を参照して使用される。ベクターは、プラスミド、バクテリオファージ、ウイルス、コスミドなどに由来し得る。
【0054】
用語「組換えベクター」および「発現ベクター」は、本明細書中で使用される場合、所望のコード配列と、特定の宿主生物における作動可能に連結されたコード配列の発現のために必要とされる適切なDNA配列またはRNA配列とを含む、DNA配列またはRNA配列をいう。原核生物発現ベクターは、プロモーター、リボソーム結合部位、宿主細胞における自律複製のための複製起点、そしておそらく他の配列(例えば、任意のオペレーター配列、任意の制限酵素部位)を含む。プロモーターは、RNAポリメラーゼをDNAに結合させ、そしてRNA合成を開始させるように指示するDNA配列として規定される。真核生物発現ベクターは、プロモーターと、必要に応じて、ポリアデニル化シグナルと、必要に応じて、エンハンサー配列とを含む。
【0055】
用語「遺伝子をコードするヌクレオチド配列を有するポリヌクレオチド」は、遺伝子のコード領域を含む核酸配列、または換言すると、遺伝子産物をコードする核酸配列を意味する。コード領域は、cDNAの形態、ゲノムDNAの形態、またはRNAの形態のいずれかで存在し得る。DNAの形態で存在する場合、オリゴヌクレオチドは、一本鎖(すなわち、センス鎖)であっても二本鎖であってもよい。適切な制御エレメント(例えば、エンハンサー/プロモーター、スプライス連結部、ポリアデニル化シグナルなど)は、必要に応じて遺伝子のコード領域に密接して位置付けられて、一次RNA転写物の転写の適切な開始および/または正確なプロセシングを可能にし得る。あるいは、本発明の発現ベクターにおいて利用されるコード領域は、内因性エンハンサー/プロモーター、スプライス連結部、介在配列、ポリアデニル化シグナルなどを含み得る。さらなる実施形態では、コード領域は、内因性制御エレメントおよび外因性制御エレメントの両方の組み合わせを含み得る。
【0056】
用語「転写調節エレメント」または「転写調節配列」は、核酸配列の発現のいくつかの局面を制御する遺伝子エレメントまたは配列をいう。例えば、プロモーターは、作動可能に連結されたコード領域の転写開始を促進する調節エレメントである。他の調節エレメントとしては、転写因子結合部位、スプライシングシグナル、ポリアデニル化シグナル、終結シグナル、およびエンハンサーエレメントが挙げられるが、これらに限定されない。
【0057】
真核生物における転写制御シグナルは、「プロモーター」および「エンハンサー」エレメントを含む。プロモーターおよびエンハンサーは、転写に関与する細胞性タンパク質と特異的に相互作用するDNA配列の短いアレイからなる(Maniatisら,1987)。プロモーターおよびエンハンサーエレメントは、種々の真核生物供給源(酵母細胞、昆虫細胞および哺乳動物細胞における遺伝子を含む)から単離されている。プロモーターおよびエンハンサーエレメントはまた、ウイルスからも単離されており、そして類似の制御エレメント(例えば、プロモーター)はまた、原核生物においても見出されている。特定のプロモーターおよびエンハンサーの選択は、目的のタンパク質を発現させるために使用される細胞型に依存する。いくつかの真核生物プロモーターおよびエンハンサーは、広範な宿主範囲を有するが、他のプロモーターおよびエンハンサーは、限られた細胞型のサブセットにおいて機能的である(概説として、Vossら,1986;およびManiatisら,1987を参照のこと)。例えば、SV40初期遺伝子エンハンサーは、多くの哺乳動物種由来の広範な種々の細胞型において非常に活性であり、そして哺乳動物細胞におけるタンパク質の発現のために広範に使用されている(Dijkemaら,1985)。広範な哺乳動物細胞型において活性なプロモーター/エンハンサーエレメントの他の2つの例は、ヒト延長因子1遺伝子由来のプロモーター/エンハンサーエレメント(Uetsukiら,1989;Kimら,1990;ならびにMizushimaおよびNagata,1990)、およびラウス肉腫ウイルス(Gormanら,1982);およびヒトサイトメガロウイルス(Boshartら,1985)の長末端反復由来のプロモーター/エンハンサーエレメントである。
【0058】
用語「プロモーター/エンハンサー」は、プロモーター機能およびエンハンサー機能(すなわち、上記のような、プロモーターエレメントおよびエンハンサーエレメントによって提供される機能)の両方を提供し得る配列を含むDNAセグメントを示す。例えば、レトロウイルスの長末端反復は、プロモーター機能およびエンハンサー機能の両方を含む。エンハンサー/プロモーターは、「内因性」であっても、「外因性」であっても、「異種性(heterologous)」であってもよい。「内因性」エンハンサー/プロモーターは、ゲノム中において所定の遺伝子と天然で連結されているものである。「外因性」または「異種性」のエンハンサー/プロモーターは、遺伝子操作(すなわち、分子生物学技術)によって遺伝子に並置されて位置付けられ、その結果、その遺伝子の転写が、連結されたエンハンサー/プロモーターにより指示されるものである。
【0059】
発現ベクターにおける「スプライシングシグナル」の存在は、しばしば、真核生物宿主細胞において組換え転写物のより高いレベルの発現を引き起こす。スプライシングシグナルは、一次RNA転写物からのイントロンの除去を媒介し、そしてスプライスドナーおよびアクセプター部位から構成される(Sambrookら,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring
Harbor Laboratory Press,New York,1989,16.7−16.8)。一般的に使用されるスプライスドナーおよびアクセプター部位は、SV40の16S RNA由来のスプライス連結部である。
【0060】
真核生物細胞における組換えDNA配列の効率的な発現は、生じる転写物の効率的な終結およびポリアデニル化を指示するシグナルの発現を必要とする。転写終結シグナルは一般的に、ポリアデニル化シグナルの下流に見出され、そして数百ヌクレオチド長である。用語「ポリ(A)部位」または「ポリ(A)配列」は、本明細書中で使用される場合、新生RNA転写物の終結およびポリアデニル化の両方を指示するDNA配列を示す。組換え転写物の効率的なポリアデニル化が望ましい。なぜなら、ポリ(A)テイルを欠失する転写物は、不安定であり、そして迅速に分解されるからである。発現ベクターにおいて利用されるポリ(A)シグナルは、「異種性」であっても「内因性」であってもよい。内因性ポリ(A)シグナルは、ゲノム中において所定遺伝子のコード領域の3’末端に天然で見出されるシグナルである。異種性ポリ(A)シグナルは、1つの遺伝子から単離され、そして別の遺伝子に対して3’側に位置付けられるシグナルである。通常使用される異種性ポリ(A)シグナルは、SV40ポリ(A)シグナルである。SV40ポリ(A)シグナルは、237bpのBamHI/BclI制限フラグメントに含まれ、そして終結およびポリアデニル化の両方を指示する(Sambrook,前出,16.6−16.7)。
【0061】
真核生物発現ベクターはまた、「ウイルスレプリコン」または「ウイルス複製起点」を含み得る。ウイルスレプリコンは、適切な複製因子を発現する宿主細胞においてベクターの染色体外複製を可能にするウイルスDNA配列である。SV40またはポリオーマウイルスの複製起点のいずれかを含むベクターは、適切なウイルスT抗原を発現する細胞において、高コピー数まで(104コピー/細胞まで)複製する。対照的に、ウシパピローマウイルスまたはエプスタイン−バーウイルス由来のレプリコンを含むベクターは、低コピー数(約100コピー/細胞)で、染色体外で複製する。
【0062】
用語「インビトロ」は、人工環境および人工環境において生じるプロセスまたは反応をいう。インビトロ環境としては、試験管および細胞溶解産物が挙げられるが、これらに限定されない。用語「インサイチュ」は、細胞培養物をいう。用語「インビボ」は、天然の環境(例えば、動物または細胞)、および天然の環境において生じるプロセスまたは反応をいう。
【0063】
用語「発現系」は、目的の遺伝子の発現を決定する(例えば、検出する)ための任意のアッセイまたはシステムをいう。分子生物学の分野における当業者は、任意の広範な種々の発現系が使用され得ることを理解する。広範な適切な哺乳動物細胞は、広範な供給源(例えば、American Type Culture Collection,Rockland,MD)から利用可能である。形質転換またはトランスフェクションの方法および発現ビヒクルの選択は、選択される宿主系に依存する。形質転換方法およびトランスフェクション方法は、例えば、Ausubelら,Current Protocols
in Molecular Biology.John Wiley & Sons,New York.1992に記載されている。発現系としては、インビトロ遺伝子発現アッセイが挙げられ、ここでは、目的の遺伝子(例えば、レポーター遺伝子)を調節配列に連結し、そしてこの遺伝子の発現を、この遺伝子の発現を阻害または誘導する因子で処理した後にモニターする。遺伝子発現の検出は、任意の適切な手段(発現されたmRNAまたはタンパク質(例えば、レポーター遺伝子の検出可能な生成物)の検出が挙げられるが、これに限定されない)を通してか、または目的の遺伝子を発現する細胞の表現型における検出可能な変化を通してなされ得る。発現系はまた、切断事象または他の核酸もしくは細胞の変化を検出するアッセイを含み得る。
【0064】
用語「酵素」は、化学的反応および生物学的反応の触媒を担う分子または分子凝集体をいう。このような分子は、代表的にはタンパク質であるが、短いペプチド、RNA、リボザイム、抗体および他の分子も含み得る。化学的反応および生物学的反応を触媒する分子は、「酵素活性を有する」または「触媒活性を有する」といわれる。
【0065】
本明細書中で同定されるすべてのアミノ酸残基は、天然のL−立体配置である。標準的なポリペプチドの命名法(J.Biol.Chem.,243,3557(1969)を参照のこと)と一致して、アミノ酸残基の略語は、以下の対応表に示される通りである。
【0066】
対応表
一文字 三文字 アミノ酸
Y Tyr L−チロシン
G Gly グリシン
F Phe L−フェニルアラニン
M Met L−メチオニン
A Ala L−アラニン
S Ser L−セリン
I Ile L−イソロイシン
L Leu L−ロイシン
T Thr L−スレオニン
V Val L−バリン
P Pro L−プロリン
K Lys L−リジン
H His L−ヒスチジン
Q Gln L−グルタミン
E Glu L−グルタミン酸
W Trp L−トリプトファン
R Arg L−アルギニン
D Asp L−アスパラギン酸
N Asn L−アスパラギン
C Cys L−システイン。
【0067】
用語「配列相同性」は、2つの核酸配列間の塩基マッチの割合または2つのアミノ酸配列間のアミノ酸マッチの割合を意味する。配列相同性は、パーセンテージ(例えば、50%)として表され、このパーセンテージは、いくつかの他の配列と比較される一つの配列からの配列の長さに対するマッチの割合を示す。ギャップ(2つの配列のいずれかにおける)は、マッチするのを最大化するために許容され;15塩基以下のギャップ長が通常使用され、6塩基以下が好ましく、2塩基以下がより好ましい。プローブまたは処理としてオリゴヌクレオチドを使用する場合、標的核酸とオリゴヌクレオチド配列との間の配列相同性は、一般的に、20個の可能なオリゴヌクレオチド塩基対マッチのうちの17個以上の標的塩基マッチ(85%)であり;好ましくは、10個の可能な塩基対マッチのうちの9個以上のマッチ(90%)であり;そしてより好ましくは、20個の可能な塩基対マッチのうちの19個以上のマッチ(95%)である。
【0068】
2つのアミノ酸配列は、それらの配列の間に部分的または完全な同一性が存在する場合に相同である。例えば、85%相同性は、最大マッチのために2つの配列を整列する場合に、85%のアミノ酸が同一であることを意味する。ギャップ(マッチされる2つの配列のいずれかにおける)は、マッチを最大にするにおいて許容され;5個以下のギャップ長が好ましく、2個以下がより好ましい。あるいはまたは好ましくは、2つのタンパク質配列(または、少なくとも100アミノ酸長のものに由来するポリペプチド配列)は、この用語が本明細書中で使用される場合、それらが変異データマトリクスおよび6以上のギャップペナルティを用いてプログラムALIGNを使用して、5(標準偏差単位)よりも高いアラインメントスコアを有する場合に相同である。Dayhoff,M.O.,Atlas of Protein Sequence and Structure,1972,第5巻,National Biomedical Research Foundation,101−110頁,およびこの巻に対する補遺2,1−10頁を参照のこと。2つの配列またはそれらの部分は、より好ましくは、ALIGNプログラムを使用して最適に整列される場合に、それらのアミノ酸が85%以上同一である場合に相同である。
【0069】
以下の用語は、2つ以上のポリヌクレオチドの間の配列関連性を記載するために使用される:「参照配列」、「比較ウィンドウ」、「配列同一性」、「配列同一性のパーセンテージ」および「実質的同一性」。「参照配列」は、配列比較のための基準として使用される、規定された配列である;参照配列は、例えば、配列表において提供される全長cDNAまたは遺伝子配列のセグメントのような、より長い配列のサブセットであり得るか、または完全cDNAまたは遺伝子配列を含み得る。一般的に、参照配列は、少なくとも20ヌクレオチド長であり、しばしば、少なくとも25ヌクレオチド長であり、そしてしばしば、少なくとも50ヌクレオチド長である。2つのポリヌクレオチドは、各々(1)2つのポリヌクレオチドの間で類似である配列(すなわち、完全なポリヌクレオチド配列の部分)を含み得、そして(2)2つのポリヌクレオチドの間で相違する配列をさらに含み得るので、2つ(またはより多く)のポリヌクレオチドの間の配列比較は、代表的に、配列類似性の局所領域を同定および比較するために、「比較ウィンドウ」にわたって2つのポリヌクレオチドの配列を比較することによって実施される。
【0070】
「比較ウィンドウ」は、本明細書中で使用される場合、少なくとも20個連続するヌクレオチドの概念的なセグメントをいい、そしてここで、比較ウィンドウにおけるポリヌクレオチド配列の部分は、2つの配列の最適アラインメントのために参照配列(これは、付加も欠失も含まない)に対して比較される場合に、20%以下の付加または欠失(すなわち、ギャップ)を含み得る。
【0071】
比較のために配列をアラインメントする方法は、当該分野で周知である。従って、任意の2つの配列間のパーセント同一性の決定は、数学的なアルゴリズムを使用して達成され得る。このような数学的アルゴリズムの好ましく非制限的な例は、MyersおよびMiller(1988)のアルゴリズム;SmithおよびWaterman(1981)の局所的相同性アルゴリズム;NeedlemanおよびWunsch(1970)の相同性アラインメントアルゴリズム;PearsonおよびLipman(1988)の類似性検索方法;KarlinおよびAltschul(1990)のアルゴリズム、KarlinおよびAltschul(1993)におけるような改変である。
【0072】
これらの数学的アルゴリズムのコンピューター実行が、配列同一性を決定するための配列比較のために利用され得る。このような実行としては、以下が挙げられるが、これらに限定されない:PC/GeneプログラムにおけるCLUSTAL(Intelligenetics,Mountain View,Californiaから利用可能);ALIGNプログラム(バージョン2.0)およびWisconsin Genetics
Software Package,バージョン8におけるGAP、BESTFIT、BLAST、FASTA、およびTFASTA(Genetics Computer Group(GCG),575 Science Drive,Madison,Wisconsin,USAから利用可能)。これらのプログラムを使用するアラインメントは、デフォルトパラメーターを使用して実施され得る。CLUSTALプログラムは、Higginsら(1988);Higginsら(1989);Corpetら(1988);Huangら(1992);およびPearsonら(1994)によって十分に記載されている。ALIGNプログラムは、MyersおよびMiller(前出)のアルゴリズムに基づく。Altschulら(1990)のBLASTプログラムは、KarlinおよびAltschul(前出)のアルゴリズムに基づく。比較目的のためにギャップ形成されたアラインメントを得るために、Gapped BLAST(BLAST 2.0における)が、Altschulら(1997)に記載のように利用され得る。あるいは、PSI−BLAST(BLAST2.0における)を使用して、分子間の遠い関係を検出する反復検索を実施し得る。Altschulら(前出)を参照のこと。BLAST、Gapped BLAST、PSI−BLASTを使用する場合、それぞれのプログラム(例えば、ヌクレオチド配列についてのBLASTN、タンパク質についてのBLASTX)のデフォルトパラメーターを使用し得る。http://www.ncbi.nlm.nih.gov.を参照のこと。アラインメントはまた、目視によって手動で実施され得る。
【0073】
用語「配列同一性」は、比較ウィンドウにわたって、2つのポリヌクレオチド配列が同一(すなわち、ヌクレオチド対ヌクレオチド基準で)であることを意味する。用語「配列同一性のパーセンテージ」は、2つのポリヌクレオチド配列が、比較ウィンドウにわたって、規定された割合のヌクレオチドについて同一(すなわち、ヌクレオチド対ヌクレオチド基準で)であることを意味する。用語「配列同一性のパーセンテージ」は、比較ウィンドウにわたって最適に整列された2つの配列を比較する工程、両方の配列において同一の核酸塩基(例えば、A、T、C、G、U、またはI)が存在する位置の数を決定して、マッチした位置の数を算出する工程、比較ウィンドウにおける位置の総数(すなわち、ウィンドウサイズ)でマッチした位置の数を除算する工程、およびこの結果に100を乗算して、配列同一性のパーセンテージを算出する工程によって算出される。用語「実質的同一性」は、本明細書中で使用される場合、ポリヌクレオチド配列の特徴を示し、ここでは、ポリヌクレオチドは、少なくとも20ヌクレオチドの位置の比較ウィンドウにわたって、しばしば、少なくとも20〜50ヌクレオチドのウィンドウにわたって、そして好ましくは、少なくとも300ヌクレオチドで、参照配列に対して比較される場合に、少なくとも60%、好ましくは少なくとも65%、より好ましくは少なくとも70%、約85%まで、そしてさらにより好ましくは、少なくとも90〜95%、一般的により好ましくは少なくとも99%の配列同一性を有する配列を含み、ここで、配列同一性のパーセンテージは、比較ウィンドウにわたって参照配列の合計20%以下の欠失または付加を含み得るポリヌクレオチド配列に対して参照配列を比較することによって算出される。参照配列は、より長い配列のサブセットであり得る。
【0074】
ポリペプチドに適用される場合、用語「実質的同一性」は、2つのペプチド配列が、例えば、デフォルトギャップ重を使用してプログラムGAPまたはBESTFITによって最適に整列される場合に、少なくとも約85%の配列同一性、好ましくは少なくとも約90%の配列同一性、より好ましくは、少なくとも約95%の配列同一性、そして最も好ましくは、少なくとも約99%の配列同一性を共有することを意味する。
【0075】
(本発明の合成核酸分子および方法)
本発明は、合成核酸分子を含む組成物、ならびに、所望の特徴(特定の細胞型において発現される場合での減少した不適切な転写特徴または意図されていない転写特徴を含む)を有するポリペプチドまたはタンパク質として効率的に発現される合成核酸分子を生成するこれらの分子を調製するための方法を提供する。
【0076】
自然選択とは、表現型レベルで起こる遺伝子型−環境の相互作用が、個体の示差的な生殖の成功へと導き、これにより、集団の遺伝子プールの改変へと導くという仮説である。一般に、天然で見出されるタンパク質のアミノ酸配列は、自然選択によって最適化を受けたと認められる。しかし、アミノ酸は、顕著にはタンパク質の活性に寄与しないタンパク質配列内に存在し、そしてこれらのアミノ酸は、ほとんどまたは全く意義なく、他のアミノ酸に変更され得る。さらに、タンパク質は、その天然の環境以外で有用であり得るか、またはその自然選択条件とは異なる目的のために有用であり得る。これらの環境において、アミノ酸配列は、種々の適用におけるその用途のために、タンパク質をより良く適合させるように合成的に変更され得る。
【0077】
同様に、タンパク質をコードする核酸配列はまた、自然選択によって最適化される。コードするDNAとその転写されるRNAとの間の関係は、DNAに対するいかなる変化も、生じるRNAに影響を及ぼすような関係である。従って、自然選択は、両方の分子に同時に働きかける。しかし、この関係は、核酸とタンパク質との間には存在しない。複数のコドンが同一のアミノ酸をコードするので、多くの異なるヌクレオチド配列が、同一のタンパク質をコードし得る。500アミノ酸から構成される特定のタンパク質は、理論上では、10150個よりも多くの異なる核酸配列によってコードされ得る。
【0078】
自然選択は、核酸に対して作用して、対応するタンパク質の適切なコードを達成する。おそらく、核酸分子の他の特性もまた、自然選択によって作用される。これらの特性としては、コドン使用頻度、RNAの二次構造、イントロンスプライシングの効率、および転写因子または他の核酸結合タンパク質との相互作用が挙げられる。これらの他の特性は、タンパク質の翻訳効率および生じる表現型を変更し得る。遺伝コードの冗長性質が理由で、これらの他の性質は、対応するアミノ酸配列を変更することなく、自然選択によって最適化され得る。
【0079】
いくつかの条件下では、タンパク質をコードする天然のヌクレオチド配列を、代替的適用のためにこのタンパク質をより良く適合させるように合成的に変更することが有用である。一般的な例は、それを外来宿主において発現させる場合に、遺伝子のコドン使用頻度を変更することである。遺伝コードの冗長性は、アミノ酸が複数のコドンによってコードされることを可能にするが、異なる生物は、他と比較していくつかのコドンを好む。コドン使用頻度は、進化学的に大きく離れた歴史を有する生物について最も異なる傾向がある。進化学的に遠い生物の間で遺伝子を転移させる場合、タンパク質翻訳の効率は、コドン使用頻度を調整することによって実質的に増加され得ることが見出されている(米国特許第5,096,825号、同第5,670,356号、および同第5,874,304号を参照のこと)。
【0080】
進化の距離に関する必要性に起因して、レポーター遺伝子のコドン使用頻度は、しばしば、実験細胞の最適なコドン使用頻度に対応しない。例としては、β−ガラクトシダーゼ(β−gal)レポーター遺伝子およびクロラムフェニコールアセチルトランスフェラーゼ(cat)レポーター遺伝子(これらは、E.coliに由来し、そして哺乳動物細胞において一般的に使用される);β−グルクロニダーゼ(gus)レポーター遺伝子(これは、E.coliに由来し、そして植物細胞において一般的に使用される);ホタルルシフェラーゼ(luc)レポーター遺伝子(これは、昆虫に由来し、そして植物細胞および哺乳動物細胞において一般的に使用される);Renillaルシフェラーゼレポーター遺伝子およびグリーン蛍光タンパク質(gfp)レポーター遺伝子(これらは、腔腸動物に由来し、そして植物細胞および哺乳動物細胞において一般的に使用される)が挙げられる。レポーター遺伝子発現の高感度な定量を達成するために、その遺伝子産物の活性は、実験宿主細胞に対して内因性であってはならない。従って、レポーター遺伝子は、通常、独特かつ特有の表現型を有する生物から選択される。結果として、これらの生物は、しばしば、実験宿主細胞から広範に離れた進化歴を有する。
【0081】
以前に、より最適なコドン使用頻度を有するが、同じ遺伝子産物をなおコードする遺伝子を作製するために、合成核酸配列は、既存のコドンを、実験宿主細胞に一般的により好ましいコドンと置換することによって作製された(米国特許第5,096,825号、同第5,670,356号、および同第5,874,304号を参照のこと)。結果は、合成遺伝子のコドン使用頻度における正味の改善であった。しかし、他の特性の最適化は考慮されず、そのため、これらの合成遺伝子は、自然淘汰によって最適化された遺伝子を反映しなかったようである。
【0082】
詳細には、コドン使用頻度における改善は、タンパク質への翻訳におけるRNA配列の役割に基づいて、RNA配列の最適化に対してのみ意図されている。このように、以前に記載された方法は、合成遺伝子の配列が、RNAへの転写におけるDNAの役割にどのように影響するかに取り組まなかった。最も注目すべきには、転写因子が合成DNAとどのように相互作用し得、そして結果として遺伝子転写をどのように調節し得るか、またはさもなければどのように影響し得るかについて、考慮されなかった。天然に見出される遺伝子について、そのDNAは、ネイティブな宿主細胞によって最適に転写され、そしてRNAを生成し、このRNAが、適切にフォールディングされる遺伝子産物をコードする。対照的に、合成遺伝子は、以前に、転写特性について最適化されなかった。むしろ、この特性は、無視されていたか、または成り行きに任されていた。
【0083】
この問題は、全ての遺伝子について重要であるが、実験宿主細胞における転写挙動を定量化するために最も一般的に使用されるレポーター遺伝子について、特に重要である。何百もの転写因子が、異なる生理学的条件下の異なる細胞型において同定されているが、おそらくより多くの存在が、依然同定されていない。これらの転写因子の全ては、導入された遺伝子の転写に影響を及ぼし得る。本発明の有用な合成レポーター遺伝子は、その遺伝子の構造が変更されているので、宿主細胞の内因性の転写特性に影響を及ぼすかまたは混乱させる最小の危険性を有する。特に有用な合成レポーター遺伝子は、新しいセットの実験条件下および/または広範な種々の実験条件下で所望の特性を有する。これらの特性を最良に達成するために、合成遺伝子の構造は、広範囲の宿主細胞内および生理学的条件下で転写因子と相互作用する最小の可能性を有するべきである。レポーター遺伝子と宿主細胞の内因性転写因子との間の潜在的な相互作用を最小化することは、特定の実験下での遺伝子の不適切な転写特性の危険性を減少し、種々の環境下での遺伝子の適応性を増加し、そして得られる実験データの容認を増加することによって、レポーター遺伝子の価値を増加する。
【0084】
対照的に、元の宿主生物由来のゲノムクローンまたはcDNAクローンに基づく、ネイティブヌクレオチド配列を含むレポーター遺伝子は、外因性宿主において発現された場合に、転写因子と相互作用し得る。この危険性は、2つの状況から生じる。第1に、ネイティブヌクレオチド配列は、ネイティブ宿主生物内での遺伝子の転写に影響を及ぼすように自然淘汰を介して最適化された配列を含む。しかし、これらの配列はまた、その遺伝子が外因性宿主中で発現された場合にも、転写に影響を及ぼし得(すなわち、無関係に)、従って、レポーター遺伝子としてのその能力を干渉する。第2に、そのヌクレオチド配列は、ネイティブ宿主生物中に存在せず、そして従って、その自然淘汰に関与しなかった転写因子と、不用意に相互作用し得る。このような不用意な相互作用の可能性は、レポーター遺伝子の実験細胞とネイティブ生物との間の進化の距離が大きいほど増加する。
【0085】
転写因子とのこれらの潜在的相互作用は、コドン使用頻度における改変を有する合成レポーター遺伝子を使用する場合に、おそらく破壊される。しかし、コドン使用頻度のみに基づいてコドンを選択することによって設計された合成レポーター遺伝子配列は、他の意図されない転写因子結合部位を含む可能性がある。なぜなら、合成遺伝子は、不適切な転写活性を矯正するように自然淘汰の利益を受けていないからである。転写因子との不用意な相互作用はまた、コードされるアミノ酸配列が人為的に変更される場合(例えば、アミノ酸置換を導入するために)にいつも生じ得る。同様に、これらの変化は、自然淘汰に供されておらず、従って、所望でない特性を示し得る。
【0086】
従って、本発明は、合成核酸配列を調製するための方法を提供し、この合成配列は、特定の宿主細胞において発現された場合に、転写因子とのその核酸の所望でない相互作用の危険性を減少し、それによって、不適切な転写特性または意図されない転写特性を減少する。好ましくは、この方法は、特定の宿主細胞についての改善されたコドン使用頻度を含み、かつ転写因子結合部位の出現が減少された、合成遺伝子を生じる。本発明はまた、転写因子結合部位の出現が減少され、かつさらなる有利な構造特性を有する、改善されたコドン使用頻度を含む合成遺伝子を調製する方法を提供する。このようなさらなる特性としては、不適切なRNAスプライシング接合部、ポリ(A)付加シグナル、所望でない制限部位、リボソーム結合部位および二次構造モチーフ(例えば、ヘアピンループ)の非存在が挙げられる。
【0087】
同じタンパク質または非常に類似するタンパク質(「コドン相違」バージョン)をコードする、2つの合成遺伝子を調製する方法もまた提供される。好ましくは、この2つの合成遺伝子は、共通のポリヌクレオチドプローブ配列にハイブリダイズする能力が減少されているか、または生存細胞に一緒に存在する場合に組み換わる危険性が減少されている。組換えを検出するために、隣接配列に相補的なプライマーを使用するレポーター配列のPCR増幅、およびその増幅された配列の配列決定が、使用され得る。
【0088】
本発明の合成核酸分子についてのコドンを選択するために、好ましいコドンは、選択された宿主細胞において相対的に高いコドン使用頻度を有し、そしてそれらの導入は、相対的に少ない転写因子結合部位の導入、相対的に少ない他の所望でない構造特性の導入、および必要に応じて、非常に類似するタンパク質をコードする別の遺伝子とその合成遺伝子とを識別する特徴の導入を生じる。従って、本発明の方法によって得られる合成核酸産物は、改善されたコドン使用頻度に起因する発現レベルの改善、所望でない転写調節配列の数の減少に起因する不適切な転写挙動の危険性の減少、および必要に応じて、合成配列を選択するために使用され得る他の基準に起因する任意のさらなる特性を有する、合成遺伝子である。
【0089】
本発明は、任意の核酸配列(例えば、ネイティブ配列(例えば、cDNA)またはインビトロで操作された配列)を使用して、例えば、特定の変更(例えば、制限酵素認識部位の導入または除去、異なるアミノ酸をコードするかまたは融合タンパク質をコードするようなコドン変更)を導入し得るか、または核酸分子のGCまたはAT含量(組成%)を変更し得る。さらに、本発明の方法は、任意の遺伝子に有用であるが、特に、レポーター遺伝子ならびにレポーター遺伝子の発現に関連する他の遺伝子(例えば、選択マーカー)に有用である。好ましい遺伝子としては、ラクタマーゼ(β−gal)、ネオマイシン耐性(Neo)、CAT、GUS、ガラクトピラノシド、GFP、キシロシダーゼ、チミジンキナーゼ、アラビノシダーゼなどをコードする遺伝子が挙げられるが、これらに限定されない。本明細書中で使用される場合、「マーカー遺伝子」または「レポーター遺伝子」は、その遺伝子を発現する細胞に別の表現型を付与し、そしてその遺伝子を有する細胞がその遺伝子を有さない細胞と識別されるのを可能にする遺伝子である。このような遺伝子は、選択マーカーまたはスクリーニングマーカーのいずれかをコードし得、これは、そのマーカーが、化学的手段によって(すなわち、選択薬剤(例えば、除草剤、抗生物質など)の使用によって)「選択」し得る形質を付与するか否か、またはそのマーカーが、観察もしくは試験を介して(すなわち、「スクリーニング」によって)同定し得る、単なる「レポーター」形質であるか否かに依存する。本開示のエレメントは、特定のマーカー遺伝子の使用を介して詳細に例示される。もちろん、適切なマーカー遺伝子またはレポーター遺伝子の多くの例が、当該分野で公知であり、そして本発明の実施において使用され得る。従って、以下の議論は、網羅的ではなく例示的であることが理解される。本明細書中に開示される技術および当該分野で公知の一般的な組換え技術を考慮して、本発明は、任意の遺伝子の変更を可能にする。
【0090】
例示的なマーカー遺伝子としては、neo遺伝子、β−gal遺伝子、gus遺伝子、cat遺伝子、gpt遺伝子、hyg遺伝子、hisD遺伝子、ble遺伝子、mprt遺伝子、bar遺伝子、ニトリラーゼ遺伝子、変異体アセトラクテートシンターゼ遺伝子(ALS)またはアセト酸(acetoacid)シンターゼ遺伝子(AAS)、メトトレキサート耐性dhfr遺伝子、デラポン(delapon)デハロゲナーゼ遺伝子、変異されたアントラニレートシンターゼ遺伝子(これは、5−メチルトリプトファンに対する耐性を付与する)(WO97/26366)、R遺伝子座遺伝子、β−ラクタマーゼ遺伝子、xylE遺伝子、α−アミラーゼ遺伝子、チロシナーゼ遺伝子、ルシフェラーゼ(luc)遺伝子(例えば、Renilla reniformisルシフェラーゼ遺伝子、ホタルルシフェラーゼ遺伝子、またはコメツキムシルシフェラーゼ(Pyrophorus plagiophthalamus)遺伝子)、エクオリン遺伝子、またはグリーン蛍光タンパク質遺伝子が挙げられるが、これらに限定されない。用語、選択マーカー遺伝子またはスクリーニングマーカー遺伝子には、形質転換された細胞について同定または選択する手段として、その分泌が検出され得る、「分泌マーカー」をコードする遺伝子も含まれる。その例には、抗体相互作用によって同定され得る分泌抗原をコードするマーカー、またはその触媒活性によって検出され得る分泌酵素でさえ含まれる。分泌タンパク質は、多くのクラスに分類され、これらには、小さい拡散性のタンパク質(例えば、ELISAによって検出可能な)、および細胞膜に挿入または捕捉されるタンパク質が挙げられる。
【0091】
本発明の方法は、反復プロセス(しかし、これに限定されない)によって行われ得る。このプロセスは、特定の種におけるコドン使用頻度に基づいて、標的分子(例えば、ネイティブヌクレオチド配列)において各アミノ酸に対する好ましいコドンを割り当てる工程、好ましいコドンを有する核酸配列において潜在的な転写調節配列(例えば、転写因子結合部位)を同定する工程(例えば、このような結合部位のデータベースを使用して)、必要に応じて、他の所望でない配列を同定する工程、および所望でない転写因子結合部位または他の配列が存在する位置を代替的なコドン(すなわち、同じアミノ酸をコードする)で置換する工程を包含する。コドン相違バージョンについて、代替的な好ましいコドンが、各バージョンにおいて置換される。必要な場合、潜在的な転写因子配列または他の所望でない配列の同定および除去は、ヌクレオチド配列が、最大数の好ましいコドンを含み、そして最小数の所望でない配列(転写調節配列または他の所望でない配列を含む)を含むことが達成されるまで、繰り返され得る。また、必要に応じて、所望の配列(例えば、制限酵素認識部位)が、導入され得る。合成核酸分子が設計および構築された後、その親核酸配列に対する特性が、当該分野で周知の方法によって決定され得る。例えば、特定の細胞における一連のベクター中の合成核酸分子および標的核酸分子の発現が、比較され得る。
【0092】
従って、一般に、本発明の方法は、標的核酸配列(例えば、ベクター骨格)、レポーター遺伝子または選択マーカー遺伝子、および目的の宿主細胞(例えば、植物(双子葉植物または単子葉植物)細胞、真菌細胞、酵母細胞または哺乳動物細胞)を同定する工程を包含する。好ましい宿主細胞は、哺乳動物宿主細胞(例えば、CHO細胞、COS細胞、293細胞、Hela細胞、CV−1細胞およびNIH3T3細胞)である。宿主細胞における好ましいコドン使用頻度、および必要に応じて、宿主細胞における低いコドン使用頻度(例えば、高い使用頻度の哺乳動物コドンならびに低い使用頻度のE.coliコドンおよび哺乳動物コドン)に基づいて、置き換えられるべきコドンが、決定される。2つの合成核酸分子のコドン相違バージョンについて、代替的な好ましいコドンが、各バージョンに導入される。従って、2より多いコドンを有するアミノ酸について、ある好ましいコドンが、あるバージョンに導入され、そして別の好ましいコドンが、他のバージョンに導入される。6つのコドンを有するアミノ酸について、最も多数の不対合塩基を有する2つのコドンが同定され、一方が、一方のバージョンに導入され、そして他方のコドンが、他方のバージョンに導入される。置き換えられるべきコドンの選択と同時に、その選択の後に、またはその選択の前に、標的配列における所望の配列および所望でない配列(例えば、所望でない転写調節配列)が、同定される。これらの配列は、EPD、NNPD、REBASE、TRANSFAC、TESS、GenePro、MAR(www.ncgr.org/MAR−search)およびBCM Gene Finder(本明細書中にさらに記載される)のようなデータベースおよびソフトウェアを使用して同定され得る。これらの配列が同定された後、改変が導入される。一旦、所望の合成核酸配列が得られると、それは、当該分野で周知の方法(例えば、重複プライマーを用いるPCR)によって調製され得、そして、その構造特性および機能特性(相同性%、特定の配列(例えば、制限部位)の存在または非存在、変化されたコドンの割合(例えば、特定のコドンの使用頻度の増加または減少)および発現率が挙げられるが、これらに限定されない)が、標的核酸配列と比較される。
【0093】
以下に記載されるように、この方法を使用して、Renilla reniformisルシフェラーゼをコードする合成レポーター遺伝子、および2つのコメツキムシルシフェラーゼ(一方は、緑色の光を放出し、もう一方は、赤色の光を放出する)をコードする合成レポーター遺伝子を作製した。両方の系について、これらの合成遺伝子は、そのタンパク質の対応するネイティブ遺伝子または親遺伝子よりも、はるかに高いレベルの発現を支持する。さらに、ネイティブ遺伝子および親遺伝子は、哺乳動物細胞において発現させた場合に、特異な転写特性を示し、これは、合成遺伝子では示されなかった。詳細には、ネイティブ遺伝子または親遺伝子の基礎発現は、比較的高い。さらに、その発現は、公知のプロモーターの非存在下でエンハンサー配列によって非常に高いレベルに誘導される。これらの合成遺伝子は、より低い基礎発現を示し、特異なエンハンサー挙動を示さない。おそらく、このエンハンサーは、合成遺伝子には存在しない、ネイティブ遺伝子において見出される転写エレメントを活性化している。これらの結果は、合成遺伝子核酸配列がレポーター遺伝子として優れた性能を示すことを、明らかに示す。
【0094】
(本発明の分子の例示的使用)
本発明の合成遺伝子は、好ましくは、それらのネイティブ対応物と同じ(または、ほとんど同じ)タンパク質をコードするが、改善されたコドン使用頻度を有し、コード領域における既知の転写調節エレメントが大きく欠失されている(少数のアミノ酸変化が、ネイティブの対応タンパク質の特性を増強するため(例えば、ルシフェラーゼの発光を増強するため)に所望され得ることが認識される)。これは、合成遺伝子がコードするタンパク質の発現レベルを増加し、そしてそのタンパク質の特異な発現の危険性を減少する。例えば、弱いプロモーターによって媒介され得る遺伝子調節の多くの重要な事象の研究は、レポータータンパク質の不適切な発現からの不十分なレポーターシグナルによって制限される。本明細書中に記載の合成ルシフェラーゼ遺伝子は、発現レベルの大きい増加(これが、検出感度の増加を可能にする)に起因して、弱いプロモーター活性の検出を可能にする。また、いくつかの選択マーカーの使用は、外因性細胞におけるそのマーカーの発現によって制限され得る。従って、細胞に対する改善されたコドン使用頻度を有し、そして他の所望でない配列(例えば、転写因子結合部位)が減少された合成選択マーカー遺伝子は、さもなければこれらのマーカーの宿主として望ましくなかった細胞における、これらのマーカーの使用を可能にし得る。
【0095】
プロモーターのクロストーク(crosstalk)は、共レポーター遺伝子を使用してトランスフェクション効率を正規化する場合の、別の問題点である。合成遺伝子の増強された発現によって、強力なプロモーターを含むDNAの量が減少され得るか、または弱いプロモーターを含むDNAを使用して、共レポーターの発現を駆動し得る。さらに、本発明の合成レポーター遺伝子からのバックグラウンド発現が、減少され得る。この特徴は、合成レポーター遺伝子からの散発性の発現を最小化し、そして他の調節経路から生じる干渉を減少することによって、合成レポーター遺伝子をより望ましくする。
【0096】
画像化システム(これは、インビボでの生物学的研究または薬物スクリーニングに使用され得る)におけるレポーター遺伝子の使用は、本発明の合成遺伝子についての別の用途である。これらの発現レベルの増加に起因して、合成遺伝子によってコードされるタンパク質は、画像化システムによってより容易に検出可能である。実際に、合成Renillaルシフェラーゼ遺伝子を使用して、トランスフェクトされたCHO細胞における発光は、計測器の補助なしで可視的に検出された。
【0097】
さらに、合成遺伝子は、融合タンパク質(例えば、分泌リーダー配列または細胞局在化配列を有する融合体)を発現させるため、トランスフェクトするのが困難な細胞(例えば、初代細胞)における転写を研究するため、および/または、調節経路および遺伝エレメントの分析を改善するために使用され得る。他の用途としては、以下が挙げられるが、これらに限定されない:極度の感度を必要とする稀少な事象の検出(例えば、RNA再コード化(recording)の研究)、IRESとの使用、インビトロ翻訳またはインビトロ転写−翻訳連結系(例えば、TNT(Promega Corp.,Madison,WI)の効率を改善するため、異なる宿主生物(例えば、植物、真菌など)に対して最適化されるレポーターの研究、薬物毒性をモニターするための共レポーターとしての複数の遺伝子の使用、マルチウェルアッセイにおけるレポーター分子として、および薬物スクリーニングにおけるレポーター分子(異なるシグナル伝達経路および他の調節機構によるレポーターシグナルの可能な干渉を最小化する利点を有する)として)。
【0098】
さらに、本発明の核酸分子の用途としては、以下が挙げられる:蛍光活性化細胞選別(FACS)、蛍光顕微鏡、インビトロおよびインビボでの遺伝子発現レベルを検出および/または測定するため(例えば、プロモーター強度の決定するため)、細胞内局在化または標的化(融合タンパク質)、マーカーとして、較正において、キットにおいて(例えば、二重(dual)アッセイのため)、インビボ画像化のため、調節経路および遺伝エレメントを分析するため、およびマルチウェル形式において)。
【0099】
ルシフェラーゼをコードする合成DNAについて、合成コメツキムシルシフェラーゼの使用は、二重レポーターの測定のような利点を提供する。Renillaルシフェラーゼは、インビボ画像化により適切であるので(なぜなら、これは、ホタルルシフェラーゼと異なり、反応のためにATPにもMg2+にも依存しないからであり、そしてセレンテラジンは、ルシフェリンよりも細胞膜により透過性であるからである)、合成Renillaルシフェラーゼ遺伝子は、インビボで使用され得る。さらに、合成Renillaルシフェラーゼは、例えば、生物学的分析のため、または薬物スクリーニングプラットフォームにおける、二重ルシフェラーゼアッセイにおける改善された忠実度および感度を有する。
【0100】
(ルシフェラーゼ遺伝子を使用する本発明の実証)
コメツキムシルシフェラーゼおよびRenillaルシフェラーゼのレポーター遺伝子を使用して、本発明を実証した。なぜなら、これらがコードするタンパク質によって触媒される反応は、ほとんどの遺伝子の産物よりも、定量することが有意に容易であるからである。しかし、本発明を実証する目的のために、これらは、一般的な遺伝子を代表する。
【0101】
コメツキムシルシフェラーゼ遺伝子およびRenillaルシフェラーゼ遺伝子は、「ルシフェラーゼ」という名前を共有するが、これは、これらが、同じ遺伝子ファミリーを起源とすることを意味すると解釈されるべきではない。これらの2つのルシフェラーゼタンパク質は、進化的に異なり;これらは、本質的に異なる形質および物理的構造を有し、これらは、広範に異なる基質を使用し(図17)、そしてこれらは、完全に異なる遺伝子ファミリーから進化した。コメツキムシルシフェラーゼは、61kDのサイズであり、ルシフェリンを基質として使用し、そしてCoAシンテターゼから進化した。Renillaルシフェラーゼは、ウミシイタケRenilla Reniformisを起源とし、これは、35kDのサイズであり、基質としてセレンテラジンを使用して、そしてαβヒドロラーゼから進化した。これらの2つの酵素の唯一の共有される形質は、これらが触媒する反応が、光の放出を生じることである。これらは、任意の他の2つの酵素が、例えば、単に、それらが触媒する反応が熱を生じるので類似であるというのと同様に、光の放出を生じることについて類似しない。
【0102】
生物発光は、ルシフェラーゼ媒介酸化反応の結果として特定の生物において生成される光である。ルシフェラーゼ遺伝子(例えば、発光性の甲虫、ウミシイタケ由来の遺伝子、および、特に、Photinus pyralis(北米の一般的なホタル)由来のルシフェラーゼ)は、現在最もポピュラーな発光レポーター遺伝子である。発光レポーター遺伝子アッセイの総説については、Bronsteinら(1994)に、そして甲虫の生物発光の進化の総説については、Wood(1995)に、言及されている。ホタルおよびコメツキムシのルシフェラーゼ(17A)およびRenillaルシフェラーゼ(17B)の各々によって触媒される反応の例示については、図17を参照のこと。
【0103】
ホタルルシフェラーゼおよびRenillaルシフェラーゼは、発光アッセイの簡便性、感度および直線範囲に起因して、遺伝子レポーターとして非常に価値がある。今日、ルシフェラーゼは、実質的に全てのタイプの実験生物系(原核生物および真核生物の細胞培養物、トランスジェニック植物および動物、ならびに無細胞発現系が挙げられるが、これらに限定されない)において使用される。ホタルルシフェラーゼ酵素は、特定の北米の甲虫Photinus pyralisに由来する。ホタルルシフェラーゼ酵素およびコメツキムシルシフェラーゼ酵素は、モノマータンパク質(61kDa)であり、これは、ATPおよびO2を使用する甲虫ルシフェリンの一酸素原子付加を介して、光を生成する(図17A)。Renillaルシフェラーゼは、ウミシイタケRenilla reniformisに由来する。Renillaルシフェラーゼ酵素は、36kDaのモノマータンパク質であり、これは、O2およびセレンテラジンを利用して光を生じる(図17B)。
【0104】
ホタルルシフェラーゼをコードする遺伝子は、Photinus pyralisからクローニングされ、そしてE.coliにおいて活性な酵素を生成することが実証されている(de Wetら、1987)。ホタルルシフェラーゼをコードするcDNA(luc)は、動物細胞、植物細胞および微生物細胞において遺伝子活性をレポートするための選り抜きの遺伝子として支持を獲得し続けている。ホタルルシフェラーゼ反応(CoAの付加によって修飾され、持続的な光の放出を生じる)は、トランスフェクトされた細胞または組織の小さいサンプル中のホタルルシフェラーゼ発現を定量するための、極めて高感度かつ迅速なインビトロアッセイを提供する。
【0105】
遺伝子レポーターとしてホタルルシフェラーゼまたはコメツキムシルシフェラーゼを使用するために、ルシフェラーゼを発現する細胞の抽出物を基質(甲虫ルシフェリン、Mg2+、ATPおよびO2)と混合し、そして発光を即座に測定する。アッセイは、非常に迅速かつ高感度であり、ほとんど労力なく遺伝子発現データを提供する。従来のホタルルシフェラーゼアッセイは、そのアッセイ試薬に補酵素Aを含めて、より高い酵素ターンオーバーおよびより大きい発光強度を生じることによって、さらに改善された(Promega Luciferase Assay Reagent、カタログ番号E1500、Promega Corporation、Madison、Wis.)。この試薬を使用して、ルシフェラーゼ活性は、ルミノメーターまたはシンチレーションカウンターにおいて容易に測定され得る。ホタルルシフェラーゼ活性およびコメツキムシルシフェラーゼ活性はまた、増殖培地にルシフェリンを添加することによって、培養物中の生存細胞において検出され得る。このインサイチュ発光は、甲虫ルシフェリンが細胞膜およびペルオキシソーム膜を通って拡散する能力、ならびにサイトゾルおよびペルオキシソームにおけるATPおよびO2の細胞内利用能に依存する。
【0106】
さらに、レポーター遺伝子は、転写事象を測定するために広範に使用されるが、それらの有用性は、レポーター発現の忠実度および効率によって制限され得る。例えば、米国特許第5,670,356号において、ホタルルシフェラーゼ遺伝子(luc+と呼ばれる)は、ルシフェラーゼ発現のレベルを改善するように改変された。より高いレベルの発現が観察されたが、より高い発現が調節の制御を改善することは決定されなかった。
【0107】
本発明を、以下の非限定的な実施例によってさらに説明する。
【0108】
(実施例1)
(合成コメツキムシ(RDおよびGR)ルシフェラーゼ核酸分子)
LucPplYGは、黄色−緑色の発光を放出する、野生型コメツキムシルシフェラーゼである(Wood、1989)。YG#81−6G01と名付けられたLucPplYGの変異体を想定した。YG#81−6G01は、ペルオキシソーム標的化シグナルを欠き、ルシフェリンおよびATPに対する低いKMを有し、野生型と比較した場合に、シグナル安定性の増加および温度安定性の増加を有する(PCT/WO9914336)。YG#81−6G01を、第224位のAlaをValに変化させること(A224Vは、緑色シフト化変異である)によって緑色の発光を放出するように変異させたか、またはアミノ酸置換A224H、S247H、N346IおよびH348Q(赤色シフト化変異セット)を同時に導入することによって赤色の発光を放出するように変異させた(PCT/WO9518853)。
【0109】
YG#81−6G01を親遺伝子として使用して、2つの合成遺伝子配列を設計した。1つは、緑色発光(GR)を放出するルシフェラーゼをコードし、1つは、赤色発光(RD)を放出するルシフェラーゼをコードする。両方の遺伝子を、1)哺乳動物細胞における発現のために最適化されたコドン使用頻度を有するように;2)転写調節部位(哺乳動物転写因子結合部位、スプライス部位、ポリ(A)付加部位、およびプロモーター、ならびに原核生物(E.coli)調節部位を含む)の数を減少するように;3)所望でない制限部位(例えば、標準的なクローニング手順を妨げる可能性のある制限部位)を欠失するように;および4)両方が同じ細胞内に存在する場合に遺伝子再編成を最小化するために、互いに比較して低いDNA配列同一性を有するように、設計した。さらに、所望の配列(例えば、Kozak配列または制限酵素認識部位)を、同定および導入し得る。
【0110】
全ての設計基準が、同時に上手く等しく達成され得るわけではない。以下の優先度を、転写調節部位の減少について確立した:最も高い優先度を、転写因子(TF)結合部位の除去に与え、次いで、スプライス部位およびポリ(A)付加部位の除去に与え、そして最後に、原核生物調節部位の除去に与えた。調節部位を除去する場合、ストラテジーは、最も重要な変化が最後に生じるのを確実にするように、より低い重要な変化から最も高い重要な変化へと研究することであった。次いで、配列を、新しいより低い優先度の部位の出現について再確認し、必要な場合、さらなる変化を施した。従って、本明細書中に記載されるコンピュータープログラムを使用する、合成GR遺伝子配列およびRD遺伝子配列を設計するためのプロセスは、以下に詳述する5つの必要に応じて繰り返される工程を含んだ。
1.コドン使用頻度を最適化し、そしてA224Vの変化を与えて、GRver1を作製し、また別に、A224H、S247H、N346IおよびH348Qの変化を与えて、RDver1を作製した。これらの特定のアミノ酸変化は、配列に対する以後の全ての操作を通して維持された。
2.所望でない制限部位、原核生物調節部位、スプライス部位、ポリ(A)部位を除去し、それによって、GRver2およびRDver2を作製した。
3.転写因子結合部位を除去し(1回目の処理)、そして任意の新しく作製された所望でない部位(上記工程2に列挙されるような)を除去し、それによって、GRver3およびRDver3を作製した。
4.上記工程3によって作製された転写因子結合部位を除去し(2回目の処理)、そして任意の新しく作製された所望でない部位(上記工程2に列挙されるような)を除去し、それによって、GRver4およびRDver4を作製した。
5.上記工程4によって作製された転写因子結合部位を除去し(3回目の処理)、そして上記工程2に列挙される部位の非存在を確認し、それによって、GRver5およびRDver5を作製した。
6.GRver5およびRDver5の設計された配列のフラグメントに対応する合成オリゴヌクレオチド(図6および10)を使用するPCRによって、実際の遺伝子を構築し、それによって、GR6およびRD7を作製した。GR6は、配列決定において、アミノ酸第49位のセリン残基がアスパラギンに変異され、そしてアミノ酸第230位のプロリンがセリンに変異されている(S49N、P230S)ことが見出された。RD7は、配列決定において、アミノ酸第36位のヒスチジンがチロシンに変異されていること(H36Y)が見出された。これらの変化は、PCRプロセス中に生じた。
7.上記工程6に記載される変異(GR6についてS49N、P230S、およびRD7についてH36Y)を戻して、GRver5.1およびRDver5.1を作製した。
8.RDver5.1を、第351位のアルギニンコドンをグリシンコドンに変化させること(R351G)によってさらに改変し、それによって、RDver5.1と比較して改善されたスペクトル特性を有するRDver5.2を作製した。
9.RDver5.2を、発光強度を増加するようにさらに変異させ、それによって、RD156−1H9を作製した。これは、4つのさらなるアミノ酸変化(M2I、S349T、K488T、E538V)および3つのサイレントな単一の塩基変化をコードする(配列番号18)。
【0111】
(1.コドン使用頻度を最適化し、そして発光色を決定する変異を導入する)
この設計工程についての開始遺伝子配列は、YG#81−6G01(配列番号2)であった。
【0112】
a)コドン使用頻度を最適化する:
このストラテジーは、ヒト細胞における最適な発現のためのコドン使用頻度を適用すること、および同時に、E.coliの低い使用頻度のコドンを回避することである。これらの要件に基づいて、2より多いコドンを有する全てのアミノ酸について、ヒト細胞における発現に最良の2つのコドンを選択した(Wadaら、1990を参照のこと)。6つのコドンを有するアミノ酸についてのコドン対の選択において、その選択を、以下の最も多い不対合塩基数を有する対へ偏らせ、最小の配列同一性を有するGR遺伝子およびRD遺伝子の設計を行った(コドン相違):
Arg:CGC/CGT Leu:CTG/TTG Ser:TCT/AGC
Thr:ACC/ACT Pro:CCA/CCT Ala:GCC/GCT
Gly:GGC/GGT Val:GTC/GTG Ile:ATC/ATT
このコドン選択に基づいて、YG#81−6G01ルシフェラーゼタンパク質配列をコードする2つの遺伝子配列を、コンピューターで作成した。この2つの遺伝子を、最小のDNA配列同一性、および同時に、密接に類似するコドン使用頻度を有するように設計した。これを達成するために、この2つの遺伝子における各コドンを、代替的な様式(例えば、Arg(n)は、遺伝子1においてCGCであり、遺伝子2においてCGTであり、そしてArg(n+1)は、遺伝子1においてCGTであり、そして遺伝子2においてCGCである)で、上記の限定されたリストからのコドンによって置き換えた。
【0113】
この設計プロセスにおける後の工程について、変化が、他の設計基準を満たすために、この限定された最適なコドン選択に対して成されるべきであることが予測されたが、哺乳動物細胞における低い使用頻度の以下のコドンは、より高い優先度の基準を満たすために必要でない限り、使用しなかった:
Arg:CGA Leu:CTA Ser:TCG
Pro:CCG Val:GTA Ile:ATA
また、E.coliにおける低い使用頻度の以下のコドンを、妥当である場合に、回避した(これらのうちの3つが哺乳動物細胞についての低い使用頻度のリストに適合することに留意する):
Arg:CGA/CGG/AGA/AGG
Leu:CTA Pro:CCC Ile:ATA。
【0114】
(b)ルミネッセンス色を決定する変異を導入する)
上記のように、2つのコドンを最適化したこの遺伝子配列のうちの一方に、1つの緑色シフト変異を導入し、もう一方に、4つの赤色シフト変異を導入した。
【0115】
この最初の設計工程からの2つの出力(output)配列を、GRver1(バージョン1 GR)およびRDver1(バージョン1 RD)と名付けた。これらのDNA配列は、63%同一である(594個のミスマッチ)が、これらのDNA配列がコードするタンパク質は、ルミネッセンス色を決定する4つのアミノ酸だけが異なる(DNA配列およびタンパク質配列のアラインメントについて、図2および図3を参照のこと)。
【0116】
表1および表2は、例として、ヒト遺伝子、親遺伝子YG#81−6G01、コドンを最適化した合成遺伝子GRver1およびRDver1、ならびに設計プロセス中工程5が完了した後の最終バージョンの合成遺伝子(GRver5およびRDver5)における、バリンおよびロイシンについてのコドン使用頻度を示す。コドン変化の完全な要約について、図4および5を参照のこと。
【0117】
【表1】
【0118】
【表2】
(2.下線を付した制限部位、原核生物調節部位、スプライス部位、およびポリ(A)付加部位を除去する)
この設計工程のための開始遺伝子配列は、GRver1およびRDver1であった。
【0119】
(a)下線を付した制限部位を除去する)
下線を付した制限部位の存在および位置を確認するために、両方の合成遺伝子の配列を、標準的な配列分析ソフトウェア(GenePro ver6.10、Riverside Scientific Ent.)を使用して、制限酵素認識配列のデータベース(REBASE ver.712、http://www.neb.com/rebase)に対して比較した。具体的には、以下の制限酵素を、望ましくないものとして分類した:
−BamH I、Xho I、Sfi I、Kpn I、Sac I、Mlu I、Nhe I、Sma I、Xho I、Bgl II、Hind III、Nco I、Nar I、Xba I、Hpa I、Sal I、
−一般的に使用される他のクローニング部位:EcoR I、EcoR V、Cla I、
−(複合構築物のために一般的に使用される)8塩基カッター、
−(N末端融合物を可能にする)BstE II、
−(T−ベクタークローニングのために使用されるA/T突出を生成し得る)Xcm I。
【0120】
合成遺伝子中に見出される望ましくない制限部位を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化の指針に従って変更した。
【0121】
(b)原核生物(E.coli)調節配列を除去する)
原核生物調節配列の存在および位置を確認するために、標準的配列分析ソフトウェア(GenePro)を使用して、両方の合成遺伝子の配列を、以下のコンセンサス配列の存在について検索した:
−TATAAT(プロモーターの−10プリブノウボックス)
−AGGAまたはGGAG(リボソーム結合部位;下流12塩基以内にあるメチオニンコドンと対合した場合にのみ、考慮される)。
【0122】
合成遺伝子において見出された場合に、このような調節配列を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化指針に従って変更した。
【0123】
(c)スプライシング部位を除去する)
スプライシング部位の存在および位置を確認するために、標準的配列分析ソフトウェア(GenePro)を使用して、各合成遺伝子の一次RNA転写物に対応するDNA鎖を、以下のコンセンサス配列(Watsonら、1983を参照のこと)の存在について検索した:
−スプライシングドナー配列:AG|GTRAGT(エキソン|イントロン)。
この検索は、AGGTRAGについて実施し、そしてより低いストリンジェンシーでGGTRAGTについて実施した;
−スプライシングアクセプター部位:(Y)nNCAG|G(イントロン|エキソン)。この検索は、n=1を用いて実施した。
合成遺伝子において見出されるスプライシング部位を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化の指針に従って変更した。一方の遺伝子におけるスプライシングアクセプター部位は、一般的に、他方の遺伝子にその部位を導入することなく除去するのが困難であった。なぜなら、そのスプライシングアクセプター部位は、2つのGlnコドン(CAG)のうちの1つを含む傾向があったからである。そのスプライシングアクセプター部位を、その2つの遺伝子間のわずかに増加した配列同一性を犠牲にして、両方の遺伝子中のGlnコドンをCAAで置換することによって除去した。
【0124】
(d)ポリ(A)付加部位を除去する)
ポリ(A)付加部位の存在および位置を確認するために、両方の合成遺伝子の配列を、標準的な配列分析ソフトウェア(GenePro)を使用して、以下のコンセンサス配列の存在について検索した:−AATAAA。合成遺伝子中に見出される各ポリ(A)付加部位を除去するために、その合成遺伝子配列の1つ以上のコドンを、上記1aに記載されるコドン最適化の指針に従って変更した。この第2の設計工程からの2つの出力(output)配列を、GRver2およびRDver2と名付けた。これらのDNA配列は、63%同一(590個のミスマッチ)である(図2および図3)。
【0125】
(3.転写因子(TF)結合部位を除去し、その後、工程2a〜2dを反復する)
この設計工程のための開始遺伝子配列は、GRver2およびRDver2であった。
【0126】
潜在的TF結合部位の存在、位置および正体を確認するために、両方の合成遺伝子の配列を、転写因子結合部位のデータベース(TRANSFAC v3.2)を検索するための問合せ配列として使用した。このTRANSFACデータベース(http://transfac.gbf.de/TRANSFAC/index:html)は、遺伝子調節DNA配列(TF結合部位)およびその配列に結合しかつその配列を介して作用するタンパク質(TF)に関する情報を、保有する。TRANSFAC Release 3.2のSITE表は、4,401件の個々の(推定)TF結合部位(真核生物遺伝子中のTF結合部位、変異誘発研究と無作為オリゴヌクレオチド混合物または特定の理論的要因に基づくインビトロ選択手順とから生じる人工配列中のTF結合部位、および(FaisstおよびMeyer、1992からの)コンセンサス結合配列を含む)を含む。
【0127】
これらの合成遺伝子配列中のこれらのTF結合部位を位置決めおよび提示するために使用されるソフトウェアツールは、TESS(Transcription Element Search Software、http://agave.humgen.upenn.edu/tess/index.html)であった。フィルターを通した文字列に基づく検索オプションを、以下のユーザー定義検索パラメーターとともに使用した:−Factor Selection Attribute:Organism Classification
−Search Pattern:Mammalia
−Max.Allowable Mismatch %:0
−Min.element length:5
−Min.log−likelihood:10。
このパラメーター選択は、少なくとも5塩基長の哺乳動物TF結合部位(このデータベース中の4,401件のうち約1,400件)のみがこの検索に含まれることを、特定する。このパラメーター選択はさらに、その問合せ配列における完全一致と最小対数尤度(LLH)スコア10とを有するTF結合部位のみが、報告されることを、特定する。このLLHスコア付け法は、2を非曖昧(unambiguous)一致に、1を部分的曖昧(partially ambiguous)一致(例えば、AまたはTがWに一致する)に、そして0を「N」に対する一致に割り当てる。例えば、上記に特定されるパラメーターを用いた検索は、TATAA(配列番号240)(LLH=10)、STRATG(配列番号241)(LLH=10)、およびMTTNCNNMA(配列番号242)(LLH=10)について「ヒット」(陽性の結果または一致)であるがTRATG(配列番号243)(LLH=9)について「ヒット」でない、「ヒット」を、これらの4つのTF結合部位がその問合せ配列中に存在する場合に、生じる。その検索パラメーターを再評価するために、より低いストリンジェンシーでの試験を、この設計プロセスの最後に実施した。
【0128】
既知のTF結合部位を含むモック(mock)問合せ配列を用いてTESSを試験した場合、このプログラムは、その問合せ配列の3’末端で終わる部位に対する一致を報告することができないことが、見出された。従って、この問題を排除するために、すべての問合せ配列の3’末端に、余分なヌクレオチドを付加した。
【0129】
上記のパラメーターを使用するTF結合部位についての最初の検索により、2つの合成遺伝子(GRver2およびRDver2)の各々について、約100個の転写因子結合部位(ヒット)が見出された。上記1aに記載されたコドン最適化の指針に従ってその合成遺伝子配列の1つ以上のコドンを変化させることによって、すべての部位を除去した。しかし、いくつかのこれらの変化が、新規なTF結合部位、他の調節配列、および新規な制限部位を生じることが、予期された。従って、工程2a〜2dを記載されるように反復し、そして4つの新規な制限部位および2つの新規なスプライス部位を除去した。この第3の設計工程から生じた2つの出力(output)配列を、GRver3およびRDver3と名付けた。これらのDNA配列は、66%同一(541個のミスマッチ)である(図2および3)。
【0130】
(4.新規な転写因子(TF)結合部位を除去し、その後、工程2a〜2dを反復する)
この設計工程のための開始遺伝子配列は、GRver3およびRDver3であった。
【0131】
この第4の工程は、工程3に記載されるプロセスの繰返しである。新たに導入されたTF結合部位についての検索により、この2つの合成遺伝子の各々について約50ヒットを得た。上記1aに記載されるコドン最適化の指針にほぼ従って、これらの合成遺伝子配列の1つ以上のコドンを変更することによって、すべての部位を除去した。しかし、より高コドン使用頻度〜中程度のコドン使用頻度を使用して、すべてのTF結合部位の除去が可能となった。GR遺伝子とRD遺伝子との間の低い配列同一性を維持することの優先度が、最も低かった。その後、工程2a〜2dを、記載される通り反復した。この第4の設計工程からの2つの出力(output)配列を、GRver4およびRDver4と名付けた。これらのDNA配列は、68%同一(506個のミスマッチ)である(図2および3)。
【0132】
(5.新規な転写因子(TF)結合部位を除去し、その後、工程2a〜2dを反復する)
この設計工程のための開始遺伝子配列は、GRver4およびRDver4であった。
【0133】
この第5の工程は、上記工程3に記載されるプロセスの別の繰返しである。工程4において導入された新規なTF結合部位についての検索により、この2つの合成遺伝子の各々について約20個のヒットを得た。上記1aに記載されるコドン最適化の指針にほぼ従ってこれらの合成遺伝子配列の1つ以上のコドンを変更することによって、すべての部位を除去した。しかし、より高使用頻度〜中程度の使用頻度を使用して(これらは、すべて「好ましい」と見なされる)、すべてのTF結合部位の除去が可能となった。GR遺伝子とRD遺伝子との間の低い配列同一性を維持することが、優先度が最も低かった。その後、工程2a〜2dを、記載されるように反復した。1つのアクセプタースプライス部位だけが、除去され得なかった。最終工程として、工程3にて特定した両方の遺伝子中のすべてのTF結合部位が存在しないことを、確認した。この第5および最後の設計工程からの2つの出力(output)配列を、GRver5およびRDver5と名付けた。これらのDNA配列は、69%同一(504個のミスマッチ)である(図2および図3)。
【0134】
(GRver5およびRDver5のさらなる進化)
(a)より低ストリンジェンシーのパラメーターをTESSに使用する)
TF結合部位についての検索を、上記工程3に記載されるように反復したが、さらに低ストリンジェントなユーザー定義パラメーターを用いた:
−LLHを10の代わりに9に設定すると、新しいヒットを生じなかった;
−LLHを0〜8(両端を含む)に設定すると、2つのさらなる部位MAMAG(22ヒット)およびCTKTK(24ヒット)についてのヒットを生じた;
−LLHを8にそして最小エレメント長を4に設定すると、この検索により、AP−1、NF−1、およびc−Mybについての異なる4塩基部位を(上記の2つの部位に加えて)得た。これらの部位は、より長い各コンセンサス部位の短縮バージョンであり、これらの部位を、上記工程3〜5で除去した。
新たな部位を導入することなくこれらの部位を完全に除去することを試みることは現実的ではなく、従って、さらなる変化を作製しなかった。
【0135】
(b)異なるデータベースを検索する)
Eukaryotic Promoter Database(リリース45)は、真核生物遺伝子の信頼できるようにマッピングされた転写開始部位(1253個の配列)についての情報を含む。このデータベースを、National Center for Biotechnology Informationサイト(http://www.ncbi.nlm.nih.gov/cgi−bin/BLAST)において、(ほぼ同一の配列を迅速に発見するように最適化した)デフォルトパラメーター(Altschulら、1990を参照のこと)とともにBLASTN 1.4.11を使用して、検索した。このアプローチを試験するために、SV40プロモーターとエンハンサーとを含むpGL3−Controlベクター配列の一部を、問合せ配列として使用し、SV40配列に対する予期されたヒットを得た。上記の2つの合成遺伝子を問合せ配列として使用した場合、ヒットは見出されなかった。
【0136】
(GRver5合成遺伝子特性およびRDver5合成遺伝子特性の要約)
両方の遺伝子(この段階で、これらはなお、コンピューターにおける単なる「仮想」配列である)は、哺乳動物の高使用頻度コドンを強く支持しかつ哺乳動物およびE.coliの低使用頻度コドンを最小にする、コドン使用頻度を有する。図4は、親遺伝子のコドン使用頻度と種々の合成遺伝子バージョンの要約を示す。
【0137】
両方の遺伝子はまた、4つより多くの非曖昧(unambiguous)塩基からなる真核生物TF結合部位、ドナースプライス部位およびアクセプター部位(1つの例外:GRver5は、1つのスプライスアクセプター部位を含む)、ポリ(A)付加部位、特定の原核生物(E.coli)調節配列、および望ましくない制限部位を完全に欠く。
【0138】
GRver5とRDver5との間の遺伝子配列同一性は、たった69%(504個のミスマッチ)であるが、一方、それにコードされるタンパク質は、99%同一(4つのアミノ酸ミスマッチ)である。図2および3を参照のこと。親配列YG#81−6G01とこれらとの同一性は、74%(GRver5)および73%(RDver5)である。図2を参照のこと。これらの塩基組成は、親YG#81−6G01についての40.2%GCに対して、49.9%GC(GRver5)および49.5%GC(RDver5)である。
【0139】
(合成遺伝子の構築)
これらの2つの合成遺伝子は、熱サイクラーにおいて合成オリゴヌクレオチドからアセンブルした後、全長遺伝子をPCR増幅することによって(Stemmerら(1995)Gene.164、pp.49〜53と同様に)、構築した。合成遺伝子の設計目的を妨げる意図せぬ変異は、修正した。
【0140】
(a)合成オリゴヌクレオチドの設計)
これらの合成オリゴヌクレオチドは、主に40マーであり、これらは集合として、各設計遺伝子(1,626bp)の完全鎖およびクローニングに必要な隣接領域の両方をコードする(各遺伝子について合計1,950bp;図6)。1つの鎖を特定するすべてのオリゴヌクレオチドの5’境界および3’境界を、一般的には、向かい側の鎖を特定するオリゴヌクレオチドの境界に対して平均20塩基のずれ/重なりを生じる様式で、配置した。
【0141】
両方の遺伝子の隣接領域の末端は、増幅プライマー(pRAMtailup:5’−gtactgagacgacgccagcccaagcttaggcctgagtg(配列番号229)およびpRAMtaildn:5’−ggcatgagcgtgaactgactgaactagcggccgccgag(配列番号230))の末端と一致して、本発明者らのE.coliベクターpRAM(WO99/14336)中への遺伝子クローニングを可能にした。
【0142】
合計183個のオリゴヌクレオチドを設計した(図6):上流隣接配列および下流隣接配列を集合としてコードする15個のオリゴヌクレオチド(両方の遺伝子について同一;配列番号35〜49)と、その2つの遺伝子の両方の鎖をコードする168個のオリゴヌクレオチド(4×42)(配列番号50〜217)である。
【0143】
183個すべてのオリゴヌクレオチドを、OLIGOソフトウェア(Wojciech
RychlikによるOLIGO 4.0 Primer Analysis Software(コピーライト)1989〜1991)のヘアピン分析に通して、潜在的に有害な分子内ループ形成を同定した。この分析結果を評価するための指針を、Sims博士(Sigma−Genosys Custom Gene Synthesis Department)の推奨に従って設定した:ΔG<−10であるヘアピンを形成するオリゴは回避しなければならない。このオリゴヌクレオチドの3’末端を含む、ΔG≦−7であるヘアピンを形成するオリゴもまた回避すべてきであるが、全体でΔG≦−5であるオリゴは、本願について問題を提起するはずがない。この分析により、ΔGが−7.1と−4.9との間であるヘアピンを形成することができる、23個のオリゴヌクレオチドが同定された。これらのうち、5つは、3’末端をブロックするかまたはほぼブロックした(0〜3個の遊離塩基)。そしてこれらを、その3’末端の1〜4塩基を除去しそして隣接オリゴヌクレオチドにその1〜4塩基を付加することによって、再設計した。
【0144】
ポリ(A)テイルと相補的な配列を包含するこの40マーオリゴヌクレオチドは、非常に低い複雑度の3’末端(13個連続するT塩基)を有した。高い複雑度の3’末端を有するが、向かい合う鎖上の相補的オリゴヌクレオチド(20塩基の代わりに11塩基)の1つと結果的に重複が減少した、さらなる40マーを設計した。
【0145】
これらのオリゴは、熱サイクラーベースのアセンブル反応における使用のために設計されたが、これらは、遺伝子構築のために連結ベースのプロトコルにおいても使用され得る。このアプローチにおいて、これらのオリゴヌクレオチドは、対合様式でアニーリングされ、そして生じた短い二本鎖フラグメントが、付着突出を使用して連結される。しかし、このためには、すべてのオリゴヌクレオチドがリン酸化されていることが、必要である。
【0146】
(b)遺伝子のアセンブルおよび増幅)
第1の工程において、この2つの合成遺伝子各々を、98個のオリゴヌクレオチドから別の反応にてアセンブルさせた。各反応について、総容積は50μlであった:
0.5μMオリゴヌクレオチド(=各オリゴ0.25pmol)
1.0U Taq DNAポリメラーゼ
0.02U Pfu DNAポリメラーゼ
2mM MgCl2
0.2mM dNTP(各々)
0.1%ゼラチン
サイクリング条件:(94℃で30秒、52℃で30秒間、および72℃で30秒間)×55サイクル。
【0147】
第2の工程において、アセンブルした各合成遺伝子を、別の反応にて増幅した。各反応についての総容積は、50μlであった:
2.5μlアセンブル反応液
5.0U Taq DNAポリメラーゼ
0.1U Pfu DNAポリメラーゼ
1M各プライマー(pRAMtailup、pRAMtaildn)
2mM MgCl2
0.2mM dNTP(各々)
サイクリング条件(94℃で20秒、65℃で60秒、72℃で3分)×30サイクル。
【0148】
アセンブルされそして増幅された遺伝子を、pRAMベクター中にサブクローニングし、そしてE.coli中にて発現させて、1〜2%の発光GRクローンまたは蛍光RDクローンを得た。5つのGRクローンおよび5つのRDクローンを単離し、そしてさらに分析した。この5つのGRクローンのうち、3つが、正確なインサートサイズを有した。この3つのうち、1つは、弱く発光し、そして1つは、変化した制限パターンを有した。5つのRDクローンのうち、2つは、正確なサイズのインサートを有し、変化した制限パターンを有した。これらのうちの1つは、弱く発光した。全体として、この分析は、これらの遺伝子における多数の変異の存在を示した。これらは、アセンブル反応および増幅反応において導入されたエラーの結果である可能性が高い。
【0149】
(c)修正アセンブルおよび増幅)
全長合成遺伝子中に存在するこの多数の変異を除去するために、本発明者らは、プルーフリーディングDNAポリメラーゼTliを使用して、各遺伝子についてさらなるアセンブル反応および増幅反応を実施した。このアセンブル反応は、98個のGRオリゴヌクレオチドまたはRDオリゴヌクレオチドに加えて、上記の変異を含む対応する全長クローン由来の少量のDNAを含んだ。このことにより、これらのオリゴが、テンプレート中に存在する変異を修正することが可能になる。
【0150】
以下のアセンブル反応を、合成遺伝子各々について実施した。各反応についての総容積は、50μlであった:
0.5μMオリゴヌクレオチド(=各オリゴ0.25pmol)
0.016pmolプラスミド(正確なインサートサイズを含むクローンの混合物)
2.5U Tli DNAポリメラーゼ
2mM MgCl2
0.2mM dNTP(各々)
0.1%ゼラチン
サイクリング条件:94℃で30秒、その後、(94℃で30秒、52℃で30秒間、および72℃で30秒間)×55サイクル、その後、72℃で5分間。
【0151】
以下の増幅反応を、これらのアセンブル反応液各々に対して実施した。各増幅反応についての総体積は、50μlであった:
1〜5μlアセンブル反応液
40pmol各プライマー(pRAMtailup、pRAMtaildn)
2.5U Tli DNAポリメラーゼ
2mM MgCl2
0.2mM dNTP(各々)
サイクリング条件:94℃で30秒、その後、(94℃で20秒、65℃で60秒間、および72℃で3分間)×30サイクル、その後、72℃で5分間。
【0152】
修正アセンブル工程および増幅工程から得られた遺伝子を、pRAMベクター中にサブクローニングし、そしてE.coliにおいて発現させ、75%の発光GRクローンまたは発光RDクローンを得た。44個のGRクローンおよび44個のRDクローンを、本発明者らのスクリーニングロボット(WO99/14336)を用いて分析した。6つの最良のGRクローンおよびRDクローンを手で分析し、そして1つの最良のGRクローンおよびRDクローン(GR6およびRD7)を、選択した。GR6の配列分析により、コード領域における2つの点変異が明らかになった。この点変異は、両方とも、アミノ酸置換(S49NおよびP230S)を生じた。RD7の配列分析により、コード領域において3つの点変異が明らかになった。この点変異のうちの1つは、アミノ酸置換(H36Y)を生じた。サイレント点変異はいずれも、この合成遺伝子の全体的設計基準と矛盾するいかなる調節部位または制限部位も、導入しなかったことを確認した。
【0153】
(d)意図しないアミノ酸置換の逆転)
GR6合成遺伝子およびRD7合成遺伝子中に存在する意図しないアミノ酸置換を、GRver5設計配列およびRDver5設計配列と一致するような部位特異的変異誘発によって逆転し、それにより、GRver5.1およびRDver5.1を作製した。変異した領域のDNA配列を、配列分析によって確認した。
【0154】
(e)スペクトル特性を改善する)
RDver5.1遺伝子を、アミノ酸変化(R351G)を導入することによりこの遺伝子のスペクトル特性を改善するようにさらに改変し、それにより、RDver5.2を作製した。
【0155】
(RD遺伝子およびGR遺伝子を含む、pGL3ベクター)
親コメツキムシルシフェラーゼYG#81−6G01(「YG」)、ならびに合成コメツキムシルシフェラーゼ遺伝子GRver5.1(「GR」)、RDver5.2(「RD」)、およびRD156−1H9を、この4つのpGL3レポーターベクター(Promega Corp.)中にクローニングした:
−pGL3−Basic=プロモーターなし、エンハンサーなし
−pGL3−Control=SV40プロモーター、SV40エンハンサー
−pGL3−Enhancer=SV40エンハンサー(ルシフェラーゼコード配列の3’側)
−pGL3−Promoter=SV40プロモーター。
GR合成遺伝子およびRD合成遺伝子のアセンブルにおいて使用したプライマーは、pRAMベクター中へのそれらの遺伝子のクローニングを容易にした。哺乳動物細胞における分析のためのpGL3ベクター(Promega Corp.,Madison、WI)中にこれらの遺伝子を導入するために、pRAMベクター中の各遺伝子(pRAM RDver5.1、pRAM GRver5.1、およびpRAM RD156−1H9)を、それらの遺伝子の5’末端にNco I部位をそして3’末端にXba I部位を導入するように増幅した。pRAM RDver5.1についてのプライマーおよびpRAM
GRver5.1についてのプライマーは、以下であった:
GR→5’GGA TCC CAT GGT GAA GCG TGA GAA 3’(配列番号231)または
RD→5’GGA TCC CAT GGT GAA ACG CGA 3’(配列番号232)および
5’CTA GCT TTT TTT TCT AGA TAA TCA TGA AGA C 3’(配列番号233)。
pRAM RD156−1H9についてのプライマーは、以下であった:
5’GCG TAG CCA TGG TAA AGC GTG AGA AAA ATG TC 3’(配列番号295)および
5’CCG ACT CTA GAT TAC TAA CCG CCG GCC TTC ACC 3’(配列番号296)。
このPCRは、以下を含んだ:
100ng DNAプラスミド
1μM上流プライマー
1μM下流プライマー
0.2mM dNTP
1×緩衝液(Promega Corp.)
5単位 Pfu DNAポリメラーゼ(Promega Corp.)
50μlにする滅菌ナノピュア水。
【0156】
このサイクリングパラメーターは、以下であった:94℃で5分;(94℃で30秒;55℃で1分;および72℃で3分)×15サイクル。精製PCR生成物を、Nco IおよびXbaIで消化し、NcoIおよびXbaIで消化したpGL3−controlと連結し、そしてこの連結生成物を、E.coliに導入した。これらのルシフェラーゼ遺伝子を他のpGL3レポーターベクター(basic、promoterおよびenhancer)に挿入するために、これらのルシフェラーゼ遺伝子の各々を含むpGL3−controlを、Nco IおよびXba Iで消化し、これもNco IおよびXba Iで消化した他のpGL3ベクターと連結し、そしてこの連結生成物を、E.coliに導入した。pGL3ベクター中のGRver5.1核酸配列およびRDver5.1(およびRD156−1H9(下記参照))核酸配列によりコードされるポリペプチドは、そのオリゴヌクレオチド中の開始コドンのNcoI部位の結果として、2位がバリンになるアミノ酸置換を有することに、注意されたい。
【0157】
内部Nco I部位およびXba I部位が原因で、YG#81−6G01中のネイティブ遺伝子を、コード領域の上流にあるHind III部位から下流にあるHpa I部位まで増幅した。これは、GRクローンおよびRDクローン中に見出される隣接配列を含んだ。上流プライマー(5’−CAA AAA GCT TGG CAT TCC GGT ACT GTT GGT AAA GCC ACC ATG GTG AAG CGA GAG−3’;配列番号234)および下流プライマー(5’−CAA TTG TTG TTG TTA ACT TGT TTA TT−3’;配列番号235)を、YG#81−6G01と混合し、そして上記のPCR条件を使用して増幅した。精製PCR生成物をNco IおよびXba Iで消化し、これもまたHind IIIおよびHpa Iで消化したpGL−controlと連結し、そしてこの連結生成物を、E.coli中に導入した。他のpGL3レポーターベクター(basic、promoter、およびenhancer)中にYG#81−6G01を挿入するために、YG#81−6G01を含むpGL3−controlベクターをNco IおよびXba Iで消化し、そしてこれもまたNco IおよびXba Iで消化した他のpGL3ベクターと連結し、そしてこの連結した生成物を、E.coli中に導入した。このpGL3ベクター中のYG#81−6G01のクローンは、塩基786にてAの代わりにCを有し、これにより、残基262にてPheからLeuへのアミノ酸配列の変化を生じることに、注意されたい(図2は、pGL3ベクター中に導入する前の、YG#81−6G01の配列を示す)。262位の変化したアミノ酸が酵素の生化学に影響したか否かを決定するために、YG#81−6G01のクローンを、元の配列と似るように変異させた。その後、両方のクローンを、E.coliにおける発現、物理的安定性、基質結合、およびルミネッセンス出力動態について試験した。有意な差異は、見出されなかった。
【0158】
合成遺伝子から発現された部分精製酵素および親遺伝子から発現された部分精製酵素を使用して、ルシフェリンおよびATPについてのKmを決定した(表3を参照のこと)。
【0159】
(表3)
【0160】
【表3】
インビトロでの真核生物転写/翻訳反応もまた、製造業者の指示に従って、PromegaのTNT T7 Quickシステムを使用して行った。ルミネッセンスレベルは、合成GR遺伝子および合成RD遺伝子について、(ルミノメーターのスペクトル感度について補正した)親遺伝子と比較して、それぞれ、(反応時間に依存して)1〜37倍および1〜77倍高かった。
【0161】
合成コメツキムシルシフェラーゼ遺伝子および野生型コメツキムシ遺伝子が、哺乳動物細胞において改善した発現を有するか否かを試験するために、この合成遺伝子および親遺伝子の各々を、一連のpGL3ベクター中にクローニングし、そしてCHO細胞中に導入した(表8)。すべての場合において、合成コメツキムシ遺伝子が、ネイティブ遺伝子より高い発現を示した。詳細には、合成GR遺伝子の発現および合成RD遺伝子の発現は、親の発現よりも、それぞれ、1900倍および40倍高かった(トランスフェクション効率を、ネイティブRenillaルシフェラーゼ遺伝子との比較により正規化した)。さらに、(basicベクター対controlベクターの)このデータは、これらの合成遺伝子が、基礎レベル転写を減少させたことを、示す。
【0162】
さらに、ネイティブ遺伝子と合成遺伝子との間でこのcontrolに関する活性の割合が比較される、enhancerベクターを用いた実験において、このデータは、これらの合成遺伝子が、異常な転写特徴を有する危険が減少していることを、示した。特に、親遺伝子は、ベクター中のエンハンサーにより活性化される、1つ以上の内部転写調節配列を含むようであった。従って、親遺伝子は、レポーター遺伝子として適切ではないが、合成GR遺伝子および合成RD遺伝子は、きれいなレポーター応答を示した(トランスフェクション効率を、ネイティブRenillaルシフェラーゼ遺伝子との比較により正規化した)。表9を参照のこと。
【0163】
クローン名ならびにヌクレオチド配列およびアミノ酸配列についてのそれらの対応する配列番号を、以下の表4に列挙する。
【0164】
【表4】
(実施例2:RDルシフェラーゼ遺伝子の評価)
RDver5.2を、そのルシフェラーゼ強度を増大させるために変異させ、それにより、4つのさらなるアミノ酸変化(M2I、S349T、K−488T、E538V)および3つのサイレント点変異(配列番号18)を有するRD156−1H9を作製した。
【0165】
a)部位特異的変異誘発:
最初のストラテジーは、部位特異的変異誘発を使用することであった。H348Qに対してGR合成遺伝子とRD合成遺伝子との間には4つのアミノ酸差異があり、このことにより、赤色に対する最大の寄与がもたらされる。従って、この置換はまた、低い発光を導き得るタンパク質における構造的変化を引き起こし得る。この領域近辺の最適化は、発光を増大させ得る。以下の位置を、変異のために選択した:
1.S344(ルシフェリンの結合ポケットの端にある)−このコドンを無作為化する
2.A245(厳密に保存されているが、348に最も近く、活性部位ポケットの端にある)−このコドンを無作為化する
3.I347(保存されておらず、配列中の348の隣にある)−疎水性アミノ酸のみに変異させる
4.S349(保存されておらず、配列中の348の隣にある)−S,T,A,Pのみに変異させる。
【0166】
上記の位置で変異させるように設計したオリゴヌクレオチドを、部位特異的変異誘発実験(WO99/14336)に用い、得られた変異体を、発光強度についてスクリーニングした。発光強度においてはほとんどバリエーションがなく、約25%のみが発光した。さらに詳細な分析のために、クローンを拾って、スクリーニングロボット(PCT/WO9914336)を用いて分析した。RDver5.2より高い発光強度(LI)のクローンはなかったが、クローンのうちの4つがルシフェリンおよびATPについてわずかに低い複合Kmを有した(Km)。
【0167】
b)方向付けられた進化:
方向付けられた進化のために用いたプロトコルおよび手順は、PCT/WO9914336に詳細に記載される。低いKmを有する4つのクローン由来のDNAを組み合わせ、ランダム変異体の3つのライブラリーを生成した。このライブラリーを、ロボットを用いてスクリーニングし、最高のLIを有するクローンを選択した。これらのクローンをともにシャッフルし、別のロボットスクリーニングにより、46℃のインキュベーション温度で完了した。最高のLI値を有する3つのクローンは、RD156−0B4、RD156−1A5、およびRD156−1H9であった。
【0168】
c)分析
最高のLI値を有する3つのクローンを、手動分析のために選択して、それらの発光強度がRDver5.2より高いことを確認し、それらのスペクトル特性が弱められていないことを確実にする。クローンのうちの1つがわずかに緑色にシフトし、他の全てのものは、RDver5.2のスペクトル特性を維持した(表5)。
【0169】
【表5】
RDver5.2に対するルシフェリンのKm値および発光強度を、いくつかの独立した実験において3つ全てのクローンについて決定した。全ての細胞サンプルを、CCLR溶解緩衝液(E1483,Promega Corp.,Madison,WI)で処理し、緩衝液(25mM HEPES pH7.8,5% グリセロール,1mg/ml BSA,150mM NaCl)に1:10希釈した。表7は、細菌細胞における発現からの結果(Lum:光学密度に対して正規化した発光値;独立した実験の測定値を前のスラッシュにより分けている)をまとめる。RD156−1H9(最高の発光強度(5〜10倍の増加)を有するクローン)はまた、ルシフェリンについて約2倍高いKmを有する。
【0170】
【表6】
表7は、照度計光電子倍増管のスペクトル感度の較正ありまたはなしで、GRver5.1に対して正規化したRD156−1H9、GRver5.1およびRDver5.2の発光強度間の比較を示す。較正した場合、クローンRD156−1H9の発光強度は、GRver5.1より約2倍低いだけであった。クローンRD156−1H9についてのルシフェリンKmは、GRver5.1より約40倍高い。RD156−1H9は、少なくとも2時間にわたり50℃で熱安定性である。
【0171】
【表7】
表8および表9は、CHO細胞におけるルシフェラーゼ発現レベルの比較を示す。表8は、ホタルルシフェラーゼ遺伝子と比較した、コントロールベクターからの発現レベルのみを示す(RLU=相対光単位)。表9は、pGL3−コントロールにおける発現レベルの%として計算した4つ全てのpGL3ベクターにおける発現レベルの比較を示す。
【0172】
【表8】
【0173】
【表9】
(実施例3:合成Renillaルシフェラーゼ核酸分子)
調製した合成Renillaルシフェラーゼ遺伝子は、以下を含む:1)導入されたコザック配列、2)哺乳動物(ヒト)発現のために最適化されたコドン使用頻度、3)所望でない制限部位の減少または排除、4)原核生物性調節部位の除去(リボソーム結合部位およびTATAボックス)、5)スプライス部位およびポリ(A)付加部位の除去、および6)哺乳動物転写因子結合配列の減少または排除。
【0174】
合成Renillaルシフェラーゼ遺伝子のコンピューター補助による設計のプロセスは、コドン最適化、ならびに転写因子結合部位および他の調節部位、ならびに制限部位に除去の回数を反復することは、3つの工程で記載され得る:
1.野生型Renillaルシフェラーゼ遺伝子を親遺伝子として用いて、コドン使用頻度を最適化し、1つのアミノ酸を変化させて(T→A)、コザックコンセンサス配列を生成し、所望でない制限部位を排除し、それにより、合成遺伝子Rlucver1を作製した。
2.原核生物性調節部位、スプライス部位、ポリ(A)部位および転写因子(TF)結合部位を除去する(第1の試み)。次いで、新たに作製したTF結合部位を除去する。次いで、新たに作製した所望でない制限酵素部位、原核生物性調節部位、スプライス部位、およびポリ(A)部位を、新たなTF結合部位を導入することなく除去する。このことにより、Rlucver2を作製した。
3.Rlucver2の3つの塩基を変化させることにより、Rluc−最終を作製した。
4.次いで、実際の遺伝子を、Rluc−最終を設計した配列に対応する合成オリゴヌクレオチドから構築した。アセンブリプロセスまたはPCRプロセスから得られた全ての変異を正した。この遺伝子は、Rluc−最終(配列番号22)であり、配列番号227のアミノ酸配列をコードする。
【0175】
(コドン選択)
GenbankのRenilla reniformisルシフェラーゼ配列(登録番号M63501、配列番号19)で開始して、ヒト細胞における最適な発現のためのコドン使用頻度に基づいて、およびE.coliの低使用頻度コドンを避けるために、コドンを選択した。ヒト細胞における発現のための最良の1つのコドン(または類似の頻度で見出された場合は、最良の2つのコドン)を1を超えるコドンに対して、全てのアミノ酸のために選択した(Wada et al.,1990):
【0176】
【化1】
1つのアミノ酸に対して2つのコドンが選択された場合、これらのコドンを、交互にして使用した。合成遺伝子についての他の基準を満たすために、最初の最適コドン選択を、後にある程度まで改変した。例えば、コザック配列の導入は、2位のアミノ酸のAlaに関してGCTの使用を必要とした(以下を参照のこと)。
【0177】
哺乳動物細胞における以下の低使用頻度コドンは、必要でなければ用いなかった:Arg:CGA、CGU;Leu:CTA、UUA;Ser:TCG;Pro:CCG;Val:GTA;およびIle:ATA。以下のE.coliにおける低使用頻度コドンはまた、妥当な場合は避けた(これらのうちの3つが哺乳動物細胞についての低使用頻度リストに適合することに注意のこと):Arg:CGA/CGG/AGA/AGG,Leu:CTA;Pro:CCC;Ile:ATA。
【0178】
(コザック配列の導入)
コザック配列:5’aaccATGGCT3’(配列番号293)(NcoI部位に下線を付し、コード領域は、大文字で示す)を、合成Renillaルシフェラーゼ遺伝子に導入した。コザック配列の導入により、2番目のアミノ酸がThrからAla(GCT)に変化する。
【0179】
(所望でない制限部位の除去)
REBASE ver.808(1998年8月1日に更新;制限酵素データベース;www.neb.com/rebase)を用いて、実施例1に記載のように、所望でない制限部位を同定した。以下の所望でない制限部位(実施例1に記載のものに加えて)を、実施例1に記載のプロセスに従って除去した:EcoICRI、NdeI、NsiI、SphI、SpeI、XmaI、PstI。
【0180】
これらの変化全てが組み込まれたRenillaルシフェラーゼ(Rluc)のバージョンは、Rlucver1である。
【0181】
(原核生物性(E.coli)調節配列、スプライス部位、およびポリ(A)部位の除去)
転写調節部位を排除することに関する優先事項およびプロセスは、実施例1に記載のとおりであった。
【0182】
(TF結合部位の除去)
実施例1に記載のものと同じプロセス、ツール、および基準を用いたが、TRANSFACデータベースのより新たなバージョン3.3を用いた。
【0183】
Rlucver1から原核生物性調節配列スプライス部位およびポリ(A)部位を除去した後、TF結合部位に関する最初の検索を行うと、約60がヒットした。全ての部位を、合成Renilla遺伝子のアミノ酸を改変することなく、除去され得る3つの例外に関して排除した:
1.CAC−結合タンパク質T00076に関して、63位の部位がWの2つのコドン(TGGTGG)から構成される;
2.myc−DF1 T00517に関して、522位の部位は、KMVについてのコドン(AAN ATG GTN)から構成される;
3.myc−DF1 T00517に関して、885位の部位は、EMGについてのコドン(GAR ATG GGN)から構成される。
【0184】
(新たに導入した)TF結合部位に関して、その後に2回目の検索を行うと、約20がヒットした。全ての新たな部位を、上記の3つの部位を残して排除した。最後に、任意の新たに導入した制限部位、原核生物性調節配列、スプライス部位およびポリ(A)部位を、可能な場合、新たなTF結合部位を導入せずに除去した。
【0185】
Rlucver2を得た(配列番号21および226)。
【0186】
実施例1と同様に、低いストリンジェンシーの検索パラメーターが、TESSフィルターにかけた文字列検索により特定されて、合成Renilla遺伝子をさらに評価した。
【0187】
LLHが10から9に減少し、最小のエレメントの長さが5から4に減少した場合、TESSフィルターにかけた文字列検索をしても、新たにヒットしなかった。上記に列挙したパラメーター変化に加えて、生物分類を哺乳動物から脊索動物に拡大した場合、この検索により、さらに4つのTF結合部位のみが得られた。Min LLHが8から0にさらに減少すると、この検索により、組み合わされたさらに2つの5塩基の部位(MAMAGおよびCTKTK)が示され、Rlucver2において4つの適合およびいくつかの4塩基の部位を有した。また、実施例1と同様に、Rlucver2を、EPD(真核生物プロモーターデータベース,リリース45)の登録に対してヒットするかをチェックした。3つのヒットを決定した(Mus musculusプロモーターH−2L^dに対して1つ(Cell,44,261(1986)、単純ヘルペスウイルスI型プロモーターb’g’2.7kbに対して1つ、およびHomo sapiens DHFRプロモーターに対して1つ(J.Mol.Biol.,176,169(1984))。しかし、Rlucver2に対してさらなる変化は行わなかった。
【0188】
(Rlucver2についての特性のまとめ)
−30全ての低使用頻度コドンを排除した。コザック配列の導入により、2番目のアミノ酸がThrからAlaに変化した;
−塩基組成:55.7% GC(Renilla野生型親遺伝子:36.5%);
−1つの所望でない制限部位は排除できなかった:488位のEcoRV;
−合成遺伝子は、原核生物性プロモーター配列を有さないが、867〜73位の1つの潜在的に機能的なリボソーム結合部位(RBS)(Metコドンの約13塩基上流)は排除できなかった;
−全てのポリ(A)付加部位を排除した;
−スプライス部位:2つのドナースプライス部位は排除できなかった(両方とも、アミノ酸配列MGKを共有する);
−TF部位:4つを超える明白な塩基のコンセンサスを有する全ての部位を、アミノ酸配列に対する変更を避けるための優先度に起因する3つの例外を除いて、排除した(約280のTF結合部位を除いた)。
合成Renillaルシフェラーゼ配列を図7および8に示す。コドン使用頻度の比較を、図9に示す。
【0189】
pGL3に導入される場合、Rluc−最終は、コザック配列(CACCATGGCT)を有する。Rlucver2に対するRluc−最終における変化を、遺伝子アセンブリの間に導入した。一方の変更は、619位におけるCからAへの変化であり、これは、真核生物プロモーター配列を排除し、遺伝子をアセンブルするために用いられる、対応するオリゴヌクレオチドにおけるヘアピン構造の安定性を減少させた。他方の変更は、218〜220位におけるCGCからAGAへの変更を含んでいた(PCRのためのより良好なオリゴヌクレオチドが生じた)。
【0190】
(遺伝子アセンブリストラテジー)
合成Renillaルシフェラーゼのために用いた遺伝子アセンブリプロトコルは、実施例1に記載のプロトコルと類似していた。使用したオリゴヌクレオチドを、図10に示す。
【0191】
【化2】
得られた合成遺伝子フラグメントを、NcoIおよびXbaIを用いてpRAMベクターにクローニングした。正確なサイズの挿入物を有する2つのコドンを、配列決定した。6つの変異のうち4つを各クローンから合成遺伝子において見出した。これらの変異は、部位特異的変異誘発により固定され(Promega Corp.,Madison,WIのGene Editor)、これら2つの遺伝子間で正確な領域を交換した。正しくされた遺伝子を、配列決定により確認した。
【0192】
(他のベクター)
pGL−3コントロールベクター骨格における合成Renillaルシフェラーゼ遺伝子のための発現ベクターを調製するために、5μgのpGL3−コントロールを、2μlの各酵素および5μlの10×緩衝液Bを含有する50μlの最終容量(ナノピュア水を用いて、50μlの容量にする)中でNcoIおよびXbaIで消化した。消化反応系を、37℃で2時間インキュベートし、混合物全体を、1×TAE中で1%アガロースゲル上で泳動した。所望のベクター骨格フラグメントを、QiagenのQIAquickゲル抽出キットを用いて精製した。
【0193】
ネイティブなRenillaルシフェラーゼ遺伝子フラグメントを、2つのオリゴヌクレオチド、NcoI−RL−FおよびXbaI−RL−Rを用いてpGL3−コントロールベクターにクローニングし、テンプレートとしてpRL−CMVを用いて、ネイティブなRenillaルシフェラーゼ遺伝子をPCR増幅した。NcoI−RL−Fについての配列は、以下のとおりである:
【0194】
【化3】
XbaI−RL−Rについての配列は、以下のとおりである
【0195】
【化4】
PCR反応を以下のとおりに行った:
反応混合物(100μlについて):
DNAテンプレート(プラスミド) 1.0μl(1.0ng/μl 最終)
10×Rec.緩衝液 10.0μl(Stratagene Corp.)
dNTP(各25mM) 1.0μl(最終250μM)
プライマー1(10μM) 2.0μl(0.2μM 最終)
プライマー2(10μM) 2.0μl(0.2μM 最終)
Pfu DNAポリメラーゼ 2.0μl(2.5U/μl,Stratagene Corp.)
82μlの2回蒸留水
PCR反応系:
94℃で2分間加熱;(94℃で20秒;65℃で1分;72℃で2分;次いで72℃で5分)×25サイクル、次いで、氷上でインキュベートする。PCR増幅したフラグメントをゲルから切り出し、DNAを精製し、−20℃で保存した。
【0196】
ネイティブのRenillaルシフェラーゼ遺伝子フラグメントをpGL3−コントロールベクターに導入するために、ネイティブのRenillaルシフェラーゼ遺伝子のPCR産物(RAM−RL合成)5μgを、NcoIおよびXbaIを用いて消化した。所望のRenillaルシフェラーゼ遺伝子フラグメントを精製し、−20℃で保存した。
【0197】
次いで、100ngの挿入物および100ngのpGL3−コントロールベクター骨格を、制限酵素NcoIおよびXbaIで消化し、ともに連結した。次いで、2μlの連結混合物を、JM109コンピテント細胞に形質転換した。8つのアンピシリン耐性クローンを拾い、それらのDNAを単離した。pGL3−コントロール−ネイティブおよびpGL3−コントロール−合成の各陽性クローンからの各DNAを精製した。ベクター中のネイティブの遺伝子および合成遺伝子の正確な配列を、DNA配列決定により確認した。
【0198】
合成Renillaルシフェラーゼ遺伝子により哺乳動物細胞における発現が改善されたか否かを決定するために、この遺伝子を、SV40プロモーターおよびSV40初期エンハンサーの制御下で、哺乳動物発現ベクターpGL3−コントロールベクターにクローニングした(図13A)。ネイティブのRenillaルシフェラーゼ遺伝子をまた、pGL−3コントロールベクターにクローニングし、その結果、合成遺伝子およびネイティブの遺伝子からの発現を比較した。次いで、これらの発現ベクターを、4つの一般的な哺乳動物細胞株(CHO、NIH3T3、HelaおよびCV−1;表10)にトランスフェクトし、合成遺伝子 対 ネイティブの遺伝子に関して、ベクター間の発現レベルを比較した。使用したDNAの量は、合成遺伝子が、異なる発現レベルで構成的に増大されることを確認するために、2つの異なるレベルの量であった。結果は、これらの細胞における合成Renillaルシフェラーゼ遺伝子に関して、70〜600倍の発現を示す(表10)。
【0199】
【表10】
ルシフェラーゼレポーターの1つの重要な利点は、その短いタンパク質半減期である。増強した発現はまた、長期化したタンパク質半減期から生じ得、そうであるならば、このことは、新たな遺伝子の所望されない欠点を与える。この可能性は、シクロヘキシミド追跡(cycloheximide chase)(「CHX追跡」)実験により除外される(図14)。このことにより、タンパク質半減期の増大は、ヒト化Renillaルシフェラーゼ遺伝子から生じないことが実証される。
【0200】
発現における増加が、確実に発現ベクター骨格に限定されず、プロモーター特異的および/または細胞特異的であるようにするために、合成Renilla遺伝子(Rluc−最終)およびネイティブのRenilla遺伝子を異なるベクター骨格に、異なるプロモーターの制御下でクローニングした(図13B)。この合成遺伝子は、その野生型対応物と比較して、常に発現が増加している(表11)。
【0201】
【表11】
【0202】
【表12】
(図13Aに示されるベクター骨格)
減少した見せかけの発現の場合、合成遺伝子は、プロモーターなしのベクターにおいてより低い基本的レベルの転写を示すはずである。合成Renillaルシフェラーゼ遺伝子およびネイティブのRenillaルシフェラーゼ遺伝子を、pGL3−基本ベクターにクローニングして、転写の基本的レベルを比較した。合成遺伝子自体は増加した発現効率を有するので、プロモーターなしのベクターからの活性により、基本的転写の差異を判断するために直接比較することはできず、むしろ、このことは、コントロールベクターを参照して、プロモーターなしのベクターからの活性の%を比較することにより考慮される(基本的ベクターからの発現は、プロモーターエレメントおよびエンハンサーエレメント両方を有する完全に機能的なベクターにおける発現により区別した)。このデータは、合成Renillaルシフェラーゼが、ネイティブの遺伝子より低いレベルの基本的転写を有することを実証する(表12)。
【0203】
エンハンサーが、プロモーター活性を実質的に刺激することが当業者に周知である。合成遺伝子は、不適切な転写特性の危険性を減少したか否かを試験するために、ネイティブ遺伝子および合成遺伝子を、エンハンサーエレメントを有するベクター(pGL3−エンハンサーベクター)に導入した。合成遺伝子は、より高い発現効率を有するので、エンハンサーの存在下で転写レベルを比較するために、両方の活性を直接比較することはできない。しかし、このことは、コントロールベクターを参照して、エンハンサーベクターから活性の%を用いることにより考慮される(エンハンサーの存在下での発現は、プロモーターエレメントおよびエンハンサーエレメント両方を有する完全に機能的なベクターにおける発現により区別した)。このような結果は、ネイティブな遺伝子が存在する場合、エンハンサー単独で、コントロールの42〜124%の転写を刺激することが可能であることを示す。しかし、ネイティブの遺伝子が、同じベクター中で合成遺伝子により置換されると、活性のみが、同じエンハンサーおよび強力なSV40プロモーターが用いられる場合、この値の1〜5%を構成するにすぎない。このことは、合成遺伝子が、見せかけの発現の危険性を減少させたことを明らかに示す(表12)。
【0204】
合成Renilla遺伝子(Rluc−最終)をインビトロ系で用いて、ネイティブの遺伝子と翻訳効率を比較した。T7 quick coupled transcription/translation system(Promega Corp.,Madison,WI)において、pRL−nullネイティブプラスミド(T7プロモーターの制御下でネイティブRenillaルシフェラーゼ遺伝子を有する)または同じ量のpRL−null−合成プラスミド(T7プロモーターの制御下で合成Remaillaルシフェラーゼ遺伝子を有する)を、TNT反応混合物に添加し、ルシフェラーゼ活性を、5分毎に60分まで測定した。二重ルシフェラーゼアッセイキット(Promega Corp.)を用いて、Renillaルシフェラーゼ活性を測定した。このデータは、改善された発現が、合成遺伝子から得られることを示した(図15A、B)。合成遺伝子の翻訳効率の増大をさらに証明するために、RNAをインビトロ転写系により調製し、次いで、精製した。pRL−null(ネイティブまたは合成)ベクターを、BamHIで直鎖状にした。DNAを複数回のフェノール−クロロホルム抽出、続いて複数回のエタノール沈殿により精製した。インビトロT7転写系を用いてRNAを調製した。DNAテンプレートを、RNaseを含まないDNaseを用いて除去し、RNAを、フェノール−クロロホルム抽出、続いて、複数回のイソプロパノール沈殿により精製した。次いで、同じ量の精製RNA(合成遺伝子またはネイティブの遺伝子のいずれか)を、ウサギ網状赤血球溶解物(図15C、D)または小麦胚芽溶解物(図15E、F)に添加した。再び、合成Renillaルシフェラーゼ遺伝子RNAは、ネイティブのRenillaルシフェラーゼ遺伝子RNAより多くのルシフェラーゼを生成した。これらのデータは、翻訳効率が、合成配列により改善されることを示唆する。なぜ合成遺伝子が小麦胚芽中で高度に発現されるのかを決定するために、植物のコドン使用頻度を決定した。高等植物において最も低い使用頻度のコドンは、哺乳動物におけるものと一致した。
【0205】
レポーター遺伝子アッセイは、転写調節事象を研究するために広く用いられている。これは、同時トランスフェクション実験においてしばしば行われ、このアッセイにおいて、試験プロモーターを含む1次レポーター構築物とともに、構成的レポーターの制御下で第2のコントロールレポーターが、サンプル間のトランスフェクション効率を含む実験変動を正規化するために内部コントロールとして細胞にトランスフェクトされる。コントロールレポーターシグナル、コントロールレポーターと1次レポーターとの間の潜在的プロモーターのやりとり(cross talk)、ならびに実験条件によるコントロールレポーターの潜在的な調節は、信頼性のある補レポーター(co−receptor)ベクターを選択するための重要な局面である。
【0206】
上記のように、合成Renillaルシフェラーゼ遺伝子を、異なるプロモーターの下で異なるベクター骨格にクローニングすることにより、ベクター構築物を作製する。全ての構築物は、試験した3つの哺乳動物細胞株においてより高い発現を示した(表11)。従って、発現効率が良好になるにつれて、合成Renillaルシフェラーゼは、哺乳動物細胞にトランスフェクトされた場合、より高いシグナルを発する。
【0207】
より高いシグナルが得られるので、同じレポーターシグナルを達成するためにはより低い活性しか必要とせず、このことは、プロモーターの干渉という危険性を減少させる。50ngのpGL3−コントロール(ホタルluc+)+ネイティブpRL−TKプラスミドの5つの異なる量(50、100、500、1000または2000ng)または合成pRL−TK(5、10、50、100、または200ng)の5つの異なる量で、CHO細胞をトランスフェクトした。各トランスフェクションに、pUC19キャリアDNAを総量3μg DNAまで添加した。10倍低いpRL−TK DNAにより、ネイティブの遺伝子と同様または大きいシグナルを与える(1次レポーターpGL3−コントロールからの発現を阻害するという危険性が減少している)ことを実証する実験が、図16に示される。
【0208】
実験的処理により、ときおり、遺伝子内の不可解な部位が活性化され得、補レポーター発現の誘導または抑制が引き起こされ、このことは、トランスフェクション効率の正規化のための補レポーターとしてその機能を弱める。1つの例は、MCF−7細胞をトランスフェクトした場合、TPAが、野生型遺伝子を有する補レポーターベクターの発現を誘導することである。500ngのpRL−TK(ネイティブ)、5μgのネイティブpRG−Bおよび合成pRG−B、2.5μgのネイティブpRG−TKおよび合成pRG−TKをMCF−7細胞のウェルごとにトランスフェクトした。100ng/ウェルのpGL3−コントロール(ホタルluc+)を、全てのRLプラスミドに対して同時トランスフェクトした。キャリアDNAであるpUC19を用いて、総DNAを5.1μg/ウェルでトランスフェクトした。15.3μlのTransFastトランスフェクション試薬(Promega Corp.,Madison,WI)をウェルごとに添加した。16時間後、細胞をトリプシン処理し、プールし、6ウェルディッシュの6つのウェルに分割し、8時間にわたりウェルに接着させた。次いで、3つのウェルを、0.2nMの腫瘍プロモーター、TPA(ホルボール−12−ミリステート−13−アセテート、Calbiochem #524400−S)で処理し、3つのウェルを20μlのDMSOでモック処理した。細胞をTPAを添加して24時間後に、0.4mlのPassive Lysis Bufferを用いて回収した。この結果は、合成遺伝子を用いることによって、実験適刺激による補レポーター発現の所望でない変化が避けられ得ることを示した(表13)。このことは、合成遺伝子を用いることにより、異常な発現の危険性が減少され得ることを示す。
【0209】
【表13】
【0210】
【表14】
【0211】
【表15】
すべての刊行物、特許および特許出願は、本明細書中に参考として援用される。前述の明細書において、本発明は、その特定の好ましい実施形態に関して記載され、多くの詳細が例示の目的で記載されてきたが、本発明は、さらなる実施形態が可能であり、本明細書中の詳細の特定のものが本発明の基本的な原理から逸脱することなくかなり変化され得ることは、当業者に明らかである。
【特許請求の範囲】
【請求項1】
明細書に記載の発明。
【請求項1】
明細書に記載の発明。
【図1】
【図2−1】
【図2−2】
【図2−3】
【図2−4】
【図2−5】
【図2−6】
【図2−7】
【図2−8】
【図2−9】
【図2−10】
【図2−11】
【図2−12】
【図2−13】
【図2−14】
【図3−1】
【図3−2】
【図3−3】
【図3−4】
【図3−5】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図5H】
【図5I】
【図5J】
【図5K】
【図6−1】
【図6−2】
【図6−3】
【図6−4】
【図7−1】
【図7−2】
【図7−3】
【図8】
【図9A】
【図9B】
【図10】
【図11−1】
【図11−2】
【図11−3】
【図12】
【図13−1】
【図13−2】
【図13−3】
【図14】
【図15A】
【図15B】
【図15C】
【図15D】
【図15E】
【図15F】
【図16−1】
【図16−2】
【図17A】
【図17B】
【図18−1】
【図18−2】
【図18−3】
【図18−4】
【図2−1】
【図2−2】
【図2−3】
【図2−4】
【図2−5】
【図2−6】
【図2−7】
【図2−8】
【図2−9】
【図2−10】
【図2−11】
【図2−12】
【図2−13】
【図2−14】
【図3−1】
【図3−2】
【図3−3】
【図3−4】
【図3−5】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図5H】
【図5I】
【図5J】
【図5K】
【図6−1】
【図6−2】
【図6−3】
【図6−4】
【図7−1】
【図7−2】
【図7−3】
【図8】
【図9A】
【図9B】
【図10】
【図11−1】
【図11−2】
【図11−3】
【図12】
【図13−1】
【図13−2】
【図13−3】
【図14】
【図15A】
【図15B】
【図15C】
【図15D】
【図15E】
【図15F】
【図16−1】
【図16−2】
【図17A】
【図17B】
【図18−1】
【図18−2】
【図18−3】
【図18−4】
【公開番号】特開2010−81942(P2010−81942A)
【公開日】平成22年4月15日(2010.4.15)
【国際特許分類】
【出願番号】特願2010−8451(P2010−8451)
【出願日】平成22年1月18日(2010.1.18)
【分割の表示】特願2006−288147(P2006−288147)の分割
【原出願日】平成13年8月24日(2001.8.24)
【出願人】(500430084)プロメガ・コーポレーション (18)
【Fターム(参考)】
【公開日】平成22年4月15日(2010.4.15)
【国際特許分類】
【出願日】平成22年1月18日(2010.1.18)
【分割の表示】特願2006−288147(P2006−288147)の分割
【原出願日】平成13年8月24日(2001.8.24)
【出願人】(500430084)プロメガ・コーポレーション (18)
【Fターム(参考)】
[ Back to top ]