水性種の合成核酸
蛍光ポリペプチドをコードする元の核酸配列のコドンとは25%超の異なるコドン組成を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含む合成核酸分子が提供される。前記合成核酸分子は、前記元の核酸配列中の平均数よりも少なくとも3倍少ない転写調節配列を有する。前記合成核酸分子によりコードされるポリペプチドは好ましくは、前記元の核酸配列によりコードされるポリペプチドと85%以上の配列同一性を有する。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、参照してここに組み込まれる、2000年8月24日出願の米国特許出願第09/645,706号の米国特許法第120条に基づく優先権を主張する。
【0002】
(参考文献)
文中でカッコ内の第一著者の姓で記される文献の完全な参考文献一覧を参考文献の項に記載した。
【0003】
本発明は生化学アッセイおよび試薬の分野に関する。より具体的には、本発明は蛍光タンパク質およびその利用方法に関する。
【背景技術】
【0004】
転写、すなわちDNA配列からのRNA分子の合成は、遺伝子発現の最初の工程である。DNAの転写を調節する遺伝子要素としては、プロモーター、ポリアデニル化シグナル、転写因子結合部位およびエンハンサーがあげられる。プロモーターは、転写の特異的開始をつかさどり、典型的には三つの一般的な領域からなる。コアプロモーターは、RNAポリメラーゼとその補因子がDNAに結合する場所である。コアプロモーターのすぐ上流は、近接プロモーターであり、ポリメラーゼ複合体を順に補充する活性化複合体の集合に機能を果たすいくつかの転写因子結合部位を含む。近接プロモーターのさらに上流に位置する末端プロモーターもまた、転写因子結合部位を含む。転写開始同様、転写終結およびポリアデニル化は特異的な遺伝子要素である。エンハンサーは典型的には、エンハンサーとプロモーターが同一DNA分子上に位置するかぎり、エンハンサーのプロモーターに対する方向と距離とは無関係に、応答するプロモーターの転写レベルを顕著に増加できる複数の転写因子結合部位を含む。遺伝子から産生される転写物の量はまた、最も重要なものは介在配列(イントロン)をスプライスドナーとスプライスアクセプターの間の一次転写物から除去するRNAスプライシングであるが、この転写後の機構により調節される。プロモーター、エンハンサー、ポリアデニル化部位、転写因子結合部位およびRNAスプライス部位を含むDNA分子内にある遺伝子要素は、典型的には認識配列で相互に関連付けられている。これらの配列は一般的には、遺伝篩要素の機能に必須の構成であると信じられている。それゆえ、例えば、プロモーター配列は特異的配列またはプロモーター機能と相互関連することが見出された特異的配列または配列群である。
【0005】
自然の選択は、表現型レベルで生ずる遺伝子型環境相互作用が個体の繁殖成功度に差をもたらし、それゆえ集団の遺伝子プールに変化がもたらされるという前提である。自然の選択により作用される核酸分子のいくつかの特徴として、コドンの使用頻度、RNAの二次構造、イントロンのスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用があげられる。遺伝子コードの縮重性のために、遺伝子のコーディング領域内の突然変異は、自然の選択により、対応するアミノ酸配列を変化させることなくこれらの特徴を最適化するように生ずる。
【0006】
いくつかの条件下で、ポリペプチドをコードする天然のヌクレオチド配列を別の用途のためにより適合させるように合成的に変化させるのに有用である。一般的な例は、外来宿主細胞中で遺伝子を発現する場合、そのコドンの使用頻度を変えることである。遺伝子コードの過剰な存在により、アミノ酸が複数のコドンによりコードされるが、異なる生物ではいくつかのコドンは他のコドンよりも有利である。非天然の宿主細胞におけるタンパク質への翻訳の効率を、コドンの使用頻度を調整するが、その遺伝子産物を維持することにより、実質的に増加できることが見出された(米国特許第5,096,825号、同第5,670,356号、および同第5,874,304号)。
【0007】
しかし、コドンの使用を変えることは、すなわち、意図しない導入が不適切な転写調節配列の合成核酸分子にもたらされる恐れがある。これは逆に転写に影響し、合成DNAの変則的な発現をもたらす。変則的な発現は、正常または予想されるレベルの発現からの逸脱と定義される。例えば、プロモーター下流に位置する転写因子結合部位はプロモーター活性に影響することが示されている(Michaelら、1990;Lambら、1998;Johnsonら、1998;Jonesら、1997)。さらに、エンハンサー配列にとって、活性に影響を与え、プロモーター非存在下でDNA転写レベルを上昇させること、または転写調節配列の存在にとって、プロモーター非存在下で遺伝子発現の基礎レベルを増加させることは異常なことではない。
【0008】
蛍光タンパク質は光により励起された際に蛍光を発するタンパク質である。蛍光タンパク質を、多くのアッセイや診断手法で、および遺伝子発現やタンパク質の局在性を研究するために用いることができる。蛍光タンパク質が、それが単離されたのとは遺伝的に離れた種で発現される場合に、その存在に問題が生ずる。この状況では、典型的には低レベルで、蛍光タンパク質は発現され、蛍光タンパク質の検出は困難となる。この理由の一つは、コドンの優先度である。例えば、植物遺伝子はあるコドンよりも他のコドンを使用する傾向にある。加えて、植物内で高度に発現される遺伝子は、特有のコドンの優先度を有している(Wadaら、1990;Murrayら、1989)。動物遺伝子もまた、コドンの優先度を示す。例えば、ヒトもまたコドンの優先度を示す。
【0009】
それゆえ、必要とされるのは、蛍光タンパク質をコードし、蛍光ポリペプチドをコードする元の核酸配列とは異なるコドン組成を有する合成核酸分子である。好ましくは、改変したコドン使用を有する合成核酸分子は、特定の宿主細胞中の発現に関して不適切な、または意図しない転写調節配列をもたない。これが、蛍光タンパク質が元々単離された生物に由来する材料とは異なる宿主細胞中での高レベルの発現を可能にする。その上、高レベル発現する蛍光タンパク質は、蛍光タンパク質の改良された検出を可能にする。
【0010】
文献
Altschul et al. (1990) J. Mol. Biol. 215: 403.
Altschul et al. (1997) Nucl. Acids Res. 25: 3389.
Altschul et al. (1992) Current Protocols in Molecular Biology. John Wiley & Sons, New York.
Boshart et al. (1985) Cell 41: 521.
Corpet et al. (1988) Nucl. Acids Res. 16: 881.
Dijkema et al. (1985) EMBO J., 4: 761.
Fradkov, A.F., et al. (2000) FEBS Letters 479: 127.
Gibbs, P.D.L., et al. (1994) Mol. Mar. Biol. Biotechnol. 3: 307.
Gibbs, P.D.L., et al. (2000) Marine Biotechnology 2: 107.
Gorman et al. (1982) Proc. Natl. Acad. Sci. USA 79: 6777.
Higgins et al. (1988) Gene 73: 237.
Higgins et al. (1989) CABIOS 5: 151.
Huang et al. (1992) CABIOS 8: 155.
Johnson et al. (1998) Mol. Reprod. Devel. 50: 377.
Jones et al. (1997) Mol. Cell. Biol. 17: 6970.
Karlin and Altschul (1990) Proc. Natl. Acad. Sci. USA 87: 2264.
Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873.
Kim, et al. (1990) Gene 91: 217.
Lamb et al. (1998) Mol. Reprod. Devel. 51: 218.
Liu, H.S. et al. (1999) Biochemical & Biophysical Research Communication 260: 712.
Maniatis et al. (1987) Science 236: 1237.
Matz, M.V., et al. (1999) Nature Biotech 17: 969.
Michael et al. (1990) EMBO J. 9: 481.
Mizushima and Nagata (1990) Nucl. Acids Res. 18: 5322.
Myers and Miller (1988) CABIOS 4: 11.
Needleman and Wunsch (1970) J. Mol. Biol. 48: 443.
Ormo, M. et al. (1996) Science 273: 1392.
Pearson et al. (1994) Meth. Mol. Biol. 24: 307.
Pearson and Lipman (1988) Proc. Natl. Acad. Sci. USA 85: 2444.
Smith and Waterman (1981) Adv. Appl. Math. 2: 482.
Uetsuki et al. (1989) J. Biol. Chem. 264: 5791.
Voss et al. (1986) Trends Biochem. Sci., 11: 287.
Yang, F., Moss, L.G. and Phillips, G.N.,Jr, (1996) Nature Biotech 14: 1246.
【0011】
全ての刊行物、特許および特許出願が参照してここに取り込まれる。明細書において、本発明は、発明のある好ましい態様に関して記載され、例示のために詳細が記述されるが、本発明がさらなる態様を許容でき、発明の基本的な原理と離れることなく、この詳細がかなり改変されることは当業者にはあきらかであろう。
【発明の開示】
【課題を解決するための手段】
【0012】
本明細書の最後に記述される請求の範囲により定義される本発明は、上述の問題の少なくとも一つを解決することを目的とする。本発明は、蛍光ポリペプチドをコードする元の核酸配列(a parent nucleic acid sequence)のコドンと25%超の異なるコドン組成を有し、元の核酸配列の転写制御配列の平均数と比べて少なくとも3倍少ないそのような配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する合成核酸分子を提供する。好ましくは、合成核酸分子は、それが由来する元の(元のまたは別の合成)ポリペプチド(タンパク質)のアミノ酸配列と85%以上、好ましくは90%以上、最も好ましくは95%以上または99%以上同一であるアミノ酸配列を有するポリペプチドをコードする。それゆえ、いくつかの特異的なアミノ酸の変化はまた、合成核酸分子によりコードされるポリペプチドの有する特定の表現型の特徴を変化させるのに望ましいと考えられる。好ましくは、アミノ酸配列の同一性は、少なくとも100個以上の連続的なアミノ酸残基である。発明の一つの実施態様では、合成核酸分子中の異なるコドンは、好ましくは元の核酸配列中の対応するコドンと同一のアミノ酸をコードする。
【0013】
合成核酸分子中で減少される転写調節配列として、転写因子結合配列、イントロンスプライス配列、ポリ(A)付加配列、エンハンサー配列およびプロモーター配列のいずれかの組み合わせがあげられるが、これに限定されない。転写調節配列は当業者に周知である。本発明の合成核酸分子は元の核酸配列のコドン組成とは25%、30%、35%、40%超の、または45%超の、例えば50%、55%、60%またはそれ以上のコドンで異なる組成を有することが好ましい。本発明で用いられるコドンは、特定生物の同一アミノ酸の少なくとも一つの他のコドンよりも頻度高く用いられるコドンで、より好ましくは、その生物で低使用頻度のコドンではなく、合成核酸分子をクローニングしたり、その発現をスクリーニングしたりするために用いられる生物、例えば大腸菌中で低使用頻度のコドンではない。さらに、あるアミノ酸の好ましいコドン、すなわち、3個以上のコドンを有するアミノ酸は、他の(好ましくない)コドンよりもより頻度高く用いられる二つ以上のコドンを含む。合成核酸分子中のある生物で他の生物よりもより頻度高く用いられるコドンの存在から、より頻度高くこれらのコドンを用いる生物の細胞へ導入すると、これらの細胞中の元の核酸配列の発現よりも高いレベルで、これらの細胞中で発現される合成核酸分子が得られる。例えば、本発明の合成核酸分子は、同一条件下(例えば、細胞培養条件、ベクターのバックボーン等)、細胞または細胞抽出液に元の核酸配列の105%以上、例えば110%、150%、200%、500%あるいはそれ以上(例えば、1000%、5000%もしくは10000%)のレベルで発現される。
【0014】
本発明の一つの態様では、異なるコドンは哺乳動物でより頻度高く用いられるコドンであり、一方、別の態様では、異なるコドンは植物でより頻度高く用いられるコドンである。ある特定の型の哺乳動物、例えばヒトは、他の型の哺乳動物よりも好ましいコドンの異なるセットを有している。同様に、ある特定の型の植物は、他の型の植物よりも好ましいコドンの異なるセットを有している。加えて、ある別の型の因子、例えば植物または動物内で高度に発現している遺伝子は、低発現遺伝子よりも好ましいコドンの異なるセットを有している。本発明の一つの態様で、異なるコドンの大多数は、所望の宿主細胞中で好ましいコドンの一つである。哺乳動物(例えば、ヒト)および植物の好ましいコドンは、当業者には既知である(例えば、Wadaら、1990)。例えば、好ましいコドンとしては、CGC(Arg)、CTG(Leu)、TCT(Ser)、AGC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCC(Ala)、GGC(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAG(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)およびTTC(Phe)があげられるが、これに限定されない(Wadaら、1990)。それゆえ、本発明の好ましい「ヒト化」合成核酸分子は、好ましいヒトのコドン、例えばCGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGC、TTCまたはその組み合わせの数を増加することにより、元の核酸配列とは異なるコドン組成を有する。例えば、本発明の合成核酸分子は元の核酸配列に比べて、CTGまたはTTGのロイシンをコードするコドン、GTGまたはGTCのバリンをコードするコドン、GGCまたはGGTのグリシンをコードするコドン、ATCまたはATTのイソロイシンをコードするコドン、CCAまたはCCTのプロリンをコードするコドン、CGCまたはCGTのアルギニンをコードするコドン、AGCまたはTCTのセリンをコードするコドン、ACCまたはACTのスレオニンをコードするコドン、GCCまたはGCTのアラニンをコードするコドン、またはこれらの組み合わせの数が増加している。
【0015】
同様に、植物中でより頻度高く用いられるコドンの数が増加した合成核酸分子は、これに限定されないが、CGC(Arg)、CTT(Leu)、TCT(Ser)、TCC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCT(Ser)、GGA(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAA(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)、TTC(Phe)またはその組み合わせの数を増加することにより、元の核酸配列とは異なるコドン組成を有する(Murrayら、1989)。好ましいコドンは、異なる型の植物で異なる(Wadaら、1990)。
【0016】
コドンの選択は、例えばヌクレオチド置換の数の増加または転写調節配列の数の減少を所望するような多くの因子により影響を受ける。ある環境、例えば転写因子結合配列の削除を認めるような環境下で、好ましくないコドンを好ましいコドンとは別のコドンまたは最も好ましいコドンとは別のコドンと置き換えるのが望ましい。別の環境、例えば合成核酸分子の異なるバージョンのコドンを作出する環境下で、好ましいコドン対は、上述の基準だけでなく、最も多くのミスマッチ塩基に基づいて選択される。
【0017】
他の生物よりもある生物においてより頻度高く用いられる、合成核酸分子中のコドンの存在から、これらのコドンを用いる生物の細胞へ導入されると、元の核酸配列の発現レベルよりも高いレベルで細胞に発現される合成核酸分子が得られる。
【0018】
蛍光タンパク質である、本発明の合成核酸分子の一つの態様において、合成核酸分子は元の緑色蛍光タンパク質核酸配列のコドン組成とは異なる組成を有する緑色蛍光タンパク質をコードする。本発明の合成緑色蛍光タンパク質核酸分子は、2の位置においてアミノ酸グリシンをコードしていてもよいし、または227の位置においてアミノ酸グリシンをコードしていてもよいし、あるいは2の位置のアミノ酸グリシンと227の位置のアミノ酸グリシンの組合せであってもよい。好ましい合成緑色蛍光タンパク質核酸分子としてMontastraea cavernosa由来のものがあげられるが、これに限定されない。
【0019】
本発明はまた、ベクター構築物を提供する。本発明のベクター構築物は、元のベクターバックボーンに比べて、少なくとも3倍少ない転写調節配列(at least 3-fold fewer transcriptional regulatory sequence)を有する合成ベクターバックボーンを含有する。ベクター構築物はまた、蛍光ポリペプチドをコードする元の核酸配列と25%超のコドンが異なるコドン組成を有し、元の核酸配列においてその配列の平均数と比べて少なくとも3倍少ない転写調節配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する核酸分子を含有する。
【0020】
プラスミドがさらに提供される。プラスミドは蛍光ポリペプチドをコードする元の核酸配列と25%超のコドンが異なるコドン組成を有し、元の核酸配列においてその配列の平均数と比べて少なくとも3倍少ない転写調節配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する核酸分子を含有する。
【0021】
さらに、発現ベクターが提供される。発現ベクターは蛍光ポリペプチドをコードする元の核酸配列と25%超のコドンが異なるコドン組成を有し、元の核酸配列においてその配列の平均数と比べて少なくとも3倍少ない転写調節配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する核酸分子を含有する。核酸分子は細胞のプロモーター機能に連結される。
【0022】
また、発現ベクターを含有する宿主細胞および適当なコンテナ中に発現ベクターを含有するキットが提供される。
【0023】
本発明はまた、元の(野生型または他の合成のいずれかの)核酸配列を遺伝学的に変化させることにより本発明の合成核酸分子を調製する方法を提供する。方法は蛍光タンパク質をコードする合成核酸分子を調製するために用いられる。本発明の方法は、いずれかのタンパク質(例えば、蛍光タンパク質)のオープンリーディングフレームのコドンの使用頻度を変化させ、転写調節配列を減少させるために、またはベクターバックボーンの転写調節部位の数を減少させるために用いられる。好ましくは、合成核酸分子中のコドンの使用頻度は、元の核酸分子に比べ潜在的な転写調節配列の数を減少させる一方、その核酸分子の発現が所望される宿主生物のコドンの使用頻度に反映するように変えられる。
【0024】
それゆえ、本発明はオープンリーディングフレームを含有する合成核酸分子を調製する方法を提供する。本方法は、蛍光ポリペプチドをコードする元の核酸配列中の複数の転写調節配列を変化させ、元の核酸配列に比べて少なくとも3倍少ない転写調節配列を有する合成核酸分子を得ることを特徴とする。本発明はまた、転写調節配列の数を減少させた合成核酸配列中の25%超のコドンを変化させ、さらなる合成核酸分子を得ることを特徴とする。改変されるコドンは転写調節配列の数を増加させない。さらなる合成核酸分子は、元の核酸配列によりコードされるポリペプチドと少なくとも85%のアミノ酸同一性を有するポリペプチドをコードする。
【0025】
あるいは、本方法は、蛍光ポリペプチドをコードする元の核酸配列の25%超のコドンを変化させ、コドンを改変した合成核酸分子を得ることを特徴とする。本方法はまた、コドン改変合成核酸分子中の複数の転写調節配列を変化させ、元の核酸配列中の対応するコドンとは異なるコドンを有する合成核酸分子に比べて、少なくとも3倍少ない転写調節配列を有する、更なる合成核酸分子を得ることを特徴とする。さらなる合成核酸分子は、元の核酸配列によりコードされる蛍光ポリペプチドと少なくとも85%のアミノ酸同一性を有するポリペプチドをコードする。
【0026】
以下に記述するように、本発明の方法は、Montastraea cavernosaの緑色蛍光タンパク質(McGFP)核酸配列とともに、ヒト細胞でより容易に発現される合成核酸を産生するために用いられた。ここに開示されるのは、高度に関連したポリペプチドをコードする合成核酸分子配列である。これらの合成核酸分子として、本発明の方法における中間体およびhGreen IIをあげることができる。これらの合成核酸分子は、互いに比べると多くの異なるヌクレオチドを有している。
【0027】
本発明の方法により、他の所望の物理的または生化学的特性(タンパク質の半減期を含む)に負の影響を与えることなしに、哺乳動物での発現のレベルを著しく促進し、既知の転写調節配列の数を大きく減じた合成核酸分子が産出された。
【0028】
本発明はまた、高度に関連したポリペプチドをコードする少なくとも二つの合成核酸分子を提供するが、この合成核酸分子では、互いに比べると多くのヌクレオチドの違いが増加している。これらの違いにより、これらの分子が両者とも細胞中に存在する場合(すなわち、それらが合成核酸分子の「コドンの異なった」バージョンである場合)、二つの合成核酸分子間の組換え頻度が減少する。それゆえ本発明は、ポリペプチドをコードする元の核酸配列のコドンの異なったバージョンである、少なくとも二つの合成核酸分子を調製する方法を提供する。本方法は、元の核酸配列を変化させ、元の核酸配列中に存在するコドンの数に比較して、選択された宿主細胞中でより頻度高く用いられる最初の複数のコドンの数を増加した第一の核酸分子を得る特徴を有する。状況に応じて、第一の合成核酸分子はまた、元の核酸配列に比べ、転写調節配列の数が減少している。元の核酸配列はまた、元の核酸配列中のコドンの数に比較して、宿主細胞中でより頻度高く用いられる第二の複数のコドンの数を増加した第二の合成核酸分子を得るために改変されている。第一の複数のコドンは第二の複数のコドンとは異なる。第一および第二の合成核酸分子は同一のポリペプチドをコードする。状況に応じて、第二の合成核酸分子は、元の核酸配列に比べ、転写調節配列の数が減少している。合成分子のいずれか、または両者はさらに修飾されうる。
【発明を実施するための最良の形態】
【0029】
定義:
本発明のために、以下の定義を適用する:
ここで用いられる用語「遺伝子」は、ポリペプチドまたはタンパク質前駆体の生産に必要なコーディング配列を含有するDNA配列を意味する。ポリペプチドは、所望のタンパク質活性が保持される限り、全長コーディング配列により、またはコーディング配列のいかなる部分によりコードされる。
ここで用いられる「アミノ酸」は、J. Biol. Chem., 243: 3557-59 (1969)中の標準的なポリペプチド命名法に従って記載される。
【0030】
標準一文字コード「A」、「C」、「G」、「T」、「U」および「I」は、ここではそれぞれ、ヌクレオチド アデニン、シトシン、グアニン、チミン、ウラシルおよびイノシンとして用いられる。オリゴヌクレオチドまたはポリヌクレオチド配列は5’端から3’端へ書かれる。
【0031】
ここで同定される全てのアミノ酸は天然のL-型である。標準的なポリペプチド命名法に従って、アミノ酸残基の略号を以下の対応表に示す。
【表1】
【0032】
「単離された核酸」または「単離されたポリヌクレオチド」のように、核酸に関して用いられる場合の用語「単離された」は、そのソース中に通常関連する少なくとも一つの混在物質から同定され、分離された核酸配列を意味する。一方、非単離核酸、例えばDNAおよびRNAは、それらが天然に存在する状態中に見出される。例えば、一定のDNA配列、例えば遺伝子は、隣接する遺伝子に近接して、宿主細胞染色体上に見出される;RNA配列、例えば特異的なタンパク質をコードする特異的なmRNA配列は、多くのタンパク質をコードする非常に多くの他のmRNA混合物として細胞中に見出される。しかし、単離された核酸は、例として、核酸が天然の細胞の核酸とは異なる染色体の位置にある核酸を通常発現する細胞中の、または天然に見出されるのとは異なる核酸配列に同様に隣接するような核酸を含む。単離された核酸は一本鎖または二本鎖の形態で存在する。単離された核酸がタンパク質を発現するために用いられる場合、オリゴヌクレオチドは最低でも、センス鎖またはコーディング鎖を含み、すなわち、オリゴヌクレオチドは一本鎖であってよいが、センス鎖およびアンチセンス鎖の両者を含み、すなわち、オリゴヌクレオチドは二重鎖であってよい。
【0033】
「単離されたタンパク質」または「単離されたポリペプチド」のようにポリペプチドについて用いられる場合の用語「単離された」は、そのソース中に通常関連する少なくとも一つの混在物質から同定され、分離されたポリペプチドを意味する。それゆえ、単離されたポリペプチドは、天然に見出されるタンパク質とは異なる形態または環境で存在する。一方、単離されていないポリペプチド、例えばタンパク質および酵素は、それらが天然に存在する状態で見出される。
【0034】
用語「精製された」または「精製」は、目的の組成物、例えばタンパク質または核酸から夾雑物を除去する任意の工程の結果を意味する。試料中の精製された組成物のパーセンテージは、これにより増加する。
【0035】
本発明の核酸に関して、用語「核酸」は、DNA、ゲノムDNA、cDNA、RNA、mRNAおよび上記の各種核酸のハイブリッドを意味する。核酸は合成起源であっても天然起源であってもよい。ここで用いられるような核酸はヌクレオチドが共有結合した配列であり、一つのヌクレオチドのペントースの3’位がリン酸ジエステル基により次のペントースの5’位と結合し、ヌクレオチド残基(塩基)が特定の順序で結合、すなわち直線状のヌクレオチドの順序に存在する。ここで用いられる「ポリヌクレオチド」は、約100ヌクレオチド超の長さの配列を含む核酸である。ここで用いられる「オリゴヌクレオチド」は、短いポリヌクレオチドまたはポリヌクレオチドの部分である。オリゴヌクレオチドは典型的には、約2から約100塩基の配列を含む。用語「オリゴ」は、用語「オリゴヌクレオチド」の代わりに時折用いられる。
【0036】
核酸分子は、核酸のリン酸ジエステル結合が置換モノヌクレオチドのペントース環の5’炭素と3’炭素に生じるので、「5’末端(5’端)と3’末端(3’端)」を有するといわれる。新しい結合が5’炭素にあるポリヌクレオチドの末端がその5’末端ヌクレオチドである。新しい結合が3’炭素にあるポリヌクレオチドの末端がその3’末端ヌクレオチドである。ここで用いられる末端ヌクレオチドは、3’または5’末端の末端位置のヌクレオチドである。
【0037】
ここで用いられるように、核酸配列は、より大きいオリゴヌクレオチドまたはポリヌクレオチドの内部であっても、5’端と3’端を有するといわれる。直鎖DNAまたは環状DNAのいずれかにおいて、個々の要素は「下流」または3’要素の「上流」または5’にあるといわれる。この用語は、転写がDNA鎖に沿って5’から3’に進行することを反映する。典型的には、連関する遺伝子の転写を行うプロモーターとエンハンサー要素は、一般にコーディング領域の5’または上流に位置する。しかし、エンハンサー要素は、プロモーター要素とコーディング領域の3’に位置する場合でさえ、その効果を発揮することができる。転写停止およびポリアデニル化シグナルはコーディング領域の3’または下流に位置する。
【0038】
ここで用いられる用語「コドン」は、ポリペプチド鎖へ取り込まれる特定のアミノ酸を同定する3個のヌクレオチドの配列、または開始または停止シグナルからなる基本的な遺伝子コード単位である。図1はコドン表である。構造遺伝子をさす場合に用いられる用語「コーディング領域」は、mRNA分子の翻訳の結果としてのポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列を意味する。典型的には、コーディング領域は、5’側で開始メチオニンをコードするヌクレオチドのトリプレット「ATG」、3’側で停止コドン(例えば、TAA、TAG、TGA)につながっている。ある場合に、コーディング領域はまた、ヌクレオチドのトリプレット「TTG」で始まることが知られている。
【0039】
「タンパク質」および「ポリペプチド」で、長さまたは翻訳後修飾、例えばグリコシル化またはリン酸化とは無関係に、アミノ酸の任意の鎖を意味する。本発明の合成遺伝子はまた、元のタンパク質の変異体またはそのポリペプチド断片をコードする。好ましくは、そのようなタンパク質ポリペプチドは、それが由来する元のタンパク質またはポリペプチドのアミノ酸配列と85%以上、好ましくは90%以上、最も好ましくは95%以上もしくは99%以上同一であるアミノ酸配列を有している。
【0040】
ポリペプチド分子は、ペプチド結合が第一のアミノ酸残基のバックボーンのアミノ基と第二のアミノ酸残基のバックボーンのカルボキシル基の間に生ずるので、「アミノ末端」(N-末端)と「カルボキシ末端」(C-末端)を有すといわれる。ポリペプチド配列に関して、用語「N-末端」および「C-末端」は、それぞれポリペプチドのN-末端およびC-末端領域の部分を含むポリペプチドの領域を意味する。ポリペプチドのN-末端領域の部分を含む配列は、大部分がポリペプチド鎖のN-末端の半分のアミノ酸を含むが、そのような配列に限定されない。例えば、N-末端配列は、ポリペプチドのN-末端の半分およびC-末端の半分の両方の塩基を含むポリペプチド配列の内部部分を含むことができる。童謡のことがC-末端に適用できる。N-末端およびC-末端領域は、必要ではないが、それぞれポリペプチドの根本的なN-末端およびC-末端を定義するアミノ酸を含む。
【0041】
ここで用いられる用語「野生型」は、天然に存在するソースから単離された遺伝子または遺伝子産物の特性を有する遺伝子または遺伝子産物を意味する。野生型遺伝子は、自然集団中に最も頻度高く観察される遺伝子であり、それゆえ任意に遺伝子の野生型が決められる。一方、用語「突然変異体」は、野生型の遺伝子または遺伝子産物と比べて、配列および/または機能的特性に修飾、すなわち改変された特性を示す遺伝子または遺伝子産物を意味する。天然に存在する突然変異体が単離されることは注目される;これらは野生型遺伝子または遺伝子産物と比較した場合に改変された特性を有することにより同定される。
【0042】
用語「相補的な」または「相補性」は、塩基対規則により関連するヌクレオチドの配列について用いられる。例えば、5’「A-G-T」3’の配列について、配列3’「T-C-A」5’は相補的である。相補性は、核酸の塩基のいくつかだけが塩基対規則にマッチする「部分的」であってもよい。あるいは、核酸の間で「完全な」または「全体の」相補性であってもよい。核酸の鎖間の相補性の程度は、核酸の鎖間におけるハイブリダイゼーションの効率および強度に重要な効果を有する。これは、増幅反応、ならびに核酸のハイブリダイゼーションに依存する検出方法に特に重要である。
【0043】
ここで用いられる用語「組換えタンパク質」または「組換えポリペプチド」は、組換えDNA分子から発現されるタンパク質分子を意味する。一方、用語「天然のタンパク質」はここでは、天然に存在する(すなわち、非組換えの)ソースから単離されたタンパク質を示すように用いられる。分子生物学技術が、天然型のタンパク質と比べて同一の性質を有する組換え型のタンパク質を製造するために用いられる。
【0044】
用語「融合タンパク質」および「融合パートナー」は、外来タンパク質断片、例えば第二のタンパク質からなる融合パートナー(例えば、蛍光または非蛍光のタンパク質またはペプチド)と連結した、目的のタンパク質、例えば蛍光タンパク質を含むキメラタンパク質を意味する。融合パートナーは、宿主細胞で発現する際にタンパク質の溶解度を増加し、例えば、祝主細胞または培養上清、もしくは両者から組換え融合タンパク質を精製するためのアフィニティータグを提供する。所望ならば、融合パートナーは目的のタンパク質から、当業者には既知の各種酵素または化学的手段により除去される。さらに、外来タンパク質断片は、蛍光タンパク質と融合した目的の別のタンパク質であってよい。これにより、蛍光を用いた外来タンパク質断片の追跡が可能となる。
【0045】
用語「核酸構築物」は、二つまたはそれ以上の異なるまたは区別できる核酸配列で構成され、当業者に既知の方法を用いて互いに連結または合成された核酸を示す。
【0046】
用語「元(の)(parent)」は、天然に存在する、または天然に存在しない核酸またはタンパク質を意味する。元は、合成核酸または合成タンパク質が産生される材料を示すために用いられる。
【0047】
ここで用いられる用語「細胞」、「細胞系」、「宿主細胞」は互換的に用いられ、これら全ての表示はこれら細胞の子孫または潜在的子孫を包含する。「形質転換細胞」で、DNA分子が導入される細胞(または原細胞)を意味する。任意に、本発明の合成遺伝子は、合成遺伝子によりコードされるタンパク質またはポリペプチドを製造できるトランスフェクトされた(「安定な」または「一過性の」)細胞系を作出するために、適当な細胞系へ導入されうる。ベクター、細胞および、そのような細胞系を構築するための方法は、当業者に周知であり、例えばAusubelら(1992)に記載されている。用語「形質転換体」または「形質転換細胞」は、転移の数に関係なく、元来の形質転換細胞に由来する一次形質転換細胞を包含する。全ての子孫は、故意の、または故意ではない突然変異のために、DNA含量が正確に同一ではない。それにもかかわらず、元来の形質転換細胞でスクリーニングされるのと同じ機能性を有する突然変異した子孫が形質転換体の定義に包含される。
【0048】
核酸は異なる型の突然変異を含むことが知られている。「点」突然変異は、野生型または元の配列の単一の塩基の位置におけるヌクレオチド配列の変化を意味する。突然変異はまた、一つ以上の塩基の挿入または欠失を意味し、その結果、核酸配列は野生型または元の配列とは異なる。
【0049】
ここで用いられる用語「操作可能に結合した(operably linked)」は、所与の遺伝子の転写および/または所望のタンパク質分子の合成を行うことができる核酸分子を製造するような方法における核酸配列の結合を意味する。本用語はまた、機能性、例えば酵素活性、結合パートナーとの結合能、阻害能などのタンパク質またはポリペプチドを製造するような方法におけるアミノ酸をコードする配列の結合を意味する。
【0050】
用語「組換えDNA分子」は、通常は天然には共に見出されない、少なくとも二つのヌクレオチドを含有するハイブリッドDNA配列を意味する。
【0051】
用語「ベクター」は、DNA断片が挿入またはクローニングされ、核酸部分を細胞に運ぶために用いられ、細胞中で複製できる核酸分子に関して用いられる。ベクターはプラスミド、バクテリオファージ、ウイルス、コスミド等に由来するか、あるいは合成的に作出される。
【0052】
ここで用いられる用語「発現ベクター」は、特定の宿主生物中で操作可能に結合したコーディング配列の発現に必要な適当なDNAまたはRNA配列を含むベクターを意味する。原核生物の発現ベクターは典型的には、プロモーター、リボソーム結合部位、宿主細胞中での自律複製のための複製起点および可能な他の要素、例えば任意のオペレーター、任意の制限酵素部位を含む。
【0053】
用語「プロモーター」は、RNAポリメラーゼをDNAに結合させ、RNA合成を開始する遺伝子要素を意味する。真核生物の発現ベクターは典型的には、プロモーター、任意にポリアデニル化シグナル、および任意にエンハンサーを含む。
【0054】
用語「遺伝子をコードするヌクレオチド配列を有するポリヌクレオチド」は、遺伝子のコーディング領域を含有する核酸配列、言い換えれば、遺伝子産物をコードする核酸配列を意味する。コーディング領域は、cDNA、ゲノムDNA、またはRNAの形態のいずれかで存在することができる。DNAの形態で存在する場合、オリゴヌクレオチドは一本鎖または二本鎖であってもよい。適当な制御要素、例えばエンハンサー/プロモーター、スプライス接合部、ポリアデニル化シグナルは、正しい転写の開始および/または一次RNA転写物の正しいプロセシングのために必要ならば、遺伝子のコーディング領域のすぐ近傍に置かれる。あるいは、本発明の発現ベクターで用いられるコーディング領域は、内在性のエンハンサー/プロモーター、スプライス接合部、介在領域、ポリアデニル化シグナル等を含んでもよい。さらなる態様では、コーディング領域は内在性制御要素および外来性制御要素の両者の組合せを含んでよい。
【0055】
用語「転写調節要素」は、核酸配列の発現の状況を制御する遺伝的要素を意味する。例えば、プロモーターは操作可能に結合したコーディング領域の転写開始を促進する調節要素である。他の調節要素としては、転写因子結合部位、スプライシングシグナル、ポリアデニル化シグナル、終止シグナルおよびエンハンサーシグナルがあげられるが、これに限定されない。
【0056】
用語「転写調節配列」は、転写調節要素の機能に関連する核酸配列を意味する。そのような配列は典型的には、配列モチーフとして認識される、または既知のコンセンサス配列に対応し、一般に、転写調節要素の機能に必要であると信じられている。
【0057】
真核生物の転写制御シグナルは、「プロモーター」要素と「エンハンサー」要素を含む。プロモーターおよびエンハンサーは典型的には、転写に関連する細胞タンパク質と特異的に相互作用するDNA配列の短いアレイである(Maniatisら、1987)。プロモーター要素およびエンハンサー要素は、酵母、昆虫および哺乳動物細胞の遺伝子を含む各種の真核生物のソースから単離されている。プロモーター要素およびエンハンサー要素はまた、ウイルスから単離され、類似の制御要素、例えばプロモーターがまた、原核生物で見出されている。特定のプロモーターおよびエンハンサーの機能は目的のタンパク質を発現させるために用いられる細胞の型に依存する。いくつかの真核生物のプロモーターおよびエンハンサーは広い宿主域を有しているが、他では限られた細胞型で機能する(総説として、Vossら、1986;およびManiatisら1987参照)。例えば、SV40初期遺伝子エンハンサーは、多くの哺乳動物種のいろいろな細胞型で非常に活性があり、哺乳動物細胞におけるタンパク質の発現で広く用いられている(Dijkemaら、1985)。幅広い哺乳動物細胞型で活性のあるプロモーター/エンハンサー要素の二つの別の例として、ヒト延長因子1遺伝子(Uetsukiら、1989;Kimら、1990;MizushimaおよびNagata、1990)およびラウス肉腫ウイルスのロングターミナルリピート(Gormanら、1982)のプロモーター/エンハンサー要素;およびヒトサイトメガロウイルス(Boshartら、1985)のプロモーター/エンハンサー要素があげられる。
【0058】
用語「プロモーター/エンハンサー」は、プロモーターおよびエンハンサーの両機能を提供できるDNAの部分、すなわち上述のプロモーター要素及びエンハンサー要素により提供される機能を示す。例えば、レトロウイルスのロングターミナルリピートはプロモーターおよびエンハンサーの両機能を含む。エンハンサー/プロモーターは、「内在性」または「外来性」もしくは「異種性」であってよい。「内在性」エンハンサー/プロモーターは、ゲノム中の所与の遺伝子に天然に結合しているものである。「外来性」または「異種性」エンハンサー/プロモーターは、遺伝子操作(すなわち、分子生物学的技術)により遺伝子と並列され、その結果、遺伝子の転写が連結したエンハンサー/プロモーターにより進められる。
【0059】
用語「転写因子結合部位」は、転写因子を結合することができるDNAの部分を示す。そのような部位はしばしば、プロモーター要素とエンハンサー要素の内部に存在するが、DNA分子の他の領域にも見出される。転写因子と転写因子結合部位との相互作用は、遺伝子の転写特性に影響を及ぼす。用語「転写因子結合配列」は、転写因子の結合に関連する配列または(複数の)配列を示す。
【0060】
発現ベクター上に「スプライシングシグナル」が存在すると、真核生物の宿主細胞において、組換え体の転写物のより高レベルでの発現がしばしば得られる。スプライシングシグナルは、一次RNA転写物からのイントロンの除去を仲介し、スプライスドナーとアクセプター部位からなる(Sambrookら、分子クローニング:実験室マニュアル(Molecular Cloning: A Laboratory Manual)、第2版、コールドスプリングハーバー研究所出版(Cold Spring Harbor Laboratory Press)、ニューヨーク、1989、16.7-16.8ページ)。通常用いられるスプライスドナーおよびアクセプター部位は、SV40の16S RNA由来のスプライス連結部である。
【0061】
真核細胞で効率的に組換えDNA配列を発現させるには、得られた転写物の効率的な終止とポリアデニル化を司るシグナルの発現が必要である。転写終止シグナルは一般に、ポリアデニル化シグナルの下流に見出され、典型的には、数百ヌクレオチドの長さである。ここで用いられる用語「ポリアデニル化シグナル」、「ポリ(A)シグナル」または「ポリ(A)部位」は、初期RNA転写物の終止とポリアデニル化の両方を司る遺伝的要素を意味する。ここで用いられる用語「ポリ(A)配列」は、初期RNA転写物の終止とポリアデニル化に関連するDNA配列を示す。ポリ(A)テールを欠く転写物は不安定で、急速に分解されるので、組換え体の転写物の効率的なポリアデニル化が望ましい。発現ベクターで用いられるポリ(A)シグナルは「異種性」または「内在性」であってよい。内在性ポリ(A)シグナルは、ゲノム中の所与の遺伝子のコーディング領域3’端に天然に見出される。異種ポリ(A)シグナルは、ある遺伝子から単離され、他の遺伝子の3’端につけられたものである。通常用いられる異種ポリ(A)シグナルは、SV40ポリ(A)シグナルである。SV40ポリ(A)シグナルは、237 bpのBamHI/BclI制限酵素断片にあり、終止およびポリアデニル化の両方を司る(Sambrook、上述、16.6-16.7)。
【0062】
真核生物の発現ベクターはまた、「ウイルスレプリコン」または「ウイルス複製起点」を含むことができる。ウイルスレプリコンは、適当な複製因子を発現する宿主細胞でベクターの染色体外複製を行わせるウイルスの要素である。SV40複製起点またはポリオーマウイルス複製起点のいずれかを含むベクターは、適当なウイルスT抗原を発現する細胞で高コピー数(104コピー/細胞まで)で複製する。一方、ウシパピローマウイルスまたはエプスタイン-バーウイルスのレプリコンを含むベクターは、染色体外で低コピー数(約100 コピー/細胞)で複製する。
【0063】
用語「インビトロ」は、人工的な環境および人工的な環境内で起きる工程または反応を意味する。インビトロの環境には試験管および細胞ライセートが含まれるが、これに限定されない。用語「インビボ」は天然環境(動物または細胞)および天然環境内で起きる工程または反応を意味する。用語「インシリコ」はコンピューター環境を意味する。
【0064】
用語「配列同一性」は、二つの核酸配列間の塩基が一致する割合または二つのアミノ酸配列間のアミノ酸が一致する割合を意味する。配列同一性は、二つの核酸配列またはアミノ酸配列間の関係の程度を示すために用いられる。部分的同一性または完全同一性がある。配列同一性は、配列解析ソフトウェア、例えばジェネティクスコンピューターグループ(GCG)(アメリカ合衆国ウィスコンシン州マディソン サイエンスドライブ575)の配列解析ソフトウェアパッケージを用いて、しばしば測定される。各種の置換、欠失、挿入およびその他の修飾に同一性の程度を与えることにより、そのようなソフトウェアの一致から配列を関係付けることができる。保存的な置換は典型的には、以下のグループ内での置換を含む:グリシン、アラニン、バリン、イソロイシン、ロイシン、アスパラギン酸、グルタミン酸、アスパラギン、グルタミン、セリン、スレオニン、リジン、アルギニン、およびフェニルアラニン、チロシン。
【0065】
配列同一性がパーセンテージ、例えば50%と表される場合、そのパーセンテージは、いくつかの他の配列と比べた一つの配列の長さに対する一致の割合を示す。ギャップ(二つの配列のいずれについても)は一致が最大となるように認められ;通常15塩基より少ないギャップの長さが用いられ、6塩基より少ないものが好ましく、2塩基より少ないものがより好ましい。オリゴヌクレオチドをプローブまたは処置に用いる場合、標的核酸およびオリゴヌクレオチドの間の配列同一性は一般に、20の可能なオリゴヌクレオチド塩基対の一致中17標的塩基の一致(85%)、好ましくは10の可能な塩基対の一致中9の一致(90%)、より好ましくは20の可能な塩基対の一致中19の一致(95%)より少ない。
【0066】
二つのアミノ酸配列間で部分的または完全な同一性があるならば、それらの配列は同一性を共有する。例えば85%同一性は、二つの配列を最大一致するようにアラインした場合に、85%のアミノ酸が同一であることを意味する。ギャップ(一致する二つの配列いずれについても)は、一致が最大となるように許可される;ギャップの長さは5以下が好ましく、2以下がより好ましい。あるいは、好ましくは、この用語がここで用いられるように、二つのタンパク質配列(または、少なくとも100個のアミノ酸の長さのポリペプチドに由来するポリペプチド)が、突然変異データマトリックスとギャップペナルティー6以上でのプログラムALIGNを用いて、5超のアラインメントスコア(標準偏差単位で)を有するならば、それらは同一性を共有する。Dayhoff, M.O.(タンパク質配列と構造のアトラス(Atlas of Protein Sequence and Structure)、1972、第5巻、国立生物医学研究財団(National Biomedical Research Foundation)、101-110ページ)および補遺2(同巻、1-10ページ)を参照。ALIGNプログラムを用いて任意にアラインされる際にアミノ酸が85%以上同一であるならば、二つの配列またはその部分はより好ましくは同一性を共有する。
【0067】
以下の用語は二つまたはそれ以上のポリヌクレオチド間の配列の関係を記述するために用いられる:「基準配列(reference sequence)」、「比較窓(comparison window)」、「配列同一性」、「配列同一性のパーセンテージ」および「実質的同一性」。「基準配列」は、配列比較の基礎として用いられる確定した配列である;基準配列は大きな配列の一部、例えば配列表に記載された全長cDNAまたは遺伝子配列の部分であってもよく、完全なcDNAまたは遺伝子配列を含有してもよい。一般的に、基準配列は少なくとも長さ20ヌクレオチド、高頻度で少なくとも長さ25ヌクレオチド、しばしば少なくとも長さ50ヌクレオチドである。二つのポリヌクレオチドがそれぞれ、(1)二つのポリヌクレオチド間で類似する配列、すなわち完全なポリヌクレオチド配列の部分を含有し、(2)さらに、二つのポリヌクレオチド間で相違を含有するので、二つ(またはそれ以上)のポリヌクレオチド間の配列比較は、典型的には、配列類似性のある局所的な領域を同定し、比較するための「比較窓」で二つのポリヌクレオチドの配列を比較することにより行われる。
【0068】
ここで用いられる「比較窓」は、少なくとも20の連続したヌクレオチドの概念的な部分を意味し、比較窓中のポリヌクレオチド配列部分は、二つの配列の最適なアラインメントのために、基準配列(付加または欠失を含有しない)と比べ、20%以下の付加または欠失、すなわちギャップを含有する。
【0069】
比較のための配列アラインメントの方法は当業者には周知である。それゆえ、二つの配列間のパーセント同一性を決定するために、数学的アルゴリズムが用いられる。そのような数学的アルゴリズムの好ましい、限定されない例として、MyersとMillerのアルゴリズム(1988);SmithとWatermanの局所的相同性アルゴリズム(1981);NeedlemanとWunschの相同性アラインメントアルゴリズム(1970);PearsonとLipmanの類似性検索法(1988);KarlinとAltschul(1993)により改良された、KarlinとAltschul(1990)のアルゴリズムをあげることができる。
【0070】
これらの数学的アルゴリズムのコンピューターによる実施は、配列同一性を決定するための配列比較のために利用される。そのような実施には、PC/Geneプログラム(カリフォルニア州マウンテンビュー、インテリジェネティクスから入手可)のCLUSTAL;ウィスコンシンジェネティクスソフトウェアパッケージ第8版(ジェネティクスコンピューターグループ(GCG)から入手可)のALIGNプログラム(第2版)およびGAP、BESTFIT、BLAST、FASTAおよびTFASTAが含まれるが、これらに限定されない。これらのプログラムを用いたアラインメントは初期設定のパラメーターを用いて行われる。CLUSTALプログラムは、Higginsら(1988);Higginsら(1989);Corpetら(1988);Huangら(1992);およびPearsonら(1994)により十分記載されている。ALIGNプログラムは、MyersとMillerのアルゴリズム(1988)に基づくものである。AltschulらのBLASTプログラム(1990)は、KarlinとAltschulのアルゴリズム(1993)に基づくものである。比較目的でギャップのあるアラインメントを得るために、Altschulら(1997)により記述されているように、Gapped BLAST(BLAST 2.0中)が用いられる。あるいは、PSI-BLAST(BLAST 2.0中)が、分子間の距離関係を検出する反復検索を行うために用いられる。Altschulら(1990)参照。BLAST、Gapped BLAST、PSI-BLASTを用いる場合、それぞれのプログラム(例えば、ヌクレオチド配列のためのBLASTN、タンパク質のためのBLASTX)の初期設定パラメーターを用いることができる。
1122943613281_0
参照。アラインメントはまた、検査により手動で行われる。
【0071】
用語「配列同一性」は、比較窓上で二つのポリヌクレオチド配列が同一(すなわち、ヌクレオチドごとの基準上)であることを意味する。用語「配列同一性のパーセンテージ」は、比較窓上で規定のヌクレオチドの割合に対して、二つのポリヌクレオチド配列が同一である(すなわち、ヌクレオチドごとの基準上)であることを意味する。用語「配列同一性のパーセンテージ」は、比較窓上で二つの最適にアラインされた配列を比較し、一致した位置の数を得るために両方の配列で同一核酸塩基(例えば、A、T、C、G、UまたはI)が生じた位置の数を決定し、比較窓中の全位置数(すなわち、窓サイズ)で一致した位置の数を除し、配列同一性のパーセンテージを得るために得られた結果に100を乗することにより計算される。ここで用いられる用語「実質的同一性」は、ポリヌクレオチド配列の特性を示し、ここで、ポリヌクレオチドは、少なくとも20ヌクレオチド位置の比較窓、しばしば少なくとも20-50ヌクレオチド、好ましくは少なくとも300ヌクレオチドの窓上で、基準配列と比べ、少なくとも60%、好ましくは少なくとも65%、より好ましくは少なくとも70%、約85%まで、さらに好ましくは少なくとも90-95%、さらに通常、少なくとも99%の配列同一性を有する配列を含有し、ここで配列同一性のパーセンテージは、基準配列を基準配列の20%以下の欠失または付加を含むポリヌクレオチド配列と比較窓上で比較することにより計算される。基準配列は大きな配列の一部であってよい。
【0072】
ポリペプチドにも適応した場合、用語「実質的同一性」は、例えば初期設定のギャップ負荷を用いたプログラムGAPまたはBESTFITにより最適にアラインされた場合に、二つのペプチド配列が、少なくとも約85%の配列同一性、好ましくは少なくとも約90%の配列同一性、より好ましくは少なくとも約95%の配列同一性、最も好ましくは少なくとも約99%の配列同一性を共有することを意味する。
【0073】
「部分的に相補的な」配列は、標的核酸に完全に相補的な配列がハイブリダイズすることを少なくとも部分的に阻害する配列であり、機能的な用語「実質的に同一の」を用いることと同義である。完全に相補的な配列の標的核酸へのハイブリダイゼーションの阻害は、低ストリンジェンシーの条件下でのハイブリダイゼーションアッセイ(サザンまたはノーザンブロット、溶液ハイブリダイゼーション等)を用いて試験される。実質的に同一の配列またはプローブは、低ストリンジェンシーの条件下での完全に同一の配列の標的への結合、すなわちハイブリダイゼーションを拮抗および阻害する。低ストリンジェンシー条件が非特異的結合を許容する条件であるとはいえず;低ストリンジェンシー条件は、二つの配列の互いへの結合が特異的、すなわち選択的相互作用をすることに必要である。非特異的結合がないことは、部分的な相補性、例えば約30%未満の同一性さえ欠く第二の標的の使用により試験される。この場合、非特異的結合がないと、プローブは第二の非相補性標的にはハイブリダイズしない。
【0074】
二重鎖核酸配列、例えばcDNAまたはゲノムクローンが用いられた場合、用語「実質的に同一な」は、ここに記載される低ストリンジェンシーの条件下で、二重鎖核酸配列のいずれかまたは両方にハイブリダイズできる任意のプローブを指す。
【0075】
「プローブ」は、選択されたストリンジェンシー条件下で結合することを(その長さに関して)プローブされる変性核酸の配列に十分相補的であるようにデザインされたオリゴヌクレオチドを意味する。
【0076】
プローブおよび変性融解核酸の関連で、「ハイブリダイゼーション」と「結合」は互換的に用いられる。変性核酸にハイブリダイズまたは結合するプローブは、ポリヌクレオチドの相補配列と塩基対をなす。特定のプローブがポリヌクレオチドと塩基対をなしたままであるかは、相補性の程度、プローブの長さおよび結合条件のストリンジェンシーに依存する。ストリンジェンシーが高ければ高いほど、相補性の程度は高くなり、および/または、プローブは長くなる。
【0077】
用語「ハイブリダイゼーション」は、相補的核酸の鎖の対合に関して用いられる。ハイブリダイゼーションおよびハイブリダイゼーションの強さ、すなわち、核酸の鎖間の関連性の強さは、当業者には周知の多くの因子により影響され、因子としては核酸間の相補性の程度、塩濃度のような条件により影響される条件のストリンジェンシー、形成されるハイブリッドのTm(融解温度)、他の組成の存在、例えばポリエチレングリコールの有無、ハイブリダイズする鎖のモル濃度および核酸鎖のG:C含量があげられる。
【0078】
用語「ストリンジェンシー」は、核酸ハイブリダイゼーションが行われるところの、温度、イオン強度、および他の組成の存在についての条件に関して用いられる。「高ストリンジェンシー」条件では、核酸塩基の対合は、高頻度の相補的塩基配列を有する核酸断片の間でのみ起きる。それゆえ、「中程度の」または「低」ストリンジェンシー条件は、互いに完全に相補的でない核酸をハイブリダイズする、または共にアニールすることが望まれる場合に、しばしば要求される。中程度または低ストリンジェンシー条件を構成する数多くの等価の条件が用いられていることは当業者には周知である。ハイブリダイゼーション条件の選択は一般に、当業者には明らかであり、通常、ハイブリダイゼーションの目的、ハイブリダイゼーションの型(DNA-DNAまたはDNA-RNA)、および配列間の所望される関係のレベルにより導かれる(方法の一般論について、例えば、Sambrookら、1989;核酸ハイブリダイゼーション 実践的アプローチ(Nucleic Acid Hybridization, A Practical Approach)、IRLプレス、ワシントンD.C.、1985)。
【0079】
核酸二重鎖の安定性は、一致しない塩基数の増加に伴い減少することが知られており、さらに、ハイブリッド二重鎖中のミスマッチの相対的な位置に依存して、多少の程度で減少する。それゆえ、ハイブリダイゼーションのストリンジェンシーは、そのような二重鎖の安定性を最大または最小にするために用いられる。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの温度を調整し;ハイブリダイゼーション混合液中のヘリックス不安定化剤、例えばホルムアミドのパーセンテージを調整し;洗浄溶液の温度および/または塩濃度を調整することにより変えることができる。フィルターハイブリダイゼーションでは、最終的なハイブリダイゼーションのストリンジェンシーはしばしば、ハイブリダイゼーション後の洗浄で用いられる塩濃度および/または温度により決定される。
【0080】
核酸ハイブリダイゼーションについて用いられる場合の「高ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブが用いられた場合、5X SSPE(43.8 g/l NaCl、6.9 g/l NaH2PO4H2Oおよび1.85 g/l EDTA、NaOHでpHを7.4に調整)、0.5% SDS、5X デンハルト試薬および100 μg/ml 変性サケ精子DNAを含む溶液中、42℃での結合またはハイブリダイゼーションとそれに続く0.1X SSPE、1.0% SDSを含む溶液中、42℃での洗浄と等価の条件を含む。
【0081】
核酸ハイブリダイゼーションについて用いられる場合の「中程度のストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブが用いられた場合、5X SSPE(43.8 g/l NaCl、6.9 g/l NaH2PO4H2Oおよび1.85 g/l EDTA、NaOHでpHを7.4に調整)、0.5% SDS、5X デンハルト試薬および100 μg/ml 変性サケ精子DNAを含む溶液中、42℃での結合またはハイブリダイゼーションとそれに続く1.0X SSPE、1.0% SDSを含む溶液中、42℃での洗浄と等価の条件を含む。
【0082】
核酸ハイブリダイゼーションについて用いられる場合の「低ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブが用いられた場合、5X SSPE(43.8 g/l NaCl、6.9 g/l NaH2PO4H2Oおよび1.85 g/l EDTA、NaOHでpHを7.4に調整)、0.5% SDS、5X デンハルト試薬[50X デンハルトは500 mlあたり:5 gフィコール(タイプ400、ファルマシア)、5g BSA(画分V、シグマ)を含む]および100 μg/ml 変性サケ精子DNAを含む溶液中、42℃での結合またはハイブリダイゼーションとそれに続く5X SSPE、0.1% SDSを含む溶液中、42℃での洗浄と等価の条件を含む。
【0083】
用語「Tm」は「融解温度」に関して用いられる。融解温度は二重鎖核酸の集団の50%が一本鎖に解離する温度である。核酸のTmの計算式は当業者には周知である。ハイブリッド核酸のTmはしばしば、1 M の塩におけるハイブリダイゼーションアッセイに適合する式を用いて概算され、通常はPCRプライマーのTmを計算する式:[(A+Tの数)x2℃+(G+Cの数)x4℃]が用いられる(C.R.Newtonら、PCR、第2版、シュプリンガー-フェアラーク(ニューヨーク、1997)、24ページ)。この式は20ヌクレオチドより長いプライマーでは不正確であることが見出された(同上)。Tm値の別の簡単な概算を、核酸が1 M NaClの水溶液中にある場合、式:Tm=81.5+0.41(%G+C)で計算できる(例えば、AndersonとYoung、「核酸ハイブリダイゼーション(Nucleic Acid Hybridization)」(1985)中の定量的フィルターハイブリダイゼーション(Quantitative Filter Hybridization))。構造ならびに配列の特徴を考慮したTmを計算するより洗練された別の計算法が当業界に存在する。計算されたTmは単なる概算であり、最適温度は通常、経験に基づいて決定される。
【0084】
本発明において、当業界の範囲で、通常の分子生物学および微生物学が用いられる。そのような技術は文献に十分に説明されている。Sambrook、FritschおよびManiatis、モレキュラー・クローニング:実験室マニュアル、第3版(2001)、コールドスプリングハーバー・ラボラトリー・プレス、ニューヨーク州コールドスプリングハーバーを参照。
【0085】
本発明に従えば、新規核酸が記述される。蛍光タンパク質をコードする元の核酸配列を修飾し、実質的に同一の蛍光タンパク質をコードするが、新規宿主細胞、この場合ヒト細胞で増強された転写および発現特性を有した核酸配列の新規合成型を作出した。
【0086】
1.本発明の合成核酸分子および方法
本発明は蛍光タンパク質をコードする合成核酸分子を含有する組成物ならびに、特定の細胞型で発現される際に、減少した不適切なまたは意図しない転写特性を含む所望の特性を有するポリペプチドまたはタンパク質として効果的に発現される合成核酸分子を得る前記分子を調製する方法を提供する。
【0087】
自然の選択は、表現型レベルで生ずる遺伝子型環境相互作用が個体の繁殖成功度に差をもたらし、それゆえ集団の遺伝子プールに変化がもたらされるという前提である。天然に見出されるタンパク質のアミノ酸配列は自然の選択による最適化を受けるということが一般に受け入れられている。しかし、タンパク質の活性に著しく寄与しないアミノ酸がタンパク質の配列内に存在し、これらのアミノ酸はほとんど、または全く影響することなく、他のアミノ酸に変換される。さらに、タンパク質はその天然の環境の外側で、または自然の選択の条件とは異なる目的のために有用である。これらの環境では、アミノ酸配列は各種用途への利用のために、タンパク質をより適合させるために合成的に改変される。
【0088】
同様に、タンパク質をコードするアミノ酸配列はまた、自然の選択により最適化される。コーディングDNAとその転写RNAとの関係は、DNAへの変化が得られるRNAに影響するというものである。それゆえ、自然の選択が両方の分子に同時に作用する。しかし、この関係は核酸とタンパク質の間には存在しない。複数コドンが同一アミノ酸をコードするので、多くの異なるヌクレオチド配列が同一タンパク質をコードできる。500アミノ酸から構成される特定のタンパク質は、理論的には10150以上の異なる核酸配列によりコードされる。
【0089】
自然の選択は核酸に作用し、対応するタンパク質の適切な暗号化をもたらす。おそらく、核酸分子の他の特性も自然の選択に作用される。これらの特性には、コドン使用頻度、RNA二次構造、イントロンのスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用が含まれる。これらの他の特性はタンパク質の翻訳効率および得られる表現型を変化させる。遺伝子コードの重複性のために、これらの他の特性を対応するアミノ酸配列を変化させることなしに、自然の選択により最適化できる。
【0090】
ある条件下で、タンパク質をコードする天然のヌクレオチド配列を別の用途のためのタンパク質により適合するように合成的に変化させるのに有用である。一般的な例は、外来宿主で発現される場合、遺伝子のコドン使用頻度を変化させることである。遺伝子コードの重複が複数コドンによりアミノ酸をコードさせるが、異なる生物ではいくつかのコドンで、他の生物とは異なる嗜好性を有する。コドン使用頻度は、広く分離した進化の歴史を有するほとんどの生物で異なる傾向にある。進化的に離れた生物間で遺伝子を転移させると、タンパク質の翻訳効率は、コドン使用頻度を調製することにより実質的に増加することが見出された(米国特許第5096825号、第5670356号および第5874304号参照)。
【0091】
進化距離のために、蛍光タンパク質をコードする遺伝子のコドン使用は、実験細胞の最適コドン使用に対応しない。例としては、腔腸動物由来であるが、通常、植物細胞および哺乳動物細胞で用いられる、緑色蛍光タンパク質(GFP)レポーター遺伝子があげられる。蛍光タンパク質遺伝子発現の感度のよい定量法を得るために、遺伝子産物の活性は実験宿主細胞に内在するものであってはならない。それゆえ、蛍光タンパク質遺伝子は通常、他とは異なる、独特の表現型を有する生物から選択される。その結果として、これらの生物はしばしば、実験宿主細胞とは広く分離した進化の歴史を有している。
【0092】
以前は、より最適なコドン使用頻度を有するが、同一遺伝子産物をまだコードする遺伝子を作出するために、合成核酸配列が、存在するコドンを実験宿主細胞で一般により好まれるコドンで置換することにより、作出された(米国特許第5096825号、第5670356号および第5874304号参照)。合成遺伝子のコドン使用頻度の基本的な改良という結果であった。しかし、他の特性の最適化は考えられず、その結果、これらの合成遺伝子はおそらく、自然の選択により最適化される遺伝子を反映しなかった。
【0093】
特に、コドン使用頻度の改良は、タンパク質への翻訳における役割に基づくRNA配列の最適化のみを意図する。それゆえ、以前に記載された方法は、合成遺伝子の配列がどのようにRNAへの転写におけるDNAの役割に影響を及ぼすかについて扱わなかった。最も顕著には、転写因子がどのように合成DNAと相互作用し、その結果として遺伝子の転写を調節するか、または遺伝子の転写に影響を及ぼすかについて、考察を与えない。天然に見出される遺伝子に関して、DNAは天然宿主細胞により最適に転写され、適切に折りたたまれた遺伝子産物をコードするRNAが得られる。その一方、合成遺伝子は以前、転写特性に関して最適化されていなかった。むしろ、この特性は無視されていたか、または偶然に任されていた。
【0094】
この懸案事項は全ての遺伝子にとって重要であるが、最も一般的に実験宿主細胞で転写の挙動を定量するために用いられるレポーター遺伝子にとって重要である。数百の転写因子が異なる生理的条件下の異なる細胞型で同定され、さらに多くが存在していると思われるが、未だ同定されていない。これらの転写因子全てが導入した遺伝子の転写に影響を及ぼす。本発明の有用な合成レポーター遺伝子の産物について、この遺伝子の構造が改変されているために、宿主細胞の本来の特性に影響する、または本来の特性をかき乱すリスクは最小である。特に有用な合成レポーター遺伝子は、新規の一連の、および/または多様な実験条件下で、所望の特性を有する。これらの特性を最もよく得るために、合成遺伝子の構造が、広い宿主細胞域と生理的条件内で転写因子と相互作用する最小の可能性を有するべきである。レポーター遺伝子と宿主細胞の内在性転写因子との相互作用の最小可能性は、特定の実験で遺伝子の不適切な転写特性のリスクを減少し、各種環境での遺伝子の適用性を増加し、得られる実験データの許容性を増加することにより、レポーター遺伝子の価値を増加する。
【0095】
これらの懸案事項はまた、転写の挙動を定量するために用いられ、そして定量のための基準として、または融合タンパク質の移動または局在性をモニターするための別のタンパク質との融合として用いられる蛍光タンパク質遺伝子にとって重要である。上述のように、数百の転写因子が宿主細胞に存在し、導入遺伝子の転写に影響を及ぼす。本発明の有用な合成蛍光タンパク質遺伝子は、遺伝子の構造が改変されているために、宿主細胞の内在性転写特性への影響または混乱のリスクは最小である。特に有用な合成蛍光タンパク質遺伝子は、新しいセットの実験条件および/または広範囲の各種実験条件下で所望の特性を有する。これらの特性を最高に達成するために、合成蛍光タンパク質遺伝子の構造は、幅広い宿主域および生理的条件の範囲で転写因子と相互作用する最小の可能性を有する。蛍光タンパク質遺伝子と宿主細胞の内在性転写因子との潜在的な相互作用を最小化することは、特定の実験の範囲で遺伝子の不適切な転写特性のリスクを減少し、各種環境で遺伝子の適用性を増加し、得られる実験データの容認度を増加することにより、蛍光タンパク質遺伝子の価値を増加する。
【0096】
一方、元の宿主生物のゲノムクローンまたはcDNAクローンに基づく天然のヌクレオチド配列を含有するレポーター遺伝子は、外来性宿主で発現する場合、転写因子と相互作用する。このリスクは二つの事情から生ずる。第一に、天然のヌクレオチド配列は、天然の宿主生物の中での遺伝子転写に影響する自然の選択を介して最適化される配列を含む。しかし、これらの配列はまた、遺伝子が外来宿主で、すなわち、理由もなく、それゆえレポーター遺伝子としての能力を妨げられて発現する場合、転写に影響を及ぼす。第二に、ヌクレオチド配列は何かの事情で、天然の宿主生物には存在しない転写因子と相互作用し、それゆえ自然の選択に参画しなかった。そのような故意ではない相互作用の可能性は、実験細胞と天然の生物との間のレポーター遺伝子の進化的分離をより大きく増加する。
【0097】
同様に、元の宿主生物または元々単離された蛍光タンパク質の突然変異体のゲノムクローンまたはcDNAクローンに基づく天然のヌクレオチド配列を含有する蛍光タンパク質遺伝子は、上述のように外来宿主で発現する場合、不適切に転写因子と相互作用する。外来宿主でのそのような故意でない相互作用の可能性は、実験細胞と天然の生物との間のレポーター遺伝子の進化学的分離をより大きく増加する。
【0098】
転写因子との可能な相互作用は、おそらく、コドン使用頻度に改変を有する合成蛍光タンパク質遺伝子を用いた場合に崩壊する。しかし、コドン使用頻度のみに基づきコドンを選択することにより設計された合成蛍光タンパク質遺伝子は、不適切な転写活性を修正する自然の選択の利益を合成遺伝子は受けていないので、他の偶然の転写因子結合部位を含まないと思われる。転写因子との故意でない相互作用はまた、コードされるアミノ酸配列が人工的に改変される、例えばアミノ酸置換を導入しないかぎり、生ずるものである。同様に、これらの変化は自然の選択を受けず、それゆえ、好ましくない特性を示す可能性がある。
【0099】
それゆえ本発明は、特定の宿主細胞で発現した場合に核酸と転写因子との好ましくない相互作用のリスクを減少し、それにより不適切または偶然の転写特性を減少させた合成核酸配列を調製する方法を提供する。好ましくは、本方法により、特定の宿主細胞で改良されたコドン使用頻度を含み、脊椎動物の転写因子結合部位の存在が減少した合成遺伝子を得ることができる。本発明はまた、転写因子結合部位の存在が減少し、別の利益のある特性を有する改良されたコドン使用頻度を含む合成遺伝子を調製する方法を提供する。そのような別の特性として、不適切なRNAスプライス配列、ポリ(A)付加配列、好ましくない制限配列、リボソーム結合配列およびヘアピンループのような二次構造モチーフがないことがあげられる。
【0100】
それゆえ、本発明の核酸は、特定の宿主細胞で発現される場合、核酸と転写因子の好ましくない相互作用のリスクを減少させた、蛍光タンパク質をコードする新規合成核酸配列を提供する。好ましくは、本方法により、特定の宿主細胞で改良されたコドン使用頻度を含み、転写因子結合配列の存在が減少した合成蛍光タンパク質遺伝子が得られる。本発明はまた、上述のような、転写因子結合部位の存在が減少し、別の利益のある特性を有する改良されたコドン使用頻度を含む合成蛍光タンパク質遺伝子を調製する方法を提供する。そのような別の特性として、不適切なRNAスプライス配列、ポリ(A)付加配列、好ましくない制限配列、リボソーム結合配列およびヘアピンループのような二次構造モチーフがないことがあげられるが、これに限定されない。
【0101】
同一または高度に類似のタンパク質をコードする合成遺伝子(「コドンが異なる」バージョン)を調製する方法もまた提供される。好ましくは、合成遺伝子は共通のポリヌクレオチド・プローブ配列にハイブリダイズする異なる能力を有し、生細胞に共存する場合に組換えのリスクが減少している。組換えを検出するために、隣接配列に相補的なプライマーを用いたレポーター配列のPCR増幅および増幅配列のシーケンシングが用いられる。それゆえ、同一または高度に類似の蛍光タンパク質をコードする合成遺伝子(「コドンが異なる」バージョン)を調製する方法もまた提供される。好ましくは、合成蛍光タンパク質遺伝子は共通のポリヌクレオチド・プローブ配列にハイブリダイズする異なる能力を有し、生細胞に共存する場合に組換えのリスクが減少している。組換えを検出するために、隣接配列に相補的なプライマーを用いたレポーター配列のPCR増幅および増幅配列のシーケンシングが用いられる。
【0102】
本発明の合成核酸分子のためのコドンを選択するために、好ましいコドンは選択された宿主細胞で比較的高いコドン使用頻度を有し、それらを導入することにより、比較的少ない転写因子結合配列、比較的少ない他の好ましくない構造的特性、および任意に合成遺伝子と高度に類似したタンパク質をコードする別の遺伝子を区別する特性が導入される。それゆえ、本発明の方法により得られる合成核酸の産物は、改良されたコドン使用頻度のために発現レベルが改良されており、好ましくない転写調節配列の数が減少していることにより不適切な転写の挙動のリスクが減少しており、合成配列を選択するために用いられる他の基準のための任意の付加的な特性を有する合成遺伝子である。
【0103】
任意に、合成遺伝子の少なくとも一つの特性は、天然の宿主細胞に対して、好ましい宿主細胞における、増強されたタンパク質発現である。それゆえ、本発明の方法により得られる合成核酸の産物は、改良されたコドン使用頻度のために発現レベルが改良されており、好ましくない転写調節配列の数が減少していることにより不適切な転写の挙動のリスクが減少しており、合成配列を選択するために用いられる他の基準のための任意の付加的な特性を有する合成蛍光タンパク質遺伝子である。
【0104】
本発明にはいずれかの核酸配列、例えばcDNAのような天然の配列、またはインビトロで操作され、例えば制限酵素認識配列の導入または削除のような特定の改変、異なるアミノ酸をコードするまたは融合タンパク質をコードするコドンの改変、光度の増加が導入される、または核酸分子のGCまたはAT含量(組成の%)が改変される配列が用いられる。その上、本発明の方法は、いずれの遺伝子についても有用であるが、特にレポーター遺伝子、並びにレポーター遺伝子の発現に関連する他の遺伝子、例えば選択マーカーに有用である。好ましい遺伝子として、ラクタマーゼ(β-gal)、ネオマイシン耐性(Neo)、CAT、GUS、ガラクトピラノシド、キシロシダーゼ、チミジンキナーゼ、アラビノシダーゼ、蛍光タンパク質等をコードする遺伝子があげられるが、これらに限定されない。
【0105】
さらに、本発明の方法は、いずれの蛍光タンパク質遺伝子にも有用である。好ましい遺伝子として、GFPおよび赤色蛍光タンパク質(RFP)等をコードする遺伝子があげられるが、これらに限定されない。本開示の要素は詳細に特定の蛍光タンパク質遺伝子を使用することにより例示される。もちろん、適当な蛍光タンパク質遺伝子の多くの例が当業者には既知であり、本発明の実施に用いることができる。それゆえ、以下の例は網羅的というよりはむしろ典型的なものであると理解されるべきである。ここに開示した技術および当業者に既知の一般的な組換え技術を考慮して、本発明はいずれかの蛍光タンパク質遺伝子の改変を可能にする。典型的な蛍光タンパク質遺伝子として、元々Montastraea cavernosaから単離されたGFP、およびActinodiscusまたはDiscosomaであると信じられているポリプから元々単離されたRFPがあげられるが、これらに限定されない。
【0106】
ここで用いられるように、「マーカー遺伝子」または「レポーター遺伝子」は、遺伝子を発現する細胞に異なる表現型を賦与し、そのために該遺伝子を有する細胞と該遺伝子を有さない細胞と区別する遺伝子である。そのような遺伝子は、化学的手段すなわち選択的薬剤(例えば除草剤、抗生物質等)により「選択」できる特性をマーカーが与えるかどうか、または観察あるいは試験、すなわち「スクリーニング」により同定できる単なる「レポーター」特性であるかどうかに依存して、選択的マーカーまたはスクリーニング可能なマーカーのいずれかをコードする。本開示の要素は特定のマーカー遺伝子の使用により詳細に例示される。もちろん、適当なマーカー遺伝子またはレポーター遺伝子の多くの例が当業者には既知であり、本発明の実施に用いることができる。それゆえ、以下の例は網羅的というよりはむしろ典型的なものであると理解されるべきである。ここに開示した技術および当業者に既知の一般的な組換え技術を考慮して、本発明はいずれかの遺伝子の改変を可能にする。
【0107】
本発明の方法は、限定はされないが、反復工程により行うことができる。工程には、特定の種のコドン使用に基づいて、好ましいコドンを標的分子、例えば元のヌクレオチド配列のそれぞれのアミノ酸に割り当てること、好ましいコドンを有する核酸配列で、潜在的な転写調節配列、例えば転写因子結合配列を、例えばそのような結合配列のデータベースを用いて同定すること、任意に他の好ましくない配列を同定すること、および好ましくない転写因子結合配列または他の配列が存在する位置で、代わりのコドンに置換する(すなわち、同一アミノ酸をコードする)ことが含まれる。コドンの異なるバージョンで、代わりの好ましいコドンが、それぞれのバージョンの転写因子結合配列数または型を減らすために試みで置換される。必要ならば、転写因子または好ましくない配列の同定と削除が、最大数の好ましいコドンおよび転写調節配列または他の好ましくない配列を含む最小数の好ましくない配列を含むヌクレオチド配列が得られるまで、繰り返される。また任意で、所望の配列、例えば制限酵素認識配列を導入できる。合成核酸分子を設計、構築した後、元の核酸配列に比較した特性を当業者に周知の方法により測定することができる。例えば、特定の細胞における一連のベクターを用いた合成および元の核酸分子の発現を比較できる。
【0108】
それゆえ、一般に、本発明の方法は、蛍光タンパク質をコードする標的核酸配列、および対象の宿主細胞、例えば植物(双子葉または単子葉)、カビ、酵母または哺乳動物細胞を同定することを含む。好ましい宿主細胞は哺乳動物宿主細胞、例えばCHO、COS、293、Hela、CV-1およびNIH3T3細胞である。宿主細胞における好ましいコドン使用、および任意に、宿主細胞における低コドン使用、例えば哺乳動物の高いコドン使用と大腸菌および哺乳動物の低いコドン使用に基づき、置換されるコドンを決定する。二つの合成核酸分子のコドンが異なるバージョンを、それぞれのバージョンに導入される別の好ましいコドンを用いて決定する。それゆえ、二つ以上のコドンを有するアミノ酸では、一つの好ましいコドンが一方のバージョンに導入され、別の好ましいコドンが他方のバージョンに導入される。一つ以上のコドンを有するアミノ酸では、一致しない塩基が最大数の二つのコドンを同定し、一つを一方のバージョンに導入し、もう一つのコドンを他方のバージョンに導入する。標的配列中の並列の、それに続く、置換されるコドンを選択する前の、所望の配列および好ましくない配列、例えば好ましくない転写調節配列を同定する。これらの配列を、ここでさらに述べた、データベースおよびソフトウェア、例えばEPD、NNPD、REBASE、TRANSFAC、TESS、GenePro、MAR(
1122943613281_1
)およびBCM Gene Finderを用いて同定することができる。配列を同定した後、修飾を導入する。所望の核酸配列が得られると、当業者に周知の方法(例えば、重複プライマーを用いたPCRまたは市販の遺伝子合成)により該配列を調製できる。標的核酸配列と比較されるその構造的、および機能的特性として、パーセント同一性、ある配列、例えば制限配列の存在の有無、改変コドンのパーセント(例えば、あるコドンの使用の増減)および発現率をあげることができるが、これに限定されない。
【0109】
ある好ましい態様では、以下の工程が行われる。
【0110】
1.元の遺伝子または遺伝子の一部のコドン使用は、一つ以上の外来宿主における発現で、好ましくはアミノ酸配列を改変することなく最適化される。
【0111】
2.任意に、所望のヌクレオチド配列(例えば、Kozakコンセンサス配列、特異的結合配列、制限酵素配列、および組換え配列)を、遺伝子配列および、必要ならアミノ酸配列を改変することにより導入する。
【0112】
3.好ましくない転写調節配列および制限酵素認識配列を、遺伝子配列内のそのような配列の記述(descriptions)により同定する。そのような記述には、特異的な個々の配列記述、コンセンサス配列記述、マトリックス記述、等がある。記述は自身の研究、文献、あるいは他の公共または市販のソースから得ることができる。記述を遺伝子配列中に、異なる検索方法、例えば目による検索、テキスト検索、配列解析ソフトウェア、またはMatInspectorプロフェッショナルのような特殊なソフトウェアを用いて示すことができる。当業者は、所望の結果を得る、使用方法に適応できるパラメーターを選択する方法を理解できるであろう。
【0113】
4.好ましくない転写調節配列および制限酵素認識配列をその後、一つ以上のコドンを同一アミノ酸の別のコドンに置換することにより、遺伝子配列から削除する。高度に望ましくない配列を削除するために、選択した外来宿主では好ましくない、またはポリペプチドの所望の特性を過度に損なわないならばアミノ酸配列を改変するコドンを置換することをユーザーは選択できる。新しい好ましくない転写調節配列または制限酵素認識配列を導入する置換コドンまたはコドンの組合わせは避けるべきである。可能な置換コドンまたはコドンの組合わせのうち、殆ど完全に好ましくない転写調節配列を削除するものが好ましい。選択した外来宿主に好ましくない多くのコドンの置換は避けるべきである。コドンの置換を手動で、またはSequenceShaperのようなソフトウェアを用いて、選択、導入できる。当業者は、所望の結果を得る、使用方法に適応できるパラメーターを選択する方法を理解できるであろう。
【0114】
5.必要ならば、調整したパラメーターを用いて、できる限りまたは許容できる限り数を減らした好ましくない転写調節配列または制限酵素認識配列を含む最終的な配列が得られるまで、工程3および4を繰り返すことができる。
【0115】
6.最終的な設計された核酸配列を合成/構築し、適当な遺伝子ベクターにクローニングすることができる。遺伝子ベクターは、選択した外来宿主または他の適当な宿主で合成遺伝子のタンパク質転写ができる発現ベクターである。
【0116】
以下に述べるように、もともとMontastraea cavernosaから単離された緑色蛍光タンパク質(GFP)の突然変異型であるGFPをコードする合成遺伝子を作出するために、本方法を用いた。合成遺伝子は、元のGFPに比べ、宿主細胞中でかなり高いレベルの蛍光をサポートする。さらに、元のGFPに比べ、合成GFPの以上発現は減少することが予測される。
【0117】
本発明の分子の使用例
本発明の合成遺伝子は好ましくは、その元の一部(または殆ど全て)として同一タンパク質をコードし、元のタンパク質と比較すると、改良されたコドン使用を有し、その一方で、コーディング領域中の既知の転写調節配列を大きく欠いている。(少数のアミノ酸変化が天然の部分タンパク質の特性を増強する、例えば、蛍光タンパク質の蛍光特性を増強するのに望ましいことが認識される。)これは合成遺伝子によりコードされるタンパク質の発現レベルを増加し、タンパク質の異常発現のリスクを減少する。例えば、遺伝子制御の多くの重要な事象についての研究は、弱いプロモーターにより仲介されるが、レポータータンパク質の不適切な発現の不十分なレポーターシグナルにより限定される。ここに記述される合成蛍光タンパク質遺伝子は、発現レベルを大きく増加しているために、弱いプロモーター活性の検出ができ、検出感度を増加することが可能である。さらなる利点は、限られた量しか得られない転写因子が、非生産的結合事象では細胞により利用されないことである。また、いくつかの選択マーカーの利用が外来細胞中のマーカーの発現により限定される。それゆえ、その細胞における改良されたコドン使用を有し、他の好ましくない配列(例えば、転写因子結合配列)が減少している合成選択マーカー遺伝子が、それらのマーカーの宿主として同様に好ましくない細胞で、マーカーとしての利用を可能にする。
【0118】
プロモーターのクロストークが、共レポーター遺伝子をトランスフェクション効率の正規化に用いている場合、別の懸案事項である。合成遺伝子の増強された発現を用いると、強力プロモーターを含むDNAの量を減少でき、またはより弱いプロモーターを含むDNAを、共レポーターを発現させるために用いることができる。さらに、本発明の合成レポーター遺伝子からのバックグランド発現を減少できる。この特性は、遺伝子の散発的な発現を最小化し、他の調節経路から生ずる障害を減少することにより、合成レポーター遺伝子をより望ましいものにする。
【0119】
結像系へのレポーター遺伝子の使用は、インビボでの生物学的研究または薬剤スクリーニングに用いることができるが、本発明の合成遺伝子の別の利用である。発現レベルが増加しているために、合成遺伝子によりコードされるタンパク質は、結像系によりより確実に検出できる。合成遺伝子によりコードされる蛍光タンパク質の場合、蛍光細胞分析分離(FACS)の間に、調査する人の必要に応じて、蛍光強度は増減する。その上、合成蛍光タンパク質遺伝子を、初代細胞のようなトランスフェクションが困難な細胞の転写を研究するため、および/または調節経路および遺伝的要素の解析を改善するために、融合タンパク質、例えば分泌リーダー配列または細胞局在配列を有する融合タンパク質を発現させるのに用いることができる。さらに、合成蛍光タンパク質遺伝子を目的の遺伝子と融合することができ、その結果、目的の遺伝子の発現を、例えば宿主細胞内で追跡することができる。
【0120】
別の用途として、極度の感度を必要とする稀な事象の検出(例えば、RNA再コード化の研究)、内在性リボソーム・エントリー部位(IRES)を用いたインビトロの翻訳またはTNTTM(プロメガ、ウィスコンシン州マディソン)のようなインビトロの転写-翻訳共役系の効率を改善するための使用、異なる宿主生物(例えば、植物、カビ等)に最適化された蛍光タンパク質の研究があげられるが、これに限定されない。その上、本発明の合成蛍光タンパク質をレポーターとして用いることができる。それゆえ、蛍光タンパク質をマルチウェルアッセイのレポーター分子として、および、異なるシグナル伝達経路と他の調節機構によりレポーターシグナルの可能な障害を最小化する利点をもった薬剤スクリーニングのレポーター分子として用いることができる。複数の合成蛍光タンパク質遺伝子を、例えば薬剤の毒性をモニターするための共レポーターとして用いることができる。
【0121】
さらに、本発明の核酸分子の用途として、インビトロおよびインビボでの遺伝子発現レベルを検出および/または測定する(例えば、プロモーター強度を測定する)ための蛍光顕微鏡、細胞内局在性またはターゲティング(融合タンパク質)、マーカーとして、検定に、キット(例えば、二重アッセイ)に、調節経路と遺伝的要素を解析するためのインビボでの結像のために、およびマルチウェルのフォーマットがあげられるが、これに限定されない。
【0122】
緑色蛍光タンパク質遺伝子を用いた本発明の実証
Green II、すなわちMontastraea cavernosaから単離された野生型遺伝子から作製された変異緑色蛍光タンパク質の遺伝子が、本発明を実証するために用いられた。Green IIは、光退色に対して高度の耐性を有している。それゆえ、例えば細胞のモニタリングに有用である。光退色は、蛍光プローブ中の光により誘導された変化であり、蛍光プローブによる特定波長光の吸収の消失および蛍光プローブの蛍光の消失をもたらす。この特性は、例えば、写真が得られる時間、または試料を観察する時間を減少することにより、いくつかの蛍光タンパク質の有用性を限定できる。したがって、高度の光退色耐性を有する蛍光タンパク質は、持続性の蛍光が所望される場合には有利である。
【0123】
以下の実施例は実例となる目的のみのために提供される。実施例は、現在記述されている発明をより詳細に理解するためにのみ、ここに取り込まれる。実施例は、記述されるまたはここにクレームされる発明の範囲を、いかなる方法でも限定しない。
【実施例1】
【0124】
合成緑色蛍光タンパク質核酸分子
McGFPは、Montastraea cavernosaから単離された緑色蛍光タンパク質(GFP)である。McGFPを第一回目の低ストリンジェンシーPCRの間に変異させ、野生型遺伝子に突然変異を導入した。第一回目のPCRから、Green Iを製造した。Green Iは、野生型GFPよりも比較的高い蛍光強度を有していた。Green Iを、Green IをコードするDNAに対して行った第二回目の低ストリンジェンシーPCRの間に変異させ、Green IIを作出した。Green IをコードするDNA配列と比較すると、Green IIをコードするDNAは、一個のヌクレオチドの変化:ヌクレオチド527のシトシンのチミンへの突然変異を含んでいる。この結果、Green Iの76番目のSが、Green IIの同位置ではFとなる。Green IIは光退色に対して高い耐性を有していた。
【0125】
Green IIを核酸配列のヒト化のための元の遺伝子として用いた。合成遺伝子配列をインシリコで、以下のソフトウェアツールを用いて設計した:マトリックス・ファミリー・ライブラリーVer 2.3および2.4に付随のMatInspectorプロフェッショナル リリース5.2、プロモーター・モジュール・ライブラリーVer 2.2および2.3に付随のModelInspectorプロフェッショナル リリース4.7.8および4.7.9、およびSequenceShaper リリース2.3(全て、Genomatix Software GmbH、ドイツ・ミュンヘンから入手)。遺伝子を1)哺乳動物細胞での発現で最適化したコドン使用を有し、2)脊椎動物の転写因子結合配列、スプライシング配列、ポリ(A)付加配列、プロモーター配列ならびに原核生物(例えば、大腸菌)の調節配列を含む転写調節配列の数を減少させ、3)Kozak配列を有し、4)クローニングのための少なくとも一つの新規制限酵素認識配列を有し、および5)不要な制限酵素認識配列、例えば標準的なクローニング法を妨害すると思われる配列をなくすように設計した。
【0126】
全ての設計の基準が同時に等しく十分に満たされるというわけではない。次の優先順位が確立している:脊椎動物の転写因子(TF)結合配列の削除が最も高い優先順位となり、続いて、スプライシング配列およびポリ(A)付加配列の削除、最後に原核生物の調節配列。調節配列を削除する場合、方針としては、最も重要な変化が確実に最後になるように、重要度の低いものから最も高いものへ作業し、これらの改良に対する不用意な変化は生じなかった。その後、新しい優先度の低い配列の出現について配列を再度チェックし、必要に応じて別の改変を加えた。それゆえ、ここに記述したコンピュータープログラムを用いた合成遺伝子配列を設計する工程は、以下に詳細に述べる繰り返し工程を任意に含む。
【0127】
MatInspectorプロフェッショナルはDNA配列中の転写因子結合配列を検索するためのこれらの配列のマトリックス記述を用いる。マトリックス記述は、転写因子負荷(weight)マトリックスデータベース(転写因子結合配列のマトリックス記述のライブラリー)に含まれる。MatInspectorの方法は元々はQuandtら、1995に記載された(Quandt, K., Frech, K., Karas, H., Wingender, E., Werner, T. (1995)MatInd and MatInspector:ヌクレオチド配列データ中のコンセンサスマッチの検出のための新しい迅速で多目的なツール(MatInd and MatInspector: new fast and versatile tools for detection of consensus matches in nucleotide sequence data.) Nucleic Acids Res. 1995, vol. 23, 4878-4884)。
【0128】
転写因子負荷マトリックスデータベース内で、マトリックス記述はカテゴリー(例えば、カビ、昆虫、植物、脊椎動物等の転写因子結合配列)に分けられる。それぞれのマトリックス記述はマトリックスファミリーに属し、MatInspectorプロフェッショナルにより繰り返しの一致を削除するように、類似および/または関連マトリックス記述が一つにまとめられる。ユーザーは、転写因子結合配列または他の配列、例えば他の転写調節配列または制限酵素配列のそれ自身のマトリックス記述を加えることができる。実施例で用いられるデータベースのバージョンは、マトリックス・ファミリー・ライブラリーVer 2.3(103ファミリー、264の脊椎動物マトリックス記述を含む)およびマトリックス・ファミリー・ライブラリーVer 2.4(106ファミリー、275の脊椎動物マトリックス記述を含む)であった。
【0129】
MatInspectorプロフェッショナルを用いた検索を行うために、ユーザーは検索に用いるマトリックス記述のサブセットを定義し、保存できる。さらに、ユーザーは検索に用いるそれぞれのマトリックス記述に対してthresholdスコア・パラメーター「コア類似性」および「マトリックス類似性」を定義できる。「コア配列」は、マトリックス記述内の最も保存された配列、典型的には四つの配列として定義される。コア類似性およびマトリックス類似性のスコアは、Quandtら、1995の記載に従って計算される。マトリックス記述と完全に一致するとスコア1.00となる(それぞれの配列位置は、マトリックス記述の位置において最も高度に保存されたヌクレオチドに相当する);「良好な」マトリックス記述との一致は通常、スコア>0.80の類似性を有する。マトリックス記述の高度に保存された位置におけるミスマッチは、殆ど保存されていない領域のミスマッチよりもマトリックス類似性スコアを減少させる。「最適化」マトリックス類似性スコアのthresholdは、偽陽性および偽陰性を最小化するように設計されているが、転写因子負荷マトリックスデータベースのそれぞれ個々のマトリックス記述に供給される(および自動的にユーザー定義マトリックスについて計算される)。
【0130】
本実施例で記述される配列解析に用いられるユーザー定義マトリックス・サブセットおよびそのマトリックススコアのパラメーター(「コア類似性threshold/マトリックス類似性threshold」と記述される)を以下に示す。このサブセットの変化は個々の設計工程で記述される。このサブセットは全ての脊椎動物マトリックスファミリー(ALL vertebrates.lib)および多くのユーザー定義マトリックスファミリー(U$)を含み、それらのIUPAC(国際純正応用化学連合)コンセンサス配列が適当に以下に示される。真核生物のスプライスドナー配列(5’、「スプライス-A」)およびアクセプター配列(3’、「スプライス-D」)はLodishら、2000(分子細胞生物学(Molecular Cell Biology)、第4版、Lodishら 2000、p.416)およびAlbertsら、1994(細胞の分子生物学(Molecula Biology of the Cell)、第3版、1994、Albertsら、p.373)に基づいて作出された。Kozak配列のマトリックス記述は、Kozak、1987に基づいて作られた(699の脊椎動物のメッセンジャーRNAに由来する5’非コーディング配列の解析。Nucleic Acids Research、1987、第15巻、p.8125)。二つのポリ(A)配列のマトリックス記述は、Tabaska、1999に基づくものであった(ヒトDNA配列中のポリアデニル化シグナルの検出、Tabaska JE、ZHANG MQ、Gene 1999、231(1-2):77-86)。大腸菌リボソーム結合配列(「EC-RBS」)のマトリックス記述は、Glass RE、1992(遺伝子機能:大腸菌とその遺伝的要素。カリフォルニア大学出版、1982、Robert E. Glass、p.95)およびRingquist、1992(大腸菌における翻訳開始;リボソーム結合部位内の配列。Ringquist, Stevenら、Molecular Microbiology、1992、6(9)、p.1221)に基づいて作製された。大腸菌プロモーターの−10および−35配列(「EC-P-10」および「EC-P-35」)および完全な大腸菌プロモーター配列、すなわち、16、17または18ヌクレオチドのスペーサー配列で分断された−35および−10配列(「EC-Prom」)のマトリックス記述は、Lisserら、1993に基づいて作られた(大腸菌mRNAプロモーター配列の編集。S. Lisser and H. Margalit、Nucleic Acids Research、1993、第21巻、第7号、p.1512)。制限酵素認識配列は、生化学試薬を供給する会社、例えばプロメガ・コーポレーションのカタログ、またはデータベース、例えばRebaseTM (
1122943613281_2.html
)で見出すことができる。
【0131】
ユーザー定義マトリックス・サブセットにおけるそれぞれのマトリックス記述のマトリックススコアのパラメーターは、目的の配列の設計基準に一致するように選択された。脊椎動物の転写因子結合配列を同定するためのスコア・パラメーター(0.75/最適化)およびいくつかのユーザー定義転写調節配列のためのよりストリンジェントなスコア・パラメーター(すなわち、増加したコアおよび/またはマトリックス類似性)を選択した。制限酵素認識配列は、マトリックスへの完全な一致だけが目的なので、マトリックス類似性thresholdが1.00とした。
【0132】
【表2】
【0133】
目的の配列で転写調節配列または制限酵素認識配列の同定を行うためにMatInspectorプロフェッショナルのようなプログラムを用いる場合、実際の目的の配列に加え、5’および3’隣接DNA配列を含むことが好ましい。隣接DNA配列の例としては、目的の配列が発現ベクターにクローニングされているならば予想される配列、および/または短い、漠然としたDNA配列、例えば「NNN」があげられる。これは、検索アルゴリズムが例えば目的の配列の5’または3’端で重複あるいはぴったり重なっている転写調節配列を検出しそこなう可能性を低くする。本実施例において、遺伝子配列(ORF)は5’および3’隣接DNA配列を含んでいた。本実施例で用いられる隣接配列を図4A-4Dに小文字で示した。
【0134】
MatInspectorプロフェッショナルを用いた配列中の転写調節配列または制限酵素認識配列の同定の後、これらの配列の一つ以上を、手動またはソフトウェアツールを用いて、同一アミノ酸をコードする別のコドンに置換することにより削除する。一つの転写調節配列または制限酵素認識配列の削除によりまた一つ以上の新たな転写調節配列または制限酵素認識配列が生ずる可能性があることを認識せねばならない。それゆえ、転写調節配列または制限酵素認識配列の同定および削除の工程は、最適配列になるまでしばしば繰り返される。
【0135】
本実施例において、SequenceShaper、転写因子結合配列または他のユーザー定義配列を削除するためのソフトウェアツールを用いた。これは、(MatInspector工程で用いられたユーザー定義のマトリックスサブセットに基づく)新たな配列を導入し、コードされるポリペプチドを変化させることなしに、MatInspectorプロフェッショナルを用いて同定されたいくつかの配列を同時に欠失させるものである。削除のために選択されたそれぞれの配列について、ユーザー定義パラメーターにより限定される可能な突然変異のリストが作成される。用いた標準パラメーターは、特に記載しない限り、以下のとおりであった:
SequenceShaper標準パラメーター:
・Remaining threshold: 0.70コア類似性/最適化-0.20マトリックス類似性(初期値)
・別の部位を挿入しない
・オープンリーディングフレーム(ORF)を保存する
「Remaining threshold」は、突然変異が導入された後にそれぞれの同定された配列が有するスコアを特定する。可能な突然変異が見出されないならば、これらのthresholdは増加する。「別の部位を挿入しない」ことにより、MatInspectorプロフェッショナルを用いた配列の同定に用いられるユーザー定義マトリックスに含まれる別の配列の生成が妨げられる。「オープンリーディングフレーム(ORF)を保存する」ことにより、提起されるべき、配列がコードするアミノ酸に影響しない唯一の突然変異が得られる。可能な突然変異のリストから、好ましいコドンを導入したものを好ましく選択した。マイナス鎖の大腸菌リボソーム結合配列および下流21塩基より短い位置のメチオニンコドンが続かないものは無視した。いくつかの転写調節配列または制限酵素認識配列は、新たな転写調節配列または制限酵素認識配列を導入せずに削除することは不可能であった。そのような場合には、記述した設計基準に最も一致するいずれかの配列を保守するように決定した。
【0136】
ModelInspectorプロフェッショナルを用いて、さらに解析を行った。このソフトウェアツールは、明確な距離と方向性を有する二つ以上の転写因子結合配列を含むDNA配列において、領域を定めるために、実験的に検証されたプロモーター分子のライブラリーを用いる。(Frech, K.ら、調節ユニットの高度に特異的なモデルを開発するための新規方法は機能プロモーターを含むGenBankの新しいLTRを検出する J. Mol. Biol.、1997、270(5)、674-687)。
【0137】
ここに記述したコンピュータープログラムを用いて、合成hGreen II遺伝子配列を設計する工程は、以下に述べるいくつかの任意の反復工程を含む。
【0138】
1.元の遺伝子(Green II;配列番号:21)のコーディング領域のコドン使用は哺乳動物で発現するために、アミノ酸配列を改変することなしに最適化されており、隣接配列がコーディング領域の5’および3’端に付加された(その結果、2M1-h(配列番号:3)を作製)。
【0139】
2.マトリックス・ファミリー・ライブラリーVer 2.3に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセット(NaeI、Kozak、ポリAシグナルを除く)を用いて、転写調節配列および制限酵素配列について、配列2M1-hを解析した。
【0140】
3.SequenceShaperの標準パラメーターを用いた上記の基準に従って、できるだけ多くの好ましくない配列を除去した(その結果、配列2M1-h1(配列番号:5)を作製)。
【0141】
4.さらに好ましくない配列をSequenceShaperを用いて削除し、マトリックス類似性thresholdを最適化0.01にあげた(その結果、配列2M1-h2(配列番号:7)を作製)。
【0142】
5. さらに好ましくない配列をSequenceShaperを用いて削除し、コア類似性thresholdを0.75に、マトリックス類似性thresholdを最適化0.01にあげた(その結果、配列2M1-h3(配列番号:9)を作製)。
【0143】
6.配列2M1-h3を、プロモーター・モジュール・ライブラリーVer 2.2およびゲノムリピート・ライブラリーVer 1.0に付随のModelInspectorプロフェッショナル リリース4.7.8を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートの存在について、解析した。プロモーター・モジュールまたはゲノムリピートを見出すことはできなかった。
【0144】
7.配列2M1-h3を、2位のアミノ酸のセリンのコドン(AGC)をグリシンのコドン(GGC)に変え、よりKozakコンセンサス配列に一致させた;これはまた、NaeI制限酵素配列を遺伝子配列の5’端に重複させて導入する(その結果、配列2M1-h4(配列番号:11)を作製)。
【0145】
8.マトリックス・ファミリー・ライブラリーVer 2.3に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセット(NaeI、Kozak、ポリAシグナルを除く)を用いて、転写調節配列および制限酵素配列について、配列2M1-h4を解析した。
【0146】
9.内部NcoI配列を配列2M1-h4から、SequenceShaperの標準パラメーターを用いて削除した(その結果、配列2M1-h5(配列番号:13)を作製)。
【0147】
10.配列2M1-h5を、プロモーター・モジュール・ライブラリーVer 2.2およびゲノムリピート・ライブラリーVer 1.0に付随のModelInspectorプロフェッショナル リリース4.7.8を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートの存在について、解析した。プロモーター・モジュールまたはゲノムリピートを見出すことはできなかった。
【0148】
11.配列2M1-h5を、5’および3’隣接領域を変えることにより、および227位のリジンのコドン(AAG)をグリシンのコドン(GGC)に変え、新しいNaeI制限酵素配列を導入し、例えば融合タンパク質の作製のためのクローニング配列を提供することにより、さらに修飾した(その結果、配列2M1-h6(配列番号:15)を作製)。
【0149】
12.マトリックス・ファミリー・ライブラリーVer 2.4に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセット(NaeIを除く)を用いて、転写調節配列および制限酵素配列について、配列2M1-h6を解析した。アップデートしたマトリックス・ファミリー・ライブラリーのため、いくつかの新しい転写因子結合配列が同定された。
【0150】
13.配列2M1-h6を、プロモーター・モジュール・ライブラリーVer 2.3およびゲノムリピート・ライブラリーVer 1.0に付随のModelInspectorプロフェッショナル リリース4.7.9を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートについて、解析した。プロモーター・モジュールおよびゲノムリピートを見出すことはできなかった。
【0151】
14.配列2M1-h6を5’隣接領域を変えることによりさらに修飾した(その結果、配列2M1-h7(配列番号:17)を作製)。
【0152】
15.マトリックス・ファミリー・ライブラリーVer 2.4に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセットを用いて、転写調節配列および制限酵素配列について、配列2M1-h7を解析した。
【0153】
16.できる限り多くの配列を、SequenceShaperにより、最初に標準パラメーターを、次いでストリンジェンシーを弱めたパラメーターを用いて、削除した(Remaining threshold:0.75コア類似性/最適化-0.01マトリックス類似性)。
【0154】
17.残りの好ましくない転写調節配列を2M1-h7から削除するために、脊椎動物の転写因子結合配列と制限酵素配列だけを含むユーザー定義マトリックス・サブセットを用いて、前の二つの工程を繰り返した。この結果、別の優先度の低い配列、例えば大腸菌リボソーム結合およびプロモーター配列、スプライシング・ドナーおよびアクセプター配列、およびポリ(A)配列を導入することにより別の優先度の高い転写調節配列を除去した(それにより配列2M1-h8(配列番号:19);hGreen IIと呼ばれる領域をコードする遺伝子を作製した)。
【0155】
18.配列2M1-h8を、プロモーター・モジュール・ライブラリーVer 2.3に付随のModelInspectorプロフェッショナル リリース4.7.9を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートについて、解析した。プロモーター・モジュールを見出すことはできなかった。
【0156】
19.5’および3’NNNsを除く2M1-h8の配列を、ブルーへロン・バイオテクノロジー社(22310 20th Avenue SE #100, Bothell, WA 98021)で、その独自の合成技術を用いて合成した。
【0157】
最終的に合成された合成遺伝子のバージョンをここではhGreen IIとして示す。hGreen IIの最終的な配列は、3個の脊椎動物転写因子結合配列を有し、一方、元のGreen II分子は67個の脊椎動物転写因子結合配列を含む。図2A-2Bは、hGreen IIと元のGreen IIをコードするDNAのアラインメントを示し、図3はhGreen IIと元のGreen IIのDNAによりコードされるアミノ酸のアラインメントを示し、図4A-4Dは、それぞれの隣接配列を含む、GreenIIおよび2M1-h8の中間体バージョンをコードする各種DNA配列のアラインメントを示す。
【0158】
図3に示したように、hGreen IIと元のGreen IIの間には、アミノ酸の位置2および227で、たった二つのアミノ酸の違いしかない。アミノ酸2の位置で、hGreen IIはGly(GGC)を有し、元のGreen IIは同位置でSer(AGT)を有する。このコドンで、DNA配列は改善した発現を示すためのコザック(Kozak)配列を加えるように変えられた。さらに、アミノ酸227の位置で、hGreen IIはGly(GGC)を有し、一方、元のGreen IIは同位置でLys(AAG)を有する。このDNA配列への変化は新規のNaeI精原配列を加え、例えば融合タンパク質を作出するためのクローニング部位を提供する。
【実施例2】
【0159】
ベクター構築物を、合成hGreen II遺伝子をプラスミドpCI-Neo哺乳動物発現ベクター(プロメガ社)にクローニングすることにより作製した。さらに、ベクター構築物を、元のGreen II遺伝子をプラスミドpCI-Neo哺乳動物発現ベクター(プロメガ社)にクローニングすることにより作製した。図5A-5Bおよび6A-6Bに示したように、hGreen II構築物はCHO細胞中で元のGreen II構築物よりも僅かに高い発現を示した。CHO細胞を用いた最初の実験で、元のGreen IIは19.8%のトランスフェクション効率を示し(図5A)、hGreen IIは21.2%のトランスフェクション効率を示した(図5B)。CHO細胞を用いた第二の実験において、元のGreen IIは24.2%のトランスフェクション効率を示し(図6A)、hGreen IIは25.5%のトランスフェクション効率を示した(図6B)。より重要なことに、蛍光の程度はhGreen II構築物で形質転換した細胞でより高かった。図5Aにおいて、22.4%の元のGreen IIがトランスフェクトしていない細胞より3 full logs高く蛍光を発し、一方、図5Bは、ヒト化Green IIをトランスフェクトした細胞の24.6%がトランスフェクトしていない細胞より3 full logs高く蛍光を発することを示している。図6Aおよび6Bでは、トランスフェクトしていない細胞に対して3 full logs蛍光を発する細胞のパーセンテージはそれぞれ、24.2%と28.9%である。NIH3T3細胞では、このマウス細胞系でこのプラスミドでの効率として、元のGreen IIは10.5%のトランスフェクション効率を示し(図7A)、hGreen IIは9.7%のトランスフェクション効率を示した(図7B)。しかし、トランスフェクトしていない対照に対して3 logsで蛍光を発する細胞のパーセンテージは、元のプラスミドに関しては6.7%であり、hGreen IIに関しては14.4%で、115%の増加である。そのような違いは、これらのいずれもが核酸配列が最適化されていない種であるので、予想されることは、注目すべきである。
【0160】
図8A-8Fは、元のGreen IIベクター構築物およびhGreen IIベクター構築物を用いてトランスフェクトしたNIH3T3細胞のトランスフェクション後2日、3日および6日目のイメージを示す。それぞれの時点において、図7と一致して、hGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞は元のGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞よりも高い蛍光タンパク質の発現を示す。
【0161】
図9は、それぞれルシフェラーゼレポーターを共トランスフェクトした、濃度を増加したhGreen IIベクター構築物およびGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞を示すグラフである。ルシフェラーゼ活性をY軸で、GFP構築物の相対的%をX軸で示した。この実験は、GFPプラスミドが非生産的な転写因子結合という事象の「受信装置」として作用しているかを間接的に測定するものである。細胞転写因子がGFPプラスミドに高度に結合するならば、ルシフェラーゼの発現は弱められる。この図は、hGreen IIの存在下で、GFPの存在量とは無関係に、ルシフェラーゼの発現は比較的安定していることを示している。元のGreen IIのレベルが増加すると、ルシフェラーゼの発現は弱められる。この発見は、低発現転写物を研究したいならば重要である;転写因子を非生産的に用いるレポーターはアッセイの結果を損なうであろう。
【図面の簡単な説明】
【0162】
【図1】コドンおよびそれらに対応するアミノ酸を示す。
【図2A】ヒト化緑色蛍光タンパク質をコードするDNA配列(配列番号:1)およびMontastraea cavernosaタンパク質に由来するタンパク質(Green II)をコードするDNA配列(配列番号:21)の配列アラインメントを示す。ヒト化hGreen IIをGreen IIから作出した。このアラインメントにおいて、アラインされた配列間の違いを、「コンセンサス」行のモノマーを消すことによって示した。
【図2B】ヒト化緑色蛍光タンパク質をコードするDNA配列(配列番号:1)およびMontastraea cavernosaタンパク質に由来するタンパク質(Green II)をコードするDNA配列(配列番号:21)の配列アラインメントを示す。ヒト化hGreen IIをGreen IIから作出した。このアラインメントにおいて、アラインされた配列間の違いを「コンセンサス」行のモノマーを消すことによって示した。
【図3】hGreen IIのDNA配列(配列番号:2)およびGreen IIのDNA配列(配列番号:22)によりコードされるアミノ酸のアミノ酸アラインメントを示す。このアラインメントにおいて、アラインされる配列間の違いを「コンセンサス」行のモノマーを消すことによって示した。
【図4A】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図4B】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図4C】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図4D】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図5】Green IIベクター構築物(図5A)およびhGreen IIベクター構築物(図5B)をトランスフェクトした50,000個のCHO細胞の、トランスフェクション効率(上/大きな長方形)およびトランスフェクション24時間後のFACSアッセイによる蛍光の対数を示すグラフである。
【図6】Green IIベクター構築物(図6A)およびhGreen IIベクター構築物(図6B)をトランスフェクトした50,000個のCHO細胞の、トランスフェクション効率(上/大きな長方形)およびトランスフェクション24時間後のFACSアッセイによる蛍光の対数を示すグラフである。
【図7】Green IIベクター構築物(図7A)およびhGreen IIベクター構築物(図7B)をトランスフェクトした50,000個のNIH3T3細胞の、トランスフェクション効率(上/大きな長方形)およびトランスフェクション24時間後のFACSアッセイによる蛍光の対数を示すグラフである。
【図8】Green IIベクター構築物およびhGreen IIベクター構築物をトランスフェクトしたNIH3T3細胞の2、3および6日目におけるイメージを示す。
【図9】ルシフェラーゼレポーターを足した濃度を増加したGreen IIベクター構築物およびhGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞を示すグラフである。ホタルのルシフェラーゼを細胞毒性のレポーターとして用いた。
【配列表】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、参照してここに組み込まれる、2000年8月24日出願の米国特許出願第09/645,706号の米国特許法第120条に基づく優先権を主張する。
【0002】
(参考文献)
文中でカッコ内の第一著者の姓で記される文献の完全な参考文献一覧を参考文献の項に記載した。
【0003】
本発明は生化学アッセイおよび試薬の分野に関する。より具体的には、本発明は蛍光タンパク質およびその利用方法に関する。
【背景技術】
【0004】
転写、すなわちDNA配列からのRNA分子の合成は、遺伝子発現の最初の工程である。DNAの転写を調節する遺伝子要素としては、プロモーター、ポリアデニル化シグナル、転写因子結合部位およびエンハンサーがあげられる。プロモーターは、転写の特異的開始をつかさどり、典型的には三つの一般的な領域からなる。コアプロモーターは、RNAポリメラーゼとその補因子がDNAに結合する場所である。コアプロモーターのすぐ上流は、近接プロモーターであり、ポリメラーゼ複合体を順に補充する活性化複合体の集合に機能を果たすいくつかの転写因子結合部位を含む。近接プロモーターのさらに上流に位置する末端プロモーターもまた、転写因子結合部位を含む。転写開始同様、転写終結およびポリアデニル化は特異的な遺伝子要素である。エンハンサーは典型的には、エンハンサーとプロモーターが同一DNA分子上に位置するかぎり、エンハンサーのプロモーターに対する方向と距離とは無関係に、応答するプロモーターの転写レベルを顕著に増加できる複数の転写因子結合部位を含む。遺伝子から産生される転写物の量はまた、最も重要なものは介在配列(イントロン)をスプライスドナーとスプライスアクセプターの間の一次転写物から除去するRNAスプライシングであるが、この転写後の機構により調節される。プロモーター、エンハンサー、ポリアデニル化部位、転写因子結合部位およびRNAスプライス部位を含むDNA分子内にある遺伝子要素は、典型的には認識配列で相互に関連付けられている。これらの配列は一般的には、遺伝篩要素の機能に必須の構成であると信じられている。それゆえ、例えば、プロモーター配列は特異的配列またはプロモーター機能と相互関連することが見出された特異的配列または配列群である。
【0005】
自然の選択は、表現型レベルで生ずる遺伝子型環境相互作用が個体の繁殖成功度に差をもたらし、それゆえ集団の遺伝子プールに変化がもたらされるという前提である。自然の選択により作用される核酸分子のいくつかの特徴として、コドンの使用頻度、RNAの二次構造、イントロンのスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用があげられる。遺伝子コードの縮重性のために、遺伝子のコーディング領域内の突然変異は、自然の選択により、対応するアミノ酸配列を変化させることなくこれらの特徴を最適化するように生ずる。
【0006】
いくつかの条件下で、ポリペプチドをコードする天然のヌクレオチド配列を別の用途のためにより適合させるように合成的に変化させるのに有用である。一般的な例は、外来宿主細胞中で遺伝子を発現する場合、そのコドンの使用頻度を変えることである。遺伝子コードの過剰な存在により、アミノ酸が複数のコドンによりコードされるが、異なる生物ではいくつかのコドンは他のコドンよりも有利である。非天然の宿主細胞におけるタンパク質への翻訳の効率を、コドンの使用頻度を調整するが、その遺伝子産物を維持することにより、実質的に増加できることが見出された(米国特許第5,096,825号、同第5,670,356号、および同第5,874,304号)。
【0007】
しかし、コドンの使用を変えることは、すなわち、意図しない導入が不適切な転写調節配列の合成核酸分子にもたらされる恐れがある。これは逆に転写に影響し、合成DNAの変則的な発現をもたらす。変則的な発現は、正常または予想されるレベルの発現からの逸脱と定義される。例えば、プロモーター下流に位置する転写因子結合部位はプロモーター活性に影響することが示されている(Michaelら、1990;Lambら、1998;Johnsonら、1998;Jonesら、1997)。さらに、エンハンサー配列にとって、活性に影響を与え、プロモーター非存在下でDNA転写レベルを上昇させること、または転写調節配列の存在にとって、プロモーター非存在下で遺伝子発現の基礎レベルを増加させることは異常なことではない。
【0008】
蛍光タンパク質は光により励起された際に蛍光を発するタンパク質である。蛍光タンパク質を、多くのアッセイや診断手法で、および遺伝子発現やタンパク質の局在性を研究するために用いることができる。蛍光タンパク質が、それが単離されたのとは遺伝的に離れた種で発現される場合に、その存在に問題が生ずる。この状況では、典型的には低レベルで、蛍光タンパク質は発現され、蛍光タンパク質の検出は困難となる。この理由の一つは、コドンの優先度である。例えば、植物遺伝子はあるコドンよりも他のコドンを使用する傾向にある。加えて、植物内で高度に発現される遺伝子は、特有のコドンの優先度を有している(Wadaら、1990;Murrayら、1989)。動物遺伝子もまた、コドンの優先度を示す。例えば、ヒトもまたコドンの優先度を示す。
【0009】
それゆえ、必要とされるのは、蛍光タンパク質をコードし、蛍光ポリペプチドをコードする元の核酸配列とは異なるコドン組成を有する合成核酸分子である。好ましくは、改変したコドン使用を有する合成核酸分子は、特定の宿主細胞中の発現に関して不適切な、または意図しない転写調節配列をもたない。これが、蛍光タンパク質が元々単離された生物に由来する材料とは異なる宿主細胞中での高レベルの発現を可能にする。その上、高レベル発現する蛍光タンパク質は、蛍光タンパク質の改良された検出を可能にする。
【0010】
文献
Altschul et al. (1990) J. Mol. Biol. 215: 403.
Altschul et al. (1997) Nucl. Acids Res. 25: 3389.
Altschul et al. (1992) Current Protocols in Molecular Biology. John Wiley & Sons, New York.
Boshart et al. (1985) Cell 41: 521.
Corpet et al. (1988) Nucl. Acids Res. 16: 881.
Dijkema et al. (1985) EMBO J., 4: 761.
Fradkov, A.F., et al. (2000) FEBS Letters 479: 127.
Gibbs, P.D.L., et al. (1994) Mol. Mar. Biol. Biotechnol. 3: 307.
Gibbs, P.D.L., et al. (2000) Marine Biotechnology 2: 107.
Gorman et al. (1982) Proc. Natl. Acad. Sci. USA 79: 6777.
Higgins et al. (1988) Gene 73: 237.
Higgins et al. (1989) CABIOS 5: 151.
Huang et al. (1992) CABIOS 8: 155.
Johnson et al. (1998) Mol. Reprod. Devel. 50: 377.
Jones et al. (1997) Mol. Cell. Biol. 17: 6970.
Karlin and Altschul (1990) Proc. Natl. Acad. Sci. USA 87: 2264.
Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873.
Kim, et al. (1990) Gene 91: 217.
Lamb et al. (1998) Mol. Reprod. Devel. 51: 218.
Liu, H.S. et al. (1999) Biochemical & Biophysical Research Communication 260: 712.
Maniatis et al. (1987) Science 236: 1237.
Matz, M.V., et al. (1999) Nature Biotech 17: 969.
Michael et al. (1990) EMBO J. 9: 481.
Mizushima and Nagata (1990) Nucl. Acids Res. 18: 5322.
Myers and Miller (1988) CABIOS 4: 11.
Needleman and Wunsch (1970) J. Mol. Biol. 48: 443.
Ormo, M. et al. (1996) Science 273: 1392.
Pearson et al. (1994) Meth. Mol. Biol. 24: 307.
Pearson and Lipman (1988) Proc. Natl. Acad. Sci. USA 85: 2444.
Smith and Waterman (1981) Adv. Appl. Math. 2: 482.
Uetsuki et al. (1989) J. Biol. Chem. 264: 5791.
Voss et al. (1986) Trends Biochem. Sci., 11: 287.
Yang, F., Moss, L.G. and Phillips, G.N.,Jr, (1996) Nature Biotech 14: 1246.
【0011】
全ての刊行物、特許および特許出願が参照してここに取り込まれる。明細書において、本発明は、発明のある好ましい態様に関して記載され、例示のために詳細が記述されるが、本発明がさらなる態様を許容でき、発明の基本的な原理と離れることなく、この詳細がかなり改変されることは当業者にはあきらかであろう。
【発明の開示】
【課題を解決するための手段】
【0012】
本明細書の最後に記述される請求の範囲により定義される本発明は、上述の問題の少なくとも一つを解決することを目的とする。本発明は、蛍光ポリペプチドをコードする元の核酸配列(a parent nucleic acid sequence)のコドンと25%超の異なるコドン組成を有し、元の核酸配列の転写制御配列の平均数と比べて少なくとも3倍少ないそのような配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する合成核酸分子を提供する。好ましくは、合成核酸分子は、それが由来する元の(元のまたは別の合成)ポリペプチド(タンパク質)のアミノ酸配列と85%以上、好ましくは90%以上、最も好ましくは95%以上または99%以上同一であるアミノ酸配列を有するポリペプチドをコードする。それゆえ、いくつかの特異的なアミノ酸の変化はまた、合成核酸分子によりコードされるポリペプチドの有する特定の表現型の特徴を変化させるのに望ましいと考えられる。好ましくは、アミノ酸配列の同一性は、少なくとも100個以上の連続的なアミノ酸残基である。発明の一つの実施態様では、合成核酸分子中の異なるコドンは、好ましくは元の核酸配列中の対応するコドンと同一のアミノ酸をコードする。
【0013】
合成核酸分子中で減少される転写調節配列として、転写因子結合配列、イントロンスプライス配列、ポリ(A)付加配列、エンハンサー配列およびプロモーター配列のいずれかの組み合わせがあげられるが、これに限定されない。転写調節配列は当業者に周知である。本発明の合成核酸分子は元の核酸配列のコドン組成とは25%、30%、35%、40%超の、または45%超の、例えば50%、55%、60%またはそれ以上のコドンで異なる組成を有することが好ましい。本発明で用いられるコドンは、特定生物の同一アミノ酸の少なくとも一つの他のコドンよりも頻度高く用いられるコドンで、より好ましくは、その生物で低使用頻度のコドンではなく、合成核酸分子をクローニングしたり、その発現をスクリーニングしたりするために用いられる生物、例えば大腸菌中で低使用頻度のコドンではない。さらに、あるアミノ酸の好ましいコドン、すなわち、3個以上のコドンを有するアミノ酸は、他の(好ましくない)コドンよりもより頻度高く用いられる二つ以上のコドンを含む。合成核酸分子中のある生物で他の生物よりもより頻度高く用いられるコドンの存在から、より頻度高くこれらのコドンを用いる生物の細胞へ導入すると、これらの細胞中の元の核酸配列の発現よりも高いレベルで、これらの細胞中で発現される合成核酸分子が得られる。例えば、本発明の合成核酸分子は、同一条件下(例えば、細胞培養条件、ベクターのバックボーン等)、細胞または細胞抽出液に元の核酸配列の105%以上、例えば110%、150%、200%、500%あるいはそれ以上(例えば、1000%、5000%もしくは10000%)のレベルで発現される。
【0014】
本発明の一つの態様では、異なるコドンは哺乳動物でより頻度高く用いられるコドンであり、一方、別の態様では、異なるコドンは植物でより頻度高く用いられるコドンである。ある特定の型の哺乳動物、例えばヒトは、他の型の哺乳動物よりも好ましいコドンの異なるセットを有している。同様に、ある特定の型の植物は、他の型の植物よりも好ましいコドンの異なるセットを有している。加えて、ある別の型の因子、例えば植物または動物内で高度に発現している遺伝子は、低発現遺伝子よりも好ましいコドンの異なるセットを有している。本発明の一つの態様で、異なるコドンの大多数は、所望の宿主細胞中で好ましいコドンの一つである。哺乳動物(例えば、ヒト)および植物の好ましいコドンは、当業者には既知である(例えば、Wadaら、1990)。例えば、好ましいコドンとしては、CGC(Arg)、CTG(Leu)、TCT(Ser)、AGC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCC(Ala)、GGC(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAG(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)およびTTC(Phe)があげられるが、これに限定されない(Wadaら、1990)。それゆえ、本発明の好ましい「ヒト化」合成核酸分子は、好ましいヒトのコドン、例えばCGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGC、TTCまたはその組み合わせの数を増加することにより、元の核酸配列とは異なるコドン組成を有する。例えば、本発明の合成核酸分子は元の核酸配列に比べて、CTGまたはTTGのロイシンをコードするコドン、GTGまたはGTCのバリンをコードするコドン、GGCまたはGGTのグリシンをコードするコドン、ATCまたはATTのイソロイシンをコードするコドン、CCAまたはCCTのプロリンをコードするコドン、CGCまたはCGTのアルギニンをコードするコドン、AGCまたはTCTのセリンをコードするコドン、ACCまたはACTのスレオニンをコードするコドン、GCCまたはGCTのアラニンをコードするコドン、またはこれらの組み合わせの数が増加している。
【0015】
同様に、植物中でより頻度高く用いられるコドンの数が増加した合成核酸分子は、これに限定されないが、CGC(Arg)、CTT(Leu)、TCT(Ser)、TCC(Ser)、ACC(Thr)、CCA(Pro)、CCT(Pro)、GCT(Ser)、GGA(Gly)、GTG(Val)、ATC(Ile)、ATT(Ile)、AAG(Lys)、AAC(Asn)、CAA(Gln)、CAC(His)、GAG(Glu)、GAC(Asp)、TAC(Tyr)、TGC(Cys)、TTC(Phe)またはその組み合わせの数を増加することにより、元の核酸配列とは異なるコドン組成を有する(Murrayら、1989)。好ましいコドンは、異なる型の植物で異なる(Wadaら、1990)。
【0016】
コドンの選択は、例えばヌクレオチド置換の数の増加または転写調節配列の数の減少を所望するような多くの因子により影響を受ける。ある環境、例えば転写因子結合配列の削除を認めるような環境下で、好ましくないコドンを好ましいコドンとは別のコドンまたは最も好ましいコドンとは別のコドンと置き換えるのが望ましい。別の環境、例えば合成核酸分子の異なるバージョンのコドンを作出する環境下で、好ましいコドン対は、上述の基準だけでなく、最も多くのミスマッチ塩基に基づいて選択される。
【0017】
他の生物よりもある生物においてより頻度高く用いられる、合成核酸分子中のコドンの存在から、これらのコドンを用いる生物の細胞へ導入されると、元の核酸配列の発現レベルよりも高いレベルで細胞に発現される合成核酸分子が得られる。
【0018】
蛍光タンパク質である、本発明の合成核酸分子の一つの態様において、合成核酸分子は元の緑色蛍光タンパク質核酸配列のコドン組成とは異なる組成を有する緑色蛍光タンパク質をコードする。本発明の合成緑色蛍光タンパク質核酸分子は、2の位置においてアミノ酸グリシンをコードしていてもよいし、または227の位置においてアミノ酸グリシンをコードしていてもよいし、あるいは2の位置のアミノ酸グリシンと227の位置のアミノ酸グリシンの組合せであってもよい。好ましい合成緑色蛍光タンパク質核酸分子としてMontastraea cavernosa由来のものがあげられるが、これに限定されない。
【0019】
本発明はまた、ベクター構築物を提供する。本発明のベクター構築物は、元のベクターバックボーンに比べて、少なくとも3倍少ない転写調節配列(at least 3-fold fewer transcriptional regulatory sequence)を有する合成ベクターバックボーンを含有する。ベクター構築物はまた、蛍光ポリペプチドをコードする元の核酸配列と25%超のコドンが異なるコドン組成を有し、元の核酸配列においてその配列の平均数と比べて少なくとも3倍少ない転写調節配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する核酸分子を含有する。
【0020】
プラスミドがさらに提供される。プラスミドは蛍光ポリペプチドをコードする元の核酸配列と25%超のコドンが異なるコドン組成を有し、元の核酸配列においてその配列の平均数と比べて少なくとも3倍少ない転写調節配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する核酸分子を含有する。
【0021】
さらに、発現ベクターが提供される。発現ベクターは蛍光ポリペプチドをコードする元の核酸配列と25%超のコドンが異なるコドン組成を有し、元の核酸配列においてその配列の平均数と比べて少なくとも3倍少ない転写調節配列を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する核酸分子を含有する。核酸分子は細胞のプロモーター機能に連結される。
【0022】
また、発現ベクターを含有する宿主細胞および適当なコンテナ中に発現ベクターを含有するキットが提供される。
【0023】
本発明はまた、元の(野生型または他の合成のいずれかの)核酸配列を遺伝学的に変化させることにより本発明の合成核酸分子を調製する方法を提供する。方法は蛍光タンパク質をコードする合成核酸分子を調製するために用いられる。本発明の方法は、いずれかのタンパク質(例えば、蛍光タンパク質)のオープンリーディングフレームのコドンの使用頻度を変化させ、転写調節配列を減少させるために、またはベクターバックボーンの転写調節部位の数を減少させるために用いられる。好ましくは、合成核酸分子中のコドンの使用頻度は、元の核酸分子に比べ潜在的な転写調節配列の数を減少させる一方、その核酸分子の発現が所望される宿主生物のコドンの使用頻度に反映するように変えられる。
【0024】
それゆえ、本発明はオープンリーディングフレームを含有する合成核酸分子を調製する方法を提供する。本方法は、蛍光ポリペプチドをコードする元の核酸配列中の複数の転写調節配列を変化させ、元の核酸配列に比べて少なくとも3倍少ない転写調節配列を有する合成核酸分子を得ることを特徴とする。本発明はまた、転写調節配列の数を減少させた合成核酸配列中の25%超のコドンを変化させ、さらなる合成核酸分子を得ることを特徴とする。改変されるコドンは転写調節配列の数を増加させない。さらなる合成核酸分子は、元の核酸配列によりコードされるポリペプチドと少なくとも85%のアミノ酸同一性を有するポリペプチドをコードする。
【0025】
あるいは、本方法は、蛍光ポリペプチドをコードする元の核酸配列の25%超のコドンを変化させ、コドンを改変した合成核酸分子を得ることを特徴とする。本方法はまた、コドン改変合成核酸分子中の複数の転写調節配列を変化させ、元の核酸配列中の対応するコドンとは異なるコドンを有する合成核酸分子に比べて、少なくとも3倍少ない転写調節配列を有する、更なる合成核酸分子を得ることを特徴とする。さらなる合成核酸分子は、元の核酸配列によりコードされる蛍光ポリペプチドと少なくとも85%のアミノ酸同一性を有するポリペプチドをコードする。
【0026】
以下に記述するように、本発明の方法は、Montastraea cavernosaの緑色蛍光タンパク質(McGFP)核酸配列とともに、ヒト細胞でより容易に発現される合成核酸を産生するために用いられた。ここに開示されるのは、高度に関連したポリペプチドをコードする合成核酸分子配列である。これらの合成核酸分子として、本発明の方法における中間体およびhGreen IIをあげることができる。これらの合成核酸分子は、互いに比べると多くの異なるヌクレオチドを有している。
【0027】
本発明の方法により、他の所望の物理的または生化学的特性(タンパク質の半減期を含む)に負の影響を与えることなしに、哺乳動物での発現のレベルを著しく促進し、既知の転写調節配列の数を大きく減じた合成核酸分子が産出された。
【0028】
本発明はまた、高度に関連したポリペプチドをコードする少なくとも二つの合成核酸分子を提供するが、この合成核酸分子では、互いに比べると多くのヌクレオチドの違いが増加している。これらの違いにより、これらの分子が両者とも細胞中に存在する場合(すなわち、それらが合成核酸分子の「コドンの異なった」バージョンである場合)、二つの合成核酸分子間の組換え頻度が減少する。それゆえ本発明は、ポリペプチドをコードする元の核酸配列のコドンの異なったバージョンである、少なくとも二つの合成核酸分子を調製する方法を提供する。本方法は、元の核酸配列を変化させ、元の核酸配列中に存在するコドンの数に比較して、選択された宿主細胞中でより頻度高く用いられる最初の複数のコドンの数を増加した第一の核酸分子を得る特徴を有する。状況に応じて、第一の合成核酸分子はまた、元の核酸配列に比べ、転写調節配列の数が減少している。元の核酸配列はまた、元の核酸配列中のコドンの数に比較して、宿主細胞中でより頻度高く用いられる第二の複数のコドンの数を増加した第二の合成核酸分子を得るために改変されている。第一の複数のコドンは第二の複数のコドンとは異なる。第一および第二の合成核酸分子は同一のポリペプチドをコードする。状況に応じて、第二の合成核酸分子は、元の核酸配列に比べ、転写調節配列の数が減少している。合成分子のいずれか、または両者はさらに修飾されうる。
【発明を実施するための最良の形態】
【0029】
定義:
本発明のために、以下の定義を適用する:
ここで用いられる用語「遺伝子」は、ポリペプチドまたはタンパク質前駆体の生産に必要なコーディング配列を含有するDNA配列を意味する。ポリペプチドは、所望のタンパク質活性が保持される限り、全長コーディング配列により、またはコーディング配列のいかなる部分によりコードされる。
ここで用いられる「アミノ酸」は、J. Biol. Chem., 243: 3557-59 (1969)中の標準的なポリペプチド命名法に従って記載される。
【0030】
標準一文字コード「A」、「C」、「G」、「T」、「U」および「I」は、ここではそれぞれ、ヌクレオチド アデニン、シトシン、グアニン、チミン、ウラシルおよびイノシンとして用いられる。オリゴヌクレオチドまたはポリヌクレオチド配列は5’端から3’端へ書かれる。
【0031】
ここで同定される全てのアミノ酸は天然のL-型である。標準的なポリペプチド命名法に従って、アミノ酸残基の略号を以下の対応表に示す。
【表1】
【0032】
「単離された核酸」または「単離されたポリヌクレオチド」のように、核酸に関して用いられる場合の用語「単離された」は、そのソース中に通常関連する少なくとも一つの混在物質から同定され、分離された核酸配列を意味する。一方、非単離核酸、例えばDNAおよびRNAは、それらが天然に存在する状態中に見出される。例えば、一定のDNA配列、例えば遺伝子は、隣接する遺伝子に近接して、宿主細胞染色体上に見出される;RNA配列、例えば特異的なタンパク質をコードする特異的なmRNA配列は、多くのタンパク質をコードする非常に多くの他のmRNA混合物として細胞中に見出される。しかし、単離された核酸は、例として、核酸が天然の細胞の核酸とは異なる染色体の位置にある核酸を通常発現する細胞中の、または天然に見出されるのとは異なる核酸配列に同様に隣接するような核酸を含む。単離された核酸は一本鎖または二本鎖の形態で存在する。単離された核酸がタンパク質を発現するために用いられる場合、オリゴヌクレオチドは最低でも、センス鎖またはコーディング鎖を含み、すなわち、オリゴヌクレオチドは一本鎖であってよいが、センス鎖およびアンチセンス鎖の両者を含み、すなわち、オリゴヌクレオチドは二重鎖であってよい。
【0033】
「単離されたタンパク質」または「単離されたポリペプチド」のようにポリペプチドについて用いられる場合の用語「単離された」は、そのソース中に通常関連する少なくとも一つの混在物質から同定され、分離されたポリペプチドを意味する。それゆえ、単離されたポリペプチドは、天然に見出されるタンパク質とは異なる形態または環境で存在する。一方、単離されていないポリペプチド、例えばタンパク質および酵素は、それらが天然に存在する状態で見出される。
【0034】
用語「精製された」または「精製」は、目的の組成物、例えばタンパク質または核酸から夾雑物を除去する任意の工程の結果を意味する。試料中の精製された組成物のパーセンテージは、これにより増加する。
【0035】
本発明の核酸に関して、用語「核酸」は、DNA、ゲノムDNA、cDNA、RNA、mRNAおよび上記の各種核酸のハイブリッドを意味する。核酸は合成起源であっても天然起源であってもよい。ここで用いられるような核酸はヌクレオチドが共有結合した配列であり、一つのヌクレオチドのペントースの3’位がリン酸ジエステル基により次のペントースの5’位と結合し、ヌクレオチド残基(塩基)が特定の順序で結合、すなわち直線状のヌクレオチドの順序に存在する。ここで用いられる「ポリヌクレオチド」は、約100ヌクレオチド超の長さの配列を含む核酸である。ここで用いられる「オリゴヌクレオチド」は、短いポリヌクレオチドまたはポリヌクレオチドの部分である。オリゴヌクレオチドは典型的には、約2から約100塩基の配列を含む。用語「オリゴ」は、用語「オリゴヌクレオチド」の代わりに時折用いられる。
【0036】
核酸分子は、核酸のリン酸ジエステル結合が置換モノヌクレオチドのペントース環の5’炭素と3’炭素に生じるので、「5’末端(5’端)と3’末端(3’端)」を有するといわれる。新しい結合が5’炭素にあるポリヌクレオチドの末端がその5’末端ヌクレオチドである。新しい結合が3’炭素にあるポリヌクレオチドの末端がその3’末端ヌクレオチドである。ここで用いられる末端ヌクレオチドは、3’または5’末端の末端位置のヌクレオチドである。
【0037】
ここで用いられるように、核酸配列は、より大きいオリゴヌクレオチドまたはポリヌクレオチドの内部であっても、5’端と3’端を有するといわれる。直鎖DNAまたは環状DNAのいずれかにおいて、個々の要素は「下流」または3’要素の「上流」または5’にあるといわれる。この用語は、転写がDNA鎖に沿って5’から3’に進行することを反映する。典型的には、連関する遺伝子の転写を行うプロモーターとエンハンサー要素は、一般にコーディング領域の5’または上流に位置する。しかし、エンハンサー要素は、プロモーター要素とコーディング領域の3’に位置する場合でさえ、その効果を発揮することができる。転写停止およびポリアデニル化シグナルはコーディング領域の3’または下流に位置する。
【0038】
ここで用いられる用語「コドン」は、ポリペプチド鎖へ取り込まれる特定のアミノ酸を同定する3個のヌクレオチドの配列、または開始または停止シグナルからなる基本的な遺伝子コード単位である。図1はコドン表である。構造遺伝子をさす場合に用いられる用語「コーディング領域」は、mRNA分子の翻訳の結果としてのポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列を意味する。典型的には、コーディング領域は、5’側で開始メチオニンをコードするヌクレオチドのトリプレット「ATG」、3’側で停止コドン(例えば、TAA、TAG、TGA)につながっている。ある場合に、コーディング領域はまた、ヌクレオチドのトリプレット「TTG」で始まることが知られている。
【0039】
「タンパク質」および「ポリペプチド」で、長さまたは翻訳後修飾、例えばグリコシル化またはリン酸化とは無関係に、アミノ酸の任意の鎖を意味する。本発明の合成遺伝子はまた、元のタンパク質の変異体またはそのポリペプチド断片をコードする。好ましくは、そのようなタンパク質ポリペプチドは、それが由来する元のタンパク質またはポリペプチドのアミノ酸配列と85%以上、好ましくは90%以上、最も好ましくは95%以上もしくは99%以上同一であるアミノ酸配列を有している。
【0040】
ポリペプチド分子は、ペプチド結合が第一のアミノ酸残基のバックボーンのアミノ基と第二のアミノ酸残基のバックボーンのカルボキシル基の間に生ずるので、「アミノ末端」(N-末端)と「カルボキシ末端」(C-末端)を有すといわれる。ポリペプチド配列に関して、用語「N-末端」および「C-末端」は、それぞれポリペプチドのN-末端およびC-末端領域の部分を含むポリペプチドの領域を意味する。ポリペプチドのN-末端領域の部分を含む配列は、大部分がポリペプチド鎖のN-末端の半分のアミノ酸を含むが、そのような配列に限定されない。例えば、N-末端配列は、ポリペプチドのN-末端の半分およびC-末端の半分の両方の塩基を含むポリペプチド配列の内部部分を含むことができる。童謡のことがC-末端に適用できる。N-末端およびC-末端領域は、必要ではないが、それぞれポリペプチドの根本的なN-末端およびC-末端を定義するアミノ酸を含む。
【0041】
ここで用いられる用語「野生型」は、天然に存在するソースから単離された遺伝子または遺伝子産物の特性を有する遺伝子または遺伝子産物を意味する。野生型遺伝子は、自然集団中に最も頻度高く観察される遺伝子であり、それゆえ任意に遺伝子の野生型が決められる。一方、用語「突然変異体」は、野生型の遺伝子または遺伝子産物と比べて、配列および/または機能的特性に修飾、すなわち改変された特性を示す遺伝子または遺伝子産物を意味する。天然に存在する突然変異体が単離されることは注目される;これらは野生型遺伝子または遺伝子産物と比較した場合に改変された特性を有することにより同定される。
【0042】
用語「相補的な」または「相補性」は、塩基対規則により関連するヌクレオチドの配列について用いられる。例えば、5’「A-G-T」3’の配列について、配列3’「T-C-A」5’は相補的である。相補性は、核酸の塩基のいくつかだけが塩基対規則にマッチする「部分的」であってもよい。あるいは、核酸の間で「完全な」または「全体の」相補性であってもよい。核酸の鎖間の相補性の程度は、核酸の鎖間におけるハイブリダイゼーションの効率および強度に重要な効果を有する。これは、増幅反応、ならびに核酸のハイブリダイゼーションに依存する検出方法に特に重要である。
【0043】
ここで用いられる用語「組換えタンパク質」または「組換えポリペプチド」は、組換えDNA分子から発現されるタンパク質分子を意味する。一方、用語「天然のタンパク質」はここでは、天然に存在する(すなわち、非組換えの)ソースから単離されたタンパク質を示すように用いられる。分子生物学技術が、天然型のタンパク質と比べて同一の性質を有する組換え型のタンパク質を製造するために用いられる。
【0044】
用語「融合タンパク質」および「融合パートナー」は、外来タンパク質断片、例えば第二のタンパク質からなる融合パートナー(例えば、蛍光または非蛍光のタンパク質またはペプチド)と連結した、目的のタンパク質、例えば蛍光タンパク質を含むキメラタンパク質を意味する。融合パートナーは、宿主細胞で発現する際にタンパク質の溶解度を増加し、例えば、祝主細胞または培養上清、もしくは両者から組換え融合タンパク質を精製するためのアフィニティータグを提供する。所望ならば、融合パートナーは目的のタンパク質から、当業者には既知の各種酵素または化学的手段により除去される。さらに、外来タンパク質断片は、蛍光タンパク質と融合した目的の別のタンパク質であってよい。これにより、蛍光を用いた外来タンパク質断片の追跡が可能となる。
【0045】
用語「核酸構築物」は、二つまたはそれ以上の異なるまたは区別できる核酸配列で構成され、当業者に既知の方法を用いて互いに連結または合成された核酸を示す。
【0046】
用語「元(の)(parent)」は、天然に存在する、または天然に存在しない核酸またはタンパク質を意味する。元は、合成核酸または合成タンパク質が産生される材料を示すために用いられる。
【0047】
ここで用いられる用語「細胞」、「細胞系」、「宿主細胞」は互換的に用いられ、これら全ての表示はこれら細胞の子孫または潜在的子孫を包含する。「形質転換細胞」で、DNA分子が導入される細胞(または原細胞)を意味する。任意に、本発明の合成遺伝子は、合成遺伝子によりコードされるタンパク質またはポリペプチドを製造できるトランスフェクトされた(「安定な」または「一過性の」)細胞系を作出するために、適当な細胞系へ導入されうる。ベクター、細胞および、そのような細胞系を構築するための方法は、当業者に周知であり、例えばAusubelら(1992)に記載されている。用語「形質転換体」または「形質転換細胞」は、転移の数に関係なく、元来の形質転換細胞に由来する一次形質転換細胞を包含する。全ての子孫は、故意の、または故意ではない突然変異のために、DNA含量が正確に同一ではない。それにもかかわらず、元来の形質転換細胞でスクリーニングされるのと同じ機能性を有する突然変異した子孫が形質転換体の定義に包含される。
【0048】
核酸は異なる型の突然変異を含むことが知られている。「点」突然変異は、野生型または元の配列の単一の塩基の位置におけるヌクレオチド配列の変化を意味する。突然変異はまた、一つ以上の塩基の挿入または欠失を意味し、その結果、核酸配列は野生型または元の配列とは異なる。
【0049】
ここで用いられる用語「操作可能に結合した(operably linked)」は、所与の遺伝子の転写および/または所望のタンパク質分子の合成を行うことができる核酸分子を製造するような方法における核酸配列の結合を意味する。本用語はまた、機能性、例えば酵素活性、結合パートナーとの結合能、阻害能などのタンパク質またはポリペプチドを製造するような方法におけるアミノ酸をコードする配列の結合を意味する。
【0050】
用語「組換えDNA分子」は、通常は天然には共に見出されない、少なくとも二つのヌクレオチドを含有するハイブリッドDNA配列を意味する。
【0051】
用語「ベクター」は、DNA断片が挿入またはクローニングされ、核酸部分を細胞に運ぶために用いられ、細胞中で複製できる核酸分子に関して用いられる。ベクターはプラスミド、バクテリオファージ、ウイルス、コスミド等に由来するか、あるいは合成的に作出される。
【0052】
ここで用いられる用語「発現ベクター」は、特定の宿主生物中で操作可能に結合したコーディング配列の発現に必要な適当なDNAまたはRNA配列を含むベクターを意味する。原核生物の発現ベクターは典型的には、プロモーター、リボソーム結合部位、宿主細胞中での自律複製のための複製起点および可能な他の要素、例えば任意のオペレーター、任意の制限酵素部位を含む。
【0053】
用語「プロモーター」は、RNAポリメラーゼをDNAに結合させ、RNA合成を開始する遺伝子要素を意味する。真核生物の発現ベクターは典型的には、プロモーター、任意にポリアデニル化シグナル、および任意にエンハンサーを含む。
【0054】
用語「遺伝子をコードするヌクレオチド配列を有するポリヌクレオチド」は、遺伝子のコーディング領域を含有する核酸配列、言い換えれば、遺伝子産物をコードする核酸配列を意味する。コーディング領域は、cDNA、ゲノムDNA、またはRNAの形態のいずれかで存在することができる。DNAの形態で存在する場合、オリゴヌクレオチドは一本鎖または二本鎖であってもよい。適当な制御要素、例えばエンハンサー/プロモーター、スプライス接合部、ポリアデニル化シグナルは、正しい転写の開始および/または一次RNA転写物の正しいプロセシングのために必要ならば、遺伝子のコーディング領域のすぐ近傍に置かれる。あるいは、本発明の発現ベクターで用いられるコーディング領域は、内在性のエンハンサー/プロモーター、スプライス接合部、介在領域、ポリアデニル化シグナル等を含んでもよい。さらなる態様では、コーディング領域は内在性制御要素および外来性制御要素の両者の組合せを含んでよい。
【0055】
用語「転写調節要素」は、核酸配列の発現の状況を制御する遺伝的要素を意味する。例えば、プロモーターは操作可能に結合したコーディング領域の転写開始を促進する調節要素である。他の調節要素としては、転写因子結合部位、スプライシングシグナル、ポリアデニル化シグナル、終止シグナルおよびエンハンサーシグナルがあげられるが、これに限定されない。
【0056】
用語「転写調節配列」は、転写調節要素の機能に関連する核酸配列を意味する。そのような配列は典型的には、配列モチーフとして認識される、または既知のコンセンサス配列に対応し、一般に、転写調節要素の機能に必要であると信じられている。
【0057】
真核生物の転写制御シグナルは、「プロモーター」要素と「エンハンサー」要素を含む。プロモーターおよびエンハンサーは典型的には、転写に関連する細胞タンパク質と特異的に相互作用するDNA配列の短いアレイである(Maniatisら、1987)。プロモーター要素およびエンハンサー要素は、酵母、昆虫および哺乳動物細胞の遺伝子を含む各種の真核生物のソースから単離されている。プロモーター要素およびエンハンサー要素はまた、ウイルスから単離され、類似の制御要素、例えばプロモーターがまた、原核生物で見出されている。特定のプロモーターおよびエンハンサーの機能は目的のタンパク質を発現させるために用いられる細胞の型に依存する。いくつかの真核生物のプロモーターおよびエンハンサーは広い宿主域を有しているが、他では限られた細胞型で機能する(総説として、Vossら、1986;およびManiatisら1987参照)。例えば、SV40初期遺伝子エンハンサーは、多くの哺乳動物種のいろいろな細胞型で非常に活性があり、哺乳動物細胞におけるタンパク質の発現で広く用いられている(Dijkemaら、1985)。幅広い哺乳動物細胞型で活性のあるプロモーター/エンハンサー要素の二つの別の例として、ヒト延長因子1遺伝子(Uetsukiら、1989;Kimら、1990;MizushimaおよびNagata、1990)およびラウス肉腫ウイルスのロングターミナルリピート(Gormanら、1982)のプロモーター/エンハンサー要素;およびヒトサイトメガロウイルス(Boshartら、1985)のプロモーター/エンハンサー要素があげられる。
【0058】
用語「プロモーター/エンハンサー」は、プロモーターおよびエンハンサーの両機能を提供できるDNAの部分、すなわち上述のプロモーター要素及びエンハンサー要素により提供される機能を示す。例えば、レトロウイルスのロングターミナルリピートはプロモーターおよびエンハンサーの両機能を含む。エンハンサー/プロモーターは、「内在性」または「外来性」もしくは「異種性」であってよい。「内在性」エンハンサー/プロモーターは、ゲノム中の所与の遺伝子に天然に結合しているものである。「外来性」または「異種性」エンハンサー/プロモーターは、遺伝子操作(すなわち、分子生物学的技術)により遺伝子と並列され、その結果、遺伝子の転写が連結したエンハンサー/プロモーターにより進められる。
【0059】
用語「転写因子結合部位」は、転写因子を結合することができるDNAの部分を示す。そのような部位はしばしば、プロモーター要素とエンハンサー要素の内部に存在するが、DNA分子の他の領域にも見出される。転写因子と転写因子結合部位との相互作用は、遺伝子の転写特性に影響を及ぼす。用語「転写因子結合配列」は、転写因子の結合に関連する配列または(複数の)配列を示す。
【0060】
発現ベクター上に「スプライシングシグナル」が存在すると、真核生物の宿主細胞において、組換え体の転写物のより高レベルでの発現がしばしば得られる。スプライシングシグナルは、一次RNA転写物からのイントロンの除去を仲介し、スプライスドナーとアクセプター部位からなる(Sambrookら、分子クローニング:実験室マニュアル(Molecular Cloning: A Laboratory Manual)、第2版、コールドスプリングハーバー研究所出版(Cold Spring Harbor Laboratory Press)、ニューヨーク、1989、16.7-16.8ページ)。通常用いられるスプライスドナーおよびアクセプター部位は、SV40の16S RNA由来のスプライス連結部である。
【0061】
真核細胞で効率的に組換えDNA配列を発現させるには、得られた転写物の効率的な終止とポリアデニル化を司るシグナルの発現が必要である。転写終止シグナルは一般に、ポリアデニル化シグナルの下流に見出され、典型的には、数百ヌクレオチドの長さである。ここで用いられる用語「ポリアデニル化シグナル」、「ポリ(A)シグナル」または「ポリ(A)部位」は、初期RNA転写物の終止とポリアデニル化の両方を司る遺伝的要素を意味する。ここで用いられる用語「ポリ(A)配列」は、初期RNA転写物の終止とポリアデニル化に関連するDNA配列を示す。ポリ(A)テールを欠く転写物は不安定で、急速に分解されるので、組換え体の転写物の効率的なポリアデニル化が望ましい。発現ベクターで用いられるポリ(A)シグナルは「異種性」または「内在性」であってよい。内在性ポリ(A)シグナルは、ゲノム中の所与の遺伝子のコーディング領域3’端に天然に見出される。異種ポリ(A)シグナルは、ある遺伝子から単離され、他の遺伝子の3’端につけられたものである。通常用いられる異種ポリ(A)シグナルは、SV40ポリ(A)シグナルである。SV40ポリ(A)シグナルは、237 bpのBamHI/BclI制限酵素断片にあり、終止およびポリアデニル化の両方を司る(Sambrook、上述、16.6-16.7)。
【0062】
真核生物の発現ベクターはまた、「ウイルスレプリコン」または「ウイルス複製起点」を含むことができる。ウイルスレプリコンは、適当な複製因子を発現する宿主細胞でベクターの染色体外複製を行わせるウイルスの要素である。SV40複製起点またはポリオーマウイルス複製起点のいずれかを含むベクターは、適当なウイルスT抗原を発現する細胞で高コピー数(104コピー/細胞まで)で複製する。一方、ウシパピローマウイルスまたはエプスタイン-バーウイルスのレプリコンを含むベクターは、染色体外で低コピー数(約100 コピー/細胞)で複製する。
【0063】
用語「インビトロ」は、人工的な環境および人工的な環境内で起きる工程または反応を意味する。インビトロの環境には試験管および細胞ライセートが含まれるが、これに限定されない。用語「インビボ」は天然環境(動物または細胞)および天然環境内で起きる工程または反応を意味する。用語「インシリコ」はコンピューター環境を意味する。
【0064】
用語「配列同一性」は、二つの核酸配列間の塩基が一致する割合または二つのアミノ酸配列間のアミノ酸が一致する割合を意味する。配列同一性は、二つの核酸配列またはアミノ酸配列間の関係の程度を示すために用いられる。部分的同一性または完全同一性がある。配列同一性は、配列解析ソフトウェア、例えばジェネティクスコンピューターグループ(GCG)(アメリカ合衆国ウィスコンシン州マディソン サイエンスドライブ575)の配列解析ソフトウェアパッケージを用いて、しばしば測定される。各種の置換、欠失、挿入およびその他の修飾に同一性の程度を与えることにより、そのようなソフトウェアの一致から配列を関係付けることができる。保存的な置換は典型的には、以下のグループ内での置換を含む:グリシン、アラニン、バリン、イソロイシン、ロイシン、アスパラギン酸、グルタミン酸、アスパラギン、グルタミン、セリン、スレオニン、リジン、アルギニン、およびフェニルアラニン、チロシン。
【0065】
配列同一性がパーセンテージ、例えば50%と表される場合、そのパーセンテージは、いくつかの他の配列と比べた一つの配列の長さに対する一致の割合を示す。ギャップ(二つの配列のいずれについても)は一致が最大となるように認められ;通常15塩基より少ないギャップの長さが用いられ、6塩基より少ないものが好ましく、2塩基より少ないものがより好ましい。オリゴヌクレオチドをプローブまたは処置に用いる場合、標的核酸およびオリゴヌクレオチドの間の配列同一性は一般に、20の可能なオリゴヌクレオチド塩基対の一致中17標的塩基の一致(85%)、好ましくは10の可能な塩基対の一致中9の一致(90%)、より好ましくは20の可能な塩基対の一致中19の一致(95%)より少ない。
【0066】
二つのアミノ酸配列間で部分的または完全な同一性があるならば、それらの配列は同一性を共有する。例えば85%同一性は、二つの配列を最大一致するようにアラインした場合に、85%のアミノ酸が同一であることを意味する。ギャップ(一致する二つの配列いずれについても)は、一致が最大となるように許可される;ギャップの長さは5以下が好ましく、2以下がより好ましい。あるいは、好ましくは、この用語がここで用いられるように、二つのタンパク質配列(または、少なくとも100個のアミノ酸の長さのポリペプチドに由来するポリペプチド)が、突然変異データマトリックスとギャップペナルティー6以上でのプログラムALIGNを用いて、5超のアラインメントスコア(標準偏差単位で)を有するならば、それらは同一性を共有する。Dayhoff, M.O.(タンパク質配列と構造のアトラス(Atlas of Protein Sequence and Structure)、1972、第5巻、国立生物医学研究財団(National Biomedical Research Foundation)、101-110ページ)および補遺2(同巻、1-10ページ)を参照。ALIGNプログラムを用いて任意にアラインされる際にアミノ酸が85%以上同一であるならば、二つの配列またはその部分はより好ましくは同一性を共有する。
【0067】
以下の用語は二つまたはそれ以上のポリヌクレオチド間の配列の関係を記述するために用いられる:「基準配列(reference sequence)」、「比較窓(comparison window)」、「配列同一性」、「配列同一性のパーセンテージ」および「実質的同一性」。「基準配列」は、配列比較の基礎として用いられる確定した配列である;基準配列は大きな配列の一部、例えば配列表に記載された全長cDNAまたは遺伝子配列の部分であってもよく、完全なcDNAまたは遺伝子配列を含有してもよい。一般的に、基準配列は少なくとも長さ20ヌクレオチド、高頻度で少なくとも長さ25ヌクレオチド、しばしば少なくとも長さ50ヌクレオチドである。二つのポリヌクレオチドがそれぞれ、(1)二つのポリヌクレオチド間で類似する配列、すなわち完全なポリヌクレオチド配列の部分を含有し、(2)さらに、二つのポリヌクレオチド間で相違を含有するので、二つ(またはそれ以上)のポリヌクレオチド間の配列比較は、典型的には、配列類似性のある局所的な領域を同定し、比較するための「比較窓」で二つのポリヌクレオチドの配列を比較することにより行われる。
【0068】
ここで用いられる「比較窓」は、少なくとも20の連続したヌクレオチドの概念的な部分を意味し、比較窓中のポリヌクレオチド配列部分は、二つの配列の最適なアラインメントのために、基準配列(付加または欠失を含有しない)と比べ、20%以下の付加または欠失、すなわちギャップを含有する。
【0069】
比較のための配列アラインメントの方法は当業者には周知である。それゆえ、二つの配列間のパーセント同一性を決定するために、数学的アルゴリズムが用いられる。そのような数学的アルゴリズムの好ましい、限定されない例として、MyersとMillerのアルゴリズム(1988);SmithとWatermanの局所的相同性アルゴリズム(1981);NeedlemanとWunschの相同性アラインメントアルゴリズム(1970);PearsonとLipmanの類似性検索法(1988);KarlinとAltschul(1993)により改良された、KarlinとAltschul(1990)のアルゴリズムをあげることができる。
【0070】
これらの数学的アルゴリズムのコンピューターによる実施は、配列同一性を決定するための配列比較のために利用される。そのような実施には、PC/Geneプログラム(カリフォルニア州マウンテンビュー、インテリジェネティクスから入手可)のCLUSTAL;ウィスコンシンジェネティクスソフトウェアパッケージ第8版(ジェネティクスコンピューターグループ(GCG)から入手可)のALIGNプログラム(第2版)およびGAP、BESTFIT、BLAST、FASTAおよびTFASTAが含まれるが、これらに限定されない。これらのプログラムを用いたアラインメントは初期設定のパラメーターを用いて行われる。CLUSTALプログラムは、Higginsら(1988);Higginsら(1989);Corpetら(1988);Huangら(1992);およびPearsonら(1994)により十分記載されている。ALIGNプログラムは、MyersとMillerのアルゴリズム(1988)に基づくものである。AltschulらのBLASTプログラム(1990)は、KarlinとAltschulのアルゴリズム(1993)に基づくものである。比較目的でギャップのあるアラインメントを得るために、Altschulら(1997)により記述されているように、Gapped BLAST(BLAST 2.0中)が用いられる。あるいは、PSI-BLAST(BLAST 2.0中)が、分子間の距離関係を検出する反復検索を行うために用いられる。Altschulら(1990)参照。BLAST、Gapped BLAST、PSI-BLASTを用いる場合、それぞれのプログラム(例えば、ヌクレオチド配列のためのBLASTN、タンパク質のためのBLASTX)の初期設定パラメーターを用いることができる。
1122943613281_0
参照。アラインメントはまた、検査により手動で行われる。
【0071】
用語「配列同一性」は、比較窓上で二つのポリヌクレオチド配列が同一(すなわち、ヌクレオチドごとの基準上)であることを意味する。用語「配列同一性のパーセンテージ」は、比較窓上で規定のヌクレオチドの割合に対して、二つのポリヌクレオチド配列が同一である(すなわち、ヌクレオチドごとの基準上)であることを意味する。用語「配列同一性のパーセンテージ」は、比較窓上で二つの最適にアラインされた配列を比較し、一致した位置の数を得るために両方の配列で同一核酸塩基(例えば、A、T、C、G、UまたはI)が生じた位置の数を決定し、比較窓中の全位置数(すなわち、窓サイズ)で一致した位置の数を除し、配列同一性のパーセンテージを得るために得られた結果に100を乗することにより計算される。ここで用いられる用語「実質的同一性」は、ポリヌクレオチド配列の特性を示し、ここで、ポリヌクレオチドは、少なくとも20ヌクレオチド位置の比較窓、しばしば少なくとも20-50ヌクレオチド、好ましくは少なくとも300ヌクレオチドの窓上で、基準配列と比べ、少なくとも60%、好ましくは少なくとも65%、より好ましくは少なくとも70%、約85%まで、さらに好ましくは少なくとも90-95%、さらに通常、少なくとも99%の配列同一性を有する配列を含有し、ここで配列同一性のパーセンテージは、基準配列を基準配列の20%以下の欠失または付加を含むポリヌクレオチド配列と比較窓上で比較することにより計算される。基準配列は大きな配列の一部であってよい。
【0072】
ポリペプチドにも適応した場合、用語「実質的同一性」は、例えば初期設定のギャップ負荷を用いたプログラムGAPまたはBESTFITにより最適にアラインされた場合に、二つのペプチド配列が、少なくとも約85%の配列同一性、好ましくは少なくとも約90%の配列同一性、より好ましくは少なくとも約95%の配列同一性、最も好ましくは少なくとも約99%の配列同一性を共有することを意味する。
【0073】
「部分的に相補的な」配列は、標的核酸に完全に相補的な配列がハイブリダイズすることを少なくとも部分的に阻害する配列であり、機能的な用語「実質的に同一の」を用いることと同義である。完全に相補的な配列の標的核酸へのハイブリダイゼーションの阻害は、低ストリンジェンシーの条件下でのハイブリダイゼーションアッセイ(サザンまたはノーザンブロット、溶液ハイブリダイゼーション等)を用いて試験される。実質的に同一の配列またはプローブは、低ストリンジェンシーの条件下での完全に同一の配列の標的への結合、すなわちハイブリダイゼーションを拮抗および阻害する。低ストリンジェンシー条件が非特異的結合を許容する条件であるとはいえず;低ストリンジェンシー条件は、二つの配列の互いへの結合が特異的、すなわち選択的相互作用をすることに必要である。非特異的結合がないことは、部分的な相補性、例えば約30%未満の同一性さえ欠く第二の標的の使用により試験される。この場合、非特異的結合がないと、プローブは第二の非相補性標的にはハイブリダイズしない。
【0074】
二重鎖核酸配列、例えばcDNAまたはゲノムクローンが用いられた場合、用語「実質的に同一な」は、ここに記載される低ストリンジェンシーの条件下で、二重鎖核酸配列のいずれかまたは両方にハイブリダイズできる任意のプローブを指す。
【0075】
「プローブ」は、選択されたストリンジェンシー条件下で結合することを(その長さに関して)プローブされる変性核酸の配列に十分相補的であるようにデザインされたオリゴヌクレオチドを意味する。
【0076】
プローブおよび変性融解核酸の関連で、「ハイブリダイゼーション」と「結合」は互換的に用いられる。変性核酸にハイブリダイズまたは結合するプローブは、ポリヌクレオチドの相補配列と塩基対をなす。特定のプローブがポリヌクレオチドと塩基対をなしたままであるかは、相補性の程度、プローブの長さおよび結合条件のストリンジェンシーに依存する。ストリンジェンシーが高ければ高いほど、相補性の程度は高くなり、および/または、プローブは長くなる。
【0077】
用語「ハイブリダイゼーション」は、相補的核酸の鎖の対合に関して用いられる。ハイブリダイゼーションおよびハイブリダイゼーションの強さ、すなわち、核酸の鎖間の関連性の強さは、当業者には周知の多くの因子により影響され、因子としては核酸間の相補性の程度、塩濃度のような条件により影響される条件のストリンジェンシー、形成されるハイブリッドのTm(融解温度)、他の組成の存在、例えばポリエチレングリコールの有無、ハイブリダイズする鎖のモル濃度および核酸鎖のG:C含量があげられる。
【0078】
用語「ストリンジェンシー」は、核酸ハイブリダイゼーションが行われるところの、温度、イオン強度、および他の組成の存在についての条件に関して用いられる。「高ストリンジェンシー」条件では、核酸塩基の対合は、高頻度の相補的塩基配列を有する核酸断片の間でのみ起きる。それゆえ、「中程度の」または「低」ストリンジェンシー条件は、互いに完全に相補的でない核酸をハイブリダイズする、または共にアニールすることが望まれる場合に、しばしば要求される。中程度または低ストリンジェンシー条件を構成する数多くの等価の条件が用いられていることは当業者には周知である。ハイブリダイゼーション条件の選択は一般に、当業者には明らかであり、通常、ハイブリダイゼーションの目的、ハイブリダイゼーションの型(DNA-DNAまたはDNA-RNA)、および配列間の所望される関係のレベルにより導かれる(方法の一般論について、例えば、Sambrookら、1989;核酸ハイブリダイゼーション 実践的アプローチ(Nucleic Acid Hybridization, A Practical Approach)、IRLプレス、ワシントンD.C.、1985)。
【0079】
核酸二重鎖の安定性は、一致しない塩基数の増加に伴い減少することが知られており、さらに、ハイブリッド二重鎖中のミスマッチの相対的な位置に依存して、多少の程度で減少する。それゆえ、ハイブリダイゼーションのストリンジェンシーは、そのような二重鎖の安定性を最大または最小にするために用いられる。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの温度を調整し;ハイブリダイゼーション混合液中のヘリックス不安定化剤、例えばホルムアミドのパーセンテージを調整し;洗浄溶液の温度および/または塩濃度を調整することにより変えることができる。フィルターハイブリダイゼーションでは、最終的なハイブリダイゼーションのストリンジェンシーはしばしば、ハイブリダイゼーション後の洗浄で用いられる塩濃度および/または温度により決定される。
【0080】
核酸ハイブリダイゼーションについて用いられる場合の「高ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブが用いられた場合、5X SSPE(43.8 g/l NaCl、6.9 g/l NaH2PO4H2Oおよび1.85 g/l EDTA、NaOHでpHを7.4に調整)、0.5% SDS、5X デンハルト試薬および100 μg/ml 変性サケ精子DNAを含む溶液中、42℃での結合またはハイブリダイゼーションとそれに続く0.1X SSPE、1.0% SDSを含む溶液中、42℃での洗浄と等価の条件を含む。
【0081】
核酸ハイブリダイゼーションについて用いられる場合の「中程度のストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブが用いられた場合、5X SSPE(43.8 g/l NaCl、6.9 g/l NaH2PO4H2Oおよび1.85 g/l EDTA、NaOHでpHを7.4に調整)、0.5% SDS、5X デンハルト試薬および100 μg/ml 変性サケ精子DNAを含む溶液中、42℃での結合またはハイブリダイゼーションとそれに続く1.0X SSPE、1.0% SDSを含む溶液中、42℃での洗浄と等価の条件を含む。
【0082】
核酸ハイブリダイゼーションについて用いられる場合の「低ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブが用いられた場合、5X SSPE(43.8 g/l NaCl、6.9 g/l NaH2PO4H2Oおよび1.85 g/l EDTA、NaOHでpHを7.4に調整)、0.5% SDS、5X デンハルト試薬[50X デンハルトは500 mlあたり:5 gフィコール(タイプ400、ファルマシア)、5g BSA(画分V、シグマ)を含む]および100 μg/ml 変性サケ精子DNAを含む溶液中、42℃での結合またはハイブリダイゼーションとそれに続く5X SSPE、0.1% SDSを含む溶液中、42℃での洗浄と等価の条件を含む。
【0083】
用語「Tm」は「融解温度」に関して用いられる。融解温度は二重鎖核酸の集団の50%が一本鎖に解離する温度である。核酸のTmの計算式は当業者には周知である。ハイブリッド核酸のTmはしばしば、1 M の塩におけるハイブリダイゼーションアッセイに適合する式を用いて概算され、通常はPCRプライマーのTmを計算する式:[(A+Tの数)x2℃+(G+Cの数)x4℃]が用いられる(C.R.Newtonら、PCR、第2版、シュプリンガー-フェアラーク(ニューヨーク、1997)、24ページ)。この式は20ヌクレオチドより長いプライマーでは不正確であることが見出された(同上)。Tm値の別の簡単な概算を、核酸が1 M NaClの水溶液中にある場合、式:Tm=81.5+0.41(%G+C)で計算できる(例えば、AndersonとYoung、「核酸ハイブリダイゼーション(Nucleic Acid Hybridization)」(1985)中の定量的フィルターハイブリダイゼーション(Quantitative Filter Hybridization))。構造ならびに配列の特徴を考慮したTmを計算するより洗練された別の計算法が当業界に存在する。計算されたTmは単なる概算であり、最適温度は通常、経験に基づいて決定される。
【0084】
本発明において、当業界の範囲で、通常の分子生物学および微生物学が用いられる。そのような技術は文献に十分に説明されている。Sambrook、FritschおよびManiatis、モレキュラー・クローニング:実験室マニュアル、第3版(2001)、コールドスプリングハーバー・ラボラトリー・プレス、ニューヨーク州コールドスプリングハーバーを参照。
【0085】
本発明に従えば、新規核酸が記述される。蛍光タンパク質をコードする元の核酸配列を修飾し、実質的に同一の蛍光タンパク質をコードするが、新規宿主細胞、この場合ヒト細胞で増強された転写および発現特性を有した核酸配列の新規合成型を作出した。
【0086】
1.本発明の合成核酸分子および方法
本発明は蛍光タンパク質をコードする合成核酸分子を含有する組成物ならびに、特定の細胞型で発現される際に、減少した不適切なまたは意図しない転写特性を含む所望の特性を有するポリペプチドまたはタンパク質として効果的に発現される合成核酸分子を得る前記分子を調製する方法を提供する。
【0087】
自然の選択は、表現型レベルで生ずる遺伝子型環境相互作用が個体の繁殖成功度に差をもたらし、それゆえ集団の遺伝子プールに変化がもたらされるという前提である。天然に見出されるタンパク質のアミノ酸配列は自然の選択による最適化を受けるということが一般に受け入れられている。しかし、タンパク質の活性に著しく寄与しないアミノ酸がタンパク質の配列内に存在し、これらのアミノ酸はほとんど、または全く影響することなく、他のアミノ酸に変換される。さらに、タンパク質はその天然の環境の外側で、または自然の選択の条件とは異なる目的のために有用である。これらの環境では、アミノ酸配列は各種用途への利用のために、タンパク質をより適合させるために合成的に改変される。
【0088】
同様に、タンパク質をコードするアミノ酸配列はまた、自然の選択により最適化される。コーディングDNAとその転写RNAとの関係は、DNAへの変化が得られるRNAに影響するというものである。それゆえ、自然の選択が両方の分子に同時に作用する。しかし、この関係は核酸とタンパク質の間には存在しない。複数コドンが同一アミノ酸をコードするので、多くの異なるヌクレオチド配列が同一タンパク質をコードできる。500アミノ酸から構成される特定のタンパク質は、理論的には10150以上の異なる核酸配列によりコードされる。
【0089】
自然の選択は核酸に作用し、対応するタンパク質の適切な暗号化をもたらす。おそらく、核酸分子の他の特性も自然の選択に作用される。これらの特性には、コドン使用頻度、RNA二次構造、イントロンのスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用が含まれる。これらの他の特性はタンパク質の翻訳効率および得られる表現型を変化させる。遺伝子コードの重複性のために、これらの他の特性を対応するアミノ酸配列を変化させることなしに、自然の選択により最適化できる。
【0090】
ある条件下で、タンパク質をコードする天然のヌクレオチド配列を別の用途のためのタンパク質により適合するように合成的に変化させるのに有用である。一般的な例は、外来宿主で発現される場合、遺伝子のコドン使用頻度を変化させることである。遺伝子コードの重複が複数コドンによりアミノ酸をコードさせるが、異なる生物ではいくつかのコドンで、他の生物とは異なる嗜好性を有する。コドン使用頻度は、広く分離した進化の歴史を有するほとんどの生物で異なる傾向にある。進化的に離れた生物間で遺伝子を転移させると、タンパク質の翻訳効率は、コドン使用頻度を調製することにより実質的に増加することが見出された(米国特許第5096825号、第5670356号および第5874304号参照)。
【0091】
進化距離のために、蛍光タンパク質をコードする遺伝子のコドン使用は、実験細胞の最適コドン使用に対応しない。例としては、腔腸動物由来であるが、通常、植物細胞および哺乳動物細胞で用いられる、緑色蛍光タンパク質(GFP)レポーター遺伝子があげられる。蛍光タンパク質遺伝子発現の感度のよい定量法を得るために、遺伝子産物の活性は実験宿主細胞に内在するものであってはならない。それゆえ、蛍光タンパク質遺伝子は通常、他とは異なる、独特の表現型を有する生物から選択される。その結果として、これらの生物はしばしば、実験宿主細胞とは広く分離した進化の歴史を有している。
【0092】
以前は、より最適なコドン使用頻度を有するが、同一遺伝子産物をまだコードする遺伝子を作出するために、合成核酸配列が、存在するコドンを実験宿主細胞で一般により好まれるコドンで置換することにより、作出された(米国特許第5096825号、第5670356号および第5874304号参照)。合成遺伝子のコドン使用頻度の基本的な改良という結果であった。しかし、他の特性の最適化は考えられず、その結果、これらの合成遺伝子はおそらく、自然の選択により最適化される遺伝子を反映しなかった。
【0093】
特に、コドン使用頻度の改良は、タンパク質への翻訳における役割に基づくRNA配列の最適化のみを意図する。それゆえ、以前に記載された方法は、合成遺伝子の配列がどのようにRNAへの転写におけるDNAの役割に影響を及ぼすかについて扱わなかった。最も顕著には、転写因子がどのように合成DNAと相互作用し、その結果として遺伝子の転写を調節するか、または遺伝子の転写に影響を及ぼすかについて、考察を与えない。天然に見出される遺伝子に関して、DNAは天然宿主細胞により最適に転写され、適切に折りたたまれた遺伝子産物をコードするRNAが得られる。その一方、合成遺伝子は以前、転写特性に関して最適化されていなかった。むしろ、この特性は無視されていたか、または偶然に任されていた。
【0094】
この懸案事項は全ての遺伝子にとって重要であるが、最も一般的に実験宿主細胞で転写の挙動を定量するために用いられるレポーター遺伝子にとって重要である。数百の転写因子が異なる生理的条件下の異なる細胞型で同定され、さらに多くが存在していると思われるが、未だ同定されていない。これらの転写因子全てが導入した遺伝子の転写に影響を及ぼす。本発明の有用な合成レポーター遺伝子の産物について、この遺伝子の構造が改変されているために、宿主細胞の本来の特性に影響する、または本来の特性をかき乱すリスクは最小である。特に有用な合成レポーター遺伝子は、新規の一連の、および/または多様な実験条件下で、所望の特性を有する。これらの特性を最もよく得るために、合成遺伝子の構造が、広い宿主細胞域と生理的条件内で転写因子と相互作用する最小の可能性を有するべきである。レポーター遺伝子と宿主細胞の内在性転写因子との相互作用の最小可能性は、特定の実験で遺伝子の不適切な転写特性のリスクを減少し、各種環境での遺伝子の適用性を増加し、得られる実験データの許容性を増加することにより、レポーター遺伝子の価値を増加する。
【0095】
これらの懸案事項はまた、転写の挙動を定量するために用いられ、そして定量のための基準として、または融合タンパク質の移動または局在性をモニターするための別のタンパク質との融合として用いられる蛍光タンパク質遺伝子にとって重要である。上述のように、数百の転写因子が宿主細胞に存在し、導入遺伝子の転写に影響を及ぼす。本発明の有用な合成蛍光タンパク質遺伝子は、遺伝子の構造が改変されているために、宿主細胞の内在性転写特性への影響または混乱のリスクは最小である。特に有用な合成蛍光タンパク質遺伝子は、新しいセットの実験条件および/または広範囲の各種実験条件下で所望の特性を有する。これらの特性を最高に達成するために、合成蛍光タンパク質遺伝子の構造は、幅広い宿主域および生理的条件の範囲で転写因子と相互作用する最小の可能性を有する。蛍光タンパク質遺伝子と宿主細胞の内在性転写因子との潜在的な相互作用を最小化することは、特定の実験の範囲で遺伝子の不適切な転写特性のリスクを減少し、各種環境で遺伝子の適用性を増加し、得られる実験データの容認度を増加することにより、蛍光タンパク質遺伝子の価値を増加する。
【0096】
一方、元の宿主生物のゲノムクローンまたはcDNAクローンに基づく天然のヌクレオチド配列を含有するレポーター遺伝子は、外来性宿主で発現する場合、転写因子と相互作用する。このリスクは二つの事情から生ずる。第一に、天然のヌクレオチド配列は、天然の宿主生物の中での遺伝子転写に影響する自然の選択を介して最適化される配列を含む。しかし、これらの配列はまた、遺伝子が外来宿主で、すなわち、理由もなく、それゆえレポーター遺伝子としての能力を妨げられて発現する場合、転写に影響を及ぼす。第二に、ヌクレオチド配列は何かの事情で、天然の宿主生物には存在しない転写因子と相互作用し、それゆえ自然の選択に参画しなかった。そのような故意ではない相互作用の可能性は、実験細胞と天然の生物との間のレポーター遺伝子の進化的分離をより大きく増加する。
【0097】
同様に、元の宿主生物または元々単離された蛍光タンパク質の突然変異体のゲノムクローンまたはcDNAクローンに基づく天然のヌクレオチド配列を含有する蛍光タンパク質遺伝子は、上述のように外来宿主で発現する場合、不適切に転写因子と相互作用する。外来宿主でのそのような故意でない相互作用の可能性は、実験細胞と天然の生物との間のレポーター遺伝子の進化学的分離をより大きく増加する。
【0098】
転写因子との可能な相互作用は、おそらく、コドン使用頻度に改変を有する合成蛍光タンパク質遺伝子を用いた場合に崩壊する。しかし、コドン使用頻度のみに基づきコドンを選択することにより設計された合成蛍光タンパク質遺伝子は、不適切な転写活性を修正する自然の選択の利益を合成遺伝子は受けていないので、他の偶然の転写因子結合部位を含まないと思われる。転写因子との故意でない相互作用はまた、コードされるアミノ酸配列が人工的に改変される、例えばアミノ酸置換を導入しないかぎり、生ずるものである。同様に、これらの変化は自然の選択を受けず、それゆえ、好ましくない特性を示す可能性がある。
【0099】
それゆえ本発明は、特定の宿主細胞で発現した場合に核酸と転写因子との好ましくない相互作用のリスクを減少し、それにより不適切または偶然の転写特性を減少させた合成核酸配列を調製する方法を提供する。好ましくは、本方法により、特定の宿主細胞で改良されたコドン使用頻度を含み、脊椎動物の転写因子結合部位の存在が減少した合成遺伝子を得ることができる。本発明はまた、転写因子結合部位の存在が減少し、別の利益のある特性を有する改良されたコドン使用頻度を含む合成遺伝子を調製する方法を提供する。そのような別の特性として、不適切なRNAスプライス配列、ポリ(A)付加配列、好ましくない制限配列、リボソーム結合配列およびヘアピンループのような二次構造モチーフがないことがあげられる。
【0100】
それゆえ、本発明の核酸は、特定の宿主細胞で発現される場合、核酸と転写因子の好ましくない相互作用のリスクを減少させた、蛍光タンパク質をコードする新規合成核酸配列を提供する。好ましくは、本方法により、特定の宿主細胞で改良されたコドン使用頻度を含み、転写因子結合配列の存在が減少した合成蛍光タンパク質遺伝子が得られる。本発明はまた、上述のような、転写因子結合部位の存在が減少し、別の利益のある特性を有する改良されたコドン使用頻度を含む合成蛍光タンパク質遺伝子を調製する方法を提供する。そのような別の特性として、不適切なRNAスプライス配列、ポリ(A)付加配列、好ましくない制限配列、リボソーム結合配列およびヘアピンループのような二次構造モチーフがないことがあげられるが、これに限定されない。
【0101】
同一または高度に類似のタンパク質をコードする合成遺伝子(「コドンが異なる」バージョン)を調製する方法もまた提供される。好ましくは、合成遺伝子は共通のポリヌクレオチド・プローブ配列にハイブリダイズする異なる能力を有し、生細胞に共存する場合に組換えのリスクが減少している。組換えを検出するために、隣接配列に相補的なプライマーを用いたレポーター配列のPCR増幅および増幅配列のシーケンシングが用いられる。それゆえ、同一または高度に類似の蛍光タンパク質をコードする合成遺伝子(「コドンが異なる」バージョン)を調製する方法もまた提供される。好ましくは、合成蛍光タンパク質遺伝子は共通のポリヌクレオチド・プローブ配列にハイブリダイズする異なる能力を有し、生細胞に共存する場合に組換えのリスクが減少している。組換えを検出するために、隣接配列に相補的なプライマーを用いたレポーター配列のPCR増幅および増幅配列のシーケンシングが用いられる。
【0102】
本発明の合成核酸分子のためのコドンを選択するために、好ましいコドンは選択された宿主細胞で比較的高いコドン使用頻度を有し、それらを導入することにより、比較的少ない転写因子結合配列、比較的少ない他の好ましくない構造的特性、および任意に合成遺伝子と高度に類似したタンパク質をコードする別の遺伝子を区別する特性が導入される。それゆえ、本発明の方法により得られる合成核酸の産物は、改良されたコドン使用頻度のために発現レベルが改良されており、好ましくない転写調節配列の数が減少していることにより不適切な転写の挙動のリスクが減少しており、合成配列を選択するために用いられる他の基準のための任意の付加的な特性を有する合成遺伝子である。
【0103】
任意に、合成遺伝子の少なくとも一つの特性は、天然の宿主細胞に対して、好ましい宿主細胞における、増強されたタンパク質発現である。それゆえ、本発明の方法により得られる合成核酸の産物は、改良されたコドン使用頻度のために発現レベルが改良されており、好ましくない転写調節配列の数が減少していることにより不適切な転写の挙動のリスクが減少しており、合成配列を選択するために用いられる他の基準のための任意の付加的な特性を有する合成蛍光タンパク質遺伝子である。
【0104】
本発明にはいずれかの核酸配列、例えばcDNAのような天然の配列、またはインビトロで操作され、例えば制限酵素認識配列の導入または削除のような特定の改変、異なるアミノ酸をコードするまたは融合タンパク質をコードするコドンの改変、光度の増加が導入される、または核酸分子のGCまたはAT含量(組成の%)が改変される配列が用いられる。その上、本発明の方法は、いずれの遺伝子についても有用であるが、特にレポーター遺伝子、並びにレポーター遺伝子の発現に関連する他の遺伝子、例えば選択マーカーに有用である。好ましい遺伝子として、ラクタマーゼ(β-gal)、ネオマイシン耐性(Neo)、CAT、GUS、ガラクトピラノシド、キシロシダーゼ、チミジンキナーゼ、アラビノシダーゼ、蛍光タンパク質等をコードする遺伝子があげられるが、これらに限定されない。
【0105】
さらに、本発明の方法は、いずれの蛍光タンパク質遺伝子にも有用である。好ましい遺伝子として、GFPおよび赤色蛍光タンパク質(RFP)等をコードする遺伝子があげられるが、これらに限定されない。本開示の要素は詳細に特定の蛍光タンパク質遺伝子を使用することにより例示される。もちろん、適当な蛍光タンパク質遺伝子の多くの例が当業者には既知であり、本発明の実施に用いることができる。それゆえ、以下の例は網羅的というよりはむしろ典型的なものであると理解されるべきである。ここに開示した技術および当業者に既知の一般的な組換え技術を考慮して、本発明はいずれかの蛍光タンパク質遺伝子の改変を可能にする。典型的な蛍光タンパク質遺伝子として、元々Montastraea cavernosaから単離されたGFP、およびActinodiscusまたはDiscosomaであると信じられているポリプから元々単離されたRFPがあげられるが、これらに限定されない。
【0106】
ここで用いられるように、「マーカー遺伝子」または「レポーター遺伝子」は、遺伝子を発現する細胞に異なる表現型を賦与し、そのために該遺伝子を有する細胞と該遺伝子を有さない細胞と区別する遺伝子である。そのような遺伝子は、化学的手段すなわち選択的薬剤(例えば除草剤、抗生物質等)により「選択」できる特性をマーカーが与えるかどうか、または観察あるいは試験、すなわち「スクリーニング」により同定できる単なる「レポーター」特性であるかどうかに依存して、選択的マーカーまたはスクリーニング可能なマーカーのいずれかをコードする。本開示の要素は特定のマーカー遺伝子の使用により詳細に例示される。もちろん、適当なマーカー遺伝子またはレポーター遺伝子の多くの例が当業者には既知であり、本発明の実施に用いることができる。それゆえ、以下の例は網羅的というよりはむしろ典型的なものであると理解されるべきである。ここに開示した技術および当業者に既知の一般的な組換え技術を考慮して、本発明はいずれかの遺伝子の改変を可能にする。
【0107】
本発明の方法は、限定はされないが、反復工程により行うことができる。工程には、特定の種のコドン使用に基づいて、好ましいコドンを標的分子、例えば元のヌクレオチド配列のそれぞれのアミノ酸に割り当てること、好ましいコドンを有する核酸配列で、潜在的な転写調節配列、例えば転写因子結合配列を、例えばそのような結合配列のデータベースを用いて同定すること、任意に他の好ましくない配列を同定すること、および好ましくない転写因子結合配列または他の配列が存在する位置で、代わりのコドンに置換する(すなわち、同一アミノ酸をコードする)ことが含まれる。コドンの異なるバージョンで、代わりの好ましいコドンが、それぞれのバージョンの転写因子結合配列数または型を減らすために試みで置換される。必要ならば、転写因子または好ましくない配列の同定と削除が、最大数の好ましいコドンおよび転写調節配列または他の好ましくない配列を含む最小数の好ましくない配列を含むヌクレオチド配列が得られるまで、繰り返される。また任意で、所望の配列、例えば制限酵素認識配列を導入できる。合成核酸分子を設計、構築した後、元の核酸配列に比較した特性を当業者に周知の方法により測定することができる。例えば、特定の細胞における一連のベクターを用いた合成および元の核酸分子の発現を比較できる。
【0108】
それゆえ、一般に、本発明の方法は、蛍光タンパク質をコードする標的核酸配列、および対象の宿主細胞、例えば植物(双子葉または単子葉)、カビ、酵母または哺乳動物細胞を同定することを含む。好ましい宿主細胞は哺乳動物宿主細胞、例えばCHO、COS、293、Hela、CV-1およびNIH3T3細胞である。宿主細胞における好ましいコドン使用、および任意に、宿主細胞における低コドン使用、例えば哺乳動物の高いコドン使用と大腸菌および哺乳動物の低いコドン使用に基づき、置換されるコドンを決定する。二つの合成核酸分子のコドンが異なるバージョンを、それぞれのバージョンに導入される別の好ましいコドンを用いて決定する。それゆえ、二つ以上のコドンを有するアミノ酸では、一つの好ましいコドンが一方のバージョンに導入され、別の好ましいコドンが他方のバージョンに導入される。一つ以上のコドンを有するアミノ酸では、一致しない塩基が最大数の二つのコドンを同定し、一つを一方のバージョンに導入し、もう一つのコドンを他方のバージョンに導入する。標的配列中の並列の、それに続く、置換されるコドンを選択する前の、所望の配列および好ましくない配列、例えば好ましくない転写調節配列を同定する。これらの配列を、ここでさらに述べた、データベースおよびソフトウェア、例えばEPD、NNPD、REBASE、TRANSFAC、TESS、GenePro、MAR(
1122943613281_1
)およびBCM Gene Finderを用いて同定することができる。配列を同定した後、修飾を導入する。所望の核酸配列が得られると、当業者に周知の方法(例えば、重複プライマーを用いたPCRまたは市販の遺伝子合成)により該配列を調製できる。標的核酸配列と比較されるその構造的、および機能的特性として、パーセント同一性、ある配列、例えば制限配列の存在の有無、改変コドンのパーセント(例えば、あるコドンの使用の増減)および発現率をあげることができるが、これに限定されない。
【0109】
ある好ましい態様では、以下の工程が行われる。
【0110】
1.元の遺伝子または遺伝子の一部のコドン使用は、一つ以上の外来宿主における発現で、好ましくはアミノ酸配列を改変することなく最適化される。
【0111】
2.任意に、所望のヌクレオチド配列(例えば、Kozakコンセンサス配列、特異的結合配列、制限酵素配列、および組換え配列)を、遺伝子配列および、必要ならアミノ酸配列を改変することにより導入する。
【0112】
3.好ましくない転写調節配列および制限酵素認識配列を、遺伝子配列内のそのような配列の記述(descriptions)により同定する。そのような記述には、特異的な個々の配列記述、コンセンサス配列記述、マトリックス記述、等がある。記述は自身の研究、文献、あるいは他の公共または市販のソースから得ることができる。記述を遺伝子配列中に、異なる検索方法、例えば目による検索、テキスト検索、配列解析ソフトウェア、またはMatInspectorプロフェッショナルのような特殊なソフトウェアを用いて示すことができる。当業者は、所望の結果を得る、使用方法に適応できるパラメーターを選択する方法を理解できるであろう。
【0113】
4.好ましくない転写調節配列および制限酵素認識配列をその後、一つ以上のコドンを同一アミノ酸の別のコドンに置換することにより、遺伝子配列から削除する。高度に望ましくない配列を削除するために、選択した外来宿主では好ましくない、またはポリペプチドの所望の特性を過度に損なわないならばアミノ酸配列を改変するコドンを置換することをユーザーは選択できる。新しい好ましくない転写調節配列または制限酵素認識配列を導入する置換コドンまたはコドンの組合わせは避けるべきである。可能な置換コドンまたはコドンの組合わせのうち、殆ど完全に好ましくない転写調節配列を削除するものが好ましい。選択した外来宿主に好ましくない多くのコドンの置換は避けるべきである。コドンの置換を手動で、またはSequenceShaperのようなソフトウェアを用いて、選択、導入できる。当業者は、所望の結果を得る、使用方法に適応できるパラメーターを選択する方法を理解できるであろう。
【0114】
5.必要ならば、調整したパラメーターを用いて、できる限りまたは許容できる限り数を減らした好ましくない転写調節配列または制限酵素認識配列を含む最終的な配列が得られるまで、工程3および4を繰り返すことができる。
【0115】
6.最終的な設計された核酸配列を合成/構築し、適当な遺伝子ベクターにクローニングすることができる。遺伝子ベクターは、選択した外来宿主または他の適当な宿主で合成遺伝子のタンパク質転写ができる発現ベクターである。
【0116】
以下に述べるように、もともとMontastraea cavernosaから単離された緑色蛍光タンパク質(GFP)の突然変異型であるGFPをコードする合成遺伝子を作出するために、本方法を用いた。合成遺伝子は、元のGFPに比べ、宿主細胞中でかなり高いレベルの蛍光をサポートする。さらに、元のGFPに比べ、合成GFPの以上発現は減少することが予測される。
【0117】
本発明の分子の使用例
本発明の合成遺伝子は好ましくは、その元の一部(または殆ど全て)として同一タンパク質をコードし、元のタンパク質と比較すると、改良されたコドン使用を有し、その一方で、コーディング領域中の既知の転写調節配列を大きく欠いている。(少数のアミノ酸変化が天然の部分タンパク質の特性を増強する、例えば、蛍光タンパク質の蛍光特性を増強するのに望ましいことが認識される。)これは合成遺伝子によりコードされるタンパク質の発現レベルを増加し、タンパク質の異常発現のリスクを減少する。例えば、遺伝子制御の多くの重要な事象についての研究は、弱いプロモーターにより仲介されるが、レポータータンパク質の不適切な発現の不十分なレポーターシグナルにより限定される。ここに記述される合成蛍光タンパク質遺伝子は、発現レベルを大きく増加しているために、弱いプロモーター活性の検出ができ、検出感度を増加することが可能である。さらなる利点は、限られた量しか得られない転写因子が、非生産的結合事象では細胞により利用されないことである。また、いくつかの選択マーカーの利用が外来細胞中のマーカーの発現により限定される。それゆえ、その細胞における改良されたコドン使用を有し、他の好ましくない配列(例えば、転写因子結合配列)が減少している合成選択マーカー遺伝子が、それらのマーカーの宿主として同様に好ましくない細胞で、マーカーとしての利用を可能にする。
【0118】
プロモーターのクロストークが、共レポーター遺伝子をトランスフェクション効率の正規化に用いている場合、別の懸案事項である。合成遺伝子の増強された発現を用いると、強力プロモーターを含むDNAの量を減少でき、またはより弱いプロモーターを含むDNAを、共レポーターを発現させるために用いることができる。さらに、本発明の合成レポーター遺伝子からのバックグランド発現を減少できる。この特性は、遺伝子の散発的な発現を最小化し、他の調節経路から生ずる障害を減少することにより、合成レポーター遺伝子をより望ましいものにする。
【0119】
結像系へのレポーター遺伝子の使用は、インビボでの生物学的研究または薬剤スクリーニングに用いることができるが、本発明の合成遺伝子の別の利用である。発現レベルが増加しているために、合成遺伝子によりコードされるタンパク質は、結像系によりより確実に検出できる。合成遺伝子によりコードされる蛍光タンパク質の場合、蛍光細胞分析分離(FACS)の間に、調査する人の必要に応じて、蛍光強度は増減する。その上、合成蛍光タンパク質遺伝子を、初代細胞のようなトランスフェクションが困難な細胞の転写を研究するため、および/または調節経路および遺伝的要素の解析を改善するために、融合タンパク質、例えば分泌リーダー配列または細胞局在配列を有する融合タンパク質を発現させるのに用いることができる。さらに、合成蛍光タンパク質遺伝子を目的の遺伝子と融合することができ、その結果、目的の遺伝子の発現を、例えば宿主細胞内で追跡することができる。
【0120】
別の用途として、極度の感度を必要とする稀な事象の検出(例えば、RNA再コード化の研究)、内在性リボソーム・エントリー部位(IRES)を用いたインビトロの翻訳またはTNTTM(プロメガ、ウィスコンシン州マディソン)のようなインビトロの転写-翻訳共役系の効率を改善するための使用、異なる宿主生物(例えば、植物、カビ等)に最適化された蛍光タンパク質の研究があげられるが、これに限定されない。その上、本発明の合成蛍光タンパク質をレポーターとして用いることができる。それゆえ、蛍光タンパク質をマルチウェルアッセイのレポーター分子として、および、異なるシグナル伝達経路と他の調節機構によりレポーターシグナルの可能な障害を最小化する利点をもった薬剤スクリーニングのレポーター分子として用いることができる。複数の合成蛍光タンパク質遺伝子を、例えば薬剤の毒性をモニターするための共レポーターとして用いることができる。
【0121】
さらに、本発明の核酸分子の用途として、インビトロおよびインビボでの遺伝子発現レベルを検出および/または測定する(例えば、プロモーター強度を測定する)ための蛍光顕微鏡、細胞内局在性またはターゲティング(融合タンパク質)、マーカーとして、検定に、キット(例えば、二重アッセイ)に、調節経路と遺伝的要素を解析するためのインビボでの結像のために、およびマルチウェルのフォーマットがあげられるが、これに限定されない。
【0122】
緑色蛍光タンパク質遺伝子を用いた本発明の実証
Green II、すなわちMontastraea cavernosaから単離された野生型遺伝子から作製された変異緑色蛍光タンパク質の遺伝子が、本発明を実証するために用いられた。Green IIは、光退色に対して高度の耐性を有している。それゆえ、例えば細胞のモニタリングに有用である。光退色は、蛍光プローブ中の光により誘導された変化であり、蛍光プローブによる特定波長光の吸収の消失および蛍光プローブの蛍光の消失をもたらす。この特性は、例えば、写真が得られる時間、または試料を観察する時間を減少することにより、いくつかの蛍光タンパク質の有用性を限定できる。したがって、高度の光退色耐性を有する蛍光タンパク質は、持続性の蛍光が所望される場合には有利である。
【0123】
以下の実施例は実例となる目的のみのために提供される。実施例は、現在記述されている発明をより詳細に理解するためにのみ、ここに取り込まれる。実施例は、記述されるまたはここにクレームされる発明の範囲を、いかなる方法でも限定しない。
【実施例1】
【0124】
合成緑色蛍光タンパク質核酸分子
McGFPは、Montastraea cavernosaから単離された緑色蛍光タンパク質(GFP)である。McGFPを第一回目の低ストリンジェンシーPCRの間に変異させ、野生型遺伝子に突然変異を導入した。第一回目のPCRから、Green Iを製造した。Green Iは、野生型GFPよりも比較的高い蛍光強度を有していた。Green Iを、Green IをコードするDNAに対して行った第二回目の低ストリンジェンシーPCRの間に変異させ、Green IIを作出した。Green IをコードするDNA配列と比較すると、Green IIをコードするDNAは、一個のヌクレオチドの変化:ヌクレオチド527のシトシンのチミンへの突然変異を含んでいる。この結果、Green Iの76番目のSが、Green IIの同位置ではFとなる。Green IIは光退色に対して高い耐性を有していた。
【0125】
Green IIを核酸配列のヒト化のための元の遺伝子として用いた。合成遺伝子配列をインシリコで、以下のソフトウェアツールを用いて設計した:マトリックス・ファミリー・ライブラリーVer 2.3および2.4に付随のMatInspectorプロフェッショナル リリース5.2、プロモーター・モジュール・ライブラリーVer 2.2および2.3に付随のModelInspectorプロフェッショナル リリース4.7.8および4.7.9、およびSequenceShaper リリース2.3(全て、Genomatix Software GmbH、ドイツ・ミュンヘンから入手)。遺伝子を1)哺乳動物細胞での発現で最適化したコドン使用を有し、2)脊椎動物の転写因子結合配列、スプライシング配列、ポリ(A)付加配列、プロモーター配列ならびに原核生物(例えば、大腸菌)の調節配列を含む転写調節配列の数を減少させ、3)Kozak配列を有し、4)クローニングのための少なくとも一つの新規制限酵素認識配列を有し、および5)不要な制限酵素認識配列、例えば標準的なクローニング法を妨害すると思われる配列をなくすように設計した。
【0126】
全ての設計の基準が同時に等しく十分に満たされるというわけではない。次の優先順位が確立している:脊椎動物の転写因子(TF)結合配列の削除が最も高い優先順位となり、続いて、スプライシング配列およびポリ(A)付加配列の削除、最後に原核生物の調節配列。調節配列を削除する場合、方針としては、最も重要な変化が確実に最後になるように、重要度の低いものから最も高いものへ作業し、これらの改良に対する不用意な変化は生じなかった。その後、新しい優先度の低い配列の出現について配列を再度チェックし、必要に応じて別の改変を加えた。それゆえ、ここに記述したコンピュータープログラムを用いた合成遺伝子配列を設計する工程は、以下に詳細に述べる繰り返し工程を任意に含む。
【0127】
MatInspectorプロフェッショナルはDNA配列中の転写因子結合配列を検索するためのこれらの配列のマトリックス記述を用いる。マトリックス記述は、転写因子負荷(weight)マトリックスデータベース(転写因子結合配列のマトリックス記述のライブラリー)に含まれる。MatInspectorの方法は元々はQuandtら、1995に記載された(Quandt, K., Frech, K., Karas, H., Wingender, E., Werner, T. (1995)MatInd and MatInspector:ヌクレオチド配列データ中のコンセンサスマッチの検出のための新しい迅速で多目的なツール(MatInd and MatInspector: new fast and versatile tools for detection of consensus matches in nucleotide sequence data.) Nucleic Acids Res. 1995, vol. 23, 4878-4884)。
【0128】
転写因子負荷マトリックスデータベース内で、マトリックス記述はカテゴリー(例えば、カビ、昆虫、植物、脊椎動物等の転写因子結合配列)に分けられる。それぞれのマトリックス記述はマトリックスファミリーに属し、MatInspectorプロフェッショナルにより繰り返しの一致を削除するように、類似および/または関連マトリックス記述が一つにまとめられる。ユーザーは、転写因子結合配列または他の配列、例えば他の転写調節配列または制限酵素配列のそれ自身のマトリックス記述を加えることができる。実施例で用いられるデータベースのバージョンは、マトリックス・ファミリー・ライブラリーVer 2.3(103ファミリー、264の脊椎動物マトリックス記述を含む)およびマトリックス・ファミリー・ライブラリーVer 2.4(106ファミリー、275の脊椎動物マトリックス記述を含む)であった。
【0129】
MatInspectorプロフェッショナルを用いた検索を行うために、ユーザーは検索に用いるマトリックス記述のサブセットを定義し、保存できる。さらに、ユーザーは検索に用いるそれぞれのマトリックス記述に対してthresholdスコア・パラメーター「コア類似性」および「マトリックス類似性」を定義できる。「コア配列」は、マトリックス記述内の最も保存された配列、典型的には四つの配列として定義される。コア類似性およびマトリックス類似性のスコアは、Quandtら、1995の記載に従って計算される。マトリックス記述と完全に一致するとスコア1.00となる(それぞれの配列位置は、マトリックス記述の位置において最も高度に保存されたヌクレオチドに相当する);「良好な」マトリックス記述との一致は通常、スコア>0.80の類似性を有する。マトリックス記述の高度に保存された位置におけるミスマッチは、殆ど保存されていない領域のミスマッチよりもマトリックス類似性スコアを減少させる。「最適化」マトリックス類似性スコアのthresholdは、偽陽性および偽陰性を最小化するように設計されているが、転写因子負荷マトリックスデータベースのそれぞれ個々のマトリックス記述に供給される(および自動的にユーザー定義マトリックスについて計算される)。
【0130】
本実施例で記述される配列解析に用いられるユーザー定義マトリックス・サブセットおよびそのマトリックススコアのパラメーター(「コア類似性threshold/マトリックス類似性threshold」と記述される)を以下に示す。このサブセットの変化は個々の設計工程で記述される。このサブセットは全ての脊椎動物マトリックスファミリー(ALL vertebrates.lib)および多くのユーザー定義マトリックスファミリー(U$)を含み、それらのIUPAC(国際純正応用化学連合)コンセンサス配列が適当に以下に示される。真核生物のスプライスドナー配列(5’、「スプライス-A」)およびアクセプター配列(3’、「スプライス-D」)はLodishら、2000(分子細胞生物学(Molecular Cell Biology)、第4版、Lodishら 2000、p.416)およびAlbertsら、1994(細胞の分子生物学(Molecula Biology of the Cell)、第3版、1994、Albertsら、p.373)に基づいて作出された。Kozak配列のマトリックス記述は、Kozak、1987に基づいて作られた(699の脊椎動物のメッセンジャーRNAに由来する5’非コーディング配列の解析。Nucleic Acids Research、1987、第15巻、p.8125)。二つのポリ(A)配列のマトリックス記述は、Tabaska、1999に基づくものであった(ヒトDNA配列中のポリアデニル化シグナルの検出、Tabaska JE、ZHANG MQ、Gene 1999、231(1-2):77-86)。大腸菌リボソーム結合配列(「EC-RBS」)のマトリックス記述は、Glass RE、1992(遺伝子機能:大腸菌とその遺伝的要素。カリフォルニア大学出版、1982、Robert E. Glass、p.95)およびRingquist、1992(大腸菌における翻訳開始;リボソーム結合部位内の配列。Ringquist, Stevenら、Molecular Microbiology、1992、6(9)、p.1221)に基づいて作製された。大腸菌プロモーターの−10および−35配列(「EC-P-10」および「EC-P-35」)および完全な大腸菌プロモーター配列、すなわち、16、17または18ヌクレオチドのスペーサー配列で分断された−35および−10配列(「EC-Prom」)のマトリックス記述は、Lisserら、1993に基づいて作られた(大腸菌mRNAプロモーター配列の編集。S. Lisser and H. Margalit、Nucleic Acids Research、1993、第21巻、第7号、p.1512)。制限酵素認識配列は、生化学試薬を供給する会社、例えばプロメガ・コーポレーションのカタログ、またはデータベース、例えばRebaseTM (
1122943613281_2.html
)で見出すことができる。
【0131】
ユーザー定義マトリックス・サブセットにおけるそれぞれのマトリックス記述のマトリックススコアのパラメーターは、目的の配列の設計基準に一致するように選択された。脊椎動物の転写因子結合配列を同定するためのスコア・パラメーター(0.75/最適化)およびいくつかのユーザー定義転写調節配列のためのよりストリンジェントなスコア・パラメーター(すなわち、増加したコアおよび/またはマトリックス類似性)を選択した。制限酵素認識配列は、マトリックスへの完全な一致だけが目的なので、マトリックス類似性thresholdが1.00とした。
【0132】
【表2】
【0133】
目的の配列で転写調節配列または制限酵素認識配列の同定を行うためにMatInspectorプロフェッショナルのようなプログラムを用いる場合、実際の目的の配列に加え、5’および3’隣接DNA配列を含むことが好ましい。隣接DNA配列の例としては、目的の配列が発現ベクターにクローニングされているならば予想される配列、および/または短い、漠然としたDNA配列、例えば「NNN」があげられる。これは、検索アルゴリズムが例えば目的の配列の5’または3’端で重複あるいはぴったり重なっている転写調節配列を検出しそこなう可能性を低くする。本実施例において、遺伝子配列(ORF)は5’および3’隣接DNA配列を含んでいた。本実施例で用いられる隣接配列を図4A-4Dに小文字で示した。
【0134】
MatInspectorプロフェッショナルを用いた配列中の転写調節配列または制限酵素認識配列の同定の後、これらの配列の一つ以上を、手動またはソフトウェアツールを用いて、同一アミノ酸をコードする別のコドンに置換することにより削除する。一つの転写調節配列または制限酵素認識配列の削除によりまた一つ以上の新たな転写調節配列または制限酵素認識配列が生ずる可能性があることを認識せねばならない。それゆえ、転写調節配列または制限酵素認識配列の同定および削除の工程は、最適配列になるまでしばしば繰り返される。
【0135】
本実施例において、SequenceShaper、転写因子結合配列または他のユーザー定義配列を削除するためのソフトウェアツールを用いた。これは、(MatInspector工程で用いられたユーザー定義のマトリックスサブセットに基づく)新たな配列を導入し、コードされるポリペプチドを変化させることなしに、MatInspectorプロフェッショナルを用いて同定されたいくつかの配列を同時に欠失させるものである。削除のために選択されたそれぞれの配列について、ユーザー定義パラメーターにより限定される可能な突然変異のリストが作成される。用いた標準パラメーターは、特に記載しない限り、以下のとおりであった:
SequenceShaper標準パラメーター:
・Remaining threshold: 0.70コア類似性/最適化-0.20マトリックス類似性(初期値)
・別の部位を挿入しない
・オープンリーディングフレーム(ORF)を保存する
「Remaining threshold」は、突然変異が導入された後にそれぞれの同定された配列が有するスコアを特定する。可能な突然変異が見出されないならば、これらのthresholdは増加する。「別の部位を挿入しない」ことにより、MatInspectorプロフェッショナルを用いた配列の同定に用いられるユーザー定義マトリックスに含まれる別の配列の生成が妨げられる。「オープンリーディングフレーム(ORF)を保存する」ことにより、提起されるべき、配列がコードするアミノ酸に影響しない唯一の突然変異が得られる。可能な突然変異のリストから、好ましいコドンを導入したものを好ましく選択した。マイナス鎖の大腸菌リボソーム結合配列および下流21塩基より短い位置のメチオニンコドンが続かないものは無視した。いくつかの転写調節配列または制限酵素認識配列は、新たな転写調節配列または制限酵素認識配列を導入せずに削除することは不可能であった。そのような場合には、記述した設計基準に最も一致するいずれかの配列を保守するように決定した。
【0136】
ModelInspectorプロフェッショナルを用いて、さらに解析を行った。このソフトウェアツールは、明確な距離と方向性を有する二つ以上の転写因子結合配列を含むDNA配列において、領域を定めるために、実験的に検証されたプロモーター分子のライブラリーを用いる。(Frech, K.ら、調節ユニットの高度に特異的なモデルを開発するための新規方法は機能プロモーターを含むGenBankの新しいLTRを検出する J. Mol. Biol.、1997、270(5)、674-687)。
【0137】
ここに記述したコンピュータープログラムを用いて、合成hGreen II遺伝子配列を設計する工程は、以下に述べるいくつかの任意の反復工程を含む。
【0138】
1.元の遺伝子(Green II;配列番号:21)のコーディング領域のコドン使用は哺乳動物で発現するために、アミノ酸配列を改変することなしに最適化されており、隣接配列がコーディング領域の5’および3’端に付加された(その結果、2M1-h(配列番号:3)を作製)。
【0139】
2.マトリックス・ファミリー・ライブラリーVer 2.3に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセット(NaeI、Kozak、ポリAシグナルを除く)を用いて、転写調節配列および制限酵素配列について、配列2M1-hを解析した。
【0140】
3.SequenceShaperの標準パラメーターを用いた上記の基準に従って、できるだけ多くの好ましくない配列を除去した(その結果、配列2M1-h1(配列番号:5)を作製)。
【0141】
4.さらに好ましくない配列をSequenceShaperを用いて削除し、マトリックス類似性thresholdを最適化0.01にあげた(その結果、配列2M1-h2(配列番号:7)を作製)。
【0142】
5. さらに好ましくない配列をSequenceShaperを用いて削除し、コア類似性thresholdを0.75に、マトリックス類似性thresholdを最適化0.01にあげた(その結果、配列2M1-h3(配列番号:9)を作製)。
【0143】
6.配列2M1-h3を、プロモーター・モジュール・ライブラリーVer 2.2およびゲノムリピート・ライブラリーVer 1.0に付随のModelInspectorプロフェッショナル リリース4.7.8を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートの存在について、解析した。プロモーター・モジュールまたはゲノムリピートを見出すことはできなかった。
【0144】
7.配列2M1-h3を、2位のアミノ酸のセリンのコドン(AGC)をグリシンのコドン(GGC)に変え、よりKozakコンセンサス配列に一致させた;これはまた、NaeI制限酵素配列を遺伝子配列の5’端に重複させて導入する(その結果、配列2M1-h4(配列番号:11)を作製)。
【0145】
8.マトリックス・ファミリー・ライブラリーVer 2.3に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセット(NaeI、Kozak、ポリAシグナルを除く)を用いて、転写調節配列および制限酵素配列について、配列2M1-h4を解析した。
【0146】
9.内部NcoI配列を配列2M1-h4から、SequenceShaperの標準パラメーターを用いて削除した(その結果、配列2M1-h5(配列番号:13)を作製)。
【0147】
10.配列2M1-h5を、プロモーター・モジュール・ライブラリーVer 2.2およびゲノムリピート・ライブラリーVer 1.0に付随のModelInspectorプロフェッショナル リリース4.7.8を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートの存在について、解析した。プロモーター・モジュールまたはゲノムリピートを見出すことはできなかった。
【0148】
11.配列2M1-h5を、5’および3’隣接領域を変えることにより、および227位のリジンのコドン(AAG)をグリシンのコドン(GGC)に変え、新しいNaeI制限酵素配列を導入し、例えば融合タンパク質の作製のためのクローニング配列を提供することにより、さらに修飾した(その結果、配列2M1-h6(配列番号:15)を作製)。
【0149】
12.マトリックス・ファミリー・ライブラリーVer 2.4に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセット(NaeIを除く)を用いて、転写調節配列および制限酵素配列について、配列2M1-h6を解析した。アップデートしたマトリックス・ファミリー・ライブラリーのため、いくつかの新しい転写因子結合配列が同定された。
【0150】
13.配列2M1-h6を、プロモーター・モジュール・ライブラリーVer 2.3およびゲノムリピート・ライブラリーVer 1.0に付随のModelInspectorプロフェッショナル リリース4.7.9を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートについて、解析した。プロモーター・モジュールおよびゲノムリピートを見出すことはできなかった。
【0151】
14.配列2M1-h6を5’隣接領域を変えることによりさらに修飾した(その結果、配列2M1-h7(配列番号:17)を作製)。
【0152】
15.マトリックス・ファミリー・ライブラリーVer 2.4に付随のMatInspectorプロフェッショナルおよびユーザー定義のマトリックス・サブセットを用いて、転写調節配列および制限酵素配列について、配列2M1-h7を解析した。
【0153】
16.できる限り多くの配列を、SequenceShaperにより、最初に標準パラメーターを、次いでストリンジェンシーを弱めたパラメーターを用いて、削除した(Remaining threshold:0.75コア類似性/最適化-0.01マトリックス類似性)。
【0154】
17.残りの好ましくない転写調節配列を2M1-h7から削除するために、脊椎動物の転写因子結合配列と制限酵素配列だけを含むユーザー定義マトリックス・サブセットを用いて、前の二つの工程を繰り返した。この結果、別の優先度の低い配列、例えば大腸菌リボソーム結合およびプロモーター配列、スプライシング・ドナーおよびアクセプター配列、およびポリ(A)配列を導入することにより別の優先度の高い転写調節配列を除去した(それにより配列2M1-h8(配列番号:19);hGreen IIと呼ばれる領域をコードする遺伝子を作製した)。
【0155】
18.配列2M1-h8を、プロモーター・モジュール・ライブラリーVer 2.3に付随のModelInspectorプロフェッショナル リリース4.7.9を用いて、初期設定のパラメーターで、プロモーター・モジュールおよびゲノムリピートについて、解析した。プロモーター・モジュールを見出すことはできなかった。
【0156】
19.5’および3’NNNsを除く2M1-h8の配列を、ブルーへロン・バイオテクノロジー社(22310 20th Avenue SE #100, Bothell, WA 98021)で、その独自の合成技術を用いて合成した。
【0157】
最終的に合成された合成遺伝子のバージョンをここではhGreen IIとして示す。hGreen IIの最終的な配列は、3個の脊椎動物転写因子結合配列を有し、一方、元のGreen II分子は67個の脊椎動物転写因子結合配列を含む。図2A-2Bは、hGreen IIと元のGreen IIをコードするDNAのアラインメントを示し、図3はhGreen IIと元のGreen IIのDNAによりコードされるアミノ酸のアラインメントを示し、図4A-4Dは、それぞれの隣接配列を含む、GreenIIおよび2M1-h8の中間体バージョンをコードする各種DNA配列のアラインメントを示す。
【0158】
図3に示したように、hGreen IIと元のGreen IIの間には、アミノ酸の位置2および227で、たった二つのアミノ酸の違いしかない。アミノ酸2の位置で、hGreen IIはGly(GGC)を有し、元のGreen IIは同位置でSer(AGT)を有する。このコドンで、DNA配列は改善した発現を示すためのコザック(Kozak)配列を加えるように変えられた。さらに、アミノ酸227の位置で、hGreen IIはGly(GGC)を有し、一方、元のGreen IIは同位置でLys(AAG)を有する。このDNA配列への変化は新規のNaeI精原配列を加え、例えば融合タンパク質を作出するためのクローニング部位を提供する。
【実施例2】
【0159】
ベクター構築物を、合成hGreen II遺伝子をプラスミドpCI-Neo哺乳動物発現ベクター(プロメガ社)にクローニングすることにより作製した。さらに、ベクター構築物を、元のGreen II遺伝子をプラスミドpCI-Neo哺乳動物発現ベクター(プロメガ社)にクローニングすることにより作製した。図5A-5Bおよび6A-6Bに示したように、hGreen II構築物はCHO細胞中で元のGreen II構築物よりも僅かに高い発現を示した。CHO細胞を用いた最初の実験で、元のGreen IIは19.8%のトランスフェクション効率を示し(図5A)、hGreen IIは21.2%のトランスフェクション効率を示した(図5B)。CHO細胞を用いた第二の実験において、元のGreen IIは24.2%のトランスフェクション効率を示し(図6A)、hGreen IIは25.5%のトランスフェクション効率を示した(図6B)。より重要なことに、蛍光の程度はhGreen II構築物で形質転換した細胞でより高かった。図5Aにおいて、22.4%の元のGreen IIがトランスフェクトしていない細胞より3 full logs高く蛍光を発し、一方、図5Bは、ヒト化Green IIをトランスフェクトした細胞の24.6%がトランスフェクトしていない細胞より3 full logs高く蛍光を発することを示している。図6Aおよび6Bでは、トランスフェクトしていない細胞に対して3 full logs蛍光を発する細胞のパーセンテージはそれぞれ、24.2%と28.9%である。NIH3T3細胞では、このマウス細胞系でこのプラスミドでの効率として、元のGreen IIは10.5%のトランスフェクション効率を示し(図7A)、hGreen IIは9.7%のトランスフェクション効率を示した(図7B)。しかし、トランスフェクトしていない対照に対して3 logsで蛍光を発する細胞のパーセンテージは、元のプラスミドに関しては6.7%であり、hGreen IIに関しては14.4%で、115%の増加である。そのような違いは、これらのいずれもが核酸配列が最適化されていない種であるので、予想されることは、注目すべきである。
【0160】
図8A-8Fは、元のGreen IIベクター構築物およびhGreen IIベクター構築物を用いてトランスフェクトしたNIH3T3細胞のトランスフェクション後2日、3日および6日目のイメージを示す。それぞれの時点において、図7と一致して、hGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞は元のGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞よりも高い蛍光タンパク質の発現を示す。
【0161】
図9は、それぞれルシフェラーゼレポーターを共トランスフェクトした、濃度を増加したhGreen IIベクター構築物およびGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞を示すグラフである。ルシフェラーゼ活性をY軸で、GFP構築物の相対的%をX軸で示した。この実験は、GFPプラスミドが非生産的な転写因子結合という事象の「受信装置」として作用しているかを間接的に測定するものである。細胞転写因子がGFPプラスミドに高度に結合するならば、ルシフェラーゼの発現は弱められる。この図は、hGreen IIの存在下で、GFPの存在量とは無関係に、ルシフェラーゼの発現は比較的安定していることを示している。元のGreen IIのレベルが増加すると、ルシフェラーゼの発現は弱められる。この発見は、低発現転写物を研究したいならば重要である;転写因子を非生産的に用いるレポーターはアッセイの結果を損なうであろう。
【図面の簡単な説明】
【0162】
【図1】コドンおよびそれらに対応するアミノ酸を示す。
【図2A】ヒト化緑色蛍光タンパク質をコードするDNA配列(配列番号:1)およびMontastraea cavernosaタンパク質に由来するタンパク質(Green II)をコードするDNA配列(配列番号:21)の配列アラインメントを示す。ヒト化hGreen IIをGreen IIから作出した。このアラインメントにおいて、アラインされた配列間の違いを、「コンセンサス」行のモノマーを消すことによって示した。
【図2B】ヒト化緑色蛍光タンパク質をコードするDNA配列(配列番号:1)およびMontastraea cavernosaタンパク質に由来するタンパク質(Green II)をコードするDNA配列(配列番号:21)の配列アラインメントを示す。ヒト化hGreen IIをGreen IIから作出した。このアラインメントにおいて、アラインされた配列間の違いを「コンセンサス」行のモノマーを消すことによって示した。
【図3】hGreen IIのDNA配列(配列番号:2)およびGreen IIのDNA配列(配列番号:22)によりコードされるアミノ酸のアミノ酸アラインメントを示す。このアラインメントにおいて、アラインされる配列間の違いを「コンセンサス」行のモノマーを消すことによって示した。
【図4A】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図4B】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図4C】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図4D】実施例1に記載したGreen IIとhGreen IIとの中間体をコードするDNAの配列アラインメントを示す。このアラインメントにおいて、小文字はフランキング配列を、大文字はコーディング領域を意味する。
【図5】Green IIベクター構築物(図5A)およびhGreen IIベクター構築物(図5B)をトランスフェクトした50,000個のCHO細胞の、トランスフェクション効率(上/大きな長方形)およびトランスフェクション24時間後のFACSアッセイによる蛍光の対数を示すグラフである。
【図6】Green IIベクター構築物(図6A)およびhGreen IIベクター構築物(図6B)をトランスフェクトした50,000個のCHO細胞の、トランスフェクション効率(上/大きな長方形)およびトランスフェクション24時間後のFACSアッセイによる蛍光の対数を示すグラフである。
【図7】Green IIベクター構築物(図7A)およびhGreen IIベクター構築物(図7B)をトランスフェクトした50,000個のNIH3T3細胞の、トランスフェクション効率(上/大きな長方形)およびトランスフェクション24時間後のFACSアッセイによる蛍光の対数を示すグラフである。
【図8】Green IIベクター構築物およびhGreen IIベクター構築物をトランスフェクトしたNIH3T3細胞の2、3および6日目におけるイメージを示す。
【図9】ルシフェラーゼレポーターを足した濃度を増加したGreen IIベクター構築物およびhGreen IIベクター構築物でトランスフェクトしたNIH3T3細胞を示すグラフである。ホタルのルシフェラーゼを細胞毒性のレポーターとして用いた。
【配列表】
【特許請求の範囲】
【請求項1】
蛍光タンパク質をコードする元の核酸配列のコドンと25%超の異なるコドン組成を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する合成核酸分子であって、前記合成核酸分子が前記元の核酸配列のそのような配列の平均数に比べて少なくとも3倍より少ない転写調節配列を有している合成核酸分子。
【請求項2】
請求項1記載の合成核酸分子であって、前記転写調節配列が転写因子結合配列、イントロンスプライス配列、ポリ(A)付加配列およびプロモーター配列からなる群から選択される合成核酸分子。
【請求項3】
請求項1記載の合成核酸分子であって、前記合成核酸分子が前記元の核酸配列のそのような配列の平均数に比べて少なくとも5倍少ない転写調節配列を有している合成核酸分子。
【請求項4】
請求項1記載の合成核酸分子であって、前記合成核酸分子によりコードされるポリペプチドが前記元の核酸配列によりコードされるポリペプチドと少なくとも85%の配列同一性を有する合成核酸分子。
【請求項5】
請求項1記載の合成核酸分子であって、前記合成核酸分子によりコードされるポリペプチドが前記元の核酸配列によりコードされるポリペプチドと少なくとも90%の連続した配列同一性を有する合成核酸分子。
【請求項6】
請求項1記載の合成核酸分子であって、前記合成核酸分子のコドン組成が前記元の核酸配列と35%超のコドンで異なる合成核酸分子。
【請求項7】
請求項1記載の合成核酸分子であって、前記合成核酸分子のコドン組成が前記元の核酸配列と45%超のコドンで異なる合成核酸分子。
【請求項8】
請求項1記載の合成核酸分子であって、前記合成核酸分子のコドン組成が前記元の核酸配列と55%超のコドンで異なる合成核酸分子。
【請求項9】
請求項1記載の合成核酸分子であって、異なるコドンの大部分が望ましい宿主細胞の好ましいコドンである合成核酸分子。
【請求項10】
請求項1記載の合成核酸分子であって、前記合成核酸分子が緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項11】
請求項1記載の合成核酸分子であって、前記合成核酸分子が元々Montastraea cavernosaから単離された核酸に由来する緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項12】
請求項1記載の合成核酸分子であって、前記合成核酸分子が配列番号:1(hGreen II)を含有する合成核酸分子。
【請求項13】
請求項1記載の合成核酸分子であって、前記元の核酸配列が緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項14】
請求項13記載の合成核酸分子であって、前記元の核酸配列がMontastraea cavernosaから単離された緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項15】
請求項14記載の合成核酸分子であって、前記合成核酸分子が配列番号:2のアミノ酸をコードする合成核酸分子。
【請求項16】
請求項1記載の合成核酸分子であって、前記合成核酸分子中で異なるコドンの大部分が哺乳動物でより頻度高く用いられるコドンである合成核酸分子。
【請求項17】
請求項1記載の合成核酸分子であって、前記合成核酸分子中で異なるコドンの大部分がヒトで好ましく用いられるコドンである合成核酸分子。
【請求項18】
請求項17記載の合成核酸分子であって、異なるコドンの大部分がヒトのコドンCGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGCおよびTTCである合成核酸分子。
【請求項19】
請求項17記載の合成核酸分子であって、異なるコドンの大部分がヒトのコドンCGC、CTG、TCT、ACC、CCA、GCC、GGC、GTCおよびATC、またはコドンCGT、TTG、AGC、ACT、CCT、GCT、GGT、GTGおよびATTである合成核酸分子。
【請求項20】
請求項1記載の合成核酸分子であって、前記合成核酸分子中で異なるコドンの大部分が植物で好ましく用いられるコドンである合成核酸分子。
【請求項21】
請求項20記載の合成核酸分子であって、異なるコドンの大部分が植物のコドンCGC、CTT、TCT、TCC、ACC、CCA、CCT、GCT、GGA、GTG、ATC、ATT、AAG、AAC、CAA、CAC、GAG、GAC、TAC、TGCおよびTTCである合成核酸分子。
【請求項22】
請求項20記載の合成核酸分子であって、異なるコドンの大部分が植物のコドンCGC、CTT、TCT、ACC、CCA、GTC、GGA、GTCおよびATC、またはコドンCGT、TGG、AGC、ACT、CCT、GCC、GGT、GTGおよびATTである合成核酸分子。
【請求項23】
請求項1記載の合成核酸分子であって、前記合成核酸分子が哺乳動物宿主細胞中で、前記元の核酸配列のレベルよりも高いレベルで発現される合成核酸分子。
【請求項24】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したCTGまたはTTGのロイシンをコードするコドン数を有する合成核酸分子。
【請求項25】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したGTGまたはGTCのバリンをコードするコドン数を有する合成核酸分子。
【請求項26】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したGGCまたはGGTのグリシンをコードするコドン数を有する合成核酸分子。
【請求項27】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したATCまたはATTのイソロイシンをコードするコドン数を有する合成核酸分子。
【請求項28】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したCCAまたはCCTのプロリンをコードするコドン数を有する合成核酸分子。
【請求項29】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したCGCまたはCGTのアルギニンをコードするコドン数を有する合成核酸分子。
【請求項30】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したAGCまたはTCTのセリンをコードするコドン数を有する合成核酸分子。
【請求項31】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したACCまたはACTのスレオニンをコードするコドン数を有する合成核酸分子。
【請求項32】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したGCCまたはGCTのアラニンをコードするコドン数を有する合成核酸分子。
【請求項33】
請求項1記載の合成核酸分子であって、前記合成核酸分子中の異なるコドンが前記元の核酸配列中の対応するコドンと同一のアミノ酸をコードする合成核酸分子。
【請求項34】
請求項1記載の合成核酸分子であって、前記合成核酸分子が前記元の核酸配列のレベルの少なくとも110%のレベルで同一条件下細胞または細胞抽出物に発現される合成核酸分子。
【請求項35】
請求項1記載の合成核酸分子であって、前記合成核酸分子によりコードされるポリペプチドがアミノ酸配列において、前記元の核酸配列によりコードされるポリペプチドと同一である合成核酸分子。
【請求項36】
請求項1記載の合成核酸分子であって、前記合成核酸分子が配列番号:1(hGreen II)、配列番号:3のヌクレオチド22から702(2M1-h)、配列番号:5のヌクレオチド22から702(2M1-h1)、配列番号:7のヌクレオチド22から702(2M1-h2)、配列番号:9のヌクレオチド22から702(2M1-h3)、配列番号:11のヌクレオチド22から702(2M1-h4)、配列番号:13のヌクレオチド22から702(2M1-h5)、配列番号:15のヌクレオチド39から719(2M1-h6)、または配列番号:17のヌクレオチド38から718(2M1-h7)を含有する合成核酸分子。
【請求項37】
元のベクター骨格に比べて少なくとも3倍少ない転写調節配列を有する合成ベクター骨格と請求項1記載の核酸を含有するベクター構築物。
【請求項38】
請求項1記載の合成核酸分子を含有するプラスミド。
【請求項39】
細胞中で機能するプロモーターを連結した請求項1記載の合成核酸分子を含有する発現ベクター。
【請求項40】
請求項39記載の発現ベクターであって、前記合成核酸分子が操作できるようにコザックコンセンサス配列に連結している発現ベクター。
【請求項41】
請求項39記載の発現ベクターであって、前記プロモーターが哺乳動物細胞中で機能する発現ベクター。
【請求項42】
請求項39記載の発現ベクターであって、前記プロモーターがヒト細胞中で機能する発現ベクター。
【請求項43】
請求項39記載の発現ベクターであって、前記プロモーターが植物細胞中で機能する発現ベクター。
【請求項44】
請求項39記載の発現ベクターであって、前記発現ベクターがさらにマルチクローニング部位を含有する発現ベクター。
【請求項45】
請求項44記載の発現ベクターであって、前記マルチクローニング部位が前記プロモーターと前記合成核酸分子との間に位置する発現ベクター。
【請求項46】
請求項44記載の発現ベクターであって、前記マルチクローニング部位が前記合成核酸分子の下流に位置する発現ベクター。
【請求項47】
請求項39記載の発現ベクターを含有する宿主細胞。
【請求項48】
適当な容器中に請求項39記載の発現ベクターを含有するキット。
【請求項49】
少なくとも低ストリンジェンシーのハイブリダイゼーション条件下、配列番号:1(hGreen II)、配列番号:3のヌクレオチド22から702(2M1-h)、配列番号:5のヌクレオチド22から702(2M1-h1)、配列番号:7のヌクレオチド22から702(2M1-h2)、配列番号:9のヌクレオチド22から702(2M1-h3)、配列番号:11のヌクレオチド22から702(2M1-h4)、配列番号:13のヌクレオチド22から702(2M1-h5)、配列番号:15のヌクレオチド39から719(2M1-h6)、または配列番号:17のヌクレオチド38から718(2M1-h7)を含有する前記合成核酸分子またはその相補体とハイブリダイズするポリヌクレオチド。
【請求項50】
請求項49記載のポリヌクレオチドであって、前記ポリヌクレオチドが低ストリンジェンシーのハイブリダイゼーション条件で、配列番号:1(hGreen II)を含有する前記合成核酸分子またはその相補体とハイブリダイズするポリヌクレオチド。
【請求項51】
a)蛍光ポリペプチドをコードする元の核酸配列に比べて少なくとも3倍少ない転写調節配列を有する合成核酸分子を得るために、前記元の核酸配列中にある複数の転写調節配列を変化させること、および
b)さらに合成核酸分子を得るために、転写調節配列を減少させた前記合成核酸配列中にある25%より多くののコドンを変化させること、
を特徴とする、オープンリーディングフレームを含有する合成核酸分子を調製する方法であって、変化させるコドンが転写調節配列を増加させず、前記さらなる合成核酸分子が、前記元の核酸配列によりコードされるポリペプチドと85%以上のアミノ酸同一性を有するポリペプチドをコードする方法。
【請求項52】
a)コドンを変化させた合成核酸分子を得るために、蛍光ポリペプチドをコードする元の核酸配列中にある25%より多くのコドンを変化させること、および
b)前記元の核酸配列の対応するコドンとは異なるコドンを有する合成核酸分子と比べて少なくとも3倍少ない転写調節配列を有するさらなる合成核酸分子を得るために、前記コドンを変化させた合成核酸分子中にある複数の転写調節配列を変化させること、
を特徴とする、オープンリーディングフレームを含有する合成核酸分子を調製する方法であって、前記さらなる合成核酸分子が、前記元の核酸配列によりコードされるポリペプチドと85%以上のアミノ酸同一性を有するポリペプチドをコードする方法。
【請求項53】
請求項51または52に記載の方法であって、前記転写調節配列が転写因子結合配列、イントロンスプライス配列、ポリ(A)付加配列、エンハンサー配列およびプロモーター配列からなる群から選択される方法。
【請求項54】
請求項51または52に記載の方法であって、前記元の核酸配列が緑色蛍光ポリペプチドをコードする方法。
【請求項55】
請求項51または52に記載の方法であって、前記元の核酸配列がMontastraea cavernosaから単離された緑色蛍光ポリペプチドをコードする方法。
【請求項56】
請求項51または52に記載の方法であって、前記合成核酸分子が中程度のストリンジェンシーのハイブリダイゼーション条件下、前記元の核酸配列とハイブリダイズする方法。
【請求項57】
請求項51または52に記載の方法であって、変化したコドンが前記元の核酸配列中の対応するアミノ酸と同一のアミノ酸をコードする方法。
【請求項58】
請求項52または53に記載の方法により調製された前記さらなる合成核酸分子である合成核酸分子。
【請求項59】
請求項51または52に記載の方法であって、前記元の核酸配列によりコードされるポリペプチドと比べて少なくとも一つのアミノ酸置換があるポリペプチドをコードするために、前記さらなる合成核酸分子を変化させることをさらに特徴とする方法。
【請求項60】
請求項51または52に記載の方法であって、転写調節配列の前記変化が前記合成核酸分子によりコードされるポリペプチドの1%未満のアミノ酸置換を誘導する方法。
【請求項61】
a)前記元の核酸配列中にあるコドンの数に比べより頻繁に宿主細胞中で用いられる第一の複数のコドンが増加した合成核酸配列を得るために元の核酸配列を変化させること;および
b)前記元の核酸配列中にあるコドンの数に比べより頻繁に宿主細胞中で用いられる第二の複数のコドンが増加したさらなる合成核酸配列を得るために前記元の核酸配列を変化させること、
を特徴とする蛍光ポリペプチドをコードする元の核酸配列の異なる種類のコドンである少なくとも二つの合成核酸分子を調製する方法であって、前記第一の複数のコドンが前記第二の複数のコドンより異なり、前記合成核酸分子および前記さらなる合成核酸分子が同一のポリペプチドをコードする方法。
【請求項62】
請求項61に記載の方法であって、前記合成核酸分子、前記さらなる合成核酸分子、もしくはその両者と比べ、少なくとも3倍少ない転写調節配列を有する少なくとも一つのさらにさらなる合成核酸分子を得るために、前記合成核酸分子、前記さらなる合成核酸分子、もしくはその両者中の複数の転写調節配列を変化させることをさらに特徴とする方法。
【請求項63】
請求項61に記載の方法であって、第一の合成核酸配列によりコードされるポリペプチドと比べ、少なくとも一つのアミノ酸置換を有するポリペプチドをコードする第一の変化した合成配列を得るために、前記第一の合成配列中の少なくとも一つのコドンを変化させることをさらに特徴とする方法。
【請求項64】
請求項61に記載の方法であって、第一の合成核酸配列によりコードされるポリペプチドと比べ、少なくとも一つのアミノ酸置換を有するポリペプチドをコードする第二の変化した合成配列を得るために、前記第二の合成配列中の少なくとも一つのコドンを変化させることをさらに特徴とする方法。
【請求項1】
蛍光タンパク質をコードする元の核酸配列のコドンと25%超の異なるコドン組成を有する蛍光ポリペプチドのコーディング領域のヌクレオチドを含有する合成核酸分子であって、前記合成核酸分子が前記元の核酸配列のそのような配列の平均数に比べて少なくとも3倍より少ない転写調節配列を有している合成核酸分子。
【請求項2】
請求項1記載の合成核酸分子であって、前記転写調節配列が転写因子結合配列、イントロンスプライス配列、ポリ(A)付加配列およびプロモーター配列からなる群から選択される合成核酸分子。
【請求項3】
請求項1記載の合成核酸分子であって、前記合成核酸分子が前記元の核酸配列のそのような配列の平均数に比べて少なくとも5倍少ない転写調節配列を有している合成核酸分子。
【請求項4】
請求項1記載の合成核酸分子であって、前記合成核酸分子によりコードされるポリペプチドが前記元の核酸配列によりコードされるポリペプチドと少なくとも85%の配列同一性を有する合成核酸分子。
【請求項5】
請求項1記載の合成核酸分子であって、前記合成核酸分子によりコードされるポリペプチドが前記元の核酸配列によりコードされるポリペプチドと少なくとも90%の連続した配列同一性を有する合成核酸分子。
【請求項6】
請求項1記載の合成核酸分子であって、前記合成核酸分子のコドン組成が前記元の核酸配列と35%超のコドンで異なる合成核酸分子。
【請求項7】
請求項1記載の合成核酸分子であって、前記合成核酸分子のコドン組成が前記元の核酸配列と45%超のコドンで異なる合成核酸分子。
【請求項8】
請求項1記載の合成核酸分子であって、前記合成核酸分子のコドン組成が前記元の核酸配列と55%超のコドンで異なる合成核酸分子。
【請求項9】
請求項1記載の合成核酸分子であって、異なるコドンの大部分が望ましい宿主細胞の好ましいコドンである合成核酸分子。
【請求項10】
請求項1記載の合成核酸分子であって、前記合成核酸分子が緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項11】
請求項1記載の合成核酸分子であって、前記合成核酸分子が元々Montastraea cavernosaから単離された核酸に由来する緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項12】
請求項1記載の合成核酸分子であって、前記合成核酸分子が配列番号:1(hGreen II)を含有する合成核酸分子。
【請求項13】
請求項1記載の合成核酸分子であって、前記元の核酸配列が緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項14】
請求項13記載の合成核酸分子であって、前記元の核酸配列がMontastraea cavernosaから単離された緑色蛍光ポリペプチドをコードする合成核酸分子。
【請求項15】
請求項14記載の合成核酸分子であって、前記合成核酸分子が配列番号:2のアミノ酸をコードする合成核酸分子。
【請求項16】
請求項1記載の合成核酸分子であって、前記合成核酸分子中で異なるコドンの大部分が哺乳動物でより頻度高く用いられるコドンである合成核酸分子。
【請求項17】
請求項1記載の合成核酸分子であって、前記合成核酸分子中で異なるコドンの大部分がヒトで好ましく用いられるコドンである合成核酸分子。
【請求項18】
請求項17記載の合成核酸分子であって、異なるコドンの大部分がヒトのコドンCGC、CTG、TCT、AGC、ACC、CCA、CCT、GCC、GGC、GTG、ATC、ATT、AAG、AAC、CAG、CAC、GAG、GAC、TAC、TGCおよびTTCである合成核酸分子。
【請求項19】
請求項17記載の合成核酸分子であって、異なるコドンの大部分がヒトのコドンCGC、CTG、TCT、ACC、CCA、GCC、GGC、GTCおよびATC、またはコドンCGT、TTG、AGC、ACT、CCT、GCT、GGT、GTGおよびATTである合成核酸分子。
【請求項20】
請求項1記載の合成核酸分子であって、前記合成核酸分子中で異なるコドンの大部分が植物で好ましく用いられるコドンである合成核酸分子。
【請求項21】
請求項20記載の合成核酸分子であって、異なるコドンの大部分が植物のコドンCGC、CTT、TCT、TCC、ACC、CCA、CCT、GCT、GGA、GTG、ATC、ATT、AAG、AAC、CAA、CAC、GAG、GAC、TAC、TGCおよびTTCである合成核酸分子。
【請求項22】
請求項20記載の合成核酸分子であって、異なるコドンの大部分が植物のコドンCGC、CTT、TCT、ACC、CCA、GTC、GGA、GTCおよびATC、またはコドンCGT、TGG、AGC、ACT、CCT、GCC、GGT、GTGおよびATTである合成核酸分子。
【請求項23】
請求項1記載の合成核酸分子であって、前記合成核酸分子が哺乳動物宿主細胞中で、前記元の核酸配列のレベルよりも高いレベルで発現される合成核酸分子。
【請求項24】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したCTGまたはTTGのロイシンをコードするコドン数を有する合成核酸分子。
【請求項25】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したGTGまたはGTCのバリンをコードするコドン数を有する合成核酸分子。
【請求項26】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したGGCまたはGGTのグリシンをコードするコドン数を有する合成核酸分子。
【請求項27】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したATCまたはATTのイソロイシンをコードするコドン数を有する合成核酸分子。
【請求項28】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したCCAまたはCCTのプロリンをコードするコドン数を有する合成核酸分子。
【請求項29】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したCGCまたはCGTのアルギニンをコードするコドン数を有する合成核酸分子。
【請求項30】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したAGCまたはTCTのセリンをコードするコドン数を有する合成核酸分子。
【請求項31】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したACCまたはACTのスレオニンをコードするコドン数を有する合成核酸分子。
【請求項32】
請求項1記載の合成核酸分子であって、前記合成核酸分子が増加したGCCまたはGCTのアラニンをコードするコドン数を有する合成核酸分子。
【請求項33】
請求項1記載の合成核酸分子であって、前記合成核酸分子中の異なるコドンが前記元の核酸配列中の対応するコドンと同一のアミノ酸をコードする合成核酸分子。
【請求項34】
請求項1記載の合成核酸分子であって、前記合成核酸分子が前記元の核酸配列のレベルの少なくとも110%のレベルで同一条件下細胞または細胞抽出物に発現される合成核酸分子。
【請求項35】
請求項1記載の合成核酸分子であって、前記合成核酸分子によりコードされるポリペプチドがアミノ酸配列において、前記元の核酸配列によりコードされるポリペプチドと同一である合成核酸分子。
【請求項36】
請求項1記載の合成核酸分子であって、前記合成核酸分子が配列番号:1(hGreen II)、配列番号:3のヌクレオチド22から702(2M1-h)、配列番号:5のヌクレオチド22から702(2M1-h1)、配列番号:7のヌクレオチド22から702(2M1-h2)、配列番号:9のヌクレオチド22から702(2M1-h3)、配列番号:11のヌクレオチド22から702(2M1-h4)、配列番号:13のヌクレオチド22から702(2M1-h5)、配列番号:15のヌクレオチド39から719(2M1-h6)、または配列番号:17のヌクレオチド38から718(2M1-h7)を含有する合成核酸分子。
【請求項37】
元のベクター骨格に比べて少なくとも3倍少ない転写調節配列を有する合成ベクター骨格と請求項1記載の核酸を含有するベクター構築物。
【請求項38】
請求項1記載の合成核酸分子を含有するプラスミド。
【請求項39】
細胞中で機能するプロモーターを連結した請求項1記載の合成核酸分子を含有する発現ベクター。
【請求項40】
請求項39記載の発現ベクターであって、前記合成核酸分子が操作できるようにコザックコンセンサス配列に連結している発現ベクター。
【請求項41】
請求項39記載の発現ベクターであって、前記プロモーターが哺乳動物細胞中で機能する発現ベクター。
【請求項42】
請求項39記載の発現ベクターであって、前記プロモーターがヒト細胞中で機能する発現ベクター。
【請求項43】
請求項39記載の発現ベクターであって、前記プロモーターが植物細胞中で機能する発現ベクター。
【請求項44】
請求項39記載の発現ベクターであって、前記発現ベクターがさらにマルチクローニング部位を含有する発現ベクター。
【請求項45】
請求項44記載の発現ベクターであって、前記マルチクローニング部位が前記プロモーターと前記合成核酸分子との間に位置する発現ベクター。
【請求項46】
請求項44記載の発現ベクターであって、前記マルチクローニング部位が前記合成核酸分子の下流に位置する発現ベクター。
【請求項47】
請求項39記載の発現ベクターを含有する宿主細胞。
【請求項48】
適当な容器中に請求項39記載の発現ベクターを含有するキット。
【請求項49】
少なくとも低ストリンジェンシーのハイブリダイゼーション条件下、配列番号:1(hGreen II)、配列番号:3のヌクレオチド22から702(2M1-h)、配列番号:5のヌクレオチド22から702(2M1-h1)、配列番号:7のヌクレオチド22から702(2M1-h2)、配列番号:9のヌクレオチド22から702(2M1-h3)、配列番号:11のヌクレオチド22から702(2M1-h4)、配列番号:13のヌクレオチド22から702(2M1-h5)、配列番号:15のヌクレオチド39から719(2M1-h6)、または配列番号:17のヌクレオチド38から718(2M1-h7)を含有する前記合成核酸分子またはその相補体とハイブリダイズするポリヌクレオチド。
【請求項50】
請求項49記載のポリヌクレオチドであって、前記ポリヌクレオチドが低ストリンジェンシーのハイブリダイゼーション条件で、配列番号:1(hGreen II)を含有する前記合成核酸分子またはその相補体とハイブリダイズするポリヌクレオチド。
【請求項51】
a)蛍光ポリペプチドをコードする元の核酸配列に比べて少なくとも3倍少ない転写調節配列を有する合成核酸分子を得るために、前記元の核酸配列中にある複数の転写調節配列を変化させること、および
b)さらに合成核酸分子を得るために、転写調節配列を減少させた前記合成核酸配列中にある25%より多くののコドンを変化させること、
を特徴とする、オープンリーディングフレームを含有する合成核酸分子を調製する方法であって、変化させるコドンが転写調節配列を増加させず、前記さらなる合成核酸分子が、前記元の核酸配列によりコードされるポリペプチドと85%以上のアミノ酸同一性を有するポリペプチドをコードする方法。
【請求項52】
a)コドンを変化させた合成核酸分子を得るために、蛍光ポリペプチドをコードする元の核酸配列中にある25%より多くのコドンを変化させること、および
b)前記元の核酸配列の対応するコドンとは異なるコドンを有する合成核酸分子と比べて少なくとも3倍少ない転写調節配列を有するさらなる合成核酸分子を得るために、前記コドンを変化させた合成核酸分子中にある複数の転写調節配列を変化させること、
を特徴とする、オープンリーディングフレームを含有する合成核酸分子を調製する方法であって、前記さらなる合成核酸分子が、前記元の核酸配列によりコードされるポリペプチドと85%以上のアミノ酸同一性を有するポリペプチドをコードする方法。
【請求項53】
請求項51または52に記載の方法であって、前記転写調節配列が転写因子結合配列、イントロンスプライス配列、ポリ(A)付加配列、エンハンサー配列およびプロモーター配列からなる群から選択される方法。
【請求項54】
請求項51または52に記載の方法であって、前記元の核酸配列が緑色蛍光ポリペプチドをコードする方法。
【請求項55】
請求項51または52に記載の方法であって、前記元の核酸配列がMontastraea cavernosaから単離された緑色蛍光ポリペプチドをコードする方法。
【請求項56】
請求項51または52に記載の方法であって、前記合成核酸分子が中程度のストリンジェンシーのハイブリダイゼーション条件下、前記元の核酸配列とハイブリダイズする方法。
【請求項57】
請求項51または52に記載の方法であって、変化したコドンが前記元の核酸配列中の対応するアミノ酸と同一のアミノ酸をコードする方法。
【請求項58】
請求項52または53に記載の方法により調製された前記さらなる合成核酸分子である合成核酸分子。
【請求項59】
請求項51または52に記載の方法であって、前記元の核酸配列によりコードされるポリペプチドと比べて少なくとも一つのアミノ酸置換があるポリペプチドをコードするために、前記さらなる合成核酸分子を変化させることをさらに特徴とする方法。
【請求項60】
請求項51または52に記載の方法であって、転写調節配列の前記変化が前記合成核酸分子によりコードされるポリペプチドの1%未満のアミノ酸置換を誘導する方法。
【請求項61】
a)前記元の核酸配列中にあるコドンの数に比べより頻繁に宿主細胞中で用いられる第一の複数のコドンが増加した合成核酸配列を得るために元の核酸配列を変化させること;および
b)前記元の核酸配列中にあるコドンの数に比べより頻繁に宿主細胞中で用いられる第二の複数のコドンが増加したさらなる合成核酸配列を得るために前記元の核酸配列を変化させること、
を特徴とする蛍光ポリペプチドをコードする元の核酸配列の異なる種類のコドンである少なくとも二つの合成核酸分子を調製する方法であって、前記第一の複数のコドンが前記第二の複数のコドンより異なり、前記合成核酸分子および前記さらなる合成核酸分子が同一のポリペプチドをコードする方法。
【請求項62】
請求項61に記載の方法であって、前記合成核酸分子、前記さらなる合成核酸分子、もしくはその両者と比べ、少なくとも3倍少ない転写調節配列を有する少なくとも一つのさらにさらなる合成核酸分子を得るために、前記合成核酸分子、前記さらなる合成核酸分子、もしくはその両者中の複数の転写調節配列を変化させることをさらに特徴とする方法。
【請求項63】
請求項61に記載の方法であって、第一の合成核酸配列によりコードされるポリペプチドと比べ、少なくとも一つのアミノ酸置換を有するポリペプチドをコードする第一の変化した合成配列を得るために、前記第一の合成配列中の少なくとも一つのコドンを変化させることをさらに特徴とする方法。
【請求項64】
請求項61に記載の方法であって、第一の合成核酸配列によりコードされるポリペプチドと比べ、少なくとも一つのアミノ酸置換を有するポリペプチドをコードする第二の変化した合成配列を得るために、前記第二の合成配列中の少なくとも一つのコドンを変化させることをさらに特徴とする方法。
【図1】
【図2A】
【図2B】
【図3】
【図4A】
【図4B】
【図4C】
【図4D】
【図5】
【図6】
【図7】
【図8】
【図9】
【図2A】
【図2B】
【図3】
【図4A】
【図4B】
【図4C】
【図4D】
【図5】
【図6】
【図7】
【図8】
【図9】
【公表番号】特表2006−512098(P2006−512098A)
【公表日】平成18年4月13日(2006.4.13)
【国際特許分類】
【出願番号】特願2005−513754(P2005−513754)
【出願日】平成15年11月20日(2003.11.20)
【国際出願番号】PCT/US2003/037117
【国際公開番号】WO2005/067410
【国際公開日】平成17年7月28日(2005.7.28)
【出願人】(593089149)プロメガ コーポレイション (57)
【氏名又は名称原語表記】Promega Corporation
【Fターム(参考)】
【公表日】平成18年4月13日(2006.4.13)
【国際特許分類】
【出願日】平成15年11月20日(2003.11.20)
【国際出願番号】PCT/US2003/037117
【国際公開番号】WO2005/067410
【国際公開日】平成17年7月28日(2005.7.28)
【出願人】(593089149)プロメガ コーポレイション (57)
【氏名又は名称原語表記】Promega Corporation
【Fターム(参考)】
[ Back to top ]