合成核酸分子組成物および調製方法

【課題】特定の宿主細胞における発現のための、不適切または意図しない転写調節配列の導入を伴わない、変更されたコドン使用を有する合成核酸分子の提供。
【解決手段】少なくとも３００ヌクレオチドの、ポリペプチドに関するコード領域を含む合成核酸分子であって、ポリペプチドをコードする野生型核酸配列と、コドンの２５％より多くが異なるコドン組成を有し、そして上記異なるコドンでのコドンの無作為選択から得られるような配列の平均数に対して、少なくとも３倍少ない転写調節配列を有し、ここで、上記転写調節配列は、転写因子結合配列、イントロスプライス部位、ポリ（Ａ）付加部位、およびプロモーター配列からなる群より選択され、そしてここで、上記合成核酸分子によりコードされる上記ポリペプチドは、上記野生型核酸配列によりコードされる上記ポリペプチドに対して、少なくとも８５％の配列同一性を有する、合成核酸分子。

【発明の詳細な説明】
【技術分野】
【０００１】
（政府の権利の主張）
本発明は、米合衆国政府からの助成金（ＮａｔｉｏｎａｌＳｃｉｅｎｃｅＦｏｕｎｄａｔｉｏｎからの助成金ＤＭＩ−９４０２７６２）を少なくとも一部用いてなされた。政府は、本発明に特定の権利を有する。
【背景技術】
【０００２】
（発明の背景）
転写（ＤＮＡ配列からのＲＮＡ分子の合成）は、遺伝子発現の最初の工程である。ＤＮＡ転写を調節する配列としては、プロモーター配列、ポリアデニル化シグナル、転写因子結合部位およびエンハンサーエレメントが挙げられる。プロモーターは、転写を特異的に開始し得るＤＮＡ配列であり、３つの一般領域からなる。コアプロモーターは、ＲＮＡポリメラーゼおよびその補因子がＤＮＡに結合する配列である。コアプロモーターの直ぐ上流は、活性化複合体のアセンブリを担う（この活性化複合体は、次いで、ポリメラーゼ複合体を補充する）いくつかの転写因子結合部位を含む、近位プロモーターである。近位プロモーターのさらに上流に位置する遠位プロモーターもまた、転写因子結合部位を含む。転写終結およびポリアデニル化は、転写開始のように、部位特異的であり、そして規定された配列によってコードされる。エンハンサーは、調節領域であり、複数の転写因子結合部位を含み、この複数の転写因子結合部位は、エンハンサーおよびプロモーターが同じＤＮＡ分子内に配置される限り、プロモーターに関するエンハンサーの配向および距離に関係なく、応答性プロモーターからの転写レベルを有意に増大させ得る。遺伝子から産生される転写物の量はまた、転写後の機構によって調節され得、最も重要なことは、スプライスドナー配列とスプライスアクセプター配列との間で、一次転写物から介在配列（イントロン）を除去するＲＮＡスプライシングである。
【０００３】
自然選択とは、表現型レベルで生じる遺伝型−環境相互作用が、個体の差示的生殖の成功を導き、従って、集団の遺伝子プールの改変を導くという仮説である。
【０００４】
自然選択によって作用される核酸分子のいくつかの特性としては、コドン使用頻度、ＲＮＡ二次構造、イントロンスプライシング効率、および転写因子または他の核酸結合タンパク質との相互作用が挙げられる。遺伝暗号の縮重性に起因して、これらの特性は、対応するアミノ酸配列を変更することなく自然選択によって最適化され得る。
ある条件下では、ポリペプチドをコードする天然のヌクレオチド配列を合成的に変更して、ポリペプチドを代替の適用のためにより適合させることが有用である。一般的な例は、外来宿主細胞において発現される場合に、遺伝子のコドン使用頻度を変更することである。遺伝暗号の重複性は、アミノ酸が複数のコドンによってコードされることを可能にするが、異なる生物は、他を上回っていくつかのコドンを好む。非ネイティブの宿主細胞におけるタンパク質翻訳の効率は、コドン使用頻度を調節することによって実質的に増大され得るが、同じ遺伝子産物を維持する（特許文献１；特許文献２および特許文献３）。
しかし、コドン使用を変更することは、次に、不適切な転写調節配列の合成核酸分子への意図しない導入を生じ得る。これは、転写に悪影響を与え、合成ＤＮＡの異常な発現を生じる。異常な発現は、発現の正常レベルまたは予測されたレベルからの逸脱として定義される。例えば、プロモーターの下流に位置する転写因子結合部位は、プロモーター活性をもたらすことが実証されている（非特許文献１；非特許文献２；非特許文献３；非特許文献４）。さらに、活性を発揮し、そしてプロモーター配列の非存在下でＤＮＡ転写レベルの上昇を生じるエンハンサーエレメント、またはプロモーター配列の非存在下で遺伝子発現の基底レベルを増大させる転写調節配列の存在は、稀なことではない。
【先行技術文献】
【特許文献】
【０００５】
【特許文献１】米国特許第５，０９６，８２５号明細書
【特許文献２】米国特許第５，６７０，３５６号明細書
【特許文献３】米国特許第５，８７４，３０４号明細書
【非特許文献】
【０００６】
【非特許文献１】Ｍｉｃｈａｅｌら、「ＥＭＢＯ．Ｊ」、１９９０年、９、４８１
【非特許文献２】Ｌａｍｂら、「Ｍｏｌ．Ｒｅｐｒｏｄ，Ｄｅｖｅｌ．」、１９９８年、５１、２１８
【非特許文献３】Ｊｏｈｎｓｏｎら、「Ｍｏｌ．Ｒｅｐｒｏｄ，Ｄｅｖｅｌ」、１９９８年、５０、３７７
【非特許文献４】Ｊｏｎｅｓら、「Ｍｏｌ．Ｃｅｌｌ．Ｂｉｏｌ．」、１９９７年、１７、６９７０
【発明の概要】
【発明が解決しようとする課題】
【０００７】
従って、特定の宿主細胞における発現のために、不適切または意図しない転写調節配列の導入もまた伴わずに、変更されたコドン使用を有する合成核酸分子を作製するための方法が必要である。
【課題を解決するための手段】
【０００８】
本発明は、以下を提供する：
（項目１）少なくとも３００ヌクレオチドの、ポリペプチドに関するコード領域を含む合成核酸分子であって、上記核酸分子は、ポリペプチドをコードする野生型核酸配列と、コドンの２５％より多くが異なるコドン組成を有し、そして上記異なるコドンでのコドンの無作為選択から得られるような配列の平均数に対して、少なくとも３倍少ない転写調節配列を有し、
ここで、上記転写調節配列は、転写因子結合配列、イントロスプライス部位、ポリ（Ａ）付加部位、およびプロモーター配列からなる群より選択され、そしてここで、上記合成核酸分子によりコードされる上記ポリペプチドは、上記野生型核酸配列によりコードされる上記ポリペプチドに対して、少なくとも８５％の配列同一性を有する、合成核酸分子。（項目２）上記合成核酸分子が、少なくとも５倍少ない転写調節配列を有する、項目１に記載の合成核酸分子。
（項目３）上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの３５％より多くが異なる、項目１に記載の合成核酸分子。
（項目４）上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの４５％より多くが異なる、項目１に記載の合成核酸分子。
（項目５）上記合成核酸分子の上記コドン組成は、上記野生型核酸配列と、上記コドンの５５％より多くが異なる、項目１に記載の合成核酸分子。
（項目６）上記異なるコドンの多数が、所望の宿主細胞の好ましいコドンである、項目１に記載の合成核酸分子。
（項目７）上記合成核酸分子が、レポーター分子をコードする、項目１に記載の合成核酸分子。
（項目８）上記合成核酸分子が、選択可能なマーカータンパク質をコードする、項目１に記載の合成核酸分子。
（項目９）上記合成核酸分子が、ルシフェラーゼをコードする、項目１に記載の合成核酸分子。
（項目１０）上記野生型核酸配列が、Ｒｅｎｉｌｌａルシフェラーゼをコードする、項目９に記載の合成核酸分子。
（項目１１）上記野生型核酸配列が、甲虫ルシフェラーゼをコードする、項目９に記載の合成核酸分子。
（項目１２）上記合成核酸分子が、２２４位のアミノ酸バリンをコードする、項目１１に記載の合成核酸分子。
（項目１３）上記合成核酸分子が、２２４位のアミノ酸ヒスチジン、２４７位のヒスチジン、３４６位のイソロイシン、３４８位のグルタミン、またはこれらのいずれかの組み合わせをコードする、項目１１に記載の合成核酸分子。
（項目１４）上記合成核酸分子において異なるコドンの多数が、哺乳動物においてより頻繁に用いられる、項目１に記載の合成核酸分子。
（項目１５）上記合成核酸分子において異なるコドンの大多数が、ヒトにおいて好ましいコドンである、項目１に記載の合成核酸分子。
（項目１６）上記合成核酸分子において異なるコドンの大多数が、植物において好ましいコドンである、項目１に記載の合成核酸分子。
（項目１７）上記合成核酸分子が、配列番号２１（Ｒｌｕｃｖｅｒ２）または配列番号２２（Ｒｌｕｃ−最終）を含む、項目９に記載の合成核酸分子。
（項目１８）上記合成核酸分子が、配列番号７（ＧＲｖｅｒ５）、配列番号８（ＧＲｖｅｒ６）、配列番号９（ＧＲｖｅｒ５．１）、または配列番号２９７（ＧＲｖｅｒ５．１）を含む、項目９に記載の合成核酸分子。
（項目１９）上記合成核酸分子が、配列番号１４（ＲＤｖｅｒ５）、配列番号１５（ＲＤｖｅｒ７）、配列番号１６（ＲＤｖｅｒ５．１）、配列番号２９９（ＲＤｖｅｒ５．１）、配列番号１７（ＲＤｖｅｒ５．２）、配列番号１８（ＲＤ１５６−１Ｈ９）、または配列番号３０１（ＲＤ１５６−１Ｈ９）を含む、項目９に記載の合成核酸分子。
（項目２０）上記異なるコドンの大多数が、ヒトのコドンＣＧＣ、ＣＴＧ、ＴＣＴ、ＡＧＣ、ＡＣＣ、ＣＣＡ、ＣＣＴ、ＧＣＣ、ＧＧＣ、ＧＴＧ、ＡＴＣ、ＡＴＴ、ＡＡＧ、ＡＡＣ、ＣＡＧ、ＣＡＣ、ＧＡＧ、ＧＡＣ、ＴＡＣ、ＴＧＣおよびＴＴＣである、項目１５に記載の合成核酸分子。
（項目２１）上記異なるコドンの大多数が、ヒトのコドンＣＧＣ、ＣＴＧ、ＴＣＴ、ＡＣＣ、ＣＣＡ、ＧＣＣ、ＧＧＣ、ＧＴＣ、およびＡＴＣ、またはコドンＣＧＴ、ＴＴＧ、ＡＧＣ、ＡＣＴ、ＣＣＴ、ＧＣＴ、ＧＧＴ、ＧＴＧ、およびＡＴＴである、項目１５に記載の合成核酸分子。
（項目２２）上記異なるコドンの大多数が、植物のコドンＣＧＣ、ＣＴＴ、ＴＣＴ、ＴＣＣ、ＡＣＣ、ＣＣＡ、ＣＣＴ、ＧＣＴ、ＧＧＡ、ＧＴＧ、ＡＴＣ、ＡＴＴ、ＡＡＧ、ＡＡＣ、ＣＡＡ、ＣＡＣ、ＧＡＧ、ＧＡＣ、ＴＡＣ、ＴＧＣおよびＴＴＣである、項目１６に記載の合成核酸分子。
（項目２３）上記異なるコドンの大多数が、植物のコドンＣＧＣ、ＣＴＴ、ＴＣＴ、ＡＣＣ、ＣＣＡ、ＧＴＣ、ＧＧＡ、ＧＴＣ、およびＡＴＣ、またはコドンＣＧＴ、ＴＧＧ、ＡＧＣ、ＡＣＴ、ＣＣＴ、ＧＣＣ、ＧＧＴ、ＧＴＧ、およびＡＴＴである、項目１６に記載の合成核酸分子。
（項目２４）上記合成核酸分子が、上記野生型核酸配列のレベルよりも、より高いレベルで、哺乳動物宿主細胞において発現される、項目１に記載の合成核酸分子。
（項目２５）上記合成核酸分子が、増加した数の、ＣＴＧまたはＴＴＧのロイシンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目２６）上記合成核酸分子が、増加した数の、ＧＴＧまたはＧＴＣのバリンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目２７）上記合成核酸分子が、増加した数の、ＧＧＣまたはＧＧＴのグリシンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目２８）上記合成核酸分子が、増加した数の、ＡＴＣまたはＡＴＴのイソロイシンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目２９）上記合成核酸分子が、増加した数の、ＣＣＡまたはＣＣＴのプロリンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目３０）上記合成核酸分子が、増加した数の、ＣＧＣまたはＣＧＴのアルギニンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目３１）上記合成核酸分子が、増加した数の、ＡＧＣまたはＴＣＴのセリンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目３２）上記合成核酸分子が、増加した数の、ＡＣＣまたはＡＣＴのスレオニンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目３３）上記合成核酸分子が、増加した数の、ＧＣＣまたはＧＣＴのアラニンをコードするコドンを有する、項目１に記載の合成核酸分子。
（項目３４）上記異なる合成核酸分子におけるコドンが、上記野生型核酸配列における対応するコドンと同じアミノ酸をコードする、項目１に記載の合成核酸分子。
（項目３５）項目１に記載の合成核酸分子を含む、プラスミド。
（項目３６）細胞におけるプロモーター機能に連結した項目１に記載の合成核酸分子を含む、発現ベクター。
（項目３７）上記合成核酸分子が、Ｋｏｚａｋコンセンサス配列に作動可能に連結される、項目３６に記載の発現ベクター。
（項目３８）上記プロモーターが、哺乳動物細胞において機能的である、項目３６に記載の発現ベクター。
（項目３９）上記プロモーターが、ヒト細胞において機能的である、項目３６に記載の発現ベクター。
（項目４０）上記プロモーターが、植物細胞において機能的である、項目３６に記載の発現ベクター。
（項目４１）上記発現ベクターが、マルチクローニング部位をさらに含む、項目３６に記載の発現ベクター。
（項目４２）上記発現ベクターが、上記プロモーターと上記合成核酸分子との間に配置された、マルチクローニング部位を含む、項目４１に記載の発現ベクター。
（項目４３）上記発現ベクターが、上記合成核酸分子から下流に配置されたマルチクローニング部位を含む、項目４１に記載の発現ベクター。
（項目４４）項目３６に記載の発現ベクターを含む、宿主細胞。
（項目４５）適切な容器手段内に、項目３６に記載の発現ベクターを含む、レポーター遺伝子発現キット。
（項目４６）配列番号９（ＧＲｖｅｒ５．１）または配列番号１８（ＲＤ１５６−１Ｈ９）によりコードされる、単離されたポリペプチド。
（項目４７）配列番号２２（Ｒｌｕｃ−最終）、配列番号９（ＧＲｖｅｒ５．１）、配列番号１８（ＲＤ１５６−１Ｈ９）、配列番号２９７（ＧＲｖｅｒ５．１）、配列番号３０１（ＲＤ１５６−１Ｈ９）、またはこれらの相補鎖に対して、ストリンジェントなハイブリダイゼーション条件下でハイブリダイズする、ポリヌクレオチド。
（項目４８）オープンリーディングフレームを含む、合成核酸分子を調製する方法であって、上記方法は、以下：
ａ）少なくとも１００アミノ酸を有するポリペプチドをコードする親核酸配列における複数の転写調節配列を変化させて、上記親核酸配列に対して少なくとも３倍少ない転写調節配列を有する合成核酸分子を得る工程であって、ここで、上記転写調節配列は、転写因子結合配列、イントロンスプライス部位、ポリ（Ａ）付加部位、エンハンサー配列、およびプロモーター配列からなる群より選択される、工程；ならびに
ｂ）減少した数の転写調節配列を有する上記合成核酸配列中のコドンの２５％より多くを変化させて、さらなる合成核酸分子を得る工程であって、ここで、変化させたコドンは、増加した数の転写調節配列を生じない工程であり、ここで、上記さらなる合成核酸分子は、上記親核酸配列によりコードされる上記ポリペプチドに対して、少なくとも８５％のアミノ酸配列同一性を有するポリペプチドをコードする、工程、
を包含する、方法。
（項目４９）オープンリーディングフレームを含む、合成核酸分子を調製する方法であって、上記方法は、以下：
ａ）少なくとも１００アミノ酸を有するポリペプチドをコードする親核酸配列中のコドンの２５％より多くを変化させて、コドンが変化した合成核酸分子を得る工程、および
ｂ）上記コドンが変化した合成核酸分子中の複数の転写調節配列を変化させて、異なるコドンでのコドンの無作為選択を有する合成核酸分子に対して、少なくとも３倍少ない転写調節配列を有する、さらなる合成核酸分子を得る工程であって、ここで、上記転写調節配列は、転写因子結合配列、イントロンスプライス部位、ポリ（Ａ）付加部位、エンハンサー配列、およびプロモーター配列からなる群より選択される工程であり、ここで、上記さらなる合成核酸分子は、上記親核酸配列によりコードされるポリペプチドに対して、少なくとも８５％のアミノ酸配列同一性を有するポリペプチドをコードする、工程、
を包含する、方法。
（項目５０）上記親核酸配列が、レポーター分子をコードする、項目４８または４９に記載の方法。
（項目５１）上記親核酸配列が、ルシフェラーゼをコードする、項目４８または４９に記載の方法。
（項目５２）上記合成核酸分子が、上記親核酸配列に対して、中程度のストリンジェシーハイブリダイゼーション条件下でハイブリダイズする、項目４８または４９に記載の方法。
（項目５３）上記変化したコドンが、上記親核酸配列における対応するコドンと同じアミノ酸をコードする、項目４８または４９に記載の方法。
（項目５４）項目４８または４９に記載の方法によって調製される、さらなる合成核酸分子である、合成核酸分子。
（項目５５）ポリペプチドをコードする親核酸配列のコドンが違うバージョンである、少なくとも２つの合成核酸分子を調製する方法であって、上記方法は、以下：
ａ）親核酸配列を変化させて、増加した数の第１の複数のコドンを有する合成核酸分子を得る工程であって、上記増加した数の第１の複数のコドンは、上記親核酸配列における上記コドンの数に関連して、選択された宿主細胞においてより頻繁に用いられる、工程；および
ｂ）親核酸配列を変化させて、増加した数の第２の複数のコドンを有するさらなる合成核酸分子を得る工程であって、上記増加した数の第２の複数のコドンは、上記親核酸配列における上記コドンの数に関連して、上記宿主細胞においてより頻繁に用いられる、工程、
を包含し、
ここで、上記第１の複数のコドンは、上記第２の複数のコドンと異なり、そしてここで、上記合成核酸分子および上記さらなる合成核酸分子は、同じポリペプチドをコードする、方法。
（項目５６）項目５５に記載の方法であって、上記方法は、上記合成核酸分子、上記さらなる合成核酸分子、またはこれらの両方において、複数の転写調節配列を変化させて、少なくとも１つのなおさらなる合成核酸分子を得る工程であって、上記なおさらなる合成核酸分子は、上記合成核酸分子、上記さらなる合成核酸分子、またはこれらの両方に対して、少なくとも３倍少ない転写調節配列を有する、工程、をさらに包含する、方法。
（項目５７）項目５５に記載の方法であって、上記方法は、上記第１の合成配列中の少なくとも１つのコドンを変化させて、第１の改変された合成配列を得る工程であって、上記第１の改変された合成配列は、上記第１の合成核酸配列によりコードされるポリペプチドに対して、少なくとも１つのアミノ酸置換を有するポリペプチドをコードする、工程、をさらに包含する、方法。
（項目５８）項目５６に記載の方法であって、上記方法は、上記第２の合成核酸配列中の少なくとも１つのコドンを変化させて、第２の改変された合成配列を得る工程であって、上記第２の改変された合成配列は、上記第１の合成核酸配列によりコードされるポリペプチドに対して、少なくとも１つのアミノ酸置換を有するポリペプチドをコードする工程、をさらに包含する、方法。
（項目５９）上記合成配列が、ルシフェラーゼをコードする、項目５５に記載の方法。
（項目６０）上記合成核酸分子が、同一の条件下で、細胞または細胞抽出物中の上記野生型核酸配列のレベルの少なくとも１１０％であるレベルで発現される、項目１に記載の合成核酸分子。
（項目６１）項目１に記載の合成核酸分子であって、上記合成核酸分子によりコードされるポリペプチドが、上記野生型核酸配列によりコードされるポリペプチドに対して、少なくとも９０％の連続する配列同一性を有する、合成核酸分子。
（項目６２）項目１に記載の合成核酸分子であって、上記合成核酸分子によりコードされるポリペプチドは、上記野生型核酸配列によりコードされるポリペプチドに対して、アミノ酸配列が同一である、合成核酸分子。
（項目６３）親核酸配列を含むベクターに対して、少なくとも３倍少ない転写調節配列を有する合成核酸分子を含む、ベクターであって、ここで、上記転写調節配列は、転写調節因子結合配列、イントロンスプライス部位、ポリ（Ａ）付加部位、およびプロモーター配列からなる群より選択される、ベクター。
（項目６４）上記合成核酸分子が、ポリペプチドをコードしない、項目６３に記載のベクター。
（項目６５）項目４８または４９に記載の方法であって、上記方法は、上記さらなる合成核酸分子を変化させて、上記親核酸配列によりコードされるポリペプチドに対して、少なくとも１つのアミノ酸置換を有するポリペプチドをコードさせる工程をさらに包含する、方法。
（項目６６）項目４８または４９に記載の方法であって、ここで、上記転写調節配列の変化は、上記合成核酸分子によりコードされるポリペプチドへとアミノ酸置換を導入しない、方法。
（発明の要旨）
本発明は、ポリペプチドコード領域の少なくとも３００ヌクレオチドを含み、ポリペプチドをコードする野生型核酸配列とは２５％より多いコドンが異なるコドン組成を有し、そして異なるコドンが無作為（ランダム）に選択される場合に生じるよりも、少なくとも３倍少ない、好ましくは少なくとも５倍少ない転写調節配列を有する、合成核酸分子を提供する。好ましくは、この合成核酸分子は、それが由来する、天然に存在する（ネイティブまたは野生型の）ポリペプチド（タンパク質）のアミノ酸配列に対して、少なくとも８５％、好ましくは９０％、そして最も好ましくは９５％または９９％同一なアミノ酸配列を有するポリペプチドをコードする。従って、いくつかの特定のアミノ酸変化がまた、合成核酸分子によってコードされるポリペプチドの特定の表現型特徴を変更することが所望され得ることが認識される。好ましくは、アミノ酸配列同一性は、少なくとも１００連続アミノ酸残基にわたる。本発明の１つの実施形態において、異なる合成核酸分子中のコドンは、好ましくは、野生型核酸分子中の対応するコドンと同じアミノ酸をコードする。
【０００９】
合成核酸分子において減少される転写調節配列としては、以下が挙げられるが、これらに限定されない：転写因子結合配列、イントロンスプライス部位、ポリ（Ａ）付加部位、エンハンサー配列およびプロモーター配列の任意の組み合わせ。転写調節配列は、当該分野で周知である。
【００１０】
本発明の合成核酸分子は、３０％、３５％、４０％より多いか、または４５％より多い、例えば、５０％、５５％、６０％より多いコドンが、野生型核酸配列のコドンとは異なるコドン組成を有することが好ましい。本発明における使用のために好ましいコドンは、特定の生物において同じアミノ酸について、少なくとも１つの他のコドンよりも高頻度で使用され、そしてより好ましくは、この生物において低使用頻度ではなく、そして合成核酸分子の発現についてクローニングまたはスクリーニングするために使用される生物（例えば、Ｅ．ｃｏｌｉ）において低使用頻度ではない。さらに、特定のアミノ酸（すなわち、３つ以上のコドンを有するアミノ酸）について好ましいコドンは、他の（好ましくない）コドンよりも高頻度で使用される２つ以上のコドンを含み得る。１つの生物において別の生物におけるよりも高頻度で使用される、合成核酸分子中のコドンの存在は、そのコドンをより高頻度で使用する生物の細胞に導入される場合、その細胞において野生型または親の核酸分子の発現よりも高レベルで発現される合成核酸分子を生じる。例えば、本発明の合成核酸分子は、同一条件（例えば、細胞培養条件、ベクター骨格など）下で、細胞または細胞抽出物における野生型核酸配列の発現レベルの、少なくとも約１１０％、例えば、１５０％、２００％、５００％以上（１０００％、５０００％、または１００００％）のレベルで発現される。
【００１１】
本発明の１つの実施形態において、異なるコドンは、哺乳動物においてより高頻度で使用されるが、本発明の別の実施形態において、異なるコドンは、植物においてより高頻度で使用される。特定の型の哺乳動物（例えば、ヒト）は、別の型の哺乳動物とは異なるセットの好適なコドンを有し得る。同様に、特定の型の植物は、別の型の植物とは異なる好適なセットのコドンを有し得る。本発明の１つの実施形態において、異なるコドンの大多数は、所望の宿主細胞において好ましいコドンである。哺乳動物（例えば、ヒト）および植物について好ましいコドンは、当該分野で公知である（例えば、Ｗａｄａら、１９９０）。例えば、好ましいヒトコドンとしては、以下が挙げられるが、これらに限定されない：ＣＧＣ（Ａｒｇ）、ＣＴＧ（Ｌｅｕ）、ＴＣＴ（Ｓｅｒ）、ＡＧＣ（Ｓｅｒ）、ＡＣＣ（Ｔｈｒ）、ＣＣＡ（Ｐｒｏ）、ＣＣＴ（Ｐｒｏ）、ＧＣＣ（Ａｌａ）、ＧＧＣ（Ｇｌｙ）、ＧＴＧ（Ｖａｌ）、ＡＴＣ（Ｉｌｅ）、ＡＴＴ（Ｉｌｅ）、ＡＡＧ（Ｌｙｓ）、ＡＡＣ（Ａｓｎ）、ＣＡＧ（Ｇｌｎ）、ＣＡＣ（Ｈｉｓ）、ＧＡＧ（Ｇｌｕ）、ＧＡＣ（Ａｓｐ）、ＴＡＣ（Ｔｙｒ）、ＴＧＣ（Ｃｙｓ）およびＴＴＣ（Ｐｈｅ）（Ｗａｄａら、１９９０）。従って、本発明の好ましい「ヒト化」合成核酸分子は、増大した数の好ましいヒトコドン（例えば、ＣＧＣ、ＣＴＧ、ＴＣＴ、ＡＧＣ、ＡＣＣ、ＣＣＡ、ＣＣＴ、ＧＣＣ、ＧＧＣ、ＧＴＧ、ＡＴＣ、ＡＴＴ、ＡＡＧ、ＡＡＣ、ＣＡＧ、ＣＡＣ、ＧＡＧ、ＧＡＣ、ＴＡＣ、ＴＧＣ、ＴＴＣまたはこれらの任意の組み合わせ）を有することによって、野生型の核酸配列とは異なるコドン組成を有する。例えば、本発明の合成核酸分子は、野生型の核酸配列に対して、増大した数のロイシンをコードするコドン、ＣＴＧまたはＴＴＧ、バリンをコードするコドン、ＧＴＧまたはＧＴＣ、グリシンをコードするコドン、ＧＧＣまたはＧＧＴ、イソロイシンをコードするＡＴＣまたはＡＴＴ、プロリンをコードするコドン、ＣＣＡまたはＣＣＴ、アルギニンをコードするコドン、ＣＧＣまたはＣＧＴ、セリンをコードするコドン、ＡＧＣまたはＴＣＴ、スレオニンをコードするコドン、ＡＣＣまたはＡＣＴ、アラニンをコードするコドン、ＧＣＣまたはＧＣＴ、あるいはこれらの任意の組み合わせを有し得る。同様に、植物においてより高頻度で使用される増大した数のコドンを有する合成核酸分子は、以下：ＣＧＣ（Ａｒｇ）、ＣＴＴ（Ｌｅｕ）、ＴＣＴ（Ｓｅｒ）、ＴＣＣ（Ｓｅｒ）、ＡＣＣ（Ｔｈｒ）、ＣＣＡ（Ｐｒｏ）、ＣＣＴ（Ｐｒｏ）、ＧＣＴ（Ｓｅｒ）、ＧＧＡ（Ｇｌｙ）、ＧＴＧ（Ｖａｌ）、ＡＴＣ（Ｉｌｅ）、ＡＴＴ（Ｉｌｅ）、ＡＡＧ（Ｌｙｓ）、ＡＡＣ（Ａｓｎ）、ＣＡＡ（Ｇｌｎ）、ＣＡＣ（Ｈｉｓ）、ＧＡＧ（Ｇｌｕ）、ＧＡＣ（Ａｓｐ）、ＴＡＣ（Ｔｙｒ）、ＴＧＣ（Ｃｙｓ）、ＴＴＣ（Ｐｈｅ）またはこれらの任意の組み合わせ（Ｍｕｒｒａｙら、１９８９）が挙げられるが、これらに限定されない増大した数の植物コドンを有することによって、野生型または親の核酸配列とは異なるコドン組成を有する。好ましいコドンは、異なる型の植物について異なり得る（Ｗａｄａら、１９９０）。
【００１２】
コドンの選択は、例えば、増大した数のヌクレオチド置換または減少した数の転写調節配列を有することが望まれる、多くの因子によって影響され得る。ある（例えば、転写因子結合部位の除去を可能にする）環境下で、好ましくないコドンを、好ましいコドン以外のコドンまたは最も好ましいコドン以外のコドンによって置換することが所望であり得る。例えば、合成核酸分子のコドンが異なるバージョンを調製する他の条件下で、好ましいコドン対は、多数のミスマッチ塩基および上記の基準に基づいて選択される。
【００１３】
１つの生物において他の生物におけるよりも、より高頻度で使用される、合成核酸分子中のコドンの存在は、これらのコドンを使用する生物の細胞に導入される場合に、この細胞において野生型または親の核酸配列の発現レベルよりも高いレベルで発現される合成核酸分子を生じる。
【００１４】
本発明の合成核酸分子は、選択マーカータンパク質またはレポータータンパク質をコードし得る。しかし、本発明は、合成レポーター遺伝子または合成選択マーカー遺伝子に限定されない、任意の核酸を適用する。レポーター分子である本発明の合成核酸分子の１つの実施形態において、この合成核酸分子は、野生型または親のＲｅｎｉｌｌａルシフェラーゼまたは甲虫ルシフェラーゼの核酸配列とは異なるコドン組成を有するルシフェラーゼをコードする。本発明の合成コメツキムシルシフェラーゼ核酸分子は、必要に応じて、２２４位でアミノ酸バリンをコードし得るか（すなわち、これは、緑色光を発する）、または必要に応じて、２２４位でアミノ酸ヒスチジン、２４７位でアミノ酸ヒスチジン、３４６位でアミノ酸イソロイシン、３４８位でアミノ酸グルタミン、またはこれらの組み合わせをコードし得る（すなわち、これは、赤色光を発する）。野生型Ｒｅｎｉｌｌａルシフェラーゼに関連する好ましい合成ルシフェラーゼ核酸分子としては、配列番号２１（Ｒｌｕｃｖｅｒ２）または配列番号２２（Ｒｌｕｃ−最終（Ｒｌｕｃ−ｆｉｎａｌ））が挙げられるが、これらに限定されない。コメツキムシルシフェラーゼ核酸配列に関連する好ましい合成ルシフェラーゼ核酸分子としては、以下が挙げられるが、これらに限定されない：配列番号７（ＧＲｖｅｒ５）、配列番号８（ＧＲ６）、配列番号９（ＧＲｖｅｒ５．１）、配列番号１４（ＲＤｖｅｒ５）、配列番号１５（ＲＤ７）、配列番号１６（ＲＤｖｅｒ５．１）、配列番号１７（ＲＤｖｅｒ５．２）または配列番号１８（ＲＤ１５６−１Ｈ９）。
【００１５】
本発明はまた、発現カセットを提供する。本発明の発現カセットは、細胞において機能的なプロモーターに作動可能に連結した、本発明の合成核酸分子を含む。好ましいプロモーターは、哺乳動物細胞において機能的であるプロモーター、および植物細胞において機能的であるプロモーターである。必要に応じて、この発現カセットは、他の配列（例えば、制限酵素認識配列およびＫｏｚａｋ配列）を含み得、そしてより大きいポリヌクレオチド分子（例えば、プラスミド、コスミド、人工染色体またはベクター（例えば、ウイルスベクター））の一部であり得る。
【００１６】
本発明の合成核酸分子を含む宿主細胞、単離されたポリペプチド（例えば、本発明の合成核酸分子によってコードされる融合ポリペプチド）および組成物、ならびに適切な容器手段中に本発明の合成核酸分子またはこれによってコードされるポリペプチドを含み、必要に応じて指示手段を含むキットがまた提供される。好ましい単離されたポリペプチドとしては、配列番号３１（ＧＲｖｅｒ５．１）、配列番号２２６（Ｒｌｕｃ−最終）または配列番号２２３（ＲＤ１５６−１Ｈ９）が挙げられるが、これらに限定されない。
【００１７】
本発明はまた、親核酸配列（野生型または別の合成核酸配列のいずれか）を遺伝的に変更することによって、本発明の合成核酸分子を調製する方法を提供する。この方法を使用して、少なくとも１００アミノ酸を含むポリペプチドをコードする合成核酸分子を調製し得る。本発明の１つの実施形態は、レポータータンパク質または選択マーカータンパク質をコードする合成遺伝子の調製である。本発明の方法を使用して、コドン使用頻度を変更し、そして任意のオープンリーディングフレーム中の転写調節配列の数を減少させるか、またはベクター骨格中の転写調節部位の数を減少させ得る。好ましくは、合成核酸分子中のコドン使用頻度は、この核酸分子の発現が所望される宿主生物の使用頻度を反映して変更されるが、親核酸分子に対して潜在的な転写調節配列の数もまた減少させる。
【００１８】
従って、本発明は、オープンリーディングフレームを含む合成核酸分子を調節するための方法を提供する。この方法は、少なくとも１００アミノ酸を有するポリペプチドをコードする親（野生型または合成）核酸配列中の複数の転写調節配列を変更（例えば、減少または排除）して、減少した数の転写調節配列を有し、そして好ましくは親核酸分子と同じアミノ酸をコードする合成核酸分子を得る工程を包含する。この転写調節配列は、転写因子結合部位、イントロンスプライス部位、ポリ（Ａ）付加部位、エンハンサー配列およびプロモーター配列からなる群より選択され、そして得られた合成核酸分子は、親核酸配列と比較して、少なくとも３倍少ない、好ましくは５倍少ない転写調節配列を有する。この方法はまた、減少した数の転写調節配列を有する合成核酸配列中のコドンの２５％より多くを変更して、さらなる合成核酸分子を得る工程を包含し、ここで、変更されたコドンは、減少した数の転写調節配列を有する合成核酸分子中および／または親核酸配列中の、対応する位置と同じアミノ酸をコードする。好ましくは、変更されたコドンは、転写調節配列の増大を生じない。好ましくは、さらなる合成核酸分子は、親核酸配列によってコードされるポリペプチドのアミノ酸配列に対して、少なくとも８５％、好ましくは９０％、そして最も好ましくは９５％または９９％の連続アミノ酸同一性を有するポリペプチドをコードする。
【００１９】
あるいは、この方法は、少なくとも１００アミノ酸を有するポリペプチドをコードする親核酸配列中の２５％より多いコドンを変更して、コドンが変更された合成核酸分子を得る工程を包含し、ここで、変更されたコドンは、親核酸配列中の対応する位置に存在するアミノ酸と同じアミノ酸をコードする。次いで、コドンが変更された合成核酸分子中の複数の転写調節配列が変更されて、さらなる合成核酸分子を得る。好ましくは、変更されたコドンは、転写調節配列の増大を生じない。また、好ましくは、このさらなる合成核酸分子は、親核酸分子によってコードされるポリペプチドのアミノ酸配列に対して、少なくとも８５％、好ましくは９０％、そして最も好ましくは９５％または９９％の連続アミノ酸配列同一性を有するポリペプチドをコードする。本発明の方法によって調製される、合成（さらなる合成を含む）核酸分子もまた、提供される。
【００２０】
本明細書中以下に記載されるように、本発明の方法を、コメツキムシルシフェラーゼおよびＲｅｎｉｌｌａルシフェラーゼの核酸配列を用いて使用した。これらの核酸分子は両方ともルシフェラーゼタンパク質をコードするが、これらは、完全に異なる科に由来し、進化的に広く分離されている。これらのタンパク質は、無関係のアミノ酸配列（タンパク質構造）を有し、そして異なる化学的基質を使用する。これらが「ルシフェラーゼ」との名称を共有するという事実は、これらが、同じ科または大まかに類似する科に由来することを意味するとは解釈されるべきではない。これらの方法は、他の所望の物理的特性または生化学的特性（タンパク質の半減期を含む）に負の効果をもたらすことなく、有意に増大した哺乳動物発現レベルを示す合成ルシフェラーゼ核酸分子を生成し、既知の転写調節エレメントの大部分をまた欠いた。
【００２１】
本発明はまた、高度に関連したポリペプチドをコードする少なくとも２つの合成核酸分子を提供するが、これらの合成核酸分子は、互いに増大した数のヌクレオチド差異を有する。これらの差異は、これらの分子が両方とも１つの細胞中に存在する場合、２つの合成核酸分子間の組換え頻度を減少させる（すなわち、これらは、合成核酸分子の「コドンが異なる」バージョンである）。従って、本発明は、ポリペプチドをコードする親核酸分子のコドンが異なるバージョンである、少なくとも２つの合成核酸分子を調製するための方法を提供する。この方法は、親核酸分子を変更して、親核酸分子中に存在するコドンの数に対して増大した数の、選択された宿主細胞中でより高頻度で使用される第一の複数のコドンを有する、第一の合成核酸分子を得る工程を包含する。必要に応じて、この第一の合成核酸分子はまた、親核酸配列と比較して、減少した数の転写調節配列を有する。この親核酸分子もまた変更されて、親核酸配列中のコドンの数に対して増大した数の、宿主細胞中でより高頻度で使用される第二の複数のコドンを有する第二の合成核酸分子が得られ、ここで、第一の複数のコドンは、第二の複数のコドンとは異なり、そして、この第一および第二の合成核酸分子は、好ましくは、同じポリペプチドをコードする。必要に応じて、第二の合成核酸分子は、親核酸分子と比較して減少した数の転写調節配列を有する。次いで、合成分子のいずれかまたは両方は、さらに改変され得る。
明らかに、本発明は、多くの遺伝子を用いる適用、そして生命科学研究、農業遺伝学、遺伝子治療、発生科学および創薬を含むがこれらに限定されない、多くの科学分野にわたる適用を有する。
【図面の簡単な説明】
【００２２】
【図１】図１は、コドンおよびこれらが対応するアミノ酸を示す。
【図２−１】図２は、以下のヌクレオチド配列比較を示す：黄緑色（ＹＧ）コメツキムシルシフェラーゼ核酸配列（ＹＧ＃８１−６Ｇ０１；配列番号２）および種々の合成緑色（ＧＲ）コメツキムシルシフェラーゼ核酸配列（ＧＲｖｅｒ１、配列番号３；ＧＲｖｅｒ２、配列番号４；ＧＲｖｅｒ３、配列番号５；ＧＲｖｅｒ４、配列番号６；ＧＲｖｅｒ５、配列番号７；ＧＲ６、配列番号８；ＧＲｖｅｒ５．１、配列番号９）、および種々の赤色（ＲＤ）コメツキムシルシフェラーゼ核酸配列（ＲＤｖｅｒ１、配列番号１０；ＲＤｖｅｒ２、配列番号１１；ＲＤｖｅｒ３、配列番号１２；ＲＤｖｅｒ４、配列番号１３；ＲＤｖｅｒ５、配列番号１４；ＲＤ７、配列番号１５；ＲＤｖｅｒ５．１、配列番号１６；ＲＤｖｅｒ５．２、配列番号１７；ＲＤ１５６−１Ｈ９、配列番号１８）。四角で囲まれたヌクレオチドは、配列番号２における相同な位置に存在するヌクレオチドと異なるヌクレオチドである。
【図２−２】図２−１の続き。
【図２−３】図２−２の続き。
【図２−４】図２−３の続き。
【図２−５】図２−４の続き。
【図２−６】図２−５の続き。
【図２−７】図２−６の続き。
【図２−８】図２−７の続き。
【図２−９】図２−８の続き。
【図２−１０】図２−９の続き。
【図２−１１】図２−１０の続き。
【図２−１２】図２−１１の続き。
【図２−１３】図２−１２の続き。
【図２−１４】図２−１３の続き。
【図３−１】図３は、以下のアミノ酸配列比較を示す：ＹＧコメツキムシルシフェラーゼアミノ酸配列（ＹＧ＃８１−６Ｇ０１、配列番号２４）および種々の合成ＧＲコメツキムシルシフェラーゼアミノ酸配列（ＧＲｖｅｒ１、配列番号２５；ＧＲｖｅｒ２、配列番号２６；ＧＲｖｅｒ３、配列番号２７；ＧＲｖｅｒ４、配列番号２８；ＧＲｖｅｒ５、配列番号２９；ＧＲ６、配列番号３０；ＧＲｖｅｒ５．１、配列番号３１）、および種々の赤色（ＲＤ）コメツキムシルシフェラーゼアミノ酸配列（ＲＤｖｅｒ１、配列番号３２；ＲＤｖｅｒ２、配列番号３３；ＲＤｖｅｒ３、配列番号３４；ＲＤｖｅｒ４、配列番号２１８；ＲＤｖｅｒ５、配列番号２１９；ＲＤ７、配列番号２２０；ＲＤｖｅｒ５．１、配列番号２２１；ＲＤｖｅｒ５．２、配列番号２２２；ＲＤ１５６−１Ｈ９、配列番号２２３）。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号２４中の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図３−２】図３−１の続き。
【図３−３】図３−２の続き。
【図３−４】図３−３の続き。
【図３−５】図３−４の続き。
【図４】図４は、ＹＧ＃８１−６Ｇ０１、ＧＲｖｅｒ１、ＲＤｖｅｒ１、ＧＲｖｅｒ５、およびＲＤｖｅｒ５、およびヒト（ＨＵＭ）におけるコドン使用頻度、ならびにＹＧ＃８１−６Ｇ０１、ＧＲｖｅｒ５、ＲＤｖｅｒ５、およびヒトにおける相対的コドン使用頻度を示す。
【図５Ａ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｂ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｃ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｄ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｅ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｆ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｇ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｈ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｉ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｊ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図５Ｋ】図５は、以下に関するコドン使用頻度を示す：ＹＧ＃８１−６Ｇ０１（図５Ａ）、およびＧＲ／ＲＤ合成核酸配列、ＧＲｖｅｒ１（図５Ｂ）、ＲＤｖｅｒ１（図５Ｃ）、ＧＲｖｅｒ２（図５Ｄ）、ＲＤｖｅｒ２（図５Ｅ）、ＧＲｖｅｒ３（図５Ｆ）、ＲＤｖｅｒ３（図５Ｇ）、ＧＲｖｅｒ４（図５Ｈ）、ＲＤｖｅｒ４（図５Ｉ）、ＧＲｖｅｒ５（図５Ｊ）、ＲＤｖｅｒ５（図５Ｋ）。
【図６−１】図６は、合成ＧＲ／ＲＤルシフェラーゼ遺伝子を調製するために用いられるオリゴヌクレオチド（配列番号３５〜２４５）を示す。
【図６−２】図６−１の続き。
【図６−３】図６−２の続き。
【図６−４】図６−３の続き。
【図７−１】図７は、以下のヌクレオチド配列比較を示す：野生型Ｒｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓルシフェラーゼ核酸配列（ＧｅｎＢａｎｋ登録番号Ｍ６３５０１）（ＲＥＬＬＵＣ、配列番号１９）、および種々の合成Ｒｅｎｉｌｌａルシフェラーゼ核酸配列（Ｒｌｕｃｖｅｒ１、配列番号２０；Ｒｌｕｃｖｅｒ２、配列番号２１；Ｒｌｕｃ−最終、配列番号２２）。四角で囲まれたヌクレオチドは、配列番号１９の相同な位置に存在するヌクレオチドと異なるヌクレオチドである。
【図７−２】図７−１の続き。
【図７−３】図７−２の続き。
【図８】図８は、以下のアミノ酸配列比較を示す：野生型Ｒｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓルシフェラーゼアミノ酸配列（ＲＥＬＬＵＣ、配列番号２２４）、および種々の合成Ｒｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓルシフェラーゼアミノ酸配列（Ｒｌｕｃｖｅｒ１、配列番号２２５；Ｒｌｕｃｖｅｒ２、配列番号２２６；Ｒｌｕｃ−最終、配列番号２２７）。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号２２４の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図９Ａ】図９は、野生型（Ａ）対合成（Ｂ）Ｒｅｎｉｌｌａルシフェラーゼ遺伝子のコドン使用頻度を示す。選択された生物体におけるコドン使用頻度は、例えば、Ｗａｄａら、１９９０；Ｓｈａｒｐら、１９８８；Ａｏｔａら、１９８８；およびＳｈａｒｐら、１９８７を、そして、植物コドンについては、Ｍｕｒｒａｙら、１９８９を参照のこと。
【図９Ｂ】図９は、野生型（Ａ）対（Ｂ）Ｒｅｎｉｌｌａルシフェラーゼ遺伝子のコドン使用頻度を示す。選択された生物体におけるコドン使用頻度は、例えば、Ｗａｄａら、１９９０；Ｓｈａｒｐら、１９８８；Ａｏｔａら、１９８８；およびＳｈａｒｐら、１９８７を、そして、植物コドンについては、Ｍｕｒｒａｙら、１９８９を参照のこと。
【図１０】図１０は、合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子を調製するために用いられるオリゴヌクレオチド（配列番号２４６〜２９２）を示す。
【図１１−１】図１１は、以下のヌクレオチド配列比較を示す：野生型黄緑色（ＹＧ）コメツキムシルシフェラーゼ核酸配列（ＬＵＣＰＰＬＹＧ、配列番号１）および合成緑色コメツキムシルシフェラーゼ核酸配列（ＧＲｖｅｒ５．１、配列番号９）、および合成赤色コメツキムシルシフェラーゼ核酸配列（ＲＤ１５６−１Ｈ９、配列番号１８）。四角で囲まれたヌクレオチドは、配列番号１の相同な位置に存在するヌクレオチドと異なるヌクレオチドである。両方の合成配列は、ＬＵＣＰＰＬＹＧと、コドンの２５％を超えて異なるコドン組成を有し、そして異なるコドンにおけるコドンの無作為選択に対して、少なくとも３倍少ない転写調節配列を有する。
【図１１−２】図１１−１の続き。
【図１１−３】図１１−２の続き。
【図１２】図１２は、以下のアミノ酸配列比較を示す：野生型ＹＧコメツキムシルシフェラーゼアミノ酸配列（ＬＵＣＰＰＬＹＧ、配列番号２３）および合成ＧＲコメツキムシルシフェラーゼアミノ酸配列（ＧＲｖｅｒ５．１、配列番号３１）および赤色（ＲＤ）コメツキムシルシフェラーゼアミノ酸配列（ＲＤ１５６−１Ｈ９、配列番号２２３）。全てのアミノ酸配列は、対応するヌクレオチド配列から推定される。四角で囲まれたアミノ酸は、配列番号２３の相同な位置に存在するアミノ酸と異なるアミノ酸である。
【図１３−１】図１３は、ｐＲＬベクターシリーズを示す。全てのベクターは、本明細書中でさらに記載されるような、Ｒｅｎｉｌｌａ野生型または合成遺伝子を含む。図１３Ａは、ｐＧＬ３ベクター（ＰｒｏｍｅｇａＣｏｒｐ．）中のＲｅｎｉｌｌａルシフェラーゼ遺伝子を示す。図１３Ｂは、Ｒｅｎｉｌｌａルシフェラーゼコリポーターベクターシリーズを示す。ｐＲＬ−ＴＫは、単純疱疹ウイルス（ＨＳＶ）ｔｋプロモーターを有し；ｐＲＬ−ＳＶ４０は、ＳＶ４０ウイルス初期エンハンサー／プロモーターを有し；ｐＲＬ−ＣＭＶは、サイトメガロウイルス（ＣＭＶ）エンハンサーおよび最初期プロモーターを有し；ｐＲＬ−ｎｕｌｌは、ＭＣＳ（マルチクローニング部位）を有するが、プロモーターもエンハンサーも有さず；ｐＲＬ−ＴＫ（Ｉｎｔ⁻）は、他のプラスミドに存在するイントロンを有さないＨＳＶ／ｔｋプロモーターを有し；ｐＲ−ＧＬ３Ｂは、ｐＧＬ−３基本骨格（ＰｒｏｍｅｇａＣｏｒｐ．）を有し；ｐＲ−ＧＬ３ＴＫは、ＨＳＶｔｋプロモーターを有するｐＲ−ＧＬ３基本骨格を有する。
【図１３−２】図１３は、ｐＲＬベクターシリーズを示す。全てのベクターは、本明細書中でさらに記載されるような、Ｒｅｎｉｌｌａ野生型または合成遺伝子を含む。図１３Ａは、ｐＧＬ３ベクター（ＰｒｏｍｅｇａＣｏｒｐ．）中のＲｅｎｉｌｌａルシフェラーゼ遺伝子を示す。図１３Ｂは、Ｒｅｎｉｌｌａルシフェラーゼコリポーターベクターシリーズを示す。ｐＲＬ−ＴＫは、単純疱疹ウイルス（ＨＳＶ）ｔｋプロモーターを有し；ｐＲＬ−ＳＶ４０は、ＳＶ４０ウイルス初期エンハンサー／プロモーターを有し；ｐＲＬ−ＣＭＶは、サイトメガロウイルス（ＣＭＶ）エンハンサーおよび最初期プロモーターを有し；ｐＲＬ−ｎｕｌｌは、ＭＣＳ（マルチクローニング部位）を有するが、プロモーターもエンハンサーも有さず；ｐＲＬ−ＴＫ（Ｉｎｔ⁻）は、他のプラスミドに存在するイントロンを有さないＨＳＶ／ｔｋプロモーターを有し；ｐＲ−ＧＬ３Ｂは、ｐＧＬ−３基本骨格（ＰｒｏｍｅｇａＣｏｒｐ．）を有し；ｐＲ−ＧＬ３ＴＫは、ＨＳＶｔｋプロモーターを有する基本骨格を有する。
【図１３−３】図１３−２の続き。
【図１４】図１４は、ＣＨＯ細胞における、合成（Ｒｌｕｃ−最終（Ｒｌｕｃ−ｆｉｎａｌ）ＲｅｎｉｌｌａルシフェラーゼおよびネイティブＲｅｎｉｌｌａルシフェラーゼの半減期を示す。
【図１５Ａ】図１５は、Ｒｅｎｉｌｌａルシフェラーゼ核酸配列のインビトロでの転写／翻訳を示す。Ａ）ｔ＝０〜６０分；Ｂ）直線範囲。
【図１５Ｂ】図１５は、Ｒｅｎｉｌｌａルシフェラーゼ核酸配列のインビトロでの転写／翻訳を示す。Ａ）ｔ＝０〜６０分；Ｂ）直線範囲。
【図１５Ｃ】図１５は、ウサギ網状赤血球溶解物における、ネイティブＲｅｎｉｌｌａルシフェラーゼＲＮＡおよび合成（Ｒｌｕｃ−最終）ＲｅｎｉｌｌａルシフェラーゼＲＮＡのインビトロでの翻訳を示す。ＲＮＡを定量し、そして同じ量を、図１５Ａ〜Ｂに示される翻訳反応と同じ様に用いた。Ｃ）ｔ＝０〜６０分；Ｄ）直線範囲。
【図１５Ｄ】図１５は、ウサギ網状赤血球溶解物における、ネイティブＲｅｎｉｌｌａルシフェラーゼＲＮＡおよび合成（Ｒｌｕｃ−最終）ＲｅｎｉｌｌａルシフェラーゼＲＮＡのインビトロでの翻訳を示す。ＲＮＡを定量し、そして同じ量を、図１５Ａ〜Ｂに示される翻訳反応と同じ様に用いた。Ｃ）ｔ＝０〜６０分；Ｄ）直線範囲。
【図１５Ｅ】図１５は、コムギ麦芽抽出物における、ネイティブＲｅｎｉｌｌａＲＮＡおよび合成（Ｒｌｕｃ−最終）ＲｅｎｉｌｌａＲＮＡの翻訳を示す。Ｅ）ｔ＝０〜６０分；Ｆ）直線範囲。
【図１５Ｆ】図１５は、コムギ麦芽における、ネイティブＲｅｎｉｌｌａルシフェラーゼＲＮＡおよび合成（Ｒｌｕｃ−最終）ＲｅｎｉｌｌａルシフェラーゼＲＮＡのインビトロでの翻訳を示す。Ｅ）ｔ＝０〜６０分；Ｆ）直線範囲。
【図１６−１】図１６は、合成Ｒｅｎｉｌｌａ核酸配列からの高い発現が、同時トランスフェクションアッセイにおけるプロモーター干渉の危険性を減らしたことを示す。ＣＨＯ細胞を、以下を用いて同時トランスフェクトした：一定量（５０ｎｇ）のホタルルシフェラーゼ発現ベクター（ｐＧＬ３コントロールベクター（ＳＶ４０のプロモーターおよびエンハンサーを有する）；Ｌｕｃ＋）、ならびにネイティブＲｅｎｉｌｌａルシフェラーゼ遺伝子（０ｎｇ、５０ｎｇ、１００ｎｇ、５００ｎｇ、１μｇ、または２μｇ）および合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子（０ｎｇ、５ｎｇ、１０ｎｇ、５０ｎｇ、１００ｎｇ、または２００ｎｇ）を有するｐＲＬベクター。
【図１６−２】図１６−１の続き。
【図１７Ａ】図１７Ａは、ホタルおよびコメツキムシのルシフェラーゼにより触媒される反応を示す。
【図１７Ｂ】図１７Ｂは、Ｒｅｎｉｌｌａルシフェラーゼにより触媒される反応を示す。
【図１８−１】図１８は、ｐＧＬ３ベクターにおけるコメツキムシルシフェラーゼのヌクレオチド配列および推定アミノ酸配列を示す（ｐＧＬ３中のＧＲｖｅｒ５．１、配列番号２９８をコードする配列番号２９７；ｐＧＬ３中のＲＤｖｅｒ５．１、配列番号３００をコードする配列番号２９９；およびｐＧＬ３中のＲＤ１５６−１Ｈ９、配列番号３０２をコードする配列番号３０１）。ＧＲｖｅｒ５．１核酸配列、ＲＤｖｅｒ５．１核酸配列、およびＲＤ１５６−１Ｈ９核酸配列を、ｐＧＬ３ベクターにクローニングするために、開始コドンにＮｃｏＩ部位を有するオリゴヌクレオチドを用いた。このことにより、２位でのバリンへのアミノ酸置換を生じた。
【図１８−２】図１８−１の続き。
【図１８−３】図１８−２の続き。
【図１８−４】図１８−３の続き。
【発明を実施するための形態】
【００２３】
（発明の詳細な説明）
（定義）
用語「遺伝子」とは、本明細書中で使用される場合、ポリペプチドまたはタンパク質前駆体の生成に必要なコード配列を含むＤＮＡ配列をいう。このポリペプチドは、全長コード配列によってコードされ得るか、または所望のタンパク質特性が維持される限り、コード配列の任意の部分によってコードされ得る。
【００２４】
「核酸」は、本明細書中で使用される場合、共有結合したヌクレオチド配列であり、１つのヌクレオチドのペントースの３’位は、次のペントースの５’位に、ホスホジエステル基によって連結され、そしてヌクレオチド残基（塩基）は、特定の配列（すなわち、ヌクレオチドの直線的な順番）で結合される。「ポリヌクレオチド」は、本明細書中で使用される場合、約１００ヌクレオチド長より長い配列を含む核酸である。「オリゴヌクレオチド」は、本明細書中で使用される場合、短いポリヌクレオチドまたはポリヌクレオチドの一部である。オリゴヌクレオチドは、代表的に、約２〜約１００塩基の配列を含む。単語「オリゴ」は、時々、単語「オリゴヌクレオチド」の代わりに使用される。
【００２５】
核酸分子は、「５’末端（５’端）」および「３’末端（３’端）」を有するといわれる。なぜなら、核酸ホスホジエステル結合は、引き続くモノヌクレオチドのペントース環の５’炭素と３’炭素との間で生じるからである。新しい結合が５’炭素に対して生じるポリヌクレオチドの末端が、５’末端ヌクレオチドである。新しい結合が３’炭素に対して生じるポリヌクレオチドの末端が、３’末端ヌクレオチドである。本明細書中で使用される場合、末端ヌクレオチドは、３’末端または５’末端の末端位置のヌクレオチドである。
【００２６】
ＤＮＡ分子は、「５’端」および「３’端」を有するといわれる。なぜなら、モノヌクレオチドは、１つのモノヌクレオチドのペントース環の５’ホスフェートが、ホスホジエステル結合を介して一方向で、隣のペントースの３’酸素に結合するような様式で反応して、オリゴヌクレオチドを作製するからである。従って、オリゴヌクレオチドの末端は、その５’ホスフェートがモノヌクレオチドペントース環の３’酸素に連結されない場合、「５’端」と称され、そしてその３’酸素が引き続くモノヌクレオチドペントース環の５’ホスフェートに連結されない場合、「３’端」と称される。
【００２７】
本明細書中で使用される場合、核酸配列はまた、より大きなオリゴヌクレオチドまたはポリヌクレオチドの内部である場合さえ、５’端および３’端を有するといわれ得る。直線状ＤＮＡ分子または環状ＤＮＡ分子のいずれかにおいて、別個のエレメントは、「下流」または３’エレメントの「上流」または５’であるといわれる。この専門用語は、転写が、ＤＮＡ鎖に沿って、５’から３’への様式で進むという事実を反映する。代表的に、連結された遺伝子の転写を指向するプロモーターエレメントまたはエンハンサーエレメントは、一般に、コード領域の５’または上流に位置する。しかし、エンハンサーエレメントは、プロモーターエレメントおよびコード領域の３’に位置する場合にさえ、その効果を発揮し得る。転写終結シグナルおよびポリアデニル化シグナルは、コード領域の３’または下流に位置する。
【００２８】
用語「コドン」は、本明細書中で使用される場合、基本的な遺伝暗号（遺伝コード）単位であり、ポリペプチド鎖に取りこまれる特定のアミノ酸、または開始シグナルもしくは停止シグナルを特定する、３ヌクレオチドの配列からなる。図１は、コドン表を含む。用語「コード領域」は、構造遺伝子に関して使用される場合、ｍＲＮＡ分子の翻訳の結果としての、新生ポリペプチドに見出されるアミノ酸をコードするヌクレオチド配列をいう。代表的に、コード領域は、開始メチオニンをコードするヌクレオチドトリプレット「ＡＴＧ」による５’側の境界があり、かつ終止コドン（例えば、ＴＡＡ、ＴＡＧ、ＴＧＡ）による３’側の境界がある。いくつかの場合、コード領域は、ヌクレオチドトリプレット「ＴＴＧ」によって開始されることもまた公知である。
【００２９】
「タンパク質」および「ポリペプチド」によって、長さまたは翻訳後修飾（例えば、グリコシル化またはリン酸化）に関わらず、任意の鎖のアミノ酸を意味する。本発明の合成遺伝子はまた、天然に存在するタンパク質またはそのポリペプチドフラグメントの改変体をコードし得る。好ましくは、このようなタンパク質ポリペプチドは、それが由来する天然に存在する（ネイティブの）アミノ酸配列に対して、少なくとも８５％、好ましくは９０％、そして最も好ましくは９５％または９９％同一である、アミノ酸配列を有する。
【００３０】
ポリペプチド分子は、「アミノ末端」（Ｎ末端）および「カルボキシ末端」（Ｃ末端）を有するといわれる。なぜなら、ペプチド結合は、第一のアミノ酸残基の骨格アミノ基と第二のアミノ酸残基の骨格カルボキシル基との間で生じるからである。ポリペプチド配列に関して、用語「Ｎ末端」および「Ｃ末端」は、それぞれ、ポリペプチドのＮ末端領域およびＣ末端領域の部分を含むポリペプチド領域をいう。ポリペプチドのＮ末端領域部分を含む配列は、ポリペプチド鎖のＮ末端半分由来のアミノ酸を優勢に含むが、このような配列に限定されない。例えば、Ｎ末端配列は、ポリペプチドのＮ末端半分およびＣ末端半分の両方に由来する塩基を含む、ポリペプチド配列の内部部分を含み得る。同じことがＣ末端にも適用される。Ｎ末端領域およびＣ末端領域は、必ずしもそうである必要はないが、それぞれ、ポリペプチドの最終的なＮ末端およびＣ末端を規定するアミノ酸を含み得る。
【００３１】
用語「野生型」は、本明細書中で使用される場合、天然に存在する供給源から単離された遺伝子または遺伝子産物の特徴を有する、遺伝子または遺伝子産物をいう。野生型遺伝子は、ある集団において最も頻繁に観察され、従って、この遺伝子の「野生型」形態と任意に称される。対照的に、用語「変異体」は、野生型の遺伝子または遺伝子産物と比較した場合に、配列および／または機能的特性における改変（すなわち、変更された特徴）を示す遺伝子または遺伝子産物をいう。天然に存在する変異体が単離され得ることが留意される；これらは、野生型の遺伝子または遺伝子産物と比較した場合に、変更された特徴を有するという事実によって、同定される。
【００３２】
用語「相補的」または「相補性」は、塩基対形成法則によって関連する、ヌクレオチドの配列に関して使用される。例えば、配列５’「Ａ−Ｇ−Ｔ」３’について、これは、配列３’「Ｔ−Ｃ−Ａ」５’に相補的である。相補性は、「部分的」であり得、この場合、いくつかの核酸塩基は、塩基対形成法則に従って一致される。あるいは、「完全」または「全体的」な相補性が、核酸間に存在し得る。核酸鎖環の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して、有意な影響を有する。これは、増幅反応、および核酸のハイブリダイゼーションに依存する検出方法において特に重要である。
【００３３】
用語「組換えタンパク質」または「組換えポリペプチド」は、本明細書中で使用される場合、組換えＤＮＡ分子から発現されるタンパク質分子をいう。対照的に、用語「ネイティブタンパク質」は、本明細書中で使用されて、天然に存在する（すなわち、非組換え）供給源から単離されたタンパク質を示す。分子生物学的技術を使用して、タンパク質のネイティブ形態と比較して、同一の特性を有するタンパク質の組換え形態を生成する。
【００３４】
用語「融合タンパク質」および「融合パートナー」とは、外因性タンパク質フラグメント（例えば、非ルシフェラーゼタンパク質からなる融合パートナー）に連結された目的のタンパク質（例えば、ルシフェラーゼ）を含む、キメラタンパク質をいう。この融合パートナーは、宿主細胞において発現される場合にタンパク質の可溶性を増強し得、例えば、宿主細胞もしくは培養物上清またはこれら両方からの組換え融合タンパク質の精製を可能にする、親和性タグ（アフィニティータグ）を提供し得る。所望の場合、この融合パートナーは、当該分野で公知の種々の酵素的方法または化学的方法によって、目的のタンパク質から除去され得る。
【００３５】
用語「細胞」、「細胞株」、「宿主細胞」は、本明細書中で使用される場合、相互変換可能に使用され、このような名称の全ては、これらの名称の子孫または潜在的子孫を含む。「形質転換細胞」は、合成遺伝子を含むＤＮＡ分子が導入された細胞（またはその祖先）を意味する。必要に応じて、本発明の合成遺伝子は、合成遺伝子によってコードされるタンパク質またはポリペプチドを産生し得る安定に形質転換された細胞株を作製するように、適切な細胞株に導入され得る。このような細胞株を構築するためのベクター、細胞および方法は、当該分野で周知である（例えば、Ａｕｓｕｂｅｌら（前出））。語「形質転換体」または「形質転換細胞」は、移入の数に関わらず、元々の形質転換細胞に由来する、初代形質転換細胞を含む。全ての子孫は、意図した変異または偶発的な変異に起因して、ＤＮＡ内容が正確に同一でなくてもよい。それにもかかわらず、元々の形質転換細胞においてスクリーニングされたのと同じ機能性を有する変異子孫は、形質転換体の定義に含まれる。
【００３６】
核酸は、異なる型の変異を含むことが公知である。「点」変異とは、単一塩基位置での、野生型配列からのヌクレオチドの配列の変更をいう。変異はまた、１以上の塩基の挿入または欠失をいい得、その結果、核酸配列は、野生型配列とは異なる。
【００３７】
用語「相同性」とは、相補性の程度をいう。部分的な相同性または完全な相同性（すなわち、同一性）が存在する。相同性は、配列分析ソフトウェア（例えば、ＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＳｏｆｔｗａｒｅＰａｃｋａｇｅｏｆｔｈｅＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ．ＵｎｉｖｅｒｓｉｔｙｏｆＷｉｓｃｏｎｓｉｎＢｉｏｔｅｃｈｎｏｌｏｇｙＣｅｎｔｅｒ．１７１０ＵｎｉｖｅｒｓｉｔｙＡｖｅｎｕｅ．Ｍａｄｉｓｏｎ，ＷＩ５３７０５）を使用して、しばしば測定される。このようなソフトウェアは、種々の置換、欠失、挿入および他の改変に対して相同性の程度を割り当てることによって、類似する配列を一致させる。保存的置換としては、代表的に、以下の群内の置換が挙げられる：グリシン、アラニン；バリン、イソロイシン、ロイシン；アスパラギン酸、グルタミン酸、アスパラギン、グルタミン；セリン、スレオニン；リジン、アルギニン；およびフェニルアラニン、チロシン。
【００３８】
「部分的に相補的な」配列は、完全に相補的な配列が標的核酸にハイブリダイゼーションすることを少なくとも部分的に阻害し、機能的用語「実質的に相同」を使用して言及される配列である。完全に相補的な配列の標的配列へのハイブリダイゼーションの阻害は、低いストリンジェンシー条件下でのハイブリダイゼーションアッセイ（サザンブロットまたはノザンブロット、溶液ハイブリダイゼーションなど）を使用して試験され得る。実質的に相同な配列またはプローブは、低いストリンジェンシー条件下で、標的配列に対する完全な相同体の結合（すなわち、ハイブリダイゼーション）と競合するか、またはこの結合を阻害する。低いストリンジェンシーの条件は、非特異的結合を許容するというわけではない；低いストリンジェンシーの条件は、２つの配列の互いに対する結合が、特異的（すなわち、選択的）相互作用であることを必要とする。非特異的結合の非存在は、部分的な程度の相補性（例えば、約３０％未満の同一性）さえも欠く、第二の標的の使用によって、試験され得る。この場合、非特異的結合の非存在下で、プローブは、第二の非特異的標的にハイブリダイズしない。
【００３９】
ｃＤＮＡクローンまたはゲノムクローンのような二本鎖核酸配列を参照して使用される場合、用語「実質的に相同」は、本明細書中に記載されるような低ストリンジェンシー条件下で、二本鎖核酸配列のいずれかの鎖または両方の鎖にハイブリダイズし得る任意のプローブをいう。
【００４０】
「プローブ」は、探索されるべき変性核酸の配列に対して、選択されたストリンジェンシー条件下で結合されるに十分な相補性となる（その長さに関連して）ように設計されたオリゴヌクレオチドをいう。
【００４１】
「ハイブリダイゼーション」および「結合」は、プローブおよび変性融解核酸の文脈において、交換可能に使用される。変性された核酸にハイブリダイズまたは結合されるプローブは、そのポリヌクレオチドにおける相補配列に対して塩基対形成される。特定のプローブが、そのポリヌクレオチドと塩基対形成されたまま維持されるか否かは、相補性の程度、プローブの長さ、および結合条件のストリンジェンシーに依存する。ストリンジェンシーが高くなればなるほど、相補性の程度はより高くなければならず、および／または、プローブはより長くなければならない。
【００４２】
用語「ハイブリダイゼーション」は、相補的核酸鎖の対形成を参照して使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度（すなわち、核酸鎖の間の会合の強度）は、当該分野で周知の多くの因子によって影響を及ぼされる。この因子としては、核酸間の相補性の程度、塩濃度、形成されるハイブリッドのＴｍ（融解温度）、他の成分の存在（例えば、ポリエチレングリコールの存在または非存在）、ハイブリダイズする鎖のモル濃度、および核酸鎖のＧ：Ｃ含量のような条件によって関与され影響される条件のストリンジェンシーが挙げられる。
【００４３】
用語「ストリンジェンシー」は、温度、イオン強度、および他の化合物の存在に関する条件（この条件下で、核酸のハイブリダイゼーションを実施する）を参照して使用される。「高ストリンジェンシー」条件では、核酸の塩基対形成は、高頻度の相補性塩基配列を有する核酸フラグメントの間でのみ起こる。従って、「中程度の」または「低い」ストリンジェンシーの条件が、一緒にハイブリダイズまたはアニールされるべき互いに対して完全には相補的でない核酸を所望する場合にしばしば必要とされる。当該分野は、多数の等価な条件が、中程度のストリンジェンシー条件または低いストリンジェンシー条件を含むように使用され得ることを十分に知っている。ハイブリダイゼーション条件の選択は、一般的に、当業者に明らかであり、そして通常、ハイブリダイゼーションの目的、ハイブリダイゼーションの型（ＤＮＡ−ＤＮＡまたはＤＮＡ−ＲＮＡ）、および配列間で所望される関連性のレベルによって導かれる（この方法の一般的な考察として、例えば、Ｓａｍｂｒｏｏｋら，１９８９；ＮｕｃｌｅｉｃＡｃｉｄＨｙｂｒｉｄｉｚａｔｉｏｎ，ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ，ＩＲＬＰｒｅｓｓ，ＷａｓｈｉｎｇｔｏｎＤ．Ｃ．，１９８５）。
【００４４】
核酸二重鎖の安定性は、ミスマッチ塩基の数の増加につれて減少し、そしてさらに、ハイブリッド二重鎖におけるミスマッチの相対的位置に依存して、より高い程度またはより低い程度まで減少されることが知られている。従って、ハイブリダイゼーションのストリンジェンシーを使用して、このような二重鎖の安定性を最大化または最少化し得る。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの温度を調整することによって；ハイブリダイゼーション混合物中におけるヘリックス不安定化剤（例えば、ホルムアミド）のパーセンテージを調整することによって；ならびに洗浄溶液の温度および／または塩濃度を調整することによって、変更され得る。フィルターハイブリダイゼーションについて、ハイブリダイゼーションの最終的なストリンジェンシーは、しばしば、ハイブリダイゼーション後の洗浄に使用される塩濃度および／または温度によって決定される。
【００４５】
「高ストリンジェンシー条件」は、核酸のハイブリダイゼーションを参照して使用される場合、約５００ヌクレオチド長のプローブを使用する場合において、５×ＳＳＰＥ（４３．８ｇ／ｌＮａＣｌ，６．９ｇ／ｌＮａＨ_２ＰＯ_４Ｈ_２Ｏおよび１．８５ｇ／ｌＥＤＴＡ（ｐＨをＮａＯＨで７．４に調整））、０．５％ＳＤＳ、５×デンハルト試薬および１００μｇ／ｍｌ変性サケ精子ＤＮＡからなる溶液中における４２℃での結合またはハイブリダイゼーションに続いて、０．１×ＳＳＰＥ、１．０％ＳＤＳを含む溶液中において４２℃で洗浄するのと等価な条件を含む。
【００４６】
「中程度のストリンジェンシー条件」は、核酸のハイブリダイゼーションを参照して使用される場合、約５００ヌクレオチド長のプローブを使用する場合において、５×ＳＳＰＥ（４３．８ｇ／ｌＮａＣｌ，６．９ｇ／ｌＮａＨ_２ＰＯ_４Ｈ_２Ｏおよび１．８５ｇ／ｌＥＤＴＡ（ｐＨをＮａＯＨで７．４に調整））、０．５％ＳＤＳ、５×デンハルト試薬および１００μｇ／ｍｌ変性サケ精子ＤＮＡからなる溶液中における４２℃での結合またはハイブリダイゼーションに続いて、１．０×ＳＳＰＥ、１．０％ＳＤＳを含む溶液中において４２℃で洗浄するのと等価な条件を含む。
【００４７】
「低いストリンジェンシー条件」は、約５００ヌクレオチド長のプローブを使用する場合において、５×ＳＳＰＥ（４３．８ｇ／ｌＮａＣｌ，６．９ｇ／ｌＮａＨ_２ＰＯ_４Ｈ_２Ｏおよび１．８５ｇ／ｌＥＤＴＡ（ｐＨをＮａＯＨで７．４に調整））、０．１％ＳＤＳ、５×デンハルト試薬［５０×デンハルトは、５００ｍｌあたりに、５ｇのＦｉｃｏｌｌ（Ｔｙｐｅ４００、Ｐｈａｒｍａｃｉａ）、５ｇのＢＳＡ（ＦｒａｃｔｉｏｎＶ；Ｓｉｇｍａ）を含む］および１００ｇ／ｍｌ変性サケ精子ＤＮＡからなる溶液中における４２℃での結合またはハイブリダイゼーションに続いて、５×ＳＳＰＥ、０．１％ＳＤＳを含む溶液中において４２℃で洗浄するのと等価な条件を含む。
【００４８】
用語「Ｔ_ｍ」は、「融解温度」を参照して使用される。融解温度は、二本鎖核酸分子の集団のうちの５０％が、解離されて一本鎖になる温度である。核酸のＴ_ｍを算出するための方程式は、当該分野で周知である。ハイブリッド核酸のＴｍはしばしば、１Ｍ塩におけるハイブリダイゼーションアッセイから採択される式を使用して推定され、そして一般的に、ＰＣＲプライマーについてのＴｍを算出するために使用されるのは、以下である：［（Ａ＋Ｔの数）×２℃＋（Ｇ＋Ｃの数）×４℃］（Ｃ．Ｒ．Ｎｅｗｔｏｎら，ＰＣＲ，第２版，Ｓｐｒｉｎｇｅｒ−Ｖｅｒｌａｇ（ＮｅｗＹｏｒｋ，１９９７），２４頁）。この式は、２０ヌクレオチドよりも長いプライマーについては不正確であることが見出された（同書）。Ｔ_ｍ値に関する別の単純な推定は、以下の式によって算出され得る：核酸が１ＭＮａＣｌでの水溶液中にある場合、Ｔ_ｍ＝８１．５＋０．４１（％Ｇ＋Ｃ）（例えば、ＡｎｄｅｒｓｏｎおよびＹｏｕｎｇ，ＱｕａｎｔｉｔａｔｉｖｅＦｉｌｔｅｒＨｙｂｒｉｄｉｚａｔｉｏｎ，ＮｕｃｌｅｉｃＡｃｉｄＨｙｂｒｉｄｉｚａｔｉｏｎ，１９８５）。他のより複雑化した計算が、当該分野において存在し、それは構造および配列の特徴を、Ｔ_ｍの算出のための考慮に入れる。算出されたＴ_ｍは、単なる推定に過ぎず；最適温度は一般的に、経験的に決定される。
【００４９】
用語「単離された」は、「単離されたオリゴヌクレオチド」または「単離されたポリヌクレオチド」におけるように、核酸に関連して使用される場合、同定され、かつその供給源において通常関連付けられる少なくとも１つの夾雑物から分離されている核酸配列をいう。従って、単離された核酸は、その天然において見出される形態または設定とは異なる形態または設定において存在する。対照的に、単離されていない核酸（例えば、ＤＮＡおよびＲＮＡ）は、それが天然において存在する状態で見出される。例えば、所定のＤＮＡ配列（例えば、遺伝子）は、隣接する遺伝子と近位で宿主細胞の染色体において見出され；ＲＮＡ配列（例えば、特定のタンパク質をコードする特定のｍＲＮＡ配列）は、多くのタンパク質をコードする多数の他のｍＲＮＡとの混合物として、細胞中において見出される。しかし、単離された核酸としては、例示として、その核酸を通常発現している細胞におけるこのような核酸であって、ここでこの核酸が天然の細胞の染色体位置とは異なる染色体位置にある核酸、またはさもなくば、天然において見出される核酸配列とは異なる核酸配列によって隣接されている核酸が挙げられる。単離された核酸またはオリゴヌクレオチドは、一本鎖または二本鎖の形態で存在し得る。単離された核酸またはオリゴヌクレオチドが、タンパク質を発現するように利用される場合、そのオリゴヌクレオチドは、最少でもセンス鎖またはコード鎖を含む（すなわち、オリゴヌクレオチドは一本鎖であり得る）が、センス鎖およびアンチセンス鎖の両方を含み得る（すなわち、オリゴヌクレオチドは、二本鎖であり得る）。
【００５０】
用語「単離された」は、「単離されたタンパク質」または「単離されたポリペプチド」におけるように、ポリペプチドに関連して使用される場合、同定され、かつその供給源において通常関連付けられる少なくとも１つの夾雑物から分離されているポリペプチドをいう。従って、単離されたポリペプチドは、その天然において見出される形態または設定とは異なる形態または設定において存在する。対照的に、単離されていないポリペプチド（例えば、タンパク質および酵素）は、それが天然において存在する状態で見出される。
【００５１】
用語「精製された」または「精製する（ために）」とは、目的の成分（例えば、タンパク質または核酸）からいくらかの夾雑物を取り除く任意のプロセスの結果を意味する。これにより、サンプル中における精製成分のパーセントは増加する。
【００５２】
用語「作動可能に連結された」は、本明細書中で使用される場合、所定の遺伝子の転写および／または所望のタンパク質分子の合成を指示し得る核酸分子が生成されるような様式における核酸配列の連結をいう。この用語はまた、機能的（例えば、酵素的に活性な、結合パートナーに結合し得る、阻害し得る、など）なタンパク質またはポリペプチドが生成されるような様式でアミノ酸をコードする配列の連結をいう。
【００５３】
用語「組換えＤＮＡ分子」は、天然において通常一緒に見出されない少なくとも２つのヌクレオチド配列を含むハイブリッドＤＮＡ配列を意味する。用語「ベクター」は、ＤＮＡのフラグメントが挿入またはクローン化され得、そして細胞中にＤＮＡセグメントを移入するために使用され得、そして細胞中において複製可能であり得る核酸分子を参照して使用される。ベクターは、プラスミド、バクテリオファージ、ウイルス、コスミドなどに由来し得る。
【００５４】
用語「組換えベクター」および「発現ベクター」は、本明細書中で使用される場合、所望のコード配列と、特定の宿主生物における作動可能に連結されたコード配列の発現のために必要とされる適切なＤＮＡ配列またはＲＮＡ配列とを含む、ＤＮＡ配列またはＲＮＡ配列をいう。原核生物発現ベクターは、プロモーター、リボソーム結合部位、宿主細胞における自律複製のための複製起点、そしておそらく他の配列（例えば、任意のオペレーター配列、任意の制限酵素部位）を含む。プロモーターは、ＲＮＡポリメラーゼをＤＮＡに結合させ、そしてＲＮＡ合成を開始させるように指示するＤＮＡ配列として規定される。真核生物発現ベクターは、プロモーターと、必要に応じて、ポリアデニル化シグナルと、必要に応じて、エンハンサー配列とを含む。
【００５５】
用語「遺伝子をコードするヌクレオチド配列を有するポリヌクレオチド」は、遺伝子のコード領域を含む核酸配列、または換言すると、遺伝子産物をコードする核酸配列を意味する。コード領域は、ｃＤＮＡの形態、ゲノムＤＮＡの形態、またはＲＮＡの形態のいずれかで存在し得る。ＤＮＡの形態で存在する場合、オリゴヌクレオチドは、一本鎖（すなわち、センス鎖）であっても二本鎖であってもよい。適切な制御エレメント（例えば、エンハンサー／プロモーター、スプライス連結部、ポリアデニル化シグナルなど）は、必要に応じて遺伝子のコード領域に密接して位置付けられて、一次ＲＮＡ転写物の転写の適切な開始および／または正確なプロセシングを可能にし得る。あるいは、本発明の発現ベクターにおいて利用されるコード領域は、内因性エンハンサー／プロモーター、スプライス連結部、介在配列、ポリアデニル化シグナルなどを含み得る。さらなる実施形態では、コード領域は、内因性制御エレメントおよび外因性制御エレメントの両方の組み合わせを含み得る。
【００５６】
用語「転写調節エレメント」または「転写調節配列」は、核酸配列の発現のいくつかの局面を制御する遺伝子エレメントまたは配列をいう。例えば、プロモーターは、作動可能に連結されたコード領域の転写開始を促進する調節エレメントである。他の調節エレメントとしては、転写因子結合部位、スプライシングシグナル、ポリアデニル化シグナル、終結シグナル、およびエンハンサーエレメントが挙げられるが、これらに限定されない。
【００５７】
真核生物における転写制御シグナルは、「プロモーター」および「エンハンサー」エレメントを含む。プロモーターおよびエンハンサーは、転写に関与する細胞性タンパク質と特異的に相互作用するＤＮＡ配列の短いアレイからなる（Ｍａｎｉａｔｉｓら，１９８７）。プロモーターおよびエンハンサーエレメントは、種々の真核生物供給源（酵母細胞、昆虫細胞および哺乳動物細胞における遺伝子を含む）から単離されている。プロモーターおよびエンハンサーエレメントはまた、ウイルスからも単離されており、そして類似の制御エレメント（例えば、プロモーター）はまた、原核生物においても見出されている。特定のプロモーターおよびエンハンサーの選択は、目的のタンパク質を発現させるために使用される細胞型に依存する。いくつかの真核生物プロモーターおよびエンハンサーは、広範な宿主範囲を有するが、他のプロモーターおよびエンハンサーは、限られた細胞型のサブセットにおいて機能的である（概説として、Ｖｏｓｓら，１９８６；およびＭａｎｉａｔｉｓら，１９８７を参照のこと）。例えば、ＳＶ４０初期遺伝子エンハンサーは、多くの哺乳動物種由来の広範な種々の細胞型において非常に活性であり、そして哺乳動物細胞におけるタンパク質の発現のために広範に使用されている（Ｄｉｊｋｅｍａら，１９８５）。広範な哺乳動物細胞型において活性なプロモーター／エンハンサーエレメントの他の２つの例は、ヒト延長因子１遺伝子由来のプロモーター／エンハンサーエレメント（Ｕｅｔｓｕｋｉら，１９８９；Ｋｉｍら，１９９０；ならびにＭｉｚｕｓｈｉｍａおよびＮａｇａｔａ，１９９０）、およびラウス肉腫ウイルス（Ｇｏｒｍａｎら，１９８２）；およびヒトサイトメガロウイルス（Ｂｏｓｈａｒｔら，１９８５）の長末端反復由来のプロモーター／エンハンサーエレメントである。
【００５８】
用語「プロモーター／エンハンサー」は、プロモーター機能およびエンハンサー機能（すなわち、上記のような、プロモーターエレメントおよびエンハンサーエレメントによって提供される機能）の両方を提供し得る配列を含むＤＮＡセグメントを示す。例えば、レトロウイルスの長末端反復は、プロモーター機能およびエンハンサー機能の両方を含む。エンハンサー／プロモーターは、「内因性」であっても、「外因性」であっても、「異種性（ｈｅｔｅｒｏｌｏｇｏｕｓ）」であってもよい。「内因性」エンハンサー／プロモーターは、ゲノム中において所定の遺伝子と天然で連結されているものである。「外因性」または「異種性」のエンハンサー／プロモーターは、遺伝子操作（すなわち、分子生物学技術）によって遺伝子に並置されて位置付けられ、その結果、その遺伝子の転写が、連結されたエンハンサー／プロモーターにより指示されるものである。
【００５９】
発現ベクターにおける「スプライシングシグナル」の存在は、しばしば、真核生物宿主細胞において組換え転写物のより高いレベルの発現を引き起こす。スプライシングシグナルは、一次ＲＮＡ転写物からのイントロンの除去を媒介し、そしてスプライスドナーおよびアクセプター部位から構成される（Ｓａｍｂｒｏｏｋら，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，第２版，ＣｏｌｄＳｐｒｉｎｇ
ＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＮｅｗＹｏｒｋ，１９８９，１６．７−１６．８）。一般的に使用されるスプライスドナーおよびアクセプター部位は、ＳＶ４０の１６ＳＲＮＡ由来のスプライス連結部である。
【００６０】
真核生物細胞における組換えＤＮＡ配列の効率的な発現は、生じる転写物の効率的な終結およびポリアデニル化を指示するシグナルの発現を必要とする。転写終結シグナルは一般的に、ポリアデニル化シグナルの下流に見出され、そして数百ヌクレオチド長である。用語「ポリ（Ａ）部位」または「ポリ（Ａ）配列」は、本明細書中で使用される場合、新生ＲＮＡ転写物の終結およびポリアデニル化の両方を指示するＤＮＡ配列を示す。組換え転写物の効率的なポリアデニル化が望ましい。なぜなら、ポリ（Ａ）テイルを欠失する転写物は、不安定であり、そして迅速に分解されるからである。発現ベクターにおいて利用されるポリ（Ａ）シグナルは、「異種性」であっても「内因性」であってもよい。内因性ポリ（Ａ）シグナルは、ゲノム中において所定遺伝子のコード領域の３’末端に天然で見出されるシグナルである。異種性ポリ（Ａ）シグナルは、１つの遺伝子から単離され、そして別の遺伝子に対して３’側に位置付けられるシグナルである。通常使用される異種性ポリ（Ａ）シグナルは、ＳＶ４０ポリ（Ａ）シグナルである。ＳＶ４０ポリ（Ａ）シグナルは、２３７ｂｐのＢａｍＨＩ／ＢｃｌＩ制限フラグメントに含まれ、そして終結およびポリアデニル化の両方を指示する（Ｓａｍｂｒｏｏｋ，前出，１６．６−１６．７）。
【００６１】
真核生物発現ベクターはまた、「ウイルスレプリコン」または「ウイルス複製起点」を含み得る。ウイルスレプリコンは、適切な複製因子を発現する宿主細胞においてベクターの染色体外複製を可能にするウイルスＤＮＡ配列である。ＳＶ４０またはポリオーマウイルスの複製起点のいずれかを含むベクターは、適切なウイルスＴ抗原を発現する細胞において、高コピー数まで（１０^４コピー／細胞まで）複製する。対照的に、ウシパピローマウイルスまたはエプスタイン−バーウイルス由来のレプリコンを含むベクターは、低コピー数（約１００コピー／細胞）で、染色体外で複製する。
【００６２】
用語「インビトロ」は、人工環境および人工環境において生じるプロセスまたは反応をいう。インビトロ環境としては、試験管および細胞溶解産物が挙げられるが、これらに限定されない。用語「インサイチュ」は、細胞培養物をいう。用語「インビボ」は、天然の環境（例えば、動物または細胞）、および天然の環境において生じるプロセスまたは反応をいう。
【００６３】
用語「発現系」は、目的の遺伝子の発現を決定する（例えば、検出する）ための任意のアッセイまたはシステムをいう。分子生物学の分野における当業者は、任意の広範な種々の発現系が使用され得ることを理解する。広範な適切な哺乳動物細胞は、広範な供給源（例えば、ＡｍｅｒｉｃａｎＴｙｐｅＣｕｌｔｕｒｅＣｏｌｌｅｃｔｉｏｎ，Ｒｏｃｋｌａｎｄ，ＭＤ）から利用可能である。形質転換またはトランスフェクションの方法および発現ビヒクルの選択は、選択される宿主系に依存する。形質転換方法およびトランスフェクション方法は、例えば、Ａｕｓｕｂｅｌら，ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓ
ｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ．ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ．１９９２に記載されている。発現系としては、インビトロ遺伝子発現アッセイが挙げられ、ここでは、目的の遺伝子（例えば、レポーター遺伝子）を調節配列に連結し、そしてこの遺伝子の発現を、この遺伝子の発現を阻害または誘導する因子で処理した後にモニターする。遺伝子発現の検出は、任意の適切な手段（発現されたｍＲＮＡまたはタンパク質（例えば、レポーター遺伝子の検出可能な生成物）の検出が挙げられるが、これに限定されない）を通してか、または目的の遺伝子を発現する細胞の表現型における検出可能な変化を通してなされ得る。発現系はまた、切断事象または他の核酸もしくは細胞の変化を検出するアッセイを含み得る。
【００６４】
用語「酵素」は、化学的反応および生物学的反応の触媒を担う分子または分子凝集体をいう。このような分子は、代表的にはタンパク質であるが、短いペプチド、ＲＮＡ、リボザイム、抗体および他の分子も含み得る。化学的反応および生物学的反応を触媒する分子は、「酵素活性を有する」または「触媒活性を有する」といわれる。
【００６５】
本明細書中で同定されるすべてのアミノ酸残基は、天然のＬ−立体配置である。標準的なポリペプチドの命名法（Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．，２４３，３５５７（１９６９）を参照のこと）と一致して、アミノ酸残基の略語は、以下の対応表に示される通りである。
【００６６】
対応表
一文字三文字アミノ酸
ＹＴｙｒＬ−チロシン
ＧＧｌｙグリシン
ＦＰｈｅＬ−フェニルアラニン
ＭＭｅｔＬ−メチオニン
ＡＡｌａＬ−アラニン
ＳＳｅｒＬ−セリン
ＩＩｌｅＬ−イソロイシン
ＬＬｅｕＬ−ロイシン
ＴＴｈｒＬ−スレオニン
ＶＶａｌＬ−バリン
ＰＰｒｏＬ−プロリン
ＫＬｙｓＬ−リジン
ＨＨｉｓＬ−ヒスチジン
ＱＧｌｎＬ−グルタミン
ＥＧｌｕＬ−グルタミン酸
ＷＴｒｐＬ−トリプトファン
ＲＡｒｇＬ−アルギニン
ＤＡｓｐＬ−アスパラギン酸
ＮＡｓｎＬ−アスパラギン
ＣＣｙｓＬ−システイン。
【００６７】
用語「配列相同性」は、２つの核酸配列間の塩基マッチの割合または２つのアミノ酸配列間のアミノ酸マッチの割合を意味する。配列相同性は、パーセンテージ（例えば、５０％）として表され、このパーセンテージは、いくつかの他の配列と比較される一つの配列からの配列の長さに対するマッチの割合を示す。ギャップ（２つの配列のいずれかにおける）は、マッチするのを最大化するために許容され；１５塩基以下のギャップ長が通常使用され、６塩基以下が好ましく、２塩基以下がより好ましい。プローブまたは処理としてオリゴヌクレオチドを使用する場合、標的核酸とオリゴヌクレオチド配列との間の配列相同性は、一般的に、２０個の可能なオリゴヌクレオチド塩基対マッチのうちの１７個以上の標的塩基マッチ（８５％）であり；好ましくは、１０個の可能な塩基対マッチのうちの９個以上のマッチ（９０％）であり；そしてより好ましくは、２０個の可能な塩基対マッチのうちの１９個以上のマッチ（９５％）である。
【００６８】
２つのアミノ酸配列は、それらの配列の間に部分的または完全な同一性が存在する場合に相同である。例えば、８５％相同性は、最大マッチのために２つの配列を整列する場合に、８５％のアミノ酸が同一であることを意味する。ギャップ（マッチされる２つの配列のいずれかにおける）は、マッチを最大にするにおいて許容され；５個以下のギャップ長が好ましく、２個以下がより好ましい。あるいはまたは好ましくは、２つのタンパク質配列（または、少なくとも１００アミノ酸長のものに由来するポリペプチド配列）は、この用語が本明細書中で使用される場合、それらが変異データマトリクスおよび６以上のギャップペナルティを用いてプログラムＡＬＩＧＮを使用して、５（標準偏差単位）よりも高いアラインメントスコアを有する場合に相同である。Ｄａｙｈｏｆｆ，Ｍ．Ｏ．，ＡｔｌａｓｏｆＰｒｏｔｅｉｎＳｅｑｕｅｎｃｅａｎｄＳｔｒｕｃｔｕｒｅ，１９７２，第５巻，ＮａｔｉｏｎａｌＢｉｏｍｅｄｉｃａｌＲｅｓｅａｒｃｈＦｏｕｎｄａｔｉｏｎ，１０１−１１０頁，およびこの巻に対する補遺２，１−１０頁を参照のこと。２つの配列またはそれらの部分は、より好ましくは、ＡＬＩＧＮプログラムを使用して最適に整列される場合に、それらのアミノ酸が８５％以上同一である場合に相同である。
【００６９】
以下の用語は、２つ以上のポリヌクレオチドの間の配列関連性を記載するために使用される：「参照配列」、「比較ウィンドウ」、「配列同一性」、「配列同一性のパーセンテージ」および「実質的同一性」。「参照配列」は、配列比較のための基準として使用される、規定された配列である；参照配列は、例えば、配列表において提供される全長ｃＤＮＡまたは遺伝子配列のセグメントのような、より長い配列のサブセットであり得るか、または完全ｃＤＮＡまたは遺伝子配列を含み得る。一般的に、参照配列は、少なくとも２０ヌクレオチド長であり、しばしば、少なくとも２５ヌクレオチド長であり、そしてしばしば、少なくとも５０ヌクレオチド長である。２つのポリヌクレオチドは、各々（１）２つのポリヌクレオチドの間で類似である配列（すなわち、完全なポリヌクレオチド配列の部分）を含み得、そして（２）２つのポリヌクレオチドの間で相違する配列をさらに含み得るので、２つ（またはより多く）のポリヌクレオチドの間の配列比較は、代表的に、配列類似性の局所領域を同定および比較するために、「比較ウィンドウ」にわたって２つのポリヌクレオチドの配列を比較することによって実施される。
【００７０】
「比較ウィンドウ」は、本明細書中で使用される場合、少なくとも２０個連続するヌクレオチドの概念的なセグメントをいい、そしてここで、比較ウィンドウにおけるポリヌクレオチド配列の部分は、２つの配列の最適アラインメントのために参照配列（これは、付加も欠失も含まない）に対して比較される場合に、２０％以下の付加または欠失（すなわち、ギャップ）を含み得る。
【００７１】
比較のために配列をアラインメントする方法は、当該分野で周知である。従って、任意の２つの配列間のパーセント同一性の決定は、数学的なアルゴリズムを使用して達成され得る。このような数学的アルゴリズムの好ましく非制限的な例は、ＭｙｅｒｓおよびＭｉｌｌｅｒ（１９８８）のアルゴリズム；ＳｍｉｔｈおよびＷａｔｅｒｍａｎ（１９８１）の局所的相同性アルゴリズム；ＮｅｅｄｌｅｍａｎおよびＷｕｎｓｃｈ（１９７０）の相同性アラインメントアルゴリズム；ＰｅａｒｓｏｎおよびＬｉｐｍａｎ（１９８８）の類似性検索方法；ＫａｒｌｉｎおよびＡｌｔｓｃｈｕｌ（１９９０）のアルゴリズム、ＫａｒｌｉｎおよびＡｌｔｓｃｈｕｌ（１９９３）におけるような改変である。
【００７２】
これらの数学的アルゴリズムのコンピューター実行が、配列同一性を決定するための配列比較のために利用され得る。このような実行としては、以下が挙げられるが、これらに限定されない：ＰＣ／ＧｅｎｅプログラムにおけるＣＬＵＳＴＡＬ（Ｉｎｔｅｌｌｉｇｅｎｅｔｉｃｓ，ＭｏｕｎｔａｉｎＶｉｅｗ，Ｃａｌｉｆｏｒｎｉａから利用可能）；ＡＬＩＧＮプログラム（バージョン２．０）およびＷｉｓｃｏｎｓｉｎＧｅｎｅｔｉｃｓ
ＳｏｆｔｗａｒｅＰａｃｋａｇｅ，バージョン８におけるＧＡＰ、ＢＥＳＴＦＩＴ、ＢＬＡＳＴ、ＦＡＳＴＡ、およびＴＦＡＳＴＡ（ＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ（ＧＣＧ），５７５ＳｃｉｅｎｃｅＤｒｉｖｅ，Ｍａｄｉｓｏｎ，Ｗｉｓｃｏｎｓｉｎ，ＵＳＡから利用可能）。これらのプログラムを使用するアラインメントは、デフォルトパラメーターを使用して実施され得る。ＣＬＵＳＴＡＬプログラムは、Ｈｉｇｇｉｎｓら（１９８８）；Ｈｉｇｇｉｎｓら（１９８９）；Ｃｏｒｐｅｔら（１９８８）；Ｈｕａｎｇら（１９９２）；およびＰｅａｒｓｏｎら（１９９４）によって十分に記載されている。ＡＬＩＧＮプログラムは、ＭｙｅｒｓおよびＭｉｌｌｅｒ（前出）のアルゴリズムに基づく。Ａｌｔｓｃｈｕｌら（１９９０）のＢＬＡＳＴプログラムは、ＫａｒｌｉｎおよびＡｌｔｓｃｈｕｌ（前出）のアルゴリズムに基づく。比較目的のためにギャップ形成されたアラインメントを得るために、ＧａｐｐｅｄＢＬＡＳＴ（ＢＬＡＳＴ２．０における）が、Ａｌｔｓｃｈｕｌら（１９９７）に記載のように利用され得る。あるいは、ＰＳＩ−ＢＬＡＳＴ（ＢＬＡＳＴ２．０における）を使用して、分子間の遠い関係を検出する反復検索を実施し得る。Ａｌｔｓｃｈｕｌら（前出）を参照のこと。ＢＬＡＳＴ、ＧａｐｐｅｄＢＬＡＳＴ、ＰＳＩ−ＢＬＡＳＴを使用する場合、それぞれのプログラム（例えば、ヌクレオチド配列についてのＢＬＡＳＴＮ、タンパク質についてのＢＬＡＳＴＸ）のデフォルトパラメーターを使用し得る。ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ．を参照のこと。アラインメントはまた、目視によって手動で実施され得る。
【００７３】
用語「配列同一性」は、比較ウィンドウにわたって、２つのポリヌクレオチド配列が同一（すなわち、ヌクレオチド対ヌクレオチド基準で）であることを意味する。用語「配列同一性のパーセンテージ」は、２つのポリヌクレオチド配列が、比較ウィンドウにわたって、規定された割合のヌクレオチドについて同一（すなわち、ヌクレオチド対ヌクレオチド基準で）であることを意味する。用語「配列同一性のパーセンテージ」は、比較ウィンドウにわたって最適に整列された２つの配列を比較する工程、両方の配列において同一の核酸塩基（例えば、Ａ、Ｔ、Ｃ、Ｇ、Ｕ、またはＩ）が存在する位置の数を決定して、マッチした位置の数を算出する工程、比較ウィンドウにおける位置の総数（すなわち、ウィンドウサイズ）でマッチした位置の数を除算する工程、およびこの結果に１００を乗算して、配列同一性のパーセンテージを算出する工程によって算出される。用語「実質的同一性」は、本明細書中で使用される場合、ポリヌクレオチド配列の特徴を示し、ここでは、ポリヌクレオチドは、少なくとも２０ヌクレオチドの位置の比較ウィンドウにわたって、しばしば、少なくとも２０〜５０ヌクレオチドのウィンドウにわたって、そして好ましくは、少なくとも３００ヌクレオチドで、参照配列に対して比較される場合に、少なくとも６０％、好ましくは少なくとも６５％、より好ましくは少なくとも７０％、約８５％まで、そしてさらにより好ましくは、少なくとも９０〜９５％、一般的により好ましくは少なくとも９９％の配列同一性を有する配列を含み、ここで、配列同一性のパーセンテージは、比較ウィンドウにわたって参照配列の合計２０％以下の欠失または付加を含み得るポリヌクレオチド配列に対して参照配列を比較することによって算出される。参照配列は、より長い配列のサブセットであり得る。
【００７４】
ポリペプチドに適用される場合、用語「実質的同一性」は、２つのペプチド配列が、例えば、デフォルトギャップ重を使用してプログラムＧＡＰまたはＢＥＳＴＦＩＴによって最適に整列される場合に、少なくとも約８５％の配列同一性、好ましくは少なくとも約９０％の配列同一性、より好ましくは、少なくとも約９５％の配列同一性、そして最も好ましくは、少なくとも約９９％の配列同一性を共有することを意味する。
【００７５】
（本発明の合成核酸分子および方法）
本発明は、合成核酸分子を含む組成物、ならびに、所望の特徴（特定の細胞型において発現される場合での減少した不適切な転写特徴または意図されていない転写特徴を含む）を有するポリペプチドまたはタンパク質として効率的に発現される合成核酸分子を生成するこれらの分子を調製するための方法を提供する。
【００７６】
自然選択とは、表現型レベルで起こる遺伝子型−環境の相互作用が、個体の示差的な生殖の成功へと導き、これにより、集団の遺伝子プールの改変へと導くという仮説である。一般に、天然で見出されるタンパク質のアミノ酸配列は、自然選択によって最適化を受けたと認められる。しかし、アミノ酸は、顕著にはタンパク質の活性に寄与しないタンパク質配列内に存在し、そしてこれらのアミノ酸は、ほとんどまたは全く意義なく、他のアミノ酸に変更され得る。さらに、タンパク質は、その天然の環境以外で有用であり得るか、またはその自然選択条件とは異なる目的のために有用であり得る。これらの環境において、アミノ酸配列は、種々の適用におけるその用途のために、タンパク質をより良く適合させるように合成的に変更され得る。
【００７７】
同様に、タンパク質をコードする核酸配列はまた、自然選択によって最適化される。コードするＤＮＡとその転写されるＲＮＡとの間の関係は、ＤＮＡに対するいかなる変化も、生じるＲＮＡに影響を及ぼすような関係である。従って、自然選択は、両方の分子に同時に働きかける。しかし、この関係は、核酸とタンパク質との間には存在しない。複数のコドンが同一のアミノ酸をコードするので、多くの異なるヌクレオチド配列が、同一のタンパク質をコードし得る。５００アミノ酸から構成される特定のタンパク質は、理論上では、１０^１５０個よりも多くの異なる核酸配列によってコードされ得る。
【００７８】
自然選択は、核酸に対して作用して、対応するタンパク質の適切なコードを達成する。おそらく、核酸分子の他の特性もまた、自然選択によって作用される。これらの特性としては、コドン使用頻度、ＲＮＡの二次構造、イントロンスプライシングの効率、および転写因子または他の核酸結合タンパク質との相互作用が挙げられる。これらの他の特性は、タンパク質の翻訳効率および生じる表現型を変更し得る。遺伝コードの冗長性質が理由で、これらの他の性質は、対応するアミノ酸配列を変更することなく、自然選択によって最適化され得る。
【００７９】
いくつかの条件下では、タンパク質をコードする天然のヌクレオチド配列を、代替的適用のためにこのタンパク質をより良く適合させるように合成的に変更することが有用である。一般的な例は、それを外来宿主において発現させる場合に、遺伝子のコドン使用頻度を変更することである。遺伝コードの冗長性は、アミノ酸が複数のコドンによってコードされることを可能にするが、異なる生物は、他と比較していくつかのコドンを好む。コドン使用頻度は、進化学的に大きく離れた歴史を有する生物について最も異なる傾向がある。進化学的に遠い生物の間で遺伝子を転移させる場合、タンパク質翻訳の効率は、コドン使用頻度を調整することによって実質的に増加され得ることが見出されている（米国特許第５，０９６，８２５号、同第５，６７０，３５６号、および同第５，８７４，３０４号を参照のこと）。
【００８０】
進化の距離に関する必要性に起因して、レポーター遺伝子のコドン使用頻度は、しばしば、実験細胞の最適なコドン使用頻度に対応しない。例としては、β−ガラクトシダーゼ（β−ｇａｌ）レポーター遺伝子およびクロラムフェニコールアセチルトランスフェラーゼ（ｃａｔ）レポーター遺伝子（これらは、Ｅ．ｃｏｌｉに由来し、そして哺乳動物細胞において一般的に使用される）；β−グルクロニダーゼ（ｇｕｓ）レポーター遺伝子（これは、Ｅ．ｃｏｌｉに由来し、そして植物細胞において一般的に使用される）；ホタルルシフェラーゼ（ｌｕｃ）レポーター遺伝子（これは、昆虫に由来し、そして植物細胞および哺乳動物細胞において一般的に使用される）；Ｒｅｎｉｌｌａルシフェラーゼレポーター遺伝子およびグリーン蛍光タンパク質（ｇｆｐ）レポーター遺伝子（これらは、腔腸動物に由来し、そして植物細胞および哺乳動物細胞において一般的に使用される）が挙げられる。レポーター遺伝子発現の高感度な定量を達成するために、その遺伝子産物の活性は、実験宿主細胞に対して内因性であってはならない。従って、レポーター遺伝子は、通常、独特かつ特有の表現型を有する生物から選択される。結果として、これらの生物は、しばしば、実験宿主細胞から広範に離れた進化歴を有する。
【００８１】
以前に、より最適なコドン使用頻度を有するが、同じ遺伝子産物をなおコードする遺伝子を作製するために、合成核酸配列は、既存のコドンを、実験宿主細胞に一般的により好ましいコドンと置換することによって作製された（米国特許第５，０９６，８２５号、同第５，６７０，３５６号、および同第５，８７４，３０４号を参照のこと）。結果は、合成遺伝子のコドン使用頻度における正味の改善であった。しかし、他の特性の最適化は考慮されず、そのため、これらの合成遺伝子は、自然淘汰によって最適化された遺伝子を反映しなかったようである。
【００８２】
詳細には、コドン使用頻度における改善は、タンパク質への翻訳におけるＲＮＡ配列の役割に基づいて、ＲＮＡ配列の最適化に対してのみ意図されている。このように、以前に記載された方法は、合成遺伝子の配列が、ＲＮＡへの転写におけるＤＮＡの役割にどのように影響するかに取り組まなかった。最も注目すべきには、転写因子が合成ＤＮＡとどのように相互作用し得、そして結果として遺伝子転写をどのように調節し得るか、またはさもなければどのように影響し得るかについて、考慮されなかった。天然に見出される遺伝子について、そのＤＮＡは、ネイティブな宿主細胞によって最適に転写され、そしてＲＮＡを生成し、このＲＮＡが、適切にフォールディングされる遺伝子産物をコードする。対照的に、合成遺伝子は、以前に、転写特性について最適化されなかった。むしろ、この特性は、無視されていたか、または成り行きに任されていた。
【００８３】
この問題は、全ての遺伝子について重要であるが、実験宿主細胞における転写挙動を定量化するために最も一般的に使用されるレポーター遺伝子について、特に重要である。何百もの転写因子が、異なる生理学的条件下の異なる細胞型において同定されているが、おそらくより多くの存在が、依然同定されていない。これらの転写因子の全ては、導入された遺伝子の転写に影響を及ぼし得る。本発明の有用な合成レポーター遺伝子は、その遺伝子の構造が変更されているので、宿主細胞の内因性の転写特性に影響を及ぼすかまたは混乱させる最小の危険性を有する。特に有用な合成レポーター遺伝子は、新しいセットの実験条件下および／または広範な種々の実験条件下で所望の特性を有する。これらの特性を最良に達成するために、合成遺伝子の構造は、広範囲の宿主細胞内および生理学的条件下で転写因子と相互作用する最小の可能性を有するべきである。レポーター遺伝子と宿主細胞の内因性転写因子との間の潜在的な相互作用を最小化することは、特定の実験下での遺伝子の不適切な転写特性の危険性を減少し、種々の環境下での遺伝子の適応性を増加し、そして得られる実験データの容認を増加することによって、レポーター遺伝子の価値を増加する。
【００８４】
対照的に、元の宿主生物由来のゲノムクローンまたはｃＤＮＡクローンに基づく、ネイティブヌクレオチド配列を含むレポーター遺伝子は、外因性宿主において発現された場合に、転写因子と相互作用し得る。この危険性は、２つの状況から生じる。第１に、ネイティブヌクレオチド配列は、ネイティブ宿主生物内での遺伝子の転写に影響を及ぼすように自然淘汰を介して最適化された配列を含む。しかし、これらの配列はまた、その遺伝子が外因性宿主中で発現された場合にも、転写に影響を及ぼし得（すなわち、無関係に）、従って、レポーター遺伝子としてのその能力を干渉する。第２に、そのヌクレオチド配列は、ネイティブ宿主生物中に存在せず、そして従って、その自然淘汰に関与しなかった転写因子と、不用意に相互作用し得る。このような不用意な相互作用の可能性は、レポーター遺伝子の実験細胞とネイティブ生物との間の進化の距離が大きいほど増加する。
【００８５】
転写因子とのこれらの潜在的相互作用は、コドン使用頻度における改変を有する合成レポーター遺伝子を使用する場合に、おそらく破壊される。しかし、コドン使用頻度のみに基づいてコドンを選択することによって設計された合成レポーター遺伝子配列は、他の意図されない転写因子結合部位を含む可能性がある。なぜなら、合成遺伝子は、不適切な転写活性を矯正するように自然淘汰の利益を受けていないからである。転写因子との不用意な相互作用はまた、コードされるアミノ酸配列が人為的に変更される場合（例えば、アミノ酸置換を導入するために）にいつも生じ得る。同様に、これらの変化は、自然淘汰に供されておらず、従って、所望でない特性を示し得る。
【００８６】
従って、本発明は、合成核酸配列を調製するための方法を提供し、この合成配列は、特定の宿主細胞において発現された場合に、転写因子とのその核酸の所望でない相互作用の危険性を減少し、それによって、不適切な転写特性または意図されない転写特性を減少する。好ましくは、この方法は、特定の宿主細胞についての改善されたコドン使用頻度を含み、かつ転写因子結合部位の出現が減少された、合成遺伝子を生じる。本発明はまた、転写因子結合部位の出現が減少され、かつさらなる有利な構造特性を有する、改善されたコドン使用頻度を含む合成遺伝子を調製する方法を提供する。このようなさらなる特性としては、不適切なＲＮＡスプライシング接合部、ポリ（Ａ）付加シグナル、所望でない制限部位、リボソーム結合部位および二次構造モチーフ（例えば、ヘアピンループ）の非存在が挙げられる。
【００８７】
同じタンパク質または非常に類似するタンパク質（「コドン相違」バージョン）をコードする、２つの合成遺伝子を調製する方法もまた提供される。好ましくは、この２つの合成遺伝子は、共通のポリヌクレオチドプローブ配列にハイブリダイズする能力が減少されているか、または生存細胞に一緒に存在する場合に組み換わる危険性が減少されている。組換えを検出するために、隣接配列に相補的なプライマーを使用するレポーター配列のＰＣＲ増幅、およびその増幅された配列の配列決定が、使用され得る。
【００８８】
本発明の合成核酸分子についてのコドンを選択するために、好ましいコドンは、選択された宿主細胞において相対的に高いコドン使用頻度を有し、そしてそれらの導入は、相対的に少ない転写因子結合部位の導入、相対的に少ない他の所望でない構造特性の導入、および必要に応じて、非常に類似するタンパク質をコードする別の遺伝子とその合成遺伝子とを識別する特徴の導入を生じる。従って、本発明の方法によって得られる合成核酸産物は、改善されたコドン使用頻度に起因する発現レベルの改善、所望でない転写調節配列の数の減少に起因する不適切な転写挙動の危険性の減少、および必要に応じて、合成配列を選択するために使用され得る他の基準に起因する任意のさらなる特性を有する、合成遺伝子である。
【００８９】
本発明は、任意の核酸配列（例えば、ネイティブ配列（例えば、ｃＤＮＡ）またはインビトロで操作された配列）を使用して、例えば、特定の変更（例えば、制限酵素認識部位の導入または除去、異なるアミノ酸をコードするかまたは融合タンパク質をコードするようなコドン変更）を導入し得るか、または核酸分子のＧＣまたはＡＴ含量（組成％）を変更し得る。さらに、本発明の方法は、任意の遺伝子に有用であるが、特に、レポーター遺伝子ならびにレポーター遺伝子の発現に関連する他の遺伝子（例えば、選択マーカー）に有用である。好ましい遺伝子としては、ラクタマーゼ（β−ｇａｌ）、ネオマイシン耐性（Ｎｅｏ）、ＣＡＴ、ＧＵＳ、ガラクトピラノシド、ＧＦＰ、キシロシダーゼ、チミジンキナーゼ、アラビノシダーゼなどをコードする遺伝子が挙げられるが、これらに限定されない。本明細書中で使用される場合、「マーカー遺伝子」または「レポーター遺伝子」は、その遺伝子を発現する細胞に別の表現型を付与し、そしてその遺伝子を有する細胞がその遺伝子を有さない細胞と識別されるのを可能にする遺伝子である。このような遺伝子は、選択マーカーまたはスクリーニングマーカーのいずれかをコードし得、これは、そのマーカーが、化学的手段によって（すなわち、選択薬剤（例えば、除草剤、抗生物質など）の使用によって）「選択」し得る形質を付与するか否か、またはそのマーカーが、観察もしくは試験を介して（すなわち、「スクリーニング」によって）同定し得る、単なる「レポーター」形質であるか否かに依存する。本開示のエレメントは、特定のマーカー遺伝子の使用を介して詳細に例示される。もちろん、適切なマーカー遺伝子またはレポーター遺伝子の多くの例が、当該分野で公知であり、そして本発明の実施において使用され得る。従って、以下の議論は、網羅的ではなく例示的であることが理解される。本明細書中に開示される技術および当該分野で公知の一般的な組換え技術を考慮して、本発明は、任意の遺伝子の変更を可能にする。
【００９０】
例示的なマーカー遺伝子としては、ｎｅｏ遺伝子、β−ｇａｌ遺伝子、ｇｕｓ遺伝子、ｃａｔ遺伝子、ｇｐｔ遺伝子、ｈｙｇ遺伝子、ｈｉｓＤ遺伝子、ｂｌｅ遺伝子、ｍｐｒｔ遺伝子、ｂａｒ遺伝子、ニトリラーゼ遺伝子、変異体アセトラクテートシンターゼ遺伝子（ＡＬＳ）またはアセト酸（ａｃｅｔｏａｃｉｄ）シンターゼ遺伝子（ＡＡＳ）、メトトレキサート耐性ｄｈｆｒ遺伝子、デラポン（ｄｅｌａｐｏｎ）デハロゲナーゼ遺伝子、変異されたアントラニレートシンターゼ遺伝子（これは、５−メチルトリプトファンに対する耐性を付与する）（ＷＯ９７／２６３６６）、Ｒ遺伝子座遺伝子、β−ラクタマーゼ遺伝子、ｘｙｌＥ遺伝子、α−アミラーゼ遺伝子、チロシナーゼ遺伝子、ルシフェラーゼ（ｌｕｃ）遺伝子（例えば、Ｒｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓルシフェラーゼ遺伝子、ホタルルシフェラーゼ遺伝子、またはコメツキムシルシフェラーゼ（Ｐｙｒｏｐｈｏｒｕｓｐｌａｇｉｏｐｈｔｈａｌａｍｕｓ）遺伝子）、エクオリン遺伝子、またはグリーン蛍光タンパク質遺伝子が挙げられるが、これらに限定されない。用語、選択マーカー遺伝子またはスクリーニングマーカー遺伝子には、形質転換された細胞について同定または選択する手段として、その分泌が検出され得る、「分泌マーカー」をコードする遺伝子も含まれる。その例には、抗体相互作用によって同定され得る分泌抗原をコードするマーカー、またはその触媒活性によって検出され得る分泌酵素でさえ含まれる。分泌タンパク質は、多くのクラスに分類され、これらには、小さい拡散性のタンパク質（例えば、ＥＬＩＳＡによって検出可能な）、および細胞膜に挿入または捕捉されるタンパク質が挙げられる。
【００９１】
本発明の方法は、反復プロセス（しかし、これに限定されない）によって行われ得る。このプロセスは、特定の種におけるコドン使用頻度に基づいて、標的分子（例えば、ネイティブヌクレオチド配列）において各アミノ酸に対する好ましいコドンを割り当てる工程、好ましいコドンを有する核酸配列において潜在的な転写調節配列（例えば、転写因子結合部位）を同定する工程（例えば、このような結合部位のデータベースを使用して）、必要に応じて、他の所望でない配列を同定する工程、および所望でない転写因子結合部位または他の配列が存在する位置を代替的なコドン（すなわち、同じアミノ酸をコードする）で置換する工程を包含する。コドン相違バージョンについて、代替的な好ましいコドンが、各バージョンにおいて置換される。必要な場合、潜在的な転写因子配列または他の所望でない配列の同定および除去は、ヌクレオチド配列が、最大数の好ましいコドンを含み、そして最小数の所望でない配列（転写調節配列または他の所望でない配列を含む）を含むことが達成されるまで、繰り返され得る。また、必要に応じて、所望の配列（例えば、制限酵素認識部位）が、導入され得る。合成核酸分子が設計および構築された後、その親核酸配列に対する特性が、当該分野で周知の方法によって決定され得る。例えば、特定の細胞における一連のベクター中の合成核酸分子および標的核酸分子の発現が、比較され得る。
【００９２】
従って、一般に、本発明の方法は、標的核酸配列（例えば、ベクター骨格）、レポーター遺伝子または選択マーカー遺伝子、および目的の宿主細胞（例えば、植物（双子葉植物または単子葉植物）細胞、真菌細胞、酵母細胞または哺乳動物細胞）を同定する工程を包含する。好ましい宿主細胞は、哺乳動物宿主細胞（例えば、ＣＨＯ細胞、ＣＯＳ細胞、２９３細胞、Ｈｅｌａ細胞、ＣＶ−１細胞およびＮＩＨ３Ｔ３細胞）である。宿主細胞における好ましいコドン使用頻度、および必要に応じて、宿主細胞における低いコドン使用頻度（例えば、高い使用頻度の哺乳動物コドンならびに低い使用頻度のＥ．ｃｏｌｉコドンおよび哺乳動物コドン）に基づいて、置き換えられるべきコドンが、決定される。２つの合成核酸分子のコドン相違バージョンについて、代替的な好ましいコドンが、各バージョンに導入される。従って、２より多いコドンを有するアミノ酸について、ある好ましいコドンが、あるバージョンに導入され、そして別の好ましいコドンが、他のバージョンに導入される。６つのコドンを有するアミノ酸について、最も多数の不対合塩基を有する２つのコドンが同定され、一方が、一方のバージョンに導入され、そして他方のコドンが、他方のバージョンに導入される。置き換えられるべきコドンの選択と同時に、その選択の後に、またはその選択の前に、標的配列における所望の配列および所望でない配列（例えば、所望でない転写調節配列）が、同定される。これらの配列は、ＥＰＤ、ＮＮＰＤ、ＲＥＢＡＳＥ、ＴＲＡＮＳＦＡＣ、ＴＥＳＳ、ＧｅｎｅＰｒｏ、ＭＡＲ（ｗｗｗ．ｎｃｇｒ．ｏｒｇ／ＭＡＲ−ｓｅａｒｃｈ）およびＢＣＭＧｅｎｅＦｉｎｄｅｒ（本明細書中にさらに記載される）のようなデータベースおよびソフトウェアを使用して同定され得る。これらの配列が同定された後、改変が導入される。一旦、所望の合成核酸配列が得られると、それは、当該分野で周知の方法（例えば、重複プライマーを用いるＰＣＲ）によって調製され得、そして、その構造特性および機能特性（相同性％、特定の配列（例えば、制限部位）の存在または非存在、変化されたコドンの割合（例えば、特定のコドンの使用頻度の増加または減少）および発現率が挙げられるが、これらに限定されない）が、標的核酸配列と比較される。
【００９３】
以下に記載されるように、この方法を使用して、Ｒｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓルシフェラーゼをコードする合成レポーター遺伝子、および２つのコメツキムシルシフェラーゼ（一方は、緑色の光を放出し、もう一方は、赤色の光を放出する）をコードする合成レポーター遺伝子を作製した。両方の系について、これらの合成遺伝子は、そのタンパク質の対応するネイティブ遺伝子または親遺伝子よりも、はるかに高いレベルの発現を支持する。さらに、ネイティブ遺伝子および親遺伝子は、哺乳動物細胞において発現させた場合に、特異な転写特性を示し、これは、合成遺伝子では示されなかった。詳細には、ネイティブ遺伝子または親遺伝子の基礎発現は、比較的高い。さらに、その発現は、公知のプロモーターの非存在下でエンハンサー配列によって非常に高いレベルに誘導される。これらの合成遺伝子は、より低い基礎発現を示し、特異なエンハンサー挙動を示さない。おそらく、このエンハンサーは、合成遺伝子には存在しない、ネイティブ遺伝子において見出される転写エレメントを活性化している。これらの結果は、合成遺伝子核酸配列がレポーター遺伝子として優れた性能を示すことを、明らかに示す。
【００９４】
（本発明の分子の例示的使用）
本発明の合成遺伝子は、好ましくは、それらのネイティブ対応物と同じ（または、ほとんど同じ）タンパク質をコードするが、改善されたコドン使用頻度を有し、コード領域における既知の転写調節エレメントが大きく欠失されている（少数のアミノ酸変化が、ネイティブの対応タンパク質の特性を増強するため（例えば、ルシフェラーゼの発光を増強するため）に所望され得ることが認識される）。これは、合成遺伝子がコードするタンパク質の発現レベルを増加し、そしてそのタンパク質の特異な発現の危険性を減少する。例えば、弱いプロモーターによって媒介され得る遺伝子調節の多くの重要な事象の研究は、レポータータンパク質の不適切な発現からの不十分なレポーターシグナルによって制限される。本明細書中に記載の合成ルシフェラーゼ遺伝子は、発現レベルの大きい増加（これが、検出感度の増加を可能にする）に起因して、弱いプロモーター活性の検出を可能にする。また、いくつかの選択マーカーの使用は、外因性細胞におけるそのマーカーの発現によって制限され得る。従って、細胞に対する改善されたコドン使用頻度を有し、そして他の所望でない配列（例えば、転写因子結合部位）が減少された合成選択マーカー遺伝子は、さもなければこれらのマーカーの宿主として望ましくなかった細胞における、これらのマーカーの使用を可能にし得る。
【００９５】
プロモーターのクロストーク（ｃｒｏｓｓｔａｌｋ）は、共レポーター遺伝子を使用してトランスフェクション効率を正規化する場合の、別の問題点である。合成遺伝子の増強された発現によって、強力なプロモーターを含むＤＮＡの量が減少され得るか、または弱いプロモーターを含むＤＮＡを使用して、共レポーターの発現を駆動し得る。さらに、本発明の合成レポーター遺伝子からのバックグラウンド発現が、減少され得る。この特徴は、合成レポーター遺伝子からの散発性の発現を最小化し、そして他の調節経路から生じる干渉を減少することによって、合成レポーター遺伝子をより望ましくする。
【００９６】
画像化システム（これは、インビボでの生物学的研究または薬物スクリーニングに使用され得る）におけるレポーター遺伝子の使用は、本発明の合成遺伝子についての別の用途である。これらの発現レベルの増加に起因して、合成遺伝子によってコードされるタンパク質は、画像化システムによってより容易に検出可能である。実際に、合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子を使用して、トランスフェクトされたＣＨＯ細胞における発光は、計測器の補助なしで可視的に検出された。
【００９７】
さらに、合成遺伝子は、融合タンパク質（例えば、分泌リーダー配列または細胞局在化配列を有する融合体）を発現させるため、トランスフェクトするのが困難な細胞（例えば、初代細胞）における転写を研究するため、および／または、調節経路および遺伝エレメントの分析を改善するために使用され得る。他の用途としては、以下が挙げられるが、これらに限定されない：極度の感度を必要とする稀少な事象の検出（例えば、ＲＮＡ再コード化（ｒｅｃｏｒｄｉｎｇ）の研究）、ＩＲＥＳとの使用、インビトロ翻訳またはインビトロ転写−翻訳連結系（例えば、ＴＮＴ（ＰｒｏｍｅｇａＣｏｒｐ．，Ｍａｄｉｓｏｎ，ＷＩ）の効率を改善するため、異なる宿主生物（例えば、植物、真菌など）に対して最適化されるレポーターの研究、薬物毒性をモニターするための共レポーターとしての複数の遺伝子の使用、マルチウェルアッセイにおけるレポーター分子として、および薬物スクリーニングにおけるレポーター分子（異なるシグナル伝達経路および他の調節機構によるレポーターシグナルの可能な干渉を最小化する利点を有する）として）。
【００９８】
さらに、本発明の核酸分子の用途としては、以下が挙げられる：蛍光活性化細胞選別（ＦＡＣＳ）、蛍光顕微鏡、インビトロおよびインビボでの遺伝子発現レベルを検出および／または測定するため（例えば、プロモーター強度の決定するため）、細胞内局在化または標的化（融合タンパク質）、マーカーとして、較正において、キットにおいて（例えば、二重（ｄｕａｌ）アッセイのため）、インビボ画像化のため、調節経路および遺伝エレメントを分析するため、およびマルチウェル形式において）。
【００９９】
ルシフェラーゼをコードする合成ＤＮＡについて、合成コメツキムシルシフェラーゼの使用は、二重レポーターの測定のような利点を提供する。Ｒｅｎｉｌｌａルシフェラーゼは、インビボ画像化により適切であるので（なぜなら、これは、ホタルルシフェラーゼと異なり、反応のためにＡＴＰにもＭｇ^２＋にも依存しないからであり、そしてセレンテラジンは、ルシフェリンよりも細胞膜により透過性であるからである）、合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子は、インビボで使用され得る。さらに、合成Ｒｅｎｉｌｌａルシフェラーゼは、例えば、生物学的分析のため、または薬物スクリーニングプラットフォームにおける、二重ルシフェラーゼアッセイにおける改善された忠実度および感度を有する。
【０１００】
（ルシフェラーゼ遺伝子を使用する本発明の実証）
コメツキムシルシフェラーゼおよびＲｅｎｉｌｌａルシフェラーゼのレポーター遺伝子を使用して、本発明を実証した。なぜなら、これらがコードするタンパク質によって触媒される反応は、ほとんどの遺伝子の産物よりも、定量することが有意に容易であるからである。しかし、本発明を実証する目的のために、これらは、一般的な遺伝子を代表する。
【０１０１】
コメツキムシルシフェラーゼ遺伝子およびＲｅｎｉｌｌａルシフェラーゼ遺伝子は、「ルシフェラーゼ」という名前を共有するが、これは、これらが、同じ遺伝子ファミリーを起源とすることを意味すると解釈されるべきではない。これらの２つのルシフェラーゼタンパク質は、進化的に異なり；これらは、本質的に異なる形質および物理的構造を有し、これらは、広範に異なる基質を使用し（図１７）、そしてこれらは、完全に異なる遺伝子ファミリーから進化した。コメツキムシルシフェラーゼは、６１ｋＤのサイズであり、ルシフェリンを基質として使用し、そしてＣｏＡシンテターゼから進化した。Ｒｅｎｉｌｌａルシフェラーゼは、ウミシイタケＲｅｎｉｌｌａＲｅｎｉｆｏｒｍｉｓを起源とし、これは、３５ｋＤのサイズであり、基質としてセレンテラジンを使用して、そしてαβヒドロラーゼから進化した。これらの２つの酵素の唯一の共有される形質は、これらが触媒する反応が、光の放出を生じることである。これらは、任意の他の２つの酵素が、例えば、単に、それらが触媒する反応が熱を生じるので類似であるというのと同様に、光の放出を生じることについて類似しない。
【０１０２】
生物発光は、ルシフェラーゼ媒介酸化反応の結果として特定の生物において生成される光である。ルシフェラーゼ遺伝子（例えば、発光性の甲虫、ウミシイタケ由来の遺伝子、および、特に、Ｐｈｏｔｉｎｕｓｐｙｒａｌｉｓ（北米の一般的なホタル）由来のルシフェラーゼ）は、現在最もポピュラーな発光レポーター遺伝子である。発光レポーター遺伝子アッセイの総説については、Ｂｒｏｎｓｔｅｉｎら（１９９４）に、そして甲虫の生物発光の進化の総説については、Ｗｏｏｄ（１９９５）に、言及されている。ホタルおよびコメツキムシのルシフェラーゼ（１７Ａ）およびＲｅｎｉｌｌａルシフェラーゼ（１７Ｂ）の各々によって触媒される反応の例示については、図１７を参照のこと。
【０１０３】
ホタルルシフェラーゼおよびＲｅｎｉｌｌａルシフェラーゼは、発光アッセイの簡便性、感度および直線範囲に起因して、遺伝子レポーターとして非常に価値がある。今日、ルシフェラーゼは、実質的に全てのタイプの実験生物系（原核生物および真核生物の細胞培養物、トランスジェニック植物および動物、ならびに無細胞発現系が挙げられるが、これらに限定されない）において使用される。ホタルルシフェラーゼ酵素は、特定の北米の甲虫Ｐｈｏｔｉｎｕｓｐｙｒａｌｉｓに由来する。ホタルルシフェラーゼ酵素およびコメツキムシルシフェラーゼ酵素は、モノマータンパク質（６１ｋＤａ）であり、これは、ＡＴＰおよびＯ_２を使用する甲虫ルシフェリンの一酸素原子付加を介して、光を生成する（図１７Ａ）。Ｒｅｎｉｌｌａルシフェラーゼは、ウミシイタケＲｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓに由来する。Ｒｅｎｉｌｌａルシフェラーゼ酵素は、３６ｋＤａのモノマータンパク質であり、これは、Ｏ_２およびセレンテラジンを利用して光を生じる（図１７Ｂ）。
【０１０４】
ホタルルシフェラーゼをコードする遺伝子は、Ｐｈｏｔｉｎｕｓｐｙｒａｌｉｓからクローニングされ、そしてＥ．ｃｏｌｉにおいて活性な酵素を生成することが実証されている（ｄｅＷｅｔら、１９８７）。ホタルルシフェラーゼをコードするｃＤＮＡ（ｌｕｃ）は、動物細胞、植物細胞および微生物細胞において遺伝子活性をレポートするための選り抜きの遺伝子として支持を獲得し続けている。ホタルルシフェラーゼ反応（ＣｏＡの付加によって修飾され、持続的な光の放出を生じる）は、トランスフェクトされた細胞または組織の小さいサンプル中のホタルルシフェラーゼ発現を定量するための、極めて高感度かつ迅速なインビトロアッセイを提供する。
【０１０５】
遺伝子レポーターとしてホタルルシフェラーゼまたはコメツキムシルシフェラーゼを使用するために、ルシフェラーゼを発現する細胞の抽出物を基質（甲虫ルシフェリン、Ｍｇ^２＋、ＡＴＰおよびＯ_２）と混合し、そして発光を即座に測定する。アッセイは、非常に迅速かつ高感度であり、ほとんど労力なく遺伝子発現データを提供する。従来のホタルルシフェラーゼアッセイは、そのアッセイ試薬に補酵素Ａを含めて、より高い酵素ターンオーバーおよびより大きい発光強度を生じることによって、さらに改善された（ＰｒｏｍｅｇａＬｕｃｉｆｅｒａｓｅＡｓｓａｙＲｅａｇｅｎｔ、カタログ番号Ｅ１５００、ＰｒｏｍｅｇａＣｏｒｐｏｒａｔｉｏｎ、Ｍａｄｉｓｏｎ、Ｗｉｓ．）。この試薬を使用して、ルシフェラーゼ活性は、ルミノメーターまたはシンチレーションカウンターにおいて容易に測定され得る。ホタルルシフェラーゼ活性およびコメツキムシルシフェラーゼ活性はまた、増殖培地にルシフェリンを添加することによって、培養物中の生存細胞において検出され得る。このインサイチュ発光は、甲虫ルシフェリンが細胞膜およびペルオキシソーム膜を通って拡散する能力、ならびにサイトゾルおよびペルオキシソームにおけるＡＴＰおよびＯ_２の細胞内利用能に依存する。
【０１０６】
さらに、レポーター遺伝子は、転写事象を測定するために広範に使用されるが、それらの有用性は、レポーター発現の忠実度および効率によって制限され得る。例えば、米国特許第５，６７０，３５６号において、ホタルルシフェラーゼ遺伝子（ｌｕｃ＋と呼ばれる）は、ルシフェラーゼ発現のレベルを改善するように改変された。より高いレベルの発現が観察されたが、より高い発現が調節の制御を改善することは決定されなかった。
【０１０７】
本発明を、以下の非限定的な実施例によってさらに説明する。
【０１０８】
（実施例１）
（合成コメツキムシ（ＲＤおよびＧＲ）ルシフェラーゼ核酸分子）
ＬｕｃＰｐｌＹＧは、黄色−緑色の発光を放出する、野生型コメツキムシルシフェラーゼである（Ｗｏｏｄ、１９８９）。ＹＧ＃８１−６Ｇ０１と名付けられたＬｕｃＰｐｌＹＧの変異体を想定した。ＹＧ＃８１−６Ｇ０１は、ペルオキシソーム標的化シグナルを欠き、ルシフェリンおよびＡＴＰに対する低いＫ_Ｍを有し、野生型と比較した場合に、シグナル安定性の増加および温度安定性の増加を有する（ＰＣＴ／ＷＯ９９１４３３６）。ＹＧ＃８１−６Ｇ０１を、第２２４位のＡｌａをＶａｌに変化させること（Ａ２２４Ｖは、緑色シフト化変異である）によって緑色の発光を放出するように変異させたか、またはアミノ酸置換Ａ２２４Ｈ、Ｓ２４７Ｈ、Ｎ３４６ＩおよびＨ３４８Ｑ（赤色シフト化変異セット）を同時に導入することによって赤色の発光を放出するように変異させた（ＰＣＴ／ＷＯ９５１８８５３）。
【０１０９】
ＹＧ＃８１−６Ｇ０１を親遺伝子として使用して、２つの合成遺伝子配列を設計した。１つは、緑色発光（ＧＲ）を放出するルシフェラーゼをコードし、１つは、赤色発光（ＲＤ）を放出するルシフェラーゼをコードする。両方の遺伝子を、１）哺乳動物細胞における発現のために最適化されたコドン使用頻度を有するように；２）転写調節部位（哺乳動物転写因子結合部位、スプライス部位、ポリ（Ａ）付加部位、およびプロモーター、ならびに原核生物（Ｅ．ｃｏｌｉ）調節部位を含む）の数を減少するように；３）所望でない制限部位（例えば、標準的なクローニング手順を妨げる可能性のある制限部位）を欠失するように；および４）両方が同じ細胞内に存在する場合に遺伝子再編成を最小化するために、互いに比較して低いＤＮＡ配列同一性を有するように、設計した。さらに、所望の配列（例えば、Ｋｏｚａｋ配列または制限酵素認識部位）を、同定および導入し得る。
【０１１０】
全ての設計基準が、同時に上手く等しく達成され得るわけではない。以下の優先度を、転写調節部位の減少について確立した：最も高い優先度を、転写因子（ＴＦ）結合部位の除去に与え、次いで、スプライス部位およびポリ（Ａ）付加部位の除去に与え、そして最後に、原核生物調節部位の除去に与えた。調節部位を除去する場合、ストラテジーは、最も重要な変化が最後に生じるのを確実にするように、より低い重要な変化から最も高い重要な変化へと研究することであった。次いで、配列を、新しいより低い優先度の部位の出現について再確認し、必要な場合、さらなる変化を施した。従って、本明細書中に記載されるコンピュータープログラムを使用する、合成ＧＲ遺伝子配列およびＲＤ遺伝子配列を設計するためのプロセスは、以下に詳述する５つの必要に応じて繰り返される工程を含んだ。
１．コドン使用頻度を最適化し、そしてＡ２２４Ｖの変化を与えて、ＧＲｖｅｒ１を作製し、また別に、Ａ２２４Ｈ、Ｓ２４７Ｈ、Ｎ３４６ＩおよびＨ３４８Ｑの変化を与えて、ＲＤｖｅｒ１を作製した。これらの特定のアミノ酸変化は、配列に対する以後の全ての操作を通して維持された。
２．所望でない制限部位、原核生物調節部位、スプライス部位、ポリ（Ａ）部位を除去し、それによって、ＧＲｖｅｒ２およびＲＤｖｅｒ２を作製した。
３．転写因子結合部位を除去し（１回目の処理）、そして任意の新しく作製された所望でない部位（上記工程２に列挙されるような）を除去し、それによって、ＧＲｖｅｒ３およびＲＤｖｅｒ３を作製した。
４．上記工程３によって作製された転写因子結合部位を除去し（２回目の処理）、そして任意の新しく作製された所望でない部位（上記工程２に列挙されるような）を除去し、それによって、ＧＲｖｅｒ４およびＲＤｖｅｒ４を作製した。
５．上記工程４によって作製された転写因子結合部位を除去し（３回目の処理）、そして上記工程２に列挙される部位の非存在を確認し、それによって、ＧＲｖｅｒ５およびＲＤｖｅｒ５を作製した。
６．ＧＲｖｅｒ５およびＲＤｖｅｒ５の設計された配列のフラグメントに対応する合成オリゴヌクレオチド（図６および１０）を使用するＰＣＲによって、実際の遺伝子を構築し、それによって、ＧＲ６およびＲＤ７を作製した。ＧＲ６は、配列決定において、アミノ酸第４９位のセリン残基がアスパラギンに変異され、そしてアミノ酸第２３０位のプロリンがセリンに変異されている（Ｓ４９Ｎ、Ｐ２３０Ｓ）ことが見出された。ＲＤ７は、配列決定において、アミノ酸第３６位のヒスチジンがチロシンに変異されていること（Ｈ３６Ｙ）が見出された。これらの変化は、ＰＣＲプロセス中に生じた。
７．上記工程６に記載される変異（ＧＲ６についてＳ４９Ｎ、Ｐ２３０Ｓ、およびＲＤ７についてＨ３６Ｙ）を戻して、ＧＲｖｅｒ５．１およびＲＤｖｅｒ５．１を作製した。
８．ＲＤｖｅｒ５．１を、第３５１位のアルギニンコドンをグリシンコドンに変化させること（Ｒ３５１Ｇ）によってさらに改変し、それによって、ＲＤｖｅｒ５．１と比較して改善されたスペクトル特性を有するＲＤｖｅｒ５．２を作製した。
９．ＲＤｖｅｒ５．２を、発光強度を増加するようにさらに変異させ、それによって、ＲＤ１５６−１Ｈ９を作製した。これは、４つのさらなるアミノ酸変化（Ｍ２Ｉ、Ｓ３４９Ｔ、Ｋ４８８Ｔ、Ｅ５３８Ｖ）および３つのサイレントな単一の塩基変化をコードする（配列番号１８）。
【０１１１】
（１．コドン使用頻度を最適化し、そして発光色を決定する変異を導入する）
この設計工程についての開始遺伝子配列は、ＹＧ＃８１−６Ｇ０１（配列番号２）であった。
【０１１２】
ａ）コドン使用頻度を最適化する：
このストラテジーは、ヒト細胞における最適な発現のためのコドン使用頻度を適用すること、および同時に、Ｅ．ｃｏｌｉの低い使用頻度のコドンを回避することである。これらの要件に基づいて、２より多いコドンを有する全てのアミノ酸について、ヒト細胞における発現に最良の２つのコドンを選択した（Ｗａｄａら、１９９０を参照のこと）。６つのコドンを有するアミノ酸についてのコドン対の選択において、その選択を、以下の最も多い不対合塩基数を有する対へ偏らせ、最小の配列同一性を有するＧＲ遺伝子およびＲＤ遺伝子の設計を行った（コドン相違）：
Ａｒｇ：ＣＧＣ／ＣＧＴＬｅｕ：ＣＴＧ／ＴＴＧＳｅｒ：ＴＣＴ／ＡＧＣ
Ｔｈｒ：ＡＣＣ／ＡＣＴＰｒｏ：ＣＣＡ／ＣＣＴＡｌａ：ＧＣＣ／ＧＣＴ
Ｇｌｙ：ＧＧＣ／ＧＧＴＶａｌ：ＧＴＣ／ＧＴＧＩｌｅ：ＡＴＣ／ＡＴＴ
このコドン選択に基づいて、ＹＧ＃８１−６Ｇ０１ルシフェラーゼタンパク質配列をコードする２つの遺伝子配列を、コンピューターで作成した。この２つの遺伝子を、最小のＤＮＡ配列同一性、および同時に、密接に類似するコドン使用頻度を有するように設計した。これを達成するために、この２つの遺伝子における各コドンを、代替的な様式（例えば、Ａｒｇ_（ｎ）は、遺伝子１においてＣＧＣであり、遺伝子２においてＣＧＴであり、そしてＡｒｇ_{（ｎ＋１）}は、遺伝子１においてＣＧＴであり、そして遺伝子２においてＣＧＣである）で、上記の限定されたリストからのコドンによって置き換えた。
【０１１３】
この設計プロセスにおける後の工程について、変化が、他の設計基準を満たすために、この限定された最適なコドン選択に対して成されるべきであることが予測されたが、哺乳動物細胞における低い使用頻度の以下のコドンは、より高い優先度の基準を満たすために必要でない限り、使用しなかった：
Ａｒｇ：ＣＧＡＬｅｕ：ＣＴＡＳｅｒ：ＴＣＧ
Ｐｒｏ：ＣＣＧＶａｌ：ＧＴＡＩｌｅ：ＡＴＡ
また、Ｅ．ｃｏｌｉにおける低い使用頻度の以下のコドンを、妥当である場合に、回避した（これらのうちの３つが哺乳動物細胞についての低い使用頻度のリストに適合することに留意する）：
Ａｒｇ：ＣＧＡ／ＣＧＧ／ＡＧＡ／ＡＧＧ
Ｌｅｕ：ＣＴＡＰｒｏ：ＣＣＣＩｌｅ：ＡＴＡ。
【０１１４】
（ｂ）ルミネッセンス色を決定する変異を導入する）
上記のように、２つのコドンを最適化したこの遺伝子配列のうちの一方に、１つの緑色シフト変異を導入し、もう一方に、４つの赤色シフト変異を導入した。
【０１１５】
この最初の設計工程からの２つの出力（ｏｕｔｐｕｔ）配列を、ＧＲｖｅｒ１（バージョン１ＧＲ）およびＲＤｖｅｒ１（バージョン１ＲＤ）と名付けた。これらのＤＮＡ配列は、６３％同一である（５９４個のミスマッチ）が、これらのＤＮＡ配列がコードするタンパク質は、ルミネッセンス色を決定する４つのアミノ酸だけが異なる（ＤＮＡ配列およびタンパク質配列のアラインメントについて、図２および図３を参照のこと）。
【０１１６】
表１および表２は、例として、ヒト遺伝子、親遺伝子ＹＧ＃８１−６Ｇ０１、コドンを最適化した合成遺伝子ＧＲｖｅｒ１およびＲＤｖｅｒ１、ならびに設計プロセス中工程５が完了した後の最終バージョンの合成遺伝子（ＧＲｖｅｒ５およびＲＤｖｅｒ５）における、バリンおよびロイシンについてのコドン使用頻度を示す。コドン変化の完全な要約について、図４および５を参照のこと。
【０１１７】
【表１】

【０１１８】
【表２】

（２．下線を付した制限部位、原核生物調節部位、スプライス部位、およびポリ（Ａ）付加部位を除去する）
この設計工程のための開始遺伝子配列は、ＧＲｖｅｒ１およびＲＤｖｅｒ１であった。
【０１１９】
（ａ）下線を付した制限部位を除去する）
下線を付した制限部位の存在および位置を確認するために、両方の合成遺伝子の配列を、標準的な配列分析ソフトウェア（ＧｅｎｅＰｒｏｖｅｒ６．１０、ＲｉｖｅｒｓｉｄｅＳｃｉｅｎｔｉｆｉｃＥｎｔ．）を使用して、制限酵素認識配列のデータベース（ＲＥＢＡＳＥｖｅｒ．７１２、ｈｔｔｐ：／／ｗｗｗ．ｎｅｂ．ｃｏｍ／ｒｅｂａｓｅ）に対して比較した。具体的には、以下の制限酵素を、望ましくないものとして分類した：
−ＢａｍＨＩ、ＸｈｏＩ、ＳｆｉＩ、ＫｐｎＩ、ＳａｃＩ、ＭｌｕＩ、ＮｈｅＩ、ＳｍａＩ、ＸｈｏＩ、ＢｇｌＩＩ、ＨｉｎｄＩＩＩ、ＮｃｏＩ、ＮａｒＩ、ＸｂａＩ、ＨｐａＩ、ＳａｌＩ、
−一般的に使用される他のクローニング部位：ＥｃｏＲＩ、ＥｃｏＲＶ、ＣｌａＩ、
−（複合構築物のために一般的に使用される）８塩基カッター、
−（Ｎ末端融合物を可能にする）ＢｓｔＥＩＩ、
−（Ｔ−ベクタークローニングのために使用されるＡ／Ｔ突出を生成し得る）ＸｃｍＩ。
【０１２０】
合成遺伝子中に見出される望ましくない制限部位を除去するために、その合成遺伝子配列の１つ以上のコドンを、上記１ａに記載されるコドン最適化の指針に従って変更した。
【０１２１】
（ｂ）原核生物（Ｅ．ｃｏｌｉ）調節配列を除去する）
原核生物調節配列の存在および位置を確認するために、標準的配列分析ソフトウェア（ＧｅｎｅＰｒｏ）を使用して、両方の合成遺伝子の配列を、以下のコンセンサス配列の存在について検索した：
−ＴＡＴＡＡＴ（プロモーターの−１０プリブノウボックス）
−ＡＧＧＡまたはＧＧＡＧ（リボソーム結合部位；下流１２塩基以内にあるメチオニンコドンと対合した場合にのみ、考慮される）。
【０１２２】
合成遺伝子において見出された場合に、このような調節配列を除去するために、その合成遺伝子配列の１つ以上のコドンを、上記１ａに記載されるコドン最適化指針に従って変更した。
【０１２３】
（ｃ）スプライシング部位を除去する）
スプライシング部位の存在および位置を確認するために、標準的配列分析ソフトウェア（ＧｅｎｅＰｒｏ）を使用して、各合成遺伝子の一次ＲＮＡ転写物に対応するＤＮＡ鎖を、以下のコンセンサス配列（Ｗａｔｓｏｎら、１９８３を参照のこと）の存在について検索した：
−スプライシングドナー配列：ＡＧ｜ＧＴＲＡＧＴ（エキソン｜イントロン）。
この検索は、ＡＧＧＴＲＡＧについて実施し、そしてより低いストリンジェンシーでＧＧＴＲＡＧＴについて実施した；
−スプライシングアクセプター部位：（Ｙ）_ｎＮＣＡＧ｜Ｇ（イントロン｜エキソン）。この検索は、ｎ＝１を用いて実施した。
合成遺伝子において見出されるスプライシング部位を除去するために、その合成遺伝子配列の１つ以上のコドンを、上記１ａに記載されるコドン最適化の指針に従って変更した。一方の遺伝子におけるスプライシングアクセプター部位は、一般的に、他方の遺伝子にその部位を導入することなく除去するのが困難であった。なぜなら、そのスプライシングアクセプター部位は、２つのＧｌｎコドン（ＣＡＧ）のうちの１つを含む傾向があったからである。そのスプライシングアクセプター部位を、その２つの遺伝子間のわずかに増加した配列同一性を犠牲にして、両方の遺伝子中のＧｌｎコドンをＣＡＡで置換することによって除去した。
【０１２４】
（ｄ）ポリ（Ａ）付加部位を除去する）
ポリ（Ａ）付加部位の存在および位置を確認するために、両方の合成遺伝子の配列を、標準的な配列分析ソフトウェア（ＧｅｎｅＰｒｏ）を使用して、以下のコンセンサス配列の存在について検索した：−ＡＡＴＡＡＡ。合成遺伝子中に見出される各ポリ（Ａ）付加部位を除去するために、その合成遺伝子配列の１つ以上のコドンを、上記１ａに記載されるコドン最適化の指針に従って変更した。この第２の設計工程からの２つの出力（ｏｕｔｐｕｔ）配列を、ＧＲｖｅｒ２およびＲＤｖｅｒ２と名付けた。これらのＤＮＡ配列は、６３％同一（５９０個のミスマッチ）である（図２および図３）。
【０１２５】
（３．転写因子（ＴＦ）結合部位を除去し、その後、工程２ａ〜２ｄを反復する）
この設計工程のための開始遺伝子配列は、ＧＲｖｅｒ２およびＲＤｖｅｒ２であった。
【０１２６】
潜在的ＴＦ結合部位の存在、位置および正体を確認するために、両方の合成遺伝子の配列を、転写因子結合部位のデータベース（ＴＲＡＮＳＦＡＣｖ３．２）を検索するための問合せ配列として使用した。このＴＲＡＮＳＦＡＣデータベース（ｈｔｔｐ：／／ｔｒａｎｓｆａｃ．ｇｂｆ．ｄｅ／ＴＲＡＮＳＦＡＣ／ｉｎｄｅｘ：ｈｔｍｌ）は、遺伝子調節ＤＮＡ配列（ＴＦ結合部位）およびその配列に結合しかつその配列を介して作用するタンパク質（ＴＦ）に関する情報を、保有する。ＴＲＡＮＳＦＡＣＲｅｌｅａｓｅ３．２のＳＩＴＥ表は、４，４０１件の個々の（推定）ＴＦ結合部位（真核生物遺伝子中のＴＦ結合部位、変異誘発研究と無作為オリゴヌクレオチド混合物または特定の理論的要因に基づくインビトロ選択手順とから生じる人工配列中のＴＦ結合部位、および（ＦａｉｓｓｔおよびＭｅｙｅｒ、１９９２からの）コンセンサス結合配列を含む）を含む。
【０１２７】
これらの合成遺伝子配列中のこれらのＴＦ結合部位を位置決めおよび提示するために使用されるソフトウェアツールは、ＴＥＳＳ（ＴｒａｎｓｃｒｉｐｔｉｏｎＥｌｅｍｅｎｔＳｅａｒｃｈＳｏｆｔｗａｒｅ、ｈｔｔｐ：／／ａｇａｖｅ．ｈｕｍｇｅｎ．ｕｐｅｎｎ．ｅｄｕ／ｔｅｓｓ／ｉｎｄｅｘ．ｈｔｍｌ）であった。フィルターを通した文字列に基づく検索オプションを、以下のユーザー定義検索パラメーターとともに使用した：−ＦａｃｔｏｒＳｅｌｅｃｔｉｏｎＡｔｔｒｉｂｕｔｅ：ＯｒｇａｎｉｓｍＣｌａｓｓｉｆｉｃａｔｉｏｎ
−ＳｅａｒｃｈＰａｔｔｅｒｎ：Ｍａｍｍａｌｉａ
−Ｍａｘ．ＡｌｌｏｗａｂｌｅＭｉｓｍａｔｃｈ％：０
−Ｍｉｎ．ｅｌｅｍｅｎｔｌｅｎｇｔｈ：５
−Ｍｉｎ．ｌｏｇ−ｌｉｋｅｌｉｈｏｏｄ：１０。
このパラメーター選択は、少なくとも５塩基長の哺乳動物ＴＦ結合部位（このデータベース中の４，４０１件のうち約１，４００件）のみがこの検索に含まれることを、特定する。このパラメーター選択はさらに、その問合せ配列における完全一致と最小対数尤度（ＬＬＨ）スコア１０とを有するＴＦ結合部位のみが、報告されることを、特定する。このＬＬＨスコア付け法は、２を非曖昧（ｕｎａｍｂｉｇｕｏｕｓ）一致に、１を部分的曖昧（ｐａｒｔｉａｌｌｙａｍｂｉｇｕｏｕｓ）一致（例えば、ＡまたはＴがＷに一致する）に、そして０を「Ｎ」に対する一致に割り当てる。例えば、上記に特定されるパラメーターを用いた検索は、ＴＡＴＡＡ（配列番号２４０）（ＬＬＨ＝１０）、ＳＴＲＡＴＧ（配列番号２４１）（ＬＬＨ＝１０）、およびＭＴＴＮＣＮＮＭＡ（配列番号２４２）（ＬＬＨ＝１０）について「ヒット」（陽性の結果または一致）であるがＴＲＡＴＧ（配列番号２４３）（ＬＬＨ＝９）について「ヒット」でない、「ヒット」を、これらの４つのＴＦ結合部位がその問合せ配列中に存在する場合に、生じる。その検索パラメーターを再評価するために、より低いストリンジェンシーでの試験を、この設計プロセスの最後に実施した。
【０１２８】
既知のＴＦ結合部位を含むモック（ｍｏｃｋ）問合せ配列を用いてＴＥＳＳを試験した場合、このプログラムは、その問合せ配列の３’末端で終わる部位に対する一致を報告することができないことが、見出された。従って、この問題を排除するために、すべての問合せ配列の３’末端に、余分なヌクレオチドを付加した。
【０１２９】
上記のパラメーターを使用するＴＦ結合部位についての最初の検索により、２つの合成遺伝子（ＧＲｖｅｒ２およびＲＤｖｅｒ２）の各々について、約１００個の転写因子結合部位（ヒット）が見出された。上記１ａに記載されたコドン最適化の指針に従ってその合成遺伝子配列の１つ以上のコドンを変化させることによって、すべての部位を除去した。しかし、いくつかのこれらの変化が、新規なＴＦ結合部位、他の調節配列、および新規な制限部位を生じることが、予期された。従って、工程２ａ〜２ｄを記載されるように反復し、そして４つの新規な制限部位および２つの新規なスプライス部位を除去した。この第３の設計工程から生じた２つの出力（ｏｕｔｐｕｔ）配列を、ＧＲｖｅｒ３およびＲＤｖｅｒ３と名付けた。これらのＤＮＡ配列は、６６％同一（５４１個のミスマッチ）である（図２および３）。
【０１３０】
（４．新規な転写因子（ＴＦ）結合部位を除去し、その後、工程２ａ〜２ｄを反復する）
この設計工程のための開始遺伝子配列は、ＧＲｖｅｒ３およびＲＤｖｅｒ３であった。
【０１３１】
この第４の工程は、工程３に記載されるプロセスの繰返しである。新たに導入されたＴＦ結合部位についての検索により、この２つの合成遺伝子の各々について約５０ヒットを得た。上記１ａに記載されるコドン最適化の指針にほぼ従って、これらの合成遺伝子配列の１つ以上のコドンを変更することによって、すべての部位を除去した。しかし、より高コドン使用頻度〜中程度のコドン使用頻度を使用して、すべてのＴＦ結合部位の除去が可能となった。ＧＲ遺伝子とＲＤ遺伝子との間の低い配列同一性を維持することの優先度が、最も低かった。その後、工程２ａ〜２ｄを、記載される通り反復した。この第４の設計工程からの２つの出力（ｏｕｔｐｕｔ）配列を、ＧＲｖｅｒ４およびＲＤｖｅｒ４と名付けた。これらのＤＮＡ配列は、６８％同一（５０６個のミスマッチ）である（図２および３）。
【０１３２】
（５．新規な転写因子（ＴＦ）結合部位を除去し、その後、工程２ａ〜２ｄを反復する）
この設計工程のための開始遺伝子配列は、ＧＲｖｅｒ４およびＲＤｖｅｒ４であった。
【０１３３】
この第５の工程は、上記工程３に記載されるプロセスの別の繰返しである。工程４において導入された新規なＴＦ結合部位についての検索により、この２つの合成遺伝子の各々について約２０個のヒットを得た。上記１ａに記載されるコドン最適化の指針にほぼ従ってこれらの合成遺伝子配列の１つ以上のコドンを変更することによって、すべての部位を除去した。しかし、より高使用頻度〜中程度の使用頻度を使用して（これらは、すべて「好ましい」と見なされる）、すべてのＴＦ結合部位の除去が可能となった。ＧＲ遺伝子とＲＤ遺伝子との間の低い配列同一性を維持することが、優先度が最も低かった。その後、工程２ａ〜２ｄを、記載されるように反復した。１つのアクセプタースプライス部位だけが、除去され得なかった。最終工程として、工程３にて特定した両方の遺伝子中のすべてのＴＦ結合部位が存在しないことを、確認した。この第５および最後の設計工程からの２つの出力（ｏｕｔｐｕｔ）配列を、ＧＲｖｅｒ５およびＲＤｖｅｒ５と名付けた。これらのＤＮＡ配列は、６９％同一（５０４個のミスマッチ）である（図２および図３）。
【０１３４】
（ＧＲｖｅｒ５およびＲＤｖｅｒ５のさらなる進化）
（ａ）より低ストリンジェンシーのパラメーターをＴＥＳＳに使用する）
ＴＦ結合部位についての検索を、上記工程３に記載されるように反復したが、さらに低ストリンジェントなユーザー定義パラメーターを用いた：
−ＬＬＨを１０の代わりに９に設定すると、新しいヒットを生じなかった；
−ＬＬＨを０〜８（両端を含む）に設定すると、２つのさらなる部位ＭＡＭＡＧ（２２ヒット）およびＣＴＫＴＫ（２４ヒット）についてのヒットを生じた；
−ＬＬＨを８にそして最小エレメント長を４に設定すると、この検索により、ＡＰ−１、ＮＦ−１、およびｃ−Ｍｙｂについての異なる４塩基部位を（上記の２つの部位に加えて）得た。これらの部位は、より長い各コンセンサス部位の短縮バージョンであり、これらの部位を、上記工程３〜５で除去した。
新たな部位を導入することなくこれらの部位を完全に除去することを試みることは現実的ではなく、従って、さらなる変化を作製しなかった。
【０１３５】
（ｂ）異なるデータベースを検索する）
ＥｕｋａｒｙｏｔｉｃＰｒｏｍｏｔｅｒＤａｔａｂａｓｅ（リリース４５）は、真核生物遺伝子の信頼できるようにマッピングされた転写開始部位（１２５３個の配列）についての情報を含む。このデータベースを、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎサイト（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｃｇｉ−ｂｉｎ／ＢＬＡＳＴ）において、（ほぼ同一の配列を迅速に発見するように最適化した）デフォルトパラメーター（Ａｌｔｓｃｈｕｌら、１９９０を参照のこと）とともにＢＬＡＳＴＮ１．４．１１を使用して、検索した。このアプローチを試験するために、ＳＶ４０プロモーターとエンハンサーとを含むｐＧＬ３−Ｃｏｎｔｒｏｌベクター配列の一部を、問合せ配列として使用し、ＳＶ４０配列に対する予期されたヒットを得た。上記の２つの合成遺伝子を問合せ配列として使用した場合、ヒットは見出されなかった。
【０１３６】
（ＧＲｖｅｒ５合成遺伝子特性およびＲＤｖｅｒ５合成遺伝子特性の要約）
両方の遺伝子（この段階で、これらはなお、コンピューターにおける単なる「仮想」配列である）は、哺乳動物の高使用頻度コドンを強く支持しかつ哺乳動物およびＥ．ｃｏｌｉの低使用頻度コドンを最小にする、コドン使用頻度を有する。図４は、親遺伝子のコドン使用頻度と種々の合成遺伝子バージョンの要約を示す。
【０１３７】
両方の遺伝子はまた、４つより多くの非曖昧（ｕｎａｍｂｉｇｕｏｕｓ）塩基からなる真核生物ＴＦ結合部位、ドナースプライス部位およびアクセプター部位（１つの例外：ＧＲｖｅｒ５は、１つのスプライスアクセプター部位を含む）、ポリ（Ａ）付加部位、特定の原核生物（Ｅ．ｃｏｌｉ）調節配列、および望ましくない制限部位を完全に欠く。
【０１３８】
ＧＲｖｅｒ５とＲＤｖｅｒ５との間の遺伝子配列同一性は、たった６９％（５０４個のミスマッチ）であるが、一方、それにコードされるタンパク質は、９９％同一（４つのアミノ酸ミスマッチ）である。図２および３を参照のこと。親配列ＹＧ＃８１−６Ｇ０１とこれらとの同一性は、７４％（ＧＲｖｅｒ５）および７３％（ＲＤｖｅｒ５）である。図２を参照のこと。これらの塩基組成は、親ＹＧ＃８１−６Ｇ０１についての４０．２％ＧＣに対して、４９．９％ＧＣ（ＧＲｖｅｒ５）および４９．５％ＧＣ（ＲＤｖｅｒ５）である。
【０１３９】
（合成遺伝子の構築）
これらの２つの合成遺伝子は、熱サイクラーにおいて合成オリゴヌクレオチドからアセンブルした後、全長遺伝子をＰＣＲ増幅することによって（Ｓｔｅｍｍｅｒら（１９９５）Ｇｅｎｅ．１６４、ｐｐ．４９〜５３と同様に）、構築した。合成遺伝子の設計目的を妨げる意図せぬ変異は、修正した。
【０１４０】
（ａ）合成オリゴヌクレオチドの設計）
これらの合成オリゴヌクレオチドは、主に４０マーであり、これらは集合として、各設計遺伝子（１，６２６ｂｐ）の完全鎖およびクローニングに必要な隣接領域の両方をコードする（各遺伝子について合計１，９５０ｂｐ；図６）。１つの鎖を特定するすべてのオリゴヌクレオチドの５’境界および３’境界を、一般的には、向かい側の鎖を特定するオリゴヌクレオチドの境界に対して平均２０塩基のずれ／重なりを生じる様式で、配置した。
【０１４１】
両方の遺伝子の隣接領域の末端は、増幅プライマー（ｐＲＡＭｔａｉｌｕｐ：５’−ｇｔａｃｔｇａｇａｃｇａｃｇｃｃａｇｃｃｃａａｇｃｔｔａｇｇｃｃｔｇａｇｔｇ（配列番号２２９）およびｐＲＡＭｔａｉｌｄｎ：５’−ｇｇｃａｔｇａｇｃｇｔｇａａｃｔｇａｃｔｇａａｃｔａｇｃｇｇｃｃｇｃｃｇａｇ（配列番号２３０））の末端と一致して、本発明者らのＥ．ｃｏｌｉベクターｐＲＡＭ（ＷＯ９９／１４３３６）中への遺伝子クローニングを可能にした。
【０１４２】
合計１８３個のオリゴヌクレオチドを設計した（図６）：上流隣接配列および下流隣接配列を集合としてコードする１５個のオリゴヌクレオチド（両方の遺伝子について同一；配列番号３５〜４９）と、その２つの遺伝子の両方の鎖をコードする１６８個のオリゴヌクレオチド（４×４２）（配列番号５０〜２１７）である。
【０１４３】
１８３個すべてのオリゴヌクレオチドを、ＯＬＩＧＯソフトウェア（Ｗｏｊｃｉｅｃｈ
ＲｙｃｈｌｉｋによるＯＬＩＧＯ４．０ＰｒｉｍｅｒＡｎａｌｙｓｉｓＳｏｆｔｗａｒｅ（コピーライト）１９８９〜１９９１）のヘアピン分析に通して、潜在的に有害な分子内ループ形成を同定した。この分析結果を評価するための指針を、Ｓｉｍｓ博士（Ｓｉｇｍａ−ＧｅｎｏｓｙｓＣｕｓｔｏｍＧｅｎｅＳｙｎｔｈｅｓｉｓＤｅｐａｒｔｍｅｎｔ）の推奨に従って設定した：ΔＧ＜−１０であるヘアピンを形成するオリゴは回避しなければならない。このオリゴヌクレオチドの３’末端を含む、ΔＧ≦−７であるヘアピンを形成するオリゴもまた回避すべてきであるが、全体でΔＧ≦−５であるオリゴは、本願について問題を提起するはずがない。この分析により、ΔＧが−７．１と−４．９との間であるヘアピンを形成することができる、２３個のオリゴヌクレオチドが同定された。これらのうち、５つは、３’末端をブロックするかまたはほぼブロックした（０〜３個の遊離塩基）。そしてこれらを、その３’末端の１〜４塩基を除去しそして隣接オリゴヌクレオチドにその１〜４塩基を付加することによって、再設計した。
【０１４４】
ポリ（Ａ）テイルと相補的な配列を包含するこの４０マーオリゴヌクレオチドは、非常に低い複雑度の３’末端（１３個連続するＴ塩基）を有した。高い複雑度の３’末端を有するが、向かい合う鎖上の相補的オリゴヌクレオチド（２０塩基の代わりに１１塩基）の１つと結果的に重複が減少した、さらなる４０マーを設計した。
【０１４５】
これらのオリゴは、熱サイクラーベースのアセンブル反応における使用のために設計されたが、これらは、遺伝子構築のために連結ベースのプロトコルにおいても使用され得る。このアプローチにおいて、これらのオリゴヌクレオチドは、対合様式でアニーリングされ、そして生じた短い二本鎖フラグメントが、付着突出を使用して連結される。しかし、このためには、すべてのオリゴヌクレオチドがリン酸化されていることが、必要である。
【０１４６】
（ｂ）遺伝子のアセンブルおよび増幅）
第１の工程において、この２つの合成遺伝子各々を、９８個のオリゴヌクレオチドから別の反応にてアセンブルさせた。各反応について、総容積は５０μｌであった：
０．５μＭオリゴヌクレオチド（＝各オリゴ０．２５ｐｍｏｌ）
１．０ＵＴａｑＤＮＡポリメラーゼ
０．０２ＵＰｆｕＤＮＡポリメラーゼ
２ｍＭＭｇＣｌ_２
０．２ｍＭｄＮＴＰ（各々）
０．１％ゼラチン
サイクリング条件：（９４℃で３０秒、５２℃で３０秒間、および７２℃で３０秒間）×５５サイクル。
【０１４７】
第２の工程において、アセンブルした各合成遺伝子を、別の反応にて増幅した。各反応についての総容積は、５０μｌであった：
２．５μｌアセンブル反応液
５．０ＵＴａｑＤＮＡポリメラーゼ
０．１ＵＰｆｕＤＮＡポリメラーゼ
１Ｍ各プライマー（ｐＲＡＭｔａｉｌｕｐ、ｐＲＡＭｔａｉｌｄｎ）
２ｍＭＭｇＣｌ_２
０．２ｍＭｄＮＴＰ（各々）
サイクリング条件（９４℃で２０秒、６５℃で６０秒、７２℃で３分）×３０サイクル。
【０１４８】
アセンブルされそして増幅された遺伝子を、ｐＲＡＭベクター中にサブクローニングし、そしてＥ．ｃｏｌｉ中にて発現させて、１〜２％の発光ＧＲクローンまたは蛍光ＲＤクローンを得た。５つのＧＲクローンおよび５つのＲＤクローンを単離し、そしてさらに分析した。この５つのＧＲクローンのうち、３つが、正確なインサートサイズを有した。この３つのうち、１つは、弱く発光し、そして１つは、変化した制限パターンを有した。５つのＲＤクローンのうち、２つは、正確なサイズのインサートを有し、変化した制限パターンを有した。これらのうちの１つは、弱く発光した。全体として、この分析は、これらの遺伝子における多数の変異の存在を示した。これらは、アセンブル反応および増幅反応において導入されたエラーの結果である可能性が高い。
【０１４９】
（ｃ）修正アセンブルおよび増幅）
全長合成遺伝子中に存在するこの多数の変異を除去するために、本発明者らは、プルーフリーディングＤＮＡポリメラーゼＴｌｉを使用して、各遺伝子についてさらなるアセンブル反応および増幅反応を実施した。このアセンブル反応は、９８個のＧＲオリゴヌクレオチドまたはＲＤオリゴヌクレオチドに加えて、上記の変異を含む対応する全長クローン由来の少量のＤＮＡを含んだ。このことにより、これらのオリゴが、テンプレート中に存在する変異を修正することが可能になる。
【０１５０】
以下のアセンブル反応を、合成遺伝子各々について実施した。各反応についての総容積は、５０μｌであった：
０．５μＭオリゴヌクレオチド（＝各オリゴ０．２５ｐｍｏｌ）
０．０１６ｐｍｏｌプラスミド（正確なインサートサイズを含むクローンの混合物）
２．５ＵＴｌｉＤＮＡポリメラーゼ
２ｍＭＭｇＣｌ_２
０．２ｍＭｄＮＴＰ（各々）
０．１％ゼラチン
サイクリング条件：９４℃で３０秒、その後、（９４℃で３０秒、５２℃で３０秒間、および７２℃で３０秒間）×５５サイクル、その後、７２℃で５分間。
【０１５１】
以下の増幅反応を、これらのアセンブル反応液各々に対して実施した。各増幅反応についての総体積は、５０μｌであった：
１〜５μｌアセンブル反応液
４０ｐｍｏｌ各プライマー（ｐＲＡＭｔａｉｌｕｐ、ｐＲＡＭｔａｉｌｄｎ）
２．５ＵＴｌｉＤＮＡポリメラーゼ
２ｍＭＭｇＣｌ_２
０．２ｍＭｄＮＴＰ（各々）
サイクリング条件：９４℃で３０秒、その後、（９４℃で２０秒、６５℃で６０秒間、および７２℃で３分間）×３０サイクル、その後、７２℃で５分間。
【０１５２】
修正アセンブル工程および増幅工程から得られた遺伝子を、ｐＲＡＭベクター中にサブクローニングし、そしてＥ．ｃｏｌｉにおいて発現させ、７５％の発光ＧＲクローンまたは発光ＲＤクローンを得た。４４個のＧＲクローンおよび４４個のＲＤクローンを、本発明者らのスクリーニングロボット（ＷＯ９９／１４３３６）を用いて分析した。６つの最良のＧＲクローンおよびＲＤクローンを手で分析し、そして１つの最良のＧＲクローンおよびＲＤクローン（ＧＲ６およびＲＤ７）を、選択した。ＧＲ６の配列分析により、コード領域における２つの点変異が明らかになった。この点変異は、両方とも、アミノ酸置換（Ｓ４９ＮおよびＰ２３０Ｓ）を生じた。ＲＤ７の配列分析により、コード領域において３つの点変異が明らかになった。この点変異のうちの１つは、アミノ酸置換（Ｈ３６Ｙ）を生じた。サイレント点変異はいずれも、この合成遺伝子の全体的設計基準と矛盾するいかなる調節部位または制限部位も、導入しなかったことを確認した。
【０１５３】
（ｄ）意図しないアミノ酸置換の逆転）
ＧＲ６合成遺伝子およびＲＤ７合成遺伝子中に存在する意図しないアミノ酸置換を、ＧＲｖｅｒ５設計配列およびＲＤｖｅｒ５設計配列と一致するような部位特異的変異誘発によって逆転し、それにより、ＧＲｖｅｒ５．１およびＲＤｖｅｒ５．１を作製した。変異した領域のＤＮＡ配列を、配列分析によって確認した。
【０１５４】
（ｅ）スペクトル特性を改善する）
ＲＤｖｅｒ５．１遺伝子を、アミノ酸変化（Ｒ３５１Ｇ）を導入することによりこの遺伝子のスペクトル特性を改善するようにさらに改変し、それにより、ＲＤｖｅｒ５．２を作製した。
【０１５５】
（ＲＤ遺伝子およびＧＲ遺伝子を含む、ｐＧＬ３ベクター）
親コメツキムシルシフェラーゼＹＧ＃８１−６Ｇ０１（「ＹＧ」）、ならびに合成コメツキムシルシフェラーゼ遺伝子ＧＲｖｅｒ５．１（「ＧＲ」）、ＲＤｖｅｒ５．２（「ＲＤ」）、およびＲＤ１５６−１Ｈ９を、この４つのｐＧＬ３レポーターベクター（ＰｒｏｍｅｇａＣｏｒｐ．）中にクローニングした：
−ｐＧＬ３−Ｂａｓｉｃ＝プロモーターなし、エンハンサーなし
−ｐＧＬ３−Ｃｏｎｔｒｏｌ＝ＳＶ４０プロモーター、ＳＶ４０エンハンサー
−ｐＧＬ３−Ｅｎｈａｎｃｅｒ＝ＳＶ４０エンハンサー（ルシフェラーゼコード配列の３’側）
−ｐＧＬ３−Ｐｒｏｍｏｔｅｒ＝ＳＶ４０プロモーター。
ＧＲ合成遺伝子およびＲＤ合成遺伝子のアセンブルにおいて使用したプライマーは、ｐＲＡＭベクター中へのそれらの遺伝子のクローニングを容易にした。哺乳動物細胞における分析のためのｐＧＬ３ベクター（ＰｒｏｍｅｇａＣｏｒｐ．，Ｍａｄｉｓｏｎ、ＷＩ）中にこれらの遺伝子を導入するために、ｐＲＡＭベクター中の各遺伝子（ｐＲＡＭＲＤｖｅｒ５．１、ｐＲＡＭＧＲｖｅｒ５．１、およびｐＲＡＭＲＤ１５６−１Ｈ９）を、それらの遺伝子の５’末端にＮｃｏＩ部位をそして３’末端にＸｂａＩ部位を導入するように増幅した。ｐＲＡＭＲＤｖｅｒ５．１についてのプライマーおよびｐＲＡＭ
ＧＲｖｅｒ５．１についてのプライマーは、以下であった：
ＧＲ→５’ＧＧＡＴＣＣＣＡＴＧＧＴＧＡＡＧＣＧＴＧＡＧＡＡ３’（配列番号２３１）または
ＲＤ→５’ＧＧＡＴＣＣＣＡＴＧＧＴＧＡＡＡＣＧＣＧＡ３’（配列番号２３２）および
５’ＣＴＡＧＣＴＴＴＴＴＴＴＴＣＴＡＧＡＴＡＡＴＣＡＴＧＡＡＧＡＣ３’（配列番号２３３）。
ｐＲＡＭＲＤ１５６−１Ｈ９についてのプライマーは、以下であった：
５’ＧＣＧＴＡＧＣＣＡＴＧＧＴＡＡＡＧＣＧＴＧＡＧＡＡＡＡＡＴＧＴＣ３’（配列番号２９５）および
５’ＣＣＧＡＣＴＣＴＡＧＡＴＴＡＣＴＡＡＣＣＧＣＣＧＧＣＣＴＴＣＡＣＣ３’（配列番号２９６）。
このＰＣＲは、以下を含んだ：
１００ｎｇＤＮＡプラスミド
１μＭ上流プライマー
１μＭ下流プライマー
０．２ｍＭｄＮＴＰ
１×緩衝液（ＰｒｏｍｅｇａＣｏｒｐ．）
５単位ＰｆｕＤＮＡポリメラーゼ（ＰｒｏｍｅｇａＣｏｒｐ．）
５０μｌにする滅菌ナノピュア水。
【０１５６】
このサイクリングパラメーターは、以下であった：９４℃で５分；（９４℃で３０秒；５５℃で１分；および７２℃で３分）×１５サイクル。精製ＰＣＲ生成物を、ＮｃｏＩおよびＸｂａＩで消化し、ＮｃｏＩおよびＸｂａＩで消化したｐＧＬ３−ｃｏｎｔｒｏｌと連結し、そしてこの連結生成物を、Ｅ．ｃｏｌｉに導入した。これらのルシフェラーゼ遺伝子を他のｐＧＬ３レポーターベクター（ｂａｓｉｃ、ｐｒｏｍｏｔｅｒおよびｅｎｈａｎｃｅｒ）に挿入するために、これらのルシフェラーゼ遺伝子の各々を含むｐＧＬ３−ｃｏｎｔｒｏｌを、ＮｃｏＩおよびＸｂａＩで消化し、これもＮｃｏＩおよびＸｂａＩで消化した他のｐＧＬ３ベクターと連結し、そしてこの連結生成物を、Ｅ．ｃｏｌｉに導入した。ｐＧＬ３ベクター中のＧＲｖｅｒ５．１核酸配列およびＲＤｖｅｒ５．１（およびＲＤ１５６−１Ｈ９（下記参照））核酸配列によりコードされるポリペプチドは、そのオリゴヌクレオチド中の開始コドンのＮｃｏＩ部位の結果として、２位がバリンになるアミノ酸置換を有することに、注意されたい。
【０１５７】
内部ＮｃｏＩ部位およびＸｂａＩ部位が原因で、ＹＧ＃８１−６Ｇ０１中のネイティブ遺伝子を、コード領域の上流にあるＨｉｎｄＩＩＩ部位から下流にあるＨｐａＩ部位まで増幅した。これは、ＧＲクローンおよびＲＤクローン中に見出される隣接配列を含んだ。上流プライマー（５’−ＣＡＡＡＡＡＧＣＴＴＧＧＣＡＴＴＣＣＧＧＴＡＣＴＧＴＴＧＧＴＡＡＡＧＣＣＡＣＣＡＴＧＧＴＧＡＡＧＣＧＡＧＡＧ−３’；配列番号２３４）および下流プライマー（５’−ＣＡＡＴＴＧＴＴＧＴＴＧＴＴＡＡＣＴＴＧＴＴＴＡＴＴ−３’；配列番号２３５）を、ＹＧ＃８１−６Ｇ０１と混合し、そして上記のＰＣＲ条件を使用して増幅した。精製ＰＣＲ生成物をＮｃｏＩおよびＸｂａＩで消化し、これもまたＨｉｎｄＩＩＩおよびＨｐａＩで消化したｐＧＬ−ｃｏｎｔｒｏｌと連結し、そしてこの連結生成物を、Ｅ．ｃｏｌｉ中に導入した。他のｐＧＬ３レポーターベクター（ｂａｓｉｃ、ｐｒｏｍｏｔｅｒ、およびｅｎｈａｎｃｅｒ）中にＹＧ＃８１−６Ｇ０１を挿入するために、ＹＧ＃８１−６Ｇ０１を含むｐＧＬ３−ｃｏｎｔｒｏｌベクターをＮｃｏＩおよびＸｂａＩで消化し、そしてこれもまたＮｃｏＩおよびＸｂａＩで消化した他のｐＧＬ３ベクターと連結し、そしてこの連結した生成物を、Ｅ．ｃｏｌｉ中に導入した。このｐＧＬ３ベクター中のＹＧ＃８１−６Ｇ０１のクローンは、塩基７８６にてＡの代わりにＣを有し、これにより、残基２６２にてＰｈｅからＬｅｕへのアミノ酸配列の変化を生じることに、注意されたい（図２は、ｐＧＬ３ベクター中に導入する前の、ＹＧ＃８１−６Ｇ０１の配列を示す）。２６２位の変化したアミノ酸が酵素の生化学に影響したか否かを決定するために、ＹＧ＃８１−６Ｇ０１のクローンを、元の配列と似るように変異させた。その後、両方のクローンを、Ｅ．ｃｏｌｉにおける発現、物理的安定性、基質結合、およびルミネッセンス出力動態について試験した。有意な差異は、見出されなかった。
【０１５８】
合成遺伝子から発現された部分精製酵素および親遺伝子から発現された部分精製酵素を使用して、ルシフェリンおよびＡＴＰについてのＫｍを決定した（表３を参照のこと）。
【０１５９】
（表３）
【０１６０】
【表３】

インビトロでの真核生物転写／翻訳反応もまた、製造業者の指示に従って、ＰｒｏｍｅｇａのＴＮＴＴ７Ｑｕｉｃｋシステムを使用して行った。ルミネッセンスレベルは、合成ＧＲ遺伝子および合成ＲＤ遺伝子について、（ルミノメーターのスペクトル感度について補正した）親遺伝子と比較して、それぞれ、（反応時間に依存して）１〜３７倍および１〜７７倍高かった。
【０１６１】
合成コメツキムシルシフェラーゼ遺伝子および野生型コメツキムシ遺伝子が、哺乳動物細胞において改善した発現を有するか否かを試験するために、この合成遺伝子および親遺伝子の各々を、一連のｐＧＬ３ベクター中にクローニングし、そしてＣＨＯ細胞中に導入した（表８）。すべての場合において、合成コメツキムシ遺伝子が、ネイティブ遺伝子より高い発現を示した。詳細には、合成ＧＲ遺伝子の発現および合成ＲＤ遺伝子の発現は、親の発現よりも、それぞれ、１９００倍および４０倍高かった（トランスフェクション効率を、ネイティブＲｅｎｉｌｌａルシフェラーゼ遺伝子との比較により正規化した）。さらに、（ｂａｓｉｃベクター対ｃｏｎｔｒｏｌベクターの）このデータは、これらの合成遺伝子が、基礎レベル転写を減少させたことを、示す。
【０１６２】
さらに、ネイティブ遺伝子と合成遺伝子との間でこのｃｏｎｔｒｏｌに関する活性の割合が比較される、ｅｎｈａｎｃｅｒベクターを用いた実験において、このデータは、これらの合成遺伝子が、異常な転写特徴を有する危険が減少していることを、示した。特に、親遺伝子は、ベクター中のエンハンサーにより活性化される、１つ以上の内部転写調節配列を含むようであった。従って、親遺伝子は、レポーター遺伝子として適切ではないが、合成ＧＲ遺伝子および合成ＲＤ遺伝子は、きれいなレポーター応答を示した（トランスフェクション効率を、ネイティブＲｅｎｉｌｌａルシフェラーゼ遺伝子との比較により正規化した）。表９を参照のこと。
【０１６３】
クローン名ならびにヌクレオチド配列およびアミノ酸配列についてのそれらの対応する配列番号を、以下の表４に列挙する。
【０１６４】
【表４】

（実施例２：ＲＤルシフェラーゼ遺伝子の評価）
ＲＤｖｅｒ５．２を、そのルシフェラーゼ強度を増大させるために変異させ、それにより、４つのさらなるアミノ酸変化（Ｍ２Ｉ、Ｓ３４９Ｔ、Ｋ−４８８Ｔ、Ｅ５３８Ｖ）および３つのサイレント点変異（配列番号１８）を有するＲＤ１５６−１Ｈ９を作製した。
【０１６５】
ａ）部位特異的変異誘発：
最初のストラテジーは、部位特異的変異誘発を使用することであった。Ｈ３４８Ｑに対してＧＲ合成遺伝子とＲＤ合成遺伝子との間には４つのアミノ酸差異があり、このことにより、赤色に対する最大の寄与がもたらされる。従って、この置換はまた、低い発光を導き得るタンパク質における構造的変化を引き起こし得る。この領域近辺の最適化は、発光を増大させ得る。以下の位置を、変異のために選択した：
１．Ｓ３４４（ルシフェリンの結合ポケットの端にある）−このコドンを無作為化する
２．Ａ２４５（厳密に保存されているが、３４８に最も近く、活性部位ポケットの端にある）−このコドンを無作為化する
３．Ｉ３４７（保存されておらず、配列中の３４８の隣にある）−疎水性アミノ酸のみに変異させる
４．Ｓ３４９（保存されておらず、配列中の３４８の隣にある）−Ｓ，Ｔ，Ａ，Ｐのみに変異させる。
【０１６６】
上記の位置で変異させるように設計したオリゴヌクレオチドを、部位特異的変異誘発実験（ＷＯ９９／１４３３６）に用い、得られた変異体を、発光強度についてスクリーニングした。発光強度においてはほとんどバリエーションがなく、約２５％のみが発光した。さらに詳細な分析のために、クローンを拾って、スクリーニングロボット（ＰＣＴ／ＷＯ９９１４３３６）を用いて分析した。ＲＤｖｅｒ５．２より高い発光強度（ＬＩ）のクローンはなかったが、クローンのうちの４つがルシフェリンおよびＡＴＰについてわずかに低い複合Ｋｍを有した（Ｋｍ）。
【０１６７】
ｂ）方向付けられた進化：
方向付けられた進化のために用いたプロトコルおよび手順は、ＰＣＴ／ＷＯ９９１４３３６に詳細に記載される。低いＫｍを有する４つのクローン由来のＤＮＡを組み合わせ、ランダム変異体の３つのライブラリーを生成した。このライブラリーを、ロボットを用いてスクリーニングし、最高のＬＩを有するクローンを選択した。これらのクローンをともにシャッフルし、別のロボットスクリーニングにより、４６℃のインキュベーション温度で完了した。最高のＬＩ値を有する３つのクローンは、ＲＤ１５６−０Ｂ４、ＲＤ１５６−１Ａ５、およびＲＤ１５６−１Ｈ９であった。
【０１６８】
ｃ）分析
最高のＬＩ値を有する３つのクローンを、手動分析のために選択して、それらの発光強度がＲＤｖｅｒ５．２より高いことを確認し、それらのスペクトル特性が弱められていないことを確実にする。クローンのうちの１つがわずかに緑色にシフトし、他の全てのものは、ＲＤｖｅｒ５．２のスペクトル特性を維持した（表５）。
【０１６９】
【表５】

ＲＤｖｅｒ５．２に対するルシフェリンのＫｍ値および発光強度を、いくつかの独立した実験において３つ全てのクローンについて決定した。全ての細胞サンプルを、ＣＣＬＲ溶解緩衝液（Ｅ１４８３，ＰｒｏｍｅｇａＣｏｒｐ．，Ｍａｄｉｓｏｎ，ＷＩ）で処理し、緩衝液（２５ｍＭＨＥＰＥＳｐＨ７．８，５％グリセロール，１ｍｇ／ｍｌＢＳＡ，１５０ｍＭＮａＣｌ）に１：１０希釈した。表７は、細菌細胞における発現からの結果（Ｌｕｍ：光学密度に対して正規化した発光値；独立した実験の測定値を前のスラッシュにより分けている）をまとめる。ＲＤ１５６−１Ｈ９（最高の発光強度（５〜１０倍の増加）を有するクローン）はまた、ルシフェリンについて約２倍高いＫｍを有する。
【０１７０】
【表６】

表７は、照度計光電子倍増管のスペクトル感度の較正ありまたはなしで、ＧＲｖｅｒ５．１に対して正規化したＲＤ１５６−１Ｈ９、ＧＲｖｅｒ５．１およびＲＤｖｅｒ５．２の発光強度間の比較を示す。較正した場合、クローンＲＤ１５６−１Ｈ９の発光強度は、ＧＲｖｅｒ５．１より約２倍低いだけであった。クローンＲＤ１５６−１Ｈ９についてのルシフェリンＫｍは、ＧＲｖｅｒ５．１より約４０倍高い。ＲＤ１５６−１Ｈ９は、少なくとも２時間にわたり５０℃で熱安定性である。
【０１７１】
【表７】

表８および表９は、ＣＨＯ細胞におけるルシフェラーゼ発現レベルの比較を示す。表８は、ホタルルシフェラーゼ遺伝子と比較した、コントロールベクターからの発現レベルのみを示す（ＲＬＵ＝相対光単位）。表９は、ｐＧＬ３−コントロールにおける発現レベルの％として計算した４つ全てのｐＧＬ３ベクターにおける発現レベルの比較を示す。
【０１７２】
【表８】

【０１７３】
【表９】

（実施例３：合成Ｒｅｎｉｌｌａルシフェラーゼ核酸分子）
調製した合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子は、以下を含む：１）導入されたコザック配列、２）哺乳動物（ヒト）発現のために最適化されたコドン使用頻度、３）所望でない制限部位の減少または排除、４）原核生物性調節部位の除去（リボソーム結合部位およびＴＡＴＡボックス）、５）スプライス部位およびポリ（Ａ）付加部位の除去、および６）哺乳動物転写因子結合配列の減少または排除。
【０１７４】
合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子のコンピューター補助による設計のプロセスは、コドン最適化、ならびに転写因子結合部位および他の調節部位、ならびに制限部位に除去の回数を反復することは、３つの工程で記載され得る：
１．野生型Ｒｅｎｉｌｌａルシフェラーゼ遺伝子を親遺伝子として用いて、コドン使用頻度を最適化し、１つのアミノ酸を変化させて（Ｔ→Ａ）、コザックコンセンサス配列を生成し、所望でない制限部位を排除し、それにより、合成遺伝子Ｒｌｕｃｖｅｒ１を作製した。
２．原核生物性調節部位、スプライス部位、ポリ（Ａ）部位および転写因子（ＴＦ）結合部位を除去する（第１の試み）。次いで、新たに作製したＴＦ結合部位を除去する。次いで、新たに作製した所望でない制限酵素部位、原核生物性調節部位、スプライス部位、およびポリ（Ａ）部位を、新たなＴＦ結合部位を導入することなく除去する。このことにより、Ｒｌｕｃｖｅｒ２を作製した。
３．Ｒｌｕｃｖｅｒ２の３つの塩基を変化させることにより、Ｒｌｕｃ−最終を作製した。
４．次いで、実際の遺伝子を、Ｒｌｕｃ−最終を設計した配列に対応する合成オリゴヌクレオチドから構築した。アセンブリプロセスまたはＰＣＲプロセスから得られた全ての変異を正した。この遺伝子は、Ｒｌｕｃ−最終（配列番号２２）であり、配列番号２２７のアミノ酸配列をコードする。
【０１７５】
（コドン選択）
ＧｅｎｂａｎｋのＲｅｎｉｌｌａｒｅｎｉｆｏｒｍｉｓルシフェラーゼ配列（登録番号Ｍ６３５０１、配列番号１９）で開始して、ヒト細胞における最適な発現のためのコドン使用頻度に基づいて、およびＥ．ｃｏｌｉの低使用頻度コドンを避けるために、コドンを選択した。ヒト細胞における発現のための最良の１つのコドン（または類似の頻度で見出された場合は、最良の２つのコドン）を１を超えるコドンに対して、全てのアミノ酸のために選択した（Ｗａｄａｅｔａｌ．，１９９０）：
【０１７６】
【化１】

１つのアミノ酸に対して２つのコドンが選択された場合、これらのコドンを、交互にして使用した。合成遺伝子についての他の基準を満たすために、最初の最適コドン選択を、後にある程度まで改変した。例えば、コザック配列の導入は、２位のアミノ酸のＡｌａに関してＧＣＴの使用を必要とした（以下を参照のこと）。
【０１７７】
哺乳動物細胞における以下の低使用頻度コドンは、必要でなければ用いなかった：Ａｒｇ：ＣＧＡ、ＣＧＵ；Ｌｅｕ：ＣＴＡ、ＵＵＡ；Ｓｅｒ：ＴＣＧ；Ｐｒｏ：ＣＣＧ；Ｖａｌ：ＧＴＡ；およびＩｌｅ：ＡＴＡ。以下のＥ．ｃｏｌｉにおける低使用頻度コドンはまた、妥当な場合は避けた（これらのうちの３つが哺乳動物細胞についての低使用頻度リストに適合することに注意のこと）：Ａｒｇ：ＣＧＡ／ＣＧＧ／ＡＧＡ／ＡＧＧ，Ｌｅｕ：ＣＴＡ；Ｐｒｏ：ＣＣＣ；Ｉｌｅ：ＡＴＡ。
【０１７８】
（コザック配列の導入）
コザック配列：５’ａａｃｃＡＴＧＧＣＴ３’（配列番号２９３）（ＮｃｏＩ部位に下線を付し、コード領域は、大文字で示す）を、合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子に導入した。コザック配列の導入により、２番目のアミノ酸がＴｈｒからＡｌａ（ＧＣＴ）に変化する。
【０１７９】
（所望でない制限部位の除去）
ＲＥＢＡＳＥｖｅｒ．８０８（１９９８年８月１日に更新；制限酵素データベース；ｗｗｗ．ｎｅｂ．ｃｏｍ／ｒｅｂａｓｅ）を用いて、実施例１に記載のように、所望でない制限部位を同定した。以下の所望でない制限部位（実施例１に記載のものに加えて）を、実施例１に記載のプロセスに従って除去した：ＥｃｏＩＣＲＩ、ＮｄｅＩ、ＮｓｉＩ、ＳｐｈＩ、ＳｐｅＩ、ＸｍａＩ、ＰｓｔＩ。
【０１８０】
これらの変化全てが組み込まれたＲｅｎｉｌｌａルシフェラーゼ（Ｒｌｕｃ）のバージョンは、Ｒｌｕｃｖｅｒ１である。
【０１８１】
（原核生物性（Ｅ．ｃｏｌｉ）調節配列、スプライス部位、およびポリ（Ａ）部位の除去）
転写調節部位を排除することに関する優先事項およびプロセスは、実施例１に記載のとおりであった。
【０１８２】
（ＴＦ結合部位の除去）
実施例１に記載のものと同じプロセス、ツール、および基準を用いたが、ＴＲＡＮＳＦＡＣデータベースのより新たなバージョン３．３を用いた。
【０１８３】
Ｒｌｕｃｖｅｒ１から原核生物性調節配列スプライス部位およびポリ（Ａ）部位を除去した後、ＴＦ結合部位に関する最初の検索を行うと、約６０がヒットした。全ての部位を、合成Ｒｅｎｉｌｌａ遺伝子のアミノ酸を改変することなく、除去され得る３つの例外に関して排除した：
１．ＣＡＣ−結合タンパク質Ｔ０００７６に関して、６３位の部位がＷの２つのコドン（ＴＧＧＴＧＧ）から構成される；
２．ｍｙｃ−ＤＦ１Ｔ００５１７に関して、５２２位の部位は、ＫＭＶについてのコドン（ＡＡＮＡＴＧＧＴＮ）から構成される；
３．ｍｙｃ−ＤＦ１Ｔ００５１７に関して、８８５位の部位は、ＥＭＧについてのコドン（ＧＡＲＡＴＧＧＧＮ）から構成される。
【０１８４】
（新たに導入した）ＴＦ結合部位に関して、その後に２回目の検索を行うと、約２０がヒットした。全ての新たな部位を、上記の３つの部位を残して排除した。最後に、任意の新たに導入した制限部位、原核生物性調節配列、スプライス部位およびポリ（Ａ）部位を、可能な場合、新たなＴＦ結合部位を導入せずに除去した。
【０１８５】
Ｒｌｕｃｖｅｒ２を得た（配列番号２１および２２６）。
【０１８６】
実施例１と同様に、低いストリンジェンシーの検索パラメーターが、ＴＥＳＳフィルターにかけた文字列検索により特定されて、合成Ｒｅｎｉｌｌａ遺伝子をさらに評価した。
【０１８７】
ＬＬＨが１０から９に減少し、最小のエレメントの長さが５から４に減少した場合、ＴＥＳＳフィルターにかけた文字列検索をしても、新たにヒットしなかった。上記に列挙したパラメーター変化に加えて、生物分類を哺乳動物から脊索動物に拡大した場合、この検索により、さらに４つのＴＦ結合部位のみが得られた。ＭｉｎＬＬＨが８から０にさらに減少すると、この検索により、組み合わされたさらに２つの５塩基の部位（ＭＡＭＡＧおよびＣＴＫＴＫ）が示され、Ｒｌｕｃｖｅｒ２において４つの適合およびいくつかの４塩基の部位を有した。また、実施例１と同様に、Ｒｌｕｃｖｅｒ２を、ＥＰＤ（真核生物プロモーターデータベース，リリース４５）の登録に対してヒットするかをチェックした。３つのヒットを決定した（ＭｕｓｍｕｓｃｕｌｕｓプロモーターＨ−２Ｌ＾ｄに対して１つ（Ｃｅｌｌ，４４，２６１（１９８６）、単純ヘルペスウイルスＩ型プロモーターｂ’ｇ’２．７ｋｂに対して１つ、およびＨｏｍｏｓａｐｉｅｎｓＤＨＦＲプロモーターに対して１つ（Ｊ．Ｍｏｌ．Ｂｉｏｌ．，１７６，１６９（１９８４））。しかし、Ｒｌｕｃｖｅｒ２に対してさらなる変化は行わなかった。
【０１８８】
（Ｒｌｕｃｖｅｒ２についての特性のまとめ）
−３０全ての低使用頻度コドンを排除した。コザック配列の導入により、２番目のアミノ酸がＴｈｒからＡｌａに変化した；
−塩基組成：５５．７％ＧＣ（Ｒｅｎｉｌｌａ野生型親遺伝子：３６．５％）；
−１つの所望でない制限部位は排除できなかった：４８８位のＥｃｏＲＶ；
−合成遺伝子は、原核生物性プロモーター配列を有さないが、８６７〜７３位の１つの潜在的に機能的なリボソーム結合部位（ＲＢＳ）（Ｍｅｔコドンの約１３塩基上流）は排除できなかった；
−全てのポリ（Ａ）付加部位を排除した；
−スプライス部位：２つのドナースプライス部位は排除できなかった（両方とも、アミノ酸配列ＭＧＫを共有する）；
−ＴＦ部位：４つを超える明白な塩基のコンセンサスを有する全ての部位を、アミノ酸配列に対する変更を避けるための優先度に起因する３つの例外を除いて、排除した（約２８０のＴＦ結合部位を除いた）。
合成Ｒｅｎｉｌｌａルシフェラーゼ配列を図７および８に示す。コドン使用頻度の比較を、図９に示す。
【０１８９】
ｐＧＬ３に導入される場合、Ｒｌｕｃ−最終は、コザック配列（ＣＡＣＣＡＴＧＧＣＴ）を有する。Ｒｌｕｃｖｅｒ２に対するＲｌｕｃ−最終における変化を、遺伝子アセンブリの間に導入した。一方の変更は、６１９位におけるＣからＡへの変化であり、これは、真核生物プロモーター配列を排除し、遺伝子をアセンブルするために用いられる、対応するオリゴヌクレオチドにおけるヘアピン構造の安定性を減少させた。他方の変更は、２１８〜２２０位におけるＣＧＣからＡＧＡへの変更を含んでいた（ＰＣＲのためのより良好なオリゴヌクレオチドが生じた）。
【０１９０】
（遺伝子アセンブリストラテジー）
合成Ｒｅｎｉｌｌａルシフェラーゼのために用いた遺伝子アセンブリプロトコルは、実施例１に記載のプロトコルと類似していた。使用したオリゴヌクレオチドを、図１０に示す。
【０１９１】
【化２】

得られた合成遺伝子フラグメントを、ＮｃｏＩおよびＸｂａＩを用いてｐＲＡＭベクターにクローニングした。正確なサイズの挿入物を有する２つのコドンを、配列決定した。６つの変異のうち４つを各クローンから合成遺伝子において見出した。これらの変異は、部位特異的変異誘発により固定され（ＰｒｏｍｅｇａＣｏｒｐ．，Ｍａｄｉｓｏｎ，ＷＩのＧｅｎｅＥｄｉｔｏｒ）、これら２つの遺伝子間で正確な領域を交換した。正しくされた遺伝子を、配列決定により確認した。
【０１９２】
（他のベクター）
ｐＧＬ−３コントロールベクター骨格における合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子のための発現ベクターを調製するために、５μｇのｐＧＬ３−コントロールを、２μｌの各酵素および５μｌの１０×緩衝液Ｂを含有する５０μｌの最終容量（ナノピュア水を用いて、５０μｌの容量にする）中でＮｃｏＩおよびＸｂａＩで消化した。消化反応系を、３７℃で２時間インキュベートし、混合物全体を、１×ＴＡＥ中で１％アガロースゲル上で泳動した。所望のベクター骨格フラグメントを、ＱｉａｇｅｎのＱＩＡｑｕｉｃｋゲル抽出キットを用いて精製した。
【０１９３】
ネイティブなＲｅｎｉｌｌａルシフェラーゼ遺伝子フラグメントを、２つのオリゴヌクレオチド、ＮｃｏＩ−ＲＬ−ＦおよびＸｂａＩ−ＲＬ−Ｒを用いてｐＧＬ３−コントロールベクターにクローニングし、テンプレートとしてｐＲＬ−ＣＭＶを用いて、ネイティブなＲｅｎｉｌｌａルシフェラーゼ遺伝子をＰＣＲ増幅した。ＮｃｏＩ−ＲＬ−Ｆについての配列は、以下のとおりである：
【０１９４】
【化３】

ＸｂａＩ−ＲＬ−Ｒについての配列は、以下のとおりである
【０１９５】
【化４】

ＰＣＲ反応を以下のとおりに行った：
反応混合物（１００μｌについて）：
ＤＮＡテンプレート（プラスミド）１．０μｌ（１．０ｎｇ／μｌ最終）
１０×Ｒｅｃ．緩衝液１０．０μｌ（ＳｔｒａｔａｇｅｎｅＣｏｒｐ．）
ｄＮＴＰ（各２５ｍＭ）１．０μｌ（最終２５０μＭ）
プライマー１（１０μＭ）２．０μｌ（０．２μＭ最終）
プライマー２（１０μＭ）２．０μｌ（０．２μＭ最終）
ＰｆｕＤＮＡポリメラーゼ２．０μｌ（２．５Ｕ／μｌ，ＳｔｒａｔａｇｅｎｅＣｏｒｐ．）
８２μｌの２回蒸留水
ＰＣＲ反応系：
９４℃で２分間加熱；（９４℃で２０秒；６５℃で１分；７２℃で２分；次いで７２℃で５分）×２５サイクル、次いで、氷上でインキュベートする。ＰＣＲ増幅したフラグメントをゲルから切り出し、ＤＮＡを精製し、−２０℃で保存した。
【０１９６】
ネイティブのＲｅｎｉｌｌａルシフェラーゼ遺伝子フラグメントをｐＧＬ３−コントロールベクターに導入するために、ネイティブのＲｅｎｉｌｌａルシフェラーゼ遺伝子のＰＣＲ産物（ＲＡＭ−ＲＬ合成）５μｇを、ＮｃｏＩおよびＸｂａＩを用いて消化した。所望のＲｅｎｉｌｌａルシフェラーゼ遺伝子フラグメントを精製し、−２０℃で保存した。
【０１９７】
次いで、１００ｎｇの挿入物および１００ｎｇのｐＧＬ３−コントロールベクター骨格を、制限酵素ＮｃｏＩおよびＸｂａＩで消化し、ともに連結した。次いで、２μｌの連結混合物を、ＪＭ１０９コンピテント細胞に形質転換した。８つのアンピシリン耐性クローンを拾い、それらのＤＮＡを単離した。ｐＧＬ３−コントロール−ネイティブおよびｐＧＬ３−コントロール−合成の各陽性クローンからの各ＤＮＡを精製した。ベクター中のネイティブの遺伝子および合成遺伝子の正確な配列を、ＤＮＡ配列決定により確認した。
【０１９８】
合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子により哺乳動物細胞における発現が改善されたか否かを決定するために、この遺伝子を、ＳＶ４０プロモーターおよびＳＶ４０初期エンハンサーの制御下で、哺乳動物発現ベクターｐＧＬ３−コントロールベクターにクローニングした（図１３Ａ）。ネイティブのＲｅｎｉｌｌａルシフェラーゼ遺伝子をまた、ｐＧＬ−３コントロールベクターにクローニングし、その結果、合成遺伝子およびネイティブの遺伝子からの発現を比較した。次いで、これらの発現ベクターを、４つの一般的な哺乳動物細胞株（ＣＨＯ、ＮＩＨ３Ｔ３、ＨｅｌａおよびＣＶ−１；表１０）にトランスフェクトし、合成遺伝子対ネイティブの遺伝子に関して、ベクター間の発現レベルを比較した。使用したＤＮＡの量は、合成遺伝子が、異なる発現レベルで構成的に増大されることを確認するために、２つの異なるレベルの量であった。結果は、これらの細胞における合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子に関して、７０〜６００倍の発現を示す（表１０）。
【０１９９】
【表１０】

ルシフェラーゼレポーターの１つの重要な利点は、その短いタンパク質半減期である。増強した発現はまた、長期化したタンパク質半減期から生じ得、そうであるならば、このことは、新たな遺伝子の所望されない欠点を与える。この可能性は、シクロヘキシミド追跡（ｃｙｃｌｏｈｅｘｉｍｉｄｅｃｈａｓｅ）（「ＣＨＸ追跡」）実験により除外される（図１４）。このことにより、タンパク質半減期の増大は、ヒト化Ｒｅｎｉｌｌａルシフェラーゼ遺伝子から生じないことが実証される。
【０２００】
発現における増加が、確実に発現ベクター骨格に限定されず、プロモーター特異的および／または細胞特異的であるようにするために、合成Ｒｅｎｉｌｌａ遺伝子（Ｒｌｕｃ−最終）およびネイティブのＲｅｎｉｌｌａ遺伝子を異なるベクター骨格に、異なるプロモーターの制御下でクローニングした（図１３Ｂ）。この合成遺伝子は、その野生型対応物と比較して、常に発現が増加している（表１１）。
【０２０１】
【表１１】

【０２０２】
【表１２】

（図１３Ａに示されるベクター骨格）
減少した見せかけの発現の場合、合成遺伝子は、プロモーターなしのベクターにおいてより低い基本的レベルの転写を示すはずである。合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子およびネイティブのＲｅｎｉｌｌａルシフェラーゼ遺伝子を、ｐＧＬ３−基本ベクターにクローニングして、転写の基本的レベルを比較した。合成遺伝子自体は増加した発現効率を有するので、プロモーターなしのベクターからの活性により、基本的転写の差異を判断するために直接比較することはできず、むしろ、このことは、コントロールベクターを参照して、プロモーターなしのベクターからの活性の％を比較することにより考慮される（基本的ベクターからの発現は、プロモーターエレメントおよびエンハンサーエレメント両方を有する完全に機能的なベクターにおける発現により区別した）。このデータは、合成Ｒｅｎｉｌｌａルシフェラーゼが、ネイティブの遺伝子より低いレベルの基本的転写を有することを実証する（表１２）。
【０２０３】
エンハンサーが、プロモーター活性を実質的に刺激することが当業者に周知である。合成遺伝子は、不適切な転写特性の危険性を減少したか否かを試験するために、ネイティブ遺伝子および合成遺伝子を、エンハンサーエレメントを有するベクター（ｐＧＬ３−エンハンサーベクター）に導入した。合成遺伝子は、より高い発現効率を有するので、エンハンサーの存在下で転写レベルを比較するために、両方の活性を直接比較することはできない。しかし、このことは、コントロールベクターを参照して、エンハンサーベクターから活性の％を用いることにより考慮される（エンハンサーの存在下での発現は、プロモーターエレメントおよびエンハンサーエレメント両方を有する完全に機能的なベクターにおける発現により区別した）。このような結果は、ネイティブな遺伝子が存在する場合、エンハンサー単独で、コントロールの４２〜１２４％の転写を刺激することが可能であることを示す。しかし、ネイティブの遺伝子が、同じベクター中で合成遺伝子により置換されると、活性のみが、同じエンハンサーおよび強力なＳＶ４０プロモーターが用いられる場合、この値の１〜５％を構成するにすぎない。このことは、合成遺伝子が、見せかけの発現の危険性を減少させたことを明らかに示す（表１２）。
【０２０４】
合成Ｒｅｎｉｌｌａ遺伝子（Ｒｌｕｃ−最終）をインビトロ系で用いて、ネイティブの遺伝子と翻訳効率を比較した。Ｔ７ｑｕｉｃｋｃｏｕｐｌｅｄｔｒａｎｓｃｒｉｐｔｉｏｎ／ｔｒａｎｓｌａｔｉｏｎｓｙｓｔｅｍ（ＰｒｏｍｅｇａＣｏｒｐ．，Ｍａｄｉｓｏｎ，ＷＩ）において、ｐＲＬ−ｎｕｌｌネイティブプラスミド（Ｔ７プロモーターの制御下でネイティブＲｅｎｉｌｌａルシフェラーゼ遺伝子を有する）または同じ量のｐＲＬ−ｎｕｌｌ−合成プラスミド（Ｔ７プロモーターの制御下で合成Ｒｅｍａｉｌｌａルシフェラーゼ遺伝子を有する）を、ＴＮＴ反応混合物に添加し、ルシフェラーゼ活性を、５分毎に６０分まで測定した。二重ルシフェラーゼアッセイキット（ＰｒｏｍｅｇａＣｏｒｐ．）を用いて、Ｒｅｎｉｌｌａルシフェラーゼ活性を測定した。このデータは、改善された発現が、合成遺伝子から得られることを示した（図１５Ａ、Ｂ）。合成遺伝子の翻訳効率の増大をさらに証明するために、ＲＮＡをインビトロ転写系により調製し、次いで、精製した。ｐＲＬ−ｎｕｌｌ（ネイティブまたは合成）ベクターを、ＢａｍＨＩで直鎖状にした。ＤＮＡを複数回のフェノール−クロロホルム抽出、続いて複数回のエタノール沈殿により精製した。インビトロＴ７転写系を用いてＲＮＡを調製した。ＤＮＡテンプレートを、ＲＮａｓｅを含まないＤＮａｓｅを用いて除去し、ＲＮＡを、フェノール−クロロホルム抽出、続いて、複数回のイソプロパノール沈殿により精製した。次いで、同じ量の精製ＲＮＡ（合成遺伝子またはネイティブの遺伝子のいずれか）を、ウサギ網状赤血球溶解物（図１５Ｃ、Ｄ）または小麦胚芽溶解物（図１５Ｅ、Ｆ）に添加した。再び、合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子ＲＮＡは、ネイティブのＲｅｎｉｌｌａルシフェラーゼ遺伝子ＲＮＡより多くのルシフェラーゼを生成した。これらのデータは、翻訳効率が、合成配列により改善されることを示唆する。なぜ合成遺伝子が小麦胚芽中で高度に発現されるのかを決定するために、植物のコドン使用頻度を決定した。高等植物において最も低い使用頻度のコドンは、哺乳動物におけるものと一致した。
【０２０５】
レポーター遺伝子アッセイは、転写調節事象を研究するために広く用いられている。これは、同時トランスフェクション実験においてしばしば行われ、このアッセイにおいて、試験プロモーターを含む１次レポーター構築物とともに、構成的レポーターの制御下で第２のコントロールレポーターが、サンプル間のトランスフェクション効率を含む実験変動を正規化するために内部コントロールとして細胞にトランスフェクトされる。コントロールレポーターシグナル、コントロールレポーターと１次レポーターとの間の潜在的プロモーターのやりとり（ｃｒｏｓｓｔａｌｋ）、ならびに実験条件によるコントロールレポーターの潜在的な調節は、信頼性のある補レポーター（ｃｏ−ｒｅｃｅｐｔｏｒ）ベクターを選択するための重要な局面である。
【０２０６】
上記のように、合成Ｒｅｎｉｌｌａルシフェラーゼ遺伝子を、異なるプロモーターの下で異なるベクター骨格にクローニングすることにより、ベクター構築物を作製する。全ての構築物は、試験した３つの哺乳動物細胞株においてより高い発現を示した（表１１）。従って、発現効率が良好になるにつれて、合成Ｒｅｎｉｌｌａルシフェラーゼは、哺乳動物細胞にトランスフェクトされた場合、より高いシグナルを発する。
【０２０７】
より高いシグナルが得られるので、同じレポーターシグナルを達成するためにはより低い活性しか必要とせず、このことは、プロモーターの干渉という危険性を減少させる。５０ｎｇのｐＧＬ３−コントロール（ホタルｌｕｃ＋）＋ネイティブｐＲＬ−ＴＫプラスミドの５つの異なる量（５０、１００、５００、１０００または２０００ｎｇ）または合成ｐＲＬ−ＴＫ（５、１０、５０、１００、または２００ｎｇ）の５つの異なる量で、ＣＨＯ細胞をトランスフェクトした。各トランスフェクションに、ｐＵＣ１９キャリアＤＮＡを総量３μｇＤＮＡまで添加した。１０倍低いｐＲＬ−ＴＫＤＮＡにより、ネイティブの遺伝子と同様または大きいシグナルを与える（１次レポーターｐＧＬ３−コントロールからの発現を阻害するという危険性が減少している）ことを実証する実験が、図１６に示される。
【０２０８】
実験的処理により、ときおり、遺伝子内の不可解な部位が活性化され得、補レポーター発現の誘導または抑制が引き起こされ、このことは、トランスフェクション効率の正規化のための補レポーターとしてその機能を弱める。１つの例は、ＭＣＦ−７細胞をトランスフェクトした場合、ＴＰＡが、野生型遺伝子を有する補レポーターベクターの発現を誘導することである。５００ｎｇのｐＲＬ−ＴＫ（ネイティブ）、５μｇのネイティブｐＲＧ−Ｂおよび合成ｐＲＧ−Ｂ、２．５μｇのネイティブｐＲＧ−ＴＫおよび合成ｐＲＧ−ＴＫをＭＣＦ−７細胞のウェルごとにトランスフェクトした。１００ｎｇ／ウェルのｐＧＬ３−コントロール（ホタルｌｕｃ＋）を、全てのＲＬプラスミドに対して同時トランスフェクトした。キャリアＤＮＡであるｐＵＣ１９を用いて、総ＤＮＡを５．１μｇ／ウェルでトランスフェクトした。１５．３μｌのＴｒａｎｓＦａｓｔトランスフェクション試薬（ＰｒｏｍｅｇａＣｏｒｐ．，Ｍａｄｉｓｏｎ，ＷＩ）をウェルごとに添加した。１６時間後、細胞をトリプシン処理し、プールし、６ウェルディッシュの６つのウェルに分割し、８時間にわたりウェルに接着させた。次いで、３つのウェルを、０．２ｎＭの腫瘍プロモーター、ＴＰＡ（ホルボール−１２−ミリステート−１３−アセテート、Ｃａｌｂｉｏｃｈｅｍ＃５２４４００−Ｓ）で処理し、３つのウェルを２０μｌのＤＭＳＯでモック処理した。細胞をＴＰＡを添加して２４時間後に、０．４ｍｌのＰａｓｓｉｖｅＬｙｓｉｓＢｕｆｆｅｒを用いて回収した。この結果は、合成遺伝子を用いることによって、実験適刺激による補レポーター発現の所望でない変化が避けられ得ることを示した（表１３）。このことは、合成遺伝子を用いることにより、異常な発現の危険性が減少され得ることを示す。
【０２０９】
【表１３】

【０２１０】
【表１４】

【０２１１】
【表１５】

すべての刊行物、特許および特許出願は、本明細書中に参考として援用される。前述の明細書において、本発明は、その特定の好ましい実施形態に関して記載され、多くの詳細が例示の目的で記載されてきたが、本発明は、さらなる実施形態が可能であり、本明細書中の詳細の特定のものが本発明の基本的な原理から逸脱することなくかなり変化され得ることは、当業者に明らかである。

【特許請求の範囲】
【請求項１】
明細書に記載の発明。

【図１】

【図２−１】

【図２−２】

【図２−３】

【図２−４】

【図２−５】

【図２−６】

【図２−７】

【図２−８】

【図２−９】

【図２−１０】

【図２−１１】

【図２−１２】

【図２−１３】

【図２−１４】

【図３−１】

【図３−２】

【図３−３】

【図３−４】

【図３−５】

【図４】

【図５Ａ】

【図５Ｂ】

【図５Ｃ】

【図５Ｄ】

【図５Ｅ】

【図５Ｆ】

【図５Ｇ】

【図５Ｈ】

【図５Ｉ】

【図５Ｊ】

【図５Ｋ】

【図６−１】

【図６−２】

【図６−３】

【図６−４】

【図７−１】

【図７−２】

【図７−３】

【図８】

【図９Ａ】

【図９Ｂ】

【図１０】

【図１１−１】

【図１１−２】

【図１１−３】

【図１２】

【図１３−１】

【図１３−２】

【図１３−３】

【図１４】

【図１５Ａ】

【図１５Ｂ】

【図１５Ｃ】

【図１５Ｄ】

【図１５Ｅ】

【図１５Ｆ】

【図１６−１】

【図１６−２】

【図１７Ａ】

【図１７Ｂ】

【図１８−１】

【図１８−２】

【図１８−３】

【図１８−４】

【公開番号】特開２０１０−８１９４２（Ｐ２０１０−８１９４２Ａ）
【公開日】平成２２年４月１５日（２０１０．４．１５）
【国際特許分類】

化学；冶金 (1,075,549)
- 生化学；ビール；酒精；ぶどう酒；酢；微生物学；酵素学；突然変異... (115,607)
  - 微生物または酵素；その組成物 (68,222)

【出願番号】特願２０１０−８４５１（Ｐ２０１０−８４５１）
【出願日】平成２２年１月１８日（２０１０．１．１８）
【分割の表示】特願２００６−２８８１４７（Ｐ２００６−２８８１４７）の分割
【原出願日】平成１３年８月２４日（２００１．８．２４）
【出願人】（５００４３００８４）プロメガ・コーポレーション (18)
【Ｆターム（参考）】

[ Back to top ]

合成核酸分子組成物および調製方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

合成核酸分子組成物および調製方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク