説明

コドン最適化法

タンパク質をコードする最適化されたポリヌクレオチド配列の宿主シュードモナス属細菌における異種発現。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その開示内容が参照により本明細書に組み込まれる、2007年2月14日出願の米国仮出願第60/901,687号、及び2006年5月30日出願の米国仮出願第60/809,536号の優先権を主張する。
【0002】
本発明は、一般に、細菌発現のために遺伝子を最適化するための方法に関する。本発明はさらに、最適化された遺伝子の解析のためのデータベースシステム及びツールに関する。
【背景技術】
【0003】
異種組換えタンパク質の調製のための宿主細胞として多数の細菌が使用されてきた。多数の細菌系の1つの重要な不利点は、ヒト遺伝子におけるコドン選択とは全く異なり、レアコドンをそれらが使用することである。これらのレアコドンの存在は、組換え遺伝子の発現遅延及び減少を引き起こし得る。特定の態様では、核酸配列は、該核酸配列の特定のコドンが特定の宿主に有利であり、発現のレベルの増強をもたらし得るコドンに変化している組換えポリペプチド変異体をコードするように変更されていてよい(例えば、Haas et al., Curr. Biol. 6:315, 1996; Yang et al., Nucleic Acids Res. 24:4592, 1996参照)。
【0004】
異種発現したタンパク質をコードするヌクレオチド配列を最適化するプロセスは、発現収量を向上させるために重要な段階であり得る。最適化要件には、前記外来タンパク質を生産する前記宿主の能力を向上させる段階、並びにその研究者が発現構築物を効率良く設計する手助けをする段階が含まれ得る。遺伝子規模のDNA合成の価格は、近年大幅に低下してきているが、本目的での最適化遺伝子合成への投資は高価であり得る。従って、徹底解析を行って合成を進める前に全ての設計要件が適切に満たされていることを確実にすることが重要である。さらに、候補合成遺伝子を評価し、この解析の結果の人間が読めるレポートを作成するプロセスは時間のかかるプロセスである。
【0005】
コドン選択の計算についてはいくつかのツールが存在するが、これらのツールは一般に、コドン使用頻度を使用可能な状況で報告するように設計されていない。これらのツールは計算した使用頻度を参照基準と比較しないため、その宿主発現系に対してレアコドンの存在を見分けるためには、典型的に、出力データを手動で再フォーマットすることが必要である。翻訳された遺伝子配列に沿ったレアコドンの空間的可視化も手動で実行しなければならない。そのため、所望の配列をそれぞれのアプリケーションに正しいフォーマットにインポートすることを含む、実質的なユーザー教育が必要である。
【発明の概要】
【0006】
本発明には、細菌宿主細胞、例えばシュードモナス・フルオレセンス(Pseudomonas fluorescens)における異種発現のために最適化された合成ポリヌクレオチド配列が含まれる。
【0007】
本発明はまた、前記細菌細胞の細胞質又はペリプラズムにおいて組換えタンパク質を生産する方法も提供し、本方法には、細菌宿主における異種発現のために合成ポリヌクレオチド配列を最適化することが含まれ、該合成ポリヌクレオチド配列は、タンパク質、例えば抗原をコードするヌクレオチド配列を含む。本方法はまた、前記最適化された合成ポリヌクレオチド配列を発現ベクターに連結することと、前記宿主細菌を前記発現ベクターで形質転換することとも含む。本方法はさらに、前記形質転換された宿主細菌を前記タンパク質の発現に適した好適な培地において培養することと、前記タンパク質を単離することとを含む。選択された細菌宿主は、シュードモナス・フルオレセンスであり得る。
【0008】
本発明の他の実施形態は、宿主においてほとんど使用されない、合成ポリヌクレオチド配列由来のレアコドンを同定及び変更(modifying)することにより、宿主細胞における異種発現のために合成ポリヌクレオチド配列を最適化する方法を含む。さらに、これらの方法には、推定内部リボソーム結合部位配列の同定及び変更(modification)、並びに前記合成ポリヌクレオチド配列由来のG又はCヌクレオチドの伸長リピートの同定及び変更が含まれ得る。これらの方法にはまた、RBS及び遺伝子コード領域におけるmRNA二次構造の同定及び最小化、並びに前記合成ポリヌクレオチド配列由来の望ましくない酵素制限部位を変更することが含まれ得る。
【0009】
本発明はまた、データベースと、生の配列からコドン使用頻度を計算し、翻訳されたDNA配列に沿ってレアコドンの位置を図表を用いて報告するためのツールとを用いる、遺伝子の自動連続解析及びレポート作成も提供する。特定遺伝子の複数の候補バージョンを設計する場合、全てのバージョンの解析を行って、合成に最適な候補を決定する。この比較は、候補バージョンの比較と参照コドン選択の比較とともに、人間が読める有用な形式で示される。
【図面の簡単な説明】
【0010】
【図1】合成ポリヌクレオチド配列の最適化中に使用することのできる段階を示す流れ図を例示する。
【0011】
【図2】P.フルオレセンス株MB214における、翻訳されたタンパク質配列に沿ったレアコドンの位置及び分布を示すレアコドン使用頻度プロフィールを例示する。
【0012】
【図3】P.フルオレセンス株MB214における、翻訳されたタンパク質配列に沿ったレアコドンの位置及び分布を示すレアコドン使用頻度プロフィールを例示する。
【図4】本発明の遺伝子データベースのデータベーススキーマの実施形態を例示する。
【発明を実施するための形態】
【0013】
本発明を、本発明の好ましい実施形態を示している添付の図面を参照して、下記にさらに詳しく説明する。しかしながら、本発明は、多くの異なる形で具体化されてよく、本明細書に示す実施形態に限定されるものと解釈してはならない;むしろ、これらの実施形態は、本開示内容が徹底的かつ完全であり、本発明の範囲を当業者に十分に伝達するために提供される。
【0014】
本発明は、一般に、原核生物宿主細胞において異種組換えタンパク質を調製するためのプロセスに関する。宿主細胞遺伝子に関する宿主細胞のコドン使用を決定する。宿主細胞において異種組換えタンパク質をコードする核酸中にほとんど出現しないコドンを、高頻度で出現するコドンを用いて変更する。次いで、この宿主細胞を、該組換えタンパク質をコードする核酸で形質転換し、この組換え核酸を発現させる。
【0015】
本明細書において、用語「変更する(modify)」又は「改変する(alter)」、あるいはその任意の形は、変更する、改変する、置き換える、欠失する、置き換えする、除去する、変更する、又は形質転換することを意味する。
【0016】
本発明はまた、タンパク質をコードする合成ポリヌクレオチド配列にも関する。本発明の実施形態はまた、細菌宿主における合成ポリヌクレオチドの異種発現も提供する。その他の実施形態には、シュードモナス・フルオレセンスにおける合成ポリヌクレオチドの異種発現が含まれる。本発明のさらなる実施形態にはまた、シュードモナス・フルオレセンスに基づく異種発現系を用いて発現させることができる組換えタンパク質をコードする最適化されたポリヌクレオチド配列が含まれる。また、本発明の別の実施形態には、シュードモナス・フルオレセンスの細胞質における合成ポリヌクレオチドの異種発現が含まれる。本発明のさらなる実施形態にはまた、シュードモナス・フルオレセンスの周辺質における合成ポリヌクレオチドの異種発現が含まれる。
【0017】
異種発現系では、最適化段階は、前記外来タンパク質を生産する前記宿主の能力を向上させる可能性がある。タンパク質発現は、転写、mRNAプロセッシング、並びに翻訳の安定性及び開始に影響を及ぼすものを含む多数の要因に支配される。前記ポリヌクレオチド最適化段階には、前記外来タンパク質を生産する前記宿主の能力を向上させるための段階、並びにその研究者が発現構築物を効率良く設計する手助けをする段階が含まれ得る。最適化戦略には、例えば、翻訳開始領域の変更、mRNA構造要素の改変、及び異なるコドンバイアスの使用が含まれ得る。次の段落では、異種タンパク質発現の減少をもたらす可能性のある潜在的な問題と、これらの問題を克服する可能性のある技術とを考察する。
【0018】
異種タンパク質発現の減少がもたらされ得る1つの領域は、レアコドンに誘導される翻訳休止である。レアコドンに誘導される翻訳休止には、前記宿主生物においてほとんど使用されず、その利用可能なtRNAプール中でそれらが不足しているために、タンパク質翻訳に悪影響を及ぼし得る、対象のポリヌクレオチド中のコドンの存在が含まれる。前記宿主生物において最適翻訳を改善する1つの方法には、コドン最適化を行うことが含まれ、このコドン最適化により変更されているレアな宿主コドンを前記合成ポリヌクレオチド配列中にもたらすことができる。
【0019】
異種タンパク質発現の減少をもたらし得る別の領域は、代替翻訳開始によるものである。代替翻訳開始には、リボソーム結合部位(RBS)としての役割を果たすことのできるモチーフを偶然含んでいる合成ポリヌクレオチド配列が含まれ得る。これらの部位は、遺伝子内部位からの末端切断型タンパク質の翻訳の開始をもたらし得る。精製中に除去することが難しい場合のある末端切断型タンパク質を生産する可能性を低下させる1つの方法には、最適化されたポリヌクレオチド配列由来の推定内部RBS配列を変更することが含まれる。
【0020】
異種タンパク質発現の減少をもたらし得る別の領域は、リピートによって引き起こされるポリメラーゼスリッページによるものである。リピートによって引き起こされるポリメラーゼスリッページは、フレームシフト突然変異をもたらし得るDNAポリメラーゼのスリッページ又はスタッタリング(stuttering)の原因となることが示されているヌクレオチド配列リピートと関与している。このようなリピートはまた、RNAポリメラーゼのスリッページの原因となる場合もある。高G+C含量バイアスを有する生物では、G又はCヌクレオチドリピートで構成される、より高度のリピートが存在し得る。従って、RNAポリメラーゼスリッページを引き起こす可能性を低下させる1つの方法には、G又はCヌクレオチドの伸長リピートを改変することが含まれる。
【0021】
異種タンパク質発現の減少をもたらし得る別の領域は、二次構造を干渉することによるものである。二次構造は、RBS配列又は開始コドンを隔離し得、タンパク質発現の減少と相関があった。また、ステムループ構造も転写休止及び減衰に関与し得る。最適化されたポリヌクレオチド配列は、そのヌクレオチド配列のRBS及び遺伝子コード領域に、転写及び翻訳の改善を可能にする最小二次構造を含有し得る。
【0022】
異種タンパク質発現を達成し得る別の領域は、制限部位である。宿主発現ベクターへの転写ユニットのその後のサブクローニングに干渉し得る制限部位を変更することによって、ポリヌクレオチド配列を最適化することができる。
【0023】
DNA配列を最適化することにより、遺伝子発現又はタンパク質生産に悪い又は良い影響を及ぼす場合がある。例えば、より頻度の高いコドンを用いてより頻度の低いコドンを変更することは、そのmRNAの半減期に影響を及ぼすことがあるか、又はメッセージの翻訳に干渉する二次構造を導入することによってその構造を改変することもある。従って、場合によっては、最適化されたメッセージを改変することが必要であり得る。
【0024】
遺伝子の全て又は一部を最適化することができる。ある場合では、発現の所望の調節は、本質的に全遺伝子を最適化することによって達成される。他の場合では、所望の調節は、遺伝子の全てではないが一部を最適化することによって達成される。
【0025】
コード配列のコドン使用頻度は、所望の特性、例えば特定の細胞種内での高レベルの発現が得られるように調整することができる。このような最適化の出発点は、100%共通コドンを有するコード配列、又は共通コドンと非共通コドンの混合を含有するコード配列であってよい。
【0026】
コドン使用頻度の異なる2又はそれ以上の候補配列を作成し、それらが所望の特性を有するかどうかを判定するために試験することができる。候補配列は、調節エレメント、例えばサイレンサー又はエンハンサーの存在を探すために、さらにコドン使用頻度の改変によってこのような調節エレメントへと変換し得るコード配列の領域の存在を探すために、コンピュータを用いることによって評価することができる。さらなる基準には、特定のヌクレオチド、例えば、A、C、GもしくはUの増加、特定のアミノ酸のコドンバイアス、又は特定のmRNA二次もしくは三次構造の有無を含んでよい。候補配列の調整は、多数のこのような基準に基づいて行うことができる。
【0027】
有望な候補配列を構築し、その後、実験的に評価する。複数の候補を互いに独立に評価してよく、あるいは最も有望な候補を新たな出発点として用いることによるか、もしくは2又はそれ以上の候補の領域を組み合わせて、新規なハイブリッドを生産することにより、前記プロセスを繰り返すこともできる。さらなるラウンドの変更及び評価を含んでもよい。
【0028】
候補配列のコドン使用頻度を変更することにより、ポジティブエレメント又はネガティブエレメントの生成又は破壊がもたらされ得る。一般に、ポジティブエレメントとは、改変又は候補配列からの除去によって治療用タンパク質の発現の低下をもたらし得るか、あるいはその生成によって治療用タンパク質の発現の増加をもたらし得る任意のエレメントを指す。例えば、ポジティブエレメントには、エンハンサー、プロモーター、下流プロモーターエレメント、ポジティブレギュレーター(例えば、転写アクチベーター)のDNA結合部位、又はmRNA二次もしくは三次構造を伝達もしくは変更することに関与する配列が含まれ得る。ネガティブエレメントとは、改変又は候補配列からの除去によって治療用タンパク質の発現の増加をもたらし得るか、あるいはその生成によって治療用タンパク質の発現の低下をもたらす任意のエレメントを指す。ネガティブエレメントには、サイレンサー、ネガティブレギュレーター(例えば、転写レプレッサー)のDNA結合部位、転写休止部位、又はmRNA二次もしくは三次構造を伝達もしくは変更することに関与する配列が含まれる。一般に、ネガティブエレメントは、ポジティブエレメントよりも高い頻度で出現する。従って、タンパク質発現の増加をもたらすコドン使用頻度の変化は、ポジティブエレメントの生成によるよりもむしろネガティブエレメントの破壊から生じる可能性が高い。さらに、候補配列の改変は、ポジティブエレメントを生成するよりもポジティブエレメントを破壊する可能性が高い。一実施形態では、候補配列は、治療用タンパク質の生産を増大させるように選択及び変更される。この候補配列は、例えば、該候補配列中のコドンを連続的に改変することによるか又はそのコドンをランダムに改変することにより変更することができる。その後、得られた治療用タンパク質の発現のレベルを決定することによるか、又は別のパラメータ、例えば、発現のレベルと相関のあるパラメータを評価することにより、変更された候補配列を評価する。非改変候補配列と比較して増加したレベルの治療用タンパク質を生産する候補配列を選択する。
【0029】
別のアプローチでは、1又は一群のコドンを、例えば、タンパク質又はメッセージ構造に関係なく変更することができ、試験することができる。あるいは、1又はそれ以上のコドンを、メッセージレベルの特性、例えば、所定の(例えば、高もしくは低GC含量の)領域内の位置、エンハンサーもしくはサイレンサーなどの構造を有する領域内の位置、エンハンサーもしくはサイレンサーなどの構造を導入するように変更することのできる領域内の位置、二次もしくは三次構造(例えば、鎖内対合、鎖間対合)を有するか、もしくは有すると予測される領域内の位置、二次もしくは三次構造(例えば、鎖内もしくは鎖間対合)を欠いているか、もしくは欠いていると予測される領域内の位置で選択することができる。特定の変更領域が所望の結果をもたらすならば、その領域が選択される。
【0030】
候補配列を系統的に作成する方法が有用である。例えば、1又は一群の、例えば、隣接ブロックのコドンを、合成核酸配列の様々な位置で、共通コドンを用いて(又は例えば、開始配列が最適化されているならば非共通コドンを用いて)変更することができ、得られた配列を評価することができる。候補は、第1の候補を作成するために前記配列内の所与のコドンの「ウィンドウ」を最適化(又は脱最適化)し、その後、そのウィンドウを前記配列内の新たな位置に移動させ、そして第2の候補を提供するためにそのウィンドウ下でその新たな位置のコドンを最適化(又は脱最適化)することにより作成することができる。候補は、それらがもたらす発現のレベルを決定することによるか、又は別のパラメータ、例えば、発現のレベルと相関のあるパラメータを評価することにより、評価することができる。一部のパラメータは、検査によるか又はコンピュータによって、例えば、それらの高もしくは低GC含量;配列エレメント例えばエンハンサーもしくはサイレンサー;二次もしくは三次構造、例えば、鎖内もしくは鎖間対合(inter-chain paring)の有無を評価することができる。
【0031】
特定の実施形態では、前記最適化された核酸配列は、そのタンパク質を、最適化を受けていない核酸配列によって発現されるものの少なくとも110%、150%、200%、500%、1,000%、5,000%あるいは10,000%のレベルでさえ発現することができる。
【0032】
図1に例示されるように、最適化プロセスは、前記宿主に異種発現させる所望のアミノ酸配列を同定することから始めることができる。このアミノ酸配列から候補ポリヌクレオチド又はDNA配列を設計することができる。この合成DNA配列の設計中に、コドン使用頻度を前記宿主発現生物のコドン使用頻度と比較することができ、この合成配列においてレアな宿主コドンを変更することができる。加えて、この合成候補DNA配列は、望ましくない酵素制限部位を除去し、任意の所望のシグナル配列、リンカー又は非翻訳領域を追加又は改変するように変更することができる。この合成DNA配列は、翻訳プロセスに干渉する可能性のある二次構造、例えばG/Cリピート及びステムループ構造の存在について解析することができる。候補DNA配列を合成する前に、最適化された配列の設計をチェックしてこの配列が所望のアミノ酸配列を正確にコードすることを確認することができる。最後に、この候補DNA配列を、DNA合成技術、例えば当分野で公知のものを用いて合成することができる。
【0033】
本発明の別の実施形態では、宿主生物、例えばシュードモナス・フルオレセンスにおける一般的なコドン使用頻度を利用して、異種ポリヌクレオチド配列の発現を最適化することができる。前記宿主発現系において特定のアミノ酸について好ましいと考えられることがほぼないと思われるコドンの割合及び分布を評価することができる。5%及び10%使用頻度の値を、レアコドンの判定のためのカットオフ値として用いることができる。例えば、表1に列挙したコドンは、シュードモナス・フルオレセンスMB214ゲノム中に5%未満の理論出現を有し、シュードモナス・フルオレセンス宿主において発現される最適化遺伝子では一般に回避される。
【表1】

【0034】
所望の異種遺伝子産物の発現には種々の宿主細胞を用いることができる。宿主細胞は、大腸菌細胞又はシュードモナス属(Psuedomonas)細胞の適当な集団から選択することができる。本明細書におけるシュードモナス属細菌(Pseudomonads)及び近縁の細菌は、本明細書において「グラム(−)プロテオバクテリアサブグループ1」として定義される群と同延である。「グラム(−)プロテオバクテリアサブグループ1」は、より具体的には、R. E. Buchanan and N. E. Gibbons (eds.), Bergey's Manual of Determinative Bacteriology, pp. 217-289 (8th ed., 1974) (The Williams & Wilkins Co., Baltimore, Md., USA)(以下「Bergey(1974)」)によって「グラム陰性好気性桿菌及び球菌」と名付けられた分類学的「要素(Part)」の範囲内に入るとされている科及び/又は属に属しているプロテオバクテリアの群として定義される。前記宿主細胞は、シュードモナス・フルオレセンス種の全ての亜種、変種、株、及びその他の下位専門特殊群の群として定義されるグラム陰性プロテオバクテリアサブグループ18から選択することができ、それには例えば、以下に属しているもの(例示的な株のATCC番号又はその他の寄託番号を括弧内に示す)が挙げられる。P.フルオレセンスバイオタイプA、次亜種1又は次亜種Iとも呼ばれる(ATCC13525);P.フルオレセンスバイオタイプB、次亜種2又は次亜種IIとも呼ばれる(ATCC17816);P.フルオレセンスバイオタイプC、次亜種3又は次亜種IIIとも呼ばれる(ATCC17400);P.フルオレセンスバイオタイプF、次亜種4又は次亜種IVとも呼ばれる(ATCC12983);P.フルオレセンスバイオタイプG、次亜種5又は次亜種Vとも呼ばれる(ATCC17518);P.フルオレセンス次亜種VI;P.フルオレセンスPf0−1;P.フルオレセンスPf−5(ATCC BAA−477);P.フルオレセンスSBW25;並びにP.フルオレセンス亜種セルローサ(P. fluorescens subsp. cellulosa)(NCIMB10462)。
【0035】
宿主細胞は、P.フルオレセンスバイオタイプAの全ての株の群として定義されるグラム陰性プロテオバクテリアサブグループ19から選択することができ、それにはP.フルオレセンス株MB101、及びその変異体(derivatives)が挙げられる。
【0036】
一実施形態では、宿主細胞は、シュードモナス目(order Pseudomonadales)のプロテオバクテリアのいずれかであり得る。特定の実施形態では、前記宿主細胞は、シュードモナス科(family Pseudomonadaceae)のプロテオバクテリアのいずれかであり得る。特定の実施形態では、前記宿主細胞は、以下の1又はそれ以上から選択することができる。グラム陰性プロテオバクテリアサブグループ1、2、3、5、7、12、15、17、18又は19。
【0037】
本発明において使用することのできるさらなるP.フルオレセンス株としては、以下のATCC名称を有するP.フルオレセンスミグラ(P. fluorescens Migula)及びP.フルオレセンスロイトキトック(P. fluorescens Loitokitok)が挙げられる。[NCIB 8286];NRRL B−1244;NCIB 8865株 COI;NCIB 8866株CO2;1291[ATCC 17458;IFO 15837;NCIB 8917;LA;NRRL B−1864;ピロリジン;PW2[ICMP 3966;NCPPB 967;NRRL B−899];13475;NCTC 10038;NRRL B−1603[6;IFO 15840];52−1C;CCEB 488−A[BU 140];CCEB 553[IEM 15/47];IAM 1008[AHH−27];IAM 1055[AHH−23];1[IFO 15842];12[ATCC 25323;NIH 11;den Dooren de Jong 216];18[IFO 15833;WRRL P−7];93[TR−10];108[52−22;IFO 15832];143[IFO 15836;PL];149[2−40−40;IFO 15838];182[IFO 3081;PJ 73];184[IFO 15830];185[W2 L−1];186[IFO 15829;PJ 79];187[NCPPB 263];188[NCPPB 316];189[PJ227;1208];191[IFO 15834;PJ 236;22/1];194[Klinge R−60;PJ 253];196[PJ 288];197[PJ 290];198[PJ 302];201[PJ 368];202[PJ 372];203[PJ 376];204[IFO 15835;PJ 682];205[PJ686];206[PJ 692];207[PJ 693];208[PJ 722];212[PJ 832];215[PJ 849];216[PJ885];267[B−9];271[B−1612];401[C71A;IFO 15831;PJ 187];NRRL B−3178[4;IFO 15841];KY8521;3081;30−21;[IFO 3081];N;PYR;PW;D946−B83[BU 2183;FERM−P 3328];P−2563[FERM−P 2894;IFO 13658];IAM−1126[43F];M−1;A506[A5−06];A505[A5−05−1];A526[A5−26];B69;72;NRRL B4290;PMW6[NCIB 11615];SC 12936;A1[IFO 15839];F 1847[CDC−EB];F 1848[CDC 93];NCIB 10586;P17;F−12;AmMS 257;PRA25;6133D02;6519E01;Ni;SC15208;BNL−WVC;NCTC 2583[NCIB 8194];H13;1013[ATCC 11251;CCEB 295];IFO 3903;1062;又はPf−5。
【0038】
シュードモナス属宿主細胞のベクターでの形質転換は、当分野で公知の任意の形質転換法を用いて行ってよく、該細菌宿主細胞は無傷細胞として又はプロトプラスト(すなわち細胞質体など)として形質転換されてよい。形質転換法には、ポレーション法、例えば、エレクトロポレーション、プロトプラスト融合、細菌接合、及び二価陽イオン処理、例えば、塩化カルシウム処理もしくはCaCl/Mg2+処理、又はその他の当分野で周知の方法が挙げられる。例えば、Morrison, J. Bact, 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology, 101:347-362 (Wu et al., eds, 1983)、Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 及びCurrent Protocols in Molecular Biology (Ausubel et al., eds., 1994))参照。
【0039】
本明細書において、用語「発酵(fermentation)」には、文字通りの発酵が用いられる実施形態と他の非発酵性培養形式が用いられる実施形態の両方が含まれる。発酵は任意の規模で行ってよい。本発明の実施形態では、発酵培地は、富栄養培地、最少培地、及び無機塩培地の中から選択することができ;富栄養培地も使用することができる。別の実施形態では、最少培地又は無機塩培地のいずれかが選択される。さらに別の実施形態では、最少培地が選択される。さらに別の実施形態では、無機塩培地が選択される。無機塩培地が一般に使用される。
【0040】
無機塩培地は、無機塩及び炭素源、例えば、グルコース、スクロース、又はグリセロールなどからなる。無機塩培地の例としては、例えば、M9培地、シュードモナス属用培地(ATCC179)、Davis and Mingioli培地(BD Davis & ES Mingioli (1950) in J. Bact. 60: 17-28参照)が挙げられる。無機塩培地を作製するために使用される無機塩には、例えば、カリウムホスフェート、アンモニウムスルフェート又はクロライド、マグネシウムスルフェート又はクロライド、並びに微量無機物、例えばカルシウムクロライド、ボレート、及び鉄、銅、マンガン、及び亜鉛のスルフェートの中から選択されるものが挙げられる。無機塩培地には、有機窒素源、例えばペプトン、トリプトン、アミノ酸、又は酵母抽出物は含まれない。その代わりに、無機窒素源を用い、この無機窒素源は、例えば、アンモニウム塩、アンモニア水、及び気体アンモニアの中から選択してよい。無機塩培地は、炭素源としてグルコースを含有してよい。無機塩培地と比較して、最少培地もまた、無機塩及び炭素源を含有する場合があるが、例えば、低レベルのアミノ酸、ビタミン、ペプトン、又はその他の成分を補給することができ、しかし、これらは極めて最低限のレベルで加えられる。
【0041】
一実施形態では、培地は、以下に列挙する様々な成分を用いて調製することができる。それらの成分は以下の順序で加えることができる。まず(NH)HPO、KHPO及びクエン酸をおよそ30リットルの蒸留水に溶かし;次いで、微量元素の溶液を加え、続いて、消泡剤、例えばUcolub N 115を加えることができる。さらに、加熱滅菌(例えばおよそ121℃にて)後、グルコース MgSO及びチアミン−HCLの滅菌溶液を加えることができる。およそ6.8でのpHの制御は、アンモニア水を用いて行うことができる。さらに、最初の量を371−グリセロールストック(123mL)に調整するために滅菌蒸留水を加えることができる。化学薬品は様々な供給業者、例えばMerckから市販されている。この培地は、シュードモナス属種及び関連細菌の増殖のための高細胞密度培養(HCDC)を可能にすることができる。HCDCは、バッチプロセスとして開始することができ、続いて、二相フェドバッチ培養を行う。バッチ部分での無制限増殖後、バイオマス濃度が数倍高まり得る3倍加時間の間に低下した特定の増殖速度で増殖を制御することができる。このような培養手順の詳細は、Riesenberg, D.; Schulz, V.; Knorre, W. A.; Pohl, H. D.; Korz, D.; Sanders, E. A.; Ross, A.; Deckwer, W. D. (1991) 「High cell density cultivation of Escherichia coli, at controlled specific growth rate」 J Biotechnol: 20(1) 17-27に記載されている。TABLE−US−00005 表5 培地組成成分開始濃度 KHPO13.3gl−1 (NHHPO 4.0gl−1 クエン酸 1.7gl−1 MgSO−7HO 1.2gl−1 微量金属溶液 10mll−1 チアミンHCl 4.5mgl−1 グルコース−HO 27.3gl−1 消泡剤 Ucolub N115 0.1mll−1 供給溶液 MgSO−7HO 19.7gl−1 グルコース−HO 770gl−1 NH 23g 微量金属溶液 6gl−1 Fe(111)シトレート 1.5gl−1 MnCl−4HO 0.8gl−1 ZmCHCOOl−2HO 0.3gl−1BO0.25gl−1 NaMoO−2H0 0.25gl−1 CoCl 6HO 0.15gl−1 CuCl 2HO 0.84gl−1 エチレンジアミン四酢酸(ethylenediamine tetracetic acid)Na塩 2HO(Titriplex III,Merck)。
【0042】
本出願において列挙した配列は相同(homologous)(類似した同一性(similar identity)を有する)であってよい。タンパク質及び/又はタンパク質配列は、それらが共通の祖先タンパク質又はタンパク質配列から自然に又は人為的に誘導される場合に「相同」である。同様に、核酸及び/又は核酸配列は、それらが共通の祖先核酸又は核酸配列から自然に又は人為的に誘導される場合に「相同」である。例えば、任意の天然に出現する核酸は、1又はそれ以上の選択コドンを含むように任意の利用可能な突然変異誘発法によって変更することができる。このように突然変異誘発した核酸は、発現させると、1又はそれ以上の非天然アミノ酸を含むポリペプチドをコードする。この突然変異プロセスは、当然、1又はそれ以上の標準コドンをさらに改変することができ、それによって得られた変異タンパク質中の1又はそれ以上の標準アミノ酸も変える。相同性は、一般に、2又はそれ以上の核酸又はタンパク質(もしくはその配列)間の配列類似性から推論される。相同性を確立する際に有用な配列間の類似性の正確な百分率は、問題の核酸及びタンパク質によって異なるが、相同性を確立するために日常的に使用されるのは、25%程度の配列類似性である。より高いレベルの配列類似性、例えば、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%もしくは99%又はそれ以上も相同性を確立するのに使用することができる。配列類似性百分率を決定するための方法(例えば、デフォルトパラメータを用いるBLASTP及びBLASTN)については本明細書に記載され、一般に利用可能である。
【0043】
ポリペプチドには、そのタンパク質のN末端に、翻訳時に又は翻訳後にそのタンパク質の転移を指示するシグナル(又はリーダー)配列を含んでよい。このポリペプチドはまた、このポリペプチドの合成、精製又は同定を容易にするためにリンカー又は他の配列とコンジュゲートするか(例えば、ポリ−His)、あるいはこのポリペプチドの固相支持体との結合を強化するためにコンジュゲートしてもよい。
【0044】
ポリペプチド配列を比較するとき、以下に記載されるように、最大の対応が得られるように整列させた場合に2配列中のアミノ酸の配列が同一である場合には、その2配列は「同一である」と言われる。2配列間の比較は、典型的に、比較ウィンドウ上でそれらの配列を比較して、配列類似性の局所領域を同定し、比較することにより行う。本明細書において「比較ウィンドウ」とは、少なくとも約20、通常は30〜約75、40〜約50の隣接する位置のセグメントを指し、ここで、これらの2配列を最適に整列させた後に、ある配列を同じ数の隣接する位置の参照配列とを比較することができる。
【0045】
比較のための配列の最適なアラインメントは、Lasergene suite of bioinformatics software(DNASTAR,Inc.,Madison,Wis.)のMegalignプログラムを使用して、デフォルトパラメータを用いて行ってよい。このプログラムには以下の参照文献に記載されているいくつかのアラインメントスキームが統合されている。Dayhoff, M. O. (1978) A model of evolutionary change in proteins - Matrices for detecting distant relationships。Dayhoff, M. O. (ed.) Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, Washington D.C. Vol. 5, Suppl. 3, pp. 345 358; Hein J. (1990) Unified Approach to Alignment and Phylogenes pp. 626 645 Methods in Enzymology vol. 183, Academic Press, Inc., San Diego, Calif.; Higgins, D. G. and Sharp, P. M. (1989) CABIOS 5:151 153; Myers, E. W. and Muller W. (1988) CABIOS 4:11 17; Robinson, E. D. (1971) Comb. Theor 11:105; Santou, N. Nes, M. (1987) Mol. Biol. Evol. 4:406 425; Sneath, P. H. A. and Sokal, R. R. (1973) Numerical Taxonomy -- the Principles and Practice of Numerical Taxonomy, Freeman Press, San Francisco, Calif.; Wilbur, W. J. and Lipman, D. J. (1983) Proc. Natl. Acad., Sci. USA 80:726 730。
【0046】
また、比較のための配列の最適なアラインメントは、Smith and Waterman (1981) Add. APL. Math 2:482の局所同一性アルゴリズムにより、Needleman and Wunsch (1970) J. Mol. Biol. 48:443の同一性アラインメントアルゴリズムにより、Pearson and Lipman (1988) Proc. Natl. Acad. Sci. USA 85: 2444の類似性検索法により、これらのアルゴリズムのコンピュータによる実施により(Wisconsin Genetics Software Package,Genetics Computer Group (GCG),575 Science Dr.,Madison,Wis.のGAP、BESTFIT、BLAST、FASTA、及びTFASTA)、又は検査により行ってよい。
【0047】
配列同一性及び配列類似性百分率を決定するために適し得るアルゴリズムの一例は、BLAST及びBLAST 2.0アルゴリズムであり、これらはそれぞれAltschul et al. (1977) Nucl. Acids Res. 25:3389 3402及びAltschul et al. (1990) J. Mol. Biol. 215:403 410に記載されている。例えば本明細書に記載のパラメータを用いてBLAST及びBLAST 2.0を使用して、本発明のポリヌクレオチド及びポリペプチドの配列同一性百分率を決定することができる。BLAST解析を行うためのソフトウェアは、国立バイオテクノロジー情報センター(National Center for Biotechnology Information)で公的に入手可能である。アミノ酸配列の場合、スコア行列を用いて、累積スコアを計算することができる。各方向のワードヒットの延長は、累積アラインメントスコアがその最大達成値から数量Xだけ低下したか;1又はそれ以上の、負のスコアの残基アラインメントの蓄積のために、累積スコアがゼロ又はそれ未満になったか;あるいはどちらかの配列の末端に達したときに停止する。BLASTアルゴリズムパラメータW、T及びXはアラインメントの感度及び速度を決定する。
【0048】
一アプローチでは、「配列同一性の百分率」は、少なくとも20の位置の比較ウィンドウ上で最適に整列させた2配列を比較することにより決定されるが、この場合、これらの2配列の最適なアラインメントのために、比較ウィンドウ内のポリペプチド配列の一部に、参照配列(この参照配列は付加又は欠失を含まない)と比較して、20%又はそれ以下、通常は5〜15%、又は10〜12%の付加又は欠失(すなわちギャップ)を含んでよい。この百分率は、両方の配列中に同一のアミノ酸残基が存在する位置の数を決定して、マッチした位置の数を得、このマッチした位置の数を参照配列中の位置の総数(すなわち比較ウィンドウサイズ)で割り、この結果に100を掛けて、配列同一性の百分率を得ることにより計算する。
【0049】
他の例証となる実施形態において、コドン最適化配列には、本明細書に記載の複数のポリペプチドを含むか、又は本明細書に記載の少なくとも1つのポリペプチド及び無関係の配列、例えば公知の腫瘍タンパク質を含む融合ポリペプチドであってよいポリペプチドが含まれ得る。融合パートナーは、例えば、Tヘルパーエピトープ(免疫学的融合パートナー)、好ましくは、ヒトによって認識されるTヘルパーエピトープを提供する手助けをするか、又はタンパク質(発現エンハンサー)を天然組換えタンパク質よりも高い収量で発現させる手助けをすることができる。特定の好ましい融合パートナーは、免疫学的融合パートナーでも発現促進融合パートナーでもある。他の融合パートナーは、ポリペプチドの溶解度を高めるように、又はポリペプチドが所望の細胞内コンパートメントを標的にすることができるように選択してよい。さらにまた、融合パートナーには、ポリペプチドの精製を容易にする親和性タグ(affinity tags)が含まれる。
【0050】
融合ポリペプチドは、一般に、化学的コンジュゲーションを含む標準的な技術を用いて調製してよい。融合ポリペプチドは、組換えポリペプチドとして発現させ、発現系において、非融合ポリペプチドと比べて、増加したレベルの生産が可能であることが好ましい。簡潔には、ポリペプチド成分をコードする核酸配列を別々に構築し、適当な発現ベクターに連結してよい。1つのポリペプチド成分をコードするDNA配列の3’末端を、ペプチドリンカーを用いて又は用いずに、第2のポリペプチド成分をコードするDNA配列の5’末端に連結し、それらの配列のリーディングフレームが同相であるようにする。これにより、両方の成分ポリペプチドの生物活性を保持する単一融合ポリペプチドへの翻訳が可能である。
【0051】
ペプチドリンカー配列を用いて、第1及び第2のポリペプチド成分を、それぞれのポリペプチドが確実にその二次及び三次構造に折り畳むために十分な距離で分離することができる。そのようなペプチドリンカー配列は、当分野で周知の標準的な技術を用いて融合ポリペプチドに組み込まれる。適したペプチドリンカー配列は、次の要因に基づいて選択してよい。(1)それらが柔軟な伸長型コンホメーションをとれること;(2)それらが第1及び第2のポリペプチド上の機能エピトープと相互作用することのできる二次構造をとれないこと;並びに(3)そのポリペプチド機能エピトープと反応するかもしれない疎水性残基又は荷電残基がないこと。好ましいペプチドリンカー配列はGly、Asn及びSer残基を含む。他の中性に近いアミノ酸、例えばThr及びAlaもまたリンカー配列に用いてよい。リンカーとして通常用いてよいアミノ酸配列には、Maratea et al., Gene 40:39 46, 1985; Murphy et al., Proc. Natl. Acad. Sci. USA 83:8258 8262, 1986;米国特許第4,935,233号及び米国特許第4,751,180号に開示されているものが挙げられる。リンカー配列は、一般に、1〜約50アミノ酸長であってよい。リンカー配列は、第1及び第2のポリペプチドが、機能ドメインを分離し、立体障害を防止するために使用することができる非必須N末端アミノ酸領域を有する場合には、必要ではない。
【0052】
連結されたDNA配列は適した転写又は翻訳調節エレメントに機能可能に連結されている。DNAの発現に関与する調節エレメントは、第1のポリペプチドをコードするDNA配列の5’にのみ位置している。同様に、翻訳及び転写終結シグナルを終わらせるために必要な停止コドンは、第2のポリペプチドをコードするDNA配列の3’にのみ存在している。
【0053】
本発明はまた、データベースと、生の配列からコドン使用頻度を計算し、翻訳されたDNA配列に沿ってレアコドンの位置を、図表を用いて報告するためのツールとを用いる、遺伝子の自動連続解析及びレポート作成も提供する。このプロセスを補助するために、解析及びレポート作成が自動的に完了し、研究者によって費やされる必要時間を削減するいくつかの新規ツールが開発されている。
【0054】
プロジェクト設計の初期段階では、タンパク質のコード配列を評価して遺伝子の全て又は一部の最適化が望ましいかどうかを判定することができる。この判定を行うための絶対基準はないが、一戦略は、宿主発現系において特定のアミノ酸に好ましいと考えられることがほぼないと思われるコドンの割合及び分布の評価を伴う。5%及び10%使用頻度の値は、レアコドンの判定のためのカットオフ値として一般に使用される。例えば、表1に列挙したコドンは、MB214ゲノム中に5%未満の出現計算値(calculated occurrence)を有し、その宿主において発現される最適化遺伝子では優先的に回避される。最適化を行わずに目的の遺伝子が異種発現されるかどうかを確かめるために、その遺伝子中に何パーセントのレアコドンが存在しているか、さらにそれらのレアコドンが発現に有害な影響を与え得る位置に存在するかどうか(すなわちその遺伝子の5’末端近くに又はクラスターに集中している)を判定することができる。
【0055】
これらの問題に取り組むために、本発明のツールは、生のORF配列からコドン使用頻度を計算し、翻訳されたDNA配列に沿ってレアコドンの位置を、図表を用いて報告するように設計されている。加えて、サブミットした遺伝子のコドン使用頻度をMB214参照コドン選択のものと比較するために、色分けされた表も示すことができる。移植性を可能にし、任意の特定の基礎バイオインフォマティクスパッケージへの依存を取り除き、使いやすさを提供するために、新規ツールを完全にPerlプログラミング言語でのCGIプログラムとして作成することができ、ウェブブラウザーを介したフォームとしてアクセスすることができる。
【0056】
使用に際し、フォーマットされていないヌクレオチド配列をフォームにペーストし、サブミットし、フォーマットしたレポートが返される。サンプル結果を図2及び図3、並びに表2に示す。
【表2】


表2はコドン頻度表を表し、各アミノ酸/コドンの組を列挙している。i)MB214中のコドンの頻度百分率、ii)解析した遺伝子中のコドンの頻度百分率、及びiii)解析した遺伝子とMB214における使用頻度の差百分率。強調表示は、MB214中のコドン使用頻度が10%未満であることを示す。遺伝子使用頻度欄の「0.00」値の強調表示は、解析した配列では使用されていないレアコドンを示す。
【0057】
図2及び図3は、翻訳されたタンパク質配列に沿ったレアコドンの位置及び分布を示すレアコドン使用頻度プロフィールの結果を例示する。図2及び図3それぞれにおいて、強調表示したコドンは、P.フルオレセンス株MB214中5%未満及び10%未満の頻度に関して表す。図2及び図3それぞれにおいて、5%又は10%使用頻度を下回るコドンの全体の割合と絶対数も翻訳された配列の後に示す。
【0058】
データベースと、最適化された遺伝子の解析のためのツールも提供される。一度、遺伝子を解析し、最適化された遺伝子の合成バージョンが保証されることが判断されると、1又はそれ以上の遺伝子の合成バージョンを設計することができる。得られる遺伝子設計候補は、それぞれ合成の前に解析されて、全ての設計基準の順守を確保することができる。サブミットした遺伝子、関連設計基準、及び解析する得られる合成候補バージョンを追跡するために、この情報を保存するためのリレーショナルデータベースが提供される。
【0059】
Linux環境において既存Perlコードで機能させるために、本発明の特定の実施形態では、PostgreSQLをリレーショナルデータベースとして選択した。データは、例えば、PerlのDBIモジュールを用いて、作成したデータベースに入力し、そのデータベースから抽出することができる。データベーススキーマは、合成転写ユニットに含まれるエレメント(例えば、タンパク質配列、リーダー配列、及びUTR配列)の選択に柔軟性を持たせるように設計することができる。発現ベクター及び宿主は、ベクター多重クローニング部位及び宿主コドン選択と合成遺伝子の適合性を確保するように定義することができる。最終配列において回避されるべきモチーフも定義することができ、各遺伝子の候補合成バージョンを保存することができる。遺伝子データベースのデータベーススキーマの代表的な実施形態が図4に例示され、実際のデータベースでのファイル名を下枠内に表している。
【0060】
SQLの専門知識を必要とせずにデータベースへのデータ入力を容易にするために、本発明の特定の実施形態では、CGIによって作成されたHTMLフォームからなるユーザーインターフェースを開発した。このユーザーインターフェースはまた、全ての入力値が有効であることを確認するエラーチェック層も提供することができる。
【0061】
新規遺伝子の入力には、CGIによって作成されたHTMLフォームを完成させ、SUBMITボタンを押すことが必要である。値は、テキストボックス内のフォームに自由に入力してもよいし、予め設定されたプルダウン及びチェックボックスメニューから選択してもよい。これらのメニューは、データベースで現在利用可能な値から自動的に作成することができる。新規な値は、それぞれのハイパーリンクを「追加する」をクリックすることによってそれぞれのメニューに追加することができ、それによりそのデータ入力に特有の新規HTMLフォームが生じる。サブミッションの結果、エラーが検出される場合、ユーザーはそのフォームに戻り、行わなければならない必要な訂正箇所を説明しているメッセージを受けることができる。フォーム上では、エラーに関連する値だけを修正又は再入力できるように、前に入力した全ての値を保存することができる。
【0062】
新規遺伝子の入力後、外部ベンダーから候補遺伝子/転写ユニットの設計及び合成について見積もり(quote)を要求することができる。本プロセスは、ベンダーのウェブサイトページに情報を入力することによって開始することができる。本プロセスを容易にし、データ入力エラーを防ぐために、データベースから直接必要なデータを必要な形式へ準備することを可能にするツールを提供することができる。このツールは、該ページをロードした時にデータベースで利用可能な全ての遺伝子からなる自動作成されたプルダウンメニューから遺伝子名を選択することによって、ユーザーが見積もりに必要な情報を作成できるようにする。一度、遺伝子を選択すると、SUBMITボタンをクリックすることにより、ベンダーの見積もりリクエストフォームに直接ペーストすることができる3つのフィールドを含むフォームが作成される。また、このページへのハイパーリンクも提供され得る。
【0063】
遺伝子コードの冗長性に起因して、合成遺伝子候補について作成することのできる多数の異なるコード配列が存在する。ベンダーは、研究者が要件設計基準に最も近いバージョンを選択できるように、典型的に、各遺伝子について多数の候補合成バージョンを提供する。これらの配列は、ウェブを使って、データベースに追加し、各遺伝子サブミッションと関連付けることができる。次に、遺伝子名を、自動作成されたプルダウンメニューから選択することができ、バージョン番号、配列、及び任意の記述コメントを入力することができる。一度提示(サブミット, submitted)すると、自動解析パイプラインを実施して、データベース中のどのサブミットバージョンが合成に最適であるかを判定することができる。
【0064】
プログラム(例えば、Perlプログラム)を含めることによって、データベースに提示(サブミット)する際の設計基準の順守を確保するために各候補合成バージョンを評価するプロセスを自動化することができる。それぞれの合成遺伝子バージョンは、関連設計仕様とともにデータベースから抽出することができ、一連の解析にかけることができる。これらの解析には以下の1又はそれ以上が含まれ得る。
1)GCG(Accelrys Software, Inc., San Diego, CAから入手可能)CODONFREQUENCYは、合成バージョンのコドン使用頻度を決定するために実施することができる。出力ファイルを解析し、各遺伝子についてデータベースに保存されているカットオフ百分率値によって定義される任意のレアコドンの存在を検出することができる;
2)GCG MAPSORTは、将来のサブクローニングに干渉し得る任意の望ましくない制限酵素の存在を決定するために実施することができる。評価した制限酵素のリストを、酵素、発現ベクター、及び遺伝子間の関係により、データベースから抽出することができる。出力ファイルを解析して、酵素のリストから任意の制限部位の存在を検出することができる;
3)GCG FINDPATTERNSは、合成バージョンにおいて回避されるべき任意の配列モチーフの存在を検出するために実施することができる。各パターンを、データベース中でその特定パターンについての許容ミスマッチ数とともに定義することができる。出力ファイルを解析して、定義された有害な配列モチーフのいずれかの存在を検出することができる;
4)プログラム(例えば、Perlプログラム)は、存在する任意のステムループ構造の強度を検出するために実施することができる。このプログラムは、配列中の推定ステムループの位置を見つけるためにGCG STEMLOOPを連続して実施し、それらのループのコーディネートを抽出した後、それらのループコーディネートを、ループ構造の自由エネルギーを決定するためにGCG MFOLDにかけることができる。出力結果は、自由エネルギーによってソートすることができ、5つの最強ループのデータを抽出することができる。加えて、比較目的で最強ループの自由エネルギーを報告することができる;さらに
5)GCG BESTFITは、エラーによって突然変異が導入されていないことを確実にするために、天然及び合成DNA配列のペプチド翻訳を比較するために実施することができる。翻訳配列は、GCG TRANSLATEによって作成することができる。出力結果を解析し、報告することができる。
【0065】
レポートは、ウェブブラウザー又はMicrosoft Wordで閲覧又は印刷するために、HTML形式で作成することができる。このレポートには、解析結果の概略レポートを表の形式で含むことができる。例えば、表3に例示されるように、1列を各合成バージョンに充て、1行を各解析に充てることができる。
【表3】

【0066】
このように、研究者はそれぞれのバージョンの結果を比較し、合成に最も適したバージョンを選択することができる。解析により設計基準を満たすバージョンがないことが示されれば、さらなるバージョンを要求することができ、好適なバージョンが得られるまで解析を繰り返すことができる。このレポートには、文書化目的で各解析の生データも含むことができる。それぞれの遺伝子バージョンのデータは、行った解析により照会することができ、読み取りやすくするために、出力データの関連部分を強調表示することができる。
【0067】
以下の実施例により本発明をより詳細に説明する。これらの実施例は本発明を例示するものであり、本発明を限定するものと解釈されるべきではない。
【実施例】
【0068】
実施例1
P.フルオレセンスからの合成遺伝子の設計
最適なシャイン・ダルガーノ配列と特異SpeI制限酵素部位を含有するDNA領域をコード配列の上流に付加した。3つの停止コドンと特異XhoI制限酵素部位を含有するDNA領域をコード配列の下流に付加した。Pfenex ORFome中5%未満のコドン使用頻度で出現する全てのレアコドンを、リボソームの失速を回避するように変更した。2又はそれ以下のミスマッチを有するパターンaggaggtn5−10dtgにマッチした全ての遺伝子内リボソーム結合部位を、末端切断型タンパク質産物を回避するように変更した。5又はそれ以上のC、あるいは5又はそれ以上のGヌクレオチドの伸展を排除して、RNAポリメラーゼスリッページを回避した。強い遺伝子内ステムループ構造、特にリボソーム結合部位を包含するものを変更した。この合成遺伝子はDNA2.0,Inc.(Menlo Park, CA)によって合成された。
【0069】
実施例2
P.フルオレセンスからの合成遺伝子の設計
最終発現タンパク質産物にはメチオニン21〜グルタミン520のアミノ酸が含まれた。Pfenex ORFome中5%未満のコドン使用頻度で出現する全てのレアコドンを、リボソームの失速を回避するように変更した。2又はそれ以下のミスマッチを有するパターンaggaggtn5−10dtgにマッチした全ての遺伝子内リボソーム結合部位を、末端切断型タンパク質産物を回避するように変更した。5又はそれ以上のC、あるいは5又はそれ以上のGヌクレオチドの伸展を排除して、RNAポリメラーゼスリッページを回避した。強い遺伝子内ステムループ構造、特にリボソーム結合部位を包含するものを変更した。24アミノ酸pbp周辺質分泌リーダーをコードするDNA配列を最適化配列の5’末端に融合した。最適シャイン・ダルガーノ配列と特異SpeI制限酵素部位を含有するDNA領域をコード配列の上流に付加した。3つの停止コドンと特異XhoI制限酵素部位を含有するDNA領域をコード配列の下流に付加した。この合成遺伝子はDNA2.0,Inc.によって合成された。
【0070】
本発明は、本明細書に記載される特定の実施形態により範囲を制限されるものではない。実際に、本明細書に記載されるものに加えて、本発明の様々な変更も前述の説明から当業者には明らかになる。このような変更は、添付の特許請求の範囲に含まれることが意図される。

【特許請求の範囲】
【請求項1】
組換えタンパク質を生産する方法であって、
宿主シュードモナス・フルオレセンス(Pseudomonas fluorescens)菌における異種発現のために、タンパク質をコードするヌクレオチド配列を含む合成ポリヌクレオチドの配列を最適化する段階と;
前記最適化された合成ポリヌクレオチド配列を発現ベクターに連結する段階と;
前記宿主シュードモナス・フルオレセンス菌を前記発現ベクターで形質転換する段階と;
前記形質転換された宿主シュードモナス・フルオレセンス菌を前記タンパク質の発現に適した好適な培地において培養する段階と;
前記タンパク質を単離する段階と
を含む、方法。
【請求項2】
前記宿主シュードモナス・フルオレセンス菌における異種発現のために前記合成ポリヌクレオチド配列を最適化する段階が、前記宿主シュードモナス・フルオレセンス菌においてほとんど使用されない、前記合成ポリヌクレオチド配列由来のレアコドンを同定及び変更する段階をさらに含む、請求項1に記載の方法。
【請求項3】
前記宿主シュードモナス・フルオレセンス菌における異種発現のために前記合成ポリヌクレオチド配列を最適化する段階が、前記合成ポリヌクレオチド配列由来の推定内部リボソーム結合部位配列を同定及び変更する段階をさらに含む、請求項2に記載の方法。
【請求項4】
前記宿主シュードモナス・フルオレセンス菌における異種発現のために前記合成ポリヌクレオチド配列を最適化する段階が、前記合成ポリヌクレオチド配列由来のG又はCヌクレオチドの伸長リピートを同定及び変更する段階をさらに含む、請求項2に記載の方法。
【請求項5】
前記宿主シュードモナス・フルオレセンス菌における異種発現のために前記合成ポリヌクレオチド配列を最適化する段階が、前記合成ポリヌクレオチド配列のRBS及び遺伝子コード領域におけるmRNA二次構造を同定及び最小化する段階をさらに含む、請求項2に記載の方法。
【請求項6】
前記宿主シュードモナス・フルオレセンス菌における異種発現のために前記合成ポリヌクレオチド配列を最適化する段階が、前記合成ポリヌクレオチド配列由来の望ましくない酵素制限部位を同定及び変更する段階をさらに含む、請求項2に記載の方法。
【請求項7】
レアコドンを同定及び変更する段階が、前記シュードモナス・フルオレセンス菌のゲノム中における出現が10%未満であるコドンを同定及び変更する段階を含む、請求項2に記載の方法。
【請求項8】
レアコドンを同定及び変更する段階が、前記シュードモナス・フルオレセンス菌のゲノム中における出現が5%未満であるコドンを同定及び変更する段階を含む、請求項2に記載の方法。
【請求項9】
異種発現のために前記合成ポリヌクレオチド配列を最適化する段階が、発現を増加させるために前記合成ポリヌクレオチド配列由来のコドンを同定及び変更する段階をさらに含む、請求項1に記載の方法。
【請求項10】
前記レアコドンを変更する段階が、前記レアコドンを高頻度で出現するコドンに置き換える段階を含む、請求項2に記載の方法。
【請求項11】
組換えタンパク質を生産する方法であって、
前記宿主シュードモナス属(Pseudomonas)細菌においてほとんど使用されない、前記合成ポリヌクレオチド配列由来のレアコドンを同定及び変更する段階と;
前記合成ポリヌクレオチド配列由来の推定内部リボソーム結合部位配列を同定及び変更する段階と;
前記合成ポリヌクレオチド配列由来のG又はCヌクレオチドの伸長リピートを同定及び変更する段階と;
前記合成ポリヌクレオチド配列のRBS及び遺伝子コード領域におけるmRNA二次構造を同定及び最小化する段階と;
最適化された合成ポリヌクレオチド配列を形成するために前記合成ポリヌクレオチド配列由来の望ましくない酵素制限部位を同定及び変更する段階と;
前記最適化された合成ポリヌクレオチド配列を発現ベクターに連結する段階と;
前記宿主シュードモナス属細菌を前記発現ベクターで形質転換する段階と;
前記形質転換された宿主シュードモナス属細菌を前記タンパク質の発現に適した好適な培地において培養する段階と;
前記タンパク質を単離する段階と
を含む、方法。
【請求項12】
前記宿主シュードモナス属細菌がシュードモナス・フルオレセンスである、請求項11に記載の方法。
【請求項13】
前記宿主シュードモナス属細菌がシュードモナス・フルオレセンス株MB101である、請求項11に記載の方法。
【請求項14】
レアコドンを同定及び変更する段階が、前記シュードモナス・フルオレセンス菌ゲノム中における出現が10%未満であるコドンを同定及び変更する段階を含む、請求項12に記載の方法。
【請求項15】
レアコドンを同定及び変更する段階が、前記シュードモナス・フルオレセンス菌ゲノム中における出現が5%未満であるコドンを同定及び変更する段階を含む、請求項12に記載の方法。
【請求項16】
最適化された遺伝子を解析する方法であって、
シュードモナス・フルオレセンス菌用の遺伝子最適化データベースを提供する段階と;
前記データベースに遺伝子データを入力する段階と;
発現ベクター又は宿主を同定する段階と;
候補遺伝子又は転写ユニットの合成リクエストを提示する段階と;
前記データベースに最適化された遺伝子配列を追加する段階と;
確実に合成リクエストが順守されるように合成された候補遺伝子の1又はそれ以上の合成バージョンを評価する段階と;
前記候補遺伝子の1又はそれ以上の合成バージョンを解析する段階と
を含む、方法。
【請求項17】
前記候補遺伝子の1又はそれ以上の合成バージョンの解析結果のレポートを作成する段階をさらに含む、請求項16に記載の方法。
【請求項18】
前記候補遺伝子の1又はそれ以上の合成バージョンを解析する段階が、候補遺伝子を検査(inspection)により又はコンピュータ(computationally)により解析する段階を含む、請求項16に記載の方法。
【請求項19】
前記候補遺伝子の1又はそれ以上の合成バージョンを解析する段階が、候補遺伝子によってもたらされる発現のレベルを解析する段階を含む、請求項16に記載の方法。
【請求項20】
前記候補遺伝子の1又はそれ以上の合成バージョンを解析する段階が、高もしくは低GC含量の有無、配列エレメント、又は前記候補遺伝子の構造を解析する段階を含む、請求項16に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2009−538622(P2009−538622A)
【公表日】平成21年11月12日(2009.11.12)
【国際特許分類】
【出願番号】特願2009−513248(P2009−513248)
【出願日】平成19年5月30日(2007.5.30)
【国際出願番号】PCT/US2007/012719
【国際公開番号】WO2007/142954
【国際公開日】平成19年12月13日(2007.12.13)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(502141050)ダウ グローバル テクノロジーズ インコーポレイティド (1,383)
【Fターム(参考)】