改善されたポリペプチド発現を達成する方法
本発明は、所与の宿主細胞中での発現のためにタンパク質コード配列を最適化する方法に関する。本方法は、遺伝的アルゴリズムを当てはめて、所定のアミノ酸配列をコードする単一コドン適合および/またはコドンペア適合配列を最適化する。アルゴリズムでは、変異体コード配列が単一コドン適合および/またはコドンペア適合の最小値に達するまで、新しい配列変異体の生成および適合変異体の引き続く選択が反復される。本発明はまた、プロセッサーおよびメモリーを含んでなるコンピューターにも関し、プロセッサーはメモリーから読み取ってそれに書き込むように構成され、メモリーは単一コドン適合および/またはコドンペア適合の最適化のための遺伝的アルゴリズムを遂行する能力をプロセッサーに提供するように構成されたデータおよび命令を含んでなる。本発明はさらに、所定のアミノ酸配列のためのコード配列を含んでなる核酸と、このような核酸を含んでなる宿主細胞と、その中でこれらの宿主細胞が使用されるポリペプチドおよびその他の発酵産物を生成する方法とに関し、コード配列は本発明の方法において、特定の宿主のために単一コドン適合および/またはコドンペア適合について最適化される。
Notice: Undefined index: DEJ in /mnt/www/gzt_disp.php on line 298
【特許請求の範囲】
【請求項1】
a)所定のアミノ酸配列をコードする少なくとも1つのオリジナルコード配列を作り出すステップと、
b)この少なくとも1つのオリジナルコード配列中で、1つ以上のコドンを同義コドンによって置換することによって、この少なくとも1つのオリジナルコード配列から少なくとも1つの新たに作り出されたコード配列を作り出すステップと、
c)所定の宿主細胞について単一コドン適合およびコドンペア適合の少なくとも1つを判定する適合関数を使用して、前記少なくとも1つのオリジナルコード配列の適合値および前記少なくとも1つの新たに作り出されたコード配列の適合値を判定するステップと、
d)前記適合値が高いほど選択される確率が高くなるような所定の選択基準に従って、前記少なくとも1つのオリジナルコード配列および前記少なくとも1つの新たに作り出されたコード配列中で、1つ以上の選択されるコード配列を選択するステップと、
e)操作b)からd)において、前記1つ以上の選択されたコード配列を1つ以上のオリジナルコード配列として処理しながら、所定の反復停止基準が満たされるまで操作b)からd)を繰り返すステップと
を含んでなる、それによって所定の宿主細胞内での発現のためにコード配列が最適化される、所定のアミノ酸配列をコードするヌクレオチドコード配列を最適化する方法。
【請求項2】
前記所定の選択基準が、前記1つ以上の選択されるコード配列が所定の基準に従って最良適合値を有するような基準である、請求項1に記載の方法。
【請求項3】
操作e)の後に、
f)前記1つ以上の選択されるコード配列中で最良の個々のコード配列を選択するステップを含んでなり、前記最良の個々のコード配列がその他の選択されたコード配列よりも良い適合値を有する、請求項1または2に記載の方法。
【請求項4】
前記所定の反復停止基準が、
(a)前記選択されたコード配列の少なくとも1つが所定の閾値を超える最良適合値を有するかどうかの試験、
(b)前記選択されたコード配列がいずれも前記所定の閾値未満の最良適合値を有さないかどうかの試験、
(c)前記選択されたコード配列の少なくとも1つが、前記オリジナルコード配列中で所定の宿主細胞について関連する正のコドンペア重みがあるコドンペアの少なくとも30%を関連する負の重みがあるコドンペアに転換するかどうかの試験、
(d)前記選択されたコード配列の少なくとも1つが、前記オリジナルコード配列中で所定の宿主細胞について0を超える関連する正の重みがあるコドンペアの少なくとも30%を0未満の関連する重みがあるコドンペアに転換するかどうかの試験
の少なくとも1つである、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
前記適合関数が、
【数1】
(式中、
gはコード配列、|g|はその長さ、g(k)はそのk番目のコドンを表し、
【数2】
はコドンc(k)の所望の比率であり、
【数3】
はヌクレオチドコード配列g中の実際の比率である)によって単一コドン適合を定義する、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記適合関数が、
【数4】
(式中、
w((c(k)、c(k+1))はコード配列g中のコドンペア重みであり、|g|は前記ヌクレオチドコード配列の長さであり、c(k)は前記コード配列中のk番目のコドンである)によってコドンペア適合を定義する、請求項1〜4のいずれか一項に記載の方法。
【請求項7】
前記適合関数が、
【数5】
(式中、
【数6】
であり、cpiは0を超える実数であり、fitcp(g)はコドンペア適合関数であり、fitsc(g)は単一コドン適合関数であり、w((c(k)、c(k+1))はコード配列g中のコドンペアの重みであり、|g|は前記コード配列の長さであり、c(k)は前記コドン配列中のk番目のコドンであり、
【数7】
は、コドンc(k)の所望の比率であり、
【数8】
はコード配列g中の実際の比率である)によって定義される、請求項1〜4のいずれか一項に記載の方法。
【請求項8】
cpiが10−4〜0.5の間である、請求項7に記載の方法。
【請求項9】
前記コドンペア重みwが、停止コドンなしの61×61コドンペアマトリックス、または停止コドンを含めた61×64コドンペアマトリックスから測定され、前記コドンペア重みwが、
(a)所定の宿主の少なくとも200個のコード配列からなる一群のヌクレオチド配列、
(b)所定の宿主が属する種の少なくとも200個のコード配列からなる一群のヌクレオチド配列、
(c)所定の宿主のゲノム配列中のタンパク質をコードするヌクレオチド配列の少なくとも5%からなる一群のヌクレオチド配列、
(d)所定の宿主の近縁の属のゲノム配列中のタンパク質をコードするヌクレオチド配列の少なくとも5%からなる一群のヌクレオチド配列
の少なくとも1つをインプットとして使用して、コンピューターベースの方法に基づいて計算される、請求項6〜8のいずれか一項に記載の方法。
【請求項10】
前記コドンペア重みwが、停止コドンとしての終結シグナルを含めた可能な61×64コドンペアの少なくとも5%、10%、20%、50%、好ましくは100%について判定される、請求項9に記載の方法。
【請求項11】
前記コドンペア重みwが、停止コドンなしの61×61コドンペアマトリックス、または停止コドンを含めた61×64コドンペアマトリックスから測定され、
前記コドンペア重みwが、
【数9】
によって定義され、総合期待値
【数10】
が、
【数11】
によって定義され、
【数12】
は全ゲノムデータセット中の単一コドン比率ckを示し、
【数13】
はそのmRNAが少なくとも細胞あたり20コピーのレベルで検出できる遺伝子である高度に発現される群中のペアの出現率(ci,cj)を示す、請求項6〜8のいずれか一項に記載の方法。
【請求項12】
所定のアミノ酸配列をコードする前記オリジナルのコーディングヌクレオチド配列が、
(a)前記所定のアミノ酸配列をコードする野生型ヌクレオチド配列、
(b)それによって所定のアミノ酸配列中のアミノ酸位置のためのコドンが、アミノ酸をコードする同義コドンから無作為に選択される、所定のアミノ酸配列の逆翻訳、
(c)それによって所定のアミノ酸配列中のアミノ酸位置のためのコドンが、所定の宿主細胞または宿主細胞の近縁種の単一コドンバイアスに従って選択される、所定のアミノ酸配列の逆翻訳
から選択される、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
前記所定の宿主細胞が、微生物、好ましくはバシラス(Bacillus)、放線菌(Actinomycetes)、エシェリキア(Escherichia)、ストレプトミセス(Streptomyces)、アスペルギルス(Aspergillus)、ペニシリウム(Penicillium)、クリヴェロミセス(Kluyveromyces)、サッカロミセス(Saccharomyces)から選択される属の微生物の細胞である、請求項1〜12のいずれか一項に記載の方法。
【請求項14】
前記所定の宿主細胞が、動物または植物細胞、好ましくはCHO、BHK、NS0、COS、Vero、PER.C6(商標)、HEK−293、ショウジョウバエ(Drosophila)S2、スポドプテラ(Spodoptera)Sf9、およびスポドプテラ(Spodoptera)Sf21から選択される細胞系の細胞である、請求項1〜12のいずれか一項に記載の方法。
【請求項15】
プロセッサーがメモリーから読み取ってメモリーに書き込むように構成され、前記メモリーが前記プロセッサーに請求項1〜14のいずれか一項に記載の方法を遂行する能力を提供するように構成されたデータおよび命令を含んでなる、プロセッサーおよびメモリーを含んでなるコンピューター。
【請求項16】
プロセッサーもまた含んでなるコンピューターのメモリー内にロードされるように構成された、データおよび命令を含んでなるコンピュータープログラム製品であって、前記プロセッサーが前記メモリーから読み取って前記メモリーに書き込むように構成され、前記データおよび命令が請求項1〜14のいずれか一項に記載の方法を遂行する能力を前記プロセッサーに提供するように構成された、コンピュータープログラム製品。
【請求項17】
請求項16に記載のコンピュータープログラム製品を備えたデータ媒体。
【請求項18】
所定のアミノ酸配列をコードするコード配列を含んでなり、コード配列が天然コード配列でなく、コード配列が所定の宿主細胞について少なくとも−0.1未満、好ましくは−0.2未満、より好ましくは−0.3未満のfitcp(g)を有する、核酸分子。
【請求項19】
所定のアミノ酸配列をコードするコード配列を含んでなり、コード配列が天然コード配列でなく、コード配列が所定の宿主細胞について少なくとも−0.1未満、好ましくは−0.2未満のfitcp(g)を有し、所定の宿主細胞について少なくとも0.1未満のfitsci(g)を有する、核酸分子。
【請求項20】
コード配列が、所定の宿主細胞内でコード配列の発現を指示できる発現制御配列と作動的に連結する、請求項18または19に記載の核酸分子。
【請求項21】
請求項20に記載の核酸分子を含んでなる宿主細胞。
【請求項22】
請求項21に記載の宿主細胞をポリペプチド発現に寄与する条件下で培養するステップと、場合によりポリペプチドを回収するステップを含んでなる、所定のアミノ酸配列を有するポリペプチドを生成する方法。
【請求項23】
請求項21に記載の宿主細胞を代謝産物の生成に寄与する条件下で培養するステップを含んでなり、それによって好ましくは所定のアミノ酸配列を有するポリペプチドが代謝産物の生成に関与する、細胞内および細胞外代謝産物の少なくとも1つを生成する方法。
【請求項1】
a)所定のアミノ酸配列をコードする少なくとも1つのオリジナルコード配列を作り出すステップと、
b)この少なくとも1つのオリジナルコード配列中で、1つ以上のコドンを同義コドンによって置換することによって、この少なくとも1つのオリジナルコード配列から少なくとも1つの新たに作り出されたコード配列を作り出すステップと、
c)所定の宿主細胞について単一コドン適合およびコドンペア適合の少なくとも1つを判定する適合関数を使用して、前記少なくとも1つのオリジナルコード配列の適合値および前記少なくとも1つの新たに作り出されたコード配列の適合値を判定するステップと、
d)前記適合値が高いほど選択される確率が高くなるような所定の選択基準に従って、前記少なくとも1つのオリジナルコード配列および前記少なくとも1つの新たに作り出されたコード配列中で、1つ以上の選択されるコード配列を選択するステップと、
e)操作b)からd)において、前記1つ以上の選択されたコード配列を1つ以上のオリジナルコード配列として処理しながら、所定の反復停止基準が満たされるまで操作b)からd)を繰り返すステップと
を含んでなる、それによって所定の宿主細胞内での発現のためにコード配列が最適化される、所定のアミノ酸配列をコードするヌクレオチドコード配列を最適化する方法。
【請求項2】
前記所定の選択基準が、前記1つ以上の選択されるコード配列が所定の基準に従って最良適合値を有するような基準である、請求項1に記載の方法。
【請求項3】
操作e)の後に、
f)前記1つ以上の選択されるコード配列中で最良の個々のコード配列を選択するステップを含んでなり、前記最良の個々のコード配列がその他の選択されたコード配列よりも良い適合値を有する、請求項1または2に記載の方法。
【請求項4】
前記所定の反復停止基準が、
(a)前記選択されたコード配列の少なくとも1つが所定の閾値を超える最良適合値を有するかどうかの試験、
(b)前記選択されたコード配列がいずれも前記所定の閾値未満の最良適合値を有さないかどうかの試験、
(c)前記選択されたコード配列の少なくとも1つが、前記オリジナルコード配列中で所定の宿主細胞について関連する正のコドンペア重みがあるコドンペアの少なくとも30%を関連する負の重みがあるコドンペアに転換するかどうかの試験、
(d)前記選択されたコード配列の少なくとも1つが、前記オリジナルコード配列中で所定の宿主細胞について0を超える関連する正の重みがあるコドンペアの少なくとも30%を0未満の関連する重みがあるコドンペアに転換するかどうかの試験
の少なくとも1つである、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
前記適合関数が、
【数1】
(式中、
gはコード配列、|g|はその長さ、g(k)はそのk番目のコドンを表し、
【数2】
はコドンc(k)の所望の比率であり、
【数3】
はヌクレオチドコード配列g中の実際の比率である)によって単一コドン適合を定義する、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記適合関数が、
【数4】
(式中、
w((c(k)、c(k+1))はコード配列g中のコドンペア重みであり、|g|は前記ヌクレオチドコード配列の長さであり、c(k)は前記コード配列中のk番目のコドンである)によってコドンペア適合を定義する、請求項1〜4のいずれか一項に記載の方法。
【請求項7】
前記適合関数が、
【数5】
(式中、
【数6】
であり、cpiは0を超える実数であり、fitcp(g)はコドンペア適合関数であり、fitsc(g)は単一コドン適合関数であり、w((c(k)、c(k+1))はコード配列g中のコドンペアの重みであり、|g|は前記コード配列の長さであり、c(k)は前記コドン配列中のk番目のコドンであり、
【数7】
は、コドンc(k)の所望の比率であり、
【数8】
はコード配列g中の実際の比率である)によって定義される、請求項1〜4のいずれか一項に記載の方法。
【請求項8】
cpiが10−4〜0.5の間である、請求項7に記載の方法。
【請求項9】
前記コドンペア重みwが、停止コドンなしの61×61コドンペアマトリックス、または停止コドンを含めた61×64コドンペアマトリックスから測定され、前記コドンペア重みwが、
(a)所定の宿主の少なくとも200個のコード配列からなる一群のヌクレオチド配列、
(b)所定の宿主が属する種の少なくとも200個のコード配列からなる一群のヌクレオチド配列、
(c)所定の宿主のゲノム配列中のタンパク質をコードするヌクレオチド配列の少なくとも5%からなる一群のヌクレオチド配列、
(d)所定の宿主の近縁の属のゲノム配列中のタンパク質をコードするヌクレオチド配列の少なくとも5%からなる一群のヌクレオチド配列
の少なくとも1つをインプットとして使用して、コンピューターベースの方法に基づいて計算される、請求項6〜8のいずれか一項に記載の方法。
【請求項10】
前記コドンペア重みwが、停止コドンとしての終結シグナルを含めた可能な61×64コドンペアの少なくとも5%、10%、20%、50%、好ましくは100%について判定される、請求項9に記載の方法。
【請求項11】
前記コドンペア重みwが、停止コドンなしの61×61コドンペアマトリックス、または停止コドンを含めた61×64コドンペアマトリックスから測定され、
前記コドンペア重みwが、
【数9】
によって定義され、総合期待値
【数10】
が、
【数11】
によって定義され、
【数12】
は全ゲノムデータセット中の単一コドン比率ckを示し、
【数13】
はそのmRNAが少なくとも細胞あたり20コピーのレベルで検出できる遺伝子である高度に発現される群中のペアの出現率(ci,cj)を示す、請求項6〜8のいずれか一項に記載の方法。
【請求項12】
所定のアミノ酸配列をコードする前記オリジナルのコーディングヌクレオチド配列が、
(a)前記所定のアミノ酸配列をコードする野生型ヌクレオチド配列、
(b)それによって所定のアミノ酸配列中のアミノ酸位置のためのコドンが、アミノ酸をコードする同義コドンから無作為に選択される、所定のアミノ酸配列の逆翻訳、
(c)それによって所定のアミノ酸配列中のアミノ酸位置のためのコドンが、所定の宿主細胞または宿主細胞の近縁種の単一コドンバイアスに従って選択される、所定のアミノ酸配列の逆翻訳
から選択される、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
前記所定の宿主細胞が、微生物、好ましくはバシラス(Bacillus)、放線菌(Actinomycetes)、エシェリキア(Escherichia)、ストレプトミセス(Streptomyces)、アスペルギルス(Aspergillus)、ペニシリウム(Penicillium)、クリヴェロミセス(Kluyveromyces)、サッカロミセス(Saccharomyces)から選択される属の微生物の細胞である、請求項1〜12のいずれか一項に記載の方法。
【請求項14】
前記所定の宿主細胞が、動物または植物細胞、好ましくはCHO、BHK、NS0、COS、Vero、PER.C6(商標)、HEK−293、ショウジョウバエ(Drosophila)S2、スポドプテラ(Spodoptera)Sf9、およびスポドプテラ(Spodoptera)Sf21から選択される細胞系の細胞である、請求項1〜12のいずれか一項に記載の方法。
【請求項15】
プロセッサーがメモリーから読み取ってメモリーに書き込むように構成され、前記メモリーが前記プロセッサーに請求項1〜14のいずれか一項に記載の方法を遂行する能力を提供するように構成されたデータおよび命令を含んでなる、プロセッサーおよびメモリーを含んでなるコンピューター。
【請求項16】
プロセッサーもまた含んでなるコンピューターのメモリー内にロードされるように構成された、データおよび命令を含んでなるコンピュータープログラム製品であって、前記プロセッサーが前記メモリーから読み取って前記メモリーに書き込むように構成され、前記データおよび命令が請求項1〜14のいずれか一項に記載の方法を遂行する能力を前記プロセッサーに提供するように構成された、コンピュータープログラム製品。
【請求項17】
請求項16に記載のコンピュータープログラム製品を備えたデータ媒体。
【請求項18】
所定のアミノ酸配列をコードするコード配列を含んでなり、コード配列が天然コード配列でなく、コード配列が所定の宿主細胞について少なくとも−0.1未満、好ましくは−0.2未満、より好ましくは−0.3未満のfitcp(g)を有する、核酸分子。
【請求項19】
所定のアミノ酸配列をコードするコード配列を含んでなり、コード配列が天然コード配列でなく、コード配列が所定の宿主細胞について少なくとも−0.1未満、好ましくは−0.2未満のfitcp(g)を有し、所定の宿主細胞について少なくとも0.1未満のfitsci(g)を有する、核酸分子。
【請求項20】
コード配列が、所定の宿主細胞内でコード配列の発現を指示できる発現制御配列と作動的に連結する、請求項18または19に記載の核酸分子。
【請求項21】
請求項20に記載の核酸分子を含んでなる宿主細胞。
【請求項22】
請求項21に記載の宿主細胞をポリペプチド発現に寄与する条件下で培養するステップと、場合によりポリペプチドを回収するステップを含んでなる、所定のアミノ酸配列を有するポリペプチドを生成する方法。
【請求項23】
請求項21に記載の宿主細胞を代謝産物の生成に寄与する条件下で培養するステップを含んでなり、それによって好ましくは所定のアミノ酸配列を有するポリペプチドが代謝産物の生成に関与する、細胞内および細胞外代謝産物の少なくとも1つを生成する方法。
【図1】
【図2】
【図3】
【図4】
【図5a】
【図5b】
【図5c】
【図5d】
【図6a】
【図6b】
【図7a】
【図7b】
【図8a】
【図8b】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15(1)】
【図15(2)】
【図16(1)】
【図16(2)】
【図17】
【図18】
【図20】
【図21】
【図22】
【図23】
【図24(1)】
【図24(2)】
【図25a】
【図25b】
【図25c】
【図26】
【図27】
【図19】
【図2】
【図3】
【図4】
【図5a】
【図5b】
【図5c】
【図5d】
【図6a】
【図6b】
【図7a】
【図7b】
【図8a】
【図8b】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15(1)】
【図15(2)】
【図16(1)】
【図16(2)】
【図17】
【図18】
【図20】
【図21】
【図22】
【図23】
【図24(1)】
【図24(2)】
【図25a】
【図25b】
【図25c】
【図26】
【図27】
【図19】
【公表番号】特表2009−540845(P2009−540845A)
【公表日】平成21年11月26日(2009.11.26)
【国際特許分類】
【出願番号】特願2009−517099(P2009−517099)
【出願日】平成19年6月15日(2007.6.15)
【国際出願番号】PCT/EP2007/055943
【国際公開番号】WO2008/000632
【国際公開日】平成20年1月3日(2008.1.3)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
2.PENTIUM
【出願人】(503220392)ディーエスエム アイピー アセッツ ビー.ブイ. (873)
【Fターム(参考)】
【公表日】平成21年11月26日(2009.11.26)
【国際特許分類】
【出願日】平成19年6月15日(2007.6.15)
【国際出願番号】PCT/EP2007/055943
【国際公開番号】WO2008/000632
【国際公開日】平成20年1月3日(2008.1.3)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
2.PENTIUM
【出願人】(503220392)ディーエスエム アイピー アセッツ ビー.ブイ. (873)
【Fターム(参考)】
[ Back to top ]