細胞代謝をモデル化する方法
【課題】現行技術水準の生物代謝の数学モデルを改良する方法及びシステムを提供すること。
【解決手段】流束均衡解析モデルを構築する工程、及びこの流束均衡解析モデルに様々な制約を適用する工程を含む、生物の細胞の代謝のイン・シリコによるモデル化又は生物情報的なモデル化のための方法及びシステムを提供する。上記の制約には、定性的運動情報の制約、定性的調節情報の制約、及び差別的DNAマイクロアレイ実験データの制約が挙げられる。さらに、代謝問題を解くためのコンピュータ計算手順も提供する。
【解決手段】流束均衡解析モデルを構築する工程、及びこの流束均衡解析モデルに様々な制約を適用する工程を含む、生物の細胞の代謝のイン・シリコによるモデル化又は生物情報的なモデル化のための方法及びシステムを提供する。上記の制約には、定性的運動情報の制約、定性的調節情報の制約、及び差別的DNAマイクロアレイ実験データの制約が挙げられる。さらに、代謝問題を解くためのコンピュータ計算手順も提供する。
【発明の詳細な説明】
【技術分野】
【0001】
優先権申し立て
本出願は、2001年1月10日に出願された仮特許出願第60/260,713号及び2001年3月23日に出願された仮特許出願第60/278,535号に対する優先権を主張する。これらの両方はその全体が参照により本明細書にインコーポレートされる。
【0002】
発明の分野
本発明は、細胞代謝のイン・シリコモデル化又は生物情報学的モデル化の方法及びシステムに関する。より具体的には、本発明は、これに限定されるわけではないが、特定の制約の組み込みによる流束均衡解析(flux balance analysis)(FBA)モデルを改良するモデル及び方法の枠組みに関する。これらの制約は、定性的運動情報、定性的調節情報、及び/又はDNA・マイクロアレイ実験データを、無制限に組み込む。さらに、本発明は特定の計算手順を用いて種々の代謝問題を解決することに関する。
【背景技術】
【0003】
配列決定された微生物遺伝子の数の急激な増加により触媒されて、代謝経路工学は近年大きな関心を集めてきた。2001年1月の時点で、50を上回る微生物のゲノムが完全に配列決定された。生物情報学的手段はそれらのコード領域の45%から80%に機能を割当ることを可能にした(非特許文献1を参照)。この新しく得られた情報は、遺伝子のノックアウト(削除)又は付加の後に代謝ネットワークの応答を計算するために微生物の数学モデルと併せて用いられる。例えば、このような情報は、代謝について工学処理された大腸菌細胞におけるエタノール生産を増大させるために用いられた(非特許文献2参照)。
【0004】
一般的に、細胞代謝の数学モデルは二つの異なる範疇に分類される。一方は運動及び調節の情報を組み込み、他方は反応経路の化学量論のみを含む。最初の部類のモデルは、本来の定常状態における細胞の挙動に適合し、次いで運動及び調節の諸関係を用いて、環境変化又は酵素工学によりもたらされる小さな摂動の存在下で該細胞がどのようにこの定常状態から外れて挙動するのかを調べる。この最初の部類の方法の重要な利点は、適用されると代謝流束空間の固有点が同定されることである。不利な点は、必要な運動パラメータを評価するのが困難であること、及び該システムが本来の定常状態からはるかに離れて動く場合それらの精度及び再現性が急速に劣化しうることである。
【0005】
第二の部類のモデルである流束均衡解析は、詳細な運動のデータ及び熱力学のデータが存在しない場合に、代謝ネットワーク情報及び細胞組成情報の化学量論的質量平衡のみを利用して該細胞に利用可能な流束分布の限界を同定する。微生物はこれらの利用できる限界を最終的に崩壊させて単一点にする極めて複雑な調節構造を進化させたが、流束均衡モデルは性能目標の上限を設定する際に、そして「理想的な」流束分布を同定する際に依然有用である。
【0006】
しかしながら、流束均衡解析の汎用性は、知らずに交差している運動又は調節の流束障壁を犠牲にして得られるものである。従って、流束均衡モデルの予測は、代謝ネットワークの性能に対する上限を与える「理想的な」流束分布として慎重に解釈されなければならない。流束均衡モデルの重要な利点は、運動のパラメータ又は調節ループについていかなる数値も必要としないことにより、資料を集めることが容易である点にある。重要な欠点は、得られた化学量論上の限界に非常に幅があることであり、該バイオマス最大化の推測が、ある条件下で有用であるとしても、一般的に適用できるとは想定し難い。
【非特許文献1】イー・ペンニシ,Science 277, 1432(1997)。
【非特許文献2】ヴイ・ハッチマニカティスら、Biotechnol. Bioeng. 58, 154(1998)。
【発明の開示】
【発明が解決しようとする課題】
【0007】
従って、本発明の第一目的は、現行技術水準を改良する方法及びシステムを提供することである。
【0008】
流束均衡解析モデルを改良するための枠組みを与える方法及びシステムを提供することが本発明の更なる目的である。
【0009】
流束均衡解析モデルの予測能を向上させる方法及びシステムを提供することが本発明の更なる目的である。
【0010】
本発明の別の一目的は、定性的な運動の情報及び/又は調節の情報を流束均衡解析モデルに組み込む方法及びシステムを提供することである。
【0011】
本発明の更なる別の一目的は、差別的(differential)DNAマイクロアレイ実験データを流束均衡解析モデルに組み込む方法及びシステムを提供することである。
【0012】
本発明の更なる目的は、増殖のための最小の反応集合を決定するために改良された方法及びシステムを提供することである。
【0013】
本発明の別の一目的は、最小の反応集合に及ぼす環境条件の効果を決定するための改良された方法及びシステムを提供することである。
【0014】
遺伝子の削除又は付加の後の代謝ネットワークの応答を計算するための方法を提供することが本発明の別の一目的である。
【0015】
本発明の更なる目的は、組換えのために数学的に最適な遺伝子を選択するための方法及びシステムを提供することである。
【0016】
本発明の別の一目的は、致死遺伝子の欠失を同定するための方法及びシステムを提供することである。
【0017】
本発明の更なる別の一目的は、病原微生物に対する遺伝子治療の候補物質を同定する方法及びシステムを提供することである。
【0018】
本発明の更なる目的は、仮説又は目的関数を試験できる方法及びシステムを提供することである。
【課題を解決するための手段】
【0019】
本発明のこれらの並びに他の目的、特性及び/又は利点は、本明細書及び請求の範囲から明らかになるであろう。
本発明は、少なくとも、生物の細胞代謝をモデル化する方法であって、代謝及び細胞組織の情報の化学量論的質量均衡を用いて、流束均衡解析モデルを構築し、代謝ネットワークの利用可能な流束分布についての限界を同定する工程と、前記流束均衡解析モデルに論理的制約を適用し、変更された流束均衡解析モデルを生成する工程と、を含み、前記論理的制約は、利用可能な流束分布についての限界を制限し、よって前記流束均衡解析モデルの予測能を向上させる、方法を提供する。
【図面の簡単な説明】
【0020】
【図1】図1は、本発明の概観を示すブロック図である。
【図2A】図2Aは、同一の最適点と一致する複数の目的関数の勾配の図である。
【図2B】図2Bは、同一の最適点と一致する複数の目的関数の勾配の図である。
【図3A】図3Aは、異なる条件に対する実現可能な目標のセットである。
【図3B】図3Bは、異なる条件に対する実現可能な目標のセットである。
【図4】図4は、化学量論上の限界、運動/調節の障壁及び新たな最適定常状態の絵表示である。
【図5】図5は、論理的制約の適用を示す単純なネットワークの図である。
【図6A】図6Aは、隘路が同定される代謝ネットワークの二つの部分の図である。
【図6B】図6Bは、隘路が同定される代謝ネットワークの二つの部分の図である。
【図7】図7は、流束/転写物比の一致の確率を転写物比に対してプロットした対数プロットである。
【図8】図8は、0.3時間当たりの増殖速度αに対する最小の酢酸塩摂取速度のプロットである。
【図9】図9は、グルコース及び酢酸塩上の増殖についての7アミノ酸の最大理論収率に対するモデル予測の表である。
【図10A】図10は、グルコース上の増殖における組換えネットワークに導入された経路変更を示す図である。図10は、グルコース上の増殖における最適な大腸菌のアルギニン生産経路と一般のアルギニン生産経路との差異を示す。(a)は大腸菌に存在するATP依存性の6−ホスホフルクトキナーゼを置換する汎用モデルの6−ホスホフルクトキナーゼのピロリン酸依存性類似体を含み;そして(b)は該大腸菌のネットワークからカルバモイルリン酸シンセターゼを置換する汎用モデルのカルバミン酸キナーゼを含む。
【図10B】図10は、グルコース上の増殖における組換えネットワークに導入された経路変更を示す図である。図10は、グルコース上の増殖における最適な大腸菌のアルギニン生産経路と一般のアルギニン生産経路との差異を示す。(a)は大腸菌に存在するATP依存性の6−ホスホフルクトキナーゼを置換する汎用モデルの6−ホスホフルクトキナーゼのピロリン酸依存性類似体を含み;そして(b)は該大腸菌のネットワークからカルバモイルリン酸シンセターゼを置換する汎用モデルのカルバミン酸キナーゼを含む。
【図11A】図11は、(a)グルコースのみでの増殖及び(b)対応する輸送反応を用いて任意の有機化合物の摂取を可能にする培地上での増殖について得られた増殖速度の関数としての最小反応ネットワークの大きさを示すグラフである。
【図11B】図11は、(a)グルコースのみでの増殖及び(b)対応する輸送反応を用いて任意の有機化合物の摂取を可能にする培地上での増殖について得られた増殖速度の関数としての最小反応ネットワークの大きさを示すグラフである。
【図12】図12は、プラマニック(Pramanik)モデル及びキースリング(Keasling)モデルに対する修正を示す表である。
【図13】図13は、グルコース上の増殖についての種々のバイオマス生産レベルにおける遺伝子削除(gene knockouts) を示すグラフである。
【図14】図14は、削除研究による除去の対象として選択された遺伝子を示す表である。
【図15】図15は、大腸菌のアミノ酸生産能を増強させる酵素反応のモデル選択を示す表である。
【図16】図16は、グルコース上の増殖における大腸菌の最適なアルギニン生産経路及び一般のアルギニン生産経路を図示する。一般のアルギニン生産経路によるカルバメート・キナーゼ及び6-ホスホフルクトキナーゼのピロリン酸依存性類似体の利用は、差引して3 ATPの無水リン酸結合を節約する。
【図17】図17は、酢酸塩上の増殖における大腸菌の最適なアルギニン生産経路及び一般のアルギニン生産経路を図示する。一般経路によるカルバミン酸キナーゼ及び酢酸キナーゼのピロリン酸依存性類似体の組み込みは、3 ATPの無水リン酸結合を節約する。
【図18】図18は、グルコース利用の二つの方式(グルコキナーゼ及びホスホトランスフェラーゼのシステム)に最適なアスパラギン生産経路を図示する。
【図19】図19は、グルコース上の増殖に最適な一般のアスパラギン生産経路を図解する。この一般経路は、前図で示されるように、AMPを形成するアスパラギン酸−アンモニアリガーゼの代わりにADPを形成するアスパラギン酸−アンモニアリガーゼを用いることにより1ATP 結合に相当する量を節約する。
【図20】図20は、酢酸塩上の増殖における大腸菌の最適なヒスチジン生産経路及び一般のヒスチジン生産経路を図示する。この一般経路のエネルギー効率(2 ATP)及び炭素転換率は両方ともそれぞれPEPカルボキシキナーゼのピロリン酸依存性類似体及びグリシンデヒドロゲナーゼの組み込みにより改善される。
【図21】図21は、グルコース又は酢酸塩のみの摂取環境において課された増殖要求の関数としてのそれぞれの最小セットにおける反応の数のグラフである。
【図22】図22は、増殖が減少する条件下での最小反応セットの展開を示す表である。
【図23】図23は、最適に操作された培地上にそれぞれの標的増殖率における摂取又は分泌された代謝物を示す表である。
【図24】図24は、複数の有機物を摂取させる摂取環境において課された増殖要求の関数としてのそれぞれの最小セットにおける反応の数のグラフである。
【図25】図25は、複数の有機摂取を可能にする摂取環境において課された増殖要求の関数としてそれぞれの最小セットにおける反応の数のグラフである。
【図26】図26は、増殖が減少する条件下で第二セットについての最小反応セットの展開を示す表である。
【図27】図27は、最適に操作された培地上の増殖における最小ネットワーク反応の機能的分類を示す表である。
【図28】図28は、機能的分類に基づいた最小代謝遺伝子/反応セットの比較を示す表である。
【発明を実施するための形態】
【0021】
発明の概要
本発明は細胞代謝のイン・シリコでのモデル化又は生物情報学的モデル化についての枠組みを含む。この枠組みにより、特定の制約の組み込みを通じてFBAモデルを改良できる。これらの制約は2値変数で表され得る論理的制約であることが好ましい。この枠組みはモデル予測を解決するためにコンピュータ計算手法の適用を提供する。このモデルは、何個のそしてどの外来遺伝子が現存する代謝ネットワークに組換えられるべきであるか、所与の代謝標的が最適化されるようにどの調節ループが活性化又は不活性化されるべきであるか、遺伝子の欠失に対して代謝ネットワークが如何に頑健であるか、所与の摂取環境においてある種の増殖要求を満たすことのできる数学的に最小の遺伝子セットが何であるか、異なる基質及び異なる炭素/酸素摂取速度の下で、どの実験的流束データが異なる仮説の目的関数と一致するか、そして他の代謝問題などを解決するために用いられ得る。この枠組みの使用から得られる結果は、生物学、化学、薬学、生命科学、及び医学の分野などの領域を含む代謝工学に関する研究又は商業的利益の幾つかの領域に適用され得る。
【0022】
1.概観
図1は本発明の枠組みを図示している。この枠組みは特定の制約の導入を通じて流束均衡解析(FBA)モデルを改良する。これらの制約は、定性的運動情報、定性的調節情報、及び/又はDNA・マイクロアレイ実験データを、無制限に導入する。これらの制約は2値変数で表され得る論理的制約であることが好ましい。本発明は、該モデルを用いて結論に到達するために混合整数線形計画法などのコンピュータ計算手法を該枠組み内に含める工程も提供する。図1に示すように、該モデルは遺伝子の付加又は欠失に直面した代謝の性能/頑健性を決定する工程を提供する。その上、このモデルは、実験的流束データが異なる基質及び異なる炭素/酸素摂取速度の下で異なる仮定的目的関数と一致するか否かを試験する工程を提供する。
【0023】
本発明は、流束均衡モデルを通して導き出された流束限界を締める工程、続いて遺伝子の付加又は遺伝子の欠失の存在下で代謝ネットワークの性能の限界を精査する工程を含む。組換えに利用できる多数(何百から何千)の遺伝子があるとすれば、現在の最適化の定式化は混合整数線形計画法の解決法の技術水準で解決され得るものの限界に達ししばしばそれを超過する。本発明は、代謝ネットワークの性能限界の効率的な疑問提起を可能にし且つその結果得られる混合整数線形計画法問題を解決するためのカスタマイズされた技術を提供するというモデル化定式化の構築の二重の目的を満たす。
【0024】
2.目的関数仮説の試験
本発明は、実験流束データが異なる基質及び異なる炭素/酸素摂取率の下で異なる仮説の目的関数と一致するか否かを試験するための、バイアスのかかっていない数学的に厳密な枠組みを提供する(エイ.ヴァルマとビー.オー.パルソン, Bio/Technology 12, 994(1994); アール.エイ.マジェヴスキーとエム.エム.ドマッチ, Biotechnol. Bioeng. 35, 732(1990))。目的関数などを仮定することにより開始するのではなく、又は細胞の行動を規定する目的関数が存在することをさえ承認するのではなく、本発明の定量的な枠組みは、研究者が異なる仮説の整合性を試験し、反証し又は微調整できる逆最適化に基づいている。このような目的関数の存在を証明することは決してできないが、該枠組みは実験データが仮定された目的関数と一致するかしないかをそしてこれが異なる環境条件下でどのように変化しうるかを厳密に試験するために有用であることに留意せよ。
【0025】
一組の観測値(observable)で与えられた最適値に到達するシステムに対するモデル・パラメータの同定のために地球物理学で開拓された逆最適化の概念がここに適用される。具体的には、本発明は、観察された流束 v* J (例えば、基質/酸素摂取、増殖速度など)の部分集合と一致する仮定された線形目的関数Σj c j v j における係数 cj を見出す工程を提供する。一般的に、係数cjに対しては一つではなくある範囲の値が観察された流束の集合と一致する。これは二次元で図2Aと共に例示する。
【0026】
目的関数c1v1+c2v2(その勾配(-c2/c1)はa値とb値の間にある)はいずれも点Aの最適性と一致している。これは点Aの最適性と一致し図2Bに示される点Bと点Cの間にある線分により表示される範囲のc1値とc2値を生じる。c1及びc2はc1+c2=1になるように定められることに留意せよ。一般的なn次元の場合、最適の v* J に応じた cj値の集合はポリトープ(polytope)を形成する。
【0027】
一般的な問題は、アフジャとオールリン(2001)(アール.ケイ.アフジャら、「ネットワーク流束、理論、アルゴリズム、及び応用」プレンティス・ホール、エングルウッド・クリフス, N.J. 1993)により導入された着想を用いて取り組まれる。観察された流束値 v* Jの部分集合が与えられると、目的関数の係数 cj の集合が、2値(dual) 変数αi及び線形目的関数の係数 cj 空間で解決される制限された2値実現可能性問題のあらゆる複数の最適解を見出すことにより決定され得る。
【0028】
2値変数αiは目的関数の改良における代謝物iの相対的重要度を定量化する。制限された2値問題の解は観察された流束値v* J の部分集合と一致する全ての可能な cj 値の集合を体系的に決定する。単純な表から得られるいずれの基本的で実現可能な解も該 cj 空間で形成されたポリトープの頂点を規定するから、これらの交互の最適な解がこの単純な方法の副産物として得られ得る。整数切捨て(integer cut)を用いた代替方法も使用され得る(エス.リーら、Comput. Chem. Eng. 24, 711 (2000))。本発明は、これらの技術を用いて基質の選択又は炭素/酸素の摂取速度が変化するとき、該ポリトープがかなり重複する(図3Aを参照)又は体系的に移動する(図3Bを参照)か否かに関して決定することができることを意図する。定量手段のこのセットは研究者が異なる仮説(もしあれば)の妥当性の範囲を試験するためにバイアスのかかっていない枠組みを提供する。
【0029】
3.運動/調節の論理的制約
化学量論平衡及び摂取速度に単に依存することによる流束均衡モデルは、如何なる実現可能な流束分布をも排除しないことを保証する。しかしながら、この汎用性はその結果が適切に解釈されない場合過度に楽観的な予測を導きうる。該細胞内での流束分布は、該細胞内の調節機構、細胞酵素の運動特性、及びこれらの酵素の発現により最終的に独自に決定される。細胞が化学量論的に最適な様式で機能すると仮定することにより、該細胞に利用されない代謝流束分布を生じうる。本発明は、FBAモデルにより、予測された化学量論的流束限界を小さくするための複数の方法を提供する。第一の戦略は、FBAを通して同定される流束変化が定性的な意味で代謝ネットワークの運動ループ及び調節ループと一致することを保証しようと試みる工程を含む。該化学量論的流束限界内の到達不可能なドメインを取り外すことにより、該予測能は向上する。第二の戦略は実験的に得られたデータを該FBAモデルに組み込む工程を伴う。本発明はDNAアレイ差別的発現データをFBAモデルに重ねるための数学的に信頼できる枠組みを含む。
【0030】
3.1 運動及び調節ループの整合性
本明細書で扱われる重要な問題は、該FBAモデルにより予測される最適な流束分布が該細胞により達成可能であるか否か又は運動及び/又は調節の限界が該システムが化学量論的限界に達することを妨げるか否かである(図4を参照)。
【0031】
本発明者らが探求することを提唱する重要な着想は、論理的関係式を用いることにより、環境変化に応答して、該代謝ネットワークが一つの定常状態から他の定常状態へ移る場合、代謝物濃度の上下変動が反応流束の上下変動と一致することを確実にすることである。
【0032】
具体的には(図5参照)、流束値vは、酵素工学の非存在下では、反応物質Aの濃度CA 又は活性物質Dの濃度CD又は阻害物質Eの濃度CEが低下する場合のみ、増加し得る。明らかに、反応流束の変化と代謝濃度の変化は共役しており、詳細な定量的運動/調節情報が存在しない場合でさえ、結合関係はこれらの変化の方向に基づいて導き出され得る。このような関係式の一つのセットが以下に詳細に記載される。
【0033】
具体的には、任意の反応流束値vjが初期基本事例値v0j を超えて増加するためには、反応物質の濃度が増大しなければならず、又は活性物質の濃度が増大しなければならず、又は阻害物質の濃度が低下しなければならないのいずれかであり、そして逆もまた同様である。これらの論理的制約を該FBA枠組みに組み込むには、第一に反応jに及ぼす代謝物iの影響を記載する調節行列(regulation matrix)Fを設定することが必要である。
【0034】
代謝物iが反応jを活性化する場合、1
Fij= 代謝物iが反応jを阻害する場合、−1
代謝物iが反応jに影響を及ぼさない場合、0
このような調節行列はEcoCyc及びMetaCycのデータベースからの情報に基づいて構築され得る(ピイ.ディ.カープら、Nucleic Acids Res. 28, 55(2000))。更なるデータベース源が非大腸菌反応についても存在する(エム.カネヒサとエス.ゴトウ、Nucleic Acids Res. 28, 29(2000))。0- 1変数である xi 及び zjの二つのセットは代謝物濃度及び反応流束値における上下変動を追跡するためにそれぞれ導入される。
【0035】
Xi = 代謝物iの濃度が上昇する場合、1
他の場合、0
Zj = 反応流束値jが本来の定常状態値を超えて増加する場合、1
他の場合、0
これらの0- 1変数を利用することにより、本発明者らは幾つかの運動及び調節限界の侵害から守るために下記の論理的制約を該FBAモデルに導入する。
【0036】
【数1】
関係式(1)は zj = 1 である場合、 vj >v0j であり、且つ、 zj = 0 である場合、 vj <v0j であることを保証する。制約(2)は、反応流束値 vj がその初期基本事例値v0j を超えて増大するためには、反応物質の濃度が増大しなければならず、活性物質の濃度が増大しなければならず、又は阻害物質の濃度が低減しなければならないことを確実にしている。最後の制約(3)は、反応流束値 vj が該初期基本事例値を下回って減少するためには、反応物質の濃度が低減しなければならず、活性物質の濃度が低減しなければならず、又は阻害物質の濃度が増大しなければならないことを確実にしている。図3の例を再び取り上げると、流束値vについての制約(2)及び(3)は
XA+XD+(1-XE ) ≧Z1、及び
(1-XA ) +(1-XD )+ XE≧ 1-Z1
となる。
【0037】
グルコース上で増殖させた場合のアラニン過剰生産経路に関する予備研究から、単純なFBAモデルにより検出できない運動及び調節の隘路が確認された。
【0038】
この分析の第一段階は反応流束に対する初期基本事例値を得ることであった。これらはバイオマス最大形成についてのLP問題を解決することにより得られた。第二段階はその最適値の80%までバイオマス生産を抑制しアラニンの過剰生産を可能とする第二のLP問題を解決することであった。第三段階は上述したように運動及び調節の論理的制約を組み込むことにより第二段階のシナリオを解決する工程を含んでいた。この研究から、調節されたアラニンの過剰生産(2.688mmol/10mmol GLC)は論理に基づいた調節制約なしのFBAモデルにより予測された値(3.298mmol/10mmol GLC)よりも約20%低いものであることを明らかにした。この減少を同定できたことより重要なことは、具体的な流束隘路を特定する能力である。反応流束の分析は該ネットワークの性能を制限する二つの潜在的な隘路を明らかにした(図6参照)。
【0039】
ペントースリン酸経路反応に加えて、リブロース-5-リン酸(RL5P)もバイオマスの構成成分であるリポ糖類(LPS)の前駆体であるために、第一の隘路(図6A)が生じる。最適よりも低い増殖要求の下では、RL5Pからバイオマスまでの反応流束はその基本事例値より低下するに違いない。従って、RL5Pの濃度は減少しなければならない(調節因子のみ)。故に、反応物質RL5Pの濃度が減少しているため、リブロースリン酸3−エピメラーゼを介した流束はその基本事例値を超えて増加できない。これはリボース−5−リン酸イソメラーゼ反応を介してさらなる流束を迂回させる。アラニンの過剰生産中、最大増殖条件の下でよりも多くの流束がピルビン酸キナーゼを通過しなければならないため、第二の隘路(図6B)が生じる。この研究において、基本事例で、FBAモデルは、ピルビン酸キナーゼの二つのイソ酵素の一つであるピルビン酸キナーゼIIを選択した。しかしながら、ピルビン酸キナーゼIIを介した流束は、その活性剤(AMP)及びその反応物質の両方の濃度が減少するため、その基本事例値を超えて増加できない。調節を含むFBAモデルでは、この反応の活性物質(FDP)の濃度が増加するので、ピルビン酸キナーゼIを介して該流束を増大させることによりこの障壁は部分的に回避された。この例は、幾らかの運動及び調節の情報を得ることにより、該論理的制約が、如何なる実現可能な流束分布を排除することもなく、単純なFBAモデルにより検出できない少なくとも一部の隘路を同定できることを示唆している。上述したこれらの重要な流束を同定し、次いで該酵素及びそれらの周囲の調節を操作することにより、容易な脱隘路化(debottlenecking)戦略が提供される。本発明は、当業者であって本開示の利益を有する者が流束均衡モデルの予測を更に「高める」ために上述したものの精神に沿って更なる論理的制約を構築できることを意図している。
【0040】
4. 差別的DNAマイクロアレイの制約
流束均衡モデルの予測能を強化するための論理的制約を規定するために定性的運動情報及び/又は定性的調節情報を用いることに加えて、本発明は差別的DNAマイクロアレイ実験データに基づいた制約を規定する工程を提供する。最近のDNAマイクロアレイ技術の進歩により、細胞の全体調節を全ゲノム規模で行なう研究が改革され始めた。DNAマイクロアレイは、種々の実験条件下における個々の遺伝子の相対的発現レベルから構成される差別的転写プロファイルを決定することができる。これにより、生物が外部環境の変化に応答する際どの遺伝子が高レベル調節又は低レベル調節されるかを推論できる。すでにこのような研究はエス.セレビシエ(S. cerevisiae)(エル.ヴォディッカら、Nat Biotechnol. 15(13), 1359(1997))及び大腸菌(シイ.エス.リッチモンドら、Nucleic Acids Res. 27(19), 3821(1999))で始まっている。このような実験の出力は通常本来の定常状態に関して正規化された一群の遺伝子転写物レベルである。グルコース対照条件と比較して、例えば、グリセロール又は酢酸塩のいずれかの培地上で増殖した大腸菌株について、主要な代謝及び重要な生合成に関与する111個の遺伝子の差別的転写物レベルが測定された(エム.ケイ.オー&ジェイ.シイ.リアオ、Biotechnol. Prog. 16(2), 278(2000))。こうして、酢酸塩上で増殖した大腸菌株のある遺伝子について1.5の転写物レベルとは、この遺伝子がグルコース上の増殖と比較して酢酸塩上での増殖中50%まで高レベル調節されることを示している。この方法では翻訳又は翻訳後の遺伝調節を検出できないが、少数の例外はあるものの、少なくとも大腸菌においては転写調節が調節の主要な様式である。
【0041】
重要な難問は、現在、対応する流束レベルの定量的変化を推論するために転写物のレベルが使用できないことである。その代わり、せいぜい流束変化と転写物レベルとの定性的な統計上の相関関係のみが導き出され得る。流束と転写物レベルとの定性的な連結に基づいて、本発明はこれらの動向を捕えるために0- 1の変数を用いる。Tljは環境変化lがあった場合の反応jを触媒する酵素をコードする遺伝子の正常な転写物レベルを表す。1より大きな値は過剰発現を示し、一方1未満の値は過少発現を表す。表示を簡単にするため、遺伝子の反応に対する位置付けを1:1、即ち j ≡ k とここで仮定する。これは必要な場合容易に緩和され得る。2値変数 wj は、
wj = 転写物及び流束のレベル変化が同じ方向にある場合、1他の場合、0
と定義されると考えよう。
【0042】
2値変数 wj が定義されると、次に、下記の式を書くことができる。
Tlj>1である場合、vlj≧voj-(1-wlj )voj (4)
Tlj<1である場合、vlj≦voj+(1-wlj ) (vmaxj-voj) (5)
上式で、v0jは基本流束レベルでありそしてvmaxjは最大許容値である。wj = 1の場合、これらの二つの制約は、Tlj >1ならば、vlj≧voj そしてTlj <1ならば、vlj≦voj をそれぞれ強制する。wj = 0の場合、この二つの制約は明らかに有効な非束縛性の制約、即ち vlj ≧0そして vlj ≦vmaxjをそれぞれ生ずる。転写物レベルと流束のレベル間の完全相関関係は、全ての wj が1に等しいことを意味するであろう。しかしながら、実験研究は、100%ではなく、平均で約80%の遺伝子が同方向で変化する転写物レベル及び流束レベルを示すことを証明した。その上、転写物レベルの値が1から離れれば離れる程、それは流束変化の方向と一致する可能性が一層高くなる。これは、転写物の変化が同方向で対応する流束レベルの変化に翻訳される可能性を定量化するための確率論的記載に動機付けを与える。具体的には、本発明者らは、この形式の統計学的モデルを構築する。
【0043】
【数2】
尺度 Tscaleは Pj が1から離れたままである範囲を制御するよう選択される。0.622という値は、100%の過剰発現(Tj = 2)、又は過少発現(Tj = 1/2)が90%の一方向性の確率を与えることを示す。図7は、転写物レベル Tj の関数として単一方向の転写物変化及び流束の変化を有する確率 Pj をプロットする。 Tj = 1 の場合、 Pj = 0.5 がいずれの結果についての等しい機会を反映し、一方、Tjが非常に大きな正又は負の指数を有する場合、 Pj は1に近づく。本発明は Pj のより精巧なモデルが使用され得ることを意図する。それには、機械的方法又は流束変化に転写物比を連結するために開発された他の方法から借りることにより構築されるモデルが含まれる。
【0044】
各 wj の効果を評価するため Pj の確率を用いた後、下記の制約が得られる。
【0045】
【数3】
ここで、αは単一方向の転写物変化及び流束の変化を有すると予測される遺伝子jの画分である。従って、αはFBAにより予測される転写物比と流束変化との「一致可能性」を定量化する。制約(4)、(5)及び(6)でFBAを補強することは、確率論的な意味で、DNAマイクロアレイ実験の遺伝子発現プロファイルにコードされた定性的情報を重ね合わせることである。上述の二つの方法での確率的枠組みは幾つかの異なる方法で用いられる。
【0046】
FBAモデルの最適化は通常多数の代替最適値を生ずる。それらの全てを同定するための見事なアルゴリズムがリーら、2000により提唱された。DNAマイクロアレイ・データは実験的に決定された遺伝子発現レベルと一致する代替の最適値の部分集合を同定するために用いられ得る。具体的には、パラメータαは、DNAアレイ・データとのそれらの一致可能性に関してFBAモデル内で目的関数を最適化した後に通常得られる複数の最適値(リーら、2000)を序列付けするために用いられ得る。グルコース上の増殖から酢酸塩上の増殖への転換についてオーとリアオ(2000)から得られたデータを用いた結果は、αがどの代替的最適解が解答者により同定されるかに応じて、課された 0.3 時間-1の増殖速度に対して 0.74 から0.89まで変化し得ることを示している。こうして、発現プロファイルの一致可能性能に対するFBAは所与のFBA最適解についてαを最大にすることにより20%ほども改良され得る。本発明はFBAモデルへのDNAマイクロアレイ・データの直接的組み込みをも提供する。ここで、実験上の転写物プロファイルとの課された一致可能性に対するFBAの目的の感度は、αの種々の値に合致させるために該モデルを制約することにより調整することができる。オーとリアオ(2000)から得られた同一のデータについて、図8に示した結果は、最小酢酸塩摂取速度と課された一致可能性パラメータαとの間で二次式の傾向を示す。
【0047】
5. 組換え用に遺伝子候補を同定する
代謝に関連する注釈付き遺伝子の爆発的増殖は、最も有望な組換えの選択を決定するために体系的手法を要求する。今までに、組換えDNA技術は新しく且つ望ましい細胞の機能を導入する単純な転換経路を付加するために用いられてきた。ここで、その目的は、複数の種に由来する多数の遺伝子を包含する代謝データベースから、大腸菌内又は他の原核生物内への組換え用に数学的に最適な遺伝子を選択するために、流束均衡解析及び混合整数計画手段を利用することである。得られる経路は直接主要生産経路上にある必要はない。何故なら代謝流束を生産経路内に方向転換すること又はこの経路のエネルギー効率を増大させることのいずれかにより間接的に生産を増強しうるからである。
【0048】
キョウト・エンサイクロペディア・オブ・ジーンズ・アンド・ゲノムス(KEGG)(カネヒサとゴトウ、2000)及びエコサイック(カープら、2000)及び他の供給源から得られる全ての既知の代謝反応を含む包括的な化学量論的行列をコンパイルすることができ、モデル生物(例えば大腸菌)の流束均衡モデルに組み込むことができる。本発明者らはこの複数種の化学量論的行列を汎用化学量論的行列と呼ぶ。この複数種の化学量論的行列は、イン・シリコ遺伝子組換え代替法を開拓し且つどの原核生物が所与のバイオプロセッシング適用に最も有利な選択になるかを調査するための貴重な資源である。
【0049】
代謝対象v* が最大化されるように宿主生物へ組込むための最大h個までの新たな遺伝子を選択することはMILP問題として定式化され得る。これは、全ての大腸菌遺伝子が存在することを保証する制約 jk=1 、∀k∈E並びに汎用行列(即ちNE)に含まれる包括的リストから最大h個までの外来遺伝子を大腸菌に導入させる制約
【0050】
【数4】
を用いて、LP流束均衡モデルを補強することにより達成される。ここで、該宿主生物は大腸菌であると仮定されるが、一般的に任意の注釈付き原核微生物が宿主生物として選択され得る。該モデルにより選択されたが大腸菌に存在しない反応(即ちNEの全ての0でないyk要素)は組換えDNA技術により細胞代謝を操作するための経路を提供する。
【0051】
プラマニックとキースリングの流束均衡大腸菌モデルを用いた予備的結果は、大腸菌の7つのアミノ酸生産経路に対する改良は外来生物由来の遺伝子の付加で理論的に達成できることを証明している(図9の表を参照)(ジェイ・プラマニックとジェイ.ディ.キースリング、Biotech. Bioeng. 56, 398(1997))。
【0052】
ほとんどの場合、たとえ3400の反応の完全なリストが選択に利用できたとしても、僅かに1つ又は2つの遺伝子が本来のアミノ酸生産経路に付加された。同定された増強機構は全て、(i)エネルギー効率の改良及び/又は(ii)生産経路の炭素変換効率の増大のいずれかによるものである。アルギニン経路の操作は、グルコース及び酢酸塩上の増殖についてそれぞれ8.75%及び9.05%の向上という最も有望な結果を示した。図10は、グルコース上の増殖について組換えネットワークに導入された経路変更を示している。全体的に、汎用モデルにより用いられる追加の遺伝子は本来の経路の3つの正味ATP結合を節約し、アルギニン生産を8.75%まで増大させる。グルコース及び酢酸塩の基質について他の天然のアミノ酸生産経路及び汎用のアミノ酸生産経路を調べると、同様の傾向が明らかになる。
【0053】
記載した本発明のモデルはまた、組換え用により多くの遺伝子候補を包含するように拡大することもできる、進行中のゲノム計画によりより多くの遺伝子候補が利用可能になるからである。本発明は、産業上重要な他の微生物を含むかなり多数の生物に適用される。大腸菌が産業上最も重要な微生物の一つであるとしても、他の微生物はそれらの緩和された調節機構により利益を与える。例えば、多様な種のコリネバクテリウム属及びブレビバクテリウム属は、培地にグルタミン酸塩を分泌できるリン脂質欠損性細胞膜を開発することによりグルタミン酸塩を生産するために用いられてきた。第一鉄イオンからの抑制効果が観察されないエレモセシウム・アシュビ及びアシュビヤ・ゴッシピイは、リボフラビン又はビタミンB2を過剰生産する。
【0054】
本発明の論理に基づいた制約は得られる予測を正確にするために遺伝子選択のMILP公式と一体化できる。異なるアミノ酸の生産用に同定された最適な組換え変化を対照させることにより、複数のアミノ酸の同時収率向上に向けた組換え戦略が同定される。遺伝子の付加を誘導するための本発明の最適化枠組みは、拡大を続ける利用可能な遺伝子のデータベースから外来遺伝子の組換えを通して流束増強を研究するための定量的手段を提供する。完全な遺伝子−酵素の関係は現在知られていないが、該公式は、それが利用可能となる場合、この情報を組み込むことを可能とする。
【0055】
6. 遺伝子の欠失(最小セット)
完全に配列決定されたゲノムの最近の激増により、幾つの遺伝子が細胞生命を維持するために必要であるかという疑問に著しい注目が集まってきた。最小のゲノムは一般的に特定の環境において複製及び増殖できる遺伝子の最小セットとして定義される。この最小遺伝子セットを明らかにする試みには、実験的研究法と理論的研究法の両方が含まれていた。理論的方法は、大規模な進化上の境界を横断して保存された遺伝子が細胞の存続に不可欠であるという仮説に基づいている。この仮説に基づいて、エム.ゲニタリウムとヘモフィルス・インフルエンザスの両方に共通した遺伝子が最小ゲノムの構成員であるに違いないと仮定することにより、最小セットの256遺伝子がコンパイルされた(エイ.アール.ムシェギアンとイー.ブイ.コーニン、P. Natl. Acad. Sci. USA 93, 1026 (1996))。
【0056】
しかしながら、興味深いことに、エム.ゲニタリウムに保存された未知機能の26個の大腸菌オープン・リーディング・フレームの内6個のみが種の生存に必須であると判断された(エフ.アリゴイら、Nat. Biotechnol. 16, 851 (1998))。複数の全く異なる種及び環境に特異的な最小ゲノムの存在が長い間憶測されてきた(エム.フイネン,エム.、Trends Genet. 16, 116 (2000))。本発明は、異なる摂取条件下で与えられる増殖速度に必要な代謝反応の最小の生命維持コアを評価することにより、この主張を試験するための計算手法を提供する。この問題は、化学量論的制約を充足し且つバイオマス標的生産率vtargetbiomassを満たす代謝反応の最小セットを解く下記の最適化問題として定式化され得る。
【0057】
【数5】
或いは、バイオマス標的の代わりに、ATP生産の最小レベル又は主要構成要素/代謝物の最低許容レベルが該モデルに組み込まれ得るであろう。本発明のこの側面の一つの新規な特性は、先の試みが必須遺伝子のセットを抽出するために一連の遺伝子除去による還元主義者の方法論を利用したが、一方本明細書では本発明者らはバイオマス生産に及ぼす全反応の影響を同時に評価し且つ所与の増殖速度目標を満たす(反応の)最小セットを選択する(全体システム研究法)。次に、これらの反応を触媒する酵素を対応するコード遺伝子に位置付けることにより最小遺伝子セットを推論できる。
【0058】
エドワードとパルソンの大腸菌FBAモデルに基づいた結果は、最小反応セット、従って対応する最小遺伝子セットが増殖培地により与えられる摂取機会及び課された増殖要件に強く依存することを初めて定量的に証明した(ジェイ.エス.エドワードとビイ.オー.パルソン、Proc. Natl. Acad. Sci. USA 97, 5528(2000))。具体的には、二つの対照的な摂取環境、即ち(a)有機物質の摂取をグルコースのみに制限する及び(b)対応する輸送反応を用いて任意の有機代謝物を摂取させる、という摂取環境の下で、異なる増殖要件について最小反応ネットワーク(大腸菌のみの反応の部分集合)を探究した。構成要素合成のための内部代謝物への最大依存及び最小依存をモデル化し、且つ必要な最小反応セットに及ぼすその影響を精査するために、これらの二つの極端な摂取シナリオが選択された。二つの摂取選択について課されたバイオマス増殖目標の関数としての最小数の代謝反応(理論的最大値のa%として)が図11に示される。
【0059】
グルコースのみを含む培地上で増殖する大腸菌細胞は増殖を支えるために少なくとも226の代謝反応を必要とすると予測される一方で、栄養豊富で最適に処理された培地上で培養される細胞は僅か124の代謝反応で増殖を支えうるであろう。予期されるように、必要な増殖率を増大させることにより最小反応セットは大きくなる。しかしながら、この増加の大きさはこの二つの事例で全く異なる。事例(a)では最小反応セットは最大増殖率を満たすために226から236にしか増えないが、事例(b)では最小反応セットは124から203へとほとんど倍増する。更に、最小反応セットもそれらの対応する反応流束も固有ではないことが見出された。周期及びイソ酵素を排除した後でさえ、数百もの複数の最小セットが同定され、これは驚異的な余剰性をコンピュータによる確認させそして大腸菌ネットワークの流束の方向転換の多様性を示す。事例(a)でのより重要なことは、同定された全ての最小反応セットは12反応の内の11反応を含み、それらの対応する遺伝子の欠失はグルコース上での増殖において致死的であることが実験的に決定された。LP最適化を用いたこのモデルで行われた一遺伝子欠失に基づく先の分析(エドワードとパルソン、2000)は、12の致死遺伝子欠失の内の7つのみを同定できた、このことはMILP枠組み内での同時遺伝子欠失を考慮することの重要性の動機付けとなった。
【0060】
本発明は、この枠組みが、単に大腸菌だけでなく幅広い進化上の境界により分離された他の種についても異なる最小反応セットを構築することによって構築できることを意図する。得られる最小セットを対比することにより、異なる進化上の枝に沿った最小反応セット(代謝遺伝子セット)の比較が為され得る。例えば、エム.ゲニタリウムとエイチ.インフルエンザなどの生物を用いて先の研究(ムシェギアンとコーニン、1996)に対する基準となる結果を得ることができる。先に記載した汎用的化学量論的行列内で多数の異なる種に生じる反応を一括して扱うことにより、種から独立した最小代謝反応セットを構築することもできる。予測される124反応/遺伝子の大腸菌系の代謝最小セットは、ムシェギアンとクーニン(1996)により提唱された最小遺伝子セットに含まれる94個の代謝遺伝子に匹敵する。本発明は、 (i)非大腸菌種で生じる反応を含む、より効率的な反応の組み合わせを同定することにより、及び(ii)複数(類似)の代謝物の摂取又は分泌に関与する遺伝子を明らかにして総数を減らすことにより、この予測の乖離が低減され得ることを意図する。明らかに、提唱された計算枠組みは、翻訳、複製、組換え、修復、転写、細胞構造に関連する遺伝子、及び未知機能の遺伝子を本質的に説明できない、反応に基づく分析に依存している。しかしながら、これは異なる摂取/分泌環境を研究するための並びに代謝の最小ゲノムの探索において複数の種に由来する反応セットを含ませるための多様性を与え、何が最小ゲノムであり、それがどのようにして環境により形成されるのかという疑問に対する価値ある洞察及び展望を与える。DNA複製の開始についてのブロウニングとシュラーの研究など、最小細胞の基本機能を説明するより精巧なモデルが開発されるにつれ、より詳細な内容が該モデル化枠組みに付加されることになる(エス.ティ.ブロウニングとエム.エル.シュラー、AICHE年次総会、セッション69、セッション69、ロサンゼルス(2000))。
【0061】
「最小」代謝ネットワークを合理的に同定するための枠組みの開発を離れて、本発明者らは異なる生物及び摂取環境における致死的遺伝子欠失をイン・シリコで予測する能力を開拓することも意図する。病原微生物の致死的遺伝子欠失を環境の関数として同定することにより(例えばエイチ.ピロリ)、治療的介入(即ち遺伝子発現の妨害)のための有望な標的の、序列を付けた一覧表がコンパイルされ得る。この一覧表は、ヒトの代謝が該一覧表に含まれる任意の病原遺伝子の発現を抑制することにより悪影響を受けないことを保証する制約を課すことにより更に精緻化され得る。
【0062】
7.混合整数線形計画法の解決技術
本発明のモデル化枠組みは、提示されるネットワーク問題を解決するために用いられる計算手順を更に提供する。用いられる計算手順は混合整数線形計画法の技術を含む。
【0063】
遺伝子付加、調節、DNAアレイ・データ重畳、遺伝回路の解明、及び最小反応セットの同定といった文脈における本発明のアルゴリズム枠組みは、MILP問題を生じる別々の最適化変数の使用を本質的に必要とする。最小限の使用者介入で又は全く使用者の介入なしで市販の解決ソフト(例えばOSL、CPLEX、LINDO等)を用いることにより数十万の変数についてさえ機械的に解くことができるLP問題と違って、MILP問題は計算上遥かにより高い能力が試され、より多くのCPU時間だけでなく使用者の介入も通常必要である。具体的には、(i)MILP解決技術をより受けやすい形式で該問題を作成すること、そして(ii)該問題が市販の解決ソフトにとって依然解決困難である場合、カスタマイズされた解決法を構築することが通常必要である。
【0064】
代謝ネットワークのMILP問題における複雑性の主要な根源は、オン又はオフの切り替え及び過剰発現又は過少発現の予測が記載に0〜1の2値変数を必要とする反応/遺伝子の数である。これらの問題は一般化されたネットワーク問題(アフジャら、1993)の部類に属し、ここでは個々の代謝物はネットワークのノードを構成し、個々の反応はネットワークのアークを表す。原核生物の既存のFBAモデル(エドワードとパルソン、2000)は何百の反応を含むとすれば、エス.セレビシエの来たるモデルは千単位の反応の可能性があり、複雑性を抑制する必要性の動機付けとなる。その上、驚異的な余剰、方向転換能及び定常状態解の複数はさらに複雑性の問題を悪化させる。これらの挑戦に鑑みて、本発明により取り扱われた問題の幾つかは、とりわけ最小反応セットの文脈において、現段階では、50時間のオーダーのCPU時間を必要とした。
【0065】
計算負担を軽減するため、幾つかの再プロセシング及び再定式化の技術を本発明に従って使用しうる。これらの技術には、イソ酵素のグループ分け、無駄な周期の排除及びネットワーク連結性の制約が含まれる。イソ酵素のグループ分けは一つの反応で触媒する酵素(即ちイソ酵素)のみを異にする反応の集合体を指す。これは2値変数の総数を切り捨てることにより複雑性を減らす。無駄な周期の排除は、代謝又はエネルギー生成に正味の影響を及ぼすことなくループで集合的に流束を再循環させる反応セット(2以上)の除去を指す。一般的に、K個の反応から成るセットKは、
【0066】
【数6】
である場合、無駄な周期を形成する。下記の制約、
【0067】
【数7】
は、少なくとも一つの反応を不活性化して該周期を中断する。
【0068】
連結性の制約は、細胞内代謝物を生産する反応が活性である場合、この代謝物を消費する少なくとも一つの反応が活性でなければならずそして逆もまた真であることを保証する。その上、細胞外代謝物を細胞内に輸送する反応が活性である場合、この代謝物を消費する少なくとも一つの細胞外反応が活性でなければならずそして逆もまた真である。
【0069】
マルチプロセッサのユニックス・プラットフォームIBM RS6000-270ワークステーションで動くCPLEX6.1及びOSLなどの現レベルの市販のMILP解決ソフトは、これらの型の問題を解決するために使用できる。市販のMILP解決ソフトでは解決困難な問題の大きさについて、カスタマイズされた分解処理法が用いられ得る。例えば、ラグランジアン(Lagrangean)緩和、及び/又は本来の代謝ネットワークを少数の代謝物と緩く相互接続された部分ネットワークに分割することによる分解が使用できる。一つの大きな問題の代わりに多数のより小さな問題を反復して解くことにより、コンピュータ計算の省力が期待される。更に、本発明はブーリアン (Boolean)と連続変数とを組み合わせた離接的計画研究法の使用を意図する。これらの方法は、本発明のMILP定式化の多くと同様に、0〜1(即ちブーリアン)の変数の全てが論理的制約に統合されるMILP問題にとりわけ効果的であることが示された。
【0070】
8.実施例:遺伝子の付加又は欠失に曝される大腸菌代謝ネットワークの性能限界を精査する
本発明の枠組みは幾つかの異なる文脈において幾つかの代謝ネットワーク問題に適用され得る。本発明は遺伝子の付加又は欠失を受けた大腸菌の代謝ネットワークの性能限界を精査するために用いられた。この実施例に従って、遺伝子の欠失又は遺伝子付加後の代謝ネットワークの応答を研究するための最適化に基づいた手法が導入され線形流束均衡解析(FBA)大腸菌モデルに適用される。どの外来遺伝子を大腸菌内に組込むかを最適に選択する遺伝子付加問題、及び所定数の既存の遺伝子を除去する遺伝子欠失問題の両方が、2値0〜1変数を用いて混合整数最適化問題として定式化される。開発されたモデル化及び最適化の枠組みは、バイオマス生産に及ぼす遺伝子欠失の効果を研究しグルコース及び酢酸塩の基質の上での好気性増殖について20アミノ酸の理論的最大生産に取り組むことにより試験される。遺伝子欠失の研究において、大腸菌の最大バイオマス生産を達成するために必要な最小遺伝子セットが、グルコース上の好気性増殖について決定される。その後の遺伝子削除分析は、僅か18遺伝子の欠失の後、バイオマス生産が単調に減少し代謝ネットワークを増殖不可能とすることを示している。
【0071】
遺伝子付加の研究では、大腸菌流束均衡モデルがKEGGデータベースから得られる3,400の非大腸菌の反応で増加させられ、多種のモデルを形成する。このモデルを汎用モデルと称する。この研究は、たとえ該モデルが3,400の外来反応候補から選択しうるにせよ、6個のアミノ酸の理論上の最大生産が、大腸菌の天然アミノ酸生産経路に僅か1又は2個の遺伝子を付加することにより改良されうるであろうことを示している。具体的には、アルギニン生産経路の操作は、グルコース及び酢酸塩上の増殖について遺伝子の付加でそれぞれ8.75%及び9.05%の予想増加という最大有望値を示した。全ての示唆される増強の機構は、(i)エネルギー効率を改良すること及び/又は(ii)生産経路の炭素変換効率を増大させることのいずれかによる。
【0072】
本発明の枠組みに従ったこの実施例は、複数の種に由来する多数の遺伝子を包含する代謝データベースから大腸菌内への組換えのために数学的に最適な遺伝子を選択すべく流束均衡解析並びに混合整数計画法手段を用いる。得られる経路は主要な生産経路上に直接在る必要はない。該生産経路に代謝流束を方向変換することによるか又は現在の経路のエネルギー効率を増大させることによるかのいずれかで間接的に生産を増強しうるからである。
【0073】
配列決定されたゲノムの最近の急増はまた、どの遺伝子が細胞生命を維持するために不可欠であるかという疑問に著しい注目を集めてきた。流束均衡解析モデル化はこの疑問を解明するのを助ける有用な手段を提供する。FBAモデルは遺伝子欠失に関連する調節構造の変更を模倣できないが、これらのモデルは細胞の生存に不可欠な代謝物を生産するために十分なネットワーク連結性が存在するか否かを把握することができる。実際に、エドワードとパルソン(2000)により提唱された最近のFBAモデルは試験された大腸菌突然変異株の86%の増殖様式を定量的に予測することができた。このモデルはグルコース上での大腸菌の好気的及び嫌気的増殖のための中心的代謝の必須遺伝子産物のいくつかを同定するためにも用いられた(ジェイ.エス.エドワードとビー.オー.パルソン、BMC Bioinformatics 2000b 1, 1)。
【0074】
しかしながら、所与の代謝系における許容できる遺伝子欠失の最大数を決定することは、複数の遺伝子欠失が同時に調べられ得る個別の最適化戦略を必要とする。線形代謝モデルの全ての代替最適値を同定するために個別の最適化を利用する関連した研究法がリーら(2000)により提唱された。
【0075】
本発明に従って、本発明者らは細胞性能の化学量論的限界が複数遺伝子の付加又は欠失の存在下においてどのように拡大又は縮小するかを調べる。より最近のデータに基づいてカープ(1999)により示唆された修正を含めたプラマニックとキースリング(1997)により供される反応経路を組み込んで、大腸菌の細胞代謝のFBAモデルが構築される。この修正はより最近の代謝情報に基づく小分子の補正か又は大腸菌の遺伝子型から現在存在しないと知られているある種の経路の除去のいずれかである。キョウト・エンサイクロペディア・オブ・ジーンズ・アンド・ゲノムスから得られる全代謝反応を含み且つシリングにより示唆された化学量論行列がコンパイルされ、そして該モデルに組み込まれる(シイ.エイチ.シリングら、Biotech. Prog. 15, 288(1999))。本発明者らはこの複数種の化学量論行列を汎用化学量論行列と呼ぶ。流束均衡解析の短い論議が次に提示され、続いて遺伝子の付加及び欠失の定式化並びに大腸菌におけるバイオマス及びアミノ酸生産へのそれらの適用が提示される。
【0076】
8.1 流束均衡解析
流束均衡解析(FBA)は、細胞に有効な流束分布の限界を同定するために生化学経路の化学量論及び細胞組成物情報のみを必要とする。微生物は、結果的にこれらの有効な限界を単一の点に崩壊させる極めて複雑な制御構造を進化させてきたが、FBAモデルは性能目標の上限を設定する際、及び「理想的な」流束分布を同定する際に依然価値がある。FBAの基礎をなす原理は目的の代謝物についての質量平衡である。N個の代謝物及びM個の代謝反応から成る代謝ネットワークに対して、
【0077】
【数8】
が得られる。上式中、Sijは反応j における代謝物i の化学量論係数であり、vjは反応jの流束を表し、biは代謝物iのネットワーク摂取(負の場合)又は分泌(正の場合)を定量する。全ての内部代謝物に対して、biは0である。可逆反応は単に反対方向の二つの不可逆的反応と定義され、全ての流束を正の数に制約する。
【0078】
通常、得られる方程式の流束均衡系は、反応の数が代謝物の数を超過するとき過少決定され、そして該反応流束を解くためには更なる情報が必要である。幾人かの研究者は制約としてそれらの過少決定モデルに付加するための外部流束を測定し、それらを完全に決定し又は過剰決定した(エイチ.ヨルゲンセンら、Biotechnol. Bioeng. 46 117 (1995);イー.パポウトサキスとシイ.メイヤー、Biotechnol. Bioeng. 27, 50 (1985);イー.パポウトサキスとシイ.メイヤー、Biotechnol. Bioeng. 27, 67 (1985);エイ.ポンズら、Biotechnol. Bioeng. 51(2), 177 (1996))。しかしながら、外部流束測定がシステムを完全に規定する前に反応経路を除去するなどの更なる仮定がしばしば必要となり、システムを完全に規定するために潜在的に活性な経路を無視することは算出される流束値に大きな変化をもたらしうる(プラマニック、1997)。代謝流束分布を調査する一般的な技術は線形最適化(ヴァルマ、1994)である。
【0079】
重要な推論は、細胞が化学量論的制約により許容されるあらゆる流束の組み合わせに及ぶことができ、従って所与の代謝目標(例えばバイオマス生産)を最大にする如何なる流束分布も達成できるというものである。バイオマス生産を最大にする線形計画法モデルは、
【0080】
【数9】
を条件として、
Z= vbiomassを最大にする。
上式中、 vbiomassはそれらの適切な生物学的比率におけるバイオマスの全ての必要な構成要素から成る流束ドレーンである。代謝物の生産を最大にし、所与の代謝物生産のためにバイオマス生産を最大にし、そしてATP生産を最小にするなどの他の目的関数も先行技術で研究されてきた。
【0081】
8.2 大腸菌の化学量論モデル
微生物の化学量論モデルは代謝を模倣するために研究された種において生じることが知られている反応の集合を組み込む。大腸菌ゲノムの完全な配列決定により、その生化学経路に関する豊富な知識が容易に利用できるので、大腸菌は本明細書で提示される研究のモデル生物になる。ヴァルマとパルソンは実験的観察を予測できる最初の詳細なFBA大腸菌モデルを提唱した(エイ.ヴァルマとビイ.オー.パルソン、J. Theor. Biol. 165, 503(1993))。その化学量論行列には、グルコースの異化及び高分子の生合成を模倣するために107個のの代謝物を利用する95の可逆反応が含まれた。このモデルは、増大する嫌気的条件で大腸菌の副産物の分泌を調べるために用いられ、実験上の観察(若干の嫌気的状況でまず酢酸塩、次にギ酸塩、最終的に高度に嫌気的条件下でエタノール)と一致する副産物の分泌の正確な順序を予測できた(エイ.ヴァルマら、Appl. Environ. Microb. 59, 2465 (1993))。先のモデルに基づいて構築して、プラマニックとキースリング(1997)は126の可逆反応(12の可逆輸送反応を含む)及び174の不可逆反応、並びに289個の代謝物を組み込んだモデルを導入した。プラマニックとキースリング(1997)は増殖速度の関数として大腸菌の高分子組成を相関させ、実験データを用いてそれらのモデルを確認した。該モデルはグルコース上の増殖についてのグリコキシレート分路の閉鎖及びオキサロアセテートへのPEPカルボキシナーゼ流束の傾きなどの幾つかの遺伝制御のレベルを首尾よく予測した。その上、グリコキシレート分路は酢酸塩上の増殖中活性であったが、PEPカルボキシキナーゼを介した流束はホスホエノルピルベートに向いていた。
【0082】
本研究で用いられる化学量論的大腸菌モデルは、プラマニックとキースリング(1997)により発表されたモデルから大幅にコンパイルされた178の不可逆反応、111の可逆反応及び12の輸送反応を用いる。プラマニックとキースリングの化学量論行列に対する修正は図12の表で与えられる。これらは基本的に小分子の訂正(例えばコハク酸塩チオキナーゼに対するGTPの代わりにATP)又はより最近のデータ(カープ、1999)に基づいた大腸菌に存在しないことが知られている反応の除去である。最も最近発表されたエドワードとパルソンの大腸菌モデル(2000)にも同様な変更が独立して含まれることに留意せよ。この代謝ネットワークは、該システムに入るためのグルコース又は酢酸塩の制約供給とともに、アンモニア、硫酸水素塩、及びリン酸塩の非制約供給を可能とする輸送反応により燃料供給される。酸素の摂取は好気的条件を模倣させるために制約されていない。乳酸、ギ酸、エタノール、グリセルアルデヒド、コハク酸、及び二酸化炭素副産物の非制約的分泌経路は輸送反応流束により提供される。汎用モデルは、キョウト・エンサイクロペディア・オブ・ジーンズ・アンド・ゲノムスから得られる3,400の細胞反応を修正されたキースリング化学量論モデルに組み込むことにより構築される。汎用化学量論行列は、大腸菌で生じることが知られている全ての反応並びに他の生物に由来する幾つかの反応を含む。
【0083】
8.3 遺伝子欠失/付加の数学的モデル化
事実上、どの代謝反応も、一つ以上の遺伝子の翻訳により生産される一つ以上の酵素によりある程度まで調節される。結果として、微生物のDNA配列からある種の遺伝子を除去すると、これらの遺伝子にコードされる酵素の役割に応じて、致命的であるか、又はあるとしてもほとんど効果を持たない。逆に、組換えDNA技術によるある種の遺伝子の付加は、影響が全く無いか又は新規な望ましい細胞機能を生じ得るかのいずれかである。大腸菌の代謝の化学量論モデル及び複数の種で生じる反応を包含する汎用化学量論行列が与えられると、この節の目的は、(i)複数遺伝子の欠失の存在下における細胞の頑健性を捕らえ、且つ(ii)所与の代謝目標の改良に最も大きな効果を有するさらなる遺伝子を汎用データ・セットから同定する、数学的モデルを定式化することである。
【0084】
第一に、あらゆる可能な遺伝子の集合として K ={k}={1,...,M,...,T}を定義する。ここで、Mは大腸菌遺伝子の数を表し、Tはデータ・セット中の遺伝子の総数を表す。この集合は E とNEの二つの部分集合に分配され得る。ここで、部分集合 E は大腸菌に存在する遺伝子を表し、部分集合 NE は非大腸菌種にのみ存在する遺伝子を表す。
【0085】
ε={k|1≦k≦M}
ηε={k|M+1≦k≦T}
続いて、2値変数 yk に個々の遺伝子kの存在又は欠如を記述させる。
【0086】
yk = 遺伝子kが宿主生物で発現しない場合、0
遺伝子kが存在し且つ機能的である場合、1
DNA組換えから欠失又は挿入についての最適な遺伝子選別の選択はyにおける非0要素の数を適切に制約することにより決定され得る。大腸菌から所与数の遺伝子dを除去する事例は下記の制約を含めることにより研究できる。
【0087】
【数10】
これは僅か(M-d)個の遺伝子が代謝ネットワークに利用できることを保証する。同様に、任意の付加遺伝子 h を導入する効果は、
yk=1、∀k∈ε (8)
【0088】
【数11】
を利用することにより研究できる。方程式(8)は必要ならば全ての大腸菌遺伝子が存在し機能的であることを可能にする、一方、方程式(9)は許容できる付加の数に上限を設定する。このモデルにより選択される最適な遺伝子はどのNEの要素が1に等しいかを決定することにより得られる。その上、複数の遺伝子がしばしば一つの反応に対応し、そして時折、複数の反応が一つの遺伝子にコードされる一つの酵素により触媒されるので、2値パラメータajkはどの酵素がどの遺伝子にコードされるかを記述するように定義される。
【0089】
αjk = 遺伝子kが反応jに直接的効果を及ぼさない場合、0
遺伝子kが反応jを触媒する酵素をコードする場合、1
パラメータajkは遺伝子機能の割り当てと反応との連関を確立する。流束値vjが非0値をとるためには、少なくとも一つの遺伝子はこの反応を触媒する酵素をコードしなければならず(αjk=1)、そしてこの遺伝子は宿主生物中に存在し且つ機能的でなければならない(yk=1)。少なくとも一つの遺伝子が個々の酵素をコードしなければならないとすると、
【0090】
【数12】
は、反応jの酵素をコードする遺伝子が機能しない場合は0であり、反応jの酵素をコードする遺伝子の少なくとも一つが機能する場合は1又は1より大である、という関係式が得られる。これは、次の制約
【0091】
【数13】
が反応jを支持できる活性遺伝子kが存在しない場合、vj=0を保証することを意味する。この場合、
【0092】
【数14】
これは今度はvjの値を0にさせる。或いは、このような遺伝子の少なくとも一つが機能するならば、
【0093】
【数15】
であり、vjは下限 Ljと上限Ujの間の任意の値をとることを可能とする。これらの限度は化学量論的制約を受けた所与の流束値 vj をそれぞれ最小化/最大化にすることにより設定される。これらの問題は市販のソフトウェア・パッケージGAMSを通してアクセスされるCPLEX6.6を用いて解かれる。3700までの2値変数を持つ問題はIBM RS6000-270ワークステーションで解かれた。
【0094】
8.4 遺伝子削除研究
本提示に従うこの実施例において、本発明者らは、何がグルコース基質上のバイオマス生産を最大化できる最小遺伝子セットであるか(摂取基準:10mmol)そしてバイオマス生産の特定レベルを依然維持するこの遺伝子セットから、最大何個の遺伝子欠失が可能であるかを決定する。第一に、本発明者らはバイオマス生産流束値 vbiomass を最大化した。この解は化学量論的制約内で代謝ネットワークにより達成できるバイオマス生産の最大理論レベル( vmax biomass 値=1.25gバイオマス/g DW ・時間)を与える。次に、バイオマス生産の特定目標レベル vtargetbiomass (最大値の百分率として)を維持する最小数の遺伝子を決定する。新たな目的関数は vtargetbiomass 以上のバイオマス生産 vbiomass を設定する制約にかけられた細胞に利用できる機能的な大腸菌遺伝子の総数を最小にする。この問題は、
【0095】
【数16】
【0096】
【数17】
を条件として
【0097】
【数18】
を最小化するものとして定式化される。
上式中、ykの非0要素は目標増殖速度を達成できる最小遺伝子セットを規定する。最大理論増殖速度を維持できる最小遺伝子セット M100% は vtargetbiomass=100%・ vmax biomassを設定することにより得られる。このモデルは、400の利用できる反応のうちの202の非輸送細胞内反応(111x2の可逆反応+178の不可逆反応)が vmax biomassを維持するために必要であることを予測する。これらの反応には、解糖反応、ペントースリン酸経路、TCA回路、呼吸反応及び最適増殖に必要なあらゆる他の同化及び異化経路が含まれる。
【0098】
M100%が与えられれば、次の目標は、代謝ネットワークに特定の最適以下の増殖速度を依然維持させながら、これらの遺伝子のどれを欠失させうるかを決定することである。これは、 vtargetbiomassを vmax biomassの種々の百分率に等しく設定し、M100%以外の細胞内反応流束値を0に制約することにより達成される。この仮定は該モデルがM100%セット以外の任意の遺伝子を活性化することを防止することに留意しなければならない。この仮定の意義は下記の節で論じる。種々のバイオマス生産レベルにおいて許容できる遺伝子削除の数は図13で与えられるが、一方選択される遺伝子の除去は図14の表に示される。予測されるように、該ネットワークに対するバイオマス生産の要求は少なくなるにつれ、該モデルはより多くの遺伝子削除を許容する。しかしながら、許容できる削除の範囲はかなり小さい。具体的には、該モデルは、90%・ vmax biomassのバイオマス要件の場合多くとも9つの遺伝子欠失を許容する、一方、18の遺伝子除去は該ネットワークにバイオマス形成をできなくさせる。従って、M100%の全要素を含む部分集合から18遺伝子の欠失を減じると(194遺伝子)、用いられるFBAモデルについて大腸菌の細胞増殖を維持できるM100%の最小の部分集合を表す。更に、全ての部分集合はエドワードとパルソン(2000b)により実施された大腸菌のイン・シリコの遺伝子欠失研究により同定された中心的な代謝の7つの実験的に立証された必須の遺伝子産物を含む。
【0099】
8.5 遺伝子欠失研究についての討論
特定遺伝子の欠失の研究は種々のエネルギー生成経路の効果に興味ある洞察を与える。示唆された遺伝子の欠失は、該細胞への必要なバイオマス生産要求が低減するとき、該ネットワークのエネルギー状態が改良されることを示している。これは、バイオマス要件が減少するとき、最適化の定式がエネルギーの形成を担う経路を順次排除するという事実により証明される。このような観察の一つは、TCA回路の段階的な分解を含む。該モデルがバイオマスの最適レベルの80%のみを生産するよう制約される場合、該ネットワークはもはやコハク酸デヒドロゲナーゼ酵素を利用してFADH2を生産することをしない。更に、バイオマス生産要件を70%まで低減することにより、fumAB、mdh、及びsucCD遺伝子の除去が可能となり、単位反応流束当たり1GTP及び1NADHの形成が無くて済むようになる。排除されるべき次の主要なエネルギー形成経路は20%のバイオマス生産レベルで生じる。この時点で、細胞のエネルギー状態は細胞のプロトン勾配からATPの形成をもはや必要としない。最後に、最低のバイオマス生産レベルでは、該細胞は細胞膜を横切ってプロトンを通過させるためにNADHの酸化をもはや要しない。
【0100】
この研究は、種々のエネルギー生成経路への細胞増殖の依存性に洞察を与え、細胞増殖を可能にする最小数の代謝遺伝子の見積りを可能とする。194遺伝子の予測は、ヘモフィルス・インフルエンザエ及びマイコプラズマ・ゲニタリウムの完全なゲノムを研究し且つ大きな系統発生距離を超えて保存される遺伝子が必須である蓋然性が極めて高いと仮定することにより得られたムシェギアンとクーニン(1996)による256の理論的見積りより低い。この反応に基づいた枠組みが翻訳、転写、複製、及び修復、及び化学量論モデルによる経路の一括化と関連する遺伝子を明らかにする能力に欠けることを考慮すると、これは予測された。より実用的な比較は、最小遺伝子セットの見積りに含まれる代謝遺伝子の数の考慮を含む。この場合、予測された194の代謝遺伝子セットはムシェギアンとコーニン(1996)により提唱された最小遺伝子セットに含まれる94の代謝遺伝子を過剰に見積もっている。この過剰な見積りは、本来の最適な遺伝子セット以外の代謝遺伝子を活性化する効果が研究されなかったために部分的に生じる。これは更なる代謝経路を開くことにより最小遺伝子セットの見積りを下げる。その上、この研究はグルコースが有機燃料として該ネットワークに入ることのみを許容した、限定された代謝能はヌクレオシド、アミノ酸、及び他の代謝物の輸入に比例してより大きく依存することにより補填され得る(シイ.エイ.フッチソンら、Science 286, 2165(1999))。
【0101】
8.6 アミノ酸生産の最適化研究
この節において、本発明者らは大腸菌の代謝ネットワーク内に組込むために数学的に最適な反応経路を同定しグルコース及び酢酸塩上での増殖におけるアミノ酸形成を最適化する。本発明者らは全部で20アミノ酸の理論的に最適な形成を開発した。それぞれの最適化の実行は、(i)大腸菌に存在する反応のみを含む事例及び(ii)該モデルが汎用化学量論行列から全反応を選択することを許す事例の二つの事例について行った。アミノ酸の生産を最大化する問題は、方程式(7)のvbiomass 代わりにアミノ酸の蓄積baaを置換することにより定式化され、一方、汎用ネットワークのアミノ酸形成bUNVaaを最大化する問題は、
【0102】
【数19】
を条件として、
Z=bUNVaa
を最大化するものとして定式化される。
【0103】
この定式化により、複数種の反応一覧表から任意の数の反応を選択できることに留意せよ。該モデルにより選択されるが大腸菌には存在しない反応(即ち、NEの全ての非0yk要素)は、組換えDNA技術により細胞代謝を操作するための経路を提供する。汎用行列からの反応の追加がある場合及び無い場合の大腸菌代謝ネットワークの理論的アミノ酸生産能は、グルコース及び酢酸塩上の増殖の場合、図9の表に示される。正確な数値よりもより有意義なことは、該モデルにより予測される構造的な経路の変化であることに留意しなければならない。なぜなら、これらは理論的な最大収率計算であるからである。ヴァルマとパルソン(1993)のモデルによる予測を比較のために示す。予期されるように、ヴァルマとパルソン(1993)のモデルによる最大生産能は、生産に利用できる更なる代謝経路を含めたより複雑なモデルの予測を僅かに下回る。
【0104】
この結果は、大腸菌の7アミノ酸の生産経路に対する改良が種々の生物から得られる遺伝子の追加により理論的に達成可能であることを示している。アルギニン経路の操作は最大の有望性を示し、グルコース及び酢酸塩上の増殖において追加の遺伝子によりそれぞれ8.75%及び9.05%の増加が得られた。最適な組換えアスパラギン経路はグルコース及び酢酸塩上での現在の大腸菌増殖を5.77%及び5.45%上回る増加を示し、一方、システイン生産はそれぞれ3.57%及び3.80%上昇し得る。ヒスチジン生産経路はDNA組換えのためのもう一つの有望な標的であることが明らかになり、同様に0.23%及び4.53%の改良が達成可能である。イソロイシン、メチオニン及びトリプトファンの形成経路は生産を増強するための最後の3つの遺伝子対象物を与える。
【0105】
これらの種々の改良を大腸菌のアミノ酸生産経路に導入するための責任を負う酵素は図15の表に示される。殆どの場合、本来のアミノ酸生産経路に僅か1又は2個の遺伝子の追加により最大理論収率が増大する。たとえ、3,400反応の完全な一覧表が選択に利用できるとしてもである。例えば、カルバミン酸キナーゼ及び6-ホスホフルクトキナーゼのピロリン酸依存体をコードする外来遺伝子を導入することにより、更にグルコース上での増殖のアルギニン生産を最適化する、一方、カルバミン酸キナーゼ及び酢酸キナーゼをコードする別の一遺伝子を追加することにより、酢酸塩上でのアルギニン生産経路を化学量論的に最適にする。大腸菌でアスパラギン酸−アンモニア・リガーゼ及び硫酸アデニリルトランスフェラーゼをコードする遺伝子を発現させることにより、上述したように、それぞれアスパラギン及びシステインの生産が増大する。グルコース及び酢酸塩基質上でのイソロイシンの生産及び酢酸塩上でのメチオニンの生産のみが該モデルに従って最適に到達するために二つ以上の更なる酵素を必要とする。
【0106】
8.7 遺伝子追加の研究についての討論
これらのアミノ酸経路の慎重な検討は、これらの追加酵素が本来の経路のエネルギー効率をどのように改良するかを明らかにする。グルコース上での増殖について本来の及び汎用的なアルギニン生産経路を図16に示す。二つの経路は二つの反応のみで異なる。即ち、汎用モデルの6-ホスホフルクトキナーゼのピロリン酸依存性類似体は大腸菌に存在するATP依存性のものに取って代わり、汎用モデルのカルバミン酸キナーゼは本来の大腸菌モデルに由来するカルバモイルリン酸シンセターゼに取って代わる。エネルギー利用の最初の改良は、汎用モデルの6-ホスホフルクトキナーゼがATPの代わりにアルギニノコハク酸シンターゼ反応から形成されるピロリン酸を用いて解糖の第三工程でリン酸基をフルクトース-6-リン酸に移転するために生じる。大腸菌モデルは、加水分解切断のためピロホスファターゼを介してこのピロリン酸を送り、結果としてこのエネルギー豊富なホスホアンヒドリド結合のエネルギーを浪費する。この他の方法で浪費されたエネルギーを取り戻すことにより、6-ホスホフルクトキナーゼのピロリン酸体は生産されるアルギニン分子当たり1未満のATPホスホアンヒドライド結合を必要とする。
【0107】
細胞エネルギー節約の第二の形態はカルバモイルリン酸シンテターゼの置換により実現される。天然のカルバモイルリン酸シンテターゼは2つのATPホスホアンヒドリド結合の消費で二酸化炭素から1モルのカルバモイルリン酸を形成する。この反応は1個のグルタミン分子のアミノ基をも必要とし、続いてグルタミン酸を形成する。グルタミン酸からグルタミンを再形成するためには更に他のATPを必要とするため、カルバモイルリン酸シンテターゼによる個々の単位流束は3個の ATPを必要とする。汎用モデルに組み込まれたカルバミン酸キナーゼは1個の ATPの消費のみで二酸化炭素及びアンモニアからカルバモイルリン酸を形成する。従って、カルバミン酸キナーゼは形成されるカルバモイルリン酸の単位流束当たり2未満のATP結合を必要とする。全体として、汎用モデルにより用いられた追加の遺伝子は本来の経路の正味の3 ATPを節約し、アルギニン生産を8.75%まで増大させる。同様な分析は図17に示される酢酸塩基質からの天然及び汎用のアルギニン生産経路でも行なうことができる。
【0108】
大腸菌のアスパラギン生産経路は該代謝ネットワークへのグルコースの投入の二つの様式、即ちグルコキナーゼ系及びホスホトランスフェラーゼ系、について図18に示す。興味深いことに、大腸菌モデルは、最適なアスパラギン生産中のグルコースの投入について、より一般的なホスホトランスフェラーゼ系よりグルコキナーゼを好む。グルコキナーゼは通常の条件下のグルコース代謝では小さな役割しか果たさないことが知られているが、この反応によるホスホトランスフェラーゼ系の置換は1.560モル/モル・グルコースから1.818モル/モル・グルコースにアスパラギンの生産を増加させる。ホスホトランスフェラーゼ系を通したグルコースの投入は、ピルビン酸からPEPを再生するためにホスホエノルピルビン酸(PEP)シンターゼを介した実質的な流束を必要とし、1 ADPホスホアンヒドリド結合の正味の消費を伴う。従って、大腸菌でグルコキナーゼを過剰発現すること又はより活性な組換えグルコキナーゼ酵素を追加することのいずれかがアスパラギン生産を改良しうる。図19はグルコース上でのアスパラギン生産に最適な汎用経路を例示する。大腸菌に存在するAMP形成版よりADPを形成するアスパラギン酸−アンモニア・リガーゼ酵素を選択することにより、この経路のエネルギー効率が改良される。現在、ピロリン酸結合エネルギーの保存のための経路が大腸菌で同定されていないので、AMPの形成は等価の2個の ATPホスホアンヒドリド結合を用いる。対照的に、ADPを形成することにより、汎用経路は単位流束当たり僅か1個のホスホアンヒドリド結合の分解しか必要でない。実際、汎用モデルのエネルギー効率は、アスパラギンの形成が膜貫通プロトン勾配からの ATPの形成を必要としないものである。この勾配は単に無機リン酸塩を細胞に輸送するために用いられる。この機構はアスパラギン生産をグルコース上での増殖で5.77%そして酢酸塩上での増殖で5.45%改良する。
【0109】
酢酸塩上の増殖における大腸菌モデル及び汎用モデルの最適なヒスチジン生産経路を図20に示す。ここでも、汎用モデルはATPホスホリボシルトランスフェラーゼ及びホスホリボシル−ATPピロホスファターゼの両方によるこの事例において形成されるピロリン酸のホスホアンヒドリド結合エネルギーを保存する反応を選択する。従って、該汎用モデルは生産されるヒスチジン分子当たり大腸菌モデルよりも少なくとも2個の ATPだけより効率的である。更に、大腸菌モデルへのグリシンデヒドロゲナーゼの追加は天然のヒスチジン経路の炭素転換を改良する。天然の大腸菌に最適なヒスチジン生産条件下で、細胞内グリシンはグリシン切断系により二酸化炭素とアンモニアに変換される。この工程において、グリシンの炭素の1つだけがテトラヒドロ葉酸へのその転移により保存される。他方、汎用モデルはグリシンをグリオキシル酸に転換することにより両方の炭素を保存する。該グリオキシル酸は続いてグリオキシル酸分路に汲み戻される。両機構はヒスチジンの最大理論収率を4.53%改良する。
【0110】
8.8 結論
提唱する最適化枠組みは、遺伝子の欠失又は付加に応答する代謝ネットワークの性能を研究する定量的手段を提供した。代謝ネットワークの性能は、遺伝子欠失に直面した場合の頑健性又は拡大を続ける利用可能な遺伝子のデータベースから得られる外来遺伝子の組換えによる流束の増強のいずれかに関する。現在、遺伝子−酵素の完全な関係は利用できないが、この定式化は、それが利用できるようになるとき、この情報の組み込みを可能とする。遺伝子削除分析は、増殖に最適化された大腸菌の代謝ネットワークが、その増殖要求が低下するとき遺伝子削除の量の増加に耐えうるであろうことを明らかにした。更に、このネットワークは、バイオマス生産がもはや可能でなくなるまでに理論的に多くとも18遺伝子の欠失に耐えうるであろう。遺伝子追加の研究は、DNA組換えにより大腸菌の遺伝子型に更なる選択肢を追加することにより、7種のアミノ酸の最大理論的生産が改良されることを明らかにした。これらの改良は二つの機構の一つにより生じる、即ち(i)エネルギー効率を改良することによるか、又は(ii)生産経路の炭素変換効率を増大させることによる。
【0111】
流束均衡解析の化学量論特性への厳格な依存性はその最大の強みであるがその最も顕著な弱点でもあるといえる。細胞内の流束分布は最終的に細胞内の調節機構、細胞酵素の運動特性、及びこれらの酵素の発現により唯一に決定される。細胞が化学量論的に最適な様式で機能すると仮定することにより、細胞に利用されうるものより幅広い代謝流束分布の限界を得る。現在、本発明者らは論理的制約を用いて調節情報を流束均衡モデルに組み込んでいる。これらの制約は、代謝濃度の上下変動が反応流束値の上下移行と一致することを保証する。より厳しく制約されたモデルは、過剰生産する細胞産物がどのように全体の代謝調節に影響を及ぼすかについての更なる洞察を与える。代謝モデルの正確度が向上し流束均衡解析に利用できる情報量が増すとき、本発明で導入された枠組みは実施に最も最適な遺伝子の付加及び/又は欠失の代謝操作を選択するために用いられ得る。
【0112】
9.実施例:異なる増殖要件及び/又は摂取環境下での大腸菌の代謝における最小反応セット
本発明の枠組みは、幾つかの異なる文脈において幾つかの代謝ネットワーク問題に適用できる。本発明の枠組みは異なる増殖要件及び摂取環境の下での大腸菌の代謝における最小反応セットを決定するためにも適用された。本発明に従って、異なる基質上での種々の増殖速度を支持できる代謝反応の最小セットを同定するための計算手順が、大腸菌の代謝ネットワークの流束均衡モデルに導入され適用される。この問題は一般化されたネットワーク最適化問題として数学的に提示される。特定の増殖速度を支持できる最小反応セットは、(i)有機物質の摂取を単一の有機成分(例えばグルコース又は酢酸塩)に限定する、及び(ii)利用できる細胞輸送反応を用いて如何なる代謝物も輸入可能とする、という二つの異なる摂取条件について決定される。本発明者らは最小反応ネットワークセットが該ネットワークに課された摂取環境及び増殖要件に高度に依存することを見出す。具体的には、本発明者らは、流束均衡モデルにより記載したような、大腸菌のネットワークはグルコースのみの培地上での増殖を支持するために224の代謝反応を必要とし、酢酸塩のみの培地上では229の代謝反応を必要とする一方、特別に操作された増殖培地上では122の反応のみで増殖が可能となる。
【0113】
完全に配列決定されたゲノムの最近の急増は幾つの遺伝子が細胞生命を維持するために必要であるかという疑問に著しい注目を集めてきた。最小ゲノムは一般に特定の環境で複製及び増殖できる遺伝子の最小セットとして定義される。この最小遺伝子セットを明らかにする試みは実験的研究法及び理論的研究法の両方を含む。広範囲のトランスポゾン突然変異誘発を用いてハッチソンら(1999)は、マイコプラズマ・ゲニタリウムの480個のタンパク質をコードする遺伝子の内265個から350個(最小と知られる細胞ゲノム(580kb))が実験増殖条件下での生存に必須であることを決定した。更なる実験研究は、酵母及びバチルス・ズブティリスのゲノムのそれぞれ12%及び9%のみが細胞の増殖及び複製に必須であることを明らかにした(エム.ジイ.ゴエブルとティ.ディ.ピーテス、Cell 46, 983(1986);エム.イタヤ、FEBS Lett. 362, 257(1995))。理論的方法は、広い進化的境界を越えて保存される遺伝子が細胞の生存に不可欠であるという仮定から出発する。この仮説に基づいて、エム.ゲニタリウム及びヘモフィルス・インフルエンザエに共通した遺伝子が最小ゲノムの構成員であるに違いないと仮定することにより、256遺伝子という最小セットがムシェギアンとコーニン(1996)によりコンパイルされた。興味深いことに、エム.ゲニタリウムに保存される未知機能の26個の大腸菌オープン・リーディング・フレームの内僅か6個が種の存続に必須であると判断された(アリゴイら、1998)。複数の、全く異なる、種及び環境に特異的な最小ゲノムの存在が長く憶測されてきた(フイネン、2000)。
【0114】
ここで、本発明者らは異なる摂取条件下での代謝反応の増殖維持に必要な最小のコアを見積もることによりこの主張を試験する計算手順を記載する。パルソンと共同研究者(エドワード&パルソン、2000b)により提唱された大腸菌の代謝の最新の化学量論モデルは、酢酸塩、又は複合基質のいずれかの増殖速度に関する所与の目標を支持できる酵素反応の最小セットを同定するために用いられる。この流束均衡解析(FBA)モデルは、解糖、トリカルボン酸(TCA)回路、ペントースリン酸経路(PPP)、及び呼吸経路、並びにアミノ酸、ヌクレオチド、及び脂質の合成経路を含む454個の代謝物及び720の反応を組み込む。増殖は、適切な生物学的比率で大腸菌バイオマスの種々の構成要素の排出を模倣するモデルに更なる反応を追加することにより定量される(エフ.シイ.ネイドハード、大腸菌及びサルモネラ:細胞生物学及び分子生物学、ASM出版編、ワシントン市、1996)。遺伝子を該ネットワーク中で個々の代謝反応に関連付けることにより、遺伝子の活性化及び不活性化は0〜1の論理2値変数を用いて該FBAモデルに組み込まれる。特定の代謝の目標(即ち増殖速度)を満たすために必要な活性代謝反応の数を最小にするという問題は一般化されたネットワーク流束問題の数学的構造をとって示される。ここで、ノードは代謝物を示し、接続アークは反応を示す。または、バイオマス目標の代わりに、ATP生産の最小レベル又は主要構成要素/代謝物の最低許容レベルが容易に該モデルに組み込まれうるであろう。混合−整数線形計画法(MILP)の解決ソフトであり、GAMSを通してアクセスされるCPLEX6.5は、分から日の範囲に及ぶCPU時間で、生ずる大規模な組み合わせ問題を解決するために用いられる。
【0115】
大腸菌のモデルに基づいて、(i)有機物質の摂取を単一の有機成分に限定する、及び(ii)対応する輸送反応を用いて任意の有機代謝物の摂取を許容する、という二つの対照的な摂取環境の下で異なる増殖要件についての最小反応ネットワークを調査する。これら二つの極端な摂取シナリオは、構成要素の合成のため内部代謝に最大限に依存する場合と最小限に依存する場合をそれぞれモデル化し、必要な最小反応セットに及ぼすそれらの効果を調べるために選択された。先の試みは、一連の遺伝子削除を通して必須遺伝子のセットを抽出するために還元主義の方法論を利用した。ここで、本発明者らは細胞増殖に及ぼす全ての反応の効果を同時に考慮することにより最小セットを選択する効率的な計算手順を用いる。次に、これらの反応を触媒する酵素(単数又は複数)を対応するコード遺伝子に位置付けることにより最小遺伝子セットを推論する。得られる結果は、原理的には、用いられる流束均衡大腸菌モデル(エドワードとパルソン、2000)の細目に依存するが、それはなお、何が最小ゲノムであるかそしてそれが環境によりどのように形成されるかという疑問に対して価値ある洞察及び展望を提供する。
【0116】
9.1 結果
最初の事例研究は、グルコース基質上での大腸菌の増殖を支える最小反応セットを同定する工程を含む。用いられるモデル化手法の詳細な記載は付属書に提供される。無機リン酸塩、酸素、硫酸塩、及びアンモニアの制約されていない摂取経路とともに、制約された量(<10 mmol/gDW・時間)のグルコースは代謝ネットワークに燃料供給できる。細胞から出ていくことのできるあらゆる代謝物の分泌経路も提供される。これらの条件下において、FBAモデルは、大腸菌の反応ネットワークが0.966gバイオマス/gDW・時間の最大理論増殖速度を達成できることを予測する、本発明者らはこれを最大増殖速度(MGR)と呼ぶ。該反応ネットワークがこのMGRに適合することを要求することにより、本発明者らは720の反応の内少なくとも234の反応がグルコース上での最大増殖に必要とされることを決定した。
【0117】
次いで、種々の最大以下の増殖要求(MGRの%)を満たすために必要な代謝反応の最小数を同定するために、増殖要求は次の研究で緩和される。興味深いことに、図21に示されるように該ネットワークに課された増殖要求が低下しても、必要な代謝反応の数は穏やかにしか減少しない。234個の反応から成る反応セットが最大増殖に必要であるが、30%以下の増殖速度に対応する最小反応セットは僅か224の反応を含む。同じ最小反応セットはMGRの0.1%という低い増殖速度でさえ持続する。一般的に、反応セットの減少は、増殖要求が減少する際に、(i)解糖、(ii)TCA回路、及び(iii)ペントースリン酸経路で生じるエネルギー生産反応を巧く除去することにより達成される。しかしながら、より速い増殖速度で存在しないある種の反応がより遅い増床速度での最小セットに加わる。このことは連続的な反応の排除より遥かに複雑な流束方向転換の機構があることを示唆している。課された増殖要件が低減する際に最小反応セットに参加する/退場する反応の詳細な記載は図22の表で提供する。
【0118】
比較のため、グルコースの代わりに制限された量の酢酸塩(<30 mmol/gDW・時間)を該ネットワークに投入できる同様な研究が実施された(図21を参照)。ここで、該ネットワークは反応セットの減少に対してグルコースの研究におけるより遥かに寛容でない。グルコース基質では増殖要求が低減するとき最小ネットワークの大きさは234反応から224へと減じるが、酢酸塩基質では該ネットワークの大きさは231反応から229へ減少するだけである。これは、最小反応セットの大きさが課されたバイオマス生産要件に依存しているだけでなく、単一基質についての具体的な選択にも依存していることを意味している。
【0119】
最小反応セットもそれらの対応する反応流束も固有でないことに留意することが重要である。例えば、30%のグルコース摂取の事例では、本発明者らは、該ネットワークに存在する171のイソ酵素と関連する多様性を計数することさえしないで、正確に224の酵素反応を含む100を上回る異なる最小反応セットを同定した。これらの殆どの複数の最小反応セットの中で、主要経路の活性及び流束方向は極く僅かしか異なっていない。最大の変化はネットワークの異化部分に集中する。例えば、一部の最小反応セットは代謝副産物として二酸化炭素、酢酸、及びフマル酸のみを分泌するが、他のセットは種々の量のギ酸、グリセロール、及びフェニルアラニン及びチロシンといったアミノ酸も分泌しうる。これらの結果は、大腸菌ネットワークの驚異的な減少及び流束方向転換の多様性をコンピュータ計算により確認させる。より重要なことは、同定された全ての最小反応セットが、それらの対応する遺伝子欠失がグルコース上での増殖に致死的であることが実験的に決定された12の反応の内の11の反応を含むことである。線形最適化を用いこのモデルで行われた単一の遺伝子欠失に基づいた先の分析は、12の致死的遺伝子の欠失の内7個のみを同定した、このことはMILP枠組み内で同時遺伝子欠失を考慮する重要性の動機付けとなる。
【0120】
第二の事例研究では、任意の有機代謝物の摂取又は分泌が可能である。このネットワークに投入される有機物質の量は炭素原子の制限量(<60 mmol/gDW・時間)を摂取させることにより第一の事例研究と一致させる。酸素、無機リン酸、硫酸及びアンモニアの制約されていない摂取経路も第一の研究と同様に与えられる。これらの「理想的な」摂取条件の下で、1.341gバイオマス/gDW・時間という最大増殖速度が達成可能であり、この場合少なくとも201の代謝反応を要することが見出される。僅か5個のアミノ酸しか最大増殖(即ちMGR)条件下で輸送されないという事実は、該培地から細胞内へそれらを輸送するのではなく内部で殆どのアミノ酸を生産することが化学量論的により有利であることを示している。
【0121】
しかしながら、この傾向は増殖速度の要件が低減するにつれ急速に逆転する。この逆転は、最大以下の目標増殖要求の下で、代謝物の輸入数の増加の直接的な結果として必要な反応の総数の対応する急激な減少をもたらす。図23の表は、各目標増殖速度で摂取又は分泌される代謝物を列挙し、一方、図24(MGRの100%〜90%)及図25(MGRの100%〜1%)は種々の目標増殖要求を達するために必要とされる代謝反応の数を例示している。バイオマス要求が低減するとき、輸入する代謝物の数を増加させることによる最小反応セットの大きさの急速な減少(図23を参照)は、増殖要求がMGRから約90%まで低減するまで続く。この増殖目標(図25を参照)より下では、付加的だが適度の減少が主として流束方向転換により達成される。図26は増殖目標が引続いて減少するとき、最小反応セットから除去され又はこれに追加される反応をまとめている。122の反応から成る第二の事例研究の最小反応ネットワークは目標増殖要求がMGRの10%まで低減する場合に達成される。この最小ネットワークは、図27に示されるように、幾つかの輸送反応及び再利用経路の反応とともに、主に細胞エンベロープ及び膜脂質の生合成反応から成る。グルコースのみの研究と同様に、複数の有機物摂取の事例についての複数の最小反応セットが予測される。
【0122】
9.2 討論
この研究では、本発明者らは、(i)グルコース又は酢酸塩のみの摂取環境、及び(ii)対応する輸送反応に関与する任意の有機代謝物の自由な摂取又は分泌という、二つの異なる摂取環境の下で増殖を支えることができる大腸菌の代謝反応の最小数を同定した。得られた結果は、最小反応セット、従って対応する最小遺伝子セットが増殖培地により与えられる摂取機会に強く依存することを定量的に証明している。グルコース又は酢酸塩のみを含む培地上で増殖する大腸菌細胞が増殖を支えるためにそれぞれ少なくとも224又は229の代謝反応を必要とするが、一方、豊富で最適に操作された培地上で培養された細胞は理論的に僅か122の代謝反応で増殖を支えうるであろう。その上、単一の基質の選択は最小反応セットの大きさ及び組成に影響を及ぼす。予期されるように、最小反応セットは必要な増殖速度が増加することにより大きくなる。しかしながら、この増加の大きさは試験された事例で全く異なる。事例(i)では、最小反応セットはグルコース上での最大増殖速度を満たすために224から234まで増加するのみであり、酢酸塩増殖では229から231まで増加する、一方、事例(ii)では、最小反応セットは122から201までほぼ倍増する。別の重要な観察は大腸菌の代謝ネットワークの大規模な減少であり、これは、グルコース上の増殖に利用できる代謝反応の僅か31%、そして複合培地上の増殖に利用できる反応の僅か17%しか利用せずに増殖を支えることができることを示す。これらの減少した最小反応ネットワークのセットでさえも、大きな多様性を示す。具体的には、100の代替的最小反応セットの非網羅的な一覧表がグルコースのみの摂取事例について同定された。
【0123】
本発明者らの分析は、大腸菌の完全な最小ゲノムの部分集合であり且つ種に特異的な最小代謝反応セットを提供することに留意しなければならない。これは、翻訳、複製、組換え、修復、転写に関連する遺伝子、及び未知機能の遺伝子を考慮できない、反応に基づく分析を採用した結果である。マイコプラズマ・ゲニタリウムを用いた研究における、ハッチソンらの必須遺伝子セット及びムシェギアンとコーニンにより提唱された最小遺伝子セットと本発明者らの最小代謝反応セットとの比較を図28に示す。得られた結果は、限られた代謝能力がヌクレオシド、アミノ酸、及び他の代謝物の輸入への比例して大きくなる依存により補償され得るというハッチソンと共同研究者(2)の発見と概念的に一致する。エム.ゲニタリウムの完全なゲノムに基づく代謝ネットワークの再構築は現在利用できず、反応ごとの比較は不可能であるが、これら三研究における種々の機能的分類の中での代謝遺伝子/代謝反応の分布は全く同じである。従って、この研究で大腸菌に適用された同時反応除去の戦略はおそらくエム.ゲニタリウムに課された進化の圧力に匹敵し、そのゲノム大きさを減じるであろう。本発明者らの分析における最小反応セットの大きさの過剰見積りは概ねその種に特異的な性質によるものであろう。大腸菌の細胞エンベロープは主としてペプチドグリカンから構成される細胞壁を含むが、マイコプラズマの細胞エンベロープは細胞壁を欠く。従って、大腸菌の生存に必要な多数の細胞エンベロープの反応はハッチソンらの遺伝子セット及びムシェギアンとコーニンのそれに含まれない。別の一要因は、同様な代謝物が一つの遺伝子と関連する機構により輸送され得るにもかかわらず、本発明者らが個々の代謝物の摂取又は分泌に異なる反応/遺伝子を割り当てることである。更に、本発明者らの分析は大腸菌のモデルに基づいているため、おそらく非大腸菌種に存在するより効率的な反応の組み合わせが最小遺伝子セットを更に減少させ矛盾を減らしうるであろう。
【0124】
この枠組みは更なる種の最小反応セットを構築するために利用され得る。これらの最小セットを対比することにより、異なる進化上の分岐に沿ってどのように最小反応セット(代謝遺伝子セット)を比較するかが推論されうるであろう。具体的には、エム.ゲニタリウム及びエイチ.インフルエンザの最小反応セットは決定され先の研究とともに基準化されうるであろう。その上、種に依存しない最小代謝反応セットは多数の異なる種に生じる反応を汎用化学量論行列(15,16)内で一括することにより追求され得る。最小細胞の基本機能を表すより複雑なモデルが開発されると、より詳細事項が該モデルに付与され得る。「最小」代謝ネットワークを合理的に同定するためにこのMILP枠組みを利用することに加えて、MILP枠組みは異なる生物及び異なる摂取環境において致死的遺伝子欠失をイン・シリコで予測するためにも用いられ得る。病原微生物(例えばエイチ.ピロリ)の致死的遺伝子欠失を同定することにより、治療介入(即ち遺伝子発現の妨害)のための有望な標的の序列付けされた一覧表をコンパイルすることができる。提唱された計算手順が採用されたFBAモデルの仮定に依存しているとしても、異なる摂取/分泌環境を研究するため並びに最小ゲノムについての研究において複数の種に由来する反応セットを包含するための多様性を与える。
【0125】
9.3 モデル化及び計算手順
流束平行分析は、潜在的に該細胞に利用できる流束分布を同定するために生化学経路の化学量論及び細胞組成情報に依存している。N個の代謝物及びM個の代謝反応から成る代謝ネットワークについて、本発明者らは、
【0126】
【数20】
を有する。上式中、Xiは代謝物iの濃度であり、Sijは反応jにおける代謝物iの化学量論係数であり、vjは反応jの流束値を表す。通常、得られる方程式の系は過少決定される(反応の数が代謝物の数を超過する)。増殖速度の最大化は時折細胞適応度の代用物として用いられる。重要な仮定は、該細胞が化学量論的制約により許容される全ての流束組み合わせに及ぶことができ、従って所与の代謝対象を最大化する任意の流束分布を達成できることである。これは、運動及び/又は調節の制約を無視することによりアクセスできる流束の領域を過剰見積りすることがある。バイオマス生産又は同等な増殖速度(1gDW・時間基準を仮定する)を最大化するための最適化モデル(線形計画法)は、
【0127】
【数21】
を条件として、Z=vバイオマスを最大化する。
【0128】
上式中、vbiomass はそれらの個々の比におけるバイオマスのあらゆる必要構成要素から成る対応する反応流束値である。1グラムのバイオマスはvbiomass の単位流束当たりで生産される。変数biは代謝物iの摂取(負の符号)又は分泌(正の符号)を定量化する。事例(i)において、アンモニア、グルコース、酸素、リン酸、及び硫酸のみがbiについて負の値を有することが許され、細胞からの輸送反応を持つ任意の代謝物は分泌され得る、一方で、事例(ii)において、全ての有機代謝物が輸入され得る。この研究において、本発明者らは、バイオマス生産の最大レベル及び最大以下のレベルを維持できる代謝反応の最小数が何であるかを調査する。それらの対応する遺伝子に反応を位置付けすることにより、バイオマス生産と遺伝子発現との連結が確立される。0〜1の論理変数を流束均衡解析枠組みに組み込むことにより、反応、従って遺伝子の存在/非存在が数学的に記載される。これらの2値変数
yj = 反応流束値vjが活性である場合、1
反応流束値vjが活性でない場合、0, j=1, ...,M
は、反応jが活性である場合1の値そして不活性である場合0の値をとる。下記の制約、vmin j ・yj≦vj≦vmax j ・yj, j=1,...,M
は、反応jを触媒する酵素をコードする遺伝子が存在したり機能的であったりしない場合、反応流束値vjが0に設定されることを保証する。或いは、このような遺伝子が活性である場合、vjは下限の minj と上限の maxj の間の値を自由にとる。バイオマス生産 v target biomass の目標値を満たすことができるネットワークにおいて機能的反応の総数を最小化する混合−整数線形計画法問題は下記の通りである。
【0129】
【数22】
を条件として、
【0130】
【数23】
を最大化する。
【0131】
上記のMILPは一般化されたネットワーク問題の部類に属する。ここで、個々の代謝物はノードを構成し、個々の反応は該ネットワークのアークを表す。
【0132】
1000を上回る2値変数の存在は、この問題を、一部の場合、コンピュータで解決困難にする。具体的には、このコンピュータ計算負担は、バイオマス目標値の低下で増大し、複数の摂取と関連した追加の複雑性により事例(i)より事例(ii)で遙かに大きい。該計算負担を緩和するために、4つの前処理技術が用いられる。即ち、(i)イソ酵素のグループ分け、(ii)無駄な周期の排除、(iii)流束限界の作成、及び(iv)連結性の制約の付加である。イソ酵素のグループ分けはイソ酵素により触媒される171の反応の集団を指す。触媒する酵素(即ちイソ酵素)のみを異にする反応は一緒のグループとし、全てのイソ酵素を一つの反応として扱う。これは2値変数の総数を切捨てることにより複雑性を減じる。無駄な周期の排除は、代謝に及ぼす正味の影響無しにループ中で集合的に流束を再循環する反応(2以上)の集合の除去を扱う。特別な事例は両方向で非0の流束を有する可逆反応である。一般的に、K個の反応から成る集合Kは、
【0133】
【数24】
の場合、無駄な周期を形成する。下記の制約は、それらの少なくとも一つが不活性で該周期を切断することを保証する。
【0134】
【数25】
全体として、346の無駄な周期が同定され、該モデルから排除された。大半の無駄な周期は単に可逆反応を含んでいた。
【0135】
得られるMILP問題の解決時間は流束値vjに課された下限 minj 及び上限 maxj の確かさに大きく依存している。確かな限界の minj 及び maxj は流束均衡制約及びバイオマス標的規格を条件として、あらゆる単一反応流束値vjをそれぞれ最小化及び最大化することにより得られる。
【0136】
【数26】
を条件として、vj*を最大化/最小化する。
【0137】
これは線形計画法(LP)の問題(2値変数でない)であり、あらゆる事例について迅速に解ける(即ち数秒未満)。異なる制限が異なるバイオマス目標について作成されることに留意せよ。該バイオマス目標が高くなるほど、得られる制限はより厳しくなる。
【0138】
連結性の制約は、細胞内代謝物を生産する反応が活性であるならば、この代謝物を消費する少なくとも一つの反応が活性でなければならずそして逆もまた同様であることを保証するためにも付与される。その上、細胞外代謝物を細胞内に輸送する反応が活性であるならば、この代謝物を消費する少なくとも一つの細胞内反応は活性でなければならずそしてその逆もまた同様である。これらの反応は、反応セットJを二つのサブセット、即ち細胞内反応を表すJint及び代謝物を細胞に/細胞から輸送する反応を表すJtrans、に分配した後、下記のように該モデルに組み込まれる。該代謝物セットIも細胞内代謝物及び細胞外代謝物をそれぞれ表すIint及びI ext のサブセットに分配される。
【0139】
【数27】
これらの連結性の制約は外部の代謝物とバイオマスの構成要素の間の適切な連結を保証できる反応の最小セットを同定するためにも用いられる。この問題は、ybiomass =1の活性なバイオマス反応を有する制約(10〜13)を条件として
【0140】
【数28】
を最小化する工程を含む。
【0141】
複数の最小反応セットの反復作成は整数の切捨てを累積しMILP定式化を解決することにより達成される。個々の整数の切捨ては以前に見出された一つの解答を排除する。例えば、解答 yj * は下記の整数の切捨てを追加することにより検討対象から排除される。
【0142】
【数29】
全ての最適化問題はIBM RS6000-270ワークステーション上でのモデル化環境GAMSを通してアクセスされるCPLEX6.5を用いて解かれる。この研究で消費された総累積CPUは400時間のオーダーであった。
【0143】
10. 選択肢及び変更
本発明は、本発明のモデル化枠組みを代謝ネットワーク問題の解決に適用できるかなり多数の方法を意図する。本発明の枠組みは、論理的制約を定義するために使用できるような定性的情報を用いて流束均衡モデルを改良するための体系的研究法を用いる。この情報は、定性的運動情報の制約、定性的調節情報の制約、差別DNAマイクロアレイ実験データの制約、及び他の論理的制約を含み得る。
【0144】
本発明のモデル化枠組みは種々の代謝問題を解決するために適用され得る。これは、遺伝子の付加及び/又は欠失の影響を決定する工程、最適な遺伝子付加を決定する工程、致死的遺伝子欠失を決定する工程、最小反応セットを決定する工程、並びに他の代謝操作を決定する工程を含む。これら及び他の問題は特定の増殖速度の要件、ある種の環境条件、又は他の条件を含みうる。
【0145】
本発明のモデル化枠組みはイン・シリコであるため、決して特定の生物に限定されない。本発明はかなり多数の生物がモデル化され得ることを意図する。本発明の精神及び範囲は請求されるもの全て及びそのあらゆる等価物を含むように広く解釈されるべきである。
【技術分野】
【0001】
優先権申し立て
本出願は、2001年1月10日に出願された仮特許出願第60/260,713号及び2001年3月23日に出願された仮特許出願第60/278,535号に対する優先権を主張する。これらの両方はその全体が参照により本明細書にインコーポレートされる。
【0002】
発明の分野
本発明は、細胞代謝のイン・シリコモデル化又は生物情報学的モデル化の方法及びシステムに関する。より具体的には、本発明は、これに限定されるわけではないが、特定の制約の組み込みによる流束均衡解析(flux balance analysis)(FBA)モデルを改良するモデル及び方法の枠組みに関する。これらの制約は、定性的運動情報、定性的調節情報、及び/又はDNA・マイクロアレイ実験データを、無制限に組み込む。さらに、本発明は特定の計算手順を用いて種々の代謝問題を解決することに関する。
【背景技術】
【0003】
配列決定された微生物遺伝子の数の急激な増加により触媒されて、代謝経路工学は近年大きな関心を集めてきた。2001年1月の時点で、50を上回る微生物のゲノムが完全に配列決定された。生物情報学的手段はそれらのコード領域の45%から80%に機能を割当ることを可能にした(非特許文献1を参照)。この新しく得られた情報は、遺伝子のノックアウト(削除)又は付加の後に代謝ネットワークの応答を計算するために微生物の数学モデルと併せて用いられる。例えば、このような情報は、代謝について工学処理された大腸菌細胞におけるエタノール生産を増大させるために用いられた(非特許文献2参照)。
【0004】
一般的に、細胞代謝の数学モデルは二つの異なる範疇に分類される。一方は運動及び調節の情報を組み込み、他方は反応経路の化学量論のみを含む。最初の部類のモデルは、本来の定常状態における細胞の挙動に適合し、次いで運動及び調節の諸関係を用いて、環境変化又は酵素工学によりもたらされる小さな摂動の存在下で該細胞がどのようにこの定常状態から外れて挙動するのかを調べる。この最初の部類の方法の重要な利点は、適用されると代謝流束空間の固有点が同定されることである。不利な点は、必要な運動パラメータを評価するのが困難であること、及び該システムが本来の定常状態からはるかに離れて動く場合それらの精度及び再現性が急速に劣化しうることである。
【0005】
第二の部類のモデルである流束均衡解析は、詳細な運動のデータ及び熱力学のデータが存在しない場合に、代謝ネットワーク情報及び細胞組成情報の化学量論的質量平衡のみを利用して該細胞に利用可能な流束分布の限界を同定する。微生物はこれらの利用できる限界を最終的に崩壊させて単一点にする極めて複雑な調節構造を進化させたが、流束均衡モデルは性能目標の上限を設定する際に、そして「理想的な」流束分布を同定する際に依然有用である。
【0006】
しかしながら、流束均衡解析の汎用性は、知らずに交差している運動又は調節の流束障壁を犠牲にして得られるものである。従って、流束均衡モデルの予測は、代謝ネットワークの性能に対する上限を与える「理想的な」流束分布として慎重に解釈されなければならない。流束均衡モデルの重要な利点は、運動のパラメータ又は調節ループについていかなる数値も必要としないことにより、資料を集めることが容易である点にある。重要な欠点は、得られた化学量論上の限界に非常に幅があることであり、該バイオマス最大化の推測が、ある条件下で有用であるとしても、一般的に適用できるとは想定し難い。
【非特許文献1】イー・ペンニシ,Science 277, 1432(1997)。
【非特許文献2】ヴイ・ハッチマニカティスら、Biotechnol. Bioeng. 58, 154(1998)。
【発明の開示】
【発明が解決しようとする課題】
【0007】
従って、本発明の第一目的は、現行技術水準を改良する方法及びシステムを提供することである。
【0008】
流束均衡解析モデルを改良するための枠組みを与える方法及びシステムを提供することが本発明の更なる目的である。
【0009】
流束均衡解析モデルの予測能を向上させる方法及びシステムを提供することが本発明の更なる目的である。
【0010】
本発明の別の一目的は、定性的な運動の情報及び/又は調節の情報を流束均衡解析モデルに組み込む方法及びシステムを提供することである。
【0011】
本発明の更なる別の一目的は、差別的(differential)DNAマイクロアレイ実験データを流束均衡解析モデルに組み込む方法及びシステムを提供することである。
【0012】
本発明の更なる目的は、増殖のための最小の反応集合を決定するために改良された方法及びシステムを提供することである。
【0013】
本発明の別の一目的は、最小の反応集合に及ぼす環境条件の効果を決定するための改良された方法及びシステムを提供することである。
【0014】
遺伝子の削除又は付加の後の代謝ネットワークの応答を計算するための方法を提供することが本発明の別の一目的である。
【0015】
本発明の更なる目的は、組換えのために数学的に最適な遺伝子を選択するための方法及びシステムを提供することである。
【0016】
本発明の別の一目的は、致死遺伝子の欠失を同定するための方法及びシステムを提供することである。
【0017】
本発明の更なる別の一目的は、病原微生物に対する遺伝子治療の候補物質を同定する方法及びシステムを提供することである。
【0018】
本発明の更なる目的は、仮説又は目的関数を試験できる方法及びシステムを提供することである。
【課題を解決するための手段】
【0019】
本発明のこれらの並びに他の目的、特性及び/又は利点は、本明細書及び請求の範囲から明らかになるであろう。
本発明は、少なくとも、生物の細胞代謝をモデル化する方法であって、代謝及び細胞組織の情報の化学量論的質量均衡を用いて、流束均衡解析モデルを構築し、代謝ネットワークの利用可能な流束分布についての限界を同定する工程と、前記流束均衡解析モデルに論理的制約を適用し、変更された流束均衡解析モデルを生成する工程と、を含み、前記論理的制約は、利用可能な流束分布についての限界を制限し、よって前記流束均衡解析モデルの予測能を向上させる、方法を提供する。
【図面の簡単な説明】
【0020】
【図1】図1は、本発明の概観を示すブロック図である。
【図2A】図2Aは、同一の最適点と一致する複数の目的関数の勾配の図である。
【図2B】図2Bは、同一の最適点と一致する複数の目的関数の勾配の図である。
【図3A】図3Aは、異なる条件に対する実現可能な目標のセットである。
【図3B】図3Bは、異なる条件に対する実現可能な目標のセットである。
【図4】図4は、化学量論上の限界、運動/調節の障壁及び新たな最適定常状態の絵表示である。
【図5】図5は、論理的制約の適用を示す単純なネットワークの図である。
【図6A】図6Aは、隘路が同定される代謝ネットワークの二つの部分の図である。
【図6B】図6Bは、隘路が同定される代謝ネットワークの二つの部分の図である。
【図7】図7は、流束/転写物比の一致の確率を転写物比に対してプロットした対数プロットである。
【図8】図8は、0.3時間当たりの増殖速度αに対する最小の酢酸塩摂取速度のプロットである。
【図9】図9は、グルコース及び酢酸塩上の増殖についての7アミノ酸の最大理論収率に対するモデル予測の表である。
【図10A】図10は、グルコース上の増殖における組換えネットワークに導入された経路変更を示す図である。図10は、グルコース上の増殖における最適な大腸菌のアルギニン生産経路と一般のアルギニン生産経路との差異を示す。(a)は大腸菌に存在するATP依存性の6−ホスホフルクトキナーゼを置換する汎用モデルの6−ホスホフルクトキナーゼのピロリン酸依存性類似体を含み;そして(b)は該大腸菌のネットワークからカルバモイルリン酸シンセターゼを置換する汎用モデルのカルバミン酸キナーゼを含む。
【図10B】図10は、グルコース上の増殖における組換えネットワークに導入された経路変更を示す図である。図10は、グルコース上の増殖における最適な大腸菌のアルギニン生産経路と一般のアルギニン生産経路との差異を示す。(a)は大腸菌に存在するATP依存性の6−ホスホフルクトキナーゼを置換する汎用モデルの6−ホスホフルクトキナーゼのピロリン酸依存性類似体を含み;そして(b)は該大腸菌のネットワークからカルバモイルリン酸シンセターゼを置換する汎用モデルのカルバミン酸キナーゼを含む。
【図11A】図11は、(a)グルコースのみでの増殖及び(b)対応する輸送反応を用いて任意の有機化合物の摂取を可能にする培地上での増殖について得られた増殖速度の関数としての最小反応ネットワークの大きさを示すグラフである。
【図11B】図11は、(a)グルコースのみでの増殖及び(b)対応する輸送反応を用いて任意の有機化合物の摂取を可能にする培地上での増殖について得られた増殖速度の関数としての最小反応ネットワークの大きさを示すグラフである。
【図12】図12は、プラマニック(Pramanik)モデル及びキースリング(Keasling)モデルに対する修正を示す表である。
【図13】図13は、グルコース上の増殖についての種々のバイオマス生産レベルにおける遺伝子削除(gene knockouts) を示すグラフである。
【図14】図14は、削除研究による除去の対象として選択された遺伝子を示す表である。
【図15】図15は、大腸菌のアミノ酸生産能を増強させる酵素反応のモデル選択を示す表である。
【図16】図16は、グルコース上の増殖における大腸菌の最適なアルギニン生産経路及び一般のアルギニン生産経路を図示する。一般のアルギニン生産経路によるカルバメート・キナーゼ及び6-ホスホフルクトキナーゼのピロリン酸依存性類似体の利用は、差引して3 ATPの無水リン酸結合を節約する。
【図17】図17は、酢酸塩上の増殖における大腸菌の最適なアルギニン生産経路及び一般のアルギニン生産経路を図示する。一般経路によるカルバミン酸キナーゼ及び酢酸キナーゼのピロリン酸依存性類似体の組み込みは、3 ATPの無水リン酸結合を節約する。
【図18】図18は、グルコース利用の二つの方式(グルコキナーゼ及びホスホトランスフェラーゼのシステム)に最適なアスパラギン生産経路を図示する。
【図19】図19は、グルコース上の増殖に最適な一般のアスパラギン生産経路を図解する。この一般経路は、前図で示されるように、AMPを形成するアスパラギン酸−アンモニアリガーゼの代わりにADPを形成するアスパラギン酸−アンモニアリガーゼを用いることにより1ATP 結合に相当する量を節約する。
【図20】図20は、酢酸塩上の増殖における大腸菌の最適なヒスチジン生産経路及び一般のヒスチジン生産経路を図示する。この一般経路のエネルギー効率(2 ATP)及び炭素転換率は両方ともそれぞれPEPカルボキシキナーゼのピロリン酸依存性類似体及びグリシンデヒドロゲナーゼの組み込みにより改善される。
【図21】図21は、グルコース又は酢酸塩のみの摂取環境において課された増殖要求の関数としてのそれぞれの最小セットにおける反応の数のグラフである。
【図22】図22は、増殖が減少する条件下での最小反応セットの展開を示す表である。
【図23】図23は、最適に操作された培地上にそれぞれの標的増殖率における摂取又は分泌された代謝物を示す表である。
【図24】図24は、複数の有機物を摂取させる摂取環境において課された増殖要求の関数としてのそれぞれの最小セットにおける反応の数のグラフである。
【図25】図25は、複数の有機摂取を可能にする摂取環境において課された増殖要求の関数としてそれぞれの最小セットにおける反応の数のグラフである。
【図26】図26は、増殖が減少する条件下で第二セットについての最小反応セットの展開を示す表である。
【図27】図27は、最適に操作された培地上の増殖における最小ネットワーク反応の機能的分類を示す表である。
【図28】図28は、機能的分類に基づいた最小代謝遺伝子/反応セットの比較を示す表である。
【発明を実施するための形態】
【0021】
発明の概要
本発明は細胞代謝のイン・シリコでのモデル化又は生物情報学的モデル化についての枠組みを含む。この枠組みにより、特定の制約の組み込みを通じてFBAモデルを改良できる。これらの制約は2値変数で表され得る論理的制約であることが好ましい。この枠組みはモデル予測を解決するためにコンピュータ計算手法の適用を提供する。このモデルは、何個のそしてどの外来遺伝子が現存する代謝ネットワークに組換えられるべきであるか、所与の代謝標的が最適化されるようにどの調節ループが活性化又は不活性化されるべきであるか、遺伝子の欠失に対して代謝ネットワークが如何に頑健であるか、所与の摂取環境においてある種の増殖要求を満たすことのできる数学的に最小の遺伝子セットが何であるか、異なる基質及び異なる炭素/酸素摂取速度の下で、どの実験的流束データが異なる仮説の目的関数と一致するか、そして他の代謝問題などを解決するために用いられ得る。この枠組みの使用から得られる結果は、生物学、化学、薬学、生命科学、及び医学の分野などの領域を含む代謝工学に関する研究又は商業的利益の幾つかの領域に適用され得る。
【0022】
1.概観
図1は本発明の枠組みを図示している。この枠組みは特定の制約の導入を通じて流束均衡解析(FBA)モデルを改良する。これらの制約は、定性的運動情報、定性的調節情報、及び/又はDNA・マイクロアレイ実験データを、無制限に導入する。これらの制約は2値変数で表され得る論理的制約であることが好ましい。本発明は、該モデルを用いて結論に到達するために混合整数線形計画法などのコンピュータ計算手法を該枠組み内に含める工程も提供する。図1に示すように、該モデルは遺伝子の付加又は欠失に直面した代謝の性能/頑健性を決定する工程を提供する。その上、このモデルは、実験的流束データが異なる基質及び異なる炭素/酸素摂取速度の下で異なる仮定的目的関数と一致するか否かを試験する工程を提供する。
【0023】
本発明は、流束均衡モデルを通して導き出された流束限界を締める工程、続いて遺伝子の付加又は遺伝子の欠失の存在下で代謝ネットワークの性能の限界を精査する工程を含む。組換えに利用できる多数(何百から何千)の遺伝子があるとすれば、現在の最適化の定式化は混合整数線形計画法の解決法の技術水準で解決され得るものの限界に達ししばしばそれを超過する。本発明は、代謝ネットワークの性能限界の効率的な疑問提起を可能にし且つその結果得られる混合整数線形計画法問題を解決するためのカスタマイズされた技術を提供するというモデル化定式化の構築の二重の目的を満たす。
【0024】
2.目的関数仮説の試験
本発明は、実験流束データが異なる基質及び異なる炭素/酸素摂取率の下で異なる仮説の目的関数と一致するか否かを試験するための、バイアスのかかっていない数学的に厳密な枠組みを提供する(エイ.ヴァルマとビー.オー.パルソン, Bio/Technology 12, 994(1994); アール.エイ.マジェヴスキーとエム.エム.ドマッチ, Biotechnol. Bioeng. 35, 732(1990))。目的関数などを仮定することにより開始するのではなく、又は細胞の行動を規定する目的関数が存在することをさえ承認するのではなく、本発明の定量的な枠組みは、研究者が異なる仮説の整合性を試験し、反証し又は微調整できる逆最適化に基づいている。このような目的関数の存在を証明することは決してできないが、該枠組みは実験データが仮定された目的関数と一致するかしないかをそしてこれが異なる環境条件下でどのように変化しうるかを厳密に試験するために有用であることに留意せよ。
【0025】
一組の観測値(observable)で与えられた最適値に到達するシステムに対するモデル・パラメータの同定のために地球物理学で開拓された逆最適化の概念がここに適用される。具体的には、本発明は、観察された流束 v* J (例えば、基質/酸素摂取、増殖速度など)の部分集合と一致する仮定された線形目的関数Σj c j v j における係数 cj を見出す工程を提供する。一般的に、係数cjに対しては一つではなくある範囲の値が観察された流束の集合と一致する。これは二次元で図2Aと共に例示する。
【0026】
目的関数c1v1+c2v2(その勾配(-c2/c1)はa値とb値の間にある)はいずれも点Aの最適性と一致している。これは点Aの最適性と一致し図2Bに示される点Bと点Cの間にある線分により表示される範囲のc1値とc2値を生じる。c1及びc2はc1+c2=1になるように定められることに留意せよ。一般的なn次元の場合、最適の v* J に応じた cj値の集合はポリトープ(polytope)を形成する。
【0027】
一般的な問題は、アフジャとオールリン(2001)(アール.ケイ.アフジャら、「ネットワーク流束、理論、アルゴリズム、及び応用」プレンティス・ホール、エングルウッド・クリフス, N.J. 1993)により導入された着想を用いて取り組まれる。観察された流束値 v* Jの部分集合が与えられると、目的関数の係数 cj の集合が、2値(dual) 変数αi及び線形目的関数の係数 cj 空間で解決される制限された2値実現可能性問題のあらゆる複数の最適解を見出すことにより決定され得る。
【0028】
2値変数αiは目的関数の改良における代謝物iの相対的重要度を定量化する。制限された2値問題の解は観察された流束値v* J の部分集合と一致する全ての可能な cj 値の集合を体系的に決定する。単純な表から得られるいずれの基本的で実現可能な解も該 cj 空間で形成されたポリトープの頂点を規定するから、これらの交互の最適な解がこの単純な方法の副産物として得られ得る。整数切捨て(integer cut)を用いた代替方法も使用され得る(エス.リーら、Comput. Chem. Eng. 24, 711 (2000))。本発明は、これらの技術を用いて基質の選択又は炭素/酸素の摂取速度が変化するとき、該ポリトープがかなり重複する(図3Aを参照)又は体系的に移動する(図3Bを参照)か否かに関して決定することができることを意図する。定量手段のこのセットは研究者が異なる仮説(もしあれば)の妥当性の範囲を試験するためにバイアスのかかっていない枠組みを提供する。
【0029】
3.運動/調節の論理的制約
化学量論平衡及び摂取速度に単に依存することによる流束均衡モデルは、如何なる実現可能な流束分布をも排除しないことを保証する。しかしながら、この汎用性はその結果が適切に解釈されない場合過度に楽観的な予測を導きうる。該細胞内での流束分布は、該細胞内の調節機構、細胞酵素の運動特性、及びこれらの酵素の発現により最終的に独自に決定される。細胞が化学量論的に最適な様式で機能すると仮定することにより、該細胞に利用されない代謝流束分布を生じうる。本発明は、FBAモデルにより、予測された化学量論的流束限界を小さくするための複数の方法を提供する。第一の戦略は、FBAを通して同定される流束変化が定性的な意味で代謝ネットワークの運動ループ及び調節ループと一致することを保証しようと試みる工程を含む。該化学量論的流束限界内の到達不可能なドメインを取り外すことにより、該予測能は向上する。第二の戦略は実験的に得られたデータを該FBAモデルに組み込む工程を伴う。本発明はDNAアレイ差別的発現データをFBAモデルに重ねるための数学的に信頼できる枠組みを含む。
【0030】
3.1 運動及び調節ループの整合性
本明細書で扱われる重要な問題は、該FBAモデルにより予測される最適な流束分布が該細胞により達成可能であるか否か又は運動及び/又は調節の限界が該システムが化学量論的限界に達することを妨げるか否かである(図4を参照)。
【0031】
本発明者らが探求することを提唱する重要な着想は、論理的関係式を用いることにより、環境変化に応答して、該代謝ネットワークが一つの定常状態から他の定常状態へ移る場合、代謝物濃度の上下変動が反応流束の上下変動と一致することを確実にすることである。
【0032】
具体的には(図5参照)、流束値vは、酵素工学の非存在下では、反応物質Aの濃度CA 又は活性物質Dの濃度CD又は阻害物質Eの濃度CEが低下する場合のみ、増加し得る。明らかに、反応流束の変化と代謝濃度の変化は共役しており、詳細な定量的運動/調節情報が存在しない場合でさえ、結合関係はこれらの変化の方向に基づいて導き出され得る。このような関係式の一つのセットが以下に詳細に記載される。
【0033】
具体的には、任意の反応流束値vjが初期基本事例値v0j を超えて増加するためには、反応物質の濃度が増大しなければならず、又は活性物質の濃度が増大しなければならず、又は阻害物質の濃度が低下しなければならないのいずれかであり、そして逆もまた同様である。これらの論理的制約を該FBA枠組みに組み込むには、第一に反応jに及ぼす代謝物iの影響を記載する調節行列(regulation matrix)Fを設定することが必要である。
【0034】
代謝物iが反応jを活性化する場合、1
Fij= 代謝物iが反応jを阻害する場合、−1
代謝物iが反応jに影響を及ぼさない場合、0
このような調節行列はEcoCyc及びMetaCycのデータベースからの情報に基づいて構築され得る(ピイ.ディ.カープら、Nucleic Acids Res. 28, 55(2000))。更なるデータベース源が非大腸菌反応についても存在する(エム.カネヒサとエス.ゴトウ、Nucleic Acids Res. 28, 29(2000))。0- 1変数である xi 及び zjの二つのセットは代謝物濃度及び反応流束値における上下変動を追跡するためにそれぞれ導入される。
【0035】
Xi = 代謝物iの濃度が上昇する場合、1
他の場合、0
Zj = 反応流束値jが本来の定常状態値を超えて増加する場合、1
他の場合、0
これらの0- 1変数を利用することにより、本発明者らは幾つかの運動及び調節限界の侵害から守るために下記の論理的制約を該FBAモデルに導入する。
【0036】
【数1】
関係式(1)は zj = 1 である場合、 vj >v0j であり、且つ、 zj = 0 である場合、 vj <v0j であることを保証する。制約(2)は、反応流束値 vj がその初期基本事例値v0j を超えて増大するためには、反応物質の濃度が増大しなければならず、活性物質の濃度が増大しなければならず、又は阻害物質の濃度が低減しなければならないことを確実にしている。最後の制約(3)は、反応流束値 vj が該初期基本事例値を下回って減少するためには、反応物質の濃度が低減しなければならず、活性物質の濃度が低減しなければならず、又は阻害物質の濃度が増大しなければならないことを確実にしている。図3の例を再び取り上げると、流束値vについての制約(2)及び(3)は
XA+XD+(1-XE ) ≧Z1、及び
(1-XA ) +(1-XD )+ XE≧ 1-Z1
となる。
【0037】
グルコース上で増殖させた場合のアラニン過剰生産経路に関する予備研究から、単純なFBAモデルにより検出できない運動及び調節の隘路が確認された。
【0038】
この分析の第一段階は反応流束に対する初期基本事例値を得ることであった。これらはバイオマス最大形成についてのLP問題を解決することにより得られた。第二段階はその最適値の80%までバイオマス生産を抑制しアラニンの過剰生産を可能とする第二のLP問題を解決することであった。第三段階は上述したように運動及び調節の論理的制約を組み込むことにより第二段階のシナリオを解決する工程を含んでいた。この研究から、調節されたアラニンの過剰生産(2.688mmol/10mmol GLC)は論理に基づいた調節制約なしのFBAモデルにより予測された値(3.298mmol/10mmol GLC)よりも約20%低いものであることを明らかにした。この減少を同定できたことより重要なことは、具体的な流束隘路を特定する能力である。反応流束の分析は該ネットワークの性能を制限する二つの潜在的な隘路を明らかにした(図6参照)。
【0039】
ペントースリン酸経路反応に加えて、リブロース-5-リン酸(RL5P)もバイオマスの構成成分であるリポ糖類(LPS)の前駆体であるために、第一の隘路(図6A)が生じる。最適よりも低い増殖要求の下では、RL5Pからバイオマスまでの反応流束はその基本事例値より低下するに違いない。従って、RL5Pの濃度は減少しなければならない(調節因子のみ)。故に、反応物質RL5Pの濃度が減少しているため、リブロースリン酸3−エピメラーゼを介した流束はその基本事例値を超えて増加できない。これはリボース−5−リン酸イソメラーゼ反応を介してさらなる流束を迂回させる。アラニンの過剰生産中、最大増殖条件の下でよりも多くの流束がピルビン酸キナーゼを通過しなければならないため、第二の隘路(図6B)が生じる。この研究において、基本事例で、FBAモデルは、ピルビン酸キナーゼの二つのイソ酵素の一つであるピルビン酸キナーゼIIを選択した。しかしながら、ピルビン酸キナーゼIIを介した流束は、その活性剤(AMP)及びその反応物質の両方の濃度が減少するため、その基本事例値を超えて増加できない。調節を含むFBAモデルでは、この反応の活性物質(FDP)の濃度が増加するので、ピルビン酸キナーゼIを介して該流束を増大させることによりこの障壁は部分的に回避された。この例は、幾らかの運動及び調節の情報を得ることにより、該論理的制約が、如何なる実現可能な流束分布を排除することもなく、単純なFBAモデルにより検出できない少なくとも一部の隘路を同定できることを示唆している。上述したこれらの重要な流束を同定し、次いで該酵素及びそれらの周囲の調節を操作することにより、容易な脱隘路化(debottlenecking)戦略が提供される。本発明は、当業者であって本開示の利益を有する者が流束均衡モデルの予測を更に「高める」ために上述したものの精神に沿って更なる論理的制約を構築できることを意図している。
【0040】
4. 差別的DNAマイクロアレイの制約
流束均衡モデルの予測能を強化するための論理的制約を規定するために定性的運動情報及び/又は定性的調節情報を用いることに加えて、本発明は差別的DNAマイクロアレイ実験データに基づいた制約を規定する工程を提供する。最近のDNAマイクロアレイ技術の進歩により、細胞の全体調節を全ゲノム規模で行なう研究が改革され始めた。DNAマイクロアレイは、種々の実験条件下における個々の遺伝子の相対的発現レベルから構成される差別的転写プロファイルを決定することができる。これにより、生物が外部環境の変化に応答する際どの遺伝子が高レベル調節又は低レベル調節されるかを推論できる。すでにこのような研究はエス.セレビシエ(S. cerevisiae)(エル.ヴォディッカら、Nat Biotechnol. 15(13), 1359(1997))及び大腸菌(シイ.エス.リッチモンドら、Nucleic Acids Res. 27(19), 3821(1999))で始まっている。このような実験の出力は通常本来の定常状態に関して正規化された一群の遺伝子転写物レベルである。グルコース対照条件と比較して、例えば、グリセロール又は酢酸塩のいずれかの培地上で増殖した大腸菌株について、主要な代謝及び重要な生合成に関与する111個の遺伝子の差別的転写物レベルが測定された(エム.ケイ.オー&ジェイ.シイ.リアオ、Biotechnol. Prog. 16(2), 278(2000))。こうして、酢酸塩上で増殖した大腸菌株のある遺伝子について1.5の転写物レベルとは、この遺伝子がグルコース上の増殖と比較して酢酸塩上での増殖中50%まで高レベル調節されることを示している。この方法では翻訳又は翻訳後の遺伝調節を検出できないが、少数の例外はあるものの、少なくとも大腸菌においては転写調節が調節の主要な様式である。
【0041】
重要な難問は、現在、対応する流束レベルの定量的変化を推論するために転写物のレベルが使用できないことである。その代わり、せいぜい流束変化と転写物レベルとの定性的な統計上の相関関係のみが導き出され得る。流束と転写物レベルとの定性的な連結に基づいて、本発明はこれらの動向を捕えるために0- 1の変数を用いる。Tljは環境変化lがあった場合の反応jを触媒する酵素をコードする遺伝子の正常な転写物レベルを表す。1より大きな値は過剰発現を示し、一方1未満の値は過少発現を表す。表示を簡単にするため、遺伝子の反応に対する位置付けを1:1、即ち j ≡ k とここで仮定する。これは必要な場合容易に緩和され得る。2値変数 wj は、
wj = 転写物及び流束のレベル変化が同じ方向にある場合、1他の場合、0
と定義されると考えよう。
【0042】
2値変数 wj が定義されると、次に、下記の式を書くことができる。
Tlj>1である場合、vlj≧voj-(1-wlj )voj (4)
Tlj<1である場合、vlj≦voj+(1-wlj ) (vmaxj-voj) (5)
上式で、v0jは基本流束レベルでありそしてvmaxjは最大許容値である。wj = 1の場合、これらの二つの制約は、Tlj >1ならば、vlj≧voj そしてTlj <1ならば、vlj≦voj をそれぞれ強制する。wj = 0の場合、この二つの制約は明らかに有効な非束縛性の制約、即ち vlj ≧0そして vlj ≦vmaxjをそれぞれ生ずる。転写物レベルと流束のレベル間の完全相関関係は、全ての wj が1に等しいことを意味するであろう。しかしながら、実験研究は、100%ではなく、平均で約80%の遺伝子が同方向で変化する転写物レベル及び流束レベルを示すことを証明した。その上、転写物レベルの値が1から離れれば離れる程、それは流束変化の方向と一致する可能性が一層高くなる。これは、転写物の変化が同方向で対応する流束レベルの変化に翻訳される可能性を定量化するための確率論的記載に動機付けを与える。具体的には、本発明者らは、この形式の統計学的モデルを構築する。
【0043】
【数2】
尺度 Tscaleは Pj が1から離れたままである範囲を制御するよう選択される。0.622という値は、100%の過剰発現(Tj = 2)、又は過少発現(Tj = 1/2)が90%の一方向性の確率を与えることを示す。図7は、転写物レベル Tj の関数として単一方向の転写物変化及び流束の変化を有する確率 Pj をプロットする。 Tj = 1 の場合、 Pj = 0.5 がいずれの結果についての等しい機会を反映し、一方、Tjが非常に大きな正又は負の指数を有する場合、 Pj は1に近づく。本発明は Pj のより精巧なモデルが使用され得ることを意図する。それには、機械的方法又は流束変化に転写物比を連結するために開発された他の方法から借りることにより構築されるモデルが含まれる。
【0044】
各 wj の効果を評価するため Pj の確率を用いた後、下記の制約が得られる。
【0045】
【数3】
ここで、αは単一方向の転写物変化及び流束の変化を有すると予測される遺伝子jの画分である。従って、αはFBAにより予測される転写物比と流束変化との「一致可能性」を定量化する。制約(4)、(5)及び(6)でFBAを補強することは、確率論的な意味で、DNAマイクロアレイ実験の遺伝子発現プロファイルにコードされた定性的情報を重ね合わせることである。上述の二つの方法での確率的枠組みは幾つかの異なる方法で用いられる。
【0046】
FBAモデルの最適化は通常多数の代替最適値を生ずる。それらの全てを同定するための見事なアルゴリズムがリーら、2000により提唱された。DNAマイクロアレイ・データは実験的に決定された遺伝子発現レベルと一致する代替の最適値の部分集合を同定するために用いられ得る。具体的には、パラメータαは、DNAアレイ・データとのそれらの一致可能性に関してFBAモデル内で目的関数を最適化した後に通常得られる複数の最適値(リーら、2000)を序列付けするために用いられ得る。グルコース上の増殖から酢酸塩上の増殖への転換についてオーとリアオ(2000)から得られたデータを用いた結果は、αがどの代替的最適解が解答者により同定されるかに応じて、課された 0.3 時間-1の増殖速度に対して 0.74 から0.89まで変化し得ることを示している。こうして、発現プロファイルの一致可能性能に対するFBAは所与のFBA最適解についてαを最大にすることにより20%ほども改良され得る。本発明はFBAモデルへのDNAマイクロアレイ・データの直接的組み込みをも提供する。ここで、実験上の転写物プロファイルとの課された一致可能性に対するFBAの目的の感度は、αの種々の値に合致させるために該モデルを制約することにより調整することができる。オーとリアオ(2000)から得られた同一のデータについて、図8に示した結果は、最小酢酸塩摂取速度と課された一致可能性パラメータαとの間で二次式の傾向を示す。
【0047】
5. 組換え用に遺伝子候補を同定する
代謝に関連する注釈付き遺伝子の爆発的増殖は、最も有望な組換えの選択を決定するために体系的手法を要求する。今までに、組換えDNA技術は新しく且つ望ましい細胞の機能を導入する単純な転換経路を付加するために用いられてきた。ここで、その目的は、複数の種に由来する多数の遺伝子を包含する代謝データベースから、大腸菌内又は他の原核生物内への組換え用に数学的に最適な遺伝子を選択するために、流束均衡解析及び混合整数計画手段を利用することである。得られる経路は直接主要生産経路上にある必要はない。何故なら代謝流束を生産経路内に方向転換すること又はこの経路のエネルギー効率を増大させることのいずれかにより間接的に生産を増強しうるからである。
【0048】
キョウト・エンサイクロペディア・オブ・ジーンズ・アンド・ゲノムス(KEGG)(カネヒサとゴトウ、2000)及びエコサイック(カープら、2000)及び他の供給源から得られる全ての既知の代謝反応を含む包括的な化学量論的行列をコンパイルすることができ、モデル生物(例えば大腸菌)の流束均衡モデルに組み込むことができる。本発明者らはこの複数種の化学量論的行列を汎用化学量論的行列と呼ぶ。この複数種の化学量論的行列は、イン・シリコ遺伝子組換え代替法を開拓し且つどの原核生物が所与のバイオプロセッシング適用に最も有利な選択になるかを調査するための貴重な資源である。
【0049】
代謝対象v* が最大化されるように宿主生物へ組込むための最大h個までの新たな遺伝子を選択することはMILP問題として定式化され得る。これは、全ての大腸菌遺伝子が存在することを保証する制約 jk=1 、∀k∈E並びに汎用行列(即ちNE)に含まれる包括的リストから最大h個までの外来遺伝子を大腸菌に導入させる制約
【0050】
【数4】
を用いて、LP流束均衡モデルを補強することにより達成される。ここで、該宿主生物は大腸菌であると仮定されるが、一般的に任意の注釈付き原核微生物が宿主生物として選択され得る。該モデルにより選択されたが大腸菌に存在しない反応(即ちNEの全ての0でないyk要素)は組換えDNA技術により細胞代謝を操作するための経路を提供する。
【0051】
プラマニックとキースリングの流束均衡大腸菌モデルを用いた予備的結果は、大腸菌の7つのアミノ酸生産経路に対する改良は外来生物由来の遺伝子の付加で理論的に達成できることを証明している(図9の表を参照)(ジェイ・プラマニックとジェイ.ディ.キースリング、Biotech. Bioeng. 56, 398(1997))。
【0052】
ほとんどの場合、たとえ3400の反応の完全なリストが選択に利用できたとしても、僅かに1つ又は2つの遺伝子が本来のアミノ酸生産経路に付加された。同定された増強機構は全て、(i)エネルギー効率の改良及び/又は(ii)生産経路の炭素変換効率の増大のいずれかによるものである。アルギニン経路の操作は、グルコース及び酢酸塩上の増殖についてそれぞれ8.75%及び9.05%の向上という最も有望な結果を示した。図10は、グルコース上の増殖について組換えネットワークに導入された経路変更を示している。全体的に、汎用モデルにより用いられる追加の遺伝子は本来の経路の3つの正味ATP結合を節約し、アルギニン生産を8.75%まで増大させる。グルコース及び酢酸塩の基質について他の天然のアミノ酸生産経路及び汎用のアミノ酸生産経路を調べると、同様の傾向が明らかになる。
【0053】
記載した本発明のモデルはまた、組換え用により多くの遺伝子候補を包含するように拡大することもできる、進行中のゲノム計画によりより多くの遺伝子候補が利用可能になるからである。本発明は、産業上重要な他の微生物を含むかなり多数の生物に適用される。大腸菌が産業上最も重要な微生物の一つであるとしても、他の微生物はそれらの緩和された調節機構により利益を与える。例えば、多様な種のコリネバクテリウム属及びブレビバクテリウム属は、培地にグルタミン酸塩を分泌できるリン脂質欠損性細胞膜を開発することによりグルタミン酸塩を生産するために用いられてきた。第一鉄イオンからの抑制効果が観察されないエレモセシウム・アシュビ及びアシュビヤ・ゴッシピイは、リボフラビン又はビタミンB2を過剰生産する。
【0054】
本発明の論理に基づいた制約は得られる予測を正確にするために遺伝子選択のMILP公式と一体化できる。異なるアミノ酸の生産用に同定された最適な組換え変化を対照させることにより、複数のアミノ酸の同時収率向上に向けた組換え戦略が同定される。遺伝子の付加を誘導するための本発明の最適化枠組みは、拡大を続ける利用可能な遺伝子のデータベースから外来遺伝子の組換えを通して流束増強を研究するための定量的手段を提供する。完全な遺伝子−酵素の関係は現在知られていないが、該公式は、それが利用可能となる場合、この情報を組み込むことを可能とする。
【0055】
6. 遺伝子の欠失(最小セット)
完全に配列決定されたゲノムの最近の激増により、幾つの遺伝子が細胞生命を維持するために必要であるかという疑問に著しい注目が集まってきた。最小のゲノムは一般的に特定の環境において複製及び増殖できる遺伝子の最小セットとして定義される。この最小遺伝子セットを明らかにする試みには、実験的研究法と理論的研究法の両方が含まれていた。理論的方法は、大規模な進化上の境界を横断して保存された遺伝子が細胞の存続に不可欠であるという仮説に基づいている。この仮説に基づいて、エム.ゲニタリウムとヘモフィルス・インフルエンザスの両方に共通した遺伝子が最小ゲノムの構成員であるに違いないと仮定することにより、最小セットの256遺伝子がコンパイルされた(エイ.アール.ムシェギアンとイー.ブイ.コーニン、P. Natl. Acad. Sci. USA 93, 1026 (1996))。
【0056】
しかしながら、興味深いことに、エム.ゲニタリウムに保存された未知機能の26個の大腸菌オープン・リーディング・フレームの内6個のみが種の生存に必須であると判断された(エフ.アリゴイら、Nat. Biotechnol. 16, 851 (1998))。複数の全く異なる種及び環境に特異的な最小ゲノムの存在が長い間憶測されてきた(エム.フイネン,エム.、Trends Genet. 16, 116 (2000))。本発明は、異なる摂取条件下で与えられる増殖速度に必要な代謝反応の最小の生命維持コアを評価することにより、この主張を試験するための計算手法を提供する。この問題は、化学量論的制約を充足し且つバイオマス標的生産率vtargetbiomassを満たす代謝反応の最小セットを解く下記の最適化問題として定式化され得る。
【0057】
【数5】
或いは、バイオマス標的の代わりに、ATP生産の最小レベル又は主要構成要素/代謝物の最低許容レベルが該モデルに組み込まれ得るであろう。本発明のこの側面の一つの新規な特性は、先の試みが必須遺伝子のセットを抽出するために一連の遺伝子除去による還元主義者の方法論を利用したが、一方本明細書では本発明者らはバイオマス生産に及ぼす全反応の影響を同時に評価し且つ所与の増殖速度目標を満たす(反応の)最小セットを選択する(全体システム研究法)。次に、これらの反応を触媒する酵素を対応するコード遺伝子に位置付けることにより最小遺伝子セットを推論できる。
【0058】
エドワードとパルソンの大腸菌FBAモデルに基づいた結果は、最小反応セット、従って対応する最小遺伝子セットが増殖培地により与えられる摂取機会及び課された増殖要件に強く依存することを初めて定量的に証明した(ジェイ.エス.エドワードとビイ.オー.パルソン、Proc. Natl. Acad. Sci. USA 97, 5528(2000))。具体的には、二つの対照的な摂取環境、即ち(a)有機物質の摂取をグルコースのみに制限する及び(b)対応する輸送反応を用いて任意の有機代謝物を摂取させる、という摂取環境の下で、異なる増殖要件について最小反応ネットワーク(大腸菌のみの反応の部分集合)を探究した。構成要素合成のための内部代謝物への最大依存及び最小依存をモデル化し、且つ必要な最小反応セットに及ぼすその影響を精査するために、これらの二つの極端な摂取シナリオが選択された。二つの摂取選択について課されたバイオマス増殖目標の関数としての最小数の代謝反応(理論的最大値のa%として)が図11に示される。
【0059】
グルコースのみを含む培地上で増殖する大腸菌細胞は増殖を支えるために少なくとも226の代謝反応を必要とすると予測される一方で、栄養豊富で最適に処理された培地上で培養される細胞は僅か124の代謝反応で増殖を支えうるであろう。予期されるように、必要な増殖率を増大させることにより最小反応セットは大きくなる。しかしながら、この増加の大きさはこの二つの事例で全く異なる。事例(a)では最小反応セットは最大増殖率を満たすために226から236にしか増えないが、事例(b)では最小反応セットは124から203へとほとんど倍増する。更に、最小反応セットもそれらの対応する反応流束も固有ではないことが見出された。周期及びイソ酵素を排除した後でさえ、数百もの複数の最小セットが同定され、これは驚異的な余剰性をコンピュータによる確認させそして大腸菌ネットワークの流束の方向転換の多様性を示す。事例(a)でのより重要なことは、同定された全ての最小反応セットは12反応の内の11反応を含み、それらの対応する遺伝子の欠失はグルコース上での増殖において致死的であることが実験的に決定された。LP最適化を用いたこのモデルで行われた一遺伝子欠失に基づく先の分析(エドワードとパルソン、2000)は、12の致死遺伝子欠失の内の7つのみを同定できた、このことはMILP枠組み内での同時遺伝子欠失を考慮することの重要性の動機付けとなった。
【0060】
本発明は、この枠組みが、単に大腸菌だけでなく幅広い進化上の境界により分離された他の種についても異なる最小反応セットを構築することによって構築できることを意図する。得られる最小セットを対比することにより、異なる進化上の枝に沿った最小反応セット(代謝遺伝子セット)の比較が為され得る。例えば、エム.ゲニタリウムとエイチ.インフルエンザなどの生物を用いて先の研究(ムシェギアンとコーニン、1996)に対する基準となる結果を得ることができる。先に記載した汎用的化学量論的行列内で多数の異なる種に生じる反応を一括して扱うことにより、種から独立した最小代謝反応セットを構築することもできる。予測される124反応/遺伝子の大腸菌系の代謝最小セットは、ムシェギアンとクーニン(1996)により提唱された最小遺伝子セットに含まれる94個の代謝遺伝子に匹敵する。本発明は、 (i)非大腸菌種で生じる反応を含む、より効率的な反応の組み合わせを同定することにより、及び(ii)複数(類似)の代謝物の摂取又は分泌に関与する遺伝子を明らかにして総数を減らすことにより、この予測の乖離が低減され得ることを意図する。明らかに、提唱された計算枠組みは、翻訳、複製、組換え、修復、転写、細胞構造に関連する遺伝子、及び未知機能の遺伝子を本質的に説明できない、反応に基づく分析に依存している。しかしながら、これは異なる摂取/分泌環境を研究するための並びに代謝の最小ゲノムの探索において複数の種に由来する反応セットを含ませるための多様性を与え、何が最小ゲノムであり、それがどのようにして環境により形成されるのかという疑問に対する価値ある洞察及び展望を与える。DNA複製の開始についてのブロウニングとシュラーの研究など、最小細胞の基本機能を説明するより精巧なモデルが開発されるにつれ、より詳細な内容が該モデル化枠組みに付加されることになる(エス.ティ.ブロウニングとエム.エル.シュラー、AICHE年次総会、セッション69、セッション69、ロサンゼルス(2000))。
【0061】
「最小」代謝ネットワークを合理的に同定するための枠組みの開発を離れて、本発明者らは異なる生物及び摂取環境における致死的遺伝子欠失をイン・シリコで予測する能力を開拓することも意図する。病原微生物の致死的遺伝子欠失を環境の関数として同定することにより(例えばエイチ.ピロリ)、治療的介入(即ち遺伝子発現の妨害)のための有望な標的の、序列を付けた一覧表がコンパイルされ得る。この一覧表は、ヒトの代謝が該一覧表に含まれる任意の病原遺伝子の発現を抑制することにより悪影響を受けないことを保証する制約を課すことにより更に精緻化され得る。
【0062】
7.混合整数線形計画法の解決技術
本発明のモデル化枠組みは、提示されるネットワーク問題を解決するために用いられる計算手順を更に提供する。用いられる計算手順は混合整数線形計画法の技術を含む。
【0063】
遺伝子付加、調節、DNAアレイ・データ重畳、遺伝回路の解明、及び最小反応セットの同定といった文脈における本発明のアルゴリズム枠組みは、MILP問題を生じる別々の最適化変数の使用を本質的に必要とする。最小限の使用者介入で又は全く使用者の介入なしで市販の解決ソフト(例えばOSL、CPLEX、LINDO等)を用いることにより数十万の変数についてさえ機械的に解くことができるLP問題と違って、MILP問題は計算上遥かにより高い能力が試され、より多くのCPU時間だけでなく使用者の介入も通常必要である。具体的には、(i)MILP解決技術をより受けやすい形式で該問題を作成すること、そして(ii)該問題が市販の解決ソフトにとって依然解決困難である場合、カスタマイズされた解決法を構築することが通常必要である。
【0064】
代謝ネットワークのMILP問題における複雑性の主要な根源は、オン又はオフの切り替え及び過剰発現又は過少発現の予測が記載に0〜1の2値変数を必要とする反応/遺伝子の数である。これらの問題は一般化されたネットワーク問題(アフジャら、1993)の部類に属し、ここでは個々の代謝物はネットワークのノードを構成し、個々の反応はネットワークのアークを表す。原核生物の既存のFBAモデル(エドワードとパルソン、2000)は何百の反応を含むとすれば、エス.セレビシエの来たるモデルは千単位の反応の可能性があり、複雑性を抑制する必要性の動機付けとなる。その上、驚異的な余剰、方向転換能及び定常状態解の複数はさらに複雑性の問題を悪化させる。これらの挑戦に鑑みて、本発明により取り扱われた問題の幾つかは、とりわけ最小反応セットの文脈において、現段階では、50時間のオーダーのCPU時間を必要とした。
【0065】
計算負担を軽減するため、幾つかの再プロセシング及び再定式化の技術を本発明に従って使用しうる。これらの技術には、イソ酵素のグループ分け、無駄な周期の排除及びネットワーク連結性の制約が含まれる。イソ酵素のグループ分けは一つの反応で触媒する酵素(即ちイソ酵素)のみを異にする反応の集合体を指す。これは2値変数の総数を切り捨てることにより複雑性を減らす。無駄な周期の排除は、代謝又はエネルギー生成に正味の影響を及ぼすことなくループで集合的に流束を再循環させる反応セット(2以上)の除去を指す。一般的に、K個の反応から成るセットKは、
【0066】
【数6】
である場合、無駄な周期を形成する。下記の制約、
【0067】
【数7】
は、少なくとも一つの反応を不活性化して該周期を中断する。
【0068】
連結性の制約は、細胞内代謝物を生産する反応が活性である場合、この代謝物を消費する少なくとも一つの反応が活性でなければならずそして逆もまた真であることを保証する。その上、細胞外代謝物を細胞内に輸送する反応が活性である場合、この代謝物を消費する少なくとも一つの細胞外反応が活性でなければならずそして逆もまた真である。
【0069】
マルチプロセッサのユニックス・プラットフォームIBM RS6000-270ワークステーションで動くCPLEX6.1及びOSLなどの現レベルの市販のMILP解決ソフトは、これらの型の問題を解決するために使用できる。市販のMILP解決ソフトでは解決困難な問題の大きさについて、カスタマイズされた分解処理法が用いられ得る。例えば、ラグランジアン(Lagrangean)緩和、及び/又は本来の代謝ネットワークを少数の代謝物と緩く相互接続された部分ネットワークに分割することによる分解が使用できる。一つの大きな問題の代わりに多数のより小さな問題を反復して解くことにより、コンピュータ計算の省力が期待される。更に、本発明はブーリアン (Boolean)と連続変数とを組み合わせた離接的計画研究法の使用を意図する。これらの方法は、本発明のMILP定式化の多くと同様に、0〜1(即ちブーリアン)の変数の全てが論理的制約に統合されるMILP問題にとりわけ効果的であることが示された。
【0070】
8.実施例:遺伝子の付加又は欠失に曝される大腸菌代謝ネットワークの性能限界を精査する
本発明の枠組みは幾つかの異なる文脈において幾つかの代謝ネットワーク問題に適用され得る。本発明は遺伝子の付加又は欠失を受けた大腸菌の代謝ネットワークの性能限界を精査するために用いられた。この実施例に従って、遺伝子の欠失又は遺伝子付加後の代謝ネットワークの応答を研究するための最適化に基づいた手法が導入され線形流束均衡解析(FBA)大腸菌モデルに適用される。どの外来遺伝子を大腸菌内に組込むかを最適に選択する遺伝子付加問題、及び所定数の既存の遺伝子を除去する遺伝子欠失問題の両方が、2値0〜1変数を用いて混合整数最適化問題として定式化される。開発されたモデル化及び最適化の枠組みは、バイオマス生産に及ぼす遺伝子欠失の効果を研究しグルコース及び酢酸塩の基質の上での好気性増殖について20アミノ酸の理論的最大生産に取り組むことにより試験される。遺伝子欠失の研究において、大腸菌の最大バイオマス生産を達成するために必要な最小遺伝子セットが、グルコース上の好気性増殖について決定される。その後の遺伝子削除分析は、僅か18遺伝子の欠失の後、バイオマス生産が単調に減少し代謝ネットワークを増殖不可能とすることを示している。
【0071】
遺伝子付加の研究では、大腸菌流束均衡モデルがKEGGデータベースから得られる3,400の非大腸菌の反応で増加させられ、多種のモデルを形成する。このモデルを汎用モデルと称する。この研究は、たとえ該モデルが3,400の外来反応候補から選択しうるにせよ、6個のアミノ酸の理論上の最大生産が、大腸菌の天然アミノ酸生産経路に僅か1又は2個の遺伝子を付加することにより改良されうるであろうことを示している。具体的には、アルギニン生産経路の操作は、グルコース及び酢酸塩上の増殖について遺伝子の付加でそれぞれ8.75%及び9.05%の予想増加という最大有望値を示した。全ての示唆される増強の機構は、(i)エネルギー効率を改良すること及び/又は(ii)生産経路の炭素変換効率を増大させることのいずれかによる。
【0072】
本発明の枠組みに従ったこの実施例は、複数の種に由来する多数の遺伝子を包含する代謝データベースから大腸菌内への組換えのために数学的に最適な遺伝子を選択すべく流束均衡解析並びに混合整数計画法手段を用いる。得られる経路は主要な生産経路上に直接在る必要はない。該生産経路に代謝流束を方向変換することによるか又は現在の経路のエネルギー効率を増大させることによるかのいずれかで間接的に生産を増強しうるからである。
【0073】
配列決定されたゲノムの最近の急増はまた、どの遺伝子が細胞生命を維持するために不可欠であるかという疑問に著しい注目を集めてきた。流束均衡解析モデル化はこの疑問を解明するのを助ける有用な手段を提供する。FBAモデルは遺伝子欠失に関連する調節構造の変更を模倣できないが、これらのモデルは細胞の生存に不可欠な代謝物を生産するために十分なネットワーク連結性が存在するか否かを把握することができる。実際に、エドワードとパルソン(2000)により提唱された最近のFBAモデルは試験された大腸菌突然変異株の86%の増殖様式を定量的に予測することができた。このモデルはグルコース上での大腸菌の好気的及び嫌気的増殖のための中心的代謝の必須遺伝子産物のいくつかを同定するためにも用いられた(ジェイ.エス.エドワードとビー.オー.パルソン、BMC Bioinformatics 2000b 1, 1)。
【0074】
しかしながら、所与の代謝系における許容できる遺伝子欠失の最大数を決定することは、複数の遺伝子欠失が同時に調べられ得る個別の最適化戦略を必要とする。線形代謝モデルの全ての代替最適値を同定するために個別の最適化を利用する関連した研究法がリーら(2000)により提唱された。
【0075】
本発明に従って、本発明者らは細胞性能の化学量論的限界が複数遺伝子の付加又は欠失の存在下においてどのように拡大又は縮小するかを調べる。より最近のデータに基づいてカープ(1999)により示唆された修正を含めたプラマニックとキースリング(1997)により供される反応経路を組み込んで、大腸菌の細胞代謝のFBAモデルが構築される。この修正はより最近の代謝情報に基づく小分子の補正か又は大腸菌の遺伝子型から現在存在しないと知られているある種の経路の除去のいずれかである。キョウト・エンサイクロペディア・オブ・ジーンズ・アンド・ゲノムスから得られる全代謝反応を含み且つシリングにより示唆された化学量論行列がコンパイルされ、そして該モデルに組み込まれる(シイ.エイチ.シリングら、Biotech. Prog. 15, 288(1999))。本発明者らはこの複数種の化学量論行列を汎用化学量論行列と呼ぶ。流束均衡解析の短い論議が次に提示され、続いて遺伝子の付加及び欠失の定式化並びに大腸菌におけるバイオマス及びアミノ酸生産へのそれらの適用が提示される。
【0076】
8.1 流束均衡解析
流束均衡解析(FBA)は、細胞に有効な流束分布の限界を同定するために生化学経路の化学量論及び細胞組成物情報のみを必要とする。微生物は、結果的にこれらの有効な限界を単一の点に崩壊させる極めて複雑な制御構造を進化させてきたが、FBAモデルは性能目標の上限を設定する際、及び「理想的な」流束分布を同定する際に依然価値がある。FBAの基礎をなす原理は目的の代謝物についての質量平衡である。N個の代謝物及びM個の代謝反応から成る代謝ネットワークに対して、
【0077】
【数8】
が得られる。上式中、Sijは反応j における代謝物i の化学量論係数であり、vjは反応jの流束を表し、biは代謝物iのネットワーク摂取(負の場合)又は分泌(正の場合)を定量する。全ての内部代謝物に対して、biは0である。可逆反応は単に反対方向の二つの不可逆的反応と定義され、全ての流束を正の数に制約する。
【0078】
通常、得られる方程式の流束均衡系は、反応の数が代謝物の数を超過するとき過少決定され、そして該反応流束を解くためには更なる情報が必要である。幾人かの研究者は制約としてそれらの過少決定モデルに付加するための外部流束を測定し、それらを完全に決定し又は過剰決定した(エイチ.ヨルゲンセンら、Biotechnol. Bioeng. 46 117 (1995);イー.パポウトサキスとシイ.メイヤー、Biotechnol. Bioeng. 27, 50 (1985);イー.パポウトサキスとシイ.メイヤー、Biotechnol. Bioeng. 27, 67 (1985);エイ.ポンズら、Biotechnol. Bioeng. 51(2), 177 (1996))。しかしながら、外部流束測定がシステムを完全に規定する前に反応経路を除去するなどの更なる仮定がしばしば必要となり、システムを完全に規定するために潜在的に活性な経路を無視することは算出される流束値に大きな変化をもたらしうる(プラマニック、1997)。代謝流束分布を調査する一般的な技術は線形最適化(ヴァルマ、1994)である。
【0079】
重要な推論は、細胞が化学量論的制約により許容されるあらゆる流束の組み合わせに及ぶことができ、従って所与の代謝目標(例えばバイオマス生産)を最大にする如何なる流束分布も達成できるというものである。バイオマス生産を最大にする線形計画法モデルは、
【0080】
【数9】
を条件として、
Z= vbiomassを最大にする。
上式中、 vbiomassはそれらの適切な生物学的比率におけるバイオマスの全ての必要な構成要素から成る流束ドレーンである。代謝物の生産を最大にし、所与の代謝物生産のためにバイオマス生産を最大にし、そしてATP生産を最小にするなどの他の目的関数も先行技術で研究されてきた。
【0081】
8.2 大腸菌の化学量論モデル
微生物の化学量論モデルは代謝を模倣するために研究された種において生じることが知られている反応の集合を組み込む。大腸菌ゲノムの完全な配列決定により、その生化学経路に関する豊富な知識が容易に利用できるので、大腸菌は本明細書で提示される研究のモデル生物になる。ヴァルマとパルソンは実験的観察を予測できる最初の詳細なFBA大腸菌モデルを提唱した(エイ.ヴァルマとビイ.オー.パルソン、J. Theor. Biol. 165, 503(1993))。その化学量論行列には、グルコースの異化及び高分子の生合成を模倣するために107個のの代謝物を利用する95の可逆反応が含まれた。このモデルは、増大する嫌気的条件で大腸菌の副産物の分泌を調べるために用いられ、実験上の観察(若干の嫌気的状況でまず酢酸塩、次にギ酸塩、最終的に高度に嫌気的条件下でエタノール)と一致する副産物の分泌の正確な順序を予測できた(エイ.ヴァルマら、Appl. Environ. Microb. 59, 2465 (1993))。先のモデルに基づいて構築して、プラマニックとキースリング(1997)は126の可逆反応(12の可逆輸送反応を含む)及び174の不可逆反応、並びに289個の代謝物を組み込んだモデルを導入した。プラマニックとキースリング(1997)は増殖速度の関数として大腸菌の高分子組成を相関させ、実験データを用いてそれらのモデルを確認した。該モデルはグルコース上の増殖についてのグリコキシレート分路の閉鎖及びオキサロアセテートへのPEPカルボキシナーゼ流束の傾きなどの幾つかの遺伝制御のレベルを首尾よく予測した。その上、グリコキシレート分路は酢酸塩上の増殖中活性であったが、PEPカルボキシキナーゼを介した流束はホスホエノルピルベートに向いていた。
【0082】
本研究で用いられる化学量論的大腸菌モデルは、プラマニックとキースリング(1997)により発表されたモデルから大幅にコンパイルされた178の不可逆反応、111の可逆反応及び12の輸送反応を用いる。プラマニックとキースリングの化学量論行列に対する修正は図12の表で与えられる。これらは基本的に小分子の訂正(例えばコハク酸塩チオキナーゼに対するGTPの代わりにATP)又はより最近のデータ(カープ、1999)に基づいた大腸菌に存在しないことが知られている反応の除去である。最も最近発表されたエドワードとパルソンの大腸菌モデル(2000)にも同様な変更が独立して含まれることに留意せよ。この代謝ネットワークは、該システムに入るためのグルコース又は酢酸塩の制約供給とともに、アンモニア、硫酸水素塩、及びリン酸塩の非制約供給を可能とする輸送反応により燃料供給される。酸素の摂取は好気的条件を模倣させるために制約されていない。乳酸、ギ酸、エタノール、グリセルアルデヒド、コハク酸、及び二酸化炭素副産物の非制約的分泌経路は輸送反応流束により提供される。汎用モデルは、キョウト・エンサイクロペディア・オブ・ジーンズ・アンド・ゲノムスから得られる3,400の細胞反応を修正されたキースリング化学量論モデルに組み込むことにより構築される。汎用化学量論行列は、大腸菌で生じることが知られている全ての反応並びに他の生物に由来する幾つかの反応を含む。
【0083】
8.3 遺伝子欠失/付加の数学的モデル化
事実上、どの代謝反応も、一つ以上の遺伝子の翻訳により生産される一つ以上の酵素によりある程度まで調節される。結果として、微生物のDNA配列からある種の遺伝子を除去すると、これらの遺伝子にコードされる酵素の役割に応じて、致命的であるか、又はあるとしてもほとんど効果を持たない。逆に、組換えDNA技術によるある種の遺伝子の付加は、影響が全く無いか又は新規な望ましい細胞機能を生じ得るかのいずれかである。大腸菌の代謝の化学量論モデル及び複数の種で生じる反応を包含する汎用化学量論行列が与えられると、この節の目的は、(i)複数遺伝子の欠失の存在下における細胞の頑健性を捕らえ、且つ(ii)所与の代謝目標の改良に最も大きな効果を有するさらなる遺伝子を汎用データ・セットから同定する、数学的モデルを定式化することである。
【0084】
第一に、あらゆる可能な遺伝子の集合として K ={k}={1,...,M,...,T}を定義する。ここで、Mは大腸菌遺伝子の数を表し、Tはデータ・セット中の遺伝子の総数を表す。この集合は E とNEの二つの部分集合に分配され得る。ここで、部分集合 E は大腸菌に存在する遺伝子を表し、部分集合 NE は非大腸菌種にのみ存在する遺伝子を表す。
【0085】
ε={k|1≦k≦M}
ηε={k|M+1≦k≦T}
続いて、2値変数 yk に個々の遺伝子kの存在又は欠如を記述させる。
【0086】
yk = 遺伝子kが宿主生物で発現しない場合、0
遺伝子kが存在し且つ機能的である場合、1
DNA組換えから欠失又は挿入についての最適な遺伝子選別の選択はyにおける非0要素の数を適切に制約することにより決定され得る。大腸菌から所与数の遺伝子dを除去する事例は下記の制約を含めることにより研究できる。
【0087】
【数10】
これは僅か(M-d)個の遺伝子が代謝ネットワークに利用できることを保証する。同様に、任意の付加遺伝子 h を導入する効果は、
yk=1、∀k∈ε (8)
【0088】
【数11】
を利用することにより研究できる。方程式(8)は必要ならば全ての大腸菌遺伝子が存在し機能的であることを可能にする、一方、方程式(9)は許容できる付加の数に上限を設定する。このモデルにより選択される最適な遺伝子はどのNEの要素が1に等しいかを決定することにより得られる。その上、複数の遺伝子がしばしば一つの反応に対応し、そして時折、複数の反応が一つの遺伝子にコードされる一つの酵素により触媒されるので、2値パラメータajkはどの酵素がどの遺伝子にコードされるかを記述するように定義される。
【0089】
αjk = 遺伝子kが反応jに直接的効果を及ぼさない場合、0
遺伝子kが反応jを触媒する酵素をコードする場合、1
パラメータajkは遺伝子機能の割り当てと反応との連関を確立する。流束値vjが非0値をとるためには、少なくとも一つの遺伝子はこの反応を触媒する酵素をコードしなければならず(αjk=1)、そしてこの遺伝子は宿主生物中に存在し且つ機能的でなければならない(yk=1)。少なくとも一つの遺伝子が個々の酵素をコードしなければならないとすると、
【0090】
【数12】
は、反応jの酵素をコードする遺伝子が機能しない場合は0であり、反応jの酵素をコードする遺伝子の少なくとも一つが機能する場合は1又は1より大である、という関係式が得られる。これは、次の制約
【0091】
【数13】
が反応jを支持できる活性遺伝子kが存在しない場合、vj=0を保証することを意味する。この場合、
【0092】
【数14】
これは今度はvjの値を0にさせる。或いは、このような遺伝子の少なくとも一つが機能するならば、
【0093】
【数15】
であり、vjは下限 Ljと上限Ujの間の任意の値をとることを可能とする。これらの限度は化学量論的制約を受けた所与の流束値 vj をそれぞれ最小化/最大化にすることにより設定される。これらの問題は市販のソフトウェア・パッケージGAMSを通してアクセスされるCPLEX6.6を用いて解かれる。3700までの2値変数を持つ問題はIBM RS6000-270ワークステーションで解かれた。
【0094】
8.4 遺伝子削除研究
本提示に従うこの実施例において、本発明者らは、何がグルコース基質上のバイオマス生産を最大化できる最小遺伝子セットであるか(摂取基準:10mmol)そしてバイオマス生産の特定レベルを依然維持するこの遺伝子セットから、最大何個の遺伝子欠失が可能であるかを決定する。第一に、本発明者らはバイオマス生産流束値 vbiomass を最大化した。この解は化学量論的制約内で代謝ネットワークにより達成できるバイオマス生産の最大理論レベル( vmax biomass 値=1.25gバイオマス/g DW ・時間)を与える。次に、バイオマス生産の特定目標レベル vtargetbiomass (最大値の百分率として)を維持する最小数の遺伝子を決定する。新たな目的関数は vtargetbiomass 以上のバイオマス生産 vbiomass を設定する制約にかけられた細胞に利用できる機能的な大腸菌遺伝子の総数を最小にする。この問題は、
【0095】
【数16】
【0096】
【数17】
を条件として
【0097】
【数18】
を最小化するものとして定式化される。
上式中、ykの非0要素は目標増殖速度を達成できる最小遺伝子セットを規定する。最大理論増殖速度を維持できる最小遺伝子セット M100% は vtargetbiomass=100%・ vmax biomassを設定することにより得られる。このモデルは、400の利用できる反応のうちの202の非輸送細胞内反応(111x2の可逆反応+178の不可逆反応)が vmax biomassを維持するために必要であることを予測する。これらの反応には、解糖反応、ペントースリン酸経路、TCA回路、呼吸反応及び最適増殖に必要なあらゆる他の同化及び異化経路が含まれる。
【0098】
M100%が与えられれば、次の目標は、代謝ネットワークに特定の最適以下の増殖速度を依然維持させながら、これらの遺伝子のどれを欠失させうるかを決定することである。これは、 vtargetbiomassを vmax biomassの種々の百分率に等しく設定し、M100%以外の細胞内反応流束値を0に制約することにより達成される。この仮定は該モデルがM100%セット以外の任意の遺伝子を活性化することを防止することに留意しなければならない。この仮定の意義は下記の節で論じる。種々のバイオマス生産レベルにおいて許容できる遺伝子削除の数は図13で与えられるが、一方選択される遺伝子の除去は図14の表に示される。予測されるように、該ネットワークに対するバイオマス生産の要求は少なくなるにつれ、該モデルはより多くの遺伝子削除を許容する。しかしながら、許容できる削除の範囲はかなり小さい。具体的には、該モデルは、90%・ vmax biomassのバイオマス要件の場合多くとも9つの遺伝子欠失を許容する、一方、18の遺伝子除去は該ネットワークにバイオマス形成をできなくさせる。従って、M100%の全要素を含む部分集合から18遺伝子の欠失を減じると(194遺伝子)、用いられるFBAモデルについて大腸菌の細胞増殖を維持できるM100%の最小の部分集合を表す。更に、全ての部分集合はエドワードとパルソン(2000b)により実施された大腸菌のイン・シリコの遺伝子欠失研究により同定された中心的な代謝の7つの実験的に立証された必須の遺伝子産物を含む。
【0099】
8.5 遺伝子欠失研究についての討論
特定遺伝子の欠失の研究は種々のエネルギー生成経路の効果に興味ある洞察を与える。示唆された遺伝子の欠失は、該細胞への必要なバイオマス生産要求が低減するとき、該ネットワークのエネルギー状態が改良されることを示している。これは、バイオマス要件が減少するとき、最適化の定式がエネルギーの形成を担う経路を順次排除するという事実により証明される。このような観察の一つは、TCA回路の段階的な分解を含む。該モデルがバイオマスの最適レベルの80%のみを生産するよう制約される場合、該ネットワークはもはやコハク酸デヒドロゲナーゼ酵素を利用してFADH2を生産することをしない。更に、バイオマス生産要件を70%まで低減することにより、fumAB、mdh、及びsucCD遺伝子の除去が可能となり、単位反応流束当たり1GTP及び1NADHの形成が無くて済むようになる。排除されるべき次の主要なエネルギー形成経路は20%のバイオマス生産レベルで生じる。この時点で、細胞のエネルギー状態は細胞のプロトン勾配からATPの形成をもはや必要としない。最後に、最低のバイオマス生産レベルでは、該細胞は細胞膜を横切ってプロトンを通過させるためにNADHの酸化をもはや要しない。
【0100】
この研究は、種々のエネルギー生成経路への細胞増殖の依存性に洞察を与え、細胞増殖を可能にする最小数の代謝遺伝子の見積りを可能とする。194遺伝子の予測は、ヘモフィルス・インフルエンザエ及びマイコプラズマ・ゲニタリウムの完全なゲノムを研究し且つ大きな系統発生距離を超えて保存される遺伝子が必須である蓋然性が極めて高いと仮定することにより得られたムシェギアンとクーニン(1996)による256の理論的見積りより低い。この反応に基づいた枠組みが翻訳、転写、複製、及び修復、及び化学量論モデルによる経路の一括化と関連する遺伝子を明らかにする能力に欠けることを考慮すると、これは予測された。より実用的な比較は、最小遺伝子セットの見積りに含まれる代謝遺伝子の数の考慮を含む。この場合、予測された194の代謝遺伝子セットはムシェギアンとコーニン(1996)により提唱された最小遺伝子セットに含まれる94の代謝遺伝子を過剰に見積もっている。この過剰な見積りは、本来の最適な遺伝子セット以外の代謝遺伝子を活性化する効果が研究されなかったために部分的に生じる。これは更なる代謝経路を開くことにより最小遺伝子セットの見積りを下げる。その上、この研究はグルコースが有機燃料として該ネットワークに入ることのみを許容した、限定された代謝能はヌクレオシド、アミノ酸、及び他の代謝物の輸入に比例してより大きく依存することにより補填され得る(シイ.エイ.フッチソンら、Science 286, 2165(1999))。
【0101】
8.6 アミノ酸生産の最適化研究
この節において、本発明者らは大腸菌の代謝ネットワーク内に組込むために数学的に最適な反応経路を同定しグルコース及び酢酸塩上での増殖におけるアミノ酸形成を最適化する。本発明者らは全部で20アミノ酸の理論的に最適な形成を開発した。それぞれの最適化の実行は、(i)大腸菌に存在する反応のみを含む事例及び(ii)該モデルが汎用化学量論行列から全反応を選択することを許す事例の二つの事例について行った。アミノ酸の生産を最大化する問題は、方程式(7)のvbiomass 代わりにアミノ酸の蓄積baaを置換することにより定式化され、一方、汎用ネットワークのアミノ酸形成bUNVaaを最大化する問題は、
【0102】
【数19】
を条件として、
Z=bUNVaa
を最大化するものとして定式化される。
【0103】
この定式化により、複数種の反応一覧表から任意の数の反応を選択できることに留意せよ。該モデルにより選択されるが大腸菌には存在しない反応(即ち、NEの全ての非0yk要素)は、組換えDNA技術により細胞代謝を操作するための経路を提供する。汎用行列からの反応の追加がある場合及び無い場合の大腸菌代謝ネットワークの理論的アミノ酸生産能は、グルコース及び酢酸塩上の増殖の場合、図9の表に示される。正確な数値よりもより有意義なことは、該モデルにより予測される構造的な経路の変化であることに留意しなければならない。なぜなら、これらは理論的な最大収率計算であるからである。ヴァルマとパルソン(1993)のモデルによる予測を比較のために示す。予期されるように、ヴァルマとパルソン(1993)のモデルによる最大生産能は、生産に利用できる更なる代謝経路を含めたより複雑なモデルの予測を僅かに下回る。
【0104】
この結果は、大腸菌の7アミノ酸の生産経路に対する改良が種々の生物から得られる遺伝子の追加により理論的に達成可能であることを示している。アルギニン経路の操作は最大の有望性を示し、グルコース及び酢酸塩上の増殖において追加の遺伝子によりそれぞれ8.75%及び9.05%の増加が得られた。最適な組換えアスパラギン経路はグルコース及び酢酸塩上での現在の大腸菌増殖を5.77%及び5.45%上回る増加を示し、一方、システイン生産はそれぞれ3.57%及び3.80%上昇し得る。ヒスチジン生産経路はDNA組換えのためのもう一つの有望な標的であることが明らかになり、同様に0.23%及び4.53%の改良が達成可能である。イソロイシン、メチオニン及びトリプトファンの形成経路は生産を増強するための最後の3つの遺伝子対象物を与える。
【0105】
これらの種々の改良を大腸菌のアミノ酸生産経路に導入するための責任を負う酵素は図15の表に示される。殆どの場合、本来のアミノ酸生産経路に僅か1又は2個の遺伝子の追加により最大理論収率が増大する。たとえ、3,400反応の完全な一覧表が選択に利用できるとしてもである。例えば、カルバミン酸キナーゼ及び6-ホスホフルクトキナーゼのピロリン酸依存体をコードする外来遺伝子を導入することにより、更にグルコース上での増殖のアルギニン生産を最適化する、一方、カルバミン酸キナーゼ及び酢酸キナーゼをコードする別の一遺伝子を追加することにより、酢酸塩上でのアルギニン生産経路を化学量論的に最適にする。大腸菌でアスパラギン酸−アンモニア・リガーゼ及び硫酸アデニリルトランスフェラーゼをコードする遺伝子を発現させることにより、上述したように、それぞれアスパラギン及びシステインの生産が増大する。グルコース及び酢酸塩基質上でのイソロイシンの生産及び酢酸塩上でのメチオニンの生産のみが該モデルに従って最適に到達するために二つ以上の更なる酵素を必要とする。
【0106】
8.7 遺伝子追加の研究についての討論
これらのアミノ酸経路の慎重な検討は、これらの追加酵素が本来の経路のエネルギー効率をどのように改良するかを明らかにする。グルコース上での増殖について本来の及び汎用的なアルギニン生産経路を図16に示す。二つの経路は二つの反応のみで異なる。即ち、汎用モデルの6-ホスホフルクトキナーゼのピロリン酸依存性類似体は大腸菌に存在するATP依存性のものに取って代わり、汎用モデルのカルバミン酸キナーゼは本来の大腸菌モデルに由来するカルバモイルリン酸シンセターゼに取って代わる。エネルギー利用の最初の改良は、汎用モデルの6-ホスホフルクトキナーゼがATPの代わりにアルギニノコハク酸シンターゼ反応から形成されるピロリン酸を用いて解糖の第三工程でリン酸基をフルクトース-6-リン酸に移転するために生じる。大腸菌モデルは、加水分解切断のためピロホスファターゼを介してこのピロリン酸を送り、結果としてこのエネルギー豊富なホスホアンヒドリド結合のエネルギーを浪費する。この他の方法で浪費されたエネルギーを取り戻すことにより、6-ホスホフルクトキナーゼのピロリン酸体は生産されるアルギニン分子当たり1未満のATPホスホアンヒドライド結合を必要とする。
【0107】
細胞エネルギー節約の第二の形態はカルバモイルリン酸シンテターゼの置換により実現される。天然のカルバモイルリン酸シンテターゼは2つのATPホスホアンヒドリド結合の消費で二酸化炭素から1モルのカルバモイルリン酸を形成する。この反応は1個のグルタミン分子のアミノ基をも必要とし、続いてグルタミン酸を形成する。グルタミン酸からグルタミンを再形成するためには更に他のATPを必要とするため、カルバモイルリン酸シンテターゼによる個々の単位流束は3個の ATPを必要とする。汎用モデルに組み込まれたカルバミン酸キナーゼは1個の ATPの消費のみで二酸化炭素及びアンモニアからカルバモイルリン酸を形成する。従って、カルバミン酸キナーゼは形成されるカルバモイルリン酸の単位流束当たり2未満のATP結合を必要とする。全体として、汎用モデルにより用いられた追加の遺伝子は本来の経路の正味の3 ATPを節約し、アルギニン生産を8.75%まで増大させる。同様な分析は図17に示される酢酸塩基質からの天然及び汎用のアルギニン生産経路でも行なうことができる。
【0108】
大腸菌のアスパラギン生産経路は該代謝ネットワークへのグルコースの投入の二つの様式、即ちグルコキナーゼ系及びホスホトランスフェラーゼ系、について図18に示す。興味深いことに、大腸菌モデルは、最適なアスパラギン生産中のグルコースの投入について、より一般的なホスホトランスフェラーゼ系よりグルコキナーゼを好む。グルコキナーゼは通常の条件下のグルコース代謝では小さな役割しか果たさないことが知られているが、この反応によるホスホトランスフェラーゼ系の置換は1.560モル/モル・グルコースから1.818モル/モル・グルコースにアスパラギンの生産を増加させる。ホスホトランスフェラーゼ系を通したグルコースの投入は、ピルビン酸からPEPを再生するためにホスホエノルピルビン酸(PEP)シンターゼを介した実質的な流束を必要とし、1 ADPホスホアンヒドリド結合の正味の消費を伴う。従って、大腸菌でグルコキナーゼを過剰発現すること又はより活性な組換えグルコキナーゼ酵素を追加することのいずれかがアスパラギン生産を改良しうる。図19はグルコース上でのアスパラギン生産に最適な汎用経路を例示する。大腸菌に存在するAMP形成版よりADPを形成するアスパラギン酸−アンモニア・リガーゼ酵素を選択することにより、この経路のエネルギー効率が改良される。現在、ピロリン酸結合エネルギーの保存のための経路が大腸菌で同定されていないので、AMPの形成は等価の2個の ATPホスホアンヒドリド結合を用いる。対照的に、ADPを形成することにより、汎用経路は単位流束当たり僅か1個のホスホアンヒドリド結合の分解しか必要でない。実際、汎用モデルのエネルギー効率は、アスパラギンの形成が膜貫通プロトン勾配からの ATPの形成を必要としないものである。この勾配は単に無機リン酸塩を細胞に輸送するために用いられる。この機構はアスパラギン生産をグルコース上での増殖で5.77%そして酢酸塩上での増殖で5.45%改良する。
【0109】
酢酸塩上の増殖における大腸菌モデル及び汎用モデルの最適なヒスチジン生産経路を図20に示す。ここでも、汎用モデルはATPホスホリボシルトランスフェラーゼ及びホスホリボシル−ATPピロホスファターゼの両方によるこの事例において形成されるピロリン酸のホスホアンヒドリド結合エネルギーを保存する反応を選択する。従って、該汎用モデルは生産されるヒスチジン分子当たり大腸菌モデルよりも少なくとも2個の ATPだけより効率的である。更に、大腸菌モデルへのグリシンデヒドロゲナーゼの追加は天然のヒスチジン経路の炭素転換を改良する。天然の大腸菌に最適なヒスチジン生産条件下で、細胞内グリシンはグリシン切断系により二酸化炭素とアンモニアに変換される。この工程において、グリシンの炭素の1つだけがテトラヒドロ葉酸へのその転移により保存される。他方、汎用モデルはグリシンをグリオキシル酸に転換することにより両方の炭素を保存する。該グリオキシル酸は続いてグリオキシル酸分路に汲み戻される。両機構はヒスチジンの最大理論収率を4.53%改良する。
【0110】
8.8 結論
提唱する最適化枠組みは、遺伝子の欠失又は付加に応答する代謝ネットワークの性能を研究する定量的手段を提供した。代謝ネットワークの性能は、遺伝子欠失に直面した場合の頑健性又は拡大を続ける利用可能な遺伝子のデータベースから得られる外来遺伝子の組換えによる流束の増強のいずれかに関する。現在、遺伝子−酵素の完全な関係は利用できないが、この定式化は、それが利用できるようになるとき、この情報の組み込みを可能とする。遺伝子削除分析は、増殖に最適化された大腸菌の代謝ネットワークが、その増殖要求が低下するとき遺伝子削除の量の増加に耐えうるであろうことを明らかにした。更に、このネットワークは、バイオマス生産がもはや可能でなくなるまでに理論的に多くとも18遺伝子の欠失に耐えうるであろう。遺伝子追加の研究は、DNA組換えにより大腸菌の遺伝子型に更なる選択肢を追加することにより、7種のアミノ酸の最大理論的生産が改良されることを明らかにした。これらの改良は二つの機構の一つにより生じる、即ち(i)エネルギー効率を改良することによるか、又は(ii)生産経路の炭素変換効率を増大させることによる。
【0111】
流束均衡解析の化学量論特性への厳格な依存性はその最大の強みであるがその最も顕著な弱点でもあるといえる。細胞内の流束分布は最終的に細胞内の調節機構、細胞酵素の運動特性、及びこれらの酵素の発現により唯一に決定される。細胞が化学量論的に最適な様式で機能すると仮定することにより、細胞に利用されうるものより幅広い代謝流束分布の限界を得る。現在、本発明者らは論理的制約を用いて調節情報を流束均衡モデルに組み込んでいる。これらの制約は、代謝濃度の上下変動が反応流束値の上下移行と一致することを保証する。より厳しく制約されたモデルは、過剰生産する細胞産物がどのように全体の代謝調節に影響を及ぼすかについての更なる洞察を与える。代謝モデルの正確度が向上し流束均衡解析に利用できる情報量が増すとき、本発明で導入された枠組みは実施に最も最適な遺伝子の付加及び/又は欠失の代謝操作を選択するために用いられ得る。
【0112】
9.実施例:異なる増殖要件及び/又は摂取環境下での大腸菌の代謝における最小反応セット
本発明の枠組みは、幾つかの異なる文脈において幾つかの代謝ネットワーク問題に適用できる。本発明の枠組みは異なる増殖要件及び摂取環境の下での大腸菌の代謝における最小反応セットを決定するためにも適用された。本発明に従って、異なる基質上での種々の増殖速度を支持できる代謝反応の最小セットを同定するための計算手順が、大腸菌の代謝ネットワークの流束均衡モデルに導入され適用される。この問題は一般化されたネットワーク最適化問題として数学的に提示される。特定の増殖速度を支持できる最小反応セットは、(i)有機物質の摂取を単一の有機成分(例えばグルコース又は酢酸塩)に限定する、及び(ii)利用できる細胞輸送反応を用いて如何なる代謝物も輸入可能とする、という二つの異なる摂取条件について決定される。本発明者らは最小反応ネットワークセットが該ネットワークに課された摂取環境及び増殖要件に高度に依存することを見出す。具体的には、本発明者らは、流束均衡モデルにより記載したような、大腸菌のネットワークはグルコースのみの培地上での増殖を支持するために224の代謝反応を必要とし、酢酸塩のみの培地上では229の代謝反応を必要とする一方、特別に操作された増殖培地上では122の反応のみで増殖が可能となる。
【0113】
完全に配列決定されたゲノムの最近の急増は幾つの遺伝子が細胞生命を維持するために必要であるかという疑問に著しい注目を集めてきた。最小ゲノムは一般に特定の環境で複製及び増殖できる遺伝子の最小セットとして定義される。この最小遺伝子セットを明らかにする試みは実験的研究法及び理論的研究法の両方を含む。広範囲のトランスポゾン突然変異誘発を用いてハッチソンら(1999)は、マイコプラズマ・ゲニタリウムの480個のタンパク質をコードする遺伝子の内265個から350個(最小と知られる細胞ゲノム(580kb))が実験増殖条件下での生存に必須であることを決定した。更なる実験研究は、酵母及びバチルス・ズブティリスのゲノムのそれぞれ12%及び9%のみが細胞の増殖及び複製に必須であることを明らかにした(エム.ジイ.ゴエブルとティ.ディ.ピーテス、Cell 46, 983(1986);エム.イタヤ、FEBS Lett. 362, 257(1995))。理論的方法は、広い進化的境界を越えて保存される遺伝子が細胞の生存に不可欠であるという仮定から出発する。この仮説に基づいて、エム.ゲニタリウム及びヘモフィルス・インフルエンザエに共通した遺伝子が最小ゲノムの構成員であるに違いないと仮定することにより、256遺伝子という最小セットがムシェギアンとコーニン(1996)によりコンパイルされた。興味深いことに、エム.ゲニタリウムに保存される未知機能の26個の大腸菌オープン・リーディング・フレームの内僅か6個が種の存続に必須であると判断された(アリゴイら、1998)。複数の、全く異なる、種及び環境に特異的な最小ゲノムの存在が長く憶測されてきた(フイネン、2000)。
【0114】
ここで、本発明者らは異なる摂取条件下での代謝反応の増殖維持に必要な最小のコアを見積もることによりこの主張を試験する計算手順を記載する。パルソンと共同研究者(エドワード&パルソン、2000b)により提唱された大腸菌の代謝の最新の化学量論モデルは、酢酸塩、又は複合基質のいずれかの増殖速度に関する所与の目標を支持できる酵素反応の最小セットを同定するために用いられる。この流束均衡解析(FBA)モデルは、解糖、トリカルボン酸(TCA)回路、ペントースリン酸経路(PPP)、及び呼吸経路、並びにアミノ酸、ヌクレオチド、及び脂質の合成経路を含む454個の代謝物及び720の反応を組み込む。増殖は、適切な生物学的比率で大腸菌バイオマスの種々の構成要素の排出を模倣するモデルに更なる反応を追加することにより定量される(エフ.シイ.ネイドハード、大腸菌及びサルモネラ:細胞生物学及び分子生物学、ASM出版編、ワシントン市、1996)。遺伝子を該ネットワーク中で個々の代謝反応に関連付けることにより、遺伝子の活性化及び不活性化は0〜1の論理2値変数を用いて該FBAモデルに組み込まれる。特定の代謝の目標(即ち増殖速度)を満たすために必要な活性代謝反応の数を最小にするという問題は一般化されたネットワーク流束問題の数学的構造をとって示される。ここで、ノードは代謝物を示し、接続アークは反応を示す。または、バイオマス目標の代わりに、ATP生産の最小レベル又は主要構成要素/代謝物の最低許容レベルが容易に該モデルに組み込まれうるであろう。混合−整数線形計画法(MILP)の解決ソフトであり、GAMSを通してアクセスされるCPLEX6.5は、分から日の範囲に及ぶCPU時間で、生ずる大規模な組み合わせ問題を解決するために用いられる。
【0115】
大腸菌のモデルに基づいて、(i)有機物質の摂取を単一の有機成分に限定する、及び(ii)対応する輸送反応を用いて任意の有機代謝物の摂取を許容する、という二つの対照的な摂取環境の下で異なる増殖要件についての最小反応ネットワークを調査する。これら二つの極端な摂取シナリオは、構成要素の合成のため内部代謝に最大限に依存する場合と最小限に依存する場合をそれぞれモデル化し、必要な最小反応セットに及ぼすそれらの効果を調べるために選択された。先の試みは、一連の遺伝子削除を通して必須遺伝子のセットを抽出するために還元主義の方法論を利用した。ここで、本発明者らは細胞増殖に及ぼす全ての反応の効果を同時に考慮することにより最小セットを選択する効率的な計算手順を用いる。次に、これらの反応を触媒する酵素(単数又は複数)を対応するコード遺伝子に位置付けることにより最小遺伝子セットを推論する。得られる結果は、原理的には、用いられる流束均衡大腸菌モデル(エドワードとパルソン、2000)の細目に依存するが、それはなお、何が最小ゲノムであるかそしてそれが環境によりどのように形成されるかという疑問に対して価値ある洞察及び展望を提供する。
【0116】
9.1 結果
最初の事例研究は、グルコース基質上での大腸菌の増殖を支える最小反応セットを同定する工程を含む。用いられるモデル化手法の詳細な記載は付属書に提供される。無機リン酸塩、酸素、硫酸塩、及びアンモニアの制約されていない摂取経路とともに、制約された量(<10 mmol/gDW・時間)のグルコースは代謝ネットワークに燃料供給できる。細胞から出ていくことのできるあらゆる代謝物の分泌経路も提供される。これらの条件下において、FBAモデルは、大腸菌の反応ネットワークが0.966gバイオマス/gDW・時間の最大理論増殖速度を達成できることを予測する、本発明者らはこれを最大増殖速度(MGR)と呼ぶ。該反応ネットワークがこのMGRに適合することを要求することにより、本発明者らは720の反応の内少なくとも234の反応がグルコース上での最大増殖に必要とされることを決定した。
【0117】
次いで、種々の最大以下の増殖要求(MGRの%)を満たすために必要な代謝反応の最小数を同定するために、増殖要求は次の研究で緩和される。興味深いことに、図21に示されるように該ネットワークに課された増殖要求が低下しても、必要な代謝反応の数は穏やかにしか減少しない。234個の反応から成る反応セットが最大増殖に必要であるが、30%以下の増殖速度に対応する最小反応セットは僅か224の反応を含む。同じ最小反応セットはMGRの0.1%という低い増殖速度でさえ持続する。一般的に、反応セットの減少は、増殖要求が減少する際に、(i)解糖、(ii)TCA回路、及び(iii)ペントースリン酸経路で生じるエネルギー生産反応を巧く除去することにより達成される。しかしながら、より速い増殖速度で存在しないある種の反応がより遅い増床速度での最小セットに加わる。このことは連続的な反応の排除より遥かに複雑な流束方向転換の機構があることを示唆している。課された増殖要件が低減する際に最小反応セットに参加する/退場する反応の詳細な記載は図22の表で提供する。
【0118】
比較のため、グルコースの代わりに制限された量の酢酸塩(<30 mmol/gDW・時間)を該ネットワークに投入できる同様な研究が実施された(図21を参照)。ここで、該ネットワークは反応セットの減少に対してグルコースの研究におけるより遥かに寛容でない。グルコース基質では増殖要求が低減するとき最小ネットワークの大きさは234反応から224へと減じるが、酢酸塩基質では該ネットワークの大きさは231反応から229へ減少するだけである。これは、最小反応セットの大きさが課されたバイオマス生産要件に依存しているだけでなく、単一基質についての具体的な選択にも依存していることを意味している。
【0119】
最小反応セットもそれらの対応する反応流束も固有でないことに留意することが重要である。例えば、30%のグルコース摂取の事例では、本発明者らは、該ネットワークに存在する171のイソ酵素と関連する多様性を計数することさえしないで、正確に224の酵素反応を含む100を上回る異なる最小反応セットを同定した。これらの殆どの複数の最小反応セットの中で、主要経路の活性及び流束方向は極く僅かしか異なっていない。最大の変化はネットワークの異化部分に集中する。例えば、一部の最小反応セットは代謝副産物として二酸化炭素、酢酸、及びフマル酸のみを分泌するが、他のセットは種々の量のギ酸、グリセロール、及びフェニルアラニン及びチロシンといったアミノ酸も分泌しうる。これらの結果は、大腸菌ネットワークの驚異的な減少及び流束方向転換の多様性をコンピュータ計算により確認させる。より重要なことは、同定された全ての最小反応セットが、それらの対応する遺伝子欠失がグルコース上での増殖に致死的であることが実験的に決定された12の反応の内の11の反応を含むことである。線形最適化を用いこのモデルで行われた単一の遺伝子欠失に基づいた先の分析は、12の致死的遺伝子の欠失の内7個のみを同定した、このことはMILP枠組み内で同時遺伝子欠失を考慮する重要性の動機付けとなる。
【0120】
第二の事例研究では、任意の有機代謝物の摂取又は分泌が可能である。このネットワークに投入される有機物質の量は炭素原子の制限量(<60 mmol/gDW・時間)を摂取させることにより第一の事例研究と一致させる。酸素、無機リン酸、硫酸及びアンモニアの制約されていない摂取経路も第一の研究と同様に与えられる。これらの「理想的な」摂取条件の下で、1.341gバイオマス/gDW・時間という最大増殖速度が達成可能であり、この場合少なくとも201の代謝反応を要することが見出される。僅か5個のアミノ酸しか最大増殖(即ちMGR)条件下で輸送されないという事実は、該培地から細胞内へそれらを輸送するのではなく内部で殆どのアミノ酸を生産することが化学量論的により有利であることを示している。
【0121】
しかしながら、この傾向は増殖速度の要件が低減するにつれ急速に逆転する。この逆転は、最大以下の目標増殖要求の下で、代謝物の輸入数の増加の直接的な結果として必要な反応の総数の対応する急激な減少をもたらす。図23の表は、各目標増殖速度で摂取又は分泌される代謝物を列挙し、一方、図24(MGRの100%〜90%)及図25(MGRの100%〜1%)は種々の目標増殖要求を達するために必要とされる代謝反応の数を例示している。バイオマス要求が低減するとき、輸入する代謝物の数を増加させることによる最小反応セットの大きさの急速な減少(図23を参照)は、増殖要求がMGRから約90%まで低減するまで続く。この増殖目標(図25を参照)より下では、付加的だが適度の減少が主として流束方向転換により達成される。図26は増殖目標が引続いて減少するとき、最小反応セットから除去され又はこれに追加される反応をまとめている。122の反応から成る第二の事例研究の最小反応ネットワークは目標増殖要求がMGRの10%まで低減する場合に達成される。この最小ネットワークは、図27に示されるように、幾つかの輸送反応及び再利用経路の反応とともに、主に細胞エンベロープ及び膜脂質の生合成反応から成る。グルコースのみの研究と同様に、複数の有機物摂取の事例についての複数の最小反応セットが予測される。
【0122】
9.2 討論
この研究では、本発明者らは、(i)グルコース又は酢酸塩のみの摂取環境、及び(ii)対応する輸送反応に関与する任意の有機代謝物の自由な摂取又は分泌という、二つの異なる摂取環境の下で増殖を支えることができる大腸菌の代謝反応の最小数を同定した。得られた結果は、最小反応セット、従って対応する最小遺伝子セットが増殖培地により与えられる摂取機会に強く依存することを定量的に証明している。グルコース又は酢酸塩のみを含む培地上で増殖する大腸菌細胞が増殖を支えるためにそれぞれ少なくとも224又は229の代謝反応を必要とするが、一方、豊富で最適に操作された培地上で培養された細胞は理論的に僅か122の代謝反応で増殖を支えうるであろう。その上、単一の基質の選択は最小反応セットの大きさ及び組成に影響を及ぼす。予期されるように、最小反応セットは必要な増殖速度が増加することにより大きくなる。しかしながら、この増加の大きさは試験された事例で全く異なる。事例(i)では、最小反応セットはグルコース上での最大増殖速度を満たすために224から234まで増加するのみであり、酢酸塩増殖では229から231まで増加する、一方、事例(ii)では、最小反応セットは122から201までほぼ倍増する。別の重要な観察は大腸菌の代謝ネットワークの大規模な減少であり、これは、グルコース上の増殖に利用できる代謝反応の僅か31%、そして複合培地上の増殖に利用できる反応の僅か17%しか利用せずに増殖を支えることができることを示す。これらの減少した最小反応ネットワークのセットでさえも、大きな多様性を示す。具体的には、100の代替的最小反応セットの非網羅的な一覧表がグルコースのみの摂取事例について同定された。
【0123】
本発明者らの分析は、大腸菌の完全な最小ゲノムの部分集合であり且つ種に特異的な最小代謝反応セットを提供することに留意しなければならない。これは、翻訳、複製、組換え、修復、転写に関連する遺伝子、及び未知機能の遺伝子を考慮できない、反応に基づく分析を採用した結果である。マイコプラズマ・ゲニタリウムを用いた研究における、ハッチソンらの必須遺伝子セット及びムシェギアンとコーニンにより提唱された最小遺伝子セットと本発明者らの最小代謝反応セットとの比較を図28に示す。得られた結果は、限られた代謝能力がヌクレオシド、アミノ酸、及び他の代謝物の輸入への比例して大きくなる依存により補償され得るというハッチソンと共同研究者(2)の発見と概念的に一致する。エム.ゲニタリウムの完全なゲノムに基づく代謝ネットワークの再構築は現在利用できず、反応ごとの比較は不可能であるが、これら三研究における種々の機能的分類の中での代謝遺伝子/代謝反応の分布は全く同じである。従って、この研究で大腸菌に適用された同時反応除去の戦略はおそらくエム.ゲニタリウムに課された進化の圧力に匹敵し、そのゲノム大きさを減じるであろう。本発明者らの分析における最小反応セットの大きさの過剰見積りは概ねその種に特異的な性質によるものであろう。大腸菌の細胞エンベロープは主としてペプチドグリカンから構成される細胞壁を含むが、マイコプラズマの細胞エンベロープは細胞壁を欠く。従って、大腸菌の生存に必要な多数の細胞エンベロープの反応はハッチソンらの遺伝子セット及びムシェギアンとコーニンのそれに含まれない。別の一要因は、同様な代謝物が一つの遺伝子と関連する機構により輸送され得るにもかかわらず、本発明者らが個々の代謝物の摂取又は分泌に異なる反応/遺伝子を割り当てることである。更に、本発明者らの分析は大腸菌のモデルに基づいているため、おそらく非大腸菌種に存在するより効率的な反応の組み合わせが最小遺伝子セットを更に減少させ矛盾を減らしうるであろう。
【0124】
この枠組みは更なる種の最小反応セットを構築するために利用され得る。これらの最小セットを対比することにより、異なる進化上の分岐に沿ってどのように最小反応セット(代謝遺伝子セット)を比較するかが推論されうるであろう。具体的には、エム.ゲニタリウム及びエイチ.インフルエンザの最小反応セットは決定され先の研究とともに基準化されうるであろう。その上、種に依存しない最小代謝反応セットは多数の異なる種に生じる反応を汎用化学量論行列(15,16)内で一括することにより追求され得る。最小細胞の基本機能を表すより複雑なモデルが開発されると、より詳細事項が該モデルに付与され得る。「最小」代謝ネットワークを合理的に同定するためにこのMILP枠組みを利用することに加えて、MILP枠組みは異なる生物及び異なる摂取環境において致死的遺伝子欠失をイン・シリコで予測するためにも用いられ得る。病原微生物(例えばエイチ.ピロリ)の致死的遺伝子欠失を同定することにより、治療介入(即ち遺伝子発現の妨害)のための有望な標的の序列付けされた一覧表をコンパイルすることができる。提唱された計算手順が採用されたFBAモデルの仮定に依存しているとしても、異なる摂取/分泌環境を研究するため並びに最小ゲノムについての研究において複数の種に由来する反応セットを包含するための多様性を与える。
【0125】
9.3 モデル化及び計算手順
流束平行分析は、潜在的に該細胞に利用できる流束分布を同定するために生化学経路の化学量論及び細胞組成情報に依存している。N個の代謝物及びM個の代謝反応から成る代謝ネットワークについて、本発明者らは、
【0126】
【数20】
を有する。上式中、Xiは代謝物iの濃度であり、Sijは反応jにおける代謝物iの化学量論係数であり、vjは反応jの流束値を表す。通常、得られる方程式の系は過少決定される(反応の数が代謝物の数を超過する)。増殖速度の最大化は時折細胞適応度の代用物として用いられる。重要な仮定は、該細胞が化学量論的制約により許容される全ての流束組み合わせに及ぶことができ、従って所与の代謝対象を最大化する任意の流束分布を達成できることである。これは、運動及び/又は調節の制約を無視することによりアクセスできる流束の領域を過剰見積りすることがある。バイオマス生産又は同等な増殖速度(1gDW・時間基準を仮定する)を最大化するための最適化モデル(線形計画法)は、
【0127】
【数21】
を条件として、Z=vバイオマスを最大化する。
【0128】
上式中、vbiomass はそれらの個々の比におけるバイオマスのあらゆる必要構成要素から成る対応する反応流束値である。1グラムのバイオマスはvbiomass の単位流束当たりで生産される。変数biは代謝物iの摂取(負の符号)又は分泌(正の符号)を定量化する。事例(i)において、アンモニア、グルコース、酸素、リン酸、及び硫酸のみがbiについて負の値を有することが許され、細胞からの輸送反応を持つ任意の代謝物は分泌され得る、一方で、事例(ii)において、全ての有機代謝物が輸入され得る。この研究において、本発明者らは、バイオマス生産の最大レベル及び最大以下のレベルを維持できる代謝反応の最小数が何であるかを調査する。それらの対応する遺伝子に反応を位置付けすることにより、バイオマス生産と遺伝子発現との連結が確立される。0〜1の論理変数を流束均衡解析枠組みに組み込むことにより、反応、従って遺伝子の存在/非存在が数学的に記載される。これらの2値変数
yj = 反応流束値vjが活性である場合、1
反応流束値vjが活性でない場合、0, j=1, ...,M
は、反応jが活性である場合1の値そして不活性である場合0の値をとる。下記の制約、vmin j ・yj≦vj≦vmax j ・yj, j=1,...,M
は、反応jを触媒する酵素をコードする遺伝子が存在したり機能的であったりしない場合、反応流束値vjが0に設定されることを保証する。或いは、このような遺伝子が活性である場合、vjは下限の minj と上限の maxj の間の値を自由にとる。バイオマス生産 v target biomass の目標値を満たすことができるネットワークにおいて機能的反応の総数を最小化する混合−整数線形計画法問題は下記の通りである。
【0129】
【数22】
を条件として、
【0130】
【数23】
を最大化する。
【0131】
上記のMILPは一般化されたネットワーク問題の部類に属する。ここで、個々の代謝物はノードを構成し、個々の反応は該ネットワークのアークを表す。
【0132】
1000を上回る2値変数の存在は、この問題を、一部の場合、コンピュータで解決困難にする。具体的には、このコンピュータ計算負担は、バイオマス目標値の低下で増大し、複数の摂取と関連した追加の複雑性により事例(i)より事例(ii)で遙かに大きい。該計算負担を緩和するために、4つの前処理技術が用いられる。即ち、(i)イソ酵素のグループ分け、(ii)無駄な周期の排除、(iii)流束限界の作成、及び(iv)連結性の制約の付加である。イソ酵素のグループ分けはイソ酵素により触媒される171の反応の集団を指す。触媒する酵素(即ちイソ酵素)のみを異にする反応は一緒のグループとし、全てのイソ酵素を一つの反応として扱う。これは2値変数の総数を切捨てることにより複雑性を減じる。無駄な周期の排除は、代謝に及ぼす正味の影響無しにループ中で集合的に流束を再循環する反応(2以上)の集合の除去を扱う。特別な事例は両方向で非0の流束を有する可逆反応である。一般的に、K個の反応から成る集合Kは、
【0133】
【数24】
の場合、無駄な周期を形成する。下記の制約は、それらの少なくとも一つが不活性で該周期を切断することを保証する。
【0134】
【数25】
全体として、346の無駄な周期が同定され、該モデルから排除された。大半の無駄な周期は単に可逆反応を含んでいた。
【0135】
得られるMILP問題の解決時間は流束値vjに課された下限 minj 及び上限 maxj の確かさに大きく依存している。確かな限界の minj 及び maxj は流束均衡制約及びバイオマス標的規格を条件として、あらゆる単一反応流束値vjをそれぞれ最小化及び最大化することにより得られる。
【0136】
【数26】
を条件として、vj*を最大化/最小化する。
【0137】
これは線形計画法(LP)の問題(2値変数でない)であり、あらゆる事例について迅速に解ける(即ち数秒未満)。異なる制限が異なるバイオマス目標について作成されることに留意せよ。該バイオマス目標が高くなるほど、得られる制限はより厳しくなる。
【0138】
連結性の制約は、細胞内代謝物を生産する反応が活性であるならば、この代謝物を消費する少なくとも一つの反応が活性でなければならずそして逆もまた同様であることを保証するためにも付与される。その上、細胞外代謝物を細胞内に輸送する反応が活性であるならば、この代謝物を消費する少なくとも一つの細胞内反応は活性でなければならずそしてその逆もまた同様である。これらの反応は、反応セットJを二つのサブセット、即ち細胞内反応を表すJint及び代謝物を細胞に/細胞から輸送する反応を表すJtrans、に分配した後、下記のように該モデルに組み込まれる。該代謝物セットIも細胞内代謝物及び細胞外代謝物をそれぞれ表すIint及びI ext のサブセットに分配される。
【0139】
【数27】
これらの連結性の制約は外部の代謝物とバイオマスの構成要素の間の適切な連結を保証できる反応の最小セットを同定するためにも用いられる。この問題は、ybiomass =1の活性なバイオマス反応を有する制約(10〜13)を条件として
【0140】
【数28】
を最小化する工程を含む。
【0141】
複数の最小反応セットの反復作成は整数の切捨てを累積しMILP定式化を解決することにより達成される。個々の整数の切捨ては以前に見出された一つの解答を排除する。例えば、解答 yj * は下記の整数の切捨てを追加することにより検討対象から排除される。
【0142】
【数29】
全ての最適化問題はIBM RS6000-270ワークステーション上でのモデル化環境GAMSを通してアクセスされるCPLEX6.5を用いて解かれる。この研究で消費された総累積CPUは400時間のオーダーであった。
【0143】
10. 選択肢及び変更
本発明は、本発明のモデル化枠組みを代謝ネットワーク問題の解決に適用できるかなり多数の方法を意図する。本発明の枠組みは、論理的制約を定義するために使用できるような定性的情報を用いて流束均衡モデルを改良するための体系的研究法を用いる。この情報は、定性的運動情報の制約、定性的調節情報の制約、差別DNAマイクロアレイ実験データの制約、及び他の論理的制約を含み得る。
【0144】
本発明のモデル化枠組みは種々の代謝問題を解決するために適用され得る。これは、遺伝子の付加及び/又は欠失の影響を決定する工程、最適な遺伝子付加を決定する工程、致死的遺伝子欠失を決定する工程、最小反応セットを決定する工程、並びに他の代謝操作を決定する工程を含む。これら及び他の問題は特定の増殖速度の要件、ある種の環境条件、又は他の条件を含みうる。
【0145】
本発明のモデル化枠組みはイン・シリコであるため、決して特定の生物に限定されない。本発明はかなり多数の生物がモデル化され得ることを意図する。本発明の精神及び範囲は請求されるもの全て及びそのあらゆる等価物を含むように広く解釈されるべきである。
【特許請求の範囲】
【請求項1】
生物の細胞代謝をモデル化する方法であって、
代謝及び細胞組織の情報の化学量論的質量均衡を用いて、流束均衡解析モデルを構築し、代謝ネットワークの利用可能な流束分布についての限界を同定する工程と、
前記流束均衡解析モデルに論理的制約を適用し、変更された流束均衡解析モデルを生成する工程と、を含み、
前記論理的制約は、利用可能な流束分布についての限界を制限し、よって前記流束均衡解析モデルの予測能を向上させる、方法。
【請求項1】
生物の細胞代謝をモデル化する方法であって、
代謝及び細胞組織の情報の化学量論的質量均衡を用いて、流束均衡解析モデルを構築し、代謝ネットワークの利用可能な流束分布についての限界を同定する工程と、
前記流束均衡解析モデルに論理的制約を適用し、変更された流束均衡解析モデルを生成する工程と、を含み、
前記論理的制約は、利用可能な流束分布についての限界を制限し、よって前記流束均衡解析モデルの予測能を向上させる、方法。
【図1】
【図2A】
【図2B】
【図3A】
【図3B】
【図4】
【図5】
【図6A】
【図6B】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図11A】
【図11B】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図2A】
【図2B】
【図3A】
【図3B】
【図4】
【図5】
【図6A】
【図6B】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図11A】
【図11B】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【公開番号】特開2012−14731(P2012−14731A)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願番号】特願2011−215869(P2011−215869)
【出願日】平成23年9月30日(2011.9.30)
【分割の表示】特願2007−200694(P2007−200694)の分割
【原出願日】平成14年1月10日(2002.1.10)
【出願人】(500273296)ザ・ペン・ステート・リサーチ・ファンデーション (14)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願日】平成23年9月30日(2011.9.30)
【分割の表示】特願2007−200694(P2007−200694)の分割
【原出願日】平成14年1月10日(2002.1.10)
【出願人】(500273296)ザ・ペン・ステート・リサーチ・ファンデーション (14)
[ Back to top ]