説明

酵母代謝をモデリングするための組成物および方法

【課題】酵母生理機能を決定するためのインシリコモデルを提供する。
【解決手段】複数の酵母反応物を複数の酵母反応と関係づけるデータ構造、複数の酵母反応のための制約セット、および酵母生理機能を予測する反応を介してフラックス分布を決定するためのコマンドを含むモデルで、関連した遺伝子または遺伝子群を特徴づける情報を含む遺伝子データベースをさらに含み、インシリコにおける酵母モデルを作成する。本発明のモデルを使用して酵母生理機能を決定するための方法をさらに提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、国立保健研究所によって授与された助成金NIH RO1HL59234の下に、合衆国政府支援によりなされたものである。合衆国政府は、本発明に一定の権利を有する。
【背景技術】
【0002】
発明の背景
本発明は、一般に化学反応ネットワークにおける活性の解析に関し、より詳細には、酵母の反応ネットワークの活性をシミュレートし、かつ予測するための計算方法に関する。
【0003】
酵母は、最も研究された微生物のうちの1つであり、その有意な産業上の重要性に加えて、真核細胞の研究のためのモデル生物として役立つ(Winzelerら、Science 285: 901-906 (1999)非特許文献1)。ヒト疾患に関係する位置的にクローン化された遺伝子の30%までが、酵母相同体を有する。
【0004】
最初に配列決定された真核生物ゲノムは、酵母のものであり、約6400のオープンリーディングフレーム(または、遺伝子)が、ゲノム中に同定された。酵母は、最初の発現プロファイリング実験の対象であり、多くの異なる変異体および異なる増殖条件についての発現プロフィールの概論が確立されている。さらに、タンパク質-タンパク質相互作用ネットワークが決定されており、多くの酵母タンパク質間の相互作用を研究するために使用されている。
【0005】
酵母は、燃料エタノール、実用エタノール、ビール、ワイン、スピリット、およびパン酵母を生産するために産業的に使用され、多くの医薬品タンパク質(ホルモンおよびワクチン)の生産のための宿主としても使用されている。さらに、酵母は、インスリンを含む多くの種々のバイオプロダクトの細胞工場として現在利用されている。
【0006】
酵母によって作成される産業上重要な産物の収率を改善するために、遺伝子操作、並びに種々の発酵条件の変更が考えられている。しかし、これらのアプローチは、現在、特定のパラメータまたはパラメータの組み合わせにおけるどのような変化が、生物の増殖、所望の産物の産生、もしくは不必要な副生成物の産生などの細胞の挙動に影響を及ぼす可能性が高いのか、明白な理解によって導かれてはいない。酸素または培地成分の供給の増減などの、発酵条件のどのような変化が細胞の挙動に影響を及ぼし、したがって発酵の実施に影響を及ぼすかを予測することができれば、有益であろう。同様に、1つまたは複数の遺伝子の付加または欠失によって生物を操作する前に、これらの変化がどのように細胞の挙動に影響を及ぼすかについて予測することが可能であれば、有用であろう。
【0007】
しかし、酵母ゲノムによってコードされる代謝反応ネットワークが複雑であるために、現在酵母についてこれらの種類の予測を行うことは困難である。培地組成の比較的軽微な変化でさえ、このネットワークの何百もの成分に影響を及ぼす可能性があり、その結果、潜在的に何百もの変数が発酵挙動の予測を行う際に考慮に値する。同様に、ネットワークにおける相互作用の複雑さのために、単一遺伝子の変異でさえ、ネットワークの多くの成分に影響を及ぼし得る。したがって、種々の条件下で酵母の細胞の挙動の多くの種々の側面をシミュレートするために使用することができる、酵母における代謝ネットワークなどの反応ネットワークを記述するモデルの要求が存在する。本発明は、この要求を満たし、その上関連した利点も提供する。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】Winzelerら、Science 285: 901-906 (1999)
【発明の概要】
【0009】
発明の要旨
本発明は、コンピュータ読み取り可能な媒体または媒体類であって、(a)複数の酵母反応物を複数の酵母反応と関係づけるデータ構造であって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含むデータ構造と、(b)複数の酵母反応のための制約セットと、および(c)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定するためのコマンドとを含み、少なくとも1つのフラックス分布は、酵母生理機能を予測することを含む媒体または媒体類を提供する。1つの態様において、データ構造における少なくとも1つの細胞反応は、関連した遺伝子を示すために注釈がついており、コンピュータ読み取り可能な媒体または媒体類は、関連した遺伝子を特徴づける情報を含む遺伝子データベースをさらに含む。もう1つの態様において、データ構造における少なくとも1つの細胞反応は、サブシステム内の機能の割当てまたは細胞内のコンパートメントによる注釈がついている。
【0010】
また、本発明は、酵母の生理機能を予測するための方法であって、(a) 複数の酵母を、複数の酵母反応と関連づけるデータ構造であって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含むデータ構造を提供すること(b)複数の酵母反応のための制約セットを提供すること(c)目的関数を提供すること、および(d)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより酵母生理機能を予測することを含む方法を提供する。1つの態様において、データ構造における少なくとも1つの酵母反応は、関連した遺伝子を示すために注釈がついており、方法は、遺伝子に関連した酵母生理機能を予測する。
【0011】
また、複数の酵母反応物を、複数の酵母反応と関連づけるデータ構造を作製するための方法であって、(a)複数の酵母反応並びに反応の基質および産物である複数の反応物を同定すること(b)データ構造の複数の反応を、複数の反応物に関連づけることであって、反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含むこと(c)複数の酵母反応のための制約セットを決定すること(d)目的関数を提供すること(e)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定すること、および(f)少なくとも1つのフラックス分布が酵母生理機能を予測しない場合は、データ構造に反応を追加するか、またはデータ構造から反応を除去させて、段階(e)を繰り返し、少なくとも1つのフラックス分布が酵母生理機能を予測する場合は、コンピュータ読み取り可能な媒体または媒体類にデータ構造を格納することを含む方法を提供する。本発明は、複数の酵母反応物を複数の反応と関連づけるデータ構造であって、本方法によって産生されるデータ構造をさらに提供する。
【図面の簡単な説明】
【0012】
【図1】仮定的代謝ネットワークの概略図を示す。
【図2】図1に示される仮定的代謝ネットワークの化学量論的マトリックスを示す。
【図3】図1に示される仮定的代謝ネットワークに配置することができる物質平衡制約およびフラックス制約(可逆性制約)を示す。(∞、無限大;Y1、取込み速度値)
【図4】酵母の典型的な代謝反応ネットワークを示す。
【図5】酵母の代謝ネットワークの再構築のための方法を示す。ゲノム注釈、生化学経路データベース、生化学教科書、および最近の刊行物から利用できる情報に基づいて、酵母のゲノム規模代謝ネットワークを設計した。増殖依存的、非増殖依存的なATP要求およびバイオマス組成などの、さらなる生理学的な制約を考慮してモデル化した。
【図6】別々の相に分離された代謝経路利用における有限数の質的に異なったパターンを現している酵母のための表現型位相面(PhPP)ダイアグラムを示す。これらの異なった位相の特徴は、等傾斜の形態で影の価格の比を使用して解釈される。等傾斜は、これらの位相を無益な、単一のおよび二重の基質限界に分類して、最適のラインを定めるために使用することができる。図の上の部分は、三次元酵母位相面ダイアグラムを示す。下の部分は、示した最適(LO)のラインを有する2次元の位相面ダイアグラムを示す。
【図7】境界線上における最適な呼吸商(RQ)対酸素摂取速度(mmole/g-DW/hr)(左上)を示す。表現型位相面(PhPP)は、予測されたRQが1.06の値の定数であることを示す。
【図8】酵母を完全に嫌気性の発酵から好気性の増殖の範囲で変化させた酸素有用性に関連した代謝表現型の位相を示す。グルコース取込み速度は、全ての条件下で固定してあり、生じる最適なバイオマス収率、並びに呼吸商、RQは、4つの代謝副産物:酢酸、コハク酸塩、ピルビン酸、およびエタノールと関係づけたアウトプット・フラックスとともに示す。
【図9】酵母の嫌気性のグルコース限定連続培養を示す。図9は、嫌気性ケモスタット培養において希釈率を変化させたグルコースの利用を示す。0.0の希釈率のデータポイントは、実験結果から推定される。陰影をつけた面積または実行不可能な領域は、増殖需要と同時に釣り合うことができない化学量論的制約のセットを含む。モデルは、最適の解(Model(最適の)によって指示した)のラインにおける所与の増殖速度についての最適のグルコース取込み速度を生じる。さらなる制約を課すことにより、より多くのグルコースが必要である領域(すなわち、他の最適以下の解の領域)の方へ解を追いやる。最適の解において、インシリコにおけるモデルでは、ピルビン酸およびアセテートを分泌しない。モデルおよび実験的ポイントの間の最大の相違は、最も高い希釈率において8%である。実験的レベル(モデル(強制))においてこれらの副生成物を産生することをモデルに強制した場合、グルコース取込み速度は、増大されるおよび実験値により近くなる。図9Bおよび図9Cは、ケモスタット培養における嫌気性の副生成物の分泌速度を示す。(q、分泌速度;D、希釈率)。
【図10】インビボにおける、およびインシリコにおける酵母の好気的なグルコース限定連続培養を示す。図10Aは、エタノール(Eth)、およびグリセロール(Gly)のバイオマス収率(YX)、並びに分泌速度を示す。図10Bは、酵母の好気的なグルコース限定連続培養のCO2分泌速度(qCO2)および呼吸商(RQ;すなわちqCO2/qO2)を示す。(exp、実験的)。
【発明を実施するための形態】
【0013】
発明の詳細な説明
本発明は、酵母 ゲノムの代謝遺伝子と、これらに関連した反応および反応物との間の相互接続を記述する、パン酵母および醸造酵母の酵母のインシリコモデルを提供する。本モデルは、異なる環境的および遺伝的条件下で、酵母の細胞の挙動の種々の側面をシミュレートするために使用することができ、これにより、産業および研究に適用するための有益な情報が提供される。本発明のモデルの利点は、これが、酵母の代謝活性をシミュレートおよび予測するための全体的なアプローチを提供することである。
【0014】
例えば、特定の産業に重要な酵素の収率を最大にするためなどの、発酵の実施に最適な条件を決定するために、酵母代謝モデルを使用することができる。また、本モデルは、酵母が1つの遺伝子または複数の遺伝子の活性における機能の差異として示すことができる細胞の挙動の範囲を算出するために使用することができる。したがって、本モデルは、所望の適用のために生物体を遺伝的に組み立てるために使用することができる。細胞の挙動を特定のパラメータが変化された結果とみなす予測を作製するためのこの能力は、酵母株の産業における開発の速度および効率、並びにこれらを使用する条件を増大する。
【0015】
また、酵母代謝モデルは、ゲノム中に見出される酵素をコードする遺伝子に対する特定の生化学反応の割当てを予測または確認するために、および現在のゲノム・データによっては示されない反応または経路の存在を同定するために使用することができる。したがって、研究および発見のプロセスを組立てて、潜在的に、新たな酵素、医薬、または商業的に重要な代謝産物を同定するために、本モデルを使用することができる。
【0016】
本発明のモデルは、複数の酵母反応物を複数の酵母反応と関連づけるデータ構造であって、反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含むデータ構造に基づく。
【0017】
本明細書に使用されるものとして、用語「酵母反応」は、酵母の生存株において、もしくは酵母の生存株によって生じる基質を消費するか、または産物を形成する変換を意味することが企図される。本用語は、酵母ゲノムによって遺伝的にコードされる1つまたは複数の酵素の活性によって生じる変換を含むことができる。また、本用語は、酵母細胞において自発的に起こる変換を含むことができる。本用語に含まれる変換は、たとえば、求核付加もしくは求電子付加、求核置換もしくは求電子置換、除去、異性化、脱アミノ、リン酸化、メチル化、解糖、還元、酸化反応、または反応物が同一のコンパートメント内で、もしくは一つの細胞のコンパートメントからもう一つへ移動する輸送反応によって、生じるものなどの位置の変化を含む。輸送反応の場合、反応の基質および産物は、化学的に同じことであることができ、基質および産物は、特定の細胞のコンパートメントにおける位置によって区別することができる。したがって、第一のコンパートメントから第二のコンパートメントまで化学的に変化しない反応物を輸送する反応は、その基質として第一のコンパートメントに反応物を有し、およびその産物として第二のコンパートメントに反応物を有する。インシリコモデルまたはデータ構造に関して使用される場合、反応は、基質を消費するかまたは産物を産生する化学転換を表すことを企図することが理解されるであろう。
【0018】
本明細書において使用されるものとして、用語「酵母反応物」は、酵母の生存株において、もしくは酵母の生存株によって起こる反応の基質または産物である化学物質を意味することが企図される。本用語は、酵母遺伝子(群)によってコードされる1つまたは複数の酵素によって行われる反応の基質または産物、1つまたは複数の非遺伝的にコードされる巨大分子、タンパク質、もしくは酵素によって行われる酵母において起こる反応、または酵母細胞において自発的に起こる反応を含み得る。代謝物は、本用語の意味の範囲内の反応物であることが理解される。インシリコモデルまたはデータ構造に関して使用される場合、反応物は、酵母の生存株において、もしくは酵母の生存株によって起こる反応の基質または産物である化学物質を表すことが理解されるであろう。
【0019】
本明細書で使用されるものとして、用語「基質」は、反応により1つまたは複数の産物に転換され得る反応物を意味することが企図される。本用語は、たとえば、求核付加もしくは求電子付加、求核置換もしくは求電子置換、除去、異性化、脱アミノ、リン酸化、メチル化、還元、酸化反応、または膜を超えて移動されるか、もしくは異なるコンパートメントへ移動されるなどの位置の変化を含み得る。
【0020】
本明細書で使用されるものとして、用語「産物」は、1つまたは複数の基質との反応によって生じる反応物を意味することが企図される。たとえば、本用語は、求核付加もしくは求電子付加、求核置換もしくは求電子置換、除去、異性化、脱アミノ、リン酸化、メチル化、還元、酸化反応、または膜を超えて移動されるか、もしくは異なるコンパートメントへ移動されるなどの位置の変化を含み得る。
【0021】
本明細書で使用されるものとして、用語「化学量論係数」は、化学反応における1つまたは複数の反応物および1つまたは複数の産物の量を関係づける数値的定数を意味することが企図される。典型的には、これらが、基本的にバランスのとれた、対応する変換を記述する化学方程式のそれぞれの反応物の分子数を意味するので、数は整数である。しかし、場合によっては、たとえば、ひとかたまりの反応において使用される場合、または実験的データを反映するために、数は非整数値をとることができる。
【0022】
本明細書に使用されるものとして、用語「複数」は、酵母反応または反応物に関して使用される場合、少なくとも2つの反応または反応物を意味することが企図される。本用語は、特定の酵母株について、2〜天然に存在する反応物または反応の数、の範囲のいかなる数の酵母反応または反応物も含み得る。したがって、本用語は、たとえば、少なくとも10、20、30、50、100、150、200、300、400、500、600、またはそれ以上の反応または反応物を含み得る。反応または反応物の数は、特定の酵母株において生じる天然に存在する反応の総数の少なくとも20%、30%、50%、60%、75%、90%、95%、または98%などの特定の酵母株において天然に存在する反応の総数の一部として表すことができる。
【0023】
本明細書に使用されるものとして、用語「データ構造」は、特異的なデータ操作機能を支援するように設計されているデータ・エレメント間の物理的関係または論理的関係を意味することが企図される。本用語は、たとえば、反応物をマトリックスもしくはネットワークに関連づけることができる反応を表すリストなどの、付加する、組み合わせる、またはさもなければ操作することができるデータ・エレメントのリストを含むことができる。また、本用語は、反応に反応物を相関させるマトリックスなどの、2つ以上の情報のリストからデータ・エレメントを相関させるマトリックスを含み得る。本用語に含まれる情報は、たとえば、化学反応の基質もしくは産物、1つもしくは複数の基質を1つもしくは複数の産物に関連する化学反応、反応に配置された制約、または化学量論係数を表し得る。
【0024】
本明細書で使用されるものとして、用語「制約」は、反応のための上または下の境界を意味することを企図する。境界は、反応を介した質量、電子、もしくはエネルギーの最小または最大のフローを特定することができる。境界は、さらに反応の方向性を特定することができる。境界は、ゼロ、無限大、または整数および非整数などの数的な値のような一定値であることができる。
【0025】
本明細書で使用されるものとして、用語「活性」は、反応に関して使用される場合、産物が産生され、または基質が消費される割合を意味することが企図される。また、産物が産生され、または基質が消費される割合は、反応のフラックスということもできる。
【0026】
本明細書に使用されるものとして、用語「活性」は、酵母に関して使用される場合、酵母における初期状態から酵母における最終状態への変化の割合を意味することが企図される。本用語は、化学物質が酵母によって消費または産生される割合、酵母の増殖の割合、または特定の反応のサブセットを介したエネルギーまたはマスフローの割合を含み得る。
【0027】
本発明は、複数の酵母反応物を複数の酵母反応と関連づけるデータ構造を有するコンピュータ読み取り可能な媒体であって、反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含む媒体を提供する。
【0028】
複数の酵母反応は、末梢の代謝経路の反応を含むことができる。本明細書に使用されるものとして、用語「末梢」は、代謝経路に関して使用される場合、中枢代謝経路の一部ではない1つまたは複数の反応を含む代謝経路を意味することが企図される。本明細書に使用されるものとして、用語「中枢」は、代謝経路に関して使用される場合、解糖、ペントースリン酸経路(PPP)、トリカルボン酸(TCA)サイクルおよび電子伝達系(ETS)、関連したアナプレロティック反応、並びにピルビン酸代謝から選択される代謝経路を意味することが企図される。
【0029】
複数の酵母反応物は、それぞれの反応物について、これが消費され、または産生される反応を表す任意のデータ構造における複数の酵母反応に関係づけることができる。したがって、本明細書において「反応ネットワーク・データ構造」と呼ばれるデータ構造は、生物学的な反応ネットワークまたは系を表すものとして機能する。本発明の反応ネットワーク・データ構造において表すことができる反応ネットワークの例は、酵母の代謝反応を構成する反応の収集である。
【0030】
本発明の方法およびモデルは、たとえば、CEN.PK113.7D株または任意の実験室株または産生株を含む、酵母のいかなる株にも適用することができる。酵母株は、当該技術分野において既知の分類基準に従って同定することができる。分類基準は、たとえば伝統的な分類学の分類に基づいたものなどの古典的微生物学的性質、または、たとえばリボソーム配列などの生物のゲノム内からの配列を比較することによって決定される進化の距離を含む。
【0031】
本発明の反応ネットワーク・データ構造に使用される反応物は、化合物データベースから得ることができ、または化合物データベースに貯蔵することができる。本明細書に使用されるものとして、用語「化合物データベース」は、生物学的な反応の基質および産物を含む複数の分子を含むコンピュータ読み取り可能な媒体または媒体類を意味することが企図される。複数の分子は、多くの生物において見出される分子を含むことができ、これにより、一般的な化合物データベースを構成する。または、複数の分子は、特定の生物において生じるものに限定することができ、これにより、生物特異的な化合物データベースを構成する。化合物データベースのそれぞれの反応物は、それが存在する化学種および細胞のコンパートメントに従って同定することができる。したがって、たとえば、細胞外コンパートメントのグルコースとサイトゾルのグルコースとの間を区別することができる。その上、それぞれの反応物は、一次または二次代謝経路の代謝産物として特定することができる。一次または二次代謝経路の代謝産物としての反応物の同定は、反応における反応物間でいかなる化学的差異も示さないが、このような明示は、大規模な反応ネットワークの視覚的な表現を助け得る。
【0032】
本明細書に使用されるものとして、用語「コンパートメント」は、反応物が第2の領域の少なくとも1つのその他の反応物から分離されるように、少なくとも1つの反応物を含む、細区画された領域を意味することが企図される。本用語に含まれる細区画された領域は、細胞の細区画された領域と相関させることができる。したがって、本用語に含まれる細区画された領域は、たとえば、細胞の細胞内の空間;細胞のまわりの細胞外空間;周辺質空間;ミトコンドリア、小胞体、ゴルジ装置、液胞もしくは核などのオルガネラ内の空間;または膜もしくはその他の物理的障害によってもう一つから分離されたあらゆる細胞下空間を含む。また、物理的な障壁と相関していない反応ネットワークの仮想境界を作成するために、細区画された領域を作成することができる。仮想境界は、ネットワークの反応を異なるコンパートメントまたは下部構造に分割するために作成することができる。
【0033】
本明細書において使用されるものとして、用語「下部構造」は、情報の一部を別々に操作すること、または解析することができるように、データ構造のその他の情報から分離されたデータ構造の情報の一部を意味することが企図される。本用語は、たとえば、内部フラックス経路、交換フラックス経路、中枢代謝経路、末梢代謝経路、または二次代謝経路などの特定の代謝経路に関連する情報を含む生物学的な機能に従って細区画された部分を含むことができる。本用語は、特定のタイプのデータ構造を解析または操作することができる計算的または数学的原理に従って細区画される部分を含むことができる。
【0034】
反応ネットワーク・データ構造に含まれる反応は、酵母の複数の代謝反応の基質、産物、および化学量論を含む代謝反応データベースから得ることができる。反応ネットワーク・データ構造の反応物は、特定の反応の基質または産物のいずれかとして指定して、それぞれに化学量論係数をこれらに割り当て、反応中で生じる化学転換を記載することができる。また、それぞれの反応は、可逆的または不可逆的方向で生じるものとして記載される。可逆反応は、正方向および逆方向の両方で作動する1つの反応とするか、または一方が正反応に対応し、他方が逆反応に対応する2つの不可逆反応に分解するか、いずれかで表すこともできる。
【0035】
反応ネットワーク・データ構造に含まれる反応は、内部系反応または交換反応を含むことができる。内部系反応は、化学種および伝達プロセスの化学的および電気的にバランスのとれた相互変換であり、これは、ある代謝産物の相対的な量を補給または排出するのに役立つ。これらの内部系反応は、トランスフォーメーションまたは転位として分類することができる。トランスフォーメーションは、基質および産物として化合物の異なったセットを含む反応であり、一方、転位は、異なったコンパートメントに位置する反応物を含む。したがって、単に細胞外環境からサイトゾルまで代謝産物を輸送する反応は、その化学組成を変えず、単に転位として分類されるだけであるが、細胞外のグルコースを取り込んで、これをサイトゾルのグルコース-6-リン酸に変換するホスホトランスフェラーゼシステム(PTS)などの反応は、転位およびトランスフォーメーションである。
【0036】
交換反応は、供与源および受け手を構成するものであり、コンパートメントへの、およびコンパートメントからの、または仮定上の系の境界を越えて、代謝産物の通過を可能にする。これらの反応は、シミュレーション目的のためのモデルに含まれており、酵母に配置される代謝需要を表す。これらは、ある場合には化学的にバランスがとれているであろうが、典型的には、これらはバランスが悪く、しばしば単一の基質または産物のみしか有さないこともある。規約の問題として、交換反応は、さらに需要交換および入力/出力交換反応に分類される。
【0037】
酵母代謝反応ネットワークに配置される代謝需要は、発行された文献において利用できる細胞の乾燥重量組成物から容易に決定することができ、または実験的に決定することができる。酵母の取込み速度および維持要求は、基質の枯渇を測定することによって取込み速度を決定する生理学的な実験によって決定することができる。また、単位バイオマスあたりの取込み速度を決定するために、それぞれの時点のバイオマスの測定を行うことができる。維持要求は、ケモスタット実験から決定することができる。グルコース取込み速度を増殖速度に対しプロットして、y切片を増殖に関連しない維持要求と解釈することもできる。増殖に関連した維持要求は、増殖速度対グルコース取込み速度のプロットの実験的に決定された点に、モデル結果をあてはめることによって決定することができる。
【0038】
入力/出力交換反応は、細胞外の反応物が本発明のモデルによって表される反応ネットワークに入ること、または出ることができるように使用される。それぞれの細胞外代謝産物について、対応する入力/出力交換反応を作成することもできる。これらの反応は、反応によって産生される1つの産物および産物なしの化学量論係数を有する基質として示される代謝産物により、非可逆的または可逆的のいずれかであり得る。この特定の規約は、代謝産物が産生されるか、または反応ネットワークから除去された場合に、反応が正のフラックス値(活性レベル)を取り、代謝産物が消費されるか、または反応ネットワークに導入された場合に、負のフラックス値を取ることができるように用いられる。これらの反応は、どの代謝産物が細胞に利用でき、およびどれが細胞によって排泄され得るかを正確に特定するためのシミュレーションの過程でさらに制約されるであろう。
【0039】
需要交換反応は、常に少なくとも1つの基質を含む不可逆的反応として特定される。これらの反応は、典型的には公式化されて、たとえば代謝ネットワークによる細胞内代謝産物の産生、または増殖とも称されるバイオマス形成を引き起こす反応の表現におけるものなどの、バランスのとれた比の多くの反応物の集積産物を表す。実施例に記載したとおり、増殖のために産生されるバイオマス成分は、L-アラニン、L-アルギニン、L-アスパラギン、L-アスパラギン酸、L-システイン、L-グルタミン、L-グルタミン酸、グリシン、L-ヒスチジン、L-イソロイシン、L-ロイシン、L-リジン、L-メチオニン、L-フェニルアラニン、L-プロリン、L-セリン、L-スレオニン、L-トリプトファン、L-チロシン、L-バリン、AMP、GMP、CMP、UMP、dAMP、dCMP、dTMP、dGMP、グリコーゲン、α、α-トレハロース、マンナン、β-D-グルカン、トリアシルグリセロール、エルゴステロール、チモステロール、ホスファチジン酸、ホスファチジルコリン、ホスファチジルエタノールアミン、ホスファチジル-D-ミオ-イノシトール、ホスファチジルセリン、ATP、硫酸、ADP、およびオルトリン酸を含み、表1に示した例示的値を有する。
【0040】
(表1)酵母の細胞成分(mmol/gDW)

【0041】
需要交換反応は、本発明のモデルにおけるどのような代謝産物に対しても導入され得る。最も一般的には、これらの反応には、アミノ酸、ヌクレオチド、ホスホリピド、およびその他のバイオマス成分などの、新たな細胞を作成することを目的とする細胞によって産生されることが必要とされる代謝産物、または別の目的のために産生される代謝産物が導入される。これらの代謝産物が一旦同定されると、不可逆的であり、かつ単一の化学量論係数を有する基質として代謝産物を特定する需要交換反応を作成することができる。これらの規格により、反応がアクティブである場合、潜在的産生需要を満たしている系により、代謝産物のネット産生が引き起こされる。反応ネットワーク・データ構造において需要交換反応として表現され、かつ本発明の方法によって解析することができるプロセスの例は、たとえば、個々のタンパク質の産生もしくは分泌;アミノ酸、ビタミン、ヌクレオシド、抗生物質、もしくは界面活性剤などの個々の代謝産物の産生もしくは分泌;移動などの外部のエネルギーを必要とするのプロセスのためのATP産生;またはバイオマス成分の形成を含む。
【0042】
個々の代謝産物に配置されるこれらの需要交換反応に加えて、定義された化学量論比で多くの代謝産物を利用する需要交換反応を導入することもできる。これらの反応は、集積された需要交換反応と称する。集積された需要反応の例は、たとえば、特定の細胞増殖速度において同時に多くのバイオマス成分の形成をシミュレートすることによって、同時的な増殖需要、または細胞に配置された細胞増殖に関連する産生要求をシミュレートするために使用される反応であろう。
【0043】
上述の反応およびこれらの相互作用を例示するために、図1に仮定的反応ネットワークを提供してある。後述するように、反応は、図2に示される典型的なデータ構造で表すことができる。図1に示した反応ネットワークは、反応物BおよびGに作用する可逆反応R2、並びに1つのBの相当物を2つのFの相当物に転換する反応R3などの陰影をつけた卵円で示したコンパートメント内で、完全に起こる内部系(intrasystem)反応を含む。図1に示される反応ネットワークは、また、入力/出力交換反応AxtおよびExtなどの交換反応、並びに需要交換反応、V増殖(growth)を含み、これは1つのDの相当物および1つのFの相当物に応答した増殖を表す。その他の内部系反応は、反応物Aをコンパートメントへ転位させ、これを反応物Gに変換する転位およびトランスフォーメーション反応であるR1、並びに反応物Eをコンパートメント外に転位させる輸送反応である反応R6を含む。
【0044】
反応ネットワークは、Sがm×nマトリックスであり、mが反応物または代謝産物の数に対応し、nがネットワークにおいて生じる反応の数に対応する、化学量論的マトリックスSとして示すことができる一組の線形代数方程式として表すことができる。図1の反応ネットワークを表す化学量論的マトリックスの例を図2に示してある。図2に示すように、マトリックスのそれぞれのカラムは、特定の反応nに対応し、それぞれの列は、特定の反応物mに対応し、およびそれぞれのSmnエレメントは、示されたnの反応における反応物mの化学量論係数に対応する。化学量論的マトリックスには、反応物が反応の基質または産物であるかどうかを示すサインを有する化学量論係数に従ってそれぞれの反応に参加する反応物に関連づけられている、R2およびR3などの内部系反応、並びに反応によって消費または産生される反応物の相当物の数と相関した値を含む。-Extおよび-Axtなどの交換反応は、同様に化学量論係数に相関する。反応物Eによって例示されるように、同じ化合物を内部反応物(E)および外部反応物(E外側(external))として別々に処理することができ、その結果、化合物を搬出する交換反応(R6)は、それぞれ-1および1の化学量論係数に相関される。しかし、化合物は、そのコンパートメントの位置によって別々の反応物として処理されるので、R5などの、内部反応物(E)を産生するが、外部反応物(E外側)に作用しない反応は、それぞれ1および0の化学量論係数によって関係づけられる。また、V増殖などの需要反応を、適切な化学量論係数によって基質と関係づけられた化学量論的マトリックスに含めることができる。
【0045】
下記にさらに詳細に記載したように、化学量論的マトリックスは、これが、たとえば線形プログラミングまたは一般的な凸解析を使用することによってネットワーク特性を容易に操作および計算することができるので、反応ネットワークを表すため、および解析するための便利な形式を提供する。反応ネットワーク・データ構造は、化学量論的マトリックスについて上に例示した方法で、および以下に例示したものなどの方法を使用して、1つまたは複数の反応の活性を決定するために操作することができる方法で、反応物および反応を関連づけることができる限り種々の形式をとることができる。本発明に有効な反応ネットワーク・データ構造のその他の例は、連結グラフ、化学反応のリスト、または反応方程式の表を含む。
【0046】
反応ネットワーク・データ構造は、酵母代謝またはそのいずれかの部分に含まれる全ての反応を含むように構築することができる。本発明の反応ネットワーク・データ構造に含むことができる酵母代謝反応の部分は、たとえば、解糖、TCAサイクル、PPP、もしくはETSなどの中枢代謝経路;またはアミノ酸生合成、アミノ酸分解、プリン生合成、ピリミジン生合成、脂質生合成、脂肪酸代謝、ビタミンもしくは補助因子生合成、輸送プロセス、およびその他の炭素源異化などの末梢代謝経路を含み得る。末梢経路内の個々の経路の例を表2に記載してあり、たとえば、キノン生合成、リボフラビン生合成、葉酸塩生合成、補酵素A生合成、NAD生合成、ビオチン生合成、およびサイアミン生合成のための補助因子生合成経路を含む。
【0047】
特定の適用に依存して、反応ネットワーク・データ構造は、表2に一覧を示す反応のいずれかまたは全てを含む複数の酵母反応を含み得る。含まれ得る典型的なな反応は、所望の酵母特異的な増殖速度または活性を達成するために必要とされるものとして同定されたものを含み、たとえば、表2において

として同定される反応を含み得る。含まれ得るその他の反応は、文献またはゲノム注釈に記載されていないものであるが、たとえば、MET6_2、MNADC、MNADD1、MNADE、MNADF_1、MNADPHPS、MNADG1、MNADG2、MNADH、MNPT1として同定される反応を含む本発明の酵母モデルを繰り返して開発する経過において同定することができる。
【0048】
(表2)























【0049】
表2の反応の反応物を同定するために使用される頭字語の標準的な化学名は、表3において提供される。
【0050】
(表3)
略語 代謝産物
13GLUCAN 1,3-β-D-グルカン
13PDG 3-ホスホ-D-グリセロイルホスファート
23DAACP 2,3-デヒドロアシル-[アシル-キャリア-タンパク質]
23PDG 2,3-ビスホスホ-D-グリセラート
2HDACP ヘキサデセノイル-[acp]
2MANPD (α-D-マンノシル)(,2)-β-D-マンノシル-ジアセチルキトバイオシルジホスホドリコール(diacetylchitobiosyldiphosphodolichol)
2N6H 2-ノナプレニル-6-ヒドロキシフェノール
2NMHMB 3-デメチルユビキノン-9
2NMHMBm 3-デメチルユビキノン-9M
2NPMBm 2-ノナプレニル-6-メトキシ-1,4-ベンゾキノンM
2NPMMBm 2-ノナプレニル-3-メチル-6-メトキシ-1,4-ベンゾキノンM
2NPMP 2-ノナプレニル-6-メトキシフェノール
2NPMPm 2-ノナプレニル-6-メトキシフェノールM
2NPPP 2-ノナプレニルフェノール
2PG 2-ホスホ-D-グリセラート
3DDAH7P 2-デヒドロ-3-デオキシ-D-アラビノ-ヘプトナート7-ホスファート
3HPACP (3R)-3-ヒドロキシパルミトイル-[アシル-キャリア-タンパク質]
3PG 3-ホスホ-D-グリセラート
3PSER 3-ホスホセリン
3PSME 5-O-(1-カルボキシビニル)-3-ホスホシキミ酸
4HBZ 4-ヒドロキシベンゾアート
4HLT 4-ヒドロキシ-L-スレオニン
4HPP 3-(4-ヒドロキシフェニル)ピルビン酸
4PPNCYS (R)-4'-ホスホパントテン酸-L‐システイン
4PPNTE パンテチン4'-ホスファート
4PPNTEm パンテチン4'-ホスファートM
4PPNTO D-4'-ホスホパントテン酸
5MTA 5'-メチルチオアデノシン
6DGLC D-Galα1->6D-グルコース
A6RP 5-アミノ-6-リビチルアミノ-2,4(1H,3H)-ピリミジンジオン
A6RP5P 5-アミノ-6-(5'-ホスホリボシルアミノ)ウラシル
A6RP5P2 5-アミノ-6-(5'-ホスホリビチルアミノ)ウラシル
AACCOA アセトアセチル-CoA
AACP アシル-[アシル-キャリア-タンパク質]
AATRE6P α,α'-トレハロース6-リン酸
ABUTm 2-アセト-2-ヒドロキシ酪酸M
AC アセテート
ACACP アシル-[アシル-キャリアータンパク質]
ACACPm アシル-[アシル-キャリアータンパク質]M
ACAL アセトアルデヒド
ACALm アセトアルデヒドM
ACAR O-アセチルカルニチン
ACARm O-アセチルカルニチンM
ACCOA アセチル-CoA
ACCOAm アセチル-CoAM
ACLAC 2-アセトラクテート
ACLACm 2-アセトラクテートM
Acm アセテートM
ACNL 3-インドールアセトニトリル
ACOA アシル-CoA
ACP アシル-キャリアータンパク質
ACPm アシル-キャリアータンパク質M
ACTAC アセトアセテート
ACTACm アセトアセテートM
ACYBUT γ-アミノ-γ-シアノブタノアート
AD アデニン
ADCHOR 4-アミノ-4-デオキシコリスミ酸(chorismate)
Adm アデニンM
ADN アデノシン
ADNm アデノシンM
ADP ADP
ADPm ADPM
ADPRIB ADPリボース
ADPRIBm ADPリボースM
AGL3P アシル-sn-グリセロール3-ホスファート
AHHMD 2-アミノ-7,8-ジヒドロ-4-ヒドロキシ-6-(ジホスホオキシメチル)プテリジン
AHHMP 2-アミノ-4-ヒドロキシ-6-ヒドロキシメチル-7,8-ジヒドロプテリジン
AHM 4-アミノ-5-ヒドロキシメチル-2-メチルピリミジン
AHMP 4-アミノ-2-メチル-5-ホスホメチルピリミジン
AHMPP 2-メチル-4-アミノ-5-ヒドロキシメチルピリミジンジホスファート(diphosphate)
AHTD 2-アミノ-4-ヒドロキシ-6-(エリスロ-1,2,3-トリヒドロキシプロピル)-ジヒドロプテリジントリホスファート(triphosphate)
AICAR 1-(5'-ホスホリボシル)-5-アミノ-4-イミダゾールカルボキサミド
AIR アミノイミダゾールリボタイド
AKA 2-オキソアジピン酸
AKAm 2-オキソアジピン酸M
AKG 2-オキソグルタラート
AKGm 2-オキソグルタラートM
AKP 2-デヒドロパントアート
AKPm 2-デヒドロパントアートM
ALA L-アラニン
ALAGLY R-S-アラニルグリシン
ALAm L-アラニンM
ALAV 5-アミノレブリン酸
ALAVm 5-アミノレブリン酸M
ALTRNA L-アルギニル-tRNA(Arg)
AM6SA 2-アミノムコナート6-セミアルデヒド
AMA L-2-アミノアジピン酸
AMASA L-2-アミノアジピン酸6-セミアルデヒド
AMG メチル-D-グルコシド
AMP AMP
AMPm AMPM
AMUCO 2-アミノムコナート
AN アンスラニレート(anthranilate)
AONA 8-アミノ-7-オキソノナノアート
APEP Nα-アセチルペプチド
APROA 3-アミノプロパナール
APROP α-アミノプロピオノニトリル
APRUT N-アセチルプトレシン
APS アデニリル硫酸
ARAB D-アラビノース
ARABLAC D-アラビノン-1,4-ラクトン
ARG L-アルギニン
ARGSUCC N-(L-アルギノ)サクシネート
ASER O-アセチル-L-セリン
ASN L-アスパラギン
ASP L-アスパルテート
ASPERMD N1-アセチルスペルミジン
ASPm L-アスパルテートM
ASPRM N1-アセチルスペルミン
ASPSA L-アスパルテート4-セミアルデヒド
ASPTRNA L-アスパラギニル-tRNA(Asn)
ASPTRNAm L-アスパラギニル-tRNA(Asn)M
ASUC N6-(1,2-ジカルボキシエチル)-AMP
AT3P2 アシルジヒドロキシアセトンホスファート
ATN アラントイン
ATP ATP
ATPm ATPM
ATRNA tRNA(Arg)
ATRP P1,P4-ビス(5'-アデノシル)テトラホスファート
ATT アラントアート
bALA β-アラニン
BASP 4-ホスホ-L-アスパルテート
bDG6P β-D-グルコース6-ホスファート
bDGLC β-D-グルコース
BIO ビオチン
BT ビオチン
C100ACP デカノイル-[acp]
C120ACP ドデカノイル-[アシル-キャリアータンパク質]
C120ACPm ドデカノイル-[アシル-キャリアータンパク質]M
C140 ミリスチン酸
C140ACP ミリストイル-[アシル-キャリアータンパク質]
C140ACPm ミリストイル-[アシル-キャリアータンパク質]M
C141ACP テトラデカノイル-[アシル-キャリアータンパク質]
C141ACPm テトラデカノイル-[アシル-キャリアータンパク質]M
C160 パルミタート
C160ACP ヘキサデカノイル-[acp]
C160ACPm ヘキサデカノイル-[acp]M
C161 1-ヘキサデセン
C161ACP パルミトイル-[アシル-キャリアータンパク質]
C161ACPm パルミトイル-[アシル-キャリアータンパク質]M
C16A C16_アルデヒド
C180 ステアレート
C180ACP ステアリン酸-[アシル-キャリアータンパク質]
C180ACPm ステアリン酸-[アシル-キャリアータンパク質]M
C181 1-オクタデセン
C181ACP オレオイル-[アシル-キャリアータンパク質]
C181ACPm オレオイル-[アシル-キャリアータンパク質]M
C182ACP リノレン酸-[アシル-キャリアータンパク質]
C182ACPm リノレン酸-[アシル-キャリアータンパク質]M
CAASP N-カルバモイル-L-アスパルテート
CAIR 1-(5-ホスホ-D-リボシル)-5アミノ-4-イミダゾールカルボキシレート
CALH 2-(3-カルボキシ-3-アミノプロピル)-L-ヒスチジン
cAMP 3',5'-環状AMP
CAP カルバモイルホスファート
CAR カミチン(Camitine)
CARm カミチン(Camitine)M
CBHCAP 3-リンゴ酸イソプロピル
CBHCAPm 3-リンゴ酸イソプロピルM
cCMP 3',5'-環状CMP
cdAMP 3',5'-環状 dAMP
CDP CDP
CDPCHO CDPコリン
CDPDG CDPジアシルグリセロール
CDPDGm CDPジアシルグリセロールM
CDPETN CDPエタノールアミン
CLR2 セラミド-2
CER3 セラミド-3
CGLY Cys-Gly
cGMP 3',5'-環状GMP
CHCOA 6-カルボキシヘキサノイル-CoA
CHIT キチン
CHITO キトサン
CHO コリン
CHOR コリスミ酸
cIMP 3',5'-環状 IMP
CIT クエン酸塩
CITm クエン酸塩M
CITR L-シトルリン
CLm カルジオリピンM
CMP CMP
CMPm CMPM
CMUSA 2-アミノ-3-カルボキシムコン酸セミアルデヒド
CO2 CO2
CO2m CO2M
COA CoA
COAm CoAM
CPAD5P 1-(2-カルボキシフェニルアミノ)-1-デオキシ-D-リブロース5-ホスファート
CPP コプロポルフィリノーゲン(Coproporphyrinogen)
CTP CTP
CTPm CTPM
CYS L-システイン
CYTD シチジン
CYTS シトシン
D45PI 1-ホスファチジル-D-ミオ-イノシトール4,5-ビスホスファート
D6PGC 6-ホスホ-D-グルコナート
D6PGL D-グルコノ-1,5-ラクトン6-ホスファート
D6RP5P 2,5-ジアミノ-6-ヒドロキシ-4-(5'-ホスホリボシルアミノ)-ピリミジン
D8RL 6,7-ジメチル-8-(1-D-リビチル)ルマジン(lumazine)
DA デオキシアデノシン
DADP dADP
DAGLY ジアシルグリセロール
DAMP dAMP
dAMP dAMP
DANNA 7,8-ジアミノノナノアート
DAPRP 1,3-ジアミノプロパン
DATP dATP
DB4P L-3,4-ジヒドロキシ-2-ブタノン4-ホスファート
DC デオキシシチジン
DCDP dCDP
DCMP dCMP
DCTP dCTP
DFUC α-D-フコシド
DG デオキシグアノシン
DGDP dGDP
DGMP dGMP
DGPP ジアシルグリセロールピロホスファート
DGTP dGTP
DHF ジヒドロ葉酸
DHFm ジヒドロ葉酸M
DHMVAm (R)-2,3-ジヒドロキシ-3-メチルブタノアートM
DHP 2-アミノ-4-ヒドロキシ-6-(D-エリスロ-1,2,3-トリヒドロキシプロピル)-7,8-ジヒドロプテリジン
DHPP ジヒドロネオプテリンホスファート
DHPT ジヒドロプテロアート
DHSK 3-デヒドロシキミ酸
DHSP スフィンガニン1-ホスファート
DHSPH 3-デヒドロスフィンガニン
DHVALm (R)-3-ヒドロキシ-3-メチル-2-オキソブタノアートM
DIMGP D-エリスロ-1-(イミダゾール-4-yl)グリセロール3-ホスファート
DIN デオキシイノシン
DIPEP ジペプチド
DISAC1P 2,3-ビス(3-ヒドロキシテトラデカノイル)-D-グルコサミニル-1,6-β-D-2,3-ビス(3-ヒドロキシテトラデカノイル)-β-D-グルコサミニル1-リン酸
DLIPOm ジヒドロリポアミドM
DMPP ジメチルアリルジホスファート
DMZYMST 4,4-ジメチルチモステロール
DOL ドリコール
DOLMANP ドリシル(Dolichyl)β-D-マンノシルホスファート
DOLP ドリシル(Dolichyl)ホスファート
DOLPP デヒドロドリシル(Dolichyl)ジホスファート
DOROA (S)-ジヒドロオロット酸
DPCOA デホスホ-CoA
DPCOAm デホスホ-CoAM
DPTH 2-[3-カルボキシ-3-(メチルammonio)プロピル]-L-ヒスチジン
DQT 3-デヒドロキナート
DR1P デオキシ-リボース1-リン酸
DR5P 2-デオキシ-D-リボース5-リン酸
DRIB デオキシリボース
DSAM S-アデノシルメチオニンアミン
DT チミジン
DTB デチオビオチン
DTBm デチオビオチンM
DTDP dTDP
DTMP dTMP
DTP 1-デオキシ-d-スレオ-2-ペンツロース
DTTP dTTP
DU デオキシウリジン
DUDP dUDP
DUMP dUMP
DUTP dUTP
E4P D-エリスロース4-リン酸
EPM エピメリビオース
EPST エピステロール
ER4P 4-ホスホ-D-エリスロナート
ERGOST エルゴステロール
ERTEOL エルゴスタ-5,7,22,24(28)-テトラエノール
ERTROL エルゴスタ-5,7,24(28)-トリエノール
ETH エタノール
ETHm エタノールM
ETHM エタノールアミン
F1P D-フルクトース1-リン酸
F26P D-フルクトース2,6-ビスリン酸
F6P β-D-フルクトース6-リン酸
FAD FAD
FADH2m FADH2M
FADm FADM
FALD ホルムアルデヒド
FDP β-D-フルクトース1,6-ビスリン酸
FERIm フェリチトクロムcM
FEROm フェリチトクロムcM
FEST フェコステロール(Fecosterol)
FGAM 2-(ホルムアミド)-N1-(5'-ホスホリボシル)アセトアミジン
FGAR 5'-ホスホリボシル-N-ホルミルグリシンアミド
FGT S-ホルミルグルタチオン
FKYN L-ホルミルキヌレニン
FMN FMN
FMNm FMNM
FMRNAm N-ホルミルメチオニル-tRNAM
FOR ホルメート(Formate)
FORm ホルメート(Formate)M
FPP trans, trans-ファルネシル二リン酸
FRU D-フルクトース
FTHF 10-ホルミルテトラヒドロ葉酸
FTHFm 10-ホルミルテトラヒドロ葉酸M
FUACAC 4-ホルミルアセトアセテート
FUC β-D-フコース
FUM フマラート
FUMm フマラートM
G1P D-グルコース1-リン酸
G6P α-D-グルコース6-リン酸
GA1P D-グルコサミン1-リン酸
GA6P D-グルコサミン6-リン酸
GABA 4-アミノブタノアート
GABAL 4-アミノブチルアルデヒド
GABALm 4-アミノブチルアルデヒドM
GABAm 4-アミノブタノアートM
GAL1P D-ガラクトース1-リン酸
GAR 5'-ホスホリボシルグリシンアミド
GBAD 4-グアニジノ-ブタノアート
GBAT 4-グアニジノ-ブタノアート
GC γ-L-グルタミル-L-システイン
GDP GDP
GDPm GDPM
GDPMAN GDPマンノース
GGL ガラクトシルグリセロール
GL グリセロール
GL3P sn-グリセロール3-リン酸
GL3Pm sn-グリセロール3-リン酸M
GLAC D-ガラクトース
GLACL 1-α-D-ガラクトシル-ミオ-イノシトール
GLAL グリコールアルデヒド
GLAM グルコサミン
GLC α-D-グルコース
GLCN グルコナート
GLN L-グルタミン
GLP グリシルペプチド
GLT L-グルシトール
GLU L-グルタメート
GLUGSAL L-グルタメート5-セミアルデヒド
GLUGSALm L-グルタメート5-セミアルデヒドM
GLUm グルタメートM
GLUP α-D-グルタミルリン酸
GLX グリオキシラート
GLY グリシン
GLYCOGEN グリコーゲン
GLYm グリシンM
GLYN グリセロン(Glycerone)
GMP GMP
GN グアニン
GNm グアニンM
GPP ゲラニル二リン酸
GSN グアノシン
GSNm グアノシンM
GTP GTP
GTPm GTPM
GTRNA L-グルタミル-tRNA(Glu)
GTRNAm L-グルタミル-tRNA(Glu)M
GTRP P1,P4-ビス(5'-guanosyl)四リン酸
H2O2 H2O2
H2S 硫化水素
H2SO3 亜硫酸
H3MCOA (S)-3-ヒドロキシ-3-メチルグルタリル-CoA
H3MCOAm (S)-3-ヒドロキシ-3-メチルグルタリル-CoAM
HACNm ブト-1-エン-1,2,4-トリカルボキシラートM
HACOA (3S)-3-ヒドロキシアシル-CoA
HAN 3-ヒドロキシアンスラニレート
HBA 4-ヒドロキシ-ベンジルアルコール
HCIT 2-ヒドロキシブタン-1,2,4-トリカルボキシラート
HCITm 2-ヒドロキシブタン-1,2,4-トリカルボキシラートM
HCYS ホモシステイン
HFXT H +EXT
HHTRNA L-ヒスチジル-tRNA(His)
HIB (S)-3-ヒドロキシブチラート
HIBCOA (S)-3-ヒドロキシイソブチリル-CoA
HICITm ホモイソシトラートM
HIS L-ヒスチジン
HISOL L-ヒスチジノール
HISOLP L-ヒスチジノールホスファート
HKYN 3-ヒドロキシキヌレニン
Hm H +M
HMB ヒドロキシメチルビラン(hydroxymethylbilane)
HOMOGEN ホモゲンチサート(Homogentisate)
HPRO trans-4-ヒドロキシ-L-プロリン
HSER L-ホモセリン
HTRNA tRNA(His)
HYXAN ヒポキサンチン
IAC インドール-3-アセテート
IAD インドール-3アセトアミド
IBCOA 2-メチルプロパノイル-CoA
ICIT イソシトラート
ICITm イソシトラートM
IDP IDP
IDPm IDPM
IGP インドールグリセロールホスファート
IGST 4,4-ジメチルコレスタ-8,14,24-トリエノール
IIMZYMST 中間体_メチルチモステロール_II
IIZYMST 中間体_チモステロール_II
ILE L-イソロイシン
ILEm L-イソロイシンM
IMACP 3-(イミダゾール-4-yl)-2-オキソプロピルホスファート
IMP IMP
IMZYMST 中間体_メチルチモステロール_I
INAC インドールアセテート
INS イノシン
IPC イノシトールホスホリルセラミド
IPPMAL リンゴ酸2-イソプロピル
IPPMALm リンゴ酸2-イソプロピルM
IPPP イソペンテニルジホスファート
ISUCC a-イミノコハク酸塩
ITCCOAm イタコニル-CoAM
ITCm イタコナートM
ITP ITP
ITPm ITPM
IVCOA 3-メチルブタノイル-CoA
IZYMST 中間体_チモステロール_I
K カリウム
KYN L-キヌレニン
LAC (R)-ラクテート
LACALm (S)-ラクトアルデヒドM
LACm (R)-ラクテートM
LCCA 長鎖カルボン酸
LEU L-ロイシン
LEUm L-ロイシンM
LGT (R)-S-ラクトイルグルタチオン
LGTm (R)-S-ラクトイルグルタチオンM
LIPIV 2,3,2',3'-テトラキス(3-ヒドロキシテトラデカノイル)-D-グルコサミニル1,6-β-D-グルコサミン1,4'-ビスホスファート
LIPOm リポアミドM
LIPX 脂質X
LLACm (S)-ラクテートM
LLCT L-シスタチオニン
LLTRNA L-リジル-tRNA(Lys)
LLTRNAm L-リジル-tRNA(Lys)M
LNST ラノステリン
LIRNA tRNA(Lys)
LIRNAm tRNA(Lys)M
LYS L-リジン
LYSm L-リジンM
MAACOA a-メチルアセトアセチル-CoA
MACAC4-マレイルアセトアセテート
MACOA 2-メチルプロパ-2-エノイル-CoA
MAL リンゴ酸
MALACP マロニル-[アシル-キャリアータンパク質]
MALACPm マロニル-[アシル-キャリアータンパク質]M
MALCOA マロニル-CoA
MALm リンゴ酸M
MALT マロナート
MALTm マロナートM
MAN α-D-マンノース
MAN1P α-D-マンノース1-リン酸
MAN2PD β-D-マンノシルジアセチルキトビオシルジホスホドリコール
MAN6P D-マンノース6-リン酸
MANNAN マンナン
MBCOA メチルブチリル-CoA
MCCOA 2-メチルブト-2-エノイル-CoA
MCRCOA 2-メチルブト-2-エノイル-CoA
MDAP メソ-ジアミノピメリン酸
MELI メリビオース
MELT メリビイトール(Melibiitol)
MET L-メチオニン
METH メタンチオール
METHF 5,10-メチレンテトラヒドロ葉酸
METHFm 5,10-メチレンテトラヒドロ葉酸M
METTHF 5,10-メチレンテトラヒドロ葉酸
METTHFm 5,10-メチレンテトラヒドロ葉酸M
MGCOA 3-メチルグルタコニル-CoA
MHIS N(pai)-メチル-L-ヒスチジン
MHVCOA a-メチル-b-ヒドロキシバレリル-CoA
MI ミオ-イノシトール
MI1P 1L-ミオ-イノシトール1-リン酸
MIP2C イノシトール-マンノース-P-イノシトール-P-セラミド
MIPC マンノース-イノシトール-P-セラミド
MK メナキノンm
MLT マルトース
MMCOA メチルマロニル-CoA
MMET S-メチルメチオニン
MMS (S)-メチルマロン酸セミアルデヒド
MNT D-マンニトール
MNT6P D-マンニトール1-リン酸
MTHF 5-メチルテトラヒドロ葉酸
MTHFm 5-メチルテトラヒドロ葉酸M
MTHGXL メチルグリオキサール
MTHN メタン
MTHNm メタンM
MTHPTGLU 5-メチルテトラヒドロプロピルトリ-L-グルタメート
MTRNAm L-メチオニル-tRNAM
MVL (R)-メバロナート
MVLm (R)-メバロナートM
MYOI ミオ-イノシトール
MZYMST 4-メチルチモステロール
N4HBZ 3-ノナプレニル-4-ヒドロキシベンゾアート
NA ナトリウム
NAAD デアミノ-NAD+
NAADm デアミノ-NAD +M
NAC ニコチナート
NACm ニコチナートM
NAD NAD+
NADH NADH
NADHm NADHM
NADm NAD +M
NADP NADP+
NADPH NADPH
NADPHm NADPHM
NADPm NADP +M
NAG N-アセチルグルコサミン
NAGA1P N-アセチル-D-グルコサミン1-ホスファート
NAGA6P N-アセチル-D-グルコサミン6-ホスファート
NAGLUm N-アセチル-L-グルタメートM
NAGLUPm N-アセチル-L-グルタメート5-ホスファートM
NAGLUSm N-アセチル-L-グルタメート5-セミアルデヒドM
NAM ニコチンアミド
NAMm ニコチンアミドM
NAMN ニコチナートD-リボヌクレオチド
NAMNm ニコチナートD-リボヌクレオチドM
NAORNm N2-アセチル-L-オルニチンM
NH3 NH3
NH3m NH3M
NH4 NH4+
NPP all-trans-ノナプレニルジホスファート
NPPm all-trans-ノナプレニルジホスファートM
NPRAN N-(5-ホスホ-D-リボシル)アンスラニレート
O2 酸素
O2m 酸素M
OA オキサロアセテート
OACOA 3-オキソアシル-CoA
OAHSER O-アセチル-L-ホモセリン
OAm オキサロアセテートM
OBUT 2-オキソブタノアート
OBUTm 2-オキソブタノアートM
OFP 酸化型フラビンタンパク質
OGT 酸化型グルタチオン
OHB 2-オキソ-3-ヒドロキシ-4-ホスホブタノアート
OHm HO-M
OICAP 3-カルボキシ-4-メチル-2-オキソペンタノアート
OICAPm 3-カルボキシ-4-メチル-2-オキソペンタノアートM
OIVAL (R)-2-オキソイソバレラート(isovalerate)
OIVALm (R)-2-オキソイソバレラート(isovalerate)M
OMP オロチジン5'-ホスファート
OMVAL 3-メチル-2-オキソブタノアート
OMVALm 3-メチル-2-オキソブタノアートM
OPEP オリゴペプチド
ORN L-オルニチン
ORNm L-オルニチンM
OROA オロタート(orotate)
OSLHSER O-サクシニル-L-ホモセリン
OSUC オキサロコハク酸塩
OSUCm オキサロコハク酸塩M
OTHIO 酸化型チオレドキシン
OTHIOm 酸化型チオレドキシンM
OXA オキサログルタラート
OXAm オキサログルタラートM
P5C (S)-1-ピロリン-5-カルボキシラート
P5Cm (S)-1-ピロリン-5-カルボキシラートM
P5P ピリドキシンリン酸
PA ホスファチダート
PABA 4-アミノベンゾアート
PAC フェニル酢酸
PAD 2-フェニルアセトアミド
PALCOA パルミトイル-CoA
PAm ホスファチダートM
PANT (R)-パントアート
PANTm (R)-パントアートM
PAP アデノシン3',5'-ビスリン酸
PAPS 3'-ホスホアデニル硫酸
PBG ポルフォビリノーゲン
PC ホスファチジルコリン
PC2 シロヒドロクロリン(Sirohydrochlorin)
PCHO コリンリン酸
PDLA ピリドキサミン
PDLA5P ピリドキサミンリン酸
PDME ホスファチジル-N-ジメチルエタノールアミン
PE ホスファチジルエタノールアミン
PEm ホスファチジルエタノールアミンM
PEP ホスホエノールピルビン酸
PEPD ペプチド
PEPm ホスホエノールピルビン酸M
PEPT ペプチド
PETHM エタノールアミンホスファート
PGm ホスファチジルグリセロールM
PGPm ホスファチジルグリセロリン酸M
PHC L-1-ピロリン-3-ヒドロキシ-5-カルボンキシラート
PHE L-フェニルアラニン
PHEN プレフェナート(Prephenate)
PHP 3-ホスホノオキシピルビン酸
PHPYR フェニルピルビン酸
PHSER O-ホスホ-L-ホモセリン
PHSP フィトスフィンゴシン1-リン酸
PHT O-ホスホ-4-ヒドロキシ-L-スレオニン
PI オルトリン酸塩
PIm オルトリン酸塩M
PIME ピメリン酸
PINS 1-ホスファチジル-D-ミオ-イノシトール
PINS4P 1-ホスファチジル-1D-ミオ-イノシトール4-リン酸
PINSP 1-ホスファチジル-1D-ミオ-イノシトール3-リン酸
PL ピリドキサール
PL5P ピリドキサールリン酸
PMME ホスファチジル-N-メチルエタノールアミン
PMVL (R)-5-ホスホメバロナート
PNTO (R)-パントテナート
PPHG プロトポルフィリノーゲンIX
PPHGm プロトポルフィリノーゲンIXM
PPI ピロリン酸
PPIm ピロリン酸M
PPIXm プロトポルフィリンM
PPMAL 2-イソプロピルリンゴ酸
PPMVL (R)-ジホスホメバロナート
PRAM 5-ホスホリボシルアミン
PRBAMP N1-(5-ホスホ-D-リボシル)-AMP
PRBATP N1-(5-ホスホ-D-リボシル)-ATP
PRFICA 1-(5'-ホスホリボシル)-5-ホルムアミド-4-イミダゾールカルボキシアミド
PRFP 5-(5-ホスホ-D-リボシルアミノホルミミノ)-1-(5-ホスホリボシル)-イミダゾール-4-カルボキサミド
PRLP N-(5'-ホスホ-D-1'-リボシルホルミミノ)-5-アミノ-1-(5”-ホスホ-D-リボシル)-4-イミダゾールカルボキシアミド
PRO L-プロリン
PROm L-プロリンM
PROPCOA プロパノイル-CoA
PRPP 5-ホスホ-α-D-リボース1-二リン酸
PRPPm 5-ホスホ-α-D-リボース1-二リン酸M
PS ホスファチジルセリン
PSm ホスファチジルセリンM
PSPH フィトスフィンゴシン
PTHm ヘムM
PTRC プトレシン
PTRSC プトレシン
PURI5P プソイドウリジン5'-リン酸
PYR ピルビン酸
PYRDX ピリドキシン
PYRm ピルビン酸M
Q ユビキノン-9
QA ピリジン-2,3-ジカルボキシラート
QAm ピリジン-2,3-ジカルボキシラートM
QH2 ユビキノール
QH2m ユビキノールM
Qm ユビキノン-9M
R1P D-リボース1-リン酸
R5P D-リボース5-リン酸
RADP 4-(1-D-リビチルアミノ)-5-アミノ-2,6-ジヒドロキシピリミジン
RAF ラフィノース
RTP 還元型フラビンタンパク質
RGT グルタチオン
RGTm グルタチオンM
RIB D-リボース
RIBFLAVm リボフラビンM
RIBOFLAV リボフラビン
RIPm α-D-リボース1-リン酸M
RL5P D-リブロース5リン酸
RMN D-ラムノース
RTHIO 還元型チオレドキシン
RTHIOm 還元型チオレドキシンM
S 硫黄
S17P セドヘプツロース1,7-ビスリン酸
S23E (S)-2,3-エポキシスクアレン
S7P セドヘプツロース7-リン酸
SACP N6-(L-1,3-ジカルボキシプロピル)-L-リシン
SAH S-アデノシル-L-ホモシステイン
SAHm S-アデノシル-L-ホモシステインM
SAICAR 1-(5'-ホスホリボシル)-5-アミノ-4-(N-スクシノカルボキサミド)-イミダゾール
SAM S-アデノシル-L-メチオニン
SAMm S-アデノシル-L-メチオニンM
SAMOB S-アデノシル-4-メチルチオ-2-オキソブタノアート
SAPm S-アミノメチルジヒドロリポイルタンパク質M
SER L-セリン
SERm L-セリンM
SLF 硫酸塩
SLFm 硫酸塩M
SME シキマート(Shikimate)
SME5P シキマート(Shikimate)3-リン酸
SOR ソルボース
SOR1P ソルボース1-リン酸
SOT D-ソルビトール
SPH スフィンガニン
SPMD スペルミジン
SPRM スペルミン
SPRMD スペルミジン
SQL スクアレン
SUC ショ糖
SUCC コハク酸塩
SUCCm コハク酸塩M
SUCCOAm スクシニル-CoAM
SUCCSAL コハク酸セミアルデヒド
T3P1 D-グリセロールアルデヒド-3-リン酸
T3P2 グリセロンホスファート
T3P2m グリセロンホスファートM
TAG16P D-タガトース1,6-ビスリン酸
TAG6P D-タガトース6-リン酸
TAGLY トリアシルグリセロール
TCOA テトラデカノイル-CoA
TGLP N-テトラデカノイルグリシルペプチド
THF テトラヒドロ葉酸
THFG テトラヒドロ葉酸-[Glu](n)
THFm テトラヒドロ葉酸M
THIAMIN チアミン
THMP チアミンモノホスファート
THPTGLU テトラヒドロプテロイルトリ-L-グルタメート
THR L-スレオニン
THRm L-スレオニンM
THY チミン
THZ 5-(2-ヒドロキシエチル)-4-メチルチアゾール
THZP 4-メチル-5-(2-ホスホエチル)-チアゾール
TPI D-ミオ-イノシトール1,4,5-三リン酸
TPP チアミン二リン酸
TPPP チアミン三リン酸
TRE α,α-トレハロース
TRE6P α,α'-トレハロース6-リン酸
TRNA tRNA
TRNAG tRNA(Glu)
TRNAGm tRNA(Glu)M
TRNAm tRNAM
TRP L-トリプトファン
TRPm L-トリプトファンM
TRPTRNAm L-トリプトファニル-tRNA(Trp)M
TYR L-チロシン
UDP UDP
UDPG UDPグルコース
UDPG23A UDP-2,3-ビス(3-ヒドロキシテトラデカノイル)グルコサミン
UDPG2A UDP-3-O-(3-ヒドロキシテトラデカノイル)-D-グルコサミン
UDPG2AA UDP-3-O-(3-ヒドロキシテトラデカノイル)-N-アセチルグルコサミン
UDPGAL UDP-D-ガラクトース
UDPNAG UDP-N-アセチル-D-ガラクトサミン
UDPP ウンデカプレニル二リン酸
UGC (-)-ウレイドグリコラート
UMP UMP
UPRG ウロポルフィリノーゲン III
URA ウラシル
UREA ウレア
UREAC ウレア-1-カルボンキシラート
URI ウリジン
UTP UTP
VAL L-バリン
X5P D-キシロース-5-リン酸
XAN キサンチン
XMP キサントシン5'-リン酸
XTSINE キサントシン
XTSN キサントシン
XUL D-キシルロース
XYL D-キシロース
ZYMST チモステロール
【0051】
試験される特定の環境条件および所望の活性に依存して、反応ネットワーク・データ構造は、少なくとも200、150、100、または50反応などのより少数の反応を含むことができる。比較的少ない反応を有している反応ネットワーク・データ構造では、シミュレーションを行うために必要とされる計算時間および資源を減少するという利点がもたらされ得る。必要に応じて、特定の反応サブセットを有する反応ネットワーク・データ構造を、作成する特定のシミュレーションに関連しない反応が省略されているものについて作製するか、または使用することができる。または、本発明の方法の精度もしくは分子詳細を高めるために、または特定の適用に適合するように、多くの反応を含めることができる。したがって、反応ネットワーク・データ構造は、酵母において、もしくは酵母によって起こるか、または酵母において起こっている反応の完全なセットの活性をシミュレートするために要求される反応数、少なくとも300、350、400、450、500、550、600以上の反応を含むことができる。酵母の代謝反応に関して実質的に完全な反応ネットワーク・データ構造は、シミュレートされる広範な条件に関連づけられるという利点を提供するが、より少ない代謝反応を有するものでは、シミュレートされる条件が特定のサブセットに限定される。
【0052】
酵母反応ネットワーク・データ構造は、天然においても操作後においても、酵母において、もしくは、酵母によって生じ、かつ大腸菌、インフルエンザ菌、枯草菌、ヘリコバクターピロリなどの別の原核生物において、もしくは、それらによって、またはホモ・サピエンスなどの別の真核生物において、もしくは、それらによって、のいずれかでは生じない1つまたは複数の反応を含むことができる。少なくとも大腸菌、インフルエンザ菌、およびヘリコバクターピロリと比較して、酵母に特有である反応の例は、表4において同定されたものを含む。酵母反応ネットワーク・データ構造は、別の生物において起こる1つまたは複数の反応を含むことができることが理解される。このような異種反応を本発明の反応ネットワーク・データ構造に対して付加することは、たとえば、人工細胞もしくは株をデザインまたは設計するときに、酵母への異種遺伝子導入の結果を予測するための方法に使用することができる。
【0053】
(表4)酵母代謝ネットワークに特異的な反応


【0054】
上記のように、代謝反応データベースに利用できるものなどのデータ構造に使用される反応の反応ネットワーク・データ構造またはインデックスは、特定の反応についての情報を含むように注釈をつけることができる。反応は、たとえば、反応を行うタンパク質、巨大分子、または酵素に対する反応の割当て、タンパク質、巨大分子、または酵素をコードする遺伝子の割当て、特定の代謝反応における酵素番号(Enzyme Commission(EC)number)または特定の代謝反応における遺伝子オントロジ番号(Gene Ontology(GO)number)、反応が属する反応のサブセット、情報が得られた参考資料に対する引用、または酵母において生じると考えられている反応の信頼性のレベルを示すための注釈をつけることができる。本発明のコンピュータ読み取り可能な媒体または媒体類は、注釈がついている反応を含んでいる遺伝子データベースを含むことができる。このような情報は、後述するように、本発明の代謝反応データベースまたはモデルを構築する経過において得ることができる。
【0055】
本明細書において使用されるものとして、用語「遺伝子データベース」は、反応を行う1つもしくは複数の巨大分子に反応を割り当てるための、または反応を行う1つもしくは複数の巨大分子をコードする1つもしくは複数の核酸を割り当てるための注釈がついている少なくとも1つの反応を含むコンピュータ読み取り可能な媒体または媒体類を意味することが企図される。遺伝子データベースは、一部または全てが注釈をつけられた複数の反応を含むことができる。注釈は、たとえば、巨大分子の名前;巨大分子に対する機能の割当て;巨大分子を含むもしくは巨大分子を産生する生物の割当て;巨大分子のための細胞下の位置の割当て;巨大分子が発現されるもしくは分解される条件の割当て;巨大分子のアミノ酸もしくはヌクレオチド配列;またはスタンフォード大学によって維持されるサッカロマイセス・ゲノム・データベース(Saccharomyces Genome Database)、またはMIPSによって維持される包括的酵母ゲノム・データベース(Comprehensive Yeast Genome Database)において見出すことができるものなどの、ゲノム・データベースにおいて巨大分子について見出されるその他のいかなる注釈も含み得る。
【0056】
本発明の遺伝子データベースは、酵母の遺伝子および/またはオープンリーディングフレームの実質的に完全なコレクション、または酵母ゲノムによってコードされる巨大分子の実質的に完全なコレクションを含み得る。または、遺伝子データベースは、酵母の遺伝子もしくはオープンリーディングフレームの一部、または酵母ゲノムによってコードされる巨大分子の一部を含み得る。一部は、酵母ゲノムによってコードされる遺伝子もしくはオープンリーディングフレーム、またはこの中でコードされる巨大分子の少なくとも10%、15%、20%、25%、50%、75%、90%、もしくは95%であることができる。また、遺伝子データベースは、酵母ゲノムの少なくとも10%、15%、20%、25%、50%、75%、90%、または95%などの酵母ゲノムの少なくとも一部のヌクレオチド配列によってコードされる巨大分子を含むことができる。したがって、本発明のコンピュータ読み取り可能な媒体または媒体類は、酵母ゲノムの一部によってコードされるそれぞれの巨大分子の少なくとも1つの反応を含むことができる。
【0057】
本発明に従った酵母のインシリコにおけるモデルは、モデルに付加するための特定の反応に関して情報を収集すること、反応ネットワーク・データ構造の反応を表すこと、および制約セットが反応ネットワークに配置されており、かつネットワークのエラーを同定するためにアウトプットを評価する、予備的シミュレーションを行うことを含む反復的なプロセスによって構築することができる。特定の代謝産物の非天然の蓄積または消費を引き起こすギャップなどのネットワークにおけるエラーは、後述するように同定することができ、所望のモデル性能が達成されるまで、シミュレーションを繰り返す。反復的なモデル構築のための典型的な方法は、実施例Iに提供してある。
【0058】
したがって、本発明は、コンピュータ読み取り可能な媒体または媒体類において、複数の酵母反応物を、複数の酵母反応と関連づけるデータ構造を作成するための方法を提供する。本方法は(a)複数の酵母反応および酵母反応の基質および産物である複数の酵母反応物を同定すること(b)複数のデータ構造の酵母反応を、複数の酵母反応物に関連づけることであって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含むこと(c)複数の酵母反応のための制約セットを作製すること(d)目的関数を提供すること(e)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定すること、および(f)少なくとも1つのフラックス分布が酵母生理機能を予測しない場合は、データ構造に反応を追加するか、またはデータ構造から反応を除去させて、段階(e)を繰り返し、少なくとも1つのフラックス分布が酵母生理機能を予測する場合は、コンピュータ読み取り可能な媒体または媒体類にデータ構造を格納することを含む。
【0059】
本発明のデータ構造に含まれる情報は、たとえば、科学文献またはNCBI(ncbi. nlm. gov)によって維持されるサイトのGenbank、MIPSによって維持されるサイトのCYGDデータベース、もしくスタンフォード大学医学部によって維持されるサイトのSGDデータベース、その他などの、注釈がついた酵母のゲノム配列を含む種々の供与源から収集することができる。
【0060】
酵母代謝のインシリコモデルの開発の際に、考慮に入れられ得るデータのタイプは、たとえばしばしば反応および反応の化学量論に関連づけられたタンパク質(類)を直接示し、または細胞抽出物内で起こっている反応の存在を間接的に示す、化学反応の実験的特徴付けに関連した情報である生化学情報;生化学的現象の実行に関係づけられた特定のタンパク質(類)をコードすることが示された遺伝子(類)の実験的同定および遺伝的特徴付けに関連した情報である遺伝情報;計算的配列解析を介した、オープンリーディングフレームおよび機能的割当ての同定に関連し、次いで生化学現象を実行するタンパク質に関係した情報であるゲノム情報;全体的細胞生理、適応度特性、基質利用、および表現型決定の結果に関する情報であって、特異的な生化学現象(特に転位)の存在を推測するために使用される化合物の同化または異化の証拠を提供する情報である生理学的な情報;および本明細書に記載されたものなどの方法を使用して、酵母の活性をシミュレートする経過で発生する情報であって、反応が代謝ネットワークに配置された特定の要求を果たす必要があるか否かなどの反応の状態に関する予測がなされる情報であるモデリング情報を含むものとみなされ得る。
【0061】
酵母反応ネットワークにおいて起こっている大多数の反応は、細胞の染色体に見出される遺伝子の転写および翻訳を介して作成される酵素/タンパク質によって触媒されている。残りの反応は、非酵素的なプロセスで起こる。さらに、反応ネットワーク・データ構造は、特定の反応経路へ、または特定の反応経路から、工程を付加または欠失させる反応を含むことができる。たとえば、実験的に観察された活性から見て、反応を付加して、酵母モデルの実行を最適化または改善することができる。または、中間の工程が、経路を介したフラックスをモデル化する必要がないときには、反応を削除して経路の中間工程を除去することができる。たとえば、経路が3つの枝分かれのない工程を含む場合、反応を組み合わせて、または一緒に付加して、ネットワーク反応を与え、これにより反応ネットワーク・データ構造を貯蔵するために必要とされるメモリおよびデータ構造の操作のために必要とされる計算資源を減少することができる。脂肪酸分解のための組合せ反応の例を表2に示してあり、アシル-CoAオキシダーゼ、ヒドラターゼ-デヒドロゲナーゼ-エピメラーゼ、および脂肪酸β-酸化におけるアセチル-CoA C-アシルトランスフェラーゼの反応を組み合わせる。
【0062】
遺伝子でコードされた酵素の活性によって生じる反応は、ゲノムシーケンシングから同定される遺伝子またはオープンリーディングフレームの一覧を示すゲノム・データベースおよびその後のゲノム注釈から得ることができる。ゲノム注釈は、オープンリーディングフレームの位置およびその他の既知の遺伝子に対する相同性または経験的に決定された活性から機能を割当てることからなる。このようなゲノム・データベースは、注釈がついている酵母の核酸もしくはタンパク質の配列を含む一般のまたは個人的なデータベースを通じて取得することができる。必要に応じて、モデル開発により、ネットワーク再構成を行い、たとえばCovertら、Trends in Biochemical Sciences 26:179-186(2001)およびPalsson、国際公開公報第00/46405号に記載されている遺伝子、タンパク質、および反応の間のモデル含有物の関連を確立することができる。
【0063】
反応を反応ネットワーク・データ構造または代謝反応データベースに添加すると、反応を可能にする/触媒するタンパク質/酵素およびこれらのタンパク質をコードする関連した遺伝子に対する関連が既知または推定されているものを、注釈によって同定することができる。したがって、これらの関連したタンパク質もしくは遺伝子または両方に対する反応の一部または全てについて、適切な関連を割り当てることができる。これらの関連は、遺伝子とタンパク質との間、並びにタンパク質と反応との間の非線形関係を収集するために使用することができる。場合によっては、1つの遺伝子は1つのタンパク質をコードし、次いで1つの反応を行う。しかし、しばしば、活性な酵素複合体を作成するために必要とされる多くの遺伝子が存在し、しばしば、1つのタンパク質によって行うことができる多くの反応または同じ反応を行うことができる多くのタンパク質が存在する。これらの関連は、関連の範囲内で論理(すなわち、ANDまたはORの関係)を収集する。これらの関連を代謝反応データベースに注釈づけることによって、酵母の活性のシミュレーションまたは予測を行う状況において、反応のレベルだけでなく、遺伝子またはタンパク質のレベルにおいても特定の反応の付加または除去の効果を決定するために、本方法を使用することができる。
【0064】
本発明の反応ネットワーク・データ構造は、複数の酵母反応の1つまたは複数の反応の活性を、反応を行うタンパク質またはタンパク質をコードする遺伝子の一致性における知識からも注釈からも独立して決定するために使用することができる。遺伝子またはタンパク質の一致性を注釈づけたモデルには、タンパク質またはコードする遺伝子が割り当てられていない反応を含むことができる。細胞代謝ネットワークにおける反応の大部分は、生物のゲノムの遺伝子と関連しているが、遺伝的な関連が知られていないモデルに含まれている反応も相当数ある。生化学もしくは細胞に基づいた測定、または観察された生化学もしくは細胞の活性に基づいた理論的考慮などの、必ずしも遺伝子学的に関連があるというわけではないその他の情報に基づいた反応データベースに、このような反応を付加することができる。たとえば、タンパク質では可能でない反応には多くの反応がある。さらに、関連したタンパク質または遺伝子が現在同定されていない細胞における特定の反応の発生は、本発明の方法を構築する反復的なモデルによって、モデル構築の間に示され得る。
【0065】
必要に応じて、反応ネットワーク・データ構造または反応データベースの反応は、注釈によってサブシステムに割り当てることができる。伝統的に同定された代謝経路(解糖、アミノ酸代謝など)など生物学的な基準に従って、または反応を組み込むもしくは操作するモデルの操作を容易にする数学的または計算的な基準に従って、反応を細区画することができる。反応データベースを細区画するための方法および基準は、Schillingら、J. Theor. Biol. 203: 249-283 (2000)に、さらに詳細に記載されている。サブシステムの使用は、極端な経路解析などの多くの解析法に有利であろうし、より容易なモデル内容の管理を行うことができる。反応をサブシステムに割り当てることは、シミュレーションのための全てのモデルの使用に影響を及ぼすことなく達成することができるが、反応をサブシステムに割り当てることによって、ユーザが特定のサブシステムにおける反応を捜すことができることができ、様々なタイプの解析を行う際に有効であろう。したがって、反応ネットワーク・データ構造は、たとえば、2つ以上のサブシステム、5つ以上のサブシステム、10以上のサブシステム、25以上のサブシステム、または50以上のサブシステムを含む、所望のサブシステムを任意の数含むこともできる。
【0066】
反応ネットワーク・データ構造または代謝反応データベースの反応は、酵母において起こると考えられている反応の信頼度を示す値によって注釈をつけることができる。信頼度のレベルは、たとえば利用できる支持データの量および形態の関数であることができる。このデータは、発行された文献、実証された実験結果、または計算解析の結果を含む種々の形態であることができる。さらに、データにより、遺伝学的、生化学的、および/または生理学的なデータに基づいて、細胞の化学反応の存在についての直接または間接の証拠を提供することができる。
【0067】
本発明は、さらにコンピュータ読み取り可能な媒体であって、(a)複数の酵母反応物を複数の酵母反応と関係づけるデータ構造であって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づけるを化学量論係数含むデータ構造と、(b)酵母反応のための複数の制約セットを含む媒体とを提供する。
【0068】
制約は、制約セットを使用する代謝ネットワークにおけるフラックスのいずれかの値に配置することができる。これらの制約は、所与の反応を介して最小または最大限に許容されるフラックスの表現であることができ、おそらく、限られた量の酵素の存在から生じる。または、制約は、反応ネットワーク・データ構造における反応もしくは輸送フラックスのいずれかの方向または可逆性を決定することができる。酵母が生存するインビボの環境に基づいて、必須分子の生合成のために細胞が利用できる代謝資源を決定することができる。対応する輸送フラックスを活性にすることができると、インシリコにおいて、代謝ネットワークによって産生される基質および副生成物のための入力および出力を有する酵母が提供される。
【0069】
図1に示した仮定的反応ネットワークに戻って、制約は、図3に示したように、それぞれの典型的な形式の反応に配置することができる。制約は、図2に示した化学量論的マトリックス反応を制約するために使用することができる形式で提供される。マトリックスまたは線形プログラミングに使用される制約の形式は、以下のものなどの線形不等式としてうまく表現することができる。
βj≦υj≦αj : j = 1...n(式1)
式中、υjは、代謝フラックスベクトルであり、βjは、最小フラックス値であり、およびαjは、最大フラックス値である。したがって、αjは、所与の反応を介した最大許容フラックスを表す有限値に、またはβjは、所与の反応を介した最小許容フラックスを表す有限値にすることができる。その上、ある可逆反応または輸送フラックスをそのままにすることを選択して、正様式および逆様式で作動する場合、図3の反応R2に示したように、βjを負の無限大に、およびαjを正の無限大にセットすることにより、フラックスを制約がないままにしてもよい。反応が正の反応だけで進行する場合、βjはゼロにセットされるが、αjは正の無限大にセットされる。反応が正反応のみで進行する場合、図3の反応R1、R3、R4、R5およびR6に示したように、βjをゼロにセットし、αjを正の無限大にセットする。例として、遺伝子欠損または特定のタンパク質の非発現の事象をシミュレートするために、αjおよびβjをゼロにセットすることにより、問題の遺伝子またはタンパク質に関連づけられた対応する代謝反応の全てを介したフラックスを、ゼロに減少させる。さらに、特定の増殖基質の不存在をシミュレートすることを望む場合、単に対応する輸送フラックスを制約することにより、代謝産物を細胞に入れることができ、αjおよびβjをゼロにさせることにより、ゼロになる。他方、基質が輸送機構を経て細胞に入ること、または出ることのみができる場合、対応するフラックスは、このシナリオを適切に制約して反映することができる。
【0070】
本明細書に記載されたインシリコにおける酵母モデルおよび方法は、Intel.RTM.マイクロプロセッサに基づき、かつMicrosoft Windowsオペレーティングシステムで動くものなどの従来のどのようなホストコンピュータシステムでも実行されることができる。NIXまたはLINUXオペレーティングシステムを使用し、IBM.RTM.、DEC.RTM.、Motrola.RTM.マイクロプロセッサに基づくものなど、その他のシステムも想定される。本明細書に記載されるシステムおよび方法は、また、クライアント-サーバー系およびインターネットなどの広い領域のネットワーク上で走らせるために実行することもできる。
【0071】
本発明の方法またはモデルを実行するソフトウェアは、Java、C、C++、Visual Basic、FORTRAN、またはCOBOLなどの周知のどのようなコンピュータ言語で書かれることもでき、周知の互換性を持ついかなるコンパイラを使用して編集することもできる。本発明のソフトウェアは、通常ホストコンピュータシステムのメモリに貯蔵された指令により動作する。メモリまたはコンピュータ読み取り可能な媒体は、ハードディスク、フロッピーディスク、コンパクトディスク、光磁気ディスク、ランダム・アクセス・メモリ、読み込みのみのメモリ、またはフラッシュ・メモリであることができる。本発明に使用されるメモリまたはコンピュータ読み取り可能な媒体は、単一のコンピュータ内に含まれることができ、またはネットワークにおいて分散されることもできる。ネットワークは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)などの当業者に既知の多くの従来のネットワークシステムのいずれであることもできる。本発明において使用することができるクライアント-サーバー環境、データベースサーバー、およびネットワークは、周知技術である。たとえば、データベースサーバーは、UNIXなどのオペレーティングシステムで実行することができ、関係型データベース管理システム、ワールドワイドウェブの適用、およびワールドワイドウェブサーバーを実行することもできる。また、その他のタイプのメモリおよびコンピュータ読み取り可能な媒体は、本発明の範囲内で機能することが想定される。
【0072】
本発明のデータベースまたはデータ構造は、たとえば、標準的な一般化されたマークアップ言語(Standard Generalized Markup Language:SGML)、ハイパーテキストマークアップ言語(Hypertext Markup Language:HTML)、または拡張可能なマークアップ言語(Extensible Markup Language:XML)を含むマークアップ言語形式で表すことができる。本発明のデータベースまたはデータ構造に貯蔵した情報にタグをつけるためにマークアップ言語を使用することができ、これにより便利な注釈づけおよびデータベースとデータ構造との間のデータ転送がもたらされる。特に、XML形式は、反応、反応物、およびこれらの注釈のデータ表現を構築するために;たとえば、ネットワークまたはインターネット上の、データベースの内容を交換するために;文書対象モデルを使用する個々のエレメントを更新するために;または本発明のデータベースもしくはデータ構造の異なる情報内容について、多くのユーザに特異なアクセスを提供するために、有効であり得る。XMLプログラミング法およびXMLコードを書き込むためのエディタは、たとえばRayにおいて Learning XML O'Reilly and Associates, Sebastopol, CA (2001)に記載されているように、当該技術分野において既知である。
【0073】
制約セットによって特定される環境条件における特定のセットの下で、反応ネットワークを介して質量のフラックスをシミュレートするために、制約セットを反応ネットワーク・データ構造に適用することができる。代謝過渡応答および/または代謝反応を特徴づける時定数が、典型的には約ミリ秒〜秒で、細胞増殖の時定数の約時間〜日と比較して非常に急速であるので、過渡応答物質バランスは、定常状態の挙動を考慮するだけに単純化することができる。反応ネットワーク・データ構造が化学量論的マトリックスであり、かつ定常状態の物質バランスが、線形方程式の以下の系を使用して適用することができる例を、ここで参照する。
S・υ = 0(式2)
式中Sは、上記記載の通り化学量論的マトリックスであり、υは、フラックスベクトルである。この方程式は、化学量論の結果として、代謝ネットワークに配置された質量、エネルギー、およびレドックス電位制約を定める。方程式1および2は共に、それぞれ反応制約および物質バランスを表し、事実上、代謝の遺伝子型の能力および制約、並びに生物の代謝潜在性を定める。方程式2を満たす全てのベクトルυは、Sにおいて数学的零空間において生じると言われている。したがって、零空間は、質量、エネルギー、またはレドックスバランスの制約に違反しない不変の代謝フラックス分布を定める。概してフラックス数は、物質バランス制約の数よりも大きく、したがって、複数のフラックス分布が、物質バランス制約を満たし、零空間を占める。零空間は、代謝フラックス分布の可能なセットを定め、方程式1に記載された反応制約を適用することによってさらに大きさを減少し、定義された解空間を生じる。この空間点は、フラックス分布を表し、それゆえにネットワークにおける代謝表現型を表す。定まった目的および制約セットが提供されたときは、全ての解のセットの範囲内の最適の解を、数学的最適化方法を使用して決定することができる。いずれの解の計算も、本モデルのシミュレーションを構成する。
【0074】
酵母の活性のための目的は、所与の反応ネットワーク・データ構造の内で、代謝ネットワークの改善された使用を調査するように選択することができる。これらの目的は、株、遺伝子型の代謝能力の活用、または最大の細胞増殖などの生理的に意味のある目的関数のための目的をデザインすることができる。増殖は、上記の通りに得られたものなどの、バイオマス組成物の文献値または実験的に決定された実測値に基づいて、生合成要求に関して定義することができる。したがって、バイオマス生成は、適切な割合で中間代謝物を除去する交換反応として定義することができ、目的関数として表すことができる。中間代謝物を排出することに加えて、この反応フラックスには、満たされなければならないあらゆる増殖依存的な維持要求を組み込むために、ATP、NADH、およびNADPHなどのエネルギー分子を利用するように形成することができる。次いで、この新たな反応フラックスは、系が目的関数として満たさなければならないもう一つの制約/バランス式になる。例えば図2の化学量論的マトリックスを用いて、このような制約を付加することは、代謝系に配置された産生需要を記載するためのフラックスを表すために、化学量論的マトリックスにさらなるカラムV増殖を付加されることに類似する。目的関数としてのこの新たなフラックスを設定し、その他の全てのフラックスに対する制約の所与のセットについてこのフラックスの値を最大にするように系に要求し、次いで生物の増殖をシミュレートする方法である。
【0075】
制約セットを反応ネットワーク・データ構造に適用する化学量論的マトリックスの例の続きを、以下の通りに例示することができる。方程式2に対する解は、特定の目的を最小にするフラックス分布が見出される最適化問題として公式化することができる。数学的に、この最適化問題は、以下のように示すことができる:
最小化Z(式3)
式中(式4)

式中、Zは、代謝フラックスυiの線形組み合せとして、この線形組み合わせにおいて質量ciを使用して、表される目的である。また、最適化問題は、等価極大問題として;すなわちZにおける符号を変えることによって述べることができる。最適化プログラムを解決するためのあらゆるコマンドを使用することができ、たとえば線形プログラミングコマンドを含む。
【0076】
本発明のコンピュータシステムは、1つまたは複数の反応の表現を受けることができるユーザー・インターフェースをさらに含むことができる。また、本発明のユーザー・インターフェースは、制約を適用するためのデータ構造、制約セットもしくはデータ表現に制約セットを適用するためのコマンド、またはその組み合わせを修飾するための少なくとも1つのコマンドを送ることが可能であり得る。インターフェースは、メニューまたはダイアログボックスなどの選択を行うためのグラフィック手段を有するグラフィック・ユーザ・インターフェースであることができる。インターフェースは、メイン画面から選択することによってアクセスできる層状の画面と共に配置することができる。ユーザー・インターフェースは、代謝反応データベースなどの本発明において有効なその他のデータベースへのアクセス、または反応ネットワーク・データ構造の反応もしくは反応物、または酵母生理に関連する情報を有するその他のデータベースに対するリンクを提供することができる。また、ユーザー・インターフェースは、反応ネットワークのグラフ図または本発明のモデルを使用するシミュレーションの結果を示すことができる。
【0077】
一旦、初期の反応ネットワーク・データ構造および制約セットが作成されると、このモデルを予備的シミュレーションによって試験することができる。予備的シミュレーションの間、代謝産物を産生することができるが、消費されることができないか、または代謝産物を消費することができるが、産生することができないネットワークのギャップまたは「行き止まり」を同定することができる。予備的シミュレーションの結果に基づいて、さらなる反応を必要とする代謝再構成の領域を同定することができる。これらのギャップの決定は、反応ネットワーク・データ構造における適切なクエリーを介して容易に算出することができ、シミュレーションストラテジーを使用する要求は必要ではないが、シミュレーションがこのようなギャップの位置を決めるための別のアプローチである。
【0078】
予備的シミュレーション試験およびモデル内容の改善段階において、必要とされるバイオマス成分を産生する能力、およびモデルとした特定の生物株の基本的な生理特性に関する予測を作製する能力などの、基本的要求を実行することができるかどうかを決定するための一連の機能的試験に、既存のモデルを供する。予備的な試験を行うほど、作製されるモデルの品質がより高くなる。典型的には、開発のこの段階に使用した大多数のシミュレーションは、単一最適化である。単一最適化は、送られる代謝資源がどのように1つの最適化問題に対する解から決定されたかを示す単一フラックス分布を算出するために使用することができる。下記の実施例に示されるように、最適化問題は、線形プログラミングを使用して解決することができる。結果は、反応地図におけるフラックス分布の表示として見ることができる。これらがモデリング/シミュレーション要求に基づいてモデルに含まれるべきかどうかを決定するために、一時的な反応をネットワークに付加することができる。
【0079】
一旦、上記の基準に従う反応ネットワーク・データ構造の内容に関して本発明のモデルが十分に完成すると、本モデルを反応ネットワークの1つまたは複数の反応の活性をシミュレートするために使用することができる。シミュレーションの結果は、たとえば、表、グラフ、反応ネットワーク、フラックス分布図、または表現型位相面グラフを含む種々の形式で示すことができる。
【0080】
したがって、本発明は酵母生理機能を予測するための方法を提供する。本方法は、(a)複数の酵母反応物を複数の酵母反応と関連づけるデータ構造であって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに該基質および該産物を関係づける化学量論係数を含むデータ構造を提供すること(b)複数の酵母反応のための制約セットを提供すること(c)目的関数を提供すること、および(d)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより酵母生理機能を予測する。
【0081】
本明細書において使用されるものとして、酵母に関して使用される場合、用語「生理機能」は、全体として酵母細胞の活性を意味することが企図される。本用語に含まれる活性は、酵母細胞の初期状態から酵母細胞の最終的な状態への変化の大きさまたは割合であることができる。活性は、質的に、または量的に測定することができる。たとえば、本用語に含まれる活性は、増殖、エネルギー産生、レドックス相当物の産生、バイオマス産生、発生、または炭素、窒素、硫黄、リン酸、水素、もしくは酸素の消費量であることができる。また、活性は、酵母細胞の特定の反応に影響を及ぼす実質的に全ての反応もしくは酵母細胞において起こる実質的に全ての反応において決定される、または予測される特定の反応の出力であることができる。本用語に含まれる特定の反応の例は、バイオマス前駆体の産生、タンパク質の産生、アミノ酸の産生、プリンの産生、ピリミジンの産生、脂質の産生、脂肪酸の産生、補助因子の産生、または代謝産物の輸送である。生理機能は、全体から現れるが、一部が単離の際に観察される場合に、一部の合計からは現れない出現特性を含み得る(例えばPalsson Nat. Biotech 18: 1147-1150 (2000)を参照されたい)。
【0082】
酵母反応の生理機能は、フラックス分布の位相面解析を使用して決定することができる。位相面は、2次元または3次元で示すことができる可能性のあるセットの表現である。例えば、基質および酸素摂取速度などの増殖条件を記載する2つのパラメータは、2次元空間の2本の軸として定義することができる。最適なフラックス分布は、線形プログラミング問題を繰り返し解き、一方で2次元空間を定義する交換フラックスを調整することによって、この面の全ての点について上に記載したとおりの反応ネットワーク・データ構造および制約セットから算出することができる。有限数の定性的に異なる代謝経路利用パターンをこのような面において同定することができ、これらの領域の境界を定めるために線を描くことができる。例えばChvatal, Linear Programming New York, W. H. Freeman and Co. (1983)に記載されているように、領域を定義する境界は、線形最適化のシャドープライスを使用して決定することができる。領域は、定常的なシャドープライス構造の領域と称する。シャドープライスは、負、ゼロ、または正のいずれかである数としての目的関数に対するそれぞれの反応物の内在値を定め、x軸およびy軸によって表される取込み速度に従ってグラフで示す。取込み速度の値が変化したので、シャドープライスがゼロになったときに、最適な反応ネットワークにおいて定性的変化がある。
【0083】
表現型位相面の1つの境界は、最適(LO)のラインとして定義される。このラインは、それぞれの代謝フラックス間の最適な関係を表す。LOは、x軸フラックスを変化させ、および増殖フラックスとして定義された目的関数で最適なy軸フラックスを算出することによって同定することができる。表現型位相面解析から、所望の活性が最適な条件を決定することができる。最大の取込み速度では、制約セットによって表される環境条件内における反応ネットワークで予測される結果であるプロットの有限領域の定義になる。プロットにおけるそれぞれの次元が異なる取込み速度に対応する多くの次元において、同種の解析を行うことができる。本発明のインシリコにおける酵母モデルを使用するシミュレーションの結果を解析するために、Edwardsら、Biotech Bioeng. 77: 27-36 (2002)に記載されているものなどの、位相面解析を使用するためのこれらの及び他の方法を使用することができる。
【0084】
また、酵母の生理機能は、フラックス分布を示すための反応地図を使用して決定することができる。酵母の反応地図は、種々のレベルにおいて反応ネットワークを考慮するために使用することができる。細胞の代謝反応ネットワークの場合、反応地図には、全体的展望を表す全ての反応補体を含むことができる。または、反応地図は、上記した反応サブシステムに対応する領域などの特定領域の代謝に、または個々の経路もしくは反応にも焦点を当てることができる。酵母の反応ネットワークの反応のサブセットを示す反応地図の例は、図4に示してある。
【0085】
また、本発明は、酵母生理機能の表現を産生する装置であって、表現は、次の工程を含むプロセスによって産生される装置を提供する:(a)複数の酵母反応物を複数の酵母反応と関係づけるデータ構造であって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物を、並びに該基質および該産物を関係づける化学量論係数を含むデータ構造を提供すること(b)複数の酵母反応のための制約セットを提供すること(c)目的関数を提供するこ(d)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定すること、および(e)1つまたは複数の酵母反応の活性の表現を産生すること。
【0086】
本発明の方法は、たとえば、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、補助因子の生合成、代謝産物の輸送、およびその他の炭素源の代謝を含む複数の酵母反応の活性を決定するために使用することができる。加えて、本方法は、上記した反応または表2において一覧を示した反応の1つまたは複数の活性を決定するために使用することができる。
【0087】
本発明の方法は、酵母変異体の表現型を決定するために使用することができる。1つまたは複数の酵母反応の活性は、上記した方法を使用して決定することができ、反応ネットワーク・データ構造は、酵母において起こる1つまたは複数の遺伝子に関連した反応を欠いている。または、酵母において天然に存在しない反応が、反応ネットワーク・データ構造に付加される場合、本方法は、1つまたは複数の酵母反応の活性を決定するために使用することができる。また、遺伝子の欠失は、反応を介したフラックスをゼロに制約することによって本発明のモデルにおいて表すことができ、これによって、反応がデータ構造内に残ることができる。したがって、シミュレーションは、酵母へ、もしくは酵母から、遺伝子を付加または除去することの効果を予測するために行うことができる。本方法は、特に末梢の代謝経路の反応を行う遺伝子産物をコードする遺伝子を付加または欠失することの効果を決定するために有効であり得る。
【0088】
薬物標的または酵母機能に影響を及ぼすその他のいかなる薬剤の標的も、本発明の方法を使用して予測することができる。このような予測は、薬物または薬剤による総合的な阻害または防止をシミュレートするための反応を除去することによって行うことができる。または、特定の反応の活性の部分的な阻害または減少は、制約を変更して本方法を行うことによって予測することができる。たとえば、活性の減少は、標的反応の代謝フラックスベクトルについてのαjまたはβj値を変更して、阻害レベルに対応する有限最大または最小フラックス値を反映することによって、本発明のモデルに導入することができる。同様に、反応を活性化する効果は、反応の活性を開始することもしくは増大することによって、特定の反応を欠いている反応ネットワーク・データ構造で本方法を行うことによって、または標的反応の代謝フラックスベクトルについてのαjもしくはβj値を変更して、活性化レベルに対応する有限最大もしくは最小フラックス値を反映することによって予測することができる。本方法は、特に末梢代謝経路の標的を同定するために有効であり得る。
【0089】
一旦、活性化または阻害のいずれが酵母機能に対する所望の効果を生ずるかについて反応が同定されると、酵母において反応を行う酵素もしくは巨大分子、または酵素もしくは巨大分子を発現する遺伝子を、薬物またはその他の薬剤の標的として同定することができる。本発明の方法によって同定される標的に対する候補化合物は、既知の方法を使用して単離または合成することができる。化合物を単離または合成するためのこのような方法は、たとえば、標的の既知の特性に基づいた合理的なデザイン(たとえば、DeCampら、Protein Engineering Principles and Practice, Ed. Cleland and Craik, Wiley-Liss, New York, pp. 467-506 (1996))、化合物のコンビナトリアル・ライブラリーに対して標的をスクリーニングすること(例えば、Houghtenら、Nature, 354, 84-86 (1991);Dooleyら、Science, 266, 2019- 2022 (1994)(これは、反復的なアプローチを記載する)、もしくは位置的精査アプローチを記載するR. Houghtenら、PCT/US91/08694および米国特許第5,556,762号を参照されたい)、または焦点をあてたライブラリーを得るための両方の組み合わせを含むことができる。当業者であれば、標的の特性または当該技術分野において既知の活性アッセイ法に基づいて、スクリーンに使用されるアッセイ条件を知っており、または日常的な方法で決定することができるであろう。
【0090】
候補薬物または候補物質が、上記した方法によって、または当該技術分野において既知のその他の方法によって同定されるかどうかは、本発明のインシリコにおける酵母モデルまたは方法を使用して確認することができる。酵母生理機能に対する候補薬物または候補物質の効果は、インビトロまたはインビボで測定される、候補薬物または候補物質の存在下における標的に対する活性に基づいて予測することができる。この活性は、反応における活性に対して測定される候補薬物または候補物質の効果を反映するように、モデルに反応を付加すること、モデルから反応を除去すること、またはモデルにおける反応の制約を調整することによってインシリコにおける酵母モデルを表すことができる。これらの条件下でシミュレーションを走らせることによって、酵母生理機能に対する候補薬物または候補物質の全体的効果を予測することができる。
【0091】
本発明の方法は、1つまたは複数の環境成分の効果または酵母の活性における条件を決定するために使用することができる。前述のように、交換反応は、環境的成分の取込み、環境への成分の放出、またはその他の環境要求に対応する反応ネットワーク・データ構造に付加することができる。環境成分または環境条件の効果は、環境成分または環境条件の効果に対応する、有限の最大または最小フラックス値を反映するように反応をターゲットする交換反応の代謝フラックスベクトルについて、αjまたはβj値を調整してシミュレーションすることによって、さらに調査することができる。環境成分は、たとえば酵母の環境に付加されたときに、吸収されおよび代謝され得る他の炭素源または代謝産物であることができる。また、環境成分は、例えば最少培地組成物に存在する成分の組み合わせであることができる。したがって、本方法は、酵母の特定の活性を支持することができる、最適なまたは最小の培地組成を決定するために使用することができる。
【0092】
本発明は、酵母の所望の活性を達成するための環境成分のセットを決定するための方法をさらに提供する。本方法は、以下の工程を含む;(a)複数の酵母反応物を複数の酵母反応と関係づけるデータ構造であって、酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに基質および産物を関係づける化学量論係数を含むデータ構造を提供すること(b)複数の酵母反応のための制約セットを提供すること(c)制約セットをデータ表現に適用し、これにより1つまたは複数の酵母反応の活性を決定すること(d)工程(a)〜(c)に従って1つまたは複数の酵母反応の活性を決定することを含み、この制約セットは、環境成分の上限または下限を含むこと、および(e)制約セットを変更して工程(a)〜(c)を繰り返すことを含み、段階(e)において決定される活性は、工程(d)において決定される活性と比較して改善されていること。
【0093】
以下の実施例では、本発明を具体的に説明するが、限定しないことが企図される。
【実施例】
【0094】
実施例I
酵母の代謝ネットワークの再構築
本実施例は、酵母の代謝ネットワークをどのように再構築することができるかについて示す。
【0095】
再構築プロセスは、図5に示したとおり、酵母の代謝についての現在の知識の包括的検索を基礎とした。反応データベースは、全ての既知の反応における存在、可逆性、局在、および補助因子要求についての利用可能なゲノムおよび代謝の情報を使用して構築した。さらに、非増殖依存性および増殖依存性のATP要求についての情報、並びにバイオマス組成物についての情報を使用した。
【0096】
この目的のために、種々のオンライン反応データベース、最近の出版物および総説論文(表5および9)、並びに確立された生化学教科書(Zubay, Biochemistry Wm.C. Brown Publishers, Dubuque, IA (1998); Stryer, Biochemistry W. H. Freeman, New York, N.Y. (1988))を調査した。酵母のハウスキーピング遺伝子およびこれらの機能についての情報は、3つの主要な酵母オンライン資源から得られた:
・MIPS包括的酵母ゲノム・データベース(CYGD)(Mewesら、Nucleic Acids Research 30(1): 31-34 (2002));
・サッカロマイセス・ゲノム・データベース(SGD)(Cherryら、Nucleic Acids Research 26(1): 73-9 (1998));
・酵母プロテオーム・データベース(YPD)(Costanzoら、Nucleic Acids Research 29(1): 75-9 (2001))。
【0097】
以下の代謝マップおよびタンパク質データベース(オンラインで利用できる)を調査した:
・遺伝子およびゲノム・データベースの京都百科事典(KEGG)(Kanehisaら、Nucleic Acids Research 28(1): 27-30 (2000));
・エキスパートタンパク質分析システム・データベースの生化学経路データベース(ExPASy)(Appelら、Trends Biochem Sci. 19(6): 258-260 (1994));
・統合ジェノミクスからのERGO(www.integratedgenomics.com)
・SWISS-PROTタンパク質配列データベース(Bairochら、Nucleic Acids Research 28(1): 45-48 (2000))
【0098】
表5は、酵母の代謝ネットワークの再構築のために調査したさらなる鍵となる参考資料の一覧を示す。
【0099】
(表5)


【0100】
全ての反応は、2つの主要なコンパートメントであるサイトゾルおよびミトコンドリアに局在しており、これは、酵母の大部分の一般的代謝反応が、これらのコンパートメントにおいて生じるためである。選択的に、1つまたは複数のさらなるコンパートメントを考慮することができる。インビボにおいてその他のコンパートメントに位置する反応、または局在に関しての情報を利用できなかった反応は、サイトゾルであるとみなした。全ての対応する代謝産物に適切な局在を割り当て、サイトゾルとミトコンドリアとの間のリンクは、既知の輸送およびシャトル系を介して、または代謝要求を満たすと推定された反応のいずれかを介して確立した。
【0101】
全ての代謝反応の初期構築の後、詳細な生化学問題の解について、リストを手動で調査した。多くの反応は、補助因子の利用を含むが、これらの反応の多くについては、補助因子要求がいまだ完全に解明されていなかった。たとえば、特定の反応が補助因子としてNADHだけもしくはNADPHだけを使用するか、または両方の補助因子を使用することができるかどうかは明らかではないが、その他の反応は、両方の補助因子を使用することが既知である。たとえば、ALD4によってコードされるミトコンドリア・アルデヒド脱水素酵素は、補助因子としてNADHおよびNADPHの両者を使用することができる(Remizeら、Appl Environ Microbiol 66(8): 3151-3159 (2000))。そのような場合、2つの反応は、再構築された代謝ネットワークに含まれる。
【0102】
酵母代謝の独特の特徴を保存するために、さらなる考慮をとり入れた。酵母は、酵素トランスヒドロゲナーゼをコードする遺伝子を欠いている。酵母における、アゾトバクタービネランジー由来の対応する遺伝子の挿入は、嫌気的条件下で特にその表現型の挙動に対して重大な影響を有する(Niessenら、Yeast 18(1): 19-32 (2001))。その結果、モデルにおいて最終的にトランスヒドロゲナーゼの効果を引き起こす反応は、ゼロに制約されるか、または不可逆的になるように強制した。たとえば、NADH依存性グルタミン酸デヒドロゲナーゼ(Gdh2p)によって行われるフラックスは、NADPH依存性グルタミン酸デヒドロゲナーゼ(Gdh1pおよびGdh3p)とのカップリングを介して最終的にトランスヒドロゲナーゼ活性が現れるのを避けるためにゼロに制約した。
【0103】
一旦、第一世代のモデルが調製されると、グルコースを唯一の炭素源として使用する継続的培養における嫌気性または好気性増殖などの、特異的なシナリオについて微生物の挙動をモデル化することができる。次いで、モデリング結果を実験結果と比較することができる。モデリングと実験の結果が一致している場合、モデルは、適切であるとみなすことができ、これは、酵母の挙動をさらにモデリングするため、および予測するために使用される。モデリングと実験の結果が一致していない場合、欠損した反応または誤った反応を決定するために、モデリングと実験の結果が一致するまで、モデルを評価し、再構築プロセスを洗練しなければならない。この反復プロセスを図5に示し、下記に例示してある。
【0104】
実施例II
P/O比の計算
本実施例は、P/O比を算出するために、どのように酵母のゲノムスケールで再構築された代謝モデルを使用するかを示し、これにより好気的呼吸の効率を測定する。P/O比は、電子伝達系(ETS)に供与される電子対あたりに産生されるATP分子の数である。
【0105】
線形最適化を適用し、インシリコにおけるP/O比は、まず電子伝達系(ETS)を介してグルコース分子あたりに産生されるATP分子の最大数を決定し、次いで理論的関係(すなわち、P/O比1.5の酵母において、18個のATP分子が産生される)を使用してインシリコにおけるP/O比を補間することによって算出した。
【0106】
単離されたミトコンドリアの実験的研究では、酵母が部位Iプロトン輸送を欠いていることを示した(Verduynら、Antonie Van Leeuwenhoek 59(1): 49-63 (1991))。したがって、ETS単独での最大の理論的または「機械的」収率の推定では、グルコースでの酵母増殖におけるNADH酸化についてP/O比1.5を与える(Verduynら、上記(1991))。しかし、実験的測定に基づいて、最終的なインビボにおけるP/O比は、ほぼ0.95であると決定されている(Verduynら、上記 (1991))。この相違は、ミトコンドリア膜貫通プロトン勾配の使用には、ミトコンドリア内膜を超えるピルビン酸のプロトン結合転位などの代謝交換を駆動することが必要なためであると一般に考えられている。脂質二重層にプロトンが難溶解性であることを考えると、プロトン(または、プロトン漏出)の単純な拡散は驚くべき既知の事実であるが、プロトン漏出は、ミトコンドリア内膜を超えて比較的高い電気化学的勾配であることにより、低いP/O比に関与すると考えられる(Westerhoff および van Dam, Thermodynamics and control of biological free-energy transduction Elsevier, New York, N.Y. (1987))。
【0107】
再構築されたネットワークを使用すると、P/O比は、電子伝達系(ETS)(YATP,max=12.5 インシリコにおけるETSを経たATP分子/グルコース分子)を介してグルコース分子あたりに産生されるATP分子の最大数を決定するためのモデルを最初に使用することにより、グルコースでの増殖におけるNADHの酸化反応について1.04であると算出された。次いで、インシリコにおけるP/O比を、理論的関係(すなわち、P/O比が1.5であるときに、グルコース分子あたり18個のATP分子が、理論的に産生される)を使用して補間した。算出されたP/O比は、実験的に決定された値の0.95に近いことが見出された。しかし、プロトン漏出は、モデルに含まれておらず、P/O比の低下の主な理由は、ミトコンドリア内膜を超える溶質移行のためのプロトン勾配の使用によるものであることを示唆する。ミトコンドリア膜を超える溶質の輸送のためのプロトン勾配の使用が、操作上P/O比に有意に関与するので、この結果は、解析に、完全な代謝ネットワークを含むことの重要性を例示する。
【0108】
実施例III
表現型位相面解析
本実施例は、生物を多くの反応の活性における変異の関数として示すことができる特徴的な表現型の範囲を算出するために、どのように酵母代謝モデルを使用することができるかを示す。
【0109】
この解析のためには、O2およびグルコースの取込み速度を、二次元空間の2本の軸として定義した。最適なフラックス分布は、線形プログラミング(LP)問題を繰り返し解き、一方で二次元空間を定義する交換フラックスを調整することによって、この面の全ての点についてのLPを使用して算出した。有限数の量的に異なる代謝経路利用パターンを面において同定し、これらの領域を画定するためにラインを描いた。表現型位相面(PhPP)の1つの境界線は、最適(LO)なラインとして定義され、それぞれの代謝フラックス間の最適な関係を表す。LOは、増殖フラックスとして定義される目的関数について、x軸(グルコース取込み速度)を変化させ、最適なy軸(O2取込み速度)を算出することによって同定した。位相面解析に関するさらなる詳細は、Edwardsら、Biotechnol. Bioeng. 77: 27-36 (2002)およびEdwardsら、Nature Biotech. 19: 125-130 (2001))において提供される。
【0110】
図6に図示したように、酵母 PhPPは、8つの異なった代謝表現型を含む。それぞれの領域(P1-P8)は、次のように要約することができる独特な代謝経路利用を示す:
【0111】
最も左の領域は、化学量論的限界による、いわゆる「実行不可能な」PhPPの定常状態領域である。
【0112】
左から右に:
【0113】
P1:増殖は、完全に好気的である。増殖要求を補助するためのグルコースの酸化的代謝を完了するために、十分な酸素を利用できる。この帯域は、無益なサイクルを表す。代謝の副生成物としてCO2のみが形成される。増殖速度は、領域P2の最適の増殖速度よりも遅い。P1の上限は、炭素が完全に酸化されて過剰な電子受容体を除去し、したがって、バイオマスを生成できない点の座位を表す。
【0114】
P2:酸素がわずかに限定され、酸化的代謝によって全ての生合成補助因子要求を最適に満たすことができるというわけでない。基質レベルのリン酸化を経たさらに高エネルギーのリン酸結合を可能にする代謝副生成物として、アセテートが形成される。O2供給の増加により、アセテート形成は最終的にゼロに減少する。
【0115】
P3:酸素摂取速度の増加により、酢酸が増大され、ピルビン酸が減少する。
【0116】
P4:酸素摂取速度の増加により、ピルビン酸が増大し始め、酢酸が減少する。エタノール産生は、最終的にゼロに減少する。
【0117】
P5:酢酸形成に向けたフラックスが増大し、エタノール産生が減少している。
【0118】
P6:酸素供給量を増大すると、酢酸形成が増大して、エタノール産生が減少し、炭素は酢酸の産生に向けらる。コハク酸塩産生の他に、リンゴ酸(malate)も、代謝副生成物として産生されるであろう。
【0119】
P7:酸素供給量は、非常に低く、エタノール産生は高く、コハク酸塩産生は、減少する。アセテートは、比較的低レベルで産生される。
【0120】
P8:この領域は、Y軸に沿っており、酸素供給量はゼロである。この領域では、完全に嫌気性の発酵を表す。エタノールおよびグリセロールは、代謝副生成物として分泌される。NADHを消耗するグリセロール形成の役割は、嫌気的条件下でサイトゾル酸化還元バランスを維持することである(Van Dijken and Scheffers Yeast 2(2): 123-7 (1986))。
【0121】
最適なライン:代謝的には、最適なライン(LO)は、基質の利用性に制限を伴わない代謝経路の最適な利用を表す。酸素/グルコース表現型位相面ダイアグラムにおいて、LOは、酵母代謝ネットワークにおける最適の好気的グルコース限定増殖を表し、培養プロセスにおける基質の完全な酸化のために無制限に酸素を供給することによってバイオマスを産生する。したがって、最適なラインは、発酵副生成物の分泌を伴わない完全な呼吸代謝を表し、無益なサイクルのフラックスはゼロに等しい。
【0122】
したがって、この実施例は、酵母の最適な発酵パターンを決定するため、並びに異なる酸素化条件およびグルコース取込み速度下で蓄積される有機副産物のタイプを決定するために、位相面解析を使用することができることを証明する。
【0123】
実施例IV
最適なラインおよび呼吸商の計算
本実施例は、酸素摂取率(OUR)、二酸化炭素発生率(CER)、およびOURを超えるCERの割合である呼吸商(RQ)を算出するために、どのように酵母代謝モデルを使用することができるかを示す。
【0124】
酸素摂取率(OUR)および二酸化炭素発生率(CER)は、発酵プロセスの間の酵母代謝活性の直接的な指標である。RQは、細胞数からは独立している鍵となる代謝パラメータである。図7に図示したように、酵母が最適のラインLOに沿って増殖する場合、その増殖は、最適な好気的割合であり、全ての炭素源がバイオマス形成に向けられており、CO2を除いて、分泌される代謝の副生成物はない。LOに沿って算出されたRQは、1.06の一定値であり;P1領域のRQは、1.06未満であり;および酵母PhPPの残りの領域のRQは、1.06よりも大きい。RQは、細胞の増殖および代謝を決定するために、並びに最適なバイオマス産生のためにグルコース供給を制御するために、何十年も使用されてきた(Zengら、Biotechnol. Bioeng. 44: 1107-1114 (1994))。実験的に、何人かの研究者は、最適なRQとして1.0(Zigova, J Biotechnol 80: 55-62 (2000). Journal of Biotechnology)、1.04(Wangら、Biotechnol & Bioeng 19: 69-86 (1977))、および1.1(Wangら、Biotechnol. & Bioeng. 21: 975-995 (1979))の値を提唱しており、最も多い酵母バイオマスを得ることができるように、供給バッチにおいて維持されるか、または酵母バイオマスを継続的に産生すべきである(Dantignyら、Appl. Microbiol. Biotechnol. 36: 352-357 (1991))。したがって、代謝モデルによる酵母増殖に最適なラインに沿った一定のRQは、発酵産業からのオンラインでの測定を介したRQの実験的公式と一致している。
【0125】
実施例V
コンピュータシミュレーション
本実施例は、酵母PhPPによって記載された代謝表現型の変更についてのコンピュータシミュレーションを示す。
【0126】
酸素供給速度を、完全に嫌気的から完全に好気的条件の範囲で変化して(1g細胞1時間あたり0〜20mmolの範囲で酸素摂取速度を増加する)、区分的に直線的に増大する関数を使用した。これらの計算のために、1g(乾燥重量)1時間あたり5mmolのグルコースのグルコース取込み速度を任意に選択した。図8Aに示すように、インシリコにおける酵母株のバイオマス収量は、P8からP2に増大することが示され、LOにおいて最適になる。次いで、収率はP1(無益サイクル領域)においてゆっくり落ち始めた。同時に、RQ値は、酸素消費速度の増大に関連して減少し、LO1において1.06の値に達し、次いで、さらに1未満に減少する。
【0127】
図8Bは、代謝副生成物;エタノール、コハク酸塩、ピルビン酸、およびアセテートの分泌速度を示し、酸素摂取率の変化は、g(乾燥重量)-時間につき0〜20mmolの酸素である。これらの副生成物のそれぞれは、それぞれの領域において基本的に異なる方法で分泌される。酸素がP7において0から増大すると、グリセロール産生(この図にはデータ示さず)は減少し、エタノール産生は増大する。アセテートおよびコハク酸塩も分泌される。
【0128】
実施例VI
ケモスタット培養における表現型挙動のモデリング
本実施例は、どのように酵母代謝モデルを使用して、特異的な産物収率または生産力などの発酵性能を最適化する最適なフラックス分布を予測できるかを示す。特に、この実施例では、どのようにフラックスに基づいた解析を使用して、嫌気的および好気的な条件下での連続培養において、グルコース中で増殖する酵母のグルコース取込み速度を最小化する条件を決定することができるかを示す。
【0129】
連続培養において、増殖速度は、希釈率に対応しており、一定値に保たれる。酵母の連続培養の計算は、インシリコにおける増殖速度を実験的に決定された希釈率に固定して、グルコース取込み速度を最小化することによって行った。この公式は、固定したグルコース取込み値が与えられるバイオマス生産を最大にすることに等しく、連続培養増殖条件をシミュレートするために使用した。さらに、1mmol/gDWの非増殖依存性ATP維持、全身的P/O比1.5(Verduynら、Antonie Van Leeuwenhoek 59(1): 49-63 (1991))、23.92mmolのATP/gDWの重合費用、および0.51gDW/hのバイオマス収率であるとシミュレートされる35.36mmolのATP/gDWの増殖依存性ATP維持が想定される。後の2つの用語の和は、ゲノム-スケール代謝モデルのバイオマス方程式に含まれる。
【0130】
酵母の最適な増殖特性を、0.1〜0.4時間-1の間で変動する希釈率で、嫌気的グルコース限定連続培養下で算出した。次いで、計算された副生成物分泌速度を実験データと比較した(Nissenら、Microbiology 143(1): 203-18 (1997))。算出したグルコースの取込み速度、並びにエタノール、グリセロール、コハク酸塩、およびバイオマスの産生は、独立して得られた実験データによく一致する(図9)。比較的低いと観察されたアセテートおよびピルビン酸の分泌速度は、これらの代謝産物の放出が、ネットワークの最適の解を改善しなかったので、インシリコのモデルによっては予測されない。
【0131】
実験的レベルにおいてピルビン酸およびアセテートをさらに分泌するようにインシリコモデルを制約し、これらの付加的な制約下で最適の解を再計算することが可能である。測定したグルコース取込み速度により近い値を生じた(図9A)。この手順は、反復的なデータ駆動制約に基づいたモデリングアプローチの例であり、インシリコモデルを改善するために実験データの逐次取り込みを使用する。全体の増殖収量を記載する能力の他に、本モデルは、どのように代謝が作動するかをさらに洞察できる。嫌気増殖条件における代謝フラックスのさらなる解析から、グルコース-6-リン酸デヒドロゲナーゼを介したフラックスは、0.1時間-1の希釈率のグルコース取込み速度で5.32%であることが見出され、これは、細胞が発酵性代謝において操作されたときの、このフラックスについての実験的に決定された値(6.34%)と一致している(Nissenら、Microbiology 143(1): 203-218 (1997))。
【0132】
また、酵母における最適な増殖特性を、クラブツリー効果が重要な役割を果たす好気的なグルコース限定の連続培養下で算出した。酵母のクラブツリー効果の基礎をなしている分子機序は知られていない。しかし、クラブツリー効果の調節の特徴(van Dijkenら、Antonie Van Leeuwenhoek 63(3-4): 343-52 (1993))は、実験的に決定された増殖速度依存的な最大酸素摂取速度として、インシリコモデルに含めることができる(Overkampら、J. of Bacteriol 182(10): 2823-30 (2000))。このさらなる制約により、および上記の通りに恒成分培養槽における増殖を公式化することによって、インシリコにおけるモデルでは、好気的グルコース限定の持続的条件下における、呼吸商、グルコース取込み、エタノール、CO2、およびグリセロール分泌速度についての定量的予測を作成する(図10)。
【0133】
実施例VII
S. Cerevsiaeの中心的代謝に含まれる遺伝子の欠失の解析
本実施例は、ネットワークにおける個々の反応の欠失の効果を決定するために、どのように酵母代謝モデルを使用することができるかを示す。
【0134】
遺伝子の欠失は、インシリコにおいて、特異的な遺伝子に対応するフラックス(類)をゼロに制約することによって行った。増殖に対する単一遺伝子の欠失の影響は、グルコース、アミノ酸、並びにプリンおよびピリミジンを含む合成完全培地における増殖をシミュレートすることによって解析した。
【0135】
インシリコにおける結果を、Saccharomyces・ゲノム・データベース(SGD)(Cherryら、Nucleic Acids Research 26(1): 73-79 (1998))によって、および包括的酵母ゲノム・データベース(Mewesら、Nucleic Acids Research 30(1): 31-34 (2002))によって供給される実験結果と比較した。考慮した全ての場合の85.6%(583のうちの499の場合)において、インシリコにおける予測が実験結果と定性的に一致した。これらの結果の評価は、実施例VIIIに見出すことができる。中心的代謝について、種々の実験的条件下で増殖を予測し、インシリコにおける予測の81.5%(114のうちの93の場合)がインビボにおける表現型と一致した。
【0136】
表6は、酵母の増殖に対する遺伝子の欠失の影響を示す。炭素源としてのグルコースを有する定義された完全培地、および炭素源としてグルコース、エタノール、またはアセテートを有する最少培地を含む種々の培地における増殖を考慮した。表6の完全参考資料の引用は、表9に見出すことができる。
【0137】
したがって、この実施例は、従来の遺伝研究を増強および包囲するために必須の遺伝子を明らかにするために、インシリコモデルを使用することができることを証明する。
【0138】
(表6)


+/- 増殖/増殖しない
# アイソザイムPyk2pは、グルコース抑制性であり、グルコースにおける増殖を持続することができない。
* モデルは、(非常に)増殖が遅延する、単一欠損変異体を予測する。
$ 単一欠損変異体の増殖は、グルコースによって阻害される。
& Pgilp欠損変異株がグルコースにおいて増殖しないのかについて、種々の仮説が存在し、たとえば、酵母におけるペントースリン酸経路は、増殖を持続するには不十分であり、十分な量のフルクトース-6-リン酸およびグリセルアルデヒド-3-リン酸をEMP経路に供給することができない(Boles, 1997)。
|| アイソザイムGpm2pおよびGpm3pは、グルコースにおける増殖を維持することができない。これらは、これらが外来プロモーター(Heinischら, 1998)から発現されるときに、残存性のインビボ活性を示すだけである。
## Gnd1pは、酵素活性の80%を占める。GND1における欠損変異体は、細胞に対して毒性があるグルコナート-6-リン酸を蓄積する(Schaaff-GerstenschlagerおよびMiosga , 1997)。
$$ ENO1は、糖新生の中心的役割を演ずるが、ENO2は、解糖において使用される(MulllerおよびEntian, 1997)。
【0139】
実施例VIII
酵母の大規模な遺伝子欠損解析
インシリコにおける酵母の遺伝子欠損の大規模な評価を、ゲノム規模代謝モデルを使用して行った。細胞生存率に対する599の単一遺伝子欠損の効果をインシリコにおいてシミュレートして、公表された実験結果と比較した。526の場合(87.8%)において、インシリコにおける結果は、合成完全培地における増殖をシミュレートしたときの実験的観察と一致した。89.4%(555中496)において、生存可能な表現型が予測され、致死的表現型は、考慮した場合の68.2%(44中30)において、正しく予測される。
【0140】
失敗モードは、インシリコモデルにおいて可能性のある4つの不適切なものについて、個別に解析した:1)不完全な培地組成物;2)代用可能なバイオマス成分;3)不完全な生化学情報;および4)調節不能。この解析では、多くの偽予測を除去し、多くの実験的に調査可能な仮説を示唆した。したがって、酵母におけるゲノム規模のインシリコモデルは、系統的に既存のデータを再調整して、生物についての知識ギャップを埋めるために使用することができる。
【0141】
完全培地における増殖を好気的条件下でシミュレートした。完全培地の組成物は、通常詳細には知られていないので、グルコース、20アミノ酸(アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、スレオニン、トリプトファン、チロシン、バリン)、並びにプリン(アデニンおよびグアニン)およびピリミジン(シトシンおよびチミン)を含む合成完全培地をモデリングの目的で定義した。さらに、アンモニア、リン酸、および硫酸を供給した。最初に、インシリコにおける結果を競合増殖アッセイ法からの実験データ(Winzelerら、Science 285: 901-906 (1999))、MIPSおよびSGDデータベースから利用できるデータ(Mewesら、Nucleic Acids Research 30(1): 31-34 (2002); Cherryら、Nucleic Acids Research 26(1): 73-79 (1998))と比較した。遺伝子欠損は、対応する反応を介したフラックスをゼロに制約し、以前に記載したとおりに(Edwards and Palsson, Proceedings of the National Academy of Sciences 97(10): 5528-5533 (2000))増殖を最適化することによってシミュレートした。この解析においては、生存可能な表現型は、全ての定義されたバイオマス要求を満たし、したがって成長することができる株として定義した。野生型シミュレーションと比較して増殖速度が減少された単一遺伝子の欠損変異体は、増殖遅延変異体と称する。
【0142】
実験データの解析は、3つの工程においてアプローチした:
・上記の合成培地を使用する初期のシミュレーションを、シミュレーション1と称した。
・その後、偽予測が、反応の欠失、反応の可逆性、調節イベント、および合成完全培地における基質の欠失などの、インシリコモデルにおける不完全な情報のためであるかどうか決定するために、シミュレーション1における偽予測を調査した。シミュレーション2においては、このような任意の付加情報をインシリコモデルに導入し、インシリコ表現型がそのインビボ表現型と一致していない遺伝子欠損変異体について、増殖を再シミュレートした。
・第3のシミュレーションは、行き止まりの経路(すなわち、全体的ネットワークにさらに接続されなかった細胞内代謝産物を導く経路)を解析から排除した(シミュレーション3)。
【0143】
酵母の生存率に対する単一遺伝子欠損の効果を、599の単一遺伝子の欠損変異体の各々について調査した。インシリコにおける結果を4群に分類した:
1.真の陰性(正しく、致死的表現型を予測した);
2.偽陰性(不当に、致死的表現型を予測した);
3.真の陽性(正しく、生存可能な表現型を予測した);
4.偽陽性(不当に、生存可能な表現型を予測した)。
【0144】
シミュレーション1において、シミュレートした599の表現型のうちの509(85%)は、実験データと一致した。シミュレーション1において増殖を遅延させる遺伝子の数は、19と計数され、驚くほど少数であった。TPI1の欠失の1つの欠失だけが、増殖速度に対して非常に影響を有した。実験的に、TPI1の欠失は、致死的である(Ciriacy and Breitenbach, J Bacteriol 139(1): 152-60 (1979))。インシリコにおいてtpi1変異体は、野生型の17%と同程度の低い比増殖率を維持することができただけである。ミトコンドリアATPaseの欠失が、ほぼ90%の野生型の比増殖率を生じたことを除いて、増殖を遅延させるその他の全ての欠失は、ほぼ99%の野生型増殖を維持した。
【0145】
偽予測が以下によって説明することができるかどうかを個別に決定するために、シミュレーション1の予測を評価した:
1.シミュレーションに使用される培地組成;
2.シミュレーションに使用されるバイオマス組成;
3.不完全な生化学情報;および、
4.遺伝子調節の効果。
【0146】
これらの起こりうる失敗モードに基づくシミュレーション1からの偽予測の解析では、599のうちの526(87.8%)が正しく予測される表現型となるモデル修飾、すなわちシミュレーション2を生じた。
【0147】
シミュレーション3は、行き止まり経路に関与する再構築したネットワークにおける220の反応のいくつかを明らかにした。ゲノム規模代謝のフラックス・バランス・モデルから、これらの反応およびこれらの対応する遺伝子を除去することにより、シミュレーション3では、530のうちの473(89.6%)が正しく予測された表現型を生じ、その91.4%が真に陽性であり、69.8%は、真に陰性の予測である。
【0148】
表7は、生存率に対するインシリコにおける酵母の単一遺伝子欠損の効果の大規模な評価の概要を提供する。
【0149】
(表7)

【0150】
インシリコ欠損研究で使用した全ての遺伝子の包括的リストおよび解析の結果を表8に提供してある。表8は、真の陰性、偽陰性、真の陽性、および偽陽性の予測のカテゴリーに従って構成される。最初に偽予測(シミュレーション1)と一致した、INO1などの遺伝子を、灰色の四角で強調したが;偽予測の評価およびシミュレーション2では、これらの場合を真の予測であると同定した。TRR2などの白四角のORFsまたは遺伝子は、対応する反応が、行き止まり経路の工程を触媒したので、シミュレーション3において除外した。
【0151】
(表8)

【0152】
以下の文章には、実行したシミュレーション1の初めの偽予測の解析が、シミュレーション2の結果になることを記載する。
【0153】
シミュレーション結果に対する培地組成の影響:
かなり単純な合成完全培地組成をシミュレーション1のために選択した。インシリコにおける培地は、主成分としてグルコース、アミノ酸、およびヌクレオチドのみを含んだ。しかし、実験目的のために使用されることが多い完全培地、たとえば酵母抽出物およびペプトンを含むYPD培地は、通常知られていない多くのその他の成分を含む。
【0154】
偽陰性予測:以下の欠損変異体の表現型:ecm1Δ、yil145cΔ、erg2Δ、erg24Δ、fas1Δ、ura1Δ、ura2Δ、ura3Δ、およびura4Δは、シミュレーション1において致死であると偽予測された。シミュレーション2では、特異的な基質をのさらに補充することにより、インシリコにおいて生存可能な表現型を救出することができ、補充された基質が複合培地の一部であるとみなされ得るので、本予測は、シミュレーション2において真の陽性の予測としてみなした。たとえば、Ecm1およびYil145cは、パントテナート合成に関与する。Ecm1は、2-オキソ吉草酸からのデヒドロパントアートの形成を触媒し、Yil145cは、β-アラニンおよびパントアートからのパントテナート合成の最終ステップを触媒する。インビボにおいて、ecm1Δ、およびyil145cΔ変異体は、増殖のためにパントテナートを要求する(Whiteら、J Biol Chem 276(14): 10794-10800 (2001))。インシリコにおいて、合成完全培地にパントテナートを供給することによって、本モデルは、生存可能な表現型を予測し、増殖速度は、インシリコにおける野生型酵母と同じであった。
【0155】
同様に、その他の偽予測は、培地組成に由来し得る:
・ERG2またはERG24を欠失する変異体は、エルゴステロールの栄養要求体である(Silveら、Mol Cell Biol 16(6): 2719-2727 (1996); Bourotおよび Karst, Gene 165(1): 97-102 (1995))。エルゴステロールを補充した合成完全培地における増殖をシミュレートすることによって、本モデルは、正確に生存可能な表現型を予測することができた。
・適切な量の脂肪酸が提供されない限り、FAS1(脂肪酸合成酵素)の欠失は致死的であり、培地への脂肪酸の添加によって、生存可能な表現型が予測された。
・URA1、URA2、URA3、またはURA4を欠失する株は、ウラシルの栄養要求体であり(Lacroute, J Bacteriol 95(3): 824-832 (1968))、培地にウラシルを供給することによって本モデルは増殖を予測した。
【0156】
上記の場合、最初に偽陰性予測であり、シミュレーション2では、これらの場合が、正しく培地組成を調整することによって陽性に予測されることを証明した。
【0157】
偽陽性予測:シミュレーション1にも、真の陰性として、または真の陽性とみなされる可能性のある偽陽性予測を含めた。競合増殖アッセイ法による実験結果に反して(Winzelerら、Science 285: 901-906 (1999))、ADE13を欠失する変異体では、低濃度のアデニンを補充した富栄養培地において、インビボで生存可能であるが、十分に増殖しない(Guetsovaら、Genetics 147(2): 383-397 (1997))。インシリコにおいて、合成完全培地にアデニンを供給した。アデニンを供給しないことにより、致死的変異体が予測された。したがって、この場合は、真の陰性を予測するとみなした。
【0158】
グルタミン合成酵素(アンモニアからグルタミンを産生する唯一の経路)をコードするGLN1の欠失も、同様の場合であった。したがって、gln1Δ変異体は、グルタミン栄養要求体である(Mitchell, Genetics 111(2): 243-58 (1985))。複合培地において、グルタミンは、特に加圧減菌の間に、グルタメートに脱アミノ化される可能性が高い。したがって、複合培地は、微量のグルタミンのみを含む可能性が高く、したがって、gln1Δ変異体は、生存可能でない。しかし、インシリコにおいて、グルタミンを完全合成培地に供給すると、増殖が予測された。合成完全培地にグルタミンを供給しないことによって、本モデルは、致死的表現型を予測し、真の陰性予測を生じる。
【0159】
Ilv3およびIlv5は、両者とも分岐アミノ酸の代謝に関与する。ILV3またはILV5の欠失は、対応するアミノ酸の供給によって救出することができると予想される。これについては、本モデルでは増殖を予測した。しかし、矛盾する実験データが存在する。競合増殖アッセイ法において、致死表現型が報告された。しかし、以前の実験では、完全合成培地に関して、イソロイシンおよびバリンが培地に補充されたときに、ilv3Δおよびilv5Δ変異体は、増殖を維持することができることを示した。それゆえに、これらの2つの場合は、真に陽性の予測であるとみなされた。
【0160】
バイオマス方程式の定義の影響
ゲノム規模代謝モデルは、バイオマス組成物の形で増殖要求を含む。増殖は、アミノ酸、脂質、ヌクレオチド、炭水化物、その他などの、バイオマスを形成するための構成要素の排出として定義される。バイオマス成分数は、44個である(表1を参照)。これらの構成要素は、細胞成分の形成のために必須であり、これらは、インシリコでのシミュレーションにおける増殖のための固定要求として使用されていた。したがって、それぞれのバイオマス成分は、代謝ネットワークによって産生されなければならず、そうでなければ生物をインシリコにおいて増殖させることができなかった。インビボにおいて、元のバイオマス前駆体または構成要素を産生することができないが;その他の代謝産物は、これらの初期の前駆体または構成要素を置換することができる、欠損変異体を見出すことが多い。それゆえに、多くの株については、この理由のために間違った表現型がインシリコで予測された。
【0161】
ホスファチジルコリンは、ホスファチジルエタノールアミンから3つのメチル化工程によって合成される(DickinsonおよびSchweizer, The metabolism and molecular physiology of 酵母 Taylor & Francis, London; Philadelphia (1999))。ホスファチジルエタノールアミンからのホスファチジルコリンの合成の第一工程では、CHO2によってコードされるメチルトランスフェラーゼによって触媒され、後の2つの工程では、OPI3によってコードされるホスホリピド・メチルトランスフェラーゼによって触媒される。CHO2またはOPI3を欠失する株は、生存可能であるが(Summersら、Genetics 120(4): 909-922 (1988); Daumら、Yeast 14(16): 1471-1510 (1998));いずれの無発現変異体も、標準的な条件下でモノ-およびジメチル化されたホスファチジルエタノールアミンを蓄積し、非常に減少したホスファチジルコリンのレベルを示す(Daumら、Yeast 15(7): 601-614 (1999))。それゆえに、ホスファチジルエタノールアミンは、バイオマス成分としてのホスファチジルコリンを置換することができる。インシリコにおいて、ホスファチジルコリンは、バイオマス形成のために必要である。上記Daumら、(1999)は、cho2Δ変異体においても少量のホスファチジルコリンを検出したので、ホスファチジルコリン合成のための代賛経路がモデルに欠けているかどうかをさらに推測してもよい。しかし、代賛経路は、インシリコモデルに含まれなかった。
【0162】
ERG3、ERG4、ERG5、またはERG6のエルゴステロール生合成経路における欠失は、インビボで生存可能な表現型になる。前者の2つの株は、エルゴスタ-8,22,24(28)-トリエン-3-β-オールを蓄積するが(Bardら、Lipids 12(8): 645-654 (1977); Zweytickら、FEBS Lett 470(1): 83-87 (2000))、後の2つは、エルゴスタ-5,8-ジエン-3-β-オール(Hataら、J Biochem (Tokyo) 94(2): 501-510 (1983))、またはチモステリン並びに小量のコレスタ-5,7,24-トリエン-3-β-オールおよびコレスタ-5,7,22,24-トリエン-3-β-オール(上記Bardら、(1977); Parksら、Crit Rev Biochem Mol Biol 34(6): 399-404 (1999))をそれぞれ蓄積する(バイオマス方程式には含まれなかった成分)。
【0163】
以下の3つの遺伝子の欠失は、偽陽性の予測となる:RER2、SEC59、およびQIR1。前者の2つは、グリコプロテイン合成に関与し、後者は、キチン代謝に関与する。キチンおよびグリコプロテインは、バイオマス成分である。しかし、単純化するために、どちらの化合物も、バイオマス方程式において考慮しなかった。バイオマス方程式へのこれらの化合物の算入により、予測結果が改善されるであろう。
【0164】
不完全な生化学情報
多くの遺伝子欠損変異体(inm1Δ、met6Δ、ynk1Δ、pho84Δ、psd2Δ、tps2Δ)については、シミュレーション1により、上記で考察した二つの理由のいずれかによって、または遺伝子調節の欠損によって(下記参照)説明することができない偽予測を生じる。公表された文献からの生化学データの広範な調査を含む代謝ネットワークのさらなる調査では、いくらかの情報が、インシリコモデルにおいて最初は欠損していたか、または情報が単に利用できなかったことを示した。
【0165】
Inm1は、イノシトール1-リン酸からイノシトールへのイノシトール生合成の最後の工程を触媒する(Murray およびGreenberg, Mol Microbiol 36(3): 651-661 (2000))。INM1を欠失させると、実験的に観察された生存可能な表現型に反して、モデルでは、即座に致死的表現型を予測した。INM1の機能に取って代わるであろうIMP2によってコードされるアイソザイムは、最初にモデルに含まれておらず、これを付加することにより、適切な予測になる。しかし、inm1Δimp2Δインビボ二重欠損変異体は、イノシトール栄養要求体でない(Lopezら、Mol Microbiol 31(4): 1255-1264 (1999))。それゆえに、イノシトール産生のためのその他の経路がおそらく存在するであろうと思われる。包括的な生化学知識が不足しているため、イノシトール生合成に対する効果およびイノシトール生合成遺伝子の欠失株の生育性を説明することができない。
【0166】
Met6Δ変異体は、メチオニン栄養要求体であり(Thomas およびSurdin-Kerjan, Microbiol Mol Biol Rev 61(4): 503-532 (1997))、増殖は、メチオニンまたはS-アデノシル-L-メチオニンの供給によって維持されるであろう。インシリコにおける増殖は、メチオニンの付加によっても、またS-アデノシル-L-メチオニンの付加によっても、維持されなかった。代謝ネットワークの調査により、MET6の欠失は、5-メチルテトラヒドロ葉酸を使用するための唯一の可能性を欠失させることに相当することが示された。それゆえに、モデルは、一定の情報を欠いていると思われる。炭素転移が、5-メチルテトラヒドロ葉酸の代わりに5-メチルテトラヒドロプテロイルトリ-L-グルタメートを使用して行われている可能性もあろう。このようなバイパスの完全な経路は、ゲノム規模モデルに含まれていなかった。
【0167】
Ynk1pの機能は、ヌクレオシド二リン酸からのヌクレオシド三リン酸の合成である。YNK1Δ変異体は、10分の1に減少したYnk1p活性を有しており(Fukuchiら、Genes 129(1): 141-146 (1993))、これは、第2のヌクレオシド二リン酸キナーゼが存在することを示す特性を有するゲノムのORFがない場合であっても、ヌクレオシド三リン酸または第2のヌクレオシド二リン酸キナーゼを産生するためのいずれかの代替経路が存在することを意味する。ヌクレオシド三リン酸を産生するためのその他の経路は、現在知られておらず(上記Dickinsonら、(1999))、したがって、本モデルには含まれておらず、それゆえに、偽陰性予測であった。
【0168】
PHO84は、本モデルに含まれる唯一のリン酸輸送体である高親和性リン酸輸送体をコードする。しかし、少なくとも2つのその他のリン酸輸送体、第2の高親和性およびNa+依存性の輸送体Pho89、並びに低親和性輸送体が存在する(Perssonら、Biochim Biophys Acta 1422(3): 255-72 (1999))。これらの輸送体を排除するために、致死的なpho84□変異体を予測した。PHO89および第3のリン酸輸送体を含むことにより、本モデルは、生存可能な欠損変異体を予測した。
【0169】
PSD2の無発現変異体では、ホスファチジルセリンからのホスファチジルエタノールアミン合成は、ミトコンドリアに位置するPsd1に位置する(Trotterら、J Biol Chem 273(21): 13189-13196 (1998))。ホスファチジルセリンは、ミトコンドリアに輸送することができ、ホスファチジルエタノールアミンは、ミトコンドリアから輸送することができると仮定された。しかし、ホスファチジルエタノールアミンの輸送およびミトコンドリア膜上のホスファチジルセリンは、最初に本モデルに含まれていなかった。ゲノムスケールフラックス・バランス・モデルにこれらの輸送体を付加することにより、インシリコにおいてPSD2欠損変異体を増殖させることができた。
【0170】
TPS2を欠失する株は、グルコースで増殖した場合に生存可能なことが示された(Bellら、J Biol Chem 273(50): 33311-33319 (1998))。Tps2pによって行われる反応は、必須のものとして、トレハロース6-リン酸からのトレハロース合成の最終工程としてモデル化した。しかし、インビボにおいて生存可能な表現型は、その他の酵素が、Tps2pによるトレハロース6-リン酸のトレハロースへの加水分解と取って代わることができることを示す(Bellら、上記 (1998))。対応する遺伝子(類)は、現在知られていない。トレハロース形成の最終工程を触媒する第2の反応の算入により、生存可能な表現型のシミュレーションが可能となった。
【0171】
ADE3(C1-テトラヒドロ葉酸合成酵素)およびADK1(アデニル酸キナーゼ)を欠失する株は、容易に説明することができない。両機能のための代賛経路またはアイソザイムをコードする遺伝子が、酵母に存在する多くの孤児遺伝子の中に存在する可能性がある。
【0172】
再構築プロセスにより、代謝においていくらか不完全にモデル化される部分を生じた。それゆえに、多くの偽陽性の予測は、再構築されたモデルの全体的経路構造に完全に接続する反応を妨げる、経路内または両者間におけるギャップ(欠損反応)の結果として生じる可能性がある。例には、以下を含む:
・スフィンゴリピド代謝。これは、完全にはまだ解明されておらず、したがって、本モデルには完全に含まれていないか、またはスフィンゴリピドはバイオマス方程式における構成要素とみなされている。
・tRNAの形成。再構築プロセスの間に、いくらかの遺伝子を、tRNA(DED81、HTS1、KRS1、YDR41C、YGL245H)の合成を担うものとして含めた。
・しかし、tRNA合成の経路は、完全には含めなかった。
・ヘム合成は、再構築されたモデル(HEM1、HEM12、HEM13、HEM15、HEM2、HEM3、HEM4)において考慮した。しかし、モデルには、ヘム代謝された反応は、含めなかった。
・それゆえに、不完全な構造の代謝ネットワークは、aur1Δ、lcb1Δ、lcb2Δ、tsc10Δ、ded81Δ、hts1Δ、krs1Δ、ydr41cΔ、ydl245wΔ、hem1Δ、hem12Δ、hem15Δ、hem2Δ、hem3Δ、およびhem4Δ欠損変異体の表現型の偽予測の原因となる可能性がある。反応可逆性。CHO1遺伝子は、細胞のホスホリピド生合成の中心的工程を触媒する必須膜タンパク質のホスファチジルセリン合成酵素をコードする。インビボにおいて、CHO1の欠失は、生存可能である(Winzelerら、Science 285: 901-906 (1999))。しかし、変異体は、炭素源としてグルコースを含む培地において、コリンまたはエタノールアミンの栄養要求性である(Bimerら、Mol Biol Cell 12(4): 997-1007 (2001))。
・それにもかかわらず、コリンおよび/またはエタノールアミンが供給されるときに、本モデルは、増殖を予測しなかった。ゲノム規模モデルのさらなる調査により、これが、もっぱら不可逆的なホスファチジルエタノールアミンを介したホスファチジルセリンからホスファチジルコリンにする反応を定義することによるかもしれないことが示された。これらの反応が可逆的にできることによって、コリンおよびエタノールアミンのいずれかの供給により、インシリコでの増殖を維持する。
【0173】
遺伝子調節
多くの偽陰性予測は、不正確なインシリコにおける合成完全培地を使用する増殖のシミュレーションによって、またはモデルにおいて最初に欠損している情報によって説明することができるのに対して、多くの偽陽性は、動態学的およびその他の調節制約をゲノム規模代謝モデルに含めなかったので、インビボにおける異化産物の発現、生成阻害効果によって、またはアイソザイムの抑制によって説明されるであろう。
【0174】
合計17の偽陽性予測は、調節イベントに関与し得る。CDC19、ACS2、またはENO2の欠失については、通常、対応するアイソザイムが欠失する遺伝子の機能に取って代わるものと予想されるであろう。しかし、対応する遺伝子、それぞれPYK2、ACS1、またはENO1は、異化産物の抑制を受けやすい(Bolesら、J Bacteriol 179(9): 2987-2993 (1997); van den Berg and Steensma, Eur J Biochem 231(3): 704-713 (1995); Zimmermanら、Yeast sugar metabolism: biochemistry, genetics, biotechnology, and applications Technomic Pub., Lancaster, PA. (1997))。GPM1の欠失は、2つのその他のアイソザイム、Gpm2およびGpm3のいずれにもよっても置換されるはずである;しかし、後者2つに対応する遺伝子産物については、通常活性が見出されない(Heinischら、Yeast 14(3): 203-13 (1998))。
【0175】
偽予測された増殖表現型は、対応する欠失した代謝遺伝子が、細胞周期、細胞運命、連絡、細胞壁保全、その他などのその他のいくつかの細胞機能に関与するときに、しばしば説明することができる。その欠失が偽陽性予測をもたらす以下の遺伝子は、単なる代謝機能以外の機能を有することが見出された:ACS2、BET2、CDC19、CDC8、CYR1、DIM1、ENO2、FAD1、GFA1、GPM1、HIP1、MSS4、PET9、PIK1、PMA1、STT4、TOR2。実際に、MIPS機能的カタログ(http://mips.gsf.de/proj/yeast/)の統計解析では、一般に、多くの機能を有する遺伝子が、細胞情報交換、細胞サイクリングおよびDNAプロセシング、または細胞組織制御に関与するときに、偽予測をもたらす可能性が高かったことを示した。
【0176】
(表9)表2の参考資料の一覧


【0177】
本出願の全体にわたって、種々の刊行物が参照された。これらの刊行物の開示は、本発明が属する分野における技術水準をより完全に記載するために、本出願においてその全体が参照として本明細書に組み入れられる。
【0178】
本発明は、上に提供された実施例に関して記載されているが、本発明の精神から逸脱することなく、種々の修飾を行うことができることが理解されるはずである。したがって、本発明は、請求の範囲によってのみ限定される。

【特許請求の範囲】
【請求項1】
以下を含む、コンピュータ読み取り可能な媒体または媒体類:
(a)複数の酵母反応物を複数の酵母反応と関係づけるデータ構造であって、該酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに該基質および該産物を関係づける化学量論係数を含み、少なくとも1つの該酵母反応は、関連した遺伝子を示すために注釈がついている、データ構造;
(b)該関連した遺伝子を特徴づける情報を含む遺伝子データベース;
(c)該複数の酵母反応のための制約セット;ならびに
(d)該制約セットが該データ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定するためのコマンドとを含み、該少なくとも1つのフラックス分布は、酵母生理機能を予測するコマンド。
【請求項2】
請求項1記載のコンピュータ読み取り可能な媒体または媒体類であって、該複数の酵母反応物の少なくとも1つの反応物または該複数の酵母反応の少なくとも1つの反応は、サブシステムまたはコンパートメントに割り当てる注釈がついている、媒体または媒体類。
【請求項3】
複数の反応が、末梢の代謝経路に由来する少なくとも1つの反応を含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項4】
末梢の代謝経路が、アミノ酸生合成、アミノ酸分解、プリン生合成、ピリミジン生合成、脂質生合成、脂肪酸代謝、補助因子生合成、細胞壁代謝、および輸送プロセスからなる群より選択される、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項5】
酵母生理機能が、増殖、エネルギー産生、レドックス当量産生、バイオマス産生、バイオマス前駆体の産生、タンパク質の産生、アミノ酸の産生、プリンの産生、ピリミジンの産生、脂質の産生、脂肪酸の産生、補助因子の産生、細胞壁成分の産生、代謝産物の輸送、および炭素、窒素、硫黄、リン酸塩、水素、または酸素の消費からなる群より選択される、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項6】
酵母生理機能が、タンパク質の分解、アミノ酸の分解、プリンの分解、ピリミジンの分解、脂質の分解、脂肪酸の分解、補助因子の分解、および細胞壁成分の分解からなる群より選択される、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項7】
データ構造が、1組の線形代数方程式を含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項8】
データ構造が、マトリックスを含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項9】
コマンドが、最適化プログラムを含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項10】
コマンドが、線形プログラムを含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項11】
請求項1記載のコンピュータ読み取り可能な媒体または媒体類であって、複数の酵母反応における第一の基質または産物は、第一のコンパートメントに割り当てられ、かつ該複数の酵母反応における第二の基質または産物は、第二のコンパートメントに割り当てられる、媒体または媒体類。
【請求項12】
複数の酵母反応が、複数の関連した遺伝子を示すための注釈がついており、かつ該遺伝子データベースが、複数の関連した遺伝子を特徴づける情報を含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
【請求項13】
以下を含む、コンピュータ読み取り可能な媒体または媒体類:
(a)複数の酵母反応物を複数の酵母反応と関係づけるデータ構造であって、該酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに該基質および該産物を関係づける化学量論係数を含むデータ構造;
(b)該複数の酵母反応のための制約セット;および、
(c)該制約セットが、データ構造に適用されるときに目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、ここにおいて該少なくとも1つのフラックス分布は、酵母増殖を決定するコマンド。
【請求項14】
以下の段階を含む酵母生理機能を予測するための方法:
(a)複数の酵母反応物を複数の反応と関連づけるデータ構造であって、該酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに該基質および該産物を関係づける化学量論係数を含み、少なくとも1つの該酵母反応は、関連した遺伝子を示すための注釈がついているデータ構造を提供する段階;
(b)該複数の酵母反応のための制約セットを提供する段階;
(c)目的関数を提供する段階;ならびに、
(d)該制約セットが該データ構造に適用されるときに、該目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより該遺伝子に関連した酵母生理機能を予測する段階。
【請求項15】
複数の酵母反応が、末梢の代謝経路に由来する少なくとも1つの反応を含む、請求項14記載の方法。
【請求項16】
末梢の代謝経路が、アミノ酸生合成、アミノ酸分解、プリン生合成、ピリミジン生合成、脂質生合成、脂肪酸代謝、補助因子生合成、細胞壁代謝、および輸送プロセスからなる群より選択される、請求項14記載の方法。
【請求項17】
酵母生理機能が、増殖、エネルギー産生、レドックス当量産生、バイオマス産生、バイオマス前駆体の産生、タンパク質の産生、アミノ酸の産生、プリンの産生、ピリミジンの産生、脂質の産生、脂肪酸の産生、補助因子の産生、細胞壁成分の産生、代謝産物の輸送、および炭素、窒素、硫黄、リン酸塩、水素、または酸素の消費からなる群より選択される、請求項14記載の方法。
【請求項18】
酵母生理機能が、解糖、TCAサイクル、ペントースリン酸経路、呼吸、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、脂肪酸の代謝、補助因子の生合成、細胞壁成分の代謝、代謝産物の輸送、および炭素源、窒素源、酸素源、リン酸塩供与源、水素供与源、または硫黄源の代謝からなる群より選択される、請求項14記載の方法。
【請求項19】
データ構造が、1組の線形代数方程式を含む、請求項14記載の方法。
【請求項20】
データ構造が、マトリックスを含む、請求項14記載の方法。
【請求項21】
フラックス分布が、線形プログラミングによって決定される、請求項14記載の方法。
【請求項22】
請求項14記載の方法であって:
(e)(a)部分のデータ構造と比較して少なくとも1つの付加された反応を含む、改変データ構造を提供する段階、
(f)制約セットが該改変データ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより酵母生理機能を予測する段階、
をさらに含む方法。
【請求項23】
少なくとも1つの添加された反応の少なくとも1つの関係物を同定する段階をさらに含む、請求項23記載の方法。
【請求項24】
少なくとも1つの関係物を同定することが、該少なくとも1つの反応と酵母タンパク質を関連させる段階を含む、請求項23記載の方法。
【請求項25】
タンパク質をコードする少なくとも1つの遺伝子を同定する段階をさらに含む、請求項23記載の方法。
【請求項26】
少なくとも1つの関係物の活性または量を変化させる少なくとも1つの化合物を同定することにより、酵母生理機能を変化させる候補薬物または候補物質を同定する段階をさらに含む、請求項23記載の方法。
【請求項27】
以下の段階を含む、請求項14記載の方法:
(e)(a)部分のデータ構造と比較して少なくとも1つを欠いている改変データ構造を提供する段階、および
(f)該制約セットが該データ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより酵母生理機能を予測する段階。
【請求項28】
少なくとも1つの反応における少なくとも1つの関係物を同定する段階をさらに含む、請求項27記載の方法。
【請求項29】
少なくとも1つの関係物を同定する段階が、該少なくとも1つの反応と酵母タンパク質を関連させる段階を含む、請求項28記載の方法。
【請求項30】
少なくとも1つの反応を行うタンパク質をコードする少なくとも1つの遺伝子を同定する段階をさらに含む、請求項24記載の方法。
【請求項31】
少なくとも1つの関係物の活性または量を変化させる少なくとも1つの化合物を同定し、これにより、酵母生理機能を変化させる候補薬物または候補物質を同定する段階をさらに含む、請求項24記載の方法。
【請求項32】
以下の段階を含む、請求項14記載の方法:
(e)(a)部分のデータ構造の該少なくとも1つの反応のための制約と比較して、少なくとも1つの反応のための変更制約を含む該改変制約セットを提供する段階と、および
(f)該制約セットが該データ構造に適用されるときに、該目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより酵母生理機能を予測する段階。
【請求項33】
少なくとも1つの反応の少なくとも1つの関係物を同定する段階をさらに含む、請求項32記載の方法。
【請求項34】
少なくとも1つの関係物を同定することが、少なくとも1つの反応と酵母タンパク質を関連させる段階を含む、請求項33記載の方法。
【請求項35】
タンパク質をコードする少なくとも1つの遺伝子を同定する段階をさらに含む、請求項34記載の方法。
【請求項36】
少なくとも1つの関係物の活性または量を変化させる少なくとも1つの化合物を同定し、これにより酵母生理機能を変化させる候補薬物または候補物質を同定する段階をさらに含む、請求項33記載の方法。
【請求項37】
酵母の1つまたは複数の遺伝子またはタンパク質と、データ構造の1つまたは複数の反応を関連づける遺伝子データベースを提供する段階をさらに含む、請求項14記載の方法。
【請求項38】
以下の段階を含む、酵母増殖を予測するための方法:
(a)複数の酵母反応物を複数の酵母反応と関連づけるデータ構造であって、該酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに該基質および該産物を関係づける化学量論係数を含む、データ構造を提供する段階;
(b)該複数の酵母反応のための制約セットを提供する段階;
(c)目的関数を提供する段階;ならびに
(d)該制約セットが該データ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定し、これにより酵母増殖を予測する段階。
【請求項39】
以下の段階を含む、複数の酵母反応物を、コンピュータ読み取り可能な媒体または媒体類の複数の酵母反応と関連づけるデータ構造を作製するための方法:
(a)複数の酵母反応並びに該酵母反応の基質および産物である複数の酵母反応物を同定する段階;
(b)データ構造における該複数の酵母反応を、該複数の酵母反応物に関連づけ、ここにおいて該酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応、並びに該基質および該産物を関係づける化学量論係数を含む、段階;
(c)該複数の酵母反応のための制約セットを決定する段階;
(d)目的関数を提供する段階;
(e)該制約セットが該データ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定する段階;ならびに
(f)該少なくとも1つのフラックス分布が酵母生理機能を予測しない場合は、該データ構造に反応を追加するか、または該データ構造から反応を除去させて、段階(e)を繰り返し、該少なくとも1つのフラックス分布が、酵母生理機能を予測する場合は、コンピュータ読み取り可能な媒体または媒体類に該データ構造を格納する段階。
【請求項40】
データ構造の反応が、注釈がついているゲノムから同定される、請求項39記載の方法。
【請求項41】
遺伝子データベースの注釈がついているゲノムから同定される反応を格納する段階をさらに含む、請求項40記載の方法。
【請求項42】
データ構造の反応に注釈をつける段階をさらに含む、請求項39記載の方法。
【請求項43】
注釈が、遺伝子の割当て、タンパク質の割当て、サブシステムの割当て、信頼格付けの割当て、ゲノム注釈情報の参考資料、および出版物の参考資料からなる群より選択される、請求項42記載の方法。
【請求項44】
工程(b)が、不平衡反応を同定し、該データ構造に反応を付加する段階を含み、これにより該不平衡反応を平衡反応に変更する段階をさらに含む、請求項39記載の方法。
【請求項45】
反応の付加が、系内の反応、交換反応、末梢の代謝経路に由来する反応、中枢代謝経路に由来する反応、遺伝子関連反応、および非遺伝子関連反応からなる群より選択される反応を付加する段階を含む、請求項39記載の方法。
【請求項46】
末梢の代謝経路が、アミノ酸生合成、アミノ酸分解、プリン生合成、ピリミジン生合成、脂質生合成、脂肪酸代謝、補助因子生合成、細胞壁代謝、および輸送プロセスからなる群より選択される、請求項45記載の方法。
【請求項47】
酵母生理機能が、増殖、エネルギー産生、レドックス当量産生、バイオマス産生、バイオマス前駆体の産生、タンパク質の産生、アミノ酸の産生、プリンの産生、ピリミジンの産生、脂質の産生、脂肪酸の産生、補助因子の産生、細胞壁成分の産生、代謝産物の輸送、発生、細胞間のシグナル伝達、および炭素、窒素、硫黄、リン酸塩、水素、または酸素の消費からなる群より選択される、請求項39記載の方法。
【請求項48】
酵母生理機能が、タンパク質の分解、アミノ酸の分解、プリンの分解、ピリミジンの分解、脂質の分解、脂肪酸の分解、補助因子の分解、および細胞壁成分の分解からなる群より選択される、請求項39記載の方法。
【請求項49】
データ構造が、1組の線形代数方程式を含む、請求項39記載の方法。
【請求項50】
データ構造が、マトリックスを含む、請求項39記載の方法。
【請求項51】
フラックス分布が、線形プログラミングによって決定される、請求項39記載の方法。
【請求項52】
複数の酵母反応物を、複数の酵母反応と関連づけるデータ構造であって、以下の段階を含むプロセスによって産生されるデータ構造:
(a)複数の酵母反応および該酵母反応の基質および産物である複数の酵母反応物を同定する段階;
(b)データ構造における該複数の酵母反応を、該複数の酵母反応物に関連づけ、該酵母反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、並びに該基質および該産物を関係づける化学量論係数を含む、段階;
(c)該複数の酵母反応のための制約セットを決定する段階;
(d)目的関数を提供する段階;
(e)該制約セットが該データ構造に適用されるとき、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定する段階;ならびに
(f)該少なくとも1つのフラックス分布が酵母生理機能を予測しない場合は、該データ構造に反応を追加するか、または該データ構造から反応を除去させて、段階(e)を繰り返し、該少なくとも1つのフラックス分布が、酵母生理機能を予測する場合は、コンピュータ読み取り可能な媒体または媒体類に該データ構造を格納する段階。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−164338(P2012−164338A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【出願番号】特願2012−91641(P2012−91641)
【出願日】平成24年4月13日(2012.4.13)
【分割の表示】特願2009−82883(P2009−82883)の分割
【原出願日】平成14年10月24日(2002.10.24)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
2.JAVA
3.フロッピー
4.UNIX
【出願人】(592130699)ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア (364)
【氏名又は名称原語表記】The Regents of The University of California