最小限の細菌ゲノム
本発明は、例えば、栄養豊富な細菌培養培地における自由生活生物の複製に必要な情報を提供するタンパク質コード遺伝子の最小限のセットに関し、ここで、(1)該遺伝子セットは、表2に列挙される101個の遺伝子を含まず;かつ/または(2)該遺伝子セットは、表3に列挙される381個のタンパク質コード遺伝子、および、任意で、以下の1つまたは複数を含む:リン酸取り込みのためのABC輸送体をコードする3個の遺伝子のセット(MG410、MG411、およびMG412遺伝子;もしくはMG289、MG290、およびMG291遺伝子);リポタンパク質コード遺伝子MG185もしくはMG260;ならびに/またはグリセロホスホリルジエステルホスホジエステラーゼ遺伝子MG29もしくはMG385。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、例えば、細菌の非必須遺伝子の同定、および自由生活生物の生存能力を補助するために必要な遺伝子の最小限のセットの同定に関する。なお、本出願は、2005年10月12日に出願された米国仮出願第60/725,295号の出願日の恩典を主張し、これはその全体が参照により本明細書中に組み込まれる。また、本発明の局面は、政府の助成金(DOE付与番号DE-FG02-02ER63453)で成された。政府は、本発明において一定の権利を有する。
【背景技術】
【0002】
背景情報
合成生物学の新規分野における進歩の1つの結果は、所望の表現型を有する生物を作製するために組み立てられ得るパーツの集合としての細胞の新たな考え方である(1)。その観点は、以下の疑問を投げかけるものである:「生物を構築するためにはどれだけ少ないパーツを要するのか?」ストレスがなくかつ全ての必要な栄養素を提供する環境において、最も単純な自由生活生物は何を含むのか?この問題は、本発明者らの研究室および他のところにおいて、理論的におよび実験的に取り組まれてきた。
【0003】
配列決定された最初の2つの細菌ゲノムの比較において、MushegianおよびKooninは、グラム陰性ヘモフィルス・インフルエンザエ(Haemophilus influenzae)ゲノムおよびグラム陽性M. ゲニタリウム(M. genitalium)ゲノムが共に有する256個のオルソロガス遺伝子が細菌生存のための最小限の遺伝子セットに極めて近いと予想した(2)。より最近では、Gilらが、複数の自由生活で内共生の細菌のゲノムの分析に基づき、最小限の細菌遺伝子セットの206タンパク質コード遺伝子コアを提案した(3)。
【0004】
1999年、本発明者らの一部は、M. ゲニタリウムの実験室での増殖に必須ではない遺伝子を実験的に決定するための、広範囲でのトランスポゾン変異誘発の最初の使用を報告した(4)。それ以後、本発明者らのアプローチならびに部位特異的遺伝子ノックアウトおよびアンチセンスRNA等の他の方法を使用する、細菌の必須遺伝子セットの多数のその他の実験的決定が行われている(5〜12)。これらの研究の大部分は、多くは抗生物質標的として使用され得る必須遺伝子を同定するという目的で、ヒト病原体を用いて行われた。これらの生物のほぼ全てが、多くのパラロガス遺伝子ファミリーを含む比較的大きなゲノムを含有する。このような遺伝子の破壊または欠失によりそれらが非必須であることが示されるが、それらの産物が、必須の生物学的機能を行うかどうかは決定されない。本発明者らが仮定的な最小限の遺伝子セットの組成に対して経験的な立証をもたらすのは、ほぼ最小限のゲノムを有する細菌の遺伝子の必須性の研究によってのみである。
【0005】
マイコプラズマとして一般的に公知のモリキューテス(Mollicutes)は、最小限の遺伝子セットを実験的に規定するための優れた実験プラットフォームである。壁を有さないこれらの細菌は、大量のゲノム減少のプロセスによって、ファーミキューテス(Firmicutes)分類群中のより通常の先祖から進化した。マイコプラズマは、ほとんど適応能力を必要としない比較的不変の生態学的地位において生存する偏性寄生生物である。ヒト尿生殖器病原体であるM. ゲニタリウムは、このゲノム節減の極端な発現であり、僅か482個のタンパク質コード遺伝子、および純粋培養で増殖し得る全ての公知の自由生活生物の中で最小の約580kbのゲノムを有する(13)。この細菌は、他の生細胞を含まない寒天プレート上において独立して増殖し得る。遺伝子必須性研究において使用されるより大きなゲノムを有するより一般的な細菌は、平均26%のパラロガス遺伝子ファミリー遺伝子を有するが、M ゲニタリウムは僅か6%しか有さない(表1)。したがって、種々の環境条件に対するゲノムの重複性および偶発性が欠如しているために、M. ゲニタリウムは既にほぼ最小限の細菌細胞となっている。
【0006】
M. ゲニタリウムおよびその最も近い類縁であるマイコプラズマ・ニューモニエ(Mycoplasma pneumoniae)についての必須細菌遺伝子に関する本発明者らの一部による1999年の報告により、これらの2つの種において約2200個のトランスポゾン挿入部位がマッピングされ、130個の推定非必須M. ゲニタリウムタンパク質コード遺伝子またはM. ゲニタリウム遺伝子のM. ニューモニエオルソログが同定された。その報告(Hutchison et al. (1999) Science 286, 2165-9(非特許文献1))において、著者らは、M. ゲニタリウムの265〜350個のタンパク質コード遺伝子が、実験室での増殖条件下で必須であると予測した(4)。しかし、遺伝子の不必要性(dispensability)の証明には、純粋なクローン集団の単離および特徴決定が必要であり、これを彼らは行わなかった。その報告において、著者らは、混合プール中で数週間Tn4001形質転換細胞を増殖させ、次いでそれらの変異体混合物からゲノムDNAを単離した。彼らは、鋳型としてそのDNAを使用した逆PCR由来の単位複製配列を配列決定し、マイコプラズマゲノム中のトランスポゾン挿入部位を同定した。トランスポゾン挿入を含む遺伝子の大部分は、必須ではないと予想される仮定タンパク質(hypothetical protein)または他のタンパク質のいずれかをコードしていた。にもかかわらず、推定破壊遺伝子の一部、例えば、イソロイシルおよびチロシル-tRNA合成酵素(MG345およびMG455)、DNA複製遺伝子dnaA(MG469)、ならびにDNAポリメラーゼIII サブユニットα(MG261)は、必須の機能を行うと考えられる。彼らは、一般的に必須であると考えられている遺伝子がどのように破壊され得るかについて仮説を立てた:遺伝子は、トランスポゾン挿入に対して耐性であり得かつ実際には破壊されない可能性があり、細胞は、2コピーの遺伝子を含有し得、または遺伝子産物が、変異体の同一の混合プール中の他の細胞によって供給され得る。
【0007】
寒天プレートから選定された個々のコロニー中に存在したM. ゲニタリウムTn4001挿入変異体を本発明者らが単離および特徴決定したという拡大された研究が、本明細書中に開示される。この分析は、この最低限の細菌における必須遺伝子の数の新規かつより徹底的な推定値を提供した。
【0008】
【非特許文献1】Hutchison et al. (1999) Science 286, 2165-9
【発明の開示】
【0009】
発明の説明
本発明者は、SP4などの栄養豊富な(rich)細菌培養培地における細菌などの生物の増殖を維持するのに非必須である、101個のタンパク質コード遺伝子を同定した。このような培養培地は、実験室条件下での細菌増殖に必要な塩、増殖因子、栄養素等の全てを含有する。実験室条件下で自由生活生物の生存能力を維持するために必要な遺伝子の最小限のセットは、これらの非必須遺伝子の同定から推定される。「最小限の遺伝子セット」とは、その発現によって上述した特定の栄養豊富な細菌培地における自由生活生物の生存能力(例えば、生存、増殖、複製、繁殖等)が可能になる遺伝子の最小限のセットを意味する。
【0010】
細菌中で破壊されたにもかかわらず生存能力を保持し、かつしたがって増殖には不必要(非必須)であるM. ゲニタリウムの101個のタンパク質コード遺伝子を表2に列挙するが、その機能的役割によって分類されている。破壊されなかった381個の遺伝子を表3にまとめるが、これらも同様に機能的役割によって分類されている。これらの遺伝子は、最小限の必須遺伝子セットの一部を形成する。その他の遺伝子もまた、最小限の遺伝子セットの一部であり得る。少なくとも、これらの他の遺伝子としては、ホスフェートおよび/またはホスホネートについてのABC輸送体、および特定のリポタンパク質および/またはグリセロホスホリルジエステルホスホジエステラーゼについてのタンパク質コード遺伝子;ならびにRNAコード遺伝子が挙げられる。
【0011】
上述したように、本発明者らの一部は、1999年に、生存能力のために必須または使い捨て可能のいずれかであると思われる遺伝子の推定セットを報告した予備的研究を公開した。表4は、不必要であると本研究において同定されたが1999年の論文においてはそのように同定されなかった遺伝子を列挙している。表5は、増殖に必要であると本研究において同定されたが1999年の論文においてはそのように同定されなかった遺伝子を列挙している。
【0012】
本発明の一局面は、SP4などの栄養豊富な細菌培養培地における純培養条件下での自由生活生物の複製に必要な情報を提供するタンパク質コード遺伝子のセット(例えば、タンパク質コード遺伝子の最小限のセット)であって、
該セットが、表2に列挙される101個のタンパク質コード遺伝子のうち少なくとも40個またはそれらの機能的等価物を欠如しており(「欠如遺伝子」)、ここで、表4の遺伝子の少なくとも1つが該欠如遺伝子に含まれ;
該セットが、表5の遺伝子の少なくとも1つを含む、表3に列挙される381個のタンパク質コード遺伝子のうち350〜381個またはそれらの機能的等価物を含み;かつ
該セットが、450個以下のタンパク質コード遺伝子を含む。
【0013】
自由生活生物の複製に必要な「情報を提供する」遺伝子のセットは、(例えば、mRNA、rRNA、またはtRNAへ)転写され得りかつタンパク質コード配列の場合にはタンパク質へ翻訳され得る任意の形態であってよく、ここで、転写/翻訳産物は、自由生活生物が機能するのを可能にする機能を提供する。
【0014】
タンパク質コード遺伝子のこのセットは、自由生活生物中の天然の遺伝子の最も小さな公知のセットであるM. ゲニタリウム中で見られる遺伝子(482個の遺伝子)の完全な相補体よりも小さい。
【0015】
本発明のタンパク質コード遺伝子のセットは、表2に列挙される遺伝子のうち少なくとも約55個(例えば、少なくとも約70、80、または90個)を欠如し得、かつ/または、表3に列挙される遺伝子のうち少なくとも約360個(例えば、少なくとも約370または380個)を含み得る。
【0016】
本発明のセットは、以下をさらに含み得る:
(a)MG410、MG411、およびMG412、ならびに(b)MG289、MG290、およびMG291、ならびにそれらの機能的等価物からなる群より選択される、リン酸取り込みのためのABC輸送体をコードする遺伝子;および/または
MG185およびMG260、ならびにそれらの機能的等価物からなる群より選択される、リポタンパク質コード遺伝子;ならびに/または
MG293およびMG385ならびにそれらの機能的等価物からなる群より選択されるグリセロホスホリルジエステルホスホジエステラーゼ遺伝子。
【0017】
さらに、本発明のセットは、マイコプラズマ・ゲニタリウム(Mycoplasma genitalium)の43個のRNAコード遺伝子、またはそれらの機能的等価物をさらに含み得る。
【0018】
本発明のセット中の遺伝子は、染色体を構成し得;かつ/またはM. ゲニタリウム由来であり得る。
【0019】
本発明の別の局面は、栄養豊富な細菌培養培地(例えば、SP4)において純培養条件下で増殖および複製し得る自由生活生物であって、その遺伝子のセットが本発明のセット、例えば、水素またはエタノールの産生に関与する少なくとも1つの遺伝子を含むセットからなる、自由生活生物である。
【0020】
本発明の別の局面は、遺伝子の機能を決定するための方法であって、該遺伝子をこのような自由生活生物へ挿入するか、該生物中で変異させるか、または該生物から除去する工程、および該生物の特性を評価する工程を含む方法である。
【0021】
本発明の別の局面は、水素またはエタノールの産生法であって、水素またはエタノールが産生されるように、適切な培地において、水素またはエタノールの産生に関与する少なくとも1つの遺伝子を含む本発明の自由生活生物を増殖させる工程を含む方法である。
【0022】
本発明の別の局面は、上述のセットの有効なサブセットである。「有効なサブセット」は、本明細書中で使用される場合、SP4などの栄養豊富な細菌培養培地における自由生活生物の複製のために必要な情報を提供するサブセットを指す。
【0023】
本発明の最小限の遺伝子セットは、種々の用途を有する。例えば、本発明の最小限の遺伝子セットは、ゲノムまたは機能的ゲノムが欠如している、細菌などの微生物の細胞(例えば、ゴースト細胞)中へ導入され得、種々の条件下で細胞増殖、タンパク質合成、複製、または他の細菌機能についての要件を調べるために実験的に使用され得る。ゴースト細胞中の最小限の遺伝子の1つまたは複数を、オルソロガス遺伝子もしくは遺伝子で修飾もしくは置換し、または同じ機能を行うタンパク質を発現する非オルソロガス遺伝子で置換して、それらの遺伝子の構造/機能研究を可能にすることができる。本発明の最小限の遺伝子セットを含む細胞は、該ゲノム中へ一体化されるかまたは1つもしくは複数の独立したプラスミド上で複製する、1つまたは複数の発現可能な異種遺伝子をさらに含むように修飾され得る。これらの細胞は、例えば、異種遺伝子の特性もしくは活性を研究するために(例えば、構造/機能の研究)、または有用な量の異種タンパク質(例えば、生物学的薬物、ワクチン、触媒酵素、エネルギー源等)を作製するために、使用され得る。
【0024】
述べたように、最小限の遺伝子セットとは、栄養豊富な細菌培養培地における自由生活生物の複製に必要な情報を提供するものである。本明細書中に記載される最小限の遺伝子セットは、テトラサイクリン選択(tetMテトラサイクリン耐性遺伝子が非必須であると示された遺伝子を不活性化するために使用されたトランスポゾン中に存在する)の存在下での、培地SP4(その組成は、参考文献番号17に記載されている)における細菌増殖について非必須であると示された遺伝子に基づいて同定された。非必須遺伝子のセットは、異なる条件下(例えば、異なる細菌培地中、異なる選択条件下、等)で増殖した生物について異なり得る。一般的に、可能な限り少ない環境ストレスで、最小限の生物(本明細書中で論じられる遺伝子セットを含有する)の増殖および繁殖を補助する培養培地は、エネルギー源、例えば、グルコース、アルギニン、または尿素;タンパク質またはペプチド;全てのアミノ酸;ヌクレオチド;ビタミン;補因子;脂肪酸および他の膜成分、例えば、コレステロール;酵素補因子;塩;ミネラル、および緩衝液を含有する。
【0025】
そのような培地はSP4(スピロプラズマ(Spiroplasma)培地)であり、これは、ウシ心臓浸出液(beef heart infusion)と、酵母抽出物添加ペプトンと、CMRL 1066培地と、17%ウシ胎仔血清との非常に栄養価の高い混合物である。酵母抽出物はジホスホピリジンヌクレオチドを提供し、血清はコレステロールおよびタンパク質供給源を提供する(例えば、Tully et al. (1979) J. Infect. Dis 139, 478-82を参照のこと)。具体的には、SP4培地は、以下の成分を含有する。
【0026】
混合
マイコプラズマブロスベース(Mycoplasma Broth Base)...3.5g
バクトトリプトン(Bacto Tryptone)...10g
バクトペプトン(Bacto Peptone)...5.3g
蒸留水...600ml
pHを7.5に調節する。
121℃で15分間オートクレーブ処理する。
【0027】
無菌的添加
20%グルコース...25ml
CMRL 1066 (10X)...50ml
7.5%炭酸水素ナトリウム...14.6ml
200mM L-グルタミン...5ml
イーストエキストラクト溶液...35ml
2%オートクレーブ済TC Yeastolate...100ml
ウシ胎仔血清(熱不活性化)...170ml
ペニシリンG(107 IU/ml)...100μl
【0028】
「遺伝子」という用語は、本明細書中で使用される場合、例えば発現制御配列へ操作可能に連結された発現可能な形態の、タンパク質コード配列またはRNAコード配列を含むポリヌクレオチドを指す。遺伝子の「コード配列」は一般に、それらがコード配列中に埋め込まれない限り、発現制御配列を含まない。本発明の種々の態様において、表2〜5に列挙される遺伝子のコード配列は、天然の発現制御配列の制御下であり得るか、もしくは異種発現制御配列の制御下であり得るか、またはそれらの組み合わせであり得る。
【0029】
「発現制御配列」とは、本明細書中で使用される場合、それが機能的に(「操作可能に」)連結されているポリヌクレオチドによってコードされるポリペプチドの発現を調節する、ポリヌクレオチド配列を指す。発現は、mRNAまたはポリペプチドのレベルで調節され得る。したがって、発現制御配列という用語は、mRNA関連要素およびタンパク質関連要素を含む。このような要素としては、プロモーター、プロモーター内のドメイン、リボソーム結合配列、転写ターミネーター等が挙げられる。コード配列の発現を実行または達成するような様式で発現制御配列が配置されている場合、発現制御配列は、ヌクレオチド配列へ操作可能に連結されている。例えば、プロモーターがコード配列の5'へ操作可能に連結されている場合、該コード配列の発現は該プロモーターによって駆動される。
【0030】
本明細書中の実施例において示唆される最小限の遺伝子セットは、マイコプラズマ・ゲニタリウム(M. ゲニタリウム)G37(ATCC 33530)由来の遺伝子または配列から構成される。この細菌の完全ゲノムは、Genbankアクセッション番号L43976として提供される。個々の遺伝子は、MG001、MG002〜MG470としてGenbankリスト中に注釈が付けられている。それらの遺伝子の配列は、2005年10月前半にTIGRのウェブサイト上に公開された。
【0031】
しかし、置換遺伝子がコードするタンパク質またはRNAが発現され得、かつ、最小限の遺伝子セット中のM. ゲニタリウムの遺伝子または配列を置換するのに十分な量の活性、機能、および/または構造を提供するという条件下で、任意の種々の他のタンパク質またはRNAをコードする遺伝子または配列が、最小限の遺伝子セットにおいて、例示されたタンパク質またはRNAをコードする遺伝子または配列を置換できる。このような置換物は、本明細書中で時に、前記例示された遺伝子またはコード配列の「機能的等価物」と呼ばれる。
【0032】
置換され得る適切な遺伝子またはコード配列としては、例えば、M. ゲニタリウム遺伝子の活性な変異体、変種、多型体等;または別の細菌、例えば、種々のマイコプラズマ種(例えば、M. カプリコラム(M. capricolum))由来の対応する(オルソロガス)遺伝子が挙げられる。さらに、前記最小限の遺伝子セット由来の遺伝子または配列は、進化的により多様な生物、例えば、古細菌または真核生物由来のオルソロガス遺伝子で置換され得る。細菌宿主では利用不可能な機構によって、機能するために翻訳後に修飾されなければならない真核生物由来の遺伝子は、当然ながら、使用出来ない。同様に、真核生物遺伝子由来の発現制御配列は、それらが細菌細胞のバックグラウンドにおいて機能できる場合にのみ、使用され得る。
【0033】
本発明の一態様において、前記最小限の遺伝子セット由来の遺伝子は、非オルソロガス遺伝子置換によって(等価な機能または活性を提供する遺伝子の異なるセットによって)置き換えられる。例えば、実施例に示されるようなM. ゲニタリウムの解糖系由来の遺伝子は、エネルギーを産生するための異なる供給源(例えば、尿素の加水分解、アルギニンの発酵等)を利用する異なる生物由来の遺伝子で置換され得る。
【0034】
例えば、M. ゲニタリウムは、解糖を通じてエネルギーを産生する。解糖系の酵素を発現する遺伝子の大部分を不必要にする別の生物由来の異なるエネルギー産生システムを置換できる。例えば、M. ゲニタリウムに密接に関連する細菌である、ウレアプラズマ・パルバム(Ureaplasma parvum)におけるエネルギー産生は、尿素の加水分解に基づく。そのシステムは、ウレアーゼ酵素複合体をコードする8個の遺伝子、2個のアンモニウム輸送体、および未だ同定されていないニッケルイオン輸送体(恐らく、いくつかのU. パルバム陽イオン輸送体の1つである)、および場合によっては尿素輸送体(輸送体は同定されておらず、非常に小さな尿素分子が拡散によって細胞中へ入り得る)を含む。本発明者らは、解糖系酵素および炭水化物輸送体をコードする15〜20個のM. ゲニタリウム遺伝子をこれらの11〜12個のU. パルバム遺伝子で置換することによって、U. パルバムで見られるようなより力強い増殖が可能であるより少ない遺伝子を有する生物が産生されるだろうと予想する。
【0035】
本明細書中で使用される場合、「ポリヌクレオチド」という用語は、Genbankリスト中に提供される一本鎖もしくはそれらに対する完全な相補体に対応する、一本鎖DNA、または該分子の二本鎖形態を含む。RNAおよびDNA様またはRNA様の材料、例えば、分枝DNA、ペプチド核酸(PNA)、またはロックト核酸(locked nucleic acid:LNA)もまた含まれる。
【0036】
変種ポリヌクレオチドがその変化前の元のポリヌクレオチドの少なくとも測定可能な量の機能を提供できるという条件で、遺伝子の機能的等価物はまた、種々の変種ポリヌクレオチドを含み得る。好ましくは、この変種は、元のポリヌクレオチドの機能の少なくとも約50%、75%、90%、または95%を提供し得る。例えば、本明細書中に記載されるポリヌクレオチドの機能的変種としては、縮重コドンを含むポリヌクレオチド;または元のポリヌクレオチドの活性断片であるポリヌクレオチド;または元のポリヌクレオチドと少なくとも約90%の同一性(例えば、少なくとも約95%または98%の同一性)を示すポリヌクレオチド;または高ストリンジェントな条件下で元のポリヌクレオチドへ特異的にハイブリダイズし得るポリヌクレオチドが挙げられる。
【0037】
特記されない限り、「約」という用語は、本明細書中で使用される場合、プラスまたはマイナス10%を指す。したがって、上記で使用される約90%とは、81%〜99%を含む。本明細書中で使用される場合、範囲の端点は、その範囲に含まれる。
【0038】
機能的変種ポリヌクレオチドは、例えば、一塩基変異多型(SNP)、対立遺伝子変種、および変異体を含む天然または非天然の多型を含む、種々の形態であり得る。それらは、例えば、1つまたは複数の付加、挿入、欠失、置換、転位、転換、逆位、染色体転座、オルタナティブスプライシング事象から生じる変種など、またはそれらの任意の組み合わせを含み得る。
【0039】
配列同一性の程度は、従来のアルゴリズム、例えば、LipmanおよびPearson(Proc. Natl. Acad. Sci. 80:726-730, 1983)またはMartinez/Needleman-Wunsch(Nucl Acid Research 11:4629-4634, 1983)によって記載されたものによって得ることが出来る。
【0040】
高ストリンジェントな条件下で第2のポリヌクレオチドに特異的にハイブリダイズするポリヌクレオチドは、そのポリヌクレオチドへ選択的にハイブリダイズする。「高ストリンジェントな」条件とは、例えば、本明細書中で使用される場合、例えば、約5X SSC、0.5% SDS、100μg/ml変性サケ精子DNA、および50%ホルムアミドを含有するハイブリダイゼーション溶液中で、長いポリヌクレオチドプローブと共に、42℃で一晩(例えば、少なくとも12時間)、ブロットまたは他のハイブリダイゼーション反応物をインキュベートすることを意味する。ブロットは、例えば、5%未満のbpミスマッチを許容する高ストリンジェントな条件で洗浄でき(例えば、65℃で30分間、0.1X SSCおよび0.1% SDS中で2回洗浄する)、それによって、例えば95%またはそれ以上の配列同一性を有する配列を選択する。高ストリンジェントな条件の他の非限定的な例としては、30 mM NaClおよび0.5% SDSを含有する水性緩衝液中で65℃での最終洗浄が挙げられる。高ストリンジェントな条件の別の例とは、7% SDS、0.5 M NaPO4、pH 7、1 mM EDTA中、50℃で例えば一晩のハイブリダイゼーション、続いて42℃で1% SDS溶液による1回または複数回の洗浄である。高ストリンジェントな洗浄は5%未満のミスマッチを許容し得るが、低下されたまたは低ストリンジェントな条件は、20%までのヌクレオチドミスマッチを許容し得る。低ストリンジェントなハイブリダイゼーションは、上記のように、但し、より低いホルムアミド条件、より低い温度、および/またはより低い塩濃度、ならびにより長いインキュベーション期間を使用して、達成され得る。
【0041】
本明細書中で示唆される最小限の遺伝子セットは、下記の要因のいくつかを考慮することによって導き出された。さらに、この最小限の遺伝子セットは、下記の要因のいくつかを考慮して、例えば、他の培養条件下での増殖のために修飾され得る。
【0042】
上記のタンパク質コード遺伝子は、本明細書中で記載される実験の条件下での増殖に必須であるようであるが、さらなるタンパク質コード遺伝子が、他の条件下では必要とされ得る。例えば、本発明者らは、本発明者らによる実験期間の間に消費され得たが、その生物の長期間の生存には必要であるかもしれない、DNA代謝遺伝子中の変異体を単離した。これらは、組換えおよびDNA修復に関与する6個の遺伝子であった:recA(MG339)、recU(MG352)、ホリデイジャンクションDNAヘリカーゼ ruvA(MG358)およびruvB(MG359)、DNAから酸化されたプリンを切除するホルムアミドピリジン-DNAグリコシラーゼmutM(MG262.1)、ならびに見込みのある(likely)DNA損傷誘導性タンパク質遺伝子(MG360)。恐らく経時的な細胞損傷の蓄積により、染色体分離タンパク質(chromosome segregation protein)SMC(MG298)および仮定遺伝子MG115(これは、肺炎連鎖球菌(Streptococcus pneumoniae)コンピテンス誘導性(competence-inducible)(cin)オペロンのcinA遺伝子に類似している)における変異体は、継代の繰り返しの後、より不十分に増殖した。
【0043】
そのほぼ最小限の遺伝子セットを用いたとしても、M. ゲニタリウムは、明確な酵素重複性(enzymatic redundancy)を有する。本発明者らは、ホスフェート(MG410、MG411、MG412)および推定ホスホネート(MG289、MG290、MG291)取り込みについての2個の完全なABC輸送体遺伝子カセットを破壊した。PhoU調節タンパク質遺伝子(MG409)は破壊されず、このことは、これが両方のカセットに必要であることを示唆している。ホスフェートとは、取り込まれなければならない必須の代謝産物である。ホスフェートはホスホネート系による緩い基質特異性の結果として両方の輸送体によって取り込まれ得るか、または、ホスフェートとホスホネートとを相互交換する代謝能力が存在するかのいずれかである。本発明者らは、これら3個の遺伝子カセットの両方を破壊したが、細胞は、恐らく、少なくとも1つのホスフェート輸送体を必要とする。したがって、最小限の遺伝子セットは、好ましくは、ホスフェート取り込みのための3個のABC輸送体遺伝子を含有する。緩い基質特異性は、それによってM. ゲニタリウムがより少ない遺伝子でその代謝要求を満たす機構として複数のM. ゲニタリウム酵素について提唱および示される、繰り返されるテーマである(21、22)。
【0044】
M. ゲニタリウムは解糖を通じてATPを産生し、初期解糖反応に関与する酵素をコードする遺伝子のいずれも破壊されなかったが、2個のエネルギー産生遺伝子の変異は、この必須の経路においてより予想外のゲノム重複性があり得ることが示された。本発明者らは、乳酸/リンゴ酸デヒドロゲナーゼ(MG460)およびピルビン酸デヒドロゲナーゼ複合体のジヒドロリポアミドデヒドロゲナーゼサブユニット(MG271)をコードする遺伝子における生存可能な挿入変異体を同定した。これらのデヒドロゲナーゼのいずれかにおける変異は、解糖ATP産生、ならびに、解糖における主な酸化剤および還元剤であるNAD+およびNADHのアンバランスなレベルを有すると予想された。これらの変異は、大きく低下した増殖速度および増殖培地の酸性化の促進を伴うと考えられる。MG271変異体は、野生型細胞よりも約20%遅い増殖を示したが、不可解なことに、乳酸デヒドロゲナーゼ変異体は、約20%速い増殖を示した。本発明者らはまた、リン脂質生合成酵素である、グリセロール-3-リン酸デヒドロゲナーゼ(MG039)における変異体を単離した。これらの変異体における機能喪失は、他のM. ゲニタリウムデヒドロゲナーゼまたはレダクターゼによって補償できた。これは、乳酸/リンゴ酸デヒドロゲナーゼ(21)およびヌクレオチドキナーゼ(22)について報告された、緩い基質特異性を有するマイコプラズマ酵素のもう1つの例であり得る。
【0045】
本発明者らの実験室条件下で、本発明者らは、101個の非必須タンパク質コード遺伝子を同定した。残りの381個のM. ゲニタリウムタンパク質コード遺伝子、および3個のリン酸輸送体遺伝子、および43個のRNAコード遺伝子は、この最小限の細胞について必須遺伝子セットを構成すると思われる(表3)。本発明者らは、12のM. ゲニタリウムパラロガス遺伝子ファミリーのうち5つのみにおいて遺伝子を破壊した。リポタンパク質MG185およびMG260ならびにグリセロホスホリルジエステルホスホジエステラーゼMG293およびMG385から構成される2つのファミリーについてのみ、本発明者らは、全てのメンバーを破壊した。したがって、これらのファミリーの機能は必須であり得、本発明者らは、前記必須遺伝子セットの本発明者らの予測を386個の遺伝子まで拡大し、それらを含めた(MG185またはMG260の各1個、ならびにMG293およびMG385の各1個)。これは、M. ゲニタリウムと同一のファーミキューテス分類群由来のより一般的な細菌である枯草菌(B. subtilis)において279個の必須遺伝子を同定した遺伝子ノックアウト/破壊研究(6)において、または、M. ゲニタリウムについての本発明者らの以前の研究(4)において予測された265〜350個よりも顕著に大きな数の必須遺伝子である。同様に、必須タンパク質コード遺伝子386個という本発明者らの知見は、いくつの遺伝子が最小限のゲノムを構成するかという理論的予測、例えば、H. インフルエンザエおよびM. ゲニタリウムの両方が共に有するMushegianおよびKooninの遺伝子256個(2)、ならびにGilらによって提唱された最小限の細菌遺伝子セットの206遺伝子コア(3)を大きく超える。本発明の必須遺伝子セットについての驚きの1つは、それが108個の仮定タンパク質および機能未知のタンパク質を含むことである。
【0046】
これらのデータは、386個のタンパク質コード遺伝子および43個の構造RNA遺伝子をコードするように構築されたゲノムは、マイコプラズマ・ラボラトリウム(Mycoplasma laboratorium)と仮定的に呼ばれてきた、生存可能な合成細胞を維持し得ることを示唆している(24)。種々の機構が、このような生存可能な合成細胞を調製するために使用され得る。例えば、前記最小限の遺伝子セットは、内在のゲノムが除去されたかまたは無能にされた、ゴースト細胞中へ導入され得る。一態様において、リボソーム、膜、および、遺伝子調節、転写、翻訳、転写後修飾、分泌、栄養素や他の物質の取込み等に重要な他の細胞成分が、ゴースト細胞中に存在する。別の態様において、1つまたは複数のこれらの成分は、合成的に調製される。
【0047】
本発明の一態様において、最小限の遺伝子セット中の遺伝子またはそれらの遺伝子のサブセットは、例えばライブラリを形成するために、従来のベクター中へクローニングされる。クローニングされるDNAは、天然の遺伝子、異なるベクター中へ以前にクローニングされた遺伝子、または人工的に合成された遺伝子を含む、任意の適切な供給源から得ることが出来る。これらの遺伝子は、インビトロで、合成手順により、例えば、参照によりその全体が本明細書中に組み込まれる、2006年5月1日に出願された同時係属中のPCT出願PCT/2006/16349「Amplification and Cloning of Single DNA Molecules Using Rolling Circle Amplification」に開示された手順により、クローニングできる。例えば、遺伝子セットの合成的に調製された遺伝子は、合成遺伝子またはゲノムを形成するために増幅およびアセンブルされ得る。これは、希釈されたDNAの各試料が平均で1分子のDNAを例えば約5kbの断片中に含有するようにDNA分子を希釈し、次いで一本鎖DNA環へ変換し、次いでΦ29ポリメラーゼを使用してこのDNA環を増幅することによって行われ得る。
【0048】
ライブラリとして、本発明の遺伝子セットを、任意の形態で、単一または複数コピーで配置でき、遺伝子の1つの断片、遺伝子の1つ、または遺伝子の2つ以上をそれぞれ有する個々のオリゴヌクレオチド中に配置できる。これらのオリゴヌクレオチドは、カセットとして配置され得る。このカセットは、本発明の遺伝子セットの全ての遺伝子を含むまたはこれらからなる最小限のゲノムを含む、より大きな遺伝子アセンブリを形成するために、連結され得る。遺伝子は、参照によりその全体が本明細書中に組み込まれる、2006年8月11日に出願されたPCT国際特許出願第PCT/US06/31214号「Method For In Vitro Recombination Employing a 3' Exonuclease Activity」に記載されるような方法によってアセンブルされ得る。PCT/US06/31214は、遺伝子のカセットを連結してより大きなアセンブリとする方法を記載しており、これは、本発明の遺伝子セットを含む単一DNA分子を作製するために使用され得る。特に、この出願は、関心対象の2つまたはそれ以上の二本鎖(ds)DNA分子を連結するために単離されたタンパク質を使用するインビトロ法を記載しており、ここで、各対の第1のDNA分子の遠位領域と第2のDNA分子の近位領域は、少なくとも20個の非パリンドロームヌクレオチド(nt)を含む配列同一性の領域を共に有し、該方法は、以下を含む:(a)その対の配列相同性の領域へ特異的にハイブリダイズするのに十分な長さの配列相同性の領域を含む各DNA分子の一本鎖オーバーハング部分を生じさせるに有効な条件下で、エキソヌクレアーゼ活性を有する酵素で前記DNA分子を処理する工程;(b)一本鎖オーバーハング部分の特異的アニーリングを達成するのに有効な条件下で、(a)で処理されたDNA分子をインキュベートする工程;ならびに(c)残りの一本鎖ギャップを埋めかつしたがって形成された切れ目をふさぐのに有効な条件下で、(b)でインキュベートされたDNA分子を処理する工程。
【0049】
ライブラリのDNA分子は、任意の実際的な長さのサイズを有し得る。dsDNAが環状化するためのサイズ下限値は、約200塩基対である。したがって、連結された断片の全長(場合によっては、ベクターの長さを含む)は、好ましくは、少なくとも約200bp長である。前記DNAは、環状または線状分子のいずれかの形態をとり得る。ライブラリは、共に連結され得る2個〜非常に多数のDNA分子を含み得る。一般的に、少なくとも約10個の断片が連結され得る。
【0050】
より具体的には、1回または数回のアセンブリ段階において、最終生成物を作製するために連結され得るDNA分子またはカセットの数は、少なくともまたは最大で約2、3、4、6、8、10、15、20、25、50、100、200、500、1000、5000、もしくは10,000個のDNA分子、例えば約4個〜約100個の分子の範囲内であり得る。本発明のライブラリ中のDNA分子またはカセットは、各々、少なくともまたは最大で約80 bs、100 bs、500 bs、1 kb、3 kb、5 kb、6 kb、10 kb、18 kb、20 kb、25 kb、32 kb、50 kb、65 kb、75 kb、150 kb、300 kb、500 kb、600 kb、またはそれ以上の範囲内、例えば、約3 kb〜約100 kbの範囲内の出発サイズを有する。本発明によれば、方法は、約600 kbのDNA分子への各々約6 kbのカセット約100個のアセンブリについて使用され得る。
【0051】
本発明の一態様は、カセット、例えば、本発明の遺伝子セット中に含まれる遺伝子またはゲノムの隣接領域を示す5〜6 kbのDNA分子を連結し、コンビナトリアルアセンブリ(combinatorial assembly)を作製することである。例えば、1つもしくは複数の遺伝子が排除または変異され、かつ/または1つもしくは複数の追加の遺伝子が付加されるように、細菌ゲノム、例えば、推定最小限ゲノムまたは最小限ゲノムを修飾することは、興味深いと思われる。そのような修飾は、例えば約5〜6 kbの適切なカセットへとゲノムを分割し、所望の修飾を含むカセットで元のカセットを置換することで修飾ゲノムをアセンブルすることによって、行われ得る。さらに、同時に種々の変化(例えば、関心対象の遺伝子の種々の修飾、種々の代替遺伝子の付加、1つまたは複数の遺伝子の排除等)を導入することが望ましい場合、コンビナトリアルアセンブリにおいて、種々の修飾に対応する種々のカセットを使用して、同時に多数のゲノムをアセンブルすることが出来る。多数の修飾配列がアセンブルされた後、好ましくはハイスループット様式で、どの修飾がゲノム(またはゲノムを含む生物)に対して所望の特性を付与するかを決定するために、修飾されたゲノムの各々の特性が試験され得る。この「異質なものを組み合わせる(mix and match)」手順によって、特性が比較され得る種々の試験用ゲノムまたは生物が作製される。全手順が、再帰的様式で所望の通り繰り返され得る。
【0052】
クローニングの方法、および本発明と共に使用される多くの他の分子生物学的方法は、例えば、Sambrook, et al. (1989), Molecular Cloning, a Laboratory Manual, Cold Harbor Laboratory Press, Cold Spring Harbor, N.Y.;Ausubel et al. (1995). Current Protocols in Molecular Biology, N. Y., John Wiley & Sons;Davis et al. (1986), Basic Methods in Molecular Biology, Elseveir Sciences Publishing,, Inc., New York;Hames et al. (1985), Nucleic Acid Hybridization, IL Press;Dracopoli et al. Current Protocols in Human Genetics, John Wiley & Sons, Inc.;およびColigan et al. Current Protocols in Protein Science, John Wiley & Sons, Inc.において論じられている。
【0053】
本発明の別の局面は、自由生活生物中の本発明の遺伝子またはポリヌクレオチドのセットである。生物は、休眠または休止状態(例えば、凍結乾燥された状態、グリセロールなどの適切な溶液中に保存された状態、または培地中に保存された状態)であってもよく、または、例えば、SP4などの栄養豊富な培養培地において増殖および/または複製していてもよい。
【0054】
本発明の別の局面は、本発明の遺伝子またはポリヌクレオチドのセットによってコードされるポリペプチドのセットである。本ポリペプチドは、例えば、自由生活生物中に存在していてもよい。
【0055】
本発明の別の局面は、コンピュータ読み取り可能な媒体に記録されている本発明の遺伝子またはポリヌクレオチドのセットである。本明細書中で使用される場合、「コンピュータ読み取り可能な媒体」とは、コンピュータによって直接読み取ることができかつアクセスできる任意の媒体を指す。このような媒体としては以下が挙げられるが、これらに限定されない:磁気記憶媒体、例えば、フロッピーディスク、ハードディスク記憶媒体、および磁気テープ;光学記憶媒体、例えば、CD-ROM;電気記憶媒体(electrical storage media)、例えば、RAMおよびROM;ならびにこれらのカテゴリーのハイブリッド、例えば、磁気/光学記憶媒体。当業者は、本発明のポリヌクレオチド配列またはアミノ酸配列を記録しているコンピュータ読み取り可能な媒体を備える製品を作製するための、任意の現在公知のコンピュータ読み取り可能な媒体の使用法を容易に理解するであろう。
【0056】
本明細書中で使用される場合、「記録される」とは、コンピュータ読み取り可能な媒体に情報を保存するためのプロセスを指す。当業者は、本発明のヌクレオチド配列情報またはアミノ酸配列情報を含む製品を作製するために、コンピュータ読み取り可能な媒体に情報を記録するための任意の現在公知の方法を容易に採用できる。
【0057】
本発明のヌクレオチド配列またはアミノ酸配列のセットを記録しているコンピュータ読み取り可能な媒体を作製するために、種々のデータ記憶構造が当業者にとって使用可能である。データ記憶構造の選択は、一般的に、保存された情報にアクセスするために選択される手段に基づく。さらに、種々のデータプロセッサプログラムおよびフォーマットを用いて、コンピュータ読み取り可能な媒体に本発明のヌクレオチド配列情報を保存することができる。配列情報は、WordPerfectおよびMicrosoft Word等の市販のソフトウェアでフォーマット化された文書処理テキストファイルで表すことができ、またはDB2、Sybase、Oracle等のデータベースアプリケーションで保存された、ASCIIファイルの形式で表すことができる。当業者は、本発明のヌクレオチド配列情報を記録しているコンピュータ読み取り可能な媒体を得るために、任意の数のデータプロセッサ構造化フォーマット(dataprocessor structuring format)(例えば、テキストファイルまたはデータベース)を容易に採用できる。
【0058】
コンピュータ読み取り可能な形式で本発明のヌクレオチド配列またはアミノ酸配列のセットを提供することによって、当業者は、種々の目的のために配列情報に日常的にアクセスすることが出来る。例えば、当業者は、コンピュータ読み取り可能な形式の本発明のヌクレオチド配列またはアミノ酸配列を使用し、これらの配列と、最小限のゲノムの代替型において本発明の配列の代用とされ得るオルソロガス配列とを比較することができる。
【0059】
分析および他の配列との比較のためにコンピュータ読み取り可能な媒体中に提供された配列情報に当業者がアクセスすることを可能にするコンピュータソフトウェアは、公に利用可能である。種々の公知のアルゴリズムが公に開示されており、サーチ手段を実行するための種々の市販のソフトウェアが存在し、かつ本発明のコンピュータベースのシステムにおいて使用され得る。このようなソフトウェアの例としては、MacPattern (EMBL)、BLASTNおよびBLASTX (NCBIA)が挙げられるが、これらに限定されない。
【0060】
例えば、SybaseシステムにおいてBLAST(Altschul et al. (1990) J. MoI. Biol. 215:403-410)およびBLAZE(Brutlag et al. (1993) Comp. Chem. 17:203-207)サーチアルゴリズムを実行するソフトウェアを用いて、他のライブラリ由来のオープンリーディングフレーム(ORF)またはタンパク質に対して相同性を含有する本発明の配列のORFを同定することができる。このようなORFは、タンパク質をコードする断片であり、種々の反応において使用される酵素等の商業的に重要なタンパク質の製造において、および商業的に有用な代謝産物の製造において、有用である。
【0061】
前述において、および下記の実施例において、全ての温度は未修正の摂氏温度で記載され;特に記載されない限り、全ての部およびパーセンテージは重量あたりである。
【0062】
実施例
I−材料および方法
A.細胞およびプラスミド
本発明者らは、American Type Culture Collection(Manassas, VA)から野生型M. ゲニタリウムG37(ATCC(登録商標)番号:33530(商標))を得た。このプロジェクトの一部として、本発明者らは、この細菌のゲノムを再度配列決定し、再度注釈を付けた。新たなM. ゲニタリウムG37配列(Genbankアクセッション番号CP000122)は、34部位において、以前のM. ゲニタリウム(13)ゲノム配列とは異なっていた。以前はフレームシフトを有すると列挙された、MG016、MG017、およびMG018(DEADヘリカーゼ)ならびにMG419およびMG420(DNAポリメラーゼIIIγ/τサブユニット)を含む数個の遺伝子をマージした。本発明者らのトランスポゾン変異誘発ベクターは、テトラサイクリン耐性遺伝子(tetM)(15)と共にTn4001トランスポゾンを含有するプラスミドpIVT-1であるが、これはバーミンガムのアラバマ大学のDr. Kevin Dybvigから供与された。
【0063】
B.エレクトロポレーションによるTn4001を用いたM. ゲニタリウムの形質転換
M. ゲニタリウム細胞のコンフルエントなフラスコを、pH 7.4の8 mM HEPES + 272 mMショ糖で構成されたエレクトロポレーションバッファー(EB)中へ掻き落とすことによって、収集した。本発明者らは、この細胞を洗浄し次いで総量200〜300μlのEB中に再懸濁した。氷上において、細胞100μlを30μgのpIVT-1プラスミドDNAと混合し、冷却した2 mmエレクトロポレーションキュベット(BioRad, Hercules, CA)へ移した。本発明者らは、2500 V、25 μF、および100 Ωを使用して、エレクトロポレーションを行った。エレクトロポレーション後、本発明者らは、37℃のSP4培地1 ml中で細胞を再懸濁し、5% CO2下、37℃で2時間、細胞を回復させた。細胞のアリコート200μlを、2mg/l 塩酸テトラサイクリン(VWR, Bridgeport, NJ)を含有するSP4寒天プレート上へ広げた。コロニーが目に見えるまで、プレートを、5% CO2下、37℃で3〜4週間インキュベートした。コロニーが3〜4週経過した(3-4 weeks old)、本発明者らは、96ウェルプレート中のSP4培地 + 7 mg/Lテトラサイクリン中へ、個々のM. ゲニタリウムコロニーを移した。大部分のウェル中のSP4が酸性に変化し始めて黄色または橙色になるまで(約4日)、本発明者らは、5% CO2下、37℃でプレートをインキュベートした。本発明者らは、それらの変異体保存細胞を-80℃で凍結した。
【0064】
C.DNA抽出のための単離されたコロニーの増幅
本発明者らは、6ウェルプレート中の7μg/mlテトラサイクリンを含有する4 mlのSP4に、トランスポゾン変異体保存細胞20μlを接種し、細胞が100%コンフルエンスに達するまで、5% CO2下、37℃でプレートをインキュベートした。コンフルエントな細胞からゲノムDNAを抽出するために、本発明者らは細胞を掻き落とし、次いで遠心分離によるペレット化のために細胞の懸濁液をチューブへ移した。したがって、非接着細胞は全く失われなかった。本発明者らは、PBS(Mediatech, Herndon, VA)中で該細胞を洗浄し、次いで100μlのPBSとQiagen MagAttract DNA Mini M48 Kit(Qiagen, Valencia, CA)由来の100μlのカオトロピックMTL緩衝液との混合物中でそれらを再懸濁した。Qiagen BioRobot M48ワークステーション(Qiagen)を使用してゲノムDNAが抽出され得るまで、チューブを-20℃で保存した。
【0065】
D.M. ゲニタリウムゲノム鋳型からのDNA配列決定によるTn4001tet挿入部位の位置決め
本発明者らによる20μl配列決定反応物は、約0.5μgのゲノムDNA、6.4 pmolの30塩基オリゴヌクレオチド
(Integrated DNA Technologies, Coralville, IA)を含有した。このプライマーは、前記tetM遺伝子中、トランスポゾン/ゲノム接合部の一方に由来する103塩基対に結合する。BLASTを使用して、本発明者らは、M. ゲニタリウムゲノム上の挿入部位を位置決めした。
【0066】
E.コロニー均質性および遺伝子重複を決定するための定量PCR
本発明者らは、プライマー設計ソフトウェアPrimer Express 1.5(Applied Biosystems)の初期条件を使用して、トランスポゾン挿入部位に隣接する定量PCRプライマー(Integrated DNA Technologies)を設計した。Applied Biosystems 7700 Sequence Detection Systemにおいて行った定量PCRを使用して、本発明者らは、野生型M. ゲニタリウム中のそれらの遺伝子の量と比べて、変異体コロニーから調製されたゲノムDNA中でTn4001挿入が欠如している標的遺伝子の量を決定した。Eurogentec qPCR Mastermix Plus SYBR Green(San Diego, CA)において反応を行った。Eurogentec qPCR Mastermix Plusにおいて行った16S rRNA遺伝子に特異的なTaqMan定量PCRを使用してそれらの相対量を決定した後、ゲノムDNA濃度を標準化した。本発明者らは、ΔΔCt法(16)を使用して野生型における量と比べて変異体ゲノムDNA調製物中で前記トランスポゾンを欠如している標的遺伝子の量を算出した。
【0067】
II.最小限の遺伝子セットの同定
本発明者らは、Tn4001tetに特異的なプライマーを使用して、本発明者らによる変異体のトランスポゾン-ゲノム接合部全体を配列決定した。生存可能な細菌の遺伝子の中央領域におけるトランスポゾンの存在によって、遺伝子が破壊されかつしたがって非必須(不必要)であったことが示された。本発明者らは、トランスポゾン挿入が遺伝子のコード配列の最初の3つのコドンより後かつ3'端側20%より前に存在する場合にのみ、このトランスポゾン挿入が破壊的であると考えた。したがって、挿入部位での短配列のトランスポゾン介在性重複(transposon mediated duplication)から生じる非破壊的な変異(18、19)、および潜在的に重要ではないCOOH端挿入は、遺伝子消費性(gene expendability)について誤った判定を生じさせるものではない。いずれかの特定の理論に拘束されることを望むわけではないが、理論的であるとしても、これらの破壊が実際に生じたこと、および一部の遺伝子はトランスポゾン挿入を許容したことが示唆され、本発明者らにより該遺伝子産物の欠如は認められなかった。遺伝子破壊が重複遺伝子の1コピーにおけるトランスポゾン挿入の結果であったという可能性を排除するために、本発明者らは、PCRを使用し、該挿入を欠如している遺伝子を検出した。これにより、本発明者らは、本発明者らのコロニーのほぼ全てが、Tn4001を有すると同定された遺伝子の破壊型および野生型の両方を含有したことを示した。定量PCRを使用したさらなる分析により、大部分のコロニーが2つまたはそれ以上の変異体の混合物であることが示され、したがって、本発明者らは運用上、それらおよびそれらから単離された任意のDNAを、クローンではなくコロニーと呼ぶ。この細胞凝集(cell clumping)のために、本発明者らは、フィルタークローニング(filter cloning)を使用して個々の変異体を単離した。これを行うために、本発明者らは、プレーティングの前に0.22μmフィルターに細胞を通して、複数の異なる変異体を含有する可能性のある細胞の凝集塊を分解した。本発明者らは、これらの細胞を使用してサブコロニーを作製し、これについて、本発明者らは定量PCRを使用して配列決定および分析の両方を行った。各々の破壊された遺伝子について、本発明者らは、少なくとも1つの初代コロニーをサブクローニングした。
【0068】
本発明者らは、合計3,152個のM. ゲニタリウムトランスポゾン挿入変異体初代コロニー、およびサブコロニーを分析し、Tn4001tet挿入物の位置を決定した。これらの75%について、本発明者らは、配列データを作製し、これによって本発明者らがトランスポゾン挿入部位をマッピングすることが可能になった。複数のTn4001tet挿入を含むコロニーは、このアプローチを使用して特徴決定できなかった。初代コロニーの62%しか、有用な配列を生じなかった。これは恐らく、マイコプラズマ細胞が、配列決定に対する抵抗性が証明された複数の変異体の混合物を含有するコロニーにつながる持続性の細胞凝集を形成する傾向を有するためである可能性があった。サブコロニーについて、成功率は82%であった。配列決定に成功したサブコロニーのうち59%において、前記トランスポゾン挿入物が、親の初代コロニー内とは異なる部位に存在した。ゲノム上に以前はヒットしなかった(unhit)挿入部位を有する変異体を本発明者らが同定した割合は、サブコロニーよりも初代コロニーについての方がより高かった。しかし、新たな挿入部位の集積率は、本発明者らの最初の600コロニーの後に低下し、このことは、本発明者らが全ての非致死的挿入部位の飽和変異誘発へ近づいたことを示している(図1)。
【0069】
本発明者らは、ゲノム上に計2293の異なるトランスポゾン挿入部位をマッピングした(図2)。変異の87%が、タンパク質コード遺伝子中に存在した。43個のRNAコード遺伝子(rRNA、tRNA、または構造RNAについて)のいずれも、挿入を含まかった。栄養豊富な実験室用培地であるSP4(17)における増殖のためにどのM. ゲニタリウム遺伝子が必須でないのかという疑問に取り組むために、本発明者らは以下の基準を使用して遺伝子破壊を計画した。本発明者らは、トランスポゾン挿入が遺伝子のコード配列の最初の3つのコドンより後かつ3'端側20%より前に存在する場合に、そのトランスポゾン挿入が破壊的であると考えた。したがって、挿入部位での短配列のトランスポゾン介在性重複から生じる非破壊的な変異(18、19)、および潜在的に重要ではないCOOH末端挿入は、遺伝子消費性について誤った判定をもたらすものではない。これらの基準を使用して、本発明者らは、計101個の不必要なM. ゲニタリウム遺伝子を同定した(表2)。図1において、初代コロニーおよびサブコロニーの機能として破壊された新たな遺伝子が頭打ちになることが見られ、このことは、本発明者らが全ての非必須遺伝子を破壊したか、ほぼ破壊したことを示唆している。非必須遺伝子におけるトランスポゾン変異体は、固体寒天上においてコロニーを形成し得、単離されたコロニーは、テトラサイクリン選択下においても、液体培養において増殖できた。
【0070】
本発明者らは、本発明者らの破壊遺伝子のいずれかが、その遺伝子の2コピーを有する細胞中に存在するかどうかの決定を所望した。予想外なことに、前記トランスポゾン挿入部位に隣接するプライマーを使用するPCRによって、初めに試験した5個全てのコロニーに由来する野生型鋳型について予想されたサイズの単位複製配列が作製された。PCRの最終段階の分析では、本発明者らが増幅した野生型配列が、標的遺伝子からジャンプした(jump out)低レベルのトランスポゾンに起因したのか、または遺伝子重複が存在したのかを示すことが出来なかった。これに取り組むために、各破壊遺伝子に対する少なくとも1つのコロニーまたはサブコロニーについて、本発明者らは定量PCRを使用し、配列決定されたDNA調製物中に存在する、混入した野生型遺伝子のコピー数を決定した。
【0071】
定量PCR結果の分析によって、大部分のコロニーが複数の変異体の混合物であったことが示された。これは、恐らく、本発明者らによる高い形質転換効率およびマイコプラズマ細胞の凝集傾向の結果であった。直接ゲノム配列決定により、集団の複数のメンバーしか同定されなかった。この問題に取り組むために、本発明者らは、1または2回のフィルタークローニングを含むように、本発明者らの変異体単離プロトコルを適合化させた。関心対象である存在するコロニーを、フィルターサブクローニングした(filter subcloned)。本発明者らは10個のサブコロニーを単離し、それらのTn4001挿入の部位を決定した。本発明者らは、急速に増殖するコロニーおよび出現が遅延したM. ゲニタリウムコロニーの両方を用いた。少数のサブコロニーのみが、親コロニーで見られたのと同一の位置に挿入物を有することが多かった。フィルタークローニング後、本発明者らは、ほぼ全てのサブコロニーが、前記破壊遺伝子の幾分低いレベルの野生型コピーを有したことを依然として見出した。これは、恐らく、Tn4001ジャンピング(jumping)の結果である(20)。サブクローニング後、本発明者らは、1%未満の野生型配列を有した本発明者らの破壊された異なるM. ゲニタリウム遺伝子101個のうちの100個について、遺伝子破壊変異体コロニーを単離することが出来た。
【0072】
いくつかの変異体は注目すべき表現型を現した。変異体の多くが徐々に増殖した一方で、乳酸/リンゴ酸デヒドロゲナーゼにおける変異体(MG460)、ならびに保存された仮定タンパク質MG414およびMG415変異体は、野生型M. ゲニタリウムよりも最大で20%速い倍加時間を有した(データは示さず)。膜タンパク質およびペントースリン酸経路の酵素をコードするトランスケトラーゼ遺伝子(MG066)中にトランスポゾン挿入を有する細胞は、野生型M. ゲニタリウムに特徴的な単層においてではなく凝集化細胞(clumped cell)の鎖において増殖した。他の変異体細胞は、プラスチックへ付着するのではなく懸濁物中で増殖した。一部の細胞は、PBSで洗浄された場合に溶解し、したがって、SP4培地中または100%血清中のいずれかにおいて処理されなければならなかった。
【0073】
本発明者らは、他の部位よりもずっとより頻繁にある部位にトランスポゾン挿入を有する、変異体を単離した(図3)。本発明者らは、以下の4個の遺伝子のホットスポットに変異を有するコロニーを見出した:MG339(recA)、急速に増殖するMG414およびMG415、ならびに全変異体プールの31%を構成するMG428(推定調節タンパク質)。それらの親コロニーとは異なる挿入部位を有するサブコロニーと比べて、初代コロニーの中で最も頻繁に見出されたトランスポゾン挿入部位の顕著な差異が存在した(図3)。本発明者らは、MG414中のTn4001tetが塩基対517,751で挿入された、それらの親コロニーとは異なる挿入部位を有する169個のコロニーおよびサブコロニーを単離した。それらのうちの5個(3%)のみが初代コロニーであった。逆に、本発明者らは、MG415中の、520,114〜520,123領域中に挿入物を有する209個のコロニーを単離したが、それらの56%が初代コロニー中に存在した。MG414変異体は、恐らく、急速な増殖と該ゲノム領域へのTn4001の選択的なジャンピングとの両方を原因とするが、一方、MG415の初代およびサブコロニーのトランスポゾン挿入の高頻度およびほぼ均等な分布は、それらの変異体が他のものよりもより急速に増殖することのみに起因する。
【0074】
III.最小限の遺伝子セットの確認(または修飾)
上述したように、少なくとも386個のタンパク質コード遺伝子および全てのRNA遺伝子が必須であり最小限のセットを形成し得た。しかし、それらの「一度に一つずつ(one-at-a time)」不必要な遺伝子の全てが同時に排除され得ることは、起こりそうもないと思われる。同時に欠失され得るサブセットを決定するために、野生型染色体が合成的に構築される。合成ゲノムは、化学的に合成されたオリゴヌクレオチドから階層的に構築される。次いで、不必要な遺伝子のサブセットが除去される。合成天然染色体および減少したゲノムを、内在の染色体が除去された細胞中への移植によって、生存能力について試験する。遺伝子合成技術の急速な進歩およびゲノム移植法開発への努力によって、上述のM. ゲニタリウム必須遺伝子セットが、真の最小限の遺伝子セットであるということが確認されるか、またはその遺伝子セットを修飾するための基礎が提供される。
【0075】
参考文献
【0076】
表:
(表1)遺伝子の必須性の研究のために使用される細菌中のパラロガス遺伝子ファミリー
【0077】
本発明者らは、より長いタンパク質配列の長さの60%に渡って30%の同一性を有することを要求する、パラロガス遺伝子ファミリーのメンバーについての一般的な定義を使用した(次いで、単連結クラスタリング(single linkage clustering)が、このファミリーを定義する)。
【0078】
(表2)破壊されているTn4001tet挿入を有するマイコプラズマ・ゲニタリウム遺伝子。遺伝子は、機能的役割によって分類されている。
【0079】
全ての情報は、本明細書中に報告されたM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。列は下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 枯草菌において必須であるオルソロガス遺伝子(1)。
B. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256個の遺伝子セット(2)中。
C. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0080】
参考文献
【0081】
(表3)この研究において破壊されなかったマイコプラズマ・ゲニタリウムタンパク質コード遺伝子。遺伝子は、機能的役割によって分類されている。
【0082】
全ての情報は、本明細書中に報告されたM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。タンパク質コード遺伝子についての列は、下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 枯草菌において必須であるオルソロガス遺伝子(1)。
B. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256遺伝子セット(2)中。
C. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0083】
参考文献
【0084】
(表4)Hutchisonらによる1999年の研究において破壊される(不必要である)と報告されなかったが本研究において不必要であると示された、Tn4001tet挿入を有するマイコプラズマ・ゲニタリウム遺伝子。遺伝子は、機能的役割によって分類されている。
【0085】
全ての情報は、本明細書中に報告された新たなM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。列は下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 枯草菌において必須であるオルソロガス遺伝子(1)。
B. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256遺伝子セット(2)中。
C. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0086】
参考文献
【0087】
(表5)Hutchisonらによる1999年の研究において必要であると報告されなかったが本研究において必要であると示された、Tn4001tet挿入を有するマイコプラズマ・ゲニタリウム遺伝子。遺伝子は、機能的役割によって分類されている。
【0088】
全ての情報は、本明細書中に報告されたM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。これらのタンパク質コード遺伝子についての列は、下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 1999年の研究において破壊されたM. ゲニタリウム遺伝子は、「X」で示される。M. ゲニタリウム遺伝子のM. ニューモニエオルソログのみが破壊されたために非必須であると見なされた遺伝子は、「P」で示される。
B. 枯草菌において必須であるオルソロガス遺伝子(1)。
C. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256遺伝子セット(2)中。
D. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0089】
参考文献
【0090】
上述の説明から、当業者は、本発明の本質的な特徴を容易に確認することができ、その精神および範囲から逸脱することなく、本発明の変更および改変を行い、それを種々の用途および条件へ適合化させかつ最大限まで本発明を利用することができる。前述の特定の態様は、単に例示的であって、何であれ決して本発明の範囲を限定するものではないと解釈されるべきである。上記および添付の図面において引用された全ての出願、特許、刊行物(2005年10月12日に出願された米国仮出願第60/725,295号を含む)の全開示は、参照によりそれらの全体が本明細書中に組み込まれる。
【図面の簡単な説明】
【0091】
【図1】分析された初代コロニーおよび親の初代コロニーとは異なる挿入部位を有するサブコロニーの総数の関数としての、新たな破壊されたM. ゲニタリウム遺伝子(上の太線)およびゲノム中の新たなトランスポゾン挿入部位(下の細線)の累積を示す。
【図2】図2A〜2Iは、M. ゲニタリウムの広範囲のトランスポゾン変異誘発を示す。現在の研究からのトランスポゾン挿入の位置は、マップ上の挿入部位の下の△によって示される。遺伝子座(MG###)上の文字は、列挙される遺伝子産物の機能的カテゴリーを指す。 A 補因子、補欠分子族、および担体の生合成 B プリン、ピリミジン、ヌクレオシド、およびヌクレオチド C 細胞エンベロープ D 細胞プロセス E 中心中間代謝(central intermediary metabolism) F DNA代謝 G エネルギー代謝 H 脂肪酸およびリン脂質代謝 I 仮定タンパク質 J タンパク質運命 K タンパク質合成 L 調節機能 M 転写 N 輸送および結合タンパク質 X 未知の機能 P 細胞/生物防御 R rRNAおよびtRNA遺伝子。
【図3】Tn4001tetの挿入の頻度を示す。これらのヒストグラムは、ゲノム中の種々の部位にトランスポゾンの挿入を有する変異体を本発明者らが同定した頻度を示す。横座標は、トランスポゾンが挿入されたM. ゲニタリウムゲノム部位である。一部の変異は、トランスポゾン移動の傾向が非常に高いと認められた。挿入部位が初代クローンとは異なるサブコロニーにおいて、パリンドローム領域および十字型エレメント等の形態的特徴に富む約350,000〜500,000塩基対のゲノム領域へとジャンプする傾向があった(van Noort et al. (2003) Trends Genet 19, 365-369)。
【図4】M. ゲニタリウムがコードする代謝経路および基質輸送機構を示す。黒い四角上の白文字は、本発明者らの現在の遺伝子破壊研究に基づく非必須の機能またはタンパク質を示す。疑問符は、経路を完成させるのに必要であるとは同定されなかった酵素または輸送体を意味し、それらの欠けている(missing)酵素および輸送体名は斜体で示される。輸送体は、細胞膜を貫通している状態で描かれている。矢印は、基質輸送の予測される方向を示す。ABC型輸送体は、基質結合タンパク質については長方形で、膜貫通パーミアーゼについては菱形で、およびATP結合サブユニットについては円形で描かれている。
【技術分野】
【0001】
発明の分野
本発明は、例えば、細菌の非必須遺伝子の同定、および自由生活生物の生存能力を補助するために必要な遺伝子の最小限のセットの同定に関する。なお、本出願は、2005年10月12日に出願された米国仮出願第60/725,295号の出願日の恩典を主張し、これはその全体が参照により本明細書中に組み込まれる。また、本発明の局面は、政府の助成金(DOE付与番号DE-FG02-02ER63453)で成された。政府は、本発明において一定の権利を有する。
【背景技術】
【0002】
背景情報
合成生物学の新規分野における進歩の1つの結果は、所望の表現型を有する生物を作製するために組み立てられ得るパーツの集合としての細胞の新たな考え方である(1)。その観点は、以下の疑問を投げかけるものである:「生物を構築するためにはどれだけ少ないパーツを要するのか?」ストレスがなくかつ全ての必要な栄養素を提供する環境において、最も単純な自由生活生物は何を含むのか?この問題は、本発明者らの研究室および他のところにおいて、理論的におよび実験的に取り組まれてきた。
【0003】
配列決定された最初の2つの細菌ゲノムの比較において、MushegianおよびKooninは、グラム陰性ヘモフィルス・インフルエンザエ(Haemophilus influenzae)ゲノムおよびグラム陽性M. ゲニタリウム(M. genitalium)ゲノムが共に有する256個のオルソロガス遺伝子が細菌生存のための最小限の遺伝子セットに極めて近いと予想した(2)。より最近では、Gilらが、複数の自由生活で内共生の細菌のゲノムの分析に基づき、最小限の細菌遺伝子セットの206タンパク質コード遺伝子コアを提案した(3)。
【0004】
1999年、本発明者らの一部は、M. ゲニタリウムの実験室での増殖に必須ではない遺伝子を実験的に決定するための、広範囲でのトランスポゾン変異誘発の最初の使用を報告した(4)。それ以後、本発明者らのアプローチならびに部位特異的遺伝子ノックアウトおよびアンチセンスRNA等の他の方法を使用する、細菌の必須遺伝子セットの多数のその他の実験的決定が行われている(5〜12)。これらの研究の大部分は、多くは抗生物質標的として使用され得る必須遺伝子を同定するという目的で、ヒト病原体を用いて行われた。これらの生物のほぼ全てが、多くのパラロガス遺伝子ファミリーを含む比較的大きなゲノムを含有する。このような遺伝子の破壊または欠失によりそれらが非必須であることが示されるが、それらの産物が、必須の生物学的機能を行うかどうかは決定されない。本発明者らが仮定的な最小限の遺伝子セットの組成に対して経験的な立証をもたらすのは、ほぼ最小限のゲノムを有する細菌の遺伝子の必須性の研究によってのみである。
【0005】
マイコプラズマとして一般的に公知のモリキューテス(Mollicutes)は、最小限の遺伝子セットを実験的に規定するための優れた実験プラットフォームである。壁を有さないこれらの細菌は、大量のゲノム減少のプロセスによって、ファーミキューテス(Firmicutes)分類群中のより通常の先祖から進化した。マイコプラズマは、ほとんど適応能力を必要としない比較的不変の生態学的地位において生存する偏性寄生生物である。ヒト尿生殖器病原体であるM. ゲニタリウムは、このゲノム節減の極端な発現であり、僅か482個のタンパク質コード遺伝子、および純粋培養で増殖し得る全ての公知の自由生活生物の中で最小の約580kbのゲノムを有する(13)。この細菌は、他の生細胞を含まない寒天プレート上において独立して増殖し得る。遺伝子必須性研究において使用されるより大きなゲノムを有するより一般的な細菌は、平均26%のパラロガス遺伝子ファミリー遺伝子を有するが、M ゲニタリウムは僅か6%しか有さない(表1)。したがって、種々の環境条件に対するゲノムの重複性および偶発性が欠如しているために、M. ゲニタリウムは既にほぼ最小限の細菌細胞となっている。
【0006】
M. ゲニタリウムおよびその最も近い類縁であるマイコプラズマ・ニューモニエ(Mycoplasma pneumoniae)についての必須細菌遺伝子に関する本発明者らの一部による1999年の報告により、これらの2つの種において約2200個のトランスポゾン挿入部位がマッピングされ、130個の推定非必須M. ゲニタリウムタンパク質コード遺伝子またはM. ゲニタリウム遺伝子のM. ニューモニエオルソログが同定された。その報告(Hutchison et al. (1999) Science 286, 2165-9(非特許文献1))において、著者らは、M. ゲニタリウムの265〜350個のタンパク質コード遺伝子が、実験室での増殖条件下で必須であると予測した(4)。しかし、遺伝子の不必要性(dispensability)の証明には、純粋なクローン集団の単離および特徴決定が必要であり、これを彼らは行わなかった。その報告において、著者らは、混合プール中で数週間Tn4001形質転換細胞を増殖させ、次いでそれらの変異体混合物からゲノムDNAを単離した。彼らは、鋳型としてそのDNAを使用した逆PCR由来の単位複製配列を配列決定し、マイコプラズマゲノム中のトランスポゾン挿入部位を同定した。トランスポゾン挿入を含む遺伝子の大部分は、必須ではないと予想される仮定タンパク質(hypothetical protein)または他のタンパク質のいずれかをコードしていた。にもかかわらず、推定破壊遺伝子の一部、例えば、イソロイシルおよびチロシル-tRNA合成酵素(MG345およびMG455)、DNA複製遺伝子dnaA(MG469)、ならびにDNAポリメラーゼIII サブユニットα(MG261)は、必須の機能を行うと考えられる。彼らは、一般的に必須であると考えられている遺伝子がどのように破壊され得るかについて仮説を立てた:遺伝子は、トランスポゾン挿入に対して耐性であり得かつ実際には破壊されない可能性があり、細胞は、2コピーの遺伝子を含有し得、または遺伝子産物が、変異体の同一の混合プール中の他の細胞によって供給され得る。
【0007】
寒天プレートから選定された個々のコロニー中に存在したM. ゲニタリウムTn4001挿入変異体を本発明者らが単離および特徴決定したという拡大された研究が、本明細書中に開示される。この分析は、この最低限の細菌における必須遺伝子の数の新規かつより徹底的な推定値を提供した。
【0008】
【非特許文献1】Hutchison et al. (1999) Science 286, 2165-9
【発明の開示】
【0009】
発明の説明
本発明者は、SP4などの栄養豊富な(rich)細菌培養培地における細菌などの生物の増殖を維持するのに非必須である、101個のタンパク質コード遺伝子を同定した。このような培養培地は、実験室条件下での細菌増殖に必要な塩、増殖因子、栄養素等の全てを含有する。実験室条件下で自由生活生物の生存能力を維持するために必要な遺伝子の最小限のセットは、これらの非必須遺伝子の同定から推定される。「最小限の遺伝子セット」とは、その発現によって上述した特定の栄養豊富な細菌培地における自由生活生物の生存能力(例えば、生存、増殖、複製、繁殖等)が可能になる遺伝子の最小限のセットを意味する。
【0010】
細菌中で破壊されたにもかかわらず生存能力を保持し、かつしたがって増殖には不必要(非必須)であるM. ゲニタリウムの101個のタンパク質コード遺伝子を表2に列挙するが、その機能的役割によって分類されている。破壊されなかった381個の遺伝子を表3にまとめるが、これらも同様に機能的役割によって分類されている。これらの遺伝子は、最小限の必須遺伝子セットの一部を形成する。その他の遺伝子もまた、最小限の遺伝子セットの一部であり得る。少なくとも、これらの他の遺伝子としては、ホスフェートおよび/またはホスホネートについてのABC輸送体、および特定のリポタンパク質および/またはグリセロホスホリルジエステルホスホジエステラーゼについてのタンパク質コード遺伝子;ならびにRNAコード遺伝子が挙げられる。
【0011】
上述したように、本発明者らの一部は、1999年に、生存能力のために必須または使い捨て可能のいずれかであると思われる遺伝子の推定セットを報告した予備的研究を公開した。表4は、不必要であると本研究において同定されたが1999年の論文においてはそのように同定されなかった遺伝子を列挙している。表5は、増殖に必要であると本研究において同定されたが1999年の論文においてはそのように同定されなかった遺伝子を列挙している。
【0012】
本発明の一局面は、SP4などの栄養豊富な細菌培養培地における純培養条件下での自由生活生物の複製に必要な情報を提供するタンパク質コード遺伝子のセット(例えば、タンパク質コード遺伝子の最小限のセット)であって、
該セットが、表2に列挙される101個のタンパク質コード遺伝子のうち少なくとも40個またはそれらの機能的等価物を欠如しており(「欠如遺伝子」)、ここで、表4の遺伝子の少なくとも1つが該欠如遺伝子に含まれ;
該セットが、表5の遺伝子の少なくとも1つを含む、表3に列挙される381個のタンパク質コード遺伝子のうち350〜381個またはそれらの機能的等価物を含み;かつ
該セットが、450個以下のタンパク質コード遺伝子を含む。
【0013】
自由生活生物の複製に必要な「情報を提供する」遺伝子のセットは、(例えば、mRNA、rRNA、またはtRNAへ)転写され得りかつタンパク質コード配列の場合にはタンパク質へ翻訳され得る任意の形態であってよく、ここで、転写/翻訳産物は、自由生活生物が機能するのを可能にする機能を提供する。
【0014】
タンパク質コード遺伝子のこのセットは、自由生活生物中の天然の遺伝子の最も小さな公知のセットであるM. ゲニタリウム中で見られる遺伝子(482個の遺伝子)の完全な相補体よりも小さい。
【0015】
本発明のタンパク質コード遺伝子のセットは、表2に列挙される遺伝子のうち少なくとも約55個(例えば、少なくとも約70、80、または90個)を欠如し得、かつ/または、表3に列挙される遺伝子のうち少なくとも約360個(例えば、少なくとも約370または380個)を含み得る。
【0016】
本発明のセットは、以下をさらに含み得る:
(a)MG410、MG411、およびMG412、ならびに(b)MG289、MG290、およびMG291、ならびにそれらの機能的等価物からなる群より選択される、リン酸取り込みのためのABC輸送体をコードする遺伝子;および/または
MG185およびMG260、ならびにそれらの機能的等価物からなる群より選択される、リポタンパク質コード遺伝子;ならびに/または
MG293およびMG385ならびにそれらの機能的等価物からなる群より選択されるグリセロホスホリルジエステルホスホジエステラーゼ遺伝子。
【0017】
さらに、本発明のセットは、マイコプラズマ・ゲニタリウム(Mycoplasma genitalium)の43個のRNAコード遺伝子、またはそれらの機能的等価物をさらに含み得る。
【0018】
本発明のセット中の遺伝子は、染色体を構成し得;かつ/またはM. ゲニタリウム由来であり得る。
【0019】
本発明の別の局面は、栄養豊富な細菌培養培地(例えば、SP4)において純培養条件下で増殖および複製し得る自由生活生物であって、その遺伝子のセットが本発明のセット、例えば、水素またはエタノールの産生に関与する少なくとも1つの遺伝子を含むセットからなる、自由生活生物である。
【0020】
本発明の別の局面は、遺伝子の機能を決定するための方法であって、該遺伝子をこのような自由生活生物へ挿入するか、該生物中で変異させるか、または該生物から除去する工程、および該生物の特性を評価する工程を含む方法である。
【0021】
本発明の別の局面は、水素またはエタノールの産生法であって、水素またはエタノールが産生されるように、適切な培地において、水素またはエタノールの産生に関与する少なくとも1つの遺伝子を含む本発明の自由生活生物を増殖させる工程を含む方法である。
【0022】
本発明の別の局面は、上述のセットの有効なサブセットである。「有効なサブセット」は、本明細書中で使用される場合、SP4などの栄養豊富な細菌培養培地における自由生活生物の複製のために必要な情報を提供するサブセットを指す。
【0023】
本発明の最小限の遺伝子セットは、種々の用途を有する。例えば、本発明の最小限の遺伝子セットは、ゲノムまたは機能的ゲノムが欠如している、細菌などの微生物の細胞(例えば、ゴースト細胞)中へ導入され得、種々の条件下で細胞増殖、タンパク質合成、複製、または他の細菌機能についての要件を調べるために実験的に使用され得る。ゴースト細胞中の最小限の遺伝子の1つまたは複数を、オルソロガス遺伝子もしくは遺伝子で修飾もしくは置換し、または同じ機能を行うタンパク質を発現する非オルソロガス遺伝子で置換して、それらの遺伝子の構造/機能研究を可能にすることができる。本発明の最小限の遺伝子セットを含む細胞は、該ゲノム中へ一体化されるかまたは1つもしくは複数の独立したプラスミド上で複製する、1つまたは複数の発現可能な異種遺伝子をさらに含むように修飾され得る。これらの細胞は、例えば、異種遺伝子の特性もしくは活性を研究するために(例えば、構造/機能の研究)、または有用な量の異種タンパク質(例えば、生物学的薬物、ワクチン、触媒酵素、エネルギー源等)を作製するために、使用され得る。
【0024】
述べたように、最小限の遺伝子セットとは、栄養豊富な細菌培養培地における自由生活生物の複製に必要な情報を提供するものである。本明細書中に記載される最小限の遺伝子セットは、テトラサイクリン選択(tetMテトラサイクリン耐性遺伝子が非必須であると示された遺伝子を不活性化するために使用されたトランスポゾン中に存在する)の存在下での、培地SP4(その組成は、参考文献番号17に記載されている)における細菌増殖について非必須であると示された遺伝子に基づいて同定された。非必須遺伝子のセットは、異なる条件下(例えば、異なる細菌培地中、異なる選択条件下、等)で増殖した生物について異なり得る。一般的に、可能な限り少ない環境ストレスで、最小限の生物(本明細書中で論じられる遺伝子セットを含有する)の増殖および繁殖を補助する培養培地は、エネルギー源、例えば、グルコース、アルギニン、または尿素;タンパク質またはペプチド;全てのアミノ酸;ヌクレオチド;ビタミン;補因子;脂肪酸および他の膜成分、例えば、コレステロール;酵素補因子;塩;ミネラル、および緩衝液を含有する。
【0025】
そのような培地はSP4(スピロプラズマ(Spiroplasma)培地)であり、これは、ウシ心臓浸出液(beef heart infusion)と、酵母抽出物添加ペプトンと、CMRL 1066培地と、17%ウシ胎仔血清との非常に栄養価の高い混合物である。酵母抽出物はジホスホピリジンヌクレオチドを提供し、血清はコレステロールおよびタンパク質供給源を提供する(例えば、Tully et al. (1979) J. Infect. Dis 139, 478-82を参照のこと)。具体的には、SP4培地は、以下の成分を含有する。
【0026】
混合
マイコプラズマブロスベース(Mycoplasma Broth Base)...3.5g
バクトトリプトン(Bacto Tryptone)...10g
バクトペプトン(Bacto Peptone)...5.3g
蒸留水...600ml
pHを7.5に調節する。
121℃で15分間オートクレーブ処理する。
【0027】
無菌的添加
20%グルコース...25ml
CMRL 1066 (10X)...50ml
7.5%炭酸水素ナトリウム...14.6ml
200mM L-グルタミン...5ml
イーストエキストラクト溶液...35ml
2%オートクレーブ済TC Yeastolate...100ml
ウシ胎仔血清(熱不活性化)...170ml
ペニシリンG(107 IU/ml)...100μl
【0028】
「遺伝子」という用語は、本明細書中で使用される場合、例えば発現制御配列へ操作可能に連結された発現可能な形態の、タンパク質コード配列またはRNAコード配列を含むポリヌクレオチドを指す。遺伝子の「コード配列」は一般に、それらがコード配列中に埋め込まれない限り、発現制御配列を含まない。本発明の種々の態様において、表2〜5に列挙される遺伝子のコード配列は、天然の発現制御配列の制御下であり得るか、もしくは異種発現制御配列の制御下であり得るか、またはそれらの組み合わせであり得る。
【0029】
「発現制御配列」とは、本明細書中で使用される場合、それが機能的に(「操作可能に」)連結されているポリヌクレオチドによってコードされるポリペプチドの発現を調節する、ポリヌクレオチド配列を指す。発現は、mRNAまたはポリペプチドのレベルで調節され得る。したがって、発現制御配列という用語は、mRNA関連要素およびタンパク質関連要素を含む。このような要素としては、プロモーター、プロモーター内のドメイン、リボソーム結合配列、転写ターミネーター等が挙げられる。コード配列の発現を実行または達成するような様式で発現制御配列が配置されている場合、発現制御配列は、ヌクレオチド配列へ操作可能に連結されている。例えば、プロモーターがコード配列の5'へ操作可能に連結されている場合、該コード配列の発現は該プロモーターによって駆動される。
【0030】
本明細書中の実施例において示唆される最小限の遺伝子セットは、マイコプラズマ・ゲニタリウム(M. ゲニタリウム)G37(ATCC 33530)由来の遺伝子または配列から構成される。この細菌の完全ゲノムは、Genbankアクセッション番号L43976として提供される。個々の遺伝子は、MG001、MG002〜MG470としてGenbankリスト中に注釈が付けられている。それらの遺伝子の配列は、2005年10月前半にTIGRのウェブサイト上に公開された。
【0031】
しかし、置換遺伝子がコードするタンパク質またはRNAが発現され得、かつ、最小限の遺伝子セット中のM. ゲニタリウムの遺伝子または配列を置換するのに十分な量の活性、機能、および/または構造を提供するという条件下で、任意の種々の他のタンパク質またはRNAをコードする遺伝子または配列が、最小限の遺伝子セットにおいて、例示されたタンパク質またはRNAをコードする遺伝子または配列を置換できる。このような置換物は、本明細書中で時に、前記例示された遺伝子またはコード配列の「機能的等価物」と呼ばれる。
【0032】
置換され得る適切な遺伝子またはコード配列としては、例えば、M. ゲニタリウム遺伝子の活性な変異体、変種、多型体等;または別の細菌、例えば、種々のマイコプラズマ種(例えば、M. カプリコラム(M. capricolum))由来の対応する(オルソロガス)遺伝子が挙げられる。さらに、前記最小限の遺伝子セット由来の遺伝子または配列は、進化的により多様な生物、例えば、古細菌または真核生物由来のオルソロガス遺伝子で置換され得る。細菌宿主では利用不可能な機構によって、機能するために翻訳後に修飾されなければならない真核生物由来の遺伝子は、当然ながら、使用出来ない。同様に、真核生物遺伝子由来の発現制御配列は、それらが細菌細胞のバックグラウンドにおいて機能できる場合にのみ、使用され得る。
【0033】
本発明の一態様において、前記最小限の遺伝子セット由来の遺伝子は、非オルソロガス遺伝子置換によって(等価な機能または活性を提供する遺伝子の異なるセットによって)置き換えられる。例えば、実施例に示されるようなM. ゲニタリウムの解糖系由来の遺伝子は、エネルギーを産生するための異なる供給源(例えば、尿素の加水分解、アルギニンの発酵等)を利用する異なる生物由来の遺伝子で置換され得る。
【0034】
例えば、M. ゲニタリウムは、解糖を通じてエネルギーを産生する。解糖系の酵素を発現する遺伝子の大部分を不必要にする別の生物由来の異なるエネルギー産生システムを置換できる。例えば、M. ゲニタリウムに密接に関連する細菌である、ウレアプラズマ・パルバム(Ureaplasma parvum)におけるエネルギー産生は、尿素の加水分解に基づく。そのシステムは、ウレアーゼ酵素複合体をコードする8個の遺伝子、2個のアンモニウム輸送体、および未だ同定されていないニッケルイオン輸送体(恐らく、いくつかのU. パルバム陽イオン輸送体の1つである)、および場合によっては尿素輸送体(輸送体は同定されておらず、非常に小さな尿素分子が拡散によって細胞中へ入り得る)を含む。本発明者らは、解糖系酵素および炭水化物輸送体をコードする15〜20個のM. ゲニタリウム遺伝子をこれらの11〜12個のU. パルバム遺伝子で置換することによって、U. パルバムで見られるようなより力強い増殖が可能であるより少ない遺伝子を有する生物が産生されるだろうと予想する。
【0035】
本明細書中で使用される場合、「ポリヌクレオチド」という用語は、Genbankリスト中に提供される一本鎖もしくはそれらに対する完全な相補体に対応する、一本鎖DNA、または該分子の二本鎖形態を含む。RNAおよびDNA様またはRNA様の材料、例えば、分枝DNA、ペプチド核酸(PNA)、またはロックト核酸(locked nucleic acid:LNA)もまた含まれる。
【0036】
変種ポリヌクレオチドがその変化前の元のポリヌクレオチドの少なくとも測定可能な量の機能を提供できるという条件で、遺伝子の機能的等価物はまた、種々の変種ポリヌクレオチドを含み得る。好ましくは、この変種は、元のポリヌクレオチドの機能の少なくとも約50%、75%、90%、または95%を提供し得る。例えば、本明細書中に記載されるポリヌクレオチドの機能的変種としては、縮重コドンを含むポリヌクレオチド;または元のポリヌクレオチドの活性断片であるポリヌクレオチド;または元のポリヌクレオチドと少なくとも約90%の同一性(例えば、少なくとも約95%または98%の同一性)を示すポリヌクレオチド;または高ストリンジェントな条件下で元のポリヌクレオチドへ特異的にハイブリダイズし得るポリヌクレオチドが挙げられる。
【0037】
特記されない限り、「約」という用語は、本明細書中で使用される場合、プラスまたはマイナス10%を指す。したがって、上記で使用される約90%とは、81%〜99%を含む。本明細書中で使用される場合、範囲の端点は、その範囲に含まれる。
【0038】
機能的変種ポリヌクレオチドは、例えば、一塩基変異多型(SNP)、対立遺伝子変種、および変異体を含む天然または非天然の多型を含む、種々の形態であり得る。それらは、例えば、1つまたは複数の付加、挿入、欠失、置換、転位、転換、逆位、染色体転座、オルタナティブスプライシング事象から生じる変種など、またはそれらの任意の組み合わせを含み得る。
【0039】
配列同一性の程度は、従来のアルゴリズム、例えば、LipmanおよびPearson(Proc. Natl. Acad. Sci. 80:726-730, 1983)またはMartinez/Needleman-Wunsch(Nucl Acid Research 11:4629-4634, 1983)によって記載されたものによって得ることが出来る。
【0040】
高ストリンジェントな条件下で第2のポリヌクレオチドに特異的にハイブリダイズするポリヌクレオチドは、そのポリヌクレオチドへ選択的にハイブリダイズする。「高ストリンジェントな」条件とは、例えば、本明細書中で使用される場合、例えば、約5X SSC、0.5% SDS、100μg/ml変性サケ精子DNA、および50%ホルムアミドを含有するハイブリダイゼーション溶液中で、長いポリヌクレオチドプローブと共に、42℃で一晩(例えば、少なくとも12時間)、ブロットまたは他のハイブリダイゼーション反応物をインキュベートすることを意味する。ブロットは、例えば、5%未満のbpミスマッチを許容する高ストリンジェントな条件で洗浄でき(例えば、65℃で30分間、0.1X SSCおよび0.1% SDS中で2回洗浄する)、それによって、例えば95%またはそれ以上の配列同一性を有する配列を選択する。高ストリンジェントな条件の他の非限定的な例としては、30 mM NaClおよび0.5% SDSを含有する水性緩衝液中で65℃での最終洗浄が挙げられる。高ストリンジェントな条件の別の例とは、7% SDS、0.5 M NaPO4、pH 7、1 mM EDTA中、50℃で例えば一晩のハイブリダイゼーション、続いて42℃で1% SDS溶液による1回または複数回の洗浄である。高ストリンジェントな洗浄は5%未満のミスマッチを許容し得るが、低下されたまたは低ストリンジェントな条件は、20%までのヌクレオチドミスマッチを許容し得る。低ストリンジェントなハイブリダイゼーションは、上記のように、但し、より低いホルムアミド条件、より低い温度、および/またはより低い塩濃度、ならびにより長いインキュベーション期間を使用して、達成され得る。
【0041】
本明細書中で示唆される最小限の遺伝子セットは、下記の要因のいくつかを考慮することによって導き出された。さらに、この最小限の遺伝子セットは、下記の要因のいくつかを考慮して、例えば、他の培養条件下での増殖のために修飾され得る。
【0042】
上記のタンパク質コード遺伝子は、本明細書中で記載される実験の条件下での増殖に必須であるようであるが、さらなるタンパク質コード遺伝子が、他の条件下では必要とされ得る。例えば、本発明者らは、本発明者らによる実験期間の間に消費され得たが、その生物の長期間の生存には必要であるかもしれない、DNA代謝遺伝子中の変異体を単離した。これらは、組換えおよびDNA修復に関与する6個の遺伝子であった:recA(MG339)、recU(MG352)、ホリデイジャンクションDNAヘリカーゼ ruvA(MG358)およびruvB(MG359)、DNAから酸化されたプリンを切除するホルムアミドピリジン-DNAグリコシラーゼmutM(MG262.1)、ならびに見込みのある(likely)DNA損傷誘導性タンパク質遺伝子(MG360)。恐らく経時的な細胞損傷の蓄積により、染色体分離タンパク質(chromosome segregation protein)SMC(MG298)および仮定遺伝子MG115(これは、肺炎連鎖球菌(Streptococcus pneumoniae)コンピテンス誘導性(competence-inducible)(cin)オペロンのcinA遺伝子に類似している)における変異体は、継代の繰り返しの後、より不十分に増殖した。
【0043】
そのほぼ最小限の遺伝子セットを用いたとしても、M. ゲニタリウムは、明確な酵素重複性(enzymatic redundancy)を有する。本発明者らは、ホスフェート(MG410、MG411、MG412)および推定ホスホネート(MG289、MG290、MG291)取り込みについての2個の完全なABC輸送体遺伝子カセットを破壊した。PhoU調節タンパク質遺伝子(MG409)は破壊されず、このことは、これが両方のカセットに必要であることを示唆している。ホスフェートとは、取り込まれなければならない必須の代謝産物である。ホスフェートはホスホネート系による緩い基質特異性の結果として両方の輸送体によって取り込まれ得るか、または、ホスフェートとホスホネートとを相互交換する代謝能力が存在するかのいずれかである。本発明者らは、これら3個の遺伝子カセットの両方を破壊したが、細胞は、恐らく、少なくとも1つのホスフェート輸送体を必要とする。したがって、最小限の遺伝子セットは、好ましくは、ホスフェート取り込みのための3個のABC輸送体遺伝子を含有する。緩い基質特異性は、それによってM. ゲニタリウムがより少ない遺伝子でその代謝要求を満たす機構として複数のM. ゲニタリウム酵素について提唱および示される、繰り返されるテーマである(21、22)。
【0044】
M. ゲニタリウムは解糖を通じてATPを産生し、初期解糖反応に関与する酵素をコードする遺伝子のいずれも破壊されなかったが、2個のエネルギー産生遺伝子の変異は、この必須の経路においてより予想外のゲノム重複性があり得ることが示された。本発明者らは、乳酸/リンゴ酸デヒドロゲナーゼ(MG460)およびピルビン酸デヒドロゲナーゼ複合体のジヒドロリポアミドデヒドロゲナーゼサブユニット(MG271)をコードする遺伝子における生存可能な挿入変異体を同定した。これらのデヒドロゲナーゼのいずれかにおける変異は、解糖ATP産生、ならびに、解糖における主な酸化剤および還元剤であるNAD+およびNADHのアンバランスなレベルを有すると予想された。これらの変異は、大きく低下した増殖速度および増殖培地の酸性化の促進を伴うと考えられる。MG271変異体は、野生型細胞よりも約20%遅い増殖を示したが、不可解なことに、乳酸デヒドロゲナーゼ変異体は、約20%速い増殖を示した。本発明者らはまた、リン脂質生合成酵素である、グリセロール-3-リン酸デヒドロゲナーゼ(MG039)における変異体を単離した。これらの変異体における機能喪失は、他のM. ゲニタリウムデヒドロゲナーゼまたはレダクターゼによって補償できた。これは、乳酸/リンゴ酸デヒドロゲナーゼ(21)およびヌクレオチドキナーゼ(22)について報告された、緩い基質特異性を有するマイコプラズマ酵素のもう1つの例であり得る。
【0045】
本発明者らの実験室条件下で、本発明者らは、101個の非必須タンパク質コード遺伝子を同定した。残りの381個のM. ゲニタリウムタンパク質コード遺伝子、および3個のリン酸輸送体遺伝子、および43個のRNAコード遺伝子は、この最小限の細胞について必須遺伝子セットを構成すると思われる(表3)。本発明者らは、12のM. ゲニタリウムパラロガス遺伝子ファミリーのうち5つのみにおいて遺伝子を破壊した。リポタンパク質MG185およびMG260ならびにグリセロホスホリルジエステルホスホジエステラーゼMG293およびMG385から構成される2つのファミリーについてのみ、本発明者らは、全てのメンバーを破壊した。したがって、これらのファミリーの機能は必須であり得、本発明者らは、前記必須遺伝子セットの本発明者らの予測を386個の遺伝子まで拡大し、それらを含めた(MG185またはMG260の各1個、ならびにMG293およびMG385の各1個)。これは、M. ゲニタリウムと同一のファーミキューテス分類群由来のより一般的な細菌である枯草菌(B. subtilis)において279個の必須遺伝子を同定した遺伝子ノックアウト/破壊研究(6)において、または、M. ゲニタリウムについての本発明者らの以前の研究(4)において予測された265〜350個よりも顕著に大きな数の必須遺伝子である。同様に、必須タンパク質コード遺伝子386個という本発明者らの知見は、いくつの遺伝子が最小限のゲノムを構成するかという理論的予測、例えば、H. インフルエンザエおよびM. ゲニタリウムの両方が共に有するMushegianおよびKooninの遺伝子256個(2)、ならびにGilらによって提唱された最小限の細菌遺伝子セットの206遺伝子コア(3)を大きく超える。本発明の必須遺伝子セットについての驚きの1つは、それが108個の仮定タンパク質および機能未知のタンパク質を含むことである。
【0046】
これらのデータは、386個のタンパク質コード遺伝子および43個の構造RNA遺伝子をコードするように構築されたゲノムは、マイコプラズマ・ラボラトリウム(Mycoplasma laboratorium)と仮定的に呼ばれてきた、生存可能な合成細胞を維持し得ることを示唆している(24)。種々の機構が、このような生存可能な合成細胞を調製するために使用され得る。例えば、前記最小限の遺伝子セットは、内在のゲノムが除去されたかまたは無能にされた、ゴースト細胞中へ導入され得る。一態様において、リボソーム、膜、および、遺伝子調節、転写、翻訳、転写後修飾、分泌、栄養素や他の物質の取込み等に重要な他の細胞成分が、ゴースト細胞中に存在する。別の態様において、1つまたは複数のこれらの成分は、合成的に調製される。
【0047】
本発明の一態様において、最小限の遺伝子セット中の遺伝子またはそれらの遺伝子のサブセットは、例えばライブラリを形成するために、従来のベクター中へクローニングされる。クローニングされるDNAは、天然の遺伝子、異なるベクター中へ以前にクローニングされた遺伝子、または人工的に合成された遺伝子を含む、任意の適切な供給源から得ることが出来る。これらの遺伝子は、インビトロで、合成手順により、例えば、参照によりその全体が本明細書中に組み込まれる、2006年5月1日に出願された同時係属中のPCT出願PCT/2006/16349「Amplification and Cloning of Single DNA Molecules Using Rolling Circle Amplification」に開示された手順により、クローニングできる。例えば、遺伝子セットの合成的に調製された遺伝子は、合成遺伝子またはゲノムを形成するために増幅およびアセンブルされ得る。これは、希釈されたDNAの各試料が平均で1分子のDNAを例えば約5kbの断片中に含有するようにDNA分子を希釈し、次いで一本鎖DNA環へ変換し、次いでΦ29ポリメラーゼを使用してこのDNA環を増幅することによって行われ得る。
【0048】
ライブラリとして、本発明の遺伝子セットを、任意の形態で、単一または複数コピーで配置でき、遺伝子の1つの断片、遺伝子の1つ、または遺伝子の2つ以上をそれぞれ有する個々のオリゴヌクレオチド中に配置できる。これらのオリゴヌクレオチドは、カセットとして配置され得る。このカセットは、本発明の遺伝子セットの全ての遺伝子を含むまたはこれらからなる最小限のゲノムを含む、より大きな遺伝子アセンブリを形成するために、連結され得る。遺伝子は、参照によりその全体が本明細書中に組み込まれる、2006年8月11日に出願されたPCT国際特許出願第PCT/US06/31214号「Method For In Vitro Recombination Employing a 3' Exonuclease Activity」に記載されるような方法によってアセンブルされ得る。PCT/US06/31214は、遺伝子のカセットを連結してより大きなアセンブリとする方法を記載しており、これは、本発明の遺伝子セットを含む単一DNA分子を作製するために使用され得る。特に、この出願は、関心対象の2つまたはそれ以上の二本鎖(ds)DNA分子を連結するために単離されたタンパク質を使用するインビトロ法を記載しており、ここで、各対の第1のDNA分子の遠位領域と第2のDNA分子の近位領域は、少なくとも20個の非パリンドロームヌクレオチド(nt)を含む配列同一性の領域を共に有し、該方法は、以下を含む:(a)その対の配列相同性の領域へ特異的にハイブリダイズするのに十分な長さの配列相同性の領域を含む各DNA分子の一本鎖オーバーハング部分を生じさせるに有効な条件下で、エキソヌクレアーゼ活性を有する酵素で前記DNA分子を処理する工程;(b)一本鎖オーバーハング部分の特異的アニーリングを達成するのに有効な条件下で、(a)で処理されたDNA分子をインキュベートする工程;ならびに(c)残りの一本鎖ギャップを埋めかつしたがって形成された切れ目をふさぐのに有効な条件下で、(b)でインキュベートされたDNA分子を処理する工程。
【0049】
ライブラリのDNA分子は、任意の実際的な長さのサイズを有し得る。dsDNAが環状化するためのサイズ下限値は、約200塩基対である。したがって、連結された断片の全長(場合によっては、ベクターの長さを含む)は、好ましくは、少なくとも約200bp長である。前記DNAは、環状または線状分子のいずれかの形態をとり得る。ライブラリは、共に連結され得る2個〜非常に多数のDNA分子を含み得る。一般的に、少なくとも約10個の断片が連結され得る。
【0050】
より具体的には、1回または数回のアセンブリ段階において、最終生成物を作製するために連結され得るDNA分子またはカセットの数は、少なくともまたは最大で約2、3、4、6、8、10、15、20、25、50、100、200、500、1000、5000、もしくは10,000個のDNA分子、例えば約4個〜約100個の分子の範囲内であり得る。本発明のライブラリ中のDNA分子またはカセットは、各々、少なくともまたは最大で約80 bs、100 bs、500 bs、1 kb、3 kb、5 kb、6 kb、10 kb、18 kb、20 kb、25 kb、32 kb、50 kb、65 kb、75 kb、150 kb、300 kb、500 kb、600 kb、またはそれ以上の範囲内、例えば、約3 kb〜約100 kbの範囲内の出発サイズを有する。本発明によれば、方法は、約600 kbのDNA分子への各々約6 kbのカセット約100個のアセンブリについて使用され得る。
【0051】
本発明の一態様は、カセット、例えば、本発明の遺伝子セット中に含まれる遺伝子またはゲノムの隣接領域を示す5〜6 kbのDNA分子を連結し、コンビナトリアルアセンブリ(combinatorial assembly)を作製することである。例えば、1つもしくは複数の遺伝子が排除または変異され、かつ/または1つもしくは複数の追加の遺伝子が付加されるように、細菌ゲノム、例えば、推定最小限ゲノムまたは最小限ゲノムを修飾することは、興味深いと思われる。そのような修飾は、例えば約5〜6 kbの適切なカセットへとゲノムを分割し、所望の修飾を含むカセットで元のカセットを置換することで修飾ゲノムをアセンブルすることによって、行われ得る。さらに、同時に種々の変化(例えば、関心対象の遺伝子の種々の修飾、種々の代替遺伝子の付加、1つまたは複数の遺伝子の排除等)を導入することが望ましい場合、コンビナトリアルアセンブリにおいて、種々の修飾に対応する種々のカセットを使用して、同時に多数のゲノムをアセンブルすることが出来る。多数の修飾配列がアセンブルされた後、好ましくはハイスループット様式で、どの修飾がゲノム(またはゲノムを含む生物)に対して所望の特性を付与するかを決定するために、修飾されたゲノムの各々の特性が試験され得る。この「異質なものを組み合わせる(mix and match)」手順によって、特性が比較され得る種々の試験用ゲノムまたは生物が作製される。全手順が、再帰的様式で所望の通り繰り返され得る。
【0052】
クローニングの方法、および本発明と共に使用される多くの他の分子生物学的方法は、例えば、Sambrook, et al. (1989), Molecular Cloning, a Laboratory Manual, Cold Harbor Laboratory Press, Cold Spring Harbor, N.Y.;Ausubel et al. (1995). Current Protocols in Molecular Biology, N. Y., John Wiley & Sons;Davis et al. (1986), Basic Methods in Molecular Biology, Elseveir Sciences Publishing,, Inc., New York;Hames et al. (1985), Nucleic Acid Hybridization, IL Press;Dracopoli et al. Current Protocols in Human Genetics, John Wiley & Sons, Inc.;およびColigan et al. Current Protocols in Protein Science, John Wiley & Sons, Inc.において論じられている。
【0053】
本発明の別の局面は、自由生活生物中の本発明の遺伝子またはポリヌクレオチドのセットである。生物は、休眠または休止状態(例えば、凍結乾燥された状態、グリセロールなどの適切な溶液中に保存された状態、または培地中に保存された状態)であってもよく、または、例えば、SP4などの栄養豊富な培養培地において増殖および/または複製していてもよい。
【0054】
本発明の別の局面は、本発明の遺伝子またはポリヌクレオチドのセットによってコードされるポリペプチドのセットである。本ポリペプチドは、例えば、自由生活生物中に存在していてもよい。
【0055】
本発明の別の局面は、コンピュータ読み取り可能な媒体に記録されている本発明の遺伝子またはポリヌクレオチドのセットである。本明細書中で使用される場合、「コンピュータ読み取り可能な媒体」とは、コンピュータによって直接読み取ることができかつアクセスできる任意の媒体を指す。このような媒体としては以下が挙げられるが、これらに限定されない:磁気記憶媒体、例えば、フロッピーディスク、ハードディスク記憶媒体、および磁気テープ;光学記憶媒体、例えば、CD-ROM;電気記憶媒体(electrical storage media)、例えば、RAMおよびROM;ならびにこれらのカテゴリーのハイブリッド、例えば、磁気/光学記憶媒体。当業者は、本発明のポリヌクレオチド配列またはアミノ酸配列を記録しているコンピュータ読み取り可能な媒体を備える製品を作製するための、任意の現在公知のコンピュータ読み取り可能な媒体の使用法を容易に理解するであろう。
【0056】
本明細書中で使用される場合、「記録される」とは、コンピュータ読み取り可能な媒体に情報を保存するためのプロセスを指す。当業者は、本発明のヌクレオチド配列情報またはアミノ酸配列情報を含む製品を作製するために、コンピュータ読み取り可能な媒体に情報を記録するための任意の現在公知の方法を容易に採用できる。
【0057】
本発明のヌクレオチド配列またはアミノ酸配列のセットを記録しているコンピュータ読み取り可能な媒体を作製するために、種々のデータ記憶構造が当業者にとって使用可能である。データ記憶構造の選択は、一般的に、保存された情報にアクセスするために選択される手段に基づく。さらに、種々のデータプロセッサプログラムおよびフォーマットを用いて、コンピュータ読み取り可能な媒体に本発明のヌクレオチド配列情報を保存することができる。配列情報は、WordPerfectおよびMicrosoft Word等の市販のソフトウェアでフォーマット化された文書処理テキストファイルで表すことができ、またはDB2、Sybase、Oracle等のデータベースアプリケーションで保存された、ASCIIファイルの形式で表すことができる。当業者は、本発明のヌクレオチド配列情報を記録しているコンピュータ読み取り可能な媒体を得るために、任意の数のデータプロセッサ構造化フォーマット(dataprocessor structuring format)(例えば、テキストファイルまたはデータベース)を容易に採用できる。
【0058】
コンピュータ読み取り可能な形式で本発明のヌクレオチド配列またはアミノ酸配列のセットを提供することによって、当業者は、種々の目的のために配列情報に日常的にアクセスすることが出来る。例えば、当業者は、コンピュータ読み取り可能な形式の本発明のヌクレオチド配列またはアミノ酸配列を使用し、これらの配列と、最小限のゲノムの代替型において本発明の配列の代用とされ得るオルソロガス配列とを比較することができる。
【0059】
分析および他の配列との比較のためにコンピュータ読み取り可能な媒体中に提供された配列情報に当業者がアクセスすることを可能にするコンピュータソフトウェアは、公に利用可能である。種々の公知のアルゴリズムが公に開示されており、サーチ手段を実行するための種々の市販のソフトウェアが存在し、かつ本発明のコンピュータベースのシステムにおいて使用され得る。このようなソフトウェアの例としては、MacPattern (EMBL)、BLASTNおよびBLASTX (NCBIA)が挙げられるが、これらに限定されない。
【0060】
例えば、SybaseシステムにおいてBLAST(Altschul et al. (1990) J. MoI. Biol. 215:403-410)およびBLAZE(Brutlag et al. (1993) Comp. Chem. 17:203-207)サーチアルゴリズムを実行するソフトウェアを用いて、他のライブラリ由来のオープンリーディングフレーム(ORF)またはタンパク質に対して相同性を含有する本発明の配列のORFを同定することができる。このようなORFは、タンパク質をコードする断片であり、種々の反応において使用される酵素等の商業的に重要なタンパク質の製造において、および商業的に有用な代謝産物の製造において、有用である。
【0061】
前述において、および下記の実施例において、全ての温度は未修正の摂氏温度で記載され;特に記載されない限り、全ての部およびパーセンテージは重量あたりである。
【0062】
実施例
I−材料および方法
A.細胞およびプラスミド
本発明者らは、American Type Culture Collection(Manassas, VA)から野生型M. ゲニタリウムG37(ATCC(登録商標)番号:33530(商標))を得た。このプロジェクトの一部として、本発明者らは、この細菌のゲノムを再度配列決定し、再度注釈を付けた。新たなM. ゲニタリウムG37配列(Genbankアクセッション番号CP000122)は、34部位において、以前のM. ゲニタリウム(13)ゲノム配列とは異なっていた。以前はフレームシフトを有すると列挙された、MG016、MG017、およびMG018(DEADヘリカーゼ)ならびにMG419およびMG420(DNAポリメラーゼIIIγ/τサブユニット)を含む数個の遺伝子をマージした。本発明者らのトランスポゾン変異誘発ベクターは、テトラサイクリン耐性遺伝子(tetM)(15)と共にTn4001トランスポゾンを含有するプラスミドpIVT-1であるが、これはバーミンガムのアラバマ大学のDr. Kevin Dybvigから供与された。
【0063】
B.エレクトロポレーションによるTn4001を用いたM. ゲニタリウムの形質転換
M. ゲニタリウム細胞のコンフルエントなフラスコを、pH 7.4の8 mM HEPES + 272 mMショ糖で構成されたエレクトロポレーションバッファー(EB)中へ掻き落とすことによって、収集した。本発明者らは、この細胞を洗浄し次いで総量200〜300μlのEB中に再懸濁した。氷上において、細胞100μlを30μgのpIVT-1プラスミドDNAと混合し、冷却した2 mmエレクトロポレーションキュベット(BioRad, Hercules, CA)へ移した。本発明者らは、2500 V、25 μF、および100 Ωを使用して、エレクトロポレーションを行った。エレクトロポレーション後、本発明者らは、37℃のSP4培地1 ml中で細胞を再懸濁し、5% CO2下、37℃で2時間、細胞を回復させた。細胞のアリコート200μlを、2mg/l 塩酸テトラサイクリン(VWR, Bridgeport, NJ)を含有するSP4寒天プレート上へ広げた。コロニーが目に見えるまで、プレートを、5% CO2下、37℃で3〜4週間インキュベートした。コロニーが3〜4週経過した(3-4 weeks old)、本発明者らは、96ウェルプレート中のSP4培地 + 7 mg/Lテトラサイクリン中へ、個々のM. ゲニタリウムコロニーを移した。大部分のウェル中のSP4が酸性に変化し始めて黄色または橙色になるまで(約4日)、本発明者らは、5% CO2下、37℃でプレートをインキュベートした。本発明者らは、それらの変異体保存細胞を-80℃で凍結した。
【0064】
C.DNA抽出のための単離されたコロニーの増幅
本発明者らは、6ウェルプレート中の7μg/mlテトラサイクリンを含有する4 mlのSP4に、トランスポゾン変異体保存細胞20μlを接種し、細胞が100%コンフルエンスに達するまで、5% CO2下、37℃でプレートをインキュベートした。コンフルエントな細胞からゲノムDNAを抽出するために、本発明者らは細胞を掻き落とし、次いで遠心分離によるペレット化のために細胞の懸濁液をチューブへ移した。したがって、非接着細胞は全く失われなかった。本発明者らは、PBS(Mediatech, Herndon, VA)中で該細胞を洗浄し、次いで100μlのPBSとQiagen MagAttract DNA Mini M48 Kit(Qiagen, Valencia, CA)由来の100μlのカオトロピックMTL緩衝液との混合物中でそれらを再懸濁した。Qiagen BioRobot M48ワークステーション(Qiagen)を使用してゲノムDNAが抽出され得るまで、チューブを-20℃で保存した。
【0065】
D.M. ゲニタリウムゲノム鋳型からのDNA配列決定によるTn4001tet挿入部位の位置決め
本発明者らによる20μl配列決定反応物は、約0.5μgのゲノムDNA、6.4 pmolの30塩基オリゴヌクレオチド
(Integrated DNA Technologies, Coralville, IA)を含有した。このプライマーは、前記tetM遺伝子中、トランスポゾン/ゲノム接合部の一方に由来する103塩基対に結合する。BLASTを使用して、本発明者らは、M. ゲニタリウムゲノム上の挿入部位を位置決めした。
【0066】
E.コロニー均質性および遺伝子重複を決定するための定量PCR
本発明者らは、プライマー設計ソフトウェアPrimer Express 1.5(Applied Biosystems)の初期条件を使用して、トランスポゾン挿入部位に隣接する定量PCRプライマー(Integrated DNA Technologies)を設計した。Applied Biosystems 7700 Sequence Detection Systemにおいて行った定量PCRを使用して、本発明者らは、野生型M. ゲニタリウム中のそれらの遺伝子の量と比べて、変異体コロニーから調製されたゲノムDNA中でTn4001挿入が欠如している標的遺伝子の量を決定した。Eurogentec qPCR Mastermix Plus SYBR Green(San Diego, CA)において反応を行った。Eurogentec qPCR Mastermix Plusにおいて行った16S rRNA遺伝子に特異的なTaqMan定量PCRを使用してそれらの相対量を決定した後、ゲノムDNA濃度を標準化した。本発明者らは、ΔΔCt法(16)を使用して野生型における量と比べて変異体ゲノムDNA調製物中で前記トランスポゾンを欠如している標的遺伝子の量を算出した。
【0067】
II.最小限の遺伝子セットの同定
本発明者らは、Tn4001tetに特異的なプライマーを使用して、本発明者らによる変異体のトランスポゾン-ゲノム接合部全体を配列決定した。生存可能な細菌の遺伝子の中央領域におけるトランスポゾンの存在によって、遺伝子が破壊されかつしたがって非必須(不必要)であったことが示された。本発明者らは、トランスポゾン挿入が遺伝子のコード配列の最初の3つのコドンより後かつ3'端側20%より前に存在する場合にのみ、このトランスポゾン挿入が破壊的であると考えた。したがって、挿入部位での短配列のトランスポゾン介在性重複(transposon mediated duplication)から生じる非破壊的な変異(18、19)、および潜在的に重要ではないCOOH端挿入は、遺伝子消費性(gene expendability)について誤った判定を生じさせるものではない。いずれかの特定の理論に拘束されることを望むわけではないが、理論的であるとしても、これらの破壊が実際に生じたこと、および一部の遺伝子はトランスポゾン挿入を許容したことが示唆され、本発明者らにより該遺伝子産物の欠如は認められなかった。遺伝子破壊が重複遺伝子の1コピーにおけるトランスポゾン挿入の結果であったという可能性を排除するために、本発明者らは、PCRを使用し、該挿入を欠如している遺伝子を検出した。これにより、本発明者らは、本発明者らのコロニーのほぼ全てが、Tn4001を有すると同定された遺伝子の破壊型および野生型の両方を含有したことを示した。定量PCRを使用したさらなる分析により、大部分のコロニーが2つまたはそれ以上の変異体の混合物であることが示され、したがって、本発明者らは運用上、それらおよびそれらから単離された任意のDNAを、クローンではなくコロニーと呼ぶ。この細胞凝集(cell clumping)のために、本発明者らは、フィルタークローニング(filter cloning)を使用して個々の変異体を単離した。これを行うために、本発明者らは、プレーティングの前に0.22μmフィルターに細胞を通して、複数の異なる変異体を含有する可能性のある細胞の凝集塊を分解した。本発明者らは、これらの細胞を使用してサブコロニーを作製し、これについて、本発明者らは定量PCRを使用して配列決定および分析の両方を行った。各々の破壊された遺伝子について、本発明者らは、少なくとも1つの初代コロニーをサブクローニングした。
【0068】
本発明者らは、合計3,152個のM. ゲニタリウムトランスポゾン挿入変異体初代コロニー、およびサブコロニーを分析し、Tn4001tet挿入物の位置を決定した。これらの75%について、本発明者らは、配列データを作製し、これによって本発明者らがトランスポゾン挿入部位をマッピングすることが可能になった。複数のTn4001tet挿入を含むコロニーは、このアプローチを使用して特徴決定できなかった。初代コロニーの62%しか、有用な配列を生じなかった。これは恐らく、マイコプラズマ細胞が、配列決定に対する抵抗性が証明された複数の変異体の混合物を含有するコロニーにつながる持続性の細胞凝集を形成する傾向を有するためである可能性があった。サブコロニーについて、成功率は82%であった。配列決定に成功したサブコロニーのうち59%において、前記トランスポゾン挿入物が、親の初代コロニー内とは異なる部位に存在した。ゲノム上に以前はヒットしなかった(unhit)挿入部位を有する変異体を本発明者らが同定した割合は、サブコロニーよりも初代コロニーについての方がより高かった。しかし、新たな挿入部位の集積率は、本発明者らの最初の600コロニーの後に低下し、このことは、本発明者らが全ての非致死的挿入部位の飽和変異誘発へ近づいたことを示している(図1)。
【0069】
本発明者らは、ゲノム上に計2293の異なるトランスポゾン挿入部位をマッピングした(図2)。変異の87%が、タンパク質コード遺伝子中に存在した。43個のRNAコード遺伝子(rRNA、tRNA、または構造RNAについて)のいずれも、挿入を含まかった。栄養豊富な実験室用培地であるSP4(17)における増殖のためにどのM. ゲニタリウム遺伝子が必須でないのかという疑問に取り組むために、本発明者らは以下の基準を使用して遺伝子破壊を計画した。本発明者らは、トランスポゾン挿入が遺伝子のコード配列の最初の3つのコドンより後かつ3'端側20%より前に存在する場合に、そのトランスポゾン挿入が破壊的であると考えた。したがって、挿入部位での短配列のトランスポゾン介在性重複から生じる非破壊的な変異(18、19)、および潜在的に重要ではないCOOH末端挿入は、遺伝子消費性について誤った判定をもたらすものではない。これらの基準を使用して、本発明者らは、計101個の不必要なM. ゲニタリウム遺伝子を同定した(表2)。図1において、初代コロニーおよびサブコロニーの機能として破壊された新たな遺伝子が頭打ちになることが見られ、このことは、本発明者らが全ての非必須遺伝子を破壊したか、ほぼ破壊したことを示唆している。非必須遺伝子におけるトランスポゾン変異体は、固体寒天上においてコロニーを形成し得、単離されたコロニーは、テトラサイクリン選択下においても、液体培養において増殖できた。
【0070】
本発明者らは、本発明者らの破壊遺伝子のいずれかが、その遺伝子の2コピーを有する細胞中に存在するかどうかの決定を所望した。予想外なことに、前記トランスポゾン挿入部位に隣接するプライマーを使用するPCRによって、初めに試験した5個全てのコロニーに由来する野生型鋳型について予想されたサイズの単位複製配列が作製された。PCRの最終段階の分析では、本発明者らが増幅した野生型配列が、標的遺伝子からジャンプした(jump out)低レベルのトランスポゾンに起因したのか、または遺伝子重複が存在したのかを示すことが出来なかった。これに取り組むために、各破壊遺伝子に対する少なくとも1つのコロニーまたはサブコロニーについて、本発明者らは定量PCRを使用し、配列決定されたDNA調製物中に存在する、混入した野生型遺伝子のコピー数を決定した。
【0071】
定量PCR結果の分析によって、大部分のコロニーが複数の変異体の混合物であったことが示された。これは、恐らく、本発明者らによる高い形質転換効率およびマイコプラズマ細胞の凝集傾向の結果であった。直接ゲノム配列決定により、集団の複数のメンバーしか同定されなかった。この問題に取り組むために、本発明者らは、1または2回のフィルタークローニングを含むように、本発明者らの変異体単離プロトコルを適合化させた。関心対象である存在するコロニーを、フィルターサブクローニングした(filter subcloned)。本発明者らは10個のサブコロニーを単離し、それらのTn4001挿入の部位を決定した。本発明者らは、急速に増殖するコロニーおよび出現が遅延したM. ゲニタリウムコロニーの両方を用いた。少数のサブコロニーのみが、親コロニーで見られたのと同一の位置に挿入物を有することが多かった。フィルタークローニング後、本発明者らは、ほぼ全てのサブコロニーが、前記破壊遺伝子の幾分低いレベルの野生型コピーを有したことを依然として見出した。これは、恐らく、Tn4001ジャンピング(jumping)の結果である(20)。サブクローニング後、本発明者らは、1%未満の野生型配列を有した本発明者らの破壊された異なるM. ゲニタリウム遺伝子101個のうちの100個について、遺伝子破壊変異体コロニーを単離することが出来た。
【0072】
いくつかの変異体は注目すべき表現型を現した。変異体の多くが徐々に増殖した一方で、乳酸/リンゴ酸デヒドロゲナーゼにおける変異体(MG460)、ならびに保存された仮定タンパク質MG414およびMG415変異体は、野生型M. ゲニタリウムよりも最大で20%速い倍加時間を有した(データは示さず)。膜タンパク質およびペントースリン酸経路の酵素をコードするトランスケトラーゼ遺伝子(MG066)中にトランスポゾン挿入を有する細胞は、野生型M. ゲニタリウムに特徴的な単層においてではなく凝集化細胞(clumped cell)の鎖において増殖した。他の変異体細胞は、プラスチックへ付着するのではなく懸濁物中で増殖した。一部の細胞は、PBSで洗浄された場合に溶解し、したがって、SP4培地中または100%血清中のいずれかにおいて処理されなければならなかった。
【0073】
本発明者らは、他の部位よりもずっとより頻繁にある部位にトランスポゾン挿入を有する、変異体を単離した(図3)。本発明者らは、以下の4個の遺伝子のホットスポットに変異を有するコロニーを見出した:MG339(recA)、急速に増殖するMG414およびMG415、ならびに全変異体プールの31%を構成するMG428(推定調節タンパク質)。それらの親コロニーとは異なる挿入部位を有するサブコロニーと比べて、初代コロニーの中で最も頻繁に見出されたトランスポゾン挿入部位の顕著な差異が存在した(図3)。本発明者らは、MG414中のTn4001tetが塩基対517,751で挿入された、それらの親コロニーとは異なる挿入部位を有する169個のコロニーおよびサブコロニーを単離した。それらのうちの5個(3%)のみが初代コロニーであった。逆に、本発明者らは、MG415中の、520,114〜520,123領域中に挿入物を有する209個のコロニーを単離したが、それらの56%が初代コロニー中に存在した。MG414変異体は、恐らく、急速な増殖と該ゲノム領域へのTn4001の選択的なジャンピングとの両方を原因とするが、一方、MG415の初代およびサブコロニーのトランスポゾン挿入の高頻度およびほぼ均等な分布は、それらの変異体が他のものよりもより急速に増殖することのみに起因する。
【0074】
III.最小限の遺伝子セットの確認(または修飾)
上述したように、少なくとも386個のタンパク質コード遺伝子および全てのRNA遺伝子が必須であり最小限のセットを形成し得た。しかし、それらの「一度に一つずつ(one-at-a time)」不必要な遺伝子の全てが同時に排除され得ることは、起こりそうもないと思われる。同時に欠失され得るサブセットを決定するために、野生型染色体が合成的に構築される。合成ゲノムは、化学的に合成されたオリゴヌクレオチドから階層的に構築される。次いで、不必要な遺伝子のサブセットが除去される。合成天然染色体および減少したゲノムを、内在の染色体が除去された細胞中への移植によって、生存能力について試験する。遺伝子合成技術の急速な進歩およびゲノム移植法開発への努力によって、上述のM. ゲニタリウム必須遺伝子セットが、真の最小限の遺伝子セットであるということが確認されるか、またはその遺伝子セットを修飾するための基礎が提供される。
【0075】
参考文献
【0076】
表:
(表1)遺伝子の必須性の研究のために使用される細菌中のパラロガス遺伝子ファミリー
【0077】
本発明者らは、より長いタンパク質配列の長さの60%に渡って30%の同一性を有することを要求する、パラロガス遺伝子ファミリーのメンバーについての一般的な定義を使用した(次いで、単連結クラスタリング(single linkage clustering)が、このファミリーを定義する)。
【0078】
(表2)破壊されているTn4001tet挿入を有するマイコプラズマ・ゲニタリウム遺伝子。遺伝子は、機能的役割によって分類されている。
【0079】
全ての情報は、本明細書中に報告されたM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。列は下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 枯草菌において必須であるオルソロガス遺伝子(1)。
B. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256個の遺伝子セット(2)中。
C. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0080】
参考文献
【0081】
(表3)この研究において破壊されなかったマイコプラズマ・ゲニタリウムタンパク質コード遺伝子。遺伝子は、機能的役割によって分類されている。
【0082】
全ての情報は、本明細書中に報告されたM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。タンパク質コード遺伝子についての列は、下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 枯草菌において必須であるオルソロガス遺伝子(1)。
B. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256遺伝子セット(2)中。
C. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0083】
参考文献
【0084】
(表4)Hutchisonらによる1999年の研究において破壊される(不必要である)と報告されなかったが本研究において不必要であると示された、Tn4001tet挿入を有するマイコプラズマ・ゲニタリウム遺伝子。遺伝子は、機能的役割によって分類されている。
【0085】
全ての情報は、本明細書中に報告された新たなM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。列は下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 枯草菌において必須であるオルソロガス遺伝子(1)。
B. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256遺伝子セット(2)中。
C. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0086】
参考文献
【0087】
(表5)Hutchisonらによる1999年の研究において必要であると報告されなかったが本研究において必要であると示された、Tn4001tet挿入を有するマイコプラズマ・ゲニタリウム遺伝子。遺伝子は、機能的役割によって分類されている。
【0088】
全ての情報は、本明細書中に報告されたM. ゲニタリウムゲノム配列および注釈に基づく。遺伝子は、主要な生物学的役割によって分類されている。これらのタンパク質コード遺伝子についての列は、下記の通りである:
M. ゲニタリウム遺伝子座
遺伝子記号
遺伝子一般名
A. 1999年の研究において破壊されたM. ゲニタリウム遺伝子は、「X」で示される。M. ゲニタリウム遺伝子のM. ニューモニエオルソログのみが破壊されたために非必須であると見なされた遺伝子は、「P」で示される。
B. 枯草菌において必須であるオルソロガス遺伝子(1)。
C. M. ゲニタリウムおよびH. インフルエンザエ中に存在するオルソロガス遺伝子としてMushegianおよびKooninによって規定された、理論的な最小限の256遺伝子セット(2)中。
D. Gilらによって規定された最小限のゲノムセットの理論的な206遺伝子コア(3)中。
【0089】
参考文献
【0090】
上述の説明から、当業者は、本発明の本質的な特徴を容易に確認することができ、その精神および範囲から逸脱することなく、本発明の変更および改変を行い、それを種々の用途および条件へ適合化させかつ最大限まで本発明を利用することができる。前述の特定の態様は、単に例示的であって、何であれ決して本発明の範囲を限定するものではないと解釈されるべきである。上記および添付の図面において引用された全ての出願、特許、刊行物(2005年10月12日に出願された米国仮出願第60/725,295号を含む)の全開示は、参照によりそれらの全体が本明細書中に組み込まれる。
【図面の簡単な説明】
【0091】
【図1】分析された初代コロニーおよび親の初代コロニーとは異なる挿入部位を有するサブコロニーの総数の関数としての、新たな破壊されたM. ゲニタリウム遺伝子(上の太線)およびゲノム中の新たなトランスポゾン挿入部位(下の細線)の累積を示す。
【図2】図2A〜2Iは、M. ゲニタリウムの広範囲のトランスポゾン変異誘発を示す。現在の研究からのトランスポゾン挿入の位置は、マップ上の挿入部位の下の△によって示される。遺伝子座(MG###)上の文字は、列挙される遺伝子産物の機能的カテゴリーを指す。 A 補因子、補欠分子族、および担体の生合成 B プリン、ピリミジン、ヌクレオシド、およびヌクレオチド C 細胞エンベロープ D 細胞プロセス E 中心中間代謝(central intermediary metabolism) F DNA代謝 G エネルギー代謝 H 脂肪酸およびリン脂質代謝 I 仮定タンパク質 J タンパク質運命 K タンパク質合成 L 調節機能 M 転写 N 輸送および結合タンパク質 X 未知の機能 P 細胞/生物防御 R rRNAおよびtRNA遺伝子。
【図3】Tn4001tetの挿入の頻度を示す。これらのヒストグラムは、ゲノム中の種々の部位にトランスポゾンの挿入を有する変異体を本発明者らが同定した頻度を示す。横座標は、トランスポゾンが挿入されたM. ゲニタリウムゲノム部位である。一部の変異は、トランスポゾン移動の傾向が非常に高いと認められた。挿入部位が初代クローンとは異なるサブコロニーにおいて、パリンドローム領域および十字型エレメント等の形態的特徴に富む約350,000〜500,000塩基対のゲノム領域へとジャンプする傾向があった(van Noort et al. (2003) Trends Genet 19, 365-369)。
【図4】M. ゲニタリウムがコードする代謝経路および基質輸送機構を示す。黒い四角上の白文字は、本発明者らの現在の遺伝子破壊研究に基づく非必須の機能またはタンパク質を示す。疑問符は、経路を完成させるのに必要であるとは同定されなかった酵素または輸送体を意味し、それらの欠けている(missing)酵素および輸送体名は斜体で示される。輸送体は、細胞膜を貫通している状態で描かれている。矢印は、基質輸送の予測される方向を示す。ABC型輸送体は、基質結合タンパク質については長方形で、膜貫通パーミアーゼについては菱形で、およびATP結合サブユニットについては円形で描かれている。
【特許請求の範囲】
【請求項1】
栄養豊富な(rich)細菌培養培地における純培養条件下での自由生活生物の増殖および複製に必要な情報を提供するタンパク質コード遺伝子のセットであって、
該セットが、表2に列挙される101個のタンパク質コード遺伝子のうち少なくとも40個、またはそれらの機能的等価物を欠如しており、表4の遺伝子のうち少なくとも1つが、該欠如している遺伝子に含まれ;
該セットが、表5の遺伝子の少なくとも1つを含む、表3に列挙される381個のタンパク質コード遺伝子のうち350〜381個、またはそれらの機能的等価物を含み;かつ
該セットが、450個以下のタンパク質コード遺伝子を含む、
セット。
【請求項2】
表2に列挙される遺伝子のうち少なくとも55個を欠如している、請求項1記載のセット。
【請求項3】
表2に列挙される遺伝子のうち少なくとも70個を欠如している、請求項1記載のセット。
【請求項4】
表2に列挙される遺伝子のうち少なくとも80個を欠如している、請求項1記載のセット。
【請求項5】
表2に列挙される遺伝子のうち少なくとも90個を欠如している、請求項1記載のセット。
【請求項6】
表3に列挙される遺伝子のうち少なくとも360個を含む、請求項1〜5のいずれか一項記載のセット。
【請求項7】
表3に列挙される遺伝子のうち少なくとも370個を含む、請求項1〜5のいずれか一項記載のセット。
【請求項8】
表3に列挙される遺伝子のうち少なくとも380個を含む、請求項1〜5のいずれか一項記載のセット。
【請求項9】
請求項1〜8のいずれか一項記載のセットを含み、かつ(a)MG410、MG411、およびMG412、ならびに(b)MG289、MG290、およびMG291、ならびにそれらの機能的等価物からなる群より選択される、リン酸取り込みのためのABC輸送体をコードする遺伝子をさらに含む、セット。
【請求項10】
請求項1〜9のいずれか一項記載のセットを含み、かつ、MG185およびMG260、ならびにそれらの機能的等価物からなる群より選択されるリポタンパク質コード遺伝子をさらに含む、セット。
【請求項11】
請求項1〜10のいずれか一項記載のセットを含み、かつ、MG293およびMG385、ならびにそれらの機能的等価物からなる群より選択されるグリセロホスホリルジエステルホスホジエステラーゼ遺伝子をさらに含む、セット。
【請求項12】
請求項1〜11のいずれか一項記載のセットを含み、かつ、マイコプラズマ・ゲニタリウム(Mycoplasma genitalium)の43個のRNAコード遺伝子またはそれらの機能的等価物をさらに含む、セット。
【請求項13】
前記遺伝子が染色体を構成する、請求項1〜12のいずれか一項記載のセット。
【請求項14】
前記遺伝子がマイコプラズマ・ゲニタリウム由来である、請求項1〜13のいずれか一項記載のセット。
【請求項15】
請求項1〜14のいずれか一項記載のセットを含み、かつ、水素またはエタノールの産生に関与する少なくとも1つの遺伝子をさらに含む、セット。
【請求項16】
自由生活生物中に存在する、請求項1〜15のいずれか一項記載のセット。
【請求項17】
栄養豊富な細菌培養培地において増殖および複製している自由生活生物中に存在する、請求項1〜15のいずれか一項記載のセット。
【請求項18】
栄養豊富な細菌培養培地がSP4である、請求項17記載のセット。
【請求項19】
コンピュータ読み取り可能な媒体に記録される、請求項1〜15のいずれか一項記載のセット。
【請求項20】
栄養豊富な細菌培養培地において純培養条件下で増殖および複製し得る自由生活生物であって、その遺伝子のセットが請求項1〜15のいずれか一項記載のセットからなる、自由生活生物。
【請求項21】
栄養豊富な細菌培養培地がSP4である、請求項20記載の自由生活生物。
【請求項22】
遺伝子の機能を決定するための方法であって、請求項20または21記載の自由生活生物内に該遺伝子を挿入するか、該自由生活生物中で該遺伝子を変異させるか、または該自由生活生物から該遺伝子を除去する工程、および該生物の特性を評価する工程を含む、方法。
【請求項23】
請求項15記載のセットを含む自由生活生物。
【請求項24】
水素またはエタノールの産生法であって、水素またはエタノールが産生されるように適切な培地において請求項23記載の生物を増殖させる工程を含む、方法。
【請求項25】
前記遺伝子がDNA分子のライブラリを構成する、請求項1〜15のいずれか一項記載のセット。
【請求項26】
複数のDNA分子を組み合わせて請求項25記載のライブラリを作製する工程を含む方法。
【請求項27】
請求項25記載のライブラリの全てのDNA分子を組み合わせて、アセンブルされたDNA分子にする工程を含む方法。
【請求項28】
アセンブルされたDNA分子がゲノムである、請求項27記載の方法。
【請求項1】
栄養豊富な(rich)細菌培養培地における純培養条件下での自由生活生物の増殖および複製に必要な情報を提供するタンパク質コード遺伝子のセットであって、
該セットが、表2に列挙される101個のタンパク質コード遺伝子のうち少なくとも40個、またはそれらの機能的等価物を欠如しており、表4の遺伝子のうち少なくとも1つが、該欠如している遺伝子に含まれ;
該セットが、表5の遺伝子の少なくとも1つを含む、表3に列挙される381個のタンパク質コード遺伝子のうち350〜381個、またはそれらの機能的等価物を含み;かつ
該セットが、450個以下のタンパク質コード遺伝子を含む、
セット。
【請求項2】
表2に列挙される遺伝子のうち少なくとも55個を欠如している、請求項1記載のセット。
【請求項3】
表2に列挙される遺伝子のうち少なくとも70個を欠如している、請求項1記載のセット。
【請求項4】
表2に列挙される遺伝子のうち少なくとも80個を欠如している、請求項1記載のセット。
【請求項5】
表2に列挙される遺伝子のうち少なくとも90個を欠如している、請求項1記載のセット。
【請求項6】
表3に列挙される遺伝子のうち少なくとも360個を含む、請求項1〜5のいずれか一項記載のセット。
【請求項7】
表3に列挙される遺伝子のうち少なくとも370個を含む、請求項1〜5のいずれか一項記載のセット。
【請求項8】
表3に列挙される遺伝子のうち少なくとも380個を含む、請求項1〜5のいずれか一項記載のセット。
【請求項9】
請求項1〜8のいずれか一項記載のセットを含み、かつ(a)MG410、MG411、およびMG412、ならびに(b)MG289、MG290、およびMG291、ならびにそれらの機能的等価物からなる群より選択される、リン酸取り込みのためのABC輸送体をコードする遺伝子をさらに含む、セット。
【請求項10】
請求項1〜9のいずれか一項記載のセットを含み、かつ、MG185およびMG260、ならびにそれらの機能的等価物からなる群より選択されるリポタンパク質コード遺伝子をさらに含む、セット。
【請求項11】
請求項1〜10のいずれか一項記載のセットを含み、かつ、MG293およびMG385、ならびにそれらの機能的等価物からなる群より選択されるグリセロホスホリルジエステルホスホジエステラーゼ遺伝子をさらに含む、セット。
【請求項12】
請求項1〜11のいずれか一項記載のセットを含み、かつ、マイコプラズマ・ゲニタリウム(Mycoplasma genitalium)の43個のRNAコード遺伝子またはそれらの機能的等価物をさらに含む、セット。
【請求項13】
前記遺伝子が染色体を構成する、請求項1〜12のいずれか一項記載のセット。
【請求項14】
前記遺伝子がマイコプラズマ・ゲニタリウム由来である、請求項1〜13のいずれか一項記載のセット。
【請求項15】
請求項1〜14のいずれか一項記載のセットを含み、かつ、水素またはエタノールの産生に関与する少なくとも1つの遺伝子をさらに含む、セット。
【請求項16】
自由生活生物中に存在する、請求項1〜15のいずれか一項記載のセット。
【請求項17】
栄養豊富な細菌培養培地において増殖および複製している自由生活生物中に存在する、請求項1〜15のいずれか一項記載のセット。
【請求項18】
栄養豊富な細菌培養培地がSP4である、請求項17記載のセット。
【請求項19】
コンピュータ読み取り可能な媒体に記録される、請求項1〜15のいずれか一項記載のセット。
【請求項20】
栄養豊富な細菌培養培地において純培養条件下で増殖および複製し得る自由生活生物であって、その遺伝子のセットが請求項1〜15のいずれか一項記載のセットからなる、自由生活生物。
【請求項21】
栄養豊富な細菌培養培地がSP4である、請求項20記載の自由生活生物。
【請求項22】
遺伝子の機能を決定するための方法であって、請求項20または21記載の自由生活生物内に該遺伝子を挿入するか、該自由生活生物中で該遺伝子を変異させるか、または該自由生活生物から該遺伝子を除去する工程、および該生物の特性を評価する工程を含む、方法。
【請求項23】
請求項15記載のセットを含む自由生活生物。
【請求項24】
水素またはエタノールの産生法であって、水素またはエタノールが産生されるように適切な培地において請求項23記載の生物を増殖させる工程を含む、方法。
【請求項25】
前記遺伝子がDNA分子のライブラリを構成する、請求項1〜15のいずれか一項記載のセット。
【請求項26】
複数のDNA分子を組み合わせて請求項25記載のライブラリを作製する工程を含む方法。
【請求項27】
請求項25記載のライブラリの全てのDNA分子を組み合わせて、アセンブルされたDNA分子にする工程を含む方法。
【請求項28】
アセンブルされたDNA分子がゲノムである、請求項27記載の方法。
【図1】
【図2A】
【図2B】
【図2C】
【図2D】
【図2E】
【図2F】
【図2G】
【図2H】
【図2I】
【図3】
【図4】
【図2A】
【図2B】
【図2C】
【図2D】
【図2E】
【図2F】
【図2G】
【図2H】
【図2I】
【図3】
【図4】
【公表番号】特表2009−511051(P2009−511051A)
【公表日】平成21年3月19日(2009.3.19)
【国際特許分類】
【出願番号】特願2008−535578(P2008−535578)
【出願日】平成18年10月12日(2006.10.12)
【国際出願番号】PCT/US2006/039047
【国際公開番号】WO2007/047148
【国際公開日】平成19年4月26日(2007.4.26)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(508113398)ザ ジェイ. クレイグ ベンター インスティテュート (1)
【Fターム(参考)】
【公表日】平成21年3月19日(2009.3.19)
【国際特許分類】
【出願日】平成18年10月12日(2006.10.12)
【国際出願番号】PCT/US2006/039047
【国際公開番号】WO2007/047148
【国際公開日】平成19年4月26日(2007.4.26)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(508113398)ザ ジェイ. クレイグ ベンター インスティテュート (1)
【Fターム(参考)】
[ Back to top ]