説明

合成遺伝子または他のDNA配列を作製するための方法

所望する核酸配列を合成するための方法が本明細書において開示される。本発明の方法は、所望する配列を複数の部分的に重複するセグメントに分割すること;所望する配列において隣接しない重複するセグメントに対するハイブリダイゼーションを避けるために、各セグメントの重複する領域の融解温度を最適化すること;所望する配列において互いに隣接する一本鎖セグメントの重複する領域を、非隣接セグメントのハイブリダイゼーションを避ける条件のもとで互いにハイブリダイゼーションさせること;および、重複する領域の間のギャップを充填または連結または修復し、それにより、所望する配列を有する二本鎖DNAを形成することを含む。核酸配列の合成における誤りを防止するための方法もまた開示される。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2003年5月22日に出願された米国仮特許出願第60/472,822号の利益を主張し、その開示は参考として組み込まれる。
【0002】
本出願は、一般にはDNA分子の合成に関し、より具体的には、合成遺伝子または他のDNA配列の合成に関する。
【背景技術】
【0003】
タンパク質は、広範囲の様々な有益な医学的用途、薬学的用途、産業的用途および生物学的用途を有する生物学的分子の1つの重要なクラスである。遺伝子は、タンパク質におけるそれぞれのアミノ酸について3つのヌクレオチド(1つのコドンまたは1組のコドン)を使用することによって遺伝暗号に従ってタンパク質を産生させるために必要な情報をコードしている。発現ベクターは、タンパク質への翻訳のために遺伝子のmRNAへの転写を可能にするDNA配列を含有する。
【0004】
目的とするタンパク質をコードする合成DNAを得ることが、多くの場合に望ましい。DNAを短い断片(例えば、50ヌクレオチド〜80ヌクレオチドまたはそれ以下)で正確に合成することができる。これよりも実質的に長い断片は、合成過程における累積的な誤りの可能性のために問題となる。ほとんどの遺伝子は、認められ得るように50ヌクレオチド〜80ヌクレオチドよりも長く、通常、数百ヌクレオチドまたは数千ヌクレオチドである。結果として、直接的な合成は、大きい遺伝子を作製するための好都合な方法ではない。現在、所望するDNA配列を有する大きい合成遺伝子はいくつかの方法のいずれかによって製造されている:
1.遺伝子がイントロンを含有しない場合、その遺伝子は直接、PCRによってゲノムDNAから合成することができる。これは、細菌、下等真核生物および多くのウイルスの遺伝子については実現可能であり、しかし、高等生物のほぼすべての遺伝子はイントロンを含有する。
2.関連した代替法は、全長のcDNAクローンから遺伝子をPCRすることである。全長クローンを単離し、特徴づけることは時間がかかり、かつ長ったらしく、また、全長のcDNAクローンは、任意の高等生物の遺伝子の非常に小さい割合についてのみ得ることができるだけである。
3.ゲノムDNA配列から推定される遺伝子配列に基づいて、遺伝子の両方の鎖の短いDNAセグメントを、重複する末端を伴って合成することができる。これらのセグメントはアニーリングさせることが可能であり、DNAリガーゼを用いて連結される。セグメント接合部におけるアニーリングの効率および正確性は不十分であることが多く、このため、低い収率がもたらされる。
4.この問題を軽減するための方法は、遺伝子を段階的な様式で小部分で組み立てることである。多くの反応を行わなければならないので、これも依然として、時間および費用がかかり、長ったらしく、かつ非効率である。
5.ゲノムDNA配列から推定される遺伝子配列に基づいて、遺伝子の短い重複する二重鎖DNAセグメントで、適合可能な末端近辺の制限エンドヌクレアーゼ部位を含有する二重鎖DNAセグメントを合成することができる。各フラグメントを適切な酵素により切断し、アニリーニングし、DNAリガーゼにより連結することができる。上記の制限に加えて、遺伝子配列の両方の鎖を合成しなければならず、また、この方法は、遺伝子配列全体にわたって一様に一定の間隔で配置される適切な制限部位を設置することに依存している。
6.遺伝子はまた、DNAポリメラーゼにより触媒される反応を使用する、部分的に重複するオリゴヌクレオチドの重複部伸長によって組み立てられている。遺伝子は、それぞれが部分的に重複し、かつ、隣接オリゴヌクレオチドに対して相補的である複数のオリゴヌクレオチドに分割される。これらのオリゴヌクレオチドはアニーリングさせることができ、得られるDNA構築物が全長の二本鎖遺伝子に伸長される。例えば、W.P.C.Stemmer他、「非常に多数のオリゴデオキシリボヌクレオチドからの遺伝子および完全なプラスミドの一段階による組立て」、Gene、1995、164、49〜53;D.E.Casimiro他、「PCRに基づく遺伝子合成およびタンパク質NMR分光法」、Structure、1997、5、1407〜1412を参照のこと(それらの開示は参考として組み込まれる)。この方法による遺伝子合成のためにオリゴヌクレオチドを設計することは、D.M.Hoover&J.Lubkowski、「DNAワーク:PCRに基づく遺伝子合成のためにオリゴヌクレオチドを設計するための自動化された方法」、Nucleic Acids Res.、2002、30:10e43(その開示は参考として組み込まれる)に記載されるように、最近になって自動化されている。この方法では、コドン使用が最適化され、必要に応じてDNAヘアピンが除かれ、また、DNA融解の最近隣モデルが、均一な目標融解温度を達成するために使用される。局所的なDNAヘアピンおよび二量体化を1つのDNAオリゴヌクレオチドから除く方法もまた、「DNA二次構造を除くこと」として当業者によって示される。しかしながら、これらの参考文献に記載される方法では、正しいハイブリダイゼーションと、正しくないハイブリダイゼーションとの間における融解温度の差が全体的に最適化されていない。
【発明の開示】
【発明が解決しようとする課題】
【0005】
本出願は、DNA配列を合成するための方法、および、本発明の方法により合成されるDNA配列を提供する。本発明の方法の好ましい実施形態では、所望する順序での多くの遺伝子セグメントの同時アニーリングを最適化し、これにより、多くの小さい遺伝子セグメント鎖から大きい鎖の組立てを容易にする融解温度を達成するために、遺伝暗号の柔軟性が利用される。
【0006】
いくつかの実施形態において、正しいDNA配列を、正しい遺伝子セグメントと、正しくない遺伝子セグメントとの混合物から合成する可能性は、DNA配列またはそのフラグメントの正しさを確認するために、DNA配列またはそのフラグメントの性質、あるいは、それらから発現されるポリペプチドまたはタンパク質の性質、あるいは、それらに由来する別の分子の性質を明らかにすることによって増大する。好適な性質の例には、DNA配列、および、それから発現されるポリペプチドの分子量が含まれる。
【0007】
本出願における方法は実用的有用性を有する。数多くの企業が現在、合成遺伝子サービスを提供している。従って、効率が改善された方法は有益である。そのような企業の部分的な一覧を、例えば、「カスタム遺伝子合成」、「合成遺伝子サービス」または関連したキーワードについてインターネット検索を行うことによって容易に作成することができる。
【0008】
当業者は、開示された方法が適用され得る無数の応用を即座に把握する。そのような応用には、(1)デノボ(de novo)「デザイナー」タンパク質を作製すること;(2)発現および結晶化の自動化された設備への結合;(3)構造的プロテオミクスのための新規なタンパク質折り畳みを発現させるために予測されるDNA配列を組み立てること;(4)タンパク質をコードしない他のDNA配列を、例えば、RNA構造のテンプレートまたはDNAナノテクノロジー成分として組み立てること;(5)所望の発現ベクターにおいて異なる種に由来するタンパク質をそれ自身のコドン使用優先(codon usage preference)に従って発現させること;および(6)小さい合成ゲノムを、その所望するタンパク質配列および調節タンパク質結合部位を特定することによって作製することが含まれる。
【0009】
本出願は、任意のサイズの遺伝子、すなわち、所望するペプチド配列をコードし、おそらくは、隣接する調節配列および遺伝子間配列が他の隣接する遺伝子の中にまで伸びている二本鎖DNA(dsDNA)配列を合成するための繰り返し法を提供する。この開示された方法では、配列の縮重性が、所望する順序での多くの遺伝子セグメントの同時アニーリングを最適化する融解温度を達成するために使用される。この最適化は、高い蓋然性で、正しくないハイブリダイゼーションまたは間違ったハイブリダイゼーションが低い温度で融解し、かつ、正しいハイブリダイゼーションまたは合致したハイブリダイゼーションが高い温度で融解し、これにより、大きい合成遺伝子の構築を迅速かつ容易にするように塩基およびコドンを選ぶことによって達成される。
【0010】
この方法は(a)階層的な組立てを含み、この組立ては、(b)忠実度が大きい技術、例えば、プルーフリーディングDNAポリメラーゼを使用する重複部伸長、連結、クローニングまたは他の方法などによって行われ、これには、(c)例えば、遺伝暗号または調節領域コンセンサス配列の縮重性を利用することによって、所望する隣接断片に対する優先的なハイブリダイゼーションを容易にし、かつ、他の断片との間での望ましくないハイブリダイゼーションを避けるために成分オリゴヌクレオチド断片の配列を最適化して、(d)正しいハイブリダイゼーション(高い融解温度)と、正しくないハイブリダイゼーション(低い融解温度)との間でのDNA融解温度の差を達成することを伴い、また、(e)必要に応じて、正しいDNA配列を有することが考えられるDNA断片をその後の組み立て工程のために選択することによって行われ、(f)その結果、高い蓋然性で、正しい組立て物が形成される。従って、配列は、発現ベクターに対して害のない様式で同義的コドン置換を使用することによってコード配列上に置かれたシグナルでそれ自身の正しい自己集合物をコードするように設計される。
【0011】
R.M.Horton他、「制限酵素の使用を伴わないハイブリッド遺伝子の操作:重複部伸長による遺伝子スプライシング」、Gene、1989、77、61〜68(その開示はその全体が参考により組み込まれる)は重複部伸長を開示するが、所望する順序での断片の組立てを容易にするために重複部領域を最適化することを開示していない。特に、Horton他は、正しいハイブリダイゼーションに対する高い融解温度と、正しくないハイブリダイゼーションに対する低い融解温度とを達成するために配列縮重性を利用することによって遺伝子の自己集合体をコードするための情報科学の使用を開示していない。
【0012】
従って、本開示は、(i)DNA配列を、隣接する断片が重複する領域を含む、小さいDNA断片に繰り返し分割する工程;(ii)正しいハイブリダイゼーションを強くし、かつ、正しくないハイブリダイゼーションを妨害するために、それぞれの繰り返し分割から生じるDNA断片の配列を最適化する工程;(iii)一本鎖DNAの任意の隣接する断片の重複する領域が相補的である、最適化された小さいDNA断片を得る工程;(iv)次に大きいDNA断片の分割に由来するDNA断片を組み合わせる工程;(v)DNA断片を自己集合させて、二本鎖の重複部領域によってつながれた一本鎖DNAセグメントを含むDNA構築物を形成させる工程;(vi)次に大きいDNA断片をDNA構築物から作製する工程;および(vii)工程(iv)、工程(v)および(vi)を工程(i)における繰り返し分割の逆の順序で繰り返して、DNA配列を作製する工程;を少なくともを含む、DNA配列を合成するための方法を提供する。
【0013】
本開示はさらに、(i)DNA配列を、隣接する断片が重複する領域を含む、小さいDNA断片に繰り返し分割する工程;(ii)正しいハイブリダイゼーションを強くし、かつ、正しくないハイブリダイゼーションを妨害するために、それぞれの繰り返し分割から生じるDNA断片の配列を最適化する工程;(iii)一本鎖DNAの任意の隣接する断片の重複する領域が相補的である、最適化された小さいDNA断片を得る工程;(iv)次に大きいDNA断片の分割に由来するDNA断片を組み合わせる工程;(v)DNA断片を自己集合させて、二本鎖の重複部領域によってつながれた一本鎖DNAセグメントを含むDNA構築物を形成させる工程;(vi)次に大きいDNA断片をDNA構築物から作製する工程;および(vii)工程(iv)、工程(v)および(vi)を工程(i)における繰り返し分割の逆の順序で繰り返して、DNA配列を作製する工程;を少なくとも含む方法に従って合成されるDNA配列を提供する。
【0014】
いくつかの実施形態において、工程(vi)において作製される次に大きいDNA断片はDNA分子の混合物を含む。いくつかの実施形態ではさらに、正しいDNA配列を有することが考えられるDNA分子を混合物から選択すること、および、選択されたDNA分子をDNA配列の合成において使用することが含まれる。いくつかの実施形態において、DNA分子がクローニングによって混合物から分離される。いくつかの実施形態において、選択は、混合物に由来する選択されたDNA分子の性質、または、それから発現されるポリペプチドの性質を決定すること、および、その性質についての所定の値に基づいてDNA分子を選択することを含む。いくつかの実施形態において、選択は、混合物に由来するDNA分子のサンプルを配列決定すること、および、正しいDNA配列を有するDNA分子を選択することを含む。いくつかの実施形態において、選択は、混合物に由来するDNA分子のサンプルの各メンバーからポリペプチドを発現させること、ポリペプチドの分子量を決定すること、および、所定の分子量を有するポリペプチドが発現されるDNA分子を選択することを含む。いくつかの実施形態において、開始コドンおよび/または停止コドンが、ポリペプチドが発現されるDNA分子に含まれる。いくつかの実施形態において、DNA分子の読み枠が開始コドンおよび/または停止コドンに関して調節される。いくつかの実施形態において、1つまたは複数の停止コドンが遺伝子の下流側(3’)において発現ベクターに挿入される。いくつかの実施形態において、ポリペプチドの分子量が電気泳動によって決定される。
【0015】
本開示はさらに、(i)DNA配列を、隣接する断片が重複する領域を含む、小さいDNA断片に繰り返し分割する工程;(ii)一本鎖DNAの任意の隣接する断片の重複する領域が相補的である、小さいDNA断片を得る工程);(iii)次に大きいDNA断片の分割に由来するDNA断片を組み合わせる工程;(iv)DNA断片を自己集合させて、二本鎖の重複部領域によってつながれた一本鎖DNAセグメントを含むDNA構築物を形成させる工程;(v)次に大きいDNA断片をDNA構築物から作製する工程;(vi)正しい配列を有することが考えられる次に大きいDNA断片を選択する工程;および(vii)工程(iii)、工程(iv)、工程(v)および(vi)を工程(i)における繰り返し分割の逆の順序で繰り返して、DNA配列を作製する工程を少なくともを含む、DNA配列を合成するための方法を提供する。
【0016】
本開示はさらに、(i)DNA配列を、隣接する断片が重複する領域を含む、小さいDNA断片に繰り返し分割する工程;(ii)一本鎖DNAの任意の隣接する断片の重複する領域が相補的である、小さいDNA断片を得る工程;(iii)次に大きいDNA断片の分割に由来するDNA断片を組み合わせる工程;(iv)DNA断片を自己集合させて、二本鎖の重複部領域によってつながれた一本鎖DNAセグメントを含むDNA構築物を形成させる工程;(v)次に大きいDNA断片をDNA構築物から作製する工程;(vi)正しい配列を有することが考えられる次に大きいDNA断片を選択する工程;および(vii)工程(iii)、工程(iv)、工程(v)および(vi)を工程(i)における繰り返し分割の逆の順序で繰り返して、DNA配列を作製する工程を少なくとも含む方法に従って合成されるDNA配列を提供する。
【0017】
いくつかの実施形態において、DNA配列は調節配列を含む。他の実施形態において、合成遺伝子は遺伝子間配列を含む。他の実施形態において、DNA配列は、隣接する調節配列および遺伝子間配列が他の隣接する遺伝子の中にまで伸びている。他の実施形態において、DNA配列はポリペプチドをコードする。好ましくは、ポリペプチドは全長タンパク質の一部である。より好ましくは、ポリペプチドは全長のタンパク質である。いくつかの実施形態において、DNA配列は、多数の隣接するコードされたポリペプチド、それらの調節領域、および遺伝子間領域を含む合成ゲノムである。
【0018】
好ましい実施形態において、DNA配列の配列が1回の分割で小さいDNA断片に分割される。この実施形態は、本明細書中では「直接的な自己集合」として示される。別の好ましい実施形態において、合成遺伝子の配列が複数回の分割で小さいDNA断片に分割される。この実施形態は、本明細書中では「繰り返し組立て」または「階層的な組立て」として示される。1つの実施形態において、合成遺伝子の配列は約1,500塩基以下の長さのDNA断片に分割される。
【0019】
小さいDNA断片は、好ましくは約60塩基以下の長さであり、より好ましくは約50塩基以下の長さである。好ましくは、重複する領域は約6塩基対〜約60塩基対を含み、より好ましくは約14塩基対〜約33塩基対を含む。
【0020】
好ましい実施形態において、最適化は、DNA断片について融解温度を計算することによって行われる。好ましくは、正しいハイブリダイゼーションの最も低い融解温度は、正しくないハイブリダイゼーションの最も高い融解温度よりも高い。当業者は、融解温度の差の大きさが、差がより狭い場合、要求されるレベルの忠実度を提供するために、よりストリンジェントなアニーリング条件が再組立て工程において要求され得るようにアニーリング条件に関係づけられることを認識する。結果として、温度の差は最小値を有しない。実際には、最も低く融解する正しい一致と、最も高く融解する正しくない一致との差は少なくとも約1℃であり、より好ましくは少なくとも約4℃であり、より好ましくは少なくとも約8℃であり、最も好ましくは少なくとも約16℃である。温度の差が広いほど、自己集合は強くなり、それにより、それほどストリンジェントでないアニーリング条件の使用が可能になる。当業者は、最適化が、融解温度と同じ効果を達成するために、ハイブリダイゼーション性向に関係づけられる他のパラメーターまたは尺度(例えば、自由エネルギー、エンタルピー、エントロピー、あるいは、そのようなパラメーターまたは尺度の算術的または代数的な組合せ)を使用して行われ得ることを理解する。実際には、融解温度自体がそのようなパラメーターまたは尺度の1つのそのような算術的または代数的な組合せである。結果として、いくつかの実施形態において、最適化は、DNA断片についてのハイブリダイゼーション性向に関係づけられるパラメーター(例えば、自由エネルギー、エンタルピー、エントロピー、およびそれらの組合せなど)を計算することによって行われる。
【0021】
いくつかの実施形態において、DNA断片は、例えば、ポリペプチドをコードする部分について、サイレントなコドン置換を変更することによって最適化される。いくつかの実施形態において、DNA断片は、例えば、調節領域について、調節領域コンセンサス配列における縮重性を利用することによって最適化される。いくつかの実施形態において、DNA断片は、隣接するDNA断片との間での境界点を調節することによって最適化される。いくつかの実施形態において、DNA断片は、例えば、遺伝子間領域にについて、直接的な塩基割り当てによって最適化される。
【0022】
好ましい実施形態において、最適化された小さいDNA断片の少なくとも1つが合成である。別の好ましい実施形態において、最適化された小さいDNA断片の少なくとも1つが一本鎖である。
【0023】
いくつかの実施形態において、DNA構築物における一本鎖DNAセグメントは0塩基の長さを有する。いくつかの実施形態において、一本鎖DNAセグメントは約0塩基〜約20塩基の長さを有する。
【0024】
好ましい実施形態において、次に大きいDNA断片は、DNA構築物をクローニングし、細胞装置を使用することによって作製される。好適なクローニング方法の例には、エキソヌクレアーゼIIIクローニング、トポイソメラーゼクローニング、制限酵素クローニングおよび相同組換えクローニングが含まれる。別の好ましい実施形態において、次に大きいDNA断片は、DNA構築物を連結することによって作製される。さらに別の好ましい実施形態において、次に大きいDNA断片は、DNAポリメラーゼを使用する反応によってDNA構築物を伸長することにより作製される。好ましくは、DNAポリメラーゼはプルーフリーディングDNAポリメラーゼである。
【0025】
好ましい実施形態において、重複する領域における3’ヌクレオチドはGまたはCである。好ましくは、重複する領域における両方の3’ヌクレオチドは独立してGまたはCである。別の好ましい実施形態において、重複する領域における3’ヌクレオチドはAまたはTである。
【0026】
好ましい実施形態において、DNAポリメラーゼプライマーが、次に大きいDNA断片の分割に由来するDNA断片と混合される。別の好ましい実施形態において、DNAポリメラーゼプライマーは、次に大きいDNA断片の分割に由来するDNA断片と一緒にされない。
【0027】
好ましい実施形態において、制限部位が、重複する領域の中に設計される。別の好ましい実施形態において、その制限部位が部位特異的な制限酵素により消化される。
【発明を実施するための最良の形態】
【0028】
本明細書中で使用される用語「DNA」は一本鎖DNAおよび二本鎖DNAの両方を包含する。用語「断片」は、状況に依存して、DNAの実際の断片または仮想的な断片のいずれかを示し得る。「非常に大きい」DNA断片は約1,500塩基よりも長く、「大きい」DNA断片は約1,500塩基またはそれ以下であり、「中間サイズの」DNA断片は約300塩基〜350塩基またはそれ以下であり、「短い」DNA断片は約50塩基〜60塩基またはそれ以下である。短いDNA断片はまた、当業者によって「オリゴヌクレオチド」と呼ばれる。しかしながら、これらの数字は概数であり、異なるプロセスまたはプロセス変法により変化し得ることが理解される。下記の開示された方法の好ましい実施形態の説明では、それぞれの繰り返し工程または階層的な工程が、同じサイズ範囲のDNA断片(例えば、DNA断片のすべてが非常に大きいか、または大きいか、または中サイズであるか、または小さい)を伴うとして記載されるが、当業者は、階層的な工程の1つが、2つ以上のサイズ範囲に由来するDNAを伴い得ることを理解する。特定の工程では、短いDNA断片および中サイズのDNA断片の両方、または、場合によっては、短いDNA断片、中サイズのDNA断片および大きいDNA断片を伴うことができる。
【0029】
「小さい」または「短い」DNA断片は、合成することができるか、または購入することができるか、または他の方法で容易に得ることができるDNAセグメントである。用語「セグメント」もまた、ここでは通常「小さい断片」を意味する。当業者は、用語「シントン」が、本明細書中で使用される用語「小さい断片」および用語「セグメント」と同義的であることを理解する。しかし、用語「シントン」は本明細書中では使用されない。下記の実施例で使用されるDNAセグメントは合成である。しかしながら、開示された方法はまた、この分野で知られている他の供給源から得られるDNAセグメント、例えば、ウイルス、細菌、菌類、植物または動物を含む天然の供給源から得られるDNAセグメント;形質転換された細胞から得られるDNAセグメント;組織培養物から得られるDNAセグメント;クローニングによって得られるDNAセグメント;または、天然に存在する配列もしくは操作された配列のPCR増幅によって得られるDNAセグメント、を使用することを含む。本明細書中で使用される場合、「正しい」DNA断片は、正しいヌクレオチド配列または所望するヌクレオチド配列を有するDNA断片である。「正しくない」断片は、正しくないヌクレオチド配列または所望されないヌクレオチド配列を有する断片である。
【0030】
開示された方法は分割・獲得の戦略によって進められる(Aho他、The Design and Analysis of Computer Algorithms、Addison−Wesley;Reading,MA:1974を参照のこと;その開示はその全体が参考として組み込まれる)。大きすぎて、直接的には解決することができない問題が、直接的に解決するためにそれぞれが十分に小さくなるまで、より小さい部分的問題に繰り返し分解され、その後、これらの小さい部分的問題が、元の問題に対する解決策に繰り返し組み合わされる。この場合、ある種の全長遺伝子は長すぎて、直接合成することができない。そのような全長遺伝子は、合成されるためにそれぞれが十分に小さくなるまで、より小さい重複する断片に繰り返し分断される。その後、遺伝子は分解の逆の順序で再組立てされる。最も小さい断片が次に大きい断片に再組立てされ、その後、その断片が次に大きい断片に再組立てされ、これが繰り返される。再組立て工程を、図1Aおよび図1Bに例示されるような、高忠実DNAポリメラーゼを使用する重複部伸長によって行うことができ、または、図2に例示されるような連結によって行うことができる。当業者は、連結が、一方の鎖を含むDNA断片が接するが、その相補的な鎖を含むDNA断片のすべてが接しない図2に例示されるDNA構築物の変化体を使用してDNAの一本鎖を再組立てするためにもまた使用され得ることを認識する。再組立てのための別の方法は、発現ベクターへのクローニングおよび適切な宿主の形質転換である。当業者は、多くのクローニング方法が、開示された方法、例えば、エキソヌクレアーゼIIIクローニング、トポイソメラーゼクローニング、制限酵素クローニングおよび相同組換えクローニング、と適合し得ることを理解する。
【0031】
より詳しくは下記において議論されるように、合成オリゴヌクレオチドは典型的には、正しくないオリゴヌクレオチド、すなわち、所望する配列を有しないオリゴヌクレオチド、と混合された所望するオリゴヌクレオチドを含有する混合物である。当業者には明らかであるように、遺伝子をそのような混合物から合成することは、正しい遺伝子または所望する遺伝子を正しくない遺伝子との混合でもたらす可能性がある。正しい遺伝子のみを合成するための1つの方法は、正しい配列を有することが考えられるDNA断片から遺伝子を再組立てすることである。結果として、いくつかの実施形態では、再組立てプロセス時において、その後の再組み立て工程における使用のために正しい配列を有することが考えられるDNA断片が選択される。いくつかの実施形態において、そのような選択のための基準は、再組立てされたDNA断片の性質、または、それによってコードされ、かつ、それから発現されるポリペプチドの性質である。いくつかの実施形態において、性質が、全長のDNA断片から、または、それから発現されるポリペプチドから決定される。いくつかの実施形態において、性質が、DNAの相補鎖について、または、それから発現されるポリペプチドについて決定される。いくつかの実施形態において、性質が、DNA断片から転写されたRNA断片について決定される。
【0032】
DNA配列の正しさを示す性質はどれも、本発明の方法において有用である。正しい配列を選択する可能性または蓋然性は、測定または決定される性質に依存する。いくつかの実施形態において、可能性は確実性に近い。そのような性質の一例が、DNA断片の実験的に決定されたヌクレオチド配列である。ヌクレオチド配列を決定するためのこの分野で知られている方法はどれも使用することができ、これらには、自動化された配列決定、手作業による配列決定、質量分析法による配列決定などが含まれる。他の実施形態では、性質により、DNA断片が正しい配列をおそらくは有することが示されるが、配列の正しさが確認されない。そのような性質の一例が、DNA断片によりコードされ、かつ、そのDNA断片から発現されるポリペプチドの分子量がある。ポリペプチドまたはタンパク質の分子量を決定するためのこの分野で知られている方法はどれも使用することができ、これらには、ゲル電気泳動、質量分析法などが含まれる。
【0033】
用語「PCR」は、DNAを組立てるか、または再組立てすることに関連して本明細書中で使用される場合、好ましくはプルーフリーディングDNAポリメラーゼを使用するPCR反応または重複部伸長反応である(「プルーフリーディングPCR」)。用語「直接的な自己集合」は、DNAを組立てるか、または再組立てすることに関連して本明細書中で使用される場合、大きいDNA断片を短い合成セグメントから一段階で組立てることを含む、DNA構築物を作製する無コピー法、またはそのような方法によって作製されるDNA構築物である。「無コピー」とは、その方法が、重複部伸長またはPCRにおいて見出されるようなコピー工程を有しないことを意味し、従って、これにより、コピー時の誤りが排除される。好ましい実施形態において、同じ鎖における隣接セグメントは境界が接し、すなわち、鎖にニックを形成する。好ましくは、自己集合におけるニックはインビトロ連結によって修復される。別の好ましい実施形態において、ニックは、クローニング後、細胞装置によってインビボで修復される。
【0034】
本発明の方法は、(a)階層的な組立てを含み、この組立ては、(b)忠実度が大きい技術、例えば、プルーフリーディングDNAポリメラーゼを使用する重複部伸長、連結、クローニングまたは他の方法などによって行われ、これには、(c)例えば、遺伝暗号または調節領域コンセンサス配列の縮重性を利用することによって、所望する隣接断片に対する優先的なハイブリダイゼーションを容易にし、かつ、他の断片に対する望ましくないハイブリダイゼーションを避けるために成分オリゴヌクレオチドにおける配列を最適化して、(d)正しいハイブリダイゼーション(高い融解温度)と、正しくないハイブリダイゼーション(低い融解温度)との間でのDNA融解温度の差を達成することを伴い、また、(e)必要に応じて、正しいDNA配列を有することが考えられるDNA断片をその後の組立て工程のために選択することによって行われ、(f)その結果、高い蓋然性で、正しい組立て物が形成される。
【0035】
階層的な組立ては、任意の工程における複雑性、および、従って、正しくない組立ての可能な数が抑制され、かつ、管理可能なほどに小さくなることを保証する。重複部伸長では、すべての正しくハイブリダイゼーションした3’末端をその一致する前置物の相補的なコピー体に確実に伸長させることが可能になる。高忠実DNAポリメラーゼ反応を使用することにより、コピー体が高い蓋然性で正しいことが保証される。連結およびクローニングにより、重複部伸長と同じ結果が達成され、その一方で、DNAポリメラーゼ反応に関連する、ゼロではないが、小さい誤り率が回避される。遺伝暗号の縮重性は、正しい一致を強め、かつ、正しくない一致を妨害するように、サイレントなコドン置換における柔軟性を可能にする。最も高く融解する正しくないハイブリダイゼーションと、最も低く融解する正しいハイブリダイゼーションとの間での温度の大きな差は、高い蓋然性で、ほとんどの正しくないハイブリダイゼーションが融解し、ほとんどの正しいハイブリダイゼーションがアニーリングしていることを意味する。正しいと考えられる遺伝子フラグメントを選択することは、化学合成に起因するオリゴヌクレオチド配列の誤りが除去または低下することを意味する。結果として、それぞれの組立て反応により、高い蓋然性で、正しいより大きいDNA断片がもたらされる。誤りが当然のこととして生じるが、確率は低い。結果として、同じ分子量の生成物(すなわち、最終的なゲルにおける同じバンド)をもたらす2つ以上の相殺する誤り、または、同じ読み枠の生成物(すなわち、同じであるか、またはほぼ同じであるコードされるアミノ酸配列)をもたらす2つ以上の相殺する欠失は、二重に希な事象またはより希な事象に対応すると考えられる。
【0036】
塩基配列を最適化する際には、理論的な融解温度が、この分野で知られている様々な方法によって、例えば、Mfoldを使用して、すべての可能な正しいハイブリダイゼーションおよび正しくないハイブリダイゼーションについて計算される。そのような方法が、例えば、M.Zuker他、「RNA二次構造予測のためのアルゴリズムおよび熱力学:実用的指針」、RNA Biochemistry and Biotechnology、Barciszewsld&Clark編、Kluwer:1999;D.H.Mathews他、「熱力学的パラメーターの拡大された配列依存性はRNA二次構造の頑強な予測を提供する」、J.Mol.Biol.、1999、288、910〜940;J.Santa−Lucia、「ポリマー、ダンベルおよびオリゴヌクレオチドDNAの最近接熱力学の統一見解」、Proc.Natl.Acad.Sci.USA、1998、95、1460〜1465に開示され、それらの開示はすべて、その全体が参考として組み込まれる。性能指数は、最も低く融解する正しい一致と、最も高く融解する正しくない一致との間における差である。正しくない一致の例には、下記が含まれる:(a)ヘアピン、この場合、短いセグメントが折れ曲がって、自身にハイブリダイゼーションする;(b)ダイマー、この場合、短いセグメントが部分的に自己相補的である;(c)セグメント間のミスマッチ、この場合、1つの短いセグメントの一部が別の短いセグメントの一部に対して部分的に相補的である;(d)およびシフトした正しい一致、この場合、誤ってアラインメントされた重複部領域が同じ重複部の内部における別の領域に対して部分的に相補的である。従って、いくつかの実施形態において、最適化は、1つだけのDNA断片について、例えば、ヘアピンについて融解温度を計算することを含み、いくつかの実施形態において、最適化は、2つのDNA断片について、例えば、セグメント間のミスマッチについて融解温度を計算することを含む。いくつかの実施形態において、最適化は両方のタイプの融解温度を計算することを含む。
【0037】
融解温度の差は、重複部におけるG−C含有量を増大することによって正しい一致を強くすること、および、非相補的な塩基を選ぶことによって正しくない一致を妨害することを含む、コドン割り当てに対する様々な変化によって拡大する。差が満足できるほどに大きくなるまで、コドン割り当ては修正され、このプロセスが繰り返される。このプロセスは手作業または自動化によって行うことができる。好ましい実施形態において、可能なコドン割り当ての検索が、生物学的適用のために開発された随時分岐限定アルゴリズムにマップ化される。これは、R.H.Lathrop他、「生物学的適用を伴う随時最適検索のための多重待ち行列分岐限定アルゴリズム」、Proc.Intl.Conf.on Genome Informatics、東京、2001年12月17日〜19日、73頁〜82頁;Genome Informatics 2001(Genome Informaticsシリーズ第12号)、Universal Academy Pressに記載され、それらの開示は参考として組み込まれる。当業者は、他の最適化方法、例えば、シミュレートされたアニーリング、遺伝的アルゴリズム、他の分岐限定技術、ヒル・クライミング、モンテカルロ法、他の検索法などが使用され得ることを認識する。当業者はさらに、正しくない一致を最適化すること、すなわち、弱めることが、正しい一致を最適化すること、すなわち、強くすることと機能的に等価であること、およびその逆も等価であることを認識する。結果として、好適な最適化方法は、正しくない一致を弱めること、正しい一致を強くすること、およびそれらの任意の組合せを包含する。
【0038】
当業者は、融解温度の差の大きさが、差がより狭い場合、要求されるレベルの忠実度を提供するために、よりストリンジェントなアニーリング条件が再組立て工程において要求され得るようにアニーリング条件に関係づけられることを認識する。結果として、温度の差は最小値を有しない。いくつかの実施形態において、温度の差は0℃よりも大きく、少なくとも約1℃、少なくとも約2℃、少なくとも約3℃、少なくとも約4℃、少なくとも約5℃、少なくとも約6℃、少なくとも約7℃、少なくとも約8℃、少なくとも約9℃、少なくとも約10℃、少なくとも約12℃、少なくとも約14℃、少なくとも約16℃、少なくとも約18℃、または少なくとも約20℃である。当業者は、適切なアニーリング条件のもとでは、温度の差が任意に0℃に近いことを理解する。実際には、最も低く融解する正しい一致と、最も高く融解する正しくない一致との差は少なくとも約1℃であり、より好ましくは少なくとも約4℃であり、より好ましくは少なくとも約8℃であり、最も好ましくは少なくとも約16℃である。温度の差が大きいほど、自己集合は強くなり、それにより、それほどストリンジェントでないアニーリング条件の使用が可能になる。
【0039】
当業者は、温度の差が、分割プロセスを最適化することによって増大し得ることを認識する。例えば、分割は、下記において記載されるネスティド(nested)検索法によって最適化することができる。他の適切な検索法が当業者には明らかである。
【0040】
外側の検索において、温度変数が高い温度、例えば、80℃に初期化され、その後、例えば、それぞれの外側検索工程において1℃ずつ下げられる。それぞれの外側検索工程において、内側の検索が、重複部領域が温度変数の現在の設定よりも低い融解温度を有しないように遺伝子を短い断片に分割することが可能であるかどうかを調べるために要求される。内部の検索が最終的に成功したとき、その対応するコドン割り当てが外側の検索から戻される。
【0041】
内側の検索は、設計上の制約、例えば、最小の重複長さ、最大のセグメント長さ、セグメント境界部における可能なC − G固定部など、を満たす可能な分割点により縦型検索を介して進行する。それぞれの内側検索工程において、直近の候補分割点から生じる重複部領域が、その領域についての最も高い自己融解温度をもたらす1組のコドン割り当てをもたらすために使用される。最も高い自己融解温度が温度変数の現在の設定よりも小さい場合、内側の検索は失敗である。それ以外の場合には、内側の検索は次の工程に続く。
【0042】
一般的なDNA融解問題は、DNA二次構造により、配列の非局所的なエレメントがハイブリダイゼーションするようにさせられ得るので、非線形である一方で、重複部領域における正しい一致が、純粋に局所的な塩基同士の線形ハイブリダイゼーションによって特徴づけられる。結果として、遺伝子の特定の部分配列について、塩基対(最近隣)に基づく線形の動的プログラム化技術が、その融解温度を最大にするその部分配列に対するコドン割り当てを決定するために使用される。
【0043】
従って、遺伝子は、設計上の制約、例えば、最小の重複長さ、最大のセグメント長さ、セグメント境界部における可能なC− G固定部などに留意しながら、最も低く融解する重複部領域の融解温度を最大にする分割点を見つけることによって短い断片に分割される。最大の分割点に対応するコドン割り当てが、最も一般的なコドンよりも、設計プロセスの開始時におけるより良い開始コドン割り当てである。
【0044】
当業者は、最適化が、融解温度と同じ効果を達成するために、ハイブリダイゼーション性向に関係づけられる他のパラメーターまたは尺度、例えば、自由エネルギー、エンタルピー、エントロピー、あるいは、そのようなパラメーターまたは尺度の算術的または代数的な組合せを使用して行われ得ることを理解する。融解温度自体がそのようなパラメーターまたは尺度の1つのそのような算術的または代数的な組合せである。
【0045】
開示された方法は、設計または分解のプロセスと、合成または再組立てのプロセスとを含む。好ましい実施形態において、合成遺伝子は、図3における方法300として例示される方法に従って設計される。工程302において、DNA配列または遺伝子が小さいDNA断片またはオリゴヌクレオチドに分割される。工程304において、小さいDNA断片が最適化される。工程306において、最適化された小さいDNA断片が得られる。工程308において、各DNA断片の1回の分割に由来するDNA断片が組み合わされる。工程310において、DNA断片をDNA構築物に自己集合させることができる。工程312において、DNA構築物が完全二重鎖DNAに伸長される。工程314において、得られたDNA断片の正しいことの可能性を示す性質が明らかにされ、正しい配列を有することが考えられるDNA断片が選択される。工程316において、工程308〜工程314が、合成遺伝子を作製するために、工程312における分割の逆の順序で繰り返される。
【0046】
工程302。合成遺伝子は下記のように分割される。合成遺伝子が非常に大きい場合、DNA配列は、必要に応じて、ほぼ等しいサイズの2つ以上のDNA断片に分割される。隣接するDNA断片は、好ましくは、再組立てを容易にするために適切な数のヌクレオチドによって重複する。重複部の範囲は、特定の塩基配列、再組立て方法、温度および塩濃度を含む様々な要因に依存し、過度な実験を行うことなく当業者によって決定することができる。隣接するDNA断片は、DNA分子を連結することについてこの分野で知られている任意の方法または方法の組合せによる再組立てのために、例えば、連結によるか、または重複部伸長による再組立てのために設計される。いくつかの実施形態において、分割は、より詳しくは下記において記載されるように、所望するDNA配列に組立てることがより確実であるDNA断片を作製するために最適化される。
【0047】
好ましい実施形態において、それぞれの大きい断片はdsDNAであり、隣接する大きい断片と少なくとも制限部位の幅(典型的には約4塩基〜約6塩基の幅)によって重複する。好ましくは、いずれかの断片において他のところには現れない制限部位が、より詳しくは下記において記載されるように遺伝暗号の縮重性を利用することによって、それぞれの得られた断片のDNA配列の中に操作して入れられる。隣接する大きい断片は、適切な制限酵素により切断し、隣接する断片をアニーリングしてつなぎ、切断された末端を連結することによって再組立てされる。
【0048】
他の実施形態において、ssDNAまたはdsDNAの大きい断片が、図2に例示されるように、同じ鎖における隣接するDNA断片がギャップを伴うことなく接するように設計される。DNAはアニーリングおよび連結によって再組立てされる。好ましい実施形態において、DNAは一本鎖である。いくつかの実施形態において、大きいDNA断片は約3000塩基の長さである。いくつかの実施形態において、隣接する大きいDNA断片は約1500塩基によって重複する。
【0049】
別の好ましい実施形態において、それぞれの大きい断片はssDNAまたはdsDNAであり、隣接する大きい断片と境界が直接に接する。この実施形態において、大きい断片の境界が接する末端と約25塩基〜約30塩基またはそれ以上によって重複するプライマーが構築され、また、境界が接する大きい断片が重複部伸長によって再組立てされる。
【0050】
さらに別の好ましい実施形態において、それぞれの大きい断片は、重複する領域が約25塩基〜約30塩基またはそれ以上の相補的なssDNAを含むdsDNAである。この実施形態において、隣接する大きい断片はハイブリダイゼーションおよび連結によって再組立てされる。別の実施形態において、ssDNAの重複部は、二本鎖の重複領域の両側に位置する一本鎖領域を残すように設計される。この実施形態において、隣接する大きい断片は重複部伸長によって再組立てされる。
【0051】
なお別の実施形態において、それぞれの得られる断片はssDNAであり、隣接する得られる断片の重複する領域は約25塩基〜約33塩基またはそれ以上の相補的な一本鎖DNAを含む。いくつかの好ましい実施形態において、重複する領域は約75塩基を含む。この実施形態において、隣接する得られる断片は重複部伸長によって再組立てされる。
【0052】
特定の実施形態において、大きいDNA断片または非常に大きいDNA断片を、この分野で知られている任意のタイプのベクターを使用してクローニングによって再組立てすることができる。好適なベクターの例には、限定されないが、プラスミド、コスミド、ファージミド、ウイルス、染色体、細菌人工染色体(BAC)または合成染色体が含まれる。
【0053】
連結またはクローニングを使用する実施形態は、DNAポリメラーゼを使用することが好ましくない状況、例えば、DNAが約3KB〜約5KBの長さよりも大きい状況では好まれる。
【0054】
DNA断片を設計するための方法が大きいDNA断片について記載されており、しかし、その方法は任意のサイズのDNA断片に対して適用可能である。DNA断片が、容易に得ることができる重複する小さいDNA断片(すなわち、小さい断片またはセグメント)に分割される。好ましくは、それぞれの短い断片は、容易に合成されるために十分に小さい。この大きいDNA断片は、上記で記載されたような非常に大きいDNA断片の分割に由来する標的DNA配列または大きいDNA断片であり得る。
【0055】
好ましい実施形態において、大きいDNA断片は「直接的な自己集合」のために設計される。この実施形態において、それぞれの大きい断片は、約50塩基〜約60塩基またはそれ以下の約50個〜約60個の重複する小さい断片に分割される。好ましくは、同じ鎖から得られる隣接する小さいDNA断片が接して、すなわち、ハイブリダイゼーションして、断片間にギャップのないDNA構築物を形成する。この実施形態において、大きいDNA断片は、好ましくは、連結によって再組立てされる(「直接的な自己集合および連結」)。同じ鎖から得られる隣接する小さい断片は隣接せず、すなわち、ハイブリダイゼーションせず、一本鎖のギャップを二本鎖重複部の間に有するDNA構築物を形成する実施形態では、大きいDNA断片が、好ましくは、重複部伸長によって再組立てされる。別の実施形態において、同じ鎖から得られる隣接する小さい断片は接して、すなわち、ハイブリダイゼーションして、一本鎖のギャップを二本鎖重複部の間に有しないDNA構築物を形成し、かつ、大きいDNA断片が、重複部伸長によって再組立てされる。別の実施形態において、ギャップの存在および非存在の組合せを有するDNA構築物が重複部伸長によって再組立てされる。別の好ましい実施形態において、大きいDNA断片が発現ベクターにおけるクローニングによって再組立てされる。この実施形態において、DNA構築物の末端はギャップの存在および非存在の任意の組合せを有し得る。好ましくは、大きいDNA断片の末端は発現ベクターへの挿入のために適合化され、例えば、発現ベクターにおける制限部位に対して相補的である。
【0056】
別の好ましい実施形態において、大きいDNA断片は「繰り返し組立て」または「階層的な組立て」のために設計される。この実施形態において、大きいDNA断片は最初に、重複する中サイズのDNA断片に分割される。いくつかの実施形態において、大きいDNA断片は約3個〜約10個の中サイズのDNA断片、好ましくは、約5個〜約7個の断片に分割される。それぞれの中サイズ断片は、その後、重複する小さいDNA断片、好ましくは約6個〜約12個の断片にさらに分割される。直接的な自己集合について上記で記載されたように、繰り返しのそれぞれのレベルにおけるDNA断片は、連結、重複部伸長またはクローニングを含む様々な方法の任意の組合せによる再組立てのために設計することができる。好ましい実施形態において、DNA断片は重複部伸長によって再組立てされる。当業者は、直接的な自己集合が、大きいDNA断片が一段階で分割される繰り返し組立ての特別な場合であることを認識する。
【0057】
工程304。繰り返しのそれぞれのレベルにおける得られたDNA断片について、配列が、正しい一致(隣接するDNA断片の間での重複部領域)を強め、かつ、正しくない一致(他のすべてのハイブリダイゼーション)を妨害するために最適化される。例えば、コード領域におけるDNA配列を、遺伝暗号の縮重性を利用することによって最適化することができる。調節領域におけるDNA配列を、調節領域コンセンサス配列における縮重性を利用することによって最適化することができる。コード領域または調節領域の外側におけるDNA配列、すなわち、遺伝子間領域におけるDNA配列を直接的な塩基割り当てによって最適化することができる。
【0058】
いくつかの実施形態では、配列最適化が使用されず、または、限定された配列最適化が使用される。例えば、ヌクレオチド配列における変化はDNAおよびRNAの二次構造を変化させ得る。RNAウイルスゲノムにおける二次構造の変化はウイルスの生存性に影響を及ぼし得る。いくつかの実施形態では、配列最適化が行われない。他の実施形態では、選択された配列が、上記で記載されたように最適化され、他の配列は最適化されない。
【0059】
いくつかの実施形態において、工程302で記載された分割が、DNA断片が所望のDNA配列に再集合する確率を増大させるために最適化される。隣接するDNA断片との間での境界点が、温度の差を生じさせ、または増大させるために、あるいは、他の正しくないハイブリダイゼーション、例えば、ヘアピンを妨害するために調節される。
【0060】
合成遺伝子の再組立てまたは合成は、工程302および工程304で記載された分割プロセスの形式的には逆のことである。
【0061】
工程306。最適化された小さいDNA断片を得る。典型的には、小さいDNA断片は合成である。好ましい実施形態において、小さいDNA断片は一本鎖であり、隣接する断片の重複する部分が相補的である。
【0062】
工程308。各DNA断片の1回の分割に由来するDNA断片が組み合わされる。繰り返し組立てプロセスにおいて、それぞれの中サイズ断片に由来する小さい断片がこの工程において組み合わされる。次の繰り返し組立てサイクルにおいて、それぞれの大きい断片に由来する得られた中サイズ断片がこの工程において組み合わされ、これが次々に繰り返される。直接的な自己集合プロセスにおいて、大きいDNA断片に由来する小さい断片がこの工程において組み合わされる。
【0063】
工程310。DNAセグメントを自己集合させて、二本鎖の重複領域によってつながれたssDNAセグメントのDNA構築物を形成させる。DNA断片が二本鎖である実施形態では、断片は好ましくは最初に変性される。DNA断片を再組立てするために重複部伸長を使用する実施形態では、一本鎖のギャップが二本鎖の重複領域の間に存在する。好ましくは、一本鎖ギャップは約0塩基〜約20塩基の長さである。DNA断片を再組立てするために連結を使用する実施形態では、長さゼロの一本鎖ギャップ(すなわち、ギャップではなく、DNAにおけるニック)が存在し、二本鎖の重複部領域が互いに接する。DNA断片を再組立てするためにクローニングを使用する実施形態では、ギャップの存在および非存在の任意の組合せが存在する。
【0064】
工程312。DNA構築物を完全な二重鎖のdsDNAに伸長させる。一本鎖のギャップが二本鎖重複部の間に存在する実施形態では、伸長が、好ましくは高忠実DNAポリメラーゼ反応を使用する重複部伸長を使用して達成される。ギャップが二本鎖重複部の間に存在しない実施形態では、伸長が連結によって達成される。別の好ましい実施形態において、自己集合した構築物が発現ベクターにクローニングされ、完全な二重鎖のdsDNAへの伸長が細胞装置によって行われる。
【0065】
いくつかの実施形態では、ssDNAがその後の工程において使用される。ssDNAは、この分野で知られている任意の方法を使用して、例えば、変性することによって、またはニック化酵素を使用することによってdsDNAから作製される。いくつかの実施形態において、DNAは、ssDNAを産生するベクター、例えば、バクテリオファージM13、またはM13のDNA複製起点を含有するプラスミドにクローニングされる。M13は、ssDNAを複写して培地に放出することが知られている。
【0066】
工程314。いくつかの実施形態において、得られたDNA断片の正しいという可能性を示す性質が、より詳しくは下記において開示されるように、必要に応じて決定される。正しい配列を有することが考えられるDNA断片がその後の再組み立て工程のために選択される。いくつかの実施形態において、性質が、正しい配列を有することが考えられる合成遺伝子を選択するために、合成遺伝子が完全に再組立てされた後に決定される。いくつかの実施形態において、選択された合成遺伝子の配列が配列決定によって確認される。
【0067】
工程316。工程308〜工程314が、合成遺伝子を作製するために、工程312における分割の逆の順序で繰り返される。当業者は、分割プロセスにおいて同定されたDNA断片がそれぞれ、異なる再組立て方法によって合成され得ることを理解する。例えば、1つの断片を重複部伸長によって合成することができ、一方で、別の断片が連結によって合成され、これら2つの断片が発現ベクターへのクローニングによって再組立てされる。
【0068】
好ましい実施形態において、開示された方法は、遺伝暗号が、高い蓋然性で、誤ったハイブリダイゼーションがより低い温度で融解し、かつ、正しいハイブリダイゼーションがより高い温度で融解するようにコドンが割り当てられることを可能にするために十分に縮重しているという事実を利用している。結果として、生じる生成物は大部分が高い蓋然性で正しい、中間の温度範囲が存在する。誤りが低い確率で生じるので、正しい分子量を有する生成物(すなわち、最終的なゲルにおける同じバンド)をもたらす2つ以上の相殺する誤り、または、同じ読み枠の生成物(すなわち、同じであるか、またはほぼ同じであるコードされたアミノ酸配列)をもたらす2つ以上の相殺する欠失は、二重に希な事象またはより希な事象に対応すると考えられる。
【0069】
最終的なプライマー、または中間のプライマー、または他の隣接する配列は、合成された遺伝子が、大きい合成遺伝子を迅速かつ容易に組み立てることを可能にする様々な広く知られているクローニング方法、例えば、制限酵素、相同組換え、エキソヌクレアーゼクローニング、またはこの分野で知られている他の方法を使用して発現ベクターに挿入されることを可能にする配列を含有することができる。
【0070】
開示された方法のいくつかの実施形態における問題の1つは、合成オリゴヌクレオチドまたは小さいDNA断片が、典型的には、内部の点欠失を有する配列が混入した所望するDNA配列(「全長のオリゴヌクレオチド」)の混合物を含有するということである。この問題は、1つだけの点欠失を有するオリゴヌクレオチド(「N−1オリゴヌクレオチド」)がオリゴヌクレオチドの典型的な化学合成における最も一般的な混入物であるので、本明細書中では「N−1」問題として示される。さらに、いくつかの実施形態において、N−1オリゴヌクレオチドは、それらがハイブリダイゼーションし、かつ、結果として、望ましくない生成物をもたらす可能性が、2つ以上の点欠失または点変異を有するオリゴヌクレオチドよりも大きいので、最も厄介な問題である。オリゴヌクレオチドのこの混合物が、本明細書中に開示されるような中位のDNA断片および大きいDNA断片を合成するために使用されるとき、生成物のDNA断片は、所望する配列を有するDNA、ならびに、N−1オリゴヌクレオチドの取り込みに起因する誤りを有するDNAを含有する集団を含有する。N−1オリゴヌクレオチドの誤りは、当業者によって理解されるように、累積的であり、かつ、フレームシフト変異を生じさせることがある。
【0071】
化学合成されたオリゴヌクレオチドにおいて、各ヌクレオチドについての典型的なカップリング効率は約98%〜約99.5%またはそれ以上である。表Iには、99.5%、99%および98%のカップリング効率について、長さが20nt〜250ntである所望する全長オリゴヌクレオチドの収率が示される。これらの結果が図4A〜図4Cにそれぞれ図示される。予想されるように、正しいオリゴヌクレオチドを合成する確率はオリゴヌクレオチドの長さおよびカップリング効率とともに低下する。合成遺伝子の構築において使用されたオリゴヌクレオチド断片のそれぞれが多少のN−1混入物を含有するので、所望する合成遺伝子を合成する確率は合成遺伝子の長さとともに低下する。
【表1】

【0072】
所望する合成遺伝子が、正しいオリゴヌクレオチド順序の高い確率で合成される場合でさえ、所望する遺伝子は、N−1オリゴヌクレオチドに起因する多くの不完全な遺伝子と常に混合されている。多くの適用において、正しい遺伝子と、不完全な遺伝子とのこのような混合物は望ましくない。従って、所望する遺伝子を合成し、かつ/または、所望する遺伝子をこのような混合物から選択する確率を改善するための方法が下記に開示される。
【0073】
いくつかの実施形態において、N−1問題は、上記に記載され、また、図2に例示されるように、直接的な自己集合および連結を使用して化学合成オリゴヌクレオチドを組立てることによって対処される。直接的な自己集合および連結を使用する実施形態では、各オリゴヌクレオチドにおけるヌクレオチドのすべてがハイブリダイゼーションされ、それにより、事前に連結されたDNA構築物にN−1オリゴヌクレオチドが取り込まれる確率を低下させる。重複部伸長を使用する実施形態では、一本鎖領域に欠失を有するオリゴヌクレオチドを取り込んでいる事前に伸長されたDNA構築物は、正しいオリゴヌクレオチドを取り込んでいるDNA構築物とほぼ同じくらいの可能性である。二本鎖領域おける一塩基欠失誤り率は約0.3%であり、一方、一本鎖領域における誤り率は約0.5%である。
【0074】
いくつかの実施形態において、N−1問題は、合成DNA分子の集団をサンプリングし、サンプリングされた分子を配列決定することによって対処される。いくつかの実施形態において、最後の工程を含めて、再組立て工程のいずれかで作製された種々のDNA分子の集団からの無作為なサンプルが配列決定され、正しいヌクレオチド配列を有するそのような分子のみが次の再組立て工程において使用される。最適なサンプルサイズは、所望するDNA分子を合成する確率に関係づけられる。例えば、99.5%のカップリング効率による200ntのオリゴヌクレオチドまたは中間フラグメントの合成は約37%の正しいオリゴヌクレオチドをもたらす。4つのオリゴヌクレオチドまたは中間フラグメントを生成物の混合物から無作為に選択することにより、少なくとも1つの正しいオリゴヌクレオチドを選択する可能性は約84%である。99.5%のカップリング効率での300ntのオリゴヌクレオチドまたは中間フラグメントについては、正しいオリゴヌクレオチドが生成物の約22%を構成する。少なくとも1つの正しいオリゴヌクレオチドまたは中間フラグメントをこの混合物に由来する4つのオリゴヌクレオチドのサンプルから選択する確率は約63%である。99.5%および99.7%のカップリング効率による合成、ならびに、250nt、300ntおよび300ntのオリゴヌクレオチド長さについて、1、4、6および8のサンプルサイズを使用して少なくとも1つの正しいオリゴヌクレオチドまたは中間フラグメントを選択する確率が表IIに示される。表IIに示されるように、わずかな量の配列決定が、正しいオリゴヌクレオチドまたは中間フラグメントを選択する良好な確率を提供するために必要となるだけである。
【表2】

【0075】
いくつかの実施形態において、サンプリングは、配列決定すべきDNAを好適なベクターにクローニングすることによって行われる。典型的には、それぞれの形質転換されたコロニーが合成DNAの1つの分子に対応する。いくつかの実施形態において、形質転換されたコロニーのサンプルが選択され、DNAが配列決定され、正しい配列を有するDNAが組立ての次の階層的段階において使用される。クローニングは、この分野で知られている任意のタイプのクローニングである。1つの実施形態において、クローニングはトポイソメラーゼI(TOPO(登録商標)、Invitrogen)クローニングである。
【0076】
サンプリングは、階層的な再組立て段階のいずれでも行われる。例えば、いくつかの実施形態において、オリゴヌクレオチドが化学合成の後で配列決定される。いくつかの実施形態において、オリゴヌクレオチドまたは中間フラグメントが中サイズのDNA断片に組立てられ、その後、この中サイズのDNA断片が配列決定される。いくつかの実施形態において、中サイズのDNA断片が大きなDNA断片に組立てられ、その後、この大きなDNA断片が配列決定される。いくつかの実施形態において、サンプリングおよび配列決定が、直接的な自己集合および連結によって合成される中サイズのDNA断片または大きいサイズのDNA断片に対して行われる。
【0077】
いくつかの実施形態において、N−1問題は、合成DNA配列の集団に由来するサンプルから発現されたポリペプチド(1つまたは複数)を分析することによって対処される。DNAは、この分野で知られている任意の手段を使用して、例えば、遺伝子を発現ベクターに挿入して、または、無細胞発現システムを使用して発現される。いくつかの実施形態において、DNA配列が発現ベクターにクローニングされ、発現される。上記で議論されたように、それぞれのクローンが、典型的には、集団に由来する1つのDNA分子に対応する。いくつかの実施形態において、DNAは全長の合成遺伝子である。いくつかの実施形態において、DNAは中間フラグメントである。中間フラグメントの場合、当業者は、いくつかの実施形態において、中間フラグメントが、(1)開始コドンを正しい読み枠で提供するリーダー、すなわち、所望するポリペプチドを発現させるために、DNAにおけるATGと、読み枠を調節する0〜2ntのフィラーとを提供するリーダー、および(2)所望するポリペプチドを終結させるために、DNAにおける1つまたは複数の停止コドン(TAA、TAGまたはTGA)と、読み枠を調節する0〜2ntのフィラーとを提供するトレーラーを伴って設計されることを認識する。典型的には、読み枠は、全長の合成遺伝子に対するのと同じである。しかし、他の読み枠がいくつかの実施形態では使用される。典型的には、0〜2個の塩基が、読み枠を調節するためにリーダーおよびトレーラーに挿入される。当業者は、3つ以上の塩基が、読み枠を調節するために使用され得ることを認識する。例えば、いくつかの実施形態において、リーダーおよび/またはトレーラーは、さらなるアミノ酸、制限部位または制御配列をコードする。当業者は、いくつかの実施形態において、異なるリーダーおよび/またはトレーラーが、本方法の様々な段階において同じDNA断片と一緒に使用されることをさらに認識する。例えば、いくつかの実施形態において、DNA断片からのポリペプチドの発現において使用されるリーダーおよび/またはトレーラーは、そのDNA断片の組立てにおいて使用されるリーダーおよび/またはトレーラーとは異なる。いくつかの実施形態において、1つまたは複数の停止コドンが、1つまたは複数のN−1オリゴヌクレオチドから構築されたDNAフラグメントの翻訳を停止させるために、遺伝子の下流側(3’)に提供される。いくつかの実施形態において、停止コドンは発現ベクターに操作して入れられる。いくつかの実施形態では、少なくとも3つの停止コドンが遺伝子の下流側(3’)、すなわち、3つの可能な読み枠のそれぞれにおいてそれぞれの少なくとも1つに含まれる。いくつかの実施形態では、停止コドン群が、それぞれの読み枠における1つの停止コドンの代わりに使用される。
【0078】
図5A〜図5Dは、ポリペプチドが合成遺伝子の構築において中間フラグメントから発現される開示された方法の実施形態を例示する。図5Aは、多数の中間フラグメントへの遺伝子の分割および構築を概略的に例示する。
【0079】
図5Bは、中間フラグメントの1つの分割および構築を例示する。文字a〜gはそれぞれが中間フラグメントの配列の一部を表す。角括弧は、これらの部分を、購入または合成されるオリゴヌクレオチドにグループ化する。「ldr」および「tlr」はリーダーおよびトレーラーをそれぞれ表す。相補鎖上の配列の対応する部分には、ハイフン(−)が前に付けられる(すなわち、「−ldr」「−a」、・・・、「−g」および「−tlr」)。再度ではあるが、角括弧は、オリゴヌクレオチドを示すために使用される。
【0080】
図5Cは、図5Bで例示されたリーダー(ldr)部分の概略である。5’末端から、リーダーは、10ntのフィラー、CATATG制限部位、および、3’末端における0〜2ntのフィラーを含む。例示された実施形態において、5’フィラーの長さは制限酵素の要求によって決定される。制限部位は、中間フラグメントをクローニングする際に使用され、ATG開始コドンを含む。0〜2ntのフィラーにより、開始コドンに対する中間フラグメントの読み枠が調節される。いくつかの実施形態において、制限部位は開始コドンを含まない。いくつかの実施形態において、開始コドンが3’フィラーに組み込まれる。
【0081】
図5Dは、図5Bで例示されたトレーラー(tlr)部分の概略である。5’末端から、トレーラーは、0〜2ntのフィラー、TAATAA停止配列、GGATCC制限部位、および5ntのフィラーを含む。0〜2ntのフィラーにより、中間フラグメントに対する停止コドンの読み枠が調節される。TAATAAは1対の停止コドンである。好適な停止コドンはどれも有用である。いくつかの実施形態では、1つの停止コドンが使用される。GGATCCは、中間フラグメントをクローニングするために使用される制限部位である。3’フィラーの長さは制限酵素の要求によって決定される。当業者は、他の実施形態において、リーダーおよび/またはトレーラーが、異なる組合せのフィラー、制限部位、開始コドンおよび/または停止コドンを使用することを理解する。いくつかの実施形態において、中間フラグメントは開始コドンおよび/または停止コドンを含み、リーダーおよび/またはトレーラーはコドンを含まない。例えば、合成遺伝子の場合、遺伝子は、典型的には、開始コドンおよび停止コドンの両方を含む。同様に、当業者は、いくつかの実施形態において、リーダーおよび/またはトレーラーが制限部位を含まないことを理解する。リーダーおよび/またはトレーラーのいくつかの実施形態において、5’フィラーおよび/または3’フィラーは使用されない。
【0082】
N−1欠陥を有するクローンから発現されるポリペプチドは不完全である。発現したペプチドは、この分野で知られている任意の手段を使用して、例えば、ゲル電気泳動、キャピラリー電気泳動、2次元電気泳動、等電点フォーカシング、分光法、質量分析法、NMR分光法、化学的アッセイ、リガンド結合アッセイ、酵素切断アッセイ、または機能的もしくは免疫学的なアッセイを使用して分析される。正しいペプチドを発現するクローンはN−1欠陥を有しない。
【0083】
いくつかの実施形態において、発現ペプチドは、ポリペプチドを分子量によって分離するゲル電気泳動を使用して分析される。64個の可能なDNAコドンのうち、3つが停止コドンである。結果として、点欠失により引き起こされるフレームシフトは、新しい停止コドンを生じさせ、これにより、早期に短縮化されたポリペプチドをもたらす可能性がある(この場合、その分子量が、ゲル電気泳動を使用して測定される)。全長のポリペプチドをもたらすクローンは、所望する配列を有することが考えられ、一方、短縮化されたポリペプチドをもたらすクローンは、少なくとも1つの点欠失を有することが考えられる。いくつかの実施形態において、N−1欠陥(1つまたは複数)を有するクローンにより、長すぎるポリペプチドが産生される。これは、N−1欠陥は、終結させる停止コドンを無視させる(読み抜けさせる)フレームシフトをもたらすからである。いくつかの実施形態において、長すぎるそのようなポリペプチドは、遺伝子の下流側(3’)において発現ベクターに操作して入れられた停止コドンによって終結させられる。上記で議論されたように、いくつかの実施形態において、3つの停止コドン群、すなわち、それぞれの可能な読み枠において1つの群が含まれる。これらの実施形態において、発現したポリペプチドの分子量は予想よりも大きい。
【0084】
いくつかの実施形態において、発現ポリペプチドの分析が、次に配列決定されるクローンのサンプルを狭めるために使用される。これらの実施形態において、発現ポリペプチドの分析は、明らかに不完全なDNAクローン(例えば、短縮化されたDNAクローン、または長すぎるDNAクローン)を同定し、それらを除くために使用される。残るクローンが、その後、配列決定される。これらの実施形態において、発現および分析は、上記の無作為的な選択法とは対照的に、半無作為的または非無作為的な選択法である。いくつかの実施形態において、発現ポリペプチドはゲル電気泳動によって分析される。場合により、ゲル電気泳動では、不完全なポリペプチドが、正しいポリペプチドから区別されない。例えば、場合により、N−1欠陥を有するDNA配列は、電気泳動条件の分解能の範囲内で、正しいポリペプチドと同じ分子量を有する不完全なポリペプチドを生じさせる。この状況は、不完全なDNA配列が、正しいポリペプチドに分子量が類似する不完全なポリペプチドを偶然に発現する場合に、例えば、点欠陥がクローンの末端付近に存在する場合に生じ得る。別の状況において、クローンは、新しい停止コドンを生じさせない3N個の点欠失を有する。上記で議論されたように、不完全なポリペプチドは、十中八九、正しいポリペプチドよりも短い。正しいポリペプチドに対して分子量が電気泳動実験の分解能よりも近い不完全なポリペプチドは区別されない。ゲル電気泳動の分解能を考えた場合、本方法を使用して正しいクローンを選択することは非常に確からしい。確率は、より高い分解能を有する分析技術、例えば、キャピラリー電気泳動または質量分析を使用してさらに改善される。場合により、遺伝子発現スクリーニングにおいて配列決定のために選択されたクローンのすべてが正しい配列を有する。このことはこの選択法の信頼性を示している。さらに、遺伝子を発現させ、かつ、発現ポリペプチドの分子量を測定することは、典型的には、DNA配列決定の同等の量よりも迅速であり、かつ/または費用がかからない。いくつかの実施形態において、中間フラグメントは、発現ポリペプチドの分子量を推定することのみによって選択され、DNA配列決定は、最終的な遺伝子構築物のためだけに、また、そのときでさえ、最終的な遺伝子から発現したポリペプチドのその分子量が正しいと推定された後のためにだけ取っておかれる。
【0085】
いくつかの実施形態において、分析されている発現ポリペプチドのすべてが不完全であり、例えば、短縮化されている。これらの実施形態において、不完全なポリペプチドの分析により、DNA配列における欠陥の存在位置が示される。その場合、遺伝子が、この情報を使用して再合成される。多数の階層的な合成工程を使用する実施形態では、DNA断片の一部のみが再合成される(例えば、欠陥を含有する中間フラグメント)。いくつかの実施形態において、邪魔なフラグメントが、上記で議論されたように、異なる方法で分割され、かつ/または再び最適化される。いくつかの実施形態において、異なるクローンが、邪魔なフラグメントに取って代わるために選ばれる。
【0086】
本明細書中に記載される方法は、任意の所望するタンパク質をコードする合成DNA遺伝子、または任意の他の所望する核酸を構築するための迅速で、容易で、かつ安価な方法を提供する。本明細書中に提供される第1の例では、大腸菌スレオニンデアミナーゼ(514個のアミノ酸残基(1,542個のコード塩基)を有するタンパク質)をコードする遺伝子の2工程の繰り返し組立てが記載される。第2の例では、天然痘(痘瘡)DNAポリメラーゼ(1,005個のアミノ酸残基(3,015個のコード塩基)を有するタンパク質)をコードする遺伝子の3工程の繰り返し組立てが記載される。第3の例では、発現ベクターへのクローニングによる再組立てを用いた合成大腸菌スレオニンデアミナーゼ遺伝子の直接的な自己集合が記載される。第4の例では、Gag3pポリタンパク質をコードする876bpのTy3GAG3遺伝子のサンプリングおよび配列決定を用いた2工程の繰り返し組立てが記載される。Ty3はサッカロミセス・セレビジアエ(Saccharomyces cerevisiae)におけるレトロトランスポゾンである。第5の例では、1640bpのTy3インテグラーゼ(「Ty3IN」)遺伝子についてのサンプリングおよび配列決定を用いた2工程の繰り返し組立てが記載される。それらにより、本明細書中に記載される方法が、任意の所望する核酸配列または任意の所望する遺伝子を構築するために使用され得ることが理解される。
【0087】
大腸菌スレオニンデアミナーゼは下記の理由から任意に選ばれた:(1)そのサイズがほとんどのタンパク質と同程度であり、このことにより、広範な適用可能性が明らかにされる;(2)大腸菌スレオニンデアミナーゼはホモ四量体に会合し、このことにより、タンパク質−タンパク質の相互作用が明らかにされる;(3)そのアロステリックな性質を正しい折り畳みおよび組立てについて容易に評価することができる;そして(4)部分的には、その構造および性質が本発明者らの1人のPh.D学位論文の研究課題であったので、昔を懐かしんで気まぐれにより。Hatfield&Ray、「定常状態反応に対する遅い過程のカップリング」、J.Biol.Chem.、1970、245(7)、1753〜4;Hatfield、Ray&Umbarger、「枯草菌由来のスレオニンデアミナーゼ.III.前定常状態の速度論的性質」、J.Biol.Chem.、1970、245(7)、1748〜53;Hatfield&Umbarger、「枯草菌由来のスレオニンデアミナーゼ.II.定常状態の速度論的性質」、J.Biol.Chem.、1970、245(7)、1742〜7;Hatfield&Umbarger、「枯草菌由来のスレオニンデアミナーゼ.I.酵素の精製」、J.Biol.Chem.、1970、245(7)、1736〜41を参照のこと。
【0088】
天然痘(痘瘡)DNAポリメラーゼは下記の理由から選ばれた:(1)天然痘(痘瘡)DNAポリメラーゼはほとんどのタンパク質よりも大きく、このことにより、広範な適用可能性が明らかにされる;および(2)現在の様々な事象により、特別な関心が天然痘(痘瘡)DNAポリメラーゼに向けられている。特に、病原性生物由来の遺伝子をデノボ合成することができることにより、病原体の実際の使用を伴わない研究が可能になる。そのような研究の例には、遺伝子発現の調節、薬物開発、ワクチン開発などが含まれる。病原体が決して使用されないので、偶発的または意図的のいずれかであっても、暴露の可能性がない。そのうえ、合成遺伝子の配列を、選択された非病原性生物における発現を最適化するために改変することができる。
【0089】
Ty3はレトロウイルスに対するその類似性のために選ばれた。GAG3はGag3p(ウイルス様粒子(VLP)に会合する26kDaのキャプシドおよび9kDaの核キャプシドにプロセシングされる38kDaのポリタンパク質)をコードする。Ty3INはS.cerevisiaeゲノムにおけるTy3のレトロウイルス様組み込みに関係している。
【0090】
開示された方法の好ましい実施形態が下記の実施例において例示される。これらの実施形態において、用語「中サイズ断片」および用語「中間フラグメント」は交換可能に使用される。
【実施例】
【0091】
<実施例1>
2工程の繰り返し分解および重複部伸長組立てによる大腸菌スレオニンデアミナーゼ
実施例1では、2工程の階層的な分解と、重複部伸長による再組立てとによる大腸菌スレオニンデアミナーゼ遺伝子の合成が例示される。大腸菌スレオニンデアミナーゼは、514個のアミノ酸残基(1,542個のコード塩基)を有するタンパク質である。
【0092】
設計
配列設計法では、所望するタンパク質配列における各アミノ酸に同義的(サイレント)なコドンの割り当てが変更される。それぞれの同義的コドン変化は、同じタンパク質をコードする異なる人工遺伝子配列をもたらす。大腸菌は所望の発現ベクターであったので、最初のコドン割り当ては、大腸菌のゲノムコドン使用法の統計学に従って各アミノ酸をその最も頻繁なコドンと対にすることであった。続いて、コドン割り当ては下記のように乱された。最終的なコドン割り当ては、生化学的に達成されるための最終的なDNA配列を意味した。
【0093】
この2工程の階層的な分解において、遺伝子は最初に5つの重複する中サイズ断片(本実施例では、340塩基以下、33塩基以上の重複部)に分割され、その後、それぞれの中サイズ断片が数個の重複する短いセグメント(本実施例では、50塩基以下、18塩基以上の重複部)に分割された。すべての重複部は、プライミング効率のために末端のCまたはGを含むように、必要ならば、長くされた。
【0094】
理論的な融解温度を、最も一般的なコドンを使用する中サイズのDNA断片および短いDNA断片のすべての可能な正しいハイブリダイゼーションおよび正しくないハイブリダイゼーションについてMfoldを用いて計算した。結果が図6に例示される。最も低く融解する正しい一致と、最も高く融解する正しくない一致との間での差を、上記で記載されたようにコドン割り当てを乱すことによって増大させた。最適化された配列に対する理論的な融解温度が図7に例示される。本実施例では、差は少なくとも10℃であった。
【0095】
スレオニンデアミナーゼタンパク質配列におけるすべてのアミノ酸に対する最終的なコドン割り当てが図8に示される(配列番号1)。図9は、大腸菌に対するコドン割り当ての記号である。図8は、図7、図10および図11A〜図11Dのための基礎を構成する。最初のコドン割り当て(図9における欄0)が図6のための基礎を構成する。
【0096】
設計目的は、図10に例示されるような希なコドンを過度に使用することなく達成することができる。本実施例におけるコドン使用(白丸および破線)が大腸菌におけるゲノムのコドン使用の関数として示される。この場合のコドン使用と、大腸菌におけるコドン使用との相関係数は0.76である。比較のために、天然のスレオニンデアミナーゼにおける天然のコドン使用もまた示される(xおよび実線)。天然のコドン使用と、大腸菌におけるコドン使用との相関係数は0.81である。天然の使用法は、設計されたものよりも良好であるか、設計されたものと同等である。
【0097】
得られたDNA配列を、図11A〜図11Eに例示される重複部マップに示される短い重複するセグメントに分解した。短いセグメントの間での重複部が角括弧([ ])によって示される。長い鎖の間での重複部が大括弧({ })によって示される。鎖1および鎖4の描写において、(−3)の前の3塩基は、重複部を明瞭に例示するために、(−3)の後に示される最初の3塩基と同じ塩基である。これらの塩基は実際のDNA配列では繰り返されない。配列番号2〜配列番号12は、鎖0を構成する配列に対応し(図11A)、配列番号13〜配列番号24は、鎖1を構成する配列に対応し(図11B)、配列番号25〜配列番号36は、鎖2を構成する配列に対応し(図11C)、配列番号37〜配列番号48は、鎖3を構成する配列に対応し(図11D)、配列番号49〜配列番号60は、鎖4を構成する配列に対応する(図11E)。より詳しくは下記において記載されるように、それぞれの短いセグメントは直接合成され、5回の並行反応で5つの中サイズのDNA断片に組立てられた。第2段階において、これら5つの中サイズ断片は合成遺伝子に組立てられた。図11A〜図11Eに示されるセグメント、および、重複部伸長のための様々なプライマーは、合計で3,093ヌクレオチドを有する総数で72個の合成セグメントとなった。
【0098】
合成
合成された大腸菌L−スレオニンデアミナーゼ遺伝子の標的DNA配列は1,542個の塩基を有する。本実施例では、この標的DNA配列を、隣接する中サイズ断片と少なくとも33塩基によってそれぞれが重複する5つの中サイズ断片の1組に分解した。次に、それぞれの中サイズ断片を、隣接するセグメントと18塩基〜50塩基によって重複する11個または12個の小さい一本鎖DNAセグメントの「組」に分解した。これら5つの中サイズ断片は、本明細書中では「中サイズ断片0」〜「中サイズ断片4」と称される。これらの中サイズ断片を構成する小さい一本鎖DNAセグメントは、「Seg」、中サイズ断片番号およびセグメント番号として示され、この場合、セグメント番号は、フォワード鎖セグメントの5’末端から始まって0から始まる。中サイズ断片およびセグメントの両方に対する番号付けがゼロから始まることに留意すること。例えば、中サイズ断片0の最初のセグメントは「Seg−0−0」であり、中サイズ断片4の7番目のセグメントは「Seg−4−6」である。これらのセグメントおよびプライマーはIllumina,inc.(San Diego、CA)によって商業的に合成された。
【0099】
図12A〜図12Eは、中サイズ断片0〜中サイズ断片4を構築するために使用された一本鎖DNAセグメントをそれぞれ例示する。各セグメントについて、隣接する相補鎖と重複する領域には、下線が引かれ、数字が付けられている。プライム付きの数字によって識別される重複部は、対応するプライムなしの重複部に対して相補的である。例えば、配列1は、隣接する相補鎖の配列1’に対して相補的であり、一方、配列2は配列2’に対して相補的であり、以降同様である。配列番号61〜配列番号71は、図12Aに例示されるSeg−0−0、Seg−0−1、Seg−0−2、・・・、Seg−0−10にそれぞれ対応する。同様に、配列番号72〜配列番号82はSeg−1−0〜Seg−1−10に対応し(図12B)、配列番号83〜配列番号93はSeg−2−0〜Seg−2−10に対応し(図12C)、配列番号94〜配列番号105はSeg−3−0〜Seg−3−11に対応し(図12D)、配列番号106〜配列番号116はSeg−4−0〜Seg−4−10に対応する(図12E)。
【0100】
リーダープライマーおよびトレーラープライマー
中サイズ断片0について、第1セグメントのSeg−0−0は重複部伸長のためのリーダープライマーとして役立つ。トレーラープライマー(リバース鎖相補体)は5’−GTAGCAGTAGGCATCAC−3’(17−mer、配列番号117)である。中サイズ断片1について、セグメントSeg−1−0はリーダープライマーとして役立ち、トレーラープライマーは5’−GGCTTCAACGGCTATCAC−3’(18−mer、配列番号118)である。中サイズ断片2について、セグメントSeg−2−0はリーダープライマーとして役立ち、トレーラープライマーは5’−GCTTAAGATGTGGGCCAG−3’(18−mer、配列番号119)である。中サイズ断片3について、セグメントSeg−3−0はリーダープライマーとして役立ち、Seg−3−11はトレーラープライマーとして役立つ。中サイズ断片4について、セグメントSeg−4−0はリーダープライマーとして役立ち、トレーラープライマーは5’−TTAGCCTGCGAGGAAGAAAC−3’(20−mer、配列番号120)である。当業者は、これらのセグメントが、付加されたプライマーが使用されないように(中サイズ断片3の場合のように)、または、1つの付加されたプライマーが使用されるように(中サイズ断片0−2および4の場合のように)、または、例示されないが、2つの付加されたプライマーが使用されるように設計され得ることを理解する。特に、偶数の数のセグメントが使用されるならば、これらのセグメントは、付加されたプライマーが必要とされないように設計することができる。この場合、第1セグメントがリーダープライマーとして役立ち、かつ、最後のセグメントがトレーラープライマーとして役立つ。異なる隣接する配列がこれらのリーダーおよびトレーラーに容易に付加され得ることもまた理解される。
【0101】
5つの中サイズ断片の組立
最初の重複部伸長反応。5つの中サイズ断片を一本鎖DNA配列の適切な組から重複部伸長およびPCRによって並行して構築した。反応混合物が表IIIに示され、サーモサイクラー条件が表IVに示される。重複部伸長反応の生成物を、図13に示されるように、1%アガロースゲルで分離した。
【表3】

【表4】

【0102】
PCR反応(濃縮)。それぞれの中サイズ断片を、表Vに示される反応混合物および表VIに示されるサーモサイクラー条件を使用するPCRによって別々に濃縮した。PCR反応の生成物を、図14に示されるように、1%アガロースゲルで分離した。
【表5】

【表6】

【0103】
全長遺伝子への5つの中サイズ断片の組立て
第2の重複部伸長反応。合成スレオニンデアミナーゼ遺伝子を、表VIIに示される反応混合物および表VIIIに示されるサーモサイクラー条件を使用するPCR反応から得られた5つの中サイズ断片から構築した。反応が完了した後、生成物を1.2%アガロースゲルに流し(図15)、スレオニンデアミナーゼ遺伝子に対応するバンドを、GENECLEAN(登録商標)(BIO101 Systems(登録商標)、Qbiogene)を用いてゲルから精製した。精製された遺伝子を、フェノール−クロロホルム(1:1)およびクロロホルム−イソアミルアルコール(24:1)によりさらに精製した。水層をグリコーゲンとともにエタノール沈殿し、沈殿を水に再懸濁して、NdeIおよびBamHIにより消化した。当業者は、他の制限部位が合成遺伝子に組み込まれ得ることを理解する。
【表7】

【表8】

【0104】
連結および発現
ディレクショナルクローニング(directional cloning)を、精製されたスレオニンデアミナーゼ遺伝子に対して行う。pET14b発現ベクター(Novagen)をBamHIおよびNdeIにより切断し、スレオニンデアミナーゼに対する適合性末端を作製する。スレオニンデアミナーゼインサートをベクターに連結し、これを使用して、BL21DE3エレクトロコンピテント細胞に形質転換する。
【0105】
<実施例2>
3工程の繰り返し分解および重複部伸長組立てによる痘瘡DNAポリメラーゼ
実施例2では、3工程の階層的な分解と、重複部伸長による再組立てとによる痘瘡DNAポリメラーゼ遺伝子の合成が例示される。痘瘡DNAポリメラーゼは、1,005個のアミノ酸残基(3,015個のコード塩基)を有するタンパク質である。痘瘡DNAポリメラーゼはまた、本明細書中では「Varpol」および「vpol」として示される。
【0106】
設計
痘瘡DNAポリメラーゼ遺伝子は大腸菌における発現のために意図されたので、コドン選択の検討は、実施例1に記載される大腸菌スレオニンデアミナーゼの設計において使用された検討と同様であった。
【0107】
3工程の階層的な分解を下記のように行った。最初に、遺伝子を約1,500塩基の2つの大きい断片に分割した。第1の大きい断片は本明細書中では「部分I」または「ポリメラーゼ−1」と称される。第2の大きい断片は本明細書中では「部分II」または「ポリメラーゼ−2」として示される。部分Iおよび部分IIは、連結によるそれらの組立てを可能にするために、相補的なApaI部位を伴って設計された。次に、それぞれの大きい断片を5つの重複する中サイズ断片(中間フラグメント)(本実施例では、340塩基以下、33塩基以上の重複部を有する)に分割した。次に、それぞれの中サイズ断片を数個の重複する短いセグメント(本実施例では、50塩基以下、18塩基以上の重複部を有する)に分割した。すべての重複部は、DNAポリメラーゼのプライミング効率ために末端のCまたはGを含むように、必要ならば、長くされた。
【0108】
DNA断片の配列を、最も低く融解する正しい一致と、最も高く融解する誤った一致との間での好適な差をもたらすように乱した。理論的な融解温度を、実施例1に記載されるように計算した。遺伝子の部分Iについて、最も一般的な大腸菌コドンについての小さい断片および中サイズ断片に対する正しい一致および正しくない一致の融解温度が図16に示され、設計された配列については図17に示される。設計されたDNA配列が図18(配列番号123)に示され、これは実施例1の図9のコドン記号に基づいている。天然の大腸菌スレオニンデアミナーゼにおけるコドン使用と比較される設計された部分I配列におけるコドン使用の比較が図19に示され、これにより、コドン頻度における類似性が示される。
【0109】
痘瘡DNAポリメラーゼ遺伝子の部分IIの小さい断片および中サイズ断片に対する理論的な融解温度が、大腸菌の最も一般的なコドンについては図20に示され、設計された配列については図21に示される。部分IIに対する設計された配列が図22(配列番号124)に示され、これは実施例1の図9のコドン記号に基づいている。天然の大腸菌スレオニンデアミナーゼのコドン使用と、部分IIの設計された配列との比較が図23に示され、これにより、コドン頻度における類似性が示される。
【0110】
痘瘡DNAポリメラーゼ遺伝子の部分Iを構成する5つの中間フラグメント(中サイズの断片)0〜4、リーダーおよびトレーラーのそれぞれを組立てるために使用された重複する短いセグメントに対する重複部マップが図24A〜図24Gに示される。配列番号125はリーダー−0に対応し(図24A)、配列番号126はリーダー−1に対応し(図24A)、配列番号127〜配列番号138は鎖−0に対応し(図24B)、配列番号139〜配列番号150は鎖−1に対応し(図24C)、配列番号151〜配列番号160は鎖−2に対応し(図24D)、配列番号161〜配列番号170は鎖−3に対応し(図24E)、配列番号171〜配列番号180は鎖−4に対応し(図24F)、配列番号181はトレーラー−0に対応し(図24G)、配列番号182はトレーラー−1に対応する(図24G)。より詳しくは下記において記載されるように、図24A〜図24Gに示されるそれぞれの短いセグメントは直接合成され、5回の並行反応で5つの中間フラグメントに組立てられ、その後、別の段階において、これら5つの中間フラグメントは痘瘡DNAポリメラーゼ遺伝子の部分Iに組立てられた。
【0111】
痘瘡DNAポリメラーゼ遺伝子の部分IIを構成する5つの中間フラグメント0〜4、リーダー、およびトレーラーのそれぞれを組立てるために使用された重複する短いセグメントに対する重複部マップが図25A〜図25Gに示される。配列番号183はリーダー−0に対応し(図25A)、配列番号184はリーダー−1に対応し(図25A)、配列番号185〜配列番号196は鎖−0に対応し(図25B)、配列番号197〜配列番号208は鎖−1に対応し(図25C)、配列番号209〜配列番号218は鎖−2に対応し(図25D)、配列番号219〜配列番号228は鎖−3に対応し(図25E)、配列番号229〜配列番号238は鎖−4に対応し(図25F)、配列番号239はトレーラー−0に対応し(図25G)、配列番号240はトレーラー−1に対応する(図24G)。より詳しくは下記において記載されるように、図25A〜図25Gに示されるそれぞれの短いセグメントは直接合成され、5回の並行反応で5つの中間フラグメントに組立てられ、その後、別の段階において、これら5つの中間フラグメントは痘瘡DNAポリメラーゼ遺伝子の部分IIに組立てられた。
【0112】
生化学
痘瘡DNAポリメラーゼ遺伝子を設計プロセスの逆の順序で組み立てた:最初に、10個の中間フラグメント(痘瘡DNAポリメラーゼ遺伝子の部分Iおよび部分IIについてそれぞれ5個)の組立て;次いで、1500bpの2つの大きい断片(部分Iおよび部分II)(これらは一緒になって全長の遺伝子を構成する)の組立て;そして最後に、適合性の隣接する末端を生じさせるための部分I(セグメント1Seg−4−09内)および部分II(セグメント2Seg−2−00内)のApaI消化、これにより、これら2つの大きい断片を連結して、全長の痘瘡DNAポリメラーゼ遺伝子を得ることができる。
【0113】
痘瘡DNAポリメラーゼの部分I。部分Iを構成する5つの中間フラグメント0〜4のそれぞれを、互いに重複する、鎖特異性が交互になっている合成オリゴヌクレオチドの組から組み立てた。中間フラグメントのそれぞれを構築するために使用された短いssDNAセグメントの配列が図26A〜図26Eに示される。隣接するセグメントの間での重複部が、下線、および下線領域の下の識別数字によって示されている。プライム付きの数字により識別される重複部は、対応するプライムなしの重複部に対して相補的である。配列番号241〜配列番号252は1Seg−0−00〜1Seg−0−11に対応し(図26A)、配列番号253〜配列番号264は1Seg−1−00〜1Seg−1−11に対応し(図26B)、配列番号265〜配列番号274は1Seg−2−00〜1Seg−2−09に対応し(図26C)、配列番号275〜配列番号284は1Seg−3−00〜1Seg−3−09に対応し(図26D)、配列番号285〜配列番号294は1Seg−4−00〜1Seg−4−09に対応する(図26E)。
【0114】
中間フラグメントのそれぞれについて、最初のセグメント(1Seg−0−00、1Seg−1−00、1Seg−2−00、1Seg−3−00および1Seg−4−00)は重複部伸長のためのリーダープライマーとして役立つ。最後のセグメント(1Seg−0−11、1Seg−1−11、1Seg−2−09、1Seg−3−09および1Seg−4−09)はトレーラープライマーとして役立つ。
【0115】
痘瘡DNAポリメラーゼの部分II。部分IIを構成する5つの中間フラグメント0〜4のそれぞれを、互いに重複する、鎖特異性が交互になっている合成オリゴヌクレオチドの組から組み立てた。中間フラグメントのそれぞれを構築するために使用された短いssDNAセグメントの配列が図27A〜図27Eに示される。隣接するセグメントの間での重複部が、下線、および下線領域の下の識別数字によって示されている。プライム付きの数字により識別される重複部は、対応するプライムなしの重複部に対して相補的である。配列番号295〜配列番号306は2Seg−0−00〜2Seg−0−11に対応し(図27A)、配列番号307〜配列番号318は2Seg−1−00〜2Seg−1−11に対応し(図27B)、配列番号319〜配列番号328は2Seg−2−00〜2Seg−2−09に対応し(図27C)、配列番号329〜配列番号338は2Seg−3−00〜2Seg−3−09に対応し(図27D)、配列番号339〜配列番号348は2Seg−4−00〜2Seg−4−09に対応する(図27E)。
【0116】
中間フラグメントのそれぞれについて、最初のセグメント(2Seg−0−00、2Seg−1−00、2Seg−2−00、2Seg−3−00および2Seg−4−00)は重複部伸長のためのリーダープライマーとして役立つ。最後のセグメント(2Seg−0−11、2Seg−1−11、2Seg−2−09、2Seg−3−09および2Seg−4−09)はトレーラープライマーとして役立つ。
【0117】
大きい断片(部分Iおよび部分II)への5つの中間フラグメントの組立て
それぞれの中間フラグメントを、図26A〜図26Eおよび図27A〜図27Eに示されるssDNA配列の適切な組から第1の重複部伸長反応で別々に構築した。それぞれの反応についての反応混合物が表IXに示され、サーモサイクラープログラムが表Xに示される。表IXにおける「合成オリゴヌクレオチドミックス」項目は、特定の中間フラグメントについてのフォワード鎖およびリバース鎖の相補体の合成オリゴヌクレオチドのそれぞれの等量からなる27.5ng/μLの混合物である。
【表9】

【表10】

【0118】
これらの反応の生成物を、痘瘡DNAポリメラーゼ遺伝子の部分Iについては図28に示されるように、また、部分IIについては図29に示されるように、1%アガロースゲルで分離した。
【0119】
痘瘡DNAポリメラーゼ遺伝子の全長の部分Iおよび部分IIへの中間フラグメントの組立て
痘瘡DNAポリメラーゼ遺伝子の部分Iおよび部分IIを、表XIに示される反応混合物および表XIIに示されるサーモサイクラープログラムを使用するそれぞれの構成中間フラグメントの組の第2の重複部伸長反応で組立てた。
【表11】

【0120】
痘瘡DNAポリメラーゼ遺伝子の部分Iの構築については、2回の重複部伸長反応を、図24Aおよび図24Gに例示される2つの異なるプライマー対を使用して行った。最初の反応では、30塩基の1lead−01リーダー(5’−TCCTCGAGCATAAT GGATGTGCGTTGCATC−3’、配列番号125)および29塩基の1trail−57トレーラー(5’−GCGGCAGCCA TAGGGCCCCTTAATCACCG−3’、配列番号349)を使用した。2回目の反応では、48塩基の1lead−02リーダー(5’−GACGACGACGACAAGCATATGCTCGAGGATA TGGATGTGCGTTGCATC−3’、配列番号126)および47塩基の1trail−58トレーラー(5’−TTAAGCGTAATCCGGAACATCGTATGGGTAGGGCCCCTTAATCACCG−3’、配列番号350)を使用した。
【0121】
痘瘡DNAポリメラーゼ遺伝子の部分IIの構築については、2回の重複部伸長反応を、図25Aおよび図25Gに例示される2つの異なるプライマー対を使用して行った。最初の反応では、30塩基の2lead−01リーダー(5’−TCCTCGAGCATAGGGCCCCTGCTGAAATTG−3’、配列番号183)および29塩基の2trail−57トレーラー(5’−GCGGCAGCCATACGCCTCATAGAAGGTCG−3’、配列番号351)を使用した。2回目の反応では、48塩基の2lead−02リーダー(5’−GACGACGACGACAAGCATATGCTCGAGGATG GGCCCCTGCTGAAATTG−3’、配列番号184)および47塩基の2trail−58トレーラー(5’−TTAAGCGTA ATCCGGAACATCGTATGGGTACGCCTCATAGAAGGTCG−3’、配列番号352)を使用した。
【表12】

【0122】
これらの反応の生成物を1%アガロースゲルで分離した。これは図30に例示される。
【0123】
全長の痘瘡DNAポリメラーゼ遺伝子(3000bp)を得るための部分Iおよび部分IIの連結
痘瘡DNAポリメラーゼ遺伝子の部分Iおよび部分IIに対応するレーンからのDNAを、GENECLEAN(登録商標)(BIO101 Systems(登録商標)、Qbiogene)を使用して精製した。2つのフラグメントを別々にApaI(Boehringer Mannheim)により一晩消化し、1%アガロースゲルで精製し、GENECLEAN(登録商標)を使用して精製した。
【0124】
部分Iおよび部分IIを、表XIIIに示される条件のもと、大気温度で1.25時間連結した。生成物を蛍光定量法によって定量した。連結を、1lead−01プライマーおよび2trail−57プライマーを使用するPCRによって確認し、その生成物を、図31に示されるように、1%アガロースゲルで単離した。PCR産物がレーン1に流され、1kB Plusラダーがレーン2に流された。
【表13】

【0125】
<実施例3>
1工程の階層的な分解および連結による大腸スレオニンデアミナーゼ
実施例3では、1工程の階層的な分解において遺伝子を分割し、直接的な自己集合方法により遺伝子を合成することによる大腸菌スレオニンデアミナーゼ遺伝子の合成が例示される。
【0126】
設計
1工程の階層的な分解において、遺伝子を54個の重複する短いセグメント(本実施例では、約60塩基以下、約27塩基以上の重複部)に分割した。遺伝子が連結による再組立てのために設計されたので、同じ鎖における隣接する短いセグメントは境界が接する、すなわち、一本鎖のギャップが二本鎖重複部の間には存在しない。重複部は、GまたはCで終了するようには設計されなかった。
【0127】
理論的な融解温度を、実施例1に記載されるように計算した。最も一般的な大腸菌コドンを使用する短いセグメントの計算された融解温度の分布が図32に示される。コドンを、上記で記載されたように、融解温度における差を増大させるために変更し、これにより、図33に示される最終的な短いセグメントについての計算された融解温度が得られた。本実施例における計算された温度差は21.6℃(77.1℃−55.5℃)であった。合成された大腸菌スレオニンデアミナーゼ遺伝子に対する最終的な配列が、実施例1の図9に由来するコドン記号を使用して、図34(配列番号353)に示される。天然の遺伝子のコドン使用と比較される設計されたスレオニンデアミナーゼ遺伝子のコドン使用の比較が図35に示され、これにより、コドン頻度の類似性が示される。
【0128】
得られたDNA配列を、図36における重複部マップに示される54個の短い重複するセグメントに分解した(配列番号354〜配列番号407)。図36におけるそれぞれの短いセグメントは直接合成され、1つの反応工程で合成遺伝子に組立てられた。
【0129】
生化学
スレオニンデアミナーゼ遺伝子を直接的な自己集合によって2工程で組立てた。リーダー、短いssDNAセグメントおよびトレーラーの配列が図37A〜図37Fに示される。配列番号408〜配列番号411は、図37Aに例示される遺伝子リーダーに対応し、配列番号412〜配列番号465はSeg−0−0〜Seg−0−53に対応し(図37B〜図37E)、配列番号466〜配列番号469は、図37Fに例示される遺伝子トレーラーに対応する。隣接するセグメントの間での重複部は示されていない。これらのDNAセグメントを商業的供給元から購入した。
【0130】
スレオニンデアミナーゼ遺伝子を最初に、直接的な自己集合および連結によってそれぞれが再組立てされる等サイズの4つの中サイズ断片に分割し、その後、これら4つの中サイズ断片を組み合わせ、連結して全長の遺伝子にした。
【0131】
4つの中サイズ断片の直接的な自己集合
4つの中サイズ断片のそれぞれを下記のように並行して構築した。
【0132】
アニーリング反応。短いセグメントを最初にサーモサイクラーにおいてアニーリングして、中サイズ断片に対応するDNA構築物を形成させた。それぞれの中サイズ断片を2つの部分(フォワード鎖およびリバース鎖)に分割した。それぞれの鎖について、0.825μMの濃度での、それぞれの鎖に対応する短いセグメントの20μL溶液を、800UのT4ポリヌクレオチドキナーゼにより処理した。それぞれの中サイズ断片のフォワード鎖およびリバース鎖に対応するキナーゼ処理された短いセグメントを混合して結合させた。フェノール抽出を混合物に対して行い、その後、エタノール沈殿および70%エタノール洗浄を行った。ペレットを7.8μLの1X TE(これから、表XIVに詳しく記載される溶液が調製された)に再懸濁した。それぞれの短いセグメントの濃度はこの溶液において1.65μMであった。この溶液を、表XVに記載されるようにプログラム化されたサーモサイクラーに置いた。
【表14】

【表15】

【0133】
連結反応。それぞれの中サイズ断片を、上記に記載されるアニーリング反応において合成された対応するDNA構築物の連結によって作製した。表XVIに示される反応混合物を16℃で一晩維持した。得られた4つの中サイズ断片のアガロースゲルが図38に示される。
【表16】

【0134】
スレオニンデアミナーゼ遺伝子への4つの中サイズ断片の組立て
それぞれの中サイズ断片を、GENECLEAN(登録商標)(BIO101 Systems(登録商標)、Qbiogene)を使用してゲルから単離した。4つの中サイズ断片を含有する連結反応混合物が表XVIIに示される。連結反応を16℃で一晩行った。生成物のアガロースゲル(これは全長のスレオニンデアミナーゼ遺伝子を含む)が図39に示される。
【表17】

【0135】
この時点で、組立てられた遺伝子は4℃で貯蔵することができ、または、ExoIII消化によって発現ベクターpET14b(Novagen)にクローニングすることができる。スレオニンデアミナーゼ遺伝子は、ExoIIIにより14℃で1分間処理された後、pET14bベクターの5’突出領域に対して適合し得る12bpの3’末端突出を有するように設計されている。インサートおよびベクターは、混合および加熱し、その後、インサートおよびベクターの重複する領域についてのTmよりも低い温度に冷却することによって連結される。アニーリングされたフラグメントを大腸菌宿主に37℃で形質転換する。
【0136】
<実施例4>
サンプリングおよび配列決定を伴う2工程の繰り返し分解によるTy3GAG3
実施例4では、サンプリングおよび配列決定を伴う2工程の繰り返し分解によるGAG3の合成が例示される。GAG3のオープンリーディングフレームは876bpの長さである。
【0137】
GAG3のORFを、重複部伸長による再組立てのために3つの重複する中間フラグメントに分割した。図40A〜図40Eは、遺伝子リーダー、フラグメント0〜2および遺伝子トレーラーの配列を例示する。フラグメント0は307bpであり、フラグメント1は324bpであり、フラグメント2は343bpであった。それぞれの中間フラグメントは、隣接するフラグメントと38ntによって重複する。それぞれの中間フラグメントを、重複部伸長による再組立てのために10個のオリゴヌクレオチド(50nt)に分割した。隣接するオリゴヌクレオチドは約19bpによって重複した。まとめると、組立てられた配列は中間フラグメントのそれぞれの両方の鎖をコードした。配列番号470は遺伝子リーダー−0に対応し(図40A)、配列番号471〜配列番号480はSeg−0−0〜Seg−0−9に対応し(図40B)、配列番号481〜配列番号490はSeg−1−0〜Seg−1−9に対応し(図40C)、配列番号491〜配列番号501はSeg−2−0〜Seg−2−10に対応し(図40D)、配列番号502は鎖2トレーラー(図40D)に対応し、配列番号503は遺伝子トレーラー−0に対応する(図40E)。
【0138】
中間フラグメントの組立てにおいて、これらのオリゴヌクレオチドを、DNAポリメラーゼ(Proofstart(登録商標)、Qiagen)ならびに適切なリーダー配列およびトレーラー配列と混合して、0.1μMの最終濃度にした。図41は、これらの反応の生成物を示すアガロースゲルである。フラグメント0はレーン1であり、フラグメント1はレーン2であり、フラグメント2はレーン3である。レーン4は2−Log DNA分子量ラダー(New England Biolabs)を含有する。
【0139】
中間フラグメントをそれぞれ、平滑末端連結手法を使用してクローニングした(pCR−BluntII−TOPO(登録商標)ベクター、Invitrogen)。それぞれの中間フラグメントの4つのクローンを配列決定し、正しい配列を選択した。選択された配列を、PCR(Proofstart(登録商標)DNAポリメラーゼ、Qiagen)によってベクターから増幅した。
【0140】
中間フラグメントを、オリゴヌクレオチドについて記載されたように混合し、二重鎖DNAに伸長させた。図42は全長のGAG3遺伝子のアガロースゲルである。遺伝子の同一性および正確性を、DNA生成物の両方の鎖を配列決定することによって確認した。
【0141】
この合成GAG3遺伝子を、5’および3’のPCR遺伝子プライマーにおいて設計されたNdeIおよびBamHIのエンドヌクレアーゼ制限部位を使用してpET−3aプラスミド(Novagen)にクローニングした。得られたプラスミドは、誘導可能なT7プロモーターの制御下における完全なGAG3遺伝子と、細菌リボソーム結合部位(Shine−Dalgarno配列)とを含有した。大腸菌のBL21(DE3)pLysS株(Novagen)をこのプラスミドにより形質転換した。T7RNAポリメラーゼの発現を、宿主によりコードされるイソプロピル−1−チオ−β−D−ガラクトピラノシドを0.4mMの濃度で使用して誘導した。30分間隔で、細胞を遠心分離により集め、超音波処理した。図43は、クーマシー染色された超音波処理物のSDS−PAGEゲルであり、Gag3pの発現を示している。
【0142】
<実施例5>
サンプリングおよび配列決定を伴う2工程の繰り返し分解によるTy3IN遺伝子
実施例5では、サンプリングおよび配列決定を伴う2工程の繰り返し分解によるTy3IN遺伝子の合成が例示される。Ty3IN遺伝子は1640bpの長さであり、図44に例示される(配列番号504)。
【0143】
Ty3IN遺伝子を、重複部伸長による再組立てのために10個の中間フラグメントに分割した。リーダー、10個の中間フラグメント、およびトレーラーについての重複部マップが図45A〜図45Lに示される:リーダー(図45A、配列番号505)、フラグメント0(196bp、図45B、配列番号506〜配列番号513)、フラグメント1(224bp、図45C、配列番号514〜配列番号521)、フラグメント2(224bp、図45D、配列番号522〜配列番号529)、フラグメント3(223bp、図45E、配列番号530〜配列番号537)、フラグメント4(227bp、図45F、配列番号538〜配列番号545)、フラグメント5(223bp、図45G、配列番号546〜配列番号553)、フラグメント6(224bp、図45H、配列番号554〜配列番号561)、フラグメント7(172bp、図45I、配列番号562〜配列番号567)、フラグメント8(175bp、図45J、配列番号568〜配列番号573)、フラグメント9(174bp、図45K、配列番号574〜配列番号580)、およびトレーラー(図45L、配列番号581)。中間フラグメントのそれぞれを、図46A〜図46Lに例示される直接的な自己集合による再組立てのために50ntのオリゴヌクレオチドに分割した。配列番号582は遺伝子リーダーに対応し(図46A)、配列番号583〜配列番号590はSeg−0−0〜Seg−0−7に対応し(図46B)、配列番号591〜配列番号598はSeg−1−0〜Seg−1−7に対応し(図46C)、配列番号599〜配列番号606はSeg−2−0〜Seg−2−7に対応し(図46D)、配列番号607〜配列番号614はSeg−3−0〜Seg−3−7に対応し(図46E)、配列番号615〜配列番号622はSeg−4−0〜Seg−4−7に対応し(図46F)、配列番号623〜配列番号630はSeg−5−0〜Seg−5−7に対応し(図46G)、配列番号631〜配列番号638はSeg−6−0〜Seg−6−7に対応し(図46H)、配列番号639〜配列番号644はSeg−7−0〜Seg−7−5に対応し(図46I)、配列番号645〜配列番号650はSeg−8−0〜Seg−8−5に対応し(図46J)、配列番号651〜配列番号657はSeg−9−0〜Seg−9−6に対応し(図46K)、配列番号658は鎖9トレーラーに対応し(図46K)、配列番号659は遺伝子トレーラーに対応する(図46L)。
【0144】
これら10個の中間フラグメントを、実施例4に記載されるように、オリゴヌクレオチドから別々に組立て、クローニングし、配列決定した。図47は、10個の中間フラグメントの反応の生成物を示すアガロースゲルである。10個の中間フラグメントを、実施例4に記載されるような重複部伸長を使用してTy3IN遺伝子に再組立てした。生成物のアガロースゲルが図48に示される。レーン1は合成Ty3IN遺伝子であり、レーン2はDNAサイズマーカーである。合成TY3IN遺伝子を、実施例4に記載されるように、クローニングし、発現させた。クーマシー染色されたTY3INタンパク質のSDS−PAGEゲルが図49に示される。レーン1は分子量マーカーを含有し、レーン2は非誘導細胞の抽出物であり、レーン3は誘導細胞の抽出物である。
【0145】
本明細書中に例示および記載される実施形態は、特定の好ましい実施形態の例として提供される。様々な変化および改変が、本開示から逸脱することなく、当業者によって、本明細書中に示された実施形態に対して行うことができる。
【図面の簡単な説明】
【0146】
【図1】図1Aは、大きいDNA断片が5つの中サイズ断片に分割される、重複部伸長によってDNA配列を合成するための開示された方法の実施形態を例示する。図1Bは、中サイズのDNA断片が12個の短いセグメントに分割される、重複部伸長によってDNA配列を合成するための実施形態を例示する。
【図2】全長のDNA配列が連結によって作製される直接的に自己集合したDNA構築物を使用する実施形態を例示する。
【図3】合成遺伝子またはDNA断片を合成するための開示された方法の実施形態を例示する。
【図4A−4B】図4A〜図4Bは、20nt〜250ntの長さを有する全長オリゴヌクレオチドの収率を、99.5%および99%のカップリング効率についてそれぞれ例示する。
【図4C】図4Cは、20nt〜250ntの長さを有する全長オリゴヌクレオチドの収率を、98%のカップリング効率についてそれぞれ例示する。
【図5】図5Aは、中間フラグメントからの遺伝子の分割および再組立てを含む実施形態を概略的に例示する。図5Bは、リーダー配列およびトレーラー配列を含むオリゴヌクレオチドへの中間フラグメントの1つの分割および再組立てを含む実施形態を概略的に例示する。図5Cは、中間フラグメントからのポリペプチドの発現において使用されたリーダーの実施形態を概略的に例示する。図5Dは、中間フラグメントからのポリペプチドの発現において使用されたトレーラーの実施形態を概略的に例示する。
【図6】実施例1における大腸菌スレオニンデアミナーゼについての最初のコドン割り当てに対する融解温度の分布を例示する。(実線)小さいセグメントの重複部の間での正しい一致。(一点短鎖線)長い鎖の重複部の間での正しい一致。(破線)小さいセグメントの間での正しくない一致。(点線)長い鎖の間での正しくない一致。
【図7】実施例1における大腸菌スレオニンデアミナーゼについての最終的なコドン割り当ての後における融解温度の分布を例示する。
【図8】実施例1における大腸菌スレオニンデアミナーゼについての最終的なコドン割り当てである。タンパク質における各アミノ酸に割り当てられたコドンが「Xn」として示される。この場合、「X」は一文字のアミノコードであり、「n」はコドンインデックスである。
【図9】大腸菌に対するアミノ酸コードおよびコドンインデックスを表す記号表である。
【図10】大腸菌ゲノムにおけるコドン使用に対する実施例1由来の合成された大腸菌スレオニンデアミナーゼ配列についてのコドン使用を例示する。各コドンが点として示され、この場合、x座標が大腸菌における1,000あたりのその使用であり、y座標がスレオニンデアミナーゼにおける1,000あたりのその使用である。(x、実線)天然のスレオニンデアミナーゼにおける使用。(o、一点短鎖線)合成遺伝子における使用。
【図11A−11C】図11A〜図11Cは、実施例1の合成されたDNAセグメントの重複部マップを提供する。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が角括弧([ ])によって示される。長い鎖の間での重複部が大括弧({ })によって示される。
【図11D−11E】図11D〜図11Eは、実施例1の合成されたDNAセグメントの重複部マップを提供する。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が角括弧([ ])によって示される。長い鎖の間での重複部が大括弧({ })によって示される。
【図12A】図12Aは、実施例1由来の合成されたオリゴヌクレオチドセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図12B】図12Bは、実施例1由来の合成されたオリゴヌクレオチドセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図12C】図12Cは、実施例1由来の合成されたオリゴヌクレオチドセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図12D】図12Dは、実施例1由来の合成されたオリゴヌクレオチドセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図12E】図12Eは、実施例1由来の合成されたオリゴヌクレオチドセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図13】実施例1における重複部伸長反応の第1回目の生成物のゲルである。
【図14】実施例1におけるPCR反応の生成物のゲルである。
【図15】実施例1における2回目の重複部伸長反応の生成物のゲルである。
【図16】実施例2における痘瘡DNAポリメラーゼ−1についての最初のコドン割り当てに対する融解温度の分布を例示する。(実線)小さいセグメントの重複部の間での正しい一致。(一点短鎖線)長い鎖の重複部の間での正しい一致。(破線)小さいセグメントの間での正しくない一致。(点線)長い鎖の間での正しくない一致。
【図17】実施例2における痘瘡DNAポリメラーゼ−1についての最終的なコドン割り当ての後における融解温度の分布を例示する。
【図18】実施例2における痘瘡DNAポリメラーゼ−1についての最終的なコドン割り当てである。タンパク質における各アミノ酸に割り当てられたコドンが「Xn」として示される。この場合、「X」は一文字のアミノコードであり、「n」はコドンインデックスである。
【図19】大腸菌ゲノムにおけるコドン使用に対する実施例2由来の合成された痘瘡DNAポリメラーゼ−1配列についてのコドン使用を例示する。各コドンが点として示され、この場合、x座標が大腸菌における1,000あたりのその使用であり、y座標がスレオニンデアミナーゼにおける1,000あたりのその使用である。(x、実線)天然のスレオニンデアミナーゼにおける使用。(o、破線)合成遺伝子における使用。
【図20】実施例2における痘瘡DNAポリメラーゼ−2についての最初のコドン割り当てに対する融解温度の分布を例示する。(実線)小さいセグメントの重複部の間での正しい一致。(一点短鎖線)長い鎖の重複部の間での正しい一致。(破線)小さいセグメントの間での正しくない一致。(点線)長い鎖の間での正しくない一致。
【図21】実施例2における痘瘡DNAポリメラーゼ−2についての最終的なコドン割り当ての後における融解温度の分布を例示する。
【図22】実施例2における痘瘡DNAポリメラーゼ−2についての最終的なコドン割り当てである。タンパク質における各アミノ酸に割り当てられたコドンが「Xn」として示される。この場合、「X」は一文字のアミノコードであり、「n」はコドンインデックスである。
【図23】大腸菌ゲノムにおけるコドン使用に対する実施例2由来の合成された痘瘡DNAポリメラーゼ−2配列についてのコドン使用を例示する。各コドンが点として示され、この場合、x座標が大腸菌における1,000あたりのその使用であり、y座標がスレオニンデアミナーゼにおける1,000あたりのその使用である。(x、実線)天然のスレオニンデアミナーゼにおける使用。(o、破線)合成遺伝子における使用。
【図24A−24D】図24A〜図24Dは、DNAポリメラーゼのリーダー(図24A)およびトレーラー(図24G)を含む、実施例2の痘瘡ポリメラーゼ−1についての合成されたDNAセグメントに対する重複部マップである。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が角括弧([ ])によって示される。
【図24E−24G】図24E〜図24Gは、DNAポリメラーゼのリーダー(図24A)およびトレーラー(図24G)を含む、実施例2の痘瘡ポリメラーゼ−1についての合成されたDNAセグメントに対する重複部マップである。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が角括弧([ ])によって示される。
【図25A−25D】図25A〜図25Dは、DNAポリメラーゼのリーダー(図25A)およびトレーラー(図25G)を含む、実施例2の痘瘡ポリメラーゼ−2についての合成されたDNAセグメントに対する重複部マップである。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が角括弧([ ])によって示される。
【図25E−25G】図25E〜図25Gは、DNAポリメラーゼのリーダー(図25A)およびトレーラー(図25G)を含む、実施例2の痘瘡ポリメラーゼ−2についての合成されたDNAセグメントに対する重複部マップである。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が角括弧([ ])によって示される。
【図26A】図26Aは、実施例2由来の痘瘡ポリメラーゼ−1に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図26B】図26Bは、実施例2由来の痘瘡ポリメラーゼ−1に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図26C】図26Cは、実施例2由来の痘瘡ポリメラーゼ−1に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図26D】図26Dは、実施例2由来の痘瘡ポリメラーゼ−1に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図26E】図26Eは、実施例2由来の痘瘡ポリメラーゼ−1に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図27A】図27Aは、実施例2由来の痘瘡ポリメラーゼ−2に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図27B】図27Bは、実施例2由来の痘瘡ポリメラーゼ−2に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図27C】図27Cは、実施例2由来の痘瘡ポリメラーゼ−2に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図27D】図27Dは、実施例2由来の痘瘡ポリメラーゼ−2に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図27E】図27Eは、実施例2由来の痘瘡ポリメラーゼ−2に対する合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図28】実施例2由来の痘瘡DNAポリメラーゼ−1を構成するフラグメント0〜フラグメント4のゲルである。
【図29】実施例2由来の痘瘡DNAポリメラーゼ−2を構成するフラグメント5〜フラグメント9のゲルである。
【図30】実施例2由来の痘瘡DNAポリメラーゼの部分Iおよび部分IIのゲルである。
【図31】実施例2由来の痘瘡DNAポリメラーゼの部分Iおよび部分IIの連結生成物のゲルである。
【図32】実施例3における大腸菌スレオニンデアミナーゼについての最初のコドン割り当てに対する融解温度の分布を例示する。(実線)小さいセグメントの重複部の間での正しい一致。(破線)小さいセグメントの間での正しくない一致。
【図33】実施例3における大腸菌スレオニンデアミナーゼについての最終的なコドン割り当ての後における融解温度の分布を例示する。
【図34】実施例3における大腸菌スレオニンデアミナーゼについての最終的なコドン割り当てである。タンパク質における各アミノ酸に割り当てられたコドンが「Xn」として示される。この場合、「X」は一文字のアミノコードであり、「n」はコドンインデックスである。
【図35】大腸菌ゲノムにおけるコドン使用に対する実施例3由来の合成された大腸菌スレオニンデアミナーゼ配列についてのコドン使用を例示する。各コドンが点として示され、この場合、x座標が大腸菌における1,000あたりのその使用法であり、y座標がスレオニンデアミナーゼにおける1,000あたりのその使用である。(x、実線)天然のスレオニンデアミナーゼにおける使用。(o、破線)合成遺伝子における使用。
【図36】実施例3の合成されたDNAセグメントに対する重複部マップを提供する。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。
【図37A】図37Aは、リーダープライマー(図37A)およびトレーラープライマー(図37F)を含む、実施例3由来の合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図37B】図37Bは、リーダープライマー(図37A)およびトレーラープライマー(図37F)を含む、実施例3由来の合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図37C】図37Cは、リーダープライマー(図37A)およびトレーラープライマー(図37F)を含む、実施例3由来の合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図37D】図37Dは、リーダープライマー(図37A)およびトレーラープライマー(図37F)を含む、実施例3由来の合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図37E】図37Eは、リーダープライマー(図37A)およびトレーラープライマー(図37F)を含む、実施例3由来の合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図37F】図37Fは、リーダープライマー(図37A)およびトレーラープライマー(図37F)を含む、実施例3由来の合成されたセグメントを例示し、この場合、フォワード鎖およびリバース鎖の相補部が示される。各列は、直接合成された一本鎖DNAの短いセグメントに対応する。短いセグメントの間での重複部が下線および数字によって示される。フォワード鎖セグメントにおけるそれぞれの下線領域は、同じ数字を有する下線領域のリバース鎖相補部であり、また、その逆である。リバース鎖の相補部領域の数字にはプライム記号が付される。
【図38】実施例3における直接的な自己集合および連結によって合成された4つの中サイズ断片のゲルである。
【図39】実施例3における4つの中サイズ断片の連結によって合成されたスレオニンデアミナーゼ遺伝子のゲルである。
【図40A−40B】図40A〜図40Bは、実施例4で合成されたTy3GAG3のORFに対する遺伝子リーダー、3つの中間セグメントおよび遺伝子トレーラーの配列を例示する。
【図40C】図40Cは、実施例4で合成されたTy3GAG3のORFに対する遺伝子リーダー、3つの中間セグメントおよび遺伝子トレーラーの配列を例示する。
【図40D−40E】図40D〜図40Eは、実施例4で合成されたTy3GAG3のORFに対する遺伝子リーダー、3つの中間セグメントおよび遺伝子トレーラーの配列を例示する。
【図41】実施例4で合成されたTy3GAG3の3つの中間セグメントのアガロースゲルである。
【図42】実施例4で合成されたTy3GAG3のアガロースゲルである。
【図43】実施例4で作製されたTy3Gag3pポリタンパク質のSDS−PAGEゲルである。
【図44】実施例5で合成されたTy3IN遺伝子の配列を例示する。
【図45A−45E】図45A〜図45Eは、実施例5で合成されたTy3IN遺伝子のリーダー、10個の中間フラグメントおよびトレーラーに対する重複部マップを提供する。
【図45F−45J】図45F〜図45Jは、実施例5で合成されたTy3IN遺伝子のリーダー、10個の中間フラグメントおよびトレーラーに対する重複部マップを提供する。
【図45K−45L】図45K〜図45Lは、実施例5で合成されたTy3IN遺伝子のリーダー、10個の中間フラグメントおよびトレーラーに対する重複部マップを提供する。
【図46A−46B】図46A〜図46Bは、実施例5で合成されたTy3IN遺伝子に対する中間フラグメントの合成において使用された50ntのオリゴヌクレオチドを例示する。
【図46C−46D】図46C〜図46Dは、実施例5で合成されたTy3IN遺伝子に対する中間フラグメントの合成において使用された50ntのオリゴヌクレオチドを例示する。
【図46E−46F】図46E〜図46Fは、実施例5で合成されたTy3IN遺伝子に対する中間フラグメントの合成において使用された50ntのオリゴヌクレオチドを例示する。
【図46G−46H】図46G〜図46Hは、実施例5で合成されたTy3IN遺伝子に対する中間フラグメントの合成において使用された50ntのオリゴヌクレオチドを例示する。
【図46I−46J】図46I〜図46Jは、実施例5で合成されたTy3IN遺伝子に対する中間フラグメントの合成において使用された50ntのオリゴヌクレオチドを例示する。
【図46K−46L】図46K〜図46Lは、実施例5で合成されたTy3IN遺伝子に対する中間フラグメントの合成において使用された50ntのオリゴヌクレオチドを例示する。
【図47】実施例5で合成されたTy3IN遺伝子の10個の中間フラグメントのアガロースゲルである。
【図48】実施例5で合成されたTY3IN遺伝子のアガロースゲルである。
【図49】実施例5で合成されたTY3INタンパク質のSDS−PAGEゲルである。
【図1A】

【図1B】


【特許請求の範囲】
【請求項1】
(i)DNA配列を、隣接する断片が重複する領域を含む、小さいDNA断片に繰り返し分割すること;
(ii)正しいハイブリダイゼーションを強くし、かつ、正しくないハイブリダイゼーションを妨害するために、それぞれの繰り返し分割から生じるDNA断片の配列を最適化すること;
(iii)一本鎖DNAの任意の前記隣接する断片の重複する領域が相補的である、最適化された小さいDNA断片を得ること;
(iv)次に大きいDNA断片の分割に由来するDNA断片を組み合わせること;
(v)DNA断片を自己集合させて、二本鎖の重複部領域によってつながれた一本鎖DNAセグメントを含むDNA構築物を形成させること;
(vi)次に大きいDNA断片を前記DNA構築物から作製すること;および
(vii)工程(iv)、工程(v)および(vi)を工程(i)における繰り返し分割の逆の順序で繰り返して、DNA配列を作製すること
を含む、DNA配列を合成する方法。
【請求項2】
次に大きいDNA断片がDNA分子の混合物を含み、かつ、前記方法がさらに、
正しいDNA配列を有することが考えられるDNA分子を前記混合物から選択すること、および
選択されたDNA分子をDNA配列の合成において使用すること
を含む、請求項1に記載の方法。
【請求項3】
DNA分子がクローニングによって前記混合物から分離される、請求項2に記載の方法。
【請求項4】
前記選択が、前記混合物に由来するDNA分子のサンプルを配列決定すること、および、所望するDNA配列を有するDNA分子を選択することを含む、請求項2に記載の方法。
【請求項5】
前記選択が、前記混合物に由来するDNA分子のサンプルの各メンバーからポリペプチドを発現させること、前記ポリペプチドの分子量を決定すること、および、所定の分子量を有するポリペプチドを発現させるDNA分子を選択することを含む、請求項2に記載の方法。
【請求項6】
開始コドンおよび/または停止コドンが、ポリペプチドを発現させるDNA分子に組み込まれている、請求項5に記載の方法。
【請求項7】
前記DNA分子の読み枠が開始コドンおよび/または停止コドンに関して調節されている、請求項6に記載の方法。
【請求項8】
前記DNA分子のサンプルの各メンバーが発現ベクターに挿入され、かつ、前記発現ベクターは停止コドンを挿入されたDNA分子の下流側に含む、請求項5に記載の方法。
【請求項9】
前記ポリペプチドの分子量が電気泳動によって決定される、請求項5に記載の方法。
【請求項10】
前記DNA配列が調節配列を含む、請求項1に記載の方法。
【請求項11】
前記DNA配列が遺伝子間配列を含む、請求項1に記載の方法。
【請求項12】
前記DNA配列がポリペプチドをコードする、請求項1に記載の方法。
【請求項13】
前記ポリペプチドが全長のタンパク質である、請求項12に記載の方法。
【請求項14】
DNA配列を小さいDNA断片に分割することが1回の分割で行われる、請求項1に記載の方法。
【請求項15】
DNA配列を小さいDNA断片に分割することが複数回の分割で行われる、請求項1に記載の方法。
【請求項16】
前記DNA配列が約1,500塩基以下の長さのDNA断片に分割される、請求項15に記載の方法。
【請求項17】
前記小さいDNA断片が約60塩基以下の長さである、請求項1に記載の方法。
【請求項18】
前記小さいDNA断片が約50塩基以下の長さである、請求項17に記載の方法。
【請求項19】
前記重複する領域が約6塩基対〜約60塩基対を含む、請求項1に記載の方法。
【請求項20】
最適化することが、DNA断片について融解温度を計算することを含む、請求項1に記載の方法。
【請求項21】
最適化することが、DNA断片についてハイブリダイゼーション性向に関係づけられるパラメーターを計算することを含む、請求項1に記載の方法。
【請求項22】
前記パラメーターが、自由エネルギー、エンタルピー、エントロピー、およびそれらの算術的または代数的な組合せからなる群から選択される、請求項21に記載の方法。
【請求項23】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも1℃高い、請求項20に記載の方法。
【請求項24】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも4℃高い、請求項20に記載の方法。
【請求項25】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも8℃高い、請求項20に記載の方法。
【請求項26】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも16℃高い、請求項20に記載の方法。
【請求項27】
最適化することが、調節領域コンセンサス配列における縮重性を利用することを含む、請求項1に記載の方法。
【請求項28】
最適化することが直接的な塩基割り当てを含む、請求項1に記載の方法。
【請求項29】
最適化することが、隣接するDNA断片との間での境界点を調節することを含む、請求項1に記載の方法。
【請求項30】
最適化することが、サイレントなコドン置換を変更することを含む、請求項1に記載の方法。
【請求項31】
前記最適化された小さいDNA断片の少なくとも1つが合成である、請求項1に記載の方法。
【請求項32】
前記最適化された小さいDNA断片の少なくとも1つが一本鎖である、請求項1に記載の方法。
【請求項33】
一本鎖DNAセグメントが約0塩基〜約20塩基の長さを有する、請求項1に記載の方法。
【請求項34】
次に大きいDNA断片が、前記DNA構築物をクローニングすることによって作製される、請求項1に記載の方法。
【請求項35】
前記クローニングが、エキソヌクレアーゼIIIクローニング、トポイソメラーゼクローニング、制限酵素クローニングおよび相同組換えクローニングからなる群から選択される、請求項34に記載の方法。
【請求項36】
次に大きいDNA断片が、前記DNA構築物を連結することによって作製される、請求項1に記載の方法。
【請求項37】
次に大きいDNA断片が、DNAポリメラーゼを使用する反応によって前記DNA構築物を伸長することによって作製される、請求項1に記載の方法。
【請求項38】
前記DNAポリメラーゼがプルーフリーディングDNAポリメラーゼである、請求項37に記載の方法。
【請求項39】
DNAポリメラーゼプライマーを、次に大きいDNA断片の分割に由来するDNA断片と混合することをさらに含む、請求項37に記載の方法。
【請求項40】
重複する領域の中に制限部位を設計することをさらに含む、請求項1に記載の方法。
【請求項41】
前記制限部位を部位特異的な制限酵素により消化することをさらに含む、請求項40に記載の方法。
【請求項42】
(i)DNA配列を、隣接する断片が重複する領域を含む、小さいDNA断片に繰り返し分割すること;
(ii)正しいハイブリダイゼーションを強くし、かつ、正しくないハイブリダイゼーションを妨害するために、それぞれの繰り返し分割から生じるDNA断片の配列を最適化すること;
(iii)一本鎖DNAの任意の前記隣接する断片の重複する領域が相補的である、最適化された小さいDNA断片を得ること;
(iv)次に大きいDNA断片の分割に由来するDNA断片を組み合わせること;
(v)DNA断片を自己集合させて、二本鎖の重複部領域によってつながれた一本鎖DNAセグメントを含むDNA構築物を形成させること;
(vi)次に大きいDNA断片を前記DNA構築物から作製すること;および
(vii)工程(iv)、工程(v)および(vi)を工程(i)における繰り返し分割の逆の順序で繰り返して、DNA配列を作製すること
を含む方法に従って合成されるDNA配列。
【請求項43】
次に大きいDNA断片がDNA分子の混合物を含み、かつ、前記方法がさらに、
正しいDNA配列を有することが考えられるDNA分子を前記混合物から選択すること、および
選択されたDNA分子をDNA配列の合成において使用すること
を含む、請求項42に記載のDNA配列。
【請求項44】
DNA分子がクローニングによって前記混合物から分離される、請求項43に記載のDNA配列。
【請求項45】
前記選択が、前記混合物に由来するDNA分子のサンプルを配列決定すること、および、所望するDNA配列を有するDNA分子を選択することを含む、請求項43に記載のDNA配列。
【請求項46】
前記選択が、前記混合物に由来するDNA分子のサンプルの各メンバーからポリペプチドを発現させること、前記ポリペプチドの分子量を決定すること、および、所定の分子量を有するポリペプチドを発現させるDNA分子を選択することを含む、請求項43に記載のDNA配列。
【請求項47】
開始コドンおよび/または停止コドンが、ポリペプチドを発現させる前記DNA分子に組み込まれている、請求項46に記載のDNA配列。
【請求項48】
前記DNA分子の読み枠が開始コドンおよび/または停止コドンに関して調節されている、請求項47に記載のDNA配列。
【請求項49】
前記DNA分子のサンプルの各メンバーが発現ベクターに挿入され、かつ、前記発現ベクターは停止コドンを挿入されたDNA分子の下流側に含む、請求項46に記載のDNA配列。
【請求項50】
前記ポリペプチドの分子量が電気泳動によって決定される、請求項46に記載のDNA配列。
【請求項51】
前記DNA配列が調節配列を含む、請求項42に記載のDNA配列。
【請求項52】
前記DNA配列が遺伝子間配列を含む、請求項42に記載のDNA配列。
【請求項53】
前記DNA配列がポリペプチドをコードする、請求項42に記載のDNA配列。
【請求項54】
前記ポリペプチドが全長のタンパク質である、請求項53に記載のDNA配列。
【請求項55】
前記DNA配列を小さいDNA断片に分割することが1回の分割で行われる、請求項42に記載のDNA配列。
【請求項56】
前記DNA配列を小さいDNA断片に分割することが複数回の分割で行われる、請求項42に記載のDNA配列。
【請求項57】
前記DNA配列が約1,500塩基以下の長さのDNA断片に分割される、請求項56に記載のDNA配列。
【請求項58】
前記小さいDNA断片が約60塩基以下の長さである、請求項42に記載のDNA配列。
【請求項59】
前記小さいDNA断片が約50塩基以下の長さである、請求項58に記載のDNA配列。
【請求項60】
前記重複する領域が約6塩基対〜約60塩基対を含む、請求項42に記載のDNA配列。
【請求項61】
最適化することが、DNA断片について融解温度を計算することを含む、請求項42に記載のDNA配列。
【請求項62】
最適化することが、DNA断片についてハイブリダイゼーション性向に関係づけられるパラメーターを計算することを含む、請求項42に記載のDNA配列。
【請求項63】
前記パラメーターが、自由エネルギー、エンタルピー、エントロピー、およびそれらの算術的または代数的な組合せからなる群から選択される、請求項42に記載のDNA配列。
【請求項64】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも1℃高い、請求項61に記載のDNA配列。
【請求項65】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも4℃高い、請求項61に記載のDNA配列。
【請求項66】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも8℃高い、請求項61に記載のDNA配列。
【請求項67】
最も低く融解する正しいハイブリダイゼーションの融解温度が、最も高く融解する正しくないハイブリダイゼーションの融解温度よりも少なくとも16℃高い、請求項61に記載のDNA配列。
【請求項68】
最適化することが、調節領域コンセンサス配列における縮重性を利用することを含む、請求項51に記載のDNA配列。
【請求項69】
最適化することが直接的な塩基割り当てを含む、請求項52に記載のDNA配列。
【請求項70】
最適化することが、隣接するDNA断片との間での境界点を調節することを含む、請求項52に記載のDNA配列。
【請求項71】
最適化することが、サイレントなコドン置換を変更することを含む、請求項53に記載のDNA配列。
【請求項72】
前記最適化された小さいDNA断片の少なくとも1つが合成である、請求項42に記載のDNA配列。
【請求項73】
前記最適化された小さいDNA断片の少なくとも1つが一本鎖である、請求項42に記載のDNA配列。
【請求項74】
一本鎖DNAセグメントが約0塩基〜約20塩基の長さを有する、請求項42に記載のDNA配列。
【請求項75】
次に大きいDNA断片が、前記DNA構築物をクローニングすることによって作製される、請求項42に記載のDNA配列。
【請求項76】
前記クローニングが、エキソヌクレアーゼIIIクローニング、トポイソメラーゼクローニング、制限酵素クローニングおよび相同組換えクローニングからなる群から選択される、請求項75に記載のDNA配列。
【請求項77】
次に大きいDNA断片が、前記DNA構築物を連結することによって作製される、請求項42に記載のDNA配列。
【請求項78】
次に大きいDNA断片が、DNAポリメラーゼを使用する反応によって前記DNA構築物を伸長することによって作製される、請求項42に記載のDNA配列。
【請求項79】
前記DNAポリメラーゼがプルーフリーディングDNAポリメラーゼである、請求項78に記載のDNA配列。
【請求項80】
DNAポリメラーゼプライマーを、次に大きいDNA断片の分割に由来するDNA断片と混合することをさらに含む、請求項78に記載のDNA配列。
【請求項81】
重複する領域の中に制限部位を設計することをさらに含む、請求項42に記載のDNA配列。
【請求項82】
前記制限部位を部位特異的な制限酵素により消化することをさらに含む、請求項81に記載のDNA配列。

【図2】
image rotate

【図3】
image rotate

【図4A−4B】
image rotate

【図4C】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11A−11C】
image rotate

【図11D−11E】
image rotate

【図12A】
image rotate

【図12B】
image rotate

【図12C】
image rotate

【図12D】
image rotate

【図12E】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24A−24D】
image rotate

【図24E−24G】
image rotate

【図25A−25D】
image rotate

【図25E−25G】
image rotate

【図26A】
image rotate

【図26B】
image rotate

【図26C】
image rotate

【図26D】
image rotate

【図26E】
image rotate

【図27A】
image rotate

【図27B】
image rotate

【図27C】
image rotate

【図27D】
image rotate

【図27E】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37A】
image rotate

【図37B】
image rotate

【図37C】
image rotate

【図37D】
image rotate

【図37E】
image rotate

【図37F】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40A−40B】
image rotate

【図40C】
image rotate

【図40D−40E】
image rotate

【図41】
image rotate

【図42】
image rotate

【図43】
image rotate

【図44】
image rotate

【図45A−45E】
image rotate

【図45F−45J】
image rotate

【図45K−45L】
image rotate

【図46A−46B】
image rotate

【図46C−46D】
image rotate

【図46E−46F】
image rotate

【図46G−46H】
image rotate

【図46I−46J】
image rotate

【図46K−46L】
image rotate

【図47】
image rotate

【図48】
image rotate

【図49】
image rotate


【公表番号】特表2007−534303(P2007−534303A)
【公表日】平成19年11月29日(2007.11.29)
【国際特許分類】
【出願番号】特願2006−533318(P2006−533318)
【出願日】平成16年5月21日(2004.5.21)
【国際出願番号】PCT/US2004/016120
【国際公開番号】WO2004/113534
【国際公開日】平成16年12月29日(2004.12.29)
【出願人】(505434227)ユニバーシティー オブ カリフォルニア (1)
【Fターム(参考)】