説明

デハロゲナーゼ活性を有する酵素およびその利用方法

【課題】高いpHおよび温度で高い活性および安定性を有するデハロゲナーゼの提供。
【解決手段】特定の配列から成る群から選択された、デハロゲナーゼ活性があるポリペプチドを符号化する配列。配列比較アルゴリズムあるいは目視検査による分析で決定されるように、少なくとも約100残留物の範囲に、特定の配列の少なくとも1つに対して少なくとも約50%の相同性のある変異体。特定の配列に対して相補的な配列、及び配列比較アルゴリズムあるいは目視検査による分析で決定されるように、少なくとも約100残留物の範囲に、特定の配列に対して少なくとも約50%の相同性のある変異体に対して相補的な配列。耐熱性を高めた配列。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願)
本発明出願は、2000 年 12 月 1 日付特許出願中の米国第 60/250,897 号を主張するもので、その内容全体を参照し本書に組込む。
(発明の利用範囲)
本発明は、一般に、酵素、酵素を符号化するポリヌクレオチド、そうしたポリヌクレオチドおよびポリペプチドの用途、さらに特定すればハロアルカンデハロゲナーゼ活性を有する酵素に関連する。
【背景技術】
【0002】
(背景)
環境汚染物質は、非常に多数および多様な化学薬品から構成され、これらの多くは、1979 年に米国環境保護庁により優先汚染物質に指定された有毒な環境危険要因である。微生物および酵素による生分解は、これらの汚染物質を除去する 1 つの方法である。従って、微生物および関連する酵素性のプロセスにより、商業廃棄物の処理、汚染環境のバイオレメディエーションの方法が設計された。
残念ながら、多くの化学汚染物質は、高い濃度および一定の組み合わせで存在するとき、微生物分解に対して耐性があるか、潜在的な微生物分解菌に対して有毒であるかのいずれかである。
ハロアルカンデハロゲナーゼは、α/βハイドロラーゼフォールドファミリーに属するもので、このファミリーは全ての酵素は類似したトポロジー、反応機構、および触媒三連構造残基を有している (Krooshof 等、Biochemistry 36(31):9571-9580, 1997)。酵素により、ハロアルカンおよびハロカルボキシル酸にある炭素‐ハロゲン結合が、加水分解により切断され、それらは対応するアルコール類に変換される。この反応は、環境保護庁により優先汚染物質とみなされている塩化エチル、塩化メチル、および 1,2-ジクロロエタンなどのハロアルカンの関連する解毒にとって重要である (Rozeboom, H., Kingma, J., Janssen, D., Dijkstra, B. Crystallization of Haloalkane Dehalogenase from Xanthobacter autotrophicus GJ10 J Mol Biol 200 (3), 611-612 (1988))。
ハロアルカンデハロゲナーゼは、全く塩素化脂肪族化合物上で成長する微生物により生成される。活動には、金属や酸素は必要なく、水が唯一の基質である。
Xanthobacter autotrophicus GJ10 は、成長に 1,2-ジクロロエタンおよびその他少数のハロアルカンおよびハロカルボキシル酸を利用する窒素固定バクテリアである (Rozeboom 等、J Mol Biol 200 3:611-612, 1988; Keuning 等、J Bacteriol 163(2):635-639, 1985)。これは、触媒反応メカニズム、活性メカニズム、結晶構造が分かっているため、最もよく研究されたデハロゲナーゼである (Schanstra 等、J Biol Chem 271(25):14747-14753, 1996)。
この生物体は、2 つの異なるデハロゲナーゼを生成する。1 つのデハロゲナーゼは、ハロゲン化アルカン用で、もう 1 つは、ハロゲン化カルボキシル酸用である。ほとんどの有害なハロゲン化合物は、洗浄剤、殺虫剤、および溶剤として使用するために工業的に生成される。Xanthobacter autotrophicus の天然の基質は、1,2-ジクロロエタンである。このハロアルカンは、ビニール生成に使用されることがよくある。
【0003】
酵素は、選択性の高い触媒である。これらの特徴は、従来の合成化学とは比較にならない精巧な立体選択性、位置選択性、および化学選択性により、反応の触媒作用をする能力である。その上、酵素は、著しく多用途である。有機溶剤中で機能したり、極端な pH や温度で作用したり、その天然の生理学的な基質とは構造的に関連のない化合物との反応の触媒作用をするように、調節ができる。
酵素は、広範囲の天然および非天然の基質に対して反応性があるため、実質上、あらゆる有機鉛化合物の修飾が可能である。その上、従来的な化学的触媒とは異なり、酵素は、エナンチオ選択性および位置選択性が非常に高い。酵素の示す高い度合いの官能基特異性によって、新しい活性化合物につながる合成配列におけるそれぞれの反応を把握することができる。また、酵素には、その生理的機能とは全く関連のない数多くの多様な反応の触媒の役目をする能力がある。例えば、ペルオキシダーゼは、過酸化水素によるフェノール類酸化の触媒の役目をする。また、ペルオキシダーゼは、酵素にある本来の機能とは関連のないヒドロキシル化反応の触媒の役目をする。その他の例には、ポリペプチドの分解において触媒の役目を果たすプロテアーゼがある。有機溶液中では、一部のプロテアーゼは、糖類をアシル化することもあるが、これは、これらの酵素にある本来の機能とは関連のない機能である。
【0004】
本発明は、酵素の特異な触媒特性を活用するものである。化学的形質変換における、生体触媒 (つまり、精製した酵素または天然酵素、非生体細胞または生体細胞) の使用には、通常、特定の出発化合物と反応する特定の生体触媒の特定が必要となるが、本発明では、数多くの出発化合物に存在する官能基について特異的な、選択された生体触媒および反応条件を使用している。
各生体触媒は、1 つの官能基あるいはいくつかの関連する官能基に特異的であり、その官能基を含む多くの出発化合物と反応しうる。
生体触媒反応によって、単一の出発化合物から誘導体の集合が生成される。これらの誘導体は、第 2 の誘導体の集合を生成するために 2 回目の触媒反応を前提とすることもできる。生体触媒の誘導体化を反復するたびに、元の化合物から何千もの変形物が生成される。
酵素は、分子の残りの部分に影響することなく出発化合物の特定部位に反応する。このプロセスを、従来の化学方法の使用により達成するのは非常に難しい。
このように生体触媒特異が高いことによって、ライブラリ内の単一活性化合物を特定する手段が提供される。ライブラリは、ライブラリの作成に使用される一連の生体触媒反応、いわゆる「生合成履歴」によって特徴づけられる。生物活性についてライブラリをスクリーニングし、生合成履歴を追跡することにより、活性化合物を生み出す特定の反応配列が特定される。反応配列は繰り返され、合成化合物が決定される。他の合成およびスクリーニング方法とは違い、この特定方法では、固定化技術が要らず、化合物は実質的にあらゆる種類のスクリーニングアッセイを使用して溶媒中で自由に合成・テストされうる。官能基における酵素反応の特異性が高いことによって、生体触媒により作成されるライブラリを作り出す特定の酵素反応の「追跡」が可能となる点に留意することは重要である。
【0005】
手順段階の多くは、ロボットによる自動装置を使用して実行されるため、一日に何千回もの生体触媒反応およびスクリーニングアッセイが可能なだけでなく、高い精度と再現性が確保される。その結果、現在の化学的な方法を使用すれば何年もかかると思われる誘導化合物のライブラリがわずか数週間で生成されうる。
(小分子を含めて、分子の修飾に関する詳細な説明については、PCT/US94/09174 を参照するものとし、その全文を参照し本書に組込む。)
本書で取りあげた公開情報は、本出願書の出願日以前に公開されたもののみが提供されている。本書にあるいかなる内容も、本発明が以前の発明による公開を早める資格がないことを承認するものと解釈されることはない。
【発明の開示】
【課題を解決するための手段】
【0006】
(発明の要約)
本発明では、SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45、47 に示した配列を持つ単離された核酸、ならびに変異体 SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45 または 47 に対して少なくとも 50% 配列同一性を持ち、デハロゲナーゼ活性のあるポリペプチドを符号化する上記核酸の変異体が提供される。
本発明の一面は、SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45、47 に示した配列 (これ以降「グループ A 核酸配列」とする) を持つ単離された核酸、それと実質的に同一な配列、およびそれに対して相補的な配列である。
本発明の別の面は、グループ A 核酸配列で示した配列、それと実質的に同一な配列、それに対して相補的な配列の、少なくとも 10 連続塩基のある単離された核酸である。
また別の一面で、本発明では、SEQ ID NO: 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、44、46、48 に示した配列を持つポリペプチドを符号化する単離された核酸、ならびにデハロゲナーゼ活性があり、そのような配列に対して少なくとも 50% 配列同一性のあるポリペプチドを符号化する上記核酸の変異体が提供される。
本発明の別の面は、SEQ ID NO: 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、44、46、48 に示した配列 (これ以降「グループ B アミノ酸配列」とする)、およびそれと実質的に同一な配列を持つポリペプチドまたはその機能的断片を符号化する単離された核酸である。
【0007】
本発明の別の面は、グループ B アミノ酸配列に示した配列、およびそれと実質的に同一な配列の、少なくとも 10 の連続アミノ酸を持つポリペプチドを符号化する単離された核酸である。
また別の一面で、本発明では、グループ B アミノ酸配列に示した配列、およびそれと実質的に同一な配列を持つ精製ポリペプチドが提供される。
本発明の別の面は、グループ B アミノ酸配列に示した配列を持つポリペプチドに特異的に結合された、単離または精製された抗体、およびそれと実質的に同一な配列である。
本発明の別の面は、グループ B アミノ酸配列のポリペプチドのうちどれか一つの少なくとも 10 連続のアミノ酸を持つポリペプチドと特異的に結合する、単離または精製された抗体、もしくはその結合断片、ならびにそれと実質的に同一な配列である。
本発明の別の面は、グループ B アミノ酸配列に示した配列、およびそれと実質的に同一な配列を持つポリペプチドの生成方法である。この方法には、ポリペプチドを宿主細胞内に符号化する核酸の導入 (ここで、核酸は操作が可能なようにプロモーターにリンクされている)、および核酸の発現ができるような条件下での宿主細胞の培養が含まれる。
本発明の別の面は、グループ B アミノ酸配列に示した配列およびそれと実質的に同一な配列の少なくとも 10 のアミノ酸を持つポリペプチドの生成方法である。この方法には、ポリペプチドを宿主細胞内に符号化する核酸の導入 (ここで、核酸は操作が可能なようにプロモーターにリンクされている)、および核酸の発現ができるような条件下での宿主細胞の培養 (これにより、ポリペプチドが生成される) が含まれる。
【0008】
本発明の別の面は、変異体の生成方法で、この方法には、グループ A 核酸配列に示した配列、それと実質的に同一な配列、グループ A 核酸配列の配列を相補する配列、上記の配列の少なくとも 30 連続のヌクレオチドで構成される断片を有する核酸の取得、ならびに、配列内にある 1 つまたは複数のヌクレオチドの異なるヌクレオチドへの交換、配列内にある 1 つまたは複数のヌクレオチドの削除、または配列内への 1 つまたは複数のヌクレオチドの追加が含まれる。
本発明の別の面は、グループ A 核酸配列に示した配列、およびそれと実質的に同一な配列、またはグループ B アミノ酸配列に示したポリペプチド配列、およびそれと実質的に同一な配列を格納するコンピュータ読み取り可能媒体である。
本発明の別の面は、プロセッサおよびデータ記憶装置を含めたコンピュータシステムで、このデータ記憶装置には、グループ A 核酸配列に示した配列、およびそれと実質的に同一な配列、またはグループ B アミノ酸配列に示した配列、およびそれと実質的に同一な配列を持つポリペプチドが格納される。
本発明の別の面は、最初の配列を基準配列と比較する方法で、ここにおいて最初の配列は、グループ A 核酸配列に示した配列、およびそれと実質的に同一な配列を持つ核酸、またはグループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドコードである。この方法には、配列を比較するコンピュータプログラムを使用した最初の配列と基準配列の読み取り、そのコンピュータプログラムによる最初の配列と基準配列の差異の判断が含まれる。
本発明の別の面は、グループ A 核酸配列に示した配列、およびそれと実質的に同一な配列、またはグループ B アミノ酸配列に示した配列、およびそれと実質的に同一な配列のポリペプチドの特徴を特定する方法で、これには配列内の特徴を特定するコンピュータプログラムの使用による配列の読み取り、およびそのコンピュータプログラムによる配列内の特徴の特定が含まれる。
本発明の別の面は、グループ B アミノ酸配列の断片または変異体、およびそれと実質的に同一な配列を特定するための試験法で、この試験法がグループ B アミノ酸配列、およびそれと実質的に同一な配列をポリペプチドの酵素機能を確保する。この試験法には、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド、もしくはポリペプチドの断片または変異体が機能するような条件下でポリペプチド断片または変異体を基質分子と接触させること、ならびにポリペプチドと基質の間の反応によっておこる基質レベルの減少または特定の反応生成物の増加を検出し、それによってその配列の断片または変異体を特定することが含まれる。
【0009】
また別の一面では、本発明により、グリセロールを合成する方法が提供される。この方法には、グリセロールを合成する条件下で、トリクロロプロパンまたはジクロロプロパンを、グループ B アミノ酸配列およびそれと実質的に同一な配列から構成されるグループから選択した配列に対して少なくとも 70% の相同性があり、デハロゲナーゼ活性を有するポリペプチドと接触させる過程が含まれる。
また別の一面では、本発明により、光学活性ハロ乳酸を生成する方法が提供される。この方法には、光学活性ハロ乳酸を生成する条件下で、ジハロプロピオン酸を、グループ B アミノ酸配列およびそれと実質的に同一な配列から構成されるグループから選択した配列に対して少なくとも 70% の相同性があり、デハロゲナーゼ活性を有するポリペプチドと接触させる過程が含まれる。
また別の一面では、本発明により、グループ B アミノ酸配列およびそれと実質的に同一な配列から構成されるグループから選択した配列に対して少なくとも 70% の相同性があり、デハロゲナーゼ活性を有するポリペプチドと環境サンプルを接触させることによる、バイオレメディエーションの方法が提供される。
別の面では、本発明により、ハロゲン化汚染物質またはハロゲン化不純物をサンプルから除去する方法が提供される。この方法には、サンプルを、グループ B アミノ酸配列およびそれと実質的に同一な配列から構成されるグループから選択した配列に対して少なくとも 70% の相同性があり、デハロゲナーゼ活性を有するポリペプチドと接触させる過程が含まれる。
また別の一面では、本発明により、ジオールを合成する条件下で、ジハロプロパンまたはモノハロプロパノールを、グループ B アミノ酸配列およびそれと実質的に同一な配列から構成されるグループから選択した配列に対して少なくとも 70% の相同性があり、デハロゲナーゼ活性を有するポリペプチドと接触させることによる、ジオールの合成方法が提供される。
また別の一面では、本発明により、ハロ置換環式ヒドロカルビルを脱ハロゲンするための方法が提供されている。この方法には、ハロ置換環式ヒドロカルビルを脱ハロゲンする条件下で、ハロ置換環式ヒドロカルビルを、グループ B アミノ酸配列およびそれと実質的に同一な配列から構成されるグループから選択した配列に対して少なくとも 70% の相同性があり、デハロゲナーゼ活性を有するポリペプチドと接触させる方法が含まれる。
【発明を実施するための最良の形態】
【0010】
本明細書の以下の図は、本発明の実施例を図示したものであり、請求項によって網羅した本発明の範囲を限定する意図はない。
(発明の詳細な説明)
本発明は、ハロアルカンデハロゲナーゼポリペプチドおよびそれらを符号化するポリヌクレオチド、ならびにポリヌクレオチドおよびポリペプチドの利用法に関するものである。本書で使用するとき、「ハロアルカンデハロゲナーゼ」という用語には、加水分解酵素活性のある酵素、例えば、アルキル酵素中間体を介してハロアルカンの加水分解の触媒作用をする能力のある酵素も含まれる。
本発明のポリヌクレオチドは、デハロゲナーゼ活性を持つ符号化を行うポリペプチドとして、またある特定の実施例ではハロアルカンデハロゲナーゼ活性を持つものと特定された。
デハロゲナーゼおよび本発明のデハロゲナーゼを符号化するポリヌクレオチドは、数多くのプロセス、方法、および組成で有用である。例えば、上述のとおり、デハロゲナーゼは、脂肪族有機塩素で汚染された環境の改善、除草剤ダラポンの分解、ハロゲン化有機酸の分解のほか、土壌・水質の改善、および土壌・水中のハロゲン化有機酸の分解による処理にも使用が可能である。その上、本発明のデハロゲナーゼは、工業プロセスにおける、環境における、および薬物に含まれる不純物の除去に使用することもできる。例えば、デハロゲナーゼは、界面活性剤、カルボキシメチルセルロース、チオグリコール酸塩などの各種のサンプル内のハロアルカン酸不純物の分解に使用することができる。また別の一面で、本発明のデハロゲナーゼは、特定の 1,2-ジオールまたはラセミハロゲノヒドリンの酸化的脱ハロゲンができることで、医薬、農薬、強誘電液体の形成に使用することができる。例えば、デハロゲナーゼは、α,β-ジハロプロピオン酸 (ジクロロプロピオン酸など) をデハロゲナーゼで処理することにより、光学活性なグリシド酸および乳酸 (βハロ乳酸など) の合成に使用できる。本発明のデハロゲナーゼは、1,3-ジハロ-2-プロパノールからの活性な (S)-(+)-3-ハロ-1,2-プロパンジオールまたは (R)-(-)-3 ハロ-1,2 プロパンジオールの生成にも使用できる。
(S)-(+)-3 ハロ-1,2-プロパンジオールは、生理学および医療上の治療や薬物の原料として有用である。
例えば、本発明のデハロゲナーゼは、酸化的脱ハロゲンが形成 (グリセロールなど) されるような条件下およびそれに十分な時間だけ、トリクロロプロパンジオール(TCP) またはジクロロプロパンジオール(DCP) と接触させることができる (DCP または TCP からグリセロールなど) (例えば、図 7 を参照)。本発明の方法および本発明の酵素を使用して、多様なジオール類を生成できる。さらに、本発明の方法および組成は、ハロゲン化芳香族化合物にも適用できる。例えば、本発明の組成は、図 8 に描写したとおり、ハロ置換環式ヒドロカルビルの脱ハロゲンに使用できる。環式ヒドロカルビル化合物の例としては、シクロアルキル、シクロアルケニル、シクロアルカジエニル、シクロアルカトリエニル、シクロアルキニル、シクロアルカジイニル、芳香族化合物、2 つの環がその 2 つの環の唯一の共通構成要素である単一の原子により結合されているスピロ炭水化物 (スピロ[3,4]オクタニル、およびこれに類似するものなど)、2 つの環が結合されかつ少なくとも 2 つの共有された原子のある二環式の炭化水素 (ビシクロ[3.2.1]オクタン、ビシクロ[2.2.1]ヘプト-2-エン、およびこれに類似するものなど)、複数の環式系から成る環の集合 (単環系または縮合環系など) が 1 本または 2 本の結合により相互に直接連結し、かつそのような環の連結部の数が関連する環式系の数よりも 1 つ少ない環集合 (ビフェニリル、ビフェニリレン、ラジカルまたは p-テルフェニル、シクロヘキシルベンジル、およびこれに類似するもの)、多環式化合物、およびこれに類似するものなどがある。
【0011】
ハロアルカンデハロゲナーゼ
全体的構造
Xanthobacter autotrophicus のハロアルカンデハロゲナーゼは、310 のアミノ酸で組成され、分子量 36,000 の単一のポリペプチド鎖で構成されている。単量体酵素は、球状で、2 つの領域から成り立っている。主となる領域は、8 本の鎖から成る混合性のβシート(順序 12435678) があるα/βハイドロラーゼフォールド構造を持ち、鎖 2 は、残りに対して逆平行である。第 2 の領域は、αヘリカルキャップで、主となる領域の上に位置する (Keuning 等、J Bacteriol 163(2):635-639, 1985)。本書にさらに詳細に説明したとおり、突然変異誘発は、例えば、キャップ領域にある特定の残基を突然変異させることにより、酵素の活性が修飾されるようになされている (Krooshof 等、Biochemistry 36(31):9571-9580, 1997)。
Xanthobacter autotrophicus における酵素の活性部位は、3 つの触媒残基 (Asp 124、His 289、および Asp 260) で構成されており、2 つの領域の間の内部疎水性空洞内にある。それぞれβ鎖 5 および 8 に位置する求核性の Asp 124 および一般塩基 His 289 は、α/βハイドロラーゼファミリー内に完全に保存される一方、Asp 260 は保存されない。活性部位には、10 個の疎水性残基 (4 個のフェニルアラニン、2 個のトリプトファン、2 個のロイシン、1 個のバリン、および 1 個のプロリン) が並んでいる (Schanstra 等、J Biol Chem 271(25):14747-14753, 1996)。
【0012】
基質の酵素加水分解中、ハロアルカンデハロゲナーゼにより、His289 により活性化された水分子による加水分解である Asp124 との求核置換により、共有結合性の中間体が形成される (Verschueren 等、Nature 363(6431):693-698, 1993)。デハロゲナーゼ酵素に共通した触媒三連構造の第 3 の構成要素である Asp260 の役割は、部位特異的突然変異誘発により研究されてきた。Asp260 のアスパラギンへの突然変異により、触媒作用的に非活性の D260N 突然変異体が生成されるが、これにより、野生型の酵素におけるデハロゲナーゼ活性に対して、三価の酸 Asp260 が不可欠であることが示される。さらに、D260N 酵素は、発現時の封入体に主に蓄積され、基質も生成物も活性部位の空洞には結合されないため、Asp260 には重要な構造上の役割がある。臭素化された基質の活性は、Asn148 がアスパラギン酸またはグルタミン酸で置換されることで D260N に回復される。
二重突然変異体 D260N+N148D および D260N+N148E の両方で、1,2-ジブロモエタンでは、野生型の酵素に比較して kcat (分子活性) が 10 分の 1 と少なく、Km 値は40 倍高くなっている。D260N+N148E 二重突然変異体の定常状態前の動態解析では、kcat の減少は、主に、炭素−臭素結合切断の割合が 220 分の 1 に減少したことと、アルキル酵素中間体の加水分解の割合が 10 分の 1 に減少したことによるものであることが示された。その一方、ブロミドが、野生型の酵素におけるよりも、12 倍早く、また異なった経路で遊離された。突然変異体の分子モデリングでは、Glu148 によって His289 との相互作用が実際に受け継がれうること、および溶剤との活性部位を連結するトンネル領域での電荷の分布に変化があることが示された (Krooshof 等、Biochemistry 36(31):9571-9580, 1997)。
【0013】
有害なハロゲン化合物分解の最初の手順では、ハロアルカンデハロゲナーゼが利用される。デハロゲナーゼ触媒作用は、エステル中間物の関連する 2 段階のメカニズムとして起こる。加水分解性デハロゲナーゼには、エネルギーは必要なく、よって毒性の原因となっているハロゲンが失われるため、有機物を解毒する簡単な方法の 1 つである。触媒三連構造 (Asp-His-Asp) は、アスパラギン酸カルボン酸塩 (Asp 124) と共に、この反応の焦点である。基質は、活性部位の空洞に結合され、Cl-α複合体は Trp 172 および Trp 175 の側鎖 NH 基と反応する。最初の段階として、基質にあるハロゲンが求核性アスパラギン酸で置換され、中間共有結合エステルが生成される。次に、His 289 が水分子を活性化し、これがエステルを加水分解する。その結果、アルコールおよびハロゲン化物が活性部位から置換される。求核性の Asp 124 およびエステル中間物の水の加水分解が関連する 2 段階のメカニズムは、その他のα/βハイドロラーゼフォールド酵素でも一貫している。
ハロアルカンデハロゲナーゼによって、脂肪族化合物にある炭素 - ハロゲン結合が切断される。結果では、C-Cl 結合での酵素反応は、C-Br 結合などその他の C-ハライド結合での反応よりも遅いことが示されている。離れていく基の能力が、この差異の説明である。1,2-ジクロロエタンおよび 1,2-ジブロモエタンの反応の割合を制限する段階は、炭素 - ハロゲン結合の切断ではなく、むしろ活性部位からのイオンの遊離である。
【0014】
バイオレメディエーション
本発明では、バイオレメディエーションに役立つ、酵素特性が改善された多数のデハロゲナーゼ酵素が提供されている。本発明のポリヌクレオチドおよびポリヌクレオチド生成物は、例えば、本発明のポリヌクレオチドまたはポリペプチドが含まれる形質転換された宿主細胞 (Xanthobacter autotrophicus というバクテリアなど)、およびハロアルカンである 1,2-ジクロルエタンが関連した地下水処理のほか、土壌堆積物からのポリ塩化ビフェニル(PCB) の除去にも役立つ。
本発明のハロアルカンデハロゲナーゼは、炭素 - ハライドの還元作用で役立つ。本発明の酵素によって、ハロアルカンの分解が開始される。別の方法として、本発明のデハロゲナーゼポリヌクレオチドまたはポリペプチドが含まれる宿主細胞は、ハロアルカンを栄養源とすることができ、解毒酵素を生成する。
【0015】
定義
本書で使用するとき、「核酸」または「核酸配列」という用語は、オリゴヌクレオチド、ヌクレオチド、ポリヌクレオチド、またはそれらのいずれかの断片、ゲノムまたは合成による DNA または RNA (一本鎖または二本鎖が考えられ、センス鎖またはアンチセンス鎖を意味し得る)、ペプチド核酸 (PNA)、もしくは何らかの DNA に似たまたは RNA に似た物質 (天然または合成) を意味する。一つの実施例において、本発明の「核酸配列」には、例えば、グループ B アミノ酸配列で示したポリペプチドおよびその変異体を符号化する配列が含まれる。別の実施例において、本発明の「核酸配列」には、例えば、グループ A 核酸配列で示した配列、それに相補的な配列、その配列の断片およびその変異体が含まれる。
特定のポリペプチドまたはタンパク質の「コード配列」、ならびに、それを「符号化するヌクレオチド配列 (そのヌクレオチド配列の符号化)」とは、該当する制御配列の制御下に置かれたときに、そのポリペプチドまたはタンパク質に転写・翻訳される核酸配列である。
「遺伝子」という用語は、ポリペプチド鎖の生成に関連する DNA のセグメントを意味し、これには、コード領域前後の領域 (リーダーおよびトレーラー) が含まれ、また、該当する場合には、個別のコードセグメント(エキソン) 間にある介在配列 (イントロン) も含まれる。
【0016】
本書で使用するとき、「アミノ酸」または「アミノ酸配列」は、オリゴペプチド、ペプチド、ポリペプチドまたはタンパク質配列、あるいはそれらの断片、部分、またはサブユニット、ならびに自然発生的な分子または合成分子を意味する。一つの実施例において、本発明の「アミノ酸配列」または「ポリペプチド配列」には、例えば、グループ B アミノ酸配列に示した配列、その配列の断片およびその変異体が含まれる。別の実施例において、本発明の「アミノ酸配列」には、例えば、グループ B 核酸配列で示した配列を持つポリヌクレオチド、それに相補的な配列、その配列の断片およびその変異体により符号化される配列が含まれる。
本書で使用するとき、「ポリペプチド」という用語は、ペプチド結合または修飾ペプチド結合、つまりペプチドアイソスターによりお互いに結合したアミノ酸を意味し、遺伝子符号化された 20 のアミノ酸以外の修飾アミノ酸が含まれることもある。ポリペプチドは、翻訳後の処理などの自然過程によって、またはこの技術分野でよく知られている化学修飾法のいずれかによって修飾されうる。修飾は、ペプチドバックボーン、アミノ酸側鎖、およびアミノまたはカルボキシル末端などを含めた、ポリペプチドのどの部位でも発生することがある。任意のポリペプチドの複数部位において、同一または異なった程度で、同じ種類の修飾が存在しうることが認識されるであろう。また、任意のポリペプチドには、数多くの種類の修飾がなされうる。修飾には、アセチル化、アシル化、ADP リボシル化、アミド化、フラビンの共有結合、ヘム成分の共有結合、ヌクレオチドまたはヌクレオチド誘導体の共有結合、リピドまたはリピド誘導体の共有結合、ホスファチジルイノシトールの共有結合、交差結合による環化、ジスルフィド結合形成、脱メチル反応、共有交差結合の形成、システインの形成、ピログルタミン酸の形成、ホルミル化、γ-カルボキシル化、グリコシル化、GPI アンカー形成、ヒドロキシル化、ヨウ素化、メチル化、ミリストイル、酸化、ペルギュレーション(pergylation)、タンパク分解処理、リン酸化、プレニル化、ラセミ化、セレノイレーション(selenoylation)、硫酸化、ならびにアルギニル化などの、転移 RNA を媒介としたアミノ酸のタンパク質への添加などがある (Creighton, T. E., Proteins Structure and Molecular Properties 2nd Ed., W. H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed.、Academic Press, New York, pp. 1-12 (1983) を参照)。
【0017】
本書で使用するとき、「単離」という用語は、本来の環境から取り出された (例:自然発生的な場合は自然環境) 物質を意味する。例えば、天然のポリヌクレオチドまたはポリペプチドは、生きた動物内に存在し、単離されていないが、同一のポリヌクレオチドまたはポリペプチドでも、自然系内で共存する一部または全ての物質から隔てられたものは、単離されている。このようなポリヌクレオチドがベクターの一部であること、またはそのようなポリヌクレオチドまたはポリペプチドが組成の一部であること (あるいはその両方) も可能で、その場合でも、そうしたベクターや組成が自然環境の一部ではないという点で単離されているといえる。
本書で使用するとき、「精製」という用語では、完全な純度を要求するものではなく、むしろ、相対的な定義が意図されている。ライブラリから得られた個別の核酸は、電気泳動的に均一となるように、従来の方法で精製されている。これらのクローンから得られた配列は、ライブラリからも、ヒト全 DNA からも、直接的には得られない。本発明の精製核酸は、生物体内のゲノムDNA の残部から、少なくとも 104〜106 倍に精製したものである。ところが、「精製」という用語には、ゲノムDNA の残部から、もしくはライブラリまたはその他の環境内にある他の配列から、少なくとも 1 桁倍、一般的には 2、3 桁倍、さらに一般的には 4、5 桁倍に精製された核酸も含まれる。
本書で使用するとき、「組換え」という用語は、核酸が、その自然環境内においては隣接していない「バックボーン」核酸と隣接するという意味である。さらに、「濃縮」核酸とは、核酸の数の 5% 以上が、核酸バックボーン分子の集団に挿入されることを表す。本発明によるバックボーン分子には、発現ベクターなどの核酸、自己複製核酸、ウィルス、核酸の組込み、ならびに所定の核酸の維持または操作に使用されるその他のベクターまたは核酸が含まれる。一般には、濃縮核酸は、15% 以上の数の核酸が組換え体バックボーン分子の集団に挿入されることを表す。より一般的には、濃縮核酸は、50% 以上の数の核酸が組換え体バックボーン分子の集団に挿入されることを表す。一つの実施例において、濃縮核酸は、90% 以上の数の核酸が組換えバックボーン分子の集団に挿入されることを表す。
【0018】
「組換え」ポリペプチドまたはタンパク質は、組換え DNA セグメント技術により生成、すなわち、希望のポリペプチドまたはタンパク質を符号化する外因的 DNA 構造により形質転換した細胞から生成したポリペプチドまたはタンパク質のことである。「合成」ポリペプチドまたはタンパク質とは、化学合成により準備されたもののことである。また、固体の化学的ペプチド合成方法は、本発明のポリペプチドまたは断片の合成にも使用できる。こうした方法は、1960 年代初期以来、この技術分野で知られており (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963; また、Stewart, J. M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., pp. 11-12 も参照)、最近では、市販の実験用ペプチド設計・合成キット(Cambridge Research Biochemicals) にも採用されている。こうした市販の実験用キットは、H. M. Geysen 等、Proc. Natl. Acad. Sci., USA, 81:3998 (1984) の内容を広く利用したもので、すべて単一のプレートに連結された多数の「ロッド」または「ピン」の先端で、ペプチドの合成が成される。このシステムが利用されるとき、ロッドまたはピンのプレートは裏返しされ、該当するアミノ酸をピンまたはロッドの先端に付着または定着させるための溶液を含んだ対応するウェルまたはリザーバーのある第 2 のプレートに挿入される。こうしたプロセス手順、すなわちロッドやピンの先端を裏返しして該当する溶液に挿入する手順を繰り返すことにより、アミノ酸が希望のペプチドに組み立てられる。さらに、市販されている多数の FMOC ペプチド合成システムが利用できる。例えば、ポリペプチドまたは断片の組立ては、Applied Biosystems, Inc. 製 Model 431A 自動ペプチド合成装置を使用して、頑丈な支えのある上で遂行できる。こうした装置では、直接合成するか、その他の既知技術を使用して結合しうる一連の断片を合成するかのいずれかにより、本発明のペプチドをすぐに利用できる。
プロモーター配列は、プロモーターにおいて転写を開始する RNA ポリメラーゼがコード配列を mRNA に転写する際に、コード配列に「操作が可能なようにリンク」されている。
【0019】
「プラスミド」は、大文字および数字 (あるいはそのいずれか) の前および後 (あるいはそのいずれか) に付ける小文字の「p」で指定される。本書の出発プラスミドは、市販されているか、制限されることなく公に入手できるか、入手可能なプラスミドを元にして公表されている手順に従い生成可能であるかのいずれかである。さらに、本書に記載したものに相当するプラスミドは、この技術分野で知られており、通常の熟練者にとって明白なものである。
DNA の「消化」とは、DNA の特定の配列にのみ作用する制限酵素を用いた DNA の触媒作用による切断を意味する。本書で使用されている各種の制限酵素は市販されているもので、それらの反応条件、補助因子、およびその他の要件は、通常の熟練者が心得ている形で使用されている。分析の目的では、一般に 1 □g のプラスミドまたは DNA 断片と、約 20 □l の緩衝液に入れた約 2 単位の酵素とが使用される。プラスミド生成のために DNA 断片を単離する目的では、一般に 5〜50 □g の DNA が、多目の液に入れた 20〜250 単位の酵素で消化される。特定の制限酵素に対する適切な緩衝液および基質の量は、製造会社により指定されている。培養時間は、37℃で約1時間が通常使用されるが、供給業者の使用説明書に従い異なることもある。消化の後、ゲル電気泳動を実施して、希望の断片を単離することもできる。
「オリゴヌクレオチド」は、単一の鎖のあるポリデオキシヌクレオチドまたは 2 つの相補的ポリデオキシヌクレチド鎖のいずれかを意味し、化学的に合成したものでもよい。このような合成オリゴヌクレオチドには 5' リン酸塩はないため、キナーゼが存在する場合は、リン酸塩を ATP に追加することなく他のオリゴヌクレオチドに連結されることはない。合成オリゴヌクレオチドは、脱リン酸されていない断片には連結する。
【0020】
2 つの核酸またはポリペプチドについての文脈での「実質的に同一」という句は、対応が最大になるように比較・位置合わせした上で、既知の配列比較アルゴリズムのどれかを使用して、または目視検査により測定したとき、少なくとも 50%、55%、60%、65%、70%、75%、80%、85%、および一部の面で 90〜95% のヌクレオチドまたはアミノ酸の残基同一性を有する 2 つ以上の配列を意味する。一般に、少なくとも約 100 の残基の領域に実質的な同一性が存在し、最も一般的には、少なくとも約 150〜200 の残基で配列は実質的に同一である。一部の実施例においては、配列は、コード領域の全長において実質的に同一である。
さらに、「実質的に同一」なアミノ酸配列は、1 つ以上のアミノ酸の同類置換または非同類置換、欠失、または挿入により、基準配列とは異なる配列であるが、特に、そうした置換が分子の活性部位ではない部位で起こるとき、またポリペプチドの機能的な特性が本質的に保持されている場合に限る。例えば、アミノ酸の同類置換では、1 つのアミノ酸が同じ部類の他のものと置き換わる (イソロイシン、バリン、ロイシン、メチオニンなどの 1 つの疎水性アミノ酸の他との置換、またはアルギニンのリジン、グルタミン酸のアスパラギン酸、グルタミンのアスパラギンとの置換といった 1 つの極性アミノ酸の他との置換などがその例)。1 つ以上のアミノ酸を、例えば、デハロゲナーゼポリペプチドから欠失させて、生物活性を著しく変化させることなく、ポリペプチドの構造を修飾することができる。例えば、アミノ末端またはカルボキシル末端のあるアミノ酸でデハロゲナーゼ生物活性には必要でないものは、除去することができる。本発明の修飾ポリペプチド配列は、デハロゲナーゼ生物活性について、数々の方法で検査することができ、この方法には、修飾ポリペプチド配列にデハロゲナーゼ基質を接触させ、修飾ポリペプチドによって、試験法における特定の基質が減少するかどうか、または機能的デハロゲナーゼポリペプチドと基質との酵素性の反応によりバイオプロダクトが増大するかどうかを判断するなどがある。
【0021】
本書で使用するとき、「断片」は、少なくとも 2 つの異なる配座に存在できる自然発生的なタンパク質の一部分である。断片は、自然発生的なタンパク質と同一かまたは実質的に同一なアミノ酸配列を持ちうる。「実質的に同一」とは、アミノ酸配列の全体ではなく大部分で、関連性のある配列の少なくとも 1 つの機能的活性が保持されていることを意味する。一般に、2 つのアミノ酸配列は少なくとも約 85% が同一である場合に、「実質的に同一」または「実質的に相同的」である。自然発生的なタンパク質とは異なる三次元構造を持つ断片も含まれる。この例としては、切断によって修飾し著しく高い活性のある成熟酵素を生成できる、低活性のプロタンパクといった「プロ体」分子がある。
「ハイブリッド形成」とは、核酸鎖が塩基対形成により相補鎖と結合するプロセスを意味する。ハイブリッド形成反応は、低濃度で存在するようなサンプルでも、目的とする特定の配列を識別することができるように、高感度で選択的とすることができる。適した厳密な条件は、例えば、プレハイブリダイゼーションおよびハイブリッド形成溶液における塩またはホルムアミドの濃度により、またはハイブリッド形成温度により決定でき、またこの技術分野でよく知られている。
特に、厳密性は、塩濃度の低下、ホルムアミド濃度の増大、ハイブリッド形成温度の上昇によって高めることができる。
例えば、高厳密性の条件下でのハイブリッド形成は、約 50% ホルムアミドで、約37℃〜42℃で起こり得る。ハイブリッド形成は、低厳密性の条件下では、約 35%〜25% のホルムアミド、約30℃〜35℃で発生し得る。特に、ハイブリッド形成は、高厳密性の条件下で、42℃、50% ホルムアミド、5X SSPE、0.3% SDS、および 200 n/ml のせん断・変性させたサケ精液 DNA で起こり得る。ハイブリッド形成は、低厳密性の条件では、上述の条件で 35% ホルムアミドで低めの温度35℃で起こり得る。特定レベルの厳密性に対応する温度範囲は、当該核酸のプリン - ピリミジン比を算出し、それに従い温度を調節することにより、さらに狭めることができる。上記の範囲および条件に関する変動は、この技術分野でよく知られている。
【0022】
「変異体」という用語は、一つ以上の塩基対、コドン、イントロン、エキソン、またはアミノ酸残基 (それぞれ) で修飾されながらも、本発明のハイドロラーゼの生物活性が維持されているような、本発明のポリヌクレオチドまたはポリペプチドを意味する。本発明のポリヌクレオチドまたはポリペプチドも、イノシンなどの修飾塩基を導入することにより修飾することができる。さらに、任意に、修飾は、1 回以上の回数だけ反復することができる。変異体は、例えば、エラープローンPCR、シャフリング、オリゴヌクレオチドを標的とした突然変異誘発、アセンブリ PCR、有性 PCR 突然変異誘発、生体内での突然変異誘発、カセット式突然変異誘発、連続的全体突然変異誘発、指数関数的な全体的突然変異誘発、部位特異的突然変異誘発、遺伝子再集合、GSSM、およびその任意の組み合わせ、順列、反復プロセスなどの方法を含めた数多くの方法で生成できる。
酵素は、選択性の高い触媒である。これらの特徴は、従来の合成化学とは比較にならない精巧な立体選択性、位置選択性、および化学選択性により、反応の触媒作用をする能力である。その上、酵素は、著しく多用途である。有機溶剤中で機能したり、極端な pH (高 pH 値や低 pH 値など) や極端な温度 (高温や低温など)、極端な塩分レベル(高塩分や低塩分など) で作用したり、その天然の生理学的な基質とは構造的に関連のない化合物との反応の触媒作用をするように、調節ができる。
酵素は、広範囲の天然および非天然の基質に対して反応性があるため、実質上、あらゆる有機鉛化合物の修飾が可能である。その上、従来的な化学的触媒とは異なり、酵素は、エナンチオ選択性および位置選択性が非常に高い。酵素の示す高い度合いの官能基特異性によって、新しい活性化合物につながる合成配列におけるそれぞれの反応を把握することができる。また、酵素には、その生理的機能とは全く関連のない数多くの多様な反応の触媒の役目をする能力がある。例えば、ペルオキシダーゼは、過酸化水素によるフェノール類酸化の触媒の役目をする。また、ペルオキシダーゼは、酵素にある本来の機能とは関連のないヒドロキシル化反応の触媒の役目をする。その他の例には、ポリペプチドの分解において触媒の役目を果たすプロテアーゼがある。有機溶液中では、一部のプロテアーゼは、糖類をアシル化することもあるが、これは、これらの酵素にある本来の機能とは関連のない機能である。
【0023】
本発明は、酵素の特異な触媒特性を活用するものである。化学的形質変換における、生体触媒 (つまり、精製した酵素または天然酵素、非生体細胞または生体細胞) の使用には、通常、特定の出発化合物と反応する特定の生体触媒の特定が必要となるが、本発明では、数多くの出発化合物に存在する官能基について特異的な、選択された生体触媒および反応条件を使用している。
各生体触媒は、1 つの官能基あるいはいくつかの関連する官能基に特異的であり、その官能基を含む多くの出発化合物と反応しうる。
生体触媒反応によって、単一の出発化合物から誘導体の集合が生成される。これらの誘導体は、第 2 の誘導体の集合を生成するために 2 回目の触媒反応を前提とすることもできる。生体触媒の誘導体化を反復するたびに、元の化合物から何千もの変形物が生成される。
酵素は、分子の残りの部分に影響することなく出発化合物の特定部位に反応する。このプロセスを、従来の化学方法の使用により達成するのは非常に難しい。
このように生体触媒特異が高いことによって、ライブラリ内の単一活性化合物を特定する手段が提供される。ライブラリは、ライブラリの作成に使用される一連の生体触媒反応、いわゆる「生合成履歴」によって特徴づけられる。生物活性についてライブラリをスクリーニングし、生合成履歴を追跡することにより、活性化合物を生み出す特定の反応配列が特定される。反応配列は繰り返され、合成化合物が決定される。他の合成およびスクリーニング方法とは違い、この特定方法では、固定化技術が要らず、化合物は実質的にあらゆる種類のスクリーニングアッセイを使用して溶媒中で自由に合成・テストされうる。官能基における酵素反応の特異度が高いことによって、生体触媒により作成されるライブラリを作り出す特定の酵素反応の「追跡」が可能となる点に留意することは重要である。
【0024】
手順段階の多くは、ロボットによる自動装置を使用して実行されるため、一日に何千回もの生体触媒反応およびスクリーニングアッセイが可能なだけでなく、高い精度と再現性が確保される。その結果、現在の化学的な方法を使用すれば何年もかかると思われる誘導化合物のライブラリがわずか数週間で生成されうる。
(小分子を含めて、分子の修飾に関する詳細な説明については、PCT/US94/09174 を参照するものとし、その全文を参照し本書に組込む。)
一面において、本発明では、合成遺伝子再集合という非確率的な方法が提供されているが、これは核酸基本要素が無作為にはシャフリング、鎖状化、キメラ化されず、非確率的に集合することを除けば、確率的シャフリングといくらかの関連性がある。
合成遺伝子再集合法は、シャフリングされるポリヌクレオチド間の高レベルな相同性の存在には依存しない。本発明は、10100 より多い異なるキメラから構成される子孫分子のライブラリ (または集合) の非確率的な生成に使用可能である。おそらくは、合成遺伝子再集合は、101000 より多い異なる子孫キメラから構成されるライブラリの生成にも使用可能である。
こうして、一面において、本発明では、計画に選択された全体的な集合順序を持つ最終的なキメラ核酸分子の集合を生成する非確立的な方法が提供されており、この方法は、相互に適合性のある連結可能な端部を持つ有用な、多数の特定の核酸基本要素を計画に生成する手順と、計画な全体的な集合順序が達成されるように、これらの核酸基本要素を集合させる手順から構成される。
組み立てられる核酸基本要素の相互に適合性のある連結可能な端部は、それらによって、予め定められた順序どおりに基本要素が連結されるようになっている場合に、このタイプの順序化された集合に対して「有用」であると考えられる。
こうして、一面において、核酸基本要素を連結する全体的な集合順序は、連結可能な端部の設計により指定され、また、2 つ以上の集合手順が使用される場合には、核酸基本要素を連結できる全体的な集合順序は、集合手順の順次に指示により指定することもできる。本発明の一つの実施例において、アニーリングを施した組立て部品は、リガーゼ(T4 DNA リガーゼなど) などの酵素を用いて処理され、基本要素の共有結合が達成される。
【0025】
別の実施例において、核酸基本要素の設計は、最終的なキメラ核酸分子の子孫集合を生成するための基礎としての役目をする一組の先駆体の核酸鋳型の配列を分析することで獲得される。こうして、これらの先駆体の核酸鋳型は、突然変異誘発、つまりキメラ化またはシャフリングされることになる核酸基本要素の設計を支援する配列情報源としての役目をする。
一つの例証において、本発明では、関連性のある遺伝子群およびその符号化された関連生成物群のキメラ化が提供されている。特定の例証において、符号化された生成物は酵素である。本発明のデハロゲナーゼは、本書で説明した方法に従い変異誘発可能である。
こうして、本発明の一面によれば、多数の先駆体の核酸鋳型 (グループ A 核酸配列のポリヌクレオチドなど) の配列は、1 つ以上の境界点を選択するために位置合わせでき、その境界点は、相同性のある領域に定めることができる。境界点は、生成されることになる核酸基本要素の境界線を定めるために使用される。
こうして、先駆体分子内で識別・選択された境界点は、子孫分子の集合において潜在的なキメラ化の地点としての役割を果たす。
【0026】
一般に、有用な境界点は、少なくとも 2 つの先駆体の鋳型で共有されている相同性のある (少なくとも 1 つの相同性のヌクレオチド塩基で構成される) 領域であるが、境界点は、少なくとも先駆体の鋳型の半分、少なくとも先駆体の鋳型の 3 分の 2、少なくとも先駆体の鋳型の 4 分の 3、および望ましくは先駆体の鋳型のほぼ全部で共有されている相同性のある領域でもありうる。さらに望ましく、なおかつ有用な境界点は、先駆体の鋳型全体で共有されている相同性の領域である。
一つの実施例においては、網羅的なライブラリを生成するために、遺伝子再集合プロセスは徹底的に実施される。言い換えれば、核酸基本要素について考えられる全ての順序付けられた組み合わせが、最終的なキメラ核酸分子の集合で表示される。同時に、各組み合わせにおける集合順序 (すなわち、最終的な各キメラ核酸の 5' から 3 配列における各基本要素の集合の順序) は、計画なもの (または非確率的なもの) である。この方法の非確率的な性質により、望まれない副産物の可能性が大幅に低減される。
別の実施例において、この方法では、例えば系統的に区画化されたライブラリを生成するために、体系的に (一つずつなど) スクリーニング可能な区画を用いて、遺伝子再集合プロセスが体系的に実施されるとしている。言い換えれば、本発明では、特定の核酸基本要素を選択的かつ慎重に用い、また順次的な手順の集合反応を選択的かつ慎重に用いることにより、実験的な設計が達成可能となり、特定の子孫生成物の集合が複数の反応槽の各々で生成されるとしている。これにより、体系的な試験およびスクリーニング手順の実施が可能となる。こうして、潜在的に非常に多数の子孫分子を小規模のグループ内で体系的に検査することができる。
特に、先駆体分子内で相同性のレベルが低いときにも、高い柔軟性があると同時に徹底的かつ体系的な方法でのキメラ化を実施できる能力があるため、本発明では、多数の子孫分子で構成されるライブラリ (または集合) の生成が提供されている。本発明の遺伝子再集合は非確率的な性質があることから、生成された子孫分子は、計画に選択された全体的な集合順序を有する最終的キメラ核酸分子のライブラリで構成されることが望ましい。特定の実施例において、そのような生成されたライブラリは、103〜101000 より多い異なる子孫分子の種から構成される。

一面において、前述のとおりに生成された最終的キメラ核酸分子の集合は、ポリペプチドを符号化するポリヌクレオチドで構成されている。一つの実施例によれば、このポリヌクレオチドは遺伝子であり、それは人工遺伝子でもありうる。
他の実施例によれば、このポリヌクレオチドは遺伝子経路であり、それは人工の遺伝子経路でもありうる。本発明では、本発明で生成される 1 つ以上の人工遺伝子が、真核生物体 (植物を含む) 内で操作可能な経路などの人工の遺伝子経路に組込み可能である。
【0027】
別の例証において、基本要素が生成される手順は合成によるものであることから、後で生体外プロセス(突然変異誘発によるなど) または生体内プロセス(宿主生物体の遺伝子スプライシング能力の利用によるなど) で、任意に除去が可能なヌクレオチド(例えば、コドンまたはイントロンまたは制御配列でありうる 1 つ以上のヌクレオチドなど) の設計および導入が可能となる。多くの例において、有用な境界点の生成といった潜在的な利益に加え、その他数多くの理由からも、これらのヌクレオチドの導入は望ましいことが認識される。
こうして、他の実施例によれば、本発明では、核酸の基本要素はイントロンの導入に使用できる。ゆえに、本発明では、機能性イントロンを本発明の人工遺伝子に導入しうる。また、発明では、機能性イントロンを本発明の人工の遺伝子経路に導入しうる。よって、本発明では、1 つ (または複数) の人工的に導入されたイントロンを含有する人工遺伝子であるキメラポリヌクレオチドが生成される。
【0028】
従って、本発明では、1 つ (または複数) の人工的に導入されたイントロンを含有する人工の遺伝子経路であるキメラポリヌクレオチドも生成される。人工的に導入されたイントロンは、天然のイントロンが遺伝子スプライシングにおいて機能的に役割を果たすのと同じ様に、遺伝子スプライシングのための 1 つまたは複数の宿主細胞において機能的であることが望ましい。本発明では、組換えおよびスプライシング(またはそのいずれか) のための宿主生物体に導入されることになる、イントロン含有の人工ポリヌクレオチドを生成するプロセスが提供されている。
本発明を利用して生成した人工遺伝子は、他の核酸との組換え用の基質としての役割を果たすこともできる。同様に、本発明を利用して生成した人工の遺伝子経路は、他の核酸との組換え用の基質としての役割を果たすこともできる。望ましい例において、組換えは、イントロン含有の人工遺伝子と、組換えの相手としての役割をする核酸との間の相同性の領域により促進されるか、その領域で発生する。特に望ましい例において、組換えの相手は、人工遺伝子または人工の遺伝子経路を含む、本発明により生成された核酸でもありうる。組換えは、人工遺伝子内の 1 つ (または複数) の人工的に導入されたイントロンの部位に存在する、相同性の領域により促進されるか、その領域で発生する。
本発明の合成遺伝子再集合法では、それぞれに 2 つの連結可能な端部のある多数の核酸基本要素を利用することが望ましい。それぞれの核酸基本要素の 2 つの連結可能な端部としては、2 つのブラントエンド(平滑断端) (つまり、それぞれに0 ヌクレオチドのオーバーハングがあるもの)、または望ましくは 1 つのブラントエンドと 1 つのオーバーハング、またはさらに望ましくは 2 つのオーバーハングが考えられる。
この目的に役立つオーバーハングには、3' オーバーハングまたは 5' オーバーハングがある。こうして、核酸基本要素には、1 つの 3' オーバーハングまたは、その代わりに 1 つの 5' オーバーハング、またはその代わりに 2 つの 3' オーバーハング、またはその代わりに 2 つの 5' オーバーハングを持つことが考えられる。核酸基本要素が集合して最終的キメラ核酸分子を形成する全体的な順序は、無作為にではなく、計画で実験的な設計により決定される。
【0029】
望ましい 1 つの実施例によれば、核酸基本要素は、2 つの一本鎖の核酸 (一本鎖のオリゴともいう) を化学合成し、それらをアニールして二本鎖核酸基本要素が形成されるようにそれらを接触させることで生成される。
二本鎖核酸基本要素は、様々なサイズが考えられる。これらの基本要素のサイズは、小さくも大きくもできる。基本要素として望ましいサイズは、1 つの塩基対 (オーバーハングは含まない) から、100,000 個の塩基対 (オーバーハングは含まない) までの範囲である。その他の望ましいサイズの範囲も提供されており、それは下限が 1 bp〜10,000 bp (この間のすべての整数値を含む) で、上限が 2 bp〜100,000 bp (この間のすべての整数値を含む) の値である。
二本鎖核酸基本要素を生成可能な、本発明にとって有用な数多くの方法が存在し、それらは、この技術分野で知られており、熟練者により簡単に実施可能なものである。
1 つの実施例によれば、二本鎖核酸基本要素は、まず 2 つの一本鎖核酸を生成し、それらをアニールして二本鎖核酸基本要素を形成できるようにすることで生成される。二本鎖核酸基本要素の 2 つの鎖は、オーバーハングを形成するもの以外では、各ヌクレオチドで相補鎖であることが考えられ、よって、オーバーハング以外にはミスマッチは含まれていない。別の実施例によれば、二本鎖核酸基本要素の 2 つの鎖は、オーバーハングを形成するもの以外では、各ヌクレオチドよりも少ない数において相補鎖である。こうして、この実施例によれば、二本鎖核酸基本要素は、コドンの縮重の導入に使用できる。コドンの縮重は、本書で説明した部位親和性のある突然変異誘発を使用、1 つまたは複数の N,N,G/T カセットを使用、またはその代わりに 1 つまたは複数の N,N,N カセットを使用して、導入することが望ましい。
【0030】
本発明の生体内での組換え方法は、特定のポリヌクレオチドまたは配列の、未知混成体または対立形質のプールに対して盲目的に実施できる。ただし、特定のポリヌクレオチドの実際の DNA または RNA 配列を知る必要はない。
混成遺伝子の母集団内で組換えを使用するアプローチは、例えば、インターロイキンI、抗体、tPA および成長ホルモンといった、有用な任意のタンパク質の生成に役立ちうる。このアプローチは、特異性または活性の変化したタンパク質の生成に使用しうる。また、このアプローチは、例えば、プロモーター領域、イントロン、エキソン、エンハンサー配列、遺伝子の 31 非翻訳領域または 51 非翻訳領域といった、混成核酸配列の生成に役立ちうる。こうして、このアプローチは、発現率の高い [sic] 遺伝子の生成に使用しうる。また、このアプローチは、反復 DNA 配列の研究にも有用である。最後に、このアプローチは、リボザイムまたはアプタマーの突然変異にも有用である。
本発明が本書で説明している一面では、DNA、RNA またはタンパク質などの非常に複雑な線形配列の定方向への分子の進化が完全な組換えとなるような、還元的再集合、組換え、および選択の反復的な繰り返しの使用が指示されている。
生体内での分子のシャフリングは、変異体の供給において有用で、細胞の自然の性質を利用して多量体の組換えを実施することができる。生体内での組換えが分子の多様性に対する主要な天然経路を提供してきた一方、遺伝子組換えは、1) 相同性の認識、2) 組換えキアズマの生成につながる鎖の切断、鎖の侵入、および代謝ステップ、そして最後に 3) キアズマの個々の組換え分子への分解、などが関連する比較的複雑なプロセスのままである。キアズマの形成には、相同配列の認識を必要とする。
【0031】
別の実施例において、本発明には、少なくとも 1 つの第 1 のポリヌクレオチドおよび 1 つの第 2 のポリヌクレオチドから混成ポリヌクレオチドを生成する方法が含まれている。本発明は、少なくとも 1 つの部分的配列相同性の領域 (3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45、47、およびその組み合わせなど) を共有する少なくとも 1 つの第 1 のポリヌクレオチドおよび 1 つの第 2 のポリヌクレオチドを適した宿主細胞に導入することにより、混成ポリヌクレオチドの生成に使用できる。部分的な配列相同性のある領域は、配列再編成となるプロセスを促進し、混成ポリヌクレオチドが生成される。本書で使用するとき、「混成ポリヌクレオチド」という用語は、本発明の方法による任意のヌクレオチド配列をいい、少なくとも 2 つの元のポリヌクレオチド配列からの配列が含まれている。こうした混成ポリヌクレオチドは、DNA 分子間の配列組込みを促進する分子間の組換え現象の結果である場合もありうる。さらに、こうした混成ポリヌクレオチドは、DNA 分子内のヌクレオチド配列を変化させる反復配列を利用した分子内の還元的再集合プロセスからのものでもありうる。
本発明では、生物活性ハイブリッドポリペプチド(混成ハロアルカンデハロゲナーゼなど) を符号化しうる混成ポリヌクレオチドを生成する手段が提供されている。一面において、最初のポリヌクレオチドは、生物活性ポリペプチドを符号化する。本発明の方法では、結果としての混成ポリヌクレオチドによりポリペプチドが符号化され、本来の生物活性ポリペプチドに由来する活性が示されるように、元のポリヌクレオチドの配列を統合するような細胞の過程の利用により、新しい混成ポリペプチドを生成する。例えば、元のポリヌクレオチドは、異なった微生物からの特定の酵素を符号化できる。1 つの生物体または変異体からできた第 1 のポリヌクレオチドにより符号化された酵素は、例えば、高塩分といった特定の環境条件下で効果的に機能することがある。異なる生物体または変異体からの第 2 のポリヌクレオチドにより符号化された酵素は、極度の高温といった異なる環境条件下で効果的に機能することがある。第 1 と第 2 の元のポリヌクレオチドからの配列を含む混成ポリヌクレオチドは、元のポリヌクレオチドにより符号化された両方の酵素の性質を示す酵素を符号化しうる。こうして、混成ポリヌクレオチドにより符号化された酵素は、第 1 と第 2 のポリヌクレオチドにより符号化されたそれぞれの酵素により共有される環境条件下 (高塩分および極度の温度など) で効果的に機能しうる。
本発明のポリヌクレオチドで符号化された酵素には、ハイドロラーゼ、デハロゲナーゼ、およびハロアルカンデハロゲナーゼが含まれるが、これに限られない。本発明の方法による混成ポリペプチドは、元の酵素では示されなかった特化された酵素活性を示すことがある。例えば、ハイドロラーゼ活性を符号化するポリヌクレオチドの組換えおよび還元的再集合 (またはそのいずれか) の後、混成ポリヌクレオチドにより符号化される結果としての混成ポリペプチドは、それぞれの元の酵素から獲得された特別なハイドロラーゼ活性、つまりハイドロラーゼが作用する結合のタイプや、ハイドロラーゼが機能する温度についてスクリーニングをすることができる。こうして、例えば、ハイドロラーゼは、混成ハイドロラーゼと元のハイドロラーゼを区別する化学機能を確認するためにスクリーニングをすることができる。これには、(a) アミド(ペプチド結合)、つまり、プロテアーゼ、(b) エステル結合、つまり、エステラーゼおよびリパーゼ、(c) アセタール、つまり、グリコシダーゼのほか、例えば、混成ポリペプチドの機能する部位での温度、pH または塩濃度などがある。
【0032】
最初のポリヌクレオチドの資源としては、個別の生物体から単離したもの (「単離体」)、定義済みの培養液内で成長した生物体の集合 (「集積培養」)、または未培養の生物体 (「環境サンプル」) などが考えられる。環境サンプルから新しい生理活性を符号化するポリヌクレオチドを引き出すために、培養に依存しない方法を使用することが最も望ましい。これは、それにより生物多様性の未利用の資源を利用することができるためである。
「環境的ライブラリ」は、環境サンプルから生成され、適した原核生物宿主内で増殖可能なクローニングベクター内で達成された自然発生的な生物体の集団ゲノムを表す。クローン化 DNA は、最初に環境サンプルから直接抽出されるため、ライブラリは、純粋培養で成長しうる原核生物の極一部には限定されない。さらに、これらのサンプルで提示される環境 DNA の正規化によって、元のサンプルに存在するあらゆる種からの DNA をより均等に表現しうることにもなる。このことにより、優先種と比較して数桁も低く表現されて場合もあるサンプルの微量成分から、目的とする遺伝子を見つける効率を劇的に高めることができる。
例えば、1 つまたは複数の未培養微生物から生成された遺伝子ライブラリは、当該の活性についてスクリーニングされる。当該の生理活性分子を符号化する潜在的な経路は、まず、原核細胞内で遺伝子発現ライブラリの形態で捕捉される。
当該の活性を符号化するポリヌクレオチドは、このようなライブラリから単離され、宿主細胞に導入される。宿主細胞は、組換えおよび還元的再集合 (またはそのいずれか) を促進する条件下で成長し、新しい活性または強化された活性を持つ潜在的に活発な生体分子が生成される。
ポリヌクレオチドを準備する微生物としては、真正細菌および古細菌などの原核微生物、および菌類などの下等真核微生物、一部の藻類や原生動物が含まれる。ポリヌクレオチドは、環境サンプルからも単離することができ、その場合は核酸を、生物体を培養することなく回収することも、または 1 つまたは複数の培養された生物体から回収することもできる。一面において、こうした微生物としては、超好熱菌、好冷菌、低温菌、好塩菌、好圧菌、および好酸菌などの極限環境微生物が考えられる。極限環境微生物から単離した酵素を符号化するポリヌクレオチドが特に望ましい。このような酵素は、陸上の温泉および深海の熱水噴出口の100℃を越える温度でも、北極の海域の0℃より低い温度でも、死海の飽和食塩水環境でも、炭の沈殿内や地熱による硫黄含有量の多い泉内の pH 値がほぼ 0 の場合でも、または下水汚泥での 11 を越える pH 値でも機能すると考えられる。例えば、極圏環境生物体からクローニングし発現したいくつかのエステラーゼおよびリパーゼでは、広範囲の温度および pH 値全体で高い活性が示される。
【0033】
上記に説明したとおりに選択・単離したポリヌクレオチドは、適した宿主細胞に導入される。適した宿主細胞としては、組換えおよび還元的再集合またはいずれかを促進する能力のある任意の細胞である。選択されたポリヌクレオチドは、適切な制御配列を含むベクター内に既にあるものが望ましい。宿主細胞としては、哺乳類の細胞などの高等な真核細胞、または、酵母菌などの下等真核細胞が考えられ、もしくは、望ましい宿主細胞としては、バクテリアの細胞などの原核細胞が考えられる。この構造の宿主細胞へ導入は、リン酸カルシウム形質移入、DEAE- Dextran 媒介のトランスフェクション、またはエレクトロポーレーションにより達成できる (Davis 等、1986)。
適切な宿主の代表的な例として、大腸菌、ストレプトマイセス、ネズミチフス菌などのバクテリアの細胞、酵母などの真菌細胞、ショウジョウバエ S2 や スポドプテラ(Spodoptera) Sf9 などの昆虫の細胞、CHO、COS、または Bowes メラノーマなどの動物の細胞、アデノウィルス、ならびに植物細胞が挙げられる。適切な宿主の選択は、本書の内容に基づき、この技術分野の熟練者の範疇にあるとみなされる。
組換えタンパク質の発現に採用可能な、各種の哺乳類の細胞培養システムに特に関連して、哺乳類の発現システムの例には、"SV40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1981) に記載のあるサル腎臓の繊維芽細胞の COS-7 株、ならびに例えば、C127、3T3、CHO、HeLa、および BHK 株細胞など、適合性のあるベクターを発現可能なその他の株細胞が含まれる。哺乳類の発現ベクターは、複製起点、適切なプロモーターおよびエンハンサーのほか、必要とされる任意のリボソーム結合部位、ポリアデニル化部位、スプライスの供与体および受容体部位、転写性末端配列、および 5' フランキング非転写配列を構成することになる。SV40 スプライス由来の DNA 配列およびポリアデニル化部位は、必要な非転写遺伝因子を提供するためにも使用されうる。
【0034】
所定のポリヌクレオチドを含む宿主細胞は、形質転換体または増幅遺伝子を選択しつつ、プロモーターの活性化のために必要に応じて修飾した従来の培養液内で培養が可能である。温度、pH などの培養条件は、発現のために選択した宿主細胞でそれまでに使用したものであり、通常の熟練者にとって明白なものである。特定の酵素活性を持つものとして識別されるクローンは、強化された活性を有する酵素を符号化するポリヌクレオチド配列の識別に配列決定することもできる。
別の面で、本発明の方法は、1 つまたは複数のオペロンまたは遺伝子群、あるいはその一部からの生化学経路を符号化する新しいポリヌクレオチドの生成に使用できることが想定される。例えば、バクテリアや多くの真核生物には、その遺伝子の生成物が関係するプロセスに関連した遺伝子を調節するための協調機構がある。遺伝子は、単一の染色体上で「遺伝子群」と呼ばれる構造で集積し、単一制御配列の制御の下で、群全体の転写を開始する単一のプロモーターを含めて、まとめて転写される。このように、遺伝子群は、一般にその機能において同一または関連性のある隣接した遺伝子の集合である。遺伝子群により符号化される生化学経路の例は、ポリケチドである。ポリケチドは、生理活性の非常に豊富な資源である分子で、これには抗生物質 (テトラサイクリンおよびエリスロマイシンなど)、抗がん剤 (ダウノマイシン)、免疫抑制薬 (FK506 およびラパマイシン)、および獣医用製品 (モネンシン) がある。多くのポリケチド(ポリケチド合成酵素により生成) は、治療薬として貴重である。ポリケチド合成酵素は、長さや機能性および環化のパターンの異なる非常に多様な炭素鎖の生合成に対して触媒の役目をする複合作用酵素である。ポリケチド合成酵素遺伝子は、遺伝子群に該当し、またポリケチド合成酵素のうち少なくとも 1 つのタイプ (指定タイプ I) には、大規模の遺伝子および酵素があり、これらの遺伝子/タンパク質の遺伝子操作および生体外での研究を複雑なものにしている。
遺伝子群 DNA は、異なる生物体から単離したり、ベクター、特に結合された遺伝子群からの検出可能なタンパク質またはタンパク質に関連した配列活性の生成を制御・調整可能な発現制御配列を含むベクターに連結することができる。こうした遺伝子群との併用には、外来性の DNA の導入に対して例外的に大きな容量を持つベクターを使用することが特に適切であり、本書では、大腸菌の F 因子 (または稔性因子) を含めて例として説明している。大腸菌の F 因子は、接合時にそれ自体の高頻度転移に影響を及ぼすプラスミドであり、混成の微生物サンプルからの遺伝子群などの大規模な DNA 断片を実現し、安定して増殖するために理想的である。特に望ましい実施例は、「フォスミド」または細菌人工染色体 (BAC) ベクターと呼ばれるクローニングベクターの使用である。これらは、ゲノムDNA の大規模なセグメントを安定して組み込むことのできる大腸菌 F 因子に由来するものである。混成の未培養環境サンプルからの DNA に組み込むとき、大規模なゲノム断片を安定した「環境 DNA ライブラリ」の形態で実現可能となる。本発明で使用する別のタイプのベクターは、コスミドベクターである。
コスミドベクターは、本来、ゲノムDNA の大規模なセグメントをクローン・増殖するように設計されていたものである。コスミドベクターへのクローニングは、Sambrook 等、Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989) に詳細に説明されている。いったん適切なベクターに結合されると、異なるポリケチド合成酵素遺伝子群を含む 2 つ以上のベクターを、適した宿主細胞に導入することができる。遺伝子群により共有されている部分的配列相同性の領域では、プロセスが促進され、配列再編成が起こり、混成遺伝子群が出来上がる。こうして、新しい混成遺伝子群は、元の遺伝子群にはなかった強化された活性についてスクリーニングができる。
【0035】
従って、1 つの実施例において、本発明は、下記の手順により、生物活性の混成ポリペプチドを生成し、そのようなポリペプチドを強化された活性についてスクリーニングする方法に関連する。
1)少なくとも操作可能な連鎖のある第 1 のポリヌクレオチドおよび操作可能な連鎖のある第 2 のポリヌクレオチド、上記の少なくとも 1 つの部分的配列相同性の領域を共有する少なくとも第 1 のポリヌクレオチドおよび第 2 のポリヌクレオチドを適した宿主細胞に導入する手順
2)配列再編成を促進し、操作可能な連鎖のある混成ポリヌクレオチドが生成されるような条件下での宿主細胞を培養する手順
3)混成ポリヌクレオチドにより符号化された混成ポリペプチドを発現する手順4)強化された生物活性の識別を促進するような条件下で混成ポリペプチドをスクリーニングする手順
5)混成ポリペプチドを符号化するポリヌクレオチドを単離する手順
各種の酵素活性についてのスクリーニング方法は、この技術分野の熟練者には知られており、本明細書全体で論じている。こうした方法を、ポリペプチドおよび本発明のポリヌクレオチドの単離時に採用することもできる。
【0036】
使用できる発現ベクターの代表例として、ウィルス粒子、バキュロウィルス、ファージ、プラスミド、ファージミド、コスミド、フォスミド、細菌人工染色体、ウィルス性 DNA (ワクシニア、アデノウィルス、家禽ジフテリアウィルス、仮性狂犬病および SV40 の誘導体など)、P1 ベースの人工染色体、酵母プラスミド、酵母人工染色体、ならびに、その他目的とする特定の宿主に固有の任意のベクター(バシラス属、アスペルギルス属、および酵母など) が挙げられる。こうして、例えば、ポリペプチドの発現のために、DNA を多様な発現ベクターのどれにでも含めることができる。このようなベクターには、染色体の、非染色体性の、および合成による DNA 配列が含まれる。多数の適したベクターが、この技術分野の熟練者に知られており、市販されている。下記のベクターが、例として挙げられる。細菌性としては、pQE ベクター(Qiagen)、pBluescript プラスミド、pNH ベクター、λ-ZAP ベクター(Stratagene)、ptrc99a、pKK223-3、pDR540、pRIT2T (Pharmacia)、真核生物としては、pXT1、pSG5 (Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40 (Pharmacia) である。ただし、複製可能であり、宿主内で生存可能である限り、その他のプラスミドまたはその他のベクターのうち、任意のものを使用することができる。本発明では、低複製数または高複製数のベクターを採用できる。
発現ベクター内の DNA 配列は、RNA 合成を指示する適切な発現制御配列 (プロモーター) によって操作可能なようにリンクされている。特定の名称を持つ細菌性のプロモーターには、lacI、lacZ、T3、T7、gpt、λ PR、PL、trp などが含まれる。真核生物のプロモーターには、CMV 前初期、HSV チミジンキナーゼ、初期および後期の SV40、レトロウィルスからの LTR、およびマウスのメタロチオネイン-Iなどがある。適切なベクターおよびプロモーターの選択は、十分にこの技術分野での通常の熟練レベル内にある。発現ベクターには、翻訳開始のためのリボソーム結合部位、および転写ターミネーターも含まれる。また、ベクターには、発現の増幅用の適切な配列も含まれうる。プロモーター領域は、選択マーカーを使用してクロラムフェニコール転移酵素 (CAT) ベクターまたはその他のベクターを希望の任意の遺伝子から選択できる。さらに、発現ベクターは、真核細胞培養に対するジヒドロ葉酸レダクターゼまたはネオマイシン耐性など、もしくは大腸菌のテトラサイクリンまたはアンピシリン耐性などといった、形質転換した宿主細胞の選択についての表現形質を提供するための、1 つまたは複数の選択可能なマーカー遺伝子が含まれていることが望ましい。
生体内での再集合は、「分子間」プロセスに焦点があてられており、まとめて「組換え」と呼び、バクテリアにおいては、一般に「RecA に依存した」現象としてみられる。本発明は、配列を組み換え直し、集合し直すための宿主細胞の組換えプロセス、または欠失によって細胞内の準反復配列の複雑さを低減するための還元的プロセスの媒介となる細胞の能力に依存することができる。この「還元的再集合」プロセスは、「分子内の」RecA に依存しないプロセスにより発生する。
【0037】
従って、本発明の別の面では、新しいポリヌクレオチドは、還元的再集合プロセスにより生成できる。この方法には、連続的な配列 (本来の符号化用配列) が含まれる構成物を生成し、それを適切なベクターに挿入し、さらにその後、それを適切な宿主細胞に導入することが関連する。個別の分子同一性の再集合は、相同性の領域を処理する構成物内の連続的な配列間で、または準反復単位間の組み合わせプロセスにより起こる。再集合プロセスによって、反復配列の複雑さおよび範囲が再組み合わせられ、また低減され (またはそのいずれか)、新しい分子種が生成されることになる。再集合の割合を高めるために、様々な処理を適用しうる。これには、紫外線、または DNA に有害な化学物質による処理、および「遺伝的不安定性」のレベルを高めた宿主細胞株の使用 (またはそのいずれか) などがある。こうして、再集合プロセスには、それ自体の進化を指示する相同的組換えまたは準反復配列の自然の性質も関連しうる。
反復または「準反復」した配列は、遺伝的不安定性の役割を果たす。本発明において、「準反復体」とは、元の単位構造には制限されない反復体である。準反復単位は、構成物内の一連の配列または類似した配列の連続単位として提示できる。いったん連結されると、連続的な配列間の結合は本質的に不可視となり、これで、結果として生じる構成物の準反復の性質は、分子レベルで連続的となる。
細胞が結果としての構成物の複雑さを低減するように機能する欠失プロセスは、準反復配列間で作用する。準反復単位では、鋳型のレパートリーが事実上無制限に提供されるが、この鋳型においてズレが生じることがある。こうして、準反復体が含まれる構成物により、欠失 (および潜在的に挿入) イベントが準反復単位内の実質的にどこででも発生しうるような、分子の十分な弾性が効果的に提供される。
例えば頭 - 尾、またはその逆のように、準反復配列がすべて同一の向きに連結されるとき、細胞は、個別の単位を区別できない。従って、還元プロセスは配列全体で発生しうる。対照的に、例えば、その単位が頭 - 尾でなく頭 - 頭であるときは、反転により、欠失の形成が離散した単位の喪失に対して有利に働くように、隣接する単位の終点が描写される。そのため、本発明の方法では、配列は、同一の向きであることが望ましい。準反復配列が無作為の向きであると、再集合の効率が失われることになり、一方、配列が一貫した向きであると、最高の効率が得られることになる。ただし、同じ向きの近接した配列が少なければ効率は低下するが、新しい分子の効果的な回復については十分な弾性が得られうる。構成物は、高い効率を得ることのできる同一の向きの準反復配列で生成できる。
【0038】
配列は、下記を含めた様々な方法を使用して、頭 - 尾の向きで組立て可能である。
a)一本鎖であるとき、向きを提供してくれるポリ A の頭およびポリ T の尾が含まれるプライマーが利用できる。これは、プライマーの最初の少数塩基を RNA から生成し、それゆえ RNAseH から簡単に除去できるようにすることで達成できる。
b)固有の制限切断部位のあるプライマーが利用できる。複数の部位、一揃いの固有の配列、および反復的な合成および連結の手順が必要となる。
c)プライマーの内側の少数塩基はチオール化でき、適切な尾のある分子の生成に使用されるエキソヌクレアーゼ。
再集合配列の回復は、還元型の反復的な指標 (RI) のあるクローニングベクターの識別に依存している。その後で、再集合した符号化用の配列が、増幅により回復できる。生成物は、再クローン化・発現される。還元型 RI のあるクローニングベクターの回復は、以下により影響を受ける。
1)構成物の複雑さが低減されたときにのみ、安定して維持されるベクターの使用。
2)物理的な手順により、短くなったベクターの物理的な回復。この場合には、クローニングベクターは、標準的なプラスミド単離手順およびアガロースゲルで細分されたサイズ、または標準的な手順を使用した低分子量の切り取りのあるカラムを用いて回復される。
3)挿入サイズが減少する際に、選択可能な断続的な遺伝子が含まれるベクターの回復。
4)発現ベクターおよび適切な選択への直接選択法の使用。
関連した生物体からの配列 (遺伝子など) の符号化では、高い度合いの相同性が示され、非常に多様なタンパク質生成物が符号化されることがある。これらのタイプの配列は、準反復体として、本発明において特に役立つ。ところが、下記に説明する例では、ほとんど同一の符号化配列 (準反復体) の再集合が示されているが、このプロセスは、このようなほとんど同一の反復体に限定されるものではない。
【0039】
下記の例では、本発明の方法を立証している。他と異なる 3 つの種から引き出した核酸配列 (準反復体) の符号化が説明されている。各配列により、はっきりと異なる特性のあるタンパク質 1 組が符号化される。それぞれの配列は、配列内の固有の位置にある単一または少数の塩基対で異なっている。準反復配列は、連結された分子の母集団内で、可能性のあるあらゆる順列および組み合わせが出来上がるように、別個または集合的に増幅され、無作為な集合体に連結される。準反復単位の数は、集合条件により制御できる。構成物内の準反復単位の平均数は、反復的な指標 (RI) として定義される。
いったん形成されると、構造物のサイズは、公表済みの手順によりアガロースゲルで細分され、クローニングベクターに挿入、適切な宿主細胞に形質移入してもしなくてもよい。その後、細胞は増殖され、「還元的再集合」が実現する。還元的再集合プロセスの割合は、希望に応じた DNA 損傷の導入により、促進させることもできる。RI の低減が、「分子内の」のメカニズムによる反復配列間での欠失の形成を媒介とするか、または「分子間」のメカニズムによる組換えに似たイベントを媒介とするかは、重要ではない。最終的な結果は、考えられるすべての組み合わせへの分子の再集合である。
任意に、結合またはその他の方法で相互作用をする能力を有する個別のシャフリング済みライブラリ メンバを識別する、もしくは、例えば、タンパク質性受容体、オリゴ糖、ヴィロン(viron)、またはその他所定の化合物または構造などの所定の高分子と特定の反応 (酵素の触媒としての領域) の触媒の役目をするためのシャフリング済みプールのライブラリ メンバをスクリーニングする手順を方法に追加することもできる。
そのようなライブラリから特定したポリペプチドは、治療、診断、研究および関連した目的 (触媒、水溶液の浸透圧向上のための溶質、それに類するものなど) に使用でき、さらに (または) 1 回または複数回のシャフリングおよび選択 (またはそのいずれか) の追加サイクルを前提とすることもできる。
別の面で、組換えまたは再集合の前またはその途中において、本発明の方法により生成されたポリヌクレオチドは、元のポリヌクレオチドへの突然変異の導入を促進するエージェントまたはプロセスを前提できることが想定される。こうした突然変異を導入することにより、結果としての混成ポリヌクレオチドおよびそれをもとに符号化したポリペプチドの多様性が向上されることになる。突然変異誘発を促進するエージェントまたはプロセスには、以下があるがこれらに制限されない:(+)-CC-1065、または(+)-CC-1065-(N3-アデニン) などの合成類似体 (Sun and Hurley, (1992) を参照)、DNA 合成を抑制する能力のある N-アセチル化または脱アセチル化した 4'-フルロ-4-アミノビフェニル付加体 (例えば、van de Poll 等、(1992) を参照)、もしくは、DNA 合成を抑制する能力のある N-アセチル化または脱アセチル化した 4-アミノビフェニル付加体 (これも、van de Poll 等、(1992) pp. 751-758を参照)、三価クロム、三価クロム塩、DNA 複製を抑制する能力のある多環式芳香族炭化水素 (PAH) DNA 付加体 (この例としては、7-ブロモメチル-ベンズ[a]アントラセン(「BMA」)、トリス(2,3-ジブロモプロピル) リン酸塩 (「Tris-BP」)、1,2-ジブロモ-3-クロロプロパン(「DBCP」)、2-ブロモアクロレイン(2BA)、ベンゾ[a]ピレン-7,8-ジヒドロジオール-9-10-エポキシド(「BPDE」)、白金 (II) ハロゲン塩、N-ヒドロキシ-2-アミノ-3-メチルイミダゾ[4,5-f]-キノリン(「N-ヒドロキシ-IQ」)、および N-ヒドロキシ-2-アミノ-1-メチル-6-フェニルイミダゾ[4,5-f]-ピリジン(「N-ヒドロキシ-PhIP」) など)。PCR 増幅を減速または停止する特に望ましい手段は、紫外光 (+)-CC-1065 および (+)-CC-1065-(N3-アデニン) から構成される。特に、含まれる手段は、DNA 付加体、またはポリヌクレオチドまたはポリヌクレオチドプールからの DNA 付加体で構成されるポリヌクレオチドであり、これは、その後のプロセスをする前に、ポリヌクレオチドから構成される溶液の加熱を含むプロセスにより、遊離または除去の可能なものである。
別の面で、本発明では、本発明による条件下で野生型タンパク質を符号化する二本鎖の鋳型ポリヌクレオチドで構成されるサンプルを処理することで、生物活性を有する組換えタンパク質を生成する方法が得られ、ハイブリッドまたは再集合ポリヌクレオチドが生成される。
【0040】
また、本発明では、独自のコドンプライマー(縮重N,N,N 配列を含む) を使用して、点突然変異をポリヌクレオチドに導入し、これにより子孫ポリペプチドの集合が生成されるが、そこで、広範囲の単独なアミノ酸置換は、それぞれのアミノ酸位置で表現される (遺伝子部位飽和突然変異誘発 (GSSM))。使用されているオリゴは、互いに近接する第 1 の相同配列、縮重 N,N,N 配列、および第 2 の相同配列 (望ましいものの必須ではない) から構成される。そのようなオリゴの使用による下流での子孫翻訳生成物には、ポリペプチドに沿ったそれぞれのアミノ酸部位で考えられる全てのアミノ酸変化が含まれるが、これは、N,N,N 配列の縮重には 20 のアミノ酸すべてのコドンが含まれているためである。
一面において、このような 1 つの縮重オリゴ (1 つの縮重 N,N,N カセットから成る) が、親ポリヌクレオチド鋳型におけるそれぞれの最初のコドンを従属させ、完全なコドンの置換をするために使用される。別の面で、同一のオリゴ内であるかどうかによらないが、少なくとも 2 つの縮重 N,N,N カセットが、親ポリヌクレオチド鋳型における少なくとも 2 つの最初のコドンを従属させ、完全なコドンの置換をするために使用される。こうして、2 つ以上の N,N,N 配列が、2 つ以上の部位でアミノ酸突然変異を導入するために、1 つのオリゴ内に含まれうる。この多数の N,N,N 配列は、直接的に近接するものでもよく、また 1 つまたは複数の追加ヌクレオチド配列ごとに別個のものでもよい。別の面で、付加および欠失の導入に有用なオリゴは、単独でか、またはN,N,N 配列を含むコドンと組み合わせて使用でき、アミノ酸の付加、欠失、および置換 (またはそのいずれか) の任意の組み合わせまたは順列が導入される。
特定の例証において、近接した N,N,N トリプレット、つまり縮重 (N,N,N)n配列を含むオリゴを使用して、2 つ以上の近接したアミノ酸位置を、同時進行的に突然変異誘発することが可能である。
【0041】
別の面で、本発明では、N,N,N 配列よりも縮重度合いの低い縮重カセットが使用される。例えば、一部の例においては、(オリゴ内でなど) 一つのみの N で構成される縮重トリプレット配列を使用することが望ましいこともある。ここで、この N はトリプレットの第 1、第 2、第 3 のどの位置でもよい。その任意の組み合わせおよび順列を含めたその他の塩基を、トリプレットの残りの 2 つの位置で使用できる。別の方法として、一部の例においては、(オリゴ内でなど) 縮重 N,N,N トリプレット配列、N,N,G/T、または N,N,G/C トリプレット配列を使用することが望ましいこともある。
ただし、本発明で説明したとおりに、縮重トリプレット(N,N,G/T または N,N,G/C トリプレット配列など) を使用することが、いくつかの理由から有利であることが認識される。一面において、本発明では、可能性のあるアミノ酸すべて (合計 20 のアミノ酸について) をポリペプチドのあらゆるアミノ酸位置に置換する手段が、体系的にかつかなり容易に提供されている。こうして、100 のアミノ酸ポリペプチドについては、本発明では、2000 の異なる種 (つまり、位置ごとに可能性のある 20 のアミノ酸×100 アミノ酸位置) を、体系的にかつかなり容易に生成する方法が提供されている。縮重 N,N,G/T または N,N,G/C トリプレット配列を含むオリゴの使用により、可能性のある 20 のアミノ酸を符号化する 32 の別個の配列が提供されていることが認識される。こうして、そのような 1 つのオリゴを使用して、親のポリヌクレオチド配列の飽和突然変異誘発がなされる反応槽内で、20 の異なるポリペプチドを符号化する 32 の異なる子孫ポリヌクレオチドが生成される。それとは対照的に、非縮重オリゴを部位特異的突然変異誘発に使用すると、反応槽当たりわずか 1 つの子孫ポリペプチド生成物ができるだけである。
【0042】
また、本発明では、公開されている縮重プライマーと組み合わせて任意に使用できる非縮重オリゴの使用についても用意している。一部の状況下で、作業中のポリヌクレオチドにおいて特定の点突然変異を生成するために、非縮重オリゴを使用することが有利であることが認識される。これにより、特定のサイレント点突然変異、該当するアミノ酸変化につながる点突然変異、ならびに停止コドンの生成および対応するポリペプチド断片の発現の原因となる点突然変異などを生成する手段が提供される。
こうして、本発明の望ましい実施例において、それぞれの飽和突然変異誘発反応槽には、親のポリヌクレオチド内で突然変異誘発されたコドン位置に対応する 1 つの特定のアミノ酸位置で 20 のすべてのアミノ酸が表現されるように、少なくとも 20 の子孫ポリペプチド分子を符号化するポリヌクレオチドが含まれる。それぞれの飽和突然変異誘発反応槽で生成された 32 倍縮重の子孫ポリペプチドには、クローン増幅 (発現ベクターを使用して適切な大腸菌宿主にクローニングするなど) をしたり、発現スクリーニングをすることができる。個別の子孫ポリペプチドがスクリーニングにより識別され好ましい特性の変化が現れたとき (親のポリペプチドとの比較時)、そのポリペプチドは配列決定され、そこに含まれる対応するものとして好ましいアミノ酸置換を識別することができる。
本書で公開した飽和突然変異誘発を用いて、親のポリペプチド内のあらゆるアミノ酸位置を突然変異誘発し、2 つ以上のアミノ酸位置で好ましいアミノ酸変化を識別できることが認識される。それらの好ましいアミノ酸置換のすべてまたはその一部の組み合わせを含む 1 つまたは複数の新しい子孫分子を生成することができる。例えば、2 つの特定の好ましいアミノ酸変化が、ポリペプチド内の 3 つのアミノ酸位置のそれぞれで識別された場合、順列には、各位置において 3 通りの可能性 (元のアミノ酸から変化のないものと、それぞれ 2 つの好ましい変化) および 3 つの位置が含まれる。こうして、3×3×3 つまり合計 27 通りの可能性があり、以前に検査済みの単一の点突然変異 6 つ (つまり、3 つの位置ごとに 2 つずつ) と、位置に変化のないものを合計した 7 つがこれに含まれる。
【0043】
また別の一面で、部位飽和型突然変異誘発は、スクリーニングとの併用のほかに、シャフリング、キメラ化、組換え、およびその他の突然変異誘発過程との併用ができる。本発明では、飽和突然変異誘発を含めた任意の突然変異誘発過程の反復的な使用について用意されている。一つの例証において、任意の突然変異誘発過程の反復使用は、スクリーニングと組み合わせて使用される。
こうして、非限定的な例証において、本発明では、追加の突然変異誘発プロセスとの組み合わせでの飽和突然変異誘発の使用についても用意しており、このプロセスでは、混成ポリヌクレオチドが組換えおよび還元的再集合によって生成されるように、2 つ以上の関連性のあるポリヌクレオチドが適した宿主細胞に導入される。
さらに、遺伝子配列全体に沿った突然変異誘発の実施について、本発明では、突然変異誘発を、ポリヌクレオチド配列内の任意の塩基数と置き換えるために使用できるとし、ここで、突然変異誘発される塩基の数は、15 から 100,000 までの各整数値であることが望ましい。こうして、分子に沿った各位置を突然変異誘発させる代わりに、各塩基または離散的な数の塩基 (合計15〜100,000 となる部分集合が望ましい) に対して突然変異誘発を起こさせることができる。ポリヌクレオチド配列に沿った各位置または位置グループの突然変異誘発には、別個のヌクレオチドが使用されることが望ましい。突然変異誘発される 3 位置で構成されるグループは、コドンでもよい。突然変異は、非相同的なカセットを含む変異原性のプライマー(変異原性カセットとも呼ばれる) を使用して導入することが望ましい。望ましいカセットは、1〜500 の塩基を持つことができる。そのような非相同的なカセットでの各ヌクレオチド位置は、N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G、または E で、ここで E は、A、C、G、または T 以外の任意の塩基である (E をデザイナーオリゴと呼ぶこともできる)。
【0044】
一般的な意味で、飽和突然変異誘発は、突然変異誘発される定義済みのポリヌクレオチド配列 (ここで、突然変異誘発される配列の長さは、約 15〜100,000 塩基分が望ましい) 内での、完全な一揃いの変異原性カセット(ここで、各カセットの長さは、約 1〜500 塩基分が望ましい) の突然変異誘発で構成される。こうして、突然変異のグループ (1〜100 の突然変異の範囲) が、突然変異誘発される各カセットに導入される。1 ラウンドの飽和突然変異誘発の適用中に、1 つのカセットに導入される突然変異のグループは、第 2 のカセットに導入される突然変異の第 2 のグループとは、異なるものでも同じものでもよい。こうしたグループ化は、欠失、付加、特定のコドンのグループ化、および特定のヌクレオチドカセットのグループ化により例証されている。
突然変異誘発される定義済みの配列には、全遺伝子、経路、cDNA、オープン・リーディング・フレーム(ORF) 全体、およびプロモーター全体、エンハンサー、リプレッサー/トランス活性化因子、複製起点、イントロン、オペレーター、または任意のポリヌクレオチド官能基などがある。一般に、この目的での「定義済みの配列」としては、15 塩基のポリヌクレオチド配列、および長さが15〜15,000 塩基分 (この発明では、この間のすべての整数値を特に指定する) のポリヌクレオチド配列の任意のポリヌクレオチドが考えられる。コドンのグループの選択にあたっての考慮事項には、縮重変異原性カセットにより符号化されるアミノ酸のタイプなどがある。
変異原性カセットに導入できる突然変異のグループ化についての特定の望ましい例証において、本発明では特に、各位置で 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、および 20 のアミノ酸用に符号化する縮重コドンの置換 (縮重オリゴを使用)、ならびにそれにより符号化されるポリペプチドのライブラリが用意されている。
【0045】
本発明の一面は、グループ A 核酸配列、およびそれと実質的に同一な配列のうちどれか 1 つの配列、それに対して相補的な配列、またはグループ A 核酸配列 (またはそれに対して相補的な配列) のうちどれか一つの配列のうち、少なくとも 10、15、20、25、30、35、40、50、75、100、150、200、300、400、または 500 の連続塩基から成る断片で構成される単離された核酸である。単離した核酸は、cDNA、ゲノムDNA、合成 DNA などの DNA で構成されうる。DNA は、二本鎖または一本鎖のどちらでもよく、また一本鎖の場合には、コード鎖または非コード(アンチセンス) 鎖のどちらでもよい。別の方法として、単離された核酸は RNA で構成することもできる。
下記にさらに詳細に説明するとおり、グループ A 核酸配列、およびそれと実質的に同一な配列のうちどれか 1 つの単離された核酸を、グループ B アミノ酸配列、およびそれと実質的に同一な配列のうちどれか 1 つのポリペプチド、もしくはグループ B アミノ酸配列、およびそれと実質的に同一な配列のうちどれか 1 つのポリペプチドのうち、少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片の準備に使用することもできる。
従って、本発明の別の面は、グループ B アミノ酸配列、それと実質的に同一な配列のポリペプチドのうちどれか 1 つ、またはグループ B アミノ酸配列のポリペプチドのどれか 1 つのうち、少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から成る断片を符号化する単離された核酸である。これらの核酸のコード配列は、遺伝暗号の重複性または縮重の結果として、グループ A 核酸配列の核酸のうちどれか 1 つ、またはその断片のコード配列と同一でもよく、またグループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドの 1 つ、およびグループ B アミノ酸配列のポリペプチドの 1 つのうち、少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸を持つ断片を符号化する異なったコード配列でもよい。遺伝暗号は、この技術分野の熟練者にはよく知られており、例えば、B. Lewin, Genes VI, Oxford University Press, 1997 の 214 ページにて入手可能であり、その開示内容を参照により本書に組み込む。
【0046】
グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つを符号化する単離された核酸には、これに限定されないが、グループ A 核酸配列、およびそれと実質的に同一な配列の 1 つのコード配列のみ、ならびにリーダー配列またはプロタンパク質配列などの追加コード配列、ならびにイントロンまたはコード配列の非翻訳配列 5' および 3' (またはそのいずれか) などの非翻訳配列などが含まれる。こうして、本書で使用するとき、「ポリペプチドを符号化するポリヌクレオチド」という用語には、ポリペプチド用のコード配列のみを含むポリヌクレオチドのほか、追加コードおよび非翻訳配列 (またはそのいずれか) を含むポリヌクレオチドも含まれる。
別の方法として、グループ A 核酸配列、およびそれと実質的に同一な配列の核酸配列は、部位特異的突然変異誘発、またはこの技術分野の熟練者にとって馴染みあるその他の技術などの従来の技術を使用して突然変異誘発し、サイレント変化をグループ A 核酸配列、およびそれと実質的に同一な配列のポリヌクレオチドに導入することもできる。本書で使用するとき、「サイレント変化」には、例えば、ポリヌクレオチドにより符号化されるアミノ酸配列を変化させることのない変化が含まれる。このような変化は、宿主生物体で頻繁に発生するコドンまたはコドン対を導入することにより、ポリペプチドを符号化するベクターを含む宿主細胞によって生成されるポリペプチドのレベルを高める目的で望ましいといえる。
【0047】
本発明は、ヌクレオチド変化を持つポリヌクレオチドにも関連し、その結果、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド内でのアミノ酸の置換、付加、欠失、融合および切断が起こる。こうしたヌクレオチド変化は、部位特異的突然変異誘発、無作為な化学的突然変異誘発、エキソヌクレアーゼIII 欠失、およびその他の組換え DNA セグメント技術などの技術を使用して導入することができる。別の方法として、こうしたヌクレオチド変化は、本書で提供した高厳密性、中程度の厳密性、または低厳密性の条件下で、グループ A 核酸配列、およびそれと実質的に同一な配列の (またはそれに対して相補的な配列) どれか 1 つのうち、少なくとも 10、15、20、25、30、35、40、50、75、100、150、200、300、400、または 500 連続塩基配列で構成されるプローブに特異的にハイブリッド形成する核酸を識別することで単離した、自然発生的な対立形質変異体でもよい。
グループ A 核酸配列、およびそれと実質的に同一な配列の単離された核酸、それに対して相補的な配列、またはグループ A 核酸配列、およびそれと実質的に同一な配列のどれか 1 つ、またはそれに対して相補的な配列のうち、少なくとも 10、15、20、25、30、35、40、50、75、100、150、200、300、400、または 500 の連続塩基で構成される断片を、本発明の核酸配列のある生物体または核酸の獲得元である生物体が含まれているかどうかを判断するプローブとして土質見本などの生体サンプルに使用することもできる。そうした手順において、核酸の単離元である生物体を潜在的にかくまう生体サンプルが得られ、サンプルからは核酸が得られる。核酸は、プローブが、内部に存在する任意の相補配列に対して特異的にハイブリッド形成することのできるような条件下で、プローブと接触する。
【0048】
必要に応じて、プローブが相補配列に対して特異的にハイブリッド形成することのできるような条件は、相補配列が含まれることがわかっているだけでなく、相補配列が含まれない配列を制御するようなサンプルからの相補配列と接触するようにプローブを配置することで、決定することができる。ハイブリッド形成バッファの塩濃度、ハイブリッド形成バッファのホルムアミド濃度、またはハイブリッド形成温度などのハイブリッド形成の条件は、プローブが相補的な核酸に対して特異的にハイブリッド形成できるような条件を特定するために変化させることができる。
サンプルに核酸の単離元の生物体が含まれている場合には、プローブの特異的なハイブリッド形成が検出される。ハイブリッド形成は、検出可能な生成物を形成する触媒能力のある放射性同位元素、蛍光色素、または酵素などの検出可能なエージェントを用いて、プローブにラベル付けをすることで検出することもできる。
ラベル付けしたプローブを使用して、サンプル内の相補的核酸の存在を検出する数多くの方法が、この分野の熟練者にとってよく知られている。これらには、サザンブロット法、ノーザンブロット法、集落ハイブリッド形成手順、およびドットブロットなどがある。これらの各方法の手順については、Ausubel 等、Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) および Sambrook 等、Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989) に提供されており、この開示内容全体を参照することで、本書に組み込む。
【0049】
別の方法として、2 つ以上のプローブ (核酸サンプル内に存在する任意の相補配列に特異的にハイブリッド形成する能力のあるものを少なくとも 1 つ) を、増幅反応に使用し、サンプルに本発明の核酸配列のある生物体 (核酸の単離元の生物体) が含まれているかを判断することもできる。一般に、プローブは、オリゴヌクレオチドを意味する。一つの実施例において、増幅反応は、PCR 反応を意味することがある。PCR プロトコルについては、前記の Ausubel および Sambrook に説明されている。別の方法として、増幅は、リガーゼ連鎖反応、3SR、または鎖置換反応を意味することもある (Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16, 1991、E. Fahy 等、"Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1:25-33, 1991、および Walker G. T. 等、"Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992 を参照。それらの開示内容の全体を参照により本書に組み込む)。そうした手順において、サンプル内にある核酸は、プローブと接触し、増幅反応が行われ、結果としての何らかの増幅生成物が検出される。増幅生成物は、反応生成物でゲル電気泳動を実施し、ゲルを臭化エチジウムなどのインターキュレーター(interculator) で染色することにより、検出することもできる。別の方法として、プローブの 1 つまたは複数は、放射性同位元素を用いてラベル付けし、ゲル電気泳動の後で、放射性増幅生成物の存在をオートラジオグラフィにより検出することもできる。
プローブは、グループ A 核酸配列、およびそれと実質的に同一な配列の端部付近の配列から誘導され、また染色体歩行法で使用して、グループ A 核酸配列、およびそれと実質的に同一な配列に隣接して位置するゲノム配列を含むクローンを識別することもできる。このような方法により、宿主生物体からの追加タンパク質を符号化する遺伝子の単離が可能となる。
【0050】
グループ A 核酸配列、およびそれと実質的に同一な配列の単離された核酸、それに対して相補的な配列、もしくはグループ A 核酸配列、およびそれと実質的に同一な配列のうちのどれか 1 つの配列、またはそれに対して相補的な配列の、少なくとも 10、15、20、25、30、35、40、50、75、100、150、200、300、400、または 500 の連続塩基から構成される断片をプローブとして使用し、関連する核酸を識別し、単離することもできる。一部の実施例において、関連する核酸としては、核酸の単離元であるもの以外の生物体からの cDNA または ゲノムDNA が考えられる。例えば、その他の生物体は関連した生物体であることもある。そうした手順において、核酸サンプルは、プローブが関連する配列に対して特異的にハイブリッド形成をできるような条件下でプローブと接触する。プローブの関連する生物体からの核酸へのハイブリッド形成は、その後、上記に説明した任意の方法を使用して検出される。
核酸のハイブリッド形成反応では、特定レベルの厳密性を達成するために使用する条件は、ハイブリッド形成する核酸の性質に応じて異なる。例えば、核酸のハイブリッド形成領域の長さ、相補性の度合い、ヌクレオチド配列の組成 (GC と AT 含有量の比)、および核酸タイプ (RNA や DNA など) を、ハイブリッド形成の条件の選択において考慮できる。追加考慮事項は、核酸のどれかが、例えばフィルターなどに固定化されているかどうかである。
ハイブリッド形成は、低厳密性、中程度の厳密性、または高厳密性の条件下で遂行できる。核酸のハイブリッド形成の例としては、まず、固定化された変性した核酸を含む高分子膜を、0.9 M NaCl、50 mM NaH2PO4, pH 7.0、5.0 mM Na2EDTA、0.5% SDS、10X デンハート液、および 0.5 mg/ml ポリリボアデニル(polyriboadenylic) で構成される溶液内で45℃で 30 分間、プレハイブリダイズする。
次に、約2×107 cpm (比活性 4-9×108 cpm/ug) の 32P 末端ラベル付きのオリゴヌクレオチドプローブをその溶液に追加する。12〜16 時間培養した後で、この膜を、0.5% SDS を含む 1X SET (150 mM NaCl、20 mM トリスハイドロクロライド、pH 7.8、1 mM Na2EDTA) 内で、室温で 30 分間洗浄し、その後、オリゴヌクレオチドプローブについて、新しい 1X SET 内で、Tm-10℃にて30分間洗浄する。その後、膜を自動 X 線フィルムで感光し、ハイブリッド形成の信号を検出する。
【0051】
cDNA またはゲノムDNA など、検出可能なプローブに対してハイブリッド形成をする核酸の識別に使用するハイブリッド形成の条件の厳密性を変化させることで、プローブに対する異なったレベルの相同性を持つ核酸を識別・単離できる。
厳密性は、プローブの融解温度よりも低い異なる温度でハイブリッド形成を実施することにより変化しうる。融解温度 Tm は、目的の配列の 50% が完全に相補的なプローブに対してハイブリッド形成を起こす温度である (イオン強度および pH は定義済みとする)。特定のプローブについて、Tm に等しいか、それより約℃低い温度となるように、非常に厳密な条件が選択される。プローブの融解温度は、下記の公式を用いて計算することができる。
長さが 14〜70 ヌクレオチドの間のプローブについては、融解温度 (Tm) は、公 式 Tm=81.5+16.6 (log [Na+])+0.41(fraction G+C)-(600/N) を用いて計算し、この式で、N は、プローブの長さである。
ハイブリッド形成が、ホルムアミドを含む溶液内で実行される場合には、融解温度は、等式 Tm=81.5+16.6(log [Na+])+0.41(fraction G+C)-(0.63% ホルムアミド)-(600/N) を用いて計算でき、この式で N は、プローブの長さである。
プレハイブリダイゼーションは、6X SSC、5X デンハート試薬、0.5% SDS、100 μg 変性・細分化済みサケ精液 DNA、または 6X SSC、5X デンハート試薬、0.5% SDS、100 μg 変性・細分化済みサケ精液 DNA、50% ホルムアミド内で実施されうる。SSC およびデンハート液の製法については、前述の Sambrook 等にリストされている。
【0052】
ハイブリッド形成は、検出可能なプローブを、上記にリストしたプレハイブリダイゼーション溶液に追加することにより実施される。プローブが二本鎖 DNA から構成されている場合、ハイブリッド形成はハイブリッド形成溶液に追加する前に変性される。フィルターは、プローブが、cDNA または ゲノムDNA に相補的な、またはそれと相同的な配列を含むそれらの cDNA または ゲノムDNA に対してハイブリッド形成されるよう、十分な時間ハイブリッド形成溶液と接触される。長さが 200 ヌクレオチドを越えるプローブについては、ハイブリッド形成は、Tm よりも 15〜25℃低い温度で実行することもできる。オリゴヌクレオチドプローブなどの短めのプローブでは、ハイブリッド形成は、Tm より 5〜10℃低い温度で実施することもできる。一般に、6X SSC でのハイブリッド形成では、約68℃で実施される。普通、50% ホルムアミド含有の溶液でのハイブリッド形成は、約42℃で実施される。
上述のすべてのハイブリッド形成は、高い厳密性の条件下であるとみなされる。
ハイブリッド形成に続いて、フィルターが洗浄され、非特異的に結合された検出可能なプローブがあれば除去される。フィルターの洗浄に使用する厳密性も、ハイブリッド形成する核酸の性質、ハイブリッド形成する核酸の長さ、相補性の度合い、ヌクレオチド配列の組成 (GC と AT 含有量の比)、核酸タイプ (RNA や DNA など) に応じて、変化させることができる。厳密性の条件を徐々に高くした洗浄の例を挙げれば、2X SSC、0.1% SDS、室温で 15分間 (低厳密性)、0.1X SSC、0.5% SDS、室温で 30 分から 1 時間 (中程度の厳密性)、0.1X SSC、0.5% SDS、ハイブリッド形成温度と68℃の間の温度で 15〜30分間 (高い厳密性)、ならびに 0.15M NaCl、72℃で 15分間 (非常に高い厳密性) となる。最終的な低厳密性の洗浄は、0.1X SSC、室温で実施することができる。上記の例は、単にフィルターの洗浄に使用可能な1組の条件を例証しているに過ぎない。この技術分野の熟練者であれば、異なる厳密性の洗浄のための多数の手法を知っているはずである。その他いくつかの例を下記に挙げる。
【0053】
プローブに対してハイブリッド形成された核酸は、オートラジオグラフィまたはその他の従来的技術により識別される。
上記の手順を変化させて、プローブ配列に対する相同性レベルが減少している核酸を識別することもできる。例えば、検出可能なプローブに対して相同性が減少している核酸を獲得するには、あまり厳密ではない条件も使用される。例えば、約 1M の Na+ 濃度を持つハイブリッド形成バッファ内で、ハイブリッド形成温度を 5℃ 単位で、68℃ から 42℃ に下げることもできる。ハイブリッド形成に続いて、フィルターは、2X SSC、0.5% SDS、ハイブリッド形成の温度で洗浄することができる。これらの条件は、50℃ より高ければ「中程度の」条件、50℃ より低ければ「低い」条件と見なされる。「中程度の」ハイブリッド形成条件の特定の例としては、上記のハイブリッド形成が 55℃ で実施されるときである。「低厳密性」のハイブリッド形成条件の特定の例は、上記のハイブリッド形成が 45℃ で実施されるときである。
【0054】
別の方法として、ハイブリッド形成は、ホルムアミドを含有する 6X SSC などのバッファ内で 42℃ で遂行することもできる。この場合には、ハイブリッド形成バッファ内のホルムアミド濃度を、50% から 0% に 5% 単位で減少させて、プローブに対して相同性レベルが減少しているクローンの識別をすることができる。ハイブリッド形成に続いて、フィルターは、6X SSC、0.5% SDS で 50℃ で洗浄することができる。これらの条件は、ホルムアミドが 25% より多いとき「中程度の」条件、ホルムアミドが 25% より低いとき「低い」条件とみなされる。「中程度の」ハイブリッド形成条件の特定の例は、ハイブリッド形成がホルムアミド30% で実施されるときである。「低厳密性」ハイブリッド形成条件の特定の例は、ハイブリッド形成がホルムアミド10% で実施されるときである。
例えば、前述の方法を使用して、グループ A 核酸配列、およびそれと実質的に同一な配列のどれか 1 つの配列、またはその配列の少なくとも約 10、15、20、25、30、35、40、50、75、100、150、200、300、400、または 500 の連続塩基で構成される断片、およびそれに対して相補的な配列で構成されるグループから選択した核酸配列に対して、少なくとも約 97%、少なくとも 95%、少なくとも 90%、少なくとも 85%、少なくとも 80%、少なくとも 75%、少なくとも 70%、少なくとも 65%、少なくとも 60%、少なくとも 55%、または少なくとも 50% の相同性のある配列を持つような核酸の単離をすることができる。相同性は、アラインメントアルゴリズムを用いて測定できる。例えば、相同的なポリヌクレオチドには、本書で説明したコード配列のどれかの自然発生的な対立形質の変異体であるコード配列がある。グループ A 核酸配列、またはそれに対して相補的な配列の核酸と比較したとき、そうした対立形質の変異体には、1 つまたは複数のヌクレオチドの置換、欠失または追加があることもある。
さらに、上記の手順を使用して、グループ B アミノ酸配列、およびそれと実質的に同一な配列のうちどれか一つの配列、または配列アラインメントアルゴリズムを使用 (FASTA バージョン3.0t78 アルゴリズムをデフォルトのパラメータで使用するなど) して決定された、その配列の少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片を持つポリペプチドに対して、少なくとも約 99%、95%、少なくとも 90%、少なくとも 85%、少なくとも 80%、少なくとも 75%、少なくとも 70%、少なくとも 65%、少なくとも 60%、少なくとも 55%、または少なくとも 50% の相同性のあるポリペプチドを符号化する核酸を単離することもできる。
【0055】
本発明の別の面は、グループ A 核酸配列、およびそれと実質的に同一な配列のどれか 1 つの配列、またはその配列の少なくとも約 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸で構成される断片から構成される単離または精製されたポリペプチドである。上記に説明のとおり、このようなポリペプチドは、ポリペプチドを符号化する核酸をベクターに挿入して、コード配列が適した宿主細胞内で符号化されたポリペプチドの発現を駆動する能力のある配列に操作可能なようにリンクされるようにすることで、獲得することができる。例えば、発現ベクターは、プロモーター、翻訳開始のためのリボソーム結合部位、および転写ターミネーターで構成することができる。また、ベクターには、発現を増幅するための適切な配列を含めることもできる。
バクテリア内のポリペプチドまたはその断片の発現に適したプロモーターには、大腸菌 lac または trp プロモーター、lacI プロモーター、lacZ プロモーター、T3 プロモーター、T7 プロモーター、gpt プロモーター、lambda PR プロモーター、lambda PL プロモーター、3-ホスホグリセリン酸キナーゼ(PGK) などの糖分解酵素を符号化するオペロンからのプロモーター、および酸性ホスタファーゼプロモーターなどが含まれる。真菌性のプロモーターには、

因子プロモーターがある。真核生物のプロモーターには、CMV 前初期プロモーター、HSV チミジンキナーゼプロモーター、熱ショックプロモーター、初期および後期の SV40 プロモーター、レトロウィルスからの LTR、およびマウスのメタロチオネイン-I プロモーターなどが含まれる。原核生物または真核生物の細胞またはそれらのウィルスの遺伝子発現を制御することが知られているその他のプロモーターを使用することもできる。
哺乳類の発現ベクターは、複製起点、必要な任意のリボソーム結合部位、ポリアデニル化部位、スプライスの供与体および受容体部位、転写性末端配列、および 5' フランキング非転写配列で構成することもできる。一部の実施例において、SV40 スプライスおよびポリアデニル化部位から誘導した DNA 配列を使用して、必須の非転写遺伝因子を提供することもできる。
真核細胞内のポリペプチドまたはその断片を発現するためのベクターを、エンハンサーに含めて、発現レベルを向上させることもできる。エンハンサーは、DNA のシス作用性のエレメントで、通常、長さが約10〜約300 bp で、プロモーターに対して作用して転写を促進する。例としては、複製開始点 bp 100〜270 の後半にある SV40 エンハンサー、サイトメガロウィルスの初期プロモーターエンハンサー、複製開始点の後半にあるポリオーマエンハンサー、アデノウィルスエンハンサーなどがある。
【0056】
さらに、一般に、発現ベクターには、ベクターを含む宿主細胞の選択を許容するために、1 つまたは複数の選択可能なマーカー遺伝子が含まれている。このような選択マーカーには、真核細胞培養のためのジヒドロ葉酸レダクターゼを符号化する遺伝子またはネオマイシン耐性を与える遺伝子、大腸菌でテトラサイクリン耐性またはアンピシリン耐性を与える遺伝子、および出芽酵母菌 TRP1 遺伝子などがある。
発現ライブラリが生成されたら、細胞分類によるスクリーニングの前に、そのライブラリの「バイオパニング」をする手順を追加することができる。「バイオパニング」の手順とは、(i)少なくとも 1 つの微生物に由来する DNA から、特定の生物活性を有する生物製剤を符号化する DNA 配列の少なくとも一部分から成る少なくとも 1 つのプローブ DNA を使用して目標 DNA を選択的に分離し、さらに、(ii)任意で、特定の生物活性についてスクリーニングされたクローンライブラリが生成されるように、単離した目標 DNA を用いて宿主を形質転換することにより準備されたクローンライブラリ内で配列相同性についてスクリーニングすることにより、特定の生物活性を持つクローンを識別するプロセスのことである。
【0057】
少なくとも 1 つの微生物に由来する DNA から、所定の目標 DNA を選択的に単離するために使用するプローブ DNA としては、既知の活性のある酵素についての DNA の全コード領域配列またはコード領域配列の一部が考えられる。元の DNA ライブラリは、特定の酵素活性を持つ酵素を符号化する DNA 配列の少なくとも一部分から構成されるプローブの混合物を使用して調べることでき、そうすることが望ましい。これらのプローブまたはプローブ ライブラリは一本鎖であることが望ましく、また調べる微生物の DNA は、一本鎖の形態に転換されていることが望ましい。特に適切なプローブは、スクリーニングされる特定の酵素活性に類似した活性または同一の活性を有する酵素を符号化する DNA に由来するものである。
プローブ DNA は、少なくとも約 10 塩基であるべきで、少なくとも 15 塩基であることが望ましい。一つの実施例では、コード領域全体をプローブとして採用することもできる。少なくとも 1 つの DNA プローブを使用して目標 DNA が選択的に単離されるハイブリッド形成の条件は、少なくとも約 50% の配列同一性となるハイブリッド形成の厳密性が得られるように、さらに特定すれば、少なくとも約 70% の配列同一性が得られる厳密性となるように設計される。
核酸のハイブリッド形成反応では、特定レベルの厳密性を達成するために使用する条件は、ハイブリッド形成する核酸の性質に応じて異なる。例えば、核酸のハイブリッド形成領域の長さ、相補性の度合い、ヌクレオチド配列の組成 (GC と AT 含有量の比など)、および核酸タイプ (RNA や DNA など) を、ハイブリッド形成の条件の選択において考慮できる。追加考慮事項は、核酸のどれかが、例えばフィルターなどに固定化されているかどうかである。
厳密性の条件を徐々に高くした洗浄の例としては、2 x SSC/0.1% SDS、ほぼ室温 (ハイブリッド形成の条件)、0.2 x SSC/0.1 % SDS、ほぼ室温 (低厳密性の条件)、0.2 x SSC/0.1% SDS、約 42℃ (中程度の厳密性の条件)、0.1 x SSC、約 68℃ (高厳密性の条件) がある。洗浄では、これらの条件のどれか 1 つ (高厳密性の条件など) を用いて達成できるほか、リストされた手順の一部または全部を繰り返して、それぞれの条件を上記の順に使用する (各 10〜15 分ずつ使用するなど) こともできる。ただし、上記に言及したとおり、最適な条件は関連する特定のハイブリッド形成反応に応じて異なり、経験的に決定されうる。
【0058】
潜在的な目標 DNA を単離するために微生物の DNA ライブラリを調べるハイブリッド形成技術は、この技術分野ではよく知られているとともに、本書に記載した技術はどれも、特に、微生物に由来する DNA の残りの部分からの分離を容易にするための、直接または間接結合のいずれであるかによらず固相結合のプローブ DNA を使用した技術は、本書での使用に適するものである。
プローブ DNA は、標的をその源から分離しやすくするために、特異的な結合対の一方 (つまり、配位子) で「ラベル付け」され、対のうち他方は固体基質に結合されることが望ましい。配位子および特異的な結合相手は、いずれの向きででもよいが、(1) 抗原またはハプテンおよび抗体またはその特異的な結合断片、(2) ビオチンまたはイミノビオチンおよびアビジンまたはストレプトアビジン、(3) 糖およびそれ用の特定のレクチン、(4) 酵素およびそれ用の抑制因子、(5) アポ酵素および補助因子、(6) 相補的なホモポリマーのオリゴヌクレチド、ならびに (7) ホルモンおよびそれ用の受容体のうちから選択することができる。固相は、(1) ガラスまたは重合体表面、(2) 重合体ビーズの充填カラム、ならびに (3) 磁性または常磁性の粒子のうちから選択することが望ましい。
さらに、任意ではあるが、単離された目標 DNA の増幅を実施することが望ましい。この実施例において、目標 DNA は、単離の後でプローブ DNA から分離される。その後、宿主の形質転換に使用される前に、増幅される。少なくともその一部分として、予め決定された DNA 配列を含めるように選択された二本鎖 DNA は、増幅を前提とし一本鎖にしたり、また、リアニーリングを施して選択した二本鎖 DNA の数が増幅されるようにすることもできる。現在、この技術分野では、数多くの増幅方法がよく知られている。
【0059】
次に、選択した DNA は、適切な生物体の形質転換をすることにより、スクリーニング用のライブラリの準備に使用される。宿主、特に本書で望ましいと特定されたものが、そうした形質転換が助長される条件下で、接種により目標 DNA を含むベクターを人工的に導入することにより形質転換される。
次に、結果としてできる形質転換済みのクローンライブラリは、所定の酵素の活性を表示するクローンについてスクリーニングされる。
生物体から選択的に単離した DNA からのクローンの多重度を用意しながら、そのようなクローンが特定の酵素活性についてスクリーニングされ、特定の酵素の特性を有するクローンが識別される。
酵素活性についてのスクリーニングは、個別の発現クローンについて実施することも、初期的に発現クローンの混合物について実施して、その混合物に 1 つ以上の特定の酵素活性があるかどうかを確認することもできる。この混合物に特定の酵素活性がある場合には、そのような酵素活性またはより特定された活性について、FACS 装置を利用して、個別のクローンを再スクリーニングすることもできる。別の方法として、ゲル微小液滴などのカプセル化技術を採用して、クローン群内の陽性発現クローンについて FACS 装置でスクリーニングされる複数のクローンを単一の位置に局在化させた後、これを個別のクローンに分けて、FACS 装置でもう一度スクリーニングして個別の陽性クローンを識別することもできる。こうして、例えば、クローン混合物に加水分解酵素活性がある場合には、個別のクローンが回収され、FACS 装置を利用してスクリーニングされ、そのようなクローンのうちどれに加水分解酵素活性があるかが判断される。本書で使用するとき、「小規模な挿入ライブラリ」とは、最高約 5000 の塩基対から成る無作為で小規模な核酸挿入物のあるクローンが含まれる遺伝子ライブラリを意味する。本書で使用するとき、「大規模な挿入ライブラリ」とは、約 5000 から数十万以上の塩基対から成る無作為で大規模な核酸挿入物のあるクローンが含まれる遺伝子ライブラリを意味する。
【0060】
前述の面の 1 つに関して説明したとおり、本発明では、微生物に由来する選択した DNA を含むクローンの酵素活性スクリーニングのプロセスが提供されており、このプロセスには、特定の酵素活性についてライブラリをスクリーニングする手順 (そのライブラリには多数のクローンが含まれ、そのクローンは選択した DNA の微生物のゲノムDNA から回収して準備されたもので、この DNA は、特定の活性を有する酵素を符号化する DNA 配列全体またはその一部分である DNA 配列少なくとも 1 つに対してハイブリッド形成することで選択されたものである)、および特定の酵素活性についてスクリーニングされるクローンを生成するために、宿主を選択した DNA で形質転換する手順が含まれる。
一つの実施例において、微生物に由来する DNA ライブラリは、特定の酵素活性を有する酵素を符号化するDNA 配列全体またはその一部分である 1 つ以上のプローブ DNA 配列に対してハイブリッド形成する DNA を、そのライブラリから選択する選択手順の対象となるが、これは次の手順による。
(a) 二本鎖のゲノムDNA 集団を一本鎖の DNA 集団にする手順
(b) ハイブリッド形成が許容され、プローブの二本鎖複合体およびハイブリッド形成の対象となるゲノムDNA 集合の要素が生成されるような条件下で、(a) の一本鎖の DNA 集団を配位子に結合された DNA プローブと接触させる手順
(c) 固相複合体が生成されるように、(b) の二本鎖複合体をその配位子についての固相の特異結合相手と接触させる手順
(d) 固相複合体を (b) の一本鎖の DNA 集団から分離する手順
(e) 固相結合プローブに結合されたゲノム集団の要素をプローブから遊離させる手順
(f) (e) のゲノム集団の要素から二本鎖 DNA を形成する手順
(g) (f) の二本鎖 DNA を適切な宿主に導入し、選択した DNA を含めた多数のクローンが含まれるライブラリを形成する手順
(h) 特定の酵素活性についてライブラリをスクリーニングする手順
【0061】
別の面で、プロセスには、信号または分泌配列を含めた DNA を回収するために予め選択する手順が含まれる。この様に、本書上記に記載したとおり、ハイブリッド形成によって、ゲノムDNA 集団から信号または分泌配列が含まれる DNA のみを選択することが可能である。下記の項は、本発明のこの実施例についての手順、一般的な分泌信号配列の性質および機能、ならびにそのような配列を試験または選択プロセスに対して適用した特定の模範例を記載するものである。
この面での特定の実施例は、さらに上記の (a) の後、(b) の前に行う下記の手順から構成される。
(ai) ハイブリッド形成が許容され二本鎖複合体が形成される条件下で、(a) の一本鎖の DNA 集団を、所定の分類のタンパク質に対して固有の分泌信号配列に対して相補的な配位子結合のオリゴヌクレオチドプローブに接触させる手順
(aii) 固相複合体が生成されるように、(ai) の二本鎖複合体をその配位子についての固相の特異結合相手と接触させる手順
(aiii) 固相複合体を (a) の一本鎖の DNA 集団から分離する手順
(aiv) 固相結合プローブに結合されたゲノム集団の要素をプローブから遊離させる手順
(av) 固相結合プローブをそれが結合されているゲノム集団の要素から分離する手順
信号配列が含まれるように選択・単離した DNA は、この後、上述の選択手順の対象となり、特定の酵素活性を有する酵素を符号化する DNA から導出された 1 つまたは複数のプローブ DNA 配列に結合された DNA がそこから選択・単離される。
この手順については、1996 年 8 月 2 日出願の米国特許第 08/692,002 号に記載および例示があり、参照しここに組込む。
【0062】
生体内でのバイオパニングを、FACS ベースの装置を利用して実施することもできる。複雑な遺伝子ライブラリは、転写済み RNA を安定化させる要素が含まれるベクターで構成されている。例えば、RNA の転写領域をフランキングするよう設計されたヘアピンなどの二次構造となる配列を含めると、その安定性を向上させる役目を果たし、細胞内での半減期が延長する。バイオパニングプロセスで使用されるプローブ分子は、プローブを目標の分子に結合するときにのみ蛍光を発するようなレポーター分子でラベル付けされたオリゴヌクレオチドで構成されている。これらのプローブが、いくつかある形質転換方法のどれか 1 つを使用してライブラリからの組換え体細胞に導入される。プローブ分子は、転写済みの目標 mRNA に結合され、DNA/RNA ヘテロ二重鎖分子となっている。プローブを目標に結合することで、スクリーニングプロセス中に、FACS 装置により検出・分類される蛍光信号が発せられる。
一部の実施例において、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその配列の少なくとも約 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片を符号化する核酸は、翻訳されたポリペプチドまたはその断片の分泌を指示する能力のあるリーダー配列を用いて、適切な段階で集合される。任意に、核酸は、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその配列の少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片を、安定性の向上または精製の単純化といった希望の特性を与える N 末端識別ペプチドなどの非相同的ペプチドまたはポリペプチドと融合されたものである融合ポリペプチドに符号化できる。
【0063】
適切な DNA 配列を、様々な手順によって、ベクターに挿入することができる。一般に、DNA 配列は、適切な制限エンドヌクレアーゼを用いた挿入物およびベクターの消化の後で、ベクター内の希望の位置に結合される。別の方法として、挿入物およびベクターの両方にあるブラントエンドを結合することもできる。多様なクローニング技術が、Ausubel 等、Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997 および Sambrook 等、Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989) に開示されているが、その全体を参照により本書に組み込む。このような手順およびその他は、この技術分野の熟練者の視野内にあるとみなされる。
ベクターは、例えば、プラスミド、ウィルス粒子、またはファージの形態が考えられる。その他のベクターには、染色体性、非染色体性および合成の DNA 配列、SV40 の誘導体、細菌性のプラスミド、ファージ DNA、バキュロウィルス、酵母プラスミド、プラスミドおよびファージ DNA の組み合わせにより誘導されたベクター、ワクシニア、アデノウィルス、家禽ジフテリアウィルス、および仮性狂犬病などのウィルス性 DNA などがある。原生生物および真核生物の宿主ととも使用する多様なクローニングベクターおよび発現ベクターが、Sambrook 等、Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, N.Y., (1989) に説明されているが、その開示内容を参照により本書に組み込む。
使用できる特定の細菌性ベクターには、よく知られたクローニングベクターpBR322 (ATCC 37017)、pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden)、GEM1 (Promega Biotec, Madison, WI, USA)、pQE70、pQE60、pQE-9 (Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A (Stratagene)、ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5 (Pharmacia)、pKK232-8 および pCM7 などの遺伝因子から構成される市販のプラスミドがある。特定の真核生物ベクターには、pSV2CAT、pOG44、pXT1、pSG (Stratagene) pSVK3、pBPV、pMSG、および pSVL (Pharmacia) などがある。ただし、複製可能であり、宿主内で生存可能である限り、その他の任意のベクターを使用することもできる。
【0064】
宿主細胞としては、この技術分野の熟練者になじみのある任意の宿主細胞を使用できる。これには、原核細胞、真核細胞、哺乳類の細胞、昆虫の細胞、または植物細胞がある。適切な宿主の代表例としては、大腸菌、ストレプトマイセス、枯草菌、ネズミチフス菌などのバクテリアの細胞、およびシュードモナス属、ストレプトマイセス属、およびブドウ球菌属などに入る様々な種、酵母などの真菌細胞、ショウジョウバエ S2 および Spodoptera Sf9 などの昆虫の細胞、CHO、COS、または Bowes メラノーマなどの動物細胞、およびアデノウィルスなどが挙げられる。適切な宿主の選択は、この技術分野における熟練者の能力の範囲内である。
ベクターは、形質転換、トランスフェクション、形質導入、ウィルス感染、遺伝子銃、または Ti を媒介とした遺伝子導入などの多様な技術を使用して、宿主細胞に導入することができる。特定の方法としては、リン酸カルシウム形質移入、DEAE-Dextran 媒介のトランスフェクション、リポフェクション、またはエレクトロポーレーションなどがある (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986))。
適切な場合には、操作された人工宿主細胞を、プロモーターを活性化するために必要に応じて修飾された従来の培養液内で培養し、本発明の遺伝子の形質転換体または増幅を選択することもできる。適切な宿主菌株を形質転換し、宿主菌株が適切な細胞密度に成長した後、選択したプロモーターを、適切な手段で誘発し (温度変化または化学作用による誘発など)、希望のポリペプチドまたはその断片が精製されるように、期間を追加して細胞を培養することができる。
【0065】
一般に、細胞は、物理的または化学的な手段で分離させる遠心分離により収集され、結果としてできる粗製抽出物が、保持され、さらに精製される。タンパク質の発現に採用した微生物の細胞は、凍結融解サイクル、超音波処理、機構的な破壊、または細胞溶解剤の使用など、従来の任意の方法で分離させることができる。こうした方法は、この技術分野の熟練者によく知られている。発現されたポリペプチドまたはその断片は、硫酸アンモニウムまたはエタノール沈殿、酸抽出、陰イオンまたは陽イオン交換クロマトグラフィ、ホスホセルローズ クロマトグラフィ、疎水性相互作用クロマトグラフィ、アフィニティークロマトグラフィ、ヒドロキシルアパタイトクロマトグラフィ、およびレクチンクロマトグラフィなどを含めた方法により、組換え細胞培養液から回収・精製ができる。ポリペプチドの配置を完成するにあたり、必要に応じて、タンパク質の再折りたたみ手順を使用することもできる。希望に応じて、最終的な精製手順で、高速液体クロマトグラフィ (HPLC) を採用することができる。
各種の哺乳類の細胞培養システムを採用して組換えタンパク質を発現させることもできる。哺乳類の発現システムの例としては、サル腎臓の繊維芽細胞の COS-7 株 (Gluzman, Cell, 23: 175, 1981 で説明)、およびC127、3T3、CHO、HeLa および BHK 株細胞など、適合性のあるベクターからのタンパク質を発現可能なその他の株細胞がある。
宿主細胞内の構成物は、組換え配列により符号化された遺伝子生成物を生成するために、従来的な方法で使用できる。組換えの生成手順で採用した宿主に応じて、ベクターが含まれる宿主細胞により生成されたポリペプチドは、グリコシル化されたものでもグリコシル化されていないものでもよい。また、本発明のポリペプチドには、初期のメチオニンアミノ酸残基が含まれていても含まれていなくてもよい。
【0066】
別の方法として、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片は、従来的なペプチド合成装置により、合成的に生成することができる。その他の実施例において、ポリペプチドの断片または部分を、ペプチド合成により、対応する全ポリペプチドの生成に採用することもでき、したがって、断片を全ポリペプチド生成の媒介物として採用しうる。
セルフリー翻訳システムを採用し、ポリペプチドまたはその断片を符号化する核酸に操作可能なようにリンクされたプロモーターで構成される DNA 構成物から転写した mRNA を使用して、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片を生成することもできる。一部の実施例において、生体外での転写反応を実施する前に、DNA 構成物を線形化することもできる。その後、転写済みの mRNA は、ウサギの網状赤血球抽出物などの適切なセルフリー翻訳抽出液で培養され、希望のポリペプチドまたはその断片が生成される。
また、本発明は、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドの、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片の変異体に関するものである。「変異体」という用語には、これらのポリペプチドの誘導体または類似体も含まれる。特に、変異体は、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドとは、1 つまたは複数の置換、付加、欠失、融合、および切断 (任意の組み合わせで存在しうる) の分だけ、アミノ酸配列が異なる。
変異体には、自然発生的なものと、生体外で生成したものがある。特に、こうした変異体は、部位特異的突然変異誘発、無作為な化学的突然変異誘発、エキソヌクレアーゼIII 欠失手順、および標準的クローン技術などの遺伝子工学技術を用いて生成できる。別の方法として、このような変異体、断片、類似体、または誘導体は、化学合成または修飾などの手順を用いて生成することもできる。
【0067】
変異体を生成するその他の方法も、この技術分野の熟練者にとってなじみがある。これらには、天然の単離体から獲得される核酸配列を修飾して、産業または研究室の用途において、その値を改善する特性のあるポリペプチドを符号化する核酸を生成する手順が含まれる。そうした手順において、天然の単離体から獲得される配列について、1 つまたは複数のヌクレオチドの差異のある多数の変異体配列が生成され、特性が与えられる。一般に、これらのヌクレオチドの差異によって、天然の単離体からの核酸により符号化されたポリペプチドについてのアミノ酸変化が生じる。
例えば、変異体は、エラープローンPCR を用いて、生成することができる。エラープローンPCR では、PCR は DNA ポリメラーゼの複製忠実度が低い条件下で実施され、PCR 生成物の全長に沿って、高いレートの点突然変異が得られる。エラープローンPCR は、Leung, D. W. 等、Technique, 1:11-15, 1989 および Caldwell, R. C. & Joyce G. F., PCR Methods Applic., 2:28-33, 1992 で説明されており、その開示内容全文を参照により本書に組み込む。要は、このような手順において、PCR 生成物の全長に沿って高いレートの点突然変異を達成するために、突然変異誘発する核酸を、PCR プライマー、反応バッファ、MgCl2、MnCl2、Taq ポリメラーゼ、および適切な濃度の dNTP と混合する。例えば、この反応は、突然変異誘発する核酸 20 fM、各 PCR プライマー30 pM、反応バッファ (50 mM の KCl、10 mM の Tris HC1 (pH 8.3) および 0.01% のゼラチンで構成)、7 mM の MgCl2、0.5 mM の MnCl2、5 単位の Taq ポリメラーゼ、0.2 mM の dGTP、0.2 mM のdATP、1 mM の dCTP、ならびに 1 mM の dTTP を用いて実行することもできる。PCR は、30 サイクルを 94℃ で 1 分間、45℃ で 1 分間、および 72℃ で 1 分間実施することができる。ただし、必要に応じて、これらのパラメータは変化することが認識される。突然変異誘発済みの核酸は、適切なベクターにクローン化され、突然変異誘発済みの核酸により符号化されたポリペプチドの活性が評価される。
【0068】
変異体は、目的とする任意のクローン化 DNA において部位特異性の突然変異を生成するオリゴヌクレオチドを標的とした突然変異誘発を用いて生成することもできる。オリゴヌクレオチド突然変異誘発については、Reidhaar-Olson, J. F. & Sauer, R. T. 等、Science, 241:53-57, 1988 に説明があり、その開示内容全体を参照により本書に組み込む。要するに、そのような手順において、クローン化 DNA に導入される 1 つまたは複数の突然変異を生じさせる多数の二本鎖オリゴヌクレオチドが合成されて、突然変異誘発するクローン化 DNA に挿入される。突然変異誘発済みの DNA を含むクローンが回収され、それによって符号化されたポリペプチドの活性が評価される。
変異体を生成する別の方法は、アセンブリ PCR である。アセンブリ PCR には、小規模な DNA 断片の混合物からの PCR 生成物の集合が関連する。多数の異なった PCR 反応が、同一のバイアル内で並行して起こり、1 つの反応生成物が、別の反応生成物の初回刺激となっている。アセンブリ PCR は、1996 年 7 月 9 日出願の米国特許第 5,965,408 号、題名「Method of DNA Reassembly by Interrupting Synthesis (断続合成による DNA 再集合の方法)」に説明があり、その開示内容全体を参照により本書に組み込む。
【0069】
変異体を生成するまた別の方法は、有性 PCR 突然変異誘発である。有性 PCR 突然変異誘発では、強制相同的組換えが、異なっているが関連性の高い DNA 配列の DNA 分子間において生体外で発生し、配列の相同性に基づく DNA 分子の無作為な断片化の結果、続いて、PCR 反応におけるプライマー伸長により、クロスオーバーの固定化が起こる。有性 PCR 突然変異誘発については、Stemmer, W. P., PNAS, USA, 91:10747-10751, 1994 に説明があり、その開示内容を参照により本書に組み込む。要は、その手順では、組み換えられる多数の核酸が DNAse により消化され、平均サイズ 50〜200 ヌクレオチドを持つ断片が生成される。
希望の平均サイズの断片は精製されて、PCR 混合液内で再懸濁される。PCR は、核酸断片間での組換えが促進されるような条件下で実施される。例えば、PCR は、精製した断片を、0.2 mM の各 dNTP、2.2 mM の MgCl2、50 mM の KCl、10 mM の Tris-HCl、pH 9.0、および 0.1% のトリトンX-100 の溶液内に、10〜30 ng/:l の濃度で再懸濁させることで実施することもできる。反応混合物100:l 当り 2.5 単位の Taq ポリメラーゼを追加し、PCR は、次の方式で実施される。すなわち、94℃ で 60 秒間、94℃ で 30 秒間、50〜55℃ で 30 秒間、72℃ で 30 秒間 (30〜45 回) および 72℃ で 5 分間である。ただし、必要に応じて、これらのパラメータは変化することが認識される。一部の実施例において、オリゴヌクレオチドを PCR 反応に含めることができる。その他の実施例において、DNA ポリメラーゼI の Klenow 断片を初回の PCR 反応で使用することもでき、また Taq ポリメラーゼを、その後の回の PCR 反応で使用することもできる。組換え配列は単離されて、それにより符号化されたポリペプチドの活性が評価される。
変異体は、生体内での突然変異誘発により生成することもできる。一部の実施例において、1 つまたは複数の DNA 修復経路での突然変異を保有している大腸菌菌株などの細菌性の菌株内で、所定の配列を増殖させることで、所定の配列内での無作為の突然変異が起こる。このような「ミューテーター」株では、野生型の親の菌株よりも無作為な突然変異レートが高くなっている。これらの菌株の 1 つでの DNA の増殖により、最終的に、DNA 内で無作為な突然変異が発生する。
生体内での突然変異誘発での使用に適したミューテーター株については、1991 年 10 月 31 日公開の PCT 公報第 WO 91/16427 号、題名「Methods for Phenotype Creation from Multiple Gene Populations (複数の遺伝子母集団からの表現型生成の方法)」に説明があり、その開示内容全体を参照により本書に組み込む。
【0070】
変異体は、カセット式突然変異誘発を使用して生成することもできる。カセット式突然変異誘発では、二本鎖 DNA 分子の小規模な領域が、天然の配列と異なる合成オリゴヌクレオチド「カセット」で置換される。オリゴヌクレオチドには、完全に、または部分的に無作為化された天然の配列 (あるいはその両方) が含まれていることが頻繁にある。
連続的全体突然変異誘発を、変異体の生成に使用することもできる。連続的全体突然変異誘発は、タンパク質工学 (タンパク質突然変異誘発) 用のアルゴリズムで、表現型的に関連性のある突然変異体の多様な母集団 (その要素はアミノ酸配列に違いがある) を生成するために開発されたものである。この方法では、組み合わせカセット式突然変異誘発の連続的なラウンドを制御するために、フィードバック機構が使用される。連続的全体突然変異誘発は、Arkin, A. P. および Youvan, D. C., PNAS, USA, 89:7811-7815, 1992 に説明されており、その開示内容全体を参照により本書に組み込む。
一部の実施例において、変異体は、指数関数的な全体的突然変異誘発を使用して生成される。指数関数的な全体的突然変異誘発は、独特および機能的な突然変異体の割合の高い組み合わせライブラリを生成するプロセスの 1 つであり、ここで、並行して、小規模のグループの残基が無作為化され、変化のあるそれぞれの位置で、機能性タンパクをもたらすアミノ酸が識別される。指数関数的な全体的突然変異誘発については、Delegrave, S. および Youvan, D. C., Biotechnology Research, 11:1548-1552, 1993 に説明があり、その開示内容全体を参照により本書に組み込む。無作為および部位特異的突然変異誘発については、Arnold, F. H., Current Opinion in Biotechnology, 4:450-455, 1993 に説明があり、その開示内容全体を参照により本書に組み込む。
一部の実施例において、変異体は、シャフリング手順を使用して生成され、ここで明確なポリペプチドを符号化する多数の核酸の一部分がまとめて融合され、キメラポリペプチドを符号化するキメラ核酸配列が生成される。これについては、1996 年 7 月 9 日出願の米国特許第 5,965,408 号、題名「Method of DNA Reassembly by Interrupting Synthesis (断続合成による DNA 再集合の方法)」および 1996 年 5 月 22 日出願の米国特許第 5,939,250 号、題名「Production of Enzymes Having Desired Activities by Mutagenesis (突然変異誘発による希望の活性を有する酵素の生成)」に説明されているとおりで、この両方を参照により本書に組み込む。
【0071】
グループ B アミノ酸配列のポリペプチドの変異体は、グループ B アミノ酸配列のポリペプチドの 1 つまたは複数のアミノ酸残基が、同類または非同類のアミノ酸残基 (同類アミノ酸残基が望ましい) と置き換えられるが、その置き換えられたアミノ酸残基は、遺伝暗号により符号化された変異体でも符号化されていない変異体でもよい。
同類置換とは、類似した特性の別のアミノ酸により、ポリペプチド内の所定のアミノ酸を置き換えることである。一般に、同類置換とみられるのは、以下の置換である。すなわち、アラニン、バリン、ロイシン、およびイソロイシンなどの脂肪族アミノ酸を他の脂肪族アミノ酸と置き換える、セリンをスレオニンと置換、またはその逆に置き換える、アスパラギン酸やグルタミン酸などの酸性残基を別の酸性残基と置き換える、アスパラギンやグルタミンなどのアミド基のある残基をアミド基のある別の残基と置き換える、リジンやアルギニンなどの塩基性残基を他の塩基性残基と交換する、ならびにフェニルアラニンやチロシンなどの芳香族残基を他の芳香族残基と置き換える置換などがある。
その他の変異体は、グループ B アミノ酸配列のポリペプチドの 1 つまたは複数のアミノ酸残基に置換基が含まれるものである。
また、その他の変異体は、ポリペプチドが、ポリペプチドの半減期を延長する化合物 (ポリエチレングリコールなど) などの別の化合物と関連しているものである。
その他の変異体は、別のアミノ酸が、リーダー配列、分泌性の配列、プロタンパク質配列、もしくはポリペプチドの精製、濃縮、または安定化を促進する配列などのポリペプチドに融合されたものである。
一部の実施例において、断片、誘導体、および類似体では、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドと同一の生物学的機能または活性が保持される。その他の実施例において、断片、誘導体、または類似体には、プロタンパク質が含まれ、プロタンパク質部分の切断により、断片、誘導体、類似体が活性化され、活性ポリペプチドが生成される。
【0072】
本発明の別の面は、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片に対して、少なくとも約 50%、少なくとも約 55%、少なくとも約 60%、少なくとも約 65%、少なくとも約 70%、少なくとも約 75%、少なくとも約 80%、少なくとも約 85%、少なくとも約 90%、少なくとも約 95%、または約 95% をこえる相同性のあるポリペプチドまたはその断片である。相同性は、比較するポリペプチドまたは断片を揃えて、相互間のアミノ酸の同一性または類似性の範囲を決定する上記に説明のプログラムのいずれかを使用して決定することができる。アミノ酸の「相同性」には、上記に説明したものなどの同類アミノ酸置換が含まれることが認識される。
グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその少なくとも約 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片に対する相同性のあるポリペプチドまたは断片は、それを符号化する核酸を、上記に説明の技術を使用して単離することにより獲得することができる。
別の方法として、相同的なポリペプチドまたは断片は、生化学的な濃縮または精製手順により獲得することができる。潜在的に相同的なポリペプチドまたは断片の配列は、タンパク質分解の消化、ゲル電気泳動、およびミクロシークエンシング、あるいはそのいずれかにより決定できる。相同的である見込みのあるポリペプチドまたは断片の配列は、上記に説明したプログラムのいずれかを使用して、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその少なくとも約 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片と比較される。
【0073】
本発明の別の面は、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドの酵素機能を保持するような、グループ B アミノ酸配列、およびそれと実質的に同一な配列の断片または変異体を識別するための検定法である。例えば、このポリペプチドの断片または変異体を、断片または変異体がグループ B アミノ酸配列にあるポリペプチドの酵素活性を保持していることを示すための生化学反応の触媒として使用することができる。
断片または変異体がグループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドの酵素活性を保持しているかどうかを判断する検定法には、ポリペプチドの断片または変異体が機能できるような条件下で、ポリペプチドの断片または変異体を基質分子と接触させる手順、およびポリペプチドと基質との間の反応による基質レベルの低下または特異反応生成物の増加のいずれかを検出する手順が含まれる。
グループ B アミノ酸配列、およびそれに実質的に同一の配列のポリペプチド、あるいは少なくとも5、10、15、20、25、30、35、40、50、75、100 あるいは 150 の連続するアミノ酸を含むその断片が、多様な用途で使用される。例えば、ポリペプチドあるいはその断片は、生体触媒反応を起こすために使用される。本発明の一面に従い、グループ B アミノ酸配列、およびそれと実質的に同一の配列のポリペプチド、あるいはグリコシド結合を加水分解するために上記のポリペプチドを符号化するポリヌクレオチドを使用するプロセスが提供される。そのような手順においては、グリコシド結合 (例:でんぷん) を含む物質と、グループ B アミノ酸配列、あるいはそれと実質的に同一な配列のポリペプチドの一つが、グリコシド結合の加水分解を促すような状況下で接触される。
グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片を、ポリペプチドまたは断片に特異的に結合する抗体の生成に使用することもできる。結果としての抗体は、アフィニティークロマトグラフィ手順に使用して、ポリペプチドの単離または精製をしたり、ポリペプチドが生体サンプル内に存在しているかどうかを確認することができる。そうした手順において、抽出液などのタンパク質製剤、または生体サンプルを、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片と、特異的に結合する能力のある抗体と接触させる。
【0074】
免疫親和性の手順では、抗体をビーズまたはその他のカラムマトリクスなどの固体担体に付着させる。タンパク質製剤は、抗体がグループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドのどれか 1 つ、またはその断片と特異的に結合するような条件下で、抗体と接触するように配置される。非特異的に結合したタンパク質を除去するために洗浄した後、特異的に結合したポリペプチドが溶出される。
生体サンプルのタンパク質が抗体と結合する能力は、この技術分野の熟練者になじみのある様々な手順のいずれかを使用して決定することができる。例えば、結合は、蛍光剤、酵素ラベル、または放射性同位元素などの検出可能なラベルで抗体にラベル付けすることで決定できる。別の方法として、抗体のサンプルへの結合は、そのような検出可能なラベルを付けた二次的な抗体を使用して検出することもできる。特定の検定法には、ELISA 試験法、サンドイッチアッセイ、放射免疫アッセイ、ウエスタンブロット法などがある。
グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片に対するものとして精製された多クローン性抗体は、動物に直接注入することで、またはポリペプチドを例えば非ヒトの動物に投与することで獲得できる。そうして獲得された抗体は、次に、ポリペプチド自体に結合される。この様に、ポリペプチドの断片のみを符号化する配列でさえも、完全に天然のポリペプチドとの結合が可能な抗体の生成に使用できる。こうした抗体は、次に、ポリペプチドを発現する細胞からポリペプチドを単離するために使用される。
【0075】
単クローン抗体の準備については、連続株細胞培養により生成される抗体を提供する任意の技術を使用できる。この例としては、ハイブリドーマ法 (Kohler および Milstein, Nature, 256:495-497, 1975、その開示内容を参照により本書に組み込む)、トリオーマ技術、ヒトB-細胞 ハイブリドーマ法 (Kozbor 等、Immunology Today 4:72, 1983、その開示内容を参照により本書に組み込む)、および EBV-ハイブリドーマ法 (Cole 等、1985, Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96、その開示内容を参照により本書に組み込む) がある。
一本鎖の抗体の生成用に説明されている技術 (米国特許第 4,946,778 号、その開示内容を参照により本書に組み込む) を採用して、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片に対する一本鎖抗体を生成することができる。別の方法として、遺伝子導入マウスを使用し、ポリペプチドまたはその断片に対してヒト化抗体を発現させることもできる。
グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド、またはその少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される断片に対するものとして生成した抗体は、その他の生物体およびサンプルからの類似したポリペプチドのスクリーニングに使用することができる。そうした技法において、生物体からのポリペプチドが、抗体と接触し、抗体に特異的に結合するポリペプチドが検出される。上記に説明したどの方法でも結合している抗体の検出に使用できる。このようなスクリーニング法の 1 つが、「Methods for Measuring Cellulase Activities (セルラーセ活性の測定方法)」Methods in Enzymology, Vol 160, pp. 87-116 に説明があり、その全文を参照により本書に組み込む。
【0076】
本書で使用するとき、「SEQ ID NO(配列番号): 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45 および 47に示した核酸配列」という用語には、グループ A 核酸配列、およびそれと実質的に同一な配列のヌクレオチド配列だけでなく、グループ A 核酸配列に相同的な配列、およびその断片、および前記のすべての配列に対して相補的な配列なども含まれる。
断片には、グループ A 核酸配列、およびそれと実質的に同一な配列の少なくとも 10、15、20、25、30、35、40、50、75、100、150、200、300、400、または 500 の連続ヌクレオチドから構成される SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45 および 47の一部分が含まれる。グループ A 核酸配列、およびそれと実質的に同一な配列の相同配列および断片とは、それらの配列に対して、少なくとも 99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55% または 50% の相同性のある配列の意味である。相同性は、FASTA バージョン3.0t78 をデフォルトのパラメータで使用するなど、本書で説明した任意のコンピュータプログラムおよびパラメータを使用して決定することができる。相同配列には、グループ A 核酸配列で示した核酸配列内のチミンがウリジンで置き換えられた RNA 配列も含まれる。相同配列は、本書で説明した任意の手順を使用して、または配列ミスを修正した結果としても獲得しうる。グループ A 核酸配列で示した核酸配列、およびそれと実質的に同一な配列は、従来の 1 文字形式 (Stryer, Lubert. Biochemistry, 3rd Ed., W. H. Freeman & Co., New York の裏表紙内側を参照) で、または配列内のヌクレオチドの同一性を記録するその他の任意の形式で表現可能であることが認識される。
本書で使用するとき、「SEQ ID NO: 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、44、46 および 48に示したポリペプチド配列」という用語には、SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45 および 47 に示した配列により符号化された、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチド配列、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドに対して相同的なポリペプチド配列、もしくはその前記のあらゆる配列の断片が含まれる。相同的ポリペプチド配列とは、グループ B アミノ酸配列のポリペプチドのどれか 1 つの配列に対して、少なくとも 99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55% または 50% の相同性を持つポリペプチド配列の意味である。相同性は、FASTA バージョン3.0t78 をデフォルトのパラメータで、またはパラメータを修正して使用するなど、本書で説明した任意のコンピュータプログラムおよびパラメータを使用して決定することができる。相同配列は、本書で説明した任意の手順を使用して、または配列ミスを修正した結果としても獲得しうる。ポリペプチド断片は、グループ B アミノ酸配列、およびそれと実質的に同一な配列のポリペプチドの、少なくとも 5、10、15、20、25、30、35、40、50、75、100、または 150 の連続アミノ酸から構成される。グループ B アミノ酸配列に示したポリペプチドコード、およびそれと実質的に同一な配列は、従来の 1 文字形式 (Stryer, Lubert. Biochemistry, 3rd Ed., W. H. Freeman & Co., New York の裏表紙内側を参照) で、または配列内のポリペプチドの同一性に関連するその他の任意の形式で表現可能であることが認識される。
この技術分野の熟練者により、SEQ ID NO: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、43、45 および 47 に示した核酸配列、および SEQ ID NO: 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、44、46 および 48 に示したポリペプチド配列は、コンピュータにより読み取りおよびアクセスが可能な任意の媒体上での保存、記録、および操作が可能であることが認識される。本書で使用するとき、「記録」および「保存」という用語は、コンピュータ媒体に情報を保存するプロセスを意味する。
熟練者であれば、コンピュータ読み取り可能媒体に情報を記録するために、現時点で既知の任意の方法を容易に採用でき、グループ A 核酸配列に示した核酸配列、およびそれと実質的に同一な配列のうち1 つまたは複数の配列、グループ B アミノ酸配列に示したポリペプチド配列、およびそれと実質的に同一な配列のうち 1 つまたは複数の配列で構成される物質を生成できる。本発明の別の面は、グループ A 核酸配列に示した核酸配列、およびそれと実質的に同一な配列のうち、少なくとも 2、5、10、15、または 20 の核酸配列が記録されるコンピュータ読み取り可能媒体である。
【0077】
本発明の別の面は、グループ A 核酸配列に示した 1 つまたは複数の核酸配列、およびそれと実質的に同一な配列を記録したコンピュータ読み取り可能媒体である。本発明の別の面は、グループ B 核酸配列に示した 1 つまたは複数の核酸配列、およびそれに実質的に同一な配列を記録した、コンピュータ読み取り可能媒体である。本発明の別の面は、上記の配列のうち、少なくとも、2、5、10、15、あるいは 20 を記録した、コンピュータ読み取り可能媒体である。
コンピュータ読み取り可能媒体には、磁気的に読み取り可能な媒体、光学的に読み取り可能な媒体、電子的に読み取り可能な媒体、および磁気/光学媒体が含まれる。例えば、コンピュータ読み取り可能媒体には、ハードディスク、フロッピィディスク、磁気テープ、CD-ROM、デジタル多用途ディスク (DVD)、ランダムアクセスメモリ (RAM) あるいは読み取り用メモリ (ROM) のほか、熟練者に知られているその他のタイプの媒体がある。
本発明の実施例には、システム(例:インターネットベースのシステム)、特に、本書で述べられている配列情報を保存および操作するコンピュータシステムが含まれる。コンピュータシステム100 の一例が、図 1 のブロック図の形で図示されている。本書で使用するとき、「コンピュータシステム」は、グループ A 核酸配列で示した核酸配列のヌクレオチド配列、およびそれに実質的に同一な配列、あるいはグループ B アミノ酸配列で示したポリペプチドを分析するために使用されるハードウェア装置、ソフトウェア装置およびデータ記憶装置を指す。
コンピュータシステム100 には、通常、配列データを処理、アクセスおよび操作するためのプロセッサが含まれる。プロセッサ 105 は、例えば Intel 社のPentium(登録商標) III、あるいは Sun、Motorola、Compaq、AMD あるいは International Business Machine (IBM) 製の類似製品など、よく知られたタイプの中央演算処理装置 (CPU) でありうる。
通常、コンピュータシステム100 は、プロセッサ 105 と、データ保管用の 1 つまたは複数の内部データ記憶装置 110、およびデータ記憶装置に格納されたデータを検索するための1 つまたは複数の検索装置から成る、通常目的のシステムである。熟練者であれば、現在利用可能な任意のシステムが適していることを簡単に認識できる。
【0078】
特に一つの実施例において、コンピュータシステム100 は、バスに接続されたプロセッサ 105 を含み、このバスはメインメモリ 115 (望ましくは RAM として実行される) およびハードドライブおよびデータが記録されたコンピュータ読み取り可能媒体 (あるいはそのいずれか) などの 1 つまたは複数の内部データ記憶装置 110 に接続されている。数種の実施例においては、コンピュータシステム100 はさらに、内部データ記憶装置 110 に記憶されたデータを読み取るための 1 つまたは複数のデータ検索装置 118 を含む。
データ検索装置 118 は、例えばフロッピー(登録商標)ディスク装置、コンパクトディスク装置、磁気テープ装置、あるいは遠隔データ記憶システム(例:インターネット経由) に接続可能なモデムなどに相当する場合もある。数種の実施例において、内部データ記憶装置 110 は、フロッピー(登録商標)ディスク、コンパクトディスク、磁気テープといった制御ロジックおよび記録データ(あるいはそのいずれか) を含む取り外し可能なコンピュータ読み取り可能媒体である。コンピュータシステム100 は、データ検索装置に挿入された場合に、制御ロジックおよびデータ記憶装置からのデータ(あるいはそのいずれか) を読み取るための適切なソフトウェアを利点として含む、あるいは上記ソフトウェアによってプログラムされる。
コンピュータシステム100 は、コンピュータ使用者に結果を表示するために使用されるディスプレイ 120 を含む。また、コンピュータシステム100 は、コンピュータシステム100 に中央化されたアクセスを提供するために、ネットワークあるいは広域ネットワーク (WAN) 内にある他のコンピュータシステム125a-c にリンクできる点にも留意するべきである。
グループ A 核酸配列、およびそれと実質的に同一な配列で示した核酸配列のヌクレオチド配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一な配列で示したポリペプチド配列にアクセス・処理するためのソフトウェア(検索ツール、比較ツールおよびモデル化ツールなど) は、プログラム実行中はメインメモリ 115 に設置される。
【0079】
数種の実施例において、コンピュータシステム100 はさらに、コンピュータ読み取り可能媒体に保管された、グループ A 核酸配列、およびそれに実質的に同一な配列に示した核酸配列、あるいはグループ B アミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列を、コンピュータ読み取り可能媒体に保管された基準ヌクレオチドあるいはポリペプチド配列と比較するための、配列比較アルゴリズムから構成される。「配列比較アルゴリズム」は、ヌクレオチド配列を、データ記憶装置内に保管された他のヌクレオチド配列および化合物 (あるいはそのいずれか) と比較するためにコンピュータシステム100 上で (ローカルあるいは遠隔的に) 実行される1 つまたは複数のプログラムを指す。例えば、配列比較アルゴリズムは、コンピュータ読み取り可能媒体に保管された、グループ A 核酸配列、およびそれに実質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列のヌクレオチド配列を、コンピュータ読み取り可能媒体に保管された基準配列と比較して相同性あるいは構造モチーフを特定する。この特許仕様書のその他の部分で特定される多様な配列比較プログラムは、特に本発明のこの面での使用を想定したものである。タンパク質および核酸配列 (あるいはそのいずれか) の相同性は、その技術分野で知られている多様な配列比較アルゴリズムおよびプログラムの 1 つを使用して評価される。そのようなアルゴリズムおよびプログラムには下記が含まれるが、これに限定されない:TBLASTN、BLASTP、FASTA、TFASTA および CLUSTALW (Pearson および Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988; Altschul 等、J. Mol. Biol. 215(3):403-410, 1990、Thompson 等、Nucleic Acids Res. 22(2):4673-4680, 1994、Higgins 等、Methzods Enzymol. 266:383-402, 1996、Altschul 等、J. Mol. Biol. 215(3):403-410, 1990; Altschul 等、Nature Genetics 3:266-272, 1993)。
相同性あるいは同一性は、配列分析ソフトウェア(例:Genetics Computer Group 社の Sequence Analysis Software Package、University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705) を使用して測定されることがよくある。そのようなソフトウェアは、多種の欠失、置換および修飾に相同性の程度を割り当てることで類似した配列と適合させる。2 つ以上の核酸あるいはポリペプチド配列が使用される文脈において「相同性」および「同一性」という単語は、任意の数の配列比較アルゴリズムあるいは手動アルゴリズムおよび目視検査により測定したとき、比較ウィンドウあるいは対応が最大になるように比較・アラインメントした場合に、同一または特定の割合のアミノ酸残基あるいは核酸を持つ、2 つ以上の配列または部分列を指す。
【0080】
配列比較上、通常、1 つの配列が基準配列としての役割を持ち、テスト配列がこの配列と比較される。配列比較アルゴリズムを使用する際は、テストおよび基準配列がコンピュータ入力され、必要な場合は部分列座標が指定され、必要な場合は配列アルゴリズムプログラムパラメータが指定される。デフォルトのプログラムパラメータまたは代わりのパラメータが指定されうる。それから配列比較アルゴリズムは、プログラムパラメータに基づき基準配列と比較してテスト配列の配列同一性のパーセントを計算する。
本書で使用する「比較ウィンドウ」とは、20〜600、通常は約 50〜約200まで、さらに通常なものとしては約100〜150までから成るグループから選択された近接位置にある任意の 1 つのセグメントの数を指し、その中で配列は、近接位置と同じ数の基準配列と最適にアラインメントされた後、その基準配列と比較される。比較のための配列アラインメントの方法は、その分野で広く知られている。
比較のための配列の最適なアラインメントは、例えば、Smith & Waterman, Adv. APPL. Math. 2:482, 1981 の局所相同性アルゴリズム、Needleman & Wunsch, J. Mol. Biol. 48:443, 1970 の相同性アラインメントアルゴリズム、Person [sic] & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444, 1988 の類似方法の検索、これらアルゴリズムのコンピュータによる実施 (Genetics Computer Group 社の Wisconsin Genetics Software Package にある GAP、BESTFIT、FASTA および TFASTA、575 Science Dr., Madison, WI)、あるいは手動アラインメントおよび目視検査によって実行される。相同性あるいは同一性を決定するその他のアルゴリズムには、例えば BLAST プログラム(National Center for Biological Information の Basic Local Alignment Search Tool) に加えて、ALIGN、AMAS (Analysis of Multiply Aligned Sequences)、AMPS (Protein Multiple Sequence Alignment)、ASSET (Aligned Segment Statistical Evaluation Tool)、BANDS、BESTSCOR、BIOSCAN (Biological Sequence Comparative Analysis Node)、BLIMPS (BLocks IMProved Searcher)、FASTA、Intervals & Points、BMB、CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman アルゴリズム、DARWIN、Las Vegas アルゴリズム、FNAT (Forced Nucleotide Alignment Tool)、Framealign, Framesearch、DYNAMIC、FILTER, FSAP (Fristensky Sequence Analysis Package)、GAP (Global Alignment Program)、GENAL、GIBBS、GenQuest、ISSC (Sensitive Sequence Comparison)、LALIGN (Local Sequence Alignment)、LCP (Local Content Program)、MACAW (Multiple Alignment Construction & Analysis Workbench)、MAP (Multiple Alignment Program)、MBLKP、MBLKN、PIMA (Pattern-Induced Multi-sequence Alignment)、SAGA (Sequence Alignment by Genetic Algorithm) および WHAT-IF などが含まれる。そのようなアラインメントプログラムはまた、実質的に同一な配列のポリヌクレオチド配列を特定するためのゲノムデータベースのスクリーニングにも使用される。数多くのゲノムデータベースが利用でき、例えば、ヒトゲノムの大部分は、Human Genome Sequencing Project (J. Roach, http://weber.u.Washington.edu/~roach/human_genome_ progress2.html) (Gibbs, 1995) の一部として利用できる。例えば、M. genitalium (Fraser 等、1995)、M. jannaschii (Bult 等、1996)、H. influenzae (Fleischmann 等、1995)、大腸菌 (Blattner 等、1997) および酵母 (S. cerevisiae) (Mewes 等、1997) および D. melanogaster (Adams 等、2000) などを含む少なくとも 21 種の他のゲノムもすでに配列解明されている。ねずみ、線虫およびアラビドプシス(Arabidopsis) sp など、モデルアルゴリズムのゲノム配列解明の過程でも大きな進歩があった。機能的情報についての注釈付きゲノム情報を含む数種のデータべースは、異なる組織によって保持されており、例えば、http://wwwtigr.org/tdb; http://www.genetics.wisc.edu、http://genome-www.stanford.edu/~ball、http://hiv-web.lanl.gov、http://www.ncbi.nlm.nih.gov、http://www.ebi.ac. uk、http://Pasteur.fr/other/biology および http://www.genome.wi.mit.edu などインターネット経由でアクセスすることができる。
【0081】
有用なアルゴリズムの一例として BLAST および BLAST 2.0 アルゴリズムがあり、それぞれ Altschul 等、Nuc. Acids Res. 25:3389-3402, 1977 および Altschul 等、J. Mol, Biol. 215:403-410, 1990 で説明されている。BLAST 分析を実行するためのソフトウェアは、National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/) を通じて公に利用できる。このアルゴリズムでは、クエリ配列において長さ W の短い単語を特定してまず高スコア配列ペア(HSP) を特定し、この単語は、データベース配列にある同じ長さの単語とアラインメントされたときに、任意の+のしきい値スコアT と一致またはこれを満たす。T は、周辺単語スコアしきい値 (Altschul 等、前掲) と呼ばれている。
これらの当初の周辺単語適合は、この単語適合を含むより長い HSP を見つけるための検索を開始するにあたり種となる役割を持っている。単語適合は、累積アラインメントスコアが増加する限り、各配列に沿って両方向に拡張される。
累積スコアは、ヌクレオチド配列ではパラメータM (一致する残基の組み合わせには報酬スコア、常に>0) を用いて計算される。アミノ酸配列では、スコアリングマトリックスが累積スコアの計算に使用される。各方向への単語適合の拡張は、下記の場合に停止する:累積アラインメントスコアが最大達成数値から数量 X 分だけ減少した場合、1 つまたは複数のマイナススコアの残基アラインメントが累積したために累積スコアがゼロ以下になった場合、あるいはいずれかの配列の最終点に到達した場合。BLAST アルゴリズムパラメータW、T および X は、アラインメントの感度と速度を決定する。BLASTN プログラム(ヌクレオチド配列用) は、デフォルトとして単語の長さ (W) 11、期待値 (E) 10、M=5、N=-4および両鎖の比較を使用する。アミノ酸配列の場合、BLASTP プログラムは、デフォルトとして、単語の長さ(W) 3、期待値 (E) 10、および BLOSUM62 スコアリングマトリックス(Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989 を参照) アラインメント(B) 50、期待値 (E) 10、M=5、N=-4および両鎖の比較を使用する。
BLAST アルゴリズムはまた、2 つの配列間の類似性に関する統計分析も実行する (例:Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993 を参照)。BLAST アルゴリズムが提供する類似性の一つの測定方法は、2 つのヌクレオチドあるいはアミノ酸配列間の一致が偶然起きる可能性を示唆する、最小合計確率 (P (N)) である。例えば、テスト核酸と基準核酸の比較における最小合計確率核酸が約 0.2 以下、さらに望ましくは約 0.01 以下、最も望ましくは 0.001 以下である場合、核酸は基準配列に類似しているとみなされる。
【0082】
一つの実施例において、タンパク質と核酸配列の相同性は、Basic Local Alignment Search Tool ("BLAST") を使って評価される。特に、下記のタスクを実行するために 5 つの特定の BLAST プログラムが使用される。
(1)LASTP および BLAST3 は、アミノ酸のクエリ配列をタンパク質配列データベースと比較する。
(2)BLASTN は、ヌクレオチドのクエリ配列をヌクレオチド配列データベースと比較する。
(3)BLASTX は、クエリ配列 (両鎖) の 6 フレーム概念的に置き換えたものをタンパク質配列データベースと比較する。
(4)TBLASTN は、クエリタンパク質配列を、6 つすべての読み取りフレーム(両鎖) に置き換えたヌクレオチド配列データベースと比較する。
(5)TBLASTX は、ヌクレオチドのクエリ配列の 6 フレームへの置き換えをヌクレオチド配列データベースの 6 フレーム翻訳と比較する。
【0083】
BLAST プログラムは、クエリアミノ酸あるいは核酸配列と、望ましくはタンパク質あるいは核酸配列データベースから得られるテスト配列間の、本書では「高スコアリングセグメントペア」と呼ばれる類似セグメントを特定することで相同性のある配列を特定する。高スコアリングセグメントペアはスコアリングマトリックスによって特定 (アラインメント) されるのが望ましい。多数のマトリックスがこの技術分野において知られている。使用されるスコアリングマトリックスは BLOSUM62 マトリックス(Gonnet 等、Science 256:1443-1445, 1992; Henikoff and Henikoff, Proteins 17:49-61, 1993) が望ましい。PAM または PAM250 マトリックスの使用がその次に望ましい (例:Schwartz および Dayhoff 編著、1978, Matrix for Detecting Distance Relationships : Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation を参照)。BLAST プログラムは、U.S. National Library of Medicine (www.ncbi.nlm.nih.gov) を通じてアクセスできる。
上記のアルゴリズムで使用されるパラメータは、研究対象の配列の長さおよび相同性の程度に応じて適応される。数種の実施例において、使用者による指示がない場合、パラメータはアルゴリズムが使用するデフォルトのパラメータである。
【0084】
図2 は、新しい配列とデータベースにある配列の間の相同性レベルを決定するために新ヌクレオチドあるいはタンパク質配列を配列データベースと比較するプロセス200 の一実施例を図示する流れ図である。配列データベースは、コンピュータシステム100 内に保管された私的データベース、あるいはインターネットを通じて利用できる GENBANK といった公的データベースでありうる。
プロセス200 は、出発段階 201 で始まり、その後、比較される新配列がコンピュータシステム100 のメモリに保管されている段階 202 へと移る。上記に記述されたように、メモリは RAM あるいは内部記憶装置を含む任意のタイプでもよい。
プロセス200 はその後段階 204 へと移り、その配列データベースが分析および比較のために開かれる。その後プロセス200 は段階 206 へと移り、データベースに保管された第一配列がコンピュータのメモリに読み込まれる。その後、段階 210 で比較が行われ、第一配列が第二配列と同一であるかを決定する。このステップは、新配列とデータベースにある第一配列間の正確な比較の実施に限定されないという点に留意することは重要である。2 つのヌクレオチドあるいはタンパク質配列の比較としてよく知られている方法は、たとえそれらが同一ではない場合でもその技術分野の熟練者には既知である。例えば、2 つのテスト配列間の相同性レベルを上げるために、ギャップが一つの配列に導入される。比較の間にギャップあるいは他の特徴が配列に導入されるべきかどうかを制御するパラメータは、通常コンピュータシステムの使用者が入力する。
段階 210 で 2 つの配列の比較が実行されると、決定段階 210 で 2 つの配列が同一であるか決定される。もちろん、「同一 (same)」という単語は、絶対的な同一の配列に限定されることはない。使用者が入力した相同性パラメータ内にある配列は、プロセス200 内に「同一」と記される。
【0085】
2 つの配列が同一であるとの決定が行われた場合、プロセス200 は段階 214 へと移り、ここでデータベースからの配列名が使用者に表示される。この段階では、表示された名前を持つ配列は入力された相同性制限を遂行したことが使用者に通知される。保管された配列名が使用者に表示されると、プロセス200 は決定段階 218 へと移り、ここでより多数の配列がデータベースに存在するか決定される。データベースに存在する配列がない場合、プロセス200 は段階 220 で終了する。しかし、データベースにさらなる配列が存在する場合、プロセス200 は段階 224 へと移り、新配列と比較できるようにポインターがデータベースの次の配列に移動する。このような方法で、新配列はデータベースの各配列とアラインメント・比較される。
配列は相同的でないと決定段階 212 で決定が行われた場合、データベースの他の配列を比較のために利用できるかを決定するために、プロセス200 は直ちに決定段階 218 に進むという点に留意すべきである。
従って、本発明の一つの面は、プロセッサ、グループ A 核酸配列、およびそれと実質的に同一の配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一の配列に示したポリペプチド配列を保管したデータ記憶装置、グループ A 核酸配列、およびそれと実質的に同一の配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一の配列で示したポリペプチド配列と比較するための基準ヌクレオチド配列あるいはポリペプチド配列を検索可能な形で保管しているデータ記憶装置、および比較を実施するための配列比較子から成るコンピュータシステムである。配列比較子は、比較される配列間の相同性レベルを提示したり、グループ A 核酸配列、およびそれに本質的に同一な配列に示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一の配列で示したポリペプチド配列の上記核酸コードの構造モチーフを特定したり、あるいは、これらの核酸コードおよびポリペプチドコードと比較される配列にある構造モチーフを特定する。数種の実施例において、データ記憶装置は、グループ A 核酸配列、およびそれと実質的に同一の配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一の配列で示したポリペプチド配列のうち、少なくとも 2、5、10、15、20、25、30 あるいは 40 以上の核酸配列の配列を記憶している場合もある。
【0086】
本発明の別の面は、グループ A 核酸配列、およびそれに本質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一の配列で示したポリペプチド配列と、基準核酸配列との間の相同性レベルを決定する方法である。その方法は、相同性レベルを決定し、核酸コードあるいはポリペプチドコードと基準ヌクレオチドあるいはポリペプチド配列間の相同性をコンピュータプログラムの使用を通じて決定し、核酸コードあるいはポリペプチドコード、および基準核酸あるいはポリペプチド配列をコンピュータプログラムの使用を通じて読み取ることを含む。コンピュータプログラムは、本書で具体的に名前を挙げたものを含め、相同性を決定するための任意の数あるコンピュータプログラムでよい (例:デフォルトパラメータあるいは修正されたパラメータでの BLAST2N)。その方法は、上記のコンピュータシステムを使用して実行される。その方法はまた、コンピュータプログラムの使用を通じて、グループ A 核酸配列、あるいはグループ B アミノ酸配列で示したポリペプチドの上記の核酸配列のうち少なくとも 2、5、10、15、20、25、30 あるいは 40 以上を読み取り、核酸コードあるいはポリペプチドコードと、基準核酸配列あるいはポリペプチド配列の間の相同性を決定することでも実行されうる。
図 3 は、2 つの配列が相同であるかを決定するためのコンピュータにあるプロセス250 の実施例を示す流れ図である。プロセス250 は、段階 252 で始まり、比較される第一配列がメモリに保管されている段階 254 へと移る。比較される第二配列は、段階 256 でメモリに保管される。その後、プロセス250 は第一配列の第一文字が読み取られる段階 260 へと移り、それから第二配列の第一文字が読み取られる段階 262 へと移る。配列がヌクレオチド配列の場合、文字は通常、A、T、C、G あるいは U のいずれかであることが理解されるべきである。
配列がタンパク質配列である場合は、第一配列とそれに続く配列を簡単に比較できるよう一文字のアミノ酸コードであることが望ましい。
2 つの文字が同一かどうかの決定は、段階 264 で行われる。それらが同一である場合、プロセス250 は、第一および第二配列にある次の文字を読み取る段階 268 へと移る。そして、次の文字が同一かどうかの決定が行われる。それらが同一である場合、プロセス250 は、2 つの文字が同一でなくなるまでこのループを繰り返す。次の 2 つの文字が同一ではないと決定された場合、プロセス250 は任意の配列にさらに読み取るべき文字があるかどうかを決める決定段階 274 へと移る。
読み取るべき文字がそれ以上ない場合、プロセス250 は段階 276 へと移り、第一および第二配列間の相同性レベルが使用者に表示される。相同性レベルは、第一配列の配列合計数に対する配列間の同一文字の割合を計算して決定される。
従って、第一の 100 ヌクレオチド配列における各文字が第二配列にある各文字すべてとアラインメントされる場合、相同性レベルは 100% である。
【0087】
別の方法として、コンピュータプログラムは、オプションとして、グループ A 核酸配列、およびそれに本質的に同一な配列の核酸コードが 1 つあるいは複数の位置において基準核酸配列と異なっているかどうかを決定するために、本発明で示した核酸配列のヌクレオチド配列を 1 つあるいは複数の基準ヌクレオチド配列と比較するコンピュータプログラムでありうる。任意で、それらのプログラムは、基準ポリヌクレオチドの配列あるいはグループ A 核酸配列、およびそれと本質的に同一な配列で示した核酸配列に関連して、挿入、欠失あるいは置換されたヌクレオチドの長さおよび同一性を記録する。ある実施例において、コンピュータプログラムはグループ A 核酸配列で示した核酸配列およびそれと本質的に同一な配列が、基準ヌクレオチド配列に関連して一塩基多型 (SNP) を含んでいるかどうかを決定するプログラムでありうる。
従って、本発明の別の面は、グループ A 核酸配列、およびそれに本質的に同一な配列で示した核酸配列が、1 つあるいは複数のヌクレオチドにおいて基準ヌクレオチド配列と異なるかどうかを決定する方法であり、この方法には、核酸配列間の差異を特定するコンピュータプログラムの使用を通じて核酸コードおよび基準ヌクレオチド配列を読み取り、核酸コードと基準ヌクレオチド配列との差異をコンピュータプログラムで特定するステップから構成されている。数種の実施例において、コンピュータプログラムは、一塩基多型を特定するプログラムである。その方法は、上記で示したコンピュータシステムおよび図 3 で図示された方法によって実行される。その方法はまた、コンピュータプログラムの使用を通じて、グループ A 核酸配列で示した核酸配列、およびそれに実質的に同一な配列、および基準ヌクレオチド配列のうち、少なくとも 2、5、10、15、20、25、30 あるいは 40 以上を読み取り、コンピュータプログラムによって核酸コードおよび基準ヌクレオチド配列の間の差異を特定することでも実行される。
【0088】
他の実施例において、コンピュータベースのシステムは、グループ A 核酸配列で示した核酸配列内、あるいはグループ B アミノ酸配列で示したポリペプチド配列、およびそれと実質的に同一な配列内における特徴を特定する識別子を含むこともある。
「識別子」とは、グループ A 核酸配列、およびそれと実質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一な配列で示したポリペプチド配列内にある特徴を特定する、1 つあるいは複数のプログラムを指す。ある実施例において、識別子は、グループ A 核酸配列、およびそれと実質的に同一な配列で示した核酸配列内にある ORF (オープン・リーディング・フレーム) を特定するプログラムを含む。
図 5 は、配列における特徴の存在を検出するためのプロセス300 の一実施例を示す流れ図である。プロセス300 は段階 302 で始まり、段階 304 へと移り、文字についてチェックを受ける第一配列がコンピュータシステム100 におけるメモリ 115 に保管される。プロセス300 はその後段階 306 へと移り、そこで配列特徴のデータベースが開かれる。そのようなデータベースには、各特徴の名前と共に特徴の属性についての一覧が含まれている。例えば、特徴の名前は「開始コドン」であり、その属性は「ATG」となる。もう 1 つの例を挙げると、特徴の名前が「TAATAA Box」であれば、その属性は「TAATAA」である。このようなデータベースの一例に、ウィスコンシン大学遺伝子コンピュータグループ (www. gcg.com) が作成するものがある。別の方法としては、文字はアルファへリックス、ベータシート、あるいは、酵素活性部位、へリックス - ターン - へリックスモチーフあるいはその技術分野において熟練者に知られている他のモチーフなどの機能的ポリペプチドモチーフなど、構造的なポリペプチドモチーフの場合もある。
【0089】
特徴データベースが段階 306 で開かれると、プロセス300 は段階 308 へと移動して、第一特徴がデータベースから読み取られる。第一特徴の属性比較が段階 310 で行われる。決定段階 316 で、特徴の属性が第一配列で見つかったかどうかが決定される。属性が見つかった場合、プロセス300 は段階 318 へと移動して、その後見つかった特徴の名前が使用者に提示される。
その後プロセス300 は、データベースの中にさらに特徴が存在しているかを決定する決定段階 320へと移動する。さらなる特徴が存在しない場合、プロセス300 は段階 324 で終了する。しかしさらなる特徴が存在する場合、プロセス300 は段階 326 で次の配列特徴を読み取り、次の特徴の属性が第一配列と比較される段階 310 へと戻る。
段階 316 で 第一配列に特徴の属性が見つからなかった場合、プロセス300 はデータベースにさらに特徴が存在するかを決めるために決定段階 320 へと直接移動する点に留意するべきである。
従って、本発明の別の面は、グループ A 核酸配列、およびそれと本質的に同一の配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれと実質的に同一の配列で示したポリペプチド配列の特徴を特定する方法であり、その方法には、特徴を特定するコンピュータプログラムの使用を通じた、核酸コードあるいはポリペプチドコードの読み取り、およびコンピュータプログラムによる核酸コード内の特徴の特定が含まれる。ある実施例において、コンピュータプログラムは、ORF を特定するコンピュータプログラムを含む。この方法は、単一配列あるいは、グループ A 核酸配列、およびそれに実質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列のうち、少なくとも 2、5、10、15、20、25、30 あるいは 40 以上をコンピュータプログラムの使用を通じて読み取り、核酸コードあるいはポリペプチドコード内の特徴をコンピュータプログラムで特定することで実行される。
グループ A 核酸配列、およびそれと実質的に同一な配列で示した核酸配列、あるいはグループ Bアミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列は、様々な形式で多種のデータプロセッサプログラム内に保管・操作される。例えば、グループ A 核酸配列、およびそれと実質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列は、Microsoft WORD あるいは WORDPERFECT のような文書処理ファイルでテキスト保存するか、あるいは ASCII ファイルとしてその技術分野の熟練者に馴染みのある DB2、SYBASE、あるいは ORACLE といった多種のデータベースプログラムで保存される。加えて、多くのコンピュータプログラムおよびデータベースは、配列比較アルゴリズム、識別子、あるいはグループ A 核酸配列D、およびそれと実質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列と比較される基準ヌクレオチド配列あるいはポリペプチドの提供元として使用される。下記のリストは、発明を制限することを意図するのではなく、グループ A 核酸配列、およびそれと実質的に同一な配列で示した核酸配列、あるいはグループ B アミノ酸配列、およびそれに実質的に同一な配列で示したポリペプチド配列に有用なプログラムおよびデータベースに対する案内を提供する意図で作成されたものである。
【0090】
使用されるプログラムとデータベースは、下記を含むがこれに制限されない:MacPattern (EMBL)、DiscoveryBase (Molecular Applications Group)、GeneMine (Molecular Applications Group)、Look (Molecular Applications Group)、MacLook (Molecular Applications Group)、BLAST および BLAST2 (NCBI)、BLASTN および BLASTX (Altschul 等、J. Mol. Biol. 215: 403, 1990)、FASTA (Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988)、FASTDB (Brutlag 等、Comp. App. Biosci. 6:237-245, 1990)、Catalyst (Molecular Simulations Inc.)、Catalyst/SHAPE (Molecular Simulations Inc.), Cerius2.DBAccess (Molecular Simulations Inc.)、HypoGen (Molecular Simulations Inc.)、Insight II (Molecular Simulations Inc.)、Discover (Molecular Simulations Inc.)、CHARMm (Molecular Simulations Inc.)、Felix (Molecular Simulations Inc.)、DelPhi (Molecular Simulations Inc.)、QuanteMM (Molecular Simulations Inc.)、Homology (Molecular Simulations Inc.)、Modeler (Molecular Simulations Inc.)、ISIS (Molecular Simulations Inc.)、Quanta/Protein Design (Molecular Simulations Inc.)、WebLab (Molecular Simulations Inc.)、WebLab Diversity Explorer (Molecular Simulations Inc.)、Gene Explorer (Molecular Simulations Inc.)、SeqFold (Molecular Simulations Inc.)、MDL Available Chemicals Directory データベース、MDL Drug Data Report データベース、Comprehensive Medicinal Chemistry データベース、Derwent's World Drug Index データベース、BioByteMasterFile データベース、Genbank データベース、および Genseqn データベース。その他多くのプログラムおよびデータベースは、現在の開示内容を知っているその技術分野の熟練者には明白である。
上記のプログラムを使用して検出されるモチーフは、ロイシンジッパー、へリックス - ターン - へリックスモチーフ、グリコシル化部位、ユビキチン化部位、アルファへリックス、およびベータシートを符号化する配列、ホメオボックス、酸性のストレッチ、酵素活性部位、基質結合部位および酵素による切断部位のように、符号化されたタンパク質、転写調整において暗示された配列の分泌を指示する信号ペプチドを符号化する信号配列を含む。
【0091】
本発明は、酵素の特異な触媒特性を高めるものである。実際、化学変化における生体触媒の使用 (例:精製酵素あるいは天然酵素、非活性細胞あるいは活性細胞など) には、通常、特定の出発化合物と反応する特定の生体触媒の特定が求められるが、本発明は、小分子などの多くの出発化合物に見られる機能群に特有の選択された生体触媒および反応状態を使用する。各生体触媒は、1 つの機能群あるいはいくつかの関連する機能群に特有のものであり、その機能群を含む出発化合物多数と反応する。
生体触媒反応は、単一の出発化合物から数多くの誘導体を生み出す。これらの誘導体は、2 つ目の誘導体を生み出すため 2 回目の触媒反応に応じさせることもできる。本来の小分子あるいは化合物から何千もの多様性が生体触媒の誘導体化の反復によって生み出される。
酵素は、分子の残りの部分に影響することなく出発化合物の特定部位に反応する。このプロセスを、従来の化学方法の使用により達成するのは非常に難しい。
この高い生体触媒特異度によって、ライブラリ内の単一活性化合物を特定する手段が提供される。ライブラリは、ライブラリの作成に使用される一連の生体触媒反応、いわゆる「生合成履歴」によって特徴づけられる。生物活性についてライブラリをスクリーニングし、生合成履歴を追跡調査することにより、活性化合物を生み出す特定の反応配列が特定される。反応配列は繰り返され、合成化合物が決定される。他の合成およびスクリーニング方法とは違い、この属性確認の様態は固定化技術が要らず、化合物は実質的にあらゆる種類のスクリーニングアッセイを使用して溶媒中で自由に合成・テストされうる。機能群における酵素反応の特異度によって、生体触媒により作成されるライブラリを作り出す特定の酵素反応の「追跡調査」が可能となる点に留意することは重要である。
手順段階の多くは、ロボットによる自動装置を使用して実行されるため、高度な正確性と信頼性を保証すると同時に、一日に何千もの生体触媒反応およびスクリーニングアッセイが可能となっている。結果として、現在の化学方法を使用すれば数年はかかると思われる誘導化合物のライブラリがほんの数週間で作成されうる。
特定の実施例において、本発明は、修飾小分子を生成するための方法を提供しているが、この方法では、本書で説明されたポリヌクレオチドにより符号化されたポリペプチドまたは酵素活性化したその断片を小分子に接触させて、修飾小分子を生成する。修飾小分子のライブラリは、希望する活性を持つライブラリ内に修飾小分子が存在するか確認するために、テストされる。希望する活性を持つ修飾小分子を生成する特定の生体触媒反応は、ライブラリの一部を作成するために使用される各々の生体触媒反応を系統的に排除していき、ライブラリのその一部に生成された修飾小分子が希望する活性を有しているかどうかについて、小分子をテストすることで特定される。希望する活性を持つ修飾小分子を生成する特定の生体触媒反応は、任意で繰り返すことができる。生体触媒反応は、小分子の構造内にみられる個別の構造的部位と反応する生体触媒群を使用して実施することができ、各生体触媒は、一つの構造的部位または関連する構造的部位群に固有のものである。そして各生体触媒は、個別の構造的部位を持つ多数の異なる小分子と反応する。
【実施例】
【0092】
本発明は、下記の例に関連してさらに詳しく詳述される。しかしながら、本発明がこれらの例のみに限定されない点が理解されるべきである。
例 1
部位飽和型突然変異誘発
部位飽和型突然変異誘発を遂行するために、SEQ ID NO:1 によって符号化されたデハロゲナーゼ酵素 (SEQ ID NO:2) のすべての残留物 (317) が、32倍縮重オリゴヌクレオチドプライマーを使用して、部位特異性の突然変異誘発によって以下のように 20 アミノ酸すべてに変換された:
デハロゲナーゼ発現構造の培養が発育され、プラスミドの製剤が生成された。
プライマーが各コドンを無作為化するために生成された各コドンには、共通の構造 X20NN(G/T)X20 があり、X20 が、変更されるべきコドンを側面に配する、SEQ ID NO:1 の核酸配列の 20 ヌクレオチドを表す。
プラスミドテンプレートの 50 ナノグラム以上、各プライマーの 125 ナノグラム、天然 Pfu バッファ 1X、dNTP および天然 Pfu DNA ポリメラーゼ2.5U 各200μMを含む反応混合物25μl が準備された。
反応は Robo96 Gradient Cycler で以下のように循環された:
95℃ で 1 分間の初期変性。
45 秒間 95℃、1分間 53℃および11分間 72℃で 20サイクル。そして
10 分間 72℃ の最終伸長ステップ。
反応混合物は、メチル化されたテンプレートDNA を消化するために、37℃ で 1 時間、DpnI 10U で消化された。
反応混合物 2μl が、XL1-ブルーMRF の細胞 50μlの形質転換を起こすために使用され、全形質転換混合物が 200-1000 の集落を産出する大きな LB-Amp-Met プレートに培養基で培養された。
個々の集落は、LB-Amp-IPTG を含む 384 ウェルマイクロタイタープレートに爪楊枝で移され、一晩発育された。
これらのプレート上のクローンは、翌日にアッセイされた。
【0093】
例2
デハロゲナーゼの耐熱性
本発明は、管理された進化によって生成される望ましい性質が、ある特定の時間、厳しいと考えられる環境を含む変更された環境下に従う分子の改善された残余物活性 (例えば、酵素活性、免疫反応、抗生物質活性など) によって、狭い意味において例証されることを規定する。そのような厳しい環境には、下記の組み合わせが含まれうる (反復あるいは反復しない、任意の順序あるいは置換えで):高温 (加工中の酵素の変性を引き起こす場合のある温度を含む)、低温、高塩分、低塩分、高 pH、低 pH、高圧、低圧、および放射線源 (紫外線放射線、可視光線、さらに全電磁スペクトルを含む) への露出状態の変化。
次の例は、管理された進化の適用が、高い温度に接触した時に活性を回復あるいは保持する酵素の能力を進化させることを示している。
上記に記述されるように、デハロゲナーゼ酵素のすべての残留物 (317) は、32 倍縮重オリゴヌクレオチドプライマーを使用して、部位特異的変異誘発によって 20 アミノ酸すべてに転化された。スクリーニングの手続きは以下のとおりだった:
384-ウェルプレートで一晩成長させた培養が遠心分離機にかけられ、培養液が取り除かれた。各ウェルに、0.06 mL 1 mM Tris/SO42- pH 7.8 が加えられた。
ロボットで、細胞懸濁液 0.02 mL から成る各親成長プレートから 2 つのアッセイプレートが作成された。
1 枚の分析プレートが室温に設置され、もう 1 枚の分析プレートが (初期スクリーンとして 55℃ を使用) その期間高温に設置された (初期は 30 分)。
規定された時間の後に、室温基質 (1.5 mM NaN3 およびブロモチモールブルー0.1 mM を備えた TCP 飽和 1 mM Tris/SO42-pH 7.8) 0.08 mL が各ウェルに加えられた。TCP =トリクロロプロパン。
各ウェルの進行カーブを発生させるために、様々な時点で 620 nm での測定が実施された。
データが分析され、熱した細胞と熱していない細胞の動態が比較された。各プレートには、突然変異していない 20F12 コントロールの 1-2 コラム(24 ウェル) が含まれた。
安定性の改善があったと見なされたウェルが再び発育され、同じ条件でテストされた。
この手続きに従って、酵素に耐熱性が高められた突然変異のあるクローンが、特に改良の原因となった各位置で、正確なアミノ酸変更を決定するために配列された。SEQ ID NO:5 および 7 で述べられるような核酸配列のある突然変異体、また各々 SEQ ID NO:6 および 8 で述べられるポリペプチド配列が識別された。
位置 G182V (SEQ ID NO: 6) の熱突然変異体は、さらに同様に耐熱性の向上したグルタミン酸塩 (Q) である場合がある。同様に、P302A 突然変異体は、ロイシン(L)、セリン(S)、リジン(K) あるいはアルギニン(R) に変更することができる。これらの変異形 (以下と同様に) は、本発明に含まれている。
この手続きに従って、9 つの単一部位突然変異体が、耐熱性を高めたことが明白になった。配列分析は、次の変更が有益だったことを示した:
D89G、F91S、T159L、G182Q、G182V、I220L、N238T、W251Y、P302A、P302L、P302S、P302K、P302R/S306R。2 つの部位のみ (189 と 302) に 1 つ以上の置換があった。リストの最初の 5 つは、(G189Q を使用して) 単一の遺伝子へ組み込まれた。
【0094】
ある一定期間、高温 (55℃ および 80℃) で、また活性アッセイの場合は 30℃ で、酵素を培養することにより、耐熱性が評定された。初期の割合は、高温で時間に対して区分された。酵素は、培養およびアッセイの両方に対して 50 mM Tris/SO4 pH 7.8中にあった。生成物 (Cl) が、Fe(NO3)3 および HgSCN を使用した標準の方法によって検知された。SEQ ID NO: 2 のデハロゲナーゼが、事実上の野生型として使用された。明白な半減期 (T1/2) は、指数関数的な減退機能にデータを適合させて計算された。
本発明は、その特定の望ましい具体的表現に関係して詳細に記述されている一方、修正および変更が記述、請求されているその精神および範囲内にあることが理解されるであろう。
【図面の簡単な説明】
【0095】
【図1】コンピュータシステムのブロック図である。
【図2】新しい配列とデータベース内の配列との間の相同性レベルを決定する目的で、新しいヌクレオチドまたはタンパク質配列を配列のデータベースと比較するための一プロセスの実施例を図示した流れ図である。
【図3】2 つの配列が相同的であるかどうかを判断するための、コンピュータ内での一プロセスの実施例を図示した流れ図である。
【図4】配列内のある特徴の存在を検出するための識別プロセス300 の一つの実施例を図示した流れ図である。
【図5】本発明のポリペプチド配列のアラインメントを示したものである。A=SEQ ID NO:4、B=SEQ ID NO:2、C=SEQ ID NO:6、rhod2=SEQ ID NO:40、myco4=SEQ ID NO:42。
【図6A】本発明の配列を示したものである(SEQ ID No:9および10)。
【図6B】本発明の配列を示したものである(SEQ ID No:11および12)。
【図6C】本発明の配列を示したものである(SEQ ID No:13および14)。
【図6D】本発明の配列を示したものである(SEQ ID No:15および16)。
【図6E】本発明の配列を示したものである(SEQ ID No:17および18)。
【図6F】本発明の配列を示したものである(SEQ ID No:19および20)。
【図6G】本発明の配列を示したものである(SEQ ID No:21および22)。
【図6H】本発明の配列を示したものである(SEQ ID No:23および24)。
【図6I】本発明の配列を示したものである(SEQ ID No:25および26)。
【図6J】本発明の配列を示したものである(SEQ ID No:27および28)。
【図6K】本発明の配列を示したものである(SEQ ID No:29および30)。
【図6L】本発明の配列を示したものである(SEQ ID No:31および32)。
【図6M】本発明の配列を示したものである(SEQ ID No:33および34)。
【図6N】本発明の配列を示したものである(SEQ ID No:35および36)。
【図6O】本発明の配列を示したものである(SEQ ID No:37および38)。
【図6P】本発明の配列を示したものである(SEQ ID No:43および44)。
【図6Q】本発明の配列を示したものである(SEQ ID No:45および46)。
【図6R】本発明の配列を示したものである(SEQ ID No:47および48)。
【図7】本発明のデハロゲナーゼを使用したグリセロールの形成、および、本発明のデハロゲナーゼを使用した 1,2-プロパンジオールまたは 1,3-プロパンジオールの形成の例を示したものである。
【図8】本発明のデハロゲナーゼを使用したハロ置換環式ヒドロカルビルの脱ハロゲンの例を示したものである。

【特許請求の範囲】
【請求項1】
配列が次から成る群から選択された、デハロゲナーゼ活性があるポリペプチドを符号化する配列から構成される単離された核酸:
配列番号: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、43、45 および 47、
配列比較アルゴリズムあるいは目視検査による分析で決定されるように、少なくとも約 100 残留物の範囲に、配列番号: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、43、45 および 47 の少なくとも 1 つに対して少なくとも約 50% の相同性のある変異体、
配列番号: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、43、45 および 47 に対して相補的な配列、及び
配列比較アルゴリズムあるいは目視検査による分析で決定されるように、少なくとも約 100 残留物の範囲に、配列番号: 3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、43、45 および 47 に対して少なくとも約 50% の相同性のある変異体に対して相補的な配列。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図6C】
image rotate

【図6D】
image rotate

【図6E】
image rotate

【図6F】
image rotate

【図6G】
image rotate

【図6H】
image rotate

【図6I】
image rotate

【図6J】
image rotate

【図6K】
image rotate

【図6L】
image rotate

【図6M】
image rotate

【図6N】
image rotate

【図6O】
image rotate

【図6P】
image rotate

【図6Q】
image rotate

【図6R】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2008−142089(P2008−142089A)
【公開日】平成20年6月26日(2008.6.26)
【国際特許分類】
【出願番号】特願2008−13072(P2008−13072)
【出願日】平成20年1月23日(2008.1.23)
【分割の表示】特願2002−568679(P2002−568679)の分割
【原出願日】平成13年11月30日(2001.11.30)
【出願人】(503089489)ヴェレニウム コーポレイション (31)
【Fターム(参考)】