タンパク質の可溶性を決定する方法
本発明は、候補タンパク質発現ライブラリー内の可溶性候補タンパク質の発現についてスクリーニングする方法に関する。本方法は、ライブラリーの各タンパク質をペプチド基質と融合させ、更に前記ペプチド基質の酵素による改変を検出することによって可溶性候補タンパク質を発現する細胞を同定することを必要とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、候補タンパク質の発現ライブラリーで可溶性候補タンパク質の発現についてスクリーニングする方法に関する。本方法は、ライブラリー内の各候補タンパク質をペプチド基質と融合し、及び前記ペプチド基質の酵素による改変を検出することによって可溶性候補タンパク質を発現する細胞を同定することを必要とする。
本明細書に引用した全ての刊行物、特許及び特許出願は参照により完全に本明細書に含まれる。
【背景技術】
【0002】
構造ゲノム学は近年ますます関心を集めつつある。タンパク質の構造の解明は、タンパク質機能の理解を深め、それによって医薬開発を促進するために重要である。
タンパク質発現及び精製は前記のような研究で重要なプロセスであり、しばしば適切に折畳まれた組換えタンパク質を生成する能力によって制限を受ける。大腸菌(Escherichia coli, E. coli)発現系を用いる構造的及び機能的解析を目的とするタンパク質の調製は、不溶性の細胞内タンパク質凝集物(封入体)の発生、プロテアーゼによる分解又は発現の欠如によってしばしば妨害される。
大腸菌は一般的な発現宿主であり、非天然遺伝子生成物の過剰産生を強いられたときしばしば誤った折り畳みをもつタンパク質を生成する。このことは、例えば結晶学及びNMRによる構造解析のような領域での前記タンパク質の有用性を甚だしく制限し、更に従来の構造ゲノム学プロジェクトの全体的な成功率を制限する。不溶性発現タンパク質の問題に対する通常のアプローチには、低温発現、種々の強度のプロモーターの使用、多様な可溶性強化融合タグ(RB Kapust & DS Waugh. "Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of polypeptides to which it is fused", Protein Sci. 1999 Aug; 8(8):1668-74)及び改変増殖培養液(SC Markrides, "Strategies for achieving high-level expression of genes in Escherichia coli", Microbiol. Rev. 1996 Sep; 60(3):512-38(概説))が含まれる。
【0003】
この困難を克服するためのまた別のアプローチは、問題のタンパク質のアミノ酸配列から予測される構造によるものである。相同性アラインメント及び二次構造予測のような情報は、安定な可溶性ドメインの位置を予測するために用いられる。標的タンパク質の切端又は変異導入を先ず初めに構築し、続いてこれを発現させて可溶性についてテストする。継続的な進展にもかかわらず、所望の特性(例えば安定性又は可溶性発現)をもつ純粋に“合理的な”タンパク質の設計は、少なくとも今日まで一般的には実現可能ではない。十分な構造的及び機構的情報の存在下においてさえ、必要な配列短縮を予測することは困難である。異種宿主で発現され得るタンパク質の能力から非天然の環境で折り畳まれるその能力まで、タンパク質構造のあらゆる局面においてアミノ酸配列がどのように影響を及ぼすかに関する情報はほとんど存在しない。タンパク質の特性における変化は、多くの小さな調整(それらの多くはタンパク質分子内の著しい距離にわたって割り当てられ又は伝えられる)の積重ねられた作用によって発生することが実験によって示され、生物情報解析プログラムはこれまでのところどの切断(truncation)又は変異がタンパク質の可溶性を高めるかを正確に予測することができない。
通常の構造に関するプロジェクトでは、数十のクローンが構築され可溶性タンパク質発現について調べられる。そのようなプロジェクトに関しては、可能な多様性のためにはサンプルが極めて不足しており、しばしば解決は見出されない。更にまた、ゲノム配列から予測される多くのタンパク質に関しては、既知のホモローグが存在せず、このことは生物情報解析アプローチの有効性を制限する。高処理スクリーニング戦術は、標準的アプローチが失敗したときに可溶性構築物を発見するために有効であることを証明することができる。これらは、構造決定のために適切な構築物を同定するためには多数の発現クローンの正確な解析を要求する。完全なタンパク質が発現されないか又は結晶化されない場合は、次の工程は、切断又はランダム変異を実施し再テストすることである。
【0004】
(i)従来の方法論は非常に大きな発現ライブラリーの作成を可能にし、更に(ii)ライブラリーが可溶性タンパク質を含む可能性はライブラリーのサイズに従って増加するが、発現ライブラリーをスクリーニングするための従来のアプローチによって生じる現実的限界はその実施を制限する。問題のタンパク質の可溶形又は結晶形を発現させることを所望する実験者の究極の目的は、標的タンパク質の全ての可能な変種を合成し、それらを可溶性発現についてスクリーニングすることである。可溶性タンパク質を発現するクローンは直接用いてもよいし、又は前記クローンを次のラウンドのライブラリー構築及び選別のシードとして用いてもよい。そのような実験では大量のクローンが得られ、前記クローンは続いて可溶性標的タンパク質の発現のためにスクリーニングされねばならないであろう。
問題の候補タンパク質の可溶性変種(ランダム変異又は切断によって作出される)を同定するという目的をもついくつかの系が記載された。融合レポーターの方法では、容易に検出され得る特性又は生物学的活性をもつ候補タンパク質及びレポータータンパク質が遺伝子融合物として発現される。タンパク質の折り畳み状態についての情報は、融合されたレポータードメインによってスクリーニング可能又は選別可能活性から誘導することができる。
融合レポーターの方法は、通常は、C-末端パートナーの“可溶性レポーター”(例えば緑色蛍光タンパク質(GFP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)又はベータガラクトシダーゼ)の融合を必要とする。GFP融合レポーターの方法では、GFPの蛍光の発生は、その融合パートナーの折り畳み状態についての情報を提供する。折り畳みが不十分な不溶性タンパク質と融合したGFP発現細胞は、折り畳みが十分な可溶性タンパク質と融合したGFP発現細胞よりも蛍光が少ない。GFPはテストタンパク質の折り畳みの収量をモニターする。テストタンパク質はその後GFPタグをもたないで発現される(GS Waldo, “Genetic screens and directed evolution for protein solubility”, Curr Opin Chem Biol 2003 Feb;7(1):33-8(概説))。
【0005】
本発明者らは、タンパク質折り畳みマーカーとしてビオチンカルボキシル担体タンパク質(BCCP)の使用に基づく融合レポーター系を以前に開発した。この系では、大腸菌由来のBCCPのビオチニル化ドメインがテストタンパク質と融合される。このドメインの正確に折畳まれた二次及び三次構造は、前記ドメインをビオチニル化する内在性宿主細胞ビオチンタンパク質リガーゼによって認識される。正確に折畳まれたテストタンパク質及びBCCPドメインを発現する宿主細胞はビオチン基について陽性を示すだろう(WO03/064656 “Protein tag comprising a biotinylation domain and method for increasing solubility and determining folding state”)。
しかしながら、これらの系に付随する問題が存在し、この問題は前記系の応用性を制限する。
自律的に折畳まれるレポータータンパク質(例えばGFP、CAT、ベータ-gal又はBCCPドメイン)の使用は、それらの大型で可溶性の性質のために問題の多い偽陽性率を生じ得る。前記は、レポーターはそれ自体不溶性になることなく不溶性タンパク質X又は完全長タンパク質との融合に寛容であるために、圧倒的な偽陽性率を生じ得る。これは、タグが適所に置かれるとき、例えばタグを介してタンパク質を固定するとき、又は生化学的分析を精製タンパク質で実施するときは問題にはならないかもしれないが、多くの適用、例えばタンパク質の結晶学では、プロテアーゼ切断又は遺伝子的欠失によるタグの除去が必要とされる。その後のタグの除去時に凝集又は分解し、従って使用に適さないクローンの処理によって多くの時間及び費用が失われる。融合タンパク質はまたin vivoでの発現中にタンパク質分解によって分解されることもまたあり得ることであり、これによって偽陽性結果を生じる可溶性の蛍光レポーター分子が残される。これらの作用は、融合タンパク質(例えばマルトース結合タンパク質、グルタチオン-S-トランスフェラーゼ、GFP、チオレドキシンを含むもの)に関して非常に一般的に観察され、おそらくは普遍的な作用である。従って、可溶性レポーターとして機能する高度に可溶性である融合パートナーの存在は、前記パートナーが融合される物質の可溶性を大きく混乱させる。
【0006】
更にまた以前に開示された融合タンパク質のほとんどが大型タンパク質である。例えばGFPの融合はタンパク質のサイズをほぼ37kDa増加させる。大腸菌での大型融合タンパク質の発現には問題が多く、実際的な限界は約100kDaである。
実験及び配列/構造データベース解析を組み合わされたとき、タンパク質の形成をもたらす主要な進化関連因子を正確に記述するためにシミュレーション研究は役立ち得る。しかしながら、そのような研究の潜在的能力は未だ十分には調査されていない。
従って、クローニングから構造決定までの全体的プロセスにおいて、可溶性発現タンパク質の選別を可能にする、迅速で高処理性であって更に信頼に足る発現タンパク質のスクリーニング方法の可能な限り迅速な開発を求める強い要請が存在する。適切な方法は、種々の変種配列を含む多数の分子の高処理スクリーニングを可能にし、選別プロセスは改善された可溶性を有する分子の容易な同定を許すであろう。不溶性タンパク質の可溶性変種の同定及び単離を可能にする、個々のタンパク質の変種の発現ライブラリーの高処理分析に対するそのよう方法の扱いやすさは、特に変異導入又は切断方法戦術と組み合わせて用いるとき、取り扱いの困難なタンパク質の高レベル発現の最適化をより達成し易くかつ手間を軽減するであろう。更にまた、この方法は、i)いずれの融合パートナーの混乱誘発作用をも最小限にすること、及びii)構造解析のために要求される下流の工程(例えば融合タグの除去)を最小限にすることを希求しなければならない。タンパク質は、小さなタグとともに日常的に結晶化されるが、二ドメイン融合における結晶化は稀である。
【発明の開示】
【0007】
発明の要旨
本発明は、不溶性タンパク質の可溶性変種を選別することができるメカニズムを含む。これらのメカニズムでは、不溶性タンパク質のコード領域を操作、翻訳、発現させて、特定の操作が可溶性変種を生成するか否かを決定することができる。従って、不溶性タンパク質の可溶化に影響を与える因子を、そのコード核酸分子の配列を決定することによって同定することができる。従って前記メカニズムはまた、可溶性に重大な影響を与えるタンパク質の特性についての重要な洞察を提供する。
本発明のある特徴にしたがえば、複数の変種候補タンパク質中の可溶性候補タンパク質をスクリーニングする方法が提供される。前記の場合、各候補タンパク質はペプチド基質に、前記ペプチド基質の酵素による改変を検出することによって可溶性候補タンパク質が同定できるように融合される。
この新規な方法は、ある種の検査可能な活性(例えばGFPの場合には固有の蛍光、又はクロラムフェニコールアセチルトランスフェラーゼの場合には酵素による消長)を示すペプチド基質それ自体を当てにしない。そのようなペプチドを可溶性レポーターとして使用する隠れた重要な原理は、可溶性分子のみが酵素の有効な基質であるということである。従って、ペプチドが可溶性候補タンパク質と融合している場合だけ、前記は、ペプチドそのものの折り畳みを必要としないで酵素のための直接的基質として機能することができる。しかしながら、ペプチドが不溶性タンパク質と融合している場合は、ペプチド-改変酵素の活性部位とのその相互作用は立体的及び拡散に関する理由のために激しく制限され極めてわずかな酵素改変が生じるだけであり、陰性、未改変表現型を生じる。更にまた、ペプチドが大腸菌で単離された状態で発現されるならば、(フレーム外で遺伝子又は遺伝子フラグメントと融合された場合に生じるように)それらは一般的には不安定で、タンパク分解を生じ、従って細胞から除去され、やはり不履行陰性表現型を生じる。本方法は、例えばタンパク質切端戦術と組み合わせて用いるとき、発現ライブラリーの高処理解析に馴染みやすい。多数の変種が作成され、ただ1つの方法でテストされるので、この方法は、可溶性で、理想的に高度に発現される候補タンパク質を同定することができる可能性を大きく増加させる。
【0008】
ペプチド基質は小さく不活性であり、従って前記ペプチド基質が融合している候補タンパク質の物理的特徴を顕著には変化させない。ここで、物理的性状の変化に関連して“顕著には〜しない”という用語は、前記物理的性状の±50%以下の変化、例えば±45%以下、±40以下、±35%以下、±30%以下、±25%以下、±20%以下、±15%以下、±13%以下、±10%以下、又はそれより小さい変化を意味する。好ましくは、前記ペプチド基質は、前記基質が融合している候補タンパク質の物理的性状を変化させない。そのような物理的性状には、候補タンパク質の可溶性、サイズ、荷電、折り畳み及びアッセンブリーメカニズムが含まれる。具体的なある利点は、候補タンパク質の可溶性は混乱させられることはなく強化もされないというものである。これは、偽陽性結果の出現を制限する(偽陽性結果の出現は従来技術の方法論では一般的であり、大型で折畳まれた可溶性レポーター分子(不溶性タンパク質フラグメントとの融合に寛容であろう)の使用に付随する)。
本発明の更なる利点は、本方法論は、候補タンパク質の収量及び可溶性の定量的分析を定性的分析と同様に可能にするということである。これは、分析及び/又は更なる操作及びスクリーニング工程のために特に可溶性が高い候補タンパク質をコードするクローンの選択を可能にする。
本明細書で用いられる、“候補タンパク質”という用語は、合成又は天然に存在する任意のタンパク質又はペプチド(タンパク質フラグメント、マルチマータンパク質、組換えタンパク質、融合及びハイブリッドタンパク質、抗体などを含む)であり得る。
【0009】
本発明に従えば、“ペプチド基質”には、ペプチド結合又は改変ペプチド結合(即ちペプチドイソステア)によって互いに結合したアミノ酸を含む、ペプチドの任意の短い領域が含まれる。この用語は、5から20アミノ酸の短いペプチド鎖を、より長い20から50アミノ酸のオリゴペプチドと同様に意味する。そのようなペプチドは候補タンパク質と融合することができ、更に、可溶性であるときは酵素作用によってペプチド基質が改変されるように、酵素の基質として機能し得る必要がある。
好ましくは、前記ペプチド基質は、それが融合される候補タンパク質に対して小さい。例えば、大きな候補タンパク質の場合には、ペプチド基質のサイズがより小さいということはさほど重要ではなく、わずかに細長いペプチド基質が候補タンパク質の構造を混乱させることなく寛容であり、従って偽陽性結果を生じ得る。対照的に、小さな候補タンパク質の場合は、ペプチド基質は理想的には可能なかぎり小さくあるべきである。好ましくは、ペプチド基質の長さは候補タンパク質の長さの20%を超えない。より好ましくは、前記長さは候補タンパク質の長さの15%を超えず、更に好ましくは、前記長さは候補タンパク質の長さの10%を超えず、更に好ましくは、前記長さは候補タンパク質の長さの5%を超えない。
好ましくは、前記ペプチド基質は短く、長さが50アミノ酸又はそれより小さく、例えば45以下、40以下、35以下、30以下、25以下、20以下、15以下、13以下、10以下又はそれより小さい。
好ましくは、前記ペプチド基質は直鎖状で、三次元構造をもたない。これは、前記ペプチドは、二次元構造モチーフを有するある構造の三次元的編成に折畳まれないことを意味する。
【0010】
好ましいペプチド基質には、ビオチンタンパク質リガーゼのための基質として機能するペプチドが含まれる。そのようなペプチド基質の例は、Schatz(1993)及びBeckettら(1999)によって性状が決定された15アミノ酸ペプチドである(PJ Schatz (1993) “Use of peptide libraries to map substrate specificity of a peptide-modifying enzyme: a 13 residue consensus peptide specifies biotinylation in Escherichia coli”, Biotechnology 11:138-1143;Becket et al. (1999) “A minimal peptide substrate in biotin holoenzyme synthetase-catalysed biotinylation”, Protein Science 8:921-929)。このペプチドの配列はGLNDIFEAQKIEWHEであり、いくつかの類似変種もまた存在する。可溶性タンパク質と融合したとき、前記ペプチドはビオチンタンパク質リガーゼ(ビオチン-AMPからこの配列のリジン残基(下線が付されている)へビオチン分子を移転させる酵素である)のための基質として機能する。融合されていないとき、又は不溶性パートナーと融合されているとき、前記は非常に非効率的な基質である。ビオチンタンパク質リガーゼのための基質であるペプチド基質の使用は、ストレプトアビジン結合物を用いる検出により可溶性についてタンパク質をスクリーニングすることを可能にする。例えば、ウェスタン型、又はドットブロットを用いることが可能であろう(前記の場合、ストレプトアビジン-ペルオキシダーゼ結合物は化学発光により検出するか、又は蛍光標識ストレプトアビジン及び蛍光画像化装置(例えばアマーシャムタイフーン(Amersham Typhoon))を用いて直接検出することができる。ビオチンに結合することができる他の化合物にはニュートラビジン、アビジン及びモノマーアビジンが含まれる。
好ましいペプチド基質にはまた、同時発現されるキナーゼ(例えばカゼインキナーゼII(真核細胞で見出される普遍的なセリン/スレオニンタンパク質キナーゼ))のための基質として機能するペプチドが含まれる。可溶性タンパク質と融合したとき、前記ペプチド(例えばRRRDDDSDDD)はキナーゼのための基質として機能し、特定の残基(S)でリン酸化される。以前に記載されたように、融合されていないか、又は不溶性パートナーと融合したとき、ペプチドの効率的なリン酸化は生じない。リン酸化されたペプチドキナーゼは特異的な抗ホスホ抗体を用いて検出される。ホスホペプチドと抗ホスホ抗体との結合は、例えば蛍光標識抗ホスホ抗体結合物を用いて直接検出することができる。
【0011】
当業者には理解されるところであるが、ペプチド基質を候補タンパク質と融合することができる多数の方法が存在する。例えば、ペプチド基質は候補タンパク質と非共有結合によって融合させることができる。ペプチド基質は翻訳後に、例えばインテインバイオロジー(intein biology)によって候補タンパク質と融合することができる。好ましくは、ペプチド基質は共有結合(例えばペプチド結合を介して、化学的結合を介して、etc)によって融合させることができる。好ましくは、ペプチド基質は遺伝子融合物として発現され、候補タンパク質を含む組換え融合タンパク質を形成する。そのような遺伝子融合物の場合、ペプチド基質及び候補タンパク質成分の結合は、好ましくは、融合タンパク質のアミノ酸配列をコードする組換えDNA構築物を用いて達成することができる(前記DNA構築物は候補タンパク質をコードするDNAと同じ読み枠内でペプチド基質をコードする)。
ペプチド基質は、候補タンパク質のアミノ末端又はカルボキシ末端のどちらかに存在するか、又は前記タンパク質に対して内部に、例えば候補タンパク質構造から外れたループとして存在することができる。好ましくは、ペプチド基質は候補タンパク質のアミノ末端又はカルボキシ末端で融合される。
本発明にしたがえば、“酵素による改変”にはペプチド基質の任意の改変が含まれ、前記改変は、例えばマーカー又は標識の結合によって、化学的成分のペプチドへの添加又はペプチドからの欠落によって、化学的状態(例えばリン酸化、メチル化、アセチルか、ユビキチン化、スモイル化、ミリストイル化又はグリコシル化)の変化によって検出することができる。例えばペプチド基質を適切に設計することにより、改変酵素によって強制された変化が抗生物質耐性遺伝子の発現を活性化し、前記を達成した候補物質の抗生物質による選別を可能にするか、又は表現型マーカー遺伝子(例えば緑色蛍光タンパク質又はβ-ガラクトシダーゼをコードする遺伝子)の発現を活性化し、物理的濃縮方法(例えばFACS、蛍光活性化細胞分類)を可能にすることができる。好ましくは、ペプチド基質は酵素の作用によってビオチニル化される。他の適切な改変タイプも当業者には明白であろう。
【0012】
また別の実施態様では、ペプチド基質は、何らかの態様で基質改変タンパク質の活性に影響を与えることができる。例えば、基質改変タンパク質の活性が候補タンパク質の可溶性の結果として特異的に上昇又は低下するように、ペプチド基質が酵素反応のための補助因子として機能することによって活性に影響を与えることができる。このようにして、発現される候補分子が可溶性である場合、そのような候補分子をコードする特定の細胞を、基質改変タンパク質の活性又は不活性を規準に(例えば変異の影響を軽減するペプチドを保有するタンパク質による不活性変異酵素の補完により)単離することができる。
本発明に従って使用される好ましいペプチドの場合(ビオチンタンパク質リガーゼのための基質である場合)、前記酵素による改変はペプチドのビオチン化状態における変化である。
酵素による改変が生じるためには、要求される改変反応を実施することができる酵素の存在が要求される。前記酵素は別個に反応混合物に添加されるか、又は反応系にとって内在性であってもよい(例えば前記スクリーニングの方法が実施されている宿主細胞で天然に発現される)。例えば、前記細胞は、基質改変酵素としての活性を有する前記タンパク質を構成的に発現することができる。また別の実施態様では、前記宿主細胞は、前記ペプチド基質改変酵素をコードするポリヌクレオチドを含む、染色体外エレメント、例えばプラスミド、エピソーム、人工染色体などで形質転換されてもよい。
【0013】
本発明にしたがえば、“検出”は、ペプチド基質の酵素による改変が生じたことを認識させる適切な任意の方法を指す。酵素によっていったん改変されたら、未変化ペプチド基質との識別を可能にするために、前記ペプチドタグは何らかの点で違いを持たねばならない。このようにして、可溶性候補タンパク質は不溶性候補タンパク質と識別され得る。改変ペプチド基質を検出する適切な方法は当業者には明白であり、前記はもちろん利用される改変酵素の特性に左右される。検出は変化したペプチド基質であっても、未変化ペプチド基質であってもよい。好ましくは、検出は、変化したペプチド基質に対する陽性検出である。例えば、そのビオチン化状態が変化するペプチド基質を利用する本発明の好ましい実施態様では、選別はビオチン化状態におけるこの変化を目指すことができ、更にビオチンに対してアビジン及びストレプトアビジンによって示される高い結合親和性を利用し、前記結合ペアの高い結合親和性を基にして検出を可能にすることができる。また別には、質量分析は、質量の変化をモニターすることによってタグの改変を検出する方法を提供することができる。この検出方法に関しては、結合パートナーは要求されない。
本発明の候補タンパク質のスクリーニングは、例えば無細胞翻訳系を用いてin vitroで実施することができる。前記の系では、候補タンパク質は細胞内で発現されることなく転写及び翻訳される。このシナリオでは、可溶性候補タンパク質の選別が同時にコード核酸の選別を可能にさせるように、遺伝子型と表現型の間には何らかのリンクが存在する必要がある。これは、可溶性タンパク質の生成をもたらした有利な配列の特徴を評価することができるように前記方法論のデコンボルーションを可能にする。適切な方法は当分野では公知である。例えば、国際特許出願WO99/02671で最近公開されたあるin vitro系は、区画化のために、従って翻訳系の成分を単離するために油中水を用いて作出されたマイクロカプセルの使用を報告している。
【0014】
好ましくは、候補タンパク質は宿主細胞で発現される。候補タンパク質が発現されるいずれの宿主細胞系も適切であることは当業者には理解されよう。前記細胞系には、原核細胞発現系(例えば連鎖球菌、ブドウ球菌、大腸菌、ストレプトミセス及び枯草菌細胞(Bacillus subtilis))及び真核細胞系、例えば酵母(例えばS.セレビシエ(cerevisiae)及びアスペルギルス(Aspergillus)細胞)、昆虫細胞、植物細胞及び哺乳動物細胞培養が含まれる。大腸菌が、本発明に従って使用される好ましい宿主細胞である。理由は、部分的には、前記が内在性のビオチンタンパク質リガーゼを発現し、従って前記は宿主細胞それ自体の中で候補タンパク質に融合されたペプチド基質の改変が可能であるからである。このメカニズムのある利点は、遺伝子型と表現型との間で要求されるリンクが各細胞内で維持され、従ってこの方法は、可溶性であることが判明した候補タンパク質のDNA配列の解析を可能にするということである。しかしながら、この特定のペプチドと適合するビオチンタンパク質リガーゼを発現しない他の宿主細胞もまた、スクリーニングの前に細胞に前記酵素のコード配列を導入することによって用いることができる。
【0015】
宿主細胞内での発現のために、候補タンパク質(場合によってペプチド基質との融合タンパク質として)をコードする核酸配列は、適切な1つのベクター又は複数のベクターでクローニングされるべきである。宿主細胞は、そのようなベクターにより形質転換されるか、トランスフェクトされるか、又は形質導入されて、スクリーニングされるべき候補タンパク質の発現が達成され得る。適切な発現の方法は当業者には周知である、多くが詳細にSambrookら(上掲書)及びFernandez & Hoeffler(1998, eds. “Gene expression systems. Using nature for the art of expression”, Academic Press, San Diego, London, Boston, New York, Sydney, Tokyo, Tronto)によって詳細に記載されている。一般的には、コード遺伝子は、所望のポリペプチドをコードするDNAが形質転換宿主細胞内でRNAに転写されるように、制御エレメント(例えばプロモーター、リボソーム結合部位(細菌発現のため)及び場合によってオペレーター)の制御下に置かれる。前記コード核酸分子は、制御配列(例えばシグナルペプチド又はリーダー配列)をコードする配列を、所望に従って(例えば翻訳ポリペプチドの小胞体腔内、ペリプラズム間隙内又は細胞外環境への分泌)含むことができる。これらのシグナルは前記ポリペプチドにとって内在性であってもよく、又はそれらは異種シグナルであってもよい。リーダー配列は細菌宿主によって翻訳後プロセッシングで除去することができる。好ましくは、候補タンパク質は、基質改変酵素と同じ細胞内の区画に存在する。例えば、ビオチンタンパク質リガーゼは細胞質性タンパク質であり、この酵素の潜在的基質である候補タンパク質は従って細胞質内で維持されるべきである。コントロール配列の他に、調節配列を付加することも所望できる。前記調節配列は、宿主細胞の増殖に対応してポリペプチドの発現を調節することを可能にする。
【0016】
候補タンパク質は、例えば硫安若しくはエタノール沈殿、酸抽出及びクロマトグラフィーのような周知の方法を用いて、組換え細胞培養から分析のために回収及び精製することができる。しかしながら、表現型と遺伝子型との間のリンクを維持するために、いくつかの方法を用いて回収タンパク質の起源の追跡を可能にしなければならない。より簡単には、候補タンパク質が発現される細胞を溶解して、ペプチド基質の改変について分析することができる。可溶性候補タンパク質が得られたコロニーの歴史を記録することによって、表現型と遺伝子型との間の必要なリンクを維持する。例えば、宿主細胞での可溶性候補タンパク質の発現についてスクリーニングする本発明の実施態様では、宿主細胞は単純にニトロセルロース膜上でin situで溶解され、ペプチド基質の改変について、例えば抗体、ストレプトアビジン又は改変ペプチド基質を認識する他の検出試薬を用いてブロッティングによって試験することができる。
特殊化されたベクター構築物もまた、所望に応じてタンパク質の精製促進のために用いることができる。前記は、本発明のポリペプチドをコードする配列を、可溶性タンパク質の精製を促進するポリペプチドドメインをコードするヌクレオチド配列に結合させることによって実施される。そのような精製促進ドメインの例には、金属キレートペプチド(例えば、固定金属上での精製を可能にするヘキサヒスチジンタグ及びヒスチジン-トリプトファンモジュール)、プロテインAドメイン(固定免疫グロブリン上での精製を可能にする)、及びFLAG伸長/アフィニティー精製系(Immunex Corp., Seatle, WA)で利用されるドメインが含まれる。切断可能なリンカー配列(例えばXA因子又はエンテロキナーゼ(Invitroen, San Diego, CA)に特異的なリンカー配列)を精製ドメインと候補タンパク質との間に挿入することもまた精製の促進に用いることができる。ビオチンタンパク質リガーゼによって生成されるビオチニル化タンパク質もまたアビジン誘導アガロースを用いて精製することができる。
【0017】
ベクターはまた機能的選別マーカーを含むことができる。前記機能的選別マーカーは、例えば耐性遺伝子(例えばカナマイシン、アンピシリン、ブラスチシジン、カルベニシリン、テトラサイクリン又はクロラムフェニコール)であり得る。ベクターは更に、必須のエレメントを欠く機能不全選別マーカーを含むことができ、この場合は、前記必須のエレメントは前記エレメントをもつ細胞の形質転換の成功に際して核酸エレメントによって供給される。機能不全選別マーカーは、例えば耐性遺伝子又はレポーター遺伝子、例えばlacZ遺伝子などであり得る。もちろんのこと、これらの可能な取り合わせは、反応系の成分のいくつかは生物のゲノムから発現され、いくつかは染色体外エレメント(例えば発現ベクター)から発現され得るように混合することができる。
可溶性候補タンパク質の選別成功の可能性を改善するために、反応系はペプチド基質改変タンパク質の活性に適した条件下でインキュベートされねばならない。例えば、外因性基質改変タンパク質が反応媒体に添加される場合には、この媒体は前記添加されるタンパク質の活性に適した条件化に置かれねばならない。基質改変タンパク質がスクリーニングの方法で用いられる宿主細胞内で発現される場合は、前記宿主細胞は、それら細胞の健常な増殖及び発現されるタンパク質の活性に適した条件下で増殖させなければならない。そのような場合には、基質改変タンパク質をそのコード遺伝子から発現させることができる適切な転写及び翻訳機構が前記系に存在していなければならない。ほとんどの場合、この機構は細胞それ自体に由来するであろう。
【0018】
本方法は複数の候補タンパク質変種のスクリーニングを可能にする。実際、本方法の能力の1つは、非常に大きな数の種々の変種をその活性について平行してスクリーニングすることを可能にするということである。このことは、本方法は高処理分析に馴染みやすいので、所望するならば、特定の1つのタンパク質若しくは複数のタンパク質のあり得る変種の全て又は非常に大きな数について包括的なスクリーニングを実施することが可能であることを意味する。
ライブラリーの作成方法は当分野では周知である。例えば、切端遺伝子ライブラリーはエキソヌクレアーゼIII消化によって構築することができる(Ostermeir & Lutz, “The Creation of ITCHY hybrid protein libraries”, in Methods in Molecular Biology vol.231, pp129-141)。
例えば、可溶化が困難であることが証明されたタンパク質について特定の可溶性変種を同定するために、切断ライブラリーを作成することができる。そのようなライブラリーは、例えばタンパク質のN-末端及びC-末端の一端又は両端でアミノ酸が1つずつ又は複数ずつ徐々に短縮されたものを含むことができる。
好ましい実施態様では、あるタンパク質の可能な全ての切端形が作成され試験される。包括的なスクリーニングが実施されたことが合理的に確信されるためには、各短縮形について少なくとも3倍、好ましくは少なくとも5倍、より好ましくは10倍オーバーサンプルされる必要があるであろう。
切端ライブラリーは、候補タンパク質の一端が固定され、他方の端が変化する増分切端ライブラリーであり得る。例えば、C-末端を固定しN-末端を変化させるか、又はN-末端を固定しC-末端を変化させることができる。そのような戦術の例として、770のアミノ酸のタンパク質については、長さが100アミノ酸を超える(大腸菌で発現されスクリーニングされるタンパク質の小さいほうの凡その実際的サイズ限界)タンパク質を生じる670の切端形が存在する。DNAレベルでは、これは2010のヌクレオチドに対応する。10倍のオーバーサンプルは20,100のクローンの構築及びスクリーニングを必要とするであろう。これらのクローンの1/3はインフレームで、一方2/3はフレームシフトを含み、従って有用なペプチドタグ付加タンパク質を発現しないであろう。
【0019】
切断ライブラリーは、候補タンパク質が両端で短縮された内部フラグメントライブラリーである。この内部フラグメントライブラリーは、特定の固定された末端が何らかの予期し得ない予想に反する問題(例えば発現の問題、従って偏向した又は無用な結果、例えば細胞のタンパク分解に対する感受性又は細胞との毒性反応)を引き起こすようなシナリオの問題を回避する。“N”個の残基をもつ具体的なタンパク質について、ほぼN2/2のフラグメントが存在するであろう。タンパク質のコード配列は正しい方向性を有し、両端でインフレームであることを確認するためには18倍のオーバーサンプリングが要求される。500アミノ酸のタンパク質を例にとれば、前記は2百万の可能な連結生成物をもたらし、従って10倍のオーバーサンプルは2千万のクローンがサンプリングされねばならないことを意味する。
切断の方法は当業者には公知である。このタイプの切断を実施するもっとも簡単な方法は、種々の周知の遺伝子工学技術を用い、コード核酸配列をいずれかの末端又は両端で選択的に欠失させ、続いて所望のコード配列を選択したベクターに挿入することである。好ましくは、候補タンパク質の切断形は、3'及び/又は5'エキソヌクレアーゼ戦術を用い、コード核酸の3'及び/又は5'末端をそれぞれ選択的に侵食させて作成される。切断ライブラリーを作成するために好ましいある方法は、核酸を管理下で又はランダムにエキソヌクレアーゼIIIで消化することで、好ましくは制限酵素消化の使用と組み合わされる。例えば、ある種の制限酵素は3'オーバーハングを残す部位で切断を実施する(例えばNsiI)。他の酵素は5'オーバーハングを残す部位で切断を実施する(例えばNotI)。これら部位の他の部位で切断し、更に3'及び/又は5'エキソヌクレアーゼ酵素を用い、前記反応物を時間を管理しながらインキュベートすることによって、消化の程度及び方向の選択を達成することができる。本発明の方法での使用に適した適切なベクター構築物の例は、本明細書に含まれる実施例に記載されている。また別には、ランダムプライマーを用いる標的遺伝子のPCR増幅を用いて、両端で短縮された遺伝子フラグメントを作出することができる。(Kawasaki et al. “Random PCR-based screening for soluble proteins using green fluorescent protein,” Biochem. & Biophys. Res. Comm. 2001, 280:842-844)。他の等価の方法にはDNAse I消化、超音波処理及びポイントシンクフラグメント化が含まれる。
【0020】
変異が既に実施された変種ライブラリーを作成することができる。変異導入はランダム変異導入であっても、合理的、位置特異的変異導入でもよい。適切な操作方法は当業者には公知で、以下が含まれよう:点変異導入(エラー誘発PCR、化学的変異導入、特定のミュテーター宿主株の使用)、反復アンサンブル変異導入(Delagrave and Youvan (1993) Bio-Technology, 11:1548-1552)、順列組合せカセット変異導入(Black et al. 1996)、DNAシャッフリング(Stemmer et al. 1994)又はコドン置換変異導入。最近のin vitro組合せプロセスにおける改善に関するが異説には以下を参照されたい:Giver and Arnold, 1998, Current Opinion in Chemical Biology, 2(3):335-338)。例えば、特定のアミノ酸を野生型配列から他のアミノ酸に選択的に変異させることができる。そのような変異体には、保存的又は非保存的アミノ酸残基(好ましくは保存的アミノ酸残基)により1つ又は2つ以上のアミノ酸残基が置換されている変種候補タンパク質が含まれ得る。例えば、X線解析のためにより品質の高いタンパク質結晶を得るために結晶化の均質性を改善する目的で、高い構造的可撓性をもつ残基(例えばArg又はLys)を例えばエントロピーが低い残基(例えばAla)に取り替えることができる。そのような置換されるアミノ酸残基は、遺伝暗号によってコードされるものでもあってもなくてもよい。典型的なそのような置換は、Ala、Val、Leu及びIle間で、Ser及びThr間で、酸性残基のAsp及びGlu間で、塩基性残基のLys及びArg間で、又は芳香族残基Phe及びTyr間で生じる。特に好ましいものは、いくつかの(即ち5から10、1から5、1から3、1及び2、又は単に1つのアミノ酸が任意の組合せで置換、欠失又は付加された変種である。特に好ましいものは、前記タンパク質の機能的特性又は活性を変化させない置換、付加及び欠失である。更にまた、これに関して特に好ましいものは保存的置換である。そのような変異体にはまた、1つ又は2つ以上のアミノ酸残基が置換基を含むポリペプチドが含まれる。
【0021】
例えば1つ又は2つ以上のアミノ酸又は候補タンパク質内にループを形成若しくは欠落させるために一連のアミノ酸の挿入物が既に配列に添加された変種のライブラリーを作成することができる。特に親水性アミノ酸が含まれる場合は、候補タンパク質の可溶性の強化をもたらすことができる。
続いてこれらの候補タンパク質ライブラリーを、もっとも高度な可溶性を示す個々の変種についてスクリーニングすることができる。
本発明のこの特徴に従えば、候補タンパク質のライブラリーは、103を超える異なるクローン、104を超える異なるクローン、105を超える異なるクローン、106を超える異なるクローン、107を超える異なるクローン、108を超える異なるクローン、又はそれより多くのクローンを含むことができる。好ましくは、ライブラリーは可能なあらゆる切断形を発現するクローン及び候補タンパク質変種を含む。これは、可能なあらゆる切断形を作出及び試験することは、成功の可能性を大きく高め、可溶性における変種とタンパク質配列の特徴とをリンクさせるために用いることができる大量のデータの解析を可能にするので有利である。更にまた、全ての位置の包括的スクリーニングは、陰性結果をもたらす実験だけを確信して廃棄することを可能にするはずである。
クローンのライブラリーは、その各細胞が異なる候補タンパク質を発現する、複数の形質転換細胞を含むことができる。そのようなライブラリーは、細胞調製物を適切なベクターライブラリーで形質転換することによって作出することができる。適切な条件下では、そのようなベクターによる形質転換は、実質的にただ1つのタイプの候補タンパク質がライブラリーの各細胞で発現されるように実施することができる。これによって、当該核酸から発現されるタンパク質は同じ細胞内に止められ、問題の核酸コード分子の選別が促進される。もし各細胞が複数の核酸分子を含んでいるとしたら、細胞の単離に際して、どの核酸分子が所望の作用を惹起するタンパク質をコードしたかが明確ではないであろう。
【0022】
本発明の部分を構成する選別技術の改善によって、潜在的候補物質の大きなプールで連続的繰り返しが持続され得るように、反復分子進化サイクルの簡単な使用が可能になった。好ましくは、高度に可溶性の候補タンパク質を発現するクローンが、更なるいずれの操作の必要性もなくクローンライブラリーから得られるであろう。しかしながら、本発明の方法によって可溶性であると同定された候補タンパク質の溶解性を最適化するために、配列変異及びスクリーニングの反復工程を実施することは必要であるか又は所望され得るかもしれない。例えば、最初のライブラリーのスクリーニングは可溶性が増進した多数の候補物質の選別を可能にするであろうが、ただし、このライブラリーは、もっぱら不溶性タンパク質又は安定的に発現されないタンパク質を発現するクローンが夾雑しているであろう。しかしながら、次の世代の候補物質を育てるために第一回目のスクリーニング過程の後で選別された可溶性候補物質を用いて反復サイクルを実施することによってこの過程をくり返すことが可能になる。更なる変異とスクリーニングの連続工程を実施することによって、これらか陽性候補物質を更なる可溶性へと発展させることが可能であろう。前記プールの内容はより多くの可溶性(“適合物”)候補物質によってますます占められるようになるであろう。一連の反復サイクルの後、よい結果の候補物質プールを採取し、この候補物質プールを操作し、新しい一連の反復サイクルを更に厳格な選別基準の下で開始するために用いられる新しいライブラリーを作出することができる。好ましくは、ただ1回の操作とスクリーニング工程の繰返しが実施され、より好ましくは3回、更に好ましくは4回又はそれより多くの工程繰返しが実施される。自動化の可能性は、はるかに多くのサイクル、必要ならばおそらく100回、500回又は1000回のサイクルの使用を可能にし得る。
【0023】
本発明の方法論の能力を高処理スクリーニングの方法論で遺憾なく発揮させるために、ライブラリーサイズと等しいスケールでスクリーニングが機能できることが必要である。このタイプの技術の能力を完全に利用するために、コロニーピッカー及び配置ロボットを用いて、平板培養された形質転換体を管理ライブラリーに変換し、更に陽性コロニーについてこれらをスクリーニングするべきである。理想的には、各コロニーは、プレートの特定のウェルに一致する“アドレス”を与えられる。バーコードの使用がアドレス付与を促進することができる。場合によって、ライブラリーは安全のために正確に複製することができる。好ましくは、コロニーのスクリーニング及び選別は、96のピンピッキングヘッドなどを組み合わせたビデオ技術を用いて自動化される。384ウェルプレートは、より多くのコロニーのスクリーニングを可能にすることによってこのプロセスを加速することができる。この技術を用いて、ほぼ2500コロニー/時間のピッキング速度が容易に達成される。
本発明の方法を実施するために好ましい方法論では、形質転換体ライブラリーは、LB寒天上のニトロセルロース膜への接種物として配置され、コロニーアレーが生成される(Buessow et al. 1998 Nucleic Acids Research 26:5007-5008)。タンパク質の発現は、例えばIPTG及びビオチンを含む寒天に前記の膜を移し、更におよそ3時間適切な温度で増殖させることによって誘発される。続いて細胞をin situで溶解する。その後大規模ドットブロット分析をタンパク質及び/又はDNAの内容物のために実施することができる。この方法では、22x22cmの膜につき60,000クローンを配置し試験することができる。このようなアッセイ様式の使用は、コロニー自体が発現容器として機能し、更にそのように多くのクローンの発現および試験の表記を極めて簡便にできるのでマイクロタイタープレートでクローンを発現させるよりも利点を有する。容易にデコンボルーションすることができる幾何学的配置で配置される場合は、発現レベルおよび溶解性レベルの定量はアレー解析ソフトウェアを使用することにより促進される。クローンを発現レベルに従って並べて、優先順位を付けることができる。前記方法は、多数のアッセイ点を容易にかつ平行して処理すること及びアッセイデータを簡単に最初の物理的クローンに遡ることを可能にする。
【0024】
このタイプの方法論では、配置されたコロニーの細胞性タンパク質は、水酸化ナトリウムに浸したパッドにコロニーを含む膜を静置することによって、in situで細胞を溶解した後で膜上に沈積される。タンパク質はタグに対する抗体によって検出することができる。前記抗体は翻訳後改変(例えばビオチニル化)に対して感受性がなく、これによってタンパク質収量の判定が可能になるが、ただしタンパク質の可溶性の状態は提示されない。より重要なことには、タンパク質は、クローンの可溶性の状態に感受性を有する検出方法を用いて検出することができる。例えば可溶性を表示するタンパク質の翻訳後ビオチニル化の場合には、ストレプトアビジン結合によって、タグが改変さているか否かについての読み出しが提供される。更にまた、発現状態に関する有用な情報は、抗体及びストレプトアビジンシグナルを例えばXY分散グラフで比較し、それによって総タンパク質の可溶性分画の概算を可能にすることによって得ることができる。ストレプトアビジンがペルオキシダーゼ又はアルカリホスファターゼに結合されている場合は、検出は化学発光によるか、又は蛍光色素と結合させることができる。可視化は蛍光画像化によって実施することができる。続いてビオチン陽性と同定されたクローンをライブラリーから単離し、通常の方法で試験して可溶性発現を証明することができる。従って、ビオチン陽性表現型を示すクローンを液体培養液中で増殖させ、IPTGの添加によりタンパク質発現を誘発し、更に可溶性状態は、溶解、及びその後での、例えば遠心又はろ過による溶解物の不溶性及び可溶性調製物への分画によって確認することができる。続いて、タンパク質を分析し、例えばSDS-PAGE及びウェスタンブロットによって性状を決定することができる。
従って、抗体及びストレプトアビジンのプローブで精査した複製膜の比較によって、個々の変種(例えば切端形)の可溶性の状態を、発現又は非発現、可溶性又は不溶性として読み出すことが可能になる。この方法では、“発現マップ”の作成は、ただ1つのアミノ酸解析度で切断の影響を測定することを可能にすることができる。これは、構造生物学者がタンパク質発現のための構築物を設計するときに必要とするタイプの情報であり、タンパク質発現に影響を与える因子のより深い理解をもたらし得る。
【0025】
更に詳細には、クローンの配列決定を実施して、切端の正確な実体を同定し、更に結合物及び複製物を同定することができる。これらのデータを用いて、クローンを発現レベル及びサイズによって優先順位を決定し、コード遺伝子配列内の短縮点に対して構築物の可溶性を相関させる可溶性発現マップ(図6)に含まれる情報を形成することができる。図6から分かるように、コード遺伝子の配列に従って並べた種々のクローンの可溶性の程度を示す図から明白な順位が存在する。類似の可溶性レベルは連続的短縮を有する構築物で明白で(マーカー点を一続きで示す直線を参照されたい)、これらは溶媒暴露リンカー中の連続残基領域に一致すると考えられる。対照的に、難溶性のギャップが、タンパク質内の構造形成領域内に含まれる短縮境界から明らかである(図11の“結合ドメイン”と記されている領域を参照されたい)。このタイプの解析は、タンパク質構造(例えばドメインの境界及びタンパク質の一次構造における残基の溶媒暴露の度合い)に関する情報を明らかにするために、切端タンパク質変種の可溶性の徹底的解析を可能にすると、本明細書では仮説が立てられている。従って、更なる特徴では、本発明は、タンパク質の構造に関係する情報を得る方法を提供する。前記方法は、上記に記載した本発明の実施態様のいずれかのスクリーニングの方法を実施し、タンパク質配列内に短縮点を有する各構築物の可溶性に関する情報を相関させることを含む。好ましくは、本発明の実施態様のいずれかから得られたデータを用いて、コード遺伝子配列内の短縮点に対して構築物の可溶性をプロットすることによって可溶性発現マップを作成する。溶媒暴露リンカー領域は、顕著な可溶性を有する連続残基の領域として同定される。溶媒暴露リンカー領域間のギャップは、タンパク質配列内の構造形成領域として同定される。溶媒暴露残基と構造形成領域との間の屈曲点はタンパク質配列内のドメイン境界として同定される。
上記のアレー様式での発現試験の前に、遺伝子切端ライブラリーの品質を遺伝子フラグメントのサイズ分布の解析によって測定するべきである。そのような性状決定は典型的には、挿入物にフランキングするプライマーによるPCRスクリーニングを必要とする。これは、挿入物のサイズの見当を提供する。続いて、その認識部位内にATGを含む制限酵素(例えばNdeI)によってPCR生成物を消化することにより、開始コドンを確認することができる。前記アレー様式での発現検査及びライブラリーから陽性物の単離に続いて、クローンの配列決定を実施して短縮の正確な実体を同定することができる。
【0026】
上記に記載した方法論と併せて、好ましくは適切なコントロールを用いて、偽陽性及び偽陰性結果が勘定に入れられていないことを担保するべきである。例えば、陽性コントロールは、このスクリーニング条件下では可溶性であることが判明しているタンパク質を用いるべきである。陽性コントロールの例はマルトース結合タンパク質(MBP)でもよく、前記に対してペプチド基質が融合される。このタンパク質は可溶性で発現され、従って基質改変タンパク質によってペプチド基質の改変を受ける。候補タンパク質に融合させたビオチニル化ペプチドを利用する本発明の実施態様では、陽性コントロールクローンは、従ってビオチニル化ペプチドと融合したMBPであろう。陰性コントロールは、例えばペプチドコード配列内にフレームシフトを含むクローでもよい。前記ペプチドは発現されないか、又は発現されるが可溶性タンパク質とは融合されていない。また別の、更に場合によって補足的陰性コントロールクローンは不溶性タンパク質を前記ペプチドと一緒にインフレームでコードすることができる。不溶性であるので、前記ペプチドは、基質改変タンパク質のための効率的な基質として機能することができない。
本発明の更に別の特徴は、上記に記載した方法論に従って用いられるキットに関する。例えば、候補タンパク質の可溶性変種を同定する適切なキットは以下を含む:
(a)宿主細胞内で変種候補タンパク質を発現させる発現ベクターであって、前記ベクターが、ビオチニル化ペプチドをコードする配列が前記候補タンパク質をコードする問題の遺伝子と遺伝子的に融合され得るように、前記問題の遺伝子の挿入を可能にさせる制限部位を含む、前記発現ベクター;
(b)ビオチニル化ペプチドをコードする核酸と遺伝子的に融合されたマルトース結合タンパク質を発現する陽性コントロールベクター;
(c)(b)と同じであるが、ビオチニル化ペプチドコード配列内にフレームシフトを含み、従ってマルトース結合タンパク質がビオチニル化されない陰性コントロール;及び
(d)不溶性タンパク質をビオチニル化ペプチドとインフレーム発現する更なる陰性コントロールベクター。
前記キットはまた、問題の候補タンパク質をコードする遺伝子の切断ライブラリーを作成し、更に前記切断形が前記ペプチド基質をコードする配列と融合され得るように前記切端形をクローニングするための指示を含むことができる。
本発明の種々の特徴及び実施態様をこれから例示として更に詳細に述べる。詳細部分の改変は本発明の範囲から外れることなく実施し得ることは明白であろう。
【0027】
結果及び方法
実施例−本方法論の概念の証明に以下を用いた:1)以前に発現されなかったタンパク質をコードする候補遺伝子及び2)実証目的のために既知の構造をもつタンパク質をコードするヒトNF-κB遺伝子。
問題の挿入遺伝子によってコードされるタンパク質のN-末端短縮の分析を可能にするベクターの構築:
可溶性スクリーニングにおける普遍的使用のためのプラスミドは、先ず初めに、切端プロセスを可能にする対応する特徴とともに問題の遺伝子を含むベクターをアッセンブリングすることによって構築した。この最初の構築物は候補遺伝子の分析に用いたが、更にまた、他の興味のある任意の遺伝子をクローニングするためのプラスミドの供給源としてもまた、候補物の読み枠を直接別のものに単に置き換えることによって用いた。候補遺伝子を含む構築物の構築を記載し、その後で無関係の別個の遺伝子、NF-κBを含む派生構築物の構築を述べる。
a)候補遺伝子のPCR:
候補遺伝子は開放読み枠を含む以前のプラスミドからPCRによってクローニングした。PCR反応は、PWOポリメラーゼ(Roche)を用い提供された指示に従って50μLの反応物で実施した。PCR構築は、大きなオリゴのプライミングによって生成された最初のアンプリコンを外側の小さなプライマーが増幅するという方法で以下の4つのオリゴヌクレオチドのプライマーを用いた(反応の効率を高めるため):
60nMのfor1、[5'-GATCCTAGCATATGAAATGCATGGATCCGCGGCCGCTGAXXXXXXXXXXXXXXXXXXXXXXXXXXX-3'](ここでXは、ATG開始コドンを省略した、候補遺伝子配列に相補的な塩基を示す);
60nMのfor2、[5'-GATCCTAGCATATGAAATGCATGG-3'];
60nMのFse1rev1、[5'-GATCCTAGGGCCGGCCXXXXXXXXXXXXXXXXXXXXXXXXXXX-3'];
及び600nMのFse1rev2、[5'-GATCCTAGGGCCGGCCXXXXX-3']。
PCRの条件は94℃で2分、続いて25サイクルの94℃で30秒、45℃で30秒、72℃で2分であった。
PCR生成物を1%TBEアガロースで電気泳動し、バンドを切り出し、更にQIAEXIIキット(Qiagen)を用いてDNA生成物を精製した。クローニング用挿入物を作成するために、1μgの前記PCR生成物をNdeI及びFseで完全に消化し、続いて2230bpのDNAフラグメントをQIAEXIIによりゲル精製した。
【0028】
b)ビオチニル化ペプチドをコードするDNA及び候補PCR生成物をクローニングするための適切な制限部位を含むベクターの構築:
オリゴヌクレオチドカセットは以下の2つのオリゴ、biot-1_for及びbiot-1_revをアニールすることによって作成した:
Biot-1_for、[5'-AGCTTGCTTGGTGGCGGTCTGAACGACATCTTCGAGGCTCAGAAAATCGAATGGCACGAATAATGAG-3']、及び
Biot-1_rev、[5'-AGCTTCTCATTATTCGTGCCATTCGATTTTCTGAGCCTCGAAGATGTCGTTCAGACCGCCACCAAGCA-3']。これをpMAL-c2g(New England Biolabs)のHindIII部位に連結して中間体プラスミドpMAS103を形成し、続いて前記をNdeI及びFseIで消化した。5521塩基対フラグメント(ベクターの骨格)を上記のようにゲル精製し、シュリンプアルカリホスファターゼ(Amersham)でリン酸化した。
【0029】
c)PCR生成物の大腸菌発現ベクターによるクローニング:
続いて2230塩基対の候補遺伝子挿入物を5521塩基対のpMAS103由来骨格にT4DNAリガーゼ(Rapid Ligation Kit, Roche)を用いて連結し、その後PCR Quickカラムを用いて反応物を脱塩し、更に10mMのトリス-Cl(pH8.0)の35μL中に溶出させた。2μLの脱塩連結反応物を用いエレクトロポレーションにより大腸菌株DH5αを形質転換し、SOC培養液中で1時間回復させ、LB寒天(アンピシリン70μg/mL補充)で平板培養した。プラスミドをいくつかのコロニーから単離し、制限消化及びDNA配列決定によって性状を調べ、構築物pHAR1111(図1参照)の正確さを確認した。
プラスミドpHAR1111を候補遺伝子の遺伝子切端実験に用いた。前記はまた他の遺伝子の解析のための出発ベクターとしても用いられた。即ち、候補遺伝子をNotI及びFseIによるプラスミド消化によって切り出し、適合するNotI及びFseI部位(PCRによって導入)を開放読み枠の開始コドン及び終止コドンに対して同じ位置に有する遺伝子を連結することによってまた別の遺伝子が挿入された。
例えば、ヒトNF-κB遺伝子は、内部NsiI部位のサイレント除去のために、先ず初めに変異させた。続いて前記を以下のオリゴヌクレオチドプライマーを用いてPCRにより増幅させた:NfkBfor1、[5'-GGATCCGCGGCCGCTGAGCAGATGGCCCATACCTTCAAATATTAGAGC-3'] 及び NfkBFseRev1、[5'-GGGATCCGGCCGGCCCCTTCTGACGTTTCCTCTGCACTTCTTC-3']。その結果、本来の開始コドンが除去された遺伝子が得られた。このPCR生成物をNotI及びFseIで消化し、pHAR1111のNotI及びFseI消化によって誘導したベクター骨格に連結した。従って、NF-κB遺伝子は、問題の遺伝子によってコードされるタンパク質のN-末端欠失と適合する形態で作出された(ベクターpHAR1112;図2)。
要約すれば、2つの類似のベクターが5'欠失ライブラリーの作成を可能にするように生成された:pHAR1111は以前に発現されなかった候補遺伝子を含み、pHAR1112は転写因子NF-κB(実証目的に用いることができる既知の構造をもつタンパク質)のための遺伝子を含んでいた。
【0030】
d)問題の挿入遺伝子によってコードされるタンパク質のC-末端短縮の解析を可能にするベクターの構築:
ベクターpMAS103(上記に記載)は、問題の遺伝子の3'末端での消化を可能にする第二の構築物の土台を形成した。ここでは、候補遺伝子は、開始コドン(ATG)がNdeI部位に存在し(CATATG)、更にpMAS103ベクターのBamHI、XbaI、SalI又はHindIII部位と適合する任意の形態の末端(適合オーバーハングとして又は平滑端連結によって)が終止コドンに続くDNAフラグメントとして完全長でクローニングされた。
これを実証するために、ヒトNF-κB遺伝子を別のプラスミド(pHAR307)(C-末端ヘキサヒスチジンタグ(タグは本実験で重要ではない)をコードするDNAと融合された遺伝子を含む)からNdeI及びBamHIによって切り出した。このフラグメントを、NdeI及びBamHIで消化して調製したpMAS103ベクター骨格に連結した。
要約すれば、プラスミドpNAS106(図3)は、NF-κB挿入物をこの遺伝子によってコードされるタンパク質のC-末端欠失に適合する形態で含む。NF-κBのタンパク質構造は十分に性状が調べられているので、前記をこの後で実証の目的に用いた。
【0031】
切断プロトコル(以前に発現しなかったタンパク質の遺伝子を含むベクターpHAR111について記載)
切端プロトコルはITCHY法(M. Ostermeier & S. Lutz, Methods in Molecular Biology “The Creation ITCHY Hybrid Protein Libraries” 231:129-141)に従って実施した。簡単に記せば、問題の遺伝子を酵素により末端短縮するために、10μgのプラスミドpHAR1111をNotI及びNsiIで完全に消化した。4μgの精製した直鎖状ベクターを1x緩衝液(New England Biolabs)、80mMのNaCl(緩衝液中のNaClに更に加えて)中で最終容積120μLに希釈した。直ちに30μLを150μLのPB緩衝液(Qiagen)に取り出し、t=0秒のコントロールを作成した。残りの90μL(22℃)に、150単位のエキソヌクレアーゼIIIを添加し混合した。30秒間隔で、0.5μLの酵素-DNA反応物を取り出し、ただ1本の300μLのPB緩衝液を含む氷上の“停止試験管”に加えた。前記を合計1時間、90μLの反応混合物が移されるまで続けた。残りの30μLはt=1時間のコントロールを構成し、これもまた150μLのPB緩衝液に添加した。3つの反応物(t=0時間、t=1時間、及びライブラリー)をPCRクリーンアップスピンカラム(Qiagen)を用いて清澄にし、それぞれ30μL、30μL及び50μLのEB緩衝液に溶出させた。コントロールサンプルはゲルで解析し、エキソヌクレアーゼ反応を確認した(データは示されていない)。
エキソヌクレアーゼ消化後に残留した一本鎖のオーバーハングを除去するために、50μLのライブラリー混合物を1xのマングビーンヌクレアーゼ(MBN)緩衝液(New England Biolabs)で希釈し、3単位のMBN酵素をほぼ55μLの最終容積に添加した。続いてこの反応物を37℃で30分インキュベートした。PCRクリーンアップスピンカラムを用いて前記反応物を清澄にし、65μLのEBに溶出させた。
連結前にベクターの末端を平滑にするために、48μLのライブラリーDNAを、2.5mMのdNTP及び1単位のT4 DNAポリメラーゼを含む1xのT4 DNAポリメラーゼ緩衝液で最終容積100μLに希釈した。前記反応物を12℃で20分インキュベートし、続いてEDTAを10mMの最終濃度で添加し更に75℃で20分加熱することによって反応を停止させた。
前記反応混合物を0.5%TBEアガロースゲルにロードし、電気泳動を実施してDNAフラグメントをサイズによって分離した。興味のあるサイズ範囲(>5.5kb)にあるDNAをゲルから切り出し、QIAEXII樹脂(Qiagen)を用いて精製し、60μLのEBに溶出させた。
切断遺伝子フラグメントを含む直鎖状ベクターに対応するサイズ選別DNAを、以下のようにしてT4 DNAリガーゼによって再環状化させた:QIAEXII精製から得たDNA溶液の8μLを製造元の指示に従って試薬(Roche Applied Science Ligation Kit)とともにインキュベートした。PCRクリーンアップスピンカラムを用いて前記連結混合物を脱塩し、2μLを用いて大腸菌DH5αコンピテント細胞をエレクトロポレーションによって形質転換した。SOC培養液中で前記形質転換混合物を回復させた後、前記ライブラリーを22cm平方の寒天プレート(Genetix, UK)で平板培養した。37℃で一晩増殖させた後、24,000個のコロニーを寒天から掻き取り、PBSに再懸濁し、ミニプレップキット(Qiagen)を用いて少量の細胞からプラスミドを調製した。このプラスミドを用いて大腸菌のタンパク質発現株、BL21コドンプラスRIL(Stratagene)を形質転換した。短縮物の均質なサイズ分布は、フランキングプライマーによる96クローンのコロニーPCRスクリーニング及びアガロースゲル電気泳動によって確認した。
【0032】
ライブラリーのロボットによる操作
コロニーピッキング:
プラスミドライブラリーで形質転換したBL21コドンプラスRIL(Stratagene)を22cm平方のLB寒天プレート(アンピシリン70mg/mL;クロラムフェニコール30mg/mL)でほぼ4,000コロニー/プレートで平板培養し、30℃で増殖させた。Kバイオシステム・グリッダーピッカーロボットを用いて、26,880個のコロニーを自動的に384ウェルプレートに釣り上げた。前記ウェルはアンピシリン及びクロラムフェニコールを補充した70μLのLB-HBFM培養液/ウェルで満たされていた。液体培養をHiGroシェーカー・インキュベーター(Genomic Solutions)で、30℃で一晩培養し飽和させた。
ニトロセルロース膜を四角く切り、22cm平方のLB寒天プレート(アンピシリン及びクロラムフェニコールを補充)の上に載せた。グリッディングピンツール及び配置ロボットを用いて、前記平板培養を高密度で前記の膜にプリントした。続いてプレートを25℃で一晩、裸眼でコロニーが見えるようになるまでインキュベートした。前記の膜を寒天から取り出し、新しいLB寒天平板(アンピシリン及びクロラムフェニコールを補充)上に置いた。前記寒天平板にはIPTGが最終濃度0.1mMで補充され、コロニー内の組換えタンパク質発現が誘発された。即座溶解及びビオチニル化ペプチドに対する抗体によるこの時点での全アレー検出によって、タンパク質(可溶性又不溶性;図4)を発現するコロニーが検出される。膜を30℃で4.5時間インキュベートし、前記誘発寒天から取り出し-80℃に置いた。分析の前に、前記膜を室温に温め、0.5MのNaOH、1.5MのNaClに浸したろ紙上に室温で10分静置した。続いてこの膜を、1Mトリス-HCl(pH7.5)、1.5MのNaCl中で2x5分、続いて2xのSSC緩衝液中で15分処理により中和した。続いてこの膜をスーパーブロック(Pierce)で一晩封鎖した。
【0033】
ストレプトアビジン及びペプチドタグに対する抗体によるハイブリッド形成
発現タンパク質の検出:
抗アビタグマウスモノクローナル抗体(Avidity)を1:7500に40mLのPBS-Tで希釈し、ローラーブロット・ハイブリダイゼーションオーブン(Techne)中で2時間室温で添加した。続いて膜をPBS-T緩衝液で3回、各回5分洗浄した。抗マウスペルオキシダーゼ結合物を40mLのPBS-Tで1;25,000に希釈し、ローラーブロット・ハイブリダイゼーションオーブン(Techne)中で1時間室温で添加した。続いて膜をPBS-T緩衝液で3回、各回5分洗浄した。タンパク質の検出は、セイヨウワサビペルオキシダーゼのための化学発光基質(Amersham ECL試薬)及びオートラジオグラフィーを用いて実施した。シグナルはデンシトメトリーによって定量した。
膜のストリッピング:
前記膜をストリッピング緩衝液(PBS;2%(w/v)SDS;100mMベータメルカプトエタノール)中で30分、室温でインキュベートして抗体を除去した。続いてこの膜をPBS-Tで30分洗浄し、続いてスーパーブロックで封鎖した。
ビオチニル化タンパク質の検出:
過剰の封鎖試薬をPBS-Tで5分洗浄することによって取り除いた。ストレプトアビジン-セイヨウワサビペルオキシダーゼを40mLのPBS-Tで1;25,000に希釈し、ローラーブロット・ハイブリダイゼーションオーブン(Techne)中で1時間、室温で膜に添加した。続いて膜をPBS-T緩衝液で3回、各回5分洗浄した。タンパク質の検出は、セイヨウワサビペルオキシダーゼのための化学発光基質(Amersham ECL試薬)及びオートラジオグラフィーを用いて実施した。図5は可溶性タンパク質についてのストレプトアビジンスクリーニングの結果を示す。結果は、誘発及び細胞溶解前のIPTG誘発デュープリケートアレーから得られた結果が示されている(それぞれ図5a及び5b)。IPTG誘発タンパク質発現の証拠は二番目の膜で観察できる(5b)。
検出のためのより定量的なまた別の方法は蛍光を使用し、上記の化学発光に加えて提供される。候補遺伝子の同じライブラリーを上記のアレーのように調製し、続いて蛍光アレキサ488-ストレプトアビジン結合物(Molecular Probes)を用いてビオチニル化タンパク質を検出した。続いてタイフーン画像化装置(Amersham)を用いて前記の膜をスキャンし、ヴィジュアルグリッド・ソフトウェア(GPC Biotech)を用いて画像を解析した(図16)。
【0034】
データ解析:
アレーのシグナルはデンシトメトリーによって定量し、画像分析ソフトを用いてクローンを発現レベルについて並べて(5c)更なる実験のために優先順位を付けた。解析した27000クローンのうち約300を、前記データが可溶性タンパク質発現を表示したので更なる分析のために選んだ。
非選別及び選別クローンの解析:
アレーデータから可溶性の安定なタンパク質であると同定された、pHAR1111の以前には発現されなかった候補遺伝子のライブラリークローンを、ピッカー-グリッダーロボットの再配置機能を用いて、凍結バンクからロボットにより抽出した。挿入物のサイズを、フランキングプライマーによる96クローンのPCRスクリーニング及びアガロースゲル電気泳動を用いてスクリーニングした。ライブラリーの品質を決定するために、比較用ライブラリー由来のクローンのランダム選別について同じ解析を実施した。ランダムに釣り上げたクローンのPCRの結果は図15に示されている。このPCRデータを示すグラフが図14に提示されてあり、切断形の長さの分布は直線的で比較的偏りがないことが観察される。NdeIを用いてPCR生成物を消化し開始コドンが確認された。蛍光分析から最も可溶性の発現クローンであると同定されたクローンのPCR解析は図17に示されてあり、切断形のサイズの分布はもはやランダムではなく、類似のサイズの周囲でクラスターを形成することが明瞭である。
最初の96個の最良の発現クローンのタンパク質発現(同じライブラリーであるがより初期の化学発光検出から得られたもの)はウェスタンブロットによって実証され、発現溶解物のろ過分画によって可溶性であることが確認され(図13)、更に予想した挿入物サイズと一致することが確認された。
続いて以前に発現されなかった候補遺伝子の可溶性発現クローンを、ベクター特異的プライマー(切断遺伝子を超えて読みとりを行う配列を有する)を用いて配列決定して、正確な短縮境界の実体及び複製物(この場合同じクローンが何度も回収された)の両方を同定した。後者は、このタンパク質の各位置が平均して7倍検査されたために生じた。これらのデータを用いて、実験的に決定したクローンを可溶性発現マップ(図11)をもたらした完全長遺伝子に対してアラインメントを実施した。そのようなマップは固有であり、タンパク質について以前には決して作成されなかった。前記マップは、切り縮めて可溶性タンパク質を生じることができるタンパク質内の位置を示す。多数のクローンが同定され、これらは更に、a)ストレプトアビジンでプローブしたとき、膜アレー又はウェスタンブロットで高いシグナルを生じる(即ち良好に発現する)ものを選別することによって、b)連続するアミノ酸が短縮点として同定されたとき最小であるものを選別することによって優先順位をつけることができる。後者は、クローンがX線結晶学のために用いられるときは有利である。なぜならば、秩序だった末端をもつコンパクトなタンパク質は無秩序な付加ペプチドを有するタンパク質よりも効率的に結晶化するからである。この情報解析は、本スクリーニング方法の高処理特性によって可能となる実験のオーバーサンプリングによってのみ可能である。
コード遺伝子の配列に従って並べた種々のクローンの可溶性の程度を示す図から明白な順位が存在するのが分かる。類似の可溶性レベルは連続的な短縮を有する構築物で明白で(マーカー点を一続きで示す直線を参照されたい)、これらは溶媒暴露リンカー中の連続残基領域に一致すると考えられる。対照的に、難溶性のギャップが、タンパク質内の構造形成領域内に含まれる短縮境界から明らかである(図11の“結合ドメイン”と記されている領域を参照されたい)。
このタイプの解析は、タンパク質構造(例えばドメインの境界及びタンパク質の一次構造における残基の溶媒暴露の度合い)に関する情報を明らかにするために、切端タンパク質変種の可溶性の徹底的解析を可能にすると、本明細書では仮説が立てられている。これは、本発明のまた別の特徴を構成する。
【0035】
タンパク質発現:コロニー対液体
図13は、LB培養液で増殖させ、溶解し更に可溶性部分に分画した陽性クローンのウェスタンブロット分析を示す。広い範囲の発現レベルが明瞭であるが、ただし10kDa、20kDa及び30kDaのクラスターを識別することができる(前記は可溶性発現マップでもまた明瞭である(図11))。完全長のタンパク質は86kDaであり、より大きな構築物が存在しないことは、この特定の標的の構造の結果であると考えられる。この結果はまた、コロニーで測定されるタンパク質発現は、より標準的な液体培養様式のタンパク質発現と良好に相関することを示している。
タンパク質発現のスケールアップ及び更なる性状決定:
精製されたタンパク質を発現すると上記で同定された遺伝子構築物の1つを、より強いT7系プロモーターの使用によりタンパク質発現の改善のために、及びN-末端にTEVプロテアーゼで切断して除去できるヘキサヒスチジンタグを添加することにより精製を促進するために、pTriEX誘導ベクター(Novagen)(図19)でサブクローニングした。この特別な構築物の発現はほぼ40mg/mLで良好であり、容易に精製できる物質をもたらす。このことは、精製分画のSDS-PAGE分析によって示される(図18)。本明細書で示される精製タンパク質は、NMRを用いて折り畳みについての性状が調べられ、N15標識物質のHQSCスペクトルは図21に示されている。このタンパク質の完全な構造解析がNMRによって実施され、以前は決して十分に過剰発現されることがなかったタンパク質が確かに折畳まれ可溶性で球状のドメインを含むことが示され、従って本発明の有用性を明示した。このクローンはまた結晶化実験にも用いられた。
更にまた、この標的の二番目に大きい30kDa タンパク質がクローンの選別の手引きとなる可溶性発現マップ(図11)から得られた情報を用いて生成され、前記は、上記に由来するより小さなドメインにプラスしてもう1つの20kDaの物質を含んでいる。これは少なくとも2つのドメインを含むと期待される。このタンパク質は、pTriEX系(図19)及びpMALベクター(New England Biolabs)(前記は容易に精製できるマルトース結合タンパク質融合物を生成し、本明細書の図20に示されている)の両方で効率的に発現される。
【0036】
NF-κBの分析:証明の目的のために既知の構造をもつタンパク質を利用する本発明のまた別の例
上記で詳細に示した第一の例は、本研究の前にはタンパク質を発現させることができなかったので以前には取り扱いが困難なタンパク質であった。しかしながら、本方法を更に実証するために、同じ方法を既知の構造を有するタンパク質に関して実施することがまた必要であろうと考えた。タンパク質NF-κBはよく規定されたドメイン構造を有するので選択した。N-末端短縮用のpHAR1112(図2)及びC-末端短縮用のpMAS106(図3)を用いて2つのライブラリーを構築した。このライブラリーは、エキソヌクレアーゼ切端工程の前にpMAS106をFseI及びXbaIで消化した点を除いて上記の実施例のように構築した。
pMAS106から得たC-末端切断形の品質は、上記のようにフランキングプライマーによる遺伝子フラグメント挿入物のPCRによって測定し、結果は図6に示されている。コロニーアレーは、アレキサ488-ストレプトアビジン結合物を上記に記載したように用い、蛍光法により分析した。陽性クローンをピッカー-グリッダーロボットのチェリーピッキング機能を用いて主要ライブラリーから単離し、最も強い96クローンをPCRによって分析した。結果(図7)は、2つのサイズのDNAクラスターを示し、前記クラスターはほぼ25kDa及び40kDaのタンパク質をコードすると予測される。これらの予想サイズは、NF-κBのドメイン構造と良好に相関性を示す(図8)。最初の48クローンはLB液体培養で発現し、総溶解物及び可溶性溶解物を調製した。ウェスタンブロット(図9)による分析は、全てのタンパク質が全体として可溶性であること、及び、厳密に観察したタンパク質サイズはPCRスクリーニングの予想サイズと一致することを示した(図7)。全ての可溶性クローンの配列を決定し、更に切断によって作出された新規なC-末端をNF-κBのための可溶性発現マップをもたらしたタンパク質配列に対してアラインメントを実施した(図10)。前記タンパク質のドメイン構造が明瞭に示され、更にドメイン端は、各ドメインの最小で最もコンパクトな形態を選択することによって単一アミノ酸の解析度でマップされた(図12)。2ドメインの40kDa及び1ドメインの25kDaの構築物は、DNA結合について機能的であると学術文献に以前に性状が示された。従って、ランダムに切端されたNF-κB遺伝子の可溶性発現についてスクリーニングすることによって同定された前記ドメインは可溶性であり機能的である。
【図面の簡単な説明】
【0037】
【図1】ビオチニル化ペプチドをコードするDNAに3'末端でインフレーム融合された候補タンパク質遺伝子をコードし、更に前記タンパク質のN-末端切断シリーズの作成を可能にするように設計された前記遺伝子の5'末端に制限部位を有する、プラスミドpHAR1111を示す。
【図2】ビオチニル化ペプチドをコードするDNAに3'末端でインフレーム融合したヒトNF-カッパB遺伝子をコードし、更に前記タンパク質のN-末端切断シリーズの作成を可能にするように設計された前記遺伝子の5'末端に制限部位を有する、プラスミドpHAR1112を示す。
【図3】3'末端のビオチニル化ペプチドをコードするDNAに関してはインフレームではないが、5'末端近くでヒトNF-カッパB遺伝子をインフレームでコードし、更に前記タンパク質のC-末端切断シリーズの作成を可能にするように設計された前記遺伝子の3'末端に制限部位を有するプラスミドpMAS106を示す。
【図4】発現分析を示す。写真1aは即座溶解後にペプチドに対する抗体でプローブした全アレーを示す。全ての発現(可溶性発現ではなく)がはっきりと見える。
【図5】可溶性を示すビオチニル化タンパク質の区別を示す発現分析である。図5a及び5bには6つのうちの1つの視野が示されて、5x5のアレーを含む(24プレート/視野)。タンパク質はストレプトアビジン-セイヨウワサビ結合物の結合により同定される。結果は、細胞溶解前に誘発されなかった複製アレー(図5a)及びIPTG誘発アレー(図5b)から得られた。IPTG-誘発タンパク質発現の証拠は第二の膜で観察することができる。スライドは、画像解析ソフトウェア(VisualGrid; GPC Biotech)を用いて定量的に解析される(図5c)。
【図6】切端NF-κB挿入物のPCRによるサイズ分けによって、ランダムなサイズ分布が明らかにされた。
【図7】フランキングオリゴヌクレオチドを用いる発現プラスミドのPCRによってサイズ分けされたDNAフラグメント。可溶性切断NF-κBタンパク質を発現するクローンは、1つ及び2つのドメイン構築物(予想されるサイズはほぼ25kDa及び40kDa)を示す2つのクラスターを構成することができる。
【図8】C-末端から短縮されたときの1つ及び2つのドメインタンパク質フラグメントのサイズを示すNF-κBタンパク質の構造。
【図9】ウェスタンブロットによる、もっとも高い発現を示す48のNF-κBクローンのタンパク質発現スクリーニング。各クローンについて、全体(T)及び可溶性分画(S)との間に顕著な相違はなく、スクリーニングによって同定されたクローンは可溶性であることを示している。大腸菌の内在性BCCPタンパク質のかすかな発現もまた観察される。なぜならば前記は細胞内のただ1つの他のビオチニル化タンパク質だからである。
【図10】完全長の遺伝子配列を用いた、短縮3'末端のDNA配列決定データの最後の18塩基対のアラインメントによる正確な短縮末端の決定を示す。
【図11】可溶性と遺伝子短縮点とを相関させた、以前に非発現とされたタンパク質をコードする遺伝子の可溶性発現マップを示す。N-末端短縮ライブラリーの構築時に作出された新規な開始コドンの位置が完全長遺伝子配列に対してアラインメントされる。2400の位置のうち、61が可溶性タンパク質発現を示唆している。図はバイナリーアウトプット(閾値限界を超える発現対非発現)を表しているが、いくつかのクローンは他のものよりはるかに良好に発現する(低発現及び高発現の例は表示されている)。
【図12】予め定めた完全長タンパク質構造物を用いるランダムスクリーニングによって同定した可溶性発現NF-κB構築物のアラインメント。ドメイン境界の高解析決定はドットで印を付したクローンから明白である。これらは1-及び2-ドメイン構築物のもっともコンパクトな形態である。
【図13】ウェスタンブロット分析を用いて特定されるタンパク質発現。プラスミドpHAR1111内の遺伝子の切断ライブラリーから得られた96の陽性クローンをLBで増殖させ、分画し可溶性分画をStr-HRPを用いてウェスタンブロットで分析した。いくつかの代表的なクローンが示されている。ウェスタン分析に由来する組換えタンパク質は、図11の可溶性発現マップから明白なように、3サイズ範囲(約10、20、30kDa)に従ってクラスターを形成する。内在性宿主タンパク質BCCPもまた表示されている。
【図14】プラスミドの消化によって明らかにされた、プラスミドpHAR1111(図1参照)の遺伝子挿入物のサイズ分布。ここで実施されたエキソヌクレアーゼ短縮プロトコルは、全てのサイズを含む標的遺伝子のランダムな短縮物のスクリーニングを可能にする、直線的で比較的偏りのない遺伝子フラグメントのサイズ分布を生じることが明らかである。
【図15】プラスミドpHAR1111に由来するランダムに切断された遺伝子のPCR分析の結果で、可溶性スクリーニングの前のライブラリー内クローンのサンプルのサイズ分布を示す。
【図16】プラスミドpHAR1111内の遺伝子のランダム切断ライブラリークローンによって発現されたタンパク質の可溶性スクリーニング。ここでアレーは、アレキサ488蛍光発光団結合ストレプトアビジンでプローブされ、画像はタイフーン蛍光スキャナー(Amersham)で捕捉された。可溶性タンパク質を発現するクローンは各々についてデュープリケートパターンで可視化される。
【図17】プラスミドpHAR1111のランダム切端遺伝子のPCR分析結果で、可溶性タンパク質を発現する切断形の非ランダムサイズ分布を示す。
【図18】可溶性スクリーニングを用いて同定された可溶性タンパク質フラグメントの精製プロフィルを示す。遺伝子フラグメントを先ず初めに大腸菌発現ベクターでサブクローニンして、N-末端ヘキサヒスチジンタグを付加して、精製を促進した(図19)。
【図19】タンパク質発現のスケールアップのための遺伝子フラグメントをサブクローニングするために用いられたpTriEXベクター(Novagen)の誘導体である。TEVプロテアーゼが切断することができるヘキサヒスチジンタグをこの構築物のN-末端に添加してアフィニティー精製を可能にする。
【図20】pHAR1111から発現されるタンパク質のマルチドメイン30kDaフラグメントは切端遺伝子とマルトース結合タンパク質との融合後に得られ、発現及び精製を促進する。
【図21】N15標識タンパク質のHQSC NMRスペクトル解析の結果である。前記解析によって、ランダムライブラリーのスクリーニングから同定された精製ドメインは高度に可溶性であるだけでなく良好に折畳まれていることが確認される。
【技術分野】
【0001】
本発明は、候補タンパク質の発現ライブラリーで可溶性候補タンパク質の発現についてスクリーニングする方法に関する。本方法は、ライブラリー内の各候補タンパク質をペプチド基質と融合し、及び前記ペプチド基質の酵素による改変を検出することによって可溶性候補タンパク質を発現する細胞を同定することを必要とする。
本明細書に引用した全ての刊行物、特許及び特許出願は参照により完全に本明細書に含まれる。
【背景技術】
【0002】
構造ゲノム学は近年ますます関心を集めつつある。タンパク質の構造の解明は、タンパク質機能の理解を深め、それによって医薬開発を促進するために重要である。
タンパク質発現及び精製は前記のような研究で重要なプロセスであり、しばしば適切に折畳まれた組換えタンパク質を生成する能力によって制限を受ける。大腸菌(Escherichia coli, E. coli)発現系を用いる構造的及び機能的解析を目的とするタンパク質の調製は、不溶性の細胞内タンパク質凝集物(封入体)の発生、プロテアーゼによる分解又は発現の欠如によってしばしば妨害される。
大腸菌は一般的な発現宿主であり、非天然遺伝子生成物の過剰産生を強いられたときしばしば誤った折り畳みをもつタンパク質を生成する。このことは、例えば結晶学及びNMRによる構造解析のような領域での前記タンパク質の有用性を甚だしく制限し、更に従来の構造ゲノム学プロジェクトの全体的な成功率を制限する。不溶性発現タンパク質の問題に対する通常のアプローチには、低温発現、種々の強度のプロモーターの使用、多様な可溶性強化融合タグ(RB Kapust & DS Waugh. "Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of polypeptides to which it is fused", Protein Sci. 1999 Aug; 8(8):1668-74)及び改変増殖培養液(SC Markrides, "Strategies for achieving high-level expression of genes in Escherichia coli", Microbiol. Rev. 1996 Sep; 60(3):512-38(概説))が含まれる。
【0003】
この困難を克服するためのまた別のアプローチは、問題のタンパク質のアミノ酸配列から予測される構造によるものである。相同性アラインメント及び二次構造予測のような情報は、安定な可溶性ドメインの位置を予測するために用いられる。標的タンパク質の切端又は変異導入を先ず初めに構築し、続いてこれを発現させて可溶性についてテストする。継続的な進展にもかかわらず、所望の特性(例えば安定性又は可溶性発現)をもつ純粋に“合理的な”タンパク質の設計は、少なくとも今日まで一般的には実現可能ではない。十分な構造的及び機構的情報の存在下においてさえ、必要な配列短縮を予測することは困難である。異種宿主で発現され得るタンパク質の能力から非天然の環境で折り畳まれるその能力まで、タンパク質構造のあらゆる局面においてアミノ酸配列がどのように影響を及ぼすかに関する情報はほとんど存在しない。タンパク質の特性における変化は、多くの小さな調整(それらの多くはタンパク質分子内の著しい距離にわたって割り当てられ又は伝えられる)の積重ねられた作用によって発生することが実験によって示され、生物情報解析プログラムはこれまでのところどの切断(truncation)又は変異がタンパク質の可溶性を高めるかを正確に予測することができない。
通常の構造に関するプロジェクトでは、数十のクローンが構築され可溶性タンパク質発現について調べられる。そのようなプロジェクトに関しては、可能な多様性のためにはサンプルが極めて不足しており、しばしば解決は見出されない。更にまた、ゲノム配列から予測される多くのタンパク質に関しては、既知のホモローグが存在せず、このことは生物情報解析アプローチの有効性を制限する。高処理スクリーニング戦術は、標準的アプローチが失敗したときに可溶性構築物を発見するために有効であることを証明することができる。これらは、構造決定のために適切な構築物を同定するためには多数の発現クローンの正確な解析を要求する。完全なタンパク質が発現されないか又は結晶化されない場合は、次の工程は、切断又はランダム変異を実施し再テストすることである。
【0004】
(i)従来の方法論は非常に大きな発現ライブラリーの作成を可能にし、更に(ii)ライブラリーが可溶性タンパク質を含む可能性はライブラリーのサイズに従って増加するが、発現ライブラリーをスクリーニングするための従来のアプローチによって生じる現実的限界はその実施を制限する。問題のタンパク質の可溶形又は結晶形を発現させることを所望する実験者の究極の目的は、標的タンパク質の全ての可能な変種を合成し、それらを可溶性発現についてスクリーニングすることである。可溶性タンパク質を発現するクローンは直接用いてもよいし、又は前記クローンを次のラウンドのライブラリー構築及び選別のシードとして用いてもよい。そのような実験では大量のクローンが得られ、前記クローンは続いて可溶性標的タンパク質の発現のためにスクリーニングされねばならないであろう。
問題の候補タンパク質の可溶性変種(ランダム変異又は切断によって作出される)を同定するという目的をもついくつかの系が記載された。融合レポーターの方法では、容易に検出され得る特性又は生物学的活性をもつ候補タンパク質及びレポータータンパク質が遺伝子融合物として発現される。タンパク質の折り畳み状態についての情報は、融合されたレポータードメインによってスクリーニング可能又は選別可能活性から誘導することができる。
融合レポーターの方法は、通常は、C-末端パートナーの“可溶性レポーター”(例えば緑色蛍光タンパク質(GFP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)又はベータガラクトシダーゼ)の融合を必要とする。GFP融合レポーターの方法では、GFPの蛍光の発生は、その融合パートナーの折り畳み状態についての情報を提供する。折り畳みが不十分な不溶性タンパク質と融合したGFP発現細胞は、折り畳みが十分な可溶性タンパク質と融合したGFP発現細胞よりも蛍光が少ない。GFPはテストタンパク質の折り畳みの収量をモニターする。テストタンパク質はその後GFPタグをもたないで発現される(GS Waldo, “Genetic screens and directed evolution for protein solubility”, Curr Opin Chem Biol 2003 Feb;7(1):33-8(概説))。
【0005】
本発明者らは、タンパク質折り畳みマーカーとしてビオチンカルボキシル担体タンパク質(BCCP)の使用に基づく融合レポーター系を以前に開発した。この系では、大腸菌由来のBCCPのビオチニル化ドメインがテストタンパク質と融合される。このドメインの正確に折畳まれた二次及び三次構造は、前記ドメインをビオチニル化する内在性宿主細胞ビオチンタンパク質リガーゼによって認識される。正確に折畳まれたテストタンパク質及びBCCPドメインを発現する宿主細胞はビオチン基について陽性を示すだろう(WO03/064656 “Protein tag comprising a biotinylation domain and method for increasing solubility and determining folding state”)。
しかしながら、これらの系に付随する問題が存在し、この問題は前記系の応用性を制限する。
自律的に折畳まれるレポータータンパク質(例えばGFP、CAT、ベータ-gal又はBCCPドメイン)の使用は、それらの大型で可溶性の性質のために問題の多い偽陽性率を生じ得る。前記は、レポーターはそれ自体不溶性になることなく不溶性タンパク質X又は完全長タンパク質との融合に寛容であるために、圧倒的な偽陽性率を生じ得る。これは、タグが適所に置かれるとき、例えばタグを介してタンパク質を固定するとき、又は生化学的分析を精製タンパク質で実施するときは問題にはならないかもしれないが、多くの適用、例えばタンパク質の結晶学では、プロテアーゼ切断又は遺伝子的欠失によるタグの除去が必要とされる。その後のタグの除去時に凝集又は分解し、従って使用に適さないクローンの処理によって多くの時間及び費用が失われる。融合タンパク質はまたin vivoでの発現中にタンパク質分解によって分解されることもまたあり得ることであり、これによって偽陽性結果を生じる可溶性の蛍光レポーター分子が残される。これらの作用は、融合タンパク質(例えばマルトース結合タンパク質、グルタチオン-S-トランスフェラーゼ、GFP、チオレドキシンを含むもの)に関して非常に一般的に観察され、おそらくは普遍的な作用である。従って、可溶性レポーターとして機能する高度に可溶性である融合パートナーの存在は、前記パートナーが融合される物質の可溶性を大きく混乱させる。
【0006】
更にまた以前に開示された融合タンパク質のほとんどが大型タンパク質である。例えばGFPの融合はタンパク質のサイズをほぼ37kDa増加させる。大腸菌での大型融合タンパク質の発現には問題が多く、実際的な限界は約100kDaである。
実験及び配列/構造データベース解析を組み合わされたとき、タンパク質の形成をもたらす主要な進化関連因子を正確に記述するためにシミュレーション研究は役立ち得る。しかしながら、そのような研究の潜在的能力は未だ十分には調査されていない。
従って、クローニングから構造決定までの全体的プロセスにおいて、可溶性発現タンパク質の選別を可能にする、迅速で高処理性であって更に信頼に足る発現タンパク質のスクリーニング方法の可能な限り迅速な開発を求める強い要請が存在する。適切な方法は、種々の変種配列を含む多数の分子の高処理スクリーニングを可能にし、選別プロセスは改善された可溶性を有する分子の容易な同定を許すであろう。不溶性タンパク質の可溶性変種の同定及び単離を可能にする、個々のタンパク質の変種の発現ライブラリーの高処理分析に対するそのよう方法の扱いやすさは、特に変異導入又は切断方法戦術と組み合わせて用いるとき、取り扱いの困難なタンパク質の高レベル発現の最適化をより達成し易くかつ手間を軽減するであろう。更にまた、この方法は、i)いずれの融合パートナーの混乱誘発作用をも最小限にすること、及びii)構造解析のために要求される下流の工程(例えば融合タグの除去)を最小限にすることを希求しなければならない。タンパク質は、小さなタグとともに日常的に結晶化されるが、二ドメイン融合における結晶化は稀である。
【発明の開示】
【0007】
発明の要旨
本発明は、不溶性タンパク質の可溶性変種を選別することができるメカニズムを含む。これらのメカニズムでは、不溶性タンパク質のコード領域を操作、翻訳、発現させて、特定の操作が可溶性変種を生成するか否かを決定することができる。従って、不溶性タンパク質の可溶化に影響を与える因子を、そのコード核酸分子の配列を決定することによって同定することができる。従って前記メカニズムはまた、可溶性に重大な影響を与えるタンパク質の特性についての重要な洞察を提供する。
本発明のある特徴にしたがえば、複数の変種候補タンパク質中の可溶性候補タンパク質をスクリーニングする方法が提供される。前記の場合、各候補タンパク質はペプチド基質に、前記ペプチド基質の酵素による改変を検出することによって可溶性候補タンパク質が同定できるように融合される。
この新規な方法は、ある種の検査可能な活性(例えばGFPの場合には固有の蛍光、又はクロラムフェニコールアセチルトランスフェラーゼの場合には酵素による消長)を示すペプチド基質それ自体を当てにしない。そのようなペプチドを可溶性レポーターとして使用する隠れた重要な原理は、可溶性分子のみが酵素の有効な基質であるということである。従って、ペプチドが可溶性候補タンパク質と融合している場合だけ、前記は、ペプチドそのものの折り畳みを必要としないで酵素のための直接的基質として機能することができる。しかしながら、ペプチドが不溶性タンパク質と融合している場合は、ペプチド-改変酵素の活性部位とのその相互作用は立体的及び拡散に関する理由のために激しく制限され極めてわずかな酵素改変が生じるだけであり、陰性、未改変表現型を生じる。更にまた、ペプチドが大腸菌で単離された状態で発現されるならば、(フレーム外で遺伝子又は遺伝子フラグメントと融合された場合に生じるように)それらは一般的には不安定で、タンパク分解を生じ、従って細胞から除去され、やはり不履行陰性表現型を生じる。本方法は、例えばタンパク質切端戦術と組み合わせて用いるとき、発現ライブラリーの高処理解析に馴染みやすい。多数の変種が作成され、ただ1つの方法でテストされるので、この方法は、可溶性で、理想的に高度に発現される候補タンパク質を同定することができる可能性を大きく増加させる。
【0008】
ペプチド基質は小さく不活性であり、従って前記ペプチド基質が融合している候補タンパク質の物理的特徴を顕著には変化させない。ここで、物理的性状の変化に関連して“顕著には〜しない”という用語は、前記物理的性状の±50%以下の変化、例えば±45%以下、±40以下、±35%以下、±30%以下、±25%以下、±20%以下、±15%以下、±13%以下、±10%以下、又はそれより小さい変化を意味する。好ましくは、前記ペプチド基質は、前記基質が融合している候補タンパク質の物理的性状を変化させない。そのような物理的性状には、候補タンパク質の可溶性、サイズ、荷電、折り畳み及びアッセンブリーメカニズムが含まれる。具体的なある利点は、候補タンパク質の可溶性は混乱させられることはなく強化もされないというものである。これは、偽陽性結果の出現を制限する(偽陽性結果の出現は従来技術の方法論では一般的であり、大型で折畳まれた可溶性レポーター分子(不溶性タンパク質フラグメントとの融合に寛容であろう)の使用に付随する)。
本発明の更なる利点は、本方法論は、候補タンパク質の収量及び可溶性の定量的分析を定性的分析と同様に可能にするということである。これは、分析及び/又は更なる操作及びスクリーニング工程のために特に可溶性が高い候補タンパク質をコードするクローンの選択を可能にする。
本明細書で用いられる、“候補タンパク質”という用語は、合成又は天然に存在する任意のタンパク質又はペプチド(タンパク質フラグメント、マルチマータンパク質、組換えタンパク質、融合及びハイブリッドタンパク質、抗体などを含む)であり得る。
【0009】
本発明に従えば、“ペプチド基質”には、ペプチド結合又は改変ペプチド結合(即ちペプチドイソステア)によって互いに結合したアミノ酸を含む、ペプチドの任意の短い領域が含まれる。この用語は、5から20アミノ酸の短いペプチド鎖を、より長い20から50アミノ酸のオリゴペプチドと同様に意味する。そのようなペプチドは候補タンパク質と融合することができ、更に、可溶性であるときは酵素作用によってペプチド基質が改変されるように、酵素の基質として機能し得る必要がある。
好ましくは、前記ペプチド基質は、それが融合される候補タンパク質に対して小さい。例えば、大きな候補タンパク質の場合には、ペプチド基質のサイズがより小さいということはさほど重要ではなく、わずかに細長いペプチド基質が候補タンパク質の構造を混乱させることなく寛容であり、従って偽陽性結果を生じ得る。対照的に、小さな候補タンパク質の場合は、ペプチド基質は理想的には可能なかぎり小さくあるべきである。好ましくは、ペプチド基質の長さは候補タンパク質の長さの20%を超えない。より好ましくは、前記長さは候補タンパク質の長さの15%を超えず、更に好ましくは、前記長さは候補タンパク質の長さの10%を超えず、更に好ましくは、前記長さは候補タンパク質の長さの5%を超えない。
好ましくは、前記ペプチド基質は短く、長さが50アミノ酸又はそれより小さく、例えば45以下、40以下、35以下、30以下、25以下、20以下、15以下、13以下、10以下又はそれより小さい。
好ましくは、前記ペプチド基質は直鎖状で、三次元構造をもたない。これは、前記ペプチドは、二次元構造モチーフを有するある構造の三次元的編成に折畳まれないことを意味する。
【0010】
好ましいペプチド基質には、ビオチンタンパク質リガーゼのための基質として機能するペプチドが含まれる。そのようなペプチド基質の例は、Schatz(1993)及びBeckettら(1999)によって性状が決定された15アミノ酸ペプチドである(PJ Schatz (1993) “Use of peptide libraries to map substrate specificity of a peptide-modifying enzyme: a 13 residue consensus peptide specifies biotinylation in Escherichia coli”, Biotechnology 11:138-1143;Becket et al. (1999) “A minimal peptide substrate in biotin holoenzyme synthetase-catalysed biotinylation”, Protein Science 8:921-929)。このペプチドの配列はGLNDIFEAQKIEWHEであり、いくつかの類似変種もまた存在する。可溶性タンパク質と融合したとき、前記ペプチドはビオチンタンパク質リガーゼ(ビオチン-AMPからこの配列のリジン残基(下線が付されている)へビオチン分子を移転させる酵素である)のための基質として機能する。融合されていないとき、又は不溶性パートナーと融合されているとき、前記は非常に非効率的な基質である。ビオチンタンパク質リガーゼのための基質であるペプチド基質の使用は、ストレプトアビジン結合物を用いる検出により可溶性についてタンパク質をスクリーニングすることを可能にする。例えば、ウェスタン型、又はドットブロットを用いることが可能であろう(前記の場合、ストレプトアビジン-ペルオキシダーゼ結合物は化学発光により検出するか、又は蛍光標識ストレプトアビジン及び蛍光画像化装置(例えばアマーシャムタイフーン(Amersham Typhoon))を用いて直接検出することができる。ビオチンに結合することができる他の化合物にはニュートラビジン、アビジン及びモノマーアビジンが含まれる。
好ましいペプチド基質にはまた、同時発現されるキナーゼ(例えばカゼインキナーゼII(真核細胞で見出される普遍的なセリン/スレオニンタンパク質キナーゼ))のための基質として機能するペプチドが含まれる。可溶性タンパク質と融合したとき、前記ペプチド(例えばRRRDDDSDDD)はキナーゼのための基質として機能し、特定の残基(S)でリン酸化される。以前に記載されたように、融合されていないか、又は不溶性パートナーと融合したとき、ペプチドの効率的なリン酸化は生じない。リン酸化されたペプチドキナーゼは特異的な抗ホスホ抗体を用いて検出される。ホスホペプチドと抗ホスホ抗体との結合は、例えば蛍光標識抗ホスホ抗体結合物を用いて直接検出することができる。
【0011】
当業者には理解されるところであるが、ペプチド基質を候補タンパク質と融合することができる多数の方法が存在する。例えば、ペプチド基質は候補タンパク質と非共有結合によって融合させることができる。ペプチド基質は翻訳後に、例えばインテインバイオロジー(intein biology)によって候補タンパク質と融合することができる。好ましくは、ペプチド基質は共有結合(例えばペプチド結合を介して、化学的結合を介して、etc)によって融合させることができる。好ましくは、ペプチド基質は遺伝子融合物として発現され、候補タンパク質を含む組換え融合タンパク質を形成する。そのような遺伝子融合物の場合、ペプチド基質及び候補タンパク質成分の結合は、好ましくは、融合タンパク質のアミノ酸配列をコードする組換えDNA構築物を用いて達成することができる(前記DNA構築物は候補タンパク質をコードするDNAと同じ読み枠内でペプチド基質をコードする)。
ペプチド基質は、候補タンパク質のアミノ末端又はカルボキシ末端のどちらかに存在するか、又は前記タンパク質に対して内部に、例えば候補タンパク質構造から外れたループとして存在することができる。好ましくは、ペプチド基質は候補タンパク質のアミノ末端又はカルボキシ末端で融合される。
本発明にしたがえば、“酵素による改変”にはペプチド基質の任意の改変が含まれ、前記改変は、例えばマーカー又は標識の結合によって、化学的成分のペプチドへの添加又はペプチドからの欠落によって、化学的状態(例えばリン酸化、メチル化、アセチルか、ユビキチン化、スモイル化、ミリストイル化又はグリコシル化)の変化によって検出することができる。例えばペプチド基質を適切に設計することにより、改変酵素によって強制された変化が抗生物質耐性遺伝子の発現を活性化し、前記を達成した候補物質の抗生物質による選別を可能にするか、又は表現型マーカー遺伝子(例えば緑色蛍光タンパク質又はβ-ガラクトシダーゼをコードする遺伝子)の発現を活性化し、物理的濃縮方法(例えばFACS、蛍光活性化細胞分類)を可能にすることができる。好ましくは、ペプチド基質は酵素の作用によってビオチニル化される。他の適切な改変タイプも当業者には明白であろう。
【0012】
また別の実施態様では、ペプチド基質は、何らかの態様で基質改変タンパク質の活性に影響を与えることができる。例えば、基質改変タンパク質の活性が候補タンパク質の可溶性の結果として特異的に上昇又は低下するように、ペプチド基質が酵素反応のための補助因子として機能することによって活性に影響を与えることができる。このようにして、発現される候補分子が可溶性である場合、そのような候補分子をコードする特定の細胞を、基質改変タンパク質の活性又は不活性を規準に(例えば変異の影響を軽減するペプチドを保有するタンパク質による不活性変異酵素の補完により)単離することができる。
本発明に従って使用される好ましいペプチドの場合(ビオチンタンパク質リガーゼのための基質である場合)、前記酵素による改変はペプチドのビオチン化状態における変化である。
酵素による改変が生じるためには、要求される改変反応を実施することができる酵素の存在が要求される。前記酵素は別個に反応混合物に添加されるか、又は反応系にとって内在性であってもよい(例えば前記スクリーニングの方法が実施されている宿主細胞で天然に発現される)。例えば、前記細胞は、基質改変酵素としての活性を有する前記タンパク質を構成的に発現することができる。また別の実施態様では、前記宿主細胞は、前記ペプチド基質改変酵素をコードするポリヌクレオチドを含む、染色体外エレメント、例えばプラスミド、エピソーム、人工染色体などで形質転換されてもよい。
【0013】
本発明にしたがえば、“検出”は、ペプチド基質の酵素による改変が生じたことを認識させる適切な任意の方法を指す。酵素によっていったん改変されたら、未変化ペプチド基質との識別を可能にするために、前記ペプチドタグは何らかの点で違いを持たねばならない。このようにして、可溶性候補タンパク質は不溶性候補タンパク質と識別され得る。改変ペプチド基質を検出する適切な方法は当業者には明白であり、前記はもちろん利用される改変酵素の特性に左右される。検出は変化したペプチド基質であっても、未変化ペプチド基質であってもよい。好ましくは、検出は、変化したペプチド基質に対する陽性検出である。例えば、そのビオチン化状態が変化するペプチド基質を利用する本発明の好ましい実施態様では、選別はビオチン化状態におけるこの変化を目指すことができ、更にビオチンに対してアビジン及びストレプトアビジンによって示される高い結合親和性を利用し、前記結合ペアの高い結合親和性を基にして検出を可能にすることができる。また別には、質量分析は、質量の変化をモニターすることによってタグの改変を検出する方法を提供することができる。この検出方法に関しては、結合パートナーは要求されない。
本発明の候補タンパク質のスクリーニングは、例えば無細胞翻訳系を用いてin vitroで実施することができる。前記の系では、候補タンパク質は細胞内で発現されることなく転写及び翻訳される。このシナリオでは、可溶性候補タンパク質の選別が同時にコード核酸の選別を可能にさせるように、遺伝子型と表現型の間には何らかのリンクが存在する必要がある。これは、可溶性タンパク質の生成をもたらした有利な配列の特徴を評価することができるように前記方法論のデコンボルーションを可能にする。適切な方法は当分野では公知である。例えば、国際特許出願WO99/02671で最近公開されたあるin vitro系は、区画化のために、従って翻訳系の成分を単離するために油中水を用いて作出されたマイクロカプセルの使用を報告している。
【0014】
好ましくは、候補タンパク質は宿主細胞で発現される。候補タンパク質が発現されるいずれの宿主細胞系も適切であることは当業者には理解されよう。前記細胞系には、原核細胞発現系(例えば連鎖球菌、ブドウ球菌、大腸菌、ストレプトミセス及び枯草菌細胞(Bacillus subtilis))及び真核細胞系、例えば酵母(例えばS.セレビシエ(cerevisiae)及びアスペルギルス(Aspergillus)細胞)、昆虫細胞、植物細胞及び哺乳動物細胞培養が含まれる。大腸菌が、本発明に従って使用される好ましい宿主細胞である。理由は、部分的には、前記が内在性のビオチンタンパク質リガーゼを発現し、従って前記は宿主細胞それ自体の中で候補タンパク質に融合されたペプチド基質の改変が可能であるからである。このメカニズムのある利点は、遺伝子型と表現型との間で要求されるリンクが各細胞内で維持され、従ってこの方法は、可溶性であることが判明した候補タンパク質のDNA配列の解析を可能にするということである。しかしながら、この特定のペプチドと適合するビオチンタンパク質リガーゼを発現しない他の宿主細胞もまた、スクリーニングの前に細胞に前記酵素のコード配列を導入することによって用いることができる。
【0015】
宿主細胞内での発現のために、候補タンパク質(場合によってペプチド基質との融合タンパク質として)をコードする核酸配列は、適切な1つのベクター又は複数のベクターでクローニングされるべきである。宿主細胞は、そのようなベクターにより形質転換されるか、トランスフェクトされるか、又は形質導入されて、スクリーニングされるべき候補タンパク質の発現が達成され得る。適切な発現の方法は当業者には周知である、多くが詳細にSambrookら(上掲書)及びFernandez & Hoeffler(1998, eds. “Gene expression systems. Using nature for the art of expression”, Academic Press, San Diego, London, Boston, New York, Sydney, Tokyo, Tronto)によって詳細に記載されている。一般的には、コード遺伝子は、所望のポリペプチドをコードするDNAが形質転換宿主細胞内でRNAに転写されるように、制御エレメント(例えばプロモーター、リボソーム結合部位(細菌発現のため)及び場合によってオペレーター)の制御下に置かれる。前記コード核酸分子は、制御配列(例えばシグナルペプチド又はリーダー配列)をコードする配列を、所望に従って(例えば翻訳ポリペプチドの小胞体腔内、ペリプラズム間隙内又は細胞外環境への分泌)含むことができる。これらのシグナルは前記ポリペプチドにとって内在性であってもよく、又はそれらは異種シグナルであってもよい。リーダー配列は細菌宿主によって翻訳後プロセッシングで除去することができる。好ましくは、候補タンパク質は、基質改変酵素と同じ細胞内の区画に存在する。例えば、ビオチンタンパク質リガーゼは細胞質性タンパク質であり、この酵素の潜在的基質である候補タンパク質は従って細胞質内で維持されるべきである。コントロール配列の他に、調節配列を付加することも所望できる。前記調節配列は、宿主細胞の増殖に対応してポリペプチドの発現を調節することを可能にする。
【0016】
候補タンパク質は、例えば硫安若しくはエタノール沈殿、酸抽出及びクロマトグラフィーのような周知の方法を用いて、組換え細胞培養から分析のために回収及び精製することができる。しかしながら、表現型と遺伝子型との間のリンクを維持するために、いくつかの方法を用いて回収タンパク質の起源の追跡を可能にしなければならない。より簡単には、候補タンパク質が発現される細胞を溶解して、ペプチド基質の改変について分析することができる。可溶性候補タンパク質が得られたコロニーの歴史を記録することによって、表現型と遺伝子型との間の必要なリンクを維持する。例えば、宿主細胞での可溶性候補タンパク質の発現についてスクリーニングする本発明の実施態様では、宿主細胞は単純にニトロセルロース膜上でin situで溶解され、ペプチド基質の改変について、例えば抗体、ストレプトアビジン又は改変ペプチド基質を認識する他の検出試薬を用いてブロッティングによって試験することができる。
特殊化されたベクター構築物もまた、所望に応じてタンパク質の精製促進のために用いることができる。前記は、本発明のポリペプチドをコードする配列を、可溶性タンパク質の精製を促進するポリペプチドドメインをコードするヌクレオチド配列に結合させることによって実施される。そのような精製促進ドメインの例には、金属キレートペプチド(例えば、固定金属上での精製を可能にするヘキサヒスチジンタグ及びヒスチジン-トリプトファンモジュール)、プロテインAドメイン(固定免疫グロブリン上での精製を可能にする)、及びFLAG伸長/アフィニティー精製系(Immunex Corp., Seatle, WA)で利用されるドメインが含まれる。切断可能なリンカー配列(例えばXA因子又はエンテロキナーゼ(Invitroen, San Diego, CA)に特異的なリンカー配列)を精製ドメインと候補タンパク質との間に挿入することもまた精製の促進に用いることができる。ビオチンタンパク質リガーゼによって生成されるビオチニル化タンパク質もまたアビジン誘導アガロースを用いて精製することができる。
【0017】
ベクターはまた機能的選別マーカーを含むことができる。前記機能的選別マーカーは、例えば耐性遺伝子(例えばカナマイシン、アンピシリン、ブラスチシジン、カルベニシリン、テトラサイクリン又はクロラムフェニコール)であり得る。ベクターは更に、必須のエレメントを欠く機能不全選別マーカーを含むことができ、この場合は、前記必須のエレメントは前記エレメントをもつ細胞の形質転換の成功に際して核酸エレメントによって供給される。機能不全選別マーカーは、例えば耐性遺伝子又はレポーター遺伝子、例えばlacZ遺伝子などであり得る。もちろんのこと、これらの可能な取り合わせは、反応系の成分のいくつかは生物のゲノムから発現され、いくつかは染色体外エレメント(例えば発現ベクター)から発現され得るように混合することができる。
可溶性候補タンパク質の選別成功の可能性を改善するために、反応系はペプチド基質改変タンパク質の活性に適した条件下でインキュベートされねばならない。例えば、外因性基質改変タンパク質が反応媒体に添加される場合には、この媒体は前記添加されるタンパク質の活性に適した条件化に置かれねばならない。基質改変タンパク質がスクリーニングの方法で用いられる宿主細胞内で発現される場合は、前記宿主細胞は、それら細胞の健常な増殖及び発現されるタンパク質の活性に適した条件下で増殖させなければならない。そのような場合には、基質改変タンパク質をそのコード遺伝子から発現させることができる適切な転写及び翻訳機構が前記系に存在していなければならない。ほとんどの場合、この機構は細胞それ自体に由来するであろう。
【0018】
本方法は複数の候補タンパク質変種のスクリーニングを可能にする。実際、本方法の能力の1つは、非常に大きな数の種々の変種をその活性について平行してスクリーニングすることを可能にするということである。このことは、本方法は高処理分析に馴染みやすいので、所望するならば、特定の1つのタンパク質若しくは複数のタンパク質のあり得る変種の全て又は非常に大きな数について包括的なスクリーニングを実施することが可能であることを意味する。
ライブラリーの作成方法は当分野では周知である。例えば、切端遺伝子ライブラリーはエキソヌクレアーゼIII消化によって構築することができる(Ostermeir & Lutz, “The Creation of ITCHY hybrid protein libraries”, in Methods in Molecular Biology vol.231, pp129-141)。
例えば、可溶化が困難であることが証明されたタンパク質について特定の可溶性変種を同定するために、切断ライブラリーを作成することができる。そのようなライブラリーは、例えばタンパク質のN-末端及びC-末端の一端又は両端でアミノ酸が1つずつ又は複数ずつ徐々に短縮されたものを含むことができる。
好ましい実施態様では、あるタンパク質の可能な全ての切端形が作成され試験される。包括的なスクリーニングが実施されたことが合理的に確信されるためには、各短縮形について少なくとも3倍、好ましくは少なくとも5倍、より好ましくは10倍オーバーサンプルされる必要があるであろう。
切端ライブラリーは、候補タンパク質の一端が固定され、他方の端が変化する増分切端ライブラリーであり得る。例えば、C-末端を固定しN-末端を変化させるか、又はN-末端を固定しC-末端を変化させることができる。そのような戦術の例として、770のアミノ酸のタンパク質については、長さが100アミノ酸を超える(大腸菌で発現されスクリーニングされるタンパク質の小さいほうの凡その実際的サイズ限界)タンパク質を生じる670の切端形が存在する。DNAレベルでは、これは2010のヌクレオチドに対応する。10倍のオーバーサンプルは20,100のクローンの構築及びスクリーニングを必要とするであろう。これらのクローンの1/3はインフレームで、一方2/3はフレームシフトを含み、従って有用なペプチドタグ付加タンパク質を発現しないであろう。
【0019】
切断ライブラリーは、候補タンパク質が両端で短縮された内部フラグメントライブラリーである。この内部フラグメントライブラリーは、特定の固定された末端が何らかの予期し得ない予想に反する問題(例えば発現の問題、従って偏向した又は無用な結果、例えば細胞のタンパク分解に対する感受性又は細胞との毒性反応)を引き起こすようなシナリオの問題を回避する。“N”個の残基をもつ具体的なタンパク質について、ほぼN2/2のフラグメントが存在するであろう。タンパク質のコード配列は正しい方向性を有し、両端でインフレームであることを確認するためには18倍のオーバーサンプリングが要求される。500アミノ酸のタンパク質を例にとれば、前記は2百万の可能な連結生成物をもたらし、従って10倍のオーバーサンプルは2千万のクローンがサンプリングされねばならないことを意味する。
切断の方法は当業者には公知である。このタイプの切断を実施するもっとも簡単な方法は、種々の周知の遺伝子工学技術を用い、コード核酸配列をいずれかの末端又は両端で選択的に欠失させ、続いて所望のコード配列を選択したベクターに挿入することである。好ましくは、候補タンパク質の切断形は、3'及び/又は5'エキソヌクレアーゼ戦術を用い、コード核酸の3'及び/又は5'末端をそれぞれ選択的に侵食させて作成される。切断ライブラリーを作成するために好ましいある方法は、核酸を管理下で又はランダムにエキソヌクレアーゼIIIで消化することで、好ましくは制限酵素消化の使用と組み合わされる。例えば、ある種の制限酵素は3'オーバーハングを残す部位で切断を実施する(例えばNsiI)。他の酵素は5'オーバーハングを残す部位で切断を実施する(例えばNotI)。これら部位の他の部位で切断し、更に3'及び/又は5'エキソヌクレアーゼ酵素を用い、前記反応物を時間を管理しながらインキュベートすることによって、消化の程度及び方向の選択を達成することができる。本発明の方法での使用に適した適切なベクター構築物の例は、本明細書に含まれる実施例に記載されている。また別には、ランダムプライマーを用いる標的遺伝子のPCR増幅を用いて、両端で短縮された遺伝子フラグメントを作出することができる。(Kawasaki et al. “Random PCR-based screening for soluble proteins using green fluorescent protein,” Biochem. & Biophys. Res. Comm. 2001, 280:842-844)。他の等価の方法にはDNAse I消化、超音波処理及びポイントシンクフラグメント化が含まれる。
【0020】
変異が既に実施された変種ライブラリーを作成することができる。変異導入はランダム変異導入であっても、合理的、位置特異的変異導入でもよい。適切な操作方法は当業者には公知で、以下が含まれよう:点変異導入(エラー誘発PCR、化学的変異導入、特定のミュテーター宿主株の使用)、反復アンサンブル変異導入(Delagrave and Youvan (1993) Bio-Technology, 11:1548-1552)、順列組合せカセット変異導入(Black et al. 1996)、DNAシャッフリング(Stemmer et al. 1994)又はコドン置換変異導入。最近のin vitro組合せプロセスにおける改善に関するが異説には以下を参照されたい:Giver and Arnold, 1998, Current Opinion in Chemical Biology, 2(3):335-338)。例えば、特定のアミノ酸を野生型配列から他のアミノ酸に選択的に変異させることができる。そのような変異体には、保存的又は非保存的アミノ酸残基(好ましくは保存的アミノ酸残基)により1つ又は2つ以上のアミノ酸残基が置換されている変種候補タンパク質が含まれ得る。例えば、X線解析のためにより品質の高いタンパク質結晶を得るために結晶化の均質性を改善する目的で、高い構造的可撓性をもつ残基(例えばArg又はLys)を例えばエントロピーが低い残基(例えばAla)に取り替えることができる。そのような置換されるアミノ酸残基は、遺伝暗号によってコードされるものでもあってもなくてもよい。典型的なそのような置換は、Ala、Val、Leu及びIle間で、Ser及びThr間で、酸性残基のAsp及びGlu間で、塩基性残基のLys及びArg間で、又は芳香族残基Phe及びTyr間で生じる。特に好ましいものは、いくつかの(即ち5から10、1から5、1から3、1及び2、又は単に1つのアミノ酸が任意の組合せで置換、欠失又は付加された変種である。特に好ましいものは、前記タンパク質の機能的特性又は活性を変化させない置換、付加及び欠失である。更にまた、これに関して特に好ましいものは保存的置換である。そのような変異体にはまた、1つ又は2つ以上のアミノ酸残基が置換基を含むポリペプチドが含まれる。
【0021】
例えば1つ又は2つ以上のアミノ酸又は候補タンパク質内にループを形成若しくは欠落させるために一連のアミノ酸の挿入物が既に配列に添加された変種のライブラリーを作成することができる。特に親水性アミノ酸が含まれる場合は、候補タンパク質の可溶性の強化をもたらすことができる。
続いてこれらの候補タンパク質ライブラリーを、もっとも高度な可溶性を示す個々の変種についてスクリーニングすることができる。
本発明のこの特徴に従えば、候補タンパク質のライブラリーは、103を超える異なるクローン、104を超える異なるクローン、105を超える異なるクローン、106を超える異なるクローン、107を超える異なるクローン、108を超える異なるクローン、又はそれより多くのクローンを含むことができる。好ましくは、ライブラリーは可能なあらゆる切断形を発現するクローン及び候補タンパク質変種を含む。これは、可能なあらゆる切断形を作出及び試験することは、成功の可能性を大きく高め、可溶性における変種とタンパク質配列の特徴とをリンクさせるために用いることができる大量のデータの解析を可能にするので有利である。更にまた、全ての位置の包括的スクリーニングは、陰性結果をもたらす実験だけを確信して廃棄することを可能にするはずである。
クローンのライブラリーは、その各細胞が異なる候補タンパク質を発現する、複数の形質転換細胞を含むことができる。そのようなライブラリーは、細胞調製物を適切なベクターライブラリーで形質転換することによって作出することができる。適切な条件下では、そのようなベクターによる形質転換は、実質的にただ1つのタイプの候補タンパク質がライブラリーの各細胞で発現されるように実施することができる。これによって、当該核酸から発現されるタンパク質は同じ細胞内に止められ、問題の核酸コード分子の選別が促進される。もし各細胞が複数の核酸分子を含んでいるとしたら、細胞の単離に際して、どの核酸分子が所望の作用を惹起するタンパク質をコードしたかが明確ではないであろう。
【0022】
本発明の部分を構成する選別技術の改善によって、潜在的候補物質の大きなプールで連続的繰り返しが持続され得るように、反復分子進化サイクルの簡単な使用が可能になった。好ましくは、高度に可溶性の候補タンパク質を発現するクローンが、更なるいずれの操作の必要性もなくクローンライブラリーから得られるであろう。しかしながら、本発明の方法によって可溶性であると同定された候補タンパク質の溶解性を最適化するために、配列変異及びスクリーニングの反復工程を実施することは必要であるか又は所望され得るかもしれない。例えば、最初のライブラリーのスクリーニングは可溶性が増進した多数の候補物質の選別を可能にするであろうが、ただし、このライブラリーは、もっぱら不溶性タンパク質又は安定的に発現されないタンパク質を発現するクローンが夾雑しているであろう。しかしながら、次の世代の候補物質を育てるために第一回目のスクリーニング過程の後で選別された可溶性候補物質を用いて反復サイクルを実施することによってこの過程をくり返すことが可能になる。更なる変異とスクリーニングの連続工程を実施することによって、これらか陽性候補物質を更なる可溶性へと発展させることが可能であろう。前記プールの内容はより多くの可溶性(“適合物”)候補物質によってますます占められるようになるであろう。一連の反復サイクルの後、よい結果の候補物質プールを採取し、この候補物質プールを操作し、新しい一連の反復サイクルを更に厳格な選別基準の下で開始するために用いられる新しいライブラリーを作出することができる。好ましくは、ただ1回の操作とスクリーニング工程の繰返しが実施され、より好ましくは3回、更に好ましくは4回又はそれより多くの工程繰返しが実施される。自動化の可能性は、はるかに多くのサイクル、必要ならばおそらく100回、500回又は1000回のサイクルの使用を可能にし得る。
【0023】
本発明の方法論の能力を高処理スクリーニングの方法論で遺憾なく発揮させるために、ライブラリーサイズと等しいスケールでスクリーニングが機能できることが必要である。このタイプの技術の能力を完全に利用するために、コロニーピッカー及び配置ロボットを用いて、平板培養された形質転換体を管理ライブラリーに変換し、更に陽性コロニーについてこれらをスクリーニングするべきである。理想的には、各コロニーは、プレートの特定のウェルに一致する“アドレス”を与えられる。バーコードの使用がアドレス付与を促進することができる。場合によって、ライブラリーは安全のために正確に複製することができる。好ましくは、コロニーのスクリーニング及び選別は、96のピンピッキングヘッドなどを組み合わせたビデオ技術を用いて自動化される。384ウェルプレートは、より多くのコロニーのスクリーニングを可能にすることによってこのプロセスを加速することができる。この技術を用いて、ほぼ2500コロニー/時間のピッキング速度が容易に達成される。
本発明の方法を実施するために好ましい方法論では、形質転換体ライブラリーは、LB寒天上のニトロセルロース膜への接種物として配置され、コロニーアレーが生成される(Buessow et al. 1998 Nucleic Acids Research 26:5007-5008)。タンパク質の発現は、例えばIPTG及びビオチンを含む寒天に前記の膜を移し、更におよそ3時間適切な温度で増殖させることによって誘発される。続いて細胞をin situで溶解する。その後大規模ドットブロット分析をタンパク質及び/又はDNAの内容物のために実施することができる。この方法では、22x22cmの膜につき60,000クローンを配置し試験することができる。このようなアッセイ様式の使用は、コロニー自体が発現容器として機能し、更にそのように多くのクローンの発現および試験の表記を極めて簡便にできるのでマイクロタイタープレートでクローンを発現させるよりも利点を有する。容易にデコンボルーションすることができる幾何学的配置で配置される場合は、発現レベルおよび溶解性レベルの定量はアレー解析ソフトウェアを使用することにより促進される。クローンを発現レベルに従って並べて、優先順位を付けることができる。前記方法は、多数のアッセイ点を容易にかつ平行して処理すること及びアッセイデータを簡単に最初の物理的クローンに遡ることを可能にする。
【0024】
このタイプの方法論では、配置されたコロニーの細胞性タンパク質は、水酸化ナトリウムに浸したパッドにコロニーを含む膜を静置することによって、in situで細胞を溶解した後で膜上に沈積される。タンパク質はタグに対する抗体によって検出することができる。前記抗体は翻訳後改変(例えばビオチニル化)に対して感受性がなく、これによってタンパク質収量の判定が可能になるが、ただしタンパク質の可溶性の状態は提示されない。より重要なことには、タンパク質は、クローンの可溶性の状態に感受性を有する検出方法を用いて検出することができる。例えば可溶性を表示するタンパク質の翻訳後ビオチニル化の場合には、ストレプトアビジン結合によって、タグが改変さているか否かについての読み出しが提供される。更にまた、発現状態に関する有用な情報は、抗体及びストレプトアビジンシグナルを例えばXY分散グラフで比較し、それによって総タンパク質の可溶性分画の概算を可能にすることによって得ることができる。ストレプトアビジンがペルオキシダーゼ又はアルカリホスファターゼに結合されている場合は、検出は化学発光によるか、又は蛍光色素と結合させることができる。可視化は蛍光画像化によって実施することができる。続いてビオチン陽性と同定されたクローンをライブラリーから単離し、通常の方法で試験して可溶性発現を証明することができる。従って、ビオチン陽性表現型を示すクローンを液体培養液中で増殖させ、IPTGの添加によりタンパク質発現を誘発し、更に可溶性状態は、溶解、及びその後での、例えば遠心又はろ過による溶解物の不溶性及び可溶性調製物への分画によって確認することができる。続いて、タンパク質を分析し、例えばSDS-PAGE及びウェスタンブロットによって性状を決定することができる。
従って、抗体及びストレプトアビジンのプローブで精査した複製膜の比較によって、個々の変種(例えば切端形)の可溶性の状態を、発現又は非発現、可溶性又は不溶性として読み出すことが可能になる。この方法では、“発現マップ”の作成は、ただ1つのアミノ酸解析度で切断の影響を測定することを可能にすることができる。これは、構造生物学者がタンパク質発現のための構築物を設計するときに必要とするタイプの情報であり、タンパク質発現に影響を与える因子のより深い理解をもたらし得る。
【0025】
更に詳細には、クローンの配列決定を実施して、切端の正確な実体を同定し、更に結合物及び複製物を同定することができる。これらのデータを用いて、クローンを発現レベル及びサイズによって優先順位を決定し、コード遺伝子配列内の短縮点に対して構築物の可溶性を相関させる可溶性発現マップ(図6)に含まれる情報を形成することができる。図6から分かるように、コード遺伝子の配列に従って並べた種々のクローンの可溶性の程度を示す図から明白な順位が存在する。類似の可溶性レベルは連続的短縮を有する構築物で明白で(マーカー点を一続きで示す直線を参照されたい)、これらは溶媒暴露リンカー中の連続残基領域に一致すると考えられる。対照的に、難溶性のギャップが、タンパク質内の構造形成領域内に含まれる短縮境界から明らかである(図11の“結合ドメイン”と記されている領域を参照されたい)。このタイプの解析は、タンパク質構造(例えばドメインの境界及びタンパク質の一次構造における残基の溶媒暴露の度合い)に関する情報を明らかにするために、切端タンパク質変種の可溶性の徹底的解析を可能にすると、本明細書では仮説が立てられている。従って、更なる特徴では、本発明は、タンパク質の構造に関係する情報を得る方法を提供する。前記方法は、上記に記載した本発明の実施態様のいずれかのスクリーニングの方法を実施し、タンパク質配列内に短縮点を有する各構築物の可溶性に関する情報を相関させることを含む。好ましくは、本発明の実施態様のいずれかから得られたデータを用いて、コード遺伝子配列内の短縮点に対して構築物の可溶性をプロットすることによって可溶性発現マップを作成する。溶媒暴露リンカー領域は、顕著な可溶性を有する連続残基の領域として同定される。溶媒暴露リンカー領域間のギャップは、タンパク質配列内の構造形成領域として同定される。溶媒暴露残基と構造形成領域との間の屈曲点はタンパク質配列内のドメイン境界として同定される。
上記のアレー様式での発現試験の前に、遺伝子切端ライブラリーの品質を遺伝子フラグメントのサイズ分布の解析によって測定するべきである。そのような性状決定は典型的には、挿入物にフランキングするプライマーによるPCRスクリーニングを必要とする。これは、挿入物のサイズの見当を提供する。続いて、その認識部位内にATGを含む制限酵素(例えばNdeI)によってPCR生成物を消化することにより、開始コドンを確認することができる。前記アレー様式での発現検査及びライブラリーから陽性物の単離に続いて、クローンの配列決定を実施して短縮の正確な実体を同定することができる。
【0026】
上記に記載した方法論と併せて、好ましくは適切なコントロールを用いて、偽陽性及び偽陰性結果が勘定に入れられていないことを担保するべきである。例えば、陽性コントロールは、このスクリーニング条件下では可溶性であることが判明しているタンパク質を用いるべきである。陽性コントロールの例はマルトース結合タンパク質(MBP)でもよく、前記に対してペプチド基質が融合される。このタンパク質は可溶性で発現され、従って基質改変タンパク質によってペプチド基質の改変を受ける。候補タンパク質に融合させたビオチニル化ペプチドを利用する本発明の実施態様では、陽性コントロールクローンは、従ってビオチニル化ペプチドと融合したMBPであろう。陰性コントロールは、例えばペプチドコード配列内にフレームシフトを含むクローでもよい。前記ペプチドは発現されないか、又は発現されるが可溶性タンパク質とは融合されていない。また別の、更に場合によって補足的陰性コントロールクローンは不溶性タンパク質を前記ペプチドと一緒にインフレームでコードすることができる。不溶性であるので、前記ペプチドは、基質改変タンパク質のための効率的な基質として機能することができない。
本発明の更に別の特徴は、上記に記載した方法論に従って用いられるキットに関する。例えば、候補タンパク質の可溶性変種を同定する適切なキットは以下を含む:
(a)宿主細胞内で変種候補タンパク質を発現させる発現ベクターであって、前記ベクターが、ビオチニル化ペプチドをコードする配列が前記候補タンパク質をコードする問題の遺伝子と遺伝子的に融合され得るように、前記問題の遺伝子の挿入を可能にさせる制限部位を含む、前記発現ベクター;
(b)ビオチニル化ペプチドをコードする核酸と遺伝子的に融合されたマルトース結合タンパク質を発現する陽性コントロールベクター;
(c)(b)と同じであるが、ビオチニル化ペプチドコード配列内にフレームシフトを含み、従ってマルトース結合タンパク質がビオチニル化されない陰性コントロール;及び
(d)不溶性タンパク質をビオチニル化ペプチドとインフレーム発現する更なる陰性コントロールベクター。
前記キットはまた、問題の候補タンパク質をコードする遺伝子の切断ライブラリーを作成し、更に前記切断形が前記ペプチド基質をコードする配列と融合され得るように前記切端形をクローニングするための指示を含むことができる。
本発明の種々の特徴及び実施態様をこれから例示として更に詳細に述べる。詳細部分の改変は本発明の範囲から外れることなく実施し得ることは明白であろう。
【0027】
結果及び方法
実施例−本方法論の概念の証明に以下を用いた:1)以前に発現されなかったタンパク質をコードする候補遺伝子及び2)実証目的のために既知の構造をもつタンパク質をコードするヒトNF-κB遺伝子。
問題の挿入遺伝子によってコードされるタンパク質のN-末端短縮の分析を可能にするベクターの構築:
可溶性スクリーニングにおける普遍的使用のためのプラスミドは、先ず初めに、切端プロセスを可能にする対応する特徴とともに問題の遺伝子を含むベクターをアッセンブリングすることによって構築した。この最初の構築物は候補遺伝子の分析に用いたが、更にまた、他の興味のある任意の遺伝子をクローニングするためのプラスミドの供給源としてもまた、候補物の読み枠を直接別のものに単に置き換えることによって用いた。候補遺伝子を含む構築物の構築を記載し、その後で無関係の別個の遺伝子、NF-κBを含む派生構築物の構築を述べる。
a)候補遺伝子のPCR:
候補遺伝子は開放読み枠を含む以前のプラスミドからPCRによってクローニングした。PCR反応は、PWOポリメラーゼ(Roche)を用い提供された指示に従って50μLの反応物で実施した。PCR構築は、大きなオリゴのプライミングによって生成された最初のアンプリコンを外側の小さなプライマーが増幅するという方法で以下の4つのオリゴヌクレオチドのプライマーを用いた(反応の効率を高めるため):
60nMのfor1、[5'-GATCCTAGCATATGAAATGCATGGATCCGCGGCCGCTGAXXXXXXXXXXXXXXXXXXXXXXXXXXX-3'](ここでXは、ATG開始コドンを省略した、候補遺伝子配列に相補的な塩基を示す);
60nMのfor2、[5'-GATCCTAGCATATGAAATGCATGG-3'];
60nMのFse1rev1、[5'-GATCCTAGGGCCGGCCXXXXXXXXXXXXXXXXXXXXXXXXXXX-3'];
及び600nMのFse1rev2、[5'-GATCCTAGGGCCGGCCXXXXX-3']。
PCRの条件は94℃で2分、続いて25サイクルの94℃で30秒、45℃で30秒、72℃で2分であった。
PCR生成物を1%TBEアガロースで電気泳動し、バンドを切り出し、更にQIAEXIIキット(Qiagen)を用いてDNA生成物を精製した。クローニング用挿入物を作成するために、1μgの前記PCR生成物をNdeI及びFseで完全に消化し、続いて2230bpのDNAフラグメントをQIAEXIIによりゲル精製した。
【0028】
b)ビオチニル化ペプチドをコードするDNA及び候補PCR生成物をクローニングするための適切な制限部位を含むベクターの構築:
オリゴヌクレオチドカセットは以下の2つのオリゴ、biot-1_for及びbiot-1_revをアニールすることによって作成した:
Biot-1_for、[5'-AGCTTGCTTGGTGGCGGTCTGAACGACATCTTCGAGGCTCAGAAAATCGAATGGCACGAATAATGAG-3']、及び
Biot-1_rev、[5'-AGCTTCTCATTATTCGTGCCATTCGATTTTCTGAGCCTCGAAGATGTCGTTCAGACCGCCACCAAGCA-3']。これをpMAL-c2g(New England Biolabs)のHindIII部位に連結して中間体プラスミドpMAS103を形成し、続いて前記をNdeI及びFseIで消化した。5521塩基対フラグメント(ベクターの骨格)を上記のようにゲル精製し、シュリンプアルカリホスファターゼ(Amersham)でリン酸化した。
【0029】
c)PCR生成物の大腸菌発現ベクターによるクローニング:
続いて2230塩基対の候補遺伝子挿入物を5521塩基対のpMAS103由来骨格にT4DNAリガーゼ(Rapid Ligation Kit, Roche)を用いて連結し、その後PCR Quickカラムを用いて反応物を脱塩し、更に10mMのトリス-Cl(pH8.0)の35μL中に溶出させた。2μLの脱塩連結反応物を用いエレクトロポレーションにより大腸菌株DH5αを形質転換し、SOC培養液中で1時間回復させ、LB寒天(アンピシリン70μg/mL補充)で平板培養した。プラスミドをいくつかのコロニーから単離し、制限消化及びDNA配列決定によって性状を調べ、構築物pHAR1111(図1参照)の正確さを確認した。
プラスミドpHAR1111を候補遺伝子の遺伝子切端実験に用いた。前記はまた他の遺伝子の解析のための出発ベクターとしても用いられた。即ち、候補遺伝子をNotI及びFseIによるプラスミド消化によって切り出し、適合するNotI及びFseI部位(PCRによって導入)を開放読み枠の開始コドン及び終止コドンに対して同じ位置に有する遺伝子を連結することによってまた別の遺伝子が挿入された。
例えば、ヒトNF-κB遺伝子は、内部NsiI部位のサイレント除去のために、先ず初めに変異させた。続いて前記を以下のオリゴヌクレオチドプライマーを用いてPCRにより増幅させた:NfkBfor1、[5'-GGATCCGCGGCCGCTGAGCAGATGGCCCATACCTTCAAATATTAGAGC-3'] 及び NfkBFseRev1、[5'-GGGATCCGGCCGGCCCCTTCTGACGTTTCCTCTGCACTTCTTC-3']。その結果、本来の開始コドンが除去された遺伝子が得られた。このPCR生成物をNotI及びFseIで消化し、pHAR1111のNotI及びFseI消化によって誘導したベクター骨格に連結した。従って、NF-κB遺伝子は、問題の遺伝子によってコードされるタンパク質のN-末端欠失と適合する形態で作出された(ベクターpHAR1112;図2)。
要約すれば、2つの類似のベクターが5'欠失ライブラリーの作成を可能にするように生成された:pHAR1111は以前に発現されなかった候補遺伝子を含み、pHAR1112は転写因子NF-κB(実証目的に用いることができる既知の構造をもつタンパク質)のための遺伝子を含んでいた。
【0030】
d)問題の挿入遺伝子によってコードされるタンパク質のC-末端短縮の解析を可能にするベクターの構築:
ベクターpMAS103(上記に記載)は、問題の遺伝子の3'末端での消化を可能にする第二の構築物の土台を形成した。ここでは、候補遺伝子は、開始コドン(ATG)がNdeI部位に存在し(CATATG)、更にpMAS103ベクターのBamHI、XbaI、SalI又はHindIII部位と適合する任意の形態の末端(適合オーバーハングとして又は平滑端連結によって)が終止コドンに続くDNAフラグメントとして完全長でクローニングされた。
これを実証するために、ヒトNF-κB遺伝子を別のプラスミド(pHAR307)(C-末端ヘキサヒスチジンタグ(タグは本実験で重要ではない)をコードするDNAと融合された遺伝子を含む)からNdeI及びBamHIによって切り出した。このフラグメントを、NdeI及びBamHIで消化して調製したpMAS103ベクター骨格に連結した。
要約すれば、プラスミドpNAS106(図3)は、NF-κB挿入物をこの遺伝子によってコードされるタンパク質のC-末端欠失に適合する形態で含む。NF-κBのタンパク質構造は十分に性状が調べられているので、前記をこの後で実証の目的に用いた。
【0031】
切断プロトコル(以前に発現しなかったタンパク質の遺伝子を含むベクターpHAR111について記載)
切端プロトコルはITCHY法(M. Ostermeier & S. Lutz, Methods in Molecular Biology “The Creation ITCHY Hybrid Protein Libraries” 231:129-141)に従って実施した。簡単に記せば、問題の遺伝子を酵素により末端短縮するために、10μgのプラスミドpHAR1111をNotI及びNsiIで完全に消化した。4μgの精製した直鎖状ベクターを1x緩衝液(New England Biolabs)、80mMのNaCl(緩衝液中のNaClに更に加えて)中で最終容積120μLに希釈した。直ちに30μLを150μLのPB緩衝液(Qiagen)に取り出し、t=0秒のコントロールを作成した。残りの90μL(22℃)に、150単位のエキソヌクレアーゼIIIを添加し混合した。30秒間隔で、0.5μLの酵素-DNA反応物を取り出し、ただ1本の300μLのPB緩衝液を含む氷上の“停止試験管”に加えた。前記を合計1時間、90μLの反応混合物が移されるまで続けた。残りの30μLはt=1時間のコントロールを構成し、これもまた150μLのPB緩衝液に添加した。3つの反応物(t=0時間、t=1時間、及びライブラリー)をPCRクリーンアップスピンカラム(Qiagen)を用いて清澄にし、それぞれ30μL、30μL及び50μLのEB緩衝液に溶出させた。コントロールサンプルはゲルで解析し、エキソヌクレアーゼ反応を確認した(データは示されていない)。
エキソヌクレアーゼ消化後に残留した一本鎖のオーバーハングを除去するために、50μLのライブラリー混合物を1xのマングビーンヌクレアーゼ(MBN)緩衝液(New England Biolabs)で希釈し、3単位のMBN酵素をほぼ55μLの最終容積に添加した。続いてこの反応物を37℃で30分インキュベートした。PCRクリーンアップスピンカラムを用いて前記反応物を清澄にし、65μLのEBに溶出させた。
連結前にベクターの末端を平滑にするために、48μLのライブラリーDNAを、2.5mMのdNTP及び1単位のT4 DNAポリメラーゼを含む1xのT4 DNAポリメラーゼ緩衝液で最終容積100μLに希釈した。前記反応物を12℃で20分インキュベートし、続いてEDTAを10mMの最終濃度で添加し更に75℃で20分加熱することによって反応を停止させた。
前記反応混合物を0.5%TBEアガロースゲルにロードし、電気泳動を実施してDNAフラグメントをサイズによって分離した。興味のあるサイズ範囲(>5.5kb)にあるDNAをゲルから切り出し、QIAEXII樹脂(Qiagen)を用いて精製し、60μLのEBに溶出させた。
切断遺伝子フラグメントを含む直鎖状ベクターに対応するサイズ選別DNAを、以下のようにしてT4 DNAリガーゼによって再環状化させた:QIAEXII精製から得たDNA溶液の8μLを製造元の指示に従って試薬(Roche Applied Science Ligation Kit)とともにインキュベートした。PCRクリーンアップスピンカラムを用いて前記連結混合物を脱塩し、2μLを用いて大腸菌DH5αコンピテント細胞をエレクトロポレーションによって形質転換した。SOC培養液中で前記形質転換混合物を回復させた後、前記ライブラリーを22cm平方の寒天プレート(Genetix, UK)で平板培養した。37℃で一晩増殖させた後、24,000個のコロニーを寒天から掻き取り、PBSに再懸濁し、ミニプレップキット(Qiagen)を用いて少量の細胞からプラスミドを調製した。このプラスミドを用いて大腸菌のタンパク質発現株、BL21コドンプラスRIL(Stratagene)を形質転換した。短縮物の均質なサイズ分布は、フランキングプライマーによる96クローンのコロニーPCRスクリーニング及びアガロースゲル電気泳動によって確認した。
【0032】
ライブラリーのロボットによる操作
コロニーピッキング:
プラスミドライブラリーで形質転換したBL21コドンプラスRIL(Stratagene)を22cm平方のLB寒天プレート(アンピシリン70mg/mL;クロラムフェニコール30mg/mL)でほぼ4,000コロニー/プレートで平板培養し、30℃で増殖させた。Kバイオシステム・グリッダーピッカーロボットを用いて、26,880個のコロニーを自動的に384ウェルプレートに釣り上げた。前記ウェルはアンピシリン及びクロラムフェニコールを補充した70μLのLB-HBFM培養液/ウェルで満たされていた。液体培養をHiGroシェーカー・インキュベーター(Genomic Solutions)で、30℃で一晩培養し飽和させた。
ニトロセルロース膜を四角く切り、22cm平方のLB寒天プレート(アンピシリン及びクロラムフェニコールを補充)の上に載せた。グリッディングピンツール及び配置ロボットを用いて、前記平板培養を高密度で前記の膜にプリントした。続いてプレートを25℃で一晩、裸眼でコロニーが見えるようになるまでインキュベートした。前記の膜を寒天から取り出し、新しいLB寒天平板(アンピシリン及びクロラムフェニコールを補充)上に置いた。前記寒天平板にはIPTGが最終濃度0.1mMで補充され、コロニー内の組換えタンパク質発現が誘発された。即座溶解及びビオチニル化ペプチドに対する抗体によるこの時点での全アレー検出によって、タンパク質(可溶性又不溶性;図4)を発現するコロニーが検出される。膜を30℃で4.5時間インキュベートし、前記誘発寒天から取り出し-80℃に置いた。分析の前に、前記膜を室温に温め、0.5MのNaOH、1.5MのNaClに浸したろ紙上に室温で10分静置した。続いてこの膜を、1Mトリス-HCl(pH7.5)、1.5MのNaCl中で2x5分、続いて2xのSSC緩衝液中で15分処理により中和した。続いてこの膜をスーパーブロック(Pierce)で一晩封鎖した。
【0033】
ストレプトアビジン及びペプチドタグに対する抗体によるハイブリッド形成
発現タンパク質の検出:
抗アビタグマウスモノクローナル抗体(Avidity)を1:7500に40mLのPBS-Tで希釈し、ローラーブロット・ハイブリダイゼーションオーブン(Techne)中で2時間室温で添加した。続いて膜をPBS-T緩衝液で3回、各回5分洗浄した。抗マウスペルオキシダーゼ結合物を40mLのPBS-Tで1;25,000に希釈し、ローラーブロット・ハイブリダイゼーションオーブン(Techne)中で1時間室温で添加した。続いて膜をPBS-T緩衝液で3回、各回5分洗浄した。タンパク質の検出は、セイヨウワサビペルオキシダーゼのための化学発光基質(Amersham ECL試薬)及びオートラジオグラフィーを用いて実施した。シグナルはデンシトメトリーによって定量した。
膜のストリッピング:
前記膜をストリッピング緩衝液(PBS;2%(w/v)SDS;100mMベータメルカプトエタノール)中で30分、室温でインキュベートして抗体を除去した。続いてこの膜をPBS-Tで30分洗浄し、続いてスーパーブロックで封鎖した。
ビオチニル化タンパク質の検出:
過剰の封鎖試薬をPBS-Tで5分洗浄することによって取り除いた。ストレプトアビジン-セイヨウワサビペルオキシダーゼを40mLのPBS-Tで1;25,000に希釈し、ローラーブロット・ハイブリダイゼーションオーブン(Techne)中で1時間、室温で膜に添加した。続いて膜をPBS-T緩衝液で3回、各回5分洗浄した。タンパク質の検出は、セイヨウワサビペルオキシダーゼのための化学発光基質(Amersham ECL試薬)及びオートラジオグラフィーを用いて実施した。図5は可溶性タンパク質についてのストレプトアビジンスクリーニングの結果を示す。結果は、誘発及び細胞溶解前のIPTG誘発デュープリケートアレーから得られた結果が示されている(それぞれ図5a及び5b)。IPTG誘発タンパク質発現の証拠は二番目の膜で観察できる(5b)。
検出のためのより定量的なまた別の方法は蛍光を使用し、上記の化学発光に加えて提供される。候補遺伝子の同じライブラリーを上記のアレーのように調製し、続いて蛍光アレキサ488-ストレプトアビジン結合物(Molecular Probes)を用いてビオチニル化タンパク質を検出した。続いてタイフーン画像化装置(Amersham)を用いて前記の膜をスキャンし、ヴィジュアルグリッド・ソフトウェア(GPC Biotech)を用いて画像を解析した(図16)。
【0034】
データ解析:
アレーのシグナルはデンシトメトリーによって定量し、画像分析ソフトを用いてクローンを発現レベルについて並べて(5c)更なる実験のために優先順位を付けた。解析した27000クローンのうち約300を、前記データが可溶性タンパク質発現を表示したので更なる分析のために選んだ。
非選別及び選別クローンの解析:
アレーデータから可溶性の安定なタンパク質であると同定された、pHAR1111の以前には発現されなかった候補遺伝子のライブラリークローンを、ピッカー-グリッダーロボットの再配置機能を用いて、凍結バンクからロボットにより抽出した。挿入物のサイズを、フランキングプライマーによる96クローンのPCRスクリーニング及びアガロースゲル電気泳動を用いてスクリーニングした。ライブラリーの品質を決定するために、比較用ライブラリー由来のクローンのランダム選別について同じ解析を実施した。ランダムに釣り上げたクローンのPCRの結果は図15に示されている。このPCRデータを示すグラフが図14に提示されてあり、切断形の長さの分布は直線的で比較的偏りがないことが観察される。NdeIを用いてPCR生成物を消化し開始コドンが確認された。蛍光分析から最も可溶性の発現クローンであると同定されたクローンのPCR解析は図17に示されてあり、切断形のサイズの分布はもはやランダムではなく、類似のサイズの周囲でクラスターを形成することが明瞭である。
最初の96個の最良の発現クローンのタンパク質発現(同じライブラリーであるがより初期の化学発光検出から得られたもの)はウェスタンブロットによって実証され、発現溶解物のろ過分画によって可溶性であることが確認され(図13)、更に予想した挿入物サイズと一致することが確認された。
続いて以前に発現されなかった候補遺伝子の可溶性発現クローンを、ベクター特異的プライマー(切断遺伝子を超えて読みとりを行う配列を有する)を用いて配列決定して、正確な短縮境界の実体及び複製物(この場合同じクローンが何度も回収された)の両方を同定した。後者は、このタンパク質の各位置が平均して7倍検査されたために生じた。これらのデータを用いて、実験的に決定したクローンを可溶性発現マップ(図11)をもたらした完全長遺伝子に対してアラインメントを実施した。そのようなマップは固有であり、タンパク質について以前には決して作成されなかった。前記マップは、切り縮めて可溶性タンパク質を生じることができるタンパク質内の位置を示す。多数のクローンが同定され、これらは更に、a)ストレプトアビジンでプローブしたとき、膜アレー又はウェスタンブロットで高いシグナルを生じる(即ち良好に発現する)ものを選別することによって、b)連続するアミノ酸が短縮点として同定されたとき最小であるものを選別することによって優先順位をつけることができる。後者は、クローンがX線結晶学のために用いられるときは有利である。なぜならば、秩序だった末端をもつコンパクトなタンパク質は無秩序な付加ペプチドを有するタンパク質よりも効率的に結晶化するからである。この情報解析は、本スクリーニング方法の高処理特性によって可能となる実験のオーバーサンプリングによってのみ可能である。
コード遺伝子の配列に従って並べた種々のクローンの可溶性の程度を示す図から明白な順位が存在するのが分かる。類似の可溶性レベルは連続的な短縮を有する構築物で明白で(マーカー点を一続きで示す直線を参照されたい)、これらは溶媒暴露リンカー中の連続残基領域に一致すると考えられる。対照的に、難溶性のギャップが、タンパク質内の構造形成領域内に含まれる短縮境界から明らかである(図11の“結合ドメイン”と記されている領域を参照されたい)。
このタイプの解析は、タンパク質構造(例えばドメインの境界及びタンパク質の一次構造における残基の溶媒暴露の度合い)に関する情報を明らかにするために、切端タンパク質変種の可溶性の徹底的解析を可能にすると、本明細書では仮説が立てられている。これは、本発明のまた別の特徴を構成する。
【0035】
タンパク質発現:コロニー対液体
図13は、LB培養液で増殖させ、溶解し更に可溶性部分に分画した陽性クローンのウェスタンブロット分析を示す。広い範囲の発現レベルが明瞭であるが、ただし10kDa、20kDa及び30kDaのクラスターを識別することができる(前記は可溶性発現マップでもまた明瞭である(図11))。完全長のタンパク質は86kDaであり、より大きな構築物が存在しないことは、この特定の標的の構造の結果であると考えられる。この結果はまた、コロニーで測定されるタンパク質発現は、より標準的な液体培養様式のタンパク質発現と良好に相関することを示している。
タンパク質発現のスケールアップ及び更なる性状決定:
精製されたタンパク質を発現すると上記で同定された遺伝子構築物の1つを、より強いT7系プロモーターの使用によりタンパク質発現の改善のために、及びN-末端にTEVプロテアーゼで切断して除去できるヘキサヒスチジンタグを添加することにより精製を促進するために、pTriEX誘導ベクター(Novagen)(図19)でサブクローニングした。この特別な構築物の発現はほぼ40mg/mLで良好であり、容易に精製できる物質をもたらす。このことは、精製分画のSDS-PAGE分析によって示される(図18)。本明細書で示される精製タンパク質は、NMRを用いて折り畳みについての性状が調べられ、N15標識物質のHQSCスペクトルは図21に示されている。このタンパク質の完全な構造解析がNMRによって実施され、以前は決して十分に過剰発現されることがなかったタンパク質が確かに折畳まれ可溶性で球状のドメインを含むことが示され、従って本発明の有用性を明示した。このクローンはまた結晶化実験にも用いられた。
更にまた、この標的の二番目に大きい30kDa タンパク質がクローンの選別の手引きとなる可溶性発現マップ(図11)から得られた情報を用いて生成され、前記は、上記に由来するより小さなドメインにプラスしてもう1つの20kDaの物質を含んでいる。これは少なくとも2つのドメインを含むと期待される。このタンパク質は、pTriEX系(図19)及びpMALベクター(New England Biolabs)(前記は容易に精製できるマルトース結合タンパク質融合物を生成し、本明細書の図20に示されている)の両方で効率的に発現される。
【0036】
NF-κBの分析:証明の目的のために既知の構造をもつタンパク質を利用する本発明のまた別の例
上記で詳細に示した第一の例は、本研究の前にはタンパク質を発現させることができなかったので以前には取り扱いが困難なタンパク質であった。しかしながら、本方法を更に実証するために、同じ方法を既知の構造を有するタンパク質に関して実施することがまた必要であろうと考えた。タンパク質NF-κBはよく規定されたドメイン構造を有するので選択した。N-末端短縮用のpHAR1112(図2)及びC-末端短縮用のpMAS106(図3)を用いて2つのライブラリーを構築した。このライブラリーは、エキソヌクレアーゼ切端工程の前にpMAS106をFseI及びXbaIで消化した点を除いて上記の実施例のように構築した。
pMAS106から得たC-末端切断形の品質は、上記のようにフランキングプライマーによる遺伝子フラグメント挿入物のPCRによって測定し、結果は図6に示されている。コロニーアレーは、アレキサ488-ストレプトアビジン結合物を上記に記載したように用い、蛍光法により分析した。陽性クローンをピッカー-グリッダーロボットのチェリーピッキング機能を用いて主要ライブラリーから単離し、最も強い96クローンをPCRによって分析した。結果(図7)は、2つのサイズのDNAクラスターを示し、前記クラスターはほぼ25kDa及び40kDaのタンパク質をコードすると予測される。これらの予想サイズは、NF-κBのドメイン構造と良好に相関性を示す(図8)。最初の48クローンはLB液体培養で発現し、総溶解物及び可溶性溶解物を調製した。ウェスタンブロット(図9)による分析は、全てのタンパク質が全体として可溶性であること、及び、厳密に観察したタンパク質サイズはPCRスクリーニングの予想サイズと一致することを示した(図7)。全ての可溶性クローンの配列を決定し、更に切断によって作出された新規なC-末端をNF-κBのための可溶性発現マップをもたらしたタンパク質配列に対してアラインメントを実施した(図10)。前記タンパク質のドメイン構造が明瞭に示され、更にドメイン端は、各ドメインの最小で最もコンパクトな形態を選択することによって単一アミノ酸の解析度でマップされた(図12)。2ドメインの40kDa及び1ドメインの25kDaの構築物は、DNA結合について機能的であると学術文献に以前に性状が示された。従って、ランダムに切端されたNF-κB遺伝子の可溶性発現についてスクリーニングすることによって同定された前記ドメインは可溶性であり機能的である。
【図面の簡単な説明】
【0037】
【図1】ビオチニル化ペプチドをコードするDNAに3'末端でインフレーム融合された候補タンパク質遺伝子をコードし、更に前記タンパク質のN-末端切断シリーズの作成を可能にするように設計された前記遺伝子の5'末端に制限部位を有する、プラスミドpHAR1111を示す。
【図2】ビオチニル化ペプチドをコードするDNAに3'末端でインフレーム融合したヒトNF-カッパB遺伝子をコードし、更に前記タンパク質のN-末端切断シリーズの作成を可能にするように設計された前記遺伝子の5'末端に制限部位を有する、プラスミドpHAR1112を示す。
【図3】3'末端のビオチニル化ペプチドをコードするDNAに関してはインフレームではないが、5'末端近くでヒトNF-カッパB遺伝子をインフレームでコードし、更に前記タンパク質のC-末端切断シリーズの作成を可能にするように設計された前記遺伝子の3'末端に制限部位を有するプラスミドpMAS106を示す。
【図4】発現分析を示す。写真1aは即座溶解後にペプチドに対する抗体でプローブした全アレーを示す。全ての発現(可溶性発現ではなく)がはっきりと見える。
【図5】可溶性を示すビオチニル化タンパク質の区別を示す発現分析である。図5a及び5bには6つのうちの1つの視野が示されて、5x5のアレーを含む(24プレート/視野)。タンパク質はストレプトアビジン-セイヨウワサビ結合物の結合により同定される。結果は、細胞溶解前に誘発されなかった複製アレー(図5a)及びIPTG誘発アレー(図5b)から得られた。IPTG-誘発タンパク質発現の証拠は第二の膜で観察することができる。スライドは、画像解析ソフトウェア(VisualGrid; GPC Biotech)を用いて定量的に解析される(図5c)。
【図6】切端NF-κB挿入物のPCRによるサイズ分けによって、ランダムなサイズ分布が明らかにされた。
【図7】フランキングオリゴヌクレオチドを用いる発現プラスミドのPCRによってサイズ分けされたDNAフラグメント。可溶性切断NF-κBタンパク質を発現するクローンは、1つ及び2つのドメイン構築物(予想されるサイズはほぼ25kDa及び40kDa)を示す2つのクラスターを構成することができる。
【図8】C-末端から短縮されたときの1つ及び2つのドメインタンパク質フラグメントのサイズを示すNF-κBタンパク質の構造。
【図9】ウェスタンブロットによる、もっとも高い発現を示す48のNF-κBクローンのタンパク質発現スクリーニング。各クローンについて、全体(T)及び可溶性分画(S)との間に顕著な相違はなく、スクリーニングによって同定されたクローンは可溶性であることを示している。大腸菌の内在性BCCPタンパク質のかすかな発現もまた観察される。なぜならば前記は細胞内のただ1つの他のビオチニル化タンパク質だからである。
【図10】完全長の遺伝子配列を用いた、短縮3'末端のDNA配列決定データの最後の18塩基対のアラインメントによる正確な短縮末端の決定を示す。
【図11】可溶性と遺伝子短縮点とを相関させた、以前に非発現とされたタンパク質をコードする遺伝子の可溶性発現マップを示す。N-末端短縮ライブラリーの構築時に作出された新規な開始コドンの位置が完全長遺伝子配列に対してアラインメントされる。2400の位置のうち、61が可溶性タンパク質発現を示唆している。図はバイナリーアウトプット(閾値限界を超える発現対非発現)を表しているが、いくつかのクローンは他のものよりはるかに良好に発現する(低発現及び高発現の例は表示されている)。
【図12】予め定めた完全長タンパク質構造物を用いるランダムスクリーニングによって同定した可溶性発現NF-κB構築物のアラインメント。ドメイン境界の高解析決定はドットで印を付したクローンから明白である。これらは1-及び2-ドメイン構築物のもっともコンパクトな形態である。
【図13】ウェスタンブロット分析を用いて特定されるタンパク質発現。プラスミドpHAR1111内の遺伝子の切断ライブラリーから得られた96の陽性クローンをLBで増殖させ、分画し可溶性分画をStr-HRPを用いてウェスタンブロットで分析した。いくつかの代表的なクローンが示されている。ウェスタン分析に由来する組換えタンパク質は、図11の可溶性発現マップから明白なように、3サイズ範囲(約10、20、30kDa)に従ってクラスターを形成する。内在性宿主タンパク質BCCPもまた表示されている。
【図14】プラスミドの消化によって明らかにされた、プラスミドpHAR1111(図1参照)の遺伝子挿入物のサイズ分布。ここで実施されたエキソヌクレアーゼ短縮プロトコルは、全てのサイズを含む標的遺伝子のランダムな短縮物のスクリーニングを可能にする、直線的で比較的偏りのない遺伝子フラグメントのサイズ分布を生じることが明らかである。
【図15】プラスミドpHAR1111に由来するランダムに切断された遺伝子のPCR分析の結果で、可溶性スクリーニングの前のライブラリー内クローンのサンプルのサイズ分布を示す。
【図16】プラスミドpHAR1111内の遺伝子のランダム切断ライブラリークローンによって発現されたタンパク質の可溶性スクリーニング。ここでアレーは、アレキサ488蛍光発光団結合ストレプトアビジンでプローブされ、画像はタイフーン蛍光スキャナー(Amersham)で捕捉された。可溶性タンパク質を発現するクローンは各々についてデュープリケートパターンで可視化される。
【図17】プラスミドpHAR1111のランダム切端遺伝子のPCR分析結果で、可溶性タンパク質を発現する切断形の非ランダムサイズ分布を示す。
【図18】可溶性スクリーニングを用いて同定された可溶性タンパク質フラグメントの精製プロフィルを示す。遺伝子フラグメントを先ず初めに大腸菌発現ベクターでサブクローニンして、N-末端ヘキサヒスチジンタグを付加して、精製を促進した(図19)。
【図19】タンパク質発現のスケールアップのための遺伝子フラグメントをサブクローニングするために用いられたpTriEXベクター(Novagen)の誘導体である。TEVプロテアーゼが切断することができるヘキサヒスチジンタグをこの構築物のN-末端に添加してアフィニティー精製を可能にする。
【図20】pHAR1111から発現されるタンパク質のマルチドメイン30kDaフラグメントは切端遺伝子とマルトース結合タンパク質との融合後に得られ、発現及び精製を促進する。
【図21】N15標識タンパク質のHQSC NMRスペクトル解析の結果である。前記解析によって、ランダムライブラリーのスクリーニングから同定された精製ドメインは高度に可溶性であるだけでなく良好に折畳まれていることが確認される。
【特許請求の範囲】
【請求項1】
複数の変種候補タンパク質内で可溶性候補タンパク質をスクリーニングする方法であって、各候補タンパク質がペプチド基質と、前記ペプチド基質の酵素改変の検出によって可溶性候補タンパク質を同定できるように融合されることを特徴とする方法。
【請求項2】
前記ペプチド基質が、可溶性であるときに酵素作用によって改変される、請求項1に記載の方法。
【請求項3】
前記ペプチド基質は、それが融合されている候補タンパク質の物理的性状を有意に混乱させない、請求項1又は2に記載の方法。
【請求項4】
前記ペプチド基質は、それが融合されている候補タンパク質の可溶性を有意に混乱させない、請求項3に記載の方法。
【請求項5】
前記ペプチド基質は長さが5から20アミノ酸である、請求項1から4のいずれかに記載の方法。
【請求項6】
前記ペプチド基質がビオチンタンパク質リガーゼのための基質である、請求項1から5のいずれかに記載の方法。
【請求項7】
前記ペプチド基質が、配列GLNDIFEAQKIEWHEを有するBCCPの、15アミノ酸ペプチド模倣物である、請求項6に記載の方法。
【請求項8】
前記ペプチド基質が各候補タンパク質とペプチド結合によって融合される、請求項1から7のいずれかに記載の方法。
【請求項9】
前記ペプチド基質が前記候補タンパク質のカルボキシ末端で融合される、請求項1から8のいずれかに記載の方法。
【請求項10】
前記ペプチド基質が前記候補タンパク質のアミノ末端で融合される、請求項1から9のいずれかに記載の方法。
【請求項11】
複数の変種候補タンパク質が、宿主細胞ライブラリー内に含まれるベクターから発現される、請求項1から10のいずれかに記載の方法。
【請求項12】
前記ライブラリー内の各宿主細胞が、前記ペプチド基質を改変することができる基質改変酵素を発現する、請求項11に記載の方法。
【請求項13】
前記宿主細胞が大腸菌である、請求項11に記載の方法。
【請求項14】
前記大腸菌がビオチンタンパク質リガーゼを発現する、請求項13に記載の方法。
【請求項15】
前記複数の変種候補タンパク質が候補タンパク質の切断形ライブラリーを含む、請求項1から14のいずれかに記載の方法。
【請求項16】
前記ライブラリーが、前記タンパク質をコードする核酸のエキソヌクレアーゼ消化によって作成される、請求項15に記載の方法。
【請求項17】
前記複数の変種候補タンパク質が、コロニーアッセイを用いて可溶性についてスクリーニングされる、請求項1から16のいずれかに記載の方法。
【請求項18】
アレー内のコロニーによって発現される候補タンパク質が、前記改変ペプチドに選択的な抗体又は他の検出試薬(例えばストレプトアビジン)を用いる改変ペプチド基質の検出によって可溶性についてスクリーニングされる、請求項17に記載の方法。
【請求項19】
ライブラリー内の複数の候補タンパク質の可溶性に関する情報をタンパク質配列内の切断点と相関させる工程を更に含む、請求項15から17のいずれかに記載の方法。
【請求項20】
タンパク質の構造に関する情報を得る方法であって、前記方法が、請求項15から17のいずれかに記載のスクリーニング方法を実施し、更にライブラリー内の複数の候補タンパク質の可溶性に関する情報をタンパク質配列内の切断点と相関させる工程を含む、前記タンパク質構造に関する情報を得る方法。
【請求項21】
以下を含む、候補タンパク質の可溶性変種を同定するキット:
(a)宿主細胞内で変種候補タンパク質を発現させる発現ベクターであって、前記ベクターが、ビオチニル化ペプチドをコードする配列が前記候補タンパク質をコードする問題の遺伝子と遺伝子的に融合され得るように、前記問題の遺伝子の挿入を可能にさせる制限部位を含む、前記発現ベクター;
(b)ビオチニル化ペプチドをコードする核酸と遺伝子的に融合されたマルトース結合タンパク質を発現する陽性コントロールベクター;
(c)(b)と同じであるが、ビオチニル化ペプチドコード配列内にフレームシフトを含み、従ってマルトース結合タンパク質がビオチニル化されない陰性コントロール;及び
(d)不溶性タンパク質をビオチニル化ペプチドとインフレーム発現する更なる陰性コントロールベクター。
【請求項1】
複数の変種候補タンパク質内で可溶性候補タンパク質をスクリーニングする方法であって、各候補タンパク質がペプチド基質と、前記ペプチド基質の酵素改変の検出によって可溶性候補タンパク質を同定できるように融合されることを特徴とする方法。
【請求項2】
前記ペプチド基質が、可溶性であるときに酵素作用によって改変される、請求項1に記載の方法。
【請求項3】
前記ペプチド基質は、それが融合されている候補タンパク質の物理的性状を有意に混乱させない、請求項1又は2に記載の方法。
【請求項4】
前記ペプチド基質は、それが融合されている候補タンパク質の可溶性を有意に混乱させない、請求項3に記載の方法。
【請求項5】
前記ペプチド基質は長さが5から20アミノ酸である、請求項1から4のいずれかに記載の方法。
【請求項6】
前記ペプチド基質がビオチンタンパク質リガーゼのための基質である、請求項1から5のいずれかに記載の方法。
【請求項7】
前記ペプチド基質が、配列GLNDIFEAQKIEWHEを有するBCCPの、15アミノ酸ペプチド模倣物である、請求項6に記載の方法。
【請求項8】
前記ペプチド基質が各候補タンパク質とペプチド結合によって融合される、請求項1から7のいずれかに記載の方法。
【請求項9】
前記ペプチド基質が前記候補タンパク質のカルボキシ末端で融合される、請求項1から8のいずれかに記載の方法。
【請求項10】
前記ペプチド基質が前記候補タンパク質のアミノ末端で融合される、請求項1から9のいずれかに記載の方法。
【請求項11】
複数の変種候補タンパク質が、宿主細胞ライブラリー内に含まれるベクターから発現される、請求項1から10のいずれかに記載の方法。
【請求項12】
前記ライブラリー内の各宿主細胞が、前記ペプチド基質を改変することができる基質改変酵素を発現する、請求項11に記載の方法。
【請求項13】
前記宿主細胞が大腸菌である、請求項11に記載の方法。
【請求項14】
前記大腸菌がビオチンタンパク質リガーゼを発現する、請求項13に記載の方法。
【請求項15】
前記複数の変種候補タンパク質が候補タンパク質の切断形ライブラリーを含む、請求項1から14のいずれかに記載の方法。
【請求項16】
前記ライブラリーが、前記タンパク質をコードする核酸のエキソヌクレアーゼ消化によって作成される、請求項15に記載の方法。
【請求項17】
前記複数の変種候補タンパク質が、コロニーアッセイを用いて可溶性についてスクリーニングされる、請求項1から16のいずれかに記載の方法。
【請求項18】
アレー内のコロニーによって発現される候補タンパク質が、前記改変ペプチドに選択的な抗体又は他の検出試薬(例えばストレプトアビジン)を用いる改変ペプチド基質の検出によって可溶性についてスクリーニングされる、請求項17に記載の方法。
【請求項19】
ライブラリー内の複数の候補タンパク質の可溶性に関する情報をタンパク質配列内の切断点と相関させる工程を更に含む、請求項15から17のいずれかに記載の方法。
【請求項20】
タンパク質の構造に関する情報を得る方法であって、前記方法が、請求項15から17のいずれかに記載のスクリーニング方法を実施し、更にライブラリー内の複数の候補タンパク質の可溶性に関する情報をタンパク質配列内の切断点と相関させる工程を含む、前記タンパク質構造に関する情報を得る方法。
【請求項21】
以下を含む、候補タンパク質の可溶性変種を同定するキット:
(a)宿主細胞内で変種候補タンパク質を発現させる発現ベクターであって、前記ベクターが、ビオチニル化ペプチドをコードする配列が前記候補タンパク質をコードする問題の遺伝子と遺伝子的に融合され得るように、前記問題の遺伝子の挿入を可能にさせる制限部位を含む、前記発現ベクター;
(b)ビオチニル化ペプチドをコードする核酸と遺伝子的に融合されたマルトース結合タンパク質を発現する陽性コントロールベクター;
(c)(b)と同じであるが、ビオチニル化ペプチドコード配列内にフレームシフトを含み、従ってマルトース結合タンパク質がビオチニル化されない陰性コントロール;及び
(d)不溶性タンパク質をビオチニル化ペプチドとインフレーム発現する更なる陰性コントロールベクター。
【図1】
【図2】
【図3】
【図4】
【図5】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図2】
【図3】
【図4】
【図5】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【公表番号】特表2008−511310(P2008−511310A)
【公表日】平成20年4月17日(2008.4.17)
【国際特許分類】
【出願番号】特願2007−529389(P2007−529389)
【出願日】平成17年9月5日(2005.9.5)
【国際出願番号】PCT/GB2005/003417
【国際公開番号】WO2006/024875
【国際公開日】平成18年3月9日(2006.3.9)
【出願人】(507070869)
【Fターム(参考)】
【公表日】平成20年4月17日(2008.4.17)
【国際特許分類】
【出願日】平成17年9月5日(2005.9.5)
【国際出願番号】PCT/GB2005/003417
【国際公開番号】WO2006/024875
【国際公開日】平成18年3月9日(2006.3.9)
【出願人】(507070869)
【Fターム(参考)】
[ Back to top ]