説明

タンパク質ライブラリー及びそれを用いるスクリーニング方法

4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質からなるタンパク質ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含む前記タンパク質ライブラリー、及び、このタンパク質ライブラリーを準備し、該ライブラリーを構成するタンパク質の構造又は機能を分析し、構造又は機能を有するタンパク質を選択することを含む、構造又は機能を有するタンパク質のスクリーニング方法。

【発明の詳細な説明】
【技術分野】
本発明は、ランダム配列タンパク質ライブラリー及びそれを用いるスクリーニング方法に関する。
【背景技術】
天然のタンパク質は20種類のアミノ酸から構成されており、これらの並び方でタンパク質の性質が決まっている。例えば、100アミノ酸残基からなるタンパク質のアミノ酸配列は、20100≒1058通り存在する。現存する天然タンパク質は、1つの種がもつタンパク質の種類を10と仮定すると、地球上に存在する種の数が10程であるので、1010ほどしかない。従って、全配列の99%以上は未知の配列であると言える。これら未知の配列を調べることにより、いまだ知られていない構造や機能をもったタンパク質を発見できる可能性がある。その際用いられるのがランダム配列タンパク質ライブラリーであり、通常には、20種類のアミノ酸をコードする64種のコドンがランダムに並んでいる。ここで、64種のコドンのうちUAA、UAG、UGAの3つは終止コドンといい、タンパク質の翻訳をそこで終結させてしまう。すなわち、64種のコドンがランダムに並んでいると、3/64の確率で終止コドンが出現してしまい、平均すると20アミノ酸残基以上のタンパク質は作りにくいという問題が生じる。
Szostakらは、終止コドンを用いずに、80アミノ酸残基のタンパク質からなる、6×1012サイズのランダム配列ライブラリーを構築し、このライブラリーから、ATPに特異的に結合するタンパク質をスクリーニングすることに成功した。そして、ランダム配列タンパク質が機能をもつ確率が1011分の1程度であると推定している(非特許文献1参照)。また、Sauerらは、親水性アミノ酸としてグルタミン、疎水性アミノ酸としてロイシン、タンパク質の水溶性を高める極性アミノ酸としてアルギニンの3種を選び、この3つのアミノ酸からなる70〜90残基をコードするランダム配列DNAライブラリーを構築し、得られるタンパク質の中に2次構造を形成するものが存在することを報告した(非特許文献2及び非特許文献3参照)。Riddleらは、SH3ドメインをコードするDNAに変異を入れ、SH3ドメインを構成するアミノ酸をイソロイシン、リシン、グルタミン酸、アラニン、グリシンの5種類にまで減らして、構造や機能を保持できるかどうか調べた。その結果、SH3ドメインの機能を保持するタンパク質が得られ、そのタンパク質では、活性部位はほぼ保存されていたが、それ以外のアミノ酸はほとんど置換されていたことが報告された(非特許文献4参照)。以上から、ランダム配列タンパク質ライブラリーには、必ずしも20種類のアミノ酸が含まれていなくてもよいと考えられているが、天然タンパク質と同程度の構造をもつタンパク質を得ることは未だできていない。
また、原始地球の大気を模倣した放電実験では、Gly、Ala、Val、Glu及びAspが多く得られることが知られている。
【非特許文献1】 Nature,410,715−718(2001)
【非特許文献2】 Proc.Natl.Acad.Sci.USA,91,2146−2150(1995)
【非特許文献3】 Nature Structural Biology,2,856−864(1995)
【非特許文献4】 Nature Structural Biology,4,805−809(1997)
【発明の開示】
本発明の課題は、構造や機能を持つタンパク質を高効率で得ることのできるタンパク質ライブラリーを提供することである。
本発明者らは、タンパク質を構成するアミノ酸に関し、種類を減らすとともに、特定の種類のアミノ酸が含まれるようにすることによって、構造や機能を持つタンパク質を高効率で得ることのできるタンパク質ライブラリーが構築できることを見出し、本発明を完成した。
本発明は、以下のものを提供する。
(1)4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質からなるタンパク質ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含む前記タンパク質ライブラリー。
(2)4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質をコードする核酸からなる核酸ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含む前記核酸ライブラリー。
(3)前記核酸にコードされるタンパク質が発現可能である、(2)記載の核酸ライブラリー。
(4)(3)記載の核酸ライブラリーの核酸にコードされるタンパク質を、該タンパク質とそれをコードするmRNAとをスペーサーを介して結合させた対応付け分子として発現させ、対応付け分子を構成するタンパク質の性質に基づいて対応付け分子を選択し、選択された対応付け分子を構成するmRNAから核酸を調製することを含む、核酸ライブラリーの製造方法。
(5)(3)記載の核酸ライブラリー又は(4)記載の製造方法により得られる核酸ライブラリーの核酸にコードされるタンパク質を発現させることを含む、(1)記載のタンパク質ライブラリーの製造方法。
(6)(1)記載のタンパク質ライブラリーを準備し、該ライブラリーを構成するタンパク質の構造又は機能を分析し、構造又は機能を有するタンパク質を選択することを含む、構造又は機能を有するタンパク質のスクリーニング方法。
(7)タンパク質ライブラリーが、(5)記載の製造方法により得られるものである(6)記載のスクリーニング方法。
【図面の簡単な説明】
図1は、鋳型DNAの説明図である。
図2は、鋳型DNAの連結法の説明図である。
図3は、鋳型DNA及び連結されたDNAの増幅産物のアガロースゲル電気泳動分析の結果(写真)を示す。矢印はそれぞれ各段階でのランダム配列DNAライブラリーの泳動パターンの位置を示す。
図4は、クローニングベクターの構造を示す。(上)発現抑制ベクターpEOR−BAD−GFP、(下)発現誘導ベクターpET20−GFP。
図5は、ランダム配列タンパク質の発現の確認結果(電気泳動写真)を示す。soluble:可溶性、insoluble:不溶性、elute:溶出液、f.t:通過液。
図6は、ランダム配列タンパク質のCDスペクトル及び2次構造含量を示す。
図7は、ランダム配列タンパク質の蛍光スペクトルを示す。
図8は、ANSのランダム配列タンパク質存在下での蛍光スペクトルを示す。
図9は、ランダム配列タンパク質のゲルろ過の結果を示す。
図10は、プレスクリーニングの概要を示す。
図11は、SP6−Ω29−FLAG−L2−16−HisAの確認結果(電気泳動写真)を示す。
図12は、L2−16 RNAの生成の確認結果(電気泳動写真)を示す。
図13は、in vitroウイルス形成の確認結果(電気泳動写真)を示す。
【発明を実施するための最良の形態】
本明細書においては、塩基の一文字記号ならびにアミノ酸の三文字記号及び一文字記号は、WIPO標準ST.25に定義された意味で用いる。
<1>タンパク質ライブラリー
本発明のタンパク質ライブラリーは、4〜12種のアミノ酸がランダムに配列されたアミノ酸配列(ランダムアミノ酸配列)を有するタンパク質からなるタンパク質ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含むことを特徴とする。
本発明のタンパク質ライブラリーの構成及び製造方法は、ランダムアミノ酸配列が4〜12種のアミノ酸からなり、このアミノ酸にGly、Ala、Val、及び、Glu又はAspが含まれることの他は、通常のランダム配列タンパク質ライブラリーの構成及び製造方法と同様でよい。
ランダムアミノ酸配列は、好ましくは4〜12種のアミノ酸、さらに好ましくは5〜6種のアミノ酸からなることが好ましい。各アミノ酸の比率は、適宜選択できるが、通常には、ランダムアミノ酸配列の全アミノ酸(残基数)に対して、Gly 10〜30%、Ala 10〜30%、Val 10〜30%、Glu又はAsp 10〜30%(両方を用いる場合には、通常、Glu 5〜15%及びAsp 5〜15%)である(ここで、Gly、Ala、Val、及び、Glu又はAspの合計は100%以下である)。
ランダムアミノ酸配列の長さは、通常には、10〜200残基、好ましくは80〜120残基である。
ライブラリーを構成するタンパク質種の数は、ライブラリーの用途によるが、通常には10〜1015、好ましくは10〜1012である。
本発明のライブラリーを構成するタンパク質は、ランダムアミノ酸配列に加えて、別のアミノ酸配列を有していてもよい。別のアミノ酸配列が、ポリヒスチジンペプチドなどの親和性タグであれば、その親和性を利用した精製法により、ライブラリーを構成するタンパク質を容易に精製することができる。
また、本発明のライブラリーを構成するタンパク質は、ラベル化されていてもよいし(WO 02/48395)、また、タンパク質とそれをコードするmRNAとをスペーサーを介して結合させた対応付け分子とされていてもよい(WO 02/48395)。
<2>核酸ライブラリー
本発明の核酸ライブラリーは、4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質をコードする核酸からなる核酸ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含むことを特徴とする。
本発明の核酸ライブラリーの構成及び製造方法は、ランダムアミノ酸配列が4〜12種のアミノ酸からなり、このアミノ酸にGly、Ala、Val、及び、Glu又はAspが含まれる、タンパク質を核酸がコードすることの他は、通常のランダム配列核酸ライブラリーの構成及び製造方法と同様でよい。
4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質は、上記に説明したとおりである。
核酸は、DNAでもRNAでもよい。または、一本鎖及び二本鎖のいずれでもよく、二本鎖の場合にはDNAとRNAのハイブリッドでもよい。
ランダムアミノ酸配列をコードする核酸は、Gで始まるコドンの繰り返しにより作成することが、製造が容易な点で好ましく、2番目の塩基がT、C、A又はG、3番目の塩基がA又はTであるGNWのコドンがさらに好ましい。2番目及び3番目の各塩基の割合は適宜選択できる。
本発明の核酸ライブラリーにおいては、核酸にコードされるタンパク質が発現可能であることが好ましい。通常には、タンパク質をコードする核酸の5’側に、転写プロモーター及び翻訳エンハンサーを含む5’非翻訳領域を結合させ、3’側に、ポリA配列を含む3’末端領域を結合させた核酸とすることで、核酸にコードされるタンパク質を発現可能にすることができる。
核酸ライブラリーは、in vitroウイルス法(WO 02/48347)によるプレセレクションを施すことにより、より精度を高めることができる。すなわち、核酸ライブラリーの核酸にコードされるタンパク質を、該タンパク質とそれをコードするmRNAとをスペーサーを介して結合させた対応付け分子として発現させ、対応付け分子を構成するタンパク質の性質に基づいて対応付け分子を選択し、選択された対応付け分子を構成するmRNAから核酸を調製することにより、核酸ライブラリーを製造することができる。
上記のような核酸ライブラリーを用いて、その核酸ライブラリーの核酸にコードされるタンパク質を発現させることにより、本発明のタンパク質ライブラリーを製造することができる。
<3>スクリーニング方法
本発明のスクリーニング方法は、本発明のタンパク質ライブラリーを準備し、該ライブラリーを構成するタンパク質の構造又は機能を分析し、構造又は機能を有するタンパク質を選択することを含む、構造又は機能を有するタンパク質のスクリーニング方法である。
本発明のタンパク質ライブラリーは、本発明の核酸配列を用いた製造方法により得られるものであることが好ましい。
本発明のスクリーニング方法は、タンパク質ライブラリーとして本発明のタンパク質ライブラリーを用いる他は、通常のランダム配列タンパク質ライブラリーを用いるスクリーニング方法と同様に実施できる。
スクリーニング方法の例としては、in vitroウイルス法(WO 02/48347)、mRNAディスプレイ法(非特許文献1)、ファージディスプレイ法(Science,228,1315−1317(1985))、リボソームディスプレイ法(Proc.Natl.Acad.Sci.USA,94,4937−4942(1997))、ポリソームディスプレイ法(Proc.Natl.Acad.Sci.USA,91,9022−9026(1994))、プラスミドディスプレイ法(Proc.Natl.Acad.Sci.USA,89,1865−1869(1992))、細胞表面ディスプレイ法(Nature Biotechnology,15,29−34(1997))、エマルジョン法(Nature Biotechnology,16,652−656(1998))、STABLE法(FEBS Lett.,457,227−230(1999))などが挙げられる。これらの手法を用いて、標的分子と結合するタンパク質や酵素などの、構造又は機能を有するタンパク質をスクリーニングすることができる。
また、これらのスクリーニング方法で用いられる、構造又は機能の分析方法の例としては、以下の方法が挙げられる。
(1)CDスペクトル測定
CDスペクトルの測定によりα−ヘリックス及びβ−シート構造の情報及び2次構造含量を求めることができる。
(2)蛍光スペクトル測定
トリプトファンのような蛍光分析が可能なアミノ酸が含まれる場合、蛍光分光光度計を用いて、ランダム配列タンパク質の構造を測定できる。
(3)ANS結合実験
ANS(1−アニリノナフタレン−8−スルホン酸)は、タンパク質中に疎水性コアのような構造があるとそこに入り込む性質があるので、これに伴い変化する、ANS本来の蛍光強度及び波長のピークを測定することにより、タンパク質の構造を測定できる。
【実施例】
以下、具体的に本発明の実施例を記述するが、下記の実施例は本発明についての具体的認識を得る一助とみなすべきものであり、本発明の範囲は下記の実施例により何ら限定されるものでない。
実施例1 ライブラリーの構築及び構造を有するタンパク質のスクリーニング
(1)ランダム配列DNAの設計
ランダム配列に含まれるコドンを、1文字目はGに固定し、2文字目はA,T,C,Gを等比率に、3文字目は、ランダム配列中のGC含量を50%にするためにAとTにした。ランダム配列の両端にはTGGを入れ、ランダム配列がトリプトファン残基1分子を挟んで連結されるようにした。トリプトファンは、280nmに吸収極大を示すので、ライブラリーからスクリーニングして得られるタンパク質の構造を測定するのに利用できる。トリプトファンの両側には、ランダム配列の連結に用いるBsaIとBbsIサイト、及び、クローニングの際に用いるBglIIとXhoIを挿入した。また、ランダム配列のコドン2文字目と3文字目の塩基の比率を変えたDNAライブラリー(L2)も合成した(図1)。鋳型DNAの塩基配列を配列番号1に示す。ライブラリー構築の鋳型となる合成DNAの配列は88bpで、ランダム配列内のGC含量はL1が50%、L2では55%である。
(2)鋳型DNAの連結法
(2−1)鋳型DNAの増幅
0.5nMの鋳型DNA、1.25UのEx Taq DNAポリメラーゼ、0.25μMのdNTP mix、ならびに、以下に示す塩基配列を有するそれぞれ0.4μMのプライマーGNW−Fw及びGNW−Rvを含む反応液50μlを用いて増幅を行った。PCRプログラムは、L1ではKK25−60、L2ではKK20−71(下記PCRプログラム参照)とした。

(2−2)フェノール、クロロホルム処理
(2−1)のPCR反応終了後に、反応液に、反応液と等量のフェノールを加えて混合し、12,000rpmで3分間遠心して水層を回収した。さらに回収した水層と等量のクロロホルムを加えて同様の操作を行い、反応液中のDNAポリメラーゼを失活させた。回収したDNAをさらにエタノール沈澱によって精製し、10μlの滅菌水に溶かした。
(2−3)制限酵素反応
(2−2)までの操作で得られた溶液の5μl、NEBuffer3の1μl、及び、BsaIの0.5μlを混合し、滅菌水を加えて10μlとし、50℃で1時間インキュベートした。残りの5μl、1μlのNEBuffer2、及び、0.5μlのBbsIを混合して、滅菌水で10μlにメスアップし、37℃で1時間インキュベートした。反応液を3%アガロースゲルで電気泳動し、ランダム配列が含まれる断片をレコチップを用いて回収した。
(2−4)ライゲーション
BsaIによる断片及びBbsIによる断片のそれぞれ5μl、ならびに、ライゲーションハイ(ligation high)の10μlを混合して16℃で1時間インキュベートしてライゲーションした。ライゲーション反応終了後、再びPCRプログラムKK25−60またはKK20−71のPCR反応を行ってDNAを増幅した。(2−3)及び(2−4)の工程を3サイクル繰り返し、鋳型DNAを連結した(図2)。
(2−3)及び(2−4)の工程では、増幅した合成DNAをランダム配列の両端にあるBbsI又はBsaIサイトで切断することにより、どちらも5’末端にトリプトファン(TGG)を含む相補的な4塩基が突出し、そして、この部分をライゲーションすることにより、間にトリプトファン残基を1個挟んで15アミノ酸残基のランダム配列がが2個連結される。この操作を1サイクルとし、計3サイクル行って、120アミノ酸残基のランダム配列タンパク質ライブラリーが構築できる。3サイクル後にできるライブラリーのサイズは5120≒1083になる。

上記の連結の操作で連結されたDNAを増幅したものを2%アガロースゲル電気泳動で分析した結果を図3に示す。それぞれの段階でのDNAの長さは、88bp(鋳型)、136bp(1サイクル)、232bp(2サイクル)、424bp(3サイクル)であった。図中、矢印はそれぞれ各段階でのランダム配列DNAライブラリーの泳動パターンの位置を示す。サイクル数が増えるごとに非特異的増幅と思われるスメアなバンドが増えて来ているが、予想される位置にバンドが見られ、ライブラリーが構築できているのがわかる。
(4)ベクターの構築
(4−1)発現抑制ベクターの構築
ランダム配列DNAライブラリーをクローニングする際に、ランダム配列からつくられるタンパク質が大腸菌にとって有害であると、大腸菌の生育に支障をきたすので、ランダム配列がコードするタンパク質の発現を抑制するベクターを構築した。発現抑制には、グルコースを過剰に供給することで発現を抑制し、アラビノースを大量に加えることで発現を促進する作用をもつプロモーターであるBADプロモーターを用いた[J.Bacteriol.177,4121−4130(1995)]。GFP遺伝子に、下表に示す塩基配列を有するプライマーT7−GFP及びGFP−Hisを用いてPCRを行い、N末端にT7tag、C末端にHis tagをつけたT7−GFP−Hisを構築した。pEOR−BAD及びT7−GFP−HisをNheIとSacIで切断し、それぞれアガロースゲルから回収した。回収したDNAをligaton highを用いて16℃で1時間インキュベートしてライゲーションし、大腸菌DH5αに形質転換した。形質転換した大腸菌をアンピシリン含有プレートにまき、37℃で1晩インキュベートした。形成したコロニーの内、GFPが発現して緑色蛍光を発するものから、CONCERT MINIPREP KITを用いてプラスミドを抽出し、pEOR−BAD−GFP(図4)を得た。

(4−2)大量発現用ベクターの構築
構築したDNAライブラリーを鋳型にしてタンパク質を大腸菌内で大量発現させるため、pET systemを用いたベクターを構築した。pET20−STAとpEOR−BAD−GFPをそれぞれNheIとHindIIIで切断し、pET20を含むDNAとGFPを含むDNAをレコチップによって回収した。これらをligation highを用いてライゲーションし、DH5αに形質転換してアンピシリン含有プレートで1晩培養した。(4−1)と同様にコロニーからプラスミドを抽出し、pET20−GFPを得た(図4)。
図4には、ライブラリーのクローニング時に用いるBglIIとXhoIの制限酵素サイトを示す。pEOR−BAD−GFP及びpET20−GFPのいずれもアンピシリン耐性遺伝子をもつ。
(5)ライブラリーのクローニングならびにタンパク質の発現及び精製
構築したライブラリーをpGEM−T easy system(Promega)を用いてTAクローニングを行った。アンピシリン含有LB培地で一晩培養することにより形成したコロニーからプラスミドを抽出してランダム配列部分の配列解析を行った。具体的には、形成したコロニーをコロニーPCRに付し、PCR産物をアガロースゲルで電気泳動し適切な長さのバンドが確認できたコロニーをアンピシリン含有LB液体培地で培養し、CONCERT MINIPREP KITによってプラスミドを抽出し、プライマーとして、pGEM−Teasyの場合はT7FGとPsp6、pEOR−BAD−GFPの場合はNcT7tagFとrrnBTer、pET20−GFPの場合は、T7FとT7R(各プライマーの配列は下記表に示す)を用いて、CEQ2000(BECKMAN COULTER)でランダム配列の塩基配列解析を行った。

塩基配列の解析の結果、ライブラリーL1中のアミノ酸組成は、Gly24%、Val41%、Ala18%、Glu7%及びAsp10%であり、ライブラリーL2中のアミノ酸組成は、Gly29%、Val20%、Ala28%、Glu12%及びAsp11%であった。L2の方が、5種類のアミノ酸がバランスよく含まれていたため、以下の実験では、ライブラリーL2を用いた。
塩基配列の解析結果に基づき、得られたランダム配列中に終止コドンが出現していないサンプルを、発現ベクターpET20−GFP(図4)にクローニングした。クローニングしたものを大腸菌BL21(DE3)コドンプラス(codon plus)に形質転換し、アンピシリン及びクロラムフェニコール含有LB寒天培地で培養した。さらに1晩液体培地中で培養し、3mlの培地中で吸光度(600nm)が0.6〜0.7になるまで培養した。吸光度が0.6を超えた時点でIPTGを最終濃度で0.1mM加えてさらに3時間培養することでランダム配列タンパク質を大量合成した。菌体をBug Buster(Novagen)を用いて破砕し、T7タグに対する抗体によるウェスタンブロッティング及びCBB染色によって大量合成を確認した。また、C末端のHisタグによるNi−NTAアガロースへの吸着を同様に確認した。吸着が確認されたタンパク質を、坂口フラスコ1本(250mL)分大量合成して同様の操作によってランダム配列タンパク質を精製した。精製したランダム配列タンパク質を透析によって30mM NaHPO(pH8.0)にバッファー交換した後、CDスペクトルや蛍光強度の測定に用いた。尚、ランダム配列タンパク質の精製に用いた条件を下記に示す。

塩基配列解析の結果、計162種類のランダム配列を解析して、終止コドンを含まないサンプルを10個得た。各ランダム配列(示したアミノ酸残基数はW以外の残基数である)を以下に示す。L2−68は5種類のアミノ酸以外のアミノ酸も含んでいるが、配列中に終止コドンが出現していなかったので、サンプルに含めた。


大腸菌BL21(DE3)codon plusを用いて、小スケールで大量発現させたランダム配列タンパク質を、C末端のHisタグを用いてNi−NTAアガロース(QIAGEN)に吸着させてから溶出した結果を図5に示す。
(6)大量精製したランダム配列タンパク質の構造評価
(5)で得られたサンプルからL2−13、16、18、19、29、68、85及び88の8個をピックアップし、それらのタンパク質を大腸菌内で大量発現、精製した。
大腸菌内で大量発現、精製したランダム配列タンパク質は、可溶性タンパク質はイミダゾール、不溶性タンパク質は尿素で変性させた状態であるので、透析によってバッファーをリン酸バッファー(pH8.0)に交換するとともに、不溶性タンパク質を再度折り畳ませた。以下の測定においては、特記しない限り、ランダム配列タンパク質はこの状態で用いた。
(6−1)CDスペクトル測定
各タンパク質のCDスペクトルを測定した。大量精製の際に各タンパク質で濃度に大きな差があったため、測定時のタンパク質濃度を、L2−13、18、68及び88は1μMに、L2−16、19、29及び85は3μMに調節した。スペクトル測定は4℃で行い、スペクトルの積算回数は4回とした。
(6−2)蛍光スペクトル測定
蛍光分光光度計を用いて、ランダム配列タンパク質中に含まれるトリプトファンの蛍光強度を測定した。測定は全てタンパク質濃度1μMで行った。
(6−3)ANS結合実験
ANS(1−アニリノナフタレン−8−スルホン酸)は、タンパク質中に疎水性コアのような構造があるとそこに入り込む。これにより、ANS本来の蛍光強度及び波長のピークが変化するという性質をもつ。ランダム配列タンパク質1μMに対し、ANSを50μM加えて測定した。
(6−4)ゲルろ過による分子量測定
各ランダムタンパク質が凝集しているかどうかを確認するために、ゲルろ過を行った。大腸菌から精製したランダムタンパク質を透析によって30mM リン酸バッファー(pH7.0)にバッファー交換した後、ゲルろ過を行った(カラム:Shodex KW−803、バッファー:30mM NaHPO(pH7.0)+150mM(NHSO、流速:1.0ml/min)。同様の条件で、Amersham Pharmacia Biotechより購入したLMW Gel Filtration Calibration Kitsを用いて検量線を作成した。
以上の測定による構造評価の結果を図6〜9に示す。
図6は、各ランダム配列タンパク質のCDスペクトル及び2次構造含量を示す。測定濃度が異なるものがあるが、値は全てθに直して表示している。222nmの値を見ると、L2−18及び29はランダムコイルの波形であるが、それ以外はα−ヘリックスやβ−シートなどの二次構造をもつことが示唆される。L2−13はβ−シート構造の波形に近い。
図7は、トリプトファンの蛍光スペクトルの測定結果を示す。
大部分のランダム配列タンパク質は極大波長が350nm付近にあり、トリプトファンが溶媒に露出して自由な環境におかれていることを示しているが、L2−13では、波長が低波長側にシフトしており、トリプトファンが非対称な環境におかれていることから三次構造の存在が示唆される。
図8は、ANS結合実験の測定結果を示す。L2−13、16、18、88では、ANSの蛍光強度が増大していることから、これらのタンパク質にはANSが結合できるような疎水性のクラスターが形成されていることが分かる。
図9は、ゲルろ過による分子量測定の結果を示す。L2−16は2箇所のピークが見られたが、その小さいほうのピークも含めて、測定した全てのランダム配列タンパク質において、モノマーの分子量に近い位置にピークが見られた。したがって、L2−16では一部のタンパク質が3〜4量体を形成しているが、他のタンパク質はすべて会合体や凝集などを起こすことなく、モノマーで存在していることがわかる。アミノ酸配列から予想されるモノマーの分子量と比べて1.3〜1.9倍大きくなっているのは、検量線を作成するのに用いた天然の球状タンパク質ほど構造がコンパクトではなく若干膨潤しているためであると考えられる。
以上の測定の結果をまとめて表7に示す。8個のランダム配列タンパク質のうちL2−29以外は全て、二次構造ないし疎水性クラスター構造の存在を示しており(下線の数字)、このことは、ランダム配列ライブラリーのうち80%以上が構造形成能をもつ可能性を強く示唆している。ゲルろ過の結果から、これらの構造形成の原因はランダム配列タンパク質が凝集を起こしているためではなく、それぞれのタンパク質が単独で構造形成能をもっていることがわかる。このような高い構造形成能からみて、機能を有するものの割合も高いことが推測される。

実施例2 in vitroウイルス法を用いたライブラリーのプレセレクション
実施例1で用いたランダム配列ライブラリーは、フレームシフトを含まないサンプルの確率が低い(インフレーム(in−frame)のサンプルが得られる確率はおよそ7%)。そこで、DNAライブラリーを構築した時点でプレセレクションを行い、ライブラリーの精度を高めることにした。ここでは、ポジティブコントロールとして配列が確認されているL2−16を用いることとした。
図10にプレセレクションの概要を示す。ライブラリーDNAにPCRによってN末端にSP6プロモーター、Ω29、及びFLAGタグを、C末端にはHisタグとポリAテイルを付加し、転写してRNAとする。生成したRNAの3’末端にPEGスペーサーとピューロマイシンを連結し、小麦胚芽の系で無細胞翻訳させることによりin vitroウイルスが形成される。これをC末端のHisタグを用いてNiビーズにより精製すると、ライブラリー中に終止コドンが入っていたり、フレームシフトが起きたりしてHisタグが発現していないDNAは精製されない。この操作により、ライブラリーの精度を上げることができる。
(1)in vitroウイルスに用いるコンストラクトの作成
L2−16のDNAに、PCR(プライマーFLAG−FとHisA−R)によってN末端にFLAGタグを、C末端にHisタグとアデニンを6個付加し、さらにPCR(プライマーSP60FとHisA−R)反応を行って、FLAGタグの前にSP6、Ω29を付加した。プライマー配列を以下に示す。

DNAポリメラーゼはKOD dashを用い、プログラムは、FLAG付加の場合は{94℃→94℃2’→{94℃30”→58℃30”→73℃45”}×25→73℃5’→4℃}、SP6付加では{94℃→94℃2’→{94℃30”→58℃30”→73℃45”}×30→73℃5’→4℃}とした。また、SP6付加のPCRは100μlスケールを2本反応した。このPCR産物をQIA quickによって1本にまとめて30μlスケールに濃縮して以降の操作に用いた。
PCR産物を2%アガロースゲルで電気泳動した結果を図11に示す。コンストラクトの全長は458bpである。
(2)in vitro転写
(1)で調製したPCR産物の濃度を測定し、Ribomax(Promega)を用いて転写した。反応条件は、2.5μg DNA、5mM rNTP(rATP、rCTP、rUTP)、0.4mM GTP、1.6mM cap、及び付属の5×バッファーとSP6 enzyme mixを混合し、DEPC処理水で25μlに合わせた。反応液を37℃で3時間インキュベートして転写反応を行った。反応後、反応液1μlを回収し、残りにDNase Iを2.5μl加えて37℃で15分インキュベートしてDNAを分解した。DNase処理後の反応液を1μl回収し、DNase処理前の反応液とともにアガロースゲルで電気泳動してRNAの生成とDNAの分解を確認した。反応液を、RNeasy(Promega)を用いて精製した。
L2−16 RNAの生成を2%アガロースゲルでの電気泳動により確認した結果を図12に示す。レーン1は転写直後のサンプル。レーン2は転写産物にDNase Iを加えてDNAを除去したサンプル。濃いバンドがRNA、RNAバンドの上の薄いスメア部分がDNA。RNAの生成及びDNAの除去が確認できる。
(3)PEGスペーサー及びピューロマイシンのライゲーション
精製したRNAの濃度を測定し、PEGスペーサー及びピューロマイシンをライゲーションした。反応条件は15℃で20hrインキュベート、反応液組成は、0.2μM PEG−puro、0.2μM PEG2000、2mM DTT、0.8mM ATP、2% BSA、10% DMSOで、T4 RNAリガーゼを用いて行った。ライゲーション産物を、RNeasyを用いて精製し、吸光度から濃度を求めた。
(4)in vitroウイルス形成
ライゲーション産物を小麦胚芽(Promega)の系を用いて無細胞翻訳し、in vitroウイルスを形成させた。反応条件は25℃、1時間で行い、反応液組成は、小麦胚芽液10μl、2pmol RNA、1mM アミノ酸mix1.6μl、RNaseインヒビター0.4μlを混合し、DEPC処理水で20μlとした。反応終了後、反応液を8M 尿素/8% SDS−PAGEで電気泳動してin vitroウイルスの形成を確認するとともに、ピューロマイシンの蛍光をもとに、蛍光イメージャーを用いて対応付け効率を求めた。その結果、対応付け効率は35%であった(図13)。図中、矢印で示した上のバンドがin vitroウイルス、下のバンドがRNAとPEG−ピューロマイシンのライゲーション産物をあらわしている。
【産業上の利用可能性】
本発明によれば、構造や機能を持つタンパク質を高効率で得ることができる。
【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】


【特許請求の範囲】
【請求項1】
4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質からなるタンパク質ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含む前記タンパク質ライブラリー。
【請求項2】
4〜12種のアミノ酸がランダムに配列されたアミノ酸配列を有するタンパク質をコードする核酸からなる核酸ライブラリーであって、前記アミノ酸は、Gly、Ala、Val、及び、Glu又はAspを含む前記核酸ライブラリー。
【請求項3】
前記核酸にコードされるタンパク質が発現可能である、請求項2記載の核酸ライブラリー。
【請求項4】
請求項3記載の核酸ライブラリーの核酸にコードされるタンパク質を、該タンパク質とそれをコードするmRNAとをスペーサーを介して結合させた対応付け分子として発現させ、対応付け分子を構成するタンパク質の性質に基づいて対応付け分子を選択し、選択された対応付け分子を構成するmRNAから核酸を調製することを含む、核酸ライブラリーの製造方法。
【請求項5】
請求項3記載の核酸ライブラリー又は請求項4記載の製造方法により得られる核酸ライブラリーの核酸にコードされるタンパク質を発現させることを含む、請求項1に記載のタンパク質ライブラリーの製造方法。
【請求項6】
請求項1記載のタンパク質ライブラリーを準備し、該ライブラリーを構成するタンパク質の構造又は機能を分析し、構造又は機能を有するタンパク質を選択することを含む、構造又は機能を有するタンパク質のスクリーニング方法。
【請求項7】
タンパク質ライブラリーが、請求項5記載の製造方法により得られるものである請求項6記載のスクリーニング方法。

【国際公開番号】WO2005/047502
【国際公開日】平成17年5月26日(2005.5.26)
【発行日】平成19年6月14日(2007.6.14)
【国際特許分類】
【出願番号】特願2005−510581(P2005−510581)
【国際出願番号】PCT/JP2003/015008
【国際出願日】平成15年11月25日(2003.11.25)
【出願人】(899000079)学校法人慶應義塾 (742)
【Fターム(参考)】