説明

ユニバーサル抗体のライブラリー

ユニバーサル抗体ライブラリーについて記載しており、該ライブラリーは、合成したものであり、特定の規準に従って選択された発現ヒト抗体配列に由来し、該規準は、例えば、その配列がある種の抗原クラス(例えば、低分子、多糖類、ペプチドまたはタンパク質)に反応して発現した天然抗体に由来し、最適な多様性のために操作して作製したCDR領域を有していることである。疾患の治療に適した治療薬を単離するために、このようなライブラリーを作製し、スクリーニングする方法も開示されている。

【発明の詳細な説明】
【技術分野】
【0001】
関連情報
本願は、その全内容を本明細書に参照により組み込んでいる、2004年7月6日に出願した米国仮特許出願第60/585931号に対する優先権を請求している。本明細書全体で引用するすべての特許、特許出願および参考文献の内容は、その全体を参照によりここに組み込んでいる。
【0002】
抗体は、研究手段として、また診断・治療用途において多大な適合性を有している。しかし、このような有用な抗体の特定は困難で、そのためには、特に治療用途を想定した場合、抗体を投与のために適正化する前に、相当程度の再設計または「ヒト化」が必要となることが頻繁である。
【背景技術】
【0003】
望ましい抗体を特定する以前の方法では、代表的抗体、例えばヒトライブラリーまたは合成ライブラリーのファージディスプレイが通常実施されてきたが、このような手法には限界がある。例えば、大部分のヒトライブラリーは、供給源組織から実験的に捕捉またはクローニングできる抗体配列の多様性しか含んでいない。したがって、ヒトライブラリーは、他の貴重な抗体配列を欠いているか、または過少に示している恐れがある。合成またはコンセンサスライブラリーには、免疫原性の潜在性を有する非天然配列をコードする可能性などの他の制約がある。その上、合成ライブラリーを包括的にしようとすると、多様性が増え過ぎて、スクリーニングするのが困難となることが頻繁である。更に、特定の標的に結合する候補抗体を特定するために用いる際、これらのライブラリーは、候補分子の結合性を改良するための合理的な親和性成熟追跡法に不向きである。例えば、後続の抗体改良法では、ランダム変異誘発、飽和変異誘発、変異性PCR、遺伝子シャフリング、抗体連鎖シャフリングなどのin vitro変異誘発がしばしば行われる。このような戦略は元来確率論的であり、何らかの意味ある配列多様性を探索するために、厖大なライブラリーの構築を要することが多い。所与の抗体中で変異を起こすべき位置数が増加するにつれ、生成するライブラリーの規模も妥当なスクリーニング規模より大きくなる。
【0004】
したがって、非免疫原性で、所望の特性、例えば容易にスクリーニングできる代表的多様性を有する候補抗体を、系統的に代表するユニバーサル抗体ライブラリーの必要性が存在する。
【0005】
本発明は、所与の抗原クラスに対する望ましい全候補抗体を表すユニバーサル抗体ライブラリー(UAL)、ならびにそのような抗体ライブラリーを作製し、スクリーニングする方法を提供することによって、上記問題を解決する。更に、ユニバーサル抗体ライブラリーの抗体は、ヒト配列に由来し、そのため非免疫原性であり、したがって治療用途、例えば、ヒトの障害や疾患を予防または治療するためにヒト患者に投与することに適している。
【0006】
本発明のライブラリーは、多重の残基多様性または単一の残基多様性を所与の部位、例えば1個または複数の相補性決定領域(CDR)内に導入する必要があるか否かに応じて、WTM(walk−through変異誘発)またはLTM(look−through変異誘発)(各々例えば、米国特許第6649340号、第5830650号、第5798208号、および米国特許出願第60/483282号を参照されたい)などの例えば変異誘発技術を用いて効率的に導入される多様性を有している。重要なことは、このような技術により、生産的多様性の量を最大限に高め、非生産的多様性、即ち単なるノイズや偶発事象の量を最小限に減らすことが可能である。したがって、本発明のユニバーサル抗体ライブラリーは、既存の抗体ライブラリーより小規模となり得るが、しかし、より合理的な多様性を備えることにより、抗体結合性候補分子をより効率的に特定することができる。
【0007】
一実施形態では、本発明のユニバーサル抗体ライブラリーは、軽鎖および/または重鎖の1個または複数のCDR中に所望の多様性を示す完全合成のライブラリーを創製するために、WTMまたはLTM技術を応用したものである。その抗体配列、例えばフレームワークおよびCDRは、特定の規準に従って選択される。例えば、その1つの規準は、該抗体配列が、発現(再編成)抗体配列内、例えばヒト抗体配列内で、更に、好ましくは抗原の特定クラスに反応した際に、最小限の出現閾値頻度(例えば、約10%以上)を示さねばならないことである。場合により、更に別の規準は、該発現(再編成)抗体配列が、最小限の閾値頻度(例えば、約10%以上)を維持しながら生殖細胞系配列から生じる(誘導される)ことである。更にまた別の規準(1つ/複数)は、所与の長さ、正準構造および/またはCDR相互依存性(例えば、CDR1のCDR2および/またはCDR3に対する)を有するCDR(例えば、発現CDR)同士の比較をすることである。その多様性を特定した後、オリゴヌクレオチドを用いた操作により、それを従来の遺伝子形態、例えば1本鎖抗体形態(scFv)中に組み込むが、その場合のオリゴヌクレオチドにより、遺伝子操作(例えば、ポリメラーゼ連鎖反応(PCR)、SOE(single overlap extension)および/またはKunkel介在変異誘発)によってフレームワークおよびCDR配列の完全な構築が系統的に可能となる。
【0008】
混合プローブを用いたとき通常起こる不適当な変異を回避することによって、非機能性タンパク質を生じる恐れのある任意の変異が、本発明により最小限に抑えられることは重要である。その上、WTMを用いたときに可能な精度は、ランダム変異誘発および/または遺伝子シャフリング技術と対照的である。更に、フレームワーク選択と、位置およびアミノ酸種に関する配列多様性の程度とを制御することによって、ライブラリーによる「抗原」クラスの認識が最適化される。更にまた、このin vitro法は、自己抗原の免疫学的ネガティブ選択と、微生物の環境曝露による遺伝子の任意の偏りとを回避している。
【0009】
したがって、本発明は、不必要に大きくせずに情報提供可能な規模のスクリーニングライブラリーから開始できる利点を提供する。最初の1セットのクローンを特定した後、後続の親和性成熟ライブラリーは、LTMおよび/またはWTMオリゴヌクレオチドの共通セットを共有し、時間および試薬経費を節約できる。更にまた、ユニバーサル抗体ライブラリーは、多様な抗原、特に例えば自己抗原に対するもので、他の任意の方法では得るのが困難である、非常に特異的な抗体を迅速・有効に産生することができる。
【0010】
ユニバーサル抗体ライブラリーは、ある抗体の画定した1個または複数の領域をコードし、本明細書に記載の規準に従って考え得るすべての変異抗体を一括して表現する、個々のポリヌクレオチドを最初に合成することによって、生成し、スクリーニングされる。該変異抗体は、例えばin vitroの転写・翻訳を用いて、および/またはリボソームディスプレイ、ファージディスプレイ、細菌ディスプレイ、酵母ディスプレイなどのディスプレイを用いて発現する。
【0011】
次いで、発現した抗体は、結合アッセイなどの機能アッセイを用いてスクリーニングし、選択する。一実施形態では、そのポリペプチドは、抗体結合性分子、例えば1本鎖抗体(scFv)をコードするポリヌクレオチドと結合して発現し、その結果、抗体結合性分子(例えば、scFv)をコードする該ポリヌクレオチド配列の特定が可能となる。関連する一実施形態では、該抗体は、例えばUS20040072740A1、US20030036092A1およびUS20030100023A1に記載の技術を例えば用いて、E.coliなどの原核生物の膜上に分泌され、ディスプレイされる。
【0012】
本法は、ヒト抗体配列を特定することにより、新規抗体もしくは改良抗体またはその断片、例えば1本鎖抗体(scFv)を開発するために使用できる。その上、本法は、いずれ多様化することになる開始時の1サブセットの配列を選択するために使用できる先験的情報の補助により、例えばコンピュータモデリングや電子データベースのバイオマイニングにより、例えば本明細書に記載の規準に従い、例えばWTMまたはLTM変異誘発を用いて、実施することができる。
【0013】
本発明の他の利点および態様は、以下の説明および実施例から容易に明らかとなろう。
【発明の開示】
【0014】
本明細書および請求の範囲を明確に理解するために、次の定義を以下に示す。
【0015】
定義
本明細書で使用する場合、「抗体結合領域」との用語は、抗原(複数も)を結合できる、免疫グロブリンまたは抗体の可変領域の1個または複数の部分を指す。抗体結合領域は、通常、例えば抗体軽鎖(VL)(またはその可変領域)、抗体重鎖(VH)(またはその可変領域)、重鎖Fd領域、またはFab、F(ab’)、単一ドメイン、1本鎖抗体(scFv)などの抗体複合重軽鎖(またはその可変領域)、あるいは完全長抗体、例えばIgG(例えば、IgG1、IgG2、IgG3、またはIgG4サブタイプ)、IgA1、IgA2、IgD、IgE、またはIgM抗体である。
【0016】
「フレームワーク領域」との用語は、多様性が相対的に高いCDR領域同士の間に存在する、当技術分野認知の抗体可変領域中の部分を指す。このようなフレームワーク領域は、フレームワーク1〜4(FR1、FR2、FR3およびFR4)と通常呼称し、CDRが抗原結合表面を形成できるように、重鎖または軽鎖抗体可変領域中に見出される3個のCDRを三次元空間中に保持するための足場を提供する。
【0017】
「閾値出現頻度」との用語は、免疫細胞が例えば特定クラスの抗原に反応するときに、発現するのに有利な配列であると判定した配列から、ユニバーサル抗体ライブラリーに使用するための選択配列を誘導することを要求する、本発明の規準を指す。閾値出現頻度を満たすと判定されたこのような発現(再編成)配列は、通常、約10%以上の出現率(%)で発現する配列である。
【0018】
「生殖細胞系閾値頻度」との用語は、免疫細胞が例えば特定クラスの抗原に反応するときに、発現するのに有利な生殖細胞系配列であると判定した配列から、ユニバーサル抗体ライブラリーに使用するための選択配列(即ち、発現または再編成配列)を誘導することを要求する、本発明の規準を指す。生殖細胞系閾値頻度を満たすと判定された配列は、通常、約10%以上の出現率(%)で生殖細胞系配列から誘導されるか、またはそれを起源とする配列である。
【0019】
「所定の抗原クラス」、または「抗原のクラス」、または「抗原クラス」との用語は、基本組成から見て構造的/化学的に似ている抗原類を指す。典型的な抗原クラスは、タンパク質(ポリペプチド)類、ペプチド類、多糖類、ポリヌクレオチド類、および低分子類である。
【0020】
「正準構造」との用語には、例えばKabatデータベースの目録に収載する際の当該抗体の直鎖配列に関する検討項目が挙げられる。Kabat付番方式は、抗体可変ドメインのアミノ酸残基に一貫した付番をするための広範に採用されている基準である。追加の構造的検討項目、例えば、Kabat付番法では十分に反映されておらず、例えばChothia等が記載し、例えば結晶構造解析および三次元モデリングにより明らかとなるような差異が、抗体の正準構造を決定するために使用できる。したがって、所与の抗体配列は、とりわけ、適当なアクセプター配列の特定を可能にする正準クラスに分類してもよい。抗体アミノ酸配列のKabat付番法、および例えばChothia等が記載する構造的検討項目、ならびに所与の抗体の正準態様の解釈に対するその関わりは、文献中に記載されている(後述の例えば材料および方法も参照されたい)。「正準構造」との用語は、抗原結合ループの1つが取る主鎖コンホメーションも指す。構造の比較により、抗原結合ループ6個中の5個では、利用可能なコンホメーションの範囲が制限されている。各正準構造の特徴は、ポリペプチド骨格のねじれ角により決定できる。したがって、抗体間の対応ループは、ループの大部分のアミノ酸配列に高い可変性があるにも関わらず、非常に類似した三次元構造を取り得る(Chothia and Lesk,1987 J.Mol.Biol.196,901−917;Chothia et al.,1989 Nature 342,877−883;Martin and Thornton,1996 J.Mol.Biol.263,800−815)。更にまた、採用されているループ構造とその周りのアミノ酸配列との間には関係がある。特定の正準クラスのコンホメーションは、ループの長さと、重要位置にあり、ループと相互作用をしており、外部の保存されたフレームワーク中にあるアミノ酸残基とによって決定される。このような重要なアミノ酸は、水素結合を介して相互作用をしていることが多い。したがって、特定の正準クラスへの指定は、このような重要なアミノ酸残基の存在に基づいて行うことができる。
【0021】
「画定したCDR領域」との用語は、結合性分子の軽鎖可変領域および/または重鎖可変領域の結合性を3個で構成する相補性決定領域(CDR)を指す。可変重鎖配列および可変軽鎖配列の各々には、各可変配列に対してCDR1、CDR2およびCDR3と称する3個のCDRがある。画定したCDR領域は抗体分子の機能活性に寄与し、足場領域またはフレームワーク領域に過ぎないアミノ酸配列がそれらを隔離できる。正確な画定上のCDRの境界および長さは分類体系によって異なる。したがって、CDRは、Kabat、Chothiaによって接触画定域または他の任意の境界画定域と呼ばれる場合がある。境界が異なるにも関わらず、すべてのCDRは、可変配列内のいわゆる「超可変領域」を構成する部分に幾つかの重複残基を有している。したがって、CDRのこれらの画定域は、隣接フレームワーク領域に対して長さおよび境界区域が異なるものとなろう。例えば、Kabat、Chothiaおよび/またはMacCallum等を参照されたい(例えば、その内容全体を本明細書に組み込んである以下のものを参照されたい。Kabat et al.,In“Sequences of Proteins of Immunological Interest,”U.S.Department of Health and Human Services,1983;Chothia et al.,J.Mol.Biol.196:901−917,1987;and MacCallum et al.,J.Mol.Biol.262:732−745(1996))。
【0022】
「保存アミノ酸残基」との用語は、生殖細胞系配列およびCDR配列の間で、あるいは所与の正準クラスおよび/または長さのCDR同士の間で、所与の残基位置に対し通常50%以上(例えば、約60%、70%、80%、90%、95%またはそれより高い)の高い頻度で出現すると決定されたアミノ酸残基を指す。所与の残基がこのように高い頻度で出現すると決定された場合、それは保存されていると判定され、したがって、分析しているCDR領域中の少なくともそのアミノ酸残基位置に対して、本発明のライブラリーにおいては「固定」残基または「定常」残基として表現される。通常は、保存アミノ酸(コドン)位置に対し核酸の変異誘発/可変性は導入されず、該残基が固定され、予め決定されている。
【0023】
「半保存アミノ酸残基」との用語は、生殖細胞系配列およびCDR配列の間で、あるいは所与の正準クラスおよび/または長さのCDR同士の間で、所与の残基位置に対する2〜3個の残基について、高い頻度で出現すると決定されたアミノ酸残基を指す。2〜3個の残基、好ましくは2個の残基が、合計でその時の約40%以上(例えば、50%、60%、70%、80%、90%またはそれより高い)の頻度で発現する場合、該残基は半保存されていると判定され、したがって、分析しているCDR領域中の少なくともそのアミノ酸残基位置に対して、本発明のライブラリーにおいては「半固定」残基として表現される。通常は、適性水準の核酸の変異誘発/可変性が、半保存アミノ酸(コドン)位置に対し、2〜3個の残基が適切に発現するように導入される。したがって、2〜3個の該残基は各々、この位置に対して「半固定」されていると言うことができる。
【0024】
「可変アミノ酸残基」との用語は、生殖細胞系配列およびCDR配列の間で、あるいは所与の正準クラスおよび/または長さのCDR同士の間で、所与の残基位置に対し、可変頻度で出現すると決定されたアミノ酸残基を指す。多数の残基が所与の位置に出現する場合、該残基位置は可変であると判定され、したがって、分析しているCDR領域中の少なくともそのアミノ酸残基位置に対して、本発明のライブラリーにおいては「可変」であると表現される。通常は、適性水準の核酸の変異誘発/可変性が、可変アミノ酸(コドン)位置に対し、正確な残基スペクトルが適切に発現するように導入される。当然ながら、任意のアミノ酸残基位置の結果または可変性、即ち保存、半保存、可変のいずれかは、適当な場合、本明細書に開示した変異誘発法、例えばLTM、WTM、ドーピングWTM、および/または拡張WTMのいずれかを用いて、所望であれば発現、探索または変更できることは理解される。
【0025】
「可変性プロファイル」との用語は、アミノ酸、および特定のCDR位置に存在する出現のそれらの頻度率を指す。該CDR位置は、所望の特性に従って群別された整列CDRデータセットから誘導される。各CDR位置では、アミノ酸頻度の合計が所定の「高い」閾値に達するまで、順位別アミノ酸頻度をその位置の可変性プロファイルに追加する。
【0026】
「アミノ酸」または「アミノ酸残基」との用語は、当技術分野認知の定義を有するアミノ酸を通常指しており、該アミノ酸は、アラニン(Ala)、アルギニン(Arg)、アスパラギン(Asn)、アスパラギン酸(Asp)、システイン(Cys)、グルタミン(Gln)、グルタミン酸(Glu)、グリシン(Gly)、ヒスチジン(His)、イソロイシン(Ile)、ロイシン(Leu)、リシン(Lys)、メチオニン(Met)、フェニルアラニン(Phe)、プロリン(Pro)、セリン(Ser)、スレオニン(Thr)、トリプトファン(Trp)、チロシン(Tyr)、およびバリン(Val)からなる群から選択されるアミノ酸などであるが、修飾、合成または希少アミノ酸も所望であれば使用してもよい。一般に、アミノ酸は、非極性側鎖(例えばAla、Cys、Ile、Leu、Met、Phe、Pro、Val)、負荷電側鎖(例えばAsp、Glu)、正荷電側鎖(例えばArg、His、Lys)、または非荷電側鎖(例えばAsn、Cys、Gln、Gly、His、Met、Phe、Ser、Thr、TrpおよびTyr)を有するものに群別できる。
【0027】
「ライブラリー」との用語は、本明細書に記載するような多様性を有し、本発明の方法により変異誘発された2種以上の抗体分子(またはその断片)を指す。ライブラリーの抗体は、ポリヌクレオチド、ポリペプチド、ポリヌクレオチドとポリペプチド、無細胞抽出物中のポリヌクレオチドとポリペプチドの形態を取るか、あるいは、ファージ、原核細胞に関するか、真核細胞中にあるポリヌクレオチドおよび/またはポリペプチドとなっていることもできる。
【0028】
「ポリヌクレオチド」との用語は、DNA分子およびRNA分子、ならびにその類縁体(例えば、ヌクレオチド類縁体を用い、または核酸化学を用いて生成したDNAまたはRNA)を指す。所望であれば、合成によって、例えば、当技術分野認知の核酸化学を用いて、または酵素的に例えばポリメラーゼを用いて、該ポリヌクレオチドを作製してもよいし、所望であれば修飾してもよい。典型的な修飾には、メチル化、ビオチニル化、および当技術分野公知の修飾が挙げられる。その上、核酸分子は1本鎖、2本鎖のいずれでもよく、所望であれば被検出部に連結してもよい。
【0029】
「変異誘発」との用語は、別途指定しない限り、ポリヌクレオチド配列またはポリペプチド配列を変化させるための当技術分野認知の任意技術を指す。好ましい変異誘発方式には、WTM(walk−through変異誘発)、有益WTM、LTM(look−through変異誘発)、LTM2(改良LTM)、コドンを偏らせるためにドープヌクレオチドを用いるWTM、多様性のより高い領域内に短い配列領域を定常的または固定的に保持するための拡張WTM、あるいはそれらの組合せが挙げられる。
【0030】
「組合せ有益変異誘発」との用語は、LTMアミノ酸変異誘発の所定スクリーニングで可測特性に変更ありと最初に特定された、Vおよび/またはVCDRアミノ酸配列変異体の縮重混合物をコードする、コード配列の組合せライブラリーを指す。組合せ有益変異手法では、LTMによって特定されたこれらの有益変異体の組合せを発現するオリゴヌクレオチドコード配列が生成する。このような組合せは、単一CDR内の異なる有益変異体、単一抗体鎖中にある2個以上のCDR内の変異体、または異なる抗体鎖のCDR内変異体の組合せであってもよい。
【0031】
詳細な説明
概説
抗体は強力な診断・治療手段である。標的に対して容易にスクリーニングできる候補結合性分子を含んだ抗体ライブラリーは、望ましい。包括的なユニバーサル抗体ライブラリーの十分な展望は、これまでのところ幻想であった。合成ライブラリーには、ノイズや、自然には出現しない過剰な多様性が伴う。純粋なヒトライブラリーには、ある種の抗原クラスに対して偏りがあり、その多様性は捕捉技術次第に過ぎない。本発明は、包括的であり、例えばハイスループット法を用いて容易にスクリーニングすることにより、新規な治療薬を得ることのできるユニバーサル抗体ライブラリーを提供する。
【0032】
とりわけ、ユニバーサル抗体ライブラリー(UAL)は任意の抗原を認識する可能性を有している。該ライブラリーの他の重要な利点には、例えば、自己反応性抗体はドナーの免疫系によるネガティブ選択により除去されるため、ヒト発現ライブラリーでは普通認められない自己抗原に対する多様性の増加が含まれる。別の特徴は、FACS(蛍光標示式細胞分取器)によるクローンのポジティブ選択を用いるユニバーサル抗体ライブラリー(UAL)のスクリーニングによって、ハイブリドーマライブラリーの生成および上清スクリーニングを行う標準的で面倒な手順が回避されることである。更にまた、他の所望標的に対する追加の抗体を発見するために、UALライブラリーを再スクリーニングすることもできる。
【0033】
1.1 バイオインフォマティクスを用いるユニバーサル抗体成分の特定および選択
本発明のユニバーサル抗体ライブラリー(UAL)を構築する第1ステップは、所定のある種の規準を満たす配列の選択である。例えば、非冗長再編成抗体配列を含んだ電子データベースのKabatデータベースから、特に特定の抗原クラスに対して極めて高頻度に発現される配列を探すことができる。該抗原クラスは、例えばタンパク質、ペプチド抗原を含むが、低分子、多糖類およびポリヌクレオチドも含むことができる。このような抗体のフレームワーク配列のクラスタリング分析を行った後、生殖細胞系配列(V BASEデータベース)との比較(BLAST探索アルゴリズムを用いて)により、所与の抗原クラス、例えばタンパク質性の抗原または標的を認識する機能抗体を生成するために後に再編成する、最も使用頻度の高い生殖細胞系ファミリーが決定される。
【0034】
次いで、機能抗体の最大で構造多様性が最も高い群を表わす候補フレームワーク配列を選択し、更にCDR1およびCDR2の正準構造を決定することにより、該CDRの長さ、したがってフレームワーク内に収容できる多様性を決定する。CDR3に関しては、再編成抗体配列の頻度分析結果を特定するために、長さのサイズ分布を行う。
【0035】
CDRのアミノ酸配列を誘導する方法には、存在する再編成抗体配列の頻度分析および相当する可変性プロファイル(VP)の生成が含まれる。不変位置を固定する一方で、最高頻度のアミノ酸を他の位置における野生型として選択する。次いで、変異誘発、例えばWTM(walk−through変異誘発)を用いて、このような野生型アミノ酸を系統的に変化させることにより、ユニバーサル抗体ライブラリーを生成する。
【0036】
ユニバーサルライブラリーの構築戦略には、フレームワーク配列の選択と、その後の超可変CDRループの設計が必要となる。フレームワーク配列の選択に関しては、特定抗原に反応して発現したと判定される利用可能なフレームワーク足場すべてのサブセットをアレイ化する。所与の抗原クラスに反応して自然界で最も高頻度に発現するフレームワークの決定によって、適当なフレームワークアクセプターを選択する。例えば、タンパク質系抗原に反応して発現する好ましいアクセプターフレームワークを決定するために、Kabatデータベース(http://www.kabatdatabase.comで利用可能)から「タンパク質指向性」フレームワークを探す。好ましいアクセプター配列が異なる抗原クラスに対してCDRを提示するために必要であれば、および/または特定種のアクセプター配列が必要であれば、それに応じてKabatタンパク質配列フィルターを設定する。例えば、タンパク質系標的に対するヒト用治療薬に使用する配列を決定するためには、タンパク質/ペプチド抗原を認識するヒト抗体配列(マウス、ラット、ニワトリなどのいずれの配列でもない)だけに絞るように該フィルターを設定する。これにより、結果を偏向させる恐れのある、データセットおよび配列情報における冗長が著しく減少する。
【0037】
前記ステップによって、多数の各種合成フレームワーク足場を生成する必要性が最小限となり、約600配列以下の潜在的アクセプターのデータセットが通常得られる。したがって、生成配列数は、抗原クラスによって選択される再編成遺伝子配列を生じる生殖細胞系前駆体配列を決定する更なる分析のために、容易に扱える。生殖細胞系に関するこの第2の決定によって、抗原クラスによって選択された抗体配列の選択は、過剰に提示される最適な(または高頻度)生殖細胞系フレームワーク配列の有無が特定されるので、精度が向上する。多数の再編成抗体配列を産生する、ある種の抗原に対する幾つかのポリクローナル反応では、少数のアクセプターフレームワーク配列が使用されるに過ぎないことが、実際に認められてきた。このような事例では、抗体の抗原に対する配列および結合の多様性は、フレームワークではなく、主にCDRに局在化している。上記のバイオインフォマティクス分析は説明上V遺伝子に集中しているが、Vλ、Vκのいずれの遺伝子も同様に評価されることは理解されよう。
【0038】
1.2 CDR多様性を最大化するための設計戦略
本発明の規準に基づく候補フレームワークの選択によって、導入すべきCDRサイズおよび初期アミノ酸配列多様性が左右される。抗体配列の1)ある抗原クラスに対する出現頻度および2)生殖細胞系頻度を特定すると、該配列をその正準クラスに従って配列できる。正準クラスは、Clothiaにより記載された約束事項(後述の、材料および方法を参照されたい)を用いて決定する。抗体配列の所与のセットについては、該抗体配列の大多数はある一定の正準クラスに入り得る。次いで、該正準クラスにより、CDR内に収容できるアミノ酸残基の個数が決まる。例えば、該正準クラスが1−3であれば、CDR1はアミノ酸6個のループを有し、CDR2はアミノ酸13個のループを有することになろう。重鎖可変配列に関しては、Jセグメントの配列分担は、ほんの6配列のサブセット由来の最適合配列だけを通常検討しさえすればよい程度に、かなり良好に保存されている。Kabat、V BASEの各データベースに関するCDRアミノ酸の頻度分析により、2種の区分、例えば1)保存すべき位置、および2)多様性生成に適する位置に属するCDRアミノ酸残基位置の特定が可能となる。
【0039】
VH−CDR2の設計では、V BASE、Kabatの各データベースにおける多様性分析は、上記VH−CDR1に対して行ったのと同様に行う。
【0040】
CDR3の多様性の設計では、Kabatデータベースからの抗体のCDR3配列は、サイズおよび抗原クラスに従って整列させる。非タンパク質抗原およびタンパク質/ヘプチド抗原を認識する各抗体のCDR3の長さを比較し、頻度分析を行い、10%の閾値頻度を用いて、CDR3多様性の設計に使用すべき最も有利な配列を特定する。CDR3のサイズおよびアミノ酸残基頻度の分析は、例えば免疫グロブリン(D)およびJ遺伝子再編成配列を用いて行うので、フィルター処理済みのKabatおよびV BASEを直接比較するための「CDR3」生殖細胞系相当配列はない。しかし、フィルター処理済みKabatの頻度分析または可変性プロファイル(VP)は、再編成CDR3の各サイズに対して生成することができ(図11および12)、その結果、各サイズ分類に対して、全CDR3位置を通して最も高頻度のアミノ酸が明らかとなり、コンセンサス「野生型」配列が得られる。意外にも、この「コンセンサス」または「頻度」手法によって、高い選択圧を受けている特定のアミノ酸が特定される。したがって、これらの残基位置は通常固定されており、多様性はその他のアミノ酸位置に導入される(特定のアミノ酸がこれらの位置に存在する場合の特定された選択性を考慮すると)。
【0041】
前記CDRのいずれかに対して多様性を設計する場合、修飾アミノ酸残基、例えば大部分のポリペプチドに使用されている従来のアミノ酸20種以外の残基、例えばホモシステインを所望であれば導入できる。これは、修飾アミノ酸残基を所望するポリヌクレオチドに終止コドンを通常導入する当分野認知の技術を用いて実行される。次いで、該技術により、導入すべき修飾アミノ酸に連結した修飾tRNA(例えば終止コドンのアンバー、オパールまたはオーカーのいわゆるサプレッサーtRNA)を当該ポリペプチドに入れる(例えば、Kohrer et al.,Import of amber and ochre suppressors tRNAs into mammalian cells:A general approach to site−specific insertion of amino acid analogues into proteins,PNAS,98,14310−14315(2001))。
【0042】
2.コンピュータ支援ユニバーサル抗体ライブラリー(UAL)の構築
本発明のユニバーサル抗体ライブラリーおよびその構築は、生成すべき抗体多様性に関する配列・構造情報の便宜を得て、改良抗体を生成する可能性が高まるように行う。画定領域、例えばCDRに導入すべきアミノ酸多様性を選択する指針とするために、モデリング情報も使用できる。更にまた、本発明の抗体について得られた実際の結果も、繰り返し作製し、スクリーニングすべきそれ以後の抗体の選択(または排除)、例えば親和性成熟の指針とすることができる。
【0043】
特定の一実施形態では、不十分または不要な構造および/または機能を有すると予測される任意の抗体の産生を省くために、in silicoモデリングを使用する。このようにして、産生すべき抗体数を顕著に減らすことにより、その後のスクリーニングアッセイにおいてシグナルノイズ比を高めることができる。別の特定の実施形態では、任意の関連情報源、例えば遺伝子・タンパク質配列および三次元のデータベース、ならびに/あるいは試験済み抗体の結果から得られる追加のモデリング情報で、in silicoモデリングを継続的に更新することにより、in silicoデータベースの予測能を一層精密にする(図1)。
【0044】
更に別の実施形態では、in silicoデータベースは、アッセイ結果、例えば試験済み抗体の結合親和性/アビディティーを備えており、1種または複数のアッセイ規準に基づいて、該抗体が、反応抗体または非反応抗体として、例えば良好に結合するか、さほど結合しない抗体として区分される。このようにして、本発明の親和性成熟により、ある範囲の機能的反応を特定の配列・構造情報と同等に扱い、このような情報を用いて今後試験すべき抗体の製造の指針とすることができる。本法は、標的抗原に対する特定の結合親和性について、例えばBiacoreアッセイを用いて抗体または抗体断片をスクリーニングするのに特に適している。
【0045】
したがって、ある領域内の特定の残基が所望の機能に関わらないと予測されることが、例えばin silicoモデリングを介して分かれば、その領域内の非隣接残基の変異誘発が望ましいこともある。画定領域間の等位構造および空間的相関関係、例えば抗体の画定領域中の機能性アミノ酸残基、例えば導入したその多様性を検討し、モデル化することができる。このようなモデリング規準には、例えばアミノ酸残基側鎖基の化学的性質、原子間距離、結晶構造解析データなどが挙げられる。したがって、産生すべき抗体数は賢明に最小限とすることができる。
【0046】
好ましい一実施形態では、前記ステップの1つまたは複数がコンピュータで支援される。特定の一実施形態では、該コンピュータ支援ステップは、例えば、Kabatデータベースをマイニングし、場合によりVbaseと結果を相互参照することを含み、それによって本発明の特定の規準を決定し、所望のCDR多様性を設計するために使用する(図1〜2)。本法は、装置、例えばコンピュータ駆動装置によって部分的または完全に実行する場合にも適している。例えば、データベースマイニングによる抗体配列の選択、多様性設計、オリゴヌクレオチド合成、前記操作のPCR介在集積、および所与の標的を結合する候補抗体の発現・選択は、組み合わせた装置類によって部分的または完全に実行することができる。その上、本法を部分的または完全に実行するための指示は、この指示を実行するための電子装置で使用するのに適した媒体に賦与できる。要約すると、本発明の方法は、ソフトウェア(例えば、コンピュータ可読性指示)およびハードウェア(例えば、コンピュータ、ロボット装置およびチップ)を含むハイスループット手法に合わせて修正可能である。
【0047】
3.ユニバーサル抗体ライブラリーの合成
一実施形態では、本発明のユニバーサル抗体ライブラリー(UAL)は、ポリペプチドの画定領域をコードし、所定のアミノ酸に対してコドンを1個だけ有する個々のオリゴヌクレオチドを合成することによって、スクリーニングのために生成される。これは、オリゴヌクレオチド内の各コドン位置に、野生型ポリペプチドの合成に必要なコドン、所定のアミノ酸用コドンのいずれかを導入することによって実現され、LTM(look−through変異誘発)と称する(例えば、米国特許出願第60/483282号を参照されたい)。
【0048】
別の実施形態では、多数のアミノ酸位置における多様性が必要な場合、WTM(walk−through変異誘発)を使用できる(例えば、米国特許第6649340号、第5830650号および第5798208号、ならびに米国特許出願第60/483282号を参照されたい)。WTMにより、最小限のオリゴヌクレオチド数で多重変異を起こすことが可能である。オリゴヌクレオチドは、例えばドーピング技法を用いて、回分で個別に作製でき、次いで所望であれば混合またはプールすることができる。
【0049】
ライブラリーを生成するためのオリゴヌクレオチドの混合物は、既知のDNA合成法により容易に合成できる。好ましい方法では、β−シアノエチルホスホロアミダイトの固相化学法の使用を必要とする(例えば、米国特許第4725677号を参照されたい)。便宜上、指定のヌクレオチド試薬容器を収容している自動DNA合成装置を使用できる。例えば画定領域を表わすポリヌクレオチドをより大きな遺伝子サイズ配列中に導入または構築することを促進するために、制限酵素部位またはプライマーハイブリッド形成部位を含有するように、ポリヌクレオチドも合成してもよい。
【0050】
合成したポリヌクレオチドは、標準的遺伝子工学技法を用いてより大きな遺伝子サイズ配列、例えば1本鎖抗体(scFv)中に挿入できる。例えば、制限酵素のための隣接認識部位を含有するように、ポリヌクレオチドを作製することができる(例えば、米国特許第4888286号を参照されたい)。認識部位は、その領域をコードするDNAに隣接する遺伝子中に天然に存在するか、または導入されている認識部位に相当するように、設計することができる。2本鎖形に変換した後、ポリヌクレオチドは、標準的技法によって該遺伝子または遺伝子ベクター中に連結される。適当なベクター(例えばファージベクター、プラスミドを含めて)によって、該遺伝子は、抗体の発現に適当な無細胞抽出物、ファージ、原核細胞または真核細胞中に導入できる。
【0051】
あるいは、通常長さが約20〜60ヌクレオチドの部分重複ポリヌクレオチドが、設計される。次いで、その内部ポリヌクレオチドを相補パートナーにアニーリングして、更にアニーリングするのに有用な1本鎖伸長部を有する2本鎖DNAを得る。次いで、そのアニーリング対を一緒に混合し、伸長させ、連結することにより、PCRを用いて完全長2本鎖分子を形成することができる(例えば、実施例3を参照されたい)。適当なベクター中にクローニングするために、その合成遺伝子の末端近傍に都合良い制限酵素部位を設計できる。次いで、その完全長分子を適当なベクター中に連結することができる。
【0052】
部分重複ポリヌクレオチドを遺伝子構築に使用する場合、そのポリヌクレオチドの1種の代わりに、縮重ヌクレオチドの1組を直接導入することもできる。適当な相補鎖は、部分相補ポリヌクレオチドからの伸長反応中に、ポリメラーゼによる酵素的伸長によって他方の鎖から合成される。合成段階における縮重ポリヌクレオチドの導入によっても、遺伝子の複数のドメインまたは画定領域に変異を誘発し、または多様性を有するようにそれを操作するクローニングが簡易化される。
【0053】
別の手法においては、抗体が1本鎖プラスミド上に存在している。例えば、ファージベクター中、またはヘルパーファージを用いて1本鎖分子の増殖を可能とする複製源が繊維状ファージのベクター中に、その遺伝子をクローニングできる。この1本鎖鋳型は、所望の変異を表わす1組の縮重ポリヌクレオチドでアニーリングし、伸長させ、連結し、こうして各類縁鎖を適当な宿主中に導入できる分子集団中に組み込むことができる(例えば、Sayers,J.R.et al.,Nucleic Acids Res.,16:791−802(1988)を参照されたい)。この手法により、変異誘発のために多重ドメインを選択する多重クローニングステップを回避できる。
【0054】
ポリメラーゼ連鎖反応(PCR)手法も、ポリヌクレオチドを遺伝子中、例えばCDR多様性をフレームワーク領域中に導入するために使用できる。例えば、ポリヌクレオチド自体を伸長用のプライマーとして使用できる。この手法では、画定領域(またはその一部)に相当する変異原カセットをコードするポリヌクレオチドは、相互に少なくとも部分的に相補性であり、ポリメラーゼ、例えばPCR増幅を用いて大きな遺伝子カセット(例えばscFv)を形成するために、伸長させることができる。
【0055】
ライブラリーの大きさは、CDR鎖長と、例えばWTMまたはLTMを用いて発現する必要のあるCDR多様性の量に応じて変化するであろう。好ましくは、ライブラリーは、1015、1014、1013、1012、1011、1010、10、10、10未満、より好ましくは10未満の抗体を含むように設計されよう。
【0056】
上記説明は、対応するポリペプチドをコードするポリヌクレオチドを変化させることにより、抗体多様性を発現させることを中心としていた。しかし、本発明の範囲が、タンパク質化学を用いて所望のポリペプチドを直接合成することによって、本明細書に開示する抗体多様性を発現させる方法も包含することは理解される。この手法の実施では、生成するポリペプチドは、ポリヌクレオチド中間体の使用を除けることを別とすれば、本発明の特徴を依然として取り込んでいる。
【0057】
上記のライブラリーに関しては、ポリヌクレオチドおよび/または対応ポリペプチドの形態を問わず、当分野認知の技術を用いて、ライブラリーをマイクロチップなどの固体支持体に結合してもよいし、好ましくはアレイ状にしてもよい。
【0058】
本発明の方法は、親和性成熟を介して候補抗体分子を修飾するのに特に有用である。改変は、抗体の可変領域および/またはフレームワーク(定常)領域中に導入できる。可変領域の修飾により、抗原結合性および所望であれば触媒特性が向上した抗体が産生できる。フレームワーク領域の修飾によっても、溶解性や安定性などの物理化学的性質を改良できるが、このような性質は、例えば商業的生産、生体利用率、および抗原に対する親和性に特に有用である。変異誘発の標的は、通常抗体分子のFv領域、即ち重鎖(VH)および軽鎖(VL)から各1本の連鎖2本の可変領域で構成される、抗原結合活性の分担構造となろう。所望の抗原結合特性が特定されると、可変領域(複数も)を操作してIgG、IgM、IgA、IgD、IgEなどの適当な抗体クラスにすることができる。好ましい一実施形態では、特定された候補結合性分子に親和性成熟を施すことにより、標的/抗原に対する該結合性分子の親和性/アビディティーを高める。
【0059】
4.発現系およびスクリーニング系
前記技術または他の適切な技術のいずれかによって生成するポリヌクレオチドのライブラリーは、発現させ、スクリーニングすることにより、所望の構造および/または活性を有する抗体を特定することができる。該抗体の発現は、無細胞抽出物(および、例えばリボソームディスプレイ)、ファージディスプレイ、原核細胞、または真核細胞(例えば、酵母)を用いて実行できる。
【0060】
一実施形態では、ポリヌクレオチドは、無細胞抽出物中で発現できる鋳型として働くように操作される。例えば米国特許第5324637号、第5492817号および第5665563号に記載のベクターおよび抽出物が使用でき、その多数のものは商業的に入手できる。ポリヌクレオチド(例えば、遺伝子型)をポリペプチド(例えば、表現型)に連結するためのリボソームディスプレイおよび他の無細胞技術が使用でき、例えばProfusion(商標)(例えば、米国特許第6348315号、第6261804号、第6258558号および第6214553号を参照されたい)。
【0061】
あるいは、本発明のポリヌクレオチドは、PluckthunおよびSkerraが記載する系などの便利なE.coli発現系中で発現することができる(Pluckthun,A.and Skerra,A.,Meth.Enzymol.178:476−515(1989);Skerra,A.et al.,Biotechnology 9:273−278(1991))。M.Better and A.Horwitz,Meth.Enzymol.178:476(1989)に記載のように、変異タンパク質は、培地中および/または細菌の細胞質中に分泌するように発現させることができる。一実施形態では、VHおよびVLをコードする単一ドメインは各々、ompA、phoA、pelBシグナル配列などのシグナル配列をコードする配列の3’末端に結合される(Lei,S.P.et al.,J.Bacteriol.169:4379(1987))。このような遺伝子融合体は2シストロン性構築体に作製され、それにより単一ベクターから発現され、E.coliのペリプラズム空間中に分泌されることができるが、その場では再度折り畳まれ、活性型に回復できる(Skerra,A.et al.,Biotechnology 9:273−278(1991))。例えば、抗体重鎖遺伝子は、抗体軽鎖遺伝子と同時に発現することにより、抗体または抗体断片を産生することができる。
【0062】
別の実施形態では、抗体配列は、分泌シグナルおよび脂質化部分を用いて原核生物、例えばE.coliの膜表面上に発現され、これについては、例えばUS20040072740A1、US20030100023A1およびUS20030036092A1に記載されている。
【0063】
更に別の実施形態では、ポリヌクレオチドは、例えば酵母ディスプレイを用いて酵母などの真核細胞中に発現でき、これについては、例えば米国特許第6423538号、第6331391号および第6300065号に記載されている。この手法では、ライブラリーの抗体(例えば、scFv)は、酵母の表面上に発現され、ディスプレイされているポリペプチドに融合している。
【0064】
本発明の抗体を発現するためのより高等な真核細胞、例えば骨髄腫細胞(例えば、NS/0細胞)、ハイブリドーマ細胞、チャイニーズハムスター卵巣(CHO)細胞などの哺乳類細胞も使用できる。哺乳類細胞中に発現する場合、抗体は、培地中に発現するか、または該細胞の表面上に発現するように、通常設計される。抗体または抗体断片は、例えば、完全な抗体分子として、または個々のVHおよびVL断片、Fab断片、単一ドメインとして、または1本鎖(sFv)として産生できる(例えば、Huston,J.S.et al.,Proc.Natl.Acad.Sci.USA 85:5879−5883(1988)を参照されたい)。
【0065】
発現抗体(または直接合成により生成した抗体)のスクリーニングは、適当な任意の手段によって行うことができる。例えば、結合活性は、標準的な免疫アッセイおよび/またはアフィニティークロマトグラフィーにより評価できる。本発明の抗体の触媒機能、例えばタンパク質分解機能のスクリーニングは、例えば米国特許第5798208号に記載のように、標準的なヘモグロビンプラークアッセイを用いて実現できる。候補抗体の治療標的結合能の決定は、例えば、所与の標的または抗原に対する抗体の結合率を測定するBiacore装置を用いてin vitroでアッセイできる。in vitroアッセイは、幾種もの動物モデルのいずれかを用いて行い、その後適切であればヒトにおいて試験できる。
【実施例】
【0066】
実施例全体にわたって、別途指示のない限り以下の材料および方法を使用した。
【0067】
材料および方法
本発明の実施は、別途指示のない限り、化学、分子生物学、組み換えDNA技術、PCR技術、免疫学(特に、例えば抗体技術)、発現系(例えば、無細胞発現、ファージディスプレイ、リボソームディスプレイおよびProfusion(商標))、ならびに必要な任意の細胞培養に関する従来技法は、当分野の技術に含まれ、文献中で説明されている。例えば、Sambrook,Fritsch and Maniatis,Molecular Cloning:Cold Spring Harbor Laboratory Press (1989);DNA Cloning,Vols.1 and 2,(D.N.Glover,Ed.1985);Oligonucleotide Synthesis(M.J.Gait,Ed.1984);PCR Handbook Current Protocols in Nucleic Acid Chemistry,Beaucage,Ed.John Wiley & Sons(1999)(Editor);Oxford Handbook of Nucleic Acid Structure,Neidle,Ed.,Oxford Univ Press(1999);PCR Protocols:A Guide to Methods and Applications,Innis et al.,Academic Press(1990);PCR Essential Techniques:Essential Techniques,Burke,Ed.,John Wiley & Son Ltd(1996);The PCR Technique:RT−PCR,Siebert,Ed.,Eaton Pub.Co.(1998);Antibody Engineering Protocols(Methods in Molecular Biology),510,Paul,S.,Humana Pr(1996);Antibody Engineering:A Practical Approach (Practical Approach Series,169),McCafferty,Ed.,Irl Pr(1996);Antibodies:A Laboratory Manual,Harlow et al.,C.S.H.L.Press,Pub.(1999);Current Protocols in Molecular Biology,eds.Ausubel et al.,John Wiley & Sons(1992);Large−Scale Mammalian Cell Culture Technology,Lubiniecki,A.,Ed.,Marcel Dekker,Pub.,(1990).Phage Display :A Laboratory Manual,C.Barbas(Ed.),CSHL Press,(2001);Antibody Phage Display,P O’Brien(Ed.),Humana Press(2001);Border et al.,Yeast surface display for screening combinatorial polypeptide libraries,Nature Biotechnology,15(6):553−7(1997);Border et al.,Yeast surface display for directed evolution of protein expression,affinity,and stability,Methods Enzymol.,328:430−44(2000);米国特許第6348315号にてPluckthun 他が記載したリボソームディスプレイと、米国特許第6258558号、第6261804号および第6214553号にてSzostak他が記載したProfusion(商標);ならびにUS20040058403A1に記載の細菌ペリプラズム発現を参照されたい。
【0068】
Kabatの約束事項を用いた抗体配列分析に関する更なる詳細説明は、例えば以下の文献に見出すことができる:Johnson et al.,The Kabat database and a bioinformatics example,Methods Mol Biol.2004;248:11−25;Johnson et al.,Preferred CDRH3 lengths for antibodies with defined specificities,Int Immunol.1998,Dec;10(12):1801−5;Johnson et al.,SEQHUNT.A program to screen aligned nucleotide and amino acid sequences,Methods Mol Biol.1995;51:1−15.and Wu et al.,Length distribution of CDRH3 in antibodies;and Johnson et al.,Proteins.1993 May;16(1):1−7.Review。
【0069】
Chothiaの約束事項を用いた抗体配列分析に関する更なる詳細説明は、例えば以下の文献に見出すことができる:Chothia et al.,Structural determinants in the sequences of immunoglobulin variable domain,J Mol Biol.1998 May 1;278(2):457−79;Morea et al.,Antibody structure,prediction and redesign,Biophys Chem.1997 Oct;68(1−3):9−16.;Morea et al.,Conformations of the third hypervariable region in the VH domain of immunoglobulins;J Mol Biol.1998 Jan 16;275(2):269−94;Al−Lazikani et al.,Standard conformations for the canonical structures of immunoglobulins,J Mol Biol.1997 Nov 7;273(4):927−48.Barre et al.,Structural conservation of hypervariable regions in immunoglobulins evolution,Nat Struct Biol.1994 Dec;1(12):915−20;Chothia et al.,Structural repertoire of the human VH segments,J Mol Biol.1992 Oct 5;227(3):799−817 Conformations of immunoglobulin hypervariable regions,Nature.1989 Dec 21−28;342(6252):877−83;and Chothia et al.,Review Canonical structures for the hypervariable regions of immunoglobulins,J Mol Biol.1987 Aug 20;196(4):901−17)。
【0070】
Chothia分析に関する更なる詳細説明は、例えば以下の文献に記載されている:Morea V,Tramontano A,Rustici M,Chothia C,Lesk AM.Conformations of the third hypervariable region in the VH domain of immunoglobulins.J Mol Biol.1998 Jan 16;275(2):269−94;Chothia C,Lesk AM,Gherardi E,Tomlinson IM,Walter G,Marks JD,Llewelyn MB,Winter G.Structural repertoire of the human VH segments.J Mol Biol.1992 Oct 5;227(3):799−817;Chothia C,Lesk AM,Tramontano A,Levitt M,Smith−Gill SJ,Air G,Sheriff S,Padlan EA,Davies D,Tulip WR,et al.Conformations of immunoglobulin hypervariable regions.Nature.1989 Dec 21−28;342(6252):877−83;Chothia C,Lesk AM.Canonical structures for the hypervariable regions of immunoglobulins.J Mol Biol.1987 Aug 20;196(4):901−17;and Chothia C,Lesk AM.The evolution of protein structures.Cold Spring Harb Symp Quant Biol.1987;52:399−405。
【0071】
CDR接触の検討に関する更なる詳細説明は、例えばMacCallum RM,Martin AC,Thornton JM.Antibody−antigen interactions:contact analysis and binding site Topography.J Mol Biol.1996 Oct 11;262(5):732−45に記載されている。
【0072】
本明細書で言及した抗体の配列およびデータベースに関する更なる詳細説明は、例えば以下の文献に見出される:Tomlinson IM,Walter G,Marks JD,Llewelyn MB,
Winter G.The repertoire of human germline VH sequences reveals about fifty groups of VH segments with different hypervariable loops.J Mol Biol.1992 Oct 5;227(3):776−98;Li W,Jaroszewski L,Godzik A.Clustering of highly homologous sequences to reduce the size of large protein databases.Bioinformatics.2001 Mar;17(3):282−3;[VBDB]www.mrc−cpe.cam.ac.uk/vbase−ok.php?menu=901;[KBTDB]www.kabatdatabase.com;[BLST]www.ncbi.nlm.nih.gov/BLAST/[CDHIT]bioinformatics.ljcrf.edu/cd−hi/;[EMBOSS]www.hgmp.mrc.ac.uk/Software/EMBOSS/;[PHYLIP]evolution.genetics.washington.edu/phylip.html;and [FASTA]fasta.bioch.virginia.edu。
【0073】
細菌発現ライブラリーは、通常以下のように構築した。Harvey et al.PNAS 101(25):9193.(2004)に記載のAPEx発現ディスプレイ系などの適当な発現ディスプレイベクター中に、鋳型配列(図18)をクローニングする。APExベクター中に導入した配列で調製した構築体のKunkel変異誘発によって、ウォークスルー(walkthrough)および拡張ウォークスルーライブラリーを調製する。Kunkel変異誘発用の1本鎖鋳型は、標準処方を用いて調製した(Sidhu,S.S.(2000)Methods Enzymol.328:333−63)。鋳型のKunkel変異誘発は、例えば以下の文献に詳述されるような標準的方法に従って実行した:Kunkel,T.A.(1985)Proc.Natl.Acad.Sci.USA 82:488−92;Kunkel,T.A.et al.(1987)Meth.Enzymol.154:367−82;Zoller,M.J.and Smith,M.(1983)Meth.Enzymol.100:468−500;Hanahan,D.(1983)J.Mol.Biol.166:557−80;and Maniatis,T.,Fritsch,E.F.and Sambrook,J.(1989)in Molecular Cloning,A Laboratory Manual。
【0074】
図26は、CDRライブラリー収集オリゴヌクレオチド類を鋳型抗体コード配列中に導入するKunkel変異誘発法における一般的ステップを示す。先ず、1本鎖ウラシル化鋳型を、CDRL3用に選択されたコドン置換部を有するL3オリゴヌクレオチド集合体(緑色断片)と反応させる。SEQID−1を利用する鋳型に関しては、サイズ2種のCDRL3、サイズ8および9がある。その各サイズに対して、ウォークスルーアミノ酸の各々により、単一のオリゴヌクレオチド混合物が生成すると思われる。ウォークスルーオリゴヌクレオチド混合物9種をサイズ8(VKIII_3_8)に対して示し、ウォークスルー混合物9種をサイズ9(VKIII_3_9)に対して示す。オリゴヌクレオチド混合物全18種を等モルずつ混合し、Kunkel変異誘発を前記のように行う(STEP1)(Sidhu,S.S.(2000)Methods Enzymol.328:333−63)。通常1本鎖鋳型の10μg反応で、10〜10個規模の形質転換体ライブラリーが得られよう。この変異誘発反応はDH5α細胞中に形質転換され、CDRL3ライブラリー集合体上でマキシプレップ(maxiprep)を行う。
【0075】
L3ライブラリー1本鎖鋳型を調製するために、L3ライブラリーDNAのこの集合体をCJ236細胞中に形質転換する(STEP2)。これにより、追加のCDR変異誘発を導入するための1本鎖鋳型が生成する。変異誘発したH3ライブラリーオリゴヌクレオチド(STEP3)をCDRL3ライブラリー鋳型にアニーリングする。図18に示した配列を利用する鋳型に関しては、CDRH3の鎖長10種、サイズ9〜18を初期設計で使用する。CDRH3の各サイズについては、別々の反応を行う。したがって、ステップ3では、各反応に対し1本鎖鋳型20μgを利用して10種の反応を別々に行う。CDRH3の各サイズ内では、ウォークスルーアミノ酸9種を利用する。したがって、サイズ9(VH_3_9)の各反応に対して縮重オリゴヌクレオチド9種が一緒にプールされ、サイズ10(VH_3_10)に対しても類似数がプールされるなどである。1本鎖鋳型各20μgの反応で、10個を超える形質転換体が得られる。したがって、CDRのサイズ10種を含んだこのライブラリーに関しては、CDRL3/CDRH3の全ライブラリーは、全形質転換体が1010個を超える。各変異誘発反応をDH5α細胞中に形質転換し、プラスミドDNAのマキシ調製後、該DNAを、APExディスプレイおよびスクリーニング(Harvey et al.PNAS 101(25):9193(2004)に記載のように)用のDH12S細胞などの適当な発現・ディスプレイ細胞系中に形質転換できるか、またはCDRH1、CDRH2、CDRL1、CDRL2などの他のCDR中に変異を更に導入するために、CJ236細胞中に該プラスミドを更に形質転換できる(STEP4)。
【0076】
(実施例1)
バイオインフォマティクス主導のユニバーサル抗体ライブラリー配列の特定方法
この実施例では、バイオインフォマティクスと本発明の判定規準とを用いて、ユニバーサル抗体ライブラリーの配列を特定および選択する。
【0077】
簡潔には、発現された免疫グロブリン、即ち再編成された免疫グロブリンの配列を含有するKabat電子データベースの検索を、特定のフィルターアルゴリズムを用いて行う。詳細には、特定の抗原クラスに応答して発現されたヒト配列のみが特定されるようにフィルターアルゴリズムを設計した。選択された抗原クラスはタンパク質ベースの抗原/標的であった。それは、この抗原クラスが、ヒト治療薬を開発するために扱いやすい標的のセットであるためである。しかし、このデータベースは、他の抗原クラス、例えば、ペプチド、多糖類、ポリヌクレオチド、および低分子の照会、ならびに、例えば獣医学用途の治療薬を開発するための、霊長類、マウス、ラット、またはニワトリ配列などの他の種に由来する抗体配列の照会にも全く同じく容易に受け入れると理解されている。5971のV配列からなる初期セットに、以上の判断規準を適用した(しかし、このセットの配列は、追加の配列がクローニングされ、データベースに入力されるのに従って、数が増加しうることに留意されたい)。
【0078】
上記検索およびフィルター分析から、タンパク質抗原を認識する非重複の再編成ヒト抗体クローンを代表する約380のV遺伝子配列からなるデータセットが返答された。次のステップでは、これらの再編成された遺伝子配列を産生した生殖系列前駆体の指定を行い、それに続いて、これらの生殖系列候補配列の頻度分析を行う。換言すれば、タンパク質抗原用に最適または高頻度な生殖系列フレームワーク配列が存在するかどうかに関する判定を行う。フィルターを通ったV配列(Kabatから)の中の再編成された遺伝子によって用いられている生殖系列配列を決定するために、V BASEを用いた。V BASEは、GenbankおよびEMBLデータライブラリー(それぞれ、例えば、Altschul,S.F.、Gish,W.、Miller,W.、Myers,E.W.、およびLipman,D.J.(1990年)、「Basic local alignment search tool」、J.Mol.Biol.215:403−410、ならびに、MRCタンパク質工学センター(Centre for Protein Engineering MRC Centre,Hills Rd,Cambridge,UK,CB2 2QH)によって運営されている一般に利用可能なデータベースを参照のこと)の現在の最新版にあるものを含めた、公表されている1000の配列から収録されたヒト生殖系列可変領域配列の包括的な総覧である。現在、7つのファミリー(即ちV1−7)に分類されている51の機能的Vセグメント、7つのファミリー(即ちVκI−VII)に分類されている40の機能的なVκセグメント、および10のファミリー(即ちVλ1−10)に分類されている31の機能的なVλセグメントが存在する。発現された(再配列された)配列に最も高頻度に寄与するV生殖系列遺伝子(およびファミリー)を特定するために、フィルターを通ったKabat配列(約380V)に対する、V BASE生殖系列配列のBatch BLASTを行った。この分析は、例えば、最も高頻度で現れる8つのフレームワークのうちの6つ(フレームワーク1、2、および3)がV3生殖系列ファミリーに属すること、ならびに、V1およびV4ファミリーのメンバーが中程度に現れるグループを形成したことを特定した。フィルターを通ったKabatデータベースに現れた生殖系列Vフレームワーク(1、2、および3)の配列に関して頻度分析を行った(図3および4)。この分析では、再編成された配列の分類の際、生殖系列遺伝子に最大4つまでの体細胞変異(点入り棒グラフ)を許した。フィルターを通ったKabatと生殖系列遺伝子との間の一致は、中空の棒グラフで示す。閾値ラインは、タンパク質/ペプチド抗原を認識する抗体の再編成された配列で最も高頻度で現れる生殖系列遺伝子を特定するように設定されている(図3および4)。
【0079】
最も高頻度のV3フレームワークの特定は、重要な結果をもたらす。V3初期フレームワーク配列の選択は、対応するCDR配列の多様性および標準的な正準構造によって規定されるサイズ制限を決定する(例えば、Chothia,C.ら、「Structural repertoire of the human VH segments」、J Mol Biol、1992年、227(3)、799〜817頁、およびTomlinson,I.M.ら、「The Structural repertoire of the human V kappa domain」、Embo J、1995年、14(18)、4628〜38頁参照)。また、V BASEによるフィルターを通ったKabatのBLAST検索は、候補分子の親和性成熟中に変異導入できる、体細胞超変異のいわゆる「ホットスポット」である位置も特定する。予備的なKabat−V BASE結果は、高頻度で使用されている4つのV3フレームワーク、即ち3−07、3−11、3−23、および3−33と、V1フレームワークである1−eと、V4フレームワークである4−34および4−30.4とを特定した(図5)。複数の開始フレームワークを選択する際に、潜在的抗原結合のためのCDRの外で、構造的多様性が追加して生成された。6つのJ配列(フレームワーク4をコードする)すべての比較分析は、これらの4つの配列が同一であり、他の2つの配列でも、相違は2アミノ酸のみであることを示す。この配列保存は、7つのフレームワークファミリーすべてに、一般的なフレームワーク4を使用するのを可能にし、多様性によって機能しないものが産生されるのを最小限にする(図5)。
【0080】
したがって、本発明の判定規準を使用し、かつ、バイオインフォマティクス手法および既存の抗体データベースを使用して、抗体アクセプター配列の、操作しやすいセットを合理的に特定できることが実証された。更に、これらの配列の特定は、以下に論じる通り、ユニバーサル抗体ライブラリー内における賢明なCDR多様性を最大にする基礎を提供する。
【0081】
(実施例2)
ユニバーサル抗体ライブラリーのためのCDR多様性を設計する方法
この実施例では、ユニバーサル抗体ライブラリーのCDR多様性を最適化する方法を示す。
【0082】
候補フレームワーク選択は、前述の通り、導入されるCDRのサイズおよび初期アミノ酸配列選択の両方を決定する。選択された6つのV3遺伝子ファミリーすべてが、同じ正準構造1−3を有する。正準構造1−3は、CDR1およびCDR2がそれぞれ、5アミノ酸および17アミノ酸のループを有することを要求する。KabatおよびV BASEデータベースのCDRアミノ酸頻度分析は、1)絶対配列保存、2)第1回の多様性生成、および3)それに続く、体細胞超変異の模倣による親和性成熟のためのCDRアミノ酸の特定を可能にする。重鎖および軽鎖可変領域における各CDRの設計については、以下に配列と共に論じる。
【0083】
重鎖の第1CDR、即ち、以下では「VH−CDR1」を設計するには、上記の判断規準を以下の通りに考慮する。即ち、生殖系列および再編成された遺伝子の両方で保存されているCDR位置は固定する。生殖系列では保存されているが、再編成された遺伝子では可変的なCDR位置は、初期のライブラリー構築では固定するが、親和性成熟中では変異導入を可能にする。そして、生殖系列および再編成配列で多様性を示すCDR位置が、変異誘発、例えばウォークスルー変異導入(WTM(商標))を用いて多様性を導入する位置である。特定された6つのV3遺伝子ファミリー(即ち、3−07、3−21、3−23、3−30.5、3−48、および3−74)から初めて、生殖系列の5アミノ酸CDR1配列の比較V BASE分析によって、これら6つの遺伝子の間でS31、Y32、およびM34が保存されていることが明らかになる(図6、左パネル)。フィルターを通ったKabatデータセットにおける、再編成された5アミノ酸CDR1配列すべての頻度分析(図6、右のパネル)は、3つの重要な発見を明示する。第1に、Y32は高度に保存されている。第2に、生殖系列で保存されている位置S31およびM34は、後の体細胞変異の対象となる。そして、第3に、CDR1位置33および35は、生殖系列でも再編成された抗体配列でも保存されていない。
【0084】
したがって、VH−CDR1では、Y32の厳密な保存は、それを保存するための強い選択圧を示すため、Y32が固定され、いかなる改変も受けない。CDR1位置33および35は、変異誘発、例えばWTM(商標)による初期のCDR1配列多様性を生成させる部位である。位置S31およびM34は、最初は「固定される」が、任意のscFv候補クローンにおける親和性成熟の際に変異導入を行う部位として特定されている。全部位で多様性を生成させない理由は、そのライブラリーの初期多様性を限定して、発現およびディスプレイを促進させることである。
【0085】
上記Kabatの頻度分析から、CDR1は、SYAMHという「野生型」の保存配列を有する。残基A33およびH35は、図6で最も高い頻度であるため、野生型配列として選択される。アミノ酸多様性を導入する際に、CDR1配列はSYXMXであろう。式中、Xは、変異導入、例えばWTMを行う位置を示す。例えば、CDR1位置33および35のチロシン残基で変異導入、例えばWTMを行う場合、その結果得られる望ましいCDR1配列は、SYMH、SYAM、SYである。この場合には、芳香族側鎖を導入することの効果が探索される。A33位置の野生型のオリゴヌクレオチドコドン配列はGCXである。Y33で置換する場合、これに対応する必要なオリゴヌクレオチド配列はTAYであろう。したがって、A33→Y33オリゴヌクレオチド混合物には、その結果のコドン配列は(G/T)(A/C)Cであろう。この場合、生成されたA33→Y33オリゴヌクレオチドは、グリシン(GCC)、アスパラギン酸(GAC)、およびセリン(TCC)をコードするコドン変更も有しうる。これらの追加「副産物」は、位置33に多様性を追加するのに寄与する。次のWTM(商標)位置35に関しては、H35の野生型のコドン配列はCAYであろう。そして、Y35に置換される場合、必要なオリゴヌクレオチド配列はTAYであろう。したがって、H35→Y35混合物には、その結果のコドン配列が(C/T)ACである。この場合、いかなる追加アミノ酸「副産物」も形成されないであろう。
【0086】
別の手法では、ルックスルー変異導入(LTM)を利用することによって、副産物を回避する。これは、通常、所望の変化それぞれについてオリゴヌクレオチドの合成を必要とするが、いかなる副産物(ノイズ)も排除する。
【0087】
重鎖の第2CDR、即ち、以下では「VH−CDR2」を設計するには、V BASEおよびKabatデータベースにおける上記配列分析は、VH−CDR1に関する場合と同様の方法で行われる。VH−CDR2配列の頻度分析を行い、6種の候補フレームワークからの生殖系列CDR2配列のアラインメントを構築し、閾値頻度を10%に選択した(図8)。
【0088】
同じV3遺伝子ファミリー(3−07、3−21、3−23、3−30.5、3−48、および3−74)から開始して、V BASE(図8、左パネル)およびフィルターを通過したKabat(図8、右パネル)の頻度分析は、CDR2位置I51、Y59、A60、およびG65がすべての生殖系列およびほとんどの再編成された遺伝子で保存されており、したがって、合成CDR2で不変でなければならないことを示す。上記のKabat頻度分析は、VH−CDR2が、GISGGTTYYADSVKGという「野生型」のコンセンサス配列を有するであろうことを示す。VH−CDR2位置54、55、58、61、62、63、64は生殖系列で配列保存を示すが、後の体細胞変異の対象となり、したがって、「固定」されるが、親和性成熟の際の変異導入は容認される。最初のCDR2多様性に関しては、試験アミノ酸(下線)を、位置50、52、52a、53、56、および57(XXXGGXXYYADSVKG)に変異誘発、例えばWTM(商標)によって導入する。
【0089】
WTMは、無作為変異導入とは異なり、特定のアミノ酸による所定の置換を可能にする。例えば、位置50、52、53、56、および57(下線)のチロシン(Y)残基でCDR2のWTM(商標)を行うには、その結果の所望のWTM(商標)CDR2配列は、以下の置換、即ち、単一置換(IXXXGGXXYYADSVKG、XIXXGGXXYYADSVKGなど)二重置換(XXGGXXYYADSVKG、IXXGGXXYYADSVKGなど)、三重置換(IXXGGXYYADSVKGなど)、四重置換(YYYGGXXYYADSVKGまたはIXYYGGXYYADSVKG)、五重置換(IXYYGGYYYYADSVKG)、六重置換(YYYGGYYYYADSVKG)を含有する(改変は下線部)。通常、1CDRあたりの2〜3置換が好ましく、これは、オリゴヌクレオチド合成における薬物使用によって容易に実現できる(技術上の詳細に関しては、例えば、米国特許出願公開第20040033569号を参照のこと)。
【0090】
予め選択された9つのWTM(商標)アミノ酸を用いた、CDR2のWTM(商標)によって、9×2即ち576メンバーのライブラリー多様性が生じる。比較のために、全20アミノ酸による6箇所のCDR2飽和変異は、20即ち6.4×10であろう。したがって、CDR2における「非固定」の12箇所で飽和変異を行うのみで、ライブラリーの多様性は、2012即ち4×1015となるであろう。これは、現在のライブラリーのディスプレイ・スクリーニング技術の能力を超えたものである。これは本発明の利点を明示するものである。本発明は、それとは対照的に、それより小型であるが、より代表性の高いライブラリーの構築を可能にする。実際、本発明の方法は、第一世代の結合分子を特定するための、数箇所のCDR位置における操作が容易なライブラリーを提供する。それに続く、他のCDR位置での親和性成熟変異導入によって、特定されたそれらの結合分子を最適化する。
【0091】
CDR3の多様性の設計を行うために、Kabatデータベースから得た抗体CDR3配列のアラインメントを、それらのサイズおよび抗原クラスに従って行った。非タンパク質性抗原(影つけされた棒グラフ)およびタンパク質/ペプチド抗原(中空の棒グラフ)を認識する抗体のCDR3の長さを示し、傾向線に適合させた(前者は実線、後者は点線)(図11)。フィルターを通ったKabatデータセットからの13アミノ酸CDR3配列の頻度分析を行い、10%の閾値頻度を選択した(図11)。CDR3のサイズおよびアミノ酸残基頻度の分析は、例えば、免疫グロブリンDおよびJ遺伝子の再編成された配列を用いて行われるので、直接フィルター処理されたKabatおよびV BASE比較に相当するいかなるCDR3生殖系列等価物も存在しない。それにもかかわらず、フィルター処理されたKabatデータベースを検査したところ、検索結果は、CDR3ループサイズに関して、約13〜16アミノ酸に頂点を有する6〜24アミノ酸の範囲の正規分布曲線が存在することを示した(図10)。
【0092】
CDR3位置に関するVBASE対Kabatの平行比較分析を行わずに、再編成されたCDR3の各サイズについてフィルター処理されたKabatの頻度分析を行った(図11)。各サイズ内で、そのCDR3位置で最も高頻度なアミノ酸を計測する分類によって、コンセンサス「野生型」配列が得られる。驚いたことに、この「コンセンサス」手法は、高選択圧下にある特定のアミノ酸を特定する。例えば、サイズが13アミノ酸のCDR3では、位置101でアスパラギン酸が高度に保存されていた(図11)。したがって、上記の通り、VH−CDR1およびVH−CDR2の多様性を設計する際に、D101が合成13アミノ酸VH−CDR3の「固定」された残基位置として維持される。しかし、VH−CDR3位置96、98、100c、および102は、一部のアミノ酸を好む傾向が高く、したがって、予備的に「固定」されるが、後に親和性成熟の際に変異導入される。頻度分布は、CDR3位置95、97、99、100、100a、100b、100d、および100eがいかなるアミノ酸への傾向も示さなかったことを示す。したがって、13アミノ酸のCDR3配列では、式、XXXXYXXDYが、例えばWTMなどの変異誘発などを用いた多様性の部位である位置(下線)を表す。サイズが8〜20アミノ酸の間にあるすべてのCDR3配列に関して、同様の分析を行うことができる。図10は、このサイズ範囲が、タンパク質性標的/抗原を認識する抗体のCDR3で見出される鎖長多様性の大部分を包含することを図示する。
【0093】
(実施例3)
バイオインフォマティクスを用いた、抗体CDRの位置可変性プロファイル(VP)を作成する方法
別の手法では、in vivoで発現されているCDRの位置可変性プロファイル(VP)を決定することによって、ユニバーサル抗体ライブラリー(UAL)を設計した。位置可変性プロファイルは、自然に発現される抗体のアラインメントされた配列のデータセットにおける特定の位置に存在する様々なアミノ酸およびそれらそれぞれの出現率のカタログ登録を表す。
【0094】
したがって、VPの決定は2ステップを伴い、例えば、ステップ1)は、データセットを生成するための、対象の1つまたは複数の特定の特性を共有するアラインメントされたアミノ酸配列(のデータセット)の収集および選択である。VまたはV由来の別々にアラインメントされたCDR1、CDR2、およびCDR3配列が、通常の目的の初期データセットを形成する。対応するVP結果を伴うCDRデータセットを得るための方法が幾つか利用可能である。通常、ステップ(2)を実施するためには、アミノ酸可変性およびアラインメントされた各位置におけるそれらの相対頻度に関する(CDR)データセットを列挙する(図43)。次に、各CDRデータセットのVPは、多様性の現出を更に導入するために、所与のCDR位置の望ましい特徴を特定する。
【0095】
ステップ1を実施するには、アラインメントされた配列のデータベースを組み立てる。対象である特定の1つまたは複数の特徴を共有する配列を選択する。例えば、タンパク質は、特定可能なモチーフ、ドメインを有し、かつ/または進化的に近縁なファミリーメンバーであって、それによって、それらの間で全体または部分配列アラインメントを可能にする可能性がある。開始入力データセットは、内因的に発現された成熟抗体のKabatデータベースなど、予め特徴付けされ、分類された配列の以前の収録から取得できる。
【0096】
Kabatデータベースから、ヒト免疫グロブリン、特にVH配列を開始基礎データセット用に選択的に収集した。通常、再編成されたヒトVH配列それぞれのルート生殖系列出自を比較分析によって決定する。対応する生殖系列の基礎を、「起因サブファミリー」と呼ぶ(図41のステップ1)。この開始「基礎データセット」内の接触画定に記載のパラメータを用いたVH配列の追加CDRを特定および描写できる。CDRおよびそれらが含むアミノ酸の指定は、Kabat、Chothia、または他のいかなる適当な画定によって記載することもできる(図41のステップ2)。
【0097】
開始ヒトVH配列「基礎データセット」内で、収録されたVH配列は、依然として大きく異なった特徴を有する可能性が高い。VHフレームワーク配列は、中でも、1−ファミリー分割(VH1、VH2、VH3、VH4など)、2−「起因するサブファミリー」、3−CDRの長さ、4−CDR正準構造、5−抗原特異性の点において異なるであろう。「基礎データセット」メンバー間の配列多様性により、一貫した分析を得るには、選出された対象の特性の1つまたは複数を共有するデータセットを特定できるように開始「基礎データセット」からのさらなる選択が必要でありうる。それらそれぞれの特性を共有する構成員は、サブセット内で意味のある比較分析を行うための、より「標準化された」セットの配列を産生することができる。この過程を反復して、その結果より高程度に相関し、かつより小さなデータセットを産生することができる。図43にそのようなものを例示する。
【0098】
CDRは以下の通りに分類することができる。全ヒトVH配列の重複していない「基礎データセット」から開始して、VH1配列を生成する配列のみを更に選択した(図43)。非重複性フィルターは、同じ抗原に対して重複して登録された抗体配列を排除する。同じ抗原に対して産生された異なった抗体が存在する場合、これらの配列はデータベースに保持される。VH1サブセット内では、CDR1およびCDR2配列を特定し、更に、CDR1またはCDR2サブセットに分割する。VHファミリー内でのCDR分割では、CDR1またはCDR2サブセットは、依然として異なった長さのCDRと共に分類されている可能性があることに留意するべきである。VH1 CDR2は、長さが13アミノ酸のものおよび15アミノ酸のもの両方が存在する。CDR1およびCDR2には、長さ6アミノ酸および13アミノ酸がそれぞれ選択され、生成したデータセットをそれぞれVH−1_CDR1_6およびVH−1_CDR2_13と命名する(図43)。
【0099】
正準構造は以下の通りに分類する。VH1 CDR2配列内で、正準構造2(CS2)であるか、あるいは正準構造(CS3)であるものの間での分別を更に行う別のサブセット分割を行う。正準構造は、主要残基におけるシグネチャー残基を識別することによって画定できる。アミノ酸残基および位置は、CDRのどの画定が利用されるかによる。この実施例では、アミノ酸位置71にV、A、L、またはTを導入したVH1 CDR2配列を正準構造2と表示し、一方、同じアミノ酸位置のRは、正準構造3を表す。これらの操作は、それぞれ、VH−1_CDR2_13_CS2およびVH−1CDR2_13_CS3と命名されたデータセットを生成した(図43)。
【0100】
VH−1_CDR2_13_CS2およびVH−1_CDR2_13_CS3(図49)に細分することによって、それらと、更に多くのVH1_CDR2_13の全般的集合体(図48)とのわずかに異なった可変性プロファイルが明らかとなる。例えば、VH−1_CDR2_13_CS2では、「A」は位置52aのより好ましいアミノ酸の1つでない。VH−1_CDR2_13_CS3では、位置51に「M」が好んで導入されることが判明しているが、VH−1_CDR2_13_CS2およびVH−1_CDR2_13ではそうではない。VH−1_CDR2_13_CS2とVH−1_CDR2_13_CS3との間での、より劇的な例としては、前者において、AおよびTの双方が位置57でほぼ等しく好まれることである。
【0101】
VH1 CDR1は、6残基のアミノ酸を要する正準クラス1(CS1)を有し、サブセットVH−1_CDR1_6を生成する(図44)。この場合、CDR1 CS1を識別する主要アミノ酸シグネチャーには、例えば、位置24のT、A、V、G、またはS、アミノ酸位置26のG、および位置29のI、F、L、V、またはSが含まれる。したがって、一部の6アミノ酸CDR変種が必要なシグネチャー配列を有しないという点でCS1に属さない配列をVH−1_CDR1_6データセットが含有することも可能である。ユニバーサル抗体ライブラリーの主目的は、CDR正準構造を有するフレームワーク配列と、その中のそれらの可変配列とを最もよく一致させ、それによって最も安定的かつ機能的な配置を得ることである。したがって、これらの非CS1配列は、自然にはCS1の安定性および機能性に最適化されていないアミノ酸を導入して、データセットの配列における「ノイズ」に寄与しうる。したがって、CS1シグネチャーに一致した配列のみを分割して、データセットVH−1_CDR1_6_CS1(図45)を作成して、さらなる精密化を行うことができる。
【0102】
交差CDR対合を以下の通りに行った。上記のサブセットは、VH生殖系列サブファミリー、CDR長、および正準構造に関してフィルターおよび標準化された配列集合体の例である。CDR構造の直接的制約以外にも、in vivoでの内因性CDR配列に直接的に影響を与えうる他のパラメータが存在する。実際、CDR正準構造がその内部のCDR配列に影響を与えることのできる現象を実証することができる。1つのCDR正準構造を有することによって、正準構造および別のCDRの配列の両方に影響を与えられることができる可能性がある。このCDR相互依存性を明らかにするために、CDR正準構造間の対合に基づいてサブセット分割する際にCDR配列分析を行った。例えば、CDRサブセットを収集し、それによって、CDR1(この場合CS1のみ)を、それらから構成されている元の抗体配列におけるCDR2 CS2またはCS3のいずれかに群別した。
【0103】
この原理に従って、VH−1CDR1_6_CS1を、VH−1_CDR1_6_CS1−2(図46)およびVH−1_CDR1_6_CS1−3(図47)に分割した。これらはそれぞれ、CDR2−CS2およびCDR2−CS3とのCDR1−CS1の「対合」を表す。全般的に、可変性プロファイルは、VH−1_CDR1_6の全集合体と類似しているが、特定のCDR位置では個々のCS優先性がある。VH−1_CDR1_6_CS1−2(図46)の位置31では、VH−1_CDR1_6_CS1またはVH−1_CDR1_6_CS1−3のいずれかと比較して、「G」および「D」は可変性プロファイルに現れないだろう。VH−1_CDR1_6_CS1−2とVH−1_CDR1_6_CS1−3との間では、位置33も外部に何らかの可変性を示す。VH−1_CDR1_6_CS1−2対合では、「A」が、優勢に現れるアミノ酸であり、「G」、「T」および「W」が独特に関連している。一方、VH−1_CDR1_6_CS1−3対合では、優性なアミノ酸が「Y」であり、その変種として好まれているアミノ酸が「D」である。分析されていないが、VH−1_CDR2にも、それらの内因性CDR1配列に選択的に対合できる、「U」を有する長さ15アミノ酸の正準構造が存在する。結果として得られるVH−1_CDR1_6_CS1−U可変性プロファイルは、上記のVH−1_CDR1_6_CS1−3およびCS1−2可変性プロファイルとは異なっている可能性があると予測される。
【0104】
逆に、CDR1正準構造1との関連におけるCDR2配列間の相互依存性を、同様に分析した。図50は、VH−1_CDR2_13_CS2−1およびVH−1_CDR2_13_CS3−1の可変性プロファイルを図示する。もっともこの場合、CDR2可変性プロファイルはほぼ同一であった。これは、この点において、CDR2設計がCDR1から独立して機能できることを実証している。しかし、VH4ファミリーなどの他のフレームワークに関しては、VH4 CDR2は、CDR2の長さが12アミノ酸の正準構造(CS−1)1つだけ有している。3つの正準構造CS−1、CS−2、およびCS−3と関与するのは、VH4 CDR1である。この場合、結果として生じるVH−4_CDR2_12_CS1−1、VH−4_CDR2_12_CS1−2、およびVH−4_CDR2_12_CS1−1可変性プロファイルから、CDR位置における独特のアミノ酸優先性が予期される。
【0105】
上記のこれらの結果は、アクセプターとして使用されるのに選択されたCDR1およびCDR2両方の正準構造、ならびに、様々なCDRアミノ酸位置にどのアミノ酸が導入されているかに応じて、採用された天然の多様性を模写するために、例えば、交差CDR安定化が存在する場合に、他の配列と見出される可能性が最も高い配列を一致させることによって、アミノ酸を「微調整」することができる。
【0106】
CDR抗原の分類は以下の通りに行った。構造分類に基づいた群別が行われたならば、抗原特異性に基づいて収集されたメンバーを分類することができる(図43)。所与の抗原クラスに関して、CDR内で好まれているアミノ酸の相関関係が存在しうる。そして、これは、特定のフレームワークの抗原クラス優先性に関して観測された。したがって、CDR配列の分割に、追加のパラメータとして抗原特異性を追加することが可能である。
【0107】
CDR配列集合体の拡張は以下の通り行った。上記の分析は、対象のサブセットを生成するための、複数のパラメータのスクリーニングの組合せの追加を示した。これには、選択されたCDR配列の可変性プロファイルを「狭くする」効果がある。しかし、この逆を行う、即ち、均質性または共有された特性の度合いがより低いより大きなデータセットを得る機会が存在しうる。事実上、これは異なったデータセットを結合することによって、実現される(図43)。この例では、CDR2が、いかなるVHファミリーに起因するかに関わらず、正準構造2(CDR2_13_CS2)を有する長さ12のCDR2すべての可変性プロファイルを列挙する。これによって、CDR2_13_CS2の多様性に寄与するすべてのアミノ酸のより広範な調査が効果的に得られる。
【0108】
CDR1およびCDR2サブセットデータセットに選択する選択的過程を図43に記載する。発明者らの方法の重要な利点は、多くの異なった「選択」経路が可能であり、それらのそれぞれが、異なったデータセット、したがって、異なった可変性プロファイル(VP)を生成することである。
【0109】
これは、下記の図に例示されており、図中、CDR1の可変性プロファイルが、VH1、VH3、およびVH4の間で比較される。ある程度類似しているが、1つの重要な相違が位置34に存在する。CDR設計用に、VH1では、「I」を固定することができ、VH3では、「M」を固定することができ、VH4では、「W」を固定することができる。別の相違は、50%から80%の頻度要件の使用の下に関連するだろう。VH4に関しては、位置35に最も高頻度で見出される2つのアミノ酸が「S」および「H」である。集合的に、これらの2つのアミノ酸の集積頻度は80%を超えるであろう。したがって、位置35は、「固定された」位置として特徴付けでき、強制同時産物として「S」および「H」の両方をその位置に導入することができる。対照的に、VH1およびVH3の両方に関して、位置35で最も高頻度で見出される2つのアミノ酸は、それらの出現頻度が併せても80%を超えず、「可変的」な位置として特徴付けられ、その位置への変異導入(例えばWTM)が行われるであろう。
【0110】
(実施例4)
ユニバーサル抗体ライブラリーを遺伝子操作する方法
この実施例では、遺伝子工学技法を用いてユニバーサル抗体ライブラリーを作製し、組み立てるステップを記述する。
【0111】
簡潔には、抗体のVおよびV断片は、標準的な分子生物学技術を用いてクローニングする。可変領域のフレームワークおよびCDRをコードするオリゴヌクレオチドをポリメラーゼ連鎖反応(PCR)によって組み立てる。次に、これらのVおよびV断片をポリ−Gly−Serリンカー(通常GGGGSGGGGSGGGGS)を用いて連結し、1本鎖抗体(scFv)を生成させる。その後、発現提示ベクターへのクローニングを容易にする制限部位を含有している、5’および3’隣接プライマーを用いて完全長分子を増幅する。生成されたライブラリーの全体的多様性は、フレームワーク配列の数と、例えばWTMを用いた変異導入に選択されたCDRの位置の数に依存する。
【0112】
WTM(商標)の実施に9アミノ酸を用いた場合、Vライブラリーの平均した多様性は、通常、3.5x10(6フレームワークx9アミノ酸x(CDR1用に2xCDR2用に2x13アミノ酸のCDR3用に2))である。Vライブラリーの多様性は上限にあり、VλおよびVκライブラリーの多様性は有意に小さい。したがって、完全なscFvライブラリーの併せた多様性は、1010から1011に限定され、これは、細菌システムの形質転換効率の範囲内にある。
【0113】
したがって、リンカー領域をコードする2つのオリゴヌクレオチド、ならびにそれぞれN末端およびC末端のHisおよびMyc免疫タグをコードする2つのオリゴヌクレオチドに加えて、V、Vλ、Vκライブラリーのフレームワークを包含させるために90のオリゴヌクレオチドを合成する。加えて、3種のライブラリーのCDR1、2、および3のそれぞれにおいて多様性を表す縮重オリゴヌクレオチド30〜60種のサブセットを合成する(合計90〜180)。これらのオリゴヌクレオチドを、単一重複伸長(SOE)PCR法で組み立て、必要なV−VλおよびV−Vκの組合せを含んだライブラリーを生成させる。その後、配列検定およびライブラリー品質の評価用に、各ライブラリーからランダムクローンを選択する。
【0114】
CDRの多様性に関しては、LTMを用いて、抗体CDRループ内での小さな摂動(例えば1ループあたり1つの変化)を探索する。一層の改良には、それに続いてWTMを用いて、CDRの化学景観を徹底的にスクリーニングする。WTMは、1つのCDR内への複数の置換の取込みを可能にする。WTMを用いて、野生型アミノ酸および所望のアミノ酸変種を、オリゴヌクレオチド合成を操作することによって、標的のCDR位置で探索する。オリゴヌクレオチドのサブセットが野生型をコードし、別のサブセットが特定の位置における標的変異をコードする、オリゴヌクレオチドの混合プールを合成する。このWTM手順では、合成の各ステップで、成長中のオリゴヌクレオチド鎖が、2塩基のうちの1塩基によって伸長する。ある塩基は野生型コドンをコードし、もう一方の塩基は、所望の変異のコドンに属する。
【0115】
(実施例5)
ユニバーサル抗体ライブラリーの発現および提示方法
この実施例では、標的に対してスクリーニングするためのユニバーサル抗体ライブラリーを発現および提示する方法を記述する。
【0116】
簡潔には、ライブラリーからscFv分子を発現するための信頼性が実証されている細菌発現系およびディスプレイ系を使用する。このscFvフォーマットは、リンカーペプチドによって結合される機能的抗原結合ユニット(VおよびV領域)からなる(図14)。本発明のそのようなライブラリーは、天然レパートリーの多様性を増大させ、構築されたならば、他の抗原に関して繰り返しスクリーニングすることができる。
【0117】
scFvライブラリーは、標準的な技法を用いて、受容細菌宿主に形質移入する。発現された融合scFvタンパク質は、蛍光標識された抗原の結合を可能にする外表面位置に発現される。候補タンパク質は、FITCで個々に標識する(直接的、またはビオチン−ストレプトアビジン連結を介して間接的に)。その後、標識抗原に効率的に結合する適当なscFvクローンを発現するライブラリーのこれらのメンバーをFACSを用いて濃縮する。その後、この細胞集団を再度増殖させ、より高い特異性および親和性で標的を認識するクローンの更に小さなサブセットを単離するために、増強されたストリンジェンシーレベルを用いて、後の選択操作を行う。これらのライブラリーは、迅速な特定および確認のために、例えばFITC標識された抗Mycタグ抗体およびFACS分析を用いて容易にハイスループットフォーマットに適合させることができる。
【0118】
その後、候補クローンを単離し、scFvの配列情報を得るためにプラスミド調製を行う。この手法は、抗体のVおよびV領域における相補性決定領域(CDR)のアミノ酸機能性を決定および最適化するのに必要な仮説主導の合理的コドン置換を可能にする。その後、比較配列解析および個々のクローンの親和性/特異性プロファイルによって、どのクローンで親和性成熟(実施例6を参照)を行うか決定する。
【0119】
(実施例6)
ユニバーサル抗体ライブラリーから得た候補のハイスループット親和性成熟を行う方法
この実施例では、ユニバーサル抗体ライブラリーから候補抗体を特定して、親和性成熟を用いてそれを改善するステップを記載する。
【0120】
簡潔には、候補抗体分子を取得し、その分子の結合特性を向上させる、ユニバーサル抗体ライブラリーの力および能力を評価するために、市販の抗体を試験抗体として指定し、本発明の方法に従って、変異導入(例えばWTM(商標)/LTMTM(商標)技法を用いる)、発現、提示、および改善した。
【0121】
簡潔には、試験抗体をscFvフォーマットで変異導入し、その後、酵母ディスプレイを用いて、発現および提示を行った。但し、上述した細菌ディスプレイ系ならばいずれも使用することができる。酵母にディスプレイされたscFvライブラリーの速度論的選択では、ビオチン化抗原によって細胞の初期標識を行い、大過剰の非ビオチン化抗原の存在下で経時的追跡を行う。追跡期間の後に、SA−PE標識によって、解離速度が遅いクローンを特定し、高速FACS分取器を用いて分別する。図29の左パネルは、野生型対照および分別ゲートのその結果生じたドットプロットと、分別ゲートにおけるライブラリーおよびクローン数を示すドットプロットと、分別後のライブラリーから単離されたクローンのドットプロットとを示す。図29の右パネルでは、親和性成熟した2つのクローンの解離アッセイのデータを、野生型タンパク質と比較して、単一指数曲線に適合させて、解離速度定数(koff)を決定した。クローン1および2は、親分子より5.2倍および4.3倍遅いkoff速度を示す。
【0122】
無作為に選択されたクローンのDNA配列検定によって、ライブラリーが、所望の変異多様性、意図されていない点変異、欠失、および挿入に関して高品質のものであることが示された。この効率は、様々な塩基の制御されていない導入によって、高レベルの望ましくない塩基変化の影響があり、好ましくないアミノ酸の使用および意図されていない終止コドンによる発現または抗体機能の低下を導くランダム/確率論的な変異誘発戦略とは対照的である。
【0123】
更に、表にされた、試験抗体のLTM分析からの配列データは、ノイズが非常に小さい生産的多様性を示している。図29の底部パネルは、野生型配列と、6つのCDRすべてで見出された、親分子の親和性を1.5倍以上増強させる29の別々な変異とを示す。これらの変化のうち幾つかは、複数回単離された。例えば、CDR3では、3つの別々な、SからKへの変化と、2つの、SからQへの変化が見出されている。対照的に、影付きの棒グラフは、その変化によって抗原親和性の増強が全く見出されなかったCDR位置を示す。次に、発見されたすべてのLTM単一突然変異の組合せを1ライブラリーに導入することによって、これらの高親和性変異中で結合活性が向上しているクローンの単離を容易にする。
【0124】
(実施例7)
ヒト疾患を治療するための治療薬抗体候補を特定するためにユニバーサル抗体ライブラリーをスクリーニングする方法
この実施例では、治療薬候補を特定するために、本発明のユニバーサル抗体ライブラリーをスクリーニングする方法を記述する。
【0125】
簡潔には、以前の治療に対して不応性であった慢性かつ破壊的な腎疾患を、本発明のユニバーサル抗体ライブラリーに対するスクリーニングの標的として選択した。詳細には、慢性腎疾患(CKD)は、2000万人を超える個体が患っており、米国における公的保健医療の主要問題として認識されている。腎形成過程を理解する際の主要な障害は、1)関与している様々な細胞型、および2)これらの細胞で分化に影響を与える関与分子を特定する腎特異的なバイオマーカーを認識する適当な試薬が存在しないことである。これらの腎マーカーを認識する抗体は、腎臓器官形成および疾患診断を調査するのに必要な現在の試薬類プールを著しく増大させると思われる。
【0126】
腎の生物学を理解するために、6つの腎臓特異的ヒト治療薬抗体候補、即ち、1)Na−Hイオン交換体(アイソフォームNHE3、NHE8)(14、15)、陰イオン交換体(アイソフォームSLC26A6、SLC27A7)、接着性分子Ksp−カドヘリン(16)およびリポカリンを、ユニバーサル抗体ライブラリーに対するスクリーニング用に特定した。
【0127】
血液学者は、長期にわたって「分化クラスター」(CD)細胞表面マーカーを認識するモノクローナル抗体(Mab)試薬の利益を享受してきた。造血作用は、リンパ球様および骨髄系統を生成する過程であり、モデル発生システムとしての多数の利点をしばしば示している。その成功の理由の多くは、造血細胞がMabによって容易に特定、単離、および操作できることにある。
【0128】
上記スクリーニングで特定された治療薬候補をアッセイするには、診断用疾患バイオマーカー、例えば、初期急性腎不全(ARF)を検出するバイオマーカーである好中球関連ゼラチナーゼ関連リポカリン(NGAL)を用いることができる。加えて、治療処置の疾患標的、例えば糸球体腎炎を、α3(IV)コラーゲンタンパク質でモニターすることができる。ストレプトアビジン−フィコエリトリン(SA−PE)を用いた、FACSによる可視化を容易にする既存のプロトコールを用いて、これらのタンパク質をビオチン化し、その後、ユニバーサル抗体ライブラリーから、第1回の抗原結合剤質を特定するために、3〜5回の選択を行う。その後、最初の治療薬抗体候補の配列決定を行い、BIAcoreアッセイを用いて、精製された可溶性タンパク質に対する親和性を試験する。その後、望ましい場合には、実施例6に記載の通り、治療薬抗体候補の親和性成熟を行う。
【0129】
その後、抗原標的を認識する際のそれらの機能性を決定するために、免疫組織化学、免疫ブロットバイオマーカー診断、ならびに、in vitroおよびin vivoの抗体ブロッキング実験など、当技術分野で認知されている技法を用いて実験室的実験を行う。
【0130】
(実施例8)
遺伝子配列のフィルターおよびクラスター分析を用いたユニバーサル抗体ライブラリー配列のバイオインフォマティクス主導的特定法
この実施例では、データベース分析を用いて、ユニバーサル抗体ライブラリー配列を特定する方法を記述する。
【0131】
簡潔には、最適な構造的かつ機能的多様性を有するユニバーサル抗体ライブラリーを設計する目的で、データの主要源として、VBASEおよびKABATを選択した。VBASEは、Chothiaに基づいた(Chothiaら)付番方式を有し、KabatのCDR画定(Kabatら)に従ってアラインメントおよびアノテーションされた全ヒト生殖系列セグメントのDNAおよびポリペプチド配列を含有するデータベースである。KABATは、異種の再編成された抗体配列の最も包括的なデータベースである。軽鎖および重鎖の両方におけるすべてのCDRに多様性を導入することによって抗体親和性を改善するために、Kabat(Kabatら)およびChothia(Chothiaら)が主導する手法に対する代替方式として、CDRの接触画定方式(MacCallumら)を選択した。接触画定手法は、有意な構造的多様性の導入を可能にし、抗体の構造安定性に影響を与えずに結合を改善する。しかし、Chothia付番法は、接触画定手法と共に用いるのに最適な方式なので使用する。図30に、最もよく使用されているこれら3つのCDR画定の比較を示す。発明者らの選択に従って、フレームワークのアミノ酸に番号付けした。
【0132】
【表1】

【0133】
ダウンロードしたすべての生殖系列Vセグメント(51VH、40VK、および31VL)についてVBASE分析を行い、上記の画定に従って解析し、例えば、図31に示すFR1−CDR1−FR2−CDR2−FR3と記載されるフォーマットで3つの異なったファイルに局所保存をした。ここで、FRはフレームワーク領域を指す。
【0134】
これらのデータセットから、各FRまたはCDRの個々のデータを抽出することができる。詳細には、配列は、FR1xFR2xFR3(FR123と呼ばれる)として構築した。ここで、「x」は、CDR1および2のためのプレースホルダとして使用される。この結果生じるデータセットは、FASTAなど、好都合で小型な形態で保存される(図32)。
【0135】
3つの生殖系列ファミリーのそれぞれについて、フレームワーク空間におけるそれらの相関を分析するため、距離マトリックスを作成するのにFR123の配列を用いた。同一な配列はすべて一括し、類似性が高いすべての配列は共にクラスタリングした。各クラスターは、類似した構造特性を表す。FR123配列の階層クラスタリングおよび対応する系統樹は、PHYLIPパッケージ[PHYL]にあるUPGMA法を用いて計算した。最初に、距離マトリックスを、PROTDIST[PHYL]および簡単なKimura式を用いて計算した。その後、UPMGAアルゴリズムを用いて、NEIGHBOR[PYHL]を実施した(添付の図を参照)。
【0136】
Kabatデータベース[KBTDB]から、ヒトVH、VK、およびVL配列の完全なデータセット(表2を参照)を、SeqhuntII[Johnsonら]を用いて、ASCIIフォーマットでダウンロードし、3種のファイル(生データ)に局所保存をした。その後、これらのファイルを解析し、各kabat記載事項を、局所DBMSに保存した。上記のデータセットを解析および分析するべきクラスを含有するjavaパッケージ(com.bioreninc.kabatDB)が開発されている。また、パッケージは、特定の領域の単離および分析を可能にする、入力配列の様々な集合を改変および記録する多数の方法も提供する。パッケージ設計は柔軟であり、付番方式および/またはCDR画定相互の容易な切り替えを可能にするものである。CDR1およびCDR2の正準クラスを特定する方法を実施した。
【0137】
【表2】

【0138】
Kabat分析フィルターは、javaパッケージ(com.bioreninc.unilib)および幾つかの外部ツール(PROTEIN SPECIFICITY(com.bioreninc.unilib))を用いた幾つかの逐次ステップで、元のデータセットのフィルターが行えるように構成されていた。保存されている、タンパク質抗原のみを認識する再編成された免疫グロブリン配列のサブセットを分析するために、適切なフィルター(以後PAフィルターと呼ぶ)を選択した。KabatDBに保存されている、抗原アノテーションがない配列は除外した(表3)。
【0139】
【表3】

【0140】
【表4】

【0141】
データベースの重複によって引き起こされる偏りを避けるために、CD−HITおよびjavaツール(結果を再確認するため)を用いて、一部の配列のフィルターを行った。このアルゴリズムは、選択された閾値(95%)を超えた同一性を有する配列クラスターを作成し、その後、各クラスターから代表的な配列を選択することに基づいている。類似性検索は、完全長配列(即ち、FR1−CDR1−FR2−CDR2−FR3−CDR3−FR4)で行った。
【0142】
大部分のライブラリー設計は、フレームワーク領域1、2、および3の微調整された分析に依存しているので、誤分類および/または間違った仮定を避けるために、完全配列データを得ることが非常に重要であった(表5)。
【0143】
【表5】

【0144】
ライブラリーの設計は、連動した2つのサブプロジェクト、即ちフレームワークおよびCDRに分割された。ヒトレパートリーから選択されたフレームワークは、再編成された免疫グロブリン配列におけるそれらの使用を代表する生殖系列フレームワークセグメント1、2、および3であった。このために、フィルターを通ったデータセットを、最初に解析し、FR123フォーマットに書き直した。フレームワーク選択の全過程を通して、この特定のフォーマットを使用し、最も一般的なファミリーが特定されるように、生殖系列フレームワークの使用が、入力データセットにどのように分布しているかを決定した。このために、再編成されたデータセットの各配列について分類を行い、各Kabat−FR123データセットに関して、関連VBASE−FR123に対するBLASTP[BLST]を用いた類似性分析を行い、解析した。最も高い類似性スコアを示すヒットを明らかにする結果を選択した。各ファミリークラスターの基数を比較し、最も一般的なものを、フレームワーク選択の標的として選択した。
【0145】
【表6】

【0146】
【表7】

【0147】
FR123−Kabatデータセットから生じたクラスターを可視化するために、PHYLIPパッケージ[PHYL]を用いた(図36、37、および38を参照)。系統樹は、距離法(UPMGA)を用いて得た。距離マトリックスは、Kimuraの式を用いて計算した。その結果得られた系統樹の配置は、それ以前のBLAST分析と一致した。
【0148】
対象の生殖系列ファミリーを選択した後で、使用頻度の高いフレームワークセグメントおよびそれらの相対的正準構造の調査によって、分析の微調整を行った。それぞれのVBASEデータセットは、選択された関連のKabatデータセットに対してBLAST分析し、高い類似性を有する配列のみを産生するその出力データを解析した。その後、各VBASEフレームワークセグメントを、計算された高類似性ヒットの数に従って順位をつけた。最後に、最も好ましいVBASEクラスター(選択されたファミリー内で)については、クラスターを構成する最高順位の配列から代表を選択した。所望に応じて、選択されたクラスターの中で最も代表的なセグメント(即ち、クラスター内における他のすべてのセグメントから最短距離にあるセグメント;表8を参照)を用いるために、最も順位が高い配列を除外することもができる。
【0149】
【表8】

【0150】
(実施例9)
CDR分析を使用したユニバーサル抗体ライブラリーのためのCDR多様性を設計するための方法
この実施例では、ユニバーサル抗体ライブラリーのためのCDRを設計するための方法を記載する。
【0151】
手短に言えば、選択されたフレームワーク(上記)を使用して、CDRの選択および設計が導かれる。即ち、CDRの長さおよび配列の両方を、完全な適合性および最適の多様性が得られるように、選択された各フレームワークファミリーに特異的に設計した。選択された生殖系列フレームワーク(VH−1、VH−3、VK−Iなど)の正準構造に従ってCDR1およびCDR2の長さを選択する。この基準から開始して、完全な分析を実行して、続いてCDR1およびCDR2を設計した。オリジナルKabatデータセットを、フレームワーク1、2および3の完全性および重複性(95%類似性閾値)についてのみフィルターした(表9参照)。フレームワーク−CDR適合性には、特異性フィルターを使用しなかった。
【0152】
【表9】

【0153】
各鎖クラス(VH、VK、VL)について、入力配列を、選択された生殖系列ファミリーに従って分類し、異なるデータセットにビニングした(表9参照)。BLASTソフトウェア[BLST]を使用し、上記のようにその結果を構文解析して、このような結果が得られた。
【0154】
選択された各サブファミリー内で、CDR1およびCDR2の両方の長さ分布を正準構造の分類に従って分析する。この分析についてのさらなる詳細は、採用された設計戦略と一緒に以下の項で検討する。この結果の概要を表10で表す。
【0155】
【表10】

【0156】
CDR1およびCDR2長さを以下の通り決定した。VH生殖系列ファミリーは、6および8のCDR1長さを有し、後者は、使用しないVH−2中にしか存在しない。CDR2長さは12から15まで様々であり、13が最も一般的であり、選択されたフレームワークに必要なものである。
【0157】
生殖系列VH−1は常に、6アミノ酸のCDR1および13アミノ酸のCDR2を有する(正準構造1−3、1−2)。再編成されたデータセットでは、VH−1と特定された配列の約97%がこれらの長さのCDRを有していた。典型的なフレームワーク基準は、1−e CDR1長さ:6、CDR2長さ:13であり、期待されたクラス適用範囲は>97%である。
【0158】
生殖系列VH−3は常に、6アミノ酸のCDR1ならびに13および15アミノ酸CDR2を有する。選択されたフレームワークは、それぞれ6および13のCDR長さを有し、したがって長さ15はCDR2に使用されなかった。ここでデータから、再編成された配列の99%で、CDR1は期待通り長さ6を有し、81%でCDR2は長さ13を有することが示された。CDR2の残りの使用空間は、長さ15を有する正準構造1−Uおよび1−4によって包含される可能性が最も高い(特に、3〜15には、使用されることが多いものがある)。典型的なフレームワーク基準は、3−07、3−11、3−23、3−30 CDR1長さ:6、CDR2長さ:13であり、期待されたクラス適用範囲は約81%である。VK生殖系列ファミリーのCDR1は、7から13まで様々な多数のアミノ酸を有し、最も多いのは7および8アミノ酸である。CDR2は常に10アミノ酸を有する。
【0159】
生殖系列VK−Iは常に、7アミノ酸のCDR1および10アミノ酸のCDR2を有する。再編成された配列における使用は、生殖系列情報との完全一致が示す。典型的なフレームワーク基準は、I−L1 CDR1長さ:7、CDR2長さ:10であり、期待されたクラス適用範囲は97%超である。
【0160】
生殖系列VK−IIIは、7および8アミノ酸のCDR1を有し、常に10アミノ酸のCDR2を有する。ここでデータから、配列の50%がCDR1長さ7、約48%が長さ8を有することが示される。2つの異なる極めて一般的な正準構造が存在するので、このような結果が得られた。CDR2長さは配列の98%超で10である。選択されたフレームワーク内で、CDR1の長さは、期待された適用範囲がサブファミリーに関する使用空間の98%であるように提供される。典型的なフレームワーク基準は、III−A27、III−L6 CDR1長さ:7および8、CDR2長さ:10であり、期待されたクラス適用範囲は98%超である。
【0161】
VL生殖系列ファミリーCDR1は、7から10までの様々な多数のアミノ酸を有し、ここで、8は一般的でなく、したがって選択的に除外される。長さ7、9および10はすべて、ファミリーにおいて非常に頻度が高い。
【0162】
生殖系列VL−1は、9および10アミノ酸のCDR1および10アミノ酸のCDR2を有する。再編成された配列に関するデータから、約74%が長さ9のCDR1を有し、その約99%が長さ10のCDR2を有することが示される。CDR1の長さ10は、より十分に適合させるために除外され、典型的な選択されたフレームワークは1b CDR1長さ:9、CDR2長さ:10であり、期待されたクラス適用範囲は約75%であった。
【0163】
生殖系列VBASE:VL−2は、10アミノ酸のCDR1およびCDR2を有する。典型的なフレームワーク基準は、2a2 CDR1長さ:10、CDR2長さ:10であり、期待されたクラス適用範囲は約95%である。
【0164】
生殖系列VL−3は常に、9アミノ酸のCDR1および10アミノ酸のCDR2を有する。このサブファミリーをVLで最も使用するので、このサブファミリーから選択された2つのフレームワークを選んで、より構造的な適用範囲が得られた。典型的なフレームワーク基準は、3r,31 CDR1長さ:9、CDR2長さ:10であり、期待されたクラス適用範囲は約99%である。
【0165】
【表11】

【0166】
15の選択されたCDRのそれぞれについて(表11)、別々に頻度分析を実行して、選択されたフレームワークとの関連からアミノ酸の使用位置を決定する。主要な目的は、CDR1およびCDR2内のそれぞれの中での各位置を2つの異なる範疇、即ち1つまたは2つの優勢なアミノ酸を示す固定位置と、初期構造多様性、つまり変異誘発の位置とに分類することであった。
【0167】
EMBOSS/prophecy[EMB]を使用した簡単な頻度分析を、アミノ酸の使用位置を表す行列を作成して実行した。次いで、各位置の相対度数データを有するように出力行列を構文解析しフィルターした。パーサは、2つの閾値(低および高)に基づく非常に簡単なフィルターを提供する。各位置について、パーサは、累積度数が高閾値に達するまで、相対度数が低閾値を超えるアミノ酸だけを処理する。また、高閾値に達しない場合、パーサは相対度数が低閾値より低いアミノ酸を評価する。低閾値と高閾値の妥当な組合せは、位置分類に優れた精度を提供するので、10と80であった。パーサ出力を度数分布図として視覚化し、その結果を以下の図で示す。
【0168】
量的CDR分類
1つまたは2つのアミノ酸が他方に対して明らかに優勢である場合、位置を固定として分類する。通常、パラメータ調整に優れたパーサは、こうした位置で、異常なアミノ酸をフィルターによって除外することが可能である。優勢な1つ(複数)のアミノ酸をCDR配列における野生型として使用する。2つのアミノ酸が優勢である場合、混合したコドンを合成して両方のアミノ酸が得られることを意味する「縮重」野生型を使用する。可変性の高い位置(WTM位置)を特定するための選ばれたパラメータは非常に精度が高い。こうした位置で、明らかに優勢のアミノ酸は存在しないが、多くは中頻度から低頻度で異なる。ここで、多様性は、最も頻度の高いアミノ酸が野生型である変異誘発、例えば、LTMまたはWTMを使用して表すことができる。
【0169】
下記の図で、ユニバーサルライブラリーのために開発されたCDR1およびCDR2に関するすべての頻度分布図およびアミノ酸配列を報告する。CDR1およびCDR2の名称を以下の通り構築する:CHAINTYPE−GERMLINEFAMILY_CDRTYPE−CDRLENGTH。例えば、VH−1_CDR1−6という名称は、重鎖、ファミリーVH−1、6アミノ酸を有するCDR1を指す。CDR3の名称は類似しており、生殖系列ファミリー分類を含まない。
【0170】
CDRの設計
重鎖および軽鎖の両方のCDR3は、長さおよび配列がどちらも最も可変性の高い領域であり、抗体結合部位の構造多様性の大部分が得られる。したがって、完全なデータセットおよびタンパク質特異的鎖の両方に関する長さ分析を各鎖型について実行した。2つのデータセットの長さ分布は有意差が認められ、タンパク質抗原が、わずかに長いCDR3を好むことが示された。VH CDR3は非常に広い分布を有し、したがって9から18の長さ(使用したものの約75%)を選択した(図10参照)。Vκ CDR3は、非常に狭い分布を有し、使用されたほとんどの長さは8および9である(図20参照)。Vλ CDR3は、わずかに広い分布を有し、この場合、長さ8、9、10および11(図24参照)をライブラリー用に選択した。
【0171】
選択された各長さについて、CDR1およびCDR2の設計で記載したものに類似する頻度分析を実行した。すべての長さについて、この分析から、CDRの中間の位置、およびフレームワーク領域との境界に隣接する少数の保存された位置で多様性が高いことが示された。
【0172】
CDR1およびCDR2に関して、CDR3の多様性領域を、変異誘発、例えばWTMの標的としての最も可変性の高い位置として選択した。野生型として選んだ残基は、それぞれの位置で最も頻度の高いアミノ酸であった。幾つかのWTM位置で、野生型アミノ酸を選び、通常、Glyの存在を望ましいものであると決定した。WTM戦略を修正方法で設計した。即ち、標的および野生型アミノ酸が得られる、塩基の「最小距離」の組合せを選ぶ代わりに、混合コドンを、標的、野生型、およびGlyアミノ酸が得られるように設計した(即ち、Glyは必要とされる副産物である)。下記の図は、ユニバーサル抗体ライブラリーのために選ばれたCDRのすべての度数分布図および配列を示す。CDR1およびCDR2の名称は以下の通り構築した:CHAINTYPE−GERMLINEFAMILY_CDRTYPE−CDRIENGTH。例えば、VH−1_CDR1−6という名称は、重鎖、ファミリーVH−1のCDR1の6残基位置を表す。CDR3の名称は類似しているが、生殖系列ファミリー分類を含まない。
【0173】
CDR3のさらなる設計の条件は以下の通りである。グリシンは、CDR3の機能的ループ構造にとって必須である。グリシンは、CDR3のVH CDR3ループ全体のおよそ10〜20%で認められる。したがって、CDR3領域を、多数のグリシンをループ全体に収容するように設計した。したがって、野生型アミノ酸に加えて、グリシンは、多数のVH CDR3位置で必要とされる副産物であった。位置95では、Aspが、タンパク質およびペプチド対する抗体に関する度数分布表で非常に多くみられ、したがって、Aspを野生型アミノ酸として使用し、グリシンをWTMの必要とされる副産物として使用した(D/G)。位置96でも同様に、Argが非常に頻度が高く、したがって、Argを野生型アミノ酸として使用し、Glyを必要とされる副産物として使用した(R/G)。位置97〜99では、セリンがCDRループでかなり多くみられるアミノ酸であり、したがって許容性が高いので、Serを使用し、Glyをベースとして使用した(S/G)。位置101ではAspを使用し(一定に維持した)、AspのN末端側に直結している位置(Phe(D−1))も同様に維持した。
【0174】
VH CDR3長さ10以上では、AspのN末端側に2残基の位置(D−2)(例えば、VH CDR3−10の位置100)で、Tyrをベースアミノ酸として使用した。Tyrも抗体のCDRループで許容性が高い。AspのN末端側にあるTyrの優勢は、CDR3ループの長さと共に増大する。したがって、表12に示す通り、Tyrをベースアミノ酸として更に追加した。表12に示す通り、位置99でSerを野生型として使用しGlyを必要とされる副産物として使用するまで、残りは、Asp101のN末端側に位置する。ウォークスルー変異誘発を実行する場合、グリシンがループ構造に存在し(通常10〜25%)、許容性が高いアミノ酸がループに存在するので、各CDR3ループを構築して、機能性抗体を作製することができる。ウォークスルーアミノ酸および機能性副産物を介して、さらなる機能性結合相互作用を得た。
【0175】
本発明のユニバーサル抗体ライブラリーに使用するために特定されたCDR配列の概要を以下の表12に記載する。CDRの名称を標準化する。即ち、名称の第1フィールドは生殖系列ファミリーであり、第2フィールドはCDR型であり、第3フィールドはCDRの長さである(例えば、VH1_CDR1−6は、長さ6を有するVH1生殖系列ファミリーのCDR1である)。単一文字の位置は、固定位置であり、2文字の位置は、2つの標的アミノ酸のみを有するように合成を混合物で実施した組合せの位置(例えば、T−S)であり、最初の文字が「X」である位置の2文字はWTM位置である。Xの次のアミノ酸は野生型である(例えば、X−V)。最初の文字が「X」である3文字の位置は、「副産物最適化」WTM位置である。「X」の次のアミノ酸文字は野生型である。最後のアミノ酸(「/」の後の文字)は必要とされる副産物である。
【0176】
【表12−1】

【0177】
【表12−2】

【0178】
【表12−3】

【0179】
CDR3の追加の設計では、幾つかのCDR3位置内に、特にC末端領域により大きな多様性を導入している。このより大きな多様性は、Kabatデータベースに認められる多様性をより密接に反映している。これは、CDR設計2および3に反映されている(以下の表参照)。
【0180】
CDR3の代替の設計では、チロシンをCDR3ループ全体により広範に導入したチロシンリッチ設計を導入する。CDR3ループ全体に広範にチロシンがみられるが、グリシンコドンをチロシンコドンと混合すると、システインコドンならびにアンバー終止コドンが生じる。アンバー終止コドンおよび広範なシステインの導入は、非生産的な抗体配列をもたらすはずである。したがって、Kabat度数分布表ではシステインが認められる重要な位置にグリシンを副産物として含める。システインは、ジスルフィド架橋を形成して長いCDR3ループを安定化し、したがってこうした重要な位置にシステインを含めることはCDR3の機能性にとって有用であり得る。CDR3のサイズの増大は内部の位置の複雑性の増大をも含み、これは設計の原理に導入される。
【0181】
理想的には、チロシンおよびグリシンをあらゆる位置に導入することができる。アンバー終止コドンなど望ましくない副産物を産生することなく、こうした残基をあらゆる位置に導入するために、代替のオリゴヌクレオチド合成操作を利用するが、ここで、コドンのプールを別々に合成し、次いで組み合わせ、次回の合成のために分割する(E A Peters,P J Schatz,S S JohnsonおよびW J Dower,J Bacteriol. 1994 July;176(14):4296〜4305)。このプロセスでは2つのプールを使用し、第1のプールは、YおよびSをコードしているコドンTMCを利用し、第2のプールは、H、S、R、NおよびDをコードしているコドンVRCを利用する。したがって、こうしたプールは、チロシンによる疎水性への寄与、および第2のプールによる多数の極性寄与を可能にする。以下で緑で示すすべての多様性位置は、こうしたコドンの分割プールを使用して生成する。
【0182】
CDRのこれらすべての多数の設計により、ユニバーサルライブラリーの多数のサブライブラリーが得られる。各設計を多数の抗原に対する全体的な適合性および性能について実験によって試験する。
【0183】
【表13】

【0184】
【表14】

【0185】
(実施例10)
WTMおよび拡張WTMを使用してCDR多様性を導入するためのオリゴヌクレオチドの設計
表12に記載の配列を使用してオリゴ構築を実行することができる。表12で影付きの、Xで表した配列に示す適切な位置でウォークスルーおよび拡張ウォークスルー(CDRH3のための)を実行した。Xはウォークスルーアミノ酸を指し、―(ダッシュ)の次の1つ(複数)のアミノ酸はベースアミノ酸を指し、必要とされる任意の副産物は/(スラッシュ)の後に示す。記載した多数のアミノ酸を有する白の位置は、これらのアミノ酸と最小数の副産物との同じ割合の混合物を示す。この混合物は、可変性プロファイルに存在するこうしたアミノ酸の優勢の混合物を反映する。
【0186】
例えば、VH1_CDR1−6は以下の通り記載する。
【0187】
【表15】

【0188】
ウォークスルーアミノ酸としてアラニンを選ぶ場合、上記の設計のために以下のコドンを使用する。
【0189】
【表16】

【0190】
位置30(Chothia付番法)では、TCCはセリンをコードし、ACCはスレオニンをコードし、したがって最も効率的な混合物はWCCである。
【0191】
位置31では、TCCはSをコードする。
【0192】
位置32では、TACはYをコードする。
【0193】
位置33では、ウォークスルーアミノ酸はベースアミノ酸と同一であり、したがってAをコードするベースアミノ酸コドンGCCを使用する。
【0194】
位置34では、ATSはIおよびMをコードし、ここで、ATCはIをコードし、ATGはMをコードする。
【0195】
位置35では、標準的なウォークスルー操作を使用する。TCCはセリンであり、GCCはアラニンと一致する。したがって、GおよびTはどちらも第1の位置で必要とされ、Cは第2の位置で必要とされ、Cは第3の位置で必要とされる。したがって、AおよびSをコードするKCCを使用する。
【0196】
実際には、オリゴヌクレオチドを抗体の可変領域と相補的である隣接領域と共に合成する。したがって、以下の配列を使用する。
【0197】
【表17】

【0198】
20のすべてのアミノ酸およびアンバーコドンを利用した非天然アミノ酸を、青/緑の影付きで示した適切な位置で潜在的にウォークスルーすることができる。例証するために、9つのウォークスルーアミノ酸を以下に示す。
【0199】
【表18】

【0200】
名称を理解するために、VH1はフレームワークであり、VH1_1はVH1 CDR1を指し、VH1_1_6はCDRサイズ6を指し、Wはウォークスルーを指し、最後の文字はウォークスルーアミノ酸である。上記の配列は、A(アラニン)、D(アスパラギン酸)、S(セリン)、I(イソロイシン)、P(プロリン)、R(アルギニン)、Y(チロシン)、H(ヒスチジン)、およびN(アスパラギン)を用いたウォークスルーを例証する。
【0201】
表12を使用したオリゴ構築は、拡張ウォークスルーを使用し、以下の通りドーピングして実行した。
【0202】
ウォークスルーおよび拡張ウォークスルー(CDRH3のための)は、表12で青または緑の影付きの、Xで表した配列に示す適切な位置で実行した。Xはウォークスルーアミノ酸を指し、―(ダッシュ)の次の1つ(複数)のアミノ酸はベースアミノ酸を指し、必要とされる任意の副産物は/(スラッシュ)の後に示す。記載した多数のアミノ酸を有する白の位置は、これらのアミノ酸と最小数の副産物との同じ割合の混合物を示す。この混合物は、可変性プロファイルに存在するこうしたアミノ酸の優勢の混合物を反映する。
【0203】
【表19】

【0204】
必要とされる副産物を用いた拡張ウォークスルー変異誘発の使用を例証するためにこの第2実施例を行う。表12に示すVH−CDR3サイズ10の設計を上記に示す。アラニンウォークスルーのために合成されたオリゴヌクレオチドは以下の通りである。
【0205】
位置95では、ベースアミノ酸はアスパラギン酸GACである。アラニンはGCCであり、グリシンは必要とされる副産物GGCである。したがって、Gは第1の位置にあり、A、GおよびCは第2の位置にあり、Cは第3の位置にある。
【0206】
位置96では、ベースアミノ酸はアルギニンCGCである。アラニンはGCCであり、グリシンは必要とされる副産物GGCである。したがって、この位置の第1ヌクレオチドはCまたはGであり、第2ヌクレオチドはGまたはCであり、第3ヌクレオチドはCを含む。
【0207】
位置97では、ベースアミノ酸はセリンであり、TCCまたはAGCとしてコードされ得る。アラニンをGCCでウォークスルーし、グリシンはGGCとしてコードされる。GGCと組み合わせたTCCはシステイン副産物(TGC)を産生するので、セリンについてはAGCが選ばれるが、これは、望ましくないジスルフィド結合形成が起こり得るのでCDRでは通常所望のものではない。したがって、AGCコドンが選ばれる。したがって、第1のヌクレオチド位置はAまたはGを含み、第2の位置はCまたはGを含み、第3のコード位置はCを含む。
【0208】
位置98および99は、位置97と同じベースアミノ酸および必要とされる副産物アミノ酸を利用するので、位置97と同一である。
【0209】
位置100は、チロシンをベースアミノ酸TACとして利用し、アラニンはGCCである。したがって、第1のコード位置はTおよびGの混合物を含み、第2のコード位置はAおよびCを含み、第3のコード位置はCを含む。
【0210】
これらの結果を以下に要約する。
【0211】
【表20】

【0212】
好ましい使用では、抗体配列中への導入を容易にするために、隣接領域を5’および3’領域に付加する。更に、グリシンはCDRH3のアミノ酸組成物の15〜25%を示すので、グリシンの導入率がこれに近似するようにドーピングを実行することができる。
【0213】
一実施例では、位置95でのグリシンの使用は、第2のコード位置で利用したGの百分率によって限定される。したがって、グリシンの導入20%に達するように、混合物に対するGの百分率は20%であった。同様に、位置96〜99でのグリシンの導入率を、グリシンの導入率が約25%に達するように調整したが、副産物の導入率は低下した。
【0214】
【表21】

【0215】
20のすべてのアミノ酸およびアンバーコドンを利用した非天然アミノ酸を、青/緑の影付きで示した適切な位置で潜在的にウォークスルーすることができる。例証するために、サイズ10のVII CDR3に関する9つのウォークスルーアミノ酸を以下に示す。
【0216】
【表22】

【0217】
CDRH3の設計2、3および4を使用したオリゴ構築は、拡張ウォークスルーを利用し、以下の通りドーピングして実行した。
【0218】
ウォークスルーおよび拡張ウォークスルー(CDRH3のための)は、表12で青または緑の影付きの、Xで表した配列に示す適切な位置で実行した。Xはウォークスルーアミノ酸を指し、―(ダッシュ)の次の1つ(複数)のアミノ酸はベースアミノ酸を指し、必要とされる任意の副産物は/(スラッシュ)の後に示す。
【0219】
【表23】

【0220】
CDRH3のさらなる設計の場合でのウォークスルー操作を更に例証するために、この第3実施例を行う。
【0221】
20のすべてのアミノ酸およびアンバーコドンを利用した非天然アミノ酸を、緑の影付きで示した適切な位置で潜在的にウォークスルーすることができる。この実施例では、設計2を使用してヒスチジンをウォークスルーし、設計3を使用してプロリンをウォークスルーし、設計4を使用してセリンをウォークスルーする。この配列表は、9〜18の設計長さでウォークスルーされたこれらのアミノ酸を有する。長さ11の分析をここで示す。
【0222】
設計2では、ヒスチジンが、例示的なウォークスルー/拡張ウォークスルーアミノ酸である。位置95では、ベースアミノ酸はセリンであり、グリシンを副産物として添加した場合のシステインの形成を回避するために、TCCよりもAGCを選ぶ。グリシンは必要とされる副産物であり、GGCである。ヒスチジンはCACとしてコードされる。したがって、A、GおよびCは第1の位置にあり、GおよびAは第2の位置にあり、Cは第3の位置にある。この混合物の濃縮物を、約15〜25%グリシンおよび好ましいベースアミノ酸セリンを産生するようにドーピングした。
【0223】
位置96、97、98および99では位置95と同じ設計を利用する。
【0224】
位置100では、ベースアミノ酸TACとしてチロシンを利用し、アラニンGCCおよびアスパラギンAACは副産物として必要とされる。ヒスチジン(CAC)は拡張ウォークスルーアミノ酸である。したがって、第1の位置はT、G、AおよびCを含み、第2の位置はAおよびCを含み、最後の位置はCを含む。ベースアミノ酸チロシンが得られるようにドーピングを実行する。
【0225】
位置100aでは、位置100と同じ設計原理を利用する。
【0226】
隣接領域をプライマーに付加した後、ヒスチジンをウォークスルーするCDRH3長さ11設計2のためのオリゴヌクレオチドの設計を以下および配列表で示す。
【0227】
【表24】

【0228】
【表25】

【0229】
設計3では、プロリンをウォークスルー/拡張ウォークスルーアミノ酸としてこの実施例に使用する。
【0230】
位置95では、Asp(GAC)がベースアミノ酸であり、Gly(GGC)が必要とされる副産物である。プロリン(CCC)のウォークスルーにより、第1の位置でGおよびC、第2の位置でA、GおよびC、第3の位置でCがもたらされる。前記実施例の通り、グリシンを15〜25%の頻度に達するようにドーピングする。
【0231】
位置96では、位置95と同じ設計を利用する。
【0232】
位置97では、ウォークスルーアミノ酸は第3の位置でCまたはTを必要としないので、プロリンのウォークスルーのためにセリンTCGを利用する。CまたはTを必要とするウォークスルーアミノ酸のためには、システイン副産物を回避するために、AGCをセリンコドンに利用することができる。AGGとしてコードされるもの(アルギニン)よりもトリプトファンTGGのほうが有益な副産物であるので、TCGはAGCよりも好ましい。アルギニンは、望ましいが、CGCは最終混合物ですでにコードされており、したがってアルギニンが重複する。
【0233】
したがって、TCGをセリンに使用し、GGGを、必要とされるグリシン副産物に使用され、CCGをプロリンに使用する。したがって、T、GおよびCを第1の位置で使用し、GおよびCを第2の位置で使用し、Gを最後の位置で使用する。
【0234】
位置98および99では、位置97と同じ設計を利用する。
【0235】
位置100および100aでは、ベースアミノ酸(TAC)であるチロシン、必要とされる副産物Ala(GCC)、および拡張ウォークスルーアミノ酸Pro(CCC)を使用する同じ設計を利用する。したがって、第1の位置はT、CおよびGを含み、第2の位置はAおよびCを含み、第3の位置はCを含む。ベースアミノ酸チロシンが得られるようにドーピングを実行する。
【0236】
付加された隣接領域と共に、プロリンのウォークスルーによる設計3のためのオリゴヌクレオチドを以下に示す。
【0237】
【表26】

【0238】
【表27】

【0239】
設計4では、セリンをウォークスルー/拡張ウォークスルーアミノ酸として使用する。
【0240】
位置95および96では、グリシン(GGC)がベースアミノ酸であり、ヒスチジン(CAC)が、必要とされる副産物であり、セリン(AGC)はウォークスルーコドンである。したがって、A、GおよびCを第1の位置に使用し、Gを第2の位置に使用し、Cを第3の位置に使用する。
【0241】
位置97、98、100および100aでは、チロシンTACがベースアミノ酸であり、TCCはウォークスルーコドンであり、第1の位置でT、第2の位置でAおよびC、最後の位置でCが得られる。
【0242】
位置99では、チロシン(TAC)がベースアミノ酸であり、ヒスチジン(CAC)、アスパラギン酸(GAC)およびアスパラギン(AAC)が、必要とされる副産物である。TCCをセリンコドンに利用する。したがって、A、C、GおよびTを第1の位置で使用し、AおよびCを第2の位置で使用し、Cを第3の位置で使用する。
【0243】
ベースアミノ酸が得られるようにドーピングを実行し、以下のオリゴヌクレオチド混合物が得られるように隣接領域を付加する。
【0244】
【表28】

【0245】
(実施例11)
分割プール設計変異誘発/オリゴヌクレオチド合成
興味深い抗原結合領域/抗原接触を特定するために、チロシンおよびグリシンを所望のあらゆる残基位置に導入することができる。アンバー終止コドンなど望ましくない副産物を産生することなく、こうした残基をあらゆる位置に導入するために、代替のオリゴヌクレオチド合成操作を利用することができるが、ここで、コドンのプールを別々に合成し、次いで組み合わせ、次回の合成のために分割する(E A Peters,P J Schatz,S S JohnsonおよびW J Dower,J Bacteriol.1994 July;176(14):4296〜4305)。このプロセスでは2つのプールを使用し、第1のプールは、YおよびSをコードしているコドンTMCを利用し、第2のプールは、H、S、R、NおよびDをコードしているコドンVRCを利用する。したがって、こうしたプールは、チロシンによる疎水性への寄与、および第2のプールによる多数の極性寄与を可能にする。この分割プール設計では、CDRH3多様性表(図12)においてXで示すすべての多様性位置はこうしたコドンの分割プールを含み得る。この実施例は、以下で示すVH3 CDR長さ9に利用したコドンセットを示す。
【0246】
【表29】

【0247】
第1のプールは、YおよびSを50:50比でコードしている。しかし、プールした後グリシンの導入が15%にまで増大するように第2のプールをドーピングする。より均衡のとれたアミノ酸の比が得られるように、チロシンプールはヒスチジンプールのサイズの1/3でコードされる。
【0248】
アミノ酸の限定された混合物を産生するために、4つのオリゴヌクレオチドカラムを利用する。先ず、上記で示したCDRH3の隣接領域および固定部分によって画定した通り、4つすべてのカラムにオリゴヌクレオチドの固定3’部分を合成する。上記の実施例配列の位置99では、第1のカラムはコドンTMCを合成する(3’−5’DNA合成におけるCMT)。残りの3つのカラムは、上記で概説したヌクレオチド比を利用してコドンVRCを合成する(3’−5’DNA合成におけるCRV)。3ヌクレオチドを結合させた後、4つすべてのカラムを開き、アセトニトリルで洗浄することにより合成支持体を除去し、樹脂をプールする。混合後、この樹脂を等しい分量で4つのカラムに入れる。この時点で、次の位置、位置98を合成する。1つのカラムで上記の通りコドンTMCを合成し、3つのカラムでVRC混合物を合成する。位置99のために、この樹脂をプールし、混合し、記載の通り再配分する。このプロセスを位置97、96および95について反復する。この時点で、5’固定および隣接領域を4つすべてのカラムに付加し、4つすべてのカラムの生じたオリゴヌクレオチド混合物を一緒にプールし、Kunkel変異誘発などの変異誘発法を利用して抗体鋳型中に導入することができる。
【0249】
均等物
当分野の技術者であれば、通常の実験を使用するだけで、本明細書に記載した本発明の特定の実施形態との多くの均等物を認識し、または確認できるであろう。このような均等物は、以下の特許請求の範囲に包含されるものとする。
【図面の簡単な説明】
【0250】
【図1】コンピュータ援用データベースバイオマイニングを用いて、本発明のユニバーサル抗体ライブラリーの構築を実施するための模式図である。
【図2】ユニバーサル抗体ライブラリーの合成に使用するためのCDRおよびフレームワーク構成要素を特定および選択するステップの例(およびデータベースの様々な統計)を示す図である。
【図3】出現頻度分析、即ち、所与の抗原クラスに対するヒト抗体免疫応答で使用されている最も使用頻度の高い生殖細胞系フレームワークの特定における閾値頻度の例を示す図である。
【図4】再編成された抗体に寄与する生殖系列の相対頻度を、各VH生殖系列ファミリーについて表にしたものである。
【図5】所与の抗原クラス(例えばタンパク質系抗原)に対する応答で使用され、合成CDR領域のアクセプターとして機能する、7つの高頻度重鎖フレームワーク配列およびそれらの配置を示す図である。CDRは、接触画定(MacCallumら)によるものである。VH1、VH3、およびVH4由来の生殖系列Vセグメントを列挙して、図示する。
【図6】例示的合成重鎖CDR1の配列多様性を、CDR可変性プロファイル(頻度分布)の形態で示す。CDR1長さは、KabatのCDR画定に従って5である。
【図7】生成した、CDR可変性プロファイル形態にある例示的合成重鎖CDR1の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。CDR1長さは、CDRの接触画定に従って6である。
【図8】例示的合成重鎖CDR2の配列多様性を、CDR可変性プロファイル(頻度分布)の形態で示す。CDR2長さは、KabatのCDR画定に従って17である。
【図9】生成した、CDR可変性プロファイル形態にある例示的合成重鎖VH1およびVH3のCDR2の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。CDR2長さは、CDRの接触画定に従って13である。
【図10】利用可能なCDR空間のおよそ75%を占める、サイズが9から18アミノ酸のVH CDR3の鎖長分布を示す図である。各鎖長に関して別々の分析を行った(図12を参照)。VH CDR3のサイズは、CDRの接触画定に従った。
【図11】例示的合成重鎖CDR3の配列多様性を、CDR可変性プロファイル(頻度分布)の形態で示す。CDR3長さは、KabatのCDR画定に従って13である。
【図12】生成した、CDR可変性プロファイル形態にある例示的合成重鎖CDR3の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。CDR3長さは、CDRの接触画定に従って9〜18である。
【図13】各重鎖CDRの配列多様性および混合重鎖ライブラリーの多様性を示す図である。可変的な位置の番号およびCDRのサイズはKabatの画定に従った。
【図14】2本鎖核酸に変換できる、非縮重および縮重重複オリゴヌクレオチドを併用し、単一重複伸長ポリメラーゼ連鎖反応(SOE−PCR)を用いた重鎖ライブラリーの構築を示す図である。
【図15】ユニバーサル抗体ライブラリーの重鎖ライブラリーと、κおよび/またはλ軽鎖ライブラリーとの、多様性の追加を目的とした混合を示す図である。
【図16】所与の抗原クラス(例えばタンパク質)に対する応答で使用され、合成CDR領域のアクセプターとして機能する、7つの高頻度軽鎖フレームワーク(即ち、3つのκおよび4つのλ軽鎖フレームワーク)配列およびそれらの配置を示す図である。CDR領域は、接触画定に従って特定される。VκI−L1、VκIII−A27、VκIII−L6、Vλ1−1b、Vλ2−2a2、Vλ3−31、およびVλ3−3r由来の生殖系列Vセグメントを列挙して、図示する。
【図17】生成した、CDR可変性プロファイル(頻度分布)形態にある例示的合成VκIおよびVκIII軽鎖CDR1の配列多様性と、置換マトリックスとを示す図である。CDR1の長さは、CDRの接触画定に従って7および8である。
【図18】本発明の例示的1本鎖抗体(scFv)の核酸配列およびアミノ酸配列を示す図である。
【図19】生成した、可変性プロファイル(頻度分布)形態にある例示的合成VκIおよびVκIII軽鎖CDR2の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。CDR2長さは、CDRの接触画定に従って10である。
【図20】利用可能なCDR空間のおよそ80%を占める、サイズが8および9アミノ酸のVκCDR3の鎖長分布を示す図である。各鎖長に関して別々の分析を行った(図21を参照)。VH CDR3のサイズは、CDRの接触画定に従った。
【図21】生成した、可変性プロファイル(頻度分布)形態にある例示的合成軽鎖(Vκ)CDR3の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。VκCDR3の長さは、CDRの接触画定に従って8〜9である。
【図22】生成した、可変性プロファイル(頻度分布)形態にある例示的合成軽鎖(Vλ)CDR1の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。VλCDR1の長さは、CDRの接触画定に従って9、10、および7である。
【図23】生成した、可変性プロファイル(頻度分布)形態にある、例示的合成重鎖Vλ1、Vλ2、およびVλ3軽鎖CDR2の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。Vλ1、Vλ2、およびVλ3CDR2の長さは、CDRの接触画定に従って10である。
【図24】利用可能なCDR空間のおよそ90%を占める、サイズが8から11アミノ酸のVλCDR3の鎖長分布を示す図である。各鎖長に関して別々の分析を行った(図25を参照)。VH CDR3のサイズは、CDRの接触画定に従った。
【図25】生成した、可変性プロファイル(頻度分布)形態にある例示的合成軽鎖VλCDR3の配列多様性と、残基位置および潜在的多様性を示すマトリックスとを示す図である。VλCDR3の長さは、CDRの接触画定に従って8、9、10、および11である。
【図26】Kunkel法変異誘発を用いた発現鋳型へのCDR多様性の導入を示す図である。
【図27】各軽鎖CDRの配列多様性および混合軽鎖ライブラリーの多様性を示す図である。可変的な位置の番号およびCDRのサイズはKabatの画定に従った。
【図28】2本鎖核酸に変換できる、非縮重および縮重重複オリゴヌクレオチドを併用し、単一重複伸長ポリメラーゼ連鎖反応(SOE−PCR)を用いた軽鎖ライブラリーの構築を示す図である。
【図29】試験抗体の親和性成熟(左パネル)と、その結果得られた多様性(底部パネル)と、代表的な数クローンの結合の改善(右パネル)とを示す図である。
【図30】VH鎖(A)およびVL鎖(B)に関する3つのCDR画定、即ちKabat(Kabatら)、Chothia(Chothiaら)、および接触要件(MacCallumら)の比較を示す図である。CDRセグメント上の小三角形は、挿入が起こる位置を示す。2つのグラフの下に、各CDRのアミノ酸数(即ちCDRの長さ)を示す。
【図31】FR1−CDR1−FR2−CDR2−FR3の形態で解析および保存されたVBASEセグメントの試料を示す図である。CDRの位置は接触画定(MacCallumら)によるものであり、付番方式はChothia(Chothiaら)によるものである。これらのデータセットから、各FRまたはCDRの個々のデータを抽出することができる。
【図32】FR123としてFASTAフォーマットで保存された、VBASEのVH生殖系列配列を示す図である。フレームワークの長さは、CDRの接触画定を指す。
【図33】FR123フォーマットのVBASE Vセグメントから得た階層的系統樹である。p−距離(ミスマッチの割合)を用いて計算された距離マトリックスと共にUPGMAクラスタリングアルゴリズムを用いた。
【図34】FR123フォーマットのVBASE Vκセグメントから得た階層的系統樹である。p−距離(ミスマッチの割合)を用いて計算された距離マトリックスと共にUPGMAクラスタリングアルゴリズムを用いた。
【図35】FR123フォーマットのVBASE Vλセグメントから得た階層的系統樹である。p−距離(ミスマッチの割合)を用いて計算された距離マトリックスと共にUPGMAクラスタリングアルゴリズムを用いた。
【図36】階層的系統木(UPGMA)として可視化した、既知の抗タンパク質抗体に関するKabat VH入力データセット(FR123フォーマット)を示す図である。
【図37】階層的系統木(UPGMA)として可視化した、既知の抗タンパク質抗体に関するKabat Vκ入力データセット(FR123フォーマット)を示す図である。
【図38】階層的系統木(UPGMA)として可視化した、既知の抗タンパク質抗体に関するKabat Vλ入力データセット(FR123フォーマット)を示す図である。
【図39】選択された12の生殖系列セグメントのアミノ酸配列を示す図である。この図には、生殖系列CDRの配列も含まれている。これらは、以下の項に記載の変異配列で置換されている。
【図40】多糖類の抗原クラスに適したフレームワークの系統樹を示す図である。
【図41】CDR1およびCDR2可変性プロファイル選択を表すフローチャートを示す[実施例3を参照]。
【図42】CDR3可変性プロファイル選択を表すフローチャートを示す[実施例3を参照]。
【図43】重鎖配列のサブセットプールの選択過程、サブセット配列のサブクラス分割、および正準構造に基づいたサブクラスのさらなる分割を示す図である。
【図44】VH−1_CDR1_6集団内の各位置におけるアミノ酸残基普及率のヒストグラムを示す図である。
【図45】VH−1_CDR1_6_CS1(正準構造2)集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。
【図46】VH−1_CDR1_6_CS1−2集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。
【図47】VH−1_CDR1_6_CS1−3集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。
【図48】VH−1_CDR2_13集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。
【図49】それぞれ、VH−1_CDR2_13_CS2集団およびVH−1_CDR2_13_CS3集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。
【図50】それぞれ、VH−1_CDR2_13_CS2−1集団およびVH−1_CDR2_13_CS3−1集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。
【図51】それぞれ、VH_CDR3−9集団、VH_CDR3−15集団、およびVH_CDR3−18集団内の各位置におけるアミノ酸残基普及率のヒストグラムである。

【特許請求の範囲】
【請求項1】
a)次の規準:
i)各フレームワーク領域は、所定の抗原クラスに対する発現抗体において規定した閾値頻度以上で生殖細胞系配列を含むこと
に従って選択された、1個または複数のフレームワーク領域、および場合により
b)1個または複数のCDR領域
を含む、抗体結合領域をコードするポリヌクレオチドのライブラリー。
【請求項2】
抗体結合領域が、抗体、抗体軽鎖(VL)、抗体重鎖(VH)および1本鎖抗体(scFv)からなる群から選択される、請求項1に記載のライブラリー。
【請求項3】
1個または複数のCDR領域を含む、請求項1に記載のライブラリー。
【請求項4】
1個または複数の前記CDR領域が、次の規準:
i)前記CDR領域は、a)の選択フレームワーク領域(複数も)の正準クラスにより決定される長さを備えること、および
ii)前記CDR領域は、前記CDR領域内の各位置または位置のサブセットに、相当する天然CDR領域(複数も)中の相当位置に見出される、ある閾値頻度以上で出現するアミノ酸のセットから選択されるアミノ酸残基を含むこと、
によって選択され、a)のフレームワーク領域およびb)のCDR領域が共同で抗体結合領域を形成する、
請求項3に記載のライブラリー。
【請求項5】
1個または複数の前記CDR領域が、次の規準:
i)前記CDR領域は、a)の選択フレームワーク領域(複数も)の正準クラスにより決定される長さを備えること、および
ii)前記CDR領域は、前記CDR領域内の各位置に、
生殖細胞系CDR、発現CDR領域の両方に出現する保存アミノ酸、
生殖細胞系では保存されているが、発現CDR領域では可変性である半保存アミノ酸、および
生殖細胞系で可変性であり、発現CDR領域で可変性である非保存アミノ酸
からなる群から選択されるアミノ酸残基によって表わされる、アミノ酸残基を含むこと、
によって選択され、a)のフレームワーク領域およびb)のCDR領域が共同で抗体結合領域を形成する、
請求項3に記載のライブラリー。
【請求項6】
前記フレームワーク領域が、軽鎖フレームワーク領域および重鎖フレームワーク領域からなる群から選択される、請求項1に記載のライブラリー。
【請求項7】
前記軽鎖フレームワーク領域が、VκI−L1、VκI−L5、VκIII−A27、VκIII−L6、VκIII−L20、Vλ1−1b、Vλ1−1c、Vλ2−2a2、およびVλ3−31、Vλ3−3rからなる群から選択される、ヒト軽鎖フレームワーククローンに由来する請求項6に記載のライブラリー。
【請求項8】
前記重鎖フレームワーク領域が、1−e、3−07、3−11、3−21、3−23、3−30.5、3−33、3−48および3−74からなる群から選択される、ヒト重鎖フレームワーククローンに由来する請求項6に記載のライブラリー。
【請求項9】
重鎖フレームワークが、J1、J2、J3、J4、J5およびJ6からなる群から選択されるJセグメント配列を含む、請求項6に記載のライブラリー。
【請求項10】
フレームワーク領域が、約10%から約100%の閾値出現頻度を有する、請求項1に記載のライブラリー。
【請求項11】
前記所定の抗原クラスが、タンパク質、ペプチド、低分子、多糖類およびポリヌクレオチドからなる群から選択される抗原のクラスである、請求項1に記載のライブラリー。
【請求項12】
CDR領域が、CDR−H1、CDR−H2、CDR−H3、CDR−L1、CDR−L2およびCDR−L3からなる群から選択される、請求項1に記載のライブラリー。
【請求項13】
所与の正準構造に関連して選択されたCDRの画定により決定されるCDR−H1の長さが、長さ5、6、7および8からなる群から選択される、請求項12に記載のライブラリー。
【請求項14】
CDR−H1領域が、Kabatに基づくCDRの画定に従うと長さが5である、請求項13に記載のライブラリー。
【請求項15】
CDR−H1がアミノ酸配列SYXMXを含み、式中Xの配列はA、Y、G、D、S、I、P、R、H、NまたはGであり、XはA、Y、G、D、S、I、P、R、H、N、WまたはGである、請求項14に記載のライブラリー。
【請求項16】
CDR−H1領域が、接触決定に基づくCDRの画定に従うと長さが6である、請求項13に記載のライブラリー。
【請求項17】
VH1 CDR−H1がアミノ酸配列T/SSYXI/MXを含み、式中XはA、Y、G、D、S、I、P、R、H、NまたはGであり、XはA、D、S、I、P、R、Y、HまたはNである、請求項16に記載のライブラリー。
【請求項18】
VH3 CDR−H1がアミノ酸配列SXYXMXを含み、式中XはA、D、S、I、P、R、Y、H、NまたはTであり、XはA、D、S、I、P、R、Y、H、N、WまたはGであり、XはA、D、S、I、P、R、Y、H、Nである、請求項16に記載のライブラリー。
【請求項19】
所与の正準構造に関連して選択されたCDRの画定により決定されるCDR−H2の長さが、長さ17、12および13からなる群から選択される、請求項12に記載のライブラリー。
【請求項20】
CDR−H2領域が、Kabatに基づくCDR画定に従うと長さ17である、請求項19に記載のライブラリー。
【請求項21】
CDR−H2がアミノ酸配列XIXGGXYYADSVKGを含み、式中XはA、D、S、I、P、R、Y、H、N、GまたはWであり、XはA、D、S、I、P、R、Y、HまたはNであり、XはA、D、S、I、P、R、Y、HまたはNであり、XはA、D、S、I、P、R、Y、H、NまたはGであり、XはA、D、S、I、P、R、Y、HまたはNであり、XはA、D、S、I、P、R、Y、H、NまたはTである、請求項20に記載のライブラリー。
【請求項22】
CDR−H2領域が、接触決定に基づくCDR画定に従うと長さ13である、請求項19に記載のライブラリー。
【請求項23】
VH1 CDR−H2がWMGXIXPXGXT/ANのアミノ酸配列を含み、式中XはA、D、S、I、P、R、Y、H、N、GまたはWであり、XはA、D、S、I、P、R、Y、HまたはNであり、XはA、D、S、I、P、R、Y、H、N、GまたはMであり、XはA、D、S、I、P、R、Y、H、N、FまたはGであり、XはA、D、S、I、P、R、Y、H、NまたはTである、請求項22に記載のライブラリー。
【請求項24】
VH3 CDR−H2がWVS/AXISXGXYのアミノ酸配列を含み、式中XはA、D、S、I、P、R、Y、H、N、V、GまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、Q、WまたはFであり、XはA、D、S、I、P、R、Y、HまたはNであり、XはA、D、S、I、P、R、Y、H、N、GまたはTであり、XはA、D、S、I、P、R、Y、H、N、TまたはKであり、XはA、D、S、I、P、R、Y、H、NまたはFである、請求項22に記載のライブラリー。
【請求項25】
CDR−H3鎖長が、長さ9、10、11、12、13、14、15、16、17および18からなる群から選択される、請求項12に記載のライブラリー。
【請求項26】
CDR−H3領域が長さ9である、請求項25に記載のライブラリー。
【請求項27】
CDR−H3がARXFDのアミノ酸配列を含み、式中XはA、D、S、I、P、R、Y、H、N、G、E、LまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、LまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、V、T、LまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、WまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、L、TまたはVである、請求項26に記載のライブラリー。
【請求項28】
CDR−H3領域が長さ10である、請求項25に記載のライブラリー。
【請求項29】
CDR−H3がアミノ酸配列ARXFDを含み、式中XはA、D、S、I、P、R、Y、H、N、G、E、L、VまたはMであり、XはA、D、S、I、P、R、Y、H、N、G、L、V、KまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、T、E、L、V、QまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、L、V、WまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、T、E、WまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、LまたはFである、請求項28に記載のライブラリー。
【請求項30】
CDR−H3領域が長さ11である、請求項25に記載のライブラリー。
【請求項31】
CDR−H3がアミノ酸配列ARXFDを含み、式中XはA、D、S、I、P、R、Y、H、N、K、G、EまたはLであり、XはA、D、S、I、P、R、Y、H、N、T、G、F、LまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、VまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、TまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、TまたはLであり、XはA、D、S、I、P、R、Y、H、N、GまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、W、FまたはLである、請求項30に記載のライブラリー。
【請求項32】
CDR−H3領域が長さ12である、請求項25に記載のライブラリー。
【請求項33】
CDR−H3がARXFDのアミノ酸配列を含み、式中XはA、D、S、I、P、R、Y、H、N、G、EまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、L、QまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、L、T、VまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、W、LまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、V、F、TまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、L、TまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、T、WまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、F、TまたはWである、請求項32に記載のライブラリー。
【請求項34】
CDR−H3領域が長さ13である、請求項25に記載のライブラリー。
【請求項35】
CDR−H3がARXFDのアミノ酸配列を含み、式中XはA、D、S、I、P、R、Y、H、N、G、E、V、LまたはKであり、XはA、D、S、I、P、R、Y、H、N、G、L、QまたはKであり、XはA、D、S、I、P、R、Y、H、N、G、L、V、KまたはMであり、XはA、D、S、I、P、R、Y、H、N、G、T、LまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、T、W、LまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、V、L、EまたはTであり、XはA、D、S、I、P、R、Y、H、N、L、V、T、WまたはGであり、XはA、D、S、I、P、R、Y、H、N、GまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、F、WまたはTである、請求項34に記載のライブラリー。
【請求項36】
CDR−H3領域が長さ14である、請求項25に記載のライブラリー。
【請求項37】
CDR−H3がARX10FDのアミノ酸配列を含み、式中XはA、D、S、I、P、R、Y、H、N、G、EまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、L、T、QまたはKであり、XはA、D、S、I、P、R、Y、H、N、G、L、V、TまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、L、F、TまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、V、TまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、T、LまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、T、L、EまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、T、F、EまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、WまたはTであり、X10はA、D、S、I、P、R、Y、H、N、G、F、WまたはLである、請求項36に記載のライブラリー。
【請求項38】
CDR−H3領域が長さ15である、請求項25に記載のライブラリー。
【請求項39】
CDR−H3がアミノ酸配列ARX1011FDを含み、式中XはA、D、S、I、P、R、Y、H、N、G、E、VまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、W、L、TまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、E、T、F、LまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、E、C、TまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、T、WまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、TまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、T、VまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、T、L、F、V、MまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、V、CまたはKであり、X10はA、D、S、I、P、R、Y、H、N、G、WまたはQであり、X11はA、D、S、I、P、R、Y、H、N、G、W、FまたはLである、請求項38に記載のライブラリー。
【請求項40】
CDR−H3領域が長さ16である、請求項25に記載のライブラリー。
【請求項41】
CDR−H3がアミノ酸配列ARX101112FDを含み、式中XはA、D、S、I、P、R、Y、H、N、G、L、VまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、L、VまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、TまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、L、TまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、V、F、TまたはMであり、XはA、D、S、I、P、R、Y、H、N、G、T、FまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、T、V、LまたはEであり、XはA、D、S、I、P、R、Y、H、N、G、T、EまたはWであり、XはA、D、S、I、P、R、Y、H、N、G、L、FまたはWであり、X10はA、D、S、I、P、R、Y、H、N、G、L、TまたはFであり、X11はA、D、S、I、P、R、Y、H、N、G、WまたはTであり、X12はA、D、S、I、P、R、Y、H、N、G、WまたはFである、請求項40に記載のライブラリー。
【請求項42】
CDR−H3領域が長さ17である、請求項25に記載のライブラリー。
【請求項43】
CDR−H3がアミノ酸配列ARX10111213FDを含み、式中XはA、D、S、I、P、R、Y、H、N、G、V、EまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、LまたはQであり、XはA、D、S、I、P、R、Y、H、N、G、L、T、VまたはMであり、XはA、D、S、I、P、R、Y、H、N、G、VまたはCであり、XはA、D、S、I、P、R、Y、H、N、G、VまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、F、VまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、W、T、VまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、LまたはVであり、XはA、D、S、I、P、R、Y、H、N、G、V、F、LまたはCであり、X10はA、D、S、I、P、R、Y、H、N、G、FまたはLであり、X11はA、D、S、I、P、R、Y、H、N、G、L、VまたはCであり、X12はA、D、S、I、P、R、Y、H、NまたはGであり、X13はA、D、S、I、P、R、Y、H、N、GまたはWである、請求項42に記載のライブラリー。
【請求項44】
CDR−H3領域が長さ18である、請求項25に記載のライブラリー。
【請求項45】
CDR−H3がアミノ酸配列ARX1011121314FDを含み、式中XはA、D、S、I、P、R、Y、H、N、G、E、VまたはLであり、XはA、D、S、I、P、R、Y、H、N、G、LまたはKであり、XはA、D、S、I、P、R、Y、H、N、G、T、V、LまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、VまたはTであり、XはA、D、S、I、P、R、Y、H、N、G、C、F、K、LまたはMであり、XはA、D、S、I、P、R、Y、H、N、G、V、F、T、WまたはCであり、XはA、D、S、I、P、R、Y、H、N、G、T、WまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、W、VまたはFであり、XはA、D、S、I、P、R、Y、H、N、G、LまたはVであり、X10はA、D、S、I、P、R、Y、H、N、G、C、LまたはFであり、X11はA、D、S、I、P、R、Y、H、N、F、GまたはWであり、X12はA、D、S、I、P、R、Y、H、N、G、T、LまたはFであり、X13はA、D、S、I、P、R、Y、H、N、GまたはWであり、X14はA、D、S、I、P、R、Y、H、N、G、WまたはTである、請求項44に記載のライブラリー。
【請求項46】
所与の正準構造に関連して選択されたCDRの画定により決定されるVL(κ)CDR−L1の長さが、長さ7および8からなる群から選択される、請求項12に記載のライブラリー。
【請求項47】
VK−I CDR−L1領域が、接触によるCDR画定に従うと長さ7である、請求項46に記載のライブラリー。
【請求項48】
CDR−L1が、アミノ酸配列SXLA/NWYを含み、式中XがA、D、S、I、P、R、Y、H、N、TまたはKであり、XがA、D、S、I、P、R、Y、H、NまたはWである、請求項47に記載のライブラリー。
【請求項49】
VK−III CDR−L1領域が、接触によるCDR画定に従うと長さ7である、請求項46に記載のライブラリー。
【請求項50】
CDR−L1が、SSN/YLAWYのアミノ酸配列を含む、請求項49に記載のライブラリー。
【請求項51】
VK−III CDR−L1領域が、接触によるCDR画定に従うと長さ8である、請求項46に記載のライブラリー。
【請求項52】
CDR−L1が、アミノ酸配列SS/NX1YLAWYを含み、式中XがA、D、S、I、P、R、Y、H、NまたはTである、請求項51に記載のライブラリー。
【請求項53】
所与の正準構造に関連して選択されたCDRの画定により決定されるVL(κ)CDR−L2の長さが、長さ10からなる群から選択される、請求項12に記載のライブラリー。
【請求項54】
VK−I CDR−L2領域が、接触によるCDR画定に従うと長さ10である、請求項53に記載のライブラリー。
【請求項55】
CDR−L2が、LLIYXASXLQ/Eのアミノ酸配列を含み、式中XがA、D、S、I、P、R、Y、H、N、KまたはGであり、XがA、D、S、I、P、R、Y、H、NまたはTである、請求項54に記載のライブラリー。
【請求項56】
VK−III CDR−L2領域が、接触によるCDR画定に従うと長さ10である、請求項53に記載のライブラリー。
【請求項57】
CDR−L2が、アミノ酸配列LLIYG/DASXRAを含み、式中XがA、D、S、I、P、R、Y、H、NまたはTである、請求項56に記載のライブラリー。
【請求項58】
CDRの画定により決定されるVL(κ)CDR−L3鎖長が、長さ8および9からなる群から選択される、請求項12に記載のライブラリー。
【請求項59】
CDR−L3領域が、接触によるCDR画定に従って長さ8である、請求項58に記載のライブラリー。
【請求項60】
CDR−L3が、アミノ酸配列QQYXPXを含み、式中XがA、D、S、I、P、R、Y、H、N、G、TまたはLであり、XがA、D、S、I、P、R、Y、H、N、T、QまたはGであり、XがA、D、S、I、P、R、Y、H、N、T、L、WまたはFであり、XがA、D、S、I、P、R、Y、H、N、L、WまたはFである、請求項59に記載のライブラリー。
【請求項61】
CDR−L3領域が、接触によるCDR画定に従うと長さ9である、請求項58に記載のライブラリー。
【請求項62】
CDR−L3が、アミノ酸配列QQYXPPXを含み、式中XがA、D、S、I、P、R、Y、H、NまたはGであり、XがA、D、S、I、P、R、Y、H、N、TまたはGであり、XがA、D、S、I、P、R、Y、H、N、WまたはTであり、XがA、D、S、I、P、R、Y、H、N、W、LまたはTである、請求項61に記載のライブラリー。
【請求項63】
所与の正準構造に関連して選択されたCDRの画定により決定されるV1(λ)CDR−L1鎖長が、長さ7、9および10からなる群から選択される、請求項12に記載のライブラリー。
【請求項64】
λ−1 CDR−L1領域が、接触によるCDR画定に従うと長さ9である、請求項63に記載のライブラリー。
【請求項65】
CDR−L1が、アミノ酸配列IGXNXVXWYを含み、式中XがA、D、S、I、P、R、Y、H、N、TまたはGであり、XがA、D、S、I、P、R、Y、H、N、TまたはFであり、XがA、D、S、I、P、R、Y、HまたはNである、請求項64に記載のライブラリー。
【請求項66】
λ−2 CDR−L1領域が、接触によるCDR画定に従うと長さ10である、請求項63に記載のライブラリー。
【請求項67】
CDR−L1が、VGXYNYVSWYのアミノ酸配列を含み、式中XがA、D、S、I、P、R、Y、H、NまたはGである、請求項66に記載のライブラリー。
【請求項68】
λ−3 CDR−L1領域が、接触によるCDR画定に従うと長さ7である、請求項63に記載のライブラリー。
【請求項69】
CDR−L1が、アミノ酸配列XA/VXWYを含み、式中XがA、D、S、I、P、R、Y、H、N、KまたはTであり、XがA、D、S、I、P、R、Y、H、N、K、QまたはEであり、XがA、D、S、I、P、R、Y、H、NまたはFであり、XがA、D、S、I、P、R、Y、H、NまたはCである、請求項68に記載のライブラリー。
【請求項70】
所与の正準構造に関連して選択されたCDRの画定により決定されるVL(λ)CDR−L2の長さが、長さ10からなる群から選択される、請求項12に記載のライブラリー。
【請求項71】
λ−1 CDR−L2領域が、接触によるCDR画定に従うと長さ10である、請求項70に記載のライブラリー。
【請求項72】
CDR−L1が、アミノ酸配列LLIYXNN/SXRPを含み、式中XがA、D、S、I、P、R、Y、H、N、GまたはEであり、XがA、D、S、I、P、R、Y、H、N、QまたはKである、請求項71に記載のライブラリー。
【請求項73】
λ−2 CDR−L2領域が、接触によるCDR画定に従うと長さ10である、請求項70に記載のライブラリー。
【請求項74】
CDR−L1が、アミノ酸配列LM/IIYE/DVXRPを含み、式中XがA、D、S、I、P、R、Y、H、NまたはTであり、XがA、D、S、I、P、R、Y、H、NまたはKである、請求項73に記載のライブラリー。
【請求項75】
λ−3 CDR−L2領域が、接触によるCDR画定に従うと長さ10である、請求項70に記載のライブラリー。
【請求項76】
CDR−L1が、アミノ酸配列LVI/VYXDXRPを含み、式中XがA、D、S、I、P、R、Y、H、N、Q、E、KまたはGであり、XがA、D、S、I、P、R、Y、H、NまたはTであり、XがA、D、S、I、P、R、Y、H、N、KまたはEである、請求項75に記載のライブラリー。
【請求項77】
CDRの画定により決定されるVL(λ)CDR−L3鎖長が、長さ8、9、10および11からなる群から選択される、請求項12に記載のライブラリー。
【請求項78】
CDR−L3領域が、接触によるCDR画定に従うと長さ8である、請求項77に記載のライブラリー。
【請求項79】
CDR−L3が、アミノ酸配列QS/AWDXSXを含み、式中XがA、D、S、I、P、R、Y、H、NまたはGであり、XがA、D、S、I、P、R、Y、H、N、T、LまたはGであり、XがA、D、S、I、P、R、Y、H、N、V、W、QまたはLである、請求項78に記載のライブラリー。
【請求項80】
CDR−L3領域が、接触によるCDR画定に従うと長さ9である、請求項77に記載のライブラリー。
【請求項81】
CDR−L3が、アミノ酸配列QS/AYD/AXSXを含み、式中XがA、D、S、I、P、R、Y、H、N、GまたはTであり、XがA、D、S、I、P、R、Y、H、N、G、LまたはTであり、XがA、D、S、I、P、R、Y、H、N、TまたはLであり、XがA、D、S、I、P、R、Y、H、N、V、W、L、FまたはGである、請求項80に記載のライブラリー。
【請求項82】
CDR−L3領域が、接触によるCDR画定に従うと長さ10である、請求項77に記載のライブラリー。
【請求項83】
CDR−L3が、アミノ酸配列QS/AWDXSL/SXを含み、式中XがA、D、S、I、P、R、Y、H、N、TまたはGであり、XがA、D、S、I、P、R、Y、H、NまたはTであり、XがA、D、S、I、P、R、Y、H、N、G、LまたはVであり、XがA、D、S、I、P、R、Y、H、N、V、WまたはGである、請求項82に記載のライブラリー。
【請求項84】
CDR−L3領域が、接触によるCDR画定に従うと長さ11である、請求項77に記載のライブラリー。
【請求項85】
CDR−L3が、アミノ酸配列QS/AWDXSL/SXを含み、式中XがA、D、S、I、P、R、Y、H、NまたはGであり、XがA、D、S、I、P、R、Y、H、NまたはTであり、XがA、D、S、I、P、R、Y、H、NまたはLであり、XがA、D、S、I、P、R、Y、H、N、V、LまたはFであり、XがA、D、S、I、P、R、Y、H、N、V、WまたはGである、請求項84に記載のライブラリー。
【請求項86】
CDR領域が、約10%から約100%の閾値頻度で天然に出現するアミノ酸残基を含む、請求項1に記載のライブラリー。
【請求項87】
CDR領域は、CDR内の残基1個がLTM(look−through変異誘発)を用いて改変されている多様性を有する、請求項1に記載のライブラリー。
【請求項88】
CDR領域は、CDR内の複数の残基がWTM(walk−through変異誘発)を用いて改変されている多様性を有する、請求項1に記載のライブラリー。
【請求項89】
抗体結合領域が、天然体細胞変異に相当する1個または複数のアミノ酸置換を更に含む、請求項1に記載のライブラリー。
【請求項90】
発現ライブラリーである、請求項1に記載のライブラリー。
【請求項91】
請求項90に記載のライブラリー、ここで発現ライブラリーが、リボソームディスプレイライブラリー、ポリソームディスプレイライブラリー、ファージディスプレイライブラリー、細菌発現ライブラリー、および酵母ディスプレイライブラリーからなる群から選択される、ライブラリー。
【請求項92】
少なくとも約10、10、10、10、10、10、1010、1011、1012および1013からなる群から選択される抗体結合領域の多様性を含む、請求項1に記載のライブラリー。
【請求項93】
1個または複数のフレームワーク領域および1個または複数のCDR領域をコードし、予め決定されたポリヌクレオチドを合成することによって生成する、請求項1に記載のライブラリーであって、前記領域をコードする該ポリヌクレオチドは十分な重複配列を更に含み、それによりポリヌクレオチド配列が、ポリメラーゼ連鎖反応(PCR)条件下で、完全な抗体結合領域をコードするポリヌクレオチドに構築できるライブラリー。
【請求項94】
画定したCDR領域をコードする前記ポリヌクレオチドが、WTM(walk−through変異誘発)、拡張WTM、LTM(look−through変異誘発)、およびそれらの組合せからなる群から選択される変異誘発法を用いて変異誘発されている、請求項93に記載のライブラリー。
【請求項95】
次の規準:
i)各フレームワーク領域は、所定の抗原クラスに対する発現抗体において、ある閾値頻度以上で出現すること、および場合により、
ii)各フレームワーク領域は、生殖細胞系抗体配列において、ある閾値頻度以上で出現すること
に従って選択された、1個または複数のフレームワーク領域をコードするポリヌクレオチドを合成するステップと、所定の多様性を有する1個または複数の画定されたCDR領域をコードするポリヌクレオチドを合成するステップと、
を含む、請求項1に記載のライブラリーを生成する方法であって、前記領域をコードする該ポリヌクレオチドは十分な重複ポリヌクレオチド配列を更に含み、それによりポリヌクレオチド配列が、ポリメラーゼ連鎖反応(PCR)条件下で、完全な抗体結合領域をコードするポリヌクレオチドに構築できる方法。
【請求項96】
画定されたCDRの前記所定の多様性が、次の規準:
i)CDR領域の長さは、選択されたフレームワーク領域の生成した正準構造により決定されること、および
ii)CDR領域は、画定されたCDR領域内で天然に起こることが判明している閾値出現頻度で、アミノ酸残基の多様性を含むこと、
に従って設計される、請求項95に記載の方法。
【請求項97】
前記所定の多様性が、WTM(walk−through変異誘発)、拡張WTM、LTM(look−through変異誘発)、およびそれらの組合せからなる群から選択される変異誘発を用いて導入される、請求項96に記載の方法。
【請求項98】
請求項87に記載の発現ライブラリーを発現させることにより、抗体結合領域を産生するステップ、および
該抗体結合領域をスクリーニングすることにより、所望の結合親和性を有する抗体結合領域を選択するステップ
を含む、所望の結合親和性を有するポリペプチドを特定する方法。
【請求項99】
請求項98に記載の方法、
ここで前記スクリーニングが、抗体結合領域をコードするポリヌクレオチドと結び付いた状態で、該抗体結合領域を標的物質と接触させることを含む、方法。
【請求項100】
選択した抗体結合領域をコードするポリヌクレオチドを特定するステップを更に含む、請求項98に記載の方法。
【請求項101】
請求項99に記載の方法、
ここで前記ポリヌクレオチドが、ファージディスプレイ、細菌ディスプレイおよび酵母ディスプレイからなる群から選択される発現ディスプレイを用いて、抗体結合領域と結び付けられる、方法。
【請求項102】
請求項99または100に記載の方法により特定した抗体結合領域。
【請求項103】
1つまたは複数のステップがコンピュータ支援される請求項95または98に記載の方法。
【請求項104】
請求項103の方法の1つまたは複数のステップを実行するための指示を有する、電子装置での使用に適した媒体。
【請求項105】
請求項104の方法の1つまたは複数のステップを実行するための装置。
【請求項106】
a)図または表のいずれかに示した配列を有する1個または複数のフレームワーク領域、および
b)図または表のいずれかに示した配列を有する1個または複数のCDR領域
を含み、
ここでa)のフレームワーク領域およびb)のCDR領域が、所定の抗原クラスに対する抗体結合領域を共同で形成する、
抗体結合領域をコードするポリヌクレオチドのライブラリー。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12−1】
image rotate

【図12−2】
image rotate

【図12−3】
image rotate

【図12−4】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17−1】
image rotate

【図17−2】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22−1】
image rotate

【図22−2】
image rotate

【図23−1】
image rotate

【図23−2】
image rotate

【図24】
image rotate

【図25−1】
image rotate

【図25−2】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40】
image rotate

【図41】
image rotate

【図42】
image rotate

【図43】
image rotate

【図44】
image rotate

【図45】
image rotate

【図46】
image rotate

【図47】
image rotate

【図48】
image rotate

【図49】
image rotate

【図50】
image rotate

【図51】
image rotate


【公表番号】特表2008−536473(P2008−536473A)
【公表日】平成20年9月11日(2008.9.11)
【国際特許分類】
【出願番号】特願2007−520478(P2007−520478)
【出願日】平成17年7月6日(2005.7.6)
【国際出願番号】PCT/US2005/024002
【国際公開番号】WO2006/014498
【国際公開日】平成18年2月9日(2006.2.9)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
【出願人】(306048616)バイオレン,インク. (5)
【Fターム(参考)】