固定化捕捉プローブを用いる遺伝子発現分析法の最適化
【課題】固定化捕捉プローブを用いる遺伝子発現分析法の最適化を提供する。
【解決手段】プローブおよびターゲットの処理法(エンジニアリング)、ターゲット鎖およびプローブの固定化(グラフト)層の弾性的性質その他種々の要因によるプローブとターゲットの親和性定数Kの変化に関するアッセイ信号の解析を含む、試料中のオリゴヌクレオチドの多重化解析法、およびダイナミックレンジ圧縮、オンチップ信号増幅等のアッセイ信号強度調整、配列の高度の類似性を示すメッセージの存在量の定量的測定のためのハイブリダイゼーションおよび伸長を媒介とする検出法の組み合わせ、たとえばmRNAの3'末端付近に位置する未翻訳のAUリッチな部分配列群の相対的発現レベルの同時測定と分類、および単一のカラーラベルのみを必要とする減算的遺伝子示差発現分析の新規な方法。
【解決手段】プローブおよびターゲットの処理法(エンジニアリング)、ターゲット鎖およびプローブの固定化(グラフト)層の弾性的性質その他種々の要因によるプローブとターゲットの親和性定数Kの変化に関するアッセイ信号の解析を含む、試料中のオリゴヌクレオチドの多重化解析法、およびダイナミックレンジ圧縮、オンチップ信号増幅等のアッセイ信号強度調整、配列の高度の類似性を示すメッセージの存在量の定量的測定のためのハイブリダイゼーションおよび伸長を媒介とする検出法の組み合わせ、たとえばmRNAの3'末端付近に位置する未翻訳のAUリッチな部分配列群の相対的発現レベルの同時測定と分類、および単一のカラーラベルのみを必要とする減算的遺伝子示差発現分析の新規な方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、米国暫定出願No.60/515,611(2003年10月28日出願)および同No.60/544533(2004年2月14日出願)に対する優先権を主張する。
【0002】
政府の利害
本出願に含まれる研究の一部はDAPRA契約により実施されたものであり、したがって本出願の権利の一部はアメリカ合衆国政府機関に帰属する可能性がある。
【0003】
発明の背景
遺伝子発現分析:細胞周期の進行、細胞の分化、細胞死などの基本的な生物学的過程は遺伝子発現パターンの変化に関連し、したがって遺伝子発現パターンは分子レベルでこれらの過程を追跡する手段となり得る。遺伝子発現パターンは治療薬への曝露によって変化するため、新規な薬物の有効性の分子的指標として有用であり、薬物のターゲットの確認にも利用できる。現在遺伝子発現分析はターゲットの発見に関連してますます重要性を増しつつある。
【0004】
また遺伝子発現分析は多遺伝子的特徴の分析のための系統的・分子的アプローチをも提供する。植物の分子生物学および分子農業において、指定された遺伝子の発現パターンおよびその時間変化は、果樹・蔬菜類の成長または成熟速度のような性質の好ましい特徴を得るための品種改良「ブリーディング」に応用されることが多くなっている。
【0005】
発現レベルの変化は病原体の状況や進展をも示す。従って、機能的腫瘍抑制遺伝子の不十分な発現及び/又は腫瘍遺伝子又は癌原遺伝子の過度の発現は、様々な癌の発生及び進展に関係していることが知られている。炎症に対する免疫反応の初期段階に、又はHSV, CMVのような一般的ウイルスなどの病原体、或いは炭疽菌などの生物兵器への曝露があったとき、発現パターンが特徴的な変化を示す特定の遺伝子が同定されている。抗体のような蛋白質マーカーの発現とは対照的に、遺伝子発現は免疫応答の最初期に起こるので、早期かつ特定的な治療の可能性に道を開くものである。
【0006】
したがって、感染源への曝露或いは治療の後に、特定の遺伝子(メッセージ)の発現レベルとその時間変化を迅速に定量分析することは、疾病の分子診断の進歩のために極めて有望な方法である。しかし本発明において詳述するように、遺伝子発現の標準的な定量分析法では必ずしも高品質のデータが得られるとは限らない。また遺伝子発現分析、特に多重化発現追跡(multiplexed expression monitoring, 本明細書ではmEMと略される)が信頼性ある実用的な分子診断方法となるためには、プロトコルが単純であること、短時間で実施できること、遺伝子群の選択に柔軟性があること、交差反応の制御に信頼性があり特異性が保証できること、3〜4桁にわたるダイナミックレンジを通じてメッセージの存在量を定量評価しつつ必要な感度を発揮できること、使用に便利なことなどが要求される。
【0007】
現行の諸方法は一般にこれらの特性を備えていない。すなわち、遺伝子発現分析はターゲットの発見のための標準的手法とはなっているが、診断方法としての、特にターゲット混合物中でcDNAの発現レベルを対応するmRNAの発現レベルの尺度として定量測定する必要のある発現追跡の利用は限られている。これは、迅速で信頼性ある定量的多重化分子診断を保証する、柔軟性と信頼性を備えたアッセイ設計が欠如しているためである。
【0008】
空間的に符号化されたアレイ:in situ合成とスポッティング:
遺伝子発現分析は、一つの反応で複数の対象物質を同時に分析(多重化分析)できるような平行アッセイ法を用いて行えば、実用性が大いに改善される。しばしば行われる方法(たとえばU.Maskos, E.M. Southern, Nucleic Acids Res. 20, 1679-1684 (1992); S.P.A. Fodor et al., Science 251, 767-773 (1991)を参照)では、平面状の基板上に形成したオリゴヌクレオチドの捕捉プローブ(場合によってはcDNA分子)のアレイを用い、プローブ・ターゲット複合体の形成が可能な条件のもとで核酸試料を含む溶液をアレイに接触させる。溶液には特定の組織から抽出したmRNA或いはmRNAからの逆転写(RT)により形成したcDNAを含ませることができる。複合体の形成(ハイブリダイゼーション)が完了した後、未結合のターゲット分子を除去し、アレイの各位置について強度を記録する。これらの強度は捕捉されたターゲットの量を反映する。強度パターンを解析すれば試料中で発現したmRNAの存在量に関する情報が得られる。この多重化アッセイ法は分子医学や生物医学研究の分野で核酸や蛋白質の分析に次第に普及しつつある。
【0009】
柔軟性・再現性・信頼性の欠如:
しかしながら空間的に符号化されたプローブアレイは、指定された遺伝子群の発現の定量的分析には一般には不適当である。すなわち、オリゴヌクレオチドの光化学的in situ合成では、アレイを変更するために時間と費用がかかるため、十分な柔軟性を持つ開放的な試験方法とは言えない。このため、限定された遺伝子のみを用いればよい用途においては、プローブの選択に自由度のある「スポット」、又は印刷アレイが好まれる。しかし「スポッティング」には依然として技術的に困難な問題がある。これは一般に定量分析には不適当な、標準的な「ストリップ」法アッセイの問題とも類似している。すなわち被覆が一様でなく、また個々のスポット内での固定化プローブの配向やアクセシビリティが不確実であるため再現性が劣ることが大きな問題として残る。さらに「バックグラウンド」強度を抑止するために高価な共焦点レーザー走査装置が必要であり、またプローブの被覆の不均一性を考慮して、以後のデータ処理の早い段階から統計解析を行う必要がある。いま一つの問題点は、スポットアレイのフットプリントが比較的大きく、したがって試薬の所要量が大きいことである。最後に、大規模な診断に必要な量を賄うためのスケールアップは、たとえば本発明の好ましい実施態様において符号化微粒子の平面アレイの形で利用されるようなバッチ法に比べて複雑であり、経済的に不利である。
【0010】
アレイを用いる診断法の問題としては感度の不足のほかにも、コピー数が広範囲にわたる(細胞1個につき1〜2個から104個程度まで)発現遺伝子を検出する能力が限られていることが挙げられる。したがって検出感度を高め、交差反応の可能性を小さくし、コピー数の広いダイナミックレンジにわたる検出を可能にすることによりこれらの問題点を解決した、新しいアッセイ法が必要とされる。
【0011】
特異性の欠如:
先行技術における最も普通の方法は、複数個のターゲット配列の定量および識別のためにプローブとターゲットの多重化ハイブリダイゼーションを唯一の工程として使用するものであるが、ハイブリダイゼーションは多重化法においては特異性に欠ける場合がある(米国特許出願No.10/271,602, "Multiplexed Analysis of Polymorphic Loci by Concurrent Interrogation and Enzyme-Mediated Detection"(2002年10月15日出願)に示された論議を参照)。特異性を向上させるためにスポットアレイに長いプローブを使用した多重化ハイブリダイゼーションの方式も用いられている。たとえばAgilent, EP 127209には長さ10〜30、好ましくは約25のプローブが開示されており、これによってスポットしたプローブの捕捉配列のランダムな障害とアクセシビリティの制約を補償することは可能である。すなわち、スポットされたアレイにおいてプローブ・ターゲット複合体が形成される際には通常はプローブの長さ全体が関係することはなく、ランダムに接近できる部分配列のみが関係する。しかし本明細書で述べるように、固相においては長いプローブを使用することは有効ではなく、また特異性の欠如の問題は依然として残る。本明細書で述べるように、交差ハイブリダイゼーションは通常強度パターンが歪められ、したがってプライマーとプローブの設計を、たとえば同時に出願されている米国特許出願No.10/892,514, "Concurrent Optimization in Selection of Primer and Capture Probe Sets for Nuclear Acid Analysis"(2004年7月15日出願)の方法を用いて注意深く行い、非同族のプローブとターゲットの分子的相互作用を考慮して注意深く分析を行わないと、定量分析は不可能になる。
【0012】
遺伝子示差発現(「トランスクリプト・プロファイリング」):
これら標準的方法の問題点、および絶対発現レベルの定量測定における重大な不確実性や誤差の可能性を考慮して、実際上好まれる方法は示差発現分析である。この方法では、正常な組織または細胞と疾患その他の異常を持つ組織または細胞、或いは正常(「野生種」)植物と遺伝子組み換え植物における発現パターンの差を特徴づける。一般に行われている方法によれば、平板状の基板に一組のcDNAクローンを「スポット」してプローブアレイを形成し、正常および変異体起源のDNAを接触させる。起源の異なるDNAには異なった標識が施されており、プローブ・ターゲット複合体により形成されるパターンを2つのカラーチャンネルで記録することができるので、正常・変異両試料の発現比を求めることができる(たとえば米国特許No.6,110,426 (Stanford University)を参照)。2色蛍光検出のシステムは煩雑であり、スポットまたはその他の方法で符号化されたプローブアレイを読み取るために必要なレーザー走査装置を入念に較正する必要があり、また2つのカラーチャンネルを別個に走査しなければならない。このような難点は本発明に開示される減算法による示差発現分析により克服され、検出色は1色で済む。
【0013】
複雑なプロトコル:
一般的に行われている多重化発現プロファイリングの方法によれば、試料中のmRNA分子の逆転写により対応するcDNAを作成し、これをスポッティングまたはin situ合成により形成したオリゴヌクレオチドの捕捉プローブのアレイに接触させる。Lockhart et al.(米国特許No.6,410,229)は、cRNAを生成させるのにmRNAをcDNAに逆転写し、これを高率の標識(平均して8個中1個のdNTP)のもとでcRNAに転写し、第二の「修飾」段階を用いて合成オリゴヌクレオチドプローブのアレイで検出するという複雑なプロトコルを提示している。このように煩瑣で誤りが入りやすい、かつ高価なプロセスは方法を複雑にするばかりでなく、たとえば増幅の非線形性などによりメッセージ存在量の最終測定値の不確実性を著しく増大させることになる。
【0014】
先行技術において好まれる多重化発現分析の方法の一つは、ランダムに置かれた短い逆転写(RT)プライマーを用いて1組のRNAを不均一なcDNA集団に転換するか、または汎用RTプライマーをmRNAのpolyAテールに作用させて完全な長さのcDNAを得ることである。これらの方法では配列固有のRTプライマーを設計する必要はないが、いずれの方法も発現の定量的追跡のためには重大な欠点を有している。
【0015】
ランダムに置かれたRTプライマーを用いた場合、cDNAの代表的集団、すなわち各々のcDNAが等しい頻度で存在する集団が得られるのはmRNA分子の長さが無限大の極限においてのみである。指定された短いmRNAの組をランダムプライミングで分析すると、一般に混合物中のmRNAの各タイプに対して長さが大きく異なるcDNAが生成し、cDNA濃度の定量測定に大きな偏りが生ずる可能性がある。これは本明細書で述べるように、短いcDNAは長いcDNAよりも容易にアニールされ捕捉プローブに固定化されるためである。また全長にわたるRTに成功したとしても、完全な長さを持つcDNAはプローブとプライマーの間の交差反応を生ずる可能性のある配列部分を多く持つわけであるから、解釈は必然的に困難となり、信頼性が低下する結果になる。
【0016】
ターゲットとプローブの立体構造の役割:
溶液中のDNAは鎖のエントロピーで決まるポリマー特性を持つことが知られている(Larson et al.,”Hydrodynamics of a DNA molecule in a flow field”,Physical Review E 55:1794−97(1997)を参照)。特に単鎖DNA(ss)DNAは可撓性が大きく、そのことは実験的に興味のある条件のほとんどにおいて、持続長がヌクレオチド(nt)数個の程度にすぎないことに現れている。これは二本鎖DNAよりも相当に短い(Marko JF,Siggia ED:”Fluctuations and supercoiling of DNA”,22:625,506−508(1994))。したがって固定化プローブによるssDNAの捕捉では分子の立体構造の自由度に著しい制約が加わることになる。同時に、もし二本鎖が形成されれば、固相法による核酸分析では、侵入するターゲットの鎖に弾性変形で対応しなければならない。ターゲットとプローブの分子のポリマーとしての立体的位置関係の適合性については、核酸分析手法の設計においてこれまで十分な注意が払われてこなかった。
【0017】
以上の考察から、遺伝子発現分析(以下では多重化発現追跡(mEM)ともいう)の特に診断への応用に適した、柔軟性・迅速性・感度・特異性に優れた方法、組成物および試験プロトコルが望まれる。本発明は多重化発現追跡のためのそのような方法および組成物、特に迅速でカスタマイズ可能な多重化アッセイの設計のための方法および組成物ならびにプロトコル、好ましくはランダム符号化アレイによる検出を用いる複数分子の分析として実施されるプロトコルを開示するものである。平行出願において、信頼性をさらに向上させるための、望ましい転換プローブ(RTプライマーなど)および検出プローブ(たとえばハイブリダイゼーションにより媒介されるターゲットの捕捉のプローブ)の最適な組を選択する方法が開示されている(米国特許出願No.10/892,514 "Concurrent Optimization in Selection of Primer and Capture Probe Sets for Nucleic Acid Analysis"(2004年7月15日出願)を参照)。
【0018】
発明の要約
本明細書には、プローブおよびターゲットの処理法「エンジニアリング」、ターゲット鎖およびプローブの固定化(「グラフト」)層の弾性的性質その他種々の要因によるプローブとターゲットの親和性定数Kの変化に関するアッセイ信号の解析を含む、試料中のオリゴヌクレオチドの多重化解析法、およびダイナミックレンジ圧縮、オンチップ信号増幅等のアッセイ信号強度調整、配列の高度の類似性を示すメッセージの存在量の定量的測定のためのハイブリダイゼーションおよび伸長を媒介とする検出法の組み合わせ、たとえばmRNAの3'末端付近に位置する未翻訳のAUリッチな部分配列群の相対的発現レベルの同時測定と分類、および単一のカラーラベルのみを必要とする減算的遺伝子示差発現分析の新規な方法を開示する。
【0019】
さらに具体的には、下記に関する方法、設計および組成物を開示する:
【0020】
(i) プローブ・ターゲット間の親和性定数K(および対応するプローブとターゲットの「変性温度」)を変化させて、プローブ層の弾性的性質およびターゲットの拘束に関連するエントロピー効果を利用して検出感度を最適化すること:特に
− ターゲット(トランスクリプト)の長さと立体構造を制御すること;
− トランスクリプト内の捕捉部分配列の選択を制御すること、すなわちトランスクリプトの5'末端に隣接する部分配列を優先的に捕捉させること;
− 溶液中のターゲット濃度を制御すること;
− グラフトしたプローブ層の配置を制御すること;
− イオン強度とpHを制御し二重体の生成をプローブ・ターゲット領域に限定し、ターゲットの溶液中への再アニーリングを最小限にすること;
【0021】
(ii) 多重化遺伝子発現分析を実現するためのアッセイの最適な組成物を系統的に構成し、またそれから得られた強度パターンを解析すること;
【0022】
(iii) アッセイに関して下記の方法を確立すること:
− メッセージ在量の広いダイナミックレンジ(全反応容積10μlあたり約1〜10,000fmol)に対応するため、下記によってアッセイ信号強度のダイナミックレンジを調節すること;
− プローブ長さとターゲットの相互作用に応じてプローブ密度を制御することで、ターゲットの捕捉に影響する「充填」制約を制御すること;
− アレイの組成、すなわち結合部位の数を制御すること;
− トランスクリプトの長さ、トランスクリプトの存在量、標識密度を制御すること。
− 伸長を媒介とする配列固有の信号増幅により、感度を向上させること;
− ハイブリダイゼーションを媒介とする分析と、伸長を媒介とする分析とを組み合わせて高度に相同的な配列を検出することにより、特異性を向上させること;
− 単一の色を用いて「変異」および「正常」試料における特定遺伝子の発現レベルの差を検出できる減算法により示差発現分析を実施すること。
【0023】
検出の特異性を最適化するには、同時出願の米国特許出願No.10/892,514”Concurrent Optimization in Selection of Primer and Capture Probe Sets for Nucleic Acid Analysis”(2003年7月15日出願)(以下単に出願10/892,514ともいう)に述べられているように、プライマーとそれに対応するプローブを適切に選択することにより、多重化逆転写および検出の配列特異性を最適化する。
【0024】
これらの方法により感度と特異性を最適化すれば、指定された1組のmRNAをcDNAに逆転写し、対応するオリゴヌクレオチドプローブにそれらcDNAを捕捉して検出することにより、指定された1組の遺伝子の同時定量分析を迅速に行うことができる。この分析には本明細書に述べるような単純なプロトコルを用いることが好ましく、ターゲット増幅過程の省略によってプロトコルの単純化とアッセイの所要時間の短縮を図ることが好ましい。本明細書に述べる方法、プロトコルおよび設計は、平行多重化核酸分析、特に指定された1組の遺伝子の発現パターンの定量分析に極めて有用である。ここに指定された遺伝子の組は典型的には2〜100個、より典型的には10〜30個の異なるmRNA(「メッセージ」)を含み、この方法を以下多重化発現追跡(mEM)と呼ぶ。本明細書に述べる方法、プロトコルおよび設計は、米国特許出願No.10/204,799“Multianalyte molecular analysis using application−specific random particle arrays”(2002年8月23日出願)(本明細書を構成するものとして援用)に記載されたREADTM式多重化発現追跡と組み合わせて有利に用いることができる。
【0025】
種々の方法、設計および組成物の有用性と利点を以下に詳述する。下記は本発明の理解を助けるため本明細書に記載した図面の説明である。
【0026】
発明の詳細な説明
本明細書では、複数の核酸を対象とする、固定化オリゴヌクレオチドプローブへの捕捉による濃度(「存在量」)の決定方法、特に指定された遺伝子の組の発現レベルの同時(「多重化」)分析の信頼性を向上させるための系統的方法を含む、方法・プロトコル・設計を開示する。より特定的には、多重化遺伝子発現分析の感度、特定性およびダイナミックレンジを最適化する方法、更には単一の検出色のみを用いる減算法による示差発現分析を含むアッセイプロトコルを開示する。またターゲットと固定化プローブの相互作用の現象的記述を導入し、この過程を支配する親和性定数の実際の値を評価する。色で符号化した微粒子上の捕捉プローブの平面状アレイを形成する好ましい実施態様によれば、本明細書に記述するサイトカイン標準パネルの場合のようにターゲットの増幅を行う必要がなく、試料採取からデータ解析までの多重化発現分析を僅か3時間或いはそれ以下で行うことも可能である(図1及び図2)。本明細書ではこれらの方法および設計を、固定化オリゴヌクレオチドプローブによるターゲット核酸鎖の捕捉を含む種々の問題に適用する例によって説明する。
【0027】
I 感度とダイナミックレンジの最適化:プローブとターゲットの親和性の変更
I.1 ハイブリダイゼーション複合体(「二重体」)生成を支配する配列固有の親和性:
ハイブリダイゼーションによって媒介される2つのオリゴヌクレオチドの複合体の形成(「アニーリング」)の標準的な解析においては質量作用の法則を用いて、複合(結合)したプローブとターゲットの濃度c = [TP]と未複合(未結合、遊離)プローブの濃度(好ましくは符号化されたビード上の)p = [P]および未複合ターゲットの濃度t = [T]とを次のように関係づける:
[TP] = K[T][P]
または
c = Kpt
【0028】
「溶融温度」の計算の通常の方法と類比的に、現象論的な「直近」(“nearest neighbor”,NN)モデルを用いて、塩濃度、温度その他の与えられた実験条件のもとでのプローブ・ターゲット複合体内の隣接塩基対間の相互作用を表現し、(配列固有の)親和性定数を計算する。二重体生成の自由エネルギー(「結合エネルギー」、「凝縮エネルギー」とも呼ぶ)は次のように計算される。
ΔGC=ΔGNucleation+ΣiεNN−Pairs(ΔHi+TΔSi)
ここにΔHiとΔSiはそれぞれエンタルピー、エントロピーを示す。条件ΔGC=0から、二重体の安定度を評価するのに広く用いられている「溶融温度」TMが求められる。
【0029】
標準的な熱力学に従い、(配列固有の)親和性定数KSSは次式から計算される。
KSS=K0exp(−ΔGC/kT)
ここにK0は定数、kはBoltzmann定数である。
【0030】
親和性定数およびプローブとターゲットの初期濃度[P]0, [T]0が与えられれば、プローブ・ターゲット複合体の平衡濃度[TP]をターゲットの初期濃度[T]0の関数として表すことができる。
【0031】
この標準モデルを用いて、温度55℃、塩濃度2Mで、15ntから35ntの長さの異なる175ntのターゲットDNAと7種のDNAオリゴヌクレオチドプローブの複合体の溶融温度と親和性定数を計算した。ターゲットおよびプローブの配列は表I−1に示すとおりである。
【0032】
表I-1
【0033】
溶融温度と親和性定数の計算値を表I−2に示す。長いプローブに対して親和性定数が極めて大きいことは、長いプローブの方がターゲットの検出感度が高いことを予測させる。たとえば複数分子の分析のREAD法に従って色で符号化した直径3.2μmの微小球(「ビード」)を用い、ビードあたりのプローブの数を[P]0=105とすると、質量作用の法則により、21量体プローブによるターゲットの検出限界が次のように計算される。
[T]min=[PT]min/K[P]0=[PT]min/1.7×1010/M×105;
ここに[PT]minは確実に検出されるために必要なプローブ・ターゲット複合体のビード当たり最小数であり、[PT]min=103に対して
が得られる。この値は細胞1個あたりコピー1個のメッセージ存在量に相当する。
【0034】
表I-2
【0035】
I.2 ターゲットとプローブの立体構造の役割:アッセイ設計に対する意味
後述するように、ターゲットの大きさと立体構造、基板に固定化されたプローブの大きさ、立体構造、配置はプローブとターゲットの相互作用に大きく影響し、NNモデルから予測されたプローブとターゲットの親和性と実際の親和性との間に大きな乖離を生ずる原因となる。
【0036】
分析対象であるターゲットを固定化プローブに捕捉する際の立体構造の妨害的な作用(「立体障害」)、特に、プローブ接近性の重要性は周知である。たとえばGuisan,J.M.in “Immobilization of Enzymes and Cells”,Gordon F.Bickerstaff,Humana Press,Totowa,NJ,p.261−275(1997)を参照されたい。このため捕捉効率を高めるための経験的な方法として、好ましい長さのスペーサーを導入してプローブの「充填」に関連する制約を軽減することが提案されている。たとえばSouthern E.et al.,Nat.Genet.(suppl.)21,5−9(1999)を参照されたい。しかし本発明の方法は既知の方法と異なり、プローブとターゲットの相互作用を最適化する系統的な設計過程の基礎として、ターゲットとプローブ層各々の性質の間に基本的な関連を確立するものである。二重体形成の際にターゲットまたはその一部のプローブ層への進入を容易にするためには、プローブ層の圧縮率を最大にする必要があることが見出された。より一般的には、本発明の設計基準は基板に固定化したプローブの長さ、グラフト密度、静電荷、ターゲットの長さと立体構造、ターゲットの5’末端に対する捕捉部分配列の位置が捕捉効率、ひいてはアッセイ信号に及ぼす影響の本性と大きさを反映している。逆に、ターゲットの存在量を正確に決定するため、プローブとターゲットの相互作用を支配する再規格化定数を決定するための方法も開示する。
【0037】
本明細書では、プローブとターゲットの捕捉効率を変化させ、アッセイの感度・特異性・ダイナミックレンジを最適化するための、固定化捕捉プローブの大きさ・立体構造・配置およびターゲットの大きさ・立体構造の選択(捕捉部分配列の選択、アレイ組成およびプロトコルの選択を含む)に関する方法、設計、設計規則を開示する。
【0038】
設計基準を確立するため、基板に固定化されたプローブの長さ・グラフト密度・電荷、およびターゲットないしターゲットの指定された部分配列の大きさと立体構造が捕捉効率、したがってアッセイ信号に及ぼす影響の本性と大きさを開示する。これに関連する実験は、複数の分子の分析のためのランダム符号化アレイ検出(READ(登録商標))法に従って実施した。すなわちプローブを色で符号化したポリマー微粒子(「ビード」)に付着させ、ビードを平面状アレイとしてシリコンチップ上に配置した。米国特許出願No.10/204,799 "Multianalyte molecular analysis using application-specific random particle arrays"(2002年8月23日出願)(本明細書を構成するものとして援用)を参照されたい。プローブは5'末端への共有結合によってビードに末端グラフトすることが好ましい。合成によるモデルDNAターゲットおよび1200 ntのカナマイシンmRNA (Promega)の逆転写により生成させたモデルcDNAを用いた実験の解析から、ターゲットと固定化プローブとの相互作用において、そのような比較的短いターゲット鎖の場合も、ターゲットとプローブの立体構造が決定的な役割を演ずることが確認される。
【0039】
I.2.1 合成モデルターゲット:
長さ25〜175 ntの合成DNAターゲットの広い濃度範囲、および長さ15〜35 ntの捕捉プローブに対して結合等温線を作成した(表I-1および実施例Iを参照)。
【0040】
ターゲット長さの効果:
プローブとターゲットの捕捉効率に対するターゲット鎖の長さの影響を調べるため、長さ25nt,40nt,90nt,175ntで共通の部分配列を含む4つの合成DNAターゲット(表I−1参照)の末端を蛍光標識し、READ法に従って平面状アレイに配列した、色で符号化した直径3.2μmのビード上の19ntの捕捉プローブとハイブリダイズさせた。代表的な結合曲線から、ターゲット長さLの影響が大きいことが知られる。図3Aに示すように、飽和以下のいずれのターゲット濃度においても、ターゲットが長いほど得られる信号強度は小さくなる。ここで信号強度は各曲線について、飽和時の値を用いて規格化されている。
【0041】
親和性定数K*および利用可能な捕捉プローブの数密度[P]0 = p0のの実験的推定値は各プロファイルを質量作用の法則にあてはめて求められ、その結果は図3Bに示すとおりである。親和性を計算するため、ここでは信号強度Iをビード1個に捕捉されたターゲットの数cとターゲット1個あたりの蛍光発色団の数nFの積に比例する(I 〜nFc)ものと仮定した。Iとcの換算は実施例IIにおいて表I-3および図4に関連して述べる較正曲線を用いれば容易に行える。親和性定数の典型的な実測値はターゲットとプローブの長さがほぼ等しいときK* = 108/M程度であり、NNモデルで予測される値より1桁小さい(表I-2)。飽和時の占有部位の数p0の典型的な値はビード1個あたり105程度である。
【0042】
遺伝子発現分析において典型的な実験条件のもとでは、ターゲットの大きさはプローブの大きさを上回り、捕捉された各ターゲットはプローブ1個分より大きい空間を占める。したがって飽和は有限な表面積A0を持つビードに対するターゲットの数の限界NTSatを反映する。ビード表面が捕捉されたターゲットで修飾され、ターゲットが「緩んだ」立体構造をとり、ターゲットの特性的寸法が、回転半径RG,T〜aLν、ここで、νは特性指数を示し、理想的な鎖に対してはν=1/2、3次元で良好な溶媒内での自己排除的な鎖に対してはν=3/5、で決まるものと仮定すると、より小さいNTSatの値が得られ(deGennes,“Scaling Concepts in Polymer Physics”,Cornell University Press,1979)、最小のターゲットに対してはNTSat〜A0/RG,T2或いはNTSat〜1/Lである。p0をビード上に捕捉されたターゲットの飽和時の数NTSatと同一視すれば、最小のターゲット(L=25nt)に対して平均分子面積はAT〜4π(1.6μm)2/8*105〜4*103Å2となる。この値は(実験的)推定値
を用いて得られるATRelaxed〜πRG,T2〜6.5*103Å2に近い(Tinland et al,Macromolecules 30,5763(1997))。175ntのターゲットについて同様の比較を行うと
となる。これらの比較から、大きいターゲット分子の立体構造は緩んだ状態でなく、よりコンパクトな構造をとること、或いはターゲット分子が相互に孤立しておらず「重複」、所謂、相互進入していることが推測される。
【0043】
一定のターゲット濃度においては、信号強度のターゲット長さLへの依存性は1/Lxの形となる(図5)。ターゲット長さがL=25ntからL=175ntの範囲で、また各長さにおいてターゲット濃度が3桁(0.1nMから100nM)の範囲で変化するとき
である。19ntのプローブにはすべてのターゲットが同じ19ntの部分配列を介してハイブリダイズし(表I−1)、したがって二重体形成の「凝縮」エネルギーは同一であるにも関わらず、ターゲットの長さが増大すると信号強度が顕著に低下する。したがって捕捉プローブの長さが与えられたとき、ターゲットが長いほど二重体形成に不利であり、有効親和性は小さくなる。
【0044】
プローブとターゲットのハイブリダイゼーションを支配する有効親和力が冪乗則に従うことは、特定のターゲット鎖の長さに従って捕捉効率を調節する手段を提供する。このことは発現分析のような分野で、配列固有の逆転写(RT)プライマーを用いてcDNAの長さを制御できるため特に有用な設計基準となる。後に詳述するように、希なメッセージが短いcDNAに転換されることが、捕捉効率を最大化する上で好ましい。
【0045】
プローブ長さの効果:
図3に19ntのプローブについて示したような結合曲線を、長さ15nt〜35ntの一群の捕捉プローブに対して作成した。図6A、6Bには175tのターゲットに対する結合曲線を、質量作用の法則へのあてはめと共に示す。ここで上記のようにI〜nFc(nFは分子あたりの蛍光標識の(平均)数)と仮定している。この組から、あてはめによって親和性定数として
が得られ、これはNNモデルから予測される値の約1/20である(表I−2参照)。ターゲットの長さを25nt,90nt,175ntにそれぞれ固定したときの信号強度とプローブ長さとの関係を図7A〜7Cに示す。予想されるとおり強度プロファイルは、NNモデルから予測される値よりは小さいが、短いプローブに対するほど高くなる。しかしながら4点のターゲット長さすべてに対して、プローブ長さ約30ntでプロファイルはピークに達するか、または飽和する。これはNNモデルでは全く予想されない効果であり、後述するように、ターゲットが固定化プローブに捕捉されるためには、接近するターゲット鎖のみならず捕捉プローブ層にも弾性変形が起こらなければならないことを示唆するものである。
【0046】
I.2.2 カナマイシンmRNA:トランスクリプトの長さと捕捉配列の位置の選択
更に、合成ターゲットの場合のように、逆転写で得られたcDNA(以下「トランスクリプト」とも呼ぶ)の長さLを減少させると、同じmRNA濃度から得られた長いトランスクリプトに比べてアッセイ信号強度が系統的かつ顕著に増大することが示される。1200 ntのカナマイシンmRNA (Promega)について後述するように、適切な逆転写プライマーを選択することにより長さが約1000 ntから約50 ntにわたる種々のcDNAが生成する(実施例III)。cDNAの5'末端付近に捕捉部分配列を置くと更に信号が強化される。したがって捕捉プローブは望ましい形として、トランスクリプトの5'末端に近接した部分配列に適合するように設計した(図8A)。いずれの強化効果もターゲットと固定化プローブとの相互作用を支配する自由エネルギーに立体構造が大きく寄与していることを示すものである。これらの効果の結果として、配列に依存する親和性Kssは有効親和性K*(L) < Kssまで減少する。このことは固定化捕捉プローブおよびトランスクリプトの設計に対して、特に基板表面の利用可能な面積のうち吸着されたターゲットの占める部分の比率がある特性値γ* = c*/cmaxを超えるとき、重要な意味を持つ。
【0047】
複数プライマー・複数プローブ(mpmp)逆転写プロトコル:
いくつかの場合に、1つのmRNAテンプレートから複数のcDNAトランスクリプトを作成する可能性を考慮して複数の逆転写プライマーを使用した(図8A)。この過程ではmRNAの3'末端付近に位置する第1の逆転写プライマー含む短いcDNAが、mRNAの3'末端からより遠くにある第2の逆転写プライマーを含むより長いcDNAトランスクリプトで置換される。各cDNAに対して1つ以上の捕捉プローブ(この場合19 nt)が供給されるようにした(実施例IV)。多重化発現追跡のための実施態様においては、たとえば図9に示した形のREAD法を使用する。
【0048】
1.2.2A トランスクリプトの長さ縮小の効果:
I.2.1項に述べたモデル化合物のタイトレーションの結果から、トランスクリプトの長さを縮小することにより実際にアッセイ信号が顕著に強化されることが確認された。
【0049】
種々の初期濃度のカナマイシンのmRNAについてmpmp逆転写設計およびアッセイプロトコルにより行った一連の逆転写反応(実施例IV)により図8Bに支援すタイトレーション曲線が得られた。150 ntと1000 のトランスクリプトに対する信号を比較すると、蛍光発色団の数nFが1000 ntのトランスクリプトの方が多いにも関わらず、信号強度は36 nMから560 pMに至るmRNA濃度のいずれにおいても150 ntの方が高い。
【0050】
たとえばターゲット濃度1.13nMに対してはI150nt/I1000nt〜3である。移行濃度(図10Aに見られる屈曲点を参照)付近などで見られる約3倍の感度増加は、トランスクリプトの長さLを縮小したときに予想される強化効果と一致している。すなわちLを1000ntから150ntに減少させたときの感度増加はおよそ(1000/150)x(3/15)である。第1の因子はモデルターゲットについてI.2.1項に述べた(そこでは
であった)長さの縮小に対応し、第2の因子は、選ばれた線形標識密度において150量体のnF(150nt)〜3であり、nF(1000nt)〜15であることを反映している。x=3/2とするとこの強化効果は〜3.5となり、実験値と一致する。
【0051】
同様に、トランスクリプトの長さを1000 ntから50 ntに縮小すると約(1000/50)3/2(1/15) 〜6倍の強化効果がある。第1の因子は長さの縮小に関係し(x = 3/2とする)、第2の因子は、選ばれた標識密度において、50量体が平均1個の標識しか含んでいないことを反映している。
【0052】
直線化吸着等温線の表現:
タイトレーション曲線を直線化吸着等温線の形で表現すれば更に洞察を深めることができる。この表現は質量作用の法則から直接得られる。反応 P(プローブ)+ T(ターゲット)<−> C(プローブ・ターゲット複合体)に対する質量作用の法則は c = Kpt と書くことができる。ここにc, p, tはそれぞれの濃度、Kは親和性定数である。p = c - p0, t = c - t0(p0, t0はそれぞれプローブとターゲットの初期濃度)と置くと、c = K(c - p0)(p - t0) となり、ここに述べる実験のようにc << t0 であればc = K(p0 - c)t0或いはc = p0 - c/Kt0となる。タイトレーションの結果をこの形で表現すると(前記と同じくIはcに比例する、すなわちI 〜nFcと仮定する。nFはトランスクリプトあたりの蛍光発色団の数を示す)、cとc/Kt0との直線関係が明瞭になり、切片からp0が、勾配からKが求められる。特に、本文に述べたとおり、勾配の急激な変化は領域の移行を示す。
【0053】
図10Aは1000 ntと150 ntのトランスクリプトに対するタイトレーションの結果をこの形で示したものである。50 ntのトランスクリプトについて同様に得た等温線も共に示してある。3本の曲線のいずれも勾配の緩い、したがって親和性定数の大きい希釈領域から、勾配の急な、したがって親和性定数の小さい濃縮領域への移行を示している。希釈領域の勾配は3つのトランスクリプトを通じてほぼ一定であり、したがって対応する親和力係数もほぼ同一である。これに対して勾配、したがって有効親和性定数は濃縮領域ではトランスクリプトの長さによって異なる(表I-4参照)。
【0054】
表I-4
【0055】
表I-4に示すように、移行点(すべてのトランスクリプトにおいて濃度t0 = 1 nM前後で生ずる)において親和性定数は、1000 ntのトランスクリプトでは約1/20、150 ntおよび50 ntのトランスクリプトでは約1/2に低下する。すなわちトランスクリプトが短いほど有効親和性定数の減少幅は小さい。希釈領域では50 ntのトランスクリプトの吸着等温線の勾配は150 ntのトランスクリプトのそれの約 1/2.5であり、したがって前者の親和性定数がそれに応じて高いことが示されている。
【0056】
移行は以下の議論で示されるように被覆率 θ の小さいところで起こる。直線化吸着等温線を通常のLangmuir等温線1/(1 + 1/Kt0) = c/p0に変換すると、占有されたプローブの被覆率c/p0 = θ が知られる。これは後述のとおり正確には、t0における占有されたプローブの数と飽和点におけるそれとの比である。具体的にはたとえば図10Aの例で、濃縮領域から移行領域への外挿によりKt0 << 1、したがって1/Kt0 = p0/cである。上に求めた濃縮領域の有効親和性定数の値を用いると、移行点における占有された部位の分率 θ* = c*/p0は150 ntおよび1000 ntのトランスクリプトに対して約0.2となる。すなわち大きいトランスクリプトはビード上のプローブの利用できる部位の占有率が20%に達すると相互作用を始める。
【0057】
図11はc*とトランスクリプトの長さとの関係c〜1/Lyを示す。限られたものではあるが利用できるデータから
と推定される。この曲線は希釈領域(線より下)と濃縮領域(線より上)との境界を表している。一般に、希なメッセージの捕捉効率、したがって検出感度を高めるには、大きい有効親和性定数を利用するため希釈領域で作業するのが有利である。この利点はターゲットが長いときは特に著しい。ターゲットは検出を容易にするため複数個の箇所に、たとえば本明細書に示すように逆転写中に標識dNTPを導入することにより、標識を施すことが望ましい。反対に、実験的に記録された信号強度の解析に際しては、長さの異なるcDNAは存在量が等しくても一般に大きく異なった信号強度を生ずる可能性があることを考慮しなければならない。すなわちメッセージの存在量の決定の信頼性を確保するには、有効親和性定数を用いて溶液濃度を評価しなければならない。
【0058】
I.2.2B 捕捉プローブ位置の効果:末端捕捉配列:
本明細書にはまた、捕捉部分配列を長いトランスクリプトの5’末端付近に置くことによって、捕捉効率、したがってアッセイ信号および感度を支配する有効親和性が増大することを開示する。このことは1200ntのカナマイシンmRNAについて、逆転写プライマーならびに内部および末端プローブのアラインメントを示す図12Aに表されている。図12Bは500ntのトランスクリプトを2つの異なった(組の)19量体プローブに捕捉した場合のタイトレーションの結果を比較したもので、プローブの一方はトランスクリプトの5’末端付近の部分配列に、他方はトランスクリプト内部の部分配列にそれぞれ適合するものである。「末端」捕捉プローブを用いたときは「内部」プローブに比べて約1.5倍のアッセイ信号強度が記録されている。これらの結果を吸着等温線の形に変換すれば(図13)、捕捉部分配列をトランスクリプトの5’末端付近にとることが、長さを縮小した場合と類似の効果を持つことがわかる。このことは、末端部分配列を捕捉する際にはプローブ層もターゲットも立体構造の変化が少なくてすみ、したがって後述のように鎖のエントロピーに由来される反発効果が少ない点で、短いターゲットを使用するのと等価であるとの見方を支持するものである。
【0059】
以上に開示した結果が示すように、メッセージの存在量を定量的に決定するには、ターゲットと固定化プローブの相互作用を支配する有効親和性の注意深い解析が必要である。
【0060】
I.3 経験的な設計ルール:
「診断」のための発現プロファイリングにおいて検出すべきトランスクリプトの配列をアプリオリに知ることができれば、ターゲットの特定の配列に適合する捕捉プローブの設計が可能になり、好ましくは末端捕捉プローブを選択することによる感度の向上、c*以上または以下の作業領域を選択することによるダイナミックレンジの調節、および特異性の最適化を図ることができる。その方法および設計の詳細は米国特許出願No.10/892,514に詳述されている。
【0061】
下記の経験的設計ルールはプローブとターゲットの相互作用を最適化するのに有用である。これらのルールはまた第II章に述べるように信号強度パターンの解析において必要な補正を示すものである。
【0062】
1 ターゲットの長さを最小とすること
固定化プローブへのターゲットのハイブリダイゼーションを支配する有効親和性定数K* = K*(L)を最大化するため、ターゲットの長さLを最小化する。
【0063】
2 捕捉部分配列を5'末端付近に置くこと
与えられたターゲット長さに対して、指定された捕捉部分配列をできるだけターゲットの5'末端に近く置く。
【0064】
3 作業領域として希釈または濃縮領域のいずれかを選択すること
特定のターゲットと固定化プローブとの相互作用を支配する有効親和性定数K*を制御するために、希釈領域で大きいK*を実現するか、濃縮領域で小さいK*を実現するかを選択する。
【0065】
系:信号のダイナミックレンジを圧縮すること
存在量の大きいメッセージに対してはK*を小さくするため長いトランスクリプトを作成し、存在量の小さいメッセージに対してはK*を大きくするため短いトランスクリプトを作成することにより、与えられたメッセージ存在量の範囲に対応する信号強度の範囲を圧縮する。
【0066】
4 定量分析のためグラフト密度を調節すること
ターゲット濃度の定量分析を行うため、捕捉プローブの長さを、与えられたプローブのグラフト密度に対する最大値以内に限定し、或いはグラフト密度を所望のプローブ長さに対して飽和を避ける限度内に限定する。
【0067】
5 感度を最大化するため層の立体構造を調節すること
グラフト密度 σ を、ターゲットの進入速度を実質的に低下させない限りで最大化する。ただし σ を飽和時のターゲットあたりプローブ数の予め定められた小さい倍数に限定する。
【0068】
6 二重体の生成を制限すること(下記参照)
ターゲット・ターゲット二重体の生成を最小限とするように、バルクのイオン強度(および可能ならば pH)を、プローブ層内で著しく小さくならない限度内で調節する。
【0069】
これらの経験的ルールは、次章で述べる現象論的モデルに基づいて更に精密化することができる。
【0070】
II 固定化プローブ層へのターゲット捕捉のモデル
II.1 一般的記述
第I章に述べた観察結果を説明し、設計ルールを精密化して、最適なプローブ層とターゲットの立体構造を選択するための体系的な設計方法を確立するため、本発明においては一本鎖DNA(ss)DNAまたはRNAターゲットが、予め指定された「捕捉部分配列」に相補的な末端グラフトプローブ層に捕捉される過程の現象論的モデルを開示する。具体的にはこのモデルは、捕捉プローブと指定されたターゲットの部分配列との二重体の形成を、ターゲットの一部がプローブ層内に侵入することを要する吸着過程と見なす。その過程にはプローブ層の弾性変形、およびターゲット(の一部)の空間的限定(配置エントロピーの減少を伴う)が含まれる。このようにこのモデルでは固定化プローブとターゲットの複合体の形成を、プローブの「単分子層」が末端グラフトによってプローブとターゲットの「二重層」に変化する、グラフトの過程と見なす。
【0071】
多価電解質ブラシ:
一つの見方として、ここに示すモデルは変形可能な基板への多価電解質の吸着過程に類似するものである。この基板は多価電解質「ブラシ」、或いはある条件のもとでは末端グラフトされたポリマー「ブラシ」の特徴を持つ(図14、Pincus,Macromolecules 24,2912−2919(1991)(本明細書を構成するものとして援用)、またFleer et al.,Sec.4 in:”Polymers at Interfaces”,Chapman Hall,1993を参照)。面密度σの末端グラフトされたプローブ層において、隣接プローブ間の特性距離d(σ〜d−2)と、各プローブの緩んだ、或いは拡張した(「マッシュルーム型」)構造の特性寸法ξ⊥とは相互に関係づけられ、ξ⊥<<dである限りは各マッシュルームの立体構造は隣接するマッシュルームの影響を受けないが、プローブ鎖が重なるようになると「マッシュルーム」構造は拘束を受け、プローブは、次第に「伸長」構造を採用し、これによって、プローブ層は鎖の末端が自由表面を向いた「ブラシ」状の形をとる(Fleer et al.,op.cit.;Milner,Witten&Cates,Macromolecules 21,2610−2619(1988))。
【0072】
後述のように固定化オリゴヌクレオチドプローブ層内には高い電荷密度が出現しているため、様々な外部条件での作業が可能であり、したがってプローブ層の立体構造にも種々の可能性がある。これらは主としてプローブのグラフト密度 σ および有効電荷線密度f (0 < f < 1)によって決まり、溶液の条件、特にpH、温度および塩濃度CSへの応答として生ずる層内のプローブの解離度 α を反映する。
【0073】
たとえば溶液反応
の解離度をkとすると、αBulk:=[A−]/[AH]をkと[H+]で表してαBulk=1/{1+[H+]/k}と書ける。一般に[H+]>[H+]Bulk,α<αBulkであり、f=f(α)、より正確にはf=f(k,CBulkS)である。バルク溶液中の塩濃度CBulkSが低いときは、電気的中性を保つために対イオンがブラシ内部に保持され、そのため混合エントロピーが減少する。対応して働く浸透圧のため、鎖はグラフト密度の如何に関わらず完全に伸びると考えられる。逆にバルクの塩濃度が十分高ければ過剰な可動共イオンおよび対イオンがブラシに進入し、ブラシ内の静電的相互作用を遮蔽する。また捕捉された対イオンに対する浸透圧が低下するため鎖の緩んだ立体構造の出現(およびそれに対応する層の厚さの減少)が予想される。通常のハイブリダイゼーション実験でしばしば現れる高い塩濃度(約100mM〜2M)のもとでは、立体構造が崩壊し、対イオンが層全体に分布せず固定化されたプローブ鎖(またはプローブ・ターゲット二重体)に結合した状態となる。
【0074】
短い両親媒性分子の界面膜:
別の見方としてこのモデルは、空気-水界面または油-水界面に吸着された、燐脂質、界面活性剤、或いはある種のペプチドのような両親媒性分子の単分子膜(「Langmuir膜」)に蛋白質などの溶質が吸着される過程に類似している。このような膜に溶質分子を挿入するには膜が局所的に圧縮されなければならず、この圧縮は横方向の圧縮の場合と同様に鎖の充填状態と立体構造の変化を伴う。配向と立体構造の自由度の相互作用は、グラフト密度の関数として種々の相を生ずるが、現在の目的のために関心が持たれるのは横方向の圧縮率の高い共存領域である。以下の議論では高分子理論の用語を用いるが、界面に吸着された両親媒性分子の膜(「Langmuir膜」)の既知の相的挙動に依拠して、短いプローブ鎖に対して可能ないかなる拡張或いは精密化も本明細書の範囲内に属する。
【0075】
現象論的モデルは、ターゲットとプローブが二重体を形成するために必要な、ターゲットおよびプローブ層の立体構造の変形によって生ずる弾性的効果の重要な役割を、特にターゲットとプローブのいずれかが固定化されている場合について明らかにしようとするものである。更に、固定化プローブ層にターゲットを細くするための最適の作業方式を述べる経験的設計ルールの精密化、およびアッセイプロトコルの完成の基礎を与えるものでもある。そのようなプロトコルは、たとえば以下に信号増幅に関連して述べるように、ターゲットに媒介されポリメラーゼによって触媒されるプローブの伸長を要する場合があり、そのためにはプローブ層に酵素その他の成分を更に進入させなければならない。
【0076】
II.1.1 プローブ層の変形とターゲットの拘束:親和性定数の再規格化
末端グラフトされたプローブの層にターゲット(の一部)が進入すると、局所的にセグメント濃度が増加し、それに応じて浸透圧が発生する。さらにターゲットの進入によって層の弾性変形が生ずるが、これは図14に示すように鎖の伸長(「伸縮」)によって媒介される。浸透圧と鎖の伸長による弾性的エネルギーは進入するターゲットに対する反発力として働き、二重体生成の自由エネルギーに反発力の項GPを生じさせる。コロイド懸濁液のエントロピー的安定化に寄与するのはこの反発自由エネルギーであるが、グラフト層の最適な立体構造はそれに接触するコロイド粒子の上で鎖の相互浸透を最小にするようなものであり、ここで目的とする捕捉プローブ層の立体構造の最適化はターゲット鎖の層内への進入を容易にすることである。
【0077】
グラフト密度が極めて低い場合、たとえばd〜σ−1/2>>RG,Tの極限では、孤立したプローブが緩んだ立体構造(マッシュルーム型)をとっており、その大きさはRG,P〜aPν,ν=3/5であり、ターゲットの捕捉が進行する際に鎖の局所的な「充填」による制約を受けることはない。しかし捕捉されるターゲットの最大数は少なく、したがってアッセイ信号は弱い。反対にグラフト密度が高くd〜σ−1/2<ξT<<RG,Tであれば、特に鎖が完全に伸長する条件のもとでは、利用し得る捕捉プローブの数は多くなるが、層の横方向の圧縮率は低く、ターゲットは十分に捕捉されずアッセイ信号は弱くなる。ここにξTは部分的に伸長したターゲットの特性を示す「液滴」の大きさである。したがって固定化プローブ層によるターゲットの捕捉を最適化するには、圧縮率を実質的に減少させない限りで単位面積あたりのプローブ数を最大にする必要がある。たとえば与えられたターゲットの大きさTの部分が二重体形成に関与するものとすれば、大きさTの合成ターゲットを用い、外部条件を一定として、捕捉されたターゲットの分率を反映するアッセイ信号をグラフト密度の関数として求め、得られた曲線でピークまたはプラトーの出現位置を決めれば、最適のグラフト密度が求められる。例えば、可撓性の「バックボーン」に「間接的に」プローブを付着させ、これを更に固相に付着させる間接固定法も拘束を緩和するのに利用できる。米国特許出願No.10/947,095“Surface Immobilized Polyelectrolyte with Multiple Functional Groups Capable of Covalent Bonding to Biomolecules”(2004年9月22日出願)(本明細書を構成するものとして援用)を参照されたい。
【0078】
ターゲットまたはターゲットの一部は、捕捉配列との接触のため、プローブ層または既に形成されているプローブ・ターゲット複合層の局所的立体構造に適合しなければならない(図10B、図10C、図15参照)。これによるターゲット鎖への拘束、およびそれに対応する配置エントロピーの減少(希釈領域でも起こる)は二重体生成の自由エネルギーに反発力の項GTを生じさせる。ssDNAまたはRNAに加えられる拘束の程度は、溶液中の条件のもとでこれらの多価電解質がとる拘束のない(緩んだ)立体構造に依存し、配列固有の相互作用(折り畳み)を考慮しないとしてもなお複雑な挙動が予想される(たとえばSchiessel&Pincus,Macromolecules 31,7953−7959(1998)を参照)。具体例を挙げれば、ターゲットの長さT、大きさRG,T〜aTν,ν=3/5(ガウス的コイル構造を仮定)の部分が局所的グラフト密度σのプローブ層に進入する場合、ターゲットの変形の弾性エネルギーGT〜(RG,T/σ−1/2)2〜a2T2ν/σが必要である。すなわちターゲットのうちプローブ層に進入する部分の長さが隣接プローブ間の特性距離d〜σ−1/2に比べて大きいほど、それに必要なターゲットの変形が困難になる。
【0079】
プローブ・ターゲット複合体の形成を促進する、配列に固有の「凝縮」エネルギーGCは、自由エネルギーのこれらの反発項Gel=GP+GTにつり合わなければならない。すなわちプローブ・ターゲット複合体の形成を支配する自由エネルギーはG〜Gel−GCの形をとる。自由エネルギーのこの形の直接的な帰結の一つは配列に依存する親和性定数KSSの、有効親和性定数K*<KSSへの「再規格化」である。Gel<GCである限り凝縮は起こるが、自由エネルギーの実増加量は少なく、−ΔG*C=−ΔGC+Gel、>−ΔGCであり、それに対応して有効凝縮エネルギーが小さいことから有効親和性定数も小さくなる。
K*〜exp(−ΔG*C/RT)<KSS〜exp(−ΔGC/RT)
また「溶融温度」も低下し、T*M<TMとなる。ここにT*Mは条件ΔG(T*M)=ΔG*C(T*M)=0から定まり、TMは条件ΔGC(TM)=0から定まる。このように配列固有の値には大きな補正を見込む必要があり、実際、弾性効果によって二重体形成が完全に抑止されることもある。
【0080】
有効親和性定数を評価する方法の一つはここに述べる経験的方法であり、立体構造が既知のプローブ層と、長さTの興味ある部分のみから成る合成ターゲットおよび長さTの部分配列が全長L>Tの配列中に埋め込まれている別のターゲットとを使用して等温線の測定を行う。排除容積効果を無視すれば、与えられた長さPのプローブの層の立体構造は、グラフト密度σと有効電荷線密度f(0<f<1)で決まり、後者は実験条件、特にバルク溶液内の塩、pH、温度を反映する。これらの等温線測定から、種々のターゲット濃度領域における有効親和性定数を容易に求めることができる。
【0081】
この経験的方法に対して補完的な、有効親和性定数を評価する今ひとつの方法は、プローブ・ターゲット捕捉の現象論的モデルを用いて弾性的および静電的相互作用の効果を説明するものである。
【0082】
II.1.2 設計に関する考察
プローブ層の立体構造:優先グラフト密度:
与えられたグラフト密度σに対して、プローブ鎖の横方向の変位s⊥がdと同程度に、すなわち、
(Pはプローブ長さ、aはモノマーまたはセグメントの大きさ)となると、「マッシュルーム型」構造における隣接する鎖の重なりが生ずるようになる。ν=1/2のときこの条件はa2P〜d2〜1/σ、したがってP〜1/σa2となる。対象の捕捉プローブに対して好ましい長さPが与えられると、これ故にグラフティング密度は、好ましくはσ<1/a2Pのように最適化される。
【0083】
プローブグラフト密度における増加に相当する方法におけるセグメント密度を増加するターゲット進入を考察することは、この規則の修正を示唆する。捕捉プローブの優先長さPが与えられたとき、ターゲットの一部が進入して少なくともプローブと同程度のフットプリントを占めることを見越して、σeff=gσ<g/a2P、1/2<g<1となるようにグラフト密度を選ぶ。たとえばg=1/2すなわちT=P(末端捕捉の場合十分良い近似で成立する状況、図12A,12B,13参照)のときは、予想されるターゲットの進入に対応するためにはσeff<1/2a2Pとする。
【0084】
プローブ層の自由エネルギー:浸透圧と弾性変形:
ターゲット鎖またはその一部が末端グラフトされたプローブのブラシに進入すると、局所的セグメント密度φが増大する。面積A0、厚さD=D(σ)のブラシがnp本の鎖を含んでいる場合、φ〜S/A0D(σ)〜(np/A0)P/D(σ)(Pは鎖1本あたりセグメント数)、したがってφ〜σP/D(σ)である。φが増加すれば浸透圧Π〜φw(wは特性指数)が増大し、層の圧縮率
が減少する。セグメントが加わればその度に弾性変形が起こる。たとえば「小球」の連なりから成るブラシ(図14)では弾性変形により小球の「特性」寸法ξPが減少し、同時に鎖セグメントの伸長とそれに伴うブラシの厚さD=D(σ)の減少による自由エネルギー増加分も減少する。各小球がPB個のセグメントを含むとすれば、
したがって
である。各プローブ鎖の長さがPでブラシの厚さにわたってP/PB個の小球を含むとす
れば、
であり、ξP〜σ−1/2とすればD〜aPσ1/3となる。すなわちグラフト密度を増加させると鎖の伸長により層の厚さが増加する。このようなスケール関係は、鎖の弾性における反発力(排除容積効果、静電的相互作用など)と吸引力とのバランスから全く一般的に生ずるものである。
【0085】
グラフト密度の制御:
共有結合を介した末端グラフトによるプローブ層の形成で実現されるグラフト密度は、固相基板上の担体面に存在する吸着部位の横方向の密度により限定されるのでない限り、特性的吸着(結合)エネルギー(プローブあたりの)と、プローブ層が成長する際に追加されるプローブに対応するために必要な弾性変形などの反発力とのバランスを反映する。すなわちグラフト密度は鎖ごとの特性面積AP 〜d2 〜1/σ を定義する。この場合グラフト密度は固相担体の共有結合的官能化に関する条件、特にプローブ濃度およびインキュベーション条件を反映する。
【0086】
典型的な値である
における最大捕捉効率の実験値から、鎖1本あたりの特性的フットプリントξPが推定される。(直径3.2μmの)ビード1個が対応できるターゲット(長さL=25nt)の最大数の推定値として
(図6B)を用い、各ターゲットが大きさの等しいプローブに捕捉されてハイブリダイズすると仮定すると、ターゲット捕捉後の平均分子面積はAp〜π(1.6μm)2/2*6*105〜0.65*103Å2と推定され、これはプローブのグラフト密度
に対応する捕捉前の値の2倍に相当する。このことから、グラフトの過程は「自己限定的」であって、少なくともここで引用する実験に用いられている固相担体の形成の条件では、末端グラフトされたプローブの立体構造は緩んだ状態ではなく、部分的に伸長した構造であると考えられる。部分的伸長は特性半径
の「小球」の伸長した列の構造(Tinland et.al.,op.cit.)と適合する。ここにRG,Pは溶液中で拘束を受けないプローブ鎖の回転半径を表す。すなわち自己限定的過程で形成されたブラシにおいては
である。
【0087】
後述のように、高いグラフト密度、特にオリゴヌクレオチドプローブのin situ合成(Lipshutz, R.J. et al., Nat. Genet. (suppl.) 21, 20-24 (1999); Shchepinov, M.S. et al., Nucleic Acids research 25, 1155-1161 (1997)) の典型的条件で出現するようなものは、一般的には好ましくない。プローブのスポッティングでは末端グラフト層は形成されず、より複雑な「縮れ構造」の層が生ずる(Netz & Joanny, Macromolecules 32, 9013-9025 (1999))。この構造では分子が固相に複数個の(ランダムな)点で付着し、ターゲットが反応できるのはプローブの配列のごく一部で、それをアプリオリに知ることはできず、またスポットごとに大きく異なる。このような状況ではグラフト密度の制御は困難である。
【0088】
自己限定型の過程で生ずるよりも小さい、予め定められたσの値を実現するには、たとえば微小球の官能化の過程に中間段階を挿入することが考えられる。具体的には分子量が調節可能な二官能性ポリエチレングリコール(PEG)、ニュートラビジン、ストレプトアビジン、アビジンなどのビオチン結合蛋白質などの二官能性ポリマーの形をとる二官能性修飾剤、或いはその他の既知分子量のヘテロ官能性ポリマー架橋剤を用いて、プローブのグラフト密度に上限を設けることができる。この上限値は修飾剤分子の大きさとビード表面上でのその横方向の充填によって決まる(図16A, 16B)。READ法を用いた実施態様では、第1段階として色で符号化した微小球(ビード)に修飾剤を共有的に結合させ、第2段階で修飾剤を捕捉プローブの共有的結合により官能化する。このとき5'末端修飾のため、標準的な共役化学の方法を用いてアミン、ビオチンなどの官能基を導入することが好ましい。
【0089】
ターゲット鎖の拘束:
吸着の希釈領域と濃縮領域:ターゲットの進入に対するプローブ層の弾性的応答に関する議論から、吸着等温線の希釈領域と濃縮領域との間の移行(図10A)が、プローブ・ターゲット複合層の弾性変形によって起こることが推定される。移行の起こる点c*(L)に対して、限られたものではあるが利用できるデータからc* 〜1/L3/2と推定される(図11)。
【0090】
小さいターゲットの極限では、捕捉の主な効果は前述のとおりプローブ層内でのセグメント密度の増大であり、移行はプローブ層、或いはより一般的には特性寸法がξ^P<ξPで既に特性寸法がξ^T<ξTであるターゲットを捕捉している捕捉プローブが形成する層が、圧縮率の低い領域に移行することを表している。すなわち移行が生ずるのは、nT*ξ^T2+nP*ξ^P2〜η*A0、すなわちη*〜(nP*/A0)ξ^P2+(nT*/A0)ξ^T2〜p0ξ^P2+c*ξ^T2、したがってc*〜(η*−p0ξ^P2)/ξ^T2のときである。特別な場合として
ならばc*+p0〜η*/ξ^2、或いは
と仮定すればc*+p0〜η*/Lyである。さらに特別な場合としてnP*=nT*=n*ならばη*〜(n*/A0)ξ^PT2或いはc*=(n*/A0)〜η*/ξ^PT2である。ここにξ^PT2はプローブ・ターゲット二重体のフットプリントを表し、前と同じく
である。この限界値は短いターゲットを用いるか(実際上は得られないことが多い)、指定のターゲット配列をターゲットの5’末端付近に置くことによって達成することができる。本明細書には後者の可能性を図15に関連して例示する。
【0091】
これと対照的に大きいターゲットの極限では、「自己限定的」グラフト過程によるグラフトプローブ層の形成の場合と全く同様に、移行点は(全体としての)大きさL、特性的「フットプリント」ξ^T2の捕捉されたターゲットの層においてターゲット鎖の重なり(クラウディング)が始まる点を反映している。ターゲットの重なりは
のとき、すなわちc*〜nT*/A0〜η*/ξ^T2〜1/Lのときに起こる。ここに、η*A0は捕捉されたターゲットで被覆され得る面積の分率を示す。
【0092】
ターゲットの進入を考慮したグラフト密度の調節の精密化
第二の場合について導いた式は、図11に支援した境界線に従って希釈領域の実現を保証するようにプローブ層のグラフト密度を最適化するために使用できる設計ルールを示している。すなわち:
【0093】
「グラフト密度はc*〜η*/L+p0(または更に一般的な
の場合に対する類似の条件)が最大になるように調節する。たとえば好ましい実施態様においては、cDNAの場合について述べたようにRTプライマーを適用するなどの方法で具体的なターゲット長さLを選択し、ついでσを調節する」
【0094】
2つの限界値は、移行がプローブ・ターゲット複合層の弾性的応答における変化を反映する一般的な場合に対する特殊な場合を表すものである。プローブ・ターゲット複合層の弾性変形と、二重体形成に必要な拘束された立体構造をとるターゲットの弾性変形との組み合わせは、全長Lが増大する配列に埋め込まれた同一の捕捉部分配列Tを含むモデルターゲットに対する吸着等温線において、ターゲット捕捉効率が
に依存することを説明するためにも用いられる。したがって有限容積を「占める」有限の部分配列が容積RG,T3〜L3νの「コイル」内に見出される確率は〜1/L3ν,ν=3/5に従って変化する。
【0095】
低い(バルク)イオン強度の条件下でのターゲットの捕捉:多価電解質ブラシ:
本発明の好ましい実施態様に関連して本明細書に述べるグラフト密度の典型的な値、すなわち3.2μmのビード1個あたり約106(または約3*1012/cm2)は、層内の空間電荷密度zCPの大きい値に対応する。たとえば長さP=20のオリゴヌクレオチドに対して、対応するプローブ層の厚さD〜50Aとすると、プローブ鎖の濃度は
である。したがってバックボーンの(完全解離した)燐酸基に関係する電荷の局所的濃度はfCP〜200mM(f=20)となる。
【0096】
電気化学的平衡状態においては、プローブ層内およびバルク溶液内に存在するカチオンと(ポリ)アニオンの濃度は条件C+C−=CBulk+CBulk−によって関係づけられる。電気的中性の要求から、プローブ層内ではC−+fCP=C+,バルク溶液内ではCBulk+=CBulk−=CBulkである。したがって与えられた負電荷fCPに対して、層内のカチオン濃度はバルク溶液内のカチオン濃度よりかなり大きくなる。
【0097】
たとえばCBulk/fCP << 1の極限ではC+ 〜fCP >> CBulk である。すなわちイオン濃度勾配が大きくても対イオンはブラシ内に保持されている。実際、対イオンは、プローブ鎖が占有する一定容積だけブラシの容積Vよりも小さい有効容積Veffの全体にわたって分布している(Veff 〜V(1 - φ))。
【0098】
これに対応するDebye遮蔽長さξE〜1/κは鎖あたりのバックボーン電荷fCPに関係し、式κ2=4πlBfCPで求められる。ここにlB=e2/εTはBjerrum長さ、CP=P/d2Dである。ブラシ内に細くされた対イオンに起因する浸透圧Π=fCPTによる反発力と、鎖の弾性fCPT=κD/d2(κ=T/a2Pは弾性率)との釣り合いから、グラフト密度に関係なく
が得られ、したがって
となる。このスケールは鎖の間の平均距離d、したがってグラフト密度によって決まる。
の極限では任意の電荷f>0に対して鎖が伸長し、グラフト密度に関わりなくブラシ厚さが最大となる。グラフト密度が十分小さく、ターゲットの進入に対応できるなら、そのような層への捕捉は「剣山型」の立体構造で、プローブ層の著しい弾性変形なく進行する。「小球」型の立体構造に従う鎖の伸長への復帰は、遊離の共イオンおよび対イオンを添加し、それらのイオンに関連するDebye遮蔽長さκFree−1がξEと同程度、したがって
となるようにその濃度を選ぶことで実現される。そのように遮蔽されたブラシでは、内部の立体構造は定性的には「小球」の連鎖から成る半希釈ポリマーブラシに類似するが、電気化学的平衡を維持するためバルク溶液の条件に応答する。
【0099】
二重体生成の荷電プローブ層内への拘束:
この場合、ターゲットが曝露される塩溶液の濃度が通常は二重体を生成しないと考えられる1 mMであっても(Primrose, "Principles of Genome Analysis", Blackwell Science, 1995)、一旦プローブ層に進入すればこれより遥かに高い局所的塩濃度に遭遇し、静電的遮蔽の条件も二重体生成に有利である。すなわちプローブ層は、バルク溶液内の極めて苛酷な、ssDNAまたはRNAの二次的構造の生成に不利な名目的条件においても、プローブとターゲットのハイブリダイゼーションが可能な局所的化学環境を提供する。このようにしてバルクではdsDNAの再アニーリングを防止しつつプローブ層内では(局所的に)二重体を生成させることが可能である。このシナリオは好ましくは次のルールで実現される。
【0100】
「ブラシ内の強い電荷と電気的中性の条件を実現して二重体形成を可能にするようにグラフト密度を調節すると同時に、外部溶液中には二重体形成を防ぐ条件を選択する」
【0101】
【0102】
III アッセイの方法
この章では感度・ダイナミックレンジ・アッセイの特異性の最適化に関する、特に高度に相同的なメッセージの存在量の多重分析に関する種々の方法を開示し、更に単一の検出色のみを用いる減算法示差発現分析の設計戦略を開示する。
【0103】
III.1 信号強度の調整
核酸分析においては、分析対象のターゲットの濃度が広範囲にわたって変化することがある。従って、多重化発現追跡においては、対象とするメッセージの存在量は細胞1個あたりmRNAコピー1〜2個に対応する低濃度から104個以上に対応する高濃度にまでわたることが多い。最弱から最強に至るトランスクリプトの信号を同時に検出するために必要な4桁のダイナミックレンジは多くのカメラや記録装置の能力を超える。プローブとターゲットの親和性を変化させること、およびアレイの組成に関するいくつかの方法によって、既知の、或いは予想されるメッセージ存在量に対応して信号強度を調整することが可能である。
【0104】
III.1.1 アレイ組成の最適化:希釈領域および濃縮領域における作業
対象とするmRNAの部分配列から所望の長さのcDNAトランスクリプトを作成するための逆転写プライマーの選択、および細くのためのターゲットの5'末端配列の選択を本明細書の考察に従って行うことにより、プローブとターゲットの親和性を調節することができ、ターゲットの捕捉を示すアッセイ信号のダイナミックレンジの調整が可能である。
【0105】
トランスクリプトの長さの選択:
アッセイ設計の最も簡単なケースは、逆転写のみが要求され増幅が不要な場合であって、cDNA濃度は試料中のmRNAの存在量を反映する。すなわちターゲットの存在量が与えられる。このときトランスクリプトの長さ、或いは捕捉部分配列の位置を正しく選べば感度を最大にし、かつ有効親和性係数の調節によって信号のダイナミックレンジを圧縮することができる。
【0106】
希なメッセージを表すトランスクリプトの存在量の少なさを補償するため、短いトランスクリプト長さを選んで、できるだけ大きい有効親和性係数を得、かつ固定化プローブとトランスクリプトのハイブリダイゼーションによるアッセイ信号を最大化することが好ましい。これにより検出感度を最大化することができる。逆に一般的なメッセージを表すトランスクリプトの存在量の多さを補償するには、長いトランスクリプトを用いて有効親和性係数をなるべく小さくし、一般的なトランスクリプトと固定化プローブのハイブリダイゼーションによる信号を最小化するのが好ましい。このようにして希なメッセージと普通なメッセージのアッセイ信号を(ある程度)イコライズすることができる。
【0107】
トランスクリプトの存在量の調節:
より一般的に、最適なトランスクリプト長さの選択が更に制約される場合がある。たとえば本明細書で論じるように相同性の高い配列を分析する場合、5'末端付近の部分配列が試料中のターゲットの多く、或いは全部に共通であって、特定のターゲットを同定するため、さもなければ望ましい長さよりも長いcDNAを作成せざるを得ないことがある。そのような場合には、与えられた長さLに対して、ターゲットの存在量t0を、希なメッセージに対してはc*以下、一般的なメッセージに対してはc*以上の領域で作業できるように選択する(たとえば1回以上の減算増幅による、後述)ことが好ましい。
【0108】
捕捉部分配列の位置:
コピー数の少ないトランスクリプトの検出感度を高める別の方法は、トランスクリプトの中央部でなく5'末端付近に存在するターゲット部分配列に対応する捕捉プローブを用いることである。I章に述べたとおり、ターゲットの中央部は末端付近よりも接近しにくく、したがってプローブ層の大きい変形を必要とし、したがって有効親和性係数は小さい。
【0109】
いずれの方法によるとしても、好ましい設計は下記のいずれかを実現することを目標とする。
【0110】
【0111】
図11に関連してc*は希釈領域から濃縮領域への移行が起こる濃度、L*はこれに対応するトランスクリプトの長さ(L*:=L(c*))を示す。
【0112】
これに対応する設計手順は、II.2 章にアッセイ設計の最適化の一部として示した次の関数である。
SelectFinalTargetAbundance(L,L*,C)
SelectTargetLength(C,C*,SP)
SelectCaptureSequence(ProbeSeq)
【0113】
III.1.2 アレイ組成の制御:担体の重複数
特定のターゲットの予想される濃度に対して、特定のタイプのプローブの数を適合させることによって、ダイナミックレンジと検出感度を更に改善することができる。特に本発明における好ましい方法であるREAD法においては、プローブの数は特定のタイプの微小球(ビード)の数(以下「重複数」とも呼ぶ)を変化させることで容易に調節できる。設計ルールは、異なったタイプのビードの最適相対存在量を選択することを規定する。
【0114】
これに関連する方法として、Ekins(US5,807,755)は受容体・リガンド結合アッセイを行うため受容体のスポットアレイを設計する方法を論じている。この方法では受容体の濃度がリガンドの濃度よりもかなり低くなければならない。後述するように、これは[P]0とビードの数NBが共に小さい場合に対する下記の理論的記述に対応する。しかしEkinsは受容体濃度が高い領域についても、本発明に述べるようなダイナミックレンジの圧縮方法についても何ら考察しておらず、また受容体・リガンド相互作用の分析にランダムに符号化した微小球アレイを使用することについても、望ましいアッセイ条件を達成するために異なった種類のビードないしプローブの相対存在量を変化させることについても触れていない。
【0115】
問題の反応は、溶液中のターゲット分子(たとえばリガンドTを含む)と、固体担体(たとえば色で符号化したビード)上に付着した受容体分子P(たとえばプローブ)とが可逆的に複合体P・Tを形成する反応である。この反応は質量作用の法則と親和性係数Kに支配され、1つの受容体が1つのリガンドに結合する場合には
K
P+T←−→PT
と書かれる。質量作用の法則は、その基本形においてはビード上の複合体分子の数[PT]、ビード上の未複合受容体部位の数[P]、反応に関与し得る遊離リガンド分子の総数[T]の関係を表し、数学的には下記の形である。
K=[PT]/[P][T]
ビード上の受容体分子Pは濃度[p]0(p0)でビードに固定化されており、分析対象におけるリガンド分子Tの初期濃度は[T]0(t0)mol/l(M)である。
【0116】
任意の瞬間において表面上の複合体分子の濃度は[PT](c)分子/ビードであり、未複合の受容体部位の数、[T](t)はp0−cで与えられる。任意の瞬間において、反応に関与し得るリガンド分子の数は、初期の分子数と既に複合化された分子の数との差である。NB個のすべて受容体分子Pを持つビードNB個のアレイにおいては、形成された複合体の数はcNBに等しい。したがって分析対象の容積Vの溶液において、反応し得るリガンド分子の数はVNAt0−NBcとなる。ここにNAはAvogadro数である。これらを用いて質量作用の法則は
K=c/((p0−c)(t0−NBc/VNA))
と書ける。複合体の数cは各ビードに対する蛍光信号強度に正比例する。
【0117】
このシナリオでは2つの極限状態が考えられる。
【0118】
t0>>NBp0/VNA
分析対象内のリガンド分子の総数が受容体部位の総数より遥かに多い場合は、平衡にある系に数個のビードを加えても各ビード上の複合体分子の数はほとんど変化しない。すなわち複合体分子の数、したがってそのような複合体を持つビードからの信号強度はビードの数と無関係であると見なせる。
【0119】
t0>>NBP0/VNA
反応に関与し得る受容体部位の数がリガンド分子より遥かに多い場合は、平衡にある系に数個のビードを加えると、平衡を維持するためには複合化したリガンド分子のあるものが解離して新しいビード上に再分布しなければならない。実際、極限状態ではc=t0VNA/NBである。したがってリガンド分子の濃度が与えられたときビードあたりの複合体分子の数、したがってそれに対応する蛍光信号強度はビード数に反比例する。
【0120】
無次元変数Y=c/p0、X=Kt0、C=Kp0NB/NA/Vを導入すると、Kの式はY/(1−Y)=(X−CY)と書かれる。占有率YとC(ビード数に比例)およびX(無次元化したリガンド濃度)の関係を図17に示す。ビード数が少ないときはYはCに依存しない。これは上記(a)の状態に対応する。無次元変数で示せばX>>CのときY→X/(1+X)であってCとは無関係である。更にX>>1ならばY→1、すなわちリガンド濃度が高く親和性係数が大きければビードは完全に占有される。Cが大きくなるとYはCと共に単調に減少し、上記の(b)の状態ではY=X/Cである。
【0121】
検出感度:
ランダムに符号化されたアレイ内部での与えられた種類のビードの数を制御することは、所望の限界内の信号強度を発生させるのに好ましい手段である。1つのリガンドが1つの受容体に結合する最も簡単な場合には、ビードの数を図17の屈曲点Cknee = 1 + X以下に減らすことで最大の占有率が得られる。
【0122】
ダイナミックレンジの圧縮:
前述したように、多重化アッセイでは検出すべきリガンドの濃度に大きな差があることが多い。この濃度幅に対応する広範囲の信号を与えられた検出器のダイナミックレンジで処理するには、多重化反応に用いる各種類のビードの数を、それぞれに対応する分析対象の予想濃度に応じて調節することが一般的に望ましい。具体的には、低濃度の対象物質による弱い信号を検出可能になるように増強し、同時に高濃度の物質による強い信号を検出装置の飽和限界を超えない程度まで減衰させることが好ましい。
【0123】
ダイナミックレンジ圧縮による信号強度のイコライゼーションは次のような場合に特に望ましい。
【0124】
a) 分析対象溶液中のリガンド濃度が広範囲に変化することが知られている、または予想されるとき。
【0125】
b) あるリガンドの結合親和性が極めて弱いことが知られている、または予想されるとき。
【0126】
c) ある種のビードの受容体密度が低いことが知られている、または予想されるとき。
【0127】
たとえばリガンド2種、受容体2種の系でリガンドの濃度t0,1 >> t0,2ならば、それぞれに対応する受容体を持つビードの相対存在量をNB,1 >> NB,2となるように調節することが望ましい。この議論は多数のリガンドを含む溶液を、それらに対応する受容体を持つビードのアレイに接触させる場合にも容易に拡張できる。
【0128】
したがって組成最適化のためのアレイ設計ルールには下記の段階が含まれる。
【0129】
「各タイプのビード上の蛍光発色団または複合化分子の望ましい数cidを選択する。
1.p0,iの既知の、または予想される値に基づいて受容体・リガンドの対の各々についてYidを設定する。
2.分析対象物質の濃度と親和性係数の積としてXiを計算する。
3.受容体・リガンドの対の各々についてCid=Xi/Yid−1/(1−Yid)を計算する。
4.各タイプのビードの望ましい数をNB,id=CidVNA/p0,iKiとして計算する。
【0130】
実験的証明:
本明細書で述べるように、有効親和性定数は長さに依存して大きく変化することがある。たとえばカナマイシンの場合、濃縮領域においてKeff(L=50nt)/Keff(L=1000nt)〜10である。トランスクリプトの長さの選択とビードの重複数との相乗効果が極めて劇的である例を図18に示す。これは実施例Vのプロトコルに従い、反応容積20μl中に10,000fmol存在するカナマイシンcDNAの検出に約3000個のビードを、反応容積20μl中に2fmol存在するIL−8のcDNAの検出に約100個のビードをそれぞれ用いて作成した図である。
【0131】
図18に示すように、左から5番目と7番目の比の対には50ntと1000ntのカナマイシンのトランスクリプトがいずれも1000fmol存在するにも関わらず、それぞれの信号強度の測定値は1桁以上異なっている。更にまた図18に示すように、カナマイシンcDNAの存在量はIL−8cDNAの約5000倍であるのに対して信号強度は約20倍にすぎず、ダイナミックレンジ圧縮を端的に示している。
【0132】
このように2つのトランスクリプトの有効親和性定数の著しい差を補正しなければ、実験データの解析で求めたメッセージ存在量には大きな誤差が含まれることになる。
【0133】
絡み合い:
この例は、捕捉されたターゲットの信号強度が更に、溶液中のターゲット鎖の絡み合いに起因する影響を受けることを示すものである。すなわち、溶液中のターゲット濃度がある閾値t*を超えるとターゲット鎖の重なりが始まる。ターゲットがL個のヌクレオチドを含み、かつ空間構造がガウス型コイルであるとすれば、ターゲット濃度は簡単にt* = L/R3 〜a-3L1-3ν、或いはν = 3/5とすればt* 〜L-4/5となり、すなわちターゲットの容積分率は Φ* 〜L-4/5となる。長いターゲットに対してはφは極めて小さく、たとえば
である。例として
, L = 1000とすると回転半径は,
分子容積は
となり、103 fmolが分子1012個に相当するとすれば、ターゲットの占める容積は,
したがって
である。すなわちこの例では、カナマイシンの1000 ntのトランスクリプトの捕捉効率はターゲットの絡み合いによって更に低下すると予想される。
【0134】
更に必要に応じて、複数のプローブおよびプライマーが関与する同時逆転写反応を用いればmRNAの異なった初期希釈度に対応することができる。この場合生成物をプールして1つの多重化反応により検出を行う。
【0135】
III.1.3 示差式増幅:
希釈領域を支配する親和性定数は配列固有の親和性定数KSSに近づくので、存在量の低いメッセージを検出するために、特に本明細書において高度に相同的な配列の分析に関連して述べるように短いcDNAの設計が困難または不可能であるときに好適である。存在量の最も小さいトランスクリプトの濃度を希釈領域に対応する検出範囲に含ませるためにPCRサイクルを少数、たとえば3〜4回に限定するような逆転写PCRプロトコルを作成することが可能である。
【0136】
濃縮領域では親和性定数が減少するので、トランスクリプトを移行濃度以上に増幅すると収率が低下する。すなわち、ある与えられた長さのターゲットに対して、ターゲット増幅を行っても信号強度の増加は、トランスクリプトの捕捉を支配する有効親和性が長さに依存するので、特に濃縮領域では比較的僅かにとどまることがある。具体的には、存在量の多いトランスクリプトを飽和領域まで増幅したとすれば、それ以上増幅を行っても捕捉量は増加せず、したがって信号強度も増加しない。この飽和効果はアッセイの設計やアッセイ信号の解析の際には考慮されるが、なおターゲット濃度の定量評価において著しい誤差を生ずることがある。
【0137】
しかし本発明の方法に基づいて正しく考慮するならば、このシナリオを用いて、低存在量のメッセージの信号を、同数の増幅サイクルを経過した高存在量のメッセージの信号に対して、同一の多重化ターゲット増幅反応において増強する示差増幅によるダイナミックレンジ圧縮を行うことができる。
【0138】
プール:
より一般的には、高存在量と低存在量のメッセージの信号によるトランスクリプトの濃度を、ターゲットの長さに関わらず、予め定めた狭い濃度範囲内へイコライズすることが望ましい。この例ではターゲットを2つまたはそれ以上の群に分けて別個に多重化ターゲット増幅を行うことにより、高存在量のメッセージに対する増幅サイクル数を少なく、低存在量のメッセージに対する増幅サイクル数を多くする。
【0139】
III.1.14 標識密度:
希釈領域における作業では少数の捕捉トランスクリプトを検出する必要があるが、標識したdNTPを高い比率で含有させることによりこれが容易になる。本明細書に述べる例では、8 molの非標識dCTPに対して1 molの標識dCTPの比率で典型的な標識密度1:64が達成される。150 ntのトランスクリプトに対してはこの比はnF(150nt) 〜3を意味し、混合物中の更に短いトランスクリプトに対してはそれに応じて低い値となる。また逆転写の過程で2種類以上の標識dNTPを加えれば単位長さあたり標識数は更に増加する。たとえばある反応混合物に対してビオチンdATPとビオチンdCTPを共に用いれば一方のみを使用した場合よりも単位長さあたり標識が増加する。逆転写反応における試薬として標識ビオチンdATPと非標識ビオチンdATPを1:6.25の比率で用いた実験(詳細略)では、対照の末端標識cDNAに比べて、1000 ntのカナマイシンcDNAには約20個の標識ヌクレオチドが存在していた。
【0140】
より一般的には、示差的標識法は濃度の異なる捕捉トランスクリプトの補足による信号の強度をイコライズする一つの方法としても利用できる。これは好ましくはトランスクリプトの組に導入される標識の数を、既知の、或いは予想される存在量および長さのレベルに従って調節する。濃縮領域への移行に関連する限界値を超える長さのトランスクリプトに対して、より高い標識dNTP密度を保証することが好ましい。この場合、そのような長いトランスクリプトは有効親和性定数が小さく、固定化プローブに捕捉される数が少ないが、標識密度が高ければそれが補償され検出感度が向上する。もとより計算に際しては、ターゲットあたりの標識総数はターゲットの長さに比例することを考慮しなければならない。
【0141】
トランスクリプトの示差的標識を実施するには、逆転写反応のためにmRNA試料を2つ以上のチューブ(反応室)に分け、たとえばその1つでは短いトランスクリプトのみが生成し、他の1つでは長いトランスクリプトのみが生成するようにし、各逆転写反応において標識dNTPと非標識dNTPの比率を調節する(この比が大きいほどトランスクリプト中の標識が多くなる)。
【0142】
III.2 伸長に媒介される配列固有の信号の増幅
感度と特異性:
短い標識cDNAを生成させるアッセイ設計を用いて今日までに得られた結果によれば、mRNAまたはcDNAの増幅を用いず新規な増幅方法を使用して、長さ50〜70ntのカナマイシンcDNAの標識断片を反応容積10μl中1fmolのレベルで検出するのに十分な感度が得られている(図19)。
【0143】
実施例VIおよび図20, 21に示すように、ヒト臨床試料に通常見られるような複雑な環境において特定のmRNAを検出できるだけのレベルの特異性があるかどうかを「スパイク実験」により更に検証することができる。
【0144】
新規な信号増幅法:
より高い感度を達成するため、プローブの配列固有の伸長に続いて蛍光プローブによる修飾を用いて、cDNA捕捉後に信号を1桁増強する方法を開示する。この伸長媒介プロセス(図22)は数分間で実行でき、またたとえば低存在量のメッセージのみに対してcDNAの逆転写標識と組み合わせて選択的にも、或いはすべてのメッセージに対しても行うことができる。
【0145】
伸長の過程では、プローブとハイブリダイズされたトランスクリプトの5'末端が、その領域においてプローブと完全に適合する場合のみ伸長が起こる。米国特許出願No. 10/271,602 "Multiplexed Analysis of Polymorphic Loci by Concurrent Interrogation and Enzyme-Mediated Detection"(2002年10月15日出願)(本明細書を構成するものとして援用)を参照されたい。
【0146】
まずカナマイシンmRNA(ここでは濃度範囲1〜32fmol/20μl)を、たとえば逆転写反応中にCy3標識dCTPをcDNAに導入することにより標識する。実施例III,IV,Vおよび図9に示すようにこの標識cDNAを固定化捕捉プローブで捕捉する。捕捉されたターゲットによる信号を増強するため、ビオチニル化dCTP(Bio−14−dCTP)を用いてin−situ(「オンチップ」)でプローブ伸長反応を行わせる。ついで得られたビオチニル化伸長生成物をストレプトアビジン・フィコエリスリン複合体に接触させて、フィコエリスリンのタグに由来する顕著に強化された蛍光を発生させる(実施例II参照)。
【0147】
実際、図23に示すように、反応は定量的であり、広い濃度範囲にわたって10倍の増強が達成され、したがってメッセージ存在量の定量の精度が向上し、約3桁にわたるダイナミックレンジの全域にわたって2倍の強度変化が容易に検出できる。
【0148】
本明細書の実施例に述べるアッセイプロトコルとREAD方式の実施態様において、50〜70ntのトランスクリプトの捕捉によって発生した信号は、ターゲット増幅を行わずに(ただし上記の信号増幅を行って)、試料のcDNA濃度約0.1fmole/10μlの検出が可能であった(信号と未補正バックグラウンドの強度比2:1のレベルで)。これは細胞1個あたりコピー10〜30個の頻度で存在するmRNAを検出するのに十分な感度である(標準プロトコル(Lockhart,D.J.,Dong,H.,Byrne,M.C.,Follettie,M.T.,Gallo,M.V.,Chee,M.S.et al.,Nature Biotechnology 14:1675−1680(1996))と同様、mRNAは107個/mlの末梢血単核球から採取するものとする)。
【0149】
III.3 検出の特異性の最適化
複数のトランスクリプトと固定化した配列固有の検出プローブとの相互作用は、複数の競合反応の平衡とそれに対応する共親和性によって支配され、あるプローブと反応に関与し得るすべてのターゲットの部分配列との、またあるターゲット部分配列と一群の検出プローブとの相互作用の強さはこれらの因子によって測られる。多成分のプローブ・ターゲット反応系において、あるターゲットがそれに対応するもの以外の捕捉プローブと相互作用すれば、速度および平衡に対して好ましくない干渉が生ずる可能性がある。
【0150】
III.3.1 プライマーとプローブの選択の最適化
交差反応の危険はトランスクリプトが長いほど、また反応に関わるトランスクリプトの数が多いほど大きくなる。これは第1の(適合的な)部分配列に似た第2の部分配列に出会う条件付確率が、ターゲット配列が長いほど大きくなるからである。捕捉の特異性を向上させるための方法として、先行技術では予想される各ターゲットにそれぞれ対応する2つ以上のプローブを用いる「多座」方式の捕捉が知られている。しかしこの方式は、プローブアレイの設計が複雑になり、かつプローブの追加によって交差反応の危険も大きくなるため、多重化定量分析には一般に不適当である。
【0151】
したがって交差反応を最小限にするため、配列固有の逆転写プライマーをmRNAの3’末端付近に置くことにより短いトランスクリプトを生成させることが好ましい。これは本明細書に述べるエントロピー効果に対処するアッセイ設計としても好ましい方法である。このようなアッセイ設計は、配列固有の逆転写プライマーの選択および配列固有の検出プローブを、好ましくは同時出願のNo.60/487451(前記)の方法によって最適化することにより実施される。
【0152】
本発明による方法は、指定されたmRNAの配列のアプリオリな知識と、予想されるその存在量を利用して、各mRNAの特定領域に対応する逆転写プライマーとその位置を選択することにより、逆転写反応で生成するcDNAの長さと標識の程度を制御しようとするものである。ある種の場合には、指定された組において1つまたは複数のmRNAに対して複数の逆転写プライマーを使用し、対応するcDNAの分析に、それらcDNAの異なった部分配列に適合する複数のプローブを用いることが有利である。同時出願のNo.60/487,451(前記)に従って、この方法を本明細書においては、「複数プライマー・複数プローブ法」(mpmp法)と呼ぶ。さらに場合によっては、検出に先立って更に逆転写生成物の増幅を行うことが有利である。
【0153】
本発明によるこれらの特異性最適化方法は多くの応用分野において有用であり、その例を実施例VIIに示す。また実施例VIIIおよび図24A, 24Bに示すように、サイトカイン遺伝子の多重化分析においてもこれらの方法を用いることができる。
【0154】
III.3.2 複数プローブ検出による特異性の向上
hMAPとeMAPの組み合わせ:
本発明による他のアッセイ方式は、遺伝子ファミリーのメンバーが、(i) 配列に、たとえば3個またはそれ以上のヌクレオチドの挿入のような顕著な差異があり、かつ (ii) 配列が実質的に相同であるが一塩基変異多形(SNP)のような僅かな差異を持つような部分配列を近接して持つ場合に、メンバーを検出するのに有用である。そのような配列は実質的な類似性のため、従来のハイブリダイゼーションによるアッセイ法では交差ハイブリダイゼーションが多く起こり、識別が困難である。
【0155】
交差ハイブリダイゼーションの問題を解決しコストを低減するためには、伸長とハイブリダイゼーションを組み合わせた二重アッセイ方式によりファミリーメンバーを識別し、かつそれぞれの存在量を決定することができる。これは大きな差異のある領域を表すトランスクリプトを一部のプローブとハイブリダイズさせ、差異の小さい領域に対応するトランスクリプトを他のプローブとハイブリダイズさせて、伸長反応によって後者のトランスクリプトのみを検出する方法で、結果の特別な解析方法によってファミリーメンバーを検出することができる。すなわち、好ましくは配列固有の伸長反応を行わせることにより、遺伝子ファミリーの同一性を確保しつつ、同時にメッセージ存在量の定量測定のために伸長反応自体を利用するか(III.2項参照)、または伸長とハイブリダイゼーションを組み合わせて識別と定量とを行う方式によって、相同性の高い配列の間の僅かの差異も検出することができる。
【0156】
最も単純な例は、配列の著しく異なる領域(塩基3個が追加された部分)が1つ、SNPを1箇所持つ領域が1つあるような遺伝子ファミリーである。上記の方式によれば、4個のビードと2つの異なったトランスクリプト標識を使用する。図25Bに示したように、1つのビードにはプローブhP1を結合させ(3つの追加塩基を持つ領域P1へのハイブリダイゼーション)、他の符号化ビードの1つにはプローブhP2を結合させる(3つの追加塩基を持たない領域P2へのハイブリダイゼーション)。第3のビードにはプローブeP1を結合させ(通常の対立遺伝子を持つ領域eP1とのハイブリダイゼーション)、第4のビードにはプローブeP2を結合させる(対立遺伝子の変異形を持つ領域eP2とのハイブリダイゼーション)。各トランスクリプトの5’末端は、適当な標識を持つプライマーを用いて逆転写反応中に第1の色(「赤」)で標識する。eP1またはeP2プローブとハイブリダイズしたトランスクリプトを伸長させたときは、第2の色(「緑」)で標識した伸長ヌクレオチド(dNTPまたはddNTP)を用いて伸長生成物を標識する。
【0157】
試料のハイブリダイゼーションに続いてアレイを分析する。ビードhP1またはhP2に赤が出現すれば、トランスクリプト中にそれぞれP1またはP2が存在することが示される。eP1ビード上のトランスクリプトが伸長すれば(緑の標識により識別される)、eP1の通常の(「野生型」)対立遺伝子が捕捉されたことが、またeP2ビードが緑色を示せばeP2の変異対立遺伝子が捕捉されたことが示される。このようにして、1回の伸長反応のみを用い、ハイブリダイゼーションと伸長のパターンを分析することにより、両領域を持つトランスクリプトの存在が容易に検出できる。より複雑な差異のパターンを持つmRNAのファミリーも、適切な数の符号化ビードとハイブリダイゼーションおよび伸長反応を利用して、同様に分析することができる。
【0158】
III.3.2A AUリッチなmRNAの発現レベルと分類の同時決定
感染やストレスへの過渡的応答においてはメッセンジャーRNA(mRNA)の代謝回転が起こる。哺乳類細胞では大部分のmRNAは分解の最初の段階としてポリ(A)鎖の短縮を示す。mRNA分子の実質的な不安定化には3'非翻訳領域(UTR)のアデニレート・ウリジレート(AU)リッチな要素が関与する。疾病状態ではAUリッチ要素(ARE)を含む多くのmRNAが発現し、疾病反応における遺伝子発現を選択的に促進または阻害するように働くことがある。AREモチーフの中核となるのはAUUUAの5塩基配列である。AREには複数個のAUUUAモチーフが分散して含まれていることもあり、しばしばそれに近接してUリッチな配列またはUストレッチが存在する。AREには様々な種類のものが知られている。
【0159】
本明細書の方法によれば、異なった部分配列を識別でき、かつ1つの色素で染色できる(多色を必要としない)プローブを用いて、様々な種類のAREの中から特定のmRNA部分配列を識別することができ、またAREに関係する各々のmRNA部分配列の相対発現レベルを決定することができる。この方法ではまず数種類のプローブを、プローブの種類に応じて符号化したビードに付着させる。プローブはAREおよびポリAテールの上流側にあるmRNA固有の部分配列に相補的なcDNA領域とハイブリダイズするように選ばれる。AREと上流側のmRNA配列を逆転写し得るように選んだプライマーを用いて、mRNA試料から逆転写によりcDNAを生成させ、トランスクリプトを標識して、ハイブリダイゼーション条件下でビード上のプローブに接触させる。
【0160】
ハイブリダイゼーションに続いて、遺伝子の相対的発現の定量の一段階として、各ビードに関係する標識されたトランスクリプトを示すアッセイイメージを取得し、アレイ内の標識トランスクリプトの全体像を得る。AREの各種類を識別する段階では、cDNAとハイブリダイズしたビード上のプローブを伸長させ、その条件を新たに伸長した生成物(符号化したビードに付着している)にAREに対応する部分が含まれるように選ぶ。このためには4種のdNTPすべてを大過剰に加えて、比較的長いプローブ伸長が起こり得るようにする。ついでアッセイイメージを記録し、各ビード上のプローブ/トランスクリプトの種類を同定する。
【0161】
次に伸長したプローブのトランスクリプトを加熱などにより変性させ、各種AREに相補的なプローブのライブラリからの1つの配列の標識プローブにビード/プローブを順次接触させる。これらの「AREプローブ」は同一のアッセイ混合物に加えるのではなく、順次使用するので、すべて同一の色素で標識したものであってよい。AREプローブのハイブリダイゼーションの後に解読すれば、各ビードに、したがって個々の遺伝子配列に関係しているAREの種類を決定することができる。以上の工程を図26に模式的に示す。
【0162】
種々の時点でのin vivoにおける各遺伝子配列の相対発現レベルは、それぞれの時点での標識トランスクリプトからの相対信号に基づいて決定することができる。このような測定はAREに関係している、したがって屡々疾病状態に関係している遺伝子配列のモニタリングに有用である。
【0163】
III.3.2B 高度に相同的な配列の識別:トウモロコシの近交系
ここに詳述するような応用においては、問題とするターゲットと実質的に相同な配列を持つ数百数千のターゲットの集合の中から特定のターゲットを検出する必要がある。このような状況では、要求される配列の選択性はハイブリダイゼーションで実現できる限界を超える。適当なプライマーとプローブの組の選択については同時出願のNo.60/487,451(前記)に詳論されている。ここでは逆転写または増幅の少なくともいずれかによる配列固有の転換、およびハイブリダイゼーション(hMAP)または伸長(eMAP)による多重化検出の組み合わせを要する、具体的なアレイ設計およびアッセイプロトコルをいくつか開示する。これらのアッセイ設計および本発明の方法論の例として、いくつかの具体例を以下に述べる。
【0164】
ハイブリダイゼーションプローブを用いる伸長生成物の調査:
本発明による今ひとつのアッセイ方式は、遺伝子ファミリーに属する高度に相同的なメンバーを識別するのに有用であり、一連の伸長を介する検出法によるもので、伸長生成物を形成し得る部分集合をそれ以外の部分集合から、第1の色の検出標識を含めることにより識別する。次に伸長生成物中の特定の部分配列を同定することにより、第一の部分集合のメンバーを更に識別することができる。この識別には第2の色の識別ラベルで修飾したハイブリダイゼーションプローブを使用する。この方法の詳細は多型の「位相整合」に関連して米国特許出願No.10/271,602 "Multiplexed Analysis of Polymorphic Loci by Concurrent Interrogation and Enzyme-Mediated Detection"(2002年10月15日出願)に記載されており、また図27〜29に関連して実施例IXに更に記述されている(図27のDNA配列はSEQ ID NO.12, 図28のDNA配列はSEQ ID NO.13である)。
【0165】
III.4 単一色による検出を用いる減算法示差分析
本発明によるアッセイ方式の一つである減算式ハイブリダイゼーションは、異なるmRNAの示差的発現の決定に用いられる(図30)。この方法はたとえば、健常者と患者とでmRNAレベルが異なるようなある種の疾患ないし状態の診断に有効である。この方式では、指定されたmRNAを健常者(normal, N)と罹患者(variant, V)から抽出し、両試料のmRNA濃度を同一にする。これはたとえば両試料に共通の標準mRNAを含めることにより実現される。
【0166】
両試料のmRNAの逆転写反応によりセンスcDNA(それぞれcDNAN, cDNAVとする)を生成させる。第1の試料に使用する逆転写プライマーのみをタグで修飾し、後に鎖の選択が可能であるようにする。逆転写の後、タグ付きプライマーを含む試料、たとえばN試料から転写によりccDNAN(cDNANと相補的なDNA鎖)を生成させ、cDNANは酵素により消化する。
【0167】
次にcDNAVとccDNANを、この2つの相補的な鎖がアニールし得る条件で結合させて二重体を形成する。この段階で両試料に等しい量のDNAが除かれる(減算)。指定された1つ以上の遺伝子がV試料中で発現不足であると、N試料中には対応する量の過剰が残り、反対に指定された1つ以上の遺伝子がV試料中で発現過剰であれば対応するV試料に過剰が残る。過剰の単鎖DNAは符号化したセンスプローブとアンチセンスプローブの対を用いて検出することができる(一方がcDNAVに、他方がccDNANに適合する)。センスプローブとアンチセンスプローブとの組は符号化した微粒子(ビード)に付着させてランダム符号化アレイを形成することが望ましい。
【0168】
この結合試料をセンスおよびアンチセンスプローブの組に接触させ、ハイブリダイズしたトランスクリプトを、たとえばビードの組に捕捉されたトランスクリプトからの蛍光信号を記録することによって検出する。標識は蛍光性逆転写プライマー或いは標識dNTPを含めることで行うことができる。センスプローブとアンチセンスプローブの組の各々において、強度の差は対応するトランスクリプトにおける過剰の符号と量を示している。特記すべきは、標準的な比率分析方法と異なり、1つの色しか必要とされないことである。
【0169】
IV 一般的開示
ランダム符号化アレイ検出法(READ):
多重化定量分析の方法においては、符号化された微小球(ビード)に付着させたオリゴヌクレオチドのアレイを用い、その解読によって符号化ビードの各種類上のプローブを同定することが好ましい。符号化したビードの組は平面基板上にランダムな平面状アレイとして配列することが好ましく、これによって顕微鏡による検査・分析が可能になる。ビード1個に結合したターゲットの量は信号強度を監視することにより知ることができる。符号化ビードに施す標識、およびアレイ内のプローブに結合したトランスクリプトに施す標識は、異なった色を区別し得るフィルターを用いて識別できる蛍光標識であることが好ましい。このアッセイ方式は米国特許出願No.10/204,799 "Multianalyte molecular analysis using application-specific random particle arrays"(2002年8月23日出願)(本明細書を構成するものとして援用)に更に詳しく記述されている。
【0170】
プローブで官能化された符号化微小球(ビード):
プローブを付着させる粒子の材質としては、たとえばプラスチック、セラミック、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性材料、トリアゾル、黒鉛、二酸化チタン、ラテックス、セファロースなどの架橋デキストラン、セルロース、ナイロン、架橋ミセル、テフロンなどが可能である(たとえばBangs Laboratories,Fishers,IN発行の“Microsphere Detection Guide”を参照)。粒子は必ずしも球形である必要はなく、また多孔質であってもよい。粒子の寸法はnm級(たとえば100nm)からmm級(たとえば1mm)まで可能であるが、約0.2ミクロン〜約200ミクロンが好ましく、約0.5ミクロン〜約5ミクロンが更に好ましい。
【0171】
粒子は表面に付着させる配列固有のプローブに対応するように符号化する。プローブは化学的または物理的に識別し得る特性、たとえば蛍光により一義的に識別可能とする。科学的、光学的または物理的特性を付与するには、たとえば励起波長、発光波長、励起状態の寿命、或いは発光強度によりスペクトル的に区別し得る、1種またはそれ以上の蛍光発色団または発色団を持つ色素のような、光学的に識別可能なタグによってビードを染色する。光学的に識別可能なタグは、たとえば米国特許No.4,717,655 (Fulwyler)に開示されているように、ビードを特定の比率で染色するように使用することもできる。染色はまた当業者に周知の方法で粒子を膨潤させて行うこともできる(たとえばMolday, Dreyer, Rembaum & Yen, J. Mol. Biol. 64, 75-88 (1975); L. Bangs, Uniform Latex Particles, Seragen Diagnostics, 1984を参照)。これらの手法により、2種の色素をそれぞれ4水準の強度で、かつ公称4種のモル比で混合して用いて最大12種のビードを膨潤およびバルク染色により符号化した。或いは国際出願PCT/US 98/10719(本明細書を構成するものとして援用)に記載されている組み合わせ色彩符号化も、ビードのアレイに光学的に識別可能なタグを付与するのに利用することができる。
【0172】
プローブ:
アッセイにおいては配列固有のプローブ、いわゆる「捕捉プローブセット」を使用する。捕捉プローブセットの各メンバーは、好ましくは同時出願のNo.10/847,046“Hybridization−Mediated Analysis of Polymorphisms(hMAP)”(2004年5月17日出願)に記載の方法により、1つの「対応」cDNAターゲット分子に相補的な固有の領域を持つように設計される。前述のとおり捕捉プローブセットの各メンバーの相補的領域の長さは、結合の親和力を調節するために異なる場合がある。
【0173】
これらのオリゴヌクレオチドプローブは5’末端に、ニュートラアビジンの付着によって官能化された微小粒子との結合のためにビオチニル化TEGスペーサーを、或いはカルボキシル化ビードとEDAC反応を用いた官能化微粒子表面との共有結合のためにアミノ化TEGスペーサー(Synthegen TX)を、それぞれ含むように合成することができる。
【0174】
逆転写:
これらのアッセイに使用する全RNAは分離後cDNAに逆転写し、このcDNA分子をdNTPまたはddNTPとDNAポリメラーゼを含む溶液の存在下で添加して、ターゲットの5'末端と完全に適合する相補的配列を持つプローブ上でcDNAを伸長させる。dNTP/ddNTP混合物は、伸長したターゲットに蛍光標識を導入するため、少なくとも1つの標識dNTPまたはddNTPを含む。cDNAターゲット分子は前述のように蛍光標識され、その蛍光標識密度(たとえば蛍光標識されたdNTPの導入の程度)は、対応するmRNAの予想発現レベルの高低によって異なる。更に、トランスクリプトのプローブとの結合領域がハイブリダイゼーションのパターンに影響し、プローブが末端に結合する方が容易である。詳細は後述の実施例において示す。
【0175】
アレイの構成法:
特定のプローブの組み合わせを含むアレイを作成するには、符号化しプローブで修飾したビードをプールしてアレイに構成する。アレイの構成法には多くの方法があるが、その一つにLEAPSTM(Light−Controlled Electrokinetic Assembly of Particles Near Surfaces)と呼ばれるものがあり、米国特許No.6,251,691(本明細書を構成するものとして援用)に記述されている。この方法ではまず平面電極と、それに実質的に平行な第2の平面電極のサイドイッチ構造を作成し、両電極間のギャップに電解質溶液のような分極性液体を満たす。第2の平面電極の内表面には低インピーダンスの部分が得られるようなパターンを設ける。次にビードをギャップに入れ、ギャップに交流電圧を印加すると、ビードは第2の平面電極上でパターンに従ってランダムに符号化されたアレイを形成する。或いは第2の平面電極上の照明パターンを利用することもできる。この方法で得られるアレイは、その特徴の密度を極めて高くとることができる。粒子アレイを構成する別の方法は米国特許出願No.10/192,352“Arrays of Microparticles and Methods of Preparation Thereof”(2002年7月9日出願)に記載されている。
【0176】
解読イメージ:
本発明によるアッセイでは、一群の粒子を明確な化学的または物理的特性によって符号化し、アッセイ前後において粒子の種類を決定できるようにする。解読を行うには、アッセイの前または後にアレイ中の符号化粒子の空間分布を記録することにより解読イメージを得る。この分布は捕捉プローブセットのメンバーの空間分布に対応する。
【0177】
光学的シグネチャとアッセイイメージ:
捕捉されたターゲットの検出を容易にするため、逆転写中に予め定められたモル比の標識dNTPを加えることによりcDNAを蛍光標識する。加えるdNTPの総量は逆転写で得られるトランスクリプトの長さによって異なる。本発明によるアッセイは、ハイブリダイゼーションに媒介される捕捉の代わりに、或いはこれに加えて、伸長に媒介される捕捉をも包含する。すなわちdNTPまたはddNTPおよびDNAポリメラーゼを含む溶液の存在下でcDNAを添加し、3'末端が捕捉されたターゲットと相補的なプローブに付着したcDNAを伸長させる。伸長させたプローブに蛍光標識を導入するため、dNTP/ddNTP混合物に少なくとも1つの標識dNTPまたはddNTPを含有させる。
【0178】
符号化ビードに施した標識およびプローブに結合したトランスクリプトに施した標識は好ましくは蛍光性であり、異なった励起・発光波長を判別できるフィルターの組み合わせ、すなわち基礎色の種々の組み合わせを用いて識別することができる。READ方式による好ましい実施態様においては、ビードにより顕微鏡などで容易に検査・分析が可能な平面状アレイを構成する。ターゲットの捕捉および分析において生成される光学的シグネチャの強度を監視することにより、捕捉されたターゲットの量が示される。
【0179】
解読イメージおよびアッセイイメージの記録:
アレイ中の粒子を解読しプローブに捕捉されたcDNA分子のアレイからのアッセイ信号を検出するには蛍光顕微鏡を用いる。解読装置の蛍光フィルターセットは、粒子の染色に用いた符号化色素の発生する蛍光を識別できるように設計され、他のフィルターセットはトランスクリプト/単位複製配列に関係する色素によるアッセイ信号を識別できるように設計される。解読イメージおよびアッセイイメージの記録装置にはCCDカメラを組み込むことができる。アッセイイメージを解析して、信号の空間分布とそれに対応するアレイ中の符号化粒子の空間分布との相関から捕捉されたターゲットの各々を同定する。
【0180】
アッセイ:
解読の前または後に、符号化粒子のアレイをcDNAターゲット分子に、粒子上のプローブによる捕捉が可能な条件化で接触させる。反応時間の経過後に符号化粒子アレイを1x TMACで洗浄して残留する遊離cDNAおよび弱く結合したcDNA分子を除去する。ハイブリダイゼーションによるアッセイに代わって、或いはこれに加えて、本発明のアッセイは伸長による検出法をも包含する。
【0181】
ついでアレイのアッセイイメージを取得することによりアレイのプローブ・cDNA複合体の光学的信号を記録する。各種類の粒子はそれぞれ配列固有のプローブと一対一に対応しているから、たとえばアッセイ前に取得した解読イメージとアッセイイメージとを比較すれば、アニールされたcDNA分子を同定することができ、それらの各々の存在量(それぞれに対応する元のmRNAの存在量に直接関連する)を、各種類の粒子の蛍光強度から決定することができる。
【0182】
以下に述べる実施例は、本発明の構成および利用に関して更に詳細を示すものである。
【0183】
実施例I:プローブおよびトランスクリプトの長さの捕捉効率への影響
長さが異なる25量体から175量体までにわたる合成DNAポリヌクレオチドターゲットを合成し(IDT, Madison, WIによる)。長いターゲットはそれぞれ短いターゲットを内部の部分配列として含んでいる。Cy5蛍光標識を用いてすべてのターゲットの5'末端を標識した。長さ15〜35 ntのアミン修飾(5'末端)オリゴヌクレオチドプローブも同様に合成した(IDT, Madison, WI)。配列の詳細を表I-1に示した。
【0184】
プローブは当業者に周知の方法により、符号化したトシル化微粒子にEDAC反応によって共有的に結合させた。予め計算した量の合成ターゲットの各々を脱塩水中10μMの原液から採取し、1xTMAC(4.5M テトラエチル塩化アンモニウム、75mM Tris pH8.0、3mM EDTA、0.15% SDS)で所定の最終濃度まで希釈した。表I−1に示すプローブの1種以上を蛍光微粒子で官能化した後、シリコン基板上に平面アレイを構成した。合成ターゲット20mlを基板表面に加え、基板を55℃のヒーターに入れ、20分後に取り出してターゲット溶液を吸引した。基板を1xTMACで室温で3回洗浄し、ついで10μlの1xTMACを基板上においてカバーグラスで覆い、アレイの蛍光強度を記録した。以上のハイブリダイゼーション実験の結果を図3,5,6,7に示した。
【0185】
実施例II:粒子1個あたりの蛍光発色団の絶対数の決定
市販のQuantiBRITETM PE フィコエリスリン蛍光定量キット(Becton−Dickinson,Franklin Lakes,NJ製)を用いた実験を行った。このキットは6.6μmのポリマービードの表面に既知量のフィコエリスリン(PE)分子を結合させたものである。ビードに由来する蛍光強度の定量測定のため、ビードのランダム平面アレイをシリコンウェハー表面に構成し、適当な蛍光フィルターとCCDカメラを備えた蛍光顕微鏡を用いて、粒子表面のPEの蛍光発色団からの蛍光の強度を表面に付着したPE発色団の数(データは製造者による)の関数として追跡した。この実験では測定に150Wのキセノンアークランプを備えたNikon Eclipse E−600FNエピ蛍光顕微鏡、Nikon 20x 0.75 NA対物鏡、R&B PEフィルターキューブ(Chroma Technology Corp.,Battleboro,VT)を用いた。イメージは冷却した16ビットCCDカメラ(Apogee Instruments Inc.)により記録した。この実験における露出/積分時間は500msであった。イメージの取得と解析にはパソコン上のMATLABTMを用いて開発したユーザーインターフェイス付きプログラムを使用した。結果を図4に示す。これにより粒子1個あたり約100個(すなわち1PE分子/μm2)のPE分子がこの方法で検出できることがわかる。
【0186】
R-フィコエリスリンと一般的なCY色素2種の蛍光性を表I-3に示す。
【0187】
表I-3
【0188】
すなわちPE分子1個はCy3分子約60個、或いはCy5分子約20個と等価である。したがってCy3分子約60個/μm2、Cy5分子約20個/μm2の検出感度が予想される。2μmの球の表面積は約12.5μm2であるから、検出されるためには1個あたりCy3分子750個、またはCy5分子250個が必要である。3ミクロンの球ならば対応する値はそれぞれCy3分子1700個、Cy5分子600個となる。したがって(2〜3ミクロン粒子の球に対して)Cy色素を用いた場合の検出感度の安全な予測は粒子1個あたり蛍光発色団約1000個となる。
【0189】
同様に、前述のとおり曲線の勾配を、記録された生の強度データから1μm2あたり分子数を求めるための(PE以外の色素を用いた場合に)近似的な換算係数として利用することもでき、さらにビードの大きさが既知ならばビード1個あたりの蛍光発色団の数を知ることができる。
【0190】
実施例III:迅速発現追跡の一般的プロトコル
多重化発現追跡の典型的な実験プロトコルは次のとおりである。本発明の方法に従って最適状態を確立するプロトコルを以下に述べる。本発明の方法による信号増幅を含むプロトコル全体は3時間以内に完了可能である(図1、図2参照)。
【0191】
段階1:
Qiagenシリカゲル膜を用いて、全RNAを血液または組織検体から分離する。対象とするmRNAの配列と相補的な配列を持つDNAオリゴヌクレオチドを添加し、mRNAのcDNAへの逆転写を準備する。
【0192】
段階2:
mRNAを含む溶液を65℃で、典型的には5分間加熱し、プライマーのアニーリングによるmRNAの変性を容易にする。ついで溶液を室温まで、典型的には2℃/minの速度で徐冷し、逆転写酵素(たとえばContech Superscript III)と蛍光標識dNTP(典型的には標識と非標識dCTPのモル比1:8)を添加して逆転写反応を開始する。標識cDNAの合成の後、RNアーゼを用いてRNAテンプレートを消化する。
【0193】
段階3:
READ方式に従い、シリコンチップ上の、DNAオリゴヌクレオチド捕捉プローブを付着させた色符号化微粒子のアレイ(図9)に蛍光標識cDNAを1x TMAC緩衝液中で50°Cで30分間アニールさせる。ハイブリダイゼーションに続いて1x TMAC緩衝液で3回洗浄し、各回ごとに緩衝液を交換する。
【0194】
必要に応じて、前述した本発明による信号増幅を実施してもよい。
【0195】
捕捉プローブの配列は、混合物中の各cDNAの3'領域に対して相補的に設計されている。cDNAの多重化分析に用いる捕捉プローブ配列の最適化の詳細は同時出願のNo.10/892,514 "Concurrent Optimizaion in Selection of Primer and Capture Probe Sets for Nucleic Acid Analysis"(2003年7月15日出願)に記載されている。アレイは本明細書の方法によって構成する。
【0196】
段階4:
米国暫定出願No.10/714,203 "Analysis, Secure Access to, and Transmission of Array Images"(2003年11月14日出願)に詳述されているアレイ自動イメージングシステムを用い、即時イメージング(天啓的には積分時間1秒以下)により、得られた蛍光のパターンを蛍光イメージとして記録する。手動の蛍光顕微鏡を用いることもできる。本明細書に記載の方法でアッセイイメージを解析することにより強度を定量的に測定する。この方法の詳細はNo.10/714,203明細書に記述されている。
【0197】
実施例IV:カナマイシンmRNAの分析(実施例IIIのプロトコルの使用)
実施例IVA:mpmp逆転写法の設計とトランスクリプトの標識
Cy3修飾逆転写プライマー6種と微小球上の複数の捕捉プローブを用いるmpmp逆転写法を、1:2の比率で順次希釈した一連のカナマイシン溶液の各1回ずつの反応に適用した。長さ79〜150 ntの断片の混合物を作成し、各断片にCy3修飾dCTPを、標識・非標識dCTPの平均モル比1:16(したがって平均標識密度1:64)で導入した。
【0198】
実施例IVB:トランスクリプトの長さと逆転写設計の改善
Cy3修飾逆転写プライマー1種または2種と微粒子上の捕捉プローブを用いるmpmp逆転写法を用い、濃度が25 nMから50 pMまで順次減少する一連のカナマイシンmRNA溶液の各々に対して逆転写反応を実行した。具体的には、逆転写プライマーと捕捉プローブの組み合わせ3種を用いて、70 ntまたは50 ntのcDNA断片の生成と分析を試みた。各断片にCy3修飾dCTPを、標識・非標識dCTPの平均モル比1:8で導入することにより、トランスクリプトのCy3標識密度も倍増(1:64から1:32へ)した。Cy3標識逆転写プライマーを用いると50 ntのトランスクリプト1個あたり平均2〜3個のCy3標識を含むこととなる。
【0199】
実施例IVC:モデルmRNAのタイトレーションにおけるアッセイの最適化
ターゲットの配置エントロピーがcDNAの検出感度に決定的な影響を与える要因であることが確認され、更にいくつかのアッセイ計画において、カナマイシンの1200 ntのモデルmRNAから得られたトランスクリプトの長さを約150 ntから更に短縮して約50 ntとし、Cy3標識密度を倍増することにより、アッセイ信号を予想どおり約5倍に増強することができた。これは検出限界約50 pMに相当する。
【0200】
注目すべきこととして、これと極めて近い結果(ターゲットのエントロピーの重要な役割を含め)が、未知のmRNA 8種の混合物にカナマイシンmRNAをモル比約1:12〜1:6200でスパイクしたときにも得られている(カナマイシン濃度25 pMおよび50 pM、mRNAのバックグラウンド300 nMに相当)。これらのモデル的アッセイの結果は、他のmRNAが存在する場合でも、細胞1個当たりコピー3〜5個の低濃度の特定メッセージを検出するのに十分な感度と特異性を示している。
【0201】
実施例IIIの予測、すなわちトランスクリプトの長さを約150 ntから約50 ntに短縮することによりアッセイ信号が更に増強されることを確認するため、50 ntまたは70 ntのトランスクリプトを生成するmpmp逆転写反応を設計した。5'末端適合捕捉プローブ(実施例III参照)の使用により信号が増強されることが実証されたので、トランスクリプトの5'末端付近の部分配列に適合するような捕捉プローブを設計した。
【0202】
アッセイプロトコルの最適化:
アッセイの感度とダイナミックレンジを更に改善するため、アッセイ条件の最適化を行った。具体的には、カナマイシンmRNAのタイトレーションにおける逆転写プライマー濃度を1/25にし(50μMから2μMへ)、ハイブリダイゼーション時間を半分に短縮した(50℃で30分から15分へ)。
【0203】
このように変更したプロトコルではターゲットの最高濃度約500 pMで起こる検出器の飽和(図10)を避けることができるばかりでなく、溶液中に残存する蛍光標識逆転写プライマーおよびdCTPの非特異的吸着によるバックグラウンド信号も低減するので、アッセイのダイナミックレンジが拡大される。アッセイの感度は2倍に向上することが認められた。
【0204】
実施例V:モデルmRNAの逆転写の最適化
実施例IIIに示したmpmp逆転写法アッセイの性能を更に向上させるため、最高の成績を収めた50ntのカナマイシントランスクリプトに対して、逆転写反応温度を厳格に制御するようプロトコルを最適化した。サーモサイクラーの温度プロファイルをプログラム化し、逆転写プライマーのアニーリング・転写の条件をより厳密に制御することにより、蛍光信号強度を2〜3倍に増強することができた(図19)。具体的にはサーモサイクラー(Perkin−Elmer)を用い、下記の温度プロファイルで実施例IIIの逆転写反応を実施した。
RNA変性:65℃、5分
アニーリング:45℃、30分
アニーリング:38℃、20分
SuperScript IIIの熱不活化:85℃、5分
保持:4℃
【0205】
ハイブリダイゼーション条件は、1xTMAC中50℃で15分インキュベーション、同緩衝液で3回洗浄、各回でビードに接触している20μlを交換、とした。
【0206】
この逆転写条件の管理を強化した2段階プロトコルによって、特異的な蛍光信号は増強され、一方で非特異的なバックグラウンド信号は旧プロトコル(プロトコル2)と同程度に抑えられ、結果的にS/N比を約2倍に向上させることができた。
【0207】
実施例VI:ヒト全RNAバックグラウンドのスパイク実験:特異性
複数のmRNAメッセージを含むヒト臨床試料に典型的に見られるような複雑な環境で特定のmRNAを検出する際に実現可能な特異性のレベルを更に評価するため、細菌に由来する未知の全RNAによるバックグラウンドをヒト胎盤全RNA(Ambion)で置き換えて一連のスパイク実験を行った。ヒト胎盤全RNAは、臨床試料中のヒトインターロイキンまたはその他のサイトカインのような特定のRNA種の発現パターンを決定する際の条件を近似するものとして、より現実的である。
【0208】
濃度約12.5nM〜50pMのカナマイシンmRNAの一定量を、100ng/μl(濃度約300nMに相当)に希釈したヒト胎盤全RNA溶液中にスパイクした。すなわち特異的mRNAと非特異的mRNAのモル比は1:24〜1:6200の範囲であった。8種の比(ターゲットなしの対照を含め)においてそれぞれ別個に、最適化したアッセイ条件で逆転写反応を行った。
【0209】
結果(図20B)は前述の全RNAの存在しない場合と同様の傾向を示している。長さ50 ntのトランスクリプトをヒト由来の全RNAにスパイクしたとき、ランダムに誘起された逆転写反応で形成された蛍光標識cDNAの捕捉による非特異的信号は、エントロピー的に有利な50 ntカナマイシンcDNAからの特異的信号に比べて無視できる程度である。検出されたターゲットの最低濃度すなわちモル比約1:6200は、特異的mRNA濃度約50 pMに相当し、細胞1個あたり数百個のコピーと等価である。このように、このアッセイ設計は、8種の未知RNAのin vitroでの混合物に対してのみならず、現実のヒト由来試料を用いる複雑な環境化においても、市販の発現プロファイリング用のプロトコル(Lockhart et al. (1996))と同等の感度と特異性を与える。
【0210】
多重化遺伝子発現プロファイリングにおいては特異性が決定的に重要であることに鑑み、前記のヒト胎盤RNAのプールへのカナマイシンのスパイク実験を拡張して、臨床試料に関連する条件を近似するようにした。結果は特異性と感度に関しては、前述のin vitroで転写された細菌由来RNAのスパイク実験の結果と同等であり、短い逆転写トランスクリプトの生成、トランスクリプトの5'末端付近の領域への捕捉プローブの適合、逆転写およびハイブリダイゼーション条件の厳格化の組み合わせによって特異性が向上することが示される。ランダム逆転写によるトランスクリプトは一般に特異的逆転写によるトランスクリプトより長く、したがって固定化プローブへの補足に際しては後者がエントロピー的に著しく有利である。
【0211】
最適化した逆転写条件のもとでも、ターゲットのエントロピーの決定的な役割は明らかである。たとえば図21の2段階プロットにおいて、親和性定数の大きい希釈領域から親和性定数の小さい濃縮領域への移行が見られる。前述のように、濃縮領域の親和性定数はターゲットのクラウディングを反映して、ターゲットの長さに大きく依存する。実際、吸着等温線の勾配は、2つの異なった逆転写プロトコルで生成させた50 ntのトランスクリプトに対して実質上同一である(図19C)。これに対して希釈領域では、スパイクなしで調製した50 ntのトランスクリプトに対する等温線の勾配は、比較的厳格でないプロトコル2の場合に比べて厳格なプロトコル3の場合は約1/2.5であり、逆転写条件の改善によって親和性定数が増加することを示している。
【0212】
実施例VII:応用例
本明細書に示したアッセイ方式は診断のために使用することができ、またある場合には治療と共に用いることができる。
【0213】
白血病:
たとえば国際出願No.WO03/008552には、遺伝子発現プロファイルによる混合系統白血病(MLL)、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)の診断方法が記載されている。これらのアッセイ方法は他の遺伝子の発現プロファイルの分析、たとえばHerceptinTM投与に先立つHer−2の分析にも用いられる。遺伝子発現プロファイルはまた臓器移植の決定や感染性病原体の診断にも有用である。医薬の標的への効果も発現プロファイルに基づいて解析することができる。サイトカインに数種の多形が存在することは、疾病への感受性或いは移植拒絶反応の出現を示すことがあり、これも本明細書に示した方式により解析することが可能である。本発明の方法のその他の応用例としては、特定の遺伝子の発現パターンの変化に現れる感染/病原体への曝露に対する宿主の応答の解析がある。
【0214】
ADMEパネル:
米国では年間10万人以上の死亡と200万人以上の入院が医薬品の副作用によるものとされており、そのうちの相当部分が個人の遺伝的変異に起因している。薬物療法の結果として遺伝的変異を検出する間接的方法は特定のバイオマーカーの遺伝子発現レベルを追跡することである。
【0215】
実施例Iに述べた方法は、薬物代謝を支配する、約200種の遺伝子を含む遺伝的マーカーに拡張することができる。これらのマーカーは柔軟性がありカスタマイズ可能なADME(吸収・分布・代謝・排泄)パネルとして得ることができる。第一のADMEパネルは、多くの薬物代謝酵素を支配する60種の遺伝子のスーパーファミリーであるチトクロムP450に基づくものである。
【0216】
ビードチップを用いる多重化遺伝子発現追跡の新しい標準は従来にない正確度、感度、特異性を持つ。たとえばhMAP法に続くeMAP法(伸長反応)を適用して、チトクロムP450ファミリーに属する高度に関連した配列であるCYP 450 2B1と2B2を識別することができた。ビードチップによる確立された方法によれば、高度に多重化されたアッセイ方式において、96%相同な配列の遺伝子発現レベルの2倍の変化を測定することができる。
【0217】
実施例VIII:多重化発現追跡:サイトカインmRNAパネル
ヒトサイトカインのin vivoトランスクリプト9種の作成:臨床的に有意義なマーカーのパネルについて遺伝子発現プロファイリングを行うための専用ビードチップを開発するための第一歩として、表III-1に示すヒトサイトカインmRNAターゲット9種の対照系を設計した。
【0218】
サイトカイン7種(IL−2,−4,−6,−8,−10,TNF−α,IFN−γ)および内生的対照2種(GAPDH,ユビキチン)の完全なcDNAのクローンのキャラクタリゼーションを配列決定により行い、pCMV6ベクター(OriGene Technologies,MD)中の特定サイトカインcDNAインサートを含むプラスミドDNAの形で回収した。ターゲット固有のPCR増幅のコストを避けるため、標準プライマー対によってすべてのcDNAを増幅するように、クローニングベクター配列に対するPCRプライマーを設計した。順方向PCRプライマーをT7プロモーター配列(サイトカインの各インサート(cDNA)のクローニング部位に隣接して存在)の上流に置くことにより、ターゲットの5’末端に位置する特定のcDNA配列のみのT7 in vitro転写が行われる。in vitro転写(MegaScript,Ambion)に続いて、アガロースゲル中でのSybrGreen染色によりテンプレートのキャラクタリゼーションを行い、200倍に希釈し、吸光度を測定してDNA濃度を決定した。
【0219】
次に、カナマイシンに対して開発した最適化プロトコルに従って、各遺伝子固有の逆転写プライマー9種を用いて多重化逆転写反応を行い、9種のCy3標識cDNAのプールを作成した。具体的には経験的設計ルール(後記)を適用して、長さ50〜70 ntのcDNAを生成し、かつ交差ハイブリダイゼーションを最小限にとどめるような逆転写プライマーを選定した。7種のサイトカインcDNA、2種の内生的対照、および2種の陰性対照(オリゴC-18、カナマイシン)に対して設計された捕捉プローブを有する符号化ビード11種を含むビードチップに、これらのcDNAのプールを精製することなく付着させた。
【0220】
プライマー/プローブの選択に関する経験的設計ルールによる第一の結果は、READ法による多重化分析で複数のサイトカイン遺伝子の発現レベルを決定する可能性を実証した。しかし9重化アッセイで2つのmRNAターゲットが非特異的なバックグラウンド信号の周辺的閾値に近い信号強度をもって検出された。これは複雑な試料プールにおいて、対応する逆転写プライマーが交差反応により他のmRNAターゲットと結合したためである。このような結果は、上に開示した数学的アルゴリズムに基づく使いやすい計算ツールを含め、プライマー/プローブの設計ルールの最適化を更に進める必要を示すものである。
【0221】
逆転写プローブおよび捕捉プローブの選定に関する第2の設計ルールを用いて、それぞれ特定のmRNAに対応する11種の捕捉プローブとそれに対応する逆転写プライマーを再設計した(表III-1)。またプライマーとターゲットのハイブリダイゼーション反応の特異性を改善するため、プライマーの長さを約20 ntに延長した。これら再設計した逆転写プライマーおよび捕捉プローブの溶融温度の計算値に基づき、より厳格な条件で逆転写反応を行った。この工程は2段階から成り、まずRNAを70°Cで5分間変性させ、次にプライマーのアニーリングと伸長を52°Cで60分間行った。オンチップのハイブリダイゼーションは、再設計プローブ9種のTmの平均値である57°Cで行った。
【0222】
次に、9種の遺伝子固有の逆転写プライマーを用いて、in vitroで転写した9種のRNA(各メッセージ32 fmolを含む)の多重化逆転写反応を行い、上述のように最適化した2段階の温度におけるインキュベーションのプロトコルに従って、9種のCy3標識cDNAのプールを得た。具体的にはコンピュータ的設計ルール(レポートIV参照)を適用して、長さ60〜200 ntのcDNAを生成し、かつ交差反応を最小限にするような逆転写プライマーを選択した(前記参照)。
【0223】
7種のサイトカインcDNA、2種の内生的対照、および2種の陰性対照(オリゴC-18、カナマイシン)に対して設計された捕捉プローブを有する符号化ビード11種を含むビードチップに、Cy3直接標識cDNAのこのプール(各16 fmolの添加したmRNAを含む)を精製することなく付着させた。図26に示す結果は、6種のサイトカインcDNA(IL-6は低レベルの非特異的ハイブリダイゼーションを示すため逆転写から除いた)の多重化検出を再現性よく行う可能性を実証した。S/N比は3.5〜6の範囲で再現性を示し(表III-2、図24A)、検出された各メッセージの信号出力が統計的に有意であることが確認される。ビードチップは各cDNAにつき約300個のビードを含んでおり、この重複が更に信頼性を高めている。
【0224】
表III−1:多重化分析に用いた9種のヒトサイトカインcDNAクローン:逆転写プライマー及び捕捉プローブの設計
【0225】
実施例IX:トウモロコシのゼイン遺伝子ファミリーの高度に相同的なmRNA配列の分析
トウモロコシの同系交配系統B73およびBSSS53において、ゼイン遺伝子のいくつかのmRNA配列は、945 ntの全長にわたって95〜99%の相同性を示す。BSSS53系統の高度に発現したmRNA配列の検出に用いるターゲット固有の変異(赤で示す)に対する、捕捉および伸長プローブの位置を図27, 28に示す。
【0226】
これらの配列を検出し、その相対的発現レベルを評価することは、大きなクローン集合の配列決定を必要とするため、現行の方法では極めて煩瑣な作業である。ハイブリダイゼーションによる検出と伸長による検出を組み合わせた方法によれば、高度に相同的なmRNAの配列を識別することができ、同時にそれらのメッセージの存在量をほぼ平行する分析方法で決定することができる。この検出アッセイは下記のように行った。
【0227】
まず処理後の全RNA試料に対して固有の逆転写プライマー(黄色で示す)を用いてmRNAをCy3標識cDNAに転換する。ついで7種のcDNAターゲットをビードチップ上で、完全に適合する捕捉/伸長プローブにハイブリダイズする。プローブはその3'末端がターゲットの各多形位置に対して整列するように設計されている。適合したハイブリッドプローブはTAMRA標識dCTPを用いて伸長する。したがって伸長したプローブは蛍光信号を発する。
【0228】
より複雑な場合として、2つの配列が共通の変異を有し、その一方のみが第2の特定の変異を持つ場合を図29に示す。具体的には遺伝子16と31が共通の変異T(Cを置換)を持ち、この点で複数配列アラインメント(図示せず)中の他のすべての配列から区別される。遺伝子31は固有の変異C(Gを置換)を識別する第2の捕捉/伸長プローブにより検出される。しかし遺伝子16には更に別の固有の変異があり、7種の高度に相同的な配列のプール中でも「移相法」によって同定することができる。図29に示すように、確実な識別のためには3段階の操作が必要であり、段階1と2は同時に行う。
【0229】
段階1:
3'末端にTを持つプローブ16を第1の種類のビードに固定化し、アニール条件下で7種の増幅済み遺伝子トランスクリプトのプールに接触させる。ハイブリダイゼーションに続く伸長によって、2つの遺伝子16, 31が他から識別され、そのプローブを持つビードからのTMRAの蛍光で検出される。同時に3'末端にCを持つプローブ31を他の種類のビードに固定化し、アニール条件下で7種の増幅済み遺伝子トランスクリプトのプールに接触させ、ハイブリダイゼーションに続く伸長反応の後、特定の符号を持つビードからのTMRAの蛍光で検出する。
【0230】
段階2:
アッセイの次の段階として、伸長後のプローブ16から、95°Cでの変性反応によりターゲット16を除去する。
【0231】
段階3:
次に伸長した単鎖プローブ16を短いCy5標識検出プローブ16に、二重体形成の溶融温度(Tm = 49°C)でハイブリダイズさせる。このためには配列中央部にCを持つ適合するプローブを使用する。指定の溶融温度(Tm)でハイブリダイゼーションが起こり、Cy5の蛍光が第1の種類のビードで検出されれば、プール中に遺伝子16が存在したことが示される。このように、この設計ではプローブ31を持つビードに由来するTMRA信号は遺伝子31の存在を確証し、プローブ16を持つビードに由来するCy5信号と共に記録されたTMRA信号は遺伝子16の存在を確証する。
【0232】
本命最初に使用した用語、数式および例は例示を目的としたものであり、限定的なものではなく、本発明の範囲は以下に示す特許請求範囲によってのみ定義され、かつ各請求項に等価な内容をすべて包含する。方法に関する請求項に含まれる諸段階は、同じ請求項に別様の断りがない限り、同項に述べられている順序のほか任意の順序で実行することができる。
【図面の簡単な説明】
【0233】
【図1】図1は多重化発現追跡を実施する過程を示す。
【図2】図2は図1の過程に関連する典型的なワークフローを示す。
【図3A】図3Aは表I−1に示したモデルプローブおよびターゲットに対するタイトレーション曲線(結合曲線)を示す。
【図3B】図3Bは図3Aの曲線を質量作用の法則によって回帰分析した結果から抜粋した、同曲線に対する微粒子1個あたりの親和性定数Kとプローブ部位の数P0を示す。
【図4】図4は強度と微粒子表面の蛍光発色団濃度との換算のための較正曲線を示す。
【図5】図5は表I−1に示したプローブとターゲットの複合体の形成の程度とターゲット長さとの関係、および冪乗法則によるデータの回帰分析の結果から抜粋した指数の値を示す。
【図6A】図6Aは表I−1に示した175 ntのモデルターゲットと種々の長さのプローブとの複合体の形成に関する吸着等温線を示す。
【図6B】図6Bは図6Aの曲線を質量作用の法則によって回帰分析した結果から抜粋した、同曲線に対する微粒子1個あたりの親和性定数Kとプローブ部位の数P0を示す。
【図7A】図7Aは表I−1に挙げられたそれぞれ長さ175nt,90nt,25ntのターゲットと種々の長さのプローブとの複合体形成の程度とプローブ長さとの関係を示す。
【図7B】図7Bは表I−1に挙げられたそれぞれ長さ175nt,90nt,25ntのターゲットと種々の長さのプローブとの複合体形成の程度とプローブ長さとの関係を示す。
【図7C】図7Cは表I−1に挙げられたそれぞれ長さ175nt,90nt,25ntのターゲットと種々の長さのプローブとの複合体形成の程度とプローブ長さとの関係を示す。
【図8A】図8Aは150ntのcDNAの生成を例に複数プライマー・複数プローブ(mpmp)設計を示す。
【図8B】図8Bは1200ntのカナマイシンのmRNAにそのようなmpmp設計を適用して作成した150ntおよび1000ntのcDNAのタイトレーション曲線を示す。
【図9】図9はランダム符号化アレイ検出(Random Encoded Array Detection,READTM)による、ハイブリダイゼーションに媒介された発現追跡の作業手順を模式的に示す。
【図10A】図10AはカナマイシンのmRNAの逆転写で得られた3つの異なる長さのcDNAについて図8のタイトレーション曲線を変換して得られた直線化タイトレーション曲線(等温線)を示す。等温線の屈曲点は吸着に「希釈」領域と「濃縮」領域があることを示す。
【図10B】図10Bは濃縮領域で固定化プローブに捕捉されたターゲット鎖の「フットプリント」を模式的に示す。
【図10C】図10Cは希釈領域で固定化プローブに捕捉されたターゲット鎖の「フットプリント」を模式的に示す。
【図11】図11は図10の等温線の濃縮領域から希釈領域への移行を特徴づけるc*の値とターゲット鎖長さとの関係を示す。
【図12A】図12Aは500ntのcDNAの生成を例に複数プライマー・複数プローブ(mpmp)設計を示す。
【図12B】図12Bは500ntのcDNAについて、cDNA内部の部分配列とcDNAの5’末端付近の部分配列にそれぞれに適合するプローブへの捕捉によって得られたタイトレーション曲線の比較を示す。
【図13】図13は図12の500ntのcDNAに対するタイトレーション曲線の変換によって得られた直線化タイトレーション曲線を示す。
【図14】図14は末端グラフトされたポリマー鎖が、グラフト密度によって異なる配列をとることを模式的に示す。
【図15】図15は末端グラフトされたポリマーにターゲット鎖が捕捉される際の鎖の拘束を模式的に示す。
【図16A】図16Aは二官能性ポリマー修飾剤を用いることにより微粒子表面におけるポリマーのグラフト密度を制御する方法を模式的に示す。
【図16B】図16Bはプローブとポリマーの相互作用を拡大して示す。
【図17】図17は(規格化)占有率(縦軸)と、アレイ中の微粒子(ビード)の数および(無次元)ターゲット濃度に正比例する量(横軸)との関係を示す。
【図18】図18は、微粒子の重複数の最適化によるダイナミックレンジ圧縮の効果により、レンジに5000倍の差がある濃度で存在する50 ntのカナマイシンcDNAと70 ntのIL 8 cDNAに対してそれぞれ生ずる信号の強度の差が20倍程度に抑えられることを示す。
【図19A】図19AはmRNAターゲットに対するプローブとプライマーの位置を示す。
【図19B】図19BはIL−8 mRNAの逆転写で得られた短いcDNAの希釈系列の表であり、1fmolのmRNAが検出限界であることを示している。
【図19C】図19Cは図19Bの表から作成したプロットを示す。
【図20A】図20AはmRNAターゲットに対するプローブとプライマーの位置を示す。
【図20B】図20BはカナマイシンmRNAの逆転写で得られた50 ntのcDNAの、本明細書に示すいくつかのプロトコルによって作成した希釈系列を示す。8種のサイトカインmRNAの混合物(バックグラウンド)およびヒト胎盤RNA混合物へのcDNAのスパイキングを示す希釈系列も含まれている。
【図21】図21は図19の希釈系列の変換によって得られた直線化吸着等温線を示す。
【図22】図22は酵素によって触媒されるプローブの伸長およびそれに続く修飾による信号増幅法を模式的に示す。
【図23】図23は図19の信号増幅法を適用することによる感度の向上を示す。下側の曲線は標識したカナマイシンcDNAの信号(第1のカラーチャンネルで記録)を、上側の曲線は同じカナマイシンにプローブ伸長および修飾を施した後の信号(第2のカラーチャンネルで記録)を示す。
【図24A】図24Aは7個のサイトカイン遺伝子および2個の「ハウスキーピング遺伝子」から成るパネルに対して行った多重化発現分析の代表的な結果を示す。
【図24B】図24Bは図24Aに示した結果のヒストグラムを示す。
【図25A】図25Aは多型解析の二段階プロセスを適用することにより、相同性の高い配列を区別し得る設計における、ターゲットとプローブの位置を示す。
【図25B】図25Bは異なったプローブを付着させた4つの符号化ビードを示す。
【図25C】図25Cは図25Aおよび図25Bのプローブを用いたアッセイの結果を示す。
【図26】図26はAUリッチなmRNAの配列の濃度の定量測定と特定のクラスの同定を同時に行う方法を示す。
【図27】図27はトウモロコシのゼイン遺伝子ファミリー(azs 22)から得られた7つのトウモロコシ遺伝子の配列アラインメントを示す。
【図28】図28はトウモロコシのゼイン遺伝子ファミリー(az2 22)内の相同性の高い配列を検出できる、ハイブリダイゼーションと伸長を組み合わせた設計を示す。
【図29】図29は図28における相同性の高い遺伝子16および31を検出できる、ハイブリダイゼーションと伸長を組み合わせた設計を示す。
【図30】図30は1つの検出色を用いる減算法示差発現分析の手順を示す。
【技術分野】
【0001】
関連出願
本出願は、米国暫定出願No.60/515,611(2003年10月28日出願)および同No.60/544533(2004年2月14日出願)に対する優先権を主張する。
【0002】
政府の利害
本出願に含まれる研究の一部はDAPRA契約により実施されたものであり、したがって本出願の権利の一部はアメリカ合衆国政府機関に帰属する可能性がある。
【0003】
発明の背景
遺伝子発現分析:細胞周期の進行、細胞の分化、細胞死などの基本的な生物学的過程は遺伝子発現パターンの変化に関連し、したがって遺伝子発現パターンは分子レベルでこれらの過程を追跡する手段となり得る。遺伝子発現パターンは治療薬への曝露によって変化するため、新規な薬物の有効性の分子的指標として有用であり、薬物のターゲットの確認にも利用できる。現在遺伝子発現分析はターゲットの発見に関連してますます重要性を増しつつある。
【0004】
また遺伝子発現分析は多遺伝子的特徴の分析のための系統的・分子的アプローチをも提供する。植物の分子生物学および分子農業において、指定された遺伝子の発現パターンおよびその時間変化は、果樹・蔬菜類の成長または成熟速度のような性質の好ましい特徴を得るための品種改良「ブリーディング」に応用されることが多くなっている。
【0005】
発現レベルの変化は病原体の状況や進展をも示す。従って、機能的腫瘍抑制遺伝子の不十分な発現及び/又は腫瘍遺伝子又は癌原遺伝子の過度の発現は、様々な癌の発生及び進展に関係していることが知られている。炎症に対する免疫反応の初期段階に、又はHSV, CMVのような一般的ウイルスなどの病原体、或いは炭疽菌などの生物兵器への曝露があったとき、発現パターンが特徴的な変化を示す特定の遺伝子が同定されている。抗体のような蛋白質マーカーの発現とは対照的に、遺伝子発現は免疫応答の最初期に起こるので、早期かつ特定的な治療の可能性に道を開くものである。
【0006】
したがって、感染源への曝露或いは治療の後に、特定の遺伝子(メッセージ)の発現レベルとその時間変化を迅速に定量分析することは、疾病の分子診断の進歩のために極めて有望な方法である。しかし本発明において詳述するように、遺伝子発現の標準的な定量分析法では必ずしも高品質のデータが得られるとは限らない。また遺伝子発現分析、特に多重化発現追跡(multiplexed expression monitoring, 本明細書ではmEMと略される)が信頼性ある実用的な分子診断方法となるためには、プロトコルが単純であること、短時間で実施できること、遺伝子群の選択に柔軟性があること、交差反応の制御に信頼性があり特異性が保証できること、3〜4桁にわたるダイナミックレンジを通じてメッセージの存在量を定量評価しつつ必要な感度を発揮できること、使用に便利なことなどが要求される。
【0007】
現行の諸方法は一般にこれらの特性を備えていない。すなわち、遺伝子発現分析はターゲットの発見のための標準的手法とはなっているが、診断方法としての、特にターゲット混合物中でcDNAの発現レベルを対応するmRNAの発現レベルの尺度として定量測定する必要のある発現追跡の利用は限られている。これは、迅速で信頼性ある定量的多重化分子診断を保証する、柔軟性と信頼性を備えたアッセイ設計が欠如しているためである。
【0008】
空間的に符号化されたアレイ:in situ合成とスポッティング:
遺伝子発現分析は、一つの反応で複数の対象物質を同時に分析(多重化分析)できるような平行アッセイ法を用いて行えば、実用性が大いに改善される。しばしば行われる方法(たとえばU.Maskos, E.M. Southern, Nucleic Acids Res. 20, 1679-1684 (1992); S.P.A. Fodor et al., Science 251, 767-773 (1991)を参照)では、平面状の基板上に形成したオリゴヌクレオチドの捕捉プローブ(場合によってはcDNA分子)のアレイを用い、プローブ・ターゲット複合体の形成が可能な条件のもとで核酸試料を含む溶液をアレイに接触させる。溶液には特定の組織から抽出したmRNA或いはmRNAからの逆転写(RT)により形成したcDNAを含ませることができる。複合体の形成(ハイブリダイゼーション)が完了した後、未結合のターゲット分子を除去し、アレイの各位置について強度を記録する。これらの強度は捕捉されたターゲットの量を反映する。強度パターンを解析すれば試料中で発現したmRNAの存在量に関する情報が得られる。この多重化アッセイ法は分子医学や生物医学研究の分野で核酸や蛋白質の分析に次第に普及しつつある。
【0009】
柔軟性・再現性・信頼性の欠如:
しかしながら空間的に符号化されたプローブアレイは、指定された遺伝子群の発現の定量的分析には一般には不適当である。すなわち、オリゴヌクレオチドの光化学的in situ合成では、アレイを変更するために時間と費用がかかるため、十分な柔軟性を持つ開放的な試験方法とは言えない。このため、限定された遺伝子のみを用いればよい用途においては、プローブの選択に自由度のある「スポット」、又は印刷アレイが好まれる。しかし「スポッティング」には依然として技術的に困難な問題がある。これは一般に定量分析には不適当な、標準的な「ストリップ」法アッセイの問題とも類似している。すなわち被覆が一様でなく、また個々のスポット内での固定化プローブの配向やアクセシビリティが不確実であるため再現性が劣ることが大きな問題として残る。さらに「バックグラウンド」強度を抑止するために高価な共焦点レーザー走査装置が必要であり、またプローブの被覆の不均一性を考慮して、以後のデータ処理の早い段階から統計解析を行う必要がある。いま一つの問題点は、スポットアレイのフットプリントが比較的大きく、したがって試薬の所要量が大きいことである。最後に、大規模な診断に必要な量を賄うためのスケールアップは、たとえば本発明の好ましい実施態様において符号化微粒子の平面アレイの形で利用されるようなバッチ法に比べて複雑であり、経済的に不利である。
【0010】
アレイを用いる診断法の問題としては感度の不足のほかにも、コピー数が広範囲にわたる(細胞1個につき1〜2個から104個程度まで)発現遺伝子を検出する能力が限られていることが挙げられる。したがって検出感度を高め、交差反応の可能性を小さくし、コピー数の広いダイナミックレンジにわたる検出を可能にすることによりこれらの問題点を解決した、新しいアッセイ法が必要とされる。
【0011】
特異性の欠如:
先行技術における最も普通の方法は、複数個のターゲット配列の定量および識別のためにプローブとターゲットの多重化ハイブリダイゼーションを唯一の工程として使用するものであるが、ハイブリダイゼーションは多重化法においては特異性に欠ける場合がある(米国特許出願No.10/271,602, "Multiplexed Analysis of Polymorphic Loci by Concurrent Interrogation and Enzyme-Mediated Detection"(2002年10月15日出願)に示された論議を参照)。特異性を向上させるためにスポットアレイに長いプローブを使用した多重化ハイブリダイゼーションの方式も用いられている。たとえばAgilent, EP 127209には長さ10〜30、好ましくは約25のプローブが開示されており、これによってスポットしたプローブの捕捉配列のランダムな障害とアクセシビリティの制約を補償することは可能である。すなわち、スポットされたアレイにおいてプローブ・ターゲット複合体が形成される際には通常はプローブの長さ全体が関係することはなく、ランダムに接近できる部分配列のみが関係する。しかし本明細書で述べるように、固相においては長いプローブを使用することは有効ではなく、また特異性の欠如の問題は依然として残る。本明細書で述べるように、交差ハイブリダイゼーションは通常強度パターンが歪められ、したがってプライマーとプローブの設計を、たとえば同時に出願されている米国特許出願No.10/892,514, "Concurrent Optimization in Selection of Primer and Capture Probe Sets for Nuclear Acid Analysis"(2004年7月15日出願)の方法を用いて注意深く行い、非同族のプローブとターゲットの分子的相互作用を考慮して注意深く分析を行わないと、定量分析は不可能になる。
【0012】
遺伝子示差発現(「トランスクリプト・プロファイリング」):
これら標準的方法の問題点、および絶対発現レベルの定量測定における重大な不確実性や誤差の可能性を考慮して、実際上好まれる方法は示差発現分析である。この方法では、正常な組織または細胞と疾患その他の異常を持つ組織または細胞、或いは正常(「野生種」)植物と遺伝子組み換え植物における発現パターンの差を特徴づける。一般に行われている方法によれば、平板状の基板に一組のcDNAクローンを「スポット」してプローブアレイを形成し、正常および変異体起源のDNAを接触させる。起源の異なるDNAには異なった標識が施されており、プローブ・ターゲット複合体により形成されるパターンを2つのカラーチャンネルで記録することができるので、正常・変異両試料の発現比を求めることができる(たとえば米国特許No.6,110,426 (Stanford University)を参照)。2色蛍光検出のシステムは煩雑であり、スポットまたはその他の方法で符号化されたプローブアレイを読み取るために必要なレーザー走査装置を入念に較正する必要があり、また2つのカラーチャンネルを別個に走査しなければならない。このような難点は本発明に開示される減算法による示差発現分析により克服され、検出色は1色で済む。
【0013】
複雑なプロトコル:
一般的に行われている多重化発現プロファイリングの方法によれば、試料中のmRNA分子の逆転写により対応するcDNAを作成し、これをスポッティングまたはin situ合成により形成したオリゴヌクレオチドの捕捉プローブのアレイに接触させる。Lockhart et al.(米国特許No.6,410,229)は、cRNAを生成させるのにmRNAをcDNAに逆転写し、これを高率の標識(平均して8個中1個のdNTP)のもとでcRNAに転写し、第二の「修飾」段階を用いて合成オリゴヌクレオチドプローブのアレイで検出するという複雑なプロトコルを提示している。このように煩瑣で誤りが入りやすい、かつ高価なプロセスは方法を複雑にするばかりでなく、たとえば増幅の非線形性などによりメッセージ存在量の最終測定値の不確実性を著しく増大させることになる。
【0014】
先行技術において好まれる多重化発現分析の方法の一つは、ランダムに置かれた短い逆転写(RT)プライマーを用いて1組のRNAを不均一なcDNA集団に転換するか、または汎用RTプライマーをmRNAのpolyAテールに作用させて完全な長さのcDNAを得ることである。これらの方法では配列固有のRTプライマーを設計する必要はないが、いずれの方法も発現の定量的追跡のためには重大な欠点を有している。
【0015】
ランダムに置かれたRTプライマーを用いた場合、cDNAの代表的集団、すなわち各々のcDNAが等しい頻度で存在する集団が得られるのはmRNA分子の長さが無限大の極限においてのみである。指定された短いmRNAの組をランダムプライミングで分析すると、一般に混合物中のmRNAの各タイプに対して長さが大きく異なるcDNAが生成し、cDNA濃度の定量測定に大きな偏りが生ずる可能性がある。これは本明細書で述べるように、短いcDNAは長いcDNAよりも容易にアニールされ捕捉プローブに固定化されるためである。また全長にわたるRTに成功したとしても、完全な長さを持つcDNAはプローブとプライマーの間の交差反応を生ずる可能性のある配列部分を多く持つわけであるから、解釈は必然的に困難となり、信頼性が低下する結果になる。
【0016】
ターゲットとプローブの立体構造の役割:
溶液中のDNAは鎖のエントロピーで決まるポリマー特性を持つことが知られている(Larson et al.,”Hydrodynamics of a DNA molecule in a flow field”,Physical Review E 55:1794−97(1997)を参照)。特に単鎖DNA(ss)DNAは可撓性が大きく、そのことは実験的に興味のある条件のほとんどにおいて、持続長がヌクレオチド(nt)数個の程度にすぎないことに現れている。これは二本鎖DNAよりも相当に短い(Marko JF,Siggia ED:”Fluctuations and supercoiling of DNA”,22:625,506−508(1994))。したがって固定化プローブによるssDNAの捕捉では分子の立体構造の自由度に著しい制約が加わることになる。同時に、もし二本鎖が形成されれば、固相法による核酸分析では、侵入するターゲットの鎖に弾性変形で対応しなければならない。ターゲットとプローブの分子のポリマーとしての立体的位置関係の適合性については、核酸分析手法の設計においてこれまで十分な注意が払われてこなかった。
【0017】
以上の考察から、遺伝子発現分析(以下では多重化発現追跡(mEM)ともいう)の特に診断への応用に適した、柔軟性・迅速性・感度・特異性に優れた方法、組成物および試験プロトコルが望まれる。本発明は多重化発現追跡のためのそのような方法および組成物、特に迅速でカスタマイズ可能な多重化アッセイの設計のための方法および組成物ならびにプロトコル、好ましくはランダム符号化アレイによる検出を用いる複数分子の分析として実施されるプロトコルを開示するものである。平行出願において、信頼性をさらに向上させるための、望ましい転換プローブ(RTプライマーなど)および検出プローブ(たとえばハイブリダイゼーションにより媒介されるターゲットの捕捉のプローブ)の最適な組を選択する方法が開示されている(米国特許出願No.10/892,514 "Concurrent Optimization in Selection of Primer and Capture Probe Sets for Nucleic Acid Analysis"(2004年7月15日出願)を参照)。
【0018】
発明の要約
本明細書には、プローブおよびターゲットの処理法「エンジニアリング」、ターゲット鎖およびプローブの固定化(「グラフト」)層の弾性的性質その他種々の要因によるプローブとターゲットの親和性定数Kの変化に関するアッセイ信号の解析を含む、試料中のオリゴヌクレオチドの多重化解析法、およびダイナミックレンジ圧縮、オンチップ信号増幅等のアッセイ信号強度調整、配列の高度の類似性を示すメッセージの存在量の定量的測定のためのハイブリダイゼーションおよび伸長を媒介とする検出法の組み合わせ、たとえばmRNAの3'末端付近に位置する未翻訳のAUリッチな部分配列群の相対的発現レベルの同時測定と分類、および単一のカラーラベルのみを必要とする減算的遺伝子示差発現分析の新規な方法を開示する。
【0019】
さらに具体的には、下記に関する方法、設計および組成物を開示する:
【0020】
(i) プローブ・ターゲット間の親和性定数K(および対応するプローブとターゲットの「変性温度」)を変化させて、プローブ層の弾性的性質およびターゲットの拘束に関連するエントロピー効果を利用して検出感度を最適化すること:特に
− ターゲット(トランスクリプト)の長さと立体構造を制御すること;
− トランスクリプト内の捕捉部分配列の選択を制御すること、すなわちトランスクリプトの5'末端に隣接する部分配列を優先的に捕捉させること;
− 溶液中のターゲット濃度を制御すること;
− グラフトしたプローブ層の配置を制御すること;
− イオン強度とpHを制御し二重体の生成をプローブ・ターゲット領域に限定し、ターゲットの溶液中への再アニーリングを最小限にすること;
【0021】
(ii) 多重化遺伝子発現分析を実現するためのアッセイの最適な組成物を系統的に構成し、またそれから得られた強度パターンを解析すること;
【0022】
(iii) アッセイに関して下記の方法を確立すること:
− メッセージ在量の広いダイナミックレンジ(全反応容積10μlあたり約1〜10,000fmol)に対応するため、下記によってアッセイ信号強度のダイナミックレンジを調節すること;
− プローブ長さとターゲットの相互作用に応じてプローブ密度を制御することで、ターゲットの捕捉に影響する「充填」制約を制御すること;
− アレイの組成、すなわち結合部位の数を制御すること;
− トランスクリプトの長さ、トランスクリプトの存在量、標識密度を制御すること。
− 伸長を媒介とする配列固有の信号増幅により、感度を向上させること;
− ハイブリダイゼーションを媒介とする分析と、伸長を媒介とする分析とを組み合わせて高度に相同的な配列を検出することにより、特異性を向上させること;
− 単一の色を用いて「変異」および「正常」試料における特定遺伝子の発現レベルの差を検出できる減算法により示差発現分析を実施すること。
【0023】
検出の特異性を最適化するには、同時出願の米国特許出願No.10/892,514”Concurrent Optimization in Selection of Primer and Capture Probe Sets for Nucleic Acid Analysis”(2003年7月15日出願)(以下単に出願10/892,514ともいう)に述べられているように、プライマーとそれに対応するプローブを適切に選択することにより、多重化逆転写および検出の配列特異性を最適化する。
【0024】
これらの方法により感度と特異性を最適化すれば、指定された1組のmRNAをcDNAに逆転写し、対応するオリゴヌクレオチドプローブにそれらcDNAを捕捉して検出することにより、指定された1組の遺伝子の同時定量分析を迅速に行うことができる。この分析には本明細書に述べるような単純なプロトコルを用いることが好ましく、ターゲット増幅過程の省略によってプロトコルの単純化とアッセイの所要時間の短縮を図ることが好ましい。本明細書に述べる方法、プロトコルおよび設計は、平行多重化核酸分析、特に指定された1組の遺伝子の発現パターンの定量分析に極めて有用である。ここに指定された遺伝子の組は典型的には2〜100個、より典型的には10〜30個の異なるmRNA(「メッセージ」)を含み、この方法を以下多重化発現追跡(mEM)と呼ぶ。本明細書に述べる方法、プロトコルおよび設計は、米国特許出願No.10/204,799“Multianalyte molecular analysis using application−specific random particle arrays”(2002年8月23日出願)(本明細書を構成するものとして援用)に記載されたREADTM式多重化発現追跡と組み合わせて有利に用いることができる。
【0025】
種々の方法、設計および組成物の有用性と利点を以下に詳述する。下記は本発明の理解を助けるため本明細書に記載した図面の説明である。
【0026】
発明の詳細な説明
本明細書では、複数の核酸を対象とする、固定化オリゴヌクレオチドプローブへの捕捉による濃度(「存在量」)の決定方法、特に指定された遺伝子の組の発現レベルの同時(「多重化」)分析の信頼性を向上させるための系統的方法を含む、方法・プロトコル・設計を開示する。より特定的には、多重化遺伝子発現分析の感度、特定性およびダイナミックレンジを最適化する方法、更には単一の検出色のみを用いる減算法による示差発現分析を含むアッセイプロトコルを開示する。またターゲットと固定化プローブの相互作用の現象的記述を導入し、この過程を支配する親和性定数の実際の値を評価する。色で符号化した微粒子上の捕捉プローブの平面状アレイを形成する好ましい実施態様によれば、本明細書に記述するサイトカイン標準パネルの場合のようにターゲットの増幅を行う必要がなく、試料採取からデータ解析までの多重化発現分析を僅か3時間或いはそれ以下で行うことも可能である(図1及び図2)。本明細書ではこれらの方法および設計を、固定化オリゴヌクレオチドプローブによるターゲット核酸鎖の捕捉を含む種々の問題に適用する例によって説明する。
【0027】
I 感度とダイナミックレンジの最適化:プローブとターゲットの親和性の変更
I.1 ハイブリダイゼーション複合体(「二重体」)生成を支配する配列固有の親和性:
ハイブリダイゼーションによって媒介される2つのオリゴヌクレオチドの複合体の形成(「アニーリング」)の標準的な解析においては質量作用の法則を用いて、複合(結合)したプローブとターゲットの濃度c = [TP]と未複合(未結合、遊離)プローブの濃度(好ましくは符号化されたビード上の)p = [P]および未複合ターゲットの濃度t = [T]とを次のように関係づける:
[TP] = K[T][P]
または
c = Kpt
【0028】
「溶融温度」の計算の通常の方法と類比的に、現象論的な「直近」(“nearest neighbor”,NN)モデルを用いて、塩濃度、温度その他の与えられた実験条件のもとでのプローブ・ターゲット複合体内の隣接塩基対間の相互作用を表現し、(配列固有の)親和性定数を計算する。二重体生成の自由エネルギー(「結合エネルギー」、「凝縮エネルギー」とも呼ぶ)は次のように計算される。
ΔGC=ΔGNucleation+ΣiεNN−Pairs(ΔHi+TΔSi)
ここにΔHiとΔSiはそれぞれエンタルピー、エントロピーを示す。条件ΔGC=0から、二重体の安定度を評価するのに広く用いられている「溶融温度」TMが求められる。
【0029】
標準的な熱力学に従い、(配列固有の)親和性定数KSSは次式から計算される。
KSS=K0exp(−ΔGC/kT)
ここにK0は定数、kはBoltzmann定数である。
【0030】
親和性定数およびプローブとターゲットの初期濃度[P]0, [T]0が与えられれば、プローブ・ターゲット複合体の平衡濃度[TP]をターゲットの初期濃度[T]0の関数として表すことができる。
【0031】
この標準モデルを用いて、温度55℃、塩濃度2Mで、15ntから35ntの長さの異なる175ntのターゲットDNAと7種のDNAオリゴヌクレオチドプローブの複合体の溶融温度と親和性定数を計算した。ターゲットおよびプローブの配列は表I−1に示すとおりである。
【0032】
表I-1
【0033】
溶融温度と親和性定数の計算値を表I−2に示す。長いプローブに対して親和性定数が極めて大きいことは、長いプローブの方がターゲットの検出感度が高いことを予測させる。たとえば複数分子の分析のREAD法に従って色で符号化した直径3.2μmの微小球(「ビード」)を用い、ビードあたりのプローブの数を[P]0=105とすると、質量作用の法則により、21量体プローブによるターゲットの検出限界が次のように計算される。
[T]min=[PT]min/K[P]0=[PT]min/1.7×1010/M×105;
ここに[PT]minは確実に検出されるために必要なプローブ・ターゲット複合体のビード当たり最小数であり、[PT]min=103に対して
が得られる。この値は細胞1個あたりコピー1個のメッセージ存在量に相当する。
【0034】
表I-2
【0035】
I.2 ターゲットとプローブの立体構造の役割:アッセイ設計に対する意味
後述するように、ターゲットの大きさと立体構造、基板に固定化されたプローブの大きさ、立体構造、配置はプローブとターゲットの相互作用に大きく影響し、NNモデルから予測されたプローブとターゲットの親和性と実際の親和性との間に大きな乖離を生ずる原因となる。
【0036】
分析対象であるターゲットを固定化プローブに捕捉する際の立体構造の妨害的な作用(「立体障害」)、特に、プローブ接近性の重要性は周知である。たとえばGuisan,J.M.in “Immobilization of Enzymes and Cells”,Gordon F.Bickerstaff,Humana Press,Totowa,NJ,p.261−275(1997)を参照されたい。このため捕捉効率を高めるための経験的な方法として、好ましい長さのスペーサーを導入してプローブの「充填」に関連する制約を軽減することが提案されている。たとえばSouthern E.et al.,Nat.Genet.(suppl.)21,5−9(1999)を参照されたい。しかし本発明の方法は既知の方法と異なり、プローブとターゲットの相互作用を最適化する系統的な設計過程の基礎として、ターゲットとプローブ層各々の性質の間に基本的な関連を確立するものである。二重体形成の際にターゲットまたはその一部のプローブ層への進入を容易にするためには、プローブ層の圧縮率を最大にする必要があることが見出された。より一般的には、本発明の設計基準は基板に固定化したプローブの長さ、グラフト密度、静電荷、ターゲットの長さと立体構造、ターゲットの5’末端に対する捕捉部分配列の位置が捕捉効率、ひいてはアッセイ信号に及ぼす影響の本性と大きさを反映している。逆に、ターゲットの存在量を正確に決定するため、プローブとターゲットの相互作用を支配する再規格化定数を決定するための方法も開示する。
【0037】
本明細書では、プローブとターゲットの捕捉効率を変化させ、アッセイの感度・特異性・ダイナミックレンジを最適化するための、固定化捕捉プローブの大きさ・立体構造・配置およびターゲットの大きさ・立体構造の選択(捕捉部分配列の選択、アレイ組成およびプロトコルの選択を含む)に関する方法、設計、設計規則を開示する。
【0038】
設計基準を確立するため、基板に固定化されたプローブの長さ・グラフト密度・電荷、およびターゲットないしターゲットの指定された部分配列の大きさと立体構造が捕捉効率、したがってアッセイ信号に及ぼす影響の本性と大きさを開示する。これに関連する実験は、複数の分子の分析のためのランダム符号化アレイ検出(READ(登録商標))法に従って実施した。すなわちプローブを色で符号化したポリマー微粒子(「ビード」)に付着させ、ビードを平面状アレイとしてシリコンチップ上に配置した。米国特許出願No.10/204,799 "Multianalyte molecular analysis using application-specific random particle arrays"(2002年8月23日出願)(本明細書を構成するものとして援用)を参照されたい。プローブは5'末端への共有結合によってビードに末端グラフトすることが好ましい。合成によるモデルDNAターゲットおよび1200 ntのカナマイシンmRNA (Promega)の逆転写により生成させたモデルcDNAを用いた実験の解析から、ターゲットと固定化プローブとの相互作用において、そのような比較的短いターゲット鎖の場合も、ターゲットとプローブの立体構造が決定的な役割を演ずることが確認される。
【0039】
I.2.1 合成モデルターゲット:
長さ25〜175 ntの合成DNAターゲットの広い濃度範囲、および長さ15〜35 ntの捕捉プローブに対して結合等温線を作成した(表I-1および実施例Iを参照)。
【0040】
ターゲット長さの効果:
プローブとターゲットの捕捉効率に対するターゲット鎖の長さの影響を調べるため、長さ25nt,40nt,90nt,175ntで共通の部分配列を含む4つの合成DNAターゲット(表I−1参照)の末端を蛍光標識し、READ法に従って平面状アレイに配列した、色で符号化した直径3.2μmのビード上の19ntの捕捉プローブとハイブリダイズさせた。代表的な結合曲線から、ターゲット長さLの影響が大きいことが知られる。図3Aに示すように、飽和以下のいずれのターゲット濃度においても、ターゲットが長いほど得られる信号強度は小さくなる。ここで信号強度は各曲線について、飽和時の値を用いて規格化されている。
【0041】
親和性定数K*および利用可能な捕捉プローブの数密度[P]0 = p0のの実験的推定値は各プロファイルを質量作用の法則にあてはめて求められ、その結果は図3Bに示すとおりである。親和性を計算するため、ここでは信号強度Iをビード1個に捕捉されたターゲットの数cとターゲット1個あたりの蛍光発色団の数nFの積に比例する(I 〜nFc)ものと仮定した。Iとcの換算は実施例IIにおいて表I-3および図4に関連して述べる較正曲線を用いれば容易に行える。親和性定数の典型的な実測値はターゲットとプローブの長さがほぼ等しいときK* = 108/M程度であり、NNモデルで予測される値より1桁小さい(表I-2)。飽和時の占有部位の数p0の典型的な値はビード1個あたり105程度である。
【0042】
遺伝子発現分析において典型的な実験条件のもとでは、ターゲットの大きさはプローブの大きさを上回り、捕捉された各ターゲットはプローブ1個分より大きい空間を占める。したがって飽和は有限な表面積A0を持つビードに対するターゲットの数の限界NTSatを反映する。ビード表面が捕捉されたターゲットで修飾され、ターゲットが「緩んだ」立体構造をとり、ターゲットの特性的寸法が、回転半径RG,T〜aLν、ここで、νは特性指数を示し、理想的な鎖に対してはν=1/2、3次元で良好な溶媒内での自己排除的な鎖に対してはν=3/5、で決まるものと仮定すると、より小さいNTSatの値が得られ(deGennes,“Scaling Concepts in Polymer Physics”,Cornell University Press,1979)、最小のターゲットに対してはNTSat〜A0/RG,T2或いはNTSat〜1/Lである。p0をビード上に捕捉されたターゲットの飽和時の数NTSatと同一視すれば、最小のターゲット(L=25nt)に対して平均分子面積はAT〜4π(1.6μm)2/8*105〜4*103Å2となる。この値は(実験的)推定値
を用いて得られるATRelaxed〜πRG,T2〜6.5*103Å2に近い(Tinland et al,Macromolecules 30,5763(1997))。175ntのターゲットについて同様の比較を行うと
となる。これらの比較から、大きいターゲット分子の立体構造は緩んだ状態でなく、よりコンパクトな構造をとること、或いはターゲット分子が相互に孤立しておらず「重複」、所謂、相互進入していることが推測される。
【0043】
一定のターゲット濃度においては、信号強度のターゲット長さLへの依存性は1/Lxの形となる(図5)。ターゲット長さがL=25ntからL=175ntの範囲で、また各長さにおいてターゲット濃度が3桁(0.1nMから100nM)の範囲で変化するとき
である。19ntのプローブにはすべてのターゲットが同じ19ntの部分配列を介してハイブリダイズし(表I−1)、したがって二重体形成の「凝縮」エネルギーは同一であるにも関わらず、ターゲットの長さが増大すると信号強度が顕著に低下する。したがって捕捉プローブの長さが与えられたとき、ターゲットが長いほど二重体形成に不利であり、有効親和性は小さくなる。
【0044】
プローブとターゲットのハイブリダイゼーションを支配する有効親和力が冪乗則に従うことは、特定のターゲット鎖の長さに従って捕捉効率を調節する手段を提供する。このことは発現分析のような分野で、配列固有の逆転写(RT)プライマーを用いてcDNAの長さを制御できるため特に有用な設計基準となる。後に詳述するように、希なメッセージが短いcDNAに転換されることが、捕捉効率を最大化する上で好ましい。
【0045】
プローブ長さの効果:
図3に19ntのプローブについて示したような結合曲線を、長さ15nt〜35ntの一群の捕捉プローブに対して作成した。図6A、6Bには175tのターゲットに対する結合曲線を、質量作用の法則へのあてはめと共に示す。ここで上記のようにI〜nFc(nFは分子あたりの蛍光標識の(平均)数)と仮定している。この組から、あてはめによって親和性定数として
が得られ、これはNNモデルから予測される値の約1/20である(表I−2参照)。ターゲットの長さを25nt,90nt,175ntにそれぞれ固定したときの信号強度とプローブ長さとの関係を図7A〜7Cに示す。予想されるとおり強度プロファイルは、NNモデルから予測される値よりは小さいが、短いプローブに対するほど高くなる。しかしながら4点のターゲット長さすべてに対して、プローブ長さ約30ntでプロファイルはピークに達するか、または飽和する。これはNNモデルでは全く予想されない効果であり、後述するように、ターゲットが固定化プローブに捕捉されるためには、接近するターゲット鎖のみならず捕捉プローブ層にも弾性変形が起こらなければならないことを示唆するものである。
【0046】
I.2.2 カナマイシンmRNA:トランスクリプトの長さと捕捉配列の位置の選択
更に、合成ターゲットの場合のように、逆転写で得られたcDNA(以下「トランスクリプト」とも呼ぶ)の長さLを減少させると、同じmRNA濃度から得られた長いトランスクリプトに比べてアッセイ信号強度が系統的かつ顕著に増大することが示される。1200 ntのカナマイシンmRNA (Promega)について後述するように、適切な逆転写プライマーを選択することにより長さが約1000 ntから約50 ntにわたる種々のcDNAが生成する(実施例III)。cDNAの5'末端付近に捕捉部分配列を置くと更に信号が強化される。したがって捕捉プローブは望ましい形として、トランスクリプトの5'末端に近接した部分配列に適合するように設計した(図8A)。いずれの強化効果もターゲットと固定化プローブとの相互作用を支配する自由エネルギーに立体構造が大きく寄与していることを示すものである。これらの効果の結果として、配列に依存する親和性Kssは有効親和性K*(L) < Kssまで減少する。このことは固定化捕捉プローブおよびトランスクリプトの設計に対して、特に基板表面の利用可能な面積のうち吸着されたターゲットの占める部分の比率がある特性値γ* = c*/cmaxを超えるとき、重要な意味を持つ。
【0047】
複数プライマー・複数プローブ(mpmp)逆転写プロトコル:
いくつかの場合に、1つのmRNAテンプレートから複数のcDNAトランスクリプトを作成する可能性を考慮して複数の逆転写プライマーを使用した(図8A)。この過程ではmRNAの3'末端付近に位置する第1の逆転写プライマー含む短いcDNAが、mRNAの3'末端からより遠くにある第2の逆転写プライマーを含むより長いcDNAトランスクリプトで置換される。各cDNAに対して1つ以上の捕捉プローブ(この場合19 nt)が供給されるようにした(実施例IV)。多重化発現追跡のための実施態様においては、たとえば図9に示した形のREAD法を使用する。
【0048】
1.2.2A トランスクリプトの長さ縮小の効果:
I.2.1項に述べたモデル化合物のタイトレーションの結果から、トランスクリプトの長さを縮小することにより実際にアッセイ信号が顕著に強化されることが確認された。
【0049】
種々の初期濃度のカナマイシンのmRNAについてmpmp逆転写設計およびアッセイプロトコルにより行った一連の逆転写反応(実施例IV)により図8Bに支援すタイトレーション曲線が得られた。150 ntと1000 のトランスクリプトに対する信号を比較すると、蛍光発色団の数nFが1000 ntのトランスクリプトの方が多いにも関わらず、信号強度は36 nMから560 pMに至るmRNA濃度のいずれにおいても150 ntの方が高い。
【0050】
たとえばターゲット濃度1.13nMに対してはI150nt/I1000nt〜3である。移行濃度(図10Aに見られる屈曲点を参照)付近などで見られる約3倍の感度増加は、トランスクリプトの長さLを縮小したときに予想される強化効果と一致している。すなわちLを1000ntから150ntに減少させたときの感度増加はおよそ(1000/150)x(3/15)である。第1の因子はモデルターゲットについてI.2.1項に述べた(そこでは
であった)長さの縮小に対応し、第2の因子は、選ばれた線形標識密度において150量体のnF(150nt)〜3であり、nF(1000nt)〜15であることを反映している。x=3/2とするとこの強化効果は〜3.5となり、実験値と一致する。
【0051】
同様に、トランスクリプトの長さを1000 ntから50 ntに縮小すると約(1000/50)3/2(1/15) 〜6倍の強化効果がある。第1の因子は長さの縮小に関係し(x = 3/2とする)、第2の因子は、選ばれた標識密度において、50量体が平均1個の標識しか含んでいないことを反映している。
【0052】
直線化吸着等温線の表現:
タイトレーション曲線を直線化吸着等温線の形で表現すれば更に洞察を深めることができる。この表現は質量作用の法則から直接得られる。反応 P(プローブ)+ T(ターゲット)<−> C(プローブ・ターゲット複合体)に対する質量作用の法則は c = Kpt と書くことができる。ここにc, p, tはそれぞれの濃度、Kは親和性定数である。p = c - p0, t = c - t0(p0, t0はそれぞれプローブとターゲットの初期濃度)と置くと、c = K(c - p0)(p - t0) となり、ここに述べる実験のようにc << t0 であればc = K(p0 - c)t0或いはc = p0 - c/Kt0となる。タイトレーションの結果をこの形で表現すると(前記と同じくIはcに比例する、すなわちI 〜nFcと仮定する。nFはトランスクリプトあたりの蛍光発色団の数を示す)、cとc/Kt0との直線関係が明瞭になり、切片からp0が、勾配からKが求められる。特に、本文に述べたとおり、勾配の急激な変化は領域の移行を示す。
【0053】
図10Aは1000 ntと150 ntのトランスクリプトに対するタイトレーションの結果をこの形で示したものである。50 ntのトランスクリプトについて同様に得た等温線も共に示してある。3本の曲線のいずれも勾配の緩い、したがって親和性定数の大きい希釈領域から、勾配の急な、したがって親和性定数の小さい濃縮領域への移行を示している。希釈領域の勾配は3つのトランスクリプトを通じてほぼ一定であり、したがって対応する親和力係数もほぼ同一である。これに対して勾配、したがって有効親和性定数は濃縮領域ではトランスクリプトの長さによって異なる(表I-4参照)。
【0054】
表I-4
【0055】
表I-4に示すように、移行点(すべてのトランスクリプトにおいて濃度t0 = 1 nM前後で生ずる)において親和性定数は、1000 ntのトランスクリプトでは約1/20、150 ntおよび50 ntのトランスクリプトでは約1/2に低下する。すなわちトランスクリプトが短いほど有効親和性定数の減少幅は小さい。希釈領域では50 ntのトランスクリプトの吸着等温線の勾配は150 ntのトランスクリプトのそれの約 1/2.5であり、したがって前者の親和性定数がそれに応じて高いことが示されている。
【0056】
移行は以下の議論で示されるように被覆率 θ の小さいところで起こる。直線化吸着等温線を通常のLangmuir等温線1/(1 + 1/Kt0) = c/p0に変換すると、占有されたプローブの被覆率c/p0 = θ が知られる。これは後述のとおり正確には、t0における占有されたプローブの数と飽和点におけるそれとの比である。具体的にはたとえば図10Aの例で、濃縮領域から移行領域への外挿によりKt0 << 1、したがって1/Kt0 = p0/cである。上に求めた濃縮領域の有効親和性定数の値を用いると、移行点における占有された部位の分率 θ* = c*/p0は150 ntおよび1000 ntのトランスクリプトに対して約0.2となる。すなわち大きいトランスクリプトはビード上のプローブの利用できる部位の占有率が20%に達すると相互作用を始める。
【0057】
図11はc*とトランスクリプトの長さとの関係c〜1/Lyを示す。限られたものではあるが利用できるデータから
と推定される。この曲線は希釈領域(線より下)と濃縮領域(線より上)との境界を表している。一般に、希なメッセージの捕捉効率、したがって検出感度を高めるには、大きい有効親和性定数を利用するため希釈領域で作業するのが有利である。この利点はターゲットが長いときは特に著しい。ターゲットは検出を容易にするため複数個の箇所に、たとえば本明細書に示すように逆転写中に標識dNTPを導入することにより、標識を施すことが望ましい。反対に、実験的に記録された信号強度の解析に際しては、長さの異なるcDNAは存在量が等しくても一般に大きく異なった信号強度を生ずる可能性があることを考慮しなければならない。すなわちメッセージの存在量の決定の信頼性を確保するには、有効親和性定数を用いて溶液濃度を評価しなければならない。
【0058】
I.2.2B 捕捉プローブ位置の効果:末端捕捉配列:
本明細書にはまた、捕捉部分配列を長いトランスクリプトの5’末端付近に置くことによって、捕捉効率、したがってアッセイ信号および感度を支配する有効親和性が増大することを開示する。このことは1200ntのカナマイシンmRNAについて、逆転写プライマーならびに内部および末端プローブのアラインメントを示す図12Aに表されている。図12Bは500ntのトランスクリプトを2つの異なった(組の)19量体プローブに捕捉した場合のタイトレーションの結果を比較したもので、プローブの一方はトランスクリプトの5’末端付近の部分配列に、他方はトランスクリプト内部の部分配列にそれぞれ適合するものである。「末端」捕捉プローブを用いたときは「内部」プローブに比べて約1.5倍のアッセイ信号強度が記録されている。これらの結果を吸着等温線の形に変換すれば(図13)、捕捉部分配列をトランスクリプトの5’末端付近にとることが、長さを縮小した場合と類似の効果を持つことがわかる。このことは、末端部分配列を捕捉する際にはプローブ層もターゲットも立体構造の変化が少なくてすみ、したがって後述のように鎖のエントロピーに由来される反発効果が少ない点で、短いターゲットを使用するのと等価であるとの見方を支持するものである。
【0059】
以上に開示した結果が示すように、メッセージの存在量を定量的に決定するには、ターゲットと固定化プローブの相互作用を支配する有効親和性の注意深い解析が必要である。
【0060】
I.3 経験的な設計ルール:
「診断」のための発現プロファイリングにおいて検出すべきトランスクリプトの配列をアプリオリに知ることができれば、ターゲットの特定の配列に適合する捕捉プローブの設計が可能になり、好ましくは末端捕捉プローブを選択することによる感度の向上、c*以上または以下の作業領域を選択することによるダイナミックレンジの調節、および特異性の最適化を図ることができる。その方法および設計の詳細は米国特許出願No.10/892,514に詳述されている。
【0061】
下記の経験的設計ルールはプローブとターゲットの相互作用を最適化するのに有用である。これらのルールはまた第II章に述べるように信号強度パターンの解析において必要な補正を示すものである。
【0062】
1 ターゲットの長さを最小とすること
固定化プローブへのターゲットのハイブリダイゼーションを支配する有効親和性定数K* = K*(L)を最大化するため、ターゲットの長さLを最小化する。
【0063】
2 捕捉部分配列を5'末端付近に置くこと
与えられたターゲット長さに対して、指定された捕捉部分配列をできるだけターゲットの5'末端に近く置く。
【0064】
3 作業領域として希釈または濃縮領域のいずれかを選択すること
特定のターゲットと固定化プローブとの相互作用を支配する有効親和性定数K*を制御するために、希釈領域で大きいK*を実現するか、濃縮領域で小さいK*を実現するかを選択する。
【0065】
系:信号のダイナミックレンジを圧縮すること
存在量の大きいメッセージに対してはK*を小さくするため長いトランスクリプトを作成し、存在量の小さいメッセージに対してはK*を大きくするため短いトランスクリプトを作成することにより、与えられたメッセージ存在量の範囲に対応する信号強度の範囲を圧縮する。
【0066】
4 定量分析のためグラフト密度を調節すること
ターゲット濃度の定量分析を行うため、捕捉プローブの長さを、与えられたプローブのグラフト密度に対する最大値以内に限定し、或いはグラフト密度を所望のプローブ長さに対して飽和を避ける限度内に限定する。
【0067】
5 感度を最大化するため層の立体構造を調節すること
グラフト密度 σ を、ターゲットの進入速度を実質的に低下させない限りで最大化する。ただし σ を飽和時のターゲットあたりプローブ数の予め定められた小さい倍数に限定する。
【0068】
6 二重体の生成を制限すること(下記参照)
ターゲット・ターゲット二重体の生成を最小限とするように、バルクのイオン強度(および可能ならば pH)を、プローブ層内で著しく小さくならない限度内で調節する。
【0069】
これらの経験的ルールは、次章で述べる現象論的モデルに基づいて更に精密化することができる。
【0070】
II 固定化プローブ層へのターゲット捕捉のモデル
II.1 一般的記述
第I章に述べた観察結果を説明し、設計ルールを精密化して、最適なプローブ層とターゲットの立体構造を選択するための体系的な設計方法を確立するため、本発明においては一本鎖DNA(ss)DNAまたはRNAターゲットが、予め指定された「捕捉部分配列」に相補的な末端グラフトプローブ層に捕捉される過程の現象論的モデルを開示する。具体的にはこのモデルは、捕捉プローブと指定されたターゲットの部分配列との二重体の形成を、ターゲットの一部がプローブ層内に侵入することを要する吸着過程と見なす。その過程にはプローブ層の弾性変形、およびターゲット(の一部)の空間的限定(配置エントロピーの減少を伴う)が含まれる。このようにこのモデルでは固定化プローブとターゲットの複合体の形成を、プローブの「単分子層」が末端グラフトによってプローブとターゲットの「二重層」に変化する、グラフトの過程と見なす。
【0071】
多価電解質ブラシ:
一つの見方として、ここに示すモデルは変形可能な基板への多価電解質の吸着過程に類似するものである。この基板は多価電解質「ブラシ」、或いはある条件のもとでは末端グラフトされたポリマー「ブラシ」の特徴を持つ(図14、Pincus,Macromolecules 24,2912−2919(1991)(本明細書を構成するものとして援用)、またFleer et al.,Sec.4 in:”Polymers at Interfaces”,Chapman Hall,1993を参照)。面密度σの末端グラフトされたプローブ層において、隣接プローブ間の特性距離d(σ〜d−2)と、各プローブの緩んだ、或いは拡張した(「マッシュルーム型」)構造の特性寸法ξ⊥とは相互に関係づけられ、ξ⊥<<dである限りは各マッシュルームの立体構造は隣接するマッシュルームの影響を受けないが、プローブ鎖が重なるようになると「マッシュルーム」構造は拘束を受け、プローブは、次第に「伸長」構造を採用し、これによって、プローブ層は鎖の末端が自由表面を向いた「ブラシ」状の形をとる(Fleer et al.,op.cit.;Milner,Witten&Cates,Macromolecules 21,2610−2619(1988))。
【0072】
後述のように固定化オリゴヌクレオチドプローブ層内には高い電荷密度が出現しているため、様々な外部条件での作業が可能であり、したがってプローブ層の立体構造にも種々の可能性がある。これらは主としてプローブのグラフト密度 σ および有効電荷線密度f (0 < f < 1)によって決まり、溶液の条件、特にpH、温度および塩濃度CSへの応答として生ずる層内のプローブの解離度 α を反映する。
【0073】
たとえば溶液反応
の解離度をkとすると、αBulk:=[A−]/[AH]をkと[H+]で表してαBulk=1/{1+[H+]/k}と書ける。一般に[H+]>[H+]Bulk,α<αBulkであり、f=f(α)、より正確にはf=f(k,CBulkS)である。バルク溶液中の塩濃度CBulkSが低いときは、電気的中性を保つために対イオンがブラシ内部に保持され、そのため混合エントロピーが減少する。対応して働く浸透圧のため、鎖はグラフト密度の如何に関わらず完全に伸びると考えられる。逆にバルクの塩濃度が十分高ければ過剰な可動共イオンおよび対イオンがブラシに進入し、ブラシ内の静電的相互作用を遮蔽する。また捕捉された対イオンに対する浸透圧が低下するため鎖の緩んだ立体構造の出現(およびそれに対応する層の厚さの減少)が予想される。通常のハイブリダイゼーション実験でしばしば現れる高い塩濃度(約100mM〜2M)のもとでは、立体構造が崩壊し、対イオンが層全体に分布せず固定化されたプローブ鎖(またはプローブ・ターゲット二重体)に結合した状態となる。
【0074】
短い両親媒性分子の界面膜:
別の見方としてこのモデルは、空気-水界面または油-水界面に吸着された、燐脂質、界面活性剤、或いはある種のペプチドのような両親媒性分子の単分子膜(「Langmuir膜」)に蛋白質などの溶質が吸着される過程に類似している。このような膜に溶質分子を挿入するには膜が局所的に圧縮されなければならず、この圧縮は横方向の圧縮の場合と同様に鎖の充填状態と立体構造の変化を伴う。配向と立体構造の自由度の相互作用は、グラフト密度の関数として種々の相を生ずるが、現在の目的のために関心が持たれるのは横方向の圧縮率の高い共存領域である。以下の議論では高分子理論の用語を用いるが、界面に吸着された両親媒性分子の膜(「Langmuir膜」)の既知の相的挙動に依拠して、短いプローブ鎖に対して可能ないかなる拡張或いは精密化も本明細書の範囲内に属する。
【0075】
現象論的モデルは、ターゲットとプローブが二重体を形成するために必要な、ターゲットおよびプローブ層の立体構造の変形によって生ずる弾性的効果の重要な役割を、特にターゲットとプローブのいずれかが固定化されている場合について明らかにしようとするものである。更に、固定化プローブ層にターゲットを細くするための最適の作業方式を述べる経験的設計ルールの精密化、およびアッセイプロトコルの完成の基礎を与えるものでもある。そのようなプロトコルは、たとえば以下に信号増幅に関連して述べるように、ターゲットに媒介されポリメラーゼによって触媒されるプローブの伸長を要する場合があり、そのためにはプローブ層に酵素その他の成分を更に進入させなければならない。
【0076】
II.1.1 プローブ層の変形とターゲットの拘束:親和性定数の再規格化
末端グラフトされたプローブの層にターゲット(の一部)が進入すると、局所的にセグメント濃度が増加し、それに応じて浸透圧が発生する。さらにターゲットの進入によって層の弾性変形が生ずるが、これは図14に示すように鎖の伸長(「伸縮」)によって媒介される。浸透圧と鎖の伸長による弾性的エネルギーは進入するターゲットに対する反発力として働き、二重体生成の自由エネルギーに反発力の項GPを生じさせる。コロイド懸濁液のエントロピー的安定化に寄与するのはこの反発自由エネルギーであるが、グラフト層の最適な立体構造はそれに接触するコロイド粒子の上で鎖の相互浸透を最小にするようなものであり、ここで目的とする捕捉プローブ層の立体構造の最適化はターゲット鎖の層内への進入を容易にすることである。
【0077】
グラフト密度が極めて低い場合、たとえばd〜σ−1/2>>RG,Tの極限では、孤立したプローブが緩んだ立体構造(マッシュルーム型)をとっており、その大きさはRG,P〜aPν,ν=3/5であり、ターゲットの捕捉が進行する際に鎖の局所的な「充填」による制約を受けることはない。しかし捕捉されるターゲットの最大数は少なく、したがってアッセイ信号は弱い。反対にグラフト密度が高くd〜σ−1/2<ξT<<RG,Tであれば、特に鎖が完全に伸長する条件のもとでは、利用し得る捕捉プローブの数は多くなるが、層の横方向の圧縮率は低く、ターゲットは十分に捕捉されずアッセイ信号は弱くなる。ここにξTは部分的に伸長したターゲットの特性を示す「液滴」の大きさである。したがって固定化プローブ層によるターゲットの捕捉を最適化するには、圧縮率を実質的に減少させない限りで単位面積あたりのプローブ数を最大にする必要がある。たとえば与えられたターゲットの大きさTの部分が二重体形成に関与するものとすれば、大きさTの合成ターゲットを用い、外部条件を一定として、捕捉されたターゲットの分率を反映するアッセイ信号をグラフト密度の関数として求め、得られた曲線でピークまたはプラトーの出現位置を決めれば、最適のグラフト密度が求められる。例えば、可撓性の「バックボーン」に「間接的に」プローブを付着させ、これを更に固相に付着させる間接固定法も拘束を緩和するのに利用できる。米国特許出願No.10/947,095“Surface Immobilized Polyelectrolyte with Multiple Functional Groups Capable of Covalent Bonding to Biomolecules”(2004年9月22日出願)(本明細書を構成するものとして援用)を参照されたい。
【0078】
ターゲットまたはターゲットの一部は、捕捉配列との接触のため、プローブ層または既に形成されているプローブ・ターゲット複合層の局所的立体構造に適合しなければならない(図10B、図10C、図15参照)。これによるターゲット鎖への拘束、およびそれに対応する配置エントロピーの減少(希釈領域でも起こる)は二重体生成の自由エネルギーに反発力の項GTを生じさせる。ssDNAまたはRNAに加えられる拘束の程度は、溶液中の条件のもとでこれらの多価電解質がとる拘束のない(緩んだ)立体構造に依存し、配列固有の相互作用(折り畳み)を考慮しないとしてもなお複雑な挙動が予想される(たとえばSchiessel&Pincus,Macromolecules 31,7953−7959(1998)を参照)。具体例を挙げれば、ターゲットの長さT、大きさRG,T〜aTν,ν=3/5(ガウス的コイル構造を仮定)の部分が局所的グラフト密度σのプローブ層に進入する場合、ターゲットの変形の弾性エネルギーGT〜(RG,T/σ−1/2)2〜a2T2ν/σが必要である。すなわちターゲットのうちプローブ層に進入する部分の長さが隣接プローブ間の特性距離d〜σ−1/2に比べて大きいほど、それに必要なターゲットの変形が困難になる。
【0079】
プローブ・ターゲット複合体の形成を促進する、配列に固有の「凝縮」エネルギーGCは、自由エネルギーのこれらの反発項Gel=GP+GTにつり合わなければならない。すなわちプローブ・ターゲット複合体の形成を支配する自由エネルギーはG〜Gel−GCの形をとる。自由エネルギーのこの形の直接的な帰結の一つは配列に依存する親和性定数KSSの、有効親和性定数K*<KSSへの「再規格化」である。Gel<GCである限り凝縮は起こるが、自由エネルギーの実増加量は少なく、−ΔG*C=−ΔGC+Gel、>−ΔGCであり、それに対応して有効凝縮エネルギーが小さいことから有効親和性定数も小さくなる。
K*〜exp(−ΔG*C/RT)<KSS〜exp(−ΔGC/RT)
また「溶融温度」も低下し、T*M<TMとなる。ここにT*Mは条件ΔG(T*M)=ΔG*C(T*M)=0から定まり、TMは条件ΔGC(TM)=0から定まる。このように配列固有の値には大きな補正を見込む必要があり、実際、弾性効果によって二重体形成が完全に抑止されることもある。
【0080】
有効親和性定数を評価する方法の一つはここに述べる経験的方法であり、立体構造が既知のプローブ層と、長さTの興味ある部分のみから成る合成ターゲットおよび長さTの部分配列が全長L>Tの配列中に埋め込まれている別のターゲットとを使用して等温線の測定を行う。排除容積効果を無視すれば、与えられた長さPのプローブの層の立体構造は、グラフト密度σと有効電荷線密度f(0<f<1)で決まり、後者は実験条件、特にバルク溶液内の塩、pH、温度を反映する。これらの等温線測定から、種々のターゲット濃度領域における有効親和性定数を容易に求めることができる。
【0081】
この経験的方法に対して補完的な、有効親和性定数を評価する今ひとつの方法は、プローブ・ターゲット捕捉の現象論的モデルを用いて弾性的および静電的相互作用の効果を説明するものである。
【0082】
II.1.2 設計に関する考察
プローブ層の立体構造:優先グラフト密度:
与えられたグラフト密度σに対して、プローブ鎖の横方向の変位s⊥がdと同程度に、すなわち、
(Pはプローブ長さ、aはモノマーまたはセグメントの大きさ)となると、「マッシュルーム型」構造における隣接する鎖の重なりが生ずるようになる。ν=1/2のときこの条件はa2P〜d2〜1/σ、したがってP〜1/σa2となる。対象の捕捉プローブに対して好ましい長さPが与えられると、これ故にグラフティング密度は、好ましくはσ<1/a2Pのように最適化される。
【0083】
プローブグラフト密度における増加に相当する方法におけるセグメント密度を増加するターゲット進入を考察することは、この規則の修正を示唆する。捕捉プローブの優先長さPが与えられたとき、ターゲットの一部が進入して少なくともプローブと同程度のフットプリントを占めることを見越して、σeff=gσ<g/a2P、1/2<g<1となるようにグラフト密度を選ぶ。たとえばg=1/2すなわちT=P(末端捕捉の場合十分良い近似で成立する状況、図12A,12B,13参照)のときは、予想されるターゲットの進入に対応するためにはσeff<1/2a2Pとする。
【0084】
プローブ層の自由エネルギー:浸透圧と弾性変形:
ターゲット鎖またはその一部が末端グラフトされたプローブのブラシに進入すると、局所的セグメント密度φが増大する。面積A0、厚さD=D(σ)のブラシがnp本の鎖を含んでいる場合、φ〜S/A0D(σ)〜(np/A0)P/D(σ)(Pは鎖1本あたりセグメント数)、したがってφ〜σP/D(σ)である。φが増加すれば浸透圧Π〜φw(wは特性指数)が増大し、層の圧縮率
が減少する。セグメントが加わればその度に弾性変形が起こる。たとえば「小球」の連なりから成るブラシ(図14)では弾性変形により小球の「特性」寸法ξPが減少し、同時に鎖セグメントの伸長とそれに伴うブラシの厚さD=D(σ)の減少による自由エネルギー増加分も減少する。各小球がPB個のセグメントを含むとすれば、
したがって
である。各プローブ鎖の長さがPでブラシの厚さにわたってP/PB個の小球を含むとす
れば、
であり、ξP〜σ−1/2とすればD〜aPσ1/3となる。すなわちグラフト密度を増加させると鎖の伸長により層の厚さが増加する。このようなスケール関係は、鎖の弾性における反発力(排除容積効果、静電的相互作用など)と吸引力とのバランスから全く一般的に生ずるものである。
【0085】
グラフト密度の制御:
共有結合を介した末端グラフトによるプローブ層の形成で実現されるグラフト密度は、固相基板上の担体面に存在する吸着部位の横方向の密度により限定されるのでない限り、特性的吸着(結合)エネルギー(プローブあたりの)と、プローブ層が成長する際に追加されるプローブに対応するために必要な弾性変形などの反発力とのバランスを反映する。すなわちグラフト密度は鎖ごとの特性面積AP 〜d2 〜1/σ を定義する。この場合グラフト密度は固相担体の共有結合的官能化に関する条件、特にプローブ濃度およびインキュベーション条件を反映する。
【0086】
典型的な値である
における最大捕捉効率の実験値から、鎖1本あたりの特性的フットプリントξPが推定される。(直径3.2μmの)ビード1個が対応できるターゲット(長さL=25nt)の最大数の推定値として
(図6B)を用い、各ターゲットが大きさの等しいプローブに捕捉されてハイブリダイズすると仮定すると、ターゲット捕捉後の平均分子面積はAp〜π(1.6μm)2/2*6*105〜0.65*103Å2と推定され、これはプローブのグラフト密度
に対応する捕捉前の値の2倍に相当する。このことから、グラフトの過程は「自己限定的」であって、少なくともここで引用する実験に用いられている固相担体の形成の条件では、末端グラフトされたプローブの立体構造は緩んだ状態ではなく、部分的に伸長した構造であると考えられる。部分的伸長は特性半径
の「小球」の伸長した列の構造(Tinland et.al.,op.cit.)と適合する。ここにRG,Pは溶液中で拘束を受けないプローブ鎖の回転半径を表す。すなわち自己限定的過程で形成されたブラシにおいては
である。
【0087】
後述のように、高いグラフト密度、特にオリゴヌクレオチドプローブのin situ合成(Lipshutz, R.J. et al., Nat. Genet. (suppl.) 21, 20-24 (1999); Shchepinov, M.S. et al., Nucleic Acids research 25, 1155-1161 (1997)) の典型的条件で出現するようなものは、一般的には好ましくない。プローブのスポッティングでは末端グラフト層は形成されず、より複雑な「縮れ構造」の層が生ずる(Netz & Joanny, Macromolecules 32, 9013-9025 (1999))。この構造では分子が固相に複数個の(ランダムな)点で付着し、ターゲットが反応できるのはプローブの配列のごく一部で、それをアプリオリに知ることはできず、またスポットごとに大きく異なる。このような状況ではグラフト密度の制御は困難である。
【0088】
自己限定型の過程で生ずるよりも小さい、予め定められたσの値を実現するには、たとえば微小球の官能化の過程に中間段階を挿入することが考えられる。具体的には分子量が調節可能な二官能性ポリエチレングリコール(PEG)、ニュートラビジン、ストレプトアビジン、アビジンなどのビオチン結合蛋白質などの二官能性ポリマーの形をとる二官能性修飾剤、或いはその他の既知分子量のヘテロ官能性ポリマー架橋剤を用いて、プローブのグラフト密度に上限を設けることができる。この上限値は修飾剤分子の大きさとビード表面上でのその横方向の充填によって決まる(図16A, 16B)。READ法を用いた実施態様では、第1段階として色で符号化した微小球(ビード)に修飾剤を共有的に結合させ、第2段階で修飾剤を捕捉プローブの共有的結合により官能化する。このとき5'末端修飾のため、標準的な共役化学の方法を用いてアミン、ビオチンなどの官能基を導入することが好ましい。
【0089】
ターゲット鎖の拘束:
吸着の希釈領域と濃縮領域:ターゲットの進入に対するプローブ層の弾性的応答に関する議論から、吸着等温線の希釈領域と濃縮領域との間の移行(図10A)が、プローブ・ターゲット複合層の弾性変形によって起こることが推定される。移行の起こる点c*(L)に対して、限られたものではあるが利用できるデータからc* 〜1/L3/2と推定される(図11)。
【0090】
小さいターゲットの極限では、捕捉の主な効果は前述のとおりプローブ層内でのセグメント密度の増大であり、移行はプローブ層、或いはより一般的には特性寸法がξ^P<ξPで既に特性寸法がξ^T<ξTであるターゲットを捕捉している捕捉プローブが形成する層が、圧縮率の低い領域に移行することを表している。すなわち移行が生ずるのは、nT*ξ^T2+nP*ξ^P2〜η*A0、すなわちη*〜(nP*/A0)ξ^P2+(nT*/A0)ξ^T2〜p0ξ^P2+c*ξ^T2、したがってc*〜(η*−p0ξ^P2)/ξ^T2のときである。特別な場合として
ならばc*+p0〜η*/ξ^2、或いは
と仮定すればc*+p0〜η*/Lyである。さらに特別な場合としてnP*=nT*=n*ならばη*〜(n*/A0)ξ^PT2或いはc*=(n*/A0)〜η*/ξ^PT2である。ここにξ^PT2はプローブ・ターゲット二重体のフットプリントを表し、前と同じく
である。この限界値は短いターゲットを用いるか(実際上は得られないことが多い)、指定のターゲット配列をターゲットの5’末端付近に置くことによって達成することができる。本明細書には後者の可能性を図15に関連して例示する。
【0091】
これと対照的に大きいターゲットの極限では、「自己限定的」グラフト過程によるグラフトプローブ層の形成の場合と全く同様に、移行点は(全体としての)大きさL、特性的「フットプリント」ξ^T2の捕捉されたターゲットの層においてターゲット鎖の重なり(クラウディング)が始まる点を反映している。ターゲットの重なりは
のとき、すなわちc*〜nT*/A0〜η*/ξ^T2〜1/Lのときに起こる。ここに、η*A0は捕捉されたターゲットで被覆され得る面積の分率を示す。
【0092】
ターゲットの進入を考慮したグラフト密度の調節の精密化
第二の場合について導いた式は、図11に支援した境界線に従って希釈領域の実現を保証するようにプローブ層のグラフト密度を最適化するために使用できる設計ルールを示している。すなわち:
【0093】
「グラフト密度はc*〜η*/L+p0(または更に一般的な
の場合に対する類似の条件)が最大になるように調節する。たとえば好ましい実施態様においては、cDNAの場合について述べたようにRTプライマーを適用するなどの方法で具体的なターゲット長さLを選択し、ついでσを調節する」
【0094】
2つの限界値は、移行がプローブ・ターゲット複合層の弾性的応答における変化を反映する一般的な場合に対する特殊な場合を表すものである。プローブ・ターゲット複合層の弾性変形と、二重体形成に必要な拘束された立体構造をとるターゲットの弾性変形との組み合わせは、全長Lが増大する配列に埋め込まれた同一の捕捉部分配列Tを含むモデルターゲットに対する吸着等温線において、ターゲット捕捉効率が
に依存することを説明するためにも用いられる。したがって有限容積を「占める」有限の部分配列が容積RG,T3〜L3νの「コイル」内に見出される確率は〜1/L3ν,ν=3/5に従って変化する。
【0095】
低い(バルク)イオン強度の条件下でのターゲットの捕捉:多価電解質ブラシ:
本発明の好ましい実施態様に関連して本明細書に述べるグラフト密度の典型的な値、すなわち3.2μmのビード1個あたり約106(または約3*1012/cm2)は、層内の空間電荷密度zCPの大きい値に対応する。たとえば長さP=20のオリゴヌクレオチドに対して、対応するプローブ層の厚さD〜50Aとすると、プローブ鎖の濃度は
である。したがってバックボーンの(完全解離した)燐酸基に関係する電荷の局所的濃度はfCP〜200mM(f=20)となる。
【0096】
電気化学的平衡状態においては、プローブ層内およびバルク溶液内に存在するカチオンと(ポリ)アニオンの濃度は条件C+C−=CBulk+CBulk−によって関係づけられる。電気的中性の要求から、プローブ層内ではC−+fCP=C+,バルク溶液内ではCBulk+=CBulk−=CBulkである。したがって与えられた負電荷fCPに対して、層内のカチオン濃度はバルク溶液内のカチオン濃度よりかなり大きくなる。
【0097】
たとえばCBulk/fCP << 1の極限ではC+ 〜fCP >> CBulk である。すなわちイオン濃度勾配が大きくても対イオンはブラシ内に保持されている。実際、対イオンは、プローブ鎖が占有する一定容積だけブラシの容積Vよりも小さい有効容積Veffの全体にわたって分布している(Veff 〜V(1 - φ))。
【0098】
これに対応するDebye遮蔽長さξE〜1/κは鎖あたりのバックボーン電荷fCPに関係し、式κ2=4πlBfCPで求められる。ここにlB=e2/εTはBjerrum長さ、CP=P/d2Dである。ブラシ内に細くされた対イオンに起因する浸透圧Π=fCPTによる反発力と、鎖の弾性fCPT=κD/d2(κ=T/a2Pは弾性率)との釣り合いから、グラフト密度に関係なく
が得られ、したがって
となる。このスケールは鎖の間の平均距離d、したがってグラフト密度によって決まる。
の極限では任意の電荷f>0に対して鎖が伸長し、グラフト密度に関わりなくブラシ厚さが最大となる。グラフト密度が十分小さく、ターゲットの進入に対応できるなら、そのような層への捕捉は「剣山型」の立体構造で、プローブ層の著しい弾性変形なく進行する。「小球」型の立体構造に従う鎖の伸長への復帰は、遊離の共イオンおよび対イオンを添加し、それらのイオンに関連するDebye遮蔽長さκFree−1がξEと同程度、したがって
となるようにその濃度を選ぶことで実現される。そのように遮蔽されたブラシでは、内部の立体構造は定性的には「小球」の連鎖から成る半希釈ポリマーブラシに類似するが、電気化学的平衡を維持するためバルク溶液の条件に応答する。
【0099】
二重体生成の荷電プローブ層内への拘束:
この場合、ターゲットが曝露される塩溶液の濃度が通常は二重体を生成しないと考えられる1 mMであっても(Primrose, "Principles of Genome Analysis", Blackwell Science, 1995)、一旦プローブ層に進入すればこれより遥かに高い局所的塩濃度に遭遇し、静電的遮蔽の条件も二重体生成に有利である。すなわちプローブ層は、バルク溶液内の極めて苛酷な、ssDNAまたはRNAの二次的構造の生成に不利な名目的条件においても、プローブとターゲットのハイブリダイゼーションが可能な局所的化学環境を提供する。このようにしてバルクではdsDNAの再アニーリングを防止しつつプローブ層内では(局所的に)二重体を生成させることが可能である。このシナリオは好ましくは次のルールで実現される。
【0100】
「ブラシ内の強い電荷と電気的中性の条件を実現して二重体形成を可能にするようにグラフト密度を調節すると同時に、外部溶液中には二重体形成を防ぐ条件を選択する」
【0101】
【0102】
III アッセイの方法
この章では感度・ダイナミックレンジ・アッセイの特異性の最適化に関する、特に高度に相同的なメッセージの存在量の多重分析に関する種々の方法を開示し、更に単一の検出色のみを用いる減算法示差発現分析の設計戦略を開示する。
【0103】
III.1 信号強度の調整
核酸分析においては、分析対象のターゲットの濃度が広範囲にわたって変化することがある。従って、多重化発現追跡においては、対象とするメッセージの存在量は細胞1個あたりmRNAコピー1〜2個に対応する低濃度から104個以上に対応する高濃度にまでわたることが多い。最弱から最強に至るトランスクリプトの信号を同時に検出するために必要な4桁のダイナミックレンジは多くのカメラや記録装置の能力を超える。プローブとターゲットの親和性を変化させること、およびアレイの組成に関するいくつかの方法によって、既知の、或いは予想されるメッセージ存在量に対応して信号強度を調整することが可能である。
【0104】
III.1.1 アレイ組成の最適化:希釈領域および濃縮領域における作業
対象とするmRNAの部分配列から所望の長さのcDNAトランスクリプトを作成するための逆転写プライマーの選択、および細くのためのターゲットの5'末端配列の選択を本明細書の考察に従って行うことにより、プローブとターゲットの親和性を調節することができ、ターゲットの捕捉を示すアッセイ信号のダイナミックレンジの調整が可能である。
【0105】
トランスクリプトの長さの選択:
アッセイ設計の最も簡単なケースは、逆転写のみが要求され増幅が不要な場合であって、cDNA濃度は試料中のmRNAの存在量を反映する。すなわちターゲットの存在量が与えられる。このときトランスクリプトの長さ、或いは捕捉部分配列の位置を正しく選べば感度を最大にし、かつ有効親和性係数の調節によって信号のダイナミックレンジを圧縮することができる。
【0106】
希なメッセージを表すトランスクリプトの存在量の少なさを補償するため、短いトランスクリプト長さを選んで、できるだけ大きい有効親和性係数を得、かつ固定化プローブとトランスクリプトのハイブリダイゼーションによるアッセイ信号を最大化することが好ましい。これにより検出感度を最大化することができる。逆に一般的なメッセージを表すトランスクリプトの存在量の多さを補償するには、長いトランスクリプトを用いて有効親和性係数をなるべく小さくし、一般的なトランスクリプトと固定化プローブのハイブリダイゼーションによる信号を最小化するのが好ましい。このようにして希なメッセージと普通なメッセージのアッセイ信号を(ある程度)イコライズすることができる。
【0107】
トランスクリプトの存在量の調節:
より一般的に、最適なトランスクリプト長さの選択が更に制約される場合がある。たとえば本明細書で論じるように相同性の高い配列を分析する場合、5'末端付近の部分配列が試料中のターゲットの多く、或いは全部に共通であって、特定のターゲットを同定するため、さもなければ望ましい長さよりも長いcDNAを作成せざるを得ないことがある。そのような場合には、与えられた長さLに対して、ターゲットの存在量t0を、希なメッセージに対してはc*以下、一般的なメッセージに対してはc*以上の領域で作業できるように選択する(たとえば1回以上の減算増幅による、後述)ことが好ましい。
【0108】
捕捉部分配列の位置:
コピー数の少ないトランスクリプトの検出感度を高める別の方法は、トランスクリプトの中央部でなく5'末端付近に存在するターゲット部分配列に対応する捕捉プローブを用いることである。I章に述べたとおり、ターゲットの中央部は末端付近よりも接近しにくく、したがってプローブ層の大きい変形を必要とし、したがって有効親和性係数は小さい。
【0109】
いずれの方法によるとしても、好ましい設計は下記のいずれかを実現することを目標とする。
【0110】
【0111】
図11に関連してc*は希釈領域から濃縮領域への移行が起こる濃度、L*はこれに対応するトランスクリプトの長さ(L*:=L(c*))を示す。
【0112】
これに対応する設計手順は、II.2 章にアッセイ設計の最適化の一部として示した次の関数である。
SelectFinalTargetAbundance(L,L*,C)
SelectTargetLength(C,C*,SP)
SelectCaptureSequence(ProbeSeq)
【0113】
III.1.2 アレイ組成の制御:担体の重複数
特定のターゲットの予想される濃度に対して、特定のタイプのプローブの数を適合させることによって、ダイナミックレンジと検出感度を更に改善することができる。特に本発明における好ましい方法であるREAD法においては、プローブの数は特定のタイプの微小球(ビード)の数(以下「重複数」とも呼ぶ)を変化させることで容易に調節できる。設計ルールは、異なったタイプのビードの最適相対存在量を選択することを規定する。
【0114】
これに関連する方法として、Ekins(US5,807,755)は受容体・リガンド結合アッセイを行うため受容体のスポットアレイを設計する方法を論じている。この方法では受容体の濃度がリガンドの濃度よりもかなり低くなければならない。後述するように、これは[P]0とビードの数NBが共に小さい場合に対する下記の理論的記述に対応する。しかしEkinsは受容体濃度が高い領域についても、本発明に述べるようなダイナミックレンジの圧縮方法についても何ら考察しておらず、また受容体・リガンド相互作用の分析にランダムに符号化した微小球アレイを使用することについても、望ましいアッセイ条件を達成するために異なった種類のビードないしプローブの相対存在量を変化させることについても触れていない。
【0115】
問題の反応は、溶液中のターゲット分子(たとえばリガンドTを含む)と、固体担体(たとえば色で符号化したビード)上に付着した受容体分子P(たとえばプローブ)とが可逆的に複合体P・Tを形成する反応である。この反応は質量作用の法則と親和性係数Kに支配され、1つの受容体が1つのリガンドに結合する場合には
K
P+T←−→PT
と書かれる。質量作用の法則は、その基本形においてはビード上の複合体分子の数[PT]、ビード上の未複合受容体部位の数[P]、反応に関与し得る遊離リガンド分子の総数[T]の関係を表し、数学的には下記の形である。
K=[PT]/[P][T]
ビード上の受容体分子Pは濃度[p]0(p0)でビードに固定化されており、分析対象におけるリガンド分子Tの初期濃度は[T]0(t0)mol/l(M)である。
【0116】
任意の瞬間において表面上の複合体分子の濃度は[PT](c)分子/ビードであり、未複合の受容体部位の数、[T](t)はp0−cで与えられる。任意の瞬間において、反応に関与し得るリガンド分子の数は、初期の分子数と既に複合化された分子の数との差である。NB個のすべて受容体分子Pを持つビードNB個のアレイにおいては、形成された複合体の数はcNBに等しい。したがって分析対象の容積Vの溶液において、反応し得るリガンド分子の数はVNAt0−NBcとなる。ここにNAはAvogadro数である。これらを用いて質量作用の法則は
K=c/((p0−c)(t0−NBc/VNA))
と書ける。複合体の数cは各ビードに対する蛍光信号強度に正比例する。
【0117】
このシナリオでは2つの極限状態が考えられる。
【0118】
t0>>NBp0/VNA
分析対象内のリガンド分子の総数が受容体部位の総数より遥かに多い場合は、平衡にある系に数個のビードを加えても各ビード上の複合体分子の数はほとんど変化しない。すなわち複合体分子の数、したがってそのような複合体を持つビードからの信号強度はビードの数と無関係であると見なせる。
【0119】
t0>>NBP0/VNA
反応に関与し得る受容体部位の数がリガンド分子より遥かに多い場合は、平衡にある系に数個のビードを加えると、平衡を維持するためには複合化したリガンド分子のあるものが解離して新しいビード上に再分布しなければならない。実際、極限状態ではc=t0VNA/NBである。したがってリガンド分子の濃度が与えられたときビードあたりの複合体分子の数、したがってそれに対応する蛍光信号強度はビード数に反比例する。
【0120】
無次元変数Y=c/p0、X=Kt0、C=Kp0NB/NA/Vを導入すると、Kの式はY/(1−Y)=(X−CY)と書かれる。占有率YとC(ビード数に比例)およびX(無次元化したリガンド濃度)の関係を図17に示す。ビード数が少ないときはYはCに依存しない。これは上記(a)の状態に対応する。無次元変数で示せばX>>CのときY→X/(1+X)であってCとは無関係である。更にX>>1ならばY→1、すなわちリガンド濃度が高く親和性係数が大きければビードは完全に占有される。Cが大きくなるとYはCと共に単調に減少し、上記の(b)の状態ではY=X/Cである。
【0121】
検出感度:
ランダムに符号化されたアレイ内部での与えられた種類のビードの数を制御することは、所望の限界内の信号強度を発生させるのに好ましい手段である。1つのリガンドが1つの受容体に結合する最も簡単な場合には、ビードの数を図17の屈曲点Cknee = 1 + X以下に減らすことで最大の占有率が得られる。
【0122】
ダイナミックレンジの圧縮:
前述したように、多重化アッセイでは検出すべきリガンドの濃度に大きな差があることが多い。この濃度幅に対応する広範囲の信号を与えられた検出器のダイナミックレンジで処理するには、多重化反応に用いる各種類のビードの数を、それぞれに対応する分析対象の予想濃度に応じて調節することが一般的に望ましい。具体的には、低濃度の対象物質による弱い信号を検出可能になるように増強し、同時に高濃度の物質による強い信号を検出装置の飽和限界を超えない程度まで減衰させることが好ましい。
【0123】
ダイナミックレンジ圧縮による信号強度のイコライゼーションは次のような場合に特に望ましい。
【0124】
a) 分析対象溶液中のリガンド濃度が広範囲に変化することが知られている、または予想されるとき。
【0125】
b) あるリガンドの結合親和性が極めて弱いことが知られている、または予想されるとき。
【0126】
c) ある種のビードの受容体密度が低いことが知られている、または予想されるとき。
【0127】
たとえばリガンド2種、受容体2種の系でリガンドの濃度t0,1 >> t0,2ならば、それぞれに対応する受容体を持つビードの相対存在量をNB,1 >> NB,2となるように調節することが望ましい。この議論は多数のリガンドを含む溶液を、それらに対応する受容体を持つビードのアレイに接触させる場合にも容易に拡張できる。
【0128】
したがって組成最適化のためのアレイ設計ルールには下記の段階が含まれる。
【0129】
「各タイプのビード上の蛍光発色団または複合化分子の望ましい数cidを選択する。
1.p0,iの既知の、または予想される値に基づいて受容体・リガンドの対の各々についてYidを設定する。
2.分析対象物質の濃度と親和性係数の積としてXiを計算する。
3.受容体・リガンドの対の各々についてCid=Xi/Yid−1/(1−Yid)を計算する。
4.各タイプのビードの望ましい数をNB,id=CidVNA/p0,iKiとして計算する。
【0130】
実験的証明:
本明細書で述べるように、有効親和性定数は長さに依存して大きく変化することがある。たとえばカナマイシンの場合、濃縮領域においてKeff(L=50nt)/Keff(L=1000nt)〜10である。トランスクリプトの長さの選択とビードの重複数との相乗効果が極めて劇的である例を図18に示す。これは実施例Vのプロトコルに従い、反応容積20μl中に10,000fmol存在するカナマイシンcDNAの検出に約3000個のビードを、反応容積20μl中に2fmol存在するIL−8のcDNAの検出に約100個のビードをそれぞれ用いて作成した図である。
【0131】
図18に示すように、左から5番目と7番目の比の対には50ntと1000ntのカナマイシンのトランスクリプトがいずれも1000fmol存在するにも関わらず、それぞれの信号強度の測定値は1桁以上異なっている。更にまた図18に示すように、カナマイシンcDNAの存在量はIL−8cDNAの約5000倍であるのに対して信号強度は約20倍にすぎず、ダイナミックレンジ圧縮を端的に示している。
【0132】
このように2つのトランスクリプトの有効親和性定数の著しい差を補正しなければ、実験データの解析で求めたメッセージ存在量には大きな誤差が含まれることになる。
【0133】
絡み合い:
この例は、捕捉されたターゲットの信号強度が更に、溶液中のターゲット鎖の絡み合いに起因する影響を受けることを示すものである。すなわち、溶液中のターゲット濃度がある閾値t*を超えるとターゲット鎖の重なりが始まる。ターゲットがL個のヌクレオチドを含み、かつ空間構造がガウス型コイルであるとすれば、ターゲット濃度は簡単にt* = L/R3 〜a-3L1-3ν、或いはν = 3/5とすればt* 〜L-4/5となり、すなわちターゲットの容積分率は Φ* 〜L-4/5となる。長いターゲットに対してはφは極めて小さく、たとえば
である。例として
, L = 1000とすると回転半径は,
分子容積は
となり、103 fmolが分子1012個に相当するとすれば、ターゲットの占める容積は,
したがって
である。すなわちこの例では、カナマイシンの1000 ntのトランスクリプトの捕捉効率はターゲットの絡み合いによって更に低下すると予想される。
【0134】
更に必要に応じて、複数のプローブおよびプライマーが関与する同時逆転写反応を用いればmRNAの異なった初期希釈度に対応することができる。この場合生成物をプールして1つの多重化反応により検出を行う。
【0135】
III.1.3 示差式増幅:
希釈領域を支配する親和性定数は配列固有の親和性定数KSSに近づくので、存在量の低いメッセージを検出するために、特に本明細書において高度に相同的な配列の分析に関連して述べるように短いcDNAの設計が困難または不可能であるときに好適である。存在量の最も小さいトランスクリプトの濃度を希釈領域に対応する検出範囲に含ませるためにPCRサイクルを少数、たとえば3〜4回に限定するような逆転写PCRプロトコルを作成することが可能である。
【0136】
濃縮領域では親和性定数が減少するので、トランスクリプトを移行濃度以上に増幅すると収率が低下する。すなわち、ある与えられた長さのターゲットに対して、ターゲット増幅を行っても信号強度の増加は、トランスクリプトの捕捉を支配する有効親和性が長さに依存するので、特に濃縮領域では比較的僅かにとどまることがある。具体的には、存在量の多いトランスクリプトを飽和領域まで増幅したとすれば、それ以上増幅を行っても捕捉量は増加せず、したがって信号強度も増加しない。この飽和効果はアッセイの設計やアッセイ信号の解析の際には考慮されるが、なおターゲット濃度の定量評価において著しい誤差を生ずることがある。
【0137】
しかし本発明の方法に基づいて正しく考慮するならば、このシナリオを用いて、低存在量のメッセージの信号を、同数の増幅サイクルを経過した高存在量のメッセージの信号に対して、同一の多重化ターゲット増幅反応において増強する示差増幅によるダイナミックレンジ圧縮を行うことができる。
【0138】
プール:
より一般的には、高存在量と低存在量のメッセージの信号によるトランスクリプトの濃度を、ターゲットの長さに関わらず、予め定めた狭い濃度範囲内へイコライズすることが望ましい。この例ではターゲットを2つまたはそれ以上の群に分けて別個に多重化ターゲット増幅を行うことにより、高存在量のメッセージに対する増幅サイクル数を少なく、低存在量のメッセージに対する増幅サイクル数を多くする。
【0139】
III.1.14 標識密度:
希釈領域における作業では少数の捕捉トランスクリプトを検出する必要があるが、標識したdNTPを高い比率で含有させることによりこれが容易になる。本明細書に述べる例では、8 molの非標識dCTPに対して1 molの標識dCTPの比率で典型的な標識密度1:64が達成される。150 ntのトランスクリプトに対してはこの比はnF(150nt) 〜3を意味し、混合物中の更に短いトランスクリプトに対してはそれに応じて低い値となる。また逆転写の過程で2種類以上の標識dNTPを加えれば単位長さあたり標識数は更に増加する。たとえばある反応混合物に対してビオチンdATPとビオチンdCTPを共に用いれば一方のみを使用した場合よりも単位長さあたり標識が増加する。逆転写反応における試薬として標識ビオチンdATPと非標識ビオチンdATPを1:6.25の比率で用いた実験(詳細略)では、対照の末端標識cDNAに比べて、1000 ntのカナマイシンcDNAには約20個の標識ヌクレオチドが存在していた。
【0140】
より一般的には、示差的標識法は濃度の異なる捕捉トランスクリプトの補足による信号の強度をイコライズする一つの方法としても利用できる。これは好ましくはトランスクリプトの組に導入される標識の数を、既知の、或いは予想される存在量および長さのレベルに従って調節する。濃縮領域への移行に関連する限界値を超える長さのトランスクリプトに対して、より高い標識dNTP密度を保証することが好ましい。この場合、そのような長いトランスクリプトは有効親和性定数が小さく、固定化プローブに捕捉される数が少ないが、標識密度が高ければそれが補償され検出感度が向上する。もとより計算に際しては、ターゲットあたりの標識総数はターゲットの長さに比例することを考慮しなければならない。
【0141】
トランスクリプトの示差的標識を実施するには、逆転写反応のためにmRNA試料を2つ以上のチューブ(反応室)に分け、たとえばその1つでは短いトランスクリプトのみが生成し、他の1つでは長いトランスクリプトのみが生成するようにし、各逆転写反応において標識dNTPと非標識dNTPの比率を調節する(この比が大きいほどトランスクリプト中の標識が多くなる)。
【0142】
III.2 伸長に媒介される配列固有の信号の増幅
感度と特異性:
短い標識cDNAを生成させるアッセイ設計を用いて今日までに得られた結果によれば、mRNAまたはcDNAの増幅を用いず新規な増幅方法を使用して、長さ50〜70ntのカナマイシンcDNAの標識断片を反応容積10μl中1fmolのレベルで検出するのに十分な感度が得られている(図19)。
【0143】
実施例VIおよび図20, 21に示すように、ヒト臨床試料に通常見られるような複雑な環境において特定のmRNAを検出できるだけのレベルの特異性があるかどうかを「スパイク実験」により更に検証することができる。
【0144】
新規な信号増幅法:
より高い感度を達成するため、プローブの配列固有の伸長に続いて蛍光プローブによる修飾を用いて、cDNA捕捉後に信号を1桁増強する方法を開示する。この伸長媒介プロセス(図22)は数分間で実行でき、またたとえば低存在量のメッセージのみに対してcDNAの逆転写標識と組み合わせて選択的にも、或いはすべてのメッセージに対しても行うことができる。
【0145】
伸長の過程では、プローブとハイブリダイズされたトランスクリプトの5'末端が、その領域においてプローブと完全に適合する場合のみ伸長が起こる。米国特許出願No. 10/271,602 "Multiplexed Analysis of Polymorphic Loci by Concurrent Interrogation and Enzyme-Mediated Detection"(2002年10月15日出願)(本明細書を構成するものとして援用)を参照されたい。
【0146】
まずカナマイシンmRNA(ここでは濃度範囲1〜32fmol/20μl)を、たとえば逆転写反応中にCy3標識dCTPをcDNAに導入することにより標識する。実施例III,IV,Vおよび図9に示すようにこの標識cDNAを固定化捕捉プローブで捕捉する。捕捉されたターゲットによる信号を増強するため、ビオチニル化dCTP(Bio−14−dCTP)を用いてin−situ(「オンチップ」)でプローブ伸長反応を行わせる。ついで得られたビオチニル化伸長生成物をストレプトアビジン・フィコエリスリン複合体に接触させて、フィコエリスリンのタグに由来する顕著に強化された蛍光を発生させる(実施例II参照)。
【0147】
実際、図23に示すように、反応は定量的であり、広い濃度範囲にわたって10倍の増強が達成され、したがってメッセージ存在量の定量の精度が向上し、約3桁にわたるダイナミックレンジの全域にわたって2倍の強度変化が容易に検出できる。
【0148】
本明細書の実施例に述べるアッセイプロトコルとREAD方式の実施態様において、50〜70ntのトランスクリプトの捕捉によって発生した信号は、ターゲット増幅を行わずに(ただし上記の信号増幅を行って)、試料のcDNA濃度約0.1fmole/10μlの検出が可能であった(信号と未補正バックグラウンドの強度比2:1のレベルで)。これは細胞1個あたりコピー10〜30個の頻度で存在するmRNAを検出するのに十分な感度である(標準プロトコル(Lockhart,D.J.,Dong,H.,Byrne,M.C.,Follettie,M.T.,Gallo,M.V.,Chee,M.S.et al.,Nature Biotechnology 14:1675−1680(1996))と同様、mRNAは107個/mlの末梢血単核球から採取するものとする)。
【0149】
III.3 検出の特異性の最適化
複数のトランスクリプトと固定化した配列固有の検出プローブとの相互作用は、複数の競合反応の平衡とそれに対応する共親和性によって支配され、あるプローブと反応に関与し得るすべてのターゲットの部分配列との、またあるターゲット部分配列と一群の検出プローブとの相互作用の強さはこれらの因子によって測られる。多成分のプローブ・ターゲット反応系において、あるターゲットがそれに対応するもの以外の捕捉プローブと相互作用すれば、速度および平衡に対して好ましくない干渉が生ずる可能性がある。
【0150】
III.3.1 プライマーとプローブの選択の最適化
交差反応の危険はトランスクリプトが長いほど、また反応に関わるトランスクリプトの数が多いほど大きくなる。これは第1の(適合的な)部分配列に似た第2の部分配列に出会う条件付確率が、ターゲット配列が長いほど大きくなるからである。捕捉の特異性を向上させるための方法として、先行技術では予想される各ターゲットにそれぞれ対応する2つ以上のプローブを用いる「多座」方式の捕捉が知られている。しかしこの方式は、プローブアレイの設計が複雑になり、かつプローブの追加によって交差反応の危険も大きくなるため、多重化定量分析には一般に不適当である。
【0151】
したがって交差反応を最小限にするため、配列固有の逆転写プライマーをmRNAの3’末端付近に置くことにより短いトランスクリプトを生成させることが好ましい。これは本明細書に述べるエントロピー効果に対処するアッセイ設計としても好ましい方法である。このようなアッセイ設計は、配列固有の逆転写プライマーの選択および配列固有の検出プローブを、好ましくは同時出願のNo.60/487451(前記)の方法によって最適化することにより実施される。
【0152】
本発明による方法は、指定されたmRNAの配列のアプリオリな知識と、予想されるその存在量を利用して、各mRNAの特定領域に対応する逆転写プライマーとその位置を選択することにより、逆転写反応で生成するcDNAの長さと標識の程度を制御しようとするものである。ある種の場合には、指定された組において1つまたは複数のmRNAに対して複数の逆転写プライマーを使用し、対応するcDNAの分析に、それらcDNAの異なった部分配列に適合する複数のプローブを用いることが有利である。同時出願のNo.60/487,451(前記)に従って、この方法を本明細書においては、「複数プライマー・複数プローブ法」(mpmp法)と呼ぶ。さらに場合によっては、検出に先立って更に逆転写生成物の増幅を行うことが有利である。
【0153】
本発明によるこれらの特異性最適化方法は多くの応用分野において有用であり、その例を実施例VIIに示す。また実施例VIIIおよび図24A, 24Bに示すように、サイトカイン遺伝子の多重化分析においてもこれらの方法を用いることができる。
【0154】
III.3.2 複数プローブ検出による特異性の向上
hMAPとeMAPの組み合わせ:
本発明による他のアッセイ方式は、遺伝子ファミリーのメンバーが、(i) 配列に、たとえば3個またはそれ以上のヌクレオチドの挿入のような顕著な差異があり、かつ (ii) 配列が実質的に相同であるが一塩基変異多形(SNP)のような僅かな差異を持つような部分配列を近接して持つ場合に、メンバーを検出するのに有用である。そのような配列は実質的な類似性のため、従来のハイブリダイゼーションによるアッセイ法では交差ハイブリダイゼーションが多く起こり、識別が困難である。
【0155】
交差ハイブリダイゼーションの問題を解決しコストを低減するためには、伸長とハイブリダイゼーションを組み合わせた二重アッセイ方式によりファミリーメンバーを識別し、かつそれぞれの存在量を決定することができる。これは大きな差異のある領域を表すトランスクリプトを一部のプローブとハイブリダイズさせ、差異の小さい領域に対応するトランスクリプトを他のプローブとハイブリダイズさせて、伸長反応によって後者のトランスクリプトのみを検出する方法で、結果の特別な解析方法によってファミリーメンバーを検出することができる。すなわち、好ましくは配列固有の伸長反応を行わせることにより、遺伝子ファミリーの同一性を確保しつつ、同時にメッセージ存在量の定量測定のために伸長反応自体を利用するか(III.2項参照)、または伸長とハイブリダイゼーションを組み合わせて識別と定量とを行う方式によって、相同性の高い配列の間の僅かの差異も検出することができる。
【0156】
最も単純な例は、配列の著しく異なる領域(塩基3個が追加された部分)が1つ、SNPを1箇所持つ領域が1つあるような遺伝子ファミリーである。上記の方式によれば、4個のビードと2つの異なったトランスクリプト標識を使用する。図25Bに示したように、1つのビードにはプローブhP1を結合させ(3つの追加塩基を持つ領域P1へのハイブリダイゼーション)、他の符号化ビードの1つにはプローブhP2を結合させる(3つの追加塩基を持たない領域P2へのハイブリダイゼーション)。第3のビードにはプローブeP1を結合させ(通常の対立遺伝子を持つ領域eP1とのハイブリダイゼーション)、第4のビードにはプローブeP2を結合させる(対立遺伝子の変異形を持つ領域eP2とのハイブリダイゼーション)。各トランスクリプトの5’末端は、適当な標識を持つプライマーを用いて逆転写反応中に第1の色(「赤」)で標識する。eP1またはeP2プローブとハイブリダイズしたトランスクリプトを伸長させたときは、第2の色(「緑」)で標識した伸長ヌクレオチド(dNTPまたはddNTP)を用いて伸長生成物を標識する。
【0157】
試料のハイブリダイゼーションに続いてアレイを分析する。ビードhP1またはhP2に赤が出現すれば、トランスクリプト中にそれぞれP1またはP2が存在することが示される。eP1ビード上のトランスクリプトが伸長すれば(緑の標識により識別される)、eP1の通常の(「野生型」)対立遺伝子が捕捉されたことが、またeP2ビードが緑色を示せばeP2の変異対立遺伝子が捕捉されたことが示される。このようにして、1回の伸長反応のみを用い、ハイブリダイゼーションと伸長のパターンを分析することにより、両領域を持つトランスクリプトの存在が容易に検出できる。より複雑な差異のパターンを持つmRNAのファミリーも、適切な数の符号化ビードとハイブリダイゼーションおよび伸長反応を利用して、同様に分析することができる。
【0158】
III.3.2A AUリッチなmRNAの発現レベルと分類の同時決定
感染やストレスへの過渡的応答においてはメッセンジャーRNA(mRNA)の代謝回転が起こる。哺乳類細胞では大部分のmRNAは分解の最初の段階としてポリ(A)鎖の短縮を示す。mRNA分子の実質的な不安定化には3'非翻訳領域(UTR)のアデニレート・ウリジレート(AU)リッチな要素が関与する。疾病状態ではAUリッチ要素(ARE)を含む多くのmRNAが発現し、疾病反応における遺伝子発現を選択的に促進または阻害するように働くことがある。AREモチーフの中核となるのはAUUUAの5塩基配列である。AREには複数個のAUUUAモチーフが分散して含まれていることもあり、しばしばそれに近接してUリッチな配列またはUストレッチが存在する。AREには様々な種類のものが知られている。
【0159】
本明細書の方法によれば、異なった部分配列を識別でき、かつ1つの色素で染色できる(多色を必要としない)プローブを用いて、様々な種類のAREの中から特定のmRNA部分配列を識別することができ、またAREに関係する各々のmRNA部分配列の相対発現レベルを決定することができる。この方法ではまず数種類のプローブを、プローブの種類に応じて符号化したビードに付着させる。プローブはAREおよびポリAテールの上流側にあるmRNA固有の部分配列に相補的なcDNA領域とハイブリダイズするように選ばれる。AREと上流側のmRNA配列を逆転写し得るように選んだプライマーを用いて、mRNA試料から逆転写によりcDNAを生成させ、トランスクリプトを標識して、ハイブリダイゼーション条件下でビード上のプローブに接触させる。
【0160】
ハイブリダイゼーションに続いて、遺伝子の相対的発現の定量の一段階として、各ビードに関係する標識されたトランスクリプトを示すアッセイイメージを取得し、アレイ内の標識トランスクリプトの全体像を得る。AREの各種類を識別する段階では、cDNAとハイブリダイズしたビード上のプローブを伸長させ、その条件を新たに伸長した生成物(符号化したビードに付着している)にAREに対応する部分が含まれるように選ぶ。このためには4種のdNTPすべてを大過剰に加えて、比較的長いプローブ伸長が起こり得るようにする。ついでアッセイイメージを記録し、各ビード上のプローブ/トランスクリプトの種類を同定する。
【0161】
次に伸長したプローブのトランスクリプトを加熱などにより変性させ、各種AREに相補的なプローブのライブラリからの1つの配列の標識プローブにビード/プローブを順次接触させる。これらの「AREプローブ」は同一のアッセイ混合物に加えるのではなく、順次使用するので、すべて同一の色素で標識したものであってよい。AREプローブのハイブリダイゼーションの後に解読すれば、各ビードに、したがって個々の遺伝子配列に関係しているAREの種類を決定することができる。以上の工程を図26に模式的に示す。
【0162】
種々の時点でのin vivoにおける各遺伝子配列の相対発現レベルは、それぞれの時点での標識トランスクリプトからの相対信号に基づいて決定することができる。このような測定はAREに関係している、したがって屡々疾病状態に関係している遺伝子配列のモニタリングに有用である。
【0163】
III.3.2B 高度に相同的な配列の識別:トウモロコシの近交系
ここに詳述するような応用においては、問題とするターゲットと実質的に相同な配列を持つ数百数千のターゲットの集合の中から特定のターゲットを検出する必要がある。このような状況では、要求される配列の選択性はハイブリダイゼーションで実現できる限界を超える。適当なプライマーとプローブの組の選択については同時出願のNo.60/487,451(前記)に詳論されている。ここでは逆転写または増幅の少なくともいずれかによる配列固有の転換、およびハイブリダイゼーション(hMAP)または伸長(eMAP)による多重化検出の組み合わせを要する、具体的なアレイ設計およびアッセイプロトコルをいくつか開示する。これらのアッセイ設計および本発明の方法論の例として、いくつかの具体例を以下に述べる。
【0164】
ハイブリダイゼーションプローブを用いる伸長生成物の調査:
本発明による今ひとつのアッセイ方式は、遺伝子ファミリーに属する高度に相同的なメンバーを識別するのに有用であり、一連の伸長を介する検出法によるもので、伸長生成物を形成し得る部分集合をそれ以外の部分集合から、第1の色の検出標識を含めることにより識別する。次に伸長生成物中の特定の部分配列を同定することにより、第一の部分集合のメンバーを更に識別することができる。この識別には第2の色の識別ラベルで修飾したハイブリダイゼーションプローブを使用する。この方法の詳細は多型の「位相整合」に関連して米国特許出願No.10/271,602 "Multiplexed Analysis of Polymorphic Loci by Concurrent Interrogation and Enzyme-Mediated Detection"(2002年10月15日出願)に記載されており、また図27〜29に関連して実施例IXに更に記述されている(図27のDNA配列はSEQ ID NO.12, 図28のDNA配列はSEQ ID NO.13である)。
【0165】
III.4 単一色による検出を用いる減算法示差分析
本発明によるアッセイ方式の一つである減算式ハイブリダイゼーションは、異なるmRNAの示差的発現の決定に用いられる(図30)。この方法はたとえば、健常者と患者とでmRNAレベルが異なるようなある種の疾患ないし状態の診断に有効である。この方式では、指定されたmRNAを健常者(normal, N)と罹患者(variant, V)から抽出し、両試料のmRNA濃度を同一にする。これはたとえば両試料に共通の標準mRNAを含めることにより実現される。
【0166】
両試料のmRNAの逆転写反応によりセンスcDNA(それぞれcDNAN, cDNAVとする)を生成させる。第1の試料に使用する逆転写プライマーのみをタグで修飾し、後に鎖の選択が可能であるようにする。逆転写の後、タグ付きプライマーを含む試料、たとえばN試料から転写によりccDNAN(cDNANと相補的なDNA鎖)を生成させ、cDNANは酵素により消化する。
【0167】
次にcDNAVとccDNANを、この2つの相補的な鎖がアニールし得る条件で結合させて二重体を形成する。この段階で両試料に等しい量のDNAが除かれる(減算)。指定された1つ以上の遺伝子がV試料中で発現不足であると、N試料中には対応する量の過剰が残り、反対に指定された1つ以上の遺伝子がV試料中で発現過剰であれば対応するV試料に過剰が残る。過剰の単鎖DNAは符号化したセンスプローブとアンチセンスプローブの対を用いて検出することができる(一方がcDNAVに、他方がccDNANに適合する)。センスプローブとアンチセンスプローブとの組は符号化した微粒子(ビード)に付着させてランダム符号化アレイを形成することが望ましい。
【0168】
この結合試料をセンスおよびアンチセンスプローブの組に接触させ、ハイブリダイズしたトランスクリプトを、たとえばビードの組に捕捉されたトランスクリプトからの蛍光信号を記録することによって検出する。標識は蛍光性逆転写プライマー或いは標識dNTPを含めることで行うことができる。センスプローブとアンチセンスプローブの組の各々において、強度の差は対応するトランスクリプトにおける過剰の符号と量を示している。特記すべきは、標準的な比率分析方法と異なり、1つの色しか必要とされないことである。
【0169】
IV 一般的開示
ランダム符号化アレイ検出法(READ):
多重化定量分析の方法においては、符号化された微小球(ビード)に付着させたオリゴヌクレオチドのアレイを用い、その解読によって符号化ビードの各種類上のプローブを同定することが好ましい。符号化したビードの組は平面基板上にランダムな平面状アレイとして配列することが好ましく、これによって顕微鏡による検査・分析が可能になる。ビード1個に結合したターゲットの量は信号強度を監視することにより知ることができる。符号化ビードに施す標識、およびアレイ内のプローブに結合したトランスクリプトに施す標識は、異なった色を区別し得るフィルターを用いて識別できる蛍光標識であることが好ましい。このアッセイ方式は米国特許出願No.10/204,799 "Multianalyte molecular analysis using application-specific random particle arrays"(2002年8月23日出願)(本明細書を構成するものとして援用)に更に詳しく記述されている。
【0170】
プローブで官能化された符号化微小球(ビード):
プローブを付着させる粒子の材質としては、たとえばプラスチック、セラミック、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性材料、トリアゾル、黒鉛、二酸化チタン、ラテックス、セファロースなどの架橋デキストラン、セルロース、ナイロン、架橋ミセル、テフロンなどが可能である(たとえばBangs Laboratories,Fishers,IN発行の“Microsphere Detection Guide”を参照)。粒子は必ずしも球形である必要はなく、また多孔質であってもよい。粒子の寸法はnm級(たとえば100nm)からmm級(たとえば1mm)まで可能であるが、約0.2ミクロン〜約200ミクロンが好ましく、約0.5ミクロン〜約5ミクロンが更に好ましい。
【0171】
粒子は表面に付着させる配列固有のプローブに対応するように符号化する。プローブは化学的または物理的に識別し得る特性、たとえば蛍光により一義的に識別可能とする。科学的、光学的または物理的特性を付与するには、たとえば励起波長、発光波長、励起状態の寿命、或いは発光強度によりスペクトル的に区別し得る、1種またはそれ以上の蛍光発色団または発色団を持つ色素のような、光学的に識別可能なタグによってビードを染色する。光学的に識別可能なタグは、たとえば米国特許No.4,717,655 (Fulwyler)に開示されているように、ビードを特定の比率で染色するように使用することもできる。染色はまた当業者に周知の方法で粒子を膨潤させて行うこともできる(たとえばMolday, Dreyer, Rembaum & Yen, J. Mol. Biol. 64, 75-88 (1975); L. Bangs, Uniform Latex Particles, Seragen Diagnostics, 1984を参照)。これらの手法により、2種の色素をそれぞれ4水準の強度で、かつ公称4種のモル比で混合して用いて最大12種のビードを膨潤およびバルク染色により符号化した。或いは国際出願PCT/US 98/10719(本明細書を構成するものとして援用)に記載されている組み合わせ色彩符号化も、ビードのアレイに光学的に識別可能なタグを付与するのに利用することができる。
【0172】
プローブ:
アッセイにおいては配列固有のプローブ、いわゆる「捕捉プローブセット」を使用する。捕捉プローブセットの各メンバーは、好ましくは同時出願のNo.10/847,046“Hybridization−Mediated Analysis of Polymorphisms(hMAP)”(2004年5月17日出願)に記載の方法により、1つの「対応」cDNAターゲット分子に相補的な固有の領域を持つように設計される。前述のとおり捕捉プローブセットの各メンバーの相補的領域の長さは、結合の親和力を調節するために異なる場合がある。
【0173】
これらのオリゴヌクレオチドプローブは5’末端に、ニュートラアビジンの付着によって官能化された微小粒子との結合のためにビオチニル化TEGスペーサーを、或いはカルボキシル化ビードとEDAC反応を用いた官能化微粒子表面との共有結合のためにアミノ化TEGスペーサー(Synthegen TX)を、それぞれ含むように合成することができる。
【0174】
逆転写:
これらのアッセイに使用する全RNAは分離後cDNAに逆転写し、このcDNA分子をdNTPまたはddNTPとDNAポリメラーゼを含む溶液の存在下で添加して、ターゲットの5'末端と完全に適合する相補的配列を持つプローブ上でcDNAを伸長させる。dNTP/ddNTP混合物は、伸長したターゲットに蛍光標識を導入するため、少なくとも1つの標識dNTPまたはddNTPを含む。cDNAターゲット分子は前述のように蛍光標識され、その蛍光標識密度(たとえば蛍光標識されたdNTPの導入の程度)は、対応するmRNAの予想発現レベルの高低によって異なる。更に、トランスクリプトのプローブとの結合領域がハイブリダイゼーションのパターンに影響し、プローブが末端に結合する方が容易である。詳細は後述の実施例において示す。
【0175】
アレイの構成法:
特定のプローブの組み合わせを含むアレイを作成するには、符号化しプローブで修飾したビードをプールしてアレイに構成する。アレイの構成法には多くの方法があるが、その一つにLEAPSTM(Light−Controlled Electrokinetic Assembly of Particles Near Surfaces)と呼ばれるものがあり、米国特許No.6,251,691(本明細書を構成するものとして援用)に記述されている。この方法ではまず平面電極と、それに実質的に平行な第2の平面電極のサイドイッチ構造を作成し、両電極間のギャップに電解質溶液のような分極性液体を満たす。第2の平面電極の内表面には低インピーダンスの部分が得られるようなパターンを設ける。次にビードをギャップに入れ、ギャップに交流電圧を印加すると、ビードは第2の平面電極上でパターンに従ってランダムに符号化されたアレイを形成する。或いは第2の平面電極上の照明パターンを利用することもできる。この方法で得られるアレイは、その特徴の密度を極めて高くとることができる。粒子アレイを構成する別の方法は米国特許出願No.10/192,352“Arrays of Microparticles and Methods of Preparation Thereof”(2002年7月9日出願)に記載されている。
【0176】
解読イメージ:
本発明によるアッセイでは、一群の粒子を明確な化学的または物理的特性によって符号化し、アッセイ前後において粒子の種類を決定できるようにする。解読を行うには、アッセイの前または後にアレイ中の符号化粒子の空間分布を記録することにより解読イメージを得る。この分布は捕捉プローブセットのメンバーの空間分布に対応する。
【0177】
光学的シグネチャとアッセイイメージ:
捕捉されたターゲットの検出を容易にするため、逆転写中に予め定められたモル比の標識dNTPを加えることによりcDNAを蛍光標識する。加えるdNTPの総量は逆転写で得られるトランスクリプトの長さによって異なる。本発明によるアッセイは、ハイブリダイゼーションに媒介される捕捉の代わりに、或いはこれに加えて、伸長に媒介される捕捉をも包含する。すなわちdNTPまたはddNTPおよびDNAポリメラーゼを含む溶液の存在下でcDNAを添加し、3'末端が捕捉されたターゲットと相補的なプローブに付着したcDNAを伸長させる。伸長させたプローブに蛍光標識を導入するため、dNTP/ddNTP混合物に少なくとも1つの標識dNTPまたはddNTPを含有させる。
【0178】
符号化ビードに施した標識およびプローブに結合したトランスクリプトに施した標識は好ましくは蛍光性であり、異なった励起・発光波長を判別できるフィルターの組み合わせ、すなわち基礎色の種々の組み合わせを用いて識別することができる。READ方式による好ましい実施態様においては、ビードにより顕微鏡などで容易に検査・分析が可能な平面状アレイを構成する。ターゲットの捕捉および分析において生成される光学的シグネチャの強度を監視することにより、捕捉されたターゲットの量が示される。
【0179】
解読イメージおよびアッセイイメージの記録:
アレイ中の粒子を解読しプローブに捕捉されたcDNA分子のアレイからのアッセイ信号を検出するには蛍光顕微鏡を用いる。解読装置の蛍光フィルターセットは、粒子の染色に用いた符号化色素の発生する蛍光を識別できるように設計され、他のフィルターセットはトランスクリプト/単位複製配列に関係する色素によるアッセイ信号を識別できるように設計される。解読イメージおよびアッセイイメージの記録装置にはCCDカメラを組み込むことができる。アッセイイメージを解析して、信号の空間分布とそれに対応するアレイ中の符号化粒子の空間分布との相関から捕捉されたターゲットの各々を同定する。
【0180】
アッセイ:
解読の前または後に、符号化粒子のアレイをcDNAターゲット分子に、粒子上のプローブによる捕捉が可能な条件化で接触させる。反応時間の経過後に符号化粒子アレイを1x TMACで洗浄して残留する遊離cDNAおよび弱く結合したcDNA分子を除去する。ハイブリダイゼーションによるアッセイに代わって、或いはこれに加えて、本発明のアッセイは伸長による検出法をも包含する。
【0181】
ついでアレイのアッセイイメージを取得することによりアレイのプローブ・cDNA複合体の光学的信号を記録する。各種類の粒子はそれぞれ配列固有のプローブと一対一に対応しているから、たとえばアッセイ前に取得した解読イメージとアッセイイメージとを比較すれば、アニールされたcDNA分子を同定することができ、それらの各々の存在量(それぞれに対応する元のmRNAの存在量に直接関連する)を、各種類の粒子の蛍光強度から決定することができる。
【0182】
以下に述べる実施例は、本発明の構成および利用に関して更に詳細を示すものである。
【0183】
実施例I:プローブおよびトランスクリプトの長さの捕捉効率への影響
長さが異なる25量体から175量体までにわたる合成DNAポリヌクレオチドターゲットを合成し(IDT, Madison, WIによる)。長いターゲットはそれぞれ短いターゲットを内部の部分配列として含んでいる。Cy5蛍光標識を用いてすべてのターゲットの5'末端を標識した。長さ15〜35 ntのアミン修飾(5'末端)オリゴヌクレオチドプローブも同様に合成した(IDT, Madison, WI)。配列の詳細を表I-1に示した。
【0184】
プローブは当業者に周知の方法により、符号化したトシル化微粒子にEDAC反応によって共有的に結合させた。予め計算した量の合成ターゲットの各々を脱塩水中10μMの原液から採取し、1xTMAC(4.5M テトラエチル塩化アンモニウム、75mM Tris pH8.0、3mM EDTA、0.15% SDS)で所定の最終濃度まで希釈した。表I−1に示すプローブの1種以上を蛍光微粒子で官能化した後、シリコン基板上に平面アレイを構成した。合成ターゲット20mlを基板表面に加え、基板を55℃のヒーターに入れ、20分後に取り出してターゲット溶液を吸引した。基板を1xTMACで室温で3回洗浄し、ついで10μlの1xTMACを基板上においてカバーグラスで覆い、アレイの蛍光強度を記録した。以上のハイブリダイゼーション実験の結果を図3,5,6,7に示した。
【0185】
実施例II:粒子1個あたりの蛍光発色団の絶対数の決定
市販のQuantiBRITETM PE フィコエリスリン蛍光定量キット(Becton−Dickinson,Franklin Lakes,NJ製)を用いた実験を行った。このキットは6.6μmのポリマービードの表面に既知量のフィコエリスリン(PE)分子を結合させたものである。ビードに由来する蛍光強度の定量測定のため、ビードのランダム平面アレイをシリコンウェハー表面に構成し、適当な蛍光フィルターとCCDカメラを備えた蛍光顕微鏡を用いて、粒子表面のPEの蛍光発色団からの蛍光の強度を表面に付着したPE発色団の数(データは製造者による)の関数として追跡した。この実験では測定に150Wのキセノンアークランプを備えたNikon Eclipse E−600FNエピ蛍光顕微鏡、Nikon 20x 0.75 NA対物鏡、R&B PEフィルターキューブ(Chroma Technology Corp.,Battleboro,VT)を用いた。イメージは冷却した16ビットCCDカメラ(Apogee Instruments Inc.)により記録した。この実験における露出/積分時間は500msであった。イメージの取得と解析にはパソコン上のMATLABTMを用いて開発したユーザーインターフェイス付きプログラムを使用した。結果を図4に示す。これにより粒子1個あたり約100個(すなわち1PE分子/μm2)のPE分子がこの方法で検出できることがわかる。
【0186】
R-フィコエリスリンと一般的なCY色素2種の蛍光性を表I-3に示す。
【0187】
表I-3
【0188】
すなわちPE分子1個はCy3分子約60個、或いはCy5分子約20個と等価である。したがってCy3分子約60個/μm2、Cy5分子約20個/μm2の検出感度が予想される。2μmの球の表面積は約12.5μm2であるから、検出されるためには1個あたりCy3分子750個、またはCy5分子250個が必要である。3ミクロンの球ならば対応する値はそれぞれCy3分子1700個、Cy5分子600個となる。したがって(2〜3ミクロン粒子の球に対して)Cy色素を用いた場合の検出感度の安全な予測は粒子1個あたり蛍光発色団約1000個となる。
【0189】
同様に、前述のとおり曲線の勾配を、記録された生の強度データから1μm2あたり分子数を求めるための(PE以外の色素を用いた場合に)近似的な換算係数として利用することもでき、さらにビードの大きさが既知ならばビード1個あたりの蛍光発色団の数を知ることができる。
【0190】
実施例III:迅速発現追跡の一般的プロトコル
多重化発現追跡の典型的な実験プロトコルは次のとおりである。本発明の方法に従って最適状態を確立するプロトコルを以下に述べる。本発明の方法による信号増幅を含むプロトコル全体は3時間以内に完了可能である(図1、図2参照)。
【0191】
段階1:
Qiagenシリカゲル膜を用いて、全RNAを血液または組織検体から分離する。対象とするmRNAの配列と相補的な配列を持つDNAオリゴヌクレオチドを添加し、mRNAのcDNAへの逆転写を準備する。
【0192】
段階2:
mRNAを含む溶液を65℃で、典型的には5分間加熱し、プライマーのアニーリングによるmRNAの変性を容易にする。ついで溶液を室温まで、典型的には2℃/minの速度で徐冷し、逆転写酵素(たとえばContech Superscript III)と蛍光標識dNTP(典型的には標識と非標識dCTPのモル比1:8)を添加して逆転写反応を開始する。標識cDNAの合成の後、RNアーゼを用いてRNAテンプレートを消化する。
【0193】
段階3:
READ方式に従い、シリコンチップ上の、DNAオリゴヌクレオチド捕捉プローブを付着させた色符号化微粒子のアレイ(図9)に蛍光標識cDNAを1x TMAC緩衝液中で50°Cで30分間アニールさせる。ハイブリダイゼーションに続いて1x TMAC緩衝液で3回洗浄し、各回ごとに緩衝液を交換する。
【0194】
必要に応じて、前述した本発明による信号増幅を実施してもよい。
【0195】
捕捉プローブの配列は、混合物中の各cDNAの3'領域に対して相補的に設計されている。cDNAの多重化分析に用いる捕捉プローブ配列の最適化の詳細は同時出願のNo.10/892,514 "Concurrent Optimizaion in Selection of Primer and Capture Probe Sets for Nucleic Acid Analysis"(2003年7月15日出願)に記載されている。アレイは本明細書の方法によって構成する。
【0196】
段階4:
米国暫定出願No.10/714,203 "Analysis, Secure Access to, and Transmission of Array Images"(2003年11月14日出願)に詳述されているアレイ自動イメージングシステムを用い、即時イメージング(天啓的には積分時間1秒以下)により、得られた蛍光のパターンを蛍光イメージとして記録する。手動の蛍光顕微鏡を用いることもできる。本明細書に記載の方法でアッセイイメージを解析することにより強度を定量的に測定する。この方法の詳細はNo.10/714,203明細書に記述されている。
【0197】
実施例IV:カナマイシンmRNAの分析(実施例IIIのプロトコルの使用)
実施例IVA:mpmp逆転写法の設計とトランスクリプトの標識
Cy3修飾逆転写プライマー6種と微小球上の複数の捕捉プローブを用いるmpmp逆転写法を、1:2の比率で順次希釈した一連のカナマイシン溶液の各1回ずつの反応に適用した。長さ79〜150 ntの断片の混合物を作成し、各断片にCy3修飾dCTPを、標識・非標識dCTPの平均モル比1:16(したがって平均標識密度1:64)で導入した。
【0198】
実施例IVB:トランスクリプトの長さと逆転写設計の改善
Cy3修飾逆転写プライマー1種または2種と微粒子上の捕捉プローブを用いるmpmp逆転写法を用い、濃度が25 nMから50 pMまで順次減少する一連のカナマイシンmRNA溶液の各々に対して逆転写反応を実行した。具体的には、逆転写プライマーと捕捉プローブの組み合わせ3種を用いて、70 ntまたは50 ntのcDNA断片の生成と分析を試みた。各断片にCy3修飾dCTPを、標識・非標識dCTPの平均モル比1:8で導入することにより、トランスクリプトのCy3標識密度も倍増(1:64から1:32へ)した。Cy3標識逆転写プライマーを用いると50 ntのトランスクリプト1個あたり平均2〜3個のCy3標識を含むこととなる。
【0199】
実施例IVC:モデルmRNAのタイトレーションにおけるアッセイの最適化
ターゲットの配置エントロピーがcDNAの検出感度に決定的な影響を与える要因であることが確認され、更にいくつかのアッセイ計画において、カナマイシンの1200 ntのモデルmRNAから得られたトランスクリプトの長さを約150 ntから更に短縮して約50 ntとし、Cy3標識密度を倍増することにより、アッセイ信号を予想どおり約5倍に増強することができた。これは検出限界約50 pMに相当する。
【0200】
注目すべきこととして、これと極めて近い結果(ターゲットのエントロピーの重要な役割を含め)が、未知のmRNA 8種の混合物にカナマイシンmRNAをモル比約1:12〜1:6200でスパイクしたときにも得られている(カナマイシン濃度25 pMおよび50 pM、mRNAのバックグラウンド300 nMに相当)。これらのモデル的アッセイの結果は、他のmRNAが存在する場合でも、細胞1個当たりコピー3〜5個の低濃度の特定メッセージを検出するのに十分な感度と特異性を示している。
【0201】
実施例IIIの予測、すなわちトランスクリプトの長さを約150 ntから約50 ntに短縮することによりアッセイ信号が更に増強されることを確認するため、50 ntまたは70 ntのトランスクリプトを生成するmpmp逆転写反応を設計した。5'末端適合捕捉プローブ(実施例III参照)の使用により信号が増強されることが実証されたので、トランスクリプトの5'末端付近の部分配列に適合するような捕捉プローブを設計した。
【0202】
アッセイプロトコルの最適化:
アッセイの感度とダイナミックレンジを更に改善するため、アッセイ条件の最適化を行った。具体的には、カナマイシンmRNAのタイトレーションにおける逆転写プライマー濃度を1/25にし(50μMから2μMへ)、ハイブリダイゼーション時間を半分に短縮した(50℃で30分から15分へ)。
【0203】
このように変更したプロトコルではターゲットの最高濃度約500 pMで起こる検出器の飽和(図10)を避けることができるばかりでなく、溶液中に残存する蛍光標識逆転写プライマーおよびdCTPの非特異的吸着によるバックグラウンド信号も低減するので、アッセイのダイナミックレンジが拡大される。アッセイの感度は2倍に向上することが認められた。
【0204】
実施例V:モデルmRNAの逆転写の最適化
実施例IIIに示したmpmp逆転写法アッセイの性能を更に向上させるため、最高の成績を収めた50ntのカナマイシントランスクリプトに対して、逆転写反応温度を厳格に制御するようプロトコルを最適化した。サーモサイクラーの温度プロファイルをプログラム化し、逆転写プライマーのアニーリング・転写の条件をより厳密に制御することにより、蛍光信号強度を2〜3倍に増強することができた(図19)。具体的にはサーモサイクラー(Perkin−Elmer)を用い、下記の温度プロファイルで実施例IIIの逆転写反応を実施した。
RNA変性:65℃、5分
アニーリング:45℃、30分
アニーリング:38℃、20分
SuperScript IIIの熱不活化:85℃、5分
保持:4℃
【0205】
ハイブリダイゼーション条件は、1xTMAC中50℃で15分インキュベーション、同緩衝液で3回洗浄、各回でビードに接触している20μlを交換、とした。
【0206】
この逆転写条件の管理を強化した2段階プロトコルによって、特異的な蛍光信号は増強され、一方で非特異的なバックグラウンド信号は旧プロトコル(プロトコル2)と同程度に抑えられ、結果的にS/N比を約2倍に向上させることができた。
【0207】
実施例VI:ヒト全RNAバックグラウンドのスパイク実験:特異性
複数のmRNAメッセージを含むヒト臨床試料に典型的に見られるような複雑な環境で特定のmRNAを検出する際に実現可能な特異性のレベルを更に評価するため、細菌に由来する未知の全RNAによるバックグラウンドをヒト胎盤全RNA(Ambion)で置き換えて一連のスパイク実験を行った。ヒト胎盤全RNAは、臨床試料中のヒトインターロイキンまたはその他のサイトカインのような特定のRNA種の発現パターンを決定する際の条件を近似するものとして、より現実的である。
【0208】
濃度約12.5nM〜50pMのカナマイシンmRNAの一定量を、100ng/μl(濃度約300nMに相当)に希釈したヒト胎盤全RNA溶液中にスパイクした。すなわち特異的mRNAと非特異的mRNAのモル比は1:24〜1:6200の範囲であった。8種の比(ターゲットなしの対照を含め)においてそれぞれ別個に、最適化したアッセイ条件で逆転写反応を行った。
【0209】
結果(図20B)は前述の全RNAの存在しない場合と同様の傾向を示している。長さ50 ntのトランスクリプトをヒト由来の全RNAにスパイクしたとき、ランダムに誘起された逆転写反応で形成された蛍光標識cDNAの捕捉による非特異的信号は、エントロピー的に有利な50 ntカナマイシンcDNAからの特異的信号に比べて無視できる程度である。検出されたターゲットの最低濃度すなわちモル比約1:6200は、特異的mRNA濃度約50 pMに相当し、細胞1個あたり数百個のコピーと等価である。このように、このアッセイ設計は、8種の未知RNAのin vitroでの混合物に対してのみならず、現実のヒト由来試料を用いる複雑な環境化においても、市販の発現プロファイリング用のプロトコル(Lockhart et al. (1996))と同等の感度と特異性を与える。
【0210】
多重化遺伝子発現プロファイリングにおいては特異性が決定的に重要であることに鑑み、前記のヒト胎盤RNAのプールへのカナマイシンのスパイク実験を拡張して、臨床試料に関連する条件を近似するようにした。結果は特異性と感度に関しては、前述のin vitroで転写された細菌由来RNAのスパイク実験の結果と同等であり、短い逆転写トランスクリプトの生成、トランスクリプトの5'末端付近の領域への捕捉プローブの適合、逆転写およびハイブリダイゼーション条件の厳格化の組み合わせによって特異性が向上することが示される。ランダム逆転写によるトランスクリプトは一般に特異的逆転写によるトランスクリプトより長く、したがって固定化プローブへの補足に際しては後者がエントロピー的に著しく有利である。
【0211】
最適化した逆転写条件のもとでも、ターゲットのエントロピーの決定的な役割は明らかである。たとえば図21の2段階プロットにおいて、親和性定数の大きい希釈領域から親和性定数の小さい濃縮領域への移行が見られる。前述のように、濃縮領域の親和性定数はターゲットのクラウディングを反映して、ターゲットの長さに大きく依存する。実際、吸着等温線の勾配は、2つの異なった逆転写プロトコルで生成させた50 ntのトランスクリプトに対して実質上同一である(図19C)。これに対して希釈領域では、スパイクなしで調製した50 ntのトランスクリプトに対する等温線の勾配は、比較的厳格でないプロトコル2の場合に比べて厳格なプロトコル3の場合は約1/2.5であり、逆転写条件の改善によって親和性定数が増加することを示している。
【0212】
実施例VII:応用例
本明細書に示したアッセイ方式は診断のために使用することができ、またある場合には治療と共に用いることができる。
【0213】
白血病:
たとえば国際出願No.WO03/008552には、遺伝子発現プロファイルによる混合系統白血病(MLL)、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)の診断方法が記載されている。これらのアッセイ方法は他の遺伝子の発現プロファイルの分析、たとえばHerceptinTM投与に先立つHer−2の分析にも用いられる。遺伝子発現プロファイルはまた臓器移植の決定や感染性病原体の診断にも有用である。医薬の標的への効果も発現プロファイルに基づいて解析することができる。サイトカインに数種の多形が存在することは、疾病への感受性或いは移植拒絶反応の出現を示すことがあり、これも本明細書に示した方式により解析することが可能である。本発明の方法のその他の応用例としては、特定の遺伝子の発現パターンの変化に現れる感染/病原体への曝露に対する宿主の応答の解析がある。
【0214】
ADMEパネル:
米国では年間10万人以上の死亡と200万人以上の入院が医薬品の副作用によるものとされており、そのうちの相当部分が個人の遺伝的変異に起因している。薬物療法の結果として遺伝的変異を検出する間接的方法は特定のバイオマーカーの遺伝子発現レベルを追跡することである。
【0215】
実施例Iに述べた方法は、薬物代謝を支配する、約200種の遺伝子を含む遺伝的マーカーに拡張することができる。これらのマーカーは柔軟性がありカスタマイズ可能なADME(吸収・分布・代謝・排泄)パネルとして得ることができる。第一のADMEパネルは、多くの薬物代謝酵素を支配する60種の遺伝子のスーパーファミリーであるチトクロムP450に基づくものである。
【0216】
ビードチップを用いる多重化遺伝子発現追跡の新しい標準は従来にない正確度、感度、特異性を持つ。たとえばhMAP法に続くeMAP法(伸長反応)を適用して、チトクロムP450ファミリーに属する高度に関連した配列であるCYP 450 2B1と2B2を識別することができた。ビードチップによる確立された方法によれば、高度に多重化されたアッセイ方式において、96%相同な配列の遺伝子発現レベルの2倍の変化を測定することができる。
【0217】
実施例VIII:多重化発現追跡:サイトカインmRNAパネル
ヒトサイトカインのin vivoトランスクリプト9種の作成:臨床的に有意義なマーカーのパネルについて遺伝子発現プロファイリングを行うための専用ビードチップを開発するための第一歩として、表III-1に示すヒトサイトカインmRNAターゲット9種の対照系を設計した。
【0218】
サイトカイン7種(IL−2,−4,−6,−8,−10,TNF−α,IFN−γ)および内生的対照2種(GAPDH,ユビキチン)の完全なcDNAのクローンのキャラクタリゼーションを配列決定により行い、pCMV6ベクター(OriGene Technologies,MD)中の特定サイトカインcDNAインサートを含むプラスミドDNAの形で回収した。ターゲット固有のPCR増幅のコストを避けるため、標準プライマー対によってすべてのcDNAを増幅するように、クローニングベクター配列に対するPCRプライマーを設計した。順方向PCRプライマーをT7プロモーター配列(サイトカインの各インサート(cDNA)のクローニング部位に隣接して存在)の上流に置くことにより、ターゲットの5’末端に位置する特定のcDNA配列のみのT7 in vitro転写が行われる。in vitro転写(MegaScript,Ambion)に続いて、アガロースゲル中でのSybrGreen染色によりテンプレートのキャラクタリゼーションを行い、200倍に希釈し、吸光度を測定してDNA濃度を決定した。
【0219】
次に、カナマイシンに対して開発した最適化プロトコルに従って、各遺伝子固有の逆転写プライマー9種を用いて多重化逆転写反応を行い、9種のCy3標識cDNAのプールを作成した。具体的には経験的設計ルール(後記)を適用して、長さ50〜70 ntのcDNAを生成し、かつ交差ハイブリダイゼーションを最小限にとどめるような逆転写プライマーを選定した。7種のサイトカインcDNA、2種の内生的対照、および2種の陰性対照(オリゴC-18、カナマイシン)に対して設計された捕捉プローブを有する符号化ビード11種を含むビードチップに、これらのcDNAのプールを精製することなく付着させた。
【0220】
プライマー/プローブの選択に関する経験的設計ルールによる第一の結果は、READ法による多重化分析で複数のサイトカイン遺伝子の発現レベルを決定する可能性を実証した。しかし9重化アッセイで2つのmRNAターゲットが非特異的なバックグラウンド信号の周辺的閾値に近い信号強度をもって検出された。これは複雑な試料プールにおいて、対応する逆転写プライマーが交差反応により他のmRNAターゲットと結合したためである。このような結果は、上に開示した数学的アルゴリズムに基づく使いやすい計算ツールを含め、プライマー/プローブの設計ルールの最適化を更に進める必要を示すものである。
【0221】
逆転写プローブおよび捕捉プローブの選定に関する第2の設計ルールを用いて、それぞれ特定のmRNAに対応する11種の捕捉プローブとそれに対応する逆転写プライマーを再設計した(表III-1)。またプライマーとターゲットのハイブリダイゼーション反応の特異性を改善するため、プライマーの長さを約20 ntに延長した。これら再設計した逆転写プライマーおよび捕捉プローブの溶融温度の計算値に基づき、より厳格な条件で逆転写反応を行った。この工程は2段階から成り、まずRNAを70°Cで5分間変性させ、次にプライマーのアニーリングと伸長を52°Cで60分間行った。オンチップのハイブリダイゼーションは、再設計プローブ9種のTmの平均値である57°Cで行った。
【0222】
次に、9種の遺伝子固有の逆転写プライマーを用いて、in vitroで転写した9種のRNA(各メッセージ32 fmolを含む)の多重化逆転写反応を行い、上述のように最適化した2段階の温度におけるインキュベーションのプロトコルに従って、9種のCy3標識cDNAのプールを得た。具体的にはコンピュータ的設計ルール(レポートIV参照)を適用して、長さ60〜200 ntのcDNAを生成し、かつ交差反応を最小限にするような逆転写プライマーを選択した(前記参照)。
【0223】
7種のサイトカインcDNA、2種の内生的対照、および2種の陰性対照(オリゴC-18、カナマイシン)に対して設計された捕捉プローブを有する符号化ビード11種を含むビードチップに、Cy3直接標識cDNAのこのプール(各16 fmolの添加したmRNAを含む)を精製することなく付着させた。図26に示す結果は、6種のサイトカインcDNA(IL-6は低レベルの非特異的ハイブリダイゼーションを示すため逆転写から除いた)の多重化検出を再現性よく行う可能性を実証した。S/N比は3.5〜6の範囲で再現性を示し(表III-2、図24A)、検出された各メッセージの信号出力が統計的に有意であることが確認される。ビードチップは各cDNAにつき約300個のビードを含んでおり、この重複が更に信頼性を高めている。
【0224】
表III−1:多重化分析に用いた9種のヒトサイトカインcDNAクローン:逆転写プライマー及び捕捉プローブの設計
【0225】
実施例IX:トウモロコシのゼイン遺伝子ファミリーの高度に相同的なmRNA配列の分析
トウモロコシの同系交配系統B73およびBSSS53において、ゼイン遺伝子のいくつかのmRNA配列は、945 ntの全長にわたって95〜99%の相同性を示す。BSSS53系統の高度に発現したmRNA配列の検出に用いるターゲット固有の変異(赤で示す)に対する、捕捉および伸長プローブの位置を図27, 28に示す。
【0226】
これらの配列を検出し、その相対的発現レベルを評価することは、大きなクローン集合の配列決定を必要とするため、現行の方法では極めて煩瑣な作業である。ハイブリダイゼーションによる検出と伸長による検出を組み合わせた方法によれば、高度に相同的なmRNAの配列を識別することができ、同時にそれらのメッセージの存在量をほぼ平行する分析方法で決定することができる。この検出アッセイは下記のように行った。
【0227】
まず処理後の全RNA試料に対して固有の逆転写プライマー(黄色で示す)を用いてmRNAをCy3標識cDNAに転換する。ついで7種のcDNAターゲットをビードチップ上で、完全に適合する捕捉/伸長プローブにハイブリダイズする。プローブはその3'末端がターゲットの各多形位置に対して整列するように設計されている。適合したハイブリッドプローブはTAMRA標識dCTPを用いて伸長する。したがって伸長したプローブは蛍光信号を発する。
【0228】
より複雑な場合として、2つの配列が共通の変異を有し、その一方のみが第2の特定の変異を持つ場合を図29に示す。具体的には遺伝子16と31が共通の変異T(Cを置換)を持ち、この点で複数配列アラインメント(図示せず)中の他のすべての配列から区別される。遺伝子31は固有の変異C(Gを置換)を識別する第2の捕捉/伸長プローブにより検出される。しかし遺伝子16には更に別の固有の変異があり、7種の高度に相同的な配列のプール中でも「移相法」によって同定することができる。図29に示すように、確実な識別のためには3段階の操作が必要であり、段階1と2は同時に行う。
【0229】
段階1:
3'末端にTを持つプローブ16を第1の種類のビードに固定化し、アニール条件下で7種の増幅済み遺伝子トランスクリプトのプールに接触させる。ハイブリダイゼーションに続く伸長によって、2つの遺伝子16, 31が他から識別され、そのプローブを持つビードからのTMRAの蛍光で検出される。同時に3'末端にCを持つプローブ31を他の種類のビードに固定化し、アニール条件下で7種の増幅済み遺伝子トランスクリプトのプールに接触させ、ハイブリダイゼーションに続く伸長反応の後、特定の符号を持つビードからのTMRAの蛍光で検出する。
【0230】
段階2:
アッセイの次の段階として、伸長後のプローブ16から、95°Cでの変性反応によりターゲット16を除去する。
【0231】
段階3:
次に伸長した単鎖プローブ16を短いCy5標識検出プローブ16に、二重体形成の溶融温度(Tm = 49°C)でハイブリダイズさせる。このためには配列中央部にCを持つ適合するプローブを使用する。指定の溶融温度(Tm)でハイブリダイゼーションが起こり、Cy5の蛍光が第1の種類のビードで検出されれば、プール中に遺伝子16が存在したことが示される。このように、この設計ではプローブ31を持つビードに由来するTMRA信号は遺伝子31の存在を確証し、プローブ16を持つビードに由来するCy5信号と共に記録されたTMRA信号は遺伝子16の存在を確証する。
【0232】
本命最初に使用した用語、数式および例は例示を目的としたものであり、限定的なものではなく、本発明の範囲は以下に示す特許請求範囲によってのみ定義され、かつ各請求項に等価な内容をすべて包含する。方法に関する請求項に含まれる諸段階は、同じ請求項に別様の断りがない限り、同項に述べられている順序のほか任意の順序で実行することができる。
【図面の簡単な説明】
【0233】
【図1】図1は多重化発現追跡を実施する過程を示す。
【図2】図2は図1の過程に関連する典型的なワークフローを示す。
【図3A】図3Aは表I−1に示したモデルプローブおよびターゲットに対するタイトレーション曲線(結合曲線)を示す。
【図3B】図3Bは図3Aの曲線を質量作用の法則によって回帰分析した結果から抜粋した、同曲線に対する微粒子1個あたりの親和性定数Kとプローブ部位の数P0を示す。
【図4】図4は強度と微粒子表面の蛍光発色団濃度との換算のための較正曲線を示す。
【図5】図5は表I−1に示したプローブとターゲットの複合体の形成の程度とターゲット長さとの関係、および冪乗法則によるデータの回帰分析の結果から抜粋した指数の値を示す。
【図6A】図6Aは表I−1に示した175 ntのモデルターゲットと種々の長さのプローブとの複合体の形成に関する吸着等温線を示す。
【図6B】図6Bは図6Aの曲線を質量作用の法則によって回帰分析した結果から抜粋した、同曲線に対する微粒子1個あたりの親和性定数Kとプローブ部位の数P0を示す。
【図7A】図7Aは表I−1に挙げられたそれぞれ長さ175nt,90nt,25ntのターゲットと種々の長さのプローブとの複合体形成の程度とプローブ長さとの関係を示す。
【図7B】図7Bは表I−1に挙げられたそれぞれ長さ175nt,90nt,25ntのターゲットと種々の長さのプローブとの複合体形成の程度とプローブ長さとの関係を示す。
【図7C】図7Cは表I−1に挙げられたそれぞれ長さ175nt,90nt,25ntのターゲットと種々の長さのプローブとの複合体形成の程度とプローブ長さとの関係を示す。
【図8A】図8Aは150ntのcDNAの生成を例に複数プライマー・複数プローブ(mpmp)設計を示す。
【図8B】図8Bは1200ntのカナマイシンのmRNAにそのようなmpmp設計を適用して作成した150ntおよび1000ntのcDNAのタイトレーション曲線を示す。
【図9】図9はランダム符号化アレイ検出(Random Encoded Array Detection,READTM)による、ハイブリダイゼーションに媒介された発現追跡の作業手順を模式的に示す。
【図10A】図10AはカナマイシンのmRNAの逆転写で得られた3つの異なる長さのcDNAについて図8のタイトレーション曲線を変換して得られた直線化タイトレーション曲線(等温線)を示す。等温線の屈曲点は吸着に「希釈」領域と「濃縮」領域があることを示す。
【図10B】図10Bは濃縮領域で固定化プローブに捕捉されたターゲット鎖の「フットプリント」を模式的に示す。
【図10C】図10Cは希釈領域で固定化プローブに捕捉されたターゲット鎖の「フットプリント」を模式的に示す。
【図11】図11は図10の等温線の濃縮領域から希釈領域への移行を特徴づけるc*の値とターゲット鎖長さとの関係を示す。
【図12A】図12Aは500ntのcDNAの生成を例に複数プライマー・複数プローブ(mpmp)設計を示す。
【図12B】図12Bは500ntのcDNAについて、cDNA内部の部分配列とcDNAの5’末端付近の部分配列にそれぞれに適合するプローブへの捕捉によって得られたタイトレーション曲線の比較を示す。
【図13】図13は図12の500ntのcDNAに対するタイトレーション曲線の変換によって得られた直線化タイトレーション曲線を示す。
【図14】図14は末端グラフトされたポリマー鎖が、グラフト密度によって異なる配列をとることを模式的に示す。
【図15】図15は末端グラフトされたポリマーにターゲット鎖が捕捉される際の鎖の拘束を模式的に示す。
【図16A】図16Aは二官能性ポリマー修飾剤を用いることにより微粒子表面におけるポリマーのグラフト密度を制御する方法を模式的に示す。
【図16B】図16Bはプローブとポリマーの相互作用を拡大して示す。
【図17】図17は(規格化)占有率(縦軸)と、アレイ中の微粒子(ビード)の数および(無次元)ターゲット濃度に正比例する量(横軸)との関係を示す。
【図18】図18は、微粒子の重複数の最適化によるダイナミックレンジ圧縮の効果により、レンジに5000倍の差がある濃度で存在する50 ntのカナマイシンcDNAと70 ntのIL 8 cDNAに対してそれぞれ生ずる信号の強度の差が20倍程度に抑えられることを示す。
【図19A】図19AはmRNAターゲットに対するプローブとプライマーの位置を示す。
【図19B】図19BはIL−8 mRNAの逆転写で得られた短いcDNAの希釈系列の表であり、1fmolのmRNAが検出限界であることを示している。
【図19C】図19Cは図19Bの表から作成したプロットを示す。
【図20A】図20AはmRNAターゲットに対するプローブとプライマーの位置を示す。
【図20B】図20BはカナマイシンmRNAの逆転写で得られた50 ntのcDNAの、本明細書に示すいくつかのプロトコルによって作成した希釈系列を示す。8種のサイトカインmRNAの混合物(バックグラウンド)およびヒト胎盤RNA混合物へのcDNAのスパイキングを示す希釈系列も含まれている。
【図21】図21は図19の希釈系列の変換によって得られた直線化吸着等温線を示す。
【図22】図22は酵素によって触媒されるプローブの伸長およびそれに続く修飾による信号増幅法を模式的に示す。
【図23】図23は図19の信号増幅法を適用することによる感度の向上を示す。下側の曲線は標識したカナマイシンcDNAの信号(第1のカラーチャンネルで記録)を、上側の曲線は同じカナマイシンにプローブ伸長および修飾を施した後の信号(第2のカラーチャンネルで記録)を示す。
【図24A】図24Aは7個のサイトカイン遺伝子および2個の「ハウスキーピング遺伝子」から成るパネルに対して行った多重化発現分析の代表的な結果を示す。
【図24B】図24Bは図24Aに示した結果のヒストグラムを示す。
【図25A】図25Aは多型解析の二段階プロセスを適用することにより、相同性の高い配列を区別し得る設計における、ターゲットとプローブの位置を示す。
【図25B】図25Bは異なったプローブを付着させた4つの符号化ビードを示す。
【図25C】図25Cは図25Aおよび図25Bのプローブを用いたアッセイの結果を示す。
【図26】図26はAUリッチなmRNAの配列の濃度の定量測定と特定のクラスの同定を同時に行う方法を示す。
【図27】図27はトウモロコシのゼイン遺伝子ファミリー(azs 22)から得られた7つのトウモロコシ遺伝子の配列アラインメントを示す。
【図28】図28はトウモロコシのゼイン遺伝子ファミリー(az2 22)内の相同性の高い配列を検出できる、ハイブリダイゼーションと伸長を組み合わせた設計を示す。
【図29】図29は図28における相同性の高い遺伝子16および31を検出できる、ハイブリダイゼーションと伸長を組み合わせた設計を示す。
【図30】図30は1つの検出色を用いる減算法示差発現分析の手順を示す。
【特許請求の範囲】
【請求項1】
溶液中で行われるアッセイで検出される、複数の核酸ターゲットと同ターゲット中の部分配列に全体的または部分的に相補的な複数のオリゴヌクレオチドとの二重体の数の著しい減少を防止する方法であって、前記オリゴヌクレオチドは固相担体の表面に付着し、ターゲットとオリゴヌクレオチドのハイブリダイゼーションに続いてアッセイ信号を発生させ、前記固相担体に付着するオリゴヌクレオチドの単位表面積あたり密度を、前記著しい減少が起こると予測される限界値以下の値に選定する方法。
【請求項1】
溶液中で行われるアッセイで検出される、複数の核酸ターゲットと同ターゲット中の部分配列に全体的または部分的に相補的な複数のオリゴヌクレオチドとの二重体の数の著しい減少を防止する方法であって、前記オリゴヌクレオチドは固相担体の表面に付着し、ターゲットとオリゴヌクレオチドのハイブリダイゼーションに続いてアッセイ信号を発生させ、前記固相担体に付着するオリゴヌクレオチドの単位表面積あたり密度を、前記著しい減少が起こると予測される限界値以下の値に選定する方法。
【図1】
【図2】
【図3A】
【図3B】
【図4】
【図5】
【図6A】
【図6B】
【図7A】
【図7B】
【図7C】
【図8A】
【図8B】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13】
【図14】
【図15】
【図16A】
【図16B】
【図17】
【図18】
【図19A】
【図19B】
【図19C】
【図20A】
【図20B】
【図21】
【図22】
【図23】
【図24A】
【図24B】
【図25A】
【図25B】
【図25C】
【図26】
【図27A】
【図27B】
【図28】
【図29】
【図30】
【図2】
【図3A】
【図3B】
【図4】
【図5】
【図6A】
【図6B】
【図7A】
【図7B】
【図7C】
【図8A】
【図8B】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13】
【図14】
【図15】
【図16A】
【図16B】
【図17】
【図18】
【図19A】
【図19B】
【図19C】
【図20A】
【図20B】
【図21】
【図22】
【図23】
【図24A】
【図24B】
【図25A】
【図25B】
【図25C】
【図26】
【図27A】
【図27B】
【図28】
【図29】
【図30】
【公開番号】特開2012−152219(P2012−152219A)
【公開日】平成24年8月16日(2012.8.16)
【国際特許分類】
【出願番号】特願2012−78294(P2012−78294)
【出願日】平成24年3月29日(2012.3.29)
【分割の表示】特願2006−538164(P2006−538164)の分割
【原出願日】平成16年10月26日(2004.10.26)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.テフロン
【出願人】(503369358)バイオアレイ ソリューションズ リミテッド (14)
【Fターム(参考)】
【公開日】平成24年8月16日(2012.8.16)
【国際特許分類】
【出願日】平成24年3月29日(2012.3.29)
【分割の表示】特願2006−538164(P2006−538164)の分割
【原出願日】平成16年10月26日(2004.10.26)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.テフロン
【出願人】(503369358)バイオアレイ ソリューションズ リミテッド (14)
【Fターム(参考)】
[ Back to top ]