説明

サブテロメアDNAプローブおよびその製造方法

本発明は、サブテロメア・プローブ、およびサブテロメア・プローブを作製する際に使用することのできるプローブ・プライマーのペア、ならびにその製造方法および使用方法を提供する。このプローブは、染色体のテロメアに近接して位置しており、現在入手可能なプローブより、総じてはるかに小型である点で有利である。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、米国特許出願番号60/415,345(2002年9月30日出願)および米国特許出願番号60/484,494(2003年7月2日出願)にかかる権利を主張するものである。また、これらの各出願については、ここに言及することによって、その内容および教示内容を本発明に組み込むものである。
【0002】
配列表
本出願は、本出願と同時に提出する、紙様式の配列リストおよび2枚の同一のCD−ROMに収めた配列リストを含むものである。紙の配列リストは、2枚のCD−ROMの配列リストと同一であり、これらのリストについては、ここに言及することをもって、そのすべてを本明細書に明確に組み込むものである。
【0003】
発明の分野
本発明は、染色体末端およびサブテロメア、ならびに染色体のサブテロメア領域で生じている染色体の再構成の検出に関するものである。より詳細には、本発明は、医療や癌の遺伝子診断でそうした染色体の再構成を検出する際に使用できるプローブに関するものである。さらに詳細には、本発明は、ゲノム中の単一の位置に有効にハイブリダイズさせることができ、このハイブリダイゼーションの分析によって、染色体のテロメアまたはサブテロメア領域に何らかの再構成が生じているかどうかが示唆されるような単一コピーのプローブに関するものである。さらに詳細には、本発明は、既存のクローニングされたプローブより広いスペクトルの異常染色体末端を検出するうえで有用な単一コピーのプローブであって、このプローブを用いると、染色体、テロメアおよびサブテロメア領域がどのように組織化されているのかについての知見を得、これらの染色体領域の各種の配列が、互いに、そして他の染色体領域とどのように関連しているのかについて関連づけ、再構成と特定の臨床上の効果とを関連づけ、遺伝的均衡型および不均衡型の稀有な染色体再構成の切断点を解析することが可能となるようなプローブに関するものである。最後に、本発明は、そうしたプローブの製造方法に関するものである。
【0004】
従来技術の説明
染色体は、生物が有するDNAを含む細胞構造で、細胞分裂時のみ形態を備えた存在として目に見える。染色体は、2本の染色分体から構成されている。各ペアの染色分体は、それぞれ短腕(p腕)、長腕(q腕)、長腕と短腕とを接続しているセントロメア、各末端のテロメアを備えた相同体を形成している。染色体を薬品または熱で予備処理すると、各腕は、明色と暗色のバンドが交互に現れるパターンを示し、これは、クロマチンが凝縮した結果である。Gバンド法は、臨床細胞遺伝学検査では一般的に使用される。Rバンド法または逆バンドも、ときに使用され、明色と暗色のGバンドが逆パターンを形成する。本出願ではG分染した染色体について言及する。
【0005】
セントロメアは、人染色体中で、染色分体を結合して束ねている特殊化したタンパク質−DNA構造で、体細胞および生殖細胞での染色体の正確な分離を担っている。セントロメアは、染色体中で狭窄領域として見えることが多く、その位置によて、染色体が、中部動原体型、次中部動原体型、末端動原体型のいずれであるかが決定される。中部動原体型の染色体では、p腕(すなわち短腕)の長さは、q腕(すなわち長腕)の長さとおおむね等しい。次中部動原体型染色体では、p腕の長さは、q腕の長さより多少短い。末端動原体型染色体では、p腕の長さが、q腕の長さよりはるかに短い。末端動原体型染色体は、高度反復DNA配列と、リボソームRNA遺伝子の複数のコピーを含む特殊化した短腕を持つことが知られている。
【0006】
テロメアは、染色体の各染色分体の末端を画する特殊化したタンパク質−DNA構造である。通常、テロメアは、明色のGバンドに位置しており、この明色のGバンドは、暗色のGバンド領域と比べると、遺伝子に富み、反復配列の密度が低い。テロメアは、明色のGバンド中に位置しているので、染色体の末端(テロメア)同士の交換および再構成は、目視による検出が困難である。テロメアは染色体特異的ではないが、テロメアに直接隣接していたり、明色に染まるGバンド中に存在することもあるサブテロメアまたはテロメア随伴反復配列は、染色体特異的である可能性がある。テロメア自体は、脊椎動物では(TTAGGG)の長さ3〜20kbのTとGに富んだ反復配列から構成されている。この配列は、染色体末端同士の融合や末端からのヌクレオチド鎖の分解を防ぐことによって染色体の安定性を維持するうえで必要である。また、テロメアは、DNAの複製に際しても必要であり、細胞の寿命維持にも重要な役割を果たしている。TTAGGG縦列反復配列のすぐ隣には、長さ数キロベース(kb)以内の複雑な反復DNAのファミリーが複数存在している。これらの配列は、複数の染色体に存在する傾向があり、サブテロメア領域に限局されている。ヒトで天然に生じる変異からは、これらの反復配列を欠損した染色体も、正常な受け継がれることが可能で、これらの配列が生物学的に重要な役割を果たしてはいないことが示唆される。4p、16、および22qテロメアに隣接したDNAの配列解析を行うと、サブテロメア領域が、中間変性(TTAGGG)反復配列によって、先端側のサブドメインと基端側のサブドメインに分割されており、これらのサブドメインは、他の染色体末端との配列類似性が異なっていることがわかる。基端側のサブテロメア配列は、少数の染色体に共通の長い配列を含んでおり、先端側のサブテロメア配列は、すでに記載されている、多くの染色体に共通の短い複雑な反復配列を含んでいる。また、染色体特異的な低コピー数の反復配列または重複配列(すなわちパラログ)が、サブテロメア領域を含むヒトゲノムの複数の領域で生じる可能性もある。Traskらは、嗅覚受容体遺伝子ファミリーの複数の遺伝子を、重複し、多くのヒト・テロメア近傍で高度の類似性を示す大型のDNAセグメント内で特定した。この遺伝子ファミリーの異なる重複配列同士が染色体内および染色体間で組み換えを生じると、染色体の再構成が起こることがある。このように、高度に関連した配列(>95%のホモロジー)の非同座性のコピーが類似しているために、サブテロメア・ドメインの分子レベルでの解析は困難を極めることになる。
【0007】
サブテロメア領域(隣接配列)の獲得または消失を伴う染色体のわずかな再構成は、特発性精神遅滞および他の遺伝的な臨床上の異常を持つ個人の0〜10%で観察されている。サブテロメア・プローブの他の用途としては、反復性の自然流産および不妊を経験した個人についての研究、遺伝性および獲得性の染色体異常の特性解析、移植前診断のうちの特定の選択されたケース、絨毛サンプルの採取または早期の羊水穿刺用に取得した間期細胞を使用した異常についての診断を挙げることができる。
【0008】
細胞遺伝学的に定義される末端の欠失は、3種のメカニズム、すなわち、テロメアの再生または治癒、中間部に欠失を生じるような当初からのテロメアの保持、そして、細胞遺伝学的再構成に際しての、異なったテロメア配列の獲得、すなわちテロメアの捕捉による誘導体化された染色体の形成によって生じる。テロメアの欠失の大半は、テロメアの再生によって安定化される可能性が高いことから、テロメアになるべく近いプローブを使用することによって、最大数の末端欠失が検出されるであろうことが示唆される。
【0009】
こうした再構成はサイズも小さく、また、ほとんどの染色体の末端には、薄く染まるバンドが存在しているため、再構成は、G分染やR分染などのルーチンの細胞遺伝学的方法では検出できないことが多い。そこで、こうした再構成を検出するにあたっては、DNAプローブを染色体にハイブリダイズさせてから蛍光顕微鏡による観察を行う蛍光in situハイブリダイゼーション(すなわちFISH)と称される手法を行ったり、マイクロサテライトの分析を行ったりする。患者だけでなく親および/または他の家族のメンバーについても調べる必要のあるマイクロサテライトの分析とは異なり、FISHでは、異常の検出にあたって、患者のサンプルのみが必要とされる。従来のFISHのプローブは、一般に、長さが60,000〜170,000塩基対、長さの平均が約110,000塩基対であり(染色体バンドの平均サイズは5百万塩基対)、大抵は、1本の染色体バンドの一部に由来するものである。したがって、FISHを用いると、ルーチンの細胞遺伝学的方法では見ることのできないような異常を検出することができる。プローブは、染色体末端腕近傍のホモロガスなDNA配列のみにハイブリダイズする。健常者の場合、2コピーの配列(各親から1コピーずつ)が存在し、したがって、各細胞に、2つのハイブリダイゼーション部位(ホモロガスな各対の染色体1本についてハイブリダイゼーション部位1箇所)が存在する。不均衡な末端染色体の再構成を持つ患者の場合、配列のコピー数または位置に偏りが生じているので、欠失は、同系の染色体の末端でハイブリダイゼーションが不在であることで検出され、トリソミーは、別の染色体で付加的なハイブリダイゼーション信号が存在していることで検出される。染色体上でのハイブリダイゼーションの位置は、染色体の細胞遺伝学的な解析から直ちに明らかとなるので、均衡な転座も、不均衡な転座も、検出可能である。
【0010】
テロメアの構造が高度に反復性であることと、サブテロメア領域を調べるにあたっての現行のアプローチがいずれもユニーク配列の存在に依拠しているという事実からすると、現行のアッセイの使用は、感度と特異性との妥協の産物であるといえる。感度は、プローブが、最小の欠失(すなわち、染色体末端に近接したもの)を検出しうるプローブであることとして定義され、特異性は、プローブが、特定の染色体に由来する配列のみを含むものであるとして定義される。先端のテロメアおよびサブテロメアのドメインに存在する複雑な反復配列を含むプローブは、染色体末端により近い位置に存在している可能性はあるものの、単一コピーのプローブが有するような特異性は持っていない(こうしたプローブは、複数またはすべてのテロメアの一体性を同時に調べる際に使用することができる)。特異的なサブテロメア領域の検出が可能な現行の「染色体特異的な」プローブは、一般に大型で、通常、先端のサブテロメアのインターバルには存在してはいない。サイズが大きいため、こうした従来技術のFISHプローブは、他の染色体にも見いだされる低頻度のパラロガスな配列を含む可能性が高くなる(そして、こうした染色体標的とのハイブリダイゼーションは、Cot 1 DNAを加えても、抑制できない)。ローニングしたプローブ配列で、他の染色体上にパラロガスなコピーを持たないものを選択するためには、従来技術のFISHプローブは、座位特異的なセグメントを含む必要がある。こうした用件を満たす配列は、テロメアから相当程度離れていることも多い。こうしたプローブによって認識される配列とテロメアの間に生じる欠失は、こうしたプローブでは検出できない。このように、大型の染色体特異的なテロメア・プローブを使用するアッセイでは、それより先端側に生じた末端再構成は検出できず、アッセイの特異性が犠牲になっている。
【0011】
各テロメア(末端動原体型のp腕を除く)についての染色体特異的なFISHプローブの第一世代は、ヒト染色体の無傷の大型末端断片を有するコスミド、ホスミド、バクテリオファージ、P1、half YACS(酵母人工染色体)から誘導したPACクローンであった。これらのクローンは、染色体の、単一コピーの配列のクラスターと、その間に分散した反復配列から構成されている。染色体の末端バンドには、パラロガスな配列(複数の染色体で見られることが多い)が高頻度で存在し、テロメア随伴反復配列が比較的高密度で存在する結果、いくつかの染色体の末端のこうしたゲノム編成物では、染色体配列が不足している。Half YACSは、1p、5p、6p、9p、12p、15q、および20qテロメアについては入手できず、これらの末端は、ゲノム・ライブラリーを、ヒトの放射線ハイブリッド地図上の最もテロメアに近いマーカーでスクリーニングすることによって誘導した。その結果、これらのクローンと同系のテロメアとの物理的距離は、不明となった。従来技術のFISHで使用されている市販のサブテロメア・プローブのいくつかは、テロメア近傍ではなく、末端から数百kbに位置していることが知られている。ちなみに、間期のマッピングでは、市販の9pクローンはテロメアから、<1.2〜1.5Mb、市販の12pクローンはテロメアから>800kbに位置しており、一方、市販の15qクローンは、テロメアから約100kbに位置していることが示されている。市販の1p、5p、6p、11q、19p、およびYpクローンの一部については距離が不明である。クローンと対応テロメアとのギャップが大きく、ハイブリダイゼーション・パターンにゲノム多型が認められ、クロス・ハイブリダイゼーションが生じることから、テロメアに対して特異的な第二世代の一連のクローンの作製が促されることとなった。これらのクローンは、テロメアに近接しているもの、染色体末端までには依然として実質的な距離が残っている。実際、市販のプローブの一部は、テロメアから大きく離れており、染色体末端の明色に染まるバンド領域にすら位置していないものもある。たとえば、市販の14qtelプローブの配列tag部位(STS)の座標にもとづくと、プローブは、暗色のGバンドである14q32.32に位置しており、したがって、末端の明色のバンドに含まれると思われるいずれのプローブよりもセントロメアに近接して位置していることになる。こうしたクローンは、大型の挿入配列を有しているので、ハイブリダイゼーション強度は適切なものとなっている。しかし、こうしたクローンを使用しても、プローブ自体や、テロメアにさらに近い配列中に含まれる欠失配列は、検出できない可能性がある。
【0012】
従来技術のFISHでは、DNAプローブは、ユニーク合成DNAと反復合成DNAの双方からなる大型のゲノムインターバル(約50〜数百kb)を含んでいる。反復DNAは広範に分布しているので、染色体特異的な異常の検出は、こうした反復DNAによって妨害されることがある。そのため、反復配列の染色体DNAに対する結合を防止する方法が開発されている。そうした方法の一つでは、プローブ中のこれらの反復配列を、過剰量の非標識反復DNAとともに予備的にアニーリングして、プローブのユニーク配列のみが染色体とハイブリダイズするようにする。
【0013】
従来技術のプローブには多くの欠点があり、その一つは、こうしたプローブの配列が決定されておらず、そのため、染色体中でのプローブの位置が正確には決定されていなかったことが挙げられる。これらのプローブに含まれる利用可能な配列タグ部位(STS)の配列を比較することにより、これらのプローブのうちのいくつかは、テロメアから相当(何百万塩基対)離れた配列を含むことが示されている。従来技術のプローブは、長さ自体も、おおよそしか決定されておらず、STSは、プローブ内の任意の位置に存在する可能性がある。すなわち、プローブの正確な位置は、STSの基端側および先端側に延在するプローブのおおよその長さに対応し、それと等しい長さのウィンドウ内でのみ決定できるということである。また、従来技術のプローブの一部は、テロメアの役目を果たす配列の存在について、half YACs(テロメアを含まない)の相補性を調べることによって機能的に誘導したものである。実際、これらの合成DNAクローンの一部は、いくつかの染色体腕の実際のテロメアを含んでいない。テロメア様配列(ヒトの祖先にあたる系統でテロメアの役目を果たした可能性がある配列)は、ヒト染色体内部の複数の位置で見いだすことができ、これらの配列が、ヒトのテロメアおよび随伴する単一コピーの配列を見いだす目的で実施された相補性の研究で選択されている可能性がある。
【0014】
また、いくつかの従来技術のプローブの座標は決定不能である。というのも、Vysis社やKnightらによって報告された配列タグ部位(STS)は、実験施設固有の名称にもとづくもので、公共のヒトゲノム機構の命名委員会によって指定されたものではないからである。こうした実験施設固有のSTSが、ゲノム・データベース、GenBank、または多の公共データベースに寄託されないかぎり、これらのSTSの実験施設固有の名称を、公的に指定されたSTSと関連づけることはできない。こうした障害があるので、こうしたSTSのいくつかについては、公共の配列資料では位置が決定されていない。したがって、サブテロメア配列を含むことが予測される合成クローンを、これらのSTSによって標準ゲノム配列と関連づけることはできず、これらの合成クローンのゲノムでの位置は、これらのプローブを顕微鏡で観察する以外には確認しようがない。こうした顕微鏡による観察では、ヒトゲノム標準配列に直接マッピングすることによって現在得られるような極めて高い解像度は望めない。入手が可能で、細胞遺伝学の実験施設で一般に使用されているサブテロメア・プローブのいくつかがマッピング不能であるという事態は、染色体の末端バンドに関連した染色体異常を持つ患者にとって、不利な結果をもたらすおそれがある。これらのプローブが、(14qterおよび16pterの市販のプローブのように)染色体の末端から相当の距離に位置する配列から構成されている場合、異常を検出できないのが、染色体上のプローブの位置のせいなのか、再構成された染色体領域のサイズのせいなのか、あるいは、これらの両方の要因のせいなのかを判断することができない。染色体1p、5p、6p,11q、19p、Yp、Yqに関して利用可能なサブテロメア・プローブは、こうしたケースである。こうしたプローブについては、異常を検出できないのが、プローブの使用に伴う擬陰性の知見(すなわち、誤差)のせいなのかどうかさえ判断することができない。こうした状況は、臨床での疾病の診断に一般的に使用される試薬に関しては許容できない実践行為であり、こうしたプローブを使用する医用診断機器の承認を受けようとしても、現在のガイドラインでは、米国食品医薬品局に拒絶されるはずである。もちろん、こうしたプローブには、研究用途のみに使用するよう、表示されている。また、こうしたプローブのいくつかについては、当業者がこれらのプローブの位置を調べようにも、プローブの誘導に使用したクローン自体がすでに利用できない状態となっていて、調べようがない。つまり、これらの従来技術のクローニングによって得られ、広く一般に使用されている試薬は、臨床上の異常の検出に広く一般に使用されているという事実があるにもかかわらず、研究者が、品質管理用の標準品との照合を、独自に行うことができないのである。ヒトゲノム標準配列の完成以来、ヒトゲノムのマッピングおよび解析用のゲノム試薬を生産してきた会社のいくつかは、需要がないという理由から、こうした製品のサポートを打ちきったり、製品の維持を終了したりしている。サブテロメアの再構成を検出するためのクローニングされた合成プローブを生産していたこうした会社の一社は、すでに廃業しており、このプローブを受け継いだ会社は、この製品系列のサポートを2年前にうち切った。したがって、当技術分野では、位置が正確に決定され、ゲノム配列から誘導され、そのゲノム配列が今後とも本質的に継続的に利用可能なものであるようなプローブ・セットが必要とされているといえる。
【0015】
最後に、従来技術のプローブは、ゲノム中の目的位置だけでなく他の位置にもハイブリダイズしてしまうクロス・ハイブリダイゼーションを生じることが示されている。こうしたことが生じるのは、多くのサブテロメア解析用の合成DNAプローブが、配列決定されておらず、したがって、ヒトゲノムの配列を解析しても、プローブ中に含まれるDNA配列が、同一染色体または他の染色体上の別の離れた位置にパラロガスな配列を持たないことを検証できないためである。その結果、こうしたプローブのいくつかは、他の染色体とクロス・ハイブリダイズすることがわかっている。製造業者(Vysis社)は、以下のプローブが、他の染色体とクロス・ハイブリダイズすることを、製品添付文書で明らかにしている。
【0016】

【0017】
また、XpとYpには、相互にホモロガスな配列が含まれており、XpとYpの双方を検出するような単一のプローブも入手可能である。同様に、XqとYqの双方を検出するような単一のプローブも入手可能であり、これは、XqとYqがホモロガスな配列を含んでいるからである。
【0018】
こうしたクロス・ハイブリダイゼーションによって生じる可能性のある好ましくない結果については、仮想例を用いて説明することもできる。両親のうちの一人が、潜在性の染色体の再構成として染色体10pと12p間の転座を有していたとして、この転座が、10p配列の一つが欠損しており、12p配列が重複されているといった不均衡なかたちでこの母親の子孫に伝搬されたとする。10pプローブを使用すると、正常なコピーの染色体10pが、染色体12pの一方とクロス・ハイブリダイズし、これらの染色体の間で転座が生じたことが示唆される。また、10p配列が、もう一方のホモロガスな染色体から消失するので、染色体10pと染色体12pのそれぞれでは、ハイブリダイゼーションが1回のみ生じているのが観察されるはずである。しかし、染色体12のプローブについては、3コピーのこの染色体(正常コピーと、重複コピー)にハイブリダイズすることになるので、10pのプローブで得られる結果と矛盾することになる。この双方の置換について明解な解釈を行うためには、不必要に錯綜した(しかも、結局のところ正しくない)説明が必要となる。したがって、当技術分野で必要とされているのは、クロス・ハイブリダイズすることのないプローブである。そうしたプローブであれば、転座の存在や、核型の不均衡な性質が、明瞭かつ単純に示されるはずである。
【0019】
現在、サブテロメア領域を調べる際の最も一般的な手法は、(1)末端染色体バンドにマッピングされているプローブ(BAC、PAC、P1、YAC、および他の大型の合成クローン)のFISHと、(2)サブテロメア領域にマッピングされている多型マイクロサテライトマーカーの使用の2つである。第一の手法に関しては、いくつかの欠点が観察されている。第一に、特定のサブテロメア・プローブに関しては、明らかにクロス・ハイブリダイゼーションを生じ、また、欠失が生じるような多型も検出されており、また、プローブによっては報告されているほど染色体末端に近接しておらず、その場合には、小型のサブテロメアの再構成は検出できない。表3に、臨床診断に使用される一般的な市販のプローブの、染色体末端からの距離を掲載してある。
【0020】
多型マイクロサテライト分析を使用する第二の手法に関しては、マーカーが染色体(すなわち、情報価値のある染色体)を判別する必要があり、情報価値のあるマーカーの大半は、テロメアから比較的離れて位置しているという欠点がある。その結果、この方法では、小型の欠失は、簡単に見過ごされてしまう。別の欠点としては、患者の親から採取したDNAサンプルが必要だという点が上げられる。
【0021】
サブテロメア領域を調べるうえでは、他の分子的な手法も開発され、使用されている。多重増幅プローブハイブリダイゼーション(MAPH)を用いると、特定の座位でのコピー数を調べることができる。この手法は、現在マッピングされている遺伝的座位/STSのゲノムでの正しい位置決定に依拠しており、座位/STSの位置が染色体端部内で誤って決定されている場合には、小さい欠失は見逃されることになる。たとえば、D16S3400は、当初、染色体末端から300kb以内に位置するものとされていたものの、2003年4月版のゲノム配列を使用したところ、染色体末端から3000kbより離れたところに位置することとなった(表3を参照のこと)。
【0022】
多重ライゲーション依存プローブ増幅法(MLPA)は、概念的には、MAPHと類似しているが、患者から採取した標品で実施するには、この方法の方が面倒が少なく、簡単である。MAPHと同じく、標品中の配列のコピー数の決定は、プローブの、患者の精製ゲノムDNAへの初期ハイブリダイゼーションから判断する。MLPAでは、標的配列に関連した二次プローブとハイブリダイズした配列の量を計測するかわりに、ハイブリダイゼーションの標的との特異性を、標的とホモロガスな極めて短い配列をインビトロでライゲーションさせることによって達成する。読み出しは、アニーリングしてハイブリダイズさせたプローブをPCRによって増幅させることによって行い、その際には、ベクター配列中の標的ゲノムと相補的な配列に隣接した汎用プライマーを使用する。しかし、双方のアプローチとも、正常な標的と異常な標的でのハイブリダイゼーションの比を測定することによって異常の検出が行われるので、ゲノム中の標的配列が健常者では単一コピーの性質を有することが予めわかっている必要がある。このアプローチは、配列が単一コピーの特性を有することが、プローブの作製の過程で確認される本発明の方法とは、対照的である。これは些細な差とはいえない。というのも、プローブと関連したゲノム中にパラロガスな配列が存在すると、擬陽性の検出結果が得られ、プローブの配列を使用して測定したコピー数の比が異なってくる可能性があるからである。MLPAのプローブに含まれるホモロガスなゲノム配列が極めて短いことからすると、ゲノム中にパラロガスな標的が不在であったと確信するためには、当業者は、プローブを誘導する際に使用した遺伝子領域が単一コピーの性質を有することを予め承知している必要がある。最後に、MLSPAは、MAPHよりは単純に実施できるものの、患者の標品を調べる前に、合成技術によって、ファージベクター中のゲノム配列のペアをクローニングするには、実質的な相応の努力が必要とされる。そうしたクローニングの過程は、本発明の技術では不要である。
【0023】
サブテロメアの再構成を調べるために、アレイを使用する比較ゲノムハイブリダイゼーション(CGH)を使用した。この手法は、ゲノム中の複数の領域を同時に調べるという利点があるが、いくつかの、本発明にはない欠点もある。不均衡な再構成を検出するには、テロメア領域中の、クローニングされた大型の合成DNAプローブが必要とされ、その結果、(a)こうしたプローブのいくつかは、テロメアに近接していない、(b)こうしたプローブはサイズが大きいので、小さな再構成は検出されない、(c)プローブとホモロガスな配列の一部と重複するような末端染色体の再構成は、再構成が生じなかったとの結果(すなわち、擬陰性の結果)が出る、(d)こうしたプローブ中の反復配列のハイブリダイゼーションをブロックする必要がある、といったことが生じる。また、ブロッキングの際には、通常、過剰量のCot1 DNAが使用され、Cot1 DNAのバッチ間のばらつきや、こうしたブロック過程の効率のばらつきの結果、異なった実験施設での再現性が失われることが示されており、したがって、この方法は、臨床や研究での試験に使用するには不適切である。
【0024】
こうした手法の大半では、相補関係が不均衡な染色体や臨床的な異常を持つ子孫をさらに生じる可能性もあるキャリアである親を特定する際に必要な均衡な転座は検出されない。従来技術のFISHプローブは、プローブとホモロガスな配列中に染色体の切断点が含まれていたり、プローブが切断点より先端側であることがわかっている場合には、こうした再構成を検出可能である。プローブは、切断点が生じている可能性のある潜在的に大型の領域(数メガベース)と比較して相対的に小さく、また、プローブは、一般に、染色体インターバル内で正確には位置決定されていないので、サブテロメア・プローブによってそうした再構成が検出される可能性は極めて低い。これとは対照的に、こうした再構成の切断点は、この染色体バンド(KnollおよびRogan,Am.J.Med.Genet.2003、この文献については、ここに言及することをもって、その教示内容および内容を本発明に組み込むものである)から誘導した単一コピーのプローブのアレイを系統的にハイブリダイズさせることによって特定することができるものであり、この染色体バンドのゲノム中の位置は、これらのプローブの作製の過程で決定されている。
【発明の開示】
【発明が解決しようとする課題】
【0025】
本発明は、従来技術の欠点を克服して、当技術分野の現状に多大なる進歩をもたらすものである。具体的には、本発明のアプローチでは、サブテロメアの異常検出用の現在入手可能な対応するクローニング・プローブより、相当小型で、一般に染色体末端に近いユニーク配列の単一コピーのハイブリダイゼーション・プローブを作製する。
【課題を解決するための手段】
【0026】
各プローブは、好ましくは、単一の染色体腕に対して特異的である。また、プローブは、蛍光顕微鏡法、アレイ比較ゲノムハイブリダイゼーション、または関連技術による検出を行ううえで十分な長さを有している必要がある。本発明のプローブの長さは、25kb未満とするのが好ましく、約25塩基対〜約15kbの範囲とするのがさらに好ましく、約50塩基対〜約12kbとするのがさらに好ましく、約60塩基対〜約10kbとするのがさらに好ましく、約70塩基対〜約9kbとするのがさらに好ましく、約80塩基対〜約8kbとするのがさらに好ましく、約90塩基対〜約7kbとするのがさらに好ましく、約100塩基対〜約6kbとするのがさらに好ましく、約250塩基対〜約5kbとするのがさらに好ましく、約500塩基対〜約4.5kbとするのがさらに好ましく、約1kb〜約4kbとするのがさらに好ましく、約1.5kb〜約3.5kbとするのが最も好ましい。こうした好適なプローブは、現在入手可能なプローブより、100倍以下小型である。こうした小型のプローブは、他の染色体上の低コピー数のパラロガスな配列へのハイブリダイゼーションが排除されるように設計することができ、有利である。より大型のクローニング・プローブ、たとえば現在市販されているクローニング・プローブの場合、サイズが大きく、また、こうした領域ではパラロガスな配列が比較的多いので、他の染色体上にパラログが存在するような配列を含んでいる可能性が極めて高い。こうした大型のプローブでは、特異性が損なわれる危険性が高くなるので、特定の染色体のサブテロメア領域を他のゲノム配列から区別するうえでは必ずしも理想的とはいえない。こうした大型のプローブをハイブリダイズする必要性は、なぜ、これらのクローンが、テロメアからさらに離れたゲノム配列を含んでいるのか、そして、なぜ、いくつかのクローンが、パラロガスでクロス・ハイブリダイズする配列を含んでいるのかについての一つの説明を提供するものである。さらに、単一コピーのプローブによって認識される隔離された短いゲノム・インターバルを利用すると、サブテロメアの再構成検出に現在使用されている現在入手可能な合成DNAのプローブより染色体末端にさらに近い、特異的なハイブリダイゼーション・インターバルを特定することができる。
【発明の効果】
【0027】
本発明のプローブのハイブリダイゼーションは、染色体に結合するのがプローブ全体であるか、一部のみであるかに関わらず、検出が可能である。したがって、プローブの配列の一部のみに関わる染色体領域の獲得や喪失は、従来技術のプローブでは認識されない可能性があるものの、本発明のプローブを用いると認識される。このように、長さの短縮された本発明のプローブを用いることにより、ハイブリダイズしたプローブがカバーする染色体配列内に切断点が存在するような患者のゲノムを解析する場合でも、誤診(たとえば、染色体の欠失についての擬陰性の結果)を減らすことができる。
【0028】
単一コピーとのハイブリダイゼーションに用いるプローブは、現在入手可能なプローブより、相当程度小型で、染色体末端にも近いものを生成できるように設計する必要がある。設計の際には、一般に、ヒトゲノム配列データベース(すなわち、Public Consortium/セレラ・ゲノミクス(Celera Genomics)のデータベース)の染色体末端の末端ヌクレオチドから始まる移動ウィンドウを探していって、末端染色体バンド中で単一コピーのインターバルを特定する。この単一コピーのインターバルは、サブテロメア領域の単一コピーのインターバルで、テロメアと最も近いものとするのが好ましい。単一コピーインターバルは、好ましくは染色体のテロメアの末端ヌクレオチドから約8000kb以内、より好ましくは、末端ヌクレオチドから約7000kb以内、さらに好ましくは末端ヌクレオチドから約6000kb以内、さらに好ましくは末端ヌクレオチドから約5000kb以内、さらに好ましくは末端ヌクレオチドから約3500kb以内、さらに好ましくは末端ヌクレオチドから約2500kb以内、さらに好ましくは末端ヌクレオチドから約1500kb以内、さらに好ましくは末端ヌクレオチドから約1000kb以内、さらに好ましくは末端ヌクレオチドから約800kb以内、さらに好ましくは末端ヌクレオチドから約600kb以内、さらに好ましくは末端ヌクレオチドから約500kb以内、さらに好ましくは約400kb以内、さらに好ましくは末端ヌクレオチドから約300kb以内、さらに好ましくは末端ヌクレオチドから約200kb以内、そして最も好ましくは、末端ヌクレオチドから約100kb以内に位置している。設計法は、さらに、特定されたインターバルが、実際に単一コピーの配列で、そのインターバルのみに見いだされるものであることを検証する過程を含むものとすることができる。こうした検証は、計算によって行うことも、実験的に行うことも可能であるものの、好適な方法は、双方の検証を含むものである。実験による確認または検証は、単一コピーの配列を実験的に染色体とハイブリダイズさせるなどの従来の技術によって実施することができる。計算による検証は、BLATまたはBLASTソフトウェアでの解析をはじめとする従来からのコンピュータ・ベースのゲノム探索技術によって行うことができる。しかし、他に、ゲノム規模で計算によって配列の比較を行う技術で同じように適当なものがあれば、そうした方法を使用することによっても、候補プローブが単一コピーの性質を持つかどうかを検証することができる。その後、単一コピーの配列をサイズによって整理し、いくつかのインターバルについてプライマーの設計を行う(長さが1.5kbより長いものが、FISHによる安定した可視化が可能であるという理由により好ましく、また、サブテロメア領域のうちでテロメアに最も近いものが好ましい)。当業者であれば、こうしたアプローチの過程で作製されたプライマーから、従来技術および公的利用が可能なゲノム・データベースをはじめとする広く利用が可能な知識を利用することによって、所望の配列を作製できることに気づくはずである。これは、プライマーの座標をゲノム・データベースで見いだすことができ、そうすれば、これらのプライマーを利用して、目的とする配列を生成することができるからである。また、本発明で作製した配列は、ゲノムのドラフト配列と比較することによって検証することができる。本発明で作製したプライマーおよびその位置については、本発明に記載する。
【0029】
単一コピーのプローブ技術、たとえば米国特許出願第09/573,080号(2000年5月16日出願)および09/854,867号(2001年5月14日出願)(これらの特許出願については、ここに言及することをもって、その双方の教示内容および内容を本出願に組み込むものである)に開示された技術は、大半のプローブは、大半の染色体で、正しい染色体位置のみにハイブリダイズするので、サブテロメア配列の作製に適している。したがって、単一コピーのプローブを、並行して、設計、増幅、生成、標識することができる。単一の位置にハイブリダイズしないプローブに関しては、ドラフト・ゲノム配列に関連配列が含まれていない場合には、こうした座位用、または隣接した座位用に、別のプライマーを作製した。複数の座位に対してハイブリダイゼーションを示すプローブの場合には、このプローブを2以上の部分に分割し、どの部分が、パラロガスな座位または反復配列とハイブリダイズするのかを決定することもできる。こうした分割では、内部プライマー、場合によっては新規な末端プライマーが作製され、この新規な生成物は、染色体にハイブリダイズされる。他の染色体領域とは異なり、多くの染色体のサブテロメア・インターバルは、単一コピーのプローブを設計するのがいくつかの点で困難である。これらの領域は極めて遺伝子が多いものの、異なる染色体の末端配列同士で相当程度の遺伝物質の交換や重複が存在している。
【0030】
詳述すると、サブテロメアの単一コピーのプローブは、サブテロメアのインターバルに対応するDNAプローブ配列を、コンピュータソフトウェアを利用して設計することによって作製される。この過程では、サブテロメアの単一コピーのインターバルの大半を特定し、その後、これらのインターバルを、ゲノムのドラフト配列と比較して、この配列インターバルが、ヒトゲノム配列の他の位置に存在していないことを検証する。ヒトゲノム配列は、最新版の配列で追加データが組み込まれている方が正確であると考えられるので、その時点で設計したプローブを、ゲノム配列の最新版と比較して、設計したプローブの座標が、その時点でも、染色体末端から300kb以内に位置しているかどうかを判断する。プローブの製造以降に、大量の配列(>300kb)が染色体のドラフト配列のテロメア末端に追加されている場合には、染色体末端にさらに近い新規なプローブを、新たに確立されたサブテロメアのインターバルから設計する。
【0031】
次に、各サブテロメア領域に対して複数ペアのプライマーセットを用いてPCRによる増幅を行うことにより、断片を合成する。他のアプローチや、単一コピーのプローブの直接合成を行ってもよいが(米国特許第6,521,427参照。この特許については、ここで言及することにより、その開示内容および内容を、本発明に組み込むものである)、こうした方法は、本発明の方法より大量のプローブを製造する場合に適した方法である。設計されたプローブの大半は増幅が可能で、増幅は、単一で均質なPCR産物が生成するよう最適化することができる。稀に、特定のプライマー・セットで増幅が観察されない場合がある。この場合には、PCRでの増幅条件を注意深く最適化し、プライマーおよび増幅産物の配列を再度吟味して、他の染色体上の配列に対してホモロジーを示していないかどうかについて判断する必要がある。それでも依然としてPCRによる増幅が生じない場合には、その座位に対してユニークな別のプライマー・セットを調製して、増幅操作を繰り返す。
【0032】
増幅反応を最適化したら、次に、複数の(または単一の大量の)反応を、並行して進行させ、ハイブリダイゼーションに適した産物を得る。この産物を、ゲル電気泳動で単離した後、カラム遠心分離で精製を行うか、反応混合物の非変性高速液体クロマトグラフィー(DHPLC)によって精製する。次に、この産物をニックトランスレーションで標識し、精製し、2個体(少なくとも1個体の雄)由来の正常な中期染色体にハイブリダイズさせ、蛍光顕微鏡法で観察する。ハイブリダイゼーション効率が(修飾ヌクレオチドを組み込んだ結果特異活性が低いために)低い場合には、プローブを再度標識し、染色体ハイブリダイゼーションを繰り返す。隣接したインターバル由来の複数の単一コピーのプローブを組み合わせて、ハイブリダイゼーションのシグナル強度を増大させることもできる。
【0033】
複数の部位とハイブリダイズするプローブについては、さらに別のいくつかの方法を利用することができる。そうした方法の一つでは、一次産物を分割して2以上の誘導産物とし、これを合成、標識して、ハイブリダイズする。ゲノム配列データベースの情報から、どのプローブの配列がパラロガスな可能性あるコピーを含んでいるのかがわかる場合には、そうした配列を排除するように、プローブを分割する。その領域のゲノム配列を、その位置と配列の内容について、複数の版のゲノムのドラフト配列で吟味する。これは、ゲノムのドラフト配列は、新規な情報で継続的にアップデートされているためである。分割した成分の両方がなおもクロス・ハイブリダイズする場合には、基端側に隣接して位置するゲノム・インターバルから、単一コピーのプローブを設計する。あるいは、またはさらに、Ct 1 DNAとともに一次産物を予備アニーリングして、複数の染色体座位に対するハイブリダイゼーションを低減したり避けたりすることができるかどうかについて判断する。この過程を行った結果、染色体特異的なサブテロメアのハイブリダイゼーションパターンが生じるのであれば、プローブが、プローブの設計の際には検出されなかった高度の反復配列を含んでいることが示唆される。こうした状況が生じた場合には、基端側に隣接して存在する単一コピーのゲノムインターバルから、単一コピーのプローブを設計する。
【0034】
したがって、本発明は、染色体の再構成を検出するうえですこぶる有用である。最近では、DNA配列の不均衡を生じるような染色体末端近くの染色体の再構成は、特発性精神遅滞などの臨床所見を有する個人の10%以下の原因となっているものと推測されている。こうした異常を検出するためには、特殊な染色体検査法、たとえば、こうした染色体領域由来のDNAプローブを使用した通常の蛍光in situハイブリダイゼーション(FISH)が必要である。今日、ヒトゲノム配列が入手可能となったことから、本発明者らは、こうした再構成を検出する際に一般に使用されている市販のDNAプローブの相当数が、染色体の末端に見あたらないことに気づいた。本発明のプローブの多くは、現在入手可能な各種のプローブより染色体の末端に近接して位置しているので、現在入手可能な市販のプローブでは特定できないおそれもあるようなヒト染色体の末端再構成を持つ一部の患者を特定することができる。この方法で作製したプローブは、(a)既存のクローニング・プローブで現在検出することのできるより広範な異常染色体末端の検出、(b)こうした染色体領域が、どのように組織化されているか、そして、(c)こうした染色体領域の配列が、相互に、また他の染色体領域とどのように関連しているかついて知見の提供に有用である。本発明者らは、以前にも、ヒトゲノム配列を使用して、蛍光in situハイブリダイゼーション(scFISH)用の、多岐にわたる染色体領域を標的とした単一コピーのプローブを直接作製したことがある(米国特許出願第09/854,867号、2001年5月14日出願)(この特許出願については、ここに言及することをもって、その教示および内容を本発明に組み込むものである)。こうしたプローブは、一部の患者のこれまでは認識されてこなかった末端再構成を検出する際にも有用である可能性がある。
【0035】
本発明は、単一コピーのプローブのアレイを製造する合理的な方法を提供する。複数の単一コピーのプローブのアレイを、通常の組換えプローブと同じ標的サイズをカバーするように設計することができるが、こうしたアレイをもっと別のユニークなかたちで応用することにより、異常を描写する際の解像度を上昇させることができる。単一コピーのプローブのアレイは、複数の染色体領域由来の標的を同時に検出する際にも、また、単一の連続したゲノム・インターバル由来の標的を同時に検出する際にも使用することができ、単一コピーのプローブのアレイの自動化された製造は、処理量の高いプロセスである。こうしたプロセスを使用して、全真性染色質の染色体の末端由来の単一コピーのプローブを同時に作製した。こうしたアレイは、サブテロメアでの転座、欠失をはじめとする各種の再構成の境界切断点を詳しく画定する際にも使用することができる。たとえば、染色体9q34から複数のプローブが作製されており、これらのプローブの各種の部分集合を組み合わせてハイブリダイズさせて、慢性骨髄性白血病(CML)でのABL1の染色体での切断点を調べ、早期の急性転化に伴う上流のABL1の欠失を検出した(KnollおよびRogan,Sequence−Based In Situ Detection of Chromosomal Abnormalities at High Resolution,Am.J.Med.Gen.121A:245−257(2003))。
【0036】
本発明の一側面としては、本発明の単一コピーのプローブ(例外は、染色体3pおよび19q)は、一般に、染色体の明色に染まる末端Gバンドに位置していることが挙げられる。この点については、ルーチンの臨床細胞遺伝学的解析では、中期染色体を分染し、顕微鏡で調べて、染色体数や染色体構造の変化を探すのではっきりしている。染色体のペアは、サイズおよびバンド形成パターンにしたがって整列させる。この整列させたものは、核型と称され、細胞の全染色体の一体性を調べるうえでの標準的かつ基本的な方法である。正常ヒト細胞の場合、46本の染色体、22対の常染色体(1〜22の番号が付されている)、および1対の性染色体(雌ではXX、雄ではXY)が存在する。型核では、染色体は、対として、サイズの大きい順に並べられ、セントロメアの位置に応じて、染色体はさらに、中部動原体型、次中部動原体型、または末端動原体型に区別される。各染色体は、DNA(ユニークな単一コピーDNA、散在反復DNA、および高度反復DNA)とタンパク質を含有している。各染色体のセントロメアと、大半の染色体のY長腕は、反復DNAから構成され、転写活性を有さないヘテロクロマチンを含有している。末端動原体型染色体の短腕も、複数コピーのリボソームRNAの遺伝子に加えて、高度反復DNAを有している。染色体のテロメアは、染色体の末端を封止して防御するべく機能する短テロメア特異的なDNA反復配列(TTAGGG)を含んでいる。テロメア領域に隣接して、染色体特異的DNA配列とテロメア随伴反復配列から部分的に構成されるサブテロメア領域が存在する(図16)。サブテロメア領域の染色体特異性の例外としては、末端動原体型染色体の短腕と、ヘテロクロマチンを含み、X染色体の長腕の末端とホモロジーを有するY染色体の長腕がある。
【0037】
染色体を、熱または薬品の使用を伴うこともあるような方法で前処理すると、22の常染色体と性染色体は、それぞれ、その染色体に独自の特徴的なバンド状のパターンを示す。バンドは、中期染色体の場合には、暗色および明色に染まる構造となっており、染色体に特異的な目印となる。クローニングしたDNA配列は、こうした構造にマッピングされてきたわけである。この構造は、他の方法では、参照可能とすることのできない核酸プローブ、配列タグ部位、EST、DNAコンティグ、遺伝子などの位置を決定し、規則化する際の参照地点の役目を果たす。というのも、セントロメア領域、ヘテロクロマチン領域、末端動原体の短腕が反復性の性質を有するために、どの染色体も、全体の配列の決定に至っていないからである。
【0038】
臨床細胞遺伝学検査で一般に使用される分染パターンは、G分染法と称され、この分染は、染色体をトリプシンで前処理し、その後、ギムサで染色することによって行われることが多いものの、他の処理方法、たとえば、蛍光染料(たとえば、これに限られるわけではないが、4,6−ジアミジノ−2−フェニルインドール)で処理しても、染色体特異的な分染パターンが得られる。R分染法は、逆分染法で、明色と暗色のGバンドの逆パターンが得られる。染色体を捕捉するのが細胞周期の異なる時期であると、すなわち、中期と前中期とでは、染色体の目に見えるバンドの数が増減する。
【0039】
分染した染色体の核型分析によって特定された染色体異常は、国際細胞遺伝学命名規約(International System for Cytogenetic Nomenclature,ISCN)に従って記載する。この命名規約は、1971年にまず導入され、1972年に公表され、現在は、1995版(ISCN,1995)が世界各地で使用されている。この命名法は、細胞遺伝学の専門家や臨床家が、染色体異常を記載する際の共通言語となっており、各回ごとに核型を示さなくても、各種知見について互いに、また臨床の専門家とコミュニケートすることができる。ISCNでは、染色体バンドの解像度についての標準も提供されている。ISCNでは、目に見えるバンド数に応じて、3レベルの異なったバンド解像度、すなわち、半数体の核型ごとに400、550、および850バンドのレベルの解像度を規定している。通常の高解像度の細胞遺伝学の研究の場合、バンド解像度は少なくとも550バンドとなる。解像度がこのレベルであると、末端Gバンドは、染色体3p、19q、およびYp以外の全染色体で明色に染まる。多くの領域の染色体バンドは、解像度が上昇するにしたがって、明色および/または暗色に染まるサブバンドに別れる。850バンドのレベルでは、染色体Ypも、明色に染まる末端バンドを有するようになり、末端染色体3pバンド(すなわち、3p26)は、3つの小型のサブバンド、すなわち、2本の暗色のサブバンド(3p26.1、3p26.3)と1本の明色のサブバンド(3p26.2)に分かれ、末端染色体19バンド(19q13.4)は、3本の小型のサブバンド、すなわち2本の暗色のサブバンド(19q13.41、19q13.43)と1本の明色のバンド(19q13.42)に別れる。各染色体末端が明色に染まり、ほとんどの染色体が同じに見える結果、これらの末端染色体バンドのみ、またはこうした染色体領域内での交換(すなわち転座)は、いずれも、ルーチンの細胞遺伝学的解析では認識されないことになる。こうした物理的特性を見るには、他の分子レベルの方法、たとえば染色体特異的な核酸プローブを使用した蛍光in situハイブリダイゼーション(FISH)を用い、末端染色体バンドの再構成を特定すること必要となる。
【0040】
この命名法では、構造上の定義も提供されているので、当業者は、プローブ(遺伝子を含む)を、染色体バンド(平均サイズは500万塩基対)にマッピングすることができる。ISCNの分染表示法は、正確とはいえないものの、安定している点で有利である。また、ヒトゲノム配列は、こうした分染した染色体の骨格に言及して、はじめて解釈が可能となる。実際、ヒトゲノム配列は、技術的な限界のために、(a)セントロメアおよびヘテロクロマチン、および(b)末端動原体型染色体(13,14,15,18,21,22)p腕配列の配列が決定できておらず、未完成である。結果的に、現行のヒトゲノムのコンティグのアレイは、分染情報に言及することによって、この階梯に明確に位置させることができる。さもないと、ゲノム配列についての知識のないものは、たとえば、公的または私的なヒトゲノム配列のデータベースのいずれかの、染色体21のポジション1が、実際に、p腕の開始地点からはじまっていると理解する可能性があり、むろん、これは正しくない。したがって、配列がどこに位置しているかを正確かつ一貫性をもって記載するためには、座標と配列を一緒に使用する必要があり、これは、プローブをリンクする構造的特徴として配列または座標のいずれかを単独で使用した場合には、誤った結果が出ることになるからである。
【0041】
本発明の別の観点では、単一コピーの産物を、サブテロメア染色体配列の固相ハイブリダイゼーションに利用する方法を提供する。当業者であれば、本発明の方法によって合成された単一コピーの核酸産物を化学的な共有結合や静電荷の中和よって固体表面に安定的に付着させ、その後、標識核酸の混合物から構成される溶液にハイブリダイズさせうることを理解できるはずである。基体は、通常、顕微鏡のスライドガラスを使用するが、他の表面、たとえば、カラム、毛細管、チップなども使用できる。核酸混合物は、精製DNA完全ゲノム、合成クローンの組み合わせ、DNA断片、PCR生成物、またはcDNAまたはcRNAのライブラリーを含むものとすることができる。本技術の単一コピーのプローブのアレイを、比較ゲノムハイブリダイゼーション(CGH)法の標的として使用することができる。このアレイは、サブテロメアの再構成を検出するうえでは、合成ゲノムクローンにもとづいた現行のアレイより有利である。標識ゲノムDNAの合成ゲノムクローンのアレイとのハイブリダイゼーション反応では、反復配列のハイブリダイゼーションを遮断するための、Cot 1 DNAとして公知の試薬反復DNA配列を加えることが必要である。アレイCGH法は、染色体のサブテロメア領域のモノソミーおよびトリソミーを同時に特定する際の代替法となる。この方法は、それぞれ異なった蛍光部分で標識された健常者のと患者のゲノム配列の相対的なハイブリダイゼーション強度の比較にもとづくものである。クローニングしたプローブに基づいたアレイCGHの複数施設での最近の研究(Carterら,Cytometry 49:43−48、2002)(この文献については、ここに言及することをもって、その教示内容および内容を本発明に組み込むものである)では、こうしたクローンで、反復配列のハイブリダイゼーションの抑制にばらつきがあることが、同一バッチの標識ゲノムプローブおよびクローンを使用して作業している実験施設間で再現性がないことに関して、最も一般的な説明であることが示されている。すなわち、導入した反復配列のハイブリダイゼーションを完全には抑制できない結果、正常/異常蛍光強度の比の測定に誤差が生じていたのである。単一コピー生成物を含むアレイを使用した場合には、ブロック剤をハイブリダイゼーション反応に加える必要がないので、このエラー源は、存在しないことになる。また、単一コピーの生成物を含むCGHアレイを使用した場合には、不均衡な染色体領域の境界がより正確に確定されることになり、これは、サブテロメアの再構成を調べるアレイCGHおよびFISHによる解析で伝統的に使用されてきた多くの合成ゲノムのプローブとは異なり、染色体上でのこれらのプローブの位置が、塩基配列レベルで正確に規定されているからである。
【0042】
本発明の別の観点では、プローブを使用し、それらを臨床表現型と相関づける方法を提供する。サブテロメア領域の研究は、細胞遺伝学的に正常な染色体を持つ個人で、合成DNAプローブを用いた通常のFISHによって(バンドの解像度、≧550)、分子の欠陥を特定することによって行われてきた。また、これらの領域については、さらに異常について解析を進めるべく、目に見える細胞遺伝学的異常のある個人でも研究が行われている。正常染色体を有する研究対象集団としては、(1)不妊または複数回の流産の経験がある個人、および(2)精神遅滞を有するものの、一般的な精神遅滞の原因は除外され、原因が不明である個人(すなわち、特発性精神遅滞)を含むものである。細胞遺伝学的に正常な患者の集団については、これらの研究でのサブテロメアについての結果では、複数回の流産または不妊の経験がある個人での異常の増大は何ら示されなかった。しかし、特発性精神遅滞と診断された個人については、サブテロメアの異常が、軽度の精神遅滞では約0.5%、中程度から重度の精神遅滞および他の臨床的な異常を持つ個人では約5%(0〜10%の範囲)に見られた。中程度から重度の精神遅滞の精神遅滞の個人については、別の研究で、多岐にわたるサブテロメアの異常が報告されている。この点については、サブテロメアの研究対象集団を規定する際に使用された臨床規準が比較的非特異的であった結果、確認時に偏向が生じたこととおそらく関連している。中程度から重度の精神遅滞の個人についてサブテロメアの解析を行う際の臨床上の最良の指標としては、精神遅滞についての陽性の家族歴、成長遅滞(出生前および出生後)、顔異形、および1異常の他の顔以外の異形状態および/または先天性の異常を挙げることができる。
【0043】
精神遅滞は、遺伝的不均衡を生じるようなサブテロメアの異常を持つ患者の全員とはいえないまでも大半において、最も一般的な特徴である。サブテロメアの欠失のいくつかは、特定の一連の臨床像を生じるので、臨床家はそうした臨床像をもとに診断を行うことができる。しかし、サブテロメアの異常を持つ患者の大半は、その時点では、特徴的な一連の臨床所見を欠いている。こうした患者では、サブテロメアの欠陥は、通常、領域の消失(すなわち、欠失またはモノソミー)、または不均衡な相互転座によって生じたある領域の消失と別の染色体末端の獲得(すなわち、ある染色体についての部分モノソミーと、別の染色体についての部分トリソミー)である。染色体の数およびサブテロメア領域の数を考慮すると、異なったサブテロメア領域についての部分モノソミーと部分トリソミーの組み合わせも多数存在する。すなわち、実質的な数の潜在的な染色体の再構成が、同じく多岐にわたる一連の臨床表現型を生じているものと考えられる。臨床上の多様性を生じる可能性のある要因としては、他にもいくつかあり、そうした要因としては、(1)末端染色体バンド(数百万塩基対)の長さから想定される、欠失において消失する1以上の末端バンドの量(および遺伝的内容)、(2)さらには、不均衡な転座でのクロマチンの消失のサイズ、そして(3)劣性アレルのホモログでのさまざまな顕在化を挙げることができる。大半のサブテロメアの異常では、類似した異常を持つ患者の報告数は限られており、いくつかのサブテロメア領域については、症例が報告されていない。患者の約半数では、サブテロメアの再構成は新規なもののようであり、他の半数は、キャリアである親から1以上の異常染色体を受け継いだものである。共通の臨床所見を特定するためには、そうした再構成を生じた患者を十分な数確認する必要があり、現在入手可能なプローブは位置が正確に決定されておらず、患者の臨床所見も多用であることからすると、特定の染色体不均衡を、臨床所見にもとづいて診断することが可能となるとは考えにくい。したがって、こうした患者群についての解析を行う唯一の実践的戦略は、全サブテロメア領域を包括的に調べる方策だということになる。1以上の異常なサブテロメア領域が特定された後に、末端染色体バンドから誘導した一連の各種のプローブを用いて試験を行うことによって、不均衡のサイズ(および具体的な関連遺伝子)をさらに解析することができる。
【0044】
診断を可能とするような特定の一連の臨床像を生じるサブテロメアの欠失のいくつかについては、特定のサブテロメア・プローブを用いることで、診断を確認することができる。特定のサブテロメア領域についての一組のプローブを用いると、所定の患者の特定の臨床所見を確定する欠失のサイズまたは長さを画定することができる。いくつかの十分に特徴づけられた症候群は、末端染色体バンドの一部のみの欠失によって生じており、こうした症候群としては、モノソミー1p36症候群(染色体1pの欠失)、ウォルフ−ヒルシュホーン症候群(染色体4pの欠失)、猫鳴き症候群(染色体5pの欠失)、およびミラー・ディッカー症候群(染色体17pの欠失)を挙げることができる。しかし、こうした症候群に罹患した患者はさまざまな臨床所見を示し、そうした臨床所見の一部は、欠失のサイズや、1以上の劣性遺伝子の顕在化をはじめとする各種の遺伝要因によって変化する。
【0045】
また、遺伝性または体質性の染色体異常に関しては、白血病をはじめとするいくつかの癌で観察される獲得性の染色体異常を、サブテロメア・プローブを用いて調べて、わずかな再構成を検出したり、さらに細胞遺伝学的に可視性の異常を解析することができる。
【0046】
本発明の別の観点では、染色体の再構成を検出するうえで有用なサブテロメア・プローブを提供する。このプローブは、一般に、長さが25kb未満、より好ましくは10kb未満で、配列が、単一染色体の腕の末端GバンドまたはRバンドにハイブリダイズすることができる単一コピーのDNA配列を含んでいる。G分染法を使用すると、末端バンドは、明色に染まり、R分染法を使用すると、末端バンドは、暗色に染まる。本発明のこの観点で使用する染色体腕としては、1p、1q、2p、2q、3p、4p、4q、5p、5q、6p、6q、7p、7q、8p、8q、9p、9q、10p、10q、11p、11q、12p、12q、13q、14p、14q、15p、15q、16p、16q、17p、17q、18q、19p、19q、20p、20q、21p、21q、22p、22q、Xp、Xq、およびYpが挙げられる。プローブの例は、一般的に、1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251よりなる群から選ばれるものである。プローブは、染色体のテロメアから8000kb以内とすることが好ましい。この点では、プローブの例として、1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251を挙げることができる。プローブは、染色体のテロメアから300kb以内とするのがさらに好ましい。この点では、配列番号36、80、46、47、49、51、56、248、57、78、59、75、76、74、63、250、251、66、65、67、4、3、1、9、6、11、10、17、20、19、18、21、81、26、29、28、31、32、43、42、41、40、44、45、および70よりなる群より選ばれたプローブが好ましい。さらに、好適なプローブは、標識されているか、表面に付着するよう修飾されている。
【0047】
本発明の別の観点では、単一コピーのDNA配列のプローブを、染色体のサブテロメア領域から作製する方法を提供する。このプローブは、個々人のゲノムの単一の位置にハイブリダイズすることができ、この方法は、一般に、上記末端ヌクレオチドに最も近い長さが少なくとも500塩基対の単一コピーのインターバルを求めて、染色体のDNA配列を、末端ヌクレオチドから開始して、ヌクレオチドごとに検索し、単一コピーのインターバルを特定し、特定した単一コピーのインターバルを合成し、合成した単一コピーのインターバルをプローブとして使用する過程を含むものである。好適な方法は、計算または実験によって、特定した単一コピーのインターバルが、単一のゲノム座位で表示されるか、パラロガスな配列が密接に関連していて、単一のハイブリダイゼーション信号のみが検出されることを検証する過程を含んでいる。この点に関しては、単一コピーの配列を標識することが好ましい。また、特定の過程が、計算と実験の双方による検証を含むものであるのが好ましい。計算による検証の好適な方法では、ソフトウェアを使用して、プローブの配列が、ゲノム中の単一の位置に位置していることを判定する。実験による検証の好適な方法では、単一コピーのプローブを染色体に再度ハイブリダイズさせて、このプローブを末端バンドおよび染色体の正しい腕上で可視化する。好適な単一コピーのインターバルは、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251よりなる群から選ばれる。この方法は、さらに、単一コピーのプローブを高度反復DNAとともに予備的にアニーリングする過程を含むものとすることもできる。
【0048】
本発明のさらに別の観点では、染色体の再構成を特定するための合成された単一コピーのポリヌクレオチドを提供する。このポリヌクレオチドは、染色体の末端ヌクレオチドから8,000kb以内に位置しているのが好ましく、染色体の再構成が生じていない場合には、特定の染色体の単一の位置にハイブリダイズすることができる。好適なポリヌクレオチドは、長さが25kb未満で、上記の特定の染色体の末端GバンドまたはRバンドに位置している。好適なポリヌクレオチドは、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251よりなる群から選択される。特に好適なポリヌクレオチドは、特定の染色体の末端ヌクレオチドから約300kb以内に位置している。特に好適なポリヌクレオチドとしては、配列番号36、80、46、47、49、51、56、248、57、78、59、75、76、74、63、250、251、66、65、67、4、3、1、9、6、11、10、17、20、19、18、21、81、26、29、28、31、32、43、42、41、40、44、45、および70よりなる群から選ばれるポリヌクレオチドを挙げることができる。ポリヌクレオチドは、標識するか、化学的に修飾して表面に付着させることが好ましい。
【0049】
本発明の別の観点では、染色体の再構成を検出しうる単一コピーのプローブを誘導するにあたって使用するオリゴヌクレオチド・プライマー・ペアを提供する。プライマーは、配列番号83〜244よりなる群から選択することが好ましい。
【0050】
本発明のさらに別の観点では、染色体の再構成を検出する際に機能しうる改善された合成DNAプローブを提供する。このプローブは、染色体腕上の位置にハイブリダイズしうるDNA配列を含んでいる。このプローブの改善点としては、プローブの長さが25kb未満であることが挙げられる。別の改善点としては、このプローブが単一コピーの配列であって、プローブの少なくとも一部が、コスミド、フォスミド、バクテリオファージ、P1、およびhalf YACSから誘導したPACクローンよりなる群から選ばれるクローンより、染色体のテロメアの末端に近接して位置していることが挙げられる。プローブの全体が、これまでに言及されているクローンより、染色体のテロメア末端に近接して位置していることが好ましい。本発明のこの観点の好適な染色体腕は、2p、3p、7p、8p、10p、11p、16p、Xp、Yp、1q、3q、4q、6q、7q、8q、9q、10q、12q、13q、14q、15q、16q、17q、18q、20q、22q、およびXqよりなる群から選ばれる腕を含むものである。プローブは、染色体のテロメアの末端ヌクレオチドから8,000kb以内に位置しているものとするのが好ましく、プローブは、染色体のテロメアの末端ヌクレオチドから300kb以内に位置しているものとするのがさらに好ましい。好適な形態では、プローブは、上記染色体の末端GバンドまたはRバンド中に位置している。本発明のこの観点の好適なプローブは、配列番号46、47、49、56、78、59、64、249、2、4、3、5、9、11、20、19、21、81、246、70、72、73、36、80、247、50、57、75、76、74、63、250、66、65、67、1、6、10、12、16、15、13、14、17、18、81、245、26、31、32、43、42、41、40、44、および45よりなる群から選ばれるプローブを含むものである。
【0051】
本発明の別の観点では、細胞遺伝学的異常について個々人をスクリーニングする方法を提供する。個々人は、共通の一連の臨床所見に基づいて、特発性精神遅滞であると診断する必要がある。また、個人は、特発性精神遅滞に伴う少なくとも1つの臨床的な異常を示す必要がある。この方法は、一般に、個々人のゲノムを、各プローブの長さが約25kb未満であるような複数のハイブリダイゼーション・プローブを使用してスクリーニングし、個々人のゲノムの細胞遺伝学的異常を示唆するプローブのハイブリダイゼーション・パターンを検出する過程を含むものである。アッセイでは、各染色体腕由来のプローブを少なくとも1種使用することが好ましい。しかし、状況によっては、臨床的な異常または共通の一連の臨床所見が、染色体腕の全集合のうちの部分集合に関連している可能性があるという理由で、特定の染色体腕のみを調べる必要がある場合もある。この方法は、さらに、ハイブリダイゼーション・パターンを、特定の臨床上異常と関連づける過程を含むものとすることができる。プローブは、単一コピーのプローブであることが好ましく、つまり、プローブは、単一のゲノム座位で表示されるか、パラロガスな配列が密接に関連していて、単一のハイブリダイゼーション信号のみが検出されることが好ましい。
【0052】
本発明の別の観点では、染色体の不均衡の程度を記載する方法を提供する。この方法は、一般に、長さが約25kb未満の複数のハイブリダイゼーション・プローブを使用して染色体腕を調べ、プローブの腕とのハイブリダイゼーション・パターンを検出し、ハイブリダイゼーション・パターンを、腕についての標準ゲノム・マップと比較して、染色体の不均衡の程度を記載する過程を含むものである。こうした方法は、複数の染色体腕について実施することができる。調べる腕は、個人についての共通の一連の臨床所見に応じて選択することも、また、臨床上の異常を、1以上の腕と関連づけることもできる。この方法は、さらに、腕の不均衡を、医学的状態と相関させる過程を含むものとすることができる。好適な医学的状態としては、特発性精神遅滞および癌を挙げることができる。
【0053】
好適な態様の詳細な説明
以下の実施例は、本発明の好適な態様を説明するものである。これらの実施例は、例示の目的で示すものであり、これらの実施例中のいずれの記載も、本発明全体としての範囲を制限するものではないと理解されたい。
【0054】
実施例1
この実施例では、本発明にしたがって、単一コピーのプローブを作製する過程について記載する。
【0055】
材料および方法
ヒトの全染色体に対するサブテロメアの単一コピーのFISHプローブの作製と、正常ヒト染色体とのハイブリダイゼーションによる、それらのプローブの試験
プローブの設計: プローブの配列は、2001年4月、2002年6月、および2002年11月のヒトゲノムのドラフト配列、およびセレラ・ゲノミクス(Celera Genomics)のヒトゲノム配列を、すでに記載されているようにして使用して(Roganら,Sequence−Based Designs of Single−Copy Genomic DNA Probes for Fluorescence In Situ Hybridization,11 Genome Research,1086−1094 (2001)、この文献については、ここに言及することをもって、その教示内容および内容を本発明に組み込むものである)、設計および確認を行った。第一の目的は、各真性染色質の染色体腕のテロメアに隣接する単一のゲノム座位を認識する単一コピーのプローブを選択することである。パラロガスな重複を繰り返すことによって進化してきた染色体末端でこの作業を行うのは、それなりの困難を伴う。パラロガスな非同座性の重複は、標的である単一コピーのインターバルの配列を、ゲノムの残りの部分と比較することによって検出する。米国立医学研究所(National Laboratory of Medicine)のBLATサーバーを使用して、公共のヒトゲノムのドラフト配列中の他の非同座性の配列類似性をテストし、一方、セレラ(Celera)社の配列については、BLASTを使用して、サンのワークステーションでローカルに検索した。長さが<500bpおよび/または配列の同一性が<80%の非同座性の配列ブロックは、そうした配列の類似性は、FISHでは検出可能とはならないので、クロス・ハイブリダイゼーションの可能性のある部位とは考えない。
【0056】
各染色体の末端から100kbのインターバルずつ、単一コピーのインターバルを探していった。長さが少なくとも約1.8kbの単一コピーのインターバルが、サブテロメア配列の最初の100kbの位置に見つかった場合には(そして、このインターバルが、計算上、ゲノムの他の位置とクロス・ハイブリダイズしない場合には)、このインターバルを、プローブとして選択した。そうでない場合には、隣接した100kbのゲノムインターバルを、候補となる単一コピーのプローブ配列について検索し、適当なプローブが特定できるまで、この操作を繰り返した。これまでに作製された単一コピーのプローブの大半は、テロメアから200kb以内に位置している。一般には、もっと長い染色体プローブが望ましいものの、1.8kbの単一コピーのインターバルからは、一般に、1.5kbのプローブを生成することができ、FISHで可視化することができる。
【0057】
プローブの生成、標識、およびFISH: 各染色体領域についての単一のDNA断片を、Pfx−Taq(Invitrogen、社)を使用したロングPCRによって増幅した。最適化の実験では、一連のPCR反応を実施し、各回で、予測されるプライマーのアニール温度の前後の異なったアニール温度を使用して、サイズが均一な増幅産物が精製する、なるべく高い温度を判定した。特異性についても、PCR増強剤溶液の濃度を製造業者の指示にしたがって変化させることにより、最適化した。所定のプライマー・セットでは、温度および増強剤の濃度を変化させても増幅が達成されない場合には、プローブ作製用に、別の隣接した単一コピーのインターバルを選択する。その後、断片を、カラム精製またはゲル電気泳動などの通常の方法で単離して、混入している可能性のある反復配列を取り除き、マイクロスピン・カラム(Millipore)を使用した低温アガロースからの精製、または調整用の非変性高速液体クロマトグラフィー(Transgenomic、ネブラスカ州オマハ)によって、精製を行った。次に、プローブ断片を、ニック・トランスレーションによって、修飾または直接的に標識したヌクレオチド(たとえば、ジゴキシゲニン−dNTP、蛍光色素−dNTPなど)を使用して直接標識した。標識プローブを、変性し、顕微鏡のスライドガラスに固定化した固定変性染色体調製物にハイブリダイズした。プローブを、2人分の染色体に、通常のFISH法(KnollおよびLichter,In Situ Hybridization to Metaphase Chromosomes and Interphase Nuclei,Current Protocols in Human Genetics,Vol.1,Unit 4.3 (N.C.Dracopoliら編)(1994)、この文献については、ここに言及することをもって、その教示内容と内容を本発明に組み込むものである)にしたがってハイブリダイズした。プローブのハイブリダイゼーションは、標識ヌクレオチドを、蛍光標識抗体で結合し、適当なフィルターセットを使用した蛍光顕微鏡法で観察することによって検出した。染色体DNA全体を、4’,6−ジアミジノ−2−フェニルインドール(青)で対比染色し、ハイブリダイズしたプローブの信号を、蛍光色素で可視化した。
【0058】
検証: 各常染色体のサブテロメア・プローブは、正常な雌または雄細胞中のホモロガスな染色体ペアにハイブリダイズする(2信号が期待される)。X染色体から作製したプローブは、雄細胞中の1染色体、および雌細胞中の2染色体とハイブリダイズする。Y染色体から作製したプローブは、雄細胞のみとハイブリダイズする。異なる2人に対する並行したハイブリダイゼーションを行って、染色体バンドの位置を確認した。対照のハイブリダイゼーションを、以前に検証済みのプローブを用いて並行して実施した。最低10個の中期の細胞を測定して、各プローブのハイブリダイゼーション効率を判定した。一般に、従来技術のFISHプローブも、単一コピーのFISHプローブも、ハイブリダイゼーション効率が少なくとも90%、より好ましくは少なくとも92%、さらに好ましくは少なくとも94%、さらに好ましくは少なくとも96%、さらに好ましくは少なくとも98%、特に好ましくは100%である。
【0059】
プローブが、染色体の多くの位置に、区別なくハイブリダイズするのであれば、中程度〜高度に反復的なゲノム配列を含んでいる可能性が高い。現在の反復配列のデータベースは、極めて包括的で、このパターンのハイブリダイゼーションは、一般的ではないが、一部のプローブでは、こうしたことも観察されている。こうした結果からは、ヒトゲノム中には、DNA配列のレベルでまだ解析されていない反復配列ファミリーが存在することが示唆される。本発明者らのこれまでの単一コピーのプローブの設計経験にもとづくと、一部のプローブのみが、ゲノム全体に分布するような非記載の分散型の反復配列ファミリーと非特異的にハイブリダイズする。ゲノム規模でクロス・ハイブリダイゼーションを生じたり、高度反復配列とのクロス・ハイブリダイゼーションを生じたりするプローブは、Cot 1 DNAと予備的にアニーリングすることができる。クロス・ハイブリダイゼーションは、高度反復(すなわちCot1のような)DNAと予備的にアニーリングすることによって抑制または防止できる。プローブ中の単一コピーの配列のハイブリダイゼーションが停止する場合には、隣接する単一コピーのインターバルを、プローブ作製用に選択する。
【0060】
2以上の染色体領域とハイブリダイズするプローブの特性解析
本発明者らは、予想外にも、単一コピーとなるよう設計したプローブ中に、高度に反復性の配列ファミリー以外にも、中期染色体上の、プローブの設計に用いた染色体部位ではない限られた一連の離散した座位にハイブリダイゼーションが生じるというパターンを観察した。このハイブリダイゼーション・パターンは、プローブが、他の染色体の配列または同じ染色体の他の配列と高度に関連した複雑な、低度に反復性の配列を含む場合に生じており、こうした配列は、パラロガスな配列として知られているものである。こうしたハイブリダイゼーション・パターンは、ゲノム配列が不正確であったり未完成であったりするという理由で生じている可能性がある。しかし、ヒトゲノム配列は、特に、ヘテロクロマチンを含む領域については、未完成であることが認められている。そうした領域に埋もれた単一コピーの配列のパラロガスなコピーは、現在のゲノムのドラフト配列には、包括的に組み込まれているわけではないようである。他の、まだ完全ないし無謬には組み立てられていないゲノム中の領域は、ドラフト版では、「ギャップ」インターバルとして示されている。こうした領域内に存在する、単一コピーのプローブのパラロガスなコピーまたは重複コピーも、非同座性の座位への予測外のハイブリダイゼーションが生じる原因となっている可能性がある。プローブの選択に用いたソフトウェアは、関連ゲノム配列をイン・シリコで検出することができるものの、ゲノム配列がまだ未完成なので、特定のプローブが、他の染色体または同じ染色体上の他の未解析の関連配列にアニーリングする可能性は常に存在する。高度に反復性のDNAを含むもとのプローブの予備的なアニーリングを行っても、離散パターンの染色体座位へのクロス・ハイブリダイゼーションが抑制されない場合には(たとえば、表1の染色体16の結果を参照のこと)、プローブが、高度反復性の配列ではなく、1以上のパラロガスな配列(すなわち、低コピー数で存在する配列)を含んでいる可能性が示唆される。
【0061】
【表1】




*: 他の染色体でのクロス・ハイブリダイゼーションが観察された。
**: クロス・ハイブリダイゼーションが生じている可能性があるので、さらなる検証が必要である。
***: Ct1による抑制を行ったにもかかわらず、クロス・ハイブリダイゼーションが生じた。
^: プローブを、「^」で標識した他の10ptelプローブと組み合わせた場合に、ハイブリダイゼーションが検出された。
: プローブを、「」で標識した他の10ptelプローブと組み合わせた場合に、ハイブリダイゼーションが検出された。
【0062】
2001年4月版よりはその後のバージョンのゲノム・アセンブリーの方が正確であると推測されるので、プローブの配列は、最新のバージョンと比較して、そうしたバージョンに、当初のプローブの配列に関連した配列が追加されていないかを判断することができる。パラログを特定するには、プローブの配列を、ゲノムのドラフト配列と比較し、その際には、重複コピーには、許容される配列の類似性を低めに設定する。最新のゲノム配列のドラフトによって、関連配列の存在が明らかになった場合には、同じまたは異なる染色体上の他のバンドにパラログが存在するような染色体特異的なプローブを生成するにあたって、2つの異なる戦略、すなわち、(1)当初のプローブが十分に長い場合には、プローブを二分して、プローブの非パラロガスな領域を再増幅する、または(2)プローブの作製にあたって、ゲノムのパラログを含まないような、異なった単一コピーのインターバルを選択するという戦略を利用することができる。配列解析によって関連配列が特定されない場合には、内部プライマーを作製して、もとのプローブを、染色体特異的な配列に二分する。
【0063】
もとのプローブを二分して、どちらの成分が複数の部位とハイブリダイズしているのかを判断することができる。この二分の過程は、2つの小型産物を生じるような内部プライマーまたは場合によっては新規な(似たような融点とGC組成を有する)末端プライマーを作製することによって実施することができる。これらの新たな産物は、単一コピーFISHのプローブとして利用できる。二分後も、クロスハイブリダイゼーションが生じる場合には、プローブをさらに二分することも、また、新たな単一コピーのプローブを隣接するゲノム・インターバルから設計して、FISHで検定することもできる。
【0064】
もとのプローブを二分した後には、2つのハイブリダイゼーション・パターンのいずれか、すなわち、一方の産物が染色体特異的であり、もう一方が、他の染色体領域にハイブリダイズするか、双方の産物とも、依然として、複数の部位にハイブリダイズするかのいずれかが期待される。前者のパターンでは、反復配列またはパラロガスな配列を含む領域の位置が決定され、一方、後者の場合には、そうした領域の位置は決定されず、内部プライマーのセットが、反復配列またはパラロガスな配列を含んで延在していることが示唆される。
【0065】
今日までのところでは、長さが1500bp以上の断片であれば、蛍光顕微鏡法によって、信頼性をもって可視化することができる。したがって、プローブを二分する場合には、生じるプローブが、少なくとも1500bp以上となるよう尽力する。これより短いプローブであっても、標的の全体的サイズが少なくとも1500bpとなるよう組み合わせることができる。こうした方法によって、他の染色体上のパラロガスな配列とクロス・ハイブリダイズする大型のプローブを二分することにより、染色体4p末端配列のみを検出するプローブを作製した。二分したプローブが長さ1.5kb以上となるように設計できない場合や、プローブの配列の全長に延在する非同座性の配列に対して広範なパラロジーが存在する場合には、クロス・ハイブリダイゼーションを生じる当初の配列に隣接した別の単一コピーのインターバルを選択する。
【0066】
プローブが染色体末端と近接していることを確認し、必要に応じて、染色体末端にさらに近いプローブに変更する。
2001年4月のゲノムドラフト配列から設計したプローブの位置を、ゲノムの最新版ドラフト配列での位置と、計算によって比較した。位置座標が染色体末端がら遠ざかっていた場合には、染色体末端により近接した新たな単一コピーのプローブを、2001年4月のドラフト配列から設計し、その結果、単一コピーの標的を検出する46のサブテロメア・プローブが検証され、さらに36のサブテロメアの単一コピーのプローブが、その後のバージョンのゲノム配列から設計され、マッピングされた。新規なプローブの作製は、サブテロメアのインターバルに、反復配列や他の染色体上のパラログが不在であるかどうかによって決まる。染色体末端になるべく近いプローブを作製することにより、既存のクローニングしたプローブを使用した場合には明らかとなることのない末端再構成を検出できる可能性が増える。
【0067】
結果
従来技術のサブテロメアのFISHプローブと比較すると、本発明にしたがって作製したサブテロメアの単一コピーのプローブは、染色体の末端配列の(こうしたゲノム領域の欠失または不均衡で潜在的な転座の結果生じる)再構成を、従来検出可能であったよりも小型のものまで検出することができた。本発明のプローブのセットは、真性染色質の配列決定済みのサブテロメア領域のすべてを検出するよう、設計されている。プライマーは、染色体1、3、5q、7、8、9q、10p、11、14q、16q、17、19、20q、Xp、およびYpのサブテロメア領域の単一コピーのプローブとして作製、検証された各サブテロメア領域内のユニーク配列を認識するよう設計され、そして実際にこうした配列を認識する(表2を参照のこと)。これらの配列はユニークで、対応するヒトゲノム配列が公的に利用できるので、プライマー自体がゲノム中で唯一の産物を画定している。したがって、配列番号83〜244に記載したプライマーの一部は、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251に記載した産物と同等である。
【0068】
【表2】


































【0069】
プローブ候補は、染色体末端領域に密着して配列させ、座標を正確に記載する。本発明のプローブは、各染色体腕のテロメアから、ある範囲の距離にわたって、一般には、各染色体の末端バンド内で延在している。個々の単一コピーのプローブまたはこうしたプローブの組み合わせを使用すると、再構成に関与した染色体領域のサイズを、高精度で、すなわち、獲得または消失した配列の長さ、染色体の転座または逆位の切断点の位置を記載することができる。
【0070】
染色体13、14、15、21および22の短腕、すなわちp腕、およびY染色体の長腕、すなわちq腕の変更は、臨床上の異常の原因とはなっていないようである。これらの領域は、主に反復配列から構成されており、その完全な配列は未決定である。したがって、こうした領域のプローブは、作製していない。しかし、こうした染色体腕がユニークな単一コピーの配列を含むことがわかった場合には、本発明は、こうした領域のプローブを作製し、利用する方法を提供するものである。
【0071】
表2に、すべての真性染色質の染色体の末端用の単一コピーのプローブについての結果をまとめて示す。プローブは、全染色体の染色体特異的な末端バンドに対して合成、ハイブリダイズ、可視化した。上述したように、いくつかの染色体末端については、複数のプローブを設計し、検証した。表1では、数種の染色体末端バンド(11q、16p、18p、20p、および22q)のそれぞれについて1プローブが、他の染色体のパラロガス配列または反復配列ファミリーを検出するようである。この表の残りのプローブおよび、表3の全ての追加のプローブは、臨床用途で必要とされる染色体特異性を示す。
【0072】
【表3】




1: 2003年4月版のゲノム・ドラフトから作製したscFISHプローブには、アステリスク(*)を付してある。残りのプローブは、1p(2002年11月)、2q、3q、4p、5p、6、8q、9p(2002年6月)以外は、2001年4月版のドラフトから作製した。これらのプローブに対応する配列番号は、UCSCのデータベース版の番号を、これらの産物の記載中に含んでいる。
2: 従来技術のFISHプローブの多くは、Knightら,Am.J.Hum.Genet.67:320,2000、およびAbbot Laboratories/Vysis社によって作製されたものである。
3: プローブから、この表で報告したテロメアの末端までの距離は、2003年4月版のゲノム配列での、プローブの境界の座標から、各染色体末端の末端ヌクレオチドの座標までのインターバルの長さにもとづいている。これらの座標は、ゲノム・ブラウザー・ウェブサイト(genome.ucsc.edu)のコンピュータ・プログラムであるBLATを使用することによって決定した。BLATのアルゴリズムが不正確であるため、プローブの境界の座標は、実際の座標とはわずかに異なっている可能性がある。
4: 従来技術のFISHプローブに付随するSTS/マーカーの位置は、2003年4月版のゲノム配列で決定した。クローンでは、単一のSTS/マーカーが特定されることも多い。こうしたクローンの一部では、存在する可能性のあるSTSマーカーの位置を決定するうえで不十分な情報しか利用できない。その結果、プローブの位置を染色体上で決定する際の誤差(すなわち±)は、一般に、American Journal of Human Genetics 67:p.320,2000およびAbbot/Vysis社によって提供されるクローンのサイズとなってしまう。標準偏差が、クローンの予測サイズ未満であることからは、2以上のSTSがクローンに位置決定されていることが示唆される。
6: 他の染色体に対してクロス・ハイブリダイズしたクローンを示す。
7: プローブは、既知のインターバルだけでなく、隣接したパラロガスな配列も認識する。
8: 報告されたSTSは、X染色体のみに位置しているが、性染色体用の市販のプローブは、双方とも、互いにホモロジーを示す。
9: プローブは、4つのパラログを検出する。そのうち3つは、染色体9上にあり、1つは、染色体2上にある。
不明: 報告されたSTS/マーカーは、全ての利用可能なゲノム・データベースでも、論文の執筆者に連絡をとっても、位置を決定できなかったので、報告されたSTS/マーカーを、ゲノム配列上に位置させることができなかった。
^: プローブを、「^」で標識した他の10ptelプローブと組み合わせた場合に、ハイブリダイゼーションが検出された。
: プローブを、「」で標識した他の10ptelプローブと組み合わせた場合に、ハイブリダイゼーションが検出された。
【0073】
表3では、対応する単一コピーのプローブの位置を、利用可能な染色体配列の末端とクローニングしたサブテロメア・プローブに含まれるサブテロメアSTSとの距離に対して比較する。市販のクローニングしたサブテロメア・プローブ(たとえば、Vysis社のもの)は、内部に含まれる1以上の配列タグ部位(STS)にもとづいて、ゲノム配列(2003年4月版)に位置させた。しかし、これらのSTSマーカーは、クローニングされた大型のセグメントのうちの極めて短いインターバルを占めるにすぎず、したがって、STSからでは、クローンの基端側または先端側の境界を画定することはできないものの、クローンのおおよそのゲノム座位は、STSの位置から推測できる。クローンの既知の長さとSTSの座標がわかると、当該クローンが占めるゲノム座標の範囲を画定することが可能となる。表3に記載したように、本発明で作製する単一コピーのプローブの大半は、同系の組換えプローブと比較すると、染色体末端に相当近接している。本発明の単一コピーのプローブの位置と、利用可能なクローニングされたサブテロメア・プローブの位置との距離的な差が最大となるのは、8pter、13qter、14qter、および6pterであり、こうしたケースでは、単一コピーのプローブの方が、それぞれの染色体の末端に、約800kb以上近接していた。単一コピーのプローブと従来技術のプローブの間に介在する先端側の8pterのインターバルは、4以上の遺伝子を含んでおり、これらの遺伝子の欠失は、クローニングしたプローブでは検出されないものの、単一コピーのプローブを使用した場合には検出される。先端側の13qterの領域(図17を参照のこと)は、10を超える確認済みまたは推定上の遺伝子を含んでおり、先端側の14qterは、3の確認済み遺伝子と30〜40の推定上の遺伝子を含んでおり、16pter領域は、200を超える確認済みおよび推定上の遺伝子を含んでいる。既存のクローニングしたサブテロメアFISHプローブの先端側に位置する8pに含まれる十分に解析された座位としては、たとえば、p53結合性タンパク質ファミリーの一員、インターフェロン誘導タンパク質15ファミリーの一員、β−2−様グアニンヌクレオチド結合性タンパク質(プロテインキナーゼC媒介性シグナル伝達で役割を果たす)、C5A受容関連配列体(肺での粘膜宿主細胞の防御に必要)をコードする遺伝子を挙げることができる。クローニングされたサブテロメア・プローブの先端側に位置する14qterの領域は、ノッチ受容体のリガンドであるJAG2遺伝子を含んでおり、このJAG2遺伝子は、頭蓋顔面の形態形成、肢、胸腺の発達、蝸牛有毛細胞の発達で本質的な役割を果たす遺伝子である。これらの遺伝子(や、まだ十分解析されていない各種の遺伝子)のいずれかで1アレルでも失われれば、臨床上望ましくない結果を生じることは明らかである。本発明のために作製した単一コピーのプローブは、現在利用可能なこれらの座位での半接合を検出しうる唯一のサブテロメアFISHプローブである。
【0074】
正常な中期染色体にハイブリダイズした、サブテロメアの単一コピーのプローブ(または、プローブの組み合わせ)12種についての代表的な複合パネルを図1に示す。各パネルには、検出されたテロメアと、プローブのおおよそのサイズが示してある(サイズは、表1の「おおよそのサイズ」の欄に対応。矢印は、染色体末端へのプローブのハイブリダイゼーションを示す。)各プローブは、配列の誘導に使用したホモロガスな染色体対に対して特異的にハイブリダイズしている。
【0075】
表1は、2002年9月までにハイブリダイゼーションを行った全プローブについて、染色体、プライマーの座標、染色体末端、単一コピーの増幅産物のおおよそのサイズおよび正確なサイズをまとめたものである。染色体10p以外については、同じサブテロメア領域由来の複数の産物を、個々にハイブリダイズし、染色体10pについては、他の10pのプローブと組み合わせてハイブリダイゼーションを行った。表に示すように、プローブには、クロス・ハイブリダイゼーションを示すものがあり(たとえば18ptel)、クロス・ハイブリダイゼーションの可能性を除外するために、さらなる検証が必要なものもあった(たとえば22q)。さらに、16pのプローブは、Cot1による抑制を行ったにも関わらず、クロス・ハイブリダイゼーションを生じた。
【0076】
表2には、各プローブを増幅するのに使用したプライマー、プライマーの座標および配列(2001年4月版のヒトゲノム配列から導出。配列は、カリフォルニア大学サンタクルーズ校のゲノム・ブラウザ・ウェブサイトからオンラインで入手可能)、PCR産物を生成した増幅反応におけるプライマーのアニーリング温度(予測温度と、その後実験的に最適化した値)、これらのプライマーを用いることによって生成された増幅産物の長さを示す。一般に、最適アニール温度は、予測アニール温度の前後5℃以内に見いだされた。PCRの反応条件を最適化した後は、表に示した全産物が、電気泳動で単一の均一に染色されるバンドを生成するか、DHPLC−Wave装置(Transgenomic、オマハ)で、特定の時点で、単一の吸収の急峻なピークを示した。これらの産物の部分集合を標識し、ヒトの中期染色体で位置を決定した。結果を表3に示す。表3に示すプローブは、表1のプローブで、他の領域にクロス・ハイブリダイズしなかったもの、そして、2002年9月以降に染色体にハイブリダイズしたプローブである。より最近になってマッピングしたプローブは、2003年4月版のゲノム配列を使用して作製し、多くの場合、これのプローブは、染色体末端にさらに近接している。表3では、単一コピーのプローブの正確なサイズを示し、プローブの染色体末端からの距離を、市販の合成プローブの染色体末端からの距離と比較してある。
【0077】
分子細胞遺伝学的解析では検出されるものの、2001年4月のゲノム配列やその後のバージョンの配列を解析しても検出されないゲノム・パラログがいくつか存在することが観察され、こうしたパラロガスな配列を含む領域では、ゲノム配列は未完成であることが示唆された。複雑でパラロガスなドメインが存在すると、そうした領域は不正確に組み立てられることも示されており、その結果、パラロガスで非同座性のコピーが、少ない方のゲノム座位にマージされることがある。したがって、この方法にしたがって設計したプローブは、患者での不均衡な再構成の検出に使用する前に、正常な対照に対してハイブリダイズさせることによって検証しておく必要がある。このアプローチは、将来のヒトゲノム配列のバージョンに含まれる可能性のある誤って組み立てられた領域を特定する際に有用である可能性がある。配列が未決定または配列が誤って決定されたゲノム領域に対するクロス・ハイブリダイゼーションには先例がある(以前の一部継続出願である米国特許出願第09/854,867号を参照のこと、この特許出願については、ここで言及することをもって、その教示内容および内容を、本発明に組み込むものである)。本発明者らは、以前に、近接して位置する高度に類似した(>95%)パラロガスな配列が位置決定されている2領域からプローブを作製した。こうした領域としては、染色体21qのダウン症領域およびM4型急性骨髄性白血病と関係する染色体16pの逆位領域を挙げることができる。双方のプローブとも、それぞれの染色体のパラログとハイブリダイズしたものの、末端動原体の短腕ともハイブリダイズした。こうした場合、高度反復性のDNAとともに予備的にアニーリングすることによって、クロス・ハイブリダイゼーションを抑制した。
【0078】
他の染色体上のパラロガスな配列、または同じ染色体上の離れた座位(>1Mb)にハイブリダイズするプローブの場合、プローブが設計上検出対象としているテロメアの異常を検出するためのアッセイの特異性が犠牲となる。こうした場合、プローブ中の、他の染色体の座位に対してパラロガスな配列は取り除いた。こうした配列を取り除くにあたっての好適なアプローチとしては、(1)隣接した染色体インターバルから別のプローブを選択、作製する、または(2)プローブを設計しなおして、他の染色体の座位に対してパラロガスなサブ配列を除外するものが上げられる。サイズが単一コピーFISHに適した単一コピーのインターバルは、ゲノム中に密に配列しているので、通常、新規なプローブを、隣接したゲノムインターバルから作製する方が好都合であった。このアプローチの方が、プローブを二分してパラロガスな側を除外するより、時間を要せず、労働集約性も低くてすむ。しかし、プローブの二分法は、場合によっては、特に、特定の(小型の)遺伝子から誘導したプローブが必要とされている場合には、唯一の代替法である。表1および2で印をつけて示した項目は、当初、他の染色体に対するパラロジーが観察されていたテロメア用の別の単一コピーのハイブリダイゼーション・プローブの例である。
【0079】
考察
本発明者らは、染色体の再構成を、ヒトのサブテロメア領域で生じる再構成のほとんどに関して検出しうる単一コピーのプローブを製造する方法を開発、試験、検証し、42の真性染色質の末端領域に用いることのできる染色体腕特異的なプローブを作製し、56種のプローブが、これらの染色体末端に明らかに対応するか、あるいは、一般的に使用されているクローニングしたプローブが占めている可能性のある位置の範囲内に対応するものの、クローニングしたプローブの正確な位置を決定しえた場合には、それよりもっと末端に近い位置に対応している可能性もあることを例証した。したがって、これらの単一コピーのプローブは、現存のプローブより、さらに小型で末端に近いサブテロメア配列関連の染色体不均衡を検出しうるものである。本発明者らは、こうしたタイプの異数性の結果として生じている特発性精神遅滞や他の臨床的な異常を検出するにあたって、これらのプローブは、より感度が高いものと推測している。染色体でのプローブの位置は、図2〜13に明確に示してあり、図2〜13の集合図である図1は、図2〜13の生の写真を使用して作製したものである。図14に、図1に図示しなかった19qtelの位置を示す。
【0080】
このように、本発明は、これまで利用可能であったプローブよりサイズが小さく、大抵の場合にはテロメアにも近い、サブテロメアDNAプローブを決定、作製するための方法を提供するものである。こうした小型のプローブは、大型のプローブではサイズが大きすぎて検出できないような、小型の変異、欠失、再構成を検出できる。また、変異、欠失、再構成の一部は、実際、大型プローブの配列内で生じており、こうした配列は、この大型のプローブを用いたのでは検出できなかったのに対し、本発明の方法およびプローブを使用すると検出が可能となる。本発明のプローブは、従来可能であったのより染色体末端に近い染色体の再構成を検出できる。これは、本発明のプローブが、各染色体腕の末端から出発して、内側に向かって、1以上のユニーク配列を探す作業を行い、そうして見いだしたユニーク配列を、対応するプローブの作製に使用するかたちで作製したものだからである。クロス・ハイブリダイゼーションを生じる配列は、好ましくは計算によって排除し、すなわち、特定した配列については、作製したプローブがクロス・ハイブリダイゼーションを生じるかどうかを実験的に決定するのではなく、クロスハイブリダイゼーションがほとんど、またはまったく生じないよう、既知の配列との比較を行う。本発明のサブテロメア・プローブの具体例は、本明細書で配列番号83〜244として特定するプライマーを使用することによって作製したものである。
【0081】
実施例2
この実施例は、18qtel(2530bp)用のプローブの設計、合成、検証、ハイブリダイゼーションについて記載する。
【0082】
材料および方法
2001年4月1日に公表されたヒトゲノム配列を使用して、染色体18の長腕上のサブテロメアのインターバルから作製したプローブを、2001年7月30日に作製した。この染色体の配列をダウンロードし、自動的に有望な単一コピーのインターバルを特定し、ポリメラーゼ連鎖反応用のプライマー配列を選択するよう作製したカスタム・ソフトウェアで解析した。もちろん、本発明の方法で使用することができる有望な単一コピーの配列を特定しうる方法であれば、任意の方法を使用することができる。Unixのscriptである「integrated_single copy FISH」がこの過程を処理する。ユーザーは、プローブの設計に使用するヒトゲノム配列の特定バージョン、染色体領域の座標、単一コピーのインターバルの最低長さを提供する必要がある。このインターバルの最低長さは、蛍光顕微鏡法でFISHプローブを可視化しやすいように、1500ヌクレオチドを選択した。しかし、このソフトウェアは、任意所望のサイズの単一コピーのインターバルを特定可能である。「末端の349,999bpを含むインターバル」と入力すると、このスクリプトが、カリフォルニア大学サンタクルーズ校のウェブサイトのゲノム・ブラウザーから、この配列を回収してきた。次に、パールのプログラムである「findirepeatmask.pl」が、「RepeatMasker」のプログラム(Smit AおよびGreen P,ワシントン大学)の出力から、すべての>1500bpのインターバルの座標を計算した。Delilaのプログラムである「xyplo」が、ncifcrfのウェブサイトで、単一コピーのインターバルの位置を示す分散プロットを示した。次に、スクリプトが、一連の配列解析プログラム(Wisconsinパッケージ、accelrys.com製)を呼び出し、まず、各単一コピーのサブインターバルの配列を、より大型の配列から抽出し、その後、各サブインターバルのロングPCRに最適化したオリゴヌクレオチド・プライマー配列選択した。染色体18の83,779,017〜83,879,017のサブインターバルを、プライマー設計用に選択した。プライマーの選択は、(Roganら、Genome Research,11:1086−1094,2001、この文献については、ここに言及することをもって、その内容および教示内容を本明細書に明確に組み込むものである)、パールのスクリプト(Wisconsinのプログラムのプライムを実施するprimwrapper.pl)を用いて、プライマーのアニール温度、生成物のG/C組成、およびインターバルの長さを、最も厳しい条件から出発して、動的に減衰させながら実施した。350kbのゲノム領域中のプローブ候補のセットを設計するのに、300MHzのユニックスのワークステーションで約1時間を要した。この染色体18のインターバルについては、ソフトウェアによって、このロングPCRの反応用に、25のインターバルの候補が提供された。本発明者らは、「完成版」の2003年4月のゲノム標準配列で、上記配列の末端から80,057〜82,584bpに存在するプロダクト22を選択した。2001年4月の配列では、この染色体18の配列は完成しておらず、このプローブの配列は、入手可能であった配列の末端から43227〜45756bpに位置していた。「RepeatMasker」のソフトウェアが、ヒトゲノムでは一般的な反復配列ファミリーの配列をスクリーニングするものの、このソフトウェアは、反復配列の規準に技術的に合致しないような、ゲノム中の複雑でパラロガスな、あるいは低コピー数のセグメント重複領域は検出しない。したがって、この配列の単一コピー組成物は、UCSCのゲノム・ブラウザーのウェブサイトで、BLATのツールを使用することにより、計算によって検証した。このツールは、ゲノム中の他の配列が、問い合わせた配列と関連しているかどうか、そして、もしそうであれば、それらの配列の長さや、問い合わせた配列との類似率はどの程度なのかについて、迅速に判定する。複数のインターバルについてのこのBLATの手続きを同時に自動化するスクリプトを開発した。長さが500bp以下または<1000bpで、ダイバージェンスが30%を超える関連配列は、染色体配列の検出に使用する厳密さのハイブリダイゼーションおよび洗浄条件では、プローブとクロス・ハイブリダイズする可能性が低いものであり、こうした閾値を超える配列は、一般に、潜在的プローブとはしなかった。しかし、18qtel領域については、こうした関連配列は、計算上では検出されなかった。
【0083】
この生成物を増幅するPCRプライマーは、30マーの正方向ストランドと32マーの逆方向ストランド(配列番号193および194)から構成されるものとした。これらのDNAプライマーは、IDT社(アイオワ州コーラルヴィル)で合成し、500μlの二回蒸留水に再懸濁し、その後、1μMの作業用ストックの濃度まで希釈した。まず、プライマーが、期待されるサイズ、すなわち2530bpの増幅産物を生成しうるかどうかについて、各プライマーのゲノムでの座標にもとづいて調べた。テストPCR反応試薬は、全体で25μlとし、順方向および逆方向プライマー(それぞれ0.9μM)、30ngのヒトゲノムの高分子量DNA(4℃で保管、Promega、ワイオミング州マディソン)、1.5mMのMgSO、0.625単位の白金Pfxポリメラーゼ、10×の反応バッファー、1.25mMのdNTPs、および1×のPCR増強剤溶液(成分および条件については、製造業者であるカリフォルニア州カールスバッドのInvitrogenに照会のこと)から構成されるものとした。最初の増幅は、プライマー設計プログラムによって予測される融点である60℃で実施した。アガロースゲル電気泳動によって、予測通りのサイズの増幅産物が生じていることが明らかとなったものの、均一な生成物を得るためには、さらなる反応の最適化が必要であった。Biomek 2000(実験室自動化用ワークステーション)を使用して、この18qtelと、他のサブテロメア領域の他の産物についての並行な反応を同時にセットアップした。温度の最適化に際しては、これらの並行な反応は、それぞれ、PCRによって、異なったアニール温度、すなわち、53.2、55.5、58.4、61.8、64.6、および66.8℃で、勾配サーマルサイクラー(MJ Research Alpha)で、最適化のための反応ではプライマーを0.3μMとなるように加えた以外は上述したのと同じ反応条件で増幅を行った。熱サイクル条件は、ゲノムのテンプレートの最初の変性を94℃で2分間行い、その後、上記のアニーリングおよび伸張の工程を上記のアニーリングおよび伸張温度で5分間、15サイクル行い、さらに変性を20分間行うものとした。その後、さらに、同じ温度で、アニーリングおよび伸張の工程を1サイクルごとに5分間延長して、15サイクル行った。プライマーの伸長後、最終精製の工程を68℃で10分間行い、反応系を冷却して、0℃に保った。生成物をアガロースゲル電気泳動で分離し、最も純度が高い産物を生じた最大収率について判定した。このプローブの産物については、最適温度が64℃であることが示された。反応規模を上げて、最終容積が200μl(すなわち約2μg)となるようにして、標識および数回の蛍光in situハイブリダイゼーションによるアッセイに十分な量のPCR産物を生成した。この生成物を、調製用のアガロースゲルで分離し、バンドを切り出し、Montage抽出用スピンカラム(Millipore、マサチューセッツ州ウォータータウン)を使用して精製した。カラムからの溶出液をエタノールで沈殿させ、短時間乾燥させ、濃度100ng/μlとなるように二回蒸留水に再懸濁させたところ、約1μgの生成物が回収された。この溶液を、Roganら(2001)に記載された手順にしたがって、ジコキシゲニン修飾するかビオチニル化したdUTPにより、ニックトランスレーションで標識した。この過程で、健常者および患者の標品から得られた中期および間期の染色体を含む5スライドの変性およびハイブリダイゼーションを行うのに十分な量のプローブが得られた。
【0084】
結果
プローブについて実験的に検証したところ、正常な核型を有する健常者由来の細胞の他の染色体領域には、一切ハイブリダイズしないことが示され、この結果は、この配列がゲノム中に単一コピーで存在するという計算上の予測結果と一致していた。このプローブは、計算と実験の双方の検証に合格したので、このプローブが染色体18qの末端に近接していることに基づいて、このプローブを、この染色体の末端再構成のキャリアと思われる患者を解析するにあたって選択した。図18は、このプローブが、6と18の相互転座を生じた患者の染色体6のp腕の末端バンドに対するこの配列の転座を検出する例を示す。この図では、18qサブテロメア・プローブ(長さ2530bp)を、異常中期細胞にハイブリダイズさせた。この細胞は、染色体6の短腕と染色18の末端染色体バンドとの間に転座を生じている。転座部位の位置を、G分染済みの正常染色体6とG分染済みの正常染色体18上の矢印で示す。転座を生じた、すなわち誘導体化(der)してG分染済み染色体6および18も示す。18qプローブの位置を赤で示す。染色体18qプローブ(赤で検出)は、左側のパネルに示すように、正常染色体18および誘導体染色体6にハイブリダイズした。誘導体染色体18は、サブテロメア領域が染色体6pの遺伝物質と交換しているので、ハイブリダイズしない。
【図面の簡単な説明】
【0085】
この特許または出願のファイルには、カラー写真の形態の図面が1枚以上含まれている。この特許または特許出願の公報のカラー図面を含む複写物は、特許庁に要請があり、必要な費用が支払われた場合には提供される。
【0086】
【図1】図1は、各種のプローブが、各種の染色体の特定の染色体位置にハイブリダイズしている様子示す12枚組の写真である。これらの画像を、図2〜13に拡大して示す。
【図2】図2は、染色体5qとハイブリダイズした2.6kbのプローブの写真である。
【図3】図3は、染色体7qとハイブリダイズした2.5kbのプローブの写真である。
【図4】図4は、染色体9qとハイブリダイズした2.2および2.4kbのプローブの写真である。
【図5】図5は、染色体13qとハイブリダイズした3.2kbのプローブの写真である。
【図6】図6は、染色体14qとハイブリダイズした3.8および1.8kbのプローブの写真である。
【図7】図7は、染色体17pとハイブリダイズした2.6kbのプローブの写真である。
【図8】図8は、染色体18qとハイブリダイズした2.5kbのプローブの写真である。
【図9】図9は、染色体19qとハイブリダイズした2.0kbのプローブの写真である。
【図10】図10は、染色体20pとハイブリダイズした2.6kbのプローブの写真である。
【図11】図11は、染色体20qとハイブリダイズした2.1、3.0、および3.7kbのプローブの写真である。
【図12】図12は、染色体22qとハイブリダイズした3.5kbのプローブの写真である。
【図13】図13は、染色体Xqととハイブリダイズした2.5kbのプローブの写真である。
【図14】図14は、染色体19qとハイブリダイズした2.3kbのプローブの写真である。
【図15】図15は、特異的な染色体腕に位置した各種プローブを示す一連の写真である。
【図16】図16は、染色体末端の構造の模式図であり、単一コピーのプローブの位置をテロメアに対して示すものである。
【図17】図17は、13q腕中の各種遺伝子の位置、ならびに従来技術のプローブおよび本発明の単一コピーのプローブに対する各種遺伝子の関係を示す模式図である。
【図18】図18は、異常または誘導化した染色体6および正常な染色体18を含む中期の伸展物とハイブリダイズさせた、単一コピーの染色体18qのプローブ(長さ2530bp)の写真である。
【図19】図19は、正常な中期の細胞とハイブリダイズさせた、染色体14q(1984bp)および3p(2093bp)に対する単一コピーのサブテロメア・プローブ2本の写真である。















【特許請求の範囲】
【請求項1】
染色体の再構成を検出する際に有用なサブテロメア・プローブであって、
長さ25kb未満の単一コピーのDNA配列を含み、この配列が、単一の染色体の腕の末端GバンドまたはRバンドにハイブリダイズしうるものである
サブテロメア・プローブ。
【請求項2】
上記末端バンドが、Gバンド分染後に明色である請求項1記載のプローブ。
【請求項3】
上記末端バンドが、Rバンド分染後に暗色である請求項1記載のプローブ。
【請求項4】
上記の単一染色体の腕が、1p、1q、2p、2q、3p、3q、4p、4q、5p、5q、6p、6q、7p、7q、8p、8q、9p、9q、10p、10q、11p、11q、12p、12q、13q、14q、15q、16p、16q、17p、17q、18p、18q、19p、19q、20p、20q、21q、22q、Xp、Xq、およびYpよりなる群から選ばれるものである請求項1記載のプローブ。
【請求項5】
上記プローブが、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251よりなる群から選ばれるものである請求項1記載のプローブ。
【請求項6】
上記プローブの長さが10kb未満である請求項1記載のプローブ。
【請求項7】
上記プローブが、上記染色体のテロメアから8000kb以内に位置している請求項1記載のプローブ。
【請求項8】
上記プローブが、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251よりなる群から選ばれるものである請求項7記載のプローブ。
【請求項9】
上記プローブが、上記染色体のテロメアから300kb以内に位置している請求項1記載のプローブ。
【請求項10】
上記プローブが、配列番号36、80、46、47、49、51、56、248、57、78、59、75、76、74、63、250、251、66、65、67、4、3、1、9、6、11、10、17、20、19、18、21、81、26、29、28、31、32、43、42、41、40、44、45、および70よりなる群から選ばれるものである請求項9記載のプローブ。
【請求項11】
上記プローブが、標識されているか、または表面に結合するよう修飾されている請求項1記載のプローブ。
【請求項12】
染色体のサブテロメア領域から単一コピーのDNA配列のプローブを作製する方法であって、上記プローブが、ゲノムの単一の位置にハイブリダイズすることができ、この方法が、
上記染色体のDNA配列で、その末端ヌクレオチドから、長さが少なくとも500塩基対で、上記末端ヌクレオチドに最も近い単一コピーのインターバルをヌクレオチドごとに検索し、
上記の単一コピーのインターバルを特定し、
上記の単一コピーのインターバルを合成し、そして
上記の単一コピーのインターバルを上記プローブとして使用する
過程を含むものである方法。
【請求項13】
上記特定過程が、特定された単一コピーのインターバルが、ゲノムの単一の位置で表示されるか、パラロガスな配列が密接に関連していて単一の信号のみが検出されるものであることを、計算または実験によって検証する作業を含むものである請求項12記載の方法。
【請求項14】
上記特定過程が、計算および実験によって検証を行う作業を含むものである請求項13記載の方法。
【請求項15】
上記の計算による検証が、ソフトウェアを使用して、プローブ配列が、ゲノム中の単一の位置に位置していることを判定するものである請求項13記載の方法。
【請求項16】
上記の方法が、上記の合成された単一コピーの配列を標識する過程をさらに含むものである請求項12記載の方法。
【請求項17】
上記の実験による検証が、上記の単一コピーのプローブを、上記染色体と再度ハイブリダイズさせて、上記のプローブを、上記染色体の末端バンドかつ正しい腕で可視化させる過程を含むものである請求項13記載の方法。
【請求項18】
上記の単一コピーのインターバルが、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251からなる群より選ばれるものである請求項12記載の方法。
【請求項19】
上記方法が、上記の単一コピーのプローブを、高度反復性のDNAと予備的にアニーリングする過程をさらに含むものである請求項12記載の方法。
【請求項20】
染色体の再構成を特定するための合成された単一コピーのポリヌクレオチドであって、上記ポリヌクレオチドが、染色体の末端ヌクレオチドから8,000kb以内に位置しており、染色体の再構成が生じていない場合には、特定の染色体の単一の位置にハイブリダイズするものであり、上記ポリヌクレオチドの長さが25kb未満であるポリヌクレオチド。
【請求項21】
上記ポリヌクレオチドが、上記の特異的な染色体の末端GバンドまたはRバンドに位置している請求項20記載のポリヌクレオチド。
【請求項22】
上記ポリヌクレオチドが、配列番号1〜3、5〜23、26〜36、38〜57、59〜61、63〜67、69〜82、および245〜251よりなる群から選ばれるものである請求項20記載のポリヌクレオチド。
【請求項23】
上記ポリヌクレオチドが、上記の特異的な染色体の末端ヌクレオチドから約300kb以内に位置している請求項20記載のポリヌクレオチド。
【請求項24】
上記ポリヌクレオチドが、配列番号36、80、46、47、49、51、56、248、57、78、59、75、76、74、63、250、251、66、65、67、4、3、1、9、6、11、10、17、20、19、18、21、81、26、29、28、31、32、43、42、41、40、44、45、および70よりなる群から選ばれるものである請求項23記載のポリヌクレオチド。
【請求項25】
上記ポリヌクレオチドが、標識されているか、表面に結合するよう化学的に修飾されている請求項20記載のポリヌクレオチド。
【請求項26】
染色体の再構成を検出しうる単一コピーのプローブを誘導するためのオリゴヌクレオチド・プライマー・ペアであって、配列番号83〜244よりなる群から選ばれる配列を含んでいるプライマー。
【請求項27】
染色体の再構成を検出する際に機能しうる優れた合成DNAプローブであって、単一の染色体腕上の正確な位置にハイブリダイズするよう機能しうるDNA配列を含んでおり、プローブの長さが25kb未満である点が改善されているプローブ。
【請求項28】
上記部分が、プローブ全体を含むものである請求項27記載の改善されたプローブ。
【請求項29】
上記プローブの少なくとも一部が、コスミド、フォスミド、バクテリオファージ、P1、およびハーフYAC由来のPACクローンよりなる群から選ばれたクローンより、染色体腕上でテロメアの末端に近い位置に位置しており、上記染色体腕が、2p、3p、5p、7p、8p、10p、11p、12p、16p、17p、18p、Xp、Yp、1q、3q、4q、6q、7q、8q、9q、10q、11q、12q、13q、14q、15q、16q、17q、18q、19q、20q、21q、および22qよりなる群から選ばれたものである請求項27記載の改善されたプローブ。
【請求項30】
上記プローブが、上記染色体のテロメアの末端ヌクレオチドから8,000kb以内に位置している請求項27記載の改善されたプローブ。
【請求項31】
上記プローブが、上記染色体のテロメアの末端ヌクレオチドから300kb以内に位置している請求項27記載の改善されたプローブ。
【請求項32】
上記プローブが、上記染色体の末端GバンドまたはRバンドに位置している請求項27記載の改善されたプローブ。
【請求項33】
上記プローブが、配列番号46、47、49、56、78、59、64、249、2、4、3、5、9、11、20、19、21、81、246、70、72、73、36、80、247、50、57、75、76、74、63、250、66、65、67、1、6、10、12、16、15、13、14、17、18、81、245、26、31、32、43、42、41、40、44、および45よりなる群から選ばれるものである請求項27記載の改善されたプローブ。
【請求項34】
個人の細胞遺伝学的異常をスクリーニングする方法であって、この個人が、特発性精神遅滞または精神遅滞および1異常の他の臨床上の異常または癌を有しており、上記方法が、
上記個人のゲノムを、複数のハイブリダイゼーション・プローブを使用することによってスクリーニングし、ここで、各プローブは、長さが約25kb未満であり、
上記プローブのハイブリダイゼーション・パターンを検出し、ここで、このハイブリダイゼーション・パターンは、上記ゲノム内の細胞遺伝学異常を示唆するものである
過程を含むものである方法。
【請求項35】
上記方法が、上記のハイブリダイゼーション・パターンを、特定の臨床上の異常と関連づける過程をさらに含むものである請求項34記載の方法。
【請求項36】
上記プローブが、ゲノム上の単一の位置、またはパラロガスな配列が密接に関連していて、単一のハイブリダイゼーション信号のみが検出されるような位置に表示される請求項34記載の方法。
【請求項37】
染色体の不均衡の程度を描写する方法であって、
長さ約25kb未満の少なくとも1種のハイブリダイゼーション・プローブを使用して染色体腕を調べ、
上記プローブの上記アームに対するハイブリダイゼーション・パターンを検出し、
上記ハイブリダイゼーション・パターンを、上記腕の標準ゲノム・マップと比較して、染色体の不均衡の程度を描写する
過程を含む方法。
【請求項38】
上記方法が、上記腕の不均衡を、特発性精神遅滞または癌よりなる群から選ばれる医学的状態と相関させる
過程をさらに含む請求項37記載の方法。
【請求項39】
上記方法が、複数のプローブを使用するものである請求項37記載の方法。
【請求項40】
上記プローブが、特異的な染色体腕にハイブリダイズするものである請求項37記載の方法。

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公表番号】特表2006−508691(P2006−508691A)
【公表日】平成18年3月16日(2006.3.16)
【国際特許分類】
【出願番号】特願2005−502005(P2005−502005)
【出願日】平成15年9月30日(2003.9.30)
【国際出願番号】PCT/US2003/031170
【国際公開番号】WO2004/029283
【国際公開日】平成16年4月8日(2004.4.8)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
UNIX
【出願人】(502416567)ザ チルドレンズ マーシー ホスピタル (5)
【Fターム(参考)】