説明

ゲノム配列決定を使用する胎児染色体異数性の診断

本発明の実施形態は、胎児染色体異数性が、妊娠女性から得られる生体試料に存在するか否かを決定するための方法、システム、および装置を提供する。生体試料の核酸分子は配列決定され、その結果ゲノム断片が配列決定される。臨床的に重要な染色体およびバックグラウンド染色体の各々の量は、当該配列決定の結果から決定される。これらの量にから算出されるパラメータ(例えば、比率)は、一つ以上のカットオフ値と比較され、それにより胎児染色体異数性が存在するか否かの分類を決定する。

【発明の詳細な説明】
【技術分野】
【0001】
優先権の主張
本出願は、「核酸配列の不均衡の決定」と題された、2007年7月23日に出願された米国仮出願第60/951438号(代理人整理番号016285−005200US)からの優先権を主張し、そして当該仮出願の正規の出願であり、当該仮出願の全ての内容は、全ての目的のために参照により本明細書に援用される。
【0002】
関連出願の相互参照
本出願はまた、「核酸配列の不均衡の決定」と題された、同時に出願された正規の出願(代理人整理番号016285−005210US)に関し、そしてその全ての内容は全ての目的のために参照により本明細書に援用される。
【0003】
発明の技術分野
本発明は、異なる核酸配列間における不均衡を決定することによる、胎児染色体異数性の診断試験に一般的に関し、そしてより詳細には、トリソミー21(ダウン症候群)および他の染色体異数性を、母体試料(例えば血液)を試験することにより同定することに関する。
【背景技術】
【0004】
背景
胎児染色体異数性は、正常ではない量(単数または複数)の染色体または染色体領域の存在から生じる。正常ではない量(単数または複数)は、異常に多いものであり得、例えば過剰な21番染色体の存在、またはトリソミー21における染色体領域の存在があり;あるいは異常に少ないものであり得、例えばターナー症候群におけるX染色体のコピーの欠損がある。
【0005】
胎児染色体異数性、例えばトリソミー21の、出産前における従来の診断方法は、侵襲性の手順、例えば羊水穿刺または絨毛膜検体採取による、胎児試料の採取を伴うものであり、そしてそれは胎児が死亡する危険性がある。非侵襲性の手順、例えば超音波検査法および生化学マーカーによるスクリーニングは、最終的な侵襲性診断手順に先立ってリスク層の妊婦に使用された。しかし、これらのスクリーニング法は通常、例えば核となる染色体の異常性の代わりに、染色体異数性、例えばトリソミー21と関わりのある付帯現象を測定し、したがって準最適な診断精度を有し、そして他の不利な点、例えば妊娠年齢によって大きな影響を受ける。
【0006】
1997年における、母体血漿中における循環性無細胞胎児DNAの発見は、非侵襲性診断のための新しい可能性を提供した(Lo,YMD and Chiu,RWK 2007 Nat Rev Genet 8,71−77)。この方法は、伴性遺伝子疾患(Costa,JM et al.2002 N Engl J Med 346,1502)および特定の単一遺伝子疾患(Lo,YMD et al.1998 N Engl J Med 339,1734−1738)の出生前診断に対して速やかに適用されたが、胎児染色体異数性の出産前における検出へのその適用は、かなりの課題を示した(Lo, YMD and Chiu, RWK 2007,上記参照)。第一に、胎児の核酸は通常、胎児の核酸の分析を阻害し得る、母体由来核酸の高いバックグラウンドと共に、母体の血漿中において存在する(Lo,YMD et al.1998 Am J Hum Genet 62,768−775)。第二に、胎児の核酸は母体の血漿中において主に無細胞形態で循環しており、そしてそのことは、胎児ゲノム中の遺伝子量または染色体量の情報を得ることを困難としている。
【0007】
これらの課題を克服する著しい発展が近年なされた(Benachi,A & Costa,JM 2007 Lancet 369,440−442)。一つの方法は、母体の血漿中における胎児特異的な核酸を検出し、その結果、母体のバックグラウンド障害の問題を克服することである(Lo, YMD and Chiu,RWK 2007,上記参照)。第21番染色体の量は、胎盤由来のDNA/RNA分子中における多型対立遺伝子の比から推定された。しかしこの方法は、試料がより少ない量の標的核酸を含有する場合においてあまり正確ではなく、そして標的とされた多型に関してヘテロ接合性である胎児にのみ適用され得、一つの多型が使用されるのであれば、それは人口群の一部に過ぎない。
【0008】
Dhallan et al(Dhallan,R,et al.2007,上記参照、Dhallan,R,et al.2007 Lancet 369,474−481)は、母体血漿へホルムアルデヒドを加えることにより、循環性胎児DNAの比率を増やす代替的な方法について記載している。母体血漿中における胎児の第21番染色体配列の比率は、第21番染色体上の一塩基多型(SNPs)に関して、父系遺伝性の胎児特異的対立遺伝子と胎児特異的ではない対立遺伝子との比を評価することによって決定された。SNP比は、基準染色体に関して同様に計算された。胎児の第21番染色体の不均衡はその後、第21番染色体のSNP比と基準染色体のSNP比との間の統計的な有意差を検出することによって推測され、ここで有意性は、0.05以下の固定されたp値を使用して定義される。高い個体群範囲を確保するために、一つの染色体あたり500個超のSNPが標的とされた。しかし、胎児DNAを高い比率に増大させるためのホルムアルデヒドの有効性について議論があり(Chung,GTY,et al.2005 Clin Chem 51,655−658)、したがって当該方法の再現性はさらに評価される必要がある。同様に、胎児および母体の各々が、各々の染色体について異なる数のSNPsに関する情報を提供するため、SNP比の比較に関する統計的検出力は、事例ごとに変化するだろう(Lo,YMD&Chiu,RWK.2007 Lancet 369,1997)。さらにこれらの方法は遺伝子多型の検出に依存するため、それらはこれらの多型に関してヘテロ接合性である胎児に限定される。
【0009】
トリソミー21および正倍数体の胎児から得られる羊膜細胞培養中の、第21番染色体遺伝子座および基準遺伝子座のポリメラーゼ連鎖反応(PCR)およびDNA定量化を使用することにより、Zimmermann他(2002 Clin Chem 48,362−363)は、前者の第21番染色体DNA配列における1.5倍の増加に基づいて、胎児の当該2つの群を区別することができた。DNA鋳型濃度における2倍の違いは、一つの閾値サイクル(Ct)の違いのみを構成するため、1.5倍の違いの区別は、従来のリアルタイムPCRの限界であった。より精密な程度の定量的識別を達成するために、代替的な方法が必要とされる。
【0010】
デジタルPCRは、核酸試料において歪んでいる対立遺伝子比率の検出のために開発された(Chang,HW et al.2002 J Natl Cancer Inst 94,1697−1703)。デジタルPCRは、核酸含有検体を、一試料あたり平均して約1個以下の標的配列を含有する多くの個別試料へ分配することを必要とする増幅型核酸分析技術である。特定の核酸標的は、デジタルPCRによって、配列特異的プライマー種または群を用いて増幅されて特定の単位複製配列を生じる。標的とされる核酸遺伝子座、および反応中に含まれるべき配列特異的プライマー種または群が、核酸分析に先立って決定され、または選択される。
【0011】
臨床的に、それは腫瘍DNA試料中におけるヘテロ接合性の欠如(LOH)の検出において有用であることが示された(Zhou,W.et al.2002 Lancet 359,219−225)。実験結果が試料中におけるLOHの存在を示唆するものであるか否かを分類するため、先の試験においてデジタルPCRの結果分析のために逐次確率比検定(SPRT)が採用された(El Karoui at al.2006 Stat Med 25,3124−3133)。
【0012】
先の試験において使用された方法において、デジタルPCRから回収されるデータの量は非常に少ない。したがって精度は、少量のデータ点および典型的な統計変動によって妥協され得る。
【0013】
したがって非侵襲性試験が、偽陰性および偽陽性の各々を最小化する高い感受性および特異性を有することが所望である。しかし、胎児DNAは低い絶対濃度で存在し、そして母体血漿および血清中における全DNA配列のうち少量の部分を示す。したがって、母体のバックグラウンド核酸を含有する生体試料中において少量の群として存在する、制限された胎児核酸量から推測され得る遺伝情報量を最大化することによって、胎児染色体異数性の非侵襲的検出を行うことができる方法を有することも所望である。
【発明の概要】
【課題を解決するための手段】
【0014】
概要
本発明の実施形態は、核酸配列の不均衡(例えば染色体の不均衡)が妊娠女性から得られる生体試料中において存在するか否かを決定するための方法、系、および装置を提供する。この決定は、生体試料中における他の臨床的に重要ではない染色体領域(バックグラウンド領域)との関連で、臨床的に重要な染色体領域の量のパラメータを使用することによってなされ得る。一つの形態において、染色体の量は、母体試料、例えば尿、血漿、血清、および他の好適な生体試料中における核酸分子の配列決定から決定される。生体試料中の核酸分子は配列決定され、その結果、ゲノム断片が配列決定される。一つ以上のカットオフ値が、例えば2つの染色体領域(または領域の組)の量の比に関して、基準量と比較した変化(すなわち、不均衡)が存在するか否かを決定するために選択される。
【0015】
一つの例示的実施形態に従って、妊娠女性から得られた生体試料は、胎児染色体異数性の出生前診断を行うために分析される。生体試料は核酸分子を含む。生体試料中に含まれる核酸分子の一部分が配列決定される。一つの形態において、得られる遺伝情報の量は、必要とされる投入生体試料の費用および量を含めて全体的に過剰ではない、正確な診断のために十分である。
【0016】
配列決定に基づいて、第一の染色体の第一の量が、当該第一の染色体由来として同定された配列から決定される。一つ以上の第二の染色体の第二の量が、当該第二の染色体の一つ由来として同定された配列から決定される。当該第一の量および当該第二の量からのパラメータはその後、一つ以上のカットオフ値と比較される。当該比較に基づいて、胎児染色体異数性が第一の染色体に存在するか否かの分類が決定される。当該配列決定は、母体バックグラウンド核酸を含有する生体試料中において、少数の群として存在する胎児核酸の限定された量から推測され得る遺伝情報量を有意に最大化する。
【0017】
一つの例示的実施形態に従って、妊娠女性から得られる生体試料は、胎児染色体異数性の出生前診断を行うために分析される。生体試料は核酸分子を含む。生体試料中の胎児DNAのパーセンテージが同定される。所望の精度に基づいて分析されるべき配列のN数は、当該パーセンテージに基づいて計算される。当該生体試料中に含まれる核酸分子の少なくともN個は、ランダムに配列決定される。
【0018】
当該ランダム配列決定に基づいて、第一の染色体の第一の量は、当該第一の染色体由来として同定された配列から決定される。一つ以上の第二の染色体の第二の量は、当該第二の染色体の一つ由来として同定された配列から決定される。当該第一の量および当該第二の量からのパラメータはその後、一つ以上のカットオフ値と比較される。当該比較に基づいて、胎児染色体異数性が当該第一の染色体に存在するか否かの分類が決定される。当該ランダム配列決定は、母親由来のバックグラウンドの核酸を含有する生体試料中において、少数の群として存在する、胎児核酸の限定された量から推測され得る遺伝情報量を有意に最大化する。
【0019】
本発明の他の実施形態は、本明細書に記載された方法と関連するシステムおよびコンピュータで読み取り可能な媒体に関する。
【0020】
本発明の性質および利点のさらなる理解は、以下の詳細な説明および添付の図面を参照にして得られる。
【図面の簡単な説明】
【0021】
【図1】図1は、本発明の実施形態に従って、妊娠女性対象から得られる生体試料中における胎児染色体異数性の出生前診断を行うための、メソッド100のフローチャートである。
【図2】図2は、本発明の実施形態に従って、ランダム配列決定を使用する胎児染色体異数性の出生前診断を行うための、メソッド200のフローチャートである。
【図3A】図3Aは、本発明の実施形態に従って、トリソミー21または正倍数体の胎児に関連する、母体の血漿試料中における第21番染色体配列のパーセンテージ表示のプロットを示す。
【図3B】図3Bは、大量並行配列決定(parallel sequencing)によって決定された母体血漿中の部分的胎児DNA濃度と、本発明の実施形態のマイクロフルイディクスデジタルPCRとの間の相関関係を示す。
【図4A】図4Aは、本発明の実施形態に従って、一つの染色体あたりの、整列された配列のパーセンテージ表示のプロットを示す。
【図4B】図4Bは、図4Aにおいて示されたトリソミー21の場合と正倍数体の場合との間における、一つの染色体あたりのパーセンテージ表示における差(%)のプロットを示す。
【図5】図5は、本発明の実施形態に従って、トリソミー21胎児に関連する母体血漿中における第21番染色体配列の過剰表示の程度と部分的胎児DNA濃度との間の相関関係を示す。
【図6】図6は、本発明の実施形態に従って分析されたヒトゲノムの一部分の表を示す。T21は、トリソミー21胎児を宿す妊婦から得られた試料を示す。
【図7】図7は、本発明の実施形態に従って、正倍数体胎児とトリソミー21胎児とを区別するために必要とされる配列数の表を示す。
【図8A】図8Aは、本発明の実施形態に従って、第21番染色体に整列された、配列決定されたタグの、上位10個の開始位置の表を示す。
【図8B】図8Bは、本発明の実施形態に従って、第22番染色体に整列された、配列決定されたタグの、上位10個の開始位置の表を示す。
【図9】図9は、本発明の実施形態のシステムおよび方法で使用可能な典型的コンピュータ装置のブロックダイアグラムを示す。
【発明を実施するための形態】
【0022】
定義
本明細書において使用される用語「生体試料」は、対象(例えば、妊娠女性のようなヒト)から採取される任意の試料のことであり、そして1つ以上の目的の核酸分子(単数または複数)を含む。
【0023】
用語「核酸」または「ポリヌクレオチド」は、デオキシリボ核酸(DNA)またはリボ核酸(RNA)、および一本または二本鎖のいずれかの形態であるそのポリマーのことである。具体的に限定されない限り、当該用語は、基準核酸と同程度の結合特性を有する、既知の天然ヌクレオチドアナログを含む核酸を含み、そして天然に存在するヌクレオチドに同様の方法で代謝される。他に示されない限り、特定の核酸配列はまた、その保存的に改変された改変体(例えば、縮重コドン置換)、対立遺伝子、オルソログ、SNPs、および相補的配列、ならびに明確に示された配列を暗黙的に含む。具体的には、縮重コドン置換は、一つ以上選択された(または全ての)コドンの第三の位置が混合塩基および/またはデオキシイノシン残基で置換されている配列を生じさせることによって達成され得る(Batzer et al.,Nucleic Acid Res.19:5081(1991);Ohtsuka et al,J.Biol.Chem.260:2605−2608(1985);およびRossolini et al, Mol.Cell.Probes 8:91−98(1994))。用語、核酸は、遺伝子、cDNA、mRNA、低分子ノンコーディングRNA、マイクロRNA(miRNA)、Piwi相互作用RNA、および遺伝子または遺伝子座によってコード化されたショートヘアピンRNA(shRNA)と交換可能に使用される。
【0024】
用語「遺伝子」は、ポリペプチド鎖を産生することに関与するDNA断片を意味する。それは、コード領域に先行する、およびコード領域に続く領域(リーダーおよびトレイラー)、ならびに個々のコード断片(エキソン)間の介在配列を含み得る。
【0025】
本明細書において使用される用語「反応」は、特定の目的ポリヌクレオチド配列の存在または不在を示す、化学的、酵素的、または物理的作用に関与する任意の工程のことである。「反応」の例は、例えばポリメラーゼ連鎖反応(PCR)のような増幅反応である。「反応」の別の例は、合成またはライゲーションのいずれかによる配列決定の反応である。「情報を提供する反応」は、ただ一つの目的配列が存在する場合において、一つ以上の特定の目的ポリヌクレオチド配列の存在を示すものである。本明細書において使用される用語「ウェル」は、密閉された構造、例えばPCRアレイにおける、ウェル形状バイアル、セル、またはチャンバー内のあらかじめ決められた位置における反応のことである。
【0026】
本明細書において使用される用語「臨床的に重要な核酸配列」は、その潜在的不均衡が試験される、より大きな遺伝子配列断片に相当するポリヌクレオチド配列のことか、またはそのより大きな遺伝子配列自体に相当するポリヌクレオチド配列のことであり得る。一つの実施例は、第21番染色体の配列である。他の例は、第18番、第13番、XおよびY染色体を含む。さらに他の例は、胎児がその親の片方または両方から受け継いているかもしれない変異遺伝子配列、または遺伝子多型、またはコピー数変異を含む。さらに他の実施例は、悪性腫瘍中において変異した、欠失した、または増幅された配列、例えばヘテロ接合性の欠損または遺伝子重複が起こっている配列を含む。幾つかの実施形態において、複数の臨床的に重要な核酸配列、または臨床的に重要な核酸配列の同等の複数のメーカーが、当該不均衡を検出するためのデータを提供するために使用され得る。例えば、第21番染色体上の5つの不連続配列からのデータは、可能性のある第21番染色体不均衡の決定のための付加的な方法において使用され得、効果的に試料の容量を1/5へと減少させる。
【0027】
本明細書において使用される用語「バックグラウンド核酸配列」は、臨床的に重要な核酸配列に対するその正常な比率が既知、例えば1:1の比率である核酸配列のことである。一つの例として、バックグラウンド核酸配列および臨床的に重要な核酸配列は、ヘテロ接合性のために別個のものである、同一の染色体由来の2つの対立遺伝子である。別の例においてバックグラウンド核酸配列は、臨床的に重要な核酸配列である別の対立遺伝子に対してヘテロ接合性である一つの対立遺伝子である。さらに、各々のバックグラウンド核酸配列および臨床的に重要な核酸配列の幾つかは、異なる個体由来であってもよい。
【0028】
本明細書において使用される用語「基準核酸配列」は、一反応あたりの平均濃度が既知であるか、または同等に測定された核酸配列のことである。
【0029】
本明細書において使用される用語「過剰表示された核酸配列」は、生体試料中における他の配列以上に豊富である、目的の2つの配列(例えば臨床的に重要な配列およびバックグラウンド配列)中における核酸配列のことである。
【0030】
本明細書において使用される用語「に基づく」は、「少なくとも一部に基づく」ことを意味し、そして、一つの方法の入力とその方法の出力との関係において生じる、一つの値の決定において使用される別の値(または結果)のことをいう。本明細書において使用される用語「導く」はまた、一つの方法の入力とその方法の出力との関係のことであり、例えば誘導が公式計算であるときに起こる。
【0031】
本明細書において使用される用語「定量的データ」は、一つ以上の反応から得られ、そして一つ以上の数値を提供するデータを意味する。例えば、特定の配列のための蛍光マーカーを示すウェルの数が、定量的データであろう。
【0032】
本明細書において使用される用語「パラメータ」は、定量的データのセットを特徴づける数値、および/または定量的データセット間における数的関係を意味する。例えば、第一の核酸配列の第一の量と第二の核酸配列の第二の量との間における比率(または比率の関数)はパラメータである。
【0033】
本明細書において使用される用語「カットオフ値」は、生体試料の分類の2つ以上の状態(例えば罹患した状態と罹患していない状態)間を仲立ちするために使用される数値を意味する。例えば、パラメータが当該カットオフ値よりも大きいならば、定量的データの第一の分類がなされ(例えば罹患した状態);またはパラメータがカットオフ値よりも小さいならば、定量データの異なる分類がなされる(例えば罹患していない状態)。
【0034】
本明細書において使用される用語「不均衡」は、臨床的に重要な核酸配列量における少なくとも一つのカットオフ値によって定義される、基準量からの任意の著しい偏差を意味する。例えば、基準量は3/5の比であり得、したがって測定比が1:1であるならば不均衡が生じるだろう。
【0035】
本明細書において使用される用語「染色体異数性」は、2倍体ゲノムのもの由来の染色体量における変異を意味する。当該変異は、増加または欠失であり得る。それは、一つの染色体の全体、または一つの染色体の領域に関連し得る。
【0036】
本明細書において使用される用語「ランダム配列決定」は、配列決定の手順以前に、配列決定された核酸断片が具体的に同定されなかったか、または標的とされなかった配列決定のことである。特定の遺伝子座を標的とする配列特異的プライマーは必要とされなかった。配列決定された核酸のプールは、試料ごとに変化し、そして同一試料における分析ごとでさえ変化する。配列決定された核酸の独自性は、生じた配列決定の結果からのみ明らかとされる。本発明の幾つかの実施形態において、ランダム配列決定は、ある共通の特徴を共有する核酸分子の特定の群を有する生体試料を増大させる手順により行われ得る。一つの実施形態において、生体試料中における各々の断片は、配列決定される同等の可能性を有する。
【0037】
本明細書において使用される用語「ヒトゲノム断片」または「ヒトゲノムの一部分」は、30億塩基対のヌクレオチドを含むヒトゲノムにおける、100%未満のヌクレオチド配列のことである。配列決定において、それはヒトゲノムにおけるヌクレオチド配列の1倍未満の範囲のことである。当該用語は、ヌクレオチド/塩基対のパーセンテージまたは絶対数として表現され得る。使用例として、当該用語は、行われた配列決定の実際の量のことをいうために使用され得る。実施形態は、正確な診断を行うために、ヒトゲノムの配列決定された断片に関する、必要とされる最小値を決定し得る。別の使用例として、当該用語は、疾患分類のためのパラメータまたは量を導き出すために使用される、配列決定されたデータの量のことであり得る。
【0038】
本明細書において使用される用語「配列決定されたタグ」は、ある核酸分子の任意の部分、または全てから配列決定されたヌクレオチド鎖のことである。例えば、配列決定されたタグは、核酸断片から配列決定された短いヌクレオチド鎖、核酸断片の両方の末端における短いヌクレオチド鎖、または生体試料中に存在する完全な核酸断片の配列決定であり得る。核酸断片は、より大きな核酸分子の任意の部分である。断片(例えば遺伝子)は、より大きな核酸分子の他の部分と分離して(すなわち、連結せずに)存在し得る。
【0039】
詳細な説明
本発明の実施形態は、臨床的に重要な染色体領域の増加または減少(疾患状態)が、非疾患状態と比較して存在するか否かを決定するための方法、システム、および装置を提供する。この決定は、生体試料中における他の臨床的に重要ではない染色体領域(バックグラウンド領域)との関連で、臨床的に重要な染色体領域の量のパラメータを使用することによってなされ得る。生体試料における核酸分子は配列決定され、その結果ゲノム断片が配列決定され、そして当該量が当該配列決定の結果から決定され得る。例えば2つの染色体領域(または領域のセット)の量の比に関して基準量と比較した変化(すなわち不均衡)が存在するか否かを決定するために、一つ以上のカットオフ値が選択される。
【0040】
基準量において検出される変化は、臨床的に重要な核酸配列と、他の臨床的に重要ではない配列との関係における任意の偏差(上向きまたは下向き)であり得る。したがって、基準状態は、任意の比または他の量(例えば1−1対応以外)であり得、そして変化を示す測定された状態は、一つ以上のカットオフ値によって決定される基準量とは異なる任意の比または他の量であり得る。
【0041】
臨床的に重要な染色体領域(臨床的に重要な核酸配列とも呼ばれる領域)およびバックグラウンド核酸配列は、第一のタイプの細胞由来であり得、そして一つ以上の第二のタイプの細胞由来であり得る。例えば、胎児/胎盤細胞由来の胎児核酸配列は、母体細胞由来の母体核酸配列のバックグラウンドを含む生体試料、例えば母体血漿中において存在する。一つの実施形態において、カットオフ値は、生体試料中における第一のタイプの細胞のパーセンテージに少なくとも一部基づいて決定される。試料中における胎児配列のパーセンテージは、任意の胎児由来遺伝子座によって決定され得、そして臨床的に重要な核酸配列を測定するために限定されないことに留意すべきである。別の実施形態において、カットオフ値は、体内における非悪性細胞由来の核酸配列のバックグラウンドを含む生体試料、例えば血漿、血清、唾液、または尿における腫瘍配列のパーセンテージに少なくとも一部基づいて決定される。
【0042】
I.一般的方法
図1は、本発明の実施形態に従って、妊娠女性対象から得られた生体試料中における、胎児染色体異数性の出生前診断を行うためのメソッド100のフローチャートである。
【0043】
ステップ110において、妊娠女性からの生体試料が入手される。生体試料は、血漿、尿、血清、または任意の他の好適な試料であってよい。当該試料は、胎児および妊娠女性からの核酸分子を含む。例えば当該核酸分子は、染色体の断片であり得る。
【0044】
ステップ120において、生体試料中に含まれる複数の核酸分子の少なくとも一部が配列決定される。配列決定された当該部分はヒトゲノム断片を示す。一つの実施形態において、核酸分子は各々の染色体の断片である。一つの末端(例えば35塩基対(bp))、両方の末端、または完全な断片が配列決定され得る。当該試料中における核酸分子の全てが配列決定されてもよく、またはサブセットのみが配列決定されてもよい。このサブセットは、以下により詳細に記載されるようにランダムに選択され得る。
【0045】
一つの実施形態において、配列決定は、大量並行配列決定を使用してなされる。大量配列決定、例えば454プラットフォーム(Roche)(Margulies,M.et al.2005 Nature 437,376−380)、Illumina Genome Analyzer (またはSolexaプラットフォーム)、またはSOLiDシステム(Applied Biosystems)、またはHelicos True Single Molecule DNA配列決定テクノロジー(Harris TD et al.2008 Science,320,106−109)、Pacific Biosciencesのsingle molecule,real−time(SMRT(登録商標))技術、およびナノポア・配列決定(Soni GV and Meller A.2007 Clin Chem 53:1996−2001)は、並行方式において高次に多重化している検体から単離された多くの核酸分子の配列決定を可能とする(Dear Brief Funct Genomic Proteomic 2003;1:397−416)。これらのプラットホームの各々は、クローン的に増大された、または増幅さえされていない核酸断片の単一分子を配列決定する。
【0046】
各ランにおいて、多くの数の配列決定のリードが、10万〜100万または場合により数百万、または10億個のオーダーで各々の試料から生じるので、得られる配列決定されたリードは、元の検体における核酸種の混合物の代表的な特性を形成する。例えば、配列決定されたリードのハプロタイプ、トランスクリプトーム、およびメチル化プロファイルは、元の検体のものと類似する(Brenner et al Nat Biotech 2000;18:630−634;Taylor et al Cancer Res 2007;67:8511−8518)。各々の検体からの配列の多くのサンプリングのために、同一配列の数、例えば数倍の範囲または高い冗長性での核酸プールの配列決定から生じたものはまた、元の試料中における特定の核酸種または遺伝子座の数の優れた定量的表示である。
【0047】
ステップ130において、配列決定(例えば配列決定からのデータ)に基づいて、第一の染色体(例えば臨床的に重要な染色体)の第一の量が決定される。当該第一の量は、当該第一の染色体に由来するものとして同定された配列から決定される。例えば、バイオインフォマティクスの手法がその後、これらのDNA配列の各々をヒトゲノムへと配置するために使用され得る。かかる配列は、ヒトゲノムの繰り返し領域、または個体間変動、例えばコピー数変動を受ける領域において存在するため、かかる配列比率は続いて起こる分析から排除される可能性がある。目的の染色体の量、および一つ以上の他の染色体の量がこのようにして決定され得る。
【0048】
ステップ140において、配列決定に基づいて、一つ以上の第二の染色体の第二の量は、第二の染色体の一つ由来として同定された配列から決定される。一つの実施形態において、第二の染色体は、第一の染色体(すなわち試験される染色体)以外の、全ての他の染色体である。別の実施形態において、第二の染色体は、ちょうど単一の他の染色体である。
【0049】
限定されないが、配列決定されたタグの数、配列決定されたヌクレオチド(塩基対)の数、あるいは特定の染色体(単数もしくは複数)、または染色体領域に由来する配列決定されたヌクレオチド(塩基対)の累積された長さの集計を含む、染色体の量を決定するための多くの方法が存在する。
【0050】
別の実施形態において、何が集計されるかを決定するために、規則が配列決定の結果に課され得る。一つの態様において、ある量は、配列決定の結果の比率に基づいて得られ得る。例えば、特定の大きさの範囲の核酸断片に対応する配列決定の結果が、バイオインフォマティクス分析の後に選択される。大きさの範囲の例は、約300bp未満、200bp未満、または100bp未満である。
【0051】
ステップ150において、パラメータは、第一の量および第二の量から決定される。例えば当該パラメータは、第一の量と第二の量との単純な比、または第一の量と、第二の量かつ第一の量との単純な比であり得る。一つの態様において、各々の量は、ある関数または別の関数の独立変数であり得、ここで比率は、これらの別の関数から得られてもよい。当業者は、異なる好適なパラメータの数を認識するだろう。
【0052】
一つの実施形態において、染色体異数性に潜在的に関与する染色体、例えば第21番染色体、第18番染色体、または第13番染色体のパラメータ(例えば分数表示(fractional representation))はしたがって、バイオインフォマティクスの手順の結果から計算され得る。当該分数表示は、全ての染色体配列(例えば臨床的に重要な染色体を含む全ての染色体の幾つかの測定)、または特定の染色体サブセット(例えば試験されるもの以外のちょうど一つのもの)の量に基づいて得られる。
【0053】
ステップ150において、パラメータは、一つ以上のカットオフ値と比較される。カットオフ値は、種々の好適な方法から決定されてもよい。かかる方法は、ベイジアン式尤度法、逐次確率比検定(SPRT)、偽の発見、信頼区間、受信者動作特性(ROC)を含む。これらの方法および試料特異的な方法の適用の例は、同時に提出された出願「DETERMINING A NUCLEIC ACID SEQUENCE IMBALANCE」(代理人整理番号016285−005210US)に記載されており、そしてそれは参照により援用される。
【0054】
一つの実施形態において、パラメータ(例えば、臨床的に重要な染色体の分数表示)はその後、正常の(すなわち正倍数体の)胎児に関与する妊娠において確立された基準範囲と比較される。当該手順における幾つかの変形において、基準範囲(すなわちカットオフ値)は、特定の母体血漿試料中における胎児DNAの部分的濃度(f)に従って調節される可能性がある。fの値は、配列決定のデータセットから、例えば胎児が男である場合に、Y染色体にマッピング可能な配列を使用して決定され得る。fの値はまた、分離した分析、例えば胎児のエピジェネティックマーカーを使用して(Chan KCA et al 2006 Clin Chem 52,2211−8)、または一塩基多型の分析から決定されてもよい。
【0055】
ステップ160において、当該比較に基づいて、胎児染色体異数性が第一の染色体に存在するか否かの分類が決定される。一つの実施形態において、当該分類は、明確なイエスまたはノーである。別の実施形態において、分類は分類できないか、または不明確であってもよい。さらに別の実施形態において、当該分類は、後日、例えば医者によって解釈され得るスコアであってもよい。
【0056】
II.配列決定、整列化、および量の決定
上で言及された通り、ゲノム断片のみが配列決定された。一つの態様において、検体中における核酸のプールが、数倍の範囲の代わりに100%未満の遺伝子範囲で配列決定されるときでさえ、捕獲された核酸分子の比率中において、大部分の各々の核酸種が一回のみ配列決定される。同様に、特定の染色体または染色体領域の量の不均衡は、定量的に決定され得る。すなわち、染色体または染色体領域の量の不均衡は、当該検体のマッピング可能な、他の配列決定されたタグ中における前記遺伝子座のパーセンテージ表示から推測される。
【0057】
これは、同一プールの核酸が複数回配列決定されて、大過剰、または数倍の範囲に達し、それにより個々の核酸種が複数回配列決定される状況と対比される。かかる状況において、特定の核酸種が配列決定される回数は、別の核酸種のものと比較して、元の試料におけるそれらの相対濃度と相関関係がある。配列決定の費用は、当該核酸種の正確な表示を達成するために必要とされるフォールド範囲(fold coverage)数と共に増加する。
【0058】
一つの実施例において、かかる配列の比率は、異数性に関与する染色体、例えば本実例において第21番染色体由来であろう。かかる配列決定の実施由来のさらに別の配列は、他の染色体に由来するだろう。他の染色体と比較した、第21番染色体の相対的大きさを考慮することによって、基準範囲内における、かかる配列決定の実施由来の、第21番染色体特異的配列の正規化頻度を得ることができる。胎児がトリソミー21を有するならば、かかる配列決定の実施由来の、第21番染色体由来配列の正規化頻度は増加し、したがってトリソミー21の検出を可能とするだろう。正規化頻度における変化の程度は、分析試料中における胎児核酸の部分的濃度に依存するだろう。
【0059】
一つの実施形態において、ヒトゲノムおよびヒト血漿DNA試料の単一端配列決定のために、我々はIlluminaゲノムアナライザーを使用した。Illuminaゲノムアナライザーは、フローセルと呼ばれる固体表面上に捕獲された、クローン的に増大された単一のDNA分子を配列決定する。各々のフローセルは、8個の個々の検体または検体のプールを配列決定するための8つのレーンを有する。各々のレーンは、ヒトゲノム中における30億塩基対の配列の一部のみである、約200Mbの配列を生じさせることが可能である。各々のゲノムDNAまたは血漿DNA試料は、一つのフローセルのレーンを使用して配列決定された。生じた短い配列タグは、ヒト基準ゲノム配列と整列され、そして染色体の複製起点が示された。各々の染色体に整列された、個々の配列決定されたタグの総数は表にされ、そして基準ヒトゲノムまたは非疾患性の代表的検体から期待される各々の染色体の相対的大きさと比較された。染色体の獲得または喪失はその後同定された。
【0060】
記載された手法は、本明細書において記載された遺伝子/染色体用量の方法の一つの例示にすぎない。代替的に、ペアエンド配列決定(paired end sequencing)が行われ得る。配列決定された断片の長さとCampbell他(Nat Genet 2008;40:722−729)によって記載された基準ゲノムにおいて期待されたものとを比較する代わりに、整列され、配列決定されたタグ数が数えられ、そして染色体の位置に従ってソートされる。染色体領域、または染色体全体の獲得または喪失は、タグの数と基準ゲノムにおいて期待される染色体の大きさ、または非疾患性の代表的な検体のものとを比較することによって決定された。ペアエンド配列決定によって、元の核酸断片の大きさを推定するこが可能であるため、一つの例は、特定の大きさ、例えば300bp未満、200bp未満、または100bp未満の核酸断片に相当する、対の配列決定されたタグの集計に集中することである。
【0061】
別の実施形態において、一回のランにおいて配列決定される核酸プール画分は、配列決定前にさらに補助的に選択される。例えば、ハイブリダイゼーション型の技術、例えばオリゴヌクレオチドアレイは、特定の染色体、例えば潜在的に異数性の染色体および試験された異数性に関与しない他の染色体(単数または複数)から、核酸配列を初めに補助的に選択するために使用され得る。別の例は、試料プールからの核酸配列の特定の下位群が、配列決定前に補助的に選択されるか、または増大される。例えば上で議論されたように、母体血漿中における胎児DNA分子は、母体のバックグラウンドDNA分子よりも短い断片を含むことが報告された(Chan et al Clin Chem 2004;50:88−92)。したがって、例えばゲル電気泳動、もしくはサイズ排除カラムによって、またはマイクロフルイディクス型手法によって、分子サイズに従って試料中における核酸配列を分画するために、当業者に既知の一つ以上の方法を使用し得る。さらに、代替的には、母体血漿中の無細胞胎児DNAを分析する例において、胎児核酸部分は、母体バックグラウンドを抑制する方法によって、例えばホルムアルデヒドの添加によって増幅され得る(Dhallan et al JAMA 2004;291:1114−9)。一つの実施形態において、補助的に選択された核酸のプールの一部分またはサブセットは、ランダムに配列決定される。
【0062】
他の単一分子配列決定の方法、例えばRoche454プラットフォーム、Applied Biosystems SOLiDプラットフォーム、Helicos True Single Molecule DNA配列決定技術、Pacific Biosciencesの単一分子リアルタイム(SMRT(登録商標))技術、およびナノポア配列決定による方法が、本出願において同様に使用され得る。
【0063】
III.配列決定の結果から染色体の量の決定
大量並行配列決定の後、配列決定されたタグの染色体の複製起点を配置するために、バイオインフォマティクス分析が行われた。この手順の後、潜在的に異数性の染色体、すなわち本研究における第21番染色体由来として同定されたタグは、全ての配列決定されたタグ、または異数性に関連しない一つ以上の染色体由来のタグと定量的に比較される。第21番染色体からの配列決定の結果と試験検体に関する他の非第21番染色体の配列決定の結果との間の関係は、当該検体が異数性またはトリソミー21胎児に関与する妊婦から得られたか否かを決定するために、上の欄において記載された方法から得られるカットオフ値と比較される。
【0064】
限定されないが、以下を含む多くの異なる量が、配列決定されたタグから得られた。例えば、特定の染色体に整列された配列決定されたタグの数、すなわち絶対数は、他の染色体に整列された配列決定されたタグの絶対数と比較され得る。代替的に、全てのまたは幾つかの他の配列決定されたタグと関連して、第21番染色体由来の配列決定されたタグの量の部分的な総数(fractional count)は、他の異数性ではない染色体のものと比較され得る。本実験において、36bpが各々のDNA断片から配列決定されたため、特定の染色体から配列決定されたヌクレオチドの数は、36bpに配列決定されたタグ数を乗じて容易に得られた。
【0065】
さらに、各々の母体血漿検体が、ヒトゲノム断片を配列決定し得る一つのフローセルを使用して統計により配列決定されたため、大部分の母体血漿DNA断片種は、一つの配列決定されたタグ数を生じさせるために各々配列決定されたであろう。すなわち、母体血漿検体中に存在する核酸断片は、1倍未満の範囲で配列決定された。したがって、任意の特定の染色体のための配列決定されたヌクレオチドの総数は、配列決定された前記染色体の一部の量、比率または長さに大部分相当するだろう。したがって、潜在的に異数性である染色体の表示の定量的決定は、同様に得られた他の染色体のための量を基準として、その染色体から配列決定されたヌクレオチド数の一部または同等の長さの一部から得られる。
【0066】
IV.配列決定のための核酸のプールの増大
上で言及されたように、および以下の実施例で記載されるように、ヒトゲノムの一部分のみが、正倍数体の場合とトリソミー21とを区別するために配列決定される必要がある。したがって、増大されたプールの画分のランダム配列決定に先立って配列決定されるために、核酸のプールを増大させることは可能であり、そして費用効率が高いであろう。例えば、母体血漿中における胎児DNA分子は、母体のバックグラウンドDNA分子よりも短い断片を含む(Chan et al Clin Chem 2004;50:88−92)。したがって、例えばゲル電気泳動、もしくはサイズ排除カラムによって、またはマイクロフルイディクス型手法によって、分子サイズに従って試料中における核酸配列を分画するために、当業者に既知の一つ以上の方法を使用し得る。
【0067】
さらに、代替的に、母体血漿中における無細胞胎児DNAを分析する例において、胎児核酸部分は、母体バックグラウンドを抑制する方法によって、例えばホルムアルデヒドの添加によって増大され得る(Dhallan et al JAMA 2004;291:1114−9)。胎児由来の配列比率は、より短い断片を含む核酸プール中で増大されるだろう。図7に従って、正倍数体とトリソミー21とを区別化するために必要とされる配列決定されたタグの数は、部分的胎児DNA濃度が増加することによって減少するだろう。
【0068】
または、潜在的に異数性の染色体および異数性に関与しない一つ以上の染色体に由来する配列は、例えばオリゴヌクレオチドマイクロアレイ上におけるハイブリダイゼーション技術によって増大され得る。核酸の増大されたプールはその後、ランダムスクリーニングを受けるだろう。これは配列決定の費用を減少させ得るだろう。
【0069】
V.ランダムスクリーニング
図2は、本発明の実施形態のランダムスクリーニングを使用する、胎児染色体異数性の出生前診断を行うためのメソッド200のフローチャートである。大量並行配列決定法のための一つの態様において、全ての染色体からの代表的なデータは、同時に生成され得る。特定の断片の複製起点は、時間に先立って選択されない。当該配列決定はランダムになされ、その後データベースサーチが、特定の断片が由来する場所を見るために行われ得る。これは、第21番染色体由来の特定の断片および第1番染色体由来の別の断片が増幅される状況と対比される。
【0070】
ステップ210において、妊娠女性からの生体試料が入手される。ステップ220において、分析される配列のN数が、所望の精度で計算される。一つの実施形態において、生体試料中における胎児DNAのパーセンテージは最初に同定される。これは、当業者に既知である任意の好適な手段によってなされ得る。当該同定は、別のものによって測定された値を単純に読み得る。この実施形態において、分析されるべき配列のN数の計算は、パーセンテージに基づく。例えば、分析に必要な配列の数は、胎児のDNAパーセンテージが落ちる時に増加され、そして胎児DNAが増加する時に減少し得る。N数は、固定された数または相対的な数、例えばパーセンテージであり得る。別の実施形態において、正確な疾患の診断のために十分であると知られているN数を配列決定し得る。N数は、正常範囲の下の方である胎児DNA濃度を有する妊婦においてさえ十分とされ得る。
【0071】
ステップ230において、生体試料中に含まれる少なくともNの複数の核酸分子は、ランダムに配列決定される。この記載された手法の特徴は、配列決定されるべき核酸が、試料分析、すなわち配列決定前に具体的に同定されないか、または標的とされないことである。特定の遺伝子座を標的とする配列特異的プライマーは、配列決定において必要とされない。配列決定される核酸のプールは、試料ごとに、そして同一試料に関する分析ごとにでさえ変化する。さらに、以下の記載から(図6)、診断事例において必要とされる配列決定の結果の量は、試験された検体量と基準群の量との間で変化し得る。これらの態様は、標的とされる遺伝子座が決定前に先だって必要とされ、したがって遺伝子座特異的プライマー、もしくはプローブセットまたはそれらの一群の使用を必要とする、大部分の分子診断手法、例えば蛍光インサイチュハイブリダイゼーション、定量的蛍光PCR、定量的リアルタイムPCR、デジタルPCR、比較蛍光PCR、マクロアレイ比較遺伝子ハイブリダイゼーションなどに基づくものと著しい対照を成す。
【0072】
一つの実施形態において、ランダムスクリーニングは、妊娠女性の血漿中に存在するDNA断片において行われ、そして胎児またはその母親のいずれかに由来するであろう遺伝子配列を得る。ランダムスクリーニングは、生体試料中に存在するランダムな部分の核酸分子をサンプリング(配列決定)することに関与する。配列決定がランダムであるため、異なるサブセット(画分)の核酸分子(およびそのゲノム)は、各々の分析において配列決定され得る。実施形態は、このサブセットが試料ごとに、および同一試料を使用し得る分析ごとに変化する時にでさえ行われるだろう。当該画分の例は、ゲノムの約0.1%、0.5%、1%、5%、10%、20%、または30%である。他の実施形態において、当該画分は、これらの値の少なくともどれかである。
【0073】
残りのステップ240〜270は、メソッド100と同様の方法で進行し得る。
【0074】
VI.配列決定されたタグのプールの配列決定後の選択
以下の実施例IIおよびIIIにおいて記載されるように、配列決定されたデータのサブセットは、トリソミー21と正倍数体の場合とを区別するために十分である。配列決定されたデータのサブセットは、特定の品質パラメータを通過した配列決定タグの比率であり得る。例えば、実施例IIにおいて、繰り返しマスク化された基準ヒトゲノムに個別に整列された、配列決定されたタグが使用された。または、全ての染色体からの核酸断片の代表的プールを配列決定し得るが、潜在的に異数性の染色体に関連するデータと多くの非異数性染色体に関連するデータとの間の比較に重点的に取り組み得る。
【0075】
さらに代替的には、元の検体中における特定のサイズのウィンドウに対応する核酸断片から生じた配列決定されたタグを含む配列決定の結果のサブセットは、配列決定後の分析の間に補助的に選択され得る。例えば、Illuminaゲノムアナライザーを使用して、核酸断片の二つの末端を配列決定することに関するペアエンド配列決定を使用し得る。各々のペアエンドからの配列決定されたデータはその後、基準ヒトゲノム配列に整列される。2つの末端間に渡るヌクレオチドの距離または数は、その後推定される。元の核酸断片の全長がまた、推定され得る。または、454プラットフォームのような配列決定プラットフォーム、および可能な幾つかの単一分子配列決定技術は、短い核酸配列の全長、例えば200bpを配列決定することができる。この方法において、核酸断片の実際の長さは、配列決定されたデータから速やかに知られるだろう。
【0076】
かかるペアエンド分析はまた、他の配列決定プラットフォーム、例えばApplied Biosystems SOLiDシステムを使用して可能である。Roche454プラットフォームに関して、他の大量並行配列決定システムと比較した、増加したリード長のために、その完全な配列からの断片長を決定することがまた可能である。
【0077】
元の母体血漿検体中における短い核酸断片に相当する配列決定されたタグのサブセットにデータ分析の焦点を合わせることの利点は、当該データセットが胎児由来のDNA配列を効果的に増大させるためである。これは、母体血漿中における胎児DNA分子が母体のバックグラウンドDNA分子以上に短い断片を含むためである(Chan et al Clin Chem 2004;50:88−92)。図7に従って、わずかな胎児DNA濃度が増加するために、正倍数体とトリソミー21の場合とを区別するために必要とされる配列決定されたタグの数は減少するだろう。
【0078】
核酸プールのサブセットの配列決定後の選択は、増大したプールを核酸のバックグラウンドプールから物理的に分離する必要がある、検体分析に先立って行われる他の核酸増大方法、例えば特定の大きさの核酸を選択するためのゲル電気泳動またはサイズ排除カラムの使用とは異なる。物理的手順は、より多くの実験的ステップを導入し、そしてコンタミネーションのような問題を生じ得る。配列決定の結果のサブセットの配列決定後のインシリコ選択はまた、疾患決定に必要とされる感受性および特異性に依存して変化し得るだろう。
【0079】
母体血漿検体がトリソミー21または正倍数体胎児を宿した妊娠女性から得られるかどうかを決定するために使用されるバイオインフォマティクス、コンピュータおよび統計的手法は、配列決定の結果からのパラメータを決定するために使用されるコンピュータプログラム製品へと蓄積され得る。コンピュータプログラムの操作は、本質的に異数性の染色体からの定量的な量、および一つ以上の他の染色体からの量(単数または複数)の決定に関するだろう。パラメータは、胎児染色体異数性が本質的に異数性の染色体に存在するか否かを決定するための好適なカットオフ値を用いて決定され、そして比較されるだろう。
【実施例】
【0080】
以下の実施例は、特許請求の範囲に記載される発明を、限定しないが示すために提供される。
I.胎児トリソミー21の出生前診断
8人の妊娠女性を当該試験のために採用した。全ての妊娠女性は、妊娠第1期または第2期であり、そして単胎妊娠であった。彼女らのうち4人は、各々トリソミー21を有する胎児を妊娠しており、そして他の4人は各々正倍数体の胎児を妊娠していた。20ミリリットルの末梢静脈血を各々の対象から回収した。母体血漿を1600xgで10分間、そしてさらに16000xgで10分間遠心分離した後に採取した。DNAをその後5〜10mLの各々の血漿試料から抽出した。Illuminaゲノムアナライザーによって、製造業者の使用説明書に従って、母体血漿DNAをその後、大量並行配列決定のために使用した。配列決定を行う技術者は、配列決定および配列データ分析の間、胎児診断を一時的に見えなくされた。
【0081】
簡潔に言えば、約50ngの母体血漿DNAをDNAライブラリー調製のために使用した。より少ない量、例えば15ngまたは10ngの母体血漿DNAを用いて開始することが可能である。母体血漿DNA断片を、Solexaアダプターと平滑末端ライゲーションし、そして150〜300bpの断片をゲル精製により選択した。または、平滑末端とアダプターとを連結した母体血漿DNA断片が、カラム(例えば、AMPure、Agencourt)を通過され、クラスター生成前のサイズ選択無しに、ライゲーションされていないアダプターを除去することが可能である。アダプターと連結されたDNAをフローセル表面へとハイブリダイズさせ、そしてDNAクラスターを、Illuminaクラスターステーションを使用して生じさせ、その後Illuminaゲノムアナライザーを用いて36サイクルの配列決定を行った。各々の母体血漿検体からのDNAを、一つのフローセルによって配列決定した。配列決定されたリードを、Solexaアナリシス・パイプラインを使用して編集した。全てのリードをその後、リピートマスクされた(repeat−masked)基準ヒトゲノム配列であるNCBI36アセンブリ(GenBank受入番号:NC_000001〜NC_000024)に、Elandアプリケーションを使用して整列した。
【0082】
本試験において、データ分析の複雑性を減少させるために、リピートマスクされたヒトゲノム基準中における固有の位置に位置付けられた配列のみがさらに考慮された。配列決定されたデータの他のサブセットまたは完全なセットが代替的に使用され得る。各々の検体に関する個々にマッピング可能な配列の全体の数が数えられた。第21番染色体に個々に整列された配列の数を、個々の検体に関して整列された配列の総数に対する比率として表現した。母体血漿は、その母体由来のDNAのバックグラウンド中において胎児DNAを含むため、トリソミー21の胎児は、胎児ゲノム中における第21番染色体の過剰のコピーの存在のために、第21番染色体に由来する過剰の配列決定されたタグに寄与するだろう。したがって、トリソミー21の胎児を宿す妊婦からの母体血漿中における第21番染色体配列のパーセンテージは、正倍数体を宿す妊婦からのものよりも高いだろう。当該分析は、胎児特異的配列の標的化を必要としない。それはまた、母体核酸からの胎児核酸の事前の物理的分離を必要としない。それはまた、配列決定後、胎児と母体の配列を区別するか、または識別する必要がない。
【0083】
図3Aは、8つの母体血漿DNA試料の各々に関して、第21番染色体に位置付けられた配列のパーセンテージ(第21番染色体のパーセンテージ表示)を示す。第21番染色体のパーセンテージ表示は、トリソミー21妊娠の母体血漿において、正倍数体妊娠のもの以上に著しく高かった。これらのデータは、胎児異数性の非侵襲的出生前診断が、基準群のものと比較した異数性染色体のパーセンテージを決定することによって達成され得ることを示唆している。または、第21番染色体の過剰な表示は、実験的に得られる第21番染色体のパーセンテージ表示と、正倍数体ヒトゲノムに関して期待される第21番染色体のパーセンテージ表示とを比較することにより検出され得る。これは、ヒトゲノムにおける繰り返し領域をマスク化することによって、またはマスク化しないことによってなされ得る。
【0084】
8人の妊娠女性の内、5人は、各々男性胎児を宿していた。Y染色体に位置付けられた配列は、胎児特異的であろう。Y染色体に位置付けられた配列のパーセンテージが、元の母体血漿検体中における部分的胎児DNA濃度を計算するために使用された。さらに、部分的胎児DNA濃度はまた、X連鎖性(ZFX)ジンクフィンガータンパク質、Y連鎖性(ZFY)パラロガス遺伝子に関与するマイクロフルイディクスデジタルPCRを使用することによって決定された。
【0085】
図3Bは、配列決定によって、Y染色体のパーセンテージ表示によって推測される部分的胎児DNA濃度と、ZFY/ZFXマイクロフルイディクスデジタルPCRによって決定されるものとの相関関係を示す。これらの二つの方法によって決定された母体血漿中における部分的胎児DNA濃度間において正の相関があった。相関係数(r)は、ピアソンの相関分析において0.917であった。
【0086】
2つの代表的な場合に関して、各々の24個の染色体(22個の常染色体、ならびにXおよびY染色体)に整列された母体血漿DNA配列のパーセンテージを、図4Aに示す。一人の妊娠女性は、トリソミー21胎児を宿しており、そして他の者は正倍数体の胎児を宿していた。第21番染色体に位置付けられた配列のパーセンテージ表示は、トリソミー21胎児を宿す妊娠女性において、正常な胎児を宿している妊娠女性と比較してより高い。
【0087】
上の二つの場合の母体血漿DNA検体間における染色体あたりのパーセンテージ表示の差(%)を、図4Bに示す。特定の染色体に関するパーセンテージ差は、以下の式を使用して計算される:
パーセンテージ差(%)=(P21−PE)/PEx100%
ここでP21は、トリソミー21胎児を宿す妊娠女性における特定の染色体に整列された血漿DNA配列のパーセンテージであり;そして
Eは、正倍数体胎児を宿す妊娠女性における特定の染色体に整列された血漿DNA配列のパーセンテージである。
【0088】
図4Bに示されるように、トリソミー21配列を宿す妊娠女性の血漿中において、正倍数体胎児を宿す妊娠女性と比較したときに、第21番染色体の、11%過剰な表示が存在する。他の染色体に整列された配列に関して、2つの場合の間における差は5%以内であった。第21番染色体に関するパーセンテージ表示は、正倍数体の母体血漿試料と比較してトリソミー21の試料中において増加するため、当該差(%)は、第21番染色体配列間における過剰な表示の程度として代わりに参照され得る。第21番染色体のパーセンテージ表示間の差(%)および絶対的な差に加えて、試験試料および基準試料からの数の比率がまた計算され得、そして基準は同様に計算され得、そして正倍数体試料と比較された、トリソミー21における第21番染色体の過剰表示の程度を示すだろう。
【0089】
各々が正倍数体の胎児を宿す4人の妊娠女性に関して、平均1.3455%の彼女らの血漿DNA配列が、第21番染色体に整列された。トリソミー21胎児を宿す4人の女性において、彼女らの胎児のうち3人は女性であった。第21番染色体のパーセンテージ表示を、これらの3人の場合の各々に関して計算した。これらの3人のトリソミー21の場合に関する第21番染色体のパーセンテージ表示における、4人の正倍数体の場合の値から得られる平均的な第21番染色体パーセンテージ表示からの差(%)を、上で記載した通りに決定した。すなわち、正倍数体胎児を宿す4人の場合における平均がこの計算における基準として使用された。これらの3人の男性トリソミー21の場合に関する部分的胎児DNA濃度は、Y染色体配列の各々のパーセンテージ表示から推測される。
【0090】
第21番染色体の過剰表示の程度と部分的胎児DNA濃度との間の相関関係を、図5に示す。2つのパラメータ間において著しい正の相関があった。相関係数(r)はピアソン相関分析において0.898であった。これらの結果は、母体血漿中における第21番染色体の過剰表示の程度が、母体血漿試料中の胎児DNAの部分的濃度と関連していることを示す。したがって、部分的胎児DNA濃度に関連する第21番染色体配列の過剰な表示の程度におけるカットオフ値は、トリソミー21胎児に関与する妊娠を同定するために決定され得る。
【0091】
母体血漿中における胎児DNAの断片的濃度の決定はまた、配列決定の実施とは別になされ得る。例えば、Y染色体DNA濃度は、リアルタイムPCR、マイクロフルイディクスPCR、または質量分析を使用してあらかじめ決定され得る。例えば、我々は、配列決定の実施中において生じたY染色体数に基づいて推測される胎児DNA濃度と、配列決定の実施とは別に生じたZFY/ZFX比との間において優れた相関があることを図3において実証した。実際、胎児DNA濃度は、Y染色体以外の女性胎児において適用可能な遺伝子座を使用して決定され得る。例えば、Chan他は、胎児由来のメチル化されたRASSF1A配列が、母体由来のメチル化されていないRASSF1A配列のバックグラウンドにおける妊娠女性の血漿中において検出されることを示した(Chan et al,Clin Chem 2006;52:2211−8)。したがって、部分的胎児DNA濃度は、メチル化されたRASSF1A配列の量を全RASSF1A(メチル化されたもの、およびメチル化されていないもの)配列で割ることによって決定され得る。
【0092】
血液凝固の間に、DNAが母体の血液細胞から放出されるため、本発明を実施するにあたり、母体血清よりも母体血漿が好ましいことが予想される。したがって、血清が使用されるならば、胎児DNAの部分的濃度は、母体血漿中において母体血清中よりも低いだろうと予想される。すなわち、母体血清が使用されるならば、同時に、同一の妊娠女性から得られる血漿試料と比較して、胎児染色体異数性を診断するためにより多くの配列を生じさせることが必要であると予想される。
【0093】
胎児DNAの部分的濃度を決定するためのさらに別の代替的な方法は、妊娠女性と胎児との間の多型の違いの定量を通じてであろう(Dhallan R, et al.2007 Lancet,369,474−481)。この方法の例は、妊娠女性がホモ接合性であり、そして胎児がヘテロ接合性である多型部位を標的とすることであろう。胎児特異的対立遺伝子の量は、胎児DNAの断片的濃度を決定するために、共通の対立遺伝子の量と比較し得る。
【0094】
一つ以上の特異的配列(単数または複数)を検出かつ定量する、比較ゲノムハイブリダイゼーション、マイクロアレイ比較ゲノムハイブリダイゼーション、定量的リアルタイムポリメラーゼ連鎖反応を含む、染色体異常を検出するための既存の技術とは対照的に、大量並行配列決定は、あらかじめ決定もしくは定義されたDNA配列のセットの検出または分析に依存しない。検体プールからの、DNA分子のランダムな代表的断片を配列決定した。様々な染色体領域に整列された異なる配列決定されたタグの数を、対象DNA種を含む検体または含まない検体間で比較した。染色体異常は、検体中の任意に与えられた染色体領域に整列された配列の数(またはパーセンテージ)における違いによって明らかとされるだろう。
【0095】
別の例において、血漿の無細胞DNAにおける配列決定技術を、特定の癌の検出のために、血漿DNA中の染色体異常を検出するために使用してもよい。異なる癌は、1セットの典型的な染色体異常を有する。複数の染色体領域における変化(増幅および欠失)が使用され得る。したがって、増幅された領域に整列された増幅された配列比率、および減少した領域に整列された減少した配列比率が存在するだろう。染色体あたりのパーセンテージ表示は、全ゲノムと関連する、与えられた任意の染色体のゲノム表示のパーセンテージとして表現される基準ゲノム中における各々の対応する染色体に関するサイズと比較され得る。直接的な比較、または基準染色体との比較が同様に使用され得る。
【0096】
II.ヒトゲノムの一部分のみの配列決定
上の実施例Iに記載された実験において、各々の個体の検体からの母体血漿DNAを、一つのフローセルのみを使用して配列決定した。配列決定の実施によって、試験された検体の各々から生じた、配列決定されたタグの数を図6に示す。T21は、トリソミー21胎児に関連する妊婦から得られた試料を示す。
【0097】
個々の配列決定された母体血漿DNA断片から、36bpが配列決定されたため、個々の検体から配列決定されたヌクレオチド/塩基対の数は、36bpを配列決定されたタグ数で乗じることによって決定され得、そして図6において同様に示される。ヒトゲノム中に約30憶塩基対存在するため、一部分のみ示される個々の母体血漿検体から生じた配列決定データの量は、約10%〜13%の範囲であった。
【0098】
さらに本試験において、Elandソフトウェアからの命名であるU0と呼ばれる、一意的にマッピング可能な配列決定されたタグのみを、上の実施例1において記載されたようなトリソミー21を有する胎児を各々宿す妊婦からの母体血漿検体中における、第21番染色体配列の量における過剰表示の存在を実証するために使用した。図6に示すように、U0配列は、単に各々の検体から生じた全ての配列決定されたタグのサブセットを表し、そしてより少ないヒトゲノムの比率、約2%をさらに示す。これらのデータは、試験された試料中において存在するヒトゲノム配列の一部分のみの配列決定は、胎児異数性の診断を達成するために十分であることを示している。
【0099】
III.必要とされる配列数の決定
正倍数体男性胎児を宿す妊娠女性からの血漿DNAの配列決定の結果を、本分析のために使用した。基準ヒトゲノム配列におけるミスマッチなしで位置付けられた配列決定されたタグの数は、1,990,000個であった。配列のサブセットを、これらの1,990,000個のタグからランダムに選択し、そして第21番染色体に整列された配列のパーセンテージを個々のサブセット内で計算した。当該サブセット中における配列数は、60,000〜540,000配列で変化された。個々のサブセットの数に関して、同数の配列決定されたタグの複数のサブセットを、全プールからの配列決定されたタグのランダム選択によって、他の組み合わせが可能でなくなるまで編集した。第21番染色体に整列された配列の平均パーセンテージおよびその標準偏差(SD)をその後、個々のサブセットサイズ内における複数のサブセットから計算した。第21番染色体に整列された配列のパーセンテージ分布におけるサブセットサイズの効果を決定するために、これらのデータを、異なるサブセットサイズ間で比較した。パーセンテージの5パーセンタイル値および95パーセンタイル値をその後、平均およびSDに従って計算した。
【0100】
妊娠女性がトリソミー21胎児を宿しているとき、第21番染色体に整列された配列決定されたタグは、当該胎児からの第21番染色体の過剰用量のために、母体血漿において過剰表示されるべきである。過剰表示の程度は、以下の等式に従って、母体血漿DNA試料における胎児DNAパーセンテージに依存する:
PerT21=PerEu×(1+f/2)
ここで、PerT21は、トリソミー21の胎児を有する女性における第21番染色体に整列された配列のパーセンテージを示し;そして
PerEuは、正倍数体胎児を有する女性における第21番染色体に整列された配列のパーセンテージを示し、;そして
fは、母体血漿DNA中における胎児DNAパーセンテージを示す。
【0101】
図7において示されるように、第21番染色体に整列された配列のパーセンテージに関するSDは、個々のサブセットにおける配列の数の増加と共に減少する。したがって、個々のサブセットにおける配列の数が増加するときに、5パーセンタイル値と95パーセンタイル値との間隔が減少する。正倍数体およびトリソミー21に関する5%と95%との間隔が重複しないときに、2つのケース群間の識別は、95%超の精度で可能であろう。
【0102】
図7において示されるように、トリソミー21の場合と正倍数体の場合の識別のための最小のサブセットサイズは、胎児DNAパーセンテージに依存する。トリソミー21と正倍数体の場合を識別ための最小のサブセットサイズは、20%、10%、および5%の胎児DNAパーセンテージの各々に対して、120,000、180,000、および540,000個の配列であった。すなわち、母体血漿DNA試料が20%の胎児DNAを含むとき、胎児がトリソミー21であるか否かを決定するために、必要とされる分析されるべき配列の数は、120,000個であろう。胎児DNAパーセンテージが5%に落ちるとき、必要とされる分析されるべき配列の数は、540,000個に増大するだろう。
【0103】
36塩基対の配列決定を使用してデータが生じるため、120,000、180,000、および540,000個の配列は、ヒトゲノムの0.14%、0.22%、および0.65%に各々相当する。妊娠早期から得られる母体血漿における、低い範囲の胎児DNA濃度が、約5%であると報告されたため(Lo,YMD et al.1998 Am J Hum Genet 62,768−775)、ヒトゲノムの約0.6%の配列決定は、任意の妊婦に関する胎児染色体異数性を少なくとも95%の精度で検出する診断のために必要とされる最小の配列決定の量を示し得る。
【0104】
IV.ランダムスクリーニング
配列決定・ランの間、配列決定されたDNA断片がランダムに選択されることを示すために、我々は実施例Iにおいて分析された8つの母体血漿試料から生じた配列決定されたタグを得た。個々の母体由来血漿検体に関して、我々は、基準ヒトゲノム配列、NCBIアセンブリ36に関連する、ミスマッチの無い第21番染色体に一意的に整列された、36bpの配列決定されたタグの各々の開始位置を決定した。その後、我々は、各々の検体由来の、整列された配列決定されたタグのプールに関する開始位置番号を昇順で並べた。我々は、第22番染色体に対して同様の分析を実行した。説明のために、各々の母体血漿検体に関する第21番染色体および第22番染色体の上位10個の開始位置を図8Aおよび8Bにそれぞれ示す。これらの表から認められるように、DNA断片の配列決定されたプールは、試料間で同一ではなかった。
【0105】
この適用において記載された任意のソフトウェア・コンポーネントまたはソフトウェア関数は、好適なコンピュータ言語、例えばJava(登録商標)、C++またはPerlを使用して、例えば従来の、またはオブジェクト指向の技術を使用して実行され得る。ソフトウェアコードは、記憶および/または伝達のためのコンピュータ読み取り可能媒体、ランダムアクセスメモリー(RAM)、読み取り専用メモリー(ROM)、磁気媒体、例えばハードドライブもしくはフロッピー(登録商標)ディスク、または光学媒体、例えばコンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)、フラッシュメモリーなどを含む好適な媒体における、一連の指示またはコマンドとして蓄積され得る。コンピュータ読み取り可能媒体は、かかる記憶または伝達装置の任意の組み合わせであり得る。
【0106】
かかるプログラムはまた、コード化され、そしてインターネットを含む種々のプロトコールに適合する有線、光、および/または無線ネットワークを経由した伝達のために適用されるキャリア信号を使用して伝達され得る。したがって、本発明の実施形態のコンピュータ読み取り可能媒体は、かかるプログラムでコード化されたデータ信号を使用して作られ得る。かかるプログラムでコード化されたコンピュータ読み取り可能媒体は、互換性のある装置と共にパッケージされるか、または他の装置からは分離して(例えばインターネットダウンロードを通じて)提供され得る。任意のかかるコンピュータ読み取り可能媒体は、単一のプログラム製品(例えばハードドライブもしくは全コンピュータシステム)上にまたはその中に装備されてもよく、そしてシステムもしくはネットワーク内における異なるコンピュータプログラム製品上もしくはその中に存在してもよい。コンピュータシステムは、ユーザーに本明細書において言及された任意の結果を提供するためのモニター、プリンター、または他の好適なディスプレイを含んでもよい。
【0107】
コンピュータシステムの例を図9に示す。図9に示されたサブシステムは、システムバス975を通じて相互接続される。さらなるサブシステム、例えばプリンター974、キーボード978、固定ディスク979、ディスプレイアダプター982と連結されたモニター976、およびその他のものが示される。I/Oコントローラー971と連結する、周辺機器および入力/出力(I/O)装置は、当技術分野において既知である任意の数の手段、例えばシリアルポート977によってコンピュータシステムと接続され得る。例えば、シリアルポート977または外部インターフェース981は、コンピュータ装置をインターネットのような広域ネットワーク、マウス入力装置、またはスキャナーと接続するために使用され得る。システムバス経由の相互接続により、セントラルプロセッサ973を個々のサブシステムと通信させ、そしてシステムメモリー972または固定ディスク979からの指示の実行、およびサブシステム間の情報の交換をさせることが可能である。システムメモリー972および/または固定ディスク979は、コンピュータ読み取り可能媒体を具現化し得る。
【0108】
本発明の例示的実施形態の上の記載は、例証および説明の目的のために存在する。記載された明確な形態に本発明を網羅する、または限定することは意図されておらず、そして多くの変更および変形は、上の教示の観点において可能である。当該実施形態は、本発明の原理、ならびにそれにより他の当業者が本発明を種々の実施形態で本発明を最もよく利用することができるように、意図された特定の使用に好適である種々の変形を有する、その実用的な利用を最もよく説明するために選択かつ記載された。
【0109】
本明細書において引用された全ての出願、特許および特許出願は、全ての目的のために、それら全体で参照により本明細書に援用される。

【特許請求の範囲】
【請求項1】
妊娠女性対象から得られた生体試料中における胎児染色体異数性の出生前診断を行うための方法であって、前記生体試料が核酸分子を含み、以下のステップ:
前記生体試料を入手し;
前記生体試料中に含まれる複数の核酸分子の少なくとも一部分を配列決定し、ここで、配列決定された前記一部分はヒトゲノム断片であり;
前記配列決定に基づいて:
第一の染色体由来として同定された配列からの、前記第一の染色体の第一の量を決定し;
第二の染色体の一つ由来として同定された配列からの、一つ以上の前記第二の染色体の第二の量を決定し;
前記第一の量および前記第二の量からパラメータを決定し;
前記パラメータを一つ以上のカットオフ値と比較し;そして
前記比較に基づいて、胎児染色体異数性が前記第一の染色体において存在するか否かの分類を決定すること
を含む、前記方法。
【請求項2】
前記配列決定が、前記生体試料中に含まれる前記核酸分子の一部分においてランダムに行われる、請求項1に記載の方法。
【請求項3】
前記生体試料が母体の血液、血漿、血清、尿または唾液である、請求項1に記載の方法。
【請求項4】
前記生体試料が大腿骨頸部洗浄液である、請求項1に記載の方法。
【請求項5】
前記第一の染色体が、第21番染色体、第18番染色体、第13番染色体、X染色体、またはY染色体である、請求項1に記載の方法。
【請求項6】
前記パラメータが前記第一の染色体由来である配列の比率である、請求項1に記載の方法。
【請求項7】
前記比率が、任意の一つ以上の、配列決定されたタグ数の部分的な総数、配列決定されたヌクレオチドの部分的な数、および集められた配列の部分的な長さから得られる、請求項6に記載の方法。
【請求項8】
前記第一の染色体に由来する配列が、塩基対の特定の数よりも少なくなるように選択される、請求項6に記載の方法。
【請求項9】
前記塩基対の特定の数が、300bp、200bp、または100bpである、請求項8に記載の方法。
【請求項10】
前記生体試料の核酸分子が、少なくとも一つの特定の染色体由来である配列について増大された、請求項1に記載の方法。
【請求項11】
前記生体試料の核酸分子が、300bp未満である配列について増大された、請求項1に記載の方法。
【請求項12】
前記生体試料の核酸分子が、200bp未満である配列について増大された、請求項1に記載の方法。
【請求項13】
前記生体試料の核酸分子が、ポリメラーゼ連鎖反応を使用して増幅された、請求項1に記載の方法。
【請求項14】
前記配列決定された一部分が、ヒトゲノムの少なくとも一つのあらかじめ決定された断片である、請求項1に記載の方法。
【請求項15】
前記断片が、ヒトゲノムの少なくとも0.1%である、請求項1に記載の方法。
【請求項16】
前記断片が、ヒトゲノムの少なくとも0.5%である、請求項1に記載の方法。
【請求項17】
前記カットオフ値の少なくとも一つが、前記生体試料中における胎児DNAの断片的濃度に関連する、請求項1に記載の方法。
【請求項18】
前記生体試料中における前記胎児DNAの断片的濃度が、Y染色体配列、胎児エピジェエティックマーカーの任意の一つ以上の比率によって、または一塩基多型分析を使用することによって決定される、請求項17に記載の方法。
【請求項19】
カットオフ値が、正常な生体試料中において確立された基準値である、請求項1に記載の方法。
【請求項20】
以下のステップ:
前記胎児試料中における胎児DNAの量を同定し;そして
所望の精度に基づいて分析されるべき配列のN数を計算すること
をさらに含む、請求項1に記載の方法。
【請求項21】
妊娠女性対象から得られた生体試料における胎児染色体異数性の出生前診断を実行するための操作を行うために、コンピューティングシステムを制御するための複数の指示でコード化されたコンピュータ読み取り可能媒体を含む、コンピュータプログラム製品であって、前記生体試料が核酸分子を含み、前記操作が以下のステップ:
妊娠女性対象から得られる前記生体試料中に含まれる核酸分子の一部分の、ランダムスクリーニングからのデータを入手し、ここで前記生体試料は核酸分子を含み、前記一部分はヒトゲノム断片であり;
前記ランダム配列決定からのデータに基づいて:
第一の染色体由来として同定された配列からの、前記第一の染色体の第一の量を決定し;
第二の染色体の一つ由来として同定された配列からの、一つ以上の前記第二の染色体の第二の量を決定し;
前記第一の量および前記第二の量からパラメータを決定し;
前記パラメータを一つ以上のカットオフ値と比較し;そして
前記比較に基づいて、胎児染色体異数性が前記第一の染色体において存在するか否かの分類を決定すること
を含む、前記方法。
【請求項22】
妊娠女性対象から得られた生体試料における胎児染色体異数性の出生前診断を行うための方法であって、前記生体試料が核酸分子を含み、以下のステップ:
前記生体試料を入手し;
所望の精度に基づいて分析されるべき配列のN数を計算し;
前記生体試料中に含まれる少なくともN個の前記核酸分子をランダムに配列決定し、ここで前記一部分はヒトゲノム断片であり;
前記ランダム配列決定に基づいて:
第一の染色体由来として同定された配列からの、前記第一の染色体の第一の量を決定し;
第二の染色体の一つ由来として同定された配列からの、一つ以上の前記第二の染色体の第二の量を決定し;
前記第一の量および前記第二の量からパラメータを決定し;
前記パラメータを一つ以上のカットオフ値と比較し;そして
前記比較に基づいて、胎児染色体異数性が前記第一の染色体において存在するか否かの分類を決定すること
を含む、前記方法。
【請求項23】
以下のステップ:
前記生体試料中における胎児DNAのパーセンテージを同定し、ここで所望の精度に基づいて分析されるべき配列のN数を計算することは、前記パーセンテージに基づくこと
をさらに含む、請求項22の方法。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図9】
image rotate


【公表番号】特表2010−534069(P2010−534069A)
【公表日】平成22年11月4日(2010.11.4)
【国際特許分類】
【出願番号】特願2010−517481(P2010−517481)
【出願日】平成20年7月23日(2008.7.23)
【国際出願番号】PCT/GB2008/002530
【国際公開番号】WO2009/013496
【国際公開日】平成21年1月29日(2009.1.29)
【出願人】(509229212)ザ チャイニーズ ユニバーシティー オブ ホンコン (4)
【Fターム(参考)】