説明

甲状腺状態の診断のための方法および組成物

本発明は、癌に関連するゲノムDNAマーカーを含むがこれに限定されない、分子プロファイリングおよび癌診断のための組成物、キット、および方法に関する。特に本発明は、甲状腺癌に関連する分子プロファイル、分子プロファイルを決定する方法、および診断を提供するために結果を解析する方法を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2009年3月7日に出願された「Methods and Compositions for Diagnosis of Thyroid Conditions」という名称の米国仮特許出願第61/176,471号の恩典を主張し、この仮特許出願はその全体が参照により本明細書に組み入れられる。
【背景技術】
【0002】
発明の背景
癌は米国における死因の第2位であり、世界的に主要な死亡原因のうちの一つである。現在ほぼ2,500万人が癌を有して生存しており、毎年1,100万件の新たな症例が診断されている。さらに、一般集団は高齢化を続けているため、癌はますます大きな問題になると考えられる。世界保健機構は、2020年までに世界的な癌の率が50%増加すると見積もっている。
【0003】
甲状腺は、ホルモンを生成する少なくとも2種類の細胞を有する、頸部にある腺である。濾胞細胞は、心拍数、体温、およびエネルギーレベルに影響を及ぼす甲状腺ホルモンを生成する。C細胞は、血中カルシウムのレベルの制御を助けるホルモンであるカルシトニンを生成する。甲状腺における異常増殖は、良性または悪性のいずれかであり得る結節の形成をもたらし得る。甲状腺癌には、甲状腺の少なくとも4つの異なる種類の悪性腫瘍:乳頭癌、濾胞癌、髄様癌、および未分化癌が含まれる。
【0004】
米国において、悪性と疑われるために毎年行われるおよそ120,000件の甲状腺除去手術のうち、約33,000件のみが必要である。したがって、およそ90,000件の不必要な手術が行われている。加えて、失われた甲状腺機能を補うために生涯にわたる薬物療法が必要となるため、治療費および合併症が引き続き存在する。したがって、癌診断の現在の方法を改善する、改善された試験手順が必要とされている。
【発明の概要】
【0005】
本発明は、(a) 対象からDNA試料を提供する段階;(b) 表1、3〜6、8、もしくはリスト1〜45に記載される多型からなる群より選択される1つもしくは複数の多型、またはそれらの相補体の存在を検出する段階;および(c) 段階(b)の結果に基づいて、該対象が悪性または良性の甲状腺状態を有するかどうか、または有する可能性が高いかどうかを判定する段階を含む、対象における甲状腺疾患を診断するための方法を含む。
【0006】
本発明はまた、表1、3〜6、8、もしくはリスト1〜45に記載される多型からなる群より選択される1つもしくは複数の多型、またはそれらの相補体に特異的に結合する1つまたは複数の結合剤を含む組成物を含む。
【0007】
別の態様において、本発明は、(a) 表1、3〜6、8、もしくはリスト1〜45に記載される多型からなる群より選択される1つもしくは複数の多型、またはそれらの相補体に特異的に結合する少なくとも1つの結合剤;および(b) 対象からのDNA試料に対する該少なくとも1つの結合剤の結合を検出するための試薬を含む、対象における甲状腺疾患を診断するためのキットを含む。
【0008】
別の態様において、本発明は、(a) 上記の方法を用いて、対象から甲状腺疾患を診断する段階;(b) 診断の結果を対象、医療提供者、または第三者に提供する段階;および(c) 該対象、医療提供者、または第三者に代金を請求する段階を含む、対象における甲状腺疾患を診断するためのビジネス方法を含む。
【図面の簡単な説明】
【0009】
本発明の新規な特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例示的な態様を記載している以下の詳細な説明、および添付の図面を参照することによって得られるであろう。
【図1】良性と悪性の甲状腺組織試料を識別するゲノム領域を同定するためのデータ解析フローチャートを示す。HAPMAP、ハプロタイプマップバージョン3‐www.HAPMAP.orgにおいて公的に利用可能な参照ファイルのセット;CBS、circular binary segmentation‐データ解析アルゴリズム(Olshen, Venkatraman et al. 2004);PLINK‐http://pngu.mgh.harvard.edu/~purcell/plink/index.shtmlにおいて利用可能な、無料のオープンソース全ゲノム関連解析ツールセット(Purcell, Neale et al. 2007。
【図2】ルーチンの細胞学的検査の精度を改善するために、分子プロファイリングがどのように使用され得るかを記載するフローチャートである。図2Aおよび図2Bは、分子プロファイリングビジネスの別の態様を記載している。
【図3】分子プロファイリングビジネスによって提供されるキットの例証である。
【図4】分子プロファイリング結果報告書の例証である。
【図5】本発明の方法において有用な、分子プロファイリングからの診断結果の表示、保存、検索、もしくは計算;ゲノムもしくは核酸の発現解析からの生データの表示、保存、検索、もしくは計算;または任意の試料もしくは顧客情報の表示、保存、検索、もしくは計算のために有用なコンピュータを示す。
【図6】遺伝子リスト間の重複のレベルを示す、コピー数データセットにまたがるベンズ解析である。パネルA、表3、4、および5に記載されるゲノム領域にマッピングされる遺伝子のリストを照合して、それらの冗長性のレベルを決定した。FVPTC対NHP遺伝子リストとPTC対NHP遺伝子リスト(表4および5)の間で、わずか2個の遺伝子が重複していた。パネルB、パネルAからの117個の独自の遺伝子の組み合わせリストを、悪性対良性解析からの199個の遺伝子のリスト(表6)と比較したところ、それらの間に24個の遺伝子の重複が示された。パネルC、FC対FA解析において記載される76個の遺伝子の、悪性対良性解析において記載される199個の遺伝子に対する比較(表3および6)。パネルD、各リスト間の重複のレベルを示す、FVPTC対NHP解析、悪性対良性解析、およびPTC対NHP解析からの遺伝子リスト(表4、5、および6)の比較。
【図7】リスト間の重複のレベルを示す、DNAコピー数解析を用いて発見された甲状腺結節を識別する292個の遺伝子の、mRNA発現および選択的エキソン使用解析により以前に発見された4918個の遺伝子(その全体が参照により本明細書に組み入れられる、米国特許出願第12/592,065号を参照されたい)に対する比較。
【発明を実施するための形態】
【0010】
発明の詳細な説明
本開示は、生体試験試料から異常な細胞増殖を診断するための新規な方法、ならびに関連するキットおよび組成物を提供する。本発明はまた、濾胞癌(FC)、濾胞型甲状腺乳頭癌(FVPTC)、ハースル細胞癌(HC)、ハースル細胞腺腫(HA);甲状腺乳頭癌(PTC)、甲状腺髄様癌(MTC)、および未分化癌(ATC)を含む癌;濾胞性腺腫(FA)を含む腺腫;結節性過形成(NHP);コロイド結節(CN);良性結節(BN);濾胞性新生物(FN);リンパ性自己免疫性甲状腺炎を含むリンパ性甲状腺炎(LCT);副甲状腺組織;腎癌の甲状腺への転移;黒色腫の甲状腺への転移;B細胞リンパ腫の甲状腺への転移;乳癌の甲状腺への転移;良性(B)腫瘍、悪性(M)腫瘍、および正常(N)組織などの、異常な細胞増殖の型の鑑別診断のための方法および組成物を提供する。
【0011】
本発明の方法および組成物は、甲状腺癌を検出、診断、および予後診断するのに有用であるヒトゲノム領域を同定する。いくつかの態様において、該ゲノム領域は、悪性甲状腺結節と良性のものを識別することができる。他の態様において、該ゲノム領域は、特定の悪性甲状腺結節を乳頭癌、濾胞癌、髄様癌、または未分化癌として識別することができる。該ゲノム領域は、良性および悪性の新生物を含むヒト甲状腺新生物における染色体異常およびコピー数変化と関連している。コピー数変化を検出して、疾患の存在についてスクリーニングするための方法において、ならびに治療法に対する攻撃的な腫瘍の挙動および反応に関する予後診断において、これらの配列はプローブとして用いられる。さらに本発明は、細胞増殖の強化された診断、鑑別診断、モニタリング、および治療を提供するためのビジネス方法を提供する。
【0012】
典型的には、腫瘍または他の型の癌の存在に関するスクリーニングは、例えば生検などの様々な方法により採取された生体試料を解析することを含む。次いで、生体試料は当業者により調製され、調べられる。調製の方法には、様々な細胞学的染色および免疫組織化学的方法が含まれ得るが、これらに限定されない。残念ながら、癌診断の伝統的な方法はいくつかの欠陥を抱えている。これらの欠陥には、以下のものが含まれる:1) 診断は主観的な評価を必要とする場合があり、そのため不正確さおよび再現性の欠如を招きやすい場合があること、2) 前記方法は、結果として生じた発病の原因となる、根底にある遺伝学的経路、代謝経路、またはシグナル伝達経路を確定できない場合があること、3) 前記方法は、試験結果の定量的評価を提供しない場合があること、ならびに4) 前記方法は、ある種の試料について明確な診断を提供できない場合があること。
【0013】
コピー数変種の検出において使用するためのマーカーの同定
本発明の1つの態様において、マーカーおよび遺伝子は、甲状腺良性試料と比較して、甲状腺癌試料において差次的コピー数を有すると同定され得る。良性病態を有する例示的な試料には、濾胞性腺腫、ハースル細胞腺腫、リンパ性甲状腺炎、および結節性過形成が含まれる。悪性病態の例示的な試料には、濾胞癌、濾胞型甲状腺乳頭癌、および甲状腺乳頭癌が含まれる。1つの態様において、本発明の方法は、癌診断の現在の方法の精度を改善しようとするものである。精度の改善は、複数の遺伝子および/もしくは発現マーカーの測定、高い診断力もしくは統計的有意性での、miRNA、rRNA、tRNA、およびmRNA遺伝子発現産物などの遺伝子発現産物の同定、または高い診断力もしくは統計的有意性での遺伝子および/もしくは発現産物の群の同定、またはそれらの任意の組み合わせに起因し得る。
【0014】
受容体チロシンキナーゼなどのある規定された群の中の遺伝子コピー数は、コピー数レベルが正常よりも高いかまたは低い場合に、疾患または状態を示し得る。同じ群の中の他の遺伝子のコピー数の測定は、診断有用性を提供し得る。したがって1つの態様において、本発明は、1つの群の中にある2つまたはそれ以上の遺伝子コピー数を測定する。例えば、いくつかの態様では、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、または50個の遺伝子コピー数が、1つの群から測定される。甲状腺癌の亜型の診断に有用な群、または特定のオントロジー群の範囲内にある群などの様々な群が、本明細書において規定される。別の態様においては、複数の群から、癌の有無を正確に示す遺伝子のセットを測定することが有利であると考えられる。例えば、本発明は、それぞれ1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、または50個の遺伝子コピー数が測定される、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、または50個の群の使用を意図する。
【0015】
加えて、生体試料における例えばRasなどの他の癌遺伝子のコピー数の増加もまた、癌性細胞の存在を示し得る。場合によっては、例えば受容体チロシンキナーゼ、細胞質チロシンキナーゼ、GTPアーゼ、セリン/スレオニンキナーゼ、脂質キナーゼ、マイトジェン、増殖因子、および転写因子などの、いくつかの異なるクラスの癌遺伝子のコピー数を決定することは有利であり得る。癌の進行に関与する異なるクラスまたは群の遺伝子のコピー数の決定は、場合によっては本発明の診断力を増加させ得る。
【0016】
発現マーカーの群は、代謝経路内もしくはシグナル伝達経路内のマーカー、または遺伝学的もしくは機能的に相同なマーカーを含み得る。例えば、1つのマーカー群は、上皮増殖因子シグナル伝達経路に関与する遺伝子を含み得る。別のマーカー群は、マイトジェン活性化プロテインキナーゼを含み得る。本発明はまた、複数のおよび/または独立した代謝経路またはシグナル伝達経路から遺伝子コピー数を検出する(すなわち、測定する)、測定するための方法および組成物を提供する。
【0017】
1つの態様において、本発明の遺伝子コピー数は、複数の遺伝子コピー数解析および統計解析の使用を通して、癌診断の精度の増加を提供し得る。特に本発明は、甲状腺癌に関連したDNAコピー数プロファイルを提供するが、これに限定されない。本発明はまた、甲状腺組織試料を特徴づける方法、ならびに該方法の適用に有用なキットおよび組成物を提供する。本開示はさらに、分子プロファイリングビジネスを実行するための方法を含む。
【0018】
本開示は、癌を診断するための現在の最先端の技術を改善するための方法および組成物を提供する。
【0019】
いくつかの態様において、本発明は、生体試料と対照試料との間で遺伝子コピー数レベルを比較し;および、生体試料と対照試料との間に、指定された信頼水準で遺伝子コピー数レベルの差が存在する場合に、生体試料を癌性であると同定する、本明細書に記載される本発明の方法を使用して、70%を上回る特異度または感度をもたらす、癌を診断する方法を提供する。いくつかの態様において、本発明の方法の特異度および/または感度は、少なくとも70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上である。
【0020】
いくつかの態様において、名目上の特異度は70%以上である。名目上の陰性適中率(NPV)は95%以上である。いくつかの態様において、NPVは、少なくとも95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、またはそれ以上である。
【0021】
感度とは、典型的にはTP/(TP+FN)を指し、式中、TPは真陽性であり、FNは偽陰性である。継続不確定(Continued Indeterminate)結果の数を、判定された組織病理学診断に基づく悪性結果の総数で除す。特異度とは、典型的にはTN/(TN+FP)を指し、式中、TNは真陰性であり、FPは偽陽性である。良性結果の数を、判定された組織病理学診断に基づく良性結果の総数で除す。陽性適中率(PPV):TP/(TP+FP);陰性適中率(NPV):TN/(TN+FN)。
【0022】
いくつかの態様において、遺伝子コピー数レベルの差は、少なくとも1、2、3、4、5、6、7、8、9、10、またはそれ以上のコピーである。いくつかの態様において、遺伝子コピー数レベルの差は、少なくとも2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、またはそれ以上である。いくつかの態様において、生体試料は、75%、80%、85%、90%、95%、99%、またはそれ以上を上回る精度で癌性であると同定される。いくつかの態様において、生体試料は、95%を上回る感度で癌性とであると同定される。いくつかの態様において、生体試料は、95%を上回る特異度で癌性であると同定される。いくつかの態様において、生体試料は、95%を上回る感度および95%を上回る特異度で癌性であると同定される。いくつかの態様において、精度は訓練アルゴリズムを用いて算出される。
【0023】
ソフトウェアを使用して、ヒトゲノムの全域で、マーカーからアレイ強度データを抽出、正規化、および要約することができる。いくつかの態様では、良性または悪性いずれかの試料における所定のプローブの相対強度を参照セットに対して比較して、コピー数異常が存在するかどうかを判定することができる。相対強度の増加はコピー数獲得(増幅)を示し、相対強度の減少はコピー数喪失(欠失)を示す。
【0024】
各試料について得られた相対強度を、例えばcircular binary segmentation(CBS)(Olshen, Venkatraman et al. 2004)を用いて、セグメント(相当するコピー数データの領域)に変換することができる。次にこれらのセグメントを用いて、例えばPLINK‐無料の全ゲノム関連解析ツールセット(Purcell, Neale et al. 2007)を使用して、試料間の非重複特徴を作成することができる。カイ二乗検定およびPLINKなどの統計的手段を用いて、悪性または良性の疾患ラベルに付随する上位の特徴を同定することができる。上位のPLINK特徴およびサポートベクターマシン(SVM)解析を用いることにより、分類を行うことができる。
【0025】
診断マーカー
本発明の1つの態様において、濾胞癌と濾胞性腺腫を識別するゲノム領域を表3に示す。
【0026】
本発明の別の態様において、濾胞型乳頭癌と結節性過形成を識別するゲノム領域を表4に示す。
【0027】
本発明の別の態様において、甲状腺乳頭癌と結節性過形成を識別するゲノム領域を表5に示す。
【0028】
甲状腺状態を検出するためのマーカーおよび遺伝子の使用
本発明のマーカーおよび遺伝子を利用して、細胞または組織の癌性状態または非癌性状態を特徴づけることができる。
【0029】
本発明は、対象の甲状腺試料における、表1、3、4、5、6、もしくは8、またはリスト1〜45のマーカーまたは遺伝子の増幅を判定する段階を含む、対象における甲状腺癌を診断するための方法を含む。遺伝子は、Human Genome Build 18に基づいて、AffymetrixアノテーションファイルGenomeWideSNP_6.na26を用いて、マイクロアレイ配列にマッピングされた。
【0030】
1つの態様において、本発明は、対象の甲状腺試料における表3のマーカーまたは遺伝子の増幅を判定する段階を含む、濾胞性腺腫から濾胞癌を診断するための方法を含む。
【0031】
1つの態様において、本発明は、対象の甲状腺試料における表4のマーカーまたは遺伝子の増幅を判定する段階を含む、結節性過形成から濾胞型乳頭癌を診断するための方法を含む。
【0032】
1つの態様において、本発明は、対象の甲状腺試料における表5のマーカーまたは遺伝子の増幅を判定する段階を含む、結節性過形成から甲状腺乳頭癌を診断するための方法を含む。
【0033】
本発明の方法において、1つまたは複数のマーカーまたは遺伝子を用いて、甲状腺状態を検出することができる。マーカーまたは遺伝子の組み合わせを用いて、甲状腺癌の検出の感度および/もしくは特異度を高めること、ならびに/または甲状腺癌の亜型を検出することができる。
【0034】
本発明はまた、細胞における、表1、3、4、5、6、もしくは8、またはリスト1〜45に開示される少なくとも1つの発現を検出する段階を含む、細胞の癌性状態を検出するための方法を含む。1つの態様では、同じ遺伝子を有する正常細胞における発現と比較することにより、発現上昇をモニターすることができる。これらの遺伝子の発現上昇は癌性状態を示す。
【0035】
検査する細胞中に存在するDNAに対するプローブを作製する手段として、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定されるヌクレオチド配列を用いることにより、甲状腺癌を有する疑いのある試料について、コピー数増加などの発現増加を判定することができる。したがって、そのような細胞のDNAを抽出し、そのような細胞のゲノムにおける本発明の遺伝子のうちの1つまたは複数の量増加の存在について、本明細書に開示される配列を用いてプロービングすることができる。例えば、本明細書に開示される癌関連遺伝子または癌関係遺伝子が細胞のゲノム内に複数コピーで存在することが判明した場合には、それがそのように判定された時点で活発に過剰発現していない場合であっても、これは少なくとも後に癌を発症する素因を示し得る。
【0036】
いくつかの態様において、本発明は、以下のシグナル伝達経路のうちの1つまたは複数からの遺伝子コピー数解析を使用する段階を含む、癌を診断する方法を提供する。遺伝子が選択され得るシグナル伝達経路には、急性骨髄性白血病シグナル伝達、2型ソマトスタチン受容体2シグナル伝達、cAMP媒介シグナル伝達、細胞周期およびDNA損傷チェックポイントシグナル伝達、Gタンパク質共役受容体シグナル伝達、インテグリンシグナル伝達、黒色腫細胞シグナル伝達、リラキシンシグナル伝達、および甲状腺癌シグナル伝達が含まれるが、これらに限定されない。いくつかの態様では、生体試料と対照試料との間の差次的なコピー数レベルを決定し比較するために、2つ以上の遺伝子が単一のシグナル伝達経路から選択される。その他のシグナル伝達経路には、接着経路、ECM経路、甲状腺癌経路、接着斑経路、アポトーシス経路、p53経路、密着結合経路、TGFβ経路、ErbB経路、Wnt経路、癌概要経路(pathway in cancer overview)、細胞周期経路、VEGF経路、Jak/STAT経路、MAPK経路、PPAR経路、mTOR経路、または自己免疫性甲状腺経路が含まれるが、これらに限定されない。他の態様では、生体試料と対照試料との間の差次的なコピー数レベルを決定し比較するために、少なくとも2つの遺伝子が少なくとも2つの異なるシグナル伝達経路から選択される。本発明の方法および組成物は、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、またはそれ以上のシグナル伝達経路から選択される遺伝子を有することができ、各シグナル伝達経路からの1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、またはそれ以上の遺伝子を任意の組み合わせで有することができる。いくつかの態様において、組み合わされた遺伝子のセットは、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは99.5%を上回る特異度もしくは感度、または少なくとも95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、もしくはそれ以上の陽性適中率もしくは陰性適中率をもたらす。
【0037】
いくつかの態様において、本発明は、少なくとも2つの異なるオントロジー群から選択される遺伝子を含む、癌を診断する方法を提供する。いくつかの態様において、遺伝子が選択され得るオントロジー群には、多細胞生物過程、多細胞生物発生、前後パターン形成、表皮発生、領域形成、外胚葉発生、角質化、発生過程、組織発生、細胞過程の調節、系の発生、生物学的過程の調節、解剖構造発生、生体調節、パターン特異化過程、ケラチノサイト発生、表皮細胞分化、器官発生、配列特異的DNA結合、DNA依存性転写の調節、胚発生、RNA代謝過程の調節、ARFグアニルヌクレオチド交換因子活性、DNA依存性転写、RNA生合成過程、細胞表面受容体結合シグナル伝達、シグナル伝達物質活性、N-メチル-D-アスパラギン酸選択的グルタミン酸受容体複合体、分子伝達物質活性、または心臓肉柱形成が含まれるが、これらに限定されない。いくつかの態様では、生体試料と対照試料との間の差次的なコピー数レベルを決定し比較するために、2つ以上の遺伝子が単一のオントロジー群から選択される。他の態様では、生体試料と対照試料との間の差次的なコピー数レベルを決定し比較するために、少なくとも2つの遺伝子が少なくとも2つの異なるオントロジー群から選択される。本発明の方法および組成物は、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、またはそれ以上の遺伝子オントロジー群から選択される遺伝子を有することができ、各遺伝子オントロジー群からの1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、またはそれ以上の遺伝子を任意の組み合わせで有することができる。いくつかの態様において、組み合わされた遺伝子のセットは、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは99.5%を上回る特異度もしくは感度、または少なくとも95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、もしくはそれ以上の陽性適中率もしくは陰性適中率もたらす。
【0038】
いくつかの態様において、生物学的試料は、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または99.5%より高い精度で、癌性として分類されるか、または癌の亜型について陽性として分類される。本明細書において使用されるような診断精度には、特異度、感度、陽性適中率、陰性適中率、および/または偽検出率が含まれる。
【0039】
癌の診断のために生物学的試料を分類する場合、典型的には、バイナリーの分類器からの四つの可能性のある結果が存在する。予測からの結果がpであり、実際の値もpである場合には、それは真陽性(TP)と呼ばれる。しかしながら、実際の値がnである場合には、それは偽陽性(FP)であると言われる。反対に、予測結果および実際の値の両方がnである場合には、真陰性が起こっており、偽陰性とは、予測結果はnであるが、実際の値がpである場合である。一つの態様において、ある者がある種の疾患を有するか否かを判定するための診断試験を検討する。この場合の偽陽性は、その者の試験結果が陽性であるが、実際には疾患を有していない場合に起こる。他方、実際には疾患を有しているにも関わらず、その者の試験結果が陰性であって、健康であることが示唆される場合に、偽陰性が起こる。いくつかの態様において、亜型の現実の有病率を仮定するROC曲線が、関連する割合で入手可能な試料において達成された過誤を再抽出することによって生成され得る。
【0040】
疾患の陽性適中率(PPV)、または正確度、または検査後確率は、正確に診断される陽性試験結果を有する患者の割合である。それは、陽性試験が、試験されている基礎をなす状態を反映している確率を反映するため、診断法の最も重要な測定値である。しかしながら、その値は、変動し得る疾患の有病率に依る。一例において、FP(偽陽性);TN(真陰性);TP(真陽性);FN(偽陰性)。
【0041】
偽陽性率(α)=FP/(FP+TN)−特異度
【0042】
偽陰性率(β)=FN/(TP+FN)--感度
【0043】
力=感度=1-β
【0044】
陽性尤度比=感度/(1-特異度)
【0045】
陰性尤度比=(1-感度)/特異度
【0046】
陰性適中率は、正確に診断される陰性試験結果を有する患者の割合である。PPVおよびNPVの測定値は、適切な疾患亜型有病率推定値を使用して導出され得る。プールされた悪性疾患有病率の推定値は、手術によってBかMかに大まかに分類される不確定のプールから計算され得る。亜型特異的な推定値について、いくつかの態様において、入手可能な試料がないために、疾患有病率が計算不能である場合がある。これらの場合には、プールされた疾患有病率推定値を亜型疾患有病率の代わりに用いることができる。
【0047】
いくつかの態様において、本発明の方法の遺伝子分析の結果は、所定の診断が正確である統計的信頼水準を提供する。いくつかの態様において、そのような統計的信頼水準は、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または99.5%を超えている。
【0048】
本開示の一つの局面において、細胞学関連企業により加工され、ルーチンの方法および染色に供され、診断され、カテゴリー化された試料は、次いで、二次診断スクリーニングとしての分子プロファイリングに供される。この二次診断スクリーニングは、(1)偽陽性および偽陰性の有意な低下、(2)結果として生じる病態の基礎をなす遺伝学的経路、代謝経路、またはシグナル伝達経路の確定、(3)診断の精度に統計的確率を割り当てる能力、(4)不明確な結果を分解する能力、および(5)癌の亜型を区別する能力を可能にする。
【0049】
例えば、甲状腺癌の特定の場合において、本発明の分子プロファイリングは、さらに、特定の型の甲状腺癌(例えば、乳頭癌、濾胞癌、髄様癌、または未分化癌)の診断を提供することができる。分子プロファイリングの結果は、さらに、科学者または医療従事者のような当業者が、特定の治療的介入を提案するかまたは処方することを可能にし得る。生物学的試料の分子プロファイリングは、初期診断後に特定の処置の効力をモニタリングするためにも使用され得る。いくつかの場合において、分子プロファイリングは、確立されている癌診断法に加えて、ではなく、確立されている癌診断法の代わりに使用され得ることがさらに理解される。
【0050】
一つの局面において、本発明は、遺伝性障害の診断およびモニタリングのために使用され得るアルゴリズムおよび方法を提供する。遺伝性障害は、遺伝子または染色体の異常により引き起こされる疾病である。癌のようないくつかの疾患は、一部、遺伝性障害によるが、環境因子によっても引き起こされ得る。いくつかの態様において、本明細書に開示されたアルゴリズムおよび方法は、甲状腺癌のような癌の診断およびモニタリングのために使用される。
【0051】
遺伝性障害は、典型的には、単一遺伝子障害および多因子性多遺伝子性(複合)障害という2つのカテゴリーへ類別され得る。単一遺伝子障害は、単一の変異型遺伝子の結果である。単一遺伝子の欠陥により引き起こされるヒト疾患は、4000種を超えると推定されている。単一遺伝子障害は、いくつかの方式で、後の世代に引き継がれ得る。常染色体優性遺伝、常染色体劣性遺伝、X連鎖優性遺伝、X連鎖劣性遺伝、Y連鎖遺伝、およびミトコンドリア遺伝を含むが、これらに限定されない、いくつかの型の単一遺伝子障害の遺伝が存在する。ある者が常染色体優性障害により影響を受けるためには、遺伝子の一つの変異型コピーのみが必要であると考えられる。常染色体優性型の障害の例には、ハンチントン病、神経繊維腫症1型、マルファン症候群、遺伝性非ポリポーシス結腸直腸癌、および遺伝性多発性外骨腫が含まれるが、これらに限定されない。常染色体劣性障害においては、ある者が常染色体劣性障害により影響を受けるためには、遺伝子の2つのコピーが変異型でなければならない。この型の障害の例には、嚢胞性繊維症、鎌型赤血球症(部分鎌型赤血球症も)、テイ・サックス病、ニーマン・ピック病、脊髄筋萎縮症、および乾性耳垢が含まれるが、これらに限定されない。X連鎖優性障害は、X染色体上の遺伝子の変異により引き起こされる。ほんの少数の障害が、この遺伝パターンを有し、主要な例は、X連鎖低リン血症性くる病である。男女共にこれらの障害において影響を受けるが、典型的には男性の方が女性より重度に影響を受ける。レット症候群、色素失調症2型、およびアイカルディ症候群のようないくつかのX連鎖優性状態は、通常、子宮内または出生直後の男性において致命的であり、従って、主として女性に見られる。X連鎖劣性障害も、X染色体上の遺伝子の変異により引き起こされる。この型の障害の例には、血友病A、デュシェンヌ型筋ジストロフィー、赤緑色盲、筋ジストロフィー、および男性型脱毛症が含まれるが、これらに限定されない。Y連鎖障害は、Y染色体上の変異により引き起こされる。例には、男性不妊および耳介多毛症(hypertrichosis pinnae)が含まれるが、これらに限定されない。母性遺伝としても公知のミトコンドリア遺伝は、ミトコンドリアDNA内の遺伝子に当てはまる。この型の障害の一例は、レーバー遺伝性視神経萎縮症である。
【0052】
遺伝性障害は、複合型、多因子性、または多遺伝子性でもあり得る。これは、それらが、生活様式および環境因子と組み合わせられた複数の遺伝子の効果に関連している可能性が高いことを意味する。複合型障害は、しばしば家族内に多発するが、明確な遺伝パターンを有していない。そのため、ある者が、これらの障害を遺伝するかまたは伝達するリスクを確定することは困難である。これらの障害の大部分を引き起こす特定の因子がまだ同定されていないため、複合型障害は、研究し処置するのも困難である。本発明のアルゴリズムおよび方法を使用して診断され、特徴決定され、かつ/またはモニタリングされ得る多因子性または多遺伝子性の障害には、心疾患、糖尿病、喘息、自閉症、多発性硬化症のような自己免疫疾患、癌、繊毛関連疾患、口蓋裂、高血圧、炎症性腸疾患、精神遅滞、および肥満が含まれるが、これらに限定されない。
【0053】
本発明のアルゴリズムおよび方法を使用して診断され、特徴決定され、かつ/またはモニタリングされ得るその他の遺伝性障害には、1p36欠失症候群、21水酸化酵素欠損症、22q11.2欠失症候群、47,XYY症候群、48,XXXX、49,XXXXX、無セルロプラスミン血症、軟骨無発生症II型、軟骨無形成症、急性間欠性ポルフィリン症、アデニロコハク酸リアーゼ欠損症、副腎白質ジストロフィー、ALA欠損性ポルフィリン症、ALAデヒドラターゼ欠損症、アレキサンダー病、アルカプトン尿症、α-1アンチトリプシン欠損症、アルストレーム症候群、アルツハイマー病(1型、2型、3型、および4型)、エナメル質形成不全、筋萎縮性側索硬化症、筋萎縮性側索硬化症2型、筋萎縮性側索硬化症4型、筋萎縮性側索硬化症4型、アンドロゲン不応症、貧血、アンジェルマン症候群、アペール症候群、毛細血管拡張性運動失調、ベアレ・スティーブンソン脳回状頭皮(Beare-Stevenson cutis gyrata)症候群、ベンジャミン症候群、βサラセミア、ビオチニダーゼ欠損症、バート・ホッグ・デューベ症候群、膀胱癌、ブルーム症候群、骨疾患、乳癌、CADASIL、彎曲肢異形成症、カナバン病、癌、セリアック病、CGD慢性肉芽腫性障害、シャルコー・マリー・トゥース病、シャルコー・マリー・トゥース病1型、シャルコー・マリー・トゥース病4型、シャルコー・マリー・トゥース病2型、シャルコー・マリー・トゥース病4型、コケーン症候群、コフィン・ローリー症候群、コラゲノパシー(collagenopathy)II型およびXI型、結腸直腸癌、先天性精管欠損症、先天性両側精管欠損症、先天性糖尿病、先天性赤血球生成性ポルフィリン症、先天性心疾患、先天性甲状腺機能低下症、結合組織病、カウデン症候群、猫泣き、クローン病、線維性狭窄(fibrostenosing)、クルーゾン症候群、クルーゾン皮膚骨格(Crouzonodermoskeletal)症候群、嚢胞性繊維症、ド・グルーシー(De Grouchy)症候群、神経変性疾患、デント病、発達障害、ディジョージ症候群、遠位型脊髄性筋萎縮症V型、ダウン症候群、低身長症、エーラース・ダンロス症候群、エーラース・ダンロス症候群関節弛緩型、エーラース・ダンロス症候群古典型、エーラース・ダンロス症候群皮膚弛緩型、エーラース・ダンロス症候群後側彎型、血管型、骨髄性プロトポルフィリン症、ファブリー病、顔面損傷および顔面障害、第V因子ライデン栓友病、家族性大腸ポリポーシス、家族性自律神経異常症、ファンコニー貧血、FG症候群、脆弱X症候群、フリードライヒ運動失調症(Friedreich ataxia)、フリードライヒ運動失調症(Friedreich's ataxia)、G6PD欠損症、ガラクトース血症、ゴーシェ病(1型、2型、および3型)、遺伝性脳障害、グリシン脳症、ヘモクロマトーシス2型、ヘモクロマトーシス4型、道化師様魚鱗癬、頭部および脳の奇形、聴覚障害および聴覚消失、小児聴覚障害、ヘモクロマトーシス(新生児、2型、および3型)、血友病、骨髄肝性ポルフィリン症、遺伝性コプロポルフィリン症、遺伝性多発性外骨腫症、遺伝性圧脆弱性ニューロパチー、遺伝性非ポリポーシス結腸直腸癌、ホモシスチン尿症、ハンチントン病、ハッチンソン・ギルフォード・プロジェリア症候群、原発性高シュウ酸尿症、高フェニルアラニン血症、軟骨低発生症、軟骨低形成症、idic15、色素失調症、乳児ゴーシェ病、乳児発症上行性遺伝性痙性麻痺、不妊症、ジャクソン・ワイス症候群、ジュベール症候群、若年型原発性側索硬化症、ケネディ病、クラインフェルター症候群、クニースト骨異形成症、クラッベ病、学習障害、レッシュ・ナイハン症候群、白質ジストロフィー、リー・フラウメニ症候群、家族性リポタンパク質リパーゼ欠損症、男性生殖器障害、マルファン症候群、マクキューン・オールブライト症候群、マクロード症候群、家族性地中海熱、MEDNIK、メンケス病、メンケス症候群、代謝障害、βグロビン型メトヘモグロビン血症、先天性メトヘモグロビン血症、メチルマロン酸血症、ミクロ(Micro)症候群、小頭症、運動障害、モワット・ウィルソン症候群、ムコ多糖症(MPS I)、ムンケ(Muenke)症候群、筋ジストロフィー、デュシェンヌ型筋ジストロフィーおよびベッカー型筋ジストロフィー、デュシェンヌ型筋ジストロフィーおよびベッカー型筋ジストロフィー、筋緊張性ジストロフィー、筋緊張性ジストロフィー1型および2型、新生児ヘモクロマトーシス、神経線維腫症、神経線維腫症1型、神経線維腫症2型、神経線維腫症I型、神経線維腫症II型、神経疾患、神経筋障害、ニーマン・ピック病、非ケトーシス型高グリシン血症、非症候性難聴、常染色体劣性非症候性難聴、ヌーナン症候群、骨形成不全症(I型およびIII型)、耳脊椎巨大骨端異形成症、パントテン酸キナーゼ関連神経変性症、パトー症候群(13番染色体トリソミー)、ペンドレッド症候群、ポイツ・ジェガース症候群、プファイファー症候群、フェニルケトン尿症、ポルフィリン症、晩発性皮膚ポルフィリン症、プラダー・ウィリ症候群、原発性肺高血圧症、プリオン病、早老症、プロピオン酸血症、プロテインC欠損症、プロテインS欠損症、偽性ゴーシェ(pseudo-Gaucher)病、弾力線維性仮性黄色腫、網膜障害、網膜芽細胞腫、網膜芽腫、FA−フリートライヒ運動失調症、レット症候群、ルビンシュタイン・テイビ症候群、SADDAN、サンドホフ病、感覚性自律神経性ニューロパチーIII型、鎌状赤血球貧血、骨格筋再生、皮膚色素異常症、スミス・レムリ・オピッツ症候群、発話障害およびコミュニケーション障害、脊髄性筋萎縮症、球脊髄性筋萎縮症、脊髄小脳変性症、ストラドウィック型脊椎骨端骨幹端異形成、先天性脊椎骨端骨幹端異形成、スティックラー症候群、スティックラー症候群COL2A1、テイ・サックス病、テトラヒドロビオプテリン欠損症、致死性骨異形成、糖尿病および感音難聴を伴うチアミン反応性巨赤芽球性貧血、甲状腺疾患、トゥレット症候群、トリーチャー・コリンズ症候群、トリプルX症候群、結節性硬化症、ターナー症候群、アッシャー症候群、異型ポルフィリン症、フォンヒッペル・リンダウ病、ワールデンブルグ症候群、ワイセンバッハー・ツウェイミュラー(Weissenbacher-Zweymuller)症候群、ウイルソン病、ウォルフ・ヒルシュホーン症候群、色素性乾皮症、X連鎖重症複合免疫不全、X連鎖鉄芽球性貧血、ならびにX連鎖球脊髄性筋萎縮症が含まれるが、これらに限定されない。
【0054】
一つの態様において、本発明の方法およびアルゴリズムは、甲状腺癌を診断し、特徴決定し、かつモニタリングするために使用される。本発明のアルゴリズムおよび方法を使用して診断され、特徴決定され、かつ/またはモニタリングされ得るその他の型の癌には、副腎皮質癌、肛門癌、再生不良性貧血、胆管癌、膀胱癌、骨癌、骨転移、中枢神経系(CNS)癌、末梢神経系(PNS)癌、乳癌、キャッスルマン病、子宮頸癌、小児非ホジキンリンパ腫、結腸直腸癌、子宮内膜癌、食道癌、ユーイング肉腫ファミリー腫瘍(Ewing's family of tumors)(例えば、ユーイング肉腫)、眼癌、胆嚢癌、胃腸カルチノイド腫瘍、胃腸間質腫瘍、妊娠性トロホブラスト疾患、ヘアリーセル白血病、ホジキン病、カポジ肉腫、腎臓癌、喉頭および下咽頭癌、急性リンパ性白血病、急性骨髄性白血病、小児白血病、慢性リンパ性白血病、慢性骨髄性白血病、肝臓癌、肺癌、肺カルチノイド腫瘍、非ホジキンリンパ腫、男性乳癌、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔および副鼻腔癌、鼻咽腔癌、神経芽腫、口腔および中咽頭癌、骨肉腫、卵巣癌、膵臓癌、陰茎癌、下垂体腫瘍、前立腺癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(成人軟部組織癌)、黒色腫皮膚癌、非黒色腫皮膚癌、胃癌、精巣癌、胸腺癌、子宮癌(例えば、子宮肉腫)、膣癌、外陰癌、およびワルデンシュトレームマクログロブリン血症が含まれるが、これらに限定されない。
【0055】
上記に従って、本明細書に開示される1つまたは複数の遺伝子のそのような複数のコピーの存在は、ノーザンブロッティングまたはサザンブロッティングを用いて、およびこの目的のためのプローブを開発するために、本明細書に開示される配列を使用して、判定することができる。そのようなプローブは、DNAもしくはRNAもしくは合成ヌクレオチドまたはそれらの組み合わせから構成されてよく、有利には、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される遺伝子または配列に一致するかまたは相補的であるヌクレオチド残基の連続した一続きからなってよい。そのようなプローブは、最も有用には、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列のうちの1つまたは複数に由来する、少なくとも15残基、好ましくは少なくとも30残基、より好ましくは少なくとも50残基、最も好ましくは少なくとも80残基、および特に少なくとも100残基、さらには200残基の連続した一続きを含む。したがって、単一のプローブが、癌性であるか、癌性であることが疑われるか、または癌性になる素因がある細胞の試料のゲノムに複数回結合し、同じ器官または組織の他の非癌性細胞のゲノムに由来する同様の量のDNAに対する同一プローブの結合が、観察可能なほどに少ない結合をもたらす場合、これは、配列決定されたプローブの由来元の、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列を含むかまたはそれらに対応する遺伝子の複数コピーの存在を示す。
【0056】
1つのそのような態様において、同一器官の正常な細胞および/または組織と比較した発現上昇は、対応するcDNAを作製し、次いで表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される遺伝子配列から開発されたプローブを使用して、得られたDNAを解析するなどして、RNAの転写の相対速度を測定することにより判定される。したがって、癌性であることが疑われる細胞の完全なRNA補完物と共に逆転写酵素を用いて作製されたcDNAのレベルは、対応する量のcDNAを生成するが、次いで、ポリメラーゼ連鎖反応、またはローリングサークル増幅などの他の何らかの手段を用いてこれを増幅して、得られたcDNAの相対レベル、およびそれによって遺伝子発現の相対レベルを測定することができる。
【0057】
発現増加は、本明細書に開示される遺伝子の発現産物に選択的に結合し、それによってその存在を検出する薬剤を用いて判定することもできる。例えば、抗体、おそらくは、蛍光標識または放射標識に結合している抗体のような適切に標識された抗体を、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列を含むポリペプチドのうちの1つに対して作製することができ、該抗体は次いで、本明細書に開示される配列に対応する遺伝子のうちの1つによってコードされるポリペプチドと反応して、これに選択的にまたは特異的に結合することになる。次いで、そのような抗体結合、特に他の非癌性の細胞および組織とは対照的に、癌性と疑われる細胞および組織に由来する試料におけるそのような結合の相対的程度を、本明細書において同定される癌関連遺伝子の発現の程度または過剰発現の尺度として用いることができる。このように、癌性の細胞および組織において過剰発現するとして本明細書において同定される遺伝子は、コピー数の増加に起因して、または過剰転写に起因して、過剰発現し得る。例えば、過剰発現は、遺伝子を活性化し、RNAポリメラーゼの反復結合をもたらす転写因子が過剰産生され、それによって正常よりも多い量のRNA転写産物が生成され、その後これが、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定されるアミノ酸配列を含むポリペプチドなどのポリペプチドへと翻訳されることに起因する。そのような解析は、本発明に従って同定される遺伝子の発現を確認し、それによって、被検患者に由来する試料における癌性状態の存在、該患者における後に癌を発症する素因の存在を判定する付加的な手段を提供する。
【0058】
本発明の方法の使用において、癌性状態を示す遺伝子発現が、癌性であることが見出されたすべての細胞に特有である必要はないことに留意されたい。したがって、本明細書に開示される方法は、一部の細胞が過剰発現の完全なパターンを示す組織において、癌性状態の存在を検出するのに有用である。例えば、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列のうちの少なくとも1つとストリンジェントな条件下で相同であるか、または少なくとも90%、好ましくは95%同一である配列を含む選択された遺伝子のセットが、腫瘍性組織または悪性組織の試料に由来する細胞の60%程度の少ない細胞に存在し、対応する非癌性組織またはさもなくば正常組織に由来する細胞の60%程度の多くの細胞には存在しない(したがって、そのような正常組織細胞の40%程度の多くの細胞に存在する)ことが、DNAまたはRNAのいずれかである適切なプローブを使用して見出され得る。1つの態様において、そのような遺伝子パターンは、癌性組織から採取された細胞の少なくとも70%に存在し、対応する正常非癌性組織試料の少なくとも70%に存在しないことが見出される。別の態様において、そのような遺伝子パターンは、癌性組織から採取された細胞の少なくとも80%に存在し、対応する正常非癌性組織試料の少なくとも80%に存在しないことが見出される。別の態様において、そのような遺伝子パターンは、癌性組織から採取された細胞の少なくとも90%に存在し、対応する正常非癌性組織試料の少なくとも90%に存在しないことが見出される。別の態様において、そのような遺伝子パターンは、癌性組織から採取された細胞の少なくとも100%に存在し、対応する正常非癌性組織試料の少なくとも100%に存在しないことが見出されるが、後者の態様は稀にしか起こらない可能性がある。
【0059】
甲状腺新生物を検出する方法
本発明の方法は、分子プロファイリングを用いることにより、対象の疾患または状態の診断を提供する。場合によっては、本発明の方法は、例えば細胞学的解析または免疫組織化学的検査などの、当技術分野で公知の他の方法と組み合わせて分子プロファイリングを用いることにより、対象の疾患または状態の診断を提供する。本明細書で用いられる対象という用語は、ヒト、非ヒト霊長類、げっ歯類、イヌ、ブタ等を含むがこれらに限定されない任意の動物(例えば、哺乳動物)を指す。対象は疾患または状態を自覚している場合もあれば、または自覚していない場合もある。
【0060】
いくつかの態様において、分子プロファイリングは、核酸(DNAまたはRNA)、タンパク質、またはそれらの組み合わせの検出、解析、または定量化を含む。本発明の方法によって診断される疾患または状態には、例えば、皮膚、心臓、肺、腎臓、乳房、膵臓、肝臓、筋肉、平滑筋、膀胱、胆嚢、結腸、腸、脳、食道、または前立腺を含むがこれらに限定されない、対象の1つまたは複数の組織における異常増殖の状態が含まれる。いくつかの態様において、本発明の方法によって解析される組織には、甲状腺組織が含まれる。
【0061】
生物学的試料を、DNAまたはRNAのような核酸を抽出するために処理することができる。核酸を、ハイブリダイゼーションを可能にする条件の下で、本発明のプローブのアレイと接触させることができる。ハイブリダイゼーションの程度は、当技術分野において公知の多数の方法を使用して、定量的にアッセイされ得る。いくつかの場合において、あるプローブ位置におけるハイブリダイゼーションの程度は、アッセイ法により提供されるシグナルの強度に関連し、従って、試料中に存在する相補的な核酸配列の量と関連している可能性がある。発現された遺伝子、エキソン、イントロン、およびmiRNAを含むヒトゲノムまたはトランスクリプトームの全体で、プローブからのアレイ強度データを抽出し、ノーマライズし、サマライズし、分析するためには、ソフトウェアを使用することができる。いくつかの態様において、差次的な発現が試料中で起こっているか否かを判定するため、良性または悪性いずれかの試料における所定のプローブの強度を、参照セットと比較してもよい。発現された配列に対応するアレイ上のマーカー位置における相対強度の増加または減少は、対応する発現された配列の発現の増加または減少をそれぞれ示す。あるいは、相対強度の減少は、発現された配列の変異を示す場合がある。
【0062】
各試料についてもたらされた強度値は、データの固有の特性を見ることによりフィーチャーの関連を査定するフィルター技術、フィーチャーサブセット検索にモデル仮説を埋め込むラッパー(wrapper)法、および最適のフィーチャーセットについての検索が分類アルゴリズムへと組み立てられる組み込み(embedded)技術を含む、フィーチャー選択技術を使用して分析され得る。
【0063】
本発明の方法において有用なフィルター技術には、(1)二標本t検定、ANOVA分析、ベイズフレームワーク、およびγ分布モデルの使用のようなパラメトリック法、(2)ウィスコクスンの順位和検定、級間・級内平方和検定(between-within class sum of squares tests)、順位積(rank products)法、ランダム順列(random permutation)法、または2つのデータセット間の発現の変化倍率について閾値を設計し、次いで、誤分類の数を最小化する各遺伝子における閾値を検出することを含むTNoMの使用のようなモデルフリーの方法、ならびに(3)二変量法、相関に基づくフィーチャー選択(correlation based feature selection)法(CFS)、最小重複性最大関連性(minimum redundancy maximum relavance)法(MRMR)、マルコフブランケット(Markov blanket)フィルター法、および非相関収縮重心(uncorrelated shrunken centroid)法のような多変量法が含まれる。本発明の方法において有用なラッパー法には、逐次検索(sequential search)法、遺伝的アルゴリズム、および分布推定(estimation of distribution)アルゴリズムが含まれる。本発明の方法において有用な組み込み法には、ランダムフォレスト(random forest)アルゴリズム、サポートベクターマシン重みベクター(weight vector of support vector machine)アルゴリズム、およびロジスティック回帰重み(weights of logistic regression)アルゴリズムが含まれる。Bioinformatics. 2007 Oct 1; 23(19):2507-17は、強度データの分析のための前掲のフィルター技術の相対的な長所の概要を提供している。
【0064】
次いで、選択されたフィーチャーは、分類アルゴリズムを使用して分類され得る。例示的なアルゴリズムには、主成分分析アルゴリズム、部分最小二乗法、および独立成分分析アルゴリズムのような変数の数を低下させる方法が含まれるが、これらに限定されない。例示的なアルゴリズムには、統計的方法および機械学習技術に基づく方法のような多数の変数を直接扱う方法が含まれるが、これらに限定されない。統計的方法には、罰則付き(penalized)ロジスティック回帰、マイクロアレイ予測分析(prediction analysis of microarrays)(PAM)、収縮重心に基づく方法、サポートベクターマシン分析、および正則化線形判別分析(regularized linear discriminant analysis)が含まれる。機械学習技術には、バギング(bagging)法、ブースティング(boosting)法、ランダムフォレストアルゴリズム、およびそれらの組み合わせが含まれる。Cancer Inform. 2008; 6: 77-97は、マイクロアレイ強度データの分析のための前掲の分類技術の概要を提供している。
【0065】
本発明のマーカーおよび遺伝子は、細胞または組織の癌性状態または非癌性状態を特徴決定するために使用され得る。本発明は、対象の甲状腺試料における、表1、3、4、5、6、または8、またはリスト1〜45にリスト化されたマーカーまたは遺伝子の差次的な発現を測定する工程を含む、悪性の組織または細胞から良性の組織または細胞を診断する方法を含む。本発明は、対象の甲状腺試料における、マーカーまたは遺伝子の差次的な発現を測定することを含む、甲状腺髄様癌を診断する方法も含む。本発明は、対象の甲状腺試料における、マーカーまたは遺伝子の差次的な発現を測定する工程を含む、甲状腺病態の亜型を診断する方法も含む。
【0066】
いくつかの態様において、本発明の方法により診断される疾患または状態には、癌、過形成、または新生物を含むが、これらに限定されない、良性および悪性の過剰増殖性障害が含まれる。いくつかの場合において、本発明の方法により診断される過剰増殖性障害には、乳腺の管組織における腺管癌、髄様癌、膠様癌、管状癌、および炎症性乳癌のような乳癌;卵巣における腺癌のような卵巣上皮腫瘍、および卵巣から腹腔へ移動した腺癌を含む卵巣癌;子宮癌;扁平上皮癌および腺癌を含む子宮頚部上皮における腺癌のような子宮頸癌;腺癌または骨へ移動した腺癌から選択される前立腺癌のよう前立腺癌;膵管組織における類上皮細胞癌および膵管における腺癌のような膵臓癌;膀胱における移行上皮癌、尿路上皮癌(移行上皮癌)、膀胱を裏打ちする尿路上皮細胞における腫瘍、扁平上皮癌、腺癌、および小細胞癌のような膀胱癌;急性骨髄性白血病(AML)、急性リンパ性白血病、慢性リンパ性白血病、慢性骨髄性白血病、ヘアリーセル白血病、脊髄形成異常症、骨髄増殖性障害、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、肥満細胞症、慢性リンパ性白血病(CLL)、多発性骨髄腫(MM)、および骨髄異形成症候群(MDS)のような白血病;骨癌;扁平上皮癌、腺癌、および大細胞未分化癌に分けられる非小細胞肺癌(NSCLC)ならびに小細胞肺癌のような肺癌;基底細胞癌、黒色腫、扁平上皮癌、および扁平上皮癌へと進展することもある皮膚状態である日光角化症のような皮膚癌;眼網膜芽細胞腫;皮膚黒色腫または眼球内(眼)黒色腫;原発性肝臓癌(肝臓において発生する癌);腎臓癌;びまん性大細胞型B細胞リンパ腫、B細胞免疫芽球性リンパ腫、および小型非切れ込み核細胞性リンパ腫のようなエイズ関連リンパ腫;カポジ肉腫;B型肝炎ウイルス(HBV)、C型肝炎ウイルス(HCV)、および肝細胞癌を含むウイルスにより誘導される癌;ヒトリンパ球向性ウイルス1型(HTLV-1)および成人T細胞白血病/リンパ腫;およびヒトパピローマウイルス(HPV)により誘導される子宮頸癌を含む、ウイルスにより誘導される癌;神経膠腫(星状細胞腫、未分化星状細胞腫、または多形神経膠芽腫)、乏突起細胞腫、上衣細胞腫、髄膜腫、リンパ腫、シュワン腫、および髄芽腫を含む原発性脳腫瘍のような中枢神経系癌(CNS);聴神経腫瘍、ならびに神経繊維腫およびシュワン腫を含む悪性末梢神経鞘腫瘍(MPNST)、悪性線維性細胞腫、悪性線維性組織球腫、悪性髄膜腫、悪性中皮腫、ならびに悪性ミュラー管混合腫瘍のような末梢神経系(PNS)癌;下咽頭癌、喉頭癌、上咽頭癌、および中咽頭癌のような口腔および中咽頭の癌;リンパ腫、胃間質腫瘍、およびカルチノイド腫瘍のような胃癌;精上皮腫および非精巣上皮腫を含む胚細胞性腫瘍(GCT)、ならびにライディッヒ細胞腫瘍およびセルトリ細胞腫瘍を含む性腺間質腫瘍のような精巣癌;胸腺腫、胸腺癌、ホジキン病、非ホジキンリンパ腫カルチノイド、またはカルチノイド腫瘍のような胸腺癌;直腸癌;ならびに結腸癌が含まれるが、これらに限定されない。いくつかの場合において、本発明の方法により診断される疾患または状態には、例えば、濾胞性腺腫、ハースル細胞腺腫、リンパ性甲状腺炎、および甲状腺過形成を含むが、これらに限定されない、良性甲状腺障害のような甲状腺障害が含まれるが、これらに限定されない。いくつかの場合において、本発明の方法により診断される疾患または状態には、例えば、濾胞癌、濾胞型甲状腺乳頭癌、髄様癌、および乳頭癌のような悪性甲状腺障害が含まれるが、これらに限定されない。いくつかの場合において、本発明の方法は、疾患を有するかそれとも正常であるかの組織の診断を提供する。他の場合において、本発明の方法は、正常、良性、または悪性の診断を提供する。いくつかの場合において、本発明の方法は、良性/正常または悪性の診断を提供する。いくつかの場合において、本発明の方法は、本明細書に提供される特定の疾患または状態のうちの一つまたは複数の診断を提供する。
【0067】
I. 生物学的試料の入手
いくつかの態様において、本発明の方法は、対象から試料を得ることを提供する。本明細書において使用されるように、対象という用語は、ヒト、非ヒト霊長類、げっ歯類、イヌ、ブタ等を含むが、これらに限定されない、任意の動物(例えば、哺乳類)をさす。本明細書に提供される得る方法には、細針吸引、コア針生検、吸引生検、切開生検、切除生検、パンチ生検、薄片生検、または皮膚生検を含む生検法が含まれる。試料は、皮膚、心臓、肺、腎臓、乳房、膵臓、肝臓、筋肉、平滑筋、膀胱、胆嚢、結腸、腸、脳、前立腺、食道、または甲状腺を含むが、これらに限定されない、本明細書に提供される組織のいずれかから得られ得る。あるいは、試料は、血液、汗、毛包、頬組織、涙、月経、便、または唾液を含むが、これらに限定されない、その他の起源から得られてもよい。本発明のいくつかの態様において、医療従事者が、試験のために生物学的試料を得てもよい。
【0068】
試料は、本明細書に提供される生検法、拭き取り、擦過、静脈切開のような当技術分野において公知の方法、または当技術分野において公知のその他の任意の方法により得られ得る。いくつかの場合において、試料は、本発明のキットの構成要素を使用して、得られるか、保管されるか、または輸送され得る。いくつかの場合において、複数の甲状腺試料のような複数の試料が、本発明の方法による診断のために得られ得る。いくつかの場合において、一つの組織型(例えば、甲状腺)からの一つまたは複数の試料、および別の組織(例えば、頬)からの一つまたは複数の試料、のような複数の試料が、本発明の方法による診断のために得られ得る。いくつかの場合において、一つの組織型(例えば、甲状腺)からの一つまたは複数の試料、および別の組織(例えば、頬)からの一つまたは複数の試料、のような複数の試料は、同一の時点でまたは異なる時点で得られてもよい。いくつかの場合において、異なる時点で得られた試料は、異なる方法により分析されかつ/または保管されてもよい。例えば、試料は、細胞学的分析(ルーチンの染色)により得られ分析され得る。いくつかの場合において、さらなる試料が、細胞学的分析の結果に基づき、対象から得らされてもよい。癌の診断には、医師、看護師、またはその他の医療従事者による対象の検査が含まれ得る。検査は、ルーチンの検査の一部であってもよいし、または、検査は、以下のうちの一つを含むが、これらに限定されない、特定の愁訴によるものであってもよい:疼痛、疾病、疾病の予想、疑わしいしこりもしくは腫瘤の存在、疾患、または状態。対象は、疾患または状態に気づいていてもよいし、または気づいていなくてもよい。医療従事者が、試験のために生物学的試料を得てもよい。いくつかの場合において、医療従事者は、生物学的試料の寄託のために対象を試験施設または検査室に照会させてもよい。
【0069】
場合によっては、医療従事者は、生体試料の寄託のために、対象を試験センターまたは検査室に照会することができる。他の場合には、対象が試料を提供してもよい。場合によっては、本発明の分子プロファイリングビジネスが試料を得てもよい。試料は、本明細書に提供される生検法、拭き取り、擦過、静脈切開などの当技術分野において公知の方法、または当技術分野において公知の任意の他の方法により得ることができる。場合によっては、試料は、本発明のキットの成分を用いて得る、保存する、または輸送することができる。場合によっては、本発明の方法による診断のために、複数の甲状腺試料などの複数の試料を得ることができる。場合によっては、本発明の方法による診断のために、1つの組織型(例えば、甲状腺)からの1つまたは複数の試料、および別の組織(例えば、頬側)からの1つまたは複数の試料などといった複数の試料を得ることができる。場合によっては、1つの組織型(例えば、甲状腺)からの1つまたは複数の試料、および別の組織(例えば、頬側)からの1つまたは複数の試料などといった複数の試料は、同時に得ることもできるし、または異なる時点で得ることもできる。場合によっては、異なる時点で得られた試料は、異なる方法により保存および/または解析される。例えば、試料を得て、細胞学的解析(ルーチンの染色)により解析することができる。場合によっては、細胞学的解析の結果に基づき、さらなる試料を対象から得てもよい。
【0070】
いくつかの場合において、対象は、さらなる診断のために、腫瘍学者、外科医、または内分泌学者のような専門医に照会させられ得る。専門医は、同様に、試験のために生物学的試料を得てもよいし、または生物学的試料の寄託のために個体を試験施設もしくは検査室に照会させてもよい。いずれの場合にも、生物学的試料は、医師、看護師、または医療技術者、内分泌学者、細胞学者、採血者、放射線技師、もしくは呼吸器科医のようなその他の医療従事者により得られ得る。医療従事者が、試料に対して実行する適切な試験もしくはアッセイ法を示してもよいし、または、本開示の分子プロファイリングビジネスが、どのアッセイ法もしくは試験が最も適切に示されるかに関して助言してもよい。分子プロファイリングビジネスは、助言事業、試料の取得およびもしくは保管、材料、または与えられた全ての製品およびサービスについて、個体または医療提供者または保険提供者に代金を請求することができる。
【0071】
本発明のいくつかの態様において、医療従事者は、初期診断または試料取得に関与していなくてもよい。あるいは、個体が、店頭販売のキットの使用を通して試料を得てもよい。キットは、本明細書に記載されるような試料を得るための手段、検査のために試料を保管するための手段、およびキットの適正使用のための説明書を含有し得る。いくつかの場合において、分子プロファイリングサービスが、キットの購入価格に含まれていてもよい。他の場合において、分子プロファイリングサービスは別料金である。
【0072】
分子プロファイリングビジネスが使用するために適している試料は、試験される個体の組織、細胞、核酸、遺伝子、遺伝子断片、発現産物、遺伝子発現産物、または遺伝子発現産物断片を含有している任意の材料であり得る。試料の適応性および/または妥当性を判定する方法が提供される。試料には、個体の組織、細胞または細胞に由来するもしくは細胞から得られる生物学的材料が含まれ得るが、これらに限定されない。試料は、細胞または組織の不均一集団または均一集団であり得る。生物学的試料は、本明細書に記載された分析法に適している試料を提供することができる、当技術分野において公知の任意の方法を使用して得られ得る。
【0073】
試料は、皮膚または頚部の擦過、頬の拭き取り、唾液収集、尿収集、便収集、月経、涙、または精液の収集を含むが、これらに限定されない、非侵襲的な方法により得られ得る。他の場合において、試料は、生検、肺胞もしくは肺の洗浄、針吸引、または静脈切開を含むが、これらに限定されない、侵襲的な手法により得られる。針吸引の方法には、さらに、細針吸引、コア針生検、吸引生検、またはラージコア(large core)生検が含まれ得る。いくつかの態様において、十分な量の生物学的材料を確実にするために、複数の試料が本明細書中の方法により得られてもよい。適当な甲状腺の試料を得る方法は、当技術分野において公知であり、さらに、参照によりその全体が本明細書に組み入れられるATA Guidelines for thryoid nodule management(Cooper et al. Thyroid Vol. 16 No. 2 2006)に記載されている。生物学的試料を得るための一般的な方法も、当技術分野において公知であり、さらに、例えば、参照によりその全体が本明細書に組み入れられるRamzy, Ibrahim Clinical Cytopathology and Aspiration Biopsy 2001に記載されている。一つの態様において、試料は、甲状腺結節または推測される甲状腺腫瘍の細針吸引液である。いくつかの場合において、細針吸引液の採取法は、超音波、X線、またはその他の画像化装置の使用によるガイド下でなされてもよい。
【0074】
本発明のいくつかの態様において、分子プロファイリングビジネスは、対象から直接、医療従事者から、第三者から、または分子プロファイリングビジネスもしくは第三者により提供されたキットから、生物学的試料を得ることができる。いくつかの場合において、生物学的試料は、対象、医療従事者、または第三者が生物学的試料を取得し、分子プロファイリングビジネスへと送付した後、分子プロファイリングビジネスにより得られてもよい。いくつかの場合において、分子プロファイリングビジネスは、生物学的試料の保管および分子プロファイリングビジネスへの輸送のための適当な容器および賦形剤を提供してもよい。
【0075】
II. 試料の保管
いくつかの態様において、本発明の方法は、試料が得られた後、試料が本発明の一つまたは複数の方法により分析される前に、数秒、数分、数時間、数日、数週間、数ヶ月、数年、またはそれ以上のような時間、試料を保管することを提供する。いくつかの場合において、試料の異なる一部分が、保管、細胞学的分析、妥当性試験、核酸抽出、分子プロファイリング、またはそれらの組み合わせを含むが、これらに限定されない、異なる下流の方法または過程を受けるよう、対象から得られた試料は、保管またはさらなる分析の工程の前に細分される。
【0076】
いくつかの場合において、試料の一部分は保管され、試料の別の一部分はさらに操作されてもよい。そのような操作には、分子プロファイリング;細胞学的染色;遺伝子または遺伝子発現産物(RNAもしくはタンパク質)の抽出、検出、または定量化;固定;および検査が含まれ得るが、これらに限定されない。他の場合において、試料は、得られ、保管され、保管工程後に、試料の異なる一部分が、保管、細胞学的分析、妥当性試験、核酸抽出、分子プロファイリング、またはそれらの組み合わせを含むが、これらに限定されない、異なる下流の方法または過程を受けるよう、さらなる分析のために細分される。いくつかの場合において、試料は、得られ、例えば、細胞学的分析により分析され、もたらされた試料材料が、本発明の一つまたは複数の分子プロファイリング法によりさらに分析される。そのような場合、試料は、細胞学的分析工程と分子プロファイリング工程との間、保管されてもよい。試料は、取得後、輸送を容易にするか、またはその他の分析の結果を待つために保管されてもよい。別の態様において、試料は、医師またはその他の医療従事者からの説明を待つ間、保管されてもよい。
【0077】
取得された試料は、短期または長期の保管のため、適当な培地中、賦形剤中、溶液中、または容器中に置かれ得る。保管は、冷蔵または冷凍の環境において試料を維持することを必要とするか場合がある。試料は、冷凍環境において保管前に急速に凍結させられ得る。凍結試料は、グリセロール、エチレングリコール、ショ糖、またはグルコースを含むが、これらに限定されない、適当な低温保存培地または化合物と接触させられ得る。適当な培地、賦形剤、または溶液には、ハンクス塩溶液、生理食塩水、細胞増殖培地、硫酸アンモニウムもしくはリン酸アンモニウムのようなアンモニウム塩溶液、または水が含まれるが、これらに限定されない。アンモニウム塩の適当な濃度には、約0.1g/ml、0.2g/ml、0.3g/ml、0.4g/ml、0.5g/ml、0.6g/ml、0.7g/ml、0.8g/ml、0.9g/ml、1.0g/ml、1.1g/ml、1.2g/ml、1.3g/ml、1.4g/ml、1.5g/ml、1.6g/ml、1.7g/ml、1.8g/ml、1.9g/ml、2.0g/ml、2.2g/ml、2.3g/ml、2.5g/ml、またはそれ以上の溶液が含まれる。培地、賦形剤、または溶液は、無菌であってもよいし、または無菌でなくてもよい。
【0078】
試料は、例えば、0C、-1C、-2C、-3C、-4C、-5C、-6C、-7C、-8C、-9C、-10C、-12C、-14C、-15C、-16C、-20C、-22C、-25C、-28C、-30C、-35C、-40C、-45C、-50C、-60C、-70C、-80C、-100C、-120C、-140C、-180C、-190C、または約-200Cを含む、室温、または冷温(例えば、約20℃〜約0℃)もしくは冷凍温度のような低温で保管され得る。いくつかの場合において、試料は、冷蔵装置内で、氷もしくは凍結ゲルパック上で、冷凍装置内で、低温貯蔵装置内で、ドライアイス上で、液体窒素中で、または液体窒素で平衡化された蒸気相で保管され得る。
【0079】
培地、賦形剤、または溶液は、後の診断もしくは操作のための妥当な状態に試料を維持するため、または凝固を防止するため、保存剤を含有していてもよい。保存剤には、クエン酸、エチレンジアミン四酢酸、アジ化ナトリウム、またはチメロサールが含まれ得る。試料は、グルタルアルデヒド、ホルムアルデヒド、またはメタノールの使用のような、当技術分野において公知の任意の方法により、保管前または保管中に固定されてもよい。試料容器は、カップ、蓋付きカップ、チューブ、無菌チューブ、真空チューブ、注射器、ボトル、顕微鏡用スライド、またはその他の適当な容器を含むが、これらに限定されない、生物学的試料の保管およびまたは輸送のために適している任意の容器であり得る。容器は、無菌であってもよいし、または無菌でなくてもよい。いくつかの場合において、試料は、例えばCytyc ThinPrep、SurePath、またはMonoprepであるがこれらに限定されない、後の細胞学的分析のための細胞の保管のために適している商業的な調製物の中に保管されてもよい。
【0080】
試料容器は、カップ、蓋付きカップ、チューブ、無菌チューブ、真空チューブ、注射器、ボトル、顕微鏡用スライド、またはその他の適当な容器を含むが、これらに限定されない、生物学的試料の保管およびまたは輸送のために適している任意の容器であり得る。容器は、無菌であってもよいし、または無菌でなくてもよい。
【0081】
III. 試料の輸送
本発明の方法は、試料の輸送を提供する。いくつかの場合において、試料は、診療所、病院、医院、またはその他の位置から第二の位置へ輸送され、そこで、試料は、保管され、かつ/または、例えば、細胞学的分析もしくは分子プロファイリングにより分析され得る。いくつかの場合において、試料は、本明細書に記載された分析を実施するため、分子プロファイリング企業へ輸送されてもよい。他の場合において、試料は、臨床検査室改善法(Clinical Laboratory Improvement Amendments)(CLIA)検査室のような、認可された検査室、または本発明の方法を実施することができる検査室のような検査室へ輸送されてもよい。試料は、試料が由来する個体により輸送されてもよい。個体による輸送には、個体が分子プロファイリングビジネスまたは指定された試料受容所を訪れ、試料を提供することが含まれ得る。試料の提供は、本明細書に記載された試料取得の技術のいずれかを含んでもよいか、または、試料は、既に取得され、本明細書に記載されるような適当な容器で保管されていてもよい。他の場合において、試料は、宅配便、郵便、海運、または適当な様式で試料を輸送することができる任意の方法を使用して、分子プロファイリングビジネスへ輸送され得る。いくつかの場合において、試料は、第三者試験検査室(例えば、細胞診検査室)により、分子プロファイリングビジネスへ提供されてもよい。他の場合において、試料は、対象のプライマリケア医、内分泌学者、またはその他の医療従事者により、分子プロファイリングビジネスへ提供されてもよい。輸送費用は、個体、医療提供者、または保険提供者へ請求され得る。分子プロファイリングビジネスは、受け取り後、直ちに試料の分析を開始してもよいし、または本明細書に記載された任意の様式で試料を保管してもよい。保管の方法は、分子プロファイリングビジネスが試料を受け取る前に選ばれたものと同一であってもよいしまたは同一でなくてもよい。
【0082】
試料は、低温保存培地または液状化細胞診調製物のような、試料の保管のために適している、本明細書に提供される任意の培地または賦形剤を含む、任意の培地または賦形剤で輸送され得る。いくつかの場合において、試料は、本明細書に提供される適当な試料保管温度のいずれかで、冷凍輸送または冷蔵輸送されてもよい。
【0083】
分子プロファイリングビジネス、その代理人もしくはライセンシー、医療従事者、研究者、または第三者検査室もしくは試験施設(例えば、細胞診検査室)による試料の受け取り後、試料は、細胞学的アッセイ法およびゲノム分析のような当技術分野において公知の多様なルーチンの分析を使用してアッセイされ得る。そのような試験は、癌、癌の型、その他の疾患もしくは状態、疾患マーカーの存在、または癌、疾患、状態、もしくは疾患マーカーの欠如を示し得る。試験は、下記のような顕微鏡検査を含む細胞学的調査の形態をとり得る。試験は、一つまたは複数の細胞学的染色の使用を含み得る。生物学的材料は、生物学的試料の調製のための当技術分野において公知の適当な方法により、試験の投与前に、試験のために操作または調製され得る。実施される特定のアッセイ法は、分子プロファイリング企業、試験を注文した医師、または助言医療従事者、細胞診検査室、試料が由来する対象、もしくは保険提供者のような第三者により決定され得る。特定のアッセイ法は、確定診断が得られる可能性、アッセイ法のコスト、アッセイ法のスピード、または提供された材料の型へのアッセイ法の適応性に基づき、選ばれ得る。
【0084】
IV. 妥当性についての試験
試料取得の後または間、例えば、試料を保管する工程の前または後、生物学的材料は、例えば、本発明の方法および組成物において使用するための試料の適応性を査定するため、収集され、妥当性について査定され得る。査定は、試料を得る個体、分子プロファイリングビジネス、キットを使用する個体、または細胞診検査室、病理学者、内分泌学者、もしくは研究者のような第三者により実施され得る。試料は、以下のものを含むが、これらに限定されない、多くの因子により、さらなる分析のために妥当であるかまたは妥当でないと判定され得る:不十分な細胞、不十分な遺伝材料、不十分なタンパク質、DNA、もしくはRNA、必要とされる試験にとって不適切な細胞、または必要とされる試験にとって不適切な材料、試料の古さ、試料が得られた様式、または試料が保管もしくは輸送された様式。妥当性は、細胞染色法、細胞数もしくは組織量の測定、全タンパク質の測定、核酸の測定、視覚的検査、顕微鏡検査、または温度もしくはpHの測定のような、当技術分野において公知の多様な方法を使用して判定され得る。一つの態様において、試料妥当性は、遺伝子発現産物レベル分析実験を実施した結果から判定されると考えられる。別の態様において、試料妥当性は、試料妥当性のマーカーの含量を測定することにより判定されると考えられる。そのようなマーカーには、ヨウ素、カルシウム、マグネシウム、リン、炭素、窒素、硫黄、鉄等のような元素;例えばチログロブリンであるがこれに限定されない、タンパク質;細胞量;およびタンパク質、核酸、脂質、または炭水化物のような細胞成分が含まれる。
【0085】
いくつかの場合において、ヨウ素は、参照によりその全体が本明細書に組み入れられる米国特許第3645691号に記載されたような化学的方法、またはヨウ素含量を測定するための当技術分野において公知のその他の化学的方法により測定され得る。ヨウ素測定のための化学的方法には、SandellおよびKolthoffの反応に基づく方法が含まれるが、これらに限定されない。反応は以下の式に従って進行する。
2 Ce4++As3+→2 Ce3++As5++I
【0086】
ヨウ素は、反応の課程で触媒効果を有する、即ち、分析される調製物中に存在するヨウ素が多いほど、速く反応が進行する。反応のスピードは、ヨウ素濃度に比例する。いくつかの場合において、この分析法は、以下の様式で実施され得る。
【0087】
予め測定された量の酸化ヒ素As2O3の濃硫酸溶液または濃硝酸溶液を、生物学的試料に添加し、混合物の温度を、反応温度、即ち、通常20℃〜60℃の温度に調整する。予め測定された量の硫酸セリウム(IV)の硫酸溶液または硝酸溶液を、そこに添加する。その後、混合物を、一定時間、予め測定された温度で反応させる。反応時間は、測定されるヨウ素の量の桁、およびそれぞれの選択された反応温度によって選択される。反応時間は、通常、約1分〜約40分である。その後、セリウム(IV)イオンの試験溶液の含量を、測光法により測定する。測光法により測定されたセリウム(IV)イオン濃度が低いほど、反応スピードが高く、従って、触媒剤、即ち、ヨウ素の量が多い。このようにして、試料のヨウ素を、直接かつ定量的に測定することができる。
【0088】
他の場合において、例えば、123I、124I、125I、および131Iのようなヨウ素の特定の同位体を検出することによっても、甲状腺組織の試料のヨウ素含量を測定することができる。さらに他の場合において、マーカーは、炭素、窒素、硫黄、酸素、鉄、リン、または水素の同位体のような別の放射性同位体であってもよい。いくつかの例において、試料収集より前に、放射性同位体を投与することができる。妥当性試験のために適している放射性同位体投与の方法は、当技術分野において周知であり、静脈もしくは動脈への注射、または摂取を含む。同位体の一部を甲状腺組織へと吸収させるための、同位体の投与と甲状腺結節試料の取得との間の適当な期間は、約1分、2分、5分、10分、15分、30分、1時間、8時間、12時間、24時間、48時間、72時間、または約1週間、1.5週間、もしくは2週間を含む、約1分〜数日または約1週間の期間を含み得、当業者により容易に決定され得る。あるいは、ヨウ素、カルシウム、マグネシウム、炭素、窒素、硫黄、酸素、鉄、リン、または水素の放射性同位体のような同位体の天然レベルについて、試料を測定してもよい。
【0089】
(i)細胞および/または組織の含量妥当性試験
組織の量を測定する方法には、試料の計量または試料の体積の測定が含まれるが、これらに限定されない。細胞の量を測定する方法には、いくつかの場合において、例えば、トリプシンもしくはコラゲナーゼのような酵素による、または、例えば、組織ホモジナイザーの使用のような物理的手段による、脱凝集の後に実施され得る、細胞計数が含まれるが、これらに限定されない。回収された細胞の量を測定するための別の方法には、細胞材料に結合する色素の定量化、または遠心分離後に得られた細胞ペレットの体積の測定が含まれるが、これらに限定されない。妥当な数の特定の型の細胞が存在することを判定する方法には、PCR、Q-PCR、RT-PCR、免疫組織化学的分析、細胞学的分析、顕微鏡的分析、およびまたは視覚的分析が含まれる。
【0090】
(ii)核酸含量妥当性試験
当技術分野において公知の多様な方法を使用して、生物学的試料からの抽出後に核酸含量を測定することにより、試料を分析することができる。いくつかの場合において、RNAまたはmRNAが、核酸含量分析前に他の核酸から抽出される。核酸含量は、抽出され、精製され、分光光度計を使用して、260ナノメートルにおける吸光度を含むが、これに限定されない、紫外吸光度により測定され得る。他の場合において、核酸の含量または妥当性は、試料を染色剤と接触させた後、蛍光光度計により測定され得る。さらに他の場合において、核酸の含量または妥当性は、電気泳動後に、または、例えば、agilentバイオアナライザーのような装置を使用して、測定され得る。本発明の方法は、核酸の含量およびまたは完全性を測定するための特定の方法に限定されないことが理解される。
【0091】
いくつかの態様において、所定の試料からのRNAの量または収量は、ナノグラム〜マイクログラムの範囲で、NanoDrop分光光度計を使用して、精製の直後に測定される。いくつかの態様において、RNA品質は、Agilent 2100 Bioanalyzer装置を使用して測定され、計算されたRNAインテグリティナンバー(Integrity Number)(RIN、1〜10)により特徴決定される。NanoDropはキュベットなしの分光光度計である。それは、試料1μl当たり5ng〜3,000ngを測定するために1マイクロリットルを使用する。NanoDropの重大な特色には、低い試料の容量、キュベットがない点;5ng/μl〜3,000ng/μlという大きなダイナミックレンジ;DNA、RNA、およびタンパク質の定量化を可能にする点が含まれる。NanoDrop(商標)2000cは、キュベットまたはキャピラリーの必要なしに、0.5μl〜2.0μlの試料の分析を可能にする。
【0092】
RNA品質は、計算されたRNAインテグリティナンバー(RIN)により測定され得る。RNAインテグリティナンバー(RIN)とは、RNA測定値に完全性の値を割り当てるためのアルゴリズムである。RNAの完全性は、遺伝子発現研究のための主要な問題であり、伝統的には、28S rRNAと18S rRNAとの比を使用して評価されているが、この方法には一貫性がないことが示されている。RINアルゴリズムは、電気泳動によるRNA測定に適用され、よりロバスト(robust)な普遍的な測定値を提供するための、RNA完全性に関する情報に寄与する異なる特色の組み合わせに基づく。いくつかの態様において、RNA品質は、Agilent 2100 Bioanalyzer装置を使用して測定される。RNA品質を測定するためのプロトコルは、公知であり、例えば、Agilentウェブサイトで、商業的に入手可能である。簡単に説明すると、第一工程で、研究者がRNA Nano LabChipへ全RNA試料を委託する。第二工程で、LabChipがAgilentバイオアナライザーに挿入され、分析が実行され、ディジタル電気泳動図が生成される。次いで、第三工程で、新たなRINアルゴリズムが、試料の完全性を判定するため、分解産物の存在または欠如を含む、RNA試料の電気泳動記録の全体を分析する。次いで、アルゴリズムは、レベル10のRNAが完璧に完全である、1〜10のRINスコアを割り当てる。電気泳動図の解釈が自動的であり、個々の解釈を受けないため、試料の普遍的で公平な比較が可能になり、実験の再現性が改善される。RINアルゴリズムは、主として、ヒト、ラット、およびマウスの組織から得られた真核生物全RNA試料の大きなデータベースと共に、ニューラルネットワークおよび適応的学習(adaptive learning)を使用して開発された。RINの利点には、以下の点が含まれる。RNAの完全性の数的な査定が得られる点;例えば、アーカイブ(archival)の前後で、RNA試料が直接比較される点、異なる検査室間の同一組織の完全性が比較される点;実験の再現性が確実になる点、例えば、RINが所定の値を示し、マイクロアレイ実験のために適している場合、同一の生物/組織/抽出法が使用されるのであれば、同一の値のRINが、常に、類似した実験のために使用され得る(Schroeder A, et al. BMC Molecular Biology 2006, 7:3 (2006))。
【0093】
いくつかの態様において、RNA品質は、10が最高品質である、RIN 1〜10の尺度で測定される。一つの局面において、本発明は、6.0またはそれ未満のRNA RIN値を有する試料からの遺伝子発現を分析する方法を提供する。いくつかの態様において、1.0、2.0、3.0、4.0、5.0、または6.0のRIN数を有するRNAを含有している試料が、本発明の方法およびアルゴリズムを使用して、マイクロアレイ遺伝子発現のために分析される。いくつかの態様において、試料は、甲状腺組織の細針吸引液である。試料は、2.0程度の低いRINで分解されていてもよい。
【0094】
所定の試料における遺伝子発現の測定は、複雑で、動的で、かつ高コストの過程である。RIN≦5.0を有するRNA試料は、典型的には、多重遺伝子マイクロアレイ分析のためには使用されず、その代り、単一遺伝子のRT-PCRアッセイ法および/またはTaqManアッセイ法のためにのみ使用され得る。品質によるRNAの有用性のこの二分は、従来、試料の有用性を制限し、研究努力を妨害してきた。本発明は、低濃度のRNAを含有している試料、例えば、甲状腺FNA試料から、意味のある多重遺伝子発現結果を得るために、低品質RNAが使用され得る方法を提供する。
【0095】
さらに、通常、多重遺伝子発現プロファイリングのためには妥当でないと見なされる、NanoDropによる低くかつ/または測定不能なRNA濃度を有する試料が、本発明の方法およびアルゴリズムを使用すれば、測定され分析され得る。今日、検査室で核酸収量を測定するために使用されている最も高感度の「最先端技術」機器が、NanoDrop分光光度計である。その種類の多くの定量化装置と同様に、NanoDrop測定値の精度は、極めて低いRNA濃度では有意に減少する。マイクロアレイ実験への入力のために必要なRNAの最少量も、所定の試料の有用性を制限する。本発明においては、極少量の核酸を含有している試料が、NanoDrop装置およびBioanalyzer装置の両方からの測定値の組み合わせを使用して推定され得、それにより、多重遺伝子発現アッセイ法および分析のため試料が最適化される。
【0096】
(iii)タンパク質含量妥当性試験
いくつかの場合において、生物学的試料中のタンパク質含量は、以下のものを含むが、これらに限定されない、当技術分野において公知の多様な方法を使用して測定され得る:280ナノメートルにおける紫外吸光度、本明細書に記載されるような細胞染色、または、例えば、クーマシーブルーもしくはビシンコニン酸によるタンパク質染色。いくつかの場合において、タンパク質は、試料の測定前に生物学的試料から抽出される。いくつかの場合において、試料の妥当性についての複数の試験が、並行して、または一つずつ実施されてもよい。いくつかの場合において、試料は、妥当性査定の前、間、または後に、複数の診断試験を実施するため、一定分量へと分割されてもよい。いくつかの場合において、妥当性試験は、さらなる診断試験に適していてもよいし、または適していなくてもよい少量の試料に対して実施される。他の場合において、試料全体が妥当性について査定される。いずれの場合にも、妥当性についての試験の代金は、対象、医療提供者、保険提供者、または政府実体に請求され得る。
【0097】
本発明のいくつかの態様において、試料は収集後すぐにまたは直ちに妥当性について試験され得る。いくつかの場合において、試料妥当性試験が、試料の十分な量または十分な品質を示さない場合には、追加的な試料を採取することができる。
【0098】
V. 分析
試料は、生物学的試料中の細胞の顕微鏡的検査と組み合わせられた細胞染色により分析され得る。細胞染色、または細胞学的調査は、以下のものを含むが、これらに限定されない、当技術分野において公知の多数の方法および適当な試薬により実施され得る:EA染色、ヘマトキシリン染色、サイトステイン(cytostain)、パパニコロウ染色、エオシン、ニッスル染色、トルイジンブルー、銀染色、アゾカルミン染色、ニュートラルレッド、またはヤヌスグリーン。いくつかの場合において、細胞は、染色法の前または間に、例えば、メタノール、エタノール、グルタルアルデヒド、またはホルムアルデヒドにより固定され、かつ/または透過性化される。いくつかの場合において、細胞は固定されない。いくつかの場合において、複数の染色が組み合わせて使用される。他の場合において、染色は全く使用されない。いくつかの場合において、核酸含量の測定は、例えば、臭化エチジウム、ヘマトキシリン、ニッスル染色、または当技術分野において公知の任意の核酸染色による染色法を使用して実施される。
【0099】
本発明のいくつかの態様において、細胞は、細胞学的調査のための当技術分野において周知の標準的な方法によりスライドへ塗沫されてもよい。他の場合において、液状化細胞診(LBC)法が使用されてもよい。いくつかの場合において、LBC法は、細胞診スライド調製の改善された手段、より均一な試料、増加した感度および特異度、ならびに改善された試料の扱いの効率を提供する。液状化細胞診の方法においては、生物学的試料が、対象から、例えば、Cytyc ThinPrep、SurePath、Monoprep、または当技術分野において公知のその他の液状化細胞診調製溶液のような液状化細胞診調製溶液を含有している容器またはバイアルに移される。さらに、試料の実質的に定量的な転移を確実にするために、試料は、液状化細胞診調製溶液で収集装置から容器またはバイアルへと濯がれてもよい。次いで、液状化細胞診調製溶液中に生物学的試料を含有している溶液は、ガラススライド上に細胞の層を作製するために、機械により、または当業者により、保管され、かつ/または加工され得る。試料は、さらに、従来の細胞診調製物と同一の方式で、染色され、顕微鏡下で調査されてもよい。
【0100】
本発明のいくつかの態様において、試料は、免疫組織化学的染色により分析されてもよい。免疫組織化学的染色は、生物学的試料(例えば、細胞または組織)における、抗体の使用による、特定の分子または抗原の存在、位置、および分布の分析を提供する。抗原は、低分子、タンパク質、ペプチド、核酸、または抗体により特異的に認識され得るその他の任意の分子であり得る。試料は、先に固定および/または透過性化の工程を含んでいてもよいし、または含んでいなくてもよい免疫組織化学的方法により分析され得る。いくつかの場合において、関心対象の抗原は、抗原特異的な抗体と試料を接触させ、次いで、一回または複数回の洗浄により非特異的結合を除去することにより検出され得る。次いで、特異的に結合した抗体が、例えば、標識された二次抗体、または標識されたアビジン/ストレプトアビジンのような抗体検出試薬により検出され得る。いくつかの場合において、その代わりに、抗原特異的な抗体が直接標識されてもよい。免疫組織化学的検査のための適当な標識には、フルオレセインおよびローダミンのようなフルオロフォア、アルカリホスファターゼおよび西洋ワサビペルオキシダーゼのような酵素、ならびに32Pおよび125Iのような放射性核種が含まれるが、これらに限定されない。免疫組織化学的染色により検出され得る遺伝子産物マーカーには、Her2/Neu、Ras、Rho、EGFR、VEGFR、UbcH10、RET/PTC1、サイトケラチン20、カルシトニン、GAL-3、甲状腺ペルオキシダーゼ、およびチログロブリンが含まれるが、これらに限定されない。
【0101】
VI. 試料の分析
一つの局面において、本発明は、低い量および品質のDNAまたはRNAのようなポリヌクレオチドを用いて、マイクロアレイ遺伝子発現分析を実施する方法を提供する。いくつかの態様において、本開示は、低い量および品質のRNAを用いて、遺伝子発現を分析することにより、癌を診断し、特徴決定し、かつ/またはモニタリングする方法を記載する。一つの態様において、癌は甲状腺癌である。甲状腺RNAは細針吸引液(FNA)から得られ得る。いくつかの態様において、遺伝子発現プロファイルは、9.0、8.0、7.0、6.0、5.0、4.0、3.0、2.0、1.0、またはそれ未満のRNA RIN値を有する分解された試料から得られる。特定の態様において、遺伝子発現プロファイルは、6またはそれ未満、即ち、6.0、5.0、4.0、3.0、2.0、1.0、またはそれ未満のRINを有する試料から得られる。甲状腺FNA試料のような低濃度の核酸を含有している試料から意味のある遺伝子発現結果を得るために、低品質RNAが使用され得る方法が、本発明により提供される。
【0102】
遺伝子発現アッセイ法のための試料の有用性の別の推定値は、典型的にはナノグラム〜マイクログラムの量で測定されるRNA収量である。今日、検査室で核酸収量を測定するために使用されている最も高感度の「最先端技術」機器は、NanoDrop分光光度計である。その種類の多くの定量化装置と同様に、NanoDrop測定値の精度は、極めて低いRNA濃度では有意に減少する。マイクロアレイ実験への入力のために必要なRNAの最少量も、所定の試料の有用性を制限する。いくつかの局面において、本発明は、NanoDrop装置およびBioanalyzer装置の両方からの測定値の組み合わせを使用して、試料入力を推定することにより、低いRNA濃度の問題を解決する。遺伝子発現研究から得られるデータの品質はRNA量に依存するため、NanoDropにより測定された低いまたは測定不能なRNA濃度を有する試料から、意味のある遺伝子発現データが作成され得る。
【0103】
本方法および本アルゴリズムは、以下のことを可能にする:(1)低い量かつ/または低い品質の核酸を含有している試料の遺伝子発現分析、(2)偽陽性および偽陰性の有意な低下、(3)結果として生じる病態の基礎をなす遺伝学的経路、代謝経路、またはシグナル伝達経路の確定、(4)遺伝性障害の診断の精度に統計的確率を割り当てる能力、(5)不明確な結果を分解する能力、および(6)癌の亜型を区別する能力。
【0104】
VI. アッセイ結果
ルーチンの細胞学的アッセイ法またはその他のアッセイ法の結果は、陰性(癌、疾患、もしくは状態がない)、不明確もしくは疑わしい(癌、疾患、もしくは状態の存在が示唆される)、診断的(癌、疾患、もしくは状態についての陽性の診断)、または非診断的(癌、疾患、もしくは状態の存在もしくは欠如に関する不十分な情報の提供)として試料を示すことができる。診断結果は、悪性または良性として、さらに分類され得る。診断結果は、例えば、癌の重度もしくは悪性度、または正確な診断の可能性を示すスコアも提供する場合がある。いくつかの場合において、診断結果は、例えば、濾胞性腺腫、ハースル細胞腺腫、リンパ性甲状腺炎、過形成、濾胞癌、濾胞型甲状腺乳頭癌、乳頭癌、または本明細書に提供される疾患もしくは状態のいずれかのような、特定の型の癌、疾患、または状態を示し得る。いくつかの場合において、診断結果は、癌、疾患、または状態の特定の病期を示し得る。診断結果は、診断された特定の癌、疾患、または状態の型または病期のための特定の処置または治療的介入を通知し得る。いくつかの態様において、実施されたアッセイ法の結果は、データベースに入力され得る。分子プロファイリング企業は、以下のうちの一つまたは複数について、個体、保険提供者、医療提供者、または政府実体に代金を請求することができる:実施されたアッセイ法、助言サービス、結果の報告、データベースアクセス、またはデータ分析。いくつかの場合において、分子プロファイリング以外の全てまたはいくつかの工程は、細胞診検査室または医療従事者により実施される。
【0105】
上記に従って、本明細書に開示される1つもしくは複数の遺伝子、またはマーカー、またはそれらの組み合わせの差次的なコピー数は、サザンブロッティングを用いて、およびこの目的のためのプローブを開発するために、本明細書において同定される配列を使用して、決定することができる。そのようなプローブは、DNAもしくはRNAもしくは合成ヌクレオチドまたはそれらの組み合わせから構成されてよく、有利には、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列に一致するかまたは相補的であるヌクレオチド残基の連続した一続きからなってよい。そのようなプローブは、最も有用には、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列のうちの1つまたは複数に由来する、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、100、110、120、130、140、150、160、175、もしくは200ヌクレオチド、またはそれ以上を含む、少なくとも15〜200ヌクレオチドまたはそれ以上の連続した一続きを含む。したがって、単一のプローブが、癌性であるか、癌性であることが疑われるか、または癌性になる素因がある細胞の試料のトランスクリプトームに複数回結合し、同じ器官または組織の他の非癌性細胞のゲノムに由来する同様の量のトランスクリプトームに対する同一プローブの結合が、観察可能なほどに多いまたは少ない結合をもたらす場合、これは、配列決定されたプローブの由来元の、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列を含むかまたはそれらに対応する1つの遺伝子、複数の遺伝子、マーカー、またはmiRNAの差次的な発現を示す。
【0106】
本発明の方法の使用において、癌性状態を示す遺伝子またはマーカーのコピー数が、癌性であることが見出されたすべての細胞に特有である必要はないことに留意されたい。したがって、本明細書に開示される方法は、一部の細胞が別の異なる遺伝子コピー数の完全なパターンを示す組織において、癌性状態の存在を検出するのに有用である。例えば、表1、3、4、5、6、もしくは8、またはリスト1〜45中に同定される配列のうちの少なくとも1つとストリンジェントな条件下で相同であるか、または少なくとも90%、好ましくは95%同一である配列を含む選択された遺伝子またはマーカーのセットが、腫瘍性組織または悪性組織の試料に由来する細胞の60%程度の少ない細胞に存在し、対応する非癌性組織またはさもなくば正常組織に由来する細胞の60%程度の多くの細胞には存在しない(したがって、そのような正常組織細胞の40%程度の多くの細胞に存在する)ことが、DNAまたはRNAのいずれかである適切なプローブを使用して見出され得る。1つの態様において、そのようなパターンは、癌性組織から採取された細胞の少なくとも70%に存在し、対応する正常非癌性組織試料の少なくとも70%に存在しないことが見出される。別の態様において、そのようなパターンは、癌性組織から採取された細胞の少なくとも80%に存在し、対応する正常非癌性組織試料の少なくとも80%に存在しないことが見出される。別の態様において、そのようなパターンは、癌性組織から採取された細胞の少なくとも90%に存在し、対応する正常非癌性組織試料の少なくとも90%に存在しないことが見出される。別の態様において、そのようなパターンは、癌性組織から採取された細胞の少なくとも100%に存在し、対応する正常非癌性組織試料の少なくとも100%に存在しないことが見出されるが、後者の態様は稀にしか起こらない可能性がある。
【0107】
VII. 分子プロファイリング
細胞学的アッセイは、例えば甲状腺の腫瘍または結節を含む、多くの型の疑わしい腫瘍の現在の診断基準を示す。本発明のいくつかの態様において、陰性、不確定、診断的、または非診断的としてアッセイされた試料は、さらなる情報を得るために、次のアッセイに供することができる。本発明において、これらの次のアッセイ法は、ゲノムDNA、遺伝子発現産物レベル、または遺伝子発現産物選択的スプライシングの分子プロファイリングの段階を含む。本発明のいくつかの態様において、分子プロファイリングとは、生体試料中のゲノムDNAの数(例えば、コピー数)および/または型の決定を意味する。場合によっては、数および/または型を、対照試料または正常と見なされる試料とさらに比較することができる。いくつかの態様において、ゲノムDNAは、コピー数の増加(増幅)もしくは減少などのコピー数変化、または挿入、欠失、切断等などの変種ついて解析することができる。1つの態様では、ヨードチロシン脱ヨウ素酵素(IYD)の欠失を用いて、甲状腺癌を検出することができる。IYD変異は、甲状腺機能低下症に関与することが以前に示された(Moreno et al. (2008) N Engl. J Med 358:1811-8)。本発明において、IYD遺伝子の欠失が甲状腺癌に関与することが示された。いくつかの態様において、IYD欠失は50 kDの欠失である。IYD遺伝子配列は、例えば、アクセッション番号NM_203395でGenbankに見出され得る。同一試料、同一試料の一部、または本明細書に記載される方法のいずれかを用いて得られ得る新たな試料に対して、分子プロファイリングを行うことができる。分子プロファイリング会社は、個体と直接連絡をとることにより、または医師、第三者の試験センターもしくは検査室、または医療従事者などの仲介者を通して、追加の試料を要求することができる。場合によっては、試料は、いくつかまたはすべての細胞学的染色または他の診断法と組み合わせて、分子プロファイリングビジネスの方法および組成物を用いてアッセイされる。他の場合では、試料は、ルーチンの細胞学的染色または他の診断法を事前に使用することなく、分子プロファイリングビジネスの方法および組成物を用いて直接アッセイされる。場合によっては、単独の、または細胞診断もしくは他のアッセイ法と組み合わせた分子プロファイリングの結果により、当業者は対象を診断すること、または対象に治療を提案することが可能となる。場合によっては、分子プロファイリングを単独で、または細胞診断と組み合わせて用いて、腫瘍または疑わしい腫瘍を悪性変化について経時的にモニターすることができる。
【0108】
本発明の分子プロファイリング法は、対象からの一つまたは複数の生物学的試料からタンパク質または核酸(RNAもしくはDNA)を抽出し分析することを提供する。いくつかの場合において、核酸は得られた試料全体から抽出される。他の場合において、核酸は得られた試料の一部から抽出される。いくつかの場合において、核酸抽出に供されない試料の一部が、細胞学的調査または免疫組織化学的検査により分析されてもよい。生物学的試料からのRNAまたはDNAの抽出の方法は、当技術分野において周知であり、例えば、Qiagen DNeasy Blood and Tissue KitまたはQiagen EZ1 RNA Universal Tissue Kitのような市販のキットの使用を含む。
【0109】
(i)組織型フィンガープリント法
多くの場合において、本発明の方法により提供されるもののような生物学的試料は、甲状腺濾胞細胞、甲状腺髄質細胞、血球(RBC、WBC、血小板)、平滑筋細胞、管、管細胞、基底膜、管腔、小葉、脂肪組織、皮膚細胞、上皮細胞、ならびに浸潤するマクロファージおよびリンパ球を含むが、これらに限定されない、いくつかの細胞型または組織を含有している可能性がある。甲状腺試料の場合において、生物学的試料の診断的分類は、例えば、主として、濾胞細胞(乳頭癌、濾胞癌、および甲状腺未分化癌のような濾胞細胞に由来する癌のため)、ならびに髄質細胞(髄様癌のため)を含み得る。甲状腺生検材料からの不確定の生物学的試料の診断は、いくつかの場合において、濾胞性腺腫か濾胞癌かの区別に関する。従って、例えば、濾胞細胞の分子プロファイリングシグナルは、希釈され、試料中に存在する他の細胞型と混同される可能性がある。同様に、その他の組織または器官からの生物学的試料の診断は、その試料中に存在し得る多くの細胞型のうちの一つまたは複数の細胞型の診断をしばしば含む。
【0110】
いくつかの態様において、本発明の方法は、他の細胞型および/または組織型の存在による希釈効果に対して、もたらさたゲノムサインが較正され得るよう、特定の生物学的試料の細胞構成を確定するアップフロント(upfront)の方法を提供する。一つの局面において、このアップフロントの方法は、試料の各成分について、アップフロントのミニ分類器(mini-classifier)として、既知の細胞および/または組織に特異的な遺伝子発現パターンの組み合わせを使用するアルゴリズムである。このアルゴリズムは、組成に従って試料を予備分類し、次いで、補正/ノーマライゼーション因子を適用するために、この分子フィンガープリントを使用する。次いで、このデータは、いくつかの場合において、最終診断を支援するためにその情報を取り込むと考えられる最終分類アルゴリズムに送り込まれる。
【0111】
(ii)ゲノム分析
いくつかの態様において、ゲノム配列分析または遺伝子型決定が、試料に対して実施され得る。この遺伝子型決定は、一塩基多型(SNP)分析、挿入欠失多型(InDel)分析、タンデムリピート数(variable number of tandem repeat)(VNTR)分析、コピー数多型(copy number variation)(CNV)分析(あるいは、コピー数多相性(copy number polymorphism)と称される)、または部分ゲノム配列決定もしくは全ゲノム配列決定のような変異分析の形態をとり得る。ゲノム分析を実施する方法は、当技術分野において公知であり、例えば、米国特許第7,335,762号;同第7,323,305号;同第7,264,929号;同第7,244,559号;同第7,211,390号;同第7,361,488号;同第7,300,788号;および同第7,280,922号に記載された方法であるがこれらに限定されない、ハイスループット配列決定を含み得る。ゲノム分析を実施する方法には、下記のようなマイクロアレイ法も含まれ得る。図1は、マイクロアレイを用いた、本願発明の試料のゲノム分析を実施するための方法を図示している。
【0112】
いくつかの場合において、ゲノム分析は、本明細書中の他の方法のいずれかと組み合わせて実施されてもよい。例えば、試料を得て、妥当性について試験し、一定分量へ分割することができる。次いで、一つまたは複数の一定分量を、本発明の細胞学的分析のために使用し、一つまたは複数を、本発明の遺伝子発現プロファイリング法のために使用し、一つまたは複数を、ゲノム分析のために使用してもよい。当業者が、本明細書に明示的には提供されていないその他の分析を生物学的試料に対して実施することを望み得ることを、本発明が予想していることが、さらに理解される。
【0113】
いくつかの態様において、分子プロファイリングはまた、以下のうちの1つまたは複数に関するアッセイ法を含む、本開示のアッセイ法も含み得るが、これらに限定されない:表1、3、4、5、6、もしくは8、またはリスト1〜45に提供される遺伝子、DNAマーカー、またはDNA領域のタンパク質発現産物、RNA発現産物、RNA発現産物レベル、RNA発現産物スプライス変種、またはDNA多型(コピー数変化など)。場合によっては、本発明の方法は、約1個;2個;3個;4個;5個;6個;7個;8個;9個;10個;15個;20個;25個;30個;35個;40個;45個;50個;60個;70個;80個;90個;100個;120個;140個;160個;180個;200個;240個;280個;300個;350個;400個;450個;500個;600個;700個;800個;1000個;1500個;2000個;2500個;3000個;3500個;4000個;5000個、7500個;10,000個;15,000個;20,000個;30,000個;45,000個;50,000個;60,000個;100,000個;200,000個;400,000個;600,000個;100万個;150万個;200万個、またはそれ以上のゲノムDNAマーカーの分子プロファイリングによる、改善された癌診断を提供する。
【0114】
1つの態様において、分子プロファイリングは、表1、3、4、5、6、もしくは8、またはリスト1〜45からなる群より選択される1つまたは複数の遺伝子のDNA多型の有無を判定するために行われるマイクロアレイハイブリダイゼーションを含む。いくつかの態様では、以下の代謝経路またはシグナル伝達経路のうちの1つまたは複数に関与する1つまたは複数の遺伝子について、DNA多型を決定する:甲状腺ホルモンの産生および/または放出、プロテインキナーゼシグナル伝達経路、脂質キナーゼシグナル伝達経路、ならびにサイクリン。場合によっては、本発明の方法は、1個、2個、3個、4個、5個、6個、7個、9個、10個、11個、12個、13個、14個、もしくは15個、またはそれ以上の異なる代謝経路またはシグナル伝達経路の少なくとも1つの遺伝子のDNA多型の解析を提供する。
【0115】
本発明のいくつかの態様において、分子プロファイリングは、試料または試料の一部を本発明の1つまたは複数のプローブに結合させる段階を含む。適切なプローブは、測定する試料の成分、すなわち遺伝子産物に結合し、これには抗体または抗体断片、アプタマー、核酸、およびオリゴヌクレオチドを含まれるが、これらに限定されない。本発明のプローブに対する試料の結合は、試料から、1つまたは複数のプローブに結合している試料への物質の変換を表す。
【0116】
(iii)発現産物プロファイリング
遺伝子発現プロファイリングは、細胞機能の全体像を作出するための一度に数千個の遺伝子の活性(発現)の測定である。これらのプロファイルは、例えば、活発に分裂している細胞を区別するか、または細胞が特定の処置に対してどのように反応するかを示すことができる。この種の多くの実験は、ゲノム全体、即ち、特定の細胞に存在する全ての遺伝子を同時に測定する。マイクロアレイ技術は、以前に同定された標的遺伝子の相対活性を測定する。遺伝子発現の連続分析(serial analysis of gene expression)(SAGE、SuperSAGE)のような配列に基づく技術も、遺伝子発現プロファイリングのために使用される。SuperSAGEは、特に正確であり、予定されたセットのみならず、任意の活性遺伝子を測定することができる。RNA、mRNA、または遺伝子発現プロファイリングマイクロアレイにおいては、ある種の処置、疾患、および発達段階の、遺伝子発現に対する効果を研究するために、数千個の遺伝子の発現レベルが同時にモニタリングされる。例えば、マイクロアレイに基づく遺伝子発現プロファイリングは、本明細書に開示された遺伝性障害、または異なる癌の型、癌の亜型、および/もしくは癌の病期の遺伝子サインを特徴決定するために使用され得る。
【0117】
発現プロファイリング実験は、しばしば、2つまたはそれ以上の実験条件において発現されたmRNAのような遺伝子発現産物の相対量の測定を含む。これは、遺伝子発現産物の特定の配列の改変されたレベルが、おそらくホメオスタシス応答または病理学的状態を示す、遺伝子発現産物によりコードされたタンパク質の必要性の変化を示唆するためである。例えば、乳癌細胞が、特定の膜貫通型受容体に関連したmRNAを、正常細胞より高いレベルで発現する場合、この受容体は乳癌において役割を果たしている可能性がある。本発明の一つの局面は、遺伝性障害および癌、特に、甲状腺癌についての重要な診断試験の一部として、プロファイリング遺伝子発現を包含する。
【0118】
いくつかの態様において、RIN≦5.0を有するRNA試料は、典型的には、多重遺伝子マイクロアレイ分析のためには使用されず、その代り、単一遺伝子のRT-PCRアッセイ法および/またはTaqManアッセイ法のためにのみ使用され得る。マイクロアレイアッセイ法、RT-PCRアッセイ法、およびTaqManアッセイ法は、関連分野において周知の標準的な分子的技術である。TaqManプローブに基づくアッセイ法は、遺伝子発現アッセイ法、DNA定量化、およびSNP遺伝子型決定を含むリアルタイムPCRにおいて広く使用されている。
【0119】
一つの態様において、当技術分野において公知である癌に関連した遺伝子発現産物が、プロファイリングされる。そのような遺伝子発現産物は、記載されており、米国特許第7,358,061号;同第7,319,011号;同第5,965,360号;同第6,436,642号;ならびに米国特許出願第2003/0186248号、同第2005/0042222号、同第2003/0190602号、同第2005/0048533号、同第2005/0266443号、同第2006/0035244号、同第2006/083744号、同第2006/0088851号、同第2006/0105360号、同第2006/0127907号、同第2007/0020657号、同第2007/0037186号、同第2007/0065833号、同第2007/0161004号、同第2007/0238119号、および同第2008/0044824号に詳述された遺伝子発現産物を含むが、これらに限定されない。
【0120】
癌に関連したその他の遺伝子発現産物が公知になる可能性があること、および本明細書に記載された方法および組成物が、そのような新たに発見される遺伝子発現産物を含み得ることが、さらに予想される。
【0121】
本発明のいくつかの態様において、遺伝子発現産物は、代替的にまたは付加的に、発現レベル以外の特徴について分析される。例えば、遺伝子産物は、選択的スプライシングについて分析され得る。選択的エキソン使用とも呼ばれる選択的スプライシングは、一次遺伝子転写物、pre-mRNAのエキソンが分離され、再接続され(即ち、スプライシングされ)、同一遺伝子から選択的なmRNA分子が産生されるような、RNAスプライシング変動機序である。いくつかの場合において、これらの直鎖状の組み合わせは、次いで、翻訳の過程を受け、そこで、同一遺伝子からの選択的なmRNA分子の各々により、アミノ酸の特定の独特の配列が指定され、タンパク質アイソフォームがもたらされる。選択的スプライシングには、異なるエキソンもしくは異なるエキソンセットの取り込み、ある種のイントロンの保持、または選択的スプライスドナー部位およびアクセプター部位の使用が含まれ得る。
【0122】
いくつかの場合において、良性試料、悪性試料、または正常試料について診断的な選択的スプライシングを示すマーカーまたはマーカーのセットが同定され得る。さらに、選択的スプライシングマーカーは、特定の型の甲状腺癌(例えば、乳頭癌、濾胞癌、髄様癌、または未分化癌)についての診断をさらに提供し得る。当技術分野において公知の悪性病変について診断的な選択的スプライシングマーカーには、米国特許第6,436,642号にリスト化されたものが含まれる。
【0123】
いくつかの場合において、miRNAおよびsiRNAのような、タンパク質をコードしないRNA発現産物の発現が、本発明の方法によりアッセイされ得る。これらのRNA発現産物の差次的な発現は、良性試料、悪性試料、または正常試料を示し得る。これらのRNA発現産物の差次的な発現は、良性試料(例えば、FA、NHP、LCT、BN、CN、HA)または悪性試料(例えば、FC、PTC、FVPTC、ATC、MTC)の亜型をさらに示し得る。いくつかの場合において、miRNA、siRNA、選択的スプライスRNAアイソフォーム、mRNA、またはそれらの任意の組み合わせの差次的な発現が、本発明の方法によりアッセイされ得る。
【0124】
いくつかの態様において、本発明は、各々、甲状腺内の病態を特徴決定し、除外し、診断するのに必要とされるバイオマーカーの16のパネルを提供する。16のパネルは、以下の通りである。
1 正常甲状腺(NML)
2 リンパ性自己免疫性甲状腺炎(LCT)
3 結節性過形成(NHP)
4 濾胞性甲状腺腺腫(FA)
5 ハースル細胞甲状腺腺腫(HC)
6 副甲状腺(非甲状腺組織)
7 甲状腺未分化癌(ATC)
8 甲状腺濾胞癌(FC)
9 ハースル細胞甲状腺癌(HC)
10 甲状腺乳頭癌(PTC)
11 濾胞型乳頭癌(FVPTC)
12 甲状腺髄様癌(MTC)
13 腎癌の甲状腺への転移
14 黒色腫の甲状腺への転移
15 B細胞リンパ腫の甲状腺への転移
16 乳癌の甲状腺への転移
【0125】
各パネルには、甲状腺内の所定の病態を特徴決定し、除外し、診断するのに必要とされるバイオマーカーのセットが含まれる。パネル1〜6は良性病態を表す。パネル7〜16は悪性病態を表す。
【0126】
甲状腺およびその内部に見出される各病態の生物学的性質は、あるパネルの複数のバイオマーカーと、別のパネルの複数のバイオマーカーとの間に、重複性が存在することを示唆する。各病態亜型を反映して、各診断パネルは、不均一であり、別のパネルのバイオマーカーと半重複性である。不均一性および重複性は、所定のFNAで採取された組織の生物学、および各病態亜型を相互に特徴決定する遺伝子発現の差を反映する。
【0127】
一つの局面において、本発明の診断的な価値は、(i)あるパネルの一つまたは複数のマーカーと、(ii)付加的な各パネルの一つまたは複数のマーカーとの比較にある。本発明の利用可能性は、他の手段により現在可能であるより高い、FNAにおける診断精度である。
【0128】
いくつかの態様において、各パネル内のバイオマーカーは交換可能(モジュラー)である。新たな病理学的亜型(例えば、他の器官からの甲状腺への転移の新たな症例報告)の定義に適応させるために、全てのパネルの複数のバイオマーカーを、置換し、増加させ、低下させ、または改善することができる。本発明は、甲状腺に見出される16の不均一な、半重複性の、別個の病態の各々を定義する複数のマーカーを記載する。16の全てのパネルが、正確な診断に到達するために必要とされ、所定のパネルは、単独では、真の診断的決定をなすために十分な力を有していない。いくつかの態様では、他のすべての病態亜型を規定する複数のバイオマーカーを調べる状況において、各パネルの複数のバイオマーカーが依然として所定の病態亜型を規定するように、各パネルのバイオマーカーがバイオマーカーの適切な組み合わせと交換される。いくつかの態様では、バイオマーカーを組み合わせて、より大きなバイオマーカーを創出することができる。いくつかの態様では、ゲノム領域を組み合わせて、より大きなゲノム領域を創出することができる。例えば、100 bp、2500 bp、および3000 bpの大きさを有する別々のゲノム領域を所定の遺伝子に対して同時にマッピングすることができ、およびそのような別々のゲノム領域を用いて、その3つの組み合わせから単一のバイオマーカーを創出して、5600 bpまで広げることができる。
【0129】
本発明の方法および組成物は、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、または16個、またはそれ以上のバイオマーカーパネルから選択される遺伝子を有することができ、各バイオマーカーパネルからの1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、またはそれ以上の遺伝子発現産物を任意の組み合わせで有することができる。いくつかの態様において、組み合わせられた遺伝子のセットは、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは99.5%より高い特異度もしくは感度、または少なくとも95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、もしくはそれ以上の陽性適中率もしくは陰性適中率を与える。
【0130】
(1)発現産物レベルを測定するインビトロの方法
遺伝子発現産物レベルを測定するための一般的な方法は、当技術分野において公知であり、以下のうちの一つまたは複数を含み得るが、これらに限定されない:付加的な細胞学的アッセイ法、特定のタンパク質もしくは酵素活性についてのアッセイ法、タンパク質もしくはRNAを含む特定の発現産物もしくは特定のRNAスプライスバリアントについてのアッセイ法、インサイチューハイブリダイゼーション、全ゲノム発現分析もしくは部分ゲノム発現分析、マイクロアレイハイブリダイゼーションアッセイ法、SAGE、酵素結合免疫吸着アッセイ法、質量分析、免疫組織化学的検査、またはブロッティング。遺伝子発現産物レベルは、全mRNAのような内部標準、またはグリセルアルデヒド3リン酸デヒドロゲナーゼもしくはチューブリンを含むが、これらに限定されない、特定の遺伝子の発現レベルに対してノーマライズされ得る。
【0131】
本発明のいくつかの態様において、遺伝子発現産物マーカーおよび選択的スプライシングマーカーは、例えば、Affymetrixアレイ、cDNAマイクロアレイ、オリゴヌクレオチドマイクロアレイ、スポットマイクロアレイ(spotted microarray)、またはBiorad、Agilent、もしくはEppendorfからのその他のマイクロアレイ製品を使用したマイクロアレイ分析により決定され得る。マイクロアレイは、一回の実験でアッセイされ得る多数の遺伝子または選択的スプライスバリアントを含有し得るため、特定の利点を提供する。いくつかの場合において、マイクロアレイ装置は、ヒトゲノムもしくはトランスクリプトーム全体、またはそれらの実質的な画分を含有しており、遺伝子発現パターン、ゲノム配列、または選択的スプライシングの網羅的な評価を可能にすることができる。マーカーは、Sambrook Molecular Cloning a Laboratory Manual 2001およびBaldi, P., and Hatfield, W.G., DNA Microarrays and Gene Expression 2002に記載されるような標準的な分子生物学およびマイクロアレイ分析技術を使用して見出され得る。
【0132】
マイクロアレイ分析は、当技術分野において公知の方法を使用して、生物学的試料(例えば、生検材料または細針吸引液)から核酸を抽出し精製することから始まる。発現および選択的スプライシングの分析のためには、DNAからRNAを抽出しかつ/または精製することが有利であり得る。tRNAおよびrRNAのようなその他の型のRNAからmRNAを抽出しかつ/または精製することが、さらに有利であり得る。
【0133】
精製された核酸は、例えば、逆転写、PCR、ライゲーション、化学反応、またはその他の技術により、蛍光、放射性核種、またはビオチンもしくはジゴキシンのような化学的標識により、さらに標識され得る。標識は、直接であってもよいしまたは間接的であってもよく、カップリング段階をさらに必要としてもよい。カップリング段階は、例えば、アミノアリル-UTPおよび(シアニン色素のような)NHSアミノ反応性色素を使用して、ハイブリダイゼーション前に行われてもよいし、または、例えば、ビオチンおよび標識されたストレプトアビジンを使用して、後に行われてもよい。(例えば、1 aaUTP:4 TTP比で)修飾されたヌクレオチドを、通常のヌクレオチドと比較して、より低い率で、典型的には、60塩基毎に1塩基となるよう、酵素的に付加する(分光光度計により測定される)。次いで、aaDNAを、例えば、カラムまたはダイアフィルトレーション(diafiltration)装置により精製することができる。アミノアリル基は、核酸塩基に付着した長いリンカー上のアミン基であり、それが反応性標識(例えば、蛍光色素)と反応する。
【0134】
次いで、標識された試料を、SDS、SSC、硫酸デキストラン、(COT1 DNA、サケ精子DNA、ウシ胸腺DNA、PolyA、またはPolyTのような)ブロッキング剤、デンハート液、ホルムアミド、またはそれらの組み合わせを含有し得るハイブリダイゼーション溶液と混合することができる。
【0135】
ハイブリダイゼーションプローブとは、プローブ内の配列に相補的なヌクレオチド配列(DNA標的)の、DNA試料またはRNA試料における存在を検出するために使用される、可変の長さのDNAまたはRNAの断片である。従って、プローブは、プローブと標的との間の相補性によりプローブ-標的塩基対合を可能にする塩基配列を有する一本鎖核酸(DNAまたはRNA)にハイブリダイズする。標識されたプローブを、まず、(加熱により、またはアルカリ性条件下で)一本のDNA鎖へと変性させ、次いで、標的DNAにハイブリダイズさせる。
【0136】
プローブの標的配列へのハイブリダイゼーションを検出するため、プローブは分子マーカーによりタグ付け(または標識)される。一般的に使用されるマーカーは、32P、または非放射性の抗体に基づくマーカーであるジゴキシゲニンである。次いで、オートラジオグラフィーまたはその他の画像化技術を介して、ハイブリダイズしたプローブを可視化することにより、プローブと中程度〜高度の配列類似性を有するDNA配列またはRNA転写物が検出される。中程度または高度の類似性を有する配列の検出は、どの程度ストリンジェントなハイブリダイゼーション条件が適用されたかに依り、高いハイブリダイゼーション温度およびハイブリダイゼーション緩衝液中の低い塩のような高ストリンジェンシーは、高度に類似している核酸配列間のハイブリダイゼーションのみを可能にするが、より低い温度および高い塩のような低ストリンジェンシーは、配列の類似性が比較的低くてもハイブリダイゼーションを可能にする。DNAマイクロアレイにおいて使用されるハイブリダイゼーションプローブとは、コーティングされたガラススライドまたは遺伝子チップのような不活性表面に共有結合的に付着しており、かつ可動性のcDNA標的がハイブリダイズさせられるDNAをさす。
【0137】
次いで、この混合物を、熱または化学的手段により変性させ、マイクロアレイのポートに添加することができる。次いで、孔を密封し、例えば、マイクロアレイが回転により混合されるハイブリダイゼーションオーブンで、またはミキサーで、マイクロアレイをハイブリダイズさせることができる。一晩のハイブリダイゼーションの後、非特異的な結合を、(例えば、SDSおよびSSCにより)洗浄除去することができる。次いで、マイクロアレイを乾燥させ、レーザーが色素を励起し、検出器がその放出を測定する専門の機械でスキャンすることができる。画像にテンプレートグリッドを重ね合わせ、フィーチャー(数ピクセルが一つのフィーチャーを作成する)の強度を定量化することができる。
【0138】
様々なキットが、本発明の方法の核酸の増幅およびプローブ生成のために使用され得る。本発明において使用され得るキットの例には、Nugen WT-Ovation FFPEキット、Nugen Exon ModuleおよびFrag/Label moduleを含むcDNA増幅キットが含まれるが、これらに限定されない。NuGEN WT-Ovation(商標)FFPE System V2は、FFPE試料に由来する小さな分解されたRNAの広大なアーカイブに対して、包括的な遺伝子発現分析を実施することを可能にする、全トランスクリプトーム増幅システムである。このシステムは、50ng程度の少ない全FFPE RNAの増幅のために必要とされる試薬およびプロトコルから構成されている。プロトコルは、qPCR、試料アーカイビング(archiving)、断片化、および標識のために使用され得る。増幅されたcDNAは、NuGENのFL-Ovation(商標)cDNA Biotin Module V2を使用したGeneChip(登録商標)3'発現アレイ分析のため、2時間未満で断片化され標識され得る。Affymetrix GeneChip(登録商標)Exon and Gene STアレイを使用した分析のためには、増幅されたcDNAは、WT-Ovation Exon Moduleと共に使用され、次いで、断片化され、FL-Ovation(登録商標)cDNA Biotin Module V2を使用して標識される。Agilentアレイでの分析のためには、増幅されたcDNAは、NuGENのFL-Ovation(商標)cDNA Fluorescent Moduleを使用して、断片化され、標識され得る。Nugen WT-Ovation FFPEキットに関するさらなる情報は、http://www.nugeninc.com/nugen/index.cfm/products/amplification-systems/wt-ovation-ffpe/で入手され得る。
【0139】
いくつかの態様において、Ambion WT-expressionキットが使用され得る。Ambion WT-expressionキットは、別のリボソームRNA(rRNA)枯渇工程なしに、直接、全RNAの増幅を可能にする。Ambion(登録商標)WT Expression Kitによると、全RNA 50ng程度の小さな試料が、Affymetrix(登録商標)GeneChip(登録商標)Human Exon 1.0 ST Array、Mouse Exon 1.0 ST Array、およびRat Exon 1.0 ST Array、ならびにHuman Gene 1.0 ST Array、Mouse Gene 1.0 ST Array、およびRat Gene 1.0 ST Array上で分析され得る。より低い入力RNAの必要性、およびAffymetrix(登録商標)法とTaqMan(登録商標)リアルタイムPCRデータとの間の高い一致に加えて、Ambion(登録商標)WT Expression Kitは、感度の有意な増加を提供する。例えば、Ambion(登録商標)WT Expression Kitでは、増加した信号雑音比の結果として、エキソンレベルで、バックグラウンドを超えて検出されるより多数のプローブセットが、得られ得る。Ambion WT-expressionキットは、付加的なAffymetrix標識キットと組み合わせて使用され得る。
【0140】
いくつかの態様において、AmpTec Trinucleotide Nano mRNA Amplificationキット(6299-A15)が、本発明の方法において使用され得る。ExpressArt(登録商標)TRinucleotide mRNA amplification Nanoキットは、1ng〜700ngという広い範囲の入力全RNAに適している。入力全RNAの量および必要とされるaRNAの収量に依って、それは1ラウンド(入力>300ng 全RNA)または2ラウンド(最少入力量1ng 全RNA)で使用され得、aRNA収量は>10μgの範囲である。AmpTecの所有するTRinucleotideプライミング技術は、rRNAに対する選択と組み合わせて、(普遍的な真核生物3'ポリ(A)配列と無関係の)mRNAの優先的な増幅をもたらす。AmpTec Trinucleotide Nano mRNA Amplificationキットに関するさらなる情報は、http://www.amp-tec.com/products.htmで入手され得る。このキットは、cDNA変換キットおよびAffymetrix標識キットと組み合わせて使用され得る。
【0141】
次いで、生データは、例えば、バックグラウンド強度を差し引き、次いで、強度を割って、各チャンネル上のフィーチャーの全強度または参照遺伝子の強度を等しくすることによりノーマライズされ得る。次いで、全ての強度についてのt値が計算され得る。Affymetrixチップのためのより高度の方法には、z比回帰、loess回帰、およびlowess回帰、ならびにRMA(robust multichip analysis)が含まれる。
【0142】
(2)遺伝子発現産物レベルを測定するインビボ方法
本発明の方法および組成物は、最初に試料を得ることなく、個体における遺伝子発現産物レベルを測定するために使用され得ることが、さらに予想される。例えば、遺伝子発現産物レベルは、インビボで、即ち、個体において測定され得る。インビボで遺伝子発現産物レベルを測定する方法は、当技術分野において公知であり、CAT、MRI;NMR;PET;および抗体または分子ビーコンを使用したタンパク質またはRNAのレベルの光学イメージング、蛍光イメージング、またはバイオフォトニック(biophotonic)イメージングのような画像化技術を含む。そのような方法は、参照により本明細書に組み入れられるUS 2008/0044824、US 2008/0131892に記載されている。インビボ分子プロファイリングのための付加的な方法は、本発明の範囲に含まれることが企図される。
【0143】
本発明のいくつかの態様において、分子プロファイリングには、試料または試料の一部を、本発明の一つまたは複数のプローブに結合させる工程が含まれる。適当なプローブは、測定すべき試料の成分、即ち、遺伝子産物に結合するものであり、抗体または抗体断片、アプタマー、核酸、およびオリゴヌクレオチドを含むが、これらに限定されない。本発明のプローブへの試料の結合は、一つまたは複数のプローブに結合する物質の試料間の変換を表す。分子プロファイリングに基づき癌を診断する方法は、試料の遺伝子発現産物(即ち、mRNAまたはタンパク質)およびレベルを検出する工程、試料と対照との間の差次的な遺伝子発現産物レベルを測定するために、それを正常対照試料における量と比較する工程;ならびに一つまたは複数の差次的な遺伝子発現産物レベルを、本発明の訓練されたアルゴリズムへ入力することにより、試験試料を分類する工程;本発明の選択および分類のアルゴリズムを使用して、試料の分類をバリデートする工程;ならびに遺伝性障害またはある型の癌について陽性として試料を同定する工程をさらに含む。
【0144】
(iii)試料の正常との比較
個体により提供された試料(試験試料)に対して実施された分子プロファイリングの結果は、正常であることが既知であるかまたは正常であると推測される生物学的試料と比較され得る。正常試料とは、癌、疾患、もしくは状態がないか、もしくはないと期待される試料、または分子プロファイリングアッセイ法において癌、疾患、もしくは状態についての試験結果が陰性であると考えられる試料である。正常試料は、試験される個体とは異なる個体に由来してもよいし、または同一の個体に由来してもよい。正常試料は、試験試料と同時にアッセイされてもよいし、または異なる時点でアッセイされてもよい。いくつかの場合において、正常試料は、例えば、試験される個体のような個体の頬拭き取り検体から得られた試料である。
【0145】
試験試料に対するアッセイ法の結果は、正常試料に対する同一アッセイ法の結果と比較され得る。いくつかの場合において、正常試料に対するアッセイ法の結果は、データベース由来または参照由来である。いくつかの場合において、正常試料に対するアッセイ法の結果は、既知であるか、または当業者により一般に認められている値である。いくつかの場合において、比較は定性的である。他の場合において、比較は定量的である。いくつかの場合において、定性的または定量的な比較には、以下のうちの一つまたは複数が含まれ得るが、これらに限定されない:蛍光値、スポット強度、吸光度の値、化学発光シグナル、ヒストグラム、臨界閾値、統計的有意性の値、遺伝子産物発現レベル、遺伝子産物発現レベルの変化、選択的エキソン使用、選択的エキソン使用の変化、DNA多型(DNA polymorphism)、コピー数多型、一つもしくは複数のDNAマーカーもしくは領域の存在もしくは欠如の指標、または核酸配列の比較。
【0146】
(iv)結果の評価
いくつかの態様において、分子プロファイリング結果は、DNA多型を、悪性、悪性の型(例えば、濾胞癌)、良性、または正常性(例えば、疾患もしくは状態がない)のような特定の表現型と相関させるため、当技術分野において公知の方法を使用して、評価される。いくつかの場合において、指定された統計的信頼水準が、診断の信頼水準を提供するために決定され得る。例えば、90%より高い信頼水準が、悪性、悪性の型、常態(normalcy)、または良性の有用な予測因子であり得ると決定されてもよい。その他の態様において、より厳密な、またはゆるい信頼水準が選ばれてもよい。例えば、およそ70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、または99.9%の信頼水準が、有用な表現型予測因子として選ばれ得る。提供された信頼水準は、いくつかの場合において、試料の品質、データの品質、分析の品質、使用される特定の方法、および分析される遺伝子、マーカー、またはゲノム領域の数と関連し得る。診断を提供するための指定された信頼水準は、予想される偽陽性もしくは偽陰性の数および/またはコストに基づき選ばれ得る。指定された信頼水準を達成するため、または診断力を有するマーカーを同定するためのパラメータを選ぶ方法には、受信者動作特徴曲線(Receiver Operator Curve)分析(ROC)、従法線(binormal)ROC、主成分分析、部分最小二乗法による分析、特異値分解(singular value decomposition)、LASSO(least absolute shrinkage and selection operator)分析、最小角度回帰(least angle regression)、および閾値勾配による正則化(threshold gradient directed regularization)法が含まれるが、これらに限定されない。
【0147】
(v)データ分析
例えばマイクロアレイデータのような、生のデータは、いくつかの場合において、データをノーマライズし、かつまたはデータの信頼性を改善するために設計されたアルゴリズムの適用を通して改善され得る。本発明のいくつかの態様において、データ分析は、処理される個々のデータポイントの数が多いため、本明細書に記載された様々なアルゴリズムの適用のために、コンピュータ、またはその他の装置、機械、もしくは機器を必要とする。「機械学習アルゴリズム」とは、遺伝子発現プロファイルを特徴決定するために使用される、「分類器」としても当業者に公知の、計算に基づく予測方法論をさす。例えば、マイクロアレイに基づくハイブリダイゼーションアッセイ法により得られた、ある種の発現レベルに対応するシグナルは、典型的には、発現プロファイルを分類するためのアルゴリズムに供される。教師あり学習は、一般に、クラスの区別を認識するため分類器を「訓練」し、次いで、独立した試験セットに対する分類器の精度を「試験」することを含む。新たな未知の試料については、試料が属するクラスを予測するために分類器が使用され得る。
【0148】
いくつかの場合において、ロバストマルチアレイアベレージ(robust multi-array Average)(RMA)法が、生データをノーマライズするために使用され得る。RMA法は、多数のマイクロアレイ上のマッチする各細胞について、バックグラウンド補正された強度を計算することから始まる。バックグラウンド補正された値は、Irizarry et al. Biostatistics 2003 April 4 (2): 249-64により記載されるように、正の値に制限される。バックグラウンド補正の後、次いで、バックグラウンド補正されたマッチする各細胞の強度の底を2とする対数が得られる。次いで、各入力アレイおよび各プローブ発現値について、アレイパーセンタイルプローブ値が全アレイパーセンタイル点の平均値と交換される、クワンタイル(quantile)ノーマライゼーション法を使用して、各マイクロアレイ上のバックグラウンド補正され対数変換されたマッチする強度が、ノーマライズされる。この方法は、Bolstad et al. Bioinformatics 2003により、より完璧に記載されている。クワンタイルノーマライゼーションの後、次いで、ノーマライズされたデータを、各マイクロアレイ上の各プローブについて発現測定値を得るため、線形モデルにフィットさせることができる。次いで、チューキーのメディアンポリッシュ(median polish)アルゴリズム(Tukey, J.W., Exploratory Data Analysis. 1977)が、ノーマライズされたプローブセットデータについて、対数スケールの発現レベルを測定するために使用され得る。
【0149】
データは、疑わしいと見なされ得るデータを除去するために、さらに、フィルタリングされ得る。いくつかの態様において、約4個、5個、6個、7個、または8個より少ないグアノシン+シトシンヌクレオチドを有するマイクロアレイプローブに由来するデータは、異常なハイブリダイゼーションの傾向または二次構造上の問題のため、信頼性が低いと見なされ得る。同様に、約12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、または22個より多いグアノシン+シトシンヌクレオチドを有するマイクロアレイプローブに由来するデータは、異常なハイブリダイゼーションの傾向または二次構造上の問題のため、信頼性が低いと見なされ得る。
【0150】
いくつかの場合において、信頼性が低いプローブセットは、一連の参照データセットに対してプローブセットの信頼性をランク付けすることにより、データ分析から排除するために選択され得る。例えば、RefSeqまたはEnsembl(EMBL)は、極めて高品質の参照データセットと見なされる。RefSeq配列またはEnsembl配列とマッチするプローブセットからのデータは、いくつかの場合において、予想される高い信頼性のため、マイクロアレイ分析実験に特に含められ得る。同様に、信頼性の低い参照データセットとマッチするプローブセットからのデータは、さらなる分析から排除されてもよいし、または含めるか否かを個別的に検討されてもよい。いくつかの場合において、参照データセットが、別々に、または共に、プローブセットの信頼性を判定するために使用され得る。いくつかの場合において、プローブセットの信頼性はランク付けされ得る。例えば、参照データセット全てに完璧にマッチするプローブおよび/またはプローブセットは、最も信頼性が高いとしてランク付けされ得る(1)。さらに、三つの参照データセットのうちの2つとマッチするプローブおよび/またはプローブセットは、二番目に信頼性が高いとしてランク付けされ得(2)、三つの参照データセットのうちの一つとマッチするプローブおよび/またはプローブセットは、その次にランク付けされ得(3)、参照データセットとマッチしないプローブおよび/またはプローブセットは、最後にランク付けされ得る(4)。次いで、プローブおよびまたはプローブセットは、それらのランク付けに基づき、分析に含められるか、または排除され得る。例えば、さらなる分析のために、カテゴリー1、2、3、および4のプローブセットからのデータを含めることを選んでもよいし;カテゴリー1、2、および3のプローブセットからのデータを含めることを選んでもよいし;カテゴリー1および2のプローブセットからのデータを含めることを選んでもよいし;またはカテゴリー1のプローブセットからのデータを含めることを選んでもよい。別の例において、プローブセットは、参照データセットエントリーに対する塩基対ミスマッチの数によりランク付けされてもよい。分子プロファイリングのための所定のプローブおよび/またはプローブセットの信頼性を査定するための多くの方法が、当技術分野において理解されており、本発明の方法は、これらの方法およびそれらの組み合わせのうちの任意のものを包含することが理解される。
【0151】
本発明のいくつかの態様において、所定の遺伝子クラスターまたは転写産物クラスターに対するプローブセットは、GC含量、信頼性、分散等に関する以前に記載されたフィルター段階を通過するプローブを、最少数よりも少なく含む場合に、さらなる解析から排除され得る。例えば、いくつかの態様において、所定の遺伝子クラスターまたは転写物クラスターに対するプローブセットは、約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個未満、または約20個未満のプローブを含む場合に、さらなる解析から排除され得る。
【0152】
マイクロアレイデータのデータ解析の方法は、予備分類アルゴリズムの使用をさらに含み得る。例えば、甲状腺結節の細針吸引物(FNA)は、甲状腺濾胞細胞、甲状腺髄質細胞、血球(RBC、WBC、血小板)、平滑筋細胞、ならびに浸潤するマクロファージおよびリンパ球を含む、いくつかの細胞型を含む。FNAの診断的分類は、主として濾胞細胞(乳頭癌、濾胞癌、および甲状腺未分化癌などの、濾胞細胞に由来する癌に関する)および髄質細胞(髄様癌に関する)を必要とする。甲状腺髄様癌および未分化癌は不確定クラスに存在することは稀であるため、不確定FNAの診断は主に濾胞性腺腫と濾胞癌の識別に関係する。濾胞細胞の分子プロファイリング(例えば、コピー数変化または他のDNA多型)シグナルはこのように希釈され、おそらくはFNA中に存在する他の細胞型と混同される。特定のFNAの細胞構成を決定する事前方法により、得られた分子プロファイリングシグネチャーが希釈効果に対して較正され得るようになる。公知の細胞特異的遺伝子発現パターンの組み合わせを、FNAの各細胞成分の事前のミニ分類器として用いることができる。アルゴリズムは次にこの細胞特異的分子フィンガープリントを使用し、組成に従って試料を予備分類し、次いで補正/正規化因子を適用し得る。このデータ/情報は次に、良性または正常と悪性の最終診断を助けるためにその情報を取り入れる最終分類アルゴリズムに送り込まれ得る。したがって、いくつかの態様において、本発明の方法によるゲノムDNAの解析は遺伝子発現パターンの解析を含み、それによって試料の細胞組成に関する補正/正規化を提供する。
【0153】
本発明のいくつかの態様において、プローブセットからのデータは、発現されないか、または検出不可能なレベルで(バックグラウンド以下で)発現される場合、分析から排除され得る。プローブセットは、任意の群について、以下のような場合に、バックグラウンドを超えて発現されていると判断される。
標準正規分布のT0から無限大までの積分<有意(0.01)
ここで、
T0=Sqr(GroupSize)(T-P)/Sqr(Pvar)、
GroupSize=群内のCELファイルの数、
T=プローブセット内のプローブスコアの平均値、
P=GC含量のバックグラウンドプローブ平均値の平均値、および
Pvar=バックグラウンドプローブ分散の総計/(プローブセット内のプローブの数)^2。
【0154】
これは、群内のプローブセットの平均が、プローブセットについての中心的バックグラウンドとしての、プローブセットのプローブと類似のGC含量のバックグラウンドプローブの平均発現より大きい、プローブセットを含めることを可能にし、かつこれは、バックグラウンドプローブセット分散からプローブセット分散を導出することを可能にする。
【0155】
本発明のいくつかの態様において、分散を示さないかまたは低い分散を示すプローブセットは、さらなる分析から排除され得る。低分散プローブセットは、カイ二乗検定を介して、分析から排除される。プローブセットは、その変換された分散が、(N-1)自由度を有するカイ二乗分布の99パーセント信頼区間の左側にある場合、低分散であると見なされる。
(N-1)* プローブセット分散/(遺伝子プローブセット分散)〜Chi-Sq(N-1)
ここで、Nは入力CELファイルの数であり、(N-1)はカイ二乗分布についての自由度であり、「遺伝子についてのプローブセット分散」は遺伝子全体のプローブセット分散の平均値である。
【0156】
本発明のいくつかの態様において、所定の遺伝子クラスタまたは転写物クラスタについてのプローブセットは、GC含量、信頼性、分散等についての既に記載されたフィルタリング工程を通過するプローブを、最少数より少なく含有している場合、さらなる分析から排除され得る。例えば、いくつかの態様において、所定の遺伝子クラスタまたは転写物クラスタについてのプローブセットは、約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個未満、または約20個未満のプローブを含有している場合、さらなる分析から排除され得る。
【0157】
遺伝子発現レベルまたは選択的スプライシングのデータ分析の方法は、さらに、本明細書に提供されるようなフィーチャー選択アルゴリズムの使用を含み得る。本発明のいくつかの態様において、フィーチャー選択は、LIMMAソフトウェア・パッケージ(Smyth, G. K. (2005). Limma: linear models for microarray data. In: Bioinformatics and Computational Biology Solutions using R and Bioconductor, R. Gentleman, V. Carey, S. Dudoit, R. Irizarry, W. Huber (eds.), Springer, New York, pages 397-420)の使用により提供される。
【0158】
遺伝子発現レベルおよびまたは選択的スプライシングのデータ分析の方法は、さらに、予備分類(pre-classifier)アルゴリズムの使用を含んでいてもよい。例えば、アルゴリズムは、組成に依って試料を予備分類し、次いで、補正/ノーマライゼーション係数を適用するために、細胞特異的な分子フィンガープリントを使用し得る。次いで、このデータ/情報は、最終診断を支援するため、その情報を取り込むと考えられる最終分類アルゴリズムに送り込まれ得る。
【0159】
遺伝子発現レベルおよびまたは選択的スプライシングのデータ分析の方法は、さらに、本明細書に提供されるような分類アルゴリズムの使用を含んでいてもよい。本発明のいくつかの態様において、サポートベクターマシン(SVM)アルゴリズム、ランダムフォレストアルゴリズム、またはそれらの組み合わせが、マイクロアレイデータの分類のために提供される。いくつかの態様において、試料を区別するか(例えば、良性か悪性か、正常か悪性か)、または亜型を区別する(例えば、PTCかFVPTCか)同定されたマーカーが、統計的有意性に基づき選択される。いくつかの場合において、統計的有意性選択は、偽検出率(FDR)についてのBenjamini Hochberg補正を適用した後、実施される。
【0160】
いくつかの場合において、分類アルゴリズムは、Fishel and Kaufman et al. 2007 Bioinformatics 23(13): 1599-606により記載されたもののようなメタ分析アプローチにより補足されてもよい。いくつかの場合において、分類アルゴリズムは、再現性分析のようなメタ分析アプローチにより補足されてもよい。いくつかの場合において、再現性分析は、少なくとも一つの予測的発現産物マーカーセットにおいて出現するマーカーを選択する。
【0161】
いくつかの場合において、フィーチャー選択および分類の結果は、ベイズ事後分析(Bayesian post-analysis)法を使用してランク付けされ得る。例えば、マイクロアレイデータは、本明細書に提供される方法のような当技術分野において公知の方法を使用して、抽出され、ノーマライズされ、サマライズされ得る。次いで、データは、LIMMAに提供されるフィーチャー選択法を含むが、これに限定されない、本明細書に提供される方法のような、当技術分野において公知の任意のフィーチャー選択法のようなフィーチャー選択工程に供され得る。次いで、データは、SVMアルゴリズムまたはランダムフォレストアルゴリズムの使用を含むが、これらに限定されない、本明細書に提供されるアルゴリズムまたは方法のいずれかの使用のような、当技術分野において公知の分類法のいずれかのような分類工程に供され得る。次いで、分類アルゴリズムの結果は、事後確率関数に従ってランク付けされ得る。例えば、事後確率関数は、カテゴリー(例えば、良性、悪性、正常、ATC、PTC、MTC、FC、FN、FA、FVPTC、CN、HA、HC、LCT、NHP等)へのマーカーの割り当ての第一種および第二種の過誤の率から事前確率を導出するために、発表された結果のような、既知の分子プロファイリング結果の調査から導出され得る。これらの過誤率は、推定変化倍率の値(例えば、1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、2.2倍、2.4倍、2.5倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、またはそれ以上)を使用して、各研究について報告された標本サイズに基づき計算され得る。次いで、これらの事前確率は、差次的な遺伝子発現の事後確率を推定するために、本発明の分子プロファイリングデータセットと組み合わせられ得る。最後に、事後確率推定値は、差次的な発現の最終的な事後確率を公式化するために、本発明の第二のデータセットと組み合わせられ得る。事後確率を導出しマイクロアレイデータの分析へ適用するための付加的な方法は、当技術分野において公知であり、例えば、Smyth, G.K. 2004 Stat. Appl. Genet. Mol. Biol. 3: Article 3に記載されている。いくつかの場合において、事後確率は、分類アルゴリズムにより提供されるマーカーをランク付けするために使用されてもよい。いくつかの場合において、マーカーは、事後確率に依ってランク付けされ得、選ばれた閾値を通過するものが、例えば、良性、悪性、正常、ATC、PTC、MTC、FC、FN、FA、FVPTC、CN、HA、HC、LCT、またはNHPである試料を示すかまたはそれらについて診断的である差次的な発現を有するマーカーとして選ばれ得る。例示的な閾値には、0.7、0.75、0.8、0.85、0.9、0.925、0.95、0.975、0.98、0.985、0.99、0.995、またはそれ以上の事前確率が含まれる。
【0162】
分子プロファイリングの結果の統計的な評価は、以下のうちの一つまたは複数を示す定量的な値を提供する場合がある:診断精度の尤度、癌、疾患、または状態の尤度、特定の癌、疾患、または状態の尤度、特定の治療的介入の成功の尤度。従って、遺伝学または分子生物学について訓練されていない可能性が高い医師が、生データを理解する必要はない。むしろ、データは、患者のケアを案内するための最も有用な形態で医師に直接提示される。分子プロファイリングの結果は、以下のものを含むが、これらに限定されない、当技術分野において公知の多数の方法を使用して、統計的に評価され得る:スチューデントt検定、両側t検定、ピアソンの順位和検定、隠れマルコフモデル分析、q-qプロットの分析、主成分分析、一元配置のANOVA、二元配置のANOVA、LIMMA等。
【0163】
本発明のいくつかの態様において、単独の、または細胞学的分析と組み合わせられた、分子プロファイリングの使用は、約85%〜約99%または約100%正確な診断を提供し得る。いくつかの場合において、分子プロファイリングビジネスは、分子プロファイリングおよび/または細胞診の使用を通して、約85%、86%、87%、88%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%、99.5%、99.75%、99.8%、99.85%、または99.9%正確な、悪性、良性、または正常の診断を提供し得る。
【0164】
いくつかの場合において、精度は、最初の診断の精度を判定するために、経時的に対象を追跡することにより判定されてもよい。他の場合において、精度は、確定的に確立されてもよいし、または統計法を使用して確立されてもよい。例えば、受信者動作特性(ROC)分析が、特定のレベルの精度、特異度、陽性適中率、陰性適中率、および/または偽検出率を達成するための、最適のアッセイパラメータを決定するために使用され得る。癌診断においてROC分析を使用する方法は、当技術分野において公知であり、例えば、参照によりその全体が本明細書に組み入れられる米国特許出願第2006/019615号に記載されている。
【0165】
本発明のいくつかの態様では、良性と正常との間で、良性と悪性との間で、悪性と正常との間で、または悪性、良性、もしくは正常を含む、本明細書に提供される疾患もしくは状態のうちのいずれか1つと、本明細書に提供される任意の他の疾患もしくは状態との間で、1つもしくは複数のDNA多型の有無、または1つもしくは複数のコピー数変化の有無の最も大きな差を示すと判定されるゲノムDNAマーカーもしくは領域またはそれらの相補体をコードするポリヌクレオチドを、本発明の分子プロファイリング試薬として用いるために選択することができる。そのようなポリヌクレオチドは、当技術分野において公知であり、使用されている現行法よりもより広いダイナミックレンジ、より大きな信号対ノイズ比、より改善された診断力、より低い偽陽性もしくは偽陰性の可能性、またはより高い統計的信頼度を提供することにより、特に有用であり得る。
【0166】
本発明の他の態様において、単独で、または細胞学的解析と組み合わせて分子プロファイリングを使用することで、非診断的としてスコア化される試料の数は、当技術分野において公知の標準的な細胞学的技法の使用と比較した場合に、約100%、99%、95%、90%、80%、75%、70%、65%、または約60%減少し得る。場合によっては、本発明の方法により、中間物または疑わしいとしてスコア化される試料の数は、当技術分野において用いられている標準的な細胞学的方法と比較した場合に、約100%、99%、98%、97%、95%、90%、85%、80%、75%、70%、65%、または約60%減少し得る。
【0167】
場合によっては、分子プロファイリングアッセイの結果は、分子プロファイリングビジネスの代表者もしくは代理人、個体、医療提供者、または保険提供者によるアクセスのためにデータベースに入力される。場合によっては、アッセイ結果には、医療従事者などのビジネスの代表者、代理人、またはコンサルタントによる解釈または診断が含まれる。他の場合には、データのコンピュータまたはアルゴリズムによる解析が自動的に提供される。場合によっては、分子プロファイリングビジネスは、以下のうちの1つまたは複数について、個体、保険提供者、医療提供者、研究者、または政府機関に代金を請求することができる:実施された分子プロファイリングアッセイ、助言サービス、データ解析、結果の報告、またはデータベースアクセス。
【0168】
本発明のいくつかの態様において、分子プロファイリングの結果は、コンピュータスクリーン上の報告書として、または紙面の記録として提示される。場合によっては、報告書は以下のうちの1つまたは複数のような情報を含み得るが、これらに限定されない:多型またはコピー数変化を示すDNAマーカーまたは領域の有無、差次的に発現する遺伝子の数、最初の試料の適合性、差次的な選択的スプライシングを示す遺伝子の数、診断、診断についての統計的信頼度、癌または悪性の可能性、および示唆される治療法。
【0169】
(vi) 分子プロファイリング結果に基づく試料のカテゴリー化
分子プロファイリングの結果は、以下のうちの1つに分類され得る:陰性(癌、疾患、または状態がない)、診断的(癌、疾患、または状態についての陽性診断)、不確定もしくは疑わしい(癌、疾患、または状態の示唆)、または非診断的(癌、疾患、または状態の有無に関する不十分な情報の提供)。場合によっては、診断結果は癌、疾患、または状態の型をさらに分類し得る。他の場合において、診断結果は、癌、疾患、もしくは状態に関与するある特定の分子経路、または特定の癌、疾患、もしくは状態のある特定の悪性度もしくは病期を示し得る。さらに他の場合において、診断結果は、Gleevecなどのキナーゼ阻害剤もしくは当技術分野において公知の任意の薬物のような特定の薬物計画、または甲状腺切除術もしくは片側甲状腺切除術のような外科的介入などの、適切な治療的介入を通知し得る。
【0170】
本発明のいくつかの態様において、結果は訓練アルゴリズムを用いて分類される。本発明の訓練アルゴリズムには、表2に記載される試料を含むがこれらに限定されない、公知の悪性試料、良性試料、および正常試料の参照セットを用いて開発されたアルゴリズムが含まれる。試料のカテゴリー化に適しているアルゴリズムには、k近傍アルゴリズム、概念ベクトルアルゴリズム、単純ベイズアルゴリズム、ニューラルネットワークアルゴリズム、隠れマルコフモデルアルゴリズム、遺伝的アルゴリズム、および相互情報特徴選択アルゴリズム、またはそれらの任意の組み合わせが含まれるが、これらに限定されない。場合によっては、本発明の訓練アルゴリズムは、本発明の細胞学者もしくは病理学者によるスコア化もしくは診断、本発明の予備分類アルゴリズムにより提供される情報、または本発明の対象の病歴に関する情報などであるがこれらに限定されない、遺伝子DNA多型データ(例えば、コピー数変化データ)、遺伝子発現データ、または選択的スプライシングデータ以外のデータを取り込んでもよい。
【0171】
(vii) 分子プロファイリングによる対象または治療的介入のモニタリング
いくつかの態様では、本発明の方法および組成物を用いて、対象をモニターすることができる。例えば、対象は癌と診断され得る。この初期診断は、分子プロファイリングの使用を含んでも、または含まなくてもよい。対象は、例えば甲状腺切除術、片側甲状腺切除術、ホルモンまたはホルモン作動薬療法、化学療法、または放射線療法などの治療的介入を処方され得る。治療的介入の結果を分子プロファイリングにより継続的にモニターして、この治療的介入の有効性を検出することができる。別の例において、対象は良性腫瘍または前癌性の病変もしくは結節を有すると診断され得、腫瘍、結節、または病変を分子プロファイリングにより継続的にモニターして、この腫瘍または病変の状態の任意の変化を検出することができる。
【0172】
分子プロファイリングを用いて、対象に試行する前に、特定の治療的介入の潜在的有効性を確認することもできる。例えば、対象は癌と診断され得る。分子プロファイリングは、例えば、RAS癌遺伝子またはヨードチロシン脱ヨウ素酵素などの、甲状腺の疾患または状態に関与する1つまたは複数の遺伝子を含むか、またはその近傍にあることが知られているゲノムDNAの領域のコピー数の変化を示し得る。当技術分野において公知の方法を用いて、腫瘍試料を採取し、インビトロで培養することができる。次いで、異常に活性化された、不活性化された、もしくは調節不全にされた経路の様々な阻害剤、または経路の活性を阻害することが知られている薬物の適用を、増殖阻害について、腫瘍細胞株に対して試験することができる。この場合も同様に、分子プロファイリングを用いて、例えば関連経路の下流標的に対するこれら阻害剤の効果をモニターすることができる。
【0173】
(viii) 研究ツールとしての分子プロファイリング
いくつかの態様では、疑わしい腫瘍の診断のための新規マーカーを同定するため;腫瘍細胞、細胞株、組織、もしくは生物などの生体試料に対する薬物もしくは候補薬物の効果をモニターするため;または発癌および/もしくは腫瘍抑制のための新規経路を発見するための研究ツールとして、分子プロファイリングを用いることができる。
【0174】
組成物
以下のうちの1つまたは複数を含む、本開示の組成物もまた提供される:表1、3、4、5、6、もしくは8、またはリスト1〜45に提供される遺伝子間領域、遺伝子、または遺伝子の一部に対応するヌクレオチド(例えば、DNAまたはRNA)。本発明のヌクレオチドは、少なくとも約10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、150、200、250、300、350、または約400もしくは500ヌクレオチド長であってよい。本発明のいくつかの態様において、ヌクレオチドは、ペプチド核酸、ピラノシルRNA、ヌクレオシド、メチル化核酸、ペグ化核酸、環状ヌクレオチド、および化学修飾ヌクレオチドを含むがこれらに限定されない、リボ核酸またはデオキシリボ核酸の天然または人工の誘導体であってよい。本発明の組成物のいくつかにおいて、本発明のヌクレオチドは検出可能な標識を含むように化学修飾されている。本発明のいくつかの態様において、生体試料は標識を含むように化学修飾されている。いくつかの態様において、本明細書に提供される組成物は、1つもしくは複数のビーズ、プレート、アレイ、マイクロアレイ、または1つもしくは複数のウェルもしくはスポットなどの固体基質に固定化されたヌクレオチド(例えば、DNAまたはRNA)を含む。
【0175】
本開示のさらなる組成物は、表1、3、4、5、6、もしくは8、もしくはリスト1〜45に提供される遺伝子もしくはDNA領域またはそれらの相補体のいずれかの、コピー数変化またはSNPまたは本明細書に提供される多型のいずれかなどの、DNA多型を検出または測定するためのオリゴヌクレオチドを含む。本発明のさらなる組成物は、表1、3、4、5、6、もしくは8、もしくはリスト1〜45に提供される遺伝子の多型対立遺伝子またはそれらの相補体の発現産物を検出(すなわち、測定)するためのオリゴヌクレオチドを含む。そのような多型対立遺伝子には、スプライス部位変種、一塩基多型、反復数多型、挿入、欠失、および相同体が含まれるが、これらに限定されない。場合によっては、変種対立遺伝子は、表1、3、4、5、6、もしくは8、もしくはリスト1〜45に記載される遺伝子と約99.9%〜約70%同一であり、例えば、約99.75%、99.5%、99.25%、99%、97.5%、95%、92.5%、90%、85%、80%、75%、および約70%同一である。場合によっては、変種対立遺伝子は、表1、3、4、5、6、もしくは8、もしくはリスト1〜45に提供される遺伝子と約1ヌクレオチド〜約500ヌクレオチドだけ異なっており、例えば、約1、2、3、5、7、10、15、20、25、30、35、50、75、100、150、200、250、300、および約400ヌクレオチドだけ異なっている。
【0176】
(vii) 分子プロファイリングに基づくバイオマーカーのグループ分け
甲状腺遺伝子は以下の群に従って記載され得る:1) 良性対悪性、2) 選択的遺伝子スプライシング、3) KEGG経路、4) 正常甲状腺、5) 甲状腺病態亜型、6) 遺伝子オントロジー、および7) 非甲状腺器官から甲状腺への転移のバイオマーカー。本発明の方法および組成物は、上記の群のうちの1つもしくは複数、および/または上記の群のいずれかからの1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、もしくはそれ以上の亜群(例えば、1つまたは複数の異なるKEGG経路)から選択される遺伝子を有することができ、各群からの1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、またはそれ以上の遺伝子発現産物を任意の組み合わせで有することができる。本発明の異なる経路における複数の遺伝子の使用は、特定の甲状腺病態を示し得る。例えば、これは、異なる経路における遺伝子変化が細胞調節の重複システムを修飾し得ることを示すのに有用であり得る。他の態様において、本発明の単一経路における複数の遺伝子の使用は、特定の甲状腺病態を示し得る。例えば、これは、特定の経路で崩壊が起こっていることを確認するのに有用であり得る。いくつかの態様において、組み合わされた遺伝子のセットは、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは99.5%を上回る特異度もしくは感度、または少なくとも95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、もしくはそれ以上の陽性適中率もしくは陰性適中率をもたらす。
【0177】
いくつかの態様において、細胞外基質遺伝子、接着遺伝子、接着斑遺伝子、および密着結合遺伝子が、甲状腺癌のバイオマーカーとして用いられる。いくつかの態様において、シグナル伝達経路は、以下の3つの経路のうちの1つから選択される:接着経路、接着斑経路、および密着結合経路。いくつかの態様では、少なくとも1つの遺伝子が、3つの経路のうちの1つから選択される。いくつかの態様では、少なくとも1つの遺伝子が、3つの経路のうちの1つずつから選択される。いくつかの態様では、少なくとも1つの遺伝子が、3つの経路のうちの2つから選択される。いくつかの態様では、3つの経路すべてに関与する少なくとも1つの遺伝子が選択される。一例において、接着経路、接着斑経路、および密着結合経路に関与する遺伝子のセットが、甲状腺癌などの癌の診断のためのマーカーとして選択される。
【0178】
甲状腺濾胞を裏打ちする濾胞細胞は、極性が高く、かつ構造が組織化されており、管腔側および頂端側の細胞膜の別個の役割を必要とする。いくつかの態様において、細胞骨格遺伝子、原形質膜遺伝子、および細胞外空間遺伝子が、甲状腺癌のバイオマーカーとして用いられる。いくつかの態様において、4つの経路、すなわちECM経路、接着斑経路、接着経路、および密着結合経路のすべてに重複する遺伝子が、甲状腺癌のバイオマーカーとして用いられる。一例において、本発明は、甲状腺分類遺伝子リストとして良性対悪性群を提供する。このリストは、KEGG経路、遺伝子オントロジー、および染色体局在性に従ってグループ分けされた(例えば表1、3、4、5、6、もしくは8、またはリスト1〜45を参照されたい)。KEGG経路を表1にさらに記載する。
【0179】
(表1)KEGG経路に関与する遺伝子

【0180】
いくつかの態様において、甲状腺癌などの癌の診断のためのマーカーは、検査のために、以下のマーカーのリストから選択される。
【0181】
甲状腺外科病理学亜型を以下に記載する。
【0182】
(i) リスト1:FC亜型、

【0183】
(ii) リスト2:FVPTC亜型、

[これは正しいか?]
【0184】
(iii) リスト3:PTC亜型、

【0185】
(iv) リスト4:NHP亜型、

【0186】
優性遺伝子オントロジー甲状腺バイオマーカーを以下に記載する。
【0187】
リスト5:多細胞生物過程、

【0188】
リスト6:多細胞生物発生、

【0189】
リスト7:前後パターン形成、

【0190】
リスト8:表皮発生、

【0191】
リスト9:領域形成、

【0192】
リスト10:外胚葉発生、

【0193】
リスト11:角質化、

【0194】
リスト12:発生過程、

【0195】
リスト13:組織発生、

【0196】
リスト14:細胞過程の調節、

【0197】
リスト15:系の発生、

【0198】
リスト16:生物学的過程の調節、

【0199】
リスト17:解剖構造発生、

【0200】
リスト18:生体調節、

【0201】
リスト19:パターン特異化過程、

【0202】
リスト20:ケラチノサイト発生、

【0203】
リスト21:表皮細胞分化、

【0204】
リスト22:器官発生、

【0205】
リスト23:配列特異的DNA結合、

【0206】
リスト24:DNA依存性転写の調節、

【0207】
リスト25:胚発生、

【0208】
リスト26:RNA代謝過程の調節、

【0209】
リスト27:ARFグアニルヌクレオチド交換因子活性、

【0210】
リスト28:DNA依存性転写、

【0211】
リスト29:RNA生合成過程、

【0212】
リスト30:細胞表面受容体結合シグナル伝達、

【0213】
リスト31:シグナル伝達物質活性、

【0214】
リスト32:N-メチル-D-アスパラギン酸選択的グルタミン酸受容体複合体、

【0215】
リスト33:分子伝達物質活性、

【0216】
リスト34:心臓肉柱形成、

【0217】
いくつかの態様において、特定の染色体に局在する遺伝子またはマーカーは本発明に有用であり得る。多型の組み合わせの有無を判定し、バイオマーカーのパネルを作成することによって、本発明を実施することができる。精度、感度、および/または特異度を高めるために、各パネル中のバイオマーカーを組み合わせることができる。いくつかの態様において、各パネル内のバイオマーカーは交換可能(モジュール式)である。新たな病理学的亜型(例えば、他の器官からの甲状腺への転移の新たな症例報告)の定義に適応させるために、すべてのパネル内の複数のバイオマーカーを置換する、増加させる、減少させる、または改善することができる。甲状腺マーカーの染色体局在性を以下に示す。
【0218】
リスト35:

【0219】
リスト36:

【0220】
リスト37:

【0221】
リスト38:

【0222】
リスト39:

【0223】
リスト40:

【0224】
リスト41:

【0225】
リスト42:

【0226】
リスト43:

【0227】
リスト44:

【0228】
リスト45:

【0229】
ビジネス方法
本明細書に記載されるように、カスタマーまたは見込みカスタマーという用語は、分子プロファイリングビジネスの方法またはサービスを使用し得る個体または実体をさす。本明細書に記載された分子プロファイリングの方法およびサービスの見込みカスタマーには、例えば、患者、対象、医師、細胞診検査室、保健医療提供者、研究者、保険企業、メディケイド(Medicaid)のような政府実体、雇用者、または癌の診断、モニタリング、および処置のためのより経済的もしくは効率的なシステムの達成に関心のあるその他の任意の実体が含まれる。
【0230】
そのような者は、例えば、薬物もしくは介入から最も利益を得る可能性が高い患者に対して高価な薬物もしくは治療的介入を選択的に必要とするため、または薬物もしくはその他の治療的介入の不必要な使用によって、利益を受けないか、もしくは被害を受ける可能性のある個体を同定するため、分子プロファイリング結果を用いることができる。
【0231】
I. 販売の方法
本発明の分子プロファイリングビジネスのサービスは、例えば、診断およびケアを増強する方法として、健康について懸念のある個体、医師、またはその他の医療従事者に販売されてもよいし;例えば、増強された診断をクライアントに提供するためのサービスとして、細胞診検査室に販売されてもよいし;例えば、不当な治療的介入を排除することにより、コストを低下させるための方法として、保健医療提供者、保険企業、および政府実体に販売されてもよい。見込みクライアントへの販売の方法には、さらに、DNA多型と疾患または状態との間の新たな相関を見出そうとしている研究者および医師のためのデータベースアクセスの販売が含まれる。
【0232】
販売の方法には、見込みカスタマーへの印刷物、ラジオ、テレビ、またはインターネットに基づく広告の使用が含まれ得る。特定の媒体を通して、見込みカスタマーに販売することも可能であり、例えば、内分泌学者には、Journal of the American Medical Association、Physicians Practice、American Medical News、Consultant、Medical Economics、Physician's Money Digest、American Family Physician、Monthly Prescribing Reference、Physicians' Travel and Meeting Guide、Patient Care、Cortlandt Forum、Internal Medicine News、Hospital Physician、Family Practice Management、Internal Medicine World Report、Women's Health in Primary Care、Family Practice News、Physician's Weekly、Health Monitor、The Endocrinologist、Journal of Endocrinology、The Open Endocrinology Journal、およびThe Journal of Molecular Endocrinologyを含むが、これらに限定されない、業界誌および医学雑誌に広告を置くことにより販売することができる。販売は、本発明の方法およびサービスを使用して、実験を実施し、いくつかの場合において、結果を発表するか、またはさらなる研究のための資金を求めるため、医療従事者との協同の形態をとることもできる。いくつかの場合において、販売の方法は、連絡情報を決定するための、例えば、American Medical Association(AMA)データベースのような医師または医療従事者のデータベースの使用を含み得る。
【0233】
一つの態様において、販売の方法は、ルーチンの方法を使用して、明確に診断することができない試料を有するカスタマーに、分子プロファイリングサービスを提供するための、細胞学的試験検査室との協同を含む。
【0234】
II. コンピュータを使用したビジネス方法
分子プロファイリングビジネスは、図5に例示されるようなコンピュータ800のような一つまたは複数のコンピュータを本発明の方法において使用してもよい。コンピュータ800は、試料もしくはカスタマーの追跡のようなカスタマーおよび試料の情報の管理、データベース管理、分子プロファイリングデータの分析、細胞学的データの分析、データ保存、代金請求、販売、結果の報告、または結果の保存のために使用され得る。コンピュータは、データ、結果、代金請求情報、販売情報(例えば、人口統計)、カスタマー情報、または試料情報を表示するためのモニター807またはその他のグラフィカルインターフェースを含み得る。コンピュータは、データまたは情報の入力のための手段816、815も含み得る。コンピュータは、処理装置801、および固定された媒体803、または取り外し可能な媒体811、またはそれらの組み合わせを含み得る。コンピュータに物理的に近いユーザは、例えば、キーボードおよび/もしくはマウスを介して、コンピュータにアクセスすることができ、または物理的なコンピュータに必ずしも近くないユーザ822は、モデム、インターネット接続、電話接続、もしくは有線もしくは無線の通信搬送波のような通信媒体805を通してコンピュータにアクセスすることができる。いくつかの場合において、コンピュータは、ユーザからコンピュータへ、またはコンピュータからユーザへ、情報を中継するための、サーバー809またはその他の通信装置に接続されていてもよい。いくつかの場合において、ユーザは、通信媒体805を通してコンピュータから入手されたデータまたは情報を、取り外し可能な媒体812のような媒体に保存することができる。
【0235】
分子プロファイリングビジネスは、以下のうちの一つまたは複数の目的のためにデータベースへ試料情報を入力してもよい:在庫の追跡、アッセイ結果の追跡、注文の追跡、カスタマー管理、カスタマーサービス、代金請求、および売り上げ。試料情報には、以下のものが含まれ得るが、これらに限定されない:カスタマーの名称、独特のカスタマーID、カスタマーに関連する医療従事者、必要とされるアッセイ法、アッセイ結果、妥当性状態、必要とされる妥当性試験、個体の病歴、予備的診断、推測される診断、試料の履歴、保険提供者、医療提供者、第三者試験施設、またはデータベースへの保存のために適している任意の情報。試料の履歴には、以下のものが含まれ得るが、これらに限定されない:試料の古さ、試料の型、取得の方法、保管の方法、または輸送の方法。
【0236】
データベースは、カスタマー、医療従事者、保険提供者、第三者、または分子プロファイリングビジネスがアクセスを認める個体もしく実体によりアクセス可能であり得る。データベースアクセスは、コンピュータまたは電話のような電子通信の形態をとり得る。データベースは、カスタマーサービス代理人、ビジネス代理人、コンサルタント、独立した試験施設、または医療従事者のような仲介者を通してアクセスされてもよい。データベースアクセスまたはアッセイ結果のような試料情報の利用可能性または程度は、与えられた、または与えられる予定の製品およびサービスについての代金の支払い時に変化してもよい。データベースアクセスまたは試料情報の程度は、患者またはカスタマーの機密性のための一般に認められているか、または法的な要件に応じて制限され得る。分子プロファイリング企業は、以下のうちの一つまたは複数について、個体、保険提供者、医療提供者、または政府実体に代金を請求することができる:試料受け取り、試料保管、試料調製、細胞学的試験、分子プロファイリング、試料情報のデータベースへの入力および更新、またはデータベースアクセス。
【0237】
III. ビジネスフロー
図2は、試料が分子プロファイリングビジネスにより処理され得る1つの方法を例証するフローチャートである。図2Aは、試料が本発明の分子プロファイリングビジネスにより処理され得る方法の1つの態様を示す。例えば、甲状腺細胞の試料が、おそらくは細針吸引を介して内分泌学者により採取され得る100。試料は、ルーチンの細胞学的染色法に供される125。ルーチンの細胞学的染色は、非診断的105、良性110、不明確もしくは疑わしい115、または悪性120という4つの異なる可能な予備的診断を提供する。次いで、分子プロファイリングビジネスが、本明細書に記載されるように、ゲノムDNA、遺伝子産物発現レベル、選択的遺伝子産物エキソン使用、またはそれらの組み合わせを解析し得る130。ゲノムDNA、遺伝子産物発現レベル、選択的遺伝子産物エキソン使用、またはそれらの組み合わせの解析(分子プロファイリング)は、悪性140または良性135の確定診断をもたらし得る。場合によっては、ルーチンの細胞学的検査において曖昧でかつ非診断的な結果を提供する試料などの試料のサブセットのみが、分子プロファイリングにより解析される。
【0238】
いくつかの場合において、分子プロファイリングの結果は、ルーチンの細胞学的試験の結果を確認する。他の場合において、分子プロファイリングの結果は異なる。そのような場合には、試料をさらに試験してもよいし、データを再調査してもよいし、または分子プロファイリングの結果もしくは細胞学的アッセイ法の結果を、正確な診断として採用してもよい。良性診断には、悪性癌ではないが、さらなるモニタリングまたは処置を必要とする可能性がある疾患または状態も含まれ得る。同様に、悪性診断には、特定の型の癌、または疾患もしくは状態に関与する特定の代謝経路もしくはシグナル伝達経路の診断がさらに含まれ得る。その診断は、放射性ヨウ素アブレーション、手術、甲状腺切除のような処置または治療的介入;またはさらなるモニタリングを必要とする可能性がある。
【0239】
キット
分子プロファイリングビジネスは、適当な試料を得るためのキットを提供してもよい。図3に図示されるようなキット203は、容器202、試料を得るための手段200、試料を保管するための試薬205、およびキットの使用に関する説明書を含むことができる。別の態様において、キットは、分子プロファイリング分析を実施するための試薬および材料をさらに含む。いくつかの場合において、試薬および材料には、分子プロファイリング法により生成されたデータを分析するためのコンピュータプログラムが含まれる。さらに他の場合において、キットは、生物学的試料が保管され、分子プロファイリングビジネスまたは第三者試験施設のような試験機関へと輸送される手段を含有している。
【0240】
分子プロファイリングビジネスは、分子プロファイリングを実施するためのキットも提供することができる。キットは、全ての必要な緩衝液および試薬を含むタンパク質または核酸を抽出するための手段;ならびに対照および試薬を含む、タンパク質または核酸のレベルを分析するための手段を含むことができる。キットは、、本発明の方法および組成物を使用して提供されたデータの分析のためのソフトウェア、またはソフトウェアを得て使用するためのライセンスをさらに含むこともできる。
【実施例】
【0241】
実施例1:甲状腺試料のハイブリダイゼーション解析
悪性の甲状腺結節と良性のものを識別するゲノム領域を同定するため、HumanSNP 6.0(SNP6.0)アレイに対する86例のハイブリダイゼーションを調べ、従来の一塩基多型(SNP)および新規な下流解析法によるコピー数解析を追跡した。SNP6.0アレイの予備結果を、本発明者らのコホートにおけるDNAコピー数異常の完全な特徴づけを可能とするアルゴリズムへの入力として使用した。本発明者らが悪性の甲状腺結節と良性のものを識別することを見出したゲノム領域のそれぞれに関して、以下のものを記載する:i) 正確な染色体位置、ii) ゲノム領域サイズ、およびiii) 異常の性質(コピー数獲得および/またはコピー数喪失)。
【0242】
甲状腺結節病態の亜型に基づく試料の群間で、いくつかの比較を行った。4つの比較のうちの1つ目は、濾胞癌対濾胞性腺腫(FC対FA)に焦点をおき、これにより47の有意なゲノム領域が得られた。濾胞型甲状腺乳頭癌と結節性過形成(FVPTC対NHP)の同様の比較により、30の有意なゲノム領域が得られ、甲状腺乳頭癌対結節性過形成(PTC対NHP)により、12の有意なゲノム領域が得られた。4つ目の比較は悪性のものをすべてグループ化し、良性試料すべての群と比較した。この解析により、250の有意なゲノム領域が得られた。要約すると、本発明者らは、良性甲状腺試料と悪性甲状腺試料との間で明白なゲノムコピー数差を示す合計339のゲノム領域を同定する。これらのゲノム領域は、少なくとも740個の独自の遺伝子および/またはタンパク質にマッピングされる。
【0243】
方法
マイクロアレイおよびデータセット
合計86例の甲状腺試料をAffymetrix HumanSNP 6.0 DNAアレイで調べて、良性試料と悪性試料との間でコピー数が有意に異なる遺伝子を同定した。試料は、甲状腺病態に従って分類した:濾胞性腺腫(FA、n=20)、ハースル細胞腺腫(HA、n=10)、リンパ性甲状腺炎(LCT、n=5)、および結節性過形成(NHP、n=20)を調べた。グループ化する際に、これらの試料を良性(n=55)として分類した。同様に、濾胞癌(FC、n=4)、濾胞型甲状腺乳頭癌(FVPTC、n=12)、および甲状腺乳頭癌(PTC、n=15)もまた調べ、グループ化する際にはこれらを悪性(n=31)として分類した。
【0244】
Affymetrixソフトウェアを用いて、ヒトゲノムに沿って均等に配置された744,000個のプローブを包含するおよそ180万個のマーカーから、SNP6.0アレイ強度を抽出、正規化、および要約した。86例すべてのアレイにおける各プローブの強度中央値、および公的に利用可能な参照HAPMAP3 CELファイルのデータセット(www.HAPMAP.org)を参照セットとして共に使用し、この参照セットは所定のプローブの正常コピー数を示した。次に、参照セットに対する試料中の所定のプローブの相対強度を用いて、コピー数異常が存在するかどうかを判定した。相対強度の増加はコピー数獲得(増幅)を示し、相対強度の減少はコピー数喪失(欠失)を示した。
【0245】
次に、各試料について得られたSNP6.0相対強度を、circular binary segmentation(CBS)(Olshen, Venkatraman et al. 2004)を用いてセグメント(相当するコピー数データの領域)に変換した。次いでこれらのセグメントを用いて、PLINK‐無料の全ゲノム関連解析ツールセット(Purcell, Neale et al. 2007)を使用して、試料間の非重複特徴を作成した。カイ二乗検定およびPLINKを用いて、疾患ラベルに付随する上位の特徴を同定した。上位のPLINK特徴およびサポートベクターマシン(SVM)解析を用いて、分類を行った。各試料のCEL入力ファイル名を表2に記載する。
【0246】
表2. 解析した試料および病理学的分類
入力CELファイルを、各試料の特定の甲状腺亜型および簡易病態分類と共に記載する。甲状腺亜型は、濾胞性腺腫(FA)、ハースル細胞腺腫(HA)、リンパ性甲状腺炎(LCT)、結節性過形成(NHP)、濾胞癌(FC)、濾胞型甲状腺乳頭癌(FVPTC)、および乳頭癌(PTC)である。
【0247】
(表2)



【0248】
結果
甲状腺における新規なDNAコピー数解析
悪性の甲状腺結節と良性のものを識別するゲノム領域を同定するため、SNP6.0アレイに対する86例のハイブリダイゼーションを調べ、それらの予備結果を新規解析アルゴリズムへの入力データセットとして使用した。遺伝子は、Human Genome Build 18に基づいて、AffymetrixアノテーションファイルGenomeWideSNP_6.na26を用いて、マイクロアレイ配列にマッピングされた。4つの比較のうちの1つ目は、濾胞癌(FC、n=4)対濾胞性腺腫(FA、n=20)に焦点をおいた。これらの解析により、186個の公知の遺伝子および/またはタンパク質にマッピングされる、47の統計的に有意なゲノム領域が同定された(p<0.05)(表3)。
【0249】
濾胞型乳頭癌(FVPTC、n=12)と、結節性過形成としてカテゴリー化される試料(NHP、n=20)との間でも、同様の比較を行った。この解析により、49個の公知の遺伝子および/またはタンパク質にマッピングされる、30の有意なゲノム領域が同定された(表4)。甲状腺乳頭癌(PTC、n=15)とNHP(n=20)の比較を目的とした3つ目の解析により、15個の公知の遺伝子および/またはタンパク質にマッピングされる、12の有意なゲノム領域が同定された(表5)。
【0250】
4つ目の比較は、利用可能なすべての悪性試料からのデータをこのコホートにグループ化し(n=31)、それらを利用可能なすべての良性試料の群(n=55)と比較した。この解析により、561個の公知の遺伝子および/またはタンパク質にマッピングされる、250の有意なゲノム領域が同定された(表6)。
【0251】
要約すると、本発明者らは、良性試料と悪性試料の異なる亜群の間で明白なゲノムコピー数差を示す合計339のゲノム領域を同定する。これらのゲノム領域は、740個の公知のヒト遺伝子および/またはタンパク質にマッピングされる。
【0252】
表3. 濾胞癌(FC)と濾胞性腺腫(FA)を識別する上位47のゲノム領域
p<0.05の有意性フィルターを使用し、その後、降順にランクづけした。FC(n=4)におけるPLINK特徴をFA(n=20)と比較した。FCとFAを識別する47のゲノム領域は、56個の公知の遺伝子および/またはタンパク質にマッピングされる。
【0253】
ゲノム領域、所定のPLINK特徴の染色体番号およびゲノムの開始位置;P、所与のPLINK特徴に関する群比較のp値、特徴を有するFCの総数、所定のPLINK特徴を有するFC試料の数;特徴を有するFAの総数、所定のPLINK特徴を有するFA試料の数;ゲノムサイズ、所定のPLINK特徴のサイズ;遺伝子、所定のゲノム領域にマッピングされる公知の遺伝子の名称。単一のゲノム領域は、多くの場合に複数の遺伝子および/またはタンパク質をコードした。同様に、いくつかのゲノム領域(または有意なPLINK特徴)は、多くの場合に互いに隣り合ってマッピングされ、結果的に1つまたは複数の同じ遺伝子にマッピングされた。
【0254】
(表3)





【0255】
濾胞型乳頭癌(FVPTC、n=12)と、結節性過形成としてカテゴリー化される試料(NHP、n=20)との間でも、同様の比較を行った。この解析により、49個の公知の遺伝子および/またはタンパク質にマッピングされる、30の有意なゲノム領域が同定された(表3)。甲状腺乳頭癌(PTC、n=15)とNHP(n=20)の比較を目的とした3つ目の解析により、15個の公知の遺伝子および/またはタンパク質にマッピングされる、12の有意なゲノム領域が同定された(表4)。
【0256】
表4. 濾胞型乳頭癌(FVPTC)と結節性過形成(NHP)を識別する上位30のゲノム領域
p<0.05の有意性フィルターを使用し、その後、降順にランクづけした。FVPTC(n=12)におけるPLINK特徴をNHP(n=20)と比較した。FVPTCとNHPを識別する30のゲノム領域が、29個の公知の遺伝子およびまたはタンパク質にマッピングされる。
【0257】
ゲノム領域、所定のPLINK特徴の染色体番号およびゲノムの開始位置;P、所与のPLINK特徴に関する群比較のp値、特徴を有するFCの総数、所定のPLINK特徴を有するFC試料の数;特徴を有するFAの総数、所定のPLINK特徴を有するFA試料の数;ゲノムサイズ、所定のPLINK特徴のサイズ;遺伝子、所定のゲノム領域にマッピングされる公知の遺伝子の名称。単一のゲノム領域は、多くの場合に複数の遺伝子および/またはタンパク質をコードした。同様に、いくつかのゲノム領域(または有意なPLINK特徴)は、多くの場合に互いに隣り合ってマッピングされ、結果的に1つまたは複数の同じ遺伝子にマッピングされた。
【0258】
(表4)



【0259】
表5. 甲状腺乳頭癌(PTC)と結節性過形成(NHP)を識別する上位12のマーカー
p値(p<0.05)に基づいて、マーカーをランクづけする。PTC(n=15)におけるDNAコピー数を、NHP(n=20)と比較した。PTCとNHPを識別する12のマーカーが、15個の公知の遺伝子および/タンパク質にマッピングされる。
【0260】
ゲノム領域、所定のPLINK特徴の染色体番号およびゲノムの開始位置;P、所与のPLINK特徴に関する群比較のp値、特徴を有するFCの総数、所定のPLINK特徴を有するFC試料の数;特徴を有するFAの総数、所定のPLINK特徴を有するFA試料の数;ゲノムサイズ、所定のPLINK特徴のサイズ;遺伝子、所定のゲノム領域にマッピングされる公知の遺伝子の名称。単一のゲノム領域は、多くの場合に複数の遺伝子および/またはタンパク質をコードした。同様に、いくつかのゲノム領域(または有意なPLINK特徴)は、多くの場合に互いに隣り合ってマッピングされ、結果的に1つまたは複数の同じ遺伝子にマッピングされた。
【0261】
(表5)

【0262】
4つ目の解析は、利用可能なすべての悪性試料からのデータをこのコホートにグループ化し(n=31)、それらを利用可能なすべての良性試料の群(n=55)と比較した。この解析により、561個の公知の遺伝子および/またはタンパク質にマッピングされる、250の有意なゲノム領域が同定された(表5)。
【0263】
表6. 悪性(M)と良性(B)を識別する上位100のマーカー
p値(p<0.05)に基づいて、マーカーをランクづけする。M(n=31)におけるDNAコピー数を、B(n=55)と比較した。合計250のマーカーが悪性と良性を識別し、これらは473個の公知の遺伝子および/タンパク質にマッピングされる。
【0264】
ゲノム領域、所定のPLINK特徴の染色体番号およびゲノムの開始位置;P、所与のPLINK特徴に関する群比較のp値、特徴を有するFCの総数、所定のPLINK特徴を有するFC試料の数;特徴を有するFAの総数、所定のPLINK特徴を有するFA試料の数;ゲノムサイズ、所定のPLINK特徴のサイズ;遺伝子、所定のゲノム領域にマッピングされる公知の遺伝子の名称。単一のゲノム領域は、多くの場合に複数の遺伝子および/またはタンパク質をコードした。同様に、いくつかのゲノム領域(または有意なPLINK特徴)は、多くの場合に互いに隣り合ってマッピングされ、結果的に1つまたは複数の同じ遺伝子にマッピングされた。
【0265】
(表6)









【0266】
要約すると、本発明者らは、良性試料と悪性試料の異なる亜群の間で明白なゲノムコピー数差を示す合計339のゲノム領域を同定する。これらのゲノム領域は、740個の公知のヒト遺伝子および/またはタンパク質にマッピングされるが、いくつかの有意なゲノム領域の性質は今のところわかっていない。
【0267】
実施例2:全4つの解析間の有意なゲノム領域遺伝子リストの照合
各比較によって作成された、結果として得られた遺伝子リスト(表7)間の冗長性のレベルを、ベン図を用いて調べた。119個の遺伝子のうち2個が、遺伝子のFC対FAリスト(表3)、FVPTC対NHPリスト(表4)、およびPTC対NHPリスト(表5)に重複していた(図6A)。117個の独自の遺伝子のこのリストを組み合わせ、これを、悪性対良性解析からマッピングされた遺伝子のリスト(表6)と比較した。本発明者らの結果から、24個の遺伝子が全4つの遺伝子リストに重複することが示される(図6B)。さらに、ベン比較の別のセットから、FC対FAリストが、M対B遺伝子リストと重複する遺伝子の大部分(14/24)に寄与することが実証される(図6C)。対照的に、FVPTC対NHPリストおよびPTC対NHPリストは、組み合わせた場合に、M対Bリストと共有する遺伝子のうちの10/24にしか寄与しなかった(図6D)。
【0268】
さらに、甲状腺試料の異なるコホートを用いて、mRNA遺伝子発現および選択的エキソン使用を調べた。この解析により、悪性の甲状腺結節と良性のものを識別し得る4918個の遺伝子が発見された。その全体が参照により本明細書に組み入れられる、米国特許出願第12/592,065号を参照されたい。本明細書に記載する研究において、本発明者らは発見努力をDNAコピー数解析に集中し、これまでに、甲状腺病態を識別し得る少なくとも292個の遺伝子にマッピングされる339の遺伝子領域を見出した。「mRNA遺伝子」の古いリストを「DNAコピー数遺伝子」の新たなリストと比較し、両方のリストに重複する73個の遺伝子を見出したが、これにより、甲状腺病態のマーカーとしてのこれらの遺伝子の重要性が強化される(図7)。
【0269】
(表7)有意なゲノム領域(PLINK特徴)の総数および個々の比較により生じた遺伝子

【0270】
実施例3:分子プロファイリングのための例示的な装置
いくつかの好ましい態様において、本発明の分子プロファイリングビジネスは、良性試料と悪性試料、良性試料と正常試料、または悪性試料と正常試料との間のコピー数変化などの多型と相関する、表1、3、4、5、6、もしくは8、またはリスト1〜45のDNA配列、またはそれらの組み合わせのリストをまとめる。遺伝子またはDNA配列のサブセットが、分子プロファイリングビジネスにより生体試料の診断において使用するために選択される。分子プロファイリングビジネスにより使用するために選択されたゲノム領域のサブセットに相補的な短い(すなわち、12〜25ヌクレオチド長の)オリゴヌクレオチドの組成物が、当技術分野において公知の標準的な方法により合成され、ニトロセルロース、ガラス、ポリマー、またはチップなどの固体支持体上の公知の位置に固定化される。
【0271】
実施例4:生体試料の分子プロファイリング
生体試料からリボ核酸を抽出し、検出可能な蛍光標識で標識し、固体支持体に結合しているオリゴヌクレオチドとストリンジェントな条件下でハイブリダイズさせる。ハイブリダイズしなかったリボ核酸を洗浄除去し、公知の各オリゴヌクレオチド位置において未加工の蛍光強度を測定することにより、結合しているリボ核酸の量を測光法で測定する。未加工の蛍光強度値を正規化し、フィルターをかけ、遺伝子発現産物レベルに変換する。遺伝子発現産物レベルを、生体試料の細胞型組成に関して遺伝子発現産物レベルを補正する予備分類アルゴリズムに入力する。補正された遺伝子発現産物レベルを、生体試料を良性、悪性、または正常として分類する訓練アルゴリズムに入力する。訓練アルゴリズムは、診断および信頼水準を含むその出力の記録を提供する。
【0272】
実施例5:甲状腺結節の分子プロファイリング
ある個体が甲状腺のしこりに気づく。その個体は家庭医を受診する。家庭医は、しこりから試料を採取し、それを分子プロファイリング解析に供することを決める。該家庭医は分子プロファイリングビジネスのキットを使用して、細針吸引により試料を採取し、妥当性試験を実施し、液体ベースの細胞診溶液中に試料を保存し、分子プロファイリングビジネスにそれを送る。分子プロファイリングビジネスは、試料の一部を細胞学的解析のために分割し、残りの試料については、試料から核酸を抽出し、抽出されたmRNAおよびDNA試料の品質および適合性を解析し、発現レベル、選択的エキソン使用、および表1、3、4、5、6、または8に記載される遺伝子のサブセットのゲノムDNAマーカーコピー数変化を解析する。この場合、プロファルされる特定のマーカー(DNAまたはRNA)は、試料型、医師の予備的診断、および分子プロファイリング会社により決定される。
【0273】
分子プロファイリングビジネスはデータ解析し、図4に例証されるように、結果として得られた診断を個体の医師に提供する。結果は、1) プロファイルされたDNAマーカーのリスト、2) プロファイリングの結果(例えば、頬側拭き取りによって得られた組織から単離された核酸からのDNAマーカーコピー数などの標準に対して正規化されたDNAマーカーコピー数)、3) 一致する型の正常組織について予測されるDNAマーカーコピー数、および4) 分子プロファイリングの結果に基づく診断および推奨され治療を提供する。分子プロファイリングビジネスは、提供された製品およびサービスについて、個体の保険提供者に代金を請求する。
【0274】
実施例6:分子プロファイリングは細胞学的調査単独に比べて改善されている
ある個体が、甲状腺の疑わしいしこりに気づく。その個体は、プライマリケア医を受診し、プライマリケア医が個体を調査し、内分泌学者へ照会させる。内分泌学者が、細針吸引を介して試料を得て、細胞学的試験検査室へ試料を送る。細胞学的試験検査室が、細針吸引液の一部に対してルーチンの細胞学的試験を実施し、その結果は不明確(即ち、不確定)である。細胞学的試験検査室は、残りの試料が分子プロファイリングに適している可能性があることを内分泌学者に提案し、内分泌学者が同意する。
【0275】
残りの試料は、本明細書中の方法および組成物を使用して分析される。分子プロファイリング分析の結果は、初期濾胞細胞癌の高い確率を示唆する。結果は、患者の年齢、およびしこりまたは結節のサイズを含む、患者のデータと組み合わせられた分子プロファイリング分析が、甲状腺切除と、それに続く放射性ヨウ素アブレーションを必要とすることをさらに示唆する。内分泌学者は結果を検討し、推奨された治療を処方する。
【0276】
細胞学的試験検査室は、ルーチンの細胞学的試験および分子プロファイリングについて、内分泌学者に代金を請求する。内分泌学者は、細胞学的試験検査室へ支払いを送り、与えられた全ての製品およびサービスについて個体の保険提供者に代金を請求する。細胞学的試験検査室は、分子プロファイリングビジネスに分子プロファイリングについての支払いを渡し、小さな差額を差し引く。
【0277】
実施例7:第三者により実施される分子プロファイリング
ある個体が、頸部の疑わしいしこりについて医師に訴える。医師は、その個体を調査し、結果を保留にして、分子プロファイリング試験および追跡調査を処方する。個体は、CLIA検査室としても公知の臨床試験検査室を訪れる。CLIA検査室は、本発明の分子プロファイリングを実施するライセンスを有する。個体は細針吸引を介してCLIA検査室で試料を提供し、試料は本明細書中の分子プロファイリングの方法および組成物を使用して分析される。分子プロファイリングの結果は、個体の医師に電子的に伝えられ、個体は追跡調査のスケジュールを決めるために連絡を受ける。医師は、分子プロファイリングの結果を個体に提示し、治療を処方する。
【0278】
本発明の好ましい態様が本明細書に示され説明されたが、そのような態様は例として提供されているに過ぎないことが当業者には明白であると考えられる。多数の変動、変化、および置換が、本発明から逸脱することなく、当業者に想到されると考えられる。本明細書に記載された本発明の態様の様々な代替物が、本発明の実施において使用され得ることが理解されるべきである。以下の特許請求の範囲が、本発明の範囲を定義し、これらの特許請求の範囲の範囲に含まれる方法および構造、ならびにそれらの等価物が、本発明に包含されるものとする。
【0279】
参照による組み入れ
本明細書中に言及された全ての刊行物および特許出願が、あたかも個々の刊行物または特許出願が、各々、具体的にかつ個々に、参照により組み入れられると示されたかのごとく、参照により本明細書に組み入れられる。

【特許請求の範囲】
【請求項1】
以下の段階を含む、対象における甲状腺疾患を診断するための方法:
(a) 対象からDNA試料を提供する段階;
(b) 表3〜6に記載される多型から選択される1つもしくは複数の多型、またはそれらの相補体の存在を検出する段階;および
(c) 段階(b)の結果に基づいて、該対象が悪性または良性の甲状腺状態を有するかどうか、または有する可能性が高いかどうかを判定する段階。
【請求項2】
悪性状態が、濾胞癌、濾胞型乳頭癌、および甲状腺乳頭癌からなる群より選択される、請求項1記載の方法。
【請求項3】
良性甲状腺状態が、濾胞性腺腫および結節性過形成からなる群より選択される、請求項1記載の方法。
【請求項4】
対象から提供されるDNA試料が、甲状腺組織を含む試料から採取される、請求項1記載の方法。
【請求項5】
多型が、正常試料と比較した場合のコピー数の変化を含む、請求項1記載の方法。
【請求項6】
正常試料と比較した場合のコピー数の変化が欠失を含む、請求項5記載の方法。
【請求項7】
正常試料と比較した場合のコピー数の変化がコピー数の増加を含む、請求項5記載の方法。
【請求項8】
正常試料が同一対象からのDNAの試料を含む、請求項5記載の方法。
【請求項9】
正常試料が異なる対象からのDNAの試料を含む、請求項5記載の方法。
【請求項10】
正常試料が、公知であるか、または一般に受け入れられている値を含む、請求項5記載の方法。
【請求項11】
段階(b)が:
(a) DNA試料を、表3〜6に記載される1つもしくは複数の多型またはそれらの相補体に特異的に結合する1つまたは複数の結合剤と接触させる段階;および
(b) 該DNA試料が該1つまたは複数の結合剤に特異的に結合するかどうかを判定する段階
を含み、該DNA試料が該1つまたは複数の結合剤に結合することにより、該対象における多型の存在が示される、請求項1記載の方法。
【請求項12】
検出段階(b)が、表3〜6に記載される1つもしくは複数のマーカー領域またはそれらの相補体を含む1つまたは複数の核酸領域の配列決定を含む、請求項1記載の方法。
【請求項13】
検出段階(b)が、表3〜6に記載される1つもしくは複数のマーカー領域またはそれらの相補体を含むDNAの量を定量する段階を含む、請求項1記載の方法。
【請求項14】
定量段階がPCRを含む、請求項13記載の方法。
【請求項15】
PCRがリアルタイムPCRを含む、請求項14記載の方法。
【請求項16】
定量段階がハイブリダイゼーションを含む、請求項13記載の方法。
【請求項17】
濾胞性腺腫、濾胞癌、結節性過形成、濾胞型乳頭癌、または甲状腺乳頭癌と相関する1つまたは複数の遺伝子の発現レベルを測定する段階をさらに含む、請求項1記載の方法。
【請求項18】
表3〜6に記載される1つもしくは複数の多型またはそれらの相補体に特異的に結合する1つまたは複数の結合剤を含む組成物。
【請求項19】
1つまたは複数の結合剤がオリゴヌクレオチドを含む、請求項18記載の組成物。
【請求項20】
オリゴヌクレオチドがRNAまたはDNAを含む、請求項19記載の組成物。
【請求項21】
1つまたは複数の結合剤がアプタマー、抗体、ペプチド核酸、またはピラノシルRNAを含む、請求項18記載の組成物。
【請求項22】
1つまたは複数の多型が欠失または重複を含む、請求項18記載の組成物。
【請求項23】
以下を含む、対象における甲状腺疾患を診断するためのキット:
(a) 表3〜6に記載される多型からなる群より選択される1つもしくは複数の多型、またはそれらの相補体に特異的に結合する少なくとも1つの結合剤;および
(b) 対象からのDNA試料に対する該少なくとも1つの結合剤の結合を検出するための試薬。
【請求項24】
少なくとも1つの結合剤が少なくとも1つのオリゴヌクレオチドを含む、請求項23記載のキット。
【請求項25】
少なくとも1つの結合剤が少なくとも1つのアプタマー、抗体、ペプチド核酸、またはピラノシルRNAを含む、請求項23記載のキット。
【請求項26】
少なくとも1つの結合剤が検出可能な標識で標識されている、請求項23記載のキット。
【請求項27】
少なくとも1つの結合剤が表面に固定化されている、請求項23記載のキット。
【請求項28】
キットの使用説明書を含む、請求項23記載のキット。
【請求項29】
以下の段階を含む、対象における甲状腺疾患を診断するためのビジネス方法:
(a) 対象から甲状腺疾患を診断する段階であって、該診断が請求項1〜17のいずれか一項記載の方法によって行われる段階;
(b) 診断の結果を対象、医療提供者、または第三者に提供する段階;および
(c) 該対象、医療提供者、または第三者に代金を請求する段階。
【請求項30】
以下の段階を含む、対象における甲状腺疾患を診断するための方法:
(a) 対象からDNA試料を提供する段階;
(b) リスト1〜44から選択される1つもしくは複数のバイオマーカー、またはそれらの相補体の存在を検出する段階;および
(c) 段階(b)の結果に基づいて、該対象が悪性または良性の甲状腺状態を有するかどうか、または有する可能性が高いかどうかを判定する段階。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公表番号】特表2012−525855(P2012−525855A)
【公表日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願番号】特願2012−510038(P2012−510038)
【出願日】平成22年5月7日(2010.5.7)
【国際出願番号】PCT/US2010/034140
【国際公開番号】WO2010/129934
【国際公開日】平成22年11月11日(2010.11.11)
【出願人】(511118469)ベラサイト インコーポレイテッド (2)
【Fターム(参考)】