癌の分類のための遺伝子発現サイン
本発明は、癌及び起源組織を、特異的なマイクロRNA及びそれに関連する核酸分子の発現パターンの解析によって分類するためのプロセスを提供する。マイクロRNAの木に基づいた発現の枠組みに従う分類は、治療の最適化及び特異的な療法の決定を可能にする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、癌の分類及び癌の起源組織の同定のための方法に関する。具体的には、本発明は、特定の癌と関係があるマイクロRNA分子、及び特定の癌に関連する又は由来する種々の核酸分子に関する。
【背景技術】
【0002】
マイクロRNAは、腫瘍形成に関与し4、著しい組織特異性を示す5〜7新規のクラスの非コードの、制御RNA遺伝子1〜3である。これらは、高度に組織特異的なバイオマーカーとして出現し2,5,6、分化の発生の決定をコードする場面において重要な役割を担うと仮定されている。種々の研究が、マイクロRNAを、特異的な悪性腫瘍の発生に関係付けている4。
【0003】
転移性の原発不明癌(CUP)が、新しい癌の全症例の3〜5%を占め、群としては、通常、非常に攻撃的な疾患であり、予後は芳しくない10。CUPの概念は、そのような患者の適切な治療を顕著に遅らせる場合がある、複雑で高価なプロセスであることが多いにもかかわらず、癌の起源を同定する現在の方法に限界があることに由来する。最近の研究から、CUPについての証拠に基づいた治療がないことから、臨床管理における大きな変動が明らかになった11。多くのプロトコールが評価された12が、比較的小さな利益しか示されていない13。したがって、腫瘍の起源組織を決定することが、分子診断の重要な、臨床における適用となる9。
【0004】
腫瘍の起源組織についての分子的分類研究14〜17は、一般に、ドメインに特異的な知識を活用しない分類アルゴリズムを使用してきた。すなわち、組織は、推測的に等価であるとして扱われ、胚形成における共通の発生学的起源を有する組織型間の根本的な類似性は無視された。注目すべき例外は、病態の分類木に基づいたSheddenらによる研究である18。これらの研究は、生物学的特色(例えば、mRNAの発現レベル)の効果を平均する機械学習の方法、すなわち、自動処理にはより適しているが、推定機構を使用したり、生み出したりはしないアプローチを使用した。
【発明の概要】
【発明が解決しようとする課題】
【0005】
種々のマーカーが、特定の型の癌及び腫瘍の起源組織を指し示すために提案されている。しかし、腫瘍マーカーの診断精度は、まだ定義されていない。したがって、特定の型の癌を診断及び分類するためのより効率的且つ有効な方法が求められている。
【課題を解決するための手段】
【0006】
本発明は、特定の癌及び腫瘍の起源組織の同定、分類及び診断において使用するための特異的な核酸配列を提供する。また、生物学的試料中の核酸配列の存在量に基づいて、核酸配列を、対象の予後の評価及び適切な治療の決定のための予後マーカーとして使用することもできる。
【0007】
本発明は、腫瘍の分類のための、マイクロRNAに基づいた分類子の開発に一部基づく。マイクロRNA発現レベルを、22個の異なる腫瘍の組織及び転移に由来するパラフィンに包埋した400個の新鮮凍結試料において測定した。253個の試料のマイクロRNAのマイクロアレイのデータを使用して、それぞれが特異的な示差的診断の役割に連結した48個のマイクロRNAに基づいて、分類子を構築した。試料のうちの3分の2が、90%を超える精度を有する高い信頼度で分類された。83個の試料の独立した盲検の試験セットにおいては、高い信頼度の全般的な精度は、89%に達した。分類の精度は、131個の転移試料を包含する、大部分の組織のクラスについては100%に達した。マイクロRNAバイオマーカーの有意性を、65個の追加の盲検の試験試料を使用して、高感度qRT−PCRによってさらに確認した。これらの知見によって、CUPについての新規のバイオマーカーとしてのマイクロRNAの有用性が実証されている。分類子は、統計学的に意味のある信頼度の尺度を提供し、広い生物学的な及び診断における適用を有し得る。
【0008】
第1の態様によれば、本発明は、生物学的試料の起源組織を同定する方法を提供し、この方法は、対象から生物学的試料を得るステップと;マイクロRNAのあらかじめ決定したセット中の個々の核酸の発現を決定するステップと;前記試料について起源組織を分類子によって分類するステップとを含む。1つの実施形態によれば、前記分類子は、決定木モデルである。
【0009】
別の態様によれば、本発明は、生物学的試料の起源組織を分類する方法を提供し、この方法は、対象から生物学的試料を得るステップと;前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の発現プロファイルを決定するステップと;前記発現プロファイルを参照発現プロファイルと比較するステップとを含み、それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記試料の起源組織の同定を可能にする。
【0010】
特定の実施形態によれば、前記組織は、肝臓、肺、膀胱、前立腺、乳房、結腸、卵巣、精巣、胃、甲状腺、膵臓、脳、子宮内膜、頭頚部、リンパ節、腎臓、メラニン形成細胞、髄膜、胸腺、消化管及び前立腺からなる群から選択される。
【0011】
いくつかの実施形態によれば、前記生物学的試料は、癌性の試料である。
【0012】
別の態様によれば、本発明は、癌又は過形成を分類する方法を提供し、この方法は、対象から生物学的試料を得るステップと;前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップと;前記得られた測定値を、前記核酸の存在量を示す基準値と比較するステップとを含み、それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記癌又は過形成の分類を可能にする。
【0013】
1つの実施形態によれば、前記試料を、転移性の癌を有する対象から得る。別の実施形態によれば、前記試料を、原発不明癌(CUP)を有する対象から得る。さらなる実施形態によれば、前記試料を、原発性癌を有する対象から得る。さらに別の実施形態によれば、前記試料は、未同定起源の腫瘍、転移性腫瘍又は原発性腫瘍である。
【0014】
特定の実施形態によれば、前記癌は、肝臓癌、肺癌、膀胱癌、前立腺癌、乳癌、結腸癌、卵巣癌、精巣癌、胃癌、甲状腺癌、膵臓癌、脳癌、子宮内膜癌、頭頚部癌、リンパ節癌、腎臓癌、メラノーマ、髄膜癌、胸腺癌、前立腺癌、消化管間質癌及び肉腫からなる群から選択される。
【0015】
いくつかの実施形態によれば、前記癌は、肺カルチノイド、肺胸膜中皮腫及び肺扁平上皮細胞癌からなる群から選択された肺癌である。
【0016】
その他の実施形態によれば、前記試料は、体液、細胞系及び組織試料からなる群から選択される。いくつの実施形態によれば、前記組織は、新鮮組織、凍結組織、固定組織、ロウ埋包組織又はホルマリン固定パラフィン埋包(FFPE)組織である。
【0017】
本発明の分類方法は、少なくとも1つの分類子アルゴリズムの使用をさらに含み、前記分類子アルゴリズムは、決定木分類子、ロジスティック回帰分類子、直線回帰分類子、(K最近傍をはじめとする)最近傍分類子、ニューラルネットワーク分類子、ガウシアン混合モデル(GMM)分類子、及びサポートベクターマシン(SVM)分類子からなる群から選択される。統合された又は大多数の決定に達するために、分類子は、(2分木をはじめとする)決定木構造又は(加重票決をはじめとする)票決スキームを使用して、1つ又は複数の分類子アルゴリズムの分類を比較することができる。
【0018】
本発明は、肝臓起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜4からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肝臓起源の癌の指標となる。
【0019】
本発明は、精巣起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜6からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、精巣起源の癌の指標となる。
【0020】
本発明は、肺起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺起源の癌の指標となる。
【0021】
本発明は、肺カルチノイド起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜48、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺カルチノイド起源の癌の指標となる。
【0022】
本発明は、肺胸膜起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺胸膜起源の癌の指標となる。
【0023】
本発明は、肺扁平上皮起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺扁平上皮起源の癌の指標となる。
【0024】
本発明は、膵臓起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、膵臓起源の癌の指標となる。
【0025】
本発明は、脳起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜24、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、脳起源の癌の指標となる。
【0026】
本発明は、乳房起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、乳房起源の癌の指標となる。
【0027】
本発明は、前立腺起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、前立腺起源の癌の指標となる。
【0028】
本発明は、子宮内膜起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、子宮内膜起源の癌の指標となる。
【0029】
本発明は、甲状腺起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、甲状腺起源の癌の指標となる。
【0030】
本発明は、頭頚部起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、頭頚部の癌の指標となる。
【0031】
本発明は、結腸起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜52、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、結腸起源の癌の指標となる。
【0032】
本発明は、膀胱起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、膀胱起源の癌の指標となる。
【0033】
本発明は、卵巣起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、卵巣起源の癌の指標となる。
【0034】
本発明は、リンパ節起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、リンパ節起源の癌の指標となる。
【0035】
本発明は、腎臓起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、腎臓起源の癌の指標となる。
【0036】
本発明は、メラニン形成細胞起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、メラニン形成細胞起源の癌の指標となる。
【0037】
本発明は、髄膜起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、髄膜起源の癌の指標となる。
【0038】
本発明は、胸腺細胞(胸腺腫−B2型)起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、胸腺細胞(胸腺腫−B2型)起源の癌の指標となる。
【0039】
本発明は、胸腺細胞(胸腺腫−B3型)起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、胸腺細胞(胸腺腫−B3型)起源の癌の指標となる。
【0040】
本発明は、消化管間質起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、癌の指標となる。
【0041】
本発明は、肉腫起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、消化管間質起源の癌の指標となる。
【0042】
本発明は、胃起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、胃起源の癌の指標となる。
【0043】
別の態様によれば、本発明は、癌を分類するためのキットを提供し、前記キットは、配列番号1〜96;それらの相補的な配列;及びそれらに対して少なくとも約80%の同一性を有する配列からなる群から選択された核酸配列を含むプローブを含む。
【0044】
本発明のこれら及びその他の実施形態が、以下の図、説明及び特許請求の範囲を併せると明らかになるであろう。
【図面の簡単な説明】
【0045】
【図1A】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。原発性結腸癌の試料と転移性結腸癌の試料とを比較し、セットのうちの少なくとも1つにおいてシグナルの閾値を超える各マイクロRNAについて、p値(対数シグナル上での対応のないt−検定)を計算する。ソートしたp値は、p値の不規則分布と一致する(0〜1の範囲において均一、黒色の点線)。下の方にある線は、10%の誤発見率(FDR)の線を示し、この線より下のp値は、10%の誤発見の確率を有する。結腸癌の転移については、いずれの特色も、10%の誤発見試験には合格しない。
【図1B】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。原発性結腸癌試料対転移性結腸癌試料の平均log2シグナルのドットプロット(十字;点線は、視覚を補助するものであり、発現が等しい対角線を示す)。
【図1C】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。(Aと同様)原発性胃癌とリンパ節に転移した胃癌との比較。最も低いp値を有する最初の3つのマイクロRNAは、(10%の誤発見率における)誤発見試験に合格する。
【図1D】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。(Bと同様)原発性胃癌対リンパ節に転移した胃癌のドットプロット。FDR試験に合格する3つのマイクロRNAが強調されている:miR−133a(配列番号97)及びmiR−143(配列番号99)は、原発性腫瘍中で過剰発現し、miR−150(配列番号101)は、転移において過剰発現する。
【図2】決定木分類子の構造を示す図であり、24個のノード(番号を付けてある、表2)、及び25個の葉を有する。各ノードは、試料の2つのセット間の二分決定であり、それらの決定は、ノードの左と右にある。一連の二分決定は、ノード#1から始まり、下方に移動し、木の「葉」である、可能な腫瘍型のうちの1つに至る。ノード#1において左のブランチに分類された試料は、「肝臓」のクラスに帰属する。それ以外の試料は、ノード#2に進む。エンドポイント(木の「葉」)に達し、この試料についての予測されるクラスが示されるまで、引き続いて、ノードにおいてマイクロRNAの発現レベルを使用して、決定を行う。例えば、「乳房」として分類される試料は、ノード#1、#2、#3、#12、#16及び#17を通る経路を通り、ノード#3、#16及び#17においては左のブランチをとり、ノード#1、#2及び#12においては右のブランチをとる必要があり、その他のノードではいずれにおいても決定は必要ではない。木の構造を特定するにあたっては、トレーニングセットのデータにおいて観察された特性を有する臨床病理学的な事柄を組み合わせた。例えば、胸腺の試料は、上皮に関連するマイクロRNAの発現が異なる、それらの組織学的な型に従って2つの群に分けた。この発現の差は、B2型腫瘍におけるリンパ球のより高い比率に明白に起因する。最初の主要な分岐(ノード#3)は、上皮起源の組織を、その他の起源又は混合起源の組織から、すなわち、それらのマイクロRNAの発現プロファイル、特に、miR−141(配列番号69)/200(配列番号3、11)ファミリーの発現において反映される生物学的な差を分ける。ここでは、胸腺B2腫瘍を、非上皮性組織又は混合性組織と共に(右のブランチ上に)グループ化し、後に、胸腺B2腫瘍は、それらとは分かれる(図4)。肝臓及び精巣は、木の最初に置いた。これは、これらの組織が、それらを容易に同定することができ、その後の干渉を減少させるマイクロRNA(それぞれ、hsa−miR−122a(配列番号1)及びhsa−miR−372(配列番号5))の非常に特異的な発現を含有することによる。それに続くノードは、消化管とその他の上皮組織との、miR−194(配列番号37)及び追加のマイクロRNAを使用する分離(ノード#12)を反復した(図3B)。肺カルチノイド腫瘍は、その他の型の肺の腫瘍とは対照的に、miR−194の高い発現を有することが見出された。これは、それらの独特な生物学的特徴に関連し得る。したがって、これらの腫瘍は、ノード#12においては、消化管組織と共にグループ化し、ノード#13においては、その他のマイクロRNAを使用して、それらとは分ける(図3A)。食道癌は、それらの組織学的な型によれば、分類のために使用するマイクロRNAの発現が実質的に異なる:食道胃接合部の腺癌は、胃癌の試料に類似し、一方、扁平上皮の試料は、上皮性の高い頭頚部癌に対して高い類似性を有した。したがって、「胃*」のクラスは、胃癌及び食道胃接合部の腺癌の両方を包含し;「頭頚部*」のクラスは、頭頚部の癌及び食道の扁平上皮癌を包含する。「GIST」は、消化管間質腫瘍を示す。患者の性別又は利用可能な臨床病理学的な情報等の追加の情報は、再度のトレーニングの必要なしで、葉又はブランチを刈り込むことによって、容易に木に組み込まれる。
【図3A】決定木のノードにおける二分決定を示すグラフである。所与のノードについて、決定アルゴリズムをトレーニングする場合、このノードの可能な成果(「葉」)である試料のクラスのみを、トレーニングのために使用する。ノード#13(図2を参照されたい)においては、肺カルチノイド腫瘍(三角、7つの試料)が、hsa−miR−21(配列番号31)及びhsa−let−7e(配列番号47)の発現レベルを使用して、消化管起源の腫瘍(灰色、中抜きの四角、49個試料)から容易に分かれる(1つの外れ値を有する)。木においてそれより前に枝分れしたその他の試料、及びこれらのマイクロRNAによっては十分に分けられないその他の試料(丸、283個の試料)は考慮されない。重要なことには、消化管起源の転移性の試料(中抜きの四角、23個の試料)は、原発性腫瘍と共に分布する。実線は、ノード#13のロジスティック回帰モデルが確率P=0.5を割り当てるhsa−miR−21及びhsa−let−7eの値を示す。線より上の点には、確率P>0.5が割り当てられ、これらは、左のブランチをとり(ノード#14へ)、線より下の点は、右のブランチをとり、肺カルチノイドとして分類される。
【図3B】決定木のノードにおける二分決定を示すグラフである。木中のノード#12におけるhsa−miR−194(配列番号37)、hsa−miR−145(配列番号45)及びhsa−miR−205(配列番号7)の発現レベル(図2)。これらのマイクロRNAを使用して、ノード#12の左のブランチ、すなわち、胃、膵臓、結腸又は肺カルチノイドからの試料(灰色の四角、56個の試料、中抜きの四角は、転移性の試料を示す)と、ノード#12の右のブランチ中のその他の上皮性の試料(灰色の三角、152個の試料、中抜きの三角は、転移性の試料を示す)との間を分けることができる。
【図3C】決定木のノードにおける二分決定を示すグラフである。qRT−PCRによる、ノード#1で使用したマイクロRNA(表2)の確認:肝臓(四角、9個の試料)及び肝臓以外の試料(三角、71個の試料)は、hsa−miR−122a(配列番号1)及びhas−miR−141(配列番号69)を使用して容易に分かれる(図5)。各試料について示すシグナルは、U6とマイクロRNAとの間のサイクル閾値(Ct)の差である。より大きな差は、このマイクロRNAのより高い発現を意味する。肝臓の腫瘍は、hsa−miR−122aのより高い発現及びhsa−miR−141のより低い発現を有する。線は、ロジスティック回帰の決定の閾値を示す(図5)。
【図3D】決定木のノードにおける二分決定を示すグラフである。qRT−PCRによる、ノード#12において使用したマイクロRNA(表2)の確認:消化管腫瘍の試料(四角、13個の試料)は、その他の上皮性の腫瘍(三角、52個の試料)と比較して、hsa−miR−145(配列番号45)、hsa−miR−194(配列番号37)及びhsa−miR−205(配列番号7)の独特な発現レベルを示す(図5)。qRT−PCRによって得られた結果は、このノードにおけるマイクロアレイのプラットフォームによって得られた結果(パネルB)と非常に類似し、類似の分布を示す。
【図4】一次元におけるロジスティック回帰モデルを示すグラフである。木中のノード#8についてのロジスティック回帰モデル(表2)は、左のブランチの群(すなわち、胸腺B2)に属する各試料に、試料中のhsa−miR−205(配列番号7)の発現レベルの関数(挿入図)としての確率(P、実線の曲線)を割り当てる(Mは、測定した発現レベルの自然対数である)。棒は、胸腺B2の試料(ノード#8の左)及び試料(ノード#8の右)中のhsa−miR−205の発現レベル分布を示す。数は、各瓶中の試料の数を示す。M>9.2を有する試料は、P>0.5を有し(灰色の点線)、胸腺のクラスに帰属させ、一方、全てのその他の試料は、ノード#8においては右のブランチに帰属させ、その他の決定ノードによる分類を続ける。
【図5A】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。qRT−PCRにおいて測定したhsa−miR−122a(配列番号1)及びhsa−miR−141(配列番号69)の発現レベルを使用して、肝臓の試料を、肝臓以外の試料から分けるためにトレーニングしたロジスティック分類子の確率(P)出力(図3C)。四角は、9つの肝臓の試料を示し、三角は、71個の肝臓以外の試料を示す。Pth=0.8における閾値は、これらの2つのクラスを容易に分け、1つの外れ値を有する。
【図5B】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。対応するROC曲線は、AUC=0.988を有し、これは、ほぼ最適である。丸は、Pth=0.8を示し、これは、肝臓の試料の同定に関して100%の感度及び99%の特異性を有する。
【図5C】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。qRT−PCRにおいて測定したhsa−miR−145(配列番号45)、hsa−miR194(配列番号37)及びhsa−miR−205(配列番号7)の発現レベル(決定木中のノード#12、図2)を使用して、消化管(GI)の試料を、消化管以外の試料から分けるためにトレーニングしたロジスティック分類子の確率(P)出力(図3D)。四角は、13個の結腸又は膵臓の試料を示し、三角は、52個のその他の上皮性の試料(ノード#12における右のブランチ)を示す。Pth=0.5における閾値は、6つのエラーを有する。
【図5D】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。対応するROC曲線は、AUC=0.914を有する。丸は、Pth=0.5を示し、これは、消化管の試料の同定に関して92%の感度及び91%の特異性を有する。
【発明を実施するための形態】
【0046】
本発明は、特異的な核酸配列を、癌を分類するために使用することができるという発見に基づく。本発明は、異なる組織及び腫瘍起源を見分けるために使用することができる高感度で、特異的且つ正確な方法を提供する。腫瘍の組織起源を決定するために、新しい、マイクロRNAに基づいた分類子を開発した。この分類子は、驚くほど少数のマイクロRNAに基づいて、約90%の精度を達成する。この分類子は、透過的アルゴリズムを使用し、特異的なバイオマーカーの明確な解釈を可能にする。この分類子は、わずか48個のマイクロRNAマーカーを使用して、22個のクラス間で、盲検の試験試料上、及び130個超の転移について約90%の全般的な精度を達成する。本発明によれば、分類木中の各ノードを、独立した示差的診断ツールとして、例えば、異なる型の肺癌の同定において使用することができる。驚くほど少数のマーカーを使用する分類子の性能は、マイクロRNAの、組織特異的な癌のバイオマーカーとしての有用性を強調し、CUPの診断を促進するための有効な手段を提供する。
【0047】
異なる腫瘍起源を見分けることが可能になれば、最良で且つ最適な治療の患者への提供が促進されることになる。
【0048】
本発明は、本発明の特異的なマイクロRNA分子のレベルを比較することによる、癌を検出、診断、モニター、段階付け及び予知するための、定量及び定性の両面における診断アッセイ及び診断方法を提供する。そのようなレベルを、好ましくは、生検、腫瘍試料、細胞、組織及び/又は体液のうちの少なくとも1つ中で測定する。本発明は、生検、腫瘍試料、細胞、組織又は体液中の前記マイクロRNA分子のレベルの変化を解析することによる、特異的な癌の存在を診断するための方法を提供する。
【0049】
本発明においては、生検、腫瘍試料、細胞、組織又は体液中の前記マイクロRNAレベルの存在を決定することは、異なる癌を見分けるのに特に有用である。
【0050】
本発明の全ての方法は、場合により、その他の癌マーカーのレベルを測定するステップをさらに包含してよい。前記マイクロRNA分子に加えて、本発明において有用なその他の癌マーカーは、試験されている癌によって異なり、当業者には既知である。
【0051】
患者から得た試料中の、本発明の核酸配列等の遺伝子発現のレベルを決定するために使用することができるアッセイの技法は、当業者には周知である。そのようなアッセイの方法として、これらに限定されないが、放射免疫アッセイ、逆転写PCR(RT−PCR)アッセイ、免疫組織化学アッセイ、in situハイブリダイゼーションアッセイ、競合的結合アッセイ、ノーザンブロット解析、ELISAアッセイ、核酸マイクロアレイ、及びバイオチップ解析が挙げられる。
【0052】
本発明のいくつかの実施形態では、相関関係及び/又は階層的クラスタ分析を使用して、特異的な試料と癌試料の異なる標本との間において、本発明の核酸配列の発現レベルの類似性を査定することができる。1つ又は複数の核酸配列の発現レベルについて自由裁量による閾値を設定して、試料又は癌試料を2つの群のうちの1つに帰属させることができる。或いは好ましい実施形態では、1つ又は複数の本発明の核酸配列の発現レベルを、ロジスティック回帰等の方法によって組み合わせて、測定基準を定義し、次いで、これを、以前に測定した試料又は閾値と比較する。帰属のための閾値をパラメータとして扱い、このパラメータを使用して、試料を各クラスに帰属させる信頼度を定量化することができる。帰属のための閾値を増減させて、臨床の筋書きに応じて、感度又は特異性に有利な計らいをすることができる。参照データに対する相関値は、増減させることができる連続的なスコアを生成し、試料が特定のクラスの癌の起源又は型に属する可能性についての診断情報を提供する。多変量解析においては、マイクロRNAのサインが、高いレベルの予後の情報を提供する。
【0053】
定義
本明細書で使用する用語法は、特定の実施形態を説明するためのものに過ぎず、制限するものではないことを理解されたい。明細書及び添付の特許請求の範囲において使用する場合、単数の形態である「a」、「an」及び「the」は、文脈からそうではないことが明確に分かる場合以外は、複数の指示対象を包含することに留意しなければならない。
【0054】
本明細書において数の範囲を列挙する場合、それらの間に介在する数のそれぞれが、同一の程度の細密さで明確に企図される。例えば、6〜9の範囲の場合、7及び8の数も、6及び9に加えて企図され、6.0〜7.0の範囲の場合、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9及び7.0の数が、明確に企図される。
【0055】
異常な増殖
本明細書で使用する場合、「異常な増殖」という用語は、正常な、適切な又は予想される経過から逸脱する細胞の増殖を意味する。例えば、異常な細胞の増殖として、DNA又はその他の細胞構成成分が損傷又は欠損している細胞の不適切な増殖を挙げることができる。異常な細胞の増殖として、その特徴が、不適切に高いレベルの細胞分裂、不適切に低いレベルのアポトーシス若しくは両方が引き起した、それらが媒介した、又はそれらに至る徴候と関係がある細胞の増殖を挙げることができる。そのような徴候は、例えば、癌性であっても若しくは非癌性であっても、又は良性であっても若しくは悪性であっても、単一若しくは複数の局所的な、細胞、細胞群又は(1つ若しくは複数の)組織の異常増殖によって特徴付けることができる。
【0056】
約
本明細書で使用する場合、「約」という用語は、+/−10%を指す。
【0057】
結び付けた
本明細書で使用する場合、「結び付けた」又は「固定化した」は、プローブと固体の支持体との間の結合が、結合、洗浄、解析及び除去の条件下で十分に安定である、プローブ及び固体の支持体手段を指す。結合は、共有結合であっても、又は非共有結合であってもよい。共有結合は、プローブと固体の支持体との間に直接形成させてもよく、そうでなければクロスリンカーによって、或いは固体の支持体若しくはプローブのいずれか又は両方の分子上の特異的な反応性の基の内包によって形成させてもよい。非共有結合は、静電気的相互作用、親水性相互作用及び疎水性相互作用のうちの1つ又は複数であってよい。ストレプトアビジン等の分子を支持体に共有結合により結び付け、且つビオチン標識したプローブをストレプトアビジンに非共有結合により結合させることは、非共有結合として挙げられる。固定化にはまた、共有結合による相互作用と非共有結合による相互作用との組合せが関与する場合もある。
【0058】
生物学的試料
本明細書で使用する場合、「生物学的試料」は、核酸を含む生物学的な組織又は流体の試料を意味する。そのような試料として、これらに限定されないが、対象から単離した組織又は流体が挙げられる。生物学的試料としてまた、生検試料及び剖検試料等の組織切片、FFPE試料、組織学的な目的で得た凍結切片、血液、血液画分、血漿、血清、痰、便、涙液、粘液、毛髪、皮膚、尿、浸出液、腹水、羊水、唾液、脳脊髄液、子宮頚部の分泌物、膣の分泌物、子宮内膜の分泌物、消化管の分泌物、気管支の分泌物、細胞系、組織試料、又は乳房からの分泌物も挙げられる。生物学的試料は、対象から細胞試料を取り出すことによって提供することができるが、また、以前に単離した(例えば、別のヒトによって、別の時期に、及び/若しくは別の目的で単離した)細胞を使用することによって、又は本明細書に記載する方法をin vivoにおいて実施することによっても達成することができる。また、治療又は予後の履歴を有する組織等の記録保管されている組織も使用することができる。生物学的試料としてはまた、動物又はヒトの組織に由来する外植片並びに初代細胞培養物及び/又は形質転換細胞培養物も挙げられる。
【0059】
癌
「癌」という用語は、組織病理的な型又は侵襲性の段階に関わりなく、全ての型の癌性の増殖若しくは癌化の過程、転移組織、又は悪性に形質転換した細胞、組織若しくは臓器を包含することを意味する。癌の例として、これらに限定されないが、アプドーマ、分離腫、鰓腫、悪性カルチノイド症候群、カルチノイド心疾患、癌腫(例えば、Walker、基底細胞、基底扁平、Brown−Pearce、管、Ehrlich腫瘍、非小細胞肺(例えば、肺扁平上皮細胞癌、肺腺癌及び肺未分化大細胞癌)、燕麦細胞、乳頭、細気管支、気管支原性、扁平上皮細胞及び移行細胞)、組織球性障害、白血病(例えば、B細胞、混合細胞型、ヌル細胞、T細胞、T細胞慢性、HTLV−II関連、リンパ球性急性、リンパ球性慢性、肥満細胞及び骨髄性)、悪性組織球増殖症、ホジキン病、免疫増殖性小、非ホジキンリンパ腫、形質細胞腫、細網内皮症、メラノーマ;軟骨芽細胞腫、軟骨腫、軟骨肉腫、線維腫、線維肉腫、巨細胞腫、組織球腫、脂肪腫、脂肪肉腫、中皮腫、粘液腫、粘液肉腫、骨腫、骨肉腫、Ewing肉腫、骨膜腫、腺線維腫、腺リンパ腫、癌肉腫、脊索腫、頭蓋咽頭腫、未分化胚細胞腫、過誤腫、間葉細胞腫、中腎腫、筋肉腫、エナメル上皮腫、セメント質腫、歯牙腫、奇形腫、胸腺腫、絨毛性腫瘍、腺癌、腺腫、胆管腫、胆脂腫、円柱腫、嚢胞腺癌、嚢胞腺腫、顆粒膜細胞腫、半陰陽性卵巣腫瘍、肝細胞腫、汗腺腫、膵島細胞腫瘍、Leydig細胞腫、乳頭腫、Sertoli細胞腫、莢膜細胞腫、平滑筋腫、平滑筋肉腫、筋芽細胞腫、筋肉腫、横紋筋腫、横紋筋肉腫、脳室上衣腫、神経節腫、神経膠腫、髄芽腫、髄膜腫、神経鞘腫、神経芽腫、神経上皮腫、神経線維腫、神経腫、傍神経節腫、非クロム親和性傍神経節腫、角化血管腫、好酸球増多を伴う血管リンパ組織過形成、硬化性血管腫、血管腫症、グロムス血管腫、血管内皮腫、血管腫、血管外皮腫、血管肉腫、リンパ管腫、リンパ管筋腫、リンパ管肉腫、松果体腫、癌肉腫、軟骨肉腫、嚢胞肉腫、葉状、線維肉腫、血管肉腫、平滑筋肉腫、白血肉腫、脂肪肉腫、リンパ管肉腫、筋肉腫、粘液肉腫、卵巣癌、横紋筋肉腫、肉腫(例えば、Ewing、実験的、Kaposi及び肥満細胞)、神経線維腫症、及び子宮頚部異形成、並びに細胞が不死化又は形質転換されているその他の状態をはじめとする、固形腫瘍及び白血病が挙げられる。
【0060】
分類
分類という用語は、個々の項目を、(形質、変数、特徴、特色等と呼ばれる)当該項目に固有の1つ又は複数の特徴についての定量的な情報に基づいたり、統計学的なモデル及び/又は以前にラベルした項目のトレーニングセットに基づいたりして、群又はクラスに配置する手順及び/又はアルゴリズムを指す。「分類木」は、カテゴリ変数をクラスに配置する決定木である。
【0061】
相補体
本明細書で使用する場合、核酸を指すための「相補体」又は「相補的な」は、ヌクレオチド間又は核酸分子のヌクレオチド類似体間でワトソン−クリック塩基対(例えば、A−T/U及びC−G)又はフーグスティーン塩基対を形成することを意味することができる。完全な相補体又は完全に相補的であるは、ヌクレオチド間又は核酸分子のヌクレオチド類似体間で100%相補的な塩基対を形成することを意味する。
【0062】
Ct
本明細書で使用する場合、「Ct」は、qRT−PCRのサイクル閾値を指し、これは、蛍光が閾値を越える分別のサイクル数である。
【0063】
データ処理ルーチン
本明細書で使用する場合、「データ処理ルーチン」は、獲得したデータの生物学的な有意性(すなわち、アッセイ又は解析の最終的な結果)を決定するソフトウエア中で具体化することができるプロセスを指す。例えば、データ処理ルーチンは、収集したデータに基づいて起源組織を決定することができる。本明細書のシステム及び方法においては、データ処理ルーチンはまた、決定した結果に基づいてデータ収集ルーチンをコントロールすることもできる。データ処理ルーチンとデータ収集ルーチンとを統合し、フィードバックを提供して、データの獲得を行い、したがって、アッセイに基づいて判断する方法を提供することができる。
【0064】
データセット
本明細書で使用する場合、「データセット」という用語は、解析から得た数値を指す。解析に関係があるこれらの数値は、ピーク高さ及び曲線下面積等の値であってよい。
【0065】
データ構造
本明細書で使用する場合、「データ構造」という用語は、2つ以上のデータセットの組合せを指し、1つ又は複数の数学的操作を、1つ又は複数のデータセットに適用して、1つ又は複数の新しいデータセットを得るか、2つ以上のデータセットを操作して、新しい方法でデータを視覚的に説明する形態となす。2つ以上のデータセットの操作から作製したデータ構造の例として、階層的クラスタ分析がある。
【0066】
検出
「検出」は、試料中の構成成分の存在を検出することを意味する。検出はまた、構成成分が存在しないことを検出することも意味する。検出はまた、構成成分のレベルを、定量的又は定性的のいずれかで決定することも意味する。
【0067】
示差的発現
「示差的発現」は、細胞及び組織の内部及びそれらの間の、時間的及び/又は空間的な遺伝子発現パターンにおける定性的又は定量的な差を意味する。したがって、例えば、正常組織と疾患組織とを比べて示差的に発現した遺伝子は、活性化又は不活性化をはじめとして、その発現が定性的に変化している場合がある。特定の状況下では、別の状況と比べて、遺伝子のスイッチが入る又は切れる場合があり、したがって、2つ以上の状況の比較が可能となる。定性的に制御される遺伝子は、ある状況又は細胞型の中では、標準的な技法によって検出可能であり得る、ある発現パターンを示す場合がある。いくつかの遺伝子は、1つの状況又は細胞型において発現するが、両方では発現しない場合がある。或いは発現の差は、調節される、上方制御されて転写物の量の増加に至る、又は下方制御されて転写物の量の減少に至る点で、定量的である場合もある。発現が異なる程度は、発現アレイ、定量的逆転写PCR、ノーザンブロット解析、リアルタイムPCR、in situハイブリダイゼーション及びリボヌクレアーゼ保護等の標準的な特徴付けの技法によって定量化するのに十分に大きいことのみが必要である。
【0068】
発現プロファイル
「発現プロファイル」という用語は、広義に使用して、ゲノムの発現プロファイル、例えば、マイクロRNAの発現プロファイルを包含する。プロファイルは、核酸配列のレベルを決定するための任意の好都合な手段、例えば、マイクロRNA、標識したマイクロRNA、増幅したマイクロRNA、cDNA等の定量的ハイブリダイゼーション、定量的PCR、定量化のためのELISAなどによって求めることができ、2つの試料間の示差的遺伝子発現の解析を可能にする。対象又は患者の腫瘍試料、例えば、細胞、又はそれらのコレクション、すなわち、組織等をアッセイする。試料を、当技術分野で既知の任意の好都合な方法によって収集する。対象とする核酸配列は、上記で提供した核酸配列をはじめとする、予測的であることが見出されている核酸配列であり、発現プロファイルは、列挙した核酸配列の全てを包含する、5、10、20、25、50又は100個以上の核酸配列についての発現データを包含することができる。いくつかの実施形態によれば、「発現プロファイル」という用語は、測定した試料中の核酸配列の存在量を測定することを意味する。
【0069】
発現比
本明細書で使用する場合、「発現比」は、2つ以上の核酸の相対的な発現レベルを指し、これは、生物学的試料中の対応する核酸の相対的な発現レベルを検出することによって決定する。
【0070】
遺伝子
本明細書で使用する場合、「遺伝子」は、転写及び/若しくは翻訳の制御配列、並びに/又はコード領域、並びに/又は非翻訳配列(例えば、イントロン、5’−及び3’−非翻訳配列)を含む、天然の遺伝子(例えば、ゲノムの遺伝子)であっても、又は合成の遺伝子であってもよい。遺伝子のコード領域は、アミノ酸配列をコードするヌクレオチド配列であっても、又はtRNA、rRNA、触媒RNA、siRNA、miRNA若しくはアンチセンスRNA等の機能性RNAであってもよい。遺伝子はまた、コード領域(例えば、エクソン及びmiRNA)に対応するmRNA又はcDNAであってもよく、これは、場合により、それらに連結している5’−又は3’−非翻訳配列を含む。遺伝子はまた、in vitroにおいて生成した増幅核酸分子であってもよく、これは、コード領域の全部若しくは一部及び/又はそれらに連結している5’−若しくは3’−非翻訳配列を含む。
【0071】
溝の結合剤/副溝の結合剤(MGB)
「溝の結合剤」及び/又は「副溝の結合剤」は、互換的に使用することができ、二本鎖DNAの副溝に、典型的には配列特異的な様式ではまる小型分子を指す。副溝の結合剤は、三日月様の形状をとり、したがって、しばしば水に置き換わって、二重らせんの副溝中にぴったりはまることができる、長く平坦な分子であってよい。副溝に結合する分子は、典型的には、フラン環、ベンゼン環又はピロール環等のねじれの自由を有する結合によって接続されている、いくつかの芳香環を含む。副溝の結合剤は、ネトロプシン、ジスタマイシン、ベレニル(berenil)、ペンタミジン及びその他の芳香族ジアミジン等の抗生物質、Hoechst33258、SN6999、クロモマイシン及びミトラマイシン等のaureolicな抗腫瘍薬、CC−1065、ジヒドロシクロピロロインドールトリペプチド(DPI3)、1,2−ジヒドロ−(3H)−ピロロ[3,2−e]インドール−7−カルボキシレート(CDPI3)、さらにそれらの内容が参照によって本明細書に組み込まれているNucleic Acids in Chemistry and Biology,2d ed.、Blackburn及びGait編、Oxford University Press、1996並びにPCT出願公開第WO03/078450号に記載されているものをはじめとする、関連の化合物及び類似体であってよい。副溝の結合剤は、プライマー、プローブ、ハイブリダイゼーションタグ相補体の構成成分、又はそれらの組合せであってよい。副溝の結合剤は、それらが結び付いているプライマー又はプローブのTmを上昇させることができ、そのようなプライマー又はプローブがより高い温度で有効にハイブリダイズするのを可能にする。
【0072】
宿主細胞
本明細書で使用する場合、「宿主細胞」は、天然に存在する細胞であっても、又はベクターを含有することができ、当該ベクターの複製を支援することができる形質転換細胞であってもよい。宿主細胞は、培養細胞、外植片、in vivoにおける細胞などであってよい。宿主細胞は、大腸菌(E.coli)等の原核細胞であっても、又は酵母、昆虫、両生類若しくは哺乳動物の細胞等、すなわちCHO細胞及びHeLa細胞等の真核細胞であってもよい。
【0073】
同一性
本明細書で使用する場合、「同一である」又は「同一性」は、2つ以上の核酸又はポリペプチド配列の文脈においては、配列が、特定の領域にわたって同一である、特定のパーセントの残基を有することを意味する。パーセントは、2つの配列を最適に整列させ、特定の領域にわたって2つの配列を比較し、両方の配列中に同一の残基が存在する位置の数を決定してマッチした位置の数を求め、マッチした位置の数を特定の領域中の位置の全数で割り、結果に100をかけて、配列同一性のパーセントを求めることによって計算することができる。2つの配列が異なる長さであり又はアラインメントが1つ若しくは複数のずれた末端をもたらし、比較の特定の領域が単一の配列のみを包含する場合には、単一の配列の残基を、計算の分母には含めるが、分子には含めない。DNA配列とRNA配列とを比較する場合には、チミン(T)とウラシル(U)とを同等であるとみなしてよい。同一性は、手作業で又はBLAST若しくはBLAST2.0等のコンピュータ配列アルゴリズムを使用することによって実施することができる。
【0074】
in situにおける検出
本明細書で使用する場合、「in situにおける検出」は、元々の部位における発現又は発現レベルの検出を意味し、元々の部位とは、生検等の組織試料中の部位を意味する。
【0075】
k−最近傍
「k−最近傍」という句は、ある点を、当該点とトレーニングデータセット中の点との間の距離を計算することによって分類する分類方法を指す。次いで、この方法は、当該点を、k(但し、kは整数である)個のその最近傍の間で最も一般的であるクラスに帰属させる。
【0076】
標識
本明細書で使用する場合、「標識」は、分光学的手段、光化学的手段、生化学的手段、免疫化学的手段、化学的手段又はその他の物理学的手段によって検出可能な組成物を意味する。例えば、有用な標識として、32P、蛍光染料、高電子密度試薬、(例えば、ELISA中で一般的に使用されるような)酵素、ビオチン、ジゴキシゲニン、又は検出可能となすことができるハプテン及びその他の実体が挙げられる。標識は、核酸及びタンパク質中に任意の位置において組み込むことができる。
【0077】
ノード
「ノード」は、分類(すなわち、決定)木における決定点である。また、その他のノードからの入力を組み合わせ、活性化機能の適用を通して出力を発生させるニューラルネット中の点。「葉」は、さらには分かれることのないノード、すなわち、分類木又は決定木における末端の配置である。
【0078】
核酸
本明細書で使用する場合、「核酸」又は「オリゴヌクレオチド」又は「ポリヌクレオチド」は、共有結合によって一緒に連結されている少なくとも2つのヌクレオチドを意味する。一本鎖の描写はまた、相補鎖の配列も定義する。したがって、核酸はまた、描写した一本鎖の相補鎖も包含する。核酸の多くの変異体を、所与の核酸と同一の目的で使用することができる。したがって、核酸はまた、実質的に同一な核酸及びそれらの相補体も包含する。一本鎖は、厳密なハイブリダイゼーション条件下で標的配列とハイブリダイズすることができるプローブをもたらす。したがって、核酸はまた、厳密なハイブリダイゼーション条件下でハイブリダイズするプローブも包含する。
【0079】
核酸は、一本鎖若しくは二本鎖であってもよく、又は二本鎖配列及び一本鎖配列の両方の部分を含んでもよい。核酸は、DNA、すなわち、ゲノムDNA及びcDNAの両方であってもよく、RNAであってもよく、又はハイブリッドであってもよい。ハイブリッドにおいては、核酸は、デオキシリボヌクレオチド及びリボヌクレオチドの組合せ、並びにウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン、ヒポキサンチン、イソシトシン及びイソグアニンをはじめとする、塩基の組合せを含有することができる。核酸は、化学的な合成方法によって又は組換えの方法によって得ることができる。
【0080】
核酸は、一般的には、リン酸ジエステル結合を含有するが、核酸として、少なくとも1つの異なる連結、例えば、ホスホロアミデート、ホスホロチオエート、ホスホロジチオエート又はO−メチルホスホロアミダイトの連結、並びにペプチド核酸の骨格及び連結を有する場合がある核酸類似体を挙げることができる。その他の類似体核酸として、参照によって本明細書に組み込まれている米国特許第5,235,033号及び第5,034,506号に記載されているものをはじめとする、正の骨格を有するもの;非イオン性の骨格を有するもの、及び非リボース骨格を有するものが挙げられる。1つ又は複数の天然には存在しないヌクレオチド又は改変されたヌクレオチドを含有する核酸もまた、核酸の1つの定義の範囲に包含される。改変されたヌクレオチド類似体は、例えば、核酸分子の5’−末端及び/又は3’−末端に位置することができる。ヌクレオチド類似体の代表的な例は、糖又は骨格が改変されたリボヌクレオチドから選択することができる。しかし、また、ヌクレオベース改変リボヌクレオチド、すなわち、天然に存在するヌクレオベースの代わりに天然には存在しないヌクレオベースを含有するリボヌクレオチド、具体的には、5位において改変されたウリジン又はシチジン、例えば、5−(2−アミノ)プロピルウリジン、5−ブロモウリジン;8位において改変されたアデノシン及びグアノシン、例えば、8−ブロモグアノシン;デアザヌクレオチド、例えば、7−デアザアデノシン;O−及びN−アルキル化ヌクレオチド、例えば、N6−メチルアデノシンも適切であることに留意しなければならない。2’−OH基は、H、OR、R、ハロ、SH、SR、NH2、NHR、NR2又はCNから選択された基によって置換することができ、但し、Rは、C1〜C6のアルキル、アルケニル又はアルキニルであり、ハロは、F、Cl、Br又はIである。改変されたヌクレオチドとしてまた、例えば、参照によって本明細書に組み込まれているKrutzfeldtら、Nature 438:685−689(2005)、Soutschekら、Nature 432:173−178(2004)、及び米国特許公開第20050107325号に記載されているヒドロキシプロリノール連結を介してコレステロールとコンジュゲートしたヌクレオチドも挙げることができる。追加の改変されたヌクレオチド及び核酸が、参照によって本明細書に組み込まれている米国特許公開第20050182005号に記載されている。リボース−リン酸骨格は、多様な理由で、例えば、そのような分子の生理環境における安定性及び半減期を向上させるために、細胞膜を介する拡散を増強させるために、又はバイオチップ上のプローブとして改変することができる。骨格の改変はまた、細胞のエンドサイトーシスの厳しい環境等における分解に対する抵抗性を増強させることもできる。骨格の改変はまた、肝臓及び腎臓等における肝細胞による核酸のクリアランスを低下させることもできる。天然に存在する核酸と類似体との混合物を作製してよく;或いは異なる核酸類似体の混合物、及び天然に存在する核酸と類似体との混合物を作製してもよい。
【0081】
プローブ
本明細書で使用する場合、「プローブ」は、1つ又は複数の型の化学的な結合により、通常は相補的な塩基の対の形成、すなわち、通常は水素結合の形成により、相補的な配列の標的核酸に結合することができるオリゴヌクレオチドを意味する。プローブは、ハイブリダイゼーション条件の厳密度に依存して、プローブ配列に対する完全な相補性には欠ける標的配列に結合することができる。標的配列と本明細書に記載する一本鎖の核酸との間におけるハイブリダイゼーションを妨げる任意の数の塩基対のミスマッチがあってよい。しかし、変異の数が非常に多いので、最も低い厳密度のハイブリダイゼーション条件下であっても、ハイブリダイゼーションを起こすことができない場合には、当該配列は、相補的な標的配列とはならない。プローブは、一本鎖であっても、又は部分的に一本鎖であり且つ部分的に二本鎖であってもよい。プローブの鎖の状態は、標的配列の構造、組成及び特性によって決定付けられる。プローブは、ストレプトアビジン複合体が後に結合することができるビオチンを用いて等、直接的に標識しても、又は間接的に標識してもよい。
【0082】
基準値
本明細書で使用する場合、「基準値」という用語は、アッセイの結果と比較した場合に、特定の成果と統計学的に相関関係を示す値を意味する。好ましい実施形態では、基準値は、マイクロRNAの発現を既知の臨床成果と比較する研究の統計学的解析から決定する。
【0083】
厳密なハイブリダイゼーション条件
本明細書で使用する場合、「厳密なハイブリダイゼーション条件」は、核酸の複合体混合物等において、第1の核酸配列(例えば、プローブ)が第2の核酸配列(例えば、標的)とハイブリダイズする条件を意味する。厳密な条件は、配列依存性であり、異なる状況においては異なる。厳密な条件を選択して、特異的な配列の、規定されたイオン強度、pHにおける融解温度(Tm)よりも約5〜10℃低い状態となすことができる。Tmは、平衡状態において、標的に対して相補的なプローブの50%が標的配列とハイブリダイズする(規定されたイオン強度、pH及び核濃度下の)温度であってよい(Tmにおいて、標的配列が過剰に存在する場合、プローブの50%が平衡状態において利用されている)。厳密な条件は、塩濃度が、pH7.0から8.3において、約0.01〜1.0Mナトリウムイオン等、約1.0M未満のナトリウム(又はその他の塩の)イオンの濃度であり、温度が、短いプローブ(例えば、約10〜50個のヌクレオチド)の場合には少なくとも約30℃であり、長いプローブ(例えば、約50個超のヌクレオチド)の場合には少なくとも約60℃である条件であってよい。厳密な条件はまた、ホルムアミド等の不安定化剤を添加して達成することもできる。選択的又は特異的なハイブリダイゼーションのためには、正のシグナルが、バックグラウンドのハイブリダイゼーションの少なくとも2から10倍であってよい。例示的な厳密なハイブリダイゼーション条件として、以下のものが挙げられる:50%ホルムアミド、5×SSC及び1%SDS、42℃でインキュベートし、又は5×SSC、1%SDS、65℃でインキュベートし、0.2×SSC及び0.1%SDS中、65℃洗浄する。
【0084】
実質的に相補的である
本明細書で使用する場合、「実質的に相補的である」は、第1の配列が、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95若しくは100個以上のヌクレオチドの領域にわたって、第2の配列の相補体と、少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%若しくは99%同一であること、又は2つの配列が、厳密なハイブリダイゼーション条件下でハイブリダイズすることを意味する。
【0085】
実質的に同一である
本明細書で使用する場合、「実質的に同一である」は、第1の配列と第2の配列とが、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95又は100個以上のヌクレオチド若しくはアミノ酸の領域にわたって、少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%若しくは99%同一であること、又は核酸に関して、第1の配列が、第2の配列の相補体に対して実質的に相補的である場合を意味する。
【0086】
対象
本明細書で使用する場合、「対象」という用語は、哺乳動物を指し、ヒト及びその他の哺乳動物の両方を包含する。本発明の方法は、好ましくは、ヒト対象に適用する。
【0087】
標的核酸
本明細書で使用する場合、「標的核酸」は、別の核酸が結合することができる核酸又はその変異体を意味する。標的核酸は、DNA配列であってよい。標的核酸は、RNAであってよい。標的核酸は、mRNA、tRNA、shRNA、siRNA又はPiwi−相互作用RNA、又はpri−miRNA、pre−miRNA、miRNA、又は抗miRNAを含むことができる。
【0088】
標的核酸は、標的miRNA結合部位又はその変異体を含むことができる。1つ又は複数のプローブが、標的核酸に結合することができる。標的結合部位は、5〜100又は10〜60個のヌクレオチドを含むことができる。標的結合部位は、全部で5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30〜40、40〜50、50〜60、61、62又は63個のヌクレオチドを含むことができる。標的部位の配列は、それらの内容が本明細書に組み込まれている米国特許出願第11/384,049号、第11/418,870号又は第11/429,720号に開示されている標的miRNA結合部位の配列のうちの少なくとも5個のヌクレオチドを含むことができる。
【0089】
組織試料
本明細書で使用する場合、組織試料は、組織生検から、関連の医術における当業者に周知の方法を使用して得た組織である。本明細書で使用する場合、「癌の疑いがある」という句は、医術における当業者によって癌性細胞を含有すると考えられている癌組織試料を意味する。生検から試料を得るための方法として、腫瘤を肉眼で見分ける方法、顕微解剖、レーザーに基づいた顕微解剖、又は当技術分野で既知の細胞を分離する方法が挙げられる。
【0090】
腫瘍
本明細書で使用する場合、「腫瘍」は、悪性にしても又は良性にしても、全ての新生物細胞の成長及び増殖、並びに全ての前癌性及び癌性の細胞及び組織を指す。
【0091】
変異体
本明細書で使用する場合、核酸に関する「変異体」は、(i)参照するヌクレオチド配列の一部;(ii)参照するヌクレオチド配列の相補体若しくはその一部;(iii)参照する核酸と実質的に同一である核酸、若しくはその相補体;又は(iv)厳密な条件下で参照する核酸とハイブリダイズする核酸、その相補体、若しくはそれと実質的に同一である配列を意味する。
【0092】
野生型
本明細書で使用する場合、「野生型」の配列という用語は、その配列についての天然の又は正常な機能を果たす配列の対立遺伝子の形態であるコード配列、非コード配列又はインターフェイス配列を指す。野生型の配列は、同族の配列の複数の対立遺伝子の形態を包含し、例えば、野生型の配列の複数の対立遺伝子が、コード配列がコードするタンパク質配列に対するサイレント又は保存的な変化をコードする場合がある。
【0093】
本発明は、miRNAを、特異的な癌の同定、分類及び診断のため、並びにそれらの起源組織の同定のために利用する。
【0094】
マイクロRNAのプロセシング
マイクロRNA(miRNA)をコードする遺伝子を転写させて、pri−miRNAとして知られているmiRNAの一次転写物の産生をもたらすことができる。pri−miRNAは、ステムアンドループ構造を有するヘアピンを含むことができる。ヘアピンのステムは、ミスマッチした塩基を含むことができる。pri−miRNAは、いくつかのヘアピンを、ポリシストロニックな構造として含むことができる。
【0095】
pri−miRNAのヘアピン構造は、Droshaによって認識され得る。Droshaは、リボヌクレアーゼIIIエンドヌクレアーゼである。Droshaは、pri−miRNA中の末端のループを認識し、ステムに入ってらせん約2巻きのところで切断して、pre−miRNAとして知られている、60−70ntの前駆体を産生することができる。Droshaは、pri−miRNAを切断し、RNaseIIIエンドヌクレアーゼに典型的な、ずれた切断部をもたらし、5’リン酸及び約2ヌクレオチドの3’オーバーハングを有するpre−miRNAステムループをもたらすことができる。Drosha切断部位から伸長する、ステムのらせん約1巻き(約10個のヌクレオチド)が、効率的なプロセシングに不可欠である場合がある。次いで、pre−miRNAは、Ran−GTP及び搬出受容体Ex−portin−5によって核から細胞質へ能動的に輸送され得る。
【0096】
pre−miRNAは、Dicerによって認識され得る。Dicerもまた、リボヌクレアーゼIIIエンドヌクレアーゼである。Dicerは、pre−miRNAの二本鎖のステムを認識することができる。Dicerもまた、末端のループを、ステムループの基部から、らせん2巻き離れて取り去り、追加の5’リン酸及び約2ヌクレオチドの3’オーバーハングを残すことができる。ミスマッチを含むことができる、得られたsiRNA様二重鎖は、成熟したmiRNA及びmiRNA*として知られている類似の大きさの断片を含む。miRNA及びmiRNA*は、pri−miRNA及びpre−miRNAの向かい合ったアームに由来することができる。miRNA*配列は、クローン化miRNAのライブラリー中に見出すことができるが、その頻度は典型的には、miRNAよりも低い。
【0097】
miRNAは、最初は、miRNA*と共に二本鎖の種として存在するが、最終的には、一本鎖RNAとして、RNA誘導サイレンシング複合体(RISC)として知られているリボ核タンパク質複合体中に組み込まれ得る。種々のタンパク質が、RISCを形成することができ、これらは、miRNA/miRNA*の二重鎖に対する特異性、標的遺伝子の結合部位、miRNAの(抑制又は活性化の)活性、及びmiRNA/miRNA*の二重鎖のいずれの鎖がRISC中に取り込まれるかに関する多様性をもたらすことができる。
【0098】
miRNA:miRNA*の二重鎖のmiRNA鎖が、RISC中に取り込まれる場合には、miRNA*が除去され、分解され得る。RISC中に取り込まれるmiRNA:miRNA*の二重鎖の鎖は、5’末端の対形成の堅固さの程度が低い鎖であってよい。miRNA:miRNA*の両方の末端が、ほぼ同等の5’の対形成を有する場合には、miRNA及びmiRNA*の両方が、遺伝子サイレンシングの活性を有することができる。
【0099】
RISCは、標的核酸を、miRNAとmRNAとの間の高いレベルの相補性に基づいて、特にmiRNAのヌクレオチド2〜7により同定することができる。動物においては、miRNAとその標的との間の相互作用が、miRNAの全長に沿うという1例が報告されているに過ぎない。これは、mir−196及びHox B8について示されたものであり、その後、mir−196が、Hox B8 mRNAの切断を媒介することが示された(Yektaら、2004、Science 304−594)。これ以外は、そのような相互作用は、植物においてのみ知られている(Bartel及びBartel 2003、Plant Physiol 132−709)。
【0100】
いくつかの研究は、翻訳の効率的な阻害を達成するための、miRNAとそのmRNA標的との間における塩基対形成の要件に注目している(Bartel 2004、Cell 116−281によって総説されている)。哺乳動物細胞中では、miRNAの最初の8個のヌクレオチドが、重要である場合がある(Doench及びSharp 2004 GenesDev 2004−504)。しかし、また、マイクロRNAのその他の部分がmRNAとの結合に参画する場合もある。さらに、3’における十分な塩基対形成が、5’における不十分な塩基対形成を補うこともできる(Brenneckeら、2005 PLoS 3−e85)。全ゲノム上でのmiRNAの結合を解析した計算研究から、標的結合における、miRNAの5’における塩基2〜7の特異的な役割が示唆されているが、また、通常は「A」であることが見出される、最初のヌクレオチドの役割も認識された(Lewisら、2005 Cell 120−15)。同様に、Krekらは、ヌクレオチド1〜7又は2〜8を使用して、標的を同定及び確認した(2005、Nat Genet 37−495)。
【0101】
mRNA中の標的部位は、5’UTR、3’UTRにおいてであっても、又はコード領域においてであってもよい。興味深いことに、複数のmiRNAが、同一のmRNA標的を、同一又は複数の部位を認識することによって制御する場合がある。最も遺伝子的に同定されている標的における複数のmiRNA結合部位の存在から、複数のRISCの共同作用が最も効率的な翻訳阻害をもたらすことが暗示され得る。
【0102】
miRNAは、RISCを指揮して、遺伝子発現を、mRNAの切断又は翻訳抑制の2つ機構のうちのいずれかによって下方制御することができる。mRNAが、miRNAに対して特定の程度の相補性を有する場合には、miRNAは、mRNAの切断を特定することができる。miRNAが切断を導く場合には、切断は、miRNAの残基10及び11に対して対形成しているヌクレオチドとヌクレオチドとの間でなされる場合がある。或いはmiRNAが、miRNAに対して必要とされる程度の相補性を有しない場合には、miRNAは、翻訳を抑制する場合もある。翻訳の抑制は、動物においてより多く見られる場合がある。これは、動物では、miRNAと結合部位との間の相補性の程度がより低い場合があるからである。
【0103】
miRNAとmiRNA*との任意の対の5’末端及び3’末端は、多様性であり得ることに留意しなければならない。この多様性は、切断部位に関するDrosha及びDicerの酵素によるプロセシングの多様性に起因し得る。miRNA及びmiRNA*の5’末端及び3’末端の多様性はまた、pri−miRNA及びpre−miRNAのステム構造中のミスマッチにも起因し得る。ステム鎖のミスマッチが、異なるヘアピン構造の集団をもたらす場合がある。ステム構造の多様性はまた、Drosha及びDicerによる切断の産物における多様性をもたらす場合もある。
【0104】
核酸
本明細書では、核酸を提供する。核酸は、配列番号1〜96又はそれらの変異体の配列を含む。変異体は、参照するヌクレオチド配列の相補体であってよい。変異体はまた、参照するヌクレオチド配列と実質的に同一であるヌクレオチド配列、又はその相補体であってもよい。変異体はまた、厳密な条件下で参照するヌクレオチド配列とハイブリダイズするヌクレオチド配列、その相補体、又はそれと実質的に同一であるヌクレオチド配列であってもよい。
【0105】
核酸は、約10から約250までのヌクレオチド長を有することができる。核酸は、少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、125、150、175、200又は250のヌクレオチド長を有することができる。核酸は、合成してもよく、又は細胞中で(in vitro若しくはin vivoにおいて)本明細書に記載する合成遺伝子を使用して発現させてもよい。核酸は、一本鎖分子として合成し、実質的に相補的な核酸とハイブリダイズさせて、二重鎖を形成させることができる。核酸は、細胞、組織若しくは臓器に、一本鎖若しくは二本鎖の形態で導入する場合もあり、又は参照によって組み入れられている米国特許第6,506,559号に記載されているものをはじめとする、当業者に周知の方法を使用して合成遺伝子によって発現させることが可能である場合もある。
【0106】
核酸複合体
核酸は、以下のうちの1つ又は複数をさらに含むことができる:ペプチド、タンパク質、RNA−DNAのハイブリッド、抗体、抗体断片、Fab断片及びアプタマー。
【0107】
pri−miRNA
核酸は、pri−miRNA又はその変異体の配列を含むことができる。pri−miRNA配列は、45〜30,000、50〜25,000、100〜20,000、1,000〜1,500又は80〜100個のヌクレオチドを含むことができる。pri−miRNAの配列は、本明細書に記載するpre−miRNA、miRNA及びmiRNA*、並びにそれらの変異体を含むことができる。pri−miRNAの配列は、配列番号1〜96又はそれらの変異体の配列のうちのいずれかを含むことができる。
【0108】
pri−miRNAは、ヘアピン構造を含むことができる。ヘアピン構造は、実質的に相補的である第1の核酸配列及び第2の核酸配列を含むことができる。第1の核酸配列及び第2の核酸配列は、37〜50個のヌクレオチドであってよい。第1の核酸配列と第2の核酸配列とは、8〜12個のヌクレオチドの第3の配列によって隔たる場合がある。ヘアピン構造は、その内容が参照によって本明細書に組み込まれているHofackerら、Monatshefte f.Chemie 125:167−188(1994)に記載されているViennaアルゴリズムによって、デフォルトパラメータを用いて計算した場合、−25Kcal/モル未満の自由エネルギーを有することができる。ヘアピンは、4〜20、8〜12又は10個のヌクレオチドの末端のループを含むことができる。pri−miRNAは、少なくとも19%のアデノシンヌクレオチド、少なくとも16%のシトシンヌクレオチド、少なくとも23%のチミンヌクレオチド、及び少なくとも19%のグアニンヌクレオチドを含むことができる。
【0109】
pre−miRNA
核酸はまた、pre−miRNA又はその変異体の配列を含むこともできる。pre−miRNA配列は、45〜90、60〜80又は60〜70個のヌクレオチドを含むことができる。pre−miRNAの配列は、本明細書に記載するmiRNA及びmiRNA*を含むことができる。pre−miRNAの配列はまた、pri−miRNAの5’末端及び3’末端から0〜160個のヌクレオチドを排除したpri−miRNAの配列であってもよい。pri−miRNAの配列は、配列番号1〜96又はそれらの変異体の配列を含むことができる。
【0110】
miRNA
核酸はまた、(miRNA*を含めた)miRNA又はその変異体の配列も含むことができる。miRNAの配列は、13〜33、18〜24又は21〜23個のヌクレオチドを含むことができる。miRNAはまた、全部で少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39又は40個のヌクレオチドを含むこともできる。miRNAの配列は、pre−miRNAの最初の13〜33個のヌクレオチドであってよい。miRNAの配列はまた、pre−miRNAの最後の13〜33個のヌクレオチドであってもよい。miRNAの配列は、配列番号1〜96又はそれらの変異体の配列を含むことができる。
【0111】
プローブ
また、本明細書に記載する核酸を含むプローブも提供する。プローブは、以下に概要を述べるように、スクリーニング及び診断の方法のために使用することができる。プローブは、バイオチップ等の固体の基材に結び付ける又は固定化することができる。
【0112】
プローブは、8から500、10から100、又は20から60のヌクレオチド長を有することができる。プローブはまた、少なくとも8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280又は300のヌクレオチド長を有することもできる。プローブは、10〜60個のヌクレオチドのリンカー配列をさらに含むことができる。
【0113】
バイオチップ
また、バイオチップも提供する。バイオチップは、固体の基材を含み、これは、結び付けられた1つ又は複数の本明細書に記載するプローブを含む。プローブは、厳密なハイブリダイゼーション条件下で、標的配列とハイブリダイズすることが可能であり得る。プローブを、基材上の空間的に規定されたアドレスにおいて結び付けることができる。標的配列当たり、2つ以上のプローブを使用することができ、それらは、ある特定の標的配列の重複するプローブ又はある特定の標的配列の異なる区分に対するプローブのいずれかである。プローブは、当業者が認識する単一の障害に関係がある標的配列とハイブリダイズすることが可能であり得る。プローブは、最初に合成し、それに続いて、バイオチップに結び付けてもよく、又はバイオチップ上に直接合成してもよい。
【0114】
固体の基材は、プローブを結び付ける又はつなげるのに適した個々の部位を個別に含有するように改変することができる材料であってよく、少なくとも1つの検出方法に適している。基材の代表的な例として、ガラス及び改変された又は機能性のガラス、(アクリル、ポリスチレン及びスチレンとその他の材料とのコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、TeflonJ等をはじめとする)プラスチック、多糖、ナイロン又はニトロセルロース、樹脂、ケイ素及び改変されたケイ素をはじめとする、シリカ又はシリカに基づいた材料、炭素、金属、無機ガラス、並びにプラスチックが挙げられる。基材は、顕著に蛍光を発することなく、光学的な検出を可能にすることができる。
【0115】
基材は、平面であってよいが、また、基材のその他の構造形状を使用してもよい。例えば、流入式の試料解析のためには、プローブをチューブの内側表面上に置いて、試料体積を最小化することができる。同様に、基材は、軟質フォーム等、柔軟性があってもよく、これには、特定のプラスチックで作製された独立気泡フォームが挙げられる。
【0116】
バイオチップ及びプローブは、化学的な官能基を用いて誘導体化し、それに続いて、それら2つを結び付けることができる。例えば、バイオチップを、これらに限定されないが、アミノ基、カルボキシル基、オキソ基又はチオール基をはじめとする、化学的な官能基を用いて誘導体化することができる。これらの官能基を使用すれば、プローブ上の官能基を使用して、プローブを、直接的に又はリンカーを使用して間接的に結び付けることができる。プローブは、5’末端により、3’末端により、又は内部ヌクレオチドを介してのいずれかで、固体の基材に結び付けることができる。
【0117】
プローブはまた、固体の基材に、非共有結合によって結び付けることもできる。例えば、ビオチン標識したオリゴヌクレオチドを作製することができ、これは、ストレプトアビジンで共有結合によりコートした表面に結合し、結び付くことができる。或いは光重合及びフォトリソグラフィー等の技法を使用して、プローブを表面上で合成することもできる。
【0118】
診断
本明細書で使用する場合、「診断する」という用語は、病態又は症状を分類し、病態の重症度(グレード若しくは段階)を決定し、病態の進行をモニターし、病態の結果及び/又は回復の見込みを予報することを指す。
【0119】
本明細書で使用する場合、「それを必要とする対象」という句は、癌を有する、癌を有する危険がある[例えば、遺伝的素因がある対象、癌の病歴及び/若しくは家族歴を有する対象、発癌性物質、職業上の危険、環境上の危険に暴露したことがある対象]ことが知られている動物又はヒトの対象、並びに/或いは癌が疑われる臨床徴候[例えば、便中の血液若しくは血便、説明のつかない疼痛、発汗、説明のつかない発熱、摂食障害に至る説明のつかない体重減少、便通習慣の変化(便秘及び/若しくは下痢)、テネスムス(特に直腸癌の場合の不完全な排便感)、貧血及び/又は全般的な脱力感]を示す対象を指す。その上に又はそれに代わって、それを必要とする対象は、定期的な健康検査を受ける健康なヒトの対象であってもよい。
【0120】
悪性又は前悪性の細胞の存在の解析は、in vivoにおいて実施しても、又はex−vivoにおいて実施してもよく、後者の場合、生物学的試料(例えば、生検)を取り出す。そのような生検試料は、細胞を含み、切開性の生検であっても、又は切除性の生検であってもよい。或いは細胞を、完全な摘出から取り出してもよい。
【0121】
本教示を利用しながら、治療計画、治療コースの決定及び/又は疾患の重症度の測定に関する追加の情報を集めることができる。
【0122】
本明細書で使用する場合、「治療計画」という句は、それを必要とする対象(例えば、ある病態を有すると診断された対象)に提供する治療の型、用量、スケジュール及び/又は治療の持続期間を特定する治療のプランを指す。選択された治療計画は、最良の臨床成果(例えば、病態の完全な治癒)を得られることが予想される攻撃的なものであってもよく、又は病態の症状を緩和することができるが、病態を完全には治癒することはない中等度のものであってもよい。特定の場合には、治療計画には、対象に対する何らかの不快感又は有害な副作用(例えば、健常な細胞若しくは組織に対する損傷)が伴う場合があることを理解されたい。治療の型として、外科的な介入(例えば、病変、病気の細胞、組織若しくは臓器の除去)、細胞置換療法、治療用薬物(例えば、受容体アゴニスト、アンタゴニスト、ホルモン、化学療法剤)の局所的又は全身的なモードでの投与、外部的な源(例えば、体外照射)及び/又は内部的な源(例えば、ブラキセラピー)を使用する放射線療法への暴露、並びに/或いはそれらの任意の組合せを挙げることができる。治療の用量、スケジュール、持続期間は、病態の重症度及び選択された型の治療に依存して変化させてよく、当業者であれば、当該型の治療を、治療の用量、スケジュール、持続期間によって加減することができる。
【0123】
また、診断方法も提供する。この方法は、生物学的試料中の特定の癌と関係がある核酸の発現レベルを検出するステップを含む。試料は、患者から得ることができる。患者における癌の特異的な状況の診断によって、予後診断及び治療戦略の選択が可能となり得る。さらに、細胞の発生段階を、一時的に発現した、特定の癌と関係がある核酸を決定することによって分類することができる。
【0124】
標識したプローブと組織アレイとのin situハイブリダイゼーションを行うことができる。熟練した当業者であれば、個々の試料間でフィンガープリントを比較して、所見に基づいて診断、予後診断又は予測を行うことができる。さらに、診断を指し示す核酸配列は、予後診断を指し示す核酸とは異なる場合があり、細胞の状態の分子プロファイリングからは、応答性条件と不応性条件との間の区別が得られる場合があり、又は成果を予測できる場合があることも理解されたい。
【0125】
キット
また、キットも提供し、このキットは、本明細書に記載する核酸を、以下のうちのいずれか又は全てと一緒に含むことができる:アッセイ用試薬、緩衝液、プローブ及び/又はプライマー、並びに無菌の食塩水又は別の薬学的に許容できる乳濁液用及び懸濁液用の基剤。さらに、キットは、本明細書に記載する方法を実行するための指示(例えば、プロトコール)を含有する指導用の材料を包含することができる。キットは、発現プロファイルのデータ解析のためのソフトウエアのパッケージをさらに含むことができる。
【0126】
例えば、キットは、標的核酸配列の増幅、検出、同定又は定量化のためのキットであってよい。キットは、ポリ(T)プライマー、順方向プライマー、逆方向プライマー及びプローブを含むことができる。
【0127】
本明細書に記載する組成物はいずれも、キット中に含むことができる。非限定的な例においては、アレイを使用してmiRNAを単離し、miRNAを標識し且つ/又はmiRNAの集団を評価するための試薬を、キット中に包含する。キットは、miRNAプローブを生み出す又は合成するための試薬もさらに包含することができる。したがって、キットは、適切な容器手段中に、標識されたヌクレオチド又はそれに続いて標識される未標識のヌクレオチドを組み込むことによりmiRNAを標識するための酵素を含む。キットはまた、反応用緩衝液、標識用緩衝液、洗浄用緩衝液又はハイブリダイゼーション用緩衝液等の1つ又は複数の緩衝液、miRNAプローブを調製するための化合物、in situハイブリダイゼーションのための構成成分、及びmiRNAを単離するための構成成分も包含することができる。本発明のその他のキットは、miRNAを含む核酸アレイを作製するための構成成分を包含することができ、したがって、例えば、固体の基材を包含することができる。
【0128】
本発明のいくつかの実施形態をより十分に例証するために、以下の実施例を示す。しかし、いかなる場合であっても、それらが、本発明の広範な範囲を制限するものであると解釈してはならない。
【実施例】
【0129】
方法
1.腫瘍試料
腫瘍の試料を、いくつかの源から得た。全ての試料について、それぞれの施設内のIRB又はIRBと同等のガイドラインに従って、施設内審査による承認を得た。ホルマリン固定パラフィン埋包(FFPE)試料について、最初の診断、組織学的な型、グレード、及び腫瘍のパーセントを、病理学者が、試料の最初及び/又は最後の切片上で実施したヘマトキシリン−エオシン(H&E)染色スライド上で決定した。試料は、原発性腫瘍、転移性腫瘍と、前立腺腫瘍試料(示さず)に類似する発現プロファイルを示した良性前立腺過形成試料(BPH)の2つの試料とを包含した。非定義試料は、この研究には包含しなかった。90%のFFPE試料において、腫瘍含有量が50%超であった。
【0130】
2.RNA抽出
凍結組織について、大きさが約0.5cm3の試料を、RNA抽出のために使用した。全RNAを、miRvana miRNA単離用キット(Ambion製)を使用して、製造者の指示に従って抽出した。手短にいうと、試料を変性用溶解溶液中でホモゲナイズし、続いて、酸−フェノール:クロロホルム抽出を行う。最後に、試料を、ガラス繊維製フィルター上で精製する。
【0131】
FFPE試料について、全RNAを、7から10個の10μm厚さの組織切片から、Rosetta Genomicsにおいて開発されたmiRdictor(商標)抽出プロトコールを使用して単離した。手短にいうと、試料を、キシレン中、57℃で数回インキュベートして、過剰なパラフィンを除去し、続いて、エタノール洗浄を行う。タンパク質を、プロテイナーゼK溶液によって、45℃で数時間分解させる。RNAを、酸フェノール:クロロホルムを用いて抽出し、続いて、エタノール沈殿及びデオキシリボヌクレアーゼ消化を行う。全RNAの量及び質を、分光光度計(Nanodrop製ND−1000)によって調べる。
【0132】
3.miRdicator(商標)アレイプラットフォーム
特注のマイクロアレイを、DNAオリゴヌクレオチドのプローブを、688個のヒトマイクロRNAにプリントすることによって作製した。各プローブは、三つ組みでプリントされており、プローブを、コートしたガラス製スライドにカップルさせるために使用するアミン基に加えて、マイクロRNAの相補配列の3’末端において22ヌクレオチド(nt)までのリンカーを保有する。20μMの各プローブを、2×SSC+0.0035%SDS中に溶解させ、Schott Nexterion(登録商標)Slide Eでコートしたマイクロアレイスライド上に、Genomic Solutions(登録商標)BioRobotics MicroGrid IIを使用して、MicroGridの製造者の指示に従って、三つ組みでスポットした。54個の陰性の対照プローブを、異なるマイクロRNAのセンス配列を使用して設計した。2つの群の陽性の対照プローブを設計して、miRdicator(商標)アレイにハイブリダイズさせた:(i)合成の小型RNAをRNAにスパイクさせてから標識して、標識化の効率を検証し、(ii)豊富な小型RNA(例えば、小型核RNA(U43、U49、U24、Z30、U6、U48、U44)、5.8s及び5sのリボゾームRNA)についてのプローブを、アレイ上にスポットして、RNAの質を検証した。スライドを、50mMエタノールアミン、1M Tris(pH9.0)及び0.1%SDSを含有する溶液中、50℃で、20分間ブロックし、次いで、水を用いて十分に濯ぎ、脱水した。
【0133】
4.miRdicator(商標)アレイのためのmiRNAのCy染料による標識化
RNAリンカー、p−rCrU−Cy/染料(Dharmacon製)を、Cy3又はCy5を有する3’末端に連結させる(Thomsonら、Nature Methods 2004,1:47−53)ことによって、5μgの全RNAを標識した。標識化反応は、全RNA、スパイク(0.1〜20フェントモル)、300ngのRNA−リンカー−染料、15%DMSO、1×リガーゼ用緩衝液、及び20単位のT4 RNAリガーゼ(NEB製)を含有し、4℃で1時間進行させ、続いて、37℃に1時間保った。標識したRNAを、3×ハイブリダイゼーション用緩衝液(Ambion製)と混合し、95℃で3分間加熱し、次いで、miRdicator(商標)アレイの上端上に添加した。スライドを、42℃中で12〜16時間ハイブリダイズさせ、続いて、1×SSC及び0.2%SDSを用いて室温中で2回洗浄し、最後に0.1×SSCを用いて洗浄した。
【0134】
アレイを、Agilent製Microarray Scanner Bundle G2565BA(出力100%において、10μmの分解能)を使用して走査した。アレイの画像を、SpotReaderソフトウエア(Niles Scientific製)を使用して解析した。
【0135】
5.アレイのシグナルの計算及び正規化
各プローブについて、三つ組みのスポットを組み合わせて、信頼できるスポットの対数平均を得ることによって、1つのシグナルを求めた。全てのデータを(自然)対数変換し、解析を対数空間において実施した。正規化のための参照データのベクトルRを、各プローブについて、全部の試料にわたって発現レベルの中央値を得ることによって計算した。各試料データのベクトルSについて、試料データと参照データとの間に最良のフィットをもたらすように2次の多項式Fを見出し、したがって、R≒F(S)となした。離れたデータ点(「外れ値」)は、多項式Fをフィットするためには使用しなかった。試料中の各プローブ(ベクトルS中の要素Si)について、最初の値Siから、(対数空間において)正規化した値Miを、最初の値を、多項式Fを用いて変換することによって計算し、したがって、Mi=F(Si)となる。図3A、B中のデータを、(指数をとることによって)線形空間に置き換え直した。トレーニングセットの試料のみを使用して、参照データのベクトルを求めても、結果に影響を及ぼさなかった。
【0136】
6.ロジスティック回帰
ロジスティック回帰モデルの目的は、いくつかのマイクロRNAの発現レベル等、いくつかの特色を使用し、2分決定木中のあるノードの2つのブランチ等、2つの可能な群のうちの1つに属する確率を割り当てることである。ロジスティック回帰は、オッズ比、すなわち、第1の群、例えば2分決定木のあるノード中の左のブランチに属する確率(P)と、第2の群、例えばそのようなあるノード中の右のブランチに属する確率(1−P)との比の自然対数を、(対数空間における)異なる発現レベルの線形の組合せとして形に表す。ロジスティック回帰は、
【数1】
であり、
但し、式中、β0は、バイアスであり、Miは、決定ノード中で使用したi番目のマイクロRNAの(対数空間において正規化された)発現レベルであり、βiは、その対応する係数である。βi>0は、このマイクロRNAの発現レベル(Mi)が増加すると、左のブランチをとる確率(P)が増加することを示し、βi<0は、反対の場合を示す。ノードが単一のマイクロRNA(M)のみを使用する場合には、Pを解くと、(図4)が得られる。
【数2】
【0137】
各試料についての回帰エラーは、割り当てられた確率Pとこの試料の本当の「確率」との間の差である。すなわち、この試料が、左のブランチの群中にあるときは1であり、そうでなければ0である。ロジスティック回帰モデルのトレーニング及び最適化は、パラメータβ及びp値を(各マイクロRNAについては、Wald統計量によって、全体的なモデルについては、χ2(カイ二乗)の差によって)計算し、データから得たモデルの尤度を最大化し、全体的な回帰エラーを最小化する。
【数3】
【0138】
ここで、ロジスティックモデルの確率の出力を、Pを、PTHで表す閾値と比較することによって二分決定に変換する。すなわち、P>PTHのときは、試料が左のブランチ(「第1の群」)に属し、逆の場合には、結果も逆になる。各ノードにおいて、>0.5の確率を有するブランチを選ぶ、すなわち、0.5の確率の閾値を使用すると、回帰エラーの和が最小化される。しかし、ゴールは、(それらの確率ではなく)誤分類の全体的な数の最小化であることから、各ノードにおける誤りの全体的な数を最小化するために、確率の閾値(PTH)を加減する改変を使用した(表2)。各ノードについて、新しい確率の閾値PTHに対する閾値を、分類エラーの数を最小化するように最適化した。確率の閾値のこの変化は、クラスの以前の頻度の変化を反映することができるバイアスβ0の改変と(分類の観点からは)同等である。
【0139】
7.ステップワイズロジスティック回帰及び特色の選択
元々のデータは、各試料について、数百個のマイクロRNAの発現レベルすなわち、数百個のデータの特色を含有する。各ノードについて、分類子をトレーニングする場合には、これらの特色の小さなサブセットのみを選択し、ロジスティック回帰モデルを最適化するために使用した。最初のトレーニングにおいては、これを、前方ステップワイズスキームを使用して行った。特色を、対数尤度が減少する順番にソートし、ロジスティックモデルに着手し、第1の特色を用いて最適化した。次いで、第2の特色を追加し、モデルを再度最適化した。これらの2つのモデルの回帰エラーを比較した:特色の追加により、有意な利点がもたらされない場合(7.88未満のχ2の差、0.005のp値)には、新しい特色を破棄した。それ以外では、追加した特色を維持した。新しい特色を追加すると、以前の特色と重複する場合がある(例えば、それらの相関性が非常に高い場合)。これについて調べるために、プロセスが、(上記のχ2の差を失うことなく)最も低い尤度を有する特色を破棄することができるか否かを反復的に調べる。特色の現在のセットが、この意味においてコンパクトであることを確実にしてから、プロセスは、ソートしたリスト中の次の特色を試験し続け、特色を使い果たす。特色の数に関する制限は、アルゴリズム中に挿入しなかったが、ほとんどの場合、2〜3つの特色が選択された。
【0140】
ステップワイズロジスティック回帰の方法を、トレーニングセットの試料のサブセット上で、繰り返し(「ブートストラップ」)を有するトレーニングセットを、23回の実行のうちのそれぞれが、試料の約3分の2を少なくとも1回は含有し、任意の1つの試料が、少なくとも1回は外される>99%の機会を有するように、再度試料採取することによって使用した。この結果、平均して、1つのノード当たり2〜3つ(より困難なノードにおいては、4〜8つ)の特色を得た。ブートストラップセット中の繰り返して選ばれた特色を、以前の証拠と比較し、それらのシグナルの強度及び信頼性を考慮することによって、1つのノード当たり2〜3つの特色のロバストなセット(表2)を選択した。これらの選択された特色を使用して分類子を構築する場合、ステップワイズのプロセスは使用せず、トレーニングが、ロジスティック回帰モデルのパラメータのみを最適化した。
【0141】
8.性別及び肺からの転移によるクラスの制限
決定木の枠組みによって、利用可能な臨床情報を容易に分類することが可能になる。2つのそのようなデータ、すなわち、性別及び肺からの転移を使用する。女性患者からの試料は、精巣及び前立腺に由来するとしては分類されず;したがって、ノード#2に達した女性患者の試料は、右のブランチに、且つ同様にノード#17においては左のブランチ(=乳房)に自動的に分類された。男性患者からの試料は、子宮内膜及び卵巣に由来するとしては分類されず、ノード20においては左のブランチに自動的に分類された。肺からの転移が指し示された試料は、肝臓に由来するとしては分類されず、ノード#1においては右のブランチに分類された。したがって、追加の情報は、一般性を喪失することもなく、分類子を保持する必要もなく、容易に活用される。
【0142】
9.K最近傍(KNN)分類アルゴリズム
KNNアルゴリズム(例えば、Maら、Arch Pathol Lab Med 2006、130:465−73を参照されたい)は、任意の試料の、トレーニングセット中の全ての試料に対する距離(ピアソンの相関関係)を計算し、試料を、最も類似するk個の試料の大多数の票決によって分類する(kは、分類子のパラメータである)。相関関係を、組織型(クラス)の全ての対を調査し、任意の2つのクラス間で有意に示差的に発現したマイクロRNAを収集することによって選択したマイクロRNA(データの特色)のあらかじめ定義したセット上で計算する。決定木によって使用された48個のマイクロRNAを有するこのリストの共通部分のみを使用しても、性能が低下することはなく、これらのマイクロRNAの情報内容が強調された。k=1,3,5を用いたKNNアルゴリズムを比較し、k=3及びマイクロRNAのより小さなセットを使用して、最適なパフォーマーを選択した。
【0143】
10.qRT−PCR
1μgの全RNAに対して、以前の記載(Shi及びChiang、BioTechniques 2005、39:519−525)に従って、ポリアデニル化反応を行う。手短にいうと、RNAを、ポリ(A)ポリメラーゼ(PAP)(Takara−2180A)、MnCl2及びATPの存在下、37℃で1時間インキュベートする。逆転写を、全RNA上で実施する。逆方向プライマーに対して相補的なコンセンサス配列をもつoligodTプライマー、oligodTデンプン、Nヌクレオチド(全A、C及びGの混合物)並びにVヌクレオチド(4つのヌクレオチドの混合物)を、逆転写反応に使用する。プライマーを、最初に、ポリA−RNAにアニールさせ、次いで、SuperScript II RT(Invitrogen製)の逆転写反応を行う。次いで、cDNAを、リアルタイムPCR反応によって、マイクロRNAに特異的な順方向プライマー、TaqManプローブ、及びオリゴdTテイルの3’配列に対して相補的な汎用逆方向プライマーを使用して増幅する。反応物を、95℃で10分間インキュベートし、続いて、95℃15秒間及び60℃1分間を42サイクル行う。
【0144】
図3Cに、U6 snRNAについて正規化したデータを示す(例えば、Thompsonら、Genes & Development 2006、20:2202−2207を参照されたい)。図3D中のデータをU6によって正規化し、(底が2の指数によって)線形空間に変換し、定数(59,000)をかけて、数値を、アレイのシグナルと同一の中央値を有するようにシフトさせた。マイクロアレイとqRT−PCRのデータとの間で、2つの別々の試料のサブセット中3つのマイクロRNA(全部で6群)の分布を比較して、コルモゴルフ−スミルノフ統計量の平均値0.32を得た。(6群のうちの)わずか2つの群が有意に異なる分布(KS統計量<0.05)を有したに過ぎず、大部分の群は、コルモゴルフ−スミルノフ検定によっては、有意に異なることはなかった。
【0145】
(実施例1)
試料及びプロファイリング
ホルマリン固定パラフィン埋包(FFPE)により記録保管されている試料は、腫瘍材料のための重要な源であることから、マイクロRNA画分を保存しているFFPEのブロックからRNAを抽出するための方法を開発した。新鮮凍結試料、ホルマリン固定試料又はFFPE試料から抽出したRNAを比較し、RNAの量及び質が、全ての保存方法にわたり類似することを実証した。さらに、マイクロRNAのプロファイルは、FFPE試料中で、11年もの長い保管期間にわたり安定であった。
【0146】
マイクロRNAプロファイリングを、miRBase(バージョン9)3中に全てのマイクロRNAについてのプローブを含有するRosetta Genomics製のmiRdicator(商標)マイクロアレイ19上で実施した。
【0147】
205個の原発性腫瘍及び131個の転移性腫瘍を包含し、22種の異なる腫瘍起源又は「クラス」を示す、333個のFFPE試料及び3つの新鮮凍結試料を収集し、プロファイリングした。(試料の概要については表1を参照されたい)。腫瘍のパーセントは、90%超の試料について、少なくとも50%であった。試料のうち83個(各クラスの約25%)を、盲検の試験セットとして無作為に選択した。65個の追加の原発性腫瘍の試料(53個のFFPE試料及び12個の新鮮凍結試料)を、選択されたマイクロRNAについての確認として、qRT−PCR上のみでプロファイリングした。全体で401個の試料が、この研究には包含された。
【0148】
(実施例2)
原発性腫瘍と転移性腫瘍との比較
十分な数の転移性の試料を得るのが困難であることに起因して、この研究は、試料セットを増大させるために、原発性腫瘍を利用している。原発性の試料と転移性の試料との間における発現プロファイルの差は、腫瘍における根本的な生物学的な差から又は付近の組織からの混入から予想することができる。そのような効果は、転移性の試料上での腫瘍の分類子の性能を妨げる場合がある。
【0149】
乳癌又は結腸癌等の大部分の組織起源については(図1A、B)、原発性腫瘍と転移性腫瘍との間では有意な差は見出されなかった。その他の場合では、マイクロRNAの小さなセットが、示差的に発現した。例えば、胃の原発性腫瘍の試料を、胃からリンパ節へ転移した試料と比較すると、3つのマイクロRNAが、有意に示差的に発現した(図1C、D)。上皮層に特徴的であるHsa−miR−1435(配列番号99)、及び筋肉組織に特徴的であるhsa−miR−133a2(配列番号97)が、胃から得た原発性腫瘍中で過剰発現し;対照的に、リンパ球中での発現が高いと以前に同定されたhsa−miR−15020(配列番号101)は、リンパ節から得た転移性の試料中により高いレベルで存在した。さらに、周囲の筋肉組織を含有することが多い、前立腺又は頭頚部等の原発性腫瘍からの試料は、顕著な発現レベルのmiR−1、miR−206及びmiR−133aを示し、これらは、骨格筋に特異的なマイクロRNAである2。我々は、転移についての分類子のトレーニングにおいては、原発性腫瘍を使用することができるが、慎重に且つ特異的なマーカー及び状況に注意を払って使用しなければならないと結論付けた。これらの効果からの潜在的な偏りを低減させるために、交差汚染が交絡効果を有する恐れがあるノードにおけるマイクロRNAの使用を最小限に留めた。例えば、筋肉に関連するマイクロRNA(miR−1/133/206)及びhsa−miR−150は使用しなかった。
【0150】
(実施例3)
決定木分類子アルゴリズム
腫瘍の分類子を、マイクロRNAの発現レベルを使用して、2分木分類スキームを適用することによって築いた(図2)。この枠組みを設定して、組織の分化及び胚形成におけるマイクロRNAの特異性を活用する:異なるマイクロRNAが、組織の特異化の種々の段階に関与するので、それらを、異なる決定点又は「ノード」において、アルゴリズムに使用した。木は、複雑な複数組織の分類の問題を、より単純な二分決定のセットに分割する。各ノードにおいては、木においてそれより前に枝分れするクラスは考慮されず、無関係の試料からの干渉を減少させ、決定をさらに単純化する(図3A)。次いで、各ノードにおける決定を、分類における十分に定義された役割を有する少数のマイクロRNAバイオマーカーのみを使用して達成することができる(表2)。2分木の構造は、組織の発生及び形態学的な類似性の階層に基づき18、マイクロRNAの発現パターンの目立つ特色によって改変された(図2)。例えば、マイクロRNAの発現パターンは、肺カルチノイドとその他の肺癌の型との間で有意な差を指し示し、したがって、これらは、ノード#12において(図3A、B)、別のブランチに分かれる(図2)。興味深いことに、データを2分の分類木に分配するための自動化アルゴリズムからは、類似の構造を有する木が生成したが、構造及び個々のノードの分類子に関する柔軟性を欠き、その性能は顕著により不十分であった。
【0151】
個々のノードのそれぞれについて、ロジスティック回帰モデルを使用した。これは、分類子のロバストなファミリーであり、連続的なデータの特色を組み合わせて二分決定を得るために疫学的研究及び臨床研究において頻繁に使用される(図3A、図4、及び方法)。遺伝子発現の分類子は、遺伝子の特色の選択に関して内在的な重複性を有するので、トレーニング試料セット上で、ブートストラップすることを、各ノードについて安定なマイクロRNAのセットを選択するための方法として使用した(方法)。この結果、1つのノード当たり少数(通常、2〜3つ)のマイクロRNAの特色を、全体的な分類子については全部で48個のマイクロRNAを得た(表2)。我々のアプローチは、示差的発現についての新しいバイオマーカーを同定するための系統だったプロセスを提供する。
【0152】
(実施例4)
分類子の性能:クロス確認及び高い信頼度の分類
最初のステップとして、分類子の性能を、トレーニングセット内で、1つとって置き法による確認(LOOCV)を使用して試験した。LOOCVは、見知らぬ試料上での分類アルゴリズムの性能をシミュレートする。LOOCVでは、アルゴリズムを繰り返して再度トレーニングし、その度に、1つの試料を除外し、各試料を、この試料なしでトレーニングした分類子上で試験する。決定木アルゴリズムは、78%の平均感度又は精度、及び99%の特異性に達し、異なるクラス間では顕著な変動を有した。この性能を、通常使用されるK最近傍(KNN)分類アルゴリズム8,5,18の性能と比較した。KNNアルゴリズムは、(最適なk=3においては)この木よりも不十分な性能を示し(71%の平均感度及び等しい特異性)、異なるクラスが、アルゴリズム間において、感度の有意な差を有した。
【0153】
診療においては、しばしば、異なる程度の信頼度の情報を査定することが有用である17,18。特にCUPの診断においては、決定的な診断を下すことができない場合には、確率の高い可能性の短いリストが実用的な選択肢である。決定木及びKNNアルゴリズムは、設計が異なり、独立にトレーニングされることから、それらの分類を組み合わせ、比較することによって、改善された精度及びより高い信頼度を得ることができる。これらの2つのアルゴリズムによって得た予測を融合させると、症例の85%において正確なクラスが含まれた。症例の69%において、これらの2つのアルゴリズムが一致し、単一の、高い信頼度の予測をもたらした。満足なことには、これらの高い信頼度の予測の93%が、試料の正確なクラスを正確に同定し、22種の腫瘍のクラスのうちの半分超が100%の感度を達成した。
【0154】
(実施例5)
分類子の性能:独立した盲検の試験セット
分類アルゴリズムの最も重要な試験は、盲検の試験セット上のものである。試料の約4分の1を、異なるクラスを代表するように無作為に選択して、独立した試験セットとして残しておき、分類子の性能を試験した(表3)。試験セット上での性能は、トレーニングセットにおけるLOOCVの性能と比較して低下しなかった。これは、分類子の非常に望ましい特色であり、この分類子がロバストであり、過学習ではないことを示している。症例の86%が、これらの2つの予測因子の融合によって正確に予測された(大部分のクラスが、100%の感度を有した)。高い信頼度の予測は、症例の3分の2に当たり、このうち、89%が正確に分類された。盲検の試験セットにおいてさえも、22個のクラスのうちの圧倒的な16個が、高い信頼度の予測において100%の精度を有した。最後に、盲検の試験セットの転移性の試料上で分類の性能を調べた。ここでもまた、分類子は、高い信頼度の分類について、85%の感度を達成した。盲検の転移性の試料上での性能がそのように高いという事実は、トレーニングセットを、原発性腫瘍を用いて増大させ、同時に潜在的に交絡するマーカーも回避するアプローチを支持する。
【0155】
(実施例6)
独立したプラットフォームであるqRT−PCRによる確認
アレイプラットフォームに基づいて開発した上記の決定木アルゴリズムは、組織群間の二分決定において、特異的な役割をマイクロRNAに帰属させる。特定のプラットファームの効果を排除するために、これらのマイクロRNAのサブセットの有意性を、Rosetta Genomics製miRdicator(商標)高感度qRT−PCRプラットフォーム(方法)上で、元々の試料のうちの15個に、65個の独立した試料を足して使用して確認した。測定したシグナルの値は、プラットフォーム間で異なるが、マイクロRNAは、それらの診断における役割を維持し(図3C、D)、正確な分類のために使用することができる(図5)。
【0156】
表1:癌の型、クラス及び組織診断
【表1】
【0157】
表2:決定木のノード、及び各ノードにおいて使用したマイクロRNA
【表2−1】
【表2−2】
†hsa−miR−200c及びhsa−miR−141は、1つの予測されたポリシストロニックなpri−miR6の部分であり、発現が非常に類似する。これらの2つのマイクロRNAは、木において、結果に対して非常にわずかな効果しか示さず、互換的に使用することができる。hsa−miR−200cは、(トレーニングセットにおいては)ノード#1において、わずかにより良好な性能を有した。
a肝臓への転移が示された試料については、このノードにおいては右のブランチに分類し、ノード#3に進む。
1女性患者に由来することが示された試料については、このノードにおいては右のブランチに分類し、ノード#3に進む。
2女性患者に由来することが示された試料については、このノードにおいては左のブランチに分類し、乳房として分類する。
3男性患者に由来することが示された試料については、このノードにおいては左のブランチに分類し、ノード#21に進む。
【0158】
「胃*」のクラスは、胃癌及び食道胃接合部の腺癌の両方を包含し;「頭頚部*」のクラスは、頭頚部の癌及び食道の扁平上皮癌を包含する(図2を参照されたい)。「GIST」は、消化管間質腫瘍を示す。
【0159】
決定木のスキームにおいては、いくつかのマイクロRNAが、木の大きな区分を分け、その後のノードに至る2つのブランチのいずれに進むかを決め;その他のノードでは、2つのブランチのうちの少なくとも1つが、特定の組織型に至る末端のノードに分かれた。この木のデザインが意味することは、2つのブランチ間を分けるマイクロRNAはまた、このノードの2つの選択的なブランチの「葉」である、任意の2つの単一の組織型間を分けるためにも使用することができる点である。例えば、ノード#12においては、hsa−miR−194が、ノード#13に至るブランチと、ノード#16に至るブランチとの間を分ける。「結腸」が、ノード#13の(ノード#14を介する)間接的な葉であり、「乳房」が、ノード#16の(ノード#17を介する)間接的な葉であることから、このことは、hsa−miR−194はまた、その他の組織型が不在の場合には、「結腸」と「乳房」との間を分けるためにも使用することができることを意味する。
【0160】
表3に、トレーニングセット及び試験セット中の試料の数を示し、且つ盲検の試験セット上での分類の性能を、各クラスについて個別に及び全ての試料にわたり平均して全体的に示す。「Sens」は、感度を示し、「Spec」は、特異性を示す。「Tree」は、決定木アルゴリズムを指し;「Union」は、決定木アルゴリズム及びKNNアルゴリズムの両方の予測を収集することによって得られる、1つ/2つの答えである。「High conf.Frac」は、決定木アルゴリズム及びKNNアルゴリズムの両方が分類に関して一致する、高い信頼度の予測を有する試料の割合である。「High conf.Sens」は、高い信頼度の予測の間の感度である。最後の列は、転移性癌の試料である、試験セットのサブセット上での性能を示す。「胃*」のクラスは、胃癌及び食道胃接合部の腺癌の両方を包含し;「頭頚部*」のクラスは、頭頚部の癌及び食道の扁平上皮癌を包含する(図2を参照されたい)。「GIST」は、消化管間質腫瘍を示す。
【0161】
表3:盲検の試験セット上での分類の性能
【表3】
【0162】
表2中のマイクロRNAのいくつかについては、類似のシード配列(同一のヌクレオチド2〜8)を有する、その他の変異体マイクロRNAが、ヒトゲノム中で知られており(表4を参照されたい)、したがって、これらは、非常に類似したセットの(mRNAをコードする)遺伝子を(RISC機構を介して)標的にするとみなされている。同一のシード配列を有するこれらのマイクロRNAは、表示するmiRと置き換わることができる。
【0163】
表4:同一のシード配列を有するマイクロRNA
【表4−1】
【表4−2】
【表4−3】
【0164】
表2中のマイクロRNAのいくつかについては、ゲノム上でごく接近して位置する(ゲノムのクラスタ)、その他のマイクロRNAが、ヒトゲノム中で知られており(表5を参照されたい)、これらは、表示するmiRと一緒に、同じように発現する場合がある。ほぼ同一のゲノムの位置からのこれらのマイクロRNAは、表示するmiRと置き換わることができる。
【0165】
表5:同一のゲノムのクラスタ内のマイクロRNA(距離<10kb)
【表5−1】
【表5−2】
【表5−3】
【表5−4】
【0166】
表2中のマイクロRNAのいくつかについては、類似の配列(配列中に6つ未満のミスマッチ)を有する、その他のマイクロRNAが、ヒトゲノム中で知られており(表6を参照されたい)、したがって、これらはまた、同一の設計を有するプローブによって捕捉することもできる。類似の全体的な配列を有するこれらのマイクロRNAは、表示するmiRと置き換わることができる。
【0167】
表6:類似の配列を有するマイクロRNA
【表6−1】
【表6−2】
【0168】
【0169】
これまでに記載した、特定の実施形態から、本発明の一般的な性質が非常に十分に明らかになるので、他者は、現在の知識を適用することによって、過度の実験なしに、一般的概念から逸脱することなく、そのような特定の実施形態を容易に改変及び/又は適合させて、種々の応用例を得ることができる。したがって、そのような適合形態及び改変形態は、開示した実施形態の均等物の意味及び範囲のうちで把握されるべきであり、そのように意図されている。本発明を、その特定の実施形態と共に説明してきたが、多くの代替形態、改変形態及び変形形態が、当業者には明らかになるであろうことは明白である。したがって、添付の請求項の精神及び広範な範囲に属する、そのような代替形態、改変形態及び変形形態は全て包含されるものとする。
【0170】
詳細な説明及び特定の実施例は、本発明の好ましい実施形態を示すが、本発明の精神及び範囲に属する種々の変化形態及び改変形態が、この詳細な説明から、当業者には明らかになるであろうことから、これら詳細な説明及び特定の実施例は、説明のために提供されているに過ぎないことを理解されたい。
【技術分野】
【0001】
本発明は、癌の分類及び癌の起源組織の同定のための方法に関する。具体的には、本発明は、特定の癌と関係があるマイクロRNA分子、及び特定の癌に関連する又は由来する種々の核酸分子に関する。
【背景技術】
【0002】
マイクロRNAは、腫瘍形成に関与し4、著しい組織特異性を示す5〜7新規のクラスの非コードの、制御RNA遺伝子1〜3である。これらは、高度に組織特異的なバイオマーカーとして出現し2,5,6、分化の発生の決定をコードする場面において重要な役割を担うと仮定されている。種々の研究が、マイクロRNAを、特異的な悪性腫瘍の発生に関係付けている4。
【0003】
転移性の原発不明癌(CUP)が、新しい癌の全症例の3〜5%を占め、群としては、通常、非常に攻撃的な疾患であり、予後は芳しくない10。CUPの概念は、そのような患者の適切な治療を顕著に遅らせる場合がある、複雑で高価なプロセスであることが多いにもかかわらず、癌の起源を同定する現在の方法に限界があることに由来する。最近の研究から、CUPについての証拠に基づいた治療がないことから、臨床管理における大きな変動が明らかになった11。多くのプロトコールが評価された12が、比較的小さな利益しか示されていない13。したがって、腫瘍の起源組織を決定することが、分子診断の重要な、臨床における適用となる9。
【0004】
腫瘍の起源組織についての分子的分類研究14〜17は、一般に、ドメインに特異的な知識を活用しない分類アルゴリズムを使用してきた。すなわち、組織は、推測的に等価であるとして扱われ、胚形成における共通の発生学的起源を有する組織型間の根本的な類似性は無視された。注目すべき例外は、病態の分類木に基づいたSheddenらによる研究である18。これらの研究は、生物学的特色(例えば、mRNAの発現レベル)の効果を平均する機械学習の方法、すなわち、自動処理にはより適しているが、推定機構を使用したり、生み出したりはしないアプローチを使用した。
【発明の概要】
【発明が解決しようとする課題】
【0005】
種々のマーカーが、特定の型の癌及び腫瘍の起源組織を指し示すために提案されている。しかし、腫瘍マーカーの診断精度は、まだ定義されていない。したがって、特定の型の癌を診断及び分類するためのより効率的且つ有効な方法が求められている。
【課題を解決するための手段】
【0006】
本発明は、特定の癌及び腫瘍の起源組織の同定、分類及び診断において使用するための特異的な核酸配列を提供する。また、生物学的試料中の核酸配列の存在量に基づいて、核酸配列を、対象の予後の評価及び適切な治療の決定のための予後マーカーとして使用することもできる。
【0007】
本発明は、腫瘍の分類のための、マイクロRNAに基づいた分類子の開発に一部基づく。マイクロRNA発現レベルを、22個の異なる腫瘍の組織及び転移に由来するパラフィンに包埋した400個の新鮮凍結試料において測定した。253個の試料のマイクロRNAのマイクロアレイのデータを使用して、それぞれが特異的な示差的診断の役割に連結した48個のマイクロRNAに基づいて、分類子を構築した。試料のうちの3分の2が、90%を超える精度を有する高い信頼度で分類された。83個の試料の独立した盲検の試験セットにおいては、高い信頼度の全般的な精度は、89%に達した。分類の精度は、131個の転移試料を包含する、大部分の組織のクラスについては100%に達した。マイクロRNAバイオマーカーの有意性を、65個の追加の盲検の試験試料を使用して、高感度qRT−PCRによってさらに確認した。これらの知見によって、CUPについての新規のバイオマーカーとしてのマイクロRNAの有用性が実証されている。分類子は、統計学的に意味のある信頼度の尺度を提供し、広い生物学的な及び診断における適用を有し得る。
【0008】
第1の態様によれば、本発明は、生物学的試料の起源組織を同定する方法を提供し、この方法は、対象から生物学的試料を得るステップと;マイクロRNAのあらかじめ決定したセット中の個々の核酸の発現を決定するステップと;前記試料について起源組織を分類子によって分類するステップとを含む。1つの実施形態によれば、前記分類子は、決定木モデルである。
【0009】
別の態様によれば、本発明は、生物学的試料の起源組織を分類する方法を提供し、この方法は、対象から生物学的試料を得るステップと;前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の発現プロファイルを決定するステップと;前記発現プロファイルを参照発現プロファイルと比較するステップとを含み、それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記試料の起源組織の同定を可能にする。
【0010】
特定の実施形態によれば、前記組織は、肝臓、肺、膀胱、前立腺、乳房、結腸、卵巣、精巣、胃、甲状腺、膵臓、脳、子宮内膜、頭頚部、リンパ節、腎臓、メラニン形成細胞、髄膜、胸腺、消化管及び前立腺からなる群から選択される。
【0011】
いくつかの実施形態によれば、前記生物学的試料は、癌性の試料である。
【0012】
別の態様によれば、本発明は、癌又は過形成を分類する方法を提供し、この方法は、対象から生物学的試料を得るステップと;前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップと;前記得られた測定値を、前記核酸の存在量を示す基準値と比較するステップとを含み、それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記癌又は過形成の分類を可能にする。
【0013】
1つの実施形態によれば、前記試料を、転移性の癌を有する対象から得る。別の実施形態によれば、前記試料を、原発不明癌(CUP)を有する対象から得る。さらなる実施形態によれば、前記試料を、原発性癌を有する対象から得る。さらに別の実施形態によれば、前記試料は、未同定起源の腫瘍、転移性腫瘍又は原発性腫瘍である。
【0014】
特定の実施形態によれば、前記癌は、肝臓癌、肺癌、膀胱癌、前立腺癌、乳癌、結腸癌、卵巣癌、精巣癌、胃癌、甲状腺癌、膵臓癌、脳癌、子宮内膜癌、頭頚部癌、リンパ節癌、腎臓癌、メラノーマ、髄膜癌、胸腺癌、前立腺癌、消化管間質癌及び肉腫からなる群から選択される。
【0015】
いくつかの実施形態によれば、前記癌は、肺カルチノイド、肺胸膜中皮腫及び肺扁平上皮細胞癌からなる群から選択された肺癌である。
【0016】
その他の実施形態によれば、前記試料は、体液、細胞系及び組織試料からなる群から選択される。いくつの実施形態によれば、前記組織は、新鮮組織、凍結組織、固定組織、ロウ埋包組織又はホルマリン固定パラフィン埋包(FFPE)組織である。
【0017】
本発明の分類方法は、少なくとも1つの分類子アルゴリズムの使用をさらに含み、前記分類子アルゴリズムは、決定木分類子、ロジスティック回帰分類子、直線回帰分類子、(K最近傍をはじめとする)最近傍分類子、ニューラルネットワーク分類子、ガウシアン混合モデル(GMM)分類子、及びサポートベクターマシン(SVM)分類子からなる群から選択される。統合された又は大多数の決定に達するために、分類子は、(2分木をはじめとする)決定木構造又は(加重票決をはじめとする)票決スキームを使用して、1つ又は複数の分類子アルゴリズムの分類を比較することができる。
【0018】
本発明は、肝臓起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜4からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肝臓起源の癌の指標となる。
【0019】
本発明は、精巣起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜6からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、精巣起源の癌の指標となる。
【0020】
本発明は、肺起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺起源の癌の指標となる。
【0021】
本発明は、肺カルチノイド起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜48、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺カルチノイド起源の癌の指標となる。
【0022】
本発明は、肺胸膜起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺胸膜起源の癌の指標となる。
【0023】
本発明は、肺扁平上皮起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、肺扁平上皮起源の癌の指標となる。
【0024】
本発明は、膵臓起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、膵臓起源の癌の指標となる。
【0025】
本発明は、脳起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜24、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、脳起源の癌の指標となる。
【0026】
本発明は、乳房起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、乳房起源の癌の指標となる。
【0027】
本発明は、前立腺起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、前立腺起源の癌の指標となる。
【0028】
本発明は、子宮内膜起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、子宮内膜起源の癌の指標となる。
【0029】
本発明は、甲状腺起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、甲状腺起源の癌の指標となる。
【0030】
本発明は、頭頚部起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、頭頚部の癌の指標となる。
【0031】
本発明は、結腸起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜52、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、結腸起源の癌の指標となる。
【0032】
本発明は、膀胱起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、膀胱起源の癌の指標となる。
【0033】
本発明は、卵巣起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、卵巣起源の癌の指標となる。
【0034】
本発明は、リンパ節起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、リンパ節起源の癌の指標となる。
【0035】
本発明は、腎臓起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、腎臓起源の癌の指標となる。
【0036】
本発明は、メラニン形成細胞起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、メラニン形成細胞起源の癌の指標となる。
【0037】
本発明は、髄膜起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、髄膜起源の癌の指標となる。
【0038】
本発明は、胸腺細胞(胸腺腫−B2型)起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、胸腺細胞(胸腺腫−B2型)起源の癌の指標となる。
【0039】
本発明は、胸腺細胞(胸腺腫−B3型)起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、胸腺細胞(胸腺腫−B3型)起源の癌の指標となる。
【0040】
本発明は、消化管間質起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、癌の指標となる。
【0041】
本発明は、肉腫起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、消化管間質起源の癌の指標となる。
【0042】
本発明は、胃起源の癌を分類するための方法をさらに提供し、この方法は、対象から得た試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み;前記核酸配列の存在量が、胃起源の癌の指標となる。
【0043】
別の態様によれば、本発明は、癌を分類するためのキットを提供し、前記キットは、配列番号1〜96;それらの相補的な配列;及びそれらに対して少なくとも約80%の同一性を有する配列からなる群から選択された核酸配列を含むプローブを含む。
【0044】
本発明のこれら及びその他の実施形態が、以下の図、説明及び特許請求の範囲を併せると明らかになるであろう。
【図面の簡単な説明】
【0045】
【図1A】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。原発性結腸癌の試料と転移性結腸癌の試料とを比較し、セットのうちの少なくとも1つにおいてシグナルの閾値を超える各マイクロRNAについて、p値(対数シグナル上での対応のないt−検定)を計算する。ソートしたp値は、p値の不規則分布と一致する(0〜1の範囲において均一、黒色の点線)。下の方にある線は、10%の誤発見率(FDR)の線を示し、この線より下のp値は、10%の誤発見の確率を有する。結腸癌の転移については、いずれの特色も、10%の誤発見試験には合格しない。
【図1B】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。原発性結腸癌試料対転移性結腸癌試料の平均log2シグナルのドットプロット(十字;点線は、視覚を補助するものであり、発現が等しい対角線を示す)。
【図1C】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。(Aと同様)原発性胃癌とリンパ節に転移した胃癌との比較。最も低いp値を有する最初の3つのマイクロRNAは、(10%の誤発見率における)誤発見試験に合格する。
【図1D】原発性腫瘍の試料と転移性腫瘍の試料とにおけるマイクロRNAの発現の比較を示すグラフである。(Bと同様)原発性胃癌対リンパ節に転移した胃癌のドットプロット。FDR試験に合格する3つのマイクロRNAが強調されている:miR−133a(配列番号97)及びmiR−143(配列番号99)は、原発性腫瘍中で過剰発現し、miR−150(配列番号101)は、転移において過剰発現する。
【図2】決定木分類子の構造を示す図であり、24個のノード(番号を付けてある、表2)、及び25個の葉を有する。各ノードは、試料の2つのセット間の二分決定であり、それらの決定は、ノードの左と右にある。一連の二分決定は、ノード#1から始まり、下方に移動し、木の「葉」である、可能な腫瘍型のうちの1つに至る。ノード#1において左のブランチに分類された試料は、「肝臓」のクラスに帰属する。それ以外の試料は、ノード#2に進む。エンドポイント(木の「葉」)に達し、この試料についての予測されるクラスが示されるまで、引き続いて、ノードにおいてマイクロRNAの発現レベルを使用して、決定を行う。例えば、「乳房」として分類される試料は、ノード#1、#2、#3、#12、#16及び#17を通る経路を通り、ノード#3、#16及び#17においては左のブランチをとり、ノード#1、#2及び#12においては右のブランチをとる必要があり、その他のノードではいずれにおいても決定は必要ではない。木の構造を特定するにあたっては、トレーニングセットのデータにおいて観察された特性を有する臨床病理学的な事柄を組み合わせた。例えば、胸腺の試料は、上皮に関連するマイクロRNAの発現が異なる、それらの組織学的な型に従って2つの群に分けた。この発現の差は、B2型腫瘍におけるリンパ球のより高い比率に明白に起因する。最初の主要な分岐(ノード#3)は、上皮起源の組織を、その他の起源又は混合起源の組織から、すなわち、それらのマイクロRNAの発現プロファイル、特に、miR−141(配列番号69)/200(配列番号3、11)ファミリーの発現において反映される生物学的な差を分ける。ここでは、胸腺B2腫瘍を、非上皮性組織又は混合性組織と共に(右のブランチ上に)グループ化し、後に、胸腺B2腫瘍は、それらとは分かれる(図4)。肝臓及び精巣は、木の最初に置いた。これは、これらの組織が、それらを容易に同定することができ、その後の干渉を減少させるマイクロRNA(それぞれ、hsa−miR−122a(配列番号1)及びhsa−miR−372(配列番号5))の非常に特異的な発現を含有することによる。それに続くノードは、消化管とその他の上皮組織との、miR−194(配列番号37)及び追加のマイクロRNAを使用する分離(ノード#12)を反復した(図3B)。肺カルチノイド腫瘍は、その他の型の肺の腫瘍とは対照的に、miR−194の高い発現を有することが見出された。これは、それらの独特な生物学的特徴に関連し得る。したがって、これらの腫瘍は、ノード#12においては、消化管組織と共にグループ化し、ノード#13においては、その他のマイクロRNAを使用して、それらとは分ける(図3A)。食道癌は、それらの組織学的な型によれば、分類のために使用するマイクロRNAの発現が実質的に異なる:食道胃接合部の腺癌は、胃癌の試料に類似し、一方、扁平上皮の試料は、上皮性の高い頭頚部癌に対して高い類似性を有した。したがって、「胃*」のクラスは、胃癌及び食道胃接合部の腺癌の両方を包含し;「頭頚部*」のクラスは、頭頚部の癌及び食道の扁平上皮癌を包含する。「GIST」は、消化管間質腫瘍を示す。患者の性別又は利用可能な臨床病理学的な情報等の追加の情報は、再度のトレーニングの必要なしで、葉又はブランチを刈り込むことによって、容易に木に組み込まれる。
【図3A】決定木のノードにおける二分決定を示すグラフである。所与のノードについて、決定アルゴリズムをトレーニングする場合、このノードの可能な成果(「葉」)である試料のクラスのみを、トレーニングのために使用する。ノード#13(図2を参照されたい)においては、肺カルチノイド腫瘍(三角、7つの試料)が、hsa−miR−21(配列番号31)及びhsa−let−7e(配列番号47)の発現レベルを使用して、消化管起源の腫瘍(灰色、中抜きの四角、49個試料)から容易に分かれる(1つの外れ値を有する)。木においてそれより前に枝分れしたその他の試料、及びこれらのマイクロRNAによっては十分に分けられないその他の試料(丸、283個の試料)は考慮されない。重要なことには、消化管起源の転移性の試料(中抜きの四角、23個の試料)は、原発性腫瘍と共に分布する。実線は、ノード#13のロジスティック回帰モデルが確率P=0.5を割り当てるhsa−miR−21及びhsa−let−7eの値を示す。線より上の点には、確率P>0.5が割り当てられ、これらは、左のブランチをとり(ノード#14へ)、線より下の点は、右のブランチをとり、肺カルチノイドとして分類される。
【図3B】決定木のノードにおける二分決定を示すグラフである。木中のノード#12におけるhsa−miR−194(配列番号37)、hsa−miR−145(配列番号45)及びhsa−miR−205(配列番号7)の発現レベル(図2)。これらのマイクロRNAを使用して、ノード#12の左のブランチ、すなわち、胃、膵臓、結腸又は肺カルチノイドからの試料(灰色の四角、56個の試料、中抜きの四角は、転移性の試料を示す)と、ノード#12の右のブランチ中のその他の上皮性の試料(灰色の三角、152個の試料、中抜きの三角は、転移性の試料を示す)との間を分けることができる。
【図3C】決定木のノードにおける二分決定を示すグラフである。qRT−PCRによる、ノード#1で使用したマイクロRNA(表2)の確認:肝臓(四角、9個の試料)及び肝臓以外の試料(三角、71個の試料)は、hsa−miR−122a(配列番号1)及びhas−miR−141(配列番号69)を使用して容易に分かれる(図5)。各試料について示すシグナルは、U6とマイクロRNAとの間のサイクル閾値(Ct)の差である。より大きな差は、このマイクロRNAのより高い発現を意味する。肝臓の腫瘍は、hsa−miR−122aのより高い発現及びhsa−miR−141のより低い発現を有する。線は、ロジスティック回帰の決定の閾値を示す(図5)。
【図3D】決定木のノードにおける二分決定を示すグラフである。qRT−PCRによる、ノード#12において使用したマイクロRNA(表2)の確認:消化管腫瘍の試料(四角、13個の試料)は、その他の上皮性の腫瘍(三角、52個の試料)と比較して、hsa−miR−145(配列番号45)、hsa−miR−194(配列番号37)及びhsa−miR−205(配列番号7)の独特な発現レベルを示す(図5)。qRT−PCRによって得られた結果は、このノードにおけるマイクロアレイのプラットフォームによって得られた結果(パネルB)と非常に類似し、類似の分布を示す。
【図4】一次元におけるロジスティック回帰モデルを示すグラフである。木中のノード#8についてのロジスティック回帰モデル(表2)は、左のブランチの群(すなわち、胸腺B2)に属する各試料に、試料中のhsa−miR−205(配列番号7)の発現レベルの関数(挿入図)としての確率(P、実線の曲線)を割り当てる(Mは、測定した発現レベルの自然対数である)。棒は、胸腺B2の試料(ノード#8の左)及び試料(ノード#8の右)中のhsa−miR−205の発現レベル分布を示す。数は、各瓶中の試料の数を示す。M>9.2を有する試料は、P>0.5を有し(灰色の点線)、胸腺のクラスに帰属させ、一方、全てのその他の試料は、ノード#8においては右のブランチに帰属させ、その他の決定ノードによる分類を続ける。
【図5A】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。qRT−PCRにおいて測定したhsa−miR−122a(配列番号1)及びhsa−miR−141(配列番号69)の発現レベルを使用して、肝臓の試料を、肝臓以外の試料から分けるためにトレーニングしたロジスティック分類子の確率(P)出力(図3C)。四角は、9つの肝臓の試料を示し、三角は、71個の肝臓以外の試料を示す。Pth=0.8における閾値は、これらの2つのクラスを容易に分け、1つの外れ値を有する。
【図5B】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。対応するROC曲線は、AUC=0.988を有し、これは、ほぼ最適である。丸は、Pth=0.8を示し、これは、肝臓の試料の同定に関して100%の感度及び99%の特異性を有する。
【図5C】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。qRT−PCRにおいて測定したhsa−miR−145(配列番号45)、hsa−miR194(配列番号37)及びhsa−miR−205(配列番号7)の発現レベル(決定木中のノード#12、図2)を使用して、消化管(GI)の試料を、消化管以外の試料から分けるためにトレーニングしたロジスティック分類子の確率(P)出力(図3D)。四角は、13個の結腸又は膵臓の試料を示し、三角は、52個のその他の上皮性の試料(ノード#12における右のブランチ)を示す。Pth=0.5における閾値は、6つのエラーを有する。
【図5D】qRT−PCRデータを用いた分類の精度を示すグラフである。受信者操作特性曲線(ROC曲線)によって、臨床的な測定基準の異なるカットオフ値について、感度を、偽陽性率(1−特異性)に対してプロットする。ROC曲線は、分類の性能の尺度である。ROC曲線下面積(AUC)を使用して、測定基準の臨床的な性能を査定することができる。無作為の分類子は、AUC=0.5を有し、完璧な感度及び100%の特異性を有する最適な分類子は、AUC=1を有する。対応するROC曲線は、AUC=0.914を有する。丸は、Pth=0.5を示し、これは、消化管の試料の同定に関して92%の感度及び91%の特異性を有する。
【発明を実施するための形態】
【0046】
本発明は、特異的な核酸配列を、癌を分類するために使用することができるという発見に基づく。本発明は、異なる組織及び腫瘍起源を見分けるために使用することができる高感度で、特異的且つ正確な方法を提供する。腫瘍の組織起源を決定するために、新しい、マイクロRNAに基づいた分類子を開発した。この分類子は、驚くほど少数のマイクロRNAに基づいて、約90%の精度を達成する。この分類子は、透過的アルゴリズムを使用し、特異的なバイオマーカーの明確な解釈を可能にする。この分類子は、わずか48個のマイクロRNAマーカーを使用して、22個のクラス間で、盲検の試験試料上、及び130個超の転移について約90%の全般的な精度を達成する。本発明によれば、分類木中の各ノードを、独立した示差的診断ツールとして、例えば、異なる型の肺癌の同定において使用することができる。驚くほど少数のマーカーを使用する分類子の性能は、マイクロRNAの、組織特異的な癌のバイオマーカーとしての有用性を強調し、CUPの診断を促進するための有効な手段を提供する。
【0047】
異なる腫瘍起源を見分けることが可能になれば、最良で且つ最適な治療の患者への提供が促進されることになる。
【0048】
本発明は、本発明の特異的なマイクロRNA分子のレベルを比較することによる、癌を検出、診断、モニター、段階付け及び予知するための、定量及び定性の両面における診断アッセイ及び診断方法を提供する。そのようなレベルを、好ましくは、生検、腫瘍試料、細胞、組織及び/又は体液のうちの少なくとも1つ中で測定する。本発明は、生検、腫瘍試料、細胞、組織又は体液中の前記マイクロRNA分子のレベルの変化を解析することによる、特異的な癌の存在を診断するための方法を提供する。
【0049】
本発明においては、生検、腫瘍試料、細胞、組織又は体液中の前記マイクロRNAレベルの存在を決定することは、異なる癌を見分けるのに特に有用である。
【0050】
本発明の全ての方法は、場合により、その他の癌マーカーのレベルを測定するステップをさらに包含してよい。前記マイクロRNA分子に加えて、本発明において有用なその他の癌マーカーは、試験されている癌によって異なり、当業者には既知である。
【0051】
患者から得た試料中の、本発明の核酸配列等の遺伝子発現のレベルを決定するために使用することができるアッセイの技法は、当業者には周知である。そのようなアッセイの方法として、これらに限定されないが、放射免疫アッセイ、逆転写PCR(RT−PCR)アッセイ、免疫組織化学アッセイ、in situハイブリダイゼーションアッセイ、競合的結合アッセイ、ノーザンブロット解析、ELISAアッセイ、核酸マイクロアレイ、及びバイオチップ解析が挙げられる。
【0052】
本発明のいくつかの実施形態では、相関関係及び/又は階層的クラスタ分析を使用して、特異的な試料と癌試料の異なる標本との間において、本発明の核酸配列の発現レベルの類似性を査定することができる。1つ又は複数の核酸配列の発現レベルについて自由裁量による閾値を設定して、試料又は癌試料を2つの群のうちの1つに帰属させることができる。或いは好ましい実施形態では、1つ又は複数の本発明の核酸配列の発現レベルを、ロジスティック回帰等の方法によって組み合わせて、測定基準を定義し、次いで、これを、以前に測定した試料又は閾値と比較する。帰属のための閾値をパラメータとして扱い、このパラメータを使用して、試料を各クラスに帰属させる信頼度を定量化することができる。帰属のための閾値を増減させて、臨床の筋書きに応じて、感度又は特異性に有利な計らいをすることができる。参照データに対する相関値は、増減させることができる連続的なスコアを生成し、試料が特定のクラスの癌の起源又は型に属する可能性についての診断情報を提供する。多変量解析においては、マイクロRNAのサインが、高いレベルの予後の情報を提供する。
【0053】
定義
本明細書で使用する用語法は、特定の実施形態を説明するためのものに過ぎず、制限するものではないことを理解されたい。明細書及び添付の特許請求の範囲において使用する場合、単数の形態である「a」、「an」及び「the」は、文脈からそうではないことが明確に分かる場合以外は、複数の指示対象を包含することに留意しなければならない。
【0054】
本明細書において数の範囲を列挙する場合、それらの間に介在する数のそれぞれが、同一の程度の細密さで明確に企図される。例えば、6〜9の範囲の場合、7及び8の数も、6及び9に加えて企図され、6.0〜7.0の範囲の場合、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9及び7.0の数が、明確に企図される。
【0055】
異常な増殖
本明細書で使用する場合、「異常な増殖」という用語は、正常な、適切な又は予想される経過から逸脱する細胞の増殖を意味する。例えば、異常な細胞の増殖として、DNA又はその他の細胞構成成分が損傷又は欠損している細胞の不適切な増殖を挙げることができる。異常な細胞の増殖として、その特徴が、不適切に高いレベルの細胞分裂、不適切に低いレベルのアポトーシス若しくは両方が引き起した、それらが媒介した、又はそれらに至る徴候と関係がある細胞の増殖を挙げることができる。そのような徴候は、例えば、癌性であっても若しくは非癌性であっても、又は良性であっても若しくは悪性であっても、単一若しくは複数の局所的な、細胞、細胞群又は(1つ若しくは複数の)組織の異常増殖によって特徴付けることができる。
【0056】
約
本明細書で使用する場合、「約」という用語は、+/−10%を指す。
【0057】
結び付けた
本明細書で使用する場合、「結び付けた」又は「固定化した」は、プローブと固体の支持体との間の結合が、結合、洗浄、解析及び除去の条件下で十分に安定である、プローブ及び固体の支持体手段を指す。結合は、共有結合であっても、又は非共有結合であってもよい。共有結合は、プローブと固体の支持体との間に直接形成させてもよく、そうでなければクロスリンカーによって、或いは固体の支持体若しくはプローブのいずれか又は両方の分子上の特異的な反応性の基の内包によって形成させてもよい。非共有結合は、静電気的相互作用、親水性相互作用及び疎水性相互作用のうちの1つ又は複数であってよい。ストレプトアビジン等の分子を支持体に共有結合により結び付け、且つビオチン標識したプローブをストレプトアビジンに非共有結合により結合させることは、非共有結合として挙げられる。固定化にはまた、共有結合による相互作用と非共有結合による相互作用との組合せが関与する場合もある。
【0058】
生物学的試料
本明細書で使用する場合、「生物学的試料」は、核酸を含む生物学的な組織又は流体の試料を意味する。そのような試料として、これらに限定されないが、対象から単離した組織又は流体が挙げられる。生物学的試料としてまた、生検試料及び剖検試料等の組織切片、FFPE試料、組織学的な目的で得た凍結切片、血液、血液画分、血漿、血清、痰、便、涙液、粘液、毛髪、皮膚、尿、浸出液、腹水、羊水、唾液、脳脊髄液、子宮頚部の分泌物、膣の分泌物、子宮内膜の分泌物、消化管の分泌物、気管支の分泌物、細胞系、組織試料、又は乳房からの分泌物も挙げられる。生物学的試料は、対象から細胞試料を取り出すことによって提供することができるが、また、以前に単離した(例えば、別のヒトによって、別の時期に、及び/若しくは別の目的で単離した)細胞を使用することによって、又は本明細書に記載する方法をin vivoにおいて実施することによっても達成することができる。また、治療又は予後の履歴を有する組織等の記録保管されている組織も使用することができる。生物学的試料としてはまた、動物又はヒトの組織に由来する外植片並びに初代細胞培養物及び/又は形質転換細胞培養物も挙げられる。
【0059】
癌
「癌」という用語は、組織病理的な型又は侵襲性の段階に関わりなく、全ての型の癌性の増殖若しくは癌化の過程、転移組織、又は悪性に形質転換した細胞、組織若しくは臓器を包含することを意味する。癌の例として、これらに限定されないが、アプドーマ、分離腫、鰓腫、悪性カルチノイド症候群、カルチノイド心疾患、癌腫(例えば、Walker、基底細胞、基底扁平、Brown−Pearce、管、Ehrlich腫瘍、非小細胞肺(例えば、肺扁平上皮細胞癌、肺腺癌及び肺未分化大細胞癌)、燕麦細胞、乳頭、細気管支、気管支原性、扁平上皮細胞及び移行細胞)、組織球性障害、白血病(例えば、B細胞、混合細胞型、ヌル細胞、T細胞、T細胞慢性、HTLV−II関連、リンパ球性急性、リンパ球性慢性、肥満細胞及び骨髄性)、悪性組織球増殖症、ホジキン病、免疫増殖性小、非ホジキンリンパ腫、形質細胞腫、細網内皮症、メラノーマ;軟骨芽細胞腫、軟骨腫、軟骨肉腫、線維腫、線維肉腫、巨細胞腫、組織球腫、脂肪腫、脂肪肉腫、中皮腫、粘液腫、粘液肉腫、骨腫、骨肉腫、Ewing肉腫、骨膜腫、腺線維腫、腺リンパ腫、癌肉腫、脊索腫、頭蓋咽頭腫、未分化胚細胞腫、過誤腫、間葉細胞腫、中腎腫、筋肉腫、エナメル上皮腫、セメント質腫、歯牙腫、奇形腫、胸腺腫、絨毛性腫瘍、腺癌、腺腫、胆管腫、胆脂腫、円柱腫、嚢胞腺癌、嚢胞腺腫、顆粒膜細胞腫、半陰陽性卵巣腫瘍、肝細胞腫、汗腺腫、膵島細胞腫瘍、Leydig細胞腫、乳頭腫、Sertoli細胞腫、莢膜細胞腫、平滑筋腫、平滑筋肉腫、筋芽細胞腫、筋肉腫、横紋筋腫、横紋筋肉腫、脳室上衣腫、神経節腫、神経膠腫、髄芽腫、髄膜腫、神経鞘腫、神経芽腫、神経上皮腫、神経線維腫、神経腫、傍神経節腫、非クロム親和性傍神経節腫、角化血管腫、好酸球増多を伴う血管リンパ組織過形成、硬化性血管腫、血管腫症、グロムス血管腫、血管内皮腫、血管腫、血管外皮腫、血管肉腫、リンパ管腫、リンパ管筋腫、リンパ管肉腫、松果体腫、癌肉腫、軟骨肉腫、嚢胞肉腫、葉状、線維肉腫、血管肉腫、平滑筋肉腫、白血肉腫、脂肪肉腫、リンパ管肉腫、筋肉腫、粘液肉腫、卵巣癌、横紋筋肉腫、肉腫(例えば、Ewing、実験的、Kaposi及び肥満細胞)、神経線維腫症、及び子宮頚部異形成、並びに細胞が不死化又は形質転換されているその他の状態をはじめとする、固形腫瘍及び白血病が挙げられる。
【0060】
分類
分類という用語は、個々の項目を、(形質、変数、特徴、特色等と呼ばれる)当該項目に固有の1つ又は複数の特徴についての定量的な情報に基づいたり、統計学的なモデル及び/又は以前にラベルした項目のトレーニングセットに基づいたりして、群又はクラスに配置する手順及び/又はアルゴリズムを指す。「分類木」は、カテゴリ変数をクラスに配置する決定木である。
【0061】
相補体
本明細書で使用する場合、核酸を指すための「相補体」又は「相補的な」は、ヌクレオチド間又は核酸分子のヌクレオチド類似体間でワトソン−クリック塩基対(例えば、A−T/U及びC−G)又はフーグスティーン塩基対を形成することを意味することができる。完全な相補体又は完全に相補的であるは、ヌクレオチド間又は核酸分子のヌクレオチド類似体間で100%相補的な塩基対を形成することを意味する。
【0062】
Ct
本明細書で使用する場合、「Ct」は、qRT−PCRのサイクル閾値を指し、これは、蛍光が閾値を越える分別のサイクル数である。
【0063】
データ処理ルーチン
本明細書で使用する場合、「データ処理ルーチン」は、獲得したデータの生物学的な有意性(すなわち、アッセイ又は解析の最終的な結果)を決定するソフトウエア中で具体化することができるプロセスを指す。例えば、データ処理ルーチンは、収集したデータに基づいて起源組織を決定することができる。本明細書のシステム及び方法においては、データ処理ルーチンはまた、決定した結果に基づいてデータ収集ルーチンをコントロールすることもできる。データ処理ルーチンとデータ収集ルーチンとを統合し、フィードバックを提供して、データの獲得を行い、したがって、アッセイに基づいて判断する方法を提供することができる。
【0064】
データセット
本明細書で使用する場合、「データセット」という用語は、解析から得た数値を指す。解析に関係があるこれらの数値は、ピーク高さ及び曲線下面積等の値であってよい。
【0065】
データ構造
本明細書で使用する場合、「データ構造」という用語は、2つ以上のデータセットの組合せを指し、1つ又は複数の数学的操作を、1つ又は複数のデータセットに適用して、1つ又は複数の新しいデータセットを得るか、2つ以上のデータセットを操作して、新しい方法でデータを視覚的に説明する形態となす。2つ以上のデータセットの操作から作製したデータ構造の例として、階層的クラスタ分析がある。
【0066】
検出
「検出」は、試料中の構成成分の存在を検出することを意味する。検出はまた、構成成分が存在しないことを検出することも意味する。検出はまた、構成成分のレベルを、定量的又は定性的のいずれかで決定することも意味する。
【0067】
示差的発現
「示差的発現」は、細胞及び組織の内部及びそれらの間の、時間的及び/又は空間的な遺伝子発現パターンにおける定性的又は定量的な差を意味する。したがって、例えば、正常組織と疾患組織とを比べて示差的に発現した遺伝子は、活性化又は不活性化をはじめとして、その発現が定性的に変化している場合がある。特定の状況下では、別の状況と比べて、遺伝子のスイッチが入る又は切れる場合があり、したがって、2つ以上の状況の比較が可能となる。定性的に制御される遺伝子は、ある状況又は細胞型の中では、標準的な技法によって検出可能であり得る、ある発現パターンを示す場合がある。いくつかの遺伝子は、1つの状況又は細胞型において発現するが、両方では発現しない場合がある。或いは発現の差は、調節される、上方制御されて転写物の量の増加に至る、又は下方制御されて転写物の量の減少に至る点で、定量的である場合もある。発現が異なる程度は、発現アレイ、定量的逆転写PCR、ノーザンブロット解析、リアルタイムPCR、in situハイブリダイゼーション及びリボヌクレアーゼ保護等の標準的な特徴付けの技法によって定量化するのに十分に大きいことのみが必要である。
【0068】
発現プロファイル
「発現プロファイル」という用語は、広義に使用して、ゲノムの発現プロファイル、例えば、マイクロRNAの発現プロファイルを包含する。プロファイルは、核酸配列のレベルを決定するための任意の好都合な手段、例えば、マイクロRNA、標識したマイクロRNA、増幅したマイクロRNA、cDNA等の定量的ハイブリダイゼーション、定量的PCR、定量化のためのELISAなどによって求めることができ、2つの試料間の示差的遺伝子発現の解析を可能にする。対象又は患者の腫瘍試料、例えば、細胞、又はそれらのコレクション、すなわち、組織等をアッセイする。試料を、当技術分野で既知の任意の好都合な方法によって収集する。対象とする核酸配列は、上記で提供した核酸配列をはじめとする、予測的であることが見出されている核酸配列であり、発現プロファイルは、列挙した核酸配列の全てを包含する、5、10、20、25、50又は100個以上の核酸配列についての発現データを包含することができる。いくつかの実施形態によれば、「発現プロファイル」という用語は、測定した試料中の核酸配列の存在量を測定することを意味する。
【0069】
発現比
本明細書で使用する場合、「発現比」は、2つ以上の核酸の相対的な発現レベルを指し、これは、生物学的試料中の対応する核酸の相対的な発現レベルを検出することによって決定する。
【0070】
遺伝子
本明細書で使用する場合、「遺伝子」は、転写及び/若しくは翻訳の制御配列、並びに/又はコード領域、並びに/又は非翻訳配列(例えば、イントロン、5’−及び3’−非翻訳配列)を含む、天然の遺伝子(例えば、ゲノムの遺伝子)であっても、又は合成の遺伝子であってもよい。遺伝子のコード領域は、アミノ酸配列をコードするヌクレオチド配列であっても、又はtRNA、rRNA、触媒RNA、siRNA、miRNA若しくはアンチセンスRNA等の機能性RNAであってもよい。遺伝子はまた、コード領域(例えば、エクソン及びmiRNA)に対応するmRNA又はcDNAであってもよく、これは、場合により、それらに連結している5’−又は3’−非翻訳配列を含む。遺伝子はまた、in vitroにおいて生成した増幅核酸分子であってもよく、これは、コード領域の全部若しくは一部及び/又はそれらに連結している5’−若しくは3’−非翻訳配列を含む。
【0071】
溝の結合剤/副溝の結合剤(MGB)
「溝の結合剤」及び/又は「副溝の結合剤」は、互換的に使用することができ、二本鎖DNAの副溝に、典型的には配列特異的な様式ではまる小型分子を指す。副溝の結合剤は、三日月様の形状をとり、したがって、しばしば水に置き換わって、二重らせんの副溝中にぴったりはまることができる、長く平坦な分子であってよい。副溝に結合する分子は、典型的には、フラン環、ベンゼン環又はピロール環等のねじれの自由を有する結合によって接続されている、いくつかの芳香環を含む。副溝の結合剤は、ネトロプシン、ジスタマイシン、ベレニル(berenil)、ペンタミジン及びその他の芳香族ジアミジン等の抗生物質、Hoechst33258、SN6999、クロモマイシン及びミトラマイシン等のaureolicな抗腫瘍薬、CC−1065、ジヒドロシクロピロロインドールトリペプチド(DPI3)、1,2−ジヒドロ−(3H)−ピロロ[3,2−e]インドール−7−カルボキシレート(CDPI3)、さらにそれらの内容が参照によって本明細書に組み込まれているNucleic Acids in Chemistry and Biology,2d ed.、Blackburn及びGait編、Oxford University Press、1996並びにPCT出願公開第WO03/078450号に記載されているものをはじめとする、関連の化合物及び類似体であってよい。副溝の結合剤は、プライマー、プローブ、ハイブリダイゼーションタグ相補体の構成成分、又はそれらの組合せであってよい。副溝の結合剤は、それらが結び付いているプライマー又はプローブのTmを上昇させることができ、そのようなプライマー又はプローブがより高い温度で有効にハイブリダイズするのを可能にする。
【0072】
宿主細胞
本明細書で使用する場合、「宿主細胞」は、天然に存在する細胞であっても、又はベクターを含有することができ、当該ベクターの複製を支援することができる形質転換細胞であってもよい。宿主細胞は、培養細胞、外植片、in vivoにおける細胞などであってよい。宿主細胞は、大腸菌(E.coli)等の原核細胞であっても、又は酵母、昆虫、両生類若しくは哺乳動物の細胞等、すなわちCHO細胞及びHeLa細胞等の真核細胞であってもよい。
【0073】
同一性
本明細書で使用する場合、「同一である」又は「同一性」は、2つ以上の核酸又はポリペプチド配列の文脈においては、配列が、特定の領域にわたって同一である、特定のパーセントの残基を有することを意味する。パーセントは、2つの配列を最適に整列させ、特定の領域にわたって2つの配列を比較し、両方の配列中に同一の残基が存在する位置の数を決定してマッチした位置の数を求め、マッチした位置の数を特定の領域中の位置の全数で割り、結果に100をかけて、配列同一性のパーセントを求めることによって計算することができる。2つの配列が異なる長さであり又はアラインメントが1つ若しくは複数のずれた末端をもたらし、比較の特定の領域が単一の配列のみを包含する場合には、単一の配列の残基を、計算の分母には含めるが、分子には含めない。DNA配列とRNA配列とを比較する場合には、チミン(T)とウラシル(U)とを同等であるとみなしてよい。同一性は、手作業で又はBLAST若しくはBLAST2.0等のコンピュータ配列アルゴリズムを使用することによって実施することができる。
【0074】
in situにおける検出
本明細書で使用する場合、「in situにおける検出」は、元々の部位における発現又は発現レベルの検出を意味し、元々の部位とは、生検等の組織試料中の部位を意味する。
【0075】
k−最近傍
「k−最近傍」という句は、ある点を、当該点とトレーニングデータセット中の点との間の距離を計算することによって分類する分類方法を指す。次いで、この方法は、当該点を、k(但し、kは整数である)個のその最近傍の間で最も一般的であるクラスに帰属させる。
【0076】
標識
本明細書で使用する場合、「標識」は、分光学的手段、光化学的手段、生化学的手段、免疫化学的手段、化学的手段又はその他の物理学的手段によって検出可能な組成物を意味する。例えば、有用な標識として、32P、蛍光染料、高電子密度試薬、(例えば、ELISA中で一般的に使用されるような)酵素、ビオチン、ジゴキシゲニン、又は検出可能となすことができるハプテン及びその他の実体が挙げられる。標識は、核酸及びタンパク質中に任意の位置において組み込むことができる。
【0077】
ノード
「ノード」は、分類(すなわち、決定)木における決定点である。また、その他のノードからの入力を組み合わせ、活性化機能の適用を通して出力を発生させるニューラルネット中の点。「葉」は、さらには分かれることのないノード、すなわち、分類木又は決定木における末端の配置である。
【0078】
核酸
本明細書で使用する場合、「核酸」又は「オリゴヌクレオチド」又は「ポリヌクレオチド」は、共有結合によって一緒に連結されている少なくとも2つのヌクレオチドを意味する。一本鎖の描写はまた、相補鎖の配列も定義する。したがって、核酸はまた、描写した一本鎖の相補鎖も包含する。核酸の多くの変異体を、所与の核酸と同一の目的で使用することができる。したがって、核酸はまた、実質的に同一な核酸及びそれらの相補体も包含する。一本鎖は、厳密なハイブリダイゼーション条件下で標的配列とハイブリダイズすることができるプローブをもたらす。したがって、核酸はまた、厳密なハイブリダイゼーション条件下でハイブリダイズするプローブも包含する。
【0079】
核酸は、一本鎖若しくは二本鎖であってもよく、又は二本鎖配列及び一本鎖配列の両方の部分を含んでもよい。核酸は、DNA、すなわち、ゲノムDNA及びcDNAの両方であってもよく、RNAであってもよく、又はハイブリッドであってもよい。ハイブリッドにおいては、核酸は、デオキシリボヌクレオチド及びリボヌクレオチドの組合せ、並びにウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン、ヒポキサンチン、イソシトシン及びイソグアニンをはじめとする、塩基の組合せを含有することができる。核酸は、化学的な合成方法によって又は組換えの方法によって得ることができる。
【0080】
核酸は、一般的には、リン酸ジエステル結合を含有するが、核酸として、少なくとも1つの異なる連結、例えば、ホスホロアミデート、ホスホロチオエート、ホスホロジチオエート又はO−メチルホスホロアミダイトの連結、並びにペプチド核酸の骨格及び連結を有する場合がある核酸類似体を挙げることができる。その他の類似体核酸として、参照によって本明細書に組み込まれている米国特許第5,235,033号及び第5,034,506号に記載されているものをはじめとする、正の骨格を有するもの;非イオン性の骨格を有するもの、及び非リボース骨格を有するものが挙げられる。1つ又は複数の天然には存在しないヌクレオチド又は改変されたヌクレオチドを含有する核酸もまた、核酸の1つの定義の範囲に包含される。改変されたヌクレオチド類似体は、例えば、核酸分子の5’−末端及び/又は3’−末端に位置することができる。ヌクレオチド類似体の代表的な例は、糖又は骨格が改変されたリボヌクレオチドから選択することができる。しかし、また、ヌクレオベース改変リボヌクレオチド、すなわち、天然に存在するヌクレオベースの代わりに天然には存在しないヌクレオベースを含有するリボヌクレオチド、具体的には、5位において改変されたウリジン又はシチジン、例えば、5−(2−アミノ)プロピルウリジン、5−ブロモウリジン;8位において改変されたアデノシン及びグアノシン、例えば、8−ブロモグアノシン;デアザヌクレオチド、例えば、7−デアザアデノシン;O−及びN−アルキル化ヌクレオチド、例えば、N6−メチルアデノシンも適切であることに留意しなければならない。2’−OH基は、H、OR、R、ハロ、SH、SR、NH2、NHR、NR2又はCNから選択された基によって置換することができ、但し、Rは、C1〜C6のアルキル、アルケニル又はアルキニルであり、ハロは、F、Cl、Br又はIである。改変されたヌクレオチドとしてまた、例えば、参照によって本明細書に組み込まれているKrutzfeldtら、Nature 438:685−689(2005)、Soutschekら、Nature 432:173−178(2004)、及び米国特許公開第20050107325号に記載されているヒドロキシプロリノール連結を介してコレステロールとコンジュゲートしたヌクレオチドも挙げることができる。追加の改変されたヌクレオチド及び核酸が、参照によって本明細書に組み込まれている米国特許公開第20050182005号に記載されている。リボース−リン酸骨格は、多様な理由で、例えば、そのような分子の生理環境における安定性及び半減期を向上させるために、細胞膜を介する拡散を増強させるために、又はバイオチップ上のプローブとして改変することができる。骨格の改変はまた、細胞のエンドサイトーシスの厳しい環境等における分解に対する抵抗性を増強させることもできる。骨格の改変はまた、肝臓及び腎臓等における肝細胞による核酸のクリアランスを低下させることもできる。天然に存在する核酸と類似体との混合物を作製してよく;或いは異なる核酸類似体の混合物、及び天然に存在する核酸と類似体との混合物を作製してもよい。
【0081】
プローブ
本明細書で使用する場合、「プローブ」は、1つ又は複数の型の化学的な結合により、通常は相補的な塩基の対の形成、すなわち、通常は水素結合の形成により、相補的な配列の標的核酸に結合することができるオリゴヌクレオチドを意味する。プローブは、ハイブリダイゼーション条件の厳密度に依存して、プローブ配列に対する完全な相補性には欠ける標的配列に結合することができる。標的配列と本明細書に記載する一本鎖の核酸との間におけるハイブリダイゼーションを妨げる任意の数の塩基対のミスマッチがあってよい。しかし、変異の数が非常に多いので、最も低い厳密度のハイブリダイゼーション条件下であっても、ハイブリダイゼーションを起こすことができない場合には、当該配列は、相補的な標的配列とはならない。プローブは、一本鎖であっても、又は部分的に一本鎖であり且つ部分的に二本鎖であってもよい。プローブの鎖の状態は、標的配列の構造、組成及び特性によって決定付けられる。プローブは、ストレプトアビジン複合体が後に結合することができるビオチンを用いて等、直接的に標識しても、又は間接的に標識してもよい。
【0082】
基準値
本明細書で使用する場合、「基準値」という用語は、アッセイの結果と比較した場合に、特定の成果と統計学的に相関関係を示す値を意味する。好ましい実施形態では、基準値は、マイクロRNAの発現を既知の臨床成果と比較する研究の統計学的解析から決定する。
【0083】
厳密なハイブリダイゼーション条件
本明細書で使用する場合、「厳密なハイブリダイゼーション条件」は、核酸の複合体混合物等において、第1の核酸配列(例えば、プローブ)が第2の核酸配列(例えば、標的)とハイブリダイズする条件を意味する。厳密な条件は、配列依存性であり、異なる状況においては異なる。厳密な条件を選択して、特異的な配列の、規定されたイオン強度、pHにおける融解温度(Tm)よりも約5〜10℃低い状態となすことができる。Tmは、平衡状態において、標的に対して相補的なプローブの50%が標的配列とハイブリダイズする(規定されたイオン強度、pH及び核濃度下の)温度であってよい(Tmにおいて、標的配列が過剰に存在する場合、プローブの50%が平衡状態において利用されている)。厳密な条件は、塩濃度が、pH7.0から8.3において、約0.01〜1.0Mナトリウムイオン等、約1.0M未満のナトリウム(又はその他の塩の)イオンの濃度であり、温度が、短いプローブ(例えば、約10〜50個のヌクレオチド)の場合には少なくとも約30℃であり、長いプローブ(例えば、約50個超のヌクレオチド)の場合には少なくとも約60℃である条件であってよい。厳密な条件はまた、ホルムアミド等の不安定化剤を添加して達成することもできる。選択的又は特異的なハイブリダイゼーションのためには、正のシグナルが、バックグラウンドのハイブリダイゼーションの少なくとも2から10倍であってよい。例示的な厳密なハイブリダイゼーション条件として、以下のものが挙げられる:50%ホルムアミド、5×SSC及び1%SDS、42℃でインキュベートし、又は5×SSC、1%SDS、65℃でインキュベートし、0.2×SSC及び0.1%SDS中、65℃洗浄する。
【0084】
実質的に相補的である
本明細書で使用する場合、「実質的に相補的である」は、第1の配列が、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95若しくは100個以上のヌクレオチドの領域にわたって、第2の配列の相補体と、少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%若しくは99%同一であること、又は2つの配列が、厳密なハイブリダイゼーション条件下でハイブリダイズすることを意味する。
【0085】
実質的に同一である
本明細書で使用する場合、「実質的に同一である」は、第1の配列と第2の配列とが、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95又は100個以上のヌクレオチド若しくはアミノ酸の領域にわたって、少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%若しくは99%同一であること、又は核酸に関して、第1の配列が、第2の配列の相補体に対して実質的に相補的である場合を意味する。
【0086】
対象
本明細書で使用する場合、「対象」という用語は、哺乳動物を指し、ヒト及びその他の哺乳動物の両方を包含する。本発明の方法は、好ましくは、ヒト対象に適用する。
【0087】
標的核酸
本明細書で使用する場合、「標的核酸」は、別の核酸が結合することができる核酸又はその変異体を意味する。標的核酸は、DNA配列であってよい。標的核酸は、RNAであってよい。標的核酸は、mRNA、tRNA、shRNA、siRNA又はPiwi−相互作用RNA、又はpri−miRNA、pre−miRNA、miRNA、又は抗miRNAを含むことができる。
【0088】
標的核酸は、標的miRNA結合部位又はその変異体を含むことができる。1つ又は複数のプローブが、標的核酸に結合することができる。標的結合部位は、5〜100又は10〜60個のヌクレオチドを含むことができる。標的結合部位は、全部で5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30〜40、40〜50、50〜60、61、62又は63個のヌクレオチドを含むことができる。標的部位の配列は、それらの内容が本明細書に組み込まれている米国特許出願第11/384,049号、第11/418,870号又は第11/429,720号に開示されている標的miRNA結合部位の配列のうちの少なくとも5個のヌクレオチドを含むことができる。
【0089】
組織試料
本明細書で使用する場合、組織試料は、組織生検から、関連の医術における当業者に周知の方法を使用して得た組織である。本明細書で使用する場合、「癌の疑いがある」という句は、医術における当業者によって癌性細胞を含有すると考えられている癌組織試料を意味する。生検から試料を得るための方法として、腫瘤を肉眼で見分ける方法、顕微解剖、レーザーに基づいた顕微解剖、又は当技術分野で既知の細胞を分離する方法が挙げられる。
【0090】
腫瘍
本明細書で使用する場合、「腫瘍」は、悪性にしても又は良性にしても、全ての新生物細胞の成長及び増殖、並びに全ての前癌性及び癌性の細胞及び組織を指す。
【0091】
変異体
本明細書で使用する場合、核酸に関する「変異体」は、(i)参照するヌクレオチド配列の一部;(ii)参照するヌクレオチド配列の相補体若しくはその一部;(iii)参照する核酸と実質的に同一である核酸、若しくはその相補体;又は(iv)厳密な条件下で参照する核酸とハイブリダイズする核酸、その相補体、若しくはそれと実質的に同一である配列を意味する。
【0092】
野生型
本明細書で使用する場合、「野生型」の配列という用語は、その配列についての天然の又は正常な機能を果たす配列の対立遺伝子の形態であるコード配列、非コード配列又はインターフェイス配列を指す。野生型の配列は、同族の配列の複数の対立遺伝子の形態を包含し、例えば、野生型の配列の複数の対立遺伝子が、コード配列がコードするタンパク質配列に対するサイレント又は保存的な変化をコードする場合がある。
【0093】
本発明は、miRNAを、特異的な癌の同定、分類及び診断のため、並びにそれらの起源組織の同定のために利用する。
【0094】
マイクロRNAのプロセシング
マイクロRNA(miRNA)をコードする遺伝子を転写させて、pri−miRNAとして知られているmiRNAの一次転写物の産生をもたらすことができる。pri−miRNAは、ステムアンドループ構造を有するヘアピンを含むことができる。ヘアピンのステムは、ミスマッチした塩基を含むことができる。pri−miRNAは、いくつかのヘアピンを、ポリシストロニックな構造として含むことができる。
【0095】
pri−miRNAのヘアピン構造は、Droshaによって認識され得る。Droshaは、リボヌクレアーゼIIIエンドヌクレアーゼである。Droshaは、pri−miRNA中の末端のループを認識し、ステムに入ってらせん約2巻きのところで切断して、pre−miRNAとして知られている、60−70ntの前駆体を産生することができる。Droshaは、pri−miRNAを切断し、RNaseIIIエンドヌクレアーゼに典型的な、ずれた切断部をもたらし、5’リン酸及び約2ヌクレオチドの3’オーバーハングを有するpre−miRNAステムループをもたらすことができる。Drosha切断部位から伸長する、ステムのらせん約1巻き(約10個のヌクレオチド)が、効率的なプロセシングに不可欠である場合がある。次いで、pre−miRNAは、Ran−GTP及び搬出受容体Ex−portin−5によって核から細胞質へ能動的に輸送され得る。
【0096】
pre−miRNAは、Dicerによって認識され得る。Dicerもまた、リボヌクレアーゼIIIエンドヌクレアーゼである。Dicerは、pre−miRNAの二本鎖のステムを認識することができる。Dicerもまた、末端のループを、ステムループの基部から、らせん2巻き離れて取り去り、追加の5’リン酸及び約2ヌクレオチドの3’オーバーハングを残すことができる。ミスマッチを含むことができる、得られたsiRNA様二重鎖は、成熟したmiRNA及びmiRNA*として知られている類似の大きさの断片を含む。miRNA及びmiRNA*は、pri−miRNA及びpre−miRNAの向かい合ったアームに由来することができる。miRNA*配列は、クローン化miRNAのライブラリー中に見出すことができるが、その頻度は典型的には、miRNAよりも低い。
【0097】
miRNAは、最初は、miRNA*と共に二本鎖の種として存在するが、最終的には、一本鎖RNAとして、RNA誘導サイレンシング複合体(RISC)として知られているリボ核タンパク質複合体中に組み込まれ得る。種々のタンパク質が、RISCを形成することができ、これらは、miRNA/miRNA*の二重鎖に対する特異性、標的遺伝子の結合部位、miRNAの(抑制又は活性化の)活性、及びmiRNA/miRNA*の二重鎖のいずれの鎖がRISC中に取り込まれるかに関する多様性をもたらすことができる。
【0098】
miRNA:miRNA*の二重鎖のmiRNA鎖が、RISC中に取り込まれる場合には、miRNA*が除去され、分解され得る。RISC中に取り込まれるmiRNA:miRNA*の二重鎖の鎖は、5’末端の対形成の堅固さの程度が低い鎖であってよい。miRNA:miRNA*の両方の末端が、ほぼ同等の5’の対形成を有する場合には、miRNA及びmiRNA*の両方が、遺伝子サイレンシングの活性を有することができる。
【0099】
RISCは、標的核酸を、miRNAとmRNAとの間の高いレベルの相補性に基づいて、特にmiRNAのヌクレオチド2〜7により同定することができる。動物においては、miRNAとその標的との間の相互作用が、miRNAの全長に沿うという1例が報告されているに過ぎない。これは、mir−196及びHox B8について示されたものであり、その後、mir−196が、Hox B8 mRNAの切断を媒介することが示された(Yektaら、2004、Science 304−594)。これ以外は、そのような相互作用は、植物においてのみ知られている(Bartel及びBartel 2003、Plant Physiol 132−709)。
【0100】
いくつかの研究は、翻訳の効率的な阻害を達成するための、miRNAとそのmRNA標的との間における塩基対形成の要件に注目している(Bartel 2004、Cell 116−281によって総説されている)。哺乳動物細胞中では、miRNAの最初の8個のヌクレオチドが、重要である場合がある(Doench及びSharp 2004 GenesDev 2004−504)。しかし、また、マイクロRNAのその他の部分がmRNAとの結合に参画する場合もある。さらに、3’における十分な塩基対形成が、5’における不十分な塩基対形成を補うこともできる(Brenneckeら、2005 PLoS 3−e85)。全ゲノム上でのmiRNAの結合を解析した計算研究から、標的結合における、miRNAの5’における塩基2〜7の特異的な役割が示唆されているが、また、通常は「A」であることが見出される、最初のヌクレオチドの役割も認識された(Lewisら、2005 Cell 120−15)。同様に、Krekらは、ヌクレオチド1〜7又は2〜8を使用して、標的を同定及び確認した(2005、Nat Genet 37−495)。
【0101】
mRNA中の標的部位は、5’UTR、3’UTRにおいてであっても、又はコード領域においてであってもよい。興味深いことに、複数のmiRNAが、同一のmRNA標的を、同一又は複数の部位を認識することによって制御する場合がある。最も遺伝子的に同定されている標的における複数のmiRNA結合部位の存在から、複数のRISCの共同作用が最も効率的な翻訳阻害をもたらすことが暗示され得る。
【0102】
miRNAは、RISCを指揮して、遺伝子発現を、mRNAの切断又は翻訳抑制の2つ機構のうちのいずれかによって下方制御することができる。mRNAが、miRNAに対して特定の程度の相補性を有する場合には、miRNAは、mRNAの切断を特定することができる。miRNAが切断を導く場合には、切断は、miRNAの残基10及び11に対して対形成しているヌクレオチドとヌクレオチドとの間でなされる場合がある。或いはmiRNAが、miRNAに対して必要とされる程度の相補性を有しない場合には、miRNAは、翻訳を抑制する場合もある。翻訳の抑制は、動物においてより多く見られる場合がある。これは、動物では、miRNAと結合部位との間の相補性の程度がより低い場合があるからである。
【0103】
miRNAとmiRNA*との任意の対の5’末端及び3’末端は、多様性であり得ることに留意しなければならない。この多様性は、切断部位に関するDrosha及びDicerの酵素によるプロセシングの多様性に起因し得る。miRNA及びmiRNA*の5’末端及び3’末端の多様性はまた、pri−miRNA及びpre−miRNAのステム構造中のミスマッチにも起因し得る。ステム鎖のミスマッチが、異なるヘアピン構造の集団をもたらす場合がある。ステム構造の多様性はまた、Drosha及びDicerによる切断の産物における多様性をもたらす場合もある。
【0104】
核酸
本明細書では、核酸を提供する。核酸は、配列番号1〜96又はそれらの変異体の配列を含む。変異体は、参照するヌクレオチド配列の相補体であってよい。変異体はまた、参照するヌクレオチド配列と実質的に同一であるヌクレオチド配列、又はその相補体であってもよい。変異体はまた、厳密な条件下で参照するヌクレオチド配列とハイブリダイズするヌクレオチド配列、その相補体、又はそれと実質的に同一であるヌクレオチド配列であってもよい。
【0105】
核酸は、約10から約250までのヌクレオチド長を有することができる。核酸は、少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、125、150、175、200又は250のヌクレオチド長を有することができる。核酸は、合成してもよく、又は細胞中で(in vitro若しくはin vivoにおいて)本明細書に記載する合成遺伝子を使用して発現させてもよい。核酸は、一本鎖分子として合成し、実質的に相補的な核酸とハイブリダイズさせて、二重鎖を形成させることができる。核酸は、細胞、組織若しくは臓器に、一本鎖若しくは二本鎖の形態で導入する場合もあり、又は参照によって組み入れられている米国特許第6,506,559号に記載されているものをはじめとする、当業者に周知の方法を使用して合成遺伝子によって発現させることが可能である場合もある。
【0106】
核酸複合体
核酸は、以下のうちの1つ又は複数をさらに含むことができる:ペプチド、タンパク質、RNA−DNAのハイブリッド、抗体、抗体断片、Fab断片及びアプタマー。
【0107】
pri−miRNA
核酸は、pri−miRNA又はその変異体の配列を含むことができる。pri−miRNA配列は、45〜30,000、50〜25,000、100〜20,000、1,000〜1,500又は80〜100個のヌクレオチドを含むことができる。pri−miRNAの配列は、本明細書に記載するpre−miRNA、miRNA及びmiRNA*、並びにそれらの変異体を含むことができる。pri−miRNAの配列は、配列番号1〜96又はそれらの変異体の配列のうちのいずれかを含むことができる。
【0108】
pri−miRNAは、ヘアピン構造を含むことができる。ヘアピン構造は、実質的に相補的である第1の核酸配列及び第2の核酸配列を含むことができる。第1の核酸配列及び第2の核酸配列は、37〜50個のヌクレオチドであってよい。第1の核酸配列と第2の核酸配列とは、8〜12個のヌクレオチドの第3の配列によって隔たる場合がある。ヘアピン構造は、その内容が参照によって本明細書に組み込まれているHofackerら、Monatshefte f.Chemie 125:167−188(1994)に記載されているViennaアルゴリズムによって、デフォルトパラメータを用いて計算した場合、−25Kcal/モル未満の自由エネルギーを有することができる。ヘアピンは、4〜20、8〜12又は10個のヌクレオチドの末端のループを含むことができる。pri−miRNAは、少なくとも19%のアデノシンヌクレオチド、少なくとも16%のシトシンヌクレオチド、少なくとも23%のチミンヌクレオチド、及び少なくとも19%のグアニンヌクレオチドを含むことができる。
【0109】
pre−miRNA
核酸はまた、pre−miRNA又はその変異体の配列を含むこともできる。pre−miRNA配列は、45〜90、60〜80又は60〜70個のヌクレオチドを含むことができる。pre−miRNAの配列は、本明細書に記載するmiRNA及びmiRNA*を含むことができる。pre−miRNAの配列はまた、pri−miRNAの5’末端及び3’末端から0〜160個のヌクレオチドを排除したpri−miRNAの配列であってもよい。pri−miRNAの配列は、配列番号1〜96又はそれらの変異体の配列を含むことができる。
【0110】
miRNA
核酸はまた、(miRNA*を含めた)miRNA又はその変異体の配列も含むことができる。miRNAの配列は、13〜33、18〜24又は21〜23個のヌクレオチドを含むことができる。miRNAはまた、全部で少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39又は40個のヌクレオチドを含むこともできる。miRNAの配列は、pre−miRNAの最初の13〜33個のヌクレオチドであってよい。miRNAの配列はまた、pre−miRNAの最後の13〜33個のヌクレオチドであってもよい。miRNAの配列は、配列番号1〜96又はそれらの変異体の配列を含むことができる。
【0111】
プローブ
また、本明細書に記載する核酸を含むプローブも提供する。プローブは、以下に概要を述べるように、スクリーニング及び診断の方法のために使用することができる。プローブは、バイオチップ等の固体の基材に結び付ける又は固定化することができる。
【0112】
プローブは、8から500、10から100、又は20から60のヌクレオチド長を有することができる。プローブはまた、少なくとも8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280又は300のヌクレオチド長を有することもできる。プローブは、10〜60個のヌクレオチドのリンカー配列をさらに含むことができる。
【0113】
バイオチップ
また、バイオチップも提供する。バイオチップは、固体の基材を含み、これは、結び付けられた1つ又は複数の本明細書に記載するプローブを含む。プローブは、厳密なハイブリダイゼーション条件下で、標的配列とハイブリダイズすることが可能であり得る。プローブを、基材上の空間的に規定されたアドレスにおいて結び付けることができる。標的配列当たり、2つ以上のプローブを使用することができ、それらは、ある特定の標的配列の重複するプローブ又はある特定の標的配列の異なる区分に対するプローブのいずれかである。プローブは、当業者が認識する単一の障害に関係がある標的配列とハイブリダイズすることが可能であり得る。プローブは、最初に合成し、それに続いて、バイオチップに結び付けてもよく、又はバイオチップ上に直接合成してもよい。
【0114】
固体の基材は、プローブを結び付ける又はつなげるのに適した個々の部位を個別に含有するように改変することができる材料であってよく、少なくとも1つの検出方法に適している。基材の代表的な例として、ガラス及び改変された又は機能性のガラス、(アクリル、ポリスチレン及びスチレンとその他の材料とのコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、TeflonJ等をはじめとする)プラスチック、多糖、ナイロン又はニトロセルロース、樹脂、ケイ素及び改変されたケイ素をはじめとする、シリカ又はシリカに基づいた材料、炭素、金属、無機ガラス、並びにプラスチックが挙げられる。基材は、顕著に蛍光を発することなく、光学的な検出を可能にすることができる。
【0115】
基材は、平面であってよいが、また、基材のその他の構造形状を使用してもよい。例えば、流入式の試料解析のためには、プローブをチューブの内側表面上に置いて、試料体積を最小化することができる。同様に、基材は、軟質フォーム等、柔軟性があってもよく、これには、特定のプラスチックで作製された独立気泡フォームが挙げられる。
【0116】
バイオチップ及びプローブは、化学的な官能基を用いて誘導体化し、それに続いて、それら2つを結び付けることができる。例えば、バイオチップを、これらに限定されないが、アミノ基、カルボキシル基、オキソ基又はチオール基をはじめとする、化学的な官能基を用いて誘導体化することができる。これらの官能基を使用すれば、プローブ上の官能基を使用して、プローブを、直接的に又はリンカーを使用して間接的に結び付けることができる。プローブは、5’末端により、3’末端により、又は内部ヌクレオチドを介してのいずれかで、固体の基材に結び付けることができる。
【0117】
プローブはまた、固体の基材に、非共有結合によって結び付けることもできる。例えば、ビオチン標識したオリゴヌクレオチドを作製することができ、これは、ストレプトアビジンで共有結合によりコートした表面に結合し、結び付くことができる。或いは光重合及びフォトリソグラフィー等の技法を使用して、プローブを表面上で合成することもできる。
【0118】
診断
本明細書で使用する場合、「診断する」という用語は、病態又は症状を分類し、病態の重症度(グレード若しくは段階)を決定し、病態の進行をモニターし、病態の結果及び/又は回復の見込みを予報することを指す。
【0119】
本明細書で使用する場合、「それを必要とする対象」という句は、癌を有する、癌を有する危険がある[例えば、遺伝的素因がある対象、癌の病歴及び/若しくは家族歴を有する対象、発癌性物質、職業上の危険、環境上の危険に暴露したことがある対象]ことが知られている動物又はヒトの対象、並びに/或いは癌が疑われる臨床徴候[例えば、便中の血液若しくは血便、説明のつかない疼痛、発汗、説明のつかない発熱、摂食障害に至る説明のつかない体重減少、便通習慣の変化(便秘及び/若しくは下痢)、テネスムス(特に直腸癌の場合の不完全な排便感)、貧血及び/又は全般的な脱力感]を示す対象を指す。その上に又はそれに代わって、それを必要とする対象は、定期的な健康検査を受ける健康なヒトの対象であってもよい。
【0120】
悪性又は前悪性の細胞の存在の解析は、in vivoにおいて実施しても、又はex−vivoにおいて実施してもよく、後者の場合、生物学的試料(例えば、生検)を取り出す。そのような生検試料は、細胞を含み、切開性の生検であっても、又は切除性の生検であってもよい。或いは細胞を、完全な摘出から取り出してもよい。
【0121】
本教示を利用しながら、治療計画、治療コースの決定及び/又は疾患の重症度の測定に関する追加の情報を集めることができる。
【0122】
本明細書で使用する場合、「治療計画」という句は、それを必要とする対象(例えば、ある病態を有すると診断された対象)に提供する治療の型、用量、スケジュール及び/又は治療の持続期間を特定する治療のプランを指す。選択された治療計画は、最良の臨床成果(例えば、病態の完全な治癒)を得られることが予想される攻撃的なものであってもよく、又は病態の症状を緩和することができるが、病態を完全には治癒することはない中等度のものであってもよい。特定の場合には、治療計画には、対象に対する何らかの不快感又は有害な副作用(例えば、健常な細胞若しくは組織に対する損傷)が伴う場合があることを理解されたい。治療の型として、外科的な介入(例えば、病変、病気の細胞、組織若しくは臓器の除去)、細胞置換療法、治療用薬物(例えば、受容体アゴニスト、アンタゴニスト、ホルモン、化学療法剤)の局所的又は全身的なモードでの投与、外部的な源(例えば、体外照射)及び/又は内部的な源(例えば、ブラキセラピー)を使用する放射線療法への暴露、並びに/或いはそれらの任意の組合せを挙げることができる。治療の用量、スケジュール、持続期間は、病態の重症度及び選択された型の治療に依存して変化させてよく、当業者であれば、当該型の治療を、治療の用量、スケジュール、持続期間によって加減することができる。
【0123】
また、診断方法も提供する。この方法は、生物学的試料中の特定の癌と関係がある核酸の発現レベルを検出するステップを含む。試料は、患者から得ることができる。患者における癌の特異的な状況の診断によって、予後診断及び治療戦略の選択が可能となり得る。さらに、細胞の発生段階を、一時的に発現した、特定の癌と関係がある核酸を決定することによって分類することができる。
【0124】
標識したプローブと組織アレイとのin situハイブリダイゼーションを行うことができる。熟練した当業者であれば、個々の試料間でフィンガープリントを比較して、所見に基づいて診断、予後診断又は予測を行うことができる。さらに、診断を指し示す核酸配列は、予後診断を指し示す核酸とは異なる場合があり、細胞の状態の分子プロファイリングからは、応答性条件と不応性条件との間の区別が得られる場合があり、又は成果を予測できる場合があることも理解されたい。
【0125】
キット
また、キットも提供し、このキットは、本明細書に記載する核酸を、以下のうちのいずれか又は全てと一緒に含むことができる:アッセイ用試薬、緩衝液、プローブ及び/又はプライマー、並びに無菌の食塩水又は別の薬学的に許容できる乳濁液用及び懸濁液用の基剤。さらに、キットは、本明細書に記載する方法を実行するための指示(例えば、プロトコール)を含有する指導用の材料を包含することができる。キットは、発現プロファイルのデータ解析のためのソフトウエアのパッケージをさらに含むことができる。
【0126】
例えば、キットは、標的核酸配列の増幅、検出、同定又は定量化のためのキットであってよい。キットは、ポリ(T)プライマー、順方向プライマー、逆方向プライマー及びプローブを含むことができる。
【0127】
本明細書に記載する組成物はいずれも、キット中に含むことができる。非限定的な例においては、アレイを使用してmiRNAを単離し、miRNAを標識し且つ/又はmiRNAの集団を評価するための試薬を、キット中に包含する。キットは、miRNAプローブを生み出す又は合成するための試薬もさらに包含することができる。したがって、キットは、適切な容器手段中に、標識されたヌクレオチド又はそれに続いて標識される未標識のヌクレオチドを組み込むことによりmiRNAを標識するための酵素を含む。キットはまた、反応用緩衝液、標識用緩衝液、洗浄用緩衝液又はハイブリダイゼーション用緩衝液等の1つ又は複数の緩衝液、miRNAプローブを調製するための化合物、in situハイブリダイゼーションのための構成成分、及びmiRNAを単離するための構成成分も包含することができる。本発明のその他のキットは、miRNAを含む核酸アレイを作製するための構成成分を包含することができ、したがって、例えば、固体の基材を包含することができる。
【0128】
本発明のいくつかの実施形態をより十分に例証するために、以下の実施例を示す。しかし、いかなる場合であっても、それらが、本発明の広範な範囲を制限するものであると解釈してはならない。
【実施例】
【0129】
方法
1.腫瘍試料
腫瘍の試料を、いくつかの源から得た。全ての試料について、それぞれの施設内のIRB又はIRBと同等のガイドラインに従って、施設内審査による承認を得た。ホルマリン固定パラフィン埋包(FFPE)試料について、最初の診断、組織学的な型、グレード、及び腫瘍のパーセントを、病理学者が、試料の最初及び/又は最後の切片上で実施したヘマトキシリン−エオシン(H&E)染色スライド上で決定した。試料は、原発性腫瘍、転移性腫瘍と、前立腺腫瘍試料(示さず)に類似する発現プロファイルを示した良性前立腺過形成試料(BPH)の2つの試料とを包含した。非定義試料は、この研究には包含しなかった。90%のFFPE試料において、腫瘍含有量が50%超であった。
【0130】
2.RNA抽出
凍結組織について、大きさが約0.5cm3の試料を、RNA抽出のために使用した。全RNAを、miRvana miRNA単離用キット(Ambion製)を使用して、製造者の指示に従って抽出した。手短にいうと、試料を変性用溶解溶液中でホモゲナイズし、続いて、酸−フェノール:クロロホルム抽出を行う。最後に、試料を、ガラス繊維製フィルター上で精製する。
【0131】
FFPE試料について、全RNAを、7から10個の10μm厚さの組織切片から、Rosetta Genomicsにおいて開発されたmiRdictor(商標)抽出プロトコールを使用して単離した。手短にいうと、試料を、キシレン中、57℃で数回インキュベートして、過剰なパラフィンを除去し、続いて、エタノール洗浄を行う。タンパク質を、プロテイナーゼK溶液によって、45℃で数時間分解させる。RNAを、酸フェノール:クロロホルムを用いて抽出し、続いて、エタノール沈殿及びデオキシリボヌクレアーゼ消化を行う。全RNAの量及び質を、分光光度計(Nanodrop製ND−1000)によって調べる。
【0132】
3.miRdicator(商標)アレイプラットフォーム
特注のマイクロアレイを、DNAオリゴヌクレオチドのプローブを、688個のヒトマイクロRNAにプリントすることによって作製した。各プローブは、三つ組みでプリントされており、プローブを、コートしたガラス製スライドにカップルさせるために使用するアミン基に加えて、マイクロRNAの相補配列の3’末端において22ヌクレオチド(nt)までのリンカーを保有する。20μMの各プローブを、2×SSC+0.0035%SDS中に溶解させ、Schott Nexterion(登録商標)Slide Eでコートしたマイクロアレイスライド上に、Genomic Solutions(登録商標)BioRobotics MicroGrid IIを使用して、MicroGridの製造者の指示に従って、三つ組みでスポットした。54個の陰性の対照プローブを、異なるマイクロRNAのセンス配列を使用して設計した。2つの群の陽性の対照プローブを設計して、miRdicator(商標)アレイにハイブリダイズさせた:(i)合成の小型RNAをRNAにスパイクさせてから標識して、標識化の効率を検証し、(ii)豊富な小型RNA(例えば、小型核RNA(U43、U49、U24、Z30、U6、U48、U44)、5.8s及び5sのリボゾームRNA)についてのプローブを、アレイ上にスポットして、RNAの質を検証した。スライドを、50mMエタノールアミン、1M Tris(pH9.0)及び0.1%SDSを含有する溶液中、50℃で、20分間ブロックし、次いで、水を用いて十分に濯ぎ、脱水した。
【0133】
4.miRdicator(商標)アレイのためのmiRNAのCy染料による標識化
RNAリンカー、p−rCrU−Cy/染料(Dharmacon製)を、Cy3又はCy5を有する3’末端に連結させる(Thomsonら、Nature Methods 2004,1:47−53)ことによって、5μgの全RNAを標識した。標識化反応は、全RNA、スパイク(0.1〜20フェントモル)、300ngのRNA−リンカー−染料、15%DMSO、1×リガーゼ用緩衝液、及び20単位のT4 RNAリガーゼ(NEB製)を含有し、4℃で1時間進行させ、続いて、37℃に1時間保った。標識したRNAを、3×ハイブリダイゼーション用緩衝液(Ambion製)と混合し、95℃で3分間加熱し、次いで、miRdicator(商標)アレイの上端上に添加した。スライドを、42℃中で12〜16時間ハイブリダイズさせ、続いて、1×SSC及び0.2%SDSを用いて室温中で2回洗浄し、最後に0.1×SSCを用いて洗浄した。
【0134】
アレイを、Agilent製Microarray Scanner Bundle G2565BA(出力100%において、10μmの分解能)を使用して走査した。アレイの画像を、SpotReaderソフトウエア(Niles Scientific製)を使用して解析した。
【0135】
5.アレイのシグナルの計算及び正規化
各プローブについて、三つ組みのスポットを組み合わせて、信頼できるスポットの対数平均を得ることによって、1つのシグナルを求めた。全てのデータを(自然)対数変換し、解析を対数空間において実施した。正規化のための参照データのベクトルRを、各プローブについて、全部の試料にわたって発現レベルの中央値を得ることによって計算した。各試料データのベクトルSについて、試料データと参照データとの間に最良のフィットをもたらすように2次の多項式Fを見出し、したがって、R≒F(S)となした。離れたデータ点(「外れ値」)は、多項式Fをフィットするためには使用しなかった。試料中の各プローブ(ベクトルS中の要素Si)について、最初の値Siから、(対数空間において)正規化した値Miを、最初の値を、多項式Fを用いて変換することによって計算し、したがって、Mi=F(Si)となる。図3A、B中のデータを、(指数をとることによって)線形空間に置き換え直した。トレーニングセットの試料のみを使用して、参照データのベクトルを求めても、結果に影響を及ぼさなかった。
【0136】
6.ロジスティック回帰
ロジスティック回帰モデルの目的は、いくつかのマイクロRNAの発現レベル等、いくつかの特色を使用し、2分決定木中のあるノードの2つのブランチ等、2つの可能な群のうちの1つに属する確率を割り当てることである。ロジスティック回帰は、オッズ比、すなわち、第1の群、例えば2分決定木のあるノード中の左のブランチに属する確率(P)と、第2の群、例えばそのようなあるノード中の右のブランチに属する確率(1−P)との比の自然対数を、(対数空間における)異なる発現レベルの線形の組合せとして形に表す。ロジスティック回帰は、
【数1】
であり、
但し、式中、β0は、バイアスであり、Miは、決定ノード中で使用したi番目のマイクロRNAの(対数空間において正規化された)発現レベルであり、βiは、その対応する係数である。βi>0は、このマイクロRNAの発現レベル(Mi)が増加すると、左のブランチをとる確率(P)が増加することを示し、βi<0は、反対の場合を示す。ノードが単一のマイクロRNA(M)のみを使用する場合には、Pを解くと、(図4)が得られる。
【数2】
【0137】
各試料についての回帰エラーは、割り当てられた確率Pとこの試料の本当の「確率」との間の差である。すなわち、この試料が、左のブランチの群中にあるときは1であり、そうでなければ0である。ロジスティック回帰モデルのトレーニング及び最適化は、パラメータβ及びp値を(各マイクロRNAについては、Wald統計量によって、全体的なモデルについては、χ2(カイ二乗)の差によって)計算し、データから得たモデルの尤度を最大化し、全体的な回帰エラーを最小化する。
【数3】
【0138】
ここで、ロジスティックモデルの確率の出力を、Pを、PTHで表す閾値と比較することによって二分決定に変換する。すなわち、P>PTHのときは、試料が左のブランチ(「第1の群」)に属し、逆の場合には、結果も逆になる。各ノードにおいて、>0.5の確率を有するブランチを選ぶ、すなわち、0.5の確率の閾値を使用すると、回帰エラーの和が最小化される。しかし、ゴールは、(それらの確率ではなく)誤分類の全体的な数の最小化であることから、各ノードにおける誤りの全体的な数を最小化するために、確率の閾値(PTH)を加減する改変を使用した(表2)。各ノードについて、新しい確率の閾値PTHに対する閾値を、分類エラーの数を最小化するように最適化した。確率の閾値のこの変化は、クラスの以前の頻度の変化を反映することができるバイアスβ0の改変と(分類の観点からは)同等である。
【0139】
7.ステップワイズロジスティック回帰及び特色の選択
元々のデータは、各試料について、数百個のマイクロRNAの発現レベルすなわち、数百個のデータの特色を含有する。各ノードについて、分類子をトレーニングする場合には、これらの特色の小さなサブセットのみを選択し、ロジスティック回帰モデルを最適化するために使用した。最初のトレーニングにおいては、これを、前方ステップワイズスキームを使用して行った。特色を、対数尤度が減少する順番にソートし、ロジスティックモデルに着手し、第1の特色を用いて最適化した。次いで、第2の特色を追加し、モデルを再度最適化した。これらの2つのモデルの回帰エラーを比較した:特色の追加により、有意な利点がもたらされない場合(7.88未満のχ2の差、0.005のp値)には、新しい特色を破棄した。それ以外では、追加した特色を維持した。新しい特色を追加すると、以前の特色と重複する場合がある(例えば、それらの相関性が非常に高い場合)。これについて調べるために、プロセスが、(上記のχ2の差を失うことなく)最も低い尤度を有する特色を破棄することができるか否かを反復的に調べる。特色の現在のセットが、この意味においてコンパクトであることを確実にしてから、プロセスは、ソートしたリスト中の次の特色を試験し続け、特色を使い果たす。特色の数に関する制限は、アルゴリズム中に挿入しなかったが、ほとんどの場合、2〜3つの特色が選択された。
【0140】
ステップワイズロジスティック回帰の方法を、トレーニングセットの試料のサブセット上で、繰り返し(「ブートストラップ」)を有するトレーニングセットを、23回の実行のうちのそれぞれが、試料の約3分の2を少なくとも1回は含有し、任意の1つの試料が、少なくとも1回は外される>99%の機会を有するように、再度試料採取することによって使用した。この結果、平均して、1つのノード当たり2〜3つ(より困難なノードにおいては、4〜8つ)の特色を得た。ブートストラップセット中の繰り返して選ばれた特色を、以前の証拠と比較し、それらのシグナルの強度及び信頼性を考慮することによって、1つのノード当たり2〜3つの特色のロバストなセット(表2)を選択した。これらの選択された特色を使用して分類子を構築する場合、ステップワイズのプロセスは使用せず、トレーニングが、ロジスティック回帰モデルのパラメータのみを最適化した。
【0141】
8.性別及び肺からの転移によるクラスの制限
決定木の枠組みによって、利用可能な臨床情報を容易に分類することが可能になる。2つのそのようなデータ、すなわち、性別及び肺からの転移を使用する。女性患者からの試料は、精巣及び前立腺に由来するとしては分類されず;したがって、ノード#2に達した女性患者の試料は、右のブランチに、且つ同様にノード#17においては左のブランチ(=乳房)に自動的に分類された。男性患者からの試料は、子宮内膜及び卵巣に由来するとしては分類されず、ノード20においては左のブランチに自動的に分類された。肺からの転移が指し示された試料は、肝臓に由来するとしては分類されず、ノード#1においては右のブランチに分類された。したがって、追加の情報は、一般性を喪失することもなく、分類子を保持する必要もなく、容易に活用される。
【0142】
9.K最近傍(KNN)分類アルゴリズム
KNNアルゴリズム(例えば、Maら、Arch Pathol Lab Med 2006、130:465−73を参照されたい)は、任意の試料の、トレーニングセット中の全ての試料に対する距離(ピアソンの相関関係)を計算し、試料を、最も類似するk個の試料の大多数の票決によって分類する(kは、分類子のパラメータである)。相関関係を、組織型(クラス)の全ての対を調査し、任意の2つのクラス間で有意に示差的に発現したマイクロRNAを収集することによって選択したマイクロRNA(データの特色)のあらかじめ定義したセット上で計算する。決定木によって使用された48個のマイクロRNAを有するこのリストの共通部分のみを使用しても、性能が低下することはなく、これらのマイクロRNAの情報内容が強調された。k=1,3,5を用いたKNNアルゴリズムを比較し、k=3及びマイクロRNAのより小さなセットを使用して、最適なパフォーマーを選択した。
【0143】
10.qRT−PCR
1μgの全RNAに対して、以前の記載(Shi及びChiang、BioTechniques 2005、39:519−525)に従って、ポリアデニル化反応を行う。手短にいうと、RNAを、ポリ(A)ポリメラーゼ(PAP)(Takara−2180A)、MnCl2及びATPの存在下、37℃で1時間インキュベートする。逆転写を、全RNA上で実施する。逆方向プライマーに対して相補的なコンセンサス配列をもつoligodTプライマー、oligodTデンプン、Nヌクレオチド(全A、C及びGの混合物)並びにVヌクレオチド(4つのヌクレオチドの混合物)を、逆転写反応に使用する。プライマーを、最初に、ポリA−RNAにアニールさせ、次いで、SuperScript II RT(Invitrogen製)の逆転写反応を行う。次いで、cDNAを、リアルタイムPCR反応によって、マイクロRNAに特異的な順方向プライマー、TaqManプローブ、及びオリゴdTテイルの3’配列に対して相補的な汎用逆方向プライマーを使用して増幅する。反応物を、95℃で10分間インキュベートし、続いて、95℃15秒間及び60℃1分間を42サイクル行う。
【0144】
図3Cに、U6 snRNAについて正規化したデータを示す(例えば、Thompsonら、Genes & Development 2006、20:2202−2207を参照されたい)。図3D中のデータをU6によって正規化し、(底が2の指数によって)線形空間に変換し、定数(59,000)をかけて、数値を、アレイのシグナルと同一の中央値を有するようにシフトさせた。マイクロアレイとqRT−PCRのデータとの間で、2つの別々の試料のサブセット中3つのマイクロRNA(全部で6群)の分布を比較して、コルモゴルフ−スミルノフ統計量の平均値0.32を得た。(6群のうちの)わずか2つの群が有意に異なる分布(KS統計量<0.05)を有したに過ぎず、大部分の群は、コルモゴルフ−スミルノフ検定によっては、有意に異なることはなかった。
【0145】
(実施例1)
試料及びプロファイリング
ホルマリン固定パラフィン埋包(FFPE)により記録保管されている試料は、腫瘍材料のための重要な源であることから、マイクロRNA画分を保存しているFFPEのブロックからRNAを抽出するための方法を開発した。新鮮凍結試料、ホルマリン固定試料又はFFPE試料から抽出したRNAを比較し、RNAの量及び質が、全ての保存方法にわたり類似することを実証した。さらに、マイクロRNAのプロファイルは、FFPE試料中で、11年もの長い保管期間にわたり安定であった。
【0146】
マイクロRNAプロファイリングを、miRBase(バージョン9)3中に全てのマイクロRNAについてのプローブを含有するRosetta Genomics製のmiRdicator(商標)マイクロアレイ19上で実施した。
【0147】
205個の原発性腫瘍及び131個の転移性腫瘍を包含し、22種の異なる腫瘍起源又は「クラス」を示す、333個のFFPE試料及び3つの新鮮凍結試料を収集し、プロファイリングした。(試料の概要については表1を参照されたい)。腫瘍のパーセントは、90%超の試料について、少なくとも50%であった。試料のうち83個(各クラスの約25%)を、盲検の試験セットとして無作為に選択した。65個の追加の原発性腫瘍の試料(53個のFFPE試料及び12個の新鮮凍結試料)を、選択されたマイクロRNAについての確認として、qRT−PCR上のみでプロファイリングした。全体で401個の試料が、この研究には包含された。
【0148】
(実施例2)
原発性腫瘍と転移性腫瘍との比較
十分な数の転移性の試料を得るのが困難であることに起因して、この研究は、試料セットを増大させるために、原発性腫瘍を利用している。原発性の試料と転移性の試料との間における発現プロファイルの差は、腫瘍における根本的な生物学的な差から又は付近の組織からの混入から予想することができる。そのような効果は、転移性の試料上での腫瘍の分類子の性能を妨げる場合がある。
【0149】
乳癌又は結腸癌等の大部分の組織起源については(図1A、B)、原発性腫瘍と転移性腫瘍との間では有意な差は見出されなかった。その他の場合では、マイクロRNAの小さなセットが、示差的に発現した。例えば、胃の原発性腫瘍の試料を、胃からリンパ節へ転移した試料と比較すると、3つのマイクロRNAが、有意に示差的に発現した(図1C、D)。上皮層に特徴的であるHsa−miR−1435(配列番号99)、及び筋肉組織に特徴的であるhsa−miR−133a2(配列番号97)が、胃から得た原発性腫瘍中で過剰発現し;対照的に、リンパ球中での発現が高いと以前に同定されたhsa−miR−15020(配列番号101)は、リンパ節から得た転移性の試料中により高いレベルで存在した。さらに、周囲の筋肉組織を含有することが多い、前立腺又は頭頚部等の原発性腫瘍からの試料は、顕著な発現レベルのmiR−1、miR−206及びmiR−133aを示し、これらは、骨格筋に特異的なマイクロRNAである2。我々は、転移についての分類子のトレーニングにおいては、原発性腫瘍を使用することができるが、慎重に且つ特異的なマーカー及び状況に注意を払って使用しなければならないと結論付けた。これらの効果からの潜在的な偏りを低減させるために、交差汚染が交絡効果を有する恐れがあるノードにおけるマイクロRNAの使用を最小限に留めた。例えば、筋肉に関連するマイクロRNA(miR−1/133/206)及びhsa−miR−150は使用しなかった。
【0150】
(実施例3)
決定木分類子アルゴリズム
腫瘍の分類子を、マイクロRNAの発現レベルを使用して、2分木分類スキームを適用することによって築いた(図2)。この枠組みを設定して、組織の分化及び胚形成におけるマイクロRNAの特異性を活用する:異なるマイクロRNAが、組織の特異化の種々の段階に関与するので、それらを、異なる決定点又は「ノード」において、アルゴリズムに使用した。木は、複雑な複数組織の分類の問題を、より単純な二分決定のセットに分割する。各ノードにおいては、木においてそれより前に枝分れするクラスは考慮されず、無関係の試料からの干渉を減少させ、決定をさらに単純化する(図3A)。次いで、各ノードにおける決定を、分類における十分に定義された役割を有する少数のマイクロRNAバイオマーカーのみを使用して達成することができる(表2)。2分木の構造は、組織の発生及び形態学的な類似性の階層に基づき18、マイクロRNAの発現パターンの目立つ特色によって改変された(図2)。例えば、マイクロRNAの発現パターンは、肺カルチノイドとその他の肺癌の型との間で有意な差を指し示し、したがって、これらは、ノード#12において(図3A、B)、別のブランチに分かれる(図2)。興味深いことに、データを2分の分類木に分配するための自動化アルゴリズムからは、類似の構造を有する木が生成したが、構造及び個々のノードの分類子に関する柔軟性を欠き、その性能は顕著により不十分であった。
【0151】
個々のノードのそれぞれについて、ロジスティック回帰モデルを使用した。これは、分類子のロバストなファミリーであり、連続的なデータの特色を組み合わせて二分決定を得るために疫学的研究及び臨床研究において頻繁に使用される(図3A、図4、及び方法)。遺伝子発現の分類子は、遺伝子の特色の選択に関して内在的な重複性を有するので、トレーニング試料セット上で、ブートストラップすることを、各ノードについて安定なマイクロRNAのセットを選択するための方法として使用した(方法)。この結果、1つのノード当たり少数(通常、2〜3つ)のマイクロRNAの特色を、全体的な分類子については全部で48個のマイクロRNAを得た(表2)。我々のアプローチは、示差的発現についての新しいバイオマーカーを同定するための系統だったプロセスを提供する。
【0152】
(実施例4)
分類子の性能:クロス確認及び高い信頼度の分類
最初のステップとして、分類子の性能を、トレーニングセット内で、1つとって置き法による確認(LOOCV)を使用して試験した。LOOCVは、見知らぬ試料上での分類アルゴリズムの性能をシミュレートする。LOOCVでは、アルゴリズムを繰り返して再度トレーニングし、その度に、1つの試料を除外し、各試料を、この試料なしでトレーニングした分類子上で試験する。決定木アルゴリズムは、78%の平均感度又は精度、及び99%の特異性に達し、異なるクラス間では顕著な変動を有した。この性能を、通常使用されるK最近傍(KNN)分類アルゴリズム8,5,18の性能と比較した。KNNアルゴリズムは、(最適なk=3においては)この木よりも不十分な性能を示し(71%の平均感度及び等しい特異性)、異なるクラスが、アルゴリズム間において、感度の有意な差を有した。
【0153】
診療においては、しばしば、異なる程度の信頼度の情報を査定することが有用である17,18。特にCUPの診断においては、決定的な診断を下すことができない場合には、確率の高い可能性の短いリストが実用的な選択肢である。決定木及びKNNアルゴリズムは、設計が異なり、独立にトレーニングされることから、それらの分類を組み合わせ、比較することによって、改善された精度及びより高い信頼度を得ることができる。これらの2つのアルゴリズムによって得た予測を融合させると、症例の85%において正確なクラスが含まれた。症例の69%において、これらの2つのアルゴリズムが一致し、単一の、高い信頼度の予測をもたらした。満足なことには、これらの高い信頼度の予測の93%が、試料の正確なクラスを正確に同定し、22種の腫瘍のクラスのうちの半分超が100%の感度を達成した。
【0154】
(実施例5)
分類子の性能:独立した盲検の試験セット
分類アルゴリズムの最も重要な試験は、盲検の試験セット上のものである。試料の約4分の1を、異なるクラスを代表するように無作為に選択して、独立した試験セットとして残しておき、分類子の性能を試験した(表3)。試験セット上での性能は、トレーニングセットにおけるLOOCVの性能と比較して低下しなかった。これは、分類子の非常に望ましい特色であり、この分類子がロバストであり、過学習ではないことを示している。症例の86%が、これらの2つの予測因子の融合によって正確に予測された(大部分のクラスが、100%の感度を有した)。高い信頼度の予測は、症例の3分の2に当たり、このうち、89%が正確に分類された。盲検の試験セットにおいてさえも、22個のクラスのうちの圧倒的な16個が、高い信頼度の予測において100%の精度を有した。最後に、盲検の試験セットの転移性の試料上で分類の性能を調べた。ここでもまた、分類子は、高い信頼度の分類について、85%の感度を達成した。盲検の転移性の試料上での性能がそのように高いという事実は、トレーニングセットを、原発性腫瘍を用いて増大させ、同時に潜在的に交絡するマーカーも回避するアプローチを支持する。
【0155】
(実施例6)
独立したプラットフォームであるqRT−PCRによる確認
アレイプラットフォームに基づいて開発した上記の決定木アルゴリズムは、組織群間の二分決定において、特異的な役割をマイクロRNAに帰属させる。特定のプラットファームの効果を排除するために、これらのマイクロRNAのサブセットの有意性を、Rosetta Genomics製miRdicator(商標)高感度qRT−PCRプラットフォーム(方法)上で、元々の試料のうちの15個に、65個の独立した試料を足して使用して確認した。測定したシグナルの値は、プラットフォーム間で異なるが、マイクロRNAは、それらの診断における役割を維持し(図3C、D)、正確な分類のために使用することができる(図5)。
【0156】
表1:癌の型、クラス及び組織診断
【表1】
【0157】
表2:決定木のノード、及び各ノードにおいて使用したマイクロRNA
【表2−1】
【表2−2】
†hsa−miR−200c及びhsa−miR−141は、1つの予測されたポリシストロニックなpri−miR6の部分であり、発現が非常に類似する。これらの2つのマイクロRNAは、木において、結果に対して非常にわずかな効果しか示さず、互換的に使用することができる。hsa−miR−200cは、(トレーニングセットにおいては)ノード#1において、わずかにより良好な性能を有した。
a肝臓への転移が示された試料については、このノードにおいては右のブランチに分類し、ノード#3に進む。
1女性患者に由来することが示された試料については、このノードにおいては右のブランチに分類し、ノード#3に進む。
2女性患者に由来することが示された試料については、このノードにおいては左のブランチに分類し、乳房として分類する。
3男性患者に由来することが示された試料については、このノードにおいては左のブランチに分類し、ノード#21に進む。
【0158】
「胃*」のクラスは、胃癌及び食道胃接合部の腺癌の両方を包含し;「頭頚部*」のクラスは、頭頚部の癌及び食道の扁平上皮癌を包含する(図2を参照されたい)。「GIST」は、消化管間質腫瘍を示す。
【0159】
決定木のスキームにおいては、いくつかのマイクロRNAが、木の大きな区分を分け、その後のノードに至る2つのブランチのいずれに進むかを決め;その他のノードでは、2つのブランチのうちの少なくとも1つが、特定の組織型に至る末端のノードに分かれた。この木のデザインが意味することは、2つのブランチ間を分けるマイクロRNAはまた、このノードの2つの選択的なブランチの「葉」である、任意の2つの単一の組織型間を分けるためにも使用することができる点である。例えば、ノード#12においては、hsa−miR−194が、ノード#13に至るブランチと、ノード#16に至るブランチとの間を分ける。「結腸」が、ノード#13の(ノード#14を介する)間接的な葉であり、「乳房」が、ノード#16の(ノード#17を介する)間接的な葉であることから、このことは、hsa−miR−194はまた、その他の組織型が不在の場合には、「結腸」と「乳房」との間を分けるためにも使用することができることを意味する。
【0160】
表3に、トレーニングセット及び試験セット中の試料の数を示し、且つ盲検の試験セット上での分類の性能を、各クラスについて個別に及び全ての試料にわたり平均して全体的に示す。「Sens」は、感度を示し、「Spec」は、特異性を示す。「Tree」は、決定木アルゴリズムを指し;「Union」は、決定木アルゴリズム及びKNNアルゴリズムの両方の予測を収集することによって得られる、1つ/2つの答えである。「High conf.Frac」は、決定木アルゴリズム及びKNNアルゴリズムの両方が分類に関して一致する、高い信頼度の予測を有する試料の割合である。「High conf.Sens」は、高い信頼度の予測の間の感度である。最後の列は、転移性癌の試料である、試験セットのサブセット上での性能を示す。「胃*」のクラスは、胃癌及び食道胃接合部の腺癌の両方を包含し;「頭頚部*」のクラスは、頭頚部の癌及び食道の扁平上皮癌を包含する(図2を参照されたい)。「GIST」は、消化管間質腫瘍を示す。
【0161】
表3:盲検の試験セット上での分類の性能
【表3】
【0162】
表2中のマイクロRNAのいくつかについては、類似のシード配列(同一のヌクレオチド2〜8)を有する、その他の変異体マイクロRNAが、ヒトゲノム中で知られており(表4を参照されたい)、したがって、これらは、非常に類似したセットの(mRNAをコードする)遺伝子を(RISC機構を介して)標的にするとみなされている。同一のシード配列を有するこれらのマイクロRNAは、表示するmiRと置き換わることができる。
【0163】
表4:同一のシード配列を有するマイクロRNA
【表4−1】
【表4−2】
【表4−3】
【0164】
表2中のマイクロRNAのいくつかについては、ゲノム上でごく接近して位置する(ゲノムのクラスタ)、その他のマイクロRNAが、ヒトゲノム中で知られており(表5を参照されたい)、これらは、表示するmiRと一緒に、同じように発現する場合がある。ほぼ同一のゲノムの位置からのこれらのマイクロRNAは、表示するmiRと置き換わることができる。
【0165】
表5:同一のゲノムのクラスタ内のマイクロRNA(距離<10kb)
【表5−1】
【表5−2】
【表5−3】
【表5−4】
【0166】
表2中のマイクロRNAのいくつかについては、類似の配列(配列中に6つ未満のミスマッチ)を有する、その他のマイクロRNAが、ヒトゲノム中で知られており(表6を参照されたい)、したがって、これらはまた、同一の設計を有するプローブによって捕捉することもできる。類似の全体的な配列を有するこれらのマイクロRNAは、表示するmiRと置き換わることができる。
【0167】
表6:類似の配列を有するマイクロRNA
【表6−1】
【表6−2】
【0168】
【0169】
これまでに記載した、特定の実施形態から、本発明の一般的な性質が非常に十分に明らかになるので、他者は、現在の知識を適用することによって、過度の実験なしに、一般的概念から逸脱することなく、そのような特定の実施形態を容易に改変及び/又は適合させて、種々の応用例を得ることができる。したがって、そのような適合形態及び改変形態は、開示した実施形態の均等物の意味及び範囲のうちで把握されるべきであり、そのように意図されている。本発明を、その特定の実施形態と共に説明してきたが、多くの代替形態、改変形態及び変形形態が、当業者には明らかになるであろうことは明白である。したがって、添付の請求項の精神及び広範な範囲に属する、そのような代替形態、改変形態及び変形形態は全て包含されるものとする。
【0170】
詳細な説明及び特定の実施例は、本発明の好ましい実施形態を示すが、本発明の精神及び範囲に属する種々の変化形態及び改変形態が、この詳細な説明から、当業者には明らかになるであろうことから、これら詳細な説明及び特定の実施例は、説明のために提供されているに過ぎないことを理解されたい。
【特許請求の範囲】
【請求項1】
生物学的試料の起源組織を分類する方法であって、
(a)対象から生物学的試料を得るステップと、
(b)前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の発現プロファイルを決定するステップと、
(c)前記発現プロファイルを参照発現プロファイルと比較するステップとを含み、
それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記試料の起源組織の分類を可能にする方法。
【請求項2】
前記組織が、肝臓、肺、膀胱、前立腺、乳房、結腸、卵巣、精巣、胃、甲状腺、膵臓、脳、子宮内膜、頭頚部、リンパ節、腎臓、メラニン形成細胞、髄膜、胸腺、及び前立腺からなる群から選択される、請求項1に記載の方法。
【請求項3】
癌又は過形成を分類する方法であって、
(a)対象から生物学的試料を得るステップと、
(b)前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップと、
(c)前記得られた測定値を前記核酸の参照存在量と比較するステップとを含み、
それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記癌又は過形成の分類を可能にする方法。
【請求項4】
前記試料を、原発不明癌(CUP)を有する、原発性癌を有する、又は転移性癌を有する対象から得る、請求項3に記載の方法。
【請求項5】
前記癌が、肝臓癌、肺癌、膀胱癌、前立腺癌、乳癌、結腸癌、卵巣癌、精巣癌、胃癌、甲状腺癌、膵臓癌、脳癌、子宮内膜癌、頭頚部癌、リンパ節癌、腎臓癌、メラノーマ、髄膜癌、胸腺癌、前立腺癌、消化管間質癌、及び肉腫からなる群から選択される、請求項3に記載の方法。
【請求項6】
前記肝臓癌が、肝細胞腫、肝細胞癌(HCC)、肝胆管癌、肝芽腫、肝血管肉腫、肝細胞腺腫、及び肝血管腫からなる群から選択される、請求項5に記載の方法。
【請求項7】
前記膵臓癌が、膵臓管腺癌、膵臓インスリノーマ、膵臓グルカゴーマ、膵臓ガストリノーマ、膵臓カルチノイド腫瘍、及び膵臓ビポーマからなる群から選択される、請求項5に記載の方法。
【請求項8】
前記膀胱癌が、膀胱扁平上皮細胞癌、膀胱移行上皮癌、及び膀胱腺癌からなる群から選択される、請求項5に記載の方法。
【請求項9】
前記前立腺癌が、前立腺癌、前立腺肉腫、及び良性前立腺過形成(BPH)からなる群から選択される、請求項5に記載の方法。
【請求項10】
前記精巣癌が、セミノーマ、精巣奇形腫、精巣胚性癌腫、精巣奇形癌腫、精巣絨毛癌、精巣肉腫、精巣間質細胞癌腫、精巣線維腫、精巣線維腺腫、精巣腺腫様腫瘍、及び精巣脂肪腫からなる群から選択される、請求項5に記載の方法。
【請求項11】
前記肺癌が、肺カルチノイド、肺胸膜中皮腫、及び肺扁平上皮細胞癌からなる群から選択される、請求項5に記載の方法。
【請求項12】
前記卵巣癌が、卵巣癌腫、未分類卵巣癌腫、漿液性乳頭癌腫、卵巣顆粒膜−包膜細胞腫瘍、卵巣未分化胚細胞腫、及び卵巣悪性奇形腫からなる群から選択される、請求項5に記載の方法。
【請求項13】
前記消化管間質癌が、小腸腺癌及び小腸カルチノイド腫瘍からなる群から選択される、請求項5に記載の方法。
【請求項14】
前記脳癌が、神経膠芽腫、神経膠腫、髄膜腫、星状細胞腫、髄芽腫、乏突起神経膠腫、神経外胚葉癌、及び神経芽腫からなる群から選択される、請求項5に記載の方法。
【請求項15】
前記乳癌が、小葉癌及び乳管癌からなる群から選択される、請求項5に記載の方法。
【請求項16】
前記頭頚部癌が、扁平上皮細胞癌である、請求項5に記載の方法。
【請求項17】
前記結腸癌が、腺癌である、請求項5に記載の方法。
【請求項18】
前記子宮内膜癌が、子宮内膜腺癌である、請求項5に記載の方法。
【請求項19】
前記リンパ節癌が、ホジキンリンパ腫である、請求項5に記載の方法。
【請求項20】
前記甲状腺癌が、乳頭癌腫である、請求項5に記載の方法。
【請求項21】
前記生物学的試料が、体液、細胞系及び組織試料からなる群から選択される、請求項1又は3のいずれか一項に記載の方法。
【請求項22】
前記組織が、新鮮組織、凍結組織、固定組織、ロウ埋包組織、又はホルマリン固定パラフィン埋包(FFPE)組織である、請求項21に記載の方法。
【請求項23】
前記発現プロファイルが、転写プロファイルである、請求項1に記載の方法。
【請求項24】
少なくとも1つの分類子アルゴリズムの使用をさらに含む、請求項1又は3に記載の方法。
【請求項25】
前記少なくとも1つの分類子が、決定木分類子、ロジスティック回帰分類子、最近傍分類子、ニューラルネットワーク分類子、ガウシアン混合モデル(GMM)、及びサポートベクターマシン(SVM)分類子からなる群から選択される、請求項24に記載の方法。
【請求項26】
前記試料中の、配列番号1〜4からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肝臓起源の癌の指標となる、肝臓起源の癌を分類するための請求項3に記載の方法。
【請求項27】
前記試料中の、配列番号1〜6からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、精巣起源の癌の指標となる、精巣起源の癌を分類するための請求項3に記載の方法。
【請求項28】
前記試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺起源の癌の指標となる、肺起源の癌を分類するための請求項3に記載の方法。
【請求項29】
前記試料中の、配列番号1〜8、31、32、37、38、45〜48、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺カルチノイド起源の癌の指標となる、肺カルチノイド起源の癌を分類するための請求項3に記載の方法。
【請求項30】
前記試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺胸膜起源の癌の指標となる、肺胸膜起源の癌を分類するための請求項3に記載の方法。
【請求項31】
前記試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺扁平上皮起源の癌の指標となる、肺扁平上皮起源の癌を分類するための請求項3に記載の方法。
【請求項32】
前記試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、膵臓起源の癌の指標となる、膵臓起源の癌を分類するための請求項3に記載の方法。
【請求項33】
前記試料中の、配列番号1〜8、31、32、37、38、45〜52、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、結腸起源の癌の指標となる、結腸起源の癌を分類するための請求項3に記載の方法。
【請求項34】
前記試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、頭頚部起源の癌の指標となる、頭頚部起源の癌を分類するための請求項3に記載の方法。
【請求項35】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、卵巣起源の癌の指標となる、卵巣起源の癌を分類するための請求項3に記載の方法。
【請求項36】
前記試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、消化管間質起源の癌の指標となる、消化管間質起源の癌を分類するための請求項3に記載の方法。
【請求項37】
前記試料中の、配列番号1〜14、19〜24、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、脳起源の癌の指標となる、脳起源の癌を分類するための請求項3に記載の方法。
【請求項38】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、乳房起源の癌の指標となる、乳房起源の癌を分類するための請求項3に記載の方法。
【請求項39】
前記試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、膀胱起源の癌の指標となる、膀胱起源の癌を分類するための請求項3に記載の方法。
【請求項40】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、前立腺起源の癌の指標となる、前立腺起源の癌を分類するための請求項3に記載の方法。
【請求項41】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、甲状腺起源の癌の指標となる、甲状腺起源の癌を分類するための請求項3に記載の方法。
【請求項42】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、子宮内膜起源の癌の指標となる、子宮内膜起源の癌を分類するための請求項3に記載の方法。
【請求項43】
前記試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、腎臓起源の癌の指標となる、腎臓起源の癌を分類するための請求項3に記載の方法。
【請求項44】
前記試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、メラニン形成細胞起源の癌の指標となる、メラニン形成細胞起源の癌を分類するための請求項3に記載の方法。
【請求項45】
前記試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、髄膜起源の癌の指標となる、髄膜起源の癌を分類するための請求項3に記載の方法。
【請求項46】
前記試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肉腫起源の癌の指標となる、肉腫起源の癌を分類するための請求項3に記載の方法。
【請求項47】
前記試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、胃起源の癌の指標となる、胃起源の癌を分類するための請求項3に記載の方法。
【請求項48】
前記試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、リンパ節起源の癌の指標となる、リンパ節起源の癌を分類するための請求項3に記載の方法。
【請求項49】
前記試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、胸腺−B2起源の癌の指標となる、胸腺−B2起源の癌を分類するための請求項3に記載の方法。
【請求項50】
前記試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、胸腺−B3起源の癌の指標となる、胸腺−B3起源の癌を分類するための請求項3に記載の方法。
【請求項51】
生物学的試料の起源組織を分類する方法であって、
(a)対象から生物学的試料を得るステップと、
(b)前記試料の遺伝子セット中の各遺伝子の個々の遺伝子発現を決定するステップであって、前記遺伝子セットがマイクロRNAを含むステップと、
(c)前記試料について、起源組織を少なくとも1つの分類子によって分類するステップと
を含む方法。
【請求項52】
少なくとも1つの分類子が、決定木モデルである、請求項51に記載の方法。
【請求項53】
(a)配列番号1〜96、
(b)(a)の相補的な配列、及び
(c)(a)又は(b)に対して少なくとも約80%の同一性を有する配列
からなる群から選択された核酸配列を含むプローブを含む、癌の分類のためのキット。
【請求項1】
生物学的試料の起源組織を分類する方法であって、
(a)対象から生物学的試料を得るステップと、
(b)前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の発現プロファイルを決定するステップと、
(c)前記発現プロファイルを参照発現プロファイルと比較するステップとを含み、
それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記試料の起源組織の分類を可能にする方法。
【請求項2】
前記組織が、肝臓、肺、膀胱、前立腺、乳房、結腸、卵巣、精巣、胃、甲状腺、膵臓、脳、子宮内膜、頭頚部、リンパ節、腎臓、メラニン形成細胞、髄膜、胸腺、及び前立腺からなる群から選択される、請求項1に記載の方法。
【請求項3】
癌又は過形成を分類する方法であって、
(a)対象から生物学的試料を得るステップと、
(b)前記試料中の、配列番号1〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップと、
(c)前記得られた測定値を前記核酸の参照存在量と比較するステップとを含み、
それによって、前記核酸配列のうちのいずれかの示差的な発現が、前記癌又は過形成の分類を可能にする方法。
【請求項4】
前記試料を、原発不明癌(CUP)を有する、原発性癌を有する、又は転移性癌を有する対象から得る、請求項3に記載の方法。
【請求項5】
前記癌が、肝臓癌、肺癌、膀胱癌、前立腺癌、乳癌、結腸癌、卵巣癌、精巣癌、胃癌、甲状腺癌、膵臓癌、脳癌、子宮内膜癌、頭頚部癌、リンパ節癌、腎臓癌、メラノーマ、髄膜癌、胸腺癌、前立腺癌、消化管間質癌、及び肉腫からなる群から選択される、請求項3に記載の方法。
【請求項6】
前記肝臓癌が、肝細胞腫、肝細胞癌(HCC)、肝胆管癌、肝芽腫、肝血管肉腫、肝細胞腺腫、及び肝血管腫からなる群から選択される、請求項5に記載の方法。
【請求項7】
前記膵臓癌が、膵臓管腺癌、膵臓インスリノーマ、膵臓グルカゴーマ、膵臓ガストリノーマ、膵臓カルチノイド腫瘍、及び膵臓ビポーマからなる群から選択される、請求項5に記載の方法。
【請求項8】
前記膀胱癌が、膀胱扁平上皮細胞癌、膀胱移行上皮癌、及び膀胱腺癌からなる群から選択される、請求項5に記載の方法。
【請求項9】
前記前立腺癌が、前立腺癌、前立腺肉腫、及び良性前立腺過形成(BPH)からなる群から選択される、請求項5に記載の方法。
【請求項10】
前記精巣癌が、セミノーマ、精巣奇形腫、精巣胚性癌腫、精巣奇形癌腫、精巣絨毛癌、精巣肉腫、精巣間質細胞癌腫、精巣線維腫、精巣線維腺腫、精巣腺腫様腫瘍、及び精巣脂肪腫からなる群から選択される、請求項5に記載の方法。
【請求項11】
前記肺癌が、肺カルチノイド、肺胸膜中皮腫、及び肺扁平上皮細胞癌からなる群から選択される、請求項5に記載の方法。
【請求項12】
前記卵巣癌が、卵巣癌腫、未分類卵巣癌腫、漿液性乳頭癌腫、卵巣顆粒膜−包膜細胞腫瘍、卵巣未分化胚細胞腫、及び卵巣悪性奇形腫からなる群から選択される、請求項5に記載の方法。
【請求項13】
前記消化管間質癌が、小腸腺癌及び小腸カルチノイド腫瘍からなる群から選択される、請求項5に記載の方法。
【請求項14】
前記脳癌が、神経膠芽腫、神経膠腫、髄膜腫、星状細胞腫、髄芽腫、乏突起神経膠腫、神経外胚葉癌、及び神経芽腫からなる群から選択される、請求項5に記載の方法。
【請求項15】
前記乳癌が、小葉癌及び乳管癌からなる群から選択される、請求項5に記載の方法。
【請求項16】
前記頭頚部癌が、扁平上皮細胞癌である、請求項5に記載の方法。
【請求項17】
前記結腸癌が、腺癌である、請求項5に記載の方法。
【請求項18】
前記子宮内膜癌が、子宮内膜腺癌である、請求項5に記載の方法。
【請求項19】
前記リンパ節癌が、ホジキンリンパ腫である、請求項5に記載の方法。
【請求項20】
前記甲状腺癌が、乳頭癌腫である、請求項5に記載の方法。
【請求項21】
前記生物学的試料が、体液、細胞系及び組織試料からなる群から選択される、請求項1又は3のいずれか一項に記載の方法。
【請求項22】
前記組織が、新鮮組織、凍結組織、固定組織、ロウ埋包組織、又はホルマリン固定パラフィン埋包(FFPE)組織である、請求項21に記載の方法。
【請求項23】
前記発現プロファイルが、転写プロファイルである、請求項1に記載の方法。
【請求項24】
少なくとも1つの分類子アルゴリズムの使用をさらに含む、請求項1又は3に記載の方法。
【請求項25】
前記少なくとも1つの分類子が、決定木分類子、ロジスティック回帰分類子、最近傍分類子、ニューラルネットワーク分類子、ガウシアン混合モデル(GMM)、及びサポートベクターマシン(SVM)分類子からなる群から選択される、請求項24に記載の方法。
【請求項26】
前記試料中の、配列番号1〜4からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肝臓起源の癌の指標となる、肝臓起源の癌を分類するための請求項3に記載の方法。
【請求項27】
前記試料中の、配列番号1〜6からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、精巣起源の癌の指標となる、精巣起源の癌を分類するための請求項3に記載の方法。
【請求項28】
前記試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺起源の癌の指標となる、肺起源の癌を分類するための請求項3に記載の方法。
【請求項29】
前記試料中の、配列番号1〜8、31、32、37、38、45〜48、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺カルチノイド起源の癌の指標となる、肺カルチノイド起源の癌を分類するための請求項3に記載の方法。
【請求項30】
前記試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺胸膜起源の癌の指標となる、肺胸膜起源の癌を分類するための請求項3に記載の方法。
【請求項31】
前記試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肺扁平上皮起源の癌の指標となる、肺扁平上皮起源の癌を分類するための請求項3に記載の方法。
【請求項32】
前記試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、膵臓起源の癌の指標となる、膵臓起源の癌を分類するための請求項3に記載の方法。
【請求項33】
前記試料中の、配列番号1〜8、31、32、37、38、45〜52、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、結腸起源の癌の指標となる、結腸起源の癌を分類するための請求項3に記載の方法。
【請求項34】
前記試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、57〜64、69〜74、85、86及び89〜96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、頭頚部起源の癌の指標となる、頭頚部起源の癌を分類するための請求項3に記載の方法。
【請求項35】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、卵巣起源の癌の指標となる、卵巣起源の癌を分類するための請求項3に記載の方法。
【請求項36】
前記試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、消化管間質起源の癌の指標となる、消化管間質起源の癌を分類するための請求項3に記載の方法。
【請求項37】
前記試料中の、配列番号1〜14、19〜24、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、脳起源の癌の指標となる、脳起源の癌を分類するための請求項3に記載の方法。
【請求項38】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、乳房起源の癌の指標となる、乳房起源の癌を分類するための請求項3に記載の方法。
【請求項39】
前記試料中の、配列番号1〜8、25、26、33、34、37、38、45、46、49、50、57〜64、69〜84、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、膀胱起源の癌の指標となる、膀胱起源の癌を分類するための請求項3に記載の方法。
【請求項40】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜68、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、前立腺起源の癌の指標となる、前立腺起源の癌を分類するための請求項3に記載の方法。
【請求項41】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、甲状腺起源の癌の指標となる、甲状腺起源の癌を分類するための請求項3に記載の方法。
【請求項42】
前記試料中の、配列番号1〜8、33、34、37、38、45、46、49、50、57〜64、69〜90、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、子宮内膜起源の癌の指標となる、子宮内膜起源の癌を分類するための請求項3に記載の方法。
【請求項43】
前記試料中の、配列番号1〜14、19〜40、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、腎臓起源の癌の指標となる、腎臓起源の癌を分類するための請求項3に記載の方法。
【請求項44】
前記試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、メラニン形成細胞起源の癌の指標となる、メラニン形成細胞起源の癌を分類するための請求項3に記載の方法。
【請求項45】
前記試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、髄膜起源の癌の指標となる、髄膜起源の癌を分類するための請求項3に記載の方法。
【請求項46】
前記試料中の、配列番号1〜14、19〜36、41〜44、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、肉腫起源の癌の指標となる、肉腫起源の癌を分類するための請求項3に記載の方法。
【請求項47】
前記試料中の、配列番号1〜8、31、32、37、38、45〜56、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、胃起源の癌の指標となる、胃起源の癌を分類するための請求項3に記載の方法。
【請求項48】
前記試料中の、配列番号1〜18、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、リンパ節起源の癌の指標となる、リンパ節起源の癌を分類するための請求項3に記載の方法。
【請求項49】
前記試料中の、配列番号1〜14、19〜28、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、胸腺−B2起源の癌の指標となる、胸腺−B2起源の癌を分類するための請求項3に記載の方法。
【請求項50】
前記試料中の、配列番号1〜8、29、30、33、34、37、38、45、46、49、50、57〜64、69〜78、95及び96からなる群から選択された核酸配列、又はそれに対して少なくとも約80%の同一性を有する配列の相対的な存在量を測定するステップを含み、前記核酸配列の存在量が、胸腺−B3起源の癌の指標となる、胸腺−B3起源の癌を分類するための請求項3に記載の方法。
【請求項51】
生物学的試料の起源組織を分類する方法であって、
(a)対象から生物学的試料を得るステップと、
(b)前記試料の遺伝子セット中の各遺伝子の個々の遺伝子発現を決定するステップであって、前記遺伝子セットがマイクロRNAを含むステップと、
(c)前記試料について、起源組織を少なくとも1つの分類子によって分類するステップと
を含む方法。
【請求項52】
少なくとも1つの分類子が、決定木モデルである、請求項51に記載の方法。
【請求項53】
(a)配列番号1〜96、
(b)(a)の相補的な配列、及び
(c)(a)又は(b)に対して少なくとも約80%の同一性を有する配列
からなる群から選択された核酸配列を含むプローブを含む、癌の分類のためのキット。
【図1A】
【図1B】
【図1C】
【図1D】
【図2】
【図3A】
【図3B】
【図3C】
【図3D】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図1B】
【図1C】
【図1D】
【図2】
【図3A】
【図3B】
【図3C】
【図3D】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【公表番号】特表2010−522554(P2010−522554A)
【公表日】平成22年7月8日(2010.7.8)
【国際特許分類】
【出願番号】特願2010−500429(P2010−500429)
【出願日】平成20年3月20日(2008.3.20)
【国際出願番号】PCT/IL2008/000396
【国際公開番号】WO2008/117278
【国際公開日】平成20年10月2日(2008.10.2)
【出願人】(509243230)ロゼッタ ゲノミックス エルティーディー. (4)
【出願人】(509260075)テル ハショメル メディカル インフラストラクチャー アンド サービズ エルティーディー. (1)
【Fターム(参考)】
【公表日】平成22年7月8日(2010.7.8)
【国際特許分類】
【出願日】平成20年3月20日(2008.3.20)
【国際出願番号】PCT/IL2008/000396
【国際公開番号】WO2008/117278
【国際公開日】平成20年10月2日(2008.10.2)
【出願人】(509243230)ロゼッタ ゲノミックス エルティーディー. (4)
【出願人】(509260075)テル ハショメル メディカル インフラストラクチャー アンド サービズ エルティーディー. (1)
【Fターム(参考)】
[ Back to top ]