説明

マイクロNASおよびその使用

本明細書には、前立腺ガンおよび肺ガンに関連する新規ポリヌクレオチドが記載されている。これらのポリヌクレオチドは、miRNAおよびmiRNA前駆体である。診断、予後診断およびこれらの病状の治療に用いることができる、関連する方法および組成物が開示されている。さらに本明細書には、前立腺ガンおよび肺ガンのモジュレーターを特定するために用いることができる方法が記載されている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的にマイクロRNA分子ならびにそれに関連するまたはそれらに由来する種々の核酸分子に関する。
【背景技術】
【0002】
マイクロRNA(miRNA)は約22ヌクレオチドの短いRNAオリゴヌクレオチドであり、遺伝子調節に関与する。マイクロRNAは、切断または翻訳を抑制するためにmRNAを標的化することによって遺伝子発現を調節する。miRNAはC. elegans、ショウジョウバエおよびヒトを含む広範囲の種に存在するが、それらはつい最近、同定されたばかりである。より重要なことに、疾患の発症および進行におけるmiRNAの役割が、ようやく最近になって理解されてきた。
【0003】
miRNAのサイズが小さいことの結果として、標準的な方法を用いてmiRNAを同定することは困難であった。多量のRNAを抽出することによって、限られた数のmiRNAが同定された。さらに、視覚的に識別できる表現型の提示に寄与するmiRNAも同定された。発現アレイのデータから、miRNAは異なる発達段階であるいは異なる組織で発現することが示されている。ある特定の組織にまたは限られた発達段階にmiRNAが制限されていることは、現在までに同定されたmiRNAは、おそらくmiRNA全体の僅かな部分に過ぎないことを示唆する。
【0004】
近年、ゲノム内のmiRNAの残りを同定するためのコンピュータを利用したアプローチが開発された。MiRscanおよびMiRseekerなどのツールによってmiRNAが同定され、後に実験的にも確認されたた。これらのコンピュータを利用したツールに基づいて、ヒトゲノムに200−255のmiRNA遺伝子が含まれると推定された。しかし、これらの推定値は未だ同定されていないmiRNAも既に同定されたmiRNAと同一の特性を持つであろうという仮定に基づくものではある。哺乳動物の生物学および疾患におけるmiRNAの基本的な重要性に基づけば、技術は未知のmiRNAを同定することを必要としている。本発明によってこの必要性が満たされ、その結果相当数のmiRNAおよび使用が提供される。
【発明の開示】
【課題を解決するための手段】
【0005】
本発明は、プリmiRNAの配列、プレmiRNAの配列、miRNAの配列、miRNA*の配列、アンチmiRNAの配列もしくはmiRNA結合部位の配列またはその変異体を含む単離された核酸に関する。この核酸は、表1に言及されるヘアピン配列;表10の配列識別子6757248−6894882の配列;表17の配列識別子1−6318もしくは18728−18960の配列;表1に言及されるmiRNAの配列;表10の配列識別子1−117750もしくは6894883−10068177の配列;表17の配列識別子6319−18727もしくは18961−19401の配列;表4に言及される標的遺伝子結合部位の配列;表10の配列識別子117751−6757247の配列;その相補体;またはそれらと少なくとも60%一致する少なくとも12の連続するヌクレオチドを含む配列を含んでもよい。この単離された核酸は、5−250のヌクレオチド長であってもよい。
【0006】
本発明は、核酸を含むプローブにも関する。このプローブは、前立腺ガンまたは肺ガンで差別的に発現されるものとして表2に言及されるmiRNAに相補的な少なくとも8−22の連続するヌクレオチドを含んでもよい。
【0007】
本発明は、複数のプローブにも関する。複数のプローブは、前立腺ガンで差別的に発現されるものとして表2に言及される各々のmiRNAに相補的な少なくとも1つのプローブを含んでもよい。複数のプローブはさらに、肺ガンで差別的に発現されるものとして表2に言及される各々のmiRNAに相補的な少なくとも1つのプローブを含んでもよい。
【0008】
本発明は、1つのプローブまたは複数のプローブを含む組成物にも関する。
【0009】
本発明は固体担体を備えるバイオチップにも関し、当該担体は複数のプローブを含む。プローブの各々は、担体の空間的に定められたアドレスに連結されてもよい。このバイオチップは、前立腺ガンで差別的に発現されるものとして表2に言及されるmiRNAに相補的なプローブを含んでもよい。このバイオチップはさらに、肺ガンで差別的に発現されるものとして表2に言及されるmiRNAに相補的なプローブを含んでもよい。
【0010】
本発明は、疾患に関連するmiRNAの差別的発現を検出する方法にも関する。生物学的試料を用意し、表1に言及されるmiRNAの配列;表10の配列識別子1−117750もしくは6894883−10068177の配列;表17の配列識別子6319−18727もしくは18961−19401の配列;またはその変異体と少なくとも70%の同一性を有する核酸のレベルを測定してもよい。コントロールと比較した核酸のレベルの相違は、差別的発現を示唆する。
【0011】
本発明はさらに、病的な状態を調節する化合物を同定する方法に関する。表1に言及されるmiRNAの配列;表10の配列識別子1−117750もしくは6894883−10068177の配列;表17の配列識別子6319−18727もしくは18961−19401の配列;またはその変異体と少なくとも70%の同一性を有する核酸を発現できる細胞を提供してもよい。この細胞をモジュレーターの候補物と接触させ、次いで核酸発現のレベルを測定してもよい。コントロールと比較した核酸のレベルの相違によって、核酸に関連する病的な状態のモジュレーターとしての化合物を同定する。
【0012】
本発明はさらに、細胞中での標的遺伝子の発現を阻害する方法に関する。細胞内に、標的遺伝子の発現を十分に阻害できる量の核酸を導入してもよい。その標的遺伝子は、表4に言及される結合部位と実質的に同一の結合部位;表10の配列識別子117751−6757247の配列;またはその変異体を含んでもよい。核酸は、配列番号:1−760616の配列;表10の配列識別子1−117750および6757248−10068177の配列;表17に記載の配列;またはその変異体を含んでもよい。標的遺伝子の発現はインビトロでまたはインビボで阻害されてもよい。
【0013】
本発明はさらに、細胞における標的遺伝子の発現を増加させる方法に関する。細胞内に、標的遺伝子の発現を十分に阻害できる量の核酸を導入してもよい。その標的遺伝子は、表4に言及される結合部位と実質的に同一の結合部位;表10の配列識別子117751−6757247の配列;またはその変異体を含んでもよい。核酸は、配列番号:1−760616;表10の配列識別子1−117750および6757248−10068177の配列;表17に記載の配列;またはその変異体に実質的に相補的な配列を含んでもよい。標的遺伝子の発現はインビトロまたはインビボで阻害されてもよい。標的遺伝子の発現はインビトロまたはインビボで促進されてもよい。
【0014】
本発明はさらに、配列番号:1−760616の配列、表10に記載の配列、表17に記載の配列またはその変異体を含む核酸を、必要とする患者に投与することを含む、表6に記載の疾患を伴う患者を治療する方法に関する。
【発明を実施するための最良の形態】
【0015】
本発明は、miRNAのヌクレオチド配列、それに対する前駆体、その標的および関連する配列を提供する。このような核酸は、診断目的にとって、さらには標的遺伝子の発現を改変することにとって有用である。本発明のその他の側面は、本発明の次の記述によって、当業者に明らかになるであろう。
【0016】
1.定義
今回の化合物、製品および組成物ならびに方法を開示し記載する前に、本明細書で用いられる専門用語が特定の態様を説明する目的のみのものであり、制限を意図するものではないことを理解すべきである。明細書および添付の請求の範囲で用いられるように、単数形の「a」、「an」および「the」は、文脈が明確にそれ以外のことを指示しない限り、複数の対象を包含することに留意すべきである。
【0017】
a.動物
本明細書で用いられる「動物」は、魚類、両生類、爬虫類、鳥類および哺乳類を意味してもよく、たとえば、マウス、ラット、ウサギ、ヤギ、ネコ、イヌ、ウシ、サルおよびヒトが挙げられる。
【0018】
b.連結
プローブおよび固体担体に関して本明細書で用いられる「連結された」または「固定化された」とは、プローブと固体担体との間の結合が、結合、洗浄、解析および除去の条件下で十分に安定していることを意味してもよい。この結合は共有的であってもまたは非共有的であってもよい。共有結合はプローブと固体担体との間で直接形成されてもよく、または架橋によってもしくは固体担体もしくはプローブのいずれか上または両方の分子上に特定の反応基の含ませることによって形成されてもよい。非共有結合は、静電気的、親水性および疎水性の相互作用のうち1つ以上であってよい。非共有結合に含まれるものは、ストレプトアビジンなどの分子の担体への共有的な連結、およびビオチン化プローブのストレプトアビジンへの非共有結合である。固定化には、共有的および非共有的相互作用の組み合わせが関与してもよい。
【0019】
c.生物学的試料
本明細書で用いられる「生物学的試料」とは、核酸を含む生物学的組織または液体の試料を意味してもよい。このような試料としては、動物から単離される組織が挙げられるが、それらに制限されるわけではない。生物学的試料としては、生検材料および検死試料などの組織切片、組織学上の目的のために採取された凍結切片、血液、血漿、血清、唾液、大便、涙液、粘液、毛髪および皮膚も挙げられ得る。生物学的試料はさらに、外植体および患者の組織に由来する一次細胞および/または形質転換細胞の培養物を含む。動物から細胞試料を除去することによって生物学的試料を提供してもよいが、予め単離された(たとえば、別のヒトによって、別の時点でおよび/または別の目的で単離された)細胞を用いて実現してもよく、または本発明の方法をインビボで実施することによって実現してもよい。保管されていた組織、たとえば、治療されたものまたは過去に結果がでたもの、を用いてもよい。
【0020】
d.相補体
本明細書で用いられる「相補体」または「相補的」とは、ヌクレオチドまたは核酸分子のヌクレオチドアナログ間のワトソン−クリック塩基対またはHoogsteen塩基対を意味してもよい。
【0021】
e.差別的発現
「差別的発現」とは、細胞および組織の中および間における一時的なおよび/または細胞性の遺伝子発現パターンの定性的または定量的な相違を意味してもよい。したがって、たとえば正常組織対疾患組織において、差別的に発現される遺伝子は定性的に発現が改変され得る(たとえば、活性化または非活性化など)。遺伝子は、その他の状況と比較して特定の状況において作動、または作動が停止し得るため、したがって2つ以上の状態の比較が可能となる。定性的に調節される遺伝子は、ある状況または細胞のタイプの範囲内で、標準的な技術で検出可能な発現パターンを表すことになる。いくつかの遺伝子は1つの状況または細胞のタイプで発現することになるが、両方では発現されない。あるいは、たとえば、発現が調節される場合、結果的に転写物の量が増加する上方調節、または結果的に転写物の量が減少する下方調節のいずれかとなる点で発現の違いは定量的となり得る。発現が異なる程度は、ただ単に、発現アレイ、定量的逆転写酵素PCR、ノーザン解析およびRNaseの保護などの標準的な特徴解析技術による定量が十分にできる程度の量であればよい。
【0022】
f.遺伝子
本明細書で用いられる「遺伝子」は、転写および/または翻訳調節配列および/またはコード領域および/または非翻訳配列(たとえばイントロン、5’−および3’−非翻訳配列)を含むゲノム遺伝子であってよい。遺伝子のコード領域は、アミノ酸配列または機能的RNA、たとえばtRNA、rRNA、触媒RNA、siRNA、miRNAおよびアンチセンスRNAをコードするヌクレオチド配列であってよい。遺伝子はさらに、必要に応じてそれに結合する5’−または3’−非翻訳配列を含むコード領域(たとえばエキソンおよびmiRNA)に対応するmRNAまたはcDNAであってよい。遺伝子はさらに、コード領域および/またはそれに結合する5’−もしくは3’−非翻訳配列のすべてまたは一部を含む、インビトロで生産され増幅された核酸分子であってよい。
【0023】
g.宿主細胞
本明細書で用いられる「宿主細胞」は、ベクターを含みベクターの複製をサポートする天然の細胞または形質転換細胞であってよい。宿主細胞は、培養細胞、外植体、インビボの細胞などであってよい。宿主細胞は、E. coliなどの原核細胞または酵母、昆虫、両生類またはCHO、HeLaなどの哺乳動物の細胞のような真核細胞であってよい。
【0024】
h.同一性
本明細書で用いられる2つ以上の核酸配列またはポリペプチド配列に関して「同一な」または「同一性」とは、特定の領域に亘って同じであるヌクレオチドまたはアミノ酸が特定のパーセンテージを有する配列を意味してもよい。最適に整列された2つの配列を比較し、特定の領域に亘り2つの配列を比較し、両方の配列において同一の残基が存在する位置の数を計測してマッチング位置数を得、マッチング位置数をその特定の領域内の位置の総数で割り、そしてその結果を100倍して配列同一性のパーセンテージを得ることによって、そのパーセンテージを計算することができる。2つの配列の長さが異なるか、またはアラインメントによってスタガード末端が生じ、比較する特定の領域が1つの配列しか含まない場合、1つの配列の残りは計算において分子には算入されないが分母には算入される。DNAとRNAとを比較する場合、チミン(T)およびウラシル(U)を等価とみなす。同一性については、手動で行ってもよく、BLASTまたはBLAST 2.0などのコンピュータ配列アルゴリズムを用いてもよい。
【0025】
i.標識
本明細書で用いられる「標識」は、分光学的、光化学的、生化学的、免疫学的、化学的に、あるいはその他の物理的手段によって検出可能な組成物を意味してもよい。たとえば、有用な標識としては、32P、蛍光色素、高電子密度試薬、酵素(たとえばELISAに広く使われるもの等)、ビオチン、ジゴキシゲニンまたはハプテンおよびその他の検出可能となり得る構成要素が挙げられる。標識を、核酸およびタンパク質内の任意の位置に組み込んでもよい。
【0026】
j.核酸
本明細書で用いられる「核酸」または「オリゴヌクレオチド」または「ポリヌクレオチド」は、相互に共有結合した少なくとも2つのヌクレオチドを意味してもよい。当業者であれば理解できるように、一本鎖を記述することは、その相補鎖の配列も規定する。したがって、核酸は、記述された一本鎖の相補鎖も包含する。さらに当業者であれば理解できるように、1つの核酸の多数の変異体を、所定の核酸と同じ目的に用いてもよい。したがって、核酸は実質的に同一の核酸およびその相補体も包含する。さらに当業者であれば理解できるように、一本鎖によって、ストリンジェントなハイブリダイゼーション条件下で標的配列とハイブリダイズし得るプローブのためのプローブが与えられる。したがって、核酸は、ストリンジェントなハイブリダイゼーション条件下でハイブリダイズするプローブも包含する。
【0027】
核酸は一本鎖もしくは二本鎖であってよく、または二本鎖および一本鎖の配列の両方の部分を含んでいてもよい。核酸はDNA(ゲノミックとcDNAの両方)、RNAまたはハイブリッドであってよく、ここで、核酸はデオキシリボヌクレオチドおよびリボヌクレオチドの組み合わせを含んでもよく、ウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン・ヒポキサンチン、イソシトシンおよびイソグアニンを含む塩基の組み合わせを含んでもよい。化学合成法によって、または組み換え法によって、核酸を得ることができる。
【0028】
一般的に核酸はホスホジエステル結合を含むものであるが、たとえばホスホロアミダート結合、ホスホロチオアート結合、ホスホロジチオアート結合またはO−メチルホスホロアミダイト結合や、ペプチド核酸のバックボーンおよび結合など少なくとも1つの異なる結合を有しうる核酸アナログが含まれていてもよい。その他の核酸アナログとしては、陽性のバックボーン;非イオン性のバックボーン、非リボースバックボーンを伴うものが挙げられ、米国特許番号第5,235,033号および第5,034,506号(これらは引用として組み込まれる)に記載のものが挙げられる。1つ以上の非天然または改変されたヌクレオチドを含む核酸も、核酸の定義の1つに包含される。改変されたヌクレオチドアナログは、たとえば核酸分子の5’−末端および/または3’−末端に位置させればよい。ヌクレオチドアナログの代表的な例としては、糖またはバックボーンが改変されたリボヌクレオチドから選択することができる。しかしながら、核酸塩基が改変されたリボヌクレオチド、すなわち天然の核酸塩基の代わりに人工の核酸塩基を含むリボヌクレオチド、たとえば5位が改変されたウリジンまたはシチジン(例えば5−(2−アミノ)プロピルウリジン、5−ブロモウリジン);8位が改変されたアデノシンおよびグアノシン(例えば8−ブロモグアノシン);デアザヌクレオチド(例えば7−デアザ−アデノシン);O−およびN−アルキル化ヌクレオチド(例えばN6−メチルアデノシン)も適切であることに留意すべきである。2’−OH基を、H、OR、R、ハロ、SH、SR、NH2、NHR、NR2またはCNから選択される基で置き換えてもよく、ここで、RはC1−C6のアルキル、アルケニルまたはアルキニルであり、ハロはF、Cl、BrまたはIである。種々の理由、たとえばそのような分子の生理的環境における安定性および半減期あるいはバイオチップ上のプローブとしての安定性および半減期を高めることを目的として、リボース−リン酸のバックボーンを改変してもよい。天然の核酸およびアナログの混合物を作製してもよく;あるいは異なる核酸アナログの混合物、および天然の核酸とアナログとの混合物を作製してもよい。
【0029】
k.作動可能な結合
本明細書で用いられる「作動可能な結合」とは、遺伝子発現が、空間的に連結したプロモーターの制御下にあることを意味してもよい。プロモーターは、その制御下にある遺伝子の5’(上流)または3’(下流)に位置してもよい。プロモーターと遺伝子との間の間隔は、プロモーターが由来する遺伝子において、プロモーターとそれが制御する遺伝子の間の間隔とほぼ同じであってよい。本技術分野において知られているように、プロモーターの機能を喪失すること無く、この間隔を変動させることができる。
【0030】
l.プローブ
本明細書で用いられる「プローブ」は、1つ以上のタイプの化学結合を介して、通常は相補的塩基対の形成(通常は水素結合の形成を介する)を介して、相補的配列の標的核酸に結合することができるオリゴヌクレオチドを意味してもよい。ハイブリダイゼーション条件のストリンジェンシーに応じて、プローブ配列との完全な相補性を欠いた状態でプローブが標的配列と結合してもよい。標的配列と本発明の一本鎖核酸との間のハイブリダイゼーションを妨げることになる塩基対のミスマッチは、任意の数存在してもよい。しかしながら、突然変異の数が極めて多く、そのために最もストリンジェントではないハイブリダイゼーション条件下であってさえ、ハイブリダイゼーションが生じ得ない場合、その配列は相補的な標的配列ではない。プローブは一本鎖でもよく、または部分的に一本鎖であって部分的に二本鎖のものでもよい。標的配列の構造、組成および特性によって、プローブのストランデッドネス(鎖の数)が決定される。それとストレプトアビジン複合体が後にそれと結合し得るビオチンなどで、プローブを直接標識してもよく、または間接的に標識してもよい。
【0031】
m.プロモーター
本明細書で用いられる「プロモーター」は、細胞内での核酸発現能を付与したり、活性化させたりまたは促進させる能力を有する合成分子または天然由来の分子を意味してもよい。プロモーターは、発現をさらに促進させるおよび/または発現の空間的位置および/または時期を改変させるための1つ以上の特異的な調節要素を含んでもよい。プロモーターはさらに、遠位のエンハンサー要素またはリプレッサー要素を含んでもよく、これらは転写開始部位から数千塩基対も離れた位置に置くことができる。プロモーターは、ウイルス、細菌、菌類、植物、昆虫および動物を含む起源に由来するものでよい。プロモーターは、そこで発現が生じる細胞、組織もしくは器官に関して、発現が生じる発達段階に関して、または生理的ストレス、病原体、金属イオンもしくは誘発剤などの外部刺激に対する応答として、遺伝子成分の構成的な発現または差別的な発現を調節してもよい。プロモーターの代表的な例としては、バクテリオファージT7プロモーター、バクテリオファージT3プロモーター、SP6プロモーター、lacオペレーター−プロモーター、tacプロモーター、SV40後期プロモーター、SV40初期プロモーター、RSV−LTRプロモーター、CMV IEプロモーター、SV40初期プロモーターまたはSV40後期プロモーターおよびCMV IEプロモーターが挙げられる。
【0032】
n.選択マーカー
本明細書で用いられる「選択マーカー」は、細胞に表現型を与える任意の遺伝子を意味し、その細胞の中でその遺伝子が発現して、遺伝的構築物によって形質移入または形質転換された細胞の同定および/または選択を促進する。選択マーカーの代表的な例としては、アンピシリン耐性遺伝子(Ampr)、テトラサイクリン耐性遺伝子(Tcr)、細菌のカナマイシン耐性遺伝子(Kanr)、ゼオシン耐性遺伝子、抗生物質のオーレオバシジンAに対する抵抗性を付与するAURI−C遺伝子、ホスフィノトリシン耐性遺伝子、ネオマイシンホスホトランスフェラーゼ遺伝子(nptII)、ハイグロマイシン耐性遺伝子、ベータグルクロニダーゼ(GUS)遺伝子、クロラムフェニコール・アセチルトランスフェラーゼ(CAT)遺伝子、緑色蛍光タンパク質をコードする遺伝子およびルシフェラーゼ遺伝子が挙げられる。
【0033】
o.ストリンジェントなハイブリダイゼーション条件
本明細書で用いられる「ストリンジェントなハイブリダイゼーション条件」は、その条件下で第1の核酸配列(たとえばプローブ)が、たとえば核酸の複雑な混合物内で第2の核酸配列(たとえば標的)とハイブリダイズすることになり、その他の配列とはしない条件を意味してもよい。ストリンジェントな条件は配列依存的であり、異なる状況においては異なるものとなるであろう。一般的に、ストリンジェントな条件としては、規定されたイオン強度・pHにおいて、特定の配列についての融点(Tm)よりも約5−10℃低い温度が選択される。Tmは、平衡において(規定されたイオン強度、pHおよび核酸の濃度の下)標的に相補的なプローブの50%が標的配列とハイブリダイズする温度であってもよい(標的配列は過剰に存在するため、Tmでは平衡においてプローブの50%が結合する)。ストリンジェントな条件は、塩濃度が約1.0M未満のナトリウムイオン、典型的には、約0.01−1.0Mのナトリウムイオン(またはその他の塩)の濃度で、pHが7.0〜8.3であって、温度が短いプローブ(たとえば約10−50ヌクレオチド)については少なくとも約30℃、長いプローブ(たとえば約50を超えるヌクレオチド)については少なくとも約60℃というものでもよい。ストリンジェントな条件は、ホルムアミドなどの非安定化剤の添加によって達成することもできる。選択的または特異的ハイブリダイゼーションについては、陽性のシグナルはハイブリダイゼーションのバックグラウンドの少なくとも2〜10倍であってよい。ストリンジェントなハイブリダイゼーションの典型的な条件としては、次のものが挙げられる:50%のホルムアミド、5xSSCおよび1%のSDSで42℃にてインキュベートするか、または5xSSC、1%のSDSで65℃でインキュベートし、65℃の0.2xSSCおよび0.1%のSDSでの洗浄を伴う。
【0034】
p.実質的に相補的
本明細書で用いられる「実質的に相補的」とは、第1の配列が、第2の配列の相補体と、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50またはそれを超えるヌクレオチドの領域に亘って少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%または99%同一であるか、または2つの配列がストリンジェントなハイブリダイゼーション条件下でハイブリダイズすることを意味してもよい。
【0035】
q.実質的に同一
本明細書で用いられる「実質的に同一」とは、第1の配列および第2の配列が、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50またはそれを超えるヌクレオチドもしくはアミノ酸の領域に亘って少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%または99%同一であること、または核酸に関しては、第1の配列が第2の配列の相補体と実質的に相補的である場合を意味してもよい。
【0036】
r.標的
本明細書で用いられる「標的」とは、ストリンジェントなハイブリダイゼーション下で、1つ以上のプローブと結合し得るポリヌクレオチドを意味してもよい。
【0037】
s.ターミネーター
本明細書で用いられる「ターミネーター」とは、転写終了のシグナルを出す転写単位の末端の配列を意味してもよい。ターミネーターは、ポリアデニル化シグナルを含む3’−非翻訳DNA配列でよく、これは一次転写物の3’末端へのポリアデニル化配列の付加を促進してもよい。ターミネーターは、ウイルス、細菌、菌類、植物、昆虫および動物を含む起源に由来するものでもよい。ターミネーターの代表的な例としては、たとえば、SV40ポリアデニル化シグナル、HSV TKポリアデニル化シグナル、CYC1ターミネーター、ADHターミネーター、SPAターミネーター、Agrobacterium tumefaciensのノパリンシンターゼ(NOS)遺伝子のターミネーター、カリフラワーモザイクウイルス(CaMV)の35S遺伝子のターミネーター、Zea mays由来のゼイン遺伝子のターミネーター、Rubiscoの小サブユニット遺伝子(SSU)の遺伝子ターミネーター配列、サブクローバースタントウイルス(SCSV)の遺伝子配列ターミネーター、rho非依存性E. coliターミネーター、およびlacZアルファターミネーターが挙げられる。
【0038】
t.ベクター
本明細書で用いられる「ベクター」は、複製起点を含む核酸配列を意味してもよい。ベクターとしては、プラスミド、バクテリオファージ、細菌の人工染色体または酵母の人工染色体でもよい。ベクターはDNAベクターでもよく、またはRNAベクターでもよい。ベクターは、自己複製能を有する染色体外のベクターまたは宿主ゲノム内に組み込まれるベクターのいずれかでもよい。
【0039】
2.マイクロRNA
理論に拘束されないが、哺乳動物のmiRNAの成熟についての現在のモデルは図1に示されるとおりである。miRNAをコードする遺伝子が転写され、プリmiRNAとして知られているmiRNA前駆体の生成を導く。このプリmiRNAは、多数のプリmiRNAを含むポリシストロニックRNAの一部分でもよい。このプリmiRNAは、ステムとループとを伴うヘアピンを形成してもよい。図1に示されるように、ステムはミスマッチ塩基を含んでもよい。
【0040】
プリmiRNAのヘアピン構造はRNaseIII・エンドヌクレアーゼであるドローシャ(Drosha)で認識されてもよい。ドローシャはプリmiRNAにおける末端ループを認識し、およそ2つのヘリカルターンをステムに切断し、プレmiRNAとして知られる60−70ntの前駆体を生成することになる。ドローシャはRNaseIII・エンドヌクレアーゼに典型的なスタガードカットでプリmiRNAを切断し得、5’リン酸と約2ヌクレオチドの3’オーバーハングを伴うプレmiRNAのステムループを生じさせる。ドローシャの切断部位を超えて広がる、ステムのおよそ1つのヘリカルターン(約10ヌクレオチド)は、効果的なプロセシングにとって不可欠でありえる。次いで、Ran−GTPと核外輸送レセプターのエクスポーチン−5によって、プレmiRNAは核から細胞質に能動輸送されうる。
【0041】
プレmiRNAはやはりRNaseIII・エンドヌクレアーゼであるダイサーで認識されてもよい。ダイサーはプレmiRNAの二本鎖のステムを認識しうる。ダイサーはさらに、ステムのループの根元における5’リン酸と3’オーバーハングとを認識しうる。ダイサーは、ステムのループの根元から末端ループの2つのヘリカルターンを切り落とし、新たな5’リン酸と約2ヌクレオチドの3’オーバーハングを遊離させることになる。得られるsiRNA様二重鎖(これにはミスマッチがあってもよい)は、成熟miRNAとmiRNA*として知られる同様のサイズの断片を含む。miRNAおよびmiRNA*は、プリmiRNAおよびプレmiRNAの向かい合うアームに由来するものでもよい。miRNA*の配列はクローニングされたmiRNAのライブラリーに見出される場合があるが、通常はmiRNAよりも低い頻度である。
【0042】
最初はmiRNA*と共に二本鎖の種として現れるが、最終的には、miRNAは一本鎖RNAとして、RNA誘導サイレンシング複合体(RISC)として知られるリボヌクレオタンパク質複合体内に組み込まれてもよい。種々のタンパク質がRISCを形成することができ、その結果miRNA/miRNA*二重鎖についての特異性、標的遺伝子の結合部位、miRNAの活性(抑制または活性化)、miRNA/miRNA*二重鎖のどちらの鎖がRISC内に取り込まれるか、という点での多様性がもたらされる。
【0043】
miRNA:miRNA*二重鎖のmiRNAの鎖がRISC内に取りこまれる時、miRNA*は取り除かれ、分解されることになる。RISC内に取りこまれるmiRNA:miRNA*二本鎖の鎖は、その5’末端の対形成がより緩い鎖であってもよい。miRNA:miRNA*の両末端における5’対形成がほぼ等しい場合、miRNAおよびmiRNA*の両者は遺伝子サイレンシング活性を有する場合がある。
【0044】
miRNAとmRNAとの間の相補性が高いレベルであることに基づいて、特にmiRNAの2−8のヌクレオチドによって、RISCは標的核酸を同定する場合がある。miRNAとその標的との間の相互作用がmiRNAの全長にわたっているケースは、動物については一つのケースが報告されたのみである。このことは、mir−196およびHox B8について示されており、さらにmir−196がHox B8 mRNAの切断を媒介することが示された(Yekta et al 2004, Science 304−594)。それ以外では、このような相互作用は植物においてのみ知られている(Bartel and Bartel 2003, Plant Physiol 132−709)。
【0045】
翻訳の効果的な阻害を実現するために、多数の研究によってmiRNAおよびそのmRNA標的の間の塩基対形成に必要な条件が考察されてきた(reviewed by Bartel 2004, Cell 116−281)。哺乳動物の細胞においては、miRNAの最初の8ヌクレオチドが重要となりうる(Doench and Sharp 2004 GenesDev 2004−504)。しかしながら、マイクロRNAのその他の部分もまた、mRNAの結合に参加しうる。さらに、3’における十分な塩基対形成によって、5’における不十分な対形成を補うことができる(Brennecke at al, 2005 PLoS 3−e85)。ゲノム全体に関するmiRNAの結合を解析するコンピュータを用いた研究から、miRNAの5’における塩基2−7についての、標的との結合における特異的な役割が示唆されたが、最初のヌクレオチド(通常は「A」)の役割も認識された(Lewis et at 2005 Cell 120−15)。同様に、Krekら(2005, Nat Genet 37−495)は、ヌクレオチド1−7または2−8を用いて標的の同定および検証を行った。
【0046】
mRNAにおける標的部位は5’UTR、3’UTRまたはコード領域に存在しうる。興味深いことに、複数のmiRNAが同一の部位または複数の部位を認識することによって、同一の標的mRNAを調節しうる。多数のmiRNA相補性部位が、遺伝学的に同定されたほとんどの標的内に存在することは、複数のRISCの協同的な作用が最も効率的に翻訳を阻害することを示唆しうる。
【0047】
miRNAは、2つのメカニズム:mRNAの切断または翻訳の抑制のいずれかによって、RISCが遺伝子発現を下方調節するように導くと考えられる。mRNAがmiRNAに対する相補性をある程度有する場合、miRNAはmRNAの切断を指定しうる。miRNAが切断を導く場合、その切断はmiRNAの残基10と11と対を形成するヌクレオチド間で生じうる。あるいは、miRNAがmiRNAに対する相補性を必要な程度有していない場合、miRNAは翻訳を抑制しうる。翻訳の抑制は、動物においてより一般的である。というのは、動物の有する相補性はより低いものでありえるからである。
【0048】
miRNAとmiRNA*との任意の対において、5’−末端および3’−末端で可変性が存在しうることに留意すべきである。この可変性は、切断部位に関しての、ドローシャおよびダイサーの酵素的なプロセシングにおける可変性によるものでありうる。miRNAおよびmiRNA*の5’−末端および3’−末端における可変性も、プリmiRNAおよびプレmiRNAのステムの構造におけるミスマッチによるものでもありうる。ステムの鎖のミスマッチは、異なるヘアピン構造の集団を導きうる。ステムの構造における可変性も、ドローシャおよびダイサーによる切断の生成物における可変性を導きうる。
【0049】
3.核酸
本発明は、配列番号:1−760616において言及されるヌクレオチド配列、表10に記載された配列および表17に記載された配列またはその変異体を含む単離された核酸に関する。この変異体は、引用されたヌクレオチド配列の相補体でもよい。この変異体はさらに、引用されたヌクレオチド配列またはその相補体と実質的に同一なヌクレオチド配列でもよい。この変異体はさらに、引用されたヌクレオチド配列、その相補体またはそれと実質的に同一なヌクレオチド配列と、ストリンジェントな条件下でハイブリダイズするヌクレオチド配列でもよい。
【0050】
核酸は、10〜100ヌクレオチドの長さを有してもよい。核酸は、少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80または90ヌクレオチドの長さを有してもよい。核酸は、合成品でもよく、または下記の合成遺伝子を用いて、細胞(インビトロまたはインビボ)で発現させたものでもよい。核酸は一本鎖分子として合成し、そして実質的に相補的な核酸とハイブリダイズさせて二重鎖を形成させてもよい。このものも本発明の核酸とみなされる。核酸は一本鎖の形状または二本鎖の形状で、細胞、組織または器官に導入してもよく、米国特許第6,506,559号(これは引用として組み込まれる)に記載されたもの等を含む当業者に周知の方法を用いて合成遺伝子により発現可能であっても良い。
【0051】
a.プリmiRNA
本発明の核酸は、プリmiRNAまたはその変異体の配列を含んでもよい。プリmiRNAの配列は、45−250、55−200、70−150または80−100のヌクレオチドを含んでもよい。プリmiRNAの配列は、下記のプレmiRNA、miRNAおよびmiRNA*を含んでもよい。プリmiRNAはさらに、miRNAまたはmiRNA*およびその相補体ならびにその変異体を含んでもよい。プリmiRNAは、少なくとも19%のアデノシンヌクレオチド、少なくとも16%のシトシンヌクレオチド、少なくとも23%のチミンヌクレオチドおよび少なくとも19%のグアニンヌクレオチドを含んでもよい。
【0052】
プリmiRNAはヘアピン構造を形成してもよい。ヘアピンは、実質的に相補的な第1の核酸配列および第2の核酸配列を含んでもよい。第1の核酸配列および第2の核酸配列は37−50のヌクレオチドであってもよい。第1の核酸配列および第2の核酸配列は、8−12のヌクレオチドの第3の配列によって分けられていてもよい。ヘアピン構造は、Hofacker et al., Monatshefte f. Chemie 125: 167−188 (1994)(その内容は本明細書に組み込まれる)に記載されるようにViennaアルゴリズムを初期設定のパラメータで計算したとき−25Kcal/mole未満の自由エネルギーを有していてもよい。ヘアピンは、4−20、8−12または10ヌクレオチドの末端ループを含んでもよい。
【0053】
プリmiRNAの配列は、表1において言及されるヘアピン配列、表10の配列識別子6757248−6894882の配列、表17の配列識別子1−6318もしくは18728−18960の配列またはその変異体を含んでもよい。
【0054】
b.プレmiRNA
本発明の核酸はさらに、プレmiRNAまたはその変異体の配列を含んでもよい。プレmiRNAの配列は、45−90、60−80または60−70のヌクレオチドを含んでもよい。プレmiRNAの配列は、下記のmiRNAおよびmiRNA*を含んでもよい。プレmiRNAはさらに、miRNAまたはmiRNA*およびその相補体ならびにその変異体を含んでもよい。プレmiRNAの配列はさらに、プリmiRNAの5’−末端および3’−末端から0−160のヌクレオチドを除いたプリmiRNAの配列であってもよい。
【0055】
プレmiRNAの配列は、表1において言及されるヘアピン配列、表10の配列識別子6757248−6894882の配列、表17の配列識別子1−6318もしくは18728−18960の配列またはその変異体を含んでもよい。
【0056】
c.miRNA
本発明の核酸はさらに、miRNA、miRNA*またはその変異体の配列を含んでもよい。miRNAの配列は、13−33、18−24または21−23のヌクレオチドを含んでもよい。miRNAの配列は、プレmiRNAの最初の13−33ヌクレオチドであってもよい。miRNAの配列は、プレmiRNAの最後の13−33ヌクレオチドであってもよい。
【0057】
miRNAの配列は、表1において言及されるmiRNAの配列、表10の配列識別子1−117750もしくは6894883−10068177の配列、表17の配列識別子6319−18727もしくは18961−19401の配列またはその変異体を含んでもよい。
【0058】
d.アンチmiRNA
本発明の核酸はさらに、miRNAまたはmiRNA*の活性を阻害可能なアンチmiRNAの配列を含んでもよい。アンチmiRNAは、全体で5−100または10−60ヌクレオチドを含んでもよい。また、アンチmiRNAは全体で少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25または26ヌクレオチドを含んでもよい。アンチmiRNAの配列は、(a)miRNAの5’と実質的に同一である少なくとも5ヌクレオチド、および当該miRNAの5’−末端からの標的部位のフランキング領域と実質的に相補的である少なくとも5−12ヌクレオチド、あるいは(b)miRNAの3’と実質的に同一な少なくとも5−12ヌクレオチド、および当該miRNAの3’−末端からの標的部位のフランキング領域と実質的に相補的な少なくとも5ヌクレオチドを含んでもよい。
【0059】
アンチmiRNAの配列は、表1において言及されるmiRNAの配列、表10の配列識別子1−117750もしくは6894883−10068177の配列、表17の配列識別子6319−18727もしくは18961−19401の配列またはその変異体の相補体を含んでもよい。
【0060】
e.標的の結合部位
本発明の核酸は、標的miRNA結合部位の配列またはその変異体を含んでもよい。標的部位の配列は、全体で5−100または10−60のヌクレオチドを含んでもよい。標的部位の配列は、表4において言及される標的遺伝子結合部位の配列、表10の配列識別子117751−6757247の配列、またはその変異体、の少なくとも5ヌクレオチドを含んでもよい。
【0061】
4.合成遺伝子
本発明はさらに、転写および/または翻訳の調節配列に作動可能に結合した本発明の核酸を含む合成遺伝子に関する。この合成遺伝子は、本発明の核酸への結合部位を伴う標的遺伝子の発現を改変可能であってもよい。標的遺伝子の発現は、細胞、組織または器官の中で変更されても良い。合成遺伝子は合成されたものでもよく、または標準的な組み換え技術によって、天然の遺伝子から誘導されたものでもよい。合成遺伝子はさらに、合成遺伝子の配列の転写単位の3’−末端において、ターミネーターを含んでもよい。合成遺伝子はさらに、選択マーカーを含んでもよい。
【0062】
5.ベクター
本発明はさらに、本発明の合成遺伝子を含むベクターに関する。ベクターとしては発現ベクターでよい。発現ベクターは追加的要素を含んでもよい。たとえば、発現ベクターは、2つの生物体内で、たとえば発現のための哺乳動物の細胞または昆虫細胞において、そしてクローニングおよび増幅のための原核生物の宿主において、ベクターを維持させることができる2つの複製系を有してもよい。発現ベクターを組み込むために、発現ベクターは、宿主細胞のゲノムと相同な少なくとも1つの配列、好ましくは発現構築物に隣接する2つの相同な配列を含んでもよい。ベクターの組み込みは、ベクター内に含ませる適切な相同配列を選択することによって、宿主細胞内の特定の座に向けてもよい。ベクターは、形質転換された宿主細胞の選択を可能とする選択マーカー遺伝子を含んでもよい。
【0063】
6.宿主細胞
本発明はさらに、本発明のベクターを含む宿主細胞に関する。この細胞は、細菌、菌類、植物、昆虫または動物細胞であってよい。
【0064】
7.プローブ
本発明はさらに、本発明の核酸を含むプローブに関する。下記に概要を示すように、スクリーニング方法および診断方法のためにプローブを用いてもよい。プローブは固体担体、たとえばバイオチップに連結してもよく、または固定化してもよい。
【0065】
プローブは、8〜500、10〜100または20〜60のヌクレオチド長を持つものでよい。プローブはさらに、少なくとも8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280または300のヌクレオチド長を持つものでよい。プローブは、10−60ヌクレオチドのリンカー配列をさらに含んでもよい。
【0066】
8.バイオチップ
本発明はさらにバイオチップに関する。バイオチップは、単数または複数の本発明のプローブが連結された固体担体を含んでもよい。プローブは、ストリンジェントなハイブリダイゼーション条件下で標的配列とハイブリダイズ可能でもよい。このプローブは、担体上の空間的に定められたアドレスに連結されてもよい。標的配列あたり1を超えるプローブを用いてもよく、重複するプローブまたは特定の標的配列の異なる区域に対するプローブのいずれかでもよい。プローブは、単独の疾患に関連する標的配列とハイブリダイズ可能でもよい。
【0067】
当業者が理解できるように、多種多様の方法によって、バイオチップにプローブを連結してもよい。プローブは、最初に合成して次いでバイオチップに連結してもよく、またはバイオチップ上で直接合成してもよい。
【0068】
固体担体は、プローブの連結または結合に適する個別の独立した部位を含むように改変された材料であって、そして少なくとも1つの検出方法によく反応する材料であってよい。担体の代表的な例としては、たとえば、ガラスおよび修飾されたかまたは機能が付与されたガラス、プラスチック(アクリル、ポリスチレンおよびスチレンとその他の材料とのコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、TeflonJなどを含む)、多糖、ナイロンまたはニトロセルロース、樹脂、シリカまたはケイ素および改変されたケイ素、炭素、金属、無機ガラスおよびプラスチックを含むシリカベースの材料が挙げられる。担体としては、感知できる程度の蛍光を伴わずに光学的な検出が可能なものでもよい。
【0069】
担体は平面でよいが、その他の構造の担体も同様に用いてもよい。たとえば、試料の体積を最小限に抑える目的で、貫流する試料用に、チューブの内壁面にプローブを設置してもよい。同様に、担体は柔軟なものでもよく、たとえば柔軟な発泡体、特定のプラスチックから作られるクローズドセル発泡体が含まれる。
【0070】
バイオチップおよびプローブを、それらを後で連結するための官能基で誘導体化してもよい。たとえば、これらに制限されるわけではないが、アミノ基、カルボキシル基、オキソ基またはチオール基を含む官能基で、バイオチップを誘導体化してもよい。これらの官能基を用いることで、直接的にまたは間接的にリンカーを利用して、プローブ上の官能基を用いてプローブを連結してもよい。5’−末端、3’−末端または内部ヌクレオチドを介することのいずれかによって、プローブを固体担体に連結してもよい。
【0071】
さらに、固体担体に非共有的にプローブを連結してもよい。たとえば、ビオチン化オリゴヌクレオチドを作製することができ、これはストレプトアビジンで共有的にコートされた表面に結合してもよく、結果的に連結が達成される。あるいは、光重合およびフォトリソグラフィーなどの技術を用いて、表面上でプローブを合成してもよい。
【0072】
9.miRNAの発現の分析
本発明はさらに、生物学的試料を本発明のプローブまたはバイオチップと接触させること、およびハイブリダイゼーションの量を検出することを含む、疾患すなわち病的な状態に関連するmiRNAを同定する方法に関する。PCRを用いて試料中の核酸を増幅してもよく、これにより高い感度が得られる。
【0073】
病的な細胞内でコントロールと比べて過剰に発現されるかまたは過少に発現されるmiRNAを同定する能力により、診断、治療、薬剤の開発、薬理遺伝学、バイオセンサーの開発分野およびその他の関連の分野において用いられ得る高解像度で高感度なデータセットを提供することができる。現在の方法によって作られる発現プロフィールは、多数のmiRNAに関する試料の状態の「フィンガープリント」であってよい。2つの状態は同様に発現される任意の特定miRNAを有し得るが、多数のmiRNAを同時に評価することによって、その細胞の状態に特徴的な遺伝子発現プロフィールの作製が可能となる。すなわち、正常な組織を疾患組織と区別することができる。既知の種々の病状における組織の発現プロフィールを比較することによって、いずれのmiRNAがこれらの状態の各々と関連しているかについての情報を得ることができる。次いで、組織試料が正常組織の発現プロフィールを示すかあるいは疾患組織の発現プロフィールを示すか決定するために、診断を実施または確認してもよい。これにより、関連する状態の分子診断が提供され得る。
【0074】
10.発現レベルの測定
本発明はさらに、生物学的試料を本発明のプローブまたはバイオチップと接触させること、およびハイブリダイゼーションの量を測定することを含む、疾患に関連するmiRNAの発現レベルを決定する方法に関する。疾患に関連するmiRNAの発現レベルは、多数の方法における情報である。たとえば、コントロールと比較したときの疾患に関連するmiRNAの差別的発現を、患者がその疾患を患っていることの診断として利用してもよい。疾患に関連するmiRNAの発現レベルを利用して、患者の治療と病状を監視してもよい。さらに、疾患に関連するmiRNAの発現レベルによって、特定の発現プロフィールを変化させるか、または疾患に関連する発現プロフィールを抑制するための薬剤の候補物をスクリーニングすることが可能になりうる。
【0075】
標的核酸を含む試料を、標的核酸に十分に相補的な、連結されたプローブを含むバイオチップと接触させること、およびコントロールのレベルを超えたプローブとのハイブリダイゼーションを検出することにより、標的核酸を検出してもよい。
【0076】
調査する核酸をナイロンメンブレンなどの固体担体上に固定化すること、および標識化プローブを試料とハイブリダイズさせることにより、標的核酸を検出してもよい。同様に、標識化プローブを固体担体に固定化すること、および標識化された標的核酸を含む試料をハイブリダイズさせることによって、標的の核酸を検出してもよい。非特異的なハイブリダイゼーションを排除するために洗浄した後、標識を検出してもよい。
【0077】
透過化処理を行った細胞または組織の試料を標識化プローブと接触させることにより、標的核酸とハイブリダイゼーションさせ、in situで標的核酸を検出してもよい。非特異的に結合したプローブを排除するために洗浄した後、標識を検出してもよい。
【0078】
これらのアッセイは直接的なハイブリダイゼーションアッセイとなり得、または米国特許番号第5,681,702号;第5,597,909号;第5,545,730号;第5,594,117号;第5,591,584号;第5,571,670号;第5,580,731号;第5,571,670号;第5,591,584号;第5,624,802号;第5,635,352号;第5,594,118号;第5,359,100号;第5,124,246号;および第5,681,697号(これらは各々引用として組み込まれる)に概説されるように、多数のプローブの使用を伴うサンドイッチアッセイを含んでも良い。
【0079】
上記で概要するように、高度、中程度のおよび低度のストリンジェンシー条件を含めた種々のハイブリダイゼーション条件を用いてもよい。プローブが標的のみとハイブリダイゼーションできるようなストリンジェンシーの条件下で、これらのアッセイを実施してもよい。これらに制限されるわけではないが、温度、ホルムアミドの濃度、塩濃度、カオトロピック性の塩の濃度、pHまたは有機溶媒の濃度を含めた熱力学変数である工程のパラメータを変化させることによって、ストリンジェンシーをコントロールすることができる。
【0080】
種々の方法によって、ハイブリダイゼーション反応を達成してもよい。反応の構成要素を同時に添加してもよく、または異なる順序で連続的に添加してもよい。さらに、この反応にはその他の種々の試薬が含まれ得る。これらには、塩、緩衝剤、アルブミンなどの中性タンパク質、界面活性剤などが挙げられ、これらを用いて最適なハイブリダイゼーションおよび検出を促進したりおよび/または非特異的なもしくはバックグラウンドの相互作用を減少させてもよい。試料の調製方法および標的の純度に合わせて、別の方法でアッセイの効率を改善する試薬、たとえばプロテアーゼインヒビター、ヌクレアーゼインヒビターおよび抗菌剤などを適宜用いてもよい。
【0081】
a.診断
本発明はさらに、生物学的試料中での疾患に関連するmiRNAの差別的発現のレベルを検出することを含む診断の方法に関する。その試料は患者に由来するものでもよい。患者の病状の診断によって、予後診断および治療計画の選択が可能になる。さらに、細胞の発達段階を、一時的に発現したmiRNA分子を測定することによって分類してもよい。
【0082】
標識化プローブの組織アレイへのin situハイブリダイゼーションを実施してもよい。個体と標準との間のフィンガープリントを比較することで、当業者であればその知見に基づいて診断、予後診断または予測を行うことができる。診断を示唆する遺伝子は、予後診断を示唆する遺伝子とは相違していてもよいこと、および細胞の状態についての分子プロファイルによって反応性状態もしくは難治性の状態との間で区別がなされ、またそれにより結果を予想できることがさらに理解される。
【0083】
b.薬剤のスクリーニング
本発明はさらに、疾患に関連するmiRNAを発現し得る病的な細胞と、治療薬の候補とを接触させること、および薬剤の候補物が疾患に関連するmiRNAの発現プロフィールに与える影響を評価することを含む、治療薬のスクリーニング方法に関する。差別的に発現されたmiRNAが同定されることで、種々のアッセイを実行することができる。疾患に関連するmiRNAの遺伝子発現を調節する能力について、試験化合物をスクリーニングしてもよい。調節には、遺伝子発現を増加させることおよび減少させることの両方が含まれる。
【0084】
試験化合物あるいは薬剤候補物は、疾患の表現型または疾患に関連するmiRNAの発現を直接的にまたは間接的に変化させる能力についてテストを行う任意の分子、たとえばタンパク質、オリゴペプチド、小有機分子、多糖、ポリヌクレオチドなどであってよい。薬剤の候補物には、無数の化学薬品の部類、たとえば100ダルトンを超え、約500、1,000、1,500、2,000または2,500ダルトン未満の分子量を持つ小有機分子が包含される。候補化合物はタンパク質との構造上の相互作用、特に水素結合の形成、に必須の官能基を含んでもよく、典型的には少なくとも1つのアミン基、カルボニル基、ヒドロキシル基またはカルボキシル基、好ましくは少なくとも2つの前記官能化学基を含む。候補薬剤は、上記の官能基の1つ以上で置換された、炭素の環状構造または複素環構造および/または芳香族構造または多環芳香族構造を含んでもよい。候補薬剤はさらに、ペプチド、糖類、脂肪酸、ステロイド、プリン、ピリミジン、誘導体、構造的アナログまたはその組み合わせを含む生体分子の間に見出される。
【0085】
疾患に関連するmiRNAに対する結合能力またはその活性の調節能力について、潜在的なモジュレーターのコンビナトリアルライブラリーをスクリーニングしてもよい。コンビナトリアルライブラリーは、試薬などの多数の化学的構成物を組み合わせることによる化学合成または生合成のいずれかによって作られた様々な化合物の集合体であってもよい。コンビナトリアルケミカルライブラリーの調製法およびスクリーニング法は、当業者にとって周知である。このようなコンビナトリアルケミカルライブラリーとしては、ペプチドをコードするペプチドライブラリー、ベンゾジアゼピン、ヒダントイン、ベンゾジアゼピンおよびジペプチド等のダイバーソマー、ビニル性のポリペプチド、小化合物ライブラリーのアナログ有機合成、オリゴカルバミン酸塩および/またはペプチジルホスホン酸塩、核酸ライブラリー、ペプチド核酸ライブラリー、抗体ライブラリー、炭水化物ライブラリー、および小有機分子ライブラリーが挙げられるが、これらに制限されるものではない。
【0086】
11.遺伝子サイレンシング
本発明はさらに、本発明の核酸を用いて細胞、組織または器官内の標的遺伝子の発現を減少させる方法に関する。標的mRNAの1つ以上の結合部位と実質的に相補的な配列を含む本発明の核酸を発現させることにり、標的遺伝子の発現を減少させてもよい。核酸はmiRNAでもよく、またはその変異体でもよい。核酸はさらに、プリmiRNA、プレmiRNAまたはその変異体でもよく、これらはプロセシングを受けてmiRNAを生じさせうる。発現したmiRNAは、標的mRNA上にある実質的に相補的な結合部位とハイブリダイズしてもよい。これにより、RISC介在性の遺伝子サイレンシングの活性化が導かれうる。miRNAの過剰発現を利用した研究についての一例はYekta et al 2004, Science 304−594であり、これは引用として本明細書に組み込まれる。当業者であれば、本発明の核酸を用い、本技術分野において周知のアンチセンス法、ならびに米国特許第6,506,559号および第6,573,099号(これらは引用によって取り込まれる)に記載のRNAi法を利用して標的遺伝子の発現を阻害してもよいことを認識するだろう。
【0087】
遺伝子サイレンシングの標的は、第2のタンパク質のサイレンシングを引き起こすタンパク質であってもよい。標的遺伝子の発現を抑制することにより、第2のタンパク質の発現が促進されるだろう。miRNA発現を効果的に抑制する例は、Esau et al 2004 JBC 275−52361; and Cheng et al 2005 Nucleic Acids Res. 33−1290による研究であり、これらは引用として本明細書に組み込まれる。
【0088】
12.遺伝子の増強
本発明はさらに、本発明の核酸を用いて細胞、組織または器官内の標的遺伝子の発現を増加させる方法に関する。プリmiRNA、プレmiRNA、miRNAまたはその変異体と実質的に相補的な配列を含む本発明の核酸を発現させることにより、標的遺伝子の発現を増加させてもよい。核酸はアンチmiRNAでもよい。アンチmiRNAはプリmiRNA、プレmiRNAまたはmiRNAとハイブリダイズしてもよく、それによりその遺伝子の抑制活性を減少させる。標的遺伝子の発現も、標的遺伝子内の結合部位の一部分に実質的に相補的な本発明の核酸を発現させることにより増加させてもよく、それによる核酸の結合部位への結合がmiRNAの結合を妨害することになるだろう。
【0089】
13.治療
本発明はさらに、本発明の核酸を、ガンなどの疾患または機能障害の進行に関連する障害のモジュレーターまたは標的として用いる方法に関する。一般的に、請求の範囲の核酸分子を、当該核酸に少なくとも部分的に相補的な遺伝子の発現モジュレーターとして用いてもよい。さらに、miRNA分子は、治療のためのスクリーニング手段の標的として機能してもよい。たとえばmiRNA分子の阻害または活性化は、細胞の分化プロセス、たとえばアポトーシスを調節しうる。
【0090】
さらに、既存のmiRNA分子を、その標的特異性を改変するために、配列が改変されたmiRNA分子を製造するための出発物質として用いてもよい。たとえば、腫瘍遺伝子、多剤耐性遺伝子またはその他の治療目的の標的遺伝子がある。さらに、プロセシングを受け、次いで二本鎖のsiRNAとして生じさせ、治療上関連する標的に対して指向付けられるようにするために、miRNA分子を改変することができる。さらに、組織を再度作り変える手段のためにmiRNA分子を用いてもよく、たとえば、分化した細胞系は、miRNA分子の発現によって異なる細胞タイプまたは幹細胞に形質転換する場合がある。
【0091】
14.組成物
本発明はさらに、本発明の核酸を含み、薬理学的に許容され得る担体を必要に応じて含む薬理学組成物に関する。この組成物を診断または治療の用途に用いてもよい。既知の方法によって薬理学組成物を投与すればよく、たとえば核酸を所望の標的細胞にインビトロまたはインビボで導入する。一般的に用いられる遺伝子導入技術としては、リン酸カルシウム、DEAE−デキストラン、エレクトロポレーション、マイクロインジェクション、ウイルス法およびカチオン性リポソームが挙げられる。
15.キット
本発明はさらに、次のもののいずれかまたはすべてのものと一緒に、本発明の核酸を含むキットに関する:アッセイ用試薬、緩衝剤、プローブおよび/またはプライマー、および滅菌食塩水またはその他の薬理学的に許容され得るエマルション基剤およびサスペンション基剤。さらに、このキットは、本発明の方法を実施するための指示書を含む指導用資料(たとえばプロトコール)を含んでもよい。
【実施例1】
【0092】
miRNAの予測
miRNAを予測するために、米国特許出願第60/522,459号、第10/709,577号および第10/709,572号(これらの内容は引用として本明細書に組み込まれる)に記載のものと類似のコンピュータを利用した2つのアプローチを用いて、潜在的なmiRNAコード遺伝子についてヒトの全ゲノムを調査した。簡潔に述べると、ヘアピン構造について、ヒトの全ゲノムの非タンパク質コード領域を走査した。予測したヘアピンおよび可能性があるmiRNAを、熱力学的安定性、ならびに構造上の特徴および文脈上の特徴によってスコア付けした。既に確認されているSangerデータベース内のmiRNAを用いることによって、このアルゴリズムを較正した。
【0093】
1.第1のスクリーニング
表11A〜表11Cでは、予測したmiRNA(「GAM NAME」)と共に、コンピュータを利用した第1のスクリーニングから予測したヘアピンの各々についての配列(「PRECURSOR SEQUENCE」)、配列識別子(「PRECUR SEQ−ID」)および起源の生物(「GAM ORGANISM」)を示す。表12では、起源の生物(「GAM ORGANISM」)およびDicer切断位置部位(「GAM POS」)と共に、各々のmiRNA(「GAM NAME」)についての配列(「GAM RNA SEQUENCE」)および配列識別子(「GAM SEQ−ID」)を示す。予測したヘアピンの配列およびmiRNAの配列も、表10に記載する。
【0094】
2.第2のスクリーニング
表1では、コンピュータを利用した第2のスクリーニングの予測した各々のヘアピン(「HID」)についての配列番号が列挙されている。表1では、各々のヘアピンについてのゲノムの位置(「Hairpin Location」)も列挙されている。ゲノムの位置についてのフォーマットは、<chr_id>(染色体番号)<strand>(鎖)<start position>(開始位置)の連結である。たとえば、19+135460000は、第19番染色体、+strand、開始位置135460000を意味する。第23番〜第25番染色体は、染色体X、染色体YおよびミトコンドリアDNAを意味する。染色体上の位置は、UCSC(http://genome.ucsc.edu)によるヒトゲノムのhg17アセンブリに基づくものであり、これはNCBI Build 35 version 1を基礎とし、International Human Genome Sequencing Consortium(国際ヒトゲノムシークエンシングコンソーシアム)によって作成された。
【0095】
表1では、進化の過程でヘアピンが保存されているか否か(「C」)についても列挙されている。ゲノム版の研究論文が存在するという選択肢がある。phastConsデータを用いることによって、これらのヘアピンを保存されたもの(「Y」)または保存されていないもの(「N」)として特定した。phastConsデータは、チンパンジー、マウス、ラット、イヌ、ニワトリ、カエルおよびゼブラフィッシュのゲノムに対しての、ヒトゲノムにおける各々のヌクレオチドについての進化における保存の指標であり、各々の種についてのBlastZに基づくベスト・イン・ゲノム・ペアー・ワイズ・(best−in−genome pair wise)アラインメントと、それに続く、8ゲノムのmultiZアラインメントとを用いるphylo−HMMに基づくものである(Siepel et al, J. Comput. Biol 11, 413−428, 2004 and Schwartz et al., Genome Res. 13, 103−107, 2003)。ヘアピンのステム内の任意の15ヌクレオチド配列において、7種に亘るphastCons保存スコアの平均が少なくとも0.9である場合、保存されたものとしてヘアピンが列挙されている(Berezikov,E. et al. Phylogenetic shadowing and Computational Identification of Human microRNA Genes. Cell 120, 21−24, 2005)。
【0096】
表1では、遺伝子間(「G」)、イントロン(「I」)またはエキソン(「E」)のいずれかとして、各々のヘアピンについてのゲノムのタイプ(「T」)も列挙されている。表1では、予測したmiRNAおよびmiRNA*の各々についての配列番号(「MID」)も列挙されている。表1では、Hofacker et al., Monatshefte f. Chemie 125: 167−188, 1994に記載されたように、0−1のスケール(1は、そのヘアピンが最も確実である)で、各々のヘアピン(「P」)についての予測スコアの評価も列挙されている。評価がゼロあるいは無の場合、そのp値が0.05未満であるようなより低い値のPalGradeに変換される。表1では、各々のPスコアの値について、バックグラウンドのヘアピンから計算したp値(「Pval」)も列挙されている。表中に示されるように、Pvalが0.05を超える例はほとんどない。これらのケースの各々において、ヘアピンは高度に保存され、あるいはこれらのヘアピンは有効であると検証された(F=Y)。
【0097】
表1では、表2に詳述されるように、発現の解析(「E」)によってmiRNAが有効とされたか否かも列挙されている(Y=有効、N=無効)。表1では、シークエンシング(「S」)によってmiRNAが有効とされたか否かについても列挙されている(Y=有効、N=無効)。予測したmiRNAとシークエンシングされたものとの間の配列に違いがあった場合、シークエンシングされた配列を予測する。miRNAのシークエンシングまたはその発現の検出ができないことは、miRNAが存在しないことを必ずしも意味するものではないことに留意すべきである。このような検出されないmiRNAは、このようなテストを受けた組織以外で発現する場合がある。さらに、このような検出されないmiRNAは、試験用の細胞の段階または条件とは異なる段階または条件にて、テスト組織で発現する場合がある。
【0098】
表1では、表2に詳述されるように、少なくとも1つの疾患において、miRNAが差別的に発現することが示された(「D」)か否か示されたことも列挙されている(Y=発現、N=未発現))。表1はまた、Sangerデータベース・リリース6.0(2005年4月)(http://nar.oupjournals.org/)において、miRNAがヒトもしくはマウスにおいて検出されたものとして、またはヒトにおいて予測したものとして、存在したか否か(「F」)(Y=存在、N=非存在)も列挙されている。上記で説明したように、Sangerデータベースに列挙されたmiRNAは予測アルゴリズムの構成要素であり、かつ出力についてのコントロールである。
【0099】
表1では、互いの5,000ヌクレオチドの距離内にあるヘアピンについての遺伝子のロケーション・クラスター(「LC」)も列挙されている。同一のLCを有する各々のmiRNAは、同一の遺伝子のクラスターを共有している。表1では、正確なマッチングによる2−7のシードによりmiRNAをグループ化するシード・クラスター(「SC」)も列挙されている。同一のSCを有する各々のmiRNAは同一のシードを有する。5ヌクレオチド長のシードについては、Lewis et al., Cell, 120; 15−20 (2005)が参照できる。
【実施例2】
【0100】
標的遺伝子の予測
次いで、コンピュータを利用した実施例1の2つのスクリーニングから予測したmiRNAを用い、そしてmiRNAを予測するための米国特許出願第60/522,459号、第10/709,577号および第10/709,572号(これらの内容は引用として本明細書に組み込まれる)に記載のものと類似のコンピュータを利用した2つのアプローチを用いて、標的遺伝子およびそれらの結合部位を予測した。
1.第1のスクリーニング
表13A〜表13Cでは、コンピュータを利用した第1のスクリーニングから予測した標的遺伝子(「TARGET」)および結合部位配列(「TARGET BINDING SITE SEQUENCE」)ならびに結合部位の配列識別子(「TARGET BINDING SITE SEQ−ID」)、ならびに標的の起源の生物(「TARGET ORGANISM」)が列挙されている。表14では、標的遺伝子に関連する疾患(「DISEASE NAME」)が列挙されている(「TARGET−GENES ASSOCIATED WITH DISEASE」)。表15では、miRNA(「SEQ ID NOs OF GAMS ASSOCIATED WITH DISEASE」)についての配列識別子および標的遺伝子に基づくmiRNAに関連する疾患(「DISEASE NAME」)も列挙されている。結合部位配列の配列も表10に記述されている。
【0101】
2.第2のスクリーニング
表4では、コンピュータを利用した第2のスクリーニングから予測した各々のmiRNA(MID)およびそのヘアピン(HID)についての標的遺伝子が列挙されている。標的遺伝子の名称は、NCBI Reference Sequence・リリース9(http://www.ncbi.nlm.nih.gov; Pruitt et al., Nucleic Acids Res, 33(1): D501−D504, 2005; Pruitt et al., Trends Genet., 16(1): 44−47, 2000; and Tatusova et al., Bioinformatics, 15(7−8): 536−43, 1999)から得た。7ヌクレオチドのmiRNAシード(位置2−8)とUTR上のA(総数=8ヌクレオチド)と完全に相補的マッチングすることによって、標的遺伝子を同定した。標的遺伝子を同定することについては、Lewis et al., Cell, 120: 15−20, (2005)が参照できる。miRNAがUTRに結合するのに十分であるシードについては、Lim Lau et al., (Nature 2005) and Brenneck et al, (PLoS Biol 2005)が参照できる。
【0102】
次いで、最少30ヌクレオチドのUTRを含む標的遺伝子のみを含むことに従ってフィルターをかけられた標的遺伝子のデータセットを用いて、結合部位を予測した。結合部位のスクリーニングでは、UTR毎最初の4000ヌクレオチドのみを考慮し、遺伝子あたりいくつかの転写物が存在する場合、最も長い転写物を考慮した。フィルターをかけることによって、転写物の総数が23626から14239に減少した。表4では、各々の標的遺伝子に関して、予測した結合部位についての配列番号が列挙されている。結合部位の配列はスプライスされたmRNA上にあるため、この配列は結合部位の5’および3’の20ヌクレオチドを含む。予測した結合部位を1つしか有さないmiRNAまたは有効であるとされたmiRNAを除き、表4のデータは、少なくとも2結合部位を含む標的遺伝子のみを示すようにフィルターがかけられた。
【0103】
表5は、それらの標的遺伝子によりmiRNA(「MID」)/ヘアピン(「HID」)と疾患との間の関係を示す。疾患の名称は、OMIMから得る。ヘアピンがその上に位置するホスト遺伝子を疾患に位置結びつける根拠については、Baskerville and Bartel, RNA, 11: 241−247 (2005) and Rodriguez et al., Genome Res., 14: 1902−1910 (2004)を参照できる。表5は、疾患に関連する標的遺伝子のmiRNAの数(「N」)を示す。表5はさらに、疾患に関連する遺伝子の総数(「T」)を示し、これはmiRNAへの結合部位を有すると予測された遺伝子から得られた。表5はさらに、T中におけるNのパーセンテージと、超幾何学的解析(「Pval」)のp値とを示す。表8は、表5および表6についての疾患の符号を示す。超幾何学的解析の参考文献としては、Schaum’s Outline of Elements of Statistics II: Inferential Statisticsが参照できる。
【0104】
表6は、ホスト遺伝子によりmiRNA(「MID」)/ヘアピン(「HID」)と疾患との間の関係を示す。ホスト遺伝子の相補鎖上のヘアピン遺伝子を、その遺伝子上に位置するものとして規定した:イントロンとしてIntron_cおよびエキソンとしてExon_c。相補鎖が疾患を引き起こし得るため相補鎖を選択する。たとえば、相補鎖上に位置するmiRNAにおける突然変異である。miRNAが両鎖上にあるというケースにおいて、イントロンとExon_cの場合のような2つの状況では、イントロンが第1に選択される。選択の理論は、Intron>Exon>Intron_c>Exon_c>遺伝子間、である。表9は、標的配列(「Gene Name」)と疾患(「Disease Code」)との間の関係を示す。
【実施例3】
【0105】
miRNAの検証
1.発現の解析−セット1
0において予測したヘアピンおよびmiRNAを確認するために、米国特許出願第60/522,459号、第10/709,577号および第10/709,572号(これらの内容は引用として本明細書に組み込まれる)に記載のものと類似の高スループットマイクロアレイを用いて、種々の組織における発現を検出した。予測した各々の前駆体miRNAについて、ヘアピンの両方のステムに由来する成熟miRNAをテストした。
【0106】
表2は、関連するmiRNA(「MID」)の発現を検出することによって検証された第2の予測セットのヘアピン(「HID」)、ならびに発現が検出された組織についての符号(「Tissue」)を示す。表2についての組織および疾患の符号を表7に列挙する。テストされた組織のいくらかは細胞系であった。P53を有する/有しない肺ガンの細胞系(H1299):H1299は突然変異を伴うP53を有する。この細胞系は、温度感受性(32℃で活性化)のP53を伴う構築物で形質移入された。この試験は32℃で実施した。
【0107】
表2はさらに、チップ発現スコアの評価(500−65000の範囲)を示す。500のしきい値を用いて、有意でないシグナルを除外し、異なる試験からのMirChipプローブのシグナルによってスコアを標準化した。試験間の蛍光物質の強度のばらつきは、RNA調製または標識化効率における変動による場合がある。各々の試料におけるmiRNAの総量は比較的一定であるという仮説に基づいて標準化した。最初に各々のプローブの生のシグナルからバックグラウンドシグナルを引いた。ここでバックグラウンドシグナルは400と規定している。次いで各々のmiRNAプローブのシグナルをすべてのmiRNAのシグナルの平均で割り、その結果を10000倍してバックグラウンドシグナルの400を加えた。このように規定することにより、各々の試験におけるすべてのmiRNAプローブのシグナルの総和は10400である。
【0108】
表2はさらに、標準化されたスコアに基づいて計算された、標準化されたシグナル(「Spval」)の統計的解析を示す。各々のmiRNAについて、予測したmiRNAの完全なリストから該当するコントロール群を用いた。各々のmiRNAは、ミスマッチを伴うプローブの内部コントロールを有する。類似のTmを有するために、関連するコントロール群は、類似のCおよびGパーセンテージを伴うプローブ(絶対的相違<5%)を含んでいた。プローブシグナルのp値は、同一のまたはより高いシグナルを有する関連するコントロール群のプローブと比較した比率である。その結果は、p値が0.05以下で、スコアが500を超えるというものである。SPVaIが0.0として記入されるケースでは、その値は0.0001未満である。
【0109】
2.発現の解析−セット2
0において予測したヘアピンおよびmiRNAをさらに確認するために、別の組織における発現を検出した。表16では、次のものによるmiRNAの発現のデータが列挙されている:HID:表17に記載された配列についてのヘアピンの配列識別子;MID:表17に記載された配列についてのmiRNAの配列識別子;Tissue:テストされた組織;S:チップ発現スコアの評価(範囲=100−65000);Dis. Diff. Exp.:疾患に関連する差別的発現およびテストが行われた組織;R:疾患に関連する発現の比率(範囲=0.01−99.99);ならびに略号:Brain Mix A−アルツハイマー病に罹患した脳組織の混合物;Brain Mix B−すべての脳組織の混合物;ならびにBrain SN−黒質。
【0110】
3.シークエンシング
第2の予測のヘアピン(「HID」)をさらに検証するために、米国特許出願第60/522,459号、第10/709,577号および第10/709,572号(これらの内容は引用として本明細書に組み込まれる)に記載のものと類似のシークエンシング法によって多数のmiRNAを検証した。表3は、示された組織(「Tissue」)におけるmiRNA(MID)をシークエンシングすることによって検証されたヘアピン(「HID」)を示す。
【実施例4】
【0111】
第19番染色体のmiRNA
実施例3から検証されたmiRNAの群は、胎盤で高度に発現し、顕著な配列類似性を有し、そして第19番染色体上の同一の座に位置する(図2)。これらの予測したmiRNAは、19q13.42座内の約100,000ヌクレオチドの範囲に亘って広がる。このゲノム領域はタンパク質をコードする遺伝子を欠き、遺伝子間にあるように思われる。我々の予測アルゴリズムの出力の詳細な検査を含むゲノム配列のさらなる解析によって、より多くの関連する推定miRNAがより多いこと、ならびにmir−371、mir−372およびmir−373がこの領域の約25,000bp下流に位置することが分かった。全体として、54の推定miRNA前駆体がこの領域内で同定された。これらのmiRNA前駆体を、4つの別個のタイプの関連配列に分けることができる(図2)。クラスター内のmiRNAの約75%は高度に関連しており、Aタイプと命名した。その他の3つのmiRNAのタイプ、つまりBタイプ、CタイプおよびDタイプは、各々4前駆体、2前駆体および2前駆体から成る。さらなる3種の推定miRNA前駆体(S1からS3)は関連性が無い配列を有する。興味深いことに、すべてのmiRNA前駆体は、隣接するmir−371、mir−372およびmir−373のmiRNA前駆体と同一の向きである。
【0112】
さらなる配列解析から、AタイプのmiRNAの大部分が、クラスター内で35回繰り返されている約600bpの領域内に埋め込まれていることが分かった。反復配列は、ゲノムのその他の領域には見られず、霊長類にのみ保存されている。ほとんどの場合、この反復単位はその上流と下流にAluリピートが結合している。このことは、Aluリピートがほとんど無いMC14−1クラスターとは際立って対照的である。
【0113】
図3−Aは、ヒトにおけるAタイプのmiRNA前駆体を含む35の反復単位の配列の比較を示す。この比較によって、最も高い配列類似性を示す2つの領域が特定された。1つの領域には、リピートの3’領域内に位置するAタイプのmiRNAが含まれる。第2の領域は、AタイプのmiRNA前駆体の約100ヌクレオチド上流に位置する。しかしながら、AタイプのmiRNA前駆体を含む領域はチンパンジーの反復単位の間で高い類似性を示すのに対して、第2の領域はそれを示さない(図3−B)。
【0114】
Aタイプのリピートを含む領域の調査から、前駆体(5p miRNA)の5’のステムにコードされたmiRNAの5’領域が、成熟miRNAのその他の領域よりも可変的であると考えられることが示唆された。このことは、3’のステム(3p miRNA)に由来する成熟miRNAの3’領域における可変性と一致する。予想されるように、ループ領域は可変性が高い。同一の事象は、43のすべてのAタイプのmiRNAの多重配列アラインメントでも見ることができる(図4)。
【0115】
図4にて示された多重配列アラインメントから、予測した成熟miRNAに関する次の発見が明らかになった。5p miRNAを3のブロックに分割することができる。ヌクレオチド1〜6はC/Tリッチであり、比較的可変性が高く、そしてほとんどのmiRNAにおけるヌクレオチド3〜5のCTCモチーフに特徴がある。ヌクレオチド7〜15はA/Gリッチであり、ヌクレオチド7および8以外は多くのmiRNA間で共有されている。ヌクレオチド16〜23はC/Tリッチであり、メンバーの間で再度保存されている。予測した3p miRNAは一般的に、そのファミリーのメンバー間でより高い保存性を示す。ほとんどのものはAAAモチーフで始まるが、少数は、異なる5’配列を有し、これは標的の認識に重要でありうる。ヌクレオチド8〜15はC/Tリッチであり、高い保存性を示す。最後の7ヌクレオチドはやや保存性が低いが、ほとんどのメンバーに共通するヌクレオチド17〜19内にGAGモチーフを含む。
【0116】
反復単位の5’領域の解析によって、ヘアピンの可能性があるものを特定した。しかしながら、ほとんどの反復単位において、これらのヘアピンは保存されておらず、そしてスコアが最も高いヘアピンからmiRNAをクローニングする努力は失敗に終わった。長い反復単位内では見つけられない8種のAタイプの前駆体が存在する。これらの前駆体の周囲の配列は、Aタイプの反復単位またはその他のどのゲノム配列に対する類似性も示さない。これらのAタイプの前駆体のうちの5種について、Aタイプの配列の下流で極めて近接する位置にAluリピートが存在する。
【0117】
クラスターにおけるその他のタイプのmiRNAから、次の特徴が示された。4つのB群のmiRNAが約500bpの反復領域内に見出され、そのうちの1つがそのクラスターの末端に位置する。2つのDタイプのmiRNA、これは相互に約2000ヌクレオチド離れている、はそのクラスターの先頭に位置し、1220ヌクレオチドの重複領域内に含まれる。興味深いことに、この2つのDタイプの前駆体は同一である。関連が無い配列の3つのmiRNAのうちの2つ、S1およびS2は、2つのDタイプのmiRNAの直後に位置し、第3のものはA34とA35との間に位置する。一般的に、クラスターを含む約100,000ヌクレオチドの全領域は反復要素で覆われている。これは、この領域に特異的なmiRNAを含有する反復単位と、クラスター内に多数存在する、ゲノムに広がる反復要素とを含む。
【実施例5】
【0118】
予測したmiRNAのクローニング
予測したmiRNAをさらに検証するために、実施例4に記載された多数のmiRNAを、米国特許出願第60/522,459号、第10/709,577号および第10/709,572号(これらの内容は引用として本明細書に組み込まれる)に記載のものと類似の方法を用いてクローニングした。簡潔に述べると、予測したmiRNAの各々について、特異的な捕獲用オリゴヌクレオチドを設計した。このオリゴヌクレオチドを用いて、小RNAに富む、胎盤由来のライブラリーから特異的なmiRNAを捕獲し、クローニングし、そしてシークエンシングした。
【0119】
43種のAタイプのmiRNAのうちの41種をクローニングした。その13種のmiRNAは、オリジナルのマイクロアレイ上には存在していなかったが、DタイプのmiRNAと同じくコンピュータを利用して予測されただけであった。予測したmiRNA前駆体のうちの11種について、5pおよび3pの予測した成熟miRNAの両方がマイクロアレイ上に存在し、そしてすべてのケースにおいて、両者は明確なシグナルを与えた。したがって、すべてのクローニングの計画において、5’および3’の両方の成熟miRNAをクローニングすることを試みた。43のクローニングされたmiRNAのうちの27について、5’のステムおよび3’のステムの両方に由来するmiRNAをクローニングすることができた。クローニングの努力は徹底的なものではなかったので、より多くのmiRNA前駆体が5’および3’の成熟miRNAをコードする可能性がある。
【0120】
多数のmiRNAクローニングの研究(Lagos−Quintana 2001, 2002, 2003) (Poy 2004)で観察されるように、クローニングされたmiRNAの多くが、3’末端における不均一性を示した。興味深いことに、かなりの数のクローニングされたmiRNAについて、5’末端での不均一性も観察された。この不均一性は、3’のステムに由来するmiRNA(6)に比べて5’のステムに由来するmiRNA(9)においてより多く見られるようであった。対照的に、3’末端における不均一性は、3’のステムおよび5’のステムに由来するmiRNAの両者において同程度であった(各々19および13)。5’の不均一性には、主に1つのヌクレオチド、大半はCまたはAの付加が伴うが、あるケースにおいては、3ヌクレオチドの付加が存在した。この事象は第19番染色体クラスターにおけるmiRNAに特異的なものではない。既知のmiRNAならびにその他の染色体からの新規miRNAの両方を含むさらに多くのクローニングされたmiRNAについて、それを観察した(データは示さず)。
【実施例6】
【0121】
miRNAの発現の解析
実施例4のmiRNAの発現をさらに調査するために、ノーザン・ブロット解析を用いていくつかの組織内のmiRNA発現のプロファイルを得た。13%の変性ポリアクリルアミドゲル上で分離した合計で40μgのRNAを用い、そして32Pで末端を標識したオリゴヌクレオチドプローブを用いて、ノーザン・ブロット解析を実施した。このオリゴヌクレオチドプローブの配列は、5’−ACTCTAAAGAGAAGCGCTTTGT−3’(A19−3p, NCBI: HSA−MIR−RG−21)および5’−ACCCACCAAAGAGAAGCACTTT−3’(A24−3p, NCBI: HSA−MIR−RG−27)であった。マイクロアレイ解析(図5−A)で観察されたものと同一の組織特異的プロフィールを伴う約22ヌクレオチドの長いRNA分子として、このmiRNAが発現された。
【0122】
MC19−1クラスターがどのようにして転写されるのかを明らかにするため。領域内のESTを調査することによって、ポリアデニル化シグナルとポリAの尾部とを伴うESTを含む僅かに1つの場所を特定した。この領域は、A43前駆体のすぐ下流側に位置する。これ以外でポリアデニル化シグナルを伴うESTを有する領域は一つのみで、mir−373の直後に位置する。このことは、mir−371、2、3が別個の転写物上にあることを示唆する。最初に、mir−A43周辺の領域に焦点を当てた研究を行い、この領域が実際にポリアデニル化mRNA内に転写されることを確認した。3.5kbの領域をカバーするプライマーを用いるRT−PCR試験の結果、予想された断片が得られた(図5−B)。5μgの胎盤の全RNAを用い、オリゴ−dTをプライマーとして用いるRT−PCR分析を実施した。次のプライマーを用いて転写物を増幅した:f1: 5’−GTCCCTGTACTGGAACTTGAG−3’; f2: 5’−GTGTCCCTGTACTGGAACGCA−3’; r1: 5’−GCCTGGCCATGTCAGCTACG−3’; r2: 5’−TTGATGGGAGGCTAGTGTTTC−3’; r3: 5’−GACGTGGAGGCGTTCTTAGTC−3’;およびr4: 5’−TGACAACCGTTGGGGATTAC−3’。シークエンシングによって、この断片の信憑性を検証した。この領域にはmir−A42およびmir−A43が含まれ、このことは、miRNAの両方が同一の一次転写物上に存在することを示す。
【0123】
クラスターの転写に関するさらなる情報は、その内部に位置する77のESTの解析からもたらされた。ESTのうち42個が胎盤に由来することを見出した。これらのESTはクラスター全体に沿って広がっているため、クラスター全体が胎盤で発現することが示唆される。この観察結果は、マイクロアレイ解析で観察される発現プロフィールと一致する。したがって、HeLa細胞で発現する唯一のmiRNAであるDタイプのmiRNAだけを例外として、クラスターにおけるすべてのmiRNAは同時発現されているようである。興味深いことに、77のESTのどれ1つとして、クラスターにおけるmiRNA前駆体と重複する領域内に位置しない。このことは、ドローシャによって加工される転写物由来のESTの発現が枯渇していることと一致する。
【0124】
マイクロアレイ発現プロフィールの調査から、miRNAのD1/2、A12、A21、A22およびA34が、テストを行ったその他のいくつかの組織において軽度から中程度の発現levelとして示された多少異なる発現プロフィールを有することが明らかになった。このことは、miRNAをコードする単数もしくは複数の転写物のオルターナティブスプライシングによって、または異なる組織特異性を有する別の単数もしくは複数のプロモーターがクラスターに沿って存在することによって説明できるかもしれない。
【0125】
3p成熟miRNAの発現と5p成熟miRNAの発現とを比較することによって、多数のmiRNA前駆体のために両者が発現するが、多くの場合異なるレベルであることが明らかになった。ほとんどのプレmiRNAについて、3p miRNAは、5p miRNAよりも高いレベルで発現する。しかしながら、6種の場合(mir−D1、2、mir−A1、mir−A8、mir−A12、mir−A17およびmir−A33)において、3p miRNAおよび5p miRNAの両方が同様のレベルで発現し、1つの場合(mir−A32)においては、5p miRNAが3p miRNAよりも高いレベルで発現した。
【実施例7】
【0126】
保存
実施例4の予測miRNAの全4つのタイプに由来する配列を、その他の種(チンパンジー、マカク、イヌ、ニワトリ、マウス、ラット、ショウジョウバエ、ゼブラフィッシュ、菌類、c. elegans)のそれと比較することで、クラスターにおけるすべてのmiRNA、そして実際のところ領域全体が、霊長類を超えては保存されていないことが明らかになった。興味深いことに、この領域のホモログは、マウスおよびラットを含むその他のいずれの調査されたゲノム内にも存在しない。したがって、これは、霊長類に特異的であって、動物一般には共有されていない最初のmiRNAクラスターである。チンパンジーとヒトとの間のホモロジー解析から、AタイプのmiRNAを保持する35のすべてのリピートが2つの種の間で近接していることが示される。さらに、クラスター全体は、ヒトとチンパンジーとの間で同一と考えられる。したがって、MC19−1クラスターの発生を導く多重の重複は、チンパンジーとヒトとが分かれる前に生じ、そして各々の種の進化の過程においても安定であり続けたに違いない。ヒトの第19番染色体が、タンデムにクラスターを形成した多数の遺伝子ファミリーと、大きなセグメントでの重複とを含むことが既知であることに留意すべきである(Grimwood et al, 2004)。したがって、この点に関して、MC19−1クラスターは第19番染色体の天然の部分である。
【0127】
対照的に、MC14−1クラスターはマウスにおいて広く保存されており、霊長類を超えて保存されていないものはクラスター内のA7 miRNAおよびA8 miRNAのみである(Seitz 2004)。対照的に、MC19−1クラスターにおけるすべてのmiRNAは霊長類に固有である。Sangerで見出されたすべてのmiRNAの調査から、三種のmiRNA、mir−198、mir−373およびmir−422a、だけが、マウスゲノムまたはラットゲノムに保存されていないが、これらはイヌゲノムに保存されていることが明らかになった。したがって、これらは霊長類に特異的ではない。興味深いことに、mir−371およびmir−372は、mir−373とクラスターを形成し、MC19−1クラスターの25kb下流側に位置し、AタイプのmiRNAとある程度相同的である(図4)が、げっ歯類でも保存されている。
【0128】
AタイプのmiRNA配列を、SangerデータベースにおけるmiRNAと比較することで、ヒトのmir−302ファミリーとのホモロジーが最も高いことが明らかになった(図4−C)。このホモロジーは、mir−371、2、3で見られるホモロジーよりも高い。mir−302ファミリー(mir−302a、b、cおよびd)は、HDCMA18P遺伝子(アクセス番号016648)のタンパク質をコードするエキソン内にある第1のイントロン内にアンチセンスの配向で位置する、690ヌクレオチドをカバーする(mir−367を含む)5つのmiRNAの強固に固められたクラスター内に見出される。miRNAホモロジー以外のさらなるホモロジーは、mir−302クラスターとMC19−1クラスターとの間には存在しない。mir−371、2、3およびmir−302a、b、c、dの両方が胚性幹細胞に特異的であるという事実は、注目に値する。
【実施例8】
【0129】
miRNAの差別的発現
0において記載された方法と類似のチップ発現法を利用して、マイクロアレイの画像をFeature Extraction Software (Version 7.1.1, Agilent)を用いて解析した。表2は、正常の組織と比較した疾患に関連する発現(「R」)の比率を示す。表2はさらに、標準化されたシグナル(「RPval」)の統計的解析を示す。各々のプローブのシグナルを、強度の中央値として設定した。シグナル強度は、バックグラウンドのレベルの400から飽和レベルの66000まで分布する。2チャンネル・ハイブリダイゼーションを実施し、Cy3シグナルをCy5シグナルと比較した。ここで、フルオロ・リバーストチップを用い(正常対疾患)、プローブシグナルをその平均シグナルに設定した。既知のmiRNAシグナルの総和が各々の試験またはチャンネルで同一となるようにシグナルを既知のmiRNA平均シグナルで割って、シグナルを標準化した。疾患の組織と正常組織との間のシグナル比を計算した。1.5よりも大きなシグナル比は、p値が0.007の有意な上方調節を示し、2を超えるシグナル比は0.003のp値を有する。2回の試験を通して、このようなまたはそれを超えるシグナル比の発生に基づいて、p値を計算した。
【0130】
表2における差別的発現解析は、miRNAのうち多くの発現が疾患組織内で有意に変化したことを示す。特に、実施例4のMC19−1のmiRNAは、前立腺ガンおよび肺ガン内で差別的に発現されている。ガンに対するMC19−1 miRNAの関連性は、前立腺ガン由来細胞内のMC19−1領域内における異型接合性の喪失の特定によって支持される(Dumur et al. 2003)。
【図面の簡単な説明】
【0131】
【図1】図1は、miRNAの成熟のモデルを示す。
【図2】図2は、19q13.42上のMC19クラスターの概略図を示す。パネルAは、その中にクラスターが位置する第19番染色体の58,580,001〜59,080,000の約500,000bpの領域(2004年5月のUSCSアセンブリによる)を示し、この領域は隣接するタンパク質をコードする遺伝子も含む。MC19−1クラスターは長方形で示される。mir−371、mir−372およびmir−373は線で示される。クラスターに隣接する、タンパク質をコードする遺伝子は、太い矢印で示される。パネルBは、MC19−1 miRNAクラスターの詳細な構造を示す。58,860,001〜58,962,000の約102,000bpの領域(2004年5月のUSCSアセンブリによる)が示される。miRNA前駆体は黒い棒で示される。すべてのmiRNAが左から右まで同一の配向であることに留意すべきである。miRNA前駆体の周囲の斜線部分は、その中に前駆体が埋め込まれている反復単位を示す。mir−371、mir−372およびmir−373の位置も示されている。
【図3】図3は、約690ntの明確なサイズのヒトの35の反復単位(A)およびチンパンジーの26の反復単位(B)の多重配列アラインメントのグラフ表示である。平均化スライドウインドウを10ntとして(最大スコア−1、最小スコア−0)、アラインメント内の各々の位置についての類似性のスコアを計算することによってこのグラフを作成した。反復単位の配列をClustalWプログラムで整列した。結果として生じたアラインメントの各々の位置に、その位置での類似性の程度を示すスコアを割り当てた。miRNA前駆体を含む領域は、縦棒で境界を示されている。前駆体の5’のステム(5p)および3’のステム(3p)に由来する成熟miRNAの正確な位置を、縦棒で示す。
【図4】図4は、MC19−1クラスターの43のAタイプのプレmiRNAの配列アラインメントを示す。パネルAは、多重配列アラインメントを、枠で印を付けた成熟miRNAの位置と共に示す。下部にコンセンサス配列を示す。保存されているヌクレオチドを、次のように着色する:黒−100%、濃灰色−80%〜99%および淡灰色−60%〜79%。パネルBは、成熟AタイプのコンセンサスmiRNAのアラインメントを、上流のヒトクラスターのmir−371、mir−372、miR−373と共に示す。パネルCは、成熟AタイプのコンセンサスmiRNAのアラインメントを、マウスのオーソロガスクラスターhsa−mir−371−373と共に示す。
【図5】図5は、MC19−1 miRNAの発現の解析を示す。パネルAは、選択された2つのAタイプのmiRNAのノーザン・ブロット解析を示す。ヒトの脳(B)、肝臓(L)、胸腺(T)、胎盤(P)およびHeLa細胞(H)からのすべてのRNAを用いて、発現を解析した。mir−98の発現とtRNAバンドのエチジウムブロミド染色がコントロールとなった。パネルBは、AタイプのmiRNA前駆体を含むmRNA転写物のRT−PCR分析を示す。胎盤からの5y(ウムラウト付きy)gの全RNAの逆転写を、オリゴ−dTを用いて実施した。その後、表示されたプライマー(水平の矢印で示される)を用いてのPCRを行った。調査された領域を、上端に図示する。縦方向の黒棒はプレmiRNAを示す;プレmiRNAの周囲の斜線部分は反復単位を示す;4つのESTの位置を右側に示す;ポリ−A部位(EST内に見出され、AATAAAコンセンサスの下流に位置する)を、縦方向の矢印で示す。三種のプライマーの組み合わせを用いたRT−PCRから予測される断片を、クラスター領域の説明図の下に示す。RT−PCR分析の結果を、予測した断片の下に示す。パネルCは、FR2断片のシークエンシング戦略を示す。この断片をベクターpTZ57R\T内にクローニングし、外部プライマーおよび内部プライマーを用いてシークエンシングした。

【特許請求の範囲】
【請求項1】
(a)表1に言及されるヘアピン配列;
(b)表10の配列識別子6757248−6894882の配列;
(c)表17の配列識別子1−6318または18728−18960の配列;
(d)表1に言及されるmiRNAの配列;
(e)表10の配列識別子1−117750または6894883−10068177の配列;
(f)表17の配列識別子6319−18727または18961−19401の配列;
(g)表4に言及される標的遺伝子結合部位の配列;
(h)表10の配列識別子117751−6757247の配列;
(i)(a)−(h)の相補体;
(j)(a)−(h)と少なくとも60%一致する少なくとも12の連続したヌクレオチドを含むヌクレオチド配列;
からなる群より選択される配列を含み、5−250のヌクレオチド長である、単離された核酸。
【請求項2】
請求項1の核酸を含むプローブ。
【請求項3】
核酸が、表2に前立腺ガンまたは肺ガンで差別的に発現されるものとして言及されるmiRNAに相補的な少なくとも8−22の連続するヌクレオチドを含む、請求項2のプローブ。
【請求項4】
請求項3の複数のプローブ。
【請求項5】
表2に前立腺ガンで差別的に発現されるものとして言及される各々のmiRNAに相補的な少なくとも1つのプローブを含む、請求項4の複数のプローブ。
【請求項6】
表2に言及される各々のmiRNAに相補的な少なくとも1つのプローブであって、肺ガンで差別的に発現されるもの等を含む、請求項4の複数のプローブ。
【請求項7】
請求項4乃至6のいずれか1項の複数のプローブを含む組成物。
【請求項8】
固体担体を備えるバイオチップであって、該担体は請求項4乃至6のいずれか1項の複数のプローブを含み、各々のプローブが担体の空間的に定められたアドレスに連結されているバイオチップ。
【請求項9】
プローブが表2に前立腺ガンで差別的に発現されるものとして言及されるmiRNAに相補的である、請求項8のバイオチップ。
【請求項10】
プローブが表2に肺ガンで差別的に発現されるものとして言及されるmiRNAに相補的である、請求項8のバイオチップ。
【請求項11】
疾患に関連するmiRNAの差別的発現を検出するための方法であって:
(a)生物学的試料を提供すること;および
(b)(i)表1に言及されるmiRNAの配列、(ii)表10の配列識別子1−117750もしくは6894883−10068177の配列、(iii)表17の配列識別子6319−18727もしくは18961−19401の配列または(iv)(i)−(iii)の変異体と少なくとも70%の同一性を有する核酸のレベルを測定することを含み、
コントロールと比較した核酸レベルの相違が差別的発現を示す方法。
【請求項12】
病的な状態を調節する化合物を同定するための方法であって:
(a)(i)表1に言及されるmiRNAの配列、(ii)表10の配列識別子1−117750もしくは6894883−10068177の配列、(iii)表17の配列識別子6319−18727もしくは18961−19401の配列または(iv)(i)−(iii)の変異体と少なくとも70%の同一性を有する核酸を発現できる細胞を提供すること;
(b)細胞をモジュレーターの候補物と接触させること;
(c)核酸発現のレベルを測定することを含み、
コントロールと比較した核酸のレベルの相違によって、核酸に関連する病的な状態のモジュレーターとしての化合物を同定する方法。
【請求項13】
標的遺伝子の発現を十分に阻害できる量の核酸を細胞内に導入することを含む細胞における標的遺伝子の発現を阻害する方法であって、標的遺伝子が(i)表4に言及される結合部位と実質的に同一の結合部位、(ii)表10の配列識別子117751−6757247の配列または(iii)(i)もしくは(ii)の変異体を含み;核酸が(a)配列番号:1−760616の配列、(b)表10の配列識別子1−117750および6757248−10068177の配列、(c)表17に記載の配列または(d)(a)−(c)の変異体を含む、細胞における標的遺伝子の発現を阻害する方法。
【請求項14】
発現がインビトロまたはインビボで阻害される、請求項12の方法。
【請求項15】
標的遺伝子の発現を十分に増加できる量の核酸を細胞内に導入することを含む細胞における標的遺伝子の発現を増加させる方法であって、標的遺伝子が(i)表4に言及される結合部位と実質的に同一の結合部位、(ii)表10の配列識別子117751−6757247の配列または(iii)(i)もしくは(ii)の変異体を含み;核酸が(a)配列番号:1−760616の配列、(b)表10に記載の配列、(c)表17に記載の配列または(d)(a)−(c)の変異体と実質的に相補的な配列を含む、細胞における標的遺伝子の発現を増加させる方法。
【請求項16】
発現がインビトロまたはインビボで阻害される、請求項15の方法。
【請求項17】
(a)配列番号:1−760616の配列、(b)表10に記載の配列、(c)表17に記載の配列または(d)(a)−(c)の変異体を含む核酸を、必要とする患者に投与することを含む、表6に記載の疾患を伴う患者を治療する方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2007−536925(P2007−536925A)
【公表日】平成19年12月20日(2007.12.20)
【国際特許分類】
【出願番号】特願2007−512601(P2007−512601)
【出願日】平成17年5月14日(2005.5.14)
【国際出願番号】PCT/IB2005/002383
【国際公開番号】WO2005/111211
【国際公開日】平成17年11月24日(2005.11.24)
【出願人】(506381876)ロゼッタ ジノミクス リミテッド (3)
【Fターム(参考)】