転写非忠実度（ｉｎｆｉｄｅｌｉｔｙ）、その検出および使用

本発明は、細胞中での転写非忠実度の新規のメカニズムの同定に関するものである。本発明は、試料中での転写非忠実度のレベルを検出するための組成物および方法、ならびに、例えば、治療の、診断の、薬理ゲノミクスのまたは薬物の設計のためのそれらの使用を提供する。開示されるであろうように、本発明は、増殖性細胞障害を検出し、モニターしまたは治療するために、薬物の設計および/またはスクリーニングのために、患者または疾病のプロファイリング、疾病重度の推定および薬物の有効性の評価のために、特に適している。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、細胞中での転写非忠実度の新規のメカニズムの同定に関するものである。本発明は、試料中での転写非忠実度のレベルを検出するための組成物および方法、ならびに、例えば、治療の、診断の、薬理ゲノミクスのまたは薬物の設計のためのそれらの使用を提供する。開示されるであろうように、本発明は、（例えば、増殖性細胞障害等の）障害を検出し、モニターしまたは治療するために、薬物の設計および/またはスクリーニングのために、患者または疾病のプロファイリング、疾病重度の予測および薬物の有効性の評価のために、特に適している。
【背景技術】
【０００２】
核酸DNAおよびRNAは、細胞核（DNA）中にゲノム情報を保存し、タンパク質を生じるためにメッセンジャーRNAを生じる転写と呼ばれるプロセス後にゲノム情報を細胞質中へ転移させるよう機能する巨大分子である。両者とも、ヌクレオチドと呼ばれる単量体から構成された直鎖状ポリマーである。DNAおよびRNAは各々、ヌクレオチドの4つの種類の組み合わせを呈する。ヌクレオチドはすべて、共通の構造を有する：有機塩基へ順に連結されるペントースへホスホジエステル結合によって連結されるリン酸基：DNAに関しては、アデニン、シトシン、チミンおよびグアニン（Ａ、Ｃ、Ｔ、Ｇ）、ならびにRNAに関しては、アデニン、シトシン、ウラシルおよびグアニン（A、C、U、G）。RNAにおいては、ペントースはリボースであり、DNAにおいては、ペントースはデオキシリボースである。DNA分子は、二重螺旋として配置された規則正しいヌクレオチドの二本鎖として組織化される。RNA分子は、分子の4つの種類を主として生じる一本鎖ポリヌクレオチドである：1）DNAから転写され、細胞質中でタンパク質へと翻訳される単一鎖のヌクレオチドであるメッセンジャーRNA（mRNA）、2）十分に定義された3次元構造を採用し、ポリペプチド鎖へ転移される特定のアミノ酸（AA）と結合し、翻訳と呼ばれるプロセスにおいて、特定のアミノ酸配列を有するタンパク質を形成する転移RNA（tRNA）、3）mRNA上に一定の順序で存在するコドン（1つのコドン＝3ヌクレオチド）によって指定される配列によって提供される情報に従って、AAを集合させてタンパク質にする構造体であるリボソームを特定のタンパク質とともに構成するより大きな分子であるリボソームRNA（rRNA）および4）非コードRNA（ncRNA）と呼ばれる短い制御RNA。
【０００３】
次に、mRNAの配列は、翻訳と呼ばれるプロセスによって、異なる言語、すなわちAAへと変換される。
【０００４】
本発明において、本発明者は初めて、転写の忠実度、すなわちDNA情報のmRNAへの転移が、病理学的細胞、特に癌細胞において劇的に低下することを示す。癌細胞における転写忠実のこの欠失は、報告された例において検査されたすべての癌および遺伝子のほとんど、および利用可能なデータベース中に存在する転写産物の大部分に影響し、いくつもの即時的および重要な意味を有する一般的な現象である。特に、転写非忠実度の発見によって、病理学的状態の研究のために現に使用されるプロテオミクスのおよびトランスクリプトームのアプローチの改良が可能となる。転写非忠実度の発見は、疾病の重度に関する疾病のより良好な分類も可能とし、治療効果の推定を改良し、転写忠実部分の欠失または改変を正す能力に基づいて薬物の有効性をスクリーニングするための新規の方法を設計する。本発明はしたがって、診断においておよび薬物の開発において、ならびに患者の治療、検出およびモニタリングならびに薬物の有効性において主要な意味および有用性を有する。
【０００５】
以下に記載される本発見の影響を理解するために、DNAからRNAへの転写における絶対的な忠実度が、正常細胞の機能に必要であることが現に信じられていることを認識することは重要である。しかしながら、現に重要だが未解決の問題が残っている。実際、ヒトゲノムの配列決定およびアノテーションによって、3万〜4万個の遺伝子がコードされると考えられた。この概算は、プロテオミクス法によって同定されることが可能なタンパク質の現時点での数をはるかに下回ったままである。最大30万個のタンパク質が同定されている。これらの差異を調整するために、単一の遺伝子が、選択的スプライシングと呼ばれるプロセスを通じて異なるタンパク質をコードするいくつもの異なるmRNAを生じることが可能であることが提唱される。選択的スプライシングは、プレメッセンジャーRNA（pmRNA）の異なる部分を除去し、それにより特定のイントロンに対応する異なる要素を除去し、異なる成熟mRNAを生じる。参照配列データベースの分析は、前記データベースが、6946遺伝子に相当する11259個の転写産物を含有することを示す。したがって、選択的スプライシングは、転写産物不均一性を76％まで増大させることが可能である。本発明者が本明細書に記載するメカニズムは、選択的スプライシングとは異なっており、はるかにより大きなタンパク質不均一性が誘導される。実際、本発明者は、コードされるAAにおける変化を結果的に生じるmRNA配列の非無作為な改変の発生、より短いタンパク質アイソフォームを生じる成熟前終止コドンの導入、伸長したタンパク質アイソフォームを生じる新規のコード配列の導入を暗示する天然終止コドンの変化を示す。それらによりギャップおよび挿入の導入は、mRNAリーディングフレームを改変し、それにより予想外のタンパク質の配列を作製する。本発明に記載されるデータは、転写非忠実度のこの現象が、正常細胞には存在するが、癌由来細胞等の病理学的細胞においては劇的に亢進することを示す。したがって、転写非忠実度（TI）が、DNAからRNAへ転移される情報の多様化に関与することが提唱される。本発明の結果はさらに、転写非忠実度が、無作為には生じないが、TI事象によって影響される塩基b0を取り囲む構成が重要であるという特定の規則に従うことを確立する。
【０００６】
別のメカニズムは、RNAの不均一性が、ゲノムレベルでは生じないが、RNAレベルすなわちRNA編集では生じることを説明すると予測され得る。しかしながら、RNA編集は、TI事象の2つの種類、すなわちギャップおよび挿入の導入を説明することは不可能である。RNA編集は、真核生物におけるmRNAおよびtRNAの転写後塩基変化を特徴とする。公知の置換編集事象の大部分は、CからUへのまたはAから（Gと読まれる）Iへの変換からなる（Gott, J. M. & Emeson, R. B. (2000) Annu Rev Genet 34, 499- 531、 Maas, S. & Rich, A. (2000) Bioessays 22, 790-802、Niswender, C. M. (1998) Cell Mol Life Sci 54, 946-64）。異なる研究は、これらの変換が、アデノシンデアミナーゼおよびシチジンデアミナーゼによって触媒される脱アミノ化メカニズムを介して生じることを示した。他の1つの置換編集事象は、「UからCへの」変換である。顕微鏡による可逆性の理論は、シチジンデアミナーゼ反応が、この変換を生じるよう後ろ向きに進み得ることを決定付けるものの、CTP合成酵素型の活性が原因である可能性があることも提唱された。いくつもの例において、RNA編集が、正常細胞と比べ、癌細胞に特異的である可能性があることが示された。さらに、本現象の割合は、癌の状態において影響を及ぼされる可能性がある。
【０００７】
癌のセットにおいて、本発明者は、cDNAレベルで、5.7％のC→T、9.2％のT→Cおよび4.7％のA→Gの変化を観察した。したがって、mRNA編集は、本明細書に記載の単一の塩基置換の20％超を説明することは不可能である。実際、最も普遍的な塩基置換、すなわち、A→C（24.6％）およびT→G（16.8％）は、公知のヒト酵素RNA編集プロセスによって現に説明されない塩基ファミリーの変化を表す。
【０００８】
さらに、転写非忠実度は、mRNA編集とは異なる1つのメカニズム（または複数のメカニズム）を通じて、塩基の欠失および/または挿入を生じると期待される。さらに、近年の研究は、dbSNP記録（単一ヌクレオチド多型データベース）の数が実際に、編集部位であることを示す（Eisenberg, E. et al. (2005) Nucleic Acids Res.33 (14), 4612-7）。本発明者のアプローチにおいて、dbSNP由来のSNPはすべて考慮されておらず、したがって、編集部位に対応する公知のSNPまたは仮性SNPが除外される。したがって、観察された癌のmRNA不均一性を説明するためのメカニズムは、転写非忠実度である。
【発明の概要】
【０００９】
本発明は、細胞において、特に哺乳動物細胞において転写非忠実度を使用し、検出しまたは変化させる組成物および方法に関する。本発明は、例えば、転写非忠実度の増大または低下したレベルによって生じまたは前記レベルと関連した疾病を検出および/または治療するための治療および診断の目的に特に適している。
【００１０】
本発明の具体的な目的は、対象において疾病の存在または段階を検出する方法であって、前記方法は、該対象からの試料において転写忠実の存在または割合を（インビトロまたはエクスビボで）評価することを含み、該存在または割合は、該対象における疾病の存在または段階の指標である。
【００１１】
本発明のさらなる目的は、薬物をスクリーニングし、同定しまたは最適化する方法に存し、前記方法は、該薬物が、遺伝子の転写非忠実度の割合を変化させる（例えば、低下させるまたは増大させる）かどうかを評価する工程を含む。
【００１２】
本発明のさらなる目的は、対象を治療する方法を必要とする対象を治療する方法であり、前記方法は、哺乳動物遺伝子の転写非忠実度の割合を変化させる（例えば、低下させるまたは増大させる）化合物の有効量を該対象へ投与することを含む。
【００１３】
本発明のさらなる目的は、ヒトまたは動物の治療の方法において使用するための、特に、癌、免疫疾患、炎症性疾患または加齢を含むがそれらには限定されない増殖性細胞障害等の疾病を治療するための医薬組成物の製造のために、哺乳動物遺伝子の転写非忠実度の割合を変化させる（例えば、低下させるまたは増大させる）化合物の使用に関する。
【００１４】
本発明のさらなる目的は、薬物または候補薬物の有効性を評価する方法であって、前記方法は、該薬物が、哺乳動物の転写非忠実度の割合を変化させる（例えば、低下させるまたは増大させる）かどうかを評価する工程を含み、このような変化は、薬物の有効性の指標である。
【００１５】
本発明はさらに、試料中で転写非忠実度（のレベル）を検出しまたは測定するための方法および（プローブ、プライマー、抗体またはそれらの誘導体等の）製品、ならびに対応するキットに関する。
【００１６】
本発明は、タンパク質または核酸における転写非忠実度配列を同定する方法、および、例えば、マーカー、免疫原としての前記配列の使用および/またはそれらの特異的リガンドを生じることにも関する。
【００１７】
この点において、本発明は、バイオマーカーを同定または作製する方法であって、前記方法は、対象からの試料中で、標的のタンパク質または核酸における転写非忠実度部位の存在を同定すること、および場合により、該転写非忠実度部位の配列を決定することを含む。具体的かつ好ましい実施態様において、標的タンパク質は、細胞表面タンパク質または分泌型タンパク質、特に細胞表面タンパク質または血漿タンパク質である。
【００１８】
本発明のさらなる目的は、形質または病理学的状態に特異的なリガンドを同定および/または作製する方法であって、前記方法は、該形質または病理学的状態を有する対象からの試料中で、1つまたはいくつもの標的のタンパク質または核酸における少なくとも1つの転写非忠実度部位の存在を同定すること、場合により、該少なくとも1つの転写非忠実度部位の配列を決定すること、および転写非忠実度によって作製される該少なくとも1つのタンパク質（もしくはドメイン）または核酸へ特異的に結合するリガンドを作製することを含む。
【００１９】
本発明は、癌、免疫疾患、炎症性疾患または加齢等の細胞増殖性障害のバイオマーカーを同定するのに特に適している。本発明は、哺乳動物対象においてこのような障害に特異的なリガンド、特に、対象において細胞増殖性障害の存在または重度を検出することが可能なリガンドを作製するのに特に有用である。
【００２０】
本発明のさらなる目的は、転写非忠実度によって作製されるタンパク質（もしくはドメイン）または核酸を特異的に結合するリガンドに存する。リガンドは、転写非忠実度によって作製されるタンパク質（またはドメイン）を特異的に結合する抗体（もしくは（Fab、Fab'、CDR等の）いずれかの断片または後述のようなそれらの誘導）であり得る。リガンドは、転写非忠実度によって作製される核酸を特異的に結合する核酸でもあり得る（例えば、プローブ、プライマー、RNAi（干渉RNA）等）。
【００２１】
本発明のさらなる局面は、特に哺乳動物タンパク質の、より好ましくはヒトタンパク質の転写非忠実度によって作製されるタンパク質のドメインを含むペプチドに関する。ペプチドは、典型的には合成ペプチド、すなわち、例えば、化学合成、アミノ酸合成および/または伸長、タンパク質消化、ペプチド構築、リコンビナント発現等によって人工的に調製されたペプチドである。ペプチドは、典型的には、該タンパク質のC末端断片の配列を含む。ペプチドは好ましくは、100、80、75、70、65、60、50、45、40、35、30、25またはさらには20個未満のアミノ酸を含む（が、他の実施態様においては、ペプチドの長さはより長い可能性がある）。タンパク質は、細胞表面タンパク質（例えば、受容体等）、分泌型タンパク質（例えば、血漿タンパク質等）、または細胞内タンパク質であり得る。
【００２２】
本発明のさらなる局面は、免疫原として上述に定義される、転写非忠実度によって作製されるペプチドの使用に存する。本発明は、上述に定義される、転写非忠実度によって作製されるタンパク質の一部を含むペプチドと、場合により適切な担体、賦形剤および/またはアジュバントとを含むワクチン組成物にも関する。
【００２３】
本発明のさらなる局面は、抗体を産生する方法に関するものであり、前記方法は、上述に定義される、転写非忠実度によって作製されるペプチドで非ヒト哺乳動物を免疫化すること、および該ペプチドと結合する抗体、または対応する抗体産生細胞を回収することを含む。場合により、抗体の誘導体が産生され得る。
【００２４】
具体的な実施態様において、本発明は、抗体を産生する方法に関するものであり、前記方法は、（i）転写非忠実度によって作製されるタンパク質のドメインを同定することおよび（ii）該ドメインと特異的に結合する抗体を産生することを含む。場合により、抗体の誘導体が産生され得る。
【００２５】
本発明のさらなる局面は、転写非忠実度によって作製されるタンパク質の一部と特異的に結合する抗体、または実質的に同一の抗原特異性を有するこのような抗体の誘導体に存する。抗体は、ポリクローナルまたはモノクローナルであり得る。誘導体という用語には、一本鎖抗体、二機能性抗体、ヒト化抗体、ヒト抗体、キメラ抗体等の（Fab、Fab'、CDR等の）いずれかの断片または他の誘導体が含まれる。
【００２６】
本発明のさらなる局面は、分子へ抱合された上述に定義されるような抗体またはその誘導体に関する。分子は、薬物、標識、毒性分子、放射性同位体等であり得る。
【００２７】
本発明は、遺伝子の転写非忠実度を（例えば、インビトロで）検出または定量化するための上述に定義されるような抗体またはその誘導体の使用にも関する。
【００２８】
本発明は、薬物または診断用試薬として上述に定義されるような抱合された抗体またはその誘導体の使用にも関する。
【００２９】
本発明は、支持体上に固定化された、転写非忠実度によって作製されるタンパク質または核酸と特異的に結合する試薬を含むデバイスまたは製品にも関する。試薬は、例えば、プローブもしくは抗体またはそれらの誘導体であり得る。
【００３０】
本発明のさらなる局面は、細胞または組織または生物体において転写非忠実度を生じまたは誘導しまたは刺激する方法に関する。このような方法は、典型的には、例えば遺伝子治療ベクターによって、転写非忠実度部位を正常なゲノム配列中に導入することを含み得る。このような改変は、細胞または組織の破壊を結果的に生じる可能性がある。特に、細胞毒性のあるタンパク質または化合物の産生を結果的に生じるいずれかの遺伝子配列中にオープンリーディングフレームを作製することは可能である。毒性分子または治療用分子を使用して標的に向かうことの可能な特異的バイオマーカーの、罹患した（または標的の）細胞における発現を生じることも可能である。したがって、このアプローチを使用して、転写非忠実度が、特定の割合で生じまたは前記割合を超過する場合、細胞を死滅させまたは治療することは可能である。
【００３１】
この点において、本発明のさらなる目的は、対象を治療する方法を必要とする対象を治療する方法であり、前記方法は、転写非忠実度部位を含有する核酸を該対象の細胞中へ導入し、それにより該核酸の発現が、該対象の治療を結果的に生じることを含む。
【００３２】
本発明のさらなる目的は、対象において転写非忠実度を生じまたは刺激しまたは調節する方法を要する対象において、転写非忠実度を生じまたは刺激しまたは調節する方法であり、前記方法は、転写非忠実度部位を含有する核酸を該対象の細胞中へ導入することを含む。
【００３３】
本発明のさらなる目的は、ヒトまたは動物の治療の方法において使用するための医薬組成物の製造のための転写非忠実度部位を含有する核酸の使用に関する。遺伝子は、哺乳動物遺伝子または、ウイルス遺伝子、細菌遺伝子等の病原体由来の遺伝子を含むいずれかの遺伝子であり得る。この点において、本発明は、病原体によって生じる疾病を治療する方法に関するものであり、前記方法は、該病原体によってコードされる遺伝子の転写非忠実度を生じることまたは刺激することを含む。
【００３４】
本発明は、低下した転写非忠実度を有するリコンビナントポリペプチドをインビトロで作製する方法にも関する。このような方法によって、リコンビナントポリペプチドにおける微小不均一性が低下できる。前記方法は、転写非忠実度の発生を低下させるために、適応したコドンを使用するリコンビナント核酸を含む宿主細胞を使用することを含む。前記方法は、転写非忠実度の発生を低下させるいずれかの化合物または処置の使用も含み得る。前記方法は、原核宿主細胞または真核宿主細胞において、例えばイー・コリ（E.coli）系またはCHO系において使用され得る。
【００３５】
本発明は、いずれかの哺乳動物対象、特にいずれかのヒト対象において、例えば、細胞増殖性障害（例えば、癌）、免疫疾患（例えば、自己免疫疾患（多発性硬化症、筋萎縮性側索硬化症（ALS））、移植片拒絶反応）、加齢、炎症性疾患、糖尿病等の増大したまたは低下した転写非忠実度の割合と関連した多様な病理学的状態を検出し、モニターしまたは治療するために、および/または治療活性のある薬物を製造し、設計しまたはスクリーニングするために使用され得る。本発明は、原核細胞、低級真核生物（例えば、酵母）、昆虫細胞、植物細胞、真菌等のいずれかの他の組織または細胞の種類において、転写非忠実度を検出し、モニターしまたは標的とするためにも使用され得る。
【図面の簡単な説明】
【００３６】
【図１ａ】cDNAライブラリの構築および配列決定の原理。
【図１ｂ】cDNAライブラリの構築および配列決定の原理。
【図２ａ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｂ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｃ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｄ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｅ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｆ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｇ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｈ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｉ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｊ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｋ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｌ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｍ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｎ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｏ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｐ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｑ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図２ｒ】（a〜q）分析に使用されるmRNA参照配列。ブラストの歪みを回避するために、mRNA参照配列のポリA尾部を系統的に除去した。図２のrは、試験された遺伝子のリストを提供する。
【図３ａ】典型的なMegaBLAST出力ファイル。
【図３ｂ】典型的なMegaBLAST出力ファイル。
【図３ｃ】典型的なMegaBLAST出力ファイル。
【図３ｄ】典型的なMegaBLAST出力ファイル。
【図３ｅ】典型的なMegaBLAST出力ファイル。
【図３ｆ】典型的なMegaBLAST出力ファイル。
【図３ｇ】典型的なMegaBLAST出力ファイル。
【図３ｈ】典型的なMegaBLAST出力ファイル。
【図３ｉ】典型的なMegaBLAST出力ファイル。
【図４ａ−１】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ａ−２】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ａ−３】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ａ−４】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ａ−５】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ａ−６】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ａ−７】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｂ−１】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｂ−２】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｂ−３】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｂ−４】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｃ−１】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｃ−２】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｃ−３】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｃ−４】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｄ−１】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｄ−２】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｄ−３】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｄ−４】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図４ｄ−５】研究された各遺伝子に関するいずれかの位置でのヌクレオチド配列の偏差の％。
【図５ａ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｂ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｃ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｄ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｅ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｆ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｇ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｈ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｉ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｊ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｋ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｌ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｍ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｎ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｏ】TPT1、VIM＝ESTの数値および比の検定分析
【図５ｐ】TPT1、VIM＝ESTの数値および比の検定分析
【図６ａ】電子フィルターの連続的な適用の前および後のESTの変動。クリップ400および細胞系除去の効果。
【図６ｂ】電子フィルターの連続的な適用の前および後のESTの変動。クリップ400および細胞系除去の効果。
【図６ｃ−１】電子フィルターの連続的な適用の前および後のESTの変動。クリップ400および細胞系除去の効果。
【図６ｃ−２】電子フィルターの連続的な適用の前および後のESTの変動。クリップ400および細胞系除去の効果。
【図６ｄ】電子フィルターの連続的な適用の前および後のESTの変動。クリップ400および細胞系除去の効果。
【図６ｅ】電子フィルターの連続的な適用の前および後のESTの変動。クリップ400および細胞系除去の効果。
【図７ａ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図７ｂ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図７ｃ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図７ｄ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図７ｅ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図７ｆ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図７ｇ】DNA構成：a）塩基b0の不均一性に及ぼすpmRNA塩基組成の効果。B）置換された各塩基に関する置換塩基の組成。C）統計的に有意なC＞N検定内での影響を受けた塩基および置換塩基の再分配。D）b-1またはb+1の反復に対応する置換塩基に及ぼすpmRNA塩基組成の効果。
【図８ａ】VIMに関する実質的な変異形mRNAおよびタンパク質。
【図８ｂ】VIMに関する実質的な変異形mRNAおよびタンパク質。
【図８ｃ】VIMに関する実質的な変異形mRNAおよびタンパク質。
【図８ｄ】VIMに関する実質的な変異形mRNAおよびタンパク質。
【図９】コード化の影響。
【図１０ａ】関心対象のタンパク質＝終止コドンが統計的に影響を受ける場合のアミノ酸配列。
【図１０ｂ】関心対象のタンパク質＝終止コドンが統計的に影響を受ける場合のアミノ酸配列。
【図１１ａ】DHPLC＝検出の原理および限界
【図１１ｂ】DHPLC＝検出の原理および限界
【図１１ｃ】DHPLC＝検出の原理および限界
【図１１ｄ】DHPLC＝検出の原理および限界
【図１２ａ】DHPLC＝プライマーおよび期待されるPCR産物。
【図１２ｂ】DHPLC＝プライマーおよび期待されるPCR産物。
【図１２ｃ】DHPLC＝プライマーおよび期待されるPCR産物。
【図１３ａ】研究された60個のタンパク質のリスト。
【図１３ｂ】研究された60個のタンパク質のリスト。
【図１３ｃ】研究された60個のタンパク質のリスト。
【図１３ｄ】研究された60個のタンパク質のリスト。
【図１４】抗体産生。
【図１５ａ】DHPLC結果。
【図１５ｂ】DHPLC結果。
【図１５ｃ】DHPLC結果。
【図１６】サンガー感受性。
【図１７ａ】癌患者の血漿中のAPOAIIおよびAPOCII PSPの検出。
【図１７ｂ】癌患者の血漿中のAPOAIIおよびAPOCII PSPの検出。
【図１７ｃ】癌患者の血漿中のAPOAIIおよびAPOCII PSPの検出。
【図１７ｄ】癌患者の血漿中のAPOAIIおよびAPOCII PSPの検出。
【図１７ｅ】癌患者の血漿中のAPOAIIおよびAPOCII PSPの検出。
【図１７ｆ】癌患者の血漿中のAPOAIIおよびAPOCII PSPの検出。
【図１８ａ】血漿タンパク質に関する起こり得るPSP。
【図１８ｂ】血漿タンパク質に関する起こり得るPSP。
【図１８ｃ】血漿タンパク質に関する起こり得るPSP。
【図１８ｄ】血漿タンパク質に関する起こり得るPSP。
【図１８ｅ】血漿タンパク質に関する起こり得るPSP。
【図１９】mRNA配列置換の推定の評価。
【発明を実施するための形態】
【００３７】
定義
転写非忠実度
転写非忠実度という用語は、いくつもの異なるRNA分子が、単一の遺伝子配列から細胞中で産生される新規のメカニズムを指定する。この新たに同定されたメカニズムは、いずれかの遺伝子に強力に影響し、非無作為であり、および以下に開示されるであろう具体的な規則に従う。実施例において示されるように、転写非忠実度は、RNA分子において置換、欠失および挿入を導入し、それにより単一の遺伝子から多様なタンパク質を作製することが可能である。転写非忠実度は、非コードRNA配列にも影響し、それにより前記配列の機能を調節することが可能である。したがって、転写非忠実度を測定し、調節しまたは標的とすることは、障害を検出しまたは治療するための、および薬物の開発のための新規のアプローチを呈する。
【００３８】
転写忠実度部位
本発明の脈絡内で、転写非忠実度部位という用語は、転写非忠実度によって影響を受ける配列および/または位置を指定する。これは、転写非忠実度の結果として生じる少なくとも1つの改変を含有する核酸またはアミノ酸ドメインであり得る。このような改変は、例えば、コードするフレームにおける切り替え（挿入および/または欠失）から、終止コドンの導入または抑制から、新たな開始コドンの導入から、（AAの変化を暗示するまたは暗示しない）ヌクレオチド置換などから結果として生じる可能性がある。転写非忠実度部位は、転写非忠実度から結果として生じる1つまたはいくつもの配列変動を含み得る。転写非忠実度部位は、例えば1個の改変されたヌクレオチドまたはアミノ酸残基から、例えば、150個の改変されたヌクレオチドまたはアミノ酸残基まで、またはさらにそれより多くを含むことが可能である。転写忠実度部位は典型的に、少なくとも1個のヌクレオチドまたはアミノ酸の改変（例えば、置換、欠失、挿入、反転等）によって、忠実な転写から結果的に生じる配列とは異なる。転写非忠実度（TIタンパク質）によって作製されるタンパク質またはドメインは典型的に、1〜50個のアミノ酸（またはさらにそれより多く）を含み、少なくとも1個の改変されたアミノ酸残基を有する。核酸の転写非忠実度配列は典型的に、1〜150個のヌクレオチド（またはさらにそれより多く）を含み、少なくとも1つの改変されたヌクレオチド残基を有する。
【００３９】
転写非忠実度の規則および同定
本願において定義される転写非忠実度の検出の特異的技術および/または具体的な規則に基づいて、いずれかの遺伝子またはタンパク質に関する転写非忠実度部位を推定および同定することは、いまや可能である。これらの部位は、所定のRNAに関して利用可能な配列を整列化しおよび塩基置換を同定することによって得られることも可能である。前記部位は、多様な技術、例えば、推定されたTIタンパク質に特異的なリガンドを使用することによって、最終的に確証されることが可能である。
【００４０】
転写非忠実度部位を同定するための具体的な方法は、
所定の遺伝子、RNAもしくはcDNA分子の配列、またはそれらの一部を提供すること、および
例えば、以下の（iii）で論議されるように、転写非忠実度規則に従って、転写非忠実度から結果的に生じるヌクレオチド変化の存在を該配列内で同定すること
を含む。
【００４１】
転写非忠実度部位を同定するための具体的なさらなる方法は、
所定のタンパク質の配列またはその一部を提供すること、および
例えば、以下の（iii）で論議されるように、転写非忠実度規則に従って、転写非忠実度から結果的に生じるアミノ酸変化の存在を該配列内で同定すること
を含む。
【００４２】
分子における転写非忠実度から結果的に生じる変化の存在は、3つの工程プロセスで同定されることが可能であり、
（i）多重対応分析（Multiple Correspondence Factorial Analysis (MCFA)）の因子に関する二次判別に依存する学習機械による転写非忠実度部位の同定
（ii）同一方法による転写非忠実度部位（b-1またはb+1またはその他）のカテゴリーの同定、および
（iii）以下の転写非忠実度規則を使用して置換塩基を推定すること
を含む。
【００４３】
シングルトンとして存在するいずれかの塩基、すなわち、それ自体によって先行されずまたは追随されないいずれかの塩基については、置換された塩基は、（b-1カテゴリーの場合）置換された塩基に先行する塩基とたいがい同一であり、または（b+1カテゴリーの場合）置換された塩基に追随する塩基と同一である。例えば、CATは、CCTとなるであろう（b-1規則）し、ATGは、AGGとなるであろう（b+1規則）。
【００４４】
置換が、3個の連続したA内で生じる場合、第二のAの置換は、優先的にCとなる。
【００４５】
置換が、3個の連続したT内で生じる場合、第二のTの置換は、優先的にC、次いでA、次いでGとなる。
【００４６】
CおよびGの伸展は、第二番目でまれにしか置換されないが、もしあれば、第二のCの置換は優先的にAとなり、第二のGの置換は優先的にCとなる。
【００４７】
他の場合については、置換塩基は、優先的にCである。
【００４８】
いずれかの標的タンパク質または核酸の配列内で転写非忠実度部位を同定するためのさらなる方法は、例えば、存在する発現した配列タグ（EST）の比較、同定された配列の直接的な増幅および特異的な配列決定法（サンガー配列決定、化学的配列決定、ピロシーケンス）による増幅産物の配列決定を含む。このようなアプローチは、AA変化、タンパク質の長さの改変等を包含する変異形配列を生じる。次に、転写非忠実度部位を有するmRNAまたはcDNAと選択的に対応するオリゴヌクレオチドが設計され、転写非忠実度を有するヌクレオチドを配列プールから選択的に増幅することが可能となる。TIタンパク質を標的とする抗体が作製されることも可能である。
【００４９】
あるいは、配列分析または生物情報学の規則によって、転写非忠実度部位を同定することが可能である。結果的に得られる配列は、いずれかのトランスフェクションベクター中にクローニングされ得る。転写非忠実度が生じる場合にのみ転写されおよび翻訳されるであろうリポーター遺伝子とともに、フレーム中でこのような転写非忠実度配列を含むコンストラクトを設計することも可能である。リポーター遺伝子は、毒素への曝露に対して標的細胞を感受性にしまたは抵抗性にするであろう酵素または蛍光タンパク質またはいずれかの遺伝子であり得る。
【００５０】
転写非忠実度部位（または置換）の同定が可能な詳細な方法には、以下に開示されるTDG法がある。
【００５１】
Pan and WeissmanおよびLiuら（PNAS, 2002, 99(14), 9346- 9351およびAnal Biochem. 2006 Sep 1;356(1):117-24）によって記載される技術は、RNA中で転写非忠実度部位を検出するのに適し得る。本技術は、複合体混合物からミスマッチ含有するDNA二本鎖を別個に濃縮できる酵素チミンDNAグリコシラーゼ（TDG）の使用に基づいている。これらの酵素は、ヌクレオチドのミスマッチを特異的に認識し、脱塩基部位を生じる（DNAのデオキシリボースと塩基の1つとの間の結合が切断される）。次に、TDGは、これらの脱塩基部位を可逆的に結合することが可能であり、したがって、ミスマッチを含有するDNA断片のアフィニティ精製に使用されることが可能である。典型的な実験において、RNAが2つの細胞種類（正常細胞および癌細胞）から抽出され、逆転写されて、二本鎖cDNAを形成する。各試料の熱変性およびゆっくりとした再生の後、ミスマッチを有するcDNAが生じ、完全な二本鎖から分離されることが可能である。これらのcDNAは次に、直接的な配列決定によって分析されまたはDHPLCによって比較されるかのいずれかが可能である（後述参照）。
【００５２】
転写非忠実度部位または変異を同定するのに適し得るさらなる技術は、例えば、米国特許第6,329,147号、米国特許第4,979,330号、WO02/077286または米国特許第6,120,992号に開示される。
【００５３】
典型的には、転写非忠実度部位を同定する方法はさらに、同定された配列を含む分子を生じることによって転写非忠実度部位の配列を確証する工程、該分子へ特異的に結合するリガンドを生じる工程、および該リガンドによって特異的に認識される抗原の存在を生物試料中で確証する工程を含む。
【００５４】
核酸の典型的な転写非忠実度配列は、好ましくは実施例5に開示される規則に従って、転写非忠実度によって生じる少なくとも1つの塩基の置換、欠失または挿入を含む長さ1〜150個のヌクレオチドの配列である。転写忠実部分配列は、より大きくあり得る。
【００５５】
TIタンパク質の典型的なドメインは、好ましくは実施例5に開示される規則に従って、転写非忠実度によって生じる少なくとも1つのアミノ酸置換（または塩基の欠失もしくは挿入から結果的に生じるコードするフレーム中の改変によるより多くの変化）を含む長さ1〜50個のアミノ酸のアミノ酸配列である。TIタンパク質のドメインは、より大きくあり得る。TIタンパク質のドメインの例は、例えば、図１３および１４における実験セクションにおいて提供される。
【００５６】
転写非忠実度の検出または測定
本発明は、DNAからRNAへの転写中にまたは転写直後に生じる天然の配列の異常性の高い割合の予期せぬ発見に基づいている。プロセスは、正常細胞中に存在し得るが、病理学的細胞、例えば癌細胞において著しく増大する。RNAへのDNA転写が、1対1の塩基相補性によって定義されるものとは異なる規則に従う配列変動を導入しているという発見によって、転写非忠実度によって作られる核酸またはタンパク質に特異的な新規の試薬（例えば、プローブ、プライマー、抗体、アプタマー等）の合理的な設計が可能となる。したがって、このような試薬によって、転写非忠実度を検出または測定することが可能となり、および正常な状態または罹患した状態間を識別することが可能となり、および転写非忠実度を示す細胞へ分子を向かわせることが可能となる。
【００５７】
さらに、本発明によって、疾病（例えば、癌）の重度を予測する試薬（例えば、プローブ、プライマー、抗体、アプタマー）の合理的な設計も可能となる。実際、転写非忠実度のより大きな割合は、疾病の重度と相関すると期待され、この割合は、遺伝子産物が影響を受ければ受けるほど、漸増的に増大している。本明細書に記載の方法またはいずれかの他の技術を使用した、罹患した細胞における転写（非）忠実度の直接的な測定によって、所定のいずれかの組織における疾病の進行の異なる段階で細胞を検出することが可能となる。遺伝子発現（転写産物およびタンパク質）においてこれらの変動を正確に測定することは、疾病の重度に関して薬物の有効性を評価する能力も改良する。現に、多様なマイクロアレイ技術によって、遺伝子発現の変化の測定が可能である。しかしながら、これらのデータの信頼性および、最も重要なことに、再現性は、現時点では不十分である。本発明者はいまや、これらのトランスクリプトーム実験の大きな可変性が、本発明者によって発見された転写非忠実度によって一部生じることを主張できる。したがって、この共通の現象によって、転写非忠実度によって最小に影響を受け、または本願に記載の規則に従って特異的配列中に生じる転写非忠実度を直接反映するかのいずれかである遺伝子発現試薬の設計が可能となる。
【００５８】
転写非忠実度が、転写の割合によって調節されることも可能であり、さらにその見込みがある。本発明者は、病理学的状態にある所定の遺伝子の発現の増大が、TIを増大させるであろうし、それによりタンパク質の不均一性を増大させるであろうと推測する。
【００５９】
転写非忠実度は、当技術分野でそれ自体公知の、本発明に適し得る数多くの技術を使用して検出または測定されることが可能である。特に、転写非忠実度は、特異的プローブ、プライマーまたは抗体等の転写非忠実度によって作られる核酸またはタンパク質に特異的な試薬を使用して、電気泳動、ゲル泳動分析、分光法等によって測定されることが可能である。転写非忠実度の割合は、転写非忠実度へ供される細胞中の遺伝子の数および/または所定の遺伝子に関して生じた転写非忠実度部位の数を評価することによって測定されることが可能である。このような割合は、検査試料における転写非忠実度によって作られる核酸またはタンパク質のレベルを、参照試料において得られるレベルと比較することによって測定されることが可能である。
【００６０】
核酸のレベルでの転写非忠実度の検出
上述に論議されるように、転写非忠実度は、RNA分子における配列変動を導入する。転写非忠実度を検出または測定することはしたがって、1つもしくはいくつもの遺伝子によってコードされるRNAにおける、または細胞もしくは組織もしくは試料の全体におけるこのような配列変動の存在または（絶対的または相対的）量を検出することによって達成されることが可能である。核酸における転写非忠実度の検出は、ハイブリダイゼーション、増幅、ヘテロ二本鎖形成等の多様な技術によって実施されることが可能である。
【００６１】
多様な組織種類に存在するヌクレオチドの同定に使用される実質的にすべての技術は、ハイブリダイゼーションと呼ばれるプロセスに依存する。ハイブリダイゼーションは、多型を同定しおよび遺伝子発現における変動を検索するのに使用されるマイクロアレイ等の技術に重要である。本技術は、遺伝子発現のレベルを測定するのに適用される。オリゴヌクレオチドプローブのハイブリダイゼーションは、少量のメッセージをより良好に研究できるようにするために、豊富に発現した遺伝子の配列を減算するのにも使用され、この手法は、サブトラクティブハイブリダイゼーションと呼ばれる。ハイブリダイゼーションは、直接的な形態の下で、またはRNA種からDNA種の配列へメッセージ配列を変換するための逆転写酵素の適用後のいずれかで、PCR実験において普遍的に使用される遺伝子増幅反応の第一の工程でもある。
【００６２】
ハイブリダイゼーションの基礎をなす基本的なメカニズムは、単一鎖のヌクレオチド配列が、互いに結合することが可能であることであり、ただし、それらの個々の配列が相補的であることである。4個の各塩基の長さおよび特定の順序の両者は、ハイブリダイゼーションの有効性および配列の特異性を規定する。このことは、特定の各塩基が、非共有結合でその相補的な塩基へ結合することを意味し、すなわち、AがTへおよびCがGへ結合し、ならびにその逆もまた真であることを意味する。配列の整合におけるこの非共有結合は、塩基の順序によって条件付けられる。したがって、一般的な実施において、塩基の規定された配列は、単一の相補的な配列へ結合する。この特異的な結合反応は、ヌクレオチドの所定のいずれかの混合物においていずれかの相補的な配列を同定することの可能なハイブリダイゼーションに関する基礎を提供する。ハイブリダイゼーションの有効性は、適切な順序において互いに整合する（ミスマッチのいくらかの程度は許容される）塩基の数によって決定され、ならびに結合バッファー、CG対TAの相対的な量（CGおよびTAは、それぞれ3個および2個の水素結合によって連結される）等の実験条件によって、ならびに融解温度、すなわち、二本鎖DNAの50％の解離が可能となるのに必要な温度によって決定される。
【００６３】
ハイブリダイゼーションを使用して転写非忠実度を検出することとは典型的に、転写非忠実度配列に特異的な核酸プローブと接触させて試料を配置すること、および形成されたハイブリッドの存在（または量）を検出することを含むものであり、該存在または量は、転写非忠実度の存在または割合の直接的な指標である。好ましい実施態様において、方法は、1つまたはいくつもの遺伝子の異なる転写非忠実度配列にそれぞれ特異的な核酸プローブの1セットを使用する。転写非忠実度配列に特異的な核酸プローブは、本願に開示された配列情報およびヌクレオチドの置換、挿入または欠失の規則を使用していずれかの遺伝子のために調製されることが可能である（例えば、実施例5参照）。
【００６４】
本発明の脈絡内で、核酸「プローブ」とは、転写非忠実度配列またはその相補体との選択的ハイブリダイゼーションができ、および該配列または相補体を含有する試料中で存在（またはその量）を検出するのに適したポリヌクレオチド配列を有する核酸またはオリゴヌクレオチドを指す。プローブは、好ましくは転写非忠実度配列に完全に相補的であるが、いくらかのミスマッチは許容され得る。プローブは典型的に、長さ8〜1500個のヌクレオチドの、例えば10〜1000個の、より好ましくは10〜800個の、典型的には20〜700個の一本鎖核酸を含む。より長いプローブが同様に使用されうることは、理解されるべきである。本発明の好ましいプローブは、転写非忠実度配列と特異的にハイブリダイズすることの可能な長さ8〜400個のヌクレオチドの一本鎖核酸分子である。
【００６５】
本発明の具体的な実施態様は、転写非忠実度配列を含有しない核酸分子の一領域と選択的にハイブリダイズする核酸プローブである。
【００６６】
核酸ハイブリダイゼーションを示すのに使用される場合、選択性とは、標的配列とのプローブのハイブリダイゼーションが、別の配列との該プローブのハイブリダイゼーションとは異なることを示す。この点において、プローブと標的配列との間の完全な相補性は必要とされないが、選択的ハイブリダイゼーションを可能にするのに十分高くあるべきである。
【００６７】
本発明の好ましいプローブは、細胞表面タンパク質または分泌型タンパク質をコードするRNA分子（または対応するcDNA分子）における転写非忠実度配列と相補的な配列を含む。本発明のプローブの具体的な例は、転写非忠実度配列と相補的な配列または配列番号1〜32のいずれか1つのペプチド配列をコードする配列を有する。
【００６８】
プローブの配列は、例えばハイブリッド（例えば、インターカレート基または2'-アルコキシリボヌクレオチド等の改変されたヌクレオチド）の安定性を増大させるために、またはプローブを標識するために、例えば化学的に改変されることが可能である。標識の典型的な例には、放射能、蛍光、発光、酵素標識、およびそれらの類似物が含まれるが、それらに限定されるわけではない。プローブは、溶液、懸濁液中で標的核酸とハイブリダイズされ得、または以下に限定されるわけではないが、ビーズ、カラム、プレート、（核酸アレイまたはチップを作製するための）基材等の固体支持体へ結合され得る。
【００６９】
（ハイブリダイゼーションプローブとの組み合わせで使用され得る）別の実施態様によると、転写非忠実度は、特異的プライマーを使用する選択的増幅によって検出または測定される。選択的増幅によって転写非忠実度を検出することとは典型的に、転写非忠実度配列を特異的に増幅する特異的な核酸プライマーと試料を接触させて配置すること、および形成された増幅産物の存在（または量）を検出することを含むものであり、該存在または量は、転写非忠実度の存在または割合の直接的な指標である。好ましい実施態様において、方法は、1つまたはいくつもの遺伝子の異なる転写非忠実度配列それぞれの特異的な増幅を可能にする核酸プライマーの1セットを使用する。増幅は、以下に限定されるわけではないが、ポリメラーゼ連鎖反応（PCR）、リガーゼ連鎖反応（LCR）、転写仲介性増幅（TMA）、鎖置換増幅（SDA）および核酸配列ベースの増幅（NASBA）など、当技術分野でそれ自体公知の多様な技術に従って実施され得る。
【００７０】
転写非忠実度配列に特異的な核酸プライマーは、本願に開示された配列情報およびヌクレオチドの置換、挿入または欠失の規則を使用していずれかの遺伝子のために調製されることが可能である（例えば、実施例5参照）。
【００７１】
「プライマー」という用語は、転写非忠実度配列もしくはその相補体との、または転写非忠実度部位に隣接する核酸の一領域との選択的ハイブリダイゼーションができ、および該配列または相補体を含有する試料において該転写非忠実度のすべてまたは一部を増幅するのに適したポリヌクレオチド配列を有する核酸またはオリゴヌクレオチドを指定する。本発明の典型的なプライマーは、長さ約5〜60個の、より好ましくは長さ約8〜約50個の、さらに好ましくは長さ約10〜40、35、30または25個のヌクレオチドの一本鎖核酸分子である。高い特異性を確実にするために、完全な相補性が好ましい。しかしながら、プローブに関して上述に論議されるように、若干のミスマッチが許容され得る。
【００７２】
「隣接する」という用語は、例えば250bpを超過しない、好ましくは、200、150、100を超過しない、または、さらに好ましくは該部位から50bpまでの上流の従来のポリメラーゼ活性に適合する転写非忠実度部位の距離に、領域が配置されるべきであることを示す。
【００７３】
本発明のさらなる局面には、核酸プライマーの少なくとも一対も含まれ、その中で、プライマーの該対は、センスおよび逆方向のプライマーを含み、ならびに該センスおよび逆方向プライマーによって、転写非忠実度配列の、または実際に相補的な配列の選択的増幅が可能となる。本発明のプライマーの具体的な例を、例えば図１２に開示する。
【００７４】
本発明のさらなる実施態様によると、転写非忠実度は、変性高速液体クロマトグラフィー（DHPLC）によって測定される。本法の原理は、例えば図１１に開示される。基本的に、増幅産物が変性され、再アニールされる。再アニーリングの間、ホモ二本鎖およびヘテロ二本鎖の両者が、転写非忠実度配列の存在の結果として形成される。次に、混合物は、DHPLCによって分析される。ヘテロ二本鎖およびホモ二本鎖のDNA構造が、分析温度で異なるので前記ヘテロ二本鎖およびホモ二本鎖は、異なって溶出され、前記ヘテロ二本鎖およびホモ二本鎖の（相対的な）量が評価されることが可能である。
【００７５】
正常細胞よりも大きな頻度を有する癌細胞において存在する転写非忠実度配列の確証として、示されるオリゴヌクレオチドを使用するRT-PCRによって、選択された遺伝子（ENO1、GAPDH、TSMB4X）の予測される転写非忠実度を増幅した（実施例6参照）。ホモ二本鎖およびヘテロ二本鎖のバリエーションを確認した（図１５）。
【００７６】
核酸を検出するのに適した他のいずれかの技術は、本発明において転写非忠実度を検出し、定量化しまたはモニターするために使用されることが可能であり、または使用に適応することが可能である。
【００７７】
タンパク質のレベルでの転写非忠実度の検出
転写非忠実度によって、タンパク質の配列に変化が生じるので、転写非忠実度の存在またはレベルは、TIタンパク質の存在または量を検出することによって測定されることも可能である。
【００７８】
当技術分野でそれ自体公知の多様な技術は、タンパク質中の転写非忠実度を測定するために使用されおよび/または適応することが可能である。特に、転写非忠実度は、それらの挙動の変化を方向付けるに至るタンパク質の改変を生じるので、これらの変化は、例えば、2次元ゲル電気泳動および質量分析によってまたは高感度表面レーザー脱離イオン化（surface enhanced laser desorption ionization）によって検出されることが可能である。TIタンパク質が、ヒト血漿中に存在することが確証されると、本発明者は、ApoAIIの基準の終止部後に配置されるペプチドの質量分析特性を示す。質量分析データは、アルギニンが、基準の終止部へ置換されることを示す。さらに、（塩基置換による成熟前終止コドンの結果として、または欠失もしくは挿入の場合のオープンリーディングフレームにおける切り替えの結果として）転写非忠実度が、より長いおよびより短い（細胞性および血漿の）タンパク質アイフソフォームを生じさせるので、このようなアイソフォームは、その特異的リガンドおよび/またはタンパク質配列決定戦略を使用して検出または定量化され得る。この点において、本発明者は、タンパク質の長さおよびアミノ酸一次配列における変化が、タンパク質のカルボキシ末端で主として生じることを示す。したがって、配列決定戦略は、これまで疑われていない領域であるタンパク質のC末端に主として向かうべきである（実際、現に使用される直接的なタンパク質配列決定法は、NH₂末端アミノ酸での開始で達成されることが可能であるにすぎない。）。
【００７９】
特異的リガンドを使用して転写非忠実度を検出することとは典型的に、TIタンパク質のドメインに特異的なリガンドと試料を接触させて配置すること、および形成されたハイブリッドの存在（または量）を検出することを含むものであり、該存在または量は、転写非忠実度の存在または割合の直接的な指標である。好ましい実施態様において、方法は、1つまたはいくつものTIタンパク質の異なるドメインにそれぞれ特異的なリガンドの1セットを使用する。これらのドメインに特異的なリガンドは、本願に開示される配列情報およびアミノ酸置換規則を使用して、いずれかのタンパク質のために調製されることが可能である（例えば、実施例5参照）。リガンドは、可溶性形態で使用され得、または表面もしくは支持体上にコーティングされ得る。
【００８０】
この点において、本発明は、TIタンパク質のドメインを選択的に結合するいずれかのリガンドにも関する。特異的抗体、合成分子、アプタマー、ペプチド等のリガンドの様々な種類が熟慮され得る。
【００８１】
具体的な実施態様において、リガンドは、抗体、またはその断片もしくは誘導体である。したがって、本発明の具体的な一局面は、TIタンパク質のドメインを特異的に結合する抗体に存する。
【００８２】
本発明の脈絡内で、抗体は、ポリクローナル抗体、モノクローナル抗体、および実質的に同一の抗原特異性を有するそれらの断片または誘導体を指定する。断片には、例えば、Fab、Fab'2、CDR領域等が含まれる。誘導体には、単一鎖抗体、ヒト化抗体、ヒト抗体、多機能抗体等が含まれる。
【００８３】
TIタンパク質のドメインに対する抗体は、当技術分野で一般的に公知の手法によって作製され得る。例えば、ポリクローナル抗体は、単独のまたは適切なタンパク質へ結合された（例えば、タンパク質またはペプチドとしての）TIタンパク質のドメインを、非ヒト動物へ注入することによって作製され得る。適切な期間の後、当技術分野で公知の技術によって、動物から採血し、血清を回収し、および精製した（Paul, W.E. "FundamentalImmunology" Second Ed. Raven Press, NY, p. 176, 1989、Harlow et al. "Antibodies: A laboratory Manual", CSH Press, 1988、Ward et al (Nature 341 (1989) 544）。
【００８４】
TIタンパク質と同一の配列を有するペプチドは、当技術分野で一般的に公知の手法によって作製され得る。このようなペプチドは、適切な支持体と結合することが可能であり、生物試料（例えば、体液）中に存在する自己抗体の検出のために使用されることが可能である。
【００８５】
TIタンパク質のドメインに対するモノクローナル抗体は、例えば、免疫Bリンパ球のミエローマ細胞への融合を包含するKohler-Millstein（2）の技術（Kohler-Millstein, Galfre, G., and Milstein, C, Methods Enz. 73 p. 1 (1981)）によって調製され得る。例えば、上述に記載された免疫原は、記載された非ヒト哺乳動物中へ注射されることが可能である。その後、脾臓が摘出され、多様な方法に従ってミエローマと融合される。次に、結果として得られるハイブリドーマ細胞が、TIタンパク質のドメインに対する抗体の分泌に関して検査されることが可能である。
【００８６】
TIタンパク質の特定のドメインに対して「選択的な」抗体とは、該ドメイン（またはエピトープを含有するその断片）に対する結合が、非特異的結合（すなわち、別の抗原、特に該ドメインを含有しない未変性タンパク質に対する結合）とは確実に識別されることが可能である抗体を指定する。TIタンパク質のドメイン選択的な抗体によって、試料中のこのようなドメインを含有するタンパク質の存在が検出できる。
【００８７】
診断学
本発明によって、使用されることの可能な検出または診断用アッセイの性能は、とりわけ、対象に由来する試料から疾病の存在、非存在、素因、危険性または重度を検出することができる。「診断学」という用語は、薬理ゲノミクス、予後等を含むものとして解釈されるべきである。
【００８８】
具体的な一局面において、本発明は、生物試料、好ましくはヒト生物試料中での疾病の存在、非存在、素因、危険性または重度をインビトロまたはエクスビボで検出する方法であって、転写非忠実度の部位を特異的に結合するリガンドと該試料を接触させて配置することと、複合体の形成を決定することとを含む前記方法に関する。
【００８９】
本発明の具体的な一目的は、対象において癌の存在、非存在、素因、危険性または重度を検出する方法であって、癌細胞によって発現する転写非忠実度の部位を特異的に結合するリガンドと対象由来の試料を接触させてインビトロまたはエクスビボで配置することと、複合体の形成を決定することとを含む前記方法に存する。
【００９０】
本発明の別の実施態様は、癌の治療に対する対象の反応または反応性を評価する方法に関するものであり、前記方法は、治療の経過前および経過中の異なる時点での対象由来の試料中の転写非忠実度の存在または割合を検出することを含む。
【００９１】
本発明は、癌の疾病の治療の有効性を決定する方法にも関するものであり、前記方法は、（i）該治療の間または後に対象由来の組織試料を提供すること、（ii）該試料中での転写非忠実度の存在および/または割合を決定することならびに（iii）該存在および/または割合を、治療の早期の段階の前または前記段階時に採取された該対象由来の参照試料中での転写非忠実度の量と比較することを含む。
【００９２】
試料中の転写非忠実度の存在（または増大）は、癌の疾病の存在、素因または進行の段階を示す。したがって、本発明によって、より効果的かつカスタマイズされる適切な治療的干渉の設計が可能となる。また、前駆症状レベルでの決定によって、予防的措置が適用できる。
【００９３】
本発明の診断方法は、インビトロ、エクスビボまたはインビボで、好ましくはインビトロまたはエクスビボで実施されることが可能である。試料は、適宜核酸またはポリペプチドを含有する、対象由来のいずれかの生物試料であり得る。このような試料の例には、体液、組織、細胞試料、器官、生検等が含まれる。最も好ましい試料は、血液、血漿、血清、唾液、尿、精液などである。試料は、検査のための核酸またはポリペプチドの利用可能性を付与しまたは改良するために、前記方法を実施する前に処理され得る。処理には、例えば以下のうちの1つ以上が含まれ得る。細胞溶解（例えば、機械的、物理的、化学的等）、遠心分離、抽出、カラムクロマトグラフィーなど。
【００９４】
本発明の方法は、転写非忠実度によって生じる新規のペプチドに対する抗体のヒト試料中での存在を決定すること、および抗体産生に至る免疫刺激を生じることからなる。本発明の第二の方法は、転写非忠実度のペプチドに対する免疫学的構造を有する細胞を検出することに関する。
【００９５】
薬物の設計および治療法
上述に論議されるように、本発明によって、転写非忠実度を調節する候補分子の能力を評価することによって、新規の薬物の設計（またはスクリーニング）が可能となる。このような方法は、結合アッセイおよび/または機能的（活性）アッセイを含み、動物等においてインビトロで（例えば、細胞系においてまたは非細胞アッセイにおいて）実施され得る。
【００９６】
本発明の具体的な目的は、生物活性のある化合物を選択し、特徴づけ、スクリーニングしまたは最適化する方法に存し、該方法は、検査化合物が転写非忠実度を調節するかどうかをインビトロで決定することを含む。転写非忠実度の調節は、特定の遺伝子もしくはタンパク質に関して、または遺伝子もしくはタンパク質のあらかじめ規定されたセットに関して、または包括的に評価されることが可能である。
【００９７】
本発明のさらなる実施態様は、生物活性のある化合物を選択し、特徴づけ、スクリーニングしまたは最適化する方法に存し、該方法は、遺伝子と検査化合物を接触させてインビトロで配置すること、および転写非忠実度の部位を含有するRNA分子の該遺伝子からの生成を調節する該検査化合物の能力を決定することを含む。
【００９８】
本発明のさらなる実施態様は、生物活性のある化合物を選択し、特徴づけ、スクリーニングしおよび/または最適化する方法に存し、該方法は、検査化合物を細胞と接触させること、および該細胞中で検査化合物が転写非忠実度を調節するかどうかを決定することを含む。
【００９９】
上述のスクリーニングアッセイは、プレート、チューブ、ディッシュ、フラスコ等のいずれかの適切なデバイス中で実施され得る。典型的には、アッセイは、多重ウェルマイクロタイターディッシュ中で実施される。本発明を使用する場合、いくつもの検査化合物が、並行してアッセイされることが可能である。さらに、検査化合物は、多様な起源、性質および組成に属し得る。前記化合物は、単離されたまたは他の物質と混合した状態で、脂質、ペプチド、ポリペプチド、核酸、小分子等のいずれかの有機または無機物質であり得る。化合物は、例えば、化合物の組み合わせライブラリのすべてまたは一部であり得る。
【０１００】
本発明の転写非忠実度を調節する化合物は、細胞中で転写非忠実度を減少または増大させるための治療的有用性等の多くの有用性を有する。このような化合物は、増殖性障害（例えば、癌）、免疫疾患、加齢、炎症性疾患等の異常な転写非忠実度によって生じまたは前記転写非忠実度と関連した疾病を治療（または予防）するために使用され得る。
【０１０１】
本発明の他の化合物は、転写非忠実度を標的とする化合物、すなわち、転写非忠実度の部位を選択的に結合する化合物である。このような化合物（例えば、抗体、RNAi等）は、診断用試薬として、または治療薬として、単独でまたは標識へ抱合されてのいずれかで使用され得る。
【０１０２】
本発明の転写非忠実度を調節または標的とする化合物は、経口的を含むいずれかの適切な経路によって、または全身性送達、静脈内、動脈内、脳内またはくも膜下腔内注射によって投与されることが可能である。薬用量は、当業者に公知のいくつもの因子に応じて、幅広い限界内で変動することが可能であり、具体的な各場合における個々の必要条件へ調整されなければならないであろう。例えば、等張性溶液、バッファー溶液および塩類溶液等を含むいずれかの溶液、懸濁液、粉末、ゲル等の、当技術分野で公知の医薬的に許容されるいずれかの薬用量が使用され得る。化合物は、単独で投与されることが可能であるが、一般的には、（Remington's Pharmaceutical Sciences, Mack Publishingに記載されるなどの）標準的な医薬的実施に関して医薬的な担体とともに投与される。抗体は、ヒトでの試行および治療において現に使用される、当技術分野でそれ自体公知の方法およびプロトコールに従って投与され得る。
【０１０３】
正常な細胞機能に及ぼす転写非忠実度の効果
複数のタンパク質が、ほとんどの細胞機能を生じることは、一般的に認められている。しかしながら、非コードRNAとして公知のRNAがそれゆえ、それ自体、機能的分子でもあることも明白である。重要性が既に過小評価されているこれらの転写産物は、多くの生物体中に存在するであろうし、多くの細胞機能を制御しているであろう。それらのうち、あるものは、rRNA、tRNA、tmRNA（トランスメッセンジャーRNA）を見出すが、他のものは、スプライシングまたは別の細胞機能においてRNAの転写後改変に介入する非コードRNA（snoRNA、snRNA等）を見出す。RNAおよびタンパク質の両者の機能は、本願に記載される転写忠実度の欠失によって影響を受けることが可能である。DNAの配列は、DNA分子の配列を認識しおよび母DNAテンプレートと相補的なヌクレオチドの単一鎖ポリマーを合成するRNAポリメラーゼIIと呼ばれるタンパク質の作用によって、核中でmRNAへと転写される。所定のいずれかの位置にあるRNA塩基の順序および種類は、テンプレートとして機能するDNA鎖に存在する塩基の順序および種類によって決定される。mRNAの第一の塩基に相当する転写されたRNAの5'末端は、開始ヌクレオチドへ結合した7-メチルグアニラートへ連結され、それにより、RNAを分解から保護する5'キャップを構成する。この改変は、転写が完了する前に生じる。一次転写産物の3'末端でのプロセシングは、アデニン残基の糸が、ポリ（A）ポリメラーゼと呼ばれる酵素によって付加される遊離3'-ヒドロキシル基を生じるためのエンドヌクレアーゼによる切断を包含する。結果的に得られるポリ（A）テイルは、100〜250個のヌクレオチドを含有する。プロセシングの第一の工程は、スプライシングであり、イントロン性配列に相当するエレメントの一次転写産物からの切断後のエキソンの連結からなる。本過程は、数多くのタンパク質およびncRNAによって調節され、それらのいくつかはRNAへ結合する。この結合が、転写忠実度の欠失によって影響を受けることが可能な一工程であることは可能である。実際、これらのタンパク質がすべて、特異的RNAによってそれ自体コードされ、これらのタンパク質の機能はそれゆえ、転写忠実度の欠失によって強力に影響を受ける。RNA成熟の非常に複雑な過程によって、翻訳が生じるよう核から搬出されるであろうmRNAが生じる。この段階で、成熟mRNAに存在するヌクレオチド三つ組が必ずしもすべてAAへ翻訳されることはないであろうことを認識することは重要である。成熟メッセンジャーRNAは、mRNAの全体的な安定性を決定する上での機能的有意性を有する5'および3'非翻訳領域と呼ばれる非コード領域を含有し、その他は翻訳において役割を担う。DNA中に含有される情報を適切なタンパク質AA配列へ効果的に運搬するために、転写の絶対的な忠実度が必要とされる。実際、転写中または成熟過程中のいずれかで生じる何らかのエラーは、mRNAの安定性における、および最終的にはタンパク質AA一次配列の変動における変化の導入を結果的に強力に生じるであろう。タンパク質配列におけるこれらの変動は次に、転写の開始、転写自体、RNAの5'キャッピング、3'ポリアデニル化、RNAスプライシングおよび/またはRNAの搬出に関与するタンパク質の配列の変化によって、転写非忠実度の現象を悪化させ得る。したがって、癌細胞から単離された遺伝子の多数に影響を及ぼす転写非忠実度に関する本発明における提示によって、現象がそれ自体を悪化させ得る可能性が開かれ、それにより疾病の重度が進行しながら増大する。転写の非忠実部分によって導入されるRNA配列の変動は、細胞機能に及ぼす即時的な結果を有し得る。実際、DNAテンプレートの塩基と相補的ではないRNA一次転写産物への塩基の導入は、結果的に得られるタンパク質AA一次配列に及ぼす即時的な有力な結果を有する。変化が、コドンの最初の2個の塩基に影響する場合、前記変化は、AA配列に及ぼす直接的な影響を典型的に発揮する。遺伝コードが縮重するので、コドンの第三の塩基に影響する変動は、タンパク質AA配列に及ぼすより低い影響を有するであろう。したがって、コドンの第三の位置に配置された塩基の変化は、タンパク質のAA配列に直接的には影響しないかもしれない。以下に記載されるデータに基づいて、本発明者は、転写の非忠実度が、コドンにおける塩基の位置とは無関係にすべての前記塩基に影響し、したがって、タンパク質AA一次配列に影響を及ぼす現象であると信じている。タンパク質における変化は、天然であり得または、活性の亢進もしくは損失かどうかでタンパク質の機能の改変を生じ得るかのいずれかである。転写非忠実度の現象は、成熟mRNAの少なくとも最初の400〜500塩基をコードすることが完了した後に主として観察され、mRNAの5'末端は、影響を比較的ほとんど受けにくい。タンパク質のより短いおよびより長い断片が、癌細胞中におよび癌患者由来の血漿中に存在するであろうと信じられている。これらのより短いおよびより長いアイソフォームは、以下に記載される転写非忠実度規則から直接的に推定されることが可能である。このことによって、癌または免疫学的疾病の重度の特異的なマーカーの同定のための合理的に設計された方法が作られる。ほとんどの遺伝子の転写の割合が、細胞の需要に適するよう調節されるので、転写非忠実度が、タンパク質機能の過剰または欠失のいずれかに直接依存して、遺伝子発現の変化を生じることが提唱される。したがって、転写非忠実度の現象は、細胞の課題を実行する細胞の能力に及ぼす顕著な効果を発揮する。したがって、癌細胞のすべての種類から単離されたほとんどの遺伝子の共通の特徴であるとしてこの欠損を同定することは、所定のいずれかの細胞における転写非忠実度の割合の定量的な測定を可能にする新たな方法を探るための理論的根拠を提供する。このスクリーニングアッセイによって、転写非忠実度を制限できる新規の薬物の検査が可能となり、それにより、疾病の進行を予防し、正常な細胞機能を回復させる。
【０１０４】
転写非忠実度および病理学
本発明は、転写非忠実度によって、タンパク質配列に重要な変化が生じることを示す。所定のいずれかのタンパク質の機能は、前記タンパク質のAA配列に直接依存する前記タンパク質の3次元構造によって決定される。変異形AA、タンパク質切り詰めまたはタンパク質伸長を有するタンパク質は結果的に、タンパク質活性の顕著な改変を生じ得または中性のままであり得る。改変されたタンパク質の正常なホモログの機能を有意に阻害する前記タンパク質の例が記載されている。転写非忠実度は、遺伝子の多数に影響を及ぼす現象であり、そのため、タンパク質の多数を生じる。これらのタンパク質のいくつもが、安定したDNA構造を維持するのに関与し、およびDNA修復に関与するので、これらのタンパク質の欠損した機能は結果的に、欠損したDNA修復を生じ得、および損傷したDNAを細胞がうまく修復する能力の有意な低下を生じ得る。正常細胞における転写忠実度が、転写を調節するいくつものタンパク質複合体の活性によるので、これらのタンパク質の初期的な小さな変化が、前記現象を進行性に悪化させ得ることはかなり可能である。このことは最終的に、細胞分化状態を結果的に抑制するであろう転写非忠実度のより大きな割合を結果的に生じるであろうし、疾病の形態の重度を増大させるに至るであろう。転写非忠実度が癌細胞中で実際に生じ、所定のいずれかの遺伝子によってコードされるタンパク質の広範な多様化に至るという提示は、新規の診断用プローブに関してスクリーニングしおよび新規の治療標的を設計するための新規の領域を開く。
【０１０５】
本発明は、DNAに存在する情報の多様化に関与しおよび特定の規則に従う新規の現象を記載する。非無作為な転写非忠実度のこの過程は、癌細胞において大いに悪化するが、同一の規則に従う正常細胞においても生じる。このメカニズムは、mRNA中に新規の塩基を導入し、それによりリボソームレベルで翻訳されるであろうメッセージにおける顕著な変化を生じる。前記現象は、検査されるほとんどの遺伝子に存在するので、非常に一般的であるようである。転写非忠実度の即時的な結果は、単一の遺伝子が、疑われるよりも多くのタンパク質を生じることが可能であることである。したがって、本発明者の発見は、ゲノム中に存在する遺伝子の制限された数と、生物試料中に存在するタンパク質の多数との間の相対的な矛盾を一部説明する可能性を有する。本発明者は、転写非忠実度が、非無作為な過程であり、および特定の規則によって統治されることを示しており、そのいくつかは既に本明細書に記載されている。いくつかは、バイオインフォマティクスおよび生物学的方法を使用する過程のさらなる特徴付けによって明らかにされるであろう。本発明者は、本明細書で、癌における転写非忠実度の意味に焦点を当てている。しかしながら、本発明者は、前記過程が一般的であり、およびこのことがタンパク質の多様性を生じるのに貢献することが可能であると信じている。タンパク質のこの多様性は、特定のタンパク質パターンを認識する免疫系の能力に有意な影響を発揮し得る。この点において、転写非忠実度は、免疫疾病の病変形成にある役割を担っていると信じられている。本発明者は、単一の塩基の置換に至る転写非忠実度の事象を考慮した。本発明者は、単一塩基置換のメカニズムが、mRNA構造の有意な脱安定化を生じるようには見えないので、単一塩基置換に焦点を当てた。したがって、単一塩基置換は、翻訳に干渉すべきではないが、真の新規のメッセージとして認識されるべきである。我々はさらに、転写非忠実度が、塩基の欠失および/または挿入を生じるとも期待されることを理解するであろう。上述の同一の方法は、転写非忠実度の代替的なメカニズムを検出するであろう。
【０１０６】
本願に記載された新規の方法は、いくつもの即時的な実用的適用を有する。
【０１０７】
新規の疾病特異的バイオマーカーを同定しおよび特定の疾病タンパク質を標的とするであろう新規の抗体を設計するためのプロテオミクス実験の最適化
本願の教示に基づいて、転写非忠実度の結果としていずれかのタンパク質配列で生じ得る変化を予測し、したがって、明らかな分子量および等電点等の物理化学的特性における変化を予測することは、いまや可能である。このことは、2次元ゲルおよび質量分析における改変されたタンパク質のパターンを生じ得る。転写非忠実度がほとんどの遺伝子に影響を及ぼすので、疾病（例えば、癌）特異的バイオマーカーを同定するために、タンパク質の制限されたセットに焦点を当てて、前記セットの変化を特徴付けることはいまや可能である。転写非忠実度アルゴリズムは、バイオマーカー発見過程の速度を上げることが可能である。あるいは、TIタンパク質のドメイン、すなわち、改変されたAAおよび転写非忠実度によって生じる未変性タンパク質を伸長する付加的な新たなAAを含有するタンパク質ドメインに対する特異的な抗体を設計することが可能である。これらのドメインに対する抗体は、タンパク質変異形特異的であろうし、したがって、体液中、細胞表面、または癌細胞の内部に存在する疾病（例えば、癌）特異的タンパク質を標的とするであろう。これらの抗体は、体液中の病理学的状態の特徴であるタンパク質を検出するために、血漿中で循環する罹患した細胞を検出するために、罹患した細胞を組織学的試料中で同定するために、疾病の重度を評価するために、およびまた、特定の罹患した細胞に対する薬物療法を目標とするために使用されるであろう。このことは、遺伝子治療ベクター、例えば、アデノウイルス、リポソーム等による、転写非忠実度を起こしやすい配列の遺伝子転移によって達成されることが可能である。あるいは、本発明者は、TIから生じるドメインと同一の配列を有する特定のペプチドを設計した。前記ペプチドは、例えば体液中に存在するTIタンパク質のドメインに対する特異的かつ天然の自己抗体を検出するために使用されることが可能である。
【０１０８】
転写非忠実度は、非無作為に生じ、検査される遺伝子の大部分においてmRNA終止コドンに頻繁に影響する。さらに、mRNAのいずれかの所定の集団の6％までが、これらのさらなる配列を含有すると概算することが可能であるので、したがって、カルボキシ末端において新規の配列を呈するタンパク質の特定の集団を、所定の癌細胞中で検出することが可能である。したがって、これらの配列の標的化は、とても考えられず、その理由は、DNAに影響を及ぼす希少な遺伝的疾患を除き、報告されている過程が、基準の終止コドン直後の配列のインフレームの読み取りを導入できないからである。これらの隠された配列の存在は、あらかじめ疑われてはいなかった。基準の終止コドンで生じる単一塩基の置換に至る転写非忠実度の発見は、このようなコード化配列の存在を明らかにし、さらに、前記コード化配列の存在が、癌細胞における増大した転写非忠実度のため、これらの細胞において増大することを示す。したがって、新規の癌特異的薬物を設計するためにこれらの正常に隠された配列を同定しおよび標的にすることは可能である。
【０１０９】
コード化配列上で生じる単一塩基の欠失または挿入に関するTIは、コード化フレーム中でのスイッチとなる。収束として、対応するタンパク質における配列が改変される（AA配列およびタンパク質長における変化）。したがって、あるものは、新規の配列を呈するタンパク質の特定の集団を、所定の癌細胞中で検出することが可能である。したがって、新規の癌特異的薬物を設計するためにこれらの正常に隠された配列を同定しおよび標的にすることは可能である。
【０１１０】
新規のまたは改変されたタンパク質配列の存在のため、およびこれらの変化が、細胞表面上に存在するタンパク質上にあることを考慮すると、疾病特異的配列に対してワクチン接種するために、これらの配列を使用することが提唱される。これらのワクチン接種は、疾病のいずれかの所定の形態を有すると診断された患者において免疫反応を惹起するために、または遺伝的素因のため、または環境毒素もしくは危険性への増大した曝露のため、特定の疾病（例えば、癌）を発達させる増大した危険を有する患者において予防的免疫反応を開始させるために使用されるであろう。
【０１１１】
したがって、本発明の具体的な目的は、対象において疾病の存在または段階を検出する方法であって、前記方法は、該対象からの試料において転写非忠実度の存在または割合を（インビトロまたはエクスビボで）評価することを含み、該存在または割合は、該対象における疾病の存在または段階の指標である。試料は、核酸および/またはタンパク質を含有するいずれかの組織、細胞、液体、生検等であり得る。試料は、反応前に、すなわち、希釈、濃縮、溶解等によって処理され得る。方法は典型的に、血漿タンパク質、細胞表面タンパク質等の多くの異なる遺伝子またはタンパク質の転写非忠実度を評価する。
【０１１２】
本発明のさらなる目的は、対象を治療する方法を必要とする対象を治療する方法であり、前記方法は、哺乳動物遺伝子の転写非忠実度の割合を変化させる（例えば、低下させるまたは増大させる）化合物の有効量を該対象へ投与することを含む。
【０１１３】
本発明のさらなる目的は、ヒトまたは動物の治療の方法において使用するための、特に、癌および免疫疾患等の増殖性細胞障害を治療するための医薬組成物の製造のために、哺乳動物遺伝子の転写非忠実度の割合を変化させる（例えば、低下させるまたは増大させる）化合物の使用に関する。
【０１１４】
本発明のさらなる目的は、薬物または候補薬物の有効性を評価する方法に存し、前記方法は、該薬物が、哺乳動物の遺伝子の転写非忠実度の割合を変化させるかどうかを評価する工程を含み、このような変化は、薬物の有効性の指標である。
【０１１５】
本発明はさらに、試料中で転写非忠実度（のレベル）を検出しまたは測定するための方法および（プローブ、プライマー、抗体またはそれらの誘導体等の）製品、ならびに対応するキットに関する。
【０１１６】
本発明は、バイオマーカーを同定または作製する方法に関するものであり、前記方法は、対象からの試料中で、標的のタンパク質、RNAまたは遺伝子における転写非忠実度部位の存在を同定すること、および場合により、該転写非忠実度部位の配列を決定することを含む。具体的かつ好ましい実施態様において、標的タンパク質は、細胞表面タンパク質または分泌型タンパク質、特に細胞表面タンパク質または血漿タンパク質である。
【０１１７】
本発明のさらなる目的は、形質または病理学的状態に特異的なリガンドを作製または同定する方法に関するものであり、前記方法は、該形質または病理学的状態を有する対象からの試料中で、1つまたはいくつもの標的のタンパク質、RNAまたは遺伝子における転写非忠実度部位の存在を同定すること、場合により、該転写非忠実度部位の配列を決定すること、および該転写非忠実度部位へ特異的に結合するリガンドを作製することを包含する。
【０１１８】
本発明は、癌、免疫疾患、炎症性疾患または加齢等の細胞増殖性障害のバイオマーカーを同定するのに特に適している。本発明は、哺乳動物対象においてこのような障害に特異的なリガンド、特に、対象において細胞増殖性障害の存在または重度を検出することが可能なリガンドを作製するのに特に有用である。
【０１１９】
本発明のさらなる局面は、特に哺乳動物タンパク質の、より好ましくはヒトタンパク質の転写非忠実度部位を含む（合成）ペプチドに関する。ペプチドは典型的に、タンパク質の内部断片または該タンパク質のC末端断片の配列を含む。ペプチドは好ましくは、100、80、75、70、65、60、50、45、40、35、30、25またはさらには20個未満のアミノ酸を含む。タンパク質は、細胞表面タンパク質（例えば、受容体等）、分泌型タンパク質（例えば、血漿タンパク質等）、または細胞内タンパク質であり得る。このような血漿タンパク質の例は、例えば図１３に提供され、アポリポタンパク質（例えば、AI、AII、CI、CII、CIII、D、E）、補体成分（例えば、C1s、C3、C7）、C反応性タンパク質（C-reactive protein）、セルピンペプチダーゼ阻害剤、フィブリノーゲン（例えば、FGA1、FGA2）、プラスミノーゲン、トランスフェリン、トランスチレチン等を含む。細胞表面受容体の例は、例えば、サイトカイン受容体およびホルモン受容体等を含む。具体的な実施態様において、本発明は、上述に列挙される豊富なヒト血漿タンパク質または細胞表面受容体の転写非忠実度部位を含む合成ペプチドに関する。
【０１２０】
このようなペプチドの具体的な例は、図１０、１４および１８に開示される。より具体的には、本発明の合成ペプチドの例は、次のアミノ酸配列のすべてまたは断片を含む。
【０１２１】
【表１】

【０１２２】
本発明のさらなる局面は、免疫原として上述に定義される、転写非忠実度部位を含むペプチドの使用に存する。本発明は、上述に定義される、転写非忠実度部位を含むペプチドと、場合により適切な担体、賦形剤および/またはアジュバントとを含むワクチン組成物にも関する。
【０１２３】
本発明は、支持体上に固定化された、転写非忠実度部位と特異的に結合する試薬を含むデバイスまたは製品にも関する。試薬は、例えば、プローブもしくは抗体またはそれらの誘導体であり得る。
【０１２４】
本発明は、いずれかの哺乳動物対象、特にいずれかのヒト対象において、例えば、細胞増殖性障害（例えば、癌）、免疫疾患（例えば、自己免疫疾患（多発性硬化症、ALS）、移植片拒絶反応）、加齢、炎症性疾患、糖尿病等の増大したまたは低下した転写非忠実度の割合と関連した多様な病理学的状態を検出し、モニターしまたは治療するために、および/または治療活性のある薬物を製造し、設計しまたはスクリーニングするために使用され得る。本発明は、原核細胞、低級真核生物（例えば、酵母）、昆虫細胞、植物細胞、真菌等のいずれかの他の細胞の種類において、転写非忠実度を検出し、モニターし、調節しまたは標的とするためにも使用され得る。
【０１２５】
転写非忠実度部位を標的とする薬剤の製造および使用
本発明の教示を使用して、例えば、転写非忠実度部位を含有するタンパク質もしくは核酸へ、またはこのようなタンパク質もしくは核酸を含有しまたは発現する細胞もしくは組織へ結合する転写非忠実度部位を標的とすることが可能な薬剤を製造することは可能である。標的とする薬剤は、上述に開示される抗体（またはその誘導体）、プローブ、プライマー、アプタマー等であり得る。
【０１２６】
このような標的化薬剤は、例えば、診断薬として、試料、組織、対象等における転写非忠実度を検出し、モニターするなどのために使用され得る。その目的のために、前記薬剤は、放射標識、酵素、蛍光標識、発光色素等の標識部分へ結合され得る。
【０１２７】
標的化薬剤は、例えば、異常な転写非忠実度を呈する細胞または組織または生物体を治療するために、治療分子としても使用され得る。薬剤は、このように使用され得、または好ましくは、毒性のある分子、薬物等の活性分子へ結合され得る。
【０１２８】
したがって、本発明の具体的な実施態様は、転写非忠実度を標的とする薬剤の製造方法に存し、前記方法は、（i）タンパク質または核酸の転写非忠実度部位を同定すること、および（ii）該部位と選択的に結合する薬剤を製造することを含む。転写非忠実度部位は、例えば、所定のRNA分子にとって利用可能な配列のアラインメント、および特に3'末端での配列バリエーションの同定によって同定され得る。転写非忠実度部位は、本願に記載される転写非忠実度規則（例えば、実施例5参照）または後述の新たな規則をいずれかの遺伝子配列へ適用することによっても同定され得る。次に、該同定された部位を含むペプチドまたは核酸分子は、従来法を使用して製造され得る。好ましい実施態様において、前記方法の工程（i）は、分泌型タンパク質もしくは細胞表面タンパク質（例えば、受容体等）のまたは核酸の転写非忠実度部位を同定することを含む。実際、分泌型タンパク質および細胞表面タンパク質は、細胞と接触しまたは対象へ投与される標的化薬剤を使用して容易に標的とされることが可能である。このようなTIタンパク質のドメインの例は、実施例に開示される。
【０１２９】
TIタンパク質のドメインに対する免疫反応を生じ、または刺激しまたは阻害するワクチンの製造および使用
本発明の教示を使用して、TIタンパク質に対する、またはこのようなTIタンパク質もしくは対応する核酸を含有しまたは発現させる細胞もしくは組織に対する免疫反応を生じまたは阻害するワクチン組成物を製造することは可能である。
【０１３０】
典型的には、ワクチン組成物は、免疫原として、転写非忠実度部位の配列を含む分子を含む。ワクチン組成物は、医薬的に許容されるいずれかの担体、賦形剤またはアジュバントを含み得る。ワクチン組成物は、罹患した細胞もしくは組織の破壊を免疫系によって生じる、TIタンパク質を発現する該細胞もしくは組織に対する免疫反応を生じるために使用されることが可能である。あるいは、ワクチン組成物は、自己免疫疾患に関与する転写非忠実度部位に対する耐性を誘導するために使用され得る。
【０１３１】
したがって、本発明の具体的な実施態様は、TIタンパク質のドメインに対するまたはこのようなタンパク質を発現する細胞もしくは組織に対する免疫反応を生じ、刺激しまたは阻害する免疫原を作製する方法に存する。前記方法は、（i）タンパク質または該酸の転写非忠実度部位を同定すること、および（ii）かかる部位またはその変異体を含むペプチドを製造することを含む。転写非忠実度部位は、例えば、所定のRNA分子にとって利用可能な配列のアラインメント、および特に3'末端での配列バリエーションの同定によって同定され得る。転写非忠実度部位は、本願に記載される転写非忠実度規則（例えば、実施例5参照）または後述の新たな規則をいずれかの遺伝子配列へ適用することによっても同定され得る。次に、該同定された部位を含むペプチド分子は、従来法を使用して製造され得る。好ましい実施態様において、前記方法の工程（i）は、分泌型タンパク質もしくは細胞表面タンパク質（例えば、受容体等）のまたは核酸の転写非忠実度部位を同定することを含む。実際、分泌型タンパク質および細胞表面タンパク質は、免疫系による反応へより多く供される。このようなTIタンパク質のドメインの例は、実施例に開示される。
【０１３２】
リコンビナントタンパク質生成系における低下した転写非忠実度
本発明の具体的な目的は、リコンビナント生成系において、特に治療タンパク質生成系において生じ得る転写非忠実度を予防または低下させる方法に存する。実際、このような転写非忠実度は、系の生成の収量を低下させ得、または多様な活性特性を呈し得る特徴付けられていないタンパク質に関する混合物の生成を生じ得るかのいずれかである。したがって、細菌生成系（転写非忠実度規則が、原核生物系と同一である場合）、真核生成系（例えば、酵母、哺乳動物細胞等）などのリコンビナント生成系において転写非忠実度の発生または割合を低下できることが推奨されおよび非常に価値がある。このような低下は、例えば、コード化核酸分子の配列を順応させることによって、および/または転写非忠実度を通じて生じたRNA分子を阻害することによって達成され得る。あるいは、転写非忠実度部位を含有するタンパク質は、培地から回収され得る。
【０１３３】
遺伝子に関する転写非忠実度に対する感受性の低下
本発明の具体的な目的は、遺伝子において生じる可能性のあるTIを予防しまたは低下させる方法に存する。実際、このようなTIは、タンパク質の発現または活性のいずれかに影響し得、または多様な活性特性を呈し得る特徴付けられていないタンパク質の混合物の生成を結果的に生じ得る。したがって、該遺伝子に関してTIの発生または割合を低下できることが推奨され、および非常に価値がある。このような低下は、例えば、遺伝子の配列を改変することによって（遺伝子治療）、および/または転写非忠実度を通じて生じたRNA分子を阻害することによって達成され得る。あるいは、TI部位を含有するタンパク質は、特異的に分解され得る（例えば、分解のために特異的に標的とされる）。
【０１３４】
RNAレベルでの転写非忠実度の測定
トランスクリプトミクス（transcriptomics）とは、多様な病理学的状態において生じるRNA（優先的にはmRNA）レベルにおける変動を測定する科学であり、前記病理学的状態のうち、癌が最も頻繁である。トランスクリプトミクスは、遺伝子のあらかじめ定義されたサブセットを同定するオリゴヌクレオチドの特定のセットとのcDNAのハイブリダイゼーションに依存する。ハイブリダイゼーションの有効性は、cDNA中で逆転写されるであろう所定のいずれかのRNAの特定の配列に依存する。所定のRNAにおける疑われていない配列のバリエーションの導入は、ハイブリダイゼーションの有効性を低下させるであろうし、したがって、トランスクリプトームチップによって認知されるシグナルに変動を生じさせる。転写非忠実度がRNA塩基配列の変化を生じるという発見は、2つの即時的な結果を有する。第一に、前記発見によって、転写非忠実度による塩基のミスマッチの結果を最小化し、それによりトランスクリプトーム実験の正確性を向上させるために、トランスクリプトームチップの最適化が可能となる。実際、トランスクリプトーム実験の現段階での制限は、研究間の再現性の欠失である。本発明者は今のところ、変動の大部分が、転写非忠実度によって生じると信じている。上述に記載される転写非忠実度の規則を理解することによって、いまや正常細胞または罹患した細胞から得られるcDNAの所定のいずれの混合物においても転写非忠実度の割合を特異的に測定するマイクロアレイチップの設計が可能となる。RNAレベルで転写非忠実度の割合をモニターすることによって、所定の細胞において生じる転写非忠実度の相対的な割合を高処理量でスクリーニングすることが可能となる。このことは、疾病の重度を決定し、治療戦略を規定し、罹患した細胞の病理学的感作特性に従って前記細胞を分類するために不可欠な情報を提供する。同一のスクリーニングによって、例えば、癌治療における新規の薬物の有効性を検査することも可能である。
【０１３５】
転写非忠実度のさらなる応用
転写非忠実度とは、十分に確立された遺伝コードへ多様化を付加する新たに発見された天然のメカニズムである。本発明者は、正常組織においてでさえ低い割合にもかかわらず転写非忠実度が生じることを観察した。本発明者は、転写非忠実度が、ゲノムにおいて同定された遺伝子の相対的に低い存在量ならびに生物の液体および組織の生細胞中に存在するタンパク質の非常により大きな多様性を説明することに関与することを提唱する。
【０１３６】
本発明者は、転写非忠実度が、免疫学的レベルで特異的な機能を供することを提唱する。本発明者はさらに、免疫系が、自己を同定するために優先的に特異的な遺伝子に影響を及ぼす転写非忠実度の所定の割合に少なくとも一部依存することを提唱する。したがって、まだ公知ではない理由のために生じる転写非忠実度の割合の異常性は、特異的な免疫反応を惹起するのに関与し得、ならびに自己免疫疾患およびアレルギー疾患の病変形成に関与し得る。転写非忠実度における個体間の差異は、免疫系の遺伝子の多型、それゆえ、免疫系の循環している細胞、例えばTリンパ球またはBリンパ球において生じる転写非忠実度の割合を決定することによっても条件付けられ得、移植片のドナーおよびアクセプターの適合性の評価ならびに疾病の移植片の重度対宿主の重度を決定することにおいても関与し得る。
【０１３７】
本発明者は、転写非忠実度が、正常な加齢過程の間により大きな割合で生じることも想定する。このことは、細胞複製、DNA修復および転写忠実度の正常な割合の維持に関与する一般的に全ての酵素および最も具体的は前記酵素のタンパク質に影響を及ぼす性能の漸減の条件を創出するであろう。したがって、上述に記載される概念は、加齢のメカニズムへ研究を再度方向付け得る。mRNAおよびcDNAの配列ならびにDNAによって指定される配列に対する忠実度に関してスクリーニングできる生化学的、プロテオミクス的、トランスクリプトーム的な方法および他の方法はしたがって、所定の個体において生じる転写非忠実度の割合を定量化するのに使用され得る。したがって、転写非忠実度の割合を低下させる新規の分子の検査は、生物学的スクリーニングを受け入れられるであろうし、加齢の割合を低下させる薬物の開発に至るであろう。
【０１３８】
本発明のさらなる局面および利点は、次の実験セクションにおいて開示されるであろうし、前記セクションは、本発明を説明するものであり、本願の範囲を制限するものではない。
【０１３９】
実験セクション
実施例1．典型的なcDNAライブラリ構築および配列決定の原理（図１参照）
相補的DNA（cDNA）ライブラリを調製する上での第一の工程は、関心対象の細胞または組織の種類から成熟mRNAを単離することである。前記mRNAのポリ（A）テイルのため、マトリックスへ共有結合した相補的オリゴdTとのハイブリダイゼーションによって、すべての細胞mRNAの混合物を得ることは直接的である。次に、結合したmRNAを低塩バッファーで溶出する。次に、mRNAテンプレートから相補的DNA鎖を合成する酵素である逆転写酵素の存在下で、mRNAのポリ（A）テイルをオリゴdTとハイブリダイズさせる。このことは、もとのmRNAテンプレートとその相補的DNA配列とを含有する二本鎖ヌクレオチドを生じる。次に、アルカリ処理によってまたはRnaseHの作用によってRNA鎖を除去することによって、一本鎖DNAを得る。次に、テンプレートを必要としないが、各cDNA鎖の遊離3'末端へデオキシオリゴヌクレオチドを付加するDNAポリメラーゼである末端トランスフェラーゼと呼ばれる酵素の作用によって、一連のdGを一本鎖DNAの3'末端へ付加する。DNAポリメラーゼによってもとのcDNA鎖と相補的なDNA鎖を合成するためのプライマーとして作用するオリゴdCとオリゴdGをハイブリダイズさせる。これらの反応は、もとの調製物中で見出されるmRNA分子に対応する完全な二本鎖DNA分子を生じる。これらの二本鎖DNA分子の各々は、cDNAと普遍的に呼ばれ、各々、片方の末端にオリゴdC-オリゴdG二本鎖を、もう片方の末端にオリゴdT-オリゴdA二本鎖領域を含有する。次に、このDNAを、制限部位でのメチル化によって保護する。次に、両末端へ短い制限リンカーを連結する。これらは、特定の制限酵素に対する認識部位を含有する二本鎖合成DNAセグメントである。「平滑末端化された」二本鎖DNA分子を接合することの可能なバクテリオファージT4由来のDNAリガーゼによって連結を実施する。次に、各末端に制限部位を有する結果的に生じる二本鎖の平滑末端化されたDNAを、粘着末端を生成する制限酵素で処理する。cDNAライブラリの構築における最終的な工程は、細菌中へトランスフェクトされる特異的プラスミドとの制限切断された二本鎖の連結である。次に、プラスミドの特異的な抗生物質抵抗性に対応する抗生物質の存在下でプラスミドのライブラリを生じるために、リコンビナント細菌を増殖させる。各クローンは、mRNAの単一部分に由来するcDNAを有する。次に、これらの各クローンを単離し、古典的な配列決定方法を使用して配列決定する。配列決定の典型的な試行は、挿入部位で開始し、各クローンにつき400〜800塩基対の配列を生じる。この配列は、配列決定の第二の試行を開始するためのテンプレートとして機能する。この順方向の進行によって、プラスミドインサート全体が漸次配列決定される。ESTで命名された数多くのcDNAの配列決定の結果は、いくつもの公共のデータベースにおいて委託されている。
【０１４０】
実施例2．データベースアノテーション
ESTデータベースは、cDNAライブラリから得られたcDNA配列に対応する配列情報を含有し、したがって、これらのライブラリを作成するのに使用された組織において所定のいずれかの時間で存在する個々のmRNAの配列に本質的に対応する。これらの配列の質は、いくつもの理由のため、疑わしい。第一に、上述に論議されるように、cDNAライブラリを作成する過程は初めに、真核mRNAの3'末端にあるポリ（A）テイルの存在に重度に依存した。第二に、mRNAは、RNaseと呼ばれる高い存在量のヌクレアーゼによって簡単に消化される非常に脆弱な分子である。第三に、これらのライブラリを構築および配列決定する間に、使用される原材料の質および前記原材料の保存にほとんど注意が払われていなかった。このため、EST配列を使用して、ゲノム情報をアノテートし、すなわち、ゲノムDNAの同定されかつ完全に配列決定されたセグメントが、いずれかの特異的なmRNAをコードするかどうかを決定した。この脈絡において、EST配列は、コード化するゲノム配列を同定するために有用であった。しかしながら、EST配列自体によって伝えられる情報にほとんど注意が払われていなかった。実際、DNAゲノム配列は、この位置の支持における強力な技術的議論とともに非常により信頼できるものとして考慮される。本発明者は、EST配列において含まれた多様性が、生物学的に、分析上または臨床的に関連性のある情報を含有し得ると推測する。実際、ESTデータベースは、多様な方法をすべて使用した多くの研究者によって作成された。このことによって本発明者は、各方法論的バイアスが、エラーの一定の数を有する背景ノイズレベルに関与しているに違いないことを推測した。しかしながら、エラーにおける差異が、ライブラリを生じるのに使用される材料の源に応じて存在することである場合、エラー率における差異は、根元的な源に直接的に関連するであろう。
【０１４１】
このことを検査するために、本発明者は、NCBI ftpサイトで利用可能なest_humanデータベースを検索した。これらの配列が、ヒトまたはバイオインフォマティクスツールによってアノテートされずまたは矯正されなかったので、本発明者は、これらのデータベースを選択した。
【０１４２】
本発明者は、ESTが、癌組織から得られたのかまたは正常組織から得られたのかを決定するために、ライブラリ同定システムを使用した。各ライブラリは、正常または癌性と標識された。各ESTの受託番号を、対応するライブラリの同定子と符合させることによって、本発明者は、260万個のESTを癌組織から得られたものとして、280万個のESTを正常組織から得られたものとして分類した。
【０１４３】
ESTアラインメントを得るために、本発明者は、公共的に利用可能なmegaBLAST 2.2.13ソフトウェア（Basic Local Alignment Search Tool, Zheng Zhang, A greedy algorithm for nucleotide sequence alignement search, J Comput Biol, 2000）を使用し、次の選択パラメータを指定した。
-d est_human：（dbEST由来のすべてのヒトEST）に対して検索するためのデータベース、
-i sequences.fasta：豊富に発現した遺伝子に対応する基準配列を含有するFASTAファイルフォーマット（図２）、
-D 2：伝統的なblast出力、
-q -2：ヌクレオチドミスマッチに関する-2のスコア、
-r 1：単一ヌクレオチドマッチに関する1のスコア、
-b 100000：アラインメントが報告された配列の最大数、
-p 90：ESTと基準配列との間の最小の％同一性、
-S 3：基準配列と符合するESTを考慮に入れる、
-W 16：アラインメント伸長で開始するための最良の完全な符合の長さ
-e 10：Karlin and Altschul（1990）の確率モデルに従って、単に偶然に、所定の配列および所定のデータベースに関して見出されると期待されるアラインメントの数である期待値（E値）、
-F F：基準配列をフィルタリングするものがないこと。
-o NonFiltre_test_90.out：megaBLASTリポートアウトファイル（outfile）
v 0：1つの系の記述を示すための配列の最大数、
-R T：（真に関してはT）：megaBLAST出力の終了時のログ情報を報告、
-I T：デフライン（defline）[T/F]におけるGIを示す
blastに関するコマンド系列： megablast -d est human -i C:＼SeqRef＼TPTl＼sequences.fasta
-o C:＼blast＼NonFiltre_test_90.out -R T -D 2 -I T -q -2 -r 1 -v 0 -b 100000 -p 90.00 -S 3 -W 16 -e 10.0 -F F
【０１４４】
図２ａ〜ｑは、分析に使用される17個の配列を示し、blastが歪むのを回避するために、mRNA基準配列のポリAテイルを系統的に除去した。図２ｒは、配列変動の発生を検査するために使用された遺伝子のリストを提供する。
【０１４５】
実施例3．正常起源および癌性起源由来のEST間の配列変動の同定
データベースにおける17個の遺伝子の大きな提示に基づいて、前記遺伝子を選択する。次に、MegaBLASTを使用して、各EST配列のNCBI由来のキュレートされた（curated）mRNA基準配列（RefSeq）に対して、前記EST配列を整列化した。このことは、所定のいずれかの塩基が、この位置とのESTの符合数によって規定されるマトリックスを作成する。次に、本発明者は、所定のいずれかの位置でRefSeqからはずれたESTの割合を測定した。組織起源に従った整列化されたEST配列の比較によって、配列変異が癌セットにおいて最も頻繁に起こり、本発明者は、癌群または正常群のいずれかにおける各塩基位置で生じる配列変動を同定した。図４は、17個の選択された遺伝子に関して正常セットおよび癌セットにおいて生じるこれらの変動のグラフによる提示を提供する。データの視覚的検討によって、配列変異が癌セットにおいて最も頻繁に起こり、現象が、特定のmRNA部位で最も顕著であるように見えることが明らかとなった。観察した大部分は、mRNA配列の開始後少なくとも400〜500塩基に、それゆえ、主として遺伝子の3'部分に配置される。変動の非常に高い数は、SNPによって説明されることは不可能であった。推定SNP（□）および生理学的に実証されたSNP（○）をグラフに示しており、これらのSNPをNCBIデータベースから得た（dbSNP、126個を構築、September 2006）（Sherry, S. T., et al. (2001) Nucleic Acids Res 29, 308-11）。 (2001) Nucleic Acids Res 29, 308-11).推定SNPおよびESTの変動（n＝442）に至る生理学的に実証されたSNPの両者は、さらなる分析から排除した（したがって、RNA編集部位（偽SNP）も排除した）。
【０１４６】
本分析の次の工程は、癌性ESTと正常ESTとの間で生じる配列バリエーションにおける差異の統計的有意性を検査することであった。各位置に関して、本発明者は、両側の比の検定を使用して、正常群と癌群との間で、RefSeq塩基の割合を3つのその他の塩基の割合と比較した。本検定は、系統的に提供され、ただし、次の条件、すなわち、n＞70および（n_i.*n_.j）/n＞5 i＝1,2；j＝1,2（式中、n＝1つの遺伝子あたりの癌性ESTおよび正常ESTの数、n₁＝癌性ESTの数、n₂＝正常ESTの数、n_.1＝RefSeqを有するESTの数、n_.2＝置換を有するESTの数）に適合した。統計的検定は、対応するP値が、0.05未満である場合はいつでも、5％の閾値レベルで正であるといわれており、この場合、帰無仮説（すなわち、両者の比が同一である）は、棄却される。
【０１４７】
さらに、どのセットにおいて変動がより大きいかを正確にするために、次の2つの片側の比の検定を考慮した。第一の検定は、統計的検定が正の場合に両群において変動性が異なることを結論付けることを可能にした後、この場合において変動性が癌セットにおいて統計的に大きいかどうかを測定した。対照的に、第二のセットは、変動性が正常セットにおいて有意により高いという仮説を検証した。両側検定と同等の条件が合致している場合にはいつでも、両者の片側検定を実施した。
【０１４８】
図３は、典型的なblast結果の記載を提供する。図５ａおよび５ｂに示されるように、代表的な遺伝子TPT1に関して、遺伝子上のいずれかの所定の位置にあるESTの数は、癌群および正常群の両者において同様である。図５ｃは、830個の正の比の検定のうちの489個が、割り当てられた基準に合致することを示す。5％のレベルで統計的に有意であった比の検定を図５ｄに示す。配置ベースの概算装置（Location Based Estimator）（C.Dalmasso, P.Broet (2005) Journal de la Societe Francaise de Statistique, tome 146, nl-2, 2005）によって定義される多重検定から結果的に得られる概算された誤差は、算出されることが可能である。26個の比の検定の正のものは、図５ｄにおいて正常組織（N＞C）で生じる塩基置換による（n＝26；LBE＝33）。このことは、癌群における配列バリエーションのため（C＞N）に生じる統計的に有意な比の検定の蓄積とは対照的である（n＝145；LBE＝15）。第二の遺伝子VIMに関して同様の分析を実施した（図５ｅ〜５ｈ）。この場合も先と同様に、所定のいずれかの遺伝子の位置にあるESTの数は、癌群および正常群において重ね合わせることができる。1847個の比の検定のうち752個が、基準に合致した。この場合も先と同様に、本発明者は、正の比の検定の数における大きな差異を観察した。すなわち、n＝78のバリエーションは、正常群（LBE＝50）によるものであり、n＝269のバリエーションは、癌群（LBE＝24）によるものである。本発明者は、ESTデータベース中に豊富に存在する17個の遺伝子に関して同一の分析を反復した。図５ｉは、得られた統計的な結果の要約である。検査された17個の遺伝子のうち、15個は、癌組織から得られたESTにおけるより大きな配列バリエーションを呈する（図５ｊ）。この段階で、統計的検定の制約のため、各遺伝子の位置のたったの9〜91％（32％の平均）を対象とした。
【０１４９】
分析のこの第一ラウンドの結論は、mRNAが抽出された組織（正常対癌）の源に従って比較される場合に、同一遺伝子のESTが異なったというものである。EST配列バリエーションを生じる技術的なエラーの割合が、組織の正常起源または癌性起源に従って異ならないと仮定し、検査した17個の遺伝子のうちの15個が、組織源による配列バリエーションを示したという事実を考慮すると、本発明者は、これらの差異が、ESTの生じた細胞の正常対癌性の状態から直接的に結果として生じることを提唱する。
【０１５０】
挿入および欠失を研究するために、同様の実験を実施する。F3フィルターを適用した後に結果を得る（実施例4参照）。非生物学的事象（配列決定エラー、Megablast誤整列化等）を回避するために、より厳密な条件を使用した。すなわち、他の改変が、-10/+10のウィンドウ中に存在しない場合、ギャップまたは挿入を考慮するに過ぎなかった。各位置に関して、本発明者は、上述のような両側の比の検定を使用して、正常群および癌群との間で他のウィンドウに対する欠失（または挿入）を有するウィンドウの比を比較した。図５ｋは、得られた統計的な結果の要約である。検査した17個の遺伝子のうち、14個（または挿入に関しては10個）は、癌組織から得られたESTにおけるより大きな配列バリエーション（欠失および挿入）を呈する（図５ｌ）。
【０１５１】
実施例4：癌セットC＞N対正常セットN＞Cにおけるバリエーション過剰の検証
癌試料または正常試料由来のライブラリを、本質的に同一の様式で処理する。したがって、ライブラリ構築またはクローン配列決定から結果的に生じる無作為なエラーは、両セットにおいて同一の割合で生じると期待され、正常EST群と癌EST群との間で観察された差異を説明することは不可能である。算術的な分析は、この解釈と一致する（Brulliard M., et al PNAS May 1, 2007 vol. 104 no. 18 7522-7527 - 補遺材料図７参照）。
【０１５２】
本発明者は次に、以下の論理的根拠に基づいてフィルタリング手法を連続的に適用することによって、EST不均一性の他の原因を排除するよう検索した。本発明者の初期的な必要条件は、ESTが、ESTが、少なくとも16個の連続した塩基において100％の同一性を有し、少なくとも50個の塩基において90％以上の同一性を有するRefSeqに対して整列化したであった。図６ｂに示されるように、このことは、17個すべての遺伝子に関して癌セットと正常セットとを比較する場合、2281および725の統計的有意差C＞NおよびN＞Cをそれぞれ生じ（列F1）、推定SNPまたは生物学的に立証されたSNPとは異なる。第二のフィルター（F2）は、各ESTが、RefSeqの長さの70％を超えるものに関して連続的にRefSeqと整列化することを必要とした。第三のフィルター（F3）は、真正のRefSeqに対してよりもパラログおよび偽遺伝子とさらに密接に関連した配列を有するESTを除去した。第四のフィルター（F4）は、各ESTアラインメントの最初および最後の50個の塩基を分析から削除した。アラインメントをさらに最適化するためにMegaBLASTプログラムによって作製可能なESTの3'境界および5'境界でミスマッチを除去するために、および/または整列化されたEST先端でのエラー蓄積から結果的に生じるものを除去するために、本発明者はこのフィルターを使用した。最後のフィルター（F5）は、正常セットと癌セットとの間の長さにおけるいずれの差異も除去するために、各遺伝子についてEST配列長を標準化した。実際、本発明者は、最初の4個のフィルターを適用した後、平均癌EST長が、正常ESTの平均長よりも大きなことに気付いた（それぞれ、640±248塩基および554±229塩基）。しかしながら、本発明者は、5個の遺伝子において有意により大きな癌EST不均一性も観察し、その中で、平均EST長は、正常セットと癌セットとの間で異ならなかった（TPT1、VIM、HSPA8、LDHA、CALM2）。
【０１５３】
統計的に有意なC＞Nの検定の数は、N＞Cの検定の数よりも大きなままであったが、C/N比は3.15（F1）から2.05（F5）まで低下した（図６ｃ）。
【０１５４】
癌ESTの不均一性が、配列決定試行の終了時にエラーの蓄積によるものではないことをさらに解明するために、本発明者は、いずれかの配列決定試行の最初の50塩基および450個未満の長さの塩基の後に提供される情報のみを考慮に入れた。この大幅なフィルタリングの後、統計的に有意なC＞Nの検定は、17個の遺伝子すべてについて455（LBE＝92）であり、N＞Cの検定は、292（LBE＝119）であった。したがって、癌セットにおいて増大したEST不均一性を生じる配列バリエーションが、癌細胞mRNAの不均一性を直接反映することは、合理的に推測可能である（図６ｄ）。
【０１５５】
本発明者は次に、培養した癌細胞から生じるESTを除去した後の癌セットにおいて、統計的に有意なより大きなEST不均一性が存続することを独立して検証した。このフィルタリングの後、統計的に有意なC＞Nの検定は、17個の遺伝子すべてについて1009（LBE＝117）であり、N＞Cの検定は、445（LBE＝193）であった（図６ｅ）。
【０１５６】
実施例5．癌細胞における転写非忠実度が原因で生じる塩基置換のコードの破壊
本発明者の次の目的は、転写非忠実度による塩基置換に関して記載された現象が、無作為な現象であるかまたは特定の規則に従うのかどうかを決定することであった。このことを達成するために、本発明者は、C＞Nが統計的に有意であるESTバリエーションに焦点を当てた。フィルタリング手法によって導入され得るバイアスを回避するために、本発明者は、フィルターにかけられていない利用可能なデータをすべて使用した。転写非忠実度が無作為な過程ではないという最初の表示は、検査した遺伝子の5'領域において塩基置換がまれに生じることであった。検査した遺伝子すべてについて、本発明者は、成熟mRNAの最初の400〜500個の塩基において生じる塩基置換の現象を非常にまれに観察した。第二の観察は、置換事象の上流および下流の配列（不均一性、H、n＝2281）を置換事象が検出されなかった配列（均一性、NH、n＝12273）と比較した場合に観察されるゲノムDNAテンプレートに関して塩基組成における差異があるという観察から、転写非忠実度が無作為な幹ではないことを示す。NH部位に関する基準は、0.5％よりも低い癌セットのバリエーションであり、正常セットのバリエーションとは統計的に差がなかった（図７ａ）。この分析において、本発明者は、置換を受ける塩基をb0と呼び、pmRNAの5'末端に配置される塩基は、b-nと呼ばれ、3'末端に配置される塩基はb+nと呼ばれる。明確にする目的のため、本発明者は、この分析において、pmRNAの塩基組成に言及する。これは、DNA上でテンプレートではない鎖（RNAPによって転写されない鎖）に相当する。データはまず、4個の塩基すべてが必ずしもバリエーションに等しく影響を受けやすいわけではないことを示し、すなわち、b0＝A（33％）≒T（32％）＞＞C（21％）＞＞G（14％）である。さらに、事象の部位の4塩基上流および3塩基下流の組成は、有意なESTバリエーションを持たない部位の組成とは統計的に異なった（カイ2乗分析の結果）（図７ａ、塩基組成は％で表され、灰色の影は豊富な塩基を示し、より濃い灰色は少量の塩基を示す）。特に、バリエーションが生じる部位は、より頻繁に先行され、前記部位に続いてA≧G＞T≒Cであった。
【０１５７】
したがって、癌EST不均一性の発生は無作為ではないが、第一に、置換を受ける塩基の性質によって、第二に、前記事象の直前の塩基および、前記事象の後の塩基の性質によって決定される。
【０１５８】
本発明者は次に、置換塩基が、無作為に選択されるかどうかを質問した。図７ｂから、それは事実ではないことが明白である。比の差の統計的有意性を、置換塩基が無作為に選択される帰無仮説で算出した（分布を均一にするための3つの置換塩基すべての調整検定）。Aは、Cによって（p＝2.8×10^-125）、TはGによって（p＝5.7×10^-29）およびGはAによって（p＝2.2×10^-32）、優先的に置換された。Cの置換は、より均等な分布を示し、Tがわずかに少数であった（p＝0.007）。
【０１５９】
本発明者は次に、優先的な塩基置換に潜む原因を探求した。これを達成するために、本発明者は、有益な事象および非有益な事象の2セットを区別した。
【０１６０】
有益な事象とは、置換された塩基が、先行する塩基（b-1）または後続の塩基（b+1）のいずれか（n＝1676）とは異なる状況であった（図７ｃ）。非有益な事象とは、これらの基準に合致しない状況であった。有益な事象が分析される場合、2つの場合に遭遇した。置換された塩基は、b-1またはb+1によって（79％）またはb-1およびb+1とは異なる別の塩基によって（21％）置換された。1）第一のサブセットにおいて、置換塩基は、b-1（n＝799；図７ｃのパネルB）またはb+1（n＝530；図７ｃのパネルC）と同一であった。置換塩基がb-1である場合、b0＝A（36％）＞C（30％）＞＞T（21％）＞＞G（13％）であった（図７ｄのパネルA）。Aは、Cによって優先的に置換された（状況の71％）。置換塩基がb+1である場合、b0＝T（47％）＞＞A（21％）＞C（19％）＞＞G（13％）であった（図７ａのパネルB）。Tは、Gによって優先的に置換された（71％）。興味深いことに、取り囲んでいる塩基の統計的重要性も異なった（図７ｄのパネルAおよび７ｄのパネルB）。b-1置換に関しては、塩基組成の相対的な影響のパターンは、b0＞b-1＞b-2＞b+1＞b-3＞b+2であった。b+1置換に関しては、取り囲んでいる塩基の相対的な影響は、b0＞b+1＞b-1＞b+2＞b-3＞b-2のパターンに従った。2）有益な事象の第二のサブセットにおいて、置換塩基は、b-1またはb+1のいずれにも対応しなかった（n＝347；図７ｃのパネルD）。影響を受けた塩基は、以下の順序、すなわちA（47％）＞T（29％）＞C（14％）＞G（10％）であった。Aは、Cによって最も普遍的に置換され（状況の91％）、Tは、C（50％）およびA（42％）によって、CはG（46％）によって、ならびにGはC（73％）によって置換された。したがって、置換塩基が、b-1またはb+1に対応しない場合、置換塩基は、無作為には選択されないが、Cは大いに過剰にある。
【０１６１】
本発明者は次に、非有益な事象のセット、すなわち、1）b-1＝b+1の状況および2）b-1＝b0＝b+1の状況を考慮した（図７ｃ）。b-1およびb+1が同一であるがb0とは異なる場合（n＝339；図７ｃのパネルE）、置換された塩基は、以下の順序、すなわちT（34.8％）＞G（23.6％）＞C（21.2％）＞A（20.4％）であり、図７ｂのT→G、G→A、A→Cと同一の優先性パターンに従った。3つの同一の塩基の反復の中央の塩基において生じる置換（n＝266；図７ｃのパネルF）は、以下の順序、すなわち、A（46.2％）＞T（36.9％）＞G（10.5％）＞C（6.4％）であった。この場合、最も普遍的な置換事象は、A→CならびにT→CおよびAであった。まれに、GGG置換は、GCGによって最も普遍的に置換され、CCCはCACによって置換された（図７ｃ）。
【０１６２】
したがって、置換が、3つの連続した同一塩基内で生じる場合、および置換が、b-1またはb+1のいずれにも対応しない場合、Cは、最も普遍的な置換塩基である（図７ｃ）。置換塩基がb-1に対応する場合、最も普遍的な置換はA→Cであり、置換塩基がb+1に対応する場合、最も普遍的な置換はT→Gである。
【０１６３】
したがって、置換を受ける塩基も置換塩基も無作為に選択されないと結論付けられることが可能である。両現象は、置換を受ける塩基の組成ならびにこの事象の上流および下流に配置される塩基の組成によって定義される予測可能なパターンに従う。
【０１６４】
具体的なアルゴリズムは、所定のいずれかの配列において塩基置換の発生を決定するモチーフ組成を精確に同定するために定義されることが可能である。
【０１６５】
本発明者は次に、Nが安定であるかないかの2セットにおいてC＞Nセットを分離した（偏差は、正常セットにおける同一位置では観察されない）。偏差は、前記偏差が、正常セットにおける偏差の平均％として定義される一定の閾値を超過する場合にのみ考慮される。図７ｅは、Nが偏向するC＞Nセットによって-4/+3サインが運搬されることを示す。前後関係の長さは、他のセットにおいてあまり重要ではない。図７ｆは、Nが安定であるC＞NセットにおけるよりもNが偏向するC＞Nセットにおいてより重要な500〜1000間隔における蓄積を示す。後者において、より早期の事象（0〜500間隔）が現れたように見える。C＞N部位のための置換塩基は、2つのセット間で同様であった（図７ｇ）。
【０１６６】
欠失または挿入の場合、結果は、除外された塩基（398のC＞Nの場合）は、以下の順序、すなわち、C（46.0％）＞T（37.9％）＞＞A（9.3％）＞G（6.8％）であり（図５ｍ）、挿入された塩基（225のC＞Nの場合）は、以下の順序、すなわち、G（36.0％）＞C（30.2％）＞A（21.8％）＞T（12.0％）であった（図５ｏ）。本発明者は、欠失または挿入の事象がしばしば、保存された同一塩基において生じることを観察した。このような事象を分析するよう設計された具体的なプログラムは、欠失の94.7％および挿入の81％が、変数の長さのストレッチにおいて生じることを示す。ストレッチは、二極性かつ対称性である可能性があり（例えば、AAATAA）またはそうではない可能性があり（例えば、CCCGG）または単一のヌクレオチドの反復である可能性がある（例えば、AAA）（図５ｍ〜５ｐのモチーフ参照）。欠失の場合において、除外された塩基は、状況84％においてのb-1またはb+1の塩基と同一である。ほとんどのモチーフは、C＞T＞A〜Gの二重項または三重項である。実際、ストレッチモチーフは、C＞NとN＞Cとの間で異なっているようには見えなかった。C＞NまたはN＞Cの特異性は、ストレッチについての他の情報に由来するであろう。より多くの遺伝子に関するさらなる分析は、これらの見解を裏付けるであろう。
【０１６７】
17個の遺伝子すべてを考慮すると、本発明者は、100個の塩基あたり10個の割合でESTの不均一性を観察した（図５ｊおよび図８ａ〜ｃ）。この割合は、ゲノムDNAにおいて生じる変異に関して記載されたいずれかの割合の過剰量にある。参照として、単一のヌクレオチド多型が、300塩基ごとに1回、ゲノム中で無作為に生じることが概算可能である。転写されたDNAに影響を及ぼす単一ヌクレオチド多型の割合は、非常に低い。3000塩基ごとに1回生じると概算される。DNAの変異が、癌においてより頻繁に生じることは明白である。しかしながら、乳癌および結腸癌に関する多大なる尽力において、本発明において使用された17個の遺伝子のうち14個を含んだDNA配列決定によって、10⁶個の塩基あたり、3.1個の変異に関する概算された体細胞性変異の割合がわかった（Sjoblom, T., et al. (2006) Science 314, 268-74）。したがって、本発明において記載される転写非忠実度は、DNAに影響を及ぼす変異のものよりはるかに大きな割合で生じる。より重要なことに、ゲノムDNAの10％未満が、mRNAへ転写されるので、DNA上の最も多くの塩基置換は、タンパク質レベルでの制限された結果を有する。対照的に、転写非忠実度による塩基置換はしばしば、タンパク質の機能に及ぼす直接的な結果を有する。実際、本明細書に記載される2281個（1548CDS−369個のサイレント置換）の置換のうち1179個は、タンパク質AA一次配列に及ぼす即時的な影響を有する塩基置換に至った（図８ｄ）。最も重要なことに、終止コドンに影響を及ぼす有意な塩基置換は、検査した17個の遺伝子のうち9個で観察された。しかしながら、転写非忠実度の概念以前に、ヒトタンパク質が、「非翻訳領域」としてこれまで考慮されたRNA配列によってコードされるさらなるコード化配列を含有するであろうことは提唱されていなかった。本発明者はいまや、転写非忠実度のため、天然の終止コドンにおいて生じる塩基置換が、特異的AAをコードする新規のコード化領域を明らかにすることを示す。この新規のコード化領域は、天然のオープンリーディングフレームと位相が同じである。天然の終止コドンは、コード化するコドンへと変換される。次に、隣の塩基の三重項がAAとして読み取られ、翻訳は、新たな終止コドンに到達するまで、新規のコード化領域とともに進行する。本発明者は、このことが、転写非忠実度を示す17個の遺伝子のうちの8個において、実際にそうであることを確証した。8個はすべて、対応するRefSeqを有するフレーム中で代替的な終止コドンを含有する（GAPDHは、代替的な終止コドンを含有しない）。このことは、各場合において、TPT1、RPS6、PRL7A、VIM、RPS4X、FTH1、FTLおよびTPI1においてそれぞれ14、7、13、15、13、4、9、55個のAAの新規のコード化配列を生成するので、即時的な結果を有する（図１０）。これらのAAの付加は、癌において大いに増大するであろうモチーフを生成する可能性を有し、これらのモチーフは、タンパク質の新規の機能を結果的に生じるであろうし、または生じないであろう。この発生を予測することによって、診断の、治療のまたは他の目的において使用され得る有用なツールの開発が可能となる。この発生を予測することによって、タンパク質のカルボキシ末端における癌特異的配列を認識するであろう特異的抗体の開発も可能となる。分析方法は、カルボキシ末端での直接的なタンパク質配列決定が今のところ不可能である。しかしながら、タンパク質を酵素的に切断し、切断産物をタンパク質のNH₂末端から配列決定することは可能である。質量分析を使用して、タンパク質分解によって生じたペプチドのAA含有量を分析することも可能である。本発明者は、これらの代替的な終止コドンが、転写非忠実度によっても影響されることをさらに示す。（9個の遺伝子のうちの7個が、影響を受けた第二の代替的な終止コドンを有する）。上述に記載される同一の現象は、配列の新規のセットへ読み取りをさらに拡大することが可能である。本法を使用するすべてのタンパク質配列のアノテーションは、コドンの使用ならびに塩基置換を正確に翻訳しまたは翻訳しない翻訳装置の能力に応じてより効果的にまたはあまり効果的でなく転写されるであろう疑わしくないいくつものコード化mRNA配列を明らかにするであろう。実際、塩基の置換によって、リボソーム読み取りの割合を改変することが可能なmRNAの構造変化を生じることが可能である。それにもかかわらず、本発明者は、塩基置換がRNA変化に関与しないと想定する。終止コドンの変化の発生に基づいて、本発明者は、癌組織中のmRNAの最大4％が、これらの付加的なコード化領域を含有することを、影響を受けた遺伝子において概算する。
【０１６８】
いくつものフィルターに基づいた具体的なプログラムは、推定の終止後ペプチド（PSP）の存在に関してタンパク質配列をすべてアノテートするのに使用されることが可能である。研究したタンパク質に対応する核酸配列を検索した後、プログラムは、基準の終止後の位相中のある核酸配列の存在または非存在を、位相中の別の終止とともに検索する（これらの代替的な終止コドンに影響する転写非忠実度の場合において1つ以上の終止を迂回する可能性は、考慮されることが可能である）。起こり得る抗原性パターンの予測に関する最小の基準に従って、最小長が固定されることは可能である（例えば、配列は、12個超のアミノ酸をコードするのみであるが、最終的には、ペプチド長はより小さくあり得る）。次に、抗原性PSPが保存される（図１８）。さらなる工程は、基準の終止の学習機械を鍛錬することによって、アノテーションを使用して候補を確認するために使用される。実際、終止コドンの1つ以上の塩基が転写非忠実度によって置換され得る確率は、決定されることが可能である。質量分析を使用して、タンパク質分解によって生じたペプチドのAA含有量を分析することも可能である。
【０１６９】
本発明者は、新規のタンパク質配列の翻訳を可能にする条件を創出するほかに、転写非忠実度が、mRNAにおける成熟前終止を導入することが可能であることも示した。基準のオープンリーディングフレーム内で生じる24個の新規の終止コドンを、17個の遺伝子のうちの13個内で同定した。このことは、転写非忠実度が、特定のドメインを欠失しているより短いタンパク質の生成を生じる可能性があることを示した。これらの切断型タンパク質は、機能の亢進または損失を結果的に生じ得る。タンパク質の3次元構造は、影響されるようであり、したがって、免疫系によって認識され得る新規の実体を作製するであろう。
【０１７０】
最後に、検査した17個の遺伝子における転写非忠実度は、同定したすべてのC＞N置換の50％がAA変化に至ることを明らかにした。17％は、同一のファミリー由来の別のものによるAAの置換に相当し、33％は、AAの異なるクラス由来のAAの置換に相当する。したがって、転写非忠実度は、潜在的に改変された機能または活性を有する新規のAA配列を有するタンパク質を生じることが可能である。上述に記載の規則を使用して転写非忠実度を推定することによって、タンパク質の挙動およびプロテオミクス実験の結果における変化の論理的根拠の推定が可能となる。
【０１７１】
実施例6．生物学的検証
生物学的検証を2つのレベル、すなわち、mRNAおよびタンパク質で実施する。
【０１７２】
まず、関心対象の17個の遺伝子のmRNA置換が、ヒト癌性組織において検出されるであろう。本発明者は、配列変異を検出するための大規模クロマトグラフィー方法であるDHPLC（変性高速液体クロマトグラフィー）を使用した。実験の原理を図１１ａ〜ｃに記載する。まず、本発明者は、ヘテロ二本鎖の形成および検出が可能であるのに十分な試料中で、変異したDNAの％を概算するために、トランスゲノムDHPLC閾値を検査する方法を開発した。実際、1個および3個の塩基置換を有する300塩基対のPCR断片を使用した。これらの断片の異なる割合、すなわち0％、2.5％、5％、7.5％、10％、20％または50％を調製した。DHPLCによって、本発明者は、試料が、2.5〜5％の変異したDNAを含有するとすぐに、[正常]DNAと[正常＋変異済み]DNAとを識別できた（図１１ｄ）。
【０１７３】
これらの結果は、本発明者が、関心対象の遺伝子に関して、正常組織および癌性組織由来のmRNAを識別することができることを示す。正常組織および癌性の隣接する組織から抽出したmRNA（Biochain Inc）を使用して、3つの遺伝子、すなわちGAPDH、ENO1およびTMSB4Xを検査した。DNAに関するDHPLC作業として、逆転写酵素を使用してmRNA試料をcDNAへ変換する。本発明者は、正常組織由来のESTよりも癌組織由来のESTにおいて、かなりより有意な置換を呈する領域を選択した。増幅に使用されるプライマーを図１２に示す。
【０１７４】
実験の第一のセットにおいて、癌性組織および隣接する正常組織（肝臓、腎臓、乳房および結腸）由来のいくつものcDNAを、該プライマーを使用するPCRによって増幅し、DHPLCシステムへ注入した。オーブンの温度を、Navigatorソフトウェア（Transgenomic）で選択した。上述に記載の遺伝子に関して特性を得、ENO1、GAPDHおよびTMSB4X遺伝子に関して代表的な実験を図１５に表す。図１５ａ〜１５ｃに示すように、癌特性は、GAPDHおよびENO1の遺伝子に関して、正常特性とは明確に異なった。本発明者が期待したようなTMSB4Xに関する差異は観察されなかった（あまりにも少ない転写非忠実度部位）。同一のPCR産物および2つの他のPCR産物の注入を三つ組で実施し（図１５ｂおよび１５ｃ）、特性は、同一の実験において非常に再現可能である。しかしながら、差異の性質は、本実験から推定されることは不可能であった。
【０１７５】
結果的に、mRNAに基づいたこの生物学的検証の連続を実施する。実際、癌性組織に由来するPCR産物の配列決定によって、最も豊富な量の変異を精確に検出することが可能である。
【０１７６】
PCR増幅済みの逆転写されたmRNAに関する古典的なサンガー配列決定方法は、特定の位置で15〜30％未満の割合で生じる配列変異形を検出しない（図１６）。実際、変異したおよび変異していない公知の配列から増幅産物混合物を配列決定することによって得られる変異済み塩基の呼び出しは、50%-50%混合で得られ、マイナーピークは15％から検出される。ピロシーケンスおよび乳濁液PCRは、cDNA不均一性の検出を可能にするより高感度な方法であり、それにより、癌細胞および正常細胞から得られたRT-PCR産物の分析が可能である（Thomas, R. K, et al. (2006) Nat Med 12, 852-5）。
【０１７７】
転写非忠実度によって影響を受ける遺伝子を完全にクローニングし、または前記遺伝子の転写非忠実度部位を含む断片及び含まない断片をクローニングする。基準終止コドンを有しおよび有さないコンストラクトを、ネオマイシン抵抗性をコードする遺伝子を有するフレーム中に連結する。癌細胞および正常細胞をまず一過性に、次に安定してこのキメラコンストラクトでトランスフェクトする。本発明者は、転写非忠実度によって基準終止コドンが変化し、それにより、ネオマイシン遺伝子の翻訳が可能となり、ネオマイシン抵抗性細胞が作出されると予測する。本発明者は、ネオマイシン抵抗性である癌細胞が、より迅速に増殖するであろうし、これらの細胞の形状が、正常細胞の形状とは有意に異なるであろうと予測する。さらに、本発明者は、これらの細胞が、より浸潤性であり、癌の進行の後期の段階にある細胞と比較されることが可能であると予測する。したがって、本技術は、個々の患者由来の異なる細胞の癌性相を決定するために使用され得る。ネオマイシン抵抗性が、転写非忠実度の結果として生じるという最終的な証拠は、ゲノムDNAから増幅された挿入されたコンストラクトを配列決定すること、およびゲノム情報が変化していないままであることを示すことによって得られるであろう。本発明者は、ネオマイシン抵抗性細胞由来のmRNAが、転写非忠実度による変異した終止コドンを含有することも検証するであろう。
【０１７８】
転写非忠実度部位の検出を可能にする1つの技術は、癌患者および正常対象の組織から抽出したRNAから逆転写されたcDNAをクローニングすることからなるcDNAライブラリの構築である。特定の遺伝子から増幅されまたは増幅されていない各cDNAを、エシェリキア・コリ（Escherichia coli）において形質転換した個別のプラスミド中でクローニングする。異なるイー・コリコロニーを拾い上げ、プラスミドを配列決定する。配列決定されるのに必要とされるクローンの数は、クローニングされたcDNA断片における置換の％による。統計的な分析によって、本発明者は、転写非忠実度部位における配列バリエーションが付与されるであろう。本技術は、改良される可能性がある。実際、逆転写および特定のプライマーによる増幅の後、cDNAは、リポーター遺伝子、例えばlacZ遺伝子を有するプラスミド中でクローニングされることが可能である。cDNAおよびリポーター遺伝子を位相中でクローニングする。置換が、mRNAの終止コドン配列中に現れる場合、リポーター遺伝子が発現する。イー・コリ細胞が、この構築物で形質転換される場合、cDNAが終止コドンにおいて変異されるプラスミドを有するコロニーは、リポーター遺伝子の発現で選択される。その後、プラスミドは、終止コドンの置換が存在するかどうかを検証するために配列決定されることが可能である。
【０１７９】
特定のプライマーを使用するリアルタイムPCRに基づいた別の技術を使用して、転写非忠実度部位を検出する。これらのプライマーは、統計的な分析に基づいた配列バリエーションを有するcDNAと一致するよう設計される。第二のプライマーは、配列バリエーションを有さないcDNA（参照）と一致するよう設計される。プライマー配列におけるバリエーションの数は、非常に重要であり、本発明者は、研究される位置の外側にある2つの変異が、特定の蛍光シグナルを得るのに必要であることを、公知の配列バリエーションに関する検査実験で決定した。プライマーが、配列置換を有さないcDNA（参照）と相補的である場合、蛍光シグナルは、増幅周期の特定数で検出される。配列置換を有するプライマーによって増幅された同一のcDNAは、増幅周期のより大きな数で現れる蛍光シグナルを生じる。2個のプライマーによる増幅周期の数の間の差異は、配列置換を有するcDNAの存在の直接的な概算である。さらに、本発明者は、この方法が、変異を受けた配列の1％を公知の配列の混合物中で検出するのに十分高感度であることを検証した。
【０１８０】
典型的な実験において、癌患者および正常対象の組織から抽出したRNAを逆転写し、該特異的プライマーの各々で増幅する。次に、両プライマーによる増幅周期間の差異を測定する。
【０１８１】
最後に、本発明者は、天然の終止コドンが影響を受ける場合に誘導される新規のタンパク質に焦点を当てることが可能である。本発明者は、終止コドンが、関心対象の本発明の17個の遺伝子のうちの9個に関して有意に影響を受けることを示した。そのことによって、カルボキシ末端において新規の配列を有するタンパク質に関する異なる特異的な集団を生じる。本発明者は、影響を受けた遺伝子についての癌性組織が、正常遺伝子よりも長い4％のタンパク質を含有すると概算する。
【０１８２】
この仮説の点において、本発明者は、60個の豊富な血漿タンパク質を分析し（図１３）、起こり得るPSPを検索した。本発明者は、PSPが十分に長く、抗原性である22個の遺伝子を発見した。次に、本発明者は、誘導されるより長い推定タンパク質配列を検索した（図１８ｂ〜ｃ）。次に、本発明者は、正常個体および癌性個体から得られた血漿中の推定上の新たなペプチドを検索した（図１８）。本発明者は、これらの22個の関心対象のタンパク質のうち、3個、すなわちAPOAI、APOAIIおよびAPOCIIを選択した。上述の分析に基づいて、本発明者は、癌患者の血漿中のより長いタンパク質（AAが13、16および17個より長い）を発見することを期待する。これらの転写非忠実度ペプチド配列は、免疫原性であると予測され、これらの新規の配列に対する抗体は、転写非忠実度を測定するための特異的なリガンドを表す（図１４）。Kyte-Doolittle分析は、これらの配列が疎水性ではないことを示すので、本発明者は、これら3つの新規のタンパク質が循環中へ分泌されると期待する（以下参照）。
【０１８３】
基準終止コドンにおける置換によるApoAIIおよびApoCIIの終止後ペプチド（PSP）の同定
基準終止コドンにおける塩基置換から結果的に生じるPSPは、以下の様式で同定され特徴付けられることが可能である。問題のPSPの免疫原性部分を認識するウサギポリクローナル抗体を調製する。これらの抗ペプチド抗体が実際にPSPを認識することを検証するために、精製されたペプチドを使用するドットブロットによって前記抗体をチェックすることが可能である。次に、癌患者から得られた血漿試料に関して、PSPに対する抗体を使用してウェスタンブロットを実施することが可能である。図１７ａ（右のパネル）は、抗PSP ApoAII抗体が、前立腺癌患者から得られた血漿試料に関して実施されたウェスタンブロットにおいて、ネガティブコントロールとしてウサギ免疫前血清を使用する場合には観察されない（図１７ａ、左のパネル）バンドを認識することを示す。PSP ApoAIIバンドは、転移期にある癌患者においても観察される（図１７ｂ、右のパネル）。このバンドは、ApoAIIの未変性単量体形態のものと比較して、わずかにより大きな分子量（11.4kDa）を有する（図１７ａ、中間のパネル、１７ｂ、左のパネル）。この分子量は、さらなるペプチド配列に基づいて予測されるものに相当する。このバンドをさらに特徴づけるために、二次元ゲルを実施することも可能である。
【０１８４】
アフィニティクロマトグラフィー実験は、抗PSP抗体を使用してApoAIIのPSP形態を単離するために実施されることが可能である（図１７ｅ）。抗PSP抗体を、マトリックスビーズ上に固定し、以下のカラムを血漿または脱脂したHDLの存在下でインキュベートした後、非特異的に結合したタンパク質を除去するために連続的に洗浄し、最終的には洗剤またはカオトロピック試薬で溶出する。抗PSP抗体および市販の抗ApoAII抗体の両者を使用するウェスタンブロッティングによって、溶出した画分を分析する。9kDaおよび11.4kDaにある2つのバンドは、市販の抗apoAII抗体によって認識されるのに対し、11.4kDaのバンドのみが、抗PSP抗体によって認識される。したがって、9kDaのバンドは、未変性ApoAII形態に相当し、11.4kDaのバンドは、ApoAIIのPSP形態に相当する。溶出された画分中の未変性ApoAIIの存在は、PSP ApoAIIタンパク質が、未変性の非還元条件下で未変性のApoAIIタンパク質とともに二量体を形成することが可能であることを示唆する。実際、ApoAIIは通常、血漿中で単一ジスルフィド架橋によって結合した2個の単量体からなる二量体として存在する。
【０１８５】
ApoAIIは、連続的な超遠心分離によって単離されることが可能な血漿中のHDL画分に主として存在する。ウェスタンブロッティングは、PSP ApoAIIは、VLDLおよびLDLを含有するd＜1.07g/mLの画分中では検出されないが、むしろHDLおよび血漿タンパク質を含有するd＞1.07g/mLの画分中で検出されることを示す（図１７ｃ）。HDL（d1.07〜1.21g/mL）を精製および洗浄するためのさらなる超遠心分離工程の後、ウェスタンブロッティングは、PSP ApoAIIが、リポタンパク質欠乏血清（LPDS）とも呼ばれるd＞1.21g/mL画分よりもむしろHDL画分と結合したままであることを明らかにする。血漿の対応する量は、ウェスタンブロット上で、これが、精製工程中のd＞1.21g/mLの希釈によるものではないことを示すために示される。Superose 6B（Amersham, GE Healthcare）を使用するゲル濾過による血漿からのリポタンパク質の分離も、PSP ApoAIIが、HDLと結合したApoAIIの分離と同様の様式で溶出することを示す。
【０１８６】
PSP ApoAIIのHDLとの結合によって、ApoAIIと同様の様式でのApoAIIのPSP形態の精製が可能となった。HDLは、すべての脂質を除去するために、まず脱脂される。次に、還元剤の存在下または非存在下で尿素またはグアニジンを含有する10mMトリスバッファー中に、結果として得られた脂質非含有タンパク質ペレットを再懸濁し、ゲル濾過カラム（例えば、Superdex 200, Amersham-GE Healthcare）へ適用する。ウェスタンブロッティング（図１７ｄ）は、ApoAIIのPSP形態が、脱脂したHDL中になおも存在することを示す。調製用電気泳動（例えば、DE52）によって、さらなる精製を達成した（実施例：DE52）。ApoAIIのPSP形態をウェスタンブロッティングによって追跡した。次に、ApoAIIの精製されたPSP形態を酵素で切断し（トリプシン）、得られたペプチドを完全なAA配列決定のためにMS-MSで分析する。結果は、基準終止が、（U→C）または（U→A）のいずれかの置換によりアルギニンに優先的に置換され、続いてセリン、バリン、グルタミン酸、スレオニン、イソロイシン、バリン、フェニルアラニン、グルタミン酸、プロリン、グルタミン酸、ロイシン、アラニン、セリン、アルギニンとともに、アルギニンであることを示す。これは、ApoAII基準終止の迂回後に生じると予測されるアミノ酸の実際の配列である。したがって、ApoAIIの基準UGA終止は、AGAまたはCGAに置換され、アルギニンに至る。いまだに調べられていない仮説は、UGAがGGAへ変換され、グリシンに至るというものである。しかし、質量分析によるこの変異形の検出は、現段階では技術的な限界を超えている。
【０１８７】
別の例は、ApoCIIのPSPによって示される。図１７ｆは、図１７ａと同様の実験を示し、例外は、ウェスタンを、市販の抗ApoCII抗体または抗PSP ApoCII抗体で実施したことである。ApoAIIのPSPと同様の手法は、ApoCIIに関して実施可能である。しかしながら、ApoCIIは、血漿中であまり豊富ではない。したがって、MS-MSでの分析に十分な量を得るために、PSP ApoCIIを含有する血漿の非常により多くの量が必要とされる。
【０１８８】
結論
本発明者は、本明細書に、大部分がコード化配列の3'末端およびmRNAの非翻訳領域において生じる塩基置換に至る新規のメカニズムを記載する。これらの塩基置換は、AA同一性の変化、成熟前終止コドンの導入および新規のコード化領域の導入を生じる天然の終止コドンの改変によるタンパク質AA配列の変化に至る。転写非忠実度のこの現象は、ncRNA界にも影響を及ぼし得、これらのRNAによって仲介される制御も妨害し得る。そのことは、DNA変異に至る記載されたいずれの現象も超過する割合で、ほとんどの遺伝子で生じる。転写非忠実度は、癌細胞において大いに増大する。転写非忠実度は、癌の病理学、疾病の重度および疾病の進行を理解する新規のパラダイムを提供する。転写非忠実度は、新規のトランスクリプトーム実験およびプロテオミクス実験の設計だけでなく、具体的な診断薬および治療薬の開発に関する重要な意味を有する。

【特許請求の範囲】
【請求項１】
対象において疾病の存在または段階を検出する方法であって、該対象からの試料において転写非忠実度の存在または割合をインビトロまたはエクスビボで評価することを含み、該存在または割合が、該対象における疾病の存在または段階の指標である、前記方法。
【請求項２】
薬物をスクリーニングし、同定しまたは最適化する方法であって、該薬物が、遺伝子の転写非忠実度の割合を変化させるかどうかを評価する工程を含む、前記方法。
【請求項３】
ヒトまたは動物の治療の方法において使用するための、特に増殖性細胞障害を治療するための医薬組成物の製造のための哺乳動物遺伝子の転写非忠実度の割合を変化させる化合物の、使用。
【請求項４】
ヒトまたは動物の治療の方法において使用するための、特に増殖性細胞障害を治療するための転写非忠実度に対して哺乳動物遺伝子を抵抗性または感受性にするにするために、前記哺乳動物遺伝子を改変する方法。
【請求項５】
薬物または候補薬物の有効性を評価する方法であって、該薬物が、哺乳動物の転写非忠実度の割合を変化させるかどうかを評価する工程を含み、このような変化が、薬物の有効性の指標である、前記方法。
【請求項６】
バイオマーカーを同定または作製する方法であって、対象からの試料中で、標的のタンパク質、RNAまたは遺伝子における転写非忠実度部位の存在を同定すること、および場合により、該転写非忠実度部位の配列を決定することを含む、前記方法。
【請求項７】
形質または病理学的状態に特異的なリガンドを同定または作製する方法であって、該形質または病理学的状態を有する対象からの試料中で、1つまたはいくつもの標的のタンパク質または遺伝子における少なくとも1つの転写非忠実度部位の存在を同定すること、場合により、該少なくとも1つの転写非忠実度部位の配列を決定すること、および該少なくとも1つの転写非忠実度部位へ特異的に結合するリガンドを作製することを含む、前記方法。
【請求項８】
転写非忠実度が、タンパク質または核酸の転写非忠実度部位に特異的な少なくとも1つのリガンドを使用して評価される、請求項１〜７のいずれか一項に記載の方法。
【請求項９】
疾病または病理学的状態が、癌、免疫疾患、炎症性疾患または加齢等の細胞増殖性障害から選択される、請求項１〜８のいずれか一項に記載の方法。
【請求項１０】
TIタンパク質の、特に哺乳動物タンパク質の、より好ましくはヒトタンパク質のドメインを含む、合成ペプチド。
【請求項１１】
転写非忠実度部位が、次の規則：
・Aが、Cによって先行されまたは追随される場合、Aの置換が優先的に生じ、
・Tが、Gによって先行されまたは追随される場合、Tの置換が優先的に生じ、
・Cが、GまたはAによって先行される場合、Cの置換が優先的に生じ、および
・Gが、Aによって先行されまたは追随される場合、Gの置換が優先的に生じる
ことに従う核酸変化によってコードされる少なくとも1つの改変を含む、請求項１０に記載のペプチド。
【請求項１２】
ペプチドが、転写非忠実度によって生じる少なくとも1つのアミノ酸変動を含むタンパク質のC末端断片の配列を含み、および/または100、80、75、70、65、60、50、45、40、35、30、25またはさらに20個未満のアミノ酸を含む、請求項１０〜１１のいずれか一項に記載のペプチド。
【請求項１３】
タンパク質が、細胞表面タンパク質（例えば、受容体）または分泌型タンパク質（例えば、血漿タンパク質）である、請求項１０〜１２のいずれか一項に記載のペプチド。
【請求項１４】
配列番号1〜32より選択される配列を含む、ペプチド。
【請求項１５】
免疫原としての請求項１０〜１４のいずれか一項に記載のペプチドの、使用。
【請求項１６】
請求項１０〜１４のいずれか一項に記載のペプチドと、場合により適切な担体、賦形剤および/またはアジュバントとを含む、ワクチン組成物。
【請求項１７】
RNA分子の転写非忠実度部位の配列を含む、合成核酸分子。
【請求項１８】
抗体を産生する方法であって、非ヒト哺乳動物を請求項１０〜１４のいずれか一項に記載のペプチドで免疫化すること、および該ペプチドを結合する抗体、または対応する抗体産生細胞を回収することを含む、前記方法。
【請求項１９】
抗体を産生する方法であって、（i）TIタンパク質のドメインを同定すること、（ii）外ドメインを特異的に結合する抗体を産生することおよび（iii）場合により、実質的に同一の抗原特異性を有する抗体の誘導体を産生することを含む、前記方法。
【請求項２０】
転写非忠実度部位を同定することが、次の規則：
・Aが、Cによって先行されまたは追随される場合、Aの置換が優先的に生じ、
・Tが、Gによって先行されまたは追随される場合、Tの置換が優先的に生じ、
・Cが、GまたはAによって先行されまたは追随される場合、Cの置換が優先的に生じ、および
・Gが、Aによって先行されまたは追随される場合、Gの置換が優先的に生じる
ことに従う核酸変化によってコードされる少なくとも1つの改変を同定することを含む、請求項１９に記載のペプチド。
【請求項２１】
タンパク質またはRNAの転写非忠実度部位と特異的に結合する、リガンド。
【請求項２２】
リガンドが、抗体（またはそのいずれかの断片もしくは誘導体）、核酸プライマーまたは核酸プローブである、請求項２１に記載のリガンド。
【請求項２３】
TIタンパク質のドメインと特異的に結合する抗体、または実質的に同一の抗原特異性を有するこのような抗体の誘導体。
【請求項２４】
抗体が、薬物、標識、毒性分子または放射性同位体等の分子へ抱合される、請求項２３に記載の抗体またはその誘導体。
【請求項２５】
遺伝子の転写非忠実度をインビトロで検出または定量化するための、請求項２１または２２に記載のリガンドの使用。
【請求項２６】
薬物または診断用試薬としての、請求項２４に記載の抱合された抗体またはその誘導体の使用。
【請求項２７】
ヒトまたは動物の治療の方法において使用するための医薬組成物の製造のための遺伝子の転写非忠実度部位を含む核酸の、使用。
【請求項２８】
支持体上に固定化された、請求項２１または２２のリガンドを含む、デバイスまたは製品。

【図１ａ】

【図１ｂ】

【図２ａ】

【図２ｂ】

【図２ｃ】

【図２ｄ】

【図２ｅ】

【図２ｆ】

【図２ｇ】

【図２ｈ】

【図２ｉ】

【図２ｊ】

【図２ｋ】

【図２ｌ】

【図２ｍ】

【図２ｎ】

【図２ｏ】

【図２ｐ】

【図２ｑ】

【図２ｒ】

【図３ａ】

【図３ｂ】

【図３ｃ】

【図３ｄ】

【図３ｅ】

【図３ｆ】

【図３ｇ】

【図３ｈ】

【図３ｉ】

【図４ａ−１】

【図４ａ−２】

【図４ａ−３】

【図４ａ−４】

【図４ａ−５】

【図４ａ−６】

【図４ａ−７】

【図４ｂ−１】

【図４ｂ−２】

【図４ｂ−３】

【図４ｂ−４】

【図４ｃ−１】

【図４ｃ−２】

【図４ｃ−３】

【図４ｃ−４】

【図４ｄ−１】

【図４ｄ−２】

【図４ｄ−３】

【図４ｄ−４】

【図４ｄ−５】

【図５ａ】

【図５ｂ】

【図５ｃ】

【図５ｄ】

【図５ｅ】

【図５ｆ】

【図５ｇ】

【図５ｈ】

【図５ｉ】

【図５ｊ】

【図５ｋ】

【図５ｌ】

【図５ｍ】

【図５ｎ】

【図５ｏ】

【図５ｐ】

【図６ａ】

【図６ｂ】

【図６ｃ−１】

【図６ｃ−２】

【図６ｄ】

【図６ｅ】

【図７ｂ】

【図７ｃ】

【図７ｅ】

【図７ｆ】

【図７ｇ】

【図８ａ】

【図８ｂ】

【図８ｃ】

【図９】

【図１１ａ】

【図１１ｂ】

【図１１ｄ】

【図１３ａ】

【図１３ｂ】

【図１３ｃ】

【図１３ｄ】

【図１４】

【図１５ｂ】

【図１５ｃ】

【図１６】

【図１７ａ】

【図１８ａ】

【図１８ｂ】

【図１８ｃ】

【図１８ｄ】

【図１８ｅ】

【図１９】

【図７ａ】

【図７ｄ】

【図８ｄ】

【図１０ａ】

【図１０ｂ】

【図１１ｃ】

【図１２ａ】

【図１２ｂ】

【図１２ｃ】

【図１５ａ】

【図１７ｂ】

【図１７ｃ】

【図１７ｄ】

【図１７ｅ】

【図１７ｆ】

【公表番号】特表２００９−５４４２８４（Ｐ２００９−５４４２８４Ａ）
【公表日】平成２１年１２月１７日（２００９．１２．１７）
【国際特許分類】

【出願番号】特願２００９−５１９９９６（Ｐ２００９−５１９９９６）
【出願日】平成１９年７月２０日（２００７．７．２０）
【国際出願番号】ＰＣＴ／ＥＰ２００７／０５７５４１
【国際公開番号】ＷＯ２００８／００９７５１
【国際公開日】平成２０年１月２４日（２００８．１．２４）
【出願人】（５０９０２０３５４）トランスメディ・ソシエテ・アノニム (2)
【氏名又は名称原語表記】ＴＲＡＮＳＭＥＤＩ　ＳＡ
【Ｆターム（参考）】

[ Back to top ]

転写非忠実度（ｉｎｆｉｄｅｌｉｔｙ）、その検出および使用

メニュー

スポンサーリンク

次の公報 »

« 前の公報

転写非忠実度（ｉｎｆｉｄｅｌｉｔｙ）、その検出および使用

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク