癌診断のためのオリゴヌクレオチド

本発明は、分析法、特に診断法に使用することができる、細胞中の遺伝子転写レベルの評価用オリゴヌクレオチドプローブに関する。本発明は、タンパク質合成及び／又は安定性に関与するタンパク質をコードする遺伝子、又は特に癌診断用転写パターンを作成するのに使用される防御の調節及び／又はクロマチンリモデリングに関与するタンパク質をコードする遺伝子に相当するオリゴヌクレオチドセットを提供する。そうしたプローブは、キットの形態で提供されるのが都合がよい。異なる型のプローブを、遺伝子発現パターンの作成、及び異なる癌又は癌の病期の同定、診断又はモニタリングの技術に使用できる。また、本発明は、このようなセット及びこのようなセットを含むキット、ならびに特徴的な発現プロファイルを得るための前記遺伝子によりコードされているマーカーポリペプチドの分析を用いた関係方法を提供する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、分析法、特に診断法に使用することができる、細胞中の遺伝子転写レベルの評価用オリゴヌクレオチドプローブに関する。そうしたプローブは、キットの形態で提供されるのが都合がよい。異なる型のプローブを、遺伝子発現パターンの作成、及び異なる癌又は癌の病期の同定、診断又はモニタリングの技術に使用できる。
【背景技術】
【０００２】
例えば、診断用途に用いられる試料分析を迅速かつ容易におこなう方法を確定することは、依然として数多くの研究者の目標とされている。エンドユーザーは、経済的であり、統計的に有意な結果が得られ、高度の熟練者を必要とすることなく日常的に実施できる方法を求めている。
【０００３】
細胞内遺伝子発現の解析が、これらの細胞の状態及び重要なこととして細胞が由来する個体の状態についての情報を提供するのに用いられてきた。細胞における種々の遺伝子の相対的な発現が、体内の特定の状態を反映するものとして同定されてきた。例えば、癌細胞は、種々のタンパク質の発現変化を示すことが知られており、したがって、転写物又は発現タンパク質は、疾病状態のマーカーとして使用できる。
【０００４】
したがって、バイオプシー組織を分析して、これらのマーカーが存在するかどうかを調べることができ、疾病部位由来の細胞は、該マーカーの存在により体の他の組織又は体液で同定できる。さらに、変化した発現の産物は血流中に放出されるかも知れず、これらの産物を分析してもよい。さらに、疾病細胞と接触した細胞は、これらの細胞と直接接触することにより影響を受けて遺伝子発現の変化を生じ、それらの発現又は発現産物を同様に分析してもよい。
【０００５】
しかしながら、これらの方法にはいくつかの限界がある。例えば、癌を同定するために特定の腫瘍マーカーを使用することには、特異性又は感度の欠如、マーカーが特異型の癌の他に病態と会合すること、及び自覚のない個体で検出するのが困難であることといった種々の欠点がある。
【０００６】
一種又は二種のマーカー転写物又はマーカータンパク質の分析の他に、より最近では、遺伝子発現パターンが分析されてきた。疾病診断における大規模遺伝子発現分析を含む研究のほとんどは、異常組織又は細胞由来の臨床試料を用いてきた。例えば、遺伝子発現データが類似する癌種間を区別するのに使用され得ることを示すいくつかの最近の刊行物では、異常組織又は細胞からは得た臨床試料を使用している（非特許文献１；非特許文献２；非特許文献３；非特許文献４）。
【０００７】
しかしながら、これらの方法は、異常細胞又はこれらの細胞の産物又は異常細胞に接触した細胞を含有する試料を分析するものである。このような試料の分析では、疾病の存在とその場所についての情報が必要である。これは、自覚のない患者では困難なことがある。さらに、試料は、疾病部位から、例えば、脳の疾病では必ずしも採取できない。
【０００８】
本発明者らは、甚だ重要な知見において、細胞を得た生物体の状態に関連する情報を得るために、体内のすべてについて、細胞のこれまで利用されてこなかった可能性について確認した。特許文献１は、疾病部位から離れた細胞の遺伝子発現、例えば、癌部位から離れたところで採取した末梢血の分析について記載している。特許文献２（引用することにより本明細書に組み込まれる）は、乳癌及びアルツハイマー病の診断用である特定プロ
ーブについて記載し、この目的及び他の疾病を診断するのに好適な他のプローブを同定するためのプロトコルについて検討している。
【０００９】
この知見は、生物の体の異なる部分が互いに動的相互作用するという前提に基づいている。疾病が体の一部分に影響を及ぼすと、体の他の部分も影響される。この相互作用は、罹患部から放出される広範囲の生化学的シグナルから生じ、体の他の部分に影響を及ぼす。放出されたシグナルにより誘発された生化学的変化及び生理学的変化の性質は、体の部分ごとに異なるけれども、これらの変化は、遺伝子発現のレベルで測定でき、診断に使用できる。
【００１０】
生物における細胞の生理学的状態は、体内で遺伝子が発現するパターンにより決定される。このパターンは、前記細胞に対する内的及び外的な生物学的刺激に依存し、これらの刺激の程度又は性質が変化すると、パターンが変化して、その中で異なる遺伝子が細胞中で発現する。生物試料における細胞の遺伝子発現パターンの系統的変化を分析することにより、前記細胞に作用している生物学的刺激の種類及び性質についての情報を得ることができるという理解がますます受け入れられるようになってきている。したがって、例えば、試験試料における細胞の多数の遺伝子の発現をモニタリングすることにより、それらの遺伝子が特定の疾病、状態又はその病期について特徴的なパターンで発現するかどうかを測定できる。したがって、例えば、組織又は体液から得た細胞の遺伝子活性の変化を測定することが、疾病を診断するための強力なツールとなる。
【００１１】
このような方法には、種々の利点がある。しばしば罹患した体内の一定領域から臨床試料を得ることが困難なことがあり、かつ体における望ましくない浸潤が生じることがあり、例えば、バイオプシーを利用して癌についての試料を得ることがしばしばある。アルツハイマー病といったある症例においては、罹患した脳の試料は、死後でしか得ることができない。さらに、得られる組織試料は、不均質であることがよくあり、異常細胞と非異常細胞の両方の混合物を含むことがあり、得られる遺伝子発現データの解析が複雑かつ困難になる。
【００１２】
腫瘍の形態的な外観に関して発病学的に均質と思われる腫瘍組織のプールは、分子レベルでは極めて不均質なことがあり（非特許文献３）、ならびに実際に本質的に異なる疾病の腫瘍を含むことがあることが示唆された（非特許文献３、非特許文献２）。
【特許文献１】ＷＯ９８／４９３４２
【特許文献２】ＰＣＴ／ＧＢ０３／００５１０２
【非特許文献１】Ａｌｏｎｅｅｔａｌ．１９９９、ＰＮＡＳ、９６、Ｐ６７４５−６７５０
【非特許文献２】Ｇｏｌｕｂｅｔａｌ．１９９９、Ｓｃｉｅｎｃｅ、２８６、Ｐ５３１−５３７
【非特許文献３】Ａｌｉｚａｄｅｈｅｔａｌ．２０００、Ｎａｔｕｒｅ、４０３、ｐ５０３−５１１
【非特許文献４】Ｂｉｔｔｎｅｒｅｔａｌ．２０００、Ｎａｔｕｒｅ、４０６、ｐ５３６−５４０
【発明の開示】
【発明が解決しようとする課題】
【００１３】
疾病、その状態又はその病期を特定する目的のためには、複数の種類の細胞の均質混合物である臨床試料が体内において容易にアクセスできる領域から得ることができることから、罹患した組織又は細胞から直接臨床試料を得ることを必要としない方法が極めて望ましい。
【課題を解決するための手段】
【００１４】
本発明者らは、このたび癌、特に乳癌を特定するのに驚くべき有用性がある一組のプローブを誘導できる配列群を特定した。したがって、本発明者らは、癌患者からの血液試料の細胞において発現が変わり、それを癌又は癌の病期を同定、診断又はモニタリングする方法に使用されるプローブを作製するのに使用できる、遺伝子ファミリーについて説明する。
【００１５】
本発明に至るまでの研究において、本発明者らは、多数の遺伝子の発現レベルを、正常患者と癌患者との比較において調べた。多数の遺伝子の発現が変化したことが判明しただけではなく、発現が変化したものは、機能の面で特別の遺伝子ファミリーに属することが分かった。これらの遺伝子自体から、対応するプローブを作製することができるプールが得られ、これをまとめて使用して個体における、該遺伝子の発現のフィンガープリントを得ることができる。これらの遺伝子の発現は、癌患者において変化し、したがって、癌の状態を調べるのに有益であると考えられるので、プローブ収集物から得たフィンガープリントは、正常状態に対して疾病状態を示している。
【００１６】
癌患者において示差的に発現していることが確認された遺伝子ファミリーは、以下のようにまとめることができる：
（ｉ）タンパク質の合成及び／又は安定性に関与しているタンパク質をコードしている遺伝子；
（ｉｉ）防御及び／又はクロマチンリモデリングの調節に関与しているタンパク質をコードしている遺伝子。
【００１７】
ファミリー（ｉ）には、以下の遺伝子が含まれる：
（ａ）リボソームタンパク質及びリボソーム活性化タンパク質（すなわち、リボソームタンパク質の成分又はそれらの機能の変更に関与している成分を含むタンパク質であって、癌患者においてダウンレギュレーションされていることが分かったタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、リボソームタンパク質Ｌ１−Ｌ５６、Ｌ７Ａ、Ｌ１０Ａ、Ｌ１３Ａ、Ｌ１８Ａ、Ｌ２３Ａ、Ｌ２７Ａ、Ｌ３５Ａ、Ｌ３６Ａ、Ｌ３７Ａ、Ｐ０、Ｐ１、Ｐ２、Ｓ２−Ｓ２９、Ｓ３１、Ｓ３３−Ｓ３６、Ｓ３Ａ、Ｓ１５Ａ、Ｓ１８Ａ、Ｓ１８Ｂ、Ｓ１８Ｃ、Ｓ２７Ａ、６３、１１５（及び偽遺伝子）、リボソームタンパク質キナーゼ（例えば、S６キナーゼ）、リボヌクレアーゼ、推
定Ｓ１ＲＮＡ結合ドメインタンパク質、真核生物翻訳開始因子及びグアニンヌクレオチド結合タンパク質Ｇなどがある；
（ｂ）翻訳阻害因子及び翻訳開始因子（すなわち、タンパク質産物へのｍＲＮＡの翻訳に関与しているタンパク質であって、癌患者においてダウンレギュレーションされていることが分かったタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、真核生物翻訳延長因子、ｔＲＮＡ合成酵素、ＲＮＡ結合タンパク質、ポリアデニル化要素結合タンパク質、チロシンフォスファターゼ、真核生物翻訳開始因子及びＲＮＡポリメラーゼI、III転写因子などがある；
（ｃ）転写又は翻訳の他のモジュレータ、例えばサイクリンＤ型結合タンパク質及びグアニンヌクレオチド結合タンパク質をコードしている遺伝子。
【００１８】
ファミリー（ｉｉ）には、以下の遺伝子が含まれる：
（ａ）免疫応答関連タンパク質（すなわち、免疫刺激に応答してアップレギュレーションされ、炎症に応答するか又は炎症反応をおこす際にアップレギュレーションされるタンパク質を含み、癌患者においてアップレギュレーションされることが判明したタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、Ｔ細胞受容体及び会合成分、例えば、タンパク質キナーゼ、種々のサイトカイン、例えば、インターロイキン及びそれらの受容体（例えば、ＩＬ−１、２、３、４、５、６、７、８、９、１０
、１１、１２、１３、１５、１７、１８、２０、２２、２４）、腫瘍壊死因子及びその受容体及びそのスーパーファミリー（例えば、ＴＮＦスーパーファミリーメンバー２、３、４、５、６、７、８、９、１１、１２、１３、１４、１５）、インターフェロン調節因子、オンコスタチンＭ、白血病阻害因子、ケモカインリガンド及び受容体ファミリー（例えば、Ｎｏ．１〜２８）、補体成分、インターフェロン刺激因子、例えば、転写因子、ＭＨＣ（例えば、ＨＬＡ）クラスI又はII（又は関連成分）（例えば、ＤＱ、ＤＲ、ＤＯ、
ＤＰ、ＤＭアルファ又はベータ）、接着タンパク質（例えば、ＣＤ１Ａ、ＣＤ１Ｃ、ＣＤ１Ｄ、ＣＤ３Ｚ、６、８、１１、１４、１８、２４、２７、２８、２９、４０、４４、５０、５４、５９、７４、７９Ｂ、８０、８１、８３、８６、９６、ＩＣＡＭ）、Ｂ細胞におけるカッパポリペプチド遺伝子エンハンサーの核因子、ミエリン塩基性タンパク質、カテプシン、トール様受容体、プロテオソームサブユニット、フェリチン、タンパク質キナーゼ又はフォスファターゼ、ならびにそれらの活性剤及び阻害剤、白血球免疫グロブリン様受容体、免疫グロブリン成分、例えば、重鎖又はＦｃ断片、例えば、IｇＧ、IｇE又
はIｇＡ又はそれらのスーパーファミリーの重鎖又はＦｃ断片、デフェンシン、オキシト
シン、Ｓ１００カルシウム結合タンパク質、レクチン及びその受容体及びスーパーファミリー、レプチン、ホスホリパーゼ及び成長因子（例えば、内皮細胞成長因子又はエリスロポエチン）などがある；
（ｂ）ＴＮＦ誘発タンパク質（すなわち、ＴＮＦにさらされると個体中で誘発され、癌患者においてアップレギュレーションされることが分かったタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、ＴＮＦアルファ誘発タンパク質８、インテグリン、Ｂ細胞中のカッパ軽ポリペプチド遺伝子エンハンサーの阻害剤、ＴＮＦ会合因子２、５、Ｂ細胞中のカッパ軽ポリペプチド遺伝子エンハンサーの核因子、ＭＡＰキナーゼ、プロテインキナーゼＣ、ユビキタスキナーゼ、カドヘリン、カスパーゼ、サイクリンＤ１、スーパーオキシドジスムターゼ及びインターロイキンなどがある；
（ｃ）低酸素症誘発タンパク質（すなわち、個体又はその一部分が低酸素状態にあるときに誘発され、癌患者においてアップレギュレーションされることが分かったタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、セストリン、Ｅ１Ａ結合タンパク質ｐ３００、エンドセリン、毛細血管拡張性運動失調症及びＲａｄ３関連タンパク質、ヘキソキナーゼ２、ＴＥＫチロシンキナーゼ、ＤＮＡ断片化因子、カスパーゼ、プラスミノーゲン活性化因子、低酸素症誘発性因子１及びグルコースホスフェートイソメラーゼなどがある；
（ｄ）酸化ストレスタンパク質（すなわち、酸化的ストレス下で個体又はその一部分で誘発され、癌患者においてアップレギュレーションされることが分かったタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、スーパーオキシドジスムターゼ、グルタチオンシンテターゼ、カタラーゼ、ラクトペルオキシダーゼ、甲状腺ペルオキシダーゼ、ミエロペルオキシダーゼ、好酸球ペルオキシダーゼ、耐酸化性１、ペルオキシレドキシン、チトクロームＰ４５０、スカベンジャー受容体、パラオキソナーゼ、グルタチオンレダクターゼ、ＮＡＤ（Ｐ）Ｈデヒドロゲナーゼ、グルタチオンS−ト
ランスフェラーゼ、カテニン、グルタレドキシン、熱ショックタンパク質（例えば、熱ショック転写因子）、マイトジェン活性化タンパク質キナーゼ、エノラーゼ、チオレドキシンレダクターゼ及びペルオキシレドキシンなどがある；
（ｅ）クロマチンリモデリングに関与しているタンパク質（すなわち、クロマチン構造を維持し又は変更するのに役立ち、遺伝子調節に必須であることがあるタンパク質）をコードしている遺伝子。これらのコードされているタンパク質には、ヒストン代替タンパク質、例えば、Ｈ３．３Ａ又はＨ３．３Ｂファミリーなどがある。
【００１９】
上記ファミリーの範囲内に含まれる適切な遺伝子配列は、ノルウェーの国立バイオテクノロジー情報センター（ＮａｔｉｏｎａｌＣｅｎｔｒｅｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ）の遺伝子又はタンパク質データベース上で、キーワードとしてファミリー名、例えば、「免疫応答」を用いて適切なデータベースを検索す
ることにより同定できる。本明細書に記載の試験に用いられるオリゴヌクレオチドを開発するのにこのような遺伝子配列が有用であることを確認するために、特定の遺伝子配列の発現を、試験癌患者と正常患者とを比較して評価することができる。発現の変化が対照レベルを超えるか又は対照レベルよりも小さい場合、プローブの派生させるためのその配列の有用性が示される。
【００２０】
一般的に、上記（ｉ）ファミリーをコードしている遺伝子は、癌対正常患者においてダウンレギュレーションされ、（ｉｉ）ファミリーの場合では、コードしている遺伝子はアップレギュレーションされる。
【００２１】
癌患者では、リボソーム産生及び翻訳制御に関与している遺伝子の発現が規則的に減少する場合、血液細胞は、低酸素及びエネルギー欠乏という環境に対して細胞が適合しようとしてタンパク質合成速度を減少させることによりもたらされる患者の新しい状態に応答していると推測される。このことは、ＭｎＳＯＤやフェリチンといった反応性酸素種（ＲＯＳ）に対する防御に関与している遺伝子は、癌試料においてアップレギュレーションされることが観察されることから支持される。エリスロポエチンが低レベルであることは、癌患者では酸素レベルが低いことを示している。また、ＴＮＦは、例えば、フェリチン、デフェンシン、ＭｎＳＯＤ及びカルグラヌリンＢの発現をアップレギュレーションすることが知られているので、ＴＮＦ活性化は、上記遺伝子のファミリーにおける変化の１つの経路であると思われる。また、ＴＮＦはEＰＯ産生を阻害し、それ自体が血液環境にお
いて低酸素状態をもたらし得る。低酸素症では、ＴＮＦレベルを誘起することが知られている。これらの変化は、血流に入って来る血管形成因子により引き起こされる。理論に縛られることを意図しないが、上記効果の基礎をなす仮説を、図１に示す。
【００２２】
したがって、本発明によれば、発現が特定の癌又は癌の病期に特徴的なパターンで影響される細胞中の遺伝子に対応する一組のオリゴヌクレオチドプローブが提供される。ここで、前記遺伝子は、前記癌又は癌の病期により系統的に影響される。好ましくは、前記遺伝子は、構成的に適度又は高度に発現される。好ましくは、上記遺伝子は、試料の細胞中で適度又は高度に発現するが、疾病細胞から得た細胞中、又はそのような疾病細胞に接触した細胞内では発現しない。このようなプローブは、特に疾病部位から離れた細胞から単離したときには、疾病が臨床的に認識できるレベルまで進展していなくてよく、癌の発病後の極めて早期、すなわち、他の自覚的又は他覚的な症状が現れる数年前であっても癌又は癌の病期を検出できる。
【発明を実施するための最良の形態】
【００２３】
本明細書で使用される用語「系統的に」影響される遺伝子とは、発現が体内で疾病細胞や疾病部位と直接接触せずに影響される遺伝子を意味し、調査中の細胞は疾病細胞ではない。
【００２４】
ここで「接触」とは、一つの細胞の他細胞への直接的な影響が観察されるように互いに極めて接近する細胞、例えば、第二の細胞に影響するのに大きくはなれた所の第一の細胞から放出された二次分子により媒介されない応答、例えば免疫応答を意味する。好ましくは、接触は、物理的接触であるか、あるいは立体的にできるだけ接近している接触、都合よくは互いに接触する細胞が、例えば、１ｃｍ³内の同じ単位容積に観察されることを
意味する。
【００２５】
「異常細胞(疾患細胞)」は、表現型の変化を発現している細胞であり、その寿命中のある時期での疾病部位に存在するもの、例えば、腫瘍部位の腫瘍細胞又は腫瘍から広まった腫瘍細胞、又は脳腫瘍の場合は脳細胞である。
【００２６】
「中程度又は高度に」発現した遺伝子とは、コピー数が３０〜１００コピー/細胞(細胞内の平均ｍＲＮＡ分子数が３×１０⁵と仮定)超である静止細胞に存在する遺伝子を意味する。
【００２７】
上記の特性を有する特異的プローブは、本明細書に記載のようにして提供される。
【００２８】
したがって、本発明による一態様によれば、一組のオリゴヌクレオチドプローブであって、前記の組が、
前記に記載したファミリー（ｉ）又は（ｉｉ）からの遺伝子配列またはこのような配列由来の遺伝子配列に相当するオリゴヌクレオチド、又は相補的配列を有するオリゴヌクレオチドもしくは機能的に等価のオリゴヌクレオチド
から選択される少なくとも１０個のオリゴヌクレオチドを含む一組のオリゴヌクレオチドプローブが提供される。
【００２９】
さらに、本発明によれば、本明細書に記載の方法に使用される一組のオリゴヌクレオチドの調製方法であって、ファミリー（ｉ）からの遺伝子配列に相当する一つ以上のオリゴヌクレオチドと、ファミリー（ｉｉ）からの遺伝子配列に相当する一つ以上のオリゴヌクレオチドを選択する工程を含む方法が提供される。好ましくは、複数のオリゴヌクレオチドを、各ファミリーから（例えば、異なるサブファミリーから）選択する。この場合の選択されたオリゴヌクレオチドは、本明細書に記載の好ましい遺伝子からのものである。
【００３０】
また、本発明によれば、一種以上のオリゴヌクレオチドプローブであって、各オリゴヌクレオチドプローブが、表２、表３又は表４にあげたオリゴヌクレオチドから（例えば、表２から）選択されたもの、あるいは表２、表３又は表４に記載の配列もしくはそれと相補的配列に由来するものであるオリゴヌクレオチドから選択されたものである、一種以上のオリゴヌクレオチドプローブが提供される。前記由来のオリゴヌクレオチドには、これらの表に記載の配列に相当する遺伝子、例えば、表２、表５又は表６に記載の遺伝子（受託番号参照）、又はその相補的配列に相当する遺伝子に由来のオリゴヌクレオチドなどがあげられる。このようなプローブを、本発明の産物及び方法に使用することにより、本発明のさらなる態様が提供される。
【００３１】
本明細書において、「オリゴヌクレオチド」は、高分子構造において少なくとも６個のモノマー、すなわち、ヌクレオチド又はそれらの修飾形態を有する核酸分子である。核酸分子は、ＤＮＡ、ＲＮＡ又はＰＮＡ（ペプチド核酸）又はそのハイブリッド又はそれらの修飾型、例えば、メチル化によるか、又は合成中に修飾されたかもしくは非天然塩基から構成された、化学的に修飾された形態、例えば、ＬＮＡ（固定核酸）であってもよい。但し、これらは、相補的配列に結合する能力を保持している。このようなオリゴヌクレオチドは、本明細書に準じて標的配列を調べるのに使用されるので、本明細書では、オリゴヌクレオチドプローブ又は単にプローブと称する。
【００３２】
ファミリー（ｉ）又は（ｉｉ）からの遺伝子配列に相当するオリゴヌクレオチドは、前記遺伝子配列のすべてもしくは一部分又はその転写物に相当するオリゴヌクレオチドを意味する。そうした遺伝子配列の一部分を使用するとき、この一部分は、本明細書に記載のオリゴヌクレオチドプローブの要件、例えば、長さ及び機能の要件を満足するものである。好ましくは、前記部分は、以下で説明するサイズを有する。前記オリゴヌクレオチドは、以下一次オリゴヌクレオチドと称する。誘導オリゴヌクレオチドとは、一次オリゴヌクレオチドの一部分ではあるが、本明細書に記載のプローブ要件を満足するオリゴヌクレオチドを意味する。
【００３３】
好ましくは、前記の組を構成しているオリゴヌクレオチドプローブは、標的分子が結
合できるように長さが少なくとも１５塩基のものである。とりわけ好ましくは、前記オリゴヌクレオチドプローブは、長さが２０〜２００塩基、例えば、長さ３０〜１５０塩基、好ましくは長さ５０〜１００塩基である。
【００３４】
本明細書で使用される用語「相補的配列」とは、連続した相補的塩基（すなわち、Ｔ：Ａ、Ｇ：Ｃ）を有する配列を意味する。したがって、相補的配列は、相補性を介して互いに結合できるものである。
【００３５】
「１０種のオリゴヌクレオチド」とは、１０の異なるオリゴヌクレオチドを意味する。本明細書に記載の遺伝子配列ファミリーからのオリゴヌクレオチド、誘導オリゴヌクレオチド及びそれらの機能的等価物は異なるオリゴヌクレオチドとみなされるが、相補的オリゴヌクレオチドは異なるものとはみなされない。しかしながら、好ましくは、少なくとも１０種のオリゴヌクレオチドは、上記した遺伝子配列ファミリー内の１０の異なる遺伝子配列（又は誘導オリゴヌクレオチド又はそれらの機能的等価物）に相当する。したがって、１０の異なるオリゴヌクレオチドは、好ましくは１０の異なる転写物に結合できるものである。
【００３６】
好ましくは、少なくとも１０種のオリゴヌクレオチドは、ファミリー（ｉ）及び（ｉｉ）からのオリゴヌクレオチドの組み合わせから構成される。例えば、各ファミリーから５種のオリゴヌクレオチドを使用してもよいし、一つのファミリーから４種と、その他のファミリーから６種を使用してもよい。これによって正常患者に対して癌患者においてアップレギュレーション又はダウンレギュレーションされる遺伝子を使用することができる。異なるサブファミリーから一種又はそれ以上のオリゴヌクレオチドを使用するのが都合がよい。例えば、サブファミリー（ｉ）ａ、（ｉ）ｂ、（ｉ）ｃ、（ｉｉ）ａ及び（ｉｉ）ｂから、各々２プローブを使用してもよい。とりわけ、前記の組のオリゴヌクレオチドには、ファミリー（ｉ）ａ、（ｉｉ）ａ及び（ｉｉ）ｅからのオリゴヌクレオチドが含まれることが好ましい。
【００３７】
ファミリー（ｉ）ａ遺伝子によりコードされている好ましいタンパク質はリボソームタンパク質であり、好ましくは各組にはこのようなタンパク質をコードしている遺伝子からのオリゴヌクレオチドが含まれる。
【００３８】
ファミリー（ｉｉ）ａ遺伝子によりコードされている好ましい免疫応答タンパク質には、接着タンパク質、インターロイキン、それらの受容体及びスーパーファミリー、ＴＮＦ、その受容体及びスーパーファミリー、免疫グロブリン成分ならびにエリスロポエチンなどがある。
【００３９】
前記の組の特に好ましいものには、一種又はそれ以上のリボソームタンパク質ならびに必要に応じて一種又はそれ以上のヒストン及び必要に応じてフェリチンをコードしている遺伝子からのオリゴヌクレオチドが含まれる。
【００４０】
好ましい前記オリゴヌクレオチドは、表２又は表３に記載されているものか、あるいは表２又は表３に記載の配列由来のもの、例えば、表２に記載のものである。前記の組は、さらに表４にあげられているか、あるいは表４に記載の配列又はその相補的配列に由来する一種又はそれ以上のオリゴヌクレオチドプローブを含んでもよい。前記誘導オリゴヌクレオチドには、これらの表に記載の配列に相当する遺伝子、例えば、表２、表５又は表６に記載の遺伝子（受託番号参照）、又はその相補的配列に相当する遺伝子に由来のオリゴヌクレオチドなどがあげられる。
【００４１】
本明細書に記載の「組」とは、一群のユニークなオリゴヌクレオチドプローブ（すな
わち、固有の配列）、好ましくは１０００より少ないオリゴヌクレオチドプローブ、とりわけ５００より少ないプローブ、例えば、好ましくは１０〜５００プローブ、例えば、１０〜１００、２００もしくは３００プローブ、とりわけ好ましくは２０〜１００プローブ、例えば、３０〜１００プローブからなるものである。場合によっては、１０より少ないプローブ、例えば、２〜９プローブ、例えば、５〜９プローブを使用してもよい。
【００４２】
プローブ数を増加すると、当該の特定遺伝子の発現を同様に変更できる他の疾病と比較することにより、解析がうまくいかない可能性、例えば、誤診を防止できることが分かる。また、本明細書に記載されていない他のオリゴヌクレオチドプローブも存在していてもよい。このことは、特に前記組のオリゴヌクレオチドプローブの最終用途に役立つ場合に言える。しかしながら、好ましくは、前記の組は、本明細書に記載のオリゴヌクレオチドからのみ、又はそのサブセット（上記したようなサイズのもの）からのみ構成されている。
【００４３】
ユニークな各オリゴヌクレオチドプローブの複数のコピー、例えば、１０又はそれ以上のコピーが、各組に存在していてもよいが、単一プローブのみを構成していてもよい。
【００４４】
好ましくは固体担体上に固定化されているか、又はそうした固定化のための手段を有していてもよい一組のオリゴヌクレオチドプローブは、上記したものから選択された少なくとも１０種のオリゴヌクレオチドプローブを含む。上記したように、これらの１０プローブは、ユニークでかつ異なる配列を有していなければならない。しかしながら、そうであっても同じ遺伝子を認識するが、異なるスプライシング事象を反映する２つの別個のプローブを使用してもよい。しかしながら、特異的な遺伝子と相補的かつそれに結合するオリゴヌクレオチドプローブが好ましい。
【００４５】
本明細書に記載の「機能的に等価な」又は誘導されたオリゴヌクレオチドとは、本明細書に記載の遺伝子配列ファミリーにおける配列からのオリゴヌクレオチドと同じ遺伝子を同定できるオリゴヌクレオチドを意味する。すなわち、機能的に等価な又は誘導されたオリゴヌクレオチドは、一次オリゴヌクレオチド又は誘導オリゴヌクレオチド（又はその相補的配列）と同じ、ある遺伝子（標的核酸分子）から転写されたｍＲＮＡ分子（又はＤＮＡ）に結合できる。したがって、好ましい特徴においては、前記の誘導又は機能的に等価なオリゴヌクレオチドは、表２、表５又は表６に記載の遺伝子配列の一部分又はその相補的配列である。好ましくは、前記の機能的に等価なオリゴヌクレオチドは、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドと同じスプライシング産物を認識、即ち、それに結合することができる。好ましくは、前記ｍＲＮＡ分子は、前記一次オリゴヌクレオチド又は誘導オリゴヌクレオチドに相当する完全長ｍＲＮＡ分子である。
【００４６】
本明細書で使用される用語「結合できる」又は「結合」は、以下で説明する条件下でハイブリダイゼーションできる能力を意味する。
【００４７】
あるいは機能的に等価な発現されるオリゴヌクレオチド（又は相補的配列）は、後記するように、一次オリゴヌクレオチド又は誘導オリゴヌクレオチド又は相補的オリゴヌクレオチドが結合する標的分子の領域と配列が同一であるか、又はそれにハイブリダイズする。好ましくは、機能的に等価なオリゴヌクレオチド（又はそれらの相補的配列）は、後記する条件下で一次オリゴヌクレオチド又は誘導オリゴヌクレオチドに相当するｍＲＮＡ配列の一つにハイブリダイズするか、あるいは一次オリゴヌクレオチド又は誘導オリゴヌクレオチドに相当するｍＲＮＡ配列の一つの一部分と配列が同一である。これに関連して「部分」とは、一続きの少なくとも５塩基、例えば、少なくとも１０又は２０塩基、例えば、５〜１００塩基、例えば、１０〜５０塩基又は１５〜３０塩基を意味する。
【００４８】
特に好ましい態様において、機能的に等価なオリゴヌクレオチドは、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドが結合する標的核酸分子（ｍＲＮＡ又はｃＤＮＡ）の領域のすべて又は一部分に結合する。「標的」核酸分子は、遺伝子転写物又は関連産物、例えば、ｍＲＮＡ又はｃＤＮＡ、又はその増幅産物である。前記一次オリゴヌクレオチド又は誘導オリゴヌクレオチドが結合する前記標的分子の前記「領域」は、相補性が存在する一帯である。その最も大きな領域は、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドの完全長である。しかしながら、全体の一次配列又は誘導オリゴヌクレオチドが標的配列の領域に相補的でない場合にはもっと短くてもよい。
【００４９】
前記標的分子の前記領域の前記部分は、少なくとも５塩基の一続き、例えば、少なくとも１０もしくは２０塩基、例えば、５〜１００塩基、例えば、１０〜５０塩基又は１５〜３０塩基であることが好ましい。これは、例えば、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドの塩基と同一である、いくつかの塩基を有する前記の機能的に等価なオリゴヌクレオチドにより得られる。これらの塩基は、例えば、機能的に等価なオリゴヌクレオチドの一部分において連続する一帯にわたって同一であるか、あるいは非連続的に存在していてもよいが、この場合標的配列に結合できる程度に充分な相補性を有する。
【００５０】
したがって、好ましい特徴において、前記の機能的に等価なオリゴヌクレオチドは、一次オリゴヌクレオチド又は誘導オリゴヌクレオチド又はその相補的配列に高ストリンジェンシー条件下でハイブリダイズする。別の表現では、前記の機能的に等価のオリゴヌクレオチドは、一次オリゴヌクレオチドのすべて又は一部分との配列の同一性が高い。好ましくは、前記の機能的に等価なオリゴヌクレオチドは、一次オリゴヌクレオチドのすべて又はその一部分に対する配列の同一性は、少なくとも７０％、好ましくは少なくとも８０％、例えば、少なくとも９０％、９５％、９８％又は９９％の同一性を有している。これに関連して使用される用語「部分」は、前記一次オリゴヌクレオチドにおける一続きの少なくとも５塩基、例えば、少なくとも１０又は２０塩基、例えば、５〜１００塩基、例えば、１０〜５０塩基又は１５〜３０塩基の一続きを意味する。前記一次オリゴヌクレオチドの一部分に対する配列の同一性しかないときには、その配列の同一性は高い、例えば、上記したように少なくとも８０％であることがとりわけ好ましい。
【００５１】
上記した機能的な要件を満足する機能的に等価なオリゴヌクレオチドには、一次オリゴヌクレオチド由来のもの、ならびにさらに単一又は複数のヌクレオチド塩基（又は等価の）の置換、付加及び／又は欠失により修飾されているが、それでもまだ機能的活性を保持しているもの、例えば、一次オリゴヌクレオチド又はさらに誘導又は修飾される誘導オリゴヌクレオチドと同じ標的分子に結合するものが挙げられる。好ましくは、前記修飾は、１〜５０塩基、例えば、１０〜３０塩基、好ましくは１〜５塩基のものである。とりわけ、少しだけの修飾、例えば、１０塩基より少ない変化、例えば、５塩基より少ない変化が存在することが好ましい。
【００５２】
「付加」等価物の意味の中には、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドが結合する標的分子上の塩基の連続した一帯に相補的である、追加配列を含有するオリゴヌクレオチドが含まれる。あるいは付加は、例えば、さらなる性質を付与され、例えば、リンカーなどの固定化手段を得てオリゴヌクレオチドプローブを固体担体に結合させることができる、異なる無関係配列を含むことができる。
【００５３】
特に好ましいものは、天然の等価物、例えば、生物学的変異体、例えば、対立遺伝子、地理的又はアロタイプ変異体、例えば、異なる種に存在する遺伝的変異体に相当するオリゴヌクレオチドである。
【００５４】
機能的等価物には、修飾塩基、例えば、非天然塩基を用いたオリゴヌクレオチドなど
がある。このような誘導体は、合成中に調製してもよいし、又は製造後に修飾して調製してもよい。
【００５５】
低ストリンジェンシーの条件下で結合する「ハイブリダイゼーション」配列は、非ストリンジェンシー条件（例えば、室温で６XＳＳＣ／５０％ホルムアミド）で結合しかつ
低ストリンジェンシーの条件（２ＸＳＳＣ、常温、より好ましくは２ＸＳＳＣ、４２℃）下で洗浄したときに結合した状態を維持するものである。高ストリンジェンシー下でのハイブリダイゼーションは、洗浄を２ＸＳＳＣ、６５℃（ここで、ＳＳＣ＝０．１５ＭＮａＣｌ、０．０１５Ｍクエン酸ナトリウム、ｐＨ７．２）でおこなう上記条件を意味する。
【００５６】
本明細書で使用される用語「配列の同一性」は、以下のパラメータを用いたＣｌｕｓｔａｌＷ（Ｔｈｏｍｐｓｏｎら、１９９４、Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．、２２、ｐ４６７３−４６８０）を用いて評価して得られる値を意味する。
ペア配列パラメーターー方法：正確、マトリックスＩＵＢ、ギャップオープンペナルティ：１５．００、ギャップ拡張ペナルティ：６．６６；
複数の配列パラメーターーマトリックス：ＩＵＢ、ギャップオープンペナルティ：１５．００、遅延同一性％：３０、ネガティブマトリックス：なし、ギャップ拡張ペナルティ：６．６６、ＤＮＡトランジションウエイティング：０．５
【００５７】
特定の塩基での配列同一性は、単純に誘導された同一塩基を含む。
【００５８】
また、本発明は、表２、表３又は表４のオリゴヌクレオチド又は表２、表３又は表４の誘導オリゴヌクレオチド（例えば、表２、表５又は表６に記載の配列又はそれらに相補的な配列を有するもの）が結合するｍＲＮＡ配列によりコードされているポリペプチドにも拡張される。さらに、本発明は、前記ポリペプチドのいずれかに結合する抗体にも及ぶ。
【００５９】
上記したように、前記の組のオリゴヌクレオチドプローブは、一種又はそれ以上の固体担体上に固定化されているのが都合がよいことがある。各ユニークなプローブの単一又は好ましくは複数のコピーは、前記固体担体に結合される。例えば、各ユニークなプローブの１０又はそれ以上のコピー、例えば、少なくとも１００コピーが存在する。
【００６０】
一つ又はそれ以上のユニークなオリゴヌクレオチドプローブは、別々の固体担体に結合させて、それらは一緒に複数の固体担体上に固定化された一組のプローブを形成してもよい。例えば、一つ又はそれ以上のユニークなプローブを、複数のビーズ、膜、フィルター、バイオチップなどに固定して、後記キットのモジュールを一緒に構成する一組のプローブを一緒に構成してもよい。各プローブに関係するシグナル（後記のようにして生成）は別個に決定できなければならないけれども、異なるモジュールの固体担体は物理的に結合しているのが都合がよい。別法として、プローブを、同じ固体担体の離れた部分に固定化してもよい。例えば、各ユニークなオリゴヌクレオチドプローブ、例えば、複数のコピーにおける各ユニークなオリゴヌクレオチドプローブを、単一のフィルター又は膜の別個かつ離れた部分又は領域に固定化して、例えば、アレイを形成してもよい。
【００６１】
このような手法を組み合わせて使用してもよい。例えば、いくつかのユニークなプローブを各々固定化するいくつかの固体担体を使用してもよい。
【００６２】
用語「固体担体」は、疎水性、イオン性又は共有結合の架橋によりオリゴヌクレオチドを結合できる、任意の固体材料を意味する。
【００６３】
本明細書で使用される用語「固定化」は、このような結合によって前記固体担体へのプローブの可逆的又は不可逆的結合を意味する。可逆的の場合には、プローブは、本発明の方法を実施するのに充分な時間、固体担体と結合したままである。
【００６４】
本発明によれば固定化部分として好適な多数の固体担体は、当該技術分野において周知であり、文献に広く記載されている。一般的に言えば、固体担体は、化学的又は生化学的方法において、固定化、分離などに現在広く使用されるか又は提案されている周知の担体又はマトリックスのいずれかでよい。このような材料には、合成有機ポリマー、例えば、ポリスチレン、ポリ塩化ビニル、ポリエチレン；又はニトロセルロース及び酢酸セルロース；又はトシル活性化表面；又はガラスもしくはナイロン、又は核酸の共有結合に好適な基を担持するいずれかの表面などがあるが、これらには限定されない。該固定化部分は、例えば、高分子材料、例えば、アガロース、セルロース、アルギナート、テフロン(登
録商標)、ラテックス、ポリスチレン又は磁気ビーズからできている、粒子、シート、ゲ
ル、フィルター、膜、マイクロファイバーストリップ、チューブ又はプレート、繊維又はキャピラリーの形態をとることができる。好ましくは一次元での配列の形態を可能とする固体担体、例えば、シート、フィルター、膜、プレート又はバイオチップが好ましい。
【００６５】
固体担体への核酸分子の結合を、直接的又は間接的におこなうことができる。例えば、フィルターを使用する場合には、結合は、ＵＶ誘発架橋によりおこなうことができる。別法として、結合を、結合部分をオリゴヌクレオチドプローブ及び／又は固体担体上に担持して使用することにより間接的におこなってもよい。したがって、例えば、一対のアフィニティ結合パートナー、例えば、アビジン、ストレプトアビジンもしくはビオチン、ＤＮＡもしくはＤＮＡ結合タンパク質（例えば、ｌａｃIレプレッサータンパク質又はそれ
が結合するｌａｃオペレータ配列のいずれか）、抗体（モノクローナル又はポリクローナルでよい）、抗体断片又は抗体のエピトープ又はハプテンを使用してもよい。これらの場合、結合対の一つのパートナーを固体担体に結合するか、又はその一つのパートナーが固有的に固体担体の一部分であり、他のパートナーを核酸分子に結合するか、又は他のパートナーが固有的に核酸分子の一部分である。
【００６６】
本明細書で使用される用語「アフィニティ結合対」とは、特異的に互いを認識しかつ結合する（すなわち、他の分子への結合に優先して）２つの成分を意味する。このような結合対は、互いに結合したときに、複合体を形成する。
【００６７】
固体担体への適切な官能基の結合は、当該技術分野において周知の方法によりおこなうことができる。このような方法には、例えば、固体担体を処理して好適な表面塗膜を得ることにより形成できる水酸基、カルボキシル基、アルデヒド基、アミノ基を介した結合が含まれる。結合パートナーの結合に適当な部分を与える固体担体は、当該技術分野において公知の通常の方法により製造できる。
【００６８】
本発明のオリゴヌクレオチドプローブへの適当な官能基の結合は、ライゲーションによりおこなうか、又は適当な部分、例えば、ビオチン又は特定の捕捉配列を担持したプライマーを使用した合成又は増幅中に導入される。
【００６９】
上記したプローブの組は、キットの形態で提供するのが都合がよい。
【００７０】
したがって、本発明のさらなる態様によれば、一種又はそれ以上の固体担体上に固定化された上記のような一組のオリゴヌクレオチドプローブを含むキットが提供される。
【００７１】
好ましくは、前記プローブ類を単一の固体担体上に固定化し、各ユニークなプローブを該固体担体の異なる領域に結合させる。しかしながら、複数の固体担体に結合させたと
き、前記複数の固体担体は、キットを構成するモジュールを形成する。とりわけ好ましくは、前記担体は、シート、フィルター、膜、プレート又はバイオチップである。
【００７２】
必要に応じて、キットは、正常試料又は疾病試料（該キットの使用に関して以下で詳細に説明する）、標準化材料、例えば、比較用の正常試料及び／又は疾病試料からのｍＲＮＡ又はｃＤＮＡ、ｃＤＮＡへの取込み用標識、増幅用核酸配列導入用アダプター、増幅用プライマー及び／又は適当な酵素、バッファー及び溶液により生成されるシグナルに関係する情報を含んでいてもよい。必要に応じて、前記キットは、添付文書を含んでいてもよい。この添付文書には、本発明の方法をどのように実施するかが記載されており、本発明を実施したときに得られる標準的なグラフ、データ又は結果を解釈するためのソフトウエアが必要に応じて付けられている。
【００７３】
後記の標準的な診断遺伝子転写物パターンを作成するこのようなキットの使用は、本発明のさらなる態様を構成する。
【００７４】
本明細書に記載のプローブの組には、種々の用途がある。しかしながら、主にこれらは、試験用細胞の遺伝子発現状態を評価して、前記細胞を得る生物に関係した情報を得ることに使用される。したがって、プローブは、生物における癌又は癌の病期を診断、同定又はモニタリングするのに有用である。
【００７５】
したがって、本発明のさらなる態様によれば、上記の一組のオリゴヌクレオチドプローブ又はキットの使用であって、上記オリゴヌクレオチドプローブが結合する遺伝子の遺伝子発現のレベルを反映する細胞の遺伝子発現パターンを決定するための使用が提供される。この使用は、少なくとも
ａ）必要に応じてｃＤＮＡに逆転写してもよい、前記細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、本明細書に記載の一組のオリゴヌクレオチドプローブ又はキットにハイブリダイズさせる工程と；
ｃ）前記プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して前記パターンを生成する工程と、
を含む。
【００７６】
この方法及び以下で述べる方法において言及されるｍＲＮＡ及びｃＤＮＡは、前記分子の誘導体又はコピー、例えばそのような分子のコピー、具体的には相補鎖の増幅又は調製により製造されるものであるが、ｍＲＮＡ配列の同一性が保持されており、すなわち、前記分子の少なくともある領域について相補性又は配列の同一性が高いので、直接に転写物（又はその相補的配列）にハイブリダイズするようなものを含む。転写物をトランケート（truncate）したり、あるいは例えば、プライマー増幅により新しい配列を導入する手法が使用された領域全体にわたっては相補性は存在しないことが認識されよう。便宜上、前記ｍＲＮＡ又はｃＤＮＡは、工程ｂ）の前に増幅することが好ましい。本明細書に記載のオリゴヌクレオチドと同様に、前記分子は、例えば、相補性が維持されるならば合成中に非天然塩基を使用して修飾してもよい。また、このような分子は、シグナル伝達手段又は固定化手段などのさらなる部分を担持していてもよい。
【００７７】
このようなパターンを作成する方法に含まれる種々の工程を、以下詳細に説明する。
【００７８】
本明細書で使用される用語「遺伝子発現」とは、特定の遺伝子の転写により特異的ｍＲＮＡ産物（すなわち、特定のスプライシング産物）が生成することを意味する。遺伝子発現レベルは、転写ｍＲＮＡ分子、又はｍＲＮＡ分子から逆転写されたｃＤＮＡ分子、又は例えば、増幅によりこれらの分子から得られた産物のレベルを評価することにより求め
ることができる。
【００７９】
この手法により得られた「パターン」は、例えば、表の形又はグラフ状に表すことができる情報を言い、二種又はそれ以上のオリゴヌクレオチドと関係するシグナルについての情報を伝達する。好ましくは、前記パターンは、各プローブと関連した発現レベルに関する数のアレイ（array）として表される。
【００８０】
好ましくは、前記パターンは、以下の線形モデルを用いて確定される：
ｙ＝Ｘｂ＋ｆ式１
（式中、Ｘは遺伝子発現データのマトリックスであり、ｙは反応変数であり、ｂは回帰係数ベクトルであり、ｆは推定残余ベクトルである。式１に表される関係を確定するのに種々の異なる方法を使用することができるが、式１の関係を確定するのには、部分最小二乗回帰（ＰＬＳＲ）を使用するのがとりわけ好ましい。
【００８１】
したがって、プローブは、細胞が単離される時点での遺伝子発現を反映するパターンを生成するのに使用される。その発現パターンは、細胞を取り巻く周囲の状況に特徴的なものであり、細胞に及ぼす影響により異なる。したがって、特定の癌を有する個体からの細胞について特徴的な遺伝子転写パターンの標準又はフィンガープリント（標準プローブパターン）を作成して、試験細胞の転写パターンとの比較に使用されてもよい。これは、生物が特定の癌を患っているか又は癌の特定の病期にあるかどうかを診断、モニタリング又は同定することに用いることができるのは明らかである。
【００８２】
標準パターンは、癌を有するか、その病期にある一つ又はそれ以上の生物から得た試料の細胞についての総ｍＲＮＡ（又はｃＤＮＡ又は関連産物）のプローブへの結合の程度を求めることにより作成される。これは、ユニークな各プローブに対応し、存在する転写物レベルを示す。異なるプローブに結合する核酸物質の量を評価し、この情報を一緒にして、その癌又は癌の病期に関する遺伝子転写パターン標準を形成する。このような標準パターン各々は、癌又は癌の病期に特徴的なものである。
【００８３】
したがって、本発明のさらなる態様によれば、生物における癌又は癌の病期に特徴的な標準遺伝子転写パターンを作成する方法であって、少なくとも
ａ）必要に応じてｃＤＮＡに逆転写してもよい、癌又は癌の病期にある一つ又はそれ以上の生物の試料細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、調査中の生物及びその試料に対応する生物及びその試料中の前記癌又は癌の病期に特異的な前記一組のオリゴヌクレオチド又はキットにハイブリダイズさせる工程と；
ｃ）前記プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、前記癌又は癌の病期の試料において、前記オリゴヌクレオチドが結合する遺伝子の遺伝子発現のレベルを示す特徴的なパターンを作成する工程と；
を含む方法が提供される。
【００８４】
前記オリゴヌクレオチドは、一種又はそれ以上の固体担体上に固定化されているのが都合がよく、好ましい。
【００８５】
特定のプローブを用いた、極めて多数の癌及び癌の異なる病期についての標準パターンをデータベースに蓄積して、要望のあり次第、検査室で利用できるようにしてもよい。
【００８６】
本明細書における「疾病」の試料及び生物、あるいは「癌」の試料及び生物は、例えば、腫瘍などの固形塊において異常細胞が増殖している生物（又は前記生物からの試料）を意味する。このような生物は、調査中の癌又は癌の病期を有する又は示すことが知られ
ているものである。
【００８７】
癌の「病期」は、特定の生理的又は代謝的変化を示しても、示さなくてもよいが、遺伝子発現の変化として検出できる遺伝子レベルでの変化を示す、癌の種々の病期を意味する。癌の進行中、種々の転写物の発現が異なってもよい。したがって、種々の病期での発現変化は、特定の転写物について「正常」試料と比較して示さなくてもよい。しかしながら、癌の進行を通して一つ又はそれ以上の病期で発現変化を示すいくつかの転写物から得た情報を組み合わせて使用すると、癌の特定の病期を示す特徴的なパターンを得ることができる。したがって、例えば癌の種々の病期、例えば、前段階I、病期I、病期II、病
期III、又は病期IVを識別できる。
【００８８】
本明細書で使用される用語「正常」とは、比較の目的に使用される生物又は試料を意味する。好ましくは、これらは、特にこれらが正常標準として使用される癌に関する遺伝子発現に影響を及ぼしそうな、いかなる疾病又は状態の兆候を示さないか、あるいはそのような疾病又は状態を有するとは思われない意味において「正常」のものである。しかしながら、癌の種々の病期を比較してもよく、そのような場合における「正常」試料は、当該癌の初期の病期に相当するものでもよい。
【００８９】
本明細書で使用される用語「試料」は、生物、例えば、細胞を含有する調査中のヒト又はヒト以外の動物から得た材料を意味し、組織、体液又は体内老廃物、あるいは原核生物の場合には、その生物自体を含む。「体液」には、血液、唾液、髄液、精液、リンパ液などがある。「体内老廃物」には、尿、喀痰物（肺疾患患者）、糞などがある。「組織試料」には、バイオプシー、外科的介入又は他の手段、例えば、胎盤により得られた組織などがある。しかしながら、好ましくは、試験試料は、癌に侵されていないと思われる体の領域からのものである。このような試料における細胞は、異常細胞、すなわち、癌細胞ではなく、このような異常細胞と接触状態にあったものではなく、かつ癌部位に由来するものではない。「疾病部位」は、客観的に測定できる方法で疾病、例えば腫瘍を発現する体の領域であると考えられる。したがって、例えば、末梢血を使用して非造血性癌の診断に使用してもよく、その血液は癌からの悪性細胞又は播種性細胞が存在する必要はない。同様に、血液：脳関門のために血液中に異常細胞が見られない脳疾患でも、末梢血は、本発明の方法に使用できる。
【００９０】
また、標準転写パターンの作成方法及び本発明の他の方法は、真核生物の生きている部分、例えば、培養細胞及び臓器培養ならびに外植片への使用にも適用できることが認識されよう。
【００９１】
本明細書で使用される「相当する」試料などは、好ましくは同じ組織、体液又は体内老廃物からの細胞を意味するが、それ以外でもさらに標準又は試験パターンを作成する目的に充分に同じである組織、体液又は体内老廃物からの細胞をも含む。プローブに「対応する」遺伝子に関して使用するとき、これはプローブに対し、配列（相補的でもよい）によって関連づけられる遺伝子を意味するが、プローブは発現の異なるスプライシング産物を反映するものでよい。
【００９２】
本明細書で使用される用語「評価」は、絶対的又は相対的な観点で測定できる定量的評価及び定性的評価の両方を意味する。
【００９３】
本発明は、以下のようにして実施できる。
【００９４】
特定の癌又は癌の病期のための標準転写パターンを作成するために、試料ｍＲＮＡを、疾病の個体又は生物から公知の手法（例えば、Ｓａｍｂｒｏｏｋら（１９８９）、Ｍ
ｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：Ａｌａｂｏｒａｔｏｒｙｍａｎｕａｌ（実験マニュアル）、２ｎｄＥＤ．、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ、ニューヨーク）により、組織、体液又は体内老廃物の細胞から抽出する。
【００９５】
ＲＮＡを用いて操作することが困難であるので、好ましくはＲＮＡをこの段階で逆転写して第一鎖ｃＤＮＡを形成する。しかしながら、ｃＤＮＡのクローニング、あるいはｃＤＮＡライブラリーから又はｃＤＮＡライブラリーを用いての選択は、本発明におけるこの方法又は他の方法では必要ない。好ましくは、第一鎖ｃＤＮＡの相補的鎖、すなわち、第二鎖ｃＤＮＡを合成するが、これは、いずれの対応鎖がオリゴヌクレオチドプローブに存在するかによって決まる。しかしながら、別法として、ＲＮＡは、逆転写なしで直接使用することができ、必要に応じて標識することもできる。
【００９６】
好ましくは、ｃＤＮＡ鎖を、適当なプライマーを使用することにより、ポリメラーゼ連鎖反応（ＰＣＲ）などの公知の増幅方法により増幅させる。別法として、ｃＤＮＡ鎖を、大腸菌などのバクテリアを形質転換するのに使用されるベクターを用いてクローニングした後、成長させて核酸分子を増殖させてもよい。ｃＤＮＡの配列が既知のものでない場合には、プライマーを、導入された核酸分子の領域に向けてもよい。したがって、例えば、アダプターを、ｃＤＮＡ分子、及びこれらの部分に向けられたプライマーにライゲーションして、ｃＤＮＡ分子を増幅することができる。別法として、真核生物試料の場合には、ＲＮＡのポリＡテール及びキャップを利用して適当なプライマーを調製してもよい。
【００９７】
特定の癌又は癌の病期の標準診断遺伝子転写パターン又はフィンガープリントを作成するために、上記オリゴヌクレオチドプローブを使用して、疾病試料のｍＲＮＡ又はｃＤＮＡを探索することにより、各特定のオリゴヌクレオチドプローブ種、すなわち、ユニークな各プローブにハイブリダイズさせるためのシグナルを生成する。また、必要に応じて、正常試料からのｍＲＮＡ又はｃＤＮＡを用いて、標準対照遺伝子転写パターンを作成してもよい。したがって、ｍＲＮＡ又はｃＤＮＡを、適当な条件下でオリゴヌクレオチドプローブと接触させてハイブリダイズさせる。
【００９８】
複数の試料を探索するときには、例えば、一つ以上の固体担体、すなわち、プローブキットモジュール上で同じプローブを用いて連続的に実施するか、あるいは対応するプローブ、例えば、対応のプローブキットのモジュールに同時にハイブリダイズさせることにより実施できる。
【００９９】
ハイブリダイゼーションがいつ生じたかを確認し、転写物の数／（オリゴヌクレオチドプローブに結合するようになったｃＤＮＡ分子）という指標を得るためには、転写物（又は関連する分子）がハイブリダイズするとき（例えば、二本鎖核酸分子の検出、又は例えば、洗浄により未結合分子を除去した後に結合した分子の数を検出することにより）に生成するシグナルを確認する必要がある。
【０１００】
シグナルを得るために、ハイブリダイズする一方又は両方の成分（すなわち、プローブ及び転写物）は、情報伝達手段又はその一部分を担持するか又は形成する。この「情報伝達手段」は、シグナルの生成又は存在により直接的又は間接的に検出できる部分である。該シグナルは、いずれの検出可能な物理的特性、例えば、放射線放出、散乱又は吸収の特性、磁気特性又は他の物理的特性、例えば、存在する分子の電荷、サイズ又は結合特性（例えば、標識）、あるいは生成することがある分子（例えば、ガス放出など）により付与されるものでよい。シグナル増幅できる方法、例えば、酵素の触媒作用により単一の活性結合部位から複数のシグナル事象を生成して、複数の検出可能な産物を生成する方法が好ましい。
【０１０１】
情報伝達手段は、自ら検出可能なシグナルを与える標識であるのが都合がよいことがある。また、これは、ｃＤＮＡ産生中、相補的ｃＤＮＡ鎖の調製、標的ｍＲＮＡ／ｃＤＮＡの増幅中に組み込まれることがあるか、又は標的核酸分子に直接付加した放射性又は他の標識を使用することによりおこなうのが都合がよい。
【０１０２】
標識は、転写物／ｃＤＮＡの存在を直接的又は間接的に検出又は測定することができるものが適当である。このような標識には、例えば、放射能標識、化学標識、例えば、発色団又は蛍光体（例えば、フルオレセイン及びローダミンなどの染料）、又は高電子密度の試薬、例えば、フェリチン、ヘモシアニン又は金コロイドなどがある。代わりのものとして、標識は、酵素、例えば、ペルオキシダーゼ又はアルカリ性フォスファターゼでもよい。この場合、酵素の存在は、好適な実体物、例えば、基質との相互作用により可視化される。また、標識は、情報伝達ペアの一部分を形成してもよい。この場合、このペアの他のメンバーは、転写物／ｃＤＮＡが結合するオリゴヌクレオチドプローブ上に見られるか、又はオリゴヌクレオチドプローブの近くに見られるものである。例えば、蛍光性化合物及びクエンチ蛍光性基質を使用できる。また、標識を、抗体などの異なる実体物上に設けることもできる。この異なる実体物は、転写物／ｃＤＮＡに結合させた、例えば、合成又は増幅中に使用された塩基に結合させたペプチド部分を認識する。
【０１０３】
シグナルは、ハイブリダイゼーション工程の前、間又は後の標識の導入により得ることができる。別法として、ハイブリダイズする転写物の存在は、他の物理的性質、例えば、それらの吸光度により確認できる。この場合、情報伝達手段は、複合体自体である。
【０１０４】
次に、各オリゴヌクレオチドプローブに関係したシグナルの量を評価する。評価は、定量的でも、定性的でもよく、各プローブへの単一の転写物種（又は関連するｃＤＮＡ又は他の産生物）の結合、あるいはユニークな各プローブの複数のコピーへの複数の転写物種の結合に基づくものでよい。定量的な結果により、蓄積される癌の転写物フィンガープリントについてのさらなる情報が得られる。このデータは、絶対値（マクロアレイの場合）で表してもよいし、又は特定の標準又は基準、例えば、正常対照試料と比較して求めてもよい。
【０１０５】
さらに、標準診断遺伝子パターン転写物を、一種又はそれ以上の疾病試料（及び使用する場合には正常試料）を用いて調製し、ハイブリダイゼーション工程を実施することにより遺伝子発現において特定の個人のバラツキの方向に偏らないパターンを得ることができる。
【０１０６】
特定の生物における特定癌又は癌の病期の同定、診断又はモニタリングの目的のために作成される標準パターン及び標準診断遺伝子転写物パターンの作成における上記プローブの使用は、本発明のさらなる態様を構成する。
【０１０７】
選択されたオリゴヌクレオチドプローブを用いて特定癌又は癌の病期について、標準診断フィンガープリント又はパターンを一旦決定したら、この情報を、異なる試験生物又は個体におけるその癌の有無又は程度又は病期を確認するのに使用できる。
【０１０８】
試験試料の遺伝子発現パターンを調べるために、標準パターンの作成に使用した試料に相当する細胞を含有する組織、体液又は体内老廃物の試験試料を、調査される患者又は生物から得る。次に、試験遺伝子転写パターンを、標準パターンについて上記した方法で作成する。
【０１０９】
したがって、本発明のさらなる態様によれば、試験遺伝子転写パターンの作成方法で
あって、少なくとも
ａ）必要に応じてｃＤＮＡに逆転写してもよい、前記試験生物の試料の細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、調査中の生物及びその試料に対応する生物及びその試料中の該癌又は癌の病期に特異的な一組のオリゴヌクレオチド又はキットにハイブリダイズさせる工程と；
ｃ）前記プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、前記試験試料において、前記オリゴヌクレオチドが結合する遺伝子の遺伝子発現レベルを示す前記パターンを作成する工程と；
を含んでなる方法が提供される。
【０１１０】
次に、この試験パターンを、一つ又はそれ以上の標準パターンと比較して、試料が癌又は癌の病期を有する細胞を含有するかどうかを評価することができる。
【０１１１】
したがって、本発明のさらなる態様によれば、生物における癌又は癌の病期を診断又は同定又はモニタリングする方法が提供される。この方法は、
ａ）必要に応じてｃＤＮＡに逆転写してもよい、前記生物の試料の細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、調査中の生物及びその試料に対応する生物及びその試料中の該癌又は癌の病期に特異的な前記一組のオリゴヌクレオチド又はキットにハイブリダイズさせる工程と；
ｃ）前記プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、前記試料において、前記オリゴヌクレオチドが結合する遺伝子の遺伝子発現のレベルを示す特徴的なパターンを作成する工程と；
ｄ）前記パターンを、前記調査中の生物及び試料に対応する生物からの試料を用いて本発明の方法により作成された標準的な診断パターンと比較して、前記調査中の生物において前記癌又は癌の病期の存在の有無を決定する工程と；
を含む。
【０１１２】
工程ｃ）まで及びその工程ｃ）を含む方法は、上記した試験パターンの作成である。
【０１１３】
本明細書で使用される用語「診断」は、生物における癌又はその病期の存在の決定を意味する。「モニタリング」は、特に個体が癌を患っていることが知られているときに癌の程度を確定することを意味し、例えば、癌の治療効果又は進行をモニタリングし、例えば、治療の適切性を決定したり、予後をおこなうことを意味する。
【０１１４】
癌又は癌の病期が存在するかどうかは、標準パターンと試験試料パターンとの間の相関の度合いを求めることにより決定できる。これには、正常試料及び疾病試料について得られる値の範囲を考慮する必要がある。これは、プローブに結合しているいくつかの代表的な試料についての標準偏差を得て標準を得ることにより確定できるけれども、試験試料が標準に対して密に相関している場合には、単一の試料でも癌を同定するための標準パターンを生成するのに充分であると考えてもよい。試験試料における癌又は癌の病期の有無又は程度は、試験試料における有益なプローブの発現レベルに関係するデータを、式１により確定される標準診断プローブパターンに挿入することにより予測できることが都合がよい。
【０１１５】
上記した方法を用いて生成したデータは、最も基本的な視覚表示に表すこと（例えば、強度に関して）から、定量化でき、かつ数学的に表すことができ、種々のプローブが結合する各遺伝子の発現レベルの相互関係を反映した基礎パターンを同定するためのもっと複雑なデータ操作まで、種々の方法を用いて解析できる。このように生成した生データは
、以下で記載するデータ処理及び統計的方法、特にデータを正規化及び標準化し、データを類別モデル（classification model）にあてはめて操作し、前記試験データが特定癌又は癌の病期のパターンを反映するかどうかを決定することが都合がよい。
【０１１６】
本発明の方法は、オリゴヌクレオチドプローブが有用である癌又は癌の病期又は進行の確認、モニタリング又は診断に使用することができる。本発明の「有用な」プローブは、当該癌又はその特定の病期における発現の変化を示す遺伝子を反映するものである。診断目的には本発明のプローブは、単独で使用したときにはその有用性は充分ではないが、例えば、上記の組における特徴的なパターンを得るためのいくつかのプローブのうちの一つとして使用するときには有用である。
【０１１７】
好ましくは、前記プローブは、前記癌又は癌の病期により系統的に影響される遺伝子に対応する。とりわけ好ましくは、本発明のプローブに結合し、転写物が得られる前記遺伝子が、中程度又は高度に発現する。中程度又は高度に発現した遺伝子に対するプローブを使用すると、必要な遺伝子発現データの組を生成するのに必要とする臨床試料が少なくてよく、例えば、血液試料が１ｍｌ未満でよいという利点がある。
【０１１８】
さらに、すでに活発に転写しているこのような遺伝子は、新しい刺激によりポジティブ又はネガティブな形により影響されやすいことが分かった。さらに、該転写物は、すでに一般的に検出可能なレベルで生成されているので、これらのレベルの小さな変化は、例えば、検出可能な一定のしきい値に到達する必要がないので容易に検出できる。
【０１１９】
本発明の好ましい方法では、本発明のプローブの組は、種々の異なる癌又は癌の病期に有用である。本発明で開示されるプローブのサブセットは、特定癌又は癌の病期の診断、同定又はモニタリングに使用することができる。
【０１２０】
前記プローブが診断、同定及びモニタリングに使用できる癌には、胃癌、肺癌、乳癌、前立腺癌、腸癌、皮膚癌、大腸癌及び卵巣癌などがある。とりわけ好ましくは、プローブは、乳癌の解析に用いられる。
【０１２１】
この診断法は、他の診断法の代替法として単独で使用してもよいし、このような方法に加えて使用してもよい。例えば、本発明の方法は具体的に腫瘍の同定及び／又は診断において、画像形成法、例えば、磁気共鳴映像法（ＭＲＩ）、超音波像形成、核イメージング又はＸ線イメージングを用いた診断の代替法又はそれに付加した診断方法として使用できる。
【０１２２】
本発明の方法は、原核生物又は真核生物からの細胞について実施できる。原核生物又は真核生物は、いずれの真核生物、例えば、ヒト、他の哺乳動物及び動物、鳥、昆虫、魚及び植物、及び原核生物、例えば、バクテリアでもよい。
【０１２３】
本発明の方法を実施できる好ましい非ヒト動物には、哺乳動物、特に霊長類、家畜、肉畜及び実験動物などがあるが、これらには限定されない。したがって、診断に好ましい動物には、マウス、ラット、モルモット、猫、犬、豚、牛、ヤギ、羊、馬などがある。特に好ましくは、ヒトの癌を、診断し、同定し、又はモニタリングする。
【０１２４】
上記したように、調査中の試料は、生物から得ることができるいずれかの都合のよい試料であってもよい。しかしながら、好ましくは上記のように、試料を疾病部位から離れた部位から得る。このような試料における細胞は、異常細胞ではなく、そのような細胞と接触したことはなく、そして疾病部位からのものではない。このような場合、試料は、これらの基準を満足しない細胞を含有していてもよいが、含有していない方が望ましい。し
かしながら、本発明のプローブは、これらの基準を満足する細胞において発現が変化している転写物に関係しているので、たとえ他のバックグランド細胞の存在下であっても、該プローブはこれらの細胞における転写レベルの変化を特異的に検出できるようになっている。
【０１２５】
このような試料からの細胞は、大多数の遺伝子の遺伝子発現において顕著で有用な変動を示すことが分かった。したがって、同じプローブ（又はいくつかのプローブ）は、そのプローブに結合している転写物の特定のレベル、又は他のプローブに対する当該プローブへの結合の程度という相互関係により、２つ又はそれ以上の癌又は癌の病期に関する測定に有用であることが分かる。その結果として、相対的に少数のプローブを、複数の癌のスクリーニングに使用することができる。このことは、プローブの選択に関して重要であるだけでなく、複数の診断に一組のプローブを使用することが可能となる。
【０１２６】
したがって、本発明によれば、２つ又はそれ以上の癌又は癌の病期を診断、同定又はモニタリングするためのプローブ組のであって、前記プローブの少なくとも一つは、前記癌又は癌の病期の少なくとも２つを診断し、同定し、又はモニタリングするのに好適であるプローブの組、ならびにそれを用いたキット及び方法が提供される。好ましくは、少なくとも５プローブ、例えば、５〜１５プローブが少なくとも２つの診断に使用される。
【０１２７】
したがって、本発明のさらなる好ましい態様によれば、生物における２つ又はそれ以上の癌又は癌の病期の診断、同定又はモニタリングのための上記した診断又は同定又はモニタリングの方法であって、前記診断方法の工程ｃ）で生成した前記試験パターンを工程ｄ）で、上記した方法で調製した少なくとも２つの標準診断パターンと比較し、各標準診断パターンが、異なる癌又は癌の病期について生成されたパターンである方法が提供される。
【０１２８】
好ましい態様によれば、評価方法は、試験試料からの遺伝子転写パターンの作成及びこれと標準パターンとの比較に関係するが、一定マーカーの発現の増強又は低下も、また発現産物の調査及びこれらの産物のレベルの調査により調べることもできる。したがって、発現産物に関係する標準パターンを生成してもよい。
【０１２９】
このような方法では、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドが結合する遺伝子によりコードされている一組のポリペプチドの発現レベルを解析される。
【０１３０】
種々の診断方法を使用して、ポリペプチド（又はその断片）の存在量を評価できる。ポリペプチドの存在又は濃度は、例えば、固定化されていてもよい該ポリペプチドに対する結合パートナー（例えば、抗体）を使用することにより調べて、該ポリペプチドを試料から分離した後、そのポリペプチドの量を求めることができる。
【０１３１】
ポリペプチドの「断片」とは、前記ポリペプチドに由来するものであることが認識できて、特定の結合パートナーが結合することができる前記ポリペプチドのドメイン又は領域、例えば、抗原性断片を意味する。好ましくは、このような断片は、前記ポリペプチドの重要な部分を含み、正常な合成後処理の産物に相当する。
【０１３２】
したがって、本発明のさらなる態様によれば、生物における癌又は癌の病期に特徴的な標準遺伝子転写パターンの作成方法であって、少なくとも
ａ）癌又は癌の病期である一種以上の生物の試料から標的ポリペプチドを放出する工程と；
ｂ）前記標的ポリペプチドを、一つ以上の結合パートナーであって、各結合パートナーが、一次オリゴヌクレオチド（又は誘導配列）が結合する遺伝子によりコードされてい
るマーカーポリペプチド（又はその断片）に特異的である結合パートナーと接触させて、前記結合パートナーを前記標的ポリペプチドに結合させる工程であって、前記マーカーポリペプチドは、調査中の生物及びその試料に対応する生物及び試料中の該癌に特異的である工程と；
ｃ）前記結合パートナーに結合している前記標的ポリペプチドを評価して、前記癌又は癌の病期を有する前記試料において前記マーカーポリペプチドを発現する遺伝子の遺伝子発現のレベルを反映した特徴的なパターンを作成する工程と；
を含む方法が提供される。
【０１３３】
本明細書で使用される用語「標的ポリペプチド」とは、検出される試料に存在するポリペプチドを意味し、「マーカーポリペプチド」とは、一次オリゴヌクレオチド又は誘導オリゴヌクレオチドが結合する遺伝子、すなわち、遺伝子ファミリー内の遺伝子によりコードされているポリペプチドである。標的及びマーカーポリペプチドは、同一であるか、又は少なくとも同一性の高い領域、例えば、エピトープ領域を有しており、結合パートナーの認識及び結合が可能である。
【０１３４】
標的ポリペプチドの「放出」とは、試料に適当な処理をおこなって、例えば、それらが存在する細胞の溶解により、結合パートナーの結合にアクセスできる形態のポリペプチドを得ることを意味する。標的ポリペプチドは細胞から周囲の組織又は液中に放出され得るが、この組織又は液、例えば、尿又は血液を分析できるため、この場合に使用する試料は、必ずしも細胞を含まない。しかしながら、上記した試料を使用するのが好ましい。「結合パートナー」は、上記アフィニティ結合の対を一緒に作る別個の存在物を含み、この結合の対における一つのパートナーは、標的又はマーカーポリペプチドであり、他のパートナーは、そのポリペプチド、例えば、抗体に特異的に結合する。
【０１３５】
形成する結合の対の量を検出するのに、種々の配置が可能である。その最も単純な形態では、サンドイッチ型アッセイ、例えば、免疫アッセイ、例えば、ＥＬＩＳＡを使用できる。この方法では、該ポリペプチドに特異的であって、標識（本明細書に記載のもの）を担持している抗体を、結合の対（例えば、第一抗体：ポリペプチドの対）に結合させ、標識の量を検出できる。
【０１３６】
本明細書に記載の他の方法は、遺伝子転写物及び関連核酸分子ではなく発現のタンパク質産物の分析のために同様に変更できる。
【０１３７】
したがって、本発明のさらなる態様によれば、試験遺伝子転写パターンの作成方法であって、少なくとも
ａ）前記試験生物の試料から標的ポリペプチドを放出する工程と；
ｂ）前記標的ポリペプチドを、一つ以上の結合パートナーであって、各結合パートナーが、一次オリゴヌクレオチド（又は誘導配列）が結合する遺伝子によりコードされているマーカーポリペプチド（又はその断片）に特異的である結合パートナーと接触させて、前記結合パートナーを前記標的ポリペプチドに結合させる工程であって、前記マーカーポリペプチドは、調査中の生物及びその試料に対応する生物及びその試料中の該癌に特異的である工程と；
ｃ）前記試験試料において前記結合パートナーに結合している前記標的ポリペプチドを評価し、前記マーカーポリペプチドを発現する遺伝子の遺伝子発現のレベルを反映した特徴的なパターンを作成する工程と；
を含む方法が提供される。
【０１３８】
本発明のさらなる態様によれば、生物における癌又は癌の病期の診断又は同定又はモニタリングの方法であって、
ａ）前記生物の試料から標的ポリペプチドを放出する工程と；
ｂ）前記標的ポリペプチドを、一つ以上の結合パートナーであって、各結合パートナーが、一次オリゴヌクレオチド（又は誘導配列）が結合する遺伝子によりコードされているマーカーポリペプチド（又はその断片）に特異的である結合パートナーと接触させて、該結合パートナーを前記標的ポリペプチドに結合させる工程であって、前記マーカーポリペプチドは、調査中の生物及びその試料に対応する生物及びその試料中の該癌に特異的である工程と；
ｃ）前記試料において前記結合パートナーに結合している前記標的ポリペプチドを評価し、前記マーカーポリペプチドを発現する遺伝子の遺伝子発現のレベルを反映した特徴的なパターンを作成する工程と；
ｄ）前記パターンを、調査中の生物及び試料に対応する生物からの試料を用いて上記した方法により作成した標準診断パターンと比較して、調査中の前記生物における前記癌又は癌の病期の存在を示す相関度を求める工程と；
を含む方法が提供される。
【０１３９】
標準パターン及び試験パターンの作成方法及び診断法では、有用なオリゴヌクレオチドプローブを使用して遺伝子発現データを得る。場合によっては、特定の方法、例えば、特定の癌を診断するのに有用なこれらのプローブを、利用できるプローブ、例えば、表２及び／又は表３に記載のオリゴヌクレオチド、表２及び／又は表３に記載の誘導オリゴヌクレオチド、それらの相補配列及び機能的に等価なオリゴヌクレオチド並びに必要に応じて、表４に記載のオリゴヌクレオチド、それらの誘導オリゴヌクレオチド、相補配列及び機能的に等価なオリゴヌクレオチドから選択することが必要である。前記誘導オリゴヌクレオチドには、これらの表に記載された配列に相当する遺伝子、例えば、表２、表５、表６（受託番号参照）に記載の遺伝子、又はそれらの相補的配列から誘導したオリゴヌクレオチドなどがある。以下の方法は、このような有用なプローブを同定すること、又はより詳細には本明細書に記載のプローブから好適なプローブのサブセットを選択するのに都合がよい。
【０１４０】
特定の癌又は癌の病期を分析するためのプローブは、当該技術分野において公知の多数の方法により同定できる。これらの方法には、例えば、差分的発現又はライブラリーサブトラクションなどがある（例えば、ＷＯ９８／４９３４２参照）。ＰＣＴ／ＧＢ０３／００５１０２に記載され、また以下でも記載するように、ほとんどの転写物に情報量が多いことに鑑み、出発点として、本明細書に記載の配列ファミリーに相当するｍＲＮＡ又はｃＤＮＡ種のランダムなサブセットを単純に分析し、そのサブセットから最も有用なプローブを採取することもできる。以下の方法では、異なる試料から得たｍＲＮＡ（又は関連分子）が結合した、固定化オリゴヌクレオチドプローブ（例えば、本発明のプローブ）を使用して、どのプローブが特定の種類の癌、例えば、疾病試料を同定するのに最も有用かを確認する。
【０１４１】
固定化プローブは、種々の関連性のない生物又は関連した生物から誘導することができる。ここで必要なことは、固定化プローブは、試験生物における相同的な対応物に特異的に結合するものでなければならないことだけである。また、プローブは、市販又は公開のデータベースから誘導し且つ固体担体に固定化することもできる。選択されたプローブは、本明細書に記載の遺伝子配列ファミリーにおける遺伝子の一つに必然的に相当するが、意図するプローブは、ファミリー群全体の中からランダムに選択することができる。
【０１４２】
固体担体に固定化されたプローブの長さは、標的配列に特定の結合を可能とするのに充分な長さでなければならない。固定化プローブは、ＤＮＡ、ＲＮＡ又はそれらの修飾産物又はＰＮＡ（ペプチド核酸）の形態でよい。好ましくは、固定化されたプローブは、試験生物において高度又は中程度発現の遺伝子であるそれらの相同的対応物に特異的に結合
しなければならない。使用されるプローブは、本明細書に記載のプローブであるのが都合がよい。
【０１４３】
生物試料における細胞の遺伝子発現パターンは、以下で説明するマイクロアレイ又はマクロアレイなどの従来技術を用いるか、又は本明細書に記載の方法を用いて作成できる。現在では、高密度オリゴアレイといった、生物試料において多数の遺伝子の発現レベルを同時にモニタリングするためのいくつかの技術が開発されている（Ｌｏｃｋｈａｒｔら、１９９６、Ｎａｔ．Ｂｉｏｔｅｃｈ．、１４、ｐ１６７５−１６８０）、ｃＤＮＡｍｉｃｒｏａｒｒａｙｓ（ｃＤＮＡマイクロアレイ）（Ｓｃｈｅｎａら、１９９５、Ｓｃｉｅｎｃｅ、２７０、ｐ４６７−４７０）、及びｃＤＮＡｍａｃｒｏａｒｒａｙｓ（ｃＤＮＡマクロアレイ）（ＭａｉｅｒＥら、１９９４、Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．、２２、ｐ３４２３−３４２４；Ｂｅｒｎａｒｄら、１９９６、Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．、２４、ｐ１４３５−１４４２）。
【０１４４】
高密度オリゴアレイ及びｃＤＮＡミクロアレイにおいて、数百及び数千もののプローブオリゴヌクレオチド又はｃＤＮＡが、スライドガラス又はナイロン膜上に斑点状に滴下するか、又はバイオチップ上に合成される。試験試料及び基準試料から単離したｍＲＮＡを、赤色又は緑色の蛍光染料を用いて逆転写により標識し、混合し、ミクロアレイにハイブリダイズさせる。洗浄後、結合した蛍光染料を、レーザーにより検出し、２つの像（各染料について一つ）を得る。２つの像についての得られた赤色スポット及び緑色スポットの比により、試験試料及び基準試料における遺伝子の発現レベルの変化についての情報を得る。別法として、単一のチャンネル又は複数のチャンネルミクロアレイによる検討を行ってもよい。
【０１４５】
ｃＤＮＡマクロアレイでは、ナイロン膜などの固体担体上に、異なるｃＤＮＡを斑点状に滴下する。この場合、ｃＤＮＡの量は、各スポットにハイブリダイズできる試験ｍＲＮＡの量よりも多くする。試験試料から単離したｍＲＮＡを逆転写により放射性標識し、固定化プローブｃＤＮＡにハイブリダイズさせる。洗浄後、固定化プローブｃＤＮＡに特異的にハイブリダイズしている標識と関係したシグナルを検出し、定量化する。マクロアレイで得られたデータは、試験試料に存在する転写物の相対的なレベルの情報を含む。マクロアレイが好適であるのは、限定された数の遺伝子の発現を監視することだけであるのに対して、ミクロアレイは数千の遺伝子の発現を同時にモニタリングするのに使用することができ、したがって、大規模に遺伝子発現を検討するのに好ましい。
【０１４６】
本明細書に記載のプローブ同定法を説明するのに、遺伝子発現データセットを作成するためのマクロアレイ技術を使用している。このために、ｍＲＮＡを意図する試料から単離し、標識した標的分子、例えば、上記したｍＲＮＡ又はｃＤＮＡを調製する。標識された標的分子を、次に固体担体に固定化したプローブにハイブリダイズさせる。これには上記の種々の固体担体を使用できる。ハイブリダイゼーション後、未結合の標的分子を除去し、固定化されたプローブにハイブリダイズしている標的分子からのシグナルを定量化する。放射性標識を実施する場合、ＰｈｏｓｐｈｏＩｍａｇｅｒを使用して、生のデータセットを得るのに使用できるイメージファイルを作成できる。標的分子を標識するのに選択される標識の特性に応じて、他の機器を使用することもできる。例えば、標識に蛍光を使用するとき、ＦｌｕｏｒｏＩｍａｇｅｒを使用してハイブリダイズされた標的分子からイメージファイルを作成することができる。
【０１４７】
各スポットにおけるシグナルの平均強度、中央強度又は量に相当する生データは、市販の画像解析用ソフトウエアを使用してイメージファイルから得ることができる。しかしながら、得られたデータは、バックグランドシグナルについて補正し、正規化してから解析する必要がある。これは、いくつかの因子が、ハイブリダイゼーションシグナルの質及
び量に影響することがあるからである。例えば、単離されたｍＲＮＡの質及び量の試料ごとのバラツキ、各反応の間における標的分子の標識効率の微小変動、ならびに異なるマクロアレイ間での非特異的結合の量のバラツキは、すべて得られるデータセットにおけるノイズの一因であり、解析前に補正する必要がある。
【０１４８】
バックグランドは、いくつかの方法で補正できる。スポット内の最低ピクセル強度をバックグランドサブトラクションに使用することもできるし、あるいはスポット輪郭付近のピクセルのラインの平均値又は中央値をこの目的に使用できる。また、ネガティブコントロールからのシグナルに基づくバックグランド強度を表す面積を規定し、この面積の平均強度をバックグランドサブトラクションに使用してもよい。
【０１４９】
次にバックグランド補正データを変換して、データ構造の分散を安定にし、プローブ強度の差について正規化することができる。いくつかの変換法が文献には記載されており、Ｃｕｉ、ＫｅｒｒａｎｄＣｈｕｒｃｈｉｌｌｈｔｔｐ：／／ｗｗｗ．ｊａｘ．ｏｒｇ／ｒｅｓｅａｒｃｈ／ｃｈｕｒｃｈｉｌｌ／ｒｅｓｅａｒｃｈ／ｅｘｐｒｅｓｓｉｏｎ／Ｃｕｉ−Ｔｒａｎｓｆｏｒｍ．ｐｄｆに概要が記載されている。各スポットの強度を、マクロアレイにおけるすべてのスポット又はマクロアレイにおける一群のスポットの全体強度、平均強度又は中央強度で割ることにより正規化して、マクロアレイにおける固定化プローブにハイブリダイズしているシグナルの相対強度を得ることができる。遺伝子発現データを正規化するためのいくつかの方法が報告されている（Ｒｉｃｈｍｏｎｄ及びＳｏｍｅｒｖｉｌｌｅ、２０００、ＣｕｒｒｅｎｔＯｐｉｎ．ＰｌａｎｔＢｉｏｌ．、３、ｐ１０８−１１６；Ｆｉｎｋｅｌｓｔｅｉｎら．、２００１、“Ｍｅｔｈｏｄｓ
ｏｆＭｉｃｒｏａｒｒａｙＤａｔａＡｎａｌｙｓｉｓ（マイクロアレイデータ解析法）、ＣＡＭＤＡからの論文、Ｌｉｎ＆Ｊｏｈｎｓｏm編、ＫｌｕｗｅｒＡｃａｄ
ｅｍｉｃ、ｐ５７−６８；Ｙａｎｇら、２００１”、“ＯｐｔｉｃａｌＴｅｃｈｎｏｌｏｇｉｅｓａｎｄＩｎｆｏｒｍａｔｉｃｓ（光技術と情報学）”、Ｂｉｔｔｎｅｒ、Ｃｈｅｎ、Ｄｏｒｓｅｌ＆Ｄｏｕｇｈｅｒｔｙ編、ＰｒｏｃｅｅｄｉｎｇｓｏｆＳＰＩＥ、４２６６、Ｐ１４１−１５２；Ｄｕｄｏｉｔら、２０００、Ｊ．ＡＭ．Ｓｔａｔ．Ａｓｓ．、９７、ｐ７７−８７；Ａｌｔｅｒら２０００、ｓｕｐｒａ；Ｎｅｗｔｏｎら．、２００１、Ｊ．Ｃｏｍｐ．Ｂｉｏｌ．、８、ｐ３７−５２）。一般的に、倍率又はスケーリング関数をまず計算して強度効果を補正した後、強度の正規化に使用する。正規化の改善に外部コントロールの使用も示唆された。
【０１５０】
大規模遺伝子発現解析に伴うもう一つの大きな難題は、異なる時間に実施される実験から採取したデータの標準化である。同一実験で得られた試料についての遺伝子発現データは、バックグラウンド補正及び正規化後に効率的に比較できることを見いだした。しかしながら、異なる時間に実施された実験で得られた試料からのデータには、解析の前にさらなる標準化が必要である。これは、異なる実験間で実験パラメータにおける微妙な差、例えば、異なる時間に抽出したｍＲＮＡの品質及び量の差、標的分子の標識に使用される時間、ハイブリダイゼーション時間又は露光時間の差が、測定値に影響するからである。また、調査中の転写物の配列の性質といった因子（それらのＧＣ含量）及びそれらの相対量により、これらが実験プロセスにおける微妙な変動によりどのように影響されるかが決まる。例えば、特定の転写物に対応する第一鎖ｃＤＮＡが第一鎖合成中にどのように効率的に転写され、かつ標識されるか、あるいはハイブリダイゼーション中に相当する標識標的分子がそれらの相補配列にどのように効率的に結合するかが決まる。また、プリントプロセスにおけるバッチ間の差も、作成された発現データにおけるバラツキについての主要な因子である。
【０１５１】
これらの影響に適切に相当し、修正できないと、実験シリーズ間の差、すなわち、異なる実験シリーズからの組み合わせたデータ内の差が、遺伝子発現データセットに含まれ
る意図する主要情報が悪いものとなる。したがって、必要に応じて、発現データは、データ解析前にバッチ調整しなければならない。
【０１５２】
いくつかの試料における多数の遺伝子の発現をモニタリングすると、多量のデータが得られ、複雑すぎて容易には解釈できない。いくつかの管理されていない、及び管理されている多変量データ解析法は、これらの多量のデータセットから有用な生物学的情報を抽出するのに有用であることがすでにわかっている。クラスター分析は、遺伝子発現解析に使用されるいままで最も一般的に使用された手法であり、同様の方法で調節される遺伝子を確認するのに行なわれたり、及び／又は遺伝子発現プロファイルを用いた新しい／未知腫瘍クラスを確認するのに実施されてきた（Ｅｉｓｅｎら、１９９８、ＰＮＡＳ、９５、Ｐ１４８６３−１４８６８、上記、Ａｌｉｚａｄｅｈら、２０００、Ｐｅｒｏｕら、２０００、Ｎａｔｕｒｅ、４０６、ｐ７４７−７５２；Ｒｏｓｓら、２０００、Ｎａｔｕｒｅ
Ｇｅｎｅｔｉｃｓ、２４（３）、ｐ２２７−２３５；Ｈｅｒｗｉｇら、１９９９、ＧｅｎｏｍｅＲｅｓ．、９、ｐ１０９３−１１０５；Ｔａｍａｙｏら、１９９９、Ｓｃｉｅｎｃｅ、ＰＮＡＳ、９６、ｐ２９０７−２９１２）。
【０１５３】
クラスタリング法では、遺伝子を、それらの発現プロファイルに基づいて、２つの基準を満足する機能的カテゴリー（クラスター）にグループ化する：“均質性”−同じクラスターにおける遺伝子は、発現において極めて類似性が高い；及び“分離”−異なるクラスターにおける遺伝子は、発現の類似性は互いに低い。
【０１５４】
遺伝子発現解析に使用されてきた種々のクラスタリング法として、例えば、階層クラスタリング（上記、Ｅｉｓｅｎら、１９９８；上記、Ａｌｉｚａｄｅｈら、２０００；上記、Ｐｅｒｏｕら、２０００；上記、Ｒｏｓｓら、２０００）、Ｋ手段クラスタリング（上記、Ｈｅｒｗｉｇら、１９９９；Ｔａｖａｚｏｉｅら、１９９９、ＮａｔｕｒｅＧｅｎｅｔｉｃｓ、２２（３）、ｐ．２８１−２８５）、遺伝子シェービング（Ｈａｓｔｉｅら、２０００、ＧｅｎｏｍｅＢｉｏｌｏｇｙ、１（２）、ｒｅｓｅａｒｃｈ０００３．１−０００３．２１）、ブロッククラスタリング（Ｔｉｂｓｈｉｒａｎｉら、１９９９、ＴｅｃｈｒｅｐｏｒｔＵｎｉｖＳｔａｎｆｏｒｄ．）、格子縞モデル（Ｌａｚｚｅｒｏｎｉ、２００２Ｓｔａｔ．Ｓｉｎｉｃａ、１２、ｐ６１−８６）及び自己組織化マップ（上記、Ｔａｍａｙｏら、１９９９）などがある。また、多変量統計解析の関連法、例えば、特異値分析（Ａｌｔｅｒら、２０００、ＰＮＡＳ、９７（１８）、ｐ１０１０１−１０１０６；上記、Ｒｏｓｓら、２０００）又は多次元スケーリングを用いたものは、調査中の対象物のディメンションを減らすのに効果的である。
【０１５５】
しかしながら、クラスター解析及び特異値分析などの方法は、純粋に調査のためであり、データに存在する内部構造の全体像が得られるだけである。これらは、調査中のクラスの性質に関する入手可能情報が解析に使用されない非管理法である。特定の試料がかけられた生物学的摂動（biological perturbation）の性質は、公知である。例えば、遺伝
子発現パターンが解析されている試料が疾病個体由来のものであるか、あるいは健康個体由来のものであるかが分かることがある。そうした場合に、判別解析は、試料を遺伝子発現データに基づく種々のグループに類別するのに使用できる。
【０１５６】
このような解析では、所定クラスのメンバーと非メンバーとの間を識別できるデータをトレーニングすることにより分級器（classifier）が構成される。次に、トレーニングされた分級器を使用して、未知の試料のクラスを予測できる。文献に記載されている判別法として、例えば、ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅｓ（Ｂｒｏｗｎら、２０００、ＰＮＡＳ、９７、ｐ２６２−２６７）、最隣接（ＮｅｒａｒｅｓｔＮｅｉｇｈｂｏｕｒ）（上記、Ｄｕｄｏｉｔら、２０００）、類別ツリー（Ｃｌａｓｓｉｆｉｃａｔｉｏｎｔｒｅｅ）、（上記、Ｄｕｄｏｉｔら、２０００）、ボーテッドクラスフィケ
ーション（ＶｏｔｅｄＣｌａｓｓｉｆｉｃａｔｉｏｎ）（上記、Ｄｕｄｏｉｔら、２０００）、重み付き遺伝子ボーティング（ＷｅｉｇｈｔｅｄＧｅｎｅＶｏｔｉｎｇ）（上記、Ｇｏｌｕｂら、１９９９）及びベイズ類別（ＢａｙｅｓｉａｎＣｌａｓｓｉｆｉｃａｔｉｏｎ）（Ｋｅｌｌｅｒら、２０００、ＴｅｃｒｅｐｏｒｔＵｎｉｖｏｆＷａｓｈｉｎｇｔｏｎ）などがある。ＰＬＳ（部分最小2乗（ＰａｒｔｉａｌＬｅ
ａｓｔＳｑｕａｒｅ））回帰分析を最初に使用して遺伝子発現データセットにおけるディメンションを減少させた後に、ロジスティック判別分析解析及び二次判別解析（ＬＤ及びＱＤＡ）を用いる類別がなされる手法も、最近報告されている（Ｎｇｕｙｅｎ＆Ｒｏｃｋｅ、２００２、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ、１８、ｐ３９−５０及び１２１６−１２２６）。
【０１５７】
遺伝子発現データが従来の判別法に及ぼす困難は、発現が解析する遺伝子の数が、解析している試料の数と比較して極めて多いことである。しかしながら、ほとんどの場合において、判別解析の問題に有用であるのは、これら遺伝子のほんの少しの部分に過ぎない。さらに、無関係の遺伝子からのノイズが有効な遺伝子からの情報をマスクし又はゆがめる恐れがある。マイクロアレイ研究に有用である遺伝子を確認及び選択するのに有効であるいくつかの方法が文献、例えば、ｔ統計量（Ｄｕｄｏｉｔら、２００２、Ｊ．ＡＭ．
Ｓｔａｔ．Ａｓｓ．、９７、ｐ７７−８７）、分散分析（Ｋｅｒｒら、２０００、ＰＮＡＳ、９８、ｐ８９６１ー８９６５）、近接解析（ＮｅｉｇｈｂｏｕｒｈｏｏｄＡｎａｌｙｓｉｓ）（上記、Ｇｏｌｕｂら、１９９９）、群間：群内平方和の比（ＲａｔｉｏｏｆＢｅｔｗｅｅｎＧｒｏｕｐｓｔｏＷｉｔｈｉｎＧｒｏｕｐｓＳｕｍｏｆＳｑｕａｒｅｓ）（上記、Ｄｕｄｏｉｔら、２００２）、ノンパラメトリックコアリング（ＮｏｎＰａｒａｍｅｔｒｉｃＳｃｏｒｉｎｇ）（Ｐａｒｋら、２００２、ＰａｃｉｆｉｃＳｙｍｐｏｓｉｕｍｏｎＢｉｏｃｏｍｐｕｔｉｎｇ、ｐ５２−６３）及び尤度選択（ＬｉｋｅｌｉｈｏｏｄＳｅｌｅｃｔｉｏｎ）（上記、Ｋｅｌｌｅｒら、２０００）において示唆された。
【０１５８】
本明細書に記載の方法において、正規化及び標準化された遺伝子発現データは、部分最小2乗回帰（ＰＬＳＲ）を用いることにより解析される。ＰＬＳＲは主に連続量データ
の回帰分析に使用される方法（補遺Ａ参照）であるけれども、バイナリーコードに基づくダミー応答マトリックス(dummy response matrix)を用いたモデル構築及び判別分析のた
めの方法としても利用できる。クラスの割り当ては、単純な二分識別、例えば、乳癌（クラス１）／健康（クラス２）に基づくもの、又は複数疾病診断、例えば、乳癌（クラス１）／卵巣癌（クラス２）／健康（クラス３）に基づく複数識別に基づくものである。類別用疾病リストは、他の癌又は癌の病期に対応する、入手可能な試料に応じて増加できる。
【０１５９】
類別法として適用されるＰＬＳＲは、ＰＬＳ−ＤＡ（ＤＡは、判別解析を意味する）と称される。ＰＬＳ−ＤＡは、Ｙマトリックスがｎ行（試料数に相当する）及びＫ列（クラス数に相当）を含むダミーマトリックスであるＰＬＳＲアルゴリズムの延長である。Ｙマトリックスは、１を第ｋ列に挿入し、−１を他のすべての列に挿入することにより構成される（Ｘの相当する第ｉ番目の対象がクラスｋに属する場合）。ＹをＸ上に回帰することにより、新しい試料の分類は、適合式？（ｘ）＝（Y₁（ｘ）、Y₂（ｘ）、．．．、Y_k（ｘ））の最大成分に相当するグループを選択することにより達成される。したがって、 −１／１応答マトリックスにおいて、０未満の予測値は、試料が−１としたクラスに属することを意味し、一方０を超える予測値は、試料が１としたクラスに属することを意味する。
【０１６０】
ＰＬＳＲ−ＤＡには、得られる結果を、２つの異なるプロットの形態、すなわち、スコアプロット及びローディングプロットの形態で容易に表すことができるという利点がある。スコアプロットは、主要な成分上への試料の投影を表し、類別モデルにおける試料の
分布及びそれらの互いの関係を示す。ローディングプロットは、データセットに存在する変数間の相関関係を示す。
【０１６１】
通常、ＰＬＡ−ＤＡを、共線データを取り扱えるので、類別問題のための出発点として使用し、ＰＬＳＲの特質をディメンション減少法として使用することが好ましい。この目的が満足されたら、さらなる情報を抽出するのに有効であることが判明した線形判別分析ＬＤＡなどの他の方法を使用することができる（Ｉｎｄａｈｌら、１９９９、Ｃｈｅｍ．ａｎｄＩｎｔｅｌｌ．Ｌａｂ．Ｓｙｓｔ．、４９、ｐ１９−３１）。この手法は、まずＰＬＳ−ＤＡを用いてデータを分解した後、スコアベクトル（最初の変数の代わりに）をＬＤＡへの入力として用いる。ＬＤＡについての詳細は、ＤｕｄａａｎｄＨａｒｔ（ＣｌａｓｓｉｆｉｃａｔｉｏｎａｎｄＳｃｅｎｅＡｎａｌｙｓｉｓ、１９７３、Ｗｈｉｌｅｙ、米国）に記載されている。
【０１６２】
モデル構築に続く工程は、モデルバリデーション（model validation）である。この工程は、多変量分析の最も重要な面に含まれると考えられ、構築された校正モデルの「良好性」を試験する。この作業において、クロスバリデーション（cross validation）法が、バリデーションに使用された。この方法において、モデルが残りのデータに基づいて完全クロスバリデーションを用いて構築される間に、各セグメントにおいて１つまたは数個の試料は除外されている。次に、除外された試料は、予測／類別に使用される。単純クロスバリデーションプロセスを数回反復（各クロスバリデーションについて異なる試料を保持する）して、いわゆる二重クロスバリデーション法をおこなう。この方法は、本明細書に記載の実施例のいくつかに示すような限定されたデータ量の場合にうまくいくことが分かった。また、クロスバリデーション工程は数回反復されるため、モデルバイアス及びオーバーフィッティングの危険が減少する。
【０１６３】
校正モデルがいったん構築されかつバリデーションされると、モデルにおける所望の情報を表す最も関係のある発現パターンを示す遺伝子を、本明細書に記載の変数選択についての従来技術に記載されている方法により選択できる。変数選択は、最終的なモデルの複雑さを減少させるのに役立ち、削ぎ落としたモデルが得られ、したがって、予測に使用できる信頼のおけるモデルが実現できる。さらに、診断目的の遺伝子の数が少ないほど、診断産物のコストが減少する。かようにして関連のある遺伝子に結合するであろう有用なプローブを同定できる。
【０１６４】
本発明者らは、校正モデルを構築した後、再サンプリング法に基づくジャックナイフ（Ｅｆｆｒｏｎ、１９８２、ＴｈｅＪａｃｋｎｉｆｅ，ｔｈｅＢｏｏｔｓｔｒａｐ
ａｎｄｏｔｈｅｒｒｅｓａｍｐｌｉｎｇｐｌａｎｓ（ジャックナイフ、ブートストラップ及び他の再サンプリングプラン）。ＳｏｃｉｅｔｙｆｏｒＩｎｄｕｓｔｒｉａｎａｎｄＡｐｐｌｉｅｄｍａｔｈｅｍａｔｉｃｓ、米国フィラデルフィア）のような統計的手法が、有意な変数（有用なプローブ）を選択又は確認するのに効率的に使用できることを見いだした。ＰＬＳ回帰係数Ｂの近似不確定分散は、下式により推定できる。
【０１６５】
【数１】

（式中、
Ｓ₂Ｂ＝Ｂの推定不確定分散；
Ｂ＝すべてのＮ対象を用いたクロスバリデーションランクＡでの回帰係数；
Ｂ_m＝クロスバリデーションセグメントｍにおいて除外された対象を除くすべての対象を
用いたランクＡでの回帰係数；及び
ｇ＝スケーリング係数（但し、ｇ＝１）。
【０１６６】
本発明者らの手法において、ジャックナイフを、クロスバリデーションとともに実施した。各変数について、クロスバリデーションサブモデルにおけるＢ係数Ｂ_iと総モデル
についてのＢ_totとの間の差を、まず算出する。次に、その差の平方和を、すべてのサブ
モデルにおいて算出して変数についてのＢ_i推定値の分散を得る。Ｂ_iの推定値の有意性を、ｔ検定を用いて計算する。したがって、得られた回帰係数を、２標準偏差に対応する不確定限界を用いて示すことができ、それから、有意な変数が検出される。
【０１６７】
この工程の実施又は使用については、市販のソフトウエア（ＴｈｅＵｎｓｃｒａｍｂｌｅｒ、ＣＡＭＯＡＳＡ、Ｎｏｒｗａｙ）で実施されているので、ここではさらに詳細には説明しない。また、ジャックナイフを用いた変数選択についての詳細も、Ｗｅｓｔａｄ＆Ｍａｒｔｅｎｓ（２０００、Ｊ．ＮｅａｒＩｎｆ．Ｓｐｅｃｔｒ．、８、ｐ１１７−１２４）において記載されている。
【０１６８】
以下の手法は、遺伝子発現データセットから有用なプローブを選択するのに使用できる：
ａ）一クロスバリデーションセグメント当たり一つのユニークな試料（データセットに存在する場合にはその反復を含む）を除外する；
ｂ）ＰＬＳＲ−ＤＡを用いて残りの試料について校正モデル（クロスバリデーションセグメント）を構築する；
ｃ）ジャックナイフ基準を用いて、工程ｂ）におけるモデルについて有意な遺伝子を選択する；
ｄ）上記３つの工程を、データセットにおけるすべてのユニークな試料を一度は除外する（工程ａ）で述べたように）まで繰り返す。例えば、データセットに７５のユニークな試料が存在する場合には、７５の異なる校正モデルを構築して、７５組の異なる有意なプローブ群を得る；
ｅ）工程ｄ）で作成した有意なプローブの組において発生頻度基準を用いて最も有意な変数を選択する。例えば、すべての組（１００％）において現れる一組のプローブは、工程ｄ）において作成した組の５０％にしか現れないプローブよりも有用である。
【０１６９】
疾病についての有用なプローブを選択したら、最終モデルを作成し、バリデーションする。モデルをバリデーションする最も一般的に使用されている２つの方法は、クロスバリデーション（ＣＶ；cross validation）及び試験セットバリデーションである。クロスバリデーション（交差確認）では、データを、ｋ個のサブセットに分ける。次に、モデルをｋ回トレーニングし、毎回、トレーニングからサブセットのうちの一つを除外する。この場合、除外されたサブセットのみを用いてエラー基準、ＲＭＳＥＰ（予測の二乗平均平方根誤差）を算出する。ｋが試料サイズと等しい場合、これを、「一除外（Ｌｅａｖｅ−Ｏｎｅ−Ｏｕｔ）」クロスバリデーションと称する。一つのバリデーションセグメント当たり一つ又は数個の試料を除外することは、種々の実験間の共分散がゼロである場合のみに有効である。したがって、「一回一試料」法は、複製物を含む場合には有効であるとは言えない。これは、複製物の一つのみを除外することは、本発明者らの解析において組織的バイアスが導入されるからである。この場合の正しい手法は、ＣＶセグメント間の共分散がゼロであるという前提を満足することから、一度に同じ試料のすべての複製物を除外することである。
【０１７０】
モデルバリデーションの第二の方法は、校正モデルをバリデーションするために別個の試験組を使用するものである。これには、別個の一組の実験を試験の組として実施する
必要がある。これは、実地試験データが得られることを前提として好ましい方法である。
【０１７１】
次に、最終モデルを、試験試料における癌又は癌の病期を同定するのに使用する。このために、選択された有用な遺伝子の発現データを試験試料から作成した後、最終モデルを使用して、試料が疾病クラス又は非疾病クラスであるかどうか、あるいは癌又は癌の病期を有するかどうかを判定する。
【０１７２】
好ましくは、類別を目的としたモデルを、上記の方法にしたがって同定したプローブに関するデータを用いて作成する。好ましくは、試料は、上記した試料である。好ましくは、工程（ａ）で固定化したオリゴヌクレオチドを、上記したファミリー内からランダムに選択する。別法として、例えば、異なるファミリーにおいて共通機能を有するタンパク質をコードしている遺伝子に相当するオリゴヌクレオチドの一つ以上を選択することにより、異なるファミリーを代表するように選択してもよい。とりわけ好ましくは、ファミリー（ｉ）及び（ｉｉ）の遺伝子に由来するオリゴヌクレオチドを含むように選択される。このようなオリゴヌクレオチドは、例えば、ｃＤＮＡ（用語「オリゴヌクレオチド」の範囲に含まれる）を用いる場合には、かなりの長さを有している。有用なプローブとしてこのようなｃＤＮＡ分子を同定することにより、ｃＤＮＡ分子の特異性を反映するが、製造及び取り扱いが容易であるもっと短いオリゴヌクレオチドの開発が実現できる。
【０１７３】
次に、上記モデルを使用して試験試料のデータを作成及び解析でき、したがって、本発明の診断法に使用できる。このような方法において、試験試料から作成したデータにより、遺伝子発現データセットが得られ、上記した方法で正規化及び標準化する。これを、上記した校正モデルにフィッティングして分類する。
【０１７４】
ここで説明する方法は、数種の癌について有用なプローブを同時に選択するのに使用することもできる。いずれの癌が校正又はトレーニングセットに含まれているかによって、有用なプローブを、前記癌用に選択できる。一つの癌について選択された有用なプローブは、意図する別の癌について選択された有用なプローブと同一でも、同一でなくてもよい。それは、選択された遺伝子が癌又は癌の病期中に互いの関係で発現するパターンであり、癌又は癌の病期に有効であるかどうかを決定するパターンである。
【０１７５】
換言すれば、有用な遺伝子を、これらの発現が調査中の癌又は癌の病期により生成される応答の影響下で他の選択された有用な遺伝子の発現とどのように相関しているかに基づいて選択する。
【０１７６】
有用なプローブを単離したり、いくつかの癌及び癌の病期を同時に同定するためには、遺伝子発現データセットは、被験者が調査中の特定の癌又は癌の病期を有するときにどのように遺伝子が発現されるかについての情報を含んでいなければならない。データセットは、一組の健康又は疾病の試料から作成する。ここで、特定の試料は、一つの癌又は癌の病期についての情報のみを含んでいてもよいし、あるいは複数の癌又は癌の病期についての情報を含んでいてもよい。したがって、本方法は、複数の癌又は癌の病期を表す試料を選択することにより、有用なプローブを単離するのに必要とされる試料の数を減少させる効率的な実験構成も教示している。
【０１７７】
上記したように、ほとんどの転写物が高情報量を有していることから、特定の癌又は癌の病期を診断、モニタリング又は同定するのに使用される有用なプローブを同定及び選択することが大幅に簡略化されるかも知れない。したがって、有用なプローブを同定するのに選択される遺伝子のプールを、大幅に減少できる。
【０１７８】
細胞内で発現されている数千の遺伝子の集団から有用なプローブを選択する従来技術
とは異なり、マイクロアレイのように、本明細書に記載の方法においては、有用なプローブを、上記遺伝子配列ファミリーに記載されたような限られた数の遺伝子から選択する。これらのファミリー内から、意図するプローブをランダムに選択できる。
【０１７９】
したがって、好ましい態様によれば、上記オリゴヌクレオチドの組を、上記の一次オリゴヌクレオチドからランダムに選択する。
【０１８０】
本明細書で使用される用語「ランダム」は、調査中の癌又は生物と関係する転写物により担持されている情報の程度に基づくバイアスしない、すなわち、有用なプローブとしてのそれらの有用可能性の方にバイアスしない選択を意味する。ランダムな選択は、例えば、高度又は中程度発現の転写物にバイアスした転写物（又は関連産物）のプールからおこなわれるが、好ましくはランダムな選択は配列を基にした基準によりバイアス又は選択しない転写物プールからおこなう。したがって、プールが大きいと、高度及び中程度発現の遺伝子に対応するオリゴヌクレオチドを含む。別法として、高度及び中程度に発現する遺伝子に対応するものについて富化してもよい。
【０１８１】
高度及び中程度に発現された遺伝子からのランダムな選択は、種々の方法でおこなうことができる。例えば、有意な数のｃＤＮＡクローンを、上記した遺伝子配列ファミリーに対応するクローンを含む、調査中の生物学的検体から構成されたｃＤＮＡライブラリーからランダムに採取することによりおこなうことができる。ｃＤＮＡライブラリーにおいて、多量又は中程度の量で存在する転写物に対応するｃＤＮＡクローンは、少ない量で存在するｃＤＮＡに対応する転写物よりも存在する頻度が大きいので、採取頻度がより大きい傾向がある。高度又は中程度発現の遺伝子に相当するものについて富化したｃＤＮＡのプールは、この手法により単離できる。
【０１８２】
本発明の方法で使用するために単離された集団のうちの多量又は中程度の量で発現する遺伝子を同定するために、意図する試料におけるそれらの転写物の相対レベルについての情報を、いくつかの従来技術を用いて作成できる。この目的には、ディファレンシャルディスプレイ又はＲＮＡフィンガープリントといった配列に依存しない方法と、マイクロアレイ又はマクロアレイなどの配列に基づく方法の両方を使用できる。別法として、高度及び中程度発現の遺伝子についての特異的プライマー配列を構成してもよく、定量的ＲＴ−ＰＣＲなどの方法を使用して高度及び中程度発現の遺伝子のレベルを決定することもできる。したがって、当業者は、生物学的試料においてｍＲＮＡの相対レベルを決定するのに当該技術分野において公知である種々の方法を使用することができる。
【０１８３】
とりわけ好ましくは、上記方法におけるｍＲＮＡの単離のための試料は、上記したようなものであり、好ましくは疾病部位からのものではなく、前記試料中の細胞は疾病細胞ではなく、また疾病細胞と接触したものでなく、例えば、非造血性癌、例えば、乳癌の検出に末梢血試料を使用する。
【０１８４】
以下、実施例を、添付図面を参照しながら説明するが、本発明はこれらの実施例には限定されない。
【実施例】
【０１８５】
実施例１：乳癌の診断
方法
血液試料
血液試料を、ノルウェーのＲｅｇｉｏｎａｌＥｔｈｉｃａｌＣｏｍｍｉｔｔｅｅの承認の下に同意したドナーから採取した。すべてのドナーは、分析の間は匿名で処理した。血液を、乳房撮影において初期異常の疑いのある女性から採取した。これらの女性に
は、乳癌の女性及び乳房撮影において異常のある女性（一次スクリーニング中に観察された異常が良性か又は悪性であるのかについてわかる前）の両方が含まれていた。すべての場合において、血液試料を、午前８時〜午後４時の間に採取した。各女性から、血液１０ｍｌを、熟練者により、抗凝固剤としてＥＤＴＡ（ＢｅｃｔｏｎＤｉｃｋｉｎｓｏｎ、米国Ｂａｌｔｉｍｏｒｅ社製）が入ったバキュテーナーチューブに採取するか、又はＰＡＸｇｅｎｅ（登録商標）チューブ（ＰｒｅＡｎａｌｙｔｉＸ、スイス国Ｈｏｍｂｒｅｃｈｔｉｋｏｎ社製）に直接採取した。ＥＤＴＡチューブに採取した血液を直ちに−８０℃で保存し、一方ＰＡＸチューブは一晩放置した後、使用するまで−８０℃で保存した。
【０１８６】
ｃＤＮＡアレイの調製
ｃＤＮＡの１４３５クローンを、５５０人の健康個人の全血から構成されたプラスミドライブラリー（米国Ｃｌｏｎｔｅｃｈ、米国ＰａｌｏＡｌｔｏ社製）からランダムに採取した。ランダムに採取したクローンのうちの約２０％は、重複するものであった。インサートの増幅のために、バクテリアクローンを、カルベニシリン５０μｇ／ｍｌとともにＬＢ１５０μｌを含有するマイクロタイタープレートで増殖させ、３７℃で攪拌しながら一晩インキュベーションした。細胞を溶解するために、各培養５μｌをＨ₂Ｏ５０μ
ｌで希釈し、９５℃で１２分間インキュベーションした。この混合物のうち２μｌを、１．５ｍＭＭｇＣｌ₂の存在下で５’−及び３‘−配列決定プライマー４０μｐｍｏｌを
用いてＰＣＲ反応させた。ＰＣＲ反応は、以下のサイクルプロトコルにより実施した：ＲｏｂｏＣｙｃｌｅｒＴｅｍｐｅｒａｔｕｒｅＣｙｃｌｅｒ（登録商標）（米国ＬａＪｏｌｌａにあるＳｔｒａｔａｇｅｎｅ社製）又はＤＮＡＥｎｇｉｎｅＤｙａｄＰｅｌｔｉｅｒＴｈｅｒｍａｌＣｙｃｌｅｒ（米国ＷａｌｔｈａｍにあるＭＪＲｅｓｅａｒｃｈ社製）において、９５℃で４分保持後、９４℃で１分間保持と６０℃で１分間保持と７２℃で３分間保持とからなる操作を２５サイクル反復した。増幅物を、ＮａＯＨ（０．２Ｍ、最終濃度）で３０分間変性し、ＨＹＢＯＮＤ−Ｎ＋膜（英国ＬｉｔｔｌｅＣｈａｌｆｏｎｔにあるＡｍｅｒｓｈａｍＰｈａｒｍａｃｉａＢｉｏｔｅｃｈ社製）上に、製造業者による使用説明書（英国ＣａｍｂｒｉｄｇｅにあるＢｉｏＲｏｂｏｔｉｃｓ社製）に基づいてＭｉｃｒｏＧｒｉｄＩＩワークステーションを用いてスポット状に滴下した。固定化ｃＤＮＡを、ＵＶクロスリンカー（米国ＳａｎＦｒａｎｃｉｓｃｏにあるＨｏｅｆｅｒＳｃｉｅｎｔｉｆｉｃＩｎｓｔｒｕｍｅｎｔｓ社製）を用いて固定した。
【０１８７】
プリントアレイは、１４３５のｃＤＮＡの他に、アッセイのバックグラウンドレベル、コンシステンシー及び感度を評価するための対照も含んでいた。これらを複数の位置にスポット状に滴下した。これらには、ＰＣＲミックス（インサートなし）などの対照；ＳｐｏｔＲｅｐｏｒｔ（商標登録）１０アレイバリデーションシステム（米国ＬａＪｏｌｌａにあるＳｔｒａｔｅｇｅｎｅ社製）の対照、ならびにβ−アクチン、γ−アクチン、ＧＡＰＤＨ、ＨＯＤ及びシクロフィリンといった、構成的に発現する遺伝子に相当するｃＤＮＡが含まれていた。
【０１８８】
ＲＮＡ抽出、プローブ合成及びハイブリダイゼーション
ＥＤＴＡチューブに採取した血液を３７℃で解凍し、ＰＡＸチューブに移し、総ＲＮＡを、業者の取扱説明書（スイス国ＨｏｍｂｒｅｃｈｔｉｋｏｎにあるＰｒｅＡｎａｌｙｔｉＸ社製）に準じて精製した。ＰＡＸチューブに直接採取した血液から、総ＲＮＡを、上記チューブにおいて新しいチューブに移すことなく抽出した。単離したＲＮＡから汚染ＤＮＡを、ＤＮＡフリーキット（米国ＡｕｓｔｉｎにあるＡｍｂｉｏｎ社製）を用いてＤＮＡａｓｅＩ処理により除去した。ＲＮＡの品質を、アガロースゲル電気泳動後の２８Ｓ及び１８Ｓリボソームバンドの一体性を肉眼で観察することにより決定した。良品質のＲＮＡが抽出された試料のみを、この試験に使用した。本発明者らの経験によれば、ＥＤＴ
Ａチューブに採取した血液はＲＮＡの品質がよくないことがしばしばあったが、一方ＰＡＸチューブに採取したものは、ＲＮＡの品質がほとんどいつも良好であった。抽出されたＲＮＡの濃度及び純度を、２６０ｎｍ及び２８０ｎｍでの吸光度を測定することにより求めた。総ＲＮＡから、業者の取扱説明書（ノルウェー国ＯｓｌｏにあるＤｙｎａｌＡＳ社製）に準じてＤｙｎａｂｅａｄｓを用いてｍＲＮＡを単離した。
【０１８９】
標識化及びハイブリダイゼーションについての実験を、１６バッチで実施した。各バッチで評価した試料数は、６〜９であった。プリントにおけるバッチ間のバラツキによるノイズを最小とするために、同じプリント実験中に製造されたアレイのみを、各バッチで使用した。試料を複数回（反復試験）評価したとき、同じｍＲＮＡプールからのアリコットをプローブ合成に使用した。プローブ合成では、総ＲＮＡ４〜５μｇに相当するｍＲＮＡのアリコットを、ｏｌｉｇｏｄＴ_25NV（０．５μｇ／μｌ）及びＳｐｏｔＲｅｐｏｒｔ（商標登録）１０アレイバリデーション・システムのｍＲＮＡスパイク（１０ｐｇ；Ｓｐｉｋｅ２、１ｐｇ）と混合し、７０℃に加熱した後、氷冷した。プローブを、反応混合物３５μｌで、５０μＣｉ［α³³Ｐ］ｄＡＴＰ、３．５μＭｄＡＴＰ、０．６ｍＭｄＣＴＰ、０．６ｍＭｄＴＴＰ、０．６ｍＭｄＧＴＰ、ＳｕｐｅｒＳｃｒｉｐｔ逆転写酵素（Ｉｎｖｉｔｒｏｇｅｎ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ社製）２００単位及び０．１ＭＤＴＴ標識の存在下、４２℃で１．５時間逆転写することにより調製した。合成後、酵素を、７０℃で１０分間失活し、ｍＲＮＡを、ＲｉｂｏＨ（米国ＭａｄｉｓｏｎにあるＰｒｏｍｅｇａ社製）４単位中、３７℃で２０分間反応混合物をインキュベーションすることにより除去した。取り込まれなかったヌクレオチドを、ＰｒｏｂｅＱｕａｎｔＧ５０Ｃｏｌｕｍｎｓ（米国ＰｉｓｃａｔａｗａｙにあるＡｍｅｒｓｈａｍＢｉｏｓｃｉｅｎｃｅｓ社製）を用いて除去した。
【０１９０】
膜を、４ｘＳＳＣ中、室温で２時間平衡化させ、プレハイブリダイゼーション溶液（４ｘＳＳＣ、０．１ＭＮａＨ₂ＰＯ₄、１ｍＭＥＤＴＡ、８％デキストラン硫酸、１０ｘデンハート液、１％ＳＤＳ）１０ｍｌ中、６５℃で一晩、予備ハイブリダイズさせた。新しく調製したプローブを、同じプレハイブリダイゼーション溶液５ｍｌに添加し、ハイブリダイゼーションを６５℃で一晩継続した。膜を、ストリンジェンシーを増加して６５(Ｃで洗浄した（２ｘＳＳＣ、０．１％ＳＤＳ；１ｘＳＳＣ、０．１％ＳＤＳ；０．１ｘ
ＳＳＣ、０．１％ＳＤＳで各々２ｘ３０分間）。
【０１９１】
ハイブリダイゼーションシグナルの定量化
ハイブリダイズさせた膜を、Ｐｈｏｓｐｈｏｓｃｒｅｅｎ（超解像）に２日間暴露し、ＰｈｏｓｐｈｏＩｍａｇｅｒ（Ｃｙｃｌｏｎｅ、米国ＭｅｒｉｄｅｎにあるＰａｃｋａｒｄ社製）を用いてイメージファイルを生成した。ハイブリダイゼーションシグナルの同定及び定量化、さらに局部バックグラウンド値のサブトラクションを、Ｐｈｏｒｅｔｉｘ
Ｓｏｆｔｗａｒｅ（英国ＮｏｎＬｉｎｅａｒＤｙｎａｍｉｃｓ社製）を用いて実施した。バックグラウンドサブトラクションでは、各スポット輪郭周囲のピクセルのラインの中央値を、各スポットで評価されたシグナルの強度から減算した。
【０１９２】
データ解析
１４３５のバックグラウンド減算発現データから、６７の遺伝子のシグナルを各膜から除去して分散度の高い発現遺伝子を排除した。これらには、各膜から最低シグナル及び最高シグナルの１．２５％を除去することが含まれていた。正規化のために、各スポットの値を、まず各アレイにおけるシグナルの平均で除した後、すべてのスポットについて立方根変換をおこなった。次に、正規化データを、一元配置分散分析（ＡＮＯＶＡ）を用いてバッチ調整した。
【０１９３】
その後、予備処理データを使用して、
ａ）一クロスバリデーションセグメント当たり一つのユニークな試料（選択された試料のすべての反復を含む）を除外するクロスバリデーションＰＬＳＲモデルを構築すること、ｂ）ジャックナイフ基準を用いて、工程ａ）におけるモデルについて有意の遺伝子の組を選択すること、
ｃ）工程ｂ）で選択した遺伝子を用いて、工程ａ）のようにしてクロスバリデーションＰＬＳＲ−ＤＡモデルを構築すること、
ｄ）再びジャックナイフ基準を用いて、工程ｃ）におけるモデルについて最も有意な遺伝子の組を選択すること、
により、有用なプローブを単離した。
【０１９４】
工程ｂ）で、１２５の遺伝子が得られた。
【０１９５】
工程ｄ）で、３５の有意な遺伝子が得られた。これらの遺伝子により、最終類別モデルを構築した。
【０１９６】
発生基準に基づいて選択された有用なプローブを使用して類別モデルを構築した。３５のプローブに基づく類別モデルについての結果を、図２に示す。図２において、これらの遺伝子の発現パターンにより、乳癌を患っているほとんどの女性と乳癌のない女性を異なるグループに類別できたことが分かる。この図において、ＰＣ１及びＰＣ２は、データに存在する系統的バラツキを最もよく定義しているデータから統計的に得た２つの主要な成分を示す。これにより、各試料、及び試料の標識化第一鎖ｃＤＮＡが結合された有用プローブの各々からのデータを、主要成分−スコアプロット上の試料投影である単一点として類別モデル上に表すことができる。
【０１９７】
図３は、３５の有意な遺伝子を用いた予測プロットを示す。図示された予測プロットにおいて、癌試料はｘ軸の＋１であり、非癌試料は−１である。ｙ軸は、属するクラスの予測を示す。予測の間、予測が正しい場合には、癌試料はゼロを超え、非癌試料はゼロ未満となるはずである。各例において、ほとんどすべての試料が正しく予測されている。クロスバリデーションでは、１０２個の実験試料を、各セグメントが一つのユニークな試料を表しており、かつその複製物（存在する場合）を含む６０のクロスバリデーションセグメントに分割した。
【０１９８】
ほとんどの乳癌細胞を正しく予測することができた。２２人の癌患者のうち１９人が正しく予測され、同様に３５人の正常患者のうち３４人が正しく予測された。試験された個人の全詳細及び予測の精度を、表１に示す。表２に、３５の有用な遺伝子の詳細を示す。これらの遺伝子は、公開データベースにおける遺伝子であり、配列の類似性及び推定生物学的機能が示されている。これらの配列を例の後に示す。
【０１９９】
図４は、３５個の遺伝子の発現レベルを示す。この図から、正常患者における発現に対して一部が過剰発現を生じ、他のものが発現不足を生じることが分かる。
【０２００】
実施例２：さらなる有用なプローブの同定と乳癌の診断における使用
方法
使用した同定と解析の方法は、試料を、ｃＤＮＡアレイを調製する代わりに、大規模遺伝子発現解析用の市販のプラットフォーム（Ａｇｉｌｅｎｔ２２Ｋチップ）を用いて解析した以外は、実質的に実施例１と同様であった。
【０２０１】
合計１２２個（対照７８及び乳癌４４）を含む、より多数の試料を解析した。データを、上記のＰＬＳＲを用いて解析した。意図する遺伝子を、１０倍クロスバリデーション法により選択した。すなわち、１２２個の試料からのデータを、各組が１２〜１３試料を
含むようにして１０組に分けた。９組について校正モデルを構築し、１組を除外した。有意の遺伝子を、組み込みモデル（built-in model ）についてジャックナイフ法により同定した。これらの工程は、１０組すべてについて、各組が少なくとも一度は除外されるようにして反復した。次に，有用遺伝子を、発生基準の頻度に基づいて同定した。すべての１０校正モデルにおいて、１０９の遺伝子が有用であることが分かった。
【０２０２】
結果
上記１０９個の遺伝子と３つのさらなる遺伝子を使用して、使用試料１２２個の類別を予測した。結果を、下表に示す。
【０２０３】
【表１】

【０２０４】
１０９個の有用な遺伝子を、３つのカテゴリー、すなわち、本明細書に記載のファミリー（ｉ）及び（ｉｉ）ならびに他の遺伝子に分けてもよい。表３に、相当する遺伝子がファミリー（ｉ）及び（ｉｉ）のカテゴリーに属する有用なプローブの詳細と、Ａｇｉｌｅｎｔによりそのプローブに割り当てられた番号を示す。同様に、表４に、相当遺伝子がファミリー（ｉ）及び（ｉｉ）に属するとは思われない有用プローブの詳細を示す。表５及び表６に、表３及び表４におけるプローブがそれぞれ配列類似性を示す遺伝子の詳細、それらの推定生物学的機能（既知の場合）、及びそれらの遺伝子についての受託番号を示す。
【０２０５】
補遺Ａ
部分最小2乗回帰（ＰＬＳＲ）
多変量回帰モデルを以下のように定義する：
Ｙ＝ＸＢ＋Ｆ
（式中、
Ｘは、Ｎ予測変数（遺伝子）のＮｘＰマトリックスであり；
Ｙ（ＮｘＪ）は、Ｊ予測変数である。この場合、Ｙは、ダミー変数を含むマトリックスを表し；
Ｂは、回帰係数のマトリックスであり；そして
Ｆは、残余のＮｘＪマトリックスである。
【０２０６】
ＰＬＳＲモデルの構造を以下のように表すことができる：
Ｘ＝ＴＰ^T＋Ｅ_A及び
Ｙ＝ＴＱ^T＋Ｆ_A（但し、
Ｔ（ＮｘＡ）は、ｘ変数の一次結合であるスコアベクトルのマトリックスであり；
Ｐ（ＰｘＡ）は、ｘローディングベクトルｐ_aを列としたマトリックスであり；
Ｑ（ＪｘＡ）は、ｙローディングベクトルｑ_aを列としたマトリックスであり；
Ｅ_a（ＮｘＰ）は、因数Ａに続くＸについてのマトリックスであり；そして
Ｆ_a（ＮｘＪ）は、因数Ａに続くＹについてのマトリックスである。
【０２０７】
ＰＬＳＲにおける基準は、［Ｘ、Ｙ］の説明済みの共分散を最大化することである。これは、Ｅ_a^TＦ_aＦ_a^TＥ_a（Ｅ_a及びＦ_a は、因数ａ又はＰＬＳ成分に続く、収縮Ｘ及びＹ）の第一固有ベクトルであるローディングウエイトベクトル（loading weights vector）ｗ_a+1により達成される。
【０２０８】
回帰係数は、以下のように表される：
Ｂ＝Ｗ（Ｐ^TＷ）^-1Ｑ^T
【０２０９】
最大階数、すなわち、最大成分数のＰＬＳＲモデルは、ＭＬＲ解に等しい。ＰＬＳＲについては、Ｍａｒｔｅｕｓ＆Ｎａｅｓ、１９８９、ＭｕｌｔｉｖａｒｉａｔｅＣａｌｉｂｒａｔｉｏｎ（多変量校正）、米国ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ社及び同上、Ｋｏｗａｌｓｋｉ＆Ｓｅａｓｈｏｌｔｚ、１９９１にさらに詳細に説明されている。
【数２】

【数３】

【数４】

【数５】

【数６】

【数７】

【数８】

【数９】

【数１０】

【数１１】

【数１２】

【数１３】

【数１４】

【数１５】

【表２】

【表３】

【表４】

【表５】

【表６】

【表７】

【表８】

【表９】

【表１０】

【表１１】

【表１２】

【表１３】

【表１４】

【表１５】

【表１６】

【表１７】

【表１８】

【表１９】

【表２０】

【図面の簡単な説明】
【０２１０】
【図１】図１は乳癌を患う個体における発現の変化に関与する種々の因子の可能性のある相互作用を示す。
【図２】図２は、PLSRを使用する、３５遺伝子に基づくスコアプロットを示す。１０２個の正常（良性を含む）試料及び乳癌試料を、３５の有用遺伝子のデータを用いたＰＬＳＲ−ＤＡにより作成された類別モデルへのプロジェクションである。ＰＣは主要成分を示し、Ｎ及びＣはそれぞれ正常試料及び乳癌試料を示す。
【図３】図３は、PLSRを使用する、３５遺伝子に基づく予測プロットを示す。３５個のｃＤＮＡデータを用いた、３つの主要成分に基づく予測プロットである。
【図４】図４は、乳癌試料及び非乳癌試料における３５遺伝子の平均発現レベルを示す。すなわち乳癌の予測に使用される３５個の遺伝子発現の平均レベルである。遺伝子は、配置（array）上の位置ID(position ID)で示されている。

【特許請求の範囲】
【請求項１】
生物における癌又は癌の病期に特徴的な標準遺伝子転写パターンを作成する方法であって、少なくとも：
ａ）必要に応じてｃＤＮＡに逆転写してもよい、その癌又は癌の病期を有する一種以上の生物の試料の細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、調査中の生物及び試料に相当する生物及び試料中の該癌又は癌の病期に特異的な一組のオリゴヌクレオチドプローブにハイブリダイズさせる工程であって、前記の一組が少なくとも１０個のオリゴヌクレオチドを含み、各オリゴヌクレオチドが、
タンパク質合成及び／又は安定性に関連しているタンパク質をコードしているファミリー（ｉ）遺伝子；又は
防御及び／又はクロマチンリモデリングの調節に関与しているタンパク質をコードしているファミリー（ｉｉ）遺伝子；からの遺伝子配列に相当するオリゴヌクレオチドから選択されたものであるか、
又はそのような配列に由来するものであるか、又は相補的配列を有するオリゴヌクレオチドか、又は機能的に等価のオリゴヌクレオチドである、工程と；
ｃ）該プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、該癌又は癌の病期についての該試料において、該オリゴヌクレオチドが結合する遺伝子の遺伝子発現のレベルを示す特徴的なパターンを作成する工程と；
を含む方法。
【請求項２】
試験遺伝子転写パターンの作成方法であって、少なくとも：
ａ）必要に応じてｃＤＮＡに逆転写してもよい、前記試験生物の試料の細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、調査中の生物及び試料に相当する生物及び試料中の該癌又は癌の病期に特異的な請求項１に記載の一組のオリゴヌクレオチドにハイブリダイズさせる工程と；
ｃ）前記プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、該試験試料において、該オリゴヌクレオチドが結合する遺伝子の遺伝子発現のレベルを示す前記パターンを作成する工程と；
を含む方法。
【請求項３】
生物における癌又は癌の病期を診断又は同定又はモニタリングする方法であって：
ａ）必要に応じてｃＤＮＡに逆転写してもよい、該生物の試料の細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、調査中の生物及び試料に相当する生物及び試料中の該癌又は癌の病期に特異的な請求項１に記載の一組のオリゴヌクレオチドにハイブリダイズさせる工程と；
ｃ）前記プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、前記試験試料において、該オリゴヌクレオチドが結合する遺伝子の遺伝子発現のレベルを示す特徴的なパターンを作成する工程と；
ｄ）前記パターンを、前記調査中の生物及び試料に相当する生物からの試料を用いて請求項１に記載の方法により作成した標準的な診断パターンと比較して、前記調査中の生物に該癌又は癌の病期の存在の有無を決定する工程と；
を含む方法。
【請求項４】
タンパク質合成及び／又は安定性に関与するタンパク質をコードしている前記ファミリー（ｉ）遺伝子が、
（ａ）リボソームタンパク質及びリボソーム活性化タンパク質、好ましくはリボソームタ
ンパク質Ｌ１−Ｌ５６、Ｌ７Ａ、Ｌ１０Ａ、Ｌ１３Ａ、Ｌ１８Ａ、Ｌ２３Ａ、Ｌ２７Ａ、Ｌ３５Ａ、Ｌ３６Ａ、Ｌ３７Ａ、Ｐ０、Ｐ１、Ｐ２、Ｓ２−Ｓ２９、Ｓ３１、Ｓ３３−Ｓ３６、Ｓ３Ａ、Ｓ１５Ａ、Ｓ１８Ａ、Ｓ１８Ｂ、Ｓ１８Ｃ、Ｓ２７Ａ、６３、１１５（及び偽遺伝子）、リボソームタンパク質キナーゼ、リボヌクレアーゼ、推定Ｓ１ＲＮＡ結合ドメインタンパク質、真核生物翻訳開始因子及びグアニンヌクレオチド結合タンパク質Ｇをコードしている遺伝子と；
（ｂ）翻訳阻害因子及び翻訳開始因子、好ましくは真核生物翻訳延長因子、ｔＲＮＡ合成酵素、ＲＮＡ結合タンパク質、ポリアデニル化要素結合タンパク質、チロシンフォスファターゼ、真核生物翻訳開始因子及びＲＮＡポリメラーゼI、III転写因子をコードして
いる遺伝子と；
（ｃ）転写又は翻訳の他のモジュレータ、好ましくはサイクリンＤ型結合タンパク質及びグアニンヌクレオチド結合タンパク質をコードしている遺伝子と；
からなる群より選択されたものである、請求項１〜３のいずれか一項に記載の方法。
【請求項５】
防御及び／又はクロマチンリモデリングファミリーの調節に関与するタンパク質をコードしている前記ファミリー（ｉｉ）遺伝子が、
（ａ）免疫応答関連タンパク質、好ましくはＴ細胞受容体及び会合成分、種々のサイトカイン、インターフェロン調節因子、オンコスタチンＭ、白血病阻害因子、ケモカインリガンド及び受容体ファミリー、補体成分、インターフェロン刺激因子、ＭＨＣクラスI又は
II（又は関連成分）、接着タンパク質、Ｂ細胞におけるカッパポリペプチド遺伝子エン
ハンサーの核因子、ミエリン塩基性タンパク質、カテプシン、トール様受容体、プロテオソームサブユニット、フェリチン、タンパク質キナーゼ又はフォスファターゼ、ならびにそれらの活性剤及び阻害剤、白血球免疫グロブリン様受容体、免疫グロブリン成分、デフェンシン、オキシトシン、Ｓ１００カルシウム結合タンパク質、レクチン及びその受容体及びスーパーファミリー、レプチン、ホスホリパーゼ及び成長因子をコードしている遺伝子と；
（ｂ）ＴＮＦ誘発タンパク質、好ましくはＴＮＦアルファ誘発タンパク質８、インテグリン、Ｂ細胞中のカッパ軽ポリペプチド遺伝子エンハンサーの阻害剤、ＴＮＦ会合因子２、５、Ｂ細胞中のカッパ軽ポリペプチド遺伝子エンハンサーの核因子、ＭＡＰキナーゼ、プロテインキナーゼＣ、ユビキタスキナーゼ、カドヘリン、カスパーゼ、サイクリンＤ１、スーパーオキシドジスムターゼ及びインターロイキンをコードしている遺伝子と；
（ｃ）低酸素症誘発タンパク質、好ましくはセストリン、Ｅ１Ａ結合タンパク質ｐ３００、エンドセリン、毛細血管拡張性運動失調症及びＲａｄ₃関連タンパク質、ヘキソキナー
ゼ２、ＴＥＫチロシンキナーゼ、ＤＮＡ断片化因子、カスパーゼ、プラスミノーゲン活性化因子、低酸素症誘発性因子１及びグルコースホスフェートイソメラーゼをコードしている遺伝子と；
（ｄ）酸化ストレスタンパク質、好ましくはスーパーオキシドジスムターゼ、グルタチオンシンテターゼ、カタラーゼ、ラクトペルオキシダーゼ、甲状腺ペルオキシダーゼ、ミエロペルオキシダーゼ、好酸球ペルオキシダーゼ、耐酸化性１、ペルオキシレドキシン、チトクロームＰ４５０、スカベンジャー受容体、パラオキソナーゼ、グルタチオンレダクターゼ、ＮＡＤ（Ｐ）Ｈデヒドロゲナーゼ、グルタチオンS−トランスフェラーゼ、カテニ
ン、グルタレドキシン、熱ショックタンパク質、マイトジェン活性化タンパク質キナーゼ、エノラーゼ、チオレドキシンレダクターゼ及びペルオキシレドキシンをコードしている遺伝子と；
（ｅ）クロマチンリモデリング、好ましくはヒストン代替タンパク質に関与しているタンパク質をコードしている遺伝子と、
からなる群より選択されたものである、請求項１〜４のいずれか１項に記載の方法。
【請求項６】
（ｉ）前記サイトカインは、インターロイキン又はそれらの受容体（好ましくはＩＬ−１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１５、１７、１８、
２０、２２又は２４）又は腫瘍壊死因子又はその受容体又はそのスーパーファミリー（好ましくはＴＮＦスーパーファミリーメンバー２、３、４、５、６、７、８、９、１１、１２、１３、１４又は１５）；及び／又は
（ｉｉ）前記接着タンパク質は、ＣＤ１Ａ、ＣＤ１Ｃ、ＣＤ１Ｄ、ＣＤ３Ｚ、６、８、１１、１４、１８、２４、２７、２８、２９、４０、４４、５０、５４、５９、７４、７９Ｂ、８０、８１、８３、８６、９６又はＩＣＡＭ；及び／又は
（ｉｉｉ）前記免疫グロブリン成分は、重鎖又はＦｃ断片、好ましくはＩｇＧ、ＩｇＥ又はＩｇＡ又はそれらのスーパーファミリーの重鎖又はＦｃ断片である；及び／又は
（ｉｖ）前記成長因子は、血管内皮細胞増殖因子又はエリスロポエチンである、
請求項５に記載の方法。
【請求項７】
ファミリー（ｉｉ）遺伝子によりコードされている前記免疫応答タンパク質は、接着タンパク質、インターロイキン、それらの受容体もしくはスーパーファミリー、ＴＮＦもしくはその受容体もしくはスーパーファミリー、免疫グロブリン成分又はエリスロポエチンである、請求項１〜６のいずれか１項に記載の方法。
【請求項８】
前記（ｉ）ファミリーをコードしている遺伝子は癌対正常患者の面でダウンレギュレーションされ、（ｉｉ）ファミリーの場合では、コードしている遺伝子はアップレギュレーションされる、請求項１〜７のいずれか１項に記載の方法。
【請求項９】
前記プローブは、前記癌又は癌の病期により全身疾患状態にある遺伝子に相当する、請求項１〜８のいずれか１項に記載の方法。
【請求項１０】
前記遺伝子は、構成的に中程度又は高度に発現するものである、請求項１〜９のいずれか１項に記載の方法。
【請求項１１】
前記の組が、ファミリー（ｉ）及びファミリー（ｉｉ）からのオリゴヌクレオチドの組み合わせを含む、請求項１〜９のいずれか１項に記載の方法。
【請求項１２】
前記の組のオリゴヌクレオチドには、ファミリー（ｉ）ａ、（ｉｉ）ａ及び（ｉｉ）ｅからのオリゴヌクレオチドが含まれている、請求項４〜１１のいずれか１項に記載の方法。
【請求項１３】
前記の組には、一種以上のリボソームタンパク質をコードしている遺伝子からのオリゴヌクレオチドならびに必要応じて一種以上のヒストン及び必要に応じてフェリチンを含んでもよい、請求項１〜１２のいずれか１項に記載の方法。
【請求項１４】
各オリゴヌクレオチドプローブは、表２又は表３に記載されているオリゴヌクレオチドから選択されたか、あるいは表２又は表３に記載の配列もしくはその相補的配列に由来するオリゴヌクレオチドである、請求項１〜１３のいずれか１項に記載の方法。
【請求項１５】
各オリゴヌクレオチドプローブは、表２に記載されているオリゴヌクレオチドから選択されたか、あるいは表２に記載の配列もしくはその相補的配列に由来するオリゴヌクレオチドである、請求項１４に記載の方法。
【請求項１６】
各オリゴヌクレオチドプローブは、表３に記載されているオリゴヌクレオチドから選択されたか、あるいは表３に記載の配列もしくはその相補的配列に由来のものである、請求項１４に記載の方法。
【請求項１７】
前記の組は、表４に記載のオリゴヌクレオチドから選択されたか、あるいは表４に記
載の配列もしくはその相補的配列に由来するものである、一種以上のオリゴヌクレオチドプローブをさらに含む、請求項１４〜１６のいずれか１項に記載の方法。
【請求項１８】
表２、表３又は表４の前記由来のオリゴヌクレオチドは、それぞれ表２、表５又は表６に記載の受託番号により示されている遺伝子の一部分又はその相補的配列である、請求項１４〜１７のいずれか１項に記載の方法。
【請求項１９】
前記の組が、１０〜５００個のプローブからなる、請求項１〜１８のいずれか１項に記載の方法。
【請求項２０】
前記の組のプローブが、一種以上の固体担体に固定化されている、請求項１〜１９のいずれか１項に記載の方法。
【請求項２１】
前記細胞は、疾病細胞でも、疾病細胞に接触したものでも、疾病部位由来のものでもない、請求項１〜２０のいずれか１項に記載の方法。
【請求項２２】
前記試料は、疾病部位から離れた部位から得られたものである、請求項１〜２１のいずれか１項に記載の方法。
【請求項２３】
前記試料は、組織、体液又は体内老廃物で表される、請求項１〜２２のいずれか１項に記載の方法。
【請求項２４】
前記試料は、末梢血である、請求項２３に記載の方法。
【請求項２５】
前記癌は、胃癌、肺癌、乳癌、前立腺癌、腸癌、皮膚癌、結腸癌又は卵巣癌、好ましくは乳癌である、請求項１〜２４のいずれか１項に記載の方法。
【請求項２６】
前記生物が、哺乳動物、好ましくはヒトである、請求項１〜２５のいずれか１項に記載の方法。
【請求項２７】
前記の組における前記プローブの少なくとも一つが、前記癌又は癌の病期の少なくとも２つの診断、同定又はモニタリングに好適である、請求項１〜２６のいずれか１項に記載の方法。
【請求項２８】
生物における２種以上の癌又は癌の病期の診断、同定又はモニタリングのために、前記診断方法の工程ｃ）で作成した試験パターンを、工程ｄ）で、請求項１又は４〜２７のいずれか１項に記載したようにして作成された少なくとも２つの標準診断パターンと比較するが、各標準診断パターンは異種の癌又は癌の病期について作成されたものであることを特徴とする、請求項３〜２７のいずれか１項に記載の診断又は同定又はモニタリングの方法。
【請求項２９】
請求項１〜２８のいずれか1項に記載の一組のオリゴヌクレオチドプローブ。
【請求項３０】
一種以上の固体担体上に固定化された、請求項２９に記載の一組のオリゴヌクレオチドプローブを含む、請求項１〜２８のいずれか１項に記載の方法を実施するためのキット。
【請求項３１】
前記方法をどのように実施するかを詳述した添付文書をさらに含む、請求項３０に記載のキット。
【請求項３２】
前記オリゴヌクレオチドプローブが結合する遺伝子の遺伝子発現のレベルを反映した細胞の遺伝子発現パターンを決定するために、請求項２９〜３１のいずれか１項に記載の一組のオリゴヌクレオチドプローブ又はキットの使用であって、少なくとも
ａ）必要に応じてｃＤＮＡに逆転写してもよい、前記細胞からｍＲＮＡを単離する工程と；
ｂ）工程（ａ）のｍＲＮＡ又はｃＤＮＡを、請求項２９〜３１のいずれか１項に記載の一組のオリゴヌクレオチドプローブ又はキットにハイブリダイズさせる工程と；
ｃ）該プローブの各々にハイブリダイズしているｍＲＮＡ又はｃＤＮＡの量を評価して、前記パターンを作成する工程と；
を含む使用。
【請求項３３】
生物における癌又は癌の病期に特徴的な標準遺伝子転写パターンの作成方法であって、少なくとも
ａ）癌又は癌の病期を有する一種以上の生物の試料から標的ポリペプチドを放出する工程と；
ｂ）該標的ポリペプチドを、一つ以上の結合パートナーであって、各結合パートナーが請求項１〜２７のいずれか１項に記載のオリゴヌクレオチドが結合する遺伝子によりコードされているマーカーポリペプチド（又はその断片）に特異的である結合パートナーと接触させて、該結合パートナーを該標的ポリペプチドに結合させる工程であって、該マーカーポリペプチドは、調査中の生物及びその試料に対応する生物及びその試料中の該癌に特異的である工程と；
ｃ）該結合パートナーに結合している該標的ポリペプチドを評価して、該癌又は癌の病期を有する該試料において前記マーカーポリペプチドを発現する遺伝子の遺伝子発現のレベルを反映した特徴的なパターンを作成する工程と；
を含む方法。
【請求項３４】
試験遺伝子転写パターンの作成方法であって、少なくとも
ａ）前記試験生物の試料から標的ポリペプチドを放出する工程と；
ｂ）該標的ポリペプチドを、一つ以上の結合パートナーであって、各結合パートナーが請求項１〜２７のいずれか１項に記載のオリゴヌクレオチドが結合する遺伝子によりコードされているマーカーポリペプチド（又はその断片）に特異的である結合パートナーと接触させて、該結合パートナーを該標的ポリペプチドに結合させる工程であって、該マーカーポリペプチドは、調査中の生物及びその試料に対応する生物及びその試料中の該癌に特異的である工程と；
ｃ）該結合パートナーに結合している該標的ポリペプチドを評価して、該試料において該マーカーポリペプチドを発現する遺伝子の遺伝子発現のレベルを反映した特徴的なパターンを作成する工程と；
を含む方法。
【請求項３５】
生物における癌又は癌の病期の診断又は同定又はモニタリング方法であって、
ａ）該生物の試料から標的ポリペプチドを放出する工程と；
ｂ）該標的ポリペプチドを、一つ以上の結合パートナーであって、各結合パートナーが請求項１〜２７のいずれか１項に記載のオリゴヌクレオチドが結合する遺伝子によりコードされているマーカーポリペプチド（又はその断片）に特異的である結合パートナーと接触させて、該結合パートナーを該標的ポリペプチドに結合させる工程であって、該マーカーポリペプチドは、調査中の生物及びその試料に対応する生物及びその試料中の該癌に特異的である工程と；
ｃ）該結合パートナーに結合している該標的ポリペプチドを評価して、該試料において該マーカーポリペプチドを発現する遺伝子の遺伝子発現のレベルを反映した特徴的なパターンを作成する工程と；
ｄ）該パターンを、調査中の生物及び試料に対応する生物からの試料を用いて請求項３３の方法により作成した標準診断パターンと比較して、調査中の該生物における該癌又は癌の病期の存在を示す相関度を求める工程と；
を含む方法。

【図１】

【図２】

【図３】

【図４】

【公表番号】特表２００８−５０１３３２（Ｐ２００８−５０１３３２Ａ）
【公表日】平成２０年１月２４日（２００８．１．２４）
【国際特許分類】

【出願番号】特願２００７−５１４１３０（Ｐ２００７−５１４１３０）
【出願日】平成１７年６月２日（２００５．６．２）
【国際出願番号】ＰＣＴ／ＧＢ２００５／００２１８０
【国際公開番号】ＷＯ２００５／１１８８５１
【国際公開日】平成１７年１２月１５日（２００５．１２．１５）
【出願人】（５０６４０２５６２）

【Ｆターム（参考）】

[ Back to top ]

癌診断のためのオリゴヌクレオチド

メニュー

スポンサーリンク

次の公報 »

« 前の公報

癌診断のためのオリゴヌクレオチド

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク