説明

解析プログラム、プロテインチップ、プロテインチップの製造方法、および、抗体カクテル

【課題】 プロテオミクス解析を、効率的に進めることができる。
【解決手段】 各種病態を示す患者や疾患モデル動物由来組織、細胞および培養細胞を用いてプロテオーム解析方法によって得られた、電気泳動画像や各種異なる特徴をもつ質量分析器による質量分析シグナルパターンを少なくとも含む、生データ、当該生データに基づいて同定したタンパク質ID、および、定量的データが、ローカルDBやプロテオミクスDBに格納される。プロテオミクス解析システムは、プロテオミクスDBに格納されたデータを同一言語に変換し、融合させ、ネットワークを介してアクセス可能な公開された他のDBを検索して、特異的タンパク質群、および特異的細胞内シグナルネットワークを抽出する。これらの得られた結果から、機能を予測し、独自のプロテインチップによる検証を行うことによって、病態を解析するとともに最も確実な治療や創薬への情報を得る。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、病態プロテオミクスによる様々な疾患対象の生物学的な個性、各時点に於ける病態・進行状況等をタンパク質レベルで詳細且つ正確に解析することにより、疾患発症メカニズムや各患者に最も適した合理的な治療薬や予防法を確立することに最適な解析プログラムに関する。特に、この情報処理システムは、医薬、臨床検査、創薬などの分野で利用することに適する。
【0002】
さらに本発明は、プロテインチップ、並びにそれを用いた病態の進行状況の診断方法や薬剤感受性の判定方法に関する。
【背景技術】
【0003】
これまでのプロテオーム解析の概念は、適当な網羅的なタンパク質解析装置あるいはDNAアレイ法などの遺伝子レベルにおける解析法にて分離・解析・検索されたタンパク質について、主にディファレンシャルディスプレイによる検出とデータベース検索による同定を行って,スタンドアロン的にターゲットタンパク質を絞り出し、様々な疾患における病態・進行状況等をタンパク質レベルで探索する方法が一般的であった。
【0004】
また,プロテオミクス研究において2次元電気泳動を用いたディファレンシャルディスプレイ解析やLC−ショットガン法用いたディファレンシャルディスプレイ解析は、それぞれの結果のみではすべての組織細胞内のタンパク質情報を網羅することができない。
【0005】
さらに、現在の解析に用いられるペプチドのアミノ酸配列情報を得ることの出来る質量分析計においては、ペプチド種によっては同定が得意不得意分野を有する特徴をもつ様々なイオン化法(MALDI法やESI法など)や異なる分離・検出法を有しており、一種類の質量分析計による分析方法のみや、一つの解析方法論ではすべての組織・細胞内のタンパク質を網羅できないことから、複数の解析方法、質量分析器を用いて解析する必要がある。組織・細胞内のタンパク質を網羅的に解析において分析装置から出力される結果は、大量に出力され、画像データやHTMLなどのインターネットファイルといった多種多様のデータタイプがあり、これらの異なる言語を用いてハイスループットで網羅的解析をすることは、実現には大きな障壁であった。
【0006】
従来の技術では、複数の解析装置データを統合して解析することができないため,プロテオミクスで最も重要とされる細胞内タンパク質ネットワークや翻訳後修飾、細胞内タンパク質の分解産物などの相互作用機能を再現することが困難であり、さらに、トランスクリプトーム研究で用いられるDNAアレイ解析、リアルタイムPCR解析などによって得られるmRNA情報は、タンパク質情報にも大きく関連しているが、同一サンプルからのプロテオミクス情報とmRNA情報を統合して解析することが困難であるため、研究者の経験的知識と長時間の文献検索による調査により試行錯誤的に導出されていた。
【0007】
しかも、分子を探索した結果を得た後、再度生体内での再現性を確認する必要がある。
【0008】
また、特定の疾病へのかかりやすさ、医薬に対する副作用などに関与する所定遺伝子変異の検出/診断などの用途を開発するには、どのプローブを搭載すれば何が分かるかと言うコンテンツを整備する必要があり、単一ではなく複数のプローブの組み合わせにより初めて解析できる事象も多い。
【0009】
他方、非常に予後の悪い腫瘍として脳腫瘍があげられる。本発明者らは、病態発症メカニズム、治療法、治療・予防薬、予後を予測する臨床マーカー
の開発を目的として、種々の脳腫瘍のニューロプロテオミクスの手法を用いた解析を行っている(たとえば、非特許文献1、非特許文献2)。予後の悪い悪性グリオーマにおいて抗癌剤に感受性を持つものとして、乏突起神経膠腫(anaplastic origodendroglioma/astrosytoma:AOG)が知られている。一般的に知られるAOGの興味ある所見としては、第1染色体短腕上(1p36)及び第19染色体長腕上(19q13)に片アレル欠失(Loss
of Heterozygosity :LOH)を有しているタイプのもの(グレード2から3において60%以上)と、1p, 19qLOHを示さないタイプのものに分類できる。両者は病理学的には全く同様の所見を示すが、LOHを有するグループは抗癌剤療法や放射線治療に高感受性で一般的に予後がよく、逆にLOHを持たないタイプは、これらの療法に非感受性で非常に予後が悪いという特徴を持っている。現在までのところ、分子レベルで両タイプの違いを示すマーカー蛋白質はもとより、予後の違いの原因となる分子群や薬剤耐性のメカニズムに関する情報は、全く報告されていない。
【非特許文献1】「Proteomic analysis of human brain identifies -enolase as anovel autoantigen in Hashimoto's encephalopathy」、Ochi H、Horiuchi I、Araki N他著、FEBSLetters、528(1-3)、pp197-202、2002年
【非特許文献2】「脳腫瘍の病態プロテオミクスで見えてくる新たなシグナル伝達経路」、荒木令江著、“プロテオミクスでみえてくる生命機能の新たなメカニズム” 実験医学 vol23(7)、羊土社、pp1050-1058、2005年
【発明の開示】
【発明が解決しようとする課題】
【0010】
上述したように、従来のプロテオーム解析の概念は、2D−PAGEや2D−LCなどで分離したタンパク質やペプチドについて、種々の質量分析装置によりペプチドマスフィンガープリント法やシークエンスタグ法などでデータベース検索することにより、病態に関わるタンパク質の同定と定量を行うものである。しかしながら、分析装置の解析は個々の装置によって異なるため,得られたデータはそれぞれ独立しており,複数の装置の解析データを統合して評価することは困難である。このため,複数の装置によって異なる概念で解析を行い、当該タンパク質のより多くの情報を得たとしても、それを有機的に結びつけて解釈することは困難であり,本来の網羅的解析を実行するに至っていない。
【0011】
したがって、プロテオミクス解析に要求される翻訳後修飾や、細胞内タンパク質の分解産物などの相互作用機能の評価や再現性を確認する際に困難を伴う。また、新しい概念の手法や装置が開発された場合でもそれらのデータを結びつけて解析することが困難である。
【0012】
本発明は、プロテオミクス解析を、効率的に進めることができる解析プログラムを提供することを目的とする。
【0013】
さらに本発明は、上記したプロテオミクス解析システムおよび方法により得られた分子情報を利用して、疾患の進行状況や薬剤感受性などのモニタリングに使用可能な分子群をリストアップして、患者組織・細胞や血清蛋白質のnatural微小生体組織・細胞タンパクチップ上における上記分子群の発現パターンをプロファイリングし、データベース化して、より確実な病態の進行状況や薬剤感受性などをモニタリングするシステム及び方法を提供することを解決すべき課題とした。
【課題を解決するための手段】
【0014】
本発明は、プロテオミクス研究分野で使用されている様々な分析装置、解析ソフトウェアから得られる大量かつ多種多様のデータタイプのタンパク質情報データ、および、ゲノミクスやトランスクリプトーム研究分野から導き出されたタンパク質分子データをプロテオミクスデータベースに統合集中管理し、データマイニングにより機能分析した結果を後機能分析データベースに格納することにより、研究者の経験や自動計算分類された統合化タンパク質情報と実験から得られた信頼性の高いRAWデータを区別し、データの信頼性を確保しながら分子機能分析も大量に、また以前よりも短期間に進めることが可能となる。
【0015】
本発明の目的は、各種病態を示す患者や疾患モデル動物由来組織、細胞および培養細胞を用いてプロテオーム解析方法によって得られた、電気泳動画像、および、各種異なる特徴をもつ質量分析器による質量分析シグナルパターンを少なくとも含む、生データ、並びに、当該生デーに基づいて同定したタンパク質ID、および、定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
データベースに格納されたデータを同一言語に変換し、融合させるステップと、
ネットワークを介してアクセス可能な公開された他のデータベースを検索するステップと、
特異的タンパク質群を抽出し、これらの機能を予測し病態を解析するステップと、を実行させることを特徴とする解析プログラムにより達成される。
【0016】
ある実施態様では、複数のLC−MSショットガン法を適用して得た、MSスペクトルデータを格納する、MSスペクトルデータベースを備えたコンピュータにおいて、前記コンピュータに、
タンパク質を同定するステップと、
前記タンパク質の同定により得られた解析結果を、データベースに格納するステップと、
データベースに格納された解析結果と、タンパク相互機能解析システムおよび生物情報統合プラットフォームとを、ネットワークを介しリンクさせて融合するステップと、を実行させる。
【0017】
別の実施態様では、論理的スペクトルを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
安定同位体標識LC−MSショットガン法を適用して得た生データを、既存の条件にて作成したペプチドピークリストと、前記データベースに格納された理論的スペクトルとの間の類似性に基づいて、ペプチドを同定するステップと、
安定同位体標識されたペアのピークの強度差から、前記ペプチドを含むタンパク質含有相対量を決定するステップと、
特定の組織・細胞に特異的に出現したタンパク質群を分類するステップと、を実行させる。
【0018】
さらに他の実施態様においては、DNAアレイ、および/または、リアルタイムPCRを含む、異なる性質の分析によるmRNA定量的発現解析データ、および、2次元電気泳動、LC−ESI−MS/MSショットガン法、および/または、LC—MALDI−MS/MSショットガン法を含む、異なる手法を用いたプロテオミクスによる定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納されたデータのそれぞれについて、ディファレンシャルディスプレイを含む、同一のアルゴリズムによる解析を施すステップを実行させる。
【0019】
より好ましい実施態様においては、さらに、前記コンピュータが、
前記データベースを異なる他のデータベースとリンクされ、前記コンピュータに
前記データベースに格納された、前記解析を施された結果である解析データについて、前記リンクされた異なる他のデータベースに格納された情報に基づいて解析するステップを実行させる。
【0020】
さらに他の実施態様においては、2D―DIGEを含む画像データであって、スポットの情報を含む画像データ、および、翻訳後修飾構造を含むタンパク質情報を格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記画像データ中のスポットと、前記データベースからの翻訳後修飾構造を含むタンパク質情報とを関連付け、当該関連付けを、前記データベースに格納するステップを実行させる。
【0021】
好ましい実施態様においては、前記コンピュータに、作成した統合データベースの情報を分析装置の解析プラットフォームにリバースインプットし、再解析するステップを実行させる
また、より好ましい実施態様においては、mRNAは、DNAアレイおよび/またはリアルタイムPCR、可溶化タンパク質は、2D−DIGEを含む蛍光標識2次元電気泳動および/またはICAT、iTRAQを含む安定同位体標識法のLC−MSショットガン法を用いて、同時進行で、方式の定量的ディファレンシャルディスプレイによるデータを一元化して解析する。
【0022】
また、別の実施態様においては、分子ネットワークを記憶したデータベースを備えたコンピュータにおいて、前記コンピュータに、
分子統合データに基づいて、前記データベース中の分子ネットワークを検するステップと、
病態で特異的に活性化あるいは特異的に失活しているなどの病態組織・細胞特異的シグナルカスケードを抽出するステップと、を実行させる。
【0023】
さらに別の好ましい実施態様においては、異なる特徴を持つ質量分析器による質量分析シグナルパターンを含む生データに基づいて同定したAccessionNo、および、Intensity比を少なくとも格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納された、異なる質量分析器に基づく、同一のAccessionNoに関するIntensity比を抽出するステップと、
前記Intensity比の値を統合し、統合した値を、前記AccessionNoと関連付けて、前記データベースに記憶するステップと、を実行させる。
【0024】
より好ましくは、さらに、前記データベースが、DNAアレイに由来するデータに基づくAccessionNo、および、Intensity比を備え、
前記データベースに格納された、同一のAccessionNoに関する統合されたIntensity比、および、DNAアレイに関するIntensity比を抽出するステップと、
前記Intensity比の値をノーマライズして、ノーマライズされた値を、前記AccessionNoと関連付けて、前記データベースに記憶するステップと、を実行させる。
【0025】
また、別の好ましい実施態様においては、2D−DIGEを含む画像データであって、スポットの情報を含む画像データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記スポットのそれぞれの情報、および、前記コンピュータに接続されたデータベースであって、前記既知のタンパク質のスポットの情報を格納した他のデータベースを参照して、前記スポットの情報と、前記既知のタンパク質のスポットの情報がマッチする場合に、当該スポットの情報として、前記既知のタンパク質のスポットの情報を与え、前記データベースに格納するステップと、
マッチしない場合に、質量分析計による解析を含む他の手法により取得し、前記データベースに格納した、前記スポットの第2の情報に基づいて、前記スポットにかかるタンパク質を同定するステップと、を実行させる。
【0026】
好ましい実施態様においては、前記前記第2の情報に基づいてタンパク質を同定するステップは、前記コンピュータに接続されたさらに他のデータベースであって、前記他の手法により同定されたタンパク質の情報が格納されたデータベースを検索するステップを含む。
【0027】
また、本発明は、病態組織・細胞の特異的な部位より、mRNAおよびタンパク質を同時に同じ可溶化組織から調製する方法を提供する。
【0028】
さらに、本発明は、生体組織や細胞から抽出したタンパク質をそのまま微少二次元電気泳動(2DE)に供与することを特徴とする方法であって、非常に小さなプロテイン2Dマップを提供する。更に作成された2Dマップを電気的にプローブに転写して固相化することを特徴とする、組織細胞内で合成されたすべてのタンパク質を網羅したnaturalな微小生体組織細胞タンパクチップ提供する。
【0029】
また、natural微小生体組織細胞タンパクチップ上のすべてのタンパク質や糖鎖やリン酸化などの翻訳後修飾タンパク質を、Cyなどの蛍光色素によってあらかじめ標識する、あるいは特異的な蛍光染試薬で染色して、微少チップ上のすべてのタンパク質スポット情報を画像化する方法を提供する。
【0030】
さらに、natural微小生体組織・細胞タンパクチップを用いて、各種病態をしめる患者血清と反応させて、患者血清中の自己抗体に対する抗原を検出する方法、および、これらの結果からチップ上の患者自己抗体陽性スポット群のプロファイリングを行い、データベース化して、病態の進行状況や薬剤感受性などをモニタリングする方法を提供する。
【0031】
また、本発明は、たとえば、上記請求項1、2、3、8、9などによって得られた分子情報から進行状況や薬剤感受性などのモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用いて、患者組織・細胞や血清タンパク質のnatural微小生体組織・細胞タンパクチップ上の抗体反応陽性パターンをプロファイリングし、データベース化して、より確実な病態の進行状況や薬剤感受性などのモニタリングに供与する方法を提供する。
【0032】
また、本発明の他の目的は、生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップにより達成される。
【0033】
好ましい実施態様においては、プロテインチップは、10cm×10cm以下のサイズを有する。
【0034】
また、別の好ましい実施態様において、プロテインチップは、蛋白質試料が電気泳動ゲルからメンブレンに転写されて固相化されている。
【0035】
好ましい実施態様において、プロテインチップの製造方法は、(1)生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、及び、(2)等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程を含む。
【0036】
また、別の好ましい実施態様において、プロテインチップの製造方法は、(1)生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、(2)等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程、及び(3)蛋白質試料をSDS-ポリアクリルアミド電気泳動後の電気泳動ゲルからメンブレンに転写する工程、を含む。
【0037】
別の好ましい実施態様において、該蛋白質試料をプロテインチップ上における蛋白質スポット情報として画像化する方法は、上記プロテインチップ上の蛋白質試料に標識されている蛍光色素に由来する蛍光を検出することを含む。
【0038】
また、本発明においては、(1)請求項1、2、3、8又は9に記載のプログラムをコンピュータに実行させることによって得られた分子情報から病態の進行状況又は薬剤感受性のモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用意する工程、(2)請求項14から16の何れかに記載のプロテインチップに上記抗体カクテルを接触させる工程、及び(3)プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、病態の進行状況又は薬剤感受性をモニタリングする方法が提供される。
【0039】
また、本発明においては、(1)抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、 抗ubiqutine
activating enzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも2種類以上の抗体を含む抗体カクテルを用意する工程、(2)脳腫瘍患者の生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップに上記抗体カクテルを接触させる工程、及び(3)プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングする方法が提供される。
【0040】
さらに、本発明においては、請求項21に記載の方法において脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングするために使用される抗体カクテルであって、抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、 抗ubiqutine
activating wnzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも2種類以上の抗体を含む抗体カクテルが提供される。
【発明の効果】
【0041】
本発明によれば、プロテオミクス解析を、効率的に進めることができる解析システムおよび方法を提供することが可能となる。
【0042】
さらに本発明によれば、上記したプロテオミクス解析システムおよび方法により得られた分子情報を利用して、疾患の進行状況や薬剤感受性などのモニタリングに使用可能な分子群をリストアップして、患者組織・細胞や血清蛋白質のnatural微小生体組織・細胞タンパクチップ上における上記分子群の発現パターンをプロファイリングし、データベース化して、より確実な病態の進行状況や薬剤感受性などをモニタリングするシステム及び方法を提供することが可能となる。
【発明を実施するための最良の形態】
【0043】
以下、添付図面を参照して、本発明の実施の形態について説明する。図1は、本発明の実施の形態にかかるプロテオミクス解析システムの全体構成を示すブロックダイヤグラムである。図1に示すように、プロテオミクス解析システムは、プロテオミクスベースの処理装置群12と、ゲノミクスベースの処理装置群14とが設けられている。また、プロテオミクス解析システムは、それぞれの処理装置群に設けられたデータベース(DB)からの情報のうち所定の情報を記憶するプロテオミクスDB16、機能分類DB18、プロテオミクスDB16へのデータ格納などを制御する統合解析システム20および機能分類DB18へのデータ格納などを制御するデータマイニングシステム22を有する。これらの間は、バス、LAN或いはWANなどのデータ通信路26で相互に接続されている。また、国際DB24との間でもデータ送受信が可能となっている。また、図示しないが、プロテオミクス解析システムは、表示装置と、マウスやキーボードを含む入力装置を備え、システムに含まれる種々のDBから読み出されたデータに基づく画像を表示することができ、また、オペレータからの指示や入力を受け付けて、必要な処理を実行することができる。
【0044】
本実施の形態において、タンパク質のデータベースとして一般に公開されたものを、「国際DB」と総称している。国際DB24として、「SwissnPlot」、「MSDB」、「GeneBank」などを利用することができる。
【0045】
図2は、プロテオミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。第1の質量分析計30〜第3の質量分析計34は、それぞれ、MALDI−TOF−TOFやLC−MS/MSなど、といった個々のタンパク質およびペプチドのマススペクトルを計測する装置である。第1の質量分析計30〜第3の質量分析計34にそれぞれ接続された、制御・解析部40〜44は、対応する質量分析計に対して、計測のための制御パラメータを送信するタンパク質計測のためのコントローラとしての機能、および、生データ(RAWデータ)の測定ポイントやスレッシュホールドを指定して生データから正規な信号を得るための解析機能を有している。
【0046】
スペクトルデータからタンパク質を導出する手法として、公開されている国際DBなどの公共データベースの情報、或いは、インハウスで格納される独自のDB(たとえば、後述するローカルDB)が利用される。第1のローカルDB50〜第3のローカルDB54は、それぞれ、スペクトルの生データや、解析で得たデータを含むデータファイルを格納する機能を有する。なお、大量のデータを格納可能とするため、制御・解析部40〜44と別体に設けても良い。
【0047】
2D−DIGE測定装置36は、プロテオーム解析を目的としたタンパク質の2次元電気泳動測定計で、タンパク質の分子量や等電点の特性からゲル上に分離したタンパク質の2次元位置からタンパク質を同定するために用いられる。2D−DIGE測定装置36に接続された制御・解析部46は、2D−DIGE測定計の制御、および、ゲルパターンの画像をデジタル画像として取り込み、画像処理後に解析データを出力する。第4のローカルDB56はゲルパターン画像や解析データを格納する。
【0048】
図3は、ゲノミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。マイクロダイセクション測定装置60は、人の組織細胞の解析に供されるべき重要部位を選択的に紫外線レーザーで切りとり、DNA、RNAタンパク質を採取する。マイクロダイセクション測定装置60に接続された制御・解析部70は、細胞切片を採取する機構の制御や、細胞の画像解析を実行する。得られた画像データや解析結果は、第5のローカルDB80に格納される。
【0049】
DNAアレイは、ガラス製、ナイロン製またはプラスチック製の基板上に、特定の核酸配列の組み合わせを一定のパターンでスポットしたものである。DNAアレイ測定装置62は、DNAアレイを使用して標識DNAまたはRNAサンプルとハイブリダイゼーションさせることで機能的ゲノム解析を行う。DNAアレイ測定装置62に接続された制御・解析部72はDNAアレイ測定装置62の制御およびスポットDNAの解析を行い、解析データを出力する。DNAアレイの画像データや解析データは、第6のローカルDB82に格納される。
【0050】
リアルタイムPCR測定装置64は、PCRの増幅量をリアルタイムでモニターし、DNAを解析する装置である。制御・解析部74は、接続されたリアルタイムPCR測定装置64の制御およびDNA解析を行う。第7のローカルDB84は、その解析結果を格納する。
【0051】
図1に表示されたプロテオミクスDB16は、第1のローカルDB50〜第7のローカルDB84と、通信路26で接続され、これらDB中の生データや解析データを、集結させる記憶を有する。ここで、集結とは、それぞれのローカルDB中の生データや解析データの全部或いは一部を、プロテオミクスDB16が記憶するような構成により実現しても良いし、或いは、生データや解析データのそれぞれについて、ローカルDB中の格納位置を示すポインタを、プロテオミクスDB16が記憶するような構成により実現しても良い。
【0052】
統合解析システム20は、上述したプロテオミクスベースの処理装置群12やゲノミクスベースの処理装置群14の制御・解析部が実行する解析を実施できるようになっており、プロテオミクスDB16に蓄積された生データ(RAWデータ)を解析し、解析結果をプロテオミクスDB16に格納することができる。また、統合解析システム20は、プロテオミクス解析システム内で得られる全てのデータの配備アドレス(ローカルDBやプロテオミクスDB16中のアドレス)や、測定データの来歴等を管理するラボラトリー情報管理システムLIMS(Laboratory Information Management System)の機能も併せ持つ。
【0053】
データマイニングシステム22は、プロテオミクスDBに蓄積された膨大な量のデータから、意味のある相関関係やパターンを発見するデータマイニングを実行することができる。データマイニングシステム22のプログラムに含まれるデータマイニングアルゴリズムにより、カテゴリー分類や機能分類等された結果は、機能分類データベースDB18に格納される。データマイングに使用されたデータは、統合解析システム20のLIMS機能によって常にモニターできる。
【0054】
このように構成されたプロテオミクス解析システムにて実行される処理の例について以下に説明する。なお、図面においては、第1のローカルDB〜第5のローカルDBを、それぞれ、ローカルDB1〜ローカルDB5とも表記している。
【0055】
図4は、プロテオミクスベースの処理装置群12を用いたデータプロファイリング方法のうち、安定同位体標識法を用いたLC−ショットガン法、および、2次元電気泳動を用いたディファレンシャルディスプレイ法の概略を示す図である。
【0056】
第3の質量分析計34および制御・解析部44を利用して、複数のサンプルを各種の異なる分子量を持つ同位体標識試薬や、同位体を含むアミノ酸の「in vivo標識法」などで標識し、同時進行で定量的差異解析をLC−MS/MSを用いたショットガン法などで行い、同定、および、定量データを、第3のローカルDB54に格納する。その一方、2D−DIGE測定装置46および制御・解析部46を利用して、同じ複数のサンプルを、二次元電気泳動を用いたディファレンシャルディスプレイ解析法などを用いて、タンパク質スポットの解析結果(等電点、分子量、定量的、タンパク質、翻訳後修飾などの同定結果)を、その画像データを含めて第4のローカルDB56に格納する。これらのデータとさらに補足的なデータを加え、一つのデータベース(プロテオミクスDB16)に統合し、プロテオミクス統合データベースとする。
【0057】
LC―MS/MSを用いた手法について、この手法では、2つのペアの標識ペプチドで、クロマトグラフ形式で計測された後、MS/MS解析によりタンパク質同定処理が実行される。図5は、タンパク質同定処理を示すフローチャートである。この処理の結果、ICAT法により「Light」と「Heavy」で示されたインテンシティ(発現強度)情報が得られ、第3のローカルDB54に格納される。図4および図5の処理については、後により詳しく説明する。
【0058】
制御・解析部44によるノイズ処理やセントロイド処理が施された後のピークリストやタンパク質情報も、第3のローカルDB54およびプロテオミクスDB16の双方に格納される。或いは、第3のローカルDB54にのみ、情報を格納し、プロテオミクスDB16には、第3のローカルDB54中に格納された場所のポインタ情報を格納しておき、検索などの際に、プロテオミクスDB16を経由して、同位体標識法によって解析されたデータをバックトラッキングできるように構成しても良い。これら情報の、ローカルDBへの格納やプロテオミクスDBへの格納は、制御・解析部44が実行しても良いし、或いは、統合解析システム20が実行しても良い。
【0059】
二次元電気泳動を用いたディファレンシャルディスプレイ解析の場合も同様である。制御・解析部46は、正常細胞と疾患細胞を染色あるいは標識試薬色により分けたそれぞれの二次元画像プロファイルをパターン合成した画像、スポットアドレス、スポット上のタンパク質情報を、元の画像データとともに、第4のローカルDB56に格納する。制御・解析部46或いは統合解析システム20は、第4のローカルDB56に格納されたデータをプロテオミクスDB16にも格納することで、ダブルバッファリングする。或いは、プロテオミクスDB16には、第4のローカルDB56に格納した場所のポインタ情報を格納する。
【0060】
以下、タンパク質同定処理(図5)について、より詳細に説明する。図5に示すように、質量分析計(たとえば、第3の質量分析計34)および制御・解析部(たとえば、制御・解析部44)は、サンプルから得られたタンパク質をトリプシンなどで分解処理を施し、質量分析に供して、MSスペクトルを得る。次いで、制御・解析部44は、MSスペクトルの生データ(RAWデータ)がサンプルから得られたときに、サンプルに対するMSテーブルを、ローカルDB(たとえば、第3のローカルDB54)に格納する。また、制御・解析部44は、オペレータの入力などにしたがってスレッシュホールドを設定し、ピークリスト(Peak List)を生成する。生成されたピークリストファイルも、第3のローカルDB54に格納される。
【0061】
次いで、制御・解析部44は、オペレータの入力などにしたがって国際DB24を選択する。制御・解析部44は、ピークリストキャリブレーションが施されたデータに基づき、選択された国際DBを用いて、RMF/シーケンスタグなどを検索し、タンパク質を定量的に翻訳後修飾も含めて同定する。
【0062】
制御・解析部44は、同定したタンパク質情報とペプチドテーブルとを、ローカルDB(第3のローカルDB54)に格納する。また、制御・解析部44或いは統合解析システム20は、第3のローカルDB54に格納した情報と、同様の情報を、プロテオミクスDB16に格納する。或いは、制御・解析部44或いは統合解析システム20は、プロテオミクスDB16に、第3のローカルDB54中、タンパク質同定結果を格納した場所を示すポインタ情報を格納しても良い。この、制御・解析部44や統合解析システム20が、プロテオミクスDB16のポインタ情報から、第3のローカルDB54中のMSテーブル、ピークリストファイル、国際DBを用いたタンパク質検索結果などをバックトラッキングすることができる。
【0063】
以下、本実施の形態にかかるデータ保管管理について、補足的に説明する。前述したように、質量分析計から取得したMSスペクトルは、ノイズ処理やピーク検出のためのセントロイド処理が施された後、ピークリストファイルとして出力され、ローカルDB中に格納される。また、ローカルDBには、大容量のLC−MS/MSの測定生データ(バイナリーデータファイル)も格納される。統合解析システムで生データの処理ができる場合には、当該生データのバイナリーデータファイルを、プロテオミクスDBに転送して、そこに格納する。また、最終結果を導出した実験データや解析内容を管理するために、生データのバイナリーデータファイルがどのホストにあるかを把握する。生データのバイナリーファイルから取り出すピークリストファイルや、ピークリストをもとにMascotデータベースのような公共データベースを使用して導き出したタンパク質情報等は、通常、生データのバイナリーデータを格納したホスト上に配備されるので、解析結果が、ローカルDBに格納されていたり、プロテオミクスDBに格納されたりして、最終結論を導きだした解析結果がどこにあるかの管理が容易ではない。そこで、本実施の形態においては、複数箇所に点在するデータの整合性を取るように、図21に示すような、データ保管管理テーブルをもつ。データ保管管理テーブルには、たとえば、タンパク質を導き出すために用いたデータファイルの名称とそのファイルを格納している場所を特定できる情報(ホスト名、IPアドレス、データベース名、ホルダ名)が格納される。
【0064】
本発明は、上記統合データベース上で、同時進行で複数の定量的ディファレンシャルディスプレイやDNAアレイ法を行うことを特徴とする方法であって、得られた各種データをプロテオミクスデータベースとして格納し、格納された各種データを基にタンパク質を同定及び定量し、同一のプラットフォームに乗せるための言語に変換して統合化し、タンパク質相互機能解析ソフトウェア及び、国際ネットワークデータベース等から特異的に出現したタンパク質の機能を予測し病態をシステマチックに解析することを特徴とするアルゴリズムを提供する。
【0065】
次に、ゲノミクスベースの処理装置群によるデータプロファイリングの一例を、図6を参照して説明する。マイクロダイセクション装置60および制御・解析部70が、正常細胞と疾患細胞を、ダイセクションを用いて得たmRNA情報を、検体画像情報とともに、第5のローカルDB80に格納する。同様に、リアルタイムPCR測定装置64および制御・解析部74が、リアルタイムPCRを用いた遺伝子発現解析を行い、PCR画像情報およびmRNA発現解析情報を、第7のローカルDB84に格納する。
【0066】
また、DNAアレイ測定装置62および制御・解析部72が、DNAアレイを用いた遺伝子発現解析を実行する際に、制御・解析部72は、オペレータの入力などにしたがって、国際DB24を選択し、発現解析によるmRNA検索を実行し、検索結果のRNA情報、タンパク質分子情報、DNAアレイ画像データを、第6のローカルDB82に格納する。
【0067】
プロテオミクスベースの処理装置群12に含まれるローカルDBのデータ格納およびプロテオミクスDB16へのデータ格納と同様に、ゲノミクスベースの処理装置群14により得られたタンパク質分子情報は、ローカルDBおよびプロテオミクスDB16の双方に格納されても良い。あるいは、プロテオミクスDB16には、ファイルの格納場所を示すポインタ情報のみを格納しても良い。
【0068】
また、本発明においては、病態組織の特異的なダイセクションを行い、mRNAとタンパク質を同時に同じ可溶化組織から調製し、mRNAについては、DNAアレイ、可溶化タンパク質については、二次元電気泳動(たとえば蛍光標識法2D−DIGE法など)および安定同位体標識(cICAT法やiTRAQ法など)LC−MSショットガン法(たとえば、MALDI−TOF−TOF、LC−ESI/MALDI−QQ−TOF、トリプル四重極型LC/MS/MS、イオントラップ型その他ハイブリッド型LC/MS/MSやFT−MASなど)を用いて、同時進行で並列的に異種解析の複数のディファレンシャルディスプレイを行うことができる(請求項4参照)。また、これらの解析の結果データに基づいて、プロテオミクスDB16やタンパク相互機能解析ソフトウェアにリンクさせて融合した解析アルゴリズムや、特定の組織器官に特異的に出現したタンパク質を自動分類するデータマイニングアルゴリズム(請求項6参照)により特異的なタンパク質分子の抽出、タンパク質機能解析および病態プロテオミクス解析が可能となる。
【0069】
本実施の形態かかるデータマイニング処理の概略を説明する。従来、タンパク質レベルとmRNAレベルとの間では、検出された分子間でどのような相互関係にあるかを関連付けすることができなかった。しかしながら、図8に示すように、分子シグナルネットワークの枠組みに当てはめた場合、分子シグナルリンケージパスウエイが見えてくる。図8において、右側のタンパク質レベルの分子シグナルネットワークと、左側のmRNAレベルの分子シグナリングネットワークとを、重ね合わせてみると、中央の「タンパク質andmRNA」に示すように、これらを重ね合わせることで、類似性を見出すことができる。
【0070】
図8に示す、タンパク質およびmRNAレベルで上昇する分子シグナルネットワークとは、病態組織・細胞サンプル中で、タンパク質、および、mRNAの両方で上昇しているシグナルネットワークを抽出する手法である。たとえば、タンパク質とmRNAの発現が一致しなくとも、mRNAが近未来的にタンパク質として発現すると仮定し、両者の活性化分子ネットワークを合流させることで、ある特定のシグナルキャスケードを抽出することができる。
【0071】
このように、分子シグナルネットワークを得ることで、図8において、「A」で示す最上流の分子や最下流の分子の抽出、治療や創薬などのターゲットとなるネットワークの情報も得られることになる。
【0072】
その一方、第4のローカルDB56などに記憶された、2D−DIGEなどの電気泳動像は、個々のタンパク質の特異的性質に位置づけられるが,これらは画像データであるため,他の数値データとの統合が難しいが,画像データと、プロテオミクスDB16、機能分類DB18、ローカルDBの数値データとをリンクさせることによって、データを一元化することができる(請求項6参照)。たとえば、ローカルDB56に記憶された画像データ中、あるスポットの複数の座標(たとえば矩形を表す4つの座標)で画定される領域と、データベースの種別(たとえば、プロテオミクスDB、機能分類DBなど)や、当該データベース中の格納場所を示す情報とを、関連付けて記憶しておくことにより実現することができる。機能分類DB18およびプロテオミクスDB16を使用することにより、図9に示すような疾患プロテオミクスデータの連携が可能となる。本例では、2D−DIGEのプロファイル画像のスポットを選択すればスポットのタンパク質情報を国際データベースから検索して表示できる。上述したように、スポットの領域の座標と、国際データベースの情報との関連付けを示す情報を、ローカルDB(たとえば、第4のローカルDB56)に記憶しておけば良い。
【0073】
また、プロテオミクス解析システムにて獲得した、測定MSデータや測定nanoLCデータを、データマイニングシステム22がヴィジュアルに表示する。このことによってタンパク質同定の確認の労力が大幅に改善できる。
【0074】
図9について、追加的に説明する。プロテオミクス解析システムの表示装置に表示された2次元電気泳動によるプロファイル画像(2D−DIGEや翻訳後修飾などの特殊染色や、抗体反応によるスポットを含む)の、あるタンパク質スポットを指定してクリックすると、そのタンパク質の名前や、各種国際DB(NCBI、swiss splot、gene bankなど)のアクセッション番号やこれらのDBに直接リンクさせることができる。これは、上述したように、スポットの領域と、アクセッション番号などとを関連付けて、プロテオミクスDB16などに記憶しておくことで実現できる。また、ゲルから抽出して得られたペプチドの質量分析によるシグナルの生データ(M/Zやインテンシティ、MS/MS情報、翻訳後修飾、分子量、等電点、アミノ酸配列など)や、安定同位体を用いた差異解析の生データ、同じ材料を用いて2次元電気泳動以外の方法(LCショットガンなど)から得られた差異解析の結果などをリンクさせる。さらには、より詳しい翻訳後修飾や立体構造や分子機能に細胞内局在などの情報、病態に関連する情報や、その分子の阻害・活性化剤などと関連する情報、その分子の抗体を使った細胞内局在の画像データベースや、その分子の異常による疾患の病態病理画像(MRIや組織切片の形態学的画像等)にもリンクでき、解析の材料となった組織や細胞に関するアトラス的要素を含んでいる。この情報を元に、この2次元電気泳動像をPVDF膜などに転写した組織・細胞Naturalプロテインチップなどの開発に繋げることができる。
【0075】
たとえば、図19は、組織・細胞Naturalプロテインチップの補足説明する図である。この「組織・細胞Naturalプロテインチップ」は、本発明者らにより独自に命名したものである。二次元電気泳動による脳組織サンプル組織・細胞Natural
プロテインチップを用いた自己抗原の解析例である。組織・細胞を2次元電気泳動によって分離し、PCDF膜などのプローブに転写することによって、約10000個ほどのタンパク質スポットが転写されたNatural
プロテインチップが作成できる。これに、患者の血清を反応させ、自己抗体が反応するスポットを図9で示すデータベース上から同定してくることができる。
【0076】
図20は、Naturalプロテインチップによる患者血清中の自己抗体反応性プロテインスポットのプロファイリングを示す図である。図19に示す手法によって、作成されたNaturalプロテインチップを用いて同定された分子の例を示す。橋本脳症、多発性硬化症、筋萎縮性側索硬化症の患者血清からNaturalプロテインチップを用いて自己抗体ターゲットタンパク質の同定とプロファイリングを行った例。これによって、その患者の病態のプロファイリングが可能となる。これを小型化することによって、簡便なNaturalプロテインチップとして臨床検査などに供することができる。
【0077】
また、本発明において、統合データベースが、複数の解析データを一元化し,本来の意味の網羅的解析を可能にする,これによって、単一装置の解析で検出できなかった,あるいは解釈できなかった微小データがクローズアップされ,再度検証する必要性が生じる可能性があるが,これを可能にするため,統合データベースで解析したデータを個々の解析ソフトウェアに戻し、再度解析を行うため処理アルゴリズムを提供する(請求項7参照)。
【0078】
また、ある特定の腫瘍関連遺伝子産物の細胞内機能を解析することを特徴とするプロテオミクス解析法にあっては、ターゲットとする遺伝子が欠失,変異している特定の細胞のDNAアレイ法や安定同位体標識法を用いた蛋白プロファイルを作成し、正常細胞とディファレンシャルディスプレイを行うが、変化しているタンパク質の定量解析を可能にするため多元データの定量的ディファレンシャルディスプレイを一元化するアルゴリズムを提供する。以下に述べるように、異なる機器(たとえば質量分析計)で測定すると、それぞれのシグナル情報が異なるパラメータで出てくる。そこで、これらを統一の言語に変換する作業(すぐなる強度のインターナルコントロールを用いた絶対定量化、ペプチド分子量(M/Z)の表記の統一化、同定分子のアクセッションの統一化などによって一元化を図る。
【0079】
複数台の質量分析計(たとえば、図2に示す第1の質量分析計30〜第3の質量分析計34)から同定されるタンパク質は、装置の感度や生データ(RAWデータ)による条件設定パラメータ(スレッシュホールド設定や公共データベース設定など)によってそれぞれの質量分析結果から同定されるタンパク質は完全に一致はしないのが一般的である。
【0080】
図7は、本実施の形態にかかる第1の質量分析計30〜第3の質量分析計34のそれぞれから得られたタンパク質を分類したベン図である。質量分析計2つ以上に属するタンパク質P+は陽性タンパク質として分類し、インテンシティとペアで機能分類DBに保存される。
【0081】
図7において、たとえば、cICAT(同位体標識法1)と、MALDI−TOF−TOF(質量分析計1)との組み合わせで行った場合、cICAT(同位体標識法1)とESI−QQ−TOF(質量分析計2)の組み合わせで行った場合、さらには、iTRAQ(同位体標識法2)とESI−QQQ(質量分析計3)の組み合わせで行った場合を用いて、全く同じサンプルのディファレンシャルディスプレイ(たとえば、癌組織と正常の比較において癌組織で特異的に上昇する分子群)のデータを統合マイニングしている。このような場合に、それぞれの解析法で解析可能な分子種に得意不得意があるため、図7のようにすべての方法論で共通して同定される同一の分子、2つの組み合わせのみで共通して同定される分子、一つの方法論で特異的に同定される分子(これには同定の際の擬陽性も含まれる場合が多い)群が存在する。これら分子群において、最も信頼性がある分子群はすべての方法論で共通に同定された分子群であり、その次に信頼性があるのは2つ以上の方法論で共通して同定された分子群である。一つの方法論のみで同定されたものについては、もう一度質量分析の生データ(RAWデータ)に帰って、その信頼性を確認する必要があるが、明かな陽性所見も含まれる。つまり、これらの方法論を組み合わせてのすべてを統合することで、はじめてすべての分子群が網羅される。
【0082】
質量分析計1台のみでしか同定できなかったタンパク質は、偽陽性タンパク質P#も含まれているため、偽陽性タンパク質P#のようなケースは、解析ソフトウェアの条件設定パラメータを調整して陽性かどうか再度検索する必要がある。その手順を、図10の処理フローにて説明する。
【0083】
図10は、機能分類データベースにある同定タンパク質の分類に際して行ったデータ処理が正しいものか遡って確認するためのアルゴリズムを示している。
【0084】
図10の例では、同定したタンパク質を、データマイニングを行いクラスター分類し、マイニング結果判定が判定基準以下のとき、本実施の形態にかかるリターンマッチングマイニングが行えるようにする。データマイニングにより判定基準が満足されるケースがあれば、機能分類DB18にプロファイリングする。また、再検索にあたって生データのレベル(RAWレベル)のデータを獲得した場合は、ローカルDBやプロテオミクスDB16にも追加格納する。なお、リターンマッチングマイニングについては後述する。
【0085】
図10の例について、より詳細に説明する。図1に示すデータマイニングシステム22は、各質量分析計等から導出されたタンパク質情報から可能なかぎり意味のある結果を、マイニング手法をもって導出するが、意味のある結果が無いか少ない場合、結論を導き出した経過のフィルタパラメータ情報の調整を行い、再度データマイニングを行う。図10(リターンマッチングマイニングアルゴリズム)は、この再度行う過程をフローによって示している。
【0086】
フロー中のボックス1「同定したタンパク質の確認判定」は、再度データマイニングを行うようにデータマイニングシステム22に対して、オペレータが入力装置を操作して指示を与えたときに入るアルゴリズムエントリー部である。
【0087】
フロー中のボックス2「同定した質量分析計の設定条件を変え、タンパク質を再検索」では、図2に示す質量分析計30〜34に接続された制御・解析部40〜44が、スレッシュホールド設定、公共データベース設定など入力パラメータの条件を、以前設定した内容から変更して、タンパク質を再検索する。スレッシュホールド値を変更することによって、ピークリストの内容がかわり、以前では発見できなかったタンパク質が同定できる。また、ある国際DB(たとえば、公共データベースA)には、ピークリストに関連する情報が無いために発見できなかったタンパク質が、他の国際DB(たとえば、公共データベースB)には登録されていてこれを使用することで解決することがある。
【0088】
フロー中のボックス3「タンパク質は他の質量分析計で同定されたものに最も多く合致するまでマイニング」するステップにおいては、図2に示す3つの質量分析計30〜34にて個々に解析して出力されたタンパク質のトータルがマキシマムになるように、設定パラメータチューニングを行い、タンパク質情報を導出する。また、このステップでは、偽陽性タンパク質の検出も可能である。
【0089】
フロー中のボックス4「最適タンパク質同定ができればローカルDBにレコード」するステップにおいては、再検索したスレッシュホールド設定、公共データベース設定など入力パラメータの条件とともに、解析結果を、測定や解析を実行した質量分析計および制御・解析部に関連するローカルDBに格納する。
【0090】
フロー中のボックス5「プロテオミクスDBにおいてレコード先を追加する」ステップにおいては、ローカルDBに格納した解析結果と設定パラメータが、プロテオミクスDBにおいて参照できるように必要な処理が実行される。
【0091】
フロー中のボックス6「機能分類DBに再同定した結果をプロファイルする」ステップにおいては、リターンマッチングマイニングした結果、意味のある機能解析結果が導出できた場合、機能分類DB18にプロファイルしている。
【0092】
機能分類DB18には、初期検索時にプロファイルした各種データの他にリターンマッチングアルゴリズムを走らせたときに得たRAWデータや解析データもプロファイリングされていく。
【0093】
リターンマッチングマイニングアルゴリズムについて、さらに、図22、図23を参照して補足的に説明する。同定したタンパク質結果が思うように出てこない場合に、結論を導き出すために使用した公共データベースの内容や、データフィルタリングに使用した閾値が最適値でなかったために生じたのではないかと判断するケースがある。図10に示すリターンマッチングアルゴリズムは、図22のレベル3まで戻って、タンパク質の再検索を行った場合の処理フローである。再検索で得たプロテオミクス結果は、図34に示すような構造体のトラッキングテーブルに格納される(つまり、DBに記憶される)。同一階層に複数個登録されていれば、登録日時の新しいものが優先されるが、過去の結果も削除しない限り使用できる。
【0094】
バックトラッキングは、図23のトラッキングテーブルに基づいて実現することができる。なお、図22は、プロテオミクス結果を得るまでのデータの流れを示している。実験や解析を試行錯誤で行う場合に、どこまで遡って行う必要があるかという要求に対して対応できるようにデータを管理する。本実施の形態では、レベルを、たとえば、4段階に分類し、レベル別にデータを管理するトラッキングテーブルを作成する。
【0095】
タンパク質発現情報を用いて分子間ネットワークによる解析する場合、タンパク質のインテンシティの扱いに注意を要する。
【0096】
質量分析結果は、3つのグループのタンパク質を同定するが共通領域(図11のベン図における領域A)に含まれるタンパク質が同じインテンシティを持てば問題ないが、図12の下に示す表のように異なる場合、補正式を使用して何らかのノーマライズ処理が必要となる。
【0097】
図11および図12について、説明する。個々の質量分析計で解析した結果、リファレンスに対するインテンシティは、絶対量でないため比較のためのノーマライズ処理が必要である。図9は、第1の質量分析計1(Mg1)、第2の質量分析計(Mg2)、第3の質量分析計(Mg3)が同じ病態サンプルからタンパク質を同定した結果、共通のタンパク質「Protein1」、「Protein2」、「Protein3」を得たときのノーマライズ処理計算を示している。質量分析計1で求めた「Protein1」、「Protein2」、「Protein3」のインテンシティの和をとってインテンシティトータル(Mg1_IT)とする。同様に他の2台のインテンシティトータル「Mg2_IT」、「Mg3_IT」を求め、その算術平均値をとった式が、図11に示すノーマライズ用補正式である。この式で求まったノーマライズ補正係数NIは、3つのタンパク質にて求めたので1タンパク質単位では、α=NI/3がノーマライズ補正係数となる。この係数αで導出したタンパク質のインテンシティを割ることによって発見したタンパク質の全体が比較できる。
【0098】
同定タンパク質のインテンシティはノーマライズ係数NIで除算され統一される。そのタンパク質IDとインテンシティをインテンシティインターバルでグルーピングして分子シグナルリンケージ解析ソフトウェア(たとえば、Keymolnet)にインポートすれば、図8に示す分子シグナルリンケージのタンパク質レベルネットワークが構築される。図8において、○で示す分子は、ある病態にある組織細胞を「proteomics」タンパク質レベル、または、「transcriptome mRNA」レベルによるディファレンシャルディスプレイ解析にて特異的に上昇、あるいは、減少、あるいは、翻訳後を修飾を受けるものとして検出された分子群で、ネットワーク解析によって相互リンクするものを矢印で示している。
【0099】
また、ゲノミクス・トランスクリプトームレベルで獲得したmRNAもプロテオミクスの時と同様にインテンシティのノーマライズを行い、mRNAレベルの分子シグナルリンケージ解析ソフトウェアにインポートすれば、図8に示すmRNAレベルネットワークが構築される。
【0100】
また,本実施の形態にかかるプロテオミクス解析システムは,異種解析装置から出力されるデータを統合して一元化処理し、網羅的解析に供することができる。したがって、新たな解析装置が開発され、或いは、新たな解析手法が開発された場合でも、出力されたデータを受け入れ、これを統合データベースに組み込むことが可能となる。
【0101】
本発明においては、以下のような6つの段階を経ることで、本発明を用いて知得した情報を臨床データとして適用している。
(1)質量分析計により取得したタンパク質のデータや、二次元電気泳動など他の手法を用いて取得したタンパク質データを一元化して、データベースに格納すること。
(2)格納されたデータを可視化することで画像解析を容易とすること。
(3)上記(1)、(2)のデータ(プロテオノミクスデータ)と、DNAアレイのデータとをマージすること。
(4)上記データやその可視化した画像に基づいて、重要シグナル、分子群を抽出すること。
(5)上記(1)〜(4)に基づいてプロテインチップを作製し検証すること。
(6)検証結果に基づいて、臨床データとして適用すること。
【0102】
上記項目(1)は、図4、5,7,10,11,12,13,15,21,22および23を参照して説明した事項に関連する。また、項目(2)〜(4)は、それぞれ、図4,8,13,14,21,22および23を参照して説明した事項、図6,8,13,16,17,21,22および23を参照して説明した事項、並びに、図8,13,17,18,21,22および23を参照して説明した事項に関連する。また、項目(5)のプロテインチップについては、図4,9,14,18,19,21,22および23を参照して説明した事項に関連する。
【0103】
以下、項目(1)、(3)について補足的に説明する。
【0104】
上述したように、同じタンパク質を質量分析器で分析した場合であっても、装置によってそのデータ値は異なるのが一般的である。図24(a)、(b)は、あるタンパク質を、異なる2つの質量分析器で測定した結果を示す図である。この質量分析器による測定結果のデータは、DB(たとえば、図2に示す第1のローカルDB50など)に格納されている。図24(a)、(b)の例では、比(Intensity比)が2つあるものとしたが、これに限定されず、比は3つ以上存在する場合もある。
【0105】
比は、通常、安定同位体修飾試薬(ICAT、ITRAQ)を用いて、複数の比較したいサンプルを混合して解析し、得られた同定ペプチドのIntensity比をタンパク質レベルで統合して平均したものを、タンパク質の「accessionNo」で標記する。上記「accessionNo」は、「swiss plot−国際タンパク質データベース」に基づくものである。図25は、図24(a)、(b)に示すデータを、図26に示すデータ統合処理により統合して得たデータの例を示す図であり、図26は、データ統合処理の一例を示すフローチャートである。
【0106】
図26に示すように、データ統合処理においては、統合解析システム20が、ローカルDBに記憶された、図24(a)、(b)に示すようなデータを読み込む(ステップ2601)。以下、M1[i]を、質量分析計2による測定結果を記憶したローカルDB中の第i行目のデータレコード、M2[i]を、質量分析計2による測定結果を記憶したローカルDB中の第i行目のデータレコードとする。また、Mp[i].accessionを、第i行のデータレコードにおける「AccessionNo」、Mp[i].ration1を、第i行のデータレコードにおける「ratio1」、Mp[i].ration2を、第i行のデータレコードにおける「ratio2」とする。この例では、p=1または2である。
【0107】
次いで、ループにおけるパラメータが初期化され、終了条件が設定される(ステップ2602〜ステップ2606)。パラメータjがM2の配列数、つまり、質量分析計2による測定結果のレコード数を超えない限り(ステップ2607でノー(No))、質量分析計1および質量分析計2に比の平均を求める。ここでは、1つのレコードには比として、「Ratio1」および「Ratio2」が存在するため、2つの比の平均
(M1[i].ratio1+M2[j].ratio1)/2
(M1[i].ratio2+M2[j].ratio2)/2
が算出される(ステップ2609)。
【0108】
この算出された平均R[k].ratio1およびR[k].ratio2には、アクセッションR[k].accessionとして、M1[i].accessionが与えられる(ステップ2608参照)。
【0109】
このようにして得られたR[k].accession、R[k].ratio1およびR[k].ratio2が、統合化されたレコードとして、データベース(たとえば、プロテオミクスDB16)に格納される。これにより、図25に示すように、たとえば、(AccessionNo=P10809、P11142、P61247)について、「Intensity比」が平均化されたようなデータを得ることができる。
【0110】
DNAアレイとタンパク質についても、同様な統合化が可能である。DNAアレイにはそれぞれのアレイ特有の「AccessionNo」が付与されている。本実施の形態では、これをタンパク質の「AccessionNo」と統合化させる。タンパク質のデータと、DNAアレイのデータからの抽出およびノーマライズは以下の手法により実現される。
【0111】
図27(a)は、図24(a)、(b)に示すタンパク質のデータに、図26に示す統合化処理を施した結果を示す図であり、図25と同様である。また、図27(b)は、ローカルDB(たとえば、第6のローカルDB82)に記憶された、あるDNAアレイのデータを示す図である。また、図29は、図27(a)、(b)に示すようなデータを統合する処理の例を示すフローチャートである。図28は、データ統合処理による処理結果を示す図である。
【0112】
図29に示すように、統合解析システム20は、タンパク質についてのデータレコードと、DNAアレイについてのデータレコードを、それぞれDBから読み出す(ステップ2901)。統合解析システム20は、同一の「AccessionNo」のレコードを抽出して(ステップ2902)、その「Intensity比」をノーマライズする。ノーマライズは、以下のように実現される。
【0113】
活性化分子群:統合解析システム20は、「Intensity比」として得られた値を比較して(ステップ2903、2904)、タンパク質およびDNAアレイの双方で「1」よりも大きい場合には、双方の値を平均化し(ステップ2905)、平均値を当該「AccessionNo」に関するレコードの統合化された比として、DB(たとえば、プロテオミクスDB16)に記憶する。比較の結果、タンパク質に関する値のみが「1」より大きい場合には、統合解析システム20は、タンパク質の値を採用し、これを統合化された比としてDBに記憶する(ステップ2906)。その一方、DNAアレイの値のみが「1」より大きい場合には、統合解析システム20は、DNAアレイの値を採用し、これを統合化された比としてDBに記憶する(ステップ2907)。
【0114】
不活性分子群:統合解析システム20は、「Intensity比」として得られた値を比較して(ステップ2908、2909)、タンパク質およびDNAアレイの双方で「1」よりも小さい場合には、双方の値を平均化し(ステップ2910)、平均値を当該「AccessionNo」に関するレコードの統合化された比として、DBに記憶する。比較の結果、タンパク質に関する値のみが「1」より小さい場合には、統合解析システム20は、タンパク質の値を採用し、これを統合化された比としてDBに記憶する(ステップ2911)。その一方、DNAアレイの値のみが「1」より小さい場合には、統合解析システム20は、DNAアレイの値を採用し、これを統合化された比としてDBに記憶する(ステップ2912)。
【0115】
このようにして、同一の「AccessionNo」が付されたタンパク質のデータおよびDNAアレイのデータについて、「Intensity比」を統合化して、これをDBに格納しておくことができる。図8や図17では、mRNAレベルの分子の発現変化とタンパク質レベルでの発現変化について、それぞれ、シグナルリンケージを解析してこれをマージしている。上述したノーマライズを適用することにより、タンパク質のデータおよびDNAアレイのデータのマージを自動化することが可能となる。
【0116】
図30に示すように、統合解析システム20(或いは、制御・解析部46であっても良い。以下同様)が、第4のローカルDB56などに記憶された、2D−DIGEによるデータに基づくスポットリストを生成し(ステップ3001)、DB(たとえば、国際DB24)に格納された既知のスポット情報とマッチングする(ステップ3002)。既知のスポット情報として、たとえば、SwissPlotによる標準的なデータを利用することができる。次いで、統合解析システム20は、タンパク質のスポットが既知であるか否か、つまり、参照スポットとマッチしたか否かを判断する(ステップ3003)。スポットは、2次元電気泳動で分離された多数の個別のタンパク質であり、既知のスポット情報には、当該スポットの泳動パターンから得た等電点、分子量およびIntensity(タンパク質量)が含まれる。したがって、スポットがマッチしたということは、等電点と分子量によって決定される2次元電気泳動の移動度が一致したことを意味している。
【0117】
ステップ3003でイエス(Yes)と判断された場合、参照スポットのタンパク質の名前や登録番号がわかれば、SwissPlotを利用して、その情報が取得される(ステップ3004)。取得された情報は、たとえば、プロテオミクスDB16に格納することができる。
【0118】
その一方、タンパク質スポットが既知ではなかった場合(ステップ3003でノー(No))
には、質量分析計による分析を行い、そのデータを取得する(ステップ3005〜ステップ3007)。質量分析によって得られたデータのそれぞれは、タンパク質をトリプシンで分解して得た複数のペプチドの質量を測定した値であり、そのペプチドの質量の情報から、ペプチドのアミノ酸シークエンスが推測される。統合解析システム20は、複数のペプチドのアミノ酸シークエンスを組み合わせて、国際DB24を検索してタンパク質を同定する(ステップ3008)。
【0119】
質量分析計の個性により、それぞれのペプチドのアミノ酸までの同定ができないものがある。そこで、複数の質量分析計で測定して、測定結果を統合し、タンパク質同定を有利に行うことに意義がある。この際に、ペプチドレベルでデータを一元化して最終データを得るのと、タンパク質レベルでデータを得る方法があるが、本実施の形態では、ペプチドレベルでデータを一元化することで、最終タンパク質の同定を有効に行っている。
【0120】
図8や図17では、mRNAレベルの分子の発現変化とタンパク質レベルでの発現変化について、それぞれ、シグナルリンケージを求め、求められたシグナルリンケージを解析してこれをマージした例を示している。これについて、図31を参照して補足する。まず、正常組織と病態組織のmRNAを取り出し、DNAアレイを用いて、mRNAの発現レベルを取得する(ステップ3101)。このmRNAの発現レベルのデータ(たとえば、スポットのIntensity)は、第6のローカルDB82に格納される。
【0121】
DNAアレイから得られた元データは、固有のAccessionNoで分子名が表示されており、したがって、プロテオミクスDB16のデータとマージするためには、SwissProtなどの国際DBのAccsessionNoに変換する必要がある。統合解析システム20は、DNAアレイから得られた個々の分子のmRNAの発現レベルと、それぞれの分子の固有のAccessionNoを、SwissProtのような国際DBのAccessionNoに変更したものとを含むリストを生成する(ステップ3102)。
【0122】
また、統合解析システム20は、ゲノム分子シグナルネットワークのタンパク質ノードに、発現したタンパク質レベルを入力する(ステップ3103)。
【0123】
その一方、タンパク質についても、正常組織と病態組織の発現レベルをMSレベルから導出し(ステップ3104)、MSやMS/MSを用いて、たとえば、Mascotサーチにより、タンパク質を検索してその情報を取得する(ステップ3105)。取得されたタンパク質の情報は、たとえば、第1のローカルDB50などに格納され得る。統合解析システム20は、DBに格納されたタンパク質の情報を取り出して、プロテオミクス用シグナルネットワークのタンパク質ノードに、発現したタンパク質レベルを入力する(ステップ3106)。このようにして、mRNAの発現レベルに基づくシグナルネットワーク、および、タンパク質の発現レベルに基づくシグナルネットワークを得ることができる。
【0124】
統合解析システム20は、シグナルネットワークを重ね合わせる(ステップ3107)。ここで、統合解析システム20は、図29に示す処理を実行して、mRNAレベルの分子の発現変化およびタンパク質レベルでの発現変化をマージすることができる。つまり、対応するAccessionNoのIntensity比を参照して、ノーマライズすることでマージし、マージした新たな値(ノーマライズされたIntensity比)をDB(たとえばプロテオミクスDB16)に格納することができる。
【0125】
次に、上述した項目(2)格納されたデータを可視化することで画像解析を容易とすること、および、(4)上記データやその可視化した画像に基づいて、重要シグナル、分子群を抽出することについて補足的に説明する。図32(a)は、2D−DIGEの画像から得られ、DB(たとえば、第4のローカルDB56)に格納されたタンパク質の情報の例を示す図である。図32(a)の例では、Protein1−*は、正常なDIGEから得たタンパク質(スポット)をそれぞれ表し、Protein2−*は、病態のDIGEから得たタンパク質(スポット)をそれぞれ表している。また、図32(a)において、「Mr」は分子量、「pl」は等電点、「D」は濃度である。データマイニングに先立って、統合解析システムは、DBに格納されたタンパク質データを参照して、それぞれのタンパク質の間のユークリッド尺度を算出する。ユークリッド尺度Uは、たとえば、以下の式にしたがって求められる。
【0126】
U={(Mr−Mr+(pl−pl+(D−D1/2
図32(b)は、求められたユークリッド尺度を示す距離テーブルである。
【0127】
データマイニングに際して、統合解析システム20は、たとえば、以下の処理を実行して、特異なタンパク質を見出す。
(1)距離テーブルの横第1列に着目して、距離が最小となるペアを探す。図32(b)の例では、「Protein1−1」との距離が最小となる(最も距離が近い)プロテインが見出される。たとえば、「Protei1−1」と「Protein2−1」との間が最小値となれば、(Protei1−1,Protein2−1)というペアが作られ、ペアのユークリッド尺度(ここでは尺度の小さいほうを採用する)が決定される。
(2)次いで、距離テーブルの横第2列に着目して、距離が最小となるペアを探す。たとえば、「Protein1−2」と「Protein2−2」との間が最小値となれば、(Protein1−2,Protein2−2)というペアができ、そのペアのユークリッド尺度が決定される。
(3)このような処理を繰り返して、最後の行まで進むことにより、全てのペアおよび当該ペアの尺度が決定される。
(4)上述した処理により決定されたペアは、横列での比較であるため、他のタンパク質と最小のペアになっているとは限らない。そこで、たとえば、(1)における(Protein1−1,Protein2−1)について、その一方と、その他の「Protein*−*」との間のユークリッド尺度を比較して、その他の「Protein*−*」の中から、ユークリッド尺度が最小となる「Proteinx−x」を検索する。
【0128】
検索された3番目の「Proteinx−x」を含むペアよりも、(Protein1−1,Protein2−1)のペアのほうが、そのユークリッド尺度が小さければ、(Protein1−1,Protein2−1,Proteinx−x)を新たにグループ化し、グループ数3とする。このグループ化により、「Proteinx−x」と対を成していたタンパク質は、「Proteinx−x」とのペアを解消され、孤立する。
【0129】
このようにして、デンドログラム(樹状図)の生成に類した処理により、グループ数2或いは3となるグループ化を繰り返すことにより、どのペア或いはグループにも属さないタンパク質が見出される。
【0130】
図33は、上記特異タンパク質の抽出を概略的に示した図である。たとえば、正常組織の2D−DIGE画像には、2つのタンパク質「Protein1−1」、「Protein1−2」のスポットが存在し、病態組織の2D−DIGE画像には、3つのタンパク質「Protein2−1」〜「Protein2−3」のスポットが存在すると考える。これらのスポットの情報は、DBに格納されている。統合解析システム20の処理によって、デンドログラムに示すように、(Protein1−1,Protein2−1)というグループ数2のペア、および、(Protein1−2,Protein2−2)というグループ数2のペアが生成される一方、「Protein2−3」がペアないしグループにも属さないと判断すると、統合解析システム20は、「Protein2−3」が特異タンパク質であると判断し、その情報を、DB(たとえば、プロテオミクスDB16)に格納する。
【0131】
さらに、統合解析システム20は、DBに格納されている既知のスポット情報を参照して、位置のスポットの位置および濃度と、特異タンパク質と判断されたタンパク質の位置および濃度とを比較して、一致すれば、その特異タンパク質が同定される。これにより、同定されたタンパク質の情報を、DBに追加することができる。
【0132】
さらに本発明は、プロテインチップ、並びにそれを用いた病態の進行状況の診断方法や薬剤感受性の判定方法に関する。
【0133】
本発明の解析は、図13に示すようなプロトコールに従って、4段階のステップで行っている。まず、病態サンプルとして脳腫瘍(glioma:AOG)の例を示すが、腫瘍組織を外科的手術によって切除したのち、病理学的検査を行い、AOGと認められるものに関して、1p,
19q LOHの有無(抗癌剤感受性・非感受性)による分類を行う。もし、正常な組織が腫瘍サンプルの近隣から切除されている場合は、これをコントロールとして分類する。これらのサンプルに関して、2種類のプロテオミクスによる解析、及び同一のサンプルを用いたDNAチップによる解析を行う。プロテオーム解析の方法論として、2次元電気泳動法による2D-DIGE法、電気泳動を用いないLC-MASSによるcICAT法およびiTRAQ法を同時進行で行って、蛋白質レベルで差異のあった分子群を質量分析解析によって同定する。又、同時に、DNAチップで得られたmRNAレベルのデータをそれぞれ比較し、これら得られたすべてのデータを統合し、分子解析ソフトを用いてネットワーク解析に供す。また、すべてのデータをデータベース化する。これらの統合データから分子クラスター解析、ネットワーク解析を含めた種々の機能解析を行い、最も重要である分子群を抽出して検証した後、臨床マーカー、治療、予防、創薬開発などへの応用へ繋げていく。本ストラテジーにおいて、抽出された分子群で特に特徴的な蛋白質群、およびリン酸化のような翻訳後修飾構造に対する抗体をカクテル化し、以下に示す独自に開発したnatural
protein chipを用いてプロファイリングをおこなった。
【0134】
本発明によれば、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップが提供される。本発明の上記プロテインチップは、生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られることを特徴とするものである。ここで言う微小サイズとは、10cm×10cm以下のサイズを有するものが好ましく、例えば5cm×5cm程度のものを挙げることができる。本発明のプロテインチップは、上記したような微小サイズのチップ上に、生体組織又は細胞内で合成された全蛋白質が網羅されていることを特徴とする。等電点電気泳動及びSDS-ポリアクリルアミド電気泳動の条件は、上記したように生体組織又は細胞内で合成された全蛋白質が微小なチップ上に網羅される限りは、特に限定されるものではないが、以下の実施例に記載されている条件又はそれに準ずる条件を当業者であれば適宜採用することができる。
【0135】
また、本発明のプロテインチップは、二次元電気泳動後のゲルをそのまま用いてもよいが、好ましくは、ゲル中の蛋白質試料をメンブレンに転写して固相化したものを使用することが好ましい。ここで用いるメンブレンの種類は特に限定されず、PVDFメンブレンなどを用いることができる。本発明では、特に低蛍光性、タンパク質低吸着性で、高分解能を有するものを用いることが好ましい。
【0136】
また、本発明のプロテインチップにおいては、生体組織又は細胞から抽出した蛋白質は、CyDye (Cy 5等)等の蛍光色素で標識されている。従って、この蛍光色素に由来する蛍光を検出することによって、プロテインチップ上の蛋白質を、プロテインチップ上における蛋白質スポット情報として画像化することが可能である。
【0137】
さらに、本発明においては、本明細書中上記した本発明によるプロテオミクス解析方法によって得られた分子情報から病態の進行状況又は薬剤感受性のモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用意することができる。次いで、本明細書中上記したプロテインチップに上記抗体カクテルを接触させ、プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化することができる。これにより、病態の進行状況又は薬剤感受性をモニタリングすることが可能になる。
【0138】
本発明の一例としては、抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、 抗ubiqutine
activating wnzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも2種類以上の抗体を含む抗体カクテルを用いて、脳腫瘍患者の生体組織又は細胞から抽出した蛋白質を固定化した微小サイズのプロテインチップに上記抗体カクテルを接触させて、プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化することができる。これにより、脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングすることが可能である。
【実施例】
【0139】
本発明者らは、鋭意研究の結果、下記の手段により新規解析法の実証実験を行い、上記課題を解決し、目的を達成することを見出した。すなわち、本発明では、生体組織や細胞から抽出したタンパク質をそのまま微小二次元電気泳動(2D)に供与して非常に小さなプロテイン2Dマップを作成することを特徴とし、これを電気的にプローブに転写して固相化することによって組織細胞内で合成されたすべてのタンパク質を網羅した生体組織タンパクチップを提供する。
【0140】
また、生体組織タンパクチップを用いて、抗体や、生体タンパク質や合成ペプチドや薬剤などの結合する分子を簡便に探索することを可能とする。
【0141】
さらに、生体組織タンパクチップを用いて、一連の結果を得た後に、もう一度生体内で再現性を確認することなしに、翻訳後修飾や、細胞内タンパク質の分解産物などの相互作用機能を再現することを可能とすることを特徴とする。
【0142】
一般に、タンパクチップに要求される相互作用の再現性の精度が増加すればするほど、細胞内タンパク質の分解産物の相互作用の再現は重要であり、本発明は上述の事情に基づいてなされたもので、その目的は人工的に合成されたタンパクチップを完全に生体組織タンパクチップに置き換えるばかりでなく、プロテオミクスを利用した病態研究、即ちゲノム研究に対応したタンパク質レベルでの細胞組織の網羅的研究に優れた方法を提供することを特徴とする。
【0143】
本実証実験では、自己免疫性疾患を伴う原因不明の脳炎患者血清中に含まれる自己抗体の抗原タンパク質を検索する目的で、正常ヒト脳組織可溶化タンパク質のプロテオームマップの作成と、同時にそのタンパク質の一部を二次元電気泳動後、PVDF膜に転写することを特徴とし、請求項1記載の、生体組織タンパクチップを作成し、患者血清による免疫ブロッティングによって、血清に含まれる自己抗体に反応性のターゲットタンパク質のスクリーニング、同定を行った。
【0144】
本実証実験において、今日までに発見されている自己抗体ターゲットタンパク質以外に、少なくとも7個のターゲットが検出された。
【0145】
具体的には、自己免疫性疾患を伴う原因不明の脳炎は、中枢神経の炎症性脱髄を特徴とする多発性硬化症(multiple sclerosis、MS)を代表として、種々の報告があり、その自己免疫性と病態発症メカニズムの関連性が注目されているのにも関わらず、その患者自己抗体と神経系組織細胞の抗原となりうるターゲットタンパク質の網羅的解析は一般的ではない。本実験では、正常ヒト大脳組織可溶化タンパク質のプロテオームマップの作成と並行して同時にそのタンパク質の一部を二次元電気泳動後PVDF膜に転写し、ヒト自己抗体を含む患者血清による免疫ブロッティングによって自己抗体に反応性のターゲットタンパク質のスクリーニング・同定を行った。
【0146】
本方式では、今日までに、MS患者の自己抗体に関しては、ミエリン蛋白がそのターゲットとして発見されていたが、上述の実験において、少なくとも7個のターゲットが検出され、更に、筋輪萎縮性側索硬化症(amyotrophic lateral screosis,ALS)の患者血清においても、4つの自己抗体反応性のタンパク質が大脳白質及び灰白質組織に存在していることを発見した。
【0147】
更に、最近、抗神経抗体の存在を示唆されている橋本脳症の患者血清に於いても、3つのターゲットタンパク質を検出し、等電点の異なる3つの「alfa−enolase」が抗原として同定された。橋本脳症、脳症を示さない橋本病、自己免疫疾患有無における脳炎患者、及び正常ヒト血清合計100人の解析の結果、ステロイド治療に感受性の橋本脳症患者100%にalfa−enolaseに対する自己抗体が検出され、早期ステロイド治療のマーカーとしての可能性が示唆された。
【0148】
また、翻訳後修飾を含む構造が抗原となっていることが明らかであることから、このスクリーニング法は従来の大腸菌によるcDNAライブラリー発現スクリーニング(SELEX)法に比較して、特に有効であることが判明した。
【0149】
さらに、癌のプロテオーム解析実験に於いては、種々の、脳腫瘍の発症メカニズムの解明、マーカー
開発などを目的とし、特に「anaplastic origo dendro glioma」に注目し脳腫瘍の解析を行った。
【0150】
「anaplastic origo dendro glioma」は、一般的に知られる所見として、第1染色体短腕、および、第19染色体長腕に典型的な片アレルの欠失LOHを有しているタイプのものと、LOHを示さないタイプのものがあり、病理学的には全く同様の所見を示すが、LOHを有するタイプは抗ガン剤や放射線治療に感受性で非常に予後がよく、逆にLOHを持たないタイプは、抗がん剤に非感受性で非常に予後が悪いという特徴を持つ。
【0151】
現在までのところ、分子レベルでこれらの違いを示すマーカータンパク質はもとより、予後の違いの原因となる分子群や薬剤耐性のメカニズムに関する情報は、全く報告されていない。そこで、これらの脳腫瘍サンプルを用いて以下のような解析を行った。
【0152】
脳腫瘍組織をLOHの有無、抗癌剤感受性による分類を行い、これらのサンプルからタンパク質とmRNAとを同時に抽出して、2種類のプロテオミクスによる解析、および、DNAチップによるディファレンシャル解析を行った。差異のあったすべての分子群を同定後、蛋白およびmRNA発現レベルのデータを比較検討し、分子ネットワーク解析ソフトウェアを用いてシグナルリンケージ解析に供した(図13参照)。
【0153】
以下、図13について説明する。図13は、病態サンプルから分子統合情報を得るためのディファレンシャルディスプレイのストラテジーを説明する図である。脳腫瘍組織を外科的手術によって切除したのち、病理学的観点からグレードや進行状況を解析、「genetic mutation」、
欠損、欠失などの有無、抗癌剤感受性、非感受性による分類等を行う。これらのサンプルよりタンパク質とmRNAとを同時に抽出して、数種類のプロテオミクスによるディファレンシャル解析(蛍光試薬標識法、安定同位体標識法、2次元電気泳動法、LCショットガン法等)、および、DNAアレイ測定やリアルタイムPCRにしたがったmRNAのディファレンシャル
解析を行う。差異のあったすべての分子群を同定後、蛋白およびmRNA発現レベルのデータを統合マイニングし、分子解析ソフトウェアを用いてシグナルネットワーク解析に供す。すべてのデータをデータベース化する。これらの統合データから分子クラスター解析、ネットワーク解析を含めた種々の機能解析を行い、最も重要である分子群を抽出して、臨床マーカー、治療、予防、創薬開発など、応用へ繋げていく。
【0154】
2D−DIGEによるプロテオームディファレンシャル解析においては、主に翻訳後修飾タンパクのプロファイリングが可能である。二つの可溶化タンパク質を蛍光試薬で標識し、混合した後、二次元電気泳動に供与し、解析を行い、合計、約3500個のスポットのうち、非感受性サンプルでは約900個の発現上昇蛋白スポットと、約800の減少タンパク質スポットが認められた。
【0155】
さらに、リン酸化タンパク質染色液であるPRO−Q(登録商標)ダイアモンドを用いて、同一のゲル上でリン酸化タンパク質を解析し、感受性サンプルに対しても同様に解析したところ、上昇した蛋白スポットは369スポット、減少したものは628個、又、リン酸化で特に非感受性特異的なものとして12スポットが検出された(図14参照)。
【0156】
図14は、複数の病態サンプルから多重蛍光標識2次元電気泳動と翻訳後修飾部位に対する特殊蛍光染色法によるディファレンシャルディスプレイを示す図である。脳腫瘍サンプルの例を示す脳腫瘍組織(抗がん剤非感受性)(Cy5でラベル)と、同一患者の正常部(Cy2でラベル)との、2D−DIGEによるディファレンシャルディスプレイを行い、さらに、リン酸化タンパク質を特異的に染色するProQ Diamondで染色した。まるで囲んだスポットはリン酸化が腫瘍で亢進あるいは脱リン酸化されているタンパク質。これら検出されたスポットの数を図中に示した。
【0157】
検出された分子群の同定に於いて、非感受性サンプルで特異的にリン酸化を受けるものとして、HSP90をはじめ4個のスポットが、又、脱リン酸化をうけるものとして、「Neurofilament−L」を代表として5個のスポットが同定された。
【0158】
また、同時に2次元電気泳動を用いないプロテオミクス解析法である誘導体化法(cICAT(登録商標)法)による解析を行った。cICAT法は2つの比較したいサンプルそれぞれを、安定同位体を用いて分子量が9ダルトン異なる「light」と「heavy」の2つの標識試薬によって、タンパク質のシステイン残基をラベルする。異なる標識試薬でラベルしたのち両者を混合してトリプシンにより断片化し、質量分析を用いて解析を行う。常に同じフラクションに分画される2つのペアの標識ペプチドは、「Heavy」と「light」の分子量の違いで質量分析によって区別され、その差異が定量される。同時にMS/MS解析により、ペプチドのシークエンスを行い、タンパク質の同定を行う。脳腫瘍サンプルは各100ugからスタートして12フラクションに分画し、最終的には約7000個のペプチドのMS/MSの解析を行った。
【0159】
非感受性と正常サンプルの比較により、上昇したものとして、グリオーマで上昇すると報告をされているマーカーとしてのタンパク質群などが検出された。感受性サンプルとの差異を見たところ、「cell cycle」、「proteolysis」に関連するタンパク質群などが検出された(図15参照)。
【0160】
図15は、複数の病態サンプルの安定同位体標識試薬を用いたLC−ショットガンによるディファレンシャルディスプレイ(脳腫瘍サンプル)の例を示す図である。抗がん剤非感受性脳腫瘍組織と、同じ病態を示すが抗がん感受性組織のサンプルとの比較。cICATやiTRAQを用いたLC−ショットガンによるディファレンシャルディスプレイによって、抗がん剤非感受性脳腫瘍組織において特異的に上昇した分子群、減少した分子群の数と分子名の一部を示す。
【0161】
次に、同一のサンプルを用いてDNAチップによる解析を行った。「CodeLink」によるヒトcDNAオリゴ約20000種類のチップを用い、非感受性サンプルにおいて、正常との比較では上昇287個、減少217個が、又感受性との比較では上昇412個、減少238個が検出された。プロテオミクスの手法によって特異的に同定されたタンパク質群と、mRNAの発現パターンとを比較した結果、両者の発現パターンは大きく異なり、例えば、非感受性と正常のサンプルの比較において、103個の上昇したタンパク質に対し、mRNAでは287個、その中で共通する分子は41個、又、減少した分子群においても、同様に同定タンパク質分子のうち、約30%としかmRNA分子とクロスしないことが判明した(図16参照)。
【0162】
そこで、タンパク質およびmRNAレベルで上昇した分子群のすべてのデータを、既存の分子ネットワーク検索ソフトウェアであるKeyMonet(登録商標)に入力し、同定分子群のリンケージ解析を行った(図17の左上右上:タンパク質レベル:左上、mRNAレベル:右上、すべてのネットワークの解析結果の一部を示す)。
【0163】
図16は、抗がん剤非感受性脳腫瘍組織vs同一患者の正常組織(MS vs N)、抗がん剤非感受性脳腫瘍組織vs同じ病態を示すが抗がん13感受性組織(MS vs HL)のタンパク質及びmRNAレベルで同定された分子数を示す図である。
【0164】
プロテオミクスの手法によって特異的に発現が上昇及び減少するものとして同定されたタンパク質群と、同一のサンプルから検出されたmRNAの発現パターンとを比較した。mRNAの発現とタンパク質の発現のパターンは大きく異なっている。タンパク質で同定された分子のうちの約30%としかmRNAの発現分子と共通にクロスしない。また、これらの分子は時として、タンパク質レベルでは上昇しているのにもかかわらず、mRNAレベルでは逆に減少しているものも多く見受けられた。
【0165】
上記違いの理由として、細胞内におけるタンパク質とmRNAの発現と安定性の時間的ラグが反映されているものと考えられる。mRNAの発現の上昇はタンパク質として充分に反映された時終了し、減少する。タンパク質がクリアランスされ不足するとmRNAの発現は誘導され上昇する。つまり、細胞内のある時間軸だけを切り取ってみると、あるタンパク質は上昇しているが、mRNAは減少していて、又あるタンパク質は減少しているが、mRNAは上昇している、ということは常に起こっていておかしくない。病態サンプルは微量でサンプル内細胞の同調を行なうなど、この時間差の謎を解決するような、タイムコースの実験はできない。
【0166】
時間的キャップを埋めることができるのかは、以下の分子発現の上昇メカニズムで説明できる。すなわち、すべてのmRNAがタンパク質として発現すると仮定した場合、ある時間軸でmRNAが過剰に発現していれば、その時点でタンパク質が減少していても近未来的にタンパク質は上昇する。ならば、その時間的ラグを無視して上昇する分子群をすべて一つに統合マイニングし、その病態サンプルおける時間軸の幅をもたせた特異的活性化シグナルネットワークを抽出できるはずである。図8ではその単純な概念の模式図を示した。このようなシグナルネットワークの抽出操作をすることによって、タンパク質やmRNAそれぞれの単独の解析のみでは見いだすことの出来なかった活性化シグナルの最上流因子(A)、最下流因子(G)を割り出すことが出来る。そこで、タンパク質およびmRNAレベルで上昇した分子群のすべてのデータを、既存の分子ネットワーク検索ソフトウェアであるKeyMolnet(登録商標)に入力し、同定分子群のリンケージ解析を行った。
【0167】
図17左上で示すタンパク質の上昇シグナルマップの骨格の中に、mRNAの発現分子群を挿入すると、共通してmRNA発現の上昇を示す分子群などは非常に少なく、逆に減少した分子が散見され、タンパク質とmRNAの発現レベルには大きな相違があることが判明した。
【0168】
そこで、主に、抗癌剤非感受性サンプル中でタンパク質、および、mRNAの両方で上昇しているシグナルネットワークの抽出の方法論を図のように考えた。例えば、シグナルの上流でタンパク質の発現があがっていて下流のシグナルは下がっているか変化したものとして同定できていない。逆にmRNAの発現がシグナルの上流では既にさがっているが、その下流は上昇している。これらの発現が一致しなくとも、両者の活性化分子を合流させることで、ある特定のシグナルキャスケードを抽出することができ、又、共通の上流因子、下流因子を決定できる可能性が示唆される(図8参照)
タンパク質、mRNAで特異的に上昇した分子のネットワーク検索結果の一例として、補体系、サイクリンとCDKによる細胞周期、レチノイン酸核内レセプターのネットワークが抽出された(図17)。
【0169】
抗がん剤非感受性サンプル中で、リン酸化を含めたタンパク質およびmRNAのレベルで、正常や抗がん剤感受性に比較して特異的に上昇しているシグナルネットワークをリストアップすると、主に、血管新成・血管透過性・細胞周期・接着因子関連分子群の関与するキャスケードの上昇、及び特異的核内レセプター群、転写因子群とそれらの下流分子群の活性化がみとめられた(図18)
また、このように、プロテオミクスによって翻訳後修飾、タンパク質レベルの変化をmRNA発現レベルの変化と比較解析することによってはじめて、病態に関連する特異的なシグナルネットワーク及び治療ターゲットとなる可能性のある分子キャスケードを抽出できることが判明した(図8)。
【0170】
生体組織タンパクチップを用いた病態プロテオミクス解析法により、脳炎を伴う自己免疫疾患患者の血清から、病態に関連する特異的な臨床マーカー及び治療ターゲットとなる自己抗体反応性分子を検出することができることが判明した(図19、図20)。
【0171】
図17は、同一組織細胞可溶化サンプルを用いて各種のディファレンシャルディスプレイ解析を行って抽出してきた分子群の、タンパク質レベル、および、mRNAの両レベルで同様に上昇しているシグナルネットワークの一例を示す図である。
【0172】
図8および図16を参照して説明したような仮説にもとづき、データを統合マイニングし、主に、非感受性サンプル中でタンパク質レベル、および、mRNAの両レベルで同様に上昇しているシグナルネットワークの一例を示す。レチノン酸レセプター(RAR)を介した発現制御に関しての解析例を図に示す。bカテニン、MAPK、RAR、tTG, インテグリン(Int)、コラーゲン、ラミニンなどがタンパク質レベルで上昇するものとして、又mRNAで発現が亢進するものとして、ErbB2、e−カドヘリン、DHTR、MAPK、tTG、Int、さらにRARの下流因子LF、PEPCK、p21CIp1、HOXD、CRBP1なども有意に上昇しているのがわかる。タンパク質、mRNA両者で上昇しているものコアにして前後のキャスケードを見てみると、図中の太字の矢印で示すような活性化シグナルが、抽出できる。これらの所見は、これまでの実験的事実にもとづき、データベース化されたシグナルネットワークを用いて、新たな病態関連シグナルキャスケードを見いだす一つの方法論として新規のものである
図18は、脳腫瘍患者組織の抗癌剤非感受性サンプル中で、特異的にタンパク質、および、mRNAの両レベルで同様に上昇しているシグナルネットワークを示す図である。
【0173】
図8および図16を参照して説明したような仮説に基づき、データを統合マイニングし、主に、非感受性サンプル中でタンパク質レベル、および、mRNAの両レベルで同様に上昇しているシグナルネットワークをリストアップした。特に薬剤感受性に関連して特徴的なものとして、アポトーシス関連キャスケード(AKT、Badシグナルなど)の亢進、血管過剰新成・血管透過性を特徴づける補体凝固系因子・血管新成因子系、サイクリンを中心とする細胞周期G1/S、G2/M関連分子群によるシグナルの亢進、インテグリン・カドヘリンを介した接着因子群、分解系の亢進、又、レチノイン酸レセプター・アンドロジエンレセプター(DHTR)関連シグナルを代表とする核レセプターなど転写因子系を介したシグナル亢進が認められた。また、このように、プロテオミクスによって翻訳後修飾、タンパク質レベルの変化をmRNA発現レベルの変化と比較解析することによってはじめて、病態に関連する特異的なシグナルネットワーク及び治療ターゲットとなる分子キャスケードを抽出できることがわかる。
【0174】
本実証実験では、特異的な分子の抽出及び、タンパク質機能解析及び病態プロテオミクス解析において、請求項3に記載された、同時進行で三方式のディファレンシャルディスプレイを行うこと、ならびに、請求項6に記載された、検索統合データマイニングアルゴリズムにより、プロテオミクスデータベースとタンパク相互機能解析ソフトウェアにリンクさせて融合し、全ての細胞内発現タンパク質を、網羅的に時間軸を追って解析し、如何にトータルとしての機能制御が行われて生物活動が成り立っていくのかを解明し、そして如何なる細胞内タンパク質群のどの様な変化が、何時、どこで、どの様にして正常の細胞活動を破綻させ、がんなどの複雑な疾患をprogressさせて行くのかを各組織・細胞で網羅的かつ系統的に整理し、ゲノム解析の情報と併せて合理的な治療法や癌マーカーや予防法の開発に役立つ網羅的な情報を得ること、即ちこれらを全て含むプロテオーム解析を可能とする方法を見出した。
実施例1:
(方法)
手術により脳腫瘍患者の脳腫瘍部位を脳腫瘍組織サンプル,腫瘍近傍の正常部位を正常組織サンプル(数ミリメートル角)として、術中に液体窒素で凍結し、その後-80oCに保存したものを用いた.これらの組織を病理学的所見にて腫瘍のグレードを確認した後、一番染色体(1P)、19番染色体(19q)のLOHの有無、抗癌剤感受性と抗癌剤耐性のものとに分類した.
それらの組織サンプルをLysis
buffer (9.8M尿素,4%CHAPS、0.5 mM EDTA、1mM DTT, 1mM PMSF, 1mM PEPSTATIN , 1mM
leupeptin, 10 mM NaF, 2 mM Na3VO4,1.5mM Okadaic acid )を用いてホモジネートして溶解させた。その溶解液を遠心分離(15,000
rpm,10min,4℃) し、不溶物を除去したものを腫瘍あるいは正常脳ホモジネートサンプルとした。
【0175】
そのサンプル約100 μgを2D
clean up kit (GE Healthcare Bio-Sciences Corp.)にあるいはアセトン沈殿法にて脱塩したのち,CyDye (Cy 5,GE
Healthcare Bio-Sciences Corp.)にてホモジネートサンプル中の蛋白質にミニマムラベルした。Cy5ラベルした蛋白質約10μg分を膨潤バッファーにて希釈して125
μLとし、その全量をストリップホルダーに添加したのち、DryStrip (pH 3-11NL, 7 cm.Invitrogen)をその溶液上にのせ、一次元目等電点電気泳動(1〜3時間)を行った。等電点電気泳動終了後、DryStripを0.1
M DTT含有SDS平衡化buffer (50 mM Tris-HCl, 6M Urea, 30% glycerol, 2% SDS, 0.02%
Bromophenol Blue, pH 8.8 )に10分間浸して還元処理及びSDS化を行った。さらに、そのDrystripの両端をカッターにて5cm長に切断し、SDS-ポリアクリルアミド電気泳動(Phast-gel
system, Pharmacia,および、 5cmx5cmPAGE産業総合研究所開発微小高分解能ゲル、20mA/ゲル,約1時間通電)にて二次元目電気泳動を行った。これをNatural
proteinゲルチップとした。
【0176】
そのNatural Proteinゲルチップを下記の方法にて電気的に5cmx5cmの低蛍光加工PVDFメンブレン(millipore,
immobilon-FL 0.45μm)へ転写し、Natural Proteinメンブレンチップとした。すなわち、低蛍光PDVFメンブレンをメタノールに約10秒間浸したのち、転写Buffer
(25 mM Tris, 200 mM グリシン, 10%メタノール)にて十分に平衡化した。セミドライトランスファー装置(株式会社 バイオクラフト)を用いて、上記のSDS-ポリアクリルアミドゲル中の蛋白質を転写bufferにて平衡化したメンブレンへ電気的(約140
mA, 50分間通電)に転写した。転写後、直ちに蛍光スキャナー(Typhoon 9400, GE Healthcare Bio-Sciences Corp.)を用いてメンブレン上のタンパク質を検出した。
【0177】
検出後、低蛍光PVDFメンブレンをブロッキング液(0.5%BSA/0.03%Tween20/PBS)に浸して室温にて10分間振とうした後、洗浄液(0.3%Tween20/PBS)にて低蛍光・低吸着・高感度・高分解能PVDFメンブレンを洗浄した(5分間×3回)。抗体カクテル溶液(anti
GFAP pAb 1/500倍 Santa Cruz, anti CD44 pAb 1/1000倍 Ancell, anti p53 mAb 1/1000倍
Santa Cruz, anti prothrombin mAb 1/1000倍 Abcam, anti α1-antitrypsin mAb 1/1000倍
Abcam, anti ubiqutine activating wnzyme E1 mAb 1/500倍 Upstate, anti Erk pAb
1/1000倍 Santa Cruz, anti p-Tyr mAb 1/1000倍 Upstate, anti zyxin pAb 1/1000倍
abcam)(ここで、pAbはウサギポリクローナル抗体を示し、mAbはマウスモノクローナル抗体を示す)に低蛍光PVDFメンブレンを浸して室温で1時間振とうし、洗浄液にて洗浄(5分間×3回)したのち、二次抗体溶液{anti
rabbit Ig-HRP linked F(ab’)2
fragment (from donkey) 1/20,000倍あるいはanti mouse Ig-HRP linked F(ab’)2 fragment (from sheep) 1/20,000倍、GE Healthcare Bio-Sciences Corp.}に低蛍光PVDFメンブレンを浸して室温にて30分間振とうした。洗浄液にて洗浄(5分間×3回)した後、ECL
Plus Western Blotting Detection Reagents (GE Healthcare Bio-Sciences Corp.) 1
mLに浸して室温で1分間反応させた。透明フィルムに挟んだ低蛍光PVDFメンブレンとHyperfilm (GE Healthcare Bio-Sciences
Corp.)を密着(約2分間)させて感光させたのち、Hyperfilmを現像した。また、同時に蛍光スキャナー(Typhoon 9400, GE Healthcare
Bio-Sciences Corp.)にてスキャンし、抗体反応性蛍光スポットを疑似色にて着色し、Cydye検出画像の上にマージさせることによって画像化した。
(結果)
Natural Proteinメンブレンチップによる脳腫瘍組織サンプル及び正常組織サンプルの抗体を用いたプロファイリングの結果を図34〜図37に示した。また、実際のサンプルパターンを図38に示し、各患者のパターンをまとめたものを図39に示した。
【0178】
GFAP,p53は腫瘍サンプルにおいてリン酸化を伴って増加し、ユビキチン化酵素E-1、CD44、アンタイトリプシン、プロトロンビンは量的な変動が明らかなパターンとして検出された。タイロシンリン酸化抗体、さらには、セリン/スレオニン酸染色法を用いると、正常と腫瘍に対する明らかな反応パターンの違いが認められた。また、各患者サンプルを用いて5種類(GFAP,CD44,タイロシンリン酸化抗体,Erk,Zyxin)の抗体カクテルにて抗がん剤感受性及び非感受性のプロファイリングにより比較すると、50及び40個の陽性スポットが得られ、それぞれに特徴的な共通の30個からなるパターンが検出された。これをType
1のパターンとして、現在,抗癌剤感受性に関連すると考えられる蛋白質の抗体をリストアップして、これらの抗体カクテルによるパターン化を行うことができる。
【0179】
以上の結果より、正常と腫瘍、抗癌剤耐性と抗癌剤感受性との識別が、このNatural Protein (メンブレン)チップで可能であることが示された。また、数種類の抗体が同時に使用できること、さらには,反応の程度(量的変化)が定量化できることから、癌の診断として用いられている組織免疫染色及び癌マーカーのELISAによる定量のみでは得ることができなかった、翻訳後修飾変化などを含む多数の分子情報が数時間で得られ、脳腫瘍に関わらず、全ての疾患関連サンプルに応用できる有用な診断法となり得る。また、本法は通常、2日以上かかっていた方法論を最短で5時間に短縮して最終データを得ることができることから、臨床検査の方法論として有用である。
【図面の簡単な説明】
【0180】
【図1】図1は、本発明の実施の形態にかかるプロテオミクス解析システムの全体構成を示すブロックダイヤグラムである。
【図2】図2は、プロテオミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。
【図3】図3は、ゲノミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。
【図4】図4は、プロテオミクスベースの処理装置群を用いたデータプロファイリング方法のうち、安定同位体標識法を用いたLC−ショットガン法、および、2次元電気泳動を用いたディファレンシャルディスプレイ法の概略を示す図である。
【図5】図5は、本実施の形態にかかるタンパク質同定処理を示すフローチャートである。
【図6】図6は、ゲノミクスベースの処理装置群によるデータプロファイリングの一例を示す図である。
【図7】図7は、本実施の形態にかかる第1の質量分析計〜第3の質量分析計のそれぞれから得られたタンパク質を分類したベン図である。
【図8】図8は、分子シグナルリンケージのタンパク質レベルネットワークの一例を示す図である。
【図9】図9は、機能分類DB内の疾患プロテオミクスデータの連携を説明する図である。
【図10】図10は、リターンマッチングマイニングアルゴリズムの例を示す図である。
【図11】図11は、タンパク質インテンシティのノーマライズ処理を説明する図である。
【図12】図12は、タンパク質インテンシティのノーマライズ処理を説明する図である。
【図13】図13は、病態サンプルから分子統合情報を得るためのディファレンシャルディスプレイのストラテジーを説明する図である。
【図14】図14は、複数の病態サンプルから多重蛍光標識2次元電気泳動と翻訳後修飾部位に対する特殊蛍光染色法によるディファレンシャルディスプレイを示す図である。
【図15】図15は、複数の病態サンプルの安定同位体標識試薬を用いたLC−ショットガンによるディファレンシャルディスプレイ(脳腫瘍サンプル)の例を示す図である。
【図16】図16は、抗がん剤非感受性脳腫瘍組織vs同一患者の正常組織(MS vs N)、抗がん剤非感受性脳腫瘍組織vs同じ病態を示すが抗がん13感受性組織(MS vs HL)のタンパク質及びmRNAレベルで同定された分子数を示す図である。
【図17】図17は、同一組織細胞可溶化サンプルを用いて各種のディファレンシャルディスプレイ解析を行って抽出してきた分子群の、タンパク質レベル、および、mRNAの両レベルで同様に上昇しているシグナルネットワークの一例を示す図である。
【図18】図18は、脳腫瘍患者組織の抗癌剤非感受性サンプル中で、特異的にタンパク質、および、mRNAの両レベルで同様に上昇しているシグナルネットワークを示す図である。
【図19】図19は、組織・細胞Naturalプロテインチップの補足説明する図である。
【図20】図20は、Naturalプロテインチップによる患者血清中の自己抗体反応性プロテインスポットのプロファイリングを示す図である。
【図21】図21は、データ保管管理テーブルを説明する図である。
【図22】図22は、リターンマッチングアルゴリズムを説明する図である。
【図23】図23は、リターンマッチングアルゴリズムを説明する図である。
【図24】図24(a)、(b)は、あるタンパク質を、異なる2つの質量分析器で測定した結果を示す図である。
【図25】図25は、図24(a)、(b)に示すデータを、データ統合処理により統合して得たデータの例を示す図である。
【図26】図26は、本実施の形態にかかるデータ統合処理の一例を示すフローチャートである。
【図27】図27(a)は、図24(a)、(b)に示すタンパク質のデータに、図26に示す統合化処理を施した結果を示す図、図27(b)は、図27(b)は、ローカルDBに記憶された、あるDNAアレイのデータを示す図である。
【図28】図28は、図27(a)、(b)に示すデータを、データ統合処理により統合して得たデータの例を示す図である。
【図29】図29は、図27(a)、(b)に示すようなデータを統合するデータ統合処理の例を示すフローチャートである。
【図30】図30は、本実施の形態にかかるタンパク質同定手順の一例を示すフローチャートである。
【図31】図31は、本実施の形態にかかるタンパク質とmRNAのマージの例を説明するフローチャートである。
【図32】図32(a)は、2D−DIGEの画像から得られたタンパク質の情報の例を示す図、図32(b)は、タンパク質間のユークリッド尺度の情報の例を示す図である。
【図33】図33は、本実施の形態にかかる特異タンパク質の抽出を概略的に示した図である。
【図34】図34は、二次元ウエスタンブロッティングによる腫瘍特異的プロテインのプロファイリングを示す。
【図35】図35は、二次元ウエスタンブロッティングによる腫瘍特異的プロテインのプロファイリングを示す。
【図36】図36は、二次元ウエスタンブロッティング及びPro-Qダイアモンド染色による腫瘍特異的プロテインのプロファイリングを示す。
【図37】図37は、抗体カクテルを用いた二次元ウエスタンブロッティングによる腫瘍特異的プロテインのプロファイリングを示す。
【図38】図38は、抗体カクテルによる個々の患者組織のメンブレンチップパターンを示す。
【図39】図39は、GCTEZカクテルを用いた非感受性及び感受性のAOG脳組織の患者試料の代表的なチップパターンを示す。
【符号の説明】
【0181】
12 プロテオミクスベースの処理装置群
14 ゲノミクスベースの処理装置群
16 プロテオミクスDB
18 機能分類DB
20 統合解析システム
22 データマイニングシステム
24 国際DB
30、32、34 質量分析計
36 2D−DIGE測定装置
40、42、44、46 制御・解析部
50、52、54、56 ローカルDB
60 マイクロダイセクション装置
62 DNAアレイ測定装置
64 リアルタイムPCR測定装置
70、72、74 制御・解析部
80、82、84、ローカルDB

【特許請求の範囲】
【請求項1】
各種病態を示す患者や疾患モデル動物由来組織、細胞および培養細胞を用いてプロテオーム解析方法によって得られた、電気泳動画像、および、各種異なる特徴をもつ質量分析器による質量分析シグナルパターンを少なくとも含む、生データ、並びに、当該生データに基づいて同定したペプチド・タンパク質ID、および、定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
データベースに格納されたデータを同一言語に変換し、融合させるステップと、
ネットワークを介してアクセス可能な公開された他のデータベースを検索するステップと、
特異的タンパク質群を抽出し、これらの機能を予測し病態を解析するステップと、を実行させることを特徴とする解析プログラム。
【請求項2】
複数のLC−MSショットガン法を適用して得た、MSスペクトルデータを格納する、MSスペクトルデータベースを備えたコンピュータにおいて、前記コンピュータに、
タンパク質を同定するステップと、
前記タンパク質の同定により得られた解析結果を、データベースに格納するステップと、
データベースに格納された解析結果と、タンパク相互機能解析システムおよび生物情報統合プラットフォームとを、ネットワークを介しリンクさせて融合するステップと、を実行させることを備えたことを特徴とする解析プログラム。
【請求項3】
論理的スペクトルを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
安定同位体標識LC−MSショットガン法を適用して得た生データを、既存の条件にて作成したペプチドピークリストと、前記データベースに格納された理論的スペクトルとの間の類似性に基づいて、ペプチドを同定するステップと、
安定同位体標識されたペアのピークの強度差から、前記ペプチドを含むタンパク質含有相対量を決定するステップと、
特定の組織・細胞に特異的に出現したタンパク質群を分類するステップと、を実行させることを特徴とする解析プログラム。
【請求項4】
DNAアレイ、および/または、リアルタイムPCRを含む、異なる性質の分析によるmRNA定量的発現解析データ、および、2次元電気泳動、LC−ESI−MS/MSショットガン法、および/または、LC—MALDI−MS/MSショットガン法を含む、異なる手法を用いたプロテオミクスによる定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納されたデータのそれぞれについて、ディファレンシャルディスプレイを含む、同一のアルゴリズムによる解析を施すステップを実行させることを特徴とする解析プログラム。
【請求項5】
さらに、前記コンピュータが、
前記データベースを異なる他のデータベースとリンクされ、前記コンピュータに
前記データベースに格納された、前記解析を施された結果である解析データについて、前記リンクされた異なる他のデータベースに格納された情報に基づいて解析するステップを実行させることを特徴とする請求項4に記載の解析プログラム。
【請求項6】
2D―DIGEを含む画像データであって、スポットの情報を含む画像データ、および、翻訳後修飾構造を含むタンパク質情報を格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記画像データ中のスポットと、前記データベースからの翻訳後修飾構造を含むタンパク質情報とを関連付け、当該関連付けを、前記データベースに格納するステップを実行させることを特徴とする解析プログラム。
【請求項7】
前記コンピュータに、
作成した統合データベースの情報を分析装置の解析プラットフォームにリバースインプットし、再解析するステップを実行させることを特徴とする請求項1ないし5の何れか一項に記載の解析プログラム。
【請求項8】
mRNAは、DNAアレイおよび/またはリアルタイムPCR、可溶化タンパク質は、2D−DIGEを含む蛍光標識2次元電気泳動および/またはICAT、iTRAQを含む安定同位体標識法のLC−MSショットガン法を用いて、同時進行で、方式の定量的ディファレンシャルディスプレイによるデータを一元化して解析することを特徴とする請求項4に記載の解析プログラム。
【請求項9】
分子ネットワークを記憶したデータベースを備えたコンピュータにおいて、前記コンピュータに、
分子統合データに基づいて、前記データベース中の分子ネットワークを検するステップと、
病態で特異的に活性化あるいは特異的に失活しているなどの病態組織・細胞特異的シグナルカスケードを抽出するステップと、を実行させることを特徴とする解析プログラム。
【請求項10】
異なる特徴を持つ質量分析器による質量分析シグナルパターンを含む生データに基づいて同定したAccessionNo、および、Intensity比を少なくとも格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納された、異なる質量分析器に基づく、同一のAccessionNoに関するIntensity比を抽出するステップと、
前記Intensity比の値を統合し、統合した値を、前記AccessionNoと関連付けて、前記データベースに記憶するステップと、を実行させることを特徴とする解析プログラム。
【請求項11】
さらに、前記データベースが、DNAアレイに由来するデータに基づくAccessionNo、および、Intensity比を備え、
前記データベースに格納された、同一のAccessionNoに関する統合されたIntensity比、および、DNAアレイに関するIntensity比を抽出するステップと、
前記Intensity比の値をノーマライズして、ノーマライズされた値を、前記AccessionNoと関連付けて、前記データベースに記憶するステップと、を実行させることを特徴とする請求項10に記載の解析プログラム。
【請求項12】
2D−DIGEを含む画像データであって、スポットの情報を含む画像データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記スポットのそれぞれの情報、および、前記コンピュータに接続されたデータベースであって、前記既知のタンパク質のスポットの情報を格納した他のデータベースを参照して、前記スポットの情報と、前記既知のタンパク質のスポットの情報がマッチする場合に、当該スポットの情報として、前記既知のタンパク質のスポットの情報を与え、前記データベースに格納するステップと、
マッチしない場合に、質量分析計による解析を含む他の手法により取得し、前記データベースに格納した、前記スポットの第2の情報に基づいて、前記スポットにかかるタンパク質を同定するステップと、を実行させることを特徴とする解析プログラム。
【請求項13】
前記第2の情報に基づいてタンパク質を同定するステップが、前記コンピュータに接続されたさらに他のデータベースであって、前記他の手法により同定されたタンパク質の情報が格納されたデータベースを検索するステップを含むことを特徴とする請求項12に記載の解析プログラム。
【請求項14】
生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップ。
【請求項15】
10cm×10cm以下のサイズを有する、請求項14に記載のプロテインチップ。
【請求項16】
蛋白質試料が電気泳動ゲルからメンブレンに転写されて固相化されている、請求項14又は15に記載のプロテインチップ。
【請求項17】
(1)生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、及び、(2)等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程を含む、請求項14又は15に記載のプロテインチップの製造方法。
【請求項18】
(1)生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、(2)等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程、及び(3)蛋白質試料をSDS-ポリアクリルアミド電気泳動後の電気泳動ゲルからメンブレンに転写する工程、を含む請求項16に記載のプロテインチップの製造方法。
【請求項19】
請求項14から16の何れかに記載のプロテインチップ上の蛋白質試料に標識されている蛍光色素に由来する蛍光を検出することを含む、該蛋白質試料をプロテインチップ上における蛋白質スポット情報として画像化する方法。
【請求項20】
(1)請求項1、2、3、8又は9に記載のプログラムをコンピュータに実行させることによって得られた分子情報から病態の進行状況又は薬剤感受性のモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用意する工程、(2)請求項14から16の何れかに記載のプロテインチップに上記抗体カクテルを接触させる工程、及び(3)プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、病態の進行状況又は薬剤感受性をモニタリングする方法。
【請求項21】
(1)抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、 抗ubiqutine
activating enzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも2種類以上の抗体を含む抗体カクテルを用意する工程、(2)脳腫瘍患者の生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップに上記抗体カクテルを接触させる工程、及び(3)プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングする方法。
【請求項22】
請求項21に記載の方法において脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングするために使用される抗体カクテルであって、抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、 抗ubiqutine
activating wnzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも2種類以上の抗体を含む抗体カクテル。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図37】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図38】
image rotate

【図39】
image rotate


【公開番号】特開2006−294014(P2006−294014A)
【公開日】平成18年10月26日(2006.10.26)
【国際特許分類】
【出願番号】特願2006−72392(P2006−72392)
【出願日】平成18年3月16日(2006.3.16)
【出願人】(801000050)財団法人くまもとテクノ産業財団 (38)
【Fターム(参考)】