解析プログラム、プロテインチップ、プロテインチップの製造方法、および、抗体カクテル

【課題】プロテオミクス解析を、効率的に進めることができる。
【解決手段】各種病態を示す患者や疾患モデル動物由来組織、細胞および培養細胞を用いてプロテオーム解析方法によって得られた、電気泳動画像や各種異なる特徴をもつ質量分析器による質量分析シグナルパターンを少なくとも含む、生データ、当該生データに基づいて同定したタンパク質ＩＤ、および、定量的データが、ローカルＤＢやプロテオミクスＤＢに格納される。プロテオミクス解析システムは、プロテオミクスＤＢに格納されたデータを同一言語に変換し、融合させ、ネットワークを介してアクセス可能な公開された他のＤＢを検索して、特異的タンパク質群、および特異的細胞内シグナルネットワークを抽出する。これらの得られた結果から、機能を予測し、独自のプロテインチップによる検証を行うことによって、病態を解析するとともに最も確実な治療や創薬への情報を得る。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、病態プロテオミクスによる様々な疾患対象の生物学的な個性、各時点に於ける病態・進行状況等をタンパク質レベルで詳細且つ正確に解析することにより、疾患発症メカニズムや各患者に最も適した合理的な治療薬や予防法を確立することに最適な解析プログラムに関する。特に、この情報処理システムは、医薬、臨床検査、創薬などの分野で利用することに適する。
【０００２】
さらに本発明は、プロテインチップ、並びにそれを用いた病態の進行状況の診断方法や薬剤感受性の判定方法に関する。
【背景技術】
【０００３】
これまでのプロテオーム解析の概念は、適当な網羅的なタンパク質解析装置あるいはＤＮＡアレイ法などの遺伝子レベルにおける解析法にて分離・解析・検索されたタンパク質について、主にディファレンシャルディスプレイによる検出とデータベース検索による同定を行って，スタンドアロン的にターゲットタンパク質を絞り出し、様々な疾患における病態・進行状況等をタンパク質レベルで探索する方法が一般的であった。
【０００４】
また，プロテオミクス研究において２次元電気泳動を用いたディファレンシャルディスプレイ解析やＬＣ−ショットガン法用いたディファレンシャルディスプレイ解析は、それぞれの結果のみではすべての組織細胞内のタンパク質情報を網羅することができない。
【０００５】
さらに、現在の解析に用いられるペプチドのアミノ酸配列情報を得ることの出来る質量分析計においては、ペプチド種によっては同定が得意不得意分野を有する特徴をもつ様々なイオン化法（ＭＡＬＤＩ法やＥＳＩ法など）や異なる分離・検出法を有しており、一種類の質量分析計による分析方法のみや、一つの解析方法論ではすべての組織・細胞内のタンパク質を網羅できないことから、複数の解析方法、質量分析器を用いて解析する必要がある。組織・細胞内のタンパク質を網羅的に解析において分析装置から出力される結果は、大量に出力され、画像データやＨＴＭＬなどのインターネットファイルといった多種多様のデータタイプがあり、これらの異なる言語を用いてハイスループットで網羅的解析をすることは、実現には大きな障壁であった。
【０００６】
従来の技術では、複数の解析装置データを統合して解析することができないため，プロテオミクスで最も重要とされる細胞内タンパク質ネットワークや翻訳後修飾、細胞内タンパク質の分解産物などの相互作用機能を再現することが困難であり、さらに、トランスクリプトーム研究で用いられるＤＮＡアレイ解析、リアルタイムＰＣＲ解析などによって得られるｍＲＮＡ情報は、タンパク質情報にも大きく関連しているが、同一サンプルからのプロテオミクス情報とｍＲＮＡ情報を統合して解析することが困難であるため、研究者の経験的知識と長時間の文献検索による調査により試行錯誤的に導出されていた。
【０００７】
しかも、分子を探索した結果を得た後、再度生体内での再現性を確認する必要がある。
【０００８】
また、特定の疾病へのかかりやすさ、医薬に対する副作用などに関与する所定遺伝子変異の検出／診断などの用途を開発するには、どのプローブを搭載すれば何が分かるかと言うコンテンツを整備する必要があり、単一ではなく複数のプローブの組み合わせにより初めて解析できる事象も多い。
【０００９】
他方、非常に予後の悪い腫瘍として脳腫瘍があげられる。本発明者らは、病態発症メカニズム、治療法、治療・予防薬、予後を予測する臨床マーカー
の開発を目的として、種々の脳腫瘍のニューロプロテオミクスの手法を用いた解析を行っている（たとえば、非特許文献１、非特許文献２）。予後の悪い悪性グリオーマにおいて抗癌剤に感受性を持つものとして、乏突起神経膠腫(anaplastic origodendroglioma/astrosytoma:AOG)が知られている。一般的に知られるAOGの興味ある所見としては、第１染色体短腕上（1p36）及び第１９染色体長腕上（19q13）に片アレル欠失（Loss
of Heterozygosity ：LOH）を有しているタイプのもの(グレード２から３において60％以上)と、1p, 19qLOHを示さないタイプのものに分類できる。両者は病理学的には全く同様の所見を示すが、LOHを有するグループは抗癌剤療法や放射線治療に高感受性で一般的に予後がよく、逆にLOHを持たないタイプは、これらの療法に非感受性で非常に予後が悪いという特徴を持っている。現在までのところ、分子レベルで両タイプの違いを示すマーカー蛋白質はもとより、予後の違いの原因となる分子群や薬剤耐性のメカニズムに関する情報は、全く報告されていない。
【非特許文献１】「Proteomic analysis of human brain identifies -enolase as anovel autoantigen in Hashimoto's encephalopathy」、Ochi H、Horiuchi I、Araki N他著、FEBSLetters、528(1-3)、pp197-202、２００２年
【非特許文献２】「脳腫瘍の病態プロテオミクスで見えてくる新たなシグナル伝達経路」、荒木令江著、“プロテオミクスでみえてくる生命機能の新たなメカニズム” 実験医学 vol23(7)、羊土社、pp1050-1058、２００５年
【発明の開示】
【発明が解決しようとする課題】
【００１０】
上述したように、従来のプロテオーム解析の概念は、２Ｄ−ＰＡＧＥや２Ｄ−ＬＣなどで分離したタンパク質やペプチドについて、種々の質量分析装置によりペプチドマスフィンガープリント法やシークエンスタグ法などでデータベース検索することにより、病態に関わるタンパク質の同定と定量を行うものである。しかしながら、分析装置の解析は個々の装置によって異なるため，得られたデータはそれぞれ独立しており，複数の装置の解析データを統合して評価することは困難である。このため，複数の装置によって異なる概念で解析を行い、当該タンパク質のより多くの情報を得たとしても、それを有機的に結びつけて解釈することは困難であり，本来の網羅的解析を実行するに至っていない。
【００１１】
したがって、プロテオミクス解析に要求される翻訳後修飾や、細胞内タンパク質の分解産物などの相互作用機能の評価や再現性を確認する際に困難を伴う。また、新しい概念の手法や装置が開発された場合でもそれらのデータを結びつけて解析することが困難である。
【００１２】
本発明は、プロテオミクス解析を、効率的に進めることができる解析プログラムを提供することを目的とする。
【００１３】
さらに本発明は、上記したプロテオミクス解析システムおよび方法により得られた分子情報を利用して、疾患の進行状況や薬剤感受性などのモニタリングに使用可能な分子群をリストアップして、患者組織・細胞や血清蛋白質のｎａｔｕｒａｌ微小生体組織・細胞タンパクチップ上における上記分子群の発現パターンをプロファイリングし、データベース化して、より確実な病態の進行状況や薬剤感受性などをモニタリングするシステム及び方法を提供することを解決すべき課題とした。
【課題を解決するための手段】
【００１４】
本発明は、プロテオミクス研究分野で使用されている様々な分析装置、解析ソフトウェアから得られる大量かつ多種多様のデータタイプのタンパク質情報データ、および、ゲノミクスやトランスクリプトーム研究分野から導き出されたタンパク質分子データをプロテオミクスデータベースに統合集中管理し、データマイニングにより機能分析した結果を後機能分析データベースに格納することにより、研究者の経験や自動計算分類された統合化タンパク質情報と実験から得られた信頼性の高いＲＡＷデータを区別し、データの信頼性を確保しながら分子機能分析も大量に、また以前よりも短期間に進めることが可能となる。
【００１５】
本発明の目的は、各種病態を示す患者や疾患モデル動物由来組織、細胞および培養細胞を用いてプロテオーム解析方法によって得られた、電気泳動画像、および、各種異なる特徴をもつ質量分析器による質量分析シグナルパターンを少なくとも含む、生データ、並びに、当該生デーに基づいて同定したタンパク質ＩＤ、および、定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
データベースに格納されたデータを同一言語に変換し、融合させるステップと、
ネットワークを介してアクセス可能な公開された他のデータベースを検索するステップと、
特異的タンパク質群を抽出し、これらの機能を予測し病態を解析するステップと、を実行させることを特徴とする解析プログラムにより達成される。
【００１６】
ある実施態様では、複数のＬＣ−ＭＳショットガン法を適用して得た、ＭＳスペクトルデータを格納する、ＭＳスペクトルデータベースを備えたコンピュータにおいて、前記コンピュータに、
タンパク質を同定するステップと、
前記タンパク質の同定により得られた解析結果を、データベースに格納するステップと、
データベースに格納された解析結果と、タンパク相互機能解析システムおよび生物情報統合プラットフォームとを、ネットワークを介しリンクさせて融合するステップと、を実行させる。
【００１７】
別の実施態様では、論理的スペクトルを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
安定同位体標識ＬＣ−ＭＳショットガン法を適用して得た生データを、既存の条件にて作成したペプチドピークリストと、前記データベースに格納された理論的スペクトルとの間の類似性に基づいて、ペプチドを同定するステップと、
安定同位体標識されたペアのピークの強度差から、前記ペプチドを含むタンパク質含有相対量を決定するステップと、
特定の組織・細胞に特異的に出現したタンパク質群を分類するステップと、を実行させる。
【００１８】
さらに他の実施態様においては、ＤＮＡアレイ、および／または、リアルタイムＰＣＲを含む、異なる性質の分析によるｍＲＮＡ定量的発現解析データ、および、２次元電気泳動、ＬＣ−ＥＳＩ−ＭＳ／ＭＳショットガン法、および／または、ＬＣ—ＭＡＬＤＩ−ＭＳ／ＭＳショットガン法を含む、異なる手法を用いたプロテオミクスによる定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納されたデータのそれぞれについて、ディファレンシャルディスプレイを含む、同一のアルゴリズムによる解析を施すステップを実行させる。
【００１９】
より好ましい実施態様においては、さらに、前記コンピュータが、
前記データベースを異なる他のデータベースとリンクされ、前記コンピュータに
前記データベースに格納された、前記解析を施された結果である解析データについて、前記リンクされた異なる他のデータベースに格納された情報に基づいて解析するステップを実行させる。
【００２０】
さらに他の実施態様においては、２Ｄ―ＤＩＧＥを含む画像データであって、スポットの情報を含む画像データ、および、翻訳後修飾構造を含むタンパク質情報を格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記画像データ中のスポットと、前記データベースからの翻訳後修飾構造を含むタンパク質情報とを関連付け、当該関連付けを、前記データベースに格納するステップを実行させる。
【００２１】
好ましい実施態様においては、前記コンピュータに、作成した統合データベースの情報を分析装置の解析プラットフォームにリバースインプットし、再解析するステップを実行させる
また、より好ましい実施態様においては、ｍＲＮＡは、ＤＮＡアレイおよび／またはリアルタイムＰＣＲ、可溶化タンパク質は、２Ｄ−ＤＩＧＥを含む蛍光標識２次元電気泳動および／またはＩＣＡＴ、ｉＴＲＡＱを含む安定同位体標識法のＬＣ−ＭＳショットガン法を用いて、同時進行で、方式の定量的ディファレンシャルディスプレイによるデータを一元化して解析する。
【００２２】
また、別の実施態様においては、分子ネットワークを記憶したデータベースを備えたコンピュータにおいて、前記コンピュータに、
分子統合データに基づいて、前記データベース中の分子ネットワークを検するステップと、
病態で特異的に活性化あるいは特異的に失活しているなどの病態組織・細胞特異的シグナルカスケードを抽出するステップと、を実行させる。
【００２３】
さらに別の好ましい実施態様においては、異なる特徴を持つ質量分析器による質量分析シグナルパターンを含む生データに基づいて同定したＡｃｃｅｓｓｉｏｎＮｏ、および、Ｉｎｔｅｎｓｉｔｙ比を少なくとも格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納された、異なる質量分析器に基づく、同一のＡｃｃｅｓｓｉｏｎＮｏに関するＩｎｔｅｎｓｉｔｙ比を抽出するステップと、
前記Ｉｎｔｅｎｓｉｔｙ比の値を統合し、統合した値を、前記ＡｃｃｅｓｓｉｏｎＮｏと関連付けて、前記データベースに記憶するステップと、を実行させる。
【００２４】
より好ましくは、さらに、前記データベースが、ＤＮＡアレイに由来するデータに基づくＡｃｃｅｓｓｉｏｎＮｏ、および、Ｉｎｔｅｎｓｉｔｙ比を備え、
前記データベースに格納された、同一のＡｃｃｅｓｓｉｏｎＮｏに関する統合されたＩｎｔｅｎｓｉｔｙ比、および、ＤＮＡアレイに関するＩｎｔｅｎｓｉｔｙ比を抽出するステップと、
前記Ｉｎｔｅｎｓｉｔｙ比の値をノーマライズして、ノーマライズされた値を、前記ＡｃｃｅｓｓｉｏｎＮｏと関連付けて、前記データベースに記憶するステップと、を実行させる。
【００２５】
また、別の好ましい実施態様においては、２Ｄ−ＤＩＧＥを含む画像データであって、スポットの情報を含む画像データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記スポットのそれぞれの情報、および、前記コンピュータに接続されたデータベースであって、前記既知のタンパク質のスポットの情報を格納した他のデータベースを参照して、前記スポットの情報と、前記既知のタンパク質のスポットの情報がマッチする場合に、当該スポットの情報として、前記既知のタンパク質のスポットの情報を与え、前記データベースに格納するステップと、
マッチしない場合に、質量分析計による解析を含む他の手法により取得し、前記データベースに格納した、前記スポットの第２の情報に基づいて、前記スポットにかかるタンパク質を同定するステップと、を実行させる。
【００２６】
好ましい実施態様においては、前記前記第２の情報に基づいてタンパク質を同定するステップは、前記コンピュータに接続されたさらに他のデータベースであって、前記他の手法により同定されたタンパク質の情報が格納されたデータベースを検索するステップを含む。
【００２７】
また、本発明は、病態組織・細胞の特異的な部位より、ｍＲＮＡおよびタンパク質を同時に同じ可溶化組織から調製する方法を提供する。
【００２８】
さらに、本発明は、生体組織や細胞から抽出したタンパク質をそのまま微少二次元電気泳動（２ＤＥ）に供与することを特徴とする方法であって、非常に小さなプロテイン２Ｄマップを提供する。更に作成された２Ｄマップを電気的にプローブに転写して固相化することを特徴とする、組織細胞内で合成されたすべてのタンパク質を網羅したｎａｔｕｒａｌな微小生体組織細胞タンパクチップ提供する。
【００２９】
また、ｎａｔｕｒａｌ微小生体組織細胞タンパクチップ上のすべてのタンパク質や糖鎖やリン酸化などの翻訳後修飾タンパク質を、Ｃｙなどの蛍光色素によってあらかじめ標識する、あるいは特異的な蛍光染試薬で染色して、微少チップ上のすべてのタンパク質スポット情報を画像化する方法を提供する。
【００３０】
さらに、ｎａｔｕｒａｌ微小生体組織・細胞タンパクチップを用いて、各種病態をしめる患者血清と反応させて、患者血清中の自己抗体に対する抗原を検出する方法、および、これらの結果からチップ上の患者自己抗体陽性スポット群のプロファイリングを行い、データベース化して、病態の進行状況や薬剤感受性などをモニタリングする方法を提供する。
【００３１】
また、本発明は、たとえば、上記請求項１、２、３、８、９などによって得られた分子情報から進行状況や薬剤感受性などのモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用いて、患者組織・細胞や血清タンパク質のｎａｔｕｒａｌ微小生体組織・細胞タンパクチップ上の抗体反応陽性パターンをプロファイリングし、データベース化して、より確実な病態の進行状況や薬剤感受性などのモニタリングに供与する方法を提供する。
【００３２】
また、本発明の他の目的は、生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップにより達成される。
【００３３】
好ましい実施態様においては、プロテインチップは、１０cm×１０cm以下のサイズを有する。
【００３４】
また、別の好ましい実施態様において、プロテインチップは、蛋白質試料が電気泳動ゲルからメンブレンに転写されて固相化されている。
【００３５】
好ましい実施態様において、プロテインチップの製造方法は、（１）生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、及び、（２）等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程を含む。
【００３６】
また、別の好ましい実施態様において、プロテインチップの製造方法は、（１）生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、（２）等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程、及び（３）蛋白質試料をSDS-ポリアクリルアミド電気泳動後の電気泳動ゲルからメンブレンに転写する工程、を含む。
【００３７】
別の好ましい実施態様において、該蛋白質試料をプロテインチップ上における蛋白質スポット情報として画像化する方法は、上記プロテインチップ上の蛋白質試料に標識されている蛍光色素に由来する蛍光を検出することを含む。
【００３８】
また、本発明においては、（１）請求項１、２、３、８又は９に記載のプログラムをコンピュータに実行させることによって得られた分子情報から病態の進行状況又は薬剤感受性のモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用意する工程、（２）請求項１４から１６の何れかに記載のプロテインチップに上記抗体カクテルを接触させる工程、及び（３）プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、病態の進行状況又は薬剤感受性をモニタリングする方法が提供される。
【００３９】
また、本発明においては、（１）抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、抗ubiqutine
activating enzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも２種類以上の抗体を含む抗体カクテルを用意する工程、（２）脳腫瘍患者の生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップに上記抗体カクテルを接触させる工程、及び（３）プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングする方法が提供される。
【００４０】
さらに、本発明においては、請求項２１に記載の方法において脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングするために使用される抗体カクテルであって、抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、抗ubiqutine
activating wnzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも２種類以上の抗体を含む抗体カクテルが提供される。
【発明の効果】
【００４１】
本発明によれば、プロテオミクス解析を、効率的に進めることができる解析システムおよび方法を提供することが可能となる。
【００４２】
さらに本発明によれば、上記したプロテオミクス解析システムおよび方法により得られた分子情報を利用して、疾患の進行状況や薬剤感受性などのモニタリングに使用可能な分子群をリストアップして、患者組織・細胞や血清蛋白質のｎａｔｕｒａｌ微小生体組織・細胞タンパクチップ上における上記分子群の発現パターンをプロファイリングし、データベース化して、より確実な病態の進行状況や薬剤感受性などをモニタリングするシステム及び方法を提供することが可能となる。
【発明を実施するための最良の形態】
【００４３】
以下、添付図面を参照して、本発明の実施の形態について説明する。図１は、本発明の実施の形態にかかるプロテオミクス解析システムの全体構成を示すブロックダイヤグラムである。図１に示すように、プロテオミクス解析システムは、プロテオミクスベースの処理装置群１２と、ゲノミクスベースの処理装置群１４とが設けられている。また、プロテオミクス解析システムは、それぞれの処理装置群に設けられたデータベース（ＤＢ）からの情報のうち所定の情報を記憶するプロテオミクスＤＢ１６、機能分類ＤＢ１８、プロテオミクスＤＢ１６へのデータ格納などを制御する統合解析システム２０および機能分類ＤＢ１８へのデータ格納などを制御するデータマイニングシステム２２を有する。これらの間は、バス、ＬＡＮ或いはＷＡＮなどのデータ通信路２６で相互に接続されている。また、国際ＤＢ２４との間でもデータ送受信が可能となっている。また、図示しないが、プロテオミクス解析システムは、表示装置と、マウスやキーボードを含む入力装置を備え、システムに含まれる種々のＤＢから読み出されたデータに基づく画像を表示することができ、また、オペレータからの指示や入力を受け付けて、必要な処理を実行することができる。
【００４４】
本実施の形態において、タンパク質のデータベースとして一般に公開されたものを、「国際ＤＢ」と総称している。国際ＤＢ２４として、「ＳｗｉｓｓｎＰｌｏｔ」、「ＭＳＤＢ」、「ＧｅｎｅＢａｎｋ」などを利用することができる。
【００４５】
図２は、プロテオミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。第１の質量分析計３０〜第３の質量分析計３４は、それぞれ、ＭＡＬＤＩ−ＴＯＦ−ＴＯＦやＬＣ−ＭＳ／ＭＳなど、といった個々のタンパク質およびペプチドのマススペクトルを計測する装置である。第１の質量分析計３０〜第３の質量分析計３４にそれぞれ接続された、制御・解析部４０〜４４は、対応する質量分析計に対して、計測のための制御パラメータを送信するタンパク質計測のためのコントローラとしての機能、および、生データ（ＲＡＷデータ）の測定ポイントやスレッシュホールドを指定して生データから正規な信号を得るための解析機能を有している。
【００４６】
スペクトルデータからタンパク質を導出する手法として、公開されている国際ＤＢなどの公共データベースの情報、或いは、インハウスで格納される独自のＤＢ（たとえば、後述するローカルＤＢ）が利用される。第１のローカルＤＢ５０〜第３のローカルＤＢ５４は、それぞれ、スペクトルの生データや、解析で得たデータを含むデータファイルを格納する機能を有する。なお、大量のデータを格納可能とするため、制御・解析部４０〜４４と別体に設けても良い。
【００４７】
２Ｄ−ＤＩＧＥ測定装置３６は、プロテオーム解析を目的としたタンパク質の２次元電気泳動測定計で、タンパク質の分子量や等電点の特性からゲル上に分離したタンパク質の２次元位置からタンパク質を同定するために用いられる。２Ｄ−ＤＩＧＥ測定装置３６に接続された制御・解析部４６は、２Ｄ−ＤＩＧＥ測定計の制御、および、ゲルパターンの画像をデジタル画像として取り込み、画像処理後に解析データを出力する。第４のローカルＤＢ５６はゲルパターン画像や解析データを格納する。
【００４８】
図３は、ゲノミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。マイクロダイセクション測定装置６０は、人の組織細胞の解析に供されるべき重要部位を選択的に紫外線レーザーで切りとり、ＤＮＡ、ＲＮＡタンパク質を採取する。マイクロダイセクション測定装置６０に接続された制御・解析部７０は、細胞切片を採取する機構の制御や、細胞の画像解析を実行する。得られた画像データや解析結果は、第５のローカルＤＢ８０に格納される。
【００４９】
ＤＮＡアレイは、ガラス製、ナイロン製またはプラスチック製の基板上に、特定の核酸配列の組み合わせを一定のパターンでスポットしたものである。ＤＮＡアレイ測定装置６２は、ＤＮＡアレイを使用して標識ＤＮＡまたはＲＮＡサンプルとハイブリダイゼーションさせることで機能的ゲノム解析を行う。ＤＮＡアレイ測定装置６２に接続された制御・解析部７２はＤＮＡアレイ測定装置６２の制御およびスポットＤＮＡの解析を行い、解析データを出力する。ＤＮＡアレイの画像データや解析データは、第６のローカルＤＢ８２に格納される。
【００５０】
リアルタイムＰＣＲ測定装置６４は、ＰＣＲの増幅量をリアルタイムでモニターし、ＤＮＡを解析する装置である。制御・解析部７４は、接続されたリアルタイムＰＣＲ測定装置６４の制御およびＤＮＡ解析を行う。第７のローカルＤＢ８４は、その解析結果を格納する。
【００５１】
図１に表示されたプロテオミクスＤＢ１６は、第１のローカルＤＢ５０〜第７のローカルＤＢ８４と、通信路２６で接続され、これらＤＢ中の生データや解析データを、集結させる記憶を有する。ここで、集結とは、それぞれのローカルＤＢ中の生データや解析データの全部或いは一部を、プロテオミクスＤＢ１６が記憶するような構成により実現しても良いし、或いは、生データや解析データのそれぞれについて、ローカルＤＢ中の格納位置を示すポインタを、プロテオミクスＤＢ１６が記憶するような構成により実現しても良い。
【００５２】
統合解析システム２０は、上述したプロテオミクスベースの処理装置群１２やゲノミクスベースの処理装置群１４の制御・解析部が実行する解析を実施できるようになっており、プロテオミクスＤＢ１６に蓄積された生データ（ＲＡＷデータ）を解析し、解析結果をプロテオミクスＤＢ１６に格納することができる。また、統合解析システム２０は、プロテオミクス解析システム内で得られる全てのデータの配備アドレス（ローカルＤＢやプロテオミクスＤＢ１６中のアドレス）や、測定データの来歴等を管理するラボラトリー情報管理システムＬＩＭＳ（ＬａｂｏｒａｔｏｒｙＩｎｆｏｒｍａｔｉｏｎＭａｎａｇｅｍｅｎｔＳｙｓｔｅｍ）の機能も併せ持つ。
【００５３】
データマイニングシステム２２は、プロテオミクスＤＢに蓄積された膨大な量のデータから、意味のある相関関係やパターンを発見するデータマイニングを実行することができる。データマイニングシステム２２のプログラムに含まれるデータマイニングアルゴリズムにより、カテゴリー分類や機能分類等された結果は、機能分類データベースＤＢ１８に格納される。データマイングに使用されたデータは、統合解析システム２０のＬＩＭＳ機能によって常にモニターできる。
【００５４】
このように構成されたプロテオミクス解析システムにて実行される処理の例について以下に説明する。なお、図面においては、第１のローカルＤＢ〜第５のローカルＤＢを、それぞれ、ローカルＤＢ１〜ローカルＤＢ５とも表記している。
【００５５】
図４は、プロテオミクスベースの処理装置群１２を用いたデータプロファイリング方法のうち、安定同位体標識法を用いたＬＣ−ショットガン法、および、２次元電気泳動を用いたディファレンシャルディスプレイ法の概略を示す図である。
【００５６】
第３の質量分析計３４および制御・解析部４４を利用して、複数のサンプルを各種の異なる分子量を持つ同位体標識試薬や、同位体を含むアミノ酸の「ｉｎｖｉｖｏ標識法」などで標識し、同時進行で定量的差異解析をＬＣ−ＭＳ／ＭＳを用いたショットガン法などで行い、同定、および、定量データを、第３のローカルＤＢ５４に格納する。その一方、２Ｄ−ＤＩＧＥ測定装置４６および制御・解析部４６を利用して、同じ複数のサンプルを、二次元電気泳動を用いたディファレンシャルディスプレイ解析法などを用いて、タンパク質スポットの解析結果（等電点、分子量、定量的、タンパク質、翻訳後修飾などの同定結果）を、その画像データを含めて第４のローカルＤＢ５６に格納する。これらのデータとさらに補足的なデータを加え、一つのデータベース（プロテオミクスＤＢ１６）に統合し、プロテオミクス統合データベースとする。
【００５７】
ＬＣ―ＭＳ／ＭＳを用いた手法について、この手法では、２つのペアの標識ペプチドで、クロマトグラフ形式で計測された後、ＭＳ／ＭＳ解析によりタンパク質同定処理が実行される。図５は、タンパク質同定処理を示すフローチャートである。この処理の結果、ＩＣＡＴ法により「Ｌｉｇｈｔ」と「Ｈｅａｖｙ」で示されたインテンシティ（発現強度）情報が得られ、第３のローカルＤＢ５４に格納される。図４および図５の処理については、後により詳しく説明する。
【００５８】
制御・解析部４４によるノイズ処理やセントロイド処理が施された後のピークリストやタンパク質情報も、第３のローカルＤＢ５４およびプロテオミクスＤＢ１６の双方に格納される。或いは、第３のローカルＤＢ５４にのみ、情報を格納し、プロテオミクスＤＢ１６には、第３のローカルＤＢ５４中に格納された場所のポインタ情報を格納しておき、検索などの際に、プロテオミクスＤＢ１６を経由して、同位体標識法によって解析されたデータをバックトラッキングできるように構成しても良い。これら情報の、ローカルＤＢへの格納やプロテオミクスＤＢへの格納は、制御・解析部４４が実行しても良いし、或いは、統合解析システム２０が実行しても良い。
【００５９】
二次元電気泳動を用いたディファレンシャルディスプレイ解析の場合も同様である。制御・解析部４６は、正常細胞と疾患細胞を染色あるいは標識試薬色により分けたそれぞれの二次元画像プロファイルをパターン合成した画像、スポットアドレス、スポット上のタンパク質情報を、元の画像データとともに、第４のローカルＤＢ５６に格納する。制御・解析部４６或いは統合解析システム２０は、第４のローカルＤＢ５６に格納されたデータをプロテオミクスＤＢ１６にも格納することで、ダブルバッファリングする。或いは、プロテオミクスＤＢ１６には、第４のローカルＤＢ５６に格納した場所のポインタ情報を格納する。
【００６０】
以下、タンパク質同定処理（図５）について、より詳細に説明する。図５に示すように、質量分析計（たとえば、第３の質量分析計３４）および制御・解析部（たとえば、制御・解析部４４）は、サンプルから得られたタンパク質をトリプシンなどで分解処理を施し、質量分析に供して、ＭＳスペクトルを得る。次いで、制御・解析部４４は、ＭＳスペクトルの生データ（ＲＡＷデータ）がサンプルから得られたときに、サンプルに対するＭＳテーブルを、ローカルＤＢ（たとえば、第３のローカルＤＢ５４）に格納する。また、制御・解析部４４は、オペレータの入力などにしたがってスレッシュホールドを設定し、ピークリスト（ＰｅａｋＬｉｓｔ）を生成する。生成されたピークリストファイルも、第３のローカルＤＢ５４に格納される。
【００６１】
次いで、制御・解析部４４は、オペレータの入力などにしたがって国際ＤＢ２４を選択する。制御・解析部４４は、ピークリストキャリブレーションが施されたデータに基づき、選択された国際ＤＢを用いて、ＲＭＦ／シーケンスタグなどを検索し、タンパク質を定量的に翻訳後修飾も含めて同定する。
【００６２】
制御・解析部４４は、同定したタンパク質情報とペプチドテーブルとを、ローカルＤＢ（第３のローカルＤＢ５４）に格納する。また、制御・解析部４４或いは統合解析システム２０は、第３のローカルＤＢ５４に格納した情報と、同様の情報を、プロテオミクスＤＢ１６に格納する。或いは、制御・解析部４４或いは統合解析システム２０は、プロテオミクスＤＢ１６に、第３のローカルＤＢ５４中、タンパク質同定結果を格納した場所を示すポインタ情報を格納しても良い。この、制御・解析部４４や統合解析システム２０が、プロテオミクスＤＢ１６のポインタ情報から、第３のローカルＤＢ５４中のＭＳテーブル、ピークリストファイル、国際ＤＢを用いたタンパク質検索結果などをバックトラッキングすることができる。
【００６３】
以下、本実施の形態にかかるデータ保管管理について、補足的に説明する。前述したように、質量分析計から取得したＭＳスペクトルは、ノイズ処理やピーク検出のためのセントロイド処理が施された後、ピークリストファイルとして出力され、ローカルＤＢ中に格納される。また、ローカルＤＢには、大容量のＬＣ−ＭＳ／ＭＳの測定生データ（バイナリーデータファイル）も格納される。統合解析システムで生データの処理ができる場合には、当該生データのバイナリーデータファイルを、プロテオミクスＤＢに転送して、そこに格納する。また、最終結果を導出した実験データや解析内容を管理するために、生データのバイナリーデータファイルがどのホストにあるかを把握する。生データのバイナリーファイルから取り出すピークリストファイルや、ピークリストをもとにＭａｓｃｏｔデータベースのような公共データベースを使用して導き出したタンパク質情報等は、通常、生データのバイナリーデータを格納したホスト上に配備されるので、解析結果が、ローカルＤＢに格納されていたり、プロテオミクスＤＢに格納されたりして、最終結論を導きだした解析結果がどこにあるかの管理が容易ではない。そこで、本実施の形態においては、複数箇所に点在するデータの整合性を取るように、図２１に示すような、データ保管管理テーブルをもつ。データ保管管理テーブルには、たとえば、タンパク質を導き出すために用いたデータファイルの名称とそのファイルを格納している場所を特定できる情報（ホスト名、ＩＰアドレス、データベース名、ホルダ名）が格納される。
【００６４】
本発明は、上記統合データベース上で、同時進行で複数の定量的ディファレンシャルディスプレイやＤＮＡアレイ法を行うことを特徴とする方法であって、得られた各種データをプロテオミクスデータベースとして格納し、格納された各種データを基にタンパク質を同定及び定量し、同一のプラットフォームに乗せるための言語に変換して統合化し、タンパク質相互機能解析ソフトウェア及び、国際ネットワークデータベース等から特異的に出現したタンパク質の機能を予測し病態をシステマチックに解析することを特徴とするアルゴリズムを提供する。
【００６５】
次に、ゲノミクスベースの処理装置群によるデータプロファイリングの一例を、図６を参照して説明する。マイクロダイセクション装置６０および制御・解析部７０が、正常細胞と疾患細胞を、ダイセクションを用いて得たｍＲＮＡ情報を、検体画像情報とともに、第５のローカルＤＢ８０に格納する。同様に、リアルタイムＰＣＲ測定装置６４および制御・解析部７４が、リアルタイムＰＣＲを用いた遺伝子発現解析を行い、ＰＣＲ画像情報およびｍＲＮＡ発現解析情報を、第７のローカルＤＢ８４に格納する。
【００６６】
また、ＤＮＡアレイ測定装置６２および制御・解析部７２が、ＤＮＡアレイを用いた遺伝子発現解析を実行する際に、制御・解析部７２は、オペレータの入力などにしたがって、国際ＤＢ２４を選択し、発現解析によるｍＲＮＡ検索を実行し、検索結果のＲＮＡ情報、タンパク質分子情報、ＤＮＡアレイ画像データを、第６のローカルＤＢ８２に格納する。
【００６７】
プロテオミクスベースの処理装置群１２に含まれるローカルＤＢのデータ格納およびプロテオミクスＤＢ１６へのデータ格納と同様に、ゲノミクスベースの処理装置群１４により得られたタンパク質分子情報は、ローカルＤＢおよびプロテオミクスＤＢ１６の双方に格納されても良い。あるいは、プロテオミクスＤＢ１６には、ファイルの格納場所を示すポインタ情報のみを格納しても良い。
【００６８】
また、本発明においては、病態組織の特異的なダイセクションを行い、ｍＲＮＡとタンパク質を同時に同じ可溶化組織から調製し、ｍＲＮＡについては、ＤＮＡアレイ、可溶化タンパク質については、二次元電気泳動（たとえば蛍光標識法２Ｄ−ＤＩＧＥ法など）および安定同位体標識（ｃＩＣＡＴ法やｉＴＲＡＱ法など）ＬＣ−ＭＳショットガン法（たとえば、ＭＡＬＤＩ−ＴＯＦ−ＴＯＦ、ＬＣ−ＥＳＩ／ＭＡＬＤＩ−ＱＱ−ＴＯＦ、トリプル四重極型ＬＣ／ＭＳ／ＭＳ、イオントラップ型その他ハイブリッド型ＬＣ／ＭＳ／ＭＳやＦＴ−ＭＡＳなど）を用いて、同時進行で並列的に異種解析の複数のディファレンシャルディスプレイを行うことができる（請求項４参照）。また、これらの解析の結果データに基づいて、プロテオミクスＤＢ１６やタンパク相互機能解析ソフトウェアにリンクさせて融合した解析アルゴリズムや、特定の組織器官に特異的に出現したタンパク質を自動分類するデータマイニングアルゴリズム（請求項６参照）により特異的なタンパク質分子の抽出、タンパク質機能解析および病態プロテオミクス解析が可能となる。
【００６９】
本実施の形態かかるデータマイニング処理の概略を説明する。従来、タンパク質レベルとｍＲＮＡレベルとの間では、検出された分子間でどのような相互関係にあるかを関連付けすることができなかった。しかしながら、図８に示すように、分子シグナルネットワークの枠組みに当てはめた場合、分子シグナルリンケージパスウエイが見えてくる。図８において、右側のタンパク質レベルの分子シグナルネットワークと、左側のｍＲＮＡレベルの分子シグナリングネットワークとを、重ね合わせてみると、中央の「タンパク質ａｎｄｍＲＮＡ」に示すように、これらを重ね合わせることで、類似性を見出すことができる。
【００７０】
図８に示す、タンパク質およびｍＲＮＡレベルで上昇する分子シグナルネットワークとは、病態組織・細胞サンプル中で、タンパク質、および、ｍＲＮＡの両方で上昇しているシグナルネットワークを抽出する手法である。たとえば、タンパク質とｍＲＮＡの発現が一致しなくとも、ｍＲＮＡが近未来的にタンパク質として発現すると仮定し、両者の活性化分子ネットワークを合流させることで、ある特定のシグナルキャスケードを抽出することができる。
【００７１】
このように、分子シグナルネットワークを得ることで、図８において、「Ａ」で示す最上流の分子や最下流の分子の抽出、治療や創薬などのターゲットとなるネットワークの情報も得られることになる。
【００７２】
その一方、第４のローカルＤＢ５６などに記憶された、２Ｄ−ＤＩＧＥなどの電気泳動像は、個々のタンパク質の特異的性質に位置づけられるが，これらは画像データであるため，他の数値データとの統合が難しいが，画像データと、プロテオミクスＤＢ１６、機能分類ＤＢ１８、ローカルＤＢの数値データとをリンクさせることによって、データを一元化することができる（請求項６参照）。たとえば、ローカルＤＢ５６に記憶された画像データ中、あるスポットの複数の座標（たとえば矩形を表す４つの座標）で画定される領域と、データベースの種別（たとえば、プロテオミクスＤＢ、機能分類ＤＢなど）や、当該データベース中の格納場所を示す情報とを、関連付けて記憶しておくことにより実現することができる。機能分類ＤＢ１８およびプロテオミクスＤＢ１６を使用することにより、図９に示すような疾患プロテオミクスデータの連携が可能となる。本例では、２Ｄ−ＤＩＧＥのプロファイル画像のスポットを選択すればスポットのタンパク質情報を国際データベースから検索して表示できる。上述したように、スポットの領域の座標と、国際データベースの情報との関連付けを示す情報を、ローカルＤＢ（たとえば、第４のローカルＤＢ５６）に記憶しておけば良い。
【００７３】
また、プロテオミクス解析システムにて獲得した、測定ＭＳデータや測定ｎａｎｏＬＣデータを、データマイニングシステム２２がヴィジュアルに表示する。このことによってタンパク質同定の確認の労力が大幅に改善できる。
【００７４】
図９について、追加的に説明する。プロテオミクス解析システムの表示装置に表示された２次元電気泳動によるプロファイル画像（２Ｄ−ＤＩＧＥや翻訳後修飾などの特殊染色や、抗体反応によるスポットを含む）の、あるタンパク質スポットを指定してクリックすると、そのタンパク質の名前や、各種国際ＤＢ（ＮＣＢＩ、ｓｗｉｓｓｓｐｌｏｔ、ｇｅｎｅｂａｎｋなど）のアクセッション番号やこれらのＤＢに直接リンクさせることができる。これは、上述したように、スポットの領域と、アクセッション番号などとを関連付けて、プロテオミクスＤＢ１６などに記憶しておくことで実現できる。また、ゲルから抽出して得られたペプチドの質量分析によるシグナルの生データ（Ｍ／Ｚやインテンシティ、ＭＳ／ＭＳ情報、翻訳後修飾、分子量、等電点、アミノ酸配列など）や、安定同位体を用いた差異解析の生データ、同じ材料を用いて２次元電気泳動以外の方法（ＬＣショットガンなど）から得られた差異解析の結果などをリンクさせる。さらには、より詳しい翻訳後修飾や立体構造や分子機能に細胞内局在などの情報、病態に関連する情報や、その分子の阻害・活性化剤などと関連する情報、その分子の抗体を使った細胞内局在の画像データベースや、その分子の異常による疾患の病態病理画像（ＭＲＩや組織切片の形態学的画像等）にもリンクでき、解析の材料となった組織や細胞に関するアトラス的要素を含んでいる。この情報を元に、この２次元電気泳動像をＰＶＤＦ膜などに転写した組織・細胞Ｎａｔｕｒａｌプロテインチップなどの開発に繋げることができる。
【００７５】
たとえば、図１９は、組織・細胞Ｎａｔｕｒａｌプロテインチップの補足説明する図である。この「組織・細胞Ｎａｔｕｒａｌプロテインチップ」は、本発明者らにより独自に命名したものである。二次元電気泳動による脳組織サンプル組織・細胞Ｎａｔｕｒａｌ
プロテインチップを用いた自己抗原の解析例である。組織・細胞を２次元電気泳動によって分離し、ＰＣＤＦ膜などのプローブに転写することによって、約１００００個ほどのタンパク質スポットが転写されたＮａｔｕｒａｌ
プロテインチップが作成できる。これに、患者の血清を反応させ、自己抗体が反応するスポットを図９で示すデータベース上から同定してくることができる。
【００７６】
図２０は、Ｎａｔｕｒａｌプロテインチップによる患者血清中の自己抗体反応性プロテインスポットのプロファイリングを示す図である。図１９に示す手法によって、作成されたＮａｔｕｒａｌプロテインチップを用いて同定された分子の例を示す。橋本脳症、多発性硬化症、筋萎縮性側索硬化症の患者血清からＮａｔｕｒａｌプロテインチップを用いて自己抗体ターゲットタンパク質の同定とプロファイリングを行った例。これによって、その患者の病態のプロファイリングが可能となる。これを小型化することによって、簡便なＮａｔｕｒａｌプロテインチップとして臨床検査などに供することができる。
【００７７】
また、本発明において、統合データベースが、複数の解析データを一元化し，本来の意味の網羅的解析を可能にする，これによって、単一装置の解析で検出できなかった，あるいは解釈できなかった微小データがクローズアップされ，再度検証する必要性が生じる可能性があるが，これを可能にするため，統合データベースで解析したデータを個々の解析ソフトウェアに戻し、再度解析を行うため処理アルゴリズムを提供する（請求項７参照）。
【００７８】
また、ある特定の腫瘍関連遺伝子産物の細胞内機能を解析することを特徴とするプロテオミクス解析法にあっては、ターゲットとする遺伝子が欠失，変異している特定の細胞のＤＮＡアレイ法や安定同位体標識法を用いた蛋白プロファイルを作成し、正常細胞とディファレンシャルディスプレイを行うが、変化しているタンパク質の定量解析を可能にするため多元データの定量的ディファレンシャルディスプレイを一元化するアルゴリズムを提供する。以下に述べるように、異なる機器（たとえば質量分析計）で測定すると、それぞれのシグナル情報が異なるパラメータで出てくる。そこで、これらを統一の言語に変換する作業（すぐなる強度のインターナルコントロールを用いた絶対定量化、ペプチド分子量（Ｍ／Ｚ）の表記の統一化、同定分子のアクセッションの統一化などによって一元化を図る。
【００７９】
複数台の質量分析計（たとえば、図２に示す第１の質量分析計３０〜第３の質量分析計３４）から同定されるタンパク質は、装置の感度や生データ（ＲＡＷデータ）による条件設定パラメータ（スレッシュホールド設定や公共データベース設定など）によってそれぞれの質量分析結果から同定されるタンパク質は完全に一致はしないのが一般的である。
【００８０】
図７は、本実施の形態にかかる第１の質量分析計３０〜第３の質量分析計３４のそれぞれから得られたタンパク質を分類したベン図である。質量分析計２つ以上に属するタンパク質Ｐ＋は陽性タンパク質として分類し、インテンシティとペアで機能分類ＤＢに保存される。
【００８１】
図７において、たとえば、ｃＩＣＡＴ（同位体標識法１）と、ＭＡＬＤＩ−ＴＯＦ−ＴＯＦ（質量分析計１）との組み合わせで行った場合、ｃＩＣＡＴ（同位体標識法１）とＥＳＩ−ＱＱ−ＴＯＦ（質量分析計２）の組み合わせで行った場合、さらには、ｉＴＲＡＱ(同位体標識法２)とＥＳＩ−ＱＱＱ(質量分析計３)の組み合わせで行った場合を用いて、全く同じサンプルのディファレンシャルディスプレイ（たとえば、癌組織と正常の比較において癌組織で特異的に上昇する分子群）のデータを統合マイニングしている。このような場合に、それぞれの解析法で解析可能な分子種に得意不得意があるため、図７のようにすべての方法論で共通して同定される同一の分子、２つの組み合わせのみで共通して同定される分子、一つの方法論で特異的に同定される分子（これには同定の際の擬陽性も含まれる場合が多い）群が存在する。これら分子群において、最も信頼性がある分子群はすべての方法論で共通に同定された分子群であり、その次に信頼性があるのは２つ以上の方法論で共通して同定された分子群である。一つの方法論のみで同定されたものについては、もう一度質量分析の生データ（ＲＡＷデータ）に帰って、その信頼性を確認する必要があるが、明かな陽性所見も含まれる。つまり、これらの方法論を組み合わせてのすべてを統合することで、はじめてすべての分子群が網羅される。
【００８２】
質量分析計１台のみでしか同定できなかったタンパク質は、偽陽性タンパク質Ｐ＃も含まれているため、偽陽性タンパク質Ｐ＃のようなケースは、解析ソフトウェアの条件設定パラメータを調整して陽性かどうか再度検索する必要がある。その手順を、図１０の処理フローにて説明する。
【００８３】
図１０は、機能分類データベースにある同定タンパク質の分類に際して行ったデータ処理が正しいものか遡って確認するためのアルゴリズムを示している。
【００８４】
図１０の例では、同定したタンパク質を、データマイニングを行いクラスター分類し、マイニング結果判定が判定基準以下のとき、本実施の形態にかかるリターンマッチングマイニングが行えるようにする。データマイニングにより判定基準が満足されるケースがあれば、機能分類ＤＢ１８にプロファイリングする。また、再検索にあたって生データのレベル（ＲＡＷレベル）のデータを獲得した場合は、ローカルＤＢやプロテオミクスＤＢ１６にも追加格納する。なお、リターンマッチングマイニングについては後述する。
【００８５】
図１０の例について、より詳細に説明する。図１に示すデータマイニングシステム２２は、各質量分析計等から導出されたタンパク質情報から可能なかぎり意味のある結果を、マイニング手法をもって導出するが、意味のある結果が無いか少ない場合、結論を導き出した経過のフィルタパラメータ情報の調整を行い、再度データマイニングを行う。図１０（リターンマッチングマイニングアルゴリズム）は、この再度行う過程をフローによって示している。
【００８６】
フロー中のボックス１「同定したタンパク質の確認判定」は、再度データマイニングを行うようにデータマイニングシステム２２に対して、オペレータが入力装置を操作して指示を与えたときに入るアルゴリズムエントリー部である。
【００８７】
フロー中のボックス２「同定した質量分析計の設定条件を変え、タンパク質を再検索」では、図２に示す質量分析計３０〜３４に接続された制御・解析部４０〜４４が、スレッシュホールド設定、公共データベース設定など入力パラメータの条件を、以前設定した内容から変更して、タンパク質を再検索する。スレッシュホールド値を変更することによって、ピークリストの内容がかわり、以前では発見できなかったタンパク質が同定できる。また、ある国際ＤＢ（たとえば、公共データベースＡ）には、ピークリストに関連する情報が無いために発見できなかったタンパク質が、他の国際ＤＢ（たとえば、公共データベースＢ）には登録されていてこれを使用することで解決することがある。
【００８８】
フロー中のボックス３「タンパク質は他の質量分析計で同定されたものに最も多く合致するまでマイニング」するステップにおいては、図２に示す３つの質量分析計３０〜３４にて個々に解析して出力されたタンパク質のトータルがマキシマムになるように、設定パラメータチューニングを行い、タンパク質情報を導出する。また、このステップでは、偽陽性タンパク質の検出も可能である。
【００８９】
フロー中のボックス４「最適タンパク質同定ができればローカルＤＢにレコード」するステップにおいては、再検索したスレッシュホールド設定、公共データベース設定など入力パラメータの条件とともに、解析結果を、測定や解析を実行した質量分析計および制御・解析部に関連するローカルＤＢに格納する。
【００９０】
フロー中のボックス５「プロテオミクスＤＢにおいてレコード先を追加する」ステップにおいては、ローカルＤＢに格納した解析結果と設定パラメータが、プロテオミクスＤＢにおいて参照できるように必要な処理が実行される。
【００９１】
フロー中のボックス６「機能分類ＤＢに再同定した結果をプロファイルする」ステップにおいては、リターンマッチングマイニングした結果、意味のある機能解析結果が導出できた場合、機能分類ＤＢ１８にプロファイルしている。
【００９２】
機能分類ＤＢ１８には、初期検索時にプロファイルした各種データの他にリターンマッチングアルゴリズムを走らせたときに得たＲＡＷデータや解析データもプロファイリングされていく。
【００９３】
リターンマッチングマイニングアルゴリズムについて、さらに、図２２、図２３を参照して補足的に説明する。同定したタンパク質結果が思うように出てこない場合に、結論を導き出すために使用した公共データベースの内容や、データフィルタリングに使用した閾値が最適値でなかったために生じたのではないかと判断するケースがある。図１０に示すリターンマッチングアルゴリズムは、図２２のレベル３まで戻って、タンパク質の再検索を行った場合の処理フローである。再検索で得たプロテオミクス結果は、図３４に示すような構造体のトラッキングテーブルに格納される（つまり、ＤＢに記憶される）。同一階層に複数個登録されていれば、登録日時の新しいものが優先されるが、過去の結果も削除しない限り使用できる。
【００９４】
バックトラッキングは、図２３のトラッキングテーブルに基づいて実現することができる。なお、図２２は、プロテオミクス結果を得るまでのデータの流れを示している。実験や解析を試行錯誤で行う場合に、どこまで遡って行う必要があるかという要求に対して対応できるようにデータを管理する。本実施の形態では、レベルを、たとえば、４段階に分類し、レベル別にデータを管理するトラッキングテーブルを作成する。
【００９５】
タンパク質発現情報を用いて分子間ネットワークによる解析する場合、タンパク質のインテンシティの扱いに注意を要する。
【００９６】
質量分析結果は、３つのグループのタンパク質を同定するが共通領域（図１１のベン図における領域Ａ）に含まれるタンパク質が同じインテンシティを持てば問題ないが、図１２の下に示す表のように異なる場合、補正式を使用して何らかのノーマライズ処理が必要となる。
【００９７】
図１１および図１２について、説明する。個々の質量分析計で解析した結果、リファレンスに対するインテンシティは、絶対量でないため比較のためのノーマライズ処理が必要である。図９は、第１の質量分析計１（Ｍｇ１）、第２の質量分析計（Ｍｇ２）、第３の質量分析計（Ｍｇ３）が同じ病態サンプルからタンパク質を同定した結果、共通のタンパク質「Ｐｒｏｔｅｉｎ１」、「Ｐｒｏｔｅｉｎ２」、「Ｐｒｏｔｅｉｎ３」を得たときのノーマライズ処理計算を示している。質量分析計１で求めた「Ｐｒｏｔｅｉｎ１」、「Ｐｒｏｔｅｉｎ２」、「Ｐｒｏｔｅｉｎ３」のインテンシティの和をとってインテンシティトータル（Ｍｇ１＿ＩＴ）とする。同様に他の２台のインテンシティトータル「Ｍｇ２＿ＩＴ」、「Ｍｇ３＿ＩＴ」を求め、その算術平均値をとった式が、図１１に示すノーマライズ用補正式である。この式で求まったノーマライズ補正係数ＮＩは、３つのタンパク質にて求めたので１タンパク質単位では、α＝ＮＩ／３がノーマライズ補正係数となる。この係数αで導出したタンパク質のインテンシティを割ることによって発見したタンパク質の全体が比較できる。
【００９８】
同定タンパク質のインテンシティはノーマライズ係数ＮＩで除算され統一される。そのタンパク質ＩＤとインテンシティをインテンシティインターバルでグルーピングして分子シグナルリンケージ解析ソフトウェア（たとえば、Ｋｅｙｍｏｌｎｅｔ）にインポートすれば、図８に示す分子シグナルリンケージのタンパク質レベルネットワークが構築される。図８において、○で示す分子は、ある病態にある組織細胞を「ｐｒｏｔｅｏｍｉｃｓ」タンパク質レベル、または、「ｔｒａｎｓｃｒｉｐｔｏｍｅｍＲＮＡ」レベルによるディファレンシャルディスプレイ解析にて特異的に上昇、あるいは、減少、あるいは、翻訳後を修飾を受けるものとして検出された分子群で、ネットワーク解析によって相互リンクするものを矢印で示している。
【００９９】
また、ゲノミクス・トランスクリプトームレベルで獲得したｍＲＮＡもプロテオミクスの時と同様にインテンシティのノーマライズを行い、ｍＲＮＡレベルの分子シグナルリンケージ解析ソフトウェアにインポートすれば、図８に示すｍＲＮＡレベルネットワークが構築される。
【０１００】
また，本実施の形態にかかるプロテオミクス解析システムは，異種解析装置から出力されるデータを統合して一元化処理し、網羅的解析に供することができる。したがって、新たな解析装置が開発され、或いは、新たな解析手法が開発された場合でも、出力されたデータを受け入れ、これを統合データベースに組み込むことが可能となる。
【０１０１】
本発明においては、以下のような６つの段階を経ることで、本発明を用いて知得した情報を臨床データとして適用している。
（１）質量分析計により取得したタンパク質のデータや、二次元電気泳動など他の手法を用いて取得したタンパク質データを一元化して、データベースに格納すること。
（２）格納されたデータを可視化することで画像解析を容易とすること。
（３）上記（１）、（２）のデータ（プロテオノミクスデータ）と、ＤＮＡアレイのデータとをマージすること。
（４）上記データやその可視化した画像に基づいて、重要シグナル、分子群を抽出すること。
（５）上記（１）〜（４）に基づいてプロテインチップを作製し検証すること。
（６）検証結果に基づいて、臨床データとして適用すること。
【０１０２】
上記項目（１）は、図４、５，７，１０，１１，１２，１３，１５，２１，２２および２３を参照して説明した事項に関連する。また、項目（２）〜（４）は、それぞれ、図４，８，１３，１４，２１，２２および２３を参照して説明した事項、図６，８，１３，１６，１７，２１，２２および２３を参照して説明した事項、並びに、図８，１３，１７，１８，２１，２２および２３を参照して説明した事項に関連する。また、項目（５）のプロテインチップについては、図４，９，１４，１８，１９，２１，２２および２３を参照して説明した事項に関連する。
【０１０３】
以下、項目（１）、（３）について補足的に説明する。
【０１０４】
上述したように、同じタンパク質を質量分析器で分析した場合であっても、装置によってそのデータ値は異なるのが一般的である。図２４（ａ）、（ｂ）は、あるタンパク質を、異なる２つの質量分析器で測定した結果を示す図である。この質量分析器による測定結果のデータは、ＤＢ（たとえば、図２に示す第１のローカルＤＢ５０など）に格納されている。図２４（ａ）、（ｂ）の例では、比（Ｉｎｔｅｎｓｉｔｙ比）が２つあるものとしたが、これに限定されず、比は３つ以上存在する場合もある。
【０１０５】
比は、通常、安定同位体修飾試薬（ＩＣＡＴ、ＩＴＲＡＱ）を用いて、複数の比較したいサンプルを混合して解析し、得られた同定ペプチドのＩｎｔｅｎｓｉｔｙ比をタンパク質レベルで統合して平均したものを、タンパク質の「ａｃｃｅｓｓｉｏｎＮｏ」で標記する。上記「ａｃｃｅｓｓｉｏｎＮｏ」は、「ｓｗｉｓｓｐｌｏｔ−国際タンパク質データベース」に基づくものである。図２５は、図２４（ａ）、（ｂ）に示すデータを、図２６に示すデータ統合処理により統合して得たデータの例を示す図であり、図２６は、データ統合処理の一例を示すフローチャートである。
【０１０６】
図２６に示すように、データ統合処理においては、統合解析システム２０が、ローカルＤＢに記憶された、図２４（ａ）、（ｂ）に示すようなデータを読み込む（ステップ２６０１）。以下、Ｍ１［ｉ］を、質量分析計２による測定結果を記憶したローカルＤＢ中の第ｉ行目のデータレコード、Ｍ２［ｉ］を、質量分析計２による測定結果を記憶したローカルＤＢ中の第ｉ行目のデータレコードとする。また、Ｍｐ［ｉ］．ａｃｃｅｓｓｉｏｎを、第ｉ行のデータレコードにおける「ＡｃｃｅｓｓｉｏｎＮｏ」、Ｍｐ［ｉ］．ｒａｔｉｏｎ１を、第ｉ行のデータレコードにおける「ｒａｔｉｏ１」、Ｍｐ［ｉ］．ｒａｔｉｏｎ２を、第ｉ行のデータレコードにおける「ｒａｔｉｏ２」とする。この例では、ｐ＝１または２である。
【０１０７】
次いで、ループにおけるパラメータが初期化され、終了条件が設定される（ステップ２６０２〜ステップ２６０６）。パラメータｊがＭ２の配列数、つまり、質量分析計２による測定結果のレコード数を超えない限り（ステップ２６０７でノー(No)）、質量分析計１および質量分析計２に比の平均を求める。ここでは、１つのレコードには比として、「Ｒａｔｉｏ１」および「Ｒａｔｉｏ２」が存在するため、２つの比の平均
（Ｍ１［ｉ］．ｒａｔｉｏ１＋Ｍ２［ｊ］．ｒａｔｉｏ１）／２
（Ｍ１［ｉ］．ｒａｔｉｏ２＋Ｍ２［ｊ］．ｒａｔｉｏ２）／２
が算出される（ステップ２６０９）。
【０１０８】
この算出された平均Ｒ［ｋ］．ｒａｔｉｏ１およびＲ［ｋ］．ｒａｔｉｏ２には、アクセッションＲ［ｋ］．ａｃｃｅｓｓｉｏｎとして、Ｍ１［ｉ］．ａｃｃｅｓｓｉｏｎが与えられる（ステップ２６０８参照）。
【０１０９】
このようにして得られたＲ［ｋ］．ａｃｃｅｓｓｉｏｎ、Ｒ［ｋ］．ｒａｔｉｏ１およびＲ［ｋ］．ｒａｔｉｏ２が、統合化されたレコードとして、データベース（たとえば、プロテオミクスＤＢ１６）に格納される。これにより、図２５に示すように、たとえば、（ＡｃｃｅｓｓｉｏｎＮｏ＝Ｐ１０８０９、Ｐ１１１４２、Ｐ６１２４７）について、「Ｉｎｔｅｎｓｉｔｙ比」が平均化されたようなデータを得ることができる。
【０１１０】
ＤＮＡアレイとタンパク質についても、同様な統合化が可能である。ＤＮＡアレイにはそれぞれのアレイ特有の「ＡｃｃｅｓｓｉｏｎＮｏ」が付与されている。本実施の形態では、これをタンパク質の「ＡｃｃｅｓｓｉｏｎＮｏ」と統合化させる。タンパク質のデータと、ＤＮＡアレイのデータからの抽出およびノーマライズは以下の手法により実現される。
【０１１１】
図２７（ａ）は、図２４（ａ）、（ｂ）に示すタンパク質のデータに、図２６に示す統合化処理を施した結果を示す図であり、図２５と同様である。また、図２７（ｂ）は、ローカルＤＢ（たとえば、第６のローカルＤＢ８２）に記憶された、あるＤＮＡアレイのデータを示す図である。また、図２９は、図２７（ａ）、（ｂ）に示すようなデータを統合する処理の例を示すフローチャートである。図２８は、データ統合処理による処理結果を示す図である。
【０１１２】
図２９に示すように、統合解析システム２０は、タンパク質についてのデータレコードと、ＤＮＡアレイについてのデータレコードを、それぞれＤＢから読み出す（ステップ２９０１）。統合解析システム２０は、同一の「ＡｃｃｅｓｓｉｏｎＮｏ」のレコードを抽出して（ステップ２９０２）、その「Ｉｎｔｅｎｓｉｔｙ比」をノーマライズする。ノーマライズは、以下のように実現される。
【０１１３】
活性化分子群：統合解析システム２０は、「Ｉｎｔｅｎｓｉｔｙ比」として得られた値を比較して（ステップ２９０３、２９０４）、タンパク質およびＤＮＡアレイの双方で「１」よりも大きい場合には、双方の値を平均化し（ステップ２９０５）、平均値を当該「ＡｃｃｅｓｓｉｏｎＮｏ」に関するレコードの統合化された比として、ＤＢ（たとえば、プロテオミクスＤＢ１６）に記憶する。比較の結果、タンパク質に関する値のみが「１」より大きい場合には、統合解析システム２０は、タンパク質の値を採用し、これを統合化された比としてＤＢに記憶する（ステップ２９０６）。その一方、ＤＮＡアレイの値のみが「１」より大きい場合には、統合解析システム２０は、ＤＮＡアレイの値を採用し、これを統合化された比としてＤＢに記憶する（ステップ２９０７）。
【０１１４】
不活性分子群：統合解析システム２０は、「Ｉｎｔｅｎｓｉｔｙ比」として得られた値を比較して（ステップ２９０８、２９０９）、タンパク質およびＤＮＡアレイの双方で「１」よりも小さい場合には、双方の値を平均化し（ステップ２９１０）、平均値を当該「ＡｃｃｅｓｓｉｏｎＮｏ」に関するレコードの統合化された比として、ＤＢに記憶する。比較の結果、タンパク質に関する値のみが「１」より小さい場合には、統合解析システム２０は、タンパク質の値を採用し、これを統合化された比としてＤＢに記憶する（ステップ２９１１）。その一方、ＤＮＡアレイの値のみが「１」より小さい場合には、統合解析システム２０は、ＤＮＡアレイの値を採用し、これを統合化された比としてＤＢに記憶する（ステップ２９１２）。
【０１１５】
このようにして、同一の「ＡｃｃｅｓｓｉｏｎＮｏ」が付されたタンパク質のデータおよびＤＮＡアレイのデータについて、「Ｉｎｔｅｎｓｉｔｙ比」を統合化して、これをＤＢに格納しておくことができる。図８や図１７では、ｍＲＮＡレベルの分子の発現変化とタンパク質レベルでの発現変化について、それぞれ、シグナルリンケージを解析してこれをマージしている。上述したノーマライズを適用することにより、タンパク質のデータおよびＤＮＡアレイのデータのマージを自動化することが可能となる。
【０１１６】
図３０に示すように、統合解析システム２０（或いは、制御・解析部４６であっても良い。以下同様）が、第４のローカルＤＢ５６などに記憶された、２Ｄ−ＤＩＧＥによるデータに基づくスポットリストを生成し（ステップ３００１）、ＤＢ（たとえば、国際ＤＢ２４）に格納された既知のスポット情報とマッチングする（ステップ３００２）。既知のスポット情報として、たとえば、ＳｗｉｓｓＰｌｏｔによる標準的なデータを利用することができる。次いで、統合解析システム２０は、タンパク質のスポットが既知であるか否か、つまり、参照スポットとマッチしたか否かを判断する（ステップ３００３）。スポットは、２次元電気泳動で分離された多数の個別のタンパク質であり、既知のスポット情報には、当該スポットの泳動パターンから得た等電点、分子量およびＩｎｔｅｎｓｉｔｙ（タンパク質量）が含まれる。したがって、スポットがマッチしたということは、等電点と分子量によって決定される２次元電気泳動の移動度が一致したことを意味している。
【０１１７】
ステップ３００３でイエス(Yes)と判断された場合、参照スポットのタンパク質の名前や登録番号がわかれば、ＳｗｉｓｓＰｌｏｔを利用して、その情報が取得される（ステップ３００４）。取得された情報は、たとえば、プロテオミクスＤＢ１６に格納することができる。
【０１１８】
その一方、タンパク質スポットが既知ではなかった場合（ステップ３００３でノー(No)）
には、質量分析計による分析を行い、そのデータを取得する（ステップ３００５〜ステップ３００７）。質量分析によって得られたデータのそれぞれは、タンパク質をトリプシンで分解して得た複数のペプチドの質量を測定した値であり、そのペプチドの質量の情報から、ペプチドのアミノ酸シークエンスが推測される。統合解析システム２０は、複数のペプチドのアミノ酸シークエンスを組み合わせて、国際ＤＢ２４を検索してタンパク質を同定する（ステップ３００８）。
【０１１９】
質量分析計の個性により、それぞれのペプチドのアミノ酸までの同定ができないものがある。そこで、複数の質量分析計で測定して、測定結果を統合し、タンパク質同定を有利に行うことに意義がある。この際に、ペプチドレベルでデータを一元化して最終データを得るのと、タンパク質レベルでデータを得る方法があるが、本実施の形態では、ペプチドレベルでデータを一元化することで、最終タンパク質の同定を有効に行っている。
【０１２０】
図８や図１７では、ｍＲＮＡレベルの分子の発現変化とタンパク質レベルでの発現変化について、それぞれ、シグナルリンケージを求め、求められたシグナルリンケージを解析してこれをマージした例を示している。これについて、図３１を参照して補足する。まず、正常組織と病態組織のｍＲＮＡを取り出し、ＤＮＡアレイを用いて、ｍＲＮＡの発現レベルを取得する（ステップ３１０１）。このｍＲＮＡの発現レベルのデータ（たとえば、スポットのＩｎｔｅｎｓｉｔｙ）は、第６のローカルＤＢ８２に格納される。
【０１２１】
ＤＮＡアレイから得られた元データは、固有のＡｃｃｅｓｓｉｏｎＮｏで分子名が表示されており、したがって、プロテオミクスＤＢ１６のデータとマージするためには、ＳｗｉｓｓＰｒｏｔなどの国際ＤＢのＡｃｃｓｅｓｓｉｏｎＮｏに変換する必要がある。統合解析システム２０は、ＤＮＡアレイから得られた個々の分子のｍＲＮＡの発現レベルと、それぞれの分子の固有のＡｃｃｅｓｓｉｏｎＮｏを、ＳｗｉｓｓＰｒｏｔのような国際ＤＢのＡｃｃｅｓｓｉｏｎＮｏに変更したものとを含むリストを生成する（ステップ３１０２）。
【０１２２】
また、統合解析システム２０は、ゲノム分子シグナルネットワークのタンパク質ノードに、発現したタンパク質レベルを入力する（ステップ３１０３）。
【０１２３】
その一方、タンパク質についても、正常組織と病態組織の発現レベルをＭＳレベルから導出し（ステップ３１０４）、ＭＳやＭＳ／ＭＳを用いて、たとえば、Ｍａｓｃｏｔサーチにより、タンパク質を検索してその情報を取得する（ステップ３１０５）。取得されたタンパク質の情報は、たとえば、第１のローカルＤＢ５０などに格納され得る。統合解析システム２０は、ＤＢに格納されたタンパク質の情報を取り出して、プロテオミクス用シグナルネットワークのタンパク質ノードに、発現したタンパク質レベルを入力する（ステップ３１０６）。このようにして、ｍＲＮＡの発現レベルに基づくシグナルネットワーク、および、タンパク質の発現レベルに基づくシグナルネットワークを得ることができる。
【０１２４】
統合解析システム２０は、シグナルネットワークを重ね合わせる（ステップ３１０７）。ここで、統合解析システム２０は、図２９に示す処理を実行して、ｍＲＮＡレベルの分子の発現変化およびタンパク質レベルでの発現変化をマージすることができる。つまり、対応するＡｃｃｅｓｓｉｏｎＮｏのＩｎｔｅｎｓｉｔｙ比を参照して、ノーマライズすることでマージし、マージした新たな値（ノーマライズされたＩｎｔｅｎｓｉｔｙ比）をＤＢ（たとえばプロテオミクスＤＢ１６）に格納することができる。
【０１２５】
次に、上述した項目（２）格納されたデータを可視化することで画像解析を容易とすること、および、（４）上記データやその可視化した画像に基づいて、重要シグナル、分子群を抽出することについて補足的に説明する。図３２（ａ）は、２Ｄ−ＤＩＧＥの画像から得られ、ＤＢ（たとえば、第4のローカルＤＢ５６）に格納されたタンパク質の情報の例を示す図である。図３２（ａ）の例では、Ｐｒｏｔｅｉｎ１−＊は、正常なＤＩＧＥから得たタンパク質（スポット）をそれぞれ表し、Ｐｒｏｔｅｉｎ２−＊は、病態のＤＩＧＥから得たタンパク質（スポット）をそれぞれ表している。また、図３２（ａ）において、「Ｍｒ」は分子量、「ｐｌ」は等電点、「Ｄ」は濃度である。データマイニングに先立って、統合解析システムは、ＤＢに格納されたタンパク質データを参照して、それぞれのタンパク質の間のユークリッド尺度を算出する。ユークリッド尺度Ｕは、たとえば、以下の式にしたがって求められる。
【０１２６】
Ｕ＝｛（Ｍｒ_ｉ−Ｍｒ_ｊ）^２＋（ｐｌ_ｉ−ｐｌ_ｊ）^２＋（Ｄ_ｉ−Ｄ_ｊ）^２｝^１／２
図３２（ｂ）は、求められたユークリッド尺度を示す距離テーブルである。
【０１２７】
データマイニングに際して、統合解析システム２０は、たとえば、以下の処理を実行して、特異なタンパク質を見出す。
（１）距離テーブルの横第１列に着目して、距離が最小となるペアを探す。図３２（ｂ）の例では、「Ｐｒｏｔｅｉｎ１−１」との距離が最小となる（最も距離が近い）プロテインが見出される。たとえば、「Ｐｒｏｔｅｉ１−１」と「Ｐｒｏｔｅｉｎ２−１」との間が最小値となれば、（Ｐｒｏｔｅｉ１−１，Ｐｒｏｔｅｉｎ２−１）というペアが作られ、ペアのユークリッド尺度（ここでは尺度の小さいほうを採用する）が決定される。
（２）次いで、距離テーブルの横第２列に着目して、距離が最小となるペアを探す。たとえば、「Ｐｒｏｔｅｉｎ１−２」と「Ｐｒｏｔｅｉｎ２−２」との間が最小値となれば、（Ｐｒｏｔｅｉｎ１−２，Ｐｒｏｔｅｉｎ２−２）というペアができ、そのペアのユークリッド尺度が決定される。
（３）このような処理を繰り返して、最後の行まで進むことにより、全てのペアおよび当該ペアの尺度が決定される。
（４）上述した処理により決定されたペアは、横列での比較であるため、他のタンパク質と最小のペアになっているとは限らない。そこで、たとえば、（１）における（Ｐｒｏｔｅｉｎ１−１，Ｐｒｏｔｅｉｎ２−１）について、その一方と、その他の「Ｐｒｏｔｅｉｎ＊−＊」との間のユークリッド尺度を比較して、その他の「Ｐｒｏｔｅｉｎ＊−＊」の中から、ユークリッド尺度が最小となる「Ｐｒｏｔｅｉｎｘ−ｘ」を検索する。
【０１２８】
検索された３番目の「Ｐｒｏｔｅｉｎｘ−ｘ」を含むペアよりも、（Ｐｒｏｔｅｉｎ１−１，Ｐｒｏｔｅｉｎ２−１）のペアのほうが、そのユークリッド尺度が小さければ、（Ｐｒｏｔｅｉｎ１−１，Ｐｒｏｔｅｉｎ２−１，Ｐｒｏｔｅｉｎｘ−ｘ）を新たにグループ化し、グループ数３とする。このグループ化により、「Ｐｒｏｔｅｉｎｘ−ｘ」と対を成していたタンパク質は、「Ｐｒｏｔｅｉｎｘ−ｘ」とのペアを解消され、孤立する。
【０１２９】
このようにして、デンドログラム（樹状図）の生成に類した処理により、グループ数２或いは３となるグループ化を繰り返すことにより、どのペア或いはグループにも属さないタンパク質が見出される。
【０１３０】
図３３は、上記特異タンパク質の抽出を概略的に示した図である。たとえば、正常組織の２Ｄ−ＤＩＧＥ画像には、２つのタンパク質「Ｐｒｏｔｅｉｎ１−１」、「Ｐｒｏｔｅｉｎ１−２」のスポットが存在し、病態組織の２Ｄ−ＤＩＧＥ画像には、３つのタンパク質「Ｐｒｏｔｅｉｎ２−１」〜「Ｐｒｏｔｅｉｎ２−３」のスポットが存在すると考える。これらのスポットの情報は、ＤＢに格納されている。統合解析システム２０の処理によって、デンドログラムに示すように、（Ｐｒｏｔｅｉｎ１−１，Ｐｒｏｔｅｉｎ２−１）というグループ数２のペア、および、（Ｐｒｏｔｅｉｎ１−２，Ｐｒｏｔｅｉｎ２−２）というグループ数２のペアが生成される一方、「Ｐｒｏｔｅｉｎ２−３」がペアないしグループにも属さないと判断すると、統合解析システム２０は、「Ｐｒｏｔｅｉｎ２−３」が特異タンパク質であると判断し、その情報を、ＤＢ（たとえば、プロテオミクスＤＢ１６）に格納する。
【０１３１】
さらに、統合解析システム２０は、ＤＢに格納されている既知のスポット情報を参照して、位置のスポットの位置および濃度と、特異タンパク質と判断されたタンパク質の位置および濃度とを比較して、一致すれば、その特異タンパク質が同定される。これにより、同定されたタンパク質の情報を、ＤＢに追加することができる。
【０１３２】
さらに本発明は、プロテインチップ、並びにそれを用いた病態の進行状況の診断方法や薬剤感受性の判定方法に関する。
【０１３３】
本発明の解析は、図１３に示すようなプロトコールに従って、４段階のステップで行っている。まず、病態サンプルとして脳腫瘍（glioma:AOG）の例を示すが、腫瘍組織を外科的手術によって切除したのち、病理学的検査を行い、AOGと認められるものに関して、1p,
19q LOHの有無（抗癌剤感受性・非感受性）による分類を行う。もし、正常な組織が腫瘍サンプルの近隣から切除されている場合は、これをコントロールとして分類する。これらのサンプルに関して、２種類のプロテオミクスによる解析、及び同一のサンプルを用いたDNAチップによる解析を行う。プロテオーム解析の方法論として、2次元電気泳動法による2D-DIGE法、電気泳動を用いないLC-MASSによるcICAT法およびiTRAQ法を同時進行で行って、蛋白質レベルで差異のあった分子群を質量分析解析によって同定する。又、同時に、DNAチップで得られたmRNAレベルのデータをそれぞれ比較し、これら得られたすべてのデータを統合し、分子解析ソフトを用いてネットワーク解析に供す。また、すべてのデータをデータベース化する。これらの統合データから分子クラスター解析、ネットワーク解析を含めた種々の機能解析を行い、最も重要である分子群を抽出して検証した後、臨床マーカー、治療、予防、創薬開発などへの応用へ繋げていく。本ストラテジーにおいて、抽出された分子群で特に特徴的な蛋白質群、およびリン酸化のような翻訳後修飾構造に対する抗体をカクテル化し、以下に示す独自に開発したnatural
protein chipを用いてプロファイリングをおこなった。
【０１３４】
本発明によれば、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップが提供される。本発明の上記プロテインチップは、生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られることを特徴とするものである。ここで言う微小サイズとは、１０cm×１０cm以下のサイズを有するものが好ましく、例えば５cm×５cm程度のものを挙げることができる。本発明のプロテインチップは、上記したような微小サイズのチップ上に、生体組織又は細胞内で合成された全蛋白質が網羅されていることを特徴とする。等電点電気泳動及びSDS-ポリアクリルアミド電気泳動の条件は、上記したように生体組織又は細胞内で合成された全蛋白質が微小なチップ上に網羅される限りは、特に限定されるものではないが、以下の実施例に記載されている条件又はそれに準ずる条件を当業者であれば適宜採用することができる。
【０１３５】
また、本発明のプロテインチップは、二次元電気泳動後のゲルをそのまま用いてもよいが、好ましくは、ゲル中の蛋白質試料をメンブレンに転写して固相化したものを使用することが好ましい。ここで用いるメンブレンの種類は特に限定されず、PVDFメンブレンなどを用いることができる。本発明では、特に低蛍光性、タンパク質低吸着性で、高分解能を有するものを用いることが好ましい。
【０１３６】
また、本発明のプロテインチップにおいては、生体組織又は細胞から抽出した蛋白質は、CyDye (Cy 5等)等の蛍光色素で標識されている。従って、この蛍光色素に由来する蛍光を検出することによって、プロテインチップ上の蛋白質を、プロテインチップ上における蛋白質スポット情報として画像化することが可能である。
【０１３７】
さらに、本発明においては、本明細書中上記した本発明によるプロテオミクス解析方法によって得られた分子情報から病態の進行状況又は薬剤感受性のモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用意することができる。次いで、本明細書中上記したプロテインチップに上記抗体カクテルを接触させ、プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化することができる。これにより、病態の進行状況又は薬剤感受性をモニタリングすることが可能になる。
【０１３８】
本発明の一例としては、抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、抗ubiqutine
activating wnzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも２種類以上の抗体を含む抗体カクテルを用いて、脳腫瘍患者の生体組織又は細胞から抽出した蛋白質を固定化した微小サイズのプロテインチップに上記抗体カクテルを接触させて、プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化することができる。これにより、脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングすることが可能である。
【実施例】
【０１３９】
本発明者らは、鋭意研究の結果、下記の手段により新規解析法の実証実験を行い、上記課題を解決し、目的を達成することを見出した。すなわち、本発明では、生体組織や細胞から抽出したタンパク質をそのまま微小二次元電気泳動（２Ｄ）に供与して非常に小さなプロテイン２Ｄマップを作成することを特徴とし、これを電気的にプローブに転写して固相化することによって組織細胞内で合成されたすべてのタンパク質を網羅した生体組織タンパクチップを提供する。
【０１４０】
また、生体組織タンパクチップを用いて、抗体や、生体タンパク質や合成ペプチドや薬剤などの結合する分子を簡便に探索することを可能とする。
【０１４１】
さらに、生体組織タンパクチップを用いて、一連の結果を得た後に、もう一度生体内で再現性を確認することなしに、翻訳後修飾や、細胞内タンパク質の分解産物などの相互作用機能を再現することを可能とすることを特徴とする。
【０１４２】
一般に、タンパクチップに要求される相互作用の再現性の精度が増加すればするほど、細胞内タンパク質の分解産物の相互作用の再現は重要であり、本発明は上述の事情に基づいてなされたもので、その目的は人工的に合成されたタンパクチップを完全に生体組織タンパクチップに置き換えるばかりでなく、プロテオミクスを利用した病態研究、即ちゲノム研究に対応したタンパク質レベルでの細胞組織の網羅的研究に優れた方法を提供することを特徴とする。
【０１４３】
本実証実験では、自己免疫性疾患を伴う原因不明の脳炎患者血清中に含まれる自己抗体の抗原タンパク質を検索する目的で、正常ヒト脳組織可溶化タンパク質のプロテオームマップの作成と、同時にそのタンパク質の一部を二次元電気泳動後、ＰＶＤＦ膜に転写することを特徴とし、請求項１記載の、生体組織タンパクチップを作成し、患者血清による免疫ブロッティングによって、血清に含まれる自己抗体に反応性のターゲットタンパク質のスクリーニング、同定を行った。
【０１４４】
本実証実験において、今日までに発見されている自己抗体ターゲットタンパク質以外に、少なくとも７個のターゲットが検出された。
【０１４５】
具体的には、自己免疫性疾患を伴う原因不明の脳炎は、中枢神経の炎症性脱髄を特徴とする多発性硬化症（ｍｕｌｔｉｐｌｅｓｃｌｅｒｏｓｉｓ、ＭＳ）を代表として、種々の報告があり、その自己免疫性と病態発症メカニズムの関連性が注目されているのにも関わらず、その患者自己抗体と神経系組織細胞の抗原となりうるターゲットタンパク質の網羅的解析は一般的ではない。本実験では、正常ヒト大脳組織可溶化タンパク質のプロテオームマップの作成と並行して同時にそのタンパク質の一部を二次元電気泳動後ＰＶＤＦ膜に転写し、ヒト自己抗体を含む患者血清による免疫ブロッティングによって自己抗体に反応性のターゲットタンパク質のスクリーニング・同定を行った。
【０１４６】
本方式では、今日までに、ＭＳ患者の自己抗体に関しては、ミエリン蛋白がそのターゲットとして発見されていたが、上述の実験において、少なくとも７個のターゲットが検出され、更に、筋輪萎縮性側索硬化症（ａｍｙｏｔｒｏｐｈｉｃｌａｔｅｒａｌｓｃｒｅｏｓｉｓ，ＡＬＳ）の患者血清においても、4つの自己抗体反応性のタンパク質が大脳白質及び灰白質組織に存在していることを発見した。
【０１４７】
更に、最近、抗神経抗体の存在を示唆されている橋本脳症の患者血清に於いても、３つのターゲットタンパク質を検出し、等電点の異なる３つの「ａｌｆａ−ｅｎｏｌａｓｅ」が抗原として同定された。橋本脳症、脳症を示さない橋本病、自己免疫疾患有無における脳炎患者、及び正常ヒト血清合計１００人の解析の結果、ステロイド治療に感受性の橋本脳症患者１００％にａｌｆａ−ｅｎｏｌａｓｅに対する自己抗体が検出され、早期ステロイド治療のマーカーとしての可能性が示唆された。
【０１４８】
また、翻訳後修飾を含む構造が抗原となっていることが明らかであることから、このスクリーニング法は従来の大腸菌によるｃＤＮＡライブラリー発現スクリーニング（ＳＥＬＥＸ）法に比較して、特に有効であることが判明した。
【０１４９】
さらに、癌のプロテオーム解析実験に於いては、種々の、脳腫瘍の発症メカニズムの解明、マーカー
開発などを目的とし、特に「ａｎａｐｌａｓｔｉｃｏｒｉｇｏｄｅｎｄｒｏｇｌｉｏｍａ」に注目し脳腫瘍の解析を行った。
【０１５０】
「ａｎａｐｌａｓｔｉｃｏｒｉｇｏｄｅｎｄｒｏｇｌｉｏｍａ」は、一般的に知られる所見として、第１染色体短腕、および、第１９染色体長腕に典型的な片アレルの欠失ＬＯＨを有しているタイプのものと、ＬＯＨを示さないタイプのものがあり、病理学的には全く同様の所見を示すが、ＬＯＨを有するタイプは抗ガン剤や放射線治療に感受性で非常に予後がよく、逆にＬＯＨを持たないタイプは、抗がん剤に非感受性で非常に予後が悪いという特徴を持つ。
【０１５１】
現在までのところ、分子レベルでこれらの違いを示すマーカータンパク質はもとより、予後の違いの原因となる分子群や薬剤耐性のメカニズムに関する情報は、全く報告されていない。そこで、これらの脳腫瘍サンプルを用いて以下のような解析を行った。
【０１５２】
脳腫瘍組織をＬＯＨの有無、抗癌剤感受性による分類を行い、これらのサンプルからタンパク質とｍＲＮＡとを同時に抽出して、２種類のプロテオミクスによる解析、および、ＤＮＡチップによるディファレンシャル解析を行った。差異のあったすべての分子群を同定後、蛋白およびｍＲＮＡ発現レベルのデータを比較検討し、分子ネットワーク解析ソフトウェアを用いてシグナルリンケージ解析に供した（図１３参照）。
【０１５３】
以下、図１３について説明する。図１３は、病態サンプルから分子統合情報を得るためのディファレンシャルディスプレイのストラテジーを説明する図である。脳腫瘍組織を外科的手術によって切除したのち、病理学的観点からグレードや進行状況を解析、「ｇｅｎｅｔｉｃｍｕｔａｔｉｏｎ」、
欠損、欠失などの有無、抗癌剤感受性、非感受性による分類等を行う。これらのサンプルよりタンパク質とｍＲＮＡとを同時に抽出して、数種類のプロテオミクスによるディファレンシャル解析（蛍光試薬標識法、安定同位体標識法、２次元電気泳動法、ＬＣショットガン法等）、および、ＤＮＡアレイ測定やリアルタイムＰＣＲにしたがったｍＲＮＡのディファレンシャル
解析を行う。差異のあったすべての分子群を同定後、蛋白およびｍＲＮＡ発現レベルのデータを統合マイニングし、分子解析ソフトウェアを用いてシグナルネットワーク解析に供す。すべてのデータをデータベース化する。これらの統合データから分子クラスター解析、ネットワーク解析を含めた種々の機能解析を行い、最も重要である分子群を抽出して、臨床マーカー、治療、予防、創薬開発など、応用へ繋げていく。
【０１５４】
２Ｄ−ＤＩＧＥによるプロテオームディファレンシャル解析においては、主に翻訳後修飾タンパクのプロファイリングが可能である。二つの可溶化タンパク質を蛍光試薬で標識し、混合した後、二次元電気泳動に供与し、解析を行い、合計、約３５００個のスポットのうち、非感受性サンプルでは約９００個の発現上昇蛋白スポットと、約８００の減少タンパク質スポットが認められた。
【０１５５】
さらに、リン酸化タンパク質染色液であるＰＲＯ−Ｑ（登録商標）ダイアモンドを用いて、同一のゲル上でリン酸化タンパク質を解析し、感受性サンプルに対しても同様に解析したところ、上昇した蛋白スポットは３６９スポット、減少したものは６２８個、又、リン酸化で特に非感受性特異的なものとして１２スポットが検出された（図１４参照）。
【０１５６】
図１４は、複数の病態サンプルから多重蛍光標識２次元電気泳動と翻訳後修飾部位に対する特殊蛍光染色法によるディファレンシャルディスプレイを示す図である。脳腫瘍サンプルの例を示す脳腫瘍組織（抗がん剤非感受性）（Ｃｙ５でラベル）と、同一患者の正常部（Ｃｙ２でラベル）との、２Ｄ−ＤＩＧＥによるディファレンシャルディスプレイを行い、さらに、リン酸化タンパク質を特異的に染色するＰｒｏＱＤｉａｍｏｎｄで染色した。まるで囲んだスポットはリン酸化が腫瘍で亢進あるいは脱リン酸化されているタンパク質。これら検出されたスポットの数を図中に示した。
【０１５７】
検出された分子群の同定に於いて、非感受性サンプルで特異的にリン酸化を受けるものとして、ＨＳＰ９０をはじめ４個のスポットが、又、脱リン酸化をうけるものとして、「Ｎｅｕｒｏｆｉｌａｍｅｎｔ−Ｌ」を代表として５個のスポットが同定された。
【０１５８】
また、同時に２次元電気泳動を用いないプロテオミクス解析法である誘導体化法（ｃＩＣＡＴ（登録商標）法）による解析を行った。ｃＩＣＡＴ法は２つの比較したいサンプルそれぞれを、安定同位体を用いて分子量が９ダルトン異なる「ｌｉｇｈｔ」と「ｈｅａｖｙ」の２つの標識試薬によって、タンパク質のシステイン残基をラベルする。異なる標識試薬でラベルしたのち両者を混合してトリプシンにより断片化し、質量分析を用いて解析を行う。常に同じフラクションに分画される２つのペアの標識ペプチドは、「Ｈｅａｖｙ」と「ｌｉｇｈｔ」の分子量の違いで質量分析によって区別され、その差異が定量される。同時にＭＳ／ＭＳ解析により、ペプチドのシークエンスを行い、タンパク質の同定を行う。脳腫瘍サンプルは各１００ｕｇからスタートして１２フラクションに分画し、最終的には約７０００個のペプチドのＭＳ／ＭＳの解析を行った。
【０１５９】
非感受性と正常サンプルの比較により、上昇したものとして、グリオーマで上昇すると報告をされているマーカーとしてのタンパク質群などが検出された。感受性サンプルとの差異を見たところ、「ｃｅｌｌｃｙｃｌｅ」、「ｐｒｏｔｅｏｌｙｓｉｓ」に関連するタンパク質群などが検出された（図１５参照）。
【０１６０】
図１５は、複数の病態サンプルの安定同位体標識試薬を用いたＬＣ−ショットガンによるディファレンシャルディスプレイ（脳腫瘍サンプル）の例を示す図である。抗がん剤非感受性脳腫瘍組織と、同じ病態を示すが抗がん感受性組織のサンプルとの比較。ｃＩＣＡＴやｉＴＲＡＱを用いたＬＣ−ショットガンによるディファレンシャルディスプレイによって、抗がん剤非感受性脳腫瘍組織において特異的に上昇した分子群、減少した分子群の数と分子名の一部を示す。
【０１６１】
次に、同一のサンプルを用いてＤＮＡチップによる解析を行った。「ＣｏｄｅＬｉｎｋ」によるヒトｃＤＮＡオリゴ約２００００種類のチップを用い、非感受性サンプルにおいて、正常との比較では上昇２８７個、減少２１７個が、又感受性との比較では上昇４１２個、減少２３８個が検出された。プロテオミクスの手法によって特異的に同定されたタンパク質群と、ｍＲＮＡの発現パターンとを比較した結果、両者の発現パターンは大きく異なり、例えば、非感受性と正常のサンプルの比較において、１０３個の上昇したタンパク質に対し、ｍＲＮＡでは２８７個、その中で共通する分子は４１個、又、減少した分子群においても、同様に同定タンパク質分子のうち、約３０％としかｍＲＮＡ分子とクロスしないことが判明した（図１６参照）。
【０１６２】
そこで、タンパク質およびｍＲＮＡレベルで上昇した分子群のすべてのデータを、既存の分子ネットワーク検索ソフトウェアであるＫｅｙＭｏｎｅｔ（登録商標）に入力し、同定分子群のリンケージ解析を行った（図１７の左上右上：タンパク質レベル：左上、ｍＲＮＡレベル：右上、すべてのネットワークの解析結果の一部を示す）。
【０１６３】
図１６は、抗がん剤非感受性脳腫瘍組織ｖｓ同一患者の正常組織（ＭＳｖｓＮ）、抗がん剤非感受性脳腫瘍組織ｖｓ同じ病態を示すが抗がん１３感受性組織(ＭＳｖｓＨＬ)のタンパク質及びｍＲＮＡレベルで同定された分子数を示す図である。
【０１６４】
プロテオミクスの手法によって特異的に発現が上昇及び減少するものとして同定されたタンパク質群と、同一のサンプルから検出されたｍＲＮＡの発現パターンとを比較した。ｍＲＮＡの発現とタンパク質の発現のパターンは大きく異なっている。タンパク質で同定された分子のうちの約３０％としかｍＲＮＡの発現分子と共通にクロスしない。また、これらの分子は時として、タンパク質レベルでは上昇しているのにもかかわらず、ｍＲＮＡレベルでは逆に減少しているものも多く見受けられた。
【０１６５】
上記違いの理由として、細胞内におけるタンパク質とｍＲＮＡの発現と安定性の時間的ラグが反映されているものと考えられる。ｍＲＮＡの発現の上昇はタンパク質として充分に反映された時終了し、減少する。タンパク質がクリアランスされ不足するとｍＲＮＡの発現は誘導され上昇する。つまり、細胞内のある時間軸だけを切り取ってみると、あるタンパク質は上昇しているが、ｍＲＮＡは減少していて、又あるタンパク質は減少しているが、mRNAは上昇している、ということは常に起こっていておかしくない。病態サンプルは微量でサンプル内細胞の同調を行なうなど、この時間差の謎を解決するような、タイムコースの実験はできない。
【０１６６】
時間的キャップを埋めることができるのかは、以下の分子発現の上昇メカニズムで説明できる。すなわち、すべてのｍＲＮＡがタンパク質として発現すると仮定した場合、ある時間軸でｍＲＮＡが過剰に発現していれば、その時点でタンパク質が減少していても近未来的にタンパク質は上昇する。ならば、その時間的ラグを無視して上昇する分子群をすべて一つに統合マイニングし、その病態サンプルおける時間軸の幅をもたせた特異的活性化シグナルネットワークを抽出できるはずである。図８ではその単純な概念の模式図を示した。このようなシグナルネットワークの抽出操作をすることによって、タンパク質やｍＲＮＡそれぞれの単独の解析のみでは見いだすことの出来なかった活性化シグナルの最上流因子（Ａ）、最下流因子（Ｇ）を割り出すことが出来る。そこで、タンパク質およびｍＲＮＡレベルで上昇した分子群のすべてのデータを、既存の分子ネットワーク検索ソフトウェアであるＫｅｙＭｏｌｎｅｔ（登録商標）に入力し、同定分子群のリンケージ解析を行った。
【０１６７】
図１７左上で示すタンパク質の上昇シグナルマップの骨格の中に、ｍＲＮＡの発現分子群を挿入すると、共通してｍＲＮＡ発現の上昇を示す分子群などは非常に少なく、逆に減少した分子が散見され、タンパク質とｍＲＮＡの発現レベルには大きな相違があることが判明した。
【０１６８】
そこで、主に、抗癌剤非感受性サンプル中でタンパク質、および、ｍＲＮＡの両方で上昇しているシグナルネットワークの抽出の方法論を図のように考えた。例えば、シグナルの上流でタンパク質の発現があがっていて下流のシグナルは下がっているか変化したものとして同定できていない。逆にｍＲＮＡの発現がシグナルの上流では既にさがっているが、その下流は上昇している。これらの発現が一致しなくとも、両者の活性化分子を合流させることで、ある特定のシグナルキャスケードを抽出することができ、又、共通の上流因子、下流因子を決定できる可能性が示唆される（図８参照）
タンパク質、ｍＲＮＡで特異的に上昇した分子のネットワーク検索結果の一例として、補体系、サイクリンとＣＤＫによる細胞周期、レチノイン酸核内レセプターのネットワークが抽出された（図１７）。
【０１６９】
抗がん剤非感受性サンプル中で、リン酸化を含めたタンパク質およびｍＲＮＡのレベルで、正常や抗がん剤感受性に比較して特異的に上昇しているシグナルネットワークをリストアップすると、主に、血管新成・血管透過性・細胞周期・接着因子関連分子群の関与するキャスケードの上昇、及び特異的核内レセプター群、転写因子群とそれらの下流分子群の活性化がみとめられた（図１８）
また、このように、プロテオミクスによって翻訳後修飾、タンパク質レベルの変化をｍＲＮＡ発現レベルの変化と比較解析することによってはじめて、病態に関連する特異的なシグナルネットワーク及び治療ターゲットとなる可能性のある分子キャスケードを抽出できることが判明した(図８)。
【０１７０】
生体組織タンパクチップを用いた病態プロテオミクス解析法により、脳炎を伴う自己免疫疾患患者の血清から、病態に関連する特異的な臨床マーカー及び治療ターゲットとなる自己抗体反応性分子を検出することができることが判明した（図１９、図２０）。
【０１７１】
図１７は、同一組織細胞可溶化サンプルを用いて各種のディファレンシャルディスプレイ解析を行って抽出してきた分子群の、タンパク質レベル、および、ｍＲＮＡの両レベルで同様に上昇しているシグナルネットワークの一例を示す図である。
【０１７２】
図８および図１６を参照して説明したような仮説にもとづき、データを統合マイニングし、主に、非感受性サンプル中でタンパク質レベル、および、ｍＲＮＡの両レベルで同様に上昇しているシグナルネットワークの一例を示す。レチノン酸レセプター（ＲＡＲ）を介した発現制御に関しての解析例を図に示す。ｂカテニン、ＭＡＰＫ、ＲＡＲ、ｔＴＧ, インテグリン（Ｉｎｔ）、コラーゲン、ラミニンなどがタンパク質レベルで上昇するものとして、又ｍＲＮＡで発現が亢進するものとして、ＥｒｂＢ２、e−カドヘリン、ＤＨＴＲ、ＭＡＰＫ、ｔＴＧ、Ｉｎｔ、さらにＲＡＲの下流因子ＬＦ、ＰＥＰＣＫ、ｐ２１ＣＩｐ１、ＨＯＸＤ、ＣＲＢＰ１なども有意に上昇しているのがわかる。タンパク質、ｍＲＮＡ両者で上昇しているものコアにして前後のキャスケードを見てみると、図中の太字の矢印で示すような活性化シグナルが、抽出できる。これらの所見は、これまでの実験的事実にもとづき、データベース化されたシグナルネットワークを用いて、新たな病態関連シグナルキャスケードを見いだす一つの方法論として新規のものである
図１８は、脳腫瘍患者組織の抗癌剤非感受性サンプル中で、特異的にタンパク質、および、ｍＲＮＡの両レベルで同様に上昇しているシグナルネットワークを示す図である。
【０１７３】
図８および図１６を参照して説明したような仮説に基づき、データを統合マイニングし、主に、非感受性サンプル中でタンパク質レベル、および、ｍＲＮＡの両レベルで同様に上昇しているシグナルネットワークをリストアップした。特に薬剤感受性に関連して特徴的なものとして、アポトーシス関連キャスケード（ＡＫＴ、Ｂａｄシグナルなど）の亢進、血管過剰新成・血管透過性を特徴づける補体凝固系因子・血管新成因子系、サイクリンを中心とする細胞周期Ｇ１／Ｓ、Ｇ２／Ｍ関連分子群によるシグナルの亢進、インテグリン・カドヘリンを介した接着因子群、分解系の亢進、又、レチノイン酸レセプター・アンドロジエンレセプター（ＤＨＴＲ）関連シグナルを代表とする核レセプターなど転写因子系を介したシグナル亢進が認められた。また、このように、プロテオミクスによって翻訳後修飾、タンパク質レベルの変化をｍＲＮＡ発現レベルの変化と比較解析することによってはじめて、病態に関連する特異的なシグナルネットワーク及び治療ターゲットとなる分子キャスケードを抽出できることがわかる。
【０１７４】
本実証実験では、特異的な分子の抽出及び、タンパク質機能解析及び病態プロテオミクス解析において、請求項３に記載された、同時進行で三方式のディファレンシャルディスプレイを行うこと、ならびに、請求項６に記載された、検索統合データマイニングアルゴリズムにより、プロテオミクスデータベースとタンパク相互機能解析ソフトウェアにリンクさせて融合し、全ての細胞内発現タンパク質を、網羅的に時間軸を追って解析し、如何にトータルとしての機能制御が行われて生物活動が成り立っていくのかを解明し、そして如何なる細胞内タンパク質群のどの様な変化が、何時、どこで、どの様にして正常の細胞活動を破綻させ、がんなどの複雑な疾患をｐｒｏｇｒｅｓｓさせて行くのかを各組織・細胞で網羅的かつ系統的に整理し、ゲノム解析の情報と併せて合理的な治療法や癌マーカーや予防法の開発に役立つ網羅的な情報を得ること、即ちこれらを全て含むプロテオーム解析を可能とする方法を見出した。
実施例１：
(方法)
手術により脳腫瘍患者の脳腫瘍部位を脳腫瘍組織サンプル，腫瘍近傍の正常部位を正常組織サンプル(数ミリメートル角)として、術中に液体窒素で凍結し、その後-80oCに保存したものを用いた．これらの組織を病理学的所見にて腫瘍のグレードを確認した後、一番染色体（１P）、１９番染色体（19q）のLOHの有無、抗癌剤感受性と抗癌剤耐性のものとに分類した．
それらの組織サンプルをLysis
buffer (9.8M尿素，4%CHAPS、0.5 ｍM EDTA、1mM DTT, 1mM PMSF, 1mM PEPSTATIN , 1mM
leupeptin, 10 mM NaF, 2 mM Na₃VO₄，1.5mM Okadaic acid )を用いてホモジネートして溶解させた。その溶解液を遠心分離(15,000
rpm，10min，4℃) し、不溶物を除去したものを腫瘍あるいは正常脳ホモジネートサンプルとした。
【０１７５】
そのサンプル約100 μgを2D
clean up kit (GE Healthcare Bio-Sciences Corp.)にあるいはアセトン沈殿法にて脱塩したのち，CyDye (Cy 5，GE
Healthcare Bio-Sciences Corp.)にてホモジネートサンプル中の蛋白質にミニマムラベルした。Cy5ラベルした蛋白質約10μg分を膨潤バッファーにて希釈して125
μLとし、その全量をストリップホルダーに添加したのち、DryStrip (pH 3-11NL, 7 cm.Invitrogen)をその溶液上にのせ、一次元目等電点電気泳動(1〜３時間)を行った。等電点電気泳動終了後、DryStripを0.1
M DTT含有SDS平衡化buffer (50 mM Tris-HCl, 6M Urea, 30% glycerol, 2% SDS, 0.02%
Bromophenol Blue, pH 8.8 )に10分間浸して還元処理及びSDS化を行った。さらに、そのDrystripの両端をカッターにて5cm長に切断し、SDS-ポリアクリルアミド電気泳動(Phast-gel
system, Pharmacia,および、 5cmx5cmPAGE産業総合研究所開発微小高分解能ゲル、20ｍA/ゲル，約1時間通電)にて二次元目電気泳動を行った。これをNatural
proteinゲルチップとした。
【０１７６】
そのNatural Proteinゲルチップを下記の方法にて電気的に5cmx5cmの低蛍光加工PVDFメンブレン（millipore,
immobilon-FL 0.45μm）へ転写し、Natural Proteinメンブレンチップとした。すなわち、低蛍光PDVFメンブレンをメタノールに約10秒間浸したのち、転写Buffer
(25 mM Tris, 200 mM グリシン, 10%メタノール)にて十分に平衡化した。セミドライトランスファー装置（株式会社バイオクラフト）を用いて、上記のSDS-ポリアクリルアミドゲル中の蛋白質を転写bufferにて平衡化したメンブレンへ電気的（約140
mA, 50分間通電）に転写した。転写後、直ちに蛍光スキャナー（Typhoon 9400, GE Healthcare Bio-Sciences Corp.）を用いてメンブレン上のタンパク質を検出した。
【０１７７】
検出後、低蛍光PVDFメンブレンをブロッキング液(0.5%BSA/0.03%Tween20/PBS)に浸して室温にて10分間振とうした後、洗浄液(0.3%Tween20/PBS)にて低蛍光・低吸着・高感度・高分解能PVDFメンブレンを洗浄した(5分間×3回)。抗体カクテル溶液(anti
GFAP pAb 1/500倍 Santa Cruz, anti CD44 pAb 1/1000倍 Ancell, anti p53 mAb 1/1000倍
Santa Cruz, anti prothrombin mAb 1/1000倍 Abcam, anti α1-antitrypsin mAb 1/1000倍
Abcam, anti ubiqutine activating wnzyme E1 mAb 1/500倍 Upstate, anti Erk pAb
1/1000倍 Santa Cruz, anti p-Tyr mAb 1/1000倍 Upstate, anti zyxin pAb 1/1000倍
abcam)（ここで、pAbはウサギポリクローナル抗体を示し、mAbはマウスモノクローナル抗体を示す）に低蛍光PVDFメンブレンを浸して室温で1時間振とうし、洗浄液にて洗浄(5分間×3回)したのち、二次抗体溶液{anti
rabbit Ig-HRP linked F(ab’)₂
fragment (from donkey) 1/20,000倍あるいはanti mouse Ig-HRP linked F(ab’)₂ fragment (from sheep) 1/20,000倍、GE Healthcare Bio-Sciences Corp.}に低蛍光PVDFメンブレンを浸して室温にて30分間振とうした。洗浄液にて洗浄(5分間×3回)した後、ECL
Plus Western Blotting Detection Reagents (GE Healthcare Bio-Sciences Corp.) 1
mLに浸して室温で1分間反応させた。透明フィルムに挟んだ低蛍光PVDFメンブレンとHyperfilm (GE Healthcare Bio-Sciences
Corp.)を密着(約2分間)させて感光させたのち、Hyperfilmを現像した。また、同時に蛍光スキャナー(Typhoon 9400, GE Healthcare
Bio-Sciences Corp.)にてスキャンし、抗体反応性蛍光スポットを疑似色にて着色し、Cydye検出画像の上にマージさせることによって画像化した。
(結果)
Natural Proteinメンブレンチップによる脳腫瘍組織サンプル及び正常組織サンプルの抗体を用いたプロファイリングの結果を図３４〜図３７に示した。また、実際のサンプルパターンを図３８に示し、各患者のパターンをまとめたものを図３９に示した。
【０１７８】
GFAP，p53は腫瘍サンプルにおいてリン酸化を伴って増加し、ユビキチン化酵素E-1、CD44、アンタイトリプシン、プロトロンビンは量的な変動が明らかなパターンとして検出された。タイロシンリン酸化抗体、さらには、セリン/スレオニン酸染色法を用いると、正常と腫瘍に対する明らかな反応パターンの違いが認められた。また、各患者サンプルを用いて5種類（GFAP，CD44，タイロシンリン酸化抗体，Erk，Zyxin）の抗体カクテルにて抗がん剤感受性及び非感受性のプロファイリングにより比較すると、50及び40個の陽性スポットが得られ、それぞれに特徴的な共通の30個からなるパターンが検出された。これをType
１のパターンとして、現在，抗癌剤感受性に関連すると考えられる蛋白質の抗体をリストアップして、これらの抗体カクテルによるパターン化を行うことができる。
【０１７９】
以上の結果より、正常と腫瘍、抗癌剤耐性と抗癌剤感受性との識別が、このNatural Protein (メンブレン)チップで可能であることが示された。また、数種類の抗体が同時に使用できること、さらには，反応の程度(量的変化)が定量化できることから、癌の診断として用いられている組織免疫染色及び癌マーカーのELISAによる定量のみでは得ることができなかった、翻訳後修飾変化などを含む多数の分子情報が数時間で得られ、脳腫瘍に関わらず、全ての疾患関連サンプルに応用できる有用な診断法となり得る。また、本法は通常、２日以上かかっていた方法論を最短で５時間に短縮して最終データを得ることができることから、臨床検査の方法論として有用である。
【図面の簡単な説明】
【０１８０】
【図１】図１は、本発明の実施の形態にかかるプロテオミクス解析システムの全体構成を示すブロックダイヤグラムである。
【図２】図２は、プロテオミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。
【図３】図３は、ゲノミクスベースの処理装置群の構成をより詳細に示すブロックダイヤグラムである。
【図４】図４は、プロテオミクスベースの処理装置群を用いたデータプロファイリング方法のうち、安定同位体標識法を用いたＬＣ−ショットガン法、および、２次元電気泳動を用いたディファレンシャルディスプレイ法の概略を示す図である。
【図５】図５は、本実施の形態にかかるタンパク質同定処理を示すフローチャートである。
【図６】図６は、ゲノミクスベースの処理装置群によるデータプロファイリングの一例を示す図である。
【図７】図７は、本実施の形態にかかる第１の質量分析計〜第３の質量分析計のそれぞれから得られたタンパク質を分類したベン図である。
【図８】図８は、分子シグナルリンケージのタンパク質レベルネットワークの一例を示す図である。
【図９】図９は、機能分類ＤＢ内の疾患プロテオミクスデータの連携を説明する図である。
【図１０】図１０は、リターンマッチングマイニングアルゴリズムの例を示す図である。
【図１１】図１１は、タンパク質インテンシティのノーマライズ処理を説明する図である。
【図１２】図１２は、タンパク質インテンシティのノーマライズ処理を説明する図である。
【図１３】図１３は、病態サンプルから分子統合情報を得るためのディファレンシャルディスプレイのストラテジーを説明する図である。
【図１４】図１４は、複数の病態サンプルから多重蛍光標識２次元電気泳動と翻訳後修飾部位に対する特殊蛍光染色法によるディファレンシャルディスプレイを示す図である。
【図１５】図１５は、複数の病態サンプルの安定同位体標識試薬を用いたＬＣ−ショットガンによるディファレンシャルディスプレイ（脳腫瘍サンプル）の例を示す図である。
【図１６】図１６は、抗がん剤非感受性脳腫瘍組織ｖｓ同一患者の正常組織（ＭＳｖｓＮ）、抗がん剤非感受性脳腫瘍組織ｖｓ同じ病態を示すが抗がん１３感受性組織(ＭＳｖｓＨＬ)のタンパク質及びｍＲＮＡレベルで同定された分子数を示す図である。
【図１７】図１７は、同一組織細胞可溶化サンプルを用いて各種のディファレンシャルディスプレイ解析を行って抽出してきた分子群の、タンパク質レベル、および、ｍＲＮＡの両レベルで同様に上昇しているシグナルネットワークの一例を示す図である。
【図１８】図１８は、脳腫瘍患者組織の抗癌剤非感受性サンプル中で、特異的にタンパク質、および、ｍＲＮＡの両レベルで同様に上昇しているシグナルネットワークを示す図である。
【図１９】図１９は、組織・細胞Ｎａｔｕｒａｌプロテインチップの補足説明する図である。
【図２０】図２０は、Ｎａｔｕｒａｌプロテインチップによる患者血清中の自己抗体反応性プロテインスポットのプロファイリングを示す図である。
【図２１】図２１は、データ保管管理テーブルを説明する図である。
【図２２】図２２は、リターンマッチングアルゴリズムを説明する図である。
【図２３】図２３は、リターンマッチングアルゴリズムを説明する図である。
【図２４】図２４（ａ）、（ｂ）は、あるタンパク質を、異なる２つの質量分析器で測定した結果を示す図である。
【図２５】図２５は、図２４（ａ）、（ｂ）に示すデータを、データ統合処理により統合して得たデータの例を示す図である。
【図２６】図２６は、本実施の形態にかかるデータ統合処理の一例を示すフローチャートである。
【図２７】図２７（ａ）は、図２４（ａ）、（ｂ）に示すタンパク質のデータに、図２６に示す統合化処理を施した結果を示す図、図２７（ｂ）は、図２７（ｂ）は、ローカルＤＢに記憶された、あるＤＮＡアレイのデータを示す図である。
【図２８】図２８は、図２７（ａ）、（ｂ）に示すデータを、データ統合処理により統合して得たデータの例を示す図である。
【図２９】図２９は、図２７（ａ）、（ｂ）に示すようなデータを統合するデータ統合処理の例を示すフローチャートである。
【図３０】図３０は、本実施の形態にかかるタンパク質同定手順の一例を示すフローチャートである。
【図３１】図３１は、本実施の形態にかかるタンパク質とｍＲＮＡのマージの例を説明するフローチャートである。
【図３２】図３２（ａ）は、２Ｄ−ＤＩＧＥの画像から得られたタンパク質の情報の例を示す図、図３２（ｂ）は、タンパク質間のユークリッド尺度の情報の例を示す図である。
【図３３】図３３は、本実施の形態にかかる特異タンパク質の抽出を概略的に示した図である。
【図３４】図３４は、二次元ウエスタンブロッティングによる腫瘍特異的プロテインのプロファイリングを示す。
【図３５】図３５は、二次元ウエスタンブロッティングによる腫瘍特異的プロテインのプロファイリングを示す。
【図３６】図３６は、二次元ウエスタンブロッティング及びPro-Qダイアモンド染色による腫瘍特異的プロテインのプロファイリングを示す。
【図３７】図３７は、抗体カクテルを用いた二次元ウエスタンブロッティングによる腫瘍特異的プロテインのプロファイリングを示す。
【図３８】図３８は、抗体カクテルによる個々の患者組織のメンブレンチップパターンを示す。
【図３９】図３９は、GCTEZカクテルを用いた非感受性及び感受性のAOG脳組織の患者試料の代表的なチップパターンを示す。
【符号の説明】
【０１８１】
１２プロテオミクスベースの処理装置群
１４ゲノミクスベースの処理装置群
１６プロテオミクスＤＢ
１８機能分類ＤＢ
２０統合解析システム
２２データマイニングシステム
２４国際ＤＢ
３０、３２、３４質量分析計
３６２Ｄ−ＤＩＧＥ測定装置
４０、４２、４４、４６制御・解析部
５０、５２、５４、５６ローカルＤＢ
６０マイクロダイセクション装置
６２ＤＮＡアレイ測定装置
６４リアルタイムＰＣＲ測定装置
７０、７２、７４制御・解析部
８０、８２、８４、ローカルＤＢ

【特許請求の範囲】
【請求項１】
各種病態を示す患者や疾患モデル動物由来組織、細胞および培養細胞を用いてプロテオーム解析方法によって得られた、電気泳動画像、および、各種異なる特徴をもつ質量分析器による質量分析シグナルパターンを少なくとも含む、生データ、並びに、当該生データに基づいて同定したペプチド・タンパク質ＩＤ、および、定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
データベースに格納されたデータを同一言語に変換し、融合させるステップと、
ネットワークを介してアクセス可能な公開された他のデータベースを検索するステップと、
特異的タンパク質群を抽出し、これらの機能を予測し病態を解析するステップと、を実行させることを特徴とする解析プログラム。
【請求項２】
複数のＬＣ−ＭＳショットガン法を適用して得た、ＭＳスペクトルデータを格納する、ＭＳスペクトルデータベースを備えたコンピュータにおいて、前記コンピュータに、
タンパク質を同定するステップと、
前記タンパク質の同定により得られた解析結果を、データベースに格納するステップと、
データベースに格納された解析結果と、タンパク相互機能解析システムおよび生物情報統合プラットフォームとを、ネットワークを介しリンクさせて融合するステップと、を実行させることを備えたことを特徴とする解析プログラム。
【請求項３】
論理的スペクトルを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
安定同位体標識ＬＣ−ＭＳショットガン法を適用して得た生データを、既存の条件にて作成したペプチドピークリストと、前記データベースに格納された理論的スペクトルとの間の類似性に基づいて、ペプチドを同定するステップと、
安定同位体標識されたペアのピークの強度差から、前記ペプチドを含むタンパク質含有相対量を決定するステップと、
特定の組織・細胞に特異的に出現したタンパク質群を分類するステップと、を実行させることを特徴とする解析プログラム。
【請求項４】
ＤＮＡアレイ、および／または、リアルタイムＰＣＲを含む、異なる性質の分析によるｍＲＮＡ定量的発現解析データ、および、２次元電気泳動、ＬＣ−ＥＳＩ−ＭＳ／ＭＳショットガン法、および／または、ＬＣ—ＭＡＬＤＩ−ＭＳ／ＭＳショットガン法を含む、異なる手法を用いたプロテオミクスによる定量的データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納されたデータのそれぞれについて、ディファレンシャルディスプレイを含む、同一のアルゴリズムによる解析を施すステップを実行させることを特徴とする解析プログラム。
【請求項５】
さらに、前記コンピュータが、
前記データベースを異なる他のデータベースとリンクされ、前記コンピュータに
前記データベースに格納された、前記解析を施された結果である解析データについて、前記リンクされた異なる他のデータベースに格納された情報に基づいて解析するステップを実行させることを特徴とする請求項４に記載の解析プログラム。
【請求項６】
２Ｄ―ＤＩＧＥを含む画像データであって、スポットの情報を含む画像データ、および、翻訳後修飾構造を含むタンパク質情報を格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記画像データ中のスポットと、前記データベースからの翻訳後修飾構造を含むタンパク質情報とを関連付け、当該関連付けを、前記データベースに格納するステップを実行させることを特徴とする解析プログラム。
【請求項７】
前記コンピュータに、
作成した統合データベースの情報を分析装置の解析プラットフォームにリバースインプットし、再解析するステップを実行させることを特徴とする請求項１ないし５の何れか一項に記載の解析プログラム。
【請求項８】
ｍＲＮＡは、ＤＮＡアレイおよび／またはリアルタイムＰＣＲ、可溶化タンパク質は、２Ｄ−ＤＩＧＥを含む蛍光標識２次元電気泳動および／またはＩＣＡＴ、ｉＴＲＡＱを含む安定同位体標識法のＬＣ−ＭＳショットガン法を用いて、同時進行で、方式の定量的ディファレンシャルディスプレイによるデータを一元化して解析することを特徴とする請求項４に記載の解析プログラム。
【請求項９】
分子ネットワークを記憶したデータベースを備えたコンピュータにおいて、前記コンピュータに、
分子統合データに基づいて、前記データベース中の分子ネットワークを検するステップと、
病態で特異的に活性化あるいは特異的に失活しているなどの病態組織・細胞特異的シグナルカスケードを抽出するステップと、を実行させることを特徴とする解析プログラム。
【請求項１０】
異なる特徴を持つ質量分析器による質量分析シグナルパターンを含む生データに基づいて同定したＡｃｃｅｓｓｉｏｎＮｏ、および、Ｉｎｔｅｎｓｉｔｙ比を少なくとも格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記データベースに格納された、異なる質量分析器に基づく、同一のＡｃｃｅｓｓｉｏｎＮｏに関するＩｎｔｅｎｓｉｔｙ比を抽出するステップと、
前記Ｉｎｔｅｎｓｉｔｙ比の値を統合し、統合した値を、前記ＡｃｃｅｓｓｉｏｎＮｏと関連付けて、前記データベースに記憶するステップと、を実行させることを特徴とする解析プログラム。
【請求項１１】
さらに、前記データベースが、ＤＮＡアレイに由来するデータに基づくＡｃｃｅｓｓｉｏｎＮｏ、および、Ｉｎｔｅｎｓｉｔｙ比を備え、
前記データベースに格納された、同一のＡｃｃｅｓｓｉｏｎＮｏに関する統合されたＩｎｔｅｎｓｉｔｙ比、および、ＤＮＡアレイに関するＩｎｔｅｎｓｉｔｙ比を抽出するステップと、
前記Ｉｎｔｅｎｓｉｔｙ比の値をノーマライズして、ノーマライズされた値を、前記ＡｃｃｅｓｓｉｏｎＮｏと関連付けて、前記データベースに記憶するステップと、を実行させることを特徴とする請求項１０に記載の解析プログラム。
【請求項１２】
２Ｄ−ＤＩＧＥを含む画像データであって、スポットの情報を含む画像データを格納したデータベースを備えたコンピュータにおいて、前記コンピュータに、
前記スポットのそれぞれの情報、および、前記コンピュータに接続されたデータベースであって、前記既知のタンパク質のスポットの情報を格納した他のデータベースを参照して、前記スポットの情報と、前記既知のタンパク質のスポットの情報がマッチする場合に、当該スポットの情報として、前記既知のタンパク質のスポットの情報を与え、前記データベースに格納するステップと、
マッチしない場合に、質量分析計による解析を含む他の手法により取得し、前記データベースに格納した、前記スポットの第２の情報に基づいて、前記スポットにかかるタンパク質を同定するステップと、を実行させることを特徴とする解析プログラム。
【請求項１３】
前記第２の情報に基づいてタンパク質を同定するステップが、前記コンピュータに接続されたさらに他のデータベースであって、前記他の手法により同定されたタンパク質の情報が格納されたデータベースを検索するステップを含むことを特徴とする請求項１２に記載の解析プログラム。
【請求項１４】
生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップ。
【請求項１５】
１０cm×１０cm以下のサイズを有する、請求項１４に記載のプロテインチップ。
【請求項１６】
蛋白質試料が電気泳動ゲルからメンブレンに転写されて固相化されている、請求項１４又は１５に記載のプロテインチップ。
【請求項１７】
（１）生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、及び、（２）等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程を含む、請求項１４又は１５に記載のプロテインチップの製造方法。
【請求項１８】
（１）生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供する工程、（２）等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供する工程、及び（３）蛋白質試料をSDS-ポリアクリルアミド電気泳動後の電気泳動ゲルからメンブレンに転写する工程、を含む請求項１６に記載のプロテインチップの製造方法。
【請求項１９】
請求項１４から１６の何れかに記載のプロテインチップ上の蛋白質試料に標識されている蛍光色素に由来する蛍光を検出することを含む、該蛋白質試料をプロテインチップ上における蛋白質スポット情報として画像化する方法。
【請求項２０】
（１）請求項１、２、３、８又は９に記載のプログラムをコンピュータに実行させることによって得られた分子情報から病態の進行状況又は薬剤感受性のモニタリングに使用可能な分子群をリストアップして、これらの分子に対する抗体カクテルを用意する工程、（２）請求項１４から１６の何れかに記載のプロテインチップに上記抗体カクテルを接触させる工程、及び（３）プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、病態の進行状況又は薬剤感受性をモニタリングする方法。
【請求項２１】
（１）抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、抗ubiqutine
activating enzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも２種類以上の抗体を含む抗体カクテルを用意する工程、（２）脳腫瘍患者の生体組織又は細胞から抽出した蛋白質を蛍光色素で標識して得られた蛋白質試料をストリップ上で一次元目の等電点電気泳動に供し、次いで等電点電気泳動後のストリップを還元処理及びSDS化した後、二次元目のSDS-ポリアクリルアミド電気泳動に供することにより得られる、生体組織又は細胞内で合成された全蛋白質を網羅した微小サイズのプロテインチップに上記抗体カクテルを接触させる工程、及び（３）プロテインチップ上の抗体反応陽性パターンをプロファイリングし、データベース化する工程を含む、脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングする方法。
【請求項２２】
請求項２１に記載の方法において脳腫瘍の病態の進行状況又は薬剤感受性をモニタリングするために使用される抗体カクテルであって、抗GFAP抗体、抗CD44抗体、抗p53抗体、抗prothrombin抗体、抗α1-antitrypsin抗体、抗ubiqutine
activating wnzyme E1抗体、抗Erk抗体、抗p-Tyr抗体、及び抗zyxin抗体から選択される少なくとも２種類以上の抗体を含む抗体カクテル。

【図１】