クラスタリングによる蛋白質の有効性推定方法

【課題】計算機により、生理活性値の測定に有効な蛋白質の推定方法を提供する。
【解決手段】有効な蛋白質（バイオマーカー）の推定には、入力層の入力ノードと、競合層のすべてのノードが重みを介して結合している自己組織化マップによるクラスタリングを用いる。蛋白質発現量と生理活性値が既知の参照成分の蛋白質発現量と生理活性値とをセットで入力する。蛋白質発現量に対応する重み要素と入力の蛋白質発現量間のユークリッド距離が最小となる競合層のノードを勝者ノードとする。勝者ノードを中心とする近傍に存在する競合層のノードの重みの更新にあたっては、蛋白質発現量に対応する重み要素に加えて、生理活性値に対応する重み要素も同時に更新して自己組織化マップを構築する。学習を通じて獲得した生理活性値に対応する重み要素の値に基づいて、競合層のノードを複数のクラスに分割し、各クラスに属する競合層のノードが持つ蛋白質発現量に対応する重み要素を比較して、生理活性の推定に有効なバイオマーカーと認定する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、クラスタリングによる蛋白質の有効性推定方法、特に機能性食品、医薬品などの生理活性の測定に使用する蛋白質の有効性を自己組織化マップによるクラスタリングで推定する方法に関するものである。
【背景技術】
【０００２】
一般に、機能性食品や医薬品成分の生理活性値を直接測定する方法は、種々知られている。しかしながら、天然物由来の食品成分のような多成分系の組成物を、成分毎に個別の評価系で測定するには、労力、時間、費用がかかり、必ずしも実際的とは言えない。近年、これらの問題を解消する一次的なスクリーニング方法として、高スループット機能性評価方法が提案されている（特許文献１、非特許文献１）。この方法では、生理活性値が既知の成分をヒト由来の培養細胞に付与し、その蛋白質発現量と生理活性値との関係を対応付けたデータセットを電子計算機に入力して学習用データベースを構築し、同様にして機能性未知の被検成分の蛋白質発現量のみを測定し、その蛋白質発現量から学習用データベースを用い機能性値を推定する。特許文献１では、この推定にニューラルネットワークが有効であることを示している。その他、確率密度分布やクラスタリングなどの使用の可能性も示唆している。
【特許文献１】特開２００６−２２３３０２号公報
【非特許文献１】永▲濱▼清子ら「ハイスループット食品機能性評価法の開発」日本農芸化学会大会講演要旨集、２００７、２７３（２００７）
【０００３】
一方、非特許文献２は、自己組織化マップ（ＳＯＭ）によるクラスタリングを用い、食品の生理機能性の推定を行った例を開示している。しかし、非特許文献２の報告では、ＳＯＭによる相対誤差１０％以内の推定成功率は約８３．３％と、かなりの結果を示しているものの、一部に生理活性値の推定が困難な食品成分も見出されている。結論として、より精度の高い推定を可能とするには、ＳＯＭのパラメータのさらなる調整が必要である、とされている。
【非特許文献２】福島多聞ら「自己組織化マップを用いた食品の生理機能性推定」火の国情報シンポジウム２００７論文集（ＣＤ−ＲＯＭ）、Ｃ−１−４（２００７）
【発明の開示】
【発明が解決しようとする課題】
【０００４】
本発明者らは、ＳＯＭによる食品の生理活性値の推定を検討する過程において、ＳＯＭによるクラスタリングは、蛋白質発現量から生理活性値を推定するというよりも、むしろ任意の生理活性値の測定に効果的に利用できる蛋白質の推定に優れていることを見出し、本発明にいたった。
【０００５】
本発明は、かかる知見に基づくもので、任意の生理活性値の測定に対し、有効な蛋白質を推定する方法を提供することを目的としている。
【課題を解決するための手段】
【０００６】
前期目的を達成した本発明のクラスタリングによる蛋白質の有効性推定方法は、下記の各項に示す態様を特徴としている。
（項１）入力層の入力ノードと、競合層のすべてのノードが重みＷ＝｛Ｗ_１，…，Ｗ_Ｎ｝を介して結合している自己組織化マップを用いたクラスタリングにおいて、蛋白質発現量Ｘ＝｛Ｘ_１，…，Ｘ_ｐ｝と生理活性値Ｙ＝｛Ｙ_１，…，Ｙ_ｑ｝が既知である参照成分Ａの蛋白質発現量Ｘと生理活性値Ｙとをセットで入力し、重み要素Ｗ_１，…，Ｗ_ｐと蛋白質発現量要素Ｘ_１，…，Ｘ_ｐ間のユークリッド距離ｄが最小となる競合層のノードを勝者ノードとし、勝者ノードを中心とする近傍に存在する競合層のノードの重み更新にあたっては、蛋白質発現量に対応する重み要素Ｗ_１，…，Ｗ_ｐに加えて、生理活性値に対応する重み要素Ｗ_ｐ＋１，…，Ｗ_Ｎも同時に更新して自己組織化マップを構築し、学習を通じて獲得した生理活性値に対応する重み要素Ｗ_ｐ＋１，…，Ｗ_Ｎの値に基づいて競合層のノードを複数の領域に分割（クラスタリング）し、各領域に属する競合層のノードが持つ蛋白質発現量に対応する重み要素Ｗ_１，…，Ｗ_ｐを比較することにより、生理活性の推定に有効な蛋白質であると認定することを特徴とするクラスタリングによる蛋白質の有効性推定方法。
（項２）参照成分が食品成分であることを特徴とする項１記載の方法。
【発明の効果】
【０００７】
本発明によれば、ＳＯＭによるクラスタリングで、任意の成分の生理活性値を測定するのに、どの蛋白質をバイオマーカーとして用いれば良いかが比較的簡単に推定できる。ある成分を細胞に付与し、新しい蛋白質の発現が認められた場合、その蛋白質がどの生理活性に関係し、その生理活性の測定に有効であるかを推定できる。これらのことから、例えば高スループット機能性評価方法などにおいて、出力対象となる生理活性毎に好適な蛋白質をバイオマーカーとして選出して、精度の高い評価系を簡単に構築することができる。
【発明を実施するための最良の形態】
【０００８】
以下の実施の形態において使用する下記技術用語は、（）内示すように略記し、その意味は両者とも同一である。
・蛋白質（バイオマーカー）
・自己組織化マップ（ＳＯＭ）
・エピガロカテキンガレート（ＥＧＣＧ）
・ベンジルイソチオシアネート（ＢＩＴＣ）
・ＮｕｃｌｅａｒＦａｃｔｏｒｋａｐｐａＢ（ＮＦ−ｋＢ）
・ＮＦ−ｋＢ認識配列（ｋＢＲＥ）
・炎症惹起に関与する転写因子ＮＦ−ｋＢの阻害活性（抗炎症活性）
・ｋＢＲＥを複数個持つルシフェラーゼレポーター配列が染色体に組み込まれた市販の細胞（ＮＦ−ｋＢ評価細胞株）
【０００９】
以下、図面に従って本発明の実施の態様を詳述する。図１は、本発明に用いるＳＯＭを例示する。図１において、ＳＯＭは、入力層と競合層により構成された２層のニューラルネットワークである。ＳＯＭは、非特許文献３に示すように、Ｔ．コホネンによって提案された教師なし競合学習型ニューラルネットワークであり、多次元からなるデータの関係をおおまかに視覚化できる。入力層ではｎ個の入力ノード各々が入力１つを受け持つ。競合層ではノードが格子状に並べられており、入力層の各ノードは競合層の全ノードと重みを介して結合している。競合層ノードの並べ方として、格子状の他にハニカム状（正六面体を平面状に並べた形態）を用いることもできる。競合層ノードの隣接関係として上下端、左右端で途切れた形でもよく、上下端、左右端をそれぞれ隣り合うとしたトーラス状としてもよい。時刻ｔ（ｔ＝０，１，２，…，Ｔ）で、競合層のｉ番目のノードが持つ重みをＷ_ｉ（ｔ）で表す。Ｗ_ｉ（ｔ）は、人力層のノード数と同じｎ個の要素を持つベクトルである。また学習の基準となる距離ｄには、入力ベクトルｘ（ｔ）とＷ_ｉ（ｔ）間のユークリッド距離が一般に用いられる。学習を通じ、ｄが一番小さい競合層のノード（勝者ノード）と、その近傍のノードの重みを式（１）で調整する。式（１）において、ａ_ｃ（ｔ）はｔが増加するにつれて単調減少する。また、重みを調整する領域もｔが増加するにつれて単調減少する。
【００１０】
【式１】
Ｗ_ｉ（ｔ＋１）＝Ｗ_ｉ（ｔ）＋ａ_ｃ（ｔ）［ｘ（ｔ）−Ｗ_ｉ（ｔ）］
【非特許文献３】Ｔ．コホネン「自己組織化マップ」シュプリンガー・フェアラーク東京、（１９９６）
【００１１】
図２は、本発明のバイオマーカー有効性推定方法の工程を示すフローである。図２において、重みベクトルの初期化は、任意の範囲の乱数を重みに代入することで行うことができる。組織化を重視する場合は、例えば競合層ノードの左上から右下に向かって徐々に小さくなる値としたり、逆に徐々に大きくなる値を与えてもよい。初期化された重みベクトルをもとに学習サンプルＡを提示し、バイオマーカー発現量に基づき勝者ノードを探索する。この探索には、一般的に蛋白質発現量とそれに対応する重み間のユークリッド距離を測定するのが望ましい。ユークリッド距離のほか、例えば蛋白質発現量とそれに対応する重みの値をそれぞれ２進数表現し、ハミング距離により測定することもできる。さらに、蛋白質発現量とそれに対応する重み間の余弦値を距離とすることもでき、この余弦値とベクトルの大きさをセットにして距離とすることもできる。本発明では、重みを更新する領域を、格子状の競合層では矩形の領域として、ハニカム状の競合層では六角形の領域として設定した後、重みを更新する際に蛋白質発現量に対応する重みに加えて、生理活性値に対応する重みも同時に更新する。重みを更新するにあたっては勝者ノードからマップ上で遠いノードほど重みの更新量を小さくするが、重み更新量を変化させる割合は距離に応じて線形としても良く、非線形としても良い。こうして、複数の蛋白質発現量と生理活性値が反映されたＳＯＭを得ることができる。終了条件としては、あらかじめ最大学習回数を設定しておくことができる。終了条件を満たせば、領域を分割（クラスタリング）し、領域（クラス）毎に蛋白質の発現量を比較する。終了条件を満たさなければ、学習サンプル提示ステップに帰って、満たすまで同じ操作を繰り返す。重みを更新する領域は学習回数が増加するにつれて縮小する必要があるが、その縮小度合いは線形でもよく、また非線形でもよい。
【００１２】
一方、前記領域分割には領域拡張法が好適である。領域拡張法では、まず基準となるノードを選択する。基準となるノードは生理活性値に対応する重みが最大であるノードを選ぶことができる。同様に生理活性値に対応する重みが最小であるノードを選んでも良い。基準となるノードを選択する繰り返し処理においては、生理活性値に対応する重み最大のノードから最小のノードに向かって選択していくことも、重み最小のノードから最大のノードに向かって選択していくことも、重みが大きいノードと小さいノードを交互に選択していくこともできる。基準となるノードにラベルが付与してあれば、基準ノードの選択ステップにかえるが、ラベルがなければラベルを付与し、近傍のノードを選択する。選択されたノードが生理活性値に対応する重みの差の閾値、例えば０．２５以下であればラベル付けずみか否かを調べ、ラベルが付与されていなければ基準ノードと同じラベルを付与する。基準ノードの近傍に、生理活性値に対応する重みの差が閾値以下のノードがなくなったとき、基準ノードが含まれる領域を確定させ、新たな基準ノードの選択を行って上記領域分割処理を継続する。最終的に、基準となるノードの生理活性値に対応する重みと、ラベルが付与されていない当該重みとの差が閾値以下となった時、残ノードに同一のラベルを付与して領域分割処理を終了する。
【００１３】
前述のように、競合層のノードは平面状に並べられており、これらの一つ一つが生理活性値に対応する重みをもっていることから、競合層を１枚の画像とみなすことが可能であり、本発明における領域分割には画像処理で用いられる各種領域分割法、例えば分割・統合法、ｋ−ｍｅａｎｓ法、ｓｎａｋｅｓ法が利用できる。
【００１４】
本発明で特徴的であるのは、ＳＯＭにおいて、蛋白質発現量と生理活性値をセットで入力しておくが、競合層の勝者ノードの探索には、入力された各蛋白質発現量間のユークリッド距離を測定して行い、勝者ノードを中心とする近傍の競合層ノードの重みベクトルの更新には、蛋白質発現量に加えて生理活性値も同時に更新する点にある。これにより、入力間の類似度は蛋白質発現量のみで決定されることになり、自己組織化のプロセスは蛋白質発現量を元に行われることになる。さらに、生理活性値に対応する重みも同時に更新することにより、その蛋白質発現量に応じた生理活性値を重みとして自律的に獲得することを可能にしている。
【００１５】
自己組織化マップの作成段階で、生理活性値と蛋白質発現量が既知の参照成分の生理活性値は、例えばＥＧＣＧの抗炎症活性の場合、ＥＧＣＧを、ＮＦ−ｋＢ評価細胞株（ＮＦ−ｋＢＡ５４９ＲｅｐｏｔｅｒＳｔａｂｌｅＣｅｌｌＬｉｎｅ：Ｐａｎｏｍｉｃｓ社製）に接触させ、そのルシフェラーゼ活性を測定する。蛋白質発現量は、例えばＨｅｐＧ２細胞に参照成分を接触させて測定する。
【００１６】
本発明における参照成分の生理活性には、既知の生理活性値に加えて、個別の生理活性測定法による結果を利用することもできる。生理活性測定法としては、レプリコンアッセイ、ＴＣＩＤ_５０法などの抗ウイルス作用、ＭＴＴアッセイ、ＷＳＴ−８アッセイなどの癌細胞増殖抑制作用、ＤＰＰＨラジカル消去活性測定、レポータージーンアッセイなどの抗酸化作用、抗炎症活性、硫酸転移酵素を用いたＡｍｅｓ変法、Ａｍｅｓ法、小核試験法、Ｒｅｃアッセイなどの抗変異原性、コルチコステロン、ＧＯＴ試験などの抗ストレス作用、ＴＵＮＥＬ法、ＡＮＮＥＸＩＮＶ法、ＤＮＡラダー法、カスパーゼ活性測定法などのアポトーシスアッセイ等を挙げることができる
【００１７】
参照成分としては、カテキン、エピカテキン、エピガロカテキン、ガロカテキン、カテキンガレート、エピカテキンガレート、ガロカテキンガレート、エピガロカテキンガレート（ＥＧＣＧ）などを含むカテキン類、ダイゼイン、ダイジン、ゲニステイン、ゲニスチン、グリシテイン、グリシチン、フォルモノネチンなどを含むイソフラボン類、シアニジン、ペラルゴニジン、デルフィニジンなどを含むアントシアニン類、ケルセチン、ミリセチン、ルチン、レスベラトロール、ケンフェロール、セサミン、クルクミン、リモニン、ガンマ−アミノ酪酸（ＧＡＢＡ）、アスタキサンチン、ガランギン、シトラール、トリゴネリン塩酸塩、エラグ酸、キナ酸、サポニン、カプサイシン、ハイドロコルチゾン、オレイン酸、ベンジルイソチオシアネート、マンギフェリン、アピゲニン、ルテオリン、クロロゲン酸、リモネン、スクアレン、レチノール、ロズマリン酸、カフェ酸、リポ酸などの化学物資、カロテノイド類、アラキドン酸、リノレン酸などを含む多価不飽和脂肪酸、９ｃ１１ｔＣＬＡ、１０ｔ１２ｃＣＬＡなどを含む共役リノール酸類、その他リバビリン、インターフェロン類、スタチン類など多様な化合物を挙げることができる。エピガロカテキンガレート、ゲニステイン、リポ酸など健康への効果が期待できるものは、特に好ましい。
【００１８】
参照成分の生理活性は、主として健康に関する機能性である。健康に関する機能性は、評価目的により異なるので必ずしも特定はできないが、食材の場合、抗酸化作用、抗変異原作用、アポトーシス誘導作用、がん細胞転移抑制作用、がん細胞増殖抑制作用、抗ストレス作用、免疫調節作用、抗ウイルス作用、ウイルス増殖抑制作用、動脈硬化抑制作用、血清脂質改善作用、高血圧予防作用、抗炎症作用、抗肥満など多様な機能を挙げることができる。特に、抗酸化作用、アポトーシス誘導作用、癌細胞増殖抑制作用など、癌の予防に関連する機能性の評価が期待されている。
【００１９】
参照成分のバイオマーカー発現量の評価には、抗酸化作用、抗炎症作用、抗変異原作用、アポトーシス誘導作用、癌細胞増殖抑制作用、抗ストレス作用、免疫調節作用、抗ウイルス作用、ウイルス増殖抑制作用などの各機能性に関係する蛋白質を挙げることができる。さらに、機能性に関わり、その発現量が変化するバイオマーカーとともに、発現量がほとんど変化しないハウスキーピングタンパク質（Ｇ６ＰＤＨ、ＧＡＰＤＨ、ａｃｔｉｎなど）をコントロールマーカーとして取扱い、これらを含めてバイオマーカーとするのが望ましい。表１に、代表的なバイオマーカーを目的とする生理活性との関係で示す。
【００２０】
【表１】

注：関連する機能を○印で示す。
Ａ…ハウスキーピング（コントロール）
Ｂ…アポトーシス誘導作用
Ｃ…抗酸化作用
Ｄ…癌細胞増殖抑制作用
Ｅ…抗ストレス作用
Ｆ…抗炎症作用
【００２１】
バイオマーカーは、文献および公開データベース上の公知情報、プロテオーム解析、ＤＮＡマイクロアレイ（ＤＮＡチップ）解析などの個別評価系による解析結果から選定することができる。公開データベースには、米国ＮＣＢＩにあるＰｕｂＭｅｄを使用して検索できるデータベースおよびインターネットを通じて検索できるデータベースを挙げることができる。
【００２２】
バイオマーカーの発現量を測定する細胞には、好適にはＪｕｒｋａｔ細胞、ＨＬ−６０細胞、ＭＯＬＴ−４細胞、Ｈｕｈ−７細胞、ＨｅｐＧ２細胞、Ｈｅｐ３Ｂ細胞、Ｃａｃｏ−２細胞、ＨｅＬａ細胞、ＭＣＦ−７細胞、Ａ４３１細胞、Ａ５４９細胞、Ｓ１Ｔ細胞、Ｓｕ９Ｔ０１細胞、ＨＵＴ１０１細胞、ＰＬＣ／ＰＲＦ−５細胞、Ｌｉ９０細胞、ＨＵＶＥＣ細胞、ＨＭＥＣ細胞、ＨＴ１７細胞、ＮＩＨ−３Ｔ３細胞、３Ｔ３−Ｌ１細胞、ＭＨ１３４細胞、ｄＲＬｈ−８４細胞、ＲＬＮ−１０細胞、ＰＣ１２細胞、３Ｙ１細胞などヒト、マウス、ラットなど哺乳動物由来細胞株、またはこれらの細胞株から派生する細胞株を挙げることができる。その中で、ヒト白血病由来細胞、ヒト肝がん由来細胞が特に望ましい。ヒト白血病由来細胞には、Ｓ１Ｔ細胞、Ｓｕ９Ｔ０１細胞、ＨＵＴ１０１細胞、Ｊｕｒｋａｔ細胞、ＨＬ−６０細胞などを挙げることができる。ヒト肝がん由来細胞には、ＰＬＣ／ＰＲＦ−５細胞、Ｌｉ９０細胞、Ｈｕｈ−７細胞、ＨｅｐＧ２細胞などを挙げることができる。
【００２３】
培養条件としては、温度は３７℃または通常の哺乳動物細胞が生育する温度とし、炭酸ガス濃度は５％または通常の哺乳動物細胞が生育する濃度が好ましい。酸化されやすい成分の場合は培養における酸素濃度を低くすることが望まれる。
【００２４】
培地としては、Ｄ−ＭＥＭ培地、ＭＥＭ培地、ＲＰＭＩ１６４０培地、Ｄ−ＭＥＭ／Ｆ−１２培地、Ｆ−１０培地、Ｆ−１２培地、ＥＲＤＦ培地など、確立された哺乳動物細胞用培地、またはそれらを基本とした培地が好ましい。Ｊｕｒｋａｔ細胞やＨＬ−６０細胞などヒト白血病由来細胞にはＲＰＭＩ１６４０培地を、Ｈｕｈ−７細胞、ＨｅｐＧ２細胞などヒト肝がん由来細胞にはＤ−ＭＥＭ培地の使用が好適である。細胞の成長を促すためには、牛胎児血清を１０％または通常の哺乳動物細胞が生育する濃度で添加してもよい。必要に応じて、非必須アミノ酸、サイトカイン（ＦＧＦ，ＨＧＦ，ＶＥＧＦ，インターロイキン−２など）を添加することもできる。ただし、血清で増殖が抑制される細胞株では無血清培養を使用する。
【００２５】
培養には、使用する細胞に適した培他の選定に加えて、細胞数、細胞密度、細胞周期などの培養条件を選択するために、必要に応じて予備的な培養実験を実施することが推奨される。
【００２６】
参照成分と細胞を作用させる混合時間は、作用開始時を０時間とし、１時間、２時間、３時間、６時間、９時間、１２時間、１８時間、２４時間、３６時間、４８時間、７２時間などから検討する。２４時間以内で機能性を判定できる場合には、それ以上作用させるには及ばない。
【００２７】
細胞へ供与する参照成分の濃度は、２μＭ、４μＭ、５μＭ、８μＭ、１０μＭ、１５μＭ、２０μＭ、３０μＭ、３５μＭ、４０μＭ、５０μＭ、６０μＭ、７０μＭ、１００μＭ、１５０μＭ、２００μＭ、２５０μＭ、３００μＭ、４００μＭ、８００μＭ、１０００μＭ、及びこれらの濃度の１０００倍および１／１０００倍の濃度の中から、参照成分及び細胞に適した濃度を選定する。通常、２μＭから１０００μＭの範囲が望ましい。
【００２８】
参照成分を付与した細胞が応答した後、浮遊細胞の場合は、遠心分離により細胞と細胞分泌物を分離する。接着細胞の場合は、ピペット操作で細胞と細胞分泌物を分離し、細胞分泌物はそのまま被検試料とする。必要に応じて、細胞破砕物は密度勾配遠心、連続遠心などにより、核、ミトコンドリア、小胞体などの特定の細胞小器官を採取し、さらなる細胞小器官抽出物としたものも参照成分とすることもある。細胞の破砕は、細胞破砕装置、例えばテフロン（登録商標）ホモジナイザー、ダウンスホモジナイザー、ポリトロンタイプホモジナイザー、超音波破砕装置、ビーズ破砕装置などによる破砕、または界面活性剤、例えばＴｒｉｔｏｎＸ−１００、ＴｒｉｔｏｎＸ−１１４、ＮＰ−４０、ＣＨＡＰＳ、ＳＢ３−１０、コール酸ナトリウム、デオキシコール酸、ＣＡ−６３０、Ｔｗｅｅｎ２０などによる破砕、または細胞破砕装置と界面活性剤の併用による破砕から、任意に選択すればよい。必要に応じて、ＥＤＴＡ等のキレート剤を加えても良い。破砕の後は、遠心分離装置により細胞抽出物および残さに分離する。
【００２９】
バイオマーカーの評価には、統合型イムノアッセイを用いる。イムノアッセイでは、イムノアッセイを基盤としたバイオマーカーに特異的な抗体を使用する。好適には、バイオマーカーとの抗原抗体反応を利用する。イムノアッセイには、ＥＬＩＳＡ、ウエスタンブロッティング、抗体チップ（抗体アレイ）、ビーズアレイ、イムノクロマトなどを利用する。代表的なイムノアッセイであるＥＬＩＳＡには非特許文献４を、ウエスタンブロッティングには非特許文献５を、そしてイムノクロマトには非特許文献６を挙げておく。測定部位として、ＥＬＩＳＡの場合は、マイクロプレート上での特異的抗体による検出を行う。マイクロプレートには、６，１２，２４，４８，９６，３８４、及び１５３６ウエルのプレートなどがあるが、９６ウエルが一般的である。ウエスタンブロッティングの場合は、膜上で特異的抗体による検出を行う。膜には、ＰＶＤＦ膜、ニトロセルロース膜などを使用できる。
【非特許文献４】石川栄治ほか、編「酵素免疫測定法第３版」医学書院、東京、１９８７
【非特許文献５】高津聖志ほか、編「タンパク質研究のための抗体実験マニュアル」羊土社、東京、２００４
【非特許文献６】ＺｕｋＲＦ，ＧｉｎｓｂｅｒｇＶＫ，ＨｏｕｔｓＴ，ＲａｂｂｉｅＪ，ＭｅｒｒｉｃｋＨ，ＵｌｌｍａｎＥＦ，ＦｉｓｃｈｅｒＭＭ，ＳｉｚｔｏＣＣ，ＳｔｉｓｏＳＮ，ＬｉｔｍａｎＤＪ．Ｅｎｚｙｍｅｉｍｕｎｏｃｈｒｏｍａｔｏｇｒａｐｈｙ：ａｑｕａｎｔｉｔａｔｉｖｅｉｍｍｕｎｏａｓｓａｙｒｅｑｕｉｒｉｎｇｎｏｉｎｓｔｒｕｍｅｎｔａｔｉｏｎ．ＣｌｉｎＣｈｅｍ．１９８５Ｊｕｌ；３１（７）：１１４４−５０
【００３０】
同様に、イムノアッセイに抗体チップ（抗体アレイ）を用いる場合は、ＰＶＤＦ膜、ニトロセルロース膜などの膜、スライドグラスあるいは類似の基盤上で、特異的抗体による検出を行う。ビーズアレイの場合はビーズ上で、イムノクロマトの場合はスティック上で、特異的抗体による検出を行う。検出は、抗体（一次抗体、二次抗体）に標識した酵素の反応による発色法、化学発光法、化学蛍光法や抗体に直接蛍光色素を標識した蛍光法があり、簡便な発色法や感度が高く定量性の良い化学発光法が望ましい。酵素には、ペルオキシダーゼやアルカリホスファターゼの使用が好適である。
【００３１】
イムノアッセイとしては、多数の試料の同時解析、定量解析、分析装置の価格などを考慮した場合、ＥＬＩＳＡ法を用いることが特に好ましい。
【００３２】
プロテオーム解析は、ＩＰＧストリップを使用した１次元目等電点電気泳動、２次元目ＳＤＳ−ＰＡＧＥによる２次元電気泳動、電気泳動パターンの色素染色によるイメージ解析、タンパク質スポットの質量分析装置による解析及び同定により行うことができる。特に、定量性にすぐれた蛍光色素によるプレラベル標識による蛍光ディファレンシャル解析が望ましい。
【００３３】
ＤＮＡマイクロアレイ（ＤＮＡチップ）解析は、市販のＤＮＡマイクロアレイ（ＤＮＡチップ）例えば、ＧｅｎｅＣｈｉｐプローブアレイ（Ａｆｆｙｍｅｔｒｉｘ社）、ＣｏｄｅＬｉｎｋＢｉｏａｒｒａａｙ（アマシャム・バイオサイエンス社）およびこれらに類するものを使用することが出来るが、ＧｅｎｅＣｈｉｐプローブアレイ（Ａｆｆｙｍｅｔｒｉｘ社）を使用することが好ましい。
【００３４】
本発明に適用する抗体としては、モノクローナル抗体、ポリクローナル抗体、抗血清、リコンビナント抗体のいずれもバイオマーカーに対する特異性があれば使用可能であるが、モノクローナル抗体の使用が好ましい。モノクローナル抗体は、実験動物としてマウスを使用してバイオマーカーに対する抗原を免役した後、非特許文献７に記載された方法により調製する。抗原には、精製タンパク質、リコンビナントタンパク質、合成ペプチドなどを使用できる。
【非特許文献７】Ｇａｌｆｒｅ，Ｇ．，Ｍｉｌｓｔｅｉｎ，Ｃ．，Ｐｒｅｐａｒａｔｉｏｎｏｆｍｏｎｏｃｌｏｎａｌａｎｔｉｂｏｄｉｅｓ：ｓｔｒａｔｅｂｉｅｓａｎｄｐｒｏｃｓｄｕｒｅｓ，ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ．１９８１；７３（ＰｔＢ）：３−４６．
【００３５】
また抗体には、市販されているものであっても、バイオマーカーに対する特異性があれば、モノクローナル抗体、ポリクローナル抗体、抗血清、リコンビナント抗体のいずれの抗体も使用可能である。
【００３６】
本発明では、前記のごとくして構築されたＳＯＭにおいて、学習を通じて獲得した生理活性値に対応する重み要素Ｗ_ｐ＋１，・・・，Ｗ_Ｎの値に基づき、競合層のノードを複数の領域（クラス）に分割する。本発明におけるＳＯＭは個々の競合層のノードが重みとして値（生理活性値）を持ち、これらが２次元状に配置されていることから一種の画像とみなすことが出来る。したがって、領域の分割には画像処理で用いられる領域分割法、例えば領域拡張法、分割・統合法、ｋ−ｍｅａｎｓ法、ｓｎａｋｅｓ法が利用できる。本発明における領域分割では、生成される領域数が未確定であること、競合層のノードが格子状に配置されていることから領域拡張法が好適である。ＳＯＭ上に生成された生理活性値の最大値に対応する競合層のノードを中心とし、近傍にある競合層のノードが持つ生理活性値が閾値以下であればこれらを同一のクラスとしてラベル付けを行い、これを近傍領域が拡大しなくなるまで繰り返す。次に、生理活性値が最小の競合層のノードを中心としてすでにラベル付けが行われていないノードに対して同様の処理を繰り返す。次に、生理活性値が２番目に大きいノードを中心に、さらに生理活性値が２番目に小さいノードを中心にとこの操作を繰り返し、最終的に生理活性値が大きい側のノードと小さい側のノード間の生理活性値に対応する重みの差が閾値以下になった時、ラベル付けされていないノードすべてを同一クラスとしてラベル付けし領域分割を終了する。こうして生成された各領域のうち、高い生理活性値を示す領域の蛋白質発現量い対応する重みＷ_ｐ＋１、…、Ｗ_Ｎと低い生理活性値を示す領域のＷ_ｐ＋１、…、Ｗ_Ｎを比較する。高い生理活性を示す領域と低い生理活性を示す領域とで同様の発現量を示す蛋白質は活性値の推定には寄与しないバイオマーカーであり、異なる値を示す蛋白質は生理活性値の推定の鍵となりうるバイオマーカーであることが分かる。さらに、生理活性値の値が同等であってもバイオマーカーの値が著しく異なる場合には、細胞内における生理活性発現機序が異なっている可能性を示しており、これをもとに生理活性発現の仕組みを生理学的に探求するきっかけを提供することが出来る。
【実施例】
【００３７】
（１）蛋白質の発現量と生理活性値の測定
【００３８】
ａ）参照成分の調整：
参照成分としては、表２に示す成分を用いた。蛋白質の発現量の測定には、ヒト肝がん由来細胞株ＨｅｐＧ２細胞を用いた。細胞は、１０％牛胎児血清（ＦＣＳ）含有Ｄ−ＭＥＭ培地を用いて、３７℃、５％ＣＯ_２ガスで平衡化したＣＯ_２インキュベータ内で培養した。対数増殖期にあるＨｅｐＧ２細胞を３×１０^５ｃｅｌｌｓ／ｍｌの細胞密度でプラスティックシャーレに接種し、２４時間後、表２に示す終濃度になるように学習用の参照成分を調製、添加した。
【００３９】
【表２】

【００４０】
ｂ）蛋白質（バイオマーカー）の測定：
ＨｅｐＧ２細胞は、細胞溶解緩衝液（１ｍＭＥＤＴＡ，０．００５％Ｔｗｅｅｎ２０，０．５％ＴｒｉｔｏｎＸ−１００，プロテアーゼ阻害剤を含有するＰＢＳ）を加え、セルスクレーパーで細胞を回収した。その後、穏やかに撹拌し、遠心分離後、その上清を総蛋白質濃度が１ｍｇ／ｍｌになるように調製したものを用いた。
【００４１】
添加により発現した蛋白質のうち、参照成分中に含まれる対象バイオマーカー量の測定は、ＥＬＩＳＡによって行った。測定対象バイオマーカーは、Ｔｈｉｏｒｅｄｏｘｉｎ，Ｓｕｒｖｉｖｉｎ，Ｈｅａｔｓｈｏｃｋｐｒｏｔｅｉｎ７０（ＨＳＰ７０），Ｘ−ｌｉｎｋｅｄｉｎｈｉｂｉｔｏｒｏｆａｐｏｐｔｏｓｉｓｐｒｏｔｅｉｎ（ＸＩＡＰ），Ｆａｓ−ａｓｓｏｃｉａｔｅｄｄｅａｔｈｄｏｍａｉｎｐｒｏｔｅｉｎ（ＦＡＤＤ），Ｔｈｉｏｒｅｄｏｘｉｎｒｅｄｕｃｔａｓｅ１（ＴＸＮＲＤ１），Ｈｅａｔｓｈｏｃｋｐｒｏｔｅｉｎ９０（ＨＳＰ９０），ＩＦＮ−ｉｎｄｕｃｉｂｌｅａｎｔｉｖｉｒａｌｐｒｏｔｅｉｎＭｘ（ＭｘＡ），Ｔｕｍｏｒ−ａｓｓｏｃｉａｔｅｄｈｙｄｒｏｑｕｉｎｏｎｅｏｘｉｄａｓｅ（ｔＮＯＸ），ＮＡＤ（Ｐ）Ｈｄｅｈｙｄｒｏｇｅｎａｓｅ［ｑｕｉｎｏｎｅ］１（ＮＱＯ１），Ｔｕｍｏｒｓｕｐｐｒｅｓｓｏｒｐ５３（ｐ５３），Ｅｘｔｒａｃｅｌｌｕｌａｒｓｉｇｎａｌ−ｒｅｇｕｌａｔｅｄｋｉｎａｓｅ２（ＥＲＫ２），Ｂ−ｃｅｌｌｌｙｍｐｈｏｍａ２（Ｂｃｌ−２）の１３種類とした。またサンプルを標準化するため、Ｇｌｙｃｅｌａｌｄｅｈｙｄｅ−３−ｐｈｏｓｐｈａｔｅｄｅｈｙｄｒｏｇｅｎａｓｅ（ＧＡＰＤＨ）についても測定した。
【００４２】
一例として、Ｔｈｉｏｒｅｄｏｘｉｎの測定について説明する。以下の操作の温度は全て３７℃で行った。抗ヒトＴｈｉｏｒｅｄｏｘｉｎマウス抗体（５００ｎｇ／ｍｌ：５０ｍＭ炭酸緩衝液、ｐＨ９．６）を９６穴マイクロプレートの各穴に１００μｌずつ添加し、２時間静置してプレートに固定化した。０．０５％のＴｗｅｅｎ２０含有ＰＢＳ（ＴＰＢＳ）で各穴を１回洗浄した後、１％ＢＳＡ含有ＰＢＳを各穴に３００μｌずつ添加し、２時間静置しブロッキングを行った。各穴をＴＰＢＳで３回洗浄した後、１０倍に希釈した細胞抽出液を各穴に１００μｌずつ添加し、２時間反応させた。各穴をＴＰＢＳで３回洗浄した後、検出抗体として抗ヒトＴｈｉｏｒｅｄｏｘｉｎヤギ抗体（１００ｎｇ／ｍｌ：１％ＢＳＡ含有ＰＢＳ）を各穴に１００μｌずつ添加し、さらに１時間反応させた。各穴をＴＰＢＳで３回洗浄した後、二次抗体として西洋わさびパーオキシダーゼ（ＨＲＰ）で標識されている抗ヤギＩｇＧマウス抗体（２００ｎｇ／ｍｌ：１％ＢＳＡ含有ＰＢＳ）を１００μｌ添加し、さらに１時間反応させた。最後にＴＰＢＳで４回洗浄して基質溶液｛０．３ｍｇＡＢＴＳ［ｐ−２、２’−ａｚｉｎｏ−ｂｉｓ−（３−ｅｔｈｙｌｂｅｎｚｏｔｈｉａｚｏｌｉｎｅ−６−ｓｕｌｆｏｎｉｃａｃｉｄ）ｄｉａｍｍｏｎｉｕｍｓａｌｔ］０．０３％Ｈ_２Ｏ_２含有０．１Ｍクエン酸緩衝液、ｐＨ４｝を１００μｌずつ添加し、１０分間反応させ、４０５−４９０ｎｍの吸光度をマイクロプレートリーダーで測定した。他のバイオマーカーについても概略は同様に行った。使用した抗体類の一覧を表３に示す。測定結果は表４に示す。
【００４３】
【表３】

【００４４】
吸光度として得られた各バイオマーカー発現量のデータを標準化するために、それぞれの吸光度をＧＡＰＤＨの吸光度で除し、単位ＧＡＰＤＨ発現量当たりのバイオマーカー発現量とした。
さらに、これらの値をコントロール被検試料のバイオマーカー発現量で除すことで、試験群のバイオマーカー発現量をコントロールに対する相対値として得た。参照成分をＨｅｐＧ２細胞に添加した際のバイオマーカー発現量を表４に示す。
【００４５】
【表４】

【００４６】
ｃ）生理活性値（抗炎症活性）の測定：
・ルシフェラーゼレポーター安定発現細胞の調製；転写因子であるＮＦ−ｋＢは炎症反応、アポトーシス、免疫または腫瘍形成の制御に重要な役割を果たす。通常、ＮＦ−ｋＢはＩｋＢ（ＩｎｈｉｂｉｔｏｒｙｋａｐｐａＢｐｒｏｔｅｉｎ）と細胞質で複合体を形成し、不活性化状態で存在する。炎症亢進するサイトカイン等の刺激により、ＭＡＰＫ（ｍｉｔｏｇｅｎ−ａｃｔｉｖａｔｅｄｐｒｏｔｅｉｎｋｉｎａｓｅ）ファミリーに属する数種のキナーゼによりＩｋＢがリン酸化された後、ポリユビキチン化され、プロテアソームにより分解されると、ＩｋＢより拘束されていたＮＦ−ｋＢは核内に移行し、染色体上の特異的なＤＮＡモチーフであるＮＦ−ｋＢの認識配列に結合し、炎症反応に関与する遺伝子の発現誘導を行う。ＮＦ−ｋＢは炎症反応、アポトーシス、免疫または腫瘍形成の制御に関わる多くの遺伝子の発現を制御している。このＮＦ−ｋＢの認識配列をルシフェラーゼ翻訳領域、ハイグロマイシン耐性遺伝子を有するプラスミドに導入し、レポーターベクターとしたものを、ヒト肺がん上皮細胞Ａ５４９に導入し、染色体ＤＮＡに安定に組み込まれた市販の細胞株（ＮＦ−ｋＢＡ５４９ＲｅｐｏｔｅｒＳｔａｂｌｅＣｅｌｌＬｉｎｅ：Ｐａｎｏｍｉｃｓ社製）を抗炎症活性の評価に供した。
【００４７】
細胞の継体には、ＤＭＥＭ１０［ＧＩＢＣＯ社のＧｌｕｔａＭＡＸＭｅｄｉａＤｕｌｂｅｃｃｏ’ｓＭｏｄｉｆｉｅｄＥａｇｌｅＭｅｄｉｕｍ（Ｄ−ＭＥＭ）（１×）、ｌｉｑｕｉｄ（Ｈｉｇｈｇｌｕｃｏｓｅ、ｃｏｎｔａｉｎｓｓｏｄｉｕｍｐｙｒｕｖａｔｅ）］にＦＢＳ（Ｈｙｃｌｏｎｅ社）１０％、Ｐｅｎｉｃｉｌｌｉｎ−Ｓｔｒｅｐｔｏｍｙｃｉｎ（ＧＩＢＣＯ社）、及びＨｙｇｒｏｍｙｃｉｎ（ＳＩＧＭＡ社）を添加した培地を用いた。アッセイを行なう際のアッセイ培地には、ＤＭＥＭ１０にＰｅｎｉｃｉｌｌｉｎ−Ｓｔｒｅｐｔｏｍｙｃｉｎを添加したもの（但し、Ｈｙｇｒｏｍｙｃｉｎは加えない。）を用いた。ＮＦ−ｋＢの活性化の程度は、ルシフェラーゼアッセイ法により測定した。
【００４８】
・ルシフェラーゼアッセイ法；この方法では、マグネシウム存在下で、ルシフェリンとＡＴＰから酸化ルシフェリンとＡＭＰを作る反応をルシフェラーゼが触媒する。ルシフェラーゼアッセイ法は、この時発生する光を発光検出器で検出して、得られた光量に基づいてルシフェラーゼ活性を評価する方法である。本発明では便宜上、この光量がＮＦ−ｋＢの活性化の程度を示すものとした。
【００４９】
【表５】

【００５０】
（２）ＳＯＭへの入力
表４の蛋白質発現量と表５の生理活性値は、それぞれ個別に複数回測定されているため、同一成分の同一濃度であっても一つの参照ベクトルとして構成するためにはこれらを適切に組み合わせる必要がある。本発明では各参照成分の各濃度のそれぞれで測定された蛋白質発現量値と生理活性値のすべての組合せについて単回帰分析を行い、ｐ値が０．０５以下でかつ最小となる組合せを総当りで探索した。抗炎症活性については生理活性値が６点得られているため、各参照成分の濃度あたり１４次元（蛋白質発現量として１３次元、生理活性（抗炎症活性）値に１次元）のベクトル６個を生成する。これにより生成したＳＯＭへの入力加工データの例を表６に示す。
【００５１】
【表６】

【００５２】
表６の１行（１３種類の蛋白質発現量とひとつの生理活性値）を１セットとし、１種類の参照成分の濃度あたり６セットずつをＳＯＭに入力した。すべてのデータは、３０成分×３濃度×６＝５４０セットであった。本発明のバイオマーカー有効性推定方法の工程を示すフローを図２に示す。図２に示すように、領域分割は再帰処理により実現した。ＳＯＭの勝者ノードを競合層から探索するには、蛋白質発現量１３種類とそれに対応する重み間のユークリッド距離を測定した。重みベクトルを更新するには、１３種類の蛋白質発現量に対応する重みに加えて、生理活性値に対応する重みも同時に更新した。ＳＯＭ上の競合層ノードは格子状配置とし、上下端、左右端がそれぞれ結合したトーラス状結合とした。こうして、複数の蛋白質発現量と生理活性値が反映されたＳＯＭを得た。図３には、蛋白質発現量に基づいて生成した自己組織化マップの例を示す。図３は生理活性値に対応する重みが２以上を白（輝度値２５５）に、生理活性値に対応する重みが０を黒（輝度値０）としてその間の生理活性値に対応する重みを２５６階調で均等に表現したものである。図３から、生理活性値に対応する重みの高い領域、低い領域、中間の領域が自動的に生成されていることが分かる。図４には生理活性値に対応する重みに基づいて各領域を自動的にクラスタリングした結果を示す。図４における各領域の色の違いは、単に異なる領域（クラス）であることを表しており、図３のような生理活性値の重みの大小とは無関係である。図４より、図３で示した生理活性値に対応する重みの大小に基づき、各領域が自動的に抽出されていることが分かる。このとき生成された領域数は１０４であり、領域間の生理活性値に対応する重みの差が０．２５以下のとき、競合層のノードは同一領域に属するとした。このしきい値は、最小０．０５から最大１．０まで０．０５刻みで変化させて同一領域に属する蛋白質発現量に対応する重みの分散が最も小さくなる値として決定した。
【００５３】
（３）バイオマーカーの有効性の推定
重みの初期値をかえてＳＯＭを学習させ、生成されたマップにおける抗炎症活性値に対応する重み要素に基づき競合層ノードを複数の領域に分割する実験を１０回行った。おのおのの実験において、生理活性値に対応する重みが大きい５クラス、及び小さい５クラスについて、各蛋白質発現量に対応する重みの平均値と標準偏差を図５に示した。図５（イ）は生理活性値に対応する重みが大きい５クラス、図５（ロ）は生理活性値に対応する重みが小さい５クラスのものである。図５（イ）において１ｓｔＭａｘは生理活性値に対応する重みがもっとも大きいクラスを表し、以下２番目に大きいクラスを２ｎｄＭａｘのように表した。同様に図５（ロ）において１ｓｔＭｉｎは生理活性値に対応する重みが最も小さいクラスを表し、以下２番目に小さいクラスのそれを２ｎｄＭｉｎのように表した。図５（イ）、（ロ）から分かるように、生理活性値に対応する重みの大きさ（小ささ）が３番目以降のクラスについては標準偏差が大きくなっており、生理活性値に対応する重みの大きさ（小ささ）が１番目、２番目のクラスが比較対象として好適であることが分かった。
【００５４】
次に、１０回の実験にそれぞれにおける１ｓｔＭａｘ、１ｓｔＭｉｎの領域内の蛋白質発現量に対応する重みの平均値を、図６（イ）及び図６（ロ）にそれぞれ示す。図６（イ）、（ロ）より、重みの初期値を変えた１０回の実験を通じておよそ安定した学習と領域分割が行われていることがわかる。
【００５５】
図７に、生理活性値に対応する重みが最大の領域（１ｓｔＭａｘ）と最小の領域（１ｓｔＭｉｎ）における、各蛋白質発現量に対応する重みの平均値と標準偏差を示す。生理活性値推定にある蛋白質が好適であるのは、生理活性値に対応する重みが大きい領域、小さい領域でその発現量に差がある場合である。したがって、図７よりＴｈｉｏｒｅｄｏｘｉｎ、Ｓｕｒｖｉｖｉｎ、ＸＩＡＰ、ＦＡＤＤ、ＥＲＫ２、ｐ５３の各蛋白質については、生理活性に対応する重みが最大の領域と最小の領域とで値に差がなく、抗炎症活性の有無の判定には不適であることが分かる。一方、ＨＳＰ７０、ＴＸＮＲＤ１、ＨＳＰ９０、ＭｘＡ、ｔＮＯＸ、ＮＱＯ１、Ｂｃｌ２の各蛋白質については、生理活性に対応する重みの平均値が最大の領域と最小の領域とで大きく異なり、かつ標準偏差を考慮しても値が重ならないことから、抗炎症活性の有無の判定に好適であることが分かる。
【００５６】
図８に、生理活性値に対応する重みが２番目に大きい領域（２ｎｄＭａｘ）と２番目に小さい領域（２ｎｄＭｉｎ）における、各蛋白質発現量に対応する重みの平均値と標準偏差を示す。図７の場合と同様に、生理活性値に対応する重みの平均値の差が十分大きく、かつ標準偏差を考慮しても値が重ならない蛋白質を調べると、Ｔｈｉｏｒｅｄｏｘｉｎ、ＸＩＡＰ、ＨＳＰ９０、ｔＮＯＸ、ＮＱＯ１、の５つが挙げられる。一方、平均値が同等であるか、標準偏差が重なる蛋白質はＳｕｒｖｉｖｉｎ、ＨＳＰ７０、ＦＡＤＤ、ＴＸＮＲＤ１、ＭｘＡ、ＥＲＫ２、ｐ５３が挙げられる。
【００５７】
表７に、抗炎症活性の推定に対する蛋白質の適合度合いをまとめる。表７において、当該蛋白質が推定に適する場合は○、不適の場合は×を記述した。また、有効性の推定では、１ｓｔＭａｘ−１ｓｔＭｉｎ、２ｎｄＭａｘ−２ｎｄＭｉｎともに○の場合に○を、１ｓｔＭａｘ−１ｓｔＭｉｎ、２ｎｄＭａｘ−２ｎｄＭｉｎのどちらか一方が○の場合に△を、１ｓｔＭａｘ−１ｓｔＭｉｎ、２ｎｄＭａｘ−２ｎｄＭｉｎともに×の場合に×を記述した。
【００５８】
【表７】

【００５９】
表７から明らかなように、生理活性のひとつである抗炎症活性の測定に有効な蛋白質として、重み要素の比較からＨＳＰ９０、ｔＮＯＸ、ＮＱＯ１が有効であると推定できる。また、参考にすべき蛋白質として、Ｔｈｉｏｒｅｄｏｘｉｎ、ＨＳＰ７０、ＸＩＡＰ、ＴＸＮＲＤ１、ＭｘＡ、Ｂｃｌ２が挙げられる。さらに、抗炎症活性推定時に考慮しなくて良い蛋白質として、Ｓｕｒｖｉｖｉｎ、ＦＡＤＤ、ＥＲＫ２、ｐ５３があることが分かる。抗炎症活性推定に好適な３つの蛋白質ＨＳＰ９０、ｔＮＯＸ、ＮＱＯ１のうち、ＮＱＯ１は２ｎｄＭａｘ−２ｎｄＭｉｎを比較した図８から分かるように、標準偏差を考えるとその発現量に対応する重みが、抗炎症活性が大きくても小さくても１．０近辺となる可能性がある。一方、ＨＳＰ９０とｔＮＯＸは抗炎症活性の大きさに応じて発現量も相応に異なっており、図７及び図８からＨＳＰ９０の発現量がおよそ０．９５から１．２であり、かつｔＮＯＸの発現量がおよそ０．８５から１．５程度の発現量を示したとき大きな抗炎症活性値を示すことが推定できる。同様に、ＨＳＰ９０の発現量がおよそ０．２５から０．９であり、かつｔＮＯＸの発現量がおよそ０．５から０．７５程度の発現量を示したとき、小さな抗炎症活性値を示すことが推定できる。
【産業上に利用可能性】
【００６０】
本発明のクラスタリングによる蛋白質（バイオマーカー）の有効性推定方法は、例えば医薬品候補成分や食品成分の生理活性評価に利用可能である。特に、天然物由来の多成分系組成物の高スループット機能性評価において、多数の生理活性を同時に評価する場合、利用可能なバイオマーカーの判定に好適である。
【図面の簡単な説明】
【００６１】
【図１】本発明に使用する自己組織化マップの概念を示す模式図である。
【図２】本発明のバイオマーカー有効性推定方法の工程を示すフロー図である。
【図３】実施例のＳＯＭ上に生成された生理活性（抗炎症活性）に対応する重みの値を示す写真である。
【図４】実施例のＳＯＭを生理活性値に対応する重みに基づき自動的にクラスタリングした結果を示す写真である。
【図５】生理活性値に対応する重みが大きい５領域と小さい５領域における、蛋白質発現量に対応応する重みの平均値と標準偏差を示すグラフで、（イ）は生理活性値に対応する重みが大きい５領域における、各蛋白質発現量に対応する重みの平均値と標準偏差、（ロ）は生理活性値に対応する重みが小さい５領域における、各蛋白質発現量に対応する重みの平均値と標準偏差である。
【図６】１ｓｔＭａｘ、１ｓｔＭｉｎ領域内の蛋白質発現量に対応する重みの平均値を示したグラフで、（イ）は１０回の実験における生理活性値最大の領域内の各蛋白質発現量に対応する重みの平均値、（ロ）１０回の実験における生理活性値最小の領域内の各蛋白質発現量に対応する重みの平均値である。
【図７】１０回の実験を通じた生理活性値に対応する重みが最大の領域と最小の領域の、蛋白質発現量に対応する重みの平均値と標準偏差を示すグラフである。
【図８】１０回の実験を通じ生理活性値に対応する重みが２番目に大きい領域と２番目に小さい領域の、蛋白質発現量に対応する重みの平均値と標準偏差である。

【特許請求の範囲】
【請求項１】
入力層の入力ノードと、競合層のすべてのノードが重みＷ＝｛Ｗ_１，…，Ｗ_Ｎ｝を介して結合している自己組織化マップを用いたクラスタリングにおいて、蛋白質発現量Ｘ＝｛Ｘ_１，…，Ｘ_ｐ｝と生理活性値Ｙ＝｛Ｙ_１，…，Ｙ_ｑ｝が既知である参照成分Ａの蛋白質発現量Ｘと生理活性値Ｙとをセットで入力し、重み要素Ｗ_１，…，Ｗ_ｐと蛋白質発現量要素Ｘ_１，…，Ｘ_ｐ間のユークリッド距離ｄが最小となる競合層のノードを勝者ノードとし、勝者ノードを中心とする近傍に存在する競合層のノードの重み更新にあたっては、蛋白質発現量に対応する重み要素Ｗ_１，…，Ｗ_ｐに加えて、生理活性値に対応する重み要素Ｗ_ｐ＋１，…，Ｗ_Ｎも同時に更新して自己組織化マップを構築し、学習を通じて獲得した生理活性値に対応する重み要素Ｗ_ｐ＋１，…，Ｗ_Ｎの値に基づいて競合層のノードを複数の領域に分割（クラスタリング）し、各領域に属する競合層のノードが持つ蛋白質発現量に対応する重み要素Ｗ_１，…，Ｗ_ｐを比較することにより、生理活性の推定に有効な蛋白質であると認定することを特徴とするクラスタリングによる蛋白質の有効性推定方法。
【請求項２】
参照成分が食品成分であることを特徴とする請求項１記載の方法。

【図１】