説明

クラスタリングによる蛋白質の有効性推定方法

【課題】計算機により、生理活性値の測定に有効な蛋白質の推定方法を提供する。
【解決手段】有効な蛋白質(バイオマーカー)の推定には、入力層の入力ノードと、競合層のすべてのノードが重みを介して結合している自己組織化マップによるクラスタリングを用いる。蛋白質発現量と生理活性値が既知の参照成分の蛋白質発現量と生理活性値とをセットで入力する。蛋白質発現量に対応する重み要素と入力の蛋白質発現量間のユークリッド距離が最小となる競合層のノードを勝者ノードとする。勝者ノードを中心とする近傍に存在する競合層のノードの重みの更新にあたっては、蛋白質発現量に対応する重み要素に加えて、生理活性値に対応する重み要素も同時に更新して自己組織化マップを構築する。学習を通じて獲得した生理活性値に対応する重み要素の値に基づいて、競合層のノードを複数のクラスに分割し、各クラスに属する競合層のノードが持つ蛋白質発現量に対応する重み要素を比較して、生理活性の推定に有効なバイオマーカーと認定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クラスタリングによる蛋白質の有効性推定方法、特に機能性食品、医薬品などの生理活性の測定に使用する蛋白質の有効性を自己組織化マップによるクラスタリングで推定する方法に関するものである。
【背景技術】
【0002】
一般に、機能性食品や医薬品成分の生理活性値を直接測定する方法は、種々知られている。しかしながら、天然物由来の食品成分のような多成分系の組成物を、成分毎に個別の評価系で測定するには、労力、時間、費用がかかり、必ずしも実際的とは言えない。近年、これらの問題を解消する一次的なスクリーニング方法として、高スループット機能性評価方法が提案されている(特許文献1、非特許文献1)。この方法では、生理活性値が既知の成分をヒト由来の培養細胞に付与し、その蛋白質発現量と生理活性値との関係を対応付けたデータセットを電子計算機に入力して学習用データベースを構築し、同様にして機能性未知の被検成分の蛋白質発現量のみを測定し、その蛋白質発現量から学習用データベースを用い機能性値を推定する。特許文献1では、この推定にニューラルネットワークが有効であることを示している。その他、確率密度分布やクラスタリングなどの使用の可能性も示唆している。
【特許文献1】特開2006−223302号公報
【非特許文献1】永▲濱▼清子ら「ハイスループット食品機能性評価法の開発」日本農芸化学会大会講演要旨集、2007、273(2007)
【0003】
一方、非特許文献2は、自己組織化マップ(SOM)によるクラスタリングを用い、食品の生理機能性の推定を行った例を開示している。しかし、非特許文献2の報告では、SOMによる相対誤差10%以内の推定成功率は約83.3%と、かなりの結果を示しているものの、一部に生理活性値の推定が困難な食品成分も見出されている。結論として、より精度の高い推定を可能とするには、SOMのパラメータのさらなる調整が必要である、とされている。
【非特許文献2】福島多聞ら「自己組織化マップを用いた食品の生理機能性推定」火の国情報シンポジウム2007論文集(CD−ROM)、C−1−4(2007)
【発明の開示】
【発明が解決しようとする課題】
【0004】
本発明者らは、SOMによる食品の生理活性値の推定を検討する過程において、SOMによるクラスタリングは、蛋白質発現量から生理活性値を推定するというよりも、むしろ任意の生理活性値の測定に効果的に利用できる蛋白質の推定に優れていることを見出し、本発明にいたった。
【0005】
本発明は、かかる知見に基づくもので、任意の生理活性値の測定に対し、有効な蛋白質を推定する方法を提供することを目的としている。
【課題を解決するための手段】
【0006】
前期目的を達成した本発明のクラスタリングによる蛋白質の有効性推定方法は、下記の各項に示す態様を特徴としている。
(項1)入力層の入力ノードと、競合層のすべてのノードが重みW={W,…,W}を介して結合している自己組織化マップを用いたクラスタリングにおいて、蛋白質発現量X={X,…,X}と生理活性値Y={Y,…,Y}が既知である参照成分Aの蛋白質発現量Xと生理活性値Yとをセットで入力し、重み要素W,…,Wと蛋白質発現量要素X,…,X間のユークリッド距離dが最小となる競合層のノードを勝者ノードとし、勝者ノードを中心とする近傍に存在する競合層のノードの重み更新にあたっては、蛋白質発現量に対応する重み要素W,…,Wに加えて、生理活性値に対応する重み要素Wp+1,…,Wも同時に更新して自己組織化マップを構築し、学習を通じて獲得した生理活性値に対応する重み要素Wp+1,…,Wの値に基づいて競合層のノードを複数の領域に分割(クラスタリング)し、各領域に属する競合層のノードが持つ蛋白質発現量に対応する重み要素W,…,Wを比較することにより、生理活性の推定に有効な蛋白質であると認定することを特徴とするクラスタリングによる蛋白質の有効性推定方法。
(項2)参照成分が食品成分であることを特徴とする項1記載の方法。
【発明の効果】
【0007】
本発明によれば、SOMによるクラスタリングで、任意の成分の生理活性値を測定するのに、どの蛋白質をバイオマーカーとして用いれば良いかが比較的簡単に推定できる。ある成分を細胞に付与し、新しい蛋白質の発現が認められた場合、その蛋白質がどの生理活性に関係し、その生理活性の測定に有効であるかを推定できる。これらのことから、例えば高スループット機能性評価方法などにおいて、出力対象となる生理活性毎に好適な蛋白質をバイオマーカーとして選出して、精度の高い評価系を簡単に構築することができる。
【発明を実施するための最良の形態】
【0008】
以下の実施の形態において使用する下記技術用語は、()内示すように略記し、その意味は両者とも同一である。
・蛋白質(バイオマーカー)
・自己組織化マップ(SOM)
・エピガロカテキンガレート(EGCG)
・ベンジルイソチオシアネート(BITC)
・Nuclear Factor kappa B(NF−kB)
・NF−kB認識配列(kBRE)
・炎症惹起に関与する転写因子NF−kBの阻害活性(抗炎症活性)
・kBREを複数個持つルシフェラーゼレポーター配列が染色体に組み込まれた市販の細胞(NF−kB評価細胞株)
【0009】
以下、図面に従って本発明の実施の態様を詳述する。図1は、本発明に用いるSOMを例示する。図1において、SOMは、入力層と競合層により構成された2層のニューラルネットワークである。SOMは、非特許文献3に示すように、T.コホネンによって提案された教師なし競合学習型ニューラルネットワークであり、多次元からなるデータの関係をおおまかに視覚化できる。入力層ではn個の入力ノード各々が入力1つを受け持つ。競合層ではノードが格子状に並べられており、入力層の各ノードは競合層の全ノードと重みを介して結合している。競合層ノードの並べ方として、格子状の他にハニカム状(正六面体を平面状に並べた形態)を用いることもできる。競合層ノードの隣接関係として上下端、左右端で途切れた形でもよく、上下端、左右端をそれぞれ隣り合うとしたトーラス状としてもよい。時刻t(t=0,1,2,…,T)で、競合層のi番目のノードが持つ重みをW(t)で表す。W(t)は、人力層のノード数と同じn個の要素を持つベクトルである。また学習の基準となる距離dには、入力ベクトルx(t)とW(t)間のユークリッド距離が一般に用いられる。学習を通じ、dが一番小さい競合層のノード(勝者ノード)と、その近傍のノードの重みを式(1)で調整する。式(1)において、a(t)はtが増加するにつれて単調減少する。また、重みを調整する領域もtが増加するにつれて単調減少する。
【0010】
【式1】
(t+1)=W(t)+a(t)[x(t)−W(t)]
【非特許文献3】T.コホネン「自己組織化マップ」シュプリンガー・フェアラーク東京、(1996)
【0011】
図2は、本発明のバイオマーカー有効性推定方法の工程を示すフローである。図2において、重みベクトルの初期化は、任意の範囲の乱数を重みに代入することで行うことができる。組織化を重視する場合は、例えば競合層ノードの左上から右下に向かって徐々に小さくなる値としたり、逆に徐々に大きくなる値を与えてもよい。初期化された重みベクトルをもとに学習サンプルAを提示し、バイオマーカー発現量に基づき勝者ノードを探索する。この探索には、一般的に蛋白質発現量とそれに対応する重み間のユークリッド距離を測定するのが望ましい。ユークリッド距離のほか、例えば蛋白質発現量とそれに対応する重みの値をそれぞれ2進数表現し、ハミング距離により測定することもできる。さらに、蛋白質発現量とそれに対応する重み間の余弦値を距離とすることもでき、この余弦値とベクトルの大きさをセットにして距離とすることもできる。本発明では、重みを更新する領域を、格子状の競合層では矩形の領域として、ハニカム状の競合層では六角形の領域として設定した後、重みを更新する際に蛋白質発現量に対応する重みに加えて、生理活性値に対応する重みも同時に更新する。重みを更新するにあたっては勝者ノードからマップ上で遠いノードほど重みの更新量を小さくするが、重み更新量を変化させる割合は距離に応じて線形としても良く、非線形としても良い。こうして、複数の蛋白質発現量と生理活性値が反映されたSOMを得ることができる。終了条件としては、あらかじめ最大学習回数を設定しておくことができる。終了条件を満たせば、領域を分割(クラスタリング)し、領域(クラス)毎に蛋白質の発現量を比較する。終了条件を満たさなければ、学習サンプル提示ステップに帰って、満たすまで同じ操作を繰り返す。重みを更新する領域は学習回数が増加するにつれて縮小する必要があるが、その縮小度合いは線形でもよく、また非線形でもよい。
【0012】
一方、前記領域分割には領域拡張法が好適である。領域拡張法では、まず基準となるノードを選択する。基準となるノードは生理活性値に対応する重みが最大であるノードを選ぶことができる。同様に生理活性値に対応する重みが最小であるノードを選んでも良い。基準となるノードを選択する繰り返し処理においては、生理活性値に対応する重み最大のノードから最小のノードに向かって選択していくことも、重み最小のノードから最大のノードに向かって選択していくことも、重みが大きいノードと小さいノードを交互に選択していくこともできる。基準となるノードにラベルが付与してあれば、基準ノードの選択ステップにかえるが、ラベルがなければラベルを付与し、近傍のノードを選択する。選択されたノードが生理活性値に対応する重みの差の閾値、例えば0.25以下であればラベル付けずみか否かを調べ、ラベルが付与されていなければ基準ノードと同じラベルを付与する。基準ノードの近傍に、生理活性値に対応する重みの差が閾値以下のノードがなくなったとき、基準ノードが含まれる領域を確定させ、新たな基準ノードの選択を行って上記領域分割処理を継続する。最終的に、基準となるノードの生理活性値に対応する重みと、ラベルが付与されていない当該重みとの差が閾値以下となった時、残ノードに同一のラベルを付与して領域分割処理を終了する。
【0013】
前述のように、競合層のノードは平面状に並べられており、これらの一つ一つが生理活性値に対応する重みをもっていることから、競合層を1枚の画像とみなすことが可能であり、本発明における領域分割には画像処理で用いられる各種領域分割法、例えば分割・統合法、k−means法、snakes法が利用できる。
【0014】
本発明で特徴的であるのは、SOMにおいて、蛋白質発現量と生理活性値をセットで入力しておくが、競合層の勝者ノードの探索には、入力された各蛋白質発現量間のユークリッド距離を測定して行い、勝者ノードを中心とする近傍の競合層ノードの重みベクトルの更新には、蛋白質発現量に加えて生理活性値も同時に更新する点にある。これにより、入力間の類似度は蛋白質発現量のみで決定されることになり、自己組織化のプロセスは蛋白質発現量を元に行われることになる。さらに、生理活性値に対応する重みも同時に更新することにより、その蛋白質発現量に応じた生理活性値を重みとして自律的に獲得することを可能にしている。
【0015】
自己組織化マップの作成段階で、生理活性値と蛋白質発現量が既知の参照成分の生理活性値は、例えばEGCGの抗炎症活性の場合、EGCGを、NF−kB評価細胞株(NF−kB A549 Repoter Stable Cell Line:Panomics社製)に接触させ、そのルシフェラーゼ活性を測定する。蛋白質発現量は、例えばHepG2細胞に参照成分を接触させて測定する。
【0016】
本発明における参照成分の生理活性には、既知の生理活性値に加えて、個別の生理活性測定法による結果を利用することもできる。生理活性測定法としては、レプリコンアッセイ、TCID50法などの抗ウイルス作用、MTTアッセイ、WST−8アッセイなどの癌細胞増殖抑制作用、DPPHラジカル消去活性測定、レポータージーンアッセイなどの抗酸化作用、抗炎症活性、硫酸転移酵素を用いたAmes変法、Ames法、小核試験法、Recアッセイなどの抗変異原性、コルチコステロン、GOT試験などの抗ストレス作用、TUNEL法、ANNEXIN V法、DNAラダー法、カスパーゼ活性測定法などのアポトーシスアッセイ等を挙げることができる
【0017】
参照成分としては、カテキン、エピカテキン、エピガロカテキン、ガロカテキン、カテキンガレート、エピカテキンガレート、ガロカテキンガレート、エピガロカテキンガレート(EGCG)などを含むカテキン類、ダイゼイン、ダイジン、ゲニステイン、ゲニスチン、グリシテイン、グリシチン、フォルモノネチンなどを含むイソフラボン類、シアニジン、ペラルゴニジン、デルフィニジンなどを含むアントシアニン類、ケルセチン、ミリセチン、ルチン、レスベラトロール、ケンフェロール、セサミン、クルクミン、リモニン、ガンマ−アミノ酪酸(GABA)、アスタキサンチン、ガランギン、シトラール、トリゴネリン塩酸塩、エラグ酸、キナ酸、サポニン、カプサイシン、ハイドロコルチゾン、オレイン酸、ベンジルイソチオシアネート、マンギフェリン、アピゲニン、ルテオリン、クロロゲン酸、リモネン、スクアレン、レチノール、ロズマリン酸、カフェ酸、リポ酸などの化学物資、カロテノイド類、アラキドン酸、リノレン酸などを含む多価不飽和脂肪酸、9c11tCLA、10t12cCLAなどを含む共役リノール酸類、その他リバビリン、インターフェロン類、スタチン類など多様な化合物を挙げることができる。エピガロカテキンガレート、ゲニステイン、リポ酸など健康への効果が期待できるものは、特に好ましい。
【0018】
参照成分の生理活性は、主として健康に関する機能性である。健康に関する機能性は、評価目的により異なるので必ずしも特定はできないが、食材の場合、抗酸化作用、抗変異原作用、アポトーシス誘導作用、がん細胞転移抑制作用、がん細胞増殖抑制作用、抗ストレス作用、免疫調節作用、抗ウイルス作用、ウイルス増殖抑制作用、動脈硬化抑制作用、血清脂質改善作用、高血圧予防作用、抗炎症作用、抗肥満など多様な機能を挙げることができる。特に、抗酸化作用、アポトーシス誘導作用、癌細胞増殖抑制作用など、癌の予防に関連する機能性の評価が期待されている。
【0019】
参照成分のバイオマーカー発現量の評価には、抗酸化作用、抗炎症作用、抗変異原作用、アポトーシス誘導作用、癌細胞増殖抑制作用、抗ストレス作用、免疫調節作用、抗ウイルス作用、ウイルス増殖抑制作用などの各機能性に関係する蛋白質を挙げることができる。さらに、機能性に関わり、その発現量が変化するバイオマーカーとともに、発現量がほとんど変化しないハウスキーピングタンパク質(G6PDH、GAPDH、actinなど)をコントロールマーカーとして取扱い、これらを含めてバイオマーカーとするのが望ましい。表1に、代表的なバイオマーカーを目的とする生理活性との関係で示す。
【0020】
【表1】


注:関連する機能を○印で示す。
A…ハウスキーピング(コントロール)
B…アポトーシス誘導作用
C…抗酸化作用
D…癌細胞増殖抑制作用
E…抗ストレス作用
F…抗炎症作用
【0021】
バイオマーカーは、文献および公開データベース上の公知情報、プロテオーム解析、DNAマイクロアレイ(DNAチップ)解析などの個別評価系による解析結果から選定することができる。公開データベースには、米国NCBIにあるPubMedを使用して検索できるデータベースおよびインターネットを通じて検索できるデータベースを挙げることができる。
【0022】
バイオマーカーの発現量を測定する細胞には、好適にはJurkat細胞、HL−60細胞、MOLT−4細胞、Huh−7細胞、HepG2細胞、Hep3B細胞、Caco−2細胞、HeLa細胞、MCF−7細胞、A431細胞、A549細胞、S1T細胞、Su9T01細胞、HUT101細胞、PLC/PRF−5細胞、Li90細胞、HUVEC細胞、HMEC細胞、HT17細胞、NIH−3T3細胞、3T3−L1細胞、MH134細胞、dRLh−84細胞、RLN−10細胞、PC12細胞、3Y1細胞などヒト、マウス、ラットなど哺乳動物由来細胞株、またはこれらの細胞株から派生する細胞株を挙げることができる。その中で、ヒト白血病由来細胞、ヒト肝がん由来細胞が特に望ましい。ヒト白血病由来細胞には、S1T細胞、Su9T01細胞、HUT101細胞、Jurkat細胞、HL−60細胞などを挙げることができる。ヒト肝がん由来細胞には、PLC/PRF−5細胞、Li90細胞、Huh−7細胞、HepG2細胞などを挙げることができる。
【0023】
培養条件としては、温度は37℃または通常の哺乳動物細胞が生育する温度とし、炭酸ガス濃度は5%または通常の哺乳動物細胞が生育する濃度が好ましい。酸化されやすい成分の場合は培養における酸素濃度を低くすることが望まれる。
【0024】
培地としては、D−MEM培地、MEM培地、RPMI1640培地、D−MEM/F−12培地、F−10培地、F−12培地、ERDF培地など、確立された哺乳動物細胞用培地、またはそれらを基本とした培地が好ましい。Jurkat細胞やHL−60細胞などヒト白血病由来細胞にはRPMI1640培地を、Huh−7細胞、HepG2細胞などヒト肝がん由来細胞にはD−MEM培地の使用が好適である。細胞の成長を促すためには、牛胎児血清を10%または通常の哺乳動物細胞が生育する濃度で添加してもよい。必要に応じて、非必須アミノ酸、サイトカイン(FGF,HGF,VEGF,インターロイキン−2など)を添加することもできる。ただし、血清で増殖が抑制される細胞株では無血清培養を使用する。
【0025】
培養には、使用する細胞に適した培他の選定に加えて、細胞数、細胞密度、細胞周期などの培養条件を選択するために、必要に応じて予備的な培養実験を実施することが推奨される。
【0026】
参照成分と細胞を作用させる混合時間は、作用開始時を0時間とし、1時間、2時間、3時間、6時間、9時間、12時間、18時間、24時間、36時間、48時間、72時間などから検討する。24時間以内で機能性を判定できる場合には、それ以上作用させるには及ばない。
【0027】
細胞へ供与する参照成分の濃度は、2μM、4μM、5μM、8μM、10μM、15μM、20μM、30μM、35μM、40μM、50μM、60μM、70μM、100μM、150μM、200μM、250μM、300μM、400μM、800μM、1000μM、及びこれらの濃度の1000倍および1/1000倍の濃度の中から、参照成分及び細胞に適した濃度を選定する。通常、2μMから1000μMの範囲が望ましい。
【0028】
参照成分を付与した細胞が応答した後、浮遊細胞の場合は、遠心分離により細胞と細胞分泌物を分離する。接着細胞の場合は、ピペット操作で細胞と細胞分泌物を分離し、細胞分泌物はそのまま被検試料とする。必要に応じて、細胞破砕物は密度勾配遠心、連続遠心などにより、核、ミトコンドリア、小胞体などの特定の細胞小器官を採取し、さらなる細胞小器官抽出物としたものも参照成分とすることもある。細胞の破砕は、細胞破砕装置、例えばテフロン(登録商標)ホモジナイザー、ダウンスホモジナイザー、ポリトロンタイプホモジナイザー、超音波破砕装置、ビーズ破砕装置などによる破砕、または界面活性剤、例えばTriton X−100、Triton X−114、NP−40、CHAPS、SB3−10、コール酸ナトリウム、デオキシコール酸、CA−630、Tween20などによる破砕、または細胞破砕装置と界面活性剤の併用による破砕から、任意に選択すればよい。必要に応じて、EDTA等のキレート剤を加えても良い。破砕の後は、遠心分離装置により細胞抽出物および残さに分離する。
【0029】
バイオマーカーの評価には、統合型イムノアッセイを用いる。イムノアッセイでは、イムノアッセイを基盤としたバイオマーカーに特異的な抗体を使用する。好適には、バイオマーカーとの抗原抗体反応を利用する。イムノアッセイには、ELISA、ウエスタンブロッティング、抗体チップ(抗体アレイ)、ビーズアレイ、イムノクロマトなどを利用する。代表的なイムノアッセイであるELISAには非特許文献4を、ウエスタンブロッティングには非特許文献5を、そしてイムノクロマトには非特許文献6を挙げておく。測定部位として、ELISAの場合は、マイクロプレート上での特異的抗体による検出を行う。マイクロプレートには、6,12,24,48,96,384、及び1536ウエルのプレートなどがあるが、96ウエルが一般的である。ウエスタンブロッティングの場合は、膜上で特異的抗体による検出を行う。膜には、PVDF膜、ニトロセルロース膜などを使用できる。
【非特許文献4】石川栄治ほか、編「酵素免疫測定法 第3版」医学書院、東京、1987
【非特許文献5】高津聖志ほか、編「タンパク質研究のための抗体実験マニュアル」羊土社、東京、2004
【非特許文献6】Zuk RF,Ginsberg VK,Houts T,Rabbie J,Merrick H,Ullman EF,Fischer MM,SiztoCC,Stiso SN,Litman DJ.Enzyme imunochromatography:a quantitative immunoassay requiringnoinstrumentation.Clin Chem.1985 Jul;31(7):1144−50
【0030】
同様に、イムノアッセイに抗体チップ(抗体アレイ)を用いる場合は、PVDF膜、ニトロセルロース膜などの膜、スライドグラスあるいは類似の基盤上で、特異的抗体による検出を行う。ビーズアレイの場合はビーズ上で、イムノクロマトの場合はスティック上で、特異的抗体による検出を行う。検出は、抗体(一次抗体、二次抗体)に標識した酵素の反応による発色法、化学発光法、化学蛍光法や抗体に直接蛍光色素を標識した蛍光法があり、簡便な発色法や感度が高く定量性の良い化学発光法が望ましい。酵素には、ペルオキシダーゼやアルカリホスファターゼの使用が好適である。
【0031】
イムノアッセイとしては、多数の試料の同時解析、定量解析、分析装置の価格などを考慮した場合、ELISA法を用いることが特に好ましい。
【0032】
プロテオーム解析は、IPGストリップを使用した1次元目等電点電気泳動、2次元目SDS−PAGEによる2次元電気泳動、電気泳動パターンの色素染色によるイメージ解析、タンパク質スポットの質量分析装置による解析及び同定により行うことができる。特に、定量性にすぐれた蛍光色素によるプレラベル標識による蛍光ディファレンシャル解析が望ましい。
【0033】
DNAマイクロアレイ(DNAチップ)解析は、市販のDNAマイクロアレイ(DNAチップ)例えば、GeneChipプローブアレイ(Affymetrix社)、CodeLinkBioarraay(アマシャム・バイオサイエンス社)およびこれらに類するものを使用することが出来るが、GeneChipプローブアレイ(Affymetrix社)を使用することが好ましい。
【0034】
本発明に適用する抗体としては、モノクローナル抗体、ポリクローナル抗体、抗血清、リコンビナント抗体のいずれもバイオマーカーに対する特異性があれば使用可能であるが、モノクローナル抗体の使用が好ましい。モノクローナル抗体は、実験動物としてマウスを使用してバイオマーカーに対する抗原を免役した後、非特許文献7に記載された方法により調製する。抗原には、精製タンパク質、リコンビナントタンパク質、合成ペプチドなどを使用できる。
【非特許文献7】Galfre,G.,Milstein,C.,Preparation of monoclonal antibodies:stratebies and procsdures,Methods Enzymol.1981;73(Pt B):3−46.
【0035】
また抗体には、市販されているものであっても、バイオマーカーに対する特異性があれば、モノクローナル抗体、ポリクローナル抗体、抗血清、リコンビナント抗体のいずれの抗体も使用可能である。
【0036】
本発明では、前記のごとくして構築されたSOMにおいて、学習を通じて獲得した生理活性値に対応する重み要素Wp+1,・・・,Wの値に基づき、競合層のノードを複数の領域(クラス)に分割する。本発明におけるSOMは個々の競合層のノードが重みとして値(生理活性値)を持ち、これらが2次元状に配置されていることから一種の画像とみなすことが出来る。したがって、領域の分割には画像処理で用いられる領域分割法、例えば領域拡張法、分割・統合法、k−means法、snakes法が利用できる。本発明における領域分割では、生成される領域数が未確定であること、競合層のノードが格子状に配置されていることから領域拡張法が好適である。SOM上に生成された生理活性値の最大値に対応する競合層のノードを中心とし、近傍にある競合層のノードが持つ生理活性値が閾値以下であればこれらを同一のクラスとしてラベル付けを行い、これを近傍領域が拡大しなくなるまで繰り返す。次に、生理活性値が最小の競合層のノードを中心としてすでにラベル付けが行われていないノードに対して同様の処理を繰り返す。次に、生理活性値が2番目に大きいノードを中心に、さらに生理活性値が2番目に小さいノードを中心にとこの操作を繰り返し、最終的に生理活性値が大きい側のノードと小さい側のノード間の生理活性値に対応する重みの差が閾値以下になった時、ラベル付けされていないノードすべてを同一クラスとしてラベル付けし領域分割を終了する。こうして生成された各領域のうち、高い生理活性値を示す領域の蛋白質発現量い対応する重みWp+1、…、Wと低い生理活性値を示す領域のWp+1、…、Wを比較する。高い生理活性を示す領域と低い生理活性を示す領域とで同様の発現量を示す蛋白質は活性値の推定には寄与しないバイオマーカーであり、異なる値を示す蛋白質は生理活性値の推定の鍵となりうるバイオマーカーであることが分かる。さらに、生理活性値の値が同等であってもバイオマーカーの値が著しく異なる場合には、細胞内における生理活性発現機序が異なっている可能性を示しており、これをもとに生理活性発現の仕組みを生理学的に探求するきっかけを提供することが出来る。
【実施例】
【0037】
(1)蛋白質の発現量と生理活性値の測定
【0038】
a)参照成分の調整:
参照成分としては、表2に示す成分を用いた。蛋白質の発現量の測定には、ヒト肝がん由来細胞株HepG2細胞を用いた。細胞は、10%牛胎児血清(FCS)含有D−MEM培地を用いて、37℃、5%COガスで平衡化したCOインキュベータ内で培養した。対数増殖期にあるHepG2細胞を3×10cells/mlの細胞密度でプラスティックシャーレに接種し、24時間後、表2に示す終濃度になるように学習用の参照成分を調製、添加した。
【0039】
【表2】

【0040】
b)蛋白質(バイオマーカー)の測定:
HepG2細胞は、細胞溶解緩衝液(1 mM EDTA,0.005%Tween20,0.5%Triton X−100,プロテアーゼ阻害剤を含有するPBS)を加え、セルスクレーパーで細胞を回収した。その後、穏やかに撹拌し、遠心分離後、その上清を総蛋白質濃度が1 mg/mlになるように調製したものを用いた。
【0041】
添加により発現した蛋白質のうち、参照成分中に含まれる対象バイオマーカー量の測定は、ELISAによって行った。測定対象バイオマーカーは、Thioredoxin,Survivin,Heat shock protein 70(HSP70),X−linked inhibitor of apoptosis protein(XIAP),Fas−associated deathdomain protein(FADD),Thioredoxin reductase 1(TXNRD1),Heat shock protein 90(HSP90),IFN−inducible antiviral protein Mx(MxA),Tumor−associated hydroquinoneoxidase(tNOX),NAD(P)H dehydrogenase [quinone] 1 (NQO1),Tumor suppressor p53 (p53),Extracellular signal−regulated kinase 2 (ERK2),B−cell lymphoma 2 (Bcl−2)の13種類とした。またサンプルを標準化するため、Glycelaldehyde−3−phosphate dehydrogenase(GAPDH)についても測定した。
【0042】
一例として、Thioredoxinの測定について説明する。以下の操作の温度は全て37℃で行った。抗ヒトThioredoxinマウス抗体(500ng/ml:50mM炭酸緩衝液、pH9.6)を96穴マイクロプレートの各穴に100μlずつ添加し、2時間静置してプレートに固定化した。0.05%のTween20含有PBS(TPBS)で各穴を1回洗浄した後、1%BSA含有PBSを各穴に300μlずつ添加し、2時間静置しブロッキングを行った。各穴をTPBSで3回洗浄した後、10倍に希釈した細胞抽出液を各穴に100μlずつ添加し、2時間反応させた。各穴をTPBSで3回洗浄した後、検出抗体として抗ヒトThioredoxinヤギ抗体(100ng/ml:1%BSA含有PBS)を各穴に100μlずつ添加し、さらに1時間反応させた。各穴をTPBSで3回洗浄した後、二次抗体として西洋わさびパーオキシダーゼ(HRP)で標識されている抗ヤギIgGマウス抗体(200ng/ml:1%BSA含有PBS)を100μl添加し、さらに1時間反応させた。最後にTPBSで4回洗浄して基質溶液{0.3mg ABTS[p−2、2’−azino−bis−(3−ethylbenzothiazoline−6−sulfonic acid)diammonium salt]0.03%H含有0.1Mクエン酸緩衝液、pH4}を100μlずつ添加し、10分間反応させ、405−490 nmの吸光度をマイクロプレートリーダーで測定した。他のバイオマーカーについても概略は同様に行った。使用した抗体類の一覧を表3に示す。測定結果は表4に示す。
【0043】
【表3】


【0044】
吸光度として得られた各バイオマーカー発現量のデータを標準化するために、それぞれの吸光度をGAPDHの吸光度で除し、単位GAPDH発現量当たりのバイオマーカー発現量とした。
さらに、これらの値をコントロール被検試料のバイオマーカー発現量で除すことで、試験群のバイオマーカー発現量をコントロールに対する相対値として得た。参照成分をHepG2細胞に添加した際のバイオマーカー発現量を表4に示す。
【0045】
【表4】


【0046】
c)生理活性値(抗炎症活性)の測定
ルシフェラーゼレポーター安定発現細胞の調製;転写因子であるNF−kBは炎症反応、アポトーシス、免疫または腫瘍形成の制御に重要な役割を果たす。通常、NF−kBはIkB(Inhibitory kappa B protein)と細胞質で複合体を形成し、不活性化状態で存在する。炎症亢進するサイトカイン等の刺激により、MAPK(mitogen−activated protein kinase)ファミリーに属する数種のキナーゼによりIkBがリン酸化された後、ポリユビキチン化され、プロテアソームにより分解されると、IkBより拘束されていたNF−kBは核内に移行し、染色体上の特異的なDNAモチーフであるNF−kBの認識配列に結合し、炎症反応に関与する遺伝子の発現誘導を行う。NF−kBは炎症反応、アポトーシス、免疫または腫瘍形成の制御に関わる多くの遺伝子の発現を制御している。このNF−kBの認識配列をルシフェラーゼ翻訳領域、ハイグロマイシン耐性遺伝子を有するプラスミドに導入し、レポーターベクターとしたものを、ヒト肺がん上皮細胞A549に導入し、染色体DNAに安定に組み込まれた市販の細胞株(NF−kB A549 Repoter Stable Cell Line:Panomics社製)を抗炎症活性の評価に供した。
【0047】
細胞の継体には、DMEM10[GIBCO社のGlutaMAX Media Dulbecco’s Modified Eagle Medium (D−MEM)(1×)、liquid (High glucose、contains sodium pyruvate)]にFBS(Hyclone社)10%、Penicillin−Streptomycin(GIBCO社)、及びHygromycin(SIGMA社)を添加した培地を用いた。アッセイを行なう際のアッセイ培地には、DMEM10にPenicillin−Streptomycinを添加したもの(但し、Hygromycinは加えない。)を用いた。NF−kBの活性化の程度は、ルシフェラーゼアッセイ法により測定した。
【0048】
ルシフェラーゼアッセイ法;この方法では、マグネシウム存在下で、ルシフェリンとATPから酸化ルシフェリンとAMPを作る反応をルシフェラーゼが触媒する。ルシフェラーゼアッセイ法は、この時発生する光を発光検出器で検出して、得られた光量に基づいてルシフェラーゼ活性を評価する方法である。本発明では便宜上、この光量がNF−kBの活性化の程度を示すものとした。
【0049】
【表5】


【0050】
(2)SOMへの入力
表4の蛋白質発現量と表5の生理活性値は、それぞれ個別に複数回測定されているため、同一成分の同一濃度であっても一つの参照ベクトルとして構成するためにはこれらを適切に組み合わせる必要がある。本発明では各参照成分の各濃度のそれぞれで測定された蛋白質発現量値と生理活性値のすべての組合せについて単回帰分析を行い、p値が0.05以下でかつ最小となる組合せを総当りで探索した。抗炎症活性については生理活性値が6点得られているため、各参照成分の濃度あたり14次元(蛋白質発現量として13次元、生理活性(抗炎症活性)値に1次元)のベクトル6個を生成する。これにより生成したSOMへの入力加工データの例を表6に示す。
【0051】
【表6】

【0052】
表6の1行(13種類の蛋白質発現量とひとつの生理活性値)を1セットとし、1種類の参照成分の濃度あたり6セットずつをSOMに入力した。すべてのデータは、30成分×3濃度×6=540セットであった。本発明のバイオマーカー有効性推定方法の工程を示すフローを図2に示す。図2に示すように、領域分割は再帰処理により実現した。SOMの勝者ノードを競合層から探索するには、蛋白質発現量13種類とそれに対応する重み間のユークリッド距離を測定した。重みベクトルを更新するには、13種類の蛋白質発現量に対応する重みに加えて、生理活性値に対応する重みも同時に更新した。SOM上の競合層ノードは格子状配置とし、上下端、左右端がそれぞれ結合したトーラス状結合とした。こうして、複数の蛋白質発現量と生理活性値が反映されたSOMを得た。図3には、蛋白質発現量に基づいて生成した自己組織化マップの例を示す。図3は生理活性値に対応する重みが2以上を白(輝度値255)に、生理活性値に対応する重みが0を黒(輝度値0)としてその間の生理活性値に対応する重みを256階調で均等に表現したものである。図3から、生理活性値に対応する重みの高い領域、低い領域、中間の領域が自動的に生成されていることが分かる。図4には生理活性値に対応する重みに基づいて各領域を自動的にクラスタリングした結果を示す。図4における各領域の色の違いは、単に異なる領域(クラス)であることを表しており、図3のような生理活性値の重みの大小とは無関係である。図4より、図3で示した生理活性値に対応する重みの大小に基づき、各領域が自動的に抽出されていることが分かる。このとき生成された領域数は104であり、領域間の生理活性値に対応する重みの差が0.25以下のとき、競合層のノードは同一領域に属するとした。このしきい値は、最小0.05から最大1.0まで0.05刻みで変化させて同一領域に属する蛋白質発現量に対応する重みの分散が最も小さくなる値として決定した。
【0053】
(3)バイオマーカーの有効性の推定
重みの初期値をかえてSOMを学習させ、生成されたマップにおける抗炎症活性値に対応する重み要素に基づき競合層ノードを複数の領域に分割する実験を10回行った。おのおのの実験において、生理活性値に対応する重みが大きい5クラス、及び小さい5クラスについて、各蛋白質発現量に対応する重みの平均値と標準偏差を図5に示した。図5(イ)は生理活性値に対応する重みが大きい5クラス、図5(ロ)は生理活性値に対応する重みが小さい5クラスのものである。図5(イ)において1st Maxは生理活性値に対応する重みがもっとも大きいクラスを表し、以下2番目に大きいクラスを2nd Maxのように表した。同様に図5(ロ)において1st Minは生理活性値に対応する重みが最も小さいクラスを表し、以下2番目に小さいクラスのそれを2nd Minのように表した。図5(イ)、(ロ)から分かるように、生理活性値に対応する重みの大きさ(小ささ)が3番目以降のクラスについては標準偏差が大きくなっており、生理活性値に対応する重みの大きさ(小ささ)が1番目、2番目のクラスが比較対象として好適であることが分かった。
【0054】
次に、10回の実験にそれぞれにおける1st Max、1st Minの領域内の蛋白質発現量に対応する重みの平均値を、図6(イ)及び図6(ロ)にそれぞれ示す。図6(イ)、(ロ)より、重みの初期値を変えた10回の実験を通じておよそ安定した学習と領域分割が行われていることがわかる。
【0055】
図7に、生理活性値に対応する重みが最大の領域(1st Max)と最小の領域(1st Min)における、各蛋白質発現量に対応する重みの平均値と標準偏差を示す。生理活性値推定にある蛋白質が好適であるのは、生理活性値に対応する重みが大きい領域、小さい領域でその発現量に差がある場合である。したがって、図7よりThioredoxin、Survivin、XIAP、FADD、ERK2、p53の各蛋白質については、生理活性に対応する重みが最大の領域と最小の領域とで値に差がなく、抗炎症活性の有無の判定には不適であることが分かる。一方、HSP70、TXNRD1、HSP90、MxA、tNOX、NQO1、Bcl2の各蛋白質については、生理活性に対応する重みの平均値が最大の領域と最小の領域とで大きく異なり、かつ標準偏差を考慮しても値が重ならないことから、抗炎症活性の有無の判定に好適であることが分かる。
【0056】
図8に、生理活性値に対応する重みが2番目に大きい領域(2nd Max)と2番目に小さい領域(2nd Min)における、各蛋白質発現量に対応する重みの平均値と標準偏差を示す。図7の場合と同様に、生理活性値に対応する重みの平均値の差が十分大きく、かつ標準偏差を考慮しても値が重ならない蛋白質を調べると、Thioredoxin、XIAP、HSP90、tNOX、NQO1、の5つが挙げられる。一方、平均値が同等であるか、標準偏差が重なる蛋白質はSurvivin、HSP70、FADD、TXNRD1、MxA、ERK2、p53が挙げられる。
【0057】
表7に、抗炎症活性の推定に対する蛋白質の適合度合いをまとめる。表7において、当該蛋白質が推定に適する場合は○、不適の場合は×を記述した。また、有効性の推定では、1st Max−1st Min、2nd Max−2nd Minともに○の場合に○を、1st Max−1st Min、2nd Max−2nd Minのどちらか一方が○の場合に△を、1st Max−1st Min、2nd Max−2nd Minともに×の場合に×を記述した。
【0058】
【表7】


【0059】
表7から明らかなように、生理活性のひとつである抗炎症活性の測定に有効な蛋白質として、重み要素の比較からHSP90、tNOX、NQO1が有効であると推定できる。また、参考にすべき蛋白質として、Thioredoxin、HSP70、XIAP、TXNRD1、MxA、Bcl2が挙げられる。さらに、抗炎症活性推定時に考慮しなくて良い蛋白質として、Survivin、FADD、ERK2、p53があることが分かる。抗炎症活性推定に好適な3つの蛋白質HSP90、tNOX、NQO1のうち、NQO1は2nd Max−2nd Minを比較した図8から分かるように、標準偏差を考えるとその発現量に対応する重みが、抗炎症活性が大きくても小さくても1.0近辺となる可能性がある。一方、HSP90とtNOXは抗炎症活性の大きさに応じて発現量も相応に異なっており、図7及び図8からHSP90の発現量がおよそ0.95から1.2であり、かつtNOXの発現量がおよそ0.85から1.5程度の発現量を示したとき大きな抗炎症活性値を示すことが推定できる。同様に、HSP90の発現量がおよそ0.25から0.9であり、かつtNOXの発現量がおよそ0.5から0.75程度の発現量を示したとき、小さな抗炎症活性値を示すことが推定できる。
【産業上に利用可能性】
【0060】
本発明のクラスタリングによる蛋白質(バイオマーカー)の有効性推定方法は、例えば医薬品候補成分や食品成分の生理活性評価に利用可能である。特に、天然物由来の多成分系組成物の高スループット機能性評価において、多数の生理活性を同時に評価する場合、利用可能なバイオマーカーの判定に好適である。
【図面の簡単な説明】
【0061】
【図1】 本発明に使用する自己組織化マップの概念を示す模式図である。
【図2】 本発明のバイオマーカー有効性推定方法の工程を示すフロー図である。
【図3】 実施例のSOM上に生成された生理活性(抗炎症活性)に対応する重みの値を示す写真である。
【図4】 実施例のSOMを生理活性値に対応する重みに基づき自動的にクラスタリングした結果を示す写真である。
【図5】 生理活性値に対応する重みが大きい5領域と小さい5領域における、蛋白質発現量に対応応する重みの平均値と標準偏差を示すグラフで、(イ)は生理活性値に対応する重みが大きい5領域における、各蛋白質発現量に対応する重みの平均値と標準偏差、(ロ)は生理活性値に対応する重みが小さい5領域における、各蛋白質発現量に対応する重みの平均値と標準偏差である。
【図6】 1st Max、1st Min領域内の蛋白質発現量に対応する重みの平均値を示したグラフで、(イ)は10回の実験における生理活性値最大の領域内の各蛋白質発現量に対応する重みの平均値、(ロ)10回の実験における生理活性値最小の領域内の各蛋白質発現量に対応する重みの平均値である。
【図7】 10回の実験を通じた生理活性値に対応する重みが最大の領域と最小の領域の、蛋白質発現量に対応する重みの平均値と標準偏差を示すグラフである。
【図8】 10回の実験を通じ生理活性値に対応する重みが2番目に大きい領域と2番目に小さい領域の、蛋白質発現量に対応する重みの平均値と標準偏差である。

【特許請求の範囲】
【請求項1】
入力層の入力ノードと、競合層のすべてのノードが重みW={W,…,W}を介して結合している自己組織化マップを用いたクラスタリングにおいて、蛋白質発現量X={X,…,X}と生理活性値Y={Y,…,Y}が既知である参照成分Aの蛋白質発現量Xと生理活性値Yとをセットで入力し、重み要素W,…,Wと蛋白質発現量要素X,…,X間のユークリッド距離dが最小となる競合層のノードを勝者ノードとし、勝者ノードを中心とする近傍に存在する競合層のノードの重み更新にあたっては、蛋白質発現量に対応する重み要素W,…,Wに加えて、生理活性値に対応する重み要素Wp+1,…,Wも同時に更新して自己組織化マップを構築し、学習を通じて獲得した生理活性値に対応する重み要素Wp+1,…,Wの値に基づいて競合層のノードを複数の領域に分割(クラスタリング)し、各領域に属する競合層のノードが持つ蛋白質発現量に対応する重み要素W,…,Wを比較することにより、生理活性の推定に有効な蛋白質であると認定することを特徴とするクラスタリングによる蛋白質の有効性推定方法。
【請求項2】
参照成分が食品成分であることを特徴とする請求項1記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−178156(P2009−178156A)
【公開日】平成21年8月13日(2009.8.13)
【国際特許分類】
【出願番号】特願2008−46831(P2008−46831)
【出願日】平成20年1月29日(2008.1.29)
【出願人】(306024609)財団法人宮崎県産業支援財団 (23)
【出願人】(504224153)国立大学法人 宮崎大学 (239)
【Fターム(参考)】