説明

蛋白質両親媒性二次構造領域の検索方法及び装置

【課題】 蛋白質二次構造の両親媒性二次構造の領域を検索する手段を提供する。
【解決手段】
二次構造がαへリックスの場合、解析対象のアミノ酸配列の奇数番及び偶数番のアミノ酸残基に対して、それぞれ、疎水性値の移動平均値を計算し、その折れ線グラフを作成する。二次構造がβシートの場合、解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基、及び、それより1.8残基ずれたアミノ酸残基に対して、それぞれ、疎水性値の移動平均値を計算し、その折れ線グラフを作成する。αへリックス及びβシートの場合において、2つの折れ線のうち一方の折れ線が所定の閾値より大きい領域を、二次構造領域候補とする。二次構造領域候補のうち、2つの折れ線の間の距離(両親媒性値A)が所定の閾値より大きい領域を、二次構造領域候補とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、蛋白質の二次構造を解析する技術に関し、特に、両親媒性二次構造を検索する技術に関する。
【背景技術】
【0002】
蛋白質は、共通構造である主鎖と様々な化学構造をもつ側鎖からなる約20種類のアミノ酸が数10〜数100個ひも状に連結して、このひも状構造が捩れながら織畳まることによって、複雑な立体構造高次構造を形成し、その形状と疎水性に代表される表面特性の多様性によって、生体における様々な化学反応を実現している。
【0003】
今日、NMR核磁気共鳴、X線構造解析に代表される様々な実験的手法によって、主に結晶フェーズのものではあるが、多数の蛋白質立体構造が明らかになってきている。そこからの知見として、蛋白質高次構造の多くの部分が、数個〜数十個のアミノ酸の集合により形成される特徴的な局所構造2次構造の組み合わせによって形成されていることがわかっている。
【0004】
代表的な二次構造としては、ペプチド鎖アミノ酸残基が鎖状に繋がった分子が螺旋構造となったヘリックス構造であるαへリックス、互い違いに側鎖を逆方向に向けたシート構造であるβシートなどがある。
【0005】
多くの種類の蛋白質において、特徴的な二次構造の存在により、特徴的な機能を果たす構造が実現されていることが知られている。例えば、膜蛋白質における膜透過の多くは、20〜25個の疎水性残基を持つアミノ酸から成るαヘリックスによって形成されていることが知られている。
【0006】
即ち、特徴的な蛋白質の二次構造の存在を知ることにより、そこから反対に、蛋白質の構造、しいては、蛋白質の機能を予測することが可能となる。
【0007】
蛋白質の二次構造の予測には様々な手法が考案されている。その中に、疎水的な環境である膜内部に存在する膜蛋白質の膜貫通二次構造領域の予測を行う方法があり、その方法ではハイドロパシープロットが用いられる。ハイドロパシープロットは、Kyte, J. & Doolittle, R. F. 1982に述べられている。ハイドロパシープロットは、20種類のアミノ酸各々の側鎖に対して疎水性/親水性を実験的に求めて指標化(KD指標)し、横軸にアミノ酸配列番号、縦軸にKD指標の移動平均値をプロットしたものである。通常、n番目のアミノ酸残基の移動平均値は、連続する5個のアミノ酸配列のKD指標の平均で求められる。
【特許文献1】特開2002-215634号公報(P2002-215634A)
【特許文献2】特開2002-286725号公報(P2002-286725A)
【発明の開示】
【発明が解決しようとする課題】
【0008】
ヒトゲノムのドラフト配列が完成するなど、多くの生物においてDNA配列決定が進む中で、決定されたDNA配列から、そこにコードされている蛋白質の情報を知ることが重要となってきており、蛋白質コード領域予測、二次構造予測のためのプログラムが数多く開発されている。
【0009】
しかしながら、蛋白質二次構造の両親媒性二次構造に注目した領域検索を実現している方法は存在しない。
【0010】
本発明の目的は、蛋白質二次構造の両親媒性二次構造の領域を検索する手段を提供することにある。
【課題を解決するための手段】
【0011】
本発明によると、蛋白質両親媒性二次構造領域の検索方法は、入力装置を介して、解析対象のアミノ酸配列を入力し、二次構造としてαへリックス又はβシートを選択する入力ステップと、上記二次構造としてαへリックスが選択された場合、上記解析対象のアミノ酸配列の奇数番のアミノ酸残基の疎水性値の移動平均値と、上記解析対象のアミノ酸配列の偶数番のアミノ酸残基の疎水性値の移動平均値と、をそれぞれ第1の移動平均値と第2の移動平均値として、計算する第1計算ステップと、上記二次構造としてβシートが選択された場合、上記解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基の疎水性値の移動平均値と、上記解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基であって且つ上記3.6残基毎のアミノ酸残基に対して1.8残基ずれたアミノ酸残基の疎水性値の移動平均値と、をそれぞれ第3の移動平均と第4の移動平均値として、計算する第2計算ステップと、上記アミノ酸残基の疎水性値の移動平均値を、縦軸が疎水性値、横軸がアミノ酸残基の番号とする座標にプロットし、上記第1の移動平均値に対する折れ線グラフを第1折れ線グラフ、上記第2の移動平均値に対する折れ線グラフを第2折れ線グラフ、上記第3の移動平均値に対する折れ線グラフを第3折れ線グラフ、上記第4の移動平均値に対する折れ線グラフを第4折れ線グラフとして、作成する折れ線グラフ作成ステップと、上記折れ線グラフを画面上に表示する表示ステップとを有する。
【発明の効果】
【0012】
本発明によれば、蛋白質一次構造であるアミノ酸配列より、両親媒性二次構造を検索することが可能となる。
【発明を実施するための最良の形態】
【0013】
以下、図面を参照して本発明の実施の形態を具体的に説明する。図1は、本発明の実施の一形態の両親媒性二次構造探索システムの構成を示すブロック図である。本例の両親媒性二次構造探索システムは、図1に示すように、中央処理装置101、データベース102、表示装置103、キーボード104、マウス105等から構成され、スタンドアロン方式である。
【0014】
利用者はキーボード104やマウス105を用いて任意のアミノ酸配列を入力する。中央処理装置101は、入力されたアミノ酸配列に含まれる両親媒性二次構造の候補領域を検出し、両親媒性二次構造候補領域を表示装置103に描画する。
【0015】
図2は、両親媒性二次構造の例として、両親媒性βシート構造を示す。両親媒性βシート構造は、疎水性の面と親水性の面を持ったβシート構造である。βシート構造では、アミノ酸の側鎖が交互に180℃の位置に存在する。故に、両親媒性βシート構造では、親水性の側鎖を持ったアミノ酸201と疎水性の側鎖を持ったアミノ酸202は、それぞれ2残基周期で出現する。
【0016】
図3は、両親媒性二次構造の例として、両親媒性αへリックス構造を示す。両親媒性αへリックス構造は、疎水性の側面と親水性の側面を持ったαへリックス構造である。αへリックス構造では、アミノ酸の側鎖が、円筒の外側を100度ずつ回転しながら円筒から突出するように位置する。故に、両親媒性αへリックス構造では、親水性の側鎖を持ったアミノ酸301と疎水性の側鎖を持ったアミノ酸302は、それぞれ、3.6残基周期で出現する。尚、親水性の側鎖を持ったアミノ酸301と疎水性の側鎖を持ったアミノ酸302の間は180度(1.8残基)ずれる。
【0017】
図4を参照して、両親媒性二次構造候補領域のフィルタリングの例を説明する。図4の横軸は、解析対象であるアミノ酸配列の全残基の番号、縦軸はアミノ酸残基の疎水性値である。疎水性値が正であれば、そのアミノ酸残基は疎水性であり、疎水性値が負であれば、そのアミノ酸残基は親水性であることを示す。即ち、横軸の上側は、疎水性、下側は親水性を表わす。折れ線はハイドロパシープロットを示す。
【0018】
先ず、βシート構造の場合を説明する。上述のように、βシート構造では、親水性の側鎖を持ったアミノ酸201と疎水性の側鎖を持ったアミノ酸202は、それぞれ、2残基周期で出現する。従って、βシート構造では、2残基毎に取り出したアミノ酸残基の疎水性値の移動平均値を求めると、疎水性か親水性を示すと予想される。例えば、奇数番のアミノ酸残基の疎水性値が疎水性を示す場合、偶数番のアミノ酸残基の疎水性値は親水性を示すと予想される。逆に、偶数番のアミノ酸残基の疎水性値が疎水性を示す場合、奇数番のアミノ酸残基の疎水性値は親水性を示すと予想される。
【0019】
そこで、n番目のアミノ酸残基の疎水性値をh、その疎水性値の移動平均値をHとすると、移動平均値Hは次の式で求められる。
【0020】
【数1】

【0021】
疎水性値hの添え字n−4、n−2、n、n+2、は、アミノ酸残基の番号を示す。nが偶数の場合、2,4,6,8・・・番目、即ち、偶数番目のアミノ酸残基の疎水性値の移動平均値が得られる。nが奇数の場合、1,3,5,7・・・番目、即ち、奇数番目のアミノ酸残基の疎水性値の移動平均値が得られる。
【0022】
このようにして、アミノ酸配列の全残基について疎水性値の移動平均値を求め、奇数番目のアミノ酸残基の移動平均値をグラフ上にプロットすることにより、1つの折れ線401を描画する。次に偶数番目のアミノ酸残基の移動平均値を同一のグラフ上にプロットすることにより、1つの折れ線402を描画する。
【0023】
2つの折れ線401、402のうち、疎水性値の移動平均値が、所定の閾値403以上且つ所定の長さ以上連続した場合、そのアミノ酸配列領域を二次構造領域候補404とする。
【0024】
次に、n番目のアミノ酸残基の両親媒性値Aを次の式で定義する。
【0025】
【数2】

【0026】
ここで、H(a)nは、n番目のアミノ酸残基の折れ線401の値、H(b)nはn番目のアミノ酸残基の折れ線402の値である。従って、両親媒性値Aは、2つの折れ線401、402の間の距離を表わす。2つの折れ線401、402の間の距離が大きい場合には、両親媒性値Aが大きく、疎水性と親水性の両者を有する可能性が高いと判定することができる。2つの折れ線401、402の間の距離が小さい場合には、両親媒性値Aが小さく、疎水性と親水性の両者を有する可能性は低いと判定することができる。
【0027】
二次構造領域候補404内にて、両親媒性値Aが、所定の閾値以上且つ所定の長さ以上連続した場合、そのアミノ酸配列領域を両親媒性候補領域405とする。
【0028】
次に、αへリックス構造の場合を説明する。上述のように、αへリックス構造では、親水性の側鎖を持ったアミノ酸301と疎水性の側鎖を持ったアミノ酸302は、それぞれ、3.6残基周期で出現する。従って、αへリックス構造では、3.6残基毎に取り出したアミノ酸残基の疎水性値の移動平均値を求めると、疎水性か親水性を示すと予想される。
【0029】
n番目のアミノ酸残基の疎水性値をh、その疎水性値の移動平均値をHとすると、移動平均値Hは次の式で求められる。
【0030】
【数3】

【0031】
疎水性値hの添え字n−7.2、n−3.6、n、n+3.6、n+7.2は、アミノ酸残基の番号を示す。nは整数である。従って、数3の式は、整数番目のアミノ酸残基の疎水性値の移動平均値を表わす。整数番目でないアミノ酸残基の場合、即ち、少数を含む数番目のアミノ酸残基の疎水性値の移動平均値Hは次の式で求められる。
【0032】
【数4】

nは整数、kは1以下の少数である。数4の式に示すように、(n+k)番目のアミノ酸残基の疎水性値の移動平均値Hは、両側の整数番目の移動平均値の重み平均である。例えば、(n+3.6)番目(nは整数とする。)のアミノ酸残基の疎水性値の移動平均値Hは、次の式によって求められる。
【0033】
【数5】

【0034】
このようにして、アミノ酸配列の全残基について疎水性値の移動平均値を求め、グラフ上にプロットする。ここでは、基準となるアミノ酸残基を設定する。αへリックス構造では、親水性の残基も疎水性の残基も、3.6残基周期で現れ、且つ、親水性の残基と疎水性の残基の間のずれは、1.8残基である。したがって、基準のアミノ酸残基から、3.6、7.2・・・番目のアミノ酸残基の移動平均値をグラフ上にプロットすることにより、1つの折れ線401を描画する。基準のアミノ酸残基から、1.8、5.4、9・・・番目のアミノ酸残基の移動平均値をグラフ上にプロットすることにより、1つの折れ線402を描画する。一方の折れ線401は、ヘリックスの一方の側の残基の疎水性の移動平均値を示し、他方の折れ線402は、ヘリックスの他方の側の残基の疎水性の移動平均値を示す。
【0035】
折れ線401のうち、疎水性値の移動平均値が、所定の閾値403以上且つ所定の長さ以上連続した場合、そのアミノ酸配列領域を二次構造領域候補404とする。
次に、n番目のアミノ酸残基の両親媒性値Aを次の式で定義する。
【0036】
【数6】

【0037】
二次構造候補領域404において、両親媒性値Aが所定の閾値以上且つ所定の長さ以上連続した場合、そのアミノ酸配列領域を両親媒性二次構造候補領域とする。
【0038】
図5は、表示装置103によって表示される本発明による両親媒性二次構造検索の画面の例を示す。この画面の上側には、解析対象のアミノ酸配列の全残基について疎水性値の移動平均値をプロットしたグラフ、即ち、ハイドロパシープロット507と両親媒性二次構造候補領域508が表示されている。
【0039】
この画面は、更に、疎水性値の閾値(図4の閾値403)を設定するためのテキストボックス501、両親媒性値Aの閾値の設定するためのテキストボックス502、αへリックス構造とβシート構造のいずれかを選択するためのラジオボタン503、αへリックス構造を選択した場合に基準となるアミノ酸を設定するテキストボックス504、両親媒性二次構造候補領域の最小塩基長を設定するためのテキストボックス505、及び、解析の開始を行うためのボタン506を有する。
【0040】
図6は、本発明による両親媒性二次構造候補領域の検索方法を示す流れ図である。最初に、ステップ601にて、解析対象のアミノ酸の一次配列を入力する。入力するデータは、データベース、ファイル、手入力のいずれから取得してもよい。次に、ステップ602にて、解析パラメータを設定する。解析パラメータには、最小疎水性値、最小両親媒性値、最小候補領域長、二次構造種類等を含む。
【0041】
最小疎水性値は、図5の画面のテキストボックス501にて入力され、最小両親媒性値は、図5の画面のテキストボックス502にて入力され、最小候補領域長は、図5の画面のテキストボックス505にて入力され、二次構造種類は、図5の画面のラジオボタン503にて選択される。
【0042】
ステップ603にて、解析パラメータとして設定された二次構造種類がαへリックス構造かβシート構造かを判定する。αへリックス構造の場合は、ステップ604に進み、基準となるアミノ酸残基を設定する。基準となるアミノ酸残基は、図5の画面のテキストボックス504にて入力される。こうして、基準となるアミノ酸残基を設定したからステップ605に進む。βシート構造の場合は、そのまま、ステップ605に進む。
【0043】
ステップ605にて、解析対象のアミノ酸配列の全残基について疎水性値の移動平均値の算出を行う。ステップ606にて、両親媒性二次構造領域の検索を行う。次に、ステップ608にて、図4に示したハイドロパシープロットによる折れ線と両親媒性二次構造候補領域描画を行い、それを表示する。
【0044】
図7は、入力データのファイルの形式の一例で、一般的に使用されるFASTA形式である。入力データは、アミノ酸の配列名701と配列702を含む。
【0045】
以上、本発明の例を説明したが、本発明は上述の例に限定されるものではなく、特許請求の範囲に記載された発明の範囲にて様々な変更が可能であることは当業者に理解されよう。
【図面の簡単な説明】
【0046】
【図1】本発明による両親媒性二次構造検索装置のシステム構成図である。
【図2】両親媒性βシート構造の例を示す図である。
【図3】両親媒性αへリックス構造の例を示す図である。
【図4】本発明による両親媒性二次構造検索方法によって両親媒性二次構造候補領域のフィルタリングの例を説明するための説明図である。
【図5】両親媒性二次構造検索のユーザーインターフェースの例を示す図である。
【図6】本発明による両親媒性二次構造候補領域の検索方法を示す流れ図である。
【図7】本発明による両親媒性二次構造検索装置において入力データのファイルの形式の一例を示す図である。
【符号の説明】
【0047】
101…中央処理装置、102…データベース、103…表示装置、104…キーボード、105…マウス、201…親水性アミノ酸残基側鎖、202…疎水性アミノ酸残基側鎖、301…親水性アミノ酸残基側鎖、302…疎水性アミノ酸残基側鎖、401、402…ハイドロパシープロット、403…疎水性値の閾値、404…二次構造候補領域、405…両親媒性二次構造領域、501…疎水性値の閾値を設定するテキストボックス、502…両親媒性値の閾値を設定するテキストボックス、503…両親媒性二次構造を選択するラジオボタン、504…最小の両親媒性二次構造領域の長さを設定するテキストボックス、505…解析実行ボタン、506…解析における「1番目」のアミノ酸残基を設定するテキストボックス、507…ハイドロパシープロット、508…両親媒性二次構造候補領域、701…アミノ酸配列名、702…アミノ酸配列

【特許請求の範囲】
【請求項1】
入力装置を介して、解析対象のアミノ酸配列を入力し、二次構造としてαへリックス又はβシートを選択する入力ステップと、
上記二次構造としてαへリックスが選択された場合、上記解析対象のアミノ酸配列の奇数番のアミノ酸残基の疎水性値の移動平均値と、上記解析対象のアミノ酸配列の偶数番のアミノ酸残基の疎水性値の移動平均値と、をそれぞれ第1の移動平均値と第2の移動平均値として、計算する第1計算ステップと、
上記二次構造としてβシートが選択された場合、上記解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基の疎水性値の移動平均値と、上記解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基であって且つ上記3.6残基毎のアミノ酸残基に対して1.8残基ずれたアミノ酸残基の疎水性値の移動平均値と、をそれぞれ第3の移動平均と第4の移動平均値として、計算する第2計算ステップと、
上記アミノ酸残基の疎水性値の移動平均値を、縦軸が疎水性値、横軸がアミノ酸残基の番号とする座標にプロットし、上記第1の移動平均値に対する折れ線グラフを第1折れ線グラフ、上記第2の移動平均値に対する折れ線グラフを第2折れ線グラフ、上記第3の移動平均値に対する折れ線グラフを第3折れ線グラフ、上記第4の移動平均値に対する折れ線グラフを第4折れ線グラフとして、作成する折れ線グラフ作成ステップと、
上記折れ線グラフを画面上に表示する表示ステップと、
を有する蛋白質両親媒性二次構造領域の検索方法。
【請求項2】
更に、上記第1折れ線グラフと第1の閾値を比較し、上記第1折れ線グラフのうち上記第1の閾値より大きく且つ所定の長さより大きい領域をβシート二次構造領域候補とすることと、
上記βシート二次構造領域候補において、上記第1折れ線グラフと上記第2折れ線グラフの差が第2の閾値より大きい領域を両親媒性βシート二次構造候補領域とすることと、
上記βシート二次構造領域候補及び上記両親媒性βシート二次構造候補領域を上記折れ線グラフと共に表示する表示ステップと、
を有する請求項1記載の蛋白質両親媒性二次構造領域の検索方法。
【請求項3】
上記第3折れ線グラフと第3の閾値を比較し、上記第3折れ線グラフのうち上記第3の閾値より大きい領域をαへリックス二次構造領域候補とすることと、
上記αへリックス二次構造領域候補において、上記第3折れ線グラフと上記第4折れ線グラフの差が第4の閾値より大きい領域を両親媒性αへリックス二次構造候補領域とすることと、
上記αへリックス二次構造領域候補及び上記両親媒性αへリックス二次構造候補領域を上記折れ線グラフと共に表示する表示ステップと、
を有する請求項1記載の蛋白質両親媒性二次構造領域の検索方法。
【請求項4】
請求項1から3のいずれか1項記載の蛋白質両親媒性二次構造領域の検索方法をコンピュータに実行させるためのコンピュータによって読み取り可能なプログラム。
【請求項5】
解析対象のアミノ酸配列と、二次構造としてαへリックス又はβシートの選択を入力する入力装置と、
上記二次構造としてαへリックスが選択された場合、上記解析対象のアミノ酸配列の奇数番のアミノ酸残基の疎水性値の移動平均値と、上記解析対象のアミノ酸配列の偶数番のアミノ酸残基の疎水性値の移動平均値と、をそれぞれ第1の移動平均値と第2の移動平均値として、計算する第1計算部と、
上記二次構造としてβシート選択された場合、上記解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基の疎水性値の移動平均値と、上記解析対象のアミノ酸配列の3.6残基毎のアミノ酸残基であって且つ上記3.6残基毎のアミノ酸残基に対して1.8残基ずれたアミノ酸残基の疎水性値の移動平均値と、をそれぞれ第3の移動平均と第4の移動平均値として、計算する第2計算部と、
上記アミノ酸残基の疎水性値の移動平均値を、縦軸が疎水性値、横軸がアミノ酸残基の番号とする座標にプロットし、上記第1の移動平均値に対する折れ線グラフを第1折れ線グラフ、上記第2の移動平均値に対する折れ線グラフを第2折れ線グラフ、上記第3の移動平均値に対する折れ線グラフを第3折れ線グラフ、上記第4の移動平均値に対する折れ線グラフを第4折れ線グラフとして、作成する折れ線グラフ作成部と、
上記折れ線グラフを画面上に表示する表示装置と、
を有する蛋白質両親媒性二次構造領域の検索装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2007−34497(P2007−34497A)
【公開日】平成19年2月8日(2007.2.8)
【国際特許分類】
【出願番号】特願2005−214426(P2005−214426)
【出願日】平成17年7月25日(2005.7.25)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【Fターム(参考)】