説明

アミノ酸組成分析によるタンパク質同定方法及びそれを用いたコンピュータ・プログラム

【課題】同定精度を著しく低下させることなく、アミノ酸組成分析手法を用いて分析コストを低く抑制したタンパク質の同定手法を提供することである。
【解決手段】同定対象となる目的タンパク質のアミノ酸組成量をアミノ酸組成分析にて得、モデルタンパク質のアミノ酸組成量の理論値と実測値との誤差から算出される補正値により補正した後、アミノ酸組成分析における加水分解による情報欠落を考慮して作成された専用の成熟タンパク質データベースにて照会し、目的タンパク質を同定する。同定結果は、成熟タンパク質データベースに登録されているタンパク質について、目的タンパク質との適合率(スコア)を算出し、スコアの高い順に表示する。使用する成熟タンパク質データベースは、一般公開されているタンパク質データベースを利用して作成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アミノ酸組成分析によるタンパク質の同定方法及びそれを用いたコンピュータ・プログラムに関する。
【背景技術】
【0002】
タンパク質の同定、特にプロテオーム解析におけるタンパク質の同定には、質量分析計を用いた迅速かつ超微量での高精度な解析が主流となっている。質量分析での手法も多様に開発されており、特許文献1では直交加速型イオントラップ結合飛行時間型質量分析計において、イオントラップから射出されたイオンの速度分布を縮小する手法を設けることにより、一度に分析できる質量対電荷比範囲を拡大し、プロテオーム解析におけるタンパク質同定の効率を向上している。
【0003】
また、現在タンパク質の同定には使用されていないが、さらに別のタンパク質情報としてタンパク質の加水分解によるアミノ酸分析からアミノ酸組成情報が得られることも知られている。
【0004】
【特許文献1】特開2008−108739号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
上記のタンパク質の同定は、質量分析によるペプチドマスフィンガープリント法などの進展により迅速かつ超微量での解析が可能となっている。しかし、本手法は高額な機器や解析費及び煩雑な前処理が必要なため、汎用分析手法には適していない。
【0006】
一方、低コスト汎用手法として確立されているアミノ酸組成分析手法は加水分解反応のみタンパク質の固有のアミノ酸組成情報を提供するが、照会するデータベースが蓄積されていないことと、タンパク質が高分子になるほどアミノ酸組成分析における加水分解による測定誤差が大きくなるため、タンパク質の同定法としては確立していない。
【課題を解決するための手段】
【0007】
本発明は、上記課題を解決するため、低コスト汎用手法として確立されているアミノ酸組成分析手法を用いてタンパク質の同定を行う。
同定対象となる目的タンパク質のアミノ酸組成量をアミノ酸組成分析にて得、モデルタンパク質のアミノ酸組成量の理論値と実測値との誤差から算出される補正値により補正した後、アミノ酸組成分析における加水分解による情報欠落を考慮して作成された専用の成熟タンパク質データベースにて照会し、目的タンパク質を同定する。同定結果は、成熟タンパク質データベースに登録されているタンパク質について、目的タンパク質との適合率(スコア)を算出し、スコアの高い順に表示する。使用する成熟タンパク質データベースは、一般公開されているタンパク質データベースを利用して作成する。
【発明の効果】
【0008】
高額(100M\程度)で煩雑な前処理が必要な質量分析装置に替わり、低コスト(20M\程度)で簡便な前処理のアミノ酸分析装置、あるいは、高速液体クロマトグラフシステム(2M\程度)を使用してタンパク質同定を実施する。また、質量分析装置を用いるタンパク質同定には1検体あたり300k\程度必要であるが、アミノ酸分析を用いることにより1検体あたり20k\程度で実施することが可能になる。以上より、タンパク質の同定精度を著しく低下させることなく、低コスト及び簡便な分析でのタンパク質同定を実現する。また、タンパク質の分離形態により加水分解時の補正係数を設定することで、プロテオーム解析に用いられるような各種電気泳動媒体からのタンパク質同定を実現する。
【発明を実施するための最良の形態】
【0009】
以下に、本発明の実施例を、図を用いて手順1〜手順3に示す。
<手順1>
図1は、本発明なるタンパク質同定方法におけるデータフローを示す図である。
本発明におけるタンパク質の同定に用いる補正値データベースを作成する手順を、図1の右側上段のフロー(1〜4)に示す。
【0010】
先ず、組成既知のタンパク質を選定してそれをモデルタンパク質(既知)とし、そのモデルタンパク質において、アミノ酸組成量を定量分析する。その定量分析により、同モデルタンパク質のアミノ酸組成量の実測値が求まる。同モデルタンパク質のアミノ酸組成量の理論値を、上記定量分析により求まった実測値(定量したアミノ酸組成量)でアミノ酸ごとに除算し、得られた商を1つの補正値グループとして記録する。
【0011】
図2に、上述の記録された補正値グループの例を示す。すなわち、アミノ酸組成分析により、組成既知のモデルタンパク質のアミノ酸組成量を測定し、同タンパク質のアミノ酸組成量の理論値とでアミノ酸ごとに除算した商を、モデルタンパク質の補正値として記録する例を示している。
【0012】
この補正値グループを、モデルタンパク質の性質(低分子、高分子、疎水性および親水性)ごと、加水分解方法(溶液状態の試料、膜にトランスブロットした試料および電気泳動ゲル中の試料)ごと、および分析装置並びに分離モード(アミノ酸組成分析計、高速液体クロマトグラフ、質量分析装置、並びにイオン交換クロマトグラフィー、逆相クロマトグラフィー、飛行時間型質量分析などの分離モード)ごとの補正値グループを用意する。
【0013】
これら用意した補正値グループを補正値データベースとして記憶装置に保存する。
<手順2>
本発明におけるタンパク質の同定に用いる成熟タンパク質データベースを作成する手順を、図1の右側下段のフロー(5〜7)に示す。
【0014】
タンパク質を構成する20種類のアミノ酸の組成量を、一般公開されているタンパク質データベースに登録されているタンパク質ごとに算出する。ただし、アミノ酸組成分析における加水分解は成熟タンパク質について実施されるため、タンパク質のシグナル配列(細胞質内で生合成されたタンパク質の、輸送および局在化を指示する構造)の情報が欠落することを考慮し、シグナル配列を持つタンパク質はシグナル配列部分のアミノ酸配列を除去した後にアミノ酸組成量を算出する。
【0015】
図3は、一般公開されているタンパク質データベースからの、成熟タンパク質データベース作成の一例を示す図である。ここで、タンパク質データベースに記載されているアミノ酸配列(アミノ酸1個は全てアルファベット1文字で記述)からシグナル配列を除外(シグナル配列の位置情報は同データベースに記載)した配列において、各アミノ酸の含有率を百分率で算出して記録する。上記手順を、タンパク質データベースに登録されているタンパク質全てにおいて実施する。
【0016】
また、アミノ酸組成分析における通常の塩酸加水分解では、アスパラギン、グルタミンの2種類のアミノ酸がそれぞれアスパラギン酸、およびグルタミン酸に変化し、システイン、トリプトファンの2種類のアミノ酸の情報が基本的に欠落するが、アルカリ加水分解など特殊加水分解で上記情報の一部が欠落しない場合の使用を考慮し、本データベースの作成段階ではシグナル配列の情報欠落のみを考慮した成熟タンパク質データベースを作成する。
<手順3>
次に、図1の左側のフロー(8〜12)に示すように、タンパク質の同定を実施する。
(a) アミノ酸組成量の測定
アミノ酸組成分析により、同定対象となる目的タンパク質のアミノ酸組成量を求める。
なお、求めたアミノ酸組成量にはアミノ酸組成分析における加水分解による測定誤差が生じるため、本誤差の補正を実施しないと同定精度が著しく低下する。
また、求めたアミノ酸組成量には目的タンパク質のシグナル配列およびアスパラギン、グルタミン、システイン、トリプトファンの各アミノ酸の情報が欠落しており一般公開されているタンパク質データベースを使用することが出来ないため、上記情報欠落を考慮した同定方法が必要となる。
(b) アミノ酸組成量の補正
上述の<手順1>で求めた補正値データベースから、目的タンパク質の性質、加水分解方法および分析装置に合わせて補正値グループを読み出し、目的タンパク質のアミノ酸組成量に対してアミノ酸ごとに積算補正する(図4を参照)。
これにより、アミノ酸組成分析における加水分解によるアミノ酸組成量の実測値を理論値に近似させ、同定精度を向上させる。
【0017】
なお、ここでは、目的タンパク質のアミノ酸組成量の測定時の誤差が、同じタンパク質の性質、同じ加水分解方法、および同種の分析装置であれば毎回同程度であることを利用している。
(c) スコア(適合率)の算出
図5にスコア算出の手順を示す算出フローを示す。
【0018】
成熟タンパク質データベースに登録されているタンパク質を算出対象タンパク質とし(51)、算出対象タンパク質のアミノ酸組成量において、上記(b)にて補正したアミノ酸組成量との含有率の差分をアミノ酸ごとに求め(52)、さらにその差分の絶対値の平均(X)を算出対象タンパク質ごとに求める(56)。
【0019】
通常のアミノ酸組成分析における加水分解によりシステインおよびトリプトファンの情報が欠落するため、システインおよびトリプトファンは差分算出を実施しない。なお、特殊加水分解で、上記2種類のアミノ酸情報が存在する場合はこの限りでない。
【0020】
アミノ酸組成分析における加水分解によりアスパラギンおよびグルタミンはそれぞれアスパラギン酸およびグルタミン酸に変化してしまうため、算出対象とすべきタンパク質のアミノ酸組成量においてアスパラギン・グルタミンの含有率をそれぞれアスパラギン酸・グルタミン酸に加算しておく。
【0021】
算出した累計差分から求めた平均差分Xは、差分絶対値の平均Xは、算出対象タンパク質と目的タンパク質とが完全一致の時0となり、適合率が高いもの程、差分絶対値の平均値X平均差分Xは低い値となる。そこで、これを調整するために、算出した平均差分X絶対値の平均Xから、次の指数関数(式1)によりスコアf(X)を算出する(57)。
【0022】
f(X)=100*(1/2)^X・・・・(式1)
成熟タンパク質データベースに登録されているタンパク質ごとに、図5のルーチンを実行し、スコアを算出していく。成熟タンパク質データベースに登録されている全てのタンパク質についてスコアを算出した後、スコア上位100種を同定結果画面に表示する。図6にその同定結果画面の一例を示す。
【0023】
同定結果画面には、タンパク質の識別名称およびスコアの他に、受入番号、生物種名、分子量および説明を表示し、近しいスコアのタンパク質が表示された場合の判断基準とする。以上の情報は成熟タンパク質データベースから読み込む。
【0024】
また、一般公開されているタンパク質データベースでの該当タンパク質のホームページアドレスを受入番号にリンクすることにより、タンパク質データベースのホームページを表示してタンパク質の詳細な情報を確認することが出来る。
【0025】
なお、本実施例の説明では、手順1から手順2の順に説明したが、本分析において、この順番に拘るものではない。
【図面の簡単な説明】
【0026】
【図1】本発明のタンパク質同定手法におけるデータフローを示す図である。
【図2】アミノ酸組成量の補正値の算出方法を示す図である。
【図3】一般公開されているタンパク質データベースからの、成熟タンパク質データベース作成の一例を示す図である。
【図4】アミノ酸組成分析により測定した目的タンパク質のアミノ酸組成量の補正を示す図である。
【図5】出力スコア算出の手順を示すフローチャートである。
【図6】本発明による目的タンパク質の同定結果を表示する画面である。
【符号の説明】
【0027】
1…組成既知タンパク質、2…アミノ酸組成量測定、3…補正値算出、4…補正値データベース、5…タンパク質データベース、6…シグナル配列情報を除外したアミノ酸組成量算出、7…成熟タンパク質データベース、8…目的タンパク質、9…アミノ酸組成量測定、10…補正値積算、11…成熟タンパク質データベースにて同定、12…同定結果画面、50…スコア算出開始、51…算出対象アミノ酸の入力および累計差分の初期化、52…差異の算出、53…累計差分の算出、54…全アミノ酸の算出確認、55…算出対象アミノ酸のシフト、56…平均差分(X)の算出、57…スコアの算出。

【特許請求の範囲】
【請求項1】
タンパク質の同定を、アミノ酸組成分析を用いて行うタンパク質同定方法であって、
(a) 組成既知のモデルタンパク質のアミノ酸組成量の理論値と、前記モデルタンパク質のアミノ酸組成量の前記アミノ酸組成分析による実測値との誤差から算出される補正値を、前記モデルタンパク質の性質、定量方法および分析装置ごとに補正値データベースを用意するステップと、
(b) 公開データベースに含まれ、分析対象の成熟タンパク質で欠落するシグナル配列情報を考慮して成熟タンパク質データベースを作成するステップと、
(c) 同定対象となる目的タンパク質のアミノ酸組成量を前記アミノ酸組成分析により実測し、前記補正値データベースの補正値を用いて、前記目的タンパク質のアミノ酸組成量を補正するステップと、
(d) 前記成熟タンパク質データベースを用い、前記アミノ酸組成分析における加水分解により欠落するアミノ酸情報を考慮して前記目的タンパク質を同定するステップと、を含むタンパク質同定方法。
【請求項2】
前記ステップ(a)において、前記モデルタンパク質のアミノ酸組成量の理論値を、該モデルタンパク質のアミノ酸組成量の実測値でアミノ酸ごとに除算し、その商を補正値データベースとしてデータベース化する請求項1に記載のタンパク質同定方法。
【請求項3】
前記補正値データベースを、前記モデルタンパク質の性質ごとに、すなわち疎水性、親水性、高分子、および低分子等、加水分解に影響するタンパク質の性質ごとにデータを蓄積する請求項2に記載のタンパク質同定方法。
【請求項4】
前記補正値データベースを、前記モデルタンパク質の加水分解方法ごとに、すなわち通常の溶液状態の試料、膜にトランスブロットした試料、および電気泳動ゲル中の試料等、試料の状態ごとにデータを蓄積する請求項2に記載のタンパク質同定方法。
【請求項5】
前記補正値データベースを、前記モデルタンパク質のアミノ酸組成量を測定する分析装置並びに分離モードごとに、すなわちアミノ酸組成を発生させる分析装置(例えばアミノ酸組成分析計、高速液体クロマトグラフ、質量分析装置など)、およびアミノ酸の分離モード(例えばイオン交換クロマトグラフィー、逆相クロマトグラフィー、飛行時間型質量分析など)ごとにデータを蓄積する請求項2に記載のタンパク質同定方法。
【請求項6】
前記ステップ(b)において、前記成熟タンパク質データベースを、一般公開されているタンパク質データベースから作成する請求項1に記載のタンパク質同定方法。
【請求項7】
前記ステップ(c)において、前記目的タンパク質のアミノ酸組成量の測定時の誤差が、同じタンパク質の性質、同じ加水分解方法、および同種の分析装置であれば毎回同程度であることを利用し、前記補正値データベース上の前記目的タンパク質の性質に近いタンパク質、および同じ加水分解方法の補正値を使用して、前記アミノ酸組成分析による目的タンパク質の同定を行う請求項1に記載のタンパク質同定方法。
【請求項8】
前記ステップ(d)において、前記アミノ酸組成分析にて得られた目的タンパク質のアミノ酸組成量に前記補正値データベースを用いて補正した値を、アミノ酸組成分析における加水分解によるアスパラギン、グルタミン、システイン、トリプトファンの各情報の欠落を考慮して、前記成熟タンパク質データベースにて照会することにより、前記目的タンパク質を同定する請求項1に記載のタンパク質同定方法。
【請求項9】
請求項1〜8のいずれか一つに記載のタンパク質同定方法のステップを実行する、コンピュータ可読媒体に具現されたコンピュータ・プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−96501(P2010−96501A)
【公開日】平成22年4月30日(2010.4.30)
【国際特許分類】
【出願番号】特願2008−264751(P2008−264751)
【出願日】平成20年10月14日(2008.10.14)
【出願人】(000125369)学校法人東海大学 (352)
【出願人】(300050367)株式会社日立ハイテクフィールディング (11)
【Fターム(参考)】