説明

質量分析による生体分子同定法

【課題】生体分子配列を構成する基本単位分子の組合せ計算により導出すること、また導出した配列が質量分析された場合のフラグメントイオンの質量電荷比をコンピュータ計算によって推定することにより、質量分析を用いた生体分子の同定において必要となるデータを導出し、既知、未知を問わす生体分子配列を決定すること。
【解決手段】生体分子配列を構成する単位分子の取り得る組合せの検討することで、既知未知を問わず生体分子配列を計算し、その生体分子配列が質量分析により測定された場合に検出される質量電荷比を算出する。算出した質量電荷比と質量分析値を、質量分析におけるフラグメントイオンの検出量に従うイオン強度と生体分子配列を構成する単位分子間の特定の結合が切れやすいことを評価する全く新しい照合方法を利用することにより、本課題を解決する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量分析を用いた生体分子同定に必要となる生体分子配列とその配列に対して開裂を伴う質量分析を行った場合の質量電荷比の理論値をコンピュータにより導出し、その質量電荷比の理論値と生体分子の質量分析結果を比較することで、生体分子配列を決定する手法に関する。
【背景技術】
【0002】
ゲノムや遺伝子に代表されるDNA配列やタンパク質を構成するアミノ酸配列、糖鎖を構成する糖鎖配列の解析は、生命現象の解明や病態の把握には不可欠とされ、バイオテクノロジーのみならず医薬研究において注目されている。DNA配列解析は、様々な生物種のゲノム計画に代表されるようにDNAシーケンサーとコンピュータによる配列アライメントにより実現され、現在も新たなゲノムや遺伝子解析が行われている。また、タンパク質の配列解析においては、プロテインシーケンサーでアミノ酸配列を解読する手法は存在するが、修飾されたアミノ酸の検出やUV等の検出器の分解能、解析に必要となるサンプル量の問題があり、プロテインシーケンサーの断片的な解析結果とDNA配列解析の結果を組合せて解析するといった手間と時間が必要となる解析が余儀なくされている。
【0003】
2002年のノーベル化学賞受賞で注目された田中耕一氏とJohn B. Fenn博士らの生体高分子のイオン化法の研究成果は質量分析技術を格段に向上させ、タンパク質や糖鎖のみならず、DNAを含めた生体分子の解析において質量分析を不可欠なツールとした。一般的には、質量分析によって生体分子を測定した場合に得られる質量スペクトルと既知の生体分子配列が質量分析された場合に検出されるであろう質量電荷比を比較することで、測定された生体分子配列を決定する解析に質量分析は用いられる(特許文献1)。しかしながら、測定した生体分子の配列が既知の情報としてデータベース化されている場合はその生体分子配列を知ることができるが、データベースに登録されていない未知の配列である場合にはその生体分子配列が決定できないばかりでなく、データベース化されている配列として誤った配列決定を行われる可能性がある。
【0004】
またデータベース化された生体分子配列と測定された質量スペクトルの比較アルゴリズムは、質量電荷比のみで検討することで生体分子配列を決定する為、十分な精度が得られていない。
【0005】
未知の生体分子配列を解析する場合は、データベースを用いるのではなく、質量スペクトルから直接配列を解読するde novo sequencing法という手法が存在する(特許文献2)。この手法では、質量ピークから検討すべき配列の組合せ計算が膨大であり計算時間が掛かるばかりでなく、配列を特定する為に必要な質量ピークがすべて現れることは珍しいゆえ解析は万能ではない。このような技術背景から、質量分析を行う生体分子の配列を特定すべく、生体分子配列データベースの充実または新たな生体分子配列同定法が望まれている。
【0006】
【特許文献1】特開平11−237383
【特許文献2】特開2006−162556
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明が解決しようとする課題は、生体分子配列を構成する基本単位分子の組合せ計算により配列を導出し、導出した配列から推定される質量電荷比をコンピュータ計算によって推定することにより、質量分析を用いた生体分子の同定において必要となるデータを算出し、既知、未知を問わす生体分子配列を決定するデータを提供することである。
【0008】
また、従来の既知の生体分子配列の質量電荷比と質量分析の実測値の比較における質量電荷比のみを用いた比較に対して、質量電荷比とイオン強度を利用する比較法を発明することで、〔0007〕において導出したデータを用いての生体分子の配列決定ならびに配列決定精度を向上させることである。
【課題を解決する為の手段】
【0009】
上記課題を克服するため、1)生体分子配列の列挙、2)1)の配列の質量分析により検出されうる理論質量電荷比の列挙と3)列挙された理論質量電荷比と生体分子の質量分析結果である質量電荷比を検出されたイオン強度を加味して比較することで、生体分子配列を決定する。
【0010】
〔0009〕1)では、生体分子の種類によって定義される配列の基本単位分子、つまり、配列を作る単位分子種が組み合わされることで考えられる配列を列挙する。より具体的には、対象となる生体分子がM種の基本単位分子から構成されると考えると、直鎖上の配列が構成される場合、配列長Nの生体分子配列はM種類考えられる。配列長Nが決ま

置の質量電荷比における測定範囲からMにおけるNの長さを検討することで考えられる配列数を限定できる。これにより導出された配列全て、または一部をデータベースへ保持する。
【0011】
なお〔0010〕は、データベース化のみならず、配列決定を行う生体分子の測定質量にあわせて動的に該当配列を計算することも含まれる。
【0012】
〔0009〕2)は、1)において列挙した配列が、質量分析中で与えられるエネルギーによって起こる分子開裂で生成するフラグメント質量を予測する。タンパク質を例にすると、〔非特許文献1〕に示されるように配列を構成するアミノ酸間の特定結合位置が開裂しやすいことが知られている。同様に糖鎖においても、単糖内のグリコシル結合、もしくはピラノース環の特定位置において開裂が起きやすいことが知られている。そこで、生体分子種によりあらわれる配列の開裂位置の特性から、1)において導出した配列が特定位置で開裂した場合の質量電荷比を計算する。
【0013】
なお、〔0012〕において計算される質量電荷比はデータベースとして事前に算出しておく場合、開裂前の生体分子の質量分析結果から得られる質量電荷比にあわせた〔0009〕1)中の該当配列のみの質量電荷比を動的に求める場合を問わない。
【0014】
〔0009〕3)は、生体分子を実際に質量分析した場合の質量電荷比と〔0012〕にて計算した質量電荷比を比較することで配列決定を実施する。生体分子を質量分析した場合には〔非特許文献1〕に示されるよう、特定のイオン系列、つまり配列を構成する分子単位の特定の結合位置での開裂が起こりやすい。特定のイオン系列の結合が切れやすいことを考えれば、そのイオン系列の質量ピークのイオン強度は大きく現れかつ、他のイオン系列の質量ピークは現れないかイオン強度が小さい状態で検出される。そこで、同一のイオン系列の質量ピークが多く検出されかつ、そのイオン系列の質量ピークのイオン強度が大きく現れることを評価する関数により〔0009〕1)で算出した配列を比較することで配列決定を実施できる。
【0015】
具体的には、〔0014〕における配列決定の為の評価関数は、〔0009〕2)で得られる質量電荷比群のある質量ピークに対して、実際に質量分析されて得られた質量ピークにある測定誤差を検討し同一性が見られた場合のイオン強度と、〔0009〕2)の質量電荷比の各イオン系列ごとの同一性の見られる質量電荷比の割合により評価を行う。各イオン系列において、〔0009〕2)中の実測されうる各単位生体分子配列の質量電荷比数をH、実測された質量と〔0009〕2)で算出された質量ピークの同一性が見られたピーク数hの比h/Hを評価することで、特定のイオン系列の結合が切れやすい特性を評価する。また、イオン系列全体として同一性が多く見られる場合にイオン強度が大きく現れることを考慮するべく、〔0009〕2)と同一性が見られた質量ピークのイオン強度iを考慮した関数g(i)を検討し、前述のイオン系列の結合が切れやすい特性を評価したh/Hの関数f(h/H)とg(i)の2つを同時に検討することで評価を行う。評価の一例として、f(h/H)とg(i)の単純積が考えられる。
【0016】
【数式1】

【0017】
但し、sは各イオン系列を表し、pは実測されたピークを表す。なお、f(x)およびg(x)は、2つのパラメーターh/Hとiの評価における重みを検討するものである。
【0018】
より具体的には、イオン強度の分布や、配列の長さとイオン系列数に評価関数値が依存することも考えられる為、求める配列長や測定時のイオン強度全体に関する影響を加味して評価関数を定義する。
【発明を実施するための最良の形態】
【0019】
この評価を〔0009〕1)にて列挙した配列全体もしくは、開裂を伴わない質量分析により検出された開裂前の生体分子配列全体の質量にて限定した配列群に対して実施することで、評価値の大きい配列が質量分析結果の示す生体分子配列であると決定する。
【0020】
【非特許文献1】Johnson,R.S.,et al.,Anal.Chem.,59,2621−2625(1987)
【発明の効果】
【0021】
本発明により、バイオテクノロジーならびに医薬研究において解析が不可欠である生体分子の1次構造、つまり配列情報を特定できる。また、生体分子が既知・未知であることを判断して未知分子の分析方法を検討するのではなく、既知・未知ともに同様の解析で生体分子配列を決定することが可能になる。
【発明を実施するための最良の形態】
【0022】
以下、本発明を更に詳細に説明するが、以下の構成要件の説明は、本発明の実施態様の代表例であり、本発明はこれらの内容のみに特定されるものではない。
本発明を実施する上で必要となる生体分子の質量分析では、複数回の開裂施行を伴う質量分析の実施を前提とし、開裂前の生体分子質量を測定する質量分析結果を得られることが望ましい。
【実施例】
【0023】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
DNA、タンパク質や糖鎖といった生体分子の内、タンパク質に関する質量分析結果を例に用いて未知生体分子の配列解析を説明する。タンパク質の質量分析では、一般的にトリプシン等のプロテアーゼによる消化を行うことで得られるペプチド断片を用いて分析が行われる。本実施例に関しても、同様にトリプシンによる消化を行うことで生成されたペプチドを用い、図1に示される質量スペクトルが得られたものとする。このスペクトルはペプチドが質量分析中において与えられるエネルギーにより開裂したものであり、開裂前つまりペプチド全体の質量電荷比(m/z)はあらかじめm/z=974.44として測定されている。
【0024】
ペプチド全体の質量電荷比m/z=974.44が1価イオンであると仮定すると、ペプチド全体の分子量は、プロトンの分子量を差し引いた973.43Daとして計算される。
【0025】
タンパク質、またはペプチドを構成する単位分子はアミノ酸であるため、20種類のアミノ酸を配列として組合せた場合に、ある程度の誤差を含めて973.43Daに近い値をとり得るアミノ酸配列の組合せの候補を検討する。誤差は、質量分析装置や測定環境に応じて検討する。
【0026】
〔0025〕においてのアミノ酸の組合せの検討は、20種類の配列を組合せて考えられる配列をあらかじめデータベースとして作成し、該当する分子量の配列から候補となるアミノ酸配列を検索する、もしくは973.43Daにある程度の誤差(例えば、±0.30Da)を検討した場合の分子量の範囲にあるアミノ酸の組合せを計算し列挙する。
【0027】
〔0026〕により列挙されたアミノ酸配列の組合せのうち、実施例として手順を説明すべく、実際に測定されたペプチド配列“DLGEEHFK”を例に以降説明する。ペプチド配列“DLGEEHFK”の分子量は973.46Daであり、実測値との誤差が0.03Daであることから〔0026〕によるアミノ酸の組合せとして表される決定配列の候補に含まれることは言うまでもない。
【0028】
ここでペプチド配列“DLGEEHFK”が、開裂を伴う質量分析によって測定された場合にフラグメントイオンとして検出されることが想定できるフラグメントイオンの分子量を図2のマトリックスとして示す。ここで示されるイオン系列は、〔0020〕の〔非特許文献1〕に示されるイオン系列中、測定を行った質量分析計によって起こりやすい開裂のイオン系列を示している。
【0029】
質量分析結果はペプチド全体の分子量の範囲の全てのピークが検出されるわけではなく、質量分析計とその設定に応じた質量電荷比の範囲の質量スペクトルしか測定できない。そこで図2のフラグメントイオンの分子量中、測定された質量分析値内に属する質量を太字にして示したのが図3である。この図3中に太字で示された値が質量分析値として全て検出されれば、事前に予想されたペプチド配列の測定結果である可能性が高い。しかしながら、開裂位置によりピークが出現しない可能性も考えられる為、全てのフラグメントイオンの分子量を示す質量ピークが存在することのみを配列決定の条件にすることは難しい。
【0030】
図4は、図3で示されたフラグメントイオンの分子量に対してある程度の誤差(ここでは、±0.30Da)を持たせた場合に、実際に検出された質量ピークがその分子量に該当した場合を赤字、該当する質量ピークが存在しない場合を青字で示したものである。図1との比較、または図4中の括弧内に示されたイオン強度によって分かるように、質量分析計ならびに測定環境から多く出現が期待されるyイオンの系列がイオン強度としても強く検出され、かつ各アミノ酸の該当するイオン系列全体にわたり検出されている。但し、ここで示されるイオン強度は、最もイオン強度の大きいピークを100として、百分率で示したものである。
【0031】
質量分析において行われる開裂試行により与えられるエネルギーの状態により、測定分子が完全にバラバラになる場合、多くの種類の質量ピークが検出される為、検出が想定される質量電荷比の多くが満たされる可能性はあるが、質量ピーク間のイオン強度を評価することで、測定分子の開裂具合を加味しながら配列決定の評価が実施される。
【0032】
ここで、分子量が973.46Daであるペプチド配列“DSSSRGHTK”を考える。前述の通り、開裂前のペプチドの分子量の測定値は973.43Daであった為、測定誤差を考慮したペプチドの分子量の範囲で考える限り、ペプチド配列“DSSSRGHTK”が求める配列である可能性も考えられる。
【0033】
図5で示したのは、ペプチド配列“DSSSRGHTK”により検出されると考えられるフラグメントイオンの分子量のマトリックスである。実測した質量ピーク値が図5により想定されるフラグメントイオンの分子量にある程度の誤差を持たせた値と一致した数が、イオン系列内で検出が想定されるピーク数に対して少ないだけでなく、該当質量ピークのイオン強度が極めて小さい。これにより、ペプチド配列“DSSSRGHTK”が、図1により示された質量分析結果から決定される配列と考えることか難しいことは容易に分かる。
【0034】
また、図5だけを見る限りでは、質量分析されたペプチドが十分に開裂を起こさなかったゆえに与えられる結果であると考えられるが、他にイオン強度が高く現れるピークの所以が示されるペプチド配列“DLGEEHFK”等の評価によって、ペプチド配列“DSSSRGHTK”が配列決定結果として相応しく無いことは結論付けられる。
【0035】
ペプチド配列“DLGEEHFK”、ペプチド配列“DSSSRGHTK”と同様に、[0026]により得られるペプチド全体の分子量が近い配列に対して同様な評価を行い実際のペプチドの配列を決定する。この実施例の場合は、前述のペプチド配列“DLGEEHFK”が決定される配列である。
【0036】
以上の一連の解析の流れを図6のフローチャートとして示す。
【図面の簡単な説明】
【0037】
【図1】実施例において配列決定を行うあるペプチドの質量スペクトルである。
【図2】ペプチド配列“DLGEEHFK”に対し開裂を伴う質量分析を行った場合に検出が想定されるイオン系列とその各フラグメントイオンの分子量である。
【図3】図2に示されるフラグメントイオンの分子量中、質量分析値の範囲内にある分子量を示した図である。
【図4】図3に示される質量分析値の測定範囲内にある分子量のうち、実測された質量分析値に該当するピークを赤字、該当しないピークを青字で示した図である。ここで、括弧内の数値は、該当質量ピークの検出イオン強度を百分率で示したものである。
【図5】ペプチド配列“DSSSRGHTK”に対して、配列決定を実施した場合の理論的なフラグメント質量値と実測値の対応を示した図である。
【図6】実施例で示した解析のフローを示した図である。

【特許請求の範囲】
【請求項1】
生体分子の種類に応じて考えられる、生体分子配列を構成する特定単位分子をコンピュータにより組合せることで、既知、未知を問わない生体分子配列を導出し、その生体分子配列の質量電荷比の理論値を計算する手法。
【請求項2】
請求項1により導出される質量電荷比の理論値と、生体分子の測定値である質量電荷比とイオン強度を利用することにより、生体分子配列を決定する方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate