説明

質量分析プリカーサーイオンの選択

本発明は、質量分析計でフラグメント化するためのサンプルポリペプチドのプリカーサーイオンを選択する方法、サンプルポリペプチドに対する少なくとも1つの推定アミノ酸配列を決定する方法、それらに用いられる装置およびコンピュータプログラムに関する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量分析計中でフラグメント化するためのサンプルポリペプチドのプリカーサーイオンを選択する方法、サンプルポリペプチドに対する少なくとも1つの推定アミノ酸配列を決定する方法、それらに用いられる装置およびコンピュータプログラムに関する。
【背景技術】
【0002】
質量分析は、タンパク質試料の同定のための益々重要なツールである。現在、質量分析を使用して試料タンパク質/ポリペプチド(特に言及していない限り、本明細書においては、タンパク質とポリペプチドという2つの用語は相互に読み替え得るものとする)のを同定(確認)することは、当該分野において既知である。MASCOT(MOWSEアルゴリズムに基づく)などのタンパク質質量フィンガープリンティングプログラムは、タンパク質を酵素(トリプシンなど)分解したものから得られた質量分析データを利用し、一次配列データベースからタンパク質を同定しようとするものである(非特許文献1)。質量分析データからタンパク質を同定する法においては、タンパク質を酵素により分解して得られたペプチドの分子量を(質量電荷比として)用いる。他の法においては、1個またはそれ以上のペプチドより得られるタンデム質量分析データ(MS/MSまたはMS2としても知られている)を使用しており、この法では、対象イオン種を選択して、序列的な(hierarchical)生成物イオンスペクトルが得られるようにフラグメント化される。さらに他の法では、質量データをアミノ酸配列データと組み合わせている。MALDI質量分析システムにおけるレーザーフルエンスの制御にファジィ理論システムが用いられている(非特許文献2)。
【0003】
国際公開第03/102572号パンフレット(特許文献1)は、サンプルポリペプチドに対する少なくとも1個の新規な(de novo)推定(候補)アミノ酸配列を決定する方法を呈示している。当該文献に記載された発明は、n≧2であるMSn質量スペクトルを用いる場合に特に有用である。本明細書においては、これを「シーケンサー」と呼ぶ。
【0004】
しかし、高次のMSn質量スペクトルを得るためには、さらにフラグメント化するためのプリカーサーとなるイオンピーク(m/zピーク)を選ばなければならず、最適の選択を行うためには、現在のところ、プリカーサーイオンの選択に熟練した入力技術を要する。したがって、国際公開第03/102572号パンフレット(特許文献1)に記載の方法(および他の質量分析法)から最良の結果を得るためには、フラグメント化のためのm/zピーク(プリカーサーイオン)の選択を熟練者により行う必要がある。
【0005】
サンプルポリペプチドに対する仮想アミノ酸配列を決定しようとする場合、質量スペクトルの少なくとも1つのm/zピークをさらにフラグメント化する必要がある特定の状況が生じうる。例えば、MALDI-QIT分光計を用いる場合、装置中のイオントラップの制限により、プリカーサーの1/3以下の質量を有するイオンが検出不能になる。同様に、下1/3の質量域のフラグメントイオンは通常観測できない。検出不能な領域に関連する質量スペクトルデータをさらに誘導するためには、さらにフラグメント化させて情報を得るためのプリカーサーとするために、質量スペクトルから適当なピークを選択しなければならない。理論的には、この方法をさらに実行し、親タンパク質のタンデムスペクトルMSnを得ることができる。
【0006】
プリカーサーイオンを選択するために現在用いられている方法は、主にm/zピークの強度に依存している。スペクトル中で最も強度の高いピークが、次のスペクトルのための(さらにフラグメント化するための)プリカーサーとして選択される。上述したように、通常、選択は熟練者が質量スペクトルを目視することにより行なわれる。この方法は高コストな法であることは明らかであると共に、適当な熟練者が確保できるかにも依存する。さらに、このような方法では、正しいm/zピークの選択がなされるかについては保証されない。
【0007】
特に、不適切なm/zピークが、さらにフラグメント化に供するためのプリカーサーとして選択されないことが保証されることが望ましい。例えば、化学ノイズピークまたは内部イオンがプリカーサーイオンとして用いられないことが保証されることが望ましい。
【0008】
質量スペクトル法は、高速かつ高スループットなポリペプチドのデノボシーケンシングを可能にするが、そのために望まれるのは、人間の介入を極力必要としない自動化法である。特に、分析対象であるサンプルポリペプチドを質量分析装置に供給するだけで、新規な配列決定(デノボシークエンス)またはデータベース検索法によってサンプルポリペプチドのアミノ酸配列が決定され、得られるアミノ酸配列がサンプルポリペプチド中の可能な限り大きな部分のアミノ酸配列であって、高い正確性を有するものであるためには、熟練者に対する要求水準で処理を行う必要がある。
【特許文献1】国際公開第03/102572号パンフレット
【非特許文献1】マトリックス・サイエンス(MatrixScience)社、パーキンス(Perkins)ら、Electrophoresis. 1990年12月;20(18):3551-67;PMID:1061228
【非特許文献2】ジェンセン(Jensen)ONら、Anal Chem. 1997年5月;1;69(9):1706-14;PMID:9145026
【発明の開示】
【発明が解決しようとする課題】
【0009】
本発明は、従来技術の欠点を克服し、上記の問題を解決しようとするものである。特に、本発明は、国際公開第03/102572号パンフレットに記載の方法と同様、質量スペクトルから、サンプルポリペプチドに対する少なくとも1つの推定(すなわち、候補)アミノ酸配列を決定し、さらにフラグメント化するためのプリカーサーイオンとして少なくとも1つのm/zピークを選択する必要のある他の方法と組み合わせて使用することができる。
【課題を解決するための手段】
【0010】
本発明に従えば、フラグメント化のために部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルのプリカーサーイオンを選択する方法が提供され、該ソフトイオン化質量スペクトルは、該部分的に分解されたサンプルポリペプチドから得られるイオン種の一組のm/zピークを有しており、該方法は以下の工程を含む:
(i)前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、それぞれのピーク候補セット中の各ピークが少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっている少なくとも2組のm/zピーク候補セットを決定し、それぞれのm/zピーク候補セットから、それぞれのアミノ酸配列が、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である推定アミノ酸配列を決定する工程;および
(ii)人工知能手法を用いて前記少なくとも2組のm/zピーク候補セットの中の前記m/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択する工程。
【0011】
後に詳述するように、具体的にはファジィ理論手法を使用することができる。しかし、ファジィ理論手法の代わりに、或いはファジィ理論手法と共に、データマイニング法、人工ニューラルネットワーク法、決定木法、遺伝的アルゴリズム、およびC4.5等の規則帰納(rule
induction)システム、および機械学習法等が挙げられるがこれらに限定されない他の人工知能手法を用いてもよい。
【0012】
後に詳述するように、ファジィ理論手法で使用されるルールは、質量スペクトルに対応するそれらの選択された変数に関する専門的知識に基づいている。これらのルールより、m/z候補ピークのプリカーサーイオンとしての適合性が判断される。特定の装置により得られるデータセットに対するルールを発見するために、ファジィ理論の代わりに、或いはファジィ理論と共に、ニューラルネットワーク、決定木法および遺伝的アルゴリズム等のデータマイニング法を使用してもよい。通常、これらの方法では、学習を通して、特定の実験データのセットから結論が導き出される。学習に用いられるデータセットは、特定のスペクトルから得られ、相対強度値で表される全ての質量ピークであってもよい。
【0013】
これらの方法を適用してモデルが構築されると、新たなデータの記述にこのモデルを使用することができる。それを単独で新たなデータセットに適用して、モデルからプリカーサーイオンを選択することができる。それを、(例えば、プリカーサーイオンの選択を制御するための)オンラインコントロールシステムを有するようにファジィ理論システムと組み合わせると、これらの方法より誘導されるモデルは、ファジィ理論手法により行なわれる人工知能的判断を補助するためのルールベースを形成することができる。種々の方法を用いてモデルを定義するために、多くの異なる変数を用いることができる。
【0014】
通常、予測モデルの構築には、3種類のデータマイニング技術、すなわち、ニューラルネットワーク、決定木法、および規則帰納システムが用いられる。ニューラルネットワークでは、従前規則(predicate rules)(例えば、どのピークがプリカーサーとして選択され/どれが選択されないか)を発見することができると、数値形式の解答が得られる。規則帰納システムを予測に用いた場合、他の方法で誘導されたルールに比べて、判断についてより多くの説明、およびどれが他のものより良いかについての指標が得られる。本システムに組み込むには、ニューラルネットワークの方がよりふさわしいデータマイニングアルゴリズムである。
【0015】
本システムの実用性を判断するためには、これらの方法より誘導されたルールまたは予測モデルの精度および被覆率が重要である。ルールの不確実性を認識し明確化しておくことは、ファジィ理論による選択結果に影響を与える。被覆率は、ルールに含まれるか、ルールが適用されるデータの数を表す。被覆率が高いと、より信頼性の高い結果が得られる。
【0016】
具体的には、質量分析において、さらにフラグメント化するためのプリカーサーイオンとなるm/zピークを選択する方法は、もちろんそれらに限定されるわけではないが、国際公開第03/102572号パンフレットに記載された手法において用いることができる。サンプルポリペプチドに対する推定アミノ酸配列の生成に他の手法を用いてもよく、本発明の方法は、さらにフラグメント化するためのm/zピークを決定することが必要な方法に等しく適用することができる。
【0017】
誘導された一連の推定アミノ酸配列中に、C末端にアルギニンを有するトリプシンペプチド中のアスパラギン酸等の特定のアミノ酸が発見されると、これらのアミノ酸はその特異的な化学的構造および性質により切断を起こしやすい部位となるので、さらにフラグメント化したスペクトル中で高い強度を有する可能性のあるピークを予測する手がかりとなりうる。
【0018】
あるm/zピークの「少なくとも1つの近隣のピーク」とは、当該m/zピークの値より大きいおよび/または小さいような、最も近いm/z値のものを意味する。例えば、仮にm/z値が375、300、347、372および331であるようなm/zピークのセットにおいては、ピーク値331は、2つの近隣ピーク、すなわち、300と347を有することになる。
【0019】
サンプルポリペプチドの質量は少なくとも3000Daであり、例えば、少なくとも4000、5000、6000、7000、8000、9000、10000または15000Daである。サンプルポリペプチドを部分分解することにより、例えば、3000または4000Da以下の質量を有するフラグメントを得ることができる。
【0020】
ソフトイオン化質量スペクトルにより、少なくとも3個のm/zピークが得られ、例えば、4、5、6、7、8、9、10、15、20、25、30、40、50、75または100個のm/zピークが得られる。
【0021】
それぞれのm/z候補ピークは、少なくとも3個のm/zピークを含んでいてもよく、例えば、4、5、6、7、8、9、10、15、20、25、30、40または50個のm/zピークを含んでいてもよい。
【0022】
ファジィ理論原理等の人工知能手法を用いた解析は、以下のうち少なくとも2つまたは3つ、或いは4つ全てを表す入力変数を用いて行うことができる:
(a)m/z候補ピークと、少なくとも1つの他のm/z候補セット中で最も近い末端のm/zピークとの差に対応するアミノ酸数(GAPとも呼ばれる)。
(b)m/z候補ピークの強度(INTENSITYとも呼ばれる)。
(c)m/z候補ピークによって表される質量(LOW_VALUE_CRITERIONとも呼ばれる)。
(d)m/z候補ピークを含む任意のm/z候補ピークに対応する推定アミノ酸配列のうち最長のもののアミノ酸数(MASS_SERIESとも呼ばれる)。
【0023】
(d)のMASS_SERIESについてさらに説明すると、全てのm/z候補ピークがP−系列(m/z候補ピークセット)に含まれる場合、系列中のアミノ酸数は変数として定義される。m/z候補ピークがいくつかのP−系列に含まれる場合、これらの系列のうち最長のもののアミノ酸数を採用する。
例えば、下記の場合において
[… ma, … mi, ‥‥] (1) 5アミノ酸
[… ma , mi, ‥‥] (2) 4アミノ酸
[… ma , … mi, ‥‥, mj, …] (3) 9アミノ酸
【0024】
maは候補質量ピークであり、3つの異なる系列(1)、(2)および(3)に含まれる。9をこの候補のアミノ酸数として採用し(長さが最大であるため)、サンプルポリペプチドに対して記述された正しいアミノ酸に対する百分率に変換される。記述されたアミノ酸配列の長さが14アミノ酸である場合、この候補に対する値は9/14=0.64である。記述された長さは、プリカーサーイオン質量を元に、標準的な全アミノ酸の質量の平均値を用いて計算してもよい。長さの決定に、許容値(例えば、2〜4)を用いてもよい。
【0025】
m/z候補ピークセットの決定の場合と同様に、サンプルポリペプチドの長さの決定に用いられるアミノ酸質量のセットは標準的なアミノ酸の質量のみから成り立っていてもよい。或いは、サンプルポリペプチドがある特定のアミノ酸を含んでいないことが分かっている場合には、該アミノ酸の質量を除外することができる。同様に、化学的に修飾された、および/または翻訳後に修飾されたアミノ酸を用いることもできる。天然に存在するものおよび合成されたもののいずれであってもよいその他のアミノ酸の質量を用いることもでき、それらには、変性されたアミノ酸および通常存在しない、2−アミノアジピン酸、2−アミノ酪酸、イソデスモシン、6−n−メチルリジンおよびノルバリン等のアミノ酸を含んでいてもよい。その他については、WIPO規準23の表4等に記載されている。同様に、同位元素でラベルされたアミノ酸も許容される。このように、このアミノ酸質質量を用いて、サンプルポリペプチドに対して評価された(記述された)長さを決定するための記述を形成することができる。
【0026】
本発明では、その推論過程が、ファジィ化、推論、合成、および脱ファジィ化を有するファジィエキスパートシステムを使用することができる。したがって、ファジィ理論原理を使用した解析は、以下の工程を含む:
【0027】
(i)少なくとも1つのメンバーシップ関数の前記入力変数をファジィ化する工程、
(ii)それぞれのルールに対するそれぞれのファジィ部分集合を定義するために、ルールベースに含まれる複数のルールであって、それぞれのルールは少なくとも1つの出力変数を有するルールの推論を行う工程、
(iii)前記少なくとも1つの出力変数のそれぞれに対する単一の出力部分集合を含むファジィ出力集合を定義するために、前記推論を行う工程(ii)の前記ファジィ部分集合を合成する工程、および(iv)前記ファジィ出力集合を脱ファジィ化してクリスプ数を得る工程。
【0028】
ファジィ化
入力変数について定義されたメンバーシップ関数を実際の数値に適用して、それぞれのルールの前提(例えば、GAPがSMALLである、GAPがMEDIUMである、GAPがLARGEである、等)の真正度(degree of truth)を決定するファジィ化工程に、工程(a)の入力変数を使用することができる。
【0029】
もちろん、GAP入力変数に対して、例えば、GAPがSMALLである、GAPがSMALL TO MEDIUMである、GAPがMEDIUMである、GAPがMEDIUM TO LARGEである、GAPがLARGEである、GAPがVERY LARGEである等の他のメンバーシップ関数を定義してもよい。このようにして、GAP入力変数(GAP集合の要素)の、それぞれのファジィ部分集合(SMALL、MEDIUM、LARGE等)に対するメンバーシップ度を決定することができる。
【0030】
GAPは、m/z候補ピークと、少なくとも1つの他のm/z候補ピークセット中で最も近いピークとの差に相当するアミノ酸数であると定義される。
【0031】
したがって、候補ピークが、少なくとも1つの他のm/z候補ピークセットの高い側の末端に位置するピークよりも高い側にある場合には、その差は、候補ピークと高い側の末端に位置するピークとの差となる。候補ピークが、少なくとも1つの他のm/z候補ピークセットの低い側の末端に位置するピークよりも低い側にある場合には、その差は、候補ピークと系列の低い側の末端に位置するピークとの差となる。
【0032】
例えば、[m1, m2,…… mn] 系列1;
[M1, M2,…… Mn] 系列2において、
GAPは、GAP=M1 B mnと定義することができる。
【0033】
アミノ酸は、57.02 Daの質量を有し、標準的なアミノ酸のうち最も軽いグリシンから、および186.08 Daの質量を有し、標準的なアミノ酸のうち最も重いトリプトファンにわたって質量が変化するので、GAPがSMALLであるとは、1アミノ酸分未満の場合であると考えると、GAPがSMALLであるに対するメンバーシップ関数は、差が57.02 Da以下である場合の1から、差が186.08 Daを上回る場合の0までの数値をとる。
同様に、GAPがMEDIUMであるとは、2アミノ酸分の場合であると考えると、GAPがMEDIUMであるに対するメンバーシップ関数は、差が114.04 Da未満である場合または差が372.16 Daを上回る場合には数値0を与え、その間である場合には0よりも大きな数値を与える。同様に、GAPがLARGEであるとは、4アミノ酸分以上の場合であると考えると、GAPがLARGEであるに対するメンバーシップ関数は、差が228.08 Da以下である場合の0から、差が558.24 Daを上回る場合の1までの数値をとる。
【0034】
特に、ファジィ理論原理を使用した解析では、GAPが大きいことが必要であり、LARGEであるとは、3アミノ酸分以上の場合であると考えられる。MALDI-QITデータを使用する場合、GAPは、m/z候補ピークと、少なくとも1つの他のm/z候補ピークセット中で低い末端に位置するピークとの差に相当するアミノ酸数であると定義される。低質量のm/z候補ピークに有利な他のファジィ化工程およびルールベースについて、以下の具体的な実施形態に記載し、本発明の他の実施形態にも同様に適用する。
【0035】
m/z候補ピークの集合およびメンバーシップ関数の生成は、質量差が比較されるアミノ酸の質量に影響を受けうる。例えば、アミノ酸の質量のセットは、標準的なアミノ酸の質量のみから成り立っていてもよい。或いは、サンプルポリペプチドがある特定のアミノ酸を含んでいないことが分かっている場合には、該アミノ酸の質量を除外することができる。同様に、化学的に修飾された、および/または翻訳後に修飾されたアミノ酸を用いることもできる。天然に存在するものおよび合成されたもののいずれであってもよいその他のアミノ酸の質量を用いることもでき、それらには、変性されたアミノ酸および通常存在しない、2−アミノアジピン酸、2−アミノ酪酸、イソデスモシン、6−n−メチルリジンおよびノルバリン等のアミノ酸を含んでいてもよい。その他については、WIPO規準23の表4等に記載されている。同様に、同位元素でラベルされたアミノ酸も許容される。
【0036】
したがって、例えば、GAPメンバーシップ関数に、サンプルポリペプチド中のあるアミノ酸が同位体標識されているという知見に基づいて変更を加えてもよく、これによってGAP値のファジィ化の精度を確保することができる。
【0037】
使用することができるメンバーシップ関数は、例えば、Z型、Π型、またはS型等の任意の適当なメンバーシップ関数であってよい。標準的なメンバーシップ関数の例は、例えば、コンスタンティン・フォン・アルトロック(Constantin von Altrock)著、「Fuzzy Logic and NeuroFuzzy Application in Business and Finance」、Prentice Hall PTR、(米国ニュージャージー)、1997年、p.327-328に詳述されている。
【0038】
入力変数について定義されたメンバーシップ関数を実際の数値に適用して、それぞれのルールの前提(例えば、INTENSITYがLOWである、INTENSITYがMEDIUMである、INTENSITYがLARGEである、等)の真正度を決定するファジィ化工程に、工程(b)の入力変数を使用することができる。
【0039】
最も豊富なピーク(質量スペクトル中で最も強度の大きなピーク)は、事実上、INTENSITY集合のHIGH
INTENSITYファジィ部分集合であると考えられ、その数値を100.0とすることができる。その後、入力変数を与えるために、より小さなm/zピークに対する数値を、最も豊富なピークに対する相対値として計算することができる。次いで、入力変数について定義されたメンバーシップ関数を実際の数値に適用して、それぞれのルールの前提(例えば、INTENSITYがLOWである、INTENSITYがMEDIUMである、INTENSITYがLARGEである、等)の真正度を決定することができる。
【0040】
例えば、強度が10以下である場合、INTENSITYがLOWであるに対するメンバーシップ関数は数値1を与えてもよい。強度が20以上である場合、INTENSITYがLOWであるに対するメンバーシップ関数は数値0を与えてもよい。INTENSITYがMEDIUMであるに対するメンバーシップ関数は、強度が18以下である場合または55を上回る場合に数値0を与え、その間の場合に0を上回る場合に0を上回る数値を与えてもよい。強度が18を上回り32以下である範囲内にある場合、数値は直線的に増大し、MEDIUMは、強度が32を上回り55以下である範囲内にある場合、数値1を保つ。INTENSITYがHIGHであるに対するメンバーシップ関数は、強度が50以下である場合には数値0を与え、強度の増加と共に直線的に増大し、強度が56以上である場合には数値1を与える。
【0041】
特に、強度が高いピークは、特に関心の対象となり、m/z候補ピークセットの内部に位置する場合であっても、末端に位置するものよりも、さらにフラグメンテーションを行うための有力な候補となりうる。これは、強度の高いピークが良質のフラグメンテーションを与えるためであり、それによって、例えば、特にイオントラップスペクトルにおいてさらに低質量側のイオンの決定を行うことが可能になる。このような、さらにフラグメンテーションした系列を、親/前イオン系列と結びつけることにより、サンプルポリペプチドの完全な配列を導き出すことが容易になる。したがって、INTENSITYの数値に適当な重み付けを行ってもよい。
【0042】
入力変数について定義されたメンバーシップ関数を実際の数値に適用して、それぞれのルールの前提(例えば、LOW_VALUE_CRITERIONがLOWである、LOW_VALUE_CRITERIONがHIGHである、等)の真正度を決定するファジィ化工程に、工程(c)の入力変数を使用することができる。入力変数は、m/z候補ピークの数値である。例えば、LOW_VALUE_CRITERIONがLOWであるに対するメンバーシップ関数は、m/z値が450以下である場合、数値1を与え、m/z値が525を上回るである場合、数値0を与えてもよい。LOW_VALUE_CRITERIONがHIGHであるに対するメンバーシップ関数は、m/z値が475未満である場合、数値0を与え、m/z値が550以上である場合、数値1を与えてもよい。
【0043】
具体的には、m/z候補ピークセットの末端または内部に位置する低質量の数値については、さらにフラグメンテーションを行う意味は殆どない。しかし、LOW_VALUE_CRITERION変数を用いて記述された推論によって、プリカーサーイオンとして使用する価値のあるピークが除外されないように注意を払う必要がある。
【0044】
入力変数について定義されたメンバーシップ関数を実際の数値に適用して、それぞれのルールの前提(例えば、MASS_SERIESがLOWである、MASS_SERIESがMEDIUMである、MASS_SERIESがHIGHである、等)の真正度を決定するファジィ化工程に、工程(d)の入力変数を使用することができる。入力変数は、m/z候補ピークを含む任意のm/z候補ピークセットに対応する任意の推定アミノ酸配列のうち最長のもののアミノ酸数の予測されたペプチドサンプルの長さに対する比である。例えば、MASS_SERIESがLOWであるに対するメンバーシップ関数は、0.2以下である場合、数値1を与え、0.35を上回るである場合、数値0を与えてもよい。MASS_SERIESがMEDIUMであるに対するメンバーシップ関数は、0.3以下または0.75を上回る場合、数値0を与え、その間である場合、0よりも大きな数値を与えてもよい。MASS_SERIESがHIGHであるに対するメンバーシップ関数は、0.6以下である場合、数値0を与え、0.8を上回るである場合、数値1を与えてもよい。
【0045】
上述のGAP、INTENSITY、LOW_VALUE_CRITERION、およびMASS_SERIES集合に対するメンバーシップ関数は、例示のためだけに示したものであり、集合に他の或いは追加の部分集合を定義してもよく、メンバーシップ関数を変更してもよい。
【0046】
それぞれの前提(INTENSITYがHIGHである等)の真正度が計算されると、これをファジィエキスパートシステムのルールベース(「知識ベース」とも呼ばれる)として使用することができる。
【0047】
推論
ファジィ化工程が完了すると、それぞれのルールの前提の真正度を計算し、それぞれのルールの結論部に適用して、ルールの有効性を求め(、言語的出力を得)るために推論工程が適用される。出力(ルールが有効である割合)は、プリカーサーイオンとしてさらに選択するためのルールによるm/zピークの評価を表す変数POSSIBLE_SELECTIONであってよい。変数POSSIBLE_SELECTIONの言語的出力は、例えば、POSSIBLE_SELECTIONはLOWである、POSSIBLE_SELECTIONはMEDIUMである、およびPOSSIBLE_SELECTIONはHIGHである等のさらなる一連のメンバーシップ関数によって決定してもよい。
【0048】
1つの実施例において、GAP入力変数は、SMALL、MEDIUMおよびLARGEのファジィ部分集合を有し、INTENSITY入力変数は、SMALL、MEDIUMおよびLARGEのファジィ部分集合を有し、LOW_VALUE_CRITERION入力変数は、LOWおよびHIGHのファジィ部分集合を有し、MASS_SERIES入力変数は、LOW、MEDIUMおよびHIGHのファジィ部分集合を有する。これは、入力変数のファジィ部分集合について合計54通りの可能な組み合わせをもたらし、それぞれを解くと、LOW、MEDUIUMおよびHIGHの値を有するPOSSIBLE_SELECTION変数のファジィ部分集合が得られる。
【0049】
これらの組み合わせのうち、3つの例を表1(TABLE
1)に示す。例えば、ルール1は、次のような評価を表す。もし、GAPがSMALL、かつINTENSITYがLOW、かつLOW_VALUE_CRITERIONがLOW、かつMASS_SERIESがLOWならば、POSSIBLE_SELECTIONはLOWである。
【0050】
【表1】

【0051】
上述のルールベースの処理においては、MIN-MAX法が通常用いられる。最小演算子は、ブール演算子「AND」の一般化であり、最大演算子は、ブール演算子「OR」の一般化である。入力変数に対して通常のMIN-MAX/MAX-PRODUCT法を使用すると、ルールの個々の重要性は0または1でしか表されず、数値が、個々の変数項に関連するより大きな不確実性を伴う場合には、システムによって誤った選択がなされる場合がある。この問題を解決する別の方法は、個々のルールに、ルールの個別の重要性を表す支持度(DoS)を割り当てることである。ルール自体は、0から1の有効性を有する「ファジィ」なものであってもよい。54の全ファジィルールは、テストデータを用いて調査および試験してもよく、それによって、それぞれのルールに割り当てられたDoSの値および出力の項目(POSSIBLE_SELECTIONがLOW、MEDIUM、およびHIGHである)を修正してもよい。例えば、ルール24および25(下記)が、出力変数としてMEDIUMを推論する。高い正の相関を有する相対変数より、「INTENSITY」は選択において最も重要な影響を与えるが、ルール24においてはLOWであると定義され、一方ルール25ではMEDIUMであると定義されている。ルール24に対しては、DoSの値として0.3を割り当てているが、ルール25においては、他の高い正の相関を有する変数である「LOW_VALUE_CRITERION」がLOWであると定義されており、DoSの値として0.9が割り当てられている。例えば、条件の有効度がいずれも0.6である場合、合成のための積演算子を用いてこれら2つのルールのマッチングを行うと:
【0052】
ルール24:
もし、「GAP」=MEDIUM、かつ「INTENSITY」=LOW、かつ「LOW_VALUE_CRITERION」=HIGH、かつ「MASS_SERIES」=HIGHならば、「POSSIBLE_SELECTION」=MEDIUM;
【0053】
ルール25:
もし、「GAP」=MEDIUM、かつ「INTENSITY」=MEDIUM、かつ「LOW_VALUE_CRITERION」=LOW、かつ「MASS_SERIES」=LOWならば、「POSSIBLE_SELECTION」=MEDIUM;
【0054】
これらのルールについて得られる結果は、以下のようになる:
【0055】
Θ{IFパートの有効度,支持度}:=ルールの結果(THENパートの結果)
すなわち、
ルール24については、Θ{0.6,0.3}=0.18
ルール25については、Θ{0.6,0.9}=0.54
【0056】
このことは、「POSSIBLE_SELECTION」がMEDIUMであるという結果に対する有効度が、ルール24については0.24で、ルール25については0.54であることを意味する。このように、ルール24に対する重要性が減少する。
【0057】
上述のように、TABLE 1(表1)中の個々の組み合わせは、出力変数における3つの可能性のうちの1つをもたらす。4つの入力変数は全て、出力変数に対し正の相関を有する。入力変数LOW_VALUE_CRITERIONおよびINTENSITYには、他の入力変数よりも大きな重み付けがなされる。同一の項目に対して同時に呼び出された2つ以上のファジィルールより得られた結果を集積するために、ファジィMAX-MIN理論を用いてもよい。入力変数の定義から予想されるように、m/z候補ピークに対するGAPの数値は、それをプリカーサーイオンとして使用する場合には小さな値であってはならない。しかし、GAPが小さな場合であっても、他の数値(INTENSITY、LOW_VALUE_CRITERION、およびMASS_SERIES)との組み合わせによっては、POSSIBLE_SELECTIONがMEDIUMになる場合もある。種々のルール、および項目の組み合わせの全般的な重要性に対して重み付けを行うために、DoSの数値を修正してもよい。
【0058】
特に、さらにフラグメンテーションを行うために考慮すべき多数のm/z候補ピークを含むm/z候補ピークセットを用いる場合には、推論工程に追加のルールを含めてもよい。例えば、INTENSITY変数に基づくルールは、INTENSITYがHIGHである場合に、m/z候補ピークに割り当てられるPOSSIBLE_SELECTIONの数値に対し、非常に有利に働く。しかし、それを含むm/z候補ピークセット中でのm/z候補ピークの位置(例えば、m/z候補ピークセット中で最長のピークであるのか、或いは下端値を有するものであるのか)も重要であり、ルールベースにおいて考慮することができる。したがって、例えば、下記のような追加ルールを導入してもよい:
【0059】
もし、(Pm-Pn)がアミノ酸の質量であり、かつPmの強度>Iiならば、high
possibility
ここで:
Iiはhigh intensityの数値であり、
Pmは高い強度を有し選択される可能性のあるイオンの質量であると定義され、
Pnは、ある系列中での隣接する質量であると定義される。
【0060】
ルールベースからの出力は言語的出力である必要はなく、代わりに、ルールの有効度をより正確に表すことができる数値的出力を返してもよい。個々のルールに対する出力値は、例えば、ファジィMAX-MIN法またはMAX-PRODUCT法を用いて計算することができ、個々のルールの前提に対する真正度の関数として数値を算出してもよい。
【0061】
例えば、3つの変数(V1、V2、およびV3)を有し、V1、V2、およびV3はそれぞれ3つの項目(high(h)、medium(m)およびlow(l))を有するよう定義された入力変数より得られる出力変数は、4つの項目(low、medium-low、medium-high、およびhigh)を含むものとする。3つの言語的項目が同じ場合(例えば、V1=medium、V2=low、V3=low)であっても、DoSの違いによって異なる出力部(THEN)を導くことができるようにファジィルールを設定する。詳細は、Table 1A(表2)に示す(下記参照)。入力部と同じ項目を含む4つの変数であるため、それらは、very-low(v-l)、low(l)、high(h)、およびvery-high(v-h)として有効度の数値を伴う出力を与える。この一連のルールにMIN演算子を適用すると:
【0062】
MIN{有効度(V1=medium),有効度(V2=low),有効度(V3=low)}:=条件の有効度、
すなわち、MIN{0.33,1.00,0.67}=0.33
【0063】
【表2】

【0064】
上式は、この前提部の有効度の集積結果が0.33となることを意味する。
【0065】
所望に応じて、出力値にも重み付けをしてもよく、例えば、支持度(DoS)を個々のルールに割り当て、それによって重要度に応じた重み付けをしてもよい。
【0066】
支持度を用いることにより、ルールベースに改変を加えることなく本発明の方法を最適化することが可能になる。そのため、例えば、ニューラルネットワークシステム等の機械学習システムに教示を行い、さらにフラグメント化するためのm/zピークの選択を最適化することができる。例えば、熟練したオペレーターに質量スペクトルを与え、さらにフラグメント化するための少なくとも1つのm/zピークを選択させてもよい。次に、機械学習システムに同一の入力データを与え、さらにフラグメント化するための少なくとも1つのm/zピークの選択結果として出力を導き、この出力を熟練者による選択結果(望ましい結果)と比較して、機械学習システムによる学習を行わせるのに、この望ましい結果を用いる。システムを最適化するために複数回の学習を行ってもよく、学習は、ルールの支持度を操作することにより行われてもよい。
【0067】
上で詳述したような支持度の修正によるシステムの最適化のために、このような仮想的なテスト用データを用いてもよい。それに代わり、或いはそれに加えて、仮想的なテスト用データに基づいてメンバーシップ関数を修正してもよい。それに代わり、或いはそれに加えて、仮想的なテスト用データに基づいてルールベースのルールを修正してもよい。
【0068】
合成
ルールベースのルールから算出され(適当に重み付けがなされ)た出力値について、ルールベースから得られた結果(ファジィ部分集合)を結合するために合成工程が適用される。
【0069】
合成は、合成演算子を用いて実行され、ルールベースに含まれるルールの結論の有効性が検定される。演算子は、この有効性および支持度を用いて計算され、全条件の有効性を表す。通常用いられる合成演算子は積算演算子であり、有効性の積である。上述した例に対し、IF部分に対するルールベースからのルールが、V1=LOW、V2=LOW、V3=MEDIUMである。この条件の有効性として、MIN演算子より0.33が誘導される。medium-highであるTHEN部分に対して、支持度として0.16が与えられ、積算演算子を用いた合成により、下記の結果が得られる。
【0070】
Θ{0.33,0.16}=0.05
【0071】
これにより、ルールの結論の有効性が得られ、出力medium-highは、有効性0.05を有する。
【0072】
脱ファジィ化
最後に、脱ファジィ工程を適用して、合成工程より得られたファジィ出力集合を、この場合にはさらにフラグメント化するためのm/z候補ピーク(さらにフラグメント化するためのプリカーサーイオンとしての使用)としての評価点を表すクリスプ数に変換する。重心法、最大値法等の広範な脱ファジィ化法が知られている。
【0073】
例えば、最大中心(CoM)法を使用することができる。2つ以上の出力項目を有効であると評価できるため、脱ファジィ化法は異なる結果を折衷しなければならない。CoMでは、推論の結果により重み付けされた各項目に対するメンバーシップの最大値の重み付き平均としてクリスプ出力が計算される。計算式を下記の式1に示す。
【0074】
【数1】

【0075】
式中、Yiはlow、medium、およびhighに対する3つのメンバーシップ値の重心である。本システムについて、Ylow=0.175、Ymedium=0.500、Yhigh=0.850と定義することができる。Piは、推論結果より得られる重みである。本方法が適用される特殊な場合は、ただ1つの出力項目が評価され、同様に、条件の有効性もただ1つの項より推論される場合である。特に、この項目の有効度(Pi)が非常に低い(例えば、0.28未満)場合、結果は実際の場合にはあまり適当でないかもしれない。この有効性の数値は、式中で互いに相殺されるため、この場合において完全に無視される。そのため、出力においていかなる項目が推論されるにせよ、出力は項目の最大値として与えられる。あらゆるDoSの数値の重要性は、このようにして消去される。
【0076】
DoS値により特定される影響を含めるためには、式1を変形して式2とする。
【0077】
【数2】

【0078】
この場合には、有効性値Piが考慮され、Piの数値にしたがって最終出力値を調整するために重み付け因子が加わる。変形式を用いることで、選択においていくつかの質量値について訂正がなされる。例えば、数値は、0.0、0.04、0.0で表される3つの項で有効性が推定される。例えば、項目mediumのみが、0.04と小さな有効性を有する。式1を使用すると、この数値より、mediumに対して最大値0.5が得られ、このことは、mediumの項目が100%の確率で得られることを示している。しかし、これはノイズに相当するピークである可能性がある。計算結果は下記の通りである。
【0079】
【数3】

【0080】
式2もPiの数値に依存しているが、結果に対するこの項目の重要性は減少している。この値は、最終的に出力変数メンバーシップ関数で決定される。Pi値が小さい場合には、結果として小さな最終出力値が得られる。
【0081】
上述のメンバーシップ関数を用いると、入力変数の定義を行うことができ、ファジィエキスパートシステムを定義するために、少なくとも1つのルールをメンバーシップ関数の出力に適用することができる。
【0082】
言語的ルールを使用するシステムの例としては、例えば、ヴィラント−クルン(Vilant-Klun)Iらの文献(Comput
BiomedRes. 1999年8月;32(4):305-21;PMID:10469527)が挙げられ、言語的規則に直接基づいた制御システムが開示されている。
【0083】
本発明に従えば、部分的に分解されたサンプルポリペプチドに対する少なくとも1つの推定アミノ酸配列を決定する方法が提供され、該方法は以下の工程を含む:
(i)前記部分的に分解されたサンプルポリペプチドから、1組のイオン種のm/zピークを与える、前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルを得る工程;
(ii)前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、それぞれのピーク候補セット中の各ピークが少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっている少なくとも2組のm/zピーク候補セットを決定し、それぞれのm/zピーク候補セットから、それぞれのアミノ酸配列が、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である推定アミノ酸配列を決定する工程;
(iii)ファジィ理論原理等の人工知能手法を用いて前記少なくとも2組のm/zピーク候補セットの中の前記m/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択する工程;
(iv)1組のイオン種のm/zピークを与える、前記選択された少なくとも1つのm/zピークのソフトイオン化質量スペクトルをさらに得る工程;
(v)場合によっては、少なくとも2つの上述のようにして得られた前記ソフトイオン化質量スペクトルを、前記ソフトイオン化質量スペクトルとして使用して工程(ii)〜(iv)を繰り返す工程;および
(vi)前記部分的に分解されたサンプルポリペプチドから得られる1組のイオン種のm/zピークを含む前記ソフトイオン化質量スペクトルから、それぞれのピーク候補セット中の各ピークが少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっている少なくとも1組のm/zピーク候補セットを決定し、それぞれのm/zピーク候補セットから、それぞれのアミノ酸配列が、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である推定アミノ酸配列を決定する工程。
【0084】
また、本発明に従えば、部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、フラグメント化のためのプリカーサーイオンを選択する装置であって、
(i)データ入力手段と、
(ii)ファジィ理論ルールベースを格納したデータ保存手段と、
(iii)本発明の方法を実行するためのプログラムコードを含むデータ処理手段と、
(iv)前記データ処理手段の出力を出力するデータ処理手段とを有する装置も提供される。
【0085】
装置は、質量分析計を含んでいてもよい。
【0086】
また、本発明に従えば、部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、フラグメント化のために少なくとも1つのm/zピークを選択するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、人工知能手法を使用して少なくとも2組のm/zピーク候補セットの中のm/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択するためのプログラムコードを含んでおり、
前記少なくとも2組のm/zピーク候補セットは、前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから決定され、
前記ソフトイオン化質量スペクトルは、前記部分的に分解されたサンプルポリペプチドより得られる1組のm/zピークを含み、
それぞれのm/zピーク候補セット中の各m/zピークは、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっており、
推定アミノ酸配列は、それぞれのm/z候補ピークセットより決定され、それぞれの推定アミノ酸配列は、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である。
この場合も、前記人工知能手法がファジィ理論原理を含んでいてもよい。
【0087】
本発明は、添付の図面を参照し、以下の詳細な記述によってさらに明らかになるが、これらは、m/zピークセットから、さらにフラグメント化するための少なくとも1つのm/zピークを選択するひとつの様式の例としてのみ挙げたものである。
【0088】
図1は、タンデム質量分析におけるプリカーサーイオンの選択方法を示すフローチャートである。
【0089】
図2は、スペクトルおよびファジィ理論原理より誘導されたm/z候補ピークセットに基づく、タンデム質量分析におけるプリカーサーイオンの選択方法を示すフローチャートである。
【0090】
図3は、GAPがSMALLである、GAPがMEDIUMである、およびGAPがLARGEであるに対するメンバーシップ関数のプロットである。
【0091】
図4は、INTENSITYがLOWである、INTENSITYがMEDIUMである、およびINTENSITYがHIGHであるに対するメンバーシップ関数のプロットである。
【0092】
図5は、LOW_VALUE_CRITERIONがLOWである、およびLOW_VALUE_CRITERIONがHIGHであるに対するメンバーシップ関数のプロットである。
【0093】
図6は、MASS_SERIESがLOWである、MASS_SERIESがMEDIUMである、およびMASS_SERIESがHIGHであるに対するメンバーシップ関数のプロットである。
【0094】
図7は、POSSIBLE_SELECTIONがLOWである、POSSIBLE_SELECTIONがMEDIUMである、およびPOSSIBLE_SELECTIONがHIGHであるに対するメンバーシップ関数のプロットである。
【0095】
図8は、系列の末端値または系列中の強いピークからのイオンピークの選択の一例を示す図である。
【0096】
図9は、(前側)質量1615 DaのテストペプチドのMS2スペクトル、および(後側)MS2スペクトルからの1074 Daのフラグメントに対するMS3スペクトルである。矢印は、MS3スペクトルでは観測されたが、MS2スペクトルでは観測されなかったピークを示す。
【0097】
本発明のシステムの一例においては、MALDI-TOF質量分析計(図示しない)が、トリプシンで分解したサンプルポリペプチドのMSスペクトル110を生成する。m/zおよび強度の数値を含む質量リストが、ステップ201においてスペクトル110から抽出され、プリカーサーイオンが、ステップ202においてペプチドイオンの質量から選択され、MS2スペクトル102を生成する。m/zおよび強度の数値を含む質量リストが、MSスペクトル102から抽出され、その後、質量リスト301は、国際公開第03/102572号パンフレットに記載のシークエンスジェネレーター302に入力され、サンプルポリペプチドに対する少なくとも2つの候補アミノ酸配列が決定される。決定ステップ203は、少なくとも2つの候補アミノ酸配列を解析し、よい結果(よい候補アミノ酸配列)が得られたか否かを決定し、そうでない場合には、以前に決定されたMSスペクトルをステップ202に送り、他のペプチドの質量を、他のMS2スペクトルを生成するためのプリカーサーイオンとして選択するために、ファジィ理論原理を使用している。この決定ステップより、イオン化してMS3スペクトル(103)を生成するために、さらにプリカーサーイオンを選択してもよい。
【0098】
プリカーサーイオンの選択に使用されるファジィ理論原理は、下記の工程を含む:
(i)入力変数を少なくとも1つのメンバーシップ関数上でファジィ化して、言語的変数を得る工程。通常、3〜7の項目(例えば、「very low」、「low」、「low-medium」、「medium」、「medium-high」、「high」、および「very high」)が、言語的変数として使用される。
(ii)それぞれのルールに対するそれぞれのファジィ部分集合を定義するために、ルールベースに含まれる複数のルールであって、それぞれのルールは少なくとも1つの出力変数を有するルールの推論を行う工程;および
(iii)前記少なくとも1つの出力変数のそれぞれに対する単一の出力部分集合を含むファジィ出力集合を定義するために、前記推論を行う工程(ii)の前記ファジィ部分集合を合成する工程
【0099】
ファジィ理論プロセスは、実施形態によっては工程(iii)で終えてもよいが、本実施形態では、追加の工程を適用して、「ファジィな」出力を判断および決定を下す上で都合のよい、有限/離散的かつ包括的な数値に変換する。このように、ファジィ理論原理は、工程(iv)ファジィ出力集合をクリスプ数に脱ファジィ化する工程も有する。
【0100】
図2に示すように、上述の方法の各ステップを実行するためのプログラムコードは、PC上のDCOM(分散型コンポーネントオブジェクトモデル)コンポーネント2122中に組み込まれている。このCOMコンポーネント2122は、プリカーサーイオンの選択に必要な関数を提供する。全ての関数はコンポーネント2122に包含されており、そのため、クライアントプログラム2031には、どのようにファジィ理論アルゴリズムが機能するかについての詳細はもたらされないが、その代わりに、定義されたインターフェイス2034を介してCOMコンポーネント2122により提供される関数にアクセスする。
【0101】
注目すべきことに、常に同一のプロセス空間中で動作するC++オブジェクトと異なり、COMオブジェクトは、異なるプロセス間、異なるコンピュータ間でも動作し、ネットワーク経由でCOMメソッドを呼び出すこともできる。このため、所望により、異なるシステム間の接続を容易に行うことができる。同様に、シーケンサー(国際公開第03/102572号パンフレット)をCOMコンポーネント2122に組み込むことができる。クライアント2031は、用意されたインターフェイス2033、2034を介して、これらのコンポーネント2121、2122を呼び出す。クライアントプログラム2031は、MS2スペクトル2101より得られる質量リストを初めとする全てを制御する。
【0102】
COMサーバーは、クライアント2031から提供されたパラメータのみを受信し、クライアントプログラム2031からの要求に対し応答する。クライアント側のCOMサーバー2121、2122との相互作用の一般的なステップは、クライアント2031の関数2102(インターフェイスIDenoSeqを介してシーケンサーコンポーネントを呼び出す)および関数2104(インターフェイスIFzLogicを介してFzLogicコンポーネントを呼び出す)を含み、(a)サーバーの起動、(b)COMオブジェクト2121、2122およびインターフェイス2033、2034の要求、(c)サーバーへの全てのメソッド呼び出しの発生、(d)サーバーをシャットダウンするためのサーバーインターフェイスの解放が挙げられる。
【0103】
COMコンポーネントの呼び出しが行われ、ファジィ理論法が開始される前に、プログラムコードによりm/z候補ピークの予備選択が行われる。具体的には、インターフェイス2034を介してCOMコンポーネント2122に入力される候補イオンの数値2103の数を減少させるために、シーケンサーのCOMコンポーネント2121を使用した予備選択の手順が適用される。特に、m/z候補ピークセットの低質量側末端のm/z候補ピークがされるが、実際にはそのピークが2以上のm/z候補ピークセットに属している場合、シーケンサーが返してきたそれらのm/z候補ピークセットからこの数値を含む最長のm/z候補ピークセットが見つけ出され、その性質が、ファジィ理論を使用する工程において使用される。具体的には、あるm/z候補ピークに対するm/z候補ピークセットの解析は、互いに独立なm/z候補ピークセット(あるm/z候補ピークセットが他の全てのm/z候補ピークセットのサブセットでないこと)を用いて行われる。
【0104】
m/z候補ピークが属する最長のm/z候補ピークセットが決定されると、m/z候補ピークセット中のアミノ酸の数は、MASS_SERIES変数の計算に使用される。
【0105】
さらに、予備選択工程の一部として、ファジィ理論COMコンポーネント2122に移すために選択されたm/zピークは記録され、同一のm/z候補ピークが再度考慮されないようにし、リソースの浪費を防止している。
【0106】
使用されるファジィ理論工程は、下記に示すとおりである。
(i) m/z候補ピークセット中の個々のm/z候補ピークについて、下記の4つの入力変数を使用してファジィ化を行う工程:
(a)m/z候補ピークと、少なくとも1つの他のm/z候補セット中で最も近い末端のm/zピークとの差に対応するアミノ酸数(GAP)、
(b)m/z候補ピークの強度(INTENSITYとも呼ばれる)、
(c)m/z候補ピークによって表される質量(LOW_VALUE_CRITERION)、
(d)m/z候補ピークを含む任意のm/z候補ピークに対応する推定アミノ酸配列のうち最長のもののアミノ酸数(MASS_SERIES)。
【0107】
入力変数のファジィ化は、図3〜6に示したメンバーシップ関数に基づいて行われる。
【0108】
推論工程(ii)は、Table 1A(表2)(上記参照)で定義されたルールベースに基づいて行われる。
【0109】
MALDI-QITスペクトルを用いる場合、プリカーサーイオンの1/3未満のピークのいかなるピークについてもその検出が困難であるため、さらにフラグメント化するためのプリカーサーイオンとして低質量のイオンが重要である。したがって、高質量のプリカーサーイオンを選択すると、b/y系列からより完璧なm/z候補ピークセットを得るために必要であることが多いにもかかわらず、低質量の質量m/zピークを得ることができない。
【0110】
したがって、MALDI-QITスペクトルを使用する場合、誘導された系列の低質量末端側からの選択に優先順位を付与してもよい。他の実施形態では、ファジィ化工程に、m/z候補ピークの質量とサンプルポリペプチドの質量との差を表す他の変数を導入することにより、同一の因子を考慮する。この場合、比較的低質量のm/z候補ピークであることを示し、そのフラグメント化により低質量のイオンに関する情報がさらに得られるので、差が大きいことが望ましい。対照的に、サンプルポリペプチドと比較して差が小さいm/z候補ピークを選択すると、プリカーサーイオンの1/3未満のイオンが切り捨てられるために、低質量のイオンに関する追加のデータが殆ど得られない場合がある。
【0111】
合成工程(iii)は、上述した積算演算子を用いて実行される。
【0112】
最後に、脱ファジィ化工程(iv)を実行し、さらにフラグメント化を行うためのプリカーサーイオンとしてのm/z候補ピークの品質または価値を表すクリスプ数を得る。具体的には、最大中心(CoM)法が用いられる。この方法において式2(上述)を用い、Ylow=0.175、Ymedium=0.500、Yhigh=0.850を用いる。Piは、推論結果に対する重みである。
【0113】
この段階では、m/z候補ピークには、0.5を上回る重みと共に(重みの数値は、脱ファジィ化後のメンバーシップ関数に由来する)、「high」または「medium」の値が割り当てられる。さらにフラグメント化を行うためのm/z候補ピークの最終選択が行われ、この情報2105が質量分析装置2035に送られ、ステップ103において、選択されたプリカーサーイオンのさらなるフラグメント化が行われ、MS3スペクトルが得られる。
【0114】
スペクトルデータによるテスト
上述のシステムのテストは、以下に詳述するスペクトルデータを用いて行われる。
【0115】
第1のテストは、ペプチドイオンの理論データを用いて実行される。サンプルデータは、あるペプチドに対する全てのb-、y-、およびa-イオン系列を含んでいる。ペプチドに対する全てのb-およびy-系列を含むデータの一例は、下記のとおりである。
【0116】
b-系列 ([203.09, 260.11, 423.17, 579.27, 678.34, 791.42, 848.45, 961.53, 1076.56.
1133.58. 1190.6, 1319.64, 1376.66, 1504.76])
y-系列 ([147.11, 204.13, 333.18, 390.2, 447.22, 562.25, 675.33, 732.35.
845.44. 944.51. 1100.61, 1263.67, 1320.69, 1451.73, 1522.77])
【0117】
ペプチドの配列は、AMGYRVLGID
GGEGK (配列番号1)である。[ペプチド質量 (Mr+H)+:1522.77 Da]。
【0118】
両系列中、下線を付したイオンの数値はテストファイルから除外した。プログラムは、b-系列からは1319.64のイオンを、y-系列からは1100.61のイオンを選択することが予想される。プログラムからは、予想通りの結果が得られた。両イオンとも、100%の高い選択可能性が設定された。データは全て理論値であるため、MS/MS(0.02)およびペプチド(0.01)に対して、小さな許容誤差を用いたが、ここで用いた許容誤差の値は、系列の誘導の際に許容されるアミノ酸の質量およびプリカーサーの質量値に対する絶対誤差の予測値である。
【0119】
【表3】

【0120】
サンプルデータのテスト結果をTable 2(表3)に示す。これらの理論的系列に対するもので、系列中に含まれるより分子量の大きないくつかのイオンを含むそれらのテスト用ファイルから予測される全てのイオンの値が得られる。
【0121】
MALDI-QITデータセットを用いて、さらにテストを行った。上に詳述したように、さらにフラグメント化を行うためのプリカーサーイオンの選択は、この種の装置ではより重要である。プリカーサーイオンを正しく選択することにより、より多くのイオン質量値が得られ、より完全なイオン系列のリストが得られ、系列のMS2スペクトルにおいて、低分子側のカットオフを加えることができる。
【0122】
27種類のトリプシン分解ペプチドのMALDI-QITスペクトルをテストに用いることができる。そのうちいくつかにはMS3スペクトルもあるため、ファジィ理論選択プログラムより得られた結果の評価に有用である。
【0123】
このデータのための質量リストは、MALDI-QIT
MS2スペクトルより抽出され、m/z値および強度を含んでいる。まず、このデータをMASCOTサーチ(マトリックス・サイエンス(Matrix Science)社、英国)に入力し、リスト中に何本のイオンピークが存在するのかを確認した。Table 3(表4)は、このデータセットのMATRIXサーチの一例[ペプチド質量(Mr+H):1615.87ダルトン(Da)]を示す。スペクトルのイオンピーク(MS2)と、ペプチドAITIFQERDP
ANI K(配列番号2)のイオンの理論値[a、b、y、b-17(b*)、b-18(b0)、y-17(y*)、およびy-18(y0)]とのマッチングを行った。マッチした値を太字で示す。サーチにおいて用いた許容誤差は、0.6以下のより大きな値を用い、多くの値をカバーした。ファジィ理論プログラムによる選択では、これらの値の範囲内になると予想される。
【0124】
この例において、プログラムは、MS/MSに対して0.13、ペプチドに対して0.1という許容誤差で、22本の候補質量値を発見したが、唯一、質量1074.63 Daのみが、高い選択可能性(重みの値が1.0)となった。Table 3(表4)より、これはb9イオンの値(1074.56+0.07)であることがわかる。このサンプルにおいて、最低のイオン値はb-系列中の803.45(b7,-0.02)であった。1074.63のピークをさらにフラグメント化することにより、低質量領域でさらにイオンピークが得られると期待される。MS3スペクトルが得られ、図9の後側に示すとおりである。図中に矢印で示すように、3つの新たなb-系列イオンピーク、b3-285.97(-0.21)、b4-400.94(-0.32)、およびb5-546.03(0.3)がMS3スペクトルにおいて観測された。このことは、ファジィ理論により自動化されたプリカーサーイオンの選択により、MS3スペクトルのために正しい選択がなされていることを示している。27の全サンプルに対して、このプログラムにより少なくとも1つの正しいピークが選択されるが、通常いくつかのイオンを誘導することができる。
【0125】
LC-QITデータについては、多価イオンについて選択を行うことができる。例えば、サンプルは、3価ペプチドイオン(YLEFI SDAI I HVLHSK-配列番号No.3、Mr:1884.01ダルトン(Da))に由来するMS2スペクトルを629.00に有していた。さらにMS3スペクトルのためのプリカーサーの選択を行い、804.93のピークを得たが、これは2価イオンy14++である。選択を完了するのに要する時間は、0.2秒未満であり、実験より、こうして選択したイオンより感度のよいMS3スペクトルが得られることが示された。
【0126】
サンプルポリペプチドのMS2スペクトルからのプリカーサーイオンの決定
上述の方法を用いて、MSスペクトルからのプリカーサーイオンの選択を行った。Table 4(表5)は、1615.90 DaのプリカーサーイオンのMS2スペクトル(図9に示す)より得られた質量リストである。表は、質量および強度を示す。
【0127】
Table 4(表5)のデータより、国際公開第03/102572号パンフレットのシステムを用いて、アミノ酸系列に対応するde novo推定アミノ酸系列を決定し、その結果をTable 5(表6)に示す。
【0128】
Table 5(表6)の結果を、上に詳述した方法によりフィルタリングして、プリカーサーイオンの選択の対象となるMSnスペクトルのセットを得る。フィルタリングされたデータをTable 6(表7)に示す。列(左から右)は、イオン質量、INTENSITY、GAP、およびMASS_SERIESを表す。
【0129】
フィルタリングされたデータを、上に詳述したファジィ理論システムのファジィ化工程に入力し、さらにフラグメント化するためのプリカーサーイオンとなるイオンを選択し、ファジィ理論により個々のイオンを解析した結果をTable 7に示す。上に詳述したように、システムは、ファジィ化、推論、合成、および脱ファジィ化工程を有する。ファジィ化工程において、GAP、INTENSITY、LOW_VALUE_CRITERION、およびMASS_SERIESの入力変数は、メンバーシップ関数(GAPがSMALLである、等)上でファジィ化される。推論工程では、ルールベース(Table 1)の個々のルールの前提について真理値を計算し、個々のルールの有効度を得る。合成工程では、ルールベースの個々のルールに対する出力を用いて、ファジィ出力集合(最終出力値)を生成する。脱ファジィ化工程では、POSSIBLE_SELECTIONに対するメンバーシップ関数を最終出力値に適用して、候補イオンの全体的な評価を決定する。
【0130】
「Selected_MASS」は、考慮される候補イオンの質量である。「Max DoS」の数値は、推論工程(ii)および合成工程(iii)の後で計算された、3つの項目(POSSIBLE_SELECTIONがHIGHである、POSSIBLE_SELECTIONがMEDIUMである、およびPOSSIBLE_SELECTIONがLOWである)の有効度を表す。「Final Output Value」は、工程(iv)において、上述した式1または2を用いて計算される。「Possible Selection」は、最終値より計算された個々のルールの前提POSSIBLE_SELECTIONがLOWである、POSSIBLE_SELECTIONがMEDIUMである、およびPOSSIBLE_SELECTIONがHIGHであるに対する真理値のうち最大のものを示す(図7)。
【0131】
結果
例えば、Table 7(表8)に示した結果からわかるように、1074.63から離れた候補イオンに対する結果は、それぞれに対して真理値1.00でLowである。1074.63の候補イオンについては、POSSIBLE_SELECTIONの値は、真理値1.00でHIGHである。
【0132】
図7からわかるように、さらにフラグメント化を行うために1074.63 Daのフラグメントを選択することにより、MS3スペクトルでは検出されるがMS2スペクトルでは検出されない多数のイオンピークが得られる。したがって、システム=s大きなセットからの1074.63 Da候補イオンの選択は、使用者または熟練者による入力/補助操作なしでサンプルポリペプチドに関する有用な情報を明らかにしており、非常に優れていた。
【0133】
この例では1つのイオンを選択した例を示している。場合によっては、2つ以上のイオンを選択してもよく、選択されたそれぞれのイオンピークは、さらにフラグメント化することができる。
【0134】
【表4】

【0135】
Table 4(表5)
イオン質量 強度
1615.90 100
BEGIN IONS
378.95 1.06
381.00 1.26
383.92 0.99
387.93 0.96
395.97 1.86
400.92 1.36
404.94 1.07
414.96 1.65
420.97 0.70
432.95 0.86
450.94 1.36
454.98 0.72
473.99 0.95
483.98 1.21
490.97 0.84
491.98 1.34
494.91 1.60
509.97 1.17
511.93 1.73
518.97 1.07
524.01 1.90
528.02 1.29
532.97 0.81
542.03 7.46
549.96 0.98
560.98 0.84
567.99 0.85
579.02 0.85
601.96 0.99
612.03 0.63
622.04 0.81
633.02 0.82
639.07 1.48
641.99 0.92
648.06 0.86
655.06 0.76
657.10 1.60
659.03 2.42
672.11 1.11
675.13 0.96
685.14 6.12
785.45 1.17
789.42 0.55
795.48 2.22
803.45 1.23
813.50 11.31
838.45 0.86
856.43 0.80
873.48 1.28
891.50 0.67
898.49 0.72
908.51 0.74
916.57 0.95
924.51 1.12
931.58 1.17
936.50 0.74
942.55 3.10
959.59 8.53
977.60 7.27
986.53 0.74
996.58 0.74
1002.63 7.39
1010.63 1.03
1030.60 1.78
1056.60 1.26
1074.63 100.00
1151.65 0.62
1182.62 0.88
1209.61 0.62
1215.72 0.91
1217.69 0.89
1243.70 0.70
1259.76 1.04
1339.78 1.34
1357.76 6.06
1374.81 0.97
1382.81 2.80
1441.88 1.40
1447.72 0.93
1469.87 1.63
1486.84 1.15
1487.88 30.56
1555.92 0.95
1571.93 1.73
1580.91 1.88
1597.98 32.53
END IONS
【0136】
Table 5(表6)
[1580.91]
[1571.93]
[1447.72]
[1441.88,1597.98]
[1441.88,1555.92]
[1382.81,1469.87,1597.98]
[1339.78,1486.84]
[1259.76,1374.81,1487.88]
[1243.7,1374.81,1487.88]
[1243.7,1357.76,1486.84]
[1215.72]
[1209.61]
[1151.65]
[996.58,1182.62]
[977.6,1074.63]
[891.5]
[873.48,1010.63]
[873.48,1002.63]
[873.48,986.53]
[795.48,942.55,1056.6,1217.69]
[795.48,924.51]
[795.48,908.51]
[795.48,898.49]
[672.11,803.45,959.59,1074.63]
[672.11,803.45,959.59,1056.6,1217.69]
[672.11,803.45,959.59,1030.6]
[672.11,803.45,931.58,1030.6]
[672.11,803.45,931.58,1002.63]
[672.11,803.45,916.57,1030.6]
[672.11,785.45,916.57,1030.6]
[672.11,785.45,898.49]
[672.11,785.45,856.43,959.59,1074.63]
[672.11,785.45,856.43,959.59,1056.6,1217.69]
[672.11,785.45,856.43,959.59,1030.6]
[473.99,601.96,659.03]
[473.99,560.98,675.13,838.45]
[473.99,560.98,675.13,803.45,959.59,1074.63]
[473.99,560.98,675.13,803.45,959.59,1056.6,1217.69]
[473.99,560.98,675.13,803.45,959.59,1030.6]
[473.99,560.98,675.13,803.45,931.58,1030.6]
[473.99,560.98,675.13,803.45,931.58,1002.63]
[473.99,560.98,675.13,803.45,916.57,1030.6]
[473.99,560.98,675.13,789.42,936.5]
[473.99,560.98,648.06]
[450.94,612.03]
[450.94,579.02]
[450.94,549.96]
[432.95,560.98,675.13,838.45]
[432.95,560.98,675.13,803.45,959.59,1074.63]
[432.95,560.98,675.13,803.45,959.59,1056.6,1217.69]
[432.95,560.98,675.13,803.45,959.59,1030.6]
[432.95,560.98,675.13,803.45,931.58,1030.6]
[432.95,560.98,675.13,803.45,931.58,1002.63]
[432.95,560.98,675.13,803.45,916.57,1030.6]
[432.95,560.98,675.13,789.42,936.5]
[432.95,560.98,648.06]
[420.97,567.99,655.06]
[420.97,567.99,639.07]
[420.97,549.96]
[420.97,524.01,685.14,813.5,942.55,1056.6,1217.69]
[420.97,524.01,685.14,813.5,916.57,1030.6]
[420.97,524.01,655.06]
[420.97,524.01,639.07]
[420.97,491.98,655.06]
[420.97,491.98,648.06]
[420.97,491.98,639.07]
[420.97,491.98,579.02]
[414.96,528.02,675.13,838.45]
[414.96,528.02,675.13,803.45,959.59,1074.63]
[414.96,528.02,675.13,803.45,959.59,1056.6,1217.69]
[414.96,528.02,675.13,803.45,959.59,1030.6]
[414.96,528.02,675.13,803.45,931.58,1030.6]
[414.96,528.02,675.13,803.45,931.58,1002.63]
[414.96,528.02,675.13,803.45,916.57,1030.6]
[414.96,528.02,675.13,789.42,936.5]
[414.96,528.02,659.03]
[414.96,528.02,657.1,813.5,942.55,1056.6,1217.69]
[414.96,528.02,657.1,813.5,916.57,1030.6]
[414.96,528.02,657.1,785.45,916.57,1030.6]
[414.96,528.02,657.1,785.45,898.49]
[414.96,528.02,657.1,785.45,856.43,959.59,1074.63]
[414.96,528.02,657.1,785.45,856.43,959.59,1056.6,1217.69]
[414.96,528.02,657.1,785.45,856.43,959.59,1030.6]
[414.96,528.02,641.99]
[414.96,511.93,675.13,838.45]
[414.96,511.93,675.13,803.45,959.59,1074.63]
[414.96,511.93,675.13,803.45,959.59,1056.6,1217.69]
[414.96,511.93,675.13,803.45,959.59,1030.6]
[414.96,511.93,675.13,803.45,931.58,1030.6]
[414.96,511.93,675.13,803.45,931.58,1002.63]
[414.96,511.93,675.13,803.45,916.57,1030.6]
[414.96,511.93,675.13,789.42,936.5]
[414.96,511.93,659.03]
[404.94,567.99,655.06]
[404.94,567.99,639.07]
[404.94,560.98,675.13,838.45]
[404.94,560.98,675.13,803.45,959.59,1074.63]
[404.94,560.98,675.13,803.45,959.59,1056.6,1217.69]
[404.94,560.98,675.13,803.45,959.59,1030.6]
[404.94,560.98,675.13,803.45,931.58,1030.6]
[404.94,560.98,675.13,803.45,931.58,1002.63]
[404.94,560.98,675.13,803.45,916.57,1030.6]
[404.94,560.98,675.13,789.42,936.5]
[404.94,560.98,648.06]
[404.94,542.03,657.1,813.5,942.55,1056.6,1217.69]
[404.94,542.03,657.1,813.5,916.57,1030.6]
[404.94,542.03,657.1,785.45,916.57,1030.6]
[404.94,542.03,657.1,785.45,898.49]
[404.94,542.03,657.1,785.45,856.43,959.59,1074.63]
[404.94,542.03,657.1,785.45,856.43,959.59,1056.6,1217.69]
[404.94,542.03,657.1,785.45,856.43,959.59,1030.6]
[404.94,542.03,655.06]
[404.94,542.03,639.07]
[404.94,532.97,648.06]
[404.94,518.97,675.13,838.45]
[404.94,518.97,675.13,803.45,959.59,1074.63]
[404.94,518.97,675.13,803.45,959.59,1056.6,1217.69]
[404.94,518.97,675.13,803.45,959.59,1030.6]
[404.94,518.97,675.13,803.45,931.58,1030.6]
[404.94,518.97,675.13,803.45,931.58,1002.63]
[404.94,518.97,675.13,803.45,916.57,1030.6]
[404.94,518.97,675.13,789.42,936.5]
[404.94,518.97,648.06]
[404.94,518.97,633.02,789.42,936.5]
[404.94,518.97,622.04]
[404.94,491.98,655.06]
[404.94,491.98,648.06]
[404.94,491.98,639.07]
[404.94,491.98,579.02]
[400.92]
[395.97,532.97,648.06]
[395.97,524.01,685.14,813.5,942.55,1056.6,1217.69]
[395.97,524.01,685.14,813.5,916.57,1030.6]
[395.97,524.01,655.06]
[395.97,524.01,639.07]
[395.97,509.97,657.1,813.5,942.55,1056.6,1217.69]
[395.97,509.97,657.1,813.5,916.57,1030.6]
[395.97,509.97,657.1,785.45,916.57,1030.6]
[395.97,509.97,657.1,785.45,898.49]
[395.97,509.97,657.1,785.45,856.43,959.59,1074.63]
[395.97,509.97,657.1,785.45,856.43,959.59,1056.6,1217.69]
[395.97,509.97,657.1,785.45,856.43,959.59,1030.6]
[395.97,509.97,639.07]
[395.97,494.91,641.99]
[387.93,518.97,675.13,838.45]
[387.93,518.97,675.13,803.45,959.59,1074.63]
[387.93,518.97,675.13,803.45,959.59,1056.6,1217.69]
[387.93,518.97,675.13,803.45,959.59,1030.6]
[387.93,518.97,675.13,803.45,931.58,1030.6]
[387.93,518.97,675.13,803.45,931.58,1002.63]
[387.93,518.97,675.13,803.45,916.57,1030.6]
[387.93,518.97,675.13,789.42,936.5]
[387.93,518.97,648.06]
[387.93,518.97,633.02,789.42,936.5]
[387.93,518.97,622.04]
[387.93,490.97,622.04]
[383.92,511.93,675.13,838.45]
[383.92,511.93,675.13,803.45,959.59,1074.63]
[383.92,511.93,675.13,803.45,959.59,1056.6,1217.69]

[383.92,511.93,675.13,803.45,959.59,1030.6]
[383.92,511.93,675.13,803.45,931.58,1030.6]
[383.92,511.93,675.13,803.45,931.58,1002.63]
[383.92,511.93,675.13,803.45,916.57,1030.6]
[383.92,511.93,675.13,789.42,936.5]
[383.92,511.93,659.03]
[383.92,454.98,601.96,659.03]
[383.92,454.98,567.99,655.06]
[383.92,454.98,567.99,639.07]
[383.92,454.98,542.03,657.1,813.5,942.55,1056.6,1217.69]
[383.92,454.98,542.03,657.1,813.5,916.57,1030.6]
[383.92,454.98,542.03,657.1,785.45,916.57,1030.6]
[383.92,454.98,542.03,657.1,785.45,898.49]
[383.92,454.98,542.03,657.1,785.45,856.43,959.59,1074.63]
[383.92,454.98,542.03,657.1,785.45,856.43,959.59,1056.6,1217.69]
[383.92,454.98,542.03,657.1,785.45,856.43,959.59,1030.6]
[383.92,454.98,542.03,655.06]
[383.92,454.98,542.03,639.07]
[383.92,454.98,511.93,675.13,838.45]
[383.92,454.98,511.93,675.13,803.45,959.59,1074.63]
[383.92,454.98,511.93,675.13,803.45,959.59,1056.6,1217.69]
[383.92,454.98,511.93,675.13,803.45,959.59,1030.6]
[383.92,454.98,511.93,675.13,803.45,931.58,1030.6]
[383.92,454.98,511.93,675.13,803.45,931.58,1002.63]
[383.92,454.98,511.93,675.13,803.45,916.57,1030.6]
[383.92,454.98,511.93,675.13,789.42,936.5]
[383.92,454.98,511.93,659.03]
[381,542.03,657.1,813.5,942.55,1056.6,1217.69]

[381,542.03,657.1,813.5,916.57,1030.6]
[381,542.03,657.1,785.45,916.57,1030.6]
[381,542.03,657.1,785.45,898.49]
[381,542.03,657.1,785.45,856.43,959.59,1074.63]
[381,542.03,657.1,785.45,856.43,959.59,1056.6,1217.69]
[381,542.03,657.1,785.45,856.43,959.59,1030.6]
[381,542.03,655.06]
[381,542.03,639.07]
[381,528.02,675.13,838.45]
[381,528.02,675.13,803.45,959.59,1074.63]
[381,528.02,675.13,803.45,959.59,1056.6,1217.69]
[381,528.02,675.13,803.45,959.59,1030.6]
[381,528.02,675.13,803.45,931.58,1030.6]
[381,528.02,675.13,803.45,931.58,1002.63]
[381,528.02,675.13,803.45,916.57,1030.6]
[381,528.02,675.13,789.42,936.5]
[381,528.02,659.03]
[381,528.02,657.1,813.5,942.55,1056.6,1217.69]
[381,528.02,657.1,813.5,916.57,1030.6]
[381,528.02,657.1,785.45,916.57,1030.6]
[381,528.02,657.1,785.45,898.49]
[381,528.02,657.1,785.45,856.43,959.59,1074.63]
[381,528.02,657.1,785.45,856.43,959.59,1056.6,1217.69]
[381,528.02,657.1,785.45,856.43,959.59,1030.6]
[381,528.02,641.99]
[381,511.93,675.13,838.45]
[381,511.93,675.13,803.45,959.59,1074.63]
[381,511.93,675.13,803.45,959.59,1056.6,1217.69]

[381,511.93,675.13,803.45,959.59,1030.6]
[381,511.93,675.13,803.45,931.58,1030.6]
[381,511.93,675.13,803.45,931.58,1002.63]
[381,511.93,675.13,803.45,916.57,1030.6]
[381,511.93,675.13,789.42,936.5]
[381,511.93,659.03]
[381,509.97,657.1,813.5,942.55,1056.6,1217.69]
[381,509.97,657.1,813.5,916.57,1030.6]
[381,509.97,657.1,785.45,916.57,1030.6]
[381,509.97,657.1,785.45,898.49]
[381,509.97,657.1,785.45,856.43,959.59,1074.63]
[381,509.97,657.1,785.45,856.43,959.59,1056.6,1217.69]
[381,509.97,657.1,785.45,856.43,959.59,1030.6]
[381,509.97,639.07]
[381,494.91,641.99]
[381,483.98,612.03]
[378.95,542.03,657.1,813.5,942.55,1056.6,1217.69]
[378.95,542.03,657.1,813.5,916.57,1030.6]
[378.95,542.03,657.1,785.45,916.57,1030.6]
[378.95,542.03,657.1,785.45,898.49]
[378.95,542.03,657.1,785.45,856.43,959.59,1074.63]
[378.95,542.03,657.1,785.45,856.43,959.59,1056.6,1217.69]
[378.95,542.03,657.1,785.45,856.43,959.59,1030.6]
[378.95,542.03,655.06]
[378.95,542.03,639.07]
[378.95,509.97,657.1,813.5,942.55,1056.6,1217.69]
[378.95,509.97,657.1,813.5,916.57,1030.6]
[378.95,509.97,657.1,785.45,916.57,1030.6]
[378.95,509.97,657.1,785.45,898.49]
[378.95,509.97,657.1,785.45,856.43,959.59,1074.63]
[378.95,509.97,657.1,785.45,856.43,959.59,1056.6,1217.69]
[378.95,509.97,657.1,785.45,856.43,959.59,1030.6]
[378.95,509.97,639.07]
[378.95,491.98,655.06]
[378.95,491.98,648.06]
[378.95,491.98,639.07]
[378.95,491.98,579.02]
【0137】
Table 6(表7)
イオン質量 INTENSITY GAP MASS_SERIES
1339.78 1.34 124 0.17
1259.76 1.04 44 0.25
1243.70 0.70 27 0.25
1215.72 0.91 6 0.08
1209.61 0.62 26
0.08
1151.65 0.62 77
0.08
996.58 0.74 10 0.17
977.60 7.27 41 0.17
672.11 1.11 13 0.50
473.99 0.95 73 0.58
450.94 1.36 50 0.17
432.95 0.86 32 0.58
420.97 0.70 20 0.58
414.96 1.65 14 0.67
404.94 1.07 4 0.67
400.92 1.36 240 0.08
395.97 1.86 240 0.67
387.93 0.96 240 0.58
383.92 0.99 240 0.75
381.00 1.26 240 0.67
378.95 1.06 240 0.67
1074.63 100.00 400 0.17
【0138】
Table 7(表8)
選択された質量:1339.78
DoSの最大値:0.265 0.000 0.000
最終出力値:0.056
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:1259.76
DoSの最大値:0.350 0.000 0.000
最終出力値:0.073
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:1243.70
DoSの最大値:0.350 0.000 0.000
最終出力値:0.073
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:996.58
DoSの最大値:1.000 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:977.60
DoSの最大値:1.000 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:873.48
DoSの最大値:1.000 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:795.48
DoSの最大値:0.388 0.000 0.000
最終出力値:0.082
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:789.42
DoSの最大値:0.435 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:785.45
DoSの最大値:0.466 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:601.96
DoSの最大値:1.000 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:494.91
DoSの最大値:0.102 0.000 0.000
最終出力値:0.021
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:473.99
DoSの最大値:0.520 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:450.94
DoSの最大値:0.975 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:432.95
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:420.97
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:414.96
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:404.94
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:395.97
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:387.93
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:383.92
DoSの最大値:0.350 0.000 0.000
最終出力値:0.073
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:381.00
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
POSSIBLE_SELECTION: Low -- 1.000

選択された質量:378.95
DoSの最大値:0.750 0.000 0.000
最終出力値:0.175
Possiblb Selection: Low -- 1.000

選択された質量:1074.63
DoSの最大値:0.000 0.000 0.486
最終出力値:0.850
POSSIBLE_SELECTION: High -- 1.000
【図面の簡単な説明】
【0139】
【図1】タンデム質量分析におけるプリカーサーイオンの選択方法を示すフローチャートである。
【図2】スペクトルおよびファジィ理論原理より誘導されたm/z候補ピークセットに基づく、タンデム質量分析におけるプリカーサーイオンの選択方法を示すフローチャートである。
【図3】GAPがSMALLである、GAPがMEDIUMである、およびGAPがLARGEであるに対するメンバーシップ関数のプロットである。
【図4】INTENSITYがLOWである、INTENSITYがMEDIUMである、およびINTENSITYがHIGHであるに対するメンバーシップ関数のプロットである。
【図5】LOW_VALUE_CRITERIONがLOWである、およびLOW_VALUE_CRITERIONがHIGHであるに対するメンバーシップ関数のプロットである。
【図6】MASS_SERIESがLOWである、MASS_SERIESがMEDIUMである、およびMASS_SERIESがHIGHであるに対するメンバーシップ関数のプロットである。
【図7】POSSIBLE_SELECTIONがLOWである、POSSIBLE_SELECTIONがMEDIUMである、およびPOSSIBLE_SELECTIONがHIGHであるに対するメンバーシップ関数のプロットである。
【図8】系列の末端値または系列中の強いピークからのイオンピークの選択の一例を示す図である。
【図9】(前側)質量1615 DaのテストペプチドのMS2スペクトル、および(後側)MS2スペクトルからの1074 Daのフラグメントに対するMS3スペクトルである。矢印は、MS3スペクトルでは観測されたが、MS2スペクトルでは観測されなかったピークを示す。

【特許請求の範囲】
【請求項1】
フラグメント化のために部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルのプリカーサーイオンを選択する方法であって、該ソフトイオン化質量スペクトルは、該部分的に分解されたサンプルポリペプチドから得られるイオン種の一組のm/zピークを有しており、該方法は:
(i)前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、それぞれのピーク候補セット中の各ピークが少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっている少なくとも2組のm/zピーク候補セットを決定し、それぞれのm/zピーク候補セットから、それぞれのアミノ酸配列が、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である推定アミノ酸配列を決定する工程と、
(ii)人工知能手法を用いて前記少なくとも2組のm/zピーク候補セットの中の前記m/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択する工程とを有する方法。
【請求項2】
前記人工知能手法がファジィ理論原理を含む請求項1に記載の方法。
【請求項3】
前記少なくとも1つのフラグメント化のためのm/zピークを選択するための前記解析が、
(a)m/z候補ピークと、少なくとも1つの他のm/z候補セット中で最も近い末端のm/zピークとの差に対応するアミノ酸数と、
(b)m/z候補ピークの強度と、
(c)m/z候補ピークによって表される質量と、
(d)m/z候補ピークを含む任意のm/z候補ピークに対応する推定アミノ酸配列のうち最長のもののアミノ酸数とからなる集合のうち少なくとも2つを表す入力変数に基づいて行われる請求項1または請求項2に記載の方法。
【請求項4】
前記ファジィ理論原理を使用した解析が、
(i)少なくとも1つのメンバーシップ関数の前記入力変数をファジィ化する工程と、
(ii)それぞれのルールに対するそれぞれのファジィ部分集合を定義するために、ルールベースに含まれる複数のルールであって、それぞれのルールは少なくとも1つの出力変数を有するルールの推論を行う工程と、
(iii)前記少なくとも1つの出力変数のそれぞれに対する単一の出力部分集合を含むファジィ出力集合を定義するために、前記推論を行う工程(ii)の前記ファジィ部分集合を合成する工程と、
(iv)前記ファジィ出力集合を脱ファジィ化してクリスプ数を得る工程とを有する請求項3に記載の方法。
【請求項5】
前記ファジィ理論原理を用いた解析が、前記ルールベースの前記ルールに重み付けをする支持度(DoS)を包含する請求項4に記載の方法。
【請求項6】
前記ルールベースの前記ルールの前記支持度が、機械学習によって調整される請求項5に記載の方法。
【請求項7】
前記脱ファジィ化工程が重心法を含む請求項4から6のいずれか1項に記載の方法。
【請求項8】
前記ルールベースが、データマイニング法による訓練を介して、実験データから知識を集積する工程をさらに有する請求項4から7のいずれか1項に記載の方法。
【請求項9】
前記データマイニング法が、
ニューラルネットワーク、
決定木、および
規則帰納アルゴリズムのいずれかを含む請求項8に記載の方法。
【請求項10】
部分的に分解されたサンプルポリペプチドに対する少なくとも1つの推定アミノ酸配列を決定する方法であって、
(i)前記部分的に分解されたサンプルポリペプチドから、1組のイオン種のm/zピークを与える、前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルを得る工程と、
(ii)前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、それぞれのピーク候補セット中の各ピークが少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっている少なくとも2組のm/zピーク候補セットを決定し、それぞれのm/zピーク候補セットから、それぞれのアミノ酸配列が、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である推定アミノ酸配列を決定する工程と、
(iii)人工知能手法を用いて前記少なくとも2組のm/zピーク候補セットの中の前記m/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択する工程と、
(iv)1組のイオン種のm/zピークを与える、前記選択された少なくとも1つのm/zピークのソフトイオン化質量スペクトルをさらに得る工程と、
(v)場合によっては、少なくとも2つの上述のようにして得られた前記ソフトイオン化質量スペクトルを、前記ソフトイオン化質量スペクトルとして使用して工程(ii)〜(iv)を繰り返す工程と、
(vi) 前記部分的に分解されたサンプルポリペプチドから得られる1組のイオン種のm/zピークを含む前記ソフトイオン化質量スペクトルから、それぞれのピーク候補セット中の各ピークが少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっている少なくとも1組のm/zピーク候補セットを決定し、それぞれのm/zピーク候補セットから、それぞれのアミノ酸配列が、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列である推定アミノ酸配列を決定する工程とを有する方法。
【請求項11】
前記人工知能手法がファジィ理論原理を含む請求項10に記載の方法。
【請求項12】
部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、フラグメント化のための少なくとも1つのm/zピークを選択するためのシステムであって、
(a)人工知能手法を使用して少なくとも2組のm/zピーク候補セットの中のm/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択するための機械命令を格納するためのメモリーであって、前記少なくとも2組のm/zピーク候補セットは、前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから決定され、前記ソフトイオン化質量スペクトルは、前記部分的に分解されたサンプルポリペプチドより得られる1組のm/zピークを含み、それぞれのm/zピーク候補セット中の各m/zピークは、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっており、推定アミノ酸配列は、それぞれのm/z候補ピークセットより決定され、それぞれの推定アミノ酸配列は、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列であるメモリーと、
(b)人工知能手法を用いて前記少なくとも2組のm/zピーク候補セットの中のm/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択するためのプロセッサーとを有するシステム。
【請求項13】
前記人工知能手法がファジィ理論原理を含む請求項12に記載のシステム。
【請求項14】
前記機械命令のファジィ理論原理によって使用されるファジィ理論ルールベースを格納するためのメモリーをさらに有し、
前記プロセッサーは前記メモリーと結合し、前記プロセッサーは、前記ファジィ理論ルールベースを参照しながら前記機械命令を実行し、前記プロセッサーに、前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、フラグメント化のための少なくとも1つのm/zピークを選択させる請求項13に記載のシステム。
【請求項15】
(i)前記ソフトイオン化質量スペクトルを表すデータを入力するためのデータ入力手段と、
(ii)前記プロセッサーの出力を出力するための出力手段とをさらに有する請求項12から14のいずれか1項に記載のシステム。
【請求項16】
さらに質量分析計を含む請求項12から15のいずれか1項に記載のシステム。
【請求項17】
前記ルールベースが、データマイニング法による訓練を介して、実験データから知識を集積することをさらに有する請求項14に記載のシステム。
【請求項18】
前記データマイニング法が、
ニューラルネットワーク、
決定木、および
規則帰納アルゴリズムのいずれかを含む請求項17に記載のシステム。
【請求項19】
部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、フラグメント化のために少なくとも1つのm/zピークを選択するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、人工知能手法を使用して少なくとも2組のm/zピーク候補セットの中のm/zピークを解析し、フラグメント化のための少なくとも1つのm/zピークを選択するためのプログラムコードを含んでおり、
前記少なくとも2組のm/zピーク候補セットは、前記部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから決定され、
前記ソフトイオン化質量スペクトルは、前記部分的に分解されたサンプルポリペプチドより得られる1組のm/zピークを含み、
それぞれのm/zピーク候補セット中の各m/zピークは、少なくとも1つの近隣のピークとアミノ酸1個の質量分だけ異なっており、
推定アミノ酸配列は、それぞれのm/z候補ピークセットより決定され、それぞれの推定アミノ酸配列は、各m/zピークとその少なくとも1つの近隣ピークとの間の質量差に対応するアミノ酸の配列であるコンピュータプログラム。
【請求項20】
前記人工知能手法がファジィ理論原理を含む請求項19記載のコンピュータプログラム。
【請求項21】
部分的に分解されたサンプルポリペプチドのソフトイオン化質量スペクトルから、フラグメント化のためのプリカーサーイオンを選択する装置であって、
(i)データ入力手段と、
(ii)ファジィ理論ルールベースを格納したデータ保存手段と、
(iii)請求項20に記載のプログラムコードを含むデータ処理手段と、
(iv)前記データ処理手段の出力を出力するためのデータ出力手段とを有する装置。
【請求項22】
前記装置が質量分析計を含む請求項21記載の装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2008−530576(P2008−530576A)
【公表日】平成20年8月7日(2008.8.7)
【国際特許分類】
【出願番号】特願2007−555702(P2007−555702)
【出願日】平成18年2月17日(2006.2.17)
【国際出願番号】PCT/GB2006/000560
【国際公開番号】WO2006/087565
【国際公開日】平成18年8月24日(2006.8.24)
【出願人】(504440339)シマズ リサーチ ラボラトリー (ヨーロッパ) リミテッド (1)
【氏名又は名称原語表記】SHIMADZU RESEARCH LABORATORY (EUROPE) LTD.
【Fターム(参考)】