質量分析データを処理する方法、その方法を実行するコンピュータプログラム、そのコンピュータプログラムを含むコンピュータプログラム製品、その方法を実行するデータ処理手段を含むフーリエ変換質量分析機及びその方法を実行するデータ処理手段を含む液体クロマトグラフィー質量分析機

【課題】質量分析データの処理において、貴重な情報が失われずに、データセットのサイズを減少することである。
【解決手段】フーリエ変換質量分析データを処理する方法は、時間領域過渡の一部のフーリエ変換を実施するステップと、その変換されたデータからイオンの存在を示す信号ピークを識別するステップとを備える。ピークが識別されると、全過渡は変換され、部分過渡変換において識別されたピークは、変換された全過渡の真のピークを見つけるために使用される。ランダムノイズから生じた「偽」ピークの数は、分解能と相関することが明らかとなっているので、真のピークを識別するために部分的過渡を使用する。次に、全データセットの異なる部分が変換されてから相関されうる。あらゆるノイズはランダムであるため、偽ピークは２つの部分変換において異なる位置に発生するはずである。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、質量分析データ、特に、限定はしないが、フーリエ変換イオンサイクロトロン共鳴質量分析（ＦＴＭＳ）から得られるデータを処理する方法に関する。
【背景技術】
【０００２】
一般に分光分析、特に質量分析は、極めて豊富なデータセットを生成する。このことは、二重収束磁場型質量分析、飛行時間型質量分析、およびフーリエ変換質量分析（ＦＴＭＳ）を使用して取得されるデータのような高分解能質量分析データの場合には、特に当てはまる。たとえば、ＦＴＭＳにおいてｍ／ｚ２００〜２０００からの標準的な取得には、百万データポイントの測定を伴う。毎秒１回スキャンの測定（通常、液体クロマトグラフィー／質量分析（ＬＣ／ＭＳ）用途向け）は、結果として７．２ＧＢ／時（約１７０ＧＢ／日）の速度の生データの生成をもたらす。
【０００３】
通常、これらのスペクトルは、コンピュータメモリまたは代替のコンピュータ可読媒体に格納され、そのため格納には大量のメモリが必要とされる。そのような分光分析データの大部分（おそらく９９％）は、貴重な情報を含むことはないが、その代わりほとんどが、その全体の大きさおよび標準偏差を除いては分析的に有用性のないノイズで構成されている。
【０００４】
現在、質量分析機は、データセット全体を格納するか、または２つの方法のうちの１つによりデータセットのサイズを減少させようと試みることがある。
【０００５】
第１の方法は、単に、質量スペクトルにおいて見い出されたピークのリストを格納する（つまり、各ピークの位置および大きさを格納する）ことである。この方法には、ユーザーまたはソフトウェアが、ピーク形状、背景、信号対雑音比、または付加的仮定なくしては生成されえないその他の情報などのさらなる特徴についてデータを再評価することができないという欠点がある。スペクトルのオフピーク部分に関する情報は、さらに手動または自動で情報が処理される場合に、極めて重要である。信号対雑音比は、イベントの有意性に関する重要な手掛かりをもたらす。さらに、ピークのグループは、グループ内のピークの位置および強度の単なる自動処理よりもはるかに高度な技能によりスペクトルを評価することができる熟達したユーザーにとって、非常に有益である。
【０００６】
格納すべきデータファイルのサイズを減少させる第２の方法は、オペレータがしきい値をあらかじめ選択し、このしきい値よりも値が大きいスペクトルのデータポイントのみをソフトウェアが格納することにより達成される。オペレータがしきい値を正しく推測する場合、ピークに属するデータポイントのみが格納される。これは、ピーク形状に関する情報を保持するという利点を有する。しかし、この方法には、しきい値レベルを正しく設定するためにオペレータの技能に依存するという欠点がある。しきい値レベルが過度に低く設定される場合、通常大量のノイズデータポイントがピークデータポイントと共に格納されることになり、しきい値が過度に高く設定される場合、ピーク形状に関連する貴重な情報はピークの基部のデータポイントが失われる際に失われてしまう。したがって、そのようなソフトウェアをうまく使用することは、熟達したオペレータ以外には困難である。加えて、ノイズに関連する情報は格納されず、そのような情報はすべて失われる。
【０００７】
ＦＴＭＳデータにおけるノイズの分析の改良は、非特許文献１において、および単独で非特許文献２においてハンナ（Ｈａｎｎａ）により説明されている。ハンナが説明する方法では、スペクトルのノイズ排除レベルとして使用されるしきい値を取得するために、ＦＴＭＳ質量スペクトルに存在するノイズの統計的分析を使用する。ピークリストは、このしきい値を超えるデータから取得される。
【先行技術文献】
【非特許文献】
【０００８】
【非特許文献１】Ｓｗａｎｓｅａ，ＡｄｖａｎｃｅｓｉｎＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ１９８５：ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１０ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙＣｏｎｆｅｒｅｎｃｅ，１９８５年９月９〜１３日、ＪｏｈｎＷｉｌｅｙａｎｄＳｏｎｓ
【非特許文献２】Ｄ．Ａ．Ｈａｎｎａ，“ＮＯＩＳＥＡＮＡＬＹＳＩＳＦＯＲＭＡＳＳＳＰＥＣＴＲＡ”，ＡｄｖａｎｃｅｓｉｎＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ１９８５，Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１０ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙＣｏｎｆｅｒｅｎｃｅ，１９８６，ｐｐ１２１１−１２１２
【発明の概要】
【発明が解決しようとする課題】
【０００９】
ハンナの論文に説明されている技法は、達成されるべき適切なノイズしきい値のより優れた推定を可能にするが、それでもなお、これらにはいくつかの欠点がある。第１に、該技法は、ピーク位置およびそれらの強さの判別をもたらすのみであり、ピーク形状およびスペクトルノイズに関する貴重な情報は失われる。第２に、ノイズ分布のパラメータを取得するために、これらのパラメータが安定するまで何回かの反復が必要となるので、該技法は計算処理上比較的高価である。
【課題を解決するための手段】
【００１０】
この背景に対して、また本発明の参考となる態様から、本発明は、フーリエ変換質量分析データを処理する方法であって、質量電荷比の範囲に関して時間領域におけるＦＴＭＳデータのセットを取得するステップと、取得された時間領域データのサブセットを周波数領域に変換するステップと、第１のしきい値を周波数領域データのサブセットに適用して、前記範囲の質量電荷比を有するイオンの存在を示すピークデータからノイズデータを識別するステップと、取得された時間領域データの全データセットを実質的に周波数領域に変換するステップと、ピークデータを含めるためにピークデータからノイズデータが識別された変換済みデータサブセットの領域に対応するその変換済み全データセット内の領域を識別するステップとを備える方法に属する。
【００１１】
本発明の参考となるこの態様の処理技法は、格納されるべきデータファイルを圧縮するために「標準」しきい値においてランダムノイズスパイクを除去するか、または低いしきい値を使用してさらに小さい実際の信号を見いだすか（ただし、ここでデータファイルは圧縮されないことがある）のいずれであっても、ランダムノイズに対する識別を向上させる。本発明は、分解能が増大するのに応じて（時間領域データポイントの数に相当）、しきい値を超えるランダムノイズピークの数が増大するが、「実際の（real）」信号ピーク、つまり選択された範囲内の質量電荷比を有するイオンの存在を純粋に表すピークの数にはほとんどまたは全く増加は見られない、という観察結果に基づく。分解能が減少するのに応じて、ランダムピークの数も減少する、という逆もまた当てはまる。事実、実際の信号ピークの数はすべての分解能において比較的一定していることが確認されている。これは、ランダムノイズがガウス分布であると仮定すれば、存在するデータポイントが多ければ、それに応じて任意の所定のしきい値を超えるデータポイントの数も多くなるからである。周波数領域データポイントの数は、時間領域データポイントの数に比例する。したがって、より少ない時間領域データセットは、より少ないランダムノイズピークをもたらし、このことは、全データセットをしきい値分けする根拠として使用されうる。
【００１２】
時間領域における全ＦＴＭＳデータセットのほんの一部を周波数領域に変換することにより、分解能が減少するために所定のしきい値において見い出される偽ピークの数が比較的少なくなる。しきい値の上方に伸びるピークが識別されると（好ましくは、そのようなピークの位置）、全データセットが変換されることができるが、低分解能においてあらかじめ識別されている位置周辺のデータだけが、分析および／または保存される必要がある。つまり、低分解能において事前にしきい値を適用した結果、偽ピークは無視されうるので、周波数領域の全データセットにしきい値が単に適用された場合に見い出されるであろう多数の偽ピークの問題が回避される。
【００１３】
本発明の参考となる態様において、全変換からの実質的にすべてのデータが表示および／または格納されうるが、それは部分的な過渡（transient）の変換において「実際の」データであると識別された領域に限られる（これらは第１のしきい値を超えるので）。すなわち、第２の強度しきい値は全変換に適用される必要はなく、たとえば、データの総量は主として、ノイズデータのみを含む走査された範囲内の周波数／質量範囲を識別し（第１のしきい値の部分的過渡変換への適用を通じて）、全過渡変換においてこれらの対応する領域を単に拒否することによって減少される。しかし、追加のまたは代替の実施形態において、第２のしきい値は、全過渡変換においてデータに適用されることができ、その第２のしきい値を超えるデータのみが表示、格納などのために保持される。その第２のしきい値は、第１のしきい値と同じであっても、または異なっていてもよい。
【００１４】
本発明の実施形態によれば、フーリエ変換質量分析（ＦＴＭＳ）データを処理する方法であって、質量電荷比（ｍ／ｚ）の範囲に関して時間領域において取得されたＦＴＭＳデータの第１のセットを周波数領域に変換するステップと、ＦＴＭＳデータの前記第１のセットとは異なる、時間領域のＦＴＭＳデータの第２のセットを周波数領域に変換するステップと、周波数領域のデータの各セットに共通のピークを識別するように、周波数領域のＦＴＭＳデータの第１のセットを周波数領域のＦＴＭＳデータの第２のセットと相関させるステップとを備える方法が提供される。
【００１５】
本発明のこの実施形態は、ノイズが基本的にランダムであるという事実を活用する。そのように、時間領域の全データセットの異なる部分は、周波数領域に変換されるときに、たとえばピークが「実際の」ピークである場合、同じ相対的位置においてピークを提示するはずであるが、ランダムノイズから生じたデータのピークは統計的に、全データセットの２つの別個のサブセットにおいて同じ場所では発生しないはずである。
【００１６】
第１および第２のデータセットは、同じ過渡の異なる部分から取得されうる（ただし重複は可能である）。代替として、第１および第２のデータセットは、異なる過渡のサブセットであってもよい。後者の場合、もちろん、２つの間の相関が有意であるように、ｍ／ｚ範囲の少なくとも部分的な重複が各過渡内に含まれることが望ましい。
【００１７】
１つの実施形態において、サブセットは相互に重複することができ、たとえば、全データセットの第１の２５％および第１の５０％がそれぞれ変換されて相互相関されてもよい。代替として、別個のサブセットが変換されてもよい（たとえば、第１の２５％および第２の２５％）。さらになお、時間領域ＦＴＭＳデータの第１および第２のセットは、全く別の過渡からのものであってもよい。
【００１８】
多数の同位体ピークが発生する、より大型の分子のピークを識別する方法もまた開示されるが、これは２つのしきい値に依存する。開示される方法は、データ圧縮を可能にするので（つまり格納されうるノイズデータの量を減少させることにより）、単に有利であるわけではないことも理解されるであろう。特に相関の手法により、低強度の「実際の」ピークの検出が、たとえフルスペクトルでノイズフロアよりも低強度である場合であっても可能になる。
【００１９】
本発明の参考となる態様および実施形態となる態様は決して相互排他的ではないことが、当然理解されるべきである。好ましい実施態様は、実際に、この２つの態様を組み合わせる。したがって、本発明の別の実施形態によれば、質量分析データを処理する方法であって、質量電荷比の範囲に関して時間領域における質量分析データのセットを取得するステップと、その取得された時間領域データの第１のサブセットを周波数領域に変換するステップと、その取得された時間領域データの第２サブセットを周波数領域に変換するステップと、取得された時間領域データの全データセットを実質的に周波数領域に変換するステップと、周波数領域の前記第１および第２のサブセットのうちの少なくとも１つに第１のしきい値を適用して、ピークデータを含むそのデータの１つまたは複数の領域を識別するステップと、周波数領域のデータの第１のサブセットを周波数領域のデータの第２のサブセットと相関させて、各々の前記サブセットに共通のデータの１つまたは複数の領域を識別するステップとを備える方法が提供される。
【００２０】
一般に、本発明は、ＦＴＭＳデータの改良されたしきい値分け技法（thresholding technique）、つまり、縮小されたデータセットを生成するときに、ピークまたはスペクトル領域が全データセットに含まれるかまたは全データセットから除外される決定プロセスへの改良された手法を提供する。本発明は、以下の基準の２つ以上の数学的または論理的な組合せに基づいている。
１．時間領域データのサブセクションにおける存在量（abundance）（過渡）
２．同じデータセットの異なるサブセクションにおける有意な存在量（任意の種類の重複するサブセクションを含む）
３．全データセットにおける存在量
４．異なるデータセットにおける存在量
５．２つ以上の異なるデータセットにおける存在量
６．以前の基準により適格とされたピーク間の位相相関
７．頻繁に発生するピークに関する情報（集計されるか、または統計的に評価されうる）
８．空白であることが判明したピークに関する情報（つまり、サンプルイオンがない場合に生成されたスペクトル）。これらは再度、集計されるか、または統計的に評価されうる。
【００２１】
異なる基準に使用される有意レベルは異なっていてもよい。論理演算は、たとえばＡＮＤ、ＯＲ、ＸＯＲ、ＮＯＴ、包含など任意のタイプであってもよい。数学演算は、乗算、加算、変換、結果と「主しきい値（master threshold）」との比較、またはそれ以外であってもよい。
【発明の効果】
【００２２】
本発明によれば、質量分析データの処理において、ピーク形状およびスペクトルノイズに関する貴重な情報が失われずに、データセットのサイズを減少することができる。
【図面の簡単な説明】
【００２３】
【図１】イオンとさらにランダムノイズも存在することにより生じた両方のピークを含む、質量スペクトルの形式で全ＦＴＭＳデータセットを示す図である。
【図２】本発明の参考となる態様を具現するＦＴＭＳデータを処理する方法を示すフローチャートである。
【図３】本発明の１つの実施形態によるデータ処理方式を示すフローチャートである。
【図４】従来技術によるしきい値分け技法を使用して生成されるフーリエ変換質量スペクトルを示す図である。
【図５】本発明の実施形態の改良されたしきい値分け技法を使用して生成されるフーリエ変換質量スペクトルを示す図である。
【図６】本発明の参考態様にも適用できるもう１つの実施形態によるデータ処理方式を示すフローチャートである。
【図７】図６のデータ処理方式と類似するが、一部変形を伴うデータ処理方式を示すフローチャートである。
【図８】本発明のさらにもう１つの実施形態を示すフローチャートである。
【発明を実施するための形態】
【００２４】
本発明がさらに容易に理解されうるために、これ以降、例示のみを目的として、添付の図面が参照される。
【００２５】
フーリエ変換イオンサイクロトロン共鳴質量分析（ＦＴＭＳ）において、周知のように、イオンはイオン源において生成され、通常リニアイオントラップのように格納装置から測定セルに注入される。セルに保持されるイオンへの均一磁場およびｒｆ電（励起）場の印加は、イオンをそのセル内でサイクロトロン周波数で軌道を描いて旋回させる。イオンは、セル内の検出電極においてイメージ電流によって検出される。
【００２６】
本技法により取得される生データは、時間領域にあり、過渡（transient）として知られる。過渡が得られると、従来技術のＦＴＭＳにおいては、以下の技法により質量スペクトルが取得される。最初に、過渡がアポダイズされ（apodise）、ゼロ充填される。次に、周波数領域へのデータのフーリエ変換が実行される。これは、実数部および虚数部で構成される１組の値から成る複素周波数スペクトルをもたらす。その後、式Ｐ＝（Ｉｍ²＋Ｒｅ²）^1/2を使用して、マグニチュードスペクトル（magnitude spectrum）がポイントごとに得られる。これは、較正式を適用することにより、質量スペクトルに変換される。結果として得られた質量スペクトルの例が図１に示される。データは、１つまたは複数のピーク（図１において質量数を示すラベルが付けられている）および大量のノイズを含むことが理解されよう。
【００２７】
全ＦＴＭＳデータセットを変換して格納することは、極めて大きい記憶容量を必要とする可能性のある、比較的多大な時間を要する作業である。格納された情報の多くは、実際、分析的にほとんど価値がないか、または全く価値がないノイズである。格納されるデータの総量を縮小するため、従来技術では単に周波数領域のデータにしきい値を適用し、そのしきい値を下回るすべてのデータポイントを除去していた。背景技術において説明されているように、データを過度に圧縮するかまたは過少に圧縮して、多くのノイズが残されたり、真のピークが誤って除去されたりするおそれもあるため、固定のしきい値の場合、これは融通のきかないメカニズムである。
【００２８】
図２は、本発明の参考となる態様を具現するＦＴＭＳデータを処理する方法のフローチャートを示す。ステップ１０において、時間領域における過渡は、前述の方法でＦＴＭＳによって取得される。ステップ２０において、この過渡の全体ではないがその一部が、周波数領域にフーリエ変換される。フーリエ変換される過渡の量は、計算の速度と精度との間のトレードオフである。一方では、全過渡の比較的小さい割合を変換することは、迅速に完了されうる。もう一方では、周波数領域に変換される過渡の割合が小さすぎる場合に、データ内の真のピークが失われることもある。図２の参考となる態様では、過渡の２５％を採用し、通常これは第１の２５％である。第１の２５％を採用することの利点は、過渡のその２５％の後続の処理を、全過渡のうちの残りが取得される前に開始できることである。
【００２９】
周波数領域のデータは、ＦＴＭＳ装置による評価のために選択された範囲内の質量電荷比を有するイオンの存在を表すピークを含む。周波数領域のデータはまた、実際にはランダムノイズの結果であるが真のピークであると誤って判別される可能性のある多数のデータポイントも含む。しかし、本発明の概要で説明されているように、そのようなピークの数は、分解能の低下に伴って減少する。したがって、全過渡のうちのわずか２５％のフーリエ変換は、ランダムノイズピークの数も減少させるはずである。
【００３０】
したがって、ステップ３０において、ステップ２０で得られた部分フーリエ変換に強度しきい値が適用される。しきい値は、真のピークを廃棄するリスクを最小限にするため、比較的控えめに選択される。それでもなお、部分データセット内の偽ピークの数が減少したため、強度しきい値を超える偽ピーク（つまり、ランダムノイズピーク）が通過されるリスクも低減される。
【００３１】
次に、ステップ４０において、全過渡が周波数領域にフーリエ変換される。次に、ステップ５０において、全過渡のフーリエ変換により取得された周波数領域データに、強度しきい値が適用される。このしきい値は、ステップ３０において適用されたしきい値と同じであっても、またはそれよりも低いものであってもよい。しかし、重要なことに、ステップ５０において適用されたしきい値は、ステップ３０で確認された真のデータピークの位置の周辺の周波数領域スペクトル（または質量スペクトル）の領域でのみ適用される。つまり、これらのピークの領域の間のデータポイントは、ステップ３０において適用された強度しきい値を下回っていることになり、これ以上検討されることはない。
【００３２】
ステップ６０において、ステップ５０で適用されたしきい値を超えるピークデータが格納される。このような方法でランダムノイズを除去することにより、おそらく９０〜９５％あるいはそれ以上の圧縮が達成されうるが、ピークに関連するデータ自体は損なわれることも、圧縮されることもない。さらに、同時係属出願第ＰＣＴ／ＥＰ０４／０１０７３６号に説明されているように、ピークの間のデータはランダムノイズであると仮定されるので、ランダムノイズデータがガウス分布であると仮定し確定されたガウス・パラメータを使用してそれを再構成することにより、擬似スペクトルは再構成されうる。
【００３３】
図３は、本発明の実施形態によるＦＴＭＳデータを処理する方法のフローチャートを示す。ステップ１００において、オペレータによって選択された全分解能を使用して、過渡がもう一度取得される（つまり、全過渡が取得される）。全データ過渡の収集と同時か、またはそれ以降に、ステップ１１０において、その過渡の第１の２５％が、図２のステップ２０のように、周波数領域に変換される。図３のステップ１２０において、データ内の真のピークを見つけるために、今度は周波数領域において、過渡の第１の２５％に、強度しきい値が適用される。前回と同様に、真のデータピークが見落とされるリスクを最小限にするため、比較的控えめなしきい値が採用されうる。
【００３４】
ステップ１３０において、過渡の第２の２５％が、周波数領域に変換される。これは、元のデータセットの重複する２５％、または後続の２５％（つまり、ステップ１００で必要とされた元の時間領域過渡の２５〜５０％）であってもよい。次に、強度しきい値は、そのデータ内の真のデータピークを識別するために、もう一度そのデータにも適用される。ステップ１４０において適用されたしきい値は、ステップ１２０において適用された強度しきい値と同じであっても、異なっていてもよい。特に、ステップ１３０において異なるサイズのデータセットがステップ１１０に関して変換される場合（たとえば、元の時間領域過渡の５０％がステップ１３０において変換される場合）、ステップ１４０において適用されるしきい値は、ステップ１２０において適用されるしきい値よりもわずかに高くなる可能性がある（後者の場合、さらに多くの過渡がフーリエ変換されたため、偽データピークのリスクが高まっている）。
【００３５】
ステップ１５０において、処理ステップ１２０および１４０の結果として取得されたデータセットは、比較されるか、または相関される。ステップ１２０および１４０に続いて取得されるスペクトルの各々において同じ場所に２つの信号が現れるはずである。しかし、ノイズが真にランダムであり全時間領域データセット（過渡）の異なるセクション間で相関されないと仮定すると、ノイズピークは、２つの異なるスペクトルの同じ位置には現れない。したがって、それぞれステップ１２０および１４０の結果として得られた２つのスペクトルにおいて相互に相関するピークの位置を識別することにより、またピークが一致しないデータの領域を廃棄することにより、データセット全体に対する「前置フィルタ（prefilter）」が生成されうる。
【００３６】
次に、ステップ１６０において、全過渡は、周波数領域にフーリエ変換される。しきい値（ステップ１２０および１４０において部分データセットに適用されたしきい値よりも高くなりうる）は、周波数領域の全過渡に適用されるが、それはステップ１００〜１５０の前置フィルタリングの技法を使用して識別されたピークの領域に限られる。格納されたピークデータ、つまり、ステップ１７０で適用された強度しきい値を超えるデータは、ステップ１８０において格納される。図２の本発明の参考となる態様と同様に、廃棄されたランダムノイズは、それがガウス分布であると仮定することにより再構築されうる。
【００３７】
現在、変換された部分過渡に比較的「ゆるい」しきい値を適用することが好ましいが（ステップ１２０および１４０）、これは必須のステップではないことが理解されるであろう。これは計算処理上高価であるが、しきい値データだけではなく、各データサブセットからのデータのすべてを相関させることが可能である。この手順は、真のピークが失われるリスクを軽減することになる。
【００３８】
図３の方法の利点は、図４および図５において説明される。図４は、４０９．６ｋＨｚにおける「実際の」ピークと、実際の信号ピーク周囲の他の場所における複数のランダムノイズピークを含む人為的な時間領域信号を示す。４０９．６ｋＨｚにおける実信号の強度は、強度しきい値のすぐ上である。
【００３９】
図４は、しきい値が前置フィルタリングなしで全フーリエ変換された過渡に適用される従来技術の技法を適用した結果を示す。全質量スペクトルである図１に対して、図４は「基線（base line）」ノイズを含まないが（しきい値の適用により除去された）、１４のランダムノイズピークがあり、そのノイズのいくつかは４０９．６ｋＨｚにおける実信号よりも高い強度を有していることが分かる。
【００４０】
全時間領域データセットの第１および第２の四半分が別個に変換される図３の改良された方式を適用し、時間領域過渡からの個別の周波数領域変換の検査を通じて、「有効な」ピークのリストが作成される。図５は、比較の結果を示す。ランダムノイズによるピークはすべて消失したが、質量電荷比のこの領域の１つの有効な信号は残っている。実信号は、たとえ図４のランダムノイズピークのいずれよりも低い強度を有していても残ることは注目に値する。したがって、ここに説明されている方法が単に、（前述の図３のステップ１８０におけるように）格納されるデータ量が減少されるようにするためにデータセットサイズを縮小することに限定されているわけではないことを理解されたい。当該方法はまた、標準の方法に匹敵するサイズのデータセットを生成するためにも使用されうるが、はるかに低い検出しきい値を使用する。これにより、データの全体量を増加させることなく、単純な強度しきい値を現在下回っている信号の検出が可能になる。
【００４１】
図３において、２つのデータサブセットのピークの位置は、データ内の実際のピークを識別するために使用されるが、他のパラメータは、データ内の真のピークを識別する代わりに、またはそれに加えて、相関されうる。たとえば、ピークの強度は、（一致するピーク強度が「真の」ピークとして識別されるように）２つのデータサブセットの間で相関されうる。加えて、または代替として、実信号の位相は、過渡の１つのセグメントから次のセグメントへと一貫性があるが、これに反して、ランダム信号の位相はランダムであるはずである。したがって、位相の一貫性は、追加または代替の要因として使用されうる。信号に対して電荷状態が判別されうる場合、関連付けられている同位体ピークの位置は予測されうる。次いで、これらの同位体のウィンドウは、さらなる改良として、最終的なしきい値分け（thresholding）領域に含まれうる。さらにもう１つの改良として、複数のデータセットからのデータが採用されうる。この概念については、以下で図８に関連してさらに説明される。好ましい実施形態において、位置および位相（少なくとも）は共に採用される。
【００４２】
図６は、本発明の参考となる態様にも適用可能なもう１つの実施形態を示す。図６の実施形態は、いくつかの信号の特異性に対処するため、図３に説明されている実施形態へのさらなる変更を含む。具体的には、より大型の分子が、独特の時間領域信号または過渡を生成する。多数の等間隔の同位体ピークにより、強い「ビートパターン（beat pattern）」が生成されうる（ホフスタドラー（Ｈｏｆｓｔａｄｌｅｒ）他共著「ＩｓｏｔｏｐｉｃｂｅａｔｐａｔｔｅｒｎｓｉｎＦｏｕｒｉｅｒｔｒａｎｓｆｏｒｍｉｏｎｃｙｃｌｏｔｒｏｎｒｅｓｏｎａｎｃｅｍａｓｓｓｐｅｃｔｒｏｍｅｔｒｙ：ｉｍｐｌｉｃａｔｉｏｎｓｆｏｒｈｉｇｈｒｅｓｏｌｕｔｉｏｎｍａｓｓｍｅａｓｕｒｅｍｅｎｔｂｙｂｉｏｐｏｌｙｍｅｒｓ」、ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ＆ＩｏｎＰｒｏｃｅｓｓｅｓ１３２：１０９〜１２７（１９９４年）を参照）。図３に説明されている２セグメントのしきい値の手法を使用して、２つの時間領域データセグメントのうちの１つは、全時間領域データの「波腹（anti-node）」と相関することができる。したがって、このセグメントにはしきい値を超える信号は現れず、そのため、たとえ２つのデータセットの一方に強い信号が現れることがあっても、「共通の」ピークは発生することはない。前もって波腹の位置を予測する方法はないので、時間領域過渡の選択されたサブセクションに波腹が現れないことを保証する方法はない。この問題に対する解決策は、２つの別個のしきい値を使用することである。
【００４３】
図６を参照すると、ステップ２００において、上記と同様に全過渡が要求される。ステップ２１０において、過渡の第１の２５％が周波数領域に変換され、次いでステップ２２０において、第１の低い強度しきい値（しきい値１）がこのしきい値のピークを識別するために適用される。ステップ２３０に示されるように過渡の第２の２５％が周波数領域に変換されると、同様の技法がこれに適用される。ステップ２４０において、しきい値１がこの周波数領域データに適用され、そのピークが識別される。
【００４４】
ステップ２５０において、ステップ２２０および２４０からの２つのデータセットは、共通のピークを識別するために相関される。しかし、ステップ２６０において、より高いしきい値（しきい値２）も、ステップ２２０および２４０に続いて取得されたデータサブセットに適用され、前述の強いビートパターンにより、大型のピーク（実際のピークと仮定される）が誤って廃棄されないようになっている。
【００４５】
変更された前置フィルタが生成されると、つまり、真のピークの位置がステップ２６０において判別されると、ステップ２７０において、全過渡が周波数領域に変換され、その後ステップ２８０において第３のしきい値がデータ領域の全データ変換に適用されるが、それはステップ２５０および２６０に続いて判別された領域に限られる。上記と同様に、ステップ２９０において、ピークデータが格納されうる。
【００４６】
同様のマグニチュード（magnitude）の２つの部分変換について説明されたが、当然のことながら、異なるマグニチュードの時間領域のデータサブセット、および／または重複するデータセットが採用されうる。
【００４７】
図７において、図６の手法に若干変更を加えた手法が示される。図６および図７に類似性があるので、類似するステップを示すために同じ参照番号が採用されている。
【００４８】
特に、図６および図７においてステップ２００〜２５０は同じである、つまり、過渡の２つの別個の部分は周波数領域に変換され、第１の比較的低いしきい値（しきい値１）を使用してピークが検出され、次いで各データセットで一致するピークを見つけるために相関される。
【００４９】
しかし、ステップ２６５において、各データサブセットにより高いしきい値を適用する代わりに、次のステップとして過渡全体が周波数領域に変換される。次に、ステップ２７５において、ステップ２００〜２５０を介してピークとして識別された領域は、全周波数領域データセットから差し引かれるか、あるいは除外される。ステップ２８５において、残りのデータセットは、第１のしきい値よりも高い第２のしきい値に従う。これは、この第２のしきい値に到達した場合、たとえ前処理ステップがそのしきい値を見つけることができなかったとしても、全スペクトルからピークが省略されないことを確認する。
【００５０】
ステップ２９５において、周波数領域の全データセットからのデータは格納されるが、それは相関前処理（ステップ２００〜２５０）と残りのデータのより高レベルのしきい値処理との組合せを通じてピークであると識別される領域に限られる。
【００５１】
図８のフローチャートにおいて、もう１つの実施形態が示される。ここで、２つの完全に別個の時間領域データセットからのピークは、相関される。ステップ３００で開始し、サンプルからイオンの第１のセットのＦＴＭＳセルへの注入に続いて（通常上流のイオンフィルタ／イオン格納配置を介して）、第１の過渡がこれらのサンプルイオンから取得される。ステップ３１０において、これは周波数領域に変換され、ステップ３２０において、しきい値が周波数領域のフーリエ変換に適用される。ステップ３３０において、第２の過渡が得られる。通常、これは、第１の過渡の収集と、その第１の過渡を作成したそれらのイオンのセルをその後空にすることに続いて、ＦＴＭＳセルに注入されたイオンの新しいセットから取得される。第２の過渡は、ステップ３４０において、周波数領域に変換される。ステップ３５０において、しきい値は、周波数領域のそのフーリエ変換にも適用される。
【００５２】
ステップ３２０および３５０において適用されたしきい値は、同じであっても、異なっていてもよい。同様に、ステップ３００および３３０においてそれぞれ得られた第１および第２の過渡は全体が周波数領域に変換されうるが、その代わりに、しきい値が適用される前にステップ３１０および３４０において、各々別個の過渡の一部のみが周波数領域に変換されうる。さらに、通常、第１の過渡が得られるサンプルイオンの質量範囲は、第２の過渡をもたらすサンプルイオンの質量範囲と対応するが、質量範囲は同一である必要はない。上流イオンフィルタ／トラップのパラメータを調整することにより、異なる質量範囲がＦＴＭＳセルに注入されうるが、もちろんこれらは少なくとも重複する必要がある。
【００５３】
ステップ３６０において、各フーリエ変換からの相関またはデータ付き合わせが行われる（これは、２つの過渡が得られる質量範囲が少なくとも部分的に重複しなければならない理由である）。このために、真のピークの位置は識別され、ステップ３７０において、それらの真のピークに関してデータが格納されうる。全過渡がステップ３１０および３４０で変換されると仮定すれば、図３および図６の実施形態の２つのステップのプロセスは回避される。しかし、図８の実施形態には、いくつかの欠点がある。具体的には、第１のデータセットの処理は、第２のデータセットが収集されていなければ完了できない。
【００５４】
たとえば、サンプルイオン（既知のｍ／ｚであるかどうかにかかわらず）について同一の過渡の一部または異なる過渡に依存するのではなく、その代わりに「空白の（blank）」スペクトル（つまり、サンプルイオンがない場合）を分析することが可能であるなど、さまざまな他の実施形態が当業者には明らかとなろう。一般に、これは、ＦＴＭＳ装置の起動時に行われうる。現時点では、ＦＴＭＳ測定セル内にイオンがない場合に常駐ノイズピークが探し出されうる。そのような常駐ノイズピークの場所は格納される。一般に、前述のように、システムソフトウェアは、異なるスペクトルで位相の変化するピークを探す。次いで、これらの位相がずれた信号はスペクトルから差し引かれる。このようにすることの１つの利点は、本発明の実施形態により対処されうるホワイトノイズと共に、単一周波数電子ノイズ（システムの偽／ノイズのピークの主要源）を低減することである。
【００５５】
本発明の実施形態は、イオンサイクロトロン共鳴によって生成される過渡の分析に関連して説明されたが、たとえば、本発明は、（通常）質量スペクトルへの最終的なフーリエ変換のための時間領域過渡として取得される、ＦＴ−ＩＲ、ＦＴ−ＮＭＲ、またはＳＡＲから取得されたデータ、Ｏｒｂｉｔｒａｐ（米国特許第５８８６３４６号を参照）などの静電型トラップ（electrostatic trap）に同等に適用可能である、というように、決して限定されることはないことを理解されたい。概念はまた、米国特許第４７５５６７０号および米国特許第６４０３９５５号に説明されているような、動電型トラップ（electrodynamic trap）から得られるデータへの適用にも適している。実際、本発明は、静電飛行時間型（ＴＯＦ）質量分析の出力に適用される（たとえば、ベナー、Ｗ．Ｈ．（１９９７年）「ＡＧａｔｅｄＥｌｅｃｔｒｏｓｔａｔｉｃＩｏｎＴｒａｐＴｏＲｅｐｅｔｉｔｉｏｕｓｌｙＭｅａｓｕｒｅｔｈｅＣｈａｒｇｅａｎｄｍ／ｚｏｆＬａｒｇｅＥｌｅｃｔｒｏｓｐｒａｙＩｏｎｓ」ＡｎａｌｙｔｉｃａｌＣｈｅｍｉｓｔｒｙ６９、４１６２〜４１６８ページを参照）。さらに、フーリエ変換は、採用されうる周波数変換の唯一の形式ではない。本発明は、たとえばアダマール変換またはラプラス変換で同様に使用されうる。Ａ．ブロック、Ｎ．ロドリゲス、およびＲ．Ｎ．ザル共著、「ＨａｄａｍａｒｄＴｒａｎｓｆｏｒｍＴｉｍｅ−ｏｆ−ＦｌｉｇｈｔＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ（ＨＴ−ＴＯＦＭＳ）」ＡｎａｌＣｈｅｍ．７０、３７３５〜３７４１（１９９８年）も参照されたい。したがって、本発明は実際に、周期的信号を生成する任意のＭＳ方法に適用可能であることが理解されよう。
【産業上の利用可能性】
【００５６】
本発明は、質量スペクトルへの最終的なフーリエ変換のための時間領域過渡の分析に利用できる。

【特許請求の範囲】
【請求項１】
周期的信号を有する質量分析データを処理する方法であって、
ａ．評価のために選択された質量電荷比の範囲内について、時間領域における前記質量分析データを取得するステップと、
ｂ．前記取得された前記時間領域における前記質量分析データの中の第１のサブセットを周波数領域に変換するステップと、
ｃ．前記時間領域における前記質量分析データの中のサブセットで、前記第１のサブセットとは異なる第２のサブセットを前記周波数領域に変換するステップと、
ｄ．前記第１のサブセットの前記変換後の値に第１の閾値を適用するステップと、
ｅ．前記第１の閾値と協働して、前記範囲内の質量電荷比を有するイオンの存在を示すピークデータからノイズデータを区別するように設定された第２の閾値を前記第２のサブセットの前記変換後の値に適用し、前記区別された前記ピークデータの質量電荷比を見出すステップと、
ｆ．前記第２のサブセットの前記変換と前記第２の閾値の適用とが行われた値のピークデータ領域の信号パラメータと、前記第１のサブセットの前記変換と前記第１の閾値の適用とが行われた値のピークデータ領域の信号パラメータとを比較し、質量電荷比が同じとなる共通のピークを識別するステップと、
を備えることを特徴とする方法。
【請求項２】
請求項１に記載の方法であって、
前記ステップｆにおける比較の後で、
ｇ．前記時間領域において取得された前記質量分析データの全部を前記周波数領域に変換するステップと、
ｈ．前記範囲内の質量電荷比を有するイオンの存在を示すピークデータから前記ノイズデータを区別するために、前記変換後のデータの前記共通のピークの領域に第３の閾値を適用するステップと、
を備えることを特徴とする方法。
【請求項３】
請求項２に記載の方法であって、前記変換後のデータの中から前記区別されたピークデータの領域の外にあるデータを前記ノイズデータとして拒否するステップをさらに備えることを特徴とする方法。
【請求項４】
請求項２または３に記載の方法であって、
前記時間領域における前記第１のサブセットおよび前記第２のサブセットは、前記時間領域におけるデータの全部の中で互いに重複しないサブセットであることを特徴とする方法。
【請求項５】
請求項１から請求項３のいずれか１に記載の方法であって、
前記信号パラメータがピーク位置であることを特徴とする方法。
【請求項６】
請求項１から請求項５のいずれか１に記載の方法であって、
前記ステップｆは、さらに、
ｋ．前記周波数領域に変換後の前記第１のサブセットの複数のピークの位相と、前記周波数領域に変換後の前記第２のサブセットの複数のピークの位相とを比較するステップと、
ｌ．前記周波数領域に変換後の前記第１のサブセットおよび前記周波数領域に変換後の前記第２のサブセットの間で一貫性のある位相を有する複数のピークを識別するステップと、
を含むことを特徴とする方法。
【請求項７】
請求項２に記載の方法であって、
前記ステップｆに加えて、前記ステップｈに先立ち、
ｍ．前記変換後のデータから、前記識別されたピークに関連するデータを除去するステップを備えることを特徴とする方法。
【請求項８】
請求項３から請求項７のいずれか１に記載の方法であって、
請求項２に依存するときは、さらに、
前記変換後のデータの中から前記第３の閾値を適用した前記ピークデータのみを格納するステップを備えることを特徴とする方法。
【請求項９】
請求項７または請求項８に記載の方法であって、さらに、
第１の閾値と第２の閾値と第３の閾値とを超える前記ピークデータを格納し、前記変換後のデータにおいて残ったデータを前記ノイズデータとして拒否するステップをさらに備えることを特徴とする方法。
【請求項１０】
請求項１から請求項９のいずれか１に記載の方法であって、前記時間領域における質量分析データを前記周波数領域における質量分析データへの変換は、フーリエ変換、アダマール変換、ラプラス変換のグループから選択されることを特徴とする方法。
【請求項１１】
プログラム要素を備えるコンピュータプログラムであって、前記プログラムは実行されると、請求項１から請求項１０のいずれか１に記載の方法を実行することを特徴とするコンピュータプログラム。
【請求項１２】
請求項１１に記載のコンピュータプログラムを含むことを特徴とするコンピュータプログラム製品。
【請求項１３】
請求項１から請求項１０のいずれか１に記載の方法を実施するように構成されたデータ処理手段を含むことを特徴とするフーリエ変換質量分析機。
【請求項１４】
請求項１から請求項１０のいずれか１に記載の方法を実施するように構成されたデータ処理手段を含むことを特徴とする液体クロマトグラフィー質量分析機。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【公開番号】特開２０１２−８８３３２（Ｐ２０１２−８８３３２Ａ）
【公開日】平成２４年５月１０日（２０１２．５．１０）
【国際特許分類】

物理学 (1,541,580)
- 測定；試験 (294,940)
  - 材料の化学的または物理的性質の決定による材料の調査または分析 (128,275)
    - 電気的，電気化学的，または磁気的手段の利用による材料の調査また... (17,622)
      - ガスのイオン化の調査によるもの；放電の調査によるもの，例．陰極... (3,117)

【出願番号】特願２０１１−２９０３０８（Ｐ２０１１−２９０３０８）
【出願日】平成２３年１２月２９日（２０１１．１２．２９）
【分割の表示】特願２００７−５４３５１６（Ｐ２００７−５４３５１６）の分割
【原出願日】平成１７年１１月２３日（２００５．１１．２３）
【出願人】（５０１１９２０５９）サーモ　フィニガン　リミテッド　ライアビリティ　カンパニー (42)
【Ｆターム（参考）】

その他の電気的手段による材料の調査、分析 (22,023)

[ Back to top ]

メニュー

スポンサーリンク

次の公報 »

« 前の公報

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク