説明

分光計によって生成されたデータからスペクトルを抽出するためのシステム及び方法

時間的に指標が付けられたスペクトル走査によって分光計から生成されたデータからスペクトルを抽出するシステム及び方法が提供される。該方法は、分光計からデータ・マトリクスを受け取る操作を含む(302)。次いで、ノイズがデータ・マトリクスから除去される(304)。更なる操作は、情報内容に基づいてデータ・マトリクスにおいて所定のスペクトルを識別することである(306)。更に、データ・マトリクスから所定のスペクトルを抽出するために、デニゼン変換に基づいて、所定のスペクトルに基づき、データ・マトリクスに還元変換が適用される(308)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は一般に分光法に関する。
背景技術
化学的分析のために設計された種々の装置が存在するけれども、広く使用されているシステムの1つは、クロマトグラフを用いて物理的に分離した後に質量分析計にかけるものである。イオン到着カウンタとしても知られる時間−デジタル変換器を組み込み且つ質量分析器を用いる種々の型式の質量分析計が公知である。時間−デジタル変換器は、例えば、イオンのパケットを本質的に同一の運動エネルギで無電界ドリフト領域へ放出する飛行時間質量分析器に用いられる。ドリフト領域においては、各イオン・パケットにおいて異なる質量対電荷比を持つイオンは、異なる速度で移動するので、ドリフト領域の出口に配置されたイオン検知器に異なる時間に到着する。したがって、イオン通過時間の測定は所定のイオンの質量対電荷比を決定する。
【0002】
現在、飛行時間質量分析器において一層一般に採用されているイオン検知器は、検知面に衝突するイオンが例えば電子増倍器によって電子のパルスを生成する単一イオン計数検知器である。典型的には、電子のパルスは増幅器によって増幅され、その結果の電気信号が生成される。増幅器によって生成された電気信号は、イオンのパケットが加速されて最初にドリフト領域に入ると始動する時間−デジタル変換器によって、検知器を打つイオンの通過時間を決定するために使用される。したがって、イオン検知器及びその関連の回路は、検知器に衝突する単一のイオンを検知することができる。
【0003】
化合物を分析する際に多くの型式の質量分析計を使用することができるが、こうした装置の全部が、質量分析計を用いて測定されてきた質量スペクトルを表す広範なデータ・マトリクスを生成する。次いで、これらの大きなデータ・マトリクスが分析され、出力された特定のデータ・マトリクスがどの種の化合物を表しているかが決定される。
【0004】
連続的に展開するスペクトルの大きな組を個々の成分スペクトルへ変形するプロセスについて、種々の技術を用いて論じられてきた。そのうちの幾つかは良好な研究室原理に基づいており、他は機械学習経路に従うものである。
【0005】
質量分析計から出力されたスペクトルを識別可能な化合物へ変換するという問題に取り組むべく、多くのことが記述され、多くのアルゴリズムが開発された。これらのうちで最も広く受け入れられたのは、AMDISと呼ばれる完全なプログラムとして提供されたものである。このプログラムはhttp://chemdata.nist.gov/mass-spec/amdis/overview.htmlから無料で入手できる。AMDISは、優れた研究室技術の自動化と、化合物パターンの大規模なライブラリに対するパターン・マッチングとに基づいている。しかし、AMDISは極めて計算集約的であり、比較的に時間を消費する。他のアルゴリズムは、同様の欠点を有する機械学習を用いて問題にアプローチしている。
【0006】
発明の概要
分光計からの時間的に指標が付けられたスペクトル走査によって生成されたデータからスペクトルを抽出するためのシステム及び方法が提供される。この方法は、分光計からデータ・マトリクスを受け取る操作を含む。次いで、データ・マトリクスからノイズが除去される。更なる動作は、情報内容に基づいてデータ・マトリクスにおいて所定のスペクトルを識別することである。更に、データ・マトリクスから所定のスペクトルを抽出するために、デニゼン変換(denizen transformation)に基づいて、還元変換(reduction transformation)をデータ・マトリクスに適用することができる。
【0007】
本発明の追加の特徴及び利点は、本発明の特徴を例として図示する添付図面と併せて理解される詳細な説明から明らかになろう。
【0008】
詳細な説明
図に示す例示の実施の形態に言及するが、特定の用語を用いて実施の形態を記述している。しかし、理解されるように、それによって発明の範囲を限定するものではない。ここで図示される発明的特徴の変形及び更なる修正、並びに、ここに図示される発明の原理の追加の応用は、この開示を所有する当業者に想起されるものであり、本発明の範囲内にあるとみなされる。
【0009】
多数のスペクトル走査から有益なスペクトルの組を抽出する、本明細書ではデニゼン変換と呼ばれる変換に基づくシステム及び方法が提供される。デニゼン変換はハウスホルダー変換(Householder transformation)に類似したもので、その優れた数値的特性を引き継いでいる。抽出されたスペクトルは化合物のライブラリ・マッチングに有効であり、これは、抽出されたスペクトルがスペクトル・データに直接基づいており、何らかの正投影には基づいていないからである。その結果は、数学的に健全で数値的に安定であり且つ化学的に敏感な方法である。この方法は、現在普及した他の技術と比較するとき、速度及び分析結果において動作が優れている。
【0010】
本発明の1つの実施の形態においては、YはM×Nマトリクスを表すことができ、それぞれがM個の質量対電荷比を持つN個の質量スペクトルの観測可能な強度を表す。これらのデータは、時間又は空間に関して展開する質量スペクトルを反復的に走査又はサンプリングする任意の装置から収集することができる。この場合、N個のスペクトルのそれぞれは或る時点での走査を表すことができる。N個のスペクトルはYが
【0011】
【数1】

【0012】
として表されるように現れると仮定する。ただし、XすなわちM×NマトリクスはB個の濃度を持つK個の個々の化合物のスペクトルを表す。BはK×Nマトリクスであり、各行の値は当該行に関連する化合物のN回の走査における濃度を表す。濃度は公知の分布又は任意の種類の計算可能な関数に従う必要はない。εは無相関のノイズを表す。
【0013】
【数2】

【0014】
がXに対する評価を表し、
【0015】
【数3】

【0016】
がBに対する評価を表すとする。
サンプルにおける化合物が(したがって、そのスペクトルが)既知であるならば、Xは既知であり、問題を、
【0017】
【数4】

【0018】
を見出す制限付き最小二乗計算に帰すことができる。同様に、濃度プロファイルが既知であるならば、制限付き最小二乗法を採用して
【0019】
【数5】

【0020】
を見出すことができる。
しかし、化合物又は濃度は既知ではないので、データを使用して
【0021】
【数6】

【0022】
の初期構築としてK個のスペクトル候補が見出される。また明らかになるように、
【0023】
【数7】

【0024】
を選択するのに使用されるアルゴリズムも同様に
【0025】
【数8】

【0026】
に対する合理的な評価を与える。
ハウスホルダー変換は、線形最小二乗操作における要素マトリクスを条件付けるようにQRアルゴリズムによって採用されることが多い。該変換はこの任務を、最も多くの情報を持つ列を選択し、その列をマトリクスの残りから有効に抽出することによって、実行する。これにより、その後の選択が線形独立であることが保証される。修正されたハウスホルダー変換の使用は、その操作性の良さとその優れた数値的特性との理由で、現在の方法の1つの実現である。ハウスホルダー変換と、どのようにハウスホルダー変換を最小二乗操作及びQR因子分解アルゴリズムにおいて用いるかは、当業者には公知である。
【0027】
【数9】

【0028】
を構築するには、同様の種類の処理が必要である。線形独立なスペクトルを選択し、該スペクトルを、数値的に安定で化学的に敏感な方法でYから抽出することができる。したがって、ハウスホルダー変換は、この状況に適用される分析方法を開発するための刺激になる。
【0029】
デニゼン変換マトリクスPが
【0030】
【数10】

【0031】
として定義されるM×Nマトリクスであるとする。ここで、長さMのベクトルVは
【0032】
【数11】

【0033】
として定義され、xはYの列のうちの1つから選択された列ベクトルを表す。デニゼン変換がマトリクスに適用されると、デニゼン変換は該マトリクスからxを抽出するという効果を持つ。xを含む列は全部ゼロであり、該マトリクスの残りは「xから自由」である。Yの値を実空間で維持するために、変換後にゼロより小さい値はゼロにされる。これは記号
【0034】
【数12】

【0035】
によって表される。デニゼン変換は
【0036】
【数13】

【0037】
として定義される。特定の列のみを狙うことが望ましいことが多い。例えば、或る時間ウィンドーの期間に溶出する化合物は、考察されるべき列の数を減らすことになる。この場合、列(n1・・・n2)のみが変換にさらされ、Yの残りの列には変化がない。
【0038】
なお、式(3)におけるvはハウスホルダー・ベクトルとは第1項だけ相違する。事実、ゼロの行がYのマトリクスの最上部に現れるとすると、2つの計算は同じである。これは、デニゼン変換に確固とした数値的根拠を与え、計算に関連する丸め特性が極めて有利であることを保証する。
【0039】
Yからの
【0040】
【数14】

【0041】
の抽出
分析には、以下に説明するパラメータが必要である。
装置ノイズ:これは、Y全体を通して均一に現れる無相関のスプリアス信号であると仮定される。これは式(1)におけるεである。このノイズは除去し得ないので、基本的には無視される。しかし、ノイズ・レベルを計算することは重要である。該ノイズ・レベルに達するまで、スペクトルはYから抽出され続ける。多くのスペクトル分析器は、ノイズ・レベルが所定のノイズ閾値よりも小さくなると、ノイズ・レベルをゼロにするようになっている。このノイズ閾値は、Yにおける最小のゼロでないノイズを見出すことによって容易に測定される。
【0042】
化学ノイズ:Yは、分析されている化合物とは無相関の永続的な信号を含むことが多い。これは、同調のはずれた装置によって、又は、他の物理的或いは電子的な誤動作によって生じ得る。この信号は永続的であるから、後述するように、デニゼン変換を用いて容易に除去される。
【0043】
ピーク幅:この方法が進行できる仮定の1つは、それぞれの化合物はデータの局在化された領域に現れるということである。この領域は「ピーク幅」としてパラメータ化され、信号の強度に関して拡大縮小され得る。これらのノイズ・パラメータ及び溶出プロファイルを評価するために開発された方法は、ここでの検討の範囲を越えているが、当業者には公知である。
【0044】
本方法の1つの実施の形態は、以下の擬似コードによって記述することができる。
化学的ノイズの除去
【0045】
【表1】

【0046】
スペクトルの抽出
【0047】
【表2】

【0048】
このアルゴリズムの例示の実行を、以下の「C」コードに示す。以下はvを計算するために使用される例示のコードである。
【0049】
【表3】

【0050】
以下は、デニゼン変換の実施の形態を実行するのに使用され得る例示のコードである。なお、対応する濃度に対する評価も関数の進行とともに計算される。
【0051】
【表4】

【0052】
本発明の方法は、検知装置から取得されたスペクトルを抽出、浄化する、数値的に安定で化学的に敏感なアルゴリズムを提供することができる。この種の処理は、物理的分離が完全ではなく、個々の化合物のスペクトルが混同されているときに重要である。デニゼン変換は、この方法をその目標へ推進するエンジンの実施の形態として導入される。デニゼン変換の開発は、多くの線形最小二乗操作の中心であり優れた数値的特性を有するハウスホルダー変換によって呼び起こされたものである。この方法は、スペクトルの直交する組を形成し、或る機械学習アルゴリズムに関連する共線性及び識別可能性の問題を回避するよう、データを直接取り扱う。抽出されたスペクトルはライブラリ・マッチングに有用である。
【0053】
図3は、時間的又は空間的に指標が付けられたスペクトル走査によって分光計から生成されたデータからスペクトルを抽出する方法を示している。ここでの検討は本発明のシステム及び方法の動作のハイレベルの概観である。この方法は分光計からデータ・マトリクスを受け取る操作(ブロック302)を含むことができる。分光計は質量分析計、赤外線分光計、光学分光計、イオン移動度分光計等であってよい。
【0054】
このデータ・マトリクスは行に値を含むことができ、各行の値は、当該行に関連する化合物のN回の走査における化合物濃度を表す。更に詳細には、データ・マトリクスは質量対電荷比に関連する強度値を含む。図1aは、クロロベンゼンと4ヒドロキシ−4メチル−2ペンタノンとを示す、分光計によって生成された例示のデータ・マトリクスを示している。化合物を表す、組み合わされたピークをも見ることができる。
【0055】
また、データは環境及び分光計自体からの或る量のノイズを含むことがある。このノイズは測定可能であり、データ・マトリクスからノイズを除去する操作(ブロック304)を実行することができる。
【0056】
次に、データ・マトリクスにおける所定のスペクトルを、情報内容に基づいて識別する(ブロック306)。所定のスペクトルの選択プロセスの基礎として用いられる情報内容は二乗和である。換言すると、本方法は、二乗和の操作が予め定めた閾値に合致するまで、データ・マトリクス中を移動する。閾値に合致すると、選択プロセスが完了する。これにより、本方法はデータの分析に関係すると信じられるスペクトルを抽出することができる。
【0057】
次いで、データ・マトリクスから所定のスペクトルを抽出するために、デニゼン変換に基づいて、還元変換をデータ・マトリクスに適用する(ブロック308)。還元変換はデニゼン変形、修正ハウスホルダー変換又は他の還元変換であり得る。所定のスペクトルが除去されてしまうと、残りのデータから、適宜の識別されたスペクトルが除去されたことを検証することができる。
【0058】
図1bは、所定のスペクトルが除去されたデータ・マトリクスの例を示している。(縮小されたスケールで表示されている)残りのピークは、残りの化合物データを示す。所定のスペクトルは、最大の二乗和又は最大の情報を持つ列であるクロロベンゼンであり、その化合物データが除去された。図1cはクロロベンゼンの評価された濃度値を示している。換言すると、図1cは、クロロベンゼンのスペクトルが除去された後のクロロベンゼンのスペクトルの例である。図2は、除去されたクロロベンゼン・スペクトルの2次元の例である。
【0059】
所定のスペクトルが除去されると、異なる工程で除去された同一化合物のスペクトルを組み合わせて、スペクトルと濃度値の総合評価が作られる。換言すると、同一化合物からのものであると信じられるスペクトルを組み合わせて総合化合物署名を形成する。化合物署名を既知の化合物のスペクトル署名のライブラリと比較することができる。検知と識別のために、多変量統計分析において組み合わされる化合物の物理的特性を表す1つ以上の値のライブラリが用いられる。更に、所定のスペクトルの過去のデータとそのときの多変量統計分析とを組み合わせることにより、階層的重み付けを用いて、可能性のある化合物を識別することができる。
【0060】
識別された署名は圧縮又は組み合わされているので、署名のマッチングは従来のライブラリ・マッチング・システムよりも大幅に短い時間で済む。この操作により、システムは、データ・マトリクスから除去された所定のスペクトルにおいて、少なくとも1つの化合物とその濃度とを識別することができる。
【0061】
また、この方法は本質的に反復的である。還元変換をマトリクスの工程に反復的に適用して、データ・マトリクスから多くの所定のスペクトルを抽出することができる。還元はノイズ・フロアに達するまで適用され、達した時点で、実質的に全部の価値あるスペクトルがデータ・マトリクスから除去されたと予測される。
【0062】
また、本発明は、分析において種々の構成要素スペクトル成分に組み合わされた2つ以上の化合物のスペクトルを区分することができる。これは、組み合わされたスペクトルにおける残りの主なピークを順次除去することによって実行される。これらの除去されたスペクトルを構成要素ベクトルとして用いて、組み合わされたスペクトルを制限付き最小二乗を用いて分解することができる。制限付き最小二乗法の評価された係数を、濃度を決定するために使用することができる。
【0063】
図4は、質量対電荷比に関連する強度値を提供する質量分析計404を用いたスペクトル分析のためのシステムを示している。質量分析計は、時間及び空間においてイオンの分散を助ける、前段の分離プロセス402とともに用いられる。例えば、分離プロセスはガス・クロマトグラフ、質量分析法、電気泳動法又は同様のプロセスであり得る。
【0064】
データ取得モジュール406は質量分析計及び分離プロセスからデータ・マトリクスを受け取るよう構成される。データ取得モジュールは質量分析計の検知回路と電気的に通信する状態にある。例えば、これら2つの装置間に高速データ接続が存在する。
【0065】
ノイズ低減モジュール408はデータ・マトリクスからノイズを除去するよう構成される。先に検討したように、電子要素におけるノイズや質量分析計における他の環境ノイズに起因して、現システムには或る種のノイズが常に存在する。ノイズの除去は、予測された量のノイズを除去する公知の技術を用いて実行することができる。
【0066】
変換モジュール410はデータ・マトリクスに還元変換を適用するように構成される。このプロセスは、データ・マトリクスからスペクトル・データを抽出するために、上記の操作を用いて適用される。更に、識別モジュール412はデータ・マトリクスにおいて所定のスペクトルを識別するよう構成される。識別は、パターン認識及び化合物署名のライブラリを用いて行なうことができる。
【0067】
理解されるように、上で言及した配置は本発明の原理の応用の単なる例示である。本発明の精神及び範囲から逸脱することなく、多数の修正及び代替の配置を考え出すことができる。本発明を、発明の最も実際的で好ましいと現在みなされる実施の形態との関連において、精密且つ詳細に図示し、十分に説明してきたが、当業者には明らかなように、ここで述べた発明の原理と概念とから逸脱することなく、多数の修正を行うことができる。
【図面の簡単な説明】
【0068】
【図1a】本発明の実施の形態において分光計によって生成されたデータ・マトリクスの例を示す図である。
【図1b】本発明の実施の形態においてデータ・マトリクスから化合物が除去された、図1aのデータ・マトリクス例を示す図である。
【図1c】本発明の実施の形態においてオリジナルのデータ・マトリクスから除去された化合物データのデータ・マトリクス例を示す図である。
【図2】図1cに示すデータの2次元データ・マトリクスである。
【図3】分光計によって生成されたデータからスペクトルを抽出するための方法の実施の形態を示すフロー図である。
【図4】スペクトル分析のためのシステムの実施の形態のブロック図である。

【特許請求の範囲】
【請求項1】
時間的に指標が付けられたスペクトル走査によって分光計から生成されたデータからスペクトルを抽出する方法であって、
前記分光計からデータ・マトリクスを受け取るステップと、
前記データ・マトリクスからノイズを除去するステップと、
情報内容に基づいて前記データのデータ・マトリクスから所定のスペクトルを識別するステップと、
前記データ・マトリクスから前記所定のスペクトルを抽出するために、デニゼン変換に基づいて、前記データ・マトリクスの還元変換を適用するステップと、
を備える方法。
【請求項2】
前記所定のスペクトルを試験して、前記の識別されたスペクトルが除去されたか否かを決定するステップを更に備える、請求項1に記載の方法。
【請求項3】
識別する前記ステップが、二乗和に基づいて前記データ・マトリクスにおいて所定のスペクトルを識別するステップを含む、請求項1に記載の方法。
【請求項4】
前記データ・マトリクスから除去された前記所定のスペクトルにおいて少なくとも1つの化合物を識別するステップを更に備える、請求項2に記載の方法。
【請求項5】
前記データ・マトリクスから除去された前記所定のスペクトルに基づいて前記所定のスペクトルにおいて少なくとも1つの化合物の対応する量を識別するステップを更に備える、請求項3に記載の方法。
【請求項6】
前記所定のスペクトルの化合物の種類を識別するために、質量スペクトルのライブラリを前記所定のスペクトルと比較するステップを更に備える、請求項5に記載の方法。
【請求項7】
検知及び識別のために多変量統計分析において組み合わされた化合物の物理的特性を表す1つ以上の値のライブラリを用いるステップを更に備える、請求項5に記載の方法。
【請求項8】
所定のスペクトルの過去のデータとそのときの多変量統計分析とを組み合わせることによって、可能性のある化合物を識別するために階層的重み付けを用いる、請求項3に記載の方法。
【請求項9】
前記データ・マトリクスから複数の所定のスペクトルを抽出するために還元変換の適用を反復するステップを更に備える、請求項2に記載の方法。
【請求項10】
データ・マトリクスを受け取る前記ステップが、質量対電荷比に関連する強度値を受け取るステップを備える、請求項1に記載の方法。
【請求項11】
分離プロセスと通信する質量分析計からデータ・マトリクスを受け取るステップを更に備える、請求項1に記載の方法。
【請求項12】
異なるステップにおいて除去された同一の化合物のスペクトルを組み合わせて、スペクトルと濃度値との総合評価を作るステップを更に備える、請求項1に記載の方法。
【請求項13】
分析において種々の構成要素スペクトル成分へ組み合わされた2以上の化合物のスペクトルを区分するステップを更に備える、請求項1に記載の方法。
【請求項14】
質量対電荷比に関連する強度値を提供する質量分析計を用いる、質量分析のためのシステムであって、
前記質量分析計からデータ・マトリクスを受け取るよう構成されたデータ取得モジュールと、
前記データ・マトリクスからノイズを除去するよう構成されたノイズ低減モジュールと、
デニゼン変換に基づく還元変換を前記データ・マトリクスに適用するよう構成された変換モジュールと、
前記データ・マトリクスにおいて所定のスペクトルを識別するよう構成された識別モジュールと、
を具備するシステム。
【請求項15】
前記識別モジュールが、前記データ・マトリクスから除去された質量スペクトル・データに基づいて前記所定のスペクトルにおいて化合物を識別するよう構成される、請求項14に記載のシステム。
【請求項16】
前記識別モジュールが、前記データ・マトリクスから除去された質量スペクトル・データに基づいて前記所定のスペクトルにおいて化合物の量を識別するよう構成される、請求項14に記載のシステム。
【請求項17】
前記変換モジュールが、前記還元変換を反復的に適用して、前記所定のスペクトルによって表される複数の化合物を決定するよう構成される、請求項14に記載のシステム。
【請求項18】
前記変換モジュールが還元変換を適用するよう構成されている場合、前記所定のスペクトルにデニゼン変換を適用するステップを備える、請求項14に記載の方法。
【請求項19】
前記データ取得モジュールが質量対電荷比を受け取るよう構成される、請求項14に記載の方法。
【請求項20】
質量対電荷比に関連する強度値を提供するシステムにおけるスペクトル分析方法であって、
質量分析計からデータ・マトリクスを受け取るステップと、
前記データ・マトリクスからノイズを除去するステップと、
デニゼン変換に基づく還元変換を所定のスペクトルに適用するステップと、
前記データ・マトリクスにおいて前記所定のスペクトルを識別するステップと、
前記所定のスペクトルにより還元されたパターン情報を記憶するステップと、
前記還元変換によって捕捉された少なくとも1つの化合物を識別するために、前記パターン情報を質量スペクトル・パターンのライブラリと比較するステップと、
を備える方法。
【請求項21】
前記データ・マトリクスから少なくとも1つの前記所定のスペクトルを抽出するために前記還元変換の適用を反復するステップを更に備える、請求項20に記載の方法。
【請求項22】
前記データ・マトリクスから除去されたスペクトルに基づいて前記所定のスペクトルにおいて少なくとも1つの化合物を識別するステップを更に備える、請求項20に記載の方法。
【請求項23】
質量分析計からの質量スペクトル・データのためのスペクトル分析方法であって、
前記質量スペクトル・データからノイズを除去するステップと、
前記質量スペクトル・データにおいて所定のスペクトルを識別するステップと、
デニゼン変換を前記所定のスペクトルに適用するステップと、
を備える方法。

【図1a】
image rotate

【図1b】
image rotate

【図1c】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2008−500537(P2008−500537A)
【公表日】平成20年1月10日(2008.1.10)
【国際特許分類】
【出願番号】特願2007−515246(P2007−515246)
【出願日】平成17年5月23日(2005.5.23)
【国際出願番号】PCT/US2005/018122
【国際公開番号】WO2005/117063
【国際公開日】平成17年12月8日(2005.12.8)
【出願人】(592087647)ブリガム・ヤング・ユニバーシティ (34)
【氏名又は名称原語表記】BRIGHAM YOUNG UNIVERSITY
【Fターム(参考)】