説明

質量分析データの処理装置及び方法

【課題】クロマトグラム再構成に際し、ピーク検出及び検体量の測定をより正確に行うことのできる質量分析システムを提供する。
【解決手段】質量分析システム(100)は、データ・アナライザ(104)を含む。データ・アナライザは、質量分析データを収集する検出器(110)に接続され、質量分析データに処理を施して、クロマトグラムを導き出すクロマトグラム生成器(116)、クロマトグラムに選択基準を適用して、クロマトグラムからデータ・ポイントを選択するためのデータ・ポイント・セレクタ(118)、及びデータ・ポイントに弁別基準を適用して、試料流(112)内におけるある検体の存在を表す、クロマトグラムにおけるピークを検出するためのピーク弁別器(120)を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量分析システムの技術に関し、特に、クロマトグラフの技術と結合されて、蛋白質及び他の生体分子等の分析を行うために利用される質量分析システムの技術に関する。
【背景技術】
【0002】
蛋白質及び他の生体分子のような検体の分析には、さまざまな分析機器を利用することが可能である。質量分析システムを用いた分析は、高い感度及び迅速な処理能力で多種多様な検体を取り扱うことができるという利点から、優れた分析手法であるといえる。例えば、生体分子は、質量分析システムを用いて得られるスペクトルの分析によって同定することが可能である。場合によっては、質量分析システムとクロマトグラフィ・システムを結合して、試料流内に存在する検体を同定することも可能である。一般に、試料流は、吸着特性を備える固定相が充填された、高性能液体クロマトグラフィ(「HPLC」)・カラムを通過するように設定される。検体が示す固定相への吸着レベルは、それぞれに異なる可能性があり、従って、クロマトグラフィ・カラムを出る際に、検体を分離することができる。試料流の逐次溶離部分が、クロマトグラフィ・カラムから質量分析システムに流入し、そこで、試料流の走査が反復されて、溶離部分からスペクトルが得られる。当該スペクトルには、さらに、処理が施され、検体の同定が容易になるように、クロマトグラフ・ピークとして表示されるのが通常である。こうした処理は、「クロマトグラム再構成」と呼ばれることもあり、全イオン・クロマトグラム、基準ピーク・クロマトグラム、及び、質量クロマトグラムのような、さまざまなクロマトグラムを求めるために利用することが可能である。結果得られるクロマトグラムのピークを検出し、その特性を解明することによって、ピークに関連した検体の同定、並びに、試料流中における検体量の測定が可能になる。
【発明の開示】
【発明が解決しようとする課題】
【0003】
従来のいくつかのピーク検出及び特性解明技法では、クロマトグラムの一次導関数または二次導関数に依存して、ピークの有無及びピーク位置が確かめられる。こうした従来の技法は、比較的ノイズのない環境における滑らかなガウス状ピークの処理には満足のいく機能を果たすことが可能である。しかし、質量分析システムのタイプによっては、結果得られるクロマトグラムの処理に可能な正確度及び効率に関して、問題になるものもある。よく用いられる特定タイプの質量分析システムの1つに、タンデム型四重極質量分析計のようなタンデム型質量分析計がある。タンデム型四重極質量分析計は、「三連四重極質量分析計」と呼ばれる場合もある。タンデム型四重極質量分析計を用いて得られるクロマトグラムには、場合によっては、ギザギザ(又は刻み目)のピーク及び比較的高レベルのノイズが含まれる可能性があり、これらは、場合によっては、スパイクとして生じている可能性がある。こうしたクロマトグラムの特性のために、従来の技法では十分な正確度又は性能が得られない可能性がある。すなわち、従来の技法では、単一のギザギザのピークを誤って複数ピークとみなし、スパイクまたは他のタイプのノイズを誤ってピークとして検出する可能性がある。さらに、従来の技法は、ピーク面積の計算時に、開始点と停止点に関するエラーを生じやすい可能性がある。
【0004】
一般に、信号の導関数を利用する場合には、信号のノイズ・レベルが増大することになるので、従来の技法のこれらの欠陥は、導関数を用いることに起因するといえる。平滑度を制御する調整可能なパラメータを利用して、これらの欠陥に対処しようとする試みがなされてきた。しかし、こうした試みには、手動で調整可能なパラメータを選択または調整する熟練したユーザによる管理が必要になる可能性がある。明らかに、調整可能なパラメータの手動選択は、面倒で、多大の時間を要する可能性がある。さらに、調整可能なパラメータは、さまざまな測定の間に繰り返し再調整を実施しなければならない可能性があり、このため、後続の測定操作の流れが複雑になり、同時に、後続の測定操作の流れが偏り、エラー、または、不一致の影響を被ることになりがちである。
【0005】
そこで、本発明は、クロマトグラム再構成に際し、ピーク検出及び検体量の測定をより正確に行うことのできる質量分析システムを提供することを、その目的とする。
【課題を解決するための手段】
【0006】
本発明によれば、ある質量分析システムが得られる。当該質量分析システムには、試料流をイオン化するためのイオン源と、イオン源に対して下流に配置され、試料流の質量分析データを収集するための検出器と、検出器に接続されたデータ解析器が含まれる。データ解析器には、質量分析データに処理を施して、クロマトグラムを得るためのクロマトグラム生成器と、クロマトグラムに選択基準を適用して、クロマトグラムからデータ・ポイントを選択するためのデータ・ポイント・セレクタと、データ・ポイントに弁別基準を適用して、クロマトグラムにおけるピークを検出するためのピーク弁別器が含まれており、ピークは、試料流内における検体の存在を表わしている。
【0007】
本発明の実施態様によれば、質量分析データの処理が可能であり、正確度及び効率の向上した、ピークの検出及び特性解明が可能になるのが有利である。本発明の実施態様によっては、スパイク及び他のタイプのノイズからピークを弁別することが可能な技法を利用することで、こうした正確度及び効率の向上を実現できるようにしても良い。この技法は、導関数を用いることなく、また、ユーザによる管理を必要せずに、機能し得ることが望ましい。また、この技法では、信頼性のある統計をベースにした手段を用いて、ピークの弁別及び特性解明を最適化することが可能である。さらに、この技法によれば、検証可能な統計をベースにした手段に基づくことが可能な、信号に基づく診断能力を高めることが可能になる。
【0008】
本発明の他の態様及び実施態様についても考察される。上述の要約的な記載及び以下の詳細な説明は、本発明をいかなる特定の実施態様にも制限することを意図したものではなく、ただ単に、本発明の実施態様のいくつかについて解説しようとするものである。
【発明を実施するための最良の形態】
【0009】
以下に添付図面を参照して、本発明の実施態様について詳細に説明する。本発明の性質及び目的についてより明確に理解するには、添付の図面に関連してなされる下記の詳細な説明を参照するのが良い。
【0010】
[定義]
以下に示す定義は、本発明の実施態様に関して解説される要素のいくつかに適用される。これらの定義は、さらに、本明細書において拡張される場合もある。
【0011】
本明細書において用いられる限りにおいて、「ある...」、「1つの...」、及び、「この...」といった単数形の用語には、文脈において明確に別段の指示がなければ、複数の対象が含まれる。従って、例えば、あるデータ・アナライザへの言及には、文脈において別段の指示がなければ、複数のデータ・アナライザが含まれる可能性がある。
【0012】
本明細書において用いられる限りにおいて、「組」という用語は、1つ以上の構成要素の集合を表わしている。従って、例えば、1組のデータ・ポイントには、単一データ・ポイントまたは複数データ・ポイントが含まれる可能性がある。組をなす構成要素は、その組のメンバと呼ばれる場合もあり得る。組をなす構成要素は、同じ場合もあれば、異なる場合もあり得る。実施態様によっては、組をなす構成要素は、1つ以上の共通特性を共有する場合もあり得る。
【0013】
本明細書において用いられる限りにおいて、「質量分析データ」という用語は、質量分析システムを利用して得られたデータを表わしている。質量分析データには、質量分析システムを利用して得られた「生」データ、こうした「生」データに基づいて導き出されたデータ、または、それらの組み合わせを含むことが可能である。従って、例えば、質量分析データには、質量分析システムを利用して得られる1組のスペクトルの形をとるデータを含むことが可能である。もう1つの例として、質量分析データには、1組のスペクトルに基づいて得られた1組のクロマトグラムの形をとるデータを含むことが可能である。
【0014】
本明細書において用いられる限りにおいて、「スペクトル」という用語は、質量電荷比の関数として表現された質量分析データを表わしている。場合によっては、スペクトルには、質量電荷比に基づいて構成された一連のデータ・ポイントを含むことも可能である。スペクトルの例には、質量スペクトル及び断片化スペクトルが含まれる。
【0015】
本明細書において用いられる限りにおいて、「クロマトグラム」という用語は、走査数または時間の関数として表現された質量分析データを表わしている。場合によっては、クロマトグラムには、走査数または時間に基づいて構成された一連のデータ・ポイントを含むことも可能である。クロマトグラムの例には、全イオン・クロマトグラム、基準ピーク・クロマトグラム、及び質量クロマトグラムが含まれる。
【0016】
本明細書において用いられる限りにおいて、「ピーク」という用語は、質量分析データの問題となる部分または関連部分を表わしている。一般に、ピークは、ある特定の検体の存在、その検体の量、または、その両方を表わす。クロマトグラムの場合、クロマトグラムに存在するピークは、「クロマトグラフ・ピーク」と呼ばれることもある。場合によっては、ピークに、一連のデータ・ポイントからの1組のデータ・ポイントを含めて、そのデータ・ポイントが、一連のデータ・ポイントに関連したベースラインに対する「正」の偏差を示すようにすることも可能である。ピークを構成する連続データ・ポイントの数は、ピークの「幅」と呼ばれる場合もある。従って、例えば、ピークには、ベースラインに対して「正」の偏差を示す複数の連続したデータ・ポイントを含むことが可能であり、従って、少なくとも2つのデータ・ポイント、一般には、3つ以上のデータ・ポイントである幅を含むことが可能である。ピークの包絡線及びベースラインによって形成される領域の範囲は、ピークの「面積」と称される場合もある。
【0017】
本明細書において用いられる限りにおいて、「ノイズ」という用語は、質量分析データの関心のない部分または無関係な部分を表わしている。ノイズは、データ処理による人為的影響、化学的不純物、周囲条件の変動、動作条件の変動、試料流中に存在する溶媒または溶媒系、及び、質量分析システムの検出器または他のコンポーネントの動作といった、多種多様な発生源に起因する可能性がある。ノイズの例には、バックグラウンド・ノイズ、ドリフト、及び、スパイクが含まれる。
【0018】
本明細書において用いられる限りにおいて、「スパイク」という用語は、質量分析データに存在する可能性のあるノイズ・タイプの1つである。場合によっては、スパイクに、一連のデータ・ポイントからの1組のデータ・ポイントを含めて、そのデータ・ポイントが、一連のデータ・ポイントに関連したベースラインに対する「正」の偏差を示すようにすることも可能である。スパイクを構成する連続データ・ポイントの数は、スパイクの「幅」と呼ばれる場合もある。スパイクは、その幅に関してピークと異なる可能性がある。すなわち、スパイクの幅は、一般に、ピークの幅より小さい。従って、例えば、スパイクには、ベースラインに対して「正」の偏差を示す単一の孤立したデータ・ポイントを含むことが可能であり、従って、データ・ポイント1つ分の幅を含むことが可能である。
【0019】
本明細書において用いられる限りにおいて、「整合フィルタ」という用語は、処理される信号の1組の既知特性または予測特性に基づいて決まるフィルタ・タイプの1つを表わしている。例えば、整合フィルタには、中心データ・ポイントの両側にいくつかのデータ・ポイントの加重和を与える1組の非ゼロ・フィルタ係数を含むことが可能である。従って、例えば、整合フィルタは、ゼロ加重中心データ・ポイントの両側のいくつかのデータ・ポイントに完全な重み付けを施すように決めることが可能である。完全な重み付けデータ・ポイント数に1を加えたものは、整合フィルタの「幅」と呼ばれる場合もあり、整合フィルタの幅は、検出されるピークの既知幅または予測幅に基づいて決めることが可能である。
【0020】
まず、図1に注目すると、この図には、本発明の実施態様の1つに従って実施される質量分析システム100が例示されている。例示の実施態様の場合、質量分析システム100は、複数段の質量分析を可能にする、タンデム型四重極質量分析計として実施されている。しかしながら、他のさまざまなやり方で質量分析システム100を実施して、複数段の質量分析が行えるようにすることも考慮されている。さらに、質量分析システム100の実施については、単一段の質量分析が行えるようにすることも考慮されている。
【0021】
図1に例示されるように、質量分析システム100には、イオンを生成する働きをするイオン源106が含まれている。例示の実施態様の場合、イオン源106は、エレクトロスプレー・イオン化(「ESI」)を利用してイオンを生成するように実施される。ESIの利点の1つは、HPLCのようなさまざまな分離手法に関連して容易に利用可能であるという点にある。しかしながら、イオン源106の実施については、マトリックス支援レーザ脱離イオン化(「MALDI」)、大気圧マトリックス支援レーザ脱離イオン化(「AP−MALDI」)といった、別のイオン化プロセスを用いてイオンを生成できるようにすることも考慮されている。
【0022】
図1に例示されるように、イオン源106は、試料流112中に存在する検体をイオン化する。例えば、試料流112には、適合する溶媒または溶媒系内に分散している生体分子を含むことが可能である。例示の実施態様の場合、試料流112は、HPLCカラムのようなクロマトグラフィ・カラム(図1には例示されていない)からイオン源106に、連続して、あるいは、絶え間なく送り込まれ、さらに詳細に後述するように、質量分析システム100によって、試料流112の順次溶離部分を検出することが可能になる。
【0023】
図1を参照すると、質量分析システム100には、イオン源106に対して下流に配置されて、イオンを与えられる質量分析器108も含まれている。質量分析器108は、質量電荷比に基づいてイオンを分離または選択する働きをする。質量分析器108は、質量分析システム100の特定の動作モードに基づいて、イオンの断片化を誘発して、プロダクト・イオンを生成する働きをすることも可能である。例示の実施態様の場合、質量分析器108は、1対の四重極質量フィルタ(図1には例示されていない)と、1対の四重極質量フィルタ間に配置することが可能な衝突室(図1には例示されていない)を用いて実施される。しかしながら、1対のイオン・トラップ装置、1対の磁場型質量分析計、1対の飛行時間装置、または、イオン・トラップ装置、磁場型質量分析計、四重極質量フィルタ、及び、飛行時間装置のうち異なるものによる組み合わせを用いるといった、他のさまざまなやり方で質量分析器108を実施できるようにすることも考慮されている。
【0024】
図1に例示のように、質量分析システム100には、質量分析器108に対して下流に配置され、イオンを供給される検出器110も含まれている。検出器110は、イオンの存在量を検出して、試料流112の1組のスペクトルを得る働きをする。検出器110は、電子増倍管、シンチレーション・カウンタ等を用いるといった、さまざまなやり方で実施することが可能である。
【0025】
図1を参照すると、質量分析システム100には、任意の有線または無線伝送チャネルを利用して、イオン源106、質量分析器108、及び、検出器110に接続されたデータ・アナライザ104も含まれている。データ・アナライザ104は、質量分析システム100を用いて収集した質量分析データを処理する働きをする。データ・アナライザ104によれば、質量分析データの処理が可能であり、正確度及び効率の向上した、ピークの検出及び特性解明が可能になるのが有利である。さらに、こうした正確度及び効率の向上によって、試料流112中に存在する検体の同定、並びに、検体から生じるイオン量の測定が容易になる。例示の実施態様の場合、データ・アナライザ104は、スパイク及び他のタイプのノイズからピークを弁別することが可能な技法に基づいて機能することにより、こうした正確度及び効率の向上を可能にする。有利なことには、この技法は、導関数を用いずに機能することが可能であり、従って、いくつかの従来の技法に関連したノイズに対する妨害排除能力が向上する。また、この技法は、自動化することが可能であり、従って、ユーザによる管理を必要とせずに、また、調整可能パラメータの手動選択を必要とせずに、機能することも可能である。さらに、この技法によれば、信号に基づく診断能力を高めることも可能である。
【0026】
図1に例示されるように、データ・アナライザ104は、本発明に解説される操作を実施する1組のモジュール114を含む。この1組のモジュール114は、コンピュータ・コード、ハードワイヤタイプの回路要素、または、コンピュータ・コードとハードワイヤタイプの回路要素の組み合わせを利用するといった、さまざまなやり方で実施することが可能である。データ・アナライザ104は、パーソナル・コンピュータ、サーバ・コンピュータ、ウェブ機器、携帯情報端末製品等のようなコンピュータ・デバイスを含むこともできるし、あるいは、それらと連係して動作することも可能であるように考慮されている。場合によっては、データ・アナライザ104は、ユーザがさまざまな処理オプションを指定できるようにするユーザ・インターフェイスとなることも可能である。
【0027】
図1を参照すると、1組のモジュール114には、質量分析システム100を用いて収集される質量分析データを処理して、クロマトグラムを導き出すクロマトグラム生成器116が含まれている。1組のモジュール114には、クロマトグラムに選択基準を適用して、クロマトグラムからデータ・ポイントを選択するデータ・ポイント・セレクタ118も含まれている。1組のモジュール114には、選択されたデータ・ポイントに弁別基準を適用して、クロマトグラムにおけるピークを検出するピーク弁別器120も含まれている。ピークは、試料流112中における検体の存在を表わしている可能性がある。図1に例示のように、1組のモジュール114には、さらに、ピーク面積を計算するピーク面積計算器122も含まれている。ピーク面積は、検体から生じるイオン量を表わしている可能性があり、イオン量は、同様に、試料流112内における検体量を表わしている可能性がある。
【0028】
上の説明から本発明の実施態様に関する一般的な概要が明らかになる。次に、図2に注目すると、本発明の実施態様の方法に従って実施可能な操作が例示されている。すなわち、図2には、質量分析データのピークを検出して、その特性を解明するために実施可能な操作が例示される。
【0029】
図2を参照すると、まず、1組のスペクトルに処理を施して、クロマトグラムが導き出される(ブロック200)。すなわち、試料流の逐次溶離部分を走査して、溶離部分から1組のスペクトルが得られる。この1組のスペクトルを記録し、処理することにより、全イオン・クロマトグラム、基準ピーク・クロマトグラム、または、質量クロマトグラムとすることが可能な、クロマトグラムが導き出される。例示の実施態様の場合、クロマトグラムには、走査数または時間に基づいて配列された一連のデータ・ポイントが含まれている。
【0030】
図3には、本発明の実施態様の1つに従って処理可能なクロマトグラム300の一例が示されている。図3に例示のように、クロマトグラム300には、走査数に基づいて配列された一連のデータ・ポイントが含まれている。ここで、一連のデータ・ポイントのうちの各データ・ポイントには、ある特定の走査数に関する存在量または強度を表わす大きさが含まれている。クロマトグラム300には、ギザギザのピーク302が含まれているが、これは、走査数「130」に中心が位置し、問題となるある特定の検体を表わしている。ギザギザのピーク302には、走査数99に中心が位置するスパイク304を含むノイズに対応する、いくつかのデータ・ポイントが先行及び後続している。この図示例において、ギザギザのピーク302には、一連のデータ・ポイントに関連した典型的な変動範囲に対して「正の」偏差を示す、複数の連続データ・ポイントが含まれており、一方、スパイク304には、この典型的な変動範囲に対して「正の」偏差を示す、単一の孤立データ・ポイントが含まれている。
【0031】
再度図2を参照すると、次に、クロマトグラムに選択基準を適用して、クロマトグラムからデータ・ポイントが選択される(ブロック202)。すなわち、選択基準を適用して、問題となる可能性のあるデータ・ポイント、すなわち、ピーク、スパイク、または、その両方に対応する可能性のあるデータ・ポイントが選択される。この図示例では、選択基準を利用し、データ・ポイントの大きさに基づいてデータ・ポイントが選択される。有利なことには、一連の再配列データ・ポイントを導き出すと、データ・ポイントの選択が容易になる。一連の再配列データ・ポイントは、さらに後述するように、さらなる利点をもたらす。
【0032】
図4には、本発明の実施態様の1つに従って、図3のクロマトグラム300から導き出された一連の再配列データ・ポイントが例示されている。図4に例示のように、一連の再配列データ・ポイントは、最大から最小へと、大きさに基づいてクロマトグラム300からのデータ・ポイントを配列または分類して導き出される。ここで、クロマトグラム300の各データ・ポイントについて、最大の大きさをなすデータ・ポイントには、1の大きさ順位が割り当てられ、二番目に大きい大きさをなすデータ・ポイントには、2の大きさ順位が割り当てられ、...といったように、大きさ順位が割り当てられる。図4に例示のように、一連の再配列データ・ポイントによって、問題となる可能性のあるデータ・ポイント、すなわち、最大の大きさをなすデータ・ポイントの識別が容易になる。この図示の例では、大きさによる上位12のデータ・ポイントは、ピーク、スパイク、または、その両方に対応する可能性のあるデータ・ポイントを構成している。
【0033】
再度図2を参照すると、一連の再配列データ・ポイントが導き出されると、その一連の再配列データ・ポイントからデータ・ポイントが選択されることが理解される。すなわち、下方しきい値に対するデータ・ポイントの大きさに基づいて、データ・ポイントが選択される。このようにして、最大の大きさをなすデータ・ポイントを識別することが可能になる。一般に、下方しきい値は、絶対的に、相対的に、または、その両方でといった、さまざまなやり方で規定することが可能である。従って、例えば、下方しきい値は、ある特定の制限値に基づくといったように、絶対的に規定することが可能であり、これにより、下方しきい値以上の大きさをなすデータ・ポイントを識別できるようになる。もう1つの例では、下方しきい値は、大きさに関して上位nのデータ・ポイントに基づくといったように、相対的に規定することが可能であり、これにより、クロマトグラムからの残りのデータ・ポイントの大きさを超える大きさをなすデータ・ポイントを識別できるようになる。
【0034】
有利なことには、下方しきい値は、一連の再配列データ・ポイントの統計に基づいて規定することが可能であり、これにより、信号に基づく診断能力が向上する。すなわち、下方しきい値は、クロマトグラムに関連した典型的な変動範囲を表わすことが可能であり、推定ベースライン値に推定ノイズ振幅値を加えた値に基づいて規定することが可能である。推定ベースライン値及び推定ノイズ振幅値は、さまざまな方法で求めることが可能である。例えば、一連の再配列データ・ポイントの中央値をなす領域に線形回帰分析を施して、回帰線を導き出すことが可能である。統計分析を実施して、その領域の適合性を検証するか、または、異なる領域を選択して、回帰線を導き出すことが可能である。回帰線に沿ったある特定の振幅によって、推定ベースライン値を表わすことが可能であり、回帰線の勾配によって、推定ノイズ振幅値を表わすことが可能である。回帰線の上方への偏差は、ピークまたはスパイクに相当する可能性があり、一方、もしあれば、回帰線より下方への偏差は、負の外乱または欠測値に相当する可能性がある。所望の場合、推定ノイズ振幅値は、クロマトグラムを構成する一連のデータ・ポイントのうちの1組の非隣接領域から標準偏差、高次モーメント、及び、極値を測定することによって精密化することが可能である。場合によっては、精密化されたノイズ振幅値に、適切なベースライン領域、すなわち、ドリフトがほとんどまたは全くなく、ピークまたはスパイクに対応する可能性のあるデータ・ポイントのないベースライン領域からの標準偏差の平均値を含むことが可能である。
【0035】
図2に例示されるように、次に、データ・ポイントに弁別基準を適用して、クロマトグラムにおける1組のピークが検出される(ブロック204)。すなわち、弁別基準は、選択基準を用いて選択されたデータ・ポイントに適用される。例示の実施態様の場合、弁別基準を利用して、スパイクまたは他のタイプのノイズに対応するデータ・ポイントからピークに対応するデータ・ポイントが弁別される。有利なことには、この弁別基準を利用すると、導関数を用いることを必要とせずに、スパイクからピークを弁別することが可能になり、これにより、ノイズに対する妨害排除能力が高められる。また、さらに後述するように、弁別基準は一連の再配列データ・ポイントの統計に基づいて規定することが可能であり、これにより、信号ベースの診断能力が向上する。
【0036】
例示の実施態様の場合、整合フィルタは、クロマトグラムにおけるピークの検出を可能にするように決められる。一般に、整合フィルタは、さまざまな方法で決めることが可能である。例えば、整合フィルタは、クロマトグラムにおける中心データ・ポイントの両側にいくつかのデータ・ポイントの加重和を与える、1組の非ゼロ・フィルタ係数を含むことが可能である。すなわち、整合フィルタは、[1,0,1]、[1,1,0,1,1]、または、[1,1,1,0,1,1,1]の値を備えるフィルタ係数を用いるといったように、ゼロ加重中心データ・ポイントの両側のいくつかのデータ・ポイントに完全な重み付けを施すように、対称性にすることが可能である。完全な重み付けデータ・ポイント数に1を加えたものは、整合フィルタの「幅」と呼ばれる場合もあり、整合フィルタの幅は、ピークの予測幅に一致するか、または、整合するように決めることが可能である。次に、データ・ポイントの加重和からオフセット値を引くことによって、整合フィルタの出力が求められる。オフセット値は、推定ベースライン値と、完全な重み付けデータ・ポイント数に1をわずかに超える数を足した値とを掛け合わせた値に基づいて得ることが可能である。従って、例えば、幅が5の整合フィルタの出力は、次のように求めることが可能である。
出力=DPt−2+DPt−1+DP+DPt+1+DPt+2−(4推定ベースライン値m)
(1)
ここで、DPt−2は、走査数または時間t−2におけるデータ・ポイントを表わし、DPt−1は、走査数または時間t−1におけるデータ・ポイントを表わし、DPは、走査数または時間tにおける中心データ・ポイントを表わし、DPt+1は、走査数または時間t+1におけるデータ・ポイントを表わし、DPt+2は、走査数または時間t+2におけるデータ・ポイントを表わし、mは、1.1または1.2のような1を超える任意の数である。ベースライン領域に適用されると、整合フィルタの出力は負になる。中心データ・ポイントにスパイクが存在する場合、整合フィルタの出力は、やはり負になる。しかしながら、ピークの頂点が、中心データ・ポイントとして存在する場合、整合フィルタの出力は正になる。一般に、ピークを構成する別のデータ・ポイントが、中心データ・ポイントとして存在する場合、整合フィルタの出力は、やはり正になる。
【0037】
いったん得られると、整合フィルタは、整合フィルタの中心データ・ポイントとして最大の大きさをなすデータ・ポイントから始めて、一連の再配列データ・ポイントに適用される。データ・ポイントがスパイクに対応すると判定されると、このデータ・ポイントは、それ以上の検討から除外され、一連の再配列データ・ポイント内における次のデータ・ポイントが評価される。一方、データ・ポイントがピークの頂点に対応すると判定されると、クロマトグラムにおけるそのデータ・ポイントの両側のデータ・ポイントが、整合フィルタを用いて評価される。このようにして、ピークの境界並びにピーク幅を決定することができる。次に、ピークに対応するデータ・ポイントが、さらなる検討から除外され、上述のように、一連の再配列データ・ポイント内における次のデータ・ポイントが評価される。評価は、一連の再配列データ・ポイント内における残りのデータ・ポイントが、下方しきい値を下回る大きさになるまで続行される。整合フィルタの幅とピーク幅との間に不整合が生じると(または、ピークが検出されない場合)、それに応じて、整合フィルタの幅を調整することが可能であり、上述の操作を繰り返すことが可能である。整合フィルタの非対称性またはオフセット値については、ピーク特性に基づいて(または、ピークが検出されない場合)、調整することができるようにも考慮されており、上述の操作を繰り返すことが可能である。
【0038】
図2に例示されるように、次に、クロマトグラムに回帰分析を適用して、ベースラインが導き出される(ブロック206)。すなわち、ピークの探索が完了し、少なくとも1つのピークが検出されると、適切なベースライン領域、すなわち、ドリフトがほとんどまたは全くなく、ピークまたはスパイクに対応する可能性のあるデータ・ポイントのない、ベースライン領域が識別される。すなわち、これらの適切なベースライン領域には、下方しきい値未満の大きさをなす、一連の再配列データ・ポイント内のデータ・ポイントが含まれる可能性がある。これらの適切なベースライン領域は、これらの適切なベースライン領域に関する整合フィルタ出力の評価に基づいて識別できるようにも考慮されている。全体として、これらの適切なベースライン領域に対して回帰分析及び他のタイプの統計分析を施し、これによって、ベースラインとしての利用に関するその平坦性及び適性の全般的評価を行うことが可能である。次に、これら適切なベースライン領域を各検出ピークに隣接した領域に細分することが可能である。これらの隣接領域に対して回帰分析及び他のタイプの統計分析を施して、ベースラインとしての利用に関するその平坦性及び適性の順位付けを行うことが可能である。このようにして、あるピークの両側における隣接領域を選択することが可能になり、結果得られる回帰線は、そのピークに関するベースラインの働きをすることが可能になる。
【0039】
図5には、本発明の実施態様の1つに従ってベースライン500を重ね合わせた、図3のクロマトグラム300が例示されている。すなわち、図5には、ギザギザのピーク302に関して導き出されたベースライン500と共に、ギザギザのピーク302をなすクロマトグラム300の一部が例示されている。この図示例では、ベースライン500を導き出すために、ギザギザのピーク302に先行するデータ・ポイント及び後続するデータ・ポイントのいくつかが、その平坦性及び適性に基づいて選択されている。
【0040】
再度図2を参照すると、各検出ピークの面積が、そのピークに関して導き出されたベースラインに基づいて計算される(ブロック208)。ピーク面積の計算は、さまざまな数値積分手法の任意の1つを用いるといった、さまざまな方法で実施可能である。図5を参照すると、例えば、ギザギザのピーク302の面積は、ギザギザのピーク302の包絡線とベースライン500によって決まり、数値積分法を利用して計算することが可能である。
【0041】
当然明らかなように、上述の本発明の実施態様は、一例として提示されたものであり、本発明には、他のさまざまな実施態様が包含される。例えば、いくつかの操作は、クロマトグラムに関連して実施されるように解説されたが、これらの操作は、他のタイプの質量分析データに関連して実施できるようにも考慮されている。また、好都合なことには、これらの操作を利用して、さまざまな他のタイプの信号におけるピークの検出及び特性解明を行えるようにも考慮されている。
【0042】
本発明の実施態様の1つは、1組のコンピュータで実行される操作を実施するためのコンピュータ・コードまたは実行可能命令を含んでいる、コンピュータ可読媒体を備えたコンピュータ記憶製品に関するものである。この媒体及びコンピュータ・コードは、特に、本発明の目的に合わせて設計及び構成されたものとすることもできるし、あるいは、コンピュータ・ソフトウェア技術における通常の技術者にとって周知であり、利用可能な種類のものとすることも可能である。コンピュータ可読媒体の例には、ハード・ディスク、フロッピ・ディスク、及び、磁気テープのような磁気媒体、コンパクト・ディスク読み取り専用メモリ(「CD−ROM」)及びホログラフィック・デバイスのような光媒体、フロプティカル・ディスクのような光磁気媒体、及び、特定用途向け集積回路(「ASIC」)、プログラマブル論理回路(「PLD」)、読み取り専用メモリ(「ROM」)素子、及び、ランダム・アクセス・メモリ(「RAM」)素子のような、特に、コンピュータ・コードを記憶し実行するように構成されたハードウェア・デバイスが含まれる。コンピュータ・コードの例には、コンパイラによって生成されるような機械コード、及び、インタプリタを利用するコンピュータによって実行される高水準コードを含むファイルが含まれる。例えば、本発明の実施態様の1つは、Java(登録商標)、C++、または、他のオブジェクト指向プログラミング言語、及び、開発ツールを用いて実施することが可能である。コンピュータ・コードのさらなる例には、暗号化コード及び圧縮コードが含まれる。さらに、本発明の実施態様の1つは、伝送チャネルを介して、搬送波または他の伝搬媒体で具現化可能なデータ信号によって、遠隔コンピュータから要求側コンピュータに転送可能な、コンピュータ・プログラム・プロダクトとしてダウンロードすることが可能である。従って、本明細書において用いられる限りにおいて、搬送波は、コンピュータ可読媒体とみなすことが可能である。本発明のもう1つの実施態様は、コンピュータ・コードの代わりに、または、それと組み合わせて、ハードワイヤタイプの回路要素で実施可能である。
【0043】
上述の実施形態に即して本発明を説明すると、本発明は、試料流(112)をイオン化するためのイオン源(106)と、該イオン源(106)に対して下流に配置されて、前記試料流(112)の質量分析データを収集するための検出器(110)と、該検出器(110)に接続されていて、前記質量分析データに処理を施して、クロマトグラムを導き出すクロマトグラム生成器(116)、前記クロマトグラムに選択基準を適用して、前記クロマトグラムからデータ・ポイントを選択するためのデータ・ポイント・セレクタ(118)、及び前記データ・ポイントに弁別基準を適用して、前記試料流(112)内におけるある検体の存在を表す、前記クロマトグラムにおけるピークを検出するためのピーク弁別器(120)を有するデータ・アナライザ(104)とを備えることを特徴とする質量分析システム(100)を提供する。
【0044】
好ましくは、前記クロマトグラムは、全イオン・クロマトグラム、基準ピーク・クロマトグラム、及び質量クロマトグラムの1つに対応するようにされる。
【0045】
好ましくは、前記データ・ポイント・セレクタ(118)は、前記選択基準を適用して、前記データ・ポイントの大きさに基づいて前記データ・ポイントを選択するように構成される。
【0046】
好ましくは、前記ピーク弁別器(120)は、整合フィルタを適用して、前記データ・ポイントから前記ピークに対応する第1の組をなすデータ・ポイントを識別するように構成される。
【0047】
好ましくは、前記ピーク弁別器(120)は、前記整合フィルタを適用して、前記データ・ポイントからスパイクに対応する第2の組をなすデータ・ポイントを識別するように構成される。
【0048】
好ましくは、前記データ・アナライザ(104)は、さらに、前記ピークの面積を計算するためのピーク面積計算器(122)を含み、前記ピーク面積は、前記検体から生じるイオン量をあらわす。
【0049】
好ましくは、前記データ・ポイントは、前記クロマトグラムからの第1のデータ・ポイントに対応し、前記ピーク面積計算器(122)は、前記クロマトグラムからの第2のデータ・ポイントに分析を加えて、ベースラインを導き出すように構成される。
【0050】
さらに、本発明は、データ・ポイントの大きさに基づいてクロマトグラムから前記データ・ポイントを選択するための第1のコードと、前記データ・ポイントに弁別基準を適用して、前記クロマトグラム内のある検体の存在を表わしたピークを検出するための第2コードが含まれることを特徴とする、質量分析システム(100)のためのコンピュータ可読媒体を提供する。
【0051】
好ましくは、前記クロマトグラムは、一連のデータ・ポイントを含み、前記第1のコードは、下方しきい値に対する前記データ・ポイントの大きさに基づいて、前記一連のデータ・ポイントから前記データ・ポイントを選択するための第3のコードを含む。
【0052】
好ましくは、前記クロマトグラムは、一連のデータ・ポイントを含み、前記第1のコードは、前記一連のデータ・ポイントからの残りのデータ・ポイントの大きさに対する前記データ・ポイントの大きさに基づいて、前記一連のデータ・ポイントから前記データ・ポイントを選択するための第4のコードを含む。
【0053】
好ましくは、前記一連のデータ・ポイントは、走査数及び時間の一方に基づいて配列され、前記一連のデータ・ポイントから前記データ・ポイントを選択するための前記第4のコードは、大きさに基づいて前記一連のデータ・ポイントを配列し、一連の再配列データ・ポイントを導き出すための第5のコードと、前記一連の再配列データ・ポイントから前記データ・ポイントを選択するための第6のコードとを含む。
【0054】
好ましくは、前記第2のコードは、前記データ・ポイントに整合フィルタを適用するための第7のコードを含む。
【0055】
好ましくは、前記第2のコードは、前記データ・ポイントから、前記ピークに対応する第1の組をなすデータ・ポイントを識別するための第8のコードを含む。
【0056】
好ましくは、前記第2のコードは、さらに、前記データ・ポイントから、スパイクに対応する第2の組をなすデータ・ポイントを識別するための第9のコードを含む。
【0057】
好ましくは、前記データ・ポイントは、前記クロマトグラムからの第1のデータ・ポイントに対応し、前記コンピュータ可読媒体は、さらに、前記クロマトグラムからの第2のデータ・ポイントに回帰分析を施して、ベースラインを導き出すための第10コードと、前記ベースラインに基づいて、前記検体の量を表した前記ピーク面積を計算するための第11のコードを含む。
【0058】
さらに、本発明は、質量分析データの処理方法であって、一連のデータ・ポイントに基づいて整合フィルタを規定する第1の工程と、前記一連のデータ・ポイントに前記整合フィルタを適用して、前記一連のデータ・ポイントから、ある検体の存在を表わしたピークに対応する、第1の組をなすデータ・ポイントを識別する第2の工程とを有することを特徴とする処理方法を提供する。
【0059】
好ましくは、前記整合フィルタの幅は、予測ピーク幅に対応する。
【0060】
好ましくは、前記第1の工程である前記整合フィルタを規定する工程は、前記一連のデータ・ポイントに基づいて、前記整合フィルタのオフセット値を導き出す工程を含む。
【0061】
好ましくは、前記オフセット値は、前記一連のデータ・ポイントに関連した推定ベースライン値を含む。
【0062】
好ましくは、前記第2の工程である前記整合フィルタを適用する工程は、前記一連のデータ・ポイントから、スパイクに対応する第2の組をなすデータ・ポイントを識別する工程を含む。
【0063】
さらに、前記データ・ポイントの大きさに基づいて、前記一連のデータ・ポイントからデータ・ポイントを選択する工程を含み、前記第2の工程である前記整合フィルタを適用する工程は、前記データ・ポイントに前記整合フィルタを適用して、前記一連のデータ・ポイントから、ピークに対応する、前記第1の組をなすデータ・ポイントを識別する工程を含む。
【0064】
本発明について、その特定の実施態様に関連して説明してきたが、当該技術者には当然明らかなように、添付の特許請求の範囲によって決められる本発明の真の精神及び範囲を逸脱することなく、さまざまな変更を加え、均等物に置き換えることが可能である。さらに、ある特定の状況、材料、組成物、方法、1つまたは複数の操作を、本発明の目的、精神、及び範囲に適応させるため、多くの変更を施すことも可能である。こうした変更は、全て、特許請求の範囲内に含まれるものとする。すなわち、本明細書に開示の方法は、特定の順番に実施される特定の操作に関連して解説されてきたが、もちろん、本発明の教示を逸脱することなく、これらの操作を組み合わせるか、細分するか、あるいは、その順番を換えて、同等の方法を生成することも可能である。従って、本明細書において特に指示のない限り、操作の順序及びグループ化は、本発明を制限するものではない。
【図面の簡単な説明】
【0065】
【図1】本発明の実施態様の1つに従って実施される質量分析システムのブロック図である。
【図2】本発明の実施態様の1つの方法に従って実施される操作を例示した図である。
【図3】本発明の実施態様の1つに従って処理することが可能なクロマトグラムの一例を示す図である。
【図4】本発明の実施態様の1つに従って、図3のクロマトグラムから導き出される一連の再配列データ・ポイントを例示した図である。
【図5】本発明の実施態様の1つに従って、ベースラインが重ね合わされた、図3のクロマトグラムである。
【符号の説明】
【0066】
100 質量分析システム
104 データ・アナライザ
106 イオン源
110 検出器
112 試料流
116 クロマトグラム生成器
118 データ・ポイント・セレクタ
120 ピーク弁別器
122 ピーク面積計算器


【特許請求の範囲】
【請求項1】
試料流をイオン化するためのイオン源と、
該イオン源に対して下流に配置されて、前記試料流の質量分析データを収集するための検出器と、
該検出器に接続され、前記質量分析データに処理を施してクロマトグラムを導き出すクロマトグラム生成器、前記クロマトグラムに選択基準を適用して前記クロマトグラムからデータ・ポイントを選択するためのデータ・ポイント・セレクタ、及び前記データ・ポイントに弁別基準を適用して前記試料流内におけるある検体の存在を表す前記クロマトグラムにおけるピークを検出するためのピーク弁別器を有するデータ・アナライザとを備えることを特徴とする質量分析システム。
【請求項2】
前記クロマトグラムは、全イオン・クロマトグラム、基準ピーク・クロマトグラム、及び質量クロマトグラムの1つに対応することを特徴とする、請求項1に記載の質量分析システム。
【請求項3】
前記データ・ポイント・セレクタは、前記選択基準を適用して前記データ・ポイントの大きさに基づいて前記データ・ポイントを選択するように構成されることを特徴とする、請求項1に記載の質量分析システム。
【請求項4】
前記ピーク弁別器は、整合フィルタを適用して前記データ・ポイントから前記ピークに対応する第1の組をなすデータ・ポイントを識別するように構成されることを特徴とする、請求項1に記載の質量分析システム。
【請求項5】
前記ピーク弁別器は、前記整合フィルタを適用して前記データ・ポイントからスパイクに対応する第2の組をなすデータ・ポイントを識別するように構成されることを特徴とする、請求項4に記載の質量分析システム。
【請求項6】
前記データ・アナライザは、さらに、前記ピークの面積を計算するためのピーク面積計算器を含むことと、前記ピーク面積は、前記検体から生じるイオン量をあらわすことを特徴とする、請求項1に記載の質量分析システム。
【請求項7】
前記データ・ポイントは、前記クロマトグラムからの第1のデータ・ポイントに対応することと、前記ピーク面積計算器は、前記クロマトグラムからの第2のデータ・ポイントに分析を加えて、ベースラインを導き出すように構成されることを特徴とする、請求項6に記載の質量分析システム。
【請求項8】
データ・ポイントの大きさに基づいてクロマトグラムから前記データ・ポイントを選択するための第1のコードと、
前記データ・ポイントに弁別基準を適用して、前記クロマトグラム内のある検体の存在を表わしたピークを検出するための第2コードが含まれていることを特徴とする、質量分析システムのためのコンピュータ可読媒体。
【請求項9】
前記クロマトグラムは、一連のデータ・ポイントを含み、前記第1のコードは、下方しきい値に対する前記データ・ポイントの大きさに基づいて前記一連のデータ・ポイントから前記データ・ポイントを選択するための第3のコードを含むことを特徴とする、請求項8に記載のコンピュータ可読媒体。
【請求項10】
前記クロマトグラムは、一連のデータ・ポイントを含み、前記第1のコードは、前記一連のデータ・ポイントからの残りのデータ・ポイントの大きさに対する前記データ・ポイントの大きさに基づいて前記一連のデータ・ポイントから前記データ・ポイントを選択するための第4のコードを含むことを特徴とする、請求項8に記載のコンピュータ可読媒体。
【請求項11】
前記一連のデータ・ポイントは、走査数及び時間の一方に基づいて配列され、前記一連のデータ・ポイントから前記データ・ポイントを選択するための前記第4のコードが、
大きさに基づいて前記一連のデータ・ポイントを配列し、一連の再配列データ・ポイントを導き出すための第5のコードと、
前記一連の再配列データ・ポイントから前記データ・ポイントを選択するための第6のコードとを含むことを特徴とする、請求項10に記載のコンピュータ可読媒体。
【請求項12】
前記第2のコードは、前記データ・ポイントに整合フィルタを適用するための第7のコードを含むことを特徴とする、請求項8に記載のコンピュータ可読媒体。
【請求項13】
前記第2のコードは、前記データ・ポイントから、前記ピークに対応する第1の組をなすデータ・ポイントを識別するための第8のコードを含むことを特徴とする、請求項8に記載のコンピュータ可読媒体。
【請求項14】
前記第2のコードは、さらに、前記データ・ポイントから、スパイクに対応する第2の組をなすデータ・ポイントを識別するための第9のコードを含むことを特徴とする、請求項13に記載のコンピュータ可読媒体。
【請求項15】
前記データ・ポイントは、前記クロマトグラムからの第1のデータ・ポイントに対応し、前記コンピュータ可読媒体は、さらに、前記クロマトグラムからの第2のデータ・ポイントに回帰分析を施して、ベースラインを導き出すための第10コードと、前記ベースラインに基づいて、前記検体の量を表した前記ピーク面積を計算するための第11のコードを含むことを特徴とする、請求項8に記載のコンピュータ可読媒体。
【請求項16】
質量分析データの処理方法であって、
一連のデータ・ポイントに基づいて整合フィルタを規定する第1の工程と、
前記一連のデータ・ポイントに前記整合フィルタを適用して、前記一連のデータ・ポイントから、ある検体の存在を表わしたピークに対応する、第1の組をなすデータ・ポイントを識別する第2の工程とを有することを特徴とする処理方法。
【請求項17】
前記整合フィルタの幅は、予測ピーク幅に対応することを特徴とする、請求項16に記載の方法。
【請求項18】
前記第1の工程である前記整合フィルタを規定する工程は、前記一連のデータ・ポイントに基づいて前記整合フィルタのオフセット値を導き出す工程を含むことを特徴とする、請求項16に記載の方法。
【請求項19】
前記オフセット値は、前記一連のデータ・ポイントに関連した推定ベースライン値を含むことを特徴とする、請求項18に記載の方法。
【請求項20】
前記第2の工程である前記整合フィルタを適用する工程は、前記一連のデータ・ポイントから、スパイクに対応する第2の組をなすデータ・ポイントを識別する工程を含むことを特徴とする、請求項16に記載の方法。
【請求項21】
さらに、前記データ・ポイントの大きさに基づいて、前記一連のデータ・ポイントからデータ・ポイントを選択する工程を含み、前記第2の工程である前記整合フィルタを適用する工程は、前記データ・ポイントに前記整合フィルタを適用して、前記一連のデータ・ポイントから、ピークに対応する、前記第1の組をなすデータ・ポイントを識別する工程を含むことを特徴とする、請求項16に記載の方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2007−5303(P2007−5303A)
【公開日】平成19年1月11日(2007.1.11)
【国際特許分類】
【出願番号】特願2006−170454(P2006−170454)
【出願日】平成18年6月20日(2006.6.20)
【出願人】(399117121)アジレント・テクノロジーズ・インク (710)
【氏名又は名称原語表記】AGILENT TECHNOLOGIES, INC.
【住所又は居所原語表記】395 Page Mill Road Palo Alto,California U.S.A.
【Fターム(参考)】