複合混合物の化学成分の組成を決定するためのシステム、方法、及びコンピュータ読み取り可能な媒体
複合混合物の化学成分の組成を決定するためのシステム、方法、及びコンピュータ読み取り可能な媒体が開示される。一の態様によれば、複合混合物の化学成分の組成の決定方法は、分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、ここで分離データはピーク情報を含み、かつ質量分析データは1次及び2次質量分析データを含む。生成された分離及び質量分析データを含む解析結果は収集及び格納される。解析結果を化学物質の特性を示す情報のライブラリと比較することにより、サンプルの化学成分が決定され、比較は分離及び質量分析データに基づいている。情報のライブラリは分離技術及び質量分析装置によって生成されるデータを含み、さらに同定され又は同定されていない化学物質の分離及び質量分析データを含む。サンプルの化学成分の表示は、人間がアクセス可能な形で利用できるようになされる。
【発明の詳細な説明】
【技術分野】
【0001】
(関連する出願)
本出願は、2008年1月16日出願の米国仮特許出願No. 61/021,508;2008年11月14日出願の米国仮特許出願No. 61/114,869、及び2008年12月3日出願の米国特許出願No.12/327,758の利益を主張し、その開示は参照することにより全体が本書に援用される。
【0002】
本書に記述される主題は、複合(complex)混合物の化学成分の組成を決定するためのシステム及び方法に関する。
【背景技術】
【0003】
複合混合物の化学成分の組成を決定する能力は、「この物質は何から作られているか?」といった質問に従来の化学分析によって答えることを含み、さらに「どのように健康な細胞は病気の細胞から異なるのか?」、「どのようにこの薬は細胞過程に影響するのか?」、「どのようにして培養細胞の成長を最適化できるか?」及び「何がこのバイオプロセスの制限因子か?」といった生物学的プロセスのより高度な分析を可能とする、広範で非常に有用な応用を有する。
【0004】
複合混合物の分析に従来から使用される技術は、クロマトグラフィー及び質量分析法を含む。クロマトグラフィーは、それによって複合混合物が成分に分かれる技術である。質量分析は、多くの異なる化学成分を含むサンプルがイオン化される技術であり、イオン化された化学成分は電磁場に曝され、電磁場は化学成分をそれらの質量-電荷(m/z)比に従って分離する。クロマトグラフィー及び質量分析は複合混合物を構成成分に分離するものの、いずれの技術も化学成分の直接同定を提供しない。化学成分の識別(identity)は、化学成分の測定された特性の解析に基づいて決定される必要がある。
【0005】
本書で用いられる用語"分離"は、複合混合物をその構成分子又は代謝産物に分離するプロセスをいう。一般の実験室の分離技術は、電気泳動及びクロマトグラフィーを含む。
【0006】
本書で用いられる用語"クロマトグラフィー"は、分離される成分(すなわち、化学成分)が2つの相の間に分布する物理的な分離方法をいい、2つの相の1つは静止する(固定相)一方、他(移動相)は一定の方向に移動する。クロマトグラフィーの出力データは、本書の主題の実施形態で操作のため使用されるであろう。
【0007】
本書で用いられる用語"保持時間"は、クロマトグラフィープロセスでサンプルを分離装置に導入してからの経過時間をいう。サンプルの成分の保持時間は、サンプルを分離装置に注入した時間と、固定相を含む分離装置の一部にサンプルの成分が溶出する(例えば、分離装置の一部から出る)時間との間の、クロマトグラフィープロセスでの経過時間をいう。
【0008】
本書で用いられる用語であるサンプル成分の"保持指数(index)"は、補間によって得られる(通常は対数の)数をいう。この数は、サンプル成分の保持時間又は保持因子を、サンプル成分のピークの前と後に溶出する標準(standards)の保持時間に関連し、系統誤差を除去するため既知の標準の分離特性を使用する機構である。
【0009】
本書で用いられる用語"分離指数(index)"は、分離技術によって分離された化学成分に関連付けられた計量(metric)をいう。クロマトグラフの分離技術に対しては、分離指数は保持時間又は保持指数であってよい。非クロマトグラフの分離技術に対しては、分離指数は化学成分によって移動された物理的な距離であってよい。
【0010】
本書で用いられる用語"分離情報"及び"分離データは、分離指数に関して化学成分の存在又は不在を示すデータをいう。例えば、分離データは、特定の時間に溶出する特定の質量を有する化学成分の存在を示してよい。分離データは、時間とともに上昇し、ピークに達し、その後に下降する、化学成分の溶出量を示してよい。分離指数(例えば、時間)にわたってプロットされる化学成分の存在のグラフは、グラフのピークを示すであろう。このようにして、分離データの文脈内で、用語"ピーク情報"及び"ピークデータ"は、用語"分離情報"及び"分離データ"と同義である。
【0011】
本書で用いられる用語"質量分析"(MS)は、標的(target)分子をイオン化、又はイオン化及び断片化(fragmenting)し、その後、それらの質量/電荷比に基づいてイオンを分析し、"分子の指紋"として機能する質量スペクトルを生成することを含む、分子を測定及び分析するための技術をいう。対象物の質量/電荷比の決定は、その対象物によって電磁エネルギーが吸収される波長を決定することで行われてよい。イオンの質量-電荷比を決定するためのいくつかの一般的に使用される方法があり、いくつかはイオンの軌跡と電磁波との相互作用を測定し、他は、イオンが特定の距離を移動するのにかかる時間、又はその両方を測定する。標的分子の同定を得るため、これらのフラグメントの質量測定からのデータがデータベースと対照して(against)検索されることができる。質量分析は又、他の多くの間で、石油化学又は医薬品の品質管理のような化学の他の分野で広く使用される。
【0012】
本書で用いられる用語"質量分析計"は、質量分析装置内で、イオンの混合物をそれらの質量-電荷比によって分離する機器をいう。
【0013】
本書で用いられる用語"ソース(source)"は、質量分析装置内で、分析されるサンプルをイオン化する機器をいう。
【0014】
本書で用いられる用語"検出器"は、質量分析装置内で、イオンを検出する機器をいう。
【0015】
本書で用いられる用語"イオン"は、例えばその対象物に電子を追加し、又は電子を取り除くことで形成される、電荷を有するあらゆる対象物をいう。
【0016】
本書で用いられる用語"質量スペクトル"は、質量分析装置によって生成されたデータのプロットをいい、典型的にはx軸上のm/z値及びy軸上の強度値を含む。
【0017】
本書で用いられる用語"m/z"は、イオンの質量数をその電荷数で割ることによって生成される無次元量をいう。それは長い間"質量-電荷"比と呼ばれていた。
【0018】
本書で用いられる用語"スキャン"は、特定の分離指数に関連付けられた質量スペクトルをいう。例えば、クロマトグラフの分離技術を使用するシステムは、個々のスキャンが異なる保持時間における複数のスキャンを生成する。
【0019】
本書で用いられる用語"サンプル"はその広い意味で使用され、天然又は合成起源の標本又は培養物を含んでよい。
【0020】
本書で用いられる用語"生体サンプル"は、培養細胞、培養物及び発酵培地メディアと同様、植物、菌、又は人間を含む動物、流体、固体(例えば便)又は組織、酪農品、穀物、野菜、肉及び肉の副産物、並びに廃棄物のような液体及び固体食品並びに飼料製品及び原料をいう。生体サンプルは、野生動物及び野獣と同様、すべての様々な家畜の科(family)から得ることができ、有蹄動物、熊、魚、うさぎ(lagamorph)、齧歯動物のような動物を含むがこれらに限定されない。生体サンプルは、あらゆる生物材料を含んでよく、対象からの細胞及び/又は非細胞材料を含んでよい。サンプルは、任意の適切な生体組織、又は、例えば前立腺組織、血液、血漿、尿、又は脳脊髄液(CSF)のような体液から分離されることができる。
【0021】
本書で用いられる用語"環境試料"は、表面物質、土壌、水及び産業サンプルのような環境材料の他、食品及び乳製品加工機器、装置、機器、器具、使い捨て及び使い捨てでないアイテムから得られるサンプルをいう。これらの例は、本書の主題に適用可能なサンプルの種類を制限するものとして解釈されない。
【0022】
クロマトグラフがサンプルを化学成分に分離し、それが質量分析装置のイオン源に供給されるような、液体又はガスクロマトグラフの出力を質量分析装置の入力に結合させるシステムが存在する。従来のシステムは、質量スペクトルデータのライブラリ(library)に対して記録された質量スペクトルの適合解析を実行することにより、得られた質量スペクトルを解析する。しかし、この方法は、いくつかの欠陥を被る。
【発明の概要】
【発明が解決しようとする課題】
【0023】
第1に、化合物ライブラリ照合は、通常、保持時間や保持指数のような分離データを考慮しない。その結果、システムは、ライブラリの化学物質が観測された化合物と同一の分離特性を持つ又は持たない可能性に関係なく、典型的にはライブラリ内のすべての化合物と比較することにより、質量スペクトル内に観測された化合物を同定しようとする必要がある。いくつかの場合、2つの異なる化学成分は同じ質量を持ち、このようにクロマトグラフィーデータがなければ区別が付かない。使用された分離技術が同じ質量を持つ2つの化学成分を十分に分離しない場合、問題はさらに悪化する。この場合、たとえシステムが分離データを考慮したとしても、2つの成分は2つのピークでなく、単一のピークとして表われ、同様に互いに区別が付かない。
【0024】
第2に、質量スペクトルデータのライブラリが合成され得ることがある。ここで使われる用語"合成ライブラリ"は、別のシステム上、又は「コンピュータ内で(in silico)」、すなわち実証分析の結果でなく仮想又は計算結果に基づいて生成されたライブラリをいう。合成ライブラリは、実際に分析を実行するための方法及び機器の特定の特性を反映しないので、合成ライブラリが誤りを発生する可能性がある。
【0025】
第3に、高精度の質量分析装置のような、一般に"正確な質量"システムとして言及される高精度な従来のシステムは高価であり、それらの標準的な対応物よりも低いデューティサイクル(duty cycle)を有するであろう。従って、従来のシステムでは、精度とスループットとの間にトレードオフがあるであろう。さらに、正確な質量だけでは化学成分を高い信頼性で同定するには不十分である。例えば、アミノ酸のロイシンとイソロイシンとは原子の組み合わせが同一であるため同一の質量を持つが、それぞれの分子の位置がわずかに異なって配置されている。正確な質量だけでは、それらの間を識別することはできない。正確な質量は、化学成分の正確な同定の前提条件でもなく、これを保証するものでもない。
【0026】
第4に、いくつかの従来のシステムでは、特定の化学成分を探索し同定するよう構成されることを意味する、"標的とされた(targeted)"分析を実行する。このようなシステムは、現在までの(hitherto)未知のエンティティ(entity)を含むサンプルのすべての化学成分を検出し及び同定しようとする"非標的の(Non-targeted)"分析を実行することはできない。非標的な分析は、巨大な潜在的な応用と利点を持つ方法である。例えば、代謝産物や細胞プロセスの副産物を分析するメタボロミック(metabolomic)解析は、非標的な方法(つまり、全体的に)で、年齢、性別、又はその他の要因(例えば、健康又は病気の状態)に関する代謝プロフィールの変化を監視するのに役立つと共に、サンプルの基質に存在する薬、薬物、及び他の生体異物(生物内で発見されるが、通常は生物内で生成されないか、又は存在することを期待されない化学物質)と同様、食物代謝産物を検出することにまで及ぶことができる。複合混合物の化学成分の組成を非標的な方法で決定する能力は、様々な他の状況で有用となり得る。そのような状況の1つは、薬、酵素、化学物質、添加物及び他の有用な生成物を生成する細胞の増殖である生物プロセスである。他の状況は、生物及び環境試料の分析を含む。
【0027】
従って、非標的な方法で、複合混合物の化学成分の組成をより正確に決定するためのシステム及び方法を提供するための必要性が存在する。
【課題を解決するための手段】
【0028】
一の態様によれば、複合混合物の化学成分の組成の非標的決定のための方法は、分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、ここで前記分離データはピーク情報を含み、かつ前記質量分析データは1次及び2次質量分析データを含む。前記生成された分離及び質量分析データを含む解析結果は収集及び格納される。前記解析結果を化学物質の特性を示す情報のライブラリと比較することにより、前記サンプルの化学成分が決定され、この特性は分離及び質量分析データを含む。前記比較は前記分離及び質量分析データに基づいている。前記情報のライブラリは前記分離技術及び質量分析装置によって生成されるデータを含み、さらに同定され又は同定されていない化学物質の分離及び質量分析データを含む。前記サンプルの前記化学成分の表示は、人間がアクセス可能な形で利用できるようになされる。
【0029】
ここで使われる用語"同定された化学物質"は、高い信頼度で同定された化学物質を指し、一方で"同定されない化学物質"は、複合混合物中の化学成分として検出されたが同定されなかった化学物質を指す。
【0030】
ここで使われ、未同定の化学物質に適用される用語"認識"は、解析結果と、情報のライブラリに記録された未同定の化学物質の特性との比較に基づき、未同定の化学物質が複合混合物中の成分であるという決定を指す。認識は、同定と同義ではない。認識の例は、その存在が既に検出され、それについての入力が情報のライブラリに追加されていた特定の保持指数及び質量-電荷比を有する化学成分の存在の決定であり、入力はエンティティに関連するクロマトグラフィー及び質量分析データを含む。
【0031】
ここで使われ、化学物質に適用される用語"同定"は、化学物質の同一性の高い信頼性を持つ決定を指す。同定の例は、どちらも同一の化学式C7H7NO2を持つ7個の炭素原子、7個の水素原子、窒素原子、及び2個の酸素原子を有する分子がサリチルアミドでなく、アントラニル酸であるという決定である。
【0032】
ここで使われる用語、"人間にアクセス可能な形で利用できるように"は、情報をユーザに視覚的、聴覚的、又はタッチにより(例えば、点字を使用して)提示することを含み、情報を画面上の表示し、情報を含む印刷物を作成し、ワードプロセッサ、スプレッドシートプログラム、テキストエディタなどのコンピュータアプリケーションを使用してアクセス可能な形式で情報を格納することを含む。
【0033】
他の態様によれば、複合混合物の化学成分の組成の非標的決定のためのシステムは、サンプルの化学成分の分離及び分離データの生成のための分離ツール、前記サンプルの前記分離された化学成分の一部に質量分析を実行し、かつ質量分析データを生成するための質量分析装置を含み、前記分離データはピーク情報を含み、前記質量分析データは1次及び2次質量分析データを含む。システムは化学物質の特性を示す情報のライブラリを含み、その特性は分離及び質量分析データを含む。前記情報のライブラリは、前記分離ツール及び質量分析装置によって生成されるデータを含み、同定され又は同定されていない化学物質の質量分析データを含む。システムはさらに、前記分離及び質量分析データを解析結果として受信、収集及び格納するための解析モジュールを含む。前記サンプルの化学成分は、前記解析結果を前記情報のライブラリと比較することによって決定され、前記質量分析データは1次及び2次質量分析データを含み、前記比較は前記分離及び質量分析データに基づく。システムは、解析モジュールに結合され、人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行うためのユーザインターフェイスを有する。
【0034】
複合混合物の化学成分の組成の非標的決定のために本書に記述された主題は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせで実装されてよい。そのようなものとして、本書で使用される用語"機能"又は"モジュール"は、ハードウェア、ソフトウェア、及び/又は記述された機能を実装するためのファームウェアをいう。1つの典型的な実装では、本書に記述される主題は、コンピュータ読取り可能な媒体に表現されコンピュータで実行可能な命令を含むコンピュータプログラム製品を用いて実行されることができる。
【0035】
本書に記述される主題を実行するのに適した典型的なコンピュータ読取り可能な媒体は、ディスクメモリ装置(disc memory devices)、チップメモリ装置(chip memory devices)、プログラム可能論理回路(programmable logic devices)、及び特定用途向け集積回路を含むことができる。さらに、本書に記述される主題を実行するコンピュータプログラム製品は、単一の素子(device)若しくはコンピュータプラットホームに存在することができ、又は複数の素子若しくはコンピュータプラットホームに分散されることができる。
【図面の簡単な説明】
【0036】
【図1A】本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なシステムを示すブロック図である。
【図1B】本書に記述された主題の実施形態に従う、例示的なシステムによって収集された解析結果を示す図である。
【図1C】本書に記述された主題の実施形態に従う、例示的なシステムによって収集された解析結果を示す図である。
【図2A】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2B】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2C】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2D】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2E】本書に記述された主題の実施形態に従う、化学物質の情報を格納するための例示的なデータ構成を示す図である。
【図2F】本書に記述された主題の実施形態に従う、化学物質の情報を格納するための例示的なデータ構成を示す図である。
【図3】本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なプロセスを示すフローチャートである。
【図4A】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4B】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4C】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4D】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4E】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4F】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4G】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【発明を実施するための形態】
【0037】
本書に記述された主題の好適な実施形態は、添付の図面を参照してここで説明され、同等の参照数字は同等の構成部分を表す。
本書に開示されている主題によれば、複合混合物の化学成分の組成を決定するためのシステム、方法、及びコンピュータ読み取り可能な媒体が提供される。
図1Aは、本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なシステムを示すブロック図である。システム100は、分析されるサンプルを化学成分に分離するための分離技術を実行する構成部分を含む。一実施形態において、システム100は、分離を実行するクロマトグラフ102部と、クロマトグラフ102部の溶出物(すなわち、クロマトグラフ102から溶出する化学成分)の質量分析を実行する質量分析装置(MS)104とを含む。一実施形態では、クロマトグラフ102は超高圧液体クロマトグラフ(UHPLC)である。その代わりに、小さな分子、すなわち特定の化学種の特徴であるパラメータとなる2,000ダルトン未満の分子量を持つ分子の分析に修正可能であり、かつ任意の大気圧又はソフト脱離(soft desorption)イオン化技術と互換性を有する、他の化学分離法が用いられることができる。その他の分離方法は、イオン移動度分析(IMS)、キャピラリーゾーン電気泳動法(CZE)、高速液体クロマトグラフィー(HPLC)、及びモノリシック(monolithic)液体クロマトグラフィーを含む。
【0038】
図1に示す実施形態において、システム100は、移動相容器106、及び移動相に押し込むポンプ108、及びサンプル入力110を介し、カラム112を高圧で通って移動相に注入されるサンプルを含む。サンプルの様々な化学成分は、異なる速度でカラム112を通って溶出され、そのため異なる時間にカラム112を出る。サンプルの化学成分がカラム112を通過して出るまでにかかる時間は、化学成分の保持時間と呼ばれる。
【0039】
カラム112の出力は、イオン化装置114に供給されます。液体クロマトグラフを使用するシステムについて、イオン化装置114はまた、カラム112から出る流出物をイオン化ガスに変換してもよい。例えば、イオン化装置114は、エレクトロスプレーイオン化装置(ESI)、大気圧化学イオン化装置(APCI)、又は他の大気圧又はソフト脱離イオン化技術であってよい。イオン化ガスは、焦点リング116を通過してMS104の質量分析部に入る。図1に示される実施形態においては、MS104の質量分析部は、検出器120に結合される四重極イオントラップ118である。その代わりの実施形態は、飛行時間型質量分析装置、イオントラップの無い四重極質量分析装置、及び他の種類のイオントラップを有する質量分析装置を用いてもよい。
【0040】
分離及び質量分析データを格納するため、検出器120データが結果データベース122に収集されると共に格納される。その代わり、分離及び質量分析データは、メモリ内又は記憶装置上で、又は当業者に知られている他のデータ記憶手段経由で、テーブル又は他のデータ構造に格納されてもよい。図1に示される実施形態においては、結果データベース122はクロマトグラフィー及び質量分析データを格納するために用いられてもよい。例えば、結果データベース122は液体クロマトグラフィー及び質量分析(LC/MS)データを含んでよい。別の実施形態では、他の種類の分離データが結果データベース112に格納されてよい。
【0041】
システム100は又、解析結果と様々な化学物質の情報リスト特性のライブラリである化学ライブラリ126との比較に基づき、サンプルの組成を決定するための解析モジュール124を含んでよい。システム100は、グラフィカルユーザインターフェイス(GUI)のようなユーザインターフェイスUI 128を含んでよい。例えばシステムに分離及び質量分析ステップを実行するよう指示し、結果を閲覧し、システムに追加の分離及び質量分析ステップを実行するよう指示し、さらに化学ライブラリ126内のエンティティとの最大一致(best match)に基づいてサンプルの組成を決定するため、システムに自動比較及び同定ルーチンを実行するよう指示するために、ユーザはUI128を用いてもよい。又、化学ライブラリ126にアクセスし、手動で解析結果をライブラリエンティティと比較し、又は自動同定ルーチンの結論を検討/確認するために、ユーザはUI128を用いてもよい。
【0042】
図1Bは、本書に記述された主題の実施形態に従う、例示的なシステムによって収集され得る解析結果のプロットを示す。図1Bに示される3次元プロットは、X軸上の保持時間又は保持指数、Y軸上のm/z、及びZ軸上の強度を表示する。一実施形態では、化学成分がカラム112を出ると、質量分析装置104は、一連の質量スペクトル又はスキャンを異なる保持時間で生成する。図1Bに示すスキャン130例のX軸に沿う幅は、視認できるよう誇張されている。単一の図形のピーク"が同じm/z比の複数の化学物質を表すと共に、そのピークが同じ時間(すなわち、スキャンが取られた時間)に溶出される可能性があるにもかかわらず、それぞれのスキャン130は、質量軸で一般に"イオン"と呼ばれる図形のピークを示す。図1Bに示す例において、スキャン130は、m/z比が283.02のイオンを表し相対存在度が100%である質量ピーク132を含む、いくつかのピークを含む。ピーク132にすぐに隣接して左に、m/z比が280.02で相対存在度が約75%の別のピークがある。200.07、362.92、385.01等のm/z比を有し、非常に小さい相対存在度(<15%)を有する他のイオンが示される。
【0043】
図1Cは、スキャンデータの例を示す。図1CのパネルAに示すように、スキャンは、検出された特定のm/z比のイオンの相対数(relative number)に対応するピーク及び谷を示すであろう。図1CのパネルAに示される質量ピークは又、図1CのパネルBに示されるような'棒(stick)'形で表されるであろう。棒表現は、重心質量ピークデータと呼ばれ、データファイルのサイズが減少される。例えば化学成分を電気泳動で物理的に分離するなどの他の分離技術を使用する実施形態について、それぞれのスキャンは保持時間又は正規化保持時間(例えば、保持指数)ではなく、距離又は正規化距離に関連付けられるであろう。
【0044】
分離を表す軸(例えば、クロマトグラフ分離技術に関する時間、又は物理的な分離技術に関する位置)に沿って複数のスキャンが準備される場合、各イオンについての強度値が上昇及び下降するのが観測され、X軸に沿ってクロマトグラフピークを生成し、それぞれのクロマトグラフピークが特定のm/z比に関連付けられる。簡単のため、用語"クロマトグラフピーク"は、分離を表す軸(例えば、時間、距離など)を横切る1又はそれ以上のイオンの有無を表すピークを意味するために一般に使用されることができる。図1Bにおいて、2次元プロット134は注入に対するクロマトグラフィーデータを示し、ピークは特定のm/zのイオンの存在が時間とともに変化することを表す。図1Bに示される例では、クロマトグラフプロット134は200.00〜200.25の範囲のm/z比を有するイオンを示し、ピーク136は、200.06のm/z比を有すると共に、ピーク最大値が3.02分であり、約3.0分から約3.1分まで溶出するイオンの存在を示す。
【0045】
分離及び質量分析データは、以下総称して"解析結果"と称される。解析結果は、サンプルの1又はそれ以上の解析実行(analysis run)からのデータ、サンプルの異なる種類の解析からのデータ、及び異なるサンプルの解析からのデータを含めることができる。解析結果は、分離及び質量分析情報を含む結果データベース122に格納される。分離情報は、ピーク情報を含むことができる。分離のためのクロマトグラフィー技術を使用するシステムでは、分離情報は保持時間及び/又はピークの保持指数のような保持情報を含むことができる。ピーク情報は、ピーク強度;ピークのベースの幅;ピークのベースの開始と終了の保持時間;ピークのベースの開始と終了の強度;ピークの高さの半分でのピークの幅;ピークの面積;ピークの対称性;ピークのノイズ;ピークに関連する質量;ピークに関連する質量-電荷比;イオン間の親子関係を記述するイオンツリー(ion tree)内のエンティティと、ピークとの関係;及びピークに関連するスキャンのリスト:を含む、ピークを記述する情報を含むことができる。
【0046】
解析結果は、タンデムMSによって生成されたデータを含んでもよい。ここで用いられる用語"タンデムMS"は、"1次MS"と呼ばれる最初のMSステップが実行され、続いて"2次MS"と一般に呼ばれる1又はそれ以上の後続するMSステップが実行される操作をいう。1次MSでは、1次質量スペクトルの生成の間に、1つ(そしておそらく1つ以上)の化学成分を表すイオンが検出及び記録される。イオンによって表される物質は、2次質量スペクトルとして検出及び記録される副成分(sub-component)に物質を分割するため、関係する物質を断片化させる2次MSにさらされる。真の(true)タンデムMSには、1次MSで関心あるイオンと、2次MSの間に結果として生成されるピークとの間に明確な関係がある。1次MSで関心あるイオンは"親"又は前駆イオンに対応し、2次MSの間に生成されるイオンは親イオンの副成分に対応し、本書では"子"又は"副産物(product )"イオンと呼ばれる。
【0047】
従って、タンデムMSは、複合混合物の化学成分の親子関係を表すデータ構造の生成を許容する。この関係は、子イオンが親イオンの副成分を表し、親及び子イオンの関係を示す樹状(tree-like)構造によって表現されるであろう。例えば、"孫"イオンを決定するため、タンデムMSが子イオンに繰り返されてもよい。従って、タンデムMSは断片化の2つのレベルに限られず、"MSn"とも呼ばれる一般に複数レベルのMSに言及するために使用される。用語"MS/MS"は、"MS2"と同義語である。簡単のため、用語"子イオン"は、以下で2次又は高次の(すなわち、1次でない)MSによって生成された任意のイオンをいう。
【0048】
例えば、1次質量スペクトルは、5つの図形ピークとして表されるであろう、5つの異なるイオンを含むかもしれない。1次MS内の各イオンは、親イオンであってよい。各親イオンは、その特定の親イオンに対する子イオンを示す質量スペクトルを生成する2次MSにさらされてもよい。一実施形態では、強度の閾値よりも高い強度を持つイオンの検出が自動的に2次MSの実行を引き起こすよう、強度の閾値が1次MSに設定されてもよい。この例では、物質は、クロマトグラフィーステップで分離を受け、それぞれ別の時間に溶出する化学成分X、Y、及びZに分離されてもよい。化学成分Xは質量分析装置のソースに入り、例えばX1、X2、及びX3のように複数のイオン種にイオン化され(さらに場合により断片化され)、それらは1次質量スペクトルのいくつかのイオンとして記録される。1次質量スペクトル内の1つのイオン、例えば、X2が強度の閾値を超え、2次MSの実行を引き起こしてもよい。
【0049】
一実施形態では、成分Xが1次MSを受けている時間の間、成分Xはクロマトグラフから溶出し続けてもよいが、質量分析装置によって無視される。2次MSが引き起こされる時間で、成分Xはまだ溶出している場合、他のサンプルはMSのソースによって受け入れられ、成分Xの第2のサンプルに2次MSが実行されてもよい。既に述べたように、この第2のサンプルはX1、X2、及びX3にイオン化され(さらに場合により断片化され)るが、X1とX3がイオントラップから放出されている間、X2はイオントラップでトラップされる。X2はその後、例えば副成分X2AとX2Bとに断片化されてもよい。成分Xがクロマトグラフからまだ溶出されている場合、例えば、副成分X3を決定する追加の2次MS、又はさらに高次のMSが実行されてもよい。例えば、その成分X2Ai、X2Aii、等を決定するため、第3のMSがX2Aに実行されてもよい。
【0050】
この例は、タンデムMSを使用することにより、親イオンX2が明確にその子イオン、X2A及びX2Bに関連し、その関係は親と子イオンの相対的な質量-電荷比に関する情報を含むことを示す。
【0051】
子イオンと親イオンの質量-電荷比及び相対強度の両方の関係を明確に理解することは、本書で"イオン計算(ion accounting )"と呼ばれ、解析実行で生成されたすべてのイオンが調査されると共に、化学物質にそれらをすべて帰属させるよう試みられる強力な技術を可能とする。化学物質に帰属できない任意のイオンは、混合物中の新しい化学成分である可能性があり、この場合、これらのイオンについて、新しいライブラリ入力が必要に応じて行われることができる。従って、これまで未知の化学成分が検出されると、成分の同定が不明であっても、未知の化学成分の存在が続いて検出、つまり認識されるよう、それらの属性を記述する情報が格納されるであろう。この方法では、新規又は未知の化学成分が検出され、続いて認識され、最終的に同定されるであろう。
【0052】
親/子関係は又、分離された成分(例えば、クロマトグラフィー段階から溶出する成分)と、1次MSで検出されたイオンとの間の関係を記述するために拡張されてもよく、さらに分析されるサンプルと分離された成分との間の関係にまで拡張されてもよい。
【0053】
さらに、結果データベース122内の解析結果は、解析結果の一般的な性質を記述する情報、又は他のメタデータを含んでよい。例としては、解析の間に取得された1次スキャンの数;解析の間に取得された2次スキャンの数;実際に取得された2次スキャンに対する、取得可能であった2次スキャンの割合;同定された化学物質のピーク内に存在した、取得された2次スキャンの数;同定された化学物質のピーク内に存在した、取得された2次スキャンの割合;解析の間に記録されたピークの数;2次スキャンが取得されたピークの数;2次スキャンが取得されたピークの割合;ピークに関連付けられた1つ以上の2次スキャンを有するピークの数;ピークに関連付けられた1つ以上の2次スキャンを有するピークの割合;2次スキャンが実行されなかった最大ピークの面積;2次スキャンが実行された最小ピークの面積;を含む。
【0054】
解析モジュール124は、1又はそれ以上のサンプルの特性と、化学ライブラリ126に格納された化学物質についての情報との比較に基づき、サンプルの化学成分を決定してもよい。一実施形態では、比較は、保持情報とピーク情報の双方に基づく。化学ライブラリ126に格納された情報は、保持時間、保持指数、付加物を含む1次スキャンで観測された質量、同位体の関係、インソース・フラグメンテーション(in-source fragmentation)、及び上記の相対強度を含んでよい。ライブラリの入力は、フラグメント、サブ-フラグメント、例えばMSnで生成された親-子のイオンデータであるサブ-サブ-フラグメント・データのツリー構造に整理され、任意のイオンに追跡可能であり、イオンは、付加物又は同位体を含む分子の化学成分として同定することができる。ライブラリの入力は又、構造情報、物理的性質、物理的な祖先(stock)のリスト、公開化学データベースへのリンク、種々のライブラリ入力へのリンク、及び手持ちの化学物質上で実行される実際の機器データへのリンクを含んでよい。用語"信頼できる(authenticated)ライブラリ入力"は、実際の機器を使用して解析され同一性が明白な化学物質に関する情報を含むライブラリ入力をいう。
【0055】
一実施形態では、化学ライブラリ126は、サンプル内の未知又は未同定の化学成分についての情報を格納するために使用されてもよい。その保持時間、質量-電荷比、及び他の情報のような、未知のイオンについての情報は、別のサンプルの解析中にそれに続く比較のために格納されてもよい。この方法では、これまで未知のイオンが検出され、続いて一連の解析実行によって同定されるであろう。既知の化学成分の有限数に対しサンプルを試験する従来の化学検査とは異なり、本書に記述される主題は、複合混合物のこれまで未知の化学物質であっても、あらゆる化学成分を検出し及び最終的に同定するために使用されることができる。
【0056】
解析モジュール124は、1)保持ウィンドウ(保持時間、保持指数)のような分離データ;2)1次MSスキャンでの分子イオンの質量;及び3)2次MSスキャン(すなわち、MS/MS又はMSn)でのフラグメントパターン:の3つの情報源からの情報の1又はそれ以上の組の比較に基づいて、サンプルの組成を決定するよう構成される。
【0057】
一実施形態では、解析結果及び化学物質に関する情報は、リレーショナルデータベース構造に格納されてもよい。図2Aから図2Dは、結果データベース122の結果情報を格納するための例示的なデータ構造を示し、図2E及び図2Fは、本書に記述された主題の実施形態に従う、化学ライブラリ126内の化学物質の情報を格納するための例示的なデータ構成を示す。
【0058】
図2Aは、特定のスキャンの結果を格納するための例示的なテーブル構成を示す。テーブル"MBZR_SCANS"内の各入力は、保持時間、スキャン数、質量、及び強度データ配列等の情報を含む。
【0059】
図2Bは、スキャンデータとつながりのある質量分析ツリー構造を模するための例示的なテーブル構成を示す。テーブル"CHRO_ION_TREES"内の各入力は、親ノードの同一性、結合イオン(linking ion)の質量、保持情報、及びスキャンデータの参考資料のような情報を含む。
【0060】
図2Cは、ピーク情報を格納する例示的なテーブル構成を示す。ピークテーブル"MBZR_PEAK"は、質量、保持時間又は保持指数、ピーク下の面積、及びノイズ等の他のより小さなピーク特性によって特徴付けられるクロマトグラフのピークを含んでよい。例えば、一つの解析で、検出可能なピークの特定の数Pを有する1組の質量スペクトルを生成してもよく、その場合Pの入力が、検出されたピークごとに1つの入力でピークテーブルに追加されてもよい。
【0061】
図2Dはクロマトグラフィーに関連する1組のピークを整理するための例示的なテーブル構成を示す。テーブル"MBZR_COMPONENT"内の各入力は、1又はそれ以上のスキャンで特定の保持時間で検出されたピークに化学成分を関連付けるであろう。
【0062】
図2E及び図2Fは、本書に記述された主題の実施形態に従う、化学ライブラリ126内の入力の例示的なテーブル構成を示す。一実施形態においては、名称、構造、化合物、融点などの分子情報は、RT/RI、実行の種類(例えば、LC+/-、MS+/-、MSn)、質量(例えば、M+H、2M+H、イオンフラグメント、付加物)、及びフラグメント情報へのポインタなどの化学物質情報と別に格納される。化学物質は、同定された場合に、参照分子に戻って(back to)指すことができる。
【0063】
図3は、本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なプロセスを示すフローチャートである。
【0064】
ブロック300で、クロマトグラフ及び質量分析装置を用い、サンプルのクロマトグラフィー及び質量分析データが生成される。生成されたデータは、ピーク情報と保持情報を含む。図1に示す実施形態では、サンプル入力ポート110に注入されたサンプルは、カラム112から溶出する。クロマトグラフ102がUHPLCなどの液体クロマトグラフの形である場合、イオン化装置114は、流出物をイオン化すると同時に液相から気相に変換するエレクトロスプレーイオン化(ESI)装置であってよい。イオン化された粒子は、このように質量分析装置104に入る。一実施形態では、イオン化された粒子は焦点リング116を通過し、例えば四重極イオントラップ118を通って検出器120に入るようにして、質量分析装置104の質量分析部に入る。
【0065】
ブロック302で、生成されたクロマトグラフィー及び質量分析データが収集及び格納される。例えば、強度のような、保持時間及び保持指数などの保持情報に沿ったピーク情報は、結果データベース122に記録されてもよい。
【0066】
複数のクロマトグラフィー及び/又は質量分析実行がサンプル上に実行され、データが解析のために収集及び格納されてよい。例えば、サンプルは、酸性及び塩基性の両方の液体クロマトグラフィー、すなわち、それぞれ正又は負イオンの生成を促進する移動相を使用する液体クロマトグラフィーにさらされてよい。サンプルは、正イオンと負イオンの両方の質量分析にさらされてよい。同一のサンプルに複数の実行が行われてもよい。上記したすべてのデータは、結果データベース122に格納されてよい。
【0067】
一実施形態では、システム100はタンデムMSを実行するよう構成される。本書で使われる用語"タンデムMS"は、親分子、イオン、又は質量分析データが知られている化学物質がさらに断片化され、質量分析情報がフラグメントのために収集されるすべての技術をいう。これは、指定された分子からのすべてのフラグメントが、デバイスの内部構造に基づいて生じる幾つかのプロセスを介してその分子に帰属するあらゆる技術を包含する。本書で使われる用語"タンデムMS"と"多段のMS"は同義である。例えば、システム100はイオントラップによって真のタンデムMSを実行してもよく、又はトリプル四重極MSを用い、若しくは個々の質量の分離及びさらなる断片化を許容するあらゆる技術によって真のタンデムMSに相当するものを実行してもよい。
【0068】
ユーザによって定義され、システム100によって実行される解析の目的に従って、カラム112から溶出する個々のかつすべての分離した化学成分に質量分析(又はタンデムMS)が実行されてもよく、サンプルの化学成分の一部がカラム112から出てくる時に、それらのみに質量分析が実行されてもよいことは、容易に理解できる。
【0069】
ブロック304では、サンプルの化学成分は、解析結果と、化学ライブラリ126などの化学物質の特性を示す情報のライブラリとを比較することによって決定される。一実施形態では、上記した特性の照合に基づいて、解析モジュール124がピークで表される化学物質の同一性を最も良く推測してよい。この方法では、ピークは化学ライブラリ126にリストされているエンティティに関連付けられるであろう。一実施形態では、ピークに関連付けられるエンティティは、イオン間の親子関係を記述するイオンツリー上のノードであってよい。一実施形態では、ピークは、そのデータがピークを表示するスキャンリストに関連付けられるであろう。
【0070】
ブロック306では、サンプルの化学成分の表示は、人間がアクセス可能な形で利用できるようになる。一実施形態では、ユーザインターフェイス128は、化学成分の視覚的表示を提供してもよい。例えば、UI128は、検出又は同定された化学成分を示す解析結果を表示してもよい。また、ユーザインターフェイス128は、グラフィック、テキスト、又は点字印刷を生成してもよく、コンピュータで生成されたせりふなどの音声を生成してもよく:又は電子メール、テキストメッセージ、若しくはテキスト文書、スプレッドシート、データベースなどのコンピュータファイル、を生成することが生成してもよい。
【0071】
上記したシステム及び方法は、従来のシステム及び方法に比べていくつかの利点を持つ。まず、ピークデータのみを使用してピークで表される化学成分を同定しようとする、従来のクロマトグラフィー+質量分析システムとは異なり、解析モジュール124は、ピーク情報と保持情報の両方に基づいて比較を実行する。ピークの保持時間/保持指数を考慮することにより、解析モジュール124は、問題となっているピークについて測定された保持情報以外の保持情報を有することが知られている分子を排除し、その検索空間を大幅に減らすことができる。さらに、分子はLC+実行に対する1つの保持時間及びLC-実行に対する別の保持時間を有してもよいので、サンプルが異なる種類のLC実行に対して予期された場所でピークを示す場合、サンプルが問題となっている分子を含む信頼性が高い。
【0072】
同様に解析モジュール124は、異なる種類の複数の解析実行を検討するだけでなく、タンデム又は多段の質量分析を実行してもよく、解析実行によって生成される豊富なデータは、親分子だけでなく、子分子若しくはイオン、又は他のフラグメントにも同様に一致するであろう。これは又、サンプル内の化学成分が正しく同定されているという高い信頼性を生じさせる。
【0073】
第2に、情報のライブラリ126は、信頼ある(authentic)データ、すなわち、参照基準を使用し分離ツール及び質量分析装置によって生成されたデータを含む。例えば、仮想又はモデル化された動作に基づいてコンピュータ内で生成されたデータである合成データとは異なり、信頼あるデータは、サンプルを分析するために使用されるのと同じ機器による同一の分析方法を使用して記録された結果に基づく。従って、特定の分子について、その分子のライブラリ情報は、その分子を含むサンプルについての解析結果とより密接に一致する。これは、例えば、正のLCに対する特別な移動相組成、及び負のLCに対する他の特別な移動相組成を使用するような、細かく調整されたシステムを有するラボ又は工場にとって特に重要である。
【0074】
第3に、情報のライブラリは、同定された化学物質と同様、未同定の化学物質のクロマトグラフィー及び質量分析データを含んでもよい。図1に示す実施形態では結果データ122は化学ライブラリ126と別のものとして示されるが、別の実施形態は、結果データ及びライブラリデータを一緒に格納するための、例えばテーブルなどの単一のデータベースを使用してよい。図1に示すように結果データがライブラリデータから概念的に分離していても、解析モジュール124は、結果データベース122に表れ続け、まだ未同定である未知のピークを検出し、化学ライブラリ126内に謎の分子の入力を生成するよう構成されてもよい。この方法では、分子の同一性が未知であるにもかかわらず、システム100は、この謎の分子の有無を報告することができる。システム100は、サンプル集合のイオン配列を報告することができ、さらにイオンを同定及び分類してもよい。例えば、解析モジュール124は、すべてのイオンについてMSnレベルでライブラリに対してイオンを照合してよく、さらに、ユーザによるその後の検査のため又はシステム100によるその後の処理のため、あらゆる不明のイオンにフラグを立ててもよい。
【0075】
未知の代謝産物の初期検出及びその後の認識などの非標的分析を実行するこの機能は、膨大な利点を有する。例えば、癌ありと癌無しの細胞の代謝解析では、癌細胞がほとんど常にいくつかの謎の分子を含むことを示す一方で、健康な細胞がそうでないことを解析結果が示す場合、これは癌の検出又は治療のための研究の重要な方向性を与える。
【0076】
一実施形態では、ユーザが2つの視覚的な比較を実行できるよう、又はシステムによって実行された比較の正しさを視覚的に確認できるよう、サンプルの組成を決定することが解析結果に沿って特定のエンティティのためのライブラリ情報を表示することを含んでよい。UI128は、ユーザがサンプルの最初の解析を実行し、さらに最初の解析の結果を表示することを許容する。
【0077】
図4A-4Gは、本書に記述された主題の実施形態に従う、UI128を介してユーザに表示される情報のスクリーンショットである。図4A-4Gに示された実施形態において、分離技術はいくつかのクロマトグラフィーの形式であると仮定され、分離情報は保持時間及び/又は保持指数を含む。これは、例示的な実施例として意図され、本書に記述された主題の限定ではない。
【0078】
図4Aは、UI128を介してユーザへ表示される、化学ライブラリ126内のライブラリ入力についての情報を示すスクリーンショットである。図4Aは、"既存物質リスト(Chemical Inventory)"というタイトルのウィンドウ400を示し、左上に検索ウィンドウ402を含み、左下にあるライブラリブラウザウィンドウ404を含み、さらにウィンドウ400の右側にあるライブラリ入力ウィンドウ406を含む。ユーザは様々な情報のライブラリを検索するため、検索ウィンドウ402を使用することができる。ユーザは、様々なデータベース又は情報のライブラリを閲覧するため、ライブラリブラウザウィンドウ402を使用することができる。図4Aに示される実施形態では、ライブラリウィンドウ406は、この例では"LIMS"と称されて階層ツリー構造に配置された化学ライブラリ126を示す。化学ライブラリ126の構造は、サブフォルダ(サブディレクトリ)及びエンティティ(ファイル)を含むフォルダ(ディレクトリ)の階層としてライブラリウィンドウ406内に表示されるが、実際のライブラリの構造はファイル/ディレクトリ実装に限定されず、ファイル、ディレクトリ、データベース、揮発性又は非揮発性メモリに格納されるデータ、ディスク若しくはメモリ記憶装置、コンパクトディスク、又はデータの記憶及び/又は編成(organization)のための他の手段、を任意の組み合わせとして実装されてもよい。図4Aに示される実施形態では、化学ライブラリ(LIMS)126は、個々の化学物質(化学物質)408についての情報のライブラリ、公共のデータベース又はそこから(公共DB)選ばれたデータ410へのリンク、及び信頼ある化学物質のライブラリ(ライブラリ)412、及び認識されたがまだ同定されていない化学物質の情報、を含む。
【0079】
一実施形態では、化学物質408は、使用される分離又は質量分析技術に応じて変化しない個々の化学物質についての情報を含むことができる。このような情報は、分子構造、分子式、分類、及び標準的な名前又は名前を含んでよい。これに対し、ライブラリ412は、使用される分離又は質量分析技術に依存する保持時間などの個々の化学物質についての情報を含んでよい。例えば、ガス又は液体クロマトグラフが使用されたか、分離ステップ中に使用された移動相が酸性又は塩基性か、等によって、同じ化学物質が完全に異なる保持時間を有するかもしれない。これらの実施形態では、機器固有のデータはライブラリ412に格納され、一方で化学物質の本質的な特性は、化学物質408に格納されてもよい。一実施形態では、化学物質408及びライブラリ412への入力は互いに相互参照され、さらに双方が公共DB 410又はLIMS126の他のサブコンポーネントへの入力と相互参照されてもよい。
【0080】
図4Aに示される実施形態では、ライブラリ412は、それぞれが分析の種類又は機器の組み合わせを表す複数のサブライブラリ414、416、及び418に分類される。例えば、サブライブラリ414は、ガスクロマトグラフを使用して分離された化学物質の信頼ある結果を含むのに対し、サブライブラリ416は、超高圧液体クロマトグラフィーを使用して分離された化学物質の信頼ある結果を含んでよい。サブライブラリ418は、収集されたがまだ認証されていないようなクロマトグラフィー及び質量分析情報を含んでよい。各サブライブラリは、既知及び未知の化学物質420に関する情報を含んでよい。図4Aにおいて、以下単に"カテキン"と称される、既知の化学物質(+)-カテキンが選択されている。
【0081】
図4Aに示される実施形態では、ライブラリウィンドウ406は選択された化学物質カテキンの情報を表示する。化学物質420に関し、表形式426とグラフ形式428の両方で、化学物質の同定についての情報422、化学物質のクロマトグラフィー情報424、及び化学物質の質量分析情報のような、広義のカテゴリに視覚的に分類されるいくつかの種類の情報が存在するであろう。
【0082】
化学同定情報422内で、化学物質の同定は、その化合物名、ライブラリID、及び化合物IDを含むことができる。一実施形態では、ライブラリID及び化合物IDが化学ライブラリ126内の化学物質を明確に同定するために使用されるのに対し、化合物名は読みやすくするために使用される非公式又は一般名である。化合物名及び化学名フィールドの組は、潜在的に複数の非公式名の中から選択するために使用される。化学レポート名及びライブラリレポート名フィールドは、生成された化学レポート及びライブラリレポートにエンティティが参照される時に、ユーザがどのような名前が使用されるかをそれぞれ選択することを許容する。
【0083】
化学物質のクロマトグラフィー情報424は、その保持時間(RT)及び保持指数(RI)を含んでよく、さらに同定プロセス中に使用されるRTウィンドウ及びRIウィンドウを含んでよい。例えば、カテキンは、2の保持時間ウィンドウを有する2.42の保持時間(RT)を持ち、25の保持指数ウィンドウを有する2493の保持指数(RI)を持つ。図4Aに示される実施形態では、ライブラリ入力の情報源は、グループ名及び源(origin)フィールドで示される。グループ名は、データを生成する特定の分析実行を識別する。分析実行は、分析される物質のサンプルをクロマトグラフの入力ポートに注入する行為に関し、本書では"注入"と称される。源は、入力を生成するために使用されるソフトウェアの種類に言及し、例えば実際の分析実行から由来するデータを示す。信頼(confidence)フィールドは、化学物質が実際にどのようにそれが同定されているかの相対的な信頼度を示す。例えば、信頼値100は、システムによって記録され、ライブラリ入力に格納された結果が、化学物質カテキンを表す信頼性が高いことを示す。信頼値は0に設定されてもよく、この場合、照合過程、すなわち分析された物質が化学ライブラリ126内の潜在的な候補と照合される過程の間、化学ライブラリ126内の入力が考慮されない。
【0084】
上記したように、本書に記述された主題は、非標的分析を実行する能力を有する。これは、化学成分が同定されないにもかかわらず、検出され続いて認識されるであろうことを意味する。この場合、ライブラリIDと化合物IDフィールドが値を含むが、化合物名フィールドが空であってもよい。100未満の信頼値は、謎の化学物質が明確に認識されたが、まだ同定されていないことを示すであろう。
【0085】
質量分析情報426は、視覚的にいくつかのタブに整理されてもよい。図4Aに示される実施形態では、"質量"タブは、1又はそれ以上の注入の間に収集された質量分析情報を含む質量情報テーブルを表示する。"公共DB"タブは、様々な情報を含むであろう公共データベースから収集され又は得られる情報を表示する。例えば、公共DBタブは、公共MSデータベースから収集され若しくは得られる質量分析情報、又はその他の公共データベースからの他の種類の情報を含んでよい。質量情報テーブルは、1次スキャンで観測された質量のリストを含んでよく、さらに1次イオンの質量だけでなく、付加物( m+H、m+Na,2m+H)、同位体を含む分子(例えば、C-13、Cl-35、Cl-37)、及び予想され又は一般に生じるインソース・フラグメントなどの変異体(variant)の質量を含んでよい。図4Aに示される実施形態では、質量情報テーブルは、1行ごとに1つの変異体で、カテキンの複数の変異体の情報を含む。図4Aに表示される情報は1次MSデータであるが、行の左端にあるプラス記号("+")は、2次MSデータも利用可能であることを示す。2次MSデータの表示は、以下の図4Bに記述されている。
【0086】
変異体は、次の命名規則を使用する。小文字の"m"は化学物質を象徴し、"m+H"は、実際に外側の電子が剥ぎ取られた水素原子(原子記号"H")であるプロトンが化学物質にくっついて生成されたイオンを象徴する。大文字"M"は、化学物質のフラグメント、又は化学物質を含む化合物のいずれかを象徴する。例えば、"M-151"は、その分子構造から原子に値する151原子単位を失った化学物質のインソース・フラグメントを指し、一方で"M+16"は、原子に値する16原子単位がその分子に追加された化学物質を含む化合物を指す。四角かっこ内の記号は、分子内の同位体の存在を示す。例えば、"m+H[C13-1]"は、1つの炭素原子(原子番号12)が炭素-13同位体で置換されているイオンを指し、"m+H[C13-2]"は、2つの炭素原子が炭素-13同位体で置換されているイオンを指す。
【0087】
各イオンの情報は各行内の列として示され、変異体の質量を示す質量列、及び質量ウィンドウ列を含むことができる。質量ウィンドウは、検出された化学成分に潜在的に一致するとみなされる可能性があるライブラリ入力内の許容誤差である。質量比列は、全体としての集団に対し、1又はそれ以上の同位体を有する変異体の相対的な割合を示す。'Quant_mass(量子質量)'列は、化学物質(例えば、カテキン)の情報の要約に含まれる質量を、どの変異体が有するかを示す。重み列は照合プロセスの間に使用され、ユーザが照合プロセスの感度を微調整することを許容する。名前列は、質量情報を人間が読み取れるよう使用される説明フィールドである。
【0088】
ライブラリウィンドウ406の下部に表示されるものは、Y軸上のイオンの相対強度と、426に表示される表形式のデータから得られるX軸上の質量とによる、グラフ形式428で示される質量情報である。
【0089】
図4Bは、UI128を介してユーザへ表示される、化学ライブラリ126内のライブラリ入力に関する詳細情報を示すスクリーンショットである。図4Bでは、質量291.1を持つイオンの1次MSデータは、そのイオンの2次MSデータを表示するよう拡張されている。図4Bに示される実施形態では、1次MSデータが拡張されていることを示すため、行の左端にあるプラス記号がマイナス記号("-")に変更されている。図4Bでは1つのレベルの2次MSデータのみが示されているものの、より高次のMSデータも同様に利用され、表示されてもよい。質量情報グラフ428は今度は、1つの変異体が質量123.1を有し、他が質量139.1を有する高質量比の2つの変異体が、グラフ内の2つの最も高いピークとして見られる2次MSデータを示す。
【0090】
図4A及び4Bは、ライブラリ412内の入力に格納される情報を表示する。図4Cは、化学物質408内の入力に格納される情報を表示する。
【0091】
図4Cは、化学ライブラリ126の分子に関連する構造情報と物理的性質とを表示するスクリーンショットである。一実施形態では、化学物質408の入力は、その化学ID、化学名、国際純正応用化学連合(IUPAC)名、分類、物理的情報と物理的性質、及び分子式などの化学物質の詳細のような、一般的情報430を含んでよい。化学物質408は、化学物質と、ライブラリ412内の情報及び公共DB410とを相互参照するためのリンク432を含んでよい。化学物質408の入力は、化学物質の類義語434を含むことができ、さらに分子の分子図(molecular diagram)などの構造情報436を含むことができる。ユーザは又、そこから物質が得られる物理的資源(physical stock)のリスト、注釈、検索用語として使用できるキーワード、及び添付ファイルとして含まれる他の種類の情報などの他の詳細438を提示されてもよい。
【0092】
図4Aから4Cは、化学ライブラリ126に格納され、ユーザによって表示及び閲覧される情報の種類を示す。図4Dから4Gは、手動による照合ステップの間、又は自動照合アルゴリズムの結果を検討するため、分析を経てサンプルについて記録されたデータを化学ライブラリ126エンティティと比較するためにユーザがどのようにシステムを使用するかを示す。
【0093】
図4Dは、1又はそれ以上の注入から収集される結果データを表示するスクリーンショットである。一実施形態では、結果ウィンドウ440は、サンプル名を表示、データが得られた日付(例えば、注入が行われた日付)、注入に関する情報を含むファイル名、クライアントID、及び特定の注入に関するその他の情報を示す、実行された注入のスクロールリストを提供する。図4Dに示される実施形態では、リストに表示される一番上の行が選択され、注入に関するデータが詳細ウィンドウ442に表形式で表示され、さらに図4Dの下3/4を占めるグラフウィンドウ444にグラフィック形式で表示される。ユーザが結果ウィンドウ440の注入リスト内をスクロールすると、詳細ウィンドウ442及びグラフウィンドウ444内に表示されるデータがそれに応じて変更され、結果ウィンドウ440内で現在選択された注入に関連するデータを表示する。
【0094】
一実施形態では、詳細ウィンドウ442は、注入に関連するデータを整理し、かつ関連するデータをユーザに理解できる形式、又はユーザが理解し、受け入れ、及びデータを使用する能力を向上させる形式でユーザに表示するため、一連のタブを含んでもよい。図4Dに示される実施形態では、詳細ウィンドウ442は現在"ヒット"タブを表示し、それは、本書で"注入データ"と称される、その注入について収集されたクロマトグラフィー及び質量分析データに最も一致するよう照合アルゴリズムが決定した化学物質のリストをユーザに提供する。つまり、ヒットタブは、解析されたサンプル内の成分の同定について、システムの最も妥当な推測を表示する。一実施形態では、あり得る成分のこのリストは表形式で表示され、そのクロマトグラフィー及び質量分析データと共に化学物質の名前を一覧表にする。
【0095】
一実施形態では、結果ウィンドウ440にリストされた注入の1つの選択に応じて、システム100はグラフウィンドウ444の注入データを表示してもよい。一実施形態では、グラフウィンドウ444は、注入データの全部又は一部を表示してもよい。例えば、グラフウィンドウ444は注入データの一部のみを表示してもよく、それに基づいて照合アルゴリズムは詳細ウィンドウ442内に選択された成分の同一性を決定する。図4Dに示される実施形態では、グラフウィンドウ444は3つの別個のグラフを含む。
【0096】
上部グラフ446は、X軸である保持時間又は保持指数と、Y軸である強度とを有し、結果ウィンドウ440で選択された注入についてのクロマトグラフィーデータのグラフを表示する。上部グラフ446は、成分の形でクロマトグラフィーデータを表示する。成分は、同様のクロマトグラフ特性を持つクロマトグラフピークの収集を表す棒である。例えば、成分は、共に溶出する1又はそれ以上の無関係な物質を含んでもよい。上部グラフ446は、特定の保持時間で溶出する成分に含まれている質量に関するどの情報も表示しない。一実施形態では、図4Dに示すように、ユーザは表形式448で情報を表示しようとする。表形式で同じ情報を提供することは、ユーザにさらに詳細にピーク情報を見ることを許容し、さらにユーザに、そうでなければグラフ形式では小さくて区別できないピークを検出することを許容するであろう。上部グラフ446は、固定幅の理想的な列としてピークを表すが、生のクロマトグラフィーデータは高さ、ベースの幅、及び面積を含む形状のピークであってよい。これらの詳細は、データの表形式448に含まれてよい。上部グラフ446のタイトルは、RT=0.6777の成分が選択されていることを示す。これは又、表形式448に反映され、そこではRT=0.68での情報が選択されている。
【0097】
図4Dに示される実施形態では、中央グラフ450は、特定の成分又は保持時間ウィンドウについての1次MSデータを示す。中央グラフ450上部に表示されるタイトルが示すように、中央グラフ450は5番目の成分の質量分析データを示す。中央グラフ450は、X軸上の質量及びY軸上の相対強度と共に、この5番目の成分の1次MSデータを示す。上部グラフ446に示すクロマトグラフィーデータを介し、ユーザが成分から成分へスクロールすると、現在上部グラフ446で選択された成分の1次MSデータを表示するよう、中央グラフ450の内容が変更される。これは、今度は'ヒット'を表示する442、及び照合ライブラリ情報を表示する452をもたらす。
【0098】
図4Dに示される実施形態では、下部グラフ452は、化学ライブラリ126内の入力の1次MSデータを示す。中央グラフ450に表示される1次MSデータと同様、下部グラフ452は、X軸上の質量及びY軸上の相対強度を有するグラフを表示する。この例では、自動的に又はユーザにより、詳細ウィンドウ442にリストされる"ヒット"の1つが選択され、この場合、化学物質はカルニチンである。下部グラフ452では、下部グラフ452の上部に表示されたタイトルによって見ることができるように、化学物質カルニチンのMSデータが表示される。カルニチンは、RT=0.6777で溶出する物質の最有力候補として照合アルゴリズムによって選択されてもよく、又はユーザが手動でカルニチンを選択してもよい。このようにしてユーザは、照合結果の精度を確認し、又は注入から化学ライブラリ126内のエンティティに関する1次MSデータまでの1次MSデータの手動による照合を実行するため、中央グラフ450で注入中に収集されたデータを、下部グラフ452のライブラリ入力からの1次データと比較してもよい。
【0099】
図4Dに示される実施形態では、上部グラフ446についてのみ表形式でのデータを示すが、一実施形態では、中央グラフ450及び下部グラフ452を含む任意のグラフについて、データが表形式で表示されてもよい。さらに、グラフウィンドウ444は、あらゆる数のグラフを含んでよく、図4Dに示すような3つのグラフに限定されない。
【0100】
一実施形態では、2次MSデータが利用可能であることをユーザに示すよう、中央グラフ450に表示される1次MSデータ内のピークデータが色分けされてもよい。中央グラフ450に表示される1次MSデータ内のピークをクリックすることや、表形式で表示されたデータから入力を選択すること等により、ユーザはピークを選択してもよい。それに応じて、システム100は、1次MSデータ内で選択されたピークに関する2次MSデータを表示してもよい。図4Dに示される実施形態では、成分#5の1次MSデータは、様々な質量の物質を表すいくつかのピークを含み、この成分は0.6777の保持時間を有する縦棒によって表される。この例では、ピークは、その2次MSデータに関連する162.2の質量を持つイオンの存在を示す。このようにしてユーザは、このピークを"掘り下げ(drill down)"、2次MSデータを表示する。この例は、図4Eに示される。
【0101】
図4Eは、注入に関連する2次MSデータを表すスクリーンショットである。一実施形態では、1次MSピークの選択は、システム100に対し、そのピークについて既に収集されている2次MSデータを表示するトリガーとなる。例えば、化学ライブラリ126から情報を見ることをユーザが希望するピークを同定するため、ユーザはUI128を使用してもよい。図4Eに示される実施形態では、中央グラフ450の上部のタイトルに見られるように、中央グラフ450は保持時間0.7046で162.2の質量を持つイオンに関する2次MSデータを表示する。下部グラフ452は、対応するイオン、すなわち化学ライブラリ126から選択される162.2の質量を有するエンティティに関する2次MSデータを表示する。
【0102】
一実施形態では、この場合にユーザは上部グラフ444に表示されるクロマトグラフィーピークを選択し、それは中央グラフ450に表示されるそのクロマトグラフィーピークについての1次MSデータをもたらす。その後、ユーザは中央グラフ450の1次MSピークを選択し、それは中央グラフ450に表示されるその1次MSピークについての2次MSデータをもたらしてもよい。同時に、システム100は、下部グラフ452の化学ライブラリ126内の対応するエンティティを表示してもよい。中央グラフ450が注入に対する1次MSのデータを表示する場合、下部グラフ452は化学ライブラリ126内の入力についての1次MSのデータを表示してよい。中央グラフ450が注入に対する2次MSのデータを表示する場合、下部グラフ452は化学ライブラリ126内の入力についての2次MSのデータを表示してよい。ユーザが中央グラフ450のデータをスクロールすると、下部グラフ452に表示されるデータが変化する。つまり、一実施形態において、中央グラフ450及び下部グラフ452は同期され、中央グラフ450の変化が下部グラフ452に対応する変化を引き起こす。この場合、ユーザが注入データを検索すると、システム100はライブラリから自動的に適切なデータを表示してよい。
【0103】
図4Dと4EではMSデータの2つのレベルのみが表示されているものの、同じコンセプトは、ユーザが高次のMSデータを生成及び/又はアクセスすることを許容するよう拡張されてもよく、これは1次及び2次のMSデータに限定されない。一実施形態では、ユーザは、マウス、メニュー、又はスクロールホイールを介してMSnデータにアクセスしてもよい。
【0104】
一実施形態では、任意の結果グラフのピークをクリックし、グラフ上で既知の場所の化学物質と同等のライブラリ情報をシステム100が表示することをもたらすため、ユーザがマウスを使用してよい。1つの例では、ユーザはXの保持指数を持つピークを観察し;ユーザがピークをクリックして、システム100が保持指数の値を記録するためのトリガーとし、同じ保持指数を持つその既存物質リスト内でエンティティを同定し、さらにその既存物質リスト内で同定されたそれらのエンティティの情報を表示してもよい。従って、手動でライブラリ入力を注入結果と参照し、又は照合プロセスの結果を確認するため、クロマトグラフデータ、1次MSデータ、及び2次MSデータを含み注入のために収集されたデータを検索するため、ユーザはUI128を使用してもよく、さらに化学ライブラリ126内の入力を検索するためにUI128を使用してもよい。
【0105】
図4A〜4Eにおいて、基本的なクロマトグラフィー及び質量分析データのピークは、高さ及び最小又はゼロの幅を持つ理想的なピーク又は棒として表現される。しかし、生のクロマトグラフィー又は質量分析データは、形状と面積を有するピークを記述する。一実施形態では、ユーザは生のピークデータにアクセスしてもよい。例えば、ユーザがマウス又はその他のポインティングデバイスを、グラフのピーク又はテーブルの行のいずれかに置くと、エンティティの詳細情報を含むポップアップウィンドウが表示されるよう、UI128が構成されてもよい。これは、図4Fに表示される。
【0106】
図4Fは、以下"ピーク"データと称される、詳細な分離(例えば、クロマトグラム)データを示すスクリーンショットである。図4Fでは、"スキャンビューア(ScanViewer)"というタイトルのウィンドウ454は、1つの注入の間に検出された実際のピークの形状を示す。この場合、ユーザは、ピーク強度と保持時間を表すラインだけでなく、詳細なピーク情報を見ることができる。スキャンビューア・ウィンドウ454内では、クロマトグラムスタイル選択ボックス456は、どのようにピークデータが表示されるかをユーザが選択することを許容する。ユーザは、検出されたすべての質量又は検出された一部の質量について、ピークデータを表示することができる。一実施形態では、ユーザは関心あるピークを、それぞれ別のグラフ又はグラフウィンドウ("分離したクロ(Separate Chro)")内で別のピークとして表示することができ、各グラフは異なるm/z値又はm/z値の範囲を表す。その代わり図4Fに示すように、ユーザは、異なるm/z値を持つピークが1つのグラフ又はグラフウィンドウ内に互いに重ねられた("重畳したクロ(Superimposed Chro)")1つのグラフを表示してもよい。図4Gに示すように、ユーザは又、収集された生データ("分離した生(Separate Raw)")を表示してもよい。
【0107】
図4Fに示される実施形態では、スキャンソースウィンドウ458は、そこからピークデータが収集及び表示されるスキャンのソースを表示する。ユーザは、ピークデータのソースとして複数のスキャンソースを選択することができる。スキャン結果ウィンドウ460は、スキャン中のイオンを表す全てのイオンをウィンドウ454の下部に表示する。一実施形態では、このスキャンのリストは、中央グラフ450に表示されるクロマトグラフピークの組からユーザによって選択されるか、又はソフトウェアによって選択されてよい。特定のピーク又は複数ピークのデータは、ウィンドウ454の中央に位置するピーク表示ウィンドウ462に表示される。ピーク464の記号は、ピーク開始、ピーク頂点、及びピークエンドを示す。ピーク464上の点は、異なる点の形状、色分け、又は他の視覚的な手段を用い、2次MSデータの利用可能性を示すか、又はその点の2次MSデータが、化学成分を同定するため照合プロセスの間に使用された2次MSデータであったことを示してもよい。
【0108】
ピーク表示ウィンドウの右上の隅にある凡例466は、クロマトグラフピーク464と交差する縦線をなすカーソル468で示されるグラフの一部の情報を示す。図4Fに示される例では、凡例466は、クロマトグラフピーク468が0.71RTに位置し、さらにクロマトグラフピーク464の面積が1.7349e+006であることを示す。凡例466は又、ピーク464が231.7から232.5 AMUsの範囲の質量を有することを示す。従って、ユーザは、図4Fに示されるピーク464が、異なる質量を持つがピーク付近の時間領域で収集された1次スキャンで測定されたイオンを表すであろうことを知らされる。ユーザがカーソル468を使用してピーク464上の点を選択した場合、1次MSのデータがスキャン結果ウィンドウ460の上半分に表示される。2次MSデータも利用可能である場合、スキャン結果ウィンドウ460の下半分に2次MSデータが表示されてもよい。
【0109】
図4Fは"重畳したクロ"モードで動作するスキャンビューアを示すが、ユーザによって定義されるデータウィンドウ(すなわち、表458の"質量"、"ウィンドウ"、"スタート"及び"終了"列の値によって決定される境界)は、ピーク464として観察される1つのピークのみを含む。データウィンドウが追加のクロマトグラフィーピークを含む十分な大きさを持つ場合、ディスプレイウィンドウ462は、データソース又は表466に一覧表示されたソース内の指定されたデータウィンドウ内に存在する追加のピークを表示してもよい。
【0110】
図4Gは、クロマトグラムスタイルボックス456内の選択によって見ることができる、"分離した生"モードを使用して表示されたピークデータの例を示すスクリーンショットである。図4Gに示される実施形態では、UI128は、図4Fに示されるピークについてのデータを含む、記録された生のピークデータを表示する。図4Gに示されるデータポイントは、データポイントの3つの組又は水平方向の行に視覚的に整理することができる。データポイントの3つの水平方向の組の中央は、そこから図4Fのピーク464が導出される生データである。データポイントの上部と下部の水平方向の組は、図4Fで指定されたデータウィンドウ内に含まれない。
【0111】
グラフは、3つの次元:X軸の保持時間、Y軸の強度、及びZ軸の質量を含む。図4Gのグラフから、質量範囲231.7〜232.5に限られ、約232(グラフの左から右へ渡る中央の一連の点)の質量を持つ主として1つのイオンのみを表す図4Fの単一ピークを見ることができる。ただし、図4Gのグラフは、それぞれ約231及び233の質量を有する(グラフの左から右へ渡る上部と下部の一連の点)2つの他のイオンが同時に溶出されたことを示す。従って、このウィンドウを使用して、ユーザは別の時間スケールでデータで見てもよく、又は特定のピークに含まれるべき質量の範囲を変更してもよい。例えば、ユーザは、231及び233の質量を持つイオンについてのデータも図4Fのピークデータに含まれるべきであると決定してもよい。その代わりに、ユーザは、ピーク検出アルゴリズムによって、いくつかのイオンが単一のピークに結合されたと決定してもよく、さらに特定のピークの質量範囲を変更することにより、これらのイオンの幾つかが偽であるとして除外するようピーク検出アルゴリズムに指示してもよい。要するに、ユーザが生の注入データに直接アクセスできるだけでなく、照合アルゴリズムによって生成された決定を微調整するため、ユーザがその情報を使用することができる。
【0112】
本書に記述される主題の範囲を逸脱しない限り、本書に記述される主題の各種の詳細を変更してよいことは理解されるであろう。さらに、前述の記述は説明を目的としたものに過ぎず、限定を目的としたものではない。
【技術分野】
【0001】
(関連する出願)
本出願は、2008年1月16日出願の米国仮特許出願No. 61/021,508;2008年11月14日出願の米国仮特許出願No. 61/114,869、及び2008年12月3日出願の米国特許出願No.12/327,758の利益を主張し、その開示は参照することにより全体が本書に援用される。
【0002】
本書に記述される主題は、複合(complex)混合物の化学成分の組成を決定するためのシステム及び方法に関する。
【背景技術】
【0003】
複合混合物の化学成分の組成を決定する能力は、「この物質は何から作られているか?」といった質問に従来の化学分析によって答えることを含み、さらに「どのように健康な細胞は病気の細胞から異なるのか?」、「どのようにこの薬は細胞過程に影響するのか?」、「どのようにして培養細胞の成長を最適化できるか?」及び「何がこのバイオプロセスの制限因子か?」といった生物学的プロセスのより高度な分析を可能とする、広範で非常に有用な応用を有する。
【0004】
複合混合物の分析に従来から使用される技術は、クロマトグラフィー及び質量分析法を含む。クロマトグラフィーは、それによって複合混合物が成分に分かれる技術である。質量分析は、多くの異なる化学成分を含むサンプルがイオン化される技術であり、イオン化された化学成分は電磁場に曝され、電磁場は化学成分をそれらの質量-電荷(m/z)比に従って分離する。クロマトグラフィー及び質量分析は複合混合物を構成成分に分離するものの、いずれの技術も化学成分の直接同定を提供しない。化学成分の識別(identity)は、化学成分の測定された特性の解析に基づいて決定される必要がある。
【0005】
本書で用いられる用語"分離"は、複合混合物をその構成分子又は代謝産物に分離するプロセスをいう。一般の実験室の分離技術は、電気泳動及びクロマトグラフィーを含む。
【0006】
本書で用いられる用語"クロマトグラフィー"は、分離される成分(すなわち、化学成分)が2つの相の間に分布する物理的な分離方法をいい、2つの相の1つは静止する(固定相)一方、他(移動相)は一定の方向に移動する。クロマトグラフィーの出力データは、本書の主題の実施形態で操作のため使用されるであろう。
【0007】
本書で用いられる用語"保持時間"は、クロマトグラフィープロセスでサンプルを分離装置に導入してからの経過時間をいう。サンプルの成分の保持時間は、サンプルを分離装置に注入した時間と、固定相を含む分離装置の一部にサンプルの成分が溶出する(例えば、分離装置の一部から出る)時間との間の、クロマトグラフィープロセスでの経過時間をいう。
【0008】
本書で用いられる用語であるサンプル成分の"保持指数(index)"は、補間によって得られる(通常は対数の)数をいう。この数は、サンプル成分の保持時間又は保持因子を、サンプル成分のピークの前と後に溶出する標準(standards)の保持時間に関連し、系統誤差を除去するため既知の標準の分離特性を使用する機構である。
【0009】
本書で用いられる用語"分離指数(index)"は、分離技術によって分離された化学成分に関連付けられた計量(metric)をいう。クロマトグラフの分離技術に対しては、分離指数は保持時間又は保持指数であってよい。非クロマトグラフの分離技術に対しては、分離指数は化学成分によって移動された物理的な距離であってよい。
【0010】
本書で用いられる用語"分離情報"及び"分離データは、分離指数に関して化学成分の存在又は不在を示すデータをいう。例えば、分離データは、特定の時間に溶出する特定の質量を有する化学成分の存在を示してよい。分離データは、時間とともに上昇し、ピークに達し、その後に下降する、化学成分の溶出量を示してよい。分離指数(例えば、時間)にわたってプロットされる化学成分の存在のグラフは、グラフのピークを示すであろう。このようにして、分離データの文脈内で、用語"ピーク情報"及び"ピークデータ"は、用語"分離情報"及び"分離データ"と同義である。
【0011】
本書で用いられる用語"質量分析"(MS)は、標的(target)分子をイオン化、又はイオン化及び断片化(fragmenting)し、その後、それらの質量/電荷比に基づいてイオンを分析し、"分子の指紋"として機能する質量スペクトルを生成することを含む、分子を測定及び分析するための技術をいう。対象物の質量/電荷比の決定は、その対象物によって電磁エネルギーが吸収される波長を決定することで行われてよい。イオンの質量-電荷比を決定するためのいくつかの一般的に使用される方法があり、いくつかはイオンの軌跡と電磁波との相互作用を測定し、他は、イオンが特定の距離を移動するのにかかる時間、又はその両方を測定する。標的分子の同定を得るため、これらのフラグメントの質量測定からのデータがデータベースと対照して(against)検索されることができる。質量分析は又、他の多くの間で、石油化学又は医薬品の品質管理のような化学の他の分野で広く使用される。
【0012】
本書で用いられる用語"質量分析計"は、質量分析装置内で、イオンの混合物をそれらの質量-電荷比によって分離する機器をいう。
【0013】
本書で用いられる用語"ソース(source)"は、質量分析装置内で、分析されるサンプルをイオン化する機器をいう。
【0014】
本書で用いられる用語"検出器"は、質量分析装置内で、イオンを検出する機器をいう。
【0015】
本書で用いられる用語"イオン"は、例えばその対象物に電子を追加し、又は電子を取り除くことで形成される、電荷を有するあらゆる対象物をいう。
【0016】
本書で用いられる用語"質量スペクトル"は、質量分析装置によって生成されたデータのプロットをいい、典型的にはx軸上のm/z値及びy軸上の強度値を含む。
【0017】
本書で用いられる用語"m/z"は、イオンの質量数をその電荷数で割ることによって生成される無次元量をいう。それは長い間"質量-電荷"比と呼ばれていた。
【0018】
本書で用いられる用語"スキャン"は、特定の分離指数に関連付けられた質量スペクトルをいう。例えば、クロマトグラフの分離技術を使用するシステムは、個々のスキャンが異なる保持時間における複数のスキャンを生成する。
【0019】
本書で用いられる用語"サンプル"はその広い意味で使用され、天然又は合成起源の標本又は培養物を含んでよい。
【0020】
本書で用いられる用語"生体サンプル"は、培養細胞、培養物及び発酵培地メディアと同様、植物、菌、又は人間を含む動物、流体、固体(例えば便)又は組織、酪農品、穀物、野菜、肉及び肉の副産物、並びに廃棄物のような液体及び固体食品並びに飼料製品及び原料をいう。生体サンプルは、野生動物及び野獣と同様、すべての様々な家畜の科(family)から得ることができ、有蹄動物、熊、魚、うさぎ(lagamorph)、齧歯動物のような動物を含むがこれらに限定されない。生体サンプルは、あらゆる生物材料を含んでよく、対象からの細胞及び/又は非細胞材料を含んでよい。サンプルは、任意の適切な生体組織、又は、例えば前立腺組織、血液、血漿、尿、又は脳脊髄液(CSF)のような体液から分離されることができる。
【0021】
本書で用いられる用語"環境試料"は、表面物質、土壌、水及び産業サンプルのような環境材料の他、食品及び乳製品加工機器、装置、機器、器具、使い捨て及び使い捨てでないアイテムから得られるサンプルをいう。これらの例は、本書の主題に適用可能なサンプルの種類を制限するものとして解釈されない。
【0022】
クロマトグラフがサンプルを化学成分に分離し、それが質量分析装置のイオン源に供給されるような、液体又はガスクロマトグラフの出力を質量分析装置の入力に結合させるシステムが存在する。従来のシステムは、質量スペクトルデータのライブラリ(library)に対して記録された質量スペクトルの適合解析を実行することにより、得られた質量スペクトルを解析する。しかし、この方法は、いくつかの欠陥を被る。
【発明の概要】
【発明が解決しようとする課題】
【0023】
第1に、化合物ライブラリ照合は、通常、保持時間や保持指数のような分離データを考慮しない。その結果、システムは、ライブラリの化学物質が観測された化合物と同一の分離特性を持つ又は持たない可能性に関係なく、典型的にはライブラリ内のすべての化合物と比較することにより、質量スペクトル内に観測された化合物を同定しようとする必要がある。いくつかの場合、2つの異なる化学成分は同じ質量を持ち、このようにクロマトグラフィーデータがなければ区別が付かない。使用された分離技術が同じ質量を持つ2つの化学成分を十分に分離しない場合、問題はさらに悪化する。この場合、たとえシステムが分離データを考慮したとしても、2つの成分は2つのピークでなく、単一のピークとして表われ、同様に互いに区別が付かない。
【0024】
第2に、質量スペクトルデータのライブラリが合成され得ることがある。ここで使われる用語"合成ライブラリ"は、別のシステム上、又は「コンピュータ内で(in silico)」、すなわち実証分析の結果でなく仮想又は計算結果に基づいて生成されたライブラリをいう。合成ライブラリは、実際に分析を実行するための方法及び機器の特定の特性を反映しないので、合成ライブラリが誤りを発生する可能性がある。
【0025】
第3に、高精度の質量分析装置のような、一般に"正確な質量"システムとして言及される高精度な従来のシステムは高価であり、それらの標準的な対応物よりも低いデューティサイクル(duty cycle)を有するであろう。従って、従来のシステムでは、精度とスループットとの間にトレードオフがあるであろう。さらに、正確な質量だけでは化学成分を高い信頼性で同定するには不十分である。例えば、アミノ酸のロイシンとイソロイシンとは原子の組み合わせが同一であるため同一の質量を持つが、それぞれの分子の位置がわずかに異なって配置されている。正確な質量だけでは、それらの間を識別することはできない。正確な質量は、化学成分の正確な同定の前提条件でもなく、これを保証するものでもない。
【0026】
第4に、いくつかの従来のシステムでは、特定の化学成分を探索し同定するよう構成されることを意味する、"標的とされた(targeted)"分析を実行する。このようなシステムは、現在までの(hitherto)未知のエンティティ(entity)を含むサンプルのすべての化学成分を検出し及び同定しようとする"非標的の(Non-targeted)"分析を実行することはできない。非標的な分析は、巨大な潜在的な応用と利点を持つ方法である。例えば、代謝産物や細胞プロセスの副産物を分析するメタボロミック(metabolomic)解析は、非標的な方法(つまり、全体的に)で、年齢、性別、又はその他の要因(例えば、健康又は病気の状態)に関する代謝プロフィールの変化を監視するのに役立つと共に、サンプルの基質に存在する薬、薬物、及び他の生体異物(生物内で発見されるが、通常は生物内で生成されないか、又は存在することを期待されない化学物質)と同様、食物代謝産物を検出することにまで及ぶことができる。複合混合物の化学成分の組成を非標的な方法で決定する能力は、様々な他の状況で有用となり得る。そのような状況の1つは、薬、酵素、化学物質、添加物及び他の有用な生成物を生成する細胞の増殖である生物プロセスである。他の状況は、生物及び環境試料の分析を含む。
【0027】
従って、非標的な方法で、複合混合物の化学成分の組成をより正確に決定するためのシステム及び方法を提供するための必要性が存在する。
【課題を解決するための手段】
【0028】
一の態様によれば、複合混合物の化学成分の組成の非標的決定のための方法は、分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、ここで前記分離データはピーク情報を含み、かつ前記質量分析データは1次及び2次質量分析データを含む。前記生成された分離及び質量分析データを含む解析結果は収集及び格納される。前記解析結果を化学物質の特性を示す情報のライブラリと比較することにより、前記サンプルの化学成分が決定され、この特性は分離及び質量分析データを含む。前記比較は前記分離及び質量分析データに基づいている。前記情報のライブラリは前記分離技術及び質量分析装置によって生成されるデータを含み、さらに同定され又は同定されていない化学物質の分離及び質量分析データを含む。前記サンプルの前記化学成分の表示は、人間がアクセス可能な形で利用できるようになされる。
【0029】
ここで使われる用語"同定された化学物質"は、高い信頼度で同定された化学物質を指し、一方で"同定されない化学物質"は、複合混合物中の化学成分として検出されたが同定されなかった化学物質を指す。
【0030】
ここで使われ、未同定の化学物質に適用される用語"認識"は、解析結果と、情報のライブラリに記録された未同定の化学物質の特性との比較に基づき、未同定の化学物質が複合混合物中の成分であるという決定を指す。認識は、同定と同義ではない。認識の例は、その存在が既に検出され、それについての入力が情報のライブラリに追加されていた特定の保持指数及び質量-電荷比を有する化学成分の存在の決定であり、入力はエンティティに関連するクロマトグラフィー及び質量分析データを含む。
【0031】
ここで使われ、化学物質に適用される用語"同定"は、化学物質の同一性の高い信頼性を持つ決定を指す。同定の例は、どちらも同一の化学式C7H7NO2を持つ7個の炭素原子、7個の水素原子、窒素原子、及び2個の酸素原子を有する分子がサリチルアミドでなく、アントラニル酸であるという決定である。
【0032】
ここで使われる用語、"人間にアクセス可能な形で利用できるように"は、情報をユーザに視覚的、聴覚的、又はタッチにより(例えば、点字を使用して)提示することを含み、情報を画面上の表示し、情報を含む印刷物を作成し、ワードプロセッサ、スプレッドシートプログラム、テキストエディタなどのコンピュータアプリケーションを使用してアクセス可能な形式で情報を格納することを含む。
【0033】
他の態様によれば、複合混合物の化学成分の組成の非標的決定のためのシステムは、サンプルの化学成分の分離及び分離データの生成のための分離ツール、前記サンプルの前記分離された化学成分の一部に質量分析を実行し、かつ質量分析データを生成するための質量分析装置を含み、前記分離データはピーク情報を含み、前記質量分析データは1次及び2次質量分析データを含む。システムは化学物質の特性を示す情報のライブラリを含み、その特性は分離及び質量分析データを含む。前記情報のライブラリは、前記分離ツール及び質量分析装置によって生成されるデータを含み、同定され又は同定されていない化学物質の質量分析データを含む。システムはさらに、前記分離及び質量分析データを解析結果として受信、収集及び格納するための解析モジュールを含む。前記サンプルの化学成分は、前記解析結果を前記情報のライブラリと比較することによって決定され、前記質量分析データは1次及び2次質量分析データを含み、前記比較は前記分離及び質量分析データに基づく。システムは、解析モジュールに結合され、人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行うためのユーザインターフェイスを有する。
【0034】
複合混合物の化学成分の組成の非標的決定のために本書に記述された主題は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせで実装されてよい。そのようなものとして、本書で使用される用語"機能"又は"モジュール"は、ハードウェア、ソフトウェア、及び/又は記述された機能を実装するためのファームウェアをいう。1つの典型的な実装では、本書に記述される主題は、コンピュータ読取り可能な媒体に表現されコンピュータで実行可能な命令を含むコンピュータプログラム製品を用いて実行されることができる。
【0035】
本書に記述される主題を実行するのに適した典型的なコンピュータ読取り可能な媒体は、ディスクメモリ装置(disc memory devices)、チップメモリ装置(chip memory devices)、プログラム可能論理回路(programmable logic devices)、及び特定用途向け集積回路を含むことができる。さらに、本書に記述される主題を実行するコンピュータプログラム製品は、単一の素子(device)若しくはコンピュータプラットホームに存在することができ、又は複数の素子若しくはコンピュータプラットホームに分散されることができる。
【図面の簡単な説明】
【0036】
【図1A】本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なシステムを示すブロック図である。
【図1B】本書に記述された主題の実施形態に従う、例示的なシステムによって収集された解析結果を示す図である。
【図1C】本書に記述された主題の実施形態に従う、例示的なシステムによって収集された解析結果を示す図である。
【図2A】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2B】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2C】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2D】本書に記述された主題の実施形態に従う、クロマトグラフィー及び質量解析結果情報を格納するための例示的なデータ構成を示す図である。
【図2E】本書に記述された主題の実施形態に従う、化学物質の情報を格納するための例示的なデータ構成を示す図である。
【図2F】本書に記述された主題の実施形態に従う、化学物質の情報を格納するための例示的なデータ構成を示す図である。
【図3】本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なプロセスを示すフローチャートである。
【図4A】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4B】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4C】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4D】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4E】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4F】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【図4G】本書に記述された主題の実施形態に従う、システムのユーザに表示される情報のスクリーンショットを示す図である。
【発明を実施するための形態】
【0037】
本書に記述された主題の好適な実施形態は、添付の図面を参照してここで説明され、同等の参照数字は同等の構成部分を表す。
本書に開示されている主題によれば、複合混合物の化学成分の組成を決定するためのシステム、方法、及びコンピュータ読み取り可能な媒体が提供される。
図1Aは、本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なシステムを示すブロック図である。システム100は、分析されるサンプルを化学成分に分離するための分離技術を実行する構成部分を含む。一実施形態において、システム100は、分離を実行するクロマトグラフ102部と、クロマトグラフ102部の溶出物(すなわち、クロマトグラフ102から溶出する化学成分)の質量分析を実行する質量分析装置(MS)104とを含む。一実施形態では、クロマトグラフ102は超高圧液体クロマトグラフ(UHPLC)である。その代わりに、小さな分子、すなわち特定の化学種の特徴であるパラメータとなる2,000ダルトン未満の分子量を持つ分子の分析に修正可能であり、かつ任意の大気圧又はソフト脱離(soft desorption)イオン化技術と互換性を有する、他の化学分離法が用いられることができる。その他の分離方法は、イオン移動度分析(IMS)、キャピラリーゾーン電気泳動法(CZE)、高速液体クロマトグラフィー(HPLC)、及びモノリシック(monolithic)液体クロマトグラフィーを含む。
【0038】
図1に示す実施形態において、システム100は、移動相容器106、及び移動相に押し込むポンプ108、及びサンプル入力110を介し、カラム112を高圧で通って移動相に注入されるサンプルを含む。サンプルの様々な化学成分は、異なる速度でカラム112を通って溶出され、そのため異なる時間にカラム112を出る。サンプルの化学成分がカラム112を通過して出るまでにかかる時間は、化学成分の保持時間と呼ばれる。
【0039】
カラム112の出力は、イオン化装置114に供給されます。液体クロマトグラフを使用するシステムについて、イオン化装置114はまた、カラム112から出る流出物をイオン化ガスに変換してもよい。例えば、イオン化装置114は、エレクトロスプレーイオン化装置(ESI)、大気圧化学イオン化装置(APCI)、又は他の大気圧又はソフト脱離イオン化技術であってよい。イオン化ガスは、焦点リング116を通過してMS104の質量分析部に入る。図1に示される実施形態においては、MS104の質量分析部は、検出器120に結合される四重極イオントラップ118である。その代わりの実施形態は、飛行時間型質量分析装置、イオントラップの無い四重極質量分析装置、及び他の種類のイオントラップを有する質量分析装置を用いてもよい。
【0040】
分離及び質量分析データを格納するため、検出器120データが結果データベース122に収集されると共に格納される。その代わり、分離及び質量分析データは、メモリ内又は記憶装置上で、又は当業者に知られている他のデータ記憶手段経由で、テーブル又は他のデータ構造に格納されてもよい。図1に示される実施形態においては、結果データベース122はクロマトグラフィー及び質量分析データを格納するために用いられてもよい。例えば、結果データベース122は液体クロマトグラフィー及び質量分析(LC/MS)データを含んでよい。別の実施形態では、他の種類の分離データが結果データベース112に格納されてよい。
【0041】
システム100は又、解析結果と様々な化学物質の情報リスト特性のライブラリである化学ライブラリ126との比較に基づき、サンプルの組成を決定するための解析モジュール124を含んでよい。システム100は、グラフィカルユーザインターフェイス(GUI)のようなユーザインターフェイスUI 128を含んでよい。例えばシステムに分離及び質量分析ステップを実行するよう指示し、結果を閲覧し、システムに追加の分離及び質量分析ステップを実行するよう指示し、さらに化学ライブラリ126内のエンティティとの最大一致(best match)に基づいてサンプルの組成を決定するため、システムに自動比較及び同定ルーチンを実行するよう指示するために、ユーザはUI128を用いてもよい。又、化学ライブラリ126にアクセスし、手動で解析結果をライブラリエンティティと比較し、又は自動同定ルーチンの結論を検討/確認するために、ユーザはUI128を用いてもよい。
【0042】
図1Bは、本書に記述された主題の実施形態に従う、例示的なシステムによって収集され得る解析結果のプロットを示す。図1Bに示される3次元プロットは、X軸上の保持時間又は保持指数、Y軸上のm/z、及びZ軸上の強度を表示する。一実施形態では、化学成分がカラム112を出ると、質量分析装置104は、一連の質量スペクトル又はスキャンを異なる保持時間で生成する。図1Bに示すスキャン130例のX軸に沿う幅は、視認できるよう誇張されている。単一の図形のピーク"が同じm/z比の複数の化学物質を表すと共に、そのピークが同じ時間(すなわち、スキャンが取られた時間)に溶出される可能性があるにもかかわらず、それぞれのスキャン130は、質量軸で一般に"イオン"と呼ばれる図形のピークを示す。図1Bに示す例において、スキャン130は、m/z比が283.02のイオンを表し相対存在度が100%である質量ピーク132を含む、いくつかのピークを含む。ピーク132にすぐに隣接して左に、m/z比が280.02で相対存在度が約75%の別のピークがある。200.07、362.92、385.01等のm/z比を有し、非常に小さい相対存在度(<15%)を有する他のイオンが示される。
【0043】
図1Cは、スキャンデータの例を示す。図1CのパネルAに示すように、スキャンは、検出された特定のm/z比のイオンの相対数(relative number)に対応するピーク及び谷を示すであろう。図1CのパネルAに示される質量ピークは又、図1CのパネルBに示されるような'棒(stick)'形で表されるであろう。棒表現は、重心質量ピークデータと呼ばれ、データファイルのサイズが減少される。例えば化学成分を電気泳動で物理的に分離するなどの他の分離技術を使用する実施形態について、それぞれのスキャンは保持時間又は正規化保持時間(例えば、保持指数)ではなく、距離又は正規化距離に関連付けられるであろう。
【0044】
分離を表す軸(例えば、クロマトグラフ分離技術に関する時間、又は物理的な分離技術に関する位置)に沿って複数のスキャンが準備される場合、各イオンについての強度値が上昇及び下降するのが観測され、X軸に沿ってクロマトグラフピークを生成し、それぞれのクロマトグラフピークが特定のm/z比に関連付けられる。簡単のため、用語"クロマトグラフピーク"は、分離を表す軸(例えば、時間、距離など)を横切る1又はそれ以上のイオンの有無を表すピークを意味するために一般に使用されることができる。図1Bにおいて、2次元プロット134は注入に対するクロマトグラフィーデータを示し、ピークは特定のm/zのイオンの存在が時間とともに変化することを表す。図1Bに示される例では、クロマトグラフプロット134は200.00〜200.25の範囲のm/z比を有するイオンを示し、ピーク136は、200.06のm/z比を有すると共に、ピーク最大値が3.02分であり、約3.0分から約3.1分まで溶出するイオンの存在を示す。
【0045】
分離及び質量分析データは、以下総称して"解析結果"と称される。解析結果は、サンプルの1又はそれ以上の解析実行(analysis run)からのデータ、サンプルの異なる種類の解析からのデータ、及び異なるサンプルの解析からのデータを含めることができる。解析結果は、分離及び質量分析情報を含む結果データベース122に格納される。分離情報は、ピーク情報を含むことができる。分離のためのクロマトグラフィー技術を使用するシステムでは、分離情報は保持時間及び/又はピークの保持指数のような保持情報を含むことができる。ピーク情報は、ピーク強度;ピークのベースの幅;ピークのベースの開始と終了の保持時間;ピークのベースの開始と終了の強度;ピークの高さの半分でのピークの幅;ピークの面積;ピークの対称性;ピークのノイズ;ピークに関連する質量;ピークに関連する質量-電荷比;イオン間の親子関係を記述するイオンツリー(ion tree)内のエンティティと、ピークとの関係;及びピークに関連するスキャンのリスト:を含む、ピークを記述する情報を含むことができる。
【0046】
解析結果は、タンデムMSによって生成されたデータを含んでもよい。ここで用いられる用語"タンデムMS"は、"1次MS"と呼ばれる最初のMSステップが実行され、続いて"2次MS"と一般に呼ばれる1又はそれ以上の後続するMSステップが実行される操作をいう。1次MSでは、1次質量スペクトルの生成の間に、1つ(そしておそらく1つ以上)の化学成分を表すイオンが検出及び記録される。イオンによって表される物質は、2次質量スペクトルとして検出及び記録される副成分(sub-component)に物質を分割するため、関係する物質を断片化させる2次MSにさらされる。真の(true)タンデムMSには、1次MSで関心あるイオンと、2次MSの間に結果として生成されるピークとの間に明確な関係がある。1次MSで関心あるイオンは"親"又は前駆イオンに対応し、2次MSの間に生成されるイオンは親イオンの副成分に対応し、本書では"子"又は"副産物(product )"イオンと呼ばれる。
【0047】
従って、タンデムMSは、複合混合物の化学成分の親子関係を表すデータ構造の生成を許容する。この関係は、子イオンが親イオンの副成分を表し、親及び子イオンの関係を示す樹状(tree-like)構造によって表現されるであろう。例えば、"孫"イオンを決定するため、タンデムMSが子イオンに繰り返されてもよい。従って、タンデムMSは断片化の2つのレベルに限られず、"MSn"とも呼ばれる一般に複数レベルのMSに言及するために使用される。用語"MS/MS"は、"MS2"と同義語である。簡単のため、用語"子イオン"は、以下で2次又は高次の(すなわち、1次でない)MSによって生成された任意のイオンをいう。
【0048】
例えば、1次質量スペクトルは、5つの図形ピークとして表されるであろう、5つの異なるイオンを含むかもしれない。1次MS内の各イオンは、親イオンであってよい。各親イオンは、その特定の親イオンに対する子イオンを示す質量スペクトルを生成する2次MSにさらされてもよい。一実施形態では、強度の閾値よりも高い強度を持つイオンの検出が自動的に2次MSの実行を引き起こすよう、強度の閾値が1次MSに設定されてもよい。この例では、物質は、クロマトグラフィーステップで分離を受け、それぞれ別の時間に溶出する化学成分X、Y、及びZに分離されてもよい。化学成分Xは質量分析装置のソースに入り、例えばX1、X2、及びX3のように複数のイオン種にイオン化され(さらに場合により断片化され)、それらは1次質量スペクトルのいくつかのイオンとして記録される。1次質量スペクトル内の1つのイオン、例えば、X2が強度の閾値を超え、2次MSの実行を引き起こしてもよい。
【0049】
一実施形態では、成分Xが1次MSを受けている時間の間、成分Xはクロマトグラフから溶出し続けてもよいが、質量分析装置によって無視される。2次MSが引き起こされる時間で、成分Xはまだ溶出している場合、他のサンプルはMSのソースによって受け入れられ、成分Xの第2のサンプルに2次MSが実行されてもよい。既に述べたように、この第2のサンプルはX1、X2、及びX3にイオン化され(さらに場合により断片化され)るが、X1とX3がイオントラップから放出されている間、X2はイオントラップでトラップされる。X2はその後、例えば副成分X2AとX2Bとに断片化されてもよい。成分Xがクロマトグラフからまだ溶出されている場合、例えば、副成分X3を決定する追加の2次MS、又はさらに高次のMSが実行されてもよい。例えば、その成分X2Ai、X2Aii、等を決定するため、第3のMSがX2Aに実行されてもよい。
【0050】
この例は、タンデムMSを使用することにより、親イオンX2が明確にその子イオン、X2A及びX2Bに関連し、その関係は親と子イオンの相対的な質量-電荷比に関する情報を含むことを示す。
【0051】
子イオンと親イオンの質量-電荷比及び相対強度の両方の関係を明確に理解することは、本書で"イオン計算(ion accounting )"と呼ばれ、解析実行で生成されたすべてのイオンが調査されると共に、化学物質にそれらをすべて帰属させるよう試みられる強力な技術を可能とする。化学物質に帰属できない任意のイオンは、混合物中の新しい化学成分である可能性があり、この場合、これらのイオンについて、新しいライブラリ入力が必要に応じて行われることができる。従って、これまで未知の化学成分が検出されると、成分の同定が不明であっても、未知の化学成分の存在が続いて検出、つまり認識されるよう、それらの属性を記述する情報が格納されるであろう。この方法では、新規又は未知の化学成分が検出され、続いて認識され、最終的に同定されるであろう。
【0052】
親/子関係は又、分離された成分(例えば、クロマトグラフィー段階から溶出する成分)と、1次MSで検出されたイオンとの間の関係を記述するために拡張されてもよく、さらに分析されるサンプルと分離された成分との間の関係にまで拡張されてもよい。
【0053】
さらに、結果データベース122内の解析結果は、解析結果の一般的な性質を記述する情報、又は他のメタデータを含んでよい。例としては、解析の間に取得された1次スキャンの数;解析の間に取得された2次スキャンの数;実際に取得された2次スキャンに対する、取得可能であった2次スキャンの割合;同定された化学物質のピーク内に存在した、取得された2次スキャンの数;同定された化学物質のピーク内に存在した、取得された2次スキャンの割合;解析の間に記録されたピークの数;2次スキャンが取得されたピークの数;2次スキャンが取得されたピークの割合;ピークに関連付けられた1つ以上の2次スキャンを有するピークの数;ピークに関連付けられた1つ以上の2次スキャンを有するピークの割合;2次スキャンが実行されなかった最大ピークの面積;2次スキャンが実行された最小ピークの面積;を含む。
【0054】
解析モジュール124は、1又はそれ以上のサンプルの特性と、化学ライブラリ126に格納された化学物質についての情報との比較に基づき、サンプルの化学成分を決定してもよい。一実施形態では、比較は、保持情報とピーク情報の双方に基づく。化学ライブラリ126に格納された情報は、保持時間、保持指数、付加物を含む1次スキャンで観測された質量、同位体の関係、インソース・フラグメンテーション(in-source fragmentation)、及び上記の相対強度を含んでよい。ライブラリの入力は、フラグメント、サブ-フラグメント、例えばMSnで生成された親-子のイオンデータであるサブ-サブ-フラグメント・データのツリー構造に整理され、任意のイオンに追跡可能であり、イオンは、付加物又は同位体を含む分子の化学成分として同定することができる。ライブラリの入力は又、構造情報、物理的性質、物理的な祖先(stock)のリスト、公開化学データベースへのリンク、種々のライブラリ入力へのリンク、及び手持ちの化学物質上で実行される実際の機器データへのリンクを含んでよい。用語"信頼できる(authenticated)ライブラリ入力"は、実際の機器を使用して解析され同一性が明白な化学物質に関する情報を含むライブラリ入力をいう。
【0055】
一実施形態では、化学ライブラリ126は、サンプル内の未知又は未同定の化学成分についての情報を格納するために使用されてもよい。その保持時間、質量-電荷比、及び他の情報のような、未知のイオンについての情報は、別のサンプルの解析中にそれに続く比較のために格納されてもよい。この方法では、これまで未知のイオンが検出され、続いて一連の解析実行によって同定されるであろう。既知の化学成分の有限数に対しサンプルを試験する従来の化学検査とは異なり、本書に記述される主題は、複合混合物のこれまで未知の化学物質であっても、あらゆる化学成分を検出し及び最終的に同定するために使用されることができる。
【0056】
解析モジュール124は、1)保持ウィンドウ(保持時間、保持指数)のような分離データ;2)1次MSスキャンでの分子イオンの質量;及び3)2次MSスキャン(すなわち、MS/MS又はMSn)でのフラグメントパターン:の3つの情報源からの情報の1又はそれ以上の組の比較に基づいて、サンプルの組成を決定するよう構成される。
【0057】
一実施形態では、解析結果及び化学物質に関する情報は、リレーショナルデータベース構造に格納されてもよい。図2Aから図2Dは、結果データベース122の結果情報を格納するための例示的なデータ構造を示し、図2E及び図2Fは、本書に記述された主題の実施形態に従う、化学ライブラリ126内の化学物質の情報を格納するための例示的なデータ構成を示す。
【0058】
図2Aは、特定のスキャンの結果を格納するための例示的なテーブル構成を示す。テーブル"MBZR_SCANS"内の各入力は、保持時間、スキャン数、質量、及び強度データ配列等の情報を含む。
【0059】
図2Bは、スキャンデータとつながりのある質量分析ツリー構造を模するための例示的なテーブル構成を示す。テーブル"CHRO_ION_TREES"内の各入力は、親ノードの同一性、結合イオン(linking ion)の質量、保持情報、及びスキャンデータの参考資料のような情報を含む。
【0060】
図2Cは、ピーク情報を格納する例示的なテーブル構成を示す。ピークテーブル"MBZR_PEAK"は、質量、保持時間又は保持指数、ピーク下の面積、及びノイズ等の他のより小さなピーク特性によって特徴付けられるクロマトグラフのピークを含んでよい。例えば、一つの解析で、検出可能なピークの特定の数Pを有する1組の質量スペクトルを生成してもよく、その場合Pの入力が、検出されたピークごとに1つの入力でピークテーブルに追加されてもよい。
【0061】
図2Dはクロマトグラフィーに関連する1組のピークを整理するための例示的なテーブル構成を示す。テーブル"MBZR_COMPONENT"内の各入力は、1又はそれ以上のスキャンで特定の保持時間で検出されたピークに化学成分を関連付けるであろう。
【0062】
図2E及び図2Fは、本書に記述された主題の実施形態に従う、化学ライブラリ126内の入力の例示的なテーブル構成を示す。一実施形態においては、名称、構造、化合物、融点などの分子情報は、RT/RI、実行の種類(例えば、LC+/-、MS+/-、MSn)、質量(例えば、M+H、2M+H、イオンフラグメント、付加物)、及びフラグメント情報へのポインタなどの化学物質情報と別に格納される。化学物質は、同定された場合に、参照分子に戻って(back to)指すことができる。
【0063】
図3は、本書に記述された主題の実施形態に従う、複合混合物の化学成分の組成を決定するための例示的なプロセスを示すフローチャートである。
【0064】
ブロック300で、クロマトグラフ及び質量分析装置を用い、サンプルのクロマトグラフィー及び質量分析データが生成される。生成されたデータは、ピーク情報と保持情報を含む。図1に示す実施形態では、サンプル入力ポート110に注入されたサンプルは、カラム112から溶出する。クロマトグラフ102がUHPLCなどの液体クロマトグラフの形である場合、イオン化装置114は、流出物をイオン化すると同時に液相から気相に変換するエレクトロスプレーイオン化(ESI)装置であってよい。イオン化された粒子は、このように質量分析装置104に入る。一実施形態では、イオン化された粒子は焦点リング116を通過し、例えば四重極イオントラップ118を通って検出器120に入るようにして、質量分析装置104の質量分析部に入る。
【0065】
ブロック302で、生成されたクロマトグラフィー及び質量分析データが収集及び格納される。例えば、強度のような、保持時間及び保持指数などの保持情報に沿ったピーク情報は、結果データベース122に記録されてもよい。
【0066】
複数のクロマトグラフィー及び/又は質量分析実行がサンプル上に実行され、データが解析のために収集及び格納されてよい。例えば、サンプルは、酸性及び塩基性の両方の液体クロマトグラフィー、すなわち、それぞれ正又は負イオンの生成を促進する移動相を使用する液体クロマトグラフィーにさらされてよい。サンプルは、正イオンと負イオンの両方の質量分析にさらされてよい。同一のサンプルに複数の実行が行われてもよい。上記したすべてのデータは、結果データベース122に格納されてよい。
【0067】
一実施形態では、システム100はタンデムMSを実行するよう構成される。本書で使われる用語"タンデムMS"は、親分子、イオン、又は質量分析データが知られている化学物質がさらに断片化され、質量分析情報がフラグメントのために収集されるすべての技術をいう。これは、指定された分子からのすべてのフラグメントが、デバイスの内部構造に基づいて生じる幾つかのプロセスを介してその分子に帰属するあらゆる技術を包含する。本書で使われる用語"タンデムMS"と"多段のMS"は同義である。例えば、システム100はイオントラップによって真のタンデムMSを実行してもよく、又はトリプル四重極MSを用い、若しくは個々の質量の分離及びさらなる断片化を許容するあらゆる技術によって真のタンデムMSに相当するものを実行してもよい。
【0068】
ユーザによって定義され、システム100によって実行される解析の目的に従って、カラム112から溶出する個々のかつすべての分離した化学成分に質量分析(又はタンデムMS)が実行されてもよく、サンプルの化学成分の一部がカラム112から出てくる時に、それらのみに質量分析が実行されてもよいことは、容易に理解できる。
【0069】
ブロック304では、サンプルの化学成分は、解析結果と、化学ライブラリ126などの化学物質の特性を示す情報のライブラリとを比較することによって決定される。一実施形態では、上記した特性の照合に基づいて、解析モジュール124がピークで表される化学物質の同一性を最も良く推測してよい。この方法では、ピークは化学ライブラリ126にリストされているエンティティに関連付けられるであろう。一実施形態では、ピークに関連付けられるエンティティは、イオン間の親子関係を記述するイオンツリー上のノードであってよい。一実施形態では、ピークは、そのデータがピークを表示するスキャンリストに関連付けられるであろう。
【0070】
ブロック306では、サンプルの化学成分の表示は、人間がアクセス可能な形で利用できるようになる。一実施形態では、ユーザインターフェイス128は、化学成分の視覚的表示を提供してもよい。例えば、UI128は、検出又は同定された化学成分を示す解析結果を表示してもよい。また、ユーザインターフェイス128は、グラフィック、テキスト、又は点字印刷を生成してもよく、コンピュータで生成されたせりふなどの音声を生成してもよく:又は電子メール、テキストメッセージ、若しくはテキスト文書、スプレッドシート、データベースなどのコンピュータファイル、を生成することが生成してもよい。
【0071】
上記したシステム及び方法は、従来のシステム及び方法に比べていくつかの利点を持つ。まず、ピークデータのみを使用してピークで表される化学成分を同定しようとする、従来のクロマトグラフィー+質量分析システムとは異なり、解析モジュール124は、ピーク情報と保持情報の両方に基づいて比較を実行する。ピークの保持時間/保持指数を考慮することにより、解析モジュール124は、問題となっているピークについて測定された保持情報以外の保持情報を有することが知られている分子を排除し、その検索空間を大幅に減らすことができる。さらに、分子はLC+実行に対する1つの保持時間及びLC-実行に対する別の保持時間を有してもよいので、サンプルが異なる種類のLC実行に対して予期された場所でピークを示す場合、サンプルが問題となっている分子を含む信頼性が高い。
【0072】
同様に解析モジュール124は、異なる種類の複数の解析実行を検討するだけでなく、タンデム又は多段の質量分析を実行してもよく、解析実行によって生成される豊富なデータは、親分子だけでなく、子分子若しくはイオン、又は他のフラグメントにも同様に一致するであろう。これは又、サンプル内の化学成分が正しく同定されているという高い信頼性を生じさせる。
【0073】
第2に、情報のライブラリ126は、信頼ある(authentic)データ、すなわち、参照基準を使用し分離ツール及び質量分析装置によって生成されたデータを含む。例えば、仮想又はモデル化された動作に基づいてコンピュータ内で生成されたデータである合成データとは異なり、信頼あるデータは、サンプルを分析するために使用されるのと同じ機器による同一の分析方法を使用して記録された結果に基づく。従って、特定の分子について、その分子のライブラリ情報は、その分子を含むサンプルについての解析結果とより密接に一致する。これは、例えば、正のLCに対する特別な移動相組成、及び負のLCに対する他の特別な移動相組成を使用するような、細かく調整されたシステムを有するラボ又は工場にとって特に重要である。
【0074】
第3に、情報のライブラリは、同定された化学物質と同様、未同定の化学物質のクロマトグラフィー及び質量分析データを含んでもよい。図1に示す実施形態では結果データ122は化学ライブラリ126と別のものとして示されるが、別の実施形態は、結果データ及びライブラリデータを一緒に格納するための、例えばテーブルなどの単一のデータベースを使用してよい。図1に示すように結果データがライブラリデータから概念的に分離していても、解析モジュール124は、結果データベース122に表れ続け、まだ未同定である未知のピークを検出し、化学ライブラリ126内に謎の分子の入力を生成するよう構成されてもよい。この方法では、分子の同一性が未知であるにもかかわらず、システム100は、この謎の分子の有無を報告することができる。システム100は、サンプル集合のイオン配列を報告することができ、さらにイオンを同定及び分類してもよい。例えば、解析モジュール124は、すべてのイオンについてMSnレベルでライブラリに対してイオンを照合してよく、さらに、ユーザによるその後の検査のため又はシステム100によるその後の処理のため、あらゆる不明のイオンにフラグを立ててもよい。
【0075】
未知の代謝産物の初期検出及びその後の認識などの非標的分析を実行するこの機能は、膨大な利点を有する。例えば、癌ありと癌無しの細胞の代謝解析では、癌細胞がほとんど常にいくつかの謎の分子を含むことを示す一方で、健康な細胞がそうでないことを解析結果が示す場合、これは癌の検出又は治療のための研究の重要な方向性を与える。
【0076】
一実施形態では、ユーザが2つの視覚的な比較を実行できるよう、又はシステムによって実行された比較の正しさを視覚的に確認できるよう、サンプルの組成を決定することが解析結果に沿って特定のエンティティのためのライブラリ情報を表示することを含んでよい。UI128は、ユーザがサンプルの最初の解析を実行し、さらに最初の解析の結果を表示することを許容する。
【0077】
図4A-4Gは、本書に記述された主題の実施形態に従う、UI128を介してユーザに表示される情報のスクリーンショットである。図4A-4Gに示された実施形態において、分離技術はいくつかのクロマトグラフィーの形式であると仮定され、分離情報は保持時間及び/又は保持指数を含む。これは、例示的な実施例として意図され、本書に記述された主題の限定ではない。
【0078】
図4Aは、UI128を介してユーザへ表示される、化学ライブラリ126内のライブラリ入力についての情報を示すスクリーンショットである。図4Aは、"既存物質リスト(Chemical Inventory)"というタイトルのウィンドウ400を示し、左上に検索ウィンドウ402を含み、左下にあるライブラリブラウザウィンドウ404を含み、さらにウィンドウ400の右側にあるライブラリ入力ウィンドウ406を含む。ユーザは様々な情報のライブラリを検索するため、検索ウィンドウ402を使用することができる。ユーザは、様々なデータベース又は情報のライブラリを閲覧するため、ライブラリブラウザウィンドウ402を使用することができる。図4Aに示される実施形態では、ライブラリウィンドウ406は、この例では"LIMS"と称されて階層ツリー構造に配置された化学ライブラリ126を示す。化学ライブラリ126の構造は、サブフォルダ(サブディレクトリ)及びエンティティ(ファイル)を含むフォルダ(ディレクトリ)の階層としてライブラリウィンドウ406内に表示されるが、実際のライブラリの構造はファイル/ディレクトリ実装に限定されず、ファイル、ディレクトリ、データベース、揮発性又は非揮発性メモリに格納されるデータ、ディスク若しくはメモリ記憶装置、コンパクトディスク、又はデータの記憶及び/又は編成(organization)のための他の手段、を任意の組み合わせとして実装されてもよい。図4Aに示される実施形態では、化学ライブラリ(LIMS)126は、個々の化学物質(化学物質)408についての情報のライブラリ、公共のデータベース又はそこから(公共DB)選ばれたデータ410へのリンク、及び信頼ある化学物質のライブラリ(ライブラリ)412、及び認識されたがまだ同定されていない化学物質の情報、を含む。
【0079】
一実施形態では、化学物質408は、使用される分離又は質量分析技術に応じて変化しない個々の化学物質についての情報を含むことができる。このような情報は、分子構造、分子式、分類、及び標準的な名前又は名前を含んでよい。これに対し、ライブラリ412は、使用される分離又は質量分析技術に依存する保持時間などの個々の化学物質についての情報を含んでよい。例えば、ガス又は液体クロマトグラフが使用されたか、分離ステップ中に使用された移動相が酸性又は塩基性か、等によって、同じ化学物質が完全に異なる保持時間を有するかもしれない。これらの実施形態では、機器固有のデータはライブラリ412に格納され、一方で化学物質の本質的な特性は、化学物質408に格納されてもよい。一実施形態では、化学物質408及びライブラリ412への入力は互いに相互参照され、さらに双方が公共DB 410又はLIMS126の他のサブコンポーネントへの入力と相互参照されてもよい。
【0080】
図4Aに示される実施形態では、ライブラリ412は、それぞれが分析の種類又は機器の組み合わせを表す複数のサブライブラリ414、416、及び418に分類される。例えば、サブライブラリ414は、ガスクロマトグラフを使用して分離された化学物質の信頼ある結果を含むのに対し、サブライブラリ416は、超高圧液体クロマトグラフィーを使用して分離された化学物質の信頼ある結果を含んでよい。サブライブラリ418は、収集されたがまだ認証されていないようなクロマトグラフィー及び質量分析情報を含んでよい。各サブライブラリは、既知及び未知の化学物質420に関する情報を含んでよい。図4Aにおいて、以下単に"カテキン"と称される、既知の化学物質(+)-カテキンが選択されている。
【0081】
図4Aに示される実施形態では、ライブラリウィンドウ406は選択された化学物質カテキンの情報を表示する。化学物質420に関し、表形式426とグラフ形式428の両方で、化学物質の同定についての情報422、化学物質のクロマトグラフィー情報424、及び化学物質の質量分析情報のような、広義のカテゴリに視覚的に分類されるいくつかの種類の情報が存在するであろう。
【0082】
化学同定情報422内で、化学物質の同定は、その化合物名、ライブラリID、及び化合物IDを含むことができる。一実施形態では、ライブラリID及び化合物IDが化学ライブラリ126内の化学物質を明確に同定するために使用されるのに対し、化合物名は読みやすくするために使用される非公式又は一般名である。化合物名及び化学名フィールドの組は、潜在的に複数の非公式名の中から選択するために使用される。化学レポート名及びライブラリレポート名フィールドは、生成された化学レポート及びライブラリレポートにエンティティが参照される時に、ユーザがどのような名前が使用されるかをそれぞれ選択することを許容する。
【0083】
化学物質のクロマトグラフィー情報424は、その保持時間(RT)及び保持指数(RI)を含んでよく、さらに同定プロセス中に使用されるRTウィンドウ及びRIウィンドウを含んでよい。例えば、カテキンは、2の保持時間ウィンドウを有する2.42の保持時間(RT)を持ち、25の保持指数ウィンドウを有する2493の保持指数(RI)を持つ。図4Aに示される実施形態では、ライブラリ入力の情報源は、グループ名及び源(origin)フィールドで示される。グループ名は、データを生成する特定の分析実行を識別する。分析実行は、分析される物質のサンプルをクロマトグラフの入力ポートに注入する行為に関し、本書では"注入"と称される。源は、入力を生成するために使用されるソフトウェアの種類に言及し、例えば実際の分析実行から由来するデータを示す。信頼(confidence)フィールドは、化学物質が実際にどのようにそれが同定されているかの相対的な信頼度を示す。例えば、信頼値100は、システムによって記録され、ライブラリ入力に格納された結果が、化学物質カテキンを表す信頼性が高いことを示す。信頼値は0に設定されてもよく、この場合、照合過程、すなわち分析された物質が化学ライブラリ126内の潜在的な候補と照合される過程の間、化学ライブラリ126内の入力が考慮されない。
【0084】
上記したように、本書に記述された主題は、非標的分析を実行する能力を有する。これは、化学成分が同定されないにもかかわらず、検出され続いて認識されるであろうことを意味する。この場合、ライブラリIDと化合物IDフィールドが値を含むが、化合物名フィールドが空であってもよい。100未満の信頼値は、謎の化学物質が明確に認識されたが、まだ同定されていないことを示すであろう。
【0085】
質量分析情報426は、視覚的にいくつかのタブに整理されてもよい。図4Aに示される実施形態では、"質量"タブは、1又はそれ以上の注入の間に収集された質量分析情報を含む質量情報テーブルを表示する。"公共DB"タブは、様々な情報を含むであろう公共データベースから収集され又は得られる情報を表示する。例えば、公共DBタブは、公共MSデータベースから収集され若しくは得られる質量分析情報、又はその他の公共データベースからの他の種類の情報を含んでよい。質量情報テーブルは、1次スキャンで観測された質量のリストを含んでよく、さらに1次イオンの質量だけでなく、付加物( m+H、m+Na,2m+H)、同位体を含む分子(例えば、C-13、Cl-35、Cl-37)、及び予想され又は一般に生じるインソース・フラグメントなどの変異体(variant)の質量を含んでよい。図4Aに示される実施形態では、質量情報テーブルは、1行ごとに1つの変異体で、カテキンの複数の変異体の情報を含む。図4Aに表示される情報は1次MSデータであるが、行の左端にあるプラス記号("+")は、2次MSデータも利用可能であることを示す。2次MSデータの表示は、以下の図4Bに記述されている。
【0086】
変異体は、次の命名規則を使用する。小文字の"m"は化学物質を象徴し、"m+H"は、実際に外側の電子が剥ぎ取られた水素原子(原子記号"H")であるプロトンが化学物質にくっついて生成されたイオンを象徴する。大文字"M"は、化学物質のフラグメント、又は化学物質を含む化合物のいずれかを象徴する。例えば、"M-151"は、その分子構造から原子に値する151原子単位を失った化学物質のインソース・フラグメントを指し、一方で"M+16"は、原子に値する16原子単位がその分子に追加された化学物質を含む化合物を指す。四角かっこ内の記号は、分子内の同位体の存在を示す。例えば、"m+H[C13-1]"は、1つの炭素原子(原子番号12)が炭素-13同位体で置換されているイオンを指し、"m+H[C13-2]"は、2つの炭素原子が炭素-13同位体で置換されているイオンを指す。
【0087】
各イオンの情報は各行内の列として示され、変異体の質量を示す質量列、及び質量ウィンドウ列を含むことができる。質量ウィンドウは、検出された化学成分に潜在的に一致するとみなされる可能性があるライブラリ入力内の許容誤差である。質量比列は、全体としての集団に対し、1又はそれ以上の同位体を有する変異体の相対的な割合を示す。'Quant_mass(量子質量)'列は、化学物質(例えば、カテキン)の情報の要約に含まれる質量を、どの変異体が有するかを示す。重み列は照合プロセスの間に使用され、ユーザが照合プロセスの感度を微調整することを許容する。名前列は、質量情報を人間が読み取れるよう使用される説明フィールドである。
【0088】
ライブラリウィンドウ406の下部に表示されるものは、Y軸上のイオンの相対強度と、426に表示される表形式のデータから得られるX軸上の質量とによる、グラフ形式428で示される質量情報である。
【0089】
図4Bは、UI128を介してユーザへ表示される、化学ライブラリ126内のライブラリ入力に関する詳細情報を示すスクリーンショットである。図4Bでは、質量291.1を持つイオンの1次MSデータは、そのイオンの2次MSデータを表示するよう拡張されている。図4Bに示される実施形態では、1次MSデータが拡張されていることを示すため、行の左端にあるプラス記号がマイナス記号("-")に変更されている。図4Bでは1つのレベルの2次MSデータのみが示されているものの、より高次のMSデータも同様に利用され、表示されてもよい。質量情報グラフ428は今度は、1つの変異体が質量123.1を有し、他が質量139.1を有する高質量比の2つの変異体が、グラフ内の2つの最も高いピークとして見られる2次MSデータを示す。
【0090】
図4A及び4Bは、ライブラリ412内の入力に格納される情報を表示する。図4Cは、化学物質408内の入力に格納される情報を表示する。
【0091】
図4Cは、化学ライブラリ126の分子に関連する構造情報と物理的性質とを表示するスクリーンショットである。一実施形態では、化学物質408の入力は、その化学ID、化学名、国際純正応用化学連合(IUPAC)名、分類、物理的情報と物理的性質、及び分子式などの化学物質の詳細のような、一般的情報430を含んでよい。化学物質408は、化学物質と、ライブラリ412内の情報及び公共DB410とを相互参照するためのリンク432を含んでよい。化学物質408の入力は、化学物質の類義語434を含むことができ、さらに分子の分子図(molecular diagram)などの構造情報436を含むことができる。ユーザは又、そこから物質が得られる物理的資源(physical stock)のリスト、注釈、検索用語として使用できるキーワード、及び添付ファイルとして含まれる他の種類の情報などの他の詳細438を提示されてもよい。
【0092】
図4Aから4Cは、化学ライブラリ126に格納され、ユーザによって表示及び閲覧される情報の種類を示す。図4Dから4Gは、手動による照合ステップの間、又は自動照合アルゴリズムの結果を検討するため、分析を経てサンプルについて記録されたデータを化学ライブラリ126エンティティと比較するためにユーザがどのようにシステムを使用するかを示す。
【0093】
図4Dは、1又はそれ以上の注入から収集される結果データを表示するスクリーンショットである。一実施形態では、結果ウィンドウ440は、サンプル名を表示、データが得られた日付(例えば、注入が行われた日付)、注入に関する情報を含むファイル名、クライアントID、及び特定の注入に関するその他の情報を示す、実行された注入のスクロールリストを提供する。図4Dに示される実施形態では、リストに表示される一番上の行が選択され、注入に関するデータが詳細ウィンドウ442に表形式で表示され、さらに図4Dの下3/4を占めるグラフウィンドウ444にグラフィック形式で表示される。ユーザが結果ウィンドウ440の注入リスト内をスクロールすると、詳細ウィンドウ442及びグラフウィンドウ444内に表示されるデータがそれに応じて変更され、結果ウィンドウ440内で現在選択された注入に関連するデータを表示する。
【0094】
一実施形態では、詳細ウィンドウ442は、注入に関連するデータを整理し、かつ関連するデータをユーザに理解できる形式、又はユーザが理解し、受け入れ、及びデータを使用する能力を向上させる形式でユーザに表示するため、一連のタブを含んでもよい。図4Dに示される実施形態では、詳細ウィンドウ442は現在"ヒット"タブを表示し、それは、本書で"注入データ"と称される、その注入について収集されたクロマトグラフィー及び質量分析データに最も一致するよう照合アルゴリズムが決定した化学物質のリストをユーザに提供する。つまり、ヒットタブは、解析されたサンプル内の成分の同定について、システムの最も妥当な推測を表示する。一実施形態では、あり得る成分のこのリストは表形式で表示され、そのクロマトグラフィー及び質量分析データと共に化学物質の名前を一覧表にする。
【0095】
一実施形態では、結果ウィンドウ440にリストされた注入の1つの選択に応じて、システム100はグラフウィンドウ444の注入データを表示してもよい。一実施形態では、グラフウィンドウ444は、注入データの全部又は一部を表示してもよい。例えば、グラフウィンドウ444は注入データの一部のみを表示してもよく、それに基づいて照合アルゴリズムは詳細ウィンドウ442内に選択された成分の同一性を決定する。図4Dに示される実施形態では、グラフウィンドウ444は3つの別個のグラフを含む。
【0096】
上部グラフ446は、X軸である保持時間又は保持指数と、Y軸である強度とを有し、結果ウィンドウ440で選択された注入についてのクロマトグラフィーデータのグラフを表示する。上部グラフ446は、成分の形でクロマトグラフィーデータを表示する。成分は、同様のクロマトグラフ特性を持つクロマトグラフピークの収集を表す棒である。例えば、成分は、共に溶出する1又はそれ以上の無関係な物質を含んでもよい。上部グラフ446は、特定の保持時間で溶出する成分に含まれている質量に関するどの情報も表示しない。一実施形態では、図4Dに示すように、ユーザは表形式448で情報を表示しようとする。表形式で同じ情報を提供することは、ユーザにさらに詳細にピーク情報を見ることを許容し、さらにユーザに、そうでなければグラフ形式では小さくて区別できないピークを検出することを許容するであろう。上部グラフ446は、固定幅の理想的な列としてピークを表すが、生のクロマトグラフィーデータは高さ、ベースの幅、及び面積を含む形状のピークであってよい。これらの詳細は、データの表形式448に含まれてよい。上部グラフ446のタイトルは、RT=0.6777の成分が選択されていることを示す。これは又、表形式448に反映され、そこではRT=0.68での情報が選択されている。
【0097】
図4Dに示される実施形態では、中央グラフ450は、特定の成分又は保持時間ウィンドウについての1次MSデータを示す。中央グラフ450上部に表示されるタイトルが示すように、中央グラフ450は5番目の成分の質量分析データを示す。中央グラフ450は、X軸上の質量及びY軸上の相対強度と共に、この5番目の成分の1次MSデータを示す。上部グラフ446に示すクロマトグラフィーデータを介し、ユーザが成分から成分へスクロールすると、現在上部グラフ446で選択された成分の1次MSデータを表示するよう、中央グラフ450の内容が変更される。これは、今度は'ヒット'を表示する442、及び照合ライブラリ情報を表示する452をもたらす。
【0098】
図4Dに示される実施形態では、下部グラフ452は、化学ライブラリ126内の入力の1次MSデータを示す。中央グラフ450に表示される1次MSデータと同様、下部グラフ452は、X軸上の質量及びY軸上の相対強度を有するグラフを表示する。この例では、自動的に又はユーザにより、詳細ウィンドウ442にリストされる"ヒット"の1つが選択され、この場合、化学物質はカルニチンである。下部グラフ452では、下部グラフ452の上部に表示されたタイトルによって見ることができるように、化学物質カルニチンのMSデータが表示される。カルニチンは、RT=0.6777で溶出する物質の最有力候補として照合アルゴリズムによって選択されてもよく、又はユーザが手動でカルニチンを選択してもよい。このようにしてユーザは、照合結果の精度を確認し、又は注入から化学ライブラリ126内のエンティティに関する1次MSデータまでの1次MSデータの手動による照合を実行するため、中央グラフ450で注入中に収集されたデータを、下部グラフ452のライブラリ入力からの1次データと比較してもよい。
【0099】
図4Dに示される実施形態では、上部グラフ446についてのみ表形式でのデータを示すが、一実施形態では、中央グラフ450及び下部グラフ452を含む任意のグラフについて、データが表形式で表示されてもよい。さらに、グラフウィンドウ444は、あらゆる数のグラフを含んでよく、図4Dに示すような3つのグラフに限定されない。
【0100】
一実施形態では、2次MSデータが利用可能であることをユーザに示すよう、中央グラフ450に表示される1次MSデータ内のピークデータが色分けされてもよい。中央グラフ450に表示される1次MSデータ内のピークをクリックすることや、表形式で表示されたデータから入力を選択すること等により、ユーザはピークを選択してもよい。それに応じて、システム100は、1次MSデータ内で選択されたピークに関する2次MSデータを表示してもよい。図4Dに示される実施形態では、成分#5の1次MSデータは、様々な質量の物質を表すいくつかのピークを含み、この成分は0.6777の保持時間を有する縦棒によって表される。この例では、ピークは、その2次MSデータに関連する162.2の質量を持つイオンの存在を示す。このようにしてユーザは、このピークを"掘り下げ(drill down)"、2次MSデータを表示する。この例は、図4Eに示される。
【0101】
図4Eは、注入に関連する2次MSデータを表すスクリーンショットである。一実施形態では、1次MSピークの選択は、システム100に対し、そのピークについて既に収集されている2次MSデータを表示するトリガーとなる。例えば、化学ライブラリ126から情報を見ることをユーザが希望するピークを同定するため、ユーザはUI128を使用してもよい。図4Eに示される実施形態では、中央グラフ450の上部のタイトルに見られるように、中央グラフ450は保持時間0.7046で162.2の質量を持つイオンに関する2次MSデータを表示する。下部グラフ452は、対応するイオン、すなわち化学ライブラリ126から選択される162.2の質量を有するエンティティに関する2次MSデータを表示する。
【0102】
一実施形態では、この場合にユーザは上部グラフ444に表示されるクロマトグラフィーピークを選択し、それは中央グラフ450に表示されるそのクロマトグラフィーピークについての1次MSデータをもたらす。その後、ユーザは中央グラフ450の1次MSピークを選択し、それは中央グラフ450に表示されるその1次MSピークについての2次MSデータをもたらしてもよい。同時に、システム100は、下部グラフ452の化学ライブラリ126内の対応するエンティティを表示してもよい。中央グラフ450が注入に対する1次MSのデータを表示する場合、下部グラフ452は化学ライブラリ126内の入力についての1次MSのデータを表示してよい。中央グラフ450が注入に対する2次MSのデータを表示する場合、下部グラフ452は化学ライブラリ126内の入力についての2次MSのデータを表示してよい。ユーザが中央グラフ450のデータをスクロールすると、下部グラフ452に表示されるデータが変化する。つまり、一実施形態において、中央グラフ450及び下部グラフ452は同期され、中央グラフ450の変化が下部グラフ452に対応する変化を引き起こす。この場合、ユーザが注入データを検索すると、システム100はライブラリから自動的に適切なデータを表示してよい。
【0103】
図4Dと4EではMSデータの2つのレベルのみが表示されているものの、同じコンセプトは、ユーザが高次のMSデータを生成及び/又はアクセスすることを許容するよう拡張されてもよく、これは1次及び2次のMSデータに限定されない。一実施形態では、ユーザは、マウス、メニュー、又はスクロールホイールを介してMSnデータにアクセスしてもよい。
【0104】
一実施形態では、任意の結果グラフのピークをクリックし、グラフ上で既知の場所の化学物質と同等のライブラリ情報をシステム100が表示することをもたらすため、ユーザがマウスを使用してよい。1つの例では、ユーザはXの保持指数を持つピークを観察し;ユーザがピークをクリックして、システム100が保持指数の値を記録するためのトリガーとし、同じ保持指数を持つその既存物質リスト内でエンティティを同定し、さらにその既存物質リスト内で同定されたそれらのエンティティの情報を表示してもよい。従って、手動でライブラリ入力を注入結果と参照し、又は照合プロセスの結果を確認するため、クロマトグラフデータ、1次MSデータ、及び2次MSデータを含み注入のために収集されたデータを検索するため、ユーザはUI128を使用してもよく、さらに化学ライブラリ126内の入力を検索するためにUI128を使用してもよい。
【0105】
図4A〜4Eにおいて、基本的なクロマトグラフィー及び質量分析データのピークは、高さ及び最小又はゼロの幅を持つ理想的なピーク又は棒として表現される。しかし、生のクロマトグラフィー又は質量分析データは、形状と面積を有するピークを記述する。一実施形態では、ユーザは生のピークデータにアクセスしてもよい。例えば、ユーザがマウス又はその他のポインティングデバイスを、グラフのピーク又はテーブルの行のいずれかに置くと、エンティティの詳細情報を含むポップアップウィンドウが表示されるよう、UI128が構成されてもよい。これは、図4Fに表示される。
【0106】
図4Fは、以下"ピーク"データと称される、詳細な分離(例えば、クロマトグラム)データを示すスクリーンショットである。図4Fでは、"スキャンビューア(ScanViewer)"というタイトルのウィンドウ454は、1つの注入の間に検出された実際のピークの形状を示す。この場合、ユーザは、ピーク強度と保持時間を表すラインだけでなく、詳細なピーク情報を見ることができる。スキャンビューア・ウィンドウ454内では、クロマトグラムスタイル選択ボックス456は、どのようにピークデータが表示されるかをユーザが選択することを許容する。ユーザは、検出されたすべての質量又は検出された一部の質量について、ピークデータを表示することができる。一実施形態では、ユーザは関心あるピークを、それぞれ別のグラフ又はグラフウィンドウ("分離したクロ(Separate Chro)")内で別のピークとして表示することができ、各グラフは異なるm/z値又はm/z値の範囲を表す。その代わり図4Fに示すように、ユーザは、異なるm/z値を持つピークが1つのグラフ又はグラフウィンドウ内に互いに重ねられた("重畳したクロ(Superimposed Chro)")1つのグラフを表示してもよい。図4Gに示すように、ユーザは又、収集された生データ("分離した生(Separate Raw)")を表示してもよい。
【0107】
図4Fに示される実施形態では、スキャンソースウィンドウ458は、そこからピークデータが収集及び表示されるスキャンのソースを表示する。ユーザは、ピークデータのソースとして複数のスキャンソースを選択することができる。スキャン結果ウィンドウ460は、スキャン中のイオンを表す全てのイオンをウィンドウ454の下部に表示する。一実施形態では、このスキャンのリストは、中央グラフ450に表示されるクロマトグラフピークの組からユーザによって選択されるか、又はソフトウェアによって選択されてよい。特定のピーク又は複数ピークのデータは、ウィンドウ454の中央に位置するピーク表示ウィンドウ462に表示される。ピーク464の記号は、ピーク開始、ピーク頂点、及びピークエンドを示す。ピーク464上の点は、異なる点の形状、色分け、又は他の視覚的な手段を用い、2次MSデータの利用可能性を示すか、又はその点の2次MSデータが、化学成分を同定するため照合プロセスの間に使用された2次MSデータであったことを示してもよい。
【0108】
ピーク表示ウィンドウの右上の隅にある凡例466は、クロマトグラフピーク464と交差する縦線をなすカーソル468で示されるグラフの一部の情報を示す。図4Fに示される例では、凡例466は、クロマトグラフピーク468が0.71RTに位置し、さらにクロマトグラフピーク464の面積が1.7349e+006であることを示す。凡例466は又、ピーク464が231.7から232.5 AMUsの範囲の質量を有することを示す。従って、ユーザは、図4Fに示されるピーク464が、異なる質量を持つがピーク付近の時間領域で収集された1次スキャンで測定されたイオンを表すであろうことを知らされる。ユーザがカーソル468を使用してピーク464上の点を選択した場合、1次MSのデータがスキャン結果ウィンドウ460の上半分に表示される。2次MSデータも利用可能である場合、スキャン結果ウィンドウ460の下半分に2次MSデータが表示されてもよい。
【0109】
図4Fは"重畳したクロ"モードで動作するスキャンビューアを示すが、ユーザによって定義されるデータウィンドウ(すなわち、表458の"質量"、"ウィンドウ"、"スタート"及び"終了"列の値によって決定される境界)は、ピーク464として観察される1つのピークのみを含む。データウィンドウが追加のクロマトグラフィーピークを含む十分な大きさを持つ場合、ディスプレイウィンドウ462は、データソース又は表466に一覧表示されたソース内の指定されたデータウィンドウ内に存在する追加のピークを表示してもよい。
【0110】
図4Gは、クロマトグラムスタイルボックス456内の選択によって見ることができる、"分離した生"モードを使用して表示されたピークデータの例を示すスクリーンショットである。図4Gに示される実施形態では、UI128は、図4Fに示されるピークについてのデータを含む、記録された生のピークデータを表示する。図4Gに示されるデータポイントは、データポイントの3つの組又は水平方向の行に視覚的に整理することができる。データポイントの3つの水平方向の組の中央は、そこから図4Fのピーク464が導出される生データである。データポイントの上部と下部の水平方向の組は、図4Fで指定されたデータウィンドウ内に含まれない。
【0111】
グラフは、3つの次元:X軸の保持時間、Y軸の強度、及びZ軸の質量を含む。図4Gのグラフから、質量範囲231.7〜232.5に限られ、約232(グラフの左から右へ渡る中央の一連の点)の質量を持つ主として1つのイオンのみを表す図4Fの単一ピークを見ることができる。ただし、図4Gのグラフは、それぞれ約231及び233の質量を有する(グラフの左から右へ渡る上部と下部の一連の点)2つの他のイオンが同時に溶出されたことを示す。従って、このウィンドウを使用して、ユーザは別の時間スケールでデータで見てもよく、又は特定のピークに含まれるべき質量の範囲を変更してもよい。例えば、ユーザは、231及び233の質量を持つイオンについてのデータも図4Fのピークデータに含まれるべきであると決定してもよい。その代わりに、ユーザは、ピーク検出アルゴリズムによって、いくつかのイオンが単一のピークに結合されたと決定してもよく、さらに特定のピークの質量範囲を変更することにより、これらのイオンの幾つかが偽であるとして除外するようピーク検出アルゴリズムに指示してもよい。要するに、ユーザが生の注入データに直接アクセスできるだけでなく、照合アルゴリズムによって生成された決定を微調整するため、ユーザがその情報を使用することができる。
【0112】
本書に記述される主題の範囲を逸脱しない限り、本書に記述される主題の各種の詳細を変更してよいことは理解されるであろう。さらに、前述の記述は説明を目的としたものに過ぎず、限定を目的としたものではない。
【特許請求の範囲】
【請求項1】
複合混合物の化学成分の組成の非標的決定のための方法であって、前記方法は、
分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、
ここで前記分離データはピーク情報を含み、かつ前記質量分析データは1次及び2次質量分析データを含み、
前記生成された分離及び質量分析データを含む解析結果を収集及び格納し、
前記解析結果を化学物質の特性を示す情報のライブラリと比較することにより、前記サンプルの化学成分を決定し、ここで前記比較は前記分離及び質量分析データに基づいており、前記情報のライブラリは前記分離技術及び質量分析装置によって生成されるデータを含み、さらに前記情報のライブラリは同定され又は同定されていない化学物質の分離及び質量分析データを含み;及び
人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行う、ことを含む方法。
【請求項2】
サンプルのクロマトグラフィーデータを生成するためのクロマトグラフの使用を含む、サンプルの分離データを生成するために分離技術を用いる請求項1に記載の方法であって、前記分離情報は保持情報を含む方法。
【請求項3】
サンプルのクロマトグラフィーデータを生成するため、超高圧液体クロマトグラフの使用を含むクロマトグラフを使用する請求項2に記載の方法。
【請求項4】
前記保持情報は、ピークの保持時間とピークの保持指数との少なくとも1つを含む請求項2に記載の方法。
【請求項5】
サンプルの分離データを生成するため、電気泳動の使用を含む分離技術を使用する請求項1に記載の方法であって、前記分離情報は分離距離情報を含む方法。
【請求項6】
サンプルの質量分析データを生成するため、四重極質量分析装置の使用を含む質量分析装置を使用する請求項1に記載の方法。
【請求項7】
サンプルの質量分析データを生成するため、イオントラップを有する質量分析装置の使用を含む質量分析装置を使用する請求項1に記載の方法。
【請求項8】
複数のサンプルのための分離及び質量分析データの生成を含む、サンプルの分離及び質量分析データを生成するため、分離技術及び質量分析装置を用い、複数のサンプルのために生成された分離及び質量分析データの収集を含む前記解析結果を収集する請求項1に記載の方法。
【請求項9】
前記分離及び質量分析データの生成は:
酸性液体クロマトグラフィーの実行;
塩基性液体クロマトグラフィーの実行;
正イオン質量分析の実行;
負イオン質量分析の実行;
複数の分離の実行;及び
複数の質量分析の実行
の少なくとも1つを含む請求項1に記載の方法。
【請求項10】
前記ピーク情報は:
ピークの強度;
ピークのベースの幅;
ピークのベースの最初と最後の保持時間;
ピークのベースの最初と最後の強度;
ピークの高さの半分でのピークの幅;
ピークの面積;
ピークの対称性;
ピークのノイズ;
ピークに関連付けられた質量;
ピークに関連付けられた質量対電荷比;
ピークと、イオン間の親子関係を記述するイオンツリーのエンティティとの関連;及びピークに関連付けられたスキャンのリスト
の少なくとも1つを含む請求項1に記載の方法。
【請求項11】
前記解析結果の格納は、前記解析結果の特性を記述する情報を格納することを含み、前記情報は:
解析の間に取得された1次スキャンの数;
解析の間に取得された2次スキャンの数;
実際に取得された2次スキャンに対する、取得可能であった2次スキャンの割合;
同定された化学物質のピーク内に存在した、取得された2次スキャンの数;
同定された化学物質のピーク内に存在した、取得された2次スキャンの割合;
解析の間に記録されたピークの数;
2次スキャンが取得されたピークの数;
2次スキャンが取得されたピークの割合;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの数;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの割合;
2次スキャンが実行されなかった最大ピークの面積;
2次スキャンが実行された最小ピークの面積;
の少なくとも1つを含む前記解析結果の特性を記述する請求項1に記載の方法。
【請求項12】
前記解析結果の格納は、前記解析結果をデータベースに格納することを含む請求項1に記載の方法。
【請求項13】
前記解析結果を前記情報のライブラリと比較することは、前記解析結果を前記情報のライブラリを格納するためのデータベースに格納されている情報と比較することを含む請求項1に記載の方法。
【請求項14】
前記解析結果を前記情報のライブラリと比較することは、前記解析結果を前記ライブラリ内のエンティティの特徴と比較することを含み:
前記エンティティの保持時間;
前記エンティティの保持指数;
前記エンティティの質量;
前記エンティティの質量対電荷比;
前記エンティティの付加物の質量;
前記エンティティの同位体の関係;
前記エンティティのフラグメントの質量;
前記エンティティと該エンティティの子イオンとの関係;
前記エンティティと該エンティティの親エンティティとの関係;
前記エンティティと該エンティティの兄弟との関係;
前記エンティティの相対強度;
前記エンティティの構造情報;
前記エンティティの物理的性質;
前記エンティティの物理的資源のリスト;
前記エンティティについて公開化学データベース入力内で得られる情報;
情報の第2のライブラリ内で得られる前記エンティティについての情報;及び
前記エンティティに関連付けられた解析結果
の少なくとも1つの比較を含む、請求項1に記載の方法。
【請求項15】
前記サンプルの組成を決定することは、前記ライブラリ内の特定のエンティティの前記解析結果及びライブラリ情報を表示することを含む、請求項1に記載の方法。
【請求項16】
前記サンプル内に存在するものとして同定され、検出されたが化学物質が同定されない情報を前記情報のライブラリに格納することを含む、請求項1に記載の方法。
【請求項17】
前記ライブラリ内の特定のエンティティの前記解析結果及びライブラリ情報を表示するため、解析モジュールに結合されるユーザインターフェイスの使用を含む、請求項1に記載の方法。
【請求項18】
前記分離データの生成は、イオン移動度分析とキャピラリー電気泳動法の1つを用いることを含む、請求項1に記載の方法。
【請求項19】
複合混合物の化学成分の組成の非標的決定のためのシステムであって、前記システムは:
サンプルの化学成分の分離の実行及びピーク情報を含む分離データの生成のための分離ツール;
前記サンプルの前記分離された化学成分の一部に質量分析を実行し、かつ1次及び2次質量分析データを含む質量分析データを生成するための質量分析装置;
前記分離ツール及び質量分析装置によって生成されるデータを含み、化学物質の特性を示す情報のライブラリであって、前記情報のライブラリは同定され又は同定されていない化学物質の分離及び質量分析データを含み;
前記分離及び質量分析データを解析結果として受信、収集及び格納し、かつ前記解析結果を前記情報のライブラリと比較することによって前記サンプルの化学成分を決定するための解析モジュールであって、前記比較は前記分離及び質量分析データに基づいており;及び
解析モジュールに結合され、人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行うためのユーザインターフェイス
を有するシステム。
【請求項20】
前記分離ツールはクロマトグラフを含む、請求項19に記載のシステム。
【請求項21】
前記クロマトグラフは液体クロマトグラフを含む、請求項20に記載のシステム。
【請求項22】
前記液体クロマトグラフを前記質量分析装置に結合するためのエレクトロスプレーイオン化装置を含む、請求項21に記載のシステム。
【請求項23】
前記液体クロマトグラフは超高圧液体クロマトグラフを含む、請求項21に記載のシステム。
【請求項24】
前記クロマトグラフはガスクロマトグラフを含む、請求項20に記載のシステム。
【請求項25】
前記分離ツールは電気泳動ツールを含む、請求項19に記載のシステム。
【請求項26】
前記質量分析装置は四重極質量分析装置を含む、請求項19に記載のシステム。
【請求項27】
前記質量分析装置はイオントラップを含む、請求項19に記載のシステム。
【請求項28】
前記解析結果は:
酸性液体クロマトグラフィーの結果;
塩基性液体クロマトグラフィーの結果;
正イオン質量分析の結果;
負イオン質量分析の結果;
複数のサンプルの結果
複数の分離の結果;及び
複数の質量分析の結果
の少なくとも1つを含む、請求項19に記載のシステム。
【請求項29】
前記分離情報は、ピークの保持時間とピークの保持指数との少なくとも1つを含む、請求項19に記載のシステム。
【請求項30】
前記ピーク情報は:
ピークの強度;
ピークのベースの幅;
ピークのベースの最初と最後の保持時間;
ピークのベースの最初と最後の強度;
ピークの高さの半分でのピークの幅;
ピークの面積;
ピークの対称性;
ピークのノイズ;
ピークに関連付けられた質量;
ピークに関連付けられた質量対電荷比;
ピークと、イオン間の親子関係を記述するイオンツリーのエンティティとの関連;及びピークに関連付けられたスキャンのリスト、
の少なくとも1つを含む、請求項19に記載のシステム。
【請求項31】
前記解析結果は、前記解析結果の特性を記述する情報を含み、前記情報は:
解析の間に取得された1次スキャンの数;
解析の間に取得された2次スキャンの数;
実際に取得された2次スキャンに対する、取得可能であった2次スキャンの割合;
同定された化学物質のピーク内に存在した、取得された2次スキャンの数;
同定された化学物質のピーク内に存在した、取得された2次スキャンの割合;
解析の間に記録されたピークの数;
2次スキャンが取得されたピークの数;
2次スキャンが取得されたピークの割合;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの数;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの割合;
2次スキャンが実行されなかった最大ピークの面積;
2次スキャンが実行された最小ピークの面積;
の少なくとも1つを含む、請求項19に記載のシステム。
【請求項32】
前記情報のライブラリ及び前記解析結果の少なくとも1つを格納するためのデータベースを含む、請求項19に記載のシステム。
【請求項33】
前記解析結果を前記情報のライブラリと比較することは、前記解析結果を前記ライブラリ内のエンティティの特徴と比較することを含み:
前記エンティティの保持時間;
前記エンティティの保持指数;
前記エンティティの質量;
前記エンティティの質量対電荷比;
前記エンティティの付加物の質量;
前記エンティティの同位体の関係;
前記エンティティのフラグメントの質量;
前記エンティティと該エンティティの子イオンとの関係;
前記エンティティと該エンティティの親エンティティとの関係;
前記エンティティの相対強度;
前記エンティティの構造情報;
前記エンティティの物理的性質;
前記エンティティの物理的資源のリスト;
前記エンティティについて公開化学データベース入力内で得られる情報;
情報の第2のライブラリ内で得られる前記エンティティについての情報;及び
前記エンティティに関連付けられた解析結果
の少なくとも1つの比較を含む、請求項19に記載のシステム。
【請求項34】
前記ライブラリは:
親エンティティと該エンティティの子イオンとの関係;
子エンティティと該エンティティの親エンティティとの関係;
前記エンティティの構造情報;
前記エンティティの物理的性質;
前記エンティティの物理的資源のリスト;
エンティティについての公開化学データベース入力へのリンク;
情報の第2のライブラリへのリンク;及び
エンティティに関連付けられた解析結果へのリンク、
の少なくとも1つに関する情報を含む、請求項19に記載のシステム。
【請求項35】
前記解析モジュールは、前記ライブラリ内のエンティティの前記解析結果及び情報を表示するように構成されている、請求項19に記載のシステム。
【請求項36】
前記解析モジュールは、前記サンプル内に存在するものとして同定され、検出されたが化学物質が同定されない情報を前記情報のライブラリに格納するように構成されている、請求項19に記載のシステム。
【請求項37】
前記ユーザインターフェイスは、前記比較の前記結果、前記情報のライブラリ内のエンティティに関する情報、及び前記サンプルの前記決定された化学成分の少なくとも1つを、人間がアクセス可能な形で利用できるようにする、請求項19に記載のシステム。
【請求項38】
前記ユーザインターフェイスは、前記システムのユーザに、1次質量分析データを人間がアクセス可能な形で利用できるようにし、前記表示された1次質量分析データから関心あるアイテムを選択し、さらに前記情報のライブラリから選択される化学物質に関連する情報を表示するのを許容するよう構成されている、請求項19に記載のシステム。
【請求項39】
前記化学物質は、前記システムによって自動的に選択される請求項38に記載のシステム。
【請求項40】
前記化学物質は、前記ユーザによって手動で選択される請求項38に記載のシステム。
【請求項41】
前記ユーザインターフェイスは、前記システムのユーザに、1次質量分析データを人間がアクセス可能な形で利用できるようにし、前記1次質量分析データから関心あるアイテムを選択し、さらに前記選択された関心あるアイテムに関連する2次質量分析データを人間がアクセス可能な形で利用できるようにするのを許容するよう構成されている、請求項19に記載のシステム。
【請求項42】
前記ユーザインターフェイスは、1次質量分析データに関連する2次質量分析データが使用可能であることを、人間がアクセス可能な形で利用できるように表示するよう構成されている、請求項41に記載のシステム。
【請求項43】
前記ユーザインターフェイスは、前記システムのユーザに、データの階層関係に従って解析結果データの複数の組を検索し、かつ前記エンティティの階層関係に従って前記情報のライブラリ内のエンティティに関連する情報を検索するのを許容するよう構成されている、請求項37に記載のシステム。
【請求項44】
前記ユーザインターフェイスは、前記エンティティに関連する前記情報の検索と、前記解析結果データの検索とを自動的に同期するよう構成され、その一方の変化が他の変化を引き起こす、請求項43に記載のシステム。
【請求項45】
コンピュータ実行可能な命令が格納されたコンピュータ読み取り可能な媒体であって、該命令はコンピュータのプロセッサによって実行されたときに:
分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、
ここで前記分離データはピーク情報を含み、かつ前記質量分析データは1次及び2次質量分析データを含み、
前記生成された分離及び質量分析データを含む解析結果を収集及び格納し、
前記解析結果を化学物質の特性を示す情報のライブラリと比較することにより、前記サンプルの化学成分を決定し、ここで前記比較は前記分離及び質量分析データに基づいており、前記情報のライブラリは前記分離技術及び質量分析装置によって生成されるデータを含み、さらに前記情報のライブラリは同定され又は同定されていない化学物質の分離及び質量分析データを含み;及び
人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行う、ことを含むステップを実行する、コンピュータ読み取り可能な媒体。
【請求項1】
複合混合物の化学成分の組成の非標的決定のための方法であって、前記方法は、
分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、
ここで前記分離データはピーク情報を含み、かつ前記質量分析データは1次及び2次質量分析データを含み、
前記生成された分離及び質量分析データを含む解析結果を収集及び格納し、
前記解析結果を化学物質の特性を示す情報のライブラリと比較することにより、前記サンプルの化学成分を決定し、ここで前記比較は前記分離及び質量分析データに基づいており、前記情報のライブラリは前記分離技術及び質量分析装置によって生成されるデータを含み、さらに前記情報のライブラリは同定され又は同定されていない化学物質の分離及び質量分析データを含み;及び
人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行う、ことを含む方法。
【請求項2】
サンプルのクロマトグラフィーデータを生成するためのクロマトグラフの使用を含む、サンプルの分離データを生成するために分離技術を用いる請求項1に記載の方法であって、前記分離情報は保持情報を含む方法。
【請求項3】
サンプルのクロマトグラフィーデータを生成するため、超高圧液体クロマトグラフの使用を含むクロマトグラフを使用する請求項2に記載の方法。
【請求項4】
前記保持情報は、ピークの保持時間とピークの保持指数との少なくとも1つを含む請求項2に記載の方法。
【請求項5】
サンプルの分離データを生成するため、電気泳動の使用を含む分離技術を使用する請求項1に記載の方法であって、前記分離情報は分離距離情報を含む方法。
【請求項6】
サンプルの質量分析データを生成するため、四重極質量分析装置の使用を含む質量分析装置を使用する請求項1に記載の方法。
【請求項7】
サンプルの質量分析データを生成するため、イオントラップを有する質量分析装置の使用を含む質量分析装置を使用する請求項1に記載の方法。
【請求項8】
複数のサンプルのための分離及び質量分析データの生成を含む、サンプルの分離及び質量分析データを生成するため、分離技術及び質量分析装置を用い、複数のサンプルのために生成された分離及び質量分析データの収集を含む前記解析結果を収集する請求項1に記載の方法。
【請求項9】
前記分離及び質量分析データの生成は:
酸性液体クロマトグラフィーの実行;
塩基性液体クロマトグラフィーの実行;
正イオン質量分析の実行;
負イオン質量分析の実行;
複数の分離の実行;及び
複数の質量分析の実行
の少なくとも1つを含む請求項1に記載の方法。
【請求項10】
前記ピーク情報は:
ピークの強度;
ピークのベースの幅;
ピークのベースの最初と最後の保持時間;
ピークのベースの最初と最後の強度;
ピークの高さの半分でのピークの幅;
ピークの面積;
ピークの対称性;
ピークのノイズ;
ピークに関連付けられた質量;
ピークに関連付けられた質量対電荷比;
ピークと、イオン間の親子関係を記述するイオンツリーのエンティティとの関連;及びピークに関連付けられたスキャンのリスト
の少なくとも1つを含む請求項1に記載の方法。
【請求項11】
前記解析結果の格納は、前記解析結果の特性を記述する情報を格納することを含み、前記情報は:
解析の間に取得された1次スキャンの数;
解析の間に取得された2次スキャンの数;
実際に取得された2次スキャンに対する、取得可能であった2次スキャンの割合;
同定された化学物質のピーク内に存在した、取得された2次スキャンの数;
同定された化学物質のピーク内に存在した、取得された2次スキャンの割合;
解析の間に記録されたピークの数;
2次スキャンが取得されたピークの数;
2次スキャンが取得されたピークの割合;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの数;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの割合;
2次スキャンが実行されなかった最大ピークの面積;
2次スキャンが実行された最小ピークの面積;
の少なくとも1つを含む前記解析結果の特性を記述する請求項1に記載の方法。
【請求項12】
前記解析結果の格納は、前記解析結果をデータベースに格納することを含む請求項1に記載の方法。
【請求項13】
前記解析結果を前記情報のライブラリと比較することは、前記解析結果を前記情報のライブラリを格納するためのデータベースに格納されている情報と比較することを含む請求項1に記載の方法。
【請求項14】
前記解析結果を前記情報のライブラリと比較することは、前記解析結果を前記ライブラリ内のエンティティの特徴と比較することを含み:
前記エンティティの保持時間;
前記エンティティの保持指数;
前記エンティティの質量;
前記エンティティの質量対電荷比;
前記エンティティの付加物の質量;
前記エンティティの同位体の関係;
前記エンティティのフラグメントの質量;
前記エンティティと該エンティティの子イオンとの関係;
前記エンティティと該エンティティの親エンティティとの関係;
前記エンティティと該エンティティの兄弟との関係;
前記エンティティの相対強度;
前記エンティティの構造情報;
前記エンティティの物理的性質;
前記エンティティの物理的資源のリスト;
前記エンティティについて公開化学データベース入力内で得られる情報;
情報の第2のライブラリ内で得られる前記エンティティについての情報;及び
前記エンティティに関連付けられた解析結果
の少なくとも1つの比較を含む、請求項1に記載の方法。
【請求項15】
前記サンプルの組成を決定することは、前記ライブラリ内の特定のエンティティの前記解析結果及びライブラリ情報を表示することを含む、請求項1に記載の方法。
【請求項16】
前記サンプル内に存在するものとして同定され、検出されたが化学物質が同定されない情報を前記情報のライブラリに格納することを含む、請求項1に記載の方法。
【請求項17】
前記ライブラリ内の特定のエンティティの前記解析結果及びライブラリ情報を表示するため、解析モジュールに結合されるユーザインターフェイスの使用を含む、請求項1に記載の方法。
【請求項18】
前記分離データの生成は、イオン移動度分析とキャピラリー電気泳動法の1つを用いることを含む、請求項1に記載の方法。
【請求項19】
複合混合物の化学成分の組成の非標的決定のためのシステムであって、前記システムは:
サンプルの化学成分の分離の実行及びピーク情報を含む分離データの生成のための分離ツール;
前記サンプルの前記分離された化学成分の一部に質量分析を実行し、かつ1次及び2次質量分析データを含む質量分析データを生成するための質量分析装置;
前記分離ツール及び質量分析装置によって生成されるデータを含み、化学物質の特性を示す情報のライブラリであって、前記情報のライブラリは同定され又は同定されていない化学物質の分離及び質量分析データを含み;
前記分離及び質量分析データを解析結果として受信、収集及び格納し、かつ前記解析結果を前記情報のライブラリと比較することによって前記サンプルの化学成分を決定するための解析モジュールであって、前記比較は前記分離及び質量分析データに基づいており;及び
解析モジュールに結合され、人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行うためのユーザインターフェイス
を有するシステム。
【請求項20】
前記分離ツールはクロマトグラフを含む、請求項19に記載のシステム。
【請求項21】
前記クロマトグラフは液体クロマトグラフを含む、請求項20に記載のシステム。
【請求項22】
前記液体クロマトグラフを前記質量分析装置に結合するためのエレクトロスプレーイオン化装置を含む、請求項21に記載のシステム。
【請求項23】
前記液体クロマトグラフは超高圧液体クロマトグラフを含む、請求項21に記載のシステム。
【請求項24】
前記クロマトグラフはガスクロマトグラフを含む、請求項20に記載のシステム。
【請求項25】
前記分離ツールは電気泳動ツールを含む、請求項19に記載のシステム。
【請求項26】
前記質量分析装置は四重極質量分析装置を含む、請求項19に記載のシステム。
【請求項27】
前記質量分析装置はイオントラップを含む、請求項19に記載のシステム。
【請求項28】
前記解析結果は:
酸性液体クロマトグラフィーの結果;
塩基性液体クロマトグラフィーの結果;
正イオン質量分析の結果;
負イオン質量分析の結果;
複数のサンプルの結果
複数の分離の結果;及び
複数の質量分析の結果
の少なくとも1つを含む、請求項19に記載のシステム。
【請求項29】
前記分離情報は、ピークの保持時間とピークの保持指数との少なくとも1つを含む、請求項19に記載のシステム。
【請求項30】
前記ピーク情報は:
ピークの強度;
ピークのベースの幅;
ピークのベースの最初と最後の保持時間;
ピークのベースの最初と最後の強度;
ピークの高さの半分でのピークの幅;
ピークの面積;
ピークの対称性;
ピークのノイズ;
ピークに関連付けられた質量;
ピークに関連付けられた質量対電荷比;
ピークと、イオン間の親子関係を記述するイオンツリーのエンティティとの関連;及びピークに関連付けられたスキャンのリスト、
の少なくとも1つを含む、請求項19に記載のシステム。
【請求項31】
前記解析結果は、前記解析結果の特性を記述する情報を含み、前記情報は:
解析の間に取得された1次スキャンの数;
解析の間に取得された2次スキャンの数;
実際に取得された2次スキャンに対する、取得可能であった2次スキャンの割合;
同定された化学物質のピーク内に存在した、取得された2次スキャンの数;
同定された化学物質のピーク内に存在した、取得された2次スキャンの割合;
解析の間に記録されたピークの数;
2次スキャンが取得されたピークの数;
2次スキャンが取得されたピークの割合;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの数;
ピークに関連付けられた1つ以上の2次スキャンを有するピークの割合;
2次スキャンが実行されなかった最大ピークの面積;
2次スキャンが実行された最小ピークの面積;
の少なくとも1つを含む、請求項19に記載のシステム。
【請求項32】
前記情報のライブラリ及び前記解析結果の少なくとも1つを格納するためのデータベースを含む、請求項19に記載のシステム。
【請求項33】
前記解析結果を前記情報のライブラリと比較することは、前記解析結果を前記ライブラリ内のエンティティの特徴と比較することを含み:
前記エンティティの保持時間;
前記エンティティの保持指数;
前記エンティティの質量;
前記エンティティの質量対電荷比;
前記エンティティの付加物の質量;
前記エンティティの同位体の関係;
前記エンティティのフラグメントの質量;
前記エンティティと該エンティティの子イオンとの関係;
前記エンティティと該エンティティの親エンティティとの関係;
前記エンティティの相対強度;
前記エンティティの構造情報;
前記エンティティの物理的性質;
前記エンティティの物理的資源のリスト;
前記エンティティについて公開化学データベース入力内で得られる情報;
情報の第2のライブラリ内で得られる前記エンティティについての情報;及び
前記エンティティに関連付けられた解析結果
の少なくとも1つの比較を含む、請求項19に記載のシステム。
【請求項34】
前記ライブラリは:
親エンティティと該エンティティの子イオンとの関係;
子エンティティと該エンティティの親エンティティとの関係;
前記エンティティの構造情報;
前記エンティティの物理的性質;
前記エンティティの物理的資源のリスト;
エンティティについての公開化学データベース入力へのリンク;
情報の第2のライブラリへのリンク;及び
エンティティに関連付けられた解析結果へのリンク、
の少なくとも1つに関する情報を含む、請求項19に記載のシステム。
【請求項35】
前記解析モジュールは、前記ライブラリ内のエンティティの前記解析結果及び情報を表示するように構成されている、請求項19に記載のシステム。
【請求項36】
前記解析モジュールは、前記サンプル内に存在するものとして同定され、検出されたが化学物質が同定されない情報を前記情報のライブラリに格納するように構成されている、請求項19に記載のシステム。
【請求項37】
前記ユーザインターフェイスは、前記比較の前記結果、前記情報のライブラリ内のエンティティに関する情報、及び前記サンプルの前記決定された化学成分の少なくとも1つを、人間がアクセス可能な形で利用できるようにする、請求項19に記載のシステム。
【請求項38】
前記ユーザインターフェイスは、前記システムのユーザに、1次質量分析データを人間がアクセス可能な形で利用できるようにし、前記表示された1次質量分析データから関心あるアイテムを選択し、さらに前記情報のライブラリから選択される化学物質に関連する情報を表示するのを許容するよう構成されている、請求項19に記載のシステム。
【請求項39】
前記化学物質は、前記システムによって自動的に選択される請求項38に記載のシステム。
【請求項40】
前記化学物質は、前記ユーザによって手動で選択される請求項38に記載のシステム。
【請求項41】
前記ユーザインターフェイスは、前記システムのユーザに、1次質量分析データを人間がアクセス可能な形で利用できるようにし、前記1次質量分析データから関心あるアイテムを選択し、さらに前記選択された関心あるアイテムに関連する2次質量分析データを人間がアクセス可能な形で利用できるようにするのを許容するよう構成されている、請求項19に記載のシステム。
【請求項42】
前記ユーザインターフェイスは、1次質量分析データに関連する2次質量分析データが使用可能であることを、人間がアクセス可能な形で利用できるように表示するよう構成されている、請求項41に記載のシステム。
【請求項43】
前記ユーザインターフェイスは、前記システムのユーザに、データの階層関係に従って解析結果データの複数の組を検索し、かつ前記エンティティの階層関係に従って前記情報のライブラリ内のエンティティに関連する情報を検索するのを許容するよう構成されている、請求項37に記載のシステム。
【請求項44】
前記ユーザインターフェイスは、前記エンティティに関連する前記情報の検索と、前記解析結果データの検索とを自動的に同期するよう構成され、その一方の変化が他の変化を引き起こす、請求項43に記載のシステム。
【請求項45】
コンピュータ実行可能な命令が格納されたコンピュータ読み取り可能な媒体であって、該命令はコンピュータのプロセッサによって実行されたときに:
分離技術及び質量分析装置を用い、サンプルの分離及び質量分析データを生成し、
ここで前記分離データはピーク情報を含み、かつ前記質量分析データは1次及び2次質量分析データを含み、
前記生成された分離及び質量分析データを含む解析結果を収集及び格納し、
前記解析結果を化学物質の特性を示す情報のライブラリと比較することにより、前記サンプルの化学成分を決定し、ここで前記比較は前記分離及び質量分析データに基づいており、前記情報のライブラリは前記分離技術及び質量分析装置によって生成されるデータを含み、さらに前記情報のライブラリは同定され又は同定されていない化学物質の分離及び質量分析データを含み;及び
人間がアクセス可能な形で利用できるように前記サンプルの前記化学成分の表示を行う、ことを含むステップを実行する、コンピュータ読み取り可能な媒体。
【図2A】
【図2B】
【図2C】
【図2D】
【図2E】
【図2F】
【図4A】
【図4B】
【図4C】
【図4D】
【図4E】
【図4F】
【図1A】
【図1B】
【図1C】
【図3】
【図4G】
【図2B】
【図2C】
【図2D】
【図2E】
【図2F】
【図4A】
【図4B】
【図4C】
【図4D】
【図4E】
【図4F】
【図1A】
【図1B】
【図1C】
【図3】
【図4G】
【公表番号】特表2011−510300(P2011−510300A)
【公表日】平成23年3月31日(2011.3.31)
【国際特許分類】
【出願番号】特願2010−543261(P2010−543261)
【出願日】平成21年1月15日(2009.1.15)
【国際出願番号】PCT/US2009/031168
【国際公開番号】WO2009/091933
【国際公開日】平成21年7月23日(2009.7.23)
【出願人】(510195412)メタボロン インコーポレーテッド (1)
【氏名又は名称原語表記】METABOLON INC.
【Fターム(参考)】
【公表日】平成23年3月31日(2011.3.31)
【国際特許分類】
【出願日】平成21年1月15日(2009.1.15)
【国際出願番号】PCT/US2009/031168
【国際公開番号】WO2009/091933
【国際公開日】平成21年7月23日(2009.7.23)
【出願人】(510195412)メタボロン インコーポレーテッド (1)
【氏名又は名称原語表記】METABOLON INC.
【Fターム(参考)】
[ Back to top ]