情報処理装置、プログラム、及びコンピュータ読み取り可能な記録媒体
【課題】複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付ける。
【解決手段】スペクトル解析装置1は、それぞれの2次元ピークデータからマススペクトル情報としてピークベクトルを作成する第1ピークベクトル作成部21と、ピークベクトル同士を比較し、それぞれの2次元ピークデータにおいて内部標準となるピークベクトルのセットを作成する内部標準同定部22と、内部標準となるピークベクトルに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部23と、保持時間が補正された2次元ピーク情報から新たなピークベクトルを作成する第2マススペクトル抽出部と、保持時間が補正された2次元ピーク情報間で、保持時間の違いが所定の範囲内の新たなピークベクトル同士を比較する対応判定部26とを備えている。
【解決手段】スペクトル解析装置1は、それぞれの2次元ピークデータからマススペクトル情報としてピークベクトルを作成する第1ピークベクトル作成部21と、ピークベクトル同士を比較し、それぞれの2次元ピークデータにおいて内部標準となるピークベクトルのセットを作成する内部標準同定部22と、内部標準となるピークベクトルに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部23と、保持時間が補正された2次元ピーク情報から新たなピークベクトルを作成する第2マススペクトル抽出部と、保持時間が補正された2次元ピーク情報間で、保持時間の違いが所定の範囲内の新たなピークベクトル同士を比較する対応判定部26とを備えている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クロマトグラフィーと質量分析との組み合わせに基づいて得られるデータを解析するための情報処理装置、この情報処理装置を制御するプログラム、及びこのプログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。
【背景技術】
【0002】
ガスクロマトグラフィー質量分析(GC/MS)装置、液体クロマトグラフィー質量分析(LC/MS)装置は、クロマトグラフィーと質量分析とを組み合わせることによって、細胞、組織、又は器官全体に含まれる膨大な種類の生体成分を分離・同定することが可能である。これらの装置では、まず、細胞、組織、又は器官全体から抽出した生体サンプル中に含まれる生体成分を、ガスクロマトグラフィー(GC)又は液体クロマトグラフィー(LC)によって単一の化合物に分離する。その後、分離した単一の化合物を一定のエネルギーを有する電子線により開裂させ、フラグメントイオンを得る。そして、フラグメントイオンのイオン強度を質量数と電荷の比(m/z)ごとに検出することにより、ある化合物の開裂パターンを示すマススペクトルを得ることができる。
【0003】
上記の装置ではこれらの処理を連続的に行うため、得られるデータは、図2に示すように、保持時間及びm/zについてのイオン強度スペクトル、すなわち2次元スペクトルデータになる。この2次元スペクトルデータを保持時間軸と直交する断面で切り出すと、m/z軸に沿ったイオン強度の情報、すなわちマススペクトルを得ることができる。一方、2次元スペクトルデータをm/z軸と直交する断面で切り出すと、保持時間軸に沿ったイオン強度の情報、すなわちマスクロマトグラムを得ることができる。
【0004】
ここで、保持時間の分解能を高くすると、マスクロマトグラムでは、図2に示すように、単一のフラグメントイオン又は擬分子イオンのイオン強度が複数の保持時間にまたがった状態になる。従って、図3に示すように、複数の保持時間にまたがったイオン強度を一点に纏めることによって、図2に示す2次元スペクトルデータを、図4上段に示す2次元ピークデータへと変換する必要がある。2次元スペクトルデータから2次元ピークデータへ変換する従来の方法について説明すると次の通りである。
【0005】
従来の方法では、まず、図2に示す2次元スペクトルデータから、あるm/zについて、図3上段に示すマスクロマトグラムデータを抽出する。そして、マスクロマトグラムにおいてイオン強度が極大となる保持時間を同定し、同定した保持時間がスペクトルのピーク位置であると認定する。
【0006】
続いて、ピーク位置の近傍に分散するイオン強度の総和をとり、この総和をピーク位置に対応付ける。これにより、図3下段に示すピークデータになる。この処理を全てのm/zについて行うことにより、図4上段に示す2次元ピークデータが得られるのである。
【0007】
この2次元ピークデータから保持時間軸に垂直な断面を切り出せば、図4下段に示すマススペクトルが得られる。ここで、それぞれのマススペクトルには、1つの化合物の開裂パターンが含まれることになる。従って、マススペクトルの開裂パターンを基に、生体サンプルに含まれる化合物を同定することができる。
【0008】
近年では、上記の装置によって、様々な生体サンプルに含まれる様々な化合物を網羅的に同定することが行われている。
【非特許文献1】質量分析法、「有機化合物のスペクトルによる同定法−MS,IR,NMR,UVの併用−第4版」、Silverstein RM,Bassler GC,Morrill TC著、荒木峻・益子洋一郎・山本修訳、第2章、質量分析法、pp.3−40、東京化学同人、東京(1983)
【非特許文献2】大倉洋甫、甲斐雅亮、IV−5質量分析法(マススペクトロメトリー)、「分析化学II改訂第4版」、大倉洋甫、田中善正、山口政俊編集、pp.228−257、南江堂、東京(1997)
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、異なる測定実験から得られた2次元ピークデータ間で、同一の化合物に由来すると考えられるマススペクトル同士を情報処理装置などによって自動的に対応付ける方法は未だ確立されていない。
【0010】
通常、異なる生体サンプルから得られた2次元ピークデータ間で同一の化合物由来のマススペクトルを見出す場合、研究者が2次元ピークデータに含まれる膨大なマススペクトルの中から経験に基づいた勘によってマススペクトルを1つずつ選出し、それぞれのマススペクトル同士を見比べ、対応するか否かを主観的に判定することが一般的に行われている。しかしながら、上述したように、様々な生体サンプルに含まれる様々な化合物を網羅的に同定する場合、研究者が個々のマススペクトル同士を比較検討する従来の方法では、ハイスループットで出力される多量の2次元ピークデータに対応するのは困難である。従って、研究者の勘に頼らず、マススペクトル同士の対応付けを自動的に行うことのできる情報処理装置が求められている。
【0011】
ここで、対応付けを自動化する際には、保持時間の問題が鍵となる。例えば、GC/MSやLC/MSなどによって同一の生体サンプルを同一の分析条件で複数回分析する場合、理論的には、同一の化合物は常に同一の保持時間の画分に含まれると考えられる。ところが、実際には、分析条件の同一性を完全に維持することは不可能であるため、分析実験ごとに保持時間のずれが生じてしまうのは避けられない。
【0012】
このずれの問題は、生体サンプルの違いなど、分析条件が変化する場合ではさらに顕著になる。従って、この実験ごとにずれている保持時間を補正しなければ、マススペクトルの対応付けを正確に行うことができない。
【0013】
さらに、それ以前の問題として、従来の技術は、ピークの位置を正確に同定できない場合があるという問題を有している。
【0014】
図5は、ある単一の化合物由来の異なるフラグメントイオンのイオン強度の例を示した図である。図5の上段は、m/zがiとなるフラグメントイオンのイオン強度を示したマスクロマトグラムであり、図5の下段は、m/zがjとなるフラグメントイオンのイオン強度を示したマスクロマトグラムである。これら2つのフラグメントイオンは同一の化合物に由来しており、それぞれのピークは、図5左側に示すように、ともに保持時間t+2とt+3との間に存在する。そして、これらのフラグメントイオンのイオン強度をサンプリングすると、図5中央に示すようになる。
【0015】
このとき、これら2つのフラグメントイオンのピークの位置(保持時間)を従来の手法に従って同定すると、従来の手法ではサンプリングされたイオン強度が最大となる位置をピークの位置として同定するため、図5右側に示すように、一方のフラグメントイオンのピークの位置はt+3となり、もう一方のフラグメントイオンのピークの位置はt+2となってしまう。このように、従来の手法では、本来同一の保持時間に対応付けられるべき2つのピークが別々の保持時間に対応付けられてしまい、その結果、これらのフラグメントイオンが異なる化合物に由来するものとして扱われることになる。
【0016】
研究者はこのような問題を経験に基づいた勘によって逐次修正しなければならないため、大量の2次元ピークデータを迅速に解析することが困難であった。
【0017】
本発明は上記課題に鑑みてなされたものであり、その第1の目的は、複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付けることのできる情報処理装置の実現を目的とする。
【0018】
また、本発明の第2の目的は、サンプリングされた2次元スペクトルデータから、個々のピークの位置を正確に同定することのできる情報処理装置の実現を目的とする。
【課題を解決するための手段】
【0019】
上記の課題を解決するために、本発明に係る情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータが複数含まれる2次元ピークデータセットにおいて、2次元ピークデータ間で対応するマススペクトルを同定する情報処理装置であって、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する第1マススペクトル抽出部と、異なる2次元ピークデータから抽出されたマススペクトルデータ同士を比較することによって、それぞれの2次元ピークデータから抽出された内部標準となるマススペクトルデータが含まれる内部標準マススペクトルデータセットを作成する内部標準同定部と、内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部と、保持時間が補正された2次元ピークデータから保持時間ごとに新たなマススペクトルデータを抽出する第2マススペクトル抽出部と、保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士を比較することによって、比較した新たなマススペクトル同士が対応するものであるか否かを判定する対応判定部とを備えていることを特徴とする。
【0020】
本明細書において、「2次元ピークデータ」とは、クロマトグラフィーと質量分析との組み合わせに基づいて得られるデータであって、かつ、各フラグメントイオン又は擬分子イオンのイオン強度が単一の保持時間に対応付けられたデータのことをいう。そして、その単一の保持時間に対応付けられたイオン強度のことを「ピークイオン強度」という。さらに本明細書において、「ピーク」とは、上記フラグメントイオン又は擬分子イオンのイオン強度が最大となる点のことをいう。また、本明細書において、「マススペクトルデータ」とは、m/zごとのイオン強度の情報を示すデータであって、例えば、2次元ピークデータから、或る保持時間についてのm/zごとのイオン強度の情報を抽出することによって得ることができる。
【0021】
本発明に係る情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータが複数含まれる2次元ピークデータセットにおいて、2次元ピークデータ間で対応するマススペクトルを同定するものである。
【0022】
上記構成によれば、第1マススペクトル抽出部によって、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータが抽出される。このマススペクトルデータは化合物を同定する手がかりになるものであり、同一の化合物からは同一のマススペクトルデータが得られる。そして、内部標準同定部によって、異なる2次元ピークデータから抽出されたマススペクトルデータ同士が比較され、それぞれの2次元ピークデータから抽出された互いに類似するマススペクトルデータが含まれる内部標準マススペクトルデータセットが作成される。この内部標準マススペクトルデータセットに含まれるマススペクトルデータは互いに類似するものであり、換言すれば、それぞれの2次元ピークデータに共通して見られるマススペクトルということになる。
【0023】
これらのマススペクトルデータは、互いに類似しているため、同一の化合物から得られたものと推定できる。クロマトグラフィーの原理によれば、同一の化合物は同一の保持時間の画分に含まれるため、上記のセットに含まれるマススペクトルデータは、全て同一の保持時間に対応するべきものである。従って、このセットに含まれるマススペクトルデータを内部標準として、各2次元ピークデータの保持時間のずれを補正することができるのである。
【0024】
本発明の情報処理装置では、保持時間補正部によって、それぞれの2次元ピーク情報における保持時間が、上述した内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて補正される。これにより、それぞれの2次元ピークデータごとの保持時間のずれが解消される。
【0025】
続いて、第2マススペクトル抽出部によって、保持時間が補正されたそれぞれの2次元ピークデータから保持時間ごとに新たなマススペクトル情報が抽出される。そして、対応判定部によって、保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士が比較され、比較された新たなマススペクトル同士が対応するものであるか否かが判定される。
【0026】
つまり、本発明に係る情報処理装置では、最終的に、保持時間の違いが所定の範囲内のマススペクトルデータ同士のみを比較する。従って、保持時間が大きく異なるマススペクトル同士を対応付けてしまうことがない。これにより、マススペクトルの対応付けを正確に行うことができる。さらに、この際用いられる保持時間は、実験ごとのずれが補正された正確なものであるため、対応付けを一層正確に行うことができる。
【0027】
以上のように、本発明に係る情報処理装置によれば、複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付けることができる。
【0028】
また、上記内部標準同定部は、2次元ピークデータ間で、保持時間の違いが所定の範囲内のマススペクトルデータ同士を比較することが好ましい。
【0029】
上記構成によれば、内部標準同定部によって比較されるマススペクトルデータは、保持時間の違いが所定の範囲内のものとなる。従って、ピークパターンは類似しているものの保持時間が著しく異なるマススペクトルデータのセットを、内部標準として意図せずに用いてしまうのを防止することができる。
【0030】
また、上記第1マススペクトル抽出部は、それぞれのマススペクトルデータを、m/zごとのイオン強度を要素とするベクトルとして抽出することが好ましい。
【0031】
上記構成によれば、マススペクトルデータ同士の類似性の判定は、ベクトル同士の比較に基づいて行われる。ベクトルの類似性を判定する公知の手法には様々な手法があり、類似度を算出することなどにより、マススペクトルデータ同士の類似性を客観的に判定することができるようになる。
【0032】
また、上記第2マススペクトル抽出部は、それぞれの新たなマススペクトルデータを、m/zごとのイオン強度を要素とする新たなベクトルとして抽出し、上記対応判定部は、異なる補正された2次元ピークデータから抽出した新たなベクトル同士の類似度を算出するとともに、算出した類似度を閾値と比較することによって、マススペクトルデータ同士が対応しているか否かを判定することが好ましい。
【0033】
上記構成によれば、対応判定部によって、それぞれのマススペクトルデータに対応するベクトル同士の類似度が算出され、さらに、算出された類似度と閾値との比較結果に基づいて、マススペクトルデータが対応するものであるか否かが判定される。このように、本発明に係る情報処理装置では、マススペクトルデータの対応付けを、ベクトルの類似度という客観的な指標に基づいて行うことができる。
【0034】
また、上記情報処理装置は、上記対応判定部によって対応すると判定された新たなマススペクトル同士について、それぞれの新たなマススペクトルの識別情報が同じ行又は列に配列された対応テーブルを作成するテーブル作成部をさらに備えていることが好ましい。
【0035】
上記構成によれば、作成された対応テーブルを参照することによって、異なる2次元ピークデータ間において、どのマススペクトルとどのマススペクトルとが対応しているかを知ることができる。
【0036】
また、上記の課題を解決するために、本発明に係る別の情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータから、保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータを作成する2次元ピークデータ作成部と、上記2次元ピークデータについて、保持時間ごとにピークイオン強度の総和をトータルピーク強度として算出し、保持時間ごとのトータルピーク強度の情報であるトータルピークデータを作成するトータルピーク作成部と、上記トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を同定し、その区間においてトータルピーク強度が極大になる保持時間を、2次元ピークデータの上記区間に含まれるピークに対応する真の保持時間として同定する第1ピーク位置同定部とを備えていることを特徴とする。
【0037】
本明細書において、「2次元スペクトルデータ」とは、クロマトグラフィーと質量分析との組み合わせに基づいて得られるデータであって、各フラグメントイオン又は擬分子イオンのイオン強度が複数の保持時間にまたがっているデータのことをいう。
【0038】
上記構成によれば、まず、2次元ピークデータ作成部によって、2次元スペクトルデータから2次元ピークデータが作成される。ここで、一例として、作成された2次元ピークデータにおいて、図9のピーク101とピーク102のように、本来は同一の保持時間に対応付けられるべきピークが、ランダム誤差のために異なる保持時間(t1とt2)に対応付けられているとする。上記構成によれば、トータルピーク作成部によって、保持時間ごとにトータルピーク強度が算出される。その結果、保持時間t1及びt2におけるトータルピーク強度は閾値よりも大きくなる(あるいは閾値以上となる)。従って、保持時間がt1からt2までの区間は、第1ピーク同定部によって、トータルピーク強度が常に閾値以上になる区間(あるいは常に閾値よりも大きくなる区間)として同定される。そして、第1ピーク同定部によって、その区間においてトータルピーク強度が極大になる保持時間t1が、ピーク101とピーク102の真の保持時間として同定される。従って、ピーク101とピーク102は、同一の保持時間t1に位置し、単一の化合物由来のピークとして扱うことができる。
【0039】
以上のように、本発明に係る情報処理装置によれば、サンプリングされた2次元スペクトルデータから、個々のピークの位置を正確に同定することができる。
【0040】
また、上記第1ピーク位置同定部は、さらに、上記2次元ピークデータの上記区間に含まれるピークイオン強度を、同定した真の保持時間に対応付けることが好ましい。
【0041】
上記構成によれば、ピークイオン強度が正確な保持時間に対応付けられた2次元ピークデータを得ることができる。
【0042】
また、上記2次元ピークデータ作成部は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間を同定する第2ピーク位置同定部と、それぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度を、仮のピーク保持時間のイオン強度に加算することによってピークイオン強度を算出するとともに、算出したピークイオン強度を仮のピーク保持時間と対応付けることによって、上記2次元ピークデータを作成するスペクトル強度合体部とを含んでいることが好ましい。
【0043】
上記構成によれば、まず、第2ピーク位置同定部によって、2次元スペクトルデータからm/zごとにマスクロマトグラムデータが抽出される。そして、それぞれのマスクロマトグラムデータにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間が同定される。続いて、スペクトル強度合体部によって、それぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度が、仮のピーク保持時間のイオン強度に加算される。この加算されたイオン強度はピークイオン強度となる。そして、このピークイオン強度は、仮のピーク保持時間と対応付けられる。その結果、複数の保持時間にまたがったイオン強度は、仮のピーク保持時間に纏められる。このようにして、2次元スペクトルデータから2次元ピークデータを作成することができる。
【0044】
また、上記情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおけるイオン強度を平滑化することによって、上記2次元ピークデータ作成部に入力する2次元スペクトルデータを作成する平滑化部をさらに備えていることが好ましい。
【0045】
通常、イオン強度をサンプリングする際には、ランダムノイズが混入することが避けられない。ここで、上記構成によれば、平滑化部によって、2次元スペクトルデータにおけるイオン強度が保持時間軸に沿って平滑化されるので、ランダムノイズの影響を抑制することができる。
【0046】
ところで、上記情報処理装置は、ハードウェアで実現してもよいし、プログラムをコンピュータに実行させることによって実現してもよい。具体的には、本発明に係るプログラムは、上記各部としてコンピュータを動作させるプログラムであり、本発明に係る記録媒体には、当該プログラムが記録されている。
【0047】
これらのプログラムがコンピュータによって実行されると、当該コンピュータは、上記情報処理装置として動作する。したがって、上記情報処理装置と同様の効果を奏する。
【発明の効果】
【0048】
以上のように、本発明に係る情報処理装置は、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する第1マススペクトル抽出部と、異なる2次元ピークデータから抽出されたマススペクトルデータ同士を比較することによって、それぞれの2次元ピークデータから抽出された互いに類似するマススペクトルデータが含まれる内部標準マススペクトルデータセットを作成する内部標準同定部と、内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部と、保持時間が補正された2次元ピークデータから保持時間ごとに新たなマススペクトルデータを抽出する第2マススペクトル抽出部と、保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士を比較することによって、比較した新たなマススペクトル同士が対応するものであるか否かを判定する対応判定部とを備えた構成となっている。従って、上述したように、複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付けることができるという効果を奏する。
【0049】
また、本発明に係る別の情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータから、保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータを作成する2次元ピークデータ作成部と、上記2次元ピークデータについて、保持時間ごとにピークイオン強度の総和をトータルピーク強度として算出し、保持時間ごとのトータルピーク強度の情報であるトータルピークデータを作成するトータルピーク作成部と、上記トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を同定し、その区間においてトータルピーク強度が極大になる保持時間を、2次元ピークデータの上記区間に含まれるピークに対応する真の保持時間として同定する第1ピーク位置同定部とを備えた構成となっている。従って、上述したように、サンプリングされた2次元スペクトルデータから、個々のピークの位置を正確に同定することができるという効果を奏する。
【発明を実施するための最良の形態】
【0050】
〔実施形態1〕
本発明に係る情報処理装置の一実施形態について図1から図13に基づいて説明すると以下の通りである。
【0051】
本実施形態のスペクトル解析装置(情報処理装置)は、GC/MS、LC/MSなど、クロマトグラフィーと質量分析とを組み合わせた測定装置がサンプリングしたデータを解析する装置である。上記の測定装置によって得られたイオン強度情報のデータは、イオン化による質量数と電荷の比(以下「m/z」という)、及び保持時間についての2次元スペクトルデータであるといえる。本実施形態のスペクトル解析装置は、上記の2次元スペクトルデータに含まれるピークの位置(すなわちピークに対応するm/z及び保持時間)を正確に同定するために用いられる。
【0052】
まず、測定装置によって得られるデータの表記方法について定義する。上述したように、測定装置によって得られるイオン強度情報(以下「スペクトル強度」という)は、m/z及び保持時間ごとに変動する。ここで、得られるスペクトルデータにおいて、m/zの番号を値の小さいものから順に1,2,…,M、保持時間の番号を時間の小さいものから順に1,2,…,Kとした場合に、保持時間がk番目でm/zがm番目のサンプル点のスペクトル強度を、xk,mと表すことにする。
【0053】
図6は、本実施形態のスペクトル解析装置の要部構成を示す機能ブロック図である。本実施形態のスペクトル解析装置1は、図6に示すように、主としてピークデータ作成部10及びピーク対応付け部20を機能ブロックとして備えたマイクロコンピュータである。
【0054】
ピークデータ作成部10は、LC/MS100(又はGC/MS)から得られた2次元スペクトルデータにおけるピークの保持時間及びイオン強度を同定し、各フラグメントイオン及び/又は擬分子イオンのイオン強度が単一の保持時間及びm/zに対応付けられた2次元ピークデータを作成するためのものである。また、ピーク対応付け部20は、上記のピークデータ作成部10によって得られた複数の実験に関する2次元ピークデータ同士を比較し、複数の実験間で同一の化合物由来のピーク同士を対応付けるためのものである。
【0055】
(1.ピークデータ作成部/ピークデータ作成工程)
図7は、ピークデータ作成部10の詳細な機能構成を示すブロック図である。図7に示すように、本実施形態におけるピークデータ作成部10は、平滑化部11、ピーク時間同定部(第2ピーク位置同定部)12、スペクトル強度合体部13、トータルピーク作成部14、トータルピーク合体部(第1ピーク位置同定部)15、及びピーク合体部(第1ピーク位置同定部)16を含んでいる。
【0056】
平滑化部11は、2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムにおけるイオン強度を平滑化する。平滑化した2次元スペクトルデータは、ピーク時間同定部12に入力される。
【0057】
ピーク時間同定部12は、平滑化部11から入力された2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間(ピークに対応する保持時間)を同定する。この仮のピーク位置の情報は、抽出されたマスクロマトグラムデータとともにスペクトル強度合体部13に入力される。
【0058】
スペクトル強度合体部13は、ピーク時間同定部12から入力されたそれぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度を、仮のピーク保持時間のイオン強度に加算することによってピークイオン強度を算出し、算出したピークイオン強度を仮のピーク保持時間と対応付ける。この処理により、複数の保持時間にまたがるフラグメントイオン又は擬分子イオンのイオン強度は、単一の保持時間及びm/zに対応付けられたピークイオン強度となり、その結果、2次元ピークデータが作成される。作成された2次元ピークデータは、トータルピーク作成部14に入力される。
【0059】
トータルピーク作成部14は、スペクトル強度合体部13から入力された2次元ピークデータについて、保持時間ごとにピークイオン強度の総和を算出する。算出されたピークイオン強度の総和は、トータルピーク強度と称され、各保持時間の画分に含まれる化合物の相対量を示す指標となる。このトータルピーク強度は保持時間ごとに算出されるため、保持時間とトータルピーク強度との関係を示すトータルピークデータが作成される。このトータルピークデータは、トータルピーク合体部15に入力される。
【0060】
トータルピーク合体部15は、トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を求め、その区間においてトータルピーク強度が極大になる保持時間を同定する。ここで同定された保持時間は、2次元ピークデータの同区間に含まれる全てのピークに対応する真の保持時間となる。ここで求めた区間及び真の保持時間の情報は、2次元ピークデータとともにピーク合体部16に入力される。さらに、トータルピーク合体部15は、ここで求めた区間に含まれるトータルピーク強度の総和を算出し、算出した総和を真の保持時間に対応付ける。これにより、更新されたトータルピークデータが作成される。この更新されたトータルピークデータは、ピーク対応付け部20の第1ピークベクトル作成部21に入力される。
【0061】
ピーク合体部16は、トータルピーク合体部15から入力された2次元ピークデータにおいて、上記の区間に含まれる全てのピークの位置を、上記の真の保持時間に対応付ける。具体的には、上記の区間に含まれるピークのピーク強度の総和をm/zごとに算出し、算出した総和を真の保持時間に対応付ける。これにより、更新された2次元ピークデータが作成される。更新された2次元ピークは、対応付け部20の第1ピークベクトル作成部21に入力される。
【0062】
次に、ピークデータ作成部10の動作について説明する。ピークデータ作成部10の処理工程(ピーク解析方法)は、平滑化工程、ピーク時間同定工程、スペクトル強度合体工程、トータルピーク作成工程、トータルピーク合体工程、及びピーク合体工程を含んでいる。これらの工程について順に説明すると以下の通りである。
【0063】
(1−1.平滑化部/平滑化工程)
まず、測定装置から得られた2次元スペクトルデータに対して、保持時間軸に沿って平滑化を行う。平滑化の詳細な手順は次の通りである。
【0064】
2次元スペクトルをm/z軸と直交する平面で切り出して得られるマスクロマトグラムにおいて、保持時間がk番目のサンプル点のスペクトル強度をxkとする。平滑化は、k番目のサンプル点を中心とする合計N個のサンプル点についてスペクトル強度の平均値を算出し、算出した平均値をk番目のサンプル点のスペクトル強度に割り当てることによって行われる。これにより、k番目のサンプル点の平滑化後のイオン強度x’kは、次の式(1)
【0065】
【数1】
【0066】
(ただし、N’=(N−1)/2)
によって表される。
【0067】
なお、この処理は、各m/zと直交する全ての平面について行われる。従って、保持時間がk番目でm/zがm番目のサンプル点の平滑化後のスペクトル強度x’k,mは、次の式(2)
【0068】
【数2】
【0069】
によって表される。この処理により、2次元スペクトルデータは、保持時間軸に沿って平滑化されたものとなる。この平滑化工程は、平滑化部11によって行われる。
【0070】
上記の平滑化工程による効果は次の通りである。通常、GC/MSやLC/MSなどによって得られるデータでは、測定されたイオン強度がランダム誤差を含んでいる。従って、測定されたイオン強度情報をそのまま用いてピークの保持時間を同定すると、ランダム誤差によりピークの保持時間が本来のものからずれてしまうことがある。しかしながら、上記の平滑化工程を行えば、ランダム誤差による影響を抑制し、ピークの位置を正確に検出することができるようになる。
【0071】
(1−2.ピーク時間同定部/ピーク時間同定工程)
次に、平滑化後の2次元スペクトルをm/z軸と直交する平面で切り出して得られるマスクロマトグラムにおけるピークの位置(ピークに対応する保持時間)を同定する。ピークの位置を同定する際には、ある保持時間のサンプル点がピークであるか否かを検定する作業を保持時間軸に沿って順次行っていく。検定方法は次の通りである。
【0072】
保持時間がk番目のサンプル点がピークであるか否かの判定は、k−1番目のサンプル点における曲線の傾きと、k+1番目のサンプル点における曲線の傾きとに基づいて行われる。詳細には、k−1番目のサンプル点における傾きが0よりも大きく、かつ、k+1番目のサンプル点における傾きが0よりも小さい場合に、k番目のサンプル点がピークであると判定する。
【0073】
なお、各サンプル点における曲線の傾きは、そのサンプル点を中心とする合計N個のサンプル点のスペクトル強度を基に、線形回帰式を用いて簡便に求めることができる。具体的には、k番目のサンプル点における曲線の傾きをbkとすると、bkは、次の式(3)
【0074】
【数3】
【0075】
によって表される。
【0076】
この処理は、各m/zと直交する全てのマスクロマトグラムについて行われる。従って、保持時間がk番目でm/zがm番目のサンプル点における曲線の傾きをbk、mとすると、bk,mは、次の式(4)
【0077】
【数4】
【0078】
によって表される。このピーク時間同定工程は、ピーク時間同定部12によって行われる。
【0079】
(1−3.スペクトル強度合体部/スペクトル強度合体工程)
続いて、平滑化後の2次元スペクトルをm/z軸と直交する断面で切り出してみる。得られたマスクロマトグラムにおいて、極小値−極大値−極小値からなる区間を1つの「山」と定義すると、この山に含まれる全てのサンプル点のスペクトル強度は、その山のピークの位置から派生したものであると考えられる。
【0080】
従って、各山に含まれる全てのサンプル点のスペクトル強度をピークの位置に纏める処理を行う。この処理は、ピーク周辺のサンプル点のスペクトル強度をピークのサンプル点のスペクトル強度に加算し、ピーク周辺のサンプル点のスペクトル強度を0にすることによって行われる。
【0081】
図8は、この処理手順を詳細に説明するフロー図である。k番目のサンプル点がピークと判定されたとする。ここで、k番目の保持時間をtk、保持時間tkにおけるピーク強度を示す変数をP(tk)とすると、まず、P(tk)にk番目のサンプル点のスペクトル強度xkを代入する(S31)。次に、ピークの左側に存在するサンプル点のスペクトル強度をピークに順次加算していくために以下の処理を行う。
【0082】
まず、処理対象のサンプル点をピークの左隣にセットするために、処理対象のサンプル番号を示す変数sにk−1を代入する(S32)。続いて、処理対象のサンプル点における曲線の傾きbsを0と比較する(S33)。ここで、傾きbsが0よりも大きい場合は、処理対象のサンプル点が現在のピークに含まれるべきサンプル点であると判断し、次のステップS34に進む。
【0083】
ステップS34では、処理対象のサンプル点のスペクトル強度xsをP(tk)に加算する。そして、処理対象のサンプル点を左側に1つずらすために、変数sの値を一つ減らす(S35)。そして、ステップS33に戻る。
【0084】
一方、ステップS33において、傾きbsが0以下である場合は、処理対象のサンプル点が現在のピークに含まれるべきものでないと判断し、ステップS36に進む。そして、今度は、ピークの右側に存在するサンプル点のスペクトル強度をピークに順次加算していくために以下の処理を行う。
【0085】
まず、処理対象のサンプル点をピークの右隣にセットするために、変数sにk+1を代入する(S36)。続いて、処理対象のサンプル点における曲線の傾きbsを0と比較する(S37)。ここで、傾きbsが0よりも小さい場合は、処理対象のサンプル点が現在のピークに含まれるべきサンプル点であると判断し、次のステップS38に進む。
【0086】
ステップS38では、処理対象のサンプル点のスペクトル強度xsをP(tk)に加算する。そして、処理対象のサンプル点を右側に1つずらすために、変数sの値を一つ増やす(S35)。そして、ステップS37に戻る。
【0087】
一方、ステップS37において、傾きbsが0以上である場合には、処理対象のサンプル点が現在のピークに含まれるべきものでないと判断し、処理を終了する。以上により、1つのピークに属するべき各サンプル点のスペクトル強度が全てピークの位置に纏められる。その結果、t番目の保持時間tkに纏められたピーク強度はP(tk)として得られる。なお、ピーク以外の位置におけるP(tk)は0とする。
【0088】
この処理は、各m/zと直交する全ての断面に含まれる全てのピークについて行われる。以下では、保持時間がtkでm/zがm番目におけるピーク強度をP(tk)mと表現する。また、保持時間、m/z、ピーク強度を要素とするデータのことを2次元ピークデータという。図9の上段は、この2次元ピークデータを可視化したものである。上記のスペクトル強度合体工程は、スペクトル強度合体部13によって行われる。
【0089】
上記の第1ピーク時間同定工程及びスペクトル強度合体工程によれば、同一のフラグメントイオンから得られるイオン強度情報が複数の保持時間にまたがってしまう場合であっても、それぞれのイオン強度情報を纏め、単一の保持時間に対応する一つのピーク強度情報として算出することができる。つまり、各フラグメントイオンに由来するピークの強度と、同ピークに対応する保持時間とを得ることができる。
【0090】
(1−4.トータルピーク作成部/トータルピーク作成工程)
次に、スペクトル強度合体工程後の2次元ピークデータを保持時間軸と直交する断面で切り出し、得られたマススペクトルに含まれる全てのピークのピーク強度を合計することによって、トータルピーク強度を算出する。この処理は、各保持時間と直交する全てのマススペクトルについて行われる。換言すれば、ある保持時間に対応する全てのピークを1つに纏める作業を全ての保持時間について行う。
【0091】
従って、保持時間tkにおけるトータルピーク強度をTI(tk)とすると、TI(tk)は次の式(5)
【0092】
【数5】
【0093】
によって表される。
【0094】
なお、このトータルピーク作成工程は、トータルピーク作成部14によって行われる。以下では、この保持時間ごとのトータルピーク強度TI(tk)のデータのことをトータルピークデータという。図9の中段は、トータルピークデータを可視化したものである。また、このトータルピークデータを作成する際に一つのトータルピークに纏められるピーク群のことをトータルピーク群という。トータルピーク群は、単一の化合物から得られるマススペクトルに相当する。
【0095】
(1−5.トータルピーク合体部/トータルピーク合体工程)
図9の中段に示すトータルピークデータにおいて、保持時間t1、t2におけるトータルピーク強度は、同一の化合物に由来するものであると考えられる。従って、トータルピーク合体工程では、これらの同一の化合物に由来すると考えられるトータルピークを一つに纏める処理を、以下の手順に従って行う。
【0096】
まず、連続する保持時間ti〜ti+n(ただしnは自然数)においてトータルピーク強度が常に0よりも大きくなる区間を同定する。そして、この区間において、トータルピーク強度が最大(極大)になる保持時間tuと山の両端部(極小点)の保持時間tsu、teu(ただしsu<euとする)とを同定する。なお、1つの山に含まれるトータルピーク強度の数が2つしかない場合などでは、tuがtsu又はteuと等しくなる場合もある。なお、ここで得られた保持時間tuは、後に、2次元ピークデータの区間tsu〜teuに含まれる全てのピークの真の保持時間になるものである。
【0097】
そして、保持時間tuを除くtsuからteuまでのトータルピーク強度を、保持時間tuにおけるトータルピーク強度に加算し、保持時間tu以外のトータルピーク強度を0にする。この処理は、全ての区間の全ての山について行われる。
【0098】
以上により、1つの化合物に由来する複数のトータルピーク強度が、化合物の保持時間を代表する1つの位置(トータルピーク強度が極大になる保持時間)に纏められる。
【0099】
一例を示すと、図9中段のトータルピークデータでは、連続する保持時間t1及びt2においてトータルピーク強度が0よりも大きくなっている。この場合、tu=t1、tsu=t1、teu=t2となる。そして、保持時間t2におけるトータルピーク強度を保持時間t1におけるトータルピーク強度に加算し、保持時間t2におけるトータルピーク強度を0にする。その結果、トータルピークデータは、図9下段のようになる。
【0100】
他の例を示すと、図10の(1)の場合は連続する2つのトータルピークが1つのピークに纏められ、(2)の場合は2つのトータルピークの間に0となる保持時間があることから2つのピークのままであり、(3)の場合は4つのトータルピークが2つのピークに纏められる。
【0101】
なお、本実施形態では、トータルピーク強度が常に0よりも大きくなる区間を同定したが、トータルピーク強度にノイズ等が含まれる場合は、所定の閾値を設定し、常に閾値よりも大きくなる区間や、常に閾値以上となる区間を同定してもよい。
【0102】
このトータルピーク合体工程は、トータルピーク合体部15によって行われる。
【0103】
(1−6.ピーク合体部/ピーク合体工程)
次に、図4上段の2次元ピークデータについても、上記のトータルピーク合体工程で求めた区間に含まれる各ピーク強度を纏める処理を行う。つまり、上記の保持時間tsu〜teuに含まれるピークのピーク強度の総和を各m/zごとに取り、総和を保持時間tuに対応付ける。
【0104】
上述した例で説明すると、図9上段の2次元ピークデータにおける、m/zがMのピークについて、ピーク強度P(t1)MとP(t2)Mとを加算し、加算したピーク強度を保持時間t1に対応付ける。ここではP(t2)M=0であるので、処理の前後でピークの位置及び強度に変化はない。
【0105】
同様に、m/zがmのピークについても、ピーク強度P(t1)mとP(t2)mとを加算し、加算したピーク強度を保持時間t1に対応付ける。この場合、P(t1)m=0であるので、処理の前後でピークの強度に変化はないが、ピークの位置がt1に変化する。上記の処理の結果、図11のようになる。
【0106】
この処理は、トータルピーク合体工程で求めた全ての区間について、全てのm/zごとに行われる。なお、ピーク合体工程はピーク合体部16によって行われる。
【0107】
上記のトータルピーク合体工程及びピーク合体工程による効果は以下の通りである。図9上段に示すm/zごとのピークデータにおいて、ピーク101とピーク102とは、同一の化合物から解離したフラグメントイオン又は擬分子イオンによるものであると考えられる。しかしながら、測定データにはランダム誤差が含まれるため、スペクトル強度合体工程の結果、図9上段のピーク101とピーク102とのように、同一の化合物から解離したフラグメントイオンによるピークであっても、互いに異なる保持時間に対応付けられてしまうことがある。その結果、本来同一の化合物に関するピークとして扱うべき2つのピーク101・102を、別々の化合物に関するピークとして扱ってしまうことになる。
【0108】
しかしながら、上記のトータルピーク合体工程及びピーク合体工程によれば、図11に示すように、ピーク101とピーク102とが同じ保持時間に対応付けられる。その結果、ピーク101とピーク102とを同一の化合物に関するピークとして扱うことができるようになるのである。
【0109】
(2.ピーク対応付け部/ピークデータ対応付け工程)
ピーク対応付け部20は、複数の実験から2次元ピークデータのセットが得られた際に、複数の2次元ピークデータ間で、同一の化合物由来のトータルピーク群(マススペクトル)同士を対応付けるためのものである。なお、ピーク対応付け部20に入力する2次元ピークデータは、必ずしも上記のピークデータ作成部10によって作成したものでなくてもよく、同様のデータであれば公知の手法によって作成したものでもよい。
【0110】
ピークデータ対応付け部20によるピークデータ対応付け工程の概要について説明すると、次の通りである。ガスクロマトグラフィーや液体クロマトグラフィーなどの分離法では、実験ごとに保持時間に誤差が含まれるため、それぞれの実験から得られた2次元ピークデータ間でトータルピーク群同士を対応付けるためには保持時間の補正が必要となる。そのために、ピークデータ対応付け部20は、比較したい2次元ピークデータの全てに共通に存在するトータルピーク群を内部標準ピーク群として検出し、この内部標準ピーク群の保持時間を基に2次元ピークデータにおける保持時間を補正する。さらに、ピークデータ対応付け部20は、補正された保持時間に基づいて、ユーザによって指定された許容範囲内で実験間のトータルピーク群同士を対応づけ、対応テーブルとして表現する。
【0111】
以下では、実験s(s=1,2,…,S)からピークデータ作成部10によって得られる2次元ピークデータを次の表1のように表す。
【0112】
【表1】
【0113】
ただし、P(s)(tk(s))mは、実験sから得られた2次元ピークデータにおいて、保持時間がtk(s)でm/zがm番目のサンプル点のピーク強度を示す。
【0114】
また、実験s(s=1,2,…,S)からピークデータ作成部10によって得られるトータルピークデータは次の表2のようになる。
【0115】
【表2】
【0116】
ただし、TI(s)(tk(s))は、実験sから得られたトータルピークデータにおいて、保持時間がtk(s)のトータルピーク強度を示す。
【0117】
図1は、ピーク対応付け部20の詳細な機能構成を示すブロック図である。図1に示すように、本実施形態におけるピーク対応付け部20は、第1ピークベクトル作成部(第1マススペクトル抽出部)21、内部標準同定部22、内部標準確認部23、保持時間補正部24、第2ピークベクトル作成部(第2マススペクトル抽出部)25、対応判定部26、及びテーブル作成部27を含んでいる。
【0118】
第1ピークベクトル作成部21は、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出し、それぞれのマススペクトルデータに含まれるピーク強度を要素とするピークベクトルを作成する。なお、本実施形態において、第1ピークベクトル作成部21は、このピークベクトルの作成を全ての2次元ピークデータについて行う。作製されたピークベクトルは、内部標準同定部22に入力される。
【0119】
内部標準同定部22は、或る2次元ピークデータから作成されたピークベクトルと他の2次元ピークデータから作成されたピークベクトルとを比較し、異なる2次元ピークデータ間で類似するピークベクトルを同定する。なお、この異なる2次元ピークデータ間で類似するピークベクトルのことを内部標準ピークベクトルという。内部標準同定部22は、全ての2次元ピークデータにおいて共通に見られる内部標準ピークベクトルのセットを作成する。後続の保持時間補正部24では、このセットに含まれるそれぞれの内部標準ベクトルの保持時間に基づいて、それぞれの2次元ピークデータの保持時間を補正する。なお、内部標準ピークベクトルのセットは、1セットだけ作成してもよいし、複数セット作成してもよい。この内部標準ピークベクトルのセットは、内部標準確認部23に入力される。
【0120】
内部標準確認部23は、内部標準同定部22によって同定された内部標準ピークベクトルが、適切であるか否かを確認するためのものである。具体的には、ユーザに対して内部標準ピークベクトルを視覚的に表示し、ユーザの指示に従って不適切な内部標準ピークベクトルを除外する機能を有している。また、内部標準確認部23は、ユーザの指示に従って内部標準ピークベクトルを他のピークベクトルに変更することもできる。このようにして変更された内部標準ピークベクトルのセットは、保持時間補正部24に入力される。
【0121】
保持時間補正部24は、内部標準ピークベクトルのセットに含まれるそれぞれの内部標準ピークベクトルに対応する保持時間に基づいて、異なる実験から得られた2次元ピークデータの保持時間を補正する。具体的には、異なる2次元ピークデータから得られた内部標準ピークベクトル同士が同一の保持時間となるように、それぞれの2次元ピークデータの保持時間を補正する。保持時間が補正された2次元ピークデータは、第2ピークベクトル作成部25に入力される。
【0122】
第2ピークベクトル作成部25は、保持時間が補正された2次元ピークデータから保持時間ごとに1次元ピークデータ(マススペクトルデータ)を切り出し、それぞれのマススペクトルデータに含まれるピーク強度を要素とするピークベクトルを新たに作成する。なお、第2ピークベクトル作成部25は、このピークベクトルの作成を全ての2次元ピークデータについて行う。新たに作成されたピークベクトルは、対応判定部26に入力される。
【0123】
対応判定部26は、保持時間が補正された2次元ピーク情報間で、保持時間の違いが所定の範囲内のピークベクトル同士を比較することによって、比較したピークベクトル同士が対応するものであるか否かを判定する。
【0124】
テーブル作成部27は、トータルピーク群の対応関係を示すテーブルを作成するためのものであり、本実施形態では、対応するトータルピーク群の識別情報が同一の列に記載された対応テーブルを作成する。なお、テーブル作成部27は、対応するトータルピーク群の識別情報が同一の行に記載された対応テーブルを作成してもよい。
【0125】
次に、ピーク対応付け部20の動作について説明する。ピーク対応付け部20によるピーク対応付け工程は、第1ピークベクトル作成工程、内部標準同定工程、内部標準確認工程、保持時間補正工程、及び第2ピークベクトル作成工程、対応判定工程、及びテーブル作成工程を含んでいる。これらの工程について順に説明すると以下の通りである。
【0126】
(2−1.第1ピークベクトル作成部/第1ピークベクトル作成工程)
まず、上記の表1に示す2次元ピークデータから、保持時間ごとに、トータルピーク群に含まれる各ピークのピーク強度を要素とするピークベクトルを作成する。このピークベクトルの作成は、全ての実験について行われる。
【0127】
s番目の実験における保持時間tk(s)のピークベクトルをf(s)(tk(s))とすると、f(s)(tk(s))は、次の式(6)
f(s)(tk(s))=(P(s)(tk(s))1,P(s)(tk(s))2,…,P(s)(tk(s))m,…
…,P(s)(tk(s))M) …(6)
によって表すことができる。
【0128】
この工程は、換言すれば、各実験について、2次元ピークデータから保持時間ごとに1次元ピークデータ(マススペクトルデータ)を抽出する工程であるともいえる。この第1ピークベクトル作成工程は、第1ピークベクトル作成部21によって行われる。
【0129】
(2−2.内部標準同定部/内部標準同定工程)
次に、異なる実験間で類似するピークベクトルのセットを同定する。ピークベクトルは、保持時間ごとに切り出した1次元ピークデータ、すなわちマススペクトルデータであるため、その保持時間の画分に含まれた化合物に依存したベクトルとなる。従って、異なる実験から得られた混合物の中に同一の化合物が含まれていれば、類似するピークベクトルが得られると考えられる。よって、この類似するピークベクトルを内部標準ピークベクトルとして同定し、この内部標準ピークベクトルに対応する保持時間に基づいて、実験ごとの保持時間のずれを補正するのである。
【0130】
本実施形態では、ピークベクトルを比較する際に3つの閾値TIP,NTP,Tintを導入する。これらの閾値は、ユーザによって設定することができる。
【0131】
TIP及びNTPは、ピークベクトルが内部標準ピークベクトルの候補としてふさわしいか否かを検定するために用いられるものである。TIPはピーク強度の閾値を示し、一方NTPはピークの本数の閾値を示す。また、Tintは、ピークベクトル同士を比較する際の保持時間の許容範囲を規定するための閾値である。
【0132】
図12は、ピークベクトルの中から内部標準ピークベクトルを探索する工程を示すフロー図である。
【0133】
まず、S個の実験の中から、任意に1つの実験を選択する。ここでは、説明の簡略化のため、1番目の実験を選択するものとする。そして、1番目の実験の1番目のピークベクトルf(1)(t1(1))を選択する(S801)。
【0134】
次に、このピークベクトルf(1)(t1(1))が内部標準ピークベクトルの候補としてふさわしいか否かを、上記のTIP及びNTPを用いて検定する(S802)。具体的には、ピークベクトルf(1)(t1(1))が有する要素P(1)(t1(1))m (m=1,2,…,M)のうち、TIPよりも大きい値を有する要素がNTP個よりも多い場合に、そのピークベクトルは内部標準ピークベクトルの候補になりうると判定され、ステップS803に進む。一方、上記の条件を満たさない場合は、そのピークベクトルは内部標準ベクトルの候補になりえないと判定され、ステップS810、S811、S802の順に進み、実験1の次のピークベクトルについて検定する。
【0135】
ステップS803では、1番目の実験と比較する実験を選択する。ここでは、実験2から順に選択していくことにする。
【0136】
そして、実験2のピークベクトルf(2)(tk(2)) (k=1,2,…,K)の中から、f(1)(t1(1))と最も類似するピークベクトルをf(2)maxとして同定する(S804)。ここで、実験2のピークベクトルf(2)(tk(2)) (k=1,2,…,K)のうち、f(1)(t1(1))に対して探索対象となるものは、次の式(7)
t1(1)−Tint<tk(2)<t1(1)+Tint …(7)
を満たすf(2)(tk(2))である。つまり、式(7)を満たす実験2のピークベクトルf(2)(tk(2))の中から、実験1のピークベクトルf(1)(t1(1))と最も類似するピークベクトルをf(2)maxとして同定する。
【0137】
ここで、例えば、ピークベクトルf(2)maxとして、f(2)(t2(2))が得られたとする。すると今度は、実験2のピークベクトルf(2)(t2(2))と最も類似する実験1のピークベクトルf(1)maxを探索する(S805)。この場合も上記と同様に、探索対象となる実験1のピークベクトルは、Tintによって規定される許容範囲内のものに限定される。具体的には、次の式(8)
t2(2)−Tint<tk(1)<t2(2)+Tint …(8)
を満たすf(1)(tk(1))の中から、f(2)(t2(2))と最も類似するピークベクトルを探索する。
【0138】
次に、得られたピークベクトルf(1)maxが、元のピークベクトルf(1)(t1(1))と一致するか否かが判定される(S806)。つまり、ピークベクトルf(1)maxとしてf(1)(t1(1))が得られた場合は、ピークベクトルf(1)(t1(1))とf(2)(t2(2))とが真に類似すると判断され、これらのピークベクトル同士は、内部標準ピークベクトルの候補として対応付けられ、ステップS807に進む。一方、ピークベクトルf(1)maxとして、f(1)(t1(1))が得られなかった場合は、ピークベクトルf(1)(t1(1))は、内部標準ピークベクトルにはなり得ないと判定され、ステップS810、S811、S802の順に進み、実験1の次のピークベクトルについて検定を行う。
【0139】
図13(a)及び図13(b)は、このことを一般化して示した図である。このように、本実施形態の内部標準同定工程では、2つの実験間において双方向でピークベクトルの類似性を検討し、2つのピークベクトルが互いに最も類似する関係にある場合に、内部標準ピークベクトルの候補としてこれら2つのピークベクトルを対応付ける。
【0140】
ステップS807では、実験1と比較する次の実験が残っているか否かを判定する。そして、次の実験が残っている場合は、次の実験を選択する(S808)。上記の例では、実験3を選択する。そして、実験3についても、上記と同様の手順により、f(1)(t1(1))と互いに最も類似するピークベクトルを探索する(S804〜S806)。このことを、S番目の実験まで繰り返し、f(1)(t1(1))と互いに最も類似するピークベクトルが全ての実験について得られた場合に、f(1)(t1(1))が内部標準ピークベクトルであると認定し(S809)、f(1)(t1(1))及びこれに類似するf(s)max (s=2,3,…,S)を、内部標準ピークベクトルのセットとして対応付ける。そして、ステップS810に進み、さらなる内部標準ピークベクトルのセットを探索する。
【0141】
一方、f(1)(t1(1))と互いに最も類似するピークベクトルが全ての実験について得られなかった場合は、f(1)(t1(1))は内部標準ピークベクトルにはなり得ないと判断し(S810〜S811)、実験1の次のピークベクトルf(1)(t2(1))について、同様の処理を行う(S804〜S809)。
【0142】
なお、ピークベクトル同士の類似性の判定は、公知の手法に従って行うことができる。具体的には、例えばm/zが同一のピークの本数や、コサイン係数、スピアマンの相関係数などに基づいて判定することができる。
【0143】
この処理を、実験1の全てのピークベクトルについて行うことによって、1又は複数の内部標準ピークベクトルのセットを得ることができる。ここで、内部標準ピークベクトルがNセット得られたとすると、得られた内部標準ピークベクトルRf(s)(Tn(s)) (n=1,2,…,N)のセットは、次の表3のように表すことができる。
【0144】
【表3】
【0145】
ただし、Tn(s)は、実験sにおいてnセット目の内部標準ピークベクトルとして認定されたピークベクトルの保持時間を示すものであり、また、T1(s)<T2(s)<…<Tn(s)<…<TN(s)であるものとする。
【0146】
なお、この内部標準同定工程は、内部標準同定部22によって行われる。
【0147】
(2−3.内部標準確認部/内部標準確認工程)
続いて、内部標準確認工程では、内部標準確認部23が、上記の内部標準同定工程によって得られた内部標準ピークベクトルの対応関係をユーザに対して視覚的に提示する。具体的には、各実験から得られた内部標準ピークベクトルのそれぞれをマススペクトルとして表示する。ユーザは、表示されたマススペクトル同士を実験間で比較検討し、得られた内部標準ピークが適切なものであるか否かを判断する。
【0148】
そして、得られた内部標準ピークが不適であると判断した場合、ユーザは、内部標準ピークを削除したり、ある実験についての内部標準ピークベクトルを他のピークベクトルに変更したりするように、スペクトル解析装置1の内部標準確認部23に対してキーボードやマウス操作によって指示を与える。
【0149】
これを受けて、内部標準確認部23は、得られた内部標準ピークベクトルのセットをユーザの指示に従って変更する。具体的には、内部標準ピークベクトルの削除が指示された場合は、上記の表3に示すテーブルから、該当する内部標準ピークベクトルを抹消する。一方、内部標準ピークベクトルを他のピークベクトルに変更するよう指示された場合は、上記のテーブルの該当する内部標準ピークベクトルの保持時間を書き換える。
【0150】
(2−4.保持時間補正部/保持時間補正工程)
次に保持時間補正工程では、得られた内部標準ピークベクトルに対応付けられた保持時間に基づいて、実験間で一致しない保持時間を補正する。具体的には、任意の1つの実験を基準実験として選択し、基準実験の内部標準ピークベクトルに対応する保持時間と、他の実験の内部標準ピークベクトルに対応する保持時間とが一致するように、他の実験の保持時間を線形補間によって補正する。
【0151】
ここで、基準実験としてc番目の実験を選択する。そして、実験sの保持時間tk(s)を補正して得られる補正後の保持時間をtck(s)とすると、tck(s)は、以下の線形補間により算出することができる。
【0152】
まず、tk(s)<T1(c)の場合は、tck(s)は、次の式(9)
【0153】
【数6】
【0154】
によって算出することができる。一方、Ti(c)<tk(s)<Ti+1(c) (i=1,2,…,N−1)の場合は、tck(s)は、次の式(10)
【0155】
【数7】
【0156】
によって算出することができる。また、tk(s)>TN(c)の場合は、tck(s)は、次の式(11)
【0157】
【数8】
【0158】
によって算出することができる。
【0159】
以上の計算により、基準実験c以外の実験における保持時間が、基準実験cの保持時間に沿うように補正される。すなわち、各実験の2次元ピークデータの保持時間は、基準実験cの2次元ピークデータの保持時間のスケールに補間されたことになる。この保持時間補正工程は、保持時間補正部24によって行われる。
【0160】
なお、上記の説明では、線形補間によって保持時間を補正したが、本発明はこれに限定されるものではなく、非線形補間によって保持時間を補正してもよい。
【0161】
保持時間が補正された2次元ピークデータは、次の表4のように表すことができる。
【0162】
【表4】
【0163】
また、トータルピークデータは次の表5のようになる。
【0164】
【表5】
【0165】
(2−5.第2ピークベクトル作成部/第2ピークベクトル作成工程)
この工程では、第1ピークベクトル作成工程と同様の処理を、保持時間が補正された2次元ピークデータについて行う。すなわち、上記の表4に示す2次元ピークデータから、各保持時間ごとに、トータルピーク群に含まれる各ピークのピーク強度を要素とするピークベクトルを作成する。このピークベクトルの作成は、全ての実験について行われる。
【0166】
s番目の実験における保持時間tck(s)のピークベクトルをF(s)(tck(s))とすると、F(s)(tck(s))は、次の式(12)
F(s)(tck(s))=(P(s)(tck(s))1,P(s)(tck(s))2,…
…,P(s)(tck(s))m,…,P(s)(tck(s))M) …(12)
によって表すことができる。
【0167】
この工程は、換言すれば、各実験について、保持時間が補正された2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する工程であるともいえる。この第2ピークベクトル作成工程は、第2ピークベクトル作成部25によって行われる。
【0168】
(2−6.対応判定部/対応判定工程、テーブル作成部/テーブル作成工程)
次に、ユーザなどにより、異なる2次元ピークデータから抽出されたピークベクトル同士の類似性を判定する際に用いる閾値Cを設定する。また、同様に、ユーザなどにより、ピークベクトル同士を比較する際の保持時間の許容範囲を規定するための閾値Tを設定する。
【0169】
そして、テーブル作成部27は、実験1の各トータルピーク群(マススペクトル)の識別情報をテーブルの第1行に代入する。このとき、テーブルの各セルに格納される識別情報をTI(tc1i(1))(1) (i=1,2,…,N1)と表記する。ただし、N1は実験1の2次元ピークデータに含まれるトータルピーク群の総数を示す。また、第k列においてはじめてテーブルに代入された要素をTI(tcki(s))(s)とする。その結果、テーブルは次の表6のようになる。
【0170】
【表6】
【0171】
次に、対応判定部26が、実験2の各ピークベクトルを、実験1のピークベクトルと比較する。まず、対応判定部26は、実験2のピークベクトルの中から、F(2)(tc1(2))を選択する。そして、実験1のピークベクトルF(1)(tck(1)) (k=1,2,…,K)のうち、次の式(13)
tc1(2)−T<tck(1)<tc1(2)+T …(13)
を満たすF(1)(tck(1))の全てと、選択したF(2)(tc1(2))との類似性をそれぞれ評価する。
【0172】
類似性の評価には、例えばm/zが同一のピークの本数や、コサイン係数、スピアマンの相関係数などを用いることができる。対応判定部26は、これらを用いて2つのピークベクトルの類似度を数値化し、この類似度を閾値Cと比較する。ここで、比較対象となる実験1のピークベクトルの中に、類似度が閾値Cを超えるものがない場合、対応判定部26は、F(2)(tc1(2))は、実験1のピークベクトルの何れとも対応しないと判定される。
【0173】
この場合、テーブル作成部27は、F(2)(tc1(2))に対応するトータルピーク群の識別情報を第2行目の第N1+1列目に格納する。格納される識別情報は、TI(tc21(2))(2)となる。
【0174】
一方、比較対象となる実験1のピークベクトルの中に、類似度が閾値Cを超えるものがある場合、対応判定部26は、F(2)(tc1(2))と最も類似度の高い実験1のピークベクトルF(1)(tci(1))が、F(2)(tc1(2))と対応するベクトルであると判定する。
【0175】
この場合、テーブル作成部27は、F(2)(tc1(2))に対応するトータルピーク群の識別情報を、第2行目で、実験1のトータルピーク群TI(tc1i(1))(1)と同じ列に格納する。格納される識別情報は、TI(tc11(2))(2)となる。
【0176】
同様にして、実験2の他のピークベクトルF(2)(tch(2)) (h=2,3,…,N2)についても、対応判定部26が、次の式(14)
tch(2)−T<tck(1)<tch(2)+T …(14)
を満たす実験1のピークベクトルF(1)(tck(1))と比較し、閾値Cを超えるものがない場合は、テーブル作成部27がテーブルの第2行目の右側の新しい列に識別情報を格納し、閾値Cを超えるものがある場合は、テーブル作成部27が第2行目の、最も類似性の高い実験1のピークベクトルに対応するトータルピーク群の識別情報と同じ列に識別情報を格納する。
【0177】
その結果、テーブルは次の表7のようになる。
【0178】
【表7】
【0179】
同様に、実験sについて、対応判定部26が、ピークベクトルF(s)(tcj(s))を実験r(r=1,2,…,s−1)のピークベクトルF(r)(tcm(r)) (ただし、tcj(s)−T<tcm(r)<tcj(s)+T)と比較する。そして、類似度が閾値Cを超えるものがない場合は、テーブル作成部27が第s行目の新しい列zに、F(s)(tcj(s))に対応するトータルピーク群の識別情報TI(tczj(s))(s)を格納する。
【0180】
一方、類似度が閾値Cを超えるものがある場合は、対応判定部26が最も類似するピークベクトルF(r)(tcn(r))を同定し、テーブル作成部27が第s行目の、ピークベクトルF(r)(tcn(r))に対応するトータルピーク群と同じ列に識別情報を格納する。
【0181】
以上の処理を、実験Sまで繰り返すことによって、テーブルは、次の表8のようになる。なお、対応するトータルピーク群がないセルについては、0が格納されるものとする。
【0182】
【表8】
【0183】
以上のようにして得られたテーブルでは、同一の実験から得られたトータルピーク群(マススペクトル)の識別情報が同じ行に配列されるとともに、対応するトータルピーク群(マススペクトル)の識別情報が同じ列に配列されることになる。このテーブルから、同じ列に配列されたトータルピーク群(マススペクトル)同士は、同一の化合物由来のものであることが示される。
【0184】
そして、0以外の値が格納されているセルについて、列ごとに、格納されているトータルピーク群に対応する保持時間の平均値を求め、その平均値を列の代表保持時間とする。
【0185】
以上の工程により、同一の化合物由来とみなすことのできるトータルピーク群(マススペクトル)を検出し行列に表現することが可能となった(表8)。それぞれのトータルピーク群に対応するピークベクトルと精製票品又は市販のマスライブラリーのピークベクトルとの共通性により、トータルピーク群の化合物の同定を行うことができる。このとき、同じ列に配列され、グルーピングされたトータルピーク群のピークベクトルについて代表ピークベクトルを定義することにより物質の検索効率を高めることができる。
【0186】
以下では、簡単な例を用いてテーブルを作成する工程を説明する。例として、3つの実験から3つの補正された2次元ピークデータが得られたとする。そして、各2次元ピークデータからは、それぞれ3つのマススペクトルが得られたとする。ここで、実験1のピークベクトルは、F(1)(tc1(1)),F(1)(tc2(1)),F(1)(tc3(1))であり、実験2のピークベクトルは、F(2)(tc1(2)),F(2)(tc2(2)),F(2)(tc3(2))であり、実験3のピークベクトルは、F(3)(tc1(3)),F(3)(tc2(3)),F(3)(tc3(3))である。
【0187】
また、tc1(1)とtc1(2)とtc1(2)との保持時間の違いは閾値T以内であり、同様に、tc2(1)とtc2(2)とtc2(2)との保持時間の違いも閾値T以内であり、また、tc3(1)とtc3(2)とtc3(2)との保持時間の違いも閾値T以内であるとする。
【0188】
そして、F(1)(tc2(1))とF(2)(tc2(2))との類似度は閾値Cよりも大きく、F(1)(tc2(1))とF(3)(tc2(3))との類似度も閾値Cよりも大きものとする。そして、それ以外のピークベクトル同士は、類似性を示さないものとする。
【0189】
このとき、テーブル作成部27は、まず、テーブルの第1行目の各セルに、実験1のそれぞれのマススペクトルの識別情報を格納する。ここでは、マススペクトルの識別情報として、ピークベクトルの識別情報を格納することとする。その結果、次の表9のようになる。
【0190】
【表9】
【0191】
続いて、対応判定部26が、実験2のピークベクトルF(2)(tc1(2))と、実験1のピークベクトルF(1)(tc1(1))とを比較する。ここで、類似度は閾値C以下であるため、これらのピークベクトル同士は対応しないと判定される。その結果、ピークベクトルF(2)(tc1(2))は、第2行第4列目に格納される。
【0192】
次に、対応判定部26が、実験2のピークベクトルF(2)(tc2(2))と、実験1のピークベクトルF(1)(tc2(1))とを比較する。ここで、類似度は閾値Cよりも大きく、類似度が最も高いいため、これらのピークベクトル同士は対応すると判定される。その結果、ピークベクトルF(2)(tc2(2))は、第2行第2列目に格納される。
【0193】
続いて、対応判定部26が、実験2のピークベクトルF(2)(tc3(2))と、実験1のピークベクトルF(1)(tc3(1))とを比較する。ここで、類似度は閾値C以下であるため、これらのピークベクトル同士は対応しないと判定される。その結果、ピークベクトルF(2)(tc3(2))は、第2行第5列目に格納される。
【0194】
実験3についても同様にして、ピークベクトルF(3)(tc1(3))は第3行第6列目、ピークベクトルF(3)(tc2(3))は第3行第2列目、ピークベクトルF(3)(tc3(3))は第3行第7列目にそれぞれ格納される。
【0195】
その結果、テーブルは、次の表10のようになる。
【0196】
【表10】
【0197】
このテーブルでは、実験1の保持時間tc2(1)のマススペクトルと、実験2の保持時間tc2(2)のマススペクトルと、実験3の保持時間tc2(3)のマススペクトルとが、同一の化合物由来のものであることが表現されている。そして、これらのマススペクトルに含まれる各ピークがマススペクトル間で対応することになる。
【0198】
そして、2列目のマススペクトルの代表保持時間は、次の式(15)
{tc2(1)+tc2(2)+tc2(3)}/3 …(15)
によって求められる。
【0199】
(3.その他)
最後に、スペクトル解析装置1の各ブロック、特に平滑化部11、ピーク時間同定部12、スペクトル強度合体部13、トータルピーク作成部14、トータルピーク合体部15、ピーク合体部16、第1ピークベクトル作成部21、内部標準同定部22、内部標準確認部23、保持時間補正部24、第2ピークベクトル作成部25、対応判定部26、及びテーブル作成部27は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
【0200】
すなわち、スペクトル解析装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるスペクトル解析装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、スペクトル解析装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0201】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0202】
また、スペクトル解析装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0203】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【実施例】
【0204】
上述した実施形態に係るスペクトル解析装置が有用であることを検証する。本実施例では、薬剤処理したアラビドプシス培養細胞T87でのGC/MS時系列測定における保持時間の対応づけを行った。
【0205】
シロイヌナズナにおいて薬剤Aに応答した代謝産物の変動を解析するため、薬剤Aで処理したシロイヌナズナ培養細胞T87株のGC/MS解析を行った。新鮮な液体培地に継代後10日目のシロイヌナズナ培養細胞に、終濃度500μMとなるように薬剤A(DMSOに溶解)を添加し、添加直後(0分)又は5分後、及び30分後、並びに1,2,4,6,8,10,12,16,20,24,36,48,96時間後に細胞を回収した。回収した細胞は蒸留水で洗浄したのち、吸引脱水し、-80℃に保存した。また、薬剤Aの代わりに同量のDMSOを添加し、上記と同様の時間後に回収した細胞をコントロールとした。細胞100mgから、メタノール、水、及びクロロホルムを用いた液層−液層分配法により生体成分を抽出後、水溶性画分をメトキシアミン及びMSTFAにより誘導体化したのち、LECO社のPegasus III(GC−TOF−MS)により分析を行った。TOF−MSによるデータ取得は、82〜500までのm/zについて、20回/秒で22分間行った。分析データは、各m/zごとのシグナル強度を保持したCSVファイルとして出力し、その結果、1サンプルについて約147MBのCSVファイルを得ることができた。このCSVファイルを上述した実施形態のスペクトル解析装置によって解析した。図14にスペクトル解析装置のメニュー画面を示す。
【0206】
まず、各m/zごとのクロマトグラム情報を、保持時間とピークエリア(ピーク強度)が対応した情報へと変換した。この結果、平均ファイルサイズが約2.5MBのファイルへと変換することができた。次に、今回の解析に用いたカラムにおける保持時間を側鎖長の異なる標準脂肪酸群を基準とした保持時間指数(retention index)に変換し、サンプル相互で比較できるようにした。分析の際に内部標準として抽出サンプルに加えておいたリビトールを基準として、リビトールのピーク強度が100となるようにピーク強度の補正を行った。補正されたデータを用い、保持時間指数のサンプル間における補正(ピークドリフトの補正)を行うための内在性内部標準の検出を行った。その結果、薬剤A処理サンプル及びコントロールサンプルのサンプリング時間16点における3反復実験(合計96分析)中、内在性の内部標準の候補として、36のピークを検出することができた。検出された内在性内部標準が、サンプル間で同じフラグメンテーションパターンを示し、同一物質であることを確認するため、評価を行った。この解析においては、保持時間の線形補正に用いる内部標準として、リビトールを含む9の化合物ピークを選択した(図15(a),図15(b))。出力されたファイル(平均約270kB)を用い、サンプル間における化合物ピークのマッチングを行った。マッチングを行った結果を可視化した結果を図16に示す。図16では、上部の表において、各行は保持時間指数の平均を、各列はサンプルを示しており、ピーク強度の大小を赤色の濃淡で示している。表中、右側48サンプルが薬剤A処理したT87培養細胞の時系列変化、左側48サンプルが、無処理コントロールの変化を示す。処理した細胞とコントロール細胞とで化合物蓄積の消長に違いが認められる化合物が検出された。検出されたピークのフラグメンテーションパターンを、既知物質のフラグメンテーションパターン(及び保持時間)と比較することにより、myo‐inositol、gamma‐Aminobutyrate、D‐malate、Ethanolamine、Sucroseなど、いくつかの化合物について、そのピークを同定することができた。
【産業上の利用可能性】
【0207】
本発明によれば、クロマトグラフィーと質量分析との組み合わせに基づいて得られたデータから、化合物の特徴を示すピークの位置を正確に同定することができる。また、本発明によれば、クロマトグラフィーと質量分析との組み合わせに基づいて複数の実験から得られた2次元ピークデータのセットにおいて、同一の化合物に由来するマススペクトルを実験間で対応付けることができる。従って、GC/MSやLC/MSによって得られたデータを解析する解析装置に利用することができる。
【図面の簡単な説明】
【0208】
【図1】本発明の一実施形態を示すものであり、スペクトル解析装置のピーク対応付け部の詳細な機能構成を示すブロック図である。
【図2】GC/MSやLC/MSによって得られた2次元スペクトルデータを可視化した図である。
【図3】従来の技術を示すものであり、マスクロマトグラムデータからピークデータへの変換方法を示す図である。
【図4】2次元ピークデータからマススペクトルを抽出する方法を示す図である。
【図5】従来の技術を示すものであり、マスクロマトグラムデータからピークデータへ変換する工程を示す図である。
【図6】本発明の一実施形態を示すものであり、スペクトル解析装置の要部構成を示すブロック図である。
【図7】本発明の一実施形態を示すものであり、スペクトル解析装置のピークデータ作成部の詳細な機能構成を示すブロック図である。
【図8】本発明の一実施形態を示すものであり、スペクトル強度合体部による処理工程を示す図である。
【図9】本発明の一実施形態を示すものであり、トータルピーク作成工程及びトータルピーク合体工程によるデータの変換を示す図である。
【図10】本発明の一実施形態を示すものであり、トータルピーク合体工程によるデータの変換を示す図である。
【図11】本発明の一実施形態を示すものであり、ピーク合体工程後の2次元スペクトルデータを示す図である。
【図12】本発明の一実施形態を示すものであり、内部標準同定部による処理工程を示す図である。
【図13】本発明の一実施形態を示すものであり、(a)及び(b)は内部標準同定工程におけるピークベクトル同士の比較方法を示す図である。
【図14】本発明の一実施例を示すものであり、スペクトル解析装置のメニュー画面を示す図である。
【図15】本発明の一実施例を示すものであり、(a)は内部標準同定部によって同定した内在性内部標準ピークを評価した例を示す図であり、(b)は内在性内部標準の候補として選ばれた化合物ピークの、各サンプルにおけるフラグメントパターンの例を示す図であり、(a)の表中で選択されているピークについて、8サンプルのマスフラグメントパターンを示した。
【図16】本発明の一実施例を示すものであり、サンプル間のマススペクトルの対応関係を示す図である。
【符号の説明】
【0209】
1 スペクトル解析装置(情報処理装置)
11 平滑化部
12 ピーク時間同定部(2次元ピークデータ作成部、第2ピーク位置同定部)
13 スペクトル強度合体部(2次元ピークデータ作成部)
14 トータルピーク作成部
15 トータルピーク合体部(第1ピーク位置同定部)
16 ピーク合体部(第1ピーク位置同定部)
21 第1ピークベクトル作成部(第1マススペクトル抽出部)
22 内部標準同定部
24 保持時間補正部
25 第2ピークベクトル作成部(第2マススペクトル抽出部)
26 対応判定部
27 テーブル作成部
【技術分野】
【0001】
本発明は、クロマトグラフィーと質量分析との組み合わせに基づいて得られるデータを解析するための情報処理装置、この情報処理装置を制御するプログラム、及びこのプログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。
【背景技術】
【0002】
ガスクロマトグラフィー質量分析(GC/MS)装置、液体クロマトグラフィー質量分析(LC/MS)装置は、クロマトグラフィーと質量分析とを組み合わせることによって、細胞、組織、又は器官全体に含まれる膨大な種類の生体成分を分離・同定することが可能である。これらの装置では、まず、細胞、組織、又は器官全体から抽出した生体サンプル中に含まれる生体成分を、ガスクロマトグラフィー(GC)又は液体クロマトグラフィー(LC)によって単一の化合物に分離する。その後、分離した単一の化合物を一定のエネルギーを有する電子線により開裂させ、フラグメントイオンを得る。そして、フラグメントイオンのイオン強度を質量数と電荷の比(m/z)ごとに検出することにより、ある化合物の開裂パターンを示すマススペクトルを得ることができる。
【0003】
上記の装置ではこれらの処理を連続的に行うため、得られるデータは、図2に示すように、保持時間及びm/zについてのイオン強度スペクトル、すなわち2次元スペクトルデータになる。この2次元スペクトルデータを保持時間軸と直交する断面で切り出すと、m/z軸に沿ったイオン強度の情報、すなわちマススペクトルを得ることができる。一方、2次元スペクトルデータをm/z軸と直交する断面で切り出すと、保持時間軸に沿ったイオン強度の情報、すなわちマスクロマトグラムを得ることができる。
【0004】
ここで、保持時間の分解能を高くすると、マスクロマトグラムでは、図2に示すように、単一のフラグメントイオン又は擬分子イオンのイオン強度が複数の保持時間にまたがった状態になる。従って、図3に示すように、複数の保持時間にまたがったイオン強度を一点に纏めることによって、図2に示す2次元スペクトルデータを、図4上段に示す2次元ピークデータへと変換する必要がある。2次元スペクトルデータから2次元ピークデータへ変換する従来の方法について説明すると次の通りである。
【0005】
従来の方法では、まず、図2に示す2次元スペクトルデータから、あるm/zについて、図3上段に示すマスクロマトグラムデータを抽出する。そして、マスクロマトグラムにおいてイオン強度が極大となる保持時間を同定し、同定した保持時間がスペクトルのピーク位置であると認定する。
【0006】
続いて、ピーク位置の近傍に分散するイオン強度の総和をとり、この総和をピーク位置に対応付ける。これにより、図3下段に示すピークデータになる。この処理を全てのm/zについて行うことにより、図4上段に示す2次元ピークデータが得られるのである。
【0007】
この2次元ピークデータから保持時間軸に垂直な断面を切り出せば、図4下段に示すマススペクトルが得られる。ここで、それぞれのマススペクトルには、1つの化合物の開裂パターンが含まれることになる。従って、マススペクトルの開裂パターンを基に、生体サンプルに含まれる化合物を同定することができる。
【0008】
近年では、上記の装置によって、様々な生体サンプルに含まれる様々な化合物を網羅的に同定することが行われている。
【非特許文献1】質量分析法、「有機化合物のスペクトルによる同定法−MS,IR,NMR,UVの併用−第4版」、Silverstein RM,Bassler GC,Morrill TC著、荒木峻・益子洋一郎・山本修訳、第2章、質量分析法、pp.3−40、東京化学同人、東京(1983)
【非特許文献2】大倉洋甫、甲斐雅亮、IV−5質量分析法(マススペクトロメトリー)、「分析化学II改訂第4版」、大倉洋甫、田中善正、山口政俊編集、pp.228−257、南江堂、東京(1997)
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、異なる測定実験から得られた2次元ピークデータ間で、同一の化合物に由来すると考えられるマススペクトル同士を情報処理装置などによって自動的に対応付ける方法は未だ確立されていない。
【0010】
通常、異なる生体サンプルから得られた2次元ピークデータ間で同一の化合物由来のマススペクトルを見出す場合、研究者が2次元ピークデータに含まれる膨大なマススペクトルの中から経験に基づいた勘によってマススペクトルを1つずつ選出し、それぞれのマススペクトル同士を見比べ、対応するか否かを主観的に判定することが一般的に行われている。しかしながら、上述したように、様々な生体サンプルに含まれる様々な化合物を網羅的に同定する場合、研究者が個々のマススペクトル同士を比較検討する従来の方法では、ハイスループットで出力される多量の2次元ピークデータに対応するのは困難である。従って、研究者の勘に頼らず、マススペクトル同士の対応付けを自動的に行うことのできる情報処理装置が求められている。
【0011】
ここで、対応付けを自動化する際には、保持時間の問題が鍵となる。例えば、GC/MSやLC/MSなどによって同一の生体サンプルを同一の分析条件で複数回分析する場合、理論的には、同一の化合物は常に同一の保持時間の画分に含まれると考えられる。ところが、実際には、分析条件の同一性を完全に維持することは不可能であるため、分析実験ごとに保持時間のずれが生じてしまうのは避けられない。
【0012】
このずれの問題は、生体サンプルの違いなど、分析条件が変化する場合ではさらに顕著になる。従って、この実験ごとにずれている保持時間を補正しなければ、マススペクトルの対応付けを正確に行うことができない。
【0013】
さらに、それ以前の問題として、従来の技術は、ピークの位置を正確に同定できない場合があるという問題を有している。
【0014】
図5は、ある単一の化合物由来の異なるフラグメントイオンのイオン強度の例を示した図である。図5の上段は、m/zがiとなるフラグメントイオンのイオン強度を示したマスクロマトグラムであり、図5の下段は、m/zがjとなるフラグメントイオンのイオン強度を示したマスクロマトグラムである。これら2つのフラグメントイオンは同一の化合物に由来しており、それぞれのピークは、図5左側に示すように、ともに保持時間t+2とt+3との間に存在する。そして、これらのフラグメントイオンのイオン強度をサンプリングすると、図5中央に示すようになる。
【0015】
このとき、これら2つのフラグメントイオンのピークの位置(保持時間)を従来の手法に従って同定すると、従来の手法ではサンプリングされたイオン強度が最大となる位置をピークの位置として同定するため、図5右側に示すように、一方のフラグメントイオンのピークの位置はt+3となり、もう一方のフラグメントイオンのピークの位置はt+2となってしまう。このように、従来の手法では、本来同一の保持時間に対応付けられるべき2つのピークが別々の保持時間に対応付けられてしまい、その結果、これらのフラグメントイオンが異なる化合物に由来するものとして扱われることになる。
【0016】
研究者はこのような問題を経験に基づいた勘によって逐次修正しなければならないため、大量の2次元ピークデータを迅速に解析することが困難であった。
【0017】
本発明は上記課題に鑑みてなされたものであり、その第1の目的は、複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付けることのできる情報処理装置の実現を目的とする。
【0018】
また、本発明の第2の目的は、サンプリングされた2次元スペクトルデータから、個々のピークの位置を正確に同定することのできる情報処理装置の実現を目的とする。
【課題を解決するための手段】
【0019】
上記の課題を解決するために、本発明に係る情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータが複数含まれる2次元ピークデータセットにおいて、2次元ピークデータ間で対応するマススペクトルを同定する情報処理装置であって、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する第1マススペクトル抽出部と、異なる2次元ピークデータから抽出されたマススペクトルデータ同士を比較することによって、それぞれの2次元ピークデータから抽出された内部標準となるマススペクトルデータが含まれる内部標準マススペクトルデータセットを作成する内部標準同定部と、内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部と、保持時間が補正された2次元ピークデータから保持時間ごとに新たなマススペクトルデータを抽出する第2マススペクトル抽出部と、保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士を比較することによって、比較した新たなマススペクトル同士が対応するものであるか否かを判定する対応判定部とを備えていることを特徴とする。
【0020】
本明細書において、「2次元ピークデータ」とは、クロマトグラフィーと質量分析との組み合わせに基づいて得られるデータであって、かつ、各フラグメントイオン又は擬分子イオンのイオン強度が単一の保持時間に対応付けられたデータのことをいう。そして、その単一の保持時間に対応付けられたイオン強度のことを「ピークイオン強度」という。さらに本明細書において、「ピーク」とは、上記フラグメントイオン又は擬分子イオンのイオン強度が最大となる点のことをいう。また、本明細書において、「マススペクトルデータ」とは、m/zごとのイオン強度の情報を示すデータであって、例えば、2次元ピークデータから、或る保持時間についてのm/zごとのイオン強度の情報を抽出することによって得ることができる。
【0021】
本発明に係る情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータが複数含まれる2次元ピークデータセットにおいて、2次元ピークデータ間で対応するマススペクトルを同定するものである。
【0022】
上記構成によれば、第1マススペクトル抽出部によって、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータが抽出される。このマススペクトルデータは化合物を同定する手がかりになるものであり、同一の化合物からは同一のマススペクトルデータが得られる。そして、内部標準同定部によって、異なる2次元ピークデータから抽出されたマススペクトルデータ同士が比較され、それぞれの2次元ピークデータから抽出された互いに類似するマススペクトルデータが含まれる内部標準マススペクトルデータセットが作成される。この内部標準マススペクトルデータセットに含まれるマススペクトルデータは互いに類似するものであり、換言すれば、それぞれの2次元ピークデータに共通して見られるマススペクトルということになる。
【0023】
これらのマススペクトルデータは、互いに類似しているため、同一の化合物から得られたものと推定できる。クロマトグラフィーの原理によれば、同一の化合物は同一の保持時間の画分に含まれるため、上記のセットに含まれるマススペクトルデータは、全て同一の保持時間に対応するべきものである。従って、このセットに含まれるマススペクトルデータを内部標準として、各2次元ピークデータの保持時間のずれを補正することができるのである。
【0024】
本発明の情報処理装置では、保持時間補正部によって、それぞれの2次元ピーク情報における保持時間が、上述した内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて補正される。これにより、それぞれの2次元ピークデータごとの保持時間のずれが解消される。
【0025】
続いて、第2マススペクトル抽出部によって、保持時間が補正されたそれぞれの2次元ピークデータから保持時間ごとに新たなマススペクトル情報が抽出される。そして、対応判定部によって、保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士が比較され、比較された新たなマススペクトル同士が対応するものであるか否かが判定される。
【0026】
つまり、本発明に係る情報処理装置では、最終的に、保持時間の違いが所定の範囲内のマススペクトルデータ同士のみを比較する。従って、保持時間が大きく異なるマススペクトル同士を対応付けてしまうことがない。これにより、マススペクトルの対応付けを正確に行うことができる。さらに、この際用いられる保持時間は、実験ごとのずれが補正された正確なものであるため、対応付けを一層正確に行うことができる。
【0027】
以上のように、本発明に係る情報処理装置によれば、複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付けることができる。
【0028】
また、上記内部標準同定部は、2次元ピークデータ間で、保持時間の違いが所定の範囲内のマススペクトルデータ同士を比較することが好ましい。
【0029】
上記構成によれば、内部標準同定部によって比較されるマススペクトルデータは、保持時間の違いが所定の範囲内のものとなる。従って、ピークパターンは類似しているものの保持時間が著しく異なるマススペクトルデータのセットを、内部標準として意図せずに用いてしまうのを防止することができる。
【0030】
また、上記第1マススペクトル抽出部は、それぞれのマススペクトルデータを、m/zごとのイオン強度を要素とするベクトルとして抽出することが好ましい。
【0031】
上記構成によれば、マススペクトルデータ同士の類似性の判定は、ベクトル同士の比較に基づいて行われる。ベクトルの類似性を判定する公知の手法には様々な手法があり、類似度を算出することなどにより、マススペクトルデータ同士の類似性を客観的に判定することができるようになる。
【0032】
また、上記第2マススペクトル抽出部は、それぞれの新たなマススペクトルデータを、m/zごとのイオン強度を要素とする新たなベクトルとして抽出し、上記対応判定部は、異なる補正された2次元ピークデータから抽出した新たなベクトル同士の類似度を算出するとともに、算出した類似度を閾値と比較することによって、マススペクトルデータ同士が対応しているか否かを判定することが好ましい。
【0033】
上記構成によれば、対応判定部によって、それぞれのマススペクトルデータに対応するベクトル同士の類似度が算出され、さらに、算出された類似度と閾値との比較結果に基づいて、マススペクトルデータが対応するものであるか否かが判定される。このように、本発明に係る情報処理装置では、マススペクトルデータの対応付けを、ベクトルの類似度という客観的な指標に基づいて行うことができる。
【0034】
また、上記情報処理装置は、上記対応判定部によって対応すると判定された新たなマススペクトル同士について、それぞれの新たなマススペクトルの識別情報が同じ行又は列に配列された対応テーブルを作成するテーブル作成部をさらに備えていることが好ましい。
【0035】
上記構成によれば、作成された対応テーブルを参照することによって、異なる2次元ピークデータ間において、どのマススペクトルとどのマススペクトルとが対応しているかを知ることができる。
【0036】
また、上記の課題を解決するために、本発明に係る別の情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータから、保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータを作成する2次元ピークデータ作成部と、上記2次元ピークデータについて、保持時間ごとにピークイオン強度の総和をトータルピーク強度として算出し、保持時間ごとのトータルピーク強度の情報であるトータルピークデータを作成するトータルピーク作成部と、上記トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を同定し、その区間においてトータルピーク強度が極大になる保持時間を、2次元ピークデータの上記区間に含まれるピークに対応する真の保持時間として同定する第1ピーク位置同定部とを備えていることを特徴とする。
【0037】
本明細書において、「2次元スペクトルデータ」とは、クロマトグラフィーと質量分析との組み合わせに基づいて得られるデータであって、各フラグメントイオン又は擬分子イオンのイオン強度が複数の保持時間にまたがっているデータのことをいう。
【0038】
上記構成によれば、まず、2次元ピークデータ作成部によって、2次元スペクトルデータから2次元ピークデータが作成される。ここで、一例として、作成された2次元ピークデータにおいて、図9のピーク101とピーク102のように、本来は同一の保持時間に対応付けられるべきピークが、ランダム誤差のために異なる保持時間(t1とt2)に対応付けられているとする。上記構成によれば、トータルピーク作成部によって、保持時間ごとにトータルピーク強度が算出される。その結果、保持時間t1及びt2におけるトータルピーク強度は閾値よりも大きくなる(あるいは閾値以上となる)。従って、保持時間がt1からt2までの区間は、第1ピーク同定部によって、トータルピーク強度が常に閾値以上になる区間(あるいは常に閾値よりも大きくなる区間)として同定される。そして、第1ピーク同定部によって、その区間においてトータルピーク強度が極大になる保持時間t1が、ピーク101とピーク102の真の保持時間として同定される。従って、ピーク101とピーク102は、同一の保持時間t1に位置し、単一の化合物由来のピークとして扱うことができる。
【0039】
以上のように、本発明に係る情報処理装置によれば、サンプリングされた2次元スペクトルデータから、個々のピークの位置を正確に同定することができる。
【0040】
また、上記第1ピーク位置同定部は、さらに、上記2次元ピークデータの上記区間に含まれるピークイオン強度を、同定した真の保持時間に対応付けることが好ましい。
【0041】
上記構成によれば、ピークイオン強度が正確な保持時間に対応付けられた2次元ピークデータを得ることができる。
【0042】
また、上記2次元ピークデータ作成部は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間を同定する第2ピーク位置同定部と、それぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度を、仮のピーク保持時間のイオン強度に加算することによってピークイオン強度を算出するとともに、算出したピークイオン強度を仮のピーク保持時間と対応付けることによって、上記2次元ピークデータを作成するスペクトル強度合体部とを含んでいることが好ましい。
【0043】
上記構成によれば、まず、第2ピーク位置同定部によって、2次元スペクトルデータからm/zごとにマスクロマトグラムデータが抽出される。そして、それぞれのマスクロマトグラムデータにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間が同定される。続いて、スペクトル強度合体部によって、それぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度が、仮のピーク保持時間のイオン強度に加算される。この加算されたイオン強度はピークイオン強度となる。そして、このピークイオン強度は、仮のピーク保持時間と対応付けられる。その結果、複数の保持時間にまたがったイオン強度は、仮のピーク保持時間に纏められる。このようにして、2次元スペクトルデータから2次元ピークデータを作成することができる。
【0044】
また、上記情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおけるイオン強度を平滑化することによって、上記2次元ピークデータ作成部に入力する2次元スペクトルデータを作成する平滑化部をさらに備えていることが好ましい。
【0045】
通常、イオン強度をサンプリングする際には、ランダムノイズが混入することが避けられない。ここで、上記構成によれば、平滑化部によって、2次元スペクトルデータにおけるイオン強度が保持時間軸に沿って平滑化されるので、ランダムノイズの影響を抑制することができる。
【0046】
ところで、上記情報処理装置は、ハードウェアで実現してもよいし、プログラムをコンピュータに実行させることによって実現してもよい。具体的には、本発明に係るプログラムは、上記各部としてコンピュータを動作させるプログラムであり、本発明に係る記録媒体には、当該プログラムが記録されている。
【0047】
これらのプログラムがコンピュータによって実行されると、当該コンピュータは、上記情報処理装置として動作する。したがって、上記情報処理装置と同様の効果を奏する。
【発明の効果】
【0048】
以上のように、本発明に係る情報処理装置は、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する第1マススペクトル抽出部と、異なる2次元ピークデータから抽出されたマススペクトルデータ同士を比較することによって、それぞれの2次元ピークデータから抽出された互いに類似するマススペクトルデータが含まれる内部標準マススペクトルデータセットを作成する内部標準同定部と、内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部と、保持時間が補正された2次元ピークデータから保持時間ごとに新たなマススペクトルデータを抽出する第2マススペクトル抽出部と、保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士を比較することによって、比較した新たなマススペクトル同士が対応するものであるか否かを判定する対応判定部とを備えた構成となっている。従って、上述したように、複数の分析実験から得られた2次元ピークデータ間で、同一の化合物由来のマススペクトル同士を自動的かつ正確に対応付けることができるという効果を奏する。
【0049】
また、本発明に係る別の情報処理装置は、クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータから、保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータを作成する2次元ピークデータ作成部と、上記2次元ピークデータについて、保持時間ごとにピークイオン強度の総和をトータルピーク強度として算出し、保持時間ごとのトータルピーク強度の情報であるトータルピークデータを作成するトータルピーク作成部と、上記トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を同定し、その区間においてトータルピーク強度が極大になる保持時間を、2次元ピークデータの上記区間に含まれるピークに対応する真の保持時間として同定する第1ピーク位置同定部とを備えた構成となっている。従って、上述したように、サンプリングされた2次元スペクトルデータから、個々のピークの位置を正確に同定することができるという効果を奏する。
【発明を実施するための最良の形態】
【0050】
〔実施形態1〕
本発明に係る情報処理装置の一実施形態について図1から図13に基づいて説明すると以下の通りである。
【0051】
本実施形態のスペクトル解析装置(情報処理装置)は、GC/MS、LC/MSなど、クロマトグラフィーと質量分析とを組み合わせた測定装置がサンプリングしたデータを解析する装置である。上記の測定装置によって得られたイオン強度情報のデータは、イオン化による質量数と電荷の比(以下「m/z」という)、及び保持時間についての2次元スペクトルデータであるといえる。本実施形態のスペクトル解析装置は、上記の2次元スペクトルデータに含まれるピークの位置(すなわちピークに対応するm/z及び保持時間)を正確に同定するために用いられる。
【0052】
まず、測定装置によって得られるデータの表記方法について定義する。上述したように、測定装置によって得られるイオン強度情報(以下「スペクトル強度」という)は、m/z及び保持時間ごとに変動する。ここで、得られるスペクトルデータにおいて、m/zの番号を値の小さいものから順に1,2,…,M、保持時間の番号を時間の小さいものから順に1,2,…,Kとした場合に、保持時間がk番目でm/zがm番目のサンプル点のスペクトル強度を、xk,mと表すことにする。
【0053】
図6は、本実施形態のスペクトル解析装置の要部構成を示す機能ブロック図である。本実施形態のスペクトル解析装置1は、図6に示すように、主としてピークデータ作成部10及びピーク対応付け部20を機能ブロックとして備えたマイクロコンピュータである。
【0054】
ピークデータ作成部10は、LC/MS100(又はGC/MS)から得られた2次元スペクトルデータにおけるピークの保持時間及びイオン強度を同定し、各フラグメントイオン及び/又は擬分子イオンのイオン強度が単一の保持時間及びm/zに対応付けられた2次元ピークデータを作成するためのものである。また、ピーク対応付け部20は、上記のピークデータ作成部10によって得られた複数の実験に関する2次元ピークデータ同士を比較し、複数の実験間で同一の化合物由来のピーク同士を対応付けるためのものである。
【0055】
(1.ピークデータ作成部/ピークデータ作成工程)
図7は、ピークデータ作成部10の詳細な機能構成を示すブロック図である。図7に示すように、本実施形態におけるピークデータ作成部10は、平滑化部11、ピーク時間同定部(第2ピーク位置同定部)12、スペクトル強度合体部13、トータルピーク作成部14、トータルピーク合体部(第1ピーク位置同定部)15、及びピーク合体部(第1ピーク位置同定部)16を含んでいる。
【0056】
平滑化部11は、2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムにおけるイオン強度を平滑化する。平滑化した2次元スペクトルデータは、ピーク時間同定部12に入力される。
【0057】
ピーク時間同定部12は、平滑化部11から入力された2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間(ピークに対応する保持時間)を同定する。この仮のピーク位置の情報は、抽出されたマスクロマトグラムデータとともにスペクトル強度合体部13に入力される。
【0058】
スペクトル強度合体部13は、ピーク時間同定部12から入力されたそれぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度を、仮のピーク保持時間のイオン強度に加算することによってピークイオン強度を算出し、算出したピークイオン強度を仮のピーク保持時間と対応付ける。この処理により、複数の保持時間にまたがるフラグメントイオン又は擬分子イオンのイオン強度は、単一の保持時間及びm/zに対応付けられたピークイオン強度となり、その結果、2次元ピークデータが作成される。作成された2次元ピークデータは、トータルピーク作成部14に入力される。
【0059】
トータルピーク作成部14は、スペクトル強度合体部13から入力された2次元ピークデータについて、保持時間ごとにピークイオン強度の総和を算出する。算出されたピークイオン強度の総和は、トータルピーク強度と称され、各保持時間の画分に含まれる化合物の相対量を示す指標となる。このトータルピーク強度は保持時間ごとに算出されるため、保持時間とトータルピーク強度との関係を示すトータルピークデータが作成される。このトータルピークデータは、トータルピーク合体部15に入力される。
【0060】
トータルピーク合体部15は、トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を求め、その区間においてトータルピーク強度が極大になる保持時間を同定する。ここで同定された保持時間は、2次元ピークデータの同区間に含まれる全てのピークに対応する真の保持時間となる。ここで求めた区間及び真の保持時間の情報は、2次元ピークデータとともにピーク合体部16に入力される。さらに、トータルピーク合体部15は、ここで求めた区間に含まれるトータルピーク強度の総和を算出し、算出した総和を真の保持時間に対応付ける。これにより、更新されたトータルピークデータが作成される。この更新されたトータルピークデータは、ピーク対応付け部20の第1ピークベクトル作成部21に入力される。
【0061】
ピーク合体部16は、トータルピーク合体部15から入力された2次元ピークデータにおいて、上記の区間に含まれる全てのピークの位置を、上記の真の保持時間に対応付ける。具体的には、上記の区間に含まれるピークのピーク強度の総和をm/zごとに算出し、算出した総和を真の保持時間に対応付ける。これにより、更新された2次元ピークデータが作成される。更新された2次元ピークは、対応付け部20の第1ピークベクトル作成部21に入力される。
【0062】
次に、ピークデータ作成部10の動作について説明する。ピークデータ作成部10の処理工程(ピーク解析方法)は、平滑化工程、ピーク時間同定工程、スペクトル強度合体工程、トータルピーク作成工程、トータルピーク合体工程、及びピーク合体工程を含んでいる。これらの工程について順に説明すると以下の通りである。
【0063】
(1−1.平滑化部/平滑化工程)
まず、測定装置から得られた2次元スペクトルデータに対して、保持時間軸に沿って平滑化を行う。平滑化の詳細な手順は次の通りである。
【0064】
2次元スペクトルをm/z軸と直交する平面で切り出して得られるマスクロマトグラムにおいて、保持時間がk番目のサンプル点のスペクトル強度をxkとする。平滑化は、k番目のサンプル点を中心とする合計N個のサンプル点についてスペクトル強度の平均値を算出し、算出した平均値をk番目のサンプル点のスペクトル強度に割り当てることによって行われる。これにより、k番目のサンプル点の平滑化後のイオン強度x’kは、次の式(1)
【0065】
【数1】
【0066】
(ただし、N’=(N−1)/2)
によって表される。
【0067】
なお、この処理は、各m/zと直交する全ての平面について行われる。従って、保持時間がk番目でm/zがm番目のサンプル点の平滑化後のスペクトル強度x’k,mは、次の式(2)
【0068】
【数2】
【0069】
によって表される。この処理により、2次元スペクトルデータは、保持時間軸に沿って平滑化されたものとなる。この平滑化工程は、平滑化部11によって行われる。
【0070】
上記の平滑化工程による効果は次の通りである。通常、GC/MSやLC/MSなどによって得られるデータでは、測定されたイオン強度がランダム誤差を含んでいる。従って、測定されたイオン強度情報をそのまま用いてピークの保持時間を同定すると、ランダム誤差によりピークの保持時間が本来のものからずれてしまうことがある。しかしながら、上記の平滑化工程を行えば、ランダム誤差による影響を抑制し、ピークの位置を正確に検出することができるようになる。
【0071】
(1−2.ピーク時間同定部/ピーク時間同定工程)
次に、平滑化後の2次元スペクトルをm/z軸と直交する平面で切り出して得られるマスクロマトグラムにおけるピークの位置(ピークに対応する保持時間)を同定する。ピークの位置を同定する際には、ある保持時間のサンプル点がピークであるか否かを検定する作業を保持時間軸に沿って順次行っていく。検定方法は次の通りである。
【0072】
保持時間がk番目のサンプル点がピークであるか否かの判定は、k−1番目のサンプル点における曲線の傾きと、k+1番目のサンプル点における曲線の傾きとに基づいて行われる。詳細には、k−1番目のサンプル点における傾きが0よりも大きく、かつ、k+1番目のサンプル点における傾きが0よりも小さい場合に、k番目のサンプル点がピークであると判定する。
【0073】
なお、各サンプル点における曲線の傾きは、そのサンプル点を中心とする合計N個のサンプル点のスペクトル強度を基に、線形回帰式を用いて簡便に求めることができる。具体的には、k番目のサンプル点における曲線の傾きをbkとすると、bkは、次の式(3)
【0074】
【数3】
【0075】
によって表される。
【0076】
この処理は、各m/zと直交する全てのマスクロマトグラムについて行われる。従って、保持時間がk番目でm/zがm番目のサンプル点における曲線の傾きをbk、mとすると、bk,mは、次の式(4)
【0077】
【数4】
【0078】
によって表される。このピーク時間同定工程は、ピーク時間同定部12によって行われる。
【0079】
(1−3.スペクトル強度合体部/スペクトル強度合体工程)
続いて、平滑化後の2次元スペクトルをm/z軸と直交する断面で切り出してみる。得られたマスクロマトグラムにおいて、極小値−極大値−極小値からなる区間を1つの「山」と定義すると、この山に含まれる全てのサンプル点のスペクトル強度は、その山のピークの位置から派生したものであると考えられる。
【0080】
従って、各山に含まれる全てのサンプル点のスペクトル強度をピークの位置に纏める処理を行う。この処理は、ピーク周辺のサンプル点のスペクトル強度をピークのサンプル点のスペクトル強度に加算し、ピーク周辺のサンプル点のスペクトル強度を0にすることによって行われる。
【0081】
図8は、この処理手順を詳細に説明するフロー図である。k番目のサンプル点がピークと判定されたとする。ここで、k番目の保持時間をtk、保持時間tkにおけるピーク強度を示す変数をP(tk)とすると、まず、P(tk)にk番目のサンプル点のスペクトル強度xkを代入する(S31)。次に、ピークの左側に存在するサンプル点のスペクトル強度をピークに順次加算していくために以下の処理を行う。
【0082】
まず、処理対象のサンプル点をピークの左隣にセットするために、処理対象のサンプル番号を示す変数sにk−1を代入する(S32)。続いて、処理対象のサンプル点における曲線の傾きbsを0と比較する(S33)。ここで、傾きbsが0よりも大きい場合は、処理対象のサンプル点が現在のピークに含まれるべきサンプル点であると判断し、次のステップS34に進む。
【0083】
ステップS34では、処理対象のサンプル点のスペクトル強度xsをP(tk)に加算する。そして、処理対象のサンプル点を左側に1つずらすために、変数sの値を一つ減らす(S35)。そして、ステップS33に戻る。
【0084】
一方、ステップS33において、傾きbsが0以下である場合は、処理対象のサンプル点が現在のピークに含まれるべきものでないと判断し、ステップS36に進む。そして、今度は、ピークの右側に存在するサンプル点のスペクトル強度をピークに順次加算していくために以下の処理を行う。
【0085】
まず、処理対象のサンプル点をピークの右隣にセットするために、変数sにk+1を代入する(S36)。続いて、処理対象のサンプル点における曲線の傾きbsを0と比較する(S37)。ここで、傾きbsが0よりも小さい場合は、処理対象のサンプル点が現在のピークに含まれるべきサンプル点であると判断し、次のステップS38に進む。
【0086】
ステップS38では、処理対象のサンプル点のスペクトル強度xsをP(tk)に加算する。そして、処理対象のサンプル点を右側に1つずらすために、変数sの値を一つ増やす(S35)。そして、ステップS37に戻る。
【0087】
一方、ステップS37において、傾きbsが0以上である場合には、処理対象のサンプル点が現在のピークに含まれるべきものでないと判断し、処理を終了する。以上により、1つのピークに属するべき各サンプル点のスペクトル強度が全てピークの位置に纏められる。その結果、t番目の保持時間tkに纏められたピーク強度はP(tk)として得られる。なお、ピーク以外の位置におけるP(tk)は0とする。
【0088】
この処理は、各m/zと直交する全ての断面に含まれる全てのピークについて行われる。以下では、保持時間がtkでm/zがm番目におけるピーク強度をP(tk)mと表現する。また、保持時間、m/z、ピーク強度を要素とするデータのことを2次元ピークデータという。図9の上段は、この2次元ピークデータを可視化したものである。上記のスペクトル強度合体工程は、スペクトル強度合体部13によって行われる。
【0089】
上記の第1ピーク時間同定工程及びスペクトル強度合体工程によれば、同一のフラグメントイオンから得られるイオン強度情報が複数の保持時間にまたがってしまう場合であっても、それぞれのイオン強度情報を纏め、単一の保持時間に対応する一つのピーク強度情報として算出することができる。つまり、各フラグメントイオンに由来するピークの強度と、同ピークに対応する保持時間とを得ることができる。
【0090】
(1−4.トータルピーク作成部/トータルピーク作成工程)
次に、スペクトル強度合体工程後の2次元ピークデータを保持時間軸と直交する断面で切り出し、得られたマススペクトルに含まれる全てのピークのピーク強度を合計することによって、トータルピーク強度を算出する。この処理は、各保持時間と直交する全てのマススペクトルについて行われる。換言すれば、ある保持時間に対応する全てのピークを1つに纏める作業を全ての保持時間について行う。
【0091】
従って、保持時間tkにおけるトータルピーク強度をTI(tk)とすると、TI(tk)は次の式(5)
【0092】
【数5】
【0093】
によって表される。
【0094】
なお、このトータルピーク作成工程は、トータルピーク作成部14によって行われる。以下では、この保持時間ごとのトータルピーク強度TI(tk)のデータのことをトータルピークデータという。図9の中段は、トータルピークデータを可視化したものである。また、このトータルピークデータを作成する際に一つのトータルピークに纏められるピーク群のことをトータルピーク群という。トータルピーク群は、単一の化合物から得られるマススペクトルに相当する。
【0095】
(1−5.トータルピーク合体部/トータルピーク合体工程)
図9の中段に示すトータルピークデータにおいて、保持時間t1、t2におけるトータルピーク強度は、同一の化合物に由来するものであると考えられる。従って、トータルピーク合体工程では、これらの同一の化合物に由来すると考えられるトータルピークを一つに纏める処理を、以下の手順に従って行う。
【0096】
まず、連続する保持時間ti〜ti+n(ただしnは自然数)においてトータルピーク強度が常に0よりも大きくなる区間を同定する。そして、この区間において、トータルピーク強度が最大(極大)になる保持時間tuと山の両端部(極小点)の保持時間tsu、teu(ただしsu<euとする)とを同定する。なお、1つの山に含まれるトータルピーク強度の数が2つしかない場合などでは、tuがtsu又はteuと等しくなる場合もある。なお、ここで得られた保持時間tuは、後に、2次元ピークデータの区間tsu〜teuに含まれる全てのピークの真の保持時間になるものである。
【0097】
そして、保持時間tuを除くtsuからteuまでのトータルピーク強度を、保持時間tuにおけるトータルピーク強度に加算し、保持時間tu以外のトータルピーク強度を0にする。この処理は、全ての区間の全ての山について行われる。
【0098】
以上により、1つの化合物に由来する複数のトータルピーク強度が、化合物の保持時間を代表する1つの位置(トータルピーク強度が極大になる保持時間)に纏められる。
【0099】
一例を示すと、図9中段のトータルピークデータでは、連続する保持時間t1及びt2においてトータルピーク強度が0よりも大きくなっている。この場合、tu=t1、tsu=t1、teu=t2となる。そして、保持時間t2におけるトータルピーク強度を保持時間t1におけるトータルピーク強度に加算し、保持時間t2におけるトータルピーク強度を0にする。その結果、トータルピークデータは、図9下段のようになる。
【0100】
他の例を示すと、図10の(1)の場合は連続する2つのトータルピークが1つのピークに纏められ、(2)の場合は2つのトータルピークの間に0となる保持時間があることから2つのピークのままであり、(3)の場合は4つのトータルピークが2つのピークに纏められる。
【0101】
なお、本実施形態では、トータルピーク強度が常に0よりも大きくなる区間を同定したが、トータルピーク強度にノイズ等が含まれる場合は、所定の閾値を設定し、常に閾値よりも大きくなる区間や、常に閾値以上となる区間を同定してもよい。
【0102】
このトータルピーク合体工程は、トータルピーク合体部15によって行われる。
【0103】
(1−6.ピーク合体部/ピーク合体工程)
次に、図4上段の2次元ピークデータについても、上記のトータルピーク合体工程で求めた区間に含まれる各ピーク強度を纏める処理を行う。つまり、上記の保持時間tsu〜teuに含まれるピークのピーク強度の総和を各m/zごとに取り、総和を保持時間tuに対応付ける。
【0104】
上述した例で説明すると、図9上段の2次元ピークデータにおける、m/zがMのピークについて、ピーク強度P(t1)MとP(t2)Mとを加算し、加算したピーク強度を保持時間t1に対応付ける。ここではP(t2)M=0であるので、処理の前後でピークの位置及び強度に変化はない。
【0105】
同様に、m/zがmのピークについても、ピーク強度P(t1)mとP(t2)mとを加算し、加算したピーク強度を保持時間t1に対応付ける。この場合、P(t1)m=0であるので、処理の前後でピークの強度に変化はないが、ピークの位置がt1に変化する。上記の処理の結果、図11のようになる。
【0106】
この処理は、トータルピーク合体工程で求めた全ての区間について、全てのm/zごとに行われる。なお、ピーク合体工程はピーク合体部16によって行われる。
【0107】
上記のトータルピーク合体工程及びピーク合体工程による効果は以下の通りである。図9上段に示すm/zごとのピークデータにおいて、ピーク101とピーク102とは、同一の化合物から解離したフラグメントイオン又は擬分子イオンによるものであると考えられる。しかしながら、測定データにはランダム誤差が含まれるため、スペクトル強度合体工程の結果、図9上段のピーク101とピーク102とのように、同一の化合物から解離したフラグメントイオンによるピークであっても、互いに異なる保持時間に対応付けられてしまうことがある。その結果、本来同一の化合物に関するピークとして扱うべき2つのピーク101・102を、別々の化合物に関するピークとして扱ってしまうことになる。
【0108】
しかしながら、上記のトータルピーク合体工程及びピーク合体工程によれば、図11に示すように、ピーク101とピーク102とが同じ保持時間に対応付けられる。その結果、ピーク101とピーク102とを同一の化合物に関するピークとして扱うことができるようになるのである。
【0109】
(2.ピーク対応付け部/ピークデータ対応付け工程)
ピーク対応付け部20は、複数の実験から2次元ピークデータのセットが得られた際に、複数の2次元ピークデータ間で、同一の化合物由来のトータルピーク群(マススペクトル)同士を対応付けるためのものである。なお、ピーク対応付け部20に入力する2次元ピークデータは、必ずしも上記のピークデータ作成部10によって作成したものでなくてもよく、同様のデータであれば公知の手法によって作成したものでもよい。
【0110】
ピークデータ対応付け部20によるピークデータ対応付け工程の概要について説明すると、次の通りである。ガスクロマトグラフィーや液体クロマトグラフィーなどの分離法では、実験ごとに保持時間に誤差が含まれるため、それぞれの実験から得られた2次元ピークデータ間でトータルピーク群同士を対応付けるためには保持時間の補正が必要となる。そのために、ピークデータ対応付け部20は、比較したい2次元ピークデータの全てに共通に存在するトータルピーク群を内部標準ピーク群として検出し、この内部標準ピーク群の保持時間を基に2次元ピークデータにおける保持時間を補正する。さらに、ピークデータ対応付け部20は、補正された保持時間に基づいて、ユーザによって指定された許容範囲内で実験間のトータルピーク群同士を対応づけ、対応テーブルとして表現する。
【0111】
以下では、実験s(s=1,2,…,S)からピークデータ作成部10によって得られる2次元ピークデータを次の表1のように表す。
【0112】
【表1】
【0113】
ただし、P(s)(tk(s))mは、実験sから得られた2次元ピークデータにおいて、保持時間がtk(s)でm/zがm番目のサンプル点のピーク強度を示す。
【0114】
また、実験s(s=1,2,…,S)からピークデータ作成部10によって得られるトータルピークデータは次の表2のようになる。
【0115】
【表2】
【0116】
ただし、TI(s)(tk(s))は、実験sから得られたトータルピークデータにおいて、保持時間がtk(s)のトータルピーク強度を示す。
【0117】
図1は、ピーク対応付け部20の詳細な機能構成を示すブロック図である。図1に示すように、本実施形態におけるピーク対応付け部20は、第1ピークベクトル作成部(第1マススペクトル抽出部)21、内部標準同定部22、内部標準確認部23、保持時間補正部24、第2ピークベクトル作成部(第2マススペクトル抽出部)25、対応判定部26、及びテーブル作成部27を含んでいる。
【0118】
第1ピークベクトル作成部21は、それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出し、それぞれのマススペクトルデータに含まれるピーク強度を要素とするピークベクトルを作成する。なお、本実施形態において、第1ピークベクトル作成部21は、このピークベクトルの作成を全ての2次元ピークデータについて行う。作製されたピークベクトルは、内部標準同定部22に入力される。
【0119】
内部標準同定部22は、或る2次元ピークデータから作成されたピークベクトルと他の2次元ピークデータから作成されたピークベクトルとを比較し、異なる2次元ピークデータ間で類似するピークベクトルを同定する。なお、この異なる2次元ピークデータ間で類似するピークベクトルのことを内部標準ピークベクトルという。内部標準同定部22は、全ての2次元ピークデータにおいて共通に見られる内部標準ピークベクトルのセットを作成する。後続の保持時間補正部24では、このセットに含まれるそれぞれの内部標準ベクトルの保持時間に基づいて、それぞれの2次元ピークデータの保持時間を補正する。なお、内部標準ピークベクトルのセットは、1セットだけ作成してもよいし、複数セット作成してもよい。この内部標準ピークベクトルのセットは、内部標準確認部23に入力される。
【0120】
内部標準確認部23は、内部標準同定部22によって同定された内部標準ピークベクトルが、適切であるか否かを確認するためのものである。具体的には、ユーザに対して内部標準ピークベクトルを視覚的に表示し、ユーザの指示に従って不適切な内部標準ピークベクトルを除外する機能を有している。また、内部標準確認部23は、ユーザの指示に従って内部標準ピークベクトルを他のピークベクトルに変更することもできる。このようにして変更された内部標準ピークベクトルのセットは、保持時間補正部24に入力される。
【0121】
保持時間補正部24は、内部標準ピークベクトルのセットに含まれるそれぞれの内部標準ピークベクトルに対応する保持時間に基づいて、異なる実験から得られた2次元ピークデータの保持時間を補正する。具体的には、異なる2次元ピークデータから得られた内部標準ピークベクトル同士が同一の保持時間となるように、それぞれの2次元ピークデータの保持時間を補正する。保持時間が補正された2次元ピークデータは、第2ピークベクトル作成部25に入力される。
【0122】
第2ピークベクトル作成部25は、保持時間が補正された2次元ピークデータから保持時間ごとに1次元ピークデータ(マススペクトルデータ)を切り出し、それぞれのマススペクトルデータに含まれるピーク強度を要素とするピークベクトルを新たに作成する。なお、第2ピークベクトル作成部25は、このピークベクトルの作成を全ての2次元ピークデータについて行う。新たに作成されたピークベクトルは、対応判定部26に入力される。
【0123】
対応判定部26は、保持時間が補正された2次元ピーク情報間で、保持時間の違いが所定の範囲内のピークベクトル同士を比較することによって、比較したピークベクトル同士が対応するものであるか否かを判定する。
【0124】
テーブル作成部27は、トータルピーク群の対応関係を示すテーブルを作成するためのものであり、本実施形態では、対応するトータルピーク群の識別情報が同一の列に記載された対応テーブルを作成する。なお、テーブル作成部27は、対応するトータルピーク群の識別情報が同一の行に記載された対応テーブルを作成してもよい。
【0125】
次に、ピーク対応付け部20の動作について説明する。ピーク対応付け部20によるピーク対応付け工程は、第1ピークベクトル作成工程、内部標準同定工程、内部標準確認工程、保持時間補正工程、及び第2ピークベクトル作成工程、対応判定工程、及びテーブル作成工程を含んでいる。これらの工程について順に説明すると以下の通りである。
【0126】
(2−1.第1ピークベクトル作成部/第1ピークベクトル作成工程)
まず、上記の表1に示す2次元ピークデータから、保持時間ごとに、トータルピーク群に含まれる各ピークのピーク強度を要素とするピークベクトルを作成する。このピークベクトルの作成は、全ての実験について行われる。
【0127】
s番目の実験における保持時間tk(s)のピークベクトルをf(s)(tk(s))とすると、f(s)(tk(s))は、次の式(6)
f(s)(tk(s))=(P(s)(tk(s))1,P(s)(tk(s))2,…,P(s)(tk(s))m,…
…,P(s)(tk(s))M) …(6)
によって表すことができる。
【0128】
この工程は、換言すれば、各実験について、2次元ピークデータから保持時間ごとに1次元ピークデータ(マススペクトルデータ)を抽出する工程であるともいえる。この第1ピークベクトル作成工程は、第1ピークベクトル作成部21によって行われる。
【0129】
(2−2.内部標準同定部/内部標準同定工程)
次に、異なる実験間で類似するピークベクトルのセットを同定する。ピークベクトルは、保持時間ごとに切り出した1次元ピークデータ、すなわちマススペクトルデータであるため、その保持時間の画分に含まれた化合物に依存したベクトルとなる。従って、異なる実験から得られた混合物の中に同一の化合物が含まれていれば、類似するピークベクトルが得られると考えられる。よって、この類似するピークベクトルを内部標準ピークベクトルとして同定し、この内部標準ピークベクトルに対応する保持時間に基づいて、実験ごとの保持時間のずれを補正するのである。
【0130】
本実施形態では、ピークベクトルを比較する際に3つの閾値TIP,NTP,Tintを導入する。これらの閾値は、ユーザによって設定することができる。
【0131】
TIP及びNTPは、ピークベクトルが内部標準ピークベクトルの候補としてふさわしいか否かを検定するために用いられるものである。TIPはピーク強度の閾値を示し、一方NTPはピークの本数の閾値を示す。また、Tintは、ピークベクトル同士を比較する際の保持時間の許容範囲を規定するための閾値である。
【0132】
図12は、ピークベクトルの中から内部標準ピークベクトルを探索する工程を示すフロー図である。
【0133】
まず、S個の実験の中から、任意に1つの実験を選択する。ここでは、説明の簡略化のため、1番目の実験を選択するものとする。そして、1番目の実験の1番目のピークベクトルf(1)(t1(1))を選択する(S801)。
【0134】
次に、このピークベクトルf(1)(t1(1))が内部標準ピークベクトルの候補としてふさわしいか否かを、上記のTIP及びNTPを用いて検定する(S802)。具体的には、ピークベクトルf(1)(t1(1))が有する要素P(1)(t1(1))m (m=1,2,…,M)のうち、TIPよりも大きい値を有する要素がNTP個よりも多い場合に、そのピークベクトルは内部標準ピークベクトルの候補になりうると判定され、ステップS803に進む。一方、上記の条件を満たさない場合は、そのピークベクトルは内部標準ベクトルの候補になりえないと判定され、ステップS810、S811、S802の順に進み、実験1の次のピークベクトルについて検定する。
【0135】
ステップS803では、1番目の実験と比較する実験を選択する。ここでは、実験2から順に選択していくことにする。
【0136】
そして、実験2のピークベクトルf(2)(tk(2)) (k=1,2,…,K)の中から、f(1)(t1(1))と最も類似するピークベクトルをf(2)maxとして同定する(S804)。ここで、実験2のピークベクトルf(2)(tk(2)) (k=1,2,…,K)のうち、f(1)(t1(1))に対して探索対象となるものは、次の式(7)
t1(1)−Tint<tk(2)<t1(1)+Tint …(7)
を満たすf(2)(tk(2))である。つまり、式(7)を満たす実験2のピークベクトルf(2)(tk(2))の中から、実験1のピークベクトルf(1)(t1(1))と最も類似するピークベクトルをf(2)maxとして同定する。
【0137】
ここで、例えば、ピークベクトルf(2)maxとして、f(2)(t2(2))が得られたとする。すると今度は、実験2のピークベクトルf(2)(t2(2))と最も類似する実験1のピークベクトルf(1)maxを探索する(S805)。この場合も上記と同様に、探索対象となる実験1のピークベクトルは、Tintによって規定される許容範囲内のものに限定される。具体的には、次の式(8)
t2(2)−Tint<tk(1)<t2(2)+Tint …(8)
を満たすf(1)(tk(1))の中から、f(2)(t2(2))と最も類似するピークベクトルを探索する。
【0138】
次に、得られたピークベクトルf(1)maxが、元のピークベクトルf(1)(t1(1))と一致するか否かが判定される(S806)。つまり、ピークベクトルf(1)maxとしてf(1)(t1(1))が得られた場合は、ピークベクトルf(1)(t1(1))とf(2)(t2(2))とが真に類似すると判断され、これらのピークベクトル同士は、内部標準ピークベクトルの候補として対応付けられ、ステップS807に進む。一方、ピークベクトルf(1)maxとして、f(1)(t1(1))が得られなかった場合は、ピークベクトルf(1)(t1(1))は、内部標準ピークベクトルにはなり得ないと判定され、ステップS810、S811、S802の順に進み、実験1の次のピークベクトルについて検定を行う。
【0139】
図13(a)及び図13(b)は、このことを一般化して示した図である。このように、本実施形態の内部標準同定工程では、2つの実験間において双方向でピークベクトルの類似性を検討し、2つのピークベクトルが互いに最も類似する関係にある場合に、内部標準ピークベクトルの候補としてこれら2つのピークベクトルを対応付ける。
【0140】
ステップS807では、実験1と比較する次の実験が残っているか否かを判定する。そして、次の実験が残っている場合は、次の実験を選択する(S808)。上記の例では、実験3を選択する。そして、実験3についても、上記と同様の手順により、f(1)(t1(1))と互いに最も類似するピークベクトルを探索する(S804〜S806)。このことを、S番目の実験まで繰り返し、f(1)(t1(1))と互いに最も類似するピークベクトルが全ての実験について得られた場合に、f(1)(t1(1))が内部標準ピークベクトルであると認定し(S809)、f(1)(t1(1))及びこれに類似するf(s)max (s=2,3,…,S)を、内部標準ピークベクトルのセットとして対応付ける。そして、ステップS810に進み、さらなる内部標準ピークベクトルのセットを探索する。
【0141】
一方、f(1)(t1(1))と互いに最も類似するピークベクトルが全ての実験について得られなかった場合は、f(1)(t1(1))は内部標準ピークベクトルにはなり得ないと判断し(S810〜S811)、実験1の次のピークベクトルf(1)(t2(1))について、同様の処理を行う(S804〜S809)。
【0142】
なお、ピークベクトル同士の類似性の判定は、公知の手法に従って行うことができる。具体的には、例えばm/zが同一のピークの本数や、コサイン係数、スピアマンの相関係数などに基づいて判定することができる。
【0143】
この処理を、実験1の全てのピークベクトルについて行うことによって、1又は複数の内部標準ピークベクトルのセットを得ることができる。ここで、内部標準ピークベクトルがNセット得られたとすると、得られた内部標準ピークベクトルRf(s)(Tn(s)) (n=1,2,…,N)のセットは、次の表3のように表すことができる。
【0144】
【表3】
【0145】
ただし、Tn(s)は、実験sにおいてnセット目の内部標準ピークベクトルとして認定されたピークベクトルの保持時間を示すものであり、また、T1(s)<T2(s)<…<Tn(s)<…<TN(s)であるものとする。
【0146】
なお、この内部標準同定工程は、内部標準同定部22によって行われる。
【0147】
(2−3.内部標準確認部/内部標準確認工程)
続いて、内部標準確認工程では、内部標準確認部23が、上記の内部標準同定工程によって得られた内部標準ピークベクトルの対応関係をユーザに対して視覚的に提示する。具体的には、各実験から得られた内部標準ピークベクトルのそれぞれをマススペクトルとして表示する。ユーザは、表示されたマススペクトル同士を実験間で比較検討し、得られた内部標準ピークが適切なものであるか否かを判断する。
【0148】
そして、得られた内部標準ピークが不適であると判断した場合、ユーザは、内部標準ピークを削除したり、ある実験についての内部標準ピークベクトルを他のピークベクトルに変更したりするように、スペクトル解析装置1の内部標準確認部23に対してキーボードやマウス操作によって指示を与える。
【0149】
これを受けて、内部標準確認部23は、得られた内部標準ピークベクトルのセットをユーザの指示に従って変更する。具体的には、内部標準ピークベクトルの削除が指示された場合は、上記の表3に示すテーブルから、該当する内部標準ピークベクトルを抹消する。一方、内部標準ピークベクトルを他のピークベクトルに変更するよう指示された場合は、上記のテーブルの該当する内部標準ピークベクトルの保持時間を書き換える。
【0150】
(2−4.保持時間補正部/保持時間補正工程)
次に保持時間補正工程では、得られた内部標準ピークベクトルに対応付けられた保持時間に基づいて、実験間で一致しない保持時間を補正する。具体的には、任意の1つの実験を基準実験として選択し、基準実験の内部標準ピークベクトルに対応する保持時間と、他の実験の内部標準ピークベクトルに対応する保持時間とが一致するように、他の実験の保持時間を線形補間によって補正する。
【0151】
ここで、基準実験としてc番目の実験を選択する。そして、実験sの保持時間tk(s)を補正して得られる補正後の保持時間をtck(s)とすると、tck(s)は、以下の線形補間により算出することができる。
【0152】
まず、tk(s)<T1(c)の場合は、tck(s)は、次の式(9)
【0153】
【数6】
【0154】
によって算出することができる。一方、Ti(c)<tk(s)<Ti+1(c) (i=1,2,…,N−1)の場合は、tck(s)は、次の式(10)
【0155】
【数7】
【0156】
によって算出することができる。また、tk(s)>TN(c)の場合は、tck(s)は、次の式(11)
【0157】
【数8】
【0158】
によって算出することができる。
【0159】
以上の計算により、基準実験c以外の実験における保持時間が、基準実験cの保持時間に沿うように補正される。すなわち、各実験の2次元ピークデータの保持時間は、基準実験cの2次元ピークデータの保持時間のスケールに補間されたことになる。この保持時間補正工程は、保持時間補正部24によって行われる。
【0160】
なお、上記の説明では、線形補間によって保持時間を補正したが、本発明はこれに限定されるものではなく、非線形補間によって保持時間を補正してもよい。
【0161】
保持時間が補正された2次元ピークデータは、次の表4のように表すことができる。
【0162】
【表4】
【0163】
また、トータルピークデータは次の表5のようになる。
【0164】
【表5】
【0165】
(2−5.第2ピークベクトル作成部/第2ピークベクトル作成工程)
この工程では、第1ピークベクトル作成工程と同様の処理を、保持時間が補正された2次元ピークデータについて行う。すなわち、上記の表4に示す2次元ピークデータから、各保持時間ごとに、トータルピーク群に含まれる各ピークのピーク強度を要素とするピークベクトルを作成する。このピークベクトルの作成は、全ての実験について行われる。
【0166】
s番目の実験における保持時間tck(s)のピークベクトルをF(s)(tck(s))とすると、F(s)(tck(s))は、次の式(12)
F(s)(tck(s))=(P(s)(tck(s))1,P(s)(tck(s))2,…
…,P(s)(tck(s))m,…,P(s)(tck(s))M) …(12)
によって表すことができる。
【0167】
この工程は、換言すれば、各実験について、保持時間が補正された2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する工程であるともいえる。この第2ピークベクトル作成工程は、第2ピークベクトル作成部25によって行われる。
【0168】
(2−6.対応判定部/対応判定工程、テーブル作成部/テーブル作成工程)
次に、ユーザなどにより、異なる2次元ピークデータから抽出されたピークベクトル同士の類似性を判定する際に用いる閾値Cを設定する。また、同様に、ユーザなどにより、ピークベクトル同士を比較する際の保持時間の許容範囲を規定するための閾値Tを設定する。
【0169】
そして、テーブル作成部27は、実験1の各トータルピーク群(マススペクトル)の識別情報をテーブルの第1行に代入する。このとき、テーブルの各セルに格納される識別情報をTI(tc1i(1))(1) (i=1,2,…,N1)と表記する。ただし、N1は実験1の2次元ピークデータに含まれるトータルピーク群の総数を示す。また、第k列においてはじめてテーブルに代入された要素をTI(tcki(s))(s)とする。その結果、テーブルは次の表6のようになる。
【0170】
【表6】
【0171】
次に、対応判定部26が、実験2の各ピークベクトルを、実験1のピークベクトルと比較する。まず、対応判定部26は、実験2のピークベクトルの中から、F(2)(tc1(2))を選択する。そして、実験1のピークベクトルF(1)(tck(1)) (k=1,2,…,K)のうち、次の式(13)
tc1(2)−T<tck(1)<tc1(2)+T …(13)
を満たすF(1)(tck(1))の全てと、選択したF(2)(tc1(2))との類似性をそれぞれ評価する。
【0172】
類似性の評価には、例えばm/zが同一のピークの本数や、コサイン係数、スピアマンの相関係数などを用いることができる。対応判定部26は、これらを用いて2つのピークベクトルの類似度を数値化し、この類似度を閾値Cと比較する。ここで、比較対象となる実験1のピークベクトルの中に、類似度が閾値Cを超えるものがない場合、対応判定部26は、F(2)(tc1(2))は、実験1のピークベクトルの何れとも対応しないと判定される。
【0173】
この場合、テーブル作成部27は、F(2)(tc1(2))に対応するトータルピーク群の識別情報を第2行目の第N1+1列目に格納する。格納される識別情報は、TI(tc21(2))(2)となる。
【0174】
一方、比較対象となる実験1のピークベクトルの中に、類似度が閾値Cを超えるものがある場合、対応判定部26は、F(2)(tc1(2))と最も類似度の高い実験1のピークベクトルF(1)(tci(1))が、F(2)(tc1(2))と対応するベクトルであると判定する。
【0175】
この場合、テーブル作成部27は、F(2)(tc1(2))に対応するトータルピーク群の識別情報を、第2行目で、実験1のトータルピーク群TI(tc1i(1))(1)と同じ列に格納する。格納される識別情報は、TI(tc11(2))(2)となる。
【0176】
同様にして、実験2の他のピークベクトルF(2)(tch(2)) (h=2,3,…,N2)についても、対応判定部26が、次の式(14)
tch(2)−T<tck(1)<tch(2)+T …(14)
を満たす実験1のピークベクトルF(1)(tck(1))と比較し、閾値Cを超えるものがない場合は、テーブル作成部27がテーブルの第2行目の右側の新しい列に識別情報を格納し、閾値Cを超えるものがある場合は、テーブル作成部27が第2行目の、最も類似性の高い実験1のピークベクトルに対応するトータルピーク群の識別情報と同じ列に識別情報を格納する。
【0177】
その結果、テーブルは次の表7のようになる。
【0178】
【表7】
【0179】
同様に、実験sについて、対応判定部26が、ピークベクトルF(s)(tcj(s))を実験r(r=1,2,…,s−1)のピークベクトルF(r)(tcm(r)) (ただし、tcj(s)−T<tcm(r)<tcj(s)+T)と比較する。そして、類似度が閾値Cを超えるものがない場合は、テーブル作成部27が第s行目の新しい列zに、F(s)(tcj(s))に対応するトータルピーク群の識別情報TI(tczj(s))(s)を格納する。
【0180】
一方、類似度が閾値Cを超えるものがある場合は、対応判定部26が最も類似するピークベクトルF(r)(tcn(r))を同定し、テーブル作成部27が第s行目の、ピークベクトルF(r)(tcn(r))に対応するトータルピーク群と同じ列に識別情報を格納する。
【0181】
以上の処理を、実験Sまで繰り返すことによって、テーブルは、次の表8のようになる。なお、対応するトータルピーク群がないセルについては、0が格納されるものとする。
【0182】
【表8】
【0183】
以上のようにして得られたテーブルでは、同一の実験から得られたトータルピーク群(マススペクトル)の識別情報が同じ行に配列されるとともに、対応するトータルピーク群(マススペクトル)の識別情報が同じ列に配列されることになる。このテーブルから、同じ列に配列されたトータルピーク群(マススペクトル)同士は、同一の化合物由来のものであることが示される。
【0184】
そして、0以外の値が格納されているセルについて、列ごとに、格納されているトータルピーク群に対応する保持時間の平均値を求め、その平均値を列の代表保持時間とする。
【0185】
以上の工程により、同一の化合物由来とみなすことのできるトータルピーク群(マススペクトル)を検出し行列に表現することが可能となった(表8)。それぞれのトータルピーク群に対応するピークベクトルと精製票品又は市販のマスライブラリーのピークベクトルとの共通性により、トータルピーク群の化合物の同定を行うことができる。このとき、同じ列に配列され、グルーピングされたトータルピーク群のピークベクトルについて代表ピークベクトルを定義することにより物質の検索効率を高めることができる。
【0186】
以下では、簡単な例を用いてテーブルを作成する工程を説明する。例として、3つの実験から3つの補正された2次元ピークデータが得られたとする。そして、各2次元ピークデータからは、それぞれ3つのマススペクトルが得られたとする。ここで、実験1のピークベクトルは、F(1)(tc1(1)),F(1)(tc2(1)),F(1)(tc3(1))であり、実験2のピークベクトルは、F(2)(tc1(2)),F(2)(tc2(2)),F(2)(tc3(2))であり、実験3のピークベクトルは、F(3)(tc1(3)),F(3)(tc2(3)),F(3)(tc3(3))である。
【0187】
また、tc1(1)とtc1(2)とtc1(2)との保持時間の違いは閾値T以内であり、同様に、tc2(1)とtc2(2)とtc2(2)との保持時間の違いも閾値T以内であり、また、tc3(1)とtc3(2)とtc3(2)との保持時間の違いも閾値T以内であるとする。
【0188】
そして、F(1)(tc2(1))とF(2)(tc2(2))との類似度は閾値Cよりも大きく、F(1)(tc2(1))とF(3)(tc2(3))との類似度も閾値Cよりも大きものとする。そして、それ以外のピークベクトル同士は、類似性を示さないものとする。
【0189】
このとき、テーブル作成部27は、まず、テーブルの第1行目の各セルに、実験1のそれぞれのマススペクトルの識別情報を格納する。ここでは、マススペクトルの識別情報として、ピークベクトルの識別情報を格納することとする。その結果、次の表9のようになる。
【0190】
【表9】
【0191】
続いて、対応判定部26が、実験2のピークベクトルF(2)(tc1(2))と、実験1のピークベクトルF(1)(tc1(1))とを比較する。ここで、類似度は閾値C以下であるため、これらのピークベクトル同士は対応しないと判定される。その結果、ピークベクトルF(2)(tc1(2))は、第2行第4列目に格納される。
【0192】
次に、対応判定部26が、実験2のピークベクトルF(2)(tc2(2))と、実験1のピークベクトルF(1)(tc2(1))とを比較する。ここで、類似度は閾値Cよりも大きく、類似度が最も高いいため、これらのピークベクトル同士は対応すると判定される。その結果、ピークベクトルF(2)(tc2(2))は、第2行第2列目に格納される。
【0193】
続いて、対応判定部26が、実験2のピークベクトルF(2)(tc3(2))と、実験1のピークベクトルF(1)(tc3(1))とを比較する。ここで、類似度は閾値C以下であるため、これらのピークベクトル同士は対応しないと判定される。その結果、ピークベクトルF(2)(tc3(2))は、第2行第5列目に格納される。
【0194】
実験3についても同様にして、ピークベクトルF(3)(tc1(3))は第3行第6列目、ピークベクトルF(3)(tc2(3))は第3行第2列目、ピークベクトルF(3)(tc3(3))は第3行第7列目にそれぞれ格納される。
【0195】
その結果、テーブルは、次の表10のようになる。
【0196】
【表10】
【0197】
このテーブルでは、実験1の保持時間tc2(1)のマススペクトルと、実験2の保持時間tc2(2)のマススペクトルと、実験3の保持時間tc2(3)のマススペクトルとが、同一の化合物由来のものであることが表現されている。そして、これらのマススペクトルに含まれる各ピークがマススペクトル間で対応することになる。
【0198】
そして、2列目のマススペクトルの代表保持時間は、次の式(15)
{tc2(1)+tc2(2)+tc2(3)}/3 …(15)
によって求められる。
【0199】
(3.その他)
最後に、スペクトル解析装置1の各ブロック、特に平滑化部11、ピーク時間同定部12、スペクトル強度合体部13、トータルピーク作成部14、トータルピーク合体部15、ピーク合体部16、第1ピークベクトル作成部21、内部標準同定部22、内部標準確認部23、保持時間補正部24、第2ピークベクトル作成部25、対応判定部26、及びテーブル作成部27は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
【0200】
すなわち、スペクトル解析装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるスペクトル解析装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、スペクトル解析装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0201】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0202】
また、スペクトル解析装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0203】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【実施例】
【0204】
上述した実施形態に係るスペクトル解析装置が有用であることを検証する。本実施例では、薬剤処理したアラビドプシス培養細胞T87でのGC/MS時系列測定における保持時間の対応づけを行った。
【0205】
シロイヌナズナにおいて薬剤Aに応答した代謝産物の変動を解析するため、薬剤Aで処理したシロイヌナズナ培養細胞T87株のGC/MS解析を行った。新鮮な液体培地に継代後10日目のシロイヌナズナ培養細胞に、終濃度500μMとなるように薬剤A(DMSOに溶解)を添加し、添加直後(0分)又は5分後、及び30分後、並びに1,2,4,6,8,10,12,16,20,24,36,48,96時間後に細胞を回収した。回収した細胞は蒸留水で洗浄したのち、吸引脱水し、-80℃に保存した。また、薬剤Aの代わりに同量のDMSOを添加し、上記と同様の時間後に回収した細胞をコントロールとした。細胞100mgから、メタノール、水、及びクロロホルムを用いた液層−液層分配法により生体成分を抽出後、水溶性画分をメトキシアミン及びMSTFAにより誘導体化したのち、LECO社のPegasus III(GC−TOF−MS)により分析を行った。TOF−MSによるデータ取得は、82〜500までのm/zについて、20回/秒で22分間行った。分析データは、各m/zごとのシグナル強度を保持したCSVファイルとして出力し、その結果、1サンプルについて約147MBのCSVファイルを得ることができた。このCSVファイルを上述した実施形態のスペクトル解析装置によって解析した。図14にスペクトル解析装置のメニュー画面を示す。
【0206】
まず、各m/zごとのクロマトグラム情報を、保持時間とピークエリア(ピーク強度)が対応した情報へと変換した。この結果、平均ファイルサイズが約2.5MBのファイルへと変換することができた。次に、今回の解析に用いたカラムにおける保持時間を側鎖長の異なる標準脂肪酸群を基準とした保持時間指数(retention index)に変換し、サンプル相互で比較できるようにした。分析の際に内部標準として抽出サンプルに加えておいたリビトールを基準として、リビトールのピーク強度が100となるようにピーク強度の補正を行った。補正されたデータを用い、保持時間指数のサンプル間における補正(ピークドリフトの補正)を行うための内在性内部標準の検出を行った。その結果、薬剤A処理サンプル及びコントロールサンプルのサンプリング時間16点における3反復実験(合計96分析)中、内在性の内部標準の候補として、36のピークを検出することができた。検出された内在性内部標準が、サンプル間で同じフラグメンテーションパターンを示し、同一物質であることを確認するため、評価を行った。この解析においては、保持時間の線形補正に用いる内部標準として、リビトールを含む9の化合物ピークを選択した(図15(a),図15(b))。出力されたファイル(平均約270kB)を用い、サンプル間における化合物ピークのマッチングを行った。マッチングを行った結果を可視化した結果を図16に示す。図16では、上部の表において、各行は保持時間指数の平均を、各列はサンプルを示しており、ピーク強度の大小を赤色の濃淡で示している。表中、右側48サンプルが薬剤A処理したT87培養細胞の時系列変化、左側48サンプルが、無処理コントロールの変化を示す。処理した細胞とコントロール細胞とで化合物蓄積の消長に違いが認められる化合物が検出された。検出されたピークのフラグメンテーションパターンを、既知物質のフラグメンテーションパターン(及び保持時間)と比較することにより、myo‐inositol、gamma‐Aminobutyrate、D‐malate、Ethanolamine、Sucroseなど、いくつかの化合物について、そのピークを同定することができた。
【産業上の利用可能性】
【0207】
本発明によれば、クロマトグラフィーと質量分析との組み合わせに基づいて得られたデータから、化合物の特徴を示すピークの位置を正確に同定することができる。また、本発明によれば、クロマトグラフィーと質量分析との組み合わせに基づいて複数の実験から得られた2次元ピークデータのセットにおいて、同一の化合物に由来するマススペクトルを実験間で対応付けることができる。従って、GC/MSやLC/MSによって得られたデータを解析する解析装置に利用することができる。
【図面の簡単な説明】
【0208】
【図1】本発明の一実施形態を示すものであり、スペクトル解析装置のピーク対応付け部の詳細な機能構成を示すブロック図である。
【図2】GC/MSやLC/MSによって得られた2次元スペクトルデータを可視化した図である。
【図3】従来の技術を示すものであり、マスクロマトグラムデータからピークデータへの変換方法を示す図である。
【図4】2次元ピークデータからマススペクトルを抽出する方法を示す図である。
【図5】従来の技術を示すものであり、マスクロマトグラムデータからピークデータへ変換する工程を示す図である。
【図6】本発明の一実施形態を示すものであり、スペクトル解析装置の要部構成を示すブロック図である。
【図7】本発明の一実施形態を示すものであり、スペクトル解析装置のピークデータ作成部の詳細な機能構成を示すブロック図である。
【図8】本発明の一実施形態を示すものであり、スペクトル強度合体部による処理工程を示す図である。
【図9】本発明の一実施形態を示すものであり、トータルピーク作成工程及びトータルピーク合体工程によるデータの変換を示す図である。
【図10】本発明の一実施形態を示すものであり、トータルピーク合体工程によるデータの変換を示す図である。
【図11】本発明の一実施形態を示すものであり、ピーク合体工程後の2次元スペクトルデータを示す図である。
【図12】本発明の一実施形態を示すものであり、内部標準同定部による処理工程を示す図である。
【図13】本発明の一実施形態を示すものであり、(a)及び(b)は内部標準同定工程におけるピークベクトル同士の比較方法を示す図である。
【図14】本発明の一実施例を示すものであり、スペクトル解析装置のメニュー画面を示す図である。
【図15】本発明の一実施例を示すものであり、(a)は内部標準同定部によって同定した内在性内部標準ピークを評価した例を示す図であり、(b)は内在性内部標準の候補として選ばれた化合物ピークの、各サンプルにおけるフラグメントパターンの例を示す図であり、(a)の表中で選択されているピークについて、8サンプルのマスフラグメントパターンを示した。
【図16】本発明の一実施例を示すものであり、サンプル間のマススペクトルの対応関係を示す図である。
【符号の説明】
【0209】
1 スペクトル解析装置(情報処理装置)
11 平滑化部
12 ピーク時間同定部(2次元ピークデータ作成部、第2ピーク位置同定部)
13 スペクトル強度合体部(2次元ピークデータ作成部)
14 トータルピーク作成部
15 トータルピーク合体部(第1ピーク位置同定部)
16 ピーク合体部(第1ピーク位置同定部)
21 第1ピークベクトル作成部(第1マススペクトル抽出部)
22 内部標準同定部
24 保持時間補正部
25 第2ピークベクトル作成部(第2マススペクトル抽出部)
26 対応判定部
27 テーブル作成部
【特許請求の範囲】
【請求項1】
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータが複数含まれる2次元ピークデータセットにおいて、2次元ピークデータ間で対応するマススペクトルを同定する情報処理装置であって、
それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する第1マススペクトル抽出部と、
異なる2次元ピークデータから抽出されたマススペクトルデータ同士を比較することによって、それぞれの2次元ピークデータから抽出された互いに類似するマススペクトルデータが含まれる内部標準マススペクトルデータセットを作成する内部標準同定部と、
内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部と、
保持時間が補正された2次元ピークデータから保持時間ごとに新たなマススペクトルデータを抽出する第2マススペクトル抽出部と、
保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士を比較することによって、比較した新たなマススペクトル同士が対応するものであるか否かを判定する対応判定部とを備えていることを特徴とする情報処理装置。
【請求項2】
上記内部標準同定部は、2次元ピークデータ間で、保持時間の違いが所定の範囲内のマススペクトルデータ同士を比較することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
上記第1マススペクトル抽出部は、それぞれのマススペクトルデータを、m/zごとのイオン強度を要素とするベクトルとして抽出することを特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
上記第2マススペクトル抽出部は、それぞれの新たなマススペクトルデータを、m/zごとのイオン強度を要素とする新たなベクトルとして抽出し、
上記対応判定部は、異なる補正された2次元ピークデータから抽出した新たなベクトル同士の類似度を算出するとともに、算出した類似度を閾値と比較することによって、マススペクトルデータ同士が対応しているか否かを判定することを特徴とする請求項1から3の何れか1項に記載の情報処理装置。
【請求項5】
上記対応判定部によって対応すると判定された新たなマススペクトル同士について、それぞれの新たなマススペクトルの識別情報が同じ行又は列に配列された対応テーブルを作成するテーブル作成部をさらに備えていることを特徴とする請求項1から4の何れか1項に記載の情報処理装置。
【請求項6】
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータから、保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータを作成する2次元ピークデータ作成部と、
上記2次元ピークデータについて、保持時間ごとにピークイオン強度の総和をトータルピーク強度として算出し、保持時間ごとのトータルピーク強度の情報であるトータルピークデータを作成するトータルピーク作成部と、
上記トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を同定し、その区間においてトータルピーク強度が極大になる保持時間を、2次元ピークデータの上記区間に含まれるピークに対応する真の保持時間として同定する第1ピーク位置同定部とを備えていることを特徴とする情報処理装置。
【請求項7】
上記第1ピーク位置同定部は、さらに、上記2次元ピークデータの上記区間に含まれるピークイオン強度を、同定した真の保持時間に対応付けることを特徴とする請求項6に記載の情報処理装置。
【請求項8】
上記2次元ピークデータ作成部は、
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間を同定する第2ピーク位置同定部と、
それぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度を、仮のピーク保持時間のイオン強度に加算することによってピークイオン強度を算出するとともに、算出したピークイオン強度を仮のピーク保持時間と対応付けることによって、上記2次元ピークデータを作成するスペクトル強度合体部とを含んでいることを特徴とする請求項6又は7に記載の情報処理装置。
【請求項9】
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおけるイオン強度を平滑化することによって、上記2次元ピークデータ作成部に入力する2次元スペクトルデータを作成する平滑化部をさらに備えていることを特徴とする請求項6から8の何れか1項に記載の情報処理装置。
【請求項10】
請求項1から9の何れか1項に記載の情報処理装置を動作させるためのプログラムであって、コンピュータを各部として機能させるためのプログラム。
【請求項11】
請求項10に記載のプログラムが記録されたコンピュータ読み取り可能な記録媒体。
【請求項1】
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータが複数含まれる2次元ピークデータセットにおいて、2次元ピークデータ間で対応するマススペクトルを同定する情報処理装置であって、
それぞれの2次元ピークデータから保持時間ごとにマススペクトルデータを抽出する第1マススペクトル抽出部と、
異なる2次元ピークデータから抽出されたマススペクトルデータ同士を比較することによって、それぞれの2次元ピークデータから抽出された互いに類似するマススペクトルデータが含まれる内部標準マススペクトルデータセットを作成する内部標準同定部と、
内部標準マススペクトルデータセットに含まれるそれぞれのマススペクトルデータに対応する保持時間に基づいて、それぞれの2次元ピークデータにおける保持時間を補正する保持時間補正部と、
保持時間が補正された2次元ピークデータから保持時間ごとに新たなマススペクトルデータを抽出する第2マススペクトル抽出部と、
保持時間が補正された2次元ピークデータ間で、保持時間の違いが所定の範囲内の新たなマススペクトルデータ同士を比較することによって、比較した新たなマススペクトル同士が対応するものであるか否かを判定する対応判定部とを備えていることを特徴とする情報処理装置。
【請求項2】
上記内部標準同定部は、2次元ピークデータ間で、保持時間の違いが所定の範囲内のマススペクトルデータ同士を比較することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
上記第1マススペクトル抽出部は、それぞれのマススペクトルデータを、m/zごとのイオン強度を要素とするベクトルとして抽出することを特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
上記第2マススペクトル抽出部は、それぞれの新たなマススペクトルデータを、m/zごとのイオン強度を要素とする新たなベクトルとして抽出し、
上記対応判定部は、異なる補正された2次元ピークデータから抽出した新たなベクトル同士の類似度を算出するとともに、算出した類似度を閾値と比較することによって、マススペクトルデータ同士が対応しているか否かを判定することを特徴とする請求項1から3の何れか1項に記載の情報処理装置。
【請求項5】
上記対応判定部によって対応すると判定された新たなマススペクトル同士について、それぞれの新たなマススペクトルの識別情報が同じ行又は列に配列された対応テーブルを作成するテーブル作成部をさらに備えていることを特徴とする請求項1から4の何れか1項に記載の情報処理装置。
【請求項6】
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータから、保持時間及びm/zごとのピークイオン強度の情報である2次元ピークデータを作成する2次元ピークデータ作成部と、
上記2次元ピークデータについて、保持時間ごとにピークイオン強度の総和をトータルピーク強度として算出し、保持時間ごとのトータルピーク強度の情報であるトータルピークデータを作成するトータルピーク作成部と、
上記トータルピークデータにおいてトータルピーク強度が常に閾値以上になる区間又は常に閾値よりも大きくなる区間を同定し、その区間においてトータルピーク強度が極大になる保持時間を、2次元ピークデータの上記区間に含まれるピークに対応する真の保持時間として同定する第1ピーク位置同定部とを備えていることを特徴とする情報処理装置。
【請求項7】
上記第1ピーク位置同定部は、さらに、上記2次元ピークデータの上記区間に含まれるピークイオン強度を、同定した真の保持時間に対応付けることを特徴とする請求項6に記載の情報処理装置。
【請求項8】
上記2次元ピークデータ作成部は、
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおいてイオン強度が極大となる保持時間に基づいて仮のピーク保持時間を同定する第2ピーク位置同定部と、
それぞれのマスクロマトグラムデータにおいて、仮のピーク保持時間に隣接する保持時間におけるイオン強度を、仮のピーク保持時間のイオン強度に加算することによってピークイオン強度を算出するとともに、算出したピークイオン強度を仮のピーク保持時間と対応付けることによって、上記2次元ピークデータを作成するスペクトル強度合体部とを含んでいることを特徴とする請求項6又は7に記載の情報処理装置。
【請求項9】
クロマトグラフィーと質量分析との組み合わせに基づいて得られる保持時間及びm/zごとのイオン強度の情報である2次元スペクトルデータからm/zごとにマスクロマトグラムデータを抽出するとともに、それぞれのマスクロマトグラムデータにおけるイオン強度を平滑化することによって、上記2次元ピークデータ作成部に入力する2次元スペクトルデータを作成する平滑化部をさらに備えていることを特徴とする請求項6から8の何れか1項に記載の情報処理装置。
【請求項10】
請求項1から9の何れか1項に記載の情報処理装置を動作させるためのプログラムであって、コンピュータを各部として機能させるためのプログラム。
【請求項11】
請求項10に記載のプログラムが記録されたコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2007−147459(P2007−147459A)
【公開日】平成19年6月14日(2007.6.14)
【国際特許分類】
【出願番号】特願2005−342680(P2005−342680)
【出願日】平成17年11月28日(2005.11.28)
【出願人】(596175810)財団法人かずさディー・エヌ・エー研究所 (40)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【出願人】(500095447)学校法人創志学園 (4)
【Fターム(参考)】
【公開日】平成19年6月14日(2007.6.14)
【国際特許分類】
【出願日】平成17年11月28日(2005.11.28)
【出願人】(596175810)財団法人かずさディー・エヌ・エー研究所 (40)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【出願人】(500095447)学校法人創志学園 (4)
【Fターム(参考)】
[ Back to top ]