説明

クロマトグラムデータ処理装置

【課題】大きなベースラインドリフトがある又は多くのノイズが重畳しているマスクロマトグラムに現れる目的化合物のピークを高い精度で検出する。
【解決手段】クロマトグラム上の信号継続時間幅に基づいてベースラインドリフトの存在があると判定されると(S2、S3)、時間経過に伴う信号強度変化量を算出して該変化量に応じた帯域幅のメディアンフィルタ及びローパスフィルタでフィルタリングすることでベースラインを推定する(S6)。クロマトグラムからベースラインを差し引いてノイズ・ピーク値を求め、確率的にノイズ振幅がベースラインの二乗根に比例することを利用して正規化を行い、正規化された値の信号分布からノイズ分布の標準偏差を求め該標準偏差を基にノイズとピークを分離する閾値を設定する(S6)。このように統計的手法を用いてピークを検出することにより、ベースラインのドリフトやノイズがあっても正確なピーク検出が可能である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クロマトグラフィ分析により得られたクロマトグラムデータを処理するデータ処理装置に関し、特に、ガスクロマトグラフ質量分析装置(GC/MS)や液体クロマトグラフ質量分析装置(LC/MS)などのクロマトグラフ質量分析装置で取得されたマスクロマトグラムから化合物ピークを検出するために好適なデータ処理装置に関する。
【背景技術】
【0002】
GC/MSやLC/MSなどのクロマトグラフ質量分析装置では、着目した特定の質量電荷比m/zを有するイオンの強度信号の時間的経過に基づいてマスクロマトグラムを作成することができる。このマスクロマトグラムの波形は、目的とする化合物のイオンに由来するピーク、ガスクロマトグラフや液体クロマトグラフの移動相や溶媒の、つまりバックグラウンドのイオンに由来するベースライン、及び、その他のノイズ、の3つの信号が重畳したものであるとみなすことができる。
【0003】
こうしたクロマトグラムに基づいて目的化合物を同定したり或いは定量したりするためには、ピークを正確に分離してそのピークトップの時間位置を把握したりピークの高さや面積を高い精度で求める必要がある。従来、クロマトグラムにおけるピーク検出手法としては、信号強度の変化率(単位時間当たりの強度変化量)を求め、その変化率に基づいてピークの開始点や終了点を判断するのが一般的である(例えば特許文献1、2など参照)。
【0004】
しかしながら、一般的なクロマトグラムでは上記手法でかなり正確にピーク検出が行えるものの、マスクロマトグラムでは上記手法を用いたピーク検出が困難であることが多い。即ち、マスクロマトグラムでは質量電荷比によって信号の波形形状、特にベースラインの形状が大きく異なることが多く、質量電荷比毎にそれぞれ適切なピーク検出パラメータを設定する必要がある。そのため、多くの質量電荷比についてのマスクロマトグラムに対してピーク検出処理を行おうとした場合、作業が非常に煩雑で面倒である。また、特にノイズを多く含んだマスクロマトグラムでは化合物ピークに類似した波形形状を持つノイズも多数存在するため、こうしたノイズとピークとを分離するような適切なピーク検出パラメータを設定すること自体が困難である。
【0005】
【特許文献1】特許第3702831号公報
【特許文献2】特開平6−230001号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は上記課題を解決するために成されたものであり、その目的とするところは、ベースラインのドリフトのような比較的大きなベースライン変動がある場合や化合物ピークに形状が類似したノイズが含まれる場合であっても、面倒なパラメータ設定などを行うことなく高い精度でピークを検出することができるクロマトグラムデータ処理装置を提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために成された本発明は、試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフにより得られたクロマトグラムからピークを検出するデータ処理装置であって、
a)クロマトグラムデータの時間的な変動の度合いに応じた帯域幅及び/又は遮断周波数を有するフィルタを用いたフィルタリング処理を施してクロマトグラムのベースラインを求めるベースライン推定手段と、
b)前記ベースライン推定手段により求められたベースラインを差し引いたクロマトグラムの残差信号分布からノイズの確率的分布を考慮した閾値を求め、該閾値を用いてノイズとピークとを分離するノイズ・ピーク分離手段と、
を備えることを特徴としている。
【0008】
本発明に係るクロマトグラムデータ処理装置は、特に、検出器が質量分析計であるクロマトグラフ質量分析装置で取得されるマスクロマトグラムのデータ処理に好適である。
【0009】
マスクロマトグラムデータを処理する場合を例に挙げて述べると、マスクロマトグラムではベースラインは基本的には1乃至複数の低周波成分で構成されるが、或る質量電荷比に対するマスクロマトグラムで大きなイオンピークが出たとき、それとは異なる質量電荷比のマスクロマトグラムのベースラインが急峻に落ち込むことがある。これは、質量分析装置のイオン化部でイオン化のために供給されるエネルギーはほぼ一定であるために、或る物質の量がイオン化部で急増して該物質のイオン化にエネルギーが費やされてしまうと、その影響を受けて、ほぼ同時にイオン化部に導入された他の物質(溶媒や移動相も含む)のイオン化が行われにくくなるためである。そこで、こうしたベースラインの急な落ち込みに対応するため、ベースライン推定手段では、クロマトグラムデータの時間的な変動の度合いが急である部分では帯域幅を狭めたバンドパスフィルタ、及び/又は遮断周波数を下げたローパスフィルタを適用してベースラインを求める。
【0010】
ここで、フィルタとしては、主として上記のような急な落ち込みに対してベースラインが引っ張られないようにピークを除去するためのメディアンフィルタと、ベースライン本来の低周波成分のみを通過させる平滑化用のローパスフィルタとを併用することができる。こうしたフィルタリング処理により、ドリフトがあるようなベースラインも高い精度で以て推定することができる。
【0011】
マスクロマトグラムから上記ベースラインを差し引くと、ピーク及びノイズが残る。そこで、ノイズ・ピーク分離手段は、この残差信号の分布から統計的手法によりノイズ成分の分布を予測し、該ノイズ成分に埋もれないものをピークとして取り扱う。例えば検出器として質量分析装置を用いた場合、ノイズ成分は各分子が一定の確率でイオン化するという二項分布に従うものと考えられる。従って、ノイズの振幅はベースラインの二乗根に比例するから、その比例関係を利用して信号の正規化を行う。そして、その正規化された信号の中でノイズ成分に埋もれていないものをピークとみなすために、ノイズ範囲を決定して該範囲を基に決めた閾値で以てノイズとピークとを分離する。具体的には、ノイズ・ピーク信号をベースラインの二乗根で除することで正規化した後に、ピーク成分の影響を避けるため、ゼロ付近の信号を用いてノイズ分布の標準偏差を求める。そして、この標準偏差にマージンを見込んだ所定の値を乗じた値を閾値として定め、この閾値でピークとノイズとを分離するとよい。
【0012】
なお、ベースラインにドリフトがないとみなせる場合には、上記のようなベースライン推定処理を行う必要はなく、その分の処理時間が無駄である。そこで、本発明に係るクロマトグラムデータ処理装置では、ベースラインのドリフトの有無を判定するドリフト判定手段をさらに備え、ベースラインドリフトが有ると判定された場合に前記ベースライン推定手段及びノイズ・ピーク分離手段を用いたピーク検出を実行し、ベースラインドリフトが無いと判定された場合にはクロマトグラム上でのピークのアスペクト比から個別のピークを判定してピーク検出を行う構成とすることが好ましい。このようにベースラインドリフトの有無を判定して、その結果に応じてピーク検出の手法を切り替えることで、不要なベースライン推定処理を省いて処理時間を短縮しつつ、ピーク検出処理精度も向上させることができる。
【発明の効果】
【0013】
本発明に係るクロマトグラムデータ処理装置によれば、ベースラインドリフトが有ってノイズを多く含むデータに対して統計的な処理を行うことでピークを検出するようにしているため、単に信号の波形形状からピークを検出する従来手法に比べて高い精度でピークを検出することができる。また、ピーク検出のために設定すべきパラメータを質量電荷比毎に変更するような必要もなく、自動的に全ての質量電荷比のマスクロマトグラムを処理することができるので、煩雑な作業を行う必要がなく省力化が図れ、スループットも向上する。
【発明を実施するための最良の形態】
【0014】
本発明に係るクロマトグラムデータ処理装置を液体クロマトグラフ質量分析装置(LC/MS)に適用した場合を例に挙げて説明する。図1はこのLC/MSの全体構成図である。
【0015】
液体クロマトグラフ(LC)1では、移動相容器2に貯留された移動相が送液ポンプ3により略一定流量で吸引されてカラム5に送給される。所定のタイミングでインジェクタ4から移動相中に分析対象の試料が導入され、移動相に乗ってカラム5に送り込まれる。カラム5を通過する間に、試料に含まれる各種成分は時間方向に分離され、カラム5から順番に溶出する。この溶出した試料成分を含む試料液が検出器としての質量分析装置10に導入される。
【0016】
質量分析装置10において、試料液はエレクトロスプレイ(ESI)ノズル12から略大気圧雰囲気であるイオン化室11内に噴霧され、それによって試料液中の成分分子はイオン化され、生成されたイオンは加熱パイプ13を通って低真空雰囲気である第1中間真空室14へと送り込まれる。イオン化室11内ではESIのほかに、大気圧化学イオン化(APCI)などの別の大気圧イオン化法を採用してもよく、それらを併用してもよい。いずれにしてもイオンは第1中間真空室14内に配置された第1イオンレンズ15により収束されつつ、スキマー16の頂部のオリフィス17を通して中真空雰囲気である第2中間真空室18に送り込まれ、第2中間真空室18内に配置された第2イオンレンズ19により収束されつつ高真空雰囲気である分析室21に送り込まれる。
【0017】
分析室21では、特定の質量(厳密には質量電荷比m/z)を有するイオンのみが四重極質量フィルタ22の長軸方向の空間を通り抜け、それ以外の質量を持つイオンは途中で発散する。そして、四重極質量フィルタ22を通り抜けたイオンはイオン検出器23に到達し、イオン検出器23では到達したイオン量に応じたイオン強度信号を出力する。この出力信号はA/D変換器24でデジタル化され、データ処理部30に入力される。データ処理部30は例えば専用の制御/処理ソフトウエアがインストールされたパーソナルコンピュータにより具現化され、クロマトグラム作成部31、ピーク検出処理部32、定性・定量処理部33などを機能的なブロックとして備える。
【0018】
一般的に、質量分析装置10では、所定の質量範囲を繰り返し走査しながら該質量範囲内のイオンを網羅的に検出するスキャン測定、特定の1乃至複数の質量電荷比のイオンのみを選択しつつ検出する選択イオンモニタリング測定のいずれか、又は両方を行うことにより、試料が注入された時点から所定時間が経過するまでのクロマトグラフィ分析を実行する。そうして取得したデータに基づいて、クロマトグラム作成部31はマスクロマトグラムやトータルイオンクロマトグラムを作成し、ピーク検出処理部32はマスクロマトグラムを構成するマスクロマトグラムデータに基づいてピーク検出を実行する。また、定性・定量処理部33は検出されたピークの情報に基づいて化合物を同定するとともに、同定した化合物を定量する。
【0019】
本実施例のLC/MSでは、特にピーク検出処理部32で実行されるピーク検出処理に特徴がある。次に、これについて詳しく説明する。図2は本実施例におけるピーク検出アルゴリズムの処理フローチャートである。
【0020】
まず処理対象のマスクロマトグラムデータを例えば記憶部から読み出すことにより取得する(ステップS1)。図4はマスクロマトグラムの一例である。一般的にマスクロマトグラムでは、このように目的とする化合物由来のピーク以外に、低周波のベースライン、及び高周波のノイズが重畳された波形形状となっている。
【0021】
このクロマトグラムデータに対し信号強度が0以上である信号継続時間幅Tを算出し、複数ある場合にはその中の最大の信号継続時間幅Tを選んで(ステップS2)、その最大信号継続時間幅が所定値を超えているか否かを判定する(ステップS3)。例えば図5に示すようにベースラインのドリフトがない場合には信号継続時間幅Tは短く、ベースラインのドリフトがある場合には信号継続時間幅Tは長くなる。従って、信号継続時間幅Tの大小によりベースラインドリフトの有無を判断することができる。なお、最大信号継続時間幅を判定する所定値はユーザが変更できるようにしておくとよい。
【0022】
ステップS3でYesと判定されることでベースラインドリフトが有ると判断された場合には、以下のステップS5〜S7のベースラインドリフト有り処理を実行する(ステップS4)。即ち、まず、ベースラインを低周波の変化を伴ったノイズデータとして扱うことでベースラインの推定を行う(ステップS5)。図3はベースライン推定処理の手順である。ノイズを含むマスクロマトグラムデータ中では他の質量荷電比に多くのイオンが出現するとその影響を受けて急激に信号強度が低下する場合がある。これは、イオン化室11内でイオン化のために供給されるエネルギーの総量が決まっているため、特定の物質が多量に(高濃度で)導入されると、それをイオン化するのに多くのエネルギーが費やされてしまい、他の物質のイオン化のためのエネルギーが相対的に減ってイオン化効率が劣化することに起因する。そこで、マスクロマトグラムデータの中で急峻な落ち込みを見つけるために、時間経過に伴う信号の強度変化量を算出する(ステップS51)。
【0023】
図6はこの強度変化量の算出方法を説明するための概念図である。図示するように、信号の変化部分に対し、その前半部と後半部とで適当なサイズの重み付け平均を計算し、その平均値A、Bを用いて、例えば(A−B)/(A+1)の計算式により強度変化量を求める。重み付けを行うために、信号の変化部分の境目を中心とするコサイン窓(ハニング窓)を重み付け窓関数として用いることができる。但し、或る程度の信号幅から変化率を求めることが可能である窓関数であれば、例えばハミング窓等の別の窓関数を用いてもよく、窓関数を用いる手法以外の手法でもよい。窓の幅などのパラメータについては、ユーザが適宜変更・設定できるようにしておくとよい。
【0024】
上記のようにしてクロマトグラム上の信号の変化部分においてそれぞれ強度変化量が求まったならば、その強度変化量が大きいほど、つまり変化が急峻であるほど通過帯域が狭くなるように後述のメディアン(中央値)フィルタの帯域幅を決め、また変化が急峻であるほど低域遮断周波数が低くなるように平滑化用のローパスフィルタの遮断周波数を決める(ステップS52)。次に、ピーク成分によってベースラインが引っ張られるのを防ぐため、上記処理により帯域幅が決められたメディアンフィルタを用いてクロマトグラムデータに対するフィルタリング処理を行う(ステップS53)。これにより、ピークが除去される。
【0025】
続いて、ベースラインが持つ低い周波数成分を通過させ、それ以上の周波数を遮断するように上記のように遮断周波数が決められたローパスフィルタによる平滑化処理を行う(ステップS54)。ここでは、0.5+0.5×cos(2πt/T)を重みとして[−T/2:T/2](Tは上で求めた帯域幅)の範囲で重み付け平均をとったものを利用する。このようにコサイン窓を用いたローパスフィルタを適用する以外でも、適当な通過帯域を設定可能な別の平滑化処理を利用しても構わない。図7は上記手法でベースライン推定を行った結果を示す図である。図示するように、大きなドリフトが存在するベースラインをかなり正確に抽出できることが分かる。
【0026】
上記のようにしてドリフトが反映されたベースラインを求めたならば、次に、ノイズとピークとを分離するためのノイズ閾値の算出を行い、そのノイズ閾値に基づきピークを選別する(ステップS6)。その第1段階として、マスクロマトグラムから上述のように推定されたベースラインを差し引いてノイズとピークのみを取り出す(ノイズ・ピーク値)。図8(a)はこうした取り出された信号波形の一例であり、ここではノイズと化合物由来のピークとが混在している。
【0027】
次いで、そのノイズ・ピーク値の振幅をベースラインの二乗根で除することで全体を正規化する。即ち、質量分析装置でイオン化を行う際に各分子は一定の確率でイオン化されるという二項分布に従うと考えられるから、ノイズ振幅はベースラインの二乗根に比例する。そこで、この比例関係を利用して、上記のようにノイズ・ピーク値を正規化することができる。図8(b)は図8(a)の信号波形を正規化した例であり、特に後半部(図8(b)中のC部分)でノイズの振幅が抑制されていることが分かる。ここで正規化を行うことで、ノイズ成分の確率分布を求めることが容易になる。
【0028】
このように正規化された信号分布において、その強度の平均値から例えば±25%以内の範囲内ではほぼノイズ成分が占めていると考えられる。そこで、図9(b)に示すように、信号強度が正規分布であると仮定すると、この±25%以内(つまりは50%範囲内)での標準偏差を3.65倍することで真の標準偏差σが求まる。その真の標準偏差σをn倍したものを閾値と定め、この閾値以下の信号がノイズであるとみなし、閾値を超える大きな値の信号をピークとして選別する(図8(b)参照)。なお、ここではノイズの範囲を±25%、標準偏差の倍率を3.65としたが、これらに限るものではなく、ノイズ成分が大半を占めるような範囲を設定できさえすれば適宜変更可能である。また、ピークが混じった状態でノイズ分布を推定できる手法であるならば、他の手法を用いてノイズ・ピークの分離が可能である。
【0029】
ステップS6の処理によりピークとノイズとは分離できるが、次に、そうして得られたピークの前後の信号強度の変化を基に、各ピークのピーク範囲を決定する(ステップS7)。ここで、信号強度の変化が予め定めた最小ピーク強度以下である場合には、ピークとして無視すればよい。また、ピーク範囲は直近のピークボトムとピークトップ間との時間差の2倍以上には広がらないように制限を加え、基本的にピークボトムをピークの開始点及び終了点とするとよい。
【0030】
一方、ステップS3でNoと判定されることでベースラインドリフトが無いと判断された場合には、ベースラインドリフト無し処理を実行する(ステップS9)。即ち、マスクロマトグラム上で信号強度が0以上の信号成分を化合物ピークとして取得する(ステップS10)。ここで0以上の信号強度が所定時間以上連続するところでは、1個のピークではなく複数のピークの集合であるとみなし、その波形を複数に、つまり各ピークに分割するような処理を行う。図11はピーク分割手法の一例の説明図である。ここでは、ピーク時間幅tとピークトップ・ピークボトムの強度差hの比t/hを閾値と比較することでピーク分割点であるか否かを決定する。そして比t/hが閾値以上である場合には分割せずに単一のピークであるとみなす。そうして、各ピークについてピーク範囲を求める。
【0031】
上述のようにしてベースラインドリフトの有無に拘わらずピークが検出されるが、ここでは、まだノイズを誤検出によりピークと判断したものが混入している場合がある。そこで、閾値処理によるノイズ除去を行う(ステップS8)。例えば、前述のように他の質量電荷比に化合物ピークが出現した場合にその影響で急峻な信号強度変化が生じ、これが化合物ピークに類似した形状のノイズとして現れることによる。そこで、こうした偽ピークを除外するために、図10に示すように、各ピーク範囲内でベースラインを中心としたピークの最大値と最小値とを求め、その比(Du/Dd)を計算してこれが所定の閾値以下であるか否かを判定する。ここで閾値は例えば1とすることができるが、これも適宜に定めることができる。本来の化合物ピークであれば、ベースラインよりも上方に大きく突出するため、上記のような原因による偽ピークを排除することができる。なお、ベースラインが0である場合にはDd=0であるので、ノイズとして除去されるピークは存在しない。
【0032】
さらに、図11に示したように、ピークの高さhと時間幅tとの比が予め定めた閾値よりも小さいものについては、ノイズであるとみなして除去する。このようにして、最終的にマスクロマトグラムから化合物ピークが検出されると、各ピーク毎にピークトップの位置(時間)、ピークトップの高さ、或いはピーク面積などのピーク情報が求められ、定性・定量処理部33に引き渡される。定性・定量処理部33は例えば質量電荷比及びピーク情報とをデータベースと照合することにより、このピークに対応する化合物を同定する。
【0033】
以上のように本実施例によるLC/MSでは、マスクロマトグラムのベースラインにドリフトがあったりまた多くのノイズが含まれたりするような場合であっても、高い精度で化合物由来のピークを検出することができ、それに基づいた定性分析や定量分析を行うことができる。
【0034】
なお、上記説明では本発明の特徴的なデータ処理をマスクロマトグラムデータに対して行っていたが、他のクロマトグラム、例えばクロマトグラフ質量分析装置で作成されるトータルイオンクロマトグラムや、質量分析計以外の検出器を用いたガスクロマトグラフや液体クロマトグラフで作成されるクロマトグラムにも本発明を適用することができる。但し、例えば上記ステップS6におけるノイズ分布は質量分析装置でのイオン化に伴うノイズ分布の統計的性質を利用しているので、検出器が異なるものである場合に、その検出器に応じたノイズ分布の統計的性質を利用してノイズ閾値を決めるように変形を行う必要がある。
【0035】
なお、上記実施例は本発明の一例であり、本願発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは明らかである。
【図面の簡単な説明】
【0036】
【図1】本発明に係るデータ処理装置を適用したLC/MSの一例の全体構成図。
【図2】本実施例におけるピーク検出アルゴリズムの処理フローチャート。
【図3】ベースライン推定処理の手順を示すフローチャート。
【図4】マスクトマログラムの一例を示す図。
【図5】信号継続時間幅の求め方を説明するための図。
【図6】信号強度変化量の算出方法を説明するための概念図。
【図7】マスクロマトグラム信号とこれから推定したベースラインとを示す図。
【図8】正規化による補正前後のノイズ・ピーク波形を示す図。
【図9】統計的なノイズ分布推定による閾値設定手法を説明するための概念図。
【図10】急峻な信号強度変化に起因する偽ピーク除外の手法を説明するための概念図。
【図11】ピーク波形形状を利用したピーク分割及びノイズ除去の手法を説明するための概念図。
【符号の説明】
【0037】
1…液体クロマトグラフ
2…移動相容器
3…送液ポンプ
4…インジェクタ
5…カラム
10…質量分析装置
11…イオン化室
12…エレクトロスプレイノズル
13…加熱パイプ
14…第1中間真空室
15…第1イオンレンズ
16…スキマー
17…オリフィス
18…第2中間真空室
19…第2イオンレンズ
21…分析室
22…四重極質量フィルタ
23…イオン検出器
24…A/D変換器
30…データ処理部
31…クロマトグラム作成部
32…ピーク検出処理部
33…定性・定量処理部

【特許請求の範囲】
【請求項1】
試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフにより得られたクロマトグラムからピークを検出するデータ処理装置であって、
a)クロマトグラムデータの時間的な変動の度合いに応じた帯域幅及び/又は遮断周波数を有するフィルタを用いたフィルタリング処理を施してクロマトグラムのベースラインを求めるベースライン推定手段と、
b)前記ベースライン推定手段により求められたベースラインを差し引いたクロマトグラムの残差信号分布からノイズの確率的分布を考慮した閾値を求め、該閾値を用いてノイズとピークとを分離するノイズ・ピーク分離手段と、
を備えることを特徴とするクロマトグラムデータ処理装置。
【請求項2】
クロマトグラムのベースラインのドリフトの有無を判定するドリフト判定手段をさらに備え、ベースラインドリフトが有ると判定された場合に前記ベースライン推定手段及びノイズ・ピーク分離手段を用いたピーク検出を実行し、ベースラインドリフトが無いと判定された場合にはクロマトグラム上でのピークのアスペクト比から個別のピークを判定してピーク検出を行うことを特徴とする請求項1に記載のクロマトグラムデータ処理装置。
【請求項3】
前記検出器は質量分析計であり、前記クロマトグラムは特定の質量電荷比に着目して作成されるマスクロマトグラムであることを特徴とする請求項1又は2に記載のクロマトグラムデータ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図7】
image rotate


【公開番号】特開2009−8582(P2009−8582A)
【公開日】平成21年1月15日(2009.1.15)
【国際特許分類】
【出願番号】特願2007−171693(P2007−171693)
【出願日】平成19年6月29日(2007.6.29)
【出願人】(000001993)株式会社島津製作所 (3,708)
【Fターム(参考)】