説明

クロマトグラムデータ処理方法及び装置

【課題】含有成分数が多い、ノイズが多い、時間変動が大きい、といった悪条件の下でも、妥当な処理時間内でクロマトグラムの時間軸を高い精度で以て補正する。
【解決手段】クロマトグラムに出現するピークの時間情報を入力データとした粗密DP(動的計画法)アルゴリズムによる最適な対応関係の探索を実行する(S3、S5)前に、ピーク存在区間の始点・終点検出に基づく簡易的な線形補正を実行する(S2)。これにより、粗密DPでは非線形の時間ずれのみを補正すればよく、探索空間が絞られる。また、粗段階DPではピーク強度に基づくピークの選別を行うことにより、処理すべきデータ数を減らす。さらに、粗段階DPと密段階DPとの間に、クロマトグラム全体の時間ずれの傾向に従ったフィルタリング処理を行って局所的な不適切なマッチングを除去する(S4)。これにより、密段階DPでの探索空間が狭まり、探索すべき候補数が減って計算時間の短縮化が図れる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ガスクロマトグラフ(GC)、液体クロマトグラフ(LC)等のクロマトグラフ分析により得られたクロマトグラムデータを処理するクロマトグラムデータ処理方法及び装置に関し、さらに詳しくは、クロマトグラムに出現するピークの保持時間を補正するためのデータ処理方法及び装置に関する。
【背景技術】
【0002】
GC分析においては、同一装置で且つ同一条件の下で分析を実施しても、キャリアガス流量の時間的変動やカラムの劣化等の様々な要因によって、同一成分に対する保持時間がずれてしまう場合がある。そのため、複数のクロマトグラムを比較するためには、その比較に先立って同一成分に対する保持時間がほぼ同一に揃うように時間軸を補正する作業が必要である。保持時間のずれが完全に線形であれば時間軸補正は容易であるが、一般的に保持時間のずれは少なからず非線形性を有している。こうした非線形の保持時間ずれに対応した時間軸補正手法の一つとして、従来、動的計画法(Dynamic Programming、以下「DP」と略す)に基づくアルゴリズムが提案されている(非特許文献1、特許文献1参照)。
【0003】
従来一般に用いられているDPアルゴリズムは、基準となる参照信号(参照クロマトグラム信号)と時間軸が非線形に歪められた対象信号(対象クロマトグラム信号)とを対応付け、その時間の歪み具合と対応点の強度の一致具合とをコスト関数とし、計算されたコストを最小にするような参照信号と対象信号との対応関係を探索する、という手法である。この対応関係が求まれば、それを利用して対象信号の時間軸を非線形に伸縮させ、保持時間ずれを補正することができる。
【0004】
ここで説明のために、参照信号をAとし、その参照信号Aの各時間におけるサンプル点をA(n)で表すこととする(但し、nは正の整数)。同様に、対象信号をBとし、その対象信号Bの各時間におけるサンプル点をB(n)で表すこととする。一般的なDPにおける最適な(最もマッチングの良好な)対応関係の探索方法は以下の通りである(図8参照)。
[1]参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点は、常識的な(種々の変動の最大値を考慮した)時間変動の範囲を考えて、例えば「対応点なし」から対象信号B(1)〜B(3)に対応する可能性がある。
[2]参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点が上記範囲内のいずれになるかによって、参照信号Aの次のサンプル点A(2)が対応可能な対象信号Bのサンプル点群はそれぞれ異なる。例えば、参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点がB(1)であれば、次のサンプル点A(2)が対応可能な対象信号Bのサンプル点群は「対応点なし」又は対象信号B(2)〜B(4)となるし、参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点がB(2)であれば、次のサンプル点A(2)が対応可能な対象信号Bのサンプル点群は「対応点なし」又は対象信号B(3)〜B(5)となる。
したがって、図8に示すように、サンプル点A(n)のnが増加するに伴い、つまり時間経過に伴い、樹形図状に対応可能なサンプル点が増えることになる。
【0005】
以上のように最適な対応関係を探索する際に常識的に対応可能な候補がそれぞれのサンプル点でm個存在すると仮定すると(図8の例の場合にはm=4)、クロマトグラムが全部でn個のサンプル点のデータからなるものであるならば、ほぼmのn乗の数の経路(つまりはクロマトグラム全体の対応関係の候補)が導出されることになる。したがって、参照信号Aと対象信号Bとの対応関係の候補数のオーダはO(m)であり、そのそれぞれについてコストを計算して最小コストの候補を選択する必要がある。
【0006】
しかしながら、計算に使用するコンピュータの性能や計算時間の制約から処理可能な計算量には制約があるので、上記のような膨大な数の候補の全てを探索しコスト計算を行うのは現実的ではない。そこで、通常、各探索段階において上位x個の候補のみを残し、それ以外のデータを削除することで最終的な候補数をx個に抑えるような手法が採られる。このような手法は一般にビーム幅xのビーム制限と呼ばれる。ビーム幅xを狭めるほど処理時間は短くて済むものの、ビーム幅xを必要以上に狭くすると、探索の前半部のみでのマッチングがよく後半部ではマッチングが乏しい局所解に陥る可能性が高くなり、一般にノイズ等に弱くなる。逆に、こうしたノイズに対する耐性(ロバスト性)を持たせるには、膨大な演算処理の時間を許容する必要がある。
【0007】
即ち、非特許文献1、特許文献1に記載のような一般的なDPアルゴリズムをクロマトグラムの時間軸補正に適用する場合、含有成分が多くクロマトグラムに出現するピーク数が多い、取得される信号のS/Nが悪く偽のピークも多い、或いは、時間変動が極端に大きい、といった悪条件の下では、現実的な演算処理時間では対象信号を参照信号に適切にマッチングさせることができず、誤った時間軸補正を行ってしまうおそれがある。特に、GC分析のカラム交換に伴う時間変動が大きい場合やガソリン・香料等、膨大な数の成分を含む試料を分析する場合、正確な時間軸補正が行えない可能性がかなり高くなる。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】国際公開第2004/090526号パンフレット
【特許文献2】特開平5−181498号公報
【非特許文献】
【0009】
【非特許文献1】プラブドバ(V.Pravdova)ほか2名、「ア・コンパリソン・オブ・トゥー・アルゴリズムズ・フォー・ワーピング・オブ・アナリティカル・シグナルズ(A comparison on two algorithms for warping of analytical signals)」、アナリティカル・キミカ・アクタ(Analytical Chimica Acta)、456、2002年、p.77−92
【非特許文献2】宮崎洋光ほか2名、「粗密DPに基づく画像の弾性マッチングアルゴリズム」、 画像の認識・理解シンポジウム (MIRU2004)予稿集、2004年7月
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明は上記課題を解決するためになされたものであり、その主たる目的は、含有成分数(ピーク数)が多い、ノイズが多い、時間変動が大きい、といった悪条件の下でも、妥当な処理時間内でクロマトグラムの時間軸を高い精度で以て補正することができるクロマトグラムデータ処理方法及び装置を提供することにある。なお、ここで言う「クロマトグラム」は、クロマトグラフ質量分析装置で得られる全イオン電流クロマトグラムや抽出イオンクロマトグラム(マスクロマトグラム)を含むものとする。
【課題を解決するための手段】
【0011】
DPにおける高速化の代表的な手法として、DPのアルゴリズム処理を大まかな候補探索と細かな候補探索との二段階に分けることにより、候補数O(m)におけるnとmとを共に減らすようにした粗密DPが知られている。例えば特許文献2には、音声認識に粗密DPを利用した手法が開示されている。また非特許文献2には、変形を伴う画像パターン認識に粗密DPを利用することが提案されている。一般に、音声信号や画像信号の場合、或る位置における信号値とそれに時間的又は空間的に近接する位置における信号値との相関が高いという特性がある。そのため、粗密DPを適用することは比較的容易である。これに対し、クロマトグラム信号の場合、或るピークとそれに時間的に近い他のピークとの相関性は殆どなく、上記のような音声用や画像用の粗密DPをそのまま利用することはできない。そこで、本願発明者はクロマトグラムの時間軸補正に粗密DPの手法を導入しつつ、クロマトグラム信号の特性を利用してDPの計算量をできるだけ低減するような処理を加えることにより、本願発明に想到するに至った。
【0012】
即ち、上記課題を解決するために成された第1発明は、試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理方法であって、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正ステップと、
b)前記線形補正ステップによる線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索ステップと、
c)前記粗探索ステップで抽出された粗段階での対応関係の候補について、該ステップで排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索ステップと、
d)前記密探索ステップで抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理ステップと、
を有することを特徴としている。
【0013】
また第2発明は上記第1発明に係るクロマトグラムデータ処理方法を実施するための装置であって、試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理装置において、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正手段と、
b)前記線形補正手段による線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索手段と、
c)前記粗探索手段で抽出された粗段階での対応関係の候補について、該手段で排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索手段と、
d)前記密探索手段で抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理手段と、
を備えることを特徴としている。
【0014】
クロマトグラムに生じる保持時間ずれの最も大きな要因の一つはカラム劣化であるが、この要因による保持時間ずれは多少の揺らぎはあるもののほぼ時間的に線形のずれである。即ち、対象クロマトグラムの時間軸が参照クロマトグラムの時間軸に対し全体的にp倍に伸び(又は1/pに縮小し)、さらに全体にqだけシフトしている、といったずれである。本発明に係るクロマトグラムデータ処理方法及び装置では、粗密DPを実行する前に、予め線形補正ステップにおける線形補正処理により、上述した線形の時間ずれを低減しておく。これにより、引き続いて実施される粗密DPでは非線形の保持時間ずれのみを対象とすればよく、限られたビーム幅であっても、つまり探索空間を狭くしても十分なロバスト性でマッチングさせることが可能となる。
【0015】
前述した一般的な粗密DPでは、まず計測データを再サンプリングすることにより低時間分解能のデータを生成し、これを入力データとしてデータ点数(n)を減らした粗段階DPを行う。その後、低時間分解能の下で得られた最適な対応関係(マッチング)に著しく反しないという制限をかけることでmを減らした上で、元の(再サンプリングする前の)時間分解能で密段階のDP処理を行う。しかしながら、クロマトグラム信号の場合、単純な再サンプリングでは元の信号が持つ情報自体が失われることになる。クロマトグラム信号では、情報として重要であるのはピークのピークトップの位置(時間)であるから、検出されたピークの位置(時間)をDPの入力データとする。
【0016】
ただし、含有成分の数が多い場合にはピークの数も多くなるし、ノイズ由来のピークもクロマトグラムに出現する。そこで、粗探索ステップでは、特に補正に有用である可能性が高いピークのみを例えば強度順に選別して粗段階のDPの入力データとすることにより、処理対象のデータ数を減らすと同時にノイズの影響を軽減する。なお、このピーク抽出に用いられるピークの強度とは、ピークの高さ、ピーク面積、又はその両方を利用することができる。上記粗探索ステップにより、参照クロマトグラム上の抽出された各ピークと対象クロマトグラム上の抽出された各ピークとの対応関係の候補が探索される。即ち、参照クロマトグラム上の抽出されたピーク毎に、対応付けられる対象クロマトグラム上のピークの候補が1乃至複数挙げられる。
【0017】
次に、密探索ステップでは、強度が低いために先に除外されたピークを含め、粗探索ステップで求まった候補に基づいたマッチングを実行することにより対応関係の候補を絞る。例えば、粗探索ステップにおいて対応するピークの候補が少なくとも1つ挙げられた参照クロマトグラム上のピークについては、密探索ステップでその候補の中の1つが候補として挙げられれば、それが最適解であるとして他の候補を破棄する。一方、粗探索ステップにおいて対応するピークの候補がない参照クロマトグラム上のピークについては、最も時間的に近い位置の候補を直線補間することで求めた仮の位置(時間)を利用して密探索のコスト計算を行えばよい。
【0018】
以上のような粗密の2段階のDPにより、参照クロマトグラム上の各ピークと対象クロマトグラム上の各ピークとの最も確からしい対応関係を求めることができる。その後、補正処理ステップにおいて、上記対応関係に基づいて対象クロマトグラムの時間軸を補正する。これにより、ピークトップの位置のみならず、対象クロマトグラムの信号波形全体が参照クロマトグラムを基準として補正される。
【0019】
第1発明に係るクロマトグラムデータ処理方法では、好ましくは、前記粗探索ステップの実行後で前記密探索ステップの実行前に、マッチング全体の傾向を評価基準として該評価基準に適合しないマッチング結果を除去するフィルタリングステップを有するようにするとよい。マッチング全体の傾向としては、全体的な変動量の統計値を用いればよく、例えば変動量の標準偏差を求め、この標準偏差を評価基準とすることができる。
【0020】
これによれば、粗探索ステップにおいて挙げられたピークの対応付けの候補のうち、全体の傾向からみて妥当でないものを予め除去することができる。そのため、効果的に対応関係の候補数を削減し、計算量を減らすことができるとともに密段階のDPにおける探索の精度を高めることができる。
【0021】
また第1発明に係るクロマトグラムデータ処理方法の一態様として、前記線形補正ステップは、時間的に近接する複数のピークの強度の相関及び時間の関係を利用して参照クロマトグラムと対象クロマトグラムとで対応する時間範囲を抽出し、その時間範囲の組み合わせを仮定して線形補正を行ったときのピークの一致の程度を調べ、最良の一致を示す時間範囲の組み合わせを選ぶことで線形補正のための係数を求めるようにすることができる。ここで、好ましくは、参照クロマトグラムと対象クロマトグラムとの先頭部分と末尾部分とでそれぞれ対応する時間範囲を抽出するとよい。
【0022】
また、前記線形補正ステップにおけるピークの一致の度合を示す尺度として、参照クロマトグラム上の各ピークについて、該参照クロマトグラム上の1本のピークと前記仮定の下で線形補正が行われた後の対象クロマトグラム上で前記参照クロマトグラム上のピークの強度に対し一定の強度比の範囲に収まり最も近傍に位置するピークとの時間差の絶対値の総和を用いるようにすることができる。これにより、比較的簡単な演算によって精度の高い線形補正を行うことができる。
【発明の効果】
【0023】
本発明に係るクロマトグラムデータ処理方法及び装置によれば、クロマトグラムの時間軸補正のために、クロマトグラム信号の特性や時間変動の発現態様に適合するように改良した粗密DPを用いると共に該粗密DPの前に線形性の時間ずれを除去する補正を行うようにしたので、対応関係の候補数を効率良く減らしながら、対象クロマトグラムを参照クロマトグラムに対して十分にマッチングさせることができる。その結果、例えば試料の含有成分が多くピーク本数が多い、信号のS/Nが悪い、時間変動が大きい、といった悪条件の下でも、実用的に十分に短い時間内で、精度の高い時間軸補正を行うことができる。それにより、例えば複数のクロマトグラムの比較を精度良く行うことが可能となる。
【0024】
また、データ処理が十分なロバスト性を持つので、粗密DPの際のコスト関数の重みやビーム幅等のデータ処理に必要なパラメータを試料の種類や分析条件などに応じて変更することなく、様々な試料から得られたデータを処理することができる。そのため、データ処理に際してのオペレータの負担が軽減され、処理のスループット向上も図れる。
【図面の簡単な説明】
【0025】
【図1】本発明に係るクロマトグラムデータ処理装置を適用したGC装置の全体構成図。
【図2】本発明に特徴的な時間軸補正方法の処理手順を示すフローチャート。
【図3】図2中の簡易線形補正のフローチャート。
【図4】簡易線形補正の概念の説明図。
【図5】簡易線形補正の処理の説明図。
【図6】図2中の粗段階DPのフローチャート。
【図7】図2中の誤候補フィルタリング処理の概念の説明図。
【図8】一般的なDPの説明図。
【図9】本発明に特徴的な時間軸補正方法の効果を検証するためのシミュレーション結果を示す図。
【発明を実施するための形態】
【0026】
本発明に係るクロマトグラムデータ処理方法を実施するクロマトグラムデータ処理装置を用いたガスクロマトグラフ(GC)装置の一実施例について、添付図面を参照して説明する。
【0027】
図1は本実施例のGC装置の概略構成図である。図1において、試料気化室等を含む試料導入部1からカラム2には一定流量でキャリアガスが供給され、試料導入部1に試料が注入されると、該試料はキャリアガス流に乗ってカラム2に導入される。カラム2を通過する間に試料中の各種成分は時間方向に分離され、順にカラム2出口から溶出して検出器3に導入される。検出器3は例えば水素炎イオン化検出器(FID)や質量分析計などであり、導入された試料成分の量に応じた検出信号を時々刻々と出力する。この信号はA/D変換器4でデジタル値に変換されてデータ処理部5に入力される。データ処理部5はクロマトグラムデータ格納部51、時間軸補正演算処理部52、クロマトグラム作成・描画部53などを含み、作成されたクロマグラムは表示部6に表示される。
【0028】
なお、データ処理部5の実体はパーソナルコンピュータであり、該コンピュータに予めインストールされた専用のデータ処理ソフトウエアを動作させることにより、上記各部の機能を実現することができる。
【0029】
このGC装置を用いて同一の分析条件の下で同一試料のGC分析を実行してクロマトグラムデータを取得した場合、理想的には同一試料成分に対する保持時間は常に同一である。しかしながら、実際には、カラム2の経時的な劣化による試料成分とカラム2内壁との相互作用の変化、試料導入部1よりカラム2に供給されるキャリアガス流速の時間的変動、カラム2が収納されたカラムオーブン(図示せず)の昇温速度の時間的変動など、様々な要因によって時間軸変動が生じ、同一試料成分に対する保持時間は一定とはならないことが多い。これは特に、複数のクロマトグラムを比較する際に問題となる。そこで、本実施例のGC装置では、GC分析により取得されたクロマトグラムの時間軸を次のような時間軸補正処理により補正するようにしている。
【0030】
図2は時間軸補正演算処理部52で実行される時間軸補正処理の概略的な手順を示すフローチャートである。ここでの時間軸補正処理とは、クロマトグラムデータ格納部51に格納されている参照クロマトグラムを基準として、GC分析して得られた対象クロマトグラムの時間軸を参照クロマトグラムの時間軸に合わせるように補正する処理である。基本的には、参照クロマトグラムと対象クロマトグラムとは同一種類の試料を分析して得られたものである。
【0031】
補正処理の手順としては、まず最初に、参照クロマトグラムと対象クロマトグラムとのそれぞれについてピーク検出を行い、ピークトップの位置(時間)と強度(高さ、面積又はその両方)をピーク情報として取得する(ステップS1)。ここで検出されたピークの時間情報が後述する粗密DPにおける入力データとなる。
【0032】
次に、対象クロマトグラムに含まれる線形の保持時間ずれを除去するために、簡易的な線形補正処理を実行する(ステップS2)。この簡易線形補正により、対象クロマトグラムにおいて、時間軸方向におけるp倍の伸縮、及び、時間qのシフトといった線形成分がほぼ除去され、非線形性を持つ保持時間ずれが残る。実際には、対象クロマトグラム上の各ピークに対し線形補正を実施し、それらピークの時間情報を修正すればよい。もちろん、粗密DPにおいて線形性の時間ずれを補正することも可能であるが、通常、線形性の時間ずれは非線形性の時間ずれに比べてかなり大きいので、線形性と非線形性の時間ずれが混在した(重畳された)状態であると、DPの際の探索空間がかなり大きくなる。これに対し、予め線形性の時間ずれを除去しておくことにより、探索空間を狭めることができる。
【0033】
簡易線形補正の後、参照クロマトグラム及び対象クロマトグラムのそれぞれにおいて、各ピークの強度情報に基づいてピークを選別して所定個数に減らす。そして、この選別により元々のピーク数に比べて大幅に数を減らしたピークの時間情報(対象クロマトグラムについては線形補正後の時間情報)を入力データとし、粗段階のDPアルゴリズムに基づくマッチングを行うことにより、参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する(ステップS3)。
【0034】
粗段階DPによる候補探索を終了した後、次の密段階DPによる探索を行う前に、フィルタリング処理によって粗段階の探索で挙げられた候補の中で、全体の傾向からみた補正の妥当性を基準として、明らかに誤っていると推定されるマッチングを除去する(ステップS4)。誤りであるか否かの判断基準には、例えば時間ずれの全体的な変動量の統計値を用いることができる。このフィルタリング処理により、探索候補を減らすことができる。
【0035】
その後に、粗段階DPによるマッチング結果を利用しつつ、上記のピーク選別で選別されなかった、つまりは粗段階DPでは考慮されなかったピークを加えて、密段階のDPアルゴリズムに基づくマッチングを行うことにより、粗段階DPで挙げられた対応関係の候補を最終的に1つに絞る(ステップS5)。粗密DPに基づく候補の探索により参照クロマトグラムに対する対象クロマトグラムの最適な、つまり最小コストを与える対応関係が見い出されたならば、その結果に基づいたワープ処理により、対象クロマトグラムの各サンプル点を移動させた、つまり時間軸補正がなされた信号を求める(ステップS6)。それにより、対象クロマトグラムに含まれる保持時間ずれが補正されたクロマトグラムデータが得られる。
【0036】
上記の一連の処理について本発明に特徴的な処理を中心に詳細に述べる。
【0037】
[ステップS2]簡易線形補正
クロマトグラムの保持時間ずれの主たる要因はカラム2の劣化であり、これによる保持時間ずれは多少の揺らぎはあるもののほぼ線形である。即ち、参照クロマトグラムに対する対象クロマトグラムの時間ずれの概略的傾向は直線的である。そのため、DPによる時間軸補正を試みる前に、線形の保持時間ずれを除去しておくことにより、DPによる補正の負荷を軽くし補正精度を向上させることができる。図3は簡易線形補正処理の手順を示すフローチャート、図4は簡易線形補正の概念の説明図、図5は簡易線形補正の処理の説明図である。
【0038】
図4に示すように、通常、クロマトグラムにおける時間ずれは線形成分と非線形成分とが重畳したものであるが、線形成分が支配的であることが多い。線形成分を除去しない場合、粗密DPで補正が必要となるずれ量はd2であるが、線形成分を除去すれば、粗密DPで補正が必要となるずれ量はd1で済むことが分かる。
【0039】
時間ずれの線形成分はクロマトグラム上でピークが存在する区間の始点及び終点から計算することができるが、そのためにはノイズ等に対する耐性の高い始点・終点検出が必要となる。ここでは、時間的に近接して出現している複数のピークを1つの群として参照クロマトグラムと対象クロマトグラムとの間での類似性の評価を行うことにより、その2つのクロマトグラムにおけるピーク存在区間の始点と終点とを検出する。そして、対象クロマトグラムのピーク存在区間の始点・終点が参照クロマトグラムのピーク存在区間の始点・終点に一致するように、対象クロマトグラムのピーク存在区間を伸縮するとともに時間軸方向にシフトさせる。
【0040】
即ち、まず参照クロマトグラムと対象クロマトグラムとのそれぞれにおいて、ピーク存在区間の始点付近の所定範囲と終点付近の所定範囲とでそれぞれ先端、末尾の候補を抽出する(ステップS21)。具体的には、図5に示すように、時間的に連続する3つのピーク(三連ピーク)を抽出し、その3本のピークの強度の相関係数α、及び、1本目のピークと2本目のピークとの時間間隔T1と2本目のピークと3本目のピークとの時間間隔T2との比β=T1/T2、を求める。相関係数αと時間間隔比βとが、参照クロマトグラム上の三連ピークと対象クロマトグラム上の三連ピークとの一致性(類似性)を判断するパラメータである。そして、参照クロマトグラム上の始点側の三連ピークと対象クロマトグラム上の始点側の三連ピークとについて、相関係数α及び時間間隔比βを用いて一致性の評価を行い一致している可能性が高いものを選び先端の候補とする。また、参照クロマトグラム上の終点側の三連ピークと対象クロマトグラム上の終点側の三連ピークとについても同様に、一致している可能性が高いものを選び末尾の候補とする。
【0041】
次に、上記ステップS21で抽出された先端の候補(三連ピーク)と末尾の候補(三連ピーク)を1つずつ選び、実際にその条件で対象クロマトグラムに対する線形補正を試行し、その後の対象クロマトグラムと参照クロマトグラムとにおいてピークの一致度合を判定する(ステップS22)。両クロマトグラムのピークの一致度合を推し量る指標は、参照クロマトグラムに現れる各ピークについて、該ピークの強度との比が一定範囲内に収まるような強度を有し、時間的に最も近い位置に存在する対象クロマトグラム上のピークとの間の距離(時間)の総和を評価関数として用いる。全ての候補の組合せについて同じ評価関数を用いてピーク一致性の評価を実行し(ステップS3)、この評価関数が最小になるような先端と末尾の候補の組合せを選択する(ステップS24)。実際には計算を簡単にするため、上述した一致度合の評価関数と先頭・末尾であることの度合を示す評価関数とを加算した評価関数を用いるようにすればよい。
【0042】
上記処理により参照クロマトグラム及び対象クロマトグラムにおいてピーク存在区間の始点と終点とが確定するから、それにより線形補正のためのパラメータ(具体的には伸縮率pとシフト量q)を算出し(ステップS25)、そのパラメータに従って対象クロマトグラム上の各ピークの位置を修正する(ステップS26)。これにより、対象クロマトグラムに含まれる時間ずれの線形成分がほぼ除去される。
【0043】
[ステップS3]粗段階DPによる探索
図6は粗段階DPの処理手順を示すフローチャートである。粗段階DPでは、処理対象のデータを減らすために、まず、単純にピーク強度順に一定割合で間引きを行うとともに、強度が一定の相対強度以下であるピークはノイズである可能性が高いとみなし除去する処理を行う。これにより、補正に有意であると推側し得るピークを選別して、ピーク数を所定数に抑える(ステップS31)。そして、参照クロマトグラム及び対象クロマトグラムのピークの時間を入力データとし、DPアルゴリズムに基づくマッチングを実行する。即ち、参照クロマトグラム上で抽出されたピークについて時間の早いものから順に、対象クロマトグラム上で抽出されたピークとの対応付けの候補を挙げ、複数の候補が挙げられたときにはその各候補について次のピークの対応付けの候補を挙げるという探索を繰り返す。したがって、図8に示したように樹形状に候補が拡がる(ステップS32)。
【0044】
なお、このときに、想定される非線形の時間ずれの最大値を考慮した時間範囲に候補の拡がりを抑えることで、各ピーク点で挙げる候補の数を制限する。上述したように、予め線形性の時間ずれが除去されているため、この制限を厳しくしても(ビーム幅を狭くしても)正当な候補が除外される事態を避けることができる。
【0045】
次いで、探索された対応関係の候補について、それぞれコストを計算する(ステップS33)。粗段階DPでのコスト関数は以下のようにする。
(1)対応付けるピークの強度比の対数に一定の定数を乗じたもの。ただし、対応付けるピークが存在しない場合には、スキップされたピーク毎に、ピーク強度に一定定数を加算したものとする。
(2)時間変動量:参照クロマトグラム上のピークと対象クロマトグラム上のピークの時間差の絶対値
(3) 時間変動量の差分:大部分の時間変動は緩やかに起きるため、時間変動量の差分はゼロに近い値をとる筈である。そこで、時間変動量の平均に相当するものとして、時間変動量にローパスフィルタを掛けた値と現在の対応ピークでの時間変動の差の絶対値を用いる。
(4)強度比の差分:マッチング後の参照クロマトグラムと対象クロマトグラムの各ピークの強度には非常に強い相関があり、理想的には強度比は一定となる。そこで、強度比の対数の平均に相当するものとして、その強度比の対数値にローパスフィルタを掛けた値と現在の対応ピークでの強度比の対数の差の絶対値を用いる。
実際には、上記(1)〜(4)の各項目に所定のガンマ補正を施した上で定数を乗じ、コスト関数としている。
【0046】
参照クロマトグラムと対象クロマトグラムとの対応関係の全ての候補についてコスト計算が終了したならば、コストが最小の候補を選択し、これを粗段階DPの最適マッチングとして決定する(ステップS34)。
【0047】
[ステップS4]フィルタリング処理
DPは局所的なマッチングには優れているが、クロマトグラム全体の傾向からみた補正の妥当性からは逸脱したマッチングを行う場合がある。そこで、図7に示すように、最適マッチングとして決定された対応関係について、各ピーク点での時間ずれの標準偏差を計算し、その標準偏差から外れるようなずれがある場合には、当該ピークのマッチングを削除する。
【0048】
[ステップS5]密段階DPによる探索
次に、粗段階DPで得られたマッチング結果を利用し探索空間を絞った上で、粗段階DPの際には除外されたピークも含めてDPアルゴリズムによるマッチングを実行する。この際には、密段階DPでの時間変動は粗段階DPで求めた時間変動に近い値をとるので、粗段階DPの結果のコスト関数にかけるガンマ補正及び定数を変更し、さらに以下のように粗段階DPでのマッチング結果との乖離度合いコストを加算する。
(1)粗段階DPでマッチングがある参照クロマトグラム上のピークについては、密段階DPにおいてマッチングが一致しなければコスト無限大とみなし、その候補を破棄する。
(2)粗段階DPでマッチングがない参照クロマトグラム上のピークについては、粗段階DPでマッチングした結果(時間的に近接したピーク)を線形補間した時間との時間ずれの絶対値を乖離度合いコストとする。
【0049】
これにより、粗段階DPでマッチングしているピークの対応付けは正しいものとして、粗段階DPでは用いられなかったピークについても適切な対応付けが行われ、結果的に、最終クロマトグラムと対象クロマトグラムとの最適な対応関係を求めることができる。
【0050】
図9は本発明に係るクロマトグラムデータ処理方法で時間軸補正を実行したときの処理結果を示す図である。この図に示すように、補正後の対象クロマトグラムは参照クロマトグラムとよく一致していることが分かる。
【0051】
なお、上記実施例はいずれも本発明の一例にすぎず、本発明の趣旨の範囲で適宜、変更、修正、追加を行っても本願特許請求の範囲に包含されることは当然である。
【符号の説明】
【0052】
1…試料導入部
2…カラム
3…検出器
4…A/D変換器
5…データ処理部
51…クロマトグラムデータ格納部
52…時間軸補正演算処理部
53…クロマトグラム作成・描画部
6…表示部

【特許請求の範囲】
【請求項1】
試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理方法であって、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正ステップと、
b)前記線形補正ステップによる線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索ステップと、
c)前記粗探索ステップで抽出された粗段階での対応関係の候補について、該ステップで排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索ステップと、
d)前記密探索ステップで抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理ステップと、
を有することを特徴とするクロマトグラムデータ処理方法。
【請求項2】
請求項1に記載のクロマトグラムデータ処理方法であって、
前記粗探索ステップの実行後で前記密探索ステップの実行前に、マッチング全体の傾向を評価基準として該評価基準に適合しないマッチング結果を除去するフィルタリングステップを有することを特徴とするクロマトグラムデータ処理方法。
【請求項3】
請求項1又は2に記載のクロマトグラムデータ処理方法であって、
前記線形補正ステップは、時間的に近接する複数のピークの強度の相関及び時間の関係を利用して参照クロマトグラムと対象クロマトグラムとで対応する時間範囲を抽出し、その時間範囲の組み合わせを仮定して線形補正を行ったときのピークの一致の程度を調べ、最良の一致を示す時間範囲の組み合わせを選ぶことで線形補正のための係数を求めることを特徴とするクロマトグラムデータ処理方法。
【請求項4】
請求項3に記載のクロマトグラムデータ処理方法であって、
前記線形補正ステップにおけるピークの一致の度合を示す尺度として、参照クロマトグラム上の各ピークについて、該参照クロマトグラム上の1本のピークと前記仮定の下で線形補正が行われた後の対象クロマトグラム上で前記参照クロマトグラム上のピークの強度に対し一定の強度比の範囲に収まり最も近傍に位置するピークとの時間差の絶対値の総和を用いることを特徴とするクロマトグラムデータ処理方法。
【請求項5】
試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理装置において、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正手段と、
b)前記線形補正手段による線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索手段と、
c)前記粗探索手段で抽出された粗段階での対応関係の候補について、該手段で排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索手段と、
d)前記密探索手段で抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理手段と、
を備えることを特徴とするクロマトグラムデータ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−220907(P2011−220907A)
【公開日】平成23年11月4日(2011.11.4)
【国際特許分類】
【出願番号】特願2010−91908(P2010−91908)
【出願日】平成22年4月13日(2010.4.13)
【出願人】(000001993)株式会社島津製作所 (3,708)