説明

測定データの取得・評価方法

【課題】データの定量信頼性を付与し、その指標を用いて不要なピークを効率的に排除すると共に、統計解析への適用、メタアナリシスへの応用を可能とする。
【解決手段】測定対象である2つの試料A、Bを等量ずつ混合した混合試料Blendを作成し、各試料A、Bの成分iに関する定量データa及びbを測定して測定値y、yとし、前記混合試料Blendの成分iに関する定量データblendを測定して測定値yとし、これらの3変数y、y、yと予測される検量線の関係式との整合性を評価することで、誤差指標を求める。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、測定データの取得・評価方法に係り、例えば、キャピラリ電気泳動(CE)−質量分析(MS)による細胞の全代謝物のメタボローム測定等に用いるのに好適な、定量的データに信頼性の指標を与えることが可能な測定データの取得・評価方法に関する。
【背景技術】
【0002】
試料中の成分(例えば血液・脳髄液・尿・汗・涙・臓器・組織・培養細胞および培地などの試料から抽出した成分を含む溶液でなる生体試料から抽出した代謝物の混合溶液)を定量分析するとき、一般に次の手順で操作を行なう。
元試料の準備→目的物質の抽出→(検出可能な形式に変換)→検出→データ処理
【0003】
ここで、「検出可能な形式に変換」するということは、誘導体化、酵素反応、分離操作等を意味する。これらの各手順は誤差を含んでいるため、最終的に得られる数値は、それらの誤差が積み重なったものとなる。
【0004】
現在の分析フローでは、これらの手順の定量的信頼性を評価するには、標準物質を添加して検量線を作成する手法を用いるのが一般的である(非特許文献1)。しかし、操作が煩雑である上に、実際の試料ではマトリクス効果が排除できない場合や、標準物質が入手困難な場合(未同定物質である場合を含む)は適用できない。又、試料自体を希釈して測定することもあるが、マトリクス効果が変化するので、実質的な意味を持たない。
【0005】
マトリクス効果を排除する方法として、これまでに、内部標準法(測定対象と同等なマトリクス効果が期待される内部標準物質の添加による相殺)が用いられている(非特許文献1)。しかし、少数の内部標準物質で全信号のマトリクス効果を予測することはできないため、特に多成分一斉分析データによる解析を行うオミクスでは実用的ではない。
【0006】
他に、いくつかの濃度の標準物質を試料に添加し、外挿法により求める標準物質添加法が用いられる。しかし、この手法は、標準物質が入手困難な場合(未同定物質である場合を含む)は適用できない。又、質量分析においては生成イオンの発生率によって親イオンの信号強度が影響を受けるため、試料間で定量的信頼性の低下が起きているかどうか判断できない。
【0007】
一方、分析機器(例えば質量分析装置)にて解析したデータには、図1に例示するように、質量分析の際に生じるランダムノイズ・スパイクノイズ・リンギングノイズなどを含む多くのノイズ信号が含まれている。試料間の差異を調べる際には、化合物のピークを正しく対応付けることが求められるが、膨大なノイズを含んだデータでは、正確にそれらを対応付けるのに、多大な労力を必要とする。しかし、十分に効率的なノイズ除去方法は、これまでに考案されていなかった(非特許文献2〜4)。
【0008】
例えば、ベースラインのスムージングを行なうことでノイズピークを低減させる手法が、多くのデータ処理ソフトに採用されている。しかし、小ピークがフラットになる、大きなノイズが排除できない、データ自体が変わってしまうという問題がある。
【0009】
又、試料を含まないブランククロマトグラムを平滑化処理し、オリジナル試料データから減算するブランクサブトラクション法も提案されている(特許文献1)。しかし、大きなノイズや試料由来のノイズを排除できないという問題がある。
【0010】
又、S/N比を指標として閾値を設定し、それ以下の装置のものをノイズとして排除するS/N比によるカットオフ手法も一般的に用いられているが、データ全てを単一の閾値で評価するため、ノイズ排除性能は低い。又、閾値設定の根拠に乏しい場合が多い。
【0011】
又、一般にノイズ信号は強度が低いため、信号強度に閾値を設定し、それ以下のものを削除する信号強度閾値によるカットオフ手法もあるが、強度は低いが必要である信号も排除されてしまうため、ノイズ排除性能は低く設定される(非特許文献5、特許文献2)。又、閾値設定の根拠に乏しい場合が多い。
【0012】
又、試料間で共通に検出された物質由来信号ピークを、ある基準(CEの場合は泳動時間、LC(液体クロマトグラフ)やGC(ガスクロマトグラフ)の場合は溶出時間、MSの場合はm/z、吸光光度計の場合は吸収波長、蛍光分析の場合は励起波長と発光波長)を指標として関連付ける(並列化する)アライメント手法に関して、測定データ間のアライメント精度向上とノイズ除去に関する技術として、繰り返し測定が良く利用されている。これは、同一試料を複数回測定し、共通で検出された信号ピークを残し、その他はノイズとして処理する手法である(非特許文献6〜8)。この手法は、ノイズ排除性能は高いが、測定回数が大幅に増えることや、質量分析の際に生じる多価イオン、多量体イオン、金属付加イオン、フラグメントイオン等を含む親イオン由来の一連のイオン群である生成イオンを排除できない等の問題点を有する。又、溶出時間や泳動時間を非線形関数を用いて補正し、アライメント精度を上げる手法が提案されている(非特許文献9)。しかし、得られる信号数が多い場合、溶出時間もしくは泳動時間が極めて近い値をとる信号を判別することができないため、アライメントの精度は低くなる。
【0013】
又、過去に測定したデータを蓄積してライブラリ化しておき、測定毎にそれらのデータを比較してノイズを排除するリファレンスライブラリによるピーク選抜方法も提案されている(非特許文献10、特許文献2〜4)。この手法は実践的ではあるが、プラットホームの違いに対応できず、作り直しが必要な点や、確率的な判断を介することから基準に曖昧さがあるという問題点を有する。
【0014】
又、生成イオンの除去に関して、生成イオンは、金属イオン(Na、K、Mg2+、Mn2+等)付加体や、いくつかの既知フラグメントイオン(蟻酸脱離、水脱離、アンモニア脱離等)については、m/zが計算できるため、発見は容易である。しかし、その化合物及び分析手法特有のフラグメントや付加体(開裂分離や特定不純物付加等)は予測不可能であるという問題点を有する。
【0015】
又、材料の混合に関して、2次元電気泳動を用いたプロテオミクスでは、測定する試料を全て等量ずつ混合したものを準備し、その混合試料の信号強度を基準として他の試料の信号を相対定量する手法が用いられている(非特許文献11)。しかし、測定データの信頼性やノイズ除去に、この値を用いているのではなく、あくまでもゲル間の標準化を行なうのが目的であった。
【先行技術文献】
【特許文献】
【0016】
【特許文献1】特開平10−339727号公報
【特許文献2】特開2005−55370号公報
【特許文献3】特開2000−131284号公報
【特許文献4】特表2007−575644号公報
【非特許文献】
【0017】
【非特許文献1】日本分析化学会九州支部編 機器分析入門 改訂第3 版 南江堂
【非特許文献2】松田史生, 及川彰, 草野都, 菊地淳, 斉藤和季. メタボローム解析技術の現状と展望. 2. データ処理技術. 化学と生物45:834-842, 2007.
【非特許文献3】大橋由明. メタボロミクスを上手に利用する. バイオサイエンスとインダストリー 65:8-13, 2007
【非特許文献4】Fiehn, O., Wohlgemuth, G., Scholz, M., Kind, T., Lee, D.-Y.,Lu, Y., Moon, S., and Nikolau, B. Quality control for plant metabolomics: reporting MSI-compliant studies. Plant J. 53:691-704, 2008.
【非特許文献5】Morohashi, M., Shimizu, K., Ohashi, Y., Abe, J., Mori, H., Tomita, M., and Soga, T. P-BOSS: a new filtering method for treasure hunting in metabolomics. J. Chromatogr. A. 1159(1-2):142-148, 2007.
【非特許文献6】Jonsson, P., Johansson, A. I., Gullberg, J., Trygg, J., A, J., Grung, B., Marklund, S. L., Sjostrom, M., Antti, H., and Moritz, T. High-throughput data analysis for detecting and identifying differences between samples in GC/MS-based metabolomics analyses.Anal. Chem. 77:5635-5642, 2005.
【非特許文献7】Jonsson, P., Gullberg, J., Nordstrom, A., Kusano, M., Kowalczyk, M., Sjotrom, M., and Moritz, T. A strategy for identifying differences in large series of metabolomics samples analyzed by GC/MS. Anal. Chem. 76:1738-1745,2004.
【非特許文献8】Jonsson, P., Bruce, S. J., Moritz, T., Trygg, J., Sjostrom, M., Plumb, R., Gramger, J., Maibaum, E., Nicholson, J. K., Holmes, E., and Antti, H. Extraction, interpretation and validation of information for comparing samples in metabolic LC/MS data sets. Analyst 130:701-707, 2005.
【非特許文献9】Smith, C., Want, E. J., O’Maille, G., Abagyan, R., and Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Anal. Chem. 78:779-787, 2006.
【非特許文献10】Styczynski, M. P., Moxley, J. F., Tong, L. V., Walther, J.L., Jensen, K. L., and Stephanopoulos, G. N. Systematic identification of conserved metabolites in GC/MS data for metabolomics and biomarker discovery. Anal. Chem. 79:966-973, 2007.
【非特許文献11】David B. Friedman et al. : Proteome analysis of human colon cancer by two-dimensional difference gel electrophoresis and mass spectrometry. Proteomics 2004.4,793-811
【発明の概要】
【発明が解決しようとする課題】
【0018】
本発明は、前記従来の問題点を解決するべくなされたもので、データの定量信頼性を付与し、その指標を用いて不要なピークを効果的に排除すると共に、統計解析への適用、メタアナリシスへの応用が可能な測定データの取得・評価方法を提供することを課題とする。
【課題を解決するための手段】
【0019】
本発明は、測定対象である2つの試料A、Bを等量ずつ混合した混合試料Blendを作成し、各試料A、Bの成分iに関する定量データa及びbを測定して測定値y、yとし、前記混合試料Blendの成分iに関する定量データblendを測定して測定値yとし、これらの3変数y、y、yと予測される検量線の関係式との整合性を評価することで、誤差指標を求めるようにして、前記課題を解決したものである。
【0020】
ここで、前記関係式を変数y、y、yを用いて作成した回帰関数とし、変数y、y、yからのずれである測定値相対誤差を前記誤差指標とすることができる。
【0021】
又、前記回帰直線の傾きを測定値の平均値との比で正規化したトレンドを求め、該トレンドを指標としてイオンの生成イオンを予測することができる。
【0022】
又、試料数が4以上の偶数の場合、半数の試料1〜nの測定値Z〜Zの平均を前記測定値yとし、残りの半数の試料(n+1)〜2nの測定値Zn+1〜Z2nの平均を前記測定値yとし、全試料を混合した試料の測定値Z2n+1を前記測定値yとすることができる。
【0023】
又、試料数が3以上の奇数の場合、略半数より1つ多い試料1〜(n+1)の測定値Z〜Zn+1の平均を前記測定値yとし、残りの略半数より1つ少ない試料(n+2)〜(2n+1)と全試料を混合した試料の測定値Zn+2〜Z2n+1、Z2n+2の平均を前記測定値yとし、全試料を混合した試料の測定値Z2n+2を前記測定値yとすることができる。
【0024】
本発明は、又、測定対象である2つの試料A、Bを、所定の比率p:(1−p)(混合比率p≠0.5)で混合した第1の混合試料Cと、所定の比率q:(1−q)(混合比率q≠0.5)で混合した第2の混合試料Dを作成し、第1の混合試料Cの成分iに関する定量データcの検量線の値f(c)と、第2の混合試料Dの成分iに関する定量データdの検量線の値f(d)が、次式
f(c)(1−q)/(1−p)≦f(d)≦f(c)q/p
の関係を満足しない時、そのデータcとdを棄却することにより、前記課題を解決したものである。
【0025】
ここで、前記混合比率p、qを、それぞれ0<p<0.5、0<q<0.5の範囲で調整することで、棄却領域を調整することができる。
【0026】
又、前記混合比率pとqの和が1であるようにすることができる。
【発明の効果】
【0027】
本発明では、比較する試料を所定の比率で混合した試料を測定することで、以下の情報を得る。
1.測定値を得たい複数試料に関する定量データ及びデータ群
2.測定試料ペアの混合物に関する定量及びデータ群
3.測定値を得たい複数試料と測定試料ペアの混合物の測定データを基にした測定誤差指標及び測定値誤差指標群
4.測定値を得たい複数試料と測定試料ペアの混合物の測定データを基にした測定値トレンド及び測定値トレンド群(請求項3の場合)
【0028】
本発明によれば、測定値を得たい複数試料に関する定量データから、各試料中の成分定量データを得ることができる。更に、次のような問題が解決される。
【0029】
(1)データの誤差指標を表示することで、定量的データに信頼性の指標を与えることができる。
【0030】
2つ以上の試料の測定データが、どの程度の信頼性をもって得られたかを、測定価を得たい複数試料に関する定量データと測定試料ペアの混合物に関する定量データの直線性若しくは関数適合性を指標に評価することができる。このとき、誤差指標が、その尺度となる。誤差指標としては、定量的相対誤差(RSE:Relative Standard Error)の他、例
えば、その二乗や誤差の和を用いることができる。RSEはゼロに近いほど誤差は小さく、定量的信頼性が高いことを示す。この指標は、純粋な標準物質が得られる場合においては、標準物質添加法(非特許文献1)でも直線性により評価できるが、測定する試料数が多く、又、標準物質が入手困難な場合は適用できない。本発明によると、分析対象の既知、未知に拘らず、測定データの信頼性を直接知ることができる。これにより、信号強度がノイズに近い場合であっても、閾値を設けることなく有意なデータを得ることができる(S/N比による閾値設定が一般的であるが、根拠に乏しい)。又、信号強度が高い場合でも、飽和現象等による信頼性の低下を感知できる。但し、この指標は、測定値を得たい複数試料の実測濃度範囲に限定される。又、請求項6の発明では、測定値の棄却域のみが決定される。
【0031】
(2)定量分析の手順の中で、データ信頼性を低下させる過程を同定できる。
【0032】
定量分析では、いくつかの手順を経て試料を調製し、最終的な測定データを得る。それらの手順のうち、どこに信頼性を低下させる要素があるのかは、これまで研究者の勘によって探索されてきた。本発明では、試料混合を行なう手順を変えることで、図2に例示する如く、どこで回帰関数からの誤差が低下するかを指標にし、問題の手順を発見できる。例えば、ガスクロマトグラフィのために試料を誘導体化する前後で各々試料を混合すれば、誘導体化によって、どの程度データの信頼性が低下しているかを判断できる。
【0033】
(3)定量性の低いノイズ信号を排除できる。
【0034】
回帰関数からの誤差指標が大きな値をとる場合、そのデータは信頼性が低いと見做される。一方で、このような場合は、その信号がランダムノイズである場合、混合により試料が変化してしまった可能性が考えられる。後者の可能性が排除できる一般的な分析の場合、回帰関数からの誤差はノイズ信号を検知する指標となる。
【0035】
(4)試料間の関連付けを利用して、アライメントミスを低減できる。
【0036】
試料間の定量的な差異を比較したい場合、一般的には、特定物質のパラメータを基に同定を行なう。例えば、LC−MSの場合は、溶出時間とm/z値を拠り所として同定、アライメントを行なう。しかしオミクスのような多成分一斉分析の場合、そのような既存のパラメータだけでは確実に同定、アライメントを行なうのは困難な場合が多く、問題となっている。そこで、回帰関数からの誤差指標を捕捉的パラメータとして用いると、同定、アライメント精度が格段に向上する。LC−MSの場合は、溶出時間、m/z値に加えて、回帰関数からの誤差が大きいデータはノイズが大きいと判断して除外し、回帰関数からの誤差が小さくなるような信号ペアを探索することで解決できる。
【0037】
(5)トレンド(trend)を指標とすることで、質量分析においては同位体や生成イオンのピークを発見できる(請求項3)。
【0038】
質量分析データにおいては、同一組成式の物体でも同位体(13Cや34S等)含有量に応じて複数の信号が検出される。又、イオン化過程において、多価イオン生成、フラグメント化、アダクト、多量体化等の生成イオンが生じ、信号数を増加させる。このうち、フラグメント化は理論的に予測することが困難である。又、生成イオンの生成の組合せは非常に多く、その予測を困難にさせている。混合試料のトレンドは、その試料ペアにおいては成分固有の値であり、生成イオンのトレンドは、親イオンのトレンドと等しいことが期待できる。そこで、トレンドを指標としてイオンの親子関係を予測することが可能である。例えばLC−MSの場合、同質溶出期間で同一トレンドである信号は、生成イオンの関係にあることが判別できる。
【0039】
(6)比較を行ないたい定量データ群を多変量解析する際の論理的指標を与える。
【0040】
多成分の一斉分析等によって得られた多変量データから統計的手法を用いて多変量解析(例えば主成分分析)を行なう場合、試料群間の差異を評価する基準は曖昧であることが多く、判断の根拠に乏しい。例えば、群を分ける判別分析を行なう場合、各群の分散を最小とし、群間距離を最大とする判別関数の法線ベクトルが求められるが、切片が決定されないので境界線を求めることができない。そこで、一般に全データの重心を通る直線を採用するが、各群のデータ数や分散が異なる場合には適用できない。これに対して、本発明による測定試料ペアの混合物に関する定量データ群を用いることにより、図3に例示する如く、より合理的な判別関数を求めることができる。即ち、混合試料データ群の重心を採用することで、判別関数の切片に関する根拠を与えることができる。
【0041】
(7)定量データ群を用いて統計解析する際の尺度の確認や信頼性を考慮した前処理を行なえる。
【0042】
各統計手法には、対象となるデータの定量値の尺度が決められているため、統計解析を行なう際には、必ずデータの尺度(間隔尺度や順序尺度)を確認しておく必要がある。定量性を把握していないデータには、本来なら統計処理を行なうことができない。しかし、回帰関数からの誤差が小さいと、少なくとも間隔尺度以上の尺度を保証することができる。又、回帰関数からの誤差指標を基にして、定量データ群における各数値に信頼性の重みを与えることができる。通常は、定量性の良し悪しが混ざったデータでも、それぞれのデータに対して重みは等しいままで検定する。しかし、本発明では回帰関数からの誤差指標から定量性の良し悪しが判断できるため、回帰関数からの誤差指標が小さいものほど重みを大きくする調整を施すことで、定量性の良いデータほど有意義に適用した検定を行なうことができる。
【0043】
今、w1,w2,…,wl,…,wmは、それぞれ、混合するペアに対する重みとする。
【数1】

【0044】
これを用いて、回帰関数からの誤差指標(RSE等)を考慮した以下のような重み付きt統計量を考えることができる。
【数2】

ただし、Ux、Uyはそれぞれ各群の不偏分散である。
【0045】
又、w1=w2=…=wm=1/mの時は、従来のスチューデントのt統計量となる。
【0046】
(8)2つの定量値に違いがあることに根拠を与えることができる。
【0047】
2つの定量値を比較する際、差や比のような指標を用いるが、違いがあることを決定するためには、それぞれの指標に閾値を設定する必要があり、通常、それらの閾値には論理的な根拠を与えることはできない。しかし、混合した試料を用いることで、それぞれの定量値が持ち得る誤差範囲を推測することができる。各定量値の誤差範囲を基に、違いが無い、即ち傾きがゼロである結果が起こる事象の確率が非常に小さいことを確認することができれば、各定量値には違いがあることを、根拠を与えつつ示すことができる。
【0048】
以上の特性を利用することにより、特にオミクスのような多成分一斉分析データによる解析において、データ取得手法の設計からデータ処理、高次統計解析までのプロセスの効率化、高精度化を実現し、又、各過程の論理的整合性を与えることができる。
【0049】
これまでの手法と本発明を比較して表1に示す。
【0050】
【表1】

【図面の簡単な説明】
【0051】
【図1】分析機器で解析したデータに含まれているノイズ信号の例を示す図
【図2】本発明により定量的信頼性を低下させる過程を同定している様子を示す図
【図3】本発明により定量データ群を多変量解析する際の論理的指標を与えている例を示す図
【図4】本発明の第1実施形態の試料混合方法を示す図
【図5】同じく棄却領域を示す図
【図6】本発明の第2実施形態の試料混合方法を示す図
【図7】同じく測定値相対誤差(RSE)の定義を示す図
【図8】本発明の第3実施形態の試料調製方法を示す図
【図9】同じく第4実施形態の試料調製方法を示す図
【図10】本発明の実施例による高脂血症患者の血清リポタンパク質データの分析結果を示す図
【図11】同じくイオン性標準物質混合物の一斉分析結果を示す図
【図12】同じくマウス肝臓抽出物のキャピラリ電気泳動質量分析データを示す図
【図13】同じく一般定量性評価基準を用いた一斉分析結果を示す図
【発明を実施するための形態】
【0052】
以下図面を参照して、本発明の実施形態を詳細に説明する。
【0053】
本発明は、混合試料による定量性評価基準という理論を元に構成されている。更に定量性評価基準は、その混合率の扱いにより、一般定量性評価基準、特殊定量性評価基準、拡張特殊定量性評価基準に分類される。
【0054】
以下、一般定量性評価基準を利用した、本発明の第1実施形態について説明する。
【0055】
DNAマイクロアレイ等、検量技術を用いない測定法においては、そのデータの信頼度を保証することができず、本来なら起こりえない測定値であっても、その後のデータ解析に用いてしまう。本発明によると、そのような信頼できない測定値を排除するための指標を得ることができる。測定対象の2試料を、指定した比率で混合した試料を用意することで求められ、それらの測定値の棄却領域を利用する。
【0056】
まず、測定対象である試料を、図4に示す如く、ある比率(p:1−p,q:1−q)(ここで混合比率p≠0.5、q≠0.5)で混合した試料を2つ用意する。試料Aにおける特定成分iの測定事象強度(信号強度など)をa、試料Bにおける強度をbiとする。これらの強度は、ある関数f(x)で表される関係(検量線;一般に一次関数)を有すると仮定すると、それらの混合によって生じた試料(試料C、試料D)における成分iの強度は、それぞれ次式で求められる。
f(c)=f(a)p+f(b)(1−p) …(3)
f(d)=f(a)q+f(b)(1−q) …(4)
【0057】
式(3)及び(4)より、aおよびbは、次式で求められる。
f(a)={f(d)(1−p)−f(d)(1−q)}/(q−p)…(5)
f(b)={f(c)q−f(d)p}/(q−p) …(6)
【0058】
各強度はゼロもしくは正の実数(a≧0、b≧0)なので、式(5)及び(6)を変形すると、次式が得られる。
f(c)(1−q)/(1−p)≦f(d)≦f(c)q/p …(7)
【0059】
即ち、c、dの棄却範囲は、次式のとおりである。
f(d)<f(c)(1−q)/(1−p),
f(c)q/p<f(d) …(8)
【0060】
即ち、c及びdが、この条件を満たさない関係である場合、それらの値は信頼できないものとして棄却することができる。又、混合比率パラメータp、qを、それぞれ0<p<0.5、0<q<0.5の範囲で調整することで、図5に示す如く、棄却領域の調整が可能である。例えばp=0.4として、f(c)/f(d)が3/2倍以上及び2/3倍以下のデータを棄却することができる。
【0061】
なお、p=0の場合、
【数3】

であり、c及びdはゼロもしくは正の実数すべての値をとり得るため、棄却領域を定義できない。
【0062】
又、試料CとDが逆の比率で作成され、混合比率pとqの和が1、即ちq=1−pの場合は、(4)〜(9)式は、次式のようになる。
f(d)=f(a)(1−p)+f(b)p …(4´)
f(a)={f(d)(1−p)−f(d)p}/(1−2p)…(5´)
f(b)={f(c)(1−p)−f(d)p}/(1−2p)…(6´)
f(c)p/(1−p)≦f(d)≦f(c)(1−p)/p …(7´)
f(d)<f(c)p/(1−p),
{f(c)(1−p)}/p<f(d) …(8´)
【数4】

【0063】
次に、特殊定量性評価基準を利用した本発明の第2実施形態について説明する。
【0064】
第1実施形態で利用した一般定量性評価基準において、もう一方の特異点p=0.5のときは、試料A及びBを等量混合することによりc及びdは等しくなり、a及びbを算出できないことは自明である。そこで、測定値を得たい試料の成分iに関する定量データa及びbを測定し、更に、図6に示す如く、測定試料を等量ずつ混合した試料の成分iのデータblendを測定する。
【0065】
ここで、次式が成立する。
【数5】

【0066】
従って、混合元のどちらかの試料成分iの濃度がゼロであったとしても、混合試料には必ずiの信号が存在し、測定する事象強度は、必ず混合元試料における強度の平均となる。これらの3変数と予測される関係式(一般に一次関数)との整合性を評価することで、測定値相対誤差(RSE)を定義する。
【0067】
ここでは、図7に例示する如く、3変数が最も一般的である回帰直線(一次関数)に当てはまる場合について述べる。直線の判定は、回帰で作成しモデル直線に対する誤差を指標として利用する。ここでは、モデルからの相対誤差(RSE:Relative Standard Error)を採用し、RSEは次の式で算出する例について述べる。
【数6】

【0068】
ここでは、nは直線モデルを作成するときのポイント数(n=3)を示し、即ちx、yの要素数である。xには平均関係を示す任意の数値(x3がx1、x2の平均であればよい)、yが各試料の測定値を示す。RSEは、ゼロに近いほど理想的な直線に近いことを示す。トレンド(trend)はこの回帰直線の傾きをyの平均値との比で正規化したものにあたる。又、最終的なa及びbは、ここで得られた回帰直線から得るのが正しい。又、a及びbのいずれかがゼロであった場合、a及びb比を算出することができなくなるが、回帰直線から求める場合、多くはゼロにならないので、この問題も回避できる。
【0069】
次に、拡張特殊定量性評価基準を利用した本発明の第3、第4実施形態について説明する。
【0070】
特殊定量性評価基準は、3以上の試料を混合する場合にも拡張して適用できる。図8は、試料数が4以上の偶数の場合の第3実施形態、図9は、試料数が3以上の奇数の場合の第4実施形態である(試料数が2の場合が第2実施形態で利用した特殊定量性評価基準である)。
【0071】
試料数が4以上の偶数の場合、図8に示す如く、半数の試料1〜nの測定値Z〜Zの平均を前記測定値yとし、残りの半数の試料(n+1)〜2nの測定値Zn+1〜Z2nの平均を前記測定値yとし、全試料を混合した試料Blendの測定値Z2n+1を前記測定値yとして、相対誤差(RSE2n,i)は次の式で求められる。
【数7】

ここで、混合した試料中の成分iの強度はZ2n+1である。
【0072】
一方、試料数が3以上の奇数の場合は、図9に示す如く、略半数より1つ多い試料1〜(n+1)の測定値Z〜Zn+1の平均を前記測定値yとし、残りの略半数より1つ少ない試料(n+2)〜(2n+1)と全試料を混合した試料Blendの測定値Zn+2〜Z2n+1、Z2n+2の平均を前記測定値yとし、全試料を混合した試料Blendの測定値Z2n+2を前記測定値yとして、相対誤差(RSE2+1n,i)は次の式で求められる。
【数8】

【実施例】
【0073】
実施例1.高脂血症患者の血清リポタンパク質データ
定量性を確認し難い実験の例として、ゲル電気泳動によるタンパク質の定量を検討した。一般に、ゲル電気泳動によってタンパク質量を定量的に比較する際、タンパク質を染色したゲルの写真から信号強度を読み取り、信号面積を比較する。しかし、ゲル電気泳動は分離能が低く、バンドの分離が悪い場合、定量は研究者の感覚に依存することが多い。又、標準タンパク質が得られていない場合が多く、標準添加法どころか、標準物質による厳密な検量線も作成し難い。そこで、定量性評価基準をタンパク質のゲル電気泳動に適用し、定量的信頼性を検討した。
【0074】
具体的には、ヒト健常者及び投薬治療中のII型高脂血症患者血清リポタンパク質を、ポリアクリルアミドゲルディスク電気泳動(リポフォー)によって分析した。ゲルのバンド強度をソフトウェアにて検出し、各リポタンパク質に相当する信号ピークの面積値を算出した。
【0075】
結果を図10に示す。高脂血症患者は、悪玉コレステロールである血清VLDLの上昇とIDLの出現が特徴的であり、特にIDLの出現は重篤度を反映するとされる。治療中の高脂血症患者では、健常者に比べVLDLの低下、IDLの上昇、HDLの低下が見られた。HDLはわずかな差であるが、RSEを勘案すると、その差は信頼性が高いことがわかる。VLDLは定量的信頼性も高く、有意に低下していることから、投薬による効果が良く現れていることがわかる。しかし、IDLのmidbandがLDL信号ピークの肩のよ
うに見えている。この肩の部分を、定量性評価基準を用いて定量すると、ある程度の定量的信頼性が得られることから、IDLの存在は確定的であり、更に治療を続ける必要があることがわかる。このように、存在が見極め難い信号ピークの肩などを定量的指標を元に評価することで、信頼性の高いデータを提供することができる。
【0076】
実施例2.イオン性標準物質混合物の一斉分析
特殊定量性評価基準の機能を評価するため、理想的な系として標準化合物の混合溶液を用いて分離分析を行い、データ処理を行った。
【0077】
具体的には、20μM及び100μMの濃度に調製した47種類のイオン性化合物を含む混合溶液を準備し、両者を混合した試料と各々の溶液をキャピラリ電気泳動−飛行時間型質量分析計(CE−TOFMS)により分離分析した。得られた信号は、以下の手順で解析した。
データ取得 → 信号ピーク検出 → STEP1→ STEP2
【0078】
なお、STEP1では試料溶液中の各成分をアライメントし、RSEの計算によりランダムノイズ成分を排除した(RSE=0.2以下を排除)。又、STEP2においては、トレンド値を計算し、生成イオンの排除を行った。
【0079】
結果を図11に示す。CE−TOFMS分析によって得られた生データでは、20μMの溶液で867信号、100μMの溶液で1,665信号を検出した。ここでは、移動時間補正などの目的で4種類の内部標準物質を添加しているので、合計51成分が含まれている。つまり、平均1成分あたり17乃至33信号が得られた計算となる。ここからSTEP1の操作を行い、ランダムノイズを排除したところ、20μMの溶液で292信号、100μMの溶液で379信号にまで低減した。更にSTEP2を実施し、生成イオン由来の信号を排除したところ、最終的に20μM、100μM溶液ともに88信号となった。この最終信号には、溶液に含まれている51成分の他に、37成分の信号が含まれており、これらは標準試薬に含まれている不純物由来であった。本測定における標準物質のRSEはMethionineの最大0.063であり、低濃度においてのMethionineの不安定さが影響したと考えられた。又、トレンド値は理論上1.33となるが、多くの物質で、これに近い値が得られた。極端に低いRSEを示した物質は、Spermine(trend=1.02)、Spermidine(trend=1.28)及びUracil(trend=1.10)であった。Spermine及びSpermidineは泳動時間が短く、金属イオンの信号と重なることからイオンサプレッションの影響を受けていることが判明した。又、Uracilは逆に泳動時間が長く、中性もしくは陰イオン性物質の信号と重なり、イオンサプレッションの影響を受けたと考えられた。以上の結果から、定量性評価基準による定量的信頼性指標は、それを低下させる原因と良く一致し、又、ランダムノイズや生成イオン排除に有効であることが示された。
【0080】
実施例3.マウス肝臓抽出物のキャピラリ電気泳動−質量分析データ
生体由来の試料に定量性評価基準を適用し、標準溶液だけでなく、実際の試料でも有効に活用できるかどうかを検討した。実際には、マウス肝臓抽出物の一斉成分分析を行い、実施例1と同様にデータ処理を実施した。
【0081】
具体的には、緩衝液で全身灌流を施した(血液成分の影響の無い)マウスと、施さなかった(血液成分の影響が有る)マウスを3個体ずつ準備し、肝臓組織を採取して抽出物を調製した。CE−TOFMSによる測定の直前に両試料を等量混合し、各試料と混合試料を分離分析した。混合は、灌流マウスと非灌流マウスのペアで行った。
【0082】
結果を図12に示す。CE−TOFMS分析によって得られた生データでは、各ペアで8,354信号、7,471信号、6,762信号を検出した。ここからSTEP1の操作を行い、ランダムノイズを排除したところ、各々1,917信号、1,641信号、1,778信号となった。更にSTEP2を実施し、生成イオン由来の信号を排除したところ、各々506信号、430信号、474信号となった。これらの最終信号を再度アライメントしてデータを統合したところ、818信号となり、全6試料で信号が検出されたものが26%、4試料で検出されたものが20%、2試料のみで検出されたものが54%であった。2試料のみで信号が得られた物質信号は信頼性が低いため、これらを排除して物質同定を行ったところ、出願人(HMT)のデータベースで同定された物質は17%、京都遺伝子ゲノム百科事典KEGG(Kyoto Encyclopedia of Genes Genomes)で物質名が予測されたものは34%、同定されなかったものは49%であった。この成績は、通常の手動ピーク処理の結果とほぼ同等であり、定量性評価基準によるデータ処理の性能は高いことが示された。又、定量性評価基準によるデータ処理に要した時間は、Excel(登録商標)ベースのプログラムを通常のデスクトップコンピュータを用いて行った場合で数分であった。これまでの手動ピーク処理では2週間以上の時間を要していたことから、本発明は作業の時間短縮並びに正確性の向上、信号選択の合理的説明をもたらすことが明らかとなった。
【0083】
実施例4.一般定量性評価基準を用いた一斉分析
一般定量性評価基準の機能を評価するため、健常と高脂血症のウサギの2種の血漿サンプルの混合溶液を用いて分離分析を行ない、データ処理を行なった。混合比率は0.45:0.55(p=0.45)とした。
【0084】
具体的には、2種類の血漿サンプル(試料A、試料B)を前処理した後、それぞれのサンプルを0.45:0.55の比率で混合した試料Cと、0.55:0.45の比率で混合した試料Dを用意し、CE−MSを用いて測定した。
データ取得 → 信号ピーク検出 → STEP1 → STEP2
【0085】
なお、STEP1では試料溶液中の各成分をアライメントし、棄却域の計算によりランダムノイズ成分を排除した。p=0.45の場合の特定成分iにおける棄却域は、f(d)<(9/11)f(c),(11/9)f(c)<f(d)となる。ここで関数fは、原点を通る一次式であると仮定すると、各信号の棄却域はd<(9/11)c,(11/9)c<dである。STEP2においては、トレンド値を計算し、生成イオンの排除を行なった。
【0086】
結果を図13に示す。CE−TOFMS分析によって得られた生データでは、試料Cで4,569信号、試料Dで4,910信号を検出した。ここからSTEP1の操作を行ない、ランダムノイズを排除したところ、試料C、試料D共に1,501信号となった。どちらの試料もSTEP1においてデータサイズが1/3以下になったことから、各測定データのノイズ含有率の高さが伺える。又、STEP2では試料Cと試料Dの信号強度から傾きを算出し(この場合、単純な信号強度の比でも良い)、傾きが近いものを生成イオンとして排除した。その結果、最終的には各試料において412信号が得られた。試料A、試料Bにおける各特定成分iの信号強度は、以下のように算出する。
=(−9/2)c+(11/2)d …(14)
=(11/2)c−(9/2)d …(15)
【0087】
これらの作業は自動化が簡単であり、手作業によるノイズ除去よりも、はるかに工数を減らして実現することが可能である。
【産業上の利用可能性】
【0088】
本発明は、上記実施例で示した物の他、多数の化学物質を含む試料を定量解析する方法、メタボロミクス、トランスクリプトミクス(DNAチップ及びマイクロアレイ及びDNAシーケンサ)、プロテオミクス、ゲノミクス、キャピラリ電気泳動(CE)、液体クロマトグラフィ(LC)、ガスクロマトグラフィ(GC)、吸光光度分析(ダイオードアレイ)、蛍光強度分析、質量分析(MS)、NMR、一次元及び二次元ゲル電気泳動(ウエスタンブロッティング法、サザンブロッティング法、ノーザンブロッティング法を含む)、リアルタイムPCR、酵素法による物質定量、その他全ての定量分析手法、試料が混合できる場合における定量データ一般(化学分析に限定されない)に適用可能である。
【符号の説明】
【0089】
A、B…試料
Blend、C、D…混合試料

【特許請求の範囲】
【請求項1】
測定対象である2つの試料A、Bを等量ずつ混合した混合試料Blendを作成し、各試料A、Bの成分iに関する定量データa及びbを測定して測定値y、yとし、前記混合試料Blendの成分iに関する定量データblendを測定して測定値yとし、これらの3変数y、y、yと予測される検量線の関係式との整合性を評価することで、誤差指標を求めることを特徴とする測定データの取得・評価方法。
【請求項2】
前記関係式を変数y、y、yを用いて作成した回帰関数とし、変数y、y、yからのずれである測定値相対誤差を前記誤差指標とすることを特徴とする請求項1に記載の測定データの取得・評価方法。
【請求項3】
前記回帰直線の傾きを測定値の平均値との比で正規化したトレンドを求め、該トレンドを指標としてイオンの生成イオンを予測することを特徴とする請求項2に記載の測定データの取得・評価方法。
【請求項4】
試料数が4以上の偶数の場合、半数の試料1〜nの測定値Z〜Zの平均を前記測定値yとし、残りの半数の試料(n+1)〜2nの測定値Zn+1〜Z2nの平均を前記測定値yとし、全試料を混合した試料の測定値Z2n+1を前記測定値yとすることを特徴とする請求項1乃至3のいずれかに記載の測定データの取得・評価方法。
【請求項5】
試料数が3以上の奇数の場合、略半数より1つ多い試料1〜(n+1)の測定値Z〜Zn+1の平均を前記測定値yとし、残りの略半数より1つ少ない試料(n+2)〜(2n+1)と全試料を混合した試料の測定値Zn+2〜Z2n+1、Z2n+2の平均を前記測定値yとし、全試料を混合した試料の測定値Z2n+2を前記測定値yとすることを特徴とする請求項1乃至3のいずれかに記載の測定データの取得・評価方法。
【請求項6】
測定対象である2つの試料A、Bを、所定の比率p:(1−p)(混合比率p≠0.5)で混合した第1の混合試料Cと、所定の比率q:(1−q)(混合比率q≠0.5)で混合した第2の混合試料Dを作成し、第1の混合試料Cの成分iに関する定量データcの検量線の値f(c)と、第2の混合試料Dの成分iに関する定量データdの検量線の値f(d)が、次式
f(c)(1−q)/(1−p)≦f(d)≦f(c)q/p
の関係を満足しない時、そのデータcとdを棄却することを特徴とする測定データの取得・評価方法。
【請求項7】
前記混合比率p、qを、それぞれ0<p<0.5、0<q<0.5の範囲で調整することで、棄却領域を調整することを特徴とする請求項6に記載の測定データの取得・評価方法。
【請求項8】
前記混合比率pとqの和が1であることを特徴とする請求項6に記載の測定データの取得・評価方法。

【図1】
image rotate

【図2】
image rotate

【図7】
image rotate

【図12】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図13】
image rotate