測定データの取得・評価方法

【課題】データの定量信頼性を付与し、その指標を用いて不要なピークを効率的に排除すると共に、統計解析への適用、メタアナリシスへの応用を可能とする。
【解決手段】測定対象である２つの試料Ａ、Ｂを等量ずつ混合した混合試料Ｂｌｅｎｄを作成し、各試料Ａ、Ｂの成分ｉに関する定量データａ_ｉ及びｂ_ｉを測定して測定値ｙ_１、ｙ_２とし、前記混合試料Ｂｌｅｎｄの成分ｉに関する定量データｂｌｅｎｄ_ｉを測定して測定値ｙ_３とし、これらの３変数ｙ_１、ｙ_２、ｙ_３と予測される検量線の関係式との整合性を評価することで、誤差指標を求める。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、測定データの取得・評価方法に係り、例えば、キャピラリ電気泳動（ＣＥ）−質量分析（ＭＳ）による細胞の全代謝物のメタボローム測定等に用いるのに好適な、定量的データに信頼性の指標を与えることが可能な測定データの取得・評価方法に関する。
【背景技術】
【０００２】
試料中の成分（例えば血液・脳髄液・尿・汗・涙・臓器・組織・培養細胞および培地などの試料から抽出した成分を含む溶液でなる生体試料から抽出した代謝物の混合溶液）を定量分析するとき、一般に次の手順で操作を行なう。
元試料の準備→目的物質の抽出→（検出可能な形式に変換）→検出→データ処理
【０００３】
ここで、「検出可能な形式に変換」するということは、誘導体化、酵素反応、分離操作等を意味する。これらの各手順は誤差を含んでいるため、最終的に得られる数値は、それらの誤差が積み重なったものとなる。
【０００４】
現在の分析フローでは、これらの手順の定量的信頼性を評価するには、標準物質を添加して検量線を作成する手法を用いるのが一般的である（非特許文献１）。しかし、操作が煩雑である上に、実際の試料ではマトリクス効果が排除できない場合や、標準物質が入手困難な場合（未同定物質である場合を含む）は適用できない。又、試料自体を希釈して測定することもあるが、マトリクス効果が変化するので、実質的な意味を持たない。
【０００５】
マトリクス効果を排除する方法として、これまでに、内部標準法（測定対象と同等なマトリクス効果が期待される内部標準物質の添加による相殺）が用いられている（非特許文献１）。しかし、少数の内部標準物質で全信号のマトリクス効果を予測することはできないため、特に多成分一斉分析データによる解析を行うオミクスでは実用的ではない。
【０００６】
他に、いくつかの濃度の標準物質を試料に添加し、外挿法により求める標準物質添加法が用いられる。しかし、この手法は、標準物質が入手困難な場合（未同定物質である場合を含む）は適用できない。又、質量分析においては生成イオンの発生率によって親イオンの信号強度が影響を受けるため、試料間で定量的信頼性の低下が起きているかどうか判断できない。
【０００７】
一方、分析機器（例えば質量分析装置）にて解析したデータには、図１に例示するように、質量分析の際に生じるランダムノイズ・スパイクノイズ・リンギングノイズなどを含む多くのノイズ信号が含まれている。試料間の差異を調べる際には、化合物のピークを正しく対応付けることが求められるが、膨大なノイズを含んだデータでは、正確にそれらを対応付けるのに、多大な労力を必要とする。しかし、十分に効率的なノイズ除去方法は、これまでに考案されていなかった（非特許文献２〜４）。
【０００８】
例えば、ベースラインのスムージングを行なうことでノイズピークを低減させる手法が、多くのデータ処理ソフトに採用されている。しかし、小ピークがフラットになる、大きなノイズが排除できない、データ自体が変わってしまうという問題がある。
【０００９】
又、試料を含まないブランククロマトグラムを平滑化処理し、オリジナル試料データから減算するブランクサブトラクション法も提案されている（特許文献１）。しかし、大きなノイズや試料由来のノイズを排除できないという問題がある。
【００１０】
又、Ｓ／Ｎ比を指標として閾値を設定し、それ以下の装置のものをノイズとして排除するＳ／Ｎ比によるカットオフ手法も一般的に用いられているが、データ全てを単一の閾値で評価するため、ノイズ排除性能は低い。又、閾値設定の根拠に乏しい場合が多い。
【００１１】
又、一般にノイズ信号は強度が低いため、信号強度に閾値を設定し、それ以下のものを削除する信号強度閾値によるカットオフ手法もあるが、強度は低いが必要である信号も排除されてしまうため、ノイズ排除性能は低く設定される（非特許文献５、特許文献２）。又、閾値設定の根拠に乏しい場合が多い。
【００１２】
又、試料間で共通に検出された物質由来信号ピークを、ある基準（ＣＥの場合は泳動時間、ＬＣ（液体クロマトグラフ）やＧＣ（ガスクロマトグラフ）の場合は溶出時間、ＭＳの場合はｍ／ｚ、吸光光度計の場合は吸収波長、蛍光分析の場合は励起波長と発光波長）を指標として関連付ける（並列化する）アライメント手法に関して、測定データ間のアライメント精度向上とノイズ除去に関する技術として、繰り返し測定が良く利用されている。これは、同一試料を複数回測定し、共通で検出された信号ピークを残し、その他はノイズとして処理する手法である（非特許文献６〜８）。この手法は、ノイズ排除性能は高いが、測定回数が大幅に増えることや、質量分析の際に生じる多価イオン、多量体イオン、金属付加イオン、フラグメントイオン等を含む親イオン由来の一連のイオン群である生成イオンを排除できない等の問題点を有する。又、溶出時間や泳動時間を非線形関数を用いて補正し、アライメント精度を上げる手法が提案されている（非特許文献９）。しかし、得られる信号数が多い場合、溶出時間もしくは泳動時間が極めて近い値をとる信号を判別することができないため、アライメントの精度は低くなる。
【００１３】
又、過去に測定したデータを蓄積してライブラリ化しておき、測定毎にそれらのデータを比較してノイズを排除するリファレンスライブラリによるピーク選抜方法も提案されている（非特許文献１０、特許文献２〜４）。この手法は実践的ではあるが、プラットホームの違いに対応できず、作り直しが必要な点や、確率的な判断を介することから基準に曖昧さがあるという問題点を有する。
【００１４】
又、生成イオンの除去に関して、生成イオンは、金属イオン（Ｎａ^＋、Ｋ^＋、Ｍｇ^２＋、Ｍｎ^２＋等）付加体や、いくつかの既知フラグメントイオン（蟻酸脱離、水脱離、アンモニア脱離等）については、ｍ／ｚが計算できるため、発見は容易である。しかし、その化合物及び分析手法特有のフラグメントや付加体（開裂分離や特定不純物付加等）は予測不可能であるという問題点を有する。
【００１５】
又、材料の混合に関して、２次元電気泳動を用いたプロテオミクスでは、測定する試料を全て等量ずつ混合したものを準備し、その混合試料の信号強度を基準として他の試料の信号を相対定量する手法が用いられている（非特許文献１１）。しかし、測定データの信頼性やノイズ除去に、この値を用いているのではなく、あくまでもゲル間の標準化を行なうのが目的であった。
【先行技術文献】
【特許文献】
【００１６】
【特許文献１】特開平１０−３３９７２７号公報
【特許文献２】特開２００５−５５３７０号公報
【特許文献３】特開２０００−１３１２８４号公報
【特許文献４】特表２００７−５７５６４４号公報
【非特許文献】
【００１７】
【非特許文献１】日本分析化学会九州支部編機器分析入門改訂第3 版南江堂
【非特許文献２】松田史生, 及川彰, 草野都, 菊地淳, 斉藤和季. メタボローム解析技術の現状と展望. 2. データ処理技術. 化学と生物45:834-842, 2007.
【非特許文献３】大橋由明. メタボロミクスを上手に利用する. バイオサイエンスとインダストリー 65:8-13, 2007
【非特許文献４】Fiehn, O., Wohlgemuth, G., Scholz, M., Kind, T., Lee, D.-Y.,Lu, Y., Moon, S., and Nikolau, B. Quality control for plant metabolomics: reporting MSI-compliant studies. Plant J. 53:691-704, 2008.
【非特許文献５】Morohashi, M., Shimizu, K., Ohashi, Y., Abe, J., Mori, H., Tomita, M., and Soga, T. P-BOSS: a new filtering method for treasure hunting in metabolomics. J. Chromatogr. A. 1159(1-2):142-148, 2007.
【非特許文献６】Jonsson, P., Johansson, A. I., Gullberg, J., Trygg, J., A, J., Grung, B., Marklund, S. L., Sjostrom, M., Antti, H., and Moritz, T. High-throughput data analysis for detecting and identifying differences between samples in GC/MS-based metabolomics analyses.Anal. Chem. 77:5635-5642, 2005.
【非特許文献７】Jonsson, P., Gullberg, J., Nordstrom, A., Kusano, M., Kowalczyk, M., Sjotrom, M., and Moritz, T. A strategy for identifying differences in large series of metabolomics samples analyzed by GC/MS. Anal. Chem. 76:1738-1745,2004.
【非特許文献８】Jonsson, P., Bruce, S. J., Moritz, T., Trygg, J., Sjostrom, M., Plumb, R., Gramger, J., Maibaum, E., Nicholson, J. K., Holmes, E., and Antti, H. Extraction, interpretation and validation of information for comparing samples in metabolic LC/MS data sets. Analyst 130:701-707, 2005.
【非特許文献９】Smith, C., Want, E. J., O’Maille, G., Abagyan, R., and Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Anal. Chem. 78:779-787, 2006.
【非特許文献１０】Styczynski, M. P., Moxley, J. F., Tong, L. V., Walther, J.L., Jensen, K. L., and Stephanopoulos, G. N. Systematic identification of conserved metabolites in GC/MS data for metabolomics and biomarker discovery. Anal. Chem. 79:966-973, 2007.
【非特許文献１１】David B. Friedman et al. : Proteome analysis of human colon cancer by two-dimensional difference gel electrophoresis and mass spectrometry. Proteomics 2004.4,793-811
【発明の概要】
【発明が解決しようとする課題】
【００１８】
本発明は、前記従来の問題点を解決するべくなされたもので、データの定量信頼性を付与し、その指標を用いて不要なピークを効果的に排除すると共に、統計解析への適用、メタアナリシスへの応用が可能な測定データの取得・評価方法を提供することを課題とする。
【課題を解決するための手段】
【００１９】
本発明は、測定対象である２つの試料Ａ、Ｂを等量ずつ混合した混合試料Ｂｌｅｎｄを作成し、各試料Ａ、Ｂの成分ｉに関する定量データａ_ｉ及びｂ_ｉを測定して測定値ｙ_１、ｙ_２とし、前記混合試料Ｂｌｅｎｄの成分ｉに関する定量データｂｌｅｎｄ_ｉを測定して測定値ｙ_３とし、これらの３変数ｙ_１、ｙ_２、ｙ_３と予測される検量線の関係式との整合性を評価することで、誤差指標を求めるようにして、前記課題を解決したものである。
【００２０】
ここで、前記関係式を変数ｙ_１、ｙ_２、ｙ_３を用いて作成した回帰関数とし、変数ｙ_１、ｙ_２、ｙ_３からのずれである測定値相対誤差を前記誤差指標とすることができる。
【００２１】
又、前記回帰直線の傾きを測定値の平均値との比で正規化したトレンドを求め、該トレンドを指標としてイオンの生成イオンを予測することができる。
【００２２】
又、試料数が４以上の偶数の場合、半数の試料１〜ｎの測定値Ｚ_１〜Ｚ_ｎの平均を前記測定値ｙ_１とし、残りの半数の試料（ｎ＋１）〜２ｎの測定値Ｚ_ｎ＋１〜Ｚ_２ｎの平均を前記測定値ｙ_２とし、全試料を混合した試料の測定値Ｚ_２ｎ＋１を前記測定値ｙ_３とすることができる。
【００２３】
又、試料数が３以上の奇数の場合、略半数より１つ多い試料１〜（ｎ＋１）の測定値Ｚ_１〜Ｚ_ｎ＋１の平均を前記測定値ｙ_１とし、残りの略半数より１つ少ない試料（ｎ＋２）〜（２ｎ＋１）と全試料を混合した試料の測定値Ｚ_ｎ＋２〜Ｚ_２ｎ＋１、Ｚ_２ｎ＋２の平均を前記測定値ｙ_２とし、全試料を混合した試料の測定値Ｚ_２ｎ＋２を前記測定値ｙ_３とすることができる。
【００２４】
本発明は、又、測定対象である２つの試料Ａ、Ｂを、所定の比率ｐ：（１−ｐ）（混合比率ｐ≠０．５）で混合した第１の混合試料Ｃと、所定の比率ｑ：（１−ｑ）（混合比率ｑ≠０．５）で混合した第２の混合試料Ｄを作成し、第１の混合試料Ｃの成分ｉに関する定量データｃ_ｉの検量線の値ｆ（ｃ_ｉ）と、第２の混合試料Ｄの成分ｉに関する定量データｄ_ｉの検量線の値ｆ（ｄ_ｉ）が、次式
ｆ（ｃ_ｉ）（１−ｑ）／（１−ｐ）≦ｆ（ｄ_ｉ）≦ｆ（ｃ_ｉ）ｑ／ｐ
の関係を満足しない時、そのデータｃ_ｉとｄ_ｉを棄却することにより、前記課題を解決したものである。
【００２５】
ここで、前記混合比率ｐ、ｑを、それぞれ０＜ｐ＜０．５、０＜ｑ＜０．５の範囲で調整することで、棄却領域を調整することができる。
【００２６】
又、前記混合比率ｐとｑの和が１であるようにすることができる。
【発明の効果】
【００２７】
本発明では、比較する試料を所定の比率で混合した試料を測定することで、以下の情報を得る。
１．測定値を得たい複数試料に関する定量データ及びデータ群
２．測定試料ペアの混合物に関する定量及びデータ群
３．測定値を得たい複数試料と測定試料ペアの混合物の測定データを基にした測定誤差指標及び測定値誤差指標群
４．測定値を得たい複数試料と測定試料ペアの混合物の測定データを基にした測定値トレンド及び測定値トレンド群（請求項３の場合）
【００２８】
本発明によれば、測定値を得たい複数試料に関する定量データから、各試料中の成分定量データを得ることができる。更に、次のような問題が解決される。
【００２９】
（１）データの誤差指標を表示することで、定量的データに信頼性の指標を与えることができる。
【００３０】
２つ以上の試料の測定データが、どの程度の信頼性をもって得られたかを、測定価を得たい複数試料に関する定量データと測定試料ペアの混合物に関する定量データの直線性若しくは関数適合性を指標に評価することができる。このとき、誤差指標が、その尺度となる。誤差指標としては、定量的相対誤差（ＲＳＥ：Relative Standard Error）の他、例
えば、その二乗や誤差の和を用いることができる。ＲＳＥはゼロに近いほど誤差は小さく、定量的信頼性が高いことを示す。この指標は、純粋な標準物質が得られる場合においては、標準物質添加法（非特許文献１）でも直線性により評価できるが、測定する試料数が多く、又、標準物質が入手困難な場合は適用できない。本発明によると、分析対象の既知、未知に拘らず、測定データの信頼性を直接知ることができる。これにより、信号強度がノイズに近い場合であっても、閾値を設けることなく有意なデータを得ることができる（Ｓ／Ｎ比による閾値設定が一般的であるが、根拠に乏しい）。又、信号強度が高い場合でも、飽和現象等による信頼性の低下を感知できる。但し、この指標は、測定値を得たい複数試料の実測濃度範囲に限定される。又、請求項６の発明では、測定値の棄却域のみが決定される。
【００３１】
（２）定量分析の手順の中で、データ信頼性を低下させる過程を同定できる。
【００３２】
定量分析では、いくつかの手順を経て試料を調製し、最終的な測定データを得る。それらの手順のうち、どこに信頼性を低下させる要素があるのかは、これまで研究者の勘によって探索されてきた。本発明では、試料混合を行なう手順を変えることで、図２に例示する如く、どこで回帰関数からの誤差が低下するかを指標にし、問題の手順を発見できる。例えば、ガスクロマトグラフィのために試料を誘導体化する前後で各々試料を混合すれば、誘導体化によって、どの程度データの信頼性が低下しているかを判断できる。
【００３３】
（３）定量性の低いノイズ信号を排除できる。
【００３４】
回帰関数からの誤差指標が大きな値をとる場合、そのデータは信頼性が低いと見做される。一方で、このような場合は、その信号がランダムノイズである場合、混合により試料が変化してしまった可能性が考えられる。後者の可能性が排除できる一般的な分析の場合、回帰関数からの誤差はノイズ信号を検知する指標となる。
【００３５】
（４）試料間の関連付けを利用して、アライメントミスを低減できる。
【００３６】
試料間の定量的な差異を比較したい場合、一般的には、特定物質のパラメータを基に同定を行なう。例えば、ＬＣ−ＭＳの場合は、溶出時間とｍ／ｚ値を拠り所として同定、アライメントを行なう。しかしオミクスのような多成分一斉分析の場合、そのような既存のパラメータだけでは確実に同定、アライメントを行なうのは困難な場合が多く、問題となっている。そこで、回帰関数からの誤差指標を捕捉的パラメータとして用いると、同定、アライメント精度が格段に向上する。ＬＣ−ＭＳの場合は、溶出時間、ｍ／ｚ値に加えて、回帰関数からの誤差が大きいデータはノイズが大きいと判断して除外し、回帰関数からの誤差が小さくなるような信号ペアを探索することで解決できる。
【００３７】
（５）トレンド（ｔｒｅｎｄ）を指標とすることで、質量分析においては同位体や生成イオンのピークを発見できる（請求項３）。
【００３８】
質量分析データにおいては、同一組成式の物体でも同位体（^１３Ｃや^３４Ｓ等）含有量に応じて複数の信号が検出される。又、イオン化過程において、多価イオン生成、フラグメント化、アダクト、多量体化等の生成イオンが生じ、信号数を増加させる。このうち、フラグメント化は理論的に予測することが困難である。又、生成イオンの生成の組合せは非常に多く、その予測を困難にさせている。混合試料のトレンドは、その試料ペアにおいては成分固有の値であり、生成イオンのトレンドは、親イオンのトレンドと等しいことが期待できる。そこで、トレンドを指標としてイオンの親子関係を予測することが可能である。例えばＬＣ−ＭＳの場合、同質溶出期間で同一トレンドである信号は、生成イオンの関係にあることが判別できる。
【００３９】
（６）比較を行ないたい定量データ群を多変量解析する際の論理的指標を与える。
【００４０】
多成分の一斉分析等によって得られた多変量データから統計的手法を用いて多変量解析（例えば主成分分析）を行なう場合、試料群間の差異を評価する基準は曖昧であることが多く、判断の根拠に乏しい。例えば、群を分ける判別分析を行なう場合、各群の分散を最小とし、群間距離を最大とする判別関数の法線ベクトルが求められるが、切片が決定されないので境界線を求めることができない。そこで、一般に全データの重心を通る直線を採用するが、各群のデータ数や分散が異なる場合には適用できない。これに対して、本発明による測定試料ペアの混合物に関する定量データ群を用いることにより、図３に例示する如く、より合理的な判別関数を求めることができる。即ち、混合試料データ群の重心を採用することで、判別関数の切片に関する根拠を与えることができる。
【００４１】
（７）定量データ群を用いて統計解析する際の尺度の確認や信頼性を考慮した前処理を行なえる。
【００４２】
各統計手法には、対象となるデータの定量値の尺度が決められているため、統計解析を行なう際には、必ずデータの尺度（間隔尺度や順序尺度）を確認しておく必要がある。定量性を把握していないデータには、本来なら統計処理を行なうことができない。しかし、回帰関数からの誤差が小さいと、少なくとも間隔尺度以上の尺度を保証することができる。又、回帰関数からの誤差指標を基にして、定量データ群における各数値に信頼性の重みを与えることができる。通常は、定量性の良し悪しが混ざったデータでも、それぞれのデータに対して重みは等しいままで検定する。しかし、本発明では回帰関数からの誤差指標から定量性の良し悪しが判断できるため、回帰関数からの誤差指標が小さいものほど重みを大きくする調整を施すことで、定量性の良いデータほど有意義に適用した検定を行なうことができる。
【００４３】
今、ｗ１，ｗ２，…，ｗｌ，…，ｗｍは、それぞれ、混合するペアに対する重みとする。
【数１】

【００４４】
これを用いて、回帰関数からの誤差指標(ＲＳＥ等)を考慮した以下のような重み付きｔ統計量を考えることができる。
【数２】

ただし、Ｕｘ、Ｕｙはそれぞれ各群の不偏分散である。
【００４５】
又、ｗ１＝ｗ２＝…＝ｗｍ＝１／ｍの時は、従来のスチューデントのｔ統計量となる。
【００４６】
（８）２つの定量値に違いがあることに根拠を与えることができる。
【００４７】
２つの定量値を比較する際、差や比のような指標を用いるが、違いがあることを決定するためには、それぞれの指標に閾値を設定する必要があり、通常、それらの閾値には論理的な根拠を与えることはできない。しかし、混合した試料を用いることで、それぞれの定量値が持ち得る誤差範囲を推測することができる。各定量値の誤差範囲を基に、違いが無い、即ち傾きがゼロである結果が起こる事象の確率が非常に小さいことを確認することができれば、各定量値には違いがあることを、根拠を与えつつ示すことができる。
【００４８】
以上の特性を利用することにより、特にオミクスのような多成分一斉分析データによる解析において、データ取得手法の設計からデータ処理、高次統計解析までのプロセスの効率化、高精度化を実現し、又、各過程の論理的整合性を与えることができる。
【００４９】
これまでの手法と本発明を比較して表１に示す。
【００５０】
【表１】

【図面の簡単な説明】
【００５１】
【図１】分析機器で解析したデータに含まれているノイズ信号の例を示す図
【図２】本発明により定量的信頼性を低下させる過程を同定している様子を示す図
【図３】本発明により定量データ群を多変量解析する際の論理的指標を与えている例を示す図
【図４】本発明の第１実施形態の試料混合方法を示す図
【図５】同じく棄却領域を示す図
【図６】本発明の第２実施形態の試料混合方法を示す図
【図７】同じく測定値相対誤差（ＲＳＥ）の定義を示す図
【図８】本発明の第３実施形態の試料調製方法を示す図
【図９】同じく第４実施形態の試料調製方法を示す図
【図１０】本発明の実施例による高脂血症患者の血清リポタンパク質データの分析結果を示す図
【図１１】同じくイオン性標準物質混合物の一斉分析結果を示す図
【図１２】同じくマウス肝臓抽出物のキャピラリ電気泳動質量分析データを示す図
【図１３】同じく一般定量性評価基準を用いた一斉分析結果を示す図
【発明を実施するための形態】
【００５２】
以下図面を参照して、本発明の実施形態を詳細に説明する。
【００５３】
本発明は、混合試料による定量性評価基準という理論を元に構成されている。更に定量性評価基準は、その混合率の扱いにより、一般定量性評価基準、特殊定量性評価基準、拡張特殊定量性評価基準に分類される。
【００５４】
以下、一般定量性評価基準を利用した、本発明の第1実施形態について説明する。
【００５５】
ＤＮＡマイクロアレイ等、検量技術を用いない測定法においては、そのデータの信頼度を保証することができず、本来なら起こりえない測定値であっても、その後のデータ解析に用いてしまう。本発明によると、そのような信頼できない測定値を排除するための指標を得ることができる。測定対象の２試料を、指定した比率で混合した試料を用意することで求められ、それらの測定値の棄却領域を利用する。
【００５６】
まず、測定対象である試料を、図４に示す如く、ある比率（ｐ：１−ｐ，ｑ：１−ｑ）（ここで混合比率ｐ≠０．５、ｑ≠０．５）で混合した試料を２つ用意する。試料Ａにおける特定成分ｉの測定事象強度(信号強度など)をａ_ｉ、試料Ｂにおける強度をｂ_iとする。これらの強度は、ある関数ｆ（ｘ）で表される関係(検量線；一般に一次関数)を有すると仮定すると、それらの混合によって生じた試料(試料Ｃ、試料Ｄ)における成分ｉの強度は、それぞれ次式で求められる。
ｆ（ｃ_ｉ）＝ｆ（ａ_ｉ）ｐ＋ｆ（ｂ_ｉ）（１−ｐ） …（３）
ｆ（ｄ_ｉ）＝ｆ（ａ_ｉ）ｑ＋ｆ（ｂ_ｉ）（１−ｑ） …（４）
【００５７】
式（３）及び（４）より、ａ_ｉおよびｂ_ｉは、次式で求められる。
ｆ（ａ_ｉ）＝｛ｆ（ｄ_ｉ）（１−ｐ）−ｆ（ｄ_ｉ）（１−ｑ）｝／（ｑ−ｐ）…（５）
ｆ（ｂ_ｉ）＝｛ｆ（ｃ_ｉ）ｑ−ｆ（ｄ_ｉ）ｐ｝／（ｑ−ｐ） …（６）
【００５８】
各強度はゼロもしくは正の実数(ａ_ｉ≧０、ｂ_ｉ≧０)なので、式（５）及び（６）を変形すると、次式が得られる。
ｆ（ｃ_ｉ）（１−ｑ）／（１−ｐ）≦ｆ（ｄ_ｉ）≦ｆ（ｃ_ｉ）ｑ／ｐ …（７）
【００５９】
即ち、ｃ_ｉ、ｄ_ｉの棄却範囲は、次式のとおりである。
ｆ（ｄ_ｉ）＜ｆ（ｃ_ｉ）（１−ｑ）／（１−ｐ），
ｆ（ｃ_ｉ）ｑ／ｐ＜ｆ（ｄ_ｉ） …（８）
【００６０】
即ち、ｃ_ｉ及びｄ_ｉが、この条件を満たさない関係である場合、それらの値は信頼できないものとして棄却することができる。又、混合比率パラメータｐ、ｑを、それぞれ０＜ｐ＜０．５、０＜ｑ＜０．５の範囲で調整することで、図５に示す如く、棄却領域の調整が可能である。例えばｐ＝０．４として、ｆ（ｃ_ｉ）／ｆ（ｄ_ｉ）が３/２倍以上及び２/３倍以下のデータを棄却することができる。
【００６１】
なお、ｐ＝０の場合、
【数３】

であり、ｃ_ｉ及びｄ_ｉはゼロもしくは正の実数すべての値をとり得るため、棄却領域を定義できない。
【００６２】
又、試料ＣとＤが逆の比率で作成され、混合比率ｐとｑの和が１、即ちｑ＝１−ｐの場合は、（４）〜（９）式は、次式のようになる。
ｆ（ｄ_ｉ）＝ｆ（ａ_ｉ）（１−ｐ）＋ｆ（ｂ_ｉ）ｐ …（４´）
ｆ（ａ_ｉ）＝｛ｆ（ｄ_ｉ）（１−ｐ）−ｆ（ｄ_ｉ）ｐ｝／（１−２ｐ）…（５´）
ｆ（ｂ_ｉ）＝｛ｆ（ｃ_ｉ）（１−ｐ）−ｆ（ｄ_ｉ）ｐ｝／（１−２ｐ）…（６´）
ｆ（ｃ_ｉ）ｐ／（１−ｐ）≦ｆ（ｄ_ｉ）≦ｆ（ｃ_ｉ）（１−ｐ）／ｐ …（７´）
ｆ（ｄ_ｉ）＜ｆ（ｃ_ｉ）ｐ／（１−ｐ），
｛ｆ（ｃ_ｉ）（１−ｐ）｝／ｐ＜ｆ（ｄ_ｉ） …（８´）
【数４】

【００６３】
次に、特殊定量性評価基準を利用した本発明の第２実施形態について説明する。
【００６４】
第１実施形態で利用した一般定量性評価基準において、もう一方の特異点ｐ＝０．５のときは、試料Ａ及びＢを等量混合することによりｃ_ｉ及びｄ_ｉは等しくなり、ａ_ｉ及びｂ_ｉを算出できないことは自明である。そこで、測定値を得たい試料の成分ｉに関する定量データａ_ｉ及びｂ_ｉを測定し、更に、図６に示す如く、測定試料を等量ずつ混合した試料の成分ｉのデータｂｌｅｎｄ_ｉを測定する。
【００６５】
ここで、次式が成立する。
【数５】

【００６６】
従って、混合元のどちらかの試料成分ｉの濃度がゼロであったとしても、混合試料には必ずｉの信号が存在し、測定する事象強度は、必ず混合元試料における強度の平均となる。これらの３変数と予測される関係式（一般に一次関数）との整合性を評価することで、測定値相対誤差（ＲＳＥ）を定義する。
【００６７】
ここでは、図７に例示する如く、３変数が最も一般的である回帰直線（一次関数）に当てはまる場合について述べる。直線の判定は、回帰で作成しモデル直線に対する誤差を指標として利用する。ここでは、モデルからの相対誤差（ＲＳＥ：Ｒelative Ｓtandard Ｅrror)を採用し、ＲＳＥは次の式で算出する例について述べる。
【数６】

【００６８】
ここでは、ｎは直線モデルを作成するときのポイント数（ｎ＝３）を示し、即ちｘ、ｙの要素数である。ｘには平均関係を示す任意の数値（ｘ３がｘ１、ｘ２の平均であればよい）、ｙが各試料の測定値を示す。ＲＳＥは、ゼロに近いほど理想的な直線に近いことを示す。トレンド（ｔｒｅｎｄ）はこの回帰直線の傾きをｙの平均値との比で正規化したものにあたる。又、最終的なａ_ｉ及びｂ_ｉは、ここで得られた回帰直線から得るのが正しい。又、ａ_ｉ及びｂ_ｉのいずれかがゼロであった場合、ａ_ｉ及びｂ_ｉ比を算出することができなくなるが、回帰直線から求める場合、多くはゼロにならないので、この問題も回避できる。
【００６９】
次に、拡張特殊定量性評価基準を利用した本発明の第３、第４実施形態について説明する。
【００７０】
特殊定量性評価基準は、３以上の試料を混合する場合にも拡張して適用できる。図８は、試料数が４以上の偶数の場合の第３実施形態、図９は、試料数が３以上の奇数の場合の第４実施形態である（試料数が２の場合が第２実施形態で利用した特殊定量性評価基準である)。
【００７１】
試料数が４以上の偶数の場合、図８に示す如く、半数の試料１〜ｎの測定値Ｚ_１〜Ｚ_ｎの平均を前記測定値ｙ_１とし、残りの半数の試料（ｎ＋１）〜２ｎの測定値Ｚ_ｎ＋１〜Ｚ_２ｎの平均を前記測定値ｙ_２とし、全試料を混合した試料Ｂｌｅｎｄの測定値Ｚ_２ｎ＋１を前記測定値ｙ_３として、相対誤差（ＲＳＥ_２ｎ，ｉ）は次の式で求められる。
【数７】

ここで、混合した試料中の成分ｉの強度はＺ_２ｎ＋１である。
【００７２】
一方、試料数が３以上の奇数の場合は、図９に示す如く、略半数より１つ多い試料１〜（ｎ＋１）の測定値Ｚ_１〜Ｚ_ｎ＋１の平均を前記測定値ｙ_１とし、残りの略半数より１つ少ない試料（ｎ＋２）〜（２ｎ＋１）と全試料を混合した試料Ｂｌｅｎｄの測定値Ｚ_ｎ＋２〜Ｚ_２ｎ＋１、Ｚ_２ｎ＋２の平均を前記測定値ｙ_２とし、全試料を混合した試料Ｂｌｅｎｄの測定値Ｚ_２ｎ＋２を前記測定値ｙ_３として、相対誤差（ＲＳＥ_{２＋１ｎ，ｉ}）は次の式で求められる。
【数８】

【実施例】
【００７３】
実施例１．高脂血症患者の血清リポタンパク質データ
定量性を確認し難い実験の例として、ゲル電気泳動によるタンパク質の定量を検討した。一般に、ゲル電気泳動によってタンパク質量を定量的に比較する際、タンパク質を染色したゲルの写真から信号強度を読み取り、信号面積を比較する。しかし、ゲル電気泳動は分離能が低く、バンドの分離が悪い場合、定量は研究者の感覚に依存することが多い。又、標準タンパク質が得られていない場合が多く、標準添加法どころか、標準物質による厳密な検量線も作成し難い。そこで、定量性評価基準をタンパク質のゲル電気泳動に適用し、定量的信頼性を検討した。
【００７４】
具体的には、ヒト健常者及び投薬治療中のII型高脂血症患者血清リポタンパク質を、ポリアクリルアミドゲルディスク電気泳動（リポフォー）によって分析した。ゲルのバンド強度をソフトウェアにて検出し、各リポタンパク質に相当する信号ピークの面積値を算出した。
【００７５】
結果を図１０に示す。高脂血症患者は、悪玉コレステロールである血清ＶＬＤＬの上昇とＩＤＬの出現が特徴的であり、特にＩＤＬの出現は重篤度を反映するとされる。治療中の高脂血症患者では、健常者に比べＶＬＤＬの低下、ＩＤＬの上昇、ＨＤＬの低下が見られた。ＨＤＬはわずかな差であるが、ＲＳＥを勘案すると、その差は信頼性が高いことがわかる。ＶＬＤＬは定量的信頼性も高く、有意に低下していることから、投薬による効果が良く現れていることがわかる。しかし、ＩＤＬのmidbandがＬＤＬ信号ピークの肩のよ
うに見えている。この肩の部分を、定量性評価基準を用いて定量すると、ある程度の定量的信頼性が得られることから、ＩＤＬの存在は確定的であり、更に治療を続ける必要があることがわかる。このように、存在が見極め難い信号ピークの肩などを定量的指標を元に評価することで、信頼性の高いデータを提供することができる。
【００７６】
実施例２．イオン性標準物質混合物の一斉分析
特殊定量性評価基準の機能を評価するため、理想的な系として標準化合物の混合溶液を用いて分離分析を行い、データ処理を行った。
【００７７】
具体的には、２０μＭ及び１００μＭの濃度に調製した４７種類のイオン性化合物を含む混合溶液を準備し、両者を混合した試料と各々の溶液をキャピラリ電気泳動−飛行時間型質量分析計（ＣＥ−ＴＯＦＭＳ）により分離分析した。得られた信号は、以下の手順で解析した。
データ取得 → 信号ピーク検出 → ＳＴＥＰ１→ ＳＴＥＰ２
【００７８】
なお、ＳＴＥＰ１では試料溶液中の各成分をアライメントし、ＲＳＥの計算によりランダムノイズ成分を排除した（ＲＳＥ＝０．２以下を排除）。又、ＳＴＥＰ２においては、トレンド値を計算し、生成イオンの排除を行った。
【００７９】
結果を図１１に示す。ＣＥ−ＴＯＦＭＳ分析によって得られた生データでは、２０μＭの溶液で８６７信号、１００μＭの溶液で１，６６５信号を検出した。ここでは、移動時間補正などの目的で４種類の内部標準物質を添加しているので、合計５１成分が含まれている。つまり、平均１成分あたり１７乃至３３信号が得られた計算となる。ここからＳＴＥＰ１の操作を行い、ランダムノイズを排除したところ、２０μＭの溶液で２９２信号、１００μＭの溶液で３７９信号にまで低減した。更にＳＴＥＰ２を実施し、生成イオン由来の信号を排除したところ、最終的に２０μＭ、１００μＭ溶液ともに８８信号となった。この最終信号には、溶液に含まれている５１成分の他に、３７成分の信号が含まれており、これらは標準試薬に含まれている不純物由来であった。本測定における標準物質のＲＳＥはＭethionineの最大０．０６３であり、低濃度においてのＭethionineの不安定さが影響したと考えられた。又、トレンド値は理論上１．３３となるが、多くの物質で、これに近い値が得られた。極端に低いＲＳＥを示した物質は、Ｓpermine（trend＝１．０２）、Ｓpermidine(trend＝１．２８)及びＵracil（trend＝１．１０）であった。Ｓpermine及びＳpermidineは泳動時間が短く、金属イオンの信号と重なることからイオンサプレッションの影響を受けていることが判明した。又、Ｕracilは逆に泳動時間が長く、中性もしくは陰イオン性物質の信号と重なり、イオンサプレッションの影響を受けたと考えられた。以上の結果から、定量性評価基準による定量的信頼性指標は、それを低下させる原因と良く一致し、又、ランダムノイズや生成イオン排除に有効であることが示された。
【００８０】
実施例３．マウス肝臓抽出物のキャピラリ電気泳動−質量分析データ
生体由来の試料に定量性評価基準を適用し、標準溶液だけでなく、実際の試料でも有効に活用できるかどうかを検討した。実際には、マウス肝臓抽出物の一斉成分分析を行い、実施例１と同様にデータ処理を実施した。
【００８１】
具体的には、緩衝液で全身灌流を施した（血液成分の影響の無い）マウスと、施さなかった（血液成分の影響が有る）マウスを３個体ずつ準備し、肝臓組織を採取して抽出物を調製した。ＣＥ−ＴＯＦＭＳによる測定の直前に両試料を等量混合し、各試料と混合試料を分離分析した。混合は、灌流マウスと非灌流マウスのペアで行った。
【００８２】
結果を図１２に示す。ＣＥ−ＴＯＦＭＳ分析によって得られた生データでは、各ペアで８，３５４信号、７，４７１信号、６，７６２信号を検出した。ここからＳＴＥＰ１の操作を行い、ランダムノイズを排除したところ、各々１，９１７信号、１，６４１信号、１，７７８信号となった。更にＳＴＥＰ２を実施し、生成イオン由来の信号を排除したところ、各々５０６信号、４３０信号、４７４信号となった。これらの最終信号を再度アライメントしてデータを統合したところ、８１８信号となり、全６試料で信号が検出されたものが２６％、４試料で検出されたものが２０％、２試料のみで検出されたものが５４％であった。２試料のみで信号が得られた物質信号は信頼性が低いため、これらを排除して物質同定を行ったところ、出願人（ＨＭＴ）のデータベースで同定された物質は１７％、京都遺伝子ゲノム百科事典ＫＥＧＧ（Kyoto Encyclopedia of Genes Genomes）で物質名が予測されたものは３４％、同定されなかったものは４９％であった。この成績は、通常の手動ピーク処理の結果とほぼ同等であり、定量性評価基準によるデータ処理の性能は高いことが示された。又、定量性評価基準によるデータ処理に要した時間は、Ｅxcel（登録商標）ベースのプログラムを通常のデスクトップコンピュータを用いて行った場合で数分であった。これまでの手動ピーク処理では２週間以上の時間を要していたことから、本発明は作業の時間短縮並びに正確性の向上、信号選択の合理的説明をもたらすことが明らかとなった。
【００８３】
実施例４．一般定量性評価基準を用いた一斉分析
一般定量性評価基準の機能を評価するため、健常と高脂血症のウサギの２種の血漿サンプルの混合溶液を用いて分離分析を行ない、データ処理を行なった。混合比率は０．４５：０．５５（ｐ＝０．４５）とした。
【００８４】
具体的には、２種類の血漿サンプル（試料Ａ、試料Ｂ）を前処理した後、それぞれのサンプルを０．４５：０．５５の比率で混合した試料Ｃと、０．５５：０．４５の比率で混合した試料Ｄを用意し、ＣＥ−ＭＳを用いて測定した。
データ取得 → 信号ピーク検出 → ＳＴＥＰ１ → ＳＴＥＰ２
【００８５】
なお、ＳＴＥＰ１では試料溶液中の各成分をアライメントし、棄却域の計算によりランダムノイズ成分を排除した。ｐ＝０．４５の場合の特定成分ｉにおける棄却域は、ｆ（ｄ_ｉ）＜（９／１１）ｆ（ｃ_ｉ），（１１／９）ｆ（ｃ_ｉ）＜ｆ（ｄ_ｉ）となる。ここで関数ｆは、原点を通る一次式であると仮定すると、各信号の棄却域はｄ_ｉ＜（９／１１）ｃ_ｉ，（１１／９）ｃ_ｉ＜ｄ_ｉである。ＳＴＥＰ２においては、トレンド値を計算し、生成イオンの排除を行なった。
【００８６】
結果を図１３に示す。ＣＥ−ＴＯＦＭＳ分析によって得られた生データでは、試料Ｃで４，５６９信号、試料Ｄで４，９１０信号を検出した。ここからＳＴＥＰ１の操作を行ない、ランダムノイズを排除したところ、試料Ｃ、試料Ｄ共に１，５０１信号となった。どちらの試料もＳＴＥＰ１においてデータサイズが１／３以下になったことから、各測定データのノイズ含有率の高さが伺える。又、ＳＴＥＰ２では試料Ｃと試料Ｄの信号強度から傾きを算出し（この場合、単純な信号強度の比でも良い）、傾きが近いものを生成イオンとして排除した。その結果、最終的には各試料において４１２信号が得られた。試料Ａ、試料Ｂにおける各特定成分ｉの信号強度は、以下のように算出する。
ａ_ｉ＝（−９／２）ｃ_ｉ＋（１１／２）ｄ_ｉ …（１４）
ｂ_ｉ＝（１１／２）ｃ_ｉ−（９／２）ｄ_ｉ …（１５）
【００８７】
これらの作業は自動化が簡単であり、手作業によるノイズ除去よりも、はるかに工数を減らして実現することが可能である。
【産業上の利用可能性】
【００８８】
本発明は、上記実施例で示した物の他、多数の化学物質を含む試料を定量解析する方法、メタボロミクス、トランスクリプトミクス（ＤＮＡチップ及びマイクロアレイ及びＤＮＡシーケンサ）、プロテオミクス、ゲノミクス、キャピラリ電気泳動（ＣＥ）、液体クロマトグラフィ（ＬＣ）、ガスクロマトグラフィ（ＧＣ）、吸光光度分析（ダイオードアレイ）、蛍光強度分析、質量分析（ＭＳ）、ＮＭＲ、一次元及び二次元ゲル電気泳動（ウエスタンブロッティング法、サザンブロッティング法、ノーザンブロッティング法を含む）、リアルタイムＰＣＲ、酵素法による物質定量、その他全ての定量分析手法、試料が混合できる場合における定量データ一般（化学分析に限定されない）に適用可能である。
【符号の説明】
【００８９】
Ａ、Ｂ…試料
Ｂｌｅｎｄ、Ｃ、Ｄ…混合試料

【特許請求の範囲】
【請求項１】
測定対象である２つの試料Ａ、Ｂを等量ずつ混合した混合試料Ｂｌｅｎｄを作成し、各試料Ａ、Ｂの成分ｉに関する定量データａ_ｉ及びｂ_ｉを測定して測定値ｙ_１、ｙ_２とし、前記混合試料Ｂｌｅｎｄの成分ｉに関する定量データｂｌｅｎｄ_ｉを測定して測定値ｙ_３とし、これらの３変数ｙ_１、ｙ_２、ｙ_３と予測される検量線の関係式との整合性を評価することで、誤差指標を求めることを特徴とする測定データの取得・評価方法。
【請求項２】
前記関係式を変数ｙ_１、ｙ_２、ｙ_３を用いて作成した回帰関数とし、変数ｙ_１、ｙ_２、ｙ_３からのずれである測定値相対誤差を前記誤差指標とすることを特徴とする請求項１に記載の測定データの取得・評価方法。
【請求項３】
前記回帰直線の傾きを測定値の平均値との比で正規化したトレンドを求め、該トレンドを指標としてイオンの生成イオンを予測することを特徴とする請求項２に記載の測定データの取得・評価方法。
【請求項４】
試料数が４以上の偶数の場合、半数の試料１〜ｎの測定値Ｚ_１〜Ｚ_ｎの平均を前記測定値ｙ_１とし、残りの半数の試料（ｎ＋１）〜２ｎの測定値Ｚ_ｎ＋１〜Ｚ_２ｎの平均を前記測定値ｙ_２とし、全試料を混合した試料の測定値Ｚ_２ｎ＋１を前記測定値ｙ_３とすることを特徴とする請求項１乃至３のいずれかに記載の測定データの取得・評価方法。
【請求項５】
試料数が３以上の奇数の場合、略半数より１つ多い試料１〜（ｎ＋１）の測定値Ｚ_１〜Ｚ_ｎ＋１の平均を前記測定値ｙ_１とし、残りの略半数より１つ少ない試料（ｎ＋２）〜（２ｎ＋１）と全試料を混合した試料の測定値Ｚ_ｎ＋２〜Ｚ_２ｎ＋１、Ｚ_２ｎ＋２の平均を前記測定値ｙ_２とし、全試料を混合した試料の測定値Ｚ_２ｎ＋２を前記測定値ｙ_３とすることを特徴とする請求項１乃至３のいずれかに記載の測定データの取得・評価方法。
【請求項６】
測定対象である２つの試料Ａ、Ｂを、所定の比率ｐ：（１−ｐ）（混合比率ｐ≠０．５）で混合した第１の混合試料Ｃと、所定の比率ｑ：（１−ｑ）（混合比率ｑ≠０．５）で混合した第２の混合試料Ｄを作成し、第１の混合試料Ｃの成分ｉに関する定量データｃ_ｉの検量線の値ｆ（ｃ_ｉ）と、第２の混合試料Ｄの成分ｉに関する定量データｄ_ｉの検量線の値ｆ（ｄ_ｉ）が、次式
ｆ（ｃ_ｉ）（１−ｑ）／（１−ｐ）≦ｆ（ｄ_ｉ）≦ｆ（ｃ_ｉ）ｑ／ｐ
の関係を満足しない時、そのデータｃ_ｉとｄ_ｉを棄却することを特徴とする測定データの取得・評価方法。
【請求項７】
前記混合比率ｐ、ｑを、それぞれ０＜ｐ＜０．５、０＜ｑ＜０．５の範囲で調整することで、棄却領域を調整することを特徴とする請求項６に記載の測定データの取得・評価方法。
【請求項８】
前記混合比率ｐとｑの和が１であることを特徴とする請求項６に記載の測定データの取得・評価方法。

【図１】