説明

電気泳動測定によるイオン性化合物の移動時間予測方法

【課題】マイクロチップ型電気泳動、キャピラリ電気泳動(CE)及びキャピラリ電気泳動/質量分析計(CE/MS)内の低分子化合物の移動度を予測する。
【解決手段】マイクロチップ型電気泳動、CE又はCE/MS内の移動時間が不明の物質の移動時間を予測する際に、まず、電気泳動の移動時間が既知の物質について、その構造から数値的に表現可能な特徴量を計算して、該特徴量と移動時間の関係を予測し、幾つかの物質の移動時間を電気泳動又は電気泳動/質量分析計で計測して、前記関係を学習させ、該学習させた結果を用いて、電気泳動又は電気泳動/質量分析計内の移動時間が不明の物質の構造から、その移動時間を予測する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マイクロチップ型電気泳動、キャピラリ電気泳動(CE)又はキャピラリ電気泳動(CE)と質量分析(MS)を組み合わせたキャピラリ電気泳動/質量分析計(CE/MS)等で計測されるイオン性化合物の検出時間を予測するための電気泳動測定によるイオン性化合物の移動時間予測方法に関する。
【背景技術】
【0002】
従来、マイクロチップ型電気泳動、キャピラリ電気泳動(CE)や高速液体クロマトグラフィ(HPLC)等の分離分析装置で測定されたピークは、化合物名が既知である標準物質のピークの出現時間と比較することにより、物質の同定が行なわれてきた。しかしながら、全ての化合物のうち、入手可能な標準物質は限られており、全ピークに関する物質の同定は、従来法では不可能であった。
【0003】
この問題を解決するため、コンピュータを使った方法を用いて、CEや液体クロマトグラフィ(LC)の移動や保持の原理に基づき、各物質の検出時間を予測する手法が開発されている(非特許文献1乃至6参照)。
【0004】
又、人工知能技術であるニューラル・ネットワーク(Artificial Neural Networks:ANN)を用いて移動時間や溶出時間を予測する方法も開発されている(非特許文献7乃至12参照)。
【0005】
しかしながら、いずれの場合も、物理的、化学的性質が似た少数の物質群の予測に適応したものであり、何百とある様々な種類の化合物の検出時間を同時に予測する方法は未だ存在しない。
【0006】
【特許文献1】特開2001−83119号公報
【特許文献2】特許第3341765号公報
【非特許文献1】Anal.Chem.,1998,70,173-181.
【非特許文献2】Analyst,1998,123,1487-1492.
【非特許文献3】Anal.Chem.,1999,71,687-699.
【非特許文献4】Anal.Chem.,2001,73,1324-1329.
【非特許文献5】Electrophoresis,2003,24,1596-1602
【非特許文献6】Anal.Biochem.1989,179,28-33.
【非特許文献7】J.Pharmaceutical and Biomedical Analysis 1999,21,95-103
【非特許文献8】J.Pharmaceutical and Biomedical Analysis 2002,28,581-590
【非特許文献9】Anal.Chem.2003,75,1039-1048.
【非特許文献10】J.ChromatogrA,2001,927,211-218
【非特許文献11】J.ChromatogrA,2002,971,207-215
【非特許文献12】Electrophoresis,2002,23,1815-1821
【発明の開示】
【発明が解決しようとする課題】
【0007】
電気泳動分析における各物質の移動時間を予測する方法は、以下の2種類がある。
【0008】
(1)電気移動度の原理を利用した予測法
この予測法は、電気泳動の各物質の移動度は、「物質の電荷に比例し、試料粘度と水和イオン半径に反比例する」という原理に基づいている。しかし、この予測法は、「イオンを球状と仮定する」「電気泳動緩衝液と物質間にスリップが起きない」など様々な仮定を基に考案された方法であり、実際の物質の移動時間の実測値と予想値が合わない例が多数報告されている。又、同族体などのごく少数の特定の物質群を予測する研究例しかなく、予測する式に関する数値パラメータは物資群毎に個別にチューニングしているものもあり、予めどのような種類の物質が存在するか分からない場合には使用できないという問題点がある。
【0009】
(2)ニューラル・ネットワークによる予測法
これまで、CE分析における化合物の特徴を数値的に表わす判別子の内、重回帰分析を用いて、移動度に影響の大きいと考えられるものを3個程度に絞込み、これらと物質の移動度間の関係をANNで学習する方法が使用されてきた。しかし、絞り込まれる判別子は対象とする物質群毎に異なり、この方法でも、特定の少数の物質群に関する移動度の予測しか適用することができない。
【0010】
一方近年、キャピラリ電気泳動と質量分析を組み合わせた、高感度で高選択性を有するCE/MSも開発されている(特許文献1参照)。しかしながら、このCE/MSでは、物質がキャピラリ内で移動中にキャピラリの出口に接続しているMSから引圧あるいは背圧を受けるため、CEとCE/MSで同じ予測モデルをそのまま使用することはできないという問題点を有していた。
【0011】
本発明は、前記従来の問題点を解決するべくなされたもので、CEだけでなく、これまで誰も成功していないマイクロチップ型電気泳動や、CE/MS内のあらゆる種類が混在した低分子化合物群の移動度を予測することを課題とする。
【課題を解決するための手段】
【0012】
本発明は、マイクロチップ型電気泳動、キャピラリ電気泳動又はキャピラリ電気泳動/質量分析計内の移動時間が不明の物質の移動時間を予測する際に、まず、電気泳動の移動時間が既知の物質について、その構造から数値的に表現可能な特徴量(例えば、半径、質量、イオン価数等)を計算して、該特徴量と移動時間の関係を予測し、幾つかの物質の移動時間を電気泳動又は電気泳動/質量分析計で計測して、前記関係を学習させ、該学習させた結果を用いて、電気泳動又は電気泳動/質量分析計内の移動時間が不明の物質の構造から、その移動時間を予測するようにして、前記課題を解決したものである。
【0013】
又、前記特徴量が、物質の2次元構造から予測した3次元構造から計算した、分子の特徴を示す判別子、分子の2次元構造から計算した電離指数、及び、化合物のイオン価数を含むようにしたものである。
【0014】
又、前記3次元構造が、真空内に単独で存在し他から影響の無い状態を仮定し、化合物単体でエネルギ的に最も安定な構造を取るような形状をとるようにしたものである。
【0015】
又、前記化合物のイオン価数を、次式を用いて計算するようにしたものである。
【0016】
【数2】

(ここで、iとjは酸解離指数pKaの添え字で、nは負の値に電荷を生じる物質のpKaの数、mは正の値に電荷を生じる物質のpKaの数であり、pHにはマイクロチップ型電気泳動、CE又はCE/MSで使用する泳動緩衝液のpHの値を用いる。)
【0017】
又、前記移動時間を、電気泳動又は電気泳動/質量分析計内で計測した化合物の移動時間を、内標準物質の移動時間で正規化した相対移動時間としたものである。
【0018】
又、前記関係を、入力層と隠れ層と出力層を有する3層構造のニューラル・ネットワークを用いて、例えばバック・プロパゲーション法により学習するようにしたものである。
【0019】
又、前記入力層に、化合物の判別子の値全てとイオン価数を加え、前記出力層に、化合物の相対移動時間を加えるようにしたものである。
【0020】
又、前記入力層と出力層に加える各値の最大値と最小値の差が大きく離れている場合は、対数正規化を行ない、差が小さい場合は、線形正規化を行なうようにしたものである。
【0021】
又、同じデータを多数のニューラル・ネットワークで学習させて、出力は平均値をとるようにしたものである。
【発明の効果】
【0022】
本発明によれば、どのような種類のイオン性化合物に関しても、構造式を与えることにより、その2次元構造から、マイクロチップ型電気泳動、CE及びCE/MSの移動時間を高い精度で予測することができる。従って、構造式が分かれば、標準物質が無くても、マイクロチップ型電気泳動、CE又はCE/MSで検出された物質を特定することができる。
【0023】
更に、既存の方法ではできなかった、マイクロチップ型電気泳動、CE又はCE/MS分析における様々な種類の分子の移動度を一度に予測することが可能になる。よって、候補化合物の移動時間を全て予想し、マイクロチップ型電気泳動、CE又はCE/MSで検出された未知成分の移動時間で比較することにより、何の種類の物質が入っているか分からないサンプルの未知ピークの同定を行なうことが可能になる。
【発明を実施するための最良の形態】
【0024】
以下図面を参照して、本発明の実施形態を詳細に説明する。
【0025】
本発明の適用対象の一つであるCE/MSは、例えば図1に示す如く、試料の分離を行なうキャピラリ電気泳動装置(CE)30と、分離された試料を霧化する霧化装置としてのエレクトロスプレーニードル40と、霧化した試料からイオン性化合物を分析する質量分析計(MS)50から構成される。
【0026】
前記CE30は、キャピラリ32と、該キャピラリ32の中に導入され、試料を分離するための泳動緩衝液(バッファとも称する)22を貯留する緩衝液槽20と、該泳動緩衝液22に先端が浸漬された白金電極12と、該白金電極12に高電圧(例えば−30kV〜+30kV)を印加するための高電圧電源16とを含んでいる。
【0027】
前記キャピラリ32の一端は前記泳動緩衝液22に浸漬され、他端は前記エレクトロスプレーニードル40に接続されている。
【0028】
前記エレクトロスプレーニードル40には、シース液槽42内に貯留されたシース液44が、ポンプ46により、エレクトロスプレーに適した液量で供給されると共に、細かい液滴を生成してイオン化を促進するネブライザガス(例えば窒素ガス)48が供給されている。
【0029】
前記MS50は、コーン52を備え、該コーン52には、イオンを加速して窒素ガスに衝突させ、フラグメントイオンを生成するためのフラグメンタ電圧が印加されると共に、CE30から入ってきた溶媒を揮発させるためのドライイングガス(例えば窒素ガス)54が供給されている。
【0030】
このような装置において、緩衝液槽20に試料を入れ、白金電極12に所定の高電圧を印加すると、試料と泳動緩衝液22とは、キャピラリ32を通って、エレクトロスプレーニードル40へ移動する。このとき、イオン性化合物は、イオン半径やイオン性の違いにより移動速度が異なるので分離され、バンド状になってエレクトロスプレーニードル40へ泳動する。そして、エレクトロスプレーニードル40で霧化され、MS50で分析される。
【0031】
本発明による移動時間の予測は次のようにして行なう。
【0032】
本実施形態では、あらゆる種類のイオン性化合物のCE/MS内での移動度を予測するために、まず、図2に例示する如く、物質の2次元構造から3次元構造を予測する。このとき、3次元構造は真空内に単独で存在し、他から影響の無い状況を仮定し、化合物単体でエネルギ的に最も安定な構造を取るような形状をとるようにする。
【0033】
次に、予測した3次元構造から、分子の特徴を示す判別子を計算する。判別子としては、例えばChemical Computing Group Inc.のMolecular Operating Environent(MOE)の標準判別子を用いることができる。
【0034】
又、分子の2次元構造から酸解離指数pKaを計算し、次の(1)〜(3)式を用いて、化合物のイオン価数を計算する。
【0035】
【数3】

(ここで、iとjは酸解離指数pKaの添え字で、nは負の値に電荷を生じる物質のpKaの数、mは正の値に電荷を生じる物質のpKaの数であり、pHにはマイクロチップ型電気泳動、CE又はCE/MSで使用する泳動緩衝液のpHの値を用いる。)
【0036】
次に、化合物の判別子、酸解離指数pKa、イオン価数と、CE/MSで計測した化合物の移動時間を内標準物質の移動時間で割って正規化した相対移動時間の間の関係を、図3に例示するような3層構造(1入力層、1隠れ層、1出力層)のニューラル・ネットワークANNを用いて、例えばバック・プロパゲーション法により学習する。図3に、ニューラル・ネットワークANNの構造と入出力層に割り当てられる値を示す。
【0037】
該ニューラル・ネットワークANNの出力層のノード数は1で固定であり、内標準物質の移動時間によって正規化された化合物の相対移動時間を加える。
【0038】
前記入力層には、次のものを加える。
【0039】
(1)化合物の判別子で、学習の対象とする全ての物質において、1つでも値が異なるもの全てを用いる。
【0040】
(2)酸解離指数pKaの値のうち、測定時の泳動緩衝液のpHに最も近い値1つを用いる。
【0041】
(3)(1)〜(3)式で計算したイオン価数を用いる。
【0042】
従って、入力層のノード数は、入力される判別子の数と酸解離指数pKaとイオン価数の和となる。
【0043】
前記入力層及び出力層に与えられる値は、0.1〜0.9の間の値に正規化する。即ち、最大値と最小値の差が大きく離れている場合は、(4)式を用いて対数正規化を行ない、差が小さい場合は、(5)式を用いて線形正規化を行なう。
【0044】
=0.8*(log10V−log10min)/(log10max−log10min)+0.1
…(4)
=0.8*(V−Vmin)/(Vmax−Vmin)+0.1 …(5)
ここで、Vは正規化される値で、VmaxとVminは対象とする化合物において最大値と最小値、Vは正規化された値である。
【0045】
更に、図4に示す如く、同じ学習データを多数のニューラル・ネットワークANN〜ANNで学習させて、各ANNの出力の平均値を取るANNアンサンブル法を用いることで、学習の精度を高めることができる。なお、アンサンブル法は省略することもできる。
【0046】
本発明の処理は、全てパーソナル・コンピュータで行なうことができる。
【実施例】
【0047】
本発明により陽イオン性低分子の移動時間を予測した。
【0048】
(1)CE/MS分析条件
キャピラリ32には、内径50μm、外径360μm、全長100cmのフューズドシリカキャピラリを用いた。泳動緩衝液22には、1M蟻酸(pH=1.8)を用いた。印加電圧は、+30kV、キャピラリ32の温度は20℃で測定した。試料は、加圧法を用いて、50mbarで3秒間注入した。質量分析装置(MS)50は、エレクトロスプレーイオン化法の正イオンモードを用い、キャピラリ電圧は4000V、フラグメンタは100Vに設定した。窒素をドライイングガス54に用い、ガスの温度は300℃、10l/分の流速で測定した。
【0049】
シース液44には10mM酢酸アンモニウム、50%メタノール水溶液を用い、流速10μl/分で送液した。測定試料には内標準物質としてメチオニンスルフォンを添加し、各測定物質の移動時間をメチオニンスルフォンの移動時間を用いて補正し、相対移動時間を求めた。
【0050】
(2)ANNに使用するデータの計算
2次元分子構造は、http://ligand.genome.ad.jp:8080/compound/からダウンロード可能な、KEGG Ligand Databaseに登録されている物質のうち、MDL社のMDL/Mol形式のものを用いた。
【0051】
2次元分子構造から3次元分子構造の予測、及び、物質の特徴の判別子には、Chemical Computing Group Inc.のMolecular Operating Environent(MOE)を用いた。即ち、MOEのEnergy Minize機能を用いて3次元構造を予測し、標準判別子192個を計算した。
【0052】
物質の電離指数pKaの計算には、Advanced Chemistry Developmenet社のソフトウェアpKaDBを用い、得られたpKaから、(1)〜(3)式によりイオン価数を計算した。
【0053】
相対移動時間は、対象とする物質の移動時間を、メチオニンスルフォンの移動時間で割った値を用いた。
【0054】
(3)ANNの計算
イ.学習方法
以下のクロスバリディーション法を用いてANNを学習した。271の実測データを無作為にグループ(約90%の学習データと、残り10%のテストデータ)に分割する。学習データを用いてANNを学習させ、学習済みANNでテストデータを予測する。次の試行では、同じデータがテストデータとして選ばれないようにして、全てのデータが一度はテストデータとして選ばれるように、この手順を10回繰り返した。
【0055】
ロ.データの正規化
ANNの入出力層に割り当てられる値で103より離れているものは、(4)式で対数正規化し、103以下のものは、(5)式で線形正規化を行なった。
【0056】
ハ.ANNの学習パラメータは、以下のように設定した。
【0057】
学習の速さを決定する学習率は0.03、0.04、・・・、0.07の4通りを用いた。
【0058】
学習の遅さを決定するモーメンタムには0.9を用いた。
【0059】
隠れ層のユニット数は10、20、・・・、100の10通りを用いた。
【0060】
学習の回数(エポック数)は8000を用いた。
【0061】
又、ユニット間の初期重みは乱数を用いて発生させた。異なる乱数の種を用い、上記の設定の全ての組合せに対し、10種類の初期重みのパターンを発生させた。即ち、4(学習率)×10(隠れ層)×10(乱数)で400パターンの学習パラメータのANNを学習した。
【0062】
(4)ANNアンサンブルの計算
(3)で計算したANNのうち、学習データに関して実測値と予想値の相関係数が高いものから30個分の出力の平均値を計算し、これを化合物の予測相対移動時間とした。
【0063】
上記の条件を用いて、271個の陽イオンを予測した相対移動時間の実測値と予測値の関係を図5に示す。この方法で予測した相対移動時間と、CE/MSで実測した相対移動時間の相関係数は0.931という高い値であった。
【0064】
なお、前記実施形態においては、質量分析計(MS)でエレクトロスプレー法(ESI)によるイオン化を用いていたが、イオン化法は、これに限定されず、大気圧化学イオン化法(APCI)、高速原子衝突法(FAB)等であってもよい。
【0065】
又、質量分析計も、図示したシングルステージの四重極型の質量分析計に限らず、磁場型、飛行時間、イオントラップ等の他の形式の質量分析計や、タンデム型の質量分析計(MS/MS、MS)であってもよい。更に、CE/MSに限らず、CE単独であってもよい。又、CEでなくマイクロチップ型電気泳動であってもよい。
【0066】
又、予測をする際に、2次元構造から3次元構造を予測しなくても、多少精度は落ちるが2次元構造だけから化合物の移動時間を予測することもできる。
【0067】
又、ANNアンサンブルでなくても、多少精度は落ちるが単独のANNでも予測することができる。
【0068】
又、ANNでなくても、重回帰分析や、サポート・ベクター・マシーンのような複数の数値パラメータ間の関係を学習する方法でも予測することが出来る。
【0069】
又、MDL社のMOL形式以外でも、分子の2次元構造が分るファイルの形式であれば、どのようなフォーマットであってもそのデータを用いて予測することが出来る。
【0070】
又、KEGG Ligand Database以外のデータベース(例えば、Merck Indexなど)でも、分子の2次元構造が分るデータが登録されていれば、そのデータを用いて予測することができる。
【0071】
又、ANNの入出力層に使用する数値を正規化する方法に関して、前記実施形態では、その最大値と最小値に大きな差があるデータに関しては対数正規化、その他の値は線形正規化を行っているが、多少精度は落ちるが、どのような正規化の方法でも構わない。
【図面の簡単な説明】
【0072】
【図1】本発明が適用されるキャピラリ電気泳動/質量分析計の構成例を示す模式図
【図2】本発明により予測される2次元分子構造と3次元分子構造の関係の例を示す図
【図3】本発明で用いるニューラル・ネットワークの構造と入出力層に割り当てられる値の例を示す図
【図4】同じくANNアンサンブルの構成図
【図5】本発明の実施例における相対移動時間の実測値と予測値の関係の例を示す図
【符号の説明】
【0073】
16…高電圧電源
20…緩衝液槽
22…泳動緩衝液(バッファ)
30…キャピラリ電気泳動装置(CE)
32…キャピラリ
40…エレクトロスプレーニードル
42…シース液槽
44…シース液
48…ネプライザガス
50…質量分析計(MS)
54…ドライイングガス
ANN…ニューラル・ネットワーク

【特許請求の範囲】
【請求項1】
マイクロチップ型電気泳動、キャピラリ電気泳動又はキャピラリ電気泳動/質量分析計内の移動時間が不明の物質の移動時間を予測する際に、
まず、電気泳動の移動時間が既知の物質について、その構造から数値的に表現可能な特徴量を計算して、該特徴量と移動時間の関係を予測し、
幾つかの物質の移動時間を電気泳動又は電気泳動/質量分析計で計測して、前記関係を学習させ、
該学習させた結果を用いて、電気泳動又は電気泳動/質量分析計内の移動時間が不明の物質の構造から、その移動時間を予測することを特徴とする電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項2】
前記特徴量が、物質の2次元構造から予測した3次元構造から計算した、分子の特徴を示す判別子、分子の2次元構造から計算した電離指数、及び、化合物のイオン価数を含むことを特徴とする請求項1に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項3】
前記3次元構造が、真空内に単独で存在し他から影響の無い状態を仮定し、化合物単体でエネルギ的に最も安定な構造を取るような形状をとるようにすることを特徴とする請求項2に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項4】
前記化合物のイオン価数を、次式を用いて計算することを特徴とする請求項2に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【数1】

(ここで、iとjは酸解離指数pKaの添え字で、nは負の値に電荷を生じる物質のpKaの数、mは正の値に電荷を生じる物質のpKaの数であり、pHにはマイクロチップ型電気泳動、キャピラリ電気泳動又はキャピラリ電気泳動/質量分析計で使用する泳動緩衝液のpHの値を用いる。)
【請求項5】
前記移動時間が、電気泳動又は電気泳動/質量分析計内で計測した化合物の移動時間を、内標準物質の移動時間で正規化した相対移動時間である請求項1に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項6】
前記関係を、入力層と隠れ層と出力層を有する多層構造のニューラル・ネットワークを用いて学習することを特徴とする請求項1に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項7】
前記入力層に、化合物の判別子の値全てとイオン価数を加え、前記出力層に、化合物の相対移動時間を加えることを特徴とする請求項6に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項8】
前記入力層と出力層に加える各値の最大値と最小値の差が大きく離れている場合は、対数正規化を行ない、差が小さい場合は、線形正規化を行なうことを特徴とする請求項7に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。
【請求項9】
同じデータを多数のニューラル・ネットワークで学習させて、出力は平均値をとることを特徴とする請求項6に記載の電気泳動測定によるイオン性化合物の移動時間予測方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2006−64472(P2006−64472A)
【公開日】平成18年3月9日(2006.3.9)
【国際特許分類】
【出願番号】特願2004−245728(P2004−245728)
【出願日】平成16年8月25日(2004.8.25)
【出願人】(504059429)ヒューマン・メタボローム・テクノロジーズ株式会社 (9)