説明

分子式構築装置、分子式構築装置の制御方法、分子式構築制御プログラム、およびコンピュータ読み取り可能な記録媒体

【課題】分子量を基に、原子の結合に矛盾のない分子式を構築することのできる分子式構築装置を実現する。
【解決手段】原子団組成取得部6は、記憶部2に記憶された、原子団とその質量数とを対応付けた情報である質量数情報を基に、含まれる全ての原子団の質量数の合計が、与えられた分子量を満たすような原子団組成を求める。結合矛盾判定部7は、原子団組成取得部6により得られた原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、記憶部2に記憶された原子団とその結合次数とを対応付けた情報である結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する。そして、分子式構築部8は、結合矛盾判定部7により結合に矛盾が無いと判断された原子団組成から分子式を構築する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子量から原子ならびに原子団の結合に矛盾をきたさない分子式を列挙することに関するものである。
【背景技術】
【0002】
近年、生体試料などの混合物中の各々の分子の精密分子量を同時にかつ迅速に測定する技術の開発が進められている。例えば、フーリエ変換イオンサイクロトロン共鳴型(Fourier-Transform Ion Cyclotron Resonance, FT-ICR)質量分析法では、質量をppm(検出質量の100万分の1)の精度で測定することが可能となっている。このような精密質量分析装置の進歩に伴い、精密分子量から分子式を推定するインフォマティクス技術の構築が、混合試料中の各々の分子の構造決定を進めるための基礎データとして必要とされている。
【0003】
従来、分子量から分子式を求めるためには、対象とする分子の分子量に適合する原子の組成を、質量数のみから求めることがなされている。
【非特許文献1】「ボルハルトショアー現代有機化学(上)」古賀憲司、野依良治、村橋俊一監修(化学同人)1996年
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の質量数のみを考慮した分子式の列挙法では、それぞれの原子の結合において矛盾をきたす分子式が候補として得られる。つまり、原子の結合次数、いわゆる原子の手、が余ったり足りなくなったりする分子式も候補として得られる。例えば、炭素原子C(結合次数4)と水素原子H(結合次数1)5つのCH5という分子式が候補として挙げられたとすれば、この分子式において、Cにとっては手が足りなく、Hにとっては手がひとつ余ってしまう。このような矛盾が起こってしまう。そのため、研究者は、候補分子式が原子の結合における矛盾のある分子式であるか否かを解析するために、原子の結合の数に矛盾があるかないかを実際に構造を考えて判断しなければならない。また、機器分析における構造決定では、分子式が既知であることが前提で研究が進められるために、元素分析などを行ってまず分子量を出して、それから構造決定をするという手順を取らならければならない。
【0005】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、与えられた分子量を基に原子の結合に矛盾しない分子式を列挙することのできる分子式構築装置、分子式構築装置の制御方法、分子式構築制御プログラム、およびコンピュータ読み取り可能な記録媒体を提供することにある。なお、ここでいう分子式とは、分子を構成する各々の原子とそれらの個数とを記述したものであり、たとえば、メタンであれば、C1H4のように表す。すなわち、分子式は原子の種類と個数により定義されるものである。
【課題を解決するための手段】
【0006】
本発明に係る分子式構築装置は、上記課題を解決するために、特定の結合次数を有する原子、または複数の原子が結合したものであり特定の結合次数を結有する原子群、である原子団とその質量数とを対応付けた情報である質量数情報と、当該原子団とその結合次数とを対応付けた情報である結合次数情報と、を記憶する記憶部と、上記記憶部に記憶された質量数情報を基に、自身に含まれる全ての原子団の質量数の合計が、与えられた分子量を満たすような原子団組成を求める原子団組成取得手段と、得られた上記原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、上記記憶部に記憶された結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する結合矛盾判定手段と、結合に矛盾が無いと判断された原子団組成から分子式を構築する分子式構築手段と、を備えたことを特徴としている。
【0007】
本発明に係る分子式構築装置の制御方法は、上記課題を解決するために、特定の結合次数を有する原子、または複数の原子が結合したものであり特定の結合次数を結有する原子群、である原子団とその質量数とを対応付けた情報である質量数情報を基に、自身に含まれる全ての原子団の質量数の合計が、与えられた分子量を満たすような原子団組成を求める原子団組成取得ステップと、得られた上記原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、原子団とその結合次数とを対応付けた情報である結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する結合矛盾判定ステップと、結合に矛盾が無いと判断された原子団組成から分子式を構築する分子式構築ステップと、を含むことを特徴としている。
【0008】
ここで、原子団とは、特定の結合次数を有する原子、あるいは、複数の原子が結合したものであり特定の結合次数を結有する原子群、を指すものである。具体的には、結合次数が1の水素(原子)、結合次数が4の炭素(原子)もそれぞれ原子団であるし、水酸基(-OH)(原子群)は、水酸基から外への結合は酸素からの結合のみとなるので結合次数は1であり、これも原子団である。また、3種のリン酸基(一リン酸、二リン酸、三リン酸)(それぞれ原子群)も、それぞれの結合次数は1なので、3種のリン酸基それぞれが原子団である。
【0009】
上記構成および上記方法によると、原子団とその質量数とを対応付けた情報である質量数情報を基に、原子団組成に含まれる全ての原子団の質量数の合計が、与えられた分子量を満たすような原子団組成を求める。このようにして得られた原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、原子団とその結合次数とを対応付けた情報である結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する。そして、原子団組成に含まれる全ての原子団における結合に矛盾が無いと判断された原子団組成から分子式を構築する。なお、原子団組成とは、具体的に説明すると、Hが3個、Cが1個、Sが1個…といったように、どの原子団が何個あるかの情報、つまり、与えられた分子量の分子における原子団の組成についての情報である。
【0010】
上記のように構築された分子式は、全ての原子団についての結合次数が考慮されており、与えられた分子量を基に原子の結合に矛盾しない分子式である。この構築された分子式は、与えられた分子量の実際の分子の分子式に対する、候補の分子式である。
【0011】
従来では、分子量から分子式を求めるためには、対象とする分子の分子量に適合する原子の組成を求めることにより行われており、結合次数については考慮されていなかった。そのため、それぞれの原子の結合数において矛盾をきたす分子式が候補として得られてしまっていた。
【0012】
これに対し、上記構成および上記方法によると、与えられた分子量を基に原子の結合に矛盾しない分子式、つまり、原子間の結合を余らせること無く全ての原子をひとつの分子として結合する分子式、を列挙することができる。そのため、従来よりも候補の分子式の数を絞って列挙することができる。
【0013】
例えば、高精度分析装置、例えばフーリエ変換イオンサイクロトロン共鳴型質量分析法で高精度で測定された分子量に対して、妥当な分子式を構築することが可能となる。構築された分子式は、原子の結合に矛盾の無い妥当な候補の分子式であるとので、構築された分子式を基に、その後の化学構造決定の効率化へとつなげることができる。よって、分子量から分子式の予測を必要とする化学の分野はもとより、生物学、医学、薬学、農学、工学その他産業上、有効に利用することができる。
【0014】
なお、原子団に、当該原子団の質量数と当該原子団の結合次数とが、対応付けられていてもよるような情報が記憶部に記憶されており、質量数情報と結合次数情報とが一まとめになっていてもよい。
【0015】
また、本発明に係る分子式構築装置では、上記構成に加え、上記与えられた分子量は、測定から得られた分子量に許容範囲が加えられたものであってもよい。
【0016】
上記構成によると、与えられた分子量、つまり、分子式を構築する対象の分子量として、測定から得られた分子量に許容範囲が加えられたものが用いられる。よって、測定により測定誤差が生じても、それを加味した分子量から妥当な分子式を構築することができる。
【0017】
ここで、許容範囲がマイナスの場合でも、マイナスの許容範囲が測定から得られた分子量に加えられることになる。例えば、測定から得られた分子量をMuとし、許容範囲を±Thとすると、与えられた分子量(分子式を構築する対象の分子量)Mwは、Mu−Th<Mw<Mu+Thの範囲に含まれるものとなる。この範囲は、例えば、Mu−Th≦Mw≦Mu+Thであっても、Mu−Th≦Mw<Mu+Thであっても、Mu−Th<Mw≦Mu+Thであっても、かまわない。また、許容範囲は、例えば、対象の分子量を測定した質量分析装置の測定誤差を考慮して求められたものであってもよいが、これに限定されない。
【0018】
また、本発明に係る分子式構築装置では、上記構成に加え、ユーザ入力を受け付ける受付手段を備え、上記与えられた分子量は、当該受付手段より与えられたものであってもよい。
【0019】
上記構成によると、受付手段により、ユーザの入力を受け付けることができる。よって、ユーザは、分子式を構築する対象の分子量を入力することができる。ユーザが望むどのような分子量でも入力することができる。また、許容範囲を入力することができるので、ユーザは適宜許容範囲を変更させた分子量(与えられた分子量)について、原子の結合に矛盾の無い分子式を得ることができる。
【0020】
また、本発明に係る分子式構築装置では、上記構成に加え、上記分子式構築手段が構築した分子式を、表示部に表示させる表示制御手段を備えてもよい。
【0021】
上記構成によると、与えられた分子量を基に構築した、原子の結合に矛盾の無い分子式を表示部に表示することができる。よって、ユーザは、表示部に表示された分子式を確認し、その後の化学構造決定に利用することができる。化学構造決定の効率化へとつなげることができる。
【0022】
また、本発明に係る分子式構築装置では、上記構成に加え、上記表示制御手段は、上記分子式構築手段が複数の分子式を構築し、これら複数の分子式間において重複した分子式がある場合、重複を省いて分子式を表示してもよい。
【0023】
上記構成によると、原子の結合に矛盾の無い分子式が複数構築され、その複数の中に重複した分子式があった場合、重複を省かれた分子式のみが表示部に表示される。つまり、原子の結合に矛盾の無い分子式が、重複を省かれて1つずつ表示される。そのため、ユーザは自身で重複を省いたりする必要がなく、原子の結合に矛盾の無い分子式を1つずつ見ることができる。このように、ユーザにとって利用しやすい表示を行うことができる。
【0024】
また、本発明に係る分子式構築装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記分子式構築装置における上記各手段として動作させることにより上記分子式構築装置をコンピュータにて実現させる分子式構築装置制御プログラム、及びその分子式構築装置制御プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0025】
本発明に係る分子式構築装置は、以上のように、原子、または複数の原子が結合した原子群、である原子団とその質量数とを対応付けた情報である質量数情報と、当該原子団とその結合次数とを対応付けた情報である結合次数情報と、を記憶する記憶部と、上記記憶部に記憶された質量数情報を基に、原子団組成に含まれる全ての原子団の質量数の合計が、取得した分子量を満たすような原子団組成を求める原子団組成取得手段と、得られた上記原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、上記記憶部に記憶された結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する結合矛盾判定手段と、結合に矛盾が無いと判断された原子団組成から分子式を構築する分子式構築手段と、を備えている。
【0026】
上記構成によると、原子団とその質量数とを対応付けた情報である質量数情報を基に、原子団組成含まれる全ての原子団の質量数の合計が、与えられた分子量を満たすような原子団組成を求める。このようにして得られた原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、原子団とその結合次数とを対応付けた情報である結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する。そして、原子団組成に含まれる全ての原子団における結合に矛盾が無いと判断された原子団組成から分子式を構築する。
【0027】
上記のように構築された分子式は、全ての原子団についての結合次数が考慮されており、与えられた分子量を基に原子の結合に矛盾しない分子式である。この構築された分子式は、与えられた分子量の実際の分子の分子式に対する、候補の分子式である。
【0028】
従来では、分子量から分子式を求めるためには、対象とする分子の分子量に適合する原子の組成を求めることにより行われており、結合次数については考慮されていなかった。そのため、それぞれの原子の結合数において矛盾をきたす分子式が候補として得られてしまっていた。
【0029】
これに対し、上記構成および上記方法によると、与えられた分子量を基に原子の結合に矛盾しない分子式、つまり、原子間の結合を余らせること無く全ての原子をひとつの分子として結合する分子式、を列挙することができる。そのため、従来よりも候補の分子式の数を絞って列挙することができる。
【0030】
例えば、高精度分析装置、例えばフーリエ変換イオンサイクロトロン共鳴型質量分析法で高精度で測定された分子量に対して、妥当な分子式を構築することが可能となる。構築された分子式は、原子の結合に矛盾の無い妥当な候補の分子式であるとので、構築された分子式を基に、その後の化学構造決定の効率化へとつなげることができる。よって、分子量から分子式の予測を必要とする化学の分野はもとより、生物学、医学、薬学、農学、工学その他産業上、有効に利用することができる。
【発明を実施するための最良の形態】
【0031】
本発明の一実施形態について図1〜図6に基づいて説明すると以下の通りである。
【0032】
本実施の形態の分子式構築装置1は、記憶部2、制御部3を備えている。記憶部2は、以下で説明する原子団情報4を記憶する記憶手段である。ここで、原子団とは、特定の結合次数を有する原子、あるいは、複数の原子が結合したものであり特定の結合次数を結有する原子群、を指すものである。具体的には、結合次数が1の水素(原子)、結合次数が4の炭素(原子)もそれぞれ原子団であるし、水酸基(-OH)(原子群)は、水酸基から外への結合は酸素からの結合のみとなるので結合次数は1であり、これも原子団である。また、3種のリン酸基(一リン酸、二リン酸、三リン酸)(それぞれ原子群)も、それぞれの結合次数は1なので、3種のリン酸基それぞれが原子団である。結合次数とは、原子団の有する結合の数、いわゆる手の数を指すものである。
【0033】
原子団情報4は、質量数情報41と結合次数情報42とを含む。質量数情報41とは、原子団とその質量数とを対応付けた情報である。結合次数情報42とは、原子団とその結合次数とを対応付けた情報である。このような原子団情報4を図2に示す。図2に示した原子団情報は、原子団に、当該原子団の質量数と当該原子団の結合次数とが、対応付けられたものであり、質量数情報41と結合次数情報42とが一まとめになっていているが、ばらばらになっていてもよい。また、原子群の質量数は、原子団情報には記憶されておらず、測定の度に、原子群を構成する各原子の質量数を基に算出してもよい。
【0034】
また、記憶部2には、分子式構築装置1の各種構成の動作を制御する制御プログラム、OSプログラム、およびその他各種プログラム等が記憶されていてもよい。
【0035】
制御部3は、装置における各種構成の動作を統括的に制御する。また、制御部3は、入力受付部(受付手段)5、原子団組成取得部(原子団組成取得手段)6、結合矛盾判定部(結合矛盾判定手段)7、分子式構築部(分子式構築手段)8、表示制御部(表示制御手段)9として機能する。
【0036】
入力受付部5は、分子式構築装置1に対するユーザ指示を受け付けるものである。ユーザが入力部(図示せず)を介して入力した、分子式を求めたい分子量Wuと許容範囲Thとを受け付ける。ここで、分子式を求めたい分子量Wuとは、例えば、フーリエ変換イオンサイクロトロン共鳴型(Fourier-Transform Ion Cyclotron Resonance, FT-ICR)装置を用いて得られた分子量とする。もちろんこれ以外の方法で得た分子量であってもよい。また、ユーザは、分子式を求めたい分子量だけ入力して、許容範囲Thは入力しなくてもよい。許容範囲Thは、例えば、分子量を測定した装置(図示せず)の測定誤差を考慮してユーザが決めてもよい。例えばFT-ICRの場合では、分析により得られる分子量に対してppmのレベルでの誤差が含まれる。この場合、例えば、分子量100.0000という値が得られたら、誤差としては100.000×0.000001 = 0.00001が誤差となる。ユーザがこの誤差の値を許容範囲Thとして入力したものを、入力受付部5は受け付ける。もちろんこの許容範囲Thの求め方は単なる例示である。なお、測定された分子量や許容範囲が、その分子量を測定した測定装置(図示せず)から直接入力受付部5に入力されるようになっていてもかまわない。
【0037】
また、入力受付部5はユーザによる分子式の構築動作の開始を受け付けるようになっていてもよい。
【0038】
原子団組成取得部6は、記憶部2に記憶された質量数情報41を基に、原子団組成に含まれる全ての原子団の質量数の合計が、入力受付部5が受け付けた分子量(与えられた分子量、分子式を構築する対象の分子量)を満たすような原子団組成を求める。原子団組成とは、具体的に説明すると、Hが3個、Cが1個、Sが1個…といったように、どの原子団が何個あるかの情報、つまり、与えられた分子量の分子における原子団の組成についての情報である。
【0039】
結合矛盾判定部7は、原子団組成取得部6により得られた原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、記憶部2に記憶された結合次数情報42から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する。
【0040】
分子式構築部8は、結合矛盾判定部7により結合に矛盾が無いと判断された原子団組成から分子式を構築する。
【0041】
表示制御部9は、分子式構築装置1が行う分子式の構築に関する画面を表示する表示部10の制御を行う。表示制御部9は、分子式構築部8が構築した分子式を、表示部10に表示する。分子式構築装置1が行う分子式の構築に関する画面(メイン画面と呼ぶ)とは、例えば、図3に示すように、使用する原子団(対象の分子に含まれるとユーザが考える原子団)の選択、分子量、許容範囲、をユーザが表示部10を見ながら入力できるような画面である。ここで、本実施形態では、図3に示すように、炭素、水素、酸素、窒素以外の原子団は、ユーザが、表示部10に表示されたメイン画面のチェックボックスをチェックすることにより、選択可能であるとする。ユーザは、分子量Muと許容範囲Th、それぞれを、表示部10に表示されたメイン画面中の”Mw=”および”[+/-]=”の後のテキストボックス代入し、ボタン”Let’s start!”をクリックすることにより、これらの条件を満たす分子式(構築された分子式)が出力用のテキストボックスに出力、つまり表示される。これらの表示方法については、単なる例示であり、これ以外の方法で、構築された分子式が表示されてもよい。
【0042】
なお、表示部10は、分子式を示す画面を表示できるものであればどのような形態でもよく、例えば、液晶ディスプレイ、プラズマディスプレイ、またはブラウン管であってもかまわない。
【0043】
次に、分子式構築装置1における分子式を求める処理について、図4に示すフローチャートを用いて説明する。
【0044】
初めに、分子量および許容範囲の取得を行う(S1)。入力受付部5が、ユーザ入力により入力された、測定された分子量および許容範囲の受け付けることで、分子量および許容範囲の取得を行う。なお、測定された分子量や許容範囲が、その分子量を測定した測定装置(図示せず)から直接入力受付部5に入力されるようになっていてもかまわない。
【0045】
次に、使用する原子団(対象の分子に含まれるとユーザが考える原子団)を結合次数により分類する(S2)。結合次数とは、原子団の有する結合の数を指すものである。例えば、ユーザが水酸基(-OH)を解析に含めるとすると、水酸基から外への結合次数は酸素からの結合のみとなるので結合次数は1である。イオウ原子について二価のイオウ(-S-)を解析に含める場合、イオウ原子から外への結合の数は2つあるので結合次数は2である。ここで、結合次数が1である原子団、2である原子団、ならびに3以上の結合次数を有する原子団を、それぞれ、単結合型原子団、2結合型原子団、3以上結合型原子団として分類する。また、これらの原子団からなる集合を単結合型原子団集合、2結合型原子団集合、3以上結合型原子団集合と呼ぶことにする。例えば、水素、ハロゲン(フッ素、塩素、臭素、ヨウ素、アスタチン)は、結合次数が1であるので単結合型原子団に分類される。また、イオウ、酸素は、結合次数が2であるので、2結合型原子団に分類される。さらに窒素、炭素はそれぞれ結合の次数が3、4であるから、3以上結合型原子団に分類される。また、リン酸基を、以下の構造式(A)のように、結合を1つ規定する場合には、結合次数1である単結合型原子団に分類する。
【0046】
【化1】

【0047】
なお、結合次数による分類の情報が、予め、記憶部2に記憶された原子団情報4に含まれていてもよく(各原子団が結合次数により分類されている)、この場合には、S2では、使用する原子団の選択の受付けだけを行えばよい。
【0048】
次に、原子団組成の取得を行う(S3)。原子団組成取得部6は、記憶部2に記憶された質量数情報41を基に、原子団組成に含まれる全ての原子団の質量数の合計が、S1で取得した、ユーザにより入力された分子量Muと許容範囲Thを基にした以下の式(1)を満たす分子量Mwを満たすような原子団組成を求める。
【0049】
【数1】

【0050】
上記の式(1)を満たす分子量Mwを有する原子団組成が、K個得られたとする。これらのK個の原子団組成をそれぞれk = 1,2,…,Kとする。
【0051】
K番目の原子団組成を構成する単結合型原子団集合に属する原子団をsk(1),sk(2),…,sk(Ns)とし、それぞれの個数をn[sk(1)], n[sk(2)],…,n[sk(Ns)]とする。また、2結合型原子団集合に属する原子団をdk(1),dk(2),…,dk(Nd)とし、それぞれの個数をn[dk(1)], n[dk(2)],…,nk[dk(Nd)]とする。また、3以上結合型原子団集合に属する原子団を、mk(1),mk(2),…,mk(Nm)とし、それぞれの個数をn[mk(1)],n[mk(2)],…,n[mk(Nm)]、さらに結合の次数をそれぞれb[mk(1)],b[mk(2)],…,b[mk(Nm)]とする。
【0052】
次に、結合矛盾判定部7は、S3で求めたK個の原子団組成それぞれについて、原子団組成に含まれる全ての原子団の結合次数を、記憶部2に記憶された結合次数情報42から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する。つまり、k番目の原子団組成に属する全ての原子団について結合があまることなく結合できるか否かを判定する(S4〜S7)。この判定について説明する。
【0053】
まず、k番目の原子団組成について、以下の(a)〜(d)の条件により場合分けを行う(S4)。
(a)k番目の原子団組成が単結合型原子団のみからなる
(b)k番目の原子団組成が単結合原子団および2結合型原子団のいずれも含み、3以上結合型原子団を含まない
(c)k番目の原子団組成が2結合型原子団のみからなる
(d)k番目の原子団組成が3以上結合型原子団を含む
S4の場合分けにおいて、上記(a)の場合、あるいは上記(b)の場合には、以下の式(2)を満たすか否かを判定する(S5)。式(2)を満たせば(S5においてYES)、k番目の原子団組成は、原子団の結合に矛盾をきたさないものであると判定される。
【0054】
【数2】

【0055】
S4の場合分けにおいて、上記(c)の場合には、以下の式(3)を満たすか否かを判定する(S6)。式(3)を満たせば(S6においてYES)、k番目の原子団組成は、あるいは原子団の結合に矛盾をきたさないものであると判定される。
【0056】
【数3】

【0057】
S4の場合分けにおいて、上記(d)の場合には、以下の式(4)および(5)を満たすか否かを判定する(S6)。満たせば(S6においてYES)、k番目の原子団組成は、原子団の結合に矛盾をきたさないものであると判定される。
【0058】
【数4】

【0059】
ここで、a % bは、aをbで割った余りを表す。
【0060】
【数5】

【0061】
以上の判定(S4〜S7)はS3で求めたK個の原子団組成全てに対して行われる。
【0062】
次に、S5〜S7において原子団の結合に矛盾をきたさない分子式をなすものであると判定された原子団組成から集計された原子の個数をもとに分子式を構築(作成)する(S8)。分子式の元になる原子団組成が原子団の結合に矛盾をきたさないものであるので、分子式に含まれるすべの原子は、原子の結合に矛盾をきたさないものとなる。ここでK’個の、原子の結合において矛盾のない分子式が得られたとする。K’個の分子式間における重複を取り除いたKreal(≦ K’)個の分子式を表示部10に出力する(S9)。原子団の組み合わせの確認は、K’個の分子式に使用した原子団の有無の情報を含めて、分子式を表示部10に出力してもよい。
【0063】
ここで、上記KrealとK’とについて具体例を用いて説明する。原子団として、上記した構造式(A)で示す1リン酸のリン酸基と、下記の構造式(B)で示す2リン酸のリン酸基と水酸基とがある場合に、[1リン酸2個、炭素1個、水素2個]と[2リン酸1個、炭素1個、水素2個、水酸基1個]とは、どちらも、矛盾の無い分子式となる原子団組成となる。つまり、前者の原子団組成は下記の構造式(C)に示す構造を取り、後者の原子団組成は下記の構造式(D)に示す構造を取るものが考えられる。このように、どちらも、同じ分子式(CH6O8P2)となる。そのために原子団組成のみでは、重複を招くことになりこれがK’個ということである。これらの重複を省いたものがK個となる。
【0064】
【化2】

【0065】
【化3】

【0066】
【化4】

【0067】
以上のように、分子式構築装置1は、ユーザにより分子量Muと許容範囲Thが与えられると、これらを満たし、かつ原子間の結合を余らせること無く全ての原子をひとつの分子として結合する分子式を求める。
【0068】
次に、同位体を有する原子あるいは原子団に対する処理について説明する。自然界に存在する同位体元素を含む同一の原子組成からなる原子団を複数考慮することが必要である場合、すなわち、自然界の存在比が非常に似通っている原子からなる原子団を考える。例えば、-Br(臭素)の精密質量は78.9183379および80.9167003である。これらの自然界の存在比は、それぞれ、50.69%および49.31%であるため、両方を考慮する必要がある場合は、以下のステップを加えることにより、両方の条件を満たす分子式を得ることができる。上記のS2での原子団の次数による分類において2種類の精密質量とそれぞれ対応した臭素からなる原子団を定義し、上記と同様にS3以降の処理を行えばよい。分子式の構築においては、質量数78.9183379の臭素および80.9167003の臭素の両方を考慮することになる。例えば、与えられた分子量の範囲が159-161であったとすると、質量数78.9183379と質量数80.9167003の両方の臭素を考慮して、159.8350382に対応する分子式Br2も正解にする。なお、片方のみで条件を満たす場合は片方のみで分子式を構築することになる。もちろん、臭素以外の他の元素についてもユーザが必要とすれば、考慮に入れてかまわない。上述の例として図2を用いて示した原子団は、同位体の存在比において一つの同位体が非常に多いので、その非常に多い方の主となる同位体の原子量のみを考慮したものである。
【0069】
なお、分子式構築装置1の各ブロック、特に制御部3は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
【0070】
すなわち、分子式構築装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである分子式構築装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記分子式構築装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0071】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0072】
また、分子式構築装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0073】
〔実施例〕
本実施例では、上記実施の形態に示した分子式構築装置1として機能するコンピュータを用いて、以下のように分子式の構築を行った。
【0074】
本実施例では、炭素、水素、酸素、窒素、イオウ(2価)、フッ素、塩素、臭素、要素の9個の原子と、3種のリン酸基(一リン酸、二リン酸、三リン酸)、スルフォニル基の4種の原子群と、である原子団を対象としてシステムを構築したが、原理的に必要に応じて原子団を追加することが可能である。また、本実施例では、使用する原子団(対象の分子に含まれるとユーザが考える原子団)の選択、分子量、許容範囲をユーザが、表示部を見ながら入力できるようになっているものとする。これらの入力が行えるように、表示部には、図3に示すメイン画面の表示がなされるものとする。
【0075】
本実施例では、炭素、水素、酸素、窒素以外の原子団は、ユーザが、表示部に表示されたチェックボックスをチェックすることにより、選択可能である。ユーザは、分子量(Mu)と許容範囲(Th)、それぞれを、表示部に表示された”Mw=”および”[+/-]=”の後のテキストボックス代入し、ボタン”Let’s start!”をクリックすることにより、これらの条件を満たす分子式が出力用のテキストボックスに出力される(ボタンの下)。
【0076】
例えば、分子量を60.02112、許容範囲を0.02と定義した場合の分子式の数は2個(出力部のTotalRealと対応)であり、分子式はC2H4O2およびC1H4N2O1である。なお、この実施例では、1997年IUPAC総会で承認された原子の質量を用いた。それぞれの原子の質量を以下に示す。水素:1.0078250319 (99.985%)、炭素:12 (98.93%)、窒素:14.0030740074 (99.632%)、酸素:15.9949146223 (99.757%)、フッ素:18.99840320 (100%)、リン:30.97376149 (100%)、イオウ:31.97207073 (94.93%)、塩素:34.96885271 (75.78%)、臭素:78.9183379 (50.69%)および80.916291 (49.31%)、ヨウ素:126.904468 (100%)。ここで、括弧の中の数字は同位体存在度を表す。
【0077】
本発明に係る分子式構築装置(分子式構築装置1)により求めた分子式の数と、従来の質量数のみを考慮した分子式の列挙法により求めた分子式との数の違いを、以下の(A)〜(G)の7つの異なる条件について検討した。
(A)4種類の原子(炭素、水素、酸素、窒素)のみを対象とした場合
(B)4種類の原子(炭素、水素、酸素、窒素)にスルフォニル基と2価のイオウ(-S-)を含めた場合
(C)4種の原子(炭素、水素、酸素、窒素)にリン酸基(一リン酸、ニリン酸、三リン酸)を含めた場合
(D)4種の原子(炭素、水素、酸素、窒素)にフッ素(-F)を含めた場合
(E)4種の原子(炭素、水素、酸素、窒素)に塩素(-Cl)を含めた場合
(F)4種の原子(炭素、水素、酸素、窒素)に臭素(-Br)を含めた場合
(G)4種の原子(炭素、水素、酸素、窒素)にヨウ素(-I)を含めた場合
有機化合物、特に天然物化合物は、4種類の原子(炭素、水素、酸素、窒素)を主原子として構成されるため、これらの4種の主原子のみから得られる分子式を、分子量Mu=100.0000,200.0000,300.0000,400.0000, 500.0000, 600.0000, 700.0000, 800.0000, 900.0000, および1000.0000の10個の条件で検討した。また、許容範囲Th=0.0001とした。図5(A)〜(G)は、本発明に係る分子式構築装置により求めた分子式の数と、従来の質量数のみを考慮した分子式の列挙法により求めた分子式とをグラフで示した図である。図5において、横軸は分子量、縦軸は分子式の数である。黒の棒は分子式構築装置1により求めた分子式の数、白の棒は、従来の質量数のみを考慮した分子式の列挙法により求めた分子式の数を示している。
【0078】
図5(A)は、上記(A)の場合である、4種類の原子(炭素、水素、酸素、窒素)のみを考慮した場合について得られる分子式の数をグラフで示した図である。分子量100.0000から1000.0000の範囲では、本発明に係る分子式構築装置により求めた分子式の数は数個である。一方、従来の方法により求めた場合には、例えば分子量が800.0000、900.0000および1000.0000の場合には、10以上の分子式が得られることがわかる。
【0079】
図5(B)には、上記(B)の場合である、4種の原子(炭素、水素、酸素、窒素)にスルフォニル基と2価のイオウ(-S-)を含めた場合に得られる分子式の数を示す。図2(C)には、上記(C)の場合である、4種の原子にリン酸基(一リン酸、ニリン酸、三リン酸)を含めた場合に得られる分子式の数を示す。図5(D)には、上記(D)の場合である、4種の原子(炭素、水素、酸素、窒素)にフッ素(-F)を含めた場合に得られる分子式の数を示す。図5(E)には、4種の原子(炭素、水素、酸素、窒素)に塩素(-Cl)を含めた場合に得られる分子式の数を示す。図5(F)には、上記(F)の場合である、4種の原子(炭素、水素、酸素、窒素)にヨウ素(-I)を含めた場合に得られる分子式の数を示す。図5(G)には、上記(G)の場合である、4種の原子(炭素、水素、酸素、窒素)にヨウ素(-I)を含めた場合に得られる分子式の数を示す。
【0080】
上記図5(A)〜(G)からわかるように、上記(A)〜(G)のどの場合においても本発明に係る分子式構築装置により求めた分子式の数は、明らに従来の質量数のみを考慮した場合の分子式の数に比べて少ない。また、図2(F)では地球上の臭素の二つの同位体はほぼ等しいため、78.9183379 (50.69%)および80.916291 (49.31%)の2つとも考慮した結果である。このように、複数の同位体を考慮することも本発明に係る分子式構築装置では可能である。
【0081】
本発明に係る分子式構築装置における分子式の絞込みの効率を定量するために、分子量1000.0000において、分子式構築装置を用いてを構築した分子式の数を、従来の質量数のみを考慮した分子式の列挙法にて得られる分子式の数で割った数(効率値)を計算した。その結果を図6に示す。図6により、上記(A)〜(G)のいずれの場合においても、効率値は0.1前後であり、本発明に係る分子式構築装置は、従来の方法に比べると、候補となる分子式の数を1/10程度に減らすことができることがわかる。このことは、例えば、高精度分析装置、例えばフーリエ変換イオンサイクロトロン共鳴型(Fourier-Transform Ion Cyclotron Resonance, FT-ICR)質量分析法で高精度で測定された分子量に対して妥当な分子式を対応づけることが可能となり、その後の化学構造決定の効率化へとつなげることができる。
【0082】
本発明は上述した実施形態および実施例に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【産業上の利用可能性】
【0083】
本発明は、結合に矛盾の無い分子式を列挙することができるので、分子量から分子式の予測を必要とする化学の分野はもとより、生物学、医学、薬学、農学、工学その他産業分野において有効に適用することができる。
【図面の簡単な説明】
【0084】
【図1】本発明の実施形態を示すものであり、分子式構築装置の要部構成を示すブロック図である。
【図2】上記分子式構築装置で用いられる質量数および結合次数情報を説明するための図である。
【図3】上記分子式構築装置にて構築された分子式を表示した表示画面の一例を示す図である。
【図4】上記分子式構築装置における分子式の構築の処理を示すフローチャートである。
【図5】(A)〜(G)は、異なる条件における、分子量(横軸)と、上記分子式構築装置を用いて構築した分子式の数あるいは従来の質量数のみを考慮した分子式の列挙法にて得られる分子式の数(縦軸)との関係を表すグラフを示す図である。
【図6】上記分子式構築装置を用いて、異なる条件における、分子量1000.0000での、上記分子式構築装置を用いて構築した分子式の数を、従来の質量数のみを考慮した分子式の列挙法にて得られる分子式の数で割った数を示すグラフである。
【符号の説明】
【0085】
1 分子式構築装置
2 記憶部
3 制御部
4 原子団情報
5 入力受付部(受付手段)
6 原子団組成取得部(原子団組成取得手段)
7 結合矛盾判定部(結合矛盾判定手段)
8 分子式構築部(分子式構築手段)
41 質量数情報
42 結合次数情報

【特許請求の範囲】
【請求項1】
特定の結合次数を有する原子、または複数の原子が結合したものであり特定の結合次数を結有する原子群、である原子団とその質量数とを対応付けた情報である質量数情報と、当該原子団とその結合次数とを対応付けた情報である結合次数情報と、を記憶する記憶部と、
上記記憶部に記憶された質量数情報を基に、自身に含まれる全ての原子団の質量数の合計が、与えられた分子量を満たすような原子団組成を求める原子団組成取得手段と、
得られた上記原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、上記記憶部に記憶された結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する結合矛盾判定手段と、
結合に矛盾が無いと判断された原子団組成から分子式を構築する分子式構築手段と、
を備えたことを特徴とする分子式構築装置。
【請求項2】
上記与えられた分子量は、測定から得られた分子量に許容範囲が加えられたものであることを特徴とする請求項1に記載の分子式構築装置。
【請求項3】
ユーザ入力を受け付ける受付手段を備え、
上記与えられた分子量は、当該受付手段より与えられたものであることを特徴とする請求項1または2に記載の分子式構築装置。
【請求項4】
上記分子式構築手段が構築した分子式を、表示部に表示させる表示制御手段を備えたことを特徴とする請求項1〜3の何れか1項に記載の分子式構築装置。
【請求項5】
上記表示制御手段は、上記分子式構築手段が複数の分子式を構築し、これら複数の分子式間において重複した分子式がある場合、重複を省いて分子式を表示することを特徴とする請求項4に記載の分子式構築装置。
【請求項6】
特定の結合次数を有する原子、または複数の原子が結合したものであり特定の結合次数を結有する原子群、である原子団とその質量数とを対応付けた情報である質量数情報を基に、自身に含まれる全ての原子団の質量数の合計が、取得した分子量を満たすような原子団組成を求める原子団組成取得ステップと、
得られた上記原子団組成について、当該原子団組成に含まれる全ての原子団の結合次数を、原子団とその結合次数とを対応付けた情報である結合次数情報から取得し、取得した結合次数を基に、当該原子団組成に含まれる全ての原子団における結合に矛盾が有るか否かを判定する結合矛盾判定ステップと、
結合に矛盾が無いと判断された原子団組成から分子式を構築する分子式構築ステップと、
を含むことを特徴とする分子式構築装置の制御方法。
【請求項7】
請求項1〜5の何れか1項に記載の分子式構築装置の上記各手段として、コンピュータを機能させるための分子式構築プログラム。
【請求項8】
請求項7に記載の分子式構築プログラムが記録されたコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2007−163212(P2007−163212A)
【公開日】平成19年6月28日(2007.6.28)
【国際特許分類】
【出願番号】特願2005−357637(P2005−357637)
【出願日】平成17年12月12日(2005.12.12)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【Fターム(参考)】