説明

データ処理装置及びデータ処理プログラム

【課題】スペクトルに基づき未知物質の同定を行ううえで、分析者の経験や知識に依存することがなく、また、主成分と副成分の情報が同時に得られるデータ処理装置を提供する。
【解決手段】未知物質のスペクトルに対し、予め準備されているスペクトルライブラリに基づき、類似性の高いスペクトルを候補として複数選択する。次に、候補となったスペクトルのうち、高い類似度を有する所定個数のスペクトルを対象としてピーク照合を行い、ピーク照合をクリアした物質を主成分とする。一方、候補となったスペクトルのうち、先程はピーク照合の対象とはならなかったスペクトルを対象としてピーク照合を行い、クリアした物質を副成分とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、未知の物質を、そのスペクトルに基づいて同定するためのデータ処理装置およびプログラムに関する。
【背景技術】
【0002】
未知物質のスペクトルに基づきその物質を同定するためのシステムやプログラムでは、従来、次のような手順で以て同定処理が行われてきた。
・まず、予め測定された既知物質のスペクトルのライブラリを所定の記憶領域に保存しておく。
・未知物質のスペクトルに対して既知物質のスペクトルの類似度を点数化する。スペクトルの全体を比較しても良いし、一部のみを比較しても良い。
・類似点数の高いものをリストアップ(このリストをヒットリストと呼ぶ)する。
・ヒットリスト中のスペクトルや物質名等の付随情報を必要に応じて表示する。
【0003】
また、官能基のピーク位置情報を所定の記憶領域に保存しておき、未知物質のスペクトルに存在するピークの位置から、その未知物質中に含まれる可能性のある官能基を示すという機能を備えたシステムやプログラムも存在している。
例えば特許文献1には、赤外線スペクトルデータを用いて未知化合物が含有する官能基の種類を推定する官能基推定方法において、その精度を高めるために、ニューラルネットワークを利用するものが開示されている。
【0004】
【特許文献1】特開平06-050890号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の未知物質同定システムでは、検索結果として類似度点数の高い順に並べられたヒットリストが示されるのみであり、必ずしもヒットリストで一位のものが正しく未知物質を示しているとは限らない。また、ヒットリストが表示されるだけであって、ライブラリ中に未知物質に対応する物質や類似した物質が存在していない、ということは示されない。
【0006】
このため、分析者は得られたヒットリスト上位のスペクトルと未知物質のスペクトルとを実際に見比べて、未知物質を特定する物質、又は未知物質に類似した物質がヒットしているかどうかを確認しなければならない。この確認作業は分析者が手作業(目視)で行うため、時間が掛かるという問題があった。また、知識、経験、主観などが影響するため、分析者によって最終的な結果に大きな違いが生じるおそれがあった。更に、未知試料が混合物である場合、スペクトルの形状を支配している主成分や赤外吸収の強い成分(赤外スペクトルの場合)については情報を得やすいが、吸収の小さな成分に関する情報はあまり得られないという問題もあった。
【0007】
一方、官能基を提示するシステムでは、得られる情報が官能基に限られる。このため、スペクトルに関する知見と化学的な知識を持ち合わせた分析者でも、この官能基に関する情報のみで未知試料がどのような化合物であるかを特定することは容易ではない。
【0008】
本発明は上述したような課題を解決するために成されたものであり、その目的とするところは、分析者の知識や経験による影響を受けることなく迅速に物質の特定を行うことができ、更に、主成分だけでなく副成分に関しても情報を提示することができるシステムを提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するために成された本発明に係るデータ処理装置は、未知物質のスペクトルに基づき、該未知物質の同定を行うデータ処理装置であって、
a)既知物質のスペクトルを集積したスペクトルライブラリと、
b)前記スペクトルライブラリに含まれる複数の既知物質のスペクトルについて、そのスペクトル固有のピーク位置情報と、そのスペクトルを識別可能な情報又はそのスペクトルに対応した既知物質を識別可能な情報とを対応付けて記憶しておくピークテーブルと、
c)未知物質のスペクトルに対し、前記スペクトルライブラリに含まれている既知物質のスペクトルの中から類似性の高いスペクトルを候補として複数選択するスペクトル検索部と、
d)前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが最上位から所定の順位までに含まれるスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を主成分として判定する主成分判定部と、
e)前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが前記主成分判定部による判定の対象となったものより低い順位のスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を副成分として判定する副成分判定部と、を備えることを特徴とする。
【0010】
また、本発明に係るデータ処理プログラムは、既知物質のスペクトルを集積したスペクトルライブラリと、前記スペクトルライブラリに含まれる複数の既知物質のスペクトルについて、そのスペクトル固有のピーク位置情報と、そのスペクトルを識別可能な情報又はそのスペクトルに対応した既知物質を識別可能な情報とを対応付けて記憶しておくピークテーブルと、にアクセス可能なコンピュータを、
未知物質のスペクトルに対し、前記スペクトルライブラリに含まれている既知物質のスペクトルの中から類似性の高いスペクトルを候補として複数選択するスペクトル検索部と、
前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが最上位から所定の順位までに含まれるスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を主成分として判定する主成分判定部と、
前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが前記主成分判定部による判定の対象となったものより低い順位のスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を副成分として判定する副成分判定部と、して動作させることを特徴としている。
【発明の効果】
【0011】
本発明に係るデータ処理装置によれば、スペクトルの検索を行った後に更にピーク照合を行うため、正確な同定結果を得ることができるうえ、同定結果が分析者の経験や知識に大きく依存してしまうことも無くなる。また、主成分だけでなく副成分に関する情報も同時に得ることができるため、分析者に求められる手間や労力が小さくて済む。
【0012】
また、主成分や副成分に該当する物質が存在していなかった場合には、該当する物質がないという情報を結果として表示させることができるから、同定処理の信頼性を一層高くすることができる。
【発明を実施するための最良の形態】
【0013】
以下、本発明に係るデータ処理装置の実施例について図面を参照しつつ説明を行う。
【0014】
図1に本発明の一実施例に係るデータ処理装置1のハードウェア構成を示す。中央演算処理装置であるCPU10にメモリ12、CRT(Cathode Ray Tube)等から成るモニタ14、キーボードやマウスなどを含む入力部16、ハードディスクやフラッシュメモリ等から成る記憶部20が接続されている。記憶部20には、データ処理プログラム21、スペクトルライブラリ22、ピークテーブル23、オペレーティングシステム(OS)24等が記憶されている。
【0015】
また、図1に描かれているように、データ処理プログラム21には、スペクトル検索部25、主成分判定部26、副成分判定部27が含まれている。これらはいずれもCPU10がデータ処理プログラム21を実行することによってソフトウェア的に具現化される構成である。
【0016】
また、本実施例に係るデータ処理装置1にはネットワークケーブルNWが備えられており、LAN(Local Area Network)などのネットワークを介して所定の装置(非図示)と接続されている。本実施例では、データ処理装置1に赤外分光光度計が接続されており、その赤外分光光度計によって取得された赤外スペクトルを未知物質のスペクトルとして同定処理を行うものとする。
【0017】
本実施例に係るデータ処理装置1によってデータ処理を行うにあたり、予め用意しておくスペクトルライブラリ22及びピークテーブル23について説明する。
【0018】
スペクトルライブラリ22は既知物質のスペクトルが多数格納された一種のデータベースである。ここでは市販されているライブラリを用いても良いし、ユーザが予め赤外分析を行うことによって得た多数のスペクトルが集積されたライブラリを用いても良い。もちろん、複数のライブラリを組み合わせることもできる。
【0019】
ピークテーブル23は、スペクトルライブラリ22に含まれる各スペクトルに現れる主要なピークの波数が列挙されたテーブルである。ピークテーブル23には、スペクトルライブラリに含まれる複数の既知物質のスペクトルについて、そのスペクトル固有のピーク位置情報と、そのスペクトルを識別可能な情報又はそのスペクトルに対応した既知物質を識別可能な情報とを対応付けて記憶しておく。このようなピークテーブル23の例を図2に示す。図2の例では、必須ピーク(波数1〜3で示されるもの)と、他ピーク(波数4〜10で示されるもの)とが含まれているが、これに限定するものではない。
【0020】
以下、本実施例に係るデータ処理装置1を用いてデータ処理を行う際の処理について、図3のフローチャートを参照しつつ説明する。
【0021】
まず、CPU10がデータ処理プログラム21を実行している状態において、ユーザが入力部16を操作すること等により、未知物質データ(未知物質スペクトル)の選択を行う(ステップS1)。
【0022】
次に、スペクトル検索部25は、前記ステップS1において指定された未知物質スペクトルに対して、ノイズ成分や他の誤差要因を除去するために各種の補正を行う。具体的には、ベースの曲がりを補正するためのベースライン補正、拡散反射法で測定されたスペクトルに対してはクベルカ・ムンク変換、そのほかATR補正などを行う。
【0023】
スペクトル検索部25は、この未知物質スペクトルに対してスペクトルライブラリ22の中から未知物質のスペクトルの形状に類似した形状を有する既知物質のスペクトルを候補スペクトルとして複数個探し出す(ステップS2)。ここでスペクトル検索部25が用いる類似性検索アルゴリズムには、従来より用いられている各種のアルゴリズムを採用することができる。例えば、絶対差、一次微分差、差の二乗、微分差の二乗、ユークリッド誤差、個体相関係数等のいずれか、または2種以上の組み合わせを利用することができる。スペクトル検索部25は、類似性の判定結果を点数として算出する。そして、スペクトル検索部25は、所定の点数以上のスペクトルを候補スペクトルとして選択したり、点数が高いものから順に、所定の順位までに含まれるスペクトルを候補スペクトルとして選択したりする。例えば点数が上位20位までのスペクトルを候補スペクトルとして選択する。
【0024】
次に、ステップS3において主成分判定部26は、前記ステップS2において候補スペクトルとして選択された既知物質のスペクトルのうち、類似性の高さが最上位から所定の順位までに含まれるスペクトル(即ち、所定の点数以上のスペクトル、または点数が最も高いものから所定順位までのスペクトル。例えば候補スペクトルのうち、上位10位までのスペクトルを対象とすることができる。)について、以下のようにしてピーク照合処理を行う。
【0025】
まず、未知物質スペクトルを、そのスペクトルに含まれるピーク強度が一定の大きさとなるように規格化する。次に、ピークテーブル23を参照し、ある成分に関して必須ピーク(図2における波数1〜3)が全て存在しているか否かを確認する。必須ピークが一つでも適合しない(存在しない)場合には、その物質は未知物質には含まれていないものと判定する。必須ピークが全て適合した場合、他ピークに関する照合を行う。ここでは例として、適合しないピークの数が0個、1個、2個、3個以上という四つの段階を設定しておき、0個の場合には「◎」、1個の場合には「○」、2個の場合には「△」というランクを付す。適合しないピークの数が3個以上の場合には、その物質は未知物質には含まれていないものであると判定する。
【0026】
以上のようにして主成分判定部26は適合しないピークの数が0〜2個のものを、それぞれに「◎」「○」「△」といったランク付けを行いつつ、主成分として判定する。ステップS3において対象となった候補スペクトルの全てが、未知物質に含まれていないものと判定されたとしても、データ処理プログラム21は処理を続行する。
【0027】
次に、ステップS4において副成分判定部27は、前記ステップS2において候補スペクトルとして選択された既知物質のうち、前記ステップS3でピーク照合の対象とならなかったスペクトルについてピーク照合を行う。例えば点数が11位から20位までの候補スペクトルを対象としてピーク照合を行う。
【0028】
副成分判定部27が行うピーク照合処理は、先に述べた主成分判定部26が行う照合処理と同一とすることができる。即ち、副成分判定部27はまず、知物質スペクトルをそのスペクトルに含まれるピーク強度が一定の大きさとなるように規格化する。又は、前記ステップS3において主成分判定部26が行った規格化の結果を用いることもできる。
次にピークテーブル23を参照し、ある成分に関して必須ピーク(図2における波数1〜3)が全て存在しているか否かを確認する。必須ピークが一つでも適合しない(存在しない)場合には、その物質は未知物質には含まれていないものと判定する。必須ピークが全て適合した場合、他ピークに関する照合を行う。適合しないピークの数が0個、1個、2個、3個以上という四つの段階を設定しておき、0個の場合には「◎」、1個の場合には「○」、2個の場合には「△」というランクを付す。適合しないピークの数が3個以上の場合には、その物質は未知物質には含まれていないものであると判定する。
【0029】
以上のようにして副成分判定部27は適合しないピークの数が0〜2個のものを、それぞれに「◎」「○」「△」といったランク付けを行いつつ、副成分として判定する。ステップS4において対象となった候補スペクトルの全てが、未知物質に含まれていないものと判定されたとしても、データ処理プログラム21は処理を続行する。
【0030】
次に、データ処理プログラム21は、ステップS3及びステップS4において主成分判定部26及び副成分判定部27によって判定された主成分と副成分とをモニタ14に処理結果として表示する(ステップS5)。主成分に該当する物質が無かった場合、また、副成分に該当する物質が無かった場合には、その旨を表示する。
【0031】
図4にステップS5においてモニタ14に表示される処理結果の画面例を示す。主成分としてポリエチレンが、副成分としてポリアミド(ナイロン系)およびシリカゲル(SiO2)がランクとともに表示されている。なお、図4の画面においてユーザが或る成分(例えばポリエチレン)を指定した後に「表示」ボタンを押下することにより、データ処理プログラム21は、その指定された成分のスペクトルと未知物質のスペクトルとを重ねて一つの画面に表示させる(例えば図5)。
【0032】
このようにしてデータ処理装置1によって行われるデータ処理が終了する。他の未知物質に関してデータ処理を行う場合には、再度ステップS1から処理を行えば良い。
【0033】
以上、本発明に係るデータ処理装置1の動作について具体的に説明を行ったが、これらはあくまでも例に過ぎないことは明らかであり、本発明の精神内において適宜に改良や変更、追加を行ったとしても構わない。
【0034】
一般に、スペクトルの形状やピーク位置は測定方法や測定条件などの違いによって若干の差が生じることがある。このため、例えば上記実施例では、透過もしくは正反射スペクトル用のスペクトルライブラリ及びピークテーブルとATRスペクトル用のスペクトルライブラリ及びピークテーブルとを別途用意しておき、データ処理の開始時点で、ユーザが未知物質スペクトルに合わせて選択できるようにしても良い。
【0035】
また、主成分判定部26及び副成分判定部27が行うピーク照合処理において、未知物質スペクトルのピークが飽和することがある。この場合、即ち、強度が一定の値以上のピークを検出した場合には、スペクトルが飽和している可能性がある旨を示すメッセージをモニタ14上に表示して、処理を続行するかどうかをユーザに指定させるようにしても良い。
また、ピークの強度が一定の値よりも小さい場合には、「ピークが見つかりませんでした」といったメッセージをモニタ14上に表示して、処理を中止するようにすることができる。
【0036】
上記の例では、スペクトルとして赤外スペクトルを対象としたデータ処理を行う場合について説明したが、本発明に係るデータ処理装置は、スペクトルとして赤外スペクトル以外のものを対象とすることができる。一般に「スペクトル」と称されるものだけでなく、「クロマトグラム」等をはじめとするデータにも適用することができる。
【図面の簡単な説明】
【0037】
【図1】本発明に係るデータ処理装置の一実施例のハードウェア構成を示す図。
【図2】ピークテーブルの例。
【図3】本実施例に係るデータ処理装置が行うデータ処理の一例を示すフローチャート。
【図4】処理結果の表示画面の例。
【図5】主成分又は副成分として判定された物質のスペクトルと、未知物質のスペクトルとを重ねて表示する画面の例。
【符号の説明】
【0038】
1…データ処理装置
10…CPU
12…メモリ
14…モニタ
16…入力部
20…記憶部
21…データ処理プログラム
22…スペクトルライブラリ
23…ピークテーブル
24…OS
25…スペクトル検索部
26…主成分判定部
27…副成分判定部

【特許請求の範囲】
【請求項1】
未知物質のスペクトルに基づき、該未知物質の同定を行うデータ処理装置であって、
a)既知物質のスペクトルを集積したスペクトルライブラリと、
b)前記スペクトルライブラリに含まれる複数の既知物質のスペクトルについて、そのスペクトル固有のピーク位置情報と、そのスペクトルを識別可能な情報又はそのスペクトルに対応した既知物質を識別可能な情報とを対応付けて記憶しておくピークテーブルと、
c)未知物質のスペクトルに対し、前記スペクトルライブラリに含まれている既知物質のスペクトルの中から類似性の高いスペクトルを候補として複数選択するスペクトル検索部と、
d)前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが最上位から所定の順位までに含まれるスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を主成分として判定する主成分判定部と、
e)前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが前記主成分判定部による判定の対象となったものより低い順位のスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を副成分として判定する副成分判定部と、
を備えることを特徴とするデータ処理装置。
【請求項2】
既知物質のスペクトルを集積したスペクトルライブラリと、
前記スペクトルライブラリに含まれる複数の既知物質のスペクトルについて、そのスペクトル固有のピーク位置情報と、そのスペクトルを識別可能な情報又はそのスペクトルに対応した既知物質を識別可能な情報とを対応付けて記憶しておくピークテーブルと、
にアクセス可能なコンピュータを、
未知物質のスペクトルに対し、前記スペクトルライブラリに含まれている既知物質のスペクトルの中から類似性の高いスペクトルを候補として複数選択するスペクトル検索部と、
前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが最上位から所定の順位までに含まれるスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を主成分として判定する主成分判定部と、
前記スペクトル検索部によって候補として選択された既知物質のスペクトルのうち、類似性の高さが前記主成分判定部による判定の対象となったものより低い順位のスペクトルについて、前記ピークテーブルに保存されているピーク位置情報と未知物質のスペクトルとを照らし合わせることによりピーク照合処理を行い、該ピーク照合処理による結果が予め定められた基準を満たす既知物質を副成分として判定する副成分判定部と、
して動作させることを特徴とするデータ処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−109449(P2009−109449A)
【公開日】平成21年5月21日(2009.5.21)
【国際特許分類】
【出願番号】特願2007−284761(P2007−284761)
【出願日】平成19年11月1日(2007.11.1)
【出願人】(000001993)株式会社島津製作所 (3,708)
【Fターム(参考)】