説明

振動スペクトル分析方法

【課題】スペクトル線形の相関が高い成分の種類や相対量が試料毎に変動する場合においても、精度良く試料の分類や成分の検量を行う。
【解決手段】複数の未知混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の未知試料ラマンデータセットを選択し(S13)、分類基準分子のスペクトルのうち、未知試料ラマンデータセットと同一測定条件で取得されたスペクトルを選択し(S15)、未知試料ラマンデータセットからPCAローディングを算出し(S14)、算出されたPCAローディングと、選択された分類基準分子のスペクトルとの相関を算出し(S16)、測定条件の異なる複数の未知試料ラマンデータセットから算出されたPCAローディングのうち、分類基準分子のスペクトルとの相関が最も高いPCAローディングを決定する(S18)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、振動スペクトル分析方法に関するものである。
【背景技術】
【0002】
従来、多数種の分子を含む生体試料の化学的状態の分類や、生体試料に含まれる成分の濃度推定(検量)を行うために、生体試料の振動スペクトル(ラマンスペクトル、もしくは赤外吸収スペクトル)を取得し、取得された振動スペクトルにおける全周波数領域の強度情報を変量として取り扱う多変量解析(ケモメトリックス)の手法が採用されている(例えば、特許文献1参照。)。
【0003】
このようなケモメトリックスの手法によれば、生体試料に含まれる各成分が与える振動バンド(ラマンバンドもしくは赤外吸収バンド)がスペクトル上で重畳された結果、試料の振動スペクトルが複雑なスペクトルの強度パターン(スペクトル線形)を呈している場合であっても、取得された振動スペクトルにおいて、各成分が与えるスペクトル線形の相関が低くなっている周波数領域がありさえすれば、振動スペクトルの情報にもとづいて生体試料の化学的状態の分類や検量ができる。
【0004】
具体的には、生体試料に含まれる核酸とタンパク質は、その化学組成や分子構造が大きく異なっているために、それらの振動スペクトルのスペクトル線形の相関は低い。あるいは生体試料に含まれる複数の種類のタンパク質において、特定のアミノ酸側鎖の出現頻度や立体構造(2次構造もしくは3次構造)に著しい相違があれば、それらのタンパク質間におけるスペクトル線形の相関も低くなっている。
【0005】
分析対象となる生体試料において、このようなスペクトル線形の相関の低い成分(分子)の種類や相対量が試料毎に変動する場合には、振動スペクトルに対して主成分分析(Principle Component Analysis, 以下、PCAという。)を実行し、主成分のスコアプロット(PCAスコアプロット)の分布から試料の状態を分類することが可能である。また、参照試料の振動スペクトルにもとづいて検量線を作成し、試料に含まれる成分の濃度を推定することも可能である。
【0006】
ケモメトリックスでは検量線は検量行列を算出することで作成され、検量行列を算出するアルゴリズムとして、PCAの結果を使用しないCLS(Classical Least Square Fitting)、ILS(Inverse Least Squares Fitting)法と、PCA結果(PCAスコア値)に準拠するPCR(Principle Component Regression)、PLS(Partial Least Squares Fitting)法が採用されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】米国特許第6341257号明細書
【非特許文献】
【0008】
【非特許文献1】Max Diem, Peter R Griffiths and John M Chalmers, ”Vibrationalspectroscopy for medical diagnosis” (2008, John Wiley & Sons)
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかし実際には、生体試料が細胞や組織あるいは体液である場合、試料にはタンパク質に代表されるように、化学組成が類似し、かつ立体構造も極端に異ならない多種類の分子が含まれている。したがって、試料には核酸とタンパク質のように振動スペクトルのスペクトル線形の相関が低い成分も含まれているが、スペクトル相関が高い成分も含まれていることが一般的である。このようにスペクトル相関の高い成分が含まれる例として、試料に含まれる複数種のタンパク質に含まれるアミノ酸側鎖および2次構造に粗い類似性があるか、化学修飾された核酸もしくは同一種類のタンパク質が存在することが考えられる。
【0010】
ケモメトリックスにおいて試料の振動スペクトルは、スペクトルの観測チャンネル(スペクトルにおける周波数軸上の観測点)を座標軸とし、各観測チャンネルにおけるスペクトル強度をその座標軸における変量とする多次元空間(多変量空間)における、空間上の1点として表現される。よって複数の試料の振動スペクトルは多変量空間において複数の分散点として表現される。PCAはこのような多変量空間上における振動スペクトルの点群分布の特徴を量的に捉えられるように、多変量空間において座標軸(PCAローディング)を再設定し、PCAローディングで張られる空間における振動スペクトルの位置情報(PCAスコア)にもとづいて試料を分類する方法である。
【0011】
上述したような、生体試料においてスペクトル線形の相関が高い成分が存在し、それらの種類や相対量が試料毎に変動している状況においては、試料の振動スペクトルを多変量空間の点に対応させたときに、スペクトルは空間の同一領域に集中し、空間分散が小さくなってしまう。したがってスペクトルの空間分散の広がりを評価するPCAでは、試料スペクトルの分類精度を欠くか分類自体が不可能である。また検量目的においても、PCR法およびPLS法はPCAに基づく手法(PCAのスコアから検量行列を算出する)であり、成分の相対濃度に関わらず試料のスペクトルのPCAスコアが不変となるために、成分を区別して検量することが不可能である。また同様に検量目的において採用されるCLSにおいては、検量行列を算出する際に必要となる試料の各成分のスペクトル(CLSローディング)の相関が高くなる(スペクトルの共線性)ために検量精度が悪化する。その結果、未知混合試料の分類や成分検量等の分析を精度良く行うことができないという不都合がある。
【0012】
本発明は、上述した事情に鑑みてなされたものであって、スペクトル線形の相関が高い成分の種類や相対量が試料毎に変動する場合においても、精度良く試料の分類や成分の検量を行うことができる振動スペクトル分析方法を提供することを目的としている。
【課題を解決するための手段】
【0013】
上記目的を達成するために本発明は以下の手段を提供する。
本発明は、複数の未知の成分を未知の混合比で含む複数の未知混合試料について、各前記未知混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択するデータセット選択ステップと、所望の成分が前記未知混合試料の中においてどれほどの割合で含まれているかの程度に応じて、前記未知試料の化学的な状態の分類を実行する場合において、該所望の成分として定められる分類基準分子のスペクトルのうち、前記データセット選択ステップにおいて選択された未知試料ラマンデータセットと同一測定条件で取得されたスペクトルを選択するスペクトル選択ステップと、前記データセット選択ステップにおいて選択された未知試料ラマンデータセットに対してPCAを実行し、PCAローディングを算出する算出ステップと、該算出ステップにおいて算出されたPCAローディングと、前記スペクトル選択ステップにおいて選択された分類基準分子のスペクトルとのスペクトル波形の相関を算出する相関算出ステップと、測定条件の異なる複数の未知試料ラマンデータセットから算出されたPCAローディングのうち、前記分類基準分子のスペクトルとのスペクトル波形の相関が最も高いPCAローディングを決定する決定ステップとを含む振動スペクトル分析方法を提供する。
【0014】
本発明によれば、未知混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータの中から選択された未知試料ラマンデータセット毎にPCAローディングを算出し、算出された全てのPCAローディングの中で、分類基準分子のスペクトルとの相関が最も高いPCAローディングを決定するので、多変量空間において方向が縮退したスペクトルに回転・拡大操作を施して、未知混合試料のスペクトルの分散に対する分類基準分子のスペクトル分散の寄与を最大化することができる。その結果、分類を所望する分類基準分子のスペクトルと相関の高い主成分のローディング情報を抽出でき、この主成分ローディングを利用して、分類基準分子の濃度の差異に基づいて未知混合試料を精度よく分類することができる。
【0015】
上記発明においては、前記決定ステップにおいて決定されたPCAローディングに対してPCAスコアをプロットすることにより前記試料を分類する分類ステップを含んでいてもよい。
このようにすることで、分類を所望する分類基準分子のスペクトルと相関の高い主成分のローディング情報であるPCAローディングを利用して、PCAスコアのプロットにより、簡易に未知混合試料を精度よく分類することができる。
【0016】
また、本発明は、複数の既知の成分を既知の混合比で含む複数の参照混合試料について、各前記参照混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記参照混合試料のラマンスペクトルデータからなる参照試料ラマンデータセットを選択する参照試料データセット選択ステップと、該参照試料データセット選択ステップにおいて選択された参照試料ラマンデータセットから複数のCLSローディングを算出する算出ステップと、該算出ステップにおいて算出された複数のCLSローディング間の相関を算出する相関算出ステップと、測定条件の異なる複数の参照試料ラマンデータセットのうち、前記相関算出ステップにおいて算出されたCLSローディングの相関が最も低い検量用データセットを決定する決定ステップと、該決定ステップにおいて決定された検量用データセットを用いて検量行列を算出する検量行列算出ステップと、前記決定ステップにおいて決定された検量用データセットと同一測定条件で測定された、複数の未知の成分を未知の混合比で含む1以上の未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択する未知試料データセット選択ステップと、該未知試料データセット選択ステップにおいて選択された前記未知試料ラマンデータセットに前記行列算出ステップにおいて算出された検量行列を乗算する検量ステップとを含む振動スペクトル分析方法を提供する。
【0017】
本発明によれば、参照混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータの中から選択された参照試料ラマンデータセット毎に複数のCLSローディングを算出し、算出されたCLSローディング間の相関が最も低い検量用データセットを決定する。そして、決定された検量用データセットから算出した検量行列を未知試料ラマンデータセットに乗算することで、多変量空間において未知混合試料中の成分スペクトルに回転・拡大操作を施して、未知混合試料の各成分スペクトルの相関を低下させて精度よく検量することができる。
【0018】
また、本発明は、複数の既知の成分を既知の混合比で含む複数の参照混合試料について、各前記参照混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記参照混合試料のラマンスペクトルデータからなる参照試料ラマンデータセットを選択する参照試料データセット選択ステップと、検量を所望する成分である検量対象分子のスペクトルのうち、前記参照試料データセット選択ステップにおいて選択された参照試料ラマンデータセットと同一測定条件で取得されたスペクトルを選択するスペクトル選択ステップと、前記参照試料データセット選択ステップにおいて選択された参照試料ラマンデータセットからPCAローディングを算出する算出ステップと、該算出ステップにおいて算出されたPCAローディングと、前記スペクトル選択ステップにおいて選択された検量対象分子のスペクトルとの相関を算出する相関算出ステップと、測定条件の異なる複数の参照試料ラマンデータセットから算出されたPCAローディングのうち、前記検量対象分子のスペクトルとの相関が最も高いPCAローディングを決定する決定ステップと、該決定ステップにおいて決定された参照試料ラマンデータセットを用いて検量行列を算出する検量行列算出ステップと、前記決定ステップにおいて決定された参照試料ラマンデータセットと同一測定条件で測定された、複数の未知の成分を未知の混合比で含む複数の未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択する未知試料データセット選択ステップと、該未知試料データセット選択ステップにおいて選択された前記未知試料ラマンデータセットに前記行列算出ステップにおいて算出された検量行列を乗算する検量ステップとを含む振動スペクトル分析方法を提供する。
【0019】
本発明によれば、参照混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータの中から選択された参照試料ラマンデータセット毎にPCAローディングが算出され、選択された参照試料ラマンデータセットと同一測定条件で取得された検量対象分子のスペクトルとの相関が最も高い参照試料ラマンデータセットを用いて検量行列が算出される。そして、算出された検量行列を未知試料ラマンデータセットに乗算することで、多変量空間において成分スペクトルに回転・拡大操作を施して、未知混合試料のスペクトルの分散に対する検量対象分子のスペクトル分散の寄与を最大化することができる。その結果、検量を所望する検量対象分子のスペクトルと相関の高い主成分のローディング情報を抽出でき、この主成分ローディングを利用して、未知混合試料の各成分を精度よく検量することができる。
【0020】
また、本発明は、複数の未知の成分を未知の混合比で含む複数の未知混合試料について、各前記未知混合試料において測定条件を異ならせて第1の周波数領域で取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択する未知試料データセット選択ステップと、該データセット選択ステップにおいて選択された各前記未知混合試料のラマンスペクトルデータと、各前記未知混合試料について、前記第1の周波数領域とは異なる周波数領域で取得された未知試料外部ラマンスペクトルデータとを結合して未知試料拡張ラマンデータセットを生成する未知試料データ結合ステップと、分類を所望する成分である分類基準分子について第2の周波数領域で取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、前記データセット選択ステップにおいて選択された前記未知試料ラマンデータセットと同一測定条件で取得されたスペクトルを選択する基準分子スペクトル選択ステップと、該基準分子スペクトル選択ステップにおいて選択されたスペクトルと、前記分類基準分子について前記第2の周波数領域とは異なる周波数領域で取得された基準分子外部ラマンスペクトルとを結合して基準分子拡張ラマンデータを生成する基準分子データ結合ステップと、前記未知試料データ結合ステップにおいて生成された未知試料拡張ラマンデータセットからPCAローディングを算出する算出ステップと、該算出ステップにおいて算出されたPCAローディングと、前記基準分子データ結合ステップにおいて生成された基準分子拡張ラマンデータとの相関を算出する相関算出ステップと、測定条件の異なる複数の未知試料拡張ラマンデータセットから算出されたPCAローディングのうち、前記基準分子拡張ラマンデータとの相関が最も高いPCAローディングを決定する決定ステップとを含む振動スペクトル分析方法を提供する。
【0021】
本発明によれば、未知試料ラマンデータセットおよび分類基準分子のスペクトルに、異なる周波数領域で取得された未知試料外部ラマンスペクトルデータおよび基準分子外部ラマンスペクトルを結合して未知試料拡張ラマンデータセットおよび基準分子拡張ラマンデータを生成するので、多変量空間において方向が縮退したスペクトルに回転・拡大操作を施して、未知混合試料のスペクトルの分散に対する分類基準分子のスペクトル分散の寄与を拡大することができる。その結果、分類を所望する分類基準分子のスペクトルと相関の高い主成分のローディング情報を抽出でき、この主成分ローディングを利用して、分類基準分子の濃度の差異に基づいて未知混合試料を精度よく分類することができる。
【0022】
上記発明においては、前記決定ステップにおいて決定されたPCAローディングに対してPCAスコアをプロットすることにより前記未知混合試料を分類する分類ステップを含んでいてもよい。
このようにすることで、分類を所望する分類基準分子のスペクトルと相関の高い主成分のローディング情報であるPCAローディングを利用して、PCAスコアのプロットにより、簡易に未知混合試料を精度よく分類することができる。
【発明の効果】
【0023】
本発明によれば、スペクトル線形の相関が高い成分の種類や相対量が試料毎に変動する場合においても、精度良く試料の分類や成分の検量を行うことができるという効果を奏する。
【図面の簡単な説明】
【0024】
【図1】本発明の第1の実施形態に係る振動スペクトル分析方法を示すフローチャートである。
【図2】図1の振動スペクトル分析方法において用いられる複数の未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットおよび分類基準分子の基準分子ラマンスペクトルデータの一例を示す図である。
【図3】本発明の第2の実施形態に係る振動スペクトル分析方法を示すフローチャートである。
【図4】図3の振動スペクトル分析方法において用いられる複数の参照混合試料のラマンスペクトルデータからなる参照試料ラマンデータセットおよび未知混合試料の未知試料ラマンスペクトルデータの一例を示す図である。
【図5】本発明の第3の実施形態に係る振動スペクトル分析方法を示すフローチャートである。
【図6】本発明の第4の実施形態に係る振動スペクトル分析方法を示すフローチャートである。
【図7】図6の振動スペクトル分析方法において用いられる複数の未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットおよび分類基準分子の基準分子ラマンスペクトルデータのおよびこれらの外部ラマンスペクトルの一例を示す図である。
【図8】図7の未知試料ラマンデータセットと外部ラマンスペクトルとを結合した未知試料拡大ラマンデータセットおよび分類基準分子の基準分子ラマンスペクトルデータと外部ラマンスペクトルとを結合した基準分子拡大ラマンスペクトルの一例を示す図である。
【発明を実施するための形態】
【0025】
本発明の第1の実施形態に係る振動スペクトル分析方法について、図面を参照して説明する。本実施形態に係る振動スペクトル分析方法は、分析対象である複数の未知混合試料のスペクトルを、所望の分類基準分子のスペクトル情報にもとづいてPCAにより分類する方法である。
【0026】
ここで、未知混合試料とは、振動スペクトルデータ(ラマンスペクトルデータ、あるいは赤外吸収スペクトルデータであってもよい)の取得および該スペクトルデータに対するケモメトリックス解析の結果に基づいて分析される試料であって、複数の未知の成分を未知の混合比で含んでいる。例えば、細胞や、組織、体液のような複数の種類の分子(核酸、タンパクA、タンパクB、…、脂質、糖類、その他情報伝達分子や補酵素などの生体内小分子等)を含む混合物質が想定される。用意される未知混合試料は1以上あればよい。
【0027】
ここで、分類基準分子とは、PCAにより未知混合試料を分類する際の分類基準となる分子であって、例えば、特定のタンパク質分子であったり、特定の脂質や糖分子であったりすることが想定される。分類基準分子としては、1種類の分子を用意してもよいし、2種以上の分子を用意してもよい。
【0028】
本実施形態に係る振動スペクトル分析方法は、図1に示されるように、未知混合試料および分類基準分子のラマンデータセットを取得する。ここで、図2に示されるように複数の未知混合試料および分類基準分子に対して複数の異なる測定条件、すなわち図2のC1〜C3を定めておいてスペクトル線形の異なるラマンスペクトルを取得する。図2にはC1〜C3の3つの異なる測定条件を示されているが、この測定条件数は複数であれば任意である。次に、以下において、スペクトル線形の異なるラマンスペクトルを取得する方法について詳述する。
【0029】
非線形ラマン散乱法においては、ラマンスペクトルを取得する際の、試料への光照射条件や検出条件を変えることで、同一の試料の同一周波数領域においてスペクトル線形の異なるラマンスペクトルを複数取得することができる。例えば、試料に照射するラマン散乱励起用の2色のレーザ光の偏光に相対的な角度を設定するか、さらにもしくは、ラマン散乱をプローブするためのレーザ光の偏光についても相対的な角度を設定すれば、信号光の有する偏光の向きは、試料に含まれる各成分(分子種)のラマンバンドの偏光解消度に応じて分散する。この場合、検光子の透過軸の角度を変化させるなど信号光に対する偏光選択条件を異ならせて信号を測定すれば、すなわち、信号の測定条件を異ならせて測定することで、試料に含まれる各成分が与えるラマンバンドの偏光解消度の差異に起因するスペクトル線形の異なるラマンスペクトルを複数取得できる。あるいは試料に照射するレーザ光の相対的な偏光角度を変更するようにしてもよい。このようにすれば少なくとも異なる2つの測定条件を選択することができる。
【0030】
このような非線形ラマン散乱法としては、SRS(誘導ラマン散乱法)、CARS(コヒーレントアンチストークスラマン散乱法)、CSRS(コヒーレントストークスラマン散乱法)、ISRS(インパルシブ誘導ラマン散乱法)、RIKES(ラマン誘起カー効果分光法)、あるいはこれらの検出法を包含する形態としての四光波混合過程にもとづく振動分光法があげられる。また、線形ラマン散乱法(自発ラマン散乱法)であっても、ラマン散乱励起用のレーザ光の偏光を設定した上で、検光子の透過軸の角度を変えることで信号の偏光選択条件を異ならせて測定すれば、スペクトル線形の異なるラマンスペクトルを複数取得できる。
【0031】
あるいは、スペクトル線形の異なるラマンスペクトルを取得する方法は次のような手法であってもよい。上述の非線形ラマン散乱法においては、ラマン散乱励起用の2色のレーザ光に対してプローブレーザ光に時間的な遅延をつけて試料に照射すれば、各時間遅延における信号光のラマンスペクトルのバンド強度は、試料に含まれる成分(分子)の振動モードが有する振動位相緩和時間に依存して変化する(時間分解CARS法)。またラマン散乱励起用の2色のレーザ光をマルチパルス化した上で、マルチパルスの繰り返し時間を掃引する場合にも、信号光のラマンスペクトルのバンド強度は、同様に振動モードの振動位相緩和時間に依存して変化する(マルチパルスインパルシブ誘導ラマン散乱法)。したがって試料に照射するレーザ光のタイミングを異ならせて信号を測定する場合においても、スペクトル線形の異なるラマンスペクトルを複数取得できる。
【0032】
またあるいは、非線形ラマン散乱法において照射レーザ光の偏光や照射タイミング、信号光の偏光選択などの測定条件を異ならせてスペクトル線形の異なるスペクトルを取得するのに加えて、非線形ラマン散乱とは異なる測定法を付加することにより、少なくとも二つの異なる分光法を用いてスペクトル線形を異ならせるようにしても良い。この場合に付加する異なる測定法の一例をあげれば、自発ラマン散乱法(非共鳴ラマン散乱、共鳴ラマン散乱)である。
【0033】
またあるいは、少なくとも異なる2つの非線形ラマン散乱法を用いて、照射レーザ光の偏光や照射タイミング、信号光の偏光選択などの測定条件を異ならせることで、スペクトル線形の異なるスペクトルを取得することとしてもよい。
【0034】
図1に示されるように、まず、分類基準分子において、測定条件C1〜C3を切り替えてラマンスペクトルを取得することにより、スペクトル線形の異なるラマンスペクトルデータからなる基準分子ラマンデータセットを取得しておく(ステップS11)。図2においては、1種類の分類基準分子P1について基準分子ラマンデータセットF1〜F3を取得した場合を示している。
【0035】
次に、未知混合試料U1〜U3の複数のラマンスペクトルデータからなる未知試料ラマンデータセットEを取得する(ステップS12)。
未知混合試料U1〜U3については、図2に示されるように、複数の未知混合試料U1〜U3の各々に対して測定条件C1〜C3を異ならせてスペクトル線形の異なるラマンスペクトルを取得する。前記ラマンスペクトルの取得に際しては、各未知混合試料U1〜U3について測定を行う。これにより、未知混合試料U1〜U3毎に、測定条件C1〜C3を異ならせて取得された複数のラマンスペクトルデータが得られる。すなわち、測定条件数と未知混合試料数の積の数だけ存在するラマンスペクトルデータで構成される未知試料ラマンデータセットEが取得される。
【0036】
次に、未知試料ラマンデータセットEの中からいずれかの小データセットE1〜E3を選択する(ステップS13)。小データセットE1〜E3は、未知試料ラマンデータセットEのうち、同一測定条件で取得された一組のラマンスペクトルデータを言う。例えば、図2に示す例では、各未知混合試料U1〜U3に対して、それぞれ、3種類の測定条件C1〜C3でラマンスペクトルを取得することによりスペクトル線形の異なるラマンスペクトルデータが取得されており、この中から、最初は、測定条件C1の縦の列の3つのラマンスペクトルデータからなる小データセットE1を選択する。
【0037】
次いで、選択された小データセットE1を用いて、PCAローディングを算出する(ステップS14)。PCAローディングは、測定チャネル軸で張られる多変量空間においてプロットされる、未知混合試料U1〜U3のラマンスペクトルの分散を最大化して捉えるように、多変量空間に再設定された座標軸の方向に向いたベクトルであって、スペクトル様の波形となっている。
PCAローディングの算出は、公知の方法で行われ、小データセットE1に対して1以上のPCAローディングが算出される。
【0038】
ステップS11において取得して基準分子ラマンデータセットF1〜F3の中から、ステップS13において選択された小データセットE1と同一の測定条件C1で測定されたラマンスペクトルデータF1を選択する(ステップS15)。
そして、選択された分類基準分子P1のラマンスペクトルデータF1と、ステップS14において算出された小データセットE1のPCAローディングとの相関が計算される(ステップS16)。すなわち、未知混合試料U1〜U3中に含まれる主成分のローディングであるPCAローディングと、分類基準分子P1のラマンスペクトルデータF1との相関が高い場合には、未知混合試料U1〜U3内における分類基準分子P1の濃度変動を良好に捉える主成分軸を選択することができる。
【0039】
そこで、小データセットE2,E3についてもこれらのステップS13〜S16を繰り返すことにより(ステップS17)、全ての測定条件C1〜C3の未知混合試料U1〜U3の小データセットのPCAローディングと、分類基準分子P1のラマンスペクトルデータF1〜F3との相関が算出され、算出された相関を比較して、最も相関が高いPCAローディングを分類用PCAローディングとして決定する(ステップS18)。そして、決定された分類用PCAローディングを用いて、未知混合試料U1〜U3毎にPCAスコアをプロットする(ステップS19)。これにより未知混合試料U1〜U3を分類基準分子P1について分類する。
【0040】
このように、本実施形態に係る振動スペクトル分析方法によれば、未知混合試料U1〜U3毎に分類基準分子P1の濃度変動を最も良好に捉えることができるPCAローディングに基づいて分類を行うので、多変量空間において方向が縮退したスペクトルに回転・拡大操作を施して、各未知混合試料U1〜U3のスペクトルの分散に対する特定の分類基準分子P1のスペクトル分散の寄与を最大化することができ、未知混合試料U1〜U3を分類基準分子P1について精度よく分類することができるという利点がある。
【0041】
なお、本実施形態においては分類基準分子P1のラマンデータセットF1〜F3の取得の後に、未知混合試料U1〜U3のラマンデータセットEを取得することとしたが、これに代えて、その順序を逆にしてもよい。また、PCAローディングの算出ステップS14と基準分子スペクトルの選択ステップS15とはその順序を入れ替えてもよい。
【0042】
本発明の第2の実施形態に係る振動スペクトル分析方法について、図面を参照して以下に説明する。本実施形態に係る振動スペクトル分析方法は、分析対象である未知混合試料の成分のCLS検量を行う方法である。
【0043】
本実施形態に係る振動スペクトル分析方法は、図3に示されるように、まず、検量行列を算出するための参照混合試料の複数のラマンスペクトルデータからなる参照試料ラマンデータセットを取得する(ステップS1)。
ここで、参照混合試料とは、未知混合試料に含まれる検量対象分子の濃度を検量する際に使用する検量行列を作成するための試料であって、未知混合試料に含まれると予想される既知の複数の成分(例えば、核酸、タンパクA、タンパクB、脂質、糖質、生体内小分子等)の混合比を変えて混合することにより作成された物質である。参照混合試料は、例えば、混合溶液であって、既知の異なる混合比のものが複数種類準備される。
【0044】
参照混合試料については、図4に示されるように、複数の参照混合試料R1〜R3の各々に対して測定条件を異ならせてスペクトル線形の異なるラマンスペクトルを取得する。
ここでスペクトル線形の異なるラマンスペクトルを取得する方法は、前述した第1の実施形態におけるスペクトル取得法に準ずる方法である。
【0045】
各参照混合試料R1〜R3のラマンスペクトルの取得に際しては、各参照混合試料R1〜R3について、複数の測定条件を設定して測定を行う。これにより、参照混合試料R1〜R3毎に測定条件を異ならせて取得された複数のラマンスペクトルデータが得られる。すなわち、測定条件数と参照混合試料数の積の数だけ存在するラマンスペクトルデータで構成される参照試料ラマンデータセットDが取得される。
【0046】
次に、参照試料ラマンデータセットDの中からいずれかの小データセットD1,D2,D3を選択する(ステップS2)。小データセットD1〜D3は、参照試料ラマンデータセットDのうち、同一測定条件で取得された一組のラマンスペクトルデータを言う。例えば、図4に示す例では、各参照混合試料R1〜R3に対して、それぞれ、3種類の測定条件C1〜C3でラマンスペクトルを取得することによりスペクトル線形の異なるラマンスペクトルデータが取得されており、この中から、最初は、測定条件C1の縦の列の3つのラマンスペクトルデータからなる小データセットD1を選択する。
【0047】
次いで、選択された小データセットD1を用いて、CLSローディングを算出する(ステップS3)。
CLSローディングの算出は、公知の方法で行われ、小データセットD1に対して複数のCLSローディングが算出される。
【0048】
そして、このように算出された小データセットD1の複数のCLSローディング間において、スペクトル波形の相関が計算される(ステップS4)。すなわち、参照混合試料R1〜R3中に含まれる個々の成分のスペクトルに相当するスペクトル様の波形であるCLSローディング間の相関が高い場合には、これから算出される検量行列に共線性が存在することとなり、検出精度が悪化する。
【0049】
そこで、小データセットD2,D3についてもこれらのステップS2〜S4を繰り返すことにより(ステップS5)、全ての測定条件C1〜C3の小データセットD1〜D3に対してCLSローディング間の相関を算出し、算出された相関を比較して、CLSローディング間の相関が最も低い小データセット(例えば、小データセットD1)を検量用小データセットとして決定する(ステップS6)。そして、決定された検量用小データセットを用いて検量行列が算出される(ステップS7)。
【0050】
また、検量用小データセットが決定されると、当該検量用小データセットを取得した際の測定条件C1と同じ測定条件C1で、未知混合試料U1に対して測定が行われることにより取得された未知試料ラマンスペクトルデータE1が決定される(ステップS8)。そして、決定された未知試料ラマンスペクトルデータE1に算出された検量行列を乗算することにより、未知混合試料内の成分の検量を行うことができる(ステップS9)。
【0051】
このように構成された本実施形態に係る振動スペクトル分析方法によれば、検量行列を算出するための検量用小データセットとして、当該検量用小データセットから算出されるCLSローディング間の相関が最も低いラマンスペクトルデータセットD1が選択されているので、スペクトル線形の異なる試料のラマンスペクトルを取得することで、多変量空間において未知混合試料中の成分スペクトルに回転・拡大操作を施して、未知混合試料の各成分スペクトルの相関を低下させて、成分を精度よく検量することができるという利点がある。
【0052】
なお、本実施形態においては、検量用小データセットを決定した後に当該検量用小データセットと同一の測定条件で取得された未知試料ラマンスペクトルE1を検量を行うためのデータとして決定することとしたが、その時点で、その測定条件でのみ未知試料ラマンスペクトルデータE1を測定することにしてもよいし、予め異なる測定条件C1〜C3で取得しておいた未知試料ラマンデータセットE1,E2,E3の中から選択することにしてもよい。
【0053】
次に、本発明の第3の実施形態に係る振動スペクトル分析方法について、図面を参照して以下に説明する。
本実施形態に係る振動スペクトル分析方法は、分析対象である未知混合試料の成分のPCA検量を行う方法である。
【0054】
本実施形態に係る振動スペクトル分析方法は、未知混合試料、参照混合試料および検量対象分子に対する複数の測定条件を定めておき、図5に示されるように、まず、検量対象分子において、測定条件を切り替えてラマンスペクトルを取得することにより、スペクトル線形の異なるラマンスペクトルデータからなる検量対象分子ラマンデータセットを取得しておく(ステップS21)。
【0055】
ここで、検量対象分子は、未知混合試料内の検量を所望する分子であり、例えば、特定のタンパク質分子であったり、特定の糖質分子であったりすることが想定される。検量対象分子としては、1種類の分子を用意してもよいし、2種以上の分子を用意してもよい。
例えば、1種類の検量対象分子について検量対象分子ラマンデータセットを取得した場合について説明する。
【0056】
次に、検量行列を算出するための参照混合試料の複数のラマンスペクトルデータからなる参照試料ラマンデータセットを取得する(ステップS22)。
参照混合試料については、複数の参照混合試料の各々に対して測定条件を異ならせてスペクトル線形の異なるラマンスペクトルを取得する。各参照混合試料のラマンスペクトルの取得に際しては、各参照混合試料について、複数の測定条件を設定して測定を行う。この複数の測定条件を設定してスペクトル線形の異なるラマンスペクトルを取得する方法は、前述の第1の実施の形態説明において詳述した方法に準ずることとする。これにより、参照混合試料毎に測定条件を異ならせて取得された複数のラマンスペクトルデータが得られる。すなわち、測定条件数と参照混合試料数の積の数だけ存在するラマンスペクトルデータで構成される参照試料ラマンデータセットが取得される。
【0057】
次に、参照試料ラマンデータセットの中からいずれかの小データセットを選択する(ステップS23)。小データセットは、参照試料ラマンデータセットのうち、同一測定条件で取得された一組のラマンスペクトルデータを言う。
次いで、選択された小データセットを用いて、PCAローディングを算出する(ステップS24)。
【0058】
そして、ステップS21において取得して検量対象分子ラマンデータセットの中から、ステップS13において選択された小データセットと同一の測定条件で測定されたラマンスペクトルデータを選択する(ステップS25)。
その後、選択された検量対象分子のラマンスペクトルデータと、ステップS24において算出された小データセットのPCAローディングとの相関が計算される(ステップS26)。すなわち、参照混合試料中に含まれる主成分のローディングであるPCAローディングと、検量対象分子のラマンスペクトルとの相関が高い場合には、参照混合試料内における検量対象分子の濃度変動を良好に捉える主成分軸を選択することができる。
【0059】
そして、これらのステップS23〜S26を繰り返すことにより(ステップS27)、全ての測定条件の参照混合試料の小データセットのPCAローディングと、検量対象分子のラマンスペクトルとの相関が算出され、算出された相関を比較して、最も相関が高いPCAローディングを有する小データセットが検量用小データセットとして決定され(ステップS28)、決定された検量用小データセットを用いて検量行列が算出される(ステップS29)。
【0060】
また、検量用小データセットが決定されると、当該検量用小データセットを取得した際の測定条件と同じ測定条件で、未知混合試料に対して測定が行われることにより取得された未知試料ラマンスペクトルデータが決定される(ステップS30)。そして、決定された未知試料ラマンスペクトルデータに算出された検量行列を乗算することにより、未知混合試料内の成分の検量を行うことができる(ステップS31)。
【0061】
このように構成された本実施形態に係る振動スペクトル分析方法によれば、検量行列を算出するための検量用小データセットとして、当該検量用小データセットから算出されるPCAローディングと検量対象分子のラマンスペクトルとの相関が最も高いラマンスペクトルデータセットが選択されているので、多変量空間において未知混合試料中の成分スペクトルに回転・拡大操作を施して、未知混合試料の各成分スペクトルの相関を低下させて、成分を精度よく検量することができるという利点がある。
【0062】
なお、本実施形態においても検量対象分子のラマンデータセットの取得の後に、未知混合試料のラマンデータセットを取得することとしたが、これに代えて、その順序を逆にしてもよい。また、PCAローディングの算出ステップS24と検量対象分子スペクトルの選択ステップS25とはその順序を入れ替えてもよい。
【0063】
次に、本発明の第4の実施形態に係る振動スペクトル分析方法について、図面を参照して以下に説明する。
本実施形態に係る振動スペクトル分析方法は、分析対象である複数の未知混合試料を所望の分類基準分子によってPCAにより分類する方法である。
【0064】
本実施形態に係る振動スペクトル分析方法は、未知混合試料および分類基準分子に対する測定条件C1〜C3を定めておき、図6〜図8に示されるように、まず、分類基準分子P1において、測定条件C1〜C3を切り替えてラマンスペクトルを取得することにより、スペクトル線形の異なるラマンスペクトルデータF1〜F3からなる基準分子ラマンデータセットFを取得しておく(ステップS41)。この複数の測定条件を設定してスペクトル線形の異なるラマンスペクトルを取得する方法は、前述の第1の実施の形態説明において詳述した方法に準ずることとする。また、分類基準分子P1において、異なる周波数領域におけるラマンスペクトルデータである外部ラマンデータFGを取得しておく(ステップS42)。図7においては、1種類の分類基準分子P1について基準分子ラマンデータセットFおよび外部ラマンデータFGを取得した場合を示している。
【0065】
次に、未知混合試料U1〜U3の複数のラマンスペクトルデータE1〜E3からなる未知試料ラマンデータセットEを取得する(ステップS43)。
未知混合試料U1〜U3については、図7に示されるように、複数の未知混合試料U1〜U3の各々に対して測定条件C1〜C3を異ならせてスペクトル線形の異なるラマンスペクトルを取得する。前記ラマンスペクトルの取得に際しては、各未知混合試料U1〜U3について測定を行う。これにより、未知混合試料U1〜U3毎に、測定条件C1〜C3を異ならせて取得された複数のラマンスペクトルデータが得られる。すなわち、測定条件数と未知混合試料数の積の数だけ存在するラマンデータで構成される未知試料ラマンデータセットEが取得される。
【0066】
また、各未知混合試料U1〜U3に対して未知試料ラマンデータセットEを取得したのと異なる周波数領域におけるラマンスペクトルデータである外部ラマンデータセットEGを取得しておく(ステップS44)。
【0067】
次に、未知試料ラマンデータセットEの中からいずれかの小データセットE1〜E3を選択する(ステップS45)。小データセットE1〜E3は、未知試料ラマンデータセットEのうち、同一測定条件で取得された一組のラマンスペクトルデータを言う。例えば、図7に示す例では、各未知混合試料U1〜U3に対して、それぞれ、3種類の測定条件C1〜C3でラマンスペクトルを取得することによりスペクトル線形の異なるラマンスペクトルデータが取得されており、この中から、最初は、測定条件C1の縦の列の3つのラマンスペクトルデータからなる小データセットE1を選択する。
【0068】
次いで、選択された小データセットE1内のラマンスペクトルデータと、外部ラマンデータセットEGのラマンスペクトルデータとを未知混合試料U1〜U3毎に結合した1組の拡張ラマンスペクトルデータからなる未知試料拡張ラマンデータセットEE1を作成する(ステップS46)。そして、作成された未知試料拡張ラマンデータセットEE1を用いて、PCAローディングを算出する(ステップS47)。
【0069】
一方、ステップS41において取得して基準分子ラマンデータセットFの中から、ステップS45において選択された小データセットE1と同一の測定条件C1で測定されたラマンスペクトルデータF1を選択する(ステップS48)。
そして、選択された分類基準分子P1のラマンスペクトルデータF1と、分類基準分子P1についてステップS42において取得しておいた外部ラマンデータFGとを結合した基準分子拡張ラマンスペクトルデータEF1を作成する(ステップS49)。
【0070】
この後に、ステップS46において算出されたPCAローディングと基準分子拡張ラマンスペクトルデータEF1との相関が計算される(ステップS50)。
そして、小データセットE2,E3についてもこれらのステップS45〜S49を繰り返すことにより(ステップS51)、全ての測定条件C1〜C3の未知混合試料U1〜U3の未知試料拡張ラマンデータセットEEのPCAローディングと、基準分子拡張ラマンスペクトルデータFEとの相関が算出され、算出された相関を比較して、最も相関が高いPCAローディングを分類用PCAローディングとして決定する(ステップS52)。そして、決定された分類用PCAローディングを用いて、未知混合試料U1〜U3毎にPCAスコアをプロットする(ステップS53)。これにより未知混合試料U1〜U3を分類基準分子P1について分類する。
【0071】
このように、本実施形態に係る振動スペクトル分析方法によれば、未知混合試料U1〜U3毎に異なる周波数領域において取得された外部ラマンスペクトルデータEGを結合した未知試料拡張ラマンデータセットEEを使用するので、多変量空間における試料スペクトルに回転・拡大操作を施すことができ、分類基準分子P1の濃度変動を最も良好に捉えることができるPCAローディングに基づいて、未知混合試料U1〜U3を分類基準分子P1について精度よく分類することができるという利点がある。
【0072】
なお、本実施形態においても分類基準分子P1のラマンデータセットの取得の後に、未知混合試料U1〜U3のラマンデータセットを取得することとしたが、これに代えて、その順序を逆にしてもよい。また、ステップS46,S47とステップS48,S49とは、その順序を入れ替えてもよい。
【符号の説明】
【0073】
P1 分類基準分子
R1,R2,R3 参照混合試料
S2 参照試料データセット選択ステップ
S3,S14,S24,S47 算出ステップ
S4,S16,S26,S50 相関算出ステップ
S6,S18,S28,S52 決定ステップ
S7,S29 検量行列算出ステップ
S8,S30,S45 未知試料データセット選択ステップ
S9,S31 検量ステップ
S13 データセット選択ステップ
S15,S25 スペクトル選択ステップ
S19,S53 分類ステップ
S46 未知試料データ結合ステップ
S48 基準分子スペクトル選択ステップ
S49 基準分子データ結合ステップ
U1,U2,U3 未知混合試料

【特許請求の範囲】
【請求項1】
複数の未知の成分を未知の混合比で含む複数の未知混合試料について、各前記未知混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記未知混合試料のラマンスペクトルデータからなるラマンデータセットを選択するデータセット選択ステップと、
分類を所望する成分である分類基準分子のスペクトルのうち、前記データセット選択ステップにおいて選択されたラマンデータセットと同一測定条件で取得されたスペクトルを選択するスペクトル選択ステップと、
前記データセット選択ステップにおいて選択されたラマンデータセットからPCAローディングを算出する算出ステップと、
該算出ステップにおいて算出されたPCAローディングと、前記スペクトル選択ステップにおいて選択された分類基準分子のスペクトルとの相関を算出する相関算出ステップと、
測定条件の異なる複数のラマンデータセットから算出されたPCAローディングのうち、前記分類基準分子のスペクトルとの相関が最も高いPCAローディングを決定する決定ステップとを含む振動スペクトル分析方法。
【請求項2】
前記決定ステップにおいて決定されたPCAローディングに対してPCAスコアをプロットすることにより前記未知混合試料を分類する分類ステップを含む請求項1に記載の振動スペクトル分析方法。
【請求項3】
複数の既知の成分を既知の混合比で含む複数の参照混合試料について、各前記参照混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記参照混合試料のラマンスペクトルデータからなる参照試料ラマンデータセットを選択する参照試料データセット選択ステップと、
該参照試料データセット選択ステップにおいて選択された参照試料ラマンデータセットから複数のCLSローディングを算出する算出ステップと、
該算出ステップにおいて算出された複数のCLSローディング間の相関を算出する相関算出ステップと、
測定条件の異なる複数の参照試料ラマンデータセットのうち、前記相関算出ステップにおいて算出されたCLSローディングの相関が最も低い検量用データセットを決定する決定ステップと、
該決定ステップにおいて決定された検量用データセットを用いて検量行列を算出する検量行列算出ステップと、
前記決定ステップにおいて決定された検量用データセットと同一測定条件で測定された、複数の未知の成分を未知の混合比で含む1以上の未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択する未知試料データセット選択ステップと、
該未知試料データセット選択ステップにおいて選択された前記未知試料ラマンデータセットに前記行列算出ステップにおいて算出された検量行列を乗算する検量ステップとを含む振動スペクトル分析方法。
【請求項4】
複数の既知の成分を既知の混合比で含む複数の参照混合試料について、各前記参照混合試料において測定条件を異ならせて取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記参照混合試料のラマンスペクトルデータからなる参照試料ラマンデータセットを選択する参照試料データセット選択ステップと、
検量を所望する成分である検量対象分子のスペクトルのうち、前記参照試料データセット選択ステップにおいて選択された参照試料ラマンデータセットと同一測定条件で取得されたスペクトルを選択するスペクトル選択ステップと、
前記参照試料データセット選択ステップにおいて選択された参照試料ラマンデータセットからPCAローディングを算出する算出ステップと、
該算出ステップにおいて算出されたPCAローディングと、前記スペクトル選択ステップにおいて選択された検量対象分子のスペクトルとの相関を算出する相関算出ステップと、
測定条件の異なる複数の参照試料ラマンデータセットから算出されたPCAローディングのうち、前記検量対象分子のスペクトルとの相関が最も高いPCAローディングを有する参照試料ラマンデータセットを決定する決定ステップと、
該決定ステップにおいて決定された参照試料ラマンデータセットを用いて検量行列を算出する検量行列算出ステップと、
前記決定ステップにおいて決定された参照試料ラマンデータセットと同一測定条件で測定された、複数の未知の成分を未知の混合比で含む複数の未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択する未知試料データセット選択ステップと、
該未知試料データセット選択ステップにおいて選択された前記未知試料ラマンデータセットに前記行列算出ステップにおいて算出された検量行列を乗算する検量ステップとを含む振動スペクトル分析方法。
【請求項5】
複数の未知の成分を未知の混合比で含む複数の未知混合試料について、各前記未知混合試料において測定条件を異ならせて第1の周波数領域で取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、同一測定条件で取得された複数の前記未知混合試料のラマンスペクトルデータからなる未知試料ラマンデータセットを選択する未知試料データセット選択ステップと、
該データセット選択ステップにおいて選択された各前記未知混合試料のラマンスペクトルデータと、各前記未知混合試料について、前記第1の周波数領域とは異なる周波数領域で取得された未知試料外部ラマンスペクトルデータとを結合して未知試料拡張ラマンデータセットを生成する未知試料データ結合ステップと、
分類を所望する成分である分類基準分子について第2の周波数領域で取得されたスペクトル線形の異なる複数のラマンスペクトルデータのうち、前記データセット選択ステップにおいて選択された前記未知試料ラマンデータセットと同一測定条件で取得されたスペクトルを選択する基準分子スペクトル選択ステップと、
該基準分子スペクトル選択ステップにおいて選択されたスペクトルと、前記分類基準分子について前記第2の周波数領域とは異なる周波数領域で取得された基準分子外部ラマンスペクトルとを結合して基準分子拡張ラマンデータを生成する基準分子データ結合ステップと、
前記未知試料データ結合ステップにおいて生成された未知試料拡張ラマンデータセットからPCAローディングを算出する算出ステップと、
該算出ステップにおいて算出されたPCAローディングと、前記基準分子データ結合ステップにおいて生成された基準分子拡張ラマンデータとの相関を算出する相関算出ステップと、
測定条件の異なる複数の未知試料拡張ラマンデータセットから算出されたPCAローディングのうち、前記基準分子拡張ラマンデータとの相関が最も高いPCAローディングを決定する決定ステップとを含む振動スペクトル分析方法。
【請求項6】
前記決定ステップにおいて決定されたPCAローディングに対してPCAスコアをプロットすることにより前記未知混合試料を分類する分類ステップを含む請求項5に記載の振動スペクトル分析方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−174906(P2011−174906A)
【公開日】平成23年9月8日(2011.9.8)
【国際特許分類】
【出願番号】特願2010−62550(P2010−62550)
【出願日】平成22年3月18日(2010.3.18)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】