説明

サンプル内の個々の要素を識別及び定量化するために分光測定データを分析するシステム、方法及びコンピュータプログラム製品

サンプルのグループの全体にわたって、分析装置から受信された代謝データを分析するシステムが提供される。このシステムは、サンプルのそれぞれに対応するデータ行列を自動的に受信する。このデータ行列は、サンプルのそれぞれに対応する行と、それぞれのサンプルの中に存在するイオンのグループに対応する列とを含む。サンプルの中に存在する、イオンのグループの少なくとも一部から構成する成分のグループの少なくとも1つに対応する固有値を決定するために、相関関数及び因数分解関数の少なくとも1つを使用するプロセッサが提供される。ユーザーインターフェースは、固有値を見た目で分かるように表示して、ユーザがサンプル内に存在する成分の種類を目で見て分かるようにするプロセッサ装置と通信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、1つ以上の成分(例えば、代謝産物など)又は複数のサンプルの中に存在する他の成分に対応する固有値を測定するため及びそれらの固有値を使用して個々の成分又はサンプルの中に存在する他の成分を識別及び/又は定量化するため、負でない因数分解関数及び/又は相関関数を使用することに関する。
【背景技術】
【0002】
選択された成分(例えば、ある小さな分子、治療薬、生体異物、代謝産物及び他の物質)の存在及び対応する相対的な量を明らかにするため、サンプル内のわずかな化学的キュー(chemical cue)を検出することは、研究者や臨床医の長期にわたる目標であった。例えば、代謝学の分野では、人間の細胞、組織又は器官(体液を含む)の中に含まれた、また主要な及び中間の代謝の中に含まれた小さな分子又は代謝産物は、そのような小さな分子の存在及び/又は身元を決定する試みの中で詳細に調べられる。「メタボローム(metabolome)」という用語は、生体の中に存在する代謝産物のコレクションのことを指す。人間のメタボロームには、一般的な代謝反応の中の当事者でありかつ細胞の維持、成長及び正常機能のために必要な生来の小さい分子(本来の生合成可能な、非高分子の化合物)が含まれる。従って、代謝学は、細胞生理学の状態を直接観察することであり、このため所定の生体における病気を予測できる。わずかな生化学的な変化(選択された代謝産物の存在を含む)は、特定の病気においては本来備わっている。従って、これらの変化を周知の経路に正確にマッピングすることにより、研究者らは病気に対する生化学的な仮説を構築することができる。この仮説に基づいて、病気の標的を標的に適した薬剤成分を用いて治療するために識別できるように、病気にとって重要な酵素と蛋白質を発見することができる。
【0003】
人間の病気の基となる生化学的な処理を発見するための分子生物学の技術は、ヒトゲノム上に集中している。このヒトゲノムは、RNAに書き写され、次に蛋白質に変換されるヒトDNAを作る遺伝子から構成している。次に、この蛋白質は、ヒト・メタボロームの小さい分子を作り上げる。ゲノミクス(DNAレベルの生化学の研究)、転写プロファイリング(RNAレベルの生化学の研究)及びプロテオミクス(proteomics)(蛋白質レベルの生化学の研究)は、病気の経路の識別に有用ではある。しかし、ヒトの細胞には25,000個以上の遺伝子、100,000から200,000個のRNA転写物及び最大で1,000,000個の蛋白質が存在するため、これらの方法は複雑である。しかしながら、ヒトのメタボロームには小さい分子がわずか2,500個しかないと推定される。
【0004】
このため、代謝技術により、ゲノミクス、転写プロファイリング及び/又はプロテオミクスを超えた著しい躍進が提供される。代謝学を用いれば、代謝産物及びヒトの代謝の中のそれらの役割は、容易に識別することができる。これに関連して、病気の目標の識別を、他の周知の方法を用いる場合よりも高い精度で処理することができる。病気経路の識別に使用するための代謝データの収集は、「Methods for Drug Discovery, Disease Treatment, and Diagnosis Using Metabolomics」という米国特許第7,005,255号の中で全体的に説明されているように、技術的に周知である。しかしながら、各種の生体サンプルから(すなわち、患者の個体群から)得られた代謝データを収集及び分類することは、多量の時間と計算能力を費やすことになる。例えば、幾つかの代謝技術によれば、生体サンプルに対するスペクトロメトリデータが収集され、三次元でプロットされ、そして各生体サンプルに対応する個々のファイルの中に記憶される。そのようなスペクトロメトリデータは、所定のサンプルの中に存在する可能性がある特定のイオンを検出したことに対応する既知のスペクトルから構成されている。個々のイオンはそのようなスペクトルの中では検出可能であるが、特定の個々の代謝産物の成分を示すそのようなイオンの組合せ及び相互作用は、特にただ1つの生体サンプルの中では、直接識別することができない。
【0005】
スペクトロメトリを受けるサンプルがほぼ純粋な成分(例えば、小さい分子の代謝産物)を含む場合、成分を識別するために、成分のスペクトルを容易に既知の成分のスペクトルと一致させることができる。さらに、特定の成分に対して一意的なイオンが存在する場合、サンプル内の成分を相対的に定量化するため、そのイオンの輝度(スペクトルのプロットの中で認識できるものとして)を使用することができる。しかしながら、多くの場合、特定の生体サンプルの分別(例えば、液体又はガスクロマトグラフにおける分別)は不完全である。例えば、2つ以上の成分の化合物又は小分子の成分は、分光計に入る不純な化合物の混合体を発生する物理的な分離工程から「共同抽出」することができる。このため、同じ種類の多くの個々の生体サンプルにわたって見られる微妙なスペクトルの傾向は、1つ以上の別の方法では不明瞭な成分が存在することを示すことができる。
【0006】
本願の譲受人のMetabolon, Inc.,は、プロットを発生するために三次元の分光測定データセットを処理するシステム及び方法を開発した。このプロットは、「A System, Method, and Computer Program Product Using an Automated Relational Database in a Computing System to Compile and Compare Metabolomic Data Obtained from a Plurality of Samples」という名称の米国特許出願第11/462,838号の中で説明されているように、複数の選択された代謝産物に対応する複数の特性プロットにより直接匹敵する。この特許出願は、参照することによって全体として本願に組み込まれる。そのような特性プロットにより、ユーザは、例え選択された成分がスペクトル分析の前に物理的な分離工程から共同抽出された場合でも、サンプルのグループの全体にわたって選択されたサンプルの成分が存在することを示す画像表示の中で、一連の複雑なデータセットを主観的に分析することができる。分解されたスペクトルスロットをスペクトルの特性スロットと主観的に比較することは、所定の種類の生体サンプル内のより複雑な成分の混合体が存在する可能性を確認するために有用である。しかしながら、そのような主観的な比較は、特定のサンプルの中に存在する可能性がある特定の成分(例えば、代謝産物、小分子の治療剤、代謝薬品、及び生体異物)の相対量に関連する定量的な情報をいまだに提供していない。
【0007】
さらに、サンプルのグループの全体にわたって、分光測定データセットを定量的に分析するための幾つかの分析方法が提案されている。例えば、要因分析(FA)、主成分分析(PCA)、及び特異値分解(SVD)が生体サンプルのグループから分光測定データの行列に適用されて、少数の基本的なスペクトルプロフィール(サンプル内の個々の成分の化合物に対応する)が発生され、かつこれらの基本的な成分のそれぞれが各個々のサンプルの中に存在する重さが計算される。しかしながら、FA、PCA、及びSVD分析方法は、基本的なスペクトルプロフィールが多数の負の値(意味のある分析値を持たない)を含んでいることがあるため、解釈するのに不明瞭な及び/又は難しい結果を招くことが多い。このため、付加的なコンピュータ能力、時間及び技術を要する分析後の変換が、処理から物理的に意味のある分析結果を集めるために必要とされる。さらに、FA、PCA、及びSVDの分析方法は、例えばJuvela らによる、すなわちJuvela, M.、Lehtinen, K. 及び Paatero, P.による「The Use of Positive Matrix Factorization in the Analysis of Molecular Line Spectra from the Thumbprint Nebula (1994)」、Clouds Cores and Low Mass Starts ASP Conference Series、第65巻、ページ176〜180、D.P. Clemens and R. Barvainis版の中で説明されているように、サンプルの中に存在する特定の代謝産物の化合物又は他の成分を示すイオンの独立したグループを指す結果を必ずしも生じない。
【0008】
このため、現行の代謝データの分析システムに関連する、前に概要を説明した技術的な問題を解決するため、改良されたシステムに対する要求が存在する。より詳細には、特定のサンプル内の幾つかの代謝産物化合物を共同抽出することに関係なく、サンプル内に存在する各代謝産物化合物の物理的に関連した負でない量、サンプル内に存在する代謝産物化合物のスペクトル及びサンプル内に存在する多数の代謝産物化合物を容易にかつ正確に測定するために、生体サンプルのグループの全体にわたって分光測定データを分析することができるシステム及び方法に対する要求が存在する。複数のサンプル及び/又はサンプル内に含まれる親化合物から質量分析データをサンプル内に存在する純粋な代謝産物化合物のスペクトルの中にデコンボリュートし、サンプル内の代謝産物化合物の相対濃度を測定するためのシステム及び方法に対する要求も存在する。
【発明の開示】
【0009】
前に概要を説明した要求は、本発明によって達成される。本発明は種々の実施形態の中で、複数の生体サンプルからの分光測定データを用いて、成分(例えば、代謝産物)の識別及び定量化に関する前に説明した技術的な問題、及び他の技術的な問題の多くを克服するシステムを提供する。特に、一実施形態では、複数のサンプルの全体にわたって、分析装置から受信されたスペクトルデータを分析するためのシステムが提供される。この分析装置は、さらに、行用のサンプル及び列用の測定値という構成の2方向テーブルにフォーマットされるデータを発生する任意の装置を含むことができる。例えば、この分析装置は、核磁気共鳴式画像形成装置、分光測定装置(例えば、ガスクロマトグラフィー質量分析計(GC−MS)及び液体クロマトグラフィー質量分析計(LC−MS)を含む)及び電気化学アレイ装置を備えることができるが、これらに限定されることはない。このシステムは、複数のサンプルのそれぞれに対応するデータ行列を自動的に受信する分析装置と通信するデータベースを備えている。このデータ行列には、複数のサンプルのそれぞれに対応する複数の行と、それらのサンプルの中に存在する複数のイオンに対応する複数の列が含まれている。これらの列は、分析装置の中の所定の点で適時に各サンプルから抽出された複数のイオンにも対応している。このシステムは、複数のサンプルの中に存在する複数の成分の少なくとも1つに対応する固有値を決定するために、データベースと通信するプロセッサ装置も備えている。この成分は、サンプル内に存在する複数のイオンの少なくとも一部を含んでいる。さらに、このシステムは、複数のサンプルの全体にわたって複数の成分の少なくとも1つに対応する固有値を目で見て分かるようにするために、データベース及びプロセッサ装置と通信するユーザーインターフェースも備えている。
【0010】
本発明の幾つかのシステムに関する実施形態によれば、プロセッサ装置は、固有値を決定するために、負でない行列因数分解関数(non-negative matrix factorization function)及び/又は独立した成分分析を実行できるように構成される。例えば、プロセッサ装置は、これらに限定されることはないが、複数のサンプルの中に存在する複数の成分の数、複数のサンプルのそれぞれの中に存在する複数の成分の少なくとも1つの相対濃度、及び複数の成分の少なくとも1つの中に存在する複数のイオンの少なくとも一部を表示する、複数の成分の少なくとも1つのスペクトルを含む固有値を決定するために、負でない行列因数分解関数及び/又は独立した成分分析を実行することができる。別の実施形態では、プロセッサ装置は、複数のサンプルの全体にわたって特定の成分の共通スペクトルを含む固有値を決定するための相関関数を実行できるように構成することもできる。この共通スペクトルは、複数のイオンの少なくとも一部の組合せを含み、また複数のサンプル内に存在するほぼ純粋な成分(対象の特定代謝産物など)に対応する。
【0011】
さらに、幾つかの実施形態では、プロセッサ装置は、複数の成分の少なくとも1つのスペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較できるようにさらに構成されて、複数のサンプル内に複数の既知の成分が存在しているかどうかについて複数のサンプルを選別する。プロセッサ装置が相関関数を実行できるように構成された実施形態では、このプロセッサ装置はまた、ほぼ純粋な成分に対応する共通スペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較できるようにさらに構成され、複数のサンプル内に複数の既知の成分が存在しているかどうかについて複数のサンプルを選別する。幾つかのそのような実施形態によれば、複数の既知のスペクトルを記憶するために、データベースと通信するメモリ装置も備えることができる。
【0012】
本発明の幾つかの実施形態は、複数のサンプルの全体にわたって分析装置から受信されたスペクトルデータを分析するための方法及び/又はコンピュータプログラム製品も提供する。そのような方法は、複数のサンプルのそれぞれに対応するデータ行列を自動的に受信するステップを含む。ここで、このデータ行列は、複数のサンプルのそれぞれに対応する複数の行と、それらサンプルの中に存在する複数のイオンに対応する複数の列を含んでいる。この方法は、複数のサンプルの中に存在する複数の成分の少なくとも1つに対応する固有値を決定するステップをさらに含んでいる(ここで、成分は、複数のイオンの少なくとも一部を含んでいる)。さらに、この方法は、複数のサンプル全体にわたって複数の成分の少なくとも1つに対応する固有値を目で見えるように表示するステップをさらに含む。
【0013】
幾つかの方法の実施形態によれば、この決定するステップは、固有値を決定するために、負でない行列因数分解(NNMF)関数を実行するステップを含む。別の実施形態では、この決定するステップは、固有値を決定するために、独立した成分分析(ICA)を実行するステップを含む。幾つかのそのような実施形態によれば、決定するステップを介して(例えば、NNMF及び/又はICAを介して)決定された固有値は、これらに限定されることはないが、複数のサンプルの中に存在する複数の成分の数、複数のサンプルのそれぞれの中に存在する複数の成分の少なくとも1つの相対濃度、及び複数の成分の少なくとも1つの中に存在する複数のイオンの少なくとも一部を表示する、複数の成分の少なくとも1つのスペクトルを含むことができる。さらに、幾つかの別の実施形態では、決定するステップは、固有値を決定するために相関関数を実行するステップをさらに備えている。そのような相関関数のステップでは、固有値は複数のサンプルの全体にわたって共通スペクトルを含んでいる。ここで、共通スペクトルは複数のイオンの少なくとも一部の組合せを含み、またこの共通スペクトルは、複数のサンプル内に存在するほぼ純粋な成分の少なくとも1つ及び複数のサンプル内に存在する1つ以上の純粋な成分の帰属スペクトル(imputed spectra)に対応する。
【0014】
本発明の種々の実施形態は、(決定するステップで発生された)固有値を複数の既知の成分に対応する複数の既知のスペクトルと比較するステップをさらに備えて、複数のサンプルの中に複数の既知の成分が存在するかどうかを選別する。例えば、決定するステップが負でない行列因数分解関数を実行するステップを含む場合、この方法は、複数の成分の少なくとも1つのスペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較するステップをさらに含み、複数のサンプルの中に複数の既知の成分が存在するかどうかを選別する。同様に、決定するステップが、複数のサンプルの全体にわたって共通スペクトルを決定するために、相関関数を実行するステップを含む実施形態では、この方法はまた、ほぼ純粋な成分に対応する共通スペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較するステップをさらに含み、複数のサンプルの中に複数の既知の成分が存在するかどうかを選別する。
【0015】
従って、複数のサンプルの全体にわたって代謝データをコンパイル及び比較するためのシステム、方法及びコンピュータプログラム製品は、本発明の実施形態の中で説明されたように、複数のサンプルからの分光測定データを使用するほぼ純粋な成分及びそれらのスペクトルのリストを提供するステップ、(例えば、サンプルの行及びイオンの列によって定義される)データ行列を部分行列に分割するために使用することができる目標の溶出時間又は溶出時間間隔を識別するステップ、及び(特定の代謝産物などの)成分を識別するために、既知のスペクトルと比較される種々のサンプルの中に存在する様々な成分に対応する既知のスペクトルのライブラリを構築するステップを含む多くの利点を提供する。しかしながら、これらに限定されることはない。ここで、部分行列では、負でない行列因数分解関数又は独立した成分分析因数分解関数、及び/又は相関関数が実行されて、1つ以上のイオンから構成されて潜在的にマスクされた及び/又は共同抽出された成分に対応する1つ以上の固有値を決定する。
【0016】
当業者には明白なこれら及び他の利点は、本発明のシステム、方法、及びコンピュータプログラム製品の中で提供される。
【0017】
本発明をこのように一般的な用語で説明してきたが、ここで添付の図面を参照する。これらの図面は、必ずしも縮尺通りには描かれていない。
【発明を実施するための最良の形態】
【0018】
ここで添付した図面を参照して、本発明を以下により説明する。これらの図面には、本発明の実施形態の全てではないが、その幾つかが示されている。実際、これらの発明は多くの異なった形態で具体化することができるが、本願に記載された実施形態に限定されると解釈してはならない。この開示内容が適切な法的必要条件を満足するように、これらの実施形態が提供される。同じ参照番号は全体を通して同じ要素を指す。
【0019】
本発明のシステム、方法及びコンピュータプログラム製品は、代謝データを分析するために使用される質量分析計に関連して説明されるが、そのような説明は代表的な目的のみに使用されることは、当業者は理解されよう。より詳細には、本発明のシステム、方法及びコンピュータプログラム製品は、複数の生体サンプルの全体にわたってスペクトルデータの複雑な組を発生するために使用される幾つの処理に対しても適合させることができる。例えば、本発明の実施形態は、核磁気共鳴イメージング(NMR)、ガスクロマトグラフィー−質量分析(GC−MS)、液体クロマトグラフィー−質量分析(LC−MS)及び電気化学アレイ(EC)を含む種々の分析装置及び処理と一緒に使用することができるが、これらに限定されることはない。
【0020】
図1は、本発明の1つの実施形態によるシステムの実施例を例示している。この図では、システムは質量分析計110などの分析装置と通信している。図示のように、生体サンプル100は、分析計110内の媒体の列の上部に取り込まれて、当業者は理解できる質量分析技術を用いて分析される。例えば、特定の生体サンプル100の成分は、種々の溶出率で分析計の列を通って送られ、それらの特定の特性に基づいて種々のスペクトル応答を示す。当業者には明らかなように、分析計110は、分離工程の間の特定の時間に各サンプルから溶出されたイオンに対応する一連のスペクトルを発生する(液体又はガスクロマトグラフィーなど)。そのような一連のスペクトルの実施例は全体的に図2に示され、分離工程の間に存在する各点の各サンプル210に対して、イオン220のスペクトルに対する輝度230としてプロットされる。従って、特定の溶出時間範囲に対して、分析計110は対応するデータ行列X(例えば、図3を参照のこと)も発生する。ここで、行列Xの行は各特定のサンプル210に対応し、行列Xの列は各特定のイオン220に対応する。さらに、行列Xの中の値は、各サンプル210内に存在する各イオン220に対する輝度値を含む。
【0021】
本発明の別の実施形態によれば、別の種類の分析装置が使用されて、一連の生体サンプル100の分析に基づいて、スペクトルと対応するデータ行列Xが発生される。例えば、この分析装置は、核磁気共鳴(NMR)イメージング装置、液体及び/又はガスクロマトグラフィー−質量分析装置(LC−MS及び/又はGC−MS)、電気化学アレイ(EC)装置、及び/又はこれらの装置の組合せを備えることができるが、これらに限定されることはない。そのようなスペクトル及び対応するデータ行列Xは、後でさらに詳細に説明するが、本発明のシステムの構成要素と通信できる他の適当な分析装置によって発生することができることは、当業者には理解されよう。
【0022】
複数の生体サンプル100は、ウェル形プレート120及び/又は他の種類のサンプル用コンテナから個別に取り出され、分析を行いかつ三次元のデータセット(図2aを参照のこと)を発生するため、分析装置110の中に個別に取り入れられる。例えば、個々の生体サンプル100は、ウェル形プレート120から分析装置110にピペット、シリンジ、試験アレイの中で定義された微小流体通路、及び/又は生体サンプルを実験室環境の中で移送するための他のシステムを介して移送することができる。生体サンプルには、血液サンプル、尿サンプル、細胞培養、唾液サンプル、及び/又は(例えば、代謝産物などの)成分及び/又は問題の化学的成分が存在する他の種類の生体サンプルを含むことができるが、これらに限定されることはない。
【0023】
図1に示されているように、本発明の実施形態は、(例えば、コンピュータ装置などの)プロセッサ装置130と通信する(例えば、メモリ装置140の中に収容された)データベースを備えることができる。このプロセッサ装置130は、複数のサンプル210のそれぞれに対応するデータ行列X(図3及び図4を参照のこと)を自動的に受信するために分析装置110と通信するようにさらに構成されている。上述されまた図3に示されているように、データ行列Xは、複数のサンプル210のそれぞれに対応する複数の行と、サンプル210の中に存在する複数のイオン220に対応する複数の列を含むことができる。プロセッサ装置130は、分析装置110と有線(RS−232、及び/又は他の種類の結線)を介して、及び/又は無線(例えば、RF、IR、又は他の無線通信)技術を介して通信して、中に収容された(及び/又はそれらと通信する)データベースが分析装置110からデータ行列Xを受信することができるようにする。さらに、分析装置110は、(これらに限定されることはないが、)インターネット、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、又は当業者が理解できる他のネットワークの種類及び/又は技術を含む有線及び/又は無線のコンピュータネットワークを介して、1つ以上のプロセッサ装置130(及び関連するユーザーインターフェース150)と通信することができる。このデータベースは、例えば、Oracle、Sybase、DB2又は他のデータベース用ソフトウェアなどの市販のソフトウェアを用いて構築することができる。図1に示されているように、データベース(及び/又は前記データベースを収容するプロセッサ装置130)は、既知のスペクトル(例えば、図8のフローチャートに示された比較するステップ810の中で使用するため)及びデータ行列(例えば、分析装置110から自動的に受信される行列X)を記憶するために、メモリ装置140(ハードディスク、メモリチップ、フラッシュメモリ、RAMモジュール、ROMモジュール、及び/又は他のメモリ装置140)とさらに通信する。さらに、このメモリ装置140は、データベースによって受信された及び/又はプロセッサ装置130によって処理された他のデータを収容するために使用することもできる。さらに、また後でさらに詳細に説明されるように、このメモリ装置140はまた、例えば、結果行列G及びF(図4に示されているように)の内容及び構造、及びプロセッサ装置が複数のサンプル210の全体にわたって相関関数を実行するときに発生する共通スペクトルなどの、本発明のプロセッサ装置130によって決定される固有値を記憶するように構成される。
【0024】
このプロセッサ装置130は、プロセッサ装置130が受信したデータ行列X(図3を参照のこと)を利用して、複数のサンプル210内に存在する複数の成分の少なくとも1つに対応する固有値を決定することができ、ここで複数の成分は複数のイオン220の少なくとも一部の組合せを含んでいる。さらに、図1に示されているように、本発明の実施形態は、複数のサンプル210の全体にわたって複数の成分の少なくとも1つに対応する固有値を目で見えるように表示するため(例えば、それぞれ図4の第1及び第2の結果行列G及びFを参照のこと)に、データベース(及び/又はメモリ装置140)及びプロセッサ装置130と通信するユーザーインターフェース150も備えている。
【0025】
本発明の幾つかのシステムに関する実施形態では、プロセッサ装置130は、固有値を決定するために、因数分解関数を実行できるように構成される。種々の実施形態によれば、プロセッサ装置130が実行する因数分解関数は、負でない行列因数分解(NNMF)(「正の行列因数分解」(PMF)とも呼ばれる)及び/又は独立した成分分析(ICA)因数分解を含むことができるが、これらに限定されることはない。本発明の種々の実施形態によるプロセッサ装置130が実行するNNMF関数の幾つかの実施例には、「Learning the Parts of Objects by Non-Negative Matrix Factorization」という名称の文献の中で全体的に説明されたこれらの関数が含まれる(Lee Daniel D. 及び Seung H. Sebastianによる「Learning the Parts of Objects by Non-Negative Matrix Factorization」Nature、第401巻、ページ 788〜791 (1999年10月21日、を参照されたい)。この文献の内容は参照することによって、その全体が本願に組み込まれる。本発明の別の実施形態に基づいて、プロセッサ装置130が利用できる別のNNMF関数は、別の参考文献の中でLee 及び Seungによって説明される(Lee Daniel D. 及び Seung H. Sebastianによる「Algorithms for Non-Negative Matrix Factorization」、Advances in Neural Information Processing Systems 13、ページ 556〜562(2001年)を参照されたい)。この文献の内容も参照することによって、その全体が本願に組み込まれる。さらに、本発明の別の実施形態に基づいて、プロセッサ装置130が別の方法として実行する別のNNMF関数についての調査は、Troppによって提供される(Tropp; Joel A.による「Literature Survey: Non-negative matrix factorization」、EE381K-14 Multidimensional Digital Signal Processing - Spring 2003 Projects、The University of Texas、Austin、 (2003年)を参照されたい)。この文献の内容も参照することによって、その全体が本願に組み込まれる。
【0026】
別の実施形態では、ICA関数がプロセッサ装置130によって使用されて、因数分解が実行される。典型的なICA関数は、例えば、Hyvarinenらによって説明される(Hyvarinen, A.、Karhunen, J.、及び Oja, E.による「Independent Component Analysis」、John Wiley & Sons (2001年)を参照されたい)。この文献の内容も参照することによって、その全体が本願に組み込まれる。
【0027】
そのような実施形態では、因数分解関数によって決定された固有値には、複数のサンプル(第1の結果行列G内の列410の数で示される)の中に存在する複数の成分(例えば、代謝産物化合物など)の数、複数のサンプル(例えば、第1の結果行列Gの各列410が、サンプル210内の各成分410の相対濃度を示す)のそれぞれの中に存在する複数の成分の少なくとも1つの相対濃度、及び複数の成分410の少なくとも1つの、(第2の結果行列Fの中に示されているように)複数の成分410の少なくとも1つに存在する複数のイオン220の少なくとも一部を示す(個々のイオン220による)スペクトルが含まれるが、これらに限定されることはない。
【0028】
プロセッサ装置130は、データ行列Xを入力として使用して因数分解関数を実行することができる(図3を参照のこと)。ここで、行列Xの列は、種々のイオン220に対応する(更に、分析計又は他の分析装置110の種々のチャネルに対応する)。前述したように、行列Xの行は種々のサンプル210に対応し、これらのサンプルから行列Xのデータが得られる。具体的に言うと、幾つかの実施形態では、プロセッサ装置130は、下記の式の中で示されているように、双一次の因数分解の問題を解決することができる。
X=GF (1)
ここで、Xは入力行列Xである(Xは、例えばn行及びp列から構成する)。さらに、G及びFは、第1及び第2の結果行列を示す(ここで、Gはn行とk列から構成し、Fはk行とp列から構成する)。kは一般にpよりも小さく、かつkは、例えば入力行列XのSVDからのスクリー・プロット(Scree plot)から決定されることは、当業者は理解されよう。(典型的なデータ行列Xから結果として生じた)典型的な結果行列の組G、Fが、例えば図4に示されている。
【0029】
その上、幾つかの実施形態では、プロセッサ装置130は、因数分解関数を用いて個々のイオン220の量の中でエラーE(ここで、EはE=X−FGと表すことができる)の予想も発生することができる。各イオン220に対して結果として生じるエラー予想は、エラー行列Sの中にも入力される。結果として生じたデータ行列及びエラー行列、それぞれX及びSを用いて、プロセッサ装置130は、下記のように表されたエラーを最小にする最小二乗による解決法として、第1及び第2の結果行列G、Fを計算できるように構成される。
Σi,j(((X−GF)i,j)/Si,j (2)
ここで、この解決策は、結果行列G及びFの全ての要素が負でないことを要求されるという点で更に制限される。例えば、Lee 及び Seungにより概要が説明されているように、G及びFを決定するために最適化された様々な他の基準が存在する。これらの制約により、サンプルの中の成分410のスペクトルがG及びFの行列乗算によって復元されるように、プロセッサ装置130が正の基本的な成分を有する固有値を確実に発生できるようにされる。Gはサンプルを用いてほぼ純粋な成分の相対濃度を予想するために使用することができ、またFは本願でさらに説明するように、イオンの組及びほぼ純粋な成分のスペクトルの相対輝度を明らかにする。
【0030】
結果行列G及びFが独特なものではなく、そして修正されまたなおもXを再生することは、当業者は理解されよう。例えば、幾つかの別の実施形態では、プロセッサ装置130は、下記のように表された関係式によりXを再生することができる。
X=GS−1SF (3)
ここで、Sはkxk行列であり、S−1はその逆数である。Sは、結果行列G及びFの解釈能力を高めるように選択することができる。別の実施形態によれば、因数分解関数は下記のように別の方法で表すことができる。
X=GDF (4)
ここで、Dはkxk行列である(それは、結果行列G及びFの解釈能力を高めるように選択することもできる)。
【0031】
図4は、因数分解関数(特に、NNMF及び/又はICA)の1つの実施例に基づいて、プロセッサ装置130が作り出した結果行列G、Fの簡略化した組を示している。図4では、サンプルの組210は、(結果行列Gの1つの列によって示された)1つの成分410のみを含んでいる。図示した実施例では、結果行列Gは、4個のサンプル210に対して分析装置110が発生した(例えば、図3を参照されたい)4個の濃度に対応する4個の行を有する列ベクトルを含んでいる。ここで、4個の濃度の1つは、4個のサンプル210のそれぞれの1つである。さらに、結果行列Fは、4個のイオン220のそれぞれに対して分析装置110が検出したイオンの輝度に対応する4個の列を有する行ベクトルである。プロセッサ装置130は、Xの各行(分析する場合の種々のサンプル210に対応する)が結果行列G(複数のサンプル210のそれぞれの中に存在する複数の成分410の少なくとも1つの相対濃度を示す)で乗算されたF(サンプル内に存在する1個の成分410の中の種々のイオン220の輝度(例えば、「高さ」)を提供する)にほぼ等しくなるようにデータ行列Xを近似するために、結果行列G、Fを入力しようとする。図4の単純化した事例では、結果行列Fにおいて結果として生じた「谷」形状は、存在する1個の成分410内の全てのイオンのスペクトル220の重み付けられた平均である。しかしながら、プロセッサ装置130はより複雑なサンプルの組を用いてNNMF処理を実行して、結果行列Fがより大きな数の成分410を示すこともできることは理解されよう。例えば、プロセッサ装置130が実行するする全てのNNMF処理は、ランク1のNNMF処理の合計と考えられる(すなわち、結果行列Fは、別の成分410の存在を示す別の行を含んでいる)。さらに、結果行列Gは、複数のサンプル210のそれぞれの中の各成分に対応する濃度を含む固有値を示す別の列を含むことができる。
【0032】
1つの実施形態では式(1)によって定義された因数分解関数は、特定の溶出時間で(行列Xで定義された)複数のサンプル210の全体にわたってイオンのスペクトル220を用いて実行されることは、当業者は理解するであろう(ここで、「溶出時間」は、分析装置110を用いて特定のイオンのスペクトル220が観察される時間を指す)。このプロセッサ装置130は、エラー関数(例えば、式(2)を参照のこと)が溶出時間、データ行列X(これは溶出時間により変化する)、及び結果行列G、Fの特定の組合せに対して最小にされるまで、多くの溶出時間に対して前述した因数分解関数の実行を繰り返すように更に構成される。そのような工程が最終的には複数のサンプル210の中に存在する(例え全てでないにしても)大部分の成分410に対応する固有値をもたらすが、広い範囲の溶出時間にわたってまた多数のサンプル210に対して因数分解関数(図4に示されている)を繰り返すことは、幾つかの実施形態では、固有値を決定するために因数分解関数が実行される特別な溶出時間及び/又は比較的狭い範囲の溶出時間を選択することによって促進される。
【0033】
例えば、本発明の幾つかの実施形態では、プロセッサ装置130を、特定の溶出時間で複数のサンプル210のそれぞれに対応するデータ行列(例えば、データ行列Xを参照のこと)を発生するために、複数のイオン210を対応する溶出時間で相関することができるように構成することができる。本願に記載されるように、データ行列Xは、複数のサンプル210のそれぞれに対応する複数の行と、それぞれのサンプル210の中に存在する複数のイオン220に対応する複数の列を備えている。このような実施形態では、プロセッサ装置130が後に続く因数分解関数を実行する開始点を識別するために、イオン220を溶出時間で最初にグループ化することができる(例えば、式(1)及び(2)を参照のこと)。このように、イオン210を溶出時間で相関することは、どのイオン210が問題の成分410の成分として互いに関連付けられるかについての初期の評価を提供する。この初期の評価は、そのままで又は因数分解関数の中で結果行列Gに対する初期の評価として使用することができる。幾つかの実施形態によれば、複数の並列のプロセッサ装置130は、結果行列G及びFの計算が促進されるように、複数の溶出時間及び/又は溶出時間範囲に対応する種々の行列Xを分析するために利用することができる。
【0034】
特定の溶出時間及び/又は溶出時間の範囲が選択されると、複数のイオン220の少なくとも一部の輝度に基づいて固有値を決定するため、イオンのスペクトル220対サンプル210の行列Xが構築され、そして前述したように因数分解関数を用いてプロセッサ装置130によって分析される。前述したように、固有値は、複数のサンプル210に存在する複数の成分410の少なくとも1つに対応する。ここで、成分410は、複数のイオン220の少なくとも2つの部分を含んでいる。
【0035】
本発明の別の実施形態によれば、プロセッサ装置130は、複数のサンプル220の全体にわたって特定の溶出時間において、イオンスペクトル(例えば、図2を参照のこと)の相関を取ることができるように構成することもできる。そのような実施形態では、プロセッサ装置130は、特定の溶出時間でサンプルの全体にわたってイオンスペクトルの相対的な上がり下がりの相関を取ることができる。例えば、そして図5のスペクトルプロットで示されているように、プロセッサ装置130は、固有値を決定するために相関関数を実行することができるように構成される。この場合、固有値には、複数のサンプル210の全体にわたって共通スペクトル410a、410b、410cが含まれる。これらの共通スペクトル410a、410b、410cは、複数のサンプル210の中に存在する複数のイオン220と対応する成分410の少なくとも一部の組合せを含むことができる。
【0036】
例えば、図5に示されているように、プロセッサ装置は、複数のサンプル210の全体にわたって、特定のイオン220の輝度230の立上り及び立下りの相関関数を取ることができる。このプロセッサ装置130は、共通スペクトル(例えば、成分410aを参照のこと)を検出することができるように構成することができる。これらの共通スペクトルは、複数のサンプル210の中に存在する可能性がある選択された成分410に対応する複数の固有値の1つとして、多数のサンプルにわたって明らかでありまたこうした共通スペクトル410aを示している。幾つかの実施形態では、図5に示されているように、プロセッサ装置は、複数のサンプルの全体にわたって相関関数を実行することができ、これにより結果として、例えばサンプルグループの中に存在する可能性がある3つの別個の成分410に対応する3つの別個の共通スペクトル410a、410b、410cを識別することができる。相関関数の一部としてプロセッサ装置が発生した共通スペクトル410a、410b、410cの固有値は、(図4に関連して全体的に前に説明したように)プロセッサ装置130が因数分解関数を実行する実施形態の中でプロセッサ装置130が発生した結果行列Fと直接比較することができる。このため、幾つかの実施形態では、これらの固有値の種類のそれぞれがサンプル210の組の中で発見された特定の成分410を構成するイオン220のスペクトルとして比較できるため、プロセッサ装置130は、相関関数が発生した固有値(例えば、固有値410aなど)を相関関数が発生した固有値(図4で示されたような結果行列Fなど)と更に比較することができる。
【0037】
幾つかの実施形態では、プロセッサ装置130は、複数の成分410の(例えば、結果行列Fの種々の行によって定義された)少なくとも1つのスペクトルを、複数の周知の成分に対応する複数の周知のスペクトルと比較することができるようにさらに構成されて、複数のサンプル210の中に複数の周知の成分が存在することに対して複数のサンプル210を選別することができる。同様に、プロセッサ装置130は、複数のサンプル210の中に存在する成分410に対応する共通スペクトル(例えば、図5の成分410aを参照のこと)を、複数の周知の成分に対応する複数の周知のスペクトルと比較することができるようにさらに構成されて、複数のサンプル210の中に複数の周知の成分が存在することに対して複数のサンプル210を選別することができる。
【0038】
例えば、幾つかのシステムに関する実施形態では、プロセッサ装置130は、(図8のフローチャートの中で示された比較するステップ810で使用するため)周知の成分に関連した周知のスペクトルを記憶するために、メモリ装置140(ハードディスク、メモリチップ、フラッシュメモリ、RAMモジュール、ROMモジュール、及び/又は他のメモリ装置140)を具備する及び/又はメモリ装置140と通信するように構成される。このため、プロセッサ装置130は、固有値(前述したように、スペクトル又は結果行列など)を決定することができるだけでなく、固有値をメモリ装置140の中の周知の成分のライブラリに記憶された複数の周知のスペクトルの周知の1つと比較することができる。このため、本発明の実施形態は、主観的で非定量的な方法を用いて、特定のサンプル又はサンプルのグループ210の中の不明瞭な及び/又は容易に検出できない成分410を識別するために特に有用である。例えば、歴史的な収集物又は現行のイオンパターンのライブラリの中に存在しないイオンのパターンを識別するために、本発明の幾つかの実施形態を使用することができる。そのようなパターンを識別することは、本発明のシステムに対して未知の化合物(非代謝産物の薬物)の存在を示唆することになる。
【0039】
さらに、メモリ装置140はまた、本発明のプロセッサ装置130が測定した、例えば(図4に示されているような)結果行列の内容及び構造G及びF、及び複数のサンプル210の全体にわたってプロセッサ装置が相関関数を実行したときに、プロセッサ装置が発生した共通スペクトル(図5の成分410a、410b、410cを参照のこと)などの固有値を記憶するように構成される。従って、本発明の実施形態は、複数のサンプル210の1つ以上に関連した特定の疾患状態又は他の条件に関連付けられた未知の成分410(例えば、結果行列Fで示されているように、複数のイオン220を含んでいる)のライブラリを構築するために、例えば前述された因数分解関数及び/又は相関関数を実行するとき、プロセッサ装置130が決定した固有値を記憶することもできる。
【0040】
図1に関して説明されたように、本発明の実施形態は、複数のサンプル210の全体にわたって複数の成分410の少なくとも1つに対応する固有値を目で見えるように表示するために、前記プロセッサ装置130と通信するユーザーインターフェース150を備えている。例えば、図4に示されているように、このユーザーインターフェース150は、因数分解関数を用いてプロセッサ装置が発生した1つ又は両方の結果行列G、Fを表示することができる。幾つかの実施形態では、(プロセッサ装置130と通信する)ユーザーインターフェース150は、結果行列Fの種々の行を、複数のサンプル210の中に存在する種々の成分410を構成するイオン220のスペクトル出力に変換することができる。さらに、図5に示されているように、このユーザーインターフェース150は、複数のサンプル210の全体にわたって相関関数を実行するときにプロセッサ装置が発生した1つ以上の共通スペクトル(図5の成分410a、410b、410cを参照のこと)を表示する(例えば、イオン220に対する輝度230のチャートとして)こともできる。幾つかの実施形態によれば、このユーザーインターフェース150は、ディスプレイ装置、パーソナルコンピュータ、及び/又は様々な種類のデータのグラフィカル表示を行う他の電子装置を備えることができる。このデータには、本願で説明される実施形態のプロセッサ装置130によって決定される固有値が含まれるが、これらに限定されることはない。
【0041】
図6〜図8に示されているように、本発明の実施形態は、複数のサンプル210の全体にわたって分析装置110から得られた代謝データ(例えば、図2を参照されたい)を分析する方法も含んでいる。図6に示された1つの実施形態によれば、この方法は、複数のサンプル210のそれぞれに対応するデータ行列Xを自動的に受信するステップ610を含んでいる。例えば、図3に示されているように、データ行列Xは、複数のサンプル210のそれぞれに対応する複数の行と、それぞれのサンプル210の中に存在する複数のイオン220に対応する複数の列を備えている。図6の実施形態は、複数のサンプル210の中に存在する複数の成分410の少なくとも1つに対応する固有値(この固有値は、例えば、後でさらに説明するように、そのような成分410の相対輝度、濃度、及び/又は成分410のアイデンティティ及び/又はイオンの成分220を含んでいる)を決定するためのステップ620をさらに備えている。ここで、これらの成分には、複数のイオン220の少なくとも一部が含まれている。さらに、図6に示されている実施形態は、複数のサンプル210の全体にわたって複数の成分410の少なくとも1つに対応する固有値を目で見えるように表示するためのステップ630を含む。
【0042】
本発明による幾つかの実施形態のプロセッサ装置130に関連して説明されたように、固有値を決定するステップ620は、固有値を決定するために因数分解関数(例えば、式(1)及び(2)によって定義されるNNMF関数及び/又はICA関数)を実行するステップを含むことができる。本発明の種々の実施形態によれば、固有値を決定するステップ620の中で実行される因数分解関数は、負でない行列因数分解(NNMF)、正の行列因数分解(PMF)、独立した成分分析(ICA)、及び/又はそのような因数分解関数の組合せを含むことができるが、これらに限定されることはない。
【0043】
幾つかの実施形態では、固有値決定ステップ620の中で発生された固有値は、複数のサンプル210の中に存在する複数の成分410を含むことができる。複数のサンプル210の中に存在する複数の成分410の数は、例えば、(図4の中で示される)結果行列Fの数として、表示するステップ630の中で表示することができる。さらに、複数のサンプル210の中に存在する複数の成分410の数は、因数分解関数の積として発生され、結果行列G内の列の数として認められる(図4に示されているように、図4では比較的単純な1つの成分の固有値が示されている)。
【0044】
幾つかの実施形態では、固有値決定ステップ620の中で発生された固有値は、複数のサンプルのそれぞれの中に存在する複数の成分410の少なくとも1つの相対濃度を含むことができる(例えば、上記の式(1)及び(2)により定義された因数分解関数を用いて発生することができる結果行列Gの中に示されているように)。例えば、(図4で示されるように)本発明の幾つかの実施形態による固有値決定ステップ620の中で発生された結果行列Gは、調査中の複数のサンプル210に対応する行と、複数のサンプル210の中に存在する複数の成分410のそれぞれの濃度に対応する列とを含む二次元行列から構成する。
【0045】
別の実施形態では、固有値決定ステップ620の中で発生された固有値は、複数の成分410の少なくとも1つのスペクトルも含むことができる。これらのスペクトルは、複数の成分410の少なくとも1つの中に存在する複数のイオン220の少なくとも一部を表示する。例えば、図4に示されているように、結果行列Fの数値成分(numerical element)は、表された実施例の中に存在する1つの成分410の輝度スペクトルを示している。行列Fの相対的な数値成分はプロットされて、複数のサンプル210の中に存在する複数の成分410の少なくとも1つのスペクトルを発生する。
【0046】
本発明の実施形態のプロセッサ装置130に関連して上述したように、固有値決定ステップ620は、固有値を決定するために、相関関数を実行するステップも含む。こうした実施形態では(その結果は図5に示されている)、固有値は複数のサンプル210の全体にわたって共通スペクトル(例えば、図5の成分410a、410b、410cを参照のこと)を有している。前述したように、固有値決定ステップ620の中で相関関数を実行することによって発生された共通スペクトル410a、410b、410cの少なくとも1つは、固有値決定ステップ620が因数分解関数を実行する本発明の実施形態が発生した結果行列Fの行に対応している。このため、本発明の種々の実施形態は、固有値決定ステップ620の精度をクロスチェックするため及び/又は確実にするために一緒に使用することができる。例えば、相関関数を実行することによって発生された共通スペクトル410a、410b、410cは、因数分解関数を実行することによって発生された結果行列Fに直接比較されて、複数のサンプル210の中に存在する複数の成分410に対応する関連する固有値の全てが、本発明のシステム及び方法のユーザに明らかにされかつ表示される(ステップ630)ことが確実にされる。
【0047】
幾つかの実施形態に関連して前述されたように、固有値決定ステップ620の一部として固有値を決定するために(例えば、式(1)及び(2)によって定義されたように)因数分解関数を利用することは、因数分解関数が適用される特定の溶出時間及び/又は溶出時間間隔を選択するために相関関数を最適化することによって更に最適化される。例えば、図7に示されているように、本発明の実施形態は、自動的にデータセットを受信するためにステップ610aを備えている。そのような実施形態では、(図6に示されている)受信するステップ610で受信された全体的に二次元のデータ行列Xであるデータセットは、複数のサンプル210の全体にわたって複数のイオン220の少なくとも一部に対応する溶出時間の情報及び輝度情報も含んでいるという点でより複雑である。
【0048】
さらなる受信するステップ610aで受信されたデータセットを単純化するため、本発明の幾つかの方法に関する実施形態は、溶出時間において複数のサンプル210のそれぞれに対応するデータ行列(例えば、図3に示されている要素Xを参照のこと)を発生するために、対応する溶出時間によってデータセットの中の複数のイオンを相関するためのステップ620aを備えることができる。このため、結果として生じたデータ行列Xは、複数のサンプル210のそれぞれに対応する複数の行と、それぞれのサンプル210の中に存在する複数のイオン220に対応する複数の列を含んでいる。データ行列Xがアセンブルされると、複数のイオン210の一部の輝度に少なくとも部分的に基づいて固有値を決定するために、データ行列X上で因数分解関数を実行するステップを含むステップ620aが実行される。例えば、図6に示されている実施形態に関連して説明されているように、固有値は複数のサンプル210に存在する複数の成分410の少なくとも1つに対応することができる。この場合、成分には複数のイオン220の中の少なくとも2つの部分が含まれる。また、図6に関連して説明されたように、そのような方法は、複数のサンプル210の全体にわたって複数の成分410の少なくとも1つに対応する固有値を、目で見えるように表示するためのステップ630も更に含むことができる。
【0049】
図8に示されているように、本発明の実施形態は、複数のサンプル210の中に複数の周知の成分が存在することに対して複数のサンプル210を選別するために、(例えば、結果行列Fから及び/又は相関関数が発生した共通スペクトル410a、410b、410cから分かるように)複数の成分410の少なくとも1つのスペクトルを、複数の周知の成分に対応する複数の周知のスペクトルと比較するするためのステップ810を更に含むことができる。
【0050】
本願で説明される装置及び方法を提供することに加えて、本発明の実施形態は、本願で説明される動作を実行するための関連したコンピュータプログラム製品も備えている。このコンピュータプログラム製品は、媒体の中に取り入れられたコンピュータが読取り可能なプログラムコードを有するコンピュータが読取り可能な記憶媒体を有する。図6〜図8を参照すると、コンピュータが読取り可能な記憶媒体は、メモリ装置140の一部とすることができ、また前述された動作を実行するために、コンピュータが読取り可能なプログラムコードを実行することができる。
【0051】
この点について、図6〜図8は、本発明の幾つかの実施形態による特定の方法、システム及びコンピュータプログラム製品のブロック図の実例である。ブロック図の各ブロックすなわちステップ及びブロック図の中のブロックの組合せは、コンピュータプログラム命令によって実行できることは理解されよう。これらのコンピュータプログラム命令は、コンピュータ又はマシンを作る他のプログラム可能な装置にロードされて、コンピュータ又は他のプログラム可能な装置上で実行する命令がブロック図、フローチャート又は制御流れブロック又はステップの中で指定された機能を実行する。コンピュータ又は他のプログラム可能な装置を特定の方法で機能させることができるこれらのコンピュータプログラムの命令を、コンピュータが読取り可能なメモリの中に記憶して、コンピュータが読取り可能なメモリの中に記憶された命令が、ブロック図、フローチャート又は制御流れブロック又はステップの中で指定された機能を実行する命令を含む製品を作ることもできる。コンピュータプログラムの命令をコンピュータ又は他のプログラム可能な装置にロードし、一連の動作ステップをコンピュータ又は他のプログラム可能な装置上で実行させて、コンピュータの実行による処理を実現することができ、コンピュータ又は他のプログラム可能な装置上で実行される命令がブロック図、フローチャート又は制御流れブロック又はステップの中で指定された機能を実行するステップを提供することができる。
【0052】
従って、ブロック図、フローチャート又は制御流れ図のブロックすなわちステップは、指定された機能を実行する手段の組合せ、指定された機能を実行するステップの組合せ、及び指定された機能を実行するプログラム命令に対応する。ブロック図、フローチャート又は制御流れ図の各ブロックすなわちステップ、及びブロック図、フローチャート又は制御流れ図のブロックすなわちステップの組み合わせは、指定された機能又はステップを実行する特殊目的のハードウェアベースのコンピュータシステム、又は特殊目的のハードウェア及びコンピュータ命令の組み合わせによって実行されることができることも理解されよう。
【0053】
本願に記述された本発明の多くの変形例及び他の実施形態は、前述した説明及び関連した図面の中で示した教義の利点を有する本発明が属する技術分野の当業者には容易であろう。このため、本発明は開示された特定の実施形態に限定されるものではなく、また変形例及び他の実施形態は添付した特許請求の範囲の中に含まれるものとすることは理解されよう。本願の中で特別な用語が使用されるが、それらの用語は一般的であり説明のためのみに使用されるものであり、本発明の範囲を限定する目的で使用されるものではない。
【図面の簡単な説明】
【0054】
【図1】分光測定装置と通信する、データベースを有しメモリ装置及びユーザーインターフェースを備える本発明の一実施形態によるシステムを例示する概要図である。
【図2】全体的に特定のシリーズの生体サンプルの中に存在するイオンを示す一連のスペクトルを例示する図である。
【図3】特定のシリーズの生体サンプルの中に存在する成分に対応する固有値を決定するために、本発明のプロセッサ装置によって利用される二次元のデータ行列を例示する図である。
【図4】特定のシリーズの生体サンプルの中に存在する成分に対応する固有値を決定するために、本発明の幾つかの実施形態に基づいて、プロセッサ装置が実行する因数分解関数を例示する図である。
【図5】特定のシリーズの生体サンプルの中に存在する成分に対応する固有値を決定するために、本発明の幾つかの実施形態に基づいて、プロセッサ装置が実行する相関関数を例示する図である。
【図6】受信するステップ、固有値を決定するステップ、及び表示するステップを含む本発明の1つの実施形態による方法のフローチャートである。
【図7】相関及びその後の因数分解のステップを含む本発明の1つの実施形態による方法のフローチャートである。
【図8】検出された成分を識別するために、固有値を既知のスペクトルと比較するステップを含む本発明の1つの実施形態による方法のフローチャートである。

【特許請求の範囲】
【請求項1】
複数のサンプルの全体にわたって分析装置から受信されたデータを分析するシステムであって、
前記複数のサンプルのそれぞれに対応するデータ行列を自動的に受信するため、前記分析装置と通信するデータベースと、
前記複数のサンプルの中に存在する、複数のイオンの少なくとも一部を含む複数の成分の少なくとも一部に対応する固有値を決定するために前記データベースと通信するプロセッサ装置と、
前記複数のサンプルの全体にわたって複数の成分の少なくとも1つに対応する前記固有値を目で見えるように表示するため、前記データベース及び前記プロセッサ装置と通信するユーザーインターフェースと
を備え、前記データ行列が、前記複数のサンプルのそれぞれに対応する複数の行と、前記それぞれのサンプルの中に存在する複数のイオンに対応する複数の列とを含む、システム。
【請求項2】
前記プロセッサ装置が、固有値を決定するために因数分解関数を実行できるように構成され、前記固有値が、複数のサンプルの中に存在する複数の成分と、前記複数のサンプルのそれぞれの中に存在する複数の成分の少なくとも1つの相対濃度と、前記複数の成分の少なくとも1つの中に存在する複数のイオンの少なくとも一部を表示する、前記複数の成分の少なくとも1つのスペクトルとから構成されるグループから選択される請求項1に記載のシステム。
【請求項3】
前記因数分解関数が負でない行列因数分解を含む請求項2に記載のシステム。
【請求項4】
前記因数分解関数が独立した成分分析因数分解を含む請求項2に記載のシステム。
【請求項5】
前記プロセッサ装置が固有値を決定するために相関関数を実行することができるように構成され、前記固有値が複数のサンプルの全体にわたって共通スペクトルを含み、前記共通スペクトルが複数のイオンの少なくとも一部の組合せを含み、複数のサンプルの中に存在する複数の成分の少なくとも一部に対応する請求項1に記載のシステム。
【請求項6】
前記プロセッサ装置が、複数の成分の少なくとも1つのスペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較できるようにさらに構成され、複数のサンプル内に複数の既知の成分が存在しているかどうかについて前記複数のサンプルを選別する請求項2に記載のシステム。
【請求項7】
前記プロセッサ装置が、ほぼ純粋な成分に対応する共通スペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較することができるようにさらに構成され、複数のサンプル内に複数の既知の成分が存在しているかどうかについて前記複数のサンプルを選別する請求項5に記載のシステム。
【請求項8】
複数の既知のスペクトルを記憶するために前記データベースと通信するメモリ装置をさらに備える請求項6に記載のシステム。
【請求項9】
複数の既知のスペクトルを記憶するため、前記データベースと通信するメモリ装置をさらに備える請求項7に記載のシステム。
【請求項10】
前記分析装置が、核磁気共鳴イメージング装置と、スペクトロメトリ装置と、電気化学アレイ装置と、それらの装置の組合せとの少なくとも1つである請求項1に記載のシステム。
【請求項11】
複数のサンプルの全体にわたって分析装置から受信されたデータを分析するシステムであって、
サンプルの中に複数のイオンが存在していることを示し、複数のサンプルの全体にわたって複数のイオンの少なくとも一部に対応する溶出時間及び輝度を含むデータセットを自動的に受信するため、前記分析装置と通信するデータベースと、
前記データセットを処理するために前記データベースと通信するプロセッサ装置と、
前記複数のサンプルの全体にわたって複数の成分の少なくとも1つに対応する固有値を目で見えるように表示するため、前記データベース及び前記プロセッサ装置と通信するユーザーインターフェースと
を具備し、前記プロセッサ装置が、前記溶出時間において複数のサンプルのそれぞれに対応するデータ出力行列を発生するため、対応する溶出時間により複数のイオンの相関を取り、前記データ行列が複数のサンプルのそれぞれに対応する複数の行と、それぞれのサンプルの中に存在する複数のイオンに対応する複数の列とを含み、前記プロセッサ装置が、複数のイオンの部分の輝度に少なくとも部分的に基づいて固有値を決定するため、前記データ行列上で因数分解関数を実行し、前記固有値が、複数のサンプルの中に存在する複数の成分の少なくとも1つに対応し、前記成分が複数のイオンの少なくとも2つの部分を含む、システム。
【請求項12】
複数のサンプルの全体にわたって分析装置から受信されたデータを分析する方法であって、
前記複数のサンプルのそれぞれに対応するデータ行列を自動的に受信するステップと、
前記複数のサンプルの中に存在する、複数のイオンの少なくとも一部を含む複数の成分の少なくとも一部に対応する固有値を決定するステップと、
前記複数のサンプルの全体にわたって複数の成分の少なくとも1つに対応する前記固有値を目で見えるように表示するステップと
を含み、前記データ行列が、前記複数のサンプルのそれぞれに対応する複数の行と、前記それぞれのサンプルの中に存在する複数のイオンに対応する複数の列とを含む、方法。
【請求項13】
前記決定するステップが、固有値を決定するために因数分解関数を実行するステップを含み、前記固有値が、複数のサンプルの中に存在する複数の成分と、前記複数のサンプルのそれぞれの中に存在する複数の成分の少なくとも1つの相対濃度と、前記複数の成分の少なくとも1つの中に存在する複数のイオンの少なくとも一部を表示する、前記複数の成分の少なくとも1つのスペクトルとから構成されるグループから選択される請求項12に記載の方法。
【請求項14】
前記因数分解関数を実行するステップが負でない行列因数分解を実行するステップを更に含む請求項13に記載の方法。
【請求項15】
前記因数分解関数を実行するステップが独立した成分分析因数分解を実行するステップを更に含む請求項13に記載の方法。
【請求項16】
前記決定するステップが、固有値を決定するために相関関数を実行するステップをさらに含み、前記固有値が複数のサンプルの全体にわたって共通スペクトルを含み、前記共通スペクトルが複数のイオンの少なくとも一部の組合せを含み、複数のサンプルの中に存在する複数の成分の少なくとも一部に対応する請求項12に記載の方法。
【請求項17】
複数の成分の少なくとも1つのスペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較するステップをさらに含み、複数のサンプル内に複数の既知の成分が存在しているかどうかについて前記複数のサンプルを選別する請求項13に記載の方法。
【請求項18】
ほぼ純粋な成分に対応する共通スペクトルを複数の既知の成分に対応する複数の既知のスペクトルと比較するステップをさらに含み、複数のサンプル内に複数の既知の成分が存在しているかどうかについて前記複数のサンプルを選別する請求項16に記載の方法。
【請求項19】
複数のサンプルの全体にわたって分析装置から受信されたデータを分析する方法であって、
サンプルの中に複数のイオンが存在していることを示し、複数のサンプルの全体にわたって複数のイオンの少なくとも一部に対応する溶出時間及び輝度を含むデータセットを自動的に受信するステップと、
前記溶出時間において複数のサンプルのそれぞれに対応するデータ行列を発生するため、対応する溶出時間によりデータセット内の複数のイオンの相関を取るステップと、
複数のイオンの部分の輝度に少なくとも部分的に基づいて固有値を決定するため、前記データ行列上で因数分解関数を実行するステップと、
前記複数のサンプルの全体にわたって複数の成分の少なくとも1つに対応する固有値を目で見えるように表示するステップと
を含み、前記データ行列が、複数のサンプルのそれぞれに対応する複数の行と、それぞれのサンプルの中に存在する複数のイオンに対応する複数の列とを含み、前記固有値が複数のサンプルの中に存在する複数の成分の少なくとも1つに対応し、前記成分が複数のイオンの少なくとも2つの部分を含む、方法。

【図1】
image rotate

【図2.3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2009−530648(P2009−530648A)
【公表日】平成21年8月27日(2009.8.27)
【国際特許分類】
【出願番号】特願2009−501695(P2009−501695)
【出願日】平成19年3月20日(2007.3.20)
【国際出願番号】PCT/US2007/064385
【国際公開番号】WO2007/109659
【国際公開日】平成19年9月27日(2007.9.27)
【出願人】(502373592)メタボロン インコーポレイテッド (4)
【Fターム(参考)】