説明

複数のサンプルから得られる代謝物のデータを、コンピュータシステムのデータベースを用いて比較および編集するためのシステム、方法、ならびにコンピュータプログラム

本発明は、データベースとそれに連結した演算装置とによって編集された代謝物データの視覚的表示を生成する。特に本発明は、サンプル群の三次元スペクトル分析データを自動的に受け取るためのデータベースを提供する。本発明はまた、複数の選択した代謝物に対応する複数の固有プロットと直接比較できるプロットを生成するためのデータセットを処理する演算装置を提供する。さらに、上記演算装置は、上記サンプル群に渡って上記選択した代謝物が存在することを示す視覚的表示を生成することができる。それゆえ、本発明のユーザは、上記サンプル群に渡って上記選択した代謝物が存在することを示す視覚的表示をもって、一連の複雑なデータセットを解析することができる。さらに、本発明の実施形態によって生成される上記視覚的表示によって、迅速にスペクトル分析データセットの主観的な解析ができる。

【発明の詳細な説明】
【発明の詳細な説明】
【0001】
〔技術分野〕
本発明は、生体が代謝過程で産する小分子を研究対象とするメタボロミクスの分野に関するものである。特に、本発明は、複数のサンプルに渡ってスペクトル分析装置から受け取った代謝物のデータを編集および比較するように実施される。さらに本発明の実施形態は、ユーザが複数のサンプルに渡って代謝物のデータを主観的に解析できるように、複数のサンプルそれぞれの中の、選択した複数の代謝物の存在を示す視覚的表示をも提供する。
【0002】
〔背景技術〕
メタボロミクスとは、細胞、組織、もしくは器官(流動体を含む)の中に存在し、基礎代謝や中間代謝に関係する、小分子や代謝物を解析することである。用語「メタボローム」とは、生体中に存在する代謝物の総体を指す。ヒトのメタボロームは、一般的な代謝反応に関するとともに、細胞のメンテナンスや成長、もしくは細胞が通常に機能するために必要な自然の小分子(もともと生合成される、高分子化合物ではないもの)を網羅する。このように、メタボロミクスは細胞の生理機能の状態を直接観測するものであり、例えば、与えられた生体の病気を予測することができる。微かな生化学的変化(選択した代謝物の存在を含む)は、任意の病気に固有のものである。それゆえ、既知の反応経路のこれらの変化を正確にマッピングすることによって、研究者は病気の仮説を立てることができる。この仮説に基づくと、病気のターゲットは、目標の薬理化合物(targeted pharmaceutical compounds)を用いて処置することと同じであるというように、病気の決め手になる(critical to)酵素や蛋白質を明らかにできる。
【0003】
病気を内在する生化学反応過程を明らかにする分子生物学の技術は、ゲノムに集中している。ゲノムはDNAを作る遺伝子から成り、DNAはRNAに転写され、そして蛋白質に翻訳され、その蛋白質がヒトのメタボロームである小分子を生成する。ゲノミクス(DNAレベルでの生化学研究)、転写プロファイリング(RNAレベルでの生化学研究)、プロテオミクス(蛋白質レベルでの生化学研究)は病理経路の同定に役立つけれども、人間の細胞には25,000種の遺伝子、100,000〜200,000種のRNA転写、1,000,000種以上の蛋白質が存在しているという事実が、この方法を困難なものにしている。しかし、人間のメタボロームは2,500種程度の小分子しかないだろうと見積もられている。
【0004】
それゆえ、メタボロミクスの技術は、ゲノミクス、転写プロファイリング、プロテオミクスを超えた重大な躍進を提供するものである。メタボロミクスにおいては代謝物と代謝過程におけるそれらの役割は直ちに同定される。これに関連して、病気のターゲットの同定が既知の他のどの手法よりもより高い精度で迅速に行われる。病理経路の同定において使われる代謝物のデータの収集は、「Methods for Drug Discovery, Disease Treatment, and Diagnosis Using Metabolomics」(米国特許第10757616号明細書)中に一般的に書かれているものとして、この技術分野では一般的に知られている。代謝物のデータの更なる使用法は、上記文献中に記されており、例えば治療効果のある作用物(すなわち薬)、他の生体異物に対する反応検査、治験、薬の安全性の決定、および薬の発見も含まれている。しかしながら、多種の生体サンプル(例えば患者)から得られた代謝物データを収集し、整理することは、多くの時間とコンピュータ資源とを浪費する。例えば、ある従来のメタボロミクス技術によると、生体サンプルのスペクトル分析データが収集され、三次元にプロットされ、それぞれの生体サンプルに対応する個々のファイルに格納される。このデータは、病気のターゲットである既知の代謝物を同定するために、複数の既知の代謝物に対応するデータと比較される。またこのようなデータは毒性作用物もしくは薬理代謝物の同定にも使用できる。さらに、このようなデータは生体異物の効果を検証するのにも使用される。しかしながら、従来のファイルに基づく方法(それぞれの生体サンプルのために生成されたデータファイルを参照する方法)は、多大な計算処理と多数の既知の代謝物を選別処理するためのメモリ資源とを必要とする。さらにファイルに基づく方法によるデータ処理は、相当数に渡るサンプルの母集団のデータの編集では役に立たない。なぜなら、従来の代謝物データ処理技術によると、サンプルの母集団に渡って容易に検出される代謝物の混合物中の僅かな変化を考慮することなく、それぞれのサンプルを個別に解析するからである。さらに、既存のファイルに基づく方法には他の制限もある。限られた安全、限られた検査能力、多種のファイルのコピーにおけるデータの不整合性、および、ある一部の情報を欲した時に、すべてのファイルについて走査しなければならないように、個々のファイルは多角的な索引(例えば日付、サンプルID、治療の有無(control vs. treated)、投薬等)をサポートしていないという制限である。
【0005】
最新の代謝物データ解析技術におけるこれらの制限は、特定の代謝物を病気のターゲットとして分類し、同定するために使われる重要な代謝物データ、もしくはそれに潜在的に関係のある代謝物データを見捨てることにつながり得る。特に、多数の(個々のヒトの組織サンプルのような)生体サンプルに対応するスペクトル分析データは、一般にそれぞれの生体サンプルに対応した巨大なデータファイルとなる。それぞれのデータファイルは既知の代謝物のライブラリを使った選別過程に移されなければならない。しかしながら、従来のシステムでは、スペクトル分析過程から得られたデータを主観的に評価するために、多数の生体サンプルのスペクトル分析データを整理統合することは容易には許されない。それゆえ個々のサンプルに対応する一つのファイルは決定的ではないが、サンプル母集団中の他のサンプルを考慮した簡潔なフォーマットで主観的に見ると、そのようなデータはもっと効果的になる。
【0006】
それゆえ、従来の代謝物データ解析システムに関連する上述の技術的問題を解決するためのシステムの改良が必要となる。特に、それぞれの生体サンプルに対し個々のデータファイルを生成することなく、自動的にスペクトル分析データを受け取ることができるシステムが必要となる。また、三次元データセットを対応する二次元データセットに変換するとともに、プロットすることができるシステムも必要となる。またこのシステムは、選択した代謝物に対応する複数の特徴を表すプロット(固有プロット)と比較してもよい。更に、ユーザが選択した代謝物を同定するために複数のサンプルに渡ってスペクトル分析データを主観的に評価できるシステムが必要となる。
【0007】
〔発明の概要〕
本発明の種々の実施形態では、上述した多くの技術的問題を克服するシステムを提供する。また、本発明の種々の実施形態では、従来のスペクトル分析データ解析システムで得られた代謝物データを自動的に編集、変換、簡潔に表示することに関する他の技術的問題をも解決する。特に、実施形態の一つでは、本発明のシステムは、コンピュータシステムの負荷を減らすとともに、サンプル母集団に渡った代謝物の差異を考慮に入れた方法で、複数のサンプルに渡って解析装置(質量分析装置など)から受け取った代謝物データを編集し、比較する。実施形態の一つでは、上記システムは複数のサンプルそれぞれに対応した三次元スペクトルデータセットを自動的に受け取るために、解析装置と通信するデータベースを備える。上記データベースと通信する演算装置は、上記データセットを対応する二次元データセットに変換し、続いて、あるいは同時に上記二次元データセットをプロットすることができる。さらに、選択した複数の代謝物が存在する複数のサンプルを選別するために、上記演算装置は上記二次元データセットのプロットと、選択した複数の代謝物に対応する固有プロットとを比較することもできる。いくつかの実施形態によると、上記システムはさらに、データベース、あるいは、ユーザが主観的に複数サンプルからのデータを見ることができるような簡潔なグラフィック形式で、複数のサンプルに渡る選択した代謝物の存在を視覚的に表示する演算装置、もしくはその両者と通信するユーザインターフェイスを備える。
【0008】
さらに、いくつかの実施形態では、上記システムは、選択した複数の代謝物の固有プロット、あるいはそれらの基礎となるデータセットを格納する記憶装置を備える。本発明の様々な実施形態において、上記データベースは様々な種類の解析装置から自動的にデータを受け取るために利用される。この解析装置としては、以下に限らないが、質量分析装置(例えばガスクロマトグラフィや液体クロマトグラフィ技術を使ったもの)、核磁気共鳴(NMR)分光装置、電気化学的アレイ(ECA)(electrochemical arrays)、あるいは複数の生体サンプルから代謝物のデータを得るのに利用される他の解析装置が挙げられる。
【0009】
さらに、本発明は、コンピュータにかかる負荷を減らした方法で、複数のサンプルに渡った代謝物のデータを編集、比較する方法、およびコンピュータプログラムをも提供する。いくつかの実施形態では、上記方法は、データベースの中の複数のサンプルそれぞれに対応する三次元スペクトル分析データを自動的に受け取る工程と、そのデータを対応する二次元のデータセットへ変換する工程と、その二次元のデータセットをプロットする工程と、選択した複数の代謝物が存在する複数のサンプルを選別するために、上記二次元データセットのプロットと、選択した複数の代謝物に対応する複数の固有プロットとを比較する工程と、複数のサンプルに渡って選択した代謝物の存在を視覚的に表示する工程とから成る。
【0010】
本発明の実施形態における方法はさらに、複数のサンプルからの上記データセットを母集団のデータセットに編集する工程と、上記データセットに対しサンプルによる索引をつける工程とから成る。いくつかの実施形態における方法によると、視覚的に表示する工程は、固有の強度ピークが記録されている特徴的な時間(固有時間)と、複数のサンプルそれぞれの番号とを軸に取ったプロットを表示する工程を有する。さらにいくつかの実施形態における方法によると、この方法は、固有時間に強度ピークがないサンプル群それぞれに対応する少なくとも一つの二次元データセットを検索する工程を有し、またサンプルの母集団データを使う、あるいは他の統計的方法、あるいはその両方を用いて、サンプル群の中のそれぞれのサンプルの中に選択した代謝物あるいは化学成分が存在するかどうかを決定するために、より小さくてより処理しやすいサンプル群をユーザが主観的に見られるように、サンプル群それぞれに対応する、少なくとも一つの二次元データセットのプロットを表示する工程から成る。
【0011】
このように本発明の実施形態として記載されている、複数のサンプルに渡って代謝物データを編集し比較するための、システム、方法、コンピュータプログラムは、多くの利点を提供する。その利点としては、サンプルの母集団のデータセットを作成できるような複数の生体サンプルの複雑な三次元スペクトル分析データセットを自動的に編集するとともに、索引を付すことや、上記複雑な三次元データセットを目的の選択した複数の代謝物に対応するデータプロットのライブラリと比較することがより容易にできる二次元データセットに対応するデータプロットに変換することや、目的の代謝物を同定するために使われるスペクトルデータ解析の視覚的表現を提供することや、本発明の上記システムのユーザが個人的にスペクトル分析データを評価し、調査中のそれぞれの生体サンプルに対応する複数の個々のデータファイルを開く必要なしに、選択した代謝物が存在するか否かを表すデータの差異を示すそれらのサンプルのみを評価することができるような、生体サンプルの母集団に渡って編集されたデータの視覚的表現を提供することである。なお、本発明の利点は上記に限らない。
【0012】
本発明のシステム、方法、コンピュータプログラムは、これらの利点と、当業者には明白である他の利点とを提供する。ここで重要なことは、これらの利点すべてによって、上記システムは、代謝物の解析結果を、生体サンプルの母集団に渡った四次元に及ぶ簡潔な形式でユーザに表示することが可能になる。なぜなら、サンプルの母集団についての解析データは、潜在的な病気のターゲットのような興味のある代謝物の同定と同時に、視覚的形式によって直ちにユーザにより明確に示されるので、ユーザはサンプルの中に選択した代謝物、化学成分、あるいはその両者が存在するのかしないのかをより良く決定できる。さらに、追加のサンプルの母集団のデータが提供されるので、本発明の実施形態では、サンプル母集団から個々に見ると無視されるような、重要かもしれないスペクトル分析の結果を無視することは少ない。
【0013】
〔図面の簡単な説明〕
一般的な用語で本発明を説明するために添付の図を参照する。なお、正確な縮尺は必要ではない。
【0014】
図1は、記憶装置とユーザインターフェイスとを備え、スペクトル分析装置と通信するデータベースを備える本発明の一実施形態によるシステムを示す図である。
【0015】
図2Aは、一つの典型的な生体サンプルに典型的に関連したスペクトル分析データの三次元プロットを示す図である。
【0016】
図2Bは、本発明のシステムのいくつかの実施形態により生成され、選択した複数の代謝物に対応する複数の固有プロットと比較できる二次元プロットを示す図である。
【0017】
図2Cは、複数のサンプルそれぞれの中に選択した代謝物の存在を示す視覚的表示を含む本発明のシステムのいくつかの実施形態により生成されるプロットを示す図である。
【0018】
図3は、典型的な実施形態の一つによるシステム、方法、およびコンピュータプログラムの操作の流れを示す図である。
【0019】
〔発明の詳細な説明〕
以下に添付の図面を参照しながら、いくつかの本発明の実施形態とともに本発明をより詳細に記述する。なお、ここに挙げる本発明の実施形態がすべてではない。実際は、これらの発明は多くの異なった形態で実施され得るものであり、以下に記載する実施形態に限って解釈するべきものではない。むしろ、これらの実施形態は、本発明の開示が法の要件を満たすために提供されるものである。
【0020】
上述した本発明の様々な側面を、他の多くの側面とともに以下でさらに詳細に記述する。本発明のシステム、方法、およびコンピュータプログラムを質量分析装置に関連させて記述する。ただし、これは本発明の使用例のほんの一例である。特に、本発明のシステム、方法、およびコンピュータプログラムは、複数の生体サンプルから複雑な代謝物データセットを生成するために使用される多くの工程において応用できる。例えば本発明は、核磁気共鳴(NMR)分光装置、ガスクロマトグラフィ質量分析装置(GC−MS)、液体クロマトグラフィ質量分析装置(LC−MS)、電気化学的アレイ(EC)(electrochemical arrays)を含む種々の異なる解析装置や工程と一緒に使用することができる。なお、組み合わせる解析装置は上記に限らない。
【0021】
図1に本発明の一実施形態のシステムの一例を示す。このシステムは、質量分析装置110のような解析装置と通信するものである。同図に示すように、生体サンプル100は、分析装置110の中のクロマトグラフィカラムの培地の上に入れられ、当業者に評価されている質量分析技術を用いて解析される。例えば、個々の生体サンプル100の成分は分析装置110のカラムの中を異なる速度で進み、それぞれ固有の特性に基づいて異なるスペクトル応答を示す。当業者にはよく知られたことだが、分析装置110は、一般に生体サンプル100の混合物であることを示す、生体サンプル100それぞれに対応するスペクトル分析データの三次元データセットを生成する。このようなスペクトル分析データの三次元データセットの一例を図2Aに示す。図2Aでは、応答強度220、成分質量210、および時間230(特にこの例では、それぞれの成分が分析装置110のカラムの中を通った時間)の3軸上でプロットした。成分質量軸210上のデータの点の位置は、例えば、生体サンプル100中のそれぞれの成分分子の数を示しており、その成分の相対質量の値を示す。本発明のシステムの他の実施形態によると、生体サンプル100の三次元解析データセットを生成するために二つの解析装置が交互に使用される。その解析装置は下記に限定されるわけではないが例えば、核磁気共鳴(NMR)分光装置、液体もしくはガスクロマトグラフィ質量分析装置(それぞれLC−MS、GC−MS)、電気化学的アレイ(EC)装置(electrochemical array)、あるいはこれらの装置の組み合わせである。このような複雑な三次元データセットが、以下に更なる詳細を記す本発明の装置と通信することができる他の適当な解析装置から生成されることを、当業者は認識している。
【0022】
複数の生体サンプル100は、ウェルプレート120もしくは他のタイプの容器から個々に取り出され、解析と三次元データセット(図2参照)の生成とのために解析装置110の中に個々に入れられる。例えば、個々の生体サンプル100は、ウェルプレート120からピペット、スポイト、マイクロ流体チップ(microfluidic passageways defined in a test array)、あるいは研究室にある他の生体サンプル移送装置を用いて解析装置110に移送される。限定されるわけではないが、この生体サンプルは、血液サンプル、尿サンプル、培養した細胞、もしくは唾液サンプル、あるいは目的の代謝物、化学物質、もしくはその両者が存在する他の生体サンプルである。
【0023】
図1に示すように、本発明の実施形態の上記システムは、複数のサンプル100それぞれに応じた三次元データセットを自動的に受け取るために、解析装置110と通信できる演算装置130(例えばコンピュータ装置)と、演算装置130が通信するデータベース(例えば記憶装置140の中に収められた(例えばリレーショナルデータベース))から成る。演算装置130は、そこに収納された(あるいはそこと通信ができる)データベースが解析装置110からデータセットを受け取ることができるように、ワイヤ(有線)(RS−232、あるいはその他のワイヤ接続)、ワイヤレス技術(例えばRF、IR、あるいはその他ワイヤレス通信手段のような)あるいはその両方によって解析装置110と通信する。さらに解析装置110は、有線あるいは無線のコンピュータネットワークによって、一つ以上の演算装置130(および関連するユーザインターフェイス150)と通信できる。上記コンピュータネットワークとは下記に限らないが、例えばインターネット、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、その他の種類のネットワーク、あるいは当業者に広く認められた技術である。上記データベースは例えばOracle、Sybase、DB2、もしくはその他のソフトウェアのような、市販のソフトウェアを使用して構築することができる。図1に示すように、上記データベース(あるいは上記データベースを収めた演算装置130)はさらに、解析装置110から自動的に受け取った三次元データセットを格納するための記憶装置140(例えばハードディスクドライブ、メモリチップ、フラッシュメモリ、RAMモジュール、ROMモジュール、あるいはその他の記憶装置140)と通信ができる。加えて、記憶装置140は、上記データベースが受け取った、あるいは演算装置130が処理したデータを格納するために使われる。
【0024】
いくつかの実施形態では、演算装置130は、上記データベースが受け取った三次元データセット(図2A参照)を、特定の点235での時間軸に沿った個々の生体サンプル100の二次元断面から成る、少なくとも一つの二次元のデータセット(図2B参照)に変換することができる。なお、ここで時間とは、解析装置110に生体サンプル100が注入された、あるいは別の方法で入れられた時をゼロ点とし、そこから測定されたものである。例えば、演算装置130は、与えられた時間点235(図2B参照)でのサンプルの質量対強度の断面を提供する。さらにX軸(もしくは例えば時間軸230)は保持指標あるいは保持時間として特徴付けてもよい。このように、三次元データセット(例えば図2A)を、応答強度220と質量210とを軸としてプロットできるような少なくとも一つの二次元データセット(例えば図2Bの断面を持つ)に変換するために、演算装置130は、三次元データセットを個別の時間点(例えば235)に対応する個々の二次元断面に分けて解析することができる。
【0025】
さらにいくつかの実施形態のシステムによると、選択した複数の代謝物の存在に対し複数の生体サンプル100を選別するために、(データベースと通信する)演算装置130は、選択した複数の代謝物に対応する複数の固有プロットと、少なくとも一つの二次元データセットのプロット(図2B参照)とを更に系統的に比較することができる。当業者にはよく知られたことだが、選択した既知の、あるいは既知だが名前のない代謝物は、質量分析装置110において固有の時間後に、特徴的な質量対強度の断面を示す。特にいくつかの実施形態では演算装置130は、選択した複数の代謝物に対応する複数の固有プロットを格納する記憶装置140を備える、あるいはその記憶装置140と通信できる。例えば、当業者は、選択した代謝物に対応する格納された二次元断面と、質量分析の結果得られた(時々図2Bに見られるようにμAで表現される)応答強度の二次元プロットとを比較することによって、様々な確実性の度合いで代謝物が同定されたと認識する。このように本発明の実施形態は、それぞれの少なくとも一つの二次元データセット(その多くはそれぞれの生体サンプル100に対応する)のプロットと、選択した代謝物に対応する固有プロットの組とを系統的に比較することができる。本発明の実施形態の様々なシステムや方法は、選択した代謝物に対応する固有プロットの組と、少なくとも一つの二次元データセットのそれぞれとを比較することができることが分かる。ここで固有プロットとは既知で名前のある、あるいは既知で名前のない化合物に対応するものである。例えば、本発明の実施形態は化学物質名を持っている、あるいは固有プロットはすでに同定されているが化学物質名もしくは分類がまだ特定されていない、知られているが名前の付いていない代謝物の両方に対応する固有プロット(例えば記憶装置140に格納された)を利用することができる。
【0026】
さらに、本発明のデータベースは一つのリレーショナルデータベースにある複数の生体サンプル100から取り出した代謝物データを格納することができるので、生体サンプル100のデータ(特に、ある選択した時間点に対応する断面データ)は容易に結合、比較、あるいはその双方を行うことができ、少なくとも一つの二次元データセットのプロットと選択した代謝物(もしくは他の化学物質)の固有プロットとの間の適合の確実性を、断面の適合の確実性が劣る生体サンプル100中において選択した代謝物が存在することを推量するために使えるようになる。それゆえ本発明のシステムのユーザは、生体サンプル100の母集団全体の中で普及しているマッチング方法で与えられた、通常は要求される最低限の閾値に満たなかった断面が、実際は選択した代謝物の存在を示しているということを主観的に決定できる。本発明の実施形態はこのように、不明確なものについて結論づけるために、生体サンプルの母集団に渡った確実な適合の視覚的表示を利用する(図2C参照)。生じうる適合は実際のところ確かなデータ点であり、生体サンプルの選択した代謝物、化学成分、もしくはその双方の存在を示す適合である。
【0027】
例えば、いくつかの生体サンプル100の場合、図2Bに見られる断面は、(例えば既知のあるいは既知だが名前が付いていない代謝物のような)選択した代謝物の固有プロットと高い確実性をもって適合する(図2Cに示すように、選択した時間枠260,270の中にあるデータ点として示される)。しかしながら、生体サンプルの多様性、生体サンプル100の中の潜在的な汚染物質、当業者が認識している実験の複雑化、あるいはそれら全てのために、いくつかの生体サンプル100の解析によって得られた三次元データセットは、与えられた時間において質量と応答強度とからなる二次元断面が高い確実性をもって固有プロットと適合しないことがある。現在のファイルに基づく方法のデータ解析システムでは、それぞれの生体サンプル100が個々に解析される。その結果二次元データセット(およびそれに対応する(図2Bのような)断面プロット)が生体サンプル100の母集団を考慮すると主観的に解析することができないという事実のために、ある代謝物あるいは他の化学物質の存在が早まってあるいは不当に見捨てられる。
【0028】
本発明のシステムの実施形態は、選択したピークが、解析装置110によって検出される時間を表す時間軸240上で、複数の生体サンプル100に渡って(強度ピークがある代謝物と適合することにより示されるような)選択した代謝物の存在の(例えば図2Cのような)視覚的表示をするために、上記演算装置130と通信するユーザインターフェイス150から構成することができる。ユーザインターフェイス150は、一般に図2Cに示すような(生体サンプル100の個体を示す)サンプル番号250と時間240とを軸にとった表示160をユーザに提供することができる。
【0029】
ユーザインターフェイス150は表示装置、パーソナルコンピュータ、あるいはデータのグラフ表示機能をもつ他の電子機器で構成することができる。例えば図2Cに示されるように、時間240とサンプル番号250とを軸にとるグラフはデータベース130によって作られ、本発明のシステムのユーザがそれぞれの生体サンプルの成分構成の違いを視覚的な差異によって見分けられるように、ユーザインターフェイス150に表示される。いくつかの実施形態では、(時間の閾値260,270に定義されるような)選択した時間間隔の中で検出された、明確に適合する強度ピークを示さない範囲外の生体サンプル(例えば図2Cのサンプル番号7番)を直ちに識別するために、ユーザインターフェイス150、演算装置130、あるいはその双方は、時間の閾値の目印260,270を作成することができる。このように本発明のシステムのユーザは、大多数の生体サンプル100に強度ピークが検出される特定の時間265を見分けるために、図2Cにおける多数のサンプルの視覚的描写を利用することができる。それから本発明のシステムは、(質量210対強度220による)ある断面プロットが、実は(与えられた固有質量では最善ではない強度ピークで示される)選択した代謝物の存在するサンプルを示しているかどうかをユーザが主観的に結論付けることができるように、特定の時間265に対応する特定の断面プロット(例えば図2B)を呼び出すことができる。
【0030】
さらに図2Cに示すように、本発明のシステムは、それぞれの生体サンプル250について、(ユーザあるいは閾値を定義した装置によって)強度ピークが客観的に決定される複数の時間の閾値260,270を編集し、表示することも可能にする。さらにこの情報を、ユーザが、選択した代謝物の存在を表すような”最善ではないがあると認められる”断面の適合を主観的に決定するのに利用される根拠に加えることができる。例えば図2Cに示され、上述したように、時間t1において解析装置110はサンプル番号7番に客観的な強度ピークを検出しなかった。しかし、他のすべてのサンプルでは客観的なピークが検出された。このように演算装置130はこの異常を検出し、解析装置110の客観的な判断の全てに渡りユーザの主観的な判断がなされるように、ユーザインターフェイスを通じて時間t1におけるサンプル番号7番の断面情報(図2B参照)を自動的に表示する。さらに本発明のシステムによるとユーザは、(図2Cの時間240とサンプル250とを軸にしたプロットにおいて)時間t2に存在する客観的なピークを表示することによって、(サンプル7番において)t1に不明瞭なもしくは検出されなかったピークの存在を主観的に判断するための確証を得ることができる。
【0031】
このように本発明の実施形態のシステムによるとユーザは、(ユーザインターフェイス150に時間プロット160として表示される)生体サンプル100はさらなる精密な調査を必要とするかどうかを即座に見分けることができる。それからさらに、生体サンプル100の母集団全体の結果の表示160と連係して時間の閾値の境界260、270を使うことにより、本発明の演算装置130は、生体サンプルの母集団全体と比較する選択した時間265において、適合もしくは固有の強度ピークを示さない生体サンプル100に対応する少なくとも一つの二次元プロット(図2B参照)の組を(記憶装置140あるいはデータベース130から)自動的に検索する。それから、選択した時間265に特徴を示すピークが存在しないのは、生体サンプル100の母集団の大多数の化学構成とは異なる代謝物が存在するのか、欠けているのかを決定するために、(点280の範囲外に対応する)データベースから検索された上記二次元プロットが主観的に解析される。
【0032】
いくつかの実施形態のシステムはこのように、視覚的表示150(例えば図2C)によって、生体サンプルの母集団全体から視覚的に見分けられるように、生体サンプル中に存在する一つあるいはそれ以上の代謝物の表を作り出す。それゆえこの代謝物の表は、薬剤の開発のための病気のターゲットに対応したリストを提供することもできる。加えていくつかの実施形態では、データベースと通信する演算装置130は、下記に限らないが、生体サンプル100が採られた患者が示す症状、患者の生理的データ、他の補足の患者データ(身長、体重、年齢など)、あるいは他の治療データを含む治療のデータを作るのにも使用される。このように本発明のデータベースを使用すれば、代謝物データに特徴的で測定のできる変化をもたらす病気や疾患の予測をすることにデータベース130を使うことができるように、生体サンプル100中の選択した代謝物の存在と他の治療因子との相関を見出すことができる。
【0033】
本発明の実施形態はまた、一般に図3のフローチャートに示されるような、複数の生体サンプル100に渡った代謝物のデータを編集および比較する方法を有する。工程310では、データベース中の複数の生体サンプル100それぞれに対応した(図2Aに示されるような)三次元データセットを自動的に受け取る。一般に図1に示されるように、また上述したように、三次元データセットは、複数の代謝物と他の成分とを含んだ生体サンプル100に対応した特性を示す解析データを生成することができる解析装置110と、(コンピュータ装置のような)演算装置130と、(有線あるいは無線で)通信することができるデータベースに受け渡されるスペクトル分析データとから成る。いくつかの実施形態、ここでは質量分析装置を使用して生成された三次元データセットにおいては、三次元データセットを定義する軸は、一般に図2Aに示されるように、成分質量210と、応答強度220と、時間230と(ここでの時間とは生体サンプル100中の特定成分が分析装置110のカラムの中を通過した時間)から成る。さらに、自動的に受け取る工程310は、サンプル母集団中の多くの生体サンプル100において繰り返され、生体サンプル100のそれぞれに対応する解析データに索引を付し、演算装置130(あるいはコンピュータ装置、もしくはそれらと通信するユーザインターフェイス150)によってデータベースから検索できるように、本発明の演算装置130によって自動的に編集される。
【0034】
とりわけいくつかの実施形態の方法では、自動的に受け取る工程310はさらに、(サンプル母集団の統計上の境界を決定するために使われる)母集団のデータセットを生成するために、複数の生体サンプル100から三次元データを編集する工程と、生体サンプル100中で(例えば図2Cのサンプル7番に見られるような)統計的に外れるものを母集団全体と比較して同定した時、演算装置130がデータベースから特定の生体サンプル100(例えばサンプル7番)に対応するデータを検索できるように、そして上記生体サンプル100中に選択した代謝物が存在しているのかどうかを主観的に判断するためにユーザに(例えばユーザインターフェイス150にて)表示することができるように、個々の生体サンプル100に基づいて三次元データに索引をつける工程とから成る。上述したように、データベース130がサンプル母集団からの差異を示す生体サンプル100に対応するデータを検索することができるように、時間の閾値(図2Cの要素260、270)を決定するために本発明のシステムを使用することができる。
【0035】
本発明の実施形態の方法の工程320は、(一般に図2Aに見られる)三次元データセットを、(一般に図2Bに見られる)対応する少なくとも一つの二次元データセットに変換する工程から成る。工程320は例えば、異なる時間を持つ生体サンプル100中のそれぞれの成分が、応答強度220と質量210との軸でプロットされた対応する二次元データセット(図2B参照)と結びつくように、時間軸220に沿って三次元データセットを分析する工程を有してもよい。また本発明の実施形態の方法は、図2Bに示されるような少なくとも一つの二次元データセットをプロットするための工程330を有する。例えば、工程310でにおいてスペクトル分析データがデータベースに自動的に受け渡される、本発明の実施形態の方法では、工程330は、選択した代謝物に対応する固有プロットと直接比較できる、質量210と応答強度220とを軸に取った対応する二次元データセット(例えば分析装置のカラムの中で測定される固有時間を持つ生体サンプル100の成分に応じた二次元データセット)をプロットする工程を有することができる。それゆえこの方法の工程340は、選択した複数の代謝物が存在する複数のサンプル100を選別するために、選択した複数の代謝物に対応した複数の固有プロットと、少なくとも一つの二次元データセット(例えば図2B)のプロットとを比較する工程から成る。
【0036】
このような二次元断面は、質量分析装置にかけられた生体サンプル100の中に特定の代謝物あるいは化学物質が存在するか否かを示すことができるということを、当業者は認識している。しかしながらまた、ある割合の生体サンプルだけが、選択した代謝物との確かな適合を示す質量対応答強度の断面を作るということも、当業者は認識している。また本発明の実施形態の方法は、図2Bに示されるような少なくとも一つの二次元データセットをプロットする工程330を有することもできる。例えば、スペクトル分析データが工程310でデータベースに自動的に受け渡される実施形態の方法では、工程330は、選択した代謝物に対応する固有プロットと直接比較できる、時間230と応答強度220とを軸に取った二次元データセット(例えば特定の質量を持った生体サンプル100の成分に応じた二次元データセット)をプロットする工程を有することができる。それゆえこの手段の工程340は、選択した複数の代謝物が存在する複数のサンプル100を選別するために、選択した複数の代謝物に対応した複数の固有プロットと、少なくとも一つの二次元データセット(例えば図2B)のプロットとを比較する工程から成る。本発明の種々の実施形態のシステムを考慮して上述したように、実施形態の方法はまた、選択した代謝物に対応する固有プロットの組と、少なくとも一つの二次元データセットのプロットそれぞれとを比較することもできるということがわかる。上記の選択した代謝物とは、既知で名前のある代謝物、あるいは既知だが名前のない代謝物を含むが、以上に限らない。例えば、上述した種々の実施形態の方法は、化学物質名のある代謝物と、その固有プロットは同定されているが化学物質名あるいは分類はまだ割り当てられていない既知だが名前の付いていない代謝物の、両方に対応した固有プロットを利用することができる。
【0037】
図3に示すように工程350は、複数のサンプルそれぞれの中の選択した代謝物の存在を視覚的に表示する工程から成る。いくつかの実施形態によると、この方法の工程はさらに、サンプル母集団全体と比較した場合に、選択した時間範囲(例えば時間閾値260,270で定義される)の中に、固有ピークが欠けている生体サンプル100を最初に同定するために、時間240(すなわち目的の適合強度ピークが検出される時間)とサンプル番号250とを軸にとる視覚的表示(図2C参照)を生成する工程と、選択した代謝物あるいは化学物質の存在をユーザが主観的に判断できるように、固有ピークを欠いた生体サンプル100に対応する少なくとも一つの二次元データセットを検索する工程とから構成することができる。最後に、いくつかの実施形態において工程350はさらに、生体サンプル100に存在する代謝物あるいは化学物質の表を提供することができる。
【0038】
このように、本発明の実施形態の方法は、(図2Bにプロットされたような)特徴を示すデータセットをそれぞれの生体サンプルについて蓄積し、それらのデータセットを、(例えば図2Cにプロットされたような)複数の生体サンプルに渡って固有のデータをマッピングするために結合し、また利用するように、データベースの中の生体サンプルの母集団からのデータと結合することにより、生体サンプル100の中に選択した代謝物、化学物質、あるいはその双方が存在するか否かを主観的に決定することを可能とする。図2Cの視覚的表示は、主観的な精査を必要とする特定の生体サンプルの同定を容易にする。これは特に図2Cで明らかである。例えば、特定のサンプルが注目している時間265のそれぞれに固有のピーク、断面の適合、もしくはその双方を示さないが、他の点で母集団全体のデータと適合する場合である。以前のデータ解析の方法はそのようなサンプル100を無視するあるいは見捨てていたけれども、本発明の手段ではユーザは、異常が説明できるものなのか、あるいはそのサンプルにある根本的に化学的な違いを示すものなのかということを、より精密で主観的な調査をするためにそのような生体サンプルを強調することができる。
【0039】
装置と方法とに加えて、本発明はさらに上記の操作を実行するコンピュータプログラムも提供する。このコンピュータプログラムは、メディアの中で具体化された、コンピュータ読み取り可能なプログラムコードを格納したコンピュータ読み取り可能な記憶媒体を備えている。図3で説明すると、上記のコンピュータ読み取り可能な記憶媒体は記憶装置140の一部であって、上記操作を行うために、上記コンピュータ読み取り可能なプログラムコードを実行する。
【0040】
この点において、図3は本発明による方法、システム、およびプログラムのブロック図である。このブロック図のそれぞれのブロック、工程、あるいはブロックの組み合わせは、コンピュータプログラムの指令によって実行される。このコンピュータプログラムの指令は、機構を構成するためのコンピュータあるいは他のプログラム可能な装置に取り込まれて実行され、上記ブロック図、フローチャート、制御フローブロック、もしくは制御フロー工程で記述された機能を実行するための手段を作り出す。また、特定の方法で作用するために、コンピュータや他のプログラム可能な装置に指令を出すことができるコンピュータ読み取り可能な記憶装置に、上記コンピュータプログラムの指令は格納される。上記のコンピュータ読み取り可能な記憶装置に格納された指令は、上記ブロック図、フローチャート、制御フローブロック、もしくは制御フロー工程に記述された機能を実行する指示手段を含んだ一つの製品を作り出す。また、コンピュータが実行する過程を作るために、上記コンピュータプログラムの指令は、コンピュータや他のプログラム可能な装置に取り込まれ、コンピュータや他のプログラム可能な装置上で操作上の工程の組が実行される。上記のコンピュータや他のプログラム可能な装置上で実行される指令は、ブロック図、フローチャート、制御フローブロック、もしくは制御フロー工程に記述された機能を実行するための手段を提供する。
【0041】
したがって、ブロック図、フローチャート、もしくは制御フロー図のブロックや工程は、記述された機能を実行する手段の組み合わせと、記述された機能を実行する工程の組み合わせと、記述された機能を実行するプログラム指示手段をサポートする。また、特別な目的のハードウェアや、コンピュータの命令に記述された機能、あるいは工程、あるいはその組み合わせを実行する特別な目的のハードウェアに基づくコンピュータシステムによって、ブロック図、フローチャート、もしくは制御フロー図のブロックや工程のそれぞれと、ブロック図、フローチャート、もしくは制御フロー図のブロックや工程の組み合わせが実行されることもわかる。
【0042】
上述の記述とそれに関係する図との中で提供される知識によって利益を得る、これらの発明が関係する当業者は、これ以降、本発明の多くの変更例と他の実施形態とを考え付くだろう。それゆえ、本発明は、開示した特定の実施形態に限られるものではなく、請求項の範囲内で、様々な変更例や他の実施形態が含まれる。ここでは特定の用語を用いているが、それらは一般的な、あるいは記述的な意図で使用しただけであって、本発明を制限する目的で使用したわけではない。
【図面の簡単な説明】
【0043】
【図1】記憶装置とユーザインターフェイスとを備え、スペクトル分析装置と通信するデータベースを備える本発明の一実施形態によるシステムを示す図である。
【図2A】一つの典型的な生体サンプルに典型的に関連したスペクトル分析データの三次元プロットを示す図である。
【図2B】本発明のシステムのいくつかの実施形態により生成され、選択した複数の代謝物に対応する複数の固有プロットと比較できる二次元プロットを示す図である。
【図2C】複数のサンプルそれぞれの中に選択した代謝物の存在を示す視覚的表示を含む本発明のシステムのいくつかの実施形態により生成されるプロットを示す図である。
【図3】典型的な実施形態の一つによるシステム、方法、およびコンピュータプログラムの操作の流れを示す図である。

【特許請求の範囲】
【請求項1】
複数のサンプルに渡って解析装置から受け取った代謝物のデータを編集および比較するシステムであって
上記複数のサンプルのそれぞれに対応する三次元データセットを自動的に受け取るために、上記解析装置と通信するデータベースと、
上記データセットを少なくとも一つの二次元データセットに変換し、上記少なくとも一つの二次元データセットをプロットし、選択した複数の代謝物が存在する上記複数のサンプルを選別するために、上記少なくとも一つの二次元データセットのプロットと、上記選択した複数の代謝物に対応する複数の固有のプロットとを比較するために、上記データベースと通信する演算装置と、
上記複数のサンプルに渡って上記選択した代謝物の存在を視覚的に表示するために、上記データベースならびに上記演算装置と通信するユーザインターフェイスとを備えるシステム。
【請求項2】
上記複数の固有プロットを格納するために上記データベースと通信する記憶装置をさらに備える請求項1に記載のシステム。
【請求項3】
上記解析装置は、核磁気共鳴分光装置(a nuclear magnetic resonance imaging device)、スペクトル分析装置(a spectrometry device)、電気化学的アレイ装置(an electrochemical array device)、もしくはそれらの組み合わせから成る請求項1に記載のシステム。
【請求項4】
複数のサンプルに渡って代謝物のデータを編集および比較する方法であって、
データベースにおける複数のサンプルのそれぞれに対応する三次元データセットを自動的に受け取る工程と、
上記データセットを対応する少なくとも一つの二次元データセットに変換する工程と、
上記少なくとも一つの二次元データセットをプロットする工程と、
選択した複数の代謝物が存在する上記複数のサンプルを選別するために、上記少なくとも一つの二次元データセットのプロットと、選択した複数の代謝物に対応する複数の固有のプロットとを比較する工程と、
上記複数のサンプルに渡って上記選択した代謝物の存在を視覚的に表示する工程とを有する方法。
【請求項5】
上記三次元データセットを自動的に受け取る工程はさらに、
上記複数のサンプルからの上記データセットを母集団のデータセットに編集する工程と、
サンプルによって上記データセットに索引を付す工程とを有する請求項4に記載の方法。
【請求項6】
上記視覚的に表示する工程は、
固有の強度ピークが記録された固有時間と、上記複数のサンプルのそれぞれの番号とを軸に取ってプロットする請求項4に記載の方法。
【請求項7】
上記固有時間に上記固有の強度ピークがないサンプル群のそれぞれに対応する、上記少なくとも一つの二次元データセットを検索する工程と、
上記サンプル群のそれぞれに対応する、上記少なくとも一つの二次元データセットのプロットを表示する工程とをさらに有する請求項6に記載の方法。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図2C】
image rotate

【図3】
image rotate


【公表番号】特表2009−505231(P2009−505231A)
【公表日】平成21年2月5日(2009.2.5)
【国際特許分類】
【出願番号】特願2008−526121(P2008−526121)
【出願日】平成18年8月7日(2006.8.7)
【国際出願番号】PCT/US2006/030838
【国際公開番号】WO2007/019485
【国際公開日】平成19年2月15日(2007.2.15)
【出願人】(508038677)メタボロン インコーポレイテッド (5)
【氏名又は名称原語表記】METABOLON INC.
【住所又は居所原語表記】800 Capitola Drive, Suite 1, Durham, NC 27612 (US)
【Fターム(参考)】