説明

フーリエ変換イオンサイクロトロン共鳴質量分析装置を用いて作製された非標的メタボロニクスデータを視覚化する方法

本発明は、以下のように要約できる。
本発明は、
i)データエレメント値X及びデータエレメント値Yを有するデータの順序対(X、Y)によって特徴付けられる成分を1若しくは2以上含む試料の複数から質量分光データを得(このときXは、成分の質量と同等又は正比例するデータエレメント値であり、Yは、成分の容量と同等又は正比例するデータエレメント値である)、
ii)前記試料においてデータエレメント値Xが共通である全ての固有成分を同定し、かかる全X値の平均値をそこから計算し、平均値を求め、さらに、Xが共通である順序データ対における全Y値の平均値及び任意で標準偏差値を求め、
iii)コード可能なセルアレイを有するデータ構造を作製し、前記各試料に存在する各固有成分の容量との関係に基づき、所定の値又は前記分光データのその他の特徴について色又は他の識別可能な特徴付けを各セルに施す、
ステップからなる分光データを表示する方法を提供する。
分光データを有するデータ構造も開示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析装置を用いて得たデータを表示する方法に関する。より具体的に本発明は、質量分析装置を用いて得たデータ及びかかるデータを有するデータ構造を表示する方法に関する。
【背景技術】
【0002】
代謝プロファイリングは、遺伝子機能、遺伝子エンジニアリングが生物に与える効果、実質的同等性、薬剤の作用機序、薬剤副作用の観察、及び疾患の生化学的基礎を測定するのに用いられる新興科学である。FT−ICR−MSを用いる非標的代謝プロファイリングにより、複合生物抽出物における多数の代謝産物が同定される。かかる分析による最終的なアウトプットは、観察した代謝産物の質量及び強度である。質量は、分子式の決定、ひいては試料中の代謝産物の同定に用いられ、強度は、試料中代謝産物の定量に用いられる。異なる生物試料の代謝プロフィールを比較することにより、代謝産物の変化が観察できる。このような生化学的変化は、実験イベントの効果を理解するために用いられる。
【0003】
質量分析及びクロマトグラフィーにより得られるデータ、並びにこの種のデータを保存、体系化及び検索するデータベースを表示する視覚化ツールは、いくつも開発されてはいるが、これらのツールが機能するのは既知分子に対する標的分析においてのみである。現在のところ、代謝プロフィールの変化をユーザーが迅速に同定できるような、複数の非標的試料分析で得た情報を表示若しくは体系化する有効な方法はない。
【0004】
大量の代謝データを見て解釈する能力は、非標的代謝法を用いる生物系の研究において律速段階にある。ユーザーが得た知見をユーザーが迅速に解釈して報告することを可能にする方法を編み出すことにより、非標的代謝学を用いる機能的ゲノミックスに要する時間や、ひいては費用が大幅に削減されると考えられる。
【0005】
当技術分野においては、分析装置を用いて得たデータを表示する新規な方法が必要とされている。当技術分野ではさらに、多数の非標的試料から得たデータを表示若しくは視覚化する新規な方法が必要とされている。また、当技術分野では、FT−ICR−MSを用いて得られた非標的代謝データを2Dアレイフォーマット形式で体系化及び表示する方法及びデータ構造も必要とされている。さらにまた、表示されたデータを追加データベースにリンクさせて、表示されたデータをさらに特徴付け又は分析することも必要とされている。
【0006】
本発明の目的は、先行技術の欠点を克服することにある。
【0007】
上記の目的は、本発明主要クレームの性質を組み合わせることにより達成される。本発明の下位クレームには、本発明におけるさらに有利な実施態様が開示されている。

【発明の開示】
【0008】
[態様の要約]
本発明は、分析装置を用いて得たデータを表示する方法に関する。より具体的に本発明は、質量分析装置を用いて得たデータ、及びかかるデータを有するデータ構造を表示する方法に関する。
【0009】
本発明は、以下のステップからなる分光データを表示する方法を提供するものである。
【0010】
i)データエレメント値X及びデータエレメント値Yを有するデータの順序対(X、Y)によって特徴付けられる成分を1若しくは2以上含む試料の複数から質量分光データを得(このときXは、成分の質量と同等又は正比例するデータエレメント値であり、Yは、成分の容量と同等又は正比例するデータエレメント値である)、
ii)前記試料においてデータエレメント値Xが共通である全ての固有成分(unique components)を同定し、かかる全X値の平均値をそこから計算し、平均値を求め、さらに、Xが共通である順序データ対における全Y値の平均値及び任意で標準偏差値を求め、また、
iii)コード可能なセルアレイを有するデータ構造を作製し、前記各試料に存在する各固有成分の容量との関係に基づき、所定の値又は前記分光データのその他の特徴についてカラーコード又は他の識別可能な特徴付けを各セルに行う。
【0011】
さらに本発明は、質量値及び強度値を有する、複数のFT−ICR−MS代謝分析データファイルを視覚化する方法を提供するものである。かかる方法は以下のステップからなる。
i)視覚化するファイルを選択し、
ii)選択した全ファイルを統合し、全代謝産物をその質量に応じて分類し、選択した全ファイルに存在する固有質量を全て同定する。各固有質量の平均値及び標準偏差値、及び観察された強度の平均値及び標準偏差値、及び前記固有質量が見い出されたファイル数を決定する。
iii)固有質量リストを縦軸にとり、選択したファイルの数を横軸にとる2次元(2D)アレイを有するデータ構造を作製する。ユーザー定義のカラーコードに従い、縦軸・横軸座標で決まるセルに代謝産物存在量を表示する。ユーザーは、例えば、a)観察された代謝産物強度、b)選択したファイルにおける代謝産物の平均強度に対する観察された強度の割合又はパーセント、c)選択したファイルの1つ、又はそれらの組合せにおいて観察された強度に対する観察された強度の割合又はパーセント等、多数の方法によってデータを見るオプションを有するが、これらの方法に限定されない。従って本方法は、多数の代謝データファイルの迅速かつ簡約化された表示若しくは視覚化を可能とするものである。結果的に、複合混合物における代謝変化の決定及び同定が大幅に簡素化される。
【0012】
さらに本発明は、以下のステップからなる非標的複合試料分析としての複数のFT−ICR−MSを視覚化する方法を提供するものである。独立する各分析について中性又は電荷形態のいずれかで、質量及び強度データ、及び/又は分子式データ、及び/又は他の同定用データ(イオン化モード、化学分類、抽出モード、ファイル名、実験条件等)からなる代謝データファイルを作製し;かかるデータファイルから多数のファイルを選択して1つのファイルに統合し;この統合したファイルのデータを質量又は分子式に基づいて分類し、選択したファイル群における全ての固有代謝産物を一括バッチ処理し;代謝バッチのそれぞれについて統計計算を行い(平均値及び標準偏差値、並びに選択したファイル総数中で代謝産物が観察されたファイル数を含むが、それらに限定はされない);このデータを次の3方法のいずれかにより表示する;すなわち、固有質量又は分子式をy軸にとり、ファイル名をx軸にとり、観察強度か、選択したファイルで観察された代謝産物の平均強度の割合又はパーセントとして表す観察強度、或いは選択したファイル中1つのファイルにおける観察強度をパーセント又は割合として表す観察強度のいずれかを各ファイルに入力(fill in)する;代謝産物が、あるファイルでは観察されずに別のファイルで観察される状況下で、ゼロ値、或いはノイズレベル又は検出リミット又はこれら以外の識別子に相当する値を表示する;前述のxy座標によって示されるセルの各々における強度若しくは割合にカラーコードを付与する、のいずれかにより表示する。
【0013】
本発明はまた、上記に定義する本発明方法により作製されるデータ構造にも関する。さらに、かかるデータ構造には、情報が、データ構造へと伝達され或いはデータ構造から伝達されるように、コンピュータ可読媒体、ハードウエア、ソフトウエア、又はそれらを組み合わせたものが含まれていてもよい。
【0014】
本要約は、必ずしも本発明が必要とする特徴を全て説明しているわけではなく、本発明は、説明されている特長の下位の組合せ(sub-combination)を包含していてもよい。
[態様の詳細]
本発明は、分析装置を用いて得たデータを表示する方法に関する。より具体的に本発明は、質量分析装置を用いて得たデータ、及びかかるデータを有するデータ構造を表示する方法に関する。
【0015】
以下は、本発明を実施するのに必要な特徴を組み合わせたものに限定されずに、
実施例にのみ基づいて好適実施態様を説明するものである。
【0016】
本発明の一実施態様は、以下のステップからなる分光データを分析する方法を提供するものである。
i)データエレメント値X及びデータエレメント値Yを有するデータの少なくとも1若しくは2以上の順序対(X、Y)によって特徴付けられる成分を1若しくは2以上含む試料の複数から質量分光データを得(このときXは、成分の質量と同等又は正比例するデータエレメント値であり、Yは、成分の容量と同等又は正比例するデータエレメント値である)、
ii)前記試料においてデータエレメント値Xが共通である全ての固有成分を同定し、かかる全X値の平均値をそこから計算し、平均値を求め、さらに、Xが共通である全ての順序データ対における全Y値の標準偏差値を求め、
iii)コード可能なセルアレイを有するデータ構造を作製し、前記各試料に存在する各固有成分の容量との関係に基づき、所定の値又は前記分光データのその他の特徴について色又は他の識別可能な特徴付けを各セルに行う。
【0017】
「分光データ」なる用語は、例えば(ただし限定はされない)、可視分光分析装置、IR分光分析装置、UV分光分析装置、質量分析装置、NMR装置等の分光分析装置を用いて得たデータを意味する。かかる分光データは、質量分析装置を用いて得るデータであることが好ましい。
【0018】
本発明方法には、あらゆる質量分析装置が用いられる。また、質量分析装置は、クロマトグラフィーシステム(ただしこれに限定されない)等の他の分析装置と併用してもよい。質量分析装置が、フーリエ変換イオンサイクロトロン質量分析装置であることが好ましい。フーリエ変換イオンサイクロトロン質量分析装置に関する説明は、カナダ特許第2298181号及びPCT/CA01/00111に記載されており、いずれも参考文献として本明細書に示してある。
【0019】
「試料」なる用語は、データが必要とされる全ての組成物を意味する。例えば、試料には、あらゆる生物試料、又はそのフラクションや抽出物が含まれる。かかる生物試料は、無処理でもよく、当技術分野で公知の1若しくは2以上の方法で処理してもよい。かかる方法の例としては、抽出法、精製法、化学反応法、又はそれらを組み合わせた方法が挙げられるが、これらの方法に限定されることはない。この点に関し、試料は、当技術分野で公知の方法のいずれで処理してもよい。生物試料には、試料に添加した他の成分も含まれていてよい。生物試料には例えば、質量分析試料に一般的に添加され、当業者には公知であると考えられる成分が含まれるが、これらに限定されることはない。実施態様の一つにおいて試料は、質量分析装置によって溶解又は分離される成分を複数有する複合試料である。
【0020】
「データの順序対(X,Y)」なる用語は、試料中の成分を特徴付けるデータを意味する。例えば、Xには成分の質量を表す数値、Yには成分の容量を表す数値が含まれていてもよい。さらにXには、特定の成分の特徴である値や他の識別子が含まれていてもよい。例えば(ただし限定はされない)、Xには、カラムにおける保持時間、質量分析検出器における特異的シグナルの位置等が含まれていてもよい。さらにXには、特定成分の質量、化学式又は構造式が含まれていてもよいが、それらに限定はされない。さらに、高次順序データセットには、強度、分子式データ、イオン化モード、化学分類、抽出モード、ファイル名、実験条件等、又はそれらを組み合わせたものなど、他のデータが含まれていてもよいが、それらに限定されることはなく、このようなデータセットは本発明において全て包含される。
【0021】
「固有成分(unique components)」なる用語は、分析した全試料中の少なくとも1つの試料に存在する全ての特定成分の集合体を意味する。
【0022】
「データ構造」なる用語は、複数試料に由来する情報の順序グループ化を意味する。データ構造には、データベース、或いは、試料に由来する若しくは試料を処理して得た情報を有する複数のセルを含むアレイが含まれていてもよい。また、データ構造には、セルが有する値に基づいて1若しくは2以上のセルにカラーコードが付与された複数セルが含まれていてもよい。しかしカラーコード以外にも、セルが有する値に基づく別の特性若しくは特徴による識別子をセルに付与してもよい。別の特性又は色特徴によるコードとは、色、パターン、陰影、又はそれらの組合せを意味し、セルが有する値に基づくセル間の識別に利用してもよい。
【0023】
「所定の値又は分光データのその他の特徴」なる用語は、観察された成分強度、又は1若しくは2以上の成分強度の平均強度若しくは標準偏差値、又は1若しくは2以上の試料中の1若しくは2以上の他の成分の平均強度に対する1若しくは2以上の成分で観察された強度の割合又はパーセントなどを意味するが、それらに限定はされない。本発明ではさらに他の値や特徴も包含される。
【0024】
上述の色又は他の識別可能な特徴は、値の範囲を任意に定義するものである。例えば、赤い色はA及びBの間の値を示すのに用いられ、青い色はCとDの間の色値(明度;color value)を示すものとして用いられるが、勿論それらに限定されるものではない。他の組合せもまた可能である。
【0025】
一実施態様では、フーリエ変換イオンサイクロトロン共鳴質量分析(FT−ICR−MS)により得た複合多成分生物試料のデータを表示する方法を提供する。この方法の説明は、図1〜6を参照しながら行う。しかし図面を参照するのは単に説明を行うためだけであり、本発明を何ら限定するものではない。
【0026】
図1には、質量分析装置を用いて得られるデータが示されている。図1に示すデータは、適宜に#170と表示する単一の試料(“n”=1)をFT−ICR−MSに供して得たものである。試料#170には10種類の成分が含まれる。各成分は、少なくとも1対のデータ順序対(X,Y)、すなわちその中性質量(nMass(X))及びその強度(強度(Y))の値により特徴付けしてもよい。図1にはまた、エレメントの数(NE)、分子式、及び分子式に伴う誤差(Err)が示されているので、所望する場合、例えば(ただし限定はされない)、(中性質量(X),強度(Y)、エレメント数(A)、分子式#1(B)、誤差(C))に対応して順序データを(X,Y,A,B,C)(これに限定されない)へと拡大してもよい。分子式の決定又はそれに伴う誤差の判定は、試料中成分の質量に基づき、当業者には容易になし得ることである。分子式は、当分野で公知の無数のアルゴリズムによって決定でき、本発明方法では、これらあらゆるアルゴリズムを単独で、又は組み合わせて用いることができる。
【0027】
当業者には明白であるように、FT−ICR−MSによって分析されるそれぞれの試料から、図1に示されるデータと同様な方法で体系化されるデータが作製される。また、やはり当業者には明白であるが、各試料には、例えば(ただし限定されない)、中性質量から同一と判定される1若しくは2以上の同一成分が含まれていてもよい。また、これらの成分は、等量ずつ、又は異なる量で存在していてもよい。さらに各試料には異なる成分が含まれていてもよい。
【0028】
次に図2には、適宜に試料#170、#171、#172及び#173と表示する、異なる4試料から得た質量分光データが示されている。各試料には、質量数及びそれに対応する強度で示される複数成分が含まれる。図にあるように、試料#170には10種の成分が含まれ、試料#171には16種の成分が含まれ、試料#172には10種の成分が含まれ、試料#173には22種の成分が含まれる。また図2からは、試料#170中で、質量が300.057819、強度7.19×10である第1番目の成分は、他の試料中に見い出せない固有成分であることが明らかである。他方、質量が300.205935で強度が6.84×10である試料#170の第2番目の成分は、試料#171、#172、及び#173にも存在しており、それぞれ、300.20593、300.205883、及び300.205886を質量とする成分である。当業者には明らかなように、2つの同一成分を別々の分析で質量分析装置にかけて判明する質量は、上述したように僅かに異なるものとなる。しかし、成分が同じであるか否かを調べる方法は当分野では種々公知であり、それらの方法は全て本発明に包含される。
【0029】
さらに図2に示すように、複数の試料から得た分光データを組み合わせて単一のデータ構造としてもよく、また任意に分類及び処理をして、全試料のそれぞれに存在する全固有質量を測定してもよい。測定する情報としてはこの他に、平均値、標準偏差値、並びに各質量がいくつかの試料に現われる回数が含まれるが、これらに限定されない。図3に示すように、かかる情報をデータ構造又はアレイとして表にすることが好ましい。
【0030】
図3は、分析した全試料に存在する固有成分のそれぞれについて得た平均質量の結果を表にしたデータ構造を示す図である。例えば(ただし限定はされない)、300.057819という平均質量は、試料#170における第1番目の成分の質量であり(図1及び2を参照)、7.188800×10が平均強度である。この成分は、他のいずれの試料にも存在しないため、その質量の標準偏差値及び強度の標準偏差値は、0である。他方、平均質量300.205909は、試料#170、#171、#172、#173で同定された4種の成分の平均質量であり、それら4成分の質量は、それぞれ、300.205935、300.20593、300.205883、300.205886であり、強度は、6.84×10、3.56×10、1.43×10、3.77×10である(図2を参照)。図3には、各試料中における全成分の平均質量、その平均質量の標準偏差値、質量が同じである全ての成分の平均強度、その平均強度の標準偏差値、ある固有質量を有する試料数、それぞれの試料番号(#)における各質量の強度が示されている。ある成分が特定の試料番号(#)において検出されない場合、値は入力されない。例えば、平均強度が、7.188800×10であり、平均質量が、300.057819である成分は、試料#170においてのみ検出されることから、特定試料の強度を表す残りのセルは空白となっている。図4に示すように、特定試料の欄に記載されている各強度値には、カラーコード、又は強度値の程度に基づく他の識別可能な特徴が付与されていてもよい。
【0031】
次いで図4には、特定の試料番号について記載した、特定強度値のそれぞれに、その強度値の程度に基づいて特異的カラーコードが付与されたデータ構造が示されている。例えば(ただし何ら限定はされない)、強度が存在しない、又は強度値が0〜1×10未満の場合は、第1の色を付与し、2×10〜2×10以下の強度には第2の色を付与し、以下同様に処理する。かかる範囲は必要に応じて調整でき、所望するあらゆる色で示すことができる。
【0032】
また、本発明に包含されるものとして、データ構造におけるデータをさらに処理してもよく、別の方法で表示してもよい。例えば(ただし限定はされない)、図5に示すように、各試料番号における強度値を、この各試料における成分の平均強度と比較してもよい。或いは(ただし限定はされない)データを処理して、例えば図6に示す試料#170(ただし限定されない)のように、特定試料中成分の全強度を比較してもよい。
【0033】
本発明の別の実施態様では、質量及び強度値を有する複数のFT−ICR−MS代謝分析データファイルを視覚化する方法を提供する。かかる方法は以下のステップからなる。
i)視覚化するファイルを選択し、
ii)選択した全ファイルを統合し、全代謝産物をその質量に応じて分類し、選択した全ファイルに存在する固有質量を全て同定する。各固有質量の平均値及び標準偏差値、並びに観察された強度の平均値及び標準偏差値、並びに前記固有質量が見い出されたファイル数を求める。
iii)固有質量リストを縦軸にとり、選択したファイル数を横軸にとる2次元(2D)アレイを有するデータ構造を作製する。ユーザー定義のカラーコードに従い、縦軸・横軸座標で決まるセルに代謝産物存在量を表示する。ユーザーは、a)観察された代謝産物強度、b)選択したファイルにおける代謝産物の平均強度に対する観察された強度の割合又はパーセント、c)選択したファイルの1つにおいて観察された強度に対する観察された強度の割合又はパーセント、或いはこれらの組合せ等、多くの方法によってデータを見る選択肢を有するが、これらの方法に限定されることはない。従って本方法は、複数の代謝データファイルの迅速かつ簡約化された表示又は視覚化を可能とするものである。結果的に、複合混合物における代謝変化の測定及び同定が大幅に簡素化される。
【0034】
本発明はさらに、上述のデータ構造をすべて包含するものである。また、本発明は、コンピュータ可読媒体上のデータ構造を全て包含するものであり、かかるコンピュータ可読媒体には、当業者には自明のコンパクトディスク、フレキシブルディスク、ハードドライブ等が例示されるが、これらに限定はされない。
【0035】
さらに本発明に包含されるものとして、本発明のデータ構造が、1若しくは2以上の別のデータベースからデータを得ること、若しくはかかるデータベースにデータを伝達することを可能とするのに必要なハードウエア、ソフトウエア、若しくはそれらの組合せと併用した本発明のデータ構造がある。かかるデータベースとしては、天然産物データベース、代謝経路データベース、生物情報プログラム、又はそれらを組み合わせたものが例示されるが、これらに限定はされない。また、ファイル名、観察された質量、観察された強度、並びに内部標準データ、分子式及び質量誤差等(これらに限定されない)の品質保証コントロールデータを含む代謝産物に関する全ての実験情報を有する1若しくは2以上のデータベースにデータ構造のセルをリンクさせてもよい。
【0036】
別の実施態様において本発明は、上記のとおりに定義され、データの順序対が高次順序データセット(A..A,X,Y,B..B)に由来する方法を提供する。
【0037】
本発明はまた、上記のとおりに定義され、データの所定の値や他の特徴が、
a)観察された代謝産物の強度、
b)選択したファイルにおける前記代謝産物の平均強度に対する観察された強度の割合又はパーセント、
c)選択したファイルの1つ以上において観察された強度に対する観察された強度の割合又はパーセント
又はそれらの組合せからなるグループから選択される方法を提供する。しかしながら当業者には明らかなように、上記以外のデータセットの特徴も全て本方法に用いることができる。
【0038】
本発明はまた、コンピュータ処理ユニットを有する分光データの分析システムも包含しており、かかる処理ユニットは以下の能力をもつ。
a)データエレメントX及びデータエレメントYを有する少なくとも1つのデータ順序対(X,Y)によって特徴付けられる1若しくは2以上の成分を有する1若しくは2以上の試料から得られる分光データを受け取り(ただしXは、Xの名称若しくは識別子、又は成分Xの質量と同等又は正比例する値であり、Yは、成分の容量と同等又は正比例するデータエレメント値を示す)、
b)前記試料においてデータエレメントXが共通である全ての固有成分を同定することにより、前記データを処理し、それら全てのXの平均値を任意で計算し、またデータエレメントXが共通である順序データ対における全てのY値の平均値と、任意で標準偏差値を決定し、また、
iii)コード可能なセルを複数有するアレイを含むデータ構造を作製する(各セルは試料中の固有成分を示し、データの特徴、付帯値、又はユーザーによる設定値との関係に基づき、色、又は別の識別可能な特徴付けを付与される)。
【0039】
上記システムにはさらに、データ構造を表示するモニター、分光データを作製する分光分析装置、又はその両方が含まれる。さらに、当業者には明らかであるが、データの特徴との関係は全て利用してよく、その関係としては、
a)1若しくは2以上の順序データセットにおける全てのY値の平均値又は中間値、
b)固有データエレメントXを伴う全てのY値の平均値又は中間値、
c)プログラム、データベース等から得た付帯値、或いは、
d)ユーザーが入力する値
が例示されるが、これらに限定はされない。
【0040】
従って本発明方法は、生物試料及び抽出物等(これらに限定されない)の複合試料の大量のデータを分析、表示、視覚化及び処理する手段を提供する。また本方法は、試料間の差異を決定するため、非標的及び不偏な方法で情報を分析する手段を提供する。
【0041】
上記の記載は、いかなる場合もクレーム記載の本発明を制限するものではない。また、発明を実施するにあたり、上述したように種々の特長を組み合わせることは、絶対に必要なことではないかもしれない。
【0042】
以下の実施例において本発明をさらに説明する。しかし、これらの実施例は、単に説明を目的とするものであり、いかなる場合も本発明の範囲を制限するものではない。
[実施例]
【実施例1】
【0043】
複数の非標的試料の分析
先ず、既に出願されている特許出願(第2298181号、カナダ、PCT/CA01/00111)に記載のとおりにして、複合試料から処理したデータファイルを分析した。この分析結果は、図1記載のフォーマットとした。次に、複数ファイルから得たデータを図2に示すように統合した。この段階で、ファイル名、イオン化/抽出コード、並びに質量及び強度値だけが残るようにデータを縮小する。次に、統合したファイルを処理して、全ての固有質量を決定する。次いで固有質量毎に平均値、標準偏差値、及び数値を決定する。このリストはy軸を表す。分析に供するために最初に選択したファイル毎にカラムを作製する。このリストはx軸を表す。次に、選択したファイルのそれぞれにおいて見い出された質量毎の強度を、図3に示すように、対応するxy座標に記入していく。強度を有しない座標は空白にしておく。アレイに記入後は、データをさらに処理し、カラーコードを用いて視覚化することが可能になる。かかる可能性として次の3つが示される。図4に示すように、ユーザーは追加処理を行うことなく、カラーコードを用いて強度値によりデータを視覚化できる。また、ユーザーは図5に示すように、強度を、選択した全試料における、その代謝産物の平均強度と比較することによりデータ(図4と関連する)をさらに処理してもよい。ユーザーは図6に示すように、全ての強度を特定のファイル(この場合はファイル170)と比較する処理をさらにデータ(図4と関連する)に行ってもよい。従ってユーザーは、多数のファイルを同時に表示し、解釈することができる。重要なことは、この方法には自己作製アレイが含まれることであるが、この自己作製アレイに限定されることはない。最終的なx軸、y軸はアレイの作製前に決定しなくてもよく、アレイの作製中に作製してもよい。
【0044】
上記明細書中で述べた参考文献は全てここに参考文献として組み込んである。
【0045】
ここまで好適実施態様を参照して本発明を説明してきたが、本明細書に記載した発明の範囲から逸脱することなく多様な変更及び修正を加えることは、当業者には自明である。
【図面の簡単な説明】
【0046】
本発明における前記の特徴或いは他の特徴は、添付図面を参照して行う以下の説明により、さらに明らかになるであろう。以下は図面の説明である。
【図1】図1は、FT−ICR−MSによる生物試料の分析を1回行ったときの代謝データファイルを示す図である。
【図2】図2は、FT−ICR−MSによる生物試料分析を複数回行って得た複合代謝データファイルを示す図である。
【図3】図3は、全ての固有質量を同定し、各固有質量の平均値及び標準偏差値並びに強度を求め、特定の固有質量を有するファイル数を表示するFT−ICR−MSによる生物試料分析を複数回行って作製した複合代謝データファイルを示す図である。
【図4】図4は、選択した全データファイルで観察された固有質量の総合計をy軸にとり、選択したデータファイルのファイル数をx軸にとる複合データファイルアレイからなるデータ構造を示す図である。対応代謝産物の強度を、かかるxy軸で決まる各セルにカラーコードで表示する。
【図5】図5は、選択した全データファイルで観察された固有質量の総合計をy軸にとり、選択したデータファイルのファイル数をx軸にとる複合データファイルアレイからなるデータ構造を示す図である。平均代謝強度に対する代謝強度の割合を、かかるxy軸で決まる各セルにカラーコードで表示する。
【図6】図6は、選択した全データファイルで観察された固有質量の総合計をy軸にとり、選択したデータファイルのファイル数をx軸にとる複合データファイルアレイからなるデータ構造を示す図である。選択したデータファイルの1つで観察された代謝強度に対する対応代謝強度の割合を、かかるxy軸で決まる各セルにカラーコードで表示する。

【特許請求の範囲】
【請求項1】
i)データエレメント値X及びデータエレメント値Yを有するデータの順序対(X、Y)によって特徴付けられる成分を1若しくは2以上含む試料の複数から質量分光データを得(このときXは、成分の質量と同等又は正比例するデータエレメント値であり、Yは、成分の容量と同等又は正比例するデータエレメント値である)、
ii)前記試料においてデータエレメント値Xが共通である全ての固有成分を同定し、かかる全X値の平均値をそこから計算し、さらに、Xが共通である順序データ対における全Y値の平均値及び任意で標準偏差値を求め、
iii)コード可能なセルを複数有するデータ構造を作製し、前記各試料に存在する各固有成分の容量との関係に基づき、所定の値又は前記分光データのその他の特徴について色又は他の識別可能な特徴付けを各セルに行う
ステップからなるデータ分析法。
【請求項2】
i)分析に供するファイルを2若しくは3以上選択し、
ii)選択した全ファイルを統合し、全代謝産物をその質量に応じて分類し、選択した全ファイルに存在する固有質量を全て同定する。各固有質量の平均値及び標準偏差値、並びに観察された強度の平均値及び標準偏差値、並びに前記固有質量が見い出されたファイル数を決定し、
iii)固有質量リストを縦軸にとり、選択したファイル数を横軸にとる2次元(2D)アレイを有するデータ構造を作製し、また、
ユーザー定義のカラーコードに従い、縦軸・横軸座標で決まるセルに代謝産物存在量を表示する(ただしユーザーは、a)観察された代謝産物強度、b)選択したファイルにおける前記代謝産物の平均強度に対する観察された強度の割合又はパーセント、c)選択したファイルの1つにおいて観察された強度に対する観察された強度の割合又はパーセント、或いはそれらの組合せからなるグループから選択される多数の方法によってデータを見るオプションを有する)
ことからなる、質量及び強度の値を有する複数のFT−ICR−MS代謝分析データファイルを視覚化する方法。
【請求項3】
請求項1又は2のいずれか記載の方法により作製されるデータ構造。
【請求項4】
請求項3記載のデータ構造を有するコンピュータ可読媒体。
【請求項5】
情報をデータ構造に伝達し、又はデータ構造から伝達させるように、ソフトウエア、ハードウエア、又はそれらの組合せと、組み合わせることを特徴とする請求項4記載のデータ構造。
【請求項6】
情報が、天然産物データベース、代謝経路データベース、生物情報プログラム、又はそれらの組合せからなるグループから選択されるデータベースに伝達されるか、該データベースから伝達されることを特徴とする請求項5記載のデータ構造。
【請求項7】
代謝産物に関する情報を有するポップアップウインドウにリンクされているセルを複数有することを特徴とする請求項3記載のデータ構造。
【請求項8】
情報が、ファイル名、観察された質量、観察された強度、品質保証データ、品質コントロールデータ、内部標準データ、分子式、質量誤差、又はそれらの組合せを含むことを特徴とする請求項7記載のデータ構造。
【請求項9】
分光データが、質量分析装置を用いて作製されることを特徴とする請求項1記載の方法。
【請求項10】
質量分析装置が、フーリエ変換イオンサイクロトロン質量分析装置であることを特徴とする請求項9記載の方法。
【請求項11】
試料が、生物試料であることを特徴とする請求項1記載の方法。
【請求項12】
データの順序対が、高次順序データセット(A..A,X,Y,B..B)に由来することを特徴とする請求項1記載の方法。
【請求項13】
データの所定の値又は他の特徴が、
a)観察された代謝産物の強度、
b)選択したファイルにおける前記代謝産物の平均強度に対する観察された強度の割合又はパーセント、
c)選択したファイルの1つにおいて観察された強度に対する観察された強度の割合又はパーセント、
或いはそれらの組合せ
からなるグループから選択されることを特徴とする請求項1記載の方法。
【請求項14】
コンピュータ処理ユニットを有する分光データの分析システムにおいて、該処理ユニットが、
a)データエレメントX及びデータエレメントYを有する少なくとも1つのデータ順序対(X,Y)によって特徴付けられる1若しくは2以上の成分を有する1若しくは2以上の試料から得られる分光データを受け取り(ただしXは、Xの名称若しくは識別子、又は成分Xの質量と同等又は正比例する値であり、Yは、成分の容量と同等又は正比例するデータエレメント値を示す)、
b)前記試料においてデータエレメントXが共通である全ての固有成分を同定することにより、前記データを処理し、それら全てのXの平均値を任意で計算し、またデータエレメントXが共通である順序データ対における全てのY値の平均値及び任意で標準偏差値を決定し、また、
iii)コード可能なセルを複数有するアレイを含むデータ構造を作製する(各セルは試料中の固有成分を示し、データの特徴、付帯値、又はユーザーによる設定値との関係に基づき、色、又は別の識別可能な特徴付けを付与される)
能力を有することを特徴とするシステム。
【請求項15】
データ構造を表示するモニター、分光データを記録する分光分析装置、又はその両方をさらに有することを特徴とする請求項14記載のシステム。
【請求項16】
分光分析装置が、質量分析装置であることを特徴とする請求項15記載のシステム。
【請求項17】
データの特徴との関係が、
a)1若しくは2以上の順序データセットにおける全てのY値の平均値又は中間値、
b)固有データエレメントXを伴う全てのY値の平均値又は中間値、
c)プログラム、データベース等から得た付帯値、或いは、
d)ユーザーによるバリューインプット
であることを特徴とする請求項14記載のシステム。
【請求項18】
色、又は別の識別可能な特徴が、値の範囲を定めることを特徴とする請求項14記載のシステム。

【特許請求の範囲】
【請求項1】
a)検出される成分を1若しくは2以上含む複数の試料から質量分光データを得、
b)検出される各成分を、Xは、成分の質量、若しくは数学関数によって修正された前記質量と同等又は正比例するデータエレメント値であり、Yは、成分の容量、若しくは数学関数によって修正された前記容量と同等又は正比例するデータエレメント値である一次順序対(X、Y)で標識し、
c)検出される各成分を、1若しくは2以上の他の同定データの二次データエレメントで標識し、
d)前記試料においてデータエレメント値Xが共通である全ての固有成分を同定し、
e)データエレメント値Xが共通である固有成分の数により一方の軸が定義され、1つの二次データエレメント又は2若しくは3以上の二次データエレメントの組み合わせにより他方の軸が定義され、座標X、Yで定義されるセルが、固有成分Xに特異的に関連する情報を、Yで定義されるパラメータ内部に含有している、コード可能なセルを複数有する二次元一次データ構造を作製する
ステップからなる、複数の試料からの質量分光データを分析する方法。
【請求項2】
試料が、生物試料であることを特徴とする請求項1記載の方法。
【請求項3】
質量分光データが、フーリエ変換イオンサイクロトロン共鳴質量分析装置(FTMS)に由来することを特徴とする請求項1記載の方法。
【請求項4】
データエレメントXが、+/−0.01ダルトン未満の精度で測定された成分の質量であることを特徴とする請求項1記載の方法。
【請求項5】
データエレメントXが、+/−0.001ダルトン未満の精度で測定された成分の質量であることを特徴とする請求項1記載の方法。
【請求項6】
データエレメントXが、+/−0.0001ダルトン未満の精度で測定された成分の質量であることを特徴とする請求項1記載の方法。
【請求項7】
二次データエレメントが、試料のファイル名、試料の抽出条件、試料が得られる実験条件、質量分析装置のイオン化モード、カラムにおける成分の保持時間、成分の分子式、成分の質量、及び試料に関する品質保証/品質管理情報からなるグループから選択されることを特徴とする請求項1記載の方法。
【請求項8】
データエレメントXが、成分の質量と、試料の抽出条件、質量分析装置のイオン化モード、及びカラムにおける成分の保持時間からなるグループから選択される1若しくは2以上の二次データエレメントとの組み合わせであることを特徴とする請求項1記載の方法。
【請求項9】
データエレメントXが共通である成分が、質量の相対差が100ppm未満の成分であると定義されることを特徴とする請求項8記載の方法。
【請求項10】
データエレメントXが共通である成分が、質量の相対差が10ppm未満の成分であると定義されることを特徴とする請求項8記載の方法。
【請求項11】
データエレメントXが共通である成分が、質量の相対差が2ppm未満の成分であると定義されることを特徴とする請求項8記載の方法。
【請求項12】
データエレメントXが共通である成分が、共通する保持時間の相対差が5%未満の成分であると定義されることを特徴とする請求項8記載の方法。
【請求項13】
データエレメントXが共通である成分が、共通する保持時間の相対差が2%未満の成分であると定義されることを特徴とする請求項8記載の方法。
【請求項14】
データエレメントXが共通である成分が、共通する保持時間の相対差が1%未満の成分であると定義されることを特徴とする請求項8記載の方法。
【請求項15】
データ構造が、試料間の比較を行う際に、エレメントY軸に沿った拡大が可能なように構成されていることを特徴とする請求項1記載の方法。
【請求項16】
データ構造が、昇順又は降順で、Yにより定義されるデータの分類、提示及び報告が可能なように構成されていることを特徴とする請求項1記載の方法。
【請求項17】
データ構造が、成分の質量に応じたデータの分類、提示及び報告が可能なように構成されていることを特徴とする請求項1記載の方法。
【請求項18】
データ構造が、クロマトグラフの成分の保持時間に応じたデータの分類、提示及び報告が可能なように構成されていることを特徴とする請求項1記載の方法。
【請求項19】
データ構造が、一次及び二次データエレメントのあらゆる組み合わせに応じたデータの分類、提示及び報告が可能なように構成されており、前記二次エレメントが、試料のファイル名、試料の抽出条件、試料が得られる実験条件、質量分析装置のイオン化モード、カラムにおける成分の保持時間、成分の分子式、成分の質量、及び試料に関する品質保証/品質管理情報からなるグループから選択されることを特徴とする請求項1記載の方法。
【請求項20】
請求項1記載の方法により作製されるデータ構造。
【請求項21】
請求項20記載のデータ構造を有するコンピュータ可読媒体。
【請求項22】
情報をデータ構造に伝達し、又はデータ構造から伝達させるように、ソフトウエア、ハードウエア、又はそれらの組合せと、組み合わせることを特徴とする請求項21記載のデータ構造。
【請求項23】
情報が、天然産物データベース及び代謝経路データベースからなるグループから選択される別のデータベースに伝達されるか、該データベースから伝達されることを特徴とする請求項22記載のデータ構造。
【請求項24】
情報が、ソフトウェアプログラムに伝達されるか、該ソフトウェアプログラムから伝達されることを特徴とする請求項22記載のデータ構造。
【請求項25】
ソフトウェアプログラムが、バイオインフォマティクスプログラムであることを特徴とする請求項24記載のデータ構造。
【請求項26】
固有成分Xに関する情報を有するポップアップウインドウにリンクされているセルを複数有することを特徴とする請求項20記載のデータ構造。
【請求項27】
データの本質的特徴、又はユーザーによる設定値との関係に基づき、色、又は別の識別可能な特徴付けを付与されているセルを複数有することを特徴とする請求項20記載のデータ構造。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2006−504071(P2006−504071A)
【公表日】平成18年2月2日(2006.2.2)
【国際特許分類】
【出願番号】特願2003−579151(P2003−579151)
【出願日】平成15年3月20日(2003.3.20)
【国際出願番号】PCT/CA2003/000389
【国際公開番号】WO2003/081506
【国際公開日】平成15年10月2日(2003.10.2)
【出願人】(504353730)フェノメノーム ディスカバリーズ インク (16)