説明

生物学的系をプロファイリングするための方法およびシステム

【課題】本発明は、複数の生物学的サンプルの、単一の生体分子成分型の、生体分子成分間の類似性、差異および/または相関の識別に基づく、生物学的系のプロフィールを作成するための、方法およびシステムを提供することを課題とする。
【解決手段】本発明の方法は、1つ以上の相関レベルで分光測定データの階層型多変数解析を利用する工程を包含する。本発明は、類似性、差異、および/または相関の識別を、サンプルまたは生物学的系における単一の生体分子成分間のみでなく、単一の生体分子成分の型の生体分子成分のパターン間でも容易にする技術プラットフォームをさらに提供する。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の引用)
本願は、2001年8月13日に出願された、同時係属中の米国仮出願番号60/31
2,145(この全開示は、本明細書中に参考として援用される)に対する利益および優
先権を主張する。
【0002】
(発明の分野)
本発明は、データの処理および評価の分野に関する。具体的には、本発明は、生物学的
サンプルの複数の成分を分離および測定するための分析技術プラットフォーム、ならびに
成分を同定するためおよび種々の測定された成分間のパターンおよび関係を明らかにする
ための、統計学的データ処理方法に関する。
【背景技術】
【0003】
(背景)
複雑な混合物の特徴付けは、種々の研究および応用の分野において重要になっており、
この分野としては、製薬、生物工学研究、ならびに栄養および薬効(nutraceut
ical)(機能性食品)の論題が挙げられる。1つの重要な領域は、製薬および生物工
学研究(しばしばメタボロミクス(metabolomics)と称される)における低
分子の研究である。
【0004】
例えば、複雑な(多因子性)疾患のための新たな薬物の開発における重要な挑戦は、バ
イオマーカー/代理マーカーの追跡および確証である。さらに、単一のバイオマーカーで
はなく、バイオマーカーのパターンが、このような疾患についてのホメオスタシスまたは
疾患状態の特徴付けおよび診断のために必要であり得ることが、明らかである。
【0005】
メタボロミクスの分野において、生物学的サンプルのプロファイリングの分野における
現在の技術は、制限された数の低分子化合物に焦点を当てた、核磁気共鳴(「NMR」)
または質量分析(「MS」)のいずれかによる測定に基づく。これらのプロファイリング
アプローチの両方が、限界を有する。NMRアプローチは、高濃度で存在する化合物につ
いてのみ信頼性のあるプロファイルを代表的に提供する点で、制限される。他方で、集中
した質量分析に基づくアプローチは、高い濃度を必要とはしないが、メタボロームの制限
された部分のみのプロファイルを提供し得る。現在のプロファイリング技術における限界
に取り組み得、そして成分間または成分のパターン(例えば、バイオマーカーパターン)
間の相関の識別を容易にするアプローチが、必要とされる。
【発明の概要】
【課題を解決するための手段】
【0006】
(発明の要旨)
本発明は、1つ以上のレベルで分光学的データの階層型多変数解析を利用する方法およ
びシステム(または包括的に「技術プラットフォーム」)を提供することによって、現在
のプロファイリング技術における限界に取り組む。本発明は、類似性、差異、および/ま
たは相関の識別を、サンプルまたは生物学的系における単一の生体分子成分間のみでなく
、単一の生体分子成分の型の生体分子成分のパターン間でも容易にする技術プラットフォ
ームをさらに提供する。したがって、本発明は、以下を提供する。
(1)生物学的系をプロファイリングする方法であって、該方法は、以下の工程:
(a)生物学的系のサンプルの分光測定値を含む1つ以上の生物学的サンプル型につい
ての複数のデータセットを提供する工程;
(b)多変数解析を用いて該複数のデータセットを評価して、該複数のデータセット間
の差異の1つ以上のセットを決定する工程;
(c)該差異の1つ以上のセットのうち1つと該複数のデータセットの一部との間の相
関を決定する工程;および
(d)該相関に基づいて該生物学的系の状態についてのプロファイルを作成する工程、
を包含する、方法。
(2)項目1に記載の方法であって、前記工程(c)が、前記差異の1つ以上のセットのうち
1つと前記複数のデータセットの少なくとも一部との間の相関を決定するために、多変数
解析を使用することを包含する、方法。
(3)項目2に記載の方法であって、前記差異の1つ以上のセットのうち1つと前記複数のデ
ータセットの少なくとも一部との間の相関を決定するための前記多変数解析が、前記工程
(b)の多変数解析の階層型カスケードを含む、方法。
(4)項目2に記載の方法であって、前記工程(b)の多変数解析および前記差異の1つ以上
のセットのうち1つと前記複数のデータセットの少なくとも一部との間の相関を決定する
ための前記多変数解析が、異なる多変数解析である、方法。
(5)項目2に記載の方法であって、前記差異の1つ以上のセットのうち1つと前記複数のデ
ータセットの少なくとも一部との間の相関を決定するための前記多変数解析が、主成分分
析、判別分析、判別分析を用いる主成分分析、標準相関、カーネル主成分分析、非線形主
成分分析、因子分析、多次元スケーリングおよびクラスター分析のうち少なくとも1つを
含む、方法。
(6)項目1に記載の方法であって、前記工程(b)の多変数解析が、2つ以上の多変数解析
の階層型カスケードを含む、方法。
(7)項目1に記載の方法であって、前記工程(b)の多変数解析が、主成分分析、判別分析
、判別分析を用いる主成分分析、標準相関、カーネル主成分分析、非線形主成分分析、因
子分析、多次元スケーリングおよびクラスター分析のうち少なくとも1つを含む、方法。
(8)項目1に記載の方法であって、前記データセットが、単一の分光測定技術からの測定値
を含む、方法。
(9)項目1に記載の方法であって、前記データセットが、2つ以上の分光測定技術からの測
定値を含む、方法。
(10)項目1に記載の方法であって、前記分光測定技術が、液体クロマトグラフィー、ガスク
ロマトグラフィー、高速液体クロマトグラフィー、キャピラリー電気泳動、質量分析、液
体クロマトグラフィー−質量分析、ガスクロマトグラフィー−質量分析、高速液体クロマ
トグラフィー−質量分析、キャピラリー電気泳動−質量分析、および核磁気共鳴分光法の
うち少なくとも1つを含む、方法。
(11)項目1に記載の方法であって、前記1つ以上の生物学的サンプル型が、血液、血漿、血
清、脳脊髄液、胆汁酸、唾液、滑液、胸膜液、心膜液、腹膜液、糞、鼻汁、眼液(ocu
lar fluid)、細胞内液、細胞間液、リンパ液および尿のうち少なくとも1つを
含む、方法。
(12)項目1に記載の方法であって、前記1つ以上の生物学的サンプル型が、肝臓細胞、上皮
細胞、内皮細胞、腎臓細胞、前立腺細胞、血液細胞、肺細胞、脳細胞、皮膚細胞、脂肪細
胞、腫瘍細胞および乳腺細胞のうち少なくとも1つを含む、方法。
(13)項目1に記載の方法であって、前記1つ以上の生物学的サンプル型が、同じ生物から異
なる時点で採取したサンプルを含む、方法。
(14)項目1に記載の方法であって、前記プロファイルがバイオマーカーを含む、方法。
(15)項目1に記載の方法であって、プロファイルのデータベースに対して前記プロファイル
を比較する工程をさらに包含する、方法。
(16)項目1に記載の方法であって、前記工程(b)が、2つ以上の分光測定技術のデータセ
ットについての線質係数に基づいて、分光測定技術から生じる差異についての複数のデー
タセットを評価することを包含する、方法。
(17)項目1に記載の方法であって、前記生物学的系の状態が、疾患状態を含む、方法。
(18)項目1に記載の方法であって、前記生物学的系の状態が、薬物に対する応答を含む、方
法。
(19)項目1に記載の方法であって、前記生物学的系の状態が、年齢、環境およびストレスの
うち少なくとも1つに対する応答を含む、方法。
(20)項目1に記載の方法を実施するための、コンピュータ読み出し可能な指示を組み込まれ
たコンピュータ読み出し可能な媒体を有する、製造物。
(21)生物学的系のプロファイリングの方法であって、該方法は、以下の工程:
(a)生物学的系のサンプルの分光測定値を含む1つ以上の生物学的サンプル型につい
ての複数のデータセットを提供する工程;
(b)多変数解析を用いて該複数のデータセットを評価して、データセット間の差異の
1つ以上のセットを決定する工程;
(c)さらなる分析のために、該差異の1つ以上のセットの1つ以上を選択する工程;
(d)分光測定技術から生じる差異についてのデータセットの少なくとも一部を、多変
数解析を用いて評価する工程;
(e)さらなる分析のために、1つ以上の選択された分光測定技術によって提供される
データセットのみを選択する工程;
(f)該複数のデータセットの少なくとも一部と、該選択されたデータセットについて
の差異の、該選択された1つ以上のセットとの間の相関を決定する工程;および
(g)該相関に基づいて該生物学的系の状態についてのプロファイルを作成する工程、
を包含する、方法。
(22)項目21に記載の方法であって、工程(d)の多変数解析を用いて評価する工程が、前
記2つ以上の分光測定技術のデータセットについての線質係数に基づく、方法。
(23)項目21に記載の方法であって、前記工程(d)が、マルチブロック分析を含む、方法

(24)項目21に記載の方法であって、前記工程(d)の多変数解析が、2つ以上の多変数解
析の階層型カスケードを含む、方法。
(25)項目21に記載の方法であって、前記工程(d)の多変数解析が、主成分分析、判別分
析、判別分析を用いる主成分分析、標準相関、カーネル主成分分析、非線形主成分分析、
因子分析、多次元スケーリングおよびクラスター分析のうち少なくとも1つを含む、方法

(26)項目21に記載の方法であって、前記工程(f)が、多変数解析を使用して、前記複数
のデータセットの少なくとも一部と前記選択されたデータセットについての差異の選択さ
れた1つ以上のセットとの間の相関を決定する工程を包含する、方法。
(27)項目26に記載の方法であって、前記複数のデータセットの少なくとも一部と前記選択
されたデータセットについての差異の選択された1つ以上のセットとの間の相関を決定す
るための前記多変数解析が、前記工程(d)の多変数解析の階層型カスケードを含む、方
法。
(28)項目26に記載の方法であって、前記工程(d)の多変数解析および前記複数のデータ
セットの少なくとも一部と前記選択されたデータセットについての差異の選択された1つ
以上のセットとの間の相関を決定するための前記多変数解析が、異なる多変数解析である
、方法。
(29)項目26に記載の方法であって、前記複数のデータセットの少なくとも一部と前記選択
されたデータセットについての差異の選択された1つ以上のセットとの間の相関を決定す
るための前記多変数解析が、主成分分析、判別分析、判別分析を用いる主成分分析、標準
相関、カーネル主成分分析、非線形主成分分析、因子分析、多次元スケーリングおよびク
ラスター分析のうち少なくとも1つを含む、方法。
(30)項目21に記載の方法であって、前記データセットが、単一の分光測定技術からの測定
値を含む、方法。
(31)項目21に記載の方法であって、前記データセットが、2つ以上の分光測定技術からの
測定値を含む、方法。
(32)項目21に記載の方法であって、前記分光測定技術が、液体クロマトグラフィー、ガス
クロマトグラフィー、高速液体クロマトグラフィー、キャピラリー電気泳動、質量分析、
液体クロマトグラフィー−質量分析、ガスクロマトグラフィー−質量分析、高速液体クロ
マトグラフィー−質量分析、キャピラリー電気泳動−質量分析、および核磁気共鳴分光法
のうち少なくとも1つを含む、方法。
(33)項目21に記載の方法であって、前記1つ以上の生物学的サンプル型が、血液、血漿、
血清、脳脊髄液、胆汁酸、唾液、滑液、胸膜液、心膜液、腹膜液、糞、鼻汁、眼液、細胞
内液、細胞間液、リンパ液および尿のうち少なくとも1つを含む、方法。
(34)項目21に記載の方法であって、前記1つ以上の生物学的サンプル型が、肝臓細胞、上
皮細胞、内皮細胞、腎臓細胞、前立腺細胞、血液細胞、肺細胞、脳細胞、皮膚細胞、脂肪
細胞、腫瘍細胞および乳腺細胞のうち少なくとも1つを含む、方法。
(35)項目21に記載の方法であって、前記1つ以上の生物学的サンプル型が、同じ生物から
異なる時点で採取したサンプルを含む、方法。
(36)項目21に記載の方法であって、前記プロファイルがバイオマーカーを含む、方法。
(37)項目21に記載の方法であって、プロファイルのデータベースに対して前記プロファイ
ルを比較する工程をさらに包含する、方法。
(38)項目21に記載の方法であって、前記工程(b)が、2つ以上の分光測定技術のデータ
セットについての線質係数に基づいて、分光測定技術から生じる差異についての複数のデ
ータセットを評価することを包含する、方法。
(39)項目21に記載の方法であって、前記生物学的系の状態が、疾患状態を含む、方法。
(40)項目21に記載の方法であって、前記生物学的系の状態が、薬物に対する応答を含む、
方法。
(41)項目21に記載の方法であって、前記生物学的系の状態が、年齢、環境およびストレス
のうち少なくとも1つに対する応答を含む、方法。
(42)項目21に記載の方法を実施するための、コンピュータ読み出し可能な指示を組み込ま
れたコンピュータ読み出し可能な媒体を有する、製造物。
(43)生物学的系をプロファイリングするためのシステムであって、該システムは、以下:
(a)1つ以上の生物学的サンプル型についての複数のデータセットを提供するために
適合された分光測定装置であって、該複数のデータセットは、生物学的系のサンプルの分
光測定値を含む、分光測定装置;ならびに
(b)該分光測定装置と連絡したデータ処理デバイスであって、該データ処理デバイス
は、以下:
(i)多変数解析を用いて該複数のデータセットを評価して、該複数のデータセット
間の差異の1つ以上のセットを決定するため;
(ii)該差異の1つ以上のセットのうち1つと該複数のデータセットの少なくとも
一部との間の相関を、多変数解析を用いて決定するため;そして
(iii)該相関に基づいて、該生物学的系の状態についてのプロファイルを作成す
るための情報を作成するため、
に適合された論理を含む、データ処理デバイス、
を備える、システム。
(44)項目43に記載のシステムであって、該システムは、前記データ処理デバイスによって
アクセス可能な外部データベースをさらに備える、システム。
【図面の簡単な説明】
【0007】
【図1A】図1Aは、本発明の種々の実施形態に従う複数のデータセットを解析するフローダイヤグラムである。
【図1B】図1Bは、本発明の種々の他の実施形態に従う複数のデータセットを解析するフローダイヤグラムである。
【図2A】図2Aは、野生型マウスおよびAPO E3 Leidenマウスから得られた複数の生物学的サンプル型の複数のデータセットに対して、本発明の種々の実施形態に従って実行される解析のフローダイヤグラムである。
【図2B】図2Bは、野生型マウスおよびAPO E3 Leidenマウスから得られた複数の生物学的サンプル型の複数のデータセットに対して、本発明の種々の実施形態に従って実行される解析のフローダイヤグラムである。
【図3】図3Aおよび図3Bは、野生型マウスサンプル(図3A)およびAPO E3マウスサンプル(図3B)の尿サンプルについての部分的400MHzH−NMRスペクトルの例である。
【図4】図4Aおよび図4Bは、野生型マウスサンプル(図4A)およびAPO E3マウスサンプル(図4B)の尿サンプルについての部分的400MHzH−NMRスペクトルの例である。
【図5】図5Aおよび図5Bは、野生型マウスサンプル(図5A)およびAPO E3マウスサンプル(図5B)の血漿サンプルについての部分的400MHzH−NMRスペクトルの例である。
【図6】図6Aおよび図6Bは、野生型マウスサンプル(図6A)およびAPO E3マウスサンプル(図6B)の血漿サンプルについての部分的400MHzH−NMRスペクトルの例である。
【図7】図7Aおよび図7Bは、APO E3マウス血漿サンプル(図7A)、および野生型マウスサンプル(図7B)に対する、ESIを使用するLC−MS分光法により得られた血漿脂質プロフィールの例である。
【図8】図8は、図2Aおよび図2Bのデータセット1および2の尿サンプルについてのNMRデータのPCA−DAスコアプロットの例である。
【図9】図9は、図2Aおよび図2Bのデータセット1(野生型マウス)の尿サンプルについてのNMRデータのPCA−DAスコアプロットの例である。
【図10】図10は、図2Aおよび図2Bのデータセット2(APO E3マウス)の尿サンプルについてのNMRデータのPCA−DAスコアプロットの例である。
【図11】図11は、野生型マウスおよびAPO E3マウスの両方の尿サンプルについてのNMRデータのPCA−DAスコアプロットの例である。
【図12】図12は、図2Aおよび図2Bのデータセット3および4の血漿サンプルについてのNMRデータのPCA−DAスコアプロットの例である。
【図13】図13は、図2Aおよび2Bのデータセット5、6の血漿サンプルならびにヒトサンプルに対するLC−MSデータのPCA−DAスコアプロットの例である。
【図14】図14は、図13の軸D2についてのローディングプロットの例である。
【図15】図15は、野生型マウスサンプル(細い実線)およびAPO E3マウスサンプル(太い実線)についてのLC−MS分光法技術により得られた正規化血漿脂質プロフィールの比較の例である。
【図16】図16は、野生型マウスサンプル(細い実線)およびAPO E3マウスサンプル(太い実線)についてのLC−MS分光法技術により得られた正規化血漿脂質プロフィールの比較の例である。
【図17】図17は、2つの異なる分光法技術(NMRおよびLC−MS)からの、1つの生物学的サンプル型(血漿)についての分光法データについての標準相関スコアプロットの例である。
【図18】図18は、全体の分光法技術は同じだが機器の構成が異なるものからの、1つの生物学的サンプル型(血漿)についての分光法データについての標準相関スコアプロットの例である。
【図19】図19は、本発明の方法を実施するために適合されたシステムの一実施形態の概略図である。
【発明を実施するための形態】
【0008】
本明細書中において使用される場合、用語「生体分子成分の型」とは、あるレベルで生
物学的系に一般的に関連する、あるクラスの生体分子をいう。例えば、遺伝子転写産物は
、生物学的系において遺伝子発現に一般的に関連する生体分子成分の型の1例であり、そ
してこの生物学的系のレベルは、ゲノムまたは機能的ゲノムと称される。タンパク質は、
生体分子成分の型の別の例であり、そして一般に、タンパク質の発現および改変などに関
連し、そして生物学的系のレベルは、プロテオミクスと称される。さらに、生体分子成分
の型の別の例は、代謝産物であり、これは一般に、メタボロミクスと称される生物学的系
のレベルに関連する。
【0009】
本発明は、分光学的データの階層型多成分解析を利用して、生物学的系の状態のプロフ
ァイルを作成する、生物学的系をプロファイリングするための方法およびシステムを提供
する。本発明によってプロファイリングされ得る生物学的系の状態としては、疾患状態、
薬理学的因子の応答、毒物学的状態、生化学的調節(例えば、アポトーシス)、年齢応答
、環境応答、およびストレス応答が挙げられるが、これらに限定されない。本発明は、複
数の供給源(例えば、血液、尿、脳脊髄液(cerebospinal fluid)、
上皮細胞、内皮細胞、異なる被験体、異なる時点での同じ被験体など)から得られた複数
の生物学的サンプルの型(例えば、体液、組織、細胞)由来の生体分子成分の型(例えば
、代謝産物、タンパク質、遺伝子転写産物など)に対するデータを使用し得る。さらに、
本発明は、1つ以上のプラットフォーム(MS、NMR、液体クロマトグラフィー(「L
C」)、ガスクロマトグラフィー(「GC」)、高速液体クロマトグラフィー(「HPL
C」)、キャピラリー電気泳動(「CE」)、および低解像度または高解像度のモードの
、任意の公知の形態のハイフン付きの質量分析(例えば、LC−MS、GC−MS、CE
−MS、LC−UV、MS−MS、MS)などが挙げられるが、これらに限定されない
)において得られた分光学的データを使用し得る。
【0010】
本明細書中において使用される場合、用語「分光学的データ」としては、任意の分光学
的技術またはクロマトグラフィー技術由来のデータが挙げられ、そして用語「分光学的測
定」としては、任意の分光学的技術またはクロマトグラフィー技術によってなされる測定
が挙げられる。分光学的技術としては、共鳴分光学、質量分析、および光学分光学が挙げ
られるが、これらに限定されない。クロマトグラフィー技術としては、液相クロマトグラ
フィー、気相クロマトグラフィー、および電気泳動が挙げられるが、これらに限定されな
い。
【0011】
本明細書中において使用される場合、用語「低分子」および「代謝産物」は、交換可能
に使用される。低分子および代謝産物としては、脂質、ステロイド、アミノ酸、有機酸、
胆汁酸、エイコサノイド、ペプチド、微量元素、ならびに薬物団(pharmacoph
ore)生成物および薬物分解生成物が挙げられるが、これらに限定されない。
【0012】
1つの局面において、本発明は、階層型(hierarchal)手順においてデータ
を処理するための多変数解析の複数の工程を利用して、分光学的データを処理する方法を
提供する。1つの実施形態において、この方法は、複数のデータセットに対して第1の多
変数解析を使用して、これらのデータセット間の1つ以上のセットの差異および/または
類似性を識別し、次いで、第2の多変数解析を使用して、これらのセットの差異(または
類似性)の少なくとも1つと、これらの複数のデータセットのうちの1つ以上との間の相
関(および/または逆相関(すなわち、負の相関))を決定する。この方法は、この相関
に基づいて、生物学的系の状態についてのプロファイルを発生させる工程をさらに包含し
得る。
【0013】
本明細書中において使用される場合、用語「データセット」とは、1つ以上の分光学的
測定に関連する分光学的データをいう。例えば、分光学的技術がNMRである場合、デー
タセットは、1つ上のNMRスペクトルを含み得る。分光学的技術がUV分光法である場
合、データセットは、1つ以上のUV発光スペクトルまたはUV吸収スペクトルを含み得
る。同様に、分光学的技術がMSである場合、データセットは、1つ以上の質量分析スペ
クトルを含み得る。分光学的技術がクロマトグラフィー−MS技術(例えば、LC−MS
、GC−MSなど)である場合、データセットは、1つ以上の質量クロマトグラムを含み
得る。あるいは、クロマトグラフィー−MS技術のデータセットは、1つ以上の全イオン
電流(「TIC」)クロマトグラムまたは再構築されたTICクロマトグラムを含み得る
。さらに、用語「データセット」は、生の分光学的データと再処理された(例えば、ノイ
ズ、ベースラインを除去するため、ピークを検出するため、標準化するためなど)データ
との両方を包含することが、理解されるべきである。
【0014】
さらに、本明細書中において使用される場合、用語「データセット」とは、1つ以上の
分光学的測定に関連する分光学的データの実質的に全てまたは部分集合をいい得る。例え
ば、異なるサンプル供給源(例えば、実験群サンプル対コントロール群サンプル)の分光
学的測定に関連するデータは、異なるデータセットとしてグループ分けされ得る。その結
果、第1のデータセットは、実験群サンプルの測定をいい得、そして第2のデータセット
は、コントロール群サンプルの測定をいい得る。さらに、データセットとは、関連すると
考えられる他の任意の分類に基づいてグループ分けされたデータをいい得る。例えば、単
一のサンプル供給源(例えば、実験群)の分光学的測定に関連するデータが、例えば、そ
の測定を実施した機器、サンプルが採取された時点、サンプルの外観などに基づいて、異
なるデータセットにグループ分けされ得る。従って、1つのデータセット(例えば、外観
に基づいた実験群サンプルのグループ分け)は、別のデータセット(例えば、実験群のデ
ータセット)の部分集合を含み得る。
【0015】
別の局面において、本発明は、多変数解析を利用して、2以上の階層レベルの相関でデ
ータを処理するための、分光光学データ処理の方法を提供する。1つの実施形態において
、この方法は、複数のデータセットに対して多変数解析を使用して、第1のレベルの相関
で、データセット間の相関(および/または逆相関)を識別し、次いで、多変数解析を使
用して、第2のレベルの相関で、データセット間の相関(および/または逆相関)を識別
する。この方法は、1つ以上のレベルの相関で識別された相関に基づいて、生物学的系の
状態に関するプロファイルを発生させる工程を、さらに包含し得る。
【0016】
なお別の局面において、本発明は、多変数解析の複数の工程を利用して、階層型手順で
データセットを処理する、分光学的データ処理の方法を提供し、ここで、多変数解析工程
の1つ以上は、2つ以上の階層レベルの相関でデータを処理する工程をさらに包含する。
例えば、1つの実施形態において、この方法は、以下の工程を包含する:(1)複数のデ
ータセットに対して第1の多変数解析を使用して、これらのデータセット間の差異および
/または類似性の1つ以上のセットを識別する工程;(2)第2の多変数解析を使用して
、第1のセットの差異(または類似性)とデータセットのうちの1つ以上との間の第1の
レベルの相関(および/または逆相関)を決定する工程;ならびに(3)第2の多変数解
析を使用して、第1のセットの差異(または類似性)とデータセットの1つ以上との間の
第2のレベルの相関(および/または逆相関)を決定する工程。この局面の方法はまた、
相関の1つ以上のレベルで識別された相関に基づいて、生物学的系の状態についてのプロ
ファイルを発生させる工程を包含し得る。
【0017】
本発明の他の局面において、本発明は、上記本発明の方法を実施するために適合された
システムを提供する。1つの実施形態において、このシステムは、分光光学装置およびデ
ータ処理デバイスを備える。別の実施形態において、このシステムは、データ処理デバイ
スによってアクセス可能なデータベースをさらに備える。このデータ処理デバイスは、本
発明の方法の1つ以上の機能を実行するよう適合された、アナログ回路および/またはデ
ジタル回路を備え得る。
【0018】
いくつかの実施形態において、このデータ処理デバイスは、汎用コンピュータ上のソフ
トウェアとして、本発明の方法の機能を実行し得る。さらに、このようなプログラムは、
コンピュータのランダムアクセスメモリの一部を蓄えて、階層型多変数解析、データ前処
理、ならびに測定された干渉信号を用いる操作およびこの信号に対する操作を実行する、
制御論理を提供し得る。このような実施形態において、このプログラムは、多数の高レベ
ルな言語(例えば、FORTRAN、PASCAL、C、C++、またはBASIC)の
任意の1つで書き込まれ得る。さらに、このプログラムは、スクリプト、マクロで書き込
まれ得るか、または市販のソフトウェア(例えば、EXCELまたはVISUAL BA
SIC)に埋め込まれ得る。さらに、このソフトウェアは、コンピュータに存在するマイ
クロプロセッサに指向されるアセンブリ言語で実装され得る。例えば、ソフトウェアは、
IBM PCまたはPCクローンで実行されるよう構成されている場合、Intel 8
0×86アセンブリ言語で実装され得る。ソフトウェアは、製品(フロッピー(登録商標
)ディスク、ハードディスク、光ディスク、磁気デープ、PROM、EPROM、または
CD−ROMのような、「コンピュータ読み取り可能なプログラム手段」が挙げられるが
、これらに限定されない)に埋め込まれ得る。
【0019】
さらなる局面において、本発明は、本発明の方法の機能がコンピュータ読み取り可能な
媒体(例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、磁気デ
ープ、PROM、EPROM、CD−ROM、またはDVD−ROMであるが、これらに
限定されない)に埋め込まれた製品を提供する。
【0020】
(詳細な説明)
図1Aを参照して、本発明に従う方法の一実施形態のフローチャートが示される。複数
のデータセット110のうちの1つ以上が、好ましくは、多変数解析の前に予備処理工程
120に供される。予備処理の適切な形態としては、データ平滑化、ノイズリダクション
、ベースライン補正、正規化およびピーク検出が挙げられるが、これらに限定されない。
データ予備処理の好ましい形態としては、エントロピーベースのピーク検出(例えば、係
属中の米国特許出願番号09/920,993(2001年8月2日出願、その内容全体
が、本明細書に参考として援用される)に開示されるもの)および部分的線形フィッティ
ング技術(例えば、J.T.W.E.Vogelsら、「Partial Linear
Fit:A New NMR Spectroscopy Processing T
ool for Pattern Recognition Applications
」Journal of Chemometrics,vol.10,pp.425−3
8(1996)に見出されるもの)が挙げられる。次いで、多変数解析を、第1レベルの
相関130において実行して、データセット間の差異(および/または類似性)を識別す
る。多変数解析の適切な形態としては、例えば、主成分解析(「PCA」)、判別解析(
「DA」)、PCA−DA、標準相関(「CC」)、部分最少二乗(「PLS」)、予測
線形判別解析(「PLDA」)、ニューラルネットワーク、およびパターン認識技術が挙
げられる。一実施形態において、PCA−DAは、スコアプロット(すなわち、2つの主
要成分に関するデータプロット;例えば、以下にさらに記載される図8〜12を参照のこ
と)を生成する第1レベルの相関において実行される。続いて、同じかまたは異なる多変
数解析が、第1レベルの相関から識別された差異(および/または類似性)に基づいて、
第2レベルの相関140においてデータセットに対して行われる。
【0021】
例えば、第1レベルが、PCA−DAスコアプロットを含む一実施形態において、第2
レベルの相関は、PCA−DA解析により生成されるローディングプロットを含む。この
第2レベルの相関は、次にスコアプロットを生成するために使用されるPCA−DAに対
する個々の入力ベクトルの寄与に関する情報を、ローディングプロットが提供するという
点において、第1レベルに対して階層型の関係を有する。例えば、各データセットが、複
数の質量クロマトグラムを含む場合、スコアプロット上の点は、1つのサンプル供給源に
起源を有する質量クロマトグラムを表す。これに比べて、ローディングプロット上の点は
、データセット間の相関に対する特定の質量(質量範囲)の寄与を表す。同様に、各デー
タセットが複数のNMRスペクトルを含む場合、スコアプロット上の点は、1つのNMR
スペクトルを表す。対照的に、対応するローディングプロット上の点は、データセット間
の相関に対する特定のNMR化学シフト値(または値の範囲)の寄与を表す。
【0022】
再び図1Aを参照して、第1レベルの相関130における解析および/または第2レベ
ルの相関140における解析において識別された相関に基づいて、プロフィールが生成さ
れる151(スペクトル検査のクエリー160に対して「いいえ」)。例えば、データ点
が、特定の群のデータセットに入るスコアプロットの領域は、その群に関連する生物学的
系の状態についてのプロフィールを含み得る。さらに、このプロフィールは、スコアプロ
ットにおける上記の領域および関連するローディングプロットにおける1つ以上の点から
特定レベルの寄与の両方を含み得る。例えば、データセットが、質量クロマトグラムおよ
び/または質量スペクトルを含む場合、生物学的系は、適切なサンプルからの分光法デー
タセットが、スコアプロットの特定の領域に入る場合、および特定の質量範囲についての
質量クロマトグラムが、スコアプロットにおいて観察された相関に対して有意な寄与を与
える場合に、ある状態のプロフィールに適合されるだけかもしれない。同様に、データセ
ットが、NMRスペクトルを含む場合、生物学的系は、適切なサンプルからの分光法デー
タセットが、スコアプロットの特定の領域に入る場合、およびそのNMRスペクトルにお
ける化学シフト値の特定の範囲が、スコアプロットにおいて観察される相関に対して有意
な寄与を与える場合に、ある状態のプロフィールに適合されるだけかもしれない。
【0023】
さらに、この方法は、第1レベルの相関130解析および/または第2レベルの相関1
40における解析において識別された相関に基づいて、データセットの1つ以上の特定の
スペクトルの検査の工程155をさらに包含し得る(スペクトル検査のクエリー160に
対して「はい」)。次いで、この検査に基づくプロフィールを作成する152。例えば、
データセットのスペクトルが、質量クロマトグラムを含む場合、この方法は、ローディン
グプロットに基づく相関に対して有意な寄与を示す質量範囲の質量クロマトグラムを検査
する。これらの質量クロマトグラムの検査により、例えば、化学化合物のどの種が、その
プロフィールに関連するのかを明らかにし得る。このような情報は、バイオマーカーの同
定および薬物標的同定に特に重要であり得る。
【0024】
図1Bを参照して、本発明に従う方法の別の実施形態のフローチャートが示される。複
数のデータセット210のうちの1つ以上は、好ましくは、多変数解析の前に予備処理工
程220に供される。次いで、第1の多変数解析を、複数のデータセットに対して実行し
230、それらのデータ間の1組以上の差異および/または類似性を識別する。この第1
の多変数解析は、これらのデータセットのサブセット間で実行され得る。例えば、第1の
多変数解析は、データセット1とデータセット2との間で実行され得(231)、そして
第1の多変数解析は、データセット2とデータセット3との間で別々に実行され得る(2
32)。次いで、この方法は、第2の多変数解析240を使用して、第1の多変数解析に
おいて識別された差異(または類似性)の組のうちの少なくとも1つと、データセットの
1つ以上との間の相関を決定する。この第2の多変数解析240は、データセット間の差
異が、階層様式で識別されるという点において、第1の多変数解析230に対して階層型
の関係を有する。例えば、データセット1とデータセット2との間(およびデータセット
2とデータセット3との間)の差異が最初に識別され(231、232)、次いで、これ
らの差異は、さらなる多変数解析240に供される。一実施形態において、第2の多変数
解析240において識別された相関に基づくプロフィールを作成する250。
【0025】
さらに、多変数解析工程231、232、240のいずれも、この多変数解析工程23
1、232、240において使用された相関レベルから識別された差異(および/または
類似性)に基づいて、同じ多変数解析または別のレベルの相関260における異なる多変
数解析(例えば、図1Aに関して記載される)を実行する工程をさらに包含し得る。次い
で、これらのレベルの相関のうちの1つ以上からの情報に基づくプロフィールが生成され
得る250、251(スペクトル検査のクエリー270に対して「いいえ」)。あるいは
、この方法は、1つ以上のレベルの相関における解析および/または1つ以上の多変数解
析工程において識別された相関に基づく、データセットの1つ以上の特定のスペクトルの
検査の工程255をさらに包含し得る(スペクトル検査のクエリー270に対して「はい
」)。次いで、この検査に基づくプロフィールが生成され得る252。
【0026】
本発明の方法を使用して、任意の生体分子成分型に対するプロフィールを作成し得る。
このようなプロフィールは、異なるレベルの生物学的系の包括的なプロフィール(例えば
、ゲノムプロフィール、トランスクリプトームプロフィール、プロテオームプロフィール
、およびメタボローム(metabolome)プロフィール)の開発を容易にする。さ
らに、このような方法は、(例えば、コントロールおよび患者群由来の血漿サンプルの)
分光測定のデータ分析に使用され得、このような方法を使用して、内在する生物学的機構
により良い洞察を得るため、新規なバイオマーカー/代理マーカーを検出するため、そし
て/あるいは介入経路を開発するために、存在する2つの群間の単一の成分または成分パ
ターンにおける任意の差異を評価し得る。
【0027】
種々の実施形態において、本発明は、代謝物および低分子のプロフィールを作成するた
めの方法を提供する。このようなプロフィールは、包括的なメタボロームプロフィールの
開発を容易にする。他の種々の実施形態において、本発明は、タンパク質、タンパク質複
合体等のプロフィールを作成するための方法を提供する。このようなプロフィールは、包
括的なプロテオームプロフィールの開発を容易にする。なお他の種々の実施形態において
、本発明は、遺伝子転写物、mRNAなどのプロフィールを作成するための方法を提供す
。このようなプロフィールは、包括的なゲノムプロフィールの開発を容易にする。
【0028】
これらの実施形態の1つの変形において、この方法は、概して、以下の工程に基づく:
(1)生物学的サンプル(例えば、体液(血漿、尿、脳髄液、唾液、滑液など))の選択
;(2)調べられる生化学的成分および使用される分光法技術(例えば、脂質、タンパク
質、微量元素、遺伝子発現などの調査)に基づくサンプル調製;(3)質量分析法および
NMRなどの方法を使用する、生物学的サンプル中の高濃度成分の測定;(4)化合物(
例えば、脂質、ステロイド、胆汁酸、エイコサノイド、(神経)ペプチド、ビタミン類、
有機酸、神経伝達物質、アミノ酸、炭水化物、イオン性有機物、ヌクレオチド、無機物、
生体異物など)を研究するための、NMRプロフィールおよび好ましいMSアプローチを
使用する、選択された分子サブクラスの測定;(5)生データの予備処理;(6)本発明
の方法のいずれかに従う多変数解析を使用するデータ解析(例えば、分子の単一のサブク
ラスの測定またはNMRもしくは質量分析法を使用する高濃度成分の測定におけるパター
ンを同定するため);ならびに(7)多変数解析を使用して、個別の実験からのデータセ
ットを組合せ、そしてそのデータにおける目的のパターンを見出す工程。さらに、この方
法は、(8)多数の時点でデータセットを獲得して、目的の多変量パターンにおける時間
変化のモニタリングを容易にする工程をさらに包含し得る。
【0029】
本発明の方法を使用して、以下が挙げられるがこれらに限定されない広範な種々の生物
学的サンプル型から得られる生体分子成分型に対してプロフィールを作製し得る:血液、
血漿、血清、脳髄液、胆汁酸、唾液、滑液、胸膜(plueral)液、心膜液、腹膜液
、便、鼻腔液、眼液、細胞内液、細胞間液、リンパ、尿、組織、肝臓細胞、上皮細胞、内
皮細胞、腎臓細胞、前立腺細胞、血球、肺細胞、脳細胞、脂肪細胞、腫瘍細胞および乳腺
細胞。
【0030】
別の局面において、本発明は、本発明の方法の機能性が、コンピュータ読み取り可能な
媒体に含まれる製品を提供する。このようなコンピュータ読み取り可能な媒体としては、
フロッピー(登録商標)ディスク、ハードディスク、光ディスク、磁気テープ、PROM、
EPROM、CD−ROM、またはDVD−ROMが挙げられるが、これらに限定されな
い。本発明の機能性は、多数のコンピュータ読み取り可能な指示または言語(例えば、F
ORTRAN、PASCAL、C、C++、BASICおよびアセンブリ言語)でコンピ
ュータ読み取り可能な媒体中に含まれ得る。さらに、このコンピュータ読み取り可能な指
示は、例えば、スクリプト、マクロで記述され得るか、または市販のソフトウエア(例え
ば、EXCELまたはVISUAL BASIC)中に機能するように含まれる。
【0031】
他の局面において、本発明は、本発明の方法を実施するために適合されるシステムを提
供する。図19を参照して、一実施形態において、このシステムは、電気連絡しているか
、無線連絡しているか、またはその両方である、1つ以上の分光測定機器1910および
データ処理デバイス1920を備える。分光測定機器は、本発明の方法を実施する際に有
用な分光測定値を生成し得る任意の機器を備え得る。適切な分光測定機器としては、質量
分析計、液相クロマトグラフィー装置、気相クロマトグラフィー装置、および電気泳動機
器ならびにこれらの組合せが挙げられるが、これらに限定されない。別の実施形態におい
て、このシステムは、データ処理デバイスによりアクセス可能なデータを保存している外
部データベース1930をさらに備え、このデータ処理デバイスは、少なくとも部分的に
、外部データベースに保存されたデータを使用して本発明の方法の1つ以上の機能を実施
する。
【0032】
このデータ処理デバイスは、分光測定機器により提供される情報を少なくとも一部使用
して本発明の方法の1つ以上の機能を実施するように適合されるアナログ回路および/ま
たはデジタル回路を備え得る。いくつかの実施形態において、データ処理デバイスは、多
目的コンピュータ上のソフトウエアとして、本発明の方法の機能性を実施し得る。さらに
、このようなプログラムは、コンピュータのランダムアクセスメモリの一部を別にとって
おいて、分光測定値収集、データセットの多変数解析、および/または生物学的系に関す
るプロフィール作成に影響を及ぼす制御論理を提供し得る。このような実施形態において
、このプログラムは、多数の高レベル言語(例えば、FORTLAN、PASCAL、C
、C++,またはBASIC)のいずれか1つで記述され得る。さらに、このプログラム
は、スクリプト、マクロ、または所有ソフトウエアもしくは市販のソフトウエア(例えば
、EXCELもしくはVISUAL BASIC)に含まれる機能性で記述し得る。さら
に、このソフトウエアは、コンピュータに搭載されたマイクロプロセッサを指向したアセ
ンブリ言語で実施され得る。例えば、このソフトウエアは、IBM PCまたはPCクロ
ーンで作動するように構成される場合、Intel80x86アセンブリ言語で実施され
得る。このソフトウエアは、コンピュータ読み取り可能なプログラム媒体(例えば、フロ
ッピー(登録商標)ディスク、ハードディスク、光ディスク、磁気テープ、PROM、EP
ROMまたはCD−ROM)が挙げられるがこれに限定されない製品に含まれ得る。
【実施例】
【0033】
(アテローム性動脈硬化についてのAPO E3マウスモデルの低分子研究)
本発明の種々の実施形態の実施例は、APO E3 Leidenトランスジェニック
マウスモデルの低分子研究の状況で、以下に例示される。
【0034】
(A.APO E3 Leidenマウス)
APO E3 Leidenマウスモデルは、P.L.B.Bruijnzeelによ
る「The Use of Transgenic Mice in Drug Dis
covery and Drug Development」(TNO Pharma,
2000年10月24日)に記載されるトランスジェニック動物モデルである。簡単には
、APO E3−Leiden対立遺伝子は、APO E4(Cys112→Arg)対
立遺伝子と同一であるが、エキソン4において21ヌクレオチドのインフレーム反復を含
み、コドン120〜126または121〜127の縦列反復を生じる。APO E3−L
eiden変異を発現するトランスジェニックマウスは、特定の条件下でアテローム硬化
性プラークを発症する高脂血表現型を有することが公知である。このモデルは、低分子(
代謝物)レベルおよびタンパク質レベルにおいて差異を見出す際に高い推定成功率を有す
るが、遺伝子レベルは非常によく特徴づけされる。
【0035】
本実施例において、10匹の野生型雄性マウスおよび10匹のAPO E3雄性マウス
を代謝ケージにおいて尿の採取後に屠殺した。APO E3マウスを、十分に特定された
ヒト遺伝子クラスター(APO E3−APC1)の挿入により作製し、そして非常に均
質な集団を、少なくとも20世代の近交系の作出により作製した。
【0036】
以下のサンプルが、分析用に利用可能であった:(1)10の野生型尿サンプルおよび
10のAPO E3尿サンプル(1匹の動物あたり約0.5ml以上);(2)10の野
生型血漿(ヘパリン)サンプルおよび10のAPO E3(ヘパリン)血漿サンプル(1
匹の動物あたり約350μl);(3)10の野生型肝臓サンプルおよび10のAPO
E3肝臓サンプル。血漿サンプルから100マイクロリットルをNMRに使用し、そして
同じサンプルを、LC−MSに使用し、約250μlが、タンパク質作業および繰り返し
に利用可能である。全てのサンプルを、−20℃で保存した。合計19個の血漿サンプル
を受容した。1つのサンプル、動物#6(APO−E3 Leiden群)は存在しなか
った。クリーンアップの後、(以下に記載される)プロテオミクス研究のために保存して
おいた部分を−70℃に移した。
【0037】
(B.実験の詳細、血漿サンプルおよび尿サンプル)
血漿サンプル抽出を、イソプロパノールを用いて達成した(タンパク質沈殿)。その血
漿サンプルのLC−MS脂質プロフィール測定値を、エレクトロスプレーイオン化(「E
SI」)および大気圧化学イオン化(「APCI」)LC−MSシステムを用いて得た。
得られた生データを、2001年8月2日出願の係属中の米国特許出願番号09/920
,993に開示されるのと実質的に類似するエントロピーベースのピーク検出技術を用い
て予備処理した。その後、この予備処理データを、本発明の方法に従って主要成分分析(
「PCA」)および/または判別分析(「DA」)に供した。血漿サンプルのNMR測定
からの生データを、パターン認識分析(「PARC」)に供した。このパターン認識分析
は、予備処理(例えば、部分的線形フィット)、ピーク検出および多変数統計分析を含ん
だ。
【0038】
尿サンプルを調製し、その尿サンプルのNMR測定値を得た。その尿サンプルに関する
生NMRデータもまた、PARC分析に供した。このPARC分析は、予備処理、ピーク
検出および多変数統計分析を含んだ。
【0039】
(B.1.マウス血漿の調製および清浄化)
マウス血漿サンプルを、室温で融解した。100μlアリコートを、清浄なエッペンド
ルフバイアルに移し、そして−70℃で保存した。サンプル番号12についてのサンプル
体積は小さく、50μだけを移した。NMRおよびLC−MS脂質分析のために、150
μlアリコートを、清浄なエッペンドルフバイアルに移した。
【0040】
血漿サンプルを、以下のプロトコルに実質的に従って清浄化し取り扱った:(1)0.
6mlのイソプロパノールを添加する;(2)ボルテックスする;(3)10,000r
pmで5分間遠心分離する;(4)500μlをNMR分析用に清浄なチューブに移す;
(5)100μlを清浄なエッペンドルフバイアルに移す;(6)400μlの水を添加
して混合する;そして(7)200μlをオートサンプラーバイアル挿入口に移す。残り
の抽出物およびペレット(沈殿したタンパク質)を−20℃で保存した。
【0041】
(B.2.ヒト血漿の調製および清浄化)
ヒトヘパリン血漿を血液バンクから得た。ガラスチューブ中で、1mlのヒト血漿と4
mlのイソプロパノールとを混合した(ボルテックスした)。遠心分離後、1mlの抽出
物をチューブに移し、そして4mlの水を添加した。得られた溶液を、4つのオートサン
プラーバイアル(1ml)に移した。
【0042】
(B.3.血漿サンプルのLC−MS)
血漿サンプルの分光光度測定を、HPLC−飛行時間MS機器の組み合わせを用いて行
った。クロマトグラフから現れる溶出物を、エレクトロスプレーイオン化(「ESI」)
および大気圧化学イオン化(「APCT」)によってイオン化した。HPLC機器を用い
て使用した代表的機器パラメータを表1に示す。そして勾配の詳細を表2に示す。ESI
供給源についての代表的パラメータを表3に示す。APCI供給源についての代表的パラ
メータを表4に示す。
【0043】
【表1】

【0044】
【表2】

【0045】
【表3】

【0046】
【表4】


サンプルについての注入順序は、以下の通りであった。マウス血漿抽出物を、ランダム
な順序で2回注入した。ヒト血漿抽出物を、この順序の開始時に2回注入し、そしてマウ
ス血漿抽出物を5回注入するごとにその後に注入し、LC−MS状態の安定性をモニター
した。ランダムな順序を適用して、多変数統計に対して起こり得るドリフトの有害な影響
を防いだ。
【0047】
(B.4.血漿サンプルおよび尿サンプルのNMR)
血漿サンプルのNMR分光光度測定を、400MHzのH−NMRを用いて行った。
NMRのためのサンプルを、以下のプロトコルに実質的に従って調製し取り扱った。イソ
プロパノール血漿抽出物(2.3.1からの500μl)を窒素下で乾燥させ、その後、
残渣を、重水素化メタノール(MeOD)中に溶解した。重水素化メタノールは、クロロ
ホルムと水とメタノールとジメチルスルホキシド(すべて重水素化)とを比較した場合に
最良のNMRスペクトルを与えたので、選択した。
【0048】
尿サンプルのNMR分光光度測定もまた、400MHzのH−NMRを用いて行った

【0049】
(C.分光光度測定および分析)
以下の分光光度測定を、代謝物/低分子レベルにて行った。
・尿のNMR測定、全40サンプルに対する多連測定(好ましくは3連測定);
・血漿のNMR測定、全40サンプルに対する多連測定(好ましくは3連測定);および
・血漿のLC−MS測定(血漿脂質プロフィール)、全40サンプルに対する多連測定(
好ましくは3連測定)。
本発明の1実施形態に従うこの実施例の分光光度データの分析を示すフローチャートを、
図2Aおよび図2Bに示す。
【0050】
図2Aを参照すると、得られた分光光度データを、8つのデータセット301〜308
に分類した。これらのデータセットは、以下の通りであった:(1)データセット1は、
野生型マウス尿サンプルの400MHzのH−NMRスペクトルを含んだ(301);
(2)データセット2は、APO E3マウス尿サンプルの400MHzのH−NMR
スペクトルを含んだ(302);(3)データセット3は、APO E3マウス血漿サン
プルの400MHzのH−NMRスペクトルを含んだ(303);(4)データセット
4は、野生型マウス血漿サンプルの400MHzのH−NMRスペクトルを含んだ(3
04);(5)データセット5は、野生型マウス血漿脂質サンプルのLC−MSスペクト
ル(ESIを使用した)を含んだ(305);(6)データセット6は、APO E3マ
ウス血漿脂質サンプルのLC−MSスペクトル(ESIを使用した)を含んだ(306)
;(7)データセット7は、APO E3マウス血漿脂質サンプルのLC−MSスペクト
ル(APSIを使用した)を含んだ(307);そして(8)データセット8は、野生型
マウス血漿脂質サンプルのLC−MSスペクトル(APSIを使用した)を含んだ(30
8)。これらのデータセット各々について得た分光光度測定の例は、以下の通りである:
データセット1について図3Aおよび図4A;データセット2について図3Bおよび図4
B;データセット3について図5Aおよび図6A;データセット4について図5Aおよび
図6A;データセット5について図7B;およびデータセット6について図7A。種々の
特徴が、図3A〜7Bのデータにおいて着目された。
【0051】
図3Aおよび3Bを参照して、馬尿酸に関連するピーク410が、野生型マウス尿サン
プルH−NMRスペクトルにおいて観察されたが、そのようなピークは、APO E3
マウス尿サンプルH−NMRスペクトルには実質的に存在しなかった。このことは、A
PO E3マウスに特有な可能な生化学的プロセスを示すことに注目した。図4Aおよび
4Bを参照すると、さらに、未同定成分に関係するピーク420が、野生型マウス尿サン
プルH−NMRスペクトルにおいて観察された。このピークもまた、APO E3マウ
ス尿サンプルの対応するH−NMRスペクトルには実質的に存在しなかった。
【0052】
図5Aおよび5Bを参照すると、2つのピーク系列510および520が、APO E
3マウス血漿サンプルH−NMRスペクトルにおいて観察された。これらのピークはい
ずれも、野生型スペクトル510には実質的に存在せず、520では実質的に減少してい
た。図6Aおよび6Bに示されるように、第1のピーク系列510に関係するピークは、
野生型スペクトル610中の共鳴シフト領域には実質的に存在せず、第2のピーク系列5
20全体は存在しているが、野生型スペクトル620において減少している。
【0053】
図7Aおよび7Bを参照すると、リソ−ホスファチジルコリン(「リソ−PC」)に関
係するピーク710が、野生型に関する強度と比較してAPO E3マウススペクトルに
おいてわずかに強度が減少したこと、リン脂質に関係するピーク720が、APO E3
スペクトルと野生型スペクトルとの間で強度が実質的に等しいこと、そしてトリグリセリ
ドに関係するピーク730が、野生型についての強度と比較してAPO E3マウススペ
クトルにおいて強度が実質的に増加したことに、注目した。
【0054】
データセット1〜8からの生データを、予備処理した(320)。そして第1多変数分
析を、データセット1と2との間、3と4との間、5と6との間、そして7と8との間で
それぞれ、各々第1相関関係レベル330(すなわち、PCA−DAスコアプロット)に
て実施した。第1相関関係レベルでの第1多変数分析の結果の例を、データセット1およ
び2について図8〜11に、データセット3および4について図12に、そしてデータセ
ット5および6(これは、ヒトサンプルからのデータを含む)について図13に示す。そ
の後、この第1多変数分析からのデータを使用して、第2相関関数レベル340(すなわ
ち、PCA−DAローディングプロット)での分析を行った。そのようなPCA−DAロ
ーディングプロットの一例を、図14に示す。
【0055】
図8を参照すると、データセット1および2の尿サンプルについてのNMRデータのP
CA−DAスコアプロットが、示される。示されるように、この分析はAPO E3およ
び野生型群についてのNMRデータを、スコアプロットにおける実質的に異なる2つの領
域(APO E3領域810および野生型領域820)に、分類する。これは、尿サンプ
ル単独が、APO E3マウスのトランスジェニック性質を反映するプロフィールを生じ
そして他の型のマウスからAPO E3マウスを区別するための体液バイオマーカープロ
フィールとして役立つに十分であり得ることを示す。
【0056】
図9を参照すると、データセット1の尿サンプルについてのNMRデータのスコアプロ
ットが、示される。示されるように、この分析は、尿の色と相関する類似性および差異が
、データセット1の尿サンプルにおいて存在することを示す。詳細には、この分析は、濃
褐色尿、褐色尿、および黄色尿に相関するスコアプロット中の異なる3つの領域(それぞ
れ、910、920、および930)を示す。図9は、野生型マウスコホート中に、異な
る3つのマウス尿プロフィールサブグループが存在することを示す。
【0057】
図10において同様に、データセット2の尿サンプルについてのNMRデータのスコア
プロットが、示される。示されるように、この分析は、尿の色と相関する類似性および差
異が、データセット2の尿サンプル中に存在することを示す。詳細には、この分析は、ス
コアプロット中の3つの領域を示し、1つの領域は褐色尿に相関し(1010)、別の領
域は、薄褐色尿に相関し(1020)、この別の領域は、黄色尿相関領域1030とわず
かに重複する。図10は、APO E3マウスコホート中に3つのマウス尿プロフィール
サブグループが存在することを示す。
【0058】
図11を参照すると、野生型マウスおよびAPO E3マウスの両方の尿サンプルにつ
いてのNMRデータのPCA−DAスコアプロットが、示される。示されるように、この
分析は、データセット1および2の尿サンプルにおいて、同じ色を有する尿についてさえ
類似性および差異が存在することを示す。詳細には、この分析は、スコアプロット中の3
つの領域を示し、1つの領域は黄色APO E3マウス尿に相関し(1110)、1つは
薄褐色APO E3マウス尿に相関し(1120)、そしてもう1つは黄色野生型マウス
尿に相関する(1130)。図11は、3つの異なるマウス尿プロフィールサブグループ
が存在することを示す。このプロフィールは、APO E3動物を野生型動物から区別す
るため、および黄色尿を生成する動物を、薄褐色尿を生成する動物から区別するために、
プロフィールとして使用され得る。
【0059】
図12を参照すると、データセット3および4の血漿サンプルについてのNMRデータ
のPCA−DAスコアプロットが、示される。示されるように、この分析は、APO E
3および野生型群についてのNMRデータを、スコアプロット中の実質的に異なる2つの
領域(野生型領域1210およびAPO E3領域1220)へと分類する。このことは
、血液サンプル単独が、野生型マウスからAPO E3マウスを区別するプロフィールを
生じるために十分であり得ることを示す。
【0060】
図13を参照すると、データセット5および6の血漿サンプルならびにヒトサンプルに
ついてのNMRデータのPCA−DAスコアプロットが、示される。示されるように、こ
の分析は、各生物型に対応するNMRデータ領域(ヒト領域1310、野生型領域132
0およびAPO E3領域1330)を分類する。図13は、血漿サンプルが、生物およ
び遺伝子型を区別するプロフィールを作成するに十分であり得ることを示す。1実施形態
において、第2相関関係レベルでの情報を、例えば、そのデータを3つの領域に分離する
ことに対してNMR技術により測定された各代謝物の寄与を調査するために、図13に示
される分析から得る。1形態において、ローディングプロットを使用して、第2相関関係
レベルを決定する。図13の軸D2についてのローディングプロットの例が、図14に示
される。
【0061】
図14および2Aを参照すると、4つの数字範囲(1401〜1404)が、円で囲ま
れている。この横座標は、質量(または質量対電荷範囲)に対応する。縦座標に沿って正
の値を有する点は、野生型に対してAPO E3マウスにおいて量が少ない成分の質量を
示し、負の値は、逆を示す。図14において理解され得るように、円で囲まれた範囲が、
例えば、図13の相関関係に対する重要な寄与である。これらの領域に関係する質量クロ
マトグラムを調査し(350)、上側の円で囲まれた領域1401および1403は、リ
ソ−ホスファチジルコリン(「リソ−PC」)と関係があることが見出され、そして下側
の領域(1402および1404)は、トリグリセリドと関係があることが見出された。
野生型マウスおよびAPO E3マウスの両方についてのホスファチジルコリンの質量ク
ロマトグラムの例が、図15に示され、野生型マウスおよびAPO E3マウスの両方に
ついてのリソ−ホスファチジルコリンの質量クロマトグラフの例が、図16に示される。
【0062】
図15を参照すると、ホスファチジルコリンに対応する一連のピーク(nは、残基数を
指す)が、野生型血漿サンプル(細い実線)およびAPO E3血漿サンプル(太い実線
)の両方について示される。図15のクロマトグラムは、n=3のピーク1510の最大
強度が全スペクトルについて等しくなるように各々正規化されている。いくつかn=1が
存在するが、このピーク位置1540に対応するシグナルの大部分はホスファチジルコリ
ンから生じるとは考えられないことが、留意されるべきである。示されるように、n=5
に対応するピーク1520および1530は、野生型と比較してAPO E3マウススペ
クトルにおいて実質的に減少したことが、観察された。
【0063】
図16を参照すると、リソ−ホスファチジルコリンに対応する一連のピーク(指示x:
yは、その脂肪酸に関する炭素原子数xおよびy個の炭素結合を指す)が、野生型血漿サ
ンプル(細い実線)およびAPO E3血漿サンプル(太い実線)の両方について示され
る。図16のクロマトグラムは、ピーク1610の最大強度が全スペクトルについて等し
くなるように各々正規化されている。示されるように、アラキドン酸に対応するピーク1
620およびリノレン酸に対応するピーク1630は、野生型と比較してAPO E3マ
ウススペクトルにおいて実質的に減少したことが、観察された。
【0064】
再び図2Aおよび2Bを参照すると、正準(canonical)相関関係を含む第2
多変数分析もまた実施した(問い合わせ360に対して「はい(YES)」)。この第2
多変数分析を、データセット3、4、5、および6に対して実施して(371)、正準相
関関係スコアプロット381を作成した。この第2多変数分析の結果の例が、図17に示
される。分析371が、非常に異なる2つの分光光度技術からのデータ(NMRからのデ
ータセット3および4と、LC−MSからのデータセット5および6)と相関することが
、留意されるべきである。そのような分析は、例えば、異なる情報が、そのような異なる
技術により提供されているか否かを識別し得る。
【0065】
図17に示されるように、この正準相関関係は、APO E3マウスおよび野生型マウ
スについてのNMRおよびLC−MSの両方の結果を、プロットにおいて実質的に異なる
2つの領域(野生型領域1710およびAPO E3領域1720)へと分類する。これ
は、NMR技術およびLC−MS技術の両方が、異なる領域への分離をもたらすことを示
す。しかし、LC−MS法は、より顕著な分離を生じた。
【0066】
第2多変数分析を、データセット5、6、7、および8に対して実施し(372)、正
準相関関係スコアプロット382を作成した。この第2多変数分析の結果の例が、図18
に示される。分析372が、多くの点で、同じ分光光度技術LC−MSからであるが異な
る機器構成からのデータ(ESIを使用するデータセット5および6とAPCIを使用す
るデータセット7および8)と相関することが、留意されるべきである。そのような分析
は、例えば、異なる情報が、そのような異なる機器構成により提供されているか否かを識
別し得る。さらに、そのような多変数分析は、(全く同じ機器を使用する)異なる機器が
異なる情報を提供するか否かを識別するために使用し得る。異なる機器が(同じ技術、パ
ラメータ、および機器を使用して同じサンプルに関して)顕著に異なる情報を提供する場
合、使用者または機器の誤差が、検出され得る。
【0067】
図18に示されるように、この正準相関関係は、APO E3マウスおよび野生型マウ
スについてのESI LC−MSの結果(十字+)およびAPCI LC−MSの結果(
アスタリスク*)の両方を、プロット中の実質的に異なる2つの領域(野生型領域181
0およびAPO E3領域1820)へと分類する。これは、ESI LC−MS技術お
よびAPCI LC−MS技術の両方が、異なる領域への分離を生じることを示す。
【0068】
本発明は、特定の実施形態に関して特に示されそして記載されてきたが、添付の特許請
求の範囲により規定される本発明の趣旨および範囲から逸脱することなく、それらの特定
の実施形態において種々の形式および詳細の変化がなされ得ることが、当業者により理解
されるべきである。従って、本発明の範囲は、添付の特許請求の範囲によって示され、従
って、その特許請求の範囲と等価な意味および範囲内に入るすべての変化が、包含される
ことが意図される。
【0069】
本発明の前述およびその他の特徴および利点、ならびに本発明自体は、上記の記載、添
付の図面および特許請求の範囲からより十分に理解される。これらの図面は、必ずしも一
定の縮尺で描く必要はなく、同様の参照番号は、異なる図の全体にわたって同じ部分を参
照する。

【特許請求の範囲】
【請求項1】
明細書に記載の発明。


【図1A】
image rotate

【図1B】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2009−133867(P2009−133867A)
【公開日】平成21年6月18日(2009.6.18)
【国際特許分類】
【出願番号】特願2009−47371(P2009−47371)
【出願日】平成21年2月27日(2009.2.27)
【分割の表示】特願2003−522011(P2003−522011)の分割
【原出願日】平成14年8月13日(2002.8.13)
【出願人】(503387514)ビージー メディスン, インコーポレイテッド (1)
【Fターム(参考)】