循環器疾患の診断と分類のためのバイオマーカーアッセイ

本開示の方法、アッセイおよびキットは、ヒトの心臓血管の健康を評価するため、バイオマーカー、特にｍｉＲＮＡおよび／またはタンパク質バイオマーカーを同定する。特定の実施形態において、方法、アッセイおよびキットは、ヒトの心臓血管の健康を評価するために、血液循環するｍｉＲＮＡおよび／またはタンパク質バイオマーカーを識別する。

【発明の詳細な説明】
【技術分野】
【０００１】
（関連出願のためのクロスリファレンス）
この出願では、２００９年１２月９日に出願された、米国仮特許出願第６１／２８５，１２１号を基礎に優先権を主張しており、その全体が参照により本明細書に組み込まれている。
【背景技術】
【０００２】
アテローム性動脈硬化症（ＡＳＣＶＤ）は、世界的に、罹患率と死亡率の主な原因である。心筋梗塞（ＭＩｓ）の約６０％は、危険因子が０または１の人に発生する。すなわち、心臓イベントが発生した人々の大多数は、現在の方法で評価した場合、低めの中間または中間のリスクのカテゴリにある。
【発明の概要】
【発明が解決しようとする課題】
【０００３】
遺伝的要因と環境的要因の組み合わせは、疾患の開始および進行に責任がある。アテローム性動脈硬化症はしばしば無症候性であり、現在の診断法によって検出されない。実際、多くの場合、アテローム性動脈硬化症の最初の症状は、心臓発作や心臓突然死である。
【０００４】
循環器疾患やその進展を、正確に予測し、診断することができるアッセイや方法は、非常に望ましい。
【課題を解決するための手段】
【０００５】
この開示は、人間の心臓血管系の健康を評価するための方法、アッセイおよびキットを提供する。一実施形態では、以下の工程を含む、人間の心臓血管系の健康を評価するための方法が提供されている。ａ）人間から生物学的サンプルを得ること；ｂ）前記生物学的サンプルで、表２０に記載されているｍｉＲＮＡの中から選択される少なくとも２つのｍｉＲＮＡマーカーのレベルを決定すること；ｃ）各ｍｉＲＮＡマーカーのレベルを有するデータセットを得ること；ｄ）前記生物学的サンプルを分類するためにデータを使用する分析・分類プロセスに、前記データを入力すること；ここで該分類は、アテローム性動脈硬化症、健康、薬剤曝露、薬剤非曝露からなる分類群から選択されるものであり、そして、ｅ）ステップ（ｄ）の分類に基づいて、人間のための治療法を決定することであって、ここでヒトの心臓血管系の健康を評価すること。
【０００６】
ヒトの心臓血管系の健康を評価するための方法であって、ａ）ヒトから生物学的サンプルを得ること；ｂ）前記生物学的サンプル中の、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及びＥＧＦから成る群から選択される少なくとも３つのタンパク質バイオマーカーのレベルを決定すること；ｃ）各タンパク質マーカーのレベルを有するデータセットを得ること；ｄ）前記生物学的サンプルを分類するために前記データを使用する分析・分類プロセスに、前記データを入力すること；ここで該分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、薬剤非曝露分類からなる分類群から選択されること、および、ｅ）ステップ（ｄ）の分類に基づいて、ヒトのための治療計画を決定することであって、ヒトの心臓血管系の健康を評価すること、を特徴とする、方法。
【０００７】
治療計画の必要性や有効性を判断するためにヒトの心臓血管系の健康を評価するための方法であって、以下を含む。ヒトから生物学的サンプルを得ること、前記生物学的サンプル中の、表２０に記載されているｍｉＲＮＡの中から選ばれる少なくとも２つのｍｉＲＮＡのマーカーのレベルを決定することと、前記生物学的サンプル中の、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及びＥＧＦから成る群から選択される少なくとも３つのタンパク質バイオマーカーのレベルを決定すること、各ｍｉＲＮＡマーカーとタンパク質バイオマーカーのレベルを有するデータセットを取得すること、前記生物学的サンプルを分類するために前記データを使用して、分析・分類プロセスに前記データを入力することであって、ここで該分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、薬剤非曝露分類からなる分類群から選択されること、および、前記分類プロセスの出力に応じて前記生物学的サンプルを分類し、前記分類に基づいてヒトのための治療計画を決定すること。
【０００８】
さらに別の実施形態では、治療計画の必要性や有効性を決定するためにヒトの心臓血管系の健康を評価するためのキットが提供されている。キットは以下を含む：生物学的サンプル中の表２０に記載されているｍｉＲＮＡの中から選ばれる少なくとも２つのｍｉＲＮＡマーカーのレベルを決定するためのアッセイと、及び／又は、生物学的サンプル中の、ＩＬ−１６、ＳＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ及びＥＧＦからなる群から選択される少なくとも３つのタンパク質マーカーのレベルを決定するためのアッセイと、以下のための使用説明書とを含み、使用説明書は、（１）各ｍｉＲＮＡ及び／又はタンパク質マーカーのレベルを有するデータセットを取得すること、（２）生物学的サンプルを分類するためのデータを使用して、分析・分類プロセスにデータを入力することであって、前記分類は、アテローム性動脈硬化症心血管疾患分類、健康分類、薬剤曝露分類、薬剤非曝露分類から成る群から選択されること、（３）前記分類に基づいてヒトのための治療計画を決定すること、のためのものである。
【０００９】
さらに別の実施形態は、ヒトの心血管イベントのリスクを評価するための方法であって、ａ）ヒトから生物学的サンプルを得ること、ｂ）前記サンプル中の、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦおよびＥＧＦからなる群から選ばれる３以上のタンパク質バイオマーカーのレベル、及び／又は、表２０の中の２つ以上のｍｉＲＮＡのレベルを決定すること、ｃ）各タンパク質バイオマーカー及び／又はｍｉＲＮＡバイオマーカーのレベルを有するデータセットを得ること、ｄ）前記データセットに基づいて心血管イベントのリスクを決定するために、リスク予測分析プロセスにデータを入力すること、ｅ）ステップ（ｄ）の心血管イベントの予測リスクに基づいてヒトのための治療計画を決定することであって、ここでは、ヒトの心血管イベントのリスクが評価される、方法、である。
【図面の簡単な説明】
【００１０】
【図１】ロジスティック回帰分析アプローチに基づいた５２検体セット（２６症例（ｃａｓｅｓ）と２６のコントロール）の予想される分類性能を示すグラフである。予想されるＡＵＣとそれに対応する９５％信頼区間は、５２の個々人またはプールされたサンプルのいずれかのセット分類の５００のシミュレーションから得られた。破線のエラーバー上の白丸は、対数正規分布に従うと仮定されたバイオマーカー濃度やスコア値と共に、期待値と、プールされたサンプル（各プール内の５サンプル）を用いた信頼区間を表している。実線のエラーバー上の白丸は、期待値と同じ分布から個々の試料を用いて信頼区間を表している。実線の黒い点は、理論的な結果を表している。ｘ軸は、症例とコントロールのバイオマーカーやスコア分布の平均の差を表している。
【００１１】
【図２】ロジスティック回帰分析アプローチに基づいた５２検体セット（２６症例と２６コントロール）の予想される分類性能を示すグラフである。予想されるＡＵＣとそれに対応する９５％信頼区間は、５２の個々人またはプールされたサンプルのいずれかのセット分類の５００のシミュレーションから得られた。破線のエラーバー上の白丸は、「正規分布」に従うと仮定されたバイオマーカー濃度やスコア値と共に、期待値と、プールされたサンプル（各プール内の５サンプル）を用いた信頼区間を表している。実線のエラーバー上の白丸は、期待値と同じ分布から個々の試料を用いて信頼区間を表している。実線の黒い点は、理論的な結果を表している。ｘ軸は、症例とコントロールのバイオマーカーやスコア分布の平均の差を表している。
【００１２】
【図３】４４のｍｉＲのセットから共変量を選択するモデルに基づいてプールされたサンプルの分類のためのＡＵＣ値の分布のグラフである。ＡＵＣ値の計算は、ペナルティ付きロジスティック回帰モデル（Ｌ１ペナルティ付き）のデータへの適合を介して、１００の事前検証済み（ｐｒｅｖａｌｉｄａｔｅｄ）分類スコアベクトルを得ることに基づいている。Ｘ軸はＡＵＣを表し、Ｙ軸は頻度を表している。示されているように、平均ＡＵＣは０．６８である。
【００１３】
【図４】４４のｍｉＲのセットから共変量を選択するモデルに基づいた、個々のサンプル分類のためのＡＵＣ値分布のグラフである。ＡＵＣ値の計算は、ペナルティ付きロジスティック回帰モデル（Ｌ１ペナルティ付き）のデータへの適合を介して、１００の事前検証済み（ｐｒｅｖａｌｉｄａｔｅｄ）分類スコアベクトルを得ることに基づいている。示されているように、平均ＡＵＣは０．７８である。
【００１４】
【図５】４４のｍｉＲのセットと４７のタンパク質バイオマーカーから共変量を選択するモデルに基づいた、個々のサンプル分類のためのＡＵＣ値分布のグラフである。ＡＵＣ値の計算は、ペナルティ付きロジスティック回帰モデル（Ｌ１ペナルティ付き）のデータへの適合を介して、１００の事前検証済み（ｐｒｅｖａｌｉｄａｔｅｄ）分類スコアベクトルを得ることに基づいている。示されているように、平均ＡＵＣは０．７５である。
【００１５】
【図６】垂直線で示された、最も高い負の相関と、最も高い正の相関を含めた、ｍｉＲとタンパク質との相関分布を示すグラフである。
【００１６】
【図７】ｍｉＲｓ単独での相関の分布を示すグラフである。
【００１７】
【図８】単独の、タンパク質バイオマーカーのデータに基づいて算出され、事前検証済みのスコア（５００リピート）に基づいたＡＵＣの分布を示すグラフである。
【００１８】
【図９】コントロールの平均値と標準偏差に正規化されたタンパク質バイオマーカーの単変量ハザード比を示すグラフである。
【００１９】
【図１０】タンパク質バイオマーカーの調整ハザード比（ａｄｊｕｓｔｅｄｈａｚａｒｄｒａｔｉｏ、ＨＲ）を示すグラフである。調整は、従来の危険因子（ＴＲＦｓ）である、年齢、性別、収縮期血圧（ＢＰ）、拡張期血圧、コレステロール、高比重リポ蛋白（ＨＤＬ）、高血圧症、高血圧薬の使用、高脂血症、糖尿病、喫煙状態、に基づいて行った。
【００２０】
【図１１Ａ】最も高い時間依存性ＡＵＣを有するマーカー群と、５年までのフォローアップ対応値を示すグラフである。ｓＦＡＳ、ＮＴ．ｐｒｏＢＮＰ、ＭＩＧ、ＩＬ．１６、ＭＩＧ、及びＡＮＧ２に対するＡＵＣが示されている。
【図１１Ｂ】最も高い時間依存性ＡＵＣを有するマーカー群と、５年までのフォローアップ対応値を示すグラフである。Ｆａｓリガンド、ＳＣＤ４０Ｌ、アディポネクチン、ＭＣＰ．３、レプチン及びＲＡＮＴＥＳに対するＡＵＣが示されている。
【００２１】
【図１２】Ｃｏｘ比例ハザード回帰モデルの用語の数の関数として、絶対値とドロップ・イン・逸脱（ｄｒｏｐ−ｉｎ−ｄｅｖｉａｎｃｅ）の標準誤差を示すグラフである。モデルに含まれるマーカーの最適な数は、「１−標準誤差ルール」を使用して、選択されている。
【００２２】
【図１３Ａ】コントロールの、Ｍａｒｓｈｆｉｅｌｄサンプルセットでの４ＣｏｘＰＨモデルから得られた線形予測のカーネル密度推定を示すグラフである。
【図１３Ｂ】症例の、Ｍａｒｓｈｆｉｅｌｄサンプルセットでの４ＣｏｘＰＨモデルから得られた線形予測のカーネル密度推定を示すグラフである。
【００２３】
【図１４Ａ】コントロールの、ＭＥＳＡサンプルセットでの４ＣｏｘＰＨモデルから得られた線形予測のカーネル密度推定を示すグラフである。
【図１４Ｂ】症例の、ＭＥＳＡサンプルセットでの４ＣｏｘＰＨモデルから得られた線形予測のカーネル密度推定を示すグラフである。
【発明を実施するための形態】
【００２４】
本開示は、ヒトの心臓血管系の健康を評価するための方法、アッセイおよびキットを提供し、特に、ヒトでのアテローム性動脈硬化症（ＡＳＣＶＤ）を、予測、診断、および監視するために、提供する。開示される方法、アッセイおよびキットは、ヒトの心臓血管の健康を評価するための、循環するマイクロリボ核酸（ｍｉＲＮＡ）バイオマーカー及び／又は蛋白質バイオマーカーを、識別（同定）する。これら方法、アッセイおよびキットの特定の実施例では、循環するｍｉＲＮＡ及び／又はタンパク質バイオマーカーは、ヒトの心臓血管系の健康を評価するために識別される。
【００２５】
一実施形態において、本開示は、治療計画のための必要性、またはその有効性を決定するためにヒトの心臓血管系の健康を評価するための方法を提供し、それは、以下の、ヒトから生物試料を得ること、前記生物試料で、表２０に記載されている群から選択された少なくとも２つのｍｉＲＮＡマーカーのレベルを決定すること、各ｍｉＲＮＡマーカーのレベルを含むデータセットを得ること、前記生物試料を分類するためにデータを使用する分析・分類プロセスに、前記データを入力すること、ここで該分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、薬剤非曝露分類からなる分類群から選択されるものであって、分類プロセスの出力に応じて前記生物学的サンプルを分類すること、および、前記分類に基づいて、ヒトのための治療計画を決定すること、からなる。
【００２６】
特定の実施形態では、治療計画の必要性、または有効性を判断するために、以下（の工程）、つまり、ヒトから生物学的サンプルを得ること（工程）、前記生物学的サンプル中の、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及びＥＧＦから成る群から選択される少なくとも３つのタンパク質マーカーのレベルを決定すること、各タンパク質バイオマーカーのレベルを含むデータセットを得ること、前記生物学的サンプルを分類するために前記データを使用する分析・分類プロセスに、前記データを入力すること；ここで該分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、薬剤非曝露分類からなる分類群から選択されること、および、前記分類プロセスの出力に応じて前記生物学的サンプルを分類し、前記分類に基づいて人間のための治療計画を決定すること、を含む、ヒトの心臓血管系の健康を評価するための方法が、開示されている。
【００２７】
別の実施形態においては、ヒトの心臓血管系の健康を評価するための方法が、提供されている。特定の実施形態においては、前記評価は、治療計画の必要性や有効性を決定するために使用することができる。当該方法は、ヒトから生物学的サンプルを得ること、前記生物学的サンプルで、表２０に記載されているｍｉＲＮＡの中から選択される少なくとも２つのｍｉＲＮＡマーカーのレベルを決定すること、前記生物学的サンプル中の、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及びＥＧＦから成る群から選択される少なくとも３つのタンパク質バイオマーカーのレベルを決定すること、ｍｉＲＮＡマーカーとタンパク質バイオマーカーの個々のレベルで構成されるデータセットを取得すること、前記生物学的サンプルを分類するために前記データを使用して分析・分類プロセスに前記データを入力することであって、ここで該分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、薬剤非曝露分類からなる分類群から選択されること、および、前記分類プロセスの出力に応じて前記生物学的サンプルを分類し、前記分類に基づいてヒトのための治療計画を決定すること、である。
【００２８】
さらに別の実施形態では、ヒトの心血管系イベントのリスクを評価するための方法を提供する。この方法は、以下を含む。つまり、ヒトから生物学的サンプルを得ること、当該サンプル中の、（１）ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及びＥＧＦから成る群から選択される３つまたはそれ以上のタンパク質バイオマーカーのレベル、及び又は、（２）表２０のｍｉＲＮＡの中から選ばれる２つまたはそれ以上のｍｉＲＮＡのマーカーのレベル、を決定すること。当該方法では、各タンパク質バイオマーカー及び又は各ｍｉＲＮＡバイオマーカーのレベルを含むデータセットが得られる。前記データセットに基づいて心血管イベントのリスクを予測するリスク予測分析プロセスへデータが入力され、この心血管イベントの予測リスクに基づいて、ヒトのための治療計画が決定される。心血管系イベントのリスクは、サンプルが得られ、及び又は、分析された日から、約１年、約２年、約３年、約４年、約５年、又はそれ以上の期間、予測することができる。当該予測された心血管系イベントは、後述するように、アテローム性動脈硬化疾患の進展、ＭＩ（心筋梗塞、ｍｙｏｃａｒｄｉａｌｉｎｆａｒｃｔｉｏｎ）等を予測できる。
【００２９】
用語「マーカー」と「バイオマーカー」は、本開示を通して同義語として使われている。
【００３０】
本開示の方法では、検出され、そのレベルが決定されたｍｉＲＮＡマーカーの数は、１つ、又は、２、３、４、５、６、７、８、９、１０やそれ以上であり得る。特定の実施形態では、検出されたｍｉＲＮＡのマーカーの数は、３、または５以上である。検出され、そのレベルが決定されているタンパク質バイオマーカー数は、１か、またはそれより多く、例えば２、３、４、５、６、７、８、９、１０以上である。特定の実施形態では、１、２、３、または５以上のｍｉＲＮＡマーカーが検出されて、そのレベルが決定され、そして、１、２、３、または５以上のタンパク質バイオマーカーが検出され、そのレベルが決定されている。
【００３１】
本開示の方法は、アテローム性動脈硬化症の診断とモニタリングのために有用である。アテローム性動脈硬化症は、また、アテローム性動脈硬化症、動脈硬化症、アテローム性血管疾患、動脈閉塞性疾患、または心臓血管疾患として知られており、血管壁へのプラーク蓄積や、血管の炎症によって特徴づけられる。血管の炎症は、アクティブなアテローム性動脈硬化症、不安定プラーク、または脆弱性プラークの特質である。プラークは、蓄積された、細胞内および細胞外脂質、平滑筋細胞、結合組織、炎症性細胞、およびグリコサミノグリカンから構成されている。特定のプラークはまた、カルシウムを含む。不安定な、アクティブな、または、脆弱なプラークは、炎症性細胞で濃縮される。
【００３２】
例によって、本発明は、サンプルに関連付けられたデータセットであって、少なくともｍｉＲＮＡのマーカー単独か、またはアテローム性動脈硬化症の予測因子として同定されているタンパク質バイオマーカーとの組み合わせによる定量的データを含むデータセットを取得すること、前記データセットを、アテローム性動脈硬化症の診断とモニタリングに有用な結果を生成するために前記データセットを使用する分析プロセスに前記データセットを入力することによって、アテローム性動脈硬化症の診断とモニタリングに有用な結果を生成するための方法を含む。この定量的データは、ＤＮＡ、ＲＮＡ、タンパク質の発現レベル、およびそれらの組み合わせを含めることができる。
【００３３】
本開示の、方法、アッセイおよびキットはまた、心筋梗塞（ＭＩ）、急性冠症候群、脳卒中、心不全、および狭心症を含む心血管疾患の合併症の診断およびモニタリングのために有用である。一般的な合併症の例としては、通常、心筋のセグメントへの冠（冠状動脈）血流量の急激な減少に起因する虚血性心筋壊死に関連するＭＩである。急性ＭＩの患者の大多数で、しばしばプラーク破裂に伴う急性血栓が、損傷部位を供給する動脈を閉塞する。プラークの破裂は、炎症性細胞が濃縮されたアテローム性動脈硬化プラークによって以前に部分的に遮られた動脈で一般的に発生する。一般的なアテローム性動脈硬化の合併症の他の例は、胸部の痛みや心臓への不十分な血流に起因する不快感の症状を伴う状態の、狭心症である。
【００３４】
本開示は、与えられた個々人のために、採血から特定の期間内に、心血管イベント（例えば、ＭＩ）のリスク予測と同様に、アテローム性動脈硬化症の診断と分類に使用することができる炎症のバイオマーカーのプロファイルを識別する。本開示でアッセイされたｍｉＲＮＡおよび蛋白質バイオマーカーは、別のアテローム性動脈硬化症の分類、例えば、診断、ステージング、予後、モニタリング、治療反応、擬似冠動脈カルシウムスコアの予測を区別することが可能である学習アルゴリズムを用いて同定されるものである。臨床的しるし（例えば、従来の危険因子）のような、アテローム性動脈硬化症の分類をするために有用なその他のデータはまた、アテローム性動脈硬化症分類のための有用な結果を生成するために使用されるデータセットの一部であり得る。
【００３５】
様々なｍｉＲＮＡマーカーおよび蛋白質バイオマーカーの定量的なデータを含むデータセットは、単独または併用で、本明細書に開示され、他のデータセットコンポーネント（例えば、ＤＮＡ、ＲＮＡ、臨床的しるしの程度）の定量的データは、分析プロセスに入力され、結果を生成するために使用することができる。分析プロセスは、定義されたパラメータ、言い換えれば、予測モデルでの、任意の学習アルゴリズムのタイプであり得る。予測モデルは、学習アルゴリズムを参照または対照データの適切な型に適用することによって、様々なアテローム性動脈硬化症の分類やリスク予測のために開発することができる。分析プロセス／予測モデルの結果は、適切な個人が、適切な処置を取るために使用することができる。例えば、分類が、「健康」や「アテローム性動脈硬化症」である場合、その結果は、個々の治療の適切な臨床経路を決定するために使用することができる。
【００３６】
マイクロＲＮＡ（本明細書では、また、ｍｉＲＮＡ、ｐＲＮＡ、ｍｉＲと称す）は、約１７〜２７ヌクレオチドの長さの一本鎖ＲＮＡ分子の形態で、遺伝子発現を調節する。ｍｉＲＮＡは、遺伝子によってコードされ、そのＤＮＡから転写される。しかし、ｍｉＲＮＡは、タンパク質に翻訳されず（すなわち、ｍｉＲＮＡはノンコーディングＲＮＡである）、代わりに、各一次転写産物（ｐｒｉ−ｍｉＲＮＡ）は、プレｍｉＲＮＡと呼ばれる短いステムループ構造になり、最終的には機能的なｍｉＲＮＡへとプロセスされる。
【００３７】
ヒトの（心血管系の）炎症に関連し、心血管系の健康を評価するために有用なｍｉＲＮＡマーカーは、以下に限定されはしないが、１つ以上の、ｍｉＲ−２６ａ、ｍｉＲ−１６、ｍｉＲ−２２２、ｍｉＲ−１０ｂ、ｍｉＲ−９３、ｍｉＲ−１９２、ｍｉＲ−１５ａ、ｍｉＲ−１２５−ａ．５ｐ、ｍｉＲ−１３０ａ、ｍｉＲ−９２ａ、ｍｉＲ−３７８、ｍｉＲ−２０ａ、ｍｉＲ−２０ｂ、ｍｉＲ−１０７、ｍｉＲ−１８６、ｈｓａ．ｌｅｔ．７ｆ、ｍｉＲ−１９ａ、ｍｉＲ−１５０、ｍｉＲ−１０６ｂ、ｍｉＲ−３０ｃ、及び、ｌｅｔ７ｂを含む。特定の実施形態では、ｍｉＲＮＡマーカーは、１つ以上のｍｉＲ−２６ａ、ｍｉＲ−１６、ｍｉＲ−２２２、ｍｉＲ−１０ｂ、ｍｉＲ−９３、ｍｉＲ−１９２、ｍｉＲ−１５ａ、ｍｉＲ−１２５−ａ．５ｐ、ｍｉＲ−１３０ａ、ｍｉＲ−９２ａ、ｍｉＲ−３７８、及び、ｌｅｔ７ｂを含む。特に、表２０に記載されているｍｉＲＮＡは、ヒトの心血管系の健康を評価するのに有用である。
【００３８】
ヒトの（心血管系の）炎症に関連し、心血管系の健康を評価するために有用なタンパク質バイオマーカーは、以下に限定されないが、１つ以上のＲＡＮＴＥＳ、ＴＩＭＰ１、ＭＣＰ−１、ＭＣＰ−２、ＭＣＰ−３、ＭＣＰ−４、エオタキシン（ｅｏｔａｘｉｎ）、ＩＰ−１０、Ｍ−ＣＳＦ、ＩＬ−３、ＴＮＦａ、Ａｎｇ−２、ＩＬ−５、ＩＬ−７、ＩＧＦ−１、ｓＶＣＡＭ、ｓｌＣＡＭ−１、Ｅ−ｓｅｌｅｃｔｉｎ、Ｐ−ｓｅｌｅｃｔｉｏｎ、インターロイキン−６、インターロイキン−１８、クレアチンキナーゼ、ＬＤＬ、ｏｘＬＤＬ、ＬＤＬ粒子サイズ、リポプロテイン（ａ）トロポニンＩ、トロポニンＴ、ＬＰＰＬＡ２、ＣＲＰ、ＨＤＬ、トリグリセリド、インスリン、ＢＮＰ、フラクタルキン、オステオポンチン、オステオプロテゲリン、オンコスタチン−Ｍ、ミエロペルオキシダーゼ、ＡＤＭＡ、ＰＡＩ−１（プラスミノゲンアクチベーター阻害剤）、ＳＡＡ（循環アミロイドＡ）、ｔ−ＰＡ（組織型プラスミノゲン活性化因子）、ｓＣＤ４０リガンド、フィブリノーゲン、ホモシステイン、Ｄ−ダイマー、白血球数、心臓型脂肪酸結合タンパク質、ＭＭＰ１、プラスミノゲン、葉酸、ビタミンＢ６、レプチン、可溶性トロンボモジュリン、ＰＡＰＰＡ、ＭＭＰ９、ＭＭＰ２、ＶＥＧＦ、ＰＩＧＦ、ＨＧＦ、ｖＷＦ、及び、シスタチンＣ、を含む。特定の実施形態では、タンパク質バイオマーカーは、１つ以上の、ＩＬ−１６、ｓＦａｓ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及び、ＥＧＦを含む。特定のバイオマーカーに加えて、本開示は、さらに、例示配列と、約９０％、約９５％、または約９７％同一であるバイオマーカー変異体を含む。本明細書で使用される変異体は、多型、スプライシング（ｓｐｌｉｃｅ）変異体、遺伝子変異などが含まれている。
【００３９】
タンパク質バイオマーカーは、種々の方法で検出することができる。たとえば、ｉｎｖｉｖｏイメージングは、心臓組織におけるアテローム性動脈硬化症関連タンパク質の存在を検出するために利用することができる。このような方法は、例えば、その様なタンパク質に特異的な標識抗体またはリガンドを利用することができる。これらの実施形態において、ポリペプチドに対して特異的である検出可能に標識された部分、例えば、抗体、リガンド等は、（例えば、注射によって）個々人に投与され、そして、これらに標識された細胞は、限定はされないが、磁気共鳴イメージング、コンピュータ断層撮影スキャンなどを含む、標準的なイメージング技術を使用して、検出される。しかし、磁気共鳴イメージング、コンピュータ断層撮影スキャン、などが挙げられるが、これらに限定されない。検出には、イメージング試薬の１つか、またはカクテルを利用することができる。
【００４０】
追加のマーカーは、以下に限定されないが、年齢、性別、ＬＤＬ濃度、ＨＤＬ濃度、トリグリセリド濃度、血圧、ボディマス指数（体格指数）、ＣＲＰ濃度、冠動脈カルシウムスコア、ウエスト周囲径、タバコ喫煙状況、心血管疾患の既往歴、心血管疾患の家族歴、心拍数、空腹時インスリン濃度、空腹時グルコース濃度、糖尿病の状態、および高血圧の薬の使用を含む、１つ以上の臨床的しるしから選択することができる。アテローム性動脈硬化症の分類を行うために有用な追加の臨床的しるしは、線形判別分析、サポートベクターマシン分類（ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｃｌａｓｓｉｆｉｃａｔｉｏｎ）、帰納的な特徴除去（ｒｅｃｕｒｓｉｖｅｆｅａｔｕｒｅｅｌｉｍｉｎａｔｉｏｎ）、マイクロアレイ予測分析、ロジスティック回帰、ＣＡＲＴ、フレックスツリー（ＦｌｅｘＴｒｅｅ）、ＬＡＲＴ、ランダムフォレスト、ＭＡＲＴ及び／又は、生存分析回帰など、当技術分野で知られているこれらの学習アルゴリズムを用いて、同定することができる。これらは、当業者に知られており、さらに本明細書に記載されている。
【００４１】
本明細書に開示された分析分類は、予測モデルの使用を含むことができる。予測モデルは、さらに、分類のために、少なくとも約０．６８またはそれ以上の品質要求基準（品質メトリック、ａｑｕａｌｉｔｙｍｅｔｒｉｃ）を備えている。特定の実施形態では、分類のために、少なくとも約０．７０またはそれ以上の品質要求基準を備えている。特定の実施形態では、品質要求基準（品質メトリック）は、曲線（ＡＵＣ）、ハザード比（ＨＲ）、相対リスク（ＲＲ）、再分類、陽性適中率（ＰＰＶ）、陰性適中率（ＮＰＶ）、精度、感度と特異性、ネット再分類指数（ＮｅｔｒｅｃｌａｓｓｉｆｉｃａｔｉｏｎＩｎｄｅｘ）、臨床ネット分類インデックス（ＣｌｉｎｉｃａｌＮｅｔｒｅｃｌａｓｓｉｆｉｃａｔｉｏｎＩｎｄｅｘ）下の領域から、選択される。これらおよびその他のメトリックは、本明細書中に記載されるように使用することができる。さらに、様々な用語が、品質要求基準（品質メトリック）を提供するように選択することができる。
【００４２】
定量的データは、データセットの各コンポーネントに対して得られ、以前に定義されたパラメータでの分析プロセス（予測モデル）へ入力され、それから、結果を生成するために使用される。
【００４３】
データは、サンプルに関連したデータを受け取る個人に帰着する任意の技術を介して、取得することができる。たとえば、個々人は、当業者に公知の方法によって、自分自身でデータセットを生成することにより、データセットを取得することができる。また、データセットは、他の個人または団体からのデータセット、または、１つ以上のデータ値を受け取ることにより、取得することができる。例えば、ある研究室専門家は、特定のデータ値を生成することができ、一方、医療専門家のような他の個人は、そのデータセットの全部又は一部を、分析プロセスに入力して、結果を出すことができる。
【００４４】
本開示を通して、参照が「サンプル」になされるが、定量的データは、調達方法、調達時間、組織の由来など、特性の任意の数が変化する複数のサンプルから得ることができることを、当業者は理解すべきである。
【００４５】
アテローム性動脈硬化症の分類に有用な結果を生成する方法で、本明細書で提示されたタンパク質マーカーの血液、血清、その他での発現パターンが、得られる。興味あるタンパク質マーカーに関連する定量的データは、そのようなマーカーに関連するＤＮＡまたはＲＮＡレベルの測定を含むアテローム性動脈硬化症の分類に有用な結果の生成を許可する如何なるデータでもあり得るが、一般的には、タンパク発現パターンである。タンパク質レベルは、個別に、または発現プロファイルの一部のような、ハイスループット法を介して定量的測定を生成するような、当業者に公知の任意の方法を介して測定することができる。たとえば、血液由来の患者サンプル、例えば血液、血漿、血清などが、興味のあるタンパク質マーカーの存在と量を決定するために、特定の結合剤や、特定の結合剤のパネルに適用され得る。
【００４６】
血液サンプル、または、例えば、血漿、血清などの血液由来のサンプルは、（複数の）ｍｉＲＮＡマーカーだけで、または関心ある（複数の）タンパク質マーカーとの組み合わせで、それらの発現レベルの存在についてアッセイされる。一般的には、血液サンプルが採血され、血漿または血清のような血液由来物が、テストされる。加えて、サンプルは、唾液、尿、精液、母乳や汗の様な他の体液由来のものでも可能である。さらに、サンプルは、動脈、静脈、毛細血管のような組織由来でも可能である。さらに、ｍｉＲＮＡマーカー、タンパク質バイオマーカーの両方を測定する場合、それらは同じサンプルからでも、または異なるサンプルからでも派生させることができる。例えば、ｍｉＲＮＡバイオマーカーは、血液由来のサンプルでアッセイし、タンパク質バイオマーカーは、組織サンプルでアッセイすることもできる。
【００４７】
興味あるｍｉＲＮＡマーカーとタンパク質マーカーに関連付けられる定量的データは、通常、発現プロファイルの形式をとる。発現プロファイルは、多数の評価されたマーカーに対応した、多くのｍｉＲＮＡまたはタンパク質産物の、相対的または絶対的な発現値のセットを構成している。様々な実施形態において、少なくとも約２、３、４、５、６、７またはそれ以上のマーカーの発現パターンを含む発現プロファイルが作られる。発現プロファイルの個々の発現が異なる各構成メンバーの発現パターンは、例えば、診断、予後、治療のモニタリングのための予測値に関して、特定の特異性と感度を提供することができる。
【００４８】
発現データを取得するための多数の方法が知られており、これらテクニックのうちの１つかまたは複数は、単独でまたは組み合わせで、本開示での発現パターンとそのプロファイルを決定するのに適している。
【００４９】
例えば、ＤＮＡとＲＮＡ（ｍＲＮＡ、ｐｒｉ−ｍｉＲＮＡ、ｐｒｅ−ｍｉＲＮＡ、ｍｉＲＮＡ、前駆体ヘアピンＲＮＡ、マイクロＲＮＰなど）の発現パターンは、ノーザン解析、ＰＣＲ、ＲＴ−ＰＣＲ、ＴａｑＭａｎ分析、ＦＲＥＴ検出、１つまたは複数の分子標識（ビーコン）のモニタリング、オリゴヌクレオチドアレイのハイブリダイゼーション、ｃＤＮＡアレイのハイブリダイゼーション、ポリヌクレオチドアレイへのハイブリダイゼーション、液体マイクロアレイへのハイブリダイゼーション、マイクロ電気アレイへのハイブリダイゼーション、ｃＤＮＡシークエンシング、クローン・ハイブリダイゼーション、ｃＤＮＡ断片フィンガープリント、遺伝子発現の連続解析（ＳＡＧＥ法）、サブトラクティブハイブリダイゼーション、ディファレンシャルディスプレイ及び／又はディファレンシャルスクリーニングによって、評価することができる。これらや他のテクニックは、当業者に周知の技術である。
【００５０】
本開示は、好ましくは単離された形態の核酸分子を含む。本明細書中で使用されているように、核酸分子が、実質的に他のポリペプチドをコードする核酸分子のコンタミから分離されている場合に、核酸分子は、「単離」されるべきである。用語「核酸」は、コーディングまたは非コーディングのＲＮＡまたはＤＮＡとして定義される。相補的で、即ちハイブリダイズし、適切なストリンジェンシーな条件下で、分子に安定的に結合した状態を保つ核酸は、本開示の範囲内に含まれる。このような配列は、本明細書に開示されたＲＮＡとのヌクレオチド配列の同一性が、少なくとも５０％、６０％、７０％または７５％、好ましくは少なくとも約８０〜９０％、より好ましくは少なくとも約９２〜９４％、さらにより好ましくは少なくとも約９５％、９８％、９９％かそれ以上で、また、挿入、欠失、ゆらぎ塩基（ｗｏｂｂｌｅｂａｓｅｓ）、置換なども含む。さらに、本明細書に開示のタンパク質バイオマーカーの配列との同一性を、少なくとも約５０％、６０％、７０％または７５％、好ましくは少なくとも約８０〜９０％、より好ましくは少なくとも約９２〜９４％、そして、最も好ましくは少なくとも約９５％、９８％、９９％以上共有する配列が考えられている。
【００５１】
ゲノムＤＮＡ、ｃＤＮＡ、ＲＮＡ（ｍＲＮＡ、ｐｒｉ−ｍｉＲＮＡ、ｐｒｅ−ｍｉＲＮＡ、ｍｉＲＮＡ、ヘアピン前駆体ＲＮＡ、ＲＮＰなど）の分子が、天然物由来かまたは合成で、代替バックボーンに基づく核酸や別の塩基を含む核酸と同様に、具体的な開示の範囲内で意図されている。
【００５２】
ヌクレオチドまたはアミノ酸配列レベルでの相同性または同一性は、配列類似性検索用に調整されている、ｂｌａｓｔｐ、ｂｌａｓｔｎ、ｂｌａｓｔｘ、ｔｂｌａｓｔｎおよびｔｂｌａｓｔｘプログラムで採用されたアルゴリズムを用いたＢＬＡＳＴ（ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ）解析によって決定される。ＢＬＡＳＴプログラムによって使用されるアプローチは、まず最初に、検索配列とデータベース配列との間で、ギャップの有無で類似セグメントを考慮し、その後、同定された一致の全ての統計学的意義を評価し、最後に、選択された有意なしきい値を満たす一致データのみサマライズすることである。ヒストグラム、説明、アライメント、期待（すなわち、データベース配列に対する一致をレポートするための統計学的に有意なしきい値）、カットオフ、マトリックスおよびフィルタ（低複雑さ）のための検索パラメータは、デフォルト設定である。ｂｌａｓｔｐ、ｂｌａｓｔｘ、ｔｂｌａｓｔｎおよびｔｂｌａｓｔｘで使用されるデフォルトのスコアリングマトリックスは、８５ヌクレオチドまたはアミノ酸長さ以上の検索配列に推奨される、ＢＬＯＳＵＭ６２マトリックスである。
【００５３】
ｂｌａｓｔｎについては、スコアリングマトリックスは、Ｎ（即ち、ミスマッチ残基ペアに対するペナルティスコア）に対するＭ（即ち、マッチ残基ペアに対する報酬スコア）の比によって設定されるが、ここで、ＭとＮのデフォルト値は、それぞれ、５と−４である。４つのｂｌａｓｔｎパラメータは、以下のように調整された。つまり、Ｑ＝１０（ギャップ生成ペナルティ）、Ｒ＝１０（ギャップ伸長ペナルティ）、ｗｉｎｋ＝１（クエリに沿ってすべてのｗｉｎｋｔｈ位置で単語のヒットを生成する）、及びｇａｐｗ−１６（ギャップアライメントが生成される範囲内でウィンドウ幅を設定する）。同等のＢｌａｓｔｐパラメータセッティングは、Ｑ＝９、Ｒ＝２、ｗｉｎｋ＝１およびｇａｐｗ＝３２である。ＧＣＧパッケージのバージョン１０．０で利用可能な、配列間のベストフィットな比較は、ＤＮＡパラメータのＧＡＰ＝５０（ギャップ生成ペナルティ）と、ＬＥＮ＝３（ギャップ伸長ペナルティ）を使用し、および、タンパク質比較での同等の設定は、ＧＡＰ＝８とＬＥＮ＝２である。
【００５４】
「ストリンジェントな条件」は以下のようであって、（１）低イオン強度および高温を採用する、例えば、５０℃で０．０１５ＭＮａＣｌ／０．００１５Ｍクエン酸ナトリウム／０．１％ＳＤＳ℃での洗浄、（２）ハイブリダイゼーション中にホルムアミドなどの変性剤を採用、例えば、５０％（体積／体積）のホルムアミドに、０．１％ウシ血清ａｌｂｕｍｉｎ／０．１％Ｆｉｃｏｌｌ／０．１％ｐｏｌｙｖｉｎｙｌｐｙｒｒｏｌｉｄｏｎｅ／ｐＨ６．５の５０ｍＭリン酸ナトリウム緩衝液、７５０ｍＭＮａＣｌ、７５ｍＭクエン酸ナトリウム、４２℃で。別の例では、５０％ホルムアミド中、５ｘＳＳＣ（０．７５ＭのＮａＣｌ、０．０７５Ｍクエン酸ナトリウム）、５０ｍＭリン酸ナトリウム（ｐＨ６．８）、０．１％ピロリン酸ナトリウム、５ｘＤｅｎｈａｒｄｔ液、超音波処理サケ精子ＤＮＡ（５０ｐｇ／ｍｌ）、０．１％ＳＤＳ、１０％硫酸デキストランで４２℃でのハイブリダイゼーション後、４２℃、０．２ｘＳＳＣ及び０．１％ＳＤＳで洗浄。当業者であれば、明確で検出可能なハイブリダイゼーションシグナルを得るために、適切なストリンジェンシー条件を、容易に決定し、変えることができる。
【００５５】
本開示はさらに、開示の核酸分子のフラグメント（断片）を提供する。本明細書中で使用されるように、核酸分子のフラグメントとは、コーディングまたは非コーディング配列の小さな部分を指している。フラグメントのサイズは、使用目的によって決定される。例えば、フラグメントがタンパク質の活性部分をエンコードするように選択されている場合、フラグメントは、タンパク質の機能的領域をエンコードするのに十分な大きさである必要がある。例えば、予測抗原領域に対応するペプチドをコードするフラグメントを、調製することができる。フラグメントが、核酸プローブまたはＰＣＲプライマーとして使用される場合、フラグメントの長さは、プライミング／プロービング時の偽陽性の数が比較的小さくなるように、選択される。
【００５６】
タンパク質の発現パターンは、定量的な尺度を提供し、以下の１つかまたはそれ以上の方法のように、サンプルから抽出された多数のマーカーの評価に適している、当業者に公知の任意の方法によって評価することができる。つまり、タンパク質アレイ（例えば、抗体アレイ）または蛍光活性化セルソーティング（ＦＡＣＳ）に結合する、ＥＬＩＳＡサンドイッチアッセイ、フローサイトメトリー、質量分析検出、熱量測定アッセイ、など。
【００５７】
一実施形態では、あるアプローチは、ＥＬＩＳＡ、抗体標識蛍光ビーズアレイ、抗体アレイ、またはＦＡＣＳスクリーンで、１つまたは複数のタンパク質産物のエピトープを認識する、標識されたアフィニティー試薬（例えば、抗体、小分子など）の使用を含む。抗体の産生・評価方法は、当該分野で周知である。
【００５８】
沢山の適切なハイスループットフォーマットが、開示されたバイオマーカーの発現パターンとプロファイルを評価するために存在している。一般的に、用語「ハイスループット」は、一日に、少なくとも約１００アッセイ、または少なくとも約５００アッセイ、または少なくとも約１０００アッセイ、または少なくとも約５０００アッセイ、または少なくとも約１０，０００アッセイ、またはそれ以上を実行するフォーマットを指している。アッセイを列挙するとき、サンプル数やアッセイされるマーカー数のどちらかを考慮することができる。
【００５９】
ハイスループット発現解析を行うための多数の技術的プラットフォームが知られている。一般的に、このような方法は、対象サンプル、タンパク質マーカー、またはその両方のうちのいずれかの論理的アレイまたは物理的なアレイを含んでいる。一般的なアレイフォーマットは、液体相、固体相の両方のアレイを含む。例えば、核酸のハイブリダイゼーション、リガンドへの抗体または他の受容体の結合などのための、液相アレイを採用するアッセイは、マルチウェルまたはマイクロタイタープレートで行うことができる。９６、３８４または１５３６ウェルのマイクロタイタープレートは、広く入手可能であり、例えば、３４５６や９６００のより多くのウェルでさえ、使用することができる。一般的には、マイクロタイタープレートの選択は、例えば、サンプルの調製および分析のために使用される、ロボットによるハンドリングやローディングシステムのような、方法や装置によって決定される。典型的なシステムは、例えば、ルミネックス社（Ａｕｓｔｉｎ、ＴＸ）のｘＭＡＰ（登録商標）テクノロジー、メソスケールディスカバリー社（Ｇａｉｔｈｅｒｓｂｕｒｇ、ＭＤ）のＭＵＬＴＩ−ＡＲＲＡＹ（登録商標）やＭＵＬＴＩ−ＳＰＯＴ（登録商標）テクノロジーを伴うＳＥＣＴＯＲ（登録商標）イメージャ、Ｂｅｃｋｍａｎ−Ｃｏｕｌｔｅｒ社（Ｆｕｌｌｅｒｔｏｎ、Ｃａｌｉｆ．）のＯＲＣＡ（商標）システム、及び、Ｚｙｍａｒｋ株式会社（Ｈｏｐｋｉｎｔｏｎ、ＭＡ）のＺＹＭＡＴＥ（商標）システム、ｍｉＲＣＵＲＹＬＮＡ（商標）ｍｉｃｒｏＲＮＡアレイ（Ｅｘｉｑｏｎ社、Ｗｏｂｕｒｎ、ＭＡ）、である。
【００６０】
また、様々な固相アレイが、好ましくは、本開示の方法、アッセイおよびキットの属性内で、発現パターンを決定するために用いることができる。典型的なフォーマットは、膜またはフィルタアレイ（例えば、ニトロセルロース、ナイロンの）、ピンアレイ、およびビーズアレイ（例えば、液体の「スラリー」内で）を含む。一般的に、候補ライブラリーのメンバーに対応する発現産物と特異的に相互作用する（例えば、ハイブリダイズするか結合する）核酸またはタンパク質試薬に対応するプローブは、固体支持体に、例えば直接または間接的に架橋するなどして、固定化されている。本質的には、特定の発現アッセイを行うために必要な試薬および条件に耐えることができる任意の固体支持体を利用することができる。例えば、機能化ガラス、シリコン、二酸化ケイ素、変性シリコン、（ポリ）テトラフルオロエチレン、（ポリ）フッ化ビニリデン（ｖｉｎｙｌｉｄｅｎｅｄｉｆｌｕｏｒｉｄｅ）、ポリスチレン、ポリカーボネートのような様々なポリマーのいずれか、またはそれらの組み合わせは全て、固相アレイの基質として役立つことができる。
【００６１】
一実施形態において、アレイは、例えば、上記指定された材料の一つで構成される「チップ」である。候補となるライブラリの個々のコンポーネントの発現産物と特異的に相互作用する、例えば、ｃＤＮＡ、合成オリゴヌクレオチドなどのような、例えばＲＮＡまたはＤＮＡの、ポリヌクレオチドプローブ、または、抗体や抗原結合フラグメントまたはそれらの誘導体のような、結合タンパク質が、論理的に順序付けられた方法、すなわち、アレイで、チップに固定されている。さらに、（サンプル標識のデザインに応じて）マーカーの塩基配列のセンスまたはアンチセンス配列のいずれかに特異的親和性を持つ分子は、マーカーに対して特異的親和性を失うことなく、アレイ表面に固定することができ、アレイ作成のため取得し製造することができる。それらは、例えば、マーカーの特定の核酸配列を認識するタンパク質、リボザイム、ペプチド核酸（ＰＮＡ）、または特定の親和性を有する他の化学物質や分子である。
【００６２】
マイクロアレイの発現は、様々なレーザーやＣＣＤベースのスキャナでマイクロアレイをスキャンし、そして、例えば、ＩＭＡＧＥＮＥ（商標）（バイオディスカバリー社）、ＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎソフトウェア（アジレント社）、ＳＣＡＮＬＹＺＥ（商標）（スタンフォード大学、Ｓｔａｎｆｏｒｄ、ＣＡ．）、ＧＥＮＥＰＩＸ（商標）（アクソン・インスツルメンツ社）の様な、多数のソフトウェアパッケージで、特徴を抽出することによって、検出することができる。
【００６３】
ハイスループットのタンパク質システムは、ＣｉｐｈｅｒｇｅｎＢｉｏｓｙｓｔｅｍｓ社（Ｆｒｅｍｏｎｔ、Ｃａｌｉｆ．）のＰＲＯＴＥＩＮＣＨＩＰ（商標）アレイや、Ｓ＆ＳＢｉｏｓｃｅｎｃｅｓ社（Ｋｅｅｎｅ、Ｎ．Ｈ．、ＵＳ）のＦＡＳＴＱＵＡＮＴ（商標）ヒトケモカインタンパク質マイクロアレイの様に市販のシステムを含む。
【００６４】
臨床的しるし（ｃｌｉｎｉｃａｌｉｎｄｉｃｉａ）、代謝的測定（ｍｅｔａｂｏｌｉｃｍｅａｓｕｒｅｓ）、遺伝子解析など、他のデータセット構成要素に関する定量的データは、当業者に公知の方法によって決定することができる。
【００６５】
したがって、ｍｉＲＮＡ、タンパク質マーカー、及び他のデータセット構成要素（すなわち、臨床的しるしなど）について得られた定量的データは、予測モデルに入力された学習アルゴリズムを使用して以前に決定されたパラメータを用いた分析プロセスに供される。分析プロセスのパラメータは、本明細書に開示されたもの、または本明細書に記載のガイドラインを使用して導き出されたものかもしれない。線形判別分析、回帰的特徴の排除、マイクロアレイの予測分析、ロジスティック回帰、ＣＡＲＴ、ＦｌｅｘＴｒｅｅ、ＬＡＲＴ、ランダムフォレスト、ＭＡＲＴ、または他の機械学習アルゴリズムの様な学習アルゴリズムは、様々なアテローム性動脈硬化症分類に適している分析プロセスのためのパラメータを決定するために、適切な参照またはトレーニングデータに適用される。
【００６６】
結果（分類、生存／タイム・トゥ・イベント（出来事までの期間）など）を生成するために使用される分析的プロセスは、サンプルを分類するための有用な結果、例えば、取得したデータセットと参照データセットとの比較、線形アルゴリズム、二次式アルゴリズム、決定ツリーアルゴリズム（ａｄｅｃｉｓｉｏｎｔｒｅｅａｌｇｏｒｉｔｈｍ）、または投票アルゴリズムを用いて得られたデータセットの比較など、を提供することができるプロセスの任意のタイプかもしれない。
【００６７】
アテローム性動脈硬化症の分類を行うための有用な結果を得るための様々な分析的プロセスが、本明細書に記載されているが、当業者であれば、容易に、分析プロセスに適切な任意のタイプは、この開示の範囲内であることを理解するであろう。
【００６８】
分析プロセスへの入力前に、各データセット内のデータは、通常、２回、３回、または複数回反復して各マーカーの値を測定することにより、収集される。データは、操作することができ、例えば、生データは、標準曲線や、各患者の平均と標準偏差を計算するために使用される反復測定の平均を用いて、変換できる。それから、これらの値は、例えば、対数変換、Ｂｏｘ−Ｃｏｘ変換などのモデルで使用される前に、変換することができる。このデータは、定義されたパラメータを使用して、分析プロセスへ入力することができる。
【００６９】
分析プロセスでは、サンプルが、ある与えられたクラスに属する確率を決定するためのしきい値を、設定することができる。確率は、好ましくは少なくとも５０％、または少なくとも６０％または少なくとも７０％または少なくとも８０％、少なくとも９０％、またはそれ以上である。
【００７０】
他の実施形態では、分析プロセスは、得られたデータと参照データセット間の比較で、統計学的に有意な差をもたらすかどうかを決定する。もしそうであれば、データセットが取得されたサンプルは、参照データセットのクラスには属さないと分類される。逆に、このような比較で、参照データセットとは統計学的に有意な差がない場合、データセットが得られたサンプルは、参照データセットのクラスに属するものとして分類される。
【００７１】
一般的には、分析プロセスは、以下で説明するものの様に、統計学的分析法によって生成されたモデルの形式である。そのような分析プロセスの例としては、線形アルゴリズム、二次式アルゴリズム、多項式アルゴリズム、決定ツリーアルゴリズム（ａｄｅｃｉｓｉｏｎｔｒｅｅａｌｇｏｒｉｔｈｍ）、投票アルゴリズム（ａｖｏｔｉｎｇａｌｇｏｒｉｔｈｍ）を含めることができる。線形アルゴリズムは次式を有することができる：
【数１】

（ここで、Ｒは、得られた有用な結果、Ｃ_０はゼロになるかもしれない定数、Ｃ_ｉおよびｘ_ｉは、それぞれ、定数と、適用可能なバイオマーカーや臨床的しるしの値、及び、Ｎはマーカーの合計数、である。）
【００７２】
二次式アルゴリズムは、次式を有することができる：
【数２】

（ここで、Ｒは、得られた有用な結果、Ｃ_０はゼロになるかもしれない定数、Ｃ_ｉおよびｘ_ｉは、それぞれ、定数と、適用可能なバイオマーカーや臨床的しるしの値、及び、Ｎはマーカーの合計数、である。）
【００７３】
多項式アルゴリズムは、線形または二次式アルゴリズムの、より一般化された式である次式を有することができる：
【数３】

（ここで、Ｒは、得られた有用な結果、Ｃ_０はゼロになるかもしれない定数、Ｃ_ｉおよびｘ_ｉは、それぞれ、定数と、適用可能なバイオマーカーや臨床的しるしの値、ｙは、ｘ_ｉが上昇するパワーであり、Ｎはマーカーの合計数、である。）
【００７４】
適切な参照（基準）またはトレーニングデータセットは、任意の適切な学習アルゴリズムを使い、分類に用いる分析プロセスのパラメータを決定するため、すなわち、予測モデルを開発するために、使用することができる。使用する参照またはトレーニングデータセットは、決定すべき望ましいアテローム性動脈硬化症の分類に依存する。データセットは、２、３、４又はそれ以上のクラスからのデータを含めることができる。例えば、アテローム性動脈硬化症を診断するために用いる分析プロセスのパラメータを決定するために監督下にある学習アルゴリズムを使用するには、コントロールと患者の各サンプルを含むデータセットが、トレーニングセットとして使用される。あるいは、管理された学習アルゴリズムを、アテローム性動脈硬化症のステージ分類のための予測モデルを開発するために使用する場合は、トレーニングセットは、心血管疾患のさまざまなステージのそれぞれのデータを含めることができる。
【００７５】
以下は、開示された方法、アッセイおよびキットの実施を支援するために、当業者に利用可能な統計学的解析方法のタイプの例である。統計分析は、２つのタスクのいずれかまたは両方に適用される可能性がある。まず、これらおよびその他の統計的方法は、好適なデータセットを形成する、マーカーや他のしるし（ｉｎｄｉｃａ）の好ましいサブセットを識別するために使用されることがある。さらに、これらと他の統計的方法は、結果を生み出すデータセットで使用される分析プロセスを生成するために使用されることがある。本明細書中に提示された、あるいは先行技術で使用可能な統計的手法のいくつかは、これらのタスクの両方を実行し、本明細書に開示される方法の実施のための分析プロセスとしての使用に適するモデルを提供するだろう。
【００７６】
その対応する特徴的な値（例えば、濃度、発現レベル）で、例えば健康とアテローム性動脈硬化症との間を識別することができるバイオマーカーが、本明細書で同定されている。これらのマーカーと、それに対応する特徴（例えば、濃度、発現量）の同定は、患者のクラスを区別する１つの分析プロセス、または複数の分析プロセスを開発するために使用することができる。以下の（実施）例では、データ解析アルゴリズムが、そのような沢山の分析プロセスを構築するためにどの様に使用することができるかを示している。実施例に記載のデータ解析アルゴリズムの各々は、健康とアテローム性動脈硬化症患者を含むトレーニング集団を交えて本明細書で同定された、マーカーのサブセットの特徴（例えば、発現値）を、使用する。本明細書に開示の、被験者を区別する１つ又は複数の分析プロセスを構築するための特定のデータ解析アルゴリズムは、以下の節で説明する。分析プロセスは、これらの例示的なデータ解析アルゴリズム、または当該技術分野で公知の他の技術を使用して構築された後、分析プロセスは、２つまたはそれ以上の表現型のいずれかのクラス（例えば、健康やアテローム性動脈硬化症患者）に被験者を分類するために、及び又は生存／タイム・トゥ・イベント（出来事までの期間）を予測するために使用することができる。これは、被験者から得られた１つ以上のマーカープロファイルに１つまたは複数の分析プロセスを適用することによって達成される。このような分析プロセスは、したがって、診断指標として非常に大きな価値を有する。
【００７７】
本開示の方法、アッセイおよびキットは、一態様では、トレーニング集団から得られるマーカープロファイルに対する、被験者から１つまたは複数のマーカープロファイルの評価のために、提供される。いくつかの実施形態では、被験者と同様に、トレーニング集団の被験者から得られた各マーカーのプロファイルは、多くの異なるマーカーのそれぞれの特徴を構成する。いくつかの実施形態では、この比較は、（ｉ）トレーニング集団からマーカープロファイルを用いた分析プロセスを開発し、（ｉｉ）被験者からのマーカープロファイルに分析プロセスを適用することによって、達成される。このように、本明細書に開示のメソッドのいくつかの実施形態に適用される分析プロセスは、テスト被験者がアテローム性動脈硬化症を持っているかどうかを判断するために使用される。代替の実施形態では、本明細書に開示の方法は、被験者がＭＩを経験するか否かを決定し、および／または（例えば、ＭＩおよび／または生存の）イベントまでの時間（タイム・トゥ・イベント）を予測することができる。
【００７８】
本明細書に開示の方法のいくつかの実施形態では、分析プロセスのアプリケーションの結果が、対象（被験者）が、ＭＩを経験する（に見舞われる）可能性が高いことを示しているときは、対象（被験者）は、「ＭＩ」対象（被験者）として診断／分類される。また、もし、例えば、分析プロセスの結果が、対象がアテローム性動脈硬化症に発展する可能性が高いことを示していれば、対象は、「アテローム性動脈硬化症」対象として診断される。分析プロセスの適用の結果が、対象がアテローム性動脈硬化症に発展しないことを示している場合は、対象は健常と診断される。したがって、いくつかの実施形態において、上述した二元的な決定状況の結果は、４つの可能な結果を有する。すなわち、（ｉ）真のアテローム性動脈硬化症：分析プロセスは、対象（被験者）がアテローム性動脈硬化症に発展することを予想し、実際に対象は、一定期間内にアテローム性動脈硬化症に進展する場合（真陽性、ＴＰ）。（ｉｉ）偽（仮性）アテローム性動脈硬化症：分析プロセスは、対象が、アテローム性動脈硬化症に発展することを予想したが、実際は、対象は、一定期間内にアテローム性動脈硬化症に進展しない場合（偽陽性、ＦＰ）。（ｉｉｉ）真の健康：分析プロセスは、対象が、アテローム性動脈硬化症に発展しないことを予想し、実際に、一定期間内にアテローム性動脈硬化症に進展しない場合（真陰性、ＴＮ）。（ｉｖ）偽（仮性）健康：分析プロセスは、対象が、アテローム性動脈硬化症に進展しないと予想したが、実際には、一定期間内にアテローム性動脈硬化症に進展する場合（偽陰性、ＦＮ）、である。
【００７９】
これらＴＰ（真陽性）、ＦＰ（偽陽性）、ＴＮ（真陽性）、ＦＮ（偽陰性）のための他の定義がなされ得ることが理解されるであろう。そのようなすべての選択的な定義は、本開示の方法、アッセイ、キットの範囲内であるが、理解を容易にするため、ＴＰ、ＦＰ、ＴＮ、ＦＮの定義は、特に明記しない限り、上記（ｉ）から（ｉｖ）によるものを、本明細書では使用する。
【００８０】
当業者によって理解されるように、多くの定量的な判断基準は、あるテストマーカーのプロファイルとリファレンスマーカーのプロファイル間での比較のパフォーマンス（例えば、被験者からのマーカープロファイルへの分析プロセスの適用）を伝えるために使用することができる。これらは、陽性予測値（ＰＰＶ）、陰性予測値（ＮＰＶ）、特異性、感度、精度、および確実性を含んでいる。さらに、受信者操作曲線（ＲＯＣ曲線）の様な他の構築物は、分析プロセスのパフォーマンスを評価するために使用することができる。本明細書中で使用されるのは：ＰＰＶ＝ＴＰ／（ＴＰ＋ＦＰ）、ＮＰＶ＝ＴＮ／（ＴＮ＋ＦＮ）、特異性＝ＴＮ／（ＴＮ＋ＦＰ）、感度＝ＴＰ／（ＴＰ＋ＦＮ）、及び、精度＝確実性＝（ＴＰ＋ＴＮ）／Ｎ。
【００８１】
ここで、Ｎは、比較したサンプルの数（例えば、アテローム性動脈硬化か健康かの判定が求められているテストのサンプル数）である。例えば、この分類が求められている１０の被験者がある場合を考えてみよう。各マーカーのプロファイルが、１０の被験者のそれぞれのために構築される。次に、各マーカープロファイルは、トレーニング集団から得られたマーカープロファイルに基づいて開発された、分析プロセスを適用することによって、評価される。この例では、上記の式のＮは１０に等しい。一般的に、Ｎは、サンプルをある集団の異なるメンバーから収集したサンプルの数である。この集団は、実際に、二つの異なるタイプからなる。１つのタイプでは、集団は、そのサンプルと表現型（例えば、マーカーの特徴値や、対象（被験者）がアテローム性動脈硬化症に進展するか否かの指標）のデータが、分析プロセスを構築または改良するために使用された対象で構成されている。この様な集団は、本明細書では、トレーニング集団と称する。他のタイプでは、集団は、分析プロセスを構築するために使用されてはいない対象で構成されている。このような集団は、検証集団と称する。特に断りのない限り、Ｎによって表される集団は、もっぱら、トレーニング集団か、または、検証集団であり、２つの集団タイプの混合物とは対照的である。検証集団とは対照的に、トレーニング集団に基づいている場合、精度などのスコアは、より高値（単一（ｕｎｉｔｙ）に近い）となることが理解されるであろう。それにもかかわらず、そうでなければ特に断りのない限り、確実性（精度）を含む１つの分析プロセス（または被験者からのバイオマーカーのプロファイルの評価の他の形態）のパフォーマンスを評価するのに使用された全ての基準は、トレーニング集団または検証集団のいずれかへの基準に関連する分析プロセスを適用することによって測定される基準に、対応している。
【００８２】
いくつかの実施形態では、Ｎは、１より大きく、５より大きく、１０より大きく、２０より大きく、１０から１００の間、或いは、１００より大きく、１０００より小さい対象（被験者）である。ある実施形態では、分析プロセス（または他の比較形態）は、トレーニング集団または検証集団に対して、少なくとも約９９％の確実性、あるいはそれ以上を有することができる。他の実施形態では、確実性は、トレーニング集団または検証集団に対して、少なくとも約９７％、少なくとも約９５％、少なくとも約９０％、少なくとも約８５％、少なくとも約８０％、少なくとも約７５％、少なくとも約７０％、少なくとも約６５％、少なくとも約６０％である。確実性の有用度は、特定の方法に依存して変化しうる。本明細書中で使用されるように、「確実性」は、「精度」を意味している。一実施形態では、感度および／または特異性は、トレーニング集団または検証集団に対して、少なくとも約９７％、少なくとも約９５％、少なくとも約９０％、少なくとも約８５％、少なくとも約８０％、少なくとも約７５％、少なくとも約７０％である。いくつかの実施形態では、このような分析プロセスは、定められた精度で、アテローム性動脈硬化症の進展を予測するために使用されている。いくつかの実施形態では、このような分析プロセスは、定められた精度で、アテローム性動脈硬化症を診断するために使用されている。いくつかの実施形態では、このような分析プロセスは、定められた精度で、アテローム性動脈硬化症のステージを決定するために使用されている。
【００８３】
十分な確実性を有する被験者を分類するための分析プロセスで使用される可能性のある特徴の数は、２またはそれ以上である。いくつかの実施形態では、それが３以上、４以上、１０以上、または１０から２００の間である。しかしながら、求められる確実性の程度に応じて、分析プロセスで使用される特徴の数は、多かれ少なかれではあるが、すべてのケースで、少なくとも２であることができる。一実施形態では、被験者を分類するための分析プロセスによって使用され得る特徴の数は、高い確実性で、テスト対象（被験者）の分類を可能にするために最適化されている。
【００８４】
特定の実施形態では、分析プロセスが生存率を予測するために利用される。生存分析は、タイムトゥイベント・データのモデリングを含む。比例ハザードモデルは、統計学における生存モデルの１つのクラスである。生存モデルは、いくつかのイベントがその量に関連付けられているかもしれない１つ以上の共変量を発生する前に経過する時間と、関連している。比例ハザードモデルでは、共変量の単位増加のユニークな効果は、ハザード率に関して掛け算の関係である。生存モデルは、以下の二つの部分から成ると見なすことができる：つまり、しばしばＡ０（ｔ）と記述され、ハザード（リスク）が共変量のベースラインレベルで経時的にどの様に変化するかを表す、基本的なハザード関数、及び、ハザードが、説明的な共変量に応じてどの様に変化するかを表す、エフェクト・パラメータ、である。典型的な医療の例は、変動の減少および／または交絡に対する制御のために、年齢や、性別の様な患者の特性と同様に、治療の指定（割当て）や、他の疾患の存在の様な共変量を含む。
【００８５】
比例ハザードの仮説は、共変数がハザードを増加させる仮説である。ベースラインハザードが異なるかもしれないが、固定係数の最も単純なケースでは、例えば、薬剤による治療は、言ってみれば、任意の時刻ｔにおける被験者のハザードを半減させることができる。ただし、共変数は、二元的予測に限定されないことに、注意されたい：連続的な共変数ｘの場合には、ハザードは、対数的に反応し、ｘでの各ユニットの増加は、結果としてハザードの比例スケーリングとなる。通常は完全に一般的なＣｏｘモデルの下では、ベースラインハザードは、「統合外（ｉｎｔｅｇｒａｔｅｄｏｕｔ）」とされ、またはヒューリスティックに考慮から除外され、残りの部分的尤度（ｌｉｋｅｌｉｈｏｏｄ）が最大化される。任意の比例ハザードモデルにより推定された共変数の影響が、こうしてハザード比として報告される。Ｃｏｘモデルでは、比例ハザード仮説が成り立つ場合、それはハザード関数を考慮せずにエフェクト・パラメータを推定可能であることを前提としている。
【００８６】
分析プロセスを開発するための適切なデータ解析アルゴリズムとしては、例えば、分類、回帰ツリー（ＣｌａｓｓｉｆｉｃａｔｉｏｎａｎｄＲｅｇｒｅｓｓｉｏｎＴｒｅｅ）（ＣＡＲＴ）およびその変異体の様なツリーベースアルゴリズム、一般化された加算モデル、ペナルティー付き回帰手法の様に、線形、ロジスティック、より柔軟な識別技術を含む判別分析を含有するが、これらに限定されない。
【００８７】
一実施形態では、トレーニング集団から得られたマーカープロファイルへの被験者のマーカープロファイルの比較が行われ、分析プロセスが適用される。分析プロセスは、コンピュータのパターン認識アルゴリズムの様なデータ解析アルゴリズムを使用して構築される。分析プロセスを構築するための他の適切なデータ解析アルゴリズムは、ロジスティック回帰または特徴値の分布の違いを検出するノンパラメトリックなアルゴリズム（例えば、ウィルコクソンの符号順位検定（ＷｉｌｃｏｘｏｎＳｉｇｎｅｄＲａｎｋＴｅｓｔ）（未調整と調整済み））を含むが、これらに限定されない。分析プロセスは、１、２、３、４、５、１０、２０及びそれ以上のマーカーから測定観測量に対応する２、３、４、５、１０、２０及びそれ以上の特徴に基づくことができる。一実施形態では、分析プロセスは、数百以上の特徴に基づいている。分析プロセスは、また、分類ツリーアルゴリズムを使用して構築することもできる。たとえば、トレーニング集団からの各マーカーのプロファイルは、少なくとも３つの特徴を含むことができ、そこでは、特徴が、分類ツリーアルゴリズムの予測因子である。分析プロセスは、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、または約１００％の精度で、集団（またはクラス）内でのメンバーシップを予測する。
【００８８】
適切なデータ解析アルゴリズムは、当該技術分野では知られている。一実施形態では、開示のデータ解析アルゴリズムは、分類と回帰ツリー（ＣｌａｓｓｉｆｉｃａｔｉｏｎａｎｄＲｅｇｒｅｓｓｉｏｎＴｒｅｅ）（ＣＡＲＴ）、多重加法回帰ツリー（ＭｕｌｔｉｐｌｅＡｄｄｉｔｉｖｅＲｅｇｒｅｓｓｉｏｎＴｒｅｅ）（ＭＡＲＴ）、マイクロアレイの予測分析（ＰＡＭ）、またはランダムフォレスト分析で構成されている。このようなアルゴリズムは、対象（被験者）を、正常として、または、特定の疾患状態に特徴的なバイオマーカーレベルを有するとして、判別するために、血液サンプルなどの生体材料から複雑なスペクトルを分類する。他の実施形態では、本開示のデータ解析アルゴリズムは、分散分析（ＡＮＯＶＡ）とノンパラメトリック同等物、線形判別分析、ロジスティック回帰分析、最近傍分類分析（ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｃｌａｓｓｉｆｉｅｒａｎａｌｙｓｉｓ）、ニューラルネットワーク、主成分分析、二次判別分析、回帰分類とサポートベクトルマシン（ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ）で構成されている。そのようなアルゴリズムは、分析プロセスを構築され、および／または分析プロセスのアプリケーションの速度と効率を向上させ、研究者のバイアスを避けるために使用できるかもしれないが、当業者は、コンピュータベースのアルゴリズムが、本開示の方法を実行する必要はないことを認識するだろう。
【００８９】
バイオマーカーのプロファイルを生成するために使用することができるにもかかわらず、分析プロセスは、マーカーのプロファイルを評価するために使用することができる。例えば、適切な分析プロセスは、ガスクロマトグラフィーによって生じるマーカープロファイルや、静的な飛行時間型二次イオン質量分析（ｓｔａｔｉｃｔｉｍｅ−ｏｆ−ｆｌｉｇｈｔｓｅｃｏｎｄａｒｙｉｏｎｍａｓｓｓｐｅｃｔｒｏｍｅｔｒｙ）（ＴＯＦ−ＳＩＭＳ）により得られるスペクトラ、を評価するために使用することができ、ＭＡＬＤＩ−ＴＯＦ−ＭＳスペクトラの解析により、高い確実性（７９−８９％の正しい分類率）で菌株を識別し、複雑な生体サンプル中のバイオマーカープロファイルを分類するために、ＭＡＬＤＩ−ＴＯＦ−ＭＳと液体クロマトグラフィー・エレクトロスプレーイオン化質量分析（ＬＣ／ＥＳＩ−ＭＳ）を使用できる。
【００９０】
本明細書に開示されるマーカーの発現レベルを使用して、分析プロセスを開発するための一つのアプローチは、最近の重心分類（ｔｈｅｎｅａｒｅｓｔｃｅｎｔｒｏｉｄｃｌａｓｓｉｆｉｅｒ）である。このような技術は、各クラス（例えば、健康とかアテローム性動脈硬化症）や、クラス内のマーカーの平均発現レベルによって与えられた重心のために、計算し、その重心に最も近いクラスに新しいサンプルを割り当てる。クラスタが既知のクラスで置き換えられます場合を除き、このアプローチは、ｋ−ｍｅａｎｓクラスタリングと似ている。このアルゴリズムは、マーカーの多数が使用されているとき、ノイズに敏感となり得る。それらが偶然によるものである可能性が高いと判断される場合は、テクニックの１つのエンハンスメントは、シュリンケージ（ｓｈｒｉｎｋａｇｅ）を使用することであり、そこでは、各マーカーに対して、クラスの重心の違いが、ゼロに設定されている。このアプローチは、マイクロアレイ、またはＰＡＭの予測分析に実装されている。シュリンケージ（ｓｈｒｉｎｋａｇｅ）は、差異がノイズとみなされるしきい値下によって制御される。ノイズレベル以上の有意差を示さないマーカーは削除される。しきい値は、相互検証（クロスバリデーション）によって選択することができる。しきい値が減少するにつれて、より多くのマーカーが含まれ、ノイズマーカの結果として、底に到達して、登山を再開する（過剰適合としてしられる現象）まで、推定される分類エラーが減少する。
【００９１】
多重加法回帰ツリー（ＭｕｌｔｉｐｌｅＡｄｄｉｔｉｖｅＲｅｇｒｅｓｓｉｏｎＴｒｅｅ）（ＭＡＲＴ）は、本明細書に開示される方法で使用することができる分析プロセスを構築するための他の方法を表している。ＭＡＲＴのための一般的なアルゴリズムは以下のとおりである。
１．初期化
【数４】

２．ｍ＝１〜Ｍに対し：
（ａ）１＝１，２，・・・、Ｎを計算。
【数５】

（ｂ）末端領域のＲＪＭを与えるターゲットリムへ回帰ツリー（ｒｅｇｒｅｓｓｉｏｎｔｒｅｅ）をフィットさせる。ここで、ｊ＝１、２、．．．Ｊｍである。
（ｃ）ｊ＝１、２、．．．Ｊｍに対して計算する。
【数６】

３．アウトプット。ｆ（ｘ）＝ｆ_Ｍ（ｘ）
【００９２】
特定のアルゴリズムが、さまざまな損失基準Ｌ（ｙ，ｆ（ｘ））の挿入によって、得られる。アルゴリズムの最初のラインは、単に単一のターミナルノードツリー（ａｓｉｎｇｌｅｔｅｒｍｉｎａｌｎｏｄｅｔｒｅｅ）である最適な定数モデルに初期化する。ライン２（ａ）に計算された負の勾配の成分は、一般的な疑似残差、ｒと呼ばれている。一般的に使用される損失関数の勾配は、当技術分野で知られている。ＭＡＲＴの手順に関連付けられているチューニングパラメータは、反復数Ｍと構成するツリーＪ．サブｍ（ｍ＝１、２、・・・、Ｍ）のそれぞれのサイズである。
【００９３】
いくつかの実施形態では、対象（被験者）を分類するために使用される分析プロセスは、回帰分析を用いて構築されている。このような実施形態では、分析プロセスは、回帰分類（ｒｅｇｒｅｓｓｉｏｎｃｌａｓｓｉｆｉｅｒ）、好ましくはロジスティック回帰分類として特徴づけることができる。このような回帰分類は、分類（ｃｌａｓｓｉｆｉｅｒ）を構築するために使用されるマーカー（例えば、そのような各マーカーの発現レベル）の各係数を含む。このような実施形態では、回帰分類の係数は、例えば、最尤法を用いて計算される。このような計算では、バイオマーカーの特徴（例えば、ＲＴ−ＰＣＲ、マイクロアレイデータ）が使用されている。特定の実施形態では、２つだけの形質のサブグループからの分子マーカーデータが使用される（例えば、健康な対象やアテローム性動脈硬化症患者で）と、従属変数は、マーカーのデータが利用可能である被験者の特定の形質の存在の有無である。
【００９４】
別の実施形態では、トレーニング集団は多くの形質のサブグループ（例えば、３つ以上の形質のサブグループ、４つ以上の特定形質のサブグループ、等）から構成されている。これら多くの形質のサブグループは、トレーニング集団での、健康体から、軽度や中程度のアテローム性動脈硬化症等、表現型の進行での個別のステージに対応することができる。この実施形態では、マルチカテゴリの応答を処理するロジスティック回帰モデルの一般化は、トレーニング集団で見つかった、さまざまな形質の任意のサブグループ間を区別する意思決定を開発するために使用することができる。たとえば、選択した分子マーカーの測定データは、トレーニング集団で表される多くの形質のサブグループのいずれかの間を区別することができる分類（ｃｌａｓｓｉｆｉｅｒ）を開発するために、マルチカテゴリーロジットモデルのいずれにも適用することができる。
【００９５】
いくつかの実施形態では、分析プロセスは、回帰モデル、好ましくは、ロジスティック回帰モデルに基づいている。このような回帰モデルでは、本明細書に開示されるマーカーの選択されたセット内のマーカーのそれぞれの係数が含まれている。このような実施形態では、回帰モデルの係数は、例えば、最尤法を用いて計算される。特定の実施形態では、２つのグループ（例えば、健康と病気）の分子マーカーデータが使用され、従属変数は、マーカーの特性データに対応する患者の状態である。
【００９６】
本開示の方法、アッセイおよびキットのいくつかの実施形態は、マルチカテゴリの（多くの部分に分かれた）応答を処理するロジスティック回帰モデルの一般化を提供している。このような実施形態は、１つまたは３つまたはそれ以上の分類に生体を区別するために使用することができる。このような回帰モデルは、同時に全てのカテゴリペアを参照し、他方のカテゴリではなく、ある一方のカテゴリの応答の可能性（ｏｄｄｓ）を記述する、マルチカテゴリのロジットモデルを使用している。モデルカテゴリのある特定の（Ｊ−１）ペアのロジット（ｌｏｇｉｔｓ）を指定したら、残りは不要になる。
【００９７】
線形判別分析（ＬＤＡ）は、特定の客体の特性に基づいて、２つのカテゴリのいずれかに対象を分類しようとする。言い換えれば、実験で測定された客体が寄与しているか否かのＬＤＡテストは、対象の分類（ｃａｔｅｇｏｒｉｚａｔｉｏｎ）を予測する。ＬＤＡは、通常、連続的な独立変数と二分カテゴリ従属変数を必要とする。本開示の方法で使用するために、トレーニング集団のサブセット間のマーカーの選択された一連の式の値が、必要な連続的な独立変数として機能する。トレーニング集団のメンバーのそれぞれのグループの分類は、二分カテゴリ従属変数としての役割を果たす。
【００９８】
ＬＤＡは、グループ情報を使用して、群間分散と群内分散との比を最大にする、変数の線形結合（ｔｈｅｌｉｎｅａｒｃｏｍｂｉｎａｔｉｏｎ）を求める。暗黙のうちに、ＬＤＡで使用される線形重みは、トレーニング・セット全体でのあるマーカーの発現は、両群（例えば、アテローム性動脈硬化症を持つグループ、アテローム性動脈硬化症を持たないグループ）にどの様に分離するか、また、この発現は、他のマーカーの発現とどの様に相関するかに、依存する。いくつかの実施形態では、ＬＤＡは、本開示に記載された遺伝子の組合せ中、Ｋ個の遺伝子によって、トレーニングサンプルのＮ数のメンバーのデータマトリックスに適用される。その後、トレーニング集団の各メンバーの線形判別式（ｄｉｓｃｒｉｍｉｎａｎｔ）が、プロットされる。理想的には、第１のサブグループ（アテローム性動脈硬化症を持たない被験者など）を表すトレーニング集団のそれらのメンバーは、線形判別値（例えば、負の値）の第１の範囲にクラスタし、第２のサブグループ（アテローム性動脈硬化症を持つ被験者など）を表すトレーニング集団のそれらのメンバーは、線形判別値（例えば、正の値）の第２の範囲にクラスタするだろう。判別値のクラスタ間の分離が大きい場合には、ＬＤＡは、より成功したとみなされる。
【００９９】
二次判別分析（ＱＤＡ）は、ＬＤＡと同じ入力パラメータを受け取り、同じ結果を返す。ＱＤＡは、結果を生成するために、線形方程式ではなく、二次方程式を使用している。ＬＤＡとＱＤＡは、（要求される対象数に関連した違いがあるが）ほぼ互換性があり、かつ、使用するかは、好み、および／または分析をサポートするためのソフトウェアの可用性の、問題である。ロジスティック回帰は、ＬＤＡとＱＤＡと同じ入力パラメータを受け取り、同じ結果を返す。
【０１００】
本明細書で同定されたマーカーの発現レベルを用いて構築することができる分析プロセスの一つのタイプは、決定ツリー（ｄｅｃｉｓｉｏｎｔｒｅｅ）である。ここで、「データ解析アルゴリズム」は、最終「決定ツリー」が、分析プロセスであるのに対し、分析プロセスを構築することができる任意のテクニックである。分析プロセスは、トレーニング集団と、特定のデータ解析アルゴリズムとを使用して、構築される。ツリーベースの方法は、特徴空間を四角形のセットに分かち、その後、あるモデル（定数など）をそれぞれ１つに適合させる。
【０１０１】
トレーニング集団のデータは、トレーニングのセット集団全体のマーカーのための特徴（例えば、発現値、または他のいくつかの観察可能なもの）を含む。分析プロセスを構築するために使用することができる、ある特定のアルゴリズムは、分類・回帰ツリー（ＣＡＲＴ）である。他の特定の決定ツリーアルゴリズム（ｄｅｃｉｓｉｏｎｔｒｅｅａｌｇｏｒｉｔｈｍｓ）は、ＩＤ３、Ｃ４．５、ＭＡＲＴ、及びランダム森林を含むが、これらに限定されない。すべてのそのようなアルゴリズムは、当技術分野で公知である。
【０１０２】
本開示の方法、アッセイおよびキットのいくつかの実施形態では、決定ツリー（ｄｅｃｉｓｉｏｎｔｒｅｅｓ）は、マーカーの選択されたセットのための発現データを用いて患者を分類するために使用される。決定ツリーアルゴリズムは、監督下にある学習アルゴリズムのクラスに属する。決定ツリーの目的は、実世界の実施例データから分析プロセス（ツリー）を誘導することである。このツリーは、決定ツリーを導き出すために使用されていない、目に見えないサンプルを分類するために、使用することができる。
【０１０３】
決定ツリー（ｄｅｃｉｓｉｏｎｔｒｅｅ）はトレーニングデータから導出される。ある例は、様々な属性に対する値と、その例がどのクラスに属するかを、含んでいる。一実施形態では、トレーニングデータは、トレーニング集団全体に亘って本明細書に記載のマーカーの組合せに対する、発現データである。
【０１０４】
次のアルゴリズムは、決定ツリーの導出について説明している。
ツリー（事例、クラス、属性）。
ルートノード（ｒｏｏｔｎｏｄｅ）を作成する。
すべての事例で、同じクラス値を使用している場合は、ルートにこのラベルを与える。
でなければ、属性が空の場合は、最も一般的な値に基づいてルートにラベルを付ける。
でなければ、開始する。
各属性の情報利得を計算する。
最高情報利得を持つ属性Ａを選択し、このルートの属性を作る。
この属性の各々の値ｖのために
Ａ＝ｖに対応して、ルートの下に新しい枝（ブランチ）を追加する。
事例（ｖ）は、Ａ＝ｖの事例とする。
事例（ｖ）が空の場合、新しい枝に、複数の事例の中で最も一般的な値で標識されたリーフノードを作る。
でなければ、この新しい枝は、ツリー（事例（ｖ）、クラス、属性｛Ａ｝）によって作成されたツリーとする。
終了。
【０１０５】
情報利得（ｉｎｆｏｒｍａｔｉｏｎｇａｉｎ）の計算の詳細については、以下に示されている。事例の有り得べきクラスｖｉが、確率Ｐ（ｖｉ）を持つ場合、実際の答えの情報コンテンツＩは次式で与えられる：
【数７】

Ｉ値は、使用される特定のデータセットの分類の結果を記述できるようにするためには、情報がどの程度必要であるかを示している。仮に、データセットが、ｐポジティブ（例えば、アテローム性動脈硬化症を持っている）や、ｎネガティブ（例えば、健康）の事例（例えば、個人）を含むと仮定すると、正解に含まれる情報は以下の通りである：
【数８】

ここで、ｌｏｇ_２は、ベース２を使用する対数である。単一の属性をテストすることによって、正しい分類を行うために必要な情報量を減らすことができる。ある特定の属性Ａ（例えば、マーカー）の残りの部分は、必要とされる情報をどの位減らすことができるかを示している。
【数９】

ここで「ｖ」は、特定のデータセットにおける、属性Ａに固有な属性値の数である。
「ｉ」は、ある特定の属性値である。「ｐ_ｉ」は、分類が正（ポジティブ）（例えば、アテローム性動脈硬化症）である、属性Ａの事例数である。「ｎ_ｉ」は、分類が負（ネガティブ）（例えば、健康）である、属性Ａの事例の数である。
【０１０６】
特定の属性Ａの情報利得（ｉｎｆｏｒｍａｔｉｏｎｇａｉｎ）は、属性Ａの特定クラスと属性Ａの残りのものとの情報量の差として計算される。
【数１０】

情報利得は、異なる複数の属性（どの様にうまく複数の事例を分割するか）、そして最高の情報を有する属性は、分類のためにどの程度重要かを評価するために使用される。
【０１０７】
分類・回帰ツリー（ＣＡＲＴ）、多変量の決定ツリー、ＩＤ３及びＣ４．５を含み、これらに限定されないが、一般的に、沢山の様々な決定ツリーアルゴリズムが、存在する。
【０１０８】
一実施形態では、決定ツリーを用いた場合には、トレーニング集団全体のある選択されたマーカーセットのための発現データは、平均ゼロ、単位分散（ｕｎｉｔｖａｒｉａｎｃｅ）を持つことが標準化されている。トレーニング集団のメンバーは、ランダムに、トレーニングセットとテストセットに分割される。例えば、一実施形態では、トレーニング集団のメンバーの３分の２は、トレーニング・セットに配置され、トレーニング集団のメンバーの３分の１は、テストセットに配置される。本明細書中に記載のマーカーの選択・組合せのための発現値は、分析プロセスを構築するために使用されている。その後、テスト・セットのメンバーを正しく分類するための、分類プロセスの能力が、決定される。いくつかの実施形態では、この計算は、ある与えられたマーカーの組合せで複数回実行される。各々の計算の繰り返しにおいて、トレーニング集団のメンバーは、ランダムにトレーニングセットとテストセットに割り当てられる。その後、分子マーカーの組合せの品質が、分析プロセス計算の個々のそのような反復の平均値として取り扱われる。
【０１０９】
分割が、本明細書に開示マーカーのセットの中で対応するマーカーの発現レベル、または２つのその様なマーカーの発現レベルに基づいている、一変量の決定ツリーに加えて、多変量の決定ツリーを、分析プロセスとして実装することができる。このような多変量の決定ツリーでは、意思決定の一部またはすべては、実際には、マーカーの複数の発現レベルの線形結合で構成されている。このような線形結合は、分類上の勾配降下（ｇｒａｄｉｅｎｔｄｅｓｃｅｎｔ）などの公知の技法や、二乗和誤差基準（ｓｕｍ−ｓｑｕａｒｅｄ−ｅｒｒｏｒｃｒｉｔｅｒｉｏｎ）を用いて訓練することができる。
【０１１０】
このような分析プロセスを説明するために、式：０．０４ｘ_１＋０．１６ｘ_２＜５００を考えてみよう。ここでは、ｘ_１とｘ_２は、本明細書に開示のマーカーの中から、二つの異なるマーカーの２つの異なる特徴を、参照している。分析プロセスを調査する（ｐｏｌｌ）ために、特徴ｘ_１とｘ_２の値は、分類されていない被験体から得られた測定値から取得される。これらの値は、式に挿入される。５００未満の値が計算されている場合は、意思決定ツリー（決定ツリー）の最初の分岐（ブランチ）が取られる。それ以外の場合は、意思決定ツリーの２番目のブランチが取得される。
【０１１１】
本開示で使用可能なもう一つのアプローチは、多変量適応型回帰スプライン（ＭＡＲＳ）である。ＭＡＲＳは、回帰の適応手順で、本明細書に開示される方法によって処理される高次元の問題によく適している。ＭＡＲＳは、段階的な線形回帰の一般化、または、回帰の設定でＣＡＲＴのパフォーマンスを向上させるためのＣＡＲＴ法の修正、とみなすことができる。
【０１１２】
いくつかの実施形態では、マーカーの選択されたセットのための発現値は、トレーニングセットをクラスタするために使用される。たとえば、１０個のマーカーが使用されている場合を考える。トレーニング集団の各メンバｍは１０個のマーカーのそれぞれの発現値を持つ。トレーニング集団のあるメンバーｍからのそのような値は、ベクトルを定義する。

ｘ_１ｍｘ_２ｍｘ_３ｍｘ_４ｍｘ_５ｍｘ_６ｍｘ_７ｍｘ_８ｍｘ_９ｍｘ_１０ｍ

ここで、ｘ_ｉｍは、被検体ｍのｉ番目のマーカーの発現レベルである。トレーニングセットにｍの生物が存在する場合、ｉマーカーの選択は、ｍのベクトルを定義する。本明細書に開示される方法は、ベクトルで使用するすべての単一マーカーの発現値はすべての単一ベクトルｍで表されることを必要としないことに注意されたい。言い換えれば、ｉ番目のマーカーのいずれかが見つからない被検体（対象）からのデータでも、まだクラスタリングに使用することができる。このような場合には、ミスしている発現値が、「ゼロ」または他の基準化された値が割り当てられている。いくつかの実施形態では、クラスタリングの前に、発現値の式の値がゼロと、単位分散の平均値を持つように基準化されている。
【０１１３】
トレーニング集団全体で同様の発現パターンを示すトレーニング集団のそれらのメンバーは、一緒にクラスタする傾向がある。マーカーの特定の組み合わせは、ベクトルがトレーニング集団に見られる形質群にクラスタ化するときに、本明細書に開示される方法のこの局面では良い分類指標であると考えられている。例えば、トレーニング集団が、健康な対象やアテローム性動脈硬化症患者を含む場合、クラスタリングの分類指標は、その集団を、健康な対象とアテローム性動脈硬化症患者のいずれかをそれぞれ一意的に表す、２つのグループにクラスタ化するだろう。
【０１１４】
クラスタリングの問題は、データセット内のナチュラルなグループを見つけることの一つとして記載されている。ナチュラルなグループを識別するために、２つの問題点が扱われる。まず、２つのサンプル間の類似度（または非類似度）を測定する方法が決定される。このメトリック（類似度測定）は、１つのクラスタ内のサンプル同士は、他のクラスタ内のサンプルに対してよりも互いに似ていることを確認するために使用される。第二に、類似性の尺度を使用して各クラスタにデータを分割するためのメカニズムが決定される。
【０１１５】
クラスタリング調査を開始する一つの方法は、距離関数を定義し、データセット内のサンプルのすべてのペア間の距離の行列を計算することである。距離が類似性の良い指標である場合は、同じクラスタ内のサンプル間の距離は、異なるクラスタ内のサンプル間の距離よりも大幅に少ない。しかし、クラスタリングは、距離メトリックを使用する必要はない。たとえば、ノンメトリックな類似度関数ｓ（ｘ，ｘ’）は、２つのベクトルｘとｘ’を比較するために使用することができる。従来、ｓ（ｘ，ｘ’）は、ｘとｘ’が幾分「類似」している場合にその値が大きい、対称関数（ｓｙｍｍｅｔｒｉｃｆｕｎｃｔｉｏｎ）である。
【０１１６】
データセット内のポイント間の「類似性」または「類似度」を測定するための方法が選択された後、クラスタリングは、データの任意のパーティションのクラスタリング品質を測定する、評価関数を必要とする。評価関数を極端化する（ｅｘｔｒｅｍｉｚｅ）データセットのパーティションは、データをクラスタ化するのに使用される。しかしながら、本明細書に開示の方法で使用できる特定の例示的なクラスタリング技術は、以下に限定はされないが、階層的クラスタリング（最近傍アルゴリズム（ｎｅａｒｅｓｔ−ｎｅｉｇｈｂｏｒａｌｇｏｒｉｔｈｍ）を用いた凝集クラスタリング（ａｇｇｌｏｍｅｒａｔｉｖｅｃｌｕｓｔｅｒｉｎｇ）、最遠傍アルゴリズム（ｆａｒｔｈｅｓｔ−ｎｅｉｇｈｂｏｒａｌｇｏｒｉｔｈｍ）、平均連鎖アルゴリズム、重心アルゴリズム、または二乗和（平方和）アルゴリズム（ｓｕｍ−ｏｆ−ｓｑｕａｒｅｓａｌｇｏｒｉｔｈｍ））、Ｋ平均法（ｋ−ｍｅａｎｓｃｌｕｓｔｅｒｉｎｇ）、ファジィＫ平均法アルゴリズム（ｆｕｚｚｙｋ−ｍｅａｎｓｃｌｕｓｔｅｒｉｎｇａｌｇｏｒｉｔｈｍ）、及び、ジャーヴィス・パトリック・クラスタリング（Ｊａｒｖｉｓ−Ｐａｔｒｉｃｋｃｌｕｓｔｅｒｉｎｇ）を含有する。
【０１１７】
主成分分析（ＰＣＡ）は、バイオマーカーデータを分析することを提案している。より一般的には、ＰＣＡは、患者の１クラスとその他（例えば、アテローム性動脈硬化症を持っている人とそうでない人）とを判別する分析プロセスを構築するために、本明細書に開示されるマーカーの特徴値のデータを分析するために使用することができる。主成分分析は、データの特徴を要約し、データを、その変数（主成分）の新しいセットに変換することによって、データセットの次元数を削減するための、古典的な手法である。
【０１１８】
ＰＣＡのいくつかの非限定的な例は次のとおりである。主要なコンポーネント（ＰＣ）に相関が無く、ｋ番目のＰＣは、ＰＣの中でｋ番目の最大分散を有するように順序付けされる。ｋ番目のＰＣは、最初のｋ−１のＰＣに直交するデータポイントの予測の変動を最大限に高める方向として解釈することができる。最初のいくつかのＰＣは、データセット内の変動の大部分をキャプチャする。対照的に、最後のいくつかのＰＣは、データ内の残りの「ノイズ」のみをキャプチャするために度々仮定される。
【０１１９】
ＰＣＡはまた、本明細書に開示されているように分析プロセスを作成するために使用することができる。そのようなアプローチでは、マーカーの選択セットのためのベクトルは、クラスタリングのために説明したのと同じ方法で構築することができる。実際には、ベクトルのセットは、各ベクトルが、トレーニング集団の特定メンバーからの選択マーカーの発現値を表す、ある行列（ｍａｔｒｉｘ）で表すことができる。いくつかの実施形態では、このマトリックスは、モノマーの定性バイナリ記述のフリー・ウィルソン法（Ｆｒｅｅ−Ｗｉｌｓｏｎｍｅｔｈｏｄ）で表され、第１主成分（ＰＣ）が、可能な分散情報の最大量をキャプチャし、第２主成分（ＰＣ）が、すべての分散情報の二番目の最大量をキャプチャして、マトリックス内のすべての分散情報が占められるまで、ＰＣＡを使用して最大限に圧縮された空間に分布される。
【０１２０】
次に、ベクトル（各ベクトルは、トレーニング集団のメンバーを表す）の各々は、プロットされる。多くの異なる種類のプロットが可能である。いくつかの実施形態では、一次元のプロットが行われる。プロットのこの形式では、予想（ｔｈｅｅｘｐｅｃｔａｔｉｏｎ）は、最初のグループ（例えば、健康な対象）のメンバーが、第１主成分の値の１つの範囲にクラスタし、第２のグループ（例えば、アテローム性動脈硬化症患者）のメンバーが、第１主成分の値の２番目の範囲にクラスタするだろう（当業者は、マーカー値の分布は、これが有効であるためにいかなる変数も伸長がないことを示す必要があることを、理解されよう。）。
【０１２１】
一例では、トレーニング集団は、２つのグループ：健康な対象とアテローム性動脈硬化症の患者：で構成されている。第１主成分は、トレーニング集団のデータセット全体にわたって、選択マーカーのマーカー発現値を使用して、計算される。その後、トレーニングセットの各メンバーは、第１主成分の値の関数としてプロットされる。この例では、第１主成分が正であるトレーニング集団のそれらのメンバーは、健康な対象者であり、第１主成分が負であるトレーニング集団のそれらのメンバーは、アテローム性動脈硬化症患者である。
【０１２２】
いくつかの実施形態では、トレーニング集団のメンバーは、複数の主成分に対してプロットされている。たとえば、いくつかの実施形態では、トレーニング集団のメンバーは、第１の次元が第１の主要成分（ｐｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｎｔ）であり、第２の次元は、第２の主成分である、２次元プロット上にプロットされる。そのような二次元プロットでは、予想（ｔｈｅｅｘｐｅｃｔａｔｉｏｎ）は、トレーニング集団で表される各々のサブグループのメンバーが、個別のグループにクラスタすることである。たとえば、２次元プロットのメンバーの第１のクラスタは、軽度のアテローム性動脈硬化症を有する被験者を表し、２次元プロットのメンバーの第２のクラスタは、中等度のアテローム性動脈硬化症を有する被験者を表す、などである。
【０１２３】
いくつかの実施形態では、トレーニング集団のメンバーは、２つ以上の主成分に対してプロットフされており、トレーニング集団のメンバーが、それぞれがトレーニング集団で見つかったサブグループをユニークに表す複数のグループにクラスタリングされているかどうか、判定される。いくつかの実施形態では、主成分分析は、当業者に公知の、Ｒｍｖａパッケージ（統計解析言語）を使用して実行される。
【０１２４】
最近傍分類指標（Ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｃｌａｓｓｉｆｉｅｒｓ）は、メモリベースのものであり、適合モデルは必要ない。クエリポイント（ｑｕｅｒｙｐｏｉｎｔ）ｘ_０を考えると、ｋトレーニングポイントｘ_（ｒ）、ｘ_０までの距離が最も近いｒ・・・ｋが識別され、その後、ポイントｘ_０は、ｋ最近傍を使用して分類される。結合はランダムに分けることができる。いくつかの実施形態では、特徴空間におけるユークリッド距離は、以下のように距離を決定するために使用される。

ｄ_（ｒ）＝||ｘ_（ｒ）−ｘ_（０）||
【０１２５】
一般的に、最近傍アルゴリズムを使用する場合は、線形判別式を計算するのに使われる発現データは、平均がゼロで分散が１であるよう標準化されている。本開示の方法については、トレーニング集団のメンバーは、ランダムに、トレーニングセットとテストセットに分割される。例えば、一実施形態では、トレーニング集団のメンバーの３分の２は、トレーニング・セットに配置され、トレーニング集団のメンバーの３分の１は、テストセットに配置される。本明細書に開示されるマーカーの選択されたセットのプロファイルは、テスト・セットのメンバーがプロットされている特徴空間を表している。次に、テスト・セットのメンバーを正しく特徴づけるためのトレーニングセットの能力が計算される。いくつかの実施形態では、最近傍計算（ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｃｏｍｐｕｔａｔｉｏｎ）は、マーカーのある特定の組合せで複数回実行される。計算の各繰り返しで、トレーニング集団のメンバーは、ランダムにトレーニングセットとテストセットに割り当てられる。その後、マーカーの組み合わせの品質が、最近傍計算（ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｃｏｍｐｕｔａｔｉｏｎ）の各繰り返しの平均値として扱われる。
【０１２６】
最近傍ルールは、不平等クラスの事前確率、差動の誤分類コスト、特徴選択の問題に対処するために改良することができる。これらの改良の多くは、近傍の加重投票のいくつかのフォームを含んでいる。
【０１２７】
生物進化の過程に触発され、分類指標の設計の進化的な方法は、分析プロセスのための確率的探索を採用している。概観では、このような方法は、本明細書に開示されたデータセットを生成するバイオマーカーのようなものの測定から、いくつかの集団分析プロセスを作成する。各分析プロセスは、他から多少異なる。次に、分析のプロセスは、トレーニングデータセット全体のデータに記録される。生物進化とのアナロジーを維持するために、得られた（スカラー）のスコアは、時々フィットネス（適応）と呼ばれている。分析プロセスは、そのスコアに基づいてランク付けされ、最良の分析プロセスは、（分析プロセスの総集団のある部分）保持される。再び、生物学的な用語に合わせて、これは適者生存と呼ばれている。分析プロセスは、確率的に次の世代の子供や子孫で変更される。いくつかの子孫の分析プロセスは、前の世代の親よりも高いスコアを持っているが、いくつかは低いスコアを持っている。全体的なプロセスは、その後の世代のために繰り返される。つまり、分析プロセスがスコアリングされて、ベストのものが保持され、別の世代へ与えるためにランダムに変更される。部分的には、ランキングが故に、各世代が、平均して以前のものよりわずかに高いスコアを有する。プロセスは、ある世代内の単一の最良の分析プロセスが、所望の基準値を超えるスコアを持つ場合、停止される。
【０１２８】
バギング、ブスティング、ランダム部分空間法、及び付加的ツリーは、脆弱な分析プロセスを改善するために使用することができる技術の組合せとして知られている、データ解析のアルゴリズムである。これらの技術は、前に述べた意思決定ツリーのような決定ツリーのために設計され、通常、適用される。さらに、このような技術はまた、線形判別分析のような他のタイプのデータ解析アルゴリズムを使用して開発された分析プロセスにも有用である。
【０１２９】
バギングにおいて、トレーニングデータセットを試し、ランダムな独立したブートストラップを生成、複製し、これらの各々の分析プロセスを構築し、最終的な分析プロセスの単純多数決によってそれらを集約する。ブースティングでは、分析プロセスは、以前の分析プロセスの結果に依存するトレーニング・セットの重み付けのバージョン上に構築される。最初に、すべてのオブジェクトが等しい重みを持っており、最初の分析プロセスは、このデータセット上に構築される。次に、重みは、分析プロセスのパフォーマンスに応じて変更される。誤って分類されたオブジェクトは、より大きな重みを取得し、次の分析プロセスは、再重み付けされた（ｒｅｗｅｉｇｈｔ）トレーニングセットにブースト（ｂｏｏｓｔ）される。このように、一連のトレーニングセットと分類が、単純な多数決によって、または最終決定での加重多数決によって結合され、取得される。
【０１３０】
ブースティングを説明するために、研究下の集団によって示された２つの表現型のグループ、表現型１（例えば、予後不良の患者）、および表現型２（例えば、予後良好の患者）が存在する場合を考える。分子マーカーＸのベクトルを考えると、分類Ｇ（Ｘ）は、上記２つの値のセット：｛表現型１、表現型２｝でのタイプ値のいずれか１つを取って予測を生成する。トレーニングサンプルのエラー率は以下で、
【数１１】

ここで、Ｎはトレーニングセットでの被験者の数（表現型１または２のいずれかの表現型を持つ被験者の合計）である。例えば、３５人の健康者と４６人の（アテローム性動脈）硬化症の患者が存在する場合、Ｎは８１である。
【０１３１】
弱い分析プロセスは、そのエラー率が、ランダム推測よりわずかに優れているに過ぎないものである。ブースティングのアルゴリズムでは、弱い分析プロセスを、繰り返し、データの修正バージョンに適用し、これにより、一連の弱い分類指標Ｇ_ｍ（ｘ）、ｍ＝１、２、・・・、Ｍ．のシーケンスを生成する。このシーケンスの分類のすべての予測は、最終的な予測を生成するために加重多数決を介して結合される：
【数１２】

１．観察加重ｗ_ｉ＝１／Ｎ、ｉ＝１，２，．．．，Ｎを初期化
２．ｍ＝１からＭ、に対して：
（ａ）分析プロセスＧ_ｍ（ｘ）を、重みｗ_ｉを使用するトレーニングセットへ適合
（ｂ）計算
【数１３】

（ｃ）計算ａ_ｍ＝ｌｏｇ（（１−ｅｒｒ_ｍ／ｅｒｒ_ｍ）
（ｄ）ｗ_ｉをセット ⇔ ｗ_ｉｅｘｐ［α_ｍＩ（ｙ_ｉ≠Ｇ_ｍ（Ｘ_ｉ））］，ｉ＝１，２，・・・・，Ｎ３．アウトプット
【０１３２】
ここでａ_１，ａ_２，．．．．，ａ_ｍは、ブースティング・アルゴリズムによって計算され、その目的は、それぞれのＧ_ｍ（ｘ）の寄与を比較検討することである。その効果は、シーケンス内のより正確な分類に高い影響を与えることである。
【０１３３】
各ブースティング段階でのデータ変更は、重みｗｉ，ｗ２，．．．，ｗ_ｎを、各トレーニング観察結果（ｘ_ｉ，ｙ_ｉ），ｉ＝１，２，．．．，Ｎのそれぞれに適用することから構成されている。最初に、すべてのウェイトは、Ｗ_ｉ＝１／Ｎにセットされ、その結果、最初のステップは、単に通常の方法でデータでの分析プロセスを養成する。それぞれの連続した反復ｍ＝２，３，．．．，Ｍのために、観察結果加重は個別に変更され、分析プロセスは、加重された観察結果（ｏｂｓｅｒｖａｔｉｏｎ）に再適用される。幹ｍで、前のステップで誘導される分析プロセスＧ_ｍ−１（ｘ）で誤って分類されたとの観察結果は、それらの加重は増加し、一方、正しく分類された観察結果は、その加重は減少する。反復が進むにつれてこのように、正しく分類するのが困難な観察結果は、増え続ける影響を享受する。それぞれの連続した分析プロセスは、それによってそのシーケンスの前の時に見逃されているトレーニング観測結果に集中するように強制される。
【０１３４】
典型的なブースティングアルゴリズムは以下のとおり：
１．観察加重ｗ_ｉ＝１／Ｎ、ｉ＝１，２，．．．，Ｎを初期化
２．ｍ＝１〜Ｍ、に対して：
（ａ）分析プロセスＧ_ｍ（ｘ）を、重みｗ_ｉを使用するトレーニング・セットへ適合
（ｂ）計算
【数１４】

（ｃ）計算ａ_ｍ＝ｌｏｇ（（１−ｅｒｒ_ｍ／ｅｒｒ_ｍ）
（ｄ）ｗ_ｉをセット：ｗｉｅｘｐ［α_ｍＩ（ｙ_ｉ≠Ｇ_ｍ（Ｘ_ｉ））］，ｉ＝１，２，・・・・，Ｎ
３．アウトプット
【数１５】

【０１３５】
アルゴリズムｍで、現在の分類指標Ｇ_ｍ（ｘ）は、ライン２ａで加重観察に誘導される。結果の重み付き誤差率は、ライン２ｂで計算される。ライン２ｃは、最終的な分類ＧＭ（ライン３）の生成で、Ｇ_ｍ（ｘ）に与えられる重みａ_ｍを計算する。それぞれの観察の個々の重みは、ライン２ｄでの次の反復のために更新される。Ｇ_ｍ（ｘ）によって誤って分類された観察結果は、シーケンスでの次の分類Ｇ_ｍ＋ｌ（ｘ）を誘導するための相対的な影響力を増加させる因子ｅｘｐ（α_ｍ）によって、その重みがスケーリングされている。いくつかの実施形態では、ブースティングまたは適応ブースティング方法が使用されている。
【０１３６】
いくつかの実施形態では、特徴の事前選択は、ノンパラメトリック・スコアリング方法の様な技術を使用して実行される。特徴の事前選択は、分類指標に使用されるために選択されるマーカーが、分類間でベストなものを識別する、二次元的削減の一形式です。その後、ロジット・ブースト（ＬｏｇｉｔＢｏｏｓｔ）手法は、ブースティング手順よりむしろ、使用されている。いくつかの実施形態では、ブースティングおよび他の分類方法が、開示された方法で使用されている。
【０１３７】
ランダム部分空間法では、分類指標は、データ特徴空間のランダム部分空間で構築されている。これらの分類指標は、通常、最終決定ルールで単純過半数の議決権によって結合される（すなわち、分析プロセスで）。
【０１３８】
示されているように、本明細書に記載の統計的手法は、データセットに含めるべき好ましいマーカーグループを同定するために使用でき、そのデータセットを使用して結果を生成するために使用できる分析プロセスを生成するために、使用できる、アルゴリズムやモデルの種類の例を単に示しているに過ぎない。また、上記や別の場所で説明した技法の組み合わせは、同じタスクのため、あるいは異なるタスクのためのいずれにも使用できる。決定ツリーとブースティングの組合せの使用の様な、いくつかの組合を、記載している。しかし、他の多くの組み合わせが可能である。例によって、射影追跡（ＰｒｏｊｅｃｔｉｏｎＰｕｒｓｕｉｔ）と重み付き多数決（ＷｅｉｇｈｔｅｄＶｏｔｉｎｇ）の様な、技術上の他の統計的手法は、データセットに含めると、マーカーの優先グループを識別するために使用することができ、また、そのデータセットを使用して結果を生成するために使用できる分析プロセスを生成するために使用することができる。
【０１３９】
分析プロセスで評価されるべきデータセットコンポーネントの最適な数を決定することができる。ある予測モデルを開発するために、上記の学習アルゴリズムを使用した場合、当業者は、分析プロセスを定義するために、マーカーのサブセットを、すなわち、少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、マーカーの完全なセットとなるまで、選択することができる。通常、マーカーのサブセットは、精度の高い予測モデルを維持しながら、例えば、試薬の有用性、定量等の利便性等、定量的なサンプル分析のニーズに合わせて用意されて選択される。
【０１４０】
分類モデル構築のための、多くの有益なマーカーの選択は、パフォーマンス・メトリックの定義と、このメトリックに基づいた有用な予測能力を持つモデルを生成するためのユーザー定義しきい値（ａｕｓｅｒ−ｄｅｆｉｎｅｄｔｈｒｅｓｈｏｌｄ）とを、必要とする。たとえば、パフォーマンス・メトリックは、ＡＵＣ、予測性の感度および／または特異性と同様に、予測モデルの全体的な精度である。
【０１４１】
あるモデルの予測能力は、例えば、特定の値や値の範囲のＡＵＣまたは正確さなど、品質メトリックを提供する能力に基づいて評価することができる。いくつかの実施形態では、所望の品質のしきい値は、少なくとも約０．７、少なくとも約０．７５、少なくとも約０．８、少なくとも約０．８５、少なくとも約０．９、少なくとも約０．９５、またはそれ以上の精度で、サンプルを分類する予測モデルである。代替措置として、所望の品質のしきい値は、少なくとも約０．７、少なくとも約０．７５、少なくとも約０．８、少なくとも約０．８５、少なくとも約０．９、またはそれ以上の精度で、あるＡＵＣでサンプルを分類する予測モデルである。
【０１４２】
当技術分野で知られているように、予測モデルの相対的な感度と特異度は、互いに反比例の関係を持つ、選択性メトリックまたは感受性メトリックのいずれかを、優先するように「調整」することができる。上記のようにモデルでの制限は、実行されるテストの特定の要件に応じて、選択した感度や特異性のレベルを提供するために調整することができる。感度と特異性のいずれかまたは両方は少なくとも約０．７、少なくとも約０．７５、少なくとも約０．８、少なくとも約０．８５、少なくとも約０．９、またはそれ以上とすることができる。
【０１４３】
様々な方法がトレーニングモデルで使用されている。マーカーのサブセットの選択は、マーカーのサブセットの順方向選択、または逆方向選択を経由するかもしれない。選択されるマーカーの数は、すべてのマーカーを使用しなくても、モデルのパフォーマンスを最適化する数である。用語の最適な数を定義する一つの方法は、ある与えられたアルゴリズムのために使用される用語の任意の組み合わせと数を使用して、このメトリックのために得られた最大値から１標準誤差以下の範囲にある、所望の予測能力（例えば、ＡＵＣ＞０．７５、または感度／特異性の同等の測定）を持つモデルを生成するいくつかの用語を選択することである。
【０１４４】
上述したように、データセットのコンポーネントの定量的データは、分析プロセスに入力され、結果を生成するために使用されている。この結果は、例えば、分類、連続的な変数、またはベクトルといった、アテローム性動脈硬化症の分類を行うために有用な、任意のタイプの情報であり得る。例えば、連続変数またはベクトルの値は、あるサンプルが特定の分類に関連付けられる可能性（ｔｈｅｌｉｋｅｌｉｈｏｏｄ）を決定するために使用されることがある。
【０１４５】
アテローム性動脈硬化症の分類は、あらゆるタイプの情報またはアテローム性動脈硬化症状態に関連付けられた任意の種類の情報の生成を参照する。例えば、診断、ステージング、アテローム性動脈硬化進行の評価範囲、予後、モニタリング、処置に対する治療的反応、既知のアテローム性動脈硬化症の治療と同様のメカニズムを介して作用する化合物を同定するためのスクリーニング、擬似冠動脈カルシウムスコアの予測、安定（すなわち、心筋梗塞）か不安定（すなわち、狭心症）か、アテローム性動脈硬化症の合併症の識別などである。
【０１４６】
好ましい実施形態では、結果は、アテローム性動脈硬化症発生の診断や、検出のために使用され、その様なアテローム性動脈硬化症は、特に、心筋梗塞、心不全などの傾向の指標となる。この実施形態では、「健康」と「アテローム性動脈硬化症」のサンプルを含む基準またはトレーニングセットが、予測モデルを開発するために使用されている。データセットは、好ましくは、アテローム性動脈硬化症を示すマーカーのタンパク質発現レベルを含み、結果を生成するために、予測モデルに入力される。その結果、「健康」または「アテローム性動脈硬化症」のいずれかとしてサンプルを分類することができる。他の実施形態では、結果は、サンプルを分類するための有用な情報を提供する連続的な変数であり、例えば、高値は「アテローム性動脈硬化症」のサンプルである確率が高いことを示し、低値は「健康」のサンプルであることの確率が低いことを示す。
【０１４７】
他の実施形態では、結果は、アテローム性動脈硬化症のステージ分類のために使用される。この実施形態では、さまざまなステージで疾患を持つ個人からのサンプルを含む基準またはトレーニングデータセットが、予測モデルを開発するために使用される。モデルは、既知のステージの病気のサンプルや、１つまたは複数のデータセットに対する個々のデータセットの単純な比較であり得るし、より複雑な多変量分類モデルでもあり得る。特定の実施形態では、モデルにデータセットを入力することは、データセットが、指定された心血管疾患のステージであるものとして生成されるから、サンプルの分類結果を生成する。同様のメソッドは、参照（基準）セットまたはトレーニングセットが、病気に進展し、後に病気に進展しなかった個々人から得られたデータを含む場合を除いて、アテローム性動脈硬化症の予後を提供するために使用することができる。
【０１４８】
他の実施形態では、結果は、アテローム性動脈硬化症の治療への応答を決定するために使用される。この実施形態では、参照（基準）データセットまたはトレーニングデータセットと予測モデルは、アテローム性動脈硬化症（疾患を有する患者と、疾患を有さない個人からのサンプル）を診断するために使用されるものと同じである。しかし、診断不明とされた個人からのサンプルで構成されるデータセットを入力する代わりに、データセットは、特定の治療が施されている既知の疾患を持つ個々人で構成され、サンプルが、「正常・健康の分類」対「アテローム性動脈硬化症の分類」の傾向があるか、その範囲内に置かれているかが、決定される。
【０１４９】
本明細書中で使用される様に、治療は、制限なしに、３，６，又は１２ヶ月後のフォローアップ検診を含めることができ、例えば、それは、β遮断薬、カルシウムチャネル遮断薬、アスピリン、コレステロール低下剤、等の薬理学的介入、および／または心血管疾患／状況の存在または程度を決定するためのさらなるテストなどである。特定の例では、即時の治療は必要ない。
【０１５０】
別の実施形態では、結果は、薬剤スクリーニング、すなわち、既知のアテローム性動脈硬化症の薬物治療と同様のメカニズムを介して作用する化合物を識別するのに、使用される。この実施形態では、既知のアテローム性動脈硬化症の薬物治療を受けた個人や、特定の治療を受けていない個人を含む基準またはトレーニングセットは、予測モデルの開発に使用することができる。未知のメカニズムを持つ化合物で処理された個人からのデータセットは、モデルに入力される。結果が、サンプルは、既知のアテローム性動脈硬化症の薬物治療で投与された対象から来たものとして分類することができることを示している場合は、新しい化合物は、同じメカニズムを介して作用する可能性がある。
【０１５１】
好ましい実施形態では、結果は冠動脈カルシウムスコア（ＣＣＳ）に相関する定量的な尺度である、「擬似冠動脈カルシウムスコア」を決定するために使用される。ＣＣＳは、全体的な動脈硬化性プラークの負荷を測定する、臨床的心血管疾患のスクリーニング手法である。イメージング技術の様々な異なるタイプを、アテローム性動脈硬化プラークのカルシウム面積と密度を定量化するために使用することができる。電子ビームＣＴとマルチスライスＣＴが使用されている場合、ＣＣＳは、Ｘ線減衰係数とカルシウム沈着の面積の関数である。通常、０のスコアが、動脈硬化性プラークの負荷が無いことを示し、＞０から１０は、プラークの負荷の証拠は最小限のもので、１１から１００は、少なくとも軽度で、１０１から４００は、少なくとも中等度で、４００を超えると、プラーク負荷の大規模な証拠を示すと考えられる。従来の危険因子と組み合わせて使用するＣＣＳは、心血管疾患の合併症の予測能力を向上させる。さらに、ＣＣＳはまた、心血管疾患の合併症に依存しない予測因子として作用することができる。
【０１５２】
冠動脈カルシウムスコアが高値の人と低値の人とを含む基準セットまたはトレーニングセットは、個々の擬似冠動脈カルシウムスコアを予測するモデルを開発するために使用することができる。この予測された擬似冠動脈カルシウムスコアは、アテローム性動脈硬化症の診断およびモニタリングに有用である。いくつかの実施形態では、擬似冠動脈カルシウムスコアは、そのような心血管疾患の診断およびモニターするためのイメージング技術から派生した実際の冠動脈カルシウムスコアのように、他の既知の心血管疾患の診断とモニタリング手法と組み合わせて使用される。
【０１５３】
当業者は、これらのメソッドを使用して生成された結果は、心血管疾患の診断およびモニタリングするための、当業者に公知の様々な他の多数の方法と組み合わせて使用することができることを認識するであろう。
【０１５４】
当業者であれば、これらのメソッドを使用して生成された結果は、心血管疾患の診断およびモニタリングのために、当業者に公知の様々な他の任意の数の方法と組み合わせて使用することもできることを、認識するだろう。
【０１５５】
一実施形態では、必要性や治療法の有効性を判断するために人間の心臓血管の健康を評価するためのキットが提供され、これは、生物学的サンプル中の表２０のｍｉＲＮＡから選択される少なくとも２種のｍｉＲＮＡマーカーのレベルを決定するためのアッセイ、各ｍｉＲＮＡマーカーのレベルから成るデータセットを取得するための手順、を含み、そして、生物学的サンプルを分類するためのデータを使用する分析・分類プロセスに、データを入力すること（ここで、分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、非薬剤曝露分類がないからなる群から選択される）、分類プロセスのアウトプットに従って生物学的サンプルを分類すること、そして、分類に基づいて治療法を決定すること、を含む。
【０１５６】
特定の実施形態では、キットはさらに、生物学的サンプル中の、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、及びＥＧＦからなる群から選択される少なくとも３つのタンパク質バイオマーカーのレベルを決定するためのアッセイと、タンパク質マーカーの個々のレベルから構成されるデータセットを取得するための手順とを含み、そして、生物学的サンプルを分類するためのデータを使用する、分析・分類プロセスにｍｉＲＮＡとタンパク質マーカーのデータを入力すること（ここで、分類は、アテローム性動脈硬化症分類、健康分類、薬剤曝露分類、非薬剤曝露分類がないからなる群から選択される）、分類プロセスのアウトプットに従って生物学的サンプルを分類すること、そして、分類に基づいて治療法を決定すること、を含む。
【０１５７】
そのような試薬の一つのタイプは、興味の対象のマーカーセットに結合する抗体のアレイまたはキットである。様々に異なるアレイフォーマットが、様々に広範囲に異なるプローブ構造、基板組成物および接着技術と共に、当該分野で知られている。代表的なアレイや興味の対象であるキット組成物は、少なくとも２、少なくとも３、少なくとも４、少なくとも５かそれ以上のｍｉＲＮＡマーカーの単独、またはタンパク質マーカーとの組合せによる定量用試薬を含有するかまたはそれから構成されている。この点で、試薬は、表１にリストされたｍｉＲＮＡ、そして好ましくは表２０でリストされたｍｉＲＮＡから選択された、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５のｍｉＲＮＡマーカーの定量のために可能である。
表１（表１−１〜表１−１５）
【表１−１】

【表１−２】

【表１−３】

【表１−４】

【表１−５】

【表１−６】

【表１−７】

【表１−８】

【表１−９】

【表１−１０】

【表１−１１】

【表１−１２】

【表１−１３】

【表１−１４】

【表１−１５】

代わりに、または、加えて、試薬は、表２から選択された、少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０のタンパク質バイオマーカーの定量のためにできる。
表２（表２−１〜表２−５）
【表２−１】

【表２−２】

【表２−３】

【表２−４】

【表２−５】

【０１５８】
特定の実施形態では、タンパク質バイオマーカーは、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン、アディポネクチン、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、およびＥＧＦ、から選択されている。
【０１５９】
キットはさらに、１つ以上の表現型の統計分析用のソフトウェアパッケージを含むことができ、分類の確率を計算するためのリファレンス・データベースが含まれる場合がある。キットは、血液サンプル、セカンドステージ抗体、ＥＬＩＳＡ試薬、チューブ、スピンカラム等の回収や処理のためのデバイスなど、様々な方法で用いられる試薬を含めることができる。
【０１６０】
上記構成要素に加えて、対象キットはさらに、本発明の方法を実施するための使用説明書を含む。これら使用説明書は、様々な形態で対象キット中に、１つ以上存在し得る。これら使用説明が存在する１つの態様は、例えば、キットのパッケージや添付文書内の、情報が印刷された紙片など、適切な媒体や基質に関する印刷情報の様なものである。さらに別の手段は、例えば、フロッピーディスク、ＣＤなど、情報が記録されたコンピュータ可読媒体であろう。また、存在し得る別の手段は、隔離されたサイト情報にアクセスするために、インターネットを介して使用することができるウェブサイトアドレスである。任意の便利な手段がキット内に存在し得る。
【０１６１】
さらなる態様において、本明細書に開示される方法アッセイおよびキットは、プールされたサンプル中のバイオマーカーを検出するために使用することができる。この方法は、特に、複数のサンプルでわずかな量しか利用できない場合（例えば、保管されていた臨床サンプルセット）、及び／又は患者または対象集団に関連する有用なテータセットを生成する時に、有用である。この点で、（たとえば、約１０μｌ、約１５μｌ、約２０μｌ、約３０μｌ、約４０μｌ、約５０μｌ、またはそれ以上の）等量のサンプルが、約２、５、１０、１５、２０、３０、５０、１００またはそれ以上の）複数の個人から得ることができる。個人は、様々なしるし（ｉｎｄｉｃｉａ）によって一致させることができる。このしるしには、年齢、性別、疾患の既往歴、イベントまでの時間（ｔｉｍｅｔｏｅｖｅｎｔ）などを含めることができる。各個人から得られたサンプルの等量をプールし、１つまたは複数のバイオマーカーの存在について分析することができる。結果は、本明細書に記載の予測・分類モデルを使用して、リファレンス・セットを生成し、予測を実行し、与えられた条件等に関連付けられるバイオマーカーを決定することができる。当業者であれば、本方法の多くの用途を容易に認識し、本明細書に開示されるｍｉＲＮＡ、タンパク質、疾患状態に限定されるものではないことを認識する。実際に、本方法は、様々な疾患や状況に関連付けられている、ＤＮＡ、ＲＮＡ（ｍＲＮＡ、ｍｉＲＮＡ、ヘアピン前駆体ＲＮＡ、ＲＮＰ）、タンパク質等を検出するために使用することができる。
【０１６２】
定義
本明細書中で使用される用語は、特記のない限り、以下に記載するように定義されている。
【０１６３】
本明細書で使用される用語「モニタリング」は、個人または個々人の健康や疾患の状況に関する有用な情報を提供するために、データセットから生成された結果を使用することを指す。「モニタリング」は、例えば、予後の判定、リスク層別化、薬物療法の選択、進行中の薬物療法の評価、治療の有効性の決定、結果の予測、治療への応答の決定、疾患または合併症の診断を含むことができ、疾患の進行の後に、または時間をかけて患者の健康状態に関連する情報を提供し、作用の既知の分子メカニズムを伴う実験的治療の恩恵を受ける可能性が最も高い患者を選択し、そのメカニズムが、投薬にラベルがない様なある疾患の小さなサブセットで重要であるかもしれない既知の分子メカニズムを伴う承認薬の恩恵を受ける可能性が最も高い患者を選択し、例えば、非侵襲的な血液検査から、より侵襲的な生検などのオプションなど、より侵襲的な／高価なテストを決定を支援する患者集団をスクリーニングし、または別の指標を治療するために使用される薬の副作用を評価するテストを含めることができる。特に、用語「モニタリング」は、アテローム性動脈硬化症のステージング、アテローム性動脈硬化症の予後、血管炎症のレベルを参照することができ、アテローム性動脈硬化症の進行の程度を評価し、治療応答をモニタリングし、冠動脈カルシウムスコアを予測し、またはアテローム性動脈硬化症の不安定な症状から安定した症状を区別することができる。
【０１６４】
本明細書中で使用される用語「定量的なデータ」は、数値を特定することができる任意のデータセットコンポーネント（例えば、ｍｉＲＮＡマーカー、タンパク質マーカー、臨床的しるし（臨床的標識）、代謝的計測、または遺伝的アッセイ）に関連付けられたデータを指す。定量的データは、マーカーのＤＮＡ、ＲＮＡまたはタンパク質レベルの尺度であることができ、モル濃度、重量濃度などのような測定の単位で表現することができる。例えば、マーカーがタンパク質である場合、そのマーカーの定量的データは、当業者に公知の方法を使用して測定され、ｍＭまたはｍｇ／ｄＬの濃度単位で表現される、タンパク質の発現レベルである。
【０１６５】
本明細書で使用される用語「哺乳動物」は、ヒトおよび非ヒトの両方を含み、ヒト、非ヒト霊長類、イヌ、ネコ、マウス、ウシ、ウマ、およびブタも含むが、これに限定されるものではない。
【０１６６】
本明細書で使用される用語「擬似冠動脈カルシウムスコア」は、画像診断法による測定を通じてというよりむしろ、本明細書に開示されるような方法を使用して生成された冠動脈カルシウムスコアを指す。当業者であれば、擬似冠動脈カルシウムスコアは、画像診断法による測定により生成された冠動脈カルシウムスコアと交換可能に使用され得ることを認識するであろう。
【０１６７】
二つ以上の核酸またはポリペプチド配列の構成における用語であるパーセント「同一性」（ｐｅｒｃｅｎｔｉｄｅｎｔｉｔｙ）は、以下で説明する配列比較アルゴリズム（例えば、ＢＬＡＳＴＰ及びＢＬＡＳＴＮまたは当業者に利用可能な他のアルゴリズム）のいずれかを使用し、または目視検査によって測定されて、比較され、最大一致のために整列された場合に、二つ以上のシーケンスまたはサブシーケンスが、特定の比率で同一のヌクレオチドまたはアミノ酸残基を有することを、指す。アプリケーションに応じて、パーセント「同一性」は、比較される配列領域、例えば、機能ドメインに亘って存在することができ、あるいはまた、比較される２つの配列の全長にわたって存在することができる。
【０１６８】
特定の実施形態では、治療法の「効果」が決定される。治療法は、改善、改良、リスクの低減、または病状または疾患の進行の減速に基づいて有効であると認識される。このような決定は、当業者によって容易になされる。
【実施例】
【０１６９】
（実施例１）
プールされたサンプル中のｍｉＲＮＡ解析
本研究で利用されたプーリングアプローチ（ｐｏｏｌｉｎｇａｐｐｒｏａｃｈ）は、ａ）血清中のｍｉＲＮＡを識別するためにＥｘｉｑｏｎ社のＬｏｃｋｅｄＮｕｃｌｅｉｃＡｃｉｄ（ＬＮＡ（商標））技術の能力を調査すること、及び、ｂ）テストのために貴重な保管臨床サンプルから最小量を利用することという、２つの目標を達成した。
【０１７０】
血清中のｍｉＲＮＡを識別する、ＬＮＡ（商標）技術の能力を評価するために、５２のプールが、前向き研究（ｐｒｏｓｐｅｃｔｉｖｅｓｔｕｄｙ）から保管されていた血清サンプルを使用して作成された（ＭａｒｓｈｆｉｅｌｄＣｌｉｎｉｃａｌＰｅｒｓｏｎａｌｉｚｅｄＭｅｄｉｃｉｎｅＲｅｓｅａｒｃｈＰｒｏｊｅｃｔ（ＰＭＲＰ），ＰｅｒｓｏｎａｌｉｚｅｄＭｅｄｉｃｉｎｅ，２（１）：４９−７９（２００５））。そのうち２６プールは、患者ケースを、他の２６プールは、コントロールを構成した。各プールは、年齢（４０〜８０歳の間の５歳毎の８つの範囲の中から選択）、性別や事象までの時間（ｔｉｍｅｔｏｅｖｅｎｔ）（即ち、０−６ヶ月内でＭＩ（心筋梗塞）、６−１２ヶ月内でＭＩなど）をマッチさせた、５人の各個人からの等量（５０μＬ）の血清サンプルを含有した。以後のマッチングは、近似的であった。患者ケースは、採血から５年以内にＭｌや、入院の不安定狭心症を伴った被験者であった。コントロールは、採血から５年以内に上記のいずれの疾患イベントとならなかった被験者であった。これらサンプルは、分類問題として評価され、テストパフォーマンスは、曲線下面積（ＡＵＣ）を用いて判定した。
【０１７１】
ＡＵＣの観点からテストパフォーマンスは、（個々のマーカーに対する）測定値の分布、または実験デザインの時点で不明であったスコアの分布に、依存する。実際の実験デザイン（２６症例、２６コントロール）と同様のサンプルサイズのセットに対するテストの期待される性能を見積もるために、多くのシミュレーションが、変数やプールしているサンプル数に対する、異なる仮定分布を用いて行なわれた。使用された仮定分布は、ａ）正常、ｂ）無仮説（ｃｈｉｓｑ）、および、ｃ）対数正規（ｌｏｇ−ｎｏｒｍａｌ）であった。あるプールサンプルの分布と数に対する適切な数の「コントロール」は、ランダムに選択されたものであり、対応する数の症例は、集団間の差異を表すために、既知の平均シフト分布から選択された。したがって、サイズＭのプールのために、２６^＊Ｍコントロールと２６^＊Ｍ症例が選択され、プールサンプルの各々は、Ｍサンプルの値を平均することによって作成される。このプロセスは、５００回繰り返され、予想されるＡＵＣの分布は、プールされたサンプルの与えられた数と母集団の距離に対して推定された。
【０１７２】
図１は、個々のサンプル（白丸と実線の誤差範囲）と、プールされたサンプル（プール毎に５の固体サンプル）（白丸と破線の誤差範囲）を使用した際の、バイオマーカーの濃度やスコアの仮定対数正規分布の結果を示している。実線の黒のドットは、個々の測定のための理論的な答えを示している。予測ＡＵＣが、一貫して、個々のサンプルに対する真のＡＵＣと予測ＡＵＣを過小評価していると観察されるが、（個々のサンプルの）不確かさの範囲は、プールされたサンプルのそれより小さい。図２は、測定値の想定正規分布の結果を表す。このケースでは、プールされたサンプルの結果は、理論的結果や個々のサンプル結果によく一致している。再び、プールされたサンプルの不確かさは、ヒトサンプルの対応する不確かさよりも小さい。仮定の無仮説分布は、対数正規分布から得られたものと一致する、多くのシミュレーション結果を提供した。これらのシミュレーションは、ヒトサンプルの分布が正規分布に従う場合は、プールされたサンプルの結果が、予測ＡＵＣの非常に良好な推定値を提供することを示しており、そうでなければ計算されたＡＵＣは過小評価される。
【０１７３】
５２のプールされたサンプルの３８のｍｉＲＮＡが、ＥＸＩＱＯＮ社のＵｎｉＲＴ（商標）ＬＮＡ技術を用いて分析した。全ＲＮＡは、多少変更された、ＱＩＡＧＥＮＲＮＥＡＳＹ（登録商標）ミニキットプロトコル（ＱＩＡＧＥＮ社、Ｖａｌｅｎｉｃａ，ＣＡ）を使用して、提供血清サンプル（上記）から抽出した。
【０１７４】
全ＲＮＡはＱＩＡＧＥＮＲＮＥＡＳＹ（登録商標）ミニキットを用いて血清から抽出した。血清は、氷上で融解し、４℃５分間１，０００×ｇで遠心した。サンプルあたり２００μＬの分量の血清を、新しいマイクロ遠心チューブへ移し、それに０．９４μｇ／μＬのＭＳ２バクテリオファージを含むＱｉａｚｏｌ混合液７５０μＬを添加した。チューブを混合し、２００μＬのクロロホルムを加えて、５分間インキュベートした。チューブを混合して２分間インキュベートし、４℃１５分間１２，０００ｘｇで遠心した。上澄部分を新しいマイクロ遠心チューブに回収し、１．５倍量の１００％エタノールを追加した。チューブを完全に混合し、７５０μＬのサンプルを、コレクションチューブ内のＱＩＡＧＥＮＲＮＥＡＳＹ（登録商標）ミニスピンカラムへ移し、室温で３０秒、１５，０００ｘｇで遠心分離した。
表３（表３−１〜表３−２）
【表３−１】

【表３−２】

【０１７５】
各ＲＮＡサンプルは、３つの独立した逆転写（ＲＴ）反応でｃＤＮＡに逆転写（ＲＴ）され、ｓｉｎｇｌｉｃａｔｅリアルタイムＰＣＲまたは定量ＰＣＲ（ｑＰＣＲ）反応として実行される。
【０１７６】
各３８４ウェルプレートは、２つのｍｉＲＮＡのアッセイのためのすべてのサンプルの反応液を含んでいた。ＲＴステップでの無テンプレートコントロール（ＲＮＡを水で置換）、及び、ＲＴステップでの無酵素コントロール（テンプレートとしてプールされたＲＮＡを使用）を、ネガティブコントロールとして、実験に含めた。すべてのアッセイで、無テンプレートコントロール及び無酵素コントロールの結果が陰性であったという点で、この品質管理手順をパスした。
【０１７７】
リアルタイムＰＣＲ解析の追加のステップは、各反応の融解曲線を生成することにより、アッセイの特異性を評価するために行われた。融解曲線解析時に単一のピークの出現は、単一の特定の産物が定量ＰＣＲの過程で増幅されたことを示している。複数の融解曲線ピークの出現は、関連する複数の定量ＰＣＲ増幅産物の指標を提供し、これは特異性の欠如の証拠である。複数のピークを示したアッセイは、いずれもデータセットから除外されている。Ｃｐ（交点、すなわち、測定されたシグナルが予め設定されたしきい値を超えて交差する点で、標的配列の測定可能な濃度を示す点）の決定のため（２次微分法による）、及び、溶解曲線分析のために、増幅曲線は、ＬＩＧＨＴＣＹＣＬＥＲ（登録商標）ソフトウェア（Ｒｏｃｈｅ，Ｉｎｄｉａｎａｐｏｌｉｓ，ＩＮ）を用いて分析された。
【０１７８】
ＰＣＲ効率は、また、ＬＩＮＲＥＧ（登録商標）ソフトウェア（オープンソースソフトウェア）でＰＣＲ増幅曲線を分析することにより評価した。５つのハウスキーピングｍｉＲＮＡ（ｍｉＲ−１６、ｍｉＲ−９３、ｍｉＲ−１０３、ｍｉＲ−１９２、およびｍｉＲ−４５１）の成績が、付属の血清サンプルから抽出したＲＮＡの品質を評価するために使用された。
【０１７９】
３８のｍｉＲＮＡターゲット中の２４は、サンプルで検出された。５０のサンプル（２６症例と２４コントロール）が、これらのサンプルの分類分析の成績を評価し、状態を予測するｍｉＲＮＡを選択するために使用された。次の方法論、ａ）ロジスティック回帰アプローチ、およびｂ）（Ｌ１ペナルティー・ラッソ（Ｌ１ｐｅｎａｌｔｙ−ｌａｓｓｏ））を使用したペナルティロジスティック回帰アプローチは、モデルを構築するために用いた。モデルでベストの分類を提供した用語の選択は、ａ）非ペナルティロジスティック回帰アプローチ（ｕｎｐｅｎａｌｉｚｅｄｌｏｇｉｓｔｉｃｒｅｇｒｅｓｓｉｏｎａｐｐｒｏａｃｈ）のために、ベイズの情報基準（ＢａｙｅｓｉａｎＩｎｆｏｒｍａｔｉｏｎｃｒｉｔｅｒｉｏｎ）を使用して前方選択を行うことにより、及び、ｂ）のペナルティアプローチ（ｐｅｎａｌｉｚｅｄａｐｐｒｏａｃｈ）のために、最適なペナルティのクロスバリデーションに基づく選択により、完成した。後者では、ペナルティパラメータは、使用可能なパラメータの係数をゼロに追いやるため、結果として得られるモデルは、減少した数の予測ｍｉＲＮＡだけを含む。パフォーマンスの客観的な尺度を評価するために、ＡＵＣは事前検証されたスコアを用いて算出した。事前検証は、クロスバリデーションのアプローチと非常によく似ており、与えられた結果を伴う「スコア」の関連付けは、与えられた検体のために、トレーニングセット内の特定の検体を使用せずにフィットしたモデルから予測されている値に基づいてされている。この分析では事前検証されたスコアは、以下の二つのアプローチに基づいて計算された。ａ）Ｋ分割交差検定（ｋ−ｆｏｌｄｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎ）と、ｂ）リーブ・ワン・アウト・交差検定（ｌｅａｖｅ−ｏｎｅ−ｏｕｔｃｒｏｓｓｖａｌｉｄａｔｉｏｎ）である。事前検証の繰り返しは、Ｎ回（Ｎは、通常、１００から１０００まで）なされた。分析の完全なシーケンスは以下の通りである。
１）モデル選択のためのＢＩＣでの、ロジスティック回帰を使用して、またはトレーニングセットでの入れ子式の交差検定（ｎｅｓｔｅｄｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎ）を介して、ペナルティ関数を推定するペナルティロジスティック回帰を使用して、データのサブセットにモデルをフィットさせる。
２）Ｋ分割交差検定ために、モデルを、サンプルのＫ−１グループにフィットさせる。
３）リーブ・ワン・アウト・交差検定（ｌｅａｖｅ−ｏｎｅ−ｏｕｔｃｒｏｓｓｖａｌｉｄａｔｉｏｎ）のために、Ｍ−１サンプル（ここでは、Ｍ＝５０）にフィットさせる。
４）フィットモデルを使用して、抜き出しサンプル（ｌｅｆｔ−ｏｕｔｓａｍｐｌｅｓ）のスコアを予測する（交差検定のためのグループＫと、リーブ・ワン・アウト・交差検定（ｌｅａｖｅ−ｏｎｅ−ｏｕｔｃｒｏｓｓｖａｌｉｄａｔｉｏｎ）のための、１つの抜き出しサンプル（ｓｉｎｇｌｅｌｅｆｔ−ｏｕｔｓａｍｐｌｅ））。
５）すべてのスコアがすべてのサンプルに対して予測された後、分類問題のためにＡＵＣを計算する。
６）ＡＵＣの変動を評価するために、ステップをＮ回（１から３）繰り返す。
【０１８０】
図３は、事前検定スコア計算１００リピートで、ペナルティロジスティック回帰モデル（Ｌ１ペナルティ・ラッソ（Ｌ１ｐｅｎａｌｔｙ−ｌａｓｓｏ））を使用して得られたＡＵＣ値の分布を示す。表４は、モデル選択と、ペナルティロジスティック回帰（Ｌ１ペナルティ・ラッソ（Ｌ１ｐｅｎａｌｔｙ−ｌａｓｓｏ））とペナルティスコア計算のための１０分割交差検定とを使用したフィッティングの過程で選択されたトップのｍｉＲＮＡを示す。あるマーカーが、この実行で選択され得る最大回数は、１０００である（１００リピートのスコア事前検定と、各リピート間での１０分割交差検定）。
表４（表４−１〜表４−２）
【表４−１】

【表４−２】

【０１８１】
表５は、Ｌ１ペナルティロジスティック回帰アプローチと組合せてリーブ・ワン・アウト・交差検定（ｌｅａｖｅ−ｏｎｅ−ｏｕｔ（ＬＯＯＶ）ｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎ）（ＬＯＯＣＶ）を使用して選択した、マーカーの数を示す。この２つの方法は、ほぼ同じ順序で選択された、非常に重複したマーカーのセットを、提供している。カウントの違いは、セット内のサンプル数からくるものである。対応するＡＵＣは０．６６である。
表５（表５−１〜表５−２）
【表５−１】

【表５−２】

【０１８２】
（実施例２）
個々のサンプル中のｍｉＲＮＡの評価
フォローアップの実験は、実施例１に記載のＥＸＩＱＯＮＬＮＡ（登録商標）を使用して、個々の血清サンプル中のｍｉＲＮＡの検出と成績（２６症例、２６コントロール）の評価に集中した。合計９０のｍｉＲＮＡ（表６を参照）が、スクリーニングされ、それには、プールされたサンプルでスクリーニングされたｍｉＲＮＡを含んでいた。この９０ｍｉＲＮＡのターゲットのうち４４は、個々の血清サンプルで検出された。プールされたサンプルで検出された２４のｍｉＲＮＡは、個々のサンプルでも検出され、さらに追加的に、２０のｍｉＲＮＡが、個々のサンプルで検出された。５のｍｉＲＮＡは、データの正規化のために使用され、分析対象から除外された。
表６（表６−１〜表６−４）
【表６−１】

【表６−２】

【表６−３】

【表６−４】

＊実施例１の一部として評価
＊＊実施例２の一部として評価
【０１８３】
実施例１での記載と同様の方法論（ｍｅｔｈｏｄｌｏｇｙ）は、このデータセットの分析のために使用された。リーブ・ワン・アウト・交差検定（ｌｅａｖｅ−ｏｎｅ−ｏｕｔｃｒｏｓｓｖａｌｉｄａｔｉｏｎ）（ＬＯＯＣＶ）と共に、ペナルティロジスティック回帰を使用することで、０．７７８に等しいＡＵＣが提示された。個々のｍｉＲＮＡが事前検定スコアの計算に使用されるモデルで選択された回数は、表７に示されている（５０個のサンプルがあったので、合計５０モデル）。平均モデルサイズは、〜８ターム（上位８のｍｉＲＮＡは「＊」で示されている）であった。期待値は、プールされたデータに対して得られた対応値よりも高い。
【表７】

【０１８４】
表８は、４分割交差検定でのＬ１ペナルティロジスティック回帰アプローチが５０の個人サンプルに適用された時に選択されたｍｉＲＮＡを提供する。再び、マーカーと順番のかなりの重複は、この２つの方法間で観察されている。図４は、この分析から得られたＡＵＣ値の分布を示す。
【表８】

【０１８５】
（実施例３）
タンパク質バイオマーカーの分析
（実施例１、２で使用されたマーシュフィールド・コホート（Ｍａｒｓｈｆｉｅｌｄｃｏｈｏｒｔ）からの）タンパク質のデータのみを含むモデルが、開発された。総計４７のユニークなタンパク質バイオマーカー（表９）が分析された。血清サンプルは、回収され、−８０℃で凍結保存され、その後、使用直前に解凍された。各サンプルは、２つの異なる検出技術：ルミネックス社（Ｌｕｍｉｎｅｘ）（Ａｕｓｔｉｎ，ＴＸ）のｘＭＡＰ（登録商標）技術と、メソスケールディスカバリ社（ＭｅｓｏＳｃａｌｅＤｉｓｃｏｖｅｒｙ）（ＭＳＤ，Ｇａｉｔｈｅｒｓｂｕｒｇ，ＭＤ）のＭＵＬＴＩ−ＳＰＯＴ（登録商標）技術と、を使用して、分析された。
【表９】

【０１８６】
ルミネックスのｘＭＡＰ（登録商標）技術は、色分けされた微粒子にプレコートされた分析物特異的抗体を利用している。微粒子、スタンダード、サンプルをウェルに分注し、固定化抗体は、対象分析物と結合する。適切な時間インキュベーションした後、粒子は、すべての非結合物質を除去するため、複数回、洗浄バッファー内で再懸濁される。対象分析物に特異的なビオチン化抗体カクテルを各ウェルに添加する。すべての非結合ビオチン化抗体を除去するための、第２のインキュベーション時間と洗浄を終えた後、ビオチン化検出抗体に結合する、ストレプトアビジン − フィコエリスリン結合体（ｓｔｒｅｐｔａｖｉｄｉｎ−ｐｈｙｃｏｅｒｙｔｈｒｉｎｃｏｎｊｕｇａｔｅ）（ストレプトアビジン−ＰＥ）を、各ウェルに添加する。最後の洗浄で、非結合のストレプトアビジン−ＰＥを除去し、微粒子を緩衝液に再懸濁して、ルミネックス・アナライザを使用して読み込む。アナライザは、マルチレーザー検出システムを介して微粒子を方向付けるためにフローセルを使用している。１つのレーザーは、微粒子特異的であり、対象物が検出されていることを決定する。他のレーザーは、結合した分析物の量に直接比例して、フィコエリトリン由来の信号の大きさを決定する。曲線は、スタンダードによって生成された信号を使用して構築されサンプルのタンパク質バイオマーカーの濃度は、それぞれの曲線から読み込まれる。４７のルミネックス（Ｌｕｍｉｎｅｘ）タンパク質バイオマーカーアッセイの感度（検出限界、ＬｉｍｉｔｏｆＤｅｔｅｃｔｉｏｎ，ＬＯＤ）と精度（アッセイ内およびアッセイ間ＣＶ％）は、表１０に示されている。
表１０（表１０−１〜表１０−２）
【表１０−１】

【表１０−２】

【０１８７】
４５のユニークなタンパク質バイオマーカーの中の１０は、ＭＳＤプラットフォーム（表１１）のに１０プレックスアッセイ（１０−ｐｌｅｘａｓｓａｙ）で分析した。
【表１１】

【０１８８】
ＭＳＤ（メソスケールディスカバリー、ＭｅｓｏＳｃａｌｅＤｉｓｃｏｖｅｒｙ）技術は、各プレートの底部を炭素表面で構築された、特殊な９６ウェルマイクロタイタープレートを採用している。各タンパク質バイオマーカーに特異的な抗体は、マイクロタイタープレートの各ウェルの底部にアレイ（ｓｐａｔｉａｌａｒｒａｙｓ）でスポットされている。スタンダードとサンプルを、プレコートプレートされたウェルに分注し、固定化抗体は、対象の分析物と結合する。適切な時間インキュベーションした後、プレートを複数回洗浄して、すべての非結合物質を除去する。ＳＵＬＦＯ−ＴＡＧ（登録商標）で標識された、分析物に特異的な二次抗体カクテルを各ウェルに添加する。２回目のインキュベーションの後、プレートを再度複数回洗浄して、任意の非結合物質を除去し、専用のリード・バッファ（ＲｅａｄＢｕｆｆｅｒ）を各ウェルに添加する。次いで、プレートをＳＥＣＴＯＲ（登録商標）イメージャーに設置すると、電流がマイクロタイタープレートの底部のカーボン電極に印加される。各スポットで、特異的二次抗体に結合したＳＵＬＦＯ−ＴＡＧ（登録商標）標識は、この電気刺激時に発光し、高感度ＣＣＤカメラで検出される。曲線は、スタンダードで生成されたシグナルを使用して構築され、サンプルの蛋白質バイオマーカーの濃度は、それぞれの曲線で読み込まれる。１０のＭＳＤ（メソスケールディスカバリー）タンパク質バイオマーカーアッセイの感度（検出限界、ＬＯＤ）と精度（内およびアッセイ間ＣＶ％）は、表１２に示されている。
【表１２】

【０１８９】
前述の事前検証済みスコア（ｐｒｅｖａｌｉｄａｔｅｄｓｃｏｒｅ）の計算にＬＯＯＶまたはＫ−分割交差検定でロジスティック回帰アプローチを用いて、モデルが構築され、パフォーマンスが評価された。図８は、事前検証済みスコアを予測するためにＫ−分割交差検定法のみを用いたタンパク質ベースのモデルから得られた、ＡＵＣ値の分布を提供している。表１３は、任意の交差検定モデルにおける、あるタンパク質マーカーの選択度数を提供する。高いカウントは、あるマーカーが一貫してコントロールから症例を分類する能力を持つことを示す。ＡＵＣは、事前検証済みスコアの計算にＬＯＯＶアプローチを使用して、０．６９８であると計算され、および、表１４は、ＬＯＯＶ方法論を使用して構築した任意のモデル内のマーカーの、選択度数を提供している。後者のＡＵＣは、ｋ−分割交差検定アプローチから計算された不確実性の限界内にある。どちらの手法も同じトップマーカーを選択している。
【表１３】

【表１４】

【０１９０】
（実施例４）
ｍｉＲＮＡとタンパク質バイオマーカーの複合解析
（実施例１、２からの）タンパク質データとｍｉＲＮＡのデータの両方を含むモデルが、開発された。（実施例３からの）４７のバイオマーカー全体のタンパク質データは、ルミネックス（ＬｕｍｉｎｅｘＣｏｒｐ，Ａｕｓｔｉｎ，ＴＸ）システムと、メソスケールディスカバリー（ＭｅｓｏＳｃａｌｅＤｉｓｃｏｖｅｒｙ、ＭＳＤ）システムの、２つの異なる検出技術を用いて得られた。タンパク質とｍｉＲＮＡのデータを組み合わせたため、候補説明的変数（ｃａｎｄｉｄａｔｅｅｘｐｌａｎａｔｏｒｙｖａｒｉａｂｌｅｓ）の数がサンプルの数を超えている。このような状況では、非ペナルティーメソッドの使用は適切ではないため、前述の事前検証済みスコア（ｐｒｅｖａｌｉｄａｔｅｄｓｃｏｒｅ）の計算にＬＯＯＶまたはＫ−分割交差検定（ｋ−ｆｏｌｄｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎ）でペナルティ付きロジスティック回帰を用いて、モデルが構築され、パフォーマンスが評価された。図５は、ｍｉＲＮＡとタンパク質の両方に基づいたモデルのためのＡＵＣ分布を提供する。ＡＵＣは、ｍｉＲＮＡのみに対して得られたものと統計的に同等であるが、２つのｍｉＲＮＡは一貫してモデルで選択されていた（表１５を参照）。図６は、ｍｉＲＮＡとタンパク質の相関の分布を示し、一方、図７は、ｍｉＲＮＡの分布を示す。図６の２つの垂直線は、タンパク質とｍｉＲＮＡ間の最大と最小の相関関係を表している。いかなる特定の理論にも拘束されることを望まなければ、これらの相関関係は現在調査されていない調節作用に対応することができる。これら２つの図を比較すると、タンパク質は、このデータ・セット内の正の相関の高い数値を生成することを示している。
【表１５】

【０１９１】
（実施例５）
ｍｉＲＮＡバイオマーカーを用いた生存
本研究では、ｍｉＲＮＡのレベルは、時間の経過とともに発生するあるイベント（ここではＭｌ）のリスクを説明している。１１２の候補ｍｉＲＮＡマーカーの、単変量、多変量分類および生存分析を行った。分類結果は、実施例２、３に記載の手法に基づいて得られた。生存解析はＣｏｘ比例ハザード回帰手法を用いて行った。後の分析のための応答変数は、時間を含み、それは、あるイベントが発生した時間、または、研究の終了までの時間、および、時間があるイベントまたは研究の終了（打ち切り）に関連しているかどうかを示す指標、である。実施例２に記載の５２サンプルについて、事象の時間またはフォローアップの終了時間が知られていた。研究の終了前にあるイベントを起こした２６例については、ある事象のインジケータ変数は１に設定され、研究の期間内にある事象が起きなかった２６例については、インジケータ変数は０に設定された。分析に含まれる説明変数は以下の通りで、：ａ）タンパク質レベル単独、ｂ）ｍｉＲＮＡレベル単独、および、ｃ）ｍｉＲＮＡレベル、タンパク質レベルのいずれか又は両方。モデルフィッティング（Ｍｏｄｅｌｆｉｔｔｉｎｇ）は、Ｃｏｘ比例ハザードモデルのペナルティ付きバージョンとペナルティ無し（ｕｎｐｅｎａｌｉｚｅｄ）バージョンの両方を使用して行われた。モデルのペナルティ付きバージョンが適用される時は必ず、Ｌ１−ペナルティ（ラッソ（Ｌａｓｓｏ））を用いた。各モデルの変数選択（ｖａｒｉａｂｌｅｓｅｌｅｃｔｉｏｎ）は、実施例１に記載したものと同じアプローチを使用して行った。すなわち、ａ）モデルの、ペナルティ無し（ｕｎｐｅｎａｌｉｚｅｄ）バージョンのための前進選択（ｆｏｒｗａｒｄｓｅｌｅｃｔｉｏｎ）でのベイズ情報量規準（ｔｈｅＢａｙｅｓｉａｎｉｎｆｏｒｍａｔｉｏｎｃｒｉｔｅｒｉｏｎ）を使用して、及び、ｂ）ペナルティ付きアプローチのための最適なペナルティの選択に基づいた交差検定（ｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎ）を使用して。客観的な方法でこれらのモデルの性能を評価するために、実施例１に記載のものと同様の方法で得られた事前検証済みスコア（ｐｒｅｖａｌｉｄａｔｅｄｓｃｏｒｅ）の計算が採用された。
【０１９２】
最初の分析（分類）では、生存時間は無視され、イベントまでの時間（タイム・ツー・イベント（ｔｉｍｅ−ｔｏ−ｅｖｅｎｔ））にかかわらず、すべてのケースが同じように処理された。表１６は、単変量の分類分析（ｕｎｉｖａｒｉａｔｅｃｌａｓｓｉｆｉｃａｔｉｏｎａｎａｌｙｓｉｓ）の結果を示している。この表内のマーカーは、予測ＡＵＣによって順位づけられている。表１８（表１７のミス！）は、多変量分類モデルにおけるｍｉＲＮＡの選択度数（ｔｈｅｓｅｌｅｃｔｉｏｎｆｒｅｑｕｅｎｃｙ）を示している。多重ロジスティック回帰モデルは、ＬＯＯＶアプローチを通じて得られたトレーニングセットの事前検証プロセス中に構築され、無視されたサンプル（ｔｈｅｌｅｆｔ−ｏｕｔ−ｓａｍｐｌｅ）のスコアを提供した。モデルのサイズは、ベイズ情報量規準（ｔｈｅＢａｙｅｓｉａｎＩｎｆｏｒｍａｔｉｏｎＣｒｉｔｅｒｉｏｎ）の使用によって決定した。平均的な分類性能は、事前検証済み分類スコアのベクトルに基づいており、０．７に等しかった。
表１６（表１６−１〜表１６−２）
【表１６−１】

【表１６−２】

【表１７】

【０１９３】
表１８は、単変量生存率分析の結果を示している。再び、このテーブル内のマーカーは、予測ＡＵＣによって順位づけられている。トップの選択マーカーは、分類分析から得られたものとほぼ同一であり、全体的なパフォーマンスは、時間依存性ＡＵＣで評価されるように、分類アプローチから得られたそれと同等であった。表１９は、Ｃｏｘ比例ハザード回帰アプローチを用いた多変量生存率解析でのｍｉＲＮＡマーカーの選択度数を示している。モデルにのみ基づいたｍｉＲＮＡのために期待されるパフォーマンスは、事前検証（ＡＵＣ＝０．７８）を用いて推定した。トレーニングセットは、リーブ・ワン・アウト（ｌｅａｖｅ−ｏｎｅ−ｏｕｔ）アプローチを介して構築され、各区画内でのモデルのサイズは、ベイズ情報量基準（ｔｈｅＢａｙｅｓｉａｎｉｎｆｏｒｍａｔｉｏｎｃｒｉｔｅｒｉｏｎ）に基づいて決定された。平均的なモデルのサイズは８であった。
【表１８】

【表１９】

【０１９４】
（実施例６）
拡張されたｍｉＲＮＡスクリーニング
ｍｉＲＮＡバイオマーカーの、症例（ｃａｓｅ）対コントロールを区別するための能力を調べるために、現在ｍｉＲＢＡＳＥ１３に更新されている、Ｅｘｉｑｏｎの水銀ＬＮＡ（登録商標）ユニバーサルＲＴマイクロＲＮＡＰＣＲアレイ技術プラットフォームを使用して、以前に、実施例２の５２の血清サンプルから得たＲＮＡ抽出物を、表１に示す７２０のｍｉＲＮＡ標的配列の存在に関してスクリーニングした。
【０１９５】
多くの分析が、各ｍｉＲＮＡバイオマーカーの全体的な意義を提供するために結合された。単変量分類と生存分析は、重要な順に各ターゲットをランク付けするために使用された各個人のｍｉＲＮＡターゲットのために、ＡＵＣ値を提供した。多変量解析もまた、４７の多変量モデルを生成するために実施された。ｍｉＲＮＡターゲットは、それらが選択されたモデルの数によってランク付けされた。ｔ−検定分析（１−ｔａｉｌｅｄ）もまた、症例（ｃａｓｅ）集団とコントロール集団における各ｍｉＲＮＡターゲットのために測定されたＣｐ値を比較して行われた。最後に、四分位数分析（ａｑｕａｒｔｉｌｅａｎａｌｙｓｉｓ）が、データセットに対して行われた。各ｍｉＲＮＡターゲットについては、すべてのサンプル（結合された症例集団とコントロール（対照）集団）が、Ｃｐ値に従って（低い値から高い値へ）ランク付けされた。ランク付けされた集団は、その後、各々が総集団の２５％を含む４つの四分位数（ｆｏｕｒｑｕａｒｔｉｌｅｓ）に分割された。各四分位数での症例被験者と対照被験者の数は、その後記録された。もし、総数２６症例のうち、６５％より多いまたは３５％未満が、「低い」四分位数にランクされた場合には、そのｍｉＲＮＡターゲットは、重要とみなされた。
【０１９６】
拡張セットの７２０のｍｉＲＮＡバイオマーカーの分析に基づいて、最終的な全体的なランクスコアが割り当てられるが、これは、ｍｉＲＮＡターゲットのセット全体がランク付けされたことにより、全体の重要度スコアの生成を説明している。表２０は、トップ５０にスコアされているｍｉＲＮＡを示している。
【表２０】

【０１９７】
（実施例７）
タンパク質バイオマーカーベースの心血管リスクスコア
ＰＭＲＰ（ＰｅｒｓｏｎａｌｉｚｅｄＭｅｄｉｃｉｎｅ，２（１）：４９−７９（２００５））．からの１１２３人のサンプルによって、心血管リスクスコアの開発がなされた。セットは、症例コホート・デザイン（ａｃａｓｅ−ｃｏｈｏｒｔｄｅｓｉｇｎ）に基づいて選択された。ベースラインの採血の時に４０−８０歳であった場合、および、事象ＭＩを有した、または５年フォローアップの間に不安定狭心症（ＵＡ）のために入院した場合は、ＰＭＲＰコホートからの被験者は、「症例」（ｃａｓｅｓ）とみなした。合計で、３８５人の症例（初期Ｍｌの１６４例、およびＵＡの２２１例）と８３８人のコントロールであった。利用可能なデータは、個々で測定された５９（４７のユニークな）のタンパク質バイオマーカー、および１０７の臨床的特徴であって、人口統計（年齢、性別、人種、糖尿病の状態、Ｍ１の家族歴、喫煙など）と、実験室での測定（総コレステロール、ＨＤＬ、ＬＤＬなど）や薬の使用（スタチン、降圧薬、血糖降下薬など）を、含んでいた。
【０１９８】
単変量解析
各バイオマーカーと患者の転帰との関連付けは、Ｃｏｘ比例ハザード回帰と、Ｈｅａｇｅｒｔｙら（ＳｕｒｖｉｖａｌＭｏｄｅｌＰｒｅｄｉｃｔｉｖｅＡｃｃｕｒａｃｙａｎｄＲＯＣＣｕｒｖｅｓＢｉｏｍｅｔｒｉｃｓ，６１：９２−１０５（２００５））のＫａｐｌａｎ−Ｍｅｉｅｒ法を使用した曲線（ＡＵＣ）での時間依存的領域と、を使用して評価された。共通のスケール上で異なる濃度範囲のすべてのタンパク質バイオマーカーに亘ってハザード比（ｈａｚａｒｄｒａｔｉｏ、ＨＲ）を提示するために、すべての被験者の値は、データをログ変換後コントロールの標準偏差で割ったコントロールの濃度の平均値を差し引くことにより、正規化された。ハザード比は、このように１つの標準偏差単位ごとに、表現された。図９は、リスクの多変量モデルを開発するための候補として使用された３５のバイオマーカーの、未調整のハザード比と標準誤差を示す。２２のバイオマーカーは、統計的に有意なＨＲを有する。
【０１９９】
年齢、性別、収縮期血圧、拡張期血圧、コレステロール、ＨＤＬ、高血圧症、高血圧症治療薬の使用、高脂血症、糖尿病、喫煙という、従来型危険因子（ｔｒａｄｉｔｉｏｎａｌｒｉｓｋｆａｃｔｏｒｓ、ＴＲＦｓ）に対して各バイオマーカーを調整しながら、同じ分析を繰り返した（図１０）。調整後、１１のバイオマーカーだけが、統計的有意性を維持していたが、選択された上記ＴＲＦｓが、心血管疾患に関連付けられていることは既知であったので、驚くべきことではない。図１１Ａ、図１１Ｂは、最も高い時間依存性ＡＵＣと５年間のフォローアップでのその対応値を有するマーカーを示している。すべてのマーカーのＡＵＣは、時間とともに減少していたＮＴ−プロＢＮＰ（ＮＴ−ｐｒｏＢＮＰ）アッセイの２つのバージョンを除き、時間とともに一定のままであった
【０２００】
多変量解析：Ｍｌ（心筋梗塞）および／またはＵＡ（不安定狭心症）の予後スコアの開発
予後スコアの開発は、タンパク質バイオマーカーと同様、ＴＲＦｓ（従来型危険因子）を含めることを基礎としていた。年齢、性別、糖尿病、および家族歴の心血管イベントとの関連性が既知であったならば、これら４つのパラメータは、モデルに含まれた。これら４つのパラメータを含めることは、沢山のフォワードマーカー選択アルゴリズム（ｆｏｒｗａｒｄｍａｒｋｅｒｓｅｌｅｃｔｉｏｎａｌｇｏｒｉｔｈｍｓ）を実行することによって確認された。すべてのアルゴリズムは、最終的な多変量アルゴリズムで４つの変数を選択した。最適なモデルサイズの決定は、以下の基準の使用に基づいてなされた。（ａ）赤池情報量基準（Ａｋａｉｋｅｉｎｆｏｒｍａｔｉｏｎｃｒｉｔｅｒｉｏｎ）、（ｂ）ベイズ情報量基準（Ｂａｙｅｓｉａｎｉｎｆｏｒｍａｔｉｏｎｃｒｉｔｅｒｉｏｎ）、（ｃ）ドロップ・イン−逸脱基準（Ｄｒｏｐ−ｉｎ−ｄｅｖｉａｎｃｅｃｒｉｔｅｒｉｏｎ）、である。最初の２つは、インサンプルエラー推定法（ｉｎ−ｓａｍｐｌｅｅｒｒｏｒｅｓｔｉｍａｔｏｒｓ）で知られており、３番目は、適合度（ｇｏｏｄｎｅｓｓ−ｏｆ−ｆｉｔ．）を推定する交差検証ループ（ｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎｌｏｏｐ）を利用している。３つのすべてのケースでは、モデルサイズは、最良のデータに適合し、過学習を回避するモデルに対して選ばれた。モデル選択のための特徴的なドロップイン・逸脱曲線（ｄｒｏｐ−ｉｎ−ｄｅｖｉａｎｃｅｃｕｒｖｅ）（量の絶対値のプロット）を図１２に示す。モデルのサイズは、曲線の最大値が同定され、その後、最大値の下に１標準誤差ポイントからラインを引く、１標準誤差ルール（１ｓｔａｎｄａｒｄｅｒｒｏｒｒｕｌｅ）の使用に基づいて選択された。タンパク質バイオマーカーの最適な数は、対応する平均絶対逸脱値が前述のラインを超える最小数として選ばれた。その数は７つのタンパク質バイオマーカーと一致し、すなわち、最適なリスクスコアは、それ故、４つのＴＲＦｓと７つのタンパク質バイオマーカーから構成されていた（図１２）。すべての３つの方法は、モデル内のバイオマーカーの最適な数として５〜７のマーカーを選択した。バイオマーカーのより小さなセットは、常により大きなセットのサブセットであった。表２１は、年齢、性別、糖尿病、およびＭｌの家族歴が、モデル内に入れ込まれた後に、選択されたバイオマーカーの度数とランキングを示している。これらのカウントとランキングは、交差検定プロセスの間に構築された別のモデルから得られた。１つのモデルは、すべてのトレーニング集団（ｔｒａｉｎｉｎｇｆｏｌｄ）のために構築され、そのサイズは、前述のモデル選択法の１つによって選択される。交差検定プロセスは、順番に平均的に各被験者のメンバーシップの割り当てによって導入された変動にわたって繰り返された。
【表２１】

【０２０１】
表２１は、５倍の事前検証（交差検証のフォーム）プロセスの４回繰り返し以上の各マーカーの、頻度選択（ｔｈｅｆｒｅｑｕｅｎｃｙｓｅｌｅｃｔｉｏｎ）、平均値、最小と最大のランクを示す。４つのＴＲＦｓは、各モデルに含めた。
【０２０２】
ドロップ・イン・逸脱アプローチ（ｔｈｅｄｒｏｐ−ｉｎ−ｄｅｖｉａｎｃｅａｐｐｒｏａｃｈ）で予測される最適なモデルサイズを使用して、Ｃｏｘ比例ハザードモデルは、異なる集団の検証を使用することができるモデルを得るために使用可能なすべてのデータにフィットした。この最終的なタンパク質ベースのモデルには、選択した順番で、次のタンパク質バイオマーカー、ＩＬ−１６、エオタキシン、ｆａｓリガンド、ＣＴＡＣＫ、ＭＣＰ−３、ＨＧＦ、およびｓＦａｓ、が含まれていた。
【０２０３】
（実施例８）
タンパク質モデルと他の標準的な予測モデルとの比較
心血管イベント（すなわち、ＭｌまたはＵＡ）の予測リスクの開示モデルのトランスポータビリティは、４５−８４歳の米国の集団から選択された第２の多民族コホートで評価した（アテローム性動脈硬化症コホートの多民族的研究）［ＢｉｌｄＤＥ，ＢｌｕｅｍｋｅＤＡ，ＢｕｒｋｅＧＬ，ＤｅｔｒａｎｏＲ，ＤｉｅｚＲｏｕｘＡＶ，ＦｏｌｓｏｍＡＲ，ＧｒｅｅｎｌａｎｄＰ，ＪａｃｏｂＤＲ，Ｊｒ．，ＫｒｏｎｍａｌＲ，ＬｉｕＫ，ＮｅｌｓｏｎＪＣ，Ｏ’ＬｅａｒｙＤ，ＳａａｄＭＦ，ＳｈｅａＳ，ＳｚｋｌｏＭ，ＴｒａｃｙＲＰ．アテローム性動脈硬化症の多民族的研究：目的とデザインＡｍＪＥｐｉｄｅｍｉｏｌ．２００２；１５６（９）：８７１−８８１］。
【０２０４】
開発に使用されたサンプルと、似て非なるサンプルでモデルの期待される性能を確立するために、事前検証メソッドが、第２の集団へモデルを適用する前に、再び使用された。２つのパフォーマンス・メトリック、純再分類指数（ｔｈｅＮｅｔＲｅｃｌａｓｓｉｆｉｃａｔｉｏｎＩｎｄｅｘ、ＮＲＩ）と臨床再分類指数（ｔｈｅＣｌｉｎｉｃａｌＮｅｔＲｅｃｌａｓｓｉｆｉｃａｔｉｏｎＩｎｄｅｘ、ＣＮＲＩ）、が使用された。純再分類指数の定義は次式で与えられる。
【数１６】

【０２０５】
式は、パーセントの観点から、症例（ｃａｓｅｓ）とコントロールに対する改善を別々に評価し、単一の数値に結果を組み合わせる。症例に対する正パーセンタイル値とコントロールに対する負の正パーセンタイル値は、開示されたモデルで導入された性能の向上を表している。リスクカテゴリーは、既存の開示モデルによって予測されるリスクスコアのための、適切なしきい値を確立することによって定義されている。ＣＮＲＩは同じ方法で定義されるが、改良された、グループ内の真のリスクの同定方法から得ることのできる集団のサブセットに適用される。心血管疾患については、例えばフラミンガム（Ｆｒａｎｉｍｇｈａｍ）スコアによって定義された中程度リスク集団で、ＮＲＩメトリックのアプリケーションは、この基準を満たす。計算値は、中程度リスクカテゴリのＣＮＲＩパフォーマンスを表している。
【０２０６】
伝統的に、１０年リスクに対するラミンガム・スコアで計算された中程度リスクカテゴリーは、１０％から２０％の間のリスク・スコアを持つ個人として定義されている。ここで示した結果は、中程度リスクカテゴリーを定義するために、以下のカットオフ値：＜３．５％、＞７．５％、を基礎としている。ａ）開示モデルは５年という期間に焦点を当て、およびｂ）フラミンガム・スコアが開発された場合、現在の集団でのイベント率は、観察値よりも低いので、これらのより低いカットオフ値の使用が正当化される。
【０２０７】
再分類比較は、与えられた対象に対して、各モデルからの絶対リスクの計算を必要とした。Ｃｏｘ比例ハザード（ＣｏｘＰＨ）モデルを使用した各個人の絶対リスクの計算は、その特性とベースラインハザード推定とに基づいて、この個々人のための相対リスクの計算を必要とした。ＣｏｘＰＨモデルは相対的リスクを予測するために設計されているが、ハザード関数の特定を必要としない。ＣｏｘＰＨモデルから絶対リスク推定値を生成するために、我々は個々人の、または、「平均的」個人の絶対リスクを必要とし、この個人の、または平均人の、相対的なリスク推定を使用して、個々人の絶対リスクを計算した。平均人は、それぞれの予測因子に対する集団平均値を有する、仮想上の個人である。集団の真のベースライン・ハザードとそれに対応する「平均的な」人が知られていなければ、（心血管イベントのリスクを計算するための正しいモデルが未知であるため）、推定が提供される必要があった。Ｒ言語［Ｒ：統計コンピューティングのための言語と環境、Ｒ開発コアチーム、統計コンピューティングのためのＲ財団、ウィーン、オーストリア、２０１０］サーブフィット（ｓｕｒｖｆｉｔ）関数が、平均的な個人のベースラインハザードを計算するために使用された。サーブフィット（ｓｕｒｖｆｉｔ）関数は、計算に重みを使用している。つまり、集団の各メンバーは、平均と比較して推定されたリスクスコアに応じて重みを受容し、加重ハザード推定値は、ベースラインハザードのために使用される。ベースラインハザードの推定は、使用されたモデルに依存し、予測された相対的リスクにも依存する。開示モデル対ＦＲＳ及びＴＲＦベースのモデルの、再分類性能の公正な比較を行うために、適切なベースラインハザード推定が、不当にいずれかのモデルを支持していないことが必要とされた。比較対象の２つのモデルの平均スコアであるリスク・スコアを使用してベースラインハザードを計算するための好ましいアプローチは、以下に説明する。さらに、サーブフィット（ｓｕｒｖｆｉｔ）関数は、カプラン・マイヤー（Ｋａｐｌａｎ−Ｍｅｉｅｒ）とアーレンの、２つの異なる推定法を実行した。両方の推定法は、テストの結果、観測された差異はごくわずかなものであった。集団に我々の結論を拡張するために、ベースライン生存関数は、研究のケース・コホートの重みを使用して、共変量の集団平均で評価された。
【０２０８】
絶対的なリスク・スコアに関して、二つのモデルを比較するためのベースラインハザードの推定の選択は難しい問題であり、文献では取り上げていない。集団の真のベースラインハザードが未知であるため、各モデルによって異なる推定を使用すると、比較の結果に重大な影響が生じ得る。ベースラインハザード推定の影響を調べるために、２つの異なる方法を用いて、すべての計算が行われた。１）線形予測スコアを使用した個々のベースライン生存者の推定値に基づいて、各モデルの絶対リスクスコアが、各モデルによって計算され、２）２つのスコアから平均線形予測を計算することによって得られる共通のベースライン生存者の推定値に基づいた、絶対リスクスコアは、集団平均で中央を占める。
【０２０９】
表２２、表２３、および表２４は、以下の３つの代替モデルに対して、バイオマーカーを含む事前検証モデルのパフォーマンスが期待された、ＮＲＩとＣＮＲＩを提示している。１）フラミンガム・リスクスコア（Ｆｒａｍｉｎｇｈａｍｒｉｓｋｓｃｏｒｅ、「ＦＲＳ」）、２）共変量として４つのＴＲＦｓ（「４−ＴＲＦ」：年齢、性別、糖尿病、Ｍ１の家族歴）を使用してマーシュフィールド・データ（Ｍａｒｓｈｆｉｅｌｄｄａｔａ）に適合されたモデル、３）共変量として９のＴＲＦｓ（「９−ＴＲＦ」：年齢、性別、糖尿病、Ｍｌの家族歴、喫煙、総コレステロール、ＨＤＬ、高血圧治療薬服用、収縮期血圧）を使用してマーシュフィールド・データに適合された代替モデル。
【０２１０】
全体的に、タンパク質バイオマーカーを含有するモデルは、心血管イベントに対する５年リスクの３．５−７．５％および３．５−１０％の範囲で、ＦＲＳまたはＴＲＦベースモデルの、より優れた再分類を提供した。表２２は、事前検証（マーシュフィールドのデータセット）に基づいて校正されたＦＲＳスコアに対する、本開示のモデルのスコアの期待される再分類パフォーマンスを示している。表２３および２４は、それぞれ、事前検証（マーシュフィールドのデータセット）に基づいた４−ＴＲＦと９−ＴＲＦモデルのスコアに対する、期待される再分類スコアを示している。
【０２１１】
ＮＲＩとＣＮＲＩの両面で、総合的な再分類は、ベースライン生存関数を計算するための２つの方法のいずれの使用においても、同程度であった。しかし、２つの方法の総ＮＲＩまたは総ＣＮＲＩを構成する、症例（ｃａｓｅｓ）およびコントロールの再分類のバランスに、違いがあった。共通のベースライン生存関数法は、よりバランスのとれた再分類を提供してくれた。この結果は、モデルの相対的リスク予測のために得られた結果と一致した。図１３Ａ−Ｂは、ＦＲＳ、本開示モデル（事前検証のアプローチの複数のリピートから得られる）、４−ＴＲＦ、および９−ＴＲＦモデルのリニアスコア（ｌｉｎｅａｒｓｃｏｒｅｓ）のカーネル密度推定の観点から、この比較を示している。本開示モデルのスコアは、他のモデルよりもより高く症例（ｃａｓｅ）の相対リスクを提供した。コントロールの分布はまた、本開示モデルのスコアのためにより広く、他のスコアに比してコントロールのリスクの上下のバランスを示した。これらの結果は、本開示モデルスコアが、他のスコアに関連する症例を正しく分類したという強力な特徴を提供した。
【０２１２】
（平均スコアを使用した）共通のベースライン生存関数法は、また、予測精度を向上させるための投票方式（ｖｏｔｉｎｇｓｃｈｅｍｅ）（すなわち、加重平均）を使用する多くの統計的アプローチと一致した。
【表２２】

事前検証（マーシュフィールドのデータセット）に基づいて校正されたフラミンガム・スコア（Ｆｒａｍｉｎｇｈａｍｓｃｏｒｅ）に対するアヴィール・スコア（Ａｖｉｉｒｓｃｏｒｅ）の予測される再分類パフォーマンス
【表２３】

事前検証（マーシュフィールドのデータセット）に基づいた４−ＴＲＦモデルスコアに対するアヴィール・スコア（Ａｖｉｉｒｓｃｏｒｅ）の予測される再分類パフォーマンス
【表２４】

事前検証（マーシュフィールドのデータセット）に基づいた９−ＴＲＦモデルスコアに対するアヴィール・スコア（Ａｖｉｉｒｓｃｏｒｅ）の予測される再分類パフォーマンス
【０２１３】
（実施例９）
第２集団への開示モデルのトランスポータビリティ（ｔｒａｎｓｐｏｒｔａｂｉｌｉｔｙ）
複数の集団間の予後モデルのトランスポータビリティの問題は、予測モデルの有用性のための究極のテストを提供する。モデルの統計的および臨床的妥当性は、モデルのトランスポータビリティの、等しく重要な側面である。１）内部検証、２）時間的検証、３）外部検証の、３段階の検証アプローチが、新しいテストのために提案されている。モデリング手法を検証するために、事前検証のアプローチ（交差検定フォーム）を使用した第１ステップの完了は、上述した。第２ステップは、同じ集団や臨床センターからの異なる患者セットでのアルゴリズムテストをする必要がある。マーシュフィールド・スタディと現在の時間との間の、最後のイベントが起きた時間が、単に短い期間（２年程度）であるなら、後発イベントの数は、同じ集団内の検証のためには小さすぎであった。したがって、外部検証ステップは、本開示のタンパク質モデルのトランスポータビリティのデモンストレーションとして設定された、ＭＥＳＡサンプルに、本開示のタンパク質モデルをテストすることによって実施された。
【０２１４】
ＭＥＳＡコホートにおける本開示モデルのパフォーマンスを評価するために、８２４のサンプル（２２２人の症例および６０２人のコントロール）が、実施例７に記載の蛋白質バイオマーカー（ＩＬ−１６、エオタキシン（ｅｏｔａｘｉｎ）、ｆａｓリガンド、ＣＴＡＣＫ、ＭＣＰ−３、ＨＧＦ、およびｓＦａｓ）のパネルを使用してアッセイされた。
【０２１５】
マーシュフィールド訓練済みモデル（Ｍａｒｓｈｆｉｅｌｄ−ｔｒａｉｎｅｄｍｏｄｅｌ）は、ＭＥＳＡの結果からの知見やインプットなしに、マーシュフィールド集団で実行されたマーカー選択とモデルフィッティングによって、ＭＥＳＡサンプルの各対象のスコアを予測するために使用された。
【０２１６】
すべてのモデルの絶対リスクスコアの計算は、上記のアプローチに基づくものであった。危険因子とバイオマーカーに対する幾らかの欠損値のため、コホートの重みは各比較のそれぞれの状態（ｓｔａｔｕｓ）と性別の組み合わせに変更された。女性と男性の症例またはコントロールの再分類は、同じ重みを運ばないので、再分類の計算でも、同じ修正済みの重みを占めた。これは、欠損値はランダムな欠落によると仮定して、全集団に対して結果を適切に拡張する試みで行われた。
【０２１７】
表２５、表２６は、レイノルズスコア（Ｒｅｙｎｏｌｄｓｓｃｏｒｅ）に対する比較と同様に、以前に提示したＮＲＩとＣＮＲＩの観点から、本開示のモデルと、３つの他のモデルとの比較を示している［ＲｉｄｋｅｒＰＭ，ＢｕｒｉｎｇＪＥ，ＲｉｆａｉＮ，ｅｔａｌ．Ｄｅｖｅｌｏｐｍｅｎｔａｎｄｖａｌｉｄａｔｉｏｎｏｆｉｍｐｒｏｖｅｄａｌｇｏｒｉｔｈｍｓｆｏｒｔｈｅａｓｓｅｓｓｍｅｎｔｏｆｇｌｏｂａｌｃａｒｄｉｏｖａｓｃｕｌａｒｒｉｓｋｉｎｗｏｍｅｎ：ｔｈｅＲｅｙｎｏｌｄｓＲｉｓｋＳｃｏｒｅＪＡＭＡ２００７；２９７：６１１−６１９］。比較はマーシュフィールド・セットからの予測パフォーマンスと一致していた。本開示モデルは、ここに提示の他のいかなるトランスポートモデルの上にも、より良い臨床ネット再分類（ｃｌｉｎｉｃａｌｎｅｔｒｅｃｌａｓｓｉｆｉｃａｔｉｏｎ）を提供した。ベースライン生存関数を推定するためのスコアの平均を用いる方法は、個々の推定値を用いる方法に比べて、症例とコントロール間の再分類によりよいバランスを提供した。これは、ＭＥＳＡサンプル（図１４Ａおよび１４Ｂ）上でこれらのモデルの相対的リスク予測に、再度一致した。これらの結果は、明らかに、ＭＥＳＡセット内の、低中間（ｌｏｗｉｎｔｅｒｍｅｄｉａｔｅ）／中間のリスク集団の本開示モデルの臨床的有用性とトランスポータビリティをサポートしている。非糖尿病集団でのモデルの予測能力は、ＮＲＩとＣＮＲＩの観点から、表２７に示されている。以降では、リスクの中間範囲は、参照モデルに基づいて、３．５から７．５％の間隔に設定されている。ベースラインで糖尿病と診断されたすべての被験者は、比較から除外されている。結果は、再び、非糖尿病患者のための中間リスクカテゴリーのモデルの臨床的有用性を示している。
【表２５】

ＦＲＳ、４−ＴＲＦ、９−ＴＲＦモデルおよびレイノルズスコアモデル（Ｒｅｙｎｏｌｄｓｓｃｏｒｅｍｏｄｅｌｓ）に対してアヴィール・スコア（Ａｖｉｉｒｓｃｏｒｅ）を比較した、ＭＥＳＡデータセットに対するＮＲＩとＣＮＲＩの結果。ＣＮＲＩは、参照モデルの３．５−１０％リスクのベースラインの範囲に基づいている。バイオマーカーデータが不足している被験者は、比較から除外されている。
【表２６】

ＦＲＳ、４−ＴＲＦ、９−ＴＲＦモデルおよびレイノルズスコアモデル（Ｒｅｙｎｏｌｄｓｓｃｏｒｅｍｏｄｅｌｓ）に対してアヴィール・スコア（Ａｖｉｉｒｓｃｏｒｅ）を比較した、ＭＥＳＡデータセットに対するＮＲＩとＣＮＲＩの結果。ＣＮＲＩは、参照モデルの３．５−７．５％リスクのベースラインの範囲に基づいている。バイオマーカーデータが不足している被験者は、比較から除外されている。
【表２７】

ＦＲＳ、４−ＴＲＦ、および９−ＴＲＦモデルに対してアヴィール・スコアを比較した、ＭＥＳＡデータセットに対するＮＲＩとＣＮＲＩの結果。ＣＮＲＩは、参照モデルの３．５−７．５％リスクのベースラインの範囲に基づいている。バイオマーカーデータが不足している被験者は、比較から除外されている。
【０２１８】
（実施例１０）
ハイブリッド・バイオマーカー予後／診断モデル
タンパク質バイオマーカー／ＴＲＦに加えて、ｍｉＲＮＡは、血液などの人間の体液で測定でき、ある被験者の将来の心血管イベントを予測するために使用することができる。
【０２１９】
表２８で提示されているｍｉＲＮＡセットから選択された共変量を有するハイブリッド予後モデルと、症例・コホート研究デザインを使用して単一スコアとして開示されたタンパク質・バイオマーカーモデル（実施例７−９を参照）とを、構築することによって、ハイブリッドのｍｉＲＮＡ／タンパク質バイオマーカーセットの予後パワーが決定される。コホート（ｃｏｈｏｒｔ）は、対象とする時間フレーム内にＭｌに進展した全ての症例（Ｎ＝２００）と２００のコントロールを含んでいる。より小さなコホートを効率的に利用するために、ＴＲＦｓとタンパク質予測因子は、単一の計算されたスコア（単一変数）の観点から処理される、ｍｉＲＮＡバイオマーカーの単変量関連づけ（ｕｎｉｖａｒｉａｔｅａｓｓｏｃｉａｔｉｏｎ）が、タンパク質バイオマーカーまたはＴＲＦｓについて観察されたそれよりも強力でない限り。後者のケースでは、多変量モデルが、使用可能なすべてのマーカー（ＴＲＦｓ、タンパク質バイオマーカー、ｍｉＲＮＡｓ）から変数を選択する、ペナルティー付き回帰法の使用に基づいて構築される。前者の場合には、スコアの計算は、前述のように、より大きなコホートで事前に推定された係数を使用して行われる。交差検定（Ｃｒｏｓｓ−ｖａｌｉｄａｔｉｏｎ）とペナルティ付き回帰テクニックは、３タイプのモデルのモデルサイズとｍｉＲＮＡマーカーを選択するために使用されている。ａ）ｍｉＲＮＡのみ（ｍｉＲＮＡ−ｏｎｌｙ）のモデル、ｂ）ＴＲＦ＋ｍｉＲＮＡベースモデル、および、ｃ）ＴＲＦ＋タンパク質＋ｍｉＲＮＡバイオマーカーベースモデル。適合されたモデルの期待されるパフォーマンスは、前述したＴＲＦ＋タンパク質ベースモデル（実施例８−９を参照）と同様に、ハイブリッドモデルの時間依存性ＡＵＣ、ＮＲＩ、およびＣＮＲＩ特性、対、ＦＲＳに基づいて、評価される。
【表２８】

【０２２０】
特に断りのない限り、明細書および特許請求の範囲で使用されている、分子量、反応条件の様に、成分、特性などの量を表現するすべての数字は、全ての例で、用語「約」で変更されるものとして理解されるべきである。したがって、これに反する指示がない限り、明細書及び添付の特許請求の範囲に記載の数値パラメータは、本開示によって得られるように求められた所望の特性に依存して変化しうる近似である。少なくとも、特許請求の範囲に均等論の適用を制限する試みとしてではなく、各数値パラメータは少なくとも、報告された有効桁数の光の中で、普通の丸め技術を適用することによって解釈されるべきである。開示の広い範囲を記載した数値範囲および数値パラメータは近似値であるにもかかわらず、特定の実施例に記載の数値は可能な限り正確に報告されている。しかし、任意の数値は、本質的には、それぞれの試験測定に見られる標準偏差に必然的に起因する特定のエラーが含まれている。
【０２２１】
用語「ａ」、「ａｎ」、「ｔｈｅ」、および本発明を説明する文脈（特に以下の特許請求の範囲の文脈）で使用される同様の指示は、特に文脈と明らかに矛盾したりまたはここに示さない限り、単数および複数の両方をカバーするために解釈されるべきである。本明細書での数値範囲の列挙は、単に、各個別の値がその範囲内にあることを個別に参照する簡単な方法として機能することを意図しているに過ぎない。そうでなければここに示されない限り、各個々の値は、それが本明細書に個々に記載されたかのように、本明細書に組み込まれている。そうでなければ本明細書に示された、あるいは明らかに文脈と矛盾しない限り、本明細書に記載のすべてのメソッドは、任意の適切な順序で実行することができる。本明細書で提供される任意のおよび全ての例、または典型的な言語（例えば、「など」）の使用は、本発明をより明らかにするためだけに意図され、それ以外の場合は、請求項に係る発明の範囲に制限をもたらすことはない。本明細書の言語は、本発明の実施に不可欠な任意のクレームされていない要素（ｎｏｎ−ｃｌａｉｍｅｄｅｌｅｍｅｎｔ）を示すものとして解釈されるべきではない。
【０２２２】
本発明の別の要素または実施形態のグループ分けは、それに制限されて解釈されるべきではない。各グループのメンバーは、参照され、個々にクレイムされ、グループの他のメンバーと組み合わされ、または、本明細書にある他の要素と組み合わされてクレムされることができる。利便性、および／または特許性の理由で、グループの１つまたは複数のメンバーが含まれるか、グループから削除されることは予想される。そのような包含または削除が発生した場合、明細書は、添付の特許請求の範囲で使用されているすべてのマーカッシュ群の記述要件を満たすよう修正されたグループが含まれているとみなされる。
【０２２３】
本発明の特定の実施形態は、本発明を実施するよう発明者に知られているベストモードを含んで、本明細書に記載されている。もちろん、これらの記載した実施形態のバリエーションは、上記の説明を読めば当業者に明らかになるであろう。本発明者は、当業者がそのようなバリエーションを適切に採用することを期待し、そして、さもなければ、本明細書に具体的に記載したこと以上に実施されると考えている。したがって、本発明は、適用される法律によって許可されているように、ここに添付した特許請求の範囲に記載されている主題のすべての改変および均等物を含んでいる。さらに、そうでなければここに示された、あるいは明らかに文脈と矛盾しない限り、すべての可能なバリエーションで、上記の要素の任意の組み合わせは、本発明に包含される。
【０２２４】
本明細書に開示される特定の実施形態は、言語からなる構成を使用する特許請求の範囲、または、本質的に言語からなる特許請求の範囲において、さらに制限を受けている。当初のクレーム又は補正の際に追加されるクレームで使用する場合、「〜から成る（ｃｏｎｓｉｓｔｉｎｇｏｆ）」との遷移用語は、特許請求の範囲に指定されていない任意の要素、ステップ、または成分を除外する。「本質的に、〜から成る（ｃｏｎｓｉｓｔｉｎｇｅｓｓｅｎｔｉａｌｌｙｏｆ）」との遷移用語は、指定された材料、ステップ、および基本的かつ新規な特徴に実質的に影響を与えないものに、特許請求の範囲が制限される。その様にクレームされた本発明の実施の形態は、本明細書に、本質的または明示的に記述され、使用可能である。
【０２２５】
さらに、本明細書を通して、多数の特許や刊行物が参照されている。上記の引用文献および刊行物の各々は、個別に、その全体が参照により本明細書に援用されている。
【０２２６】
最後に、本明細書に開示の本発明の実施形態は、本発明の原理を例示するものであることは理解されるべきである。採用可能な他の修正は、本発明の範囲内である。この様に、例示の方法で、しかしそれに限定されることなく、本発明の他の構成は、本明細書の教示に従って利用することができる。したがって、本発明は、正確に示され記載されたものに、限定されない。
【０２２７】
本明細書に開示される特定の実施形態は、言語からなる構成を使用する特許請求の範囲、または、本質的に言語からなる特許請求の範囲において、さらに制限を受けている。当初のクレーム又は補正の際に追加されるクレームで使用する場合、「〜から成る（ｃｏｎｓｉｓｔｉｎｇｏｆ）」との遷移用語は、特許請求の範囲に指定されていない任意の要素、ステップ、または成分を除外する。「本質的に、〜から成る（ｃｏｎｓｉｓｔｉｎｇｅｓｓｅｎｔｉａｌｌｙｏｆ）」との遷移用語は、指定された材料、ステップ、および基本的かつ新規な特徴に実質的に影響を与えないものに、特許請求の範囲が制限される。その様にクレームされた本発明の実施の形態は、本明細書に、本質的または明示的に記述され、使用可能である。

【特許請求の範囲】
【請求項１】
ヒトの心臓血管の健康を評価するための方法であって、
ａ）ヒトから生物学的サンプルを得ること、
ｂ）前記生物学的サンプル中の、表２０に記載のｍｉＲＮＡの中から選択される少なくとも２つのｍｉＲＮＡマーカーのレベルを決定すること、
ｃ）各ｍｉＲＮＡマーカーのレベルを有するデータセットを得ること、
ｄ）前記生物学的サンプルを分類するために前記データを使用する分析・分類プロセスに、前記データを入力することであって、ここで、分類は、アテローム性動脈硬化心血管疾患の分類、健康の分類、薬剤曝露の分類、薬剤曝露無しの分類から成る群から選択されること、及び、
ｅ）ステップ（ｄ）の分類に基づいてヒトのための治療計画を決定することを含み、
当該ヒトの心臓血管の健康が評価されること、
を特徴とする、方法。
【請求項２】
前記少なくとも２つのｍｉＲＮＡマーカーは、ｍｉＲ−３７８、ｍｉＲ−４９７、ｍｉＲ−２１、ｍｉＲ−１５ｂ、ｍｉＲ−９９ａ、ｍｉＲ−２９ａ、ｍｉＲ−２４、ｍｉＲ−３０ｂ、ｍｉＲ−２９ｃ、ｍｉＲ−３３１．３ｐ、ｍｉＲ−１９ａ、ｍｉＲ−２２、ｍｉＲ−１２６、ｌｅｔ−７ｂ、ｍｉＲ−５０２．３、およびｍｉＲ−６５２から成る群から選択される、請求項１に記載の方法。
【請求項３】
前記少なくとも２つのｍｉＲＮＡのマーカーは、ｍｉＲ−３７８、ｍｉＲ−４９７、ｍｉＲ−２１、ｍｉＲ−１５ｂ、ｍｉＲ−９９ａ、およびｍｉＲ−６５２から成る群から選択される、請求項２に記載の方法。
【請求項４】
前記アテローム性動脈硬化心血管疾患の分類は、冠動脈疾患、心筋梗塞（ＭＩ）、不安定狭心症から成る群から選択される、請求項１に記載の方法。
【請求項５】
さらに、アテローム性動脈硬化症の診断、アテローム性動脈硬化症のステージング、アテローム性動脈硬化症の予後、血管の炎症レベル、アテローム性動脈硬化症の進行の程度を、決定すること、治療反応をモニタリングすること、冠動脈カルシウムスコアを予測すること、アテローム性動脈硬化症症状の安定性のものと不安定なものとを区別すること、および、それらの組み合わせのために分類を使用することを特徴とする、請求項１に記載の方法。
【請求項６】
前記データセットはさらに、１つ以上の臨床的しるし（ｃｌｉｎｉｃａｌｉｎｄｉｃｉａ）のためのデータを含む、請求項１に記載の方法。
【請求項７】
前記１個以上の臨床的しるしは、年齢、性別、ＬＤＬ濃度、ＨＤＬ濃度、トリグリセリド濃度、血圧、ボディマス指数、ＣＲＰ濃度、冠動脈カルシウムスコア、ウエスト周囲径、喫煙状況、心血管疾患の既往歴、心血管疾患の家族歴、心拍数、空腹時インスリン濃度、空腹時グルコース濃度、糖尿病の状態、高血圧薬の使用、およびそれらの組合せ、から成る群から選択される、請求項６に記載の方法。
【請求項８】
前記選択された臨床的しるしは、年齢、性別、糖尿病、およびＭｌの家族歴である、請求項７に記載の方法。
【請求項９】
前記生物学的サンプルは、血液、血清、血漿、唾液、尿、汗、母乳、及びそれらの組合せを含む、請求項１に記載の方法。
【請求項１０】
さらに、前記生物学的サンプル中の少なくとも一つのタンパク質バイオマーカーのレベルを決定することを含む、請求項１に記載の方法。
【請求項１１】
前記少なくとも１つのタンパク質バイオマーカーは、ＩＬ−１６、ｓＦＡＳ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン（ａｄｉｐｏｎｅｃｔｉｎ）、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦおよびＥＧＦから成る群から選択される、請求項１０に記載の方法。
【請求項１２】
前記少なくとも１つのタンパク質バイオマーカーは、ＩＬ−１６、エオタキシン、Ｆａｓリガンド、ＣＴＡＣＫ、ＭＣＰ−３、ＨＧＦ、およびｓＦＡＳから成る群から選択される、請求項１１に記載の方法。
【請求項１３】
３またはそれ以上の蛋白質バイオマーカーのレベルが決定される、請求項１１に記載の方法。
【請求項１４】
前記分析・分類プロセスは、予測モデルの使用を含む、請求項１に記載の方法
【請求項１５】
前記分析・分類プロセスは、得られた前記データセットを参照データセットと比較することを含む、請求項１に記載の方法。
【請求項１６】
前記予測モデルは、分類のために少なくとも０．６８の少なくとも１つの品質メトリック（ｍｅｔｒｉｃ）を含む、請求項１３に記載の方法。
【請求項１７】
前記品質メトリックは、ＡＵＣと精度から選択される、請求項１５に記載の方法。
【請求項１８】
前記分析・分類プロセスは、線形判別分析モデル、サポートベクターマシン分類（ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｃｌａｓｓｉｆｉｃａｔｉｏｎ）アルゴリズム、帰納的な特徴除去（ｒｅｃｕｒｓｉｖｅｆｅａｔｕｒｅｅｌｉｍｉｎａｔｉｏｎ）モデル、マイクロアレイモデルの予測分析、ロジスティック回帰モデル、ＣＡＲＴアルゴリズム、フレックス・ツリー・アルゴリズム、ＬＡＲＴアルゴリズム、ランダムフォレスト・アルゴリズム、ＭＡＲＴアルゴリズム、機械学習アルゴリズム、ペナルティ付き回帰法（ａｐｅｎａｌｉｚｅｄｒｅｇｒｅｓｓｉｏｎｍｅｔｈｏｄ）、およびそれらの組み合わせから成る群から選択される１以上のものの使用を含む、請求項１に記載の方法。
【請求項１９】
前記分析・分類プロセスは、少なくとも０．６８の品質メトリックを提供するように選択されるターム（ｔｅｒｍｓ）を含む、請求項１８に記載の方法。
【請求項２０】
前記分析・分類プロセスは、０．７０の品質メトリックを提供するように選択されるタームを含む、請求項１８に記載の方法。
【請求項２１】
前記分析・分類プロセスは、分類のための少なくとも０．７０の少なくとも１つの品質メトリックを含む、請求項１８に記載の方法。
【請求項２２】
前記治療計画は、追加検査、薬理学的介入、無治療、及びそれらの組合せからなる群から選択される１つまたは複数を含む、請求項１に記載の方法。
【請求項２３】
ヒトの心臓血管の健康を評価するための方法であって、
ａ）ヒトから生物学的サンプルを得ること、
ｂ）前記生物学的サンプル中の、ＩＬ−１６、ｓＦａｓ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン（ａｄｉｐｏｎｅｃｔｉｎ）、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、およびＥＧＦから成る群から選択される少なくとも３つのタンパク質マーカーのレベルを決定すること、
ｃ）各タンパク質マーカーのレベルを有するデータセットを得ること、
ｄ）生物学的サンプルを分類するために前記データを使用する分析・分類プロセスに、前記データを入力することであって、ここで、分類は、アテローム性動脈硬化症心血管疾患分類、健康分類、薬剤曝露分類、薬剤非曝露分類から成る群から選択されること、及び、
ｅ）ステップ（ｄ）の分類に基づいてヒトのための治療計画を決定することを含み、
当該ヒトの心臓血管の健康が評価されること、
を特徴とする、方法。
【請求項２４】
前記少なくとも３つのタンパク質マーカーは、ＩＬ−１６、エオタキシン（ＥＯＴＡＸＩＮ）、Ｆａｓリガンド、ＣＴＡＣＫ、ＭＣＰ−３、ＨＧＦ、およびｓＦａｓからなる群から選択される、請求項２３に記載の方法。
【請求項２５】
前記データセットは、さらに、年齢、性別、ＬＤＬ濃度、ＨＤＬ濃度、トリグリセリド濃度、血圧、ボディマス指数、ＣＲＰ濃度、冠動脈カルシウムスコア、ウエスト周囲径、喫煙状況、心血管疾患の既往歴、心血管疾患の家族歴、心拍数、空腹時インスリン濃度、空腹時グルコース濃度、糖尿病の状態、高血圧薬の使用、およびそれらの組合せから成る群から選ばれる１以上の臨床的しるしのためのデータを含む、請求項２３に記載の方法。
【請求項２６】
治療計画の必要性または有効性を決定するためにヒトの心臓血管の健康を評価するための方法であって、
ヒトから生物学的サンプルを得ること、
前記生物学的サンプルでの、表２０に記載のｍｉＲＮＡの中から選択される少なくとも２つのｍｉＲＮＡマーカーのレベルを決定すること、
前記生物学的サンプルでの、ＩＬ−１６、ｓＦａｓ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン（ａｄｉｐｏｎｅｃｔｉｎ）、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、およびＥＧＦから成る群から選択される少なくとも３つのタンパク質マーカーのレベルを決定すること、
個々のｍｉＲＮＡマーカーおよびタンパク質マーカーのレベルを構成するデータセットを得ること、
前記生物学的サンプルを分類するために前記データを使用する分析・分類プロセスに、前記データを入力することであって、ここで、該分類は、アテローム性動脈硬化症心血管疾患分類、健康分類、薬剤曝露分類、薬剤非曝露分類から成る群から選択されること、および、
前記分類プロセスの出力に応じて前記生物学的サンプルを分類し、前記分類に基づいてヒトのための治療計画を決定すること、
を特徴とする、方法。
【請求項２７】
前記ｍｉＲＮＡマーカーは、ｍｉＲ−３７８、ｍｉＲ−４９７、ｍｉＲ−２１、ｍｉＲ−１５ｂ、ｍｉＲ−９９ａ、ｍｉＲ−２９ａ、ｍｉＲ−２４、ｍｉＲ−３０ｂ、ｍｉＲ−２９ｃ、ｍｉＲ−３３１．３ｐ、ｍｉＲ−１９ａ、ｍｉＲ−２２、ｍｉＲ−１２６、ｌｅｔ−７ｂ、ｍｉＲ−５０２．３、およびｍｉＲ−６５２から成る群から選択される、請求項２６に記載の方法。
【請求項２８】
前記タンパク質バイオマーカーは、ＩＬ−１６、エオタキシン、Ｆａｓリガンド、ＣＴＡＣＫ、ＭＣＰ−３、ＨＧＦ、およびｓＦＡＳから成る群から選択される、請求項２６に記載の方法。
【請求項２９】
治療計画の必要性または有効性を決定するためにヒトの心臓血管の健康を評価するためのキットであって、
生物学的サンプル中の表２０に記載のｍｉＲＮＡの中から選択される少なくとも２つのｍｉＲＮＡマーカーのレベルを決定するためのアッセイと、
使用説明書であって、
ｍｉＲＮＡマーカーの個々のレベルで構成されるデータセットを取得すること、
前記生物学的サンプルを分類するために前記データを使用する、分析・分類プロセスに前記データを入力することであって、前記分類は、アテローム性動脈硬化心血管疾患の分類、健康の分類、薬剤曝露の分類、薬剤曝露無しの分類から成る群から選択されること、
前記分類プロセスの出力に応じて前記生物学的サンプルを分類すること、および、
前記分類に基づいてヒトのための治療計画を決定すること、のための使用説明書と、
を含む、キット。
【請求項３０】
さらに、前記生物学的サンプルでの、ＩＬ−１６、ｓＦａｓ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン（ａｄｉｐｏｎｅｃｔｉｎ）、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、およびＥＧＦから成る群から選択される少なくとも３つのタンパク質マーカーのレベルを決定するためのアッセイと、
使用説明書であって、
前記タンパク質マーカーの個々のレベルで構成されるデータセットを取得すること、
前記生物学的サンプルを分類するために前記データを使用する、分析・分類プロセスに前記ｍｉＲＮＡと前記タンパク質マーカーの前記データを入力することであって、前記分類は、アテローム性動脈硬化症心血管疾患分類、健康分類、薬剤曝露分類、薬剤非曝露分類から成る群から選択されること、
前記分類プロセスの出力に応じて前記生物学的サンプルを分類すること、および、
前記分類に基づいてヒトのための治療計画を決定すること、のための使用説明書と、
を含む、請求項２９に記載のキット。
【請求項３１】
ヒトの心血管イベントのリスクを評価するための方法であって、
ａ）ヒトから生物学的サンプルを得ること、
ｂ）前記生物学的サンプル中の、表２０に記載のｍｉＲＮＡの中から選択される少なくとも２つのｍｉＲＮＡマーカーのレベルを決定すること、
ｃ）各ｍｉＲＮＡマーカーのレベルを構成するデータセットを得ること、
ｄ）前記データセットに基づいて心血管イベントのリスクを決定するために、リスク予測分析プロセスに前記データを入力すること、及び、
ｅ）ステップ（ｄ）の心血管イベントの予測リスクに基づいてヒトのための治療計画を決定することを含み、
当該ヒトの心臓血管イベントが評価されること、
を特徴とする、方法。
【請求項３２】
前記心血管イベントのリスクは、サンプルが得られた日から、約１年、約２年、約３年、約４年、および約５年から成る群から選択された期間に対して決定される、請求項３１に記載の方法。
【請求項３３】
前記生物学的サンプルでの、３つ以上のタンパク質バイオマーカーのレベルを決定することを、さらに含む、請求項３１に記載の方法。
【請求項３４】
前記３つ以上のタンパク質バイオマーカーは、ＩＬ−１６、ｓＦａｓ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン（ａｄｉｐｏｎｅｃｔｉｎ）、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、およびＥＧＦから成る群から選択される、請求項３３に記載の方法。
【請求項３５】
前記３つ以上のタンパク質バイオマーカーは、ＩＬ−１６、エオタキシン、Ｆａｓリガンド、ＣＴＡＣＫ、ＭＣＰ−３、ＨＧＦ、およびｓＦＡＳから成る群から選択される、請求項３４に記載の方法。
【請求項３６】
ヒトの心臓血管イベントのリスクを評価するための方法であって、
ａ）ヒトから生物学的サンプルを得ること、
ｂ）前記生物学的サンプルでの、ＩＬ−１６、ｓＦａｓ、Ｆａｓリガンド、ＭＣＰ−３、ＨＧＦ、ＣＴＡＣＫ、エオタキシン（ＥＯＴＡＸＩＮ）、アディポネクチン（ａｄｉｐｏｎｅｃｔｉｎ）、ＩＬ−１８、ＴＩＭＰ．４、ＴＩＭＰ．１、ＣＲＰ、ＶＥＧＦ、およびＥＧＦから成る群から選択される１以上のタンパク質マーカーのレベルを決定すること、
ｃ）各タンパク質マーカーのレベルを構成するデータセットを得ること、
ｄ）前記データセットに基づいて心血管イベントのリスクを決定するために、リスク予測分析プロセスに前記データを入力こと、及び、
ｅ）ステップ（ｄ）の心血管イベントの予測リスクに基づいて、ヒトのための治療計画を決定することを含み、
当該ヒトの心血管イベントのリスクが評価されること、
を特徴とする、方法。
【請求項３７】
心血管イベントのリスクは、サンプルが得られた日から、約１年、約２年、約３年、約４年、および約５年から成る群から選択された期間に対して決定される、請求項３６に記載の方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１Ａ】

【図１１Ｂ】

【図１２】

【図１３Ａ−Ｂ】

【図１４Ａ−Ｂ】

【公表番号】特表２０１３−５１３３８７（Ｐ２０１３−５１３３８７Ａ）
【公表日】平成２５年４月２２日（２０１３．４．２２）
【国際特許分類】

【出願番号】特願２０１２−５４３２９８（Ｐ２０１２−５４３２９８）
【出願日】平成２２年１２月９日（２０１０．１２．９）
【国際出願番号】ＰＣＴ／ＵＳ２０１０／０５９７８１
【国際公開番号】ＷＯ２０１１／０７２１７７
【国際公開日】平成２３年６月１６日（２０１１．６．１６）
【公序良俗違反の表示】
（特許庁注：以下のものは登録商標）
１．フロッピー
【出願人】（５１２１５１５３９）アヴィール　インコーポレイテッド (1)
【Ｆターム（参考）】

[ Back to top ]

循環器疾患の診断と分類のためのバイオマーカーアッセイ

メニュー

スポンサーリンク

次の公報 »

« 前の公報

循環器疾患の診断と分類のためのバイオマーカーアッセイ

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク