説明

癌診断パネル

【課題】必要な最少数のマーカーを用いて最も信頼できる結果が得られるよう、マーカーをポートフォリオに分類する。
【解決手段】診断適用への使用のためのマーカーのポートフォリオの選択方法は、診断パラメーターを定義し、パラメーターが最適化されるようパラメーター間での関係を確立し、そして診断適用のためのマーカーの最適グループを選択することを包含する。前記診断パラメーターは、1つの遺伝子の発現の相対的程度の基準、及び前記遺伝子の発現の程度の測定における基準の分散を包含し;そして前記診断と識別パラメーターとの間の関係が平均分散関係であり得る。
前記方法を実施するためにプログラムされた機械、及びそれらの操作ための使用説明書を含んで成る製品が本発明のさらなる観点である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、診断用マーカーのポートフォリオの選択に関する。
【背景技術】
【0002】
背景
少数の単一遺伝子診断マーカー、例えばヘル−2−ネウ(her-2-neu)が現在、使用されている。しかしながら、通常、疾病は、1つの特定の遺伝子についての分子診断剤によっては容易に診断されない。複数のマーカーがしばしば必要とされ、そして差遺伝子変調に基づくアッセイに包含され得るそのようなマーカーの数は多数であり、数百の遺伝子にさえおよぶ。必要な最少数のマーカーを用いて最も信頼できる結果が得られるよう、マーカーをポートフォリオに分類することが所望される。これは、複数段階、例えば核酸増幅段階を包含するアッセイにおいては、特に真実である。
【発明の概要】
【0003】
発明の要約
本発明は、配列番号1〜30、32、34及び98から成る群から選択された遺伝子の組み合わせにおける個々の遺伝子の差変調(正常集団における同じ遺伝子の発現に対して)を同定することによる癌の診断方法である。もう1つの態様においては、前記組合せは、配列番号32〜67、69及び98〜100から成る群から選択される。
前記方法を使用するための遺伝子発現ポートフォリオ及びキットが、本発明のさらなる観点である。
【発明を実施するための形態】
【0004】
特定の記載
本発明の方法は、適切な細胞の遺伝子発現パターンを決定するためのいずれかの方法、及び遺伝子発現を決定する、タンパク質に基づく方法と共に使用され得る。遺伝子発現プロフィールを確立するための好ましい方法は、タンパク質又はペプチドをコードすることができる遺伝子により生成されるRNAの量を決定することを包含する。これは、逆転写酵素PCR(RT−PCR)、競争RT−PCR、同時RT−PCR、差表示(differential display)RT−PCR、ノザンブロット分析及び他の関連する試験により達成される。個々のPCR反応を用いて、それらの技法を行うことが可能であるが、mRNAから生成されるコピーDNA(cRNA)を増幅し、そしてマイクロアレイを通してそれを分析することが最良である。
【0005】
多くの異なったアレイ配置及びそれらの生成方法は、当業者に知られており、そして次のアメリカ特許(それらは、引用により本明細書に組み込まれる)に記載されている:アメリカ特許第5,445,934号;第5,532,128号;第5,556,752号;第5,242,974号;第5,384,261号;第5,405,783号;第5,412,087号;第5,424,186号;第5,429,807号;第5,436,327号;第5,472,672号;第5,527,681号;第5,529,756号;第5,545,531号;第5,554,501号;第5,561,071号;第5,571,639号;第5,593,839号;第5,599,695号;第5,624,711号;第5,658,734号及び第5,700,637号。
【0006】
マイクロアレイ技法は、数千の遺伝子の定常状態mRNAレベルの同時測定を可能にし、それにより、制御されていない細胞増殖の開始、阻止又は調節のような効果を同定するための強力な手段を提供する。2種のマイクロアレイ技法が現在、広く使用されている。第1の技法はcDNAアレイであり、そして第2の技法はオリゴヌクレオチドアレイである。それらのチップの構成には、差異が存在するが、実質的にすべての下流のデータ分析及び出力は同じである。
【0007】
それらの分析の結果は、典型的には、マイクロアレイに基づいて既知の位置での核酸配列に対してハイブリダイズする、サンプルからのcDNA配列を検出するために使用されるラベルされたプローブから受動するシグナルの強度の測定である。典型的には、シグナルの強度は、サンプル細胞において発現されるcDNA及び従って、mRNAの量に比例する。多数のそのような技法は入手でき且つ有用である。遺伝子発現を決定するための好ましい方法は、アメリカ特許第6,271,002号(Linsleyなど.); 第6,218,122号(Friendなど.);第6,218,114号(Peckなど.)及び第6,004,755号(Wandなど.)(それらの開示は引用により本明細書に組み込まれる)に見出され得る。
【0008】
発現レベルの分析は、そのような強度の比較によって行われる。これは、試験サンプルにおける遺伝子の発現強度−対−対照サンプルにおけるそれらの強度の比率マトリックスを生成することによって最良に行われる。例えば、疾病組織からの遺伝子発現強度が、同じタイプの正常組織から生成される発現強度と比較され得る(例えば、疾病結腸組織サンプル−対−正常結腸組織サンプル)。それらの発現強度の比は、試験サンプルと対照サンプルとの間の遺伝子発現における倍率−変化を示す。
【0009】
変調された遺伝子は、非正常細胞においてアップレギュレートされるか、又はダウンレギュレートされる場合、特異的に発現されるそれらの遺伝子である。アップレギュレーション及びダウンレギュレーションとは、検出できる差異(ノイズを測定するための使用されるシステムにおけるノイズの寄与を越えて)が、基線に対する遺伝子の発現の量として見出されることを意味する相対的用語である。この場合、基線は正常細胞の測定された遺伝子発現である。次に、非正常細胞における注目的遺伝子が、同じ測定方法を用いて、基線レベルに対してアップレギュレートされるか又はダウンレギュレートされる。
【0010】
好ましくは、アップ及びダウンレギュレーションのレベルは、ハイブリダイズされるマイクロアレイプローブの強度側定値の倍率変化に基づいて区別される。例えば、1.5倍又はそれ以上の差異がそのような識別を行うために使用される場合、疾病細胞は、正常細胞よりも少なくとも1.5倍高いか又は1.5倍低い強度を生むことが見出される。
【0011】
識別を行う他の方法が利用できる。例えば、統計学的試験は、種々のサンプルグループ間で最も有意に異なる遺伝子を見出すために使用され得る。スチューデントのt−試験は、2種のグループ間での有意な差異を見出すために使用され得る強い統計学的試験の例である。p-値が低いほど、遺伝子が異なったグループ間での差異を示す証拠をより一層、強制する。それもかかわらず、マイクロアレイは1つよりも多くの遺伝子を同時に測定するので、10,000の統計学的試験が1度に行われ得る。このために、偶然、低いp−値を見出す傾向があり、そしてSidak補正及びランダム化/過突然変異誘発実験を用いて、このための調製が行われ得る。
【0012】
t−試験による0.05以下のp−値は、遺伝子が有意に異なる証拠である。より強制証拠は、Sidak補正が計算に入れられた後の0.05以下のp−値である。個々のグループにおける多数のサンプルに関しては、ランダム化/過突然変異誘発試験の後の0.05以下のp−値は、有意な差異の最も強制的証拠である。
【0013】
グループにおける遺伝子組について得られる情報が臨床学的に適切な判断、例えば診断、予後又は処理選択を行うための正常な基礎を提供するよう遺伝子がグループ分けされ得る。それらの組の遺伝子が本発明のポートフォリオを構成する。ほとんどの診断マーカーに関しては、正しい医学的判断を行うために十分な最少のマーカーを用いることがしばしば、所望される。これは、さらなる分析を継続する処理の遅延、及び時間及び供給源の不適切な使用を妨げる。好ましい最適なポートフォリオは、判断が実際、正しい確立を最大にする条件を満たすと共に、そのような判断を行うための最少数のマーカーを使用するポートフォリオである。それらの条件は一般的に、感受性及び特異性必要条件を包含するであろう。
【0014】
マイクロアレイに基づく検出方法においては、ポートフォリオの感受性は、正常状態に対する疾病又は異常状態における遺伝子の発現により示される倍率差異において影響され得る。遺伝子の示差的発現の検出は、それがもう1つの状態において遺伝子の発現に関して大きな倍率変化を示す場合、感受性である。感受性のもう1つの観点は、ノイズとシグナルとを区別する能力を示すが、1つのもの(例えば、マイクロアレイにおける強度測定値)により生成されるシグナルが所定の設定(例えば、臨床学的実験室)において、ノイズと容易に区別されるレベル以下である場合、その遺伝子は最適ポートフォリオから排除されるべきである。最適ポートフォリオを定義するそれらの条件を設定するための方法は、本発明の方法に組み込まれ得る。
【0015】
特異性は、遺伝子発現のシグナル化と注目の条件との相互関係の統計学的測定値において影響され得る。1組の遺伝子の示差的発現は大きな倍率変化を生成することが観察されるが、しかしそれらが注目の状態以外の多くの状態(例えば、多発性疾病状態)に関してそうである場合、前記組の遺伝子についての遺伝子発現プロフィールは非特異的である。データの相関又はデータの精度の程度、例えば標準偏差、相関係数及び同様のものの統計学的測定値は、そのような測定値として使用され得る。
【0016】
ポートフォリオにおける包含についての遺伝子グループを考慮する場合、発現測定値における小さな標準偏差は高い特異性と相関する。類似する発現パターンを示す遺伝子は、同じ方法に遺伝子を押し進める同一の因子により同時調節され得る。この因子はサンプルを分類するために十分で成るが、しかし必ずしも必要ではない場合、それらの遺伝子は、マーカーがこの単一因子にすべて関係しているかどうかについて、サンプルを正しく同定するのに失敗するであろう。次に、多様化が、できるだけ少数のマーカーの選択をもたらし、さらにデータ組に含まれる多くの異なった最適発現パターンとして担当する。
【0017】
本発明の方法においては、遺伝子マーカーのグループが、診断適用への使用のために選択される。それらのマーカーグループが、“ポートフォリオ”である。診断適用は、対象の疾病状態の検出又は同定、対象が所定の疾病又は病状を縮小する傾向の決定、疾病を有する対象が治療に応答するであろう傾向の決定、疾病を有する対象の予後(又はその可能性ある進行又は後退)の決定、及び疾病を有する対象に対する処理の効果の決定を包含する。例えば、前記方法は、結腸癌を縮小する対象の存在又は傾向、又はそのような対象が細胞毒性薬剤に対して有利に応答するであろう傾向を検出するためのポートフォリオを確立するために使用され得る。
【0018】
本発明の方法により選択されるポートフォリオは、正確且つ精密な結果を確かにし、そしてポートフォリオを含んで成る遺伝子の数により経済的に使用される多数型のマーカーを含む。本発明の方法は、いずれかの疾病、病状、又は複数遺伝子の発現に付随する状態についての最適な遺伝子発現ポートフォリオを確立するために使用され得る。本発明における最適ポートフォリオとは、次のパラメーター:正確度、精度、及びポートフォリオを含んで成る遺伝子の数のうち少なくとも2種のパラメーターの予定された標準に従って、対象の状態(分析が取られる状態に基づいて)の評価を提供する遺伝子発現プロフィールを言及する。
【0019】
最も好ましくは、ポートフォリオに使用されるマーカーは、mRNA(“遺伝子”)を発現する核酸配列である。マーカーの発現は、通常、健康な対象において生じ、そして診断適用の目的である現象が存在する場合、より高く発現されるか又は高く発現され得る。他方では、発現は、診断適用の目的である現象が存在する場合を除いて、存在し得ない。
【0020】
診断の判定を行うために比較され得るマーカー計算値、特徴、表示又は測定値が、前記方法に使用される診断パラメーターである。遺伝子発現レベルのインジケーターは、最も好ましい診断パラメーターである。そのようなインジケーターは、上記のようにして、マイクロアレイから読み取られる強度測定値を包含する。他の診断パラメーター、例えばマーカーのメチル化の相対的程度のインジケーターもまた可能である。
【0021】
識別は、お互い関連する数学的/統計学的値の使用を通して、診断パラメーター間で行われる。好ましい識別は、遺伝子発現を示す平均シグナル読み取り、及びそのような読み取り変動の測定値である。最も好ましい識別は、異なったグループ読み取り(例えば、マイクロアレイ強度測定値)とシグナル比測定値の標準偏差との間のシグナル比の平均の使用により行われる。多数のそのような数学的/統計学的値が、それらの位置、例えば所定の%でのリターンにおいて使用され得る。
【0022】
診断パラメーター識別間の関係が、診断適用のために有用なマーカーの選択を最適化するために使用される。しかしながら、帰納的アプローチがまた、入力データ選択又はデータ出力を補充するために適用され得るか又は使用され得る。最も好ましい関係は、平均分散関係、例えばMean−Variance Analysis in Portfolio Choice and Capital Markets by Harry M. Markowitz (Frank J. Fabozzi Associates, New Hope, PA: 2000, ISBN: 1-883249-75-9) (引用により本明細書に組み込まれる)に記載されるその関係である。前記関係は、財政投資ポートフォリオに関しての株式の選択において最良に理解される。これは、前記関係が進行し、そして解明された情況である。
【0023】
株式のポートフォリオを最適化する投資家は、多数の可能な株式から選択し、個々は、リターンの歴史的比較及びリスク率を有する。平均分散方法は、所定のレベルの予測されるリターンについてのリスク(分散又は標準偏差により測定されるような)を最少にし、そして所定レベルのリスクについての予測されるリターンを最大にするすべての実施できるポートフォリオを同定するために、線状プログラミング又は二次プログラミングの決定的な線状アルゴリズムを使用する。標準偏差が予測されるリターンに対してプロットされる場合、効果的な境界が生成される。効果的境界にそっての株式の選択は、リターン及びリスクにおいて最適化された、多様化された株式ポートフォリオをもたらす。
【0024】
平均分散関係が本発明の方法に使用される場合、診断パラメーター、例えばマイクロアレイシグナル強度及び標準偏差は、財政ポートフォリオの選択に使用されるリターン及びリスク率を置換する。最も好ましくは、平均分散関係が適用される場合、市販のコンピューターソフトウェアアプリケーション、例えば本明細書に通して“Wagner Software”として言及される、”Wagnr Associates Mean-Variance Optimization Application”が使用される。
【0025】
このソフトウェアは、Markowitzセンスで効果的境界及び最適ポートフォリオを決定するために、”Wagnr Associates Mean-Variance Optimization Library” からの関数を用いる。そのようなアプリケーションは財政上のアプリケーションのために製造されているので、入力データがソフトウェアにより必要とされる慣例に従えられるように、その入力データを予備的処理することが必要である。例えばWagnerソフトウェアがマイクロアレイ強度測定値と共に使用される場合、次のデータ変換方法が使用される。
【0026】
個々の遺伝子基線と実験値との間の関係が最初に確立されるべきである。好ましい方法は、次の通りに行われる。基線の種類が選択される。典型的には、これは、注目的条件を有さない集団からの遺伝子を含んで成るであろう。例えば、乳癌についての診断である遺伝子のポートフォリオを選択することに興味がある場合、乳癌を有さない患者からのサンプルが基線の種類を製造するために使用され得る。基線の種類が選択されると、算術平均及び標準偏差が基線の種類サンプルのための個々の遺伝子の遺伝子発現のインジケーターのために計算される。
【0027】
次に、コンピューター処理された統計学的データが、個々の遺伝子についての(X標準偏差+平均)の基線値を計算するために使用される。これは、すべての他のサンプルが比較される遺伝子についての基線読み取りである。Xはポートフォリオを処方する個人により選択される緊縮変数である。Xの値が高いほど、より緊縮性になる。好ましくは、Xは0.5〜3の範囲であり、2〜3がより好ましく、そして3が最も好ましい。
【0028】
個々の実験サンプル(注目的状態を表示するそれら)−対−基線読み取りの間の比率が計算される。次に、その比率が、ソフトウェアによるデータ取り扱いの容易さのために底10の対数値に変換される。これは、Wagnerソフトウェアを用いて、Markman平均−分散アルゴリズムに従って最適化のために必要な負の値へのダウンレギュレートされた遺伝子の表示を可能にする。
それらの変換された比率を含んで成る予備処理されたデータは、それが財政分析目的のために使用される場合、Wagnerソフトウェアに通常使用されるリターン値の代わりに入力として使用される。
【0029】
効果的境界が処方されると、最適化されたポートフォリオが、前記境界上の点に対応する所定の入力レベル(リターン)又は分散のために選択される。それらの入力又は分散は、ポートフォリオを処方する個人により設定される予定された標準である。換言すれば、最適なポートフォリオを探究する個人は、許容できる入力レベル(感染性の表示)又は所定レベルの分散(特異性の表示)を決定し、そしてその入力レベル又は分散に対応する効果的な境界にそって存在する遺伝子を選択する。Wagnerソフトウェアは、入力レベル又は分散が選択される場合、そのような遺伝子選択することができる。それはまた、それが株式ポートフォリオにおける株に関してであるように、ポートフォリオにおける個々の遺伝子に重量を割り当てることができる。
【0030】
サンプルが、ポートフォリオが診断である条件を有するかどうかの決定は、患者サンプルについてのポートフォリオにおける遺伝子の発現と、ポートフォリオを確立するために使用される、示差的に発現された遺伝子の計算された値とを比較することによって行われ得る。好ましくは、ポートフォリオ値が、ポートフォリオにおける個々の遺伝子の、強度値のポートフォリオ選択工程におけるその遺伝子に割り当てられる重量による積を要約することによって、最初に生成される。次に、境界値が、(Y標準偏差+基線グループについてのポートフォリオ値の平均)により計算され、ここでYは上記Xと同じ意味を有する緊縮値である。次に、基線の種類の境界値よりも高いポートフォリオ値を有するサンプルが、その条件を有するものとして分類される。所望には、この工程は、信頼レベルを改良するための良く知られている統計学的方法に従って、反復して行われ得る。
【0031】
任意には、最良の予測正確度が得られるまで、この工程を反復することができる。未知のもののポートフォリオ選択及び特徴づけの工程は次の通りである:
1.基線の種類を選択し:
2.基線の種類のサンプルンついて、個々の遺伝子の平均及び標準偏差を計算し;
3.個々の遺伝子について(X標準偏差+平均)を計算する。これは、すべての他のサンプルが比較される基線読み取りである。Xは緊縮変数であり、高いX値は、低いX値よりも緊縮性である。
4.個々の実験サンプル−対−段階3で計算された基線読み取り間の比率を計算し;
【0032】
5.1以下の比率が負であるように比率を変換し(例えば、対数底10を用いて)。(ダウンレギュレートされた遺伝子が現在、MV最適化のために必要な負の値を正確に有する);
6.それらの変換された比率が、ソフトフェアアプリケーションに通常使用される有用なリターンの変わりに入力として使用され;
7.前記ソフトウェアは、効果的な境界をプロットし、そしてその効果的な境界にそってのいずれかの点での最適化されたポートフォリオを戻し;
8.前記効果的な境界上の所望するリターン又は分散を選択し;
9.ポートフォリオ選択アルゴリズムにより生成される重量による、個々の遺伝子の強度値の積を要約することにより、個々のサンプルについてのポートフォリオ値を計算し;
【0033】
10.(Y×基線のポートフォリオ値の標準差)+平均ポートフォリオ値により境界値を計算する。この境界値よりも大きな値は、実験種類として分類されるであろう;
11.任意には、最良の予測正確度が得られるまで、この工程を反復することができる。第2プロフォリオが任意には、基線及び実験計算を逆にすることによって創造され得る。これは、元の基線の種類においてアップ−レギュレートされる遺伝子の新規ポートフォリオを創造する。この第2ポートフォリオ値は、複数のポートフォリオに基づいて新規分類値を創造するために、第1の値から控除され得る。
ポートフォリオを選択するための工程のための入力として使用され得るよう、遺伝子発現データからの遺伝子のもう1つの予備選択方法は、下記式:
【0034】
【数1】

【0035】
により与えられる限界に基づかれており、ここでμiは疾病又は病状を有することが知られているサブセットの平均であり、μnは正常サンプルのサブセットの平均であり、そしてσi+σnは組合わされた標準偏差を表す。シグナル:ノイズ カットオフはまた、1つの関係、例えば下記式:
【0036】
【数2】

【0037】
に従って、データを予備選択することによって使用され得る。これは、それらの差変調に基づいて予備選択される遺伝子が臨床学的に有意な手段で識別されることを確実にする。それは、診断パラメーターを測定する仕事に適切な計測のノイズレベル以上である。それらの基準に従っての予備選択された個々のマーカーに関しては、縦列がサンプルを表し、横列がマーカーを表し、そして個々の要素が、下記関係:
【0038】
【数3】

【0039】
(ここでIは強度測定値である)に従ってのマーカーの発現についての標準化された強度測定値であるマトリックスが確立される。
財政ポートフォリオソフトウェアについての入力を創造するこの工程の使用は、最適ポートフォリオを定義するために追加の境界条件の設定をまた可能にする。例えば、ポートフォリオサイズは、固定された範囲又は多くのマーカーに制限され得る。これは、データ予備選択基準をより厳重にすることにより(例えば、下記式:
【0040】
【数4】

の代わりに、下記式:
【0041】
【数5】

【0042】
を用いて)、又は特徴のプログラミング、例えばポートフォリオサイズの制限を用いることにより行われ得る。例えば、効果的境界が最適な10の遺伝子のみから選択されるべき境界条件を定めることができる。また、効果的境界を決定するために予備選択されたすべての遺伝子を使用し、そして次に、選択された遺伝子の数を制限することができる(例えば、10以下)。
【0043】
ポートフォリオの選択方法はまた、帰納的規則の適用を包含することができる。好ましくは、そのような規則は、生物学、及び臨床学的結果を生成するために使用される技術の理解に基づいて生成される。より好ましくは、それらは、最適化された方法からの出力に適用される。例えば、ポートフォリオ選択の平均分散方法は、乳癌を有する対象において示差的に発現される多くの遺伝子についてのマイクロアレイデータに適用され得る。
【0044】
前記方法からの出力は、末梢血液、及び疾病の乳房組織において発現されるいくつかの遺伝子を包含する最適化された遺伝子組である。試験方法に使用されるサンプルが末梢血液から得られ、そして乳癌の場合に示差的に発現される一定の遺伝子がまた、末梢血液において示差的に発現される場合、ポートフォリオが、末梢血液において示差的に発現されるそれらの遺伝子を除いて、効果的に境界から選択される帰納的規則が適用され得る。勿論、前記規則は、データ予備選択の間、前記規則を適用することにより、効果的境界の形式の前、適用され得る。
【0045】
問題の生物学に必ずしも関連しない他の帰納的規則が適用され得る。例えば、ポートフォリオの所定の百分率のみが特定の遺伝子により表され得る規則を適用することができる。市販のソフトウェア、例えばWagnerソフトウェアは、それらのタイプの帰納法を容易に適応する。これは、例えば、正確度及び精度以外の因子(例えば、予測される実施許諾料)が1又は複数の遺伝子の所望性に影響を及ぼす場合、有用であり得る。平均−分散関係を除く他の関係は、それらが予定された特性、例えばアッセイ正確度及び精度に従ってポートフォリオを最適化する場合、本発明の方法に使用され得る。
【0046】
2種の例は、Martin同時等式アプローチ(Elton, Edwin J. and Martin J. Gruber (1987), Modern Portfolio Theory Investment Analysis, Third Edition, John Wiley, New York, 1987)、及び遺伝的アルゴリズム(Davis, L., (1989), Adapting Operator Probabilities in Genetic Algorithms, in Proceedings of the Third International Conference on Genetic Algorithms, Morgan Kaufinann: San Matco, pp. 61-69)である。例えば、マーカー検出技法が既知の偏りを示す場合のゆがんだデータを取り扱うために、平均−分散関係を適合する多くの手段が存在する。それらは、対照シグナルからの平均平方(負の)偏差の平方根が対照シグナル以下になるそれらのシグナル値のみを包含する半−偏差方法を包含する。
【0047】
本発明の製品は、疾病を処理し、診断し、予後し、そして他方では、評価するために有用なポートフォリオを製造する遺伝子発現プロフィールの表示を包含する。それらの表示は、機械、例えばコンピューター読み取り可能媒体(磁気、光学及び同様のもの)により自動的に読み取られ得る媒体に変換される。製品はまた、そのような媒体において遺伝子発現プロフィールを評価するための使用説明書を包含することができる。
【0048】
例えば、製品は、上記遺伝子のポートフォリオの遺伝子発現プロフィールを比較するためのコンピューター使用説明書を有するCD ROMを包含することができる。製品はまた、そこにおいてデジタル記録される遺伝子発現プロフィールを有することができ、その結果、それらは患者サンプルからの遺伝子発現データと比較され得る。他方では、前記プロフィールは異なった表示フォーマットで記録され得る。グラフの記録が1つのそのようなフォーマットである。
【0049】
本発明の異なったタイプの製品は、遺伝子発現プロフィールを示すために使用され、媒体又はフォーマットされたアッセイである。それらは、例えば配列補体又はプローブが、注目的遺伝子を示す配列が結合し、それらの存在を読み取ることができる決定因子を創造するマトリックスに付加されるマイクロアレイを包含することができる。そのようなマイクロアレイが、時間を非常に節約する、最適化されたポートフォリオを含む場合、工程手段、及び供給源は、基質に適用され、サンプルと反応せしめされ、分析機により読み取られ、結果について処理され、そして(時々)確証されるべきであるcDNA又はオリゴヌクレオチドの数を最少にすることによって達成される。
【0050】
本発明の他の製品は、本発明の方法を通して確立されたポートフォリオにおける遺伝子の発現レベルを示す、ハイブリダイゼーション、増幅及びシグナル生成を行うための試薬キットに形成され得る。本発明に従って製造されるキットは、遺伝子発現プロフィールを決定するためのフォーマットされたアッセイを包含する。それらは、アッセイを行うために必要とされる材料、例えば試薬及び使用説明書のすべて又はいくつかを包含することができる。
【実施例】
【0051】
例1:最適化されたポートフォリオの製造
遺伝子発現データを最近、11種の異なった型の癌の代表である組織サンプルから生成した。そのデータは、Cancer Research 61: 7388-7393, 2001、及びhttp://carrier.gnf.org/welsh/eican/において公開されている。Andrew I. Suなど., “Molecular Classification of Human Carcinomas by Use of Gene Expression Signature”を参照のこと。データは、“U95”オリゴヌクレオチドマイクロアレイ(Affymetrix, Inc.から市販されている)の使用により得られた強度測定値を包含した。
【0052】
公開されたデータからの遺伝子の発現の測定値(蛍光強度測定値)が、循環細胞が乳癌、前立腺、卵巣癌又は肺癌の存在を示すかどうかを決定するためのマーカーのパネルについての最適遺伝子発現ポートフォリオを選択するために使用された。そのような循環細胞は好ましくは、上皮細胞である。
研究におけるデータは、次のサンプル、例えば24個の腺癌、12個の浸潤性乳管腺癌、21個の結腸直腸腺癌、23個の卵巣癌、25個の肺癌、及び次の追加のサンプル、すなわち19個の前立腺癌、12個の乳癌、13個の結腸癌、13個の卵巣癌、及び89個の肺癌から収集された。
【0053】
基腺の種類としての正常サンプルの収集からの強度読み取りを用いて、算術平均、及び個々の遺伝子の標準偏差を計算し、続いて個々の遺伝子についての(X標準偏差+平均)値を計算した。緊縮性変数Xを、この場合、3の値として割り当てた。次に、比率を、研究に記載される個々の実験サンプル−対−基腺値計算の間で計算した。その比率を、通常の対数に変換した。次に、それらの値を、Wagnerソフトウェアのための入力値として使用した。
【0054】
この方法は、効果的境界を選択し、この境界にそって、個々の腫瘍型についての最少組のマーカーが選択レベルの差(最良のシグナル:ノイズ比率点で選択された)についての最少量の変動を有する。ソフトウェアによる最適化は、前立腺癌について2種の遺伝子、乳癌について5種の遺伝子、結腸癌についての6種の遺伝子、卵巣癌について2種の遺伝子及び肺癌マーカーについて9種の遺伝子を包含する24種のポートフォリオの選択をもたらした(表1及び表2)。
【0055】
【表1】

【0056】
【表2】

【0057】
例2:帰納的段階
帰納的処理をさらに、例1で得られたポートフォリオに適用した。すなわち、前記規則は、同定された遺伝子/マーカーがたぶん、末梢血液において発現されるか、又は十分に特徴づけられた組織マーカー(例えば、PSA、ママグロビン、等)である場合、そのような遺伝子/マーカーはポートフォリオから除去されることを言及する。前記規則の適用は、患者サンプルが末梢血液、例えば上皮細胞に見出される成分をアッセイすることによって得られるスクリーニング適用への使用のために最適化される遺伝子/マーカーのポートフォリオの確立を可能にした。選択されたポートフォリオの結果は、表3及び表4に示されるように、31種の遺伝子を含む。
【0058】
【表3】

【0059】
【表4】

【0060】
例3:予後ポートフォリオ
既知の臨床学的結果を有する患者サンプル組を用いて、本発明のポートフォリオ選択方法を試験した。前記サンプル組は、van’t Veer, L. J など., Gene Expression Profiling Predicts Clinical Outcome of Breast Cancer, Nature, 415, 530-536 (2002) (引用により本明細書に組み込まれる)に記載される。その研究にいおいては、乳房組織サンプルを、散在性乳房腫瘍を示す78人の患者から得た。患者はすべて、年齢55以下であり、そして5cm以下の腫瘍を有した。すべては、リンパ節陰性であった。患者の34人は、5年以下で遠隔転移を提供し、そして44人は同じ期間で遠隔転移を示さなかった。
【0061】
サンプル調製及び発現プロフィールは参照に記載される。70種の遺伝子の予後マーカーポートフォリオを、異なった予後(転移−対−非転移)を有する患者において示差的に発現される約5,000種の遺伝子の考慮から選択した。選択は、管理されていないクラスター化、続く相関係数分析に基づいて行われた。これは、疾病結果と個々の遺伝子の発現との相関係数を計算することによって行われた。次に、この分析による疾病に有意に関連するそれらは、70種の遺伝子の“最適化された”パネルが選択されるまで、“leave-one-out”法を用いて比較される場合、5種の連続グループにより順序づけされたランクであった。
【0062】
次に、研究からのデータを、本発明の方法に従って処理した。サンプル番号54を、高い百分率の欠側値のために、さらなる分析から除去した。個々の遺伝子についての強度測定値の平均及び標準偏差を、基線として非転移性サンプルを用いて計算した。次に、X(標準偏差+平均)の識別値を、個々の基線遺伝子について計算した(ここでXは3の値を割り当てられた)。この値を用いて、得られるポートフォリオが緊縮であることを確証した。次に、識別値:基腺値の比率を、個々の転移サンプルについて計算した。次に、この比率を通常のアルゴリズムに変換した。次に、このデータを、16種の遺伝子のポートフォリオが選択される効果的境界を生成するWagnerソフトウェア中に導入した。
【0063】
次に、基線及び実験値を逆にし、そして非転移性患者においてアップ−レギュレートされた、12種のマーカー提供遺伝子の第2ポートフォリオを生成した。第2ポートフォリオ値を、第1ポートフォリオ値から控除し、すべての28種の遺伝子からの組合されたポートフォリオ値を創造した。この最終ポートフォリオは、配列番号70〜97からの遺伝子から成る。このポートフォリオの17種の遺伝子はまた、対照に記載される70種の遺伝子ポートフォリオに存在した。ポートフォリオの遺伝子は下記に同定される。(配列番号70, 72, 73〜77, 79, 80, 85, 87, 91〜93, 95及び97。)
【0064】
【表5】

【0065】
【表6】

【0066】
次に、2種のポートフォリオを用いて、対照に記載される分類正確度を試験するための方法に従ってマイクロアレイからの遺伝子発現有意性を比較することによって、78種の元のサンプルの予後を決定した。70種の遺伝子ポートフォリオの場合、サンプルの81%が、不良の予後を示すものとして、不明瞭な有意性を包含するよう偏向された、最適化された限界に従って、適切に特徴づけられた(絶対限界については85%)。このボートフォリオは、前記最適化された限界を用いて、良好な予後を有するものとして、不良な予後を有する3人の患者を誤って分類した(絶対限界については5人)。良好な予後を有する12人の患者は、それらが前記最適化された限界を用いて不良な予後を有する場合、良好な予後を有するものとして誤って分類された(絶対限界については8人)。
【0067】
28種の遺伝子ポートフォリオの場合、サンプルの94%が、不良の予後を示すものとして、不明瞭な有意性を包含するよう偏向された、最適化された限界に従って、適切に特徴づけられた(絶対限界については93%)。このボートフォリオは、前記最適化された限界を用いて、良好な予後を有するものとして、不良な予後を有する3人の患者を誤って分類した(絶対限界については5人)。良好な予後を有する3人の患者は、それらが前記最適化された限界を用いて不良な予後を有する場合、良好な予後を有するものとして誤って分類された(絶対限界については2人)。
【0068】
2種のプロフィルを比較すれば、本発明の方法に従って選択されたプロファイルはより経済的であり、そして比較ポートフォリオよりもより正確で且つ信頼できる結果を生成することが明らかである。

【特許請求の範囲】
【請求項1】
配列番号1〜30、32、34及び98から成る群から選択された遺伝子の組み合わせにおける単離された核酸配列、それらの相補体、又はそれらの一部を含んで成る診断ポートフォリオ。
【請求項2】
そこに含まれる遺伝子の示差的発現を同定するために適切なマトリックスにおける請求項1記載の診断ポートフォリオ。
【請求項3】
前記マトリックスがマイクロアレイにおいて使用される請求項2記載の診断ポートフォリオ。
【請求項4】
前記マイクロアレイがcDNAマイクロアレイである請求項3記載の診断ポートフィリオ。
【請求項5】
前記マイクロアレイがオリゴヌクレオチドマイクロアレイである請求項3記載の診断ポートフォリオ。
【請求項6】
配列番号1〜30、32、34及び98から成る群から選択された遺伝子の組み合わせの発現の検出のための試薬を含んでなる、癌診断用キット。
【請求項7】
マイクロアレイ分析を行なうための試薬を更に含んでなる請求項記載のキット。
【請求項8】
前記遺伝子内の核酸配列、それらの相補体、またはそれらの部分をアッセイするための媒体を更に含んでなる請求項記載のキット。
【請求項9】
前記媒体がマイクロアレイである請求項記載のキット。
【請求項10】
使用説明書を更に含んでなる請求項記載のキット。

【公開番号】特開2009−118855(P2009−118855A)
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願番号】特願2009−49600(P2009−49600)
【出願日】平成21年3月3日(2009.3.3)
【分割の表示】特願2003−96170(P2003−96170)の分割
【原出願日】平成15年3月31日(2003.3.31)
【出願人】(594199337)オルソ−クリニカル ダイアグノスティクス,インコーポレイティド (14)
【Fターム(参考)】