説明

遺伝子発現情報に基づく薬物有害反応の予測方法

【課題】薬物有害反応を予測できる遺伝子を同定する方法および薬物の薬物有害反応を予測する方法を提供すること。
【解決手段】薬物の1日最大使用量と最高血中濃度の相関に基づいて、薬物の1日最大使用量10mg未満、10mg以上400mg未満、400mg以上の各範囲における回帰直線の中央位置に相当する最高血中濃度の値±10%を至適の薬物曝露濃度とする、上記方法、ならびに、ヒト由来の細胞を、被検薬物に、該薬物のヒトにおける1日最大使用量範囲に応じて決定される至適の薬物曝露濃度で曝露し、細胞の遺伝子発現の変化を検出し、そのデータを統計学的手法により分析して、被検薬物の有害反応を予測する方法であって、至適の薬物曝露濃度及び遺伝子が、上記方法によって決定される濃度および遺伝子であることとする、上記方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝子発現情報に基づく薬物有害反応の予測方法に関する。
【背景技術】
【0002】
従来の新薬開発プロセスでは、まず、ラット、マウスなどの動物を用いて安全性および有効性を検討し、安全性および有効性が確認された薬物についてのみ、ヒトを対象とする臨床試験を行う。しかし、齧歯類などの実験動物では薬物有害反応(毒性)が確認されず、臨床試験(ヒト)で初めて薬物有害反応を示したり、数千例を検討して初めて薬物有害反応を示す薬物が現れることがあり、その場合、その薬物の開発や販売が中止されることがある。ここまでの開発プロセスで10年以上かかるといわれており、コストもかかる。このように臨床試験段階になって開発を中止したり販売を中止せざるを得ない状況になることを避けるため、薬物を動物または細胞に曝露し、遺伝子発現解析を行って、ゲノムレベルで毒性発現メカニズムの解明や毒性予測を行う、いわゆるトキシコゲノミクスが発展しつつある。
【0003】
トキシコゲノミクスについて、例えば非特許文献1に、Sprague−Dawley雄ラットに、強い腎毒性剤のシスプラチン等を大量(例えば0.1〜5mg/kg)に投与してラットの腎臓に障害を起こさせ、その腎臓からRNAを抽出し、マイクロアレイで遺伝子発現を分析して毒性発現メカニズムを検討し、発現に変化のあった遺伝子に基づいてクラスタリングを行って、腎臓毒性のバイオマーカーとして使用できる遺伝子を選択することが開示されている。
【0004】
また、非特許文献2に、HanBrl:Wister雄ラットに強い肝毒性の化合物(例えばアフラトキシンB1など26種類)を投与して肝障害を起こさせ、その肝臓からRNAを抽出し、マイクロアレイで肝細胞の遺伝子発現を分析し、サポートベクターマシンを用いて遺伝子を分類し、肝障害のバイオマーカーとして使用し得る遺伝子を同定することが開示されている。
【0005】
しかし、これらの実験では、腎障害または肝障害が当然起きる量を実験動物に投与しており、実際の臨床における投与の条件と大きく異なる。また、薬物に対する生体反応のヒトと動物間の種差が存在するため、実験動物による薬物有害反応の研究には限界がある。更に、多数の薬物の有害反応の予測を、より効率的に行える手法が求められている。
【0006】
また、特許文献1には、サンプルを薬物に曝露し、サンプルに含まれる少なくとも2つの遺伝子の薬物に対する反応をモニタリングし、遺伝子における薬物の反応の相違をコントラスト分析し、各遺伝子のサマリースコアを構築してロジスティック回帰を行い、その結果により薬物の毒性に関する予測モデルを提供することが開示されている。
【0007】
特許文献2には、被検薬物を細胞又は微生物に接触させ、特定遺伝子の転写により生成されるRNAを標的RNAとして、標的RNA中の特定配列と同一または相補的な配列のRNAを特異的に増幅させる工程と、増幅工程により増幅されたRNAを検出することにより、特定遺伝子の発現によって標的RNAが転写されたか否かを検知する工程を含む被検薬物の薬効又は毒性の評価方法が開示されている。
【0008】
特許文献3には、被検薬物の肝毒性を予測する方法であって、被検薬物の存在下または不存在下で肝細胞をインキュベーションし、被検薬物の存在下または不存在下でのバイオマーカーペプチドのレベルを比較し、被検薬物の存在下でのバイオマーカーのポリペプチドが上昇した場合、その薬物は肝毒性を起こすと予測する方法が開示されている。
【0009】
【非特許文献1】Rupesh P.Aminら,“Identification of Putative Gene−Based Markers of Renal Toxicity",Environmental Health Perspectives,March 2004,vol.112,No.4,p.465−479
【非特許文献2】Guido Steinerら,“Discriminating Different Classes of Toxicants by Transcript Profiling”,Environmental Health Perspectives,August 2004,Vol.112,No.12,p.1236−1248
【特許文献1】米国特許出願公開第2002/0192671号
【特許文献2】米国特許出願公開第2003/0108930号
【特許文献3】米国特許出願公開第2004/0265889号
【発明の開示】
【発明が解決しようとする課題】
【0010】
本発明の目的は、安全、容易、迅速に、コストをかけずに、多くの薬物について臨床(ヒト)での薬物の使用に近い条件で有害反応を予測できる遺伝子の同定方法、およびその遺伝子を用いた薬物有害反応を予測する方法を提供することである。
【課題を解決するための手段】
【0011】
本発明者らは、上記問題を解決すべく、ヒトの細胞への薬物の曝露濃度、曝露時間、データの分析方法などを鋭意検討し、本発明を完成した。
【0012】
即ち本発明は、以下の特徴を有する。
(1)ヒト由来の細胞を、薬物有害反応を現す薬物および現さない薬物に、薬物のヒトにおける1日最大使用量範囲に応じて決定される至適の薬物曝露濃度で曝露し、細胞の遺伝子発現の変化を検出し、そのデータを統計学的手法により分析し、薬物有害反応に関与する遺伝子を同定することを含む、薬物有害反応を予測するための遺伝子を同定する方法であって、
薬物の1日最大使用量と最高血中濃度の相関に基づいて、薬物の1日最大使用量10mg未満、10mg以上400mg未満、400mg以上の各範囲における回帰直線の中央位置に相当する最高血中濃度の値±10%を至適の薬物曝露濃度とすることを特徴とする、上記方法。
(2)至適の薬物曝露濃度が、薬物のヒトにおける1日最大使用量が10mg未満の場合0.05μg/ml±10%、10mg以上400mg未満の場合1.0μg/ml±10%、400mg以上の場合20μg/ml±10%である、(1)に記載の方法。
(3)薬物の薬理作用により分類された複数の薬物グループ間で、発現が変化した遺伝子数のばらつきが最も少ない時間を薬物の曝露時間として決定することをさらに含む、(1)または(2)に記載の方法。
(4)薬物の曝露時間が12〜48時間である、(3)に記載の方法。
(5)ヒト由来の細胞がプライマリー細胞または不死化細胞である、(1)〜(4)のいずれかに記載の方法。
(6)遺伝子発現の変化を、ハイブリダイゼーションまたは定量RT−PCRにより検出する、(1)〜(5)のいずれかに記載の方法。
(7)統計学的手法がサポートベクターマシンである、(1)〜(6)のいずれかに記載の方法。
(8)薬物有害反応が腎障害である、(1)〜(7)のいずれかに記載の方法。
(9)ヒト由来の細胞を、被検薬物に、該薬物のヒトにおける1日最大使用量範囲に応じて決定される至適の薬物曝露濃度で曝露し、細胞の遺伝子発現の変化を検出し、そのデータを統計学的手法により分析して、被検薬物の有害反応を予測する方法であって、
至適の薬物曝露濃度及び遺伝子が、(1)〜(8)のいずれかに記載の方法によって決定される濃度および遺伝子であることを特徴とする、上記方法。
(10)至適の薬物曝露濃度が、薬物のヒトにおける1日最大使用量が10mg未満の場合0.05μg/ml±10%、10mg以上400mg未満の場合1.0μg/ml±10%、400mg以上の場合20μg/ml±10%である、(9)に記載の方法。
【0013】
(11)薬物の薬理作用により分類された複数の薬物グループ間で、発現が変化した遺伝子数のばらつきが最も少ない時間を薬物の曝露時間として決定することをさらに含む、(9)または(10)に記載の方法。
(12)薬物の曝露時間が12〜48時間である、(11)に記載の方法。
(13)ヒト由来の細胞がプライマリー細胞または不死化細胞である、(9)〜(12)のいずれかに記載の方法。
(14)遺伝子発現の変化を、ハイブリダイゼーションまたは定量RT−PCRにより検出する、(9)〜(13)のいずれかに記載の方法。
(15)統計学的手法が、サポートベクターマシンである、(9)〜(14)のいずれかに記載の方法。
(16)薬物有害反応が腎障害である、(9)〜(15)のいずれかに記載の方法。
(17)予測遺伝子が、配列番号1〜32で表される塩基配列および該塩基配列と70%以上の同一性を有する塩基配列を含む腎障害予測遺伝子からなる群から選択される、(9)〜(16)のいずれかに記載の方法。
(18)(17)で定義された腎障害予測遺伝子の塩基配列および該塩基配列の少なくとも15塩基からなる断片配列からなる群から選択された塩基配列を含むDNAが固定された、薬物腎障害予測用DNA固定化担体。
(19)担体が、石英、ガラスまたはポリマーである、(18)に記載の担体。
(20)DNAマイクロアレイである、(18)または(19)に記載の担体。
【0014】
本明細書において、薬物有害反応とは、投与された薬物に起因する生体に対するあらゆる有害な反応をいい、当該薬物との因果関係が否定できないものをいう。
【0015】
本明細書において、薬物のヒトにおける1日最大使用量とは、医薬品の添付文書に基づく1日に使用される最大の用量をいう。
【0016】
本明細書において、薬物のヒトにおける最高血中濃度とは、ヒトへの薬物投与後の血中濃度の極大値をいい、医薬品の添付文書などに例えばCmax値として記載されている。
【発明の効果】
【0017】
本発明によれば、薬物有害反応の予測に用いることができる遺伝子を効率的かつ簡易に同定することができる。また、明らかに薬物有害反応を起こす毒性の強い薬物以外の薬物でもその有害反応を調べることができる。更に、ヒト細胞における薬物有害反応を、一度に多くの候補薬物について、安全、容易、迅速に低コストで調べることができ、その精度も高い。
【発明を実施するための最良の形態】
【0018】
1.薬物有害反応の予測遺伝子を同定する方法
本発明の薬物有害反応を予測するための遺伝子を同定する方法は、ヒト由来の細胞を、薬物有害反応を現す薬物および現さない薬物に、薬物のヒトにおける1日最大使用量範囲に応じて決定される至適の薬物曝露濃度で曝露し、細胞の遺伝子発現の変化を検出し、そのデータを統計学的手法により分析し、薬物有害反応に関与する遺伝子を同定することを含む方法であって、薬物の1日最大使用量と最高血中濃度の相関に基づいて、薬物の1日最大使用量10mg未満、10mg以上400mg未満、400mg以上の各範囲における回帰直線の中央位置に相当する最高血中濃度の値±10%を至適の薬物曝露濃度とすることを特徴とする。
重要なことは、薬物曝露濃度および曝露時間の決定と、その薬物曝露濃度での薬物有害反応に関与する遺伝子の同定である。
【0019】
(1)本発明に用いる細胞
薬物に曝露する細胞はヒト由来細胞であり、好ましくはプライマリー細胞(すなわち、初代培養細胞)または不死化細胞、例えばEpstein−Barr Virus感染により増殖能を獲得したEBV不死化末梢血リンパ球細胞、不死化B細胞などを用いることができ、特に限定されない。これらの細胞はセルバンク(理化学研究所バイオソースセンター)、アメリカンタイプカルチャーコレクション(ATCC)などから入手可能である。また、例えば日本国内において本発明を適用する場合、日本人由来の細胞が好ましいと考えられる。
【0020】
(2)本発明に用いる薬物
曝露に用いる薬物は、薬物有害反応を現す薬物と現さない薬物の両方を含むように選択し、細胞をそれらの薬物に曝露したときに、細胞の遺伝子が相対的に異なる発現を示せば特に限定されない。例えば、薬物有害反応を現す薬物により発現が変化するが、薬物有害反応を現さない薬物では発現が変化しない遺伝子が、薬物有害反応の予測遺伝子の候補となり得る。本発明は、例えば日本または外国で医薬品として承認されている薬物の有害反応を予測できる遺伝子を同定することを含むので、例えば、医薬品の添付文書の記載から薬物有害反応を現す薬物および現さない薬物を選択することができる。薬物有害反応が腎障害の場合、曝露する薬物の腎障害の有無は、その薬物の添付文書に臨床上の副作用としてヒトにおいて腎機能障害、急性腎不全などが現れた等の記載から分別できる。他の薬物有害反応、例えば、肝障害、肺障害、消化管障害、神経障害などについても同様である。
【0021】
(3)薬物曝露濃度の決定方法
本発明者らは、薬物の1日最大使用量と最高血中濃度(Cmax値)が相関関係を有することを見出した。
1日最大使用量とCmax値が分かっている80種類の薬物(薬物有害反応を現す薬物、現さない薬物を含む)について、薬物の添付文書中の用法の1日あたり最大使用量(mg)(per kg記載のものは60kgとして、体表面積記載のものは1.5mで計算)と、Cmax(μg/ml)(複数のCmax値が記載されていた場合には大きい方の数字を採用)を調べた。そして、グラフのX軸に1日最大使用量(log)、Y軸にCmax値(log)をとってプロットし、これらの相関係数を求めたところ、約0.86であり(図1)、比較的高い正の相関があることが分かった。次に、X軸の1日最大使用量を、10mg未満、10mg以上400mg未満、400mg以上の範囲に分け、各範囲における回帰直線の中央位置に相当するY軸のCmax値±10%を至適の薬物曝露濃度とした。
【0022】
このようにして決定された好ましい薬物曝露濃度は、薬物のヒトにおける1日最大使用量が10mg未満の場合0.05μg/ml±10%、10mg以上400mg未満の場合1.0μg/ml±10%、400mg以上の場合20μg/ml±10%である(図1)。これらの薬物曝露濃度は、どの薬物有害反応にも、どの薬物にも適用可能である。また、薬物曝露濃度を、各範囲に応じてそれぞれ1つだけ、即ち0.05μg/ml、1.0μg/ml、20μg/mlに決定してもよい。
【0023】
従来の薬物曝露実験では、各薬物に応じて異なる幅のある薬物曝露濃度で煩雑な実験が行なわれていたが、本発明では、薬物曝露実験を上記3つの薬物曝露濃度で行えばよく、実験が簡便化される。また、上記3つの薬物曝露濃度を用いることにより、薬物有害反応関連遺伝子を適正かつ容易に同定することを可能にし、その遺伝子発現の変化を検出することによって、薬物の有害反応を容易に評価することができる。
【0024】
(4)薬物曝露時間の決定方法
薬物曝露時間は、多数の薬物について検討する場合、実験の簡易性、迅速性、実験条件の統一などを勘案すると、同じ曝露時間に揃えることが好ましい。本発明では、薬物の薬理作用により分類された複数の薬物グループ間で、発現が変化した遺伝子数のばらつきが最も少ない時間を薬物曝露時間として、以下のように決定される。
ある共通した薬物有害反応(例えば腎障害、肝障害など)を現すことが分かっている複数の薬物を、薬理作用によりいくつかの薬物グループに分類する。そして薬物グループごとに、上記(3)で決定された薬物曝露濃度で、曝露時間を例えば10分、60分、6時間、24時間として、ヒト細胞を薬物に曝露する実験を行う。
【0025】
曝露前と上記時間が経過した曝露後の細胞のRNAを抽出する。フルオレセイン、Cy3、Cy5、ラジオアイソトープ(例えば32P、131I、H、14Cなど)、ビオチン、ローダミン、ジゴキシゲニンなどを用いて、抽出したRNAから標識cDNAまたはcRNAを合成する。
【0026】
上記標識cDNAまたはcRNAについてハイブリダイゼーション(例えばDNAマイクロアレイ法、サザンハイブリダイゼーション法、DNAマクロアレイ法など)または定量RT−PCRを行う。
【0027】
ハイブリダイゼーションは、ストリンジェントな条件で行うことができる。ストリンジェントな条件は、例えば30〜50℃で2〜6×SSC、0.1〜0.5%SDS中で1〜24時間のハイブリダイゼーション、その後、0.1〜1×SSC、0.1〜0.2%SDS中、室温での洗浄などの条件を含む。ここで、1×SSCは、150mM NaClおよび15mMクエン酸ナトリウムを含む水溶液(pH7.2)である。
【0028】
市販のヒトゲノム解析用DNAマイクロアレイ(例えばAffymetrix社)を使用する場合は、その取扱説明書に記載されている方法およびハイブリダイゼーション条件に厳密に従うことが望ましい。
【0029】
定量RT−PCRは、生体組織由来のRNAから逆転写(RT)によりcDNAを調製し、1対のプライマーを、鋳型としてのcDNAとハイブリダイズさせてポリメラーゼ連鎖反応(PCR)を行い、生成した2本鎖DNAを、内部標準物質(例えばβ−アクチン遺伝子などのハウスキーピング遺伝子)を用いて定量することを含む。
【0030】
ハイブリダイゼーションまたは定量RT−PCRにより、遺伝子発現の変化を測定し、各薬物曝露時間、各薬物グループごとに、薬物有害反応を現す薬物に細胞を曝露したときの発現量に変化が見られた遺伝子の発現量の平均と、薬物有害反応を現さない薬物に曝露したときの遺伝子の発現量の平均の比をとって薬物グループ間で相対的に比較し、各薬物グループごとに、発現量が変化した遺伝子の数を決定し、その遺伝子の数のばらつきが最も少ないときの曝露時間を、至適の薬物曝露時間とする(図2)。
【0031】
また、薬物曝露時間を決定する際に、例えばボルケーノプロット法を用いることができる。
ボルケーノプロットとは、Fold Change(上記薬物グループのそれぞれにおける、薬物有害反応を表す薬物に曝露した細胞の遺伝子の発現量の平均と、薬物有害反応を現さない薬物に曝露した細胞の遺伝子の発現量の平均との比であり、値が1未満の場合、例えば0.75であれば、有害反応を現さない薬物に曝露していない細胞の遺伝子の発現量の平均よりも25%低いことを意味し、Fold Change値は約−1.3になる)と有意差(p値)の関係を表す手法である。具体的には、グラフのX軸にFold値の対数(2を底とする)、Y軸にp値の対数(10を底とする)をとり、例えばX軸で−1.0以下または+1.0以上(つまり2倍以上の発現変化)でかつY軸で1.3以上(数値が大きいほどその効果が真であると期待される)に該当するプロット数(遺伝子数)を数え(図3)、全ての薬物グループにおいてどの薬物曝露時間であれば遺伝子数のばらつきが最も少ないかを検討することにより、本発明における薬物曝露時間を決定することができる。
このようにして決定された好ましい薬物曝露時間は、12〜48時間、より好ましくは22〜26時間、更に好ましくは23〜25時間である。これらの曝露時間は、肝障害などの他の障害にも適用可能である。
【0032】
(5)RNAサンプルおよびデータのフィルタリング
ヒト由来細胞から抽出したRNAの質が悪いと、信頼性のあるデータが得られない。そこで、RNAサンプルを以下の2つのパラメータで評価して、分解、劣化、不純物混入等したRNAサンプルを排除することが好ましい。
【0033】
(i)OD260/OD280
核酸の吸光度のピークは約260nmにあり、約260nm以外にピークが見られる場合、その核酸溶液はコンタミネーションを起こしている可能性がある。OD260/OD280比は、好ましくは1.8〜2.0である。
【0034】
(ii)rRNAの28S/18S比
RNAサンプルを例えば電気泳動で分析すると、28S RNA、18S RNA等のピークが現れる。28S RNAは特に分解されやすいので、RNAが分解されていると28S RNAのピークが下がって幅が広くなったり、ベースラインが上がるので劣化が判断できる。28S/18S比は、好ましくは1.2以上、より好ましくは1.6〜2.4である。
【0035】
また、RNAサンプルとDNAチップを用いた実験後のデータについて、そのデータを解析するか否かを決定するフィルタリングを以下の3つのパラメータに基づいて行うことが好ましい。
【0036】
(iii)パーセントプレゼント
パーセントプレゼントとは、全トランスクリプト中で発現有り(P)と判断されたトランスクリプトの割合(%)をいう。
パーセントプレゼントは、例えばAffymetrix社のGeneChipシステムのソフトウエア(GCOSソフト、MASソフト)においてパラメータとして出力される。パーセントプレゼントは好ましくは25%以上である。
【0037】
(iv)β−アクチンの3’末端/5’末端比
RNAが分解されていると、ラベリングを行ったときに5’末端側が標識できなくなるが、3’末端側は標識できることを利用して、ハウスキーピング遺伝子の1つであるβ−アクチンのRNAの3’末端/5’末端比を調べる。
β−アクチンの3’末端と5’末端それぞれの発現量の比は、最も好ましくは1であるが、ラベリングシステムなどの要因により値が様々に変化する。従って、例えば、それぞれのラベリングシステムで3’末端/5’末端比のデータを集めておき、本発明で用いたいRNAサンプルについて3’末端/5’末端比がはずれ値であった場合、そのサンプルは排除する。
【0038】
(v)グリセルアルデヒド−3−リン酸デヒドロゲナーゼ(GAPDH)の3’末端/5’末端比
β−アクチンと同様に、GAPDHのRNAの3’末端と5’末端の発現量から、3’末端/5’末端比を調べ、はずれ値を示すRNAサンプルは排除する。
((iv)および(v)の参考文献:Yasuo Oshimaら,“Analysis of 3’/5’ ratio of Actin and Glyceraldehyde−3−phosphate dehydrogenase (GAPDH)”,Genome Informatics,2003,pp.472〜433)
【0039】
(6)予測遺伝子の同定
上記(3)及び(4)の方法により決定された薬物曝露濃度および薬物曝露時間で曝露されたヒト由来の細胞の遺伝子発現を、ハイブリダイゼーションで検出し、例えばサポートベクターマシン(SMV)を用いて予測遺伝子を同定することができる。ハイブリダイゼーションにDNAチップを用いる場合、DNAチップから得られるデータについてノーマライゼーション、ノイズリダクションを行うことが好ましい。
【0040】
(i)ノーマライゼーション(補正)
各シグナル強度(数値化データ)の総計や中間値から補正係数を算出し、各シグナル強度を補正するグローバルノーマライゼーション、発現量が一定と推定できる遺伝子(ハウスキーピング遺伝子など)のシグナル強度から補正係数を算出し、各シグナル強度を補正するノーマライゼーションなどを行うことができる。
【0041】
(ii)ノイズリダクション
ノイズリダクションは、プローブの局所的な物理的、化学的変化が周囲のプローブの測定値に影響を及ぼすことが原因となるチップ内のノイズや、サンプルの生物学的なばらつき、ハイブリダイゼーションのプロトコール、実験環境のばらつき、時間のずれ、チップ製造の際の不均一低などのチップ間のノイズを、減少させる。この手法は、Agilent Technologies社のGeneSpring GX 7.3を用いて行うことができる。
【0042】
(iii)ボルケーノプロット法によるフィルタリングおよびSVMによる予測遺伝子の同定
上記遺伝子発現のデータを、ボルケーノプロットを用いてフィルターにかけることにより、可能性のある予測遺伝子を絞り込むことができる。例えばp値0.05以下で、かつ例えばFold Change1.6以上となるデータの遺伝子を予測遺伝子とする。ボルケーノプロットは、例えばAgilent Technologies社のGeneSpring GX 7.3を用いて行うことができる。
また、更に別の統計学的分析方法を用いて、より好ましい予測遺伝子を同定することができる。本発明ではハイブリダイゼーションから得られる多数のデータを分析することから、サポートベクターマシン(SVMともいう)を用いることが好ましい。
【0043】
SVMは、2クラスのデータの分類を行う学習機械である。予測空間に2つのグループを分ける識別平面を見出し、プロットが平面のどちら側にあるのかによりプロットを分類する。識別平面は一番近いプロットの距離(マージン:あるベクトルの方向で図った、学習データのクラス間の距離)ができるだけ大きくなるように計算される。ニューラルネットワークは線形の識別器であるが、カーネルトリックを使った非線形投射された空間を用いるSVMは、より複雑なデータを分類することができる。さらにソフトマージンを用いれば多少の識別誤りを許すように制約を緩めることができる。SVMを用いて、既知のグループのサンプル群(トレーニングセットともいう)から、予測遺伝子を選び出す。SVMは、例えばAgilent Technologies社のGeneSpring GX7.3のソフトウエアを用いることができる。
【0044】
具体的には、GeneSpring GX7.3のSVMのクロスバリデーション法を用い、トレーニングセットとして上記(4)の手順で得たハイブリダイゼーションあるいは定量RT−PCRの予測遺伝子のデータを与え、予測効率(予測正確性、予測感度、予測特異性および陽性尤度比、下記表1参照)が極大となるパラメータを探る。次に、SVMに、予測効率を極大とするパラメータと、トレーニングセットとして上記クロスバリデーション法で用いたハイブリダイゼーションの予測遺伝子のデータを与えて、予測空間と識別平面を見出す。
【0045】
予測空間と識別平面を見出すとき、予測正確性が好ましくは70%以上、より好ましくは80%以上、90%以上、95%以上、あるいは極大になるように、ソフトマージンのファクター(Diagonal Scaling Factorともいう)を設定することが好ましい。
【0046】
本明細書における予測正確性、予測感度、予測特異性、陽性尤度比は、以下のように与えられる。
【0047】
【表1】

予測正確性=(a+d)/(a+b+c+d)
予測感度=a/(a+c)
予測特異性=d/(b+d)
陽性尤度比={a/(a+c)}/{b/(b+d)}
【0048】
予測正確性が例えば極大になったDiagonal Scaling Factorと、上記トレーニングセットと、上記(4)と同じ手法で得た別のハイブリダイゼーションのデータをテストセットとして、SVMに与え、予測遺伝子を選び出す。
【0049】
このようにして同定された予測遺伝子は、その塩基配列に対して好ましくは70%、75%、より好ましくは80%、85%、更に好ましくは90%、95%、98%、99%以上の配列同一性を有する遺伝子も含まれる。同一性は、同一塩基数/全塩基数×100(%)で与えられ、BLAST、FASTAなどのプログラムにより検索することができる。
【0050】
2.被検薬物の有害反応を予測する方法
上記1.の手法に従って、被検薬物について予測遺伝子のデータ(テストセット)を得る。次に、上記トレーニングセット、テストセットおよびパラメータをコンピュータに入力して出力する。コンピュータのソフトとして、例えばAgilent Technologies社のGeneSpring GX7.3のソフトウエアを用いることができる。
【0051】
3.薬物有害反応予測用DNA固定化担体
上記1.により同定された予測遺伝子のDNA、または15塩基以上のそのDNA断片、例えば15塩基〜全塩基、20塩基〜全塩基、30塩基〜全塩基、40塩基〜全塩基、50塩基〜全塩基、100塩基〜全塩基、150塩基〜全塩基、200塩基〜全塩基、あるいは前記DNAまたはDNA断片と70%、75%、より好ましくは80%、85%、更に好ましくは90%、95%、98%、99%以上の同一性を有するDNAを固定した、薬物有害反応予測用DNA固定化担体を作製できる。
【0052】
固定化するDNAは、ホスホアミダイト法、リン酸トリエステル法、H−ホスホネート法などで合成できる。例えばホスホアミダイト法では、担体に結合した3’末端ヌクレオシドを出発物質とし、この5’側に新たなヌクレオチドモノマーを付加する反応が繰り返されて、3’から5’方向へのDNA鎖伸長反応が行われる。好ましくは20〜200塩基、より好ましくは30〜150塩基、更に好ましくは50〜100塩基のDNAを合成する。DNA合成のために、市販のDNA自動合成機を用いることができる。
【0053】
ベクターにDNAを組み込んでクローニングし、PCR反応を用いてDNAの増幅を行う。PCR反応サイクルは、例えば変性工程で約90〜98℃、約15秒〜5分、アニーリング工程で約36〜65℃、約30秒〜10分、伸長工程で約65〜75℃、約30秒〜10分を、約20〜50回サイクル行えばよい。PCR反応液は、PCRバッファー(例えば50mM KCl、10mM Tris−HCl(pH8.4〜9.0、25℃)、1.5mM MgCl、0.001%TritonX−100)、鋳型DNA、dNTP、プライマー、耐熱性DNAポリメラーゼなどを含む。
【0054】
増幅したDNAをアガロースゲル電気泳動などによって精製し、担体に固定化する。担体は特に限定されないが、例えば石英、ガラス、ポリマーなどの担体が好ましい。担体の形状は特に限定されず、その全体または一部が平坦な面を有する担体が好ましい。例えばスライドガラス(ポリL−リシンコート、シリレン化、シラン化などを行ってもよい)、ナイロンメンブレン、ニトロセルロースメンブレンなどを用いることができる。固定化する際、市販のスポッティング装置などを用いてもよい。特にDNAマイクロアレイについては多くの作製装置が市販されており、作製方法も担体上に直接DNAを合成する方法(Affymetrix社)もある。例えばDNAマイクロアレイについては、細胞工学別冊、DNAマイクロアレイと最新PCR法、村松正明、那波宏之監修、秀潤社、p.26−34、サザンブロットについては、実験医学別冊、改訂第4版、新遺伝子工学ハンドブック、村松正實ら編、羊土社、p.90−94、DNAマクロアレイについては、実験医学別冊、ポストゲノム時代の実験講座1、ゲノム機能研究プロトコール、辻本豪三ら編、羊土社、p.78−83を参照して作製することができる。
【0055】
以下、本発明の実施例を示すが、それらは単なる例示であり、本発明の範囲はこれらの実施例に限定されるものではない。
【実施例1】
【0056】
薬物曝露濃度の決定
国内で医薬品として承認されている約200種類の薬物について、腎障害の有無を添付文書の記載により分類した。腎障害を現す薬物を表2、腎障害を現さない薬物を表3に示す。
【0057】
【表2】


【0058】
【表3】


【0059】
上記表2及び3に記載の薬物のうち、1日最大使用量とCmax値が分かった80種類の薬物について、X軸に1日最大使用量(log)、Y軸にCmax値(log)をとってグラフを描いたところ、相関係数は0.859であり、Fisherのrのz変換によるp値は、<0.0001であった(図1)。1日最大使用量を10mg未満、10mg以上400mg未満、400mg以上の3つの範囲に分け、各範囲における回帰直線の中央位置に相当する最高血中濃度の値±10%を薬物曝露濃度とし、薬物のヒトにおける1日最大使用量が10mg未満の場合0.05μg/ml、10mg以上400mg未満の場合1.0μg/ml、400mg以上の場合20μg/mlとした。表2および3に、添付文書に記載された1日最大使用量および決定された薬物曝露濃度を示す。
【実施例2】
【0060】
薬物曝露時間の決定
腎障害を現すことが知られている薬物を、以下の5つのグループに分けた。
グループ1:白金抗腫瘍化合物(シスプラチン、ネダプラチン、カルボプラチン)
グループ2:カルバペネム系抗生物質(イミペネム・シタスタチン(IPM−CS)、パニペネム・ベタミプロン(PAPM−BP))
グループ3:アミノグリコシド系抗生物質(アミカシン(AMK)、トブラマイシン(TOB)、ジベカシン(DKB)、ゲンタマイシン(GM)、イセパシン(ISP))
グループ4:セファロスポリン系抗生物質(セフォゾプラン(CZOP)、セフタジジム(CAZ))
グループ5:免疫抑制剤(シクロスポリンA(CsA)、PSC−833、タクロリムス(FK−506)、グスペリムス(NKT−01))
【0061】
ヒト由来細胞(日本人由来EBV不死化末梢血リンパ球細胞HEV0034、理化学研究所から入手)を、上記薬物曝露濃度の決定方法に従った曝露濃度で曝露し、曝露前、曝露後10分、60分、6時間、24時間の遺伝子発現をGeneChipTMHG−U133 DNAマイクロアレイ(Affymetrix社)で、添付文書に記載の手順に従って調べた。スキャナーはGene Chip System(Affymetrix社)、解析ソフトはGCOS(Affimetrix社)を使用した。
【0062】
薬物に曝露していない細胞のデータと比較して2倍以上の発現変化がみられ、かつ有意水準がp<0.01の遺伝子を選択し、更にボルケーノプロットによるフィルタリングを行った。グラフのX軸にFold値の対数、Y軸にp値の対数をとった散布図を描き、X軸で−1.0以下かつY軸で1.3以上にプロットされた遺伝子を下方制御された遺伝子、X軸で+1.0以上かつY軸で1.3以上にプロットされた遺伝子を上方制御された遺伝子とした。例としてグループ5の免疫抑制剤に10分間曝露させた場合と、免疫抑制剤の溶媒(vehicle)に曝露した場合についてのボルケーノプロットのグラフを図3に示す。有意に発現が変化した遺伝子290のうち、25遺伝子が下方制御された遺伝子、265遺伝子が上方制御された遺伝子(いずれも黒のドット)と同定された。
【0063】
他のグループの薬物についても同様にして、各曝露時間での発現に変化があった遺伝子数を調べた。免疫抑制剤の場合、曝露時間10分で発現変化を示す遺伝子数が最も多かったが、白金抗腫瘍化合物、カルバペネム系抗生物質、アミノグリコシド系抗生物質、セファロスポリン系抗生物質では、時間経過に依存して発現変化を示す遺伝子数が増加する傾向が見られた。できるだけ多くのグループで、発現変化を示す遺伝子ができるだけ多く見られた(すなわち、遺伝子数のばらつきが最も少ない)時間を薬物曝露時間として決定した。図2から、薬物曝露時間を24時間とした。
【実施例3】
【0064】
腎障害予測遺伝子の同定と薬物の腎障害の予測
日本人由来EBV不死化末梢血リンパ球細胞HEV0034ヒト由来細胞を約1.0×10個/mlになるようにカルチャーディッシュに添加し、薬物を各曝露濃度になるように添加し、24時間、37℃でインキュベーションした。24時間後、RNeasyキット(QIAGEN社)のプロトコールに従い、細胞からTotal RNAを抽出した。抽出RNAサンプルのフィルタリングを行い、(i)OD260/OD280比が1.8以上、(ii)rRNAの28S/18S比が1.6以上のサンプルを選択したところ、上記表2と表3の薬物200種類中、実際に曝露実験を行った薬物180種類のうち、DNAマイクロアレイの解析に使用できるものは125種類になった。その薬物を表4に示す(表中のサンプルIDは、表2及び3のサンプルIDに対応する)。
【0065】
【表4】

【0066】
次に、Ovation Systemキット(NuGEN社)のプロトコールに従ってcDNAの合成を行い、ビオチン標識されたcDNAを量産・精製した。得られた標識cDNAを上記キットのプロトコールに記載された条件下で処理して、標識cDNAを断片化した。これらの標識cDNAを用いてDNAマイクロアレイ法を行った。DNAマイクロアレイはGeneChip HG−U133キットを用い、そのプロトコールに従った。スキャナーはGene Chip System(Affimetrix社)を用い、スキャン画像を数値化したデータについてノーマライゼーションを行った。ノーマライゼーションは、数値化データ0.01未満を、0.01の発現とし、ハウスキーピング遺伝子の数値化データ、プローブセットごとの数値化データをチップごとに補正した。補正係数の算出は、各チップ内の99のハウスキーピング遺伝子の中の中央値を示したものの値でチップ間のノーマライゼーションを行った。ここで、ハウスキーピング遺伝子は、腎障害のノーマライゼーション用ハウスキーピング遺伝子を用いた(以下、Better HK遺伝子ともいう)。Better HK遺伝子とは、Gutte,AJ,Dzau,VJ,Glueck,SB:Futher difiing housekeeping, or “maintenance,” genes Focus on ”A compedium of gene expression in normal human tissues,”Physiol. Genomics, Vol.7,No.2,pp.95−96(2001)に報告されているハウスキーピング遺伝子を、本発明の実験系(ヒト由来細胞を薬物に曝露してDNAマイクロアレイで遺伝子発現を検出してデータ分析する)に用いて、変動の大きい2SD(標準偏差)を超える遺伝子を除き、残りの遺伝子を用いてさらに本発明の実験系に用いて変動の大きい遺伝子を除く、という作業を繰り返し、残った遺伝子である。Better HK遺伝子99個を遺伝子名で以下に示す(遺伝子の配列は、National Center For Biotechnology Information(NCBI)などのデータバンクから入手できる)。
【0067】
ABCF1、ACTB34、ANAPC5、ARF1、ARF3、ASCC3L1、ATP6V0B、ATP6V0E、BAT1、C1D、C2orf24、CANX、CAPNS1、CBX3、CFL1、COX4I1、DAD1、DDX5、DULLARD、EEF2、EIF3S5、EIF3S7、EIF4G2、ERH、FAU、FNTA、GAPD、GDI2、GUK1、H3F3B、HINT1、HNRPA1、HNRPC、HNRPD、HNRPK、HNRPM、HSPC117、HSPCB、IK、ILF2、JTB、KARS、KHDRBS1、MGC2749、MYST2、NARS、NEDD5、NONO、NPM1、OAZ1、PARK7、PRPF8、PSMB2、RHOA、RNP24、RNPS1、RPL10A、RPL11、RPL12、RPL14、RPL17、RPL18、RPL19、RPL21、RPL24、RPL27、RPL28、RPL30、RPL34、RPL35、RPL37、RPL4、RPL6、RPL9、RPS10、RPS11、RPS13、RPS24、RPS25、RPS27A、RPS5、RPS6、RPS7、SART1、SART3、SFRS9、SLC25A3、SMAP、SMNDC1、SPAG7、SRP14、STARD7、TAF10、TARDBP、TCEB2、USP22、YY1、ZNF146、ZNF259。
【0068】
次に、ノイズリダクションを行った。ノイズリダクションは、Agilent Technologies社のGeneSpring GX 7.3のFilter on Flags機能を用いて、125サンプル中75サンプル以上のサンプルで、PまたはMのフラグ(PまたはMのフラグならば適、Aのフラグは不適を示す)を有するトランスクリプトのみを以下の解析に用いることとした。これは、60%以上のトランスクリプトで発現ありと判断されていないものは、ノイズによる変動が大きく解析に影響し、解析結果が一定しないという経験値に基づき採用したノイズリダクション法である。この時点で、解析データにある45063トランスクリプトが9351トランスクリプトに減少した。
【0069】
また、得られたDNAチップのデータについてのフィルタリングを、以下のパラメータで行った:(iii)パーセントプレゼントが25%以上、(iv)β−アクチンのRNAの3’末端/5’末端比が<100、(v)グリセルアルデヒド−3−リン酸デヒドロゲナーゼの3’末端/5’末端比が<10。
【0070】
更に、ボルケーノプロットにより腎障害を現す薬物と現さない薬物のデータを比較してフィルタリングを行った。p値0.05以下で、かつFold Change1.6以上のデータの遺伝子のみを選択したところ、上記9351トランスクリプトが89トランスクリプトに減少し、この89の遺伝子を予測遺伝子の候補とした。ボルケーノプロットは、Agilent Technologies社のGeneSpring GX 7.3を用いて行った。
【0071】
次に、上記GeneSpring GX 7.3のSVM計算機能のクロスバリデーション機能を用いて、上記89の候補の腎障害予測遺伝子のデータ(data set 2005)を与えた。予測効率が極大となる点を探り、この予測効率を極大とするパラメータを探った。パラメータを探るのに考えうる様々なパラメータを入力し、結果を評価することを繰り返すことで、最良の結果を示すパラメータを調べた。そのパラメータは以下の通りである。
【0072】
【表5】

【0073】
なお、表5のDiagonal Scaling Factorは、例えば20−40のように、より広い値でも可能である。
【0074】
ここで、上記89の遺伝子のうち、32個の遺伝子が腎障害予測遺伝子として絞り込まれた。32個の腎障害予測遺伝子を以下の表6及び配列番号1〜32に示す。
【0075】
【表6】

【0076】
SVMに上記パラメータと上記data set 2005を与えて、予測空間と識別平面を見出した。次に表4に記載の薬物の別のマイクロアレイの腎障害予測遺伝子のデータ(data set 2006)を与えて、結果を評価した。薬物有害反応の予測正確性等の評価を行ったところ、予測正確性=82.9%、予測特異性=85.0%、予測感度=80.6%、陽性尤度比=5.37であった。
【産業上の利用可能性】
【0077】
本発明は、トキシコゲノミクスの分野で広く適用できる。
【図面の簡単な説明】
【0078】
【図1】薬物の1日最大使用量とCmax値の相関を示す。
【図2】各曝露時間における5つの薬物グループでの発現量が有意に変化した遺伝子数を示す。
【図3】免疫抑制剤についてのボルケーノプロットを示す。

【特許請求の範囲】
【請求項1】
ヒト由来の細胞を、薬物有害反応を現す薬物および現さない薬物に、薬物のヒトにおける1日最大使用量範囲に応じて決定される至適の薬物曝露濃度で曝露し、細胞の遺伝子発現の変化を検出し、そのデータを統計学的手法により分析し、薬物有害反応に関与する遺伝子を同定することを含む、薬物有害反応を予測するための遺伝子を同定する方法であって、
薬物の1日最大使用量と最高血中濃度の相関に基づいて、薬物の1日最大使用量10mg未満、10mg以上400mg未満、400mg以上の各範囲における回帰直線の中央位置に相当する最高血中濃度の値±10%を至適の薬物曝露濃度とすることを特徴とする、上記方法。
【請求項2】
至適の薬物曝露濃度が、薬物のヒトにおける1日最大使用量が10mg未満の場合0.05μg/ml±10%、10mg以上400mg未満の場合1.0μg/ml±10%、400mg以上の場合20μg/ml±10%である、請求項1に記載の方法。
【請求項3】
薬物の薬理作用により分類された複数の薬物グループ間で、発現が変化した遺伝子数のばらつきが最も少ない時間を薬物の曝露時間として決定することをさらに含む、請求項1または2に記載の方法。
【請求項4】
薬物の曝露時間が12〜48時間である、請求項3に記載の方法。
【請求項5】
ヒト由来の細胞がプライマリー細胞または不死化細胞である、請求項1〜4のいずれか1項に記載の方法。
【請求項6】
遺伝子発現の変化を、ハイブリダイゼーションまたは定量RT−PCRにより検出する、請求項1〜5のいずれか1項に記載の方法。
【請求項7】
統計学的手法がサポートベクターマシンである、請求項1〜6のいずれか1項に記載の方法。
【請求項8】
薬物有害反応が腎障害である、請求項1〜7のいずれか1項に記載の方法。
【請求項9】
ヒト由来の細胞を、被検薬物に、該薬物のヒトにおける1日最大使用量範囲に応じて決定される至適の薬物曝露濃度で曝露し、細胞の遺伝子発現の変化を検出し、そのデータを統計学的手法により分析して、被検薬物の有害反応を予測する方法であって、
至適の薬物曝露濃度及び遺伝子が、請求項1〜8のいずれか1項に記載の方法によって決定される濃度および遺伝子であることを特徴とする、上記方法。
【請求項10】
至適の薬物曝露濃度が、薬物のヒトにおける1日最大使用量が10mg未満の場合0.05μg/ml±10%、10mg以上400mg未満の場合1.0μg/ml±10%、400mg以上の場合20μg/ml±10%である、請求項9に記載の方法。
【請求項11】
薬物の薬理作用により分類された複数の薬物グループ間で、発現が変化した遺伝子数のばらつきが最も少ない時間を薬物の曝露時間として決定することをさらに含む、請求項9または10に記載の方法。
【請求項12】
薬物の曝露時間が12〜48時間である、請求項11に記載の方法。
【請求項13】
ヒト由来の細胞がプライマリー細胞または不死化細胞である、請求項9〜12のいずれか1項に記載の方法。
【請求項14】
遺伝子発現の変化を、ハイブリダイゼーションまたは定量RT−PCRにより検出する、請求項9〜13のいずれか1項に記載の方法。
【請求項15】
統計学的手法が、サポートベクターマシンである、請求項9〜14のいずれか1項に記載の方法。
【請求項16】
薬物有害反応が腎障害である、請求項9〜15のいずれか1項に記載の方法。
【請求項17】
予測遺伝子が、配列番号1〜32で表される塩基配列および該塩基配列と70%以上の同一性を有する塩基配列を含む腎障害予測遺伝子からなる群から選択される、請求項9〜16のいずれか1項に記載の方法。
【請求項18】
請求項17で定義された腎障害予測遺伝子の塩基配列および該塩基配列の少なくとも15塩基からなる断片配列からなる群から選択された塩基配列を含むDNAが固定された、薬物腎障害予測用DNA固定化担体。
【請求項19】
担体が、石英、ガラスまたはポリマーである、請求項18に記載の担体。
【請求項20】
DNAマイクロアレイである、請求項18または19に記載の担体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2008−228644(P2008−228644A)
【公開日】平成20年10月2日(2008.10.2)
【国際特許分類】
【出願番号】特願2007−72357(P2007−72357)
【出願日】平成19年3月20日(2007.3.20)
【出願人】(505246789)学校法人自治医科大学 (49)
【Fターム(参考)】