説明

疾患予後モデルの作成方法、このモデルを用いた疾患予後予測方法、このモデルによる予後予測装置、ならびにそのプログラム・記憶媒体

本発明は、コンピュータを用いて所定の疾患の臨床化学検査値から当該疾患に対する予後を予測するモデルを作成するに際し、コンピュータに当該疾患の複数の臨床化学検査実測値と予後の実測値とを入力し、これらをデータマイニングのプログラムによって処理して、前記疾患の予後に影響がある臨床化学検査項目を複数決定し、さらに、これら複数の項目の前記予後に対する優先度を決定し、この優先度に基づいて複数の臨床化学検査項目および臨床化学検査値範囲と前記予後予測値との相関を規定した判断ルーチンを確立して、この判断ルーチンを前記モデルとした疾患予後予測モデルである。

【発明の詳細な説明】
【技術分野】
本発明は疾患の予後を予測するモデル、及びこれを利用した予測方法に関するものである。
【背景技術】
わが国には、約200万人のHCVキャリアー、約100万人のHBVキャリアーが存在する。これらキャリアーの一部は、慢性肝炎や肝硬変に長期間かけて進行し、肝癌を併発してこれらキャリアーは死亡する・
肝臓疾患や肝臓癌の診断の第1は画像診断であるが、薬価が高く特殊な機器と技術が必要である。臨床化学検査による血液検査もこれら疾患の診断に適用されるが、画像診断の補助に過ぎない。
肝臓疾患や肝臓癌の血液検査所見の一つとして、PIVKAの測定がある。肝疾患に伴って血液中にPIVKAが出現することが見出され、従来肝細胞癌の良いマーカーとされていたα−ヘェトプロテインが陰性の肝細胞癌患者においてもPIVKA−IIが高頻度に出現することにより、PIVKAが肝臓癌の腫瘍マーカーとして確立されている。
HCV,HBVや進行型の肝臓癌は慢性型疾患であり、その治療の主体は予後の延長である。従来これら肝疾患患者の予後や余命を予測することは、画像診断結果から担当医が自身の経験に基づいていた。したがって、正確な予後(余命を含む。)の予測が困難であった。
そこで、この発明は、臨床化学検査値から疾患の予後を正確に予測するモデルを構築すること、そしてこのモデルに基づいて疾患の予後を正確に予測する方法を提供することを目的とするものである。
【発明の開示】
本発明者は血液検査所見と疾患の予後、例えば余命の実測値とをデータマイニングなどのデータ処理手法を用いて分析することによって既述のモデルを構築した。データマイニングとは、過去のデータを分析し、その中から有効な規則性を発見して、重要な意思決定支援を促進する先進的情報解析システムで、金融ビジネス流通分野において確立され、広く導入されている手法である。従来の統計的手法では限られたサンプル数を用いて仮説を検証する方法であることから、網羅性、迅速性において難点があるも、データマイニングでは膨大なデータから網羅的に高速探索し、精密な解析が可能である。
臨床化学検査所見と予後(例えば余命)の実測値とを比較検討し、疾患の予後に与える臨床化学検査項目の優劣を求め、より優位の臨床化学検査項目を上流側においた判断分岐ルーチンを構成して、この判断分岐ルーチンに臨床化学検査項目の測定値を適用することにより、予後の予測(予後の確からしさ)を得ることができる。
本発明はこのような知見によってなされたものであり、コンピュータを用いて所定の疾患の臨床化学検査値から当該疾患に対する予後を予測するモデルを作成する方法であって、コンピュータに当該疾患の複数の臨床化学検査実測値と予後の実測値とを入力し、これらをデータマイニングのプログラムによって処理して、前記疾患の予後に影響がある臨床化学検査項目を一つ又は複数決定し、さらに、当該項目が複数の場合にはこれら項目の前記予後に対する優先度を決定し、この優先度に基づいて、複数の臨床化学検査項目およびこの検査項目の臨床化学検査値範囲と、前記予後予測値との相関を規定した判断ルーチンを確立して、この判断ルーチンを前記モデルとした疾患予後予測モデルの作成方法であることを特徴とするものである。
本発明の好適な形態においては、前記判断ルーチンは、複数の機会事象ノードを前記臨床化学検査項目および臨床化学検査測定値範囲とし、この機会事象ノードに対応した複数の予後予測値を終端ノードとしたデシジョンツリーである。さらに、既述の判断ルーチンに基づいて、疾患名と前記複数の臨床化学検査化学測定値から当該疾患の予後を予測することができる。
他の発明は、コンピュータを用いて臨床検査化学データから当該疾患に対する予後を予測する方法において、コンピュータには請求項1又は2記載の判断ルーチンが記憶され、予後予測対象の疾患名、当該疾患に対する臨床化学検査測定値をコンピュータに入力し、この入力値を前記判断ルーチンに基づいて前記疾患の予後予測値を求めるように構成された疾患予後予測方法である。さらに、他の発明は、コンピュータを備えた、臨床化学検査値から当該疾患に対する予後を予測する装置において、前記コンピュータは、既述の判断ルーチンを記憶するメモリと、予後予想対象の疾患名および当該疾患に対する臨床化学検査測定値を入力する入力手段と、この入力値を前記判断ルーチンに適用して前記疾患の予後予測値を求める予後予測値取得手段と、この予後予測値を表示手段に表示させるための表示処理手段と、を備える疾患予後予測装置である。
さらに、他の発明は、前記各手段をコンピュータに実行させるための、当該コンピュータに読み取り可能なプログラムであり、また、このプログラムが記憶された記憶媒体である。
本発明が適用される対象の一つに、肝臓疾患があり、前記最優先の臨床化学検査項目がPIVKAに係わるものである。前記判断ルーチンは、複数の機会事象ノードを前記臨床化学検査項目および臨床化学検査測定値範囲とし、この機会事象ノードに対応した複数の予後予測値を終端ノードとしたデシジョンツリーである。前記デシジョンツリーの機会事象ノードには、患者情報が含まれている。さらに、本発明は、既述のデシジョンツリーを構成するデータ群であることを特徴とする。このデータは記憶媒体としてのCD、DVD、HDなどに記録可能である。
さらに、本発明は、疾患を指標する臨床検査項目の、複数の患者に係わる検査結果と、各患者の当該疾患に係わる実際の予後との関係に基づいて統計処理されたモデルによって、ある患者の当該疾患の現在の前記臨床検査項目に係わる検査値から、当該患者の前記疾患に係わる予後を予測する方法である。この検査項目の一例がPIVKAに係わるものである。前記判断ルーチンの過程で、前記臨床検査項目の優先度が、その都度決定されるようにした。前記疾患が肝臓疾患に係わるものであり、最上位の事象ノードをPIVKAの臨床検査値に係わる臨界値に設定した。余命年数毎の前記モデルに基づいてPIVKAを最優先ノードとした余命予測を行うに際し、余命年数毎にPIVKAの基準値が設定されていることとした。
本発明によれば、肝臓疾患における予後を予測する上で、最優先の臨床化学検査項目(第1選択の診断マーカー)がPIVKAであることが分かった。したがって、本発明は、患者データ(年齢、体重、性別、MRI等の画像データ、臨床化学測定値、血液検査所見等)を疾患予後に与える影響度に応じてソートさせる手法によって、患者の実データから疾患予後を予測する方法を提供するものである。
【図面の簡単な説明】
図1は、本発明方法を実施するためのハードウエアブロック図である。図2は、本発明によって得られたデシジョンツリーを示した系統図である。図3は、本発明に係わる機能ブロック図である。
【発明を実施するための最良の形態】
1990年から2002年の期間、肝疾患患者が原因で死亡した456名(男性325名、女性131名、平均64歳:25−92歳)を対象とした。うち死亡時診断は肝癌346名、肝硬変慢性肝不全59名、急性肝不全14名、その他37名であった。
患者情報と血液検査所見(Alb,ALT,LDH,CHO,PIVKAなどその他複数の項目一項目あたり約25000件)の情報を日本IBM社製データ・マイニングツールである「DB2 Intelligent Miner」(商品名)を用いて分析して、検査時点から1年生存できるか否かの1年余命判定モデルとしての決定木(デシジョンツリー)を作成した。
デシジョンツリーはノードとリンクから構成され、各ノードには分類する属性、ノードとその下位ノードを結ぶリンクには属性値がそれぞれ対応付けられている。下位ノードには、最上位ノードからのリンク属性値により分類されたクラスを表現する。
属性とは臨床化学検査項目・患者個人データ項目の特定とこの項目の数値範囲の特定(=,>,≧,<,≦,≠,≒等の条件符号によって定義される。)から、例えば構成される。
優先度に基づいて上位ノードと下位ノードを決定し、リンクには範囲が定義され、終端ノードには予後の予測の確からしさが定義される。なお、今回の知見によれば、最上位ノードが肝臓癌・肝炎の場合にはPIVKAに係わるものであることがわかった。したがって、肝臓癌の予後(余命)を予測する場合には、PIVKAの血液検査所見が第1選択マーカーとなる。
その他の項目は次のとおり。検査日、死亡日、検査年齢、死亡年齢、検査予後、検査から何日目に死亡したか、性別、ウイルス型、病名、TP:総蛋白、ALB:アルブミン、GLB:グロブリン、A/G:アルブミンとグロブリンの比、TTT:チモール、ZTT:クンケル、T−BIL:トータルビリルビン、D−BIL:ビリルビン分画、GOT、GPT、LDH:ラクテイトデヒドロゲナーゼ、ALP:アルカリホスファターゼ、γGTP:ガンマーGTP、LAP:ロイシンアミノペピチダーゼ、CH−E:コリンエステラーゼ、BUN:尿中尿素窒素、CREA:クレアチニン、URICA、NA:ナトリウム、CL:クロール、K:カリウム、CA:カルシウム、T−CHO:トータルコレステロール、AFP:α−フェトプロテイン、PIVKA−II。
図1は、本発明に係わる予後予測モデル生成方法・装置を実現するためのハードウエアブロック図であって、これらはマイクロコンピュータから構成される。マイクロコンピュータは、入力手段(キーボード等)1、出力手段(液晶モニタ等)2、コンピュータ本体(メモリ、CPU、I/O等)3からなり、メモリにはデータマイニング用プログラムが記憶されている。
今、入力手段から、既述の情報をマイクロコンピュータ本体に入力して分析した結果、検査時点で(PIVKA>8255mAU/ml)の条件を満たすと93.9%,(1034<PIVKA<8255),(AFP>1215ng/ml)の2条件では91.7%の確率で1年以内に死亡するのに対し、(PIVKA<1034),(CHO>102mg/dl),(AFP<531.5)の3つの条件を満たすと85.5%の確率で1年以上生存するモデルが作成された。
このモデルは図2に示されるデシジョンツリーから構成される。図2において、円形で示される各ブロック(20)は機会事象ノードであり、四角で示される各ブロックは終端ノード(22)である。これらノードはそれぞれ複数あり(20A、20B・・・・,22A、22B・・・・・)、一つの機会事象ノードから他の機会事象ノード或いは終端ノードに分岐している。
機会事象ノードの円の大きさはN(患者数)に対応しており、円の中の斜線部で示される領域(例:機会事象ノード20Aの100)は余命1年以下のNの割合、斜線が付されていない領域(例:機会事象ノード20Aの102)は余命1年以上のNの割合をそれぞれ示している。
一つの機会事情ノードから他の事象ノード或いは終端ノードに分岐するルートのうち、左側のルートは、機会事象ノードの比較値に対する肯定を示し、右側のルートは否定を示す。例えば、機会事象ノード20AのPIVKA<586.5mgAU/mlが肯定されると、機会事象ノード20Bに移行し、これが否定されると機会事象ノード20Gに移行する。
前記終端ノードは一年生存及び一年以内死亡の割合を示すものであるから、一年以内生存確率を指標する。なお、機会事象ノードの2重円内において、内側の斜線あり/斜線なしの割合はこの機会事象ノードにおける1年生存可否人数の割合に相当し、外側円の斜線あり/なしの割合は直ぐ上流の機会事象における1年生存可否人数の割合に相当し、これら割合を乗じた数が当該事象の判断後の1年生存/1年以内死亡の割合となる。
実際の臨床データ及び患者データ(年齢等)と予後(一年後死亡/あるいは生存)とをデータマイニングの手法によって分析すると、図2のような判断木が得られた。この図2から明らかなように、肝臓疾患・肝臓癌の予後予測モデルにおいて、最も優先度が高い第1選択マーカーがPIVKAの測定値であることが分かる。
次に予後予測方法・装置について説明する。これは図1と同様なハードウエアによって実現される。マイクロコンピュータ本体のメモリに、既述のデシジョンツリーに対応するプログラムが記憶されている。
図3は、マイクロコンピュータ本体の動作を説明した機能ブロック図であり、予後予想対象の疾患名(C型肝炎)および当該疾患に対する臨床化学検査測定値(既述の項目)を入力する入力手段と、この入力値を前記判断ルーチン(デシジョンツリー)に適用して前記疾患の予後予測値を求める予後予測値取得手段と、この予後予測値を表示手段に表示させるための表示処理手段(液晶モニタ)から構成されている。
デシジョンツリーを用いた予後予測方法について説明する。患者氏名・患者ID・患者性別・患者年齢等患者情報と各種臨床化学検査値をマイクロコンピュータの前記入力手段を用いて入力する。マイクロコンピュータ本体のCPUは、この入力データをメモリの一部であるワークRAMに一時記憶するとともに、この記憶データに図2に示すデシジョンツリーのプログラムを適用する。
今、ある患者の測定データを用いてC型肝炎の予後を実際に予測する場合について説明する。コンピュータの入力手段から患者データと臨床検査所見をコンピュータ本体に入力する。コンピュータ本体のCPUはメモリにあるデシジョンツリーに相当するプログラムしたがって、余命予測処理を行う。
事象ノード20AにおいてPIVKA<586.5(単位省略。以下同じ。)が肯定されると事象ノード20Bに移行して、CH−E<0.225が肯定されると事象ノード20Jに移行する。事象ノード20Jにおいて検査年齢<67.5であると事象ノード20Cに移行してCL<151.5が判定される。これが肯定されると終端ノード22Aに移行し、これが否定されると終端ノード22Bに移行する。終端ノード22Aでは、一年後生存(余命1年以上)がほぼ7割で、終端ノードではこれがほぼ1割となる。患者の血液検査所見からデシジョンツリーの判定ルートが検索され、該当する終端ノードに至って1年後の生存確率が決定され、これが予後の予測値となる。
デシジョンツリーには、C型肝炎2年余命の判定のデシジョンツリー、C型肝炎5年余命の判定デシジョンツリーなど複数の判定ルーチンが作成可能である。これをB型肝炎やその他の疾患に拡大させることができる。ある患者について全ての判定ルーチンを実行することによって、疾患毎で余命年数毎の予後予測値(生存確率)が本願発明に係わる予後予測方法・装置によって算出可能である。
ここで説明されたデータマイニングを用いた手法によって、肝癌腫瘍マーカーの絶対値と肝予備能が肝疾患患者の生存期間に寄与することが確認された。Decision tree以外に回転対象基底関数(RBF:radial basis function)やニューラルネットワークを用いての解析では、随時の検査値を用いて、あと何年生存できるかの予後予測モデルの作成も可能である。
前記モデル基づいて、肝癌患者に絞り、かつ半年生存、1年生存、2年生存という順に予後の予測値を求めると、いずれもPIVKAが最も重要な因子として抽出され、それぞれ2028mAU/ml、1035mAU/ml、502mAU/mlという基準値が求められた。従って、PIVKAが2000mAU/mlなら半年、1000mAU/mlなら1年、500mAU/mlなら2年という生命予後の予測が可能であることが確認された。なお、この基準値はこれに限定されず、適宜変更される。この基準値から凡そ言えることは、生存年数の長さとPIVKAの基準値とは逆比例の関係にあるということである。
データマイニングを用いた解析により疾患の自然経過、予後の推定が可能であり、本モデルは、移植医療の適応など肝疾患、肝癌患者の治療法の選択に大きく寄与する。
なお、図2のモデルではPIVKA以外の臨床検査項目も事象ノードに採用したが、PIVKA単独でも、肝臓癌の余命の予測が、実際の結果とほぼ一致していることが確認された。
【図1】

【図2】

【図3】


【特許請求の範囲】
【請求項1】
コンピュータを用いて所定の疾患の臨床化学検査値から当該疾患に対する予後を予測するモデルを作成する方法であって、コンピュータに当該疾患の複数の臨床化学検査実測値と予後の実測値とを入力し、これらをデータマイニングのプログラムによって処理して、前記疾患の予後に影響がある臨床化学検査項目を一つ又は複数決定し、さらに、当該項目が複数の場合にはこれら項目の前記予後に対する優先度を決定し、この優先度に基づいて、複数の臨床化学検査項目およびこの検査項目の臨床化学検査値範囲と、前記予後予測値との相関を規定した判断ルーチンを確立して、この判断ルーチンを前記モデルとした疾患予後予測モデルの作成方法。
【請求項2】
前記判断ルーチンは、複数の機会事象ノードを前記臨床化学検査項目および臨床化学検査測定値範囲とし、この機会事象ノードに対応した複数の予後予測値を終端ノードとしたデシジョンツリーである請求項1記載の疾患予後予測モデルの作成方法。
【請求項3】
請求項1又は2記載の前記判断ルーチンに基づいて、疾患名と前記複数の臨床化学検査化学測定値から当該疾患の予後を予測する方法。
【請求項4】
コンピュータを用いて臨床検査化学データから当該疾患に対する予後を予測する方法において、コンピュータには請求項1又は2記載の判断ルーチンが記憶され、予後予測対象の疾患名、当該疾患に対する臨床化学検査測定値をコンピュータに入力し、この入力値を前記判断ルーチンに基づいて前記疾患の予後予測値を求めるように構成された疾患予後予測方法。
【請求項5】
コンピュータを備えた、臨床化学検査値から当該疾患に対する予後を予測する装置において、前記コンピュータは、請求項1又は2記載の判断ルーチンを記憶するメモリと、予後予想対象の疾患名および当該疾患に対する臨床化学検査測定値を入力する入力手段と、この入力値を前記判断ルーチンに適用して前記疾患の予後予測値を求める予後予測値取得手段と、この予後予測値を表示手段に表示させるための表示処理手段と、を備える疾患予後予測装置。
【請求項6】
請求項5記載の各手段をコンピュータに実行させるための、当該コンピュータに読み取り可能なプログラム。
【請求項7】
請求項6記載のプログラムが記憶された記憶媒体。
【請求項8】
前記疾患が肝臓疾患であり、前記最優先の臨床化学検査項目がPIVKAに係わるものである請求項2記載の方法。
【請求項9】
前記判断ルーチンは、複数の機会事象ノードを前記臨床化学検査項目および臨床化学検査測定値範囲とし、この機会事象ノードに対応した複数の予後予測値を終端ノードとしたデシジョンツリーである請求項3又は4記載の方法。
【請求項10】
前記デシジョンツリーの機会事象ノードには、患者情報が含まれている請求項9記載の方法。
【請求項11】
請求項2記載のデシジョンツリーを構成するデータ群。
【請求項12】
疾患を指標する臨床検査項目の、複数の患者に係わる検査結果と、各患者の当該疾患に係わる実際の予後との関係に基づいて統計処理されたモデルによって、ある患者の当該疾患の現在の前記臨床検査項目に係わる検査値から、当該患者の前記疾患に係わる予後を予測する方法。
【請求項13】
前記臨床検査項目がPIVKAに係わるものである請求項12記載の方法。
【請求項14】
前記判断ルーチンの過程で、前記臨床検査項目の優先度が、その都度決定されるようにした請求項1又は4記載の方法。
【請求項15】
前記疾患が肝臓疾患に係わるものであり、最上位の事象ノードをPIVKAの臨床検査値に係わる臨界値に設定した請求項1又は4記載の方法。
【請求項16】
余命年数毎の前記モデルに基づいてPIVKAを最優先ノードとした余命予測を行うに際し、余命年数毎にPIVKAの基準値が設定されている請求項13記載の方法。

【国際公開番号】WO2004/095021
【国際公開日】平成16年11月4日(2004.11.4)
【発行日】平成18年7月13日(2006.7.13)
【国際特許分類】
【出願番号】特願2005−505806(P2005−505806)
【国際出願番号】PCT/JP2004/005915
【国際出願日】平成16年4月23日(2004.4.23)
【出願人】(000000217)エーザイ株式会社 (102)
【出願人】(503150619)
【出願人】(503351814)
【Fターム(参考)】