説明

生死予測装置とその方法、生死予測プログラム及び記録媒体

【課題】所定の危険因子のデータに基づいて、10年以内の日本人の各個人別の生死を、従来技術に比較して高精度で予測する。
【解決手段】10年以内生死予測装置において、性別、総コレステロール値t.cho(mg/dl)、糖尿病の有無、高感度CRP(hsCRP)(mg/dl)、及びホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力し、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算し、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば10年以内の生死を予測する生死予測装置とその方法、生死予測プログラム及びそのプログラムを記録しコンピュータにより読取可能な記録媒体に関する。
【背景技術】
【0002】
例えば健康診断に用いる危険因子について、年齢、性別、収縮期血圧、総コレステロール、ヘモグロビンA1c、喫煙の有無等の冠危険因子は心血管疾患の危険因子として公知である。また、フォンヴィレブランド因子(Von Willebrand factor;凝固線溶系及び血管内皮機能の指標)、高感度CRP(炎症の指標)、ホモシステイン(Homocysteine;血管内皮機能の指標)が総死亡もしくは血管疾患死に関連していることが報告されている(例えば、非特許文献1−4及び6参照。)。ここで、高感度CRP(hsCRP)は肺炎球菌による炎症が起こり、菌のC−多糖体に反応する蛋白質が血液中に出現することからC−反応性蛋白質(C-reactive protein)と呼ばれており、いわゆる炎症マーカーである。また、フォンヴィレブランド因子は、血漿、血管内皮下組織及び血小板に存在する高分子糖蛋白質であり、損傷血管内皮下組織への血小板の粘着において、一次止血機構において重要な働きをする。さらに、ホモシステインは、血中において、血管内皮細胞を障害し、血栓形成の原因といわれている。
【0003】
また、従来技術に係る予測システムについては、例えば非特許文献5において、年齢、総コレステロール値、LDLコレステロール値、HDLコレステロール値、血圧値、糖尿病及び喫煙の有無を基に、フラミンガムスコア(Framingham Score)を計算して今後10年以内に冠動脈疾患を予測する確率を推定する予測システムが提案されている(例えば、非特許文献5参照。)。
【0004】
さらに、特許文献1では、個人の健康状態を総合的に表す指標を用いて、日常の健康状態の定量的な把握、健康管理指導を行ったときの効果及び指導内容の最適化が困難であるという問題点を解決するために、様々な健診結果に対する健康余命予測の基礎データである健康余命予測データを用いて、健診結果入力手順で入力された健康診断の健診結果から、健康余命の予測値を個人毎に算出し、表示手段で表示、あるいは印刷手段で印刷するようにした健康管理支援装置が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2003−167959号公報
【非特許文献】
【0006】
【非特許文献1】Agnes Jager et al., "von Willebrand Factor, C-Reactive Protein, and 5-Year Mortality in Diabetic and Nondiabetic Subjects, the Hoorn Study". Arteriosclerosis Thrombosis, and Vascular Biology, 1999, No. 19, pp.3071-3078.
【非特許文献2】Wolfgang Koenig et al., "Prospective Study of High-Sensitivity C-reactive Protein as a Determinant of Mortality: Results from the MONICA/KORA Augsburg Cohort Study, 1984-1998". Clinical Chemistry Vol. 54, No. 2, pp.335-342, 2008.
【非特許文献3】Arima H, et al. "High-sensitivity C-reactive protein and Coronary heart disease in a general population of Japanese: the Hisayama study". Arteriosclerosis Thrombosis, and Vascular Biology, 2008, No. 28, pp.1385-91.
【非特許文献4】Stein Emil Vollset et al., "Plasma total homocysteine and cardiovascular and noncardiovascular mortality: the Hordaland Homocysteine Study". American Journal of Clinical Nutrition, Vol. 74, No. 1, pp.130-136, July 2001.
【非特許文献5】Peter W.F. Wilson et al., "Prediction of Coronary Heart Disease Using Risk Factor Categories". Circulation 1998, No. 97, pp.1837-1847.
【非特許文献6】緒方絹歌ほか,「高感度CRP及びvWFは全死亡の予知因子である−縦断研究による疫学的検討−」,第33回日本高血圧学会総会プログラム抄録集,P60−288,2010年10月15日。
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述の非特許文献1−4及び6で提案された健康診断に用いる危険因子として、全死亡について多くの危険因子が報告されているが、これらはいずれも健常者等と比較してX倍のリスクがあるという表現であり、患者個別の生死予測は困難であった。
【0008】
また、非特許文献5において開示されたフラミンガムスコアを用いた予測システムは心血管疾患を予測するシステムであること、及びアメリカ人に対する予測システムであることから、日本人の生死を予測することはできないという問題点があった。
【0009】
さらに、特許文献1においては、「様々な健診結果に対する健康余命予測の基礎データである健康余命予測データを用いて、健診結果入力手順で入力された健康診断の健診結果から、健康余命の予測値を個人毎に算出する」のみで一般的な手法を開示しているにすぎず、具体的にどのように構成するかは記載されておらず、各個人の生死予測を高精度で行うことができないという問題点があった。
【0010】
本発明の目的は以上の問題点を解決し、所定の危険因子のデータに基づいて、10年以内の日本人の各個人別の生死を、従来技術に比較して高精度で予測することができる生死予測装置とその方法、生死予測プログラム及びそのプログラムを記録した記録媒体を提供することにある。
【課題を解決するための手段】
【0011】
第1の発明に係る10年以内生死予測装置は、所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測装置であって、
(1)性別、
(2)総コレステロール値t.cho(mg/dl)、
(3)糖尿病の有無、
(4)高感度CRP(hsCRP)(mg/dl)、及び
(5)ホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力する入力手段と、
複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算する計算手段と、
上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する出力手段とを備えたことを特徴とする。
【0012】
上記10年以内生死予測装置において、上記計算手段はさらに、高感度CRP(hsCRP)以外の入力項目のデータを用いて、評価値Z=0となるときの高感度CRP(hsCRP)の生死しきい値を計算し、
上記出力手段はさらに、上記高感度CRP(hsCRP)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする。
【0013】
また、上記10年以内生死予測装置において、上記計算手段はさらに、ホモシステイン(Homocysteine)以外の入力項目のデータを用いて、評価値Z=0となるときのホモシステイン(Homocysteine)の生死しきい値を計算し、
上記出力手段はさらに、上記ホモシステイン(Homocysteine)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする。
【0014】
さらに、上記10年以内生死予測装置において、上記評価式Zは、
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×Diabetes+0.29127×ln(hsCRP)
+0.116553×Homocysteine+2.927662
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Diabetesは「ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているか否か」である上記糖尿病の有無であり、ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているとき1であり、それ以外のとき0であることを特徴とする。
【0015】
またさらに、上記10年以内生死予測装置において、上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【0016】
【数1】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする。
【0017】
第2の発明に係る10年以内生死予測方法は、コンピュータにより、所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測方法であって、
(1)性別、
(2)総コレステロール値t.cho(mg/dl)、
(3)糖尿病の有無、
(4)高感度CRP(hsCRP)(mg/dl)、及び
(5)ホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力するステップと、
上記コンピュータが、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算するステップと、
上記コンピュータが、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力するステップとを含むことを特徴とする。
【0018】
上記10年以内生死予測方法において、上記計算するステップはさらに、上記コンピュータが、高感度CRP(hsCRP)以外の入力項目のデータを用いて、評価値Z=0となるときの高感度CRP(hsCRP)の生死しきい値を計算し、
上記出力ステップはさらに、上記コンピュータが、上記高感度CRP(hsCRP)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする。
【0019】
また、上記10年以内生死予測方法において、上記計算するステップはさらに、ホモシステイン(Homocysteine)以外の入力項目のデータを用いて、評価値Z=0となるときのホモシステイン(Homocysteine)の生死しきい値を計算し、
上記出力するステップはさらに、上記ホモシステイン(Homocysteine)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする。
【0020】
さらに、上記10年以内生死予測方法において、上記評価式Zは、
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×Diabetes+0.29127×ln(hsCRP)
+0.116553×Homocysteine+2.927662
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Diabetesは「ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているか否か」である上記糖尿病の有無であり、ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているとき1であり、それ以外のとき0であることを特徴とする。
【0021】
またさらに、上記10年以内生死予測方法において、上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【0022】
【数2】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする。
【0023】
第3の発明に係るコンピュータにより実行可能な生死予測プログラムは、上記第2の発明に係る10年以内生死予測方法の各ステップを含むことを特徴とする。
【0024】
第4の発明に係るコンピュータにより読取可能な記録媒体は、上記第3の発明に係るコンピュータにより実行可能な生死予測プログラムを記録したことを特徴とする。
【0025】
第5の発明に係る10年以内生死予測装置は、所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測装置であって、
(1)年齢Age、
(2)性別Gender、
(3)収縮期血圧sbp(mmHg)、
(4)総コレステロール値t.cho(mg/dl)、
(5)ヘモグロビンA1c(HbA1c)(%)、及び
(6)喫煙の有無を含む入力項目のデータを入力する入力手段と、
複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算する計算手段と、
上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する出力手段とを備え、
上記評価式Zは、
Z=0.123978×Age−0.856709×Gender
+0.018992×sbp−0.011564×t.cho
+0.249791×HbA1c+0.748658×Smoke
−8.871682
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Smokeは喫煙者のとき1であり、非喫煙者のとき0であり、
上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【0026】
【数3】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする。
【0027】
第6の発明に係る10年以内生死予測方法は、コンピュータにより、所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測方法であって、
(1)年齢Age、
(2)性別Gender、
(3)収縮期血圧sbp(mmHg)、
(4)総コレステロール値t.cho(mh/dl)、
(5)ヘモグロビンA1c(HbA1c)(%)、及び
(6)喫煙の有無を含む入力項目のデータを入力するステップと、
上記コンピュータが、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算するステップと、
上記コンピュータが、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力するステップとを含み、
上記評価式Zは、
Z=0.123978×Age−0.856709×Gender
+0.018992×sbp−0.011564×t.cho
+0.249791×HbA1c+0.748658×Smoke
−8.871682
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Smokeは喫煙者のとき1であり、非喫煙者のとき0であり、
上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【0028】
【数4】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする。
【0029】
第7の発明に係るコンピュータにより実行可能な生死予測プログラムは、上記第6の発明に係る10年以内生死予測方法の各ステップを含むことを特徴とする。
【0030】
第8の発明に係るコンピュータにより読取可能な記録媒体は、上記第7の発明に係るコンピュータにより実行可能な生死予測プログラムを記録したことを特徴とする。
【発明の効果】
【0031】
本発明に係る生死予測装置とその方法、生死予測プログラム及びそのプログラムを記録した記録媒体によれば、性別、総コレステロール値t.cho(mg/dl)、糖尿病の有無、高感度CRP(hsCRP)(mg/dl)、及びホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力し、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算し、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する。従って、10年以内の日本人の各個人別の生死を、被験者の年齢にかかわらず、従来技術に比較して高精度で予測することができる。
【0032】
また、別の発明に係る生死予測装置とその方法、生死予測プログラム及びそのプログラムを記録した記録媒体によれば、年齢Age、性別Gender、収縮期血圧sbp(mmHg)、総コレステロール値t.cho(mg/dl)、ヘモグロビンA1c(HbA1c)(%)、及び喫煙の有無を含む入力項目のデータを入力し、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算し、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する。従って、過去の知見及び医師の経験に基づいた候補因子に基づいて、改良フィッシャー線形識別器を用いて評価式Zを生成して構築したので、従来に良く使用された候補因子を用いて、10年以内の生死を精度よく予測することができ、医師が使用する候補因子の観点で非常に使いやすいという特有の効果を有する。
【図面の簡単な説明】
【0033】
【図1】本発明の第1及び第2の実施形態に係る10年以内生死予測装置10の詳細構成を示すブロック図である。
【図2】図1の10年以内生死予測装置10を構築するためのプロセスを示すフロー図である。
【図3】第2の実施形態に係る10年以内生死予測装置10によって実行される10年以内生死予測処理の第1の部分を示すフローチャートである。
【図4】第2の実施形態に係る10年以内生死予測装置10によって実行される10年以内生死予測処理の第2の部分を示すフローチャートである。
【図5】第2の実施形態に係る10年以内生死予測装置10による表示例101を示す正面図である。
【図6】第2の実施形態に係る10年以内生死予測装置10による表示例102を示す正面図である。
【図7】第2の実施形態に係る10年以内生死予測装置10による表示例103を示す正面図である。
【図8】第1の実施形態に係る図1の10年以内生死予測装置10を評価したときの評価値Zのバラツキを示すグラフである。
【図9】第2の実施形態に係る10年以内生死予測装置10を評価したときの評価値Zのバラツキを示すグラフである。
【発明を実施するための形態】
【0034】
以下、本発明に係る各実施形態について図面を参照して説明する。なお、以下の各実施形態において、同様の構成要素については同一の符号を付している。
【0035】
図1は本発明の第1及び第2の実施形態に係る10年以内生死予測装置10の詳細構成を示すブロック図であり、図2は図1の10年以内生死予測装置10を構築するためのプロセスを示すフロー図である。図1及び図2に図示された10年以内生死予測装置10は、被験者に関する所定の5つの入力項目を入力することにより、被験者の10年以内の生死を予測する装置である。この装置は以下に示す健康診断データとその後の生死結果のデータを訓練データ(学習データ又は教師データ)として用いて構築されたことを特徴としている。図1の詳細構成については後述する。
【0036】
まず、上記健康診断データの詳細について以下に説明する。
【0037】
1999年に40歳以上の健常な一般住民1920名(男性794名、女性1126名)を対象に福岡県浮羽郡田主丸町(現福岡県久留米市田主丸町)にて住民健診を実施し、収縮期血圧(sbp)、拡張期血圧(dbp)、空腹時血糖値(FBS)、ヘモグロビンA1c(HbA1c)、総コレステロール値(t.cho)、LDLコレステロール値、HDLコレステロール値、トリグリセリド(TG)、高感度CRP(hsCRP)、フォンヴィレブランド因子(von Willebrand factor(vWF))、ホモシステイン(Homocysteine)(なお、上記11項目のうち後者の9つの項目は被験者の血液検査による)を測定し、年齢、性別、高血圧治療の有無、糖尿病治療の有無、脂質異常症治療の有無、喫煙の有無を調査した。その後10年間にわたって健診受診者の生死の追跡調査(追跡率96.8%)を行った。
【0038】
図2は図1の10年以内生死予測装置10を構築するためのプロセスを示すフロー図である。
【0039】
図2において、一般住民N(=1920)例のサンプル集合90を10年生死予測システム構築用サンプル(訓練サンプル)集合91と予測システム評価用サンプル(テストサンプル)集合93とにランダムに分割した。訓練サンプル集合91としてNTra(=1536)例、テストサンプル集合93としてNTes(=384)例に分割した。訓練サンプル集合91のNTra例のうち、生死不明50例を訓練サンプル集合91から取り除き、N’Tra(=1486)例を新たに訓練サンプル集合92とした。テストサンプル集合93,94は訓練サンプル集合91,92とは独立なサンプル集合とした。テストサンプル集合93のNTes例のうち、生死不明12例、及びデータに欠損のある229例をテストサンプル集合93から取り除き、N’Tes(=143)例を新たにテストサンプル集合94とした。そして、詳細後述するように、10年以内生死予測装置10を、訓練サンプル集合92を用いて訓練(学習)することにより構築する。
【0040】
次いで、第1の実施形態に係る10年以内生死予測装置10について以下説明する。ここで、第1の実施形態に係る10年以内生死予測装置10は、過去の知見及び医師の経験に基づいた候補因子に基づいて、詳細後述する改良フィッシャー線形識別器を用いて評価式Zを生成して構築することを特徴とする。
【0041】
過去の報告及び医師の経験をもとに総死亡に強く関連すると考えられる年齢Age、性別Gender、収縮期血圧(sbp)(mmHg)、総コレステロール値(t.cho)(mg/dl)、ヘモグロビンA1c(HbA1c)(%)、喫煙の有無を要素とする訓練サンプルを統計的パターン認識法を用いて解析した。当該第1の実施形態及び後述する第2の実施形態では、フィッシャー(Fisher)線形識別器をベースとした予測装置を構築した。フィッシャー線形識別器とは、以下の式(1)において、評価値Z<0のときサンプルベクトルxをA群(「生存」に対応する)として分類するように割り当て、評価値Z>0のときサンプルベクトルxをB群(「死亡」に対応する)として分類するように割り当てる識別器である。なお、当該明細書において、数式がイメージ入力された墨付き括弧の数番号と、数式が文字入力された大括弧の数式番号とを混在して用いており、また、当該明細書での一連の数式番号として「式(1)」の形式を用いて数式番号を式の最後部に付与して(付与していない数式も存在する)用いることとする。
【0042】
[数1]
Z=Z−Z (1)
[数2]
=(1/2)(x−μΣ−1(x−μ)−lnP,i=A,B
[数3]
Σ=PΣ+PΣ
【0043】
ここで、μ、Σ、P(i=A,B)はそれぞれクラスωの平均ベクトル、クラスクラスωの共分散行列、クラスクラスωの事前確率を表す。ここで、クラスωは生死のうちの「生存」のクラス(Z<0)であり、クラスωは生死のうちの「死亡」のクラス(Z>0)である。なお、Z=0は生死予測のしきい値であり、生死予測値は「不定値」となる。
【0044】
従来、フィッシャー線形識別器においては、共分散行列として標本共分散行列を用いるが、第1及び第2の実施形態では、欠損データであっても効率よく使用したいとの観点から標本共分散行列の非対角要素は0とした。また、一方の群に結果が偏らないようにするために事前確率を等しくした。標本共分散行列の非対角成分を0、等事前確率としたフィッシャー線形識別器を改良フィッシャー線形識別器と呼び、式(2)により表す。改良フィッシャー線形識別器では、Z<0のときサンプルベクトルxをA群(「生存」に対応する)として分類するように割り当て、Z>0のときサンプルベクトルxをB群(「死亡」に対応する)として分類するように割り当てる。
【0045】
[数4]
Z=Z−Z (2)
【0046】
【数5】

【0047】
ここで、x、μij、σij、d(i=A,B)はそれぞれ、テストサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数(人数)を表す。ここで、クラスωは「生存」のクラス(Z<0)であり、クラスωは「死亡」のクラス(Z>0)である。
【0048】
図2の訓練サンプル集合92だけを用いて改良フィッシャー線形識別器を構築することにより、以下の式(3)により表される予測システムを構築した。以下の式(3)においてZ<0のときサンプルベクトルxを「生存」として分類し、Z>0のとき「死亡」として分類する。性別Ageは男性を1、女性を2とし、喫煙因子Smokeは喫煙者を1、非喫煙者を0とする。
【0049】
[数5]
Z=0.123978×Age−0.856709×Gender
+0.018992×sbp−0.011564×t.cho
+0.249791×HbA1c+0.748658×Smoke
−8.871682 (3)
【0050】
以上の第1の実施形態によれば、過去の知見及び医師の経験に基づいた候補因子に基づいて、改良フィッシャー線形識別器を用いて評価式Zを生成して構築したので、従来に良く使用された候補因子を用いて、10年以内の生死を精度よく予測することができ、医師が使用する候補因子の観点で非常に使いやすいという特有の効果を有する。
【0051】
次いで、本発明の第2の実施形態に係る10年以内生死予測装置10について以下に説明する。ここで、第2の実施形態に係る10年以内生死予測装置10は、計算機シミュレーションに基づいて構築することを特徴とする。
【0052】
まず、第2の実施形態における候補因子について以下に説明する。上述の第1の実施形態に係る10年以内生死予測装置10では、過去の報告及び医師の経験をもとに総死亡に強く関連すると考えられる因子を用いて10年生死予測システム10を構築したが、10年生死予測率の観点で最適であるとは限らない。そこで、第2の実施形態では、
(1)年齢Age、
(2)性別Gender、
(3)高血圧への進展関連因子、
(4)高コレステロール血症への進展/脂質異常症への進展関連因子、
(5)糖尿病への進展関連因子、
(6)喫煙の有無、
(7)フォンヴィレブランド因子(von Willebrand factor(vWF))、
(8)高感度CRP(hsCRP)、
(9)ホモシステイン(Homocysteine)
の9種類の候補因子の中から10年生死予測率の観点で最適な予測因子群を選択し、最適な予測因子群を用いて、第2の実施形態に係る10年以内生死予測装置10を構築した。
【0053】
高血圧への進展関連因子としては、収縮期血圧(sbp)、高血圧の有無I、高血圧の有無IIのうちいずれか一つを用いた。高コレステロール血症への進展もしくは脂質異常症への進展関連因子としては総コレステロール値(t.chol)、non−HDL値(総コレステロール値(t.chol)からHDLコレステロール値を引いた値をいう。)、脂質異常症I、脂質異常症の有無II、脂質異常症IIIのうちいずれか一つを用いた。また、糖尿病への進展関連因子としてはヘモグロビンA1c(HbA1c)、糖尿病の有無I、糖尿病の有無II、糖尿病の有無IIIのうちいずれか一つを用いた。ここで、以下の表1の通り各因子を定義する。
【0054】
【表1】

【0055】
ここで、高感度CRP(hsCRP)は炎症マーカーであり、心血管疾患死亡、癌死亡、総死亡に関連することがすでに知られている(例えば、非特許文献1〜3参照。)。フォンヴィレブランド因子(von Willebrand factor(vWF))は凝固線溶系及び血管内皮機能の指標であり、総死亡及び心血管疾患死亡の予知因子であることが知られている(例えば、非特許文献1参照。)。また、血管内皮機能のマーカーであるホモシステイン(Homocysteine)は、心血管疾患死亡及び非心血管疾患死亡の強い予知因子であることが知られている(例えば、非特許文献4参照。)。なお、第2の実施形態において、高感度CRP(hsCRP)は対数正規分布に従うために自然対数(ln)をとることとする。
【0056】
次いで、第2の実施形態における最適因子群の評価方法について以下に説明する。訓練サンプル集合92における年代別の生死割合(数)は表2の通りである。
【0057】
【表2】

【0058】
表2より、訓練サンプル集合92においては死亡者数より生存者数の方が極端に多くアンバランスである。また、若年者であるほど死亡し難く(生存しやすく)、年配者であるほど死亡しやすい(生存しにくい)ことが分かる。つまり、死亡の予測は困難であり、その中でも若年者の死亡予測は極めて困難であることが予想される。また、生存の中でも年配者の方が予測困難であることが予想される。
【0059】
若年者の死亡予測率と年配者の生存予測率を犠牲にすることにより、その他の場合の予測率の向上が見込まれるが、第2の実施形態では、年代ごとで大きく予測率が増減しないように次式(4)で表される全年代平均予測率Fに基づいて最適因子群を選択した。
【0060】
[数6]
F=(40、50歳代の生存予測率+60歳代の生存予測率+70歳代以上の生存予測率+40、50歳代の死亡予測率+60歳代の死亡予測率+70歳代以上の死亡予測率)/6 (4)
【0061】
ここで、
[数7]
(y歳代の生存予測率)=(y歳代の生存予測正解症例数)/(y歳代の生存症例数)
[数8]
(y歳代の死亡予測率)=(y歳代の死亡予測正解症例数)/(y歳代の死亡症例数)
である。
【0062】
次いで、第2の実施形態における最適因子群の選択方法について以下に説明する。10年以内生死予測に最適な因子群を選択するために、リーブワンアウト(leave−one−out)法を用いた。リーブワンアウト法を用いた最適因子群選択手順は以下の通りである。
【0063】
(手順1)9種類の候補因子の中からd(=1,2,3,…,9)個の因子群Ωを選択する。
(手順2)NTra個の訓練サンプルを(NTRa−1)個の疑似訓練サンプル(疑似訓練サンプル集合)と1個の疑似テストサンプルとに分割する。
(手順3)疑似訓練サンプル集合を用いて因子群Ωを用いた改良フィッシャー線形識別器(リーブワンアウト法を用いた10年以内生死予測装置10)を構築する。
(手順4)リーブワンアウト法を用いた10年以内生死予測装置10を用いて疑似テストサンプルの生死予測を行う。
(手順5)手順2〜5の処理を、すべての訓練サンプルが一度限り疑似テストサンプルに選択されるまで繰り返し、NTra個の10年以内生死予測結果を求める。この予測結果を基に全年代平均予測率FΩを推定する。
(手順6)手順1〜5を候補因子のすべての組合せ(d=1〜9)が選択されるまで繰り返す。ただし、同一種類の因子については同時に組合せとして選択されない。例えば、高血圧への進展関連因子に属する高血圧の有無Iと高血圧の有無IIは同時に選択されることはない。
(手順7)全年代平均予測率FΩが最大となる因子群Ωmaxを最適因子群とする。
【0064】
本発明者らの計算によれば、最適因子群選択手順を行うことにより、第2の実施形態のための最適因子群として、性別Gender、総コレステロール値(t.cho)、糖尿病の有無II、高感度CRP(hsCRP)、ホモシステイン(Homocysteine)が選択された。
【0065】
次いで、第2の実施形態に係る最適因子群による10年以内生死予測装置10について以下に説明する。上記の最適因子群Ωmaxを用いて改良フィッシャー線形識別器を適用することにより、次式(5)で表される10年以内生死予測装置10を構築した。式(5)においてサンプルベクトルxを、Z<0のとき「生存」として分類し、Z>0のとき「死亡」として分類する。
【0066】
[数9]
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×DiabetesII+0.29127×ln(hsCRP)
+0.116553×Homocysteine+2.927662 (5)
【0067】
ここで、DiabetesIIは表1における「糖尿病の有無II」の因子である。また、lnは自然対数である。
【0068】
以上の各実施形態においては、フィッシャー線形識別器及び改良フィッシャー線形識別器を用いて評価値Zの式を演算しているが、本発明はこれに限らず、一次識別器、二次識別器などのベイズ(Bayes)識別器等を用いて、所定の教師有り学習を用いる識別方法のサポートベクトルマシン(SVM)を用いて評価式を生成演算してもよい。
【0069】
なお、例えば、高感度CRP(hsCRP)以外の
(1)性別Gender、
(2)総コレステロール値(t.cho)、
(3)糖尿病の有無II(DiabetesII)、及び
(4)ホモシステイン(Homocysteine)
とを被験者のデータ値とし、次式(6)を用いて高感度CRP(hsCRP)の生死しきい値hsCRPTHを計算することにより、当該生死しきい値hsCRPTH未満にすることで10年以上生存する確率が高くなると予測することができる。
【0070】
[数10]
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×DiabetesII+0.29127×ln(hsCRPTH
+0.116553×Homocysteine+2.927662=0
(6)
【0071】
また、例えば、ホモシステイン(Homocysteine)以外の
(1)性別Gender、
(2)総コレステロール値(t.cho)、
(3)糖尿病の有無II(DiabetesII)、及び
(4)高感度CRP(hsCRP)
とを被験者のデータ値とし、次式(7)を用いてホモシステイン(Homocysteine)の生死しきい値HomocysteineTHを計算することにより、当該生死しきい値HomocysteineTH未満にすることで10年以上生存する確率が高くなると予測することができる。
【0072】
[数11]
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×DiabetesII+0.29127×ln(hsCRP)
+0.116553×HomocysteineTH+2.927662=0
(7)
【0073】
以下、図1及び図2を参照して、第1及び第2の実施形態に係る10年以内生死予測装置10の構成及び処理について詳述する。
【0074】
図1は本発明の第1及び第2の実施形態に係る10年以内生死予測装置10の詳細構成を示すブロック図である。図1において、当該装置10の10年以内生死予測処理を実行するときの入力項目のデータ(図3のステップS1で示す5項目のみに限らず、被験者識別データ(氏名、識別番号など)と対応付けして格納してもよい。)はキーボード41を用いてユーザにより入力されるが、本発明はこれに限らず、当該データを外部記憶装置60又は外部通信端末装置70で格納又は入力しておきハードディスクメモリ23(又はRAM22)に転送してもよい。10年以内生死予測装置10の通信インターフェース50は、インターネット80を介して外部通信端末装置70に接続され、10年以内生死予測装置10は、外部通信端末装置70にアクセスすることにより、所望する入力項目のデータを取得してハードディスクメモリ23に格納する。また、10年以内生死予測装置10のドライブ装置インターフェース35bを介して、例えばハードディスクメモリであり入力項目のデータを予め格納して提供する外部記憶装置60に接続され、10年以内生死予測装置10は、外部記憶装置60にアクセスすることにより、所望する入力項目のデータを取得してハードディスクメモリ23に格納してもよい。
【0075】
図1において、10年以内生死予測装置10は、
(a)当該10年以内生死予測装置10の動作及び処理を演算及び制御するデジタル計算機からなるコンピュータのCPU(中央演算処理装置)20と、
(b)オペレーションプログラムなどの基本プログラム及びそれを実行するために必要なデータを格納するROM(読み出し専用メモリ)21と、
(c)CPU20のワーキングメモリとして動作し、当該10年以内生死予測処理で必要なパラメータやデータを一時的に格納するRAM(ランダムアクセスメモリ)22と、
(d)当該10年以内生死予測処理において用いる入力項目のデータなどの各種データを格納するためのハードディスクメモリ23と、
(e)例えばハードディスクメモリで構成され、CD−ROMドライブ装置45を用いて読み込んだ、図3〜図4の10年以内生死予測処理の処理プログラム(これらのプログラムはコンピュータにより実行可能なプログラムである。)を格納するプログラムメモリ24と、
(f)外部通信端末装置70とインターネット80を介して接続され、外部通信端末装置70とデータを送受信する通信インターフェース50と、
(g)所定のデータや指示コマンドを入力するためのキーボード41に接続され、キーボード41から入力されたデータや指示コマンドを受信して所定の信号変換などのインターフェース処理を行ってCPU20に伝送するキーボードインターフェース31と、
(h)液晶ディスプレイ43上で指示コマンドを入力するためのマウス42に接続され、マウス42から入力されたデータや指示コマンドを受信して所定の信号変換などのインターフェース処理を行ってCPU20に伝送するマウスインターフェース32と、
(i)CPU20によって処理されたデータや設定指示画面、生成された出力データなどを表示する液晶ディスプレイ43に接続され、表示すべき画像データを液晶ディスプレイ43用の画像信号に変換して液晶ディスプレイ43に出力して表示するディスプレイインターフェース33と、
(j)CPU20によって処理されたデータ及び所定の生成された出力データなどを印字するプリンタ44に接続され、印字すべき印字データの所定の信号変換などを行ってプリンタ44に出力して印字するプリンタインターフェース34と、
(k)図3〜図4の10年以内生死予測処理の処理プログラムが記憶されたCD−ROM45aから当該プログラムのプログラムデータを読み出すCD−ROMドライブ装置45に接続され、読み出された画像処理プログラムのプログラムデータを所定の信号変換などを行ってプログラムメモリ24に転送するドライブ装置インターフェース35aと、
(l)例えば入力項目のデータを記憶する、例えばハードディスクメモリなどの外部記憶装置60に接続され、読み出されたデータを所定の信号変換などを行ってCPU20又はハードディスクメモリ23に転送するドライブ装置インターフェース35bとを備え、
これらの回路20〜24、31〜34、35a、35b及び50はバス30を介して接続される。
【0076】
図3及び図4は、第2の実施形態に係る10年以内生死予測装置10によって実行される10年以内生死予測処理を示すフローチャートである。なお、第1の実施形態に係る10年以内生死予測装置10によって実行される10年以内生死予測処理については、入力項目の相違、ステップS21〜S29の処理がないことを除いて、図3と同様に構成される。
【0077】
図3のステップS1において、まず、ユーザは以下の5つの入力項目についてキーボード41を用いて入力する。
(1)性別Gender(男性、女性)、
(2)総コレステロール値t.cho(mg/dl)、
(3)糖尿病の有無II「ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているか否か」、
(4)高感度CRP(hsCRP)(mg/dl)、及び
(5)ホモシステイン(Homocysteine)(μmol/l)。
【0078】
次いで、ステップS2において、性別は男性であるか否かが判断され、YESのときはステップS3に進む一方、NOのときはステップS4に進む。ステップS3ではGenderに1を代入してステップS5に進む一方、ステップS4ではGenderに2を代入してステップS5に進む。そして、ステップS5では、「ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているか」否かが判断され、YESのときはステップS6に進む一方、NOのときはステップS7に進む。ステップS6では、糖尿病の有無II(Diabetes II)に1を代入してステップS8に進む一方、ステップS7では、糖尿病の有無II(Diabetes II)に0を代入してステップS8に進む。さらに、ステップS8では、式(5)を用いて評価値Zを計算し、ステップS9では、Z<0であるか否かが判断され、YESのときはステップS10に進む一方、NOのときはステップS11に進む。
【0079】
ステップS10では、図5の表示例101に示すように、予測結果「10年以内に死亡しない確率は高いです。」と液晶ディスプレイ43に表示して当該処理を終了する。ステップS11では、Z=0であるか否かが判断され、YESのときはステップS12に進む一方、NOのときはステップS13に進む。ステップS12では、図6の表示例102に示すように、予測結果「10年以上生存する確率と10年以内に死亡する確率はほぼ同じです。」を液晶ディスプレイ43に表示して当該処理を終了する。ステップS13では、図7の表示例103に示すように、予測結果「10年以内に死亡する確率は高いです。」を液晶ディスプレイ43に表示して図4のステップS21に進む。
【0080】
図4のステップS21では、糖尿病の有無II(Diabetes II)=1であるか否かが判断され、YESのときはステップS22に進む一方、NOのときはステップS25に進む。ステップS22では、糖尿病の有無II(Diabetes II)=0であってその他の入力項目値はステップS1での入力値であるときの評価値Zを、式(5)を用いて計算し、ステップS23でZ<0であるか否かが判断され、YESのときはステップS24に進む一方、NOのときはステップS25に進む。ステップ24では、図7の表示例103に示すように、コメント表示「例えばヘモグロビンA1c(HbA1c)のみを6.5%未満に以下にすることで10年以上生存する確率が高くなります。例えば、カロリーを控えた食事と適度な運動をすることで当該数値を下げることができます。」を液晶ディスプレイ43に表示する。すなわち、ヘモグロビンA1c(HbA1c)の目標値を表示するとともに、その目標値を達成するためのアドバイスも表示している。
【0081】
次いで、ステップS25では、式(6)を用いて高感度CRP(hsCRP)(mg/dl)の生死しきい値hsCRPTH(mg/dl)を計算し、ステップS26では、図7の表示例103に示すように、コメント表示「例えば高感度CRP(hsCRP)(mg/dl)のみをhsCRPTH(mg/dl)以下にすることで10年以上生存する確率が高くなります。炎症の指標である当該数値を下げるためには、医療機関にて受診して必要な検査を行い、適切なアドバイスを受けて下さい。」を液晶ディスプレイ43に表示する。このコメント表示では、上記ステップS25で計算された具体的な生死しきい値hsCRPTH(mg/dl)の数値を表示するとともに、その目標値を達成するためのアドバイスも表示している。
【0082】
さらに、ステップS27では、式(8)を用いてホモシステイン(Homocysteine)(μmol/l)の生死しきい値HomocysteineTH(mg/dl)を計算し、ステップS28では、図7の表示例103に示すように、コメント表示「例えばホモシステイン(Homocysteine)(μmol/l)のみをHomocysteineTH(mg/dl)以下にすることで10年以上生存する確率が高くなります。動脈硬化の指標である当該数値を下げるためには、医療機関にて受診して必要な検査を行い、適切なアドバイスを受けて下さい。」を液晶ディスプレイ43に表示して当該処理を終了する。このコメント表示では、上記ステップS27で計算された具体的な生死しきい値HomocysteineTH(mg/dl)の数値を表示するとともに、その目標値を達成するためのアドバイスも表示している。
【0083】
以上の実施形態では、評価結果及びアドバイスを含むコメント結果を液晶ディスプレイ43に表示して出力しているが、本発明はこれに限らず、プリンタ44に出力して印字してもよい。例えば、複数の被験者に関する入力項目のデータ(被験者に関する氏名及び/又は識別番号を対応づけて含む。)を、例えば外部記憶装置60に記憶しておき、複数の被験者に対する式(5)などを用いて評価結果、コメント結果をまとめて表示又は印字出力してもよい。
【0084】
さらに、第1及び第2の実施形態に係る10年以内生死予測装置10の評価とその結果について以下に説明する。
【0085】
図8は第1の実施形態に係る図1の10年以内生死予測装置10を評価したときの評価値Zのバラツキを示すグラフである。また、図9は第2の実施形態に係る10年以内生死予測装置10を評価したときの評価値Zのバラツキを示すグラフである。ここで、第1及び第2実施形態に係る10年以内生死予測装置10の評価のために、当該予測装置10の構築において使用しなかった訓練サンプル集合92とは独立のN’Tes(=143)例のテストサンプルからなるテストサンプル集合94を用いる。図8及び図9において、×は10年以内の生存者を表し、○は10年以内の死亡者を表す。横軸は予測装置10の評価値(スコア)Zを表し、評価値Zが負の場合「生存」と予測し、正の場合「死亡」と予測する。図8及び図9の○又は×は一般住民一人ひとりの10年以内生死の予測を表している。
【0086】
図8から明らかなように、第1の実施形態に係る10年以内生死予測装置10では、143例中113例の生死を正しく予測することができた(予測率79.0%)。10年以内の生存者124例中100例を生存と予測し(生存正予測率80.6%)、10年以内の死亡者19例中13例の死亡を正しく予測することができた(死亡正予測率68。4%)。
【0087】
また、図9から明らかなように、第2の実施形態に係る10年以内生死予測装置10では、143例中104例の生死を正しく予測することができた(予測率72.7%)。10年以内の生存者124人中92例を生存と予測し、10年以内の死亡者19例中12例の死亡を正しく予測することができた。
【0088】
さらに、第1及び第2の実施形態に係る10年以内生死予測装置10についての年代別生死予測性能の評価結果について以下に説明する。ここで、第1の実施形態に係る10年以内生死予測装置10の年代別予測率を表3に示し、第2の実施形態に係る10年以内生死予測装置10の年代別予測率を表4に示す。
【0089】
【表3】

【0090】
【表4】

【0091】
表3及び表4から明らかなように、第1の実施形態に係る10年以内生死予測装置10では、40、50歳代の死亡の予測、70歳代の生存の予測率が極めて低いが、第2の実施形態に係る10年以内生死予測装置10では、全年代にわたってバランスよく生死の予測を行うことができた。特に、死亡予測が困難な40、50歳代の死亡を第2の実施形態では2例中2例とも正しく予測することができた。また、70歳代の生存も高い予測率を得ることができた。
【0092】
以上の実施形態において、図3〜図4の10年以内生死予測処理の処理プログラムが記憶されたコンピュータにより読取可能なCD−ROM45aを用いて実行してもよいし、CD−R,CD−RW,DVD,DVD−R,DVD−RW,DVD−RAM,ブルーレイディスクなどのコンピュータにより読取可能な種々の記録媒体を用いてもよい。
【産業上の利用可能性】
【0093】
以上詳述したように、本発明に係る生死予測装置とその方法、生死予測プログラム及びそのプログラムを記録した記録媒体によれば、性別、総コレステロール値t.cho(mg/dl)、糖尿病の有無、高感度CRP(hsCRP)(mg/dl)、及びホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力し、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算し、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する。従って、10年以内の日本人の各個人別の生死を、被験者の年齢にかかわらず、従来技術に比較して高精度で予測することができる。
【0094】
また、別の発明に係る生死予測装置とその方法、生死予測プログラム及びそのプログラムを記録した記録媒体によれば、年齢Age、性別Gender、収縮期血圧sbp(mmHg)、総コレステロール値t.cho(mg/dl)、ヘモグロビンA1c(HbA1c)(%)、及び喫煙の有無を含む入力項目のデータを入力し、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算し、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する。従って、過去の知見及び医師の経験に基づいた候補因子に基づいて、改良フィッシャー線形識別器を用いて評価式Zを生成して構築したので、従来に良く使用された候補因子を用いて、10年以内の生死を精度よく予測することができ、医師が使用する候補因子の観点で非常に使いやすいという特有の効果を有する。
【符号の説明】
【0095】
10…10年以内生死予測装置、
20…CPU、
21…ROM、
22…RAM、
23…ハードディスクメモリ、
24…プログラムメモリ、
30…バス、
31…キーボードインターフェース、
32…マウスインターフェース、
33…ディスプレイインターフェース、
34…プリンタインターフェース、
35a,35b…ドライブ装置インターフェース、
41…キーボード、
42…マウス、
43…液晶ディスプレイ、
44…プリンタ、
45…CD−ROMドライブ装置、
45a…CD−ROM、
50…通信インターフェース、
60…外部記憶装置、
70…外部通信端末装置、
80…インターネット、
90…サンプル集合、
91,92…訓練サンプル集合、
93,94…テストサンプル集合。

【特許請求の範囲】
【請求項1】
所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測装置であって、
(1)性別、
(2)総コレステロール値t.cho(mg/dl)、
(3)糖尿病の有無、
(4)高感度CRP(hsCRP)(mg/dl)、及び
(5)ホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力する入力手段と、
複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算する計算手段と、
上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する出力手段とを備えたことを特徴とする10年以内生死予測装置。
【請求項2】
上記計算手段はさらに、高感度CRP(hsCRP)以外の入力項目のデータを用いて、評価値Z=0となるときの高感度CRP(hsCRP)の生死しきい値を計算し、
上記出力手段はさらに、上記高感度CRP(hsCRP)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする請求項1記載の10年以内生死予測装置。
【請求項3】
上記計算手段はさらに、ホモシステイン(Homocysteine)以外の入力項目のデータを用いて、評価値Z=0となるときのホモシステイン(Homocysteine)の生死しきい値を計算し、
上記出力手段はさらに、上記ホモシステイン(Homocysteine)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする請求項1記載の10年以内生死予測装置。
【請求項4】
上記評価式Zは、
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×Diabetes+0.29127×ln(hsCRP)
+0.116553×Homocysteine+2.927662
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Diabetesは「ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているか否か」である上記糖尿病の有無であり、ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているとき1であり、それ以外のとき0であることを特徴とする請求項1乃至3のうちのいずれか1つに記載の10年以内生死予測装置。
【請求項5】
上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【数1】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする請求項1乃至4のうちのいずれか1つに記載の10年以内生死予測装置。
【請求項6】
コンピュータにより、所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測方法であって、
(1)性別、
(2)総コレステロール値t.cho(mg/dl)、
(3)糖尿病の有無、
(4)高感度CRP(hsCRP)(mg/dl)、及び
(5)ホモシステイン(Homocysteine)(μmol/l)を含む入力項目のデータを入力するステップと、
上記コンピュータが、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算するステップと、
上記コンピュータが、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力するステップとを含むことを特徴とする10年以内生死予測方法。
【請求項7】
上記計算するステップはさらに、上記コンピュータが、高感度CRP(hsCRP)以外の入力項目のデータを用いて、評価値Z=0となるときの高感度CRP(hsCRP)の生死しきい値を計算し、
上記出力ステップはさらに、上記コンピュータが、上記高感度CRP(hsCRP)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする請求項6記載の10年以内生死予測方法。
【請求項8】
上記計算するステップはさらに、ホモシステイン(Homocysteine)以外の入力項目のデータを用いて、評価値Z=0となるときのホモシステイン(Homocysteine)の生死しきい値を計算し、
上記出力するステップはさらに、上記ホモシステイン(Homocysteine)を上記計算された生死しきい値未満にすることで10年以上生存する確率が高くなることからなるコメントを出力することを特徴とする請求項6記載の10年以内生死予測方法。
【請求項9】
上記評価式Zは、
Z=−0.856709×Gender−0.011564×t.cho
+0.770368×Diabetes+0.29127×ln(hsCRP)
+0.116553×Homocysteine+2.927662
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Diabetesは「ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているか否か」である上記糖尿病の有無であり、ヘモグロビンA1c(HbA1c)が6.5%以上もしくは糖尿病の治療を受けているとき1であり、それ以外のとき0であることを特徴とする請求項6乃至8のうちのいずれか1つに記載の10年以内生死予測方法。
【請求項10】
上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【数2】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする請求項6乃至9のうちのいずれか1つに記載の10年以内生死予測方法。
【請求項11】
請求項6乃至10のうちのいずれか1つに記載の10年以内生死予測方法の各ステップを含むことを特徴とするコンピュータにより実行可能な生死予測プログラム。
【請求項12】
請求項11記載のコンピュータにより実行可能な生死予測プログラムを記録したことを特徴とするコンピュータにより読取可能な記録媒体。
【請求項13】
所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測装置であって、
(1)年齢Age、
(2)性別Gender、
(3)収縮期血圧sbp(mmHg)、
(4)総コレステロール値t.cho(mg/dl)、
(5)ヘモグロビンA1c(HbA1c)(%)、及び
(6)喫煙の有無を含む入力項目のデータを入力する入力手段と、
複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算する計算手段と、
上記計算された評価値Zに対応する生存又は死亡の評価結果を出力する出力手段とを備え、
上記評価式Zは、
Z=0.123978×Age−0.856709×Gender
+0.018992×sbp−0.011564×t.cho
+0.249791×HbA1c+0.748658×Smoke
−8.871682
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Smokeは喫煙者のとき1であり、非喫煙者のとき0であり、
上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【数3】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする10年以内生死予測装置。
【請求項14】
コンピュータにより、所定の入力項目のデータに基づいて被験者の10年以内の生死を予測する10年以内生死予測方法であって、
(1)年齢Age、
(2)性別Gender、
(3)収縮期血圧sbp(mmHg)、
(4)総コレステロール値t.cho(mg/dl)、
(5)ヘモグロビンA1c(HbA1c)(%)、及び
(6)喫煙の有無を含む入力項目のデータを入力するステップと、
上記コンピュータが、複数の被験者についての上記入力項目及び10年以内生死に関する実際のデータを訓練データとして用いて教師あり学習を用いる識別方法の識別器を用いて生成された10年以内の生死予測の評価式Zを用いて、上記入力された入力項目のデータに基づいて評価値Zを計算するステップと、
上記コンピュータが、上記計算された評価値Zに対応する生存又は死亡の評価結果を出力するステップとを含み、
上記評価式Zは、
Z=0.123978×Age−0.856709×Gender
+0.018992×sbp−0.011564×t.cho
+0.249791×HbA1c+0.748658×Smoke
−8.871682
で表され、
(a)上記Genderは性別であって、男性のとき1であり、女性のとき2であり、
(b)上記Smokeは喫煙者のとき1であり、非喫煙者のとき0であり、
上記教師あり学習を用いる識別方法の識別器は、フィッシャー線形識別器において上記実際のデータに係る標本共分散行列の非対角成分を0とし、等事前確率としてなる改良フィッシャー線形識別器であり、上記改良フィッシャー線形識別器は以下の式で表され、
Z=Z−Z
【数4】

ここで、x、μij、σij、d(i=A,B)はそれぞれ、上記実際のデータに係るサンプルベクトルxの第j要素、クラスωの訓練サンプル第j要素の標本平均値、クラスωの訓練サンプル第j要素の標本分散、要素数を表し、Z<0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをA群として分類するように割り当て、Z>0のとき、上記実際のデータのうちの生存に係るデータからなるサンプルベクトルxをB群として分類するように割り当てたことを特徴とする10年以内生死予測方法。
【請求項15】
請求項14記載の10年以内生死予測方法の各ステップを含むことを特徴とするコンピュータにより実行可能な生死予測プログラム。
【請求項16】
請求項15記載のコンピュータにより実行可能な生死予測プログラムを記録したことを特徴とするコンピュータにより読取可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−61785(P2013−61785A)
【公開日】平成25年4月4日(2013.4.4)
【国際特許分類】
【出願番号】特願2011−199648(P2011−199648)
【出願日】平成23年9月13日(2011.9.13)
【出願人】(599045903)学校法人 久留米大学 (72)