説明

健診データ処理方法、健診データ処理装置、及び、プログラム

【課題】 生体が本来的に持っているゆらぎを利用して、検査項目間の相関を精度良く反映させ得るようにして、精度の高い予測や検査結果の再検討に役立てる。
【解決手段】 医療の各検査項目について統計処理可能な量のデータを有する健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分処理と、前記レベル区分処理により区分した各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算処理とを実行することを特徴とする健診データ処理方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、健診データ処理方法、処理装置、及び、プログラムに関する。詳しくは、生体の状態を様々な視点から表す情報であるため相関を有している各検査項目の検査値を統一的に扱うことにより、検査項目間の相関を精度良く反映させることを可能にした、健診データ処理方法、処理装置、及び、プログラムに関する。
検査項目としては、例えば、BMI、最高血圧、最低血圧、白血球数、赤血球数、血色素量、Ht(ヘマトクリット)、MCV(平均赤血球容積)、MCH(平均赤血球血色素量)、MCHC(平均赤血球血色素濃度)、血小板、GOT、GPT、γGTP、総コレステロール、中性脂肪、HDLコレステロール、随時血糖等を挙げることができる。
【背景技術】
【0002】
従来の保健指導では、産業医や担当医が受診者の健診結果を見て、自身の経験に基づいて判断して指導する手法や、過去の検査結果からの直線回帰式によって将来の健康状態を予測して指導する手法が行われている。
しかし、産業医や担当医の経験に基づく手法には、多大な労力や費用を必要とするという問題点がある。また、過去の検査結果からの直線回帰式に基づく手法では、トレンドは読み取れるものの、集団としての生理学的な変化や個人の特性の両面を考慮して予測を行うことができないため精度が悪く、長期の予測には耐え得ないという問題点がある。
現時点では、生体が本来有する生理学的な特性や個人毎の健康状態を活用することにより、精度良く将来の健康状態等を予測する手法は提供されていない。
【先行技術文献】
【特許文献】
【0003】
特開2006−343792号公報(特許文献1)には、第1の時点で第1の条件を満たし、且つ、第2の時点で第2の条件を満たした受診者の中で、或る疾病aを発症した受診者の割合 (発症率)を対応付けるルールを、疾病別や条件別に多数作成しておき、受診者の検査値が入力されると、何れのルールを満たすかを調べて、該当する疾病とその発症率を表示等するシステムが記載されている。
なお、第1の条件とは、例えば、性別:男性,年齢:40代,BMI≧25,血糖値<125,間食:する,等であり、第1の条件に対応する第2の条件とは、性別や年齢のような不変又は第1の条件から既定となる項目を除いた項目値、例えば、BMI≧30、血糖値<140,間食:する,等である。
【特許文献1】特開2006−343792号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のシステムでは、ルールの作成に際して作成者が種々の事情を考慮して漏れが無いように網羅する必要があるため、煩雑な手間を要するばかりでなく、作成者の経験等に依存する度合いが大きくなり、精度にも問題が生ずる。
また、結果的に非常に多数のルールが存在するため、入力された受診者の検査値から該当するルールを抽出する演算処理にも、大きな負荷がかかるようになる。
【0005】
本発明は、生体が本来有する生理学的な特性を、集団及び個人の両面から考慮することにより、精度の高い予測や検査結果の再検討、さらには、現病名の再検討や未知の病名の探索を可能にすることを目標とし、そのための基礎技術として、生体が本来的に持っているゆらぎに着目して、検査値が属するべきレベルを区分する手法を提供し、さらに、該レベル区分を活用することにより、或る1又は2以上の検査項目の検査結果から別の検査項目の現時点又は将来の値を精度良く推定する手法を提供することを目的とする。
そのため、例えば、各検査項目の検査値が、生体という統一体から得られる情報であるために相関を有するということに着目して、各検査項目の検査値を統一的に扱う手法を提供し、これにより、検査項目間の相関を精度良く反映させ得るようにする。
また、或る検査項目の検査値が欠けている場合でも、検査項目間の精度の良い相関を利用することにより、当該或る検査項目とは別の検査項目(群)の検査結果から、当該或る検査項目の検査値を精度良く推定できるようにする。
また、現在の検査結果から将来の検査結果を精度良く予測できるようにし、さらに、その予測値を精度良く補正できるようにする。
【課題を解決するための手段】
【0006】
本発明の構成を、下記[1]〜[16]に記す。
[1]構成1
医療の各検査項目について統計処理可能な量のデータを有する健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分処理と、
前記レベル区分処理により区分した各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算処理と、
を実行することを特徴とする健診データ処理方法。
[2]構成2
構成1に於いて、
前記最上レベルと最下レベルは異常検査値のレベルであり、最上レベルと最下レベルの間の複数個の各レベルは正常検査値のレベルである、
ことを特徴とする健診データ処理方法。
【0007】
所定のレコード群は、或る特定の群に偏ることなく、多数の人の特性を満遍なく表し得るデータを構成できればよく、例えば、数年間に渡って蓄積した膨大な健診データの中から、1回だけ受診した人(受診者IDが一つのみ)を抽出したレコード群を採用することができる。望ましくは、1回だけ受診した人であって、受診時に「疾患を有しない」と判定された人のレコード群を採用することができる。ここで、「疾患を有しない」とは、所定の問診表の病名の申告欄に病名がなんら記載されなかったか、又は、疾患が無い旨が記載されたことをいう。このように、健康であるか、又は、少なくとも疾患を自覚していない多数人のデータを採用することにより、さらに精度の良い結果を得ることができる。
検査項目としては、例えば、BMI、最高血圧、最低血圧、白血球数、赤血球数、血色素量、Ht(ヘマトクリット)、MCV(平均赤血球容積)、MCH(平均赤血球血色素量)、MCHC(平均赤血球血色素濃度)、血小板、GOT、GPT、γGTP、総コレステロール、中性脂肪、HDLコレステロール、随時血糖等を挙げることができる。
区分数と各レベルの比率としては、例えば、各検査項目について、それぞれ検査値が低い方から順に、2.50%(レベル1)、23.75%(レベル2)、23.75%(レベル3)、23.75%(レベル4)、23.75%(レベル5)、2.50%(レベル6)、のように区分する手法を例示できる。この場合、最上レベルがレベル6、最下レベルがレベル1である。最上と最下の両レベル(異常値)の合計は5%であり、これらの間のレベル2〜5(正常値)が、それぞれ、23.75%ずつに区分されている。なお、このような区分に限定されず、例えば、中間のレベルを3区分以下や5区分以上に区分したり、最上と最下のレベルを2.50%から増減させたりしてもよい。
【0008】
健康な人の場合、生体が本来的に持っているゆらぎのため、正常値とされる範囲内であれば、何れの値も同様にとり得る、換言すれば、正常値の範囲内の任意の値を、同じ確率でとり得る。このことに、本願の発明者は注目した。
即ち、正常値の範囲を構成1の如く等分割して、各区分にレベル値を割り振ると、
(1)健康な人の場合、各検査項目のレベル値(例:18検査項目のレベル値)の組合せは、正常値の範囲内(レベル2〜レベル5)でランダムとなる。このため、多数の健康人が或る特定のパターンを表すことは無く、階層型クラスタリングを行っても、或る特定の検査項目群の或る特定のレベル値の組合せに集中が現れることは無い。
これに対して、
(2)病人の場合、病気に応じた特定の検査項目群のレベル値が異常値(レベル1又はレベル6)をとり、階層型クラスタリングを行うと、病気に応じた特定の検査項目群の特定のレベル値(レベル1又はレベル6)の組合せへの集中が現れる。
したがって、
(3)健康から病気へ推移する過程では、病気に応じた特定の検査項目群の特定のレベル値の組合せへの集中傾向が現れるようになり、相関係数が大きくなる。
以上の理由から、構成1、2のように区分すると、或る1又は2以上の検査項目の検査値又は検査値の組合せから別の検査項目の検査値を精度良く推定したり、予測したり、予測値を修正することが可能となる。
検査項目・レベルについては、本明細書では、以下、例えばBMIがレベル5であるとき、 「BMI・5」のように表記することとする。
【0009】
[3]構成3
構成1又は構成2に於いて、さらに、
前記レベル区分処理により区分した検査項目・レベルの中から選ばれる第1データとしての検査項目・レベル(又は複数の検査項目・レベルの組合せ)を前提としたとき、当該第1データを規定する検査項目(又は複数の検査項目)とは別の検査項目の或るレベルである第2データが生起する確率を、第1データと第2データの種々の組合せについてそれぞれ調べ、生起確率が所定値以上となる両データの組合せを、第1データから第2データを導出する導出ルールとして抽出するルール抽出処理、
を実行することを特徴とする健診データ処理方法。
上記に於いて、「(又は複数の検査項目・レベルの組合せ)」では、例えば、「最高血圧・2」と「最高血圧・3」というような「検査項目・レベル」は、有り得ない組合せであるため、調べる対象から予め除外されるものとする。
第1データを前提としたとき第2データが生起する確率を、本明細書では、適宜、「信頼度」ということとする。
信頼度の閾値を与える所定値としては、例えば「80%」を用いることができるが、これに限定されず、適宜に増減してよい。
【0010】
[4]構成4
構成3に於いて、
前記ルール抽出処理は、同一検査項目の第2データを導出する2以上の検査項目・レベル(又は複数の検査項目・レベルの組合せ)が存在する場合は、その中で最大の生起確率を与える検査項目・レベル(又は複数の検査項目・レベルの組合せ)を、当該検査項目のレベルを導出する第1データとする、
ことを特徴とする健診データ処理方法。
例えば、或る健診データベースの例では、「Ht・2」と「MCHC・3」という第1データを前提としたとき「血色素量・2」という第2データが信頼度100%で導出されるが、別の第1データから「血色素量・1」という第2データが信頼度83%で導出されるような場合は、信頼度の高い方の第2データ(「血色素量・2」)を選択する、ということである。
【0011】
[5]構成5
構成4に於いて、さらに、
複数の検査項目と各検査項目のレベルが修正判定セットとして与えられると、前記ルール抽出処理により抽出された何れかの導出ルールの第1データに該当する検査項目・レベル(又は複数の検査項目・レベルの組合せ)の有無を調べ、該当有りの場合は、当該検査項目・レベル(又は当該複数の検査項目・レベルの組合せ)を当該修正判定セットの第1データとして抽出する第1データ抽出処理と、
前記第1データ抽出処理により第1データが抽出されると、当該第1データに対応する導出ルールによって導出される第2データの検査項目・レベルを、当該修正判定セットの対応する検査項目の修正データとして返す修正処理と、
を実行することを特徴とする健診データ処理方法。
第1データ抽出処理に対して与えられる「修正判定セット」は、例えば、キーボードやマウス等の入力装置から与えられることができるが、これに限定されない。例えば、所定の受診者リストから順に与えられてもよく、LAN更には外部のネットを介して与えられてもよい。
【0012】
[6]構成6
構成5に於いて、さらに、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算処理により求めた境界検査値を用いて区分する区間レベル区分処理と、
前記区間レベル区分処理により区分した任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求めるとともに、その中で遷移確率が最大のレベルを、当該任意の年齢区間・検査項目のレベルからの遷移先仮レベルとする遷移確率算出処理と、
受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出処理により求めた遷移先仮レベルを取得する仮レベル取得処理と、
を実行し、
前記第1データ抽出処理は、前記仮レベル取得処理によって後続する年齢区間・検査項目の各遷移先仮レベルが取得されると、当該遷移先仮レベルのセットを、前記修正判定セットとして処理する、
ことを特徴とする健診データ処理方法。
同一受診者の時系列データを持つレコード群は、同一受診者のレコードが、隣接する年齢区間の両方に跨がって含まれるようにすることにより、検査値の経年推移を各同一受診者について得るものである。例えば、6年間継続し且つ毎年1回受診した受診者のレコード群であり、年齢区間を5才刻みとするような場合である。
[7]構成7
構成6に於いて、
前記レベル区分処理は、前記健診データベース中の所定のレコード群として、前記区間レベル区分処理が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算処理は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理方法。
例えば、境界値演算処理と区間レベル区分処理で、年齢区間を、〜19才、20〜24才、25〜29才、30〜34才、・・・のように揃える場合である。
【0013】
[8]構成8
医療の各検査項目について統計処理可能な量のデータを有する健診データベースを保持している記憶装置と、
前記健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分手段と、
前記レベル区分手段により区分された各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算手段と、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算手段により求められた境界検査値を用いて区分する区間レベル区分手段と、
前記区間レベル区分手段により区分された任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求めるとともに、その中で遷移確率が最大のレベルを、当該任意の年齢区間・検査項目のレベルからの遷移先仮レベルとする遷移確率算出手段と、
受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出手段により求められた遷移先仮レベルを取得する仮レベル取得手段と、
前記レベル区分手段により区分された検査項目・レベルの中から選ばれる第1データとしての検査項目・レベル(又は複数の検査項目・レベルの組合せ)を前提としたとき、当該第1データを規定する検査項目(又は複数の検査項目)とは別の検査項目の或るレベルである第2データが生起する確率を、第1データと第2データの種々の組合せについてそれぞれ調べ、生起確率が所定値以上となる両データの組合せを、第1データから第2データを導出する導出ルールとして抽出するルール抽出手段と、
前記仮レベル取得手段によって後続する年齢区間・検査項目の各遷移先仮レベルのセットが取得されると、該遷移先仮レベルのセットを修正判定対象として、前記ルール抽出手段により抽出された何れかの導出ルールの第1データに該当する検査項目・レベル(又は複数の検査項目・レベルの組合せ)の有無を調べ、該当有りの場合は、当該検査項目・レベル(又は当該複数の検査項目・レベルの組合せ)を当該修正判定対象の第1データとして抽出する第1データ抽出手段と、
前記第1データ抽出手段により第1データが抽出されると、当該第1データに対応する導出ルールによって導出される第2データの検査項目・レベルを、当該修正判定対象の対応する検査項目の修正データとして返す予測修正手段と、
を有することを特徴とする健診データ処理装置。
【0014】
[9]構成9
構成8に於いて、
前記レベル区分手段は、前記健診データベース中の所定のレコード群として、前記区間レベル区分手段が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算手段は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理装置。
[10]構成10
構成9に於いて、さらに、
前記修正手段によって返された修正データを、修正前のデータと区別して、所定の表示装置に表示する表示制御手段、
を有することを特徴とする健診データ処理装置。
【0015】
[11]構成11
構成1又は構成2に於いて、さらに、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算処理により求めた境界検査値を用いて区分する区間レベル区分処理と、
前記区間レベル区分処理により区分した任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求める遷移確率算出処理と、
を実行することを特徴とする健診データ処理方法。
【0016】
[12]構成12
構成11に於いて、
前記レベル区分処理は、前記健診データベース中の所定のレコード群として、前記区間レベル区分処理が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算処理は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理方法。
[13]構成13
構成12に於いて、さらに、
受診者の年齢と複数の検査項目の各検査値が予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出処理により求めた中で遷移確率が最大のレベルを求め、そのレベルのセットを予測セットとして返す遷移先予測処理、
を実行することを特徴とする健診データ処理方法。
【0017】
[14]構成14
医療の各検査項目について統計処理可能な量のデータを有する健診データベースを保持している記憶装置と、
前記健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分手段と、
前記レベル区分手段により区分された各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算手段と、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算手段により求められた境界検査値を用いて区分する区間レベル区分手段と、
前記区間レベル区分手段により区分された任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求める遷移確率算出手段と、
受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出手段により求められた中で遷移確率が最大のレベルを求め、そのレベルのセットを予測セットとして返す遷移先予測手段と、
を有することを特徴とする健診データ処理装置。
[15]構成15
構成14に於いて、
前記レベル区分手段は、前記健診データベース中の所定のレコード群として、前記区間レベル区分手段が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算手段は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理装置。
【0018】
[16]構成16
コンピュータを、請求項8〜請求項10、請求項14、又は、請求項15の何れかの健診データ処理装置として機能させるためのプログラム。
【発明の効果】
【0019】
構成1は、医療の各検査項目について統計処理可能な量のデータを有する健診データベース中の所定のレコード群の各検査項目の検査値分布を同じレベルに属する検査値数の比率が各検査項目間で同一となり且つ最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるようにそれぞれ所定数個のレベルに区分するレベル区分処理と、前記レベル区分処理により区分した各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算処理とを実行することを特徴とする健診データ処理方法である。また、構成2は、構成1に於いて、前記最上レベルと最下レベルは異常検査値のレベルであり、最上レベルと最下レベルの間の複数個の各レベルは正常検査値のレベルであることを特徴とする健診データ処理方法である。
このため、或る1又は2以上の検査項目の検査値又は検査値の組合せから別の検査項目の検査値を精度良く推定したり、予測したり、予測値を修正する際に必要な基礎的手法を提供することができる。
また、各々特質は異なるが生体という統一体から得られる情報である各検査項目の検査値を、統一的に扱う手法を提供することができ、検査項目間の相関を精度良く反映させることが可能となる。
【0020】
構成3は、構成1又は構成2に於いて、さらに、前記レベル区分処理により区分した検査項目・レベルの中から選ばれる第1データとしての1以上の検査項目・レベルを前提としたとき、別の検査項目の或るレベルである第2データが生起する確率を第1データと第2データの種々の組合せについてそれぞれ調べ、生起確率が所定値以上となる両データの組合せを第1データから第2データを導出する導出ルールとして抽出するルール抽出処理を実行することを特徴とする健診データ処理方法である。また、構成4は、構成3に於いて、前記ルール抽出処理は、同一検査項目の第2データを導出する第1データが存在する場合は、その中で最大の生起確率を与える第1データを、当該検査項目のレベルを導出する第1データとすることを特徴とする健診データ処理方法である。また、構成5は、構成4に於いて、さらに、複数の検査項目と各検査項目のレベルが修正判定セットとして与えられると、前記ルール抽出処理により抽出された何れかの導出ルールの第1データに該当する検査項目・レベル(又は複数の検査項目・レベルの組合せ)の有無を調べ、該当有りの場合は、当該検査項目・レベル(又は当該複数の検査項目・レベルの組合せ)を当該修正判定セットの第1データとして抽出する第1データ抽出処理と、前記第1データ抽出処理により第1データが抽出されると、当該第1データに対応する導出ルールによって導出される第2データの検査項目・レベルを、当該修正判定セットの対応する検査項目の修正データとして返す修正処理とを実行することを特徴とする健診データ処理方法である。
このため、或る1又は2以上の検査項目の検査値又は検査値の組合せから別の検査項目の検査値を精度良く推定したり、推定値を修正したりすることができる。
【0021】
構成6は、構成5に於いて、さらに、前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布をそれぞれ前記境界値演算処理により求めた境界検査値を用いて区分する区間レベル区分処理と、前記区間レベル区分処理により区分した任意の年齢区間・検査項目のレベルから後続する年齢区間・検査項目の各レベルへ遷移する確率を当該任意の年齢区間・検査項目のレベルから後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求めるとともにその中で遷移確率が最大のレベルを当該任意の年齢区間・検査項目のレベルからの遷移先仮レベルとする遷移確率算出処理と、受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについてそれぞれ前記遷移確率算出処理により求めた遷移先仮レベルを取得する仮レベル取得処理とを実行し、前記第1データ抽出処理は、前記仮レベル取得処理によって後続する年齢区間・検査項目の各遷移先仮レベルが取得されると当該遷移先仮レベルのセットを前記修正判定セットとして処理することを特徴とする健診データ処理方法である。また、構成7は、構成6に於いて、前記レベル区分処理は、前記健診データベース中の所定のレコード群として前記区間レベル区分処理が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、前記境界値演算処理は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求めることを特徴とする健診データ処理方法である。
このため、或る1又は2以上の検査項目の検査値又は検査値の組合せから別の検査項目の検査値を精度良く予測して修正することができる。
【0022】
構成8は、構成6の処理を実現する装置であり、そのような装置を提供することができる。また、構成9は、構成7の処理を実現する装置であり、そのような装置を提供することができる。構成10は、構成9に於いて、さらに、前記修正手段によって返された修正データを修正前のデータと区別して所定の表示装置に表示する表示制御手段を有することを特徴とする健診データ処理装置であり、そのような装置を提供することができる。
【0023】
構成11は、構成1又は構成2に於いて、さらに、前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ前記境界値演算処理により求めた境界検査値を用いて区分する区間レベル区分処理と、前記区間レベル区分処理により区分した任意の年齢区間・検査項目のレベルから後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求める遷移確率算出処理とを実行することを特徴とする健診データ処理方法である。また、構成12は、構成11に於いて、前記レベル区分処理は、前記健診データベース中の所定のレコード群として前記区間レベル区分処理が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、前記境界値演算処理は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求めることを特徴とする健診データ処理方法である。また、構成13は、構成12に於いて、さらに、受診者の年齢と複数の検査項目の各検査値が予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについてそれぞれ前記遷移確率算出処理により求めた中で遷移確率が最大のレベルを求めそのレベルのセットを予測セットとして返す遷移先予測処理を実行することを特徴とする健診データ処理方法である。
このため、或る1又は2以上の検査項目の検査値又は検査値の組合せから別の検査項目の検査値を精度良く予測することができる。
【0024】
構成14や構成15は、構成13の処理を実現する装置であり、そのような装置を提供することができる。
【0025】
構成16は、コンピュータを、構成8〜10、14、又は15の何れかの健診データ処理装置として機能させるためのプログラムであるため、構成8〜10、14、又は15の装置を実現するプログラムを提供することができる。
【図面の簡単な説明】
【0026】
【図1】健診データ処理&予測処理の手順を示すフローチャート。
【図2】実施の形態の装置の構成を示すブロック図(a)と、レベル区分の手法の説明図 (b)。
【図3】健診データベースの構成例を示す説明図(a)と、検査値をレベル化する実例を示す説明図(b)。
【図4】検査値の年齢範囲別の確率分布と遷移確率を男性・中性脂肪の場合について例示する説明図(導出ルール適用前)。
【図5】導出ルールの抽出例を示す説明図(a)と、遷移先のレベルを導出ルールの第2データで置換する例を示す説明図(b)。
【図6】図4の説明図で導出ルール適用後を示す。
【図7】図4の説明図で任意の年齢区間・レベル(45〜49才・レベル6)を選択した場合の表示の変化を示す説明図。
【図8】図4の説明図で任意の年齢区間・レベル(45〜49才・レベル6)を選択した場合の表示の変化を、区間区分図の一部を非表示とし、さらに、現状の予想を併せて表示して示す説明図。
【発明を実施するための形態】
【0027】
図面を参照して、本発明の実施の形態を説明する。
実施の形態の方法・装置は、図2(a)に示すコンピュータシステムに於いて実現される。即ち、制御装置10がROM13や必要に応じて記憶装置11から所定のプログラムを読み出して、図1に示す手順を実行することにより、実現される。
【0028】
ハードディスク或いはSSD等で構成される記憶装置11には、統計処理可能な量の健診データを有する健診データベースが格納されている。また、本願の健診データ処理機能を実現するためのアプリケーション等の各種のアプリケーションを、必要に応じて格納させてもよい。
【0029】
健診データベースの構成例を、図3(a)に示す。
図示の例では、一意の受診者IDと受診年月日に対応付けて、18個の検査項目(BMI,最高血圧(SBP),最低血圧(DBP),白血球数,赤血球数,血色素量(Hb),ヘマトクリット(Ht),MCV,MCH,MCHC,血小板,GOT,GPT,γGTP,総コレステロール,中性脂肪,HDLコレステロール(図ではHDLと略記),随時血糖)を有する。これらの検査項目は一例であり、他の検査項目を追加する等、適宜に増減してよい。また、別のテーブル(不図示)には、共通の受診者IDに対応付けて、年齢や性別等の受診者の属性が記録されている。
【0030】
制御装置10は、CPU等を有する公知の構成を有する。
図2(a)の例では記憶装置(ハードディスク)11は制御装置10に接続されているが、例えば、LAN等を介して接続されていてもよい。また、入力装置としても、図示のキーボード・マウスに限定されず、例えば、ICカードに記録された健診結果を読み取って健診データベースに蓄積する構成や、LAN(更にはインターネット)を介して入力される健診結果を健診データベースに蓄積する構成でもよい。予測対象者等のデータ(各検査項目の検査値;修正判定セットの元データ,予測判定セットの元データ)の入力に関しても同様である。また、出力装置もディスプレイに限定されず、プリンタやスピーカでもよい。要は、図1の手順を実行できる構成であれば、ハードウェアの構成は任意である。
【0031】
図1に即して、実施の形態の装置の機能を実現する手順を説明する。
まず、健診データベースから、図3(a)に示す各検査項目の項目値を有するレコードのデータを取得する。また、各レコードの受診者IDにより対応付けられる各受診者の属性(年齢・性別)のデータも、不図示のテーブルから併せて取得する。
本例では、健診データとして、1回受診データ(レコード数:64194件)と、6回受診データ(受診者ID総数:12099)を用いている。
【0032】
1回受診データとは、データを蓄積した6年間の内、何れか1年の1回のみ、当該受診者IDのレコードが存在するデータであって、且つ、受診時に「疾患を有しない」と判定された人のデータである。ここで、「疾患を有しない」とは、所定の問診表の病名の申告欄に病名がなんら記載されなかったか、又は、疾患が無い旨が記載されたことをいう。
1回受診データは、レベル区分処理(S21)にて年齢区間別・性別に分類され、それぞれ検査項目毎に所定数個のレベルに区分され(=離散化され)、さらに、各レベルの境界検査値が算出される。請求項では、年齢区間毎にレベル区分する場合を特に区間レベル区分処理と記述し、年齢区間についての限定をしないでレベル区分する場合を単にレベル区分処理と記述している。算出された各境界検査値は、6回受診データのレベル化(=離散化)に用いられる。また、年齢区間別・性別に分類され、検査項目毎にレベル化された1回受診データは、ルール抽出処理(S41)に供される。ルール抽出処理(S41)の詳細は、後述する。
【0033】
6回受診データとは、データを蓄積した6年間の各年に、当該受診者IDのレコードが一つずつ存在するデータである。6回受診データでは、1回受診データとは異なり、受診時の疾患申告の有無は考慮されていない。なお、受診年月日の「年」が同じレコードが同一の受診者IDで複数有る場合は、その受診者IDのデータは除外されている。
6回受診データは、レベル区分処理(請求項の区間レベル区分処理;S21)にて年齢区間別・性別に分類され、それぞれ、1回受診データの同じ年齢区間でのレベル化により算出した各レベルの境界検査値を用いて、検査項目毎にレベル化(=離散化)される。また、年齢区間別・性別に分類され、検査項目毎にレベル化された6回受診データは、遷移確率算出処理(S31)に供される。遷移確率算出処理(S31)の詳細は後述する。
【0034】
なお、ステップS13の「1回受診データと6回受診データのグループ分け」は、受診者IDと受診年月日を照合することにより、行うことができる。
【0035】
ステップS21では、前述のように、1回受診データを年齢区間別・性別に分類し、各分類を、それぞれ、検査項目毎に所定数個のレベルに区分する。また、6回受診データを年齢区間別・性別に分類し、各分類を、それぞれ、1回受診データのレベル化で得た対応する年齢区間・性・レベルの境界検査値を用いてレベル化する。
【0036】
1回受診データの任意の年齢区間・性・検査項目のレベル化は、図2(b)に示すように、当該年齢区間・性・検査項目の最小値の検査値から始め、その総数のうち、2.50%まで含まれる検査値、26.25%まで含まれる検査値、50.00%まで含まれる検査値、73.75%まで含まれる検査値、97.50%まで含まれる検査値、100.00%まで含まれる検査値を、それぞれ求めることによって行う。2.50%以下は検査値が低い側の異常値、97.50%より大は高い側の異常値である。また、2.50%より大で、且つ、97.50%以下は、正常値とされる範囲である。なお、年齢区間としては、本例では、5才刻みを採用している。即ち、〜19才まで、20〜24才、25〜29才、30〜35才、・・・の5才刻みを採用している(図4参照)。
【0037】
上述のように、本発明では、正常値の範囲(2.50%〜97.50%)を、各レベルに含まれる検査値数が等しくなるように、区分している。
その理由を説明する。
健康な人の場合、生体が本来的に持っているゆらぎのため、正常値とされる範囲内であれば、何れの値も同様にとり得る、換言すれば、正常値の範囲内の任意の値を、同じ確率でとり得る。このことに、本願の発明者は注目した。
即ち、正常値の範囲を上述の如く等分割して、各区分にレベル値を割り振ると、
(1)健康な人の場合、各検査項目のレベル値(例:18検査項目のレベル値)の組合せは、正常値の範囲内(レベル2〜レベル5)でランダムとなる。このため、多数の健康人が或る特定のパターンを表すことは無く、階層型クラスタリングを行っても、或る特定の検査項目群の或る特定のレベル値の組合せに集中が現れることは無い。
これに対して、
(2)病人の場合、病気に応じた特定の検査項目群のレベル値が異常値(レベル1又はレベル6)をとり、階層型クラスタリングを行うと、病気に応じた特定の検査項目群の特定のレベル値(レベル1又はレベル6)の組合せへの集中が現れる。
このため、
(3)健康から病気へ推移する過程では、病気に応じた特定の検査項目群の特定のレベル値の組合せへの集中傾向が現れるようになり、相関係数が大きくなる。
したがって、上述のように区分すると、或る1又は2以上の検査項目の検査値又は検査値の組合せから、別の検査項目の検査値を精度良く推定したり、予測値を精度良く修正することが可能となり、これに基づいて、再検査を指示したり、現病名の再検討を要することを示唆したり、さらには、未知の病名の探索を可能とすることも期待できる。
【0038】
1回受診データのレベル化で得られた各境界検査値は、それぞれ、6回受診データの同じ年齢区間・性・検査項目のレベル化に用いられる。例えば、1回受診データの40〜44才・男性・中性脂肪のレベル化で得られた各レベルの境界検査値を、6回受診データの40〜44才・男性・中性脂肪のレベル化に用いる。このように年齢区間・性・検査項目を揃えているため、年齢や性によって検査値の標準値等にズレが有る場合等でも、データ量が比較的少ない6回受診データを、多量のデータ量を持つ1回受診データと同等の良好な精度で、レベル化することができる。換言すれば、隣接する年齢区間内に同一人の受診データが必ず含まれている6回受診データ上に、前記(1)〜(3)を反映させることができる。つまり、健康から病気へ推移する過程に於いて病気に応じた特定の検査項目群の特定のレベル値の組合せに集中傾向が現れるという事象を、6回受診データに於いて、精度良く利用できるようになる。言うなれば、特定の検査項目群の特定のレベル値の組合せの相関を、6回受診データに於いて、精度良く利用できるようになる。
【0039】
こうして、1回受診データの各年齢区間・各性・各検査項目の検査値を、同じレベルに含まれる検査値数の、当該年齢区間・性・検査項目での全検査値数に対する比率が、各検査項目間で同一となるように、且つ、正常値とされる範囲内の各レベルの比率が同一となるように、それぞれ所定数個(本例では6個)のレベルに区分するとともに、それを用いて6回受診データを区分した後、次に、両受診データの各検査値を、それぞれ該当するレベル(離散値)で置換したデータを作成する。これにより、1回受診データと6回受診データの各年齢区間・各性・各検査項目の各検査値を「検査項目・レベル」で統一的に扱うことが可能になる。検査値を該当するレベルで置換した一例を、図3(b)に示す。
【0040】
さらに、1回受診データに関しては、各検査項目の年齢区間別・性別の確率分布を求めて、レベル(離散値)で表現した区間区分図を作成する。区間区分図とは、年齢区間毎にレベルで区分して、年齢区間順に並べた図である。図4に、男性・中性脂肪の場合について各年齢区間の各レベルの確率分布を求めて作成した区間区分図を例示する。レベル1が検査値の低い側、レベル6が高い側である。なお、図4では、隣接する年齢区間には間隔が設けられているが、密接させてもよい。
【0041】
本例では、図4のような区間区分図をディスプレイへ出力し、この区間区分図上に、遷移確率や遷移先を表示する。即ち、遷移態様図を表示する。例えば、或る年齢区間の或るレベルから後続の年齢区間の各レベルへ遷移する場合の遷移確率の大小を、当該或る年齢区間の或るレベルから後続の年齢区間の各レベルへ引いた矢印の太さで表現するようにしてもよい。或いは、矢印の輝度の大小や、矢印の線種(実線,破線,点線,等)で表現してもよく、これに、上記太さの相違を加味して表示してもよい。なお、図4では、縦軸は確率分布であるが、実際の検査値が分かるように、縦軸の確率分布を検査値に変換して表示してもよく、両者を表示するようにしてもよい。つまり、ユーザフレンドリーな表示となるように、適宜、改良してよいことは勿論である。
遷移先表示の詳細については、後述する。
【0042】
ステップS31では、6回受診データを用いて、遷移確率算出処理を実行する。
前述したように、6回受診データでは、データを蓄積した6年間の各年に、受診者IDが同じレコードが一つずつ存在する。したがって、本例のように5才刻みで年齢区間を設定すると、隣接する年齢区間(例:40〜44才,45〜49才)には、必ず、同一受診者のデータが含まれることとなる。このため、6回受診データを用いると、各人の検査値の経年推移について精度の良い推定を行うことができる。即ち、6回受診データには、前述の(1)〜(3)が反映されている。このため、経年推移について精度の良い推定を行うことができ、ひいては、任意の年齢区間の任意のレベルから後続の年齢区間の各レベルへ遷移する確率について精度の良い推定を行うことができる。例えば、病気を早期に見出すという観点に於いて、極めて精度の良い知見を与えることができる。
【0043】
遷移確率の算出は、或る検査項目・年齢区間・レベルに属している各データが、後続の年齢区間では、それぞれ何れのレベルへ推移するかを、各検査項目・年齢区間・レベルについてそれぞれに属するデータ数をカウントすることによって行う。
例えば、中性脂肪・男性の例では、40〜44才・レベル4に属する6回受診データは213件(不図示)であるが、年齢区間45〜49才では、41件(=19.2%)がレベル6、64件(=30.0%)がレベル5、51件(=23.9%)がレベル4、31件(=14.6%)がレベル3、26件(=12.2%)がレベル2、0件(=0%)がレベル1に属する。これより、図示のような推定が可能となる。
かかる計数結果に基づいて、ステップS31では、各検査項目の任意の年齢区間・レベルを起点とする、後続の年齢区間の各レベルへの遷移確率を算出するのである。
【0044】
ステップS41ではルール抽出処理を実行する。データとしては、レベル区分処理(S21)に於いて年齢区間別・性別に分類し、検査項目毎に所定数個(6個)のレベルに区分した、1回受診データを用いる。
前述したように、病人の場合には、病気に応じた特定の検査項目群の特定のレベル値の組合せに集中が現れる。また、健康から病気へ推移する過程では集中傾向が現れる。したがって、病気への推移が始まっている場合、特定の検査項目群の各特定のレベル値の相関を精度良く利用することが可能となる。
このことを利用して、ルール抽出処理では、或る検査項目・レベル又は2以上の或る検査項目・レベルの組合せ(第1データ)を前提としたとき、当該前提とした第1データの何れの検査項目とも異なる検査項目の或るレベル(第2データの検査項目・レベル)が生起する確率が、所定値(例:80%)以上の場合に、当該第1データ・第2データの組合せを、当該第1データから当該第2データを導出する導出ルールとして抽出する。
【0045】
例えば、図5(a)に示すように、「最高血圧・1を前提としたとき、最低血圧・1が生起する確率は、83.33%(confidence;参照)」であり、所定値(80%)以上である。このため、「最高血圧・1を第1データとし、最低血圧・1を第2データとする」導出ルールが抽出される。同様に、「Ht・2で、且つ、MCHC・3を前提としたとき、血色素量・2が生起する確率は100%であり、所定値(80%)以上である。このため、「Ht・2且つMCHC・3を第1データとし、血色素量・2を第2データとする」導出ルールが抽出される。
【0046】
このような導出ルールを適宜に用いることにより、相関を有する検査項目の検査値(レベル)又はその組合せから、相関を有する別の検査項目の検査値(レベル)を精度良く推定し、或いは修正することが可能となる。例えば、遷移確率算出処理(S31)で算出した後続の各レベルへの遷移確率の大小関係(例:何れのレベルへの遷移確率が最大であるか,等)を、精度良く修正することが可能となる。また、受診者の検査結果(請求項の修正判定セット)に疑義があるとして再検査を指示したり、現病名の再検討を要することについて示唆したりすることも可能となる。さらには、既知の病名に当てはまらない集中が現れた場合等、未知の病名を探索することも期待できる。
【0047】
なお、ルール抽出処理では、第1データとして有り得ない組合せ、即ち、検査項目が同じで且つレベルが異なる組合せ(例:Ht・2、且つ、Ht・3)を第1データの候補とすることは、予め、除外されている。これにより、無駄に生起確率を演算することを防止でき、コンピュータの負荷を軽減できる。
また、第1データと第2データが同時に生起する確率(support参照)が極めて小さい場合(例:3%より小)も、生起確率の演算対象から除外されて、負荷の軽減が図られている。
【0048】
ステップS51では、予測処理を実行する。
まず、予測対象者のデータ(請求項の予測判定セット)を取得する。このデータとしては、健診データベースと同じ検査項目(図3(a)参照)の各検査値、及び、予測対象者の属性(年齢・性別)を挙げることができる。なお、健診データベースと同じ検査項目の全ての検査値が揃っていなくてもよい。つまり、一部の検査値のみでもよい。また、予測対象者は、実在の受診者でもよく、仮想の受診者でもよい。
【0049】
この予測対象者のデータは、例えば、キーボードやマウス等の入力装置から入力されてもよく、ICカード等のデータを読み込む構成でもよい。また、LANや、更にはインターネットを介して入力されるデータを取得する構成でもよい。或いは、予めハードディスク等に記録されている健診者リストから、予測対象者を所定の順序で読み出して、順に取得するような構成でもよい。
【0050】
こうして取得した各検査項目の検査値を、次に、レベル化する。即ち、それぞれ、該当するレベルに置換する。レベル化の境界検査値としては、ステップS21(レベル区分処理)にて1回受診データに基づいて算出した境界検査値の中で、当該予測対象者の年齢と性別に該当する境界検査値を用いる。
【0051】
次に、現在のレベルから、後続の年齢区間の各レベルへ遷移する確率を、それぞれ取得する。現在のレベルとは、予測対象者の検査値の属するレベルである。また、後続の年齢区間とは、予測対象者の5年後の年齢が属する年齢区間である。後続の年齢区間の各レベルへの遷移確率は、ステップS31(遷移確率算出処理)にて6回受診データに基づいて算出した各値を取得する。また、各遷移確率の中で最大の遷移確率となる遷移先のレベルを、遷移先仮レベルとして、メモリ12上に保持する。
【0052】
後続の年齢区間の各レベルへの遷移確率について説明する。
例えば、予測対象者の年齢が42才(年齢区間:40〜44才)で、検査項目「中性脂肪」の検査値に対応するレベルが「4」の場合、図4内に黒丸印で示した位置が、現在のレベルである。この位置を起点として、後続の年齢区間(45〜49才)の各レベルへの遷移確率は、レベル6が19.2%、レベル5が30.3%、レベル4が23.9%、レベル3が14.6%、レベル2が12.2%、レベル1が0.0%である。これらは、ステップS31の遷移確率算出処理にて計数値に基づいて算出されて、メモリ12上に保持されているものとする。
【0053】
この場合に於いて、遷移確率が最大となるのは、レベル5へ遷移する場合の30.0%であるため、このレベル5が、遷移先仮レベルとして保持される。図4では、遷移確率が最大のレベル5へ向かう矢印が最も太く表されている。即ち、図4では、遷移確率の大きい順に、最太実線矢印、太実線矢印、細実線矢印、細破線矢印、細点線矢印、細2点鎖線矢印で表されている。矢印の起点としては、例えば、当該のレベルの中央位置を設定できるが、これに限定されない。例えば、前述したように、図4の縦軸に確率分布及び/又は実際の検査値を表示できるため、予測対象者の検査値の高さを起点に設定してもよい。
図4の表示は上記のとおりであるが、後述の図6〜8では、ルールを用いた修正等に応じて、矢印の線種や太さ、或いは、矢印の指す位置等が、適宜、変更されている。
【0054】
遷移確率最大の遷移先レベル(遷移先仮レベル)が決まると、次に、導出ルールに基づく修正が行われる。即ち、予測対象者の各検査値に基づいてそれぞれ求めた遷移先仮レベル(遷移確率が最大の遷移先のレベル)又は遷移先仮レベルの組合せの中に、導出ルールの第1データに該当するものが有る場合に、当該の導出ルールを用いて導出した第2データ(検査項目・レベル)で、当該第2データと検査項目が同じ遷移先仮レベルを置換する修正が行われる。
【0055】
例えば、予測対象者の各検査項目の検査値に基づいて、遷移先仮レベルとして、「「Ht・2」「MCHC・3」「血色素量・3」が決まった場合を考えると、図5(a)に示されるように、「「Ht・2」「MCHC・3」を第1データとし、「血色素量・2」を第2データとする導出ルールが存在する。このため、この場合は、遷移先仮レベルとして保持された中の「血色素量・3」が、第2データ「血色素量・2」に置換される。この様子を、図5(b)に示す。
【0056】
このような修正を、中性脂肪の区間区分図を用いて説明する。
図6は、当初図4であったものが、導出ルールによって矢印の太さが変更された様子を表す。即ち、中性脂肪の年齢区間40〜44才のレベル4から後続の年齢区間への遷移確率最大のレベル(遷移先仮レベル)は図4に示すようにレベル5であるが、導出ルールの中に「中性脂肪・4」を第2データとするルールがあり、当該の導出ルールの第1データが、当該予測対象者の各検査値に基づいて求めた1又は2以上の遷移先仮レベルによって構成されるものであったため、「中性脂肪・5」が「中性脂肪・4」で置換され、その結果、矢印の太さが、図6のように変更されたものである。
【0057】
なお、上記では、図4から図6へ表示が切り換えられる場合に即して説明したが、遷移先仮レベルの算出後、直ちに導出ルールに基づく修正を自動的に実行するように構成した場合には、図4の表示は実際には行われず、直ちに、図6の表示が行われる。また、図4から図6への切り換えを、ユーザの指示入力に応じて行うように構成してもよい。
また、図4や図6の表示は一例を示すものであり、例えば、図6の矢印の太さや線種を図4と同様とし、これに代えて、導出ルールによって変更されたレベルを強調表示(例えば、ハイライト表示)等して、ユーザに示しても良い。
【0058】
遷移確率に応じた表示態様や、導出ルールによる修正を取り入りて表示する態様の例としては、例えば、以下のような表示態様を挙げることができる。即ち、
遷移確率に応じた表示態様としては、例えば、
(a)算出起点から遷移先レベルへ矢印を引き、その太さを、遷移確率が大きいほど太くするような表示態様。
(b)遷移確率に応じて、矢印の線種を、実線、破線、点線、鎖線等で表現するような表示態様。
(c)矢印の輝度や色を、遷移確率が大きいほど目立つものとした表示態様。
(d)遷移先のレベル領域の表示を遷移確率に応じて変えた表示態様。例えば、遷移確率が大きいレベルほど目立つように、例えば、ハイライト表示する表示態様。
(e)遷移確率の数値を傍らに表示した表示態様。さらに、その場合に於いて、遷移確率の大きさに応じて書体やポイントを異ならせた表示態様。
を例示することができる。
【0059】
また、修正を取り入れた所定の態様としては、例えば、
(A)遷移先仮レベル(遷移確率が最大のレベル)と、導出ルールの第2データで示されるレベル(修正後レベル)の両者を、それぞれ、両者の意味が分かるように明瞭に区別して表示(強調表示)する態様。
(B)遷移先仮レベル(遷移確率が最大のレベル)の強調表示を止め、導出ルールの第2データで示されるレベル(修正後レベル)を遷移蓋然性の高いレベルとして強調表示する態様。
(C)上記(B)に於いて、遷移蓋然性は高いが、遷移確率が最大のレベル(遷移先仮レベル)とは異なる旨を、併せて表示する態様,
(D)上記(B)に於いて、遷移先仮レベル(遷移確率が最大のレベル)の強調表示を止めるのみならず、他のレベルへの遷移確率に基づく表示も止め、導出ルールの第2データで示されるレベル(修正後レベル)のみを、遷移蓋然性の高いレベルとして強調表示する態様。
(E)遷移先仮レベル(遷移確率が最大のレベル)と、導出ルールの第2データで示されるレベル(修正後レベル)が隣接する場合には、その境界部分を矢印の指示先に設定して表示する態様。
等を例示することができる。
なお、遷移確率に応じた表示態様や、修正を取り入れた所定の態様としては、上記以外の表示態様であってもよい。
【0060】
前記導出ルールに基づく修正の説明に於いて、修正された「検査項目・レベル」が、別の導出ルールの第1データ又はその一部を構成している場合もあり得る。その場合は、当該の導出ルールにより導出される第2データによって更に別の検査項目の遷移先仮レベルが置換される等して、次々と変動が波及し、最終的に、当初に置換された「検査項目・レベル(図5(b)の血色素量・2)」が再び置換されてしまう事態も想定される。このような循環現象による不定状態を防止するため、本装置では、導出ルールの第2データで置換された「検査項目・レベル」を、導出ルールの第1データとして用いないようにシステムを構成している。
なお、これに代えて、例えば、「再度の置換が実施されようとした時点で、導出ルールの適用を止める」等の構成とすることもできる。
【0061】
また、本装置では、何れかの「検査項目・レベル」が選択されると、当該の検査項目に関しては、当該「検査項目・レベル」を第1データの構成要素として処理するように、システムを構成している。即ち、当該の検査項目に関しては、当該「検査項目・レベル」を遷移先仮レベルとみなして処理するように、システムを構成している。
【0062】
このことを、図4(中性脂肪の例)を参照して説明する。
図4に於いて、遷移先仮レベルは「レベル5」である。このとき、例えば、図示のように、「レベル6」をユーザが選択すると、検査項目「中性脂肪」に関しては、当該の「レベル6」を用い、且つ、他の検査項目に関してはそれぞれの遷移先仮レベルを用いて、導出ルールが適用される。つまり、「中性脂肪・6」単独、又は「中性脂肪・6」を含む1又は2以上の「検査項目・レベル」から成る第1データが存在するか否か調べ、存在する場合は、当該第1データに対応する第2データで、当該第2データと同じ検査項目のレベルを置換する。なお、循環による不定状態、即ち、第2データに該当するとして修正された「検査項目・レベル」が、別の導出ルールの第1データ又はその一部を構成している場合に、更なる導出ルールの適用と修正が行われ、その波及により、当初に選択した「中性脂肪・6」が修正されてしまうという事態を防止するために、本装置では、ユーザ選択された「検査項目・レベル」(この場合は「中性脂肪・6」)を固定している。なお、このような制御に代えて、前述したような制御、即ち、第2データに該当するとして修正された「検査項目・レベル」を固定する制御を採用してもよい。
【0063】
上述のユーザ選択(ここでは「中性脂肪・6」の選択)では、さらに、ユーザ選択された「検査項目・レベル」を起点とする、後続年齢範囲への遷移確率の表示も行われる。
このことを図4、図7を参照して説明する。
図4に於いて、遷移先仮レベルは「中性脂肪・5」である。このとき、例えば、「中性脂肪・6」をユーザが選択すると、該「中性脂肪・6」を起点として、後続の年齢区間の各レベルへの遷移確率がそれぞれ取得されて、図7に示すように、当該取得した遷移確率に応じた太さや線種の矢印で、各レベルへの遷移が表示される。
【0064】
このように、ユーザは、適宜に「検査項目・レベル」を選択して、例えば、現状のままでは、5年先に「レベル5」に遷移する確率が最大であるが、不摂生等を重ねた結果、例えば、当該5年先に「レベル6」に遷移してしまったと仮定したとき、当該5年先の時点で「レベル6」に遷移してしまったことが他の検査項目にどのような影響を及ぼすかを把握できるとともに、さらに、その後、どのように遷移していくかも、分かり易く把握することができる。
【0065】
図7を別様に表示した例を図8に示す。
図8では、区間区分図の一部を非表示としている。
また、図8では、選択した「レベル6」への遷移を仮定の予想(最大可能性)として2点鎖線太矢印で示すとともに、当該「レベル6」からの遷移先についても、2点鎖線太矢印(最大可能性)と、2点鎖線矢印(次の可能性)とで示している。
また、図8では、予測対象者の各検査項目の検査結果から、遷移確率は「レベル5」が最大であったが、導出ルールによる修正では「レベル4」が導出されたため、両レベルの境界を矢印の指示先に設定して表示している。
【0066】
このような出力は、ディスプレイのみならず、例えば、プリンタで出力するように構成することもできる。また、LAN更にはインターネットを介して、問い合わせ元の端末装置へ送信するように構成してもよい。
本願の装置で遷移確率を算出し、さらに、導出ルールで修正した結果を多数の健診者のデータに当てはめてみた結果、良好な精度を得ることを確認できた。
【0067】
上記では、予測先(遷移先仮レベルのセット)について導出ルールを適用する例を説明したが、導出ルールは、現時点の検査結果(請求項の修正判定セット)について適用するともできる。また、その発展型として、検査結果の再検討を指示したり、現病名の再検討を要する旨を示唆したりすることも可能である。さらには、通常と異なる集中が現れた場合等、未知の病名の探索等に用いることも期待できる。
【符号の説明】
【0068】
10 制御装置(CPUを備える)
11 記憶装置(ハードディスク等)
12 記憶装置(RAM)
13 記憶装置(ROM)
16 入力装置(キーボード,マウス等)
17 出力装置(ディスプレイ等)
18 LAN

【特許請求の範囲】
【請求項1】
医療の各検査項目について統計処理可能な量のデータを有する健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分処理と、
前記レベル区分処理により区分した各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算処理と、
を実行することを特徴とする健診データ処理方法。
【請求項2】
請求項1に於いて、
前記最上レベルと最下レベルは異常検査値のレベルであり、最上レベルと最下レベルの間の複数個の各レベルは正常検査値のレベルである、
ことを特徴とする健診データ処理方法。
【請求項3】
請求項1又は請求項2に於いて、さらに、
前記レベル区分処理により区分した検査項目・レベルの中から選ばれる第1データとしての検査項目・レベル(又は複数の検査項目・レベルの組合せ)を前提としたとき、当該第1データを規定する検査項目(又は複数の検査項目)とは別の検査項目の或るレベルである第2データが生起する確率を、第1データと第2データの種々の組合せについてそれぞれ調べ、生起確率が所定値以上となる両データの組合せを、第1データから第2データを導出する導出ルールとして抽出するルール抽出処理、
を実行することを特徴とする健診データ処理方法。
【請求項4】
請求項3に於いて、
前記ルール抽出処理は、同一検査項目の第2データを導出する2以上の検査項目・レベル(又は複数の検査項目・レベルの組合せ)が存在する場合は、その中で最大の生起確率を与える検査項目・レベル(又は複数の検査項目・レベルの組合せ)を、当該検査項目のレベルを導出する第1データとする、
ことを特徴とする健診データ処理方法。
【請求項5】
請求項4に於いて、さらに、
複数の検査項目と各検査項目のレベルが修正判定セットとして与えられると、前記ルール抽出処理により抽出された何れかの導出ルールの第1データに該当する検査項目・レベル(又は複数の検査項目・レベルの組合せ)の有無を調べ、該当有りの場合は、当該検査項目・レベル(又は当該複数の検査項目・レベルの組合せ)を当該修正判定セットの第1データとして抽出する第1データ抽出処理と、
前記第1データ抽出処理により第1データが抽出されると、当該第1データに対応する導出ルールによって導出される第2データの検査項目・レベルを、当該修正判定セットの対応する検査項目の修正データとして返す修正処理と、
を実行することを特徴とする健診データ処理方法。
【請求項6】
請求項5に於いて、さらに、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算処理により求めた境界検査値を用いて区分する区間レベル区分処理と、
前記区間レベル区分処理により区分した任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求めるとともに、その中で遷移確率が最大のレベルを、当該任意の年齢区間・検査項目のレベルからの遷移先仮レベルとする遷移確率算出処理と、
受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出処理により求めた遷移先仮レベルを取得する仮レベル取得処理と、
を実行し、
前記第1データ抽出処理は、前記仮レベル取得処理によって後続する年齢区間・検査項目の各遷移先仮レベルが取得されると、当該遷移先仮レベルのセットを、前記修正判定セットとして処理する、
ことを特徴とする健診データ処理方法。
【請求項7】
請求項6に於いて、
前記レベル区分処理は、前記健診データベース中の所定のレコード群として、前記区間レベル区分処理が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算処理は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理方法。
【請求項8】
医療の各検査項目について統計処理可能な量のデータを有する健診データベースを保持している記憶装置と、
前記健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分手段と、
前記レベル区分手段により区分された各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算手段と、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算手段により求められた境界検査値を用いて区分する区間レベル区分手段と、
前記区間レベル区分手段により区分された任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求めるとともに、その中で遷移確率が最大のレベルを、当該任意の年齢区間・検査項目のレベルからの遷移先仮レベルとする遷移確率算出手段と、
受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出手段により求められた遷移先仮レベルを取得する仮レベル取得手段と、
前記レベル区分手段により区分された検査項目・レベルの中から選ばれる第1データとしての検査項目・レベル(又は複数の検査項目・レベルの組合せ)を前提としたとき、当該第1データを規定する検査項目(又は複数の検査項目)とは別の検査項目の或るレベルである第2データが生起する確率を、第1データと第2データの種々の組合せについてそれぞれ調べ、生起確率が所定値以上となる両データの組合せを、第1データから第2データを導出する導出ルールとして抽出するルール抽出手段と、
前記仮レベル取得手段によって後続する年齢区間・検査項目の各遷移先仮レベルのセットが取得されると、該遷移先仮レベルのセットを修正判定対象として、前記ルール抽出手段により抽出された何れかの導出ルールの第1データに該当する検査項目・レベル(又は複数の検査項目・レベルの組合せ)の有無を調べ、該当有りの場合は、当該検査項目・レベル(又は当該複数の検査項目・レベルの組合せ)を当該修正判定対象の第1データとして抽出する第1データ抽出手段と、
前記第1データ抽出手段により第1データが抽出されると、当該第1データに対応する導出ルールによって導出される第2データの検査項目・レベルを、当該修正判定対象の対応する検査項目の修正データとして返す予測修正手段と、
を有することを特徴とする健診データ処理装置。
【請求項9】
請求項8に於いて、
前記レベル区分手段は、前記健診データベース中の所定のレコード群として、前記区間レベル区分手段が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算手段は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理装置。
【請求項10】
請求項9に於いて、さらに、
前記修正手段によって返された修正データを、修正前のデータと区別して、所定の表示装置に表示する表示制御手段、
を有することを特徴とする健診データ処理装置。
【請求項11】
請求項1又は請求項2に於いて、さらに、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算処理により求めた境界検査値を用いて区分する区間レベル区分処理と、
前記区間レベル区分処理により区分した任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求める遷移確率算出処理と、
を実行することを特徴とする健診データ処理方法。
【請求項12】
請求項11に於いて、
前記レベル区分処理は、前記健診データベース中の所定のレコード群として、前記区間レベル区分処理が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算処理は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理方法。
【請求項13】
請求項12に於いて、さらに、
受診者の年齢と複数の検査項目の各検査値が予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出処理により求めた中で遷移確率が最大のレベルを求め、そのレベルのセットを予測セットとして返す遷移先予測処理、
を実行することを特徴とする健診データ処理方法。
【請求項14】
医療の各検査項目について統計処理可能な量のデータを有する健診データベースを保持している記憶装置と、
前記健診データベース中の所定のレコード群の各検査項目の検査値分布を、同じレベルに属する検査値数の比率が各検査項目間で同一となり、且つ、最上レベルと最下レベルの間の複数個の各レベルの比率が同一となるように、それぞれ所定数個のレベルに区分するレベル区分手段と、
前記レベル区分手段により区分された各検査項目の各レベルの境界を与える境界検査値をそれぞれ求める境界値演算手段と、
前記健診データベース中で同一受診者の時系列データを構成するレコード群の各レコードをそれぞれ当該レコードの受診時年齢が属する年齢区間に所属させることにより構成した各年齢区間の各検査項目の検査値分布を、それぞれ、前記境界値演算手段により求められた境界検査値を用いて区分する区間レベル区分手段と、
前記区間レベル区分手段により区分された任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ遷移する確率を、当該任意の年齢区間・検査項目のレベルから、後続する年齢区間・検査項目の各レベルへ推移したデータ数に基づいてそれぞれ求める遷移確率算出手段と、
受診者の年齢と複数の検査項目の各検査値とが予測判定セットとして与えられると、当該受診者の年齢・各検査値に対応する年齢区間・検査項目の各レベルについて、それぞれ前記遷移確率算出手段により求められた中で遷移確率が最大のレベルを求め、そのレベルのセットを予測セットとして返す遷移先予測手段と、
を有することを特徴とする健診データ処理装置。
【請求項15】
請求項14に於いて、
前記レベル区分手段は、前記健診データベース中の所定のレコード群として、前記区間レベル区分手段が採用する年齢区間と同じ年齢区間で区分したレコード群を用い、
前記境界値演算手段は、前記年齢区間毎に各検査項目の各レベルの境界検査値をそれぞれ求める、
ことを特徴とする健診データ処理装置。
【請求項16】
コンピュータを、請求項8〜請求項10、請求項14、又は、請求項15の何れかの健診データ処理装置として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−33155(P2012−33155A)
【公開日】平成24年2月16日(2012.2.16)
【国際特許分類】
【出願番号】特願2011−143635(P2011−143635)
【出願日】平成23年6月29日(2011.6.29)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成22年度、文部科学省、地域産学官連携科学技術振興施策、助成研究(地域イノベーションクラスタープログラム(都市エリア型)岐阜県南部エリア)、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(304019399)国立大学法人岐阜大学 (289)
【出願人】(599144712)タック株式会社 (25)
【Fターム(参考)】