説明

診断支援装置

【課題】参照被験者の検査結果の数値データに偏りがあったとしても、その影響を受けにくくすることができ、その結果疾患の有無についての判定精度を向上させることができる診断支援装置を提供する。
【解決手段】参照検査結果記憶部21と、対象検査結果記憶部22と、数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部31と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部32と、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部33と、前記抽出部により抽出された識別子に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部34とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、各種検査項目の検査結果のデータベースに基づいて、検査対象被験者がある疾患を有しているかどうかを判定支援したり、ある疾患と検査結果の傾向にどのような関係があるかについて判断するのを支援したりするための診断支援装置に関するものである。
【背景技術】
【0002】
ある検査対象被験者が、特定の疾患を有しているかどうかについて医師が判断することを補助するための装置として、検査対象被験者に対して行われた検査結果の数値がある基準値以上であれば疾患を有する可能性があると判断する診断支援装置が従来からある。このような診断支援装置では、その疾患と行われる検査の検査結果との関係性が明確であれば、有効に作用し、医療従事者の支援を行うことができると考えられるが、実際には、疾患と検査結果との間の関係性が明確でない場合も多く、基準値を設定すること自体が難しい事も多い。
【0003】
このような問題を解決するために、疾患が存在するかどうかを判断するための基準値を設定するのではなく、例えば、特許文献1等に示される診断支援装置では、多数の参照被験者から得られた複数の検査項目における検査結果の数値データに基づいて、2次元平面上にマップとして形成し、その数値が似通った集団を可視化しておき、ある検査対象被験者の検査データがマップ上のどの集団に属する又は近いかによってある疾患を有するかどうかを判断するように構成された診断支援装置がある。
【0004】
しかしながら、このような診断支援装置では、検査結果の数値データそのものを利用して疾患の有無を判断するためのマップが形成されているため、予め用意されている多数の参照被験者の検査結果に偏りがある場合には、実際には疾患を有しているはずの検査対象被験者が、ある集団から大きく離れているために疾患を有さないといった誤判定が発生しやすくなっている可能性がある。
【0005】
より具体的には、ある疾患と検査結果のデータとの因果関係については良く分かっていないのであるから、多数の参照被験者の検査結果の数値データが大きく離れた値で固まっている等の偏りがあったとしても、それが普通の状態であるのか異常の状態であるのかを判断する事は難しい。このことから、疾患の有無を判断するために参照被験者の検査結果について数値データそのものを使用している場合には、検査対象被験者が疾患を有しているかどうかについて、うまく判定するには診断支援装置の使用者が偏りを無視したり、対数を取ったり正規分布として扱ったりする等の補正をかけたりする手間を一々かけなくてはならず、診断支援の自動化に対する障害となってしまう。加えて、診断支援装置の使用者がそのような補正を検査結果の数値データに行うことが診断精度の向上に寄与するかどうかという点でも疑問が残る。
【0006】
また、疾患を有するかどうかについての判定精度を向上させるには、参照被験者の数を多くすることも大数の法則等から考えて有効であると考えられるが、数値データを直接取り扱う場合には、その分だけ計算負荷が増大していくことになり、短時間で診断支援を行うことが難しくなってしまう。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2009−528103号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は上述したような問題を鑑みてなされたものであり、参照被験者の検査結果の数値データに偏りがあったとしても、その影響を受けにくくすることができ、その結果疾患の有無についての判定精度を向上させることができるとともに、疾患を有するかどうかについての計算負荷が小さく、高速で診断支援を行うことができる診断支援装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
すなわち、請求項1に記載の発明は、ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置である。
【0010】
また、請求項2に記載の発明は、ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに数値順に記憶する参照検査結果記憶部と、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、前記検査項目ごとに、前記検査対象被験者の検査結果を、前記参照被験者の各検査結果に対して数値順となるように加えて、前記検査項目ごとの検査結果列を生成する並べ替え部と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置である。
【0011】
このようなものであれば、前記並べ替え部が、複数の参照被験者の検査結果と検査対象被験者の検査結果を数値順に並べ替えて検査結果列を作り、前記近傍群生成部が前記検査対象被験者と順序距離の小さい参照被験者を選択人数だけ選択して近傍群を生成するように構成してあるので、数値データに関わりなく、検査対象被験者の検査結果よりも大きい値を有する参照被験者も小さい値を有する参照被験者も略均等に評価させることができる。より具体的には、例えば、前記検査結果列において検査対象被験者の検査結果が、前後の検査結果に対して数値が小さい値側には近く、大きい値側から遠かったとしても常に小さい側からだけ参照被験者が選択されて近傍群が作られることを防ぐことができる。従って、偏った数値データであったとしても全ての参照被験者の検査結果を略均等に使って疾患の有無の評価ができるようになるため、検査対象被験者の疾患の有無をより良い精度で推定する事が可能となる。
【0012】
また、数値データそのものではなく、前記並び変え部が生成した検査結果列において順序距離において近傍群を生成するようにしてあるので、例えば、検査対象被験者の検査結果に対して前後にいる参照被験者を交互に選んでいくといった計算負荷の少ない選択方法で近傍群を生成することができる。
【0013】
このように、本発明によれば計算負荷をあまり高くすることなく、しかも、参照被験者の偏りがあったとしても検査結果の数値が小さいもの又は大きいものだけに偏ったような近傍群が生成されるのを防ぎ、全ての参照被験者を略均等に評価できる近傍群を生成することができる。従って、このような参照被験者を均等に評価した近傍群を用いているので、検査対象被験者が疾患を保持しているかどうかを精度よく判定することができる。
【0014】
さらに、前記選択人数を変更して前記近傍群生成部が生成する近傍群の大きさを変更し、また、前記抽出部が合致していると見なす検査項目数を変更することによって多数の条件での検査対象被験者の疾患度を評価することができる。つまり、近傍群の大きさと、合致していると見なす参照被験者の検査項目数をそれぞれ変化させることにより一点の疾患度だけではなく、全体の疾患度の傾向から検査対象被検査者がある疾患を有するかどうかを評価することにより、より判定精度を向上させることができる。
【0015】
近傍群の大きさによる算出される疾患度の違いを全体的に考慮して、検査対象被験者が疾患を有しているかどうかを判断できるようにし、疾患度の鑑別精度を向上させるには、請求項3に記載しているように前記近傍群生成部が、複数の前記選択人数ごとに近傍群を生成するように構成されていればよい。
【0016】
近傍群の大きさによる違いを全て評価できるようにするための具体的な実施の態様としては、請求項4に記載しているように前記近傍群生成部が、前記選択人数を一人から前記参照被験者全員まで変更して、前記選択人数ごとの近傍群を生成するように構成されていればよい。
【0017】
多数の検査項目の結果がある場合において、どの検査項目が疾患度の有無の判定に有効であるかが良く分かっていないとしても、ある程度の精度で疾患度を算出することができるようにするには、請求項5に記載しているように前記抽出部が、前記選択人数ごとに生成される各近傍群について複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出するように構成されていればよい。
【0018】
検査項目が複数ある場合において、それぞれの検査項目のデータから疾患度をある程度の精度で推定算出するための具体的な態様としては、請求項6に記載しているように前記抽出部が、1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出するとともに、2つの検査項目から全ての検査項目までの近傍群において合致している前記参照被験者の識別子を抽出するように構成されているものが挙げられる。
【0019】
ある検査対象被験者が疾患を有しているかどうかについて、視覚的に捉えられるようにして総合的な評価を簡単に行えるようにするには、請求項7に記載しているように請前記疾患度を一軸に、前記疾患度を算出する際に前記近傍群生成部にて使用した選択人数を別の一軸に、前記疾患度を算出する際に前記抽出部におい識別子を抽出する際の基準とした検査項目数を更に別の一軸として3次元表示をする表示部を更に備えたものであればよい。このようなものであれば、例えば、疾患度の3次元グラフが特定の傾向を示している場合には検査対象被験者が疾患を有していると判断することができ、医療従事者が詳細に各検査項目の検査結果データを検討しなくても診断を行うことができるようになる。
【0020】
多数の検査項目のデータがある場合において、疾患度の鑑別精度に対してあまり寄与していない検査項目を外し、より精度よく疾患度の推定算出が行えるようにするには、請求項8に記載したように前記疾患度推定算出部が全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である基準鑑別精度と、検査項目のうち所定項目数の検査結果を用いずに算出した疾患度の鑑別精度である比較鑑別精度のそれぞれを算出する鑑別精度算出部と、前記基準鑑別精度と、前記比較鑑別精度とを比較して、前記比較鑑別精度が前記基準鑑別精度よりも鑑別精度が向上した場合には、前記比較鑑別精度を算出する際に用いなかった検査項目の検査結果を前記参照検査結果記憶部又は前記対象検査結果記憶部から除外する検査項目除去部とを更に備えたものであればよい。
【0021】
外された検索項目の検査結果データにおいて、残された検査結果データとの組み合わせ方によっては疾患度の鑑別精度が向上するものを外してしまうことを防ぐには、請求項9に記載したように、前記検査項目除去部が除外した検査項目の検査結果のうち1つを、残された検査項目の結果に加えて前記疾患度推定算出部が算出した疾患度の鑑別精度である再鑑別精度を算出する再鑑別精度算出部と、前記比較鑑別精度と前記再鑑別精度とを比較して、前記再鑑別精度が前記比較鑑別精度よりも鑑別精度が向上した場合には、加えた検査項目を前記参照検査結果比較部又は前記対象検査結果記憶部に戻す検査項目付加部とを更に備えたものであればよい。
【0022】
複数の検査項目の検査結果データがある場合には、ある検査結果データが特に疾患度の推定に寄与していることが考えられる。このような検査項目を自動で発見し、より疾患度の鑑別精度を向上させることができるようにするには、請求項10に記載しているようにある検査項目の検査結果を、更に別の検査項目として追加して前記疾患度推定算出部が算出した疾患度の鑑別精度である重み付け鑑別精度を算出する重み付け鑑別精度算出部と、前記重み付け鑑別精度が、重み付けを行わずに算出した疾患度の鑑別精度よりも向上した場合には、その検査項目の検査結果を複数の検査項目として前記参照検査結果比較部又は前記対象検査結果記憶部に記憶させる検査項目重み付け部とを更に備えたものであればよい。
【0023】
前記疾患度を各近傍群間の比較だけではなく、ある基準に基づいて評価できるようにするためには、請求項11に記載しているように、前記疾患度推定算出部が、全参照被験者における疾患保持者の比率である全参照被験者疾患発現率と、前記近傍群内疾患発現率とに基づいて疾患度を推定算出するものであればよい。
【0024】
疾患度として有効に働くと考えられるとともに、疾患の有無について判断するためのインデックスとして使いやすいものとしては、請求項12に記載しているように、前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との比率であるものが挙げられる。
【0025】
インデックスとして略同等に機能する別の具体的な実施の態様としては、請求項13に記載しているように前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との差であるものが挙げられる。
【0026】
疾患の有無の判断に関わる部分についてのみ疾患度を算出することにより、疾患度が推定算出される回数を減らし、計算負荷を軽減して算出速度を向上させるには、請求項14に記載しているように、前記疾患度推定算出部が、各近傍群において所定の回数以上合致する疾患保持者がいる場合に、前記疾患度を算出するように構成されたものであればよい。
【0027】
検査項目の一部について検査結果が存在しない参照被験者が混ざっており、データベース内に歯抜けデータが存在したとしても、有効に疾患度の推定算出を行うことができるようにするには、請求項15に記載しているように前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数が、対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数よりも少ない場合には、前記疾患度推定算出部が、当該参照被験者に関しては記憶されている検査項目数内では、疾患度の算出に用いられるとともに、前記検査項目数よりも多いときには、疾患度の算出に用いないように構成されているものであればよい。
【0028】
検査対象被験者が検査項目の一部について検査結果のデータを有していない場合に有効に疾患度の推定算出を行うことができるようにするには、請求項16に記載しているように、対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数が、前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数よりも少ない場合には、前記検査対象被験者の検査項目に対応する前記参照被験者の検査項目のデータを用いて前記疾患度推定算出部が疾患度を算出するものであればよい。
【0029】
検査項目ごとの検査結果が大小を比較することのできる数値情報からなる数値検査結果だけを疾患度の推定に用いるのではなく、例えば、陰性か陽性かといった2値の検査や生活習慣に対する質問のように複数の選択肢であり大小を比較できないようなカテゴリー分けに関する検査結果も疾患度の推定に用いることができるようにするには、請求項17に記載しているように前記参照検査結果記憶部及び対象検査結果記憶部に記憶されている検査項目の検査結果が、大小を比較できる数値情報からなる数値検査結果と、カテゴリー分けを示すカテゴリー分け検査結果とを含むものであり、前記カテゴリー分け検査結果を有する検査項目について、前記検査対象被験者と前記参照被験者とのカテゴリー分け検査結果が同値であるか否かに基づいて当該検査項目ごとの近傍群を生成するカテゴリー分け近傍群生成部を更に備えたものであればよい。
【0030】
予め用意できるデータベースにおいて、参照被験者が疾患を有しているかどうかについての情報がない場合にも、参照被験者と検査対象被験者がどれくらい似ているかについて評価し、似通っている集団からどのような疾患を有しているかを予想できるようにするには、請求項18に記載したように複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、前記選択人数及び前記抽出部において合致している前記参照被験者の識別子が登場する回数に基づいて、前記検査対象被験者と、前記参照被験者と間の類似度を算出する類似度算出部を備えることを特徴とする診断支援装置であればよい。
【0031】
全参照被験者間の類似度によって自己組織化マップ等を作成できるようにし、ある特徴を有するグループが疾患を有する可能性が高いといった推論を可能とするには、請求項19に記載しているように、ある参照被験者と前記検査対象被験者とを交換して、前記参照検査結果記憶部及び前記対象検査結果記憶部にそれぞれの検査結果を記憶させる交換部とを更に備え、前記交換部がすべての参照被験者を検査対象被験者とするとともに、すべての参照被験者間の類似度を前記類似度算出部に算出させるものであればよい。
【発明の効果】
【0032】
このように本発明の診断支援装置によれば、参照被験者の検査項目ごとの検査結果を数値順に並び変えた上で、検査対象被験者の検査結果と順序距離が近いもので近傍群を作って、それらの近傍群を比較して当該検査対象被験者に似ている参照被験者を抽出することで、疾患度の推定算出を行うようにしているので、例えば参照被験者のデータに複数の塊が形成されるような偏りがあったとしても検査対象被験者に対して均等に扱うことができ、検査対象被験者の疾患度の推定をよりうまく行うことができるようになる。また、検査の数値そのものではなく、順序から演算を行っているので、計算負荷を大幅に減らして、高速で疾患度の推定を行うことができる。
【図面の簡単な説明】
【0033】
【図1】本発明の第1実施形態に係る診断支援装置を示す機能ブロック図。
【図2】第1実施形態の診断支援装置のデータベースに記憶されている各検査項目の検査結果の一例を示す表。
【図3】第1実施形態の診断支援装置のデータベースに記憶されている各検査項目の検査結果を並び変えた状態を示す表。
【図4】第1実施形態の診断支援装置が生成した各検査項目の近傍群から抽出された参照被験者及び疾患度の算出結果を示す表。
【図5】第1実施形態の診断支援装置が生成した各検査項目の近傍群から抽出された参照被験者及び疾患度の算出結果の別の例を示す表。
【図6】第1実施形態の診断支援装置における表示部の疾患度の表示方法を示す模式図。
【図7】第1実施形態の診断支援装置の動作を示すフローチャート。
【図8】第1実施形態の変形実施形態に係る診断支援装置を示す機能ブロック図。
【図9】本発明の第2実施形態に係る診断支援装置を示す機能ブロック図。
【図10】第2実施形態の診断支援装置の動作を示すフローチャート。
【図11】本発明の第3実施形態に係る診断支援装置を示す機能ブロック図。
【図12】第3実施形態の診断支援装置の動作を示すフローチャート。
【図13】本発明の第4実施形態に係る診断支援装置を示す機能ブロック図。
【図14】第4実施形態の診断支援装置の動作を示すフローチャート。
【図15】第5実施形態の診断支援装置の類似度の表示方法の一例を示す模式図。
【発明を実施するための形態】
【実施例】
【0034】
以下、本発明の第一実施形態について図面を参照して説明する。
【0035】
第一実施形態の診断支援装置100は、CPU、内部メモリ、HDD等の外部記憶装置103、通信ネットワークに接続するためのモデム等の通信インタフェース、ディスプレイ、マウスやキーボードといった入力手段等を具備したいわゆるコンピュータによりその機能を実現してあるものである。
【0036】
図1に示すように、前記コンピュータは、少なくとも査対象被験者がある疾患を有しているかどうかを示す疾患度について推定算出する演算部1としての機能を発揮するものである
【0037】
前記演算部1は、複数の検査項目についての検査結果のデータを記憶するデータベース部2と、前記データベース部2のデータを加工し、数値順に並べた検査結果列に基づいて疾患度の演算を行う処理部3と、疾患度を3次元表示する表示部4とから構成してある。
【0038】
前記データベース部2は、疾患度が判定される検査対象被験者の各種検査結果が記憶してある対象検査結果記憶部22と、前記疾患度の推定するための元データとなる複数の参照被験者の検査結果が記憶してある参照検査結果記憶部21とからなるものである。
【0039】
より具体的には、前記対象検査結果記憶部22は、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶するものである。例えば、図2に示すデータベースの一部のように識別子と検査結果を対にして記憶させてある。
【0040】
前記参照検査結果記憶部21は、ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶するものである。本第一実施形態では、検査項目は、例えば血液検査における各種成分である。この血液検査における各種成分の値は、疾患との因果関係が分かっているもの、分かっていないものの両方が含まれている。ここで、識別子は例えば仮に付された患者番号であり、個人を特定できないものであったとしても、少なくともある検査結果がどの参照被験者のものであるかが判別できるものであれば構わない。また、前記非疾患保持者とは、疾患保持者が保持している疾患を保持していないもののことであり、別の疾患を有しているものであっても構わないし、健常者であっても構わない。
【0041】
前記処理部3は、全参照被験者と検査対象被験者の検査結果を数値順に並べ替えて、検査項目ごとの検査結果列を生成する並べ替え部31と、検査結果列から前記参照被験者の検査結果と順序距離が小さい検査結果を有する参照被験者の近傍群を生成する近傍群生成部32と、各近傍群に共通して表れる参照被験者を抽出する抽出部33と、抽出された参照被験者の構成から疾患度を推定算出する疾患度推定算出部34とから構成してある。
【0042】
各部について具体例を参照しながら説明する。以下の説明では、簡単のためにデータベースの一部だけを使用した例で説明するが、データベースの大きさを拡張しても同様に成り立つ話である。
【0043】
前記並べ替え部31は、図2に示されるような前記対象検査結果記憶部22及び前記参照検査結果記憶部21に記憶されている各検査結果のデータを図3(a)に示すように1つに統合した後に、図3(b)に示すように数値順に昇順でソートして各検査結果列を生成するようにしてある。ここで、図3では分かりやすさのために、検査結果の数値及び疾患の有無をかっこ書きで記載してあるが、以下の工程では数値データ自体は用いられておらず、各識別子が表れる順番のみによって処理が行われる。
【0044】
前記近傍群生成部32は、前記並べ替え部31により生成された各検査結果列から前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成するものである。ここで、順序距離が小さいとは、数値順に並べられた状態において前記検査対象被験者の検査結果と順番が近いもののことである。例えば、図3(b)に記載されている検査項目3の検査結果列において、検査対象被験者S0001の数値データは3.4であり、参照被験者P0005、P0003、P0006の数値データはそれぞれ2.9、3.6、3.7であることから、数値データを基準としてS0001と近いものを選ぶと、P0003、P0006、P0005の順となる。しかしながら順序距離で選ぶと、P0003とP0005は等距離にあり、P0006が最も離れているものとなる。
【0045】
ここで、近傍群生成部32は、検査対象被験者のデータのある地点を中心として、選択人数がn人となるまで順序距離が近いものを選択していく。この際、前記近傍群生成部32は、順序距離が近い順に検査結果が検査対象被験者のデータに対して小さい側、大きい側(図面では上側、下側)から順に1人ずつ選んでいきn人となった時点で各検査項目において近傍群を生成する。なお、片側においてこれ以上参照被験者を選択できない場合には、常にもう片側の参照被験者で順序距離の小さいものを近傍群生成部32は選択するようにしてある。このように構成してあるので、例えば、nが3人の場合には、図3(b)の検査結果列から図4(a)に示されるような近傍群が検査項目ごとに生成されることになる。
【0046】
前記抽出部33は、1つの検査項目の近傍群において含まれている前記参照被検者の識別子、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出するように構成してある。ここで、識別子を抽出する条件は変更可能なものであり、本実施形態では1つの検査項目の近似群に表れているだけで、参照被験者の識別子を抽出する場合から、全ての検査項目に共通して表れている識別子のみを抽出する場合まで変更される。別の表現をすると、検査項目数mがM項目であるとすると、1、2、3・・・・M項目までそれぞれの条件で近傍群からの抽出を行うようにしてある。例えば、2項目以上で合致しているものを抽出する条件の場合、図4(a)に示される各検査項目の近傍群から図4(b)に示すように各識別子が抽出されることになる。抽出する条件が2項目のまま、選択人数nが4人に拡げられると図5に示されるようになる。
【0047】
前記疾患度推定算出部34は、前記抽出部33により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出するものである。より具体的には、前記疾患度推定算出部34は、参照被験者がN人、検査項目数がM個であるとすると、前記近傍群生成部32が近傍群を作る条件である選択人数が1〜N人の場合があり、前記抽出部33の抽出条件が1〜M通りあることからそれぞれの条件でN×M通りの疾患度を推定算出するように構成してある。本実施形態では、前記疾患度は近傍群内疾患発現率と参照被験者内における疾患保持者の割合とを比較して算出するようにしてある。すなわち、前記疾患度推定算出部34は、全参照被験者における疾患保持者の比率である全参照被験者疾患発現率と、前記近傍群内疾患発現率とに基づいて疾患度を推定算出するものであり、前記近傍群内疾患発現率を全参照被験者疾患発現率で割ったものを検査対象被験者が疾患を有するかどうかを判断するための疾患度(インデックス)としている。このようにすることで、例えば、近傍群内に疾患保持者が元のデータベース内よりも多い割合で存在している場合には、疾患度は大きな値になる。図4、図5を比較すると分かるように選択人数n及び検査項目数mの条件ごとに疾患度は変化する可能性がある。
【0048】
前記表示部4は、前記疾患度をZ軸に、前記疾患度を算出する際に前記近傍群生成部32にて使用した選択人数nを別のX軸に、前記疾患度を算出する際に前記抽出部33におい識別子を抽出する際の基準とした検査項目数mをY軸として3次元表示をするものである。図6に示すように疾患度の分布傾向により検査対象被験者が疾患を有するかどうかを簡単に判断することができる。例えば、ある疾患において当該疾患を有していない検査対象被験者について疾患度が算出されると、図6(a)に示すように近傍群として選択される人数nが大きく(X軸の値が大きい)、合致と判断する検査項目数mが小さい(Y軸の値が小さい)領域(以下第1領域とする)においては、疾患度(Z軸の値)がほぼ1となっており、選択人数nが小さく、合致条件mが大きい領域(以下第2領域とする)ではほとんど疾患度が0となっている。従って、図6(a)に示されるように図面視において手前側が山となっており、斜め奥側へとなだらかに下降する勾配が形成されていることが分かる。
【0049】
一方、ある疾患を有している検査対象被験者の場合は、図6(b)に示すように第1領域において疾患度が略1を示している点では疾患を有していない場合と同じものの第2領域において選択人数nと合致条件mが略同じ値を取る領域において疾患度が1よりも大きい値を取っている。従って、図6(b)は、図面視において手前側が平面になっており、斜め奥側へと上昇する勾配が形成されていることが分かる。
【0050】
このように疾患度を全ての選択人数n、合致条件mで3次元表示してみると疾患を有しているかどうかによって顕著な分布傾向の差が表れることから視覚的に非常に分かりやすく、検査対象被験者の診断を支援することができる。
【0051】
また、本明細書では分かりやすさのためグラフの三次元形状のみを記載しているが、色によって視覚的な補助をしても構わない。例えば、図6(b)に示されるように検査対象被験者が疾患を有している場合には疾患度が1よりも大きい領域が大きくなることや、疾患度が1よりも大きいということは、参照被験者の中で疾患を有している人の割合よりも近傍群から抽出された集団の方が疾患を保持している人の割合が大きいことを示している事等から1つの重要な基準であると考えられる。そこで、疾患度のうち1以上のものに関しては、色を変化させて1よりも小さい領域と区別できるようにすれば、疾患の有無を判断しやすくなると考えられる。
【0052】
次に、このように構成された本実施形態の診断支援装置100の動作について図7のフローチャートを参照しながら簡単に説明する。
【0053】
まず、並べ替え部31がデータベース部2を参照して検査項目ごとに数値順の検査結果列を生成する(ステップS1)。次に近傍群生成部32と抽出部33の初期設定がリセットされ、n=1、m=1から開始される(ステップS2)。前記近傍群生成部32は設定されている選択人数nに基づいて検査結果列から近傍群を生成する(ステップS3)。前記抽出部33は各近傍群においてm項目以上の検査項目で共通する参照被験者の識別子を抽出する(ステップS4)。前記疾患度推定算出部34は、近傍群から抽出された疾患保持者の割合である近傍群内疾患発現率を全参照被験者における疾患保持者の割合である全参照被験者疾患発現率で割って疾患度を推定算出する(ステップS5)。選択人数nが参照被験者の総数Nかどうかの判断が行われ(ステップS6)、そうでない場合はnを1人増やして(ステップS7)再び近傍群を作り直し、識別子の抽出が再度行われて、別の疾患度が算出される。nがNと等しくなった場合には、抽出部33における合致と判断する条件である項目数mがMと等しいかどうかが判断され(ステップS8)、異なる場合にはmを1だけ増やして再び疾患度の推定算出が行われる。最終的に全ての選択人数n及び合致条件の項目数mの組み合わせについて疾患度が推定算出されると、前記表示がそれらのデータに基づいて疾患度の3次元表示を行う(ステップS9)。
【0054】
このように構成された診断支援装置100によれば、各検査項目の検査データを数値順に並べた上で、検査対象被験者と順序距離の小さいものから選択人数nだけ順番に選択していくことで近傍群を作成し、その近傍群から所定の項目数m以上で登場する検査対象被験者と類似していると考えられる参照被験者を抽出し、抽出された参照被験者の疾患保持者の割合と、全体の割合とを比較することで疾患度の推定を行っている。このため、計算負荷をあまり高くすることなく、しかも、参照被験者の偏りがあったとしても検査結果の数値が小さいもの又は大きいものだけに偏ったような近傍群が生成されるのを防ぎ、全ての参照被験者を略均等に評価できる近傍群を生成することができる。従って、このような参照被験者を均等に評価した近傍群を用いているので、検査対象被験者が疾患を保持しているかどうかを精度よく判定することができる。
【0055】
また、参照被験者の検査結果における偏りや傾向について従来であれば、極端なデータを無視したり、様々な分布を仮定して補正したりした上で検査対象被験者が疾患を有しているかどうかについて判定しないと有意義な結果が得られにくかったが、本実施形態の診断支援装置によれば、そのような操作を無くすことができるようになる。従って、従来の診断支援装置においては医師の経験や知見に依存して診断精度を向上させていた部分が大きかったが、本実施計形態の診断支援装置では順序距離に着目していることによりそのような問題を軽減し、精度の良い診断を行いながらも自動化をより進めることができる。
【0056】
第1実施形態の変形実施形態について説明する。第1実施形態では選択人数n及び参照被験者が各近傍群において合致していると判断する検査項目数mについてそれぞれn×m点において疾患度(インデックス)を算出し、その算出結果を3次元グラフで表示するように構成してあるが、例えば、1つの値だけに注目して検査対象被験者が疾患を有するかどうかを判断できるようにするには、疾患度の平均値を求める平均値算出部を更に備えたものであればよい。平均値算出部は、有意に作用しないと考えられる(n、m)組の疾患度を無視するように構成してある。例えば、近傍群の選択人数nが小さく、合致条件である検査項目数mが大きい等の条件が厳しい場合には、前記抽出部33が参照被験者の識別子を全く抽出できないことがある。このような場合、疾患度は全て0となってしまうので、平均の対象外としてある。より具体的には、合致とする検査項目数mに対して、全ての選択人数nごとにおける疾患度の平均を取った後に、全ての検査項目数mごとの平均された疾患度をさらに平均して全体の平均値を算出するように構成してある。
【0057】
別の平均値の算出方法としては、前記検査項目数m又は選択人数nを変化させて前記抽出部33により抽出された識別子の参照被験者が疾患保持者だった場合のみ疾患度を算出するようにしても構わない。
【0058】
演算回数を減らし、大規模なデータベースを用いた疾患度の判定を行う場合でも高速に平均値を算出するためのさらに別の平均値の算出方法としては、合致とする検査項目数mを固定しておき、近傍群の大きさを決める選択人数nを1つずつ大きくしていく際に、新たな合致者が発生した場合のみ平均値を算出するように構成したものであればよい。つまり、ある選択人数n−1とnとで前記抽出部33が抽出する参照被験者に変化が無い、又は、抽出される参照被検査者が増えたとしても合致条件数mに達するものが増えなかった場合には、疾患度又は平均値を算出する演算を行わないように構成してある。このように構成されたものであれば、ある合致条件数mに対して、多くとも参照被験者の総数であるN回までしか演算を行う必要が無いのでより高速化を見込むことができる。
【0059】
また、前記第1実施形態では疾患度は近傍群から抽出された参照被験者における疾患保持者の比率と、全参照被験者における疾患保持者の比率との比を取ることで算出されていたが、例えば、各比率の差を取るようにしても構わない。
【0060】
データベースによっては、全ての参照被験者について各検査結果項目が一致していないことも多い。このような場合、ある患者の存在していない検査項目の検査結果に対する扱い方は以下のような方法が考えられる。
【0061】
すなわち、前記参照検査結果記憶部21に記憶されている所定の参照被験者の検査項目数が、対象検査結果記憶部22に記憶されている前記検査対象被験者の検査項目数よりも少ない場合には、前記疾患度推定算出部34が、当該参照被験者に関しては記憶されている検査項目数内では、疾患度の算出に用いられるとともに、前記検査項目数よりも多いときには、疾患度の算出に用いないように構成されているものであればよい。
【0062】
より具体的には、所定の参照被験者と検査対象被験者との間で共通して存在している検査項目の検査結果により前記疾患度推定算出部34が疾患度を推定算出するものであり、その際は全参照被験者の中にその参照被験者を含めており、検査対象被験者のみが有する検査項目に対しては、疾患度の算出においてその参照被験者を全参照被験者の中から除いた形で疾患度を算出するように構成してある。
【0063】
また、検査対象被験者の検査項目のデータが参照被験者の検査項目のデータよりも少ない場合には、検査対象被験者の検査項目データを基準として疾患度を算出するための検査項目を決定すればよい。
【0064】
すなわち、対象検査結果記憶部22に記憶されている前記検査対象被験者の検査項目数が、前記参照検査結果記憶部21に記憶されている所定の参照被験者の検査項目数よりも少ない場合には、前記検査対象被験者の検査項目に対応する前記参照被験者の検査項目のデータを用いて前記疾患度推定算出部34が疾患度を算出するものであればよい。
【0065】
第1実施形態では、検査項目ごとの検査結果が大小を比較することのできる数値情報からなる数値検査結果だけを用いて疾患度の推定を行っていたが、実際の検査項目においては、陰性か陽性かといった2値の検査や生活習慣に対する質問のように複数の選択肢であり大小を比較できないようなカテゴリー分けに関する検査結果も存在する。カテゴリー分けに関する検査項目としては、例えば、食習慣、趣味、嗜好、行動形式等の調査を挙げることができ、このような調査に対する回答は(a)朝食重視(b)昼食重視(c)おやつ重視(d)夕食重視(e)夜食重視等のようにどの回答も並列であり、数値があり、大小を比較できる数値検査結果のように扱うことができない。
【0066】
このようなカテゴリー分け検査結果も疾患度の推定に用いることができるようにするには、図8に示すように、前記参照検査結果記憶部21及び対象検査結果記憶部22に記憶されている検査項目の検査結果が、大小を比較できる数値情報からなる数値検査結果と、カテゴリー分けを示すカテゴリー分け検査結果とを含むものであり、前記カテゴリー分け検査結果を有する検査項目について、前記検査対象被験者と前記参照被験者とのカテゴリー分け検査結果が同値であるか否かに基づいて当該検査項目ごとの近傍群を生成するカテゴリー分け近傍群生成部36を更に備えたものであればよい。
【0067】
より具体的には、前記カテゴリー分け近傍群生成部36は、前記検査対象被験者の回答した選択肢と前記参照被験者の回答した選択肢が同じであり、同値のものを近傍群として生成するものである。ここで、近傍群生成部32が近傍群を生成するための選択人数をn人と設定している場合、前記カテゴリー分け近傍群生成部36も可能であればこの基準を採用するようにしてある。しかしながら、非常に多くの参照被験者が検査対象被験者と同じ選択肢を選んでいる場合には、選択人数n人内に選択することが困難な場合がある。このように選択人数nよりも同値である人数が多い場合には例外的に、カテゴリー分け近傍群生成部36は、全ての同値であった参照被験者の識別子を抽出し近傍群を生成する。従って、選択人数によっては他の数値検査結果により生成される近傍群内の人数とカテゴリー分け検査結果により生成される近傍群内の人数が異なっている場合も存在することになる。数値検査結果についても同じ値の参照被験者が複数人おり、選択人数よりも多い場合には例外的に近傍群生成部32も全ての参照被験者を含めて近傍群を生成してもよい。
【0068】
このように数値検査結果とカテゴリー分け検査結果のそれぞれから形成された各近傍群から前記抽出部は一致している参照被験者の識別子を抽出し、前記疾患度推定部は疾患度の推定算出を行わせることにより、大小の存在しない検査結果であっても同値であるかどうかを基準することで疾患度の推定算出を行うことができる。つまり、より広範囲の検査結果を使うことができるので、疾患度の精度をさらに良くすることができるようになる。
【0069】
前記第1実施形態では、全ての参照被験者に基づいて近傍群を生成するように構成してあったが、例えば、検査対象被験者と順序距離又は数値が近い参照被験者のグループを予め抽出しておき、その中で近傍群を作るようにしても構わない。加えて、全ての選択人数n及び合致条件となる検査項目数mで疾患度を算出しなくても構わない。例えば、いくつかの組み合わせについてのみ疾患度の算出を行うようにしてもよい。また、参照検査結果記憶部に記憶されている識別子を予め検査結果に基づいて数値順に並べた状態で記憶させておき、前記並べ替え部は、検査対象被験者の識別子を検査項目ごとに数値順を崩さないように挿入するものであっても構わない。
【0070】
次に本発明の第2実施形態について説明する。
【0071】
第2実施形態の診断支援装置100では、図9に示すように前記第1実施形態に対してさらに、前記演算部1に用いられる検査結果のデータについて取捨選択を行う等して疾患度に関する演算の最適化を行うための最適化部5を更に備えたものである。
【0072】
前記最適化部5は、鑑別精度を算出する鑑別精度算出部51と、前記鑑別精度算出する鑑別精度に基づいて、除外した方が鑑別精度を向上させる項目を除去する検査項目除去部52と、除去された検査項目のうち1つを元に戻した状態で再び鑑別精度を算出する鑑別精度算出部53と、前記鑑別精度算出部53によって再算出された鑑別精度に基づいて元に戻した方がよい検査項目をデータベースに残す検査項目付加部54とから構成してある。
【0073】
鑑別精度算出部51は、前記疾患度推定算出部34が全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である基準鑑別精度と、検査項目のうち所定項目数の検査結果を用いずに算出した疾患度の鑑別精度である比較鑑別精度のそれぞれを算出するものである。ここで鑑別精度の算出方法としては、例えば、ROC(receiver operating characteristic; 受信者動作特性)解析を行うようにしてある。本実施形態では、鑑別精度算出部51は、検査項目のうち1項目だけを除外した状態で、前記演算部1により疾患度の算出を行わせて、比較鑑別精度を算出するように構成してあり、全検査項目の中から1つずつ除外する検査項目を変え、それぞれの鑑別精度を算出している。
【0074】
前記検査項目除去部52は、前記基準鑑別精度と、前記比較鑑別精度とを比較して、前記比較鑑別精度が前記基準鑑別精度よりも鑑別精度が向上した場合には、前記比較鑑別精度を算出する際に用いなかった検査項目の検査結果を前記参照検査結果記憶部21又は前記対象検査結果記憶部22から除外するものである。より具体的には、前記検査項目除去部52は、1つの基準鑑別精度と、除去された検査項目の異なるそれぞれの比較鑑別精度とを比較し、前記基準鑑別精度よりも比較鑑別精度が悪かった場合には、その検査項目のデータを前記参照検査結果記憶部21又は前記対象検査結果記憶部22から除外するものである。ここで除外するとは、記憶部から該当するデータを消去することや、別の記憶領域に移し替える等して、疾患度の算出にある検査項目のデータが用いられないようにすることを含む概念である。
【0075】
前記鑑別精度算出部53は、前記検査項目除去部52が除外した検査項目の検査結果のうち1つを、残された検査項目の結果に加えて前記疾患度推定算出部34が算出した疾患度の鑑別精度である再鑑別精度を算出するものである。
【0076】
前記検査項目付加部54は、前記比較鑑別精度と前記再鑑別精度とを比較して、前記再鑑別精度が前記比較鑑別精度よりも鑑別精度が向上した場合には、加えた検査項目を前記参照検査結果比較部又は前記対象検査結果記憶部22に戻すものである。
【0077】
このように構成された最適化部5の動作について図10のフローチャートを参照しながら説明する。
【0078】
まず、全ての検査項目のデータを用いて前記演算部1が疾患度を算出する。ここで、疾患度は、ある一組の近傍群生成部32が生成する近傍群の大きさを決定する選択人数nと、前記抽出部33が各近傍群から合致している参照被験者を抽出する基準である項目数mにより算出されたものを代表して算出してもよいし、全ての選択人数nと項目数mにおいてそれぞれ疾患度を算出し、それらの疾患度を平均した値としてもよい(ステップST1)。
【0079】
前記演算部1にて算出された疾患度について、前記鑑別精度算出部51がROC解析を行うことにより第1基準鑑別精度を算出する(ステップST2)。次に、基準鑑別精度を算出するために用いられた検査項目に1〜M番までの番号を付与して、k=1に初期設定した状態にする(ステップST3)。k番目の検査項目を除いた状態での疾患度を演算部1が算出し(ステップST4)、鑑別精度算出部51がk番目の検査項目を使用していない状態での鑑別精度である比較鑑別精度を算出する(ステップST5)。kが全検査項目数Mと等しくなるまで、ある1つの検査項目を除いた状態での比較鑑別精度の算出を繰り返す(ステップST6、ステップST7)。
【0080】
前記検査項目除去部52が、第1基準鑑別精度と全ての比較鑑別精度とを比較し(ステップST8)、第1基準鑑別精度よりも所定値以上、鑑別精度の良い比較鑑別精度が存在するかどうかの判断を行う(ステップST9)。存在しない場合には、そこで検査項目の最適化が終了し、存在している場合には、前記検査項目除去部52が、ある検査項目を省くことにより比較鑑別精度が良くなった検査項目を前記参照結果記憶部及び前記対象検査結果記憶部22から除外する(ステップST10)。
【0081】
検査項目から除外されたデータが存在する場合には、前記演算部1が残っている検査項目を全て用いて疾患度の算出を行い(ステップST11)、前記鑑別精度算出部53が、除外されずに残った検査項目を全て使用して第2基準鑑別精度を算出する(ステップST12)。ここで、除外された検査項目について1〜L番までの番号が付与されるとともに、lが1に初期設定される(ステップST13)。
【0082】
次に、l番目の除外された検査項目を残っている検査項目に戻した状態で、前記演算部1が疾患度を算出する(ステップST14)。そして、ステップST14で算出された疾患度を用いて、前記鑑別精度算出部53は、l番目の除外された検査項目を戻した状態での再鑑別精度を算出する(ステップST15)。lが除外された全検査項目数Lとなるまで(ステップST16、ステップST17)順番に1つずつ除外された検査項目を戻した状態での再鑑別精度が算出される。
【0083】
前記検査項目付加部54が第2基準鑑別精度と算出された各再鑑別精度とを比較し(ステップST18)、第2基準鑑別精度よりも所定値以上良い再鑑別精度が存在しない場合には、最適化を終了する(ステップST19)。再鑑別精度が第2基準鑑別精度よりも所定値以上良くなっている場合には、前記検査項目付加部54が、再鑑別精度の方が良くなった検査項目のデータを参照検査結果記憶部21及び対象検査結果記憶部22に全て戻し(ステップST20)、再びステップST1からの工程を最適化が終了されるまで繰り返す。
【0084】
このように、鑑別精度の算出を繰り返すことにより検査対象被験者が疾患を有しているどうかを判定する精度に対して、あまり寄与していない又は悪影響を与えている検査項目のデータが除去され、検査項目のデータを自動で最適化することができる。
【0085】
次に本発明の第3実施形態について説明する。第3実施形態は、前記第2実施形態における最適化部5が検査項目間の重みづけを行うための構成を備えたものである。
【0086】
前記最適化部5は、図11に示すようにある検査項目の検査結果を、前記疾患度推定算出部34が全ての検査項目の検査結果を等しい回数だけ用いて算出した疾患度の鑑別精度である第3基準鑑別精度と、更に別の検査項目として追加して前記疾患度推定算出部34が算出した疾患度の鑑別精度である重み付け鑑別精度を算出する重み付け鑑別精度算出部55と、前記重み付け鑑別精度が、重み付けを行わずに算出した疾患度の鑑別精度よりも向上した場合には、その検査項目の検査結果を複数の検査項目として前記参照検査結果記憶部21又は前記対象検査結果記憶部22に記憶させる検査項目重み付け部56とを備えたものである。
【0087】
前記鑑別精度算出部51は、前記演算部1がある検査項目のデータをコピーして2項目分として扱うようにした状態で算出された疾患度に対する鑑別精度である重み付け鑑別精度を算出するように構成したものである。また、何も重み付けを行わずに算出した疾患度に対する鑑別精度である第3基準鑑別精度は、第2実施形態における第1基準鑑別精度に相当するものであるが、例えば、全ての検査項目を2回ずつ使用して重み付けをつけずに第3基準鑑別精度を算出するようにしてもかまわない。
【0088】
前記検査項目重み付け部56は、前記第1基準鑑別精度と前記重み付け鑑別精度とを比較し、前記重み付け鑑別精度の方が鑑別精度の向上があった場合には、その検査結果を2重にカウントできるように別の検査項目として前記参照検査結果記憶部21及び前記対象検査結果記憶部22にコピーさせて記憶させるものである。
【0089】
このように構成された最適化部5による各検査項目間の重み付けについて図12のフローチャートを参照しながら説明する。
【0090】
まず、前記演算部1にて全ての検査項目のデータを1回ずつ使用して疾患度の算出が行われる(ステップPH1)。その疾患度を用いて前記重み付け鑑別精度算出部55は、第3基準鑑別精度を算出する(ステップPH2)。次に、全ての検査項目について番号mが1〜Mまで付され(ステップPH3)、m番目の検査項目を2回使用するようにした状態で前記演算部1により疾患度が算出される(ステップPH4)。その疾患度に基づいて、前記重み付け鑑別精度算出部55はm番目の検査項目に対する重み付け鑑別精度を算出する(ステップPH5)。重み付けが行われた検査項目の番号mが全検査項目数Mと一致しているかどうかの判断が行われ(ステップPH6)、mがMに一致するまで順番に重み付けを各検査項目の重み付けを行い(ステップPH7)、重み付け鑑別精度が算出される。
【0091】
次に、前記検査項目重み付け部56は前記第3基準鑑別精度と、各重み付け鑑別精度との比較を行い(ステップPH8)、第3基準鑑別精度よりも所定値以上に向上した重み付け鑑別精度が無い場合には重み付けが終了され(ステップPH9)、向上したm番目の項目については前記参照検査結果記憶部21及び前記対象検査結果記憶部22にコピーし項目数を増加させて記憶させる(ステップPH10)。
【0092】
再びステップPH3に戻り、新たな項目数で重み付けを開始し、鑑別精度の向上が見られなくなるまで検査項目の重み付けが繰り返される。
【0093】
このように第3実施形態によれば、自動で項目間の重み付けを繰り返すことにより鑑別精度を向上させることができ、より対象被験者の疾患度の推定精度を向上させることができる。
【0094】
本発明の第4実施形態について説明する。
【0095】
第4実施形態の診断支援装置100は、図13に示すように前記第1実施形態と前記参照検査結果記憶部21に記憶されるデータについて、予め参照被験者がある疾患を有しているかどうかの情報が記憶されていない点と、前記疾患度推定算出部34の替わりに参照被験者と検査対象被験者との類似度を推定算出する類似度算出部35を備えている点、及び表示部4が各参照被験者と検査対象被験者との類似度を表示する類似度表示部6である点が異なる。言い換えると第1実施形態の診断支援装置100は教師あり学習に基づいた診断支援装置100であるのに対して、第4実施形態の診断支援装置100は教師なし学習に基づいて、類似している参照被験者の集合から検査対象被験者がどのような疾患を有しているかについて類推することを支援するためのものである。
【0096】
第1実施形態の異なる部分についてのみ具体的に説明する。
【0097】
前記参照検査結果記憶部21には、複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶されており、参照被験者間において特定の疾患があるかないかについての基準は設けていない。
【0098】
前記類似度算出部35は、前記選択人数及び前記抽出部33において合致している前記参照被験者の識別子が登場する回数に基づいて、前記検査対象被験者と、前記参照被験者と間の類似度を算出するものである。ここで類似度は、参照被験者の総数をN、近傍群を生成するための選択人数をn、総検査項目数をM、近傍群間において検査対象被験者とある参照被検査者が合致していると判断する検査項目数をmとすると、(N/n)からなる距離指数に基づいて表されるものである。なお、ある検査項目数mにおける距離指数は、選択人数nを大きくしていった時に初めて検査対象被験者と参照被験者とが合致していると判断されたときの値のみを算出するようにしている。本実施形態では、検査項目数mは1〜Mの場合全てについて前記距離指数を算出し、その平均値を類似度として使用している。
【0099】
前記類似度表示部6は、全参照被験者のうち類似度の高い上位数%を提示し、検査対象被験者と各検査項目で良く似た傾向を示しているものを示すようにしてある。このようにして、検査対象被験者と良く似た傾向を持った参照被験者がピックアップされるので、例えば、この参照被検査者らが有している疾患を検討することにより検査対象被験者が有している可能性のある疾患を類推する事を支援することが可能となる。
【0100】
このように構成された第4実施形態の診断支援装置100の動作について図14に示すフローチャートを参照しながら説明する。
【0101】
まず、前記並べ替え部31が前記参照検査結果記憶部21及び前記対象検査結果記憶部22に記憶されているデータを検査項目ごとに数値順に並べ替えて検査項目ごとの検査結果列を生成する(ステップSS1)。近傍群生成部32が近傍群を作るための選択人数nを1に、抽出部33における各近傍群に含まれる参照被験者が合致と見なされる条件の検査項目数mを1と初期設定する(ステップSS2)。前記近傍群生成部32は、検査結果列から設定されている選択人数であるn人を検査対象被験者との順序距離が近い順に選択して近傍群を生成する(ステップSS3)。前記抽出部33が、m項目以上の近傍群において共通する参照被験者の識別子のうち、選択人数nになった時点で初めて表れたもののみを抽出する(ステップSS4)。前記抽出部33が抽出した識別子ごとに類似度算出部35が参照被験者の総数N、選択人数n、合致条件である検査項目数mに基づいて検査対象被験者との類似度を算出する(ステップSS5)。ある検査項目数mについて合致していると判断する条件において、選択人数nを1〜Nまで変化させて、類似度の算出を繰り返す(ステップSS6、ステップSS7)。また合致条件の項目数mも1〜Mまで変化させて類似度の算出を繰り返す(ステップSS8、ステップSS9)。最後に類似度表示部6が検査対象被験者と類似度の高い参照被験者の上位数%を提示して終了する(ステップSS10)。
【0102】
このようにして、第4実施形態の診断支援装置100によればデータベース部2に疾患の有無に関する情報がなかったとしても、検査対象被験者と傾向の似通った人を探し、傾向を発見するための手助けとなるような教師なし学習による診断支援を行うことができる。
【0103】
第5実施形態の診断支援装置100について説明する。第4実施形態の診断支援装置100では、ある一人の検査対象被験者と複数の参照被験者との類似度を評価するものであったが、第5実施形態の診断支援装置100では全ての参照被験者間の類似度を算出し、その類似度に基づいて自己組織化マップを作成するためのものである。
【0104】
具体的には、第4実施形態の診断支援装置100が更に、ある参照被験者と前記検査対象被験者とを交換して、前記参照検査結果記憶部21及び前記対象検査結果記憶部22にそれぞれの検査結果を記憶させる交換部とを更に備え、前記交換部がすべての参照被験者を検査対象被験者とするとともに、すべての参照被験者間の類似度を前記類似度算出部35に算出させるものであればよい。このようなものであれば、全参照被験者間の類似度を算出することができ、例えば、前述した類似度は一種の距離指数であることを利用して、各参照被験者間の平面上の距離を距離指数で表し、図15に示されるような2次元平面上に配置させれば、距離指数の近いもの同士により疾患などの傾向が揃った集団を作ることができるようになる。この形成された集団から様々な疾患と検査項目の結果との関係を知ることができ、ある疾患を有する患者の特徴を抽出する事が可能となる。
【0105】
その他、本発明の趣旨に反しない限りにおいて、様々な変形や実施形態の組み合わせを行っても構わない。
【符号の説明】
【0106】
100・・・診断支援装置
21・・・参照検査結果記憶部
22・・・対象検査結果記憶部
31・・・並べ替え部
32・・・近傍群生成部
33・・・抽出部
34・・・疾患度推定算出部
35・・・類似度算出部
36・・・カテゴリー分け近傍群生成部
4・・・表示部
51・・・鑑別精度算出部
52・・・検査項目除去部
53・・・再鑑別精度算出部
54・・・検査項目付加部
55・・・重み付け鑑別精度算出部
56・・・検査項目重み付け部

【特許請求の範囲】
【請求項1】
ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、
検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、
前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、
前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、
1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、
前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置。
【請求項2】
ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに数値順に記憶する参照検査結果記憶部と、
検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、
前記検査項目ごとに、前記検査対象被験者の検査結果を、前記参照被験者の各検査結果に対して数値順となるように加えて、前記検査項目ごとの検査結果列を生成する並べ替え部と、
前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、
1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、
前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置。
【請求項3】
前記近傍群生成部が、複数の前記選択人数ごとに近傍群を生成するように構成されている請求項1又は2記載の診断支援装置。
【請求項4】
前記近傍群生成部が、前記選択人数を一人から前記参照被験者全員まで変更して、前記選択人数ごとの近傍群を生成するように構成されている請求項1乃至3のいずれかに記載の診断支援装置。
【請求項5】
前記抽出部が、前記選択人数ごとに生成される各近傍群について複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出するように構成されている請求項1乃至4のいずれかに記載の診断支援装置。
【請求項6】
前記抽出部が、1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出するとともに、2つの検査項目から全ての検査項目までの近傍群において合致している前記参照被験者の識別子を抽出するように構成されている請求項1乃至5のいずれかに記載の診断支援装置。
【請求項7】
前記疾患度を一軸に、前記疾患度を算出する際に前記近傍群生成部にて使用した選択人数を別の一軸に、前記疾患度を算出する際に前記抽出部におい識別子を抽出する際の基準とした検査項目数を更に別の一軸として3次元表示をする表示部を更に備えた請求項1乃至6のいずれかに記載の診断支援装置。
【請求項8】
前記疾患度推定算出部が全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である第1基準鑑別精度と、検査項目のうち所定項目数の検査結果を用いずに算出した疾患度の鑑別精度である比較鑑別精度のそれぞれを算出する鑑別精度算出部と、
前記第1基準鑑別精度と、前記比較鑑別精度とを比較して、前記比較鑑別精度が前記基準鑑別精度よりも鑑別精度が向上した場合には、前記比較鑑別精度を算出する際に用いなかった検査項目の検査結果を前記参照検査結果記憶部又は前記対象検査結果記憶部から除外する検査項目除去部とを更に備えた請求項1乃至7のいずれかに記載の診断支援装置。
【請求項9】
前記疾患度推定算出部が除外されずに残った全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である第2基準鑑別精度と、前記検査項目除去部が除外した検査項目の検査結果のうち1つを、残された検査項目の結果に加えて前記疾患度推定算出部が算出した疾患度の鑑別精度である再鑑別精度を算出する再鑑別精度算出部と、
前記比較鑑別精度と前記再鑑別精度とを比較して、前記再鑑別精度が前記比較鑑別精度よりも鑑別精度が向上した場合には、加えた検査項目を前記参照検査結果記憶部又は前記対象検査結果記憶部に戻す検査項目付加部とを更に備えた請求項8記載の診断支援装置。
【請求項10】
前記疾患度推定算出部が全ての検査項目の検査結果を同じ回数だけ用いて算出した疾患度の鑑別精度である第3基準鑑別精度と、ある検査項目の検査結果を、更に別の検査項目として追加して前記疾患度推定算出部が算出した疾患度の鑑別精度である重み付け鑑別精度を算出する重み付け鑑別精度算出部と、
前記重み付け鑑別精度が、第3鑑別精度よりも向上した場合には、その検査項目の検査結果を複数の検査項目として前記参照検査結果記憶部又は前記対象検査結果記憶部に記憶させる検査項目重み付け部とを更に備えた請求項1乃至9のいずれかに記載の診断支援装置。
【請求項11】
前記疾患度推定算出部が、全参照被験者における疾患保持者の比率である全参照被験者疾患発現率と、前記近傍群内疾患発現率とに基づいて疾患度を推定算出する請求項1乃至10のいずれかに記載の診断支援装置。
【請求項12】
前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との比率である請求項11記載の診断支援装置。
【請求項13】
前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との差である請求項11記載の診断支援装置。
【請求項14】
前記疾患度推定算出部が、各近傍群において所定の回数以上合致する疾患保持者がいる場合に、前記疾患度を算出するように構成された請求項1乃至13のいずれかに記載の診断支援装置。
【請求項15】
前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数が、対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数よりも少ない場合には、前記疾患度推定算出部が、当該参照被験者に関しては記憶されている検査項目数内では、疾患度の算出に用いられるとともに、前記検査項目数よりも多いときには、疾患度の算出に用いないように構成されている請求項1乃至14のいずれかに記載の診断装置。
【請求項16】
対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数が、前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数よりも少ない場合には、前記検査対象被験者の検査項目に対応する前記参照被験者の検査項目のデータを用いて前記疾患度推定算出部が疾患度を算出する請求項1乃至15のいずれかに記載の診断装置。
【請求項17】
前記参照検査結果記憶部及び対象検査結果記憶部に記憶されている検査項目の検査結果が、大小を比較できる数値情報からなる数値検査結果と、カテゴリー分けを示すカテゴリー分け検査結果とを含むものであり、
前記カテゴリー分け検査結果を有する検査項目について、前記検査対象被験者と前記参照被験者とのカテゴリー分け検査結果が同値であるか否かに基づいて当該検査項目ごとの近傍群を生成するカテゴリー分け近傍群生成部を更に備えた請求項1乃至16のいずれかに記載の診断支援装置。
【請求項18】
複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、
検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、
前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、
前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、
1つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、
前記選択人数及び前記抽出部において合致している前記参照被験者の識別子が登場する回数に基づいて、前記検査対象被験者と、前記参照被験者と間の類似度を算出する類似度算出部を備えることを特徴とする診断支援装置。
【請求項19】
ある参照被験者と前記検査対象被験者とを交換して、前記参照検査結果記憶部及び前記対象検査結果記憶部にそれぞれの検査結果を記憶させる交換部とを更に備え、
前記交換部がすべての参照被験者を検査対象被験者とするとともに、すべての参照被験者間の類似度を前記類似度算出部に算出させる請求項18記載の診断支援装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate