診断支援装置

【課題】参照被験者の検査結果の数値データに偏りがあったとしても、その影響を受けにくくすることができ、その結果疾患の有無についての判定精度を向上させることができる診断支援装置を提供する。
【解決手段】参照検査結果記憶部２１と、対象検査結果記憶部２２と、数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部３１と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部３２と、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部３３と、前記抽出部により抽出された識別子に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部３４とを備えた。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、各種検査項目の検査結果のデータベースに基づいて、検査対象被験者がある疾患を有しているかどうかを判定支援したり、ある疾患と検査結果の傾向にどのような関係があるかについて判断するのを支援したりするための診断支援装置に関するものである。
【背景技術】
【０００２】
ある検査対象被験者が、特定の疾患を有しているかどうかについて医師が判断することを補助するための装置として、検査対象被験者に対して行われた検査結果の数値がある基準値以上であれば疾患を有する可能性があると判断する診断支援装置が従来からある。このような診断支援装置では、その疾患と行われる検査の検査結果との関係性が明確であれば、有効に作用し、医療従事者の支援を行うことができると考えられるが、実際には、疾患と検査結果との間の関係性が明確でない場合も多く、基準値を設定すること自体が難しい事も多い。
【０００３】
このような問題を解決するために、疾患が存在するかどうかを判断するための基準値を設定するのではなく、例えば、特許文献１等に示される診断支援装置では、多数の参照被験者から得られた複数の検査項目における検査結果の数値データに基づいて、２次元平面上にマップとして形成し、その数値が似通った集団を可視化しておき、ある検査対象被験者の検査データがマップ上のどの集団に属する又は近いかによってある疾患を有するかどうかを判断するように構成された診断支援装置がある。
【０００４】
しかしながら、このような診断支援装置では、検査結果の数値データそのものを利用して疾患の有無を判断するためのマップが形成されているため、予め用意されている多数の参照被験者の検査結果に偏りがある場合には、実際には疾患を有しているはずの検査対象被験者が、ある集団から大きく離れているために疾患を有さないといった誤判定が発生しやすくなっている可能性がある。
【０００５】
より具体的には、ある疾患と検査結果のデータとの因果関係については良く分かっていないのであるから、多数の参照被験者の検査結果の数値データが大きく離れた値で固まっている等の偏りがあったとしても、それが普通の状態であるのか異常の状態であるのかを判断する事は難しい。このことから、疾患の有無を判断するために参照被験者の検査結果について数値データそのものを使用している場合には、検査対象被験者が疾患を有しているかどうかについて、うまく判定するには診断支援装置の使用者が偏りを無視したり、対数を取ったり正規分布として扱ったりする等の補正をかけたりする手間を一々かけなくてはならず、診断支援の自動化に対する障害となってしまう。加えて、診断支援装置の使用者がそのような補正を検査結果の数値データに行うことが診断精度の向上に寄与するかどうかという点でも疑問が残る。
【０００６】
また、疾患を有するかどうかについての判定精度を向上させるには、参照被験者の数を多くすることも大数の法則等から考えて有効であると考えられるが、数値データを直接取り扱う場合には、その分だけ計算負荷が増大していくことになり、短時間で診断支援を行うことが難しくなってしまう。
【先行技術文献】
【特許文献】
【０００７】
【特許文献１】特開２００９−５２８１０３号公報
【発明の概要】
【発明が解決しようとする課題】
【０００８】
本発明は上述したような問題を鑑みてなされたものであり、参照被験者の検査結果の数値データに偏りがあったとしても、その影響を受けにくくすることができ、その結果疾患の有無についての判定精度を向上させることができるとともに、疾患を有するかどうかについての計算負荷が小さく、高速で診断支援を行うことができる診断支援装置を提供することを目的とする。
【課題を解決するための手段】
【０００９】
すなわち、請求項１に記載の発明は、ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置である。
【００１０】
また、請求項２に記載の発明は、ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに数値順に記憶する参照検査結果記憶部と、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、前記検査項目ごとに、前記検査対象被験者の検査結果を、前記参照被験者の各検査結果に対して数値順となるように加えて、前記検査項目ごとの検査結果列を生成する並べ替え部と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置である。
【００１１】
このようなものであれば、前記並べ替え部が、複数の参照被験者の検査結果と検査対象被験者の検査結果を数値順に並べ替えて検査結果列を作り、前記近傍群生成部が前記検査対象被験者と順序距離の小さい参照被験者を選択人数だけ選択して近傍群を生成するように構成してあるので、数値データに関わりなく、検査対象被験者の検査結果よりも大きい値を有する参照被験者も小さい値を有する参照被験者も略均等に評価させることができる。より具体的には、例えば、前記検査結果列において検査対象被験者の検査結果が、前後の検査結果に対して数値が小さい値側には近く、大きい値側から遠かったとしても常に小さい側からだけ参照被験者が選択されて近傍群が作られることを防ぐことができる。従って、偏った数値データであったとしても全ての参照被験者の検査結果を略均等に使って疾患の有無の評価ができるようになるため、検査対象被験者の疾患の有無をより良い精度で推定する事が可能となる。
【００１２】
また、数値データそのものではなく、前記並び変え部が生成した検査結果列において順序距離において近傍群を生成するようにしてあるので、例えば、検査対象被験者の検査結果に対して前後にいる参照被験者を交互に選んでいくといった計算負荷の少ない選択方法で近傍群を生成することができる。
【００１３】
このように、本発明によれば計算負荷をあまり高くすることなく、しかも、参照被験者の偏りがあったとしても検査結果の数値が小さいもの又は大きいものだけに偏ったような近傍群が生成されるのを防ぎ、全ての参照被験者を略均等に評価できる近傍群を生成することができる。従って、このような参照被験者を均等に評価した近傍群を用いているので、検査対象被験者が疾患を保持しているかどうかを精度よく判定することができる。
【００１４】
さらに、前記選択人数を変更して前記近傍群生成部が生成する近傍群の大きさを変更し、また、前記抽出部が合致していると見なす検査項目数を変更することによって多数の条件での検査対象被験者の疾患度を評価することができる。つまり、近傍群の大きさと、合致していると見なす参照被験者の検査項目数をそれぞれ変化させることにより一点の疾患度だけではなく、全体の疾患度の傾向から検査対象被検査者がある疾患を有するかどうかを評価することにより、より判定精度を向上させることができる。
【００１５】
近傍群の大きさによる算出される疾患度の違いを全体的に考慮して、検査対象被験者が疾患を有しているかどうかを判断できるようにし、疾患度の鑑別精度を向上させるには、請求項３に記載しているように前記近傍群生成部が、複数の前記選択人数ごとに近傍群を生成するように構成されていればよい。
【００１６】
近傍群の大きさによる違いを全て評価できるようにするための具体的な実施の態様としては、請求項４に記載しているように前記近傍群生成部が、前記選択人数を一人から前記参照被験者全員まで変更して、前記選択人数ごとの近傍群を生成するように構成されていればよい。
【００１７】
多数の検査項目の結果がある場合において、どの検査項目が疾患度の有無の判定に有効であるかが良く分かっていないとしても、ある程度の精度で疾患度を算出することができるようにするには、請求項５に記載しているように前記抽出部が、前記選択人数ごとに生成される各近傍群について複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出するように構成されていればよい。
【００１８】
検査項目が複数ある場合において、それぞれの検査項目のデータから疾患度をある程度の精度で推定算出するための具体的な態様としては、請求項６に記載しているように前記抽出部が、１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出するとともに、２つの検査項目から全ての検査項目までの近傍群において合致している前記参照被験者の識別子を抽出するように構成されているものが挙げられる。
【００１９】
ある検査対象被験者が疾患を有しているかどうかについて、視覚的に捉えられるようにして総合的な評価を簡単に行えるようにするには、請求項７に記載しているように請前記疾患度を一軸に、前記疾患度を算出する際に前記近傍群生成部にて使用した選択人数を別の一軸に、前記疾患度を算出する際に前記抽出部におい識別子を抽出する際の基準とした検査項目数を更に別の一軸として３次元表示をする表示部を更に備えたものであればよい。このようなものであれば、例えば、疾患度の３次元グラフが特定の傾向を示している場合には検査対象被験者が疾患を有していると判断することができ、医療従事者が詳細に各検査項目の検査結果データを検討しなくても診断を行うことができるようになる。
【００２０】
多数の検査項目のデータがある場合において、疾患度の鑑別精度に対してあまり寄与していない検査項目を外し、より精度よく疾患度の推定算出が行えるようにするには、請求項８に記載したように前記疾患度推定算出部が全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である基準鑑別精度と、検査項目のうち所定項目数の検査結果を用いずに算出した疾患度の鑑別精度である比較鑑別精度のそれぞれを算出する鑑別精度算出部と、前記基準鑑別精度と、前記比較鑑別精度とを比較して、前記比較鑑別精度が前記基準鑑別精度よりも鑑別精度が向上した場合には、前記比較鑑別精度を算出する際に用いなかった検査項目の検査結果を前記参照検査結果記憶部又は前記対象検査結果記憶部から除外する検査項目除去部とを更に備えたものであればよい。
【００２１】
外された検索項目の検査結果データにおいて、残された検査結果データとの組み合わせ方によっては疾患度の鑑別精度が向上するものを外してしまうことを防ぐには、請求項９に記載したように、前記検査項目除去部が除外した検査項目の検査結果のうち１つを、残された検査項目の結果に加えて前記疾患度推定算出部が算出した疾患度の鑑別精度である再鑑別精度を算出する再鑑別精度算出部と、前記比較鑑別精度と前記再鑑別精度とを比較して、前記再鑑別精度が前記比較鑑別精度よりも鑑別精度が向上した場合には、加えた検査項目を前記参照検査結果比較部又は前記対象検査結果記憶部に戻す検査項目付加部とを更に備えたものであればよい。
【００２２】
複数の検査項目の検査結果データがある場合には、ある検査結果データが特に疾患度の推定に寄与していることが考えられる。このような検査項目を自動で発見し、より疾患度の鑑別精度を向上させることができるようにするには、請求項１０に記載しているようにある検査項目の検査結果を、更に別の検査項目として追加して前記疾患度推定算出部が算出した疾患度の鑑別精度である重み付け鑑別精度を算出する重み付け鑑別精度算出部と、前記重み付け鑑別精度が、重み付けを行わずに算出した疾患度の鑑別精度よりも向上した場合には、その検査項目の検査結果を複数の検査項目として前記参照検査結果比較部又は前記対象検査結果記憶部に記憶させる検査項目重み付け部とを更に備えたものであればよい。
【００２３】
前記疾患度を各近傍群間の比較だけではなく、ある基準に基づいて評価できるようにするためには、請求項１１に記載しているように、前記疾患度推定算出部が、全参照被験者における疾患保持者の比率である全参照被験者疾患発現率と、前記近傍群内疾患発現率とに基づいて疾患度を推定算出するものであればよい。
【００２４】
疾患度として有効に働くと考えられるとともに、疾患の有無について判断するためのインデックスとして使いやすいものとしては、請求項１２に記載しているように、前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との比率であるものが挙げられる。
【００２５】
インデックスとして略同等に機能する別の具体的な実施の態様としては、請求項１３に記載しているように前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との差であるものが挙げられる。
【００２６】
疾患の有無の判断に関わる部分についてのみ疾患度を算出することにより、疾患度が推定算出される回数を減らし、計算負荷を軽減して算出速度を向上させるには、請求項１４に記載しているように、前記疾患度推定算出部が、各近傍群において所定の回数以上合致する疾患保持者がいる場合に、前記疾患度を算出するように構成されたものであればよい。
【００２７】
検査項目の一部について検査結果が存在しない参照被験者が混ざっており、データベース内に歯抜けデータが存在したとしても、有効に疾患度の推定算出を行うことができるようにするには、請求項１５に記載しているように前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数が、対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数よりも少ない場合には、前記疾患度推定算出部が、当該参照被験者に関しては記憶されている検査項目数内では、疾患度の算出に用いられるとともに、前記検査項目数よりも多いときには、疾患度の算出に用いないように構成されているものであればよい。
【００２８】
検査対象被験者が検査項目の一部について検査結果のデータを有していない場合に有効に疾患度の推定算出を行うことができるようにするには、請求項１６に記載しているように、対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数が、前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数よりも少ない場合には、前記検査対象被験者の検査項目に対応する前記参照被験者の検査項目のデータを用いて前記疾患度推定算出部が疾患度を算出するものであればよい。
【００２９】
検査項目ごとの検査結果が大小を比較することのできる数値情報からなる数値検査結果だけを疾患度の推定に用いるのではなく、例えば、陰性か陽性かといった２値の検査や生活習慣に対する質問のように複数の選択肢であり大小を比較できないようなカテゴリー分けに関する検査結果も疾患度の推定に用いることができるようにするには、請求項１７に記載しているように前記参照検査結果記憶部及び対象検査結果記憶部に記憶されている検査項目の検査結果が、大小を比較できる数値情報からなる数値検査結果と、カテゴリー分けを示すカテゴリー分け検査結果とを含むものであり、前記カテゴリー分け検査結果を有する検査項目について、前記検査対象被験者と前記参照被験者とのカテゴリー分け検査結果が同値であるか否かに基づいて当該検査項目ごとの近傍群を生成するカテゴリー分け近傍群生成部を更に備えたものであればよい。
【００３０】
予め用意できるデータベースにおいて、参照被験者が疾患を有しているかどうかについての情報がない場合にも、参照被験者と検査対象被験者がどれくらい似ているかについて評価し、似通っている集団からどのような疾患を有しているかを予想できるようにするには、請求項１８に記載したように複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、前記選択人数及び前記抽出部において合致している前記参照被験者の識別子が登場する回数に基づいて、前記検査対象被験者と、前記参照被験者と間の類似度を算出する類似度算出部を備えることを特徴とする診断支援装置であればよい。
【００３１】
全参照被験者間の類似度によって自己組織化マップ等を作成できるようにし、ある特徴を有するグループが疾患を有する可能性が高いといった推論を可能とするには、請求項１９に記載しているように、ある参照被験者と前記検査対象被験者とを交換して、前記参照検査結果記憶部及び前記対象検査結果記憶部にそれぞれの検査結果を記憶させる交換部とを更に備え、前記交換部がすべての参照被験者を検査対象被験者とするとともに、すべての参照被験者間の類似度を前記類似度算出部に算出させるものであればよい。
【発明の効果】
【００３２】
このように本発明の診断支援装置によれば、参照被験者の検査項目ごとの検査結果を数値順に並び変えた上で、検査対象被験者の検査結果と順序距離が近いもので近傍群を作って、それらの近傍群を比較して当該検査対象被験者に似ている参照被験者を抽出することで、疾患度の推定算出を行うようにしているので、例えば参照被験者のデータに複数の塊が形成されるような偏りがあったとしても検査対象被験者に対して均等に扱うことができ、検査対象被験者の疾患度の推定をよりうまく行うことができるようになる。また、検査の数値そのものではなく、順序から演算を行っているので、計算負荷を大幅に減らして、高速で疾患度の推定を行うことができる。
【図面の簡単な説明】
【００３３】
【図１】本発明の第１実施形態に係る診断支援装置を示す機能ブロック図。
【図２】第１実施形態の診断支援装置のデータベースに記憶されている各検査項目の検査結果の一例を示す表。
【図３】第１実施形態の診断支援装置のデータベースに記憶されている各検査項目の検査結果を並び変えた状態を示す表。
【図４】第１実施形態の診断支援装置が生成した各検査項目の近傍群から抽出された参照被験者及び疾患度の算出結果を示す表。
【図５】第１実施形態の診断支援装置が生成した各検査項目の近傍群から抽出された参照被験者及び疾患度の算出結果の別の例を示す表。
【図６】第１実施形態の診断支援装置における表示部の疾患度の表示方法を示す模式図。
【図７】第１実施形態の診断支援装置の動作を示すフローチャート。
【図８】第１実施形態の変形実施形態に係る診断支援装置を示す機能ブロック図。
【図９】本発明の第２実施形態に係る診断支援装置を示す機能ブロック図。
【図１０】第２実施形態の診断支援装置の動作を示すフローチャート。
【図１１】本発明の第３実施形態に係る診断支援装置を示す機能ブロック図。
【図１２】第３実施形態の診断支援装置の動作を示すフローチャート。
【図１３】本発明の第４実施形態に係る診断支援装置を示す機能ブロック図。
【図１４】第４実施形態の診断支援装置の動作を示すフローチャート。
【図１５】第５実施形態の診断支援装置の類似度の表示方法の一例を示す模式図。
【発明を実施するための形態】
【実施例】
【００３４】
以下、本発明の第一実施形態について図面を参照して説明する。
【００３５】
第一実施形態の診断支援装置１００は、ＣＰＵ、内部メモリ、ＨＤＤ等の外部記憶装置１０３、通信ネットワークに接続するためのモデム等の通信インタフェース、ディスプレイ、マウスやキーボードといった入力手段等を具備したいわゆるコンピュータによりその機能を実現してあるものである。
【００３６】
図１に示すように、前記コンピュータは、少なくとも査対象被験者がある疾患を有しているかどうかを示す疾患度について推定算出する演算部１としての機能を発揮するものである
【００３７】
前記演算部１は、複数の検査項目についての検査結果のデータを記憶するデータベース部２と、前記データベース部２のデータを加工し、数値順に並べた検査結果列に基づいて疾患度の演算を行う処理部３と、疾患度を３次元表示する表示部４とから構成してある。
【００３８】
前記データベース部２は、疾患度が判定される検査対象被験者の各種検査結果が記憶してある対象検査結果記憶部２２と、前記疾患度の推定するための元データとなる複数の参照被験者の検査結果が記憶してある参照検査結果記憶部２１とからなるものである。
【００３９】
より具体的には、前記対象検査結果記憶部２２は、検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶するものである。例えば、図２に示すデータベースの一部のように識別子と検査結果を対にして記憶させてある。
【００４０】
前記参照検査結果記憶部２１は、ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶するものである。本第一実施形態では、検査項目は、例えば血液検査における各種成分である。この血液検査における各種成分の値は、疾患との因果関係が分かっているもの、分かっていないものの両方が含まれている。ここで、識別子は例えば仮に付された患者番号であり、個人を特定できないものであったとしても、少なくともある検査結果がどの参照被験者のものであるかが判別できるものであれば構わない。また、前記非疾患保持者とは、疾患保持者が保持している疾患を保持していないもののことであり、別の疾患を有しているものであっても構わないし、健常者であっても構わない。
【００４１】
前記処理部３は、全参照被験者と検査対象被験者の検査結果を数値順に並べ替えて、検査項目ごとの検査結果列を生成する並べ替え部３１と、検査結果列から前記参照被験者の検査結果と順序距離が小さい検査結果を有する参照被験者の近傍群を生成する近傍群生成部３２と、各近傍群に共通して表れる参照被験者を抽出する抽出部３３と、抽出された参照被験者の構成から疾患度を推定算出する疾患度推定算出部３４とから構成してある。
【００４２】
各部について具体例を参照しながら説明する。以下の説明では、簡単のためにデータベースの一部だけを使用した例で説明するが、データベースの大きさを拡張しても同様に成り立つ話である。
【００４３】
前記並べ替え部３１は、図２に示されるような前記対象検査結果記憶部２２及び前記参照検査結果記憶部２１に記憶されている各検査結果のデータを図３（ａ）に示すように１つに統合した後に、図３（ｂ）に示すように数値順に昇順でソートして各検査結果列を生成するようにしてある。ここで、図３では分かりやすさのために、検査結果の数値及び疾患の有無をかっこ書きで記載してあるが、以下の工程では数値データ自体は用いられておらず、各識別子が表れる順番のみによって処理が行われる。
【００４４】
前記近傍群生成部３２は、前記並べ替え部３１により生成された各検査結果列から前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成するものである。ここで、順序距離が小さいとは、数値順に並べられた状態において前記検査対象被験者の検査結果と順番が近いもののことである。例えば、図３（ｂ）に記載されている検査項目３の検査結果列において、検査対象被験者Ｓ０００１の数値データは３．４であり、参照被験者Ｐ０００５、Ｐ０００３、Ｐ０００６の数値データはそれぞれ２．９、３．６、３．７であることから、数値データを基準としてＳ０００１と近いものを選ぶと、Ｐ０００３、Ｐ０００６、Ｐ０００５の順となる。しかしながら順序距離で選ぶと、Ｐ０００３とＰ０００５は等距離にあり、Ｐ０００６が最も離れているものとなる。
【００４５】
ここで、近傍群生成部３２は、検査対象被験者のデータのある地点を中心として、選択人数がｎ人となるまで順序距離が近いものを選択していく。この際、前記近傍群生成部３２は、順序距離が近い順に検査結果が検査対象被験者のデータに対して小さい側、大きい側（図面では上側、下側）から順に１人ずつ選んでいきｎ人となった時点で各検査項目において近傍群を生成する。なお、片側においてこれ以上参照被験者を選択できない場合には、常にもう片側の参照被験者で順序距離の小さいものを近傍群生成部３２は選択するようにしてある。このように構成してあるので、例えば、ｎが３人の場合には、図３（ｂ）の検査結果列から図４（ａ）に示されるような近傍群が検査項目ごとに生成されることになる。
【００４６】
前記抽出部３３は、１つの検査項目の近傍群において含まれている前記参照被検者の識別子、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出するように構成してある。ここで、識別子を抽出する条件は変更可能なものであり、本実施形態では１つの検査項目の近似群に表れているだけで、参照被験者の識別子を抽出する場合から、全ての検査項目に共通して表れている識別子のみを抽出する場合まで変更される。別の表現をすると、検査項目数ｍがＭ項目であるとすると、１、２、３・・・・Ｍ項目までそれぞれの条件で近傍群からの抽出を行うようにしてある。例えば、２項目以上で合致しているものを抽出する条件の場合、図４（ａ）に示される各検査項目の近傍群から図４（ｂ）に示すように各識別子が抽出されることになる。抽出する条件が２項目のまま、選択人数ｎが４人に拡げられると図５に示されるようになる。
【００４７】
前記疾患度推定算出部３４は、前記抽出部３３により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出するものである。より具体的には、前記疾患度推定算出部３４は、参照被験者がＮ人、検査項目数がＭ個であるとすると、前記近傍群生成部３２が近傍群を作る条件である選択人数が１〜Ｎ人の場合があり、前記抽出部３３の抽出条件が１〜Ｍ通りあることからそれぞれの条件でＮ×Ｍ通りの疾患度を推定算出するように構成してある。本実施形態では、前記疾患度は近傍群内疾患発現率と参照被験者内における疾患保持者の割合とを比較して算出するようにしてある。すなわち、前記疾患度推定算出部３４は、全参照被験者における疾患保持者の比率である全参照被験者疾患発現率と、前記近傍群内疾患発現率とに基づいて疾患度を推定算出するものであり、前記近傍群内疾患発現率を全参照被験者疾患発現率で割ったものを検査対象被験者が疾患を有するかどうかを判断するための疾患度（インデックス）としている。このようにすることで、例えば、近傍群内に疾患保持者が元のデータベース内よりも多い割合で存在している場合には、疾患度は大きな値になる。図４、図５を比較すると分かるように選択人数ｎ及び検査項目数ｍの条件ごとに疾患度は変化する可能性がある。
【００４８】
前記表示部４は、前記疾患度をＺ軸に、前記疾患度を算出する際に前記近傍群生成部３２にて使用した選択人数ｎを別のＸ軸に、前記疾患度を算出する際に前記抽出部３３におい識別子を抽出する際の基準とした検査項目数ｍをＹ軸として３次元表示をするものである。図６に示すように疾患度の分布傾向により検査対象被験者が疾患を有するかどうかを簡単に判断することができる。例えば、ある疾患において当該疾患を有していない検査対象被験者について疾患度が算出されると、図６（ａ）に示すように近傍群として選択される人数ｎが大きく（Ｘ軸の値が大きい）、合致と判断する検査項目数ｍが小さい（Ｙ軸の値が小さい）領域（以下第１領域とする）においては、疾患度（Ｚ軸の値）がほぼ１となっており、選択人数ｎが小さく、合致条件ｍが大きい領域（以下第２領域とする）ではほとんど疾患度が０となっている。従って、図６（ａ）に示されるように図面視において手前側が山となっており、斜め奥側へとなだらかに下降する勾配が形成されていることが分かる。
【００４９】
一方、ある疾患を有している検査対象被験者の場合は、図６（ｂ）に示すように第１領域において疾患度が略１を示している点では疾患を有していない場合と同じものの第２領域において選択人数ｎと合致条件ｍが略同じ値を取る領域において疾患度が１よりも大きい値を取っている。従って、図６（ｂ）は、図面視において手前側が平面になっており、斜め奥側へと上昇する勾配が形成されていることが分かる。
【００５０】
このように疾患度を全ての選択人数ｎ、合致条件ｍで３次元表示してみると疾患を有しているかどうかによって顕著な分布傾向の差が表れることから視覚的に非常に分かりやすく、検査対象被験者の診断を支援することができる。
【００５１】
また、本明細書では分かりやすさのためグラフの三次元形状のみを記載しているが、色によって視覚的な補助をしても構わない。例えば、図６（ｂ）に示されるように検査対象被験者が疾患を有している場合には疾患度が１よりも大きい領域が大きくなることや、疾患度が１よりも大きいということは、参照被験者の中で疾患を有している人の割合よりも近傍群から抽出された集団の方が疾患を保持している人の割合が大きいことを示している事等から１つの重要な基準であると考えられる。そこで、疾患度のうち１以上のものに関しては、色を変化させて１よりも小さい領域と区別できるようにすれば、疾患の有無を判断しやすくなると考えられる。
【００５２】
次に、このように構成された本実施形態の診断支援装置１００の動作について図７のフローチャートを参照しながら簡単に説明する。
【００５３】
まず、並べ替え部３１がデータベース部２を参照して検査項目ごとに数値順の検査結果列を生成する（ステップＳ１）。次に近傍群生成部３２と抽出部３３の初期設定がリセットされ、ｎ＝１、ｍ＝１から開始される（ステップＳ２）。前記近傍群生成部３２は設定されている選択人数ｎに基づいて検査結果列から近傍群を生成する（ステップＳ３）。前記抽出部３３は各近傍群においてｍ項目以上の検査項目で共通する参照被験者の識別子を抽出する（ステップＳ４）。前記疾患度推定算出部３４は、近傍群から抽出された疾患保持者の割合である近傍群内疾患発現率を全参照被験者における疾患保持者の割合である全参照被験者疾患発現率で割って疾患度を推定算出する（ステップＳ５）。選択人数ｎが参照被験者の総数Ｎかどうかの判断が行われ（ステップＳ６）、そうでない場合はｎを１人増やして（ステップＳ７）再び近傍群を作り直し、識別子の抽出が再度行われて、別の疾患度が算出される。ｎがＮと等しくなった場合には、抽出部３３における合致と判断する条件である項目数ｍがＭと等しいかどうかが判断され（ステップＳ８）、異なる場合にはｍを１だけ増やして再び疾患度の推定算出が行われる。最終的に全ての選択人数ｎ及び合致条件の項目数ｍの組み合わせについて疾患度が推定算出されると、前記表示がそれらのデータに基づいて疾患度の３次元表示を行う（ステップＳ９）。
【００５４】
このように構成された診断支援装置１００によれば、各検査項目の検査データを数値順に並べた上で、検査対象被験者と順序距離の小さいものから選択人数ｎだけ順番に選択していくことで近傍群を作成し、その近傍群から所定の項目数ｍ以上で登場する検査対象被験者と類似していると考えられる参照被験者を抽出し、抽出された参照被験者の疾患保持者の割合と、全体の割合とを比較することで疾患度の推定を行っている。このため、計算負荷をあまり高くすることなく、しかも、参照被験者の偏りがあったとしても検査結果の数値が小さいもの又は大きいものだけに偏ったような近傍群が生成されるのを防ぎ、全ての参照被験者を略均等に評価できる近傍群を生成することができる。従って、このような参照被験者を均等に評価した近傍群を用いているので、検査対象被験者が疾患を保持しているかどうかを精度よく判定することができる。
【００５５】
また、参照被験者の検査結果における偏りや傾向について従来であれば、極端なデータを無視したり、様々な分布を仮定して補正したりした上で検査対象被験者が疾患を有しているかどうかについて判定しないと有意義な結果が得られにくかったが、本実施形態の診断支援装置によれば、そのような操作を無くすことができるようになる。従って、従来の診断支援装置においては医師の経験や知見に依存して診断精度を向上させていた部分が大きかったが、本実施計形態の診断支援装置では順序距離に着目していることによりそのような問題を軽減し、精度の良い診断を行いながらも自動化をより進めることができる。
【００５６】
第１実施形態の変形実施形態について説明する。第１実施形態では選択人数ｎ及び参照被験者が各近傍群において合致していると判断する検査項目数ｍについてそれぞれｎ×ｍ点において疾患度（インデックス）を算出し、その算出結果を３次元グラフで表示するように構成してあるが、例えば、１つの値だけに注目して検査対象被験者が疾患を有するかどうかを判断できるようにするには、疾患度の平均値を求める平均値算出部を更に備えたものであればよい。平均値算出部は、有意に作用しないと考えられる（ｎ、ｍ）組の疾患度を無視するように構成してある。例えば、近傍群の選択人数ｎが小さく、合致条件である検査項目数ｍが大きい等の条件が厳しい場合には、前記抽出部３３が参照被験者の識別子を全く抽出できないことがある。このような場合、疾患度は全て０となってしまうので、平均の対象外としてある。より具体的には、合致とする検査項目数ｍに対して、全ての選択人数ｎごとにおける疾患度の平均を取った後に、全ての検査項目数ｍごとの平均された疾患度をさらに平均して全体の平均値を算出するように構成してある。
【００５７】
別の平均値の算出方法としては、前記検査項目数ｍ又は選択人数ｎを変化させて前記抽出部３３により抽出された識別子の参照被験者が疾患保持者だった場合のみ疾患度を算出するようにしても構わない。
【００５８】
演算回数を減らし、大規模なデータベースを用いた疾患度の判定を行う場合でも高速に平均値を算出するためのさらに別の平均値の算出方法としては、合致とする検査項目数ｍを固定しておき、近傍群の大きさを決める選択人数ｎを１つずつ大きくしていく際に、新たな合致者が発生した場合のみ平均値を算出するように構成したものであればよい。つまり、ある選択人数ｎ−１とｎとで前記抽出部３３が抽出する参照被験者に変化が無い、又は、抽出される参照被検査者が増えたとしても合致条件数ｍに達するものが増えなかった場合には、疾患度又は平均値を算出する演算を行わないように構成してある。このように構成されたものであれば、ある合致条件数ｍに対して、多くとも参照被験者の総数であるＮ回までしか演算を行う必要が無いのでより高速化を見込むことができる。
【００５９】
また、前記第１実施形態では疾患度は近傍群から抽出された参照被験者における疾患保持者の比率と、全参照被験者における疾患保持者の比率との比を取ることで算出されていたが、例えば、各比率の差を取るようにしても構わない。
【００６０】
データベースによっては、全ての参照被験者について各検査結果項目が一致していないことも多い。このような場合、ある患者の存在していない検査項目の検査結果に対する扱い方は以下のような方法が考えられる。
【００６１】
すなわち、前記参照検査結果記憶部２１に記憶されている所定の参照被験者の検査項目数が、対象検査結果記憶部２２に記憶されている前記検査対象被験者の検査項目数よりも少ない場合には、前記疾患度推定算出部３４が、当該参照被験者に関しては記憶されている検査項目数内では、疾患度の算出に用いられるとともに、前記検査項目数よりも多いときには、疾患度の算出に用いないように構成されているものであればよい。
【００６２】
より具体的には、所定の参照被験者と検査対象被験者との間で共通して存在している検査項目の検査結果により前記疾患度推定算出部３４が疾患度を推定算出するものであり、その際は全参照被験者の中にその参照被験者を含めており、検査対象被験者のみが有する検査項目に対しては、疾患度の算出においてその参照被験者を全参照被験者の中から除いた形で疾患度を算出するように構成してある。
【００６３】
また、検査対象被験者の検査項目のデータが参照被験者の検査項目のデータよりも少ない場合には、検査対象被験者の検査項目データを基準として疾患度を算出するための検査項目を決定すればよい。
【００６４】
すなわち、対象検査結果記憶部２２に記憶されている前記検査対象被験者の検査項目数が、前記参照検査結果記憶部２１に記憶されている所定の参照被験者の検査項目数よりも少ない場合には、前記検査対象被験者の検査項目に対応する前記参照被験者の検査項目のデータを用いて前記疾患度推定算出部３４が疾患度を算出するものであればよい。
【００６５】
第１実施形態では、検査項目ごとの検査結果が大小を比較することのできる数値情報からなる数値検査結果だけを用いて疾患度の推定を行っていたが、実際の検査項目においては、陰性か陽性かといった２値の検査や生活習慣に対する質問のように複数の選択肢であり大小を比較できないようなカテゴリー分けに関する検査結果も存在する。カテゴリー分けに関する検査項目としては、例えば、食習慣、趣味、嗜好、行動形式等の調査を挙げることができ、このような調査に対する回答は（ａ）朝食重視（ｂ）昼食重視（ｃ）おやつ重視（ｄ）夕食重視（ｅ）夜食重視等のようにどの回答も並列であり、数値があり、大小を比較できる数値検査結果のように扱うことができない。
【００６６】
このようなカテゴリー分け検査結果も疾患度の推定に用いることができるようにするには、図８に示すように、前記参照検査結果記憶部２１及び対象検査結果記憶部２２に記憶されている検査項目の検査結果が、大小を比較できる数値情報からなる数値検査結果と、カテゴリー分けを示すカテゴリー分け検査結果とを含むものであり、前記カテゴリー分け検査結果を有する検査項目について、前記検査対象被験者と前記参照被験者とのカテゴリー分け検査結果が同値であるか否かに基づいて当該検査項目ごとの近傍群を生成するカテゴリー分け近傍群生成部３６を更に備えたものであればよい。
【００６７】
より具体的には、前記カテゴリー分け近傍群生成部３６は、前記検査対象被験者の回答した選択肢と前記参照被験者の回答した選択肢が同じであり、同値のものを近傍群として生成するものである。ここで、近傍群生成部３２が近傍群を生成するための選択人数をｎ人と設定している場合、前記カテゴリー分け近傍群生成部３６も可能であればこの基準を採用するようにしてある。しかしながら、非常に多くの参照被験者が検査対象被験者と同じ選択肢を選んでいる場合には、選択人数ｎ人内に選択することが困難な場合がある。このように選択人数ｎよりも同値である人数が多い場合には例外的に、カテゴリー分け近傍群生成部３６は、全ての同値であった参照被験者の識別子を抽出し近傍群を生成する。従って、選択人数によっては他の数値検査結果により生成される近傍群内の人数とカテゴリー分け検査結果により生成される近傍群内の人数が異なっている場合も存在することになる。数値検査結果についても同じ値の参照被験者が複数人おり、選択人数よりも多い場合には例外的に近傍群生成部３２も全ての参照被験者を含めて近傍群を生成してもよい。
【００６８】
このように数値検査結果とカテゴリー分け検査結果のそれぞれから形成された各近傍群から前記抽出部は一致している参照被験者の識別子を抽出し、前記疾患度推定部は疾患度の推定算出を行わせることにより、大小の存在しない検査結果であっても同値であるかどうかを基準することで疾患度の推定算出を行うことができる。つまり、より広範囲の検査結果を使うことができるので、疾患度の精度をさらに良くすることができるようになる。
【００６９】
前記第１実施形態では、全ての参照被験者に基づいて近傍群を生成するように構成してあったが、例えば、検査対象被験者と順序距離又は数値が近い参照被験者のグループを予め抽出しておき、その中で近傍群を作るようにしても構わない。加えて、全ての選択人数ｎ及び合致条件となる検査項目数ｍで疾患度を算出しなくても構わない。例えば、いくつかの組み合わせについてのみ疾患度の算出を行うようにしてもよい。また、参照検査結果記憶部に記憶されている識別子を予め検査結果に基づいて数値順に並べた状態で記憶させておき、前記並べ替え部は、検査対象被験者の識別子を検査項目ごとに数値順を崩さないように挿入するものであっても構わない。
【００７０】
次に本発明の第２実施形態について説明する。
【００７１】
第２実施形態の診断支援装置１００では、図９に示すように前記第１実施形態に対してさらに、前記演算部１に用いられる検査結果のデータについて取捨選択を行う等して疾患度に関する演算の最適化を行うための最適化部５を更に備えたものである。
【００７２】
前記最適化部５は、鑑別精度を算出する鑑別精度算出部５１と、前記鑑別精度算出する鑑別精度に基づいて、除外した方が鑑別精度を向上させる項目を除去する検査項目除去部５２と、除去された検査項目のうち１つを元に戻した状態で再び鑑別精度を算出する鑑別精度算出部５３と、前記鑑別精度算出部５３によって再算出された鑑別精度に基づいて元に戻した方がよい検査項目をデータベースに残す検査項目付加部５４とから構成してある。
【００７３】
鑑別精度算出部５１は、前記疾患度推定算出部３４が全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である基準鑑別精度と、検査項目のうち所定項目数の検査結果を用いずに算出した疾患度の鑑別精度である比較鑑別精度のそれぞれを算出するものである。ここで鑑別精度の算出方法としては、例えば、ＲＯＣ（receiver operating characteristic; 受信者動作特性）解析を行うようにしてある。本実施形態では、鑑別精度算出部５１は、検査項目のうち１項目だけを除外した状態で、前記演算部１により疾患度の算出を行わせて、比較鑑別精度を算出するように構成してあり、全検査項目の中から１つずつ除外する検査項目を変え、それぞれの鑑別精度を算出している。
【００７４】
前記検査項目除去部５２は、前記基準鑑別精度と、前記比較鑑別精度とを比較して、前記比較鑑別精度が前記基準鑑別精度よりも鑑別精度が向上した場合には、前記比較鑑別精度を算出する際に用いなかった検査項目の検査結果を前記参照検査結果記憶部２１又は前記対象検査結果記憶部２２から除外するものである。より具体的には、前記検査項目除去部５２は、１つの基準鑑別精度と、除去された検査項目の異なるそれぞれの比較鑑別精度とを比較し、前記基準鑑別精度よりも比較鑑別精度が悪かった場合には、その検査項目のデータを前記参照検査結果記憶部２１又は前記対象検査結果記憶部２２から除外するものである。ここで除外するとは、記憶部から該当するデータを消去することや、別の記憶領域に移し替える等して、疾患度の算出にある検査項目のデータが用いられないようにすることを含む概念である。
【００７５】
前記鑑別精度算出部５３は、前記検査項目除去部５２が除外した検査項目の検査結果のうち１つを、残された検査項目の結果に加えて前記疾患度推定算出部３４が算出した疾患度の鑑別精度である再鑑別精度を算出するものである。
【００７６】
前記検査項目付加部５４は、前記比較鑑別精度と前記再鑑別精度とを比較して、前記再鑑別精度が前記比較鑑別精度よりも鑑別精度が向上した場合には、加えた検査項目を前記参照検査結果比較部又は前記対象検査結果記憶部２２に戻すものである。
【００７７】
このように構成された最適化部５の動作について図１０のフローチャートを参照しながら説明する。
【００７８】
まず、全ての検査項目のデータを用いて前記演算部１が疾患度を算出する。ここで、疾患度は、ある一組の近傍群生成部３２が生成する近傍群の大きさを決定する選択人数ｎと、前記抽出部３３が各近傍群から合致している参照被験者を抽出する基準である項目数ｍにより算出されたものを代表して算出してもよいし、全ての選択人数ｎと項目数ｍにおいてそれぞれ疾患度を算出し、それらの疾患度を平均した値としてもよい（ステップＳＴ１）。
【００７９】
前記演算部１にて算出された疾患度について、前記鑑別精度算出部５１がＲＯＣ解析を行うことにより第１基準鑑別精度を算出する（ステップＳＴ２）。次に、基準鑑別精度を算出するために用いられた検査項目に１〜Ｍ番までの番号を付与して、ｋ＝１に初期設定した状態にする（ステップＳＴ３）。ｋ番目の検査項目を除いた状態での疾患度を演算部１が算出し(ステップＳＴ４)、鑑別精度算出部５１がｋ番目の検査項目を使用していない状態での鑑別精度である比較鑑別精度を算出する（ステップＳＴ５）。ｋが全検査項目数Ｍと等しくなるまで、ある１つの検査項目を除いた状態での比較鑑別精度の算出を繰り返す（ステップＳＴ６、ステップＳＴ７）。
【００８０】
前記検査項目除去部５２が、第１基準鑑別精度と全ての比較鑑別精度とを比較し（ステップＳＴ８）、第１基準鑑別精度よりも所定値以上、鑑別精度の良い比較鑑別精度が存在するかどうかの判断を行う（ステップＳＴ９）。存在しない場合には、そこで検査項目の最適化が終了し、存在している場合には、前記検査項目除去部５２が、ある検査項目を省くことにより比較鑑別精度が良くなった検査項目を前記参照結果記憶部及び前記対象検査結果記憶部２２から除外する（ステップＳＴ１０）。
【００８１】
検査項目から除外されたデータが存在する場合には、前記演算部１が残っている検査項目を全て用いて疾患度の算出を行い(ステップＳＴ１１)、前記鑑別精度算出部５３が、除外されずに残った検査項目を全て使用して第２基準鑑別精度を算出する（ステップＳＴ１２）。ここで、除外された検査項目について１〜Ｌ番までの番号が付与されるとともに、ｌが１に初期設定される（ステップＳＴ１３）。
【００８２】
次に、ｌ番目の除外された検査項目を残っている検査項目に戻した状態で、前記演算部１が疾患度を算出する（ステップＳＴ１４）。そして、ステップＳＴ１４で算出された疾患度を用いて、前記鑑別精度算出部５３は、ｌ番目の除外された検査項目を戻した状態での再鑑別精度を算出する（ステップＳＴ１５）。ｌが除外された全検査項目数Ｌとなるまで（ステップＳＴ１６、ステップＳＴ１７）順番に１つずつ除外された検査項目を戻した状態での再鑑別精度が算出される。
【００８３】
前記検査項目付加部５４が第２基準鑑別精度と算出された各再鑑別精度とを比較し（ステップＳＴ１８）、第２基準鑑別精度よりも所定値以上良い再鑑別精度が存在しない場合には、最適化を終了する（ステップＳＴ１９）。再鑑別精度が第２基準鑑別精度よりも所定値以上良くなっている場合には、前記検査項目付加部５４が、再鑑別精度の方が良くなった検査項目のデータを参照検査結果記憶部２１及び対象検査結果記憶部２２に全て戻し（ステップＳＴ２０）、再びステップＳＴ１からの工程を最適化が終了されるまで繰り返す。
【００８４】
このように、鑑別精度の算出を繰り返すことにより検査対象被験者が疾患を有しているどうかを判定する精度に対して、あまり寄与していない又は悪影響を与えている検査項目のデータが除去され、検査項目のデータを自動で最適化することができる。
【００８５】
次に本発明の第３実施形態について説明する。第３実施形態は、前記第２実施形態における最適化部５が検査項目間の重みづけを行うための構成を備えたものである。
【００８６】
前記最適化部５は、図１１に示すようにある検査項目の検査結果を、前記疾患度推定算出部３４が全ての検査項目の検査結果を等しい回数だけ用いて算出した疾患度の鑑別精度である第３基準鑑別精度と、更に別の検査項目として追加して前記疾患度推定算出部３４が算出した疾患度の鑑別精度である重み付け鑑別精度を算出する重み付け鑑別精度算出部５５と、前記重み付け鑑別精度が、重み付けを行わずに算出した疾患度の鑑別精度よりも向上した場合には、その検査項目の検査結果を複数の検査項目として前記参照検査結果記憶部２１又は前記対象検査結果記憶部２２に記憶させる検査項目重み付け部５６とを備えたものである。
【００８７】
前記鑑別精度算出部５１は、前記演算部１がある検査項目のデータをコピーして２項目分として扱うようにした状態で算出された疾患度に対する鑑別精度である重み付け鑑別精度を算出するように構成したものである。また、何も重み付けを行わずに算出した疾患度に対する鑑別精度である第３基準鑑別精度は、第２実施形態における第１基準鑑別精度に相当するものであるが、例えば、全ての検査項目を２回ずつ使用して重み付けをつけずに第３基準鑑別精度を算出するようにしてもかまわない。
【００８８】
前記検査項目重み付け部５６は、前記第１基準鑑別精度と前記重み付け鑑別精度とを比較し、前記重み付け鑑別精度の方が鑑別精度の向上があった場合には、その検査結果を２重にカウントできるように別の検査項目として前記参照検査結果記憶部２１及び前記対象検査結果記憶部２２にコピーさせて記憶させるものである。
【００８９】
このように構成された最適化部５による各検査項目間の重み付けについて図１２のフローチャートを参照しながら説明する。
【００９０】
まず、前記演算部１にて全ての検査項目のデータを１回ずつ使用して疾患度の算出が行われる（ステップＰＨ１）。その疾患度を用いて前記重み付け鑑別精度算出部５５は、第３基準鑑別精度を算出する（ステップＰＨ２）。次に、全ての検査項目について番号ｍが１〜Ｍまで付され（ステップＰＨ３）、ｍ番目の検査項目を２回使用するようにした状態で前記演算部１により疾患度が算出される（ステップＰＨ４）。その疾患度に基づいて、前記重み付け鑑別精度算出部５５はｍ番目の検査項目に対する重み付け鑑別精度を算出する（ステップＰＨ５）。重み付けが行われた検査項目の番号ｍが全検査項目数Ｍと一致しているかどうかの判断が行われ（ステップＰＨ６）、ｍがＭに一致するまで順番に重み付けを各検査項目の重み付けを行い（ステップＰＨ７）、重み付け鑑別精度が算出される。
【００９１】
次に、前記検査項目重み付け部５６は前記第３基準鑑別精度と、各重み付け鑑別精度との比較を行い（ステップＰＨ８）、第３基準鑑別精度よりも所定値以上に向上した重み付け鑑別精度が無い場合には重み付けが終了され（ステップＰＨ９）、向上したｍ番目の項目については前記参照検査結果記憶部２１及び前記対象検査結果記憶部２２にコピーし項目数を増加させて記憶させる（ステップＰＨ１０）。
【００９２】
再びステップＰＨ３に戻り、新たな項目数で重み付けを開始し、鑑別精度の向上が見られなくなるまで検査項目の重み付けが繰り返される。
【００９３】
このように第３実施形態によれば、自動で項目間の重み付けを繰り返すことにより鑑別精度を向上させることができ、より対象被験者の疾患度の推定精度を向上させることができる。
【００９４】
本発明の第４実施形態について説明する。
【００９５】
第４実施形態の診断支援装置１００は、図１３に示すように前記第１実施形態と前記参照検査結果記憶部２１に記憶されるデータについて、予め参照被験者がある疾患を有しているかどうかの情報が記憶されていない点と、前記疾患度推定算出部３４の替わりに参照被験者と検査対象被験者との類似度を推定算出する類似度算出部３５を備えている点、及び表示部４が各参照被験者と検査対象被験者との類似度を表示する類似度表示部６である点が異なる。言い換えると第１実施形態の診断支援装置１００は教師あり学習に基づいた診断支援装置１００であるのに対して、第４実施形態の診断支援装置１００は教師なし学習に基づいて、類似している参照被験者の集合から検査対象被験者がどのような疾患を有しているかについて類推することを支援するためのものである。
【００９６】
第１実施形態の異なる部分についてのみ具体的に説明する。
【００９７】
前記参照検査結果記憶部２１には、複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶されており、参照被験者間において特定の疾患があるかないかについての基準は設けていない。
【００９８】
前記類似度算出部３５は、前記選択人数及び前記抽出部３３において合致している前記参照被験者の識別子が登場する回数に基づいて、前記検査対象被験者と、前記参照被験者と間の類似度を算出するものである。ここで類似度は、参照被験者の総数をＮ、近傍群を生成するための選択人数をｎ、総検査項目数をＭ、近傍群間において検査対象被験者とある参照被検査者が合致していると判断する検査項目数をｍとすると、（Ｎ／ｎ）^ｍからなる距離指数に基づいて表されるものである。なお、ある検査項目数ｍにおける距離指数は、選択人数ｎを大きくしていった時に初めて検査対象被験者と参照被験者とが合致していると判断されたときの値のみを算出するようにしている。本実施形態では、検査項目数ｍは１〜Ｍの場合全てについて前記距離指数を算出し、その平均値を類似度として使用している。
【００９９】
前記類似度表示部６は、全参照被験者のうち類似度の高い上位数％を提示し、検査対象被験者と各検査項目で良く似た傾向を示しているものを示すようにしてある。このようにして、検査対象被験者と良く似た傾向を持った参照被験者がピックアップされるので、例えば、この参照被検査者らが有している疾患を検討することにより検査対象被験者が有している可能性のある疾患を類推する事を支援することが可能となる。
【０１００】
このように構成された第４実施形態の診断支援装置１００の動作について図１４に示すフローチャートを参照しながら説明する。
【０１０１】
まず、前記並べ替え部３１が前記参照検査結果記憶部２１及び前記対象検査結果記憶部２２に記憶されているデータを検査項目ごとに数値順に並べ替えて検査項目ごとの検査結果列を生成する（ステップＳＳ１）。近傍群生成部３２が近傍群を作るための選択人数ｎを１に、抽出部３３における各近傍群に含まれる参照被験者が合致と見なされる条件の検査項目数ｍを１と初期設定する（ステップＳＳ２）。前記近傍群生成部３２は、検査結果列から設定されている選択人数であるｎ人を検査対象被験者との順序距離が近い順に選択して近傍群を生成する（ステップＳＳ３）。前記抽出部３３が、ｍ項目以上の近傍群において共通する参照被験者の識別子のうち、選択人数ｎになった時点で初めて表れたもののみを抽出する（ステップＳＳ４）。前記抽出部３３が抽出した識別子ごとに類似度算出部３５が参照被験者の総数Ｎ、選択人数ｎ、合致条件である検査項目数ｍに基づいて検査対象被験者との類似度を算出する（ステップＳＳ５）。ある検査項目数ｍについて合致していると判断する条件において、選択人数ｎを１〜Ｎまで変化させて、類似度の算出を繰り返す（ステップＳＳ６、ステップＳＳ７）。また合致条件の項目数ｍも１〜Ｍまで変化させて類似度の算出を繰り返す（ステップＳＳ８、ステップＳＳ９）。最後に類似度表示部６が検査対象被験者と類似度の高い参照被験者の上位数％を提示して終了する（ステップＳＳ１０）。
【０１０２】
このようにして、第４実施形態の診断支援装置１００によればデータベース部２に疾患の有無に関する情報がなかったとしても、検査対象被験者と傾向の似通った人を探し、傾向を発見するための手助けとなるような教師なし学習による診断支援を行うことができる。
【０１０３】
第５実施形態の診断支援装置１００について説明する。第４実施形態の診断支援装置１００では、ある一人の検査対象被験者と複数の参照被験者との類似度を評価するものであったが、第５実施形態の診断支援装置１００では全ての参照被験者間の類似度を算出し、その類似度に基づいて自己組織化マップを作成するためのものである。
【０１０４】
具体的には、第４実施形態の診断支援装置１００が更に、ある参照被験者と前記検査対象被験者とを交換して、前記参照検査結果記憶部２１及び前記対象検査結果記憶部２２にそれぞれの検査結果を記憶させる交換部とを更に備え、前記交換部がすべての参照被験者を検査対象被験者とするとともに、すべての参照被験者間の類似度を前記類似度算出部３５に算出させるものであればよい。このようなものであれば、全参照被験者間の類似度を算出することができ、例えば、前述した類似度は一種の距離指数であることを利用して、各参照被験者間の平面上の距離を距離指数で表し、図１５に示されるような２次元平面上に配置させれば、距離指数の近いもの同士により疾患などの傾向が揃った集団を作ることができるようになる。この形成された集団から様々な疾患と検査項目の結果との関係を知ることができ、ある疾患を有する患者の特徴を抽出する事が可能となる。
【０１０５】
その他、本発明の趣旨に反しない限りにおいて、様々な変形や実施形態の組み合わせを行っても構わない。
【符号の説明】
【０１０６】
１００・・・診断支援装置
２１・・・参照検査結果記憶部
２２・・・対象検査結果記憶部
３１・・・並べ替え部
３２・・・近傍群生成部
３３・・・抽出部
３４・・・疾患度推定算出部
３５・・・類似度算出部
３６・・・カテゴリー分け近傍群生成部
４・・・表示部
５１・・・鑑別精度算出部
５２・・・検査項目除去部
５３・・・再鑑別精度算出部
５４・・・検査項目付加部
５５・・・重み付け鑑別精度算出部
５６・・・検査項目重み付け部

【特許請求の範囲】
【請求項１】
ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、
検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、
前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、
前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、
１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、
前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置。
【請求項２】
ある疾患を有する疾患保持者と前記疾患を有さない非疾患保持者とから構成される複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに数値順に記憶する参照検査結果記憶部と、
検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、
前記検査項目ごとに、前記検査対象被験者の検査結果を、前記参照被験者の各検査結果に対して数値順となるように加えて、前記検査項目ごとの検査結果列を生成する並べ替え部と、
前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、
１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、
前記抽出部により抽出された識別子のうち、前記疾患保持者の識別子が含まれる比率である近傍群内疾患発現率に基づいて、前記検査対象被験者が前記疾患を罹患している可能性を示す疾患度を推定算出する疾患度推定算出部とを備えることを特徴とする診断支援装置。
【請求項３】
前記近傍群生成部が、複数の前記選択人数ごとに近傍群を生成するように構成されている請求項１又は２記載の診断支援装置。
【請求項４】
前記近傍群生成部が、前記選択人数を一人から前記参照被験者全員まで変更して、前記選択人数ごとの近傍群を生成するように構成されている請求項１乃至３のいずれかに記載の診断支援装置。
【請求項５】
前記抽出部が、前記選択人数ごとに生成される各近傍群について複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出するように構成されている請求項１乃至４のいずれかに記載の診断支援装置。
【請求項６】
前記抽出部が、１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出するとともに、２つの検査項目から全ての検査項目までの近傍群において合致している前記参照被験者の識別子を抽出するように構成されている請求項１乃至５のいずれかに記載の診断支援装置。
【請求項７】
前記疾患度を一軸に、前記疾患度を算出する際に前記近傍群生成部にて使用した選択人数を別の一軸に、前記疾患度を算出する際に前記抽出部におい識別子を抽出する際の基準とした検査項目数を更に別の一軸として３次元表示をする表示部を更に備えた請求項１乃至６のいずれかに記載の診断支援装置。
【請求項８】
前記疾患度推定算出部が全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である第１基準鑑別精度と、検査項目のうち所定項目数の検査結果を用いずに算出した疾患度の鑑別精度である比較鑑別精度のそれぞれを算出する鑑別精度算出部と、
前記第１基準鑑別精度と、前記比較鑑別精度とを比較して、前記比較鑑別精度が前記基準鑑別精度よりも鑑別精度が向上した場合には、前記比較鑑別精度を算出する際に用いなかった検査項目の検査結果を前記参照検査結果記憶部又は前記対象検査結果記憶部から除外する検査項目除去部とを更に備えた請求項１乃至７のいずれかに記載の診断支援装置。
【請求項９】
前記疾患度推定算出部が除外されずに残った全ての検査項目の検査結果を用いて算出した疾患度の鑑別精度である第２基準鑑別精度と、前記検査項目除去部が除外した検査項目の検査結果のうち１つを、残された検査項目の結果に加えて前記疾患度推定算出部が算出した疾患度の鑑別精度である再鑑別精度を算出する再鑑別精度算出部と、
前記比較鑑別精度と前記再鑑別精度とを比較して、前記再鑑別精度が前記比較鑑別精度よりも鑑別精度が向上した場合には、加えた検査項目を前記参照検査結果記憶部又は前記対象検査結果記憶部に戻す検査項目付加部とを更に備えた請求項８記載の診断支援装置。
【請求項１０】
前記疾患度推定算出部が全ての検査項目の検査結果を同じ回数だけ用いて算出した疾患度の鑑別精度である第３基準鑑別精度と、ある検査項目の検査結果を、更に別の検査項目として追加して前記疾患度推定算出部が算出した疾患度の鑑別精度である重み付け鑑別精度を算出する重み付け鑑別精度算出部と、
前記重み付け鑑別精度が、第３鑑別精度よりも向上した場合には、その検査項目の検査結果を複数の検査項目として前記参照検査結果記憶部又は前記対象検査結果記憶部に記憶させる検査項目重み付け部とを更に備えた請求項１乃至９のいずれかに記載の診断支援装置。
【請求項１１】
前記疾患度推定算出部が、全参照被験者における疾患保持者の比率である全参照被験者疾患発現率と、前記近傍群内疾患発現率とに基づいて疾患度を推定算出する請求項１乃至１０のいずれかに記載の診断支援装置。
【請求項１２】
前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との比率である請求項１１記載の診断支援装置。
【請求項１３】
前記疾患度が全参照被験者疾患発現率と、前記近傍群内疾患発現率との差である請求項１１記載の診断支援装置。
【請求項１４】
前記疾患度推定算出部が、各近傍群において所定の回数以上合致する疾患保持者がいる場合に、前記疾患度を算出するように構成された請求項１乃至１３のいずれかに記載の診断支援装置。
【請求項１５】
前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数が、対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数よりも少ない場合には、前記疾患度推定算出部が、当該参照被験者に関しては記憶されている検査項目数内では、疾患度の算出に用いられるとともに、前記検査項目数よりも多いときには、疾患度の算出に用いないように構成されている請求項１乃至１４のいずれかに記載の診断装置。
【請求項１６】
対象検査結果記憶部に記憶されている前記検査対象被験者の検査項目数が、前記参照検査結果記憶部に記憶されている所定の参照被験者の検査項目数よりも少ない場合には、前記検査対象被験者の検査項目に対応する前記参照被験者の検査項目のデータを用いて前記疾患度推定算出部が疾患度を算出する請求項１乃至１５のいずれかに記載の診断装置。
【請求項１７】
前記参照検査結果記憶部及び対象検査結果記憶部に記憶されている検査項目の検査結果が、大小を比較できる数値情報からなる数値検査結果と、カテゴリー分けを示すカテゴリー分け検査結果とを含むものであり、
前記カテゴリー分け検査結果を有する検査項目について、前記検査対象被験者と前記参照被験者とのカテゴリー分け検査結果が同値であるか否かに基づいて当該検査項目ごとの近傍群を生成するカテゴリー分け近傍群生成部を更に備えた請求項１乃至１６のいずれかに記載の診断支援装置。
【請求項１８】
複数の参照被験者に対して実施された複数の検査項目の検査結果を、当該参照被験者を識別する識別子とともに記憶する参照検査結果記憶部と、
検査対象被験者に対して実施された複数の検査項目の検査結果を、当該検査対象被験者を識別する識別子とともに記憶する対象検査結果記憶部と、
前記検査項目ごとに、前記検査対象被験者の検査結果と、前記参照被験者のうち少なくとも当該検査対象被験者の検査結果と近い数値を有する参照被験者の検査結果又は全参照被験者の検査結果を数値順に並べ替え、前記検査項目ごとの検査結果列を生成する並べ替え部と、
前記検査結果列ごとにおいて、前記検査対象被験者との順序距離が小さい参照被験者を所定の選択人数だけ選択し、前記検査項目ごとの近傍群を生成する近傍群生成部と、
１つの検査項目の近傍群において含まれている前記参照被検者の識別子を抽出する、又は、複数の検査項目の近傍群において合致している前記参照被験者の識別子を抽出する抽出部と、
前記選択人数及び前記抽出部において合致している前記参照被験者の識別子が登場する回数に基づいて、前記検査対象被験者と、前記参照被験者と間の類似度を算出する類似度算出部を備えることを特徴とする診断支援装置。
【請求項１９】
ある参照被験者と前記検査対象被験者とを交換して、前記参照検査結果記憶部及び前記対象検査結果記憶部にそれぞれの検査結果を記憶させる交換部とを更に備え、
前記交換部がすべての参照被験者を検査対象被験者とするとともに、すべての参照被験者間の類似度を前記類似度算出部に算出させる請求項１８記載の診断支援装置。

【図１】