データ検索装置およびその制御方法、データ検索システム

【課題】入力した症例に類似する複数の確定症例データを症例データベースから抽出する技術を提供する。
【解決手段】症例データベースから確定症例データを抽出するデータ検索装置において、少なくとも医用画像データを含む症例データの入力を受け付ける入力受付手段と、症例データベースに記憶された複数の確定症例データの各々について、入力された症例データとの類似度を導出する導出手段と、症例データベースに記憶される複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類手段と、複数の診断グループの各々から、導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出手段と、を含む。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、症例データベースから類似の症例データを検索する技術に関するものである。
【背景技術】
【０００２】
近年、病院情報システム（ＨＩＳ：Hospital Information System）や画像保管通信システム（ＰＡＣＳ：Picture Archiving and Communication System）等の医用情報システムの普及に連れて、医用文書及び医用画像の電子化が進展している。これにより、以前はフィルムに現像されてからシャーカステン上で見ることが多かった医用画像（Ｘ線画像、ＣＴ画像あるいはＭＲＩ画像など）は、現在ではデジタル化されている。デジタル化された医用画像（デジタル画像）はＰＣＡＳに格納され、必要な時にＰＡＣＳから読み出され端末のモニタ上に表示される。また、診療記録等の医用文書も電子化されてきており、患者の診療記録をＨＩＳから読み出して端末のモニタ上に表示することも可能となってきた。さらに、電子化された環境にいる読影医は、読影の依頼箋を電子的なメッセージにより受け取り、患者を撮影した医用画像データをＰＡＣＳから読み出して端末の読影専用モニタ上に表示することも出来る。また、必要に応じて患者の診療記録をＨＩＳから読み出して、別のモニタ上に表示することができる。
【０００３】
ところで、医師が医用画像を読影して画像診断を行う際に、読影中の画像に写った患部が見慣れない画像特徴を持つ場合や、類似した画像特徴を持つ疾患が複数存在する場合などは、診断名の判断に迷うことがある。この様な場合、迷った医師は他のベテラン医師に相談するか、または、医学書等の文献を調べて、疑わしい疾患名に関する画像特徴の解説文を読むことがある。あるいは、写真付きの医学文献を調べ、読影中の画像に写った患部と類似した写真を見つけ、その写真に対応する疾患名を見ることで、診断の参考にしようとすることがある。しかし、常に相談できる他の医師がいるとは限らない。また、文献を調べたからといって、必ず読影中の画像に写った患部と類似した写真あるいは画像特徴の解説文が見つかるとは限らない。そこで、近年、類似症例を検索する装置が提案されている。検索装置の基本的な考え方は、過去に蓄積した症例データの中から何らかの基準に基づき症例データを検索して医師に提示することにより、診断の支援をしようとするものである。
【０００４】
例えば、特許文献１では、過去に診断された画像データを、所見と病名を含む診断情報と対応付けてデータベースに蓄積する技術が開示されている。また、新たに診断しようとする画像に対する所見が入力されると、同様の所見を含む過去の診断情報を検索し、対応する画像データや病名を表示する技術も併せて開示されている。そして、特許文献２では、診断履歴比較手段によって、画像診断結果と確定診断結果とが食い違っている参考症例（画像診断が間違っていた症例）を検出して参考症例データベースに登録する技術が開示されている。また、後から識別情報を指定することで必要な参考症例画像を参照可能な参考症例検索方式を開示している。
【特許文献１】特開平６−２９２６５６号公報
【特許文献２】特開平５−１０１１２２号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
しかしながら、例えば、特許文献１に記載の技術では、類似症例検索結果として画像データと病名の両方が得られるものの、文章の類似性に基づいて検索しているため必ずしも画像特徴の類似性を保障している訳ではない。また、類似した所見を持つ症例データの病名しか得られないため、複数の異なる病名が得られるとも限らない。また、特許文献２に記載の技術では、医師に対して誤診に対する注意喚起をすることはできるが、必ずしも現在読影中の画像の正しい診断名を類推させる症例データが示せる訳ではない。そのため、ある症例について過去の症例データを検索する際に、医師が判断に迷う可能性のある異なる確定診断結果を持つ複数の症例データが得られないという問題があった。
【０００６】
本発明は、上述の問題点に鑑みなされたものであり、ある症例について過去の症例データを検索する際に、異なる確定診断結果を持つ複数の症例データを抽出可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【０００７】
上述の問題点を解決するため、本発明のデータ検索装置は以下の構成を備える。すなわち、医用画像データと該医用画像データに対応する確定した診断情報とを含む複数の確定症例データを記憶する症例データベースから１以上の確定症例データを抽出するデータ検索装置において、少なくとも医用画像データを含む症例データの入力を受け付ける入力受付手段と、前記症例データベースに記憶された前記複数の確定症例データの各々について、前記入力受付手段により入力された前記症例データとの類似度を導出する導出手段と、前記症例データベースに記憶される前記複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類手段と、前記複数の診断グループの各々から、前記導出手段により導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出手段と、を含む。
【０００８】
上述の問題点を解決するため、本発明のデータ検索装置の制御方法は以下の構成を備える。すなわち、医用画像データと該医用画像データに対応する確定した診断情報とを含む複数の確定症例データを記憶する症例データベースから１以上の確定症例データを抽出するデータ検索装置の制御方法において、少なくとも医用画像データを含む症例データの入力を受け付ける入力受付工程と、前記症例データベースに記憶された前記複数の確定症例データの各々について、前記入力受付工程により入力された前記症例データとの類似度を導出する導出工程と、前記症例データベースに記憶される前記複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類工程と、前記複数の診断グループの各々から、前記導出工程により導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出工程と、を含む。
【０００９】
上述の問題点を解決するため、本発明のデータ検索システムは以下の構成を備える。すなわち、医用画像データと該医用画像データに対応する確定した診断情報とを含む複数の確定症例データを記憶する症例データベースと、該症例データベースにアクセスして１以上の確定症例データを抽出するデータ検索装置と、を含むデータ検索システムにおいて、少なくとも医用画像データを含む症例データの入力を受け付ける入力受付手段と、前記症例データベースに記憶された前記複数の確定症例データの各々について、前記入力受付手段により入力された前記症例データとの類似度を導出する導出手段と、前記症例データベースに記憶される前記複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類手段と、前記複数の診断グループの各々から、前記導出手段により導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出手段と、を含む。
【発明の効果】
【００１０】
本発明によれば、ある症例について過去の症例データを検索する際に、異なる確定診断結果を持つ複数の症例データを抽出可能とする技術を提供することができる。
【発明を実施するための最良の形態】
【００１１】
以下に、図面を参照して、この発明の好適な実施の形態を詳しく説明する。なお、以下の実施の形態はあくまで例示であり、本発明の範囲を限定する趣旨のものではない。
【００１２】
（第１実施形態）
本発明に係るデータ検索装置の第１実施形態として、医療用データ検索システムにおける類似症例検索装置を例に挙げて以下に説明する。
【００１３】
＜装置構成＞
図１は、第１実施形態に係る類似症例検索装置の機器構成を示す図である。
【００１４】
類似症例検索装置１は、制御部１０、モニタ１０４、マウス１０５、キーボード１０６を有する。制御部１０は、中央処理装置（ＣＰＵ）１００、主メモリ１０１、磁気ディスク１０２、表示メモリ１０３、共有バス１０７を有する。そして、ＣＰＵ１００が主メモリ１０１に格納されたプログラムを実行することにより、症例データベース２、医用画像データベース３および診療録データベース４へのアクセス、類似症例検索装置１の全体の制御、等の各種制御が実行される。
【００１５】
ＣＰＵ１００は、主として類似症例検索装置１の各構成要素の動作を制御する。主メモリ１０１は、ＣＰＵ１００が実行する制御プログラムを格納したり、ＣＰＵ１００によるプログラム実行時の作業領域を提供したりする。磁気ディスク１０２は、オペレーティングシステム（ＯＳ）、周辺機器のデバイスドライバ、後述する類似症例検索処理等を行うためのプログラムを含む各種アプリケーションソフト、およびそれらのソフトが生成または使用する作業用データ等を格納する。表示メモリ１０３は、モニタ１０４のための表示用データを一時記憶する。モニタ１０４は、例えばＣＲＴモニタや液晶モニタ等であり、表示メモリ１０３からのデータに基づいて画像を表示する。マウス１０５及びキーボード１０６はユーザによるポインティング入力及び文字等の入力をそれぞれ行う。上記各構成要素は共有バス１０７により互いに通信可能に接続されている。
【００１６】
第１実施形態では、類似症例検索装置１はＬＡＮ５を介して、症例データベース２から症例データを、医用画像データベース３から画像データを、および診療録データベース４から診療録データを、それぞれ読み出すことができる。ここで、症例データベース２は、医用画像データとその医用画像データに対応する確定診断情報とを含む症例データ（確定症例データ）を複数保管する症例データ保管手段として機能する。そして、医用画像データベース３として既存のＰＡＣＳを利用することができる。また、診療録データベース４として既存のＨＩＳのサブシステムである電子カルテシステムを利用することができる。なお、類似症例検索装置１に外部記憶装置、例えばＦＤＤ、ＨＤＤ、ＣＤドライブ、ＤＶＤドライブ、ＭＯドライブ、ＺＩＰドライブ等を接続し、それらのドライブから確定症例データ、画像データおよび診療録データを読み込むように構成しても良い。
【００１７】
なお、医用画像の種類には、単純Ｘ線画像（レントゲン画像）、Ｘ線ＣＴ（Computed Tomography）画像、ＭＲＩ（Magnetic Resonance Imaging）画像、ＰＥＴ（Positron Emission Tomography）画像、ＳＰＥＣＴ（Single Photon Emission Computed Tomography）画像、超音波画像などがある。
【００１８】
診療録には、患者の個人情報（氏名、生年月日、年齢、性別など）、臨床情報（様々な検査値、主訴、既往歴、治療歴など）、医用画像データベース３に格納された患者の画像データへの参照情報および主治医の所見情報などが記載される。さらに、診断が進んだ段階で、診療録には確定診断名が記載される。
【００１９】
症例データベース２に保管される症例データは、診療録データベース４に保管された確定診断名付きの診療録データおよび医用画像データベース３に保管された画像データの一部を、コピーまたは参照することにより作成される。
【００２０】
＜データ構造＞
図９および図１０に、症例データベース２に保管される症例データテーブルの例を示す。症例データテーブルとは、同じ構成要素から成る複数の症例データを規則正しく並べたデータの集まりである。
【００２１】
症例データの構成要素は以下の意味を持つ。“症例データＩＤ（ＤＩＤ）”は、症例データを一意に識別するための識別子である。ＤＩＤには、症例データが追加された順番にシーケンシャルな番号を付ける。“確定診断名”は、診療録データに記載された確定診断名をコピーすることで得られる。なお、“確定診断名”は必ずしも文字列である必要はなく、標準化された診断コード（確定診断名を数値と一意に対応付けたもの）を用いてもよい。“診断グループＩＤ（ＧＩＤ）”は、診断グループを一意に識別するための識別子である。ここで、診断グループとは、画像診断を行う上で識別不要な複数の確定診断名の集まりである。具体例を挙げて説明すると、例えば肺で見られる疾患として、肺癌、肺炎、結核などの疾患が知られているが、これらはいずれも治療方法が異なるため、画像診断においても識別が必要である。一方、肺腺癌、肺扁平上皮癌、肺小細胞癌などは、いずれも肺癌をより詳細に診断したものであり、画像診断上は識別困難かつ識別不要であるので、すべて肺癌と同じ診断グループに分類する。診断グループを決めるためには、画像診断に関連する医学的な知識が必要である。
【００２２】
図１３に、複数の“確定診断名”と“診断グループＩＤ（ＧＩＤ）”との対応表の例を示す図である。ただし、図１３では具体的な確定診断名を記載していない。確定診断名は診療科ごとに非常に多くの診断名があり、さらに医療機関によって同様の疾患を異なる診断名で表現することがある。従って、確定診断名と診断グループＩＤ（ＧＩＤ）との対応表は、使用先の診療科や医療機関ごとに適切に決めることが望ましい。
【００２３】
第１実施形態では、図１３に例示した対応表を類似症例検索装置１の磁気ディスク１０２に格納し、必要に応じて対応表を書き換え可能とする。対応表の書き換えは、予め決めた所定の手順により、所定の権限を持つ者が行う。対応表の書き換えは、所定の権限を持つ者が、新たな対応表を不図示の外部記憶装置から読み出すか、またはＬＡＮ５経由で受信した後、磁気ディスク１０２に格納することにより実施される。
【００２４】
再び図９を参照すると、“診療録データへの参照情報”は、診療録データベース４から症例データに対応した診療録データを読み出すための参照情報である。症例データ中に、診療録データそのものをコピーするのではなく、“診療録データへの参照情報”を記憶することで、症例データテーブルのサイズを小さくすることができ、記憶容量の節約となる。
【００２５】
“画像撮影日”および“画像の種類”は、いずれも診療録データまたは画像データのヘッダ情報から読み出すことができる。“対象臓器”は、後述する画像の関心領域がどの臓器に含まれるかを示す情報であり、症例データを作成する際に医師が入力する。あるいは、最新のコンピュータ画像処理技術を用いて臓器を自動識別することで、“対象臓器”を自動入力することも可能である。
【００２６】
“画像データへの参照情報”は、医用画像データベース３から症例データに対応した画像データを読み出すための参照情報である。症例データ中に、画像データそのものをコピーするのではなく、“画像データへの参照情報”を記憶することで、症例データテーブルのサイズを小さくすることができ、記憶容量の節約となる。
【００２７】
“関心スライス番号”は、医用画像の種類がＣＴ画像、ＭＲＩ画像またはＰＥＴ画像などの複数スライスから成る画像である場合に必要な情報であり、画像診断上最も注目すべき領域（関心領域）が何番目のスライス画像に含まれるかを示す。“関心領域の座標情報（Ｘ０，Ｙ０，Ｘ１，Ｙ１）”は、前記“関心スライス番号”によって示されるスライス画像において、関心領域がどのＸＹ座標範囲に含まれるかを示す情報である。通常、画像の左上を原点とし、右方向をＸ座標軸方向、下方向をＹ座標軸方向に取った直交座標系において、画素単位の位置情報として座標情報が表現される。座標情報（Ｘ０，Ｙ０，Ｘ１，Ｙ１）は、関心領域の左上隅の座標（Ｘ０，Ｙ０）と、関心領域の右下の座標（Ｘ１，Ｙ１）をまとめて表現したものである。
【００２８】
関心領域は、例えば以下のようにして得られる。まず、上述の“画像データへの参照情報”を用いて、医用画像データベース３から症例データに対応した画像データを読み出す。次に、“関心スライス番号”によって指定されるスライス画像を選択する。最後に、“関心領域の座標情報（Ｘ０，Ｙ０，Ｘ１，Ｙ１）”によって指定される範囲内の画像データを抽出することで、関心領域の画像データを得ることができる。
【００２９】
“関心領域の画像特徴情報Ｆ”は、関心領域の画像データの特徴を表す情報である。Ｆは複数の画像特徴量（ｆ１，ｆ２，ｆ３，…）からなる多次元情報（ベクトル情報）である。個々の画像特徴量の具体例を以下に例示する。
【００３０】
・患部のサイズ（長径／短型／平均径などの直径、面積など）
・患部の輪郭線の長さ
・患部の形状（長型と短径との比、輪郭線の長さと平均径との比、輪郭線のフラクタル次元、予め決めた複数のモデル形状との一致度など）
・患部の平均濃度値
・患部の濃度分布パターン
もちろん、これらの他にも様々な画像特徴量を計算することが可能である。
【００３１】
患部に関する画像特徴量を計算するためには、予め患部の範囲（境界線）を特定しておく必要がある。患部の範囲を特定する方法としては、一般に、医師が画像を見ながら患部の境界線を指定する方法（マニュアル抽出法）と、画像処理技術を利用した自動抽出法がある。本実施例では、マニュアル抽出法と自動抽出法のどちらを用いてもよい。Ｆをどの様な画像特徴量の組み合わせとして表現するかは、画像データの類似度を計算する上で重要である。一般に、より多くの画像特徴量を使用した方が画像データの特徴を詳細に表現できるという利点があるが、その一方で、より多くの画像特徴量を使用すると類似度の計算時間が長くなるという欠点もある。通常、互いに相関する情報が少ない１０〜数１０程度の画像特徴量の組み合わせとしてＦが定義される。
【００３２】
図１０は、図９とは異なる構成要素を持つ症例データテーブルの他の例を示す図である。
【００３３】
“症例データＩＤ（ＤＩＤ）”、“確定診断名” および“診断グループＩＤ（ＧＩＤ）”は、いずれも図９と同じものである。
【００３４】
“所定の臨床情報Ｃ”は、診療録データベース４に保管されている診療録データから必要な臨床情報を選択的にコピーしたものである。そして、Ｃは複数の臨床情報（ｃ１，ｃ２，ｃ３，…）からなる多次元情報（ベクトル情報）である。個々の臨床情報の具体例としては、各種検査値（身体検査値、血液検査値、癌マーカーや炎症マーカーなど特定の疾患に関連した検査値など）、既往歴、治療歴など、様々なものがある。Ｃをどの様な臨床情報の組み合わせとして表現するかは、臨床情報の類似度を計算する上で重要である。適切なＣの決め方は、主に診断対象とする臓器や疾患の種類に大きく依存する。
【００３５】
“画像撮影日”、“画像の種類”および“対象臓器”は、いずれも図９と同じものである。
【００３６】
“関心領域の画像データＩ”は、医用画像データベース３に保管されている画像データから関心スライス画像を選択し、さらに関心スライス画像内の関心領域に含まれる画像データをコピーしたものである。つまり、Ｉは注目領域に含まれる画素数分の画素情報（ｉ１，ｉ２，ｉ３，…）からなる多次元情報（ベクトル情報）である。
【００３７】
“関心領域の画像特徴情報Ｆ”は、図９と同じものである。
【００３８】
なお、図９と図１０の主な違いは、臨床情報Ｃおよび画像データＩへの参照情報として間接的に記憶するか（図９）、直接記憶するか（図１０）にある。症例データベース２の容量が十分大きい場合は、図１０に例示した様に、すべてのデータを症例データテーブル内に直接記憶するとよい。なぜなら、一つのデータベースに保管されているデータを読み出すためには一回のデータ読み出し処理で済むためである。一方、複数のデータベースに保管されているデータを読み出すためには複数回のデータ読み出し処理が必要となり、それだけ処理手順および処理時間が余計にかかる。
【００３９】
図２は、類似症例検索における関心領域の画像特徴量と診断グループとの概念的な関係を示す図である。図２では、関心領域の画像特徴情報Ｆは、画像特徴量１（ｆ１）と画像特徴量２（ｆ２）によって定義されているものと仮定している。一般に、Ｆは１０〜数１０個程度の画像特徴量から定義されるが、ここでは図をわかりやすくするために、Ｆによって表される画像特徴空間（多次元ベクトル空間）を２次元のＸＹ座標空間によって表現している。また、図２では、画像特徴情報Ｆのみによって診断グループの範囲を表現しているが、症例データは所定の臨床情報Ｃも含むので、画像特徴情報Ｆと所定の臨床情報Ｃの両方を利用して、より高次の多次元ベクトル空間によって診断グループの範囲を表現してもよい。この場合、後述の未確定症例データと確定診断名付き症例データとの類似度は、画像特徴情報Ｆと所定の臨床情報Ｃの両方を用いて定義される。
【００４０】
なお、図２においては、画像特徴空間（ＸＹ座標空間）内に、楕円によって示されたＧ１からＧ７までの診断グループが存在している。各診断グループの境界線は、各診断グループに属する症例データが分布する範囲（の限界）を示すものである。異なる各診断グループに属する、異なる種類の疾患であっても、画像特徴情報が互いに非常に似ている場合があるため、複数の診断グループが部分的に重なる範囲が存在する。
【００４１】
また、図２においては、未確定症例データＤ０が“ｘ”印によって示された位置に相当する画像特徴情報Ｆ０を持つものとする。この時、未確定症例データＤ０は、診断グループＧ２、Ｇ３およびＧ４のいずれかに属する可能性が高いので、類似症例検索結果としては、少なくとも診断グループＧ２、Ｇ３およびＧ４に属する複数の確定診断名付き症例データが表示されることが期待される。
【００４２】
＜装置の動作＞
以下、図３〜図５のフローチャートおよび図１１〜図１７のデータテーブルを参照して、制御部１０がどのように類似症例検索装置１を制御しているかについて説明する。なお、以下のフローチャートによって示される処理は、ＣＰＵ１００が主メモリ１０１に格納されているプログラムを実行することにより実現される。また、ここでは、医師が、マウス１０５やキーボード１０６を操作することで、類似症例検索装置１に様々なコマンド（指示・命令）を入力するものとする。
【００４３】
また、ＣＰＵ１００が実行するプログラムの実行状況や実行結果は、ＣＰＵ１００が別途実行するＯＳ及び表示プログラムの機能により、モニタ１０４に表示される。また、症例データベース２には、図１０に例示された症例データテーブルが保管されているものとする。
【００４４】
図３は、第１実施形態に係る類似症例検索装置の処理フローチャートである。
【００４５】
ステップＳ３１０では、ユーザ（医師）のコマンド入力に従い、ＣＰＵ１００は未確定症例データＤ０の入力受付を実行する。具体的には、未確定症例データＤ０を医用画像データベース３または不図示の医用画像撮影装置から共有バス１０７およびＬＡＮ５を経由して、主メモリ１０１に読み込む。あるいは、ＣＰＵ１００は未確定症例データＤ０を、磁気ディスク１０２または不図示の外部記憶装置から共有バス１０７を経由して、主メモリ１０１に読み込んでもよい。なお、以下の説明においては、説明を簡単にするため、未確定症例データＤ０は画像データに関する情報のみを含むものとする。つまり、未確定症例データＤ０には、画像撮影日、画像の種類、対象臓器、関心領域の画像データＩ０および関心領域の画像特徴情報Ｆ０は含まれるが、所定の臨床情報Ｃ０は含まれない。従って、類似症例検索処理は類似画像検索処理とほぼ同様の処理となっている。ただし、未確定症例データＤ０に、各種臨床検査結果等から得られた所定の臨床情報Ｃ０を含んでいてもよい。未確定症例データＤ０に所定の臨床情報Ｃ０を含む場合と含まない場合とでは、類似度の計算にＣ０を含めるか含めないかが異なるだけであり、基本的な処理手順に違いはない。
【００４６】
ステップＳ３２０では、医師のコマンド入力に従い、ＣＰＵ１００は類似症例検索条件の決定を行う。ここで、類似症例検索条件とは、類似症例検索を行う対象となる症例データを限定するための条件である。具体的には、症例データの構成要素である“画像の種類”および“対象臓器”が、未確定症例データＤ０の構成要素である“画像の種類”および“対象臓器”に一致する場合のみ類似症例検索の対象とする。なぜなら、一般的には、これらの構成要素が異なる場合、関心領域の画像特徴情報Ｆも大きく異なる場合が多いため、これらの構成要素が異なる症例データは最初から検索対象から除外しておいた方が、作業効率がよいためである。ただし、“画像の種類”および／または“対象臓器”が異なる症例データの中から類似症例検索を行う場合に備え、類似症例検索条件の決定は、医師のコマンド入力に従って柔軟に変更可能なように構成しておくと好適である。
【００４７】
以下では、未確定症例データＤ０の“画像の種類”は”造影ＣＴ画像”であり、“対象臓器”は”肺”である場合の処理例を説明する。つまり、類似症例検索条件として、“画像の種類”を”造影ＣＴ画像”、“対象臓器”を”肺”に設定するコマンド入力がなされた場合の処理例を説明する。
【００４８】
ステップＳ３３０では、ステップＳ３２０で決定された類似症例検索条件に従い、ＣＰＵ１００は図１１に例示された検索用症例データテーブルを主メモリ１０１上に作成する。この際、もし主メモリ１０１に十分な空き記憶容量がなければ、磁気ディスク１０２上に検索用症例データテーブルを作成し、後述の処理において必要なデータのみを主メモリ１０１上に読み出すように制御してもよい。検索用症例データテーブルの作成方法については、後述する。
【００４９】
図１１は、検索用症例データテーブルの一例である。“症例データ第２ＩＤ（Ｄ’ＩＤ）”は、検索用症例データテーブル内の症例データを一意に識別するための識別子である。Ｄ’ＩＤには、後述する検索用症例データテーブルのソートが終了した段階で、上の行から順番にシーケンシャル番号を付ける。“症例データＩＤ（ＤＩＤ）”、“診断グループＩＤ（ＧＩＤ）”および“関心領域の画像特徴情報Ｆ”は、すでに図９と図１０で説明したものと同じである。“類似度Ｒ”は、未確定症例データＤ０と検索用症例データテーブル内の各症例データ（Ｄ’１，Ｄ’２，Ｄ’３，…）との間の類似度を意味するが、ステップＳ３３０の時点ではまだ類似度Ｒは算出されていない。
【００５０】
以下、検索用症例データテーブルの作成方法を詳述する。ＣＰＵ１００は、症例データベース２から共有バス１０７およびＬＡＮ５を経由して、類似症例検索条件に合致する症例データを読み込む。ステップＳ３２０で説明した通り、本実施例では類似症例検索条件として、“画像の種類”が造影ＣＴ画像であり、“対象臓器”が肺である症例データに限定している。従って、図１１には、図１０に示した症例データの内、“画像の種類”が造影ＣＴ画像であり、“対象臓器”が肺である症例データのみが読み込まれる。また、ＣＰＵ１００は無駄なデータ転送を減らすため、検索用症例データテーブルに必要な構成要素（“症例データＩＤ（ＤＩＤ）”、“診断グループＩＤ（ＧＩＤ）”および“関心領域の画像特徴情報Ｆ”）のみを読み込む。“類似度Ｒ”には、初期値として値０を代入する。症例データの読み込み終了後、ＣＰＵ１００は、後述のステップＳ３７０における処理を高速化する目的で、検索用症例データテーブル内の各行を診断グループＩＤ（ＧＩＤ）に基づいてソートする。図１１には、診断グループＩＤ（ＧＩＤ）が昇順となる様にソートした結果が例示されている。検索用症例データテーブルのソートが終了した後、“症例データ第２ＩＤ（Ｄ’ＩＤ）”に、上の行から順番にシーケンシャル番号を付ける。
【００５１】
なお、第１実施形態では、任意の表に含まれる行データを現す記法として、行の先頭（最初の列）に書かれた値（通常は何らかのＩＤ）が値Ｘである時、行データ全体をＸと表記する。つまり、Ｘ＝｛Ｘ，…｝の関係がある。図１１の例では、１行目の症例データをＤ’１、２行目の症例データをＤ’２、ｎ行目の症例データをＤ’ｎと表記する。他の表についても、同じ記法を用いる。
【００５２】
ステップＳ３４０では、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルの中から、上位類似症例データ（Ｔ１，Ｔ２，…，Ｔｍ）を選出する。ここで、上位類似症例データとは、検索用症例データテーブル内の全症例データを、未確定症例データＤ０との類似度が高い順に並べた場合の、先頭からｍ個目までの症例データ（Ｔ１，Ｔ２，…，Ｔｍ）を呼ぶ。ここで、値ｍ（上位類似症例データ数）は予め設定しておく必要がある。制御部１０の不図示の読み出し専用メモリまたは不揮発性メモリには、予めｍの初期値が書き込まれている。さらに、医師のコマンド入力に従い、ＣＰＵ１００が不図示の不揮発性メモリに値ｍを書き込むことにより、値ｍを変更することができる。ステップＳ３４０の詳細な処理手順については、図４、図１１および図１２を用いて以下に説明する。
【００５３】
図１２は、図１１に例示した検索用症例データテーブルに対してステップＳ３４０を実行することにより作成される上位類似症例データテーブルの例を示す図である。上位類似症例データテーブルとは、ＣＰＵ１００がステップＳ３４０で選出した上位類似症例データを主メモリ１０１上にテーブル形式で記憶したものである。図１２の例では、値ｍ（上位類似症例データ数）は値３に設定されている。従って、図１２の上位類似症例データテーブルは３行（Ｔ１，Ｔ２，Ｔ３）から構成される。
【００５４】
“上位類似症例データＩＤ（ＴＩＤ）”は、上位類似症例データを一意に識別するための識別子である。ＴＩＤには、ステップＳ３４０における上位類似症例データの選出が終了した後に、上の行から順番にシーケンシャル番号を付ける。“症例データ第２ＩＤ（Ｄ’ＩＤ）”、“診断グループＩＤ（ＧＩＤ）”および“類似度Ｒ”は、すでに図１１で説明したものと同じであり、検索用症例データテーブル（図１１）からコピーする。図１２の例では、図１１の症例データの内、Ｄ’５，Ｄ’３およびＤ’６の症例データが上位類似症例データとして選出されている。そして、図１２のテーブルの各行は、“類似度Ｒ”の値が昇順となるようにソートされているので、値Ｒ５≧値Ｒ３≧値Ｒ６、の関係がある。
【００５５】
図４は、ステップＳ３４０の詳細な処理手順を示すフローチャートである。
【００５６】
ステップＳ４１０では、ＣＰＵ１００は、図１２に例示された上位類似症例データテーブルを主メモリ１０１上に作成し、上位類似症例データテーブルの全構成要素を値０で初期化する。図１２の例では値ｍ＝値３なので、３行の上位類似症例データテーブルを作成し、全構成要素に値０を代入する。
【００５７】
ステップＳ４２０では、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルに含まれる症例データの総数（検索用症例データテーブルの行数）値Ｎを調べ、この値Ｎを主メモリ１０１に記憶する。また、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルの何行目に着目しているかを示すインデックス変数ｎに初期値１を代入し、このインデックス変数ｎを主メモリ１０１に記憶する。
【００５８】
ステップＳ４３０では、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルから、ｎ行目の症例データＤ’ｎを読み出す。
【００５９】
ステップＳ４４０では、ＣＰＵ１００は、ステップＳ３１０で読み込んだ未確定症例データＤ０と、ステップＳ４３０で読み出した症例データＤ’ｎとの類似度Ｒｎを計算する。さらにＣＰＵ１００は、類似度Ｒｎを主メモリ１０１に記憶した検索用症例データテーブルのｎ行目の“類似度Ｒ”欄に書き込むことで記憶する。類似度Ｒｎの計算方法は、未確定症例データＤ０と症例データＤ’ｎの両方に含まれる情報を利用したものであれば任意の計算方法を定義することができる。図１１の例では、“関心領域の画像特徴情報Ｆ”（Ｆ＝｛ｆ１，ｆ２，ｆ３，…｝）が類似度Ｒｎの計算に利用可能である。式（１）に、未確定症例データＤ０の関心領域の画像特徴情報Ｆ０と、症例データＤ’ｎの関心領域の画像特徴情報Ｆｎとの類似度Ｒｎの計算式の一例を示す。ただし、類似度Ｒｎの計算方法は式（１）に限定されるものではない。
【００６０】
【数１】

なお、式（１）において、Ｆ０＝｛ｆ０１，ｆ０２，ｆ０３，…｝であり、Ｆｎ＝｛ｆｎ１，ｆｎ２，ｆｎ３，…｝である。式（１）を幾何学的に表現すると、Ｆ０ベクトルとＦｎベクトル間のユークリッド距離の逆数と言うことができる。類似度Ｒｎはベクトル間距離が近いほど大きな値を取るべきなので、ベクトル間距離の逆数としたが、計算量を減らすために、類似度Ｒｎの代わりに式（２）によって相違度Ｒ’ｎを計算してもよい。あるいは、さらに計算量を減らすために、式（３）によって相違度Ｒ”ｎを計算してもよい。類似度Ｒｎの代わりに相違度Ｒ’ｎまたはＲ”ｎを計算した場合は、後述する通りステップＳ４５０における判断方法を変更する。また、ステップＳ４５０と同様なので説明は省略するが、図５のステップＳ５３５における判断方法も変更する。
【００６１】
【数２】

【００６２】
【数３】

【００６３】
ステップＳ４５０では、ＣＰＵ１００は、ステップＳ４４０で計算した類似度Ｒｎと、上位類似症例データテーブル内の最終行にある上位類似症例データＴｍ（図１２の例ではＴ３）の類似度Ｒとを比較する。値ＲｎがＴｍのＲ値以上である場合は、上位類似症例データを入れ替える必要があるので、ステップＳ４６０に進む。逆に、値ＲｎがＴｍのＲ値未満である場合は、上位類似症例データを入れ替える必要はないので、ステップＳ４８０へ進む。
【００６４】
なお、ステップＳ４４０において、類似度Ｒｎの代わりに相違度Ｒ’ｎまたはＲ”ｎを計算した場合は、ステップＳ４５０の判断方法は以下のように変更する。値Ｒ’ｎまたは値Ｒ”ｎがＴｍのＲ’値またはＲ”値未満である場合は、上位類似症例データを入れ替える必要があるので、ステップＳ４６０に進む。逆に、値Ｒ’ｎまたは値Ｒ”ｎがＴｍのＲ’値またはＲ”値以上である場合は、上位類似症例データを入れ替える必要はないので、ステップＳ４８０へ進む。
【００６５】
ステップＳ４６０では、ＣＰＵ１００は、上位類似症例データテーブルのＴｍ（図１２の例ではＴ３）の行に、ステップＳ４３０で読み出した症例データＤ’ｎの３つの構成要素を上書きする。ここで、３つの構成要素とは、“症例データ第２ＩＤ（Ｄ’ＩＤ）”の値Ｄ’ｎ、“診断グループＩＤ（ＧＩＤ）”の値および“類似度Ｒ”の値である。
【００６６】
ステップＳ４７０では、ＣＰＵ１００は、上位類似症例データテーブル内のすべての行（Ｔ１からＴｍまで）を“類似度Ｒ”の値が昇順となる様にソートする。
【００６７】
ステップＳ４８０では、ＣＰＵ１００は、インデックス変数ｎをインクリメント（１を加算）する。
【００６８】
ステップＳ４９０では、ＣＰＵ１００は、インデックス変数ｎと検索用症例データテーブルの行数Ｎとを比較する。値ｎが値Ｎより大きい場合は、検索用症例データテーブル内の全症例データをすでに読み終えたことになるので、ステップＳ３４０の処理を終了する。逆に、値ｎが値Ｎ以下の場合は、検索用症例データテーブル内の全症例データをまだ読み終えていないことになるので、ステップＳ４３０に戻って処理を継続する。上述したように、上位類似症例データテーブル（図１２）の内容は、検索用症例データテーブル（図１１）の内容に対して、上述のステップＳ３４０を実行することにより得られるものである。
【００６９】
ステップＳ３５０では、ＣＰＵ１００は、上位類似診断グループＩＤと、それらの関連グループＩＤを調べ、これらのＩＤをすべて合わせたものを検索対象グループＩＤとして決定する。この時の処理手順を、図１２および図１４を用いて以下に詳述する。
【００７０】
まず、ＣＰＵ１００は、図１２に例示した上位類似症例データテーブルの“診断グループＩＤ（ＧＩＤ）”列の値を全行に渡って調べる。そして、発見したすべてのＧＩＤ値（図１２の例では値Ｇ３と値Ｇ４）を上位類似診断グループＩＤとして主メモリ１０１に記憶する。次に、ＣＰＵ１００は、図１４に例示した“診断グループＩＤ（ＧＩＤ）”と複数の“関連グループＩＤ”との対応表を参照し、上述の上位類似診断グループＩＤに対する関連グループＩＤをすべて調べ、これらの関連グループＩＤを主メモリ１０１に記憶する。この際、複数の上位類似診断グループＩＤに関連する関連グループＩＤ（重複関連グループＩＤ）と、一つの上位類似診断グループＩＤだけに関連する関連グループＩＤ（単独関連グループＩＤ）とを区別して記憶しておく。図１２および図１４の例では、上位類似診断グループＩＤである値Ｇ３と値Ｇ４の両方に対する関連グループＩＤである値Ｇ２は重複関連グループＩＤであり、値Ｇ３だけに対する関連グループＩＤである値Ｇ６および値Ｇ７は単独関連グループＩＤである。後述の処理において、ＣＰＵ１００は、上述の上位類似診断グループＩＤとそれらの関連グループＩＤを合わせたものを、検索対象グループＩＤとして処理する。なお、図１４の例は、上述の図２に例示した診断グループ間の関係に対応している。つまり、図２において、Ｇ１はＧ２およびＧ５と重なる範囲に分布しているので、図１４において、診断グループＩＤ＝値Ｇ１、に対しては、関連グループＩＤ＝｛値Ｇ２，値Ｇ５｝、となっている。
【００７１】
ステップＳ３６０では、ＣＰＵ１００は、上述の検索対象グループＩＤごとに、類似症例データの選出数の下限値と上限値を決定する。つまりグループごとに抽出基準を設定する。
【００７２】
図１５は、“検索対象グループＩＤ”と類似症例データの“選出数（下限，上限）”との対応表の一例である。図１５に例示した内容は、図１２および図１４に例示した内容と対応している。まず、ＣＰＵ１００は、ステップＳ３５０で主メモリに記憶した検索対象グループＩＤ（上位類似診断グループＩＤとそれらの関連グループＩＤを合わせたもの）の総数を調べ、この総数と同じ行数を持つ、図１５に例示した対応表を作成する。次に、ＣＰＵ１００は、図１５に例示した対応表の“検索対象グループＩＤ”列に、上の行からそれぞれ順番に、上位類似診断グループＩＤ（値Ｇ３，値Ｇ４）、重複関連グループＩＤ（値Ｇ２）および単独関連グループＩＤ（値Ｇ６，値Ｇ７）を書き込む。さらに、ＣＰＵ１００は、図１５に例示した対応表の“選出数（下限，上限）”列に、以下の規則に基づいて、類似症例データの選出数の下限値と上限値を書き込む。
【００７３】
以下、図１５を用いて選出数（下限，上限）の決め方について説明する。基本的な考え方は、選出数（下限，上限）は、上位類似診断グループＩＤ、重複関連グループＩＤおよび単独関連グループＩＤのそれぞれに対して、予め決めておいた値を使用する。図１５の例では、以下の規則に基づいて計算している。
【００７４】
・上位類似診断グループＩＤ（Ｇ３とＧ４）に対しては、予め決めておいた選出数の下限値（値３）を使用する。
【００７５】
・重複関連グループＩＤ（Ｇ２）に対する選出数の下限値は、上位類似診断グループＩＤの選出数の下限値より１小さい値（値２）を使用する。
【００７６】
・単独関連グループＩＤ（Ｇ６とＧ７）に対する選出数の下限値は、重複関連グループＩＤの選出数の下限値より１小さい値（値１）を使用する。
【００７７】
・いずれの選出数の上限値も、下限値に２を足した値を使用する。
上述の規則を適用することにより、予め決めておく値は最初の一つだけで済む。さらに、医師からのコマンド入力によって、予め決めておく値を変更可能とすることで、類似症例検索結果として表示する類似症例数は変更可能となる。上述の決め方以外にも、様々な選出数（下限，上限）の決め方が考えられるが、どのような決め方がよいかは、ユーザである医師の嗜好または類似症例検索結果を表示するウィンドウサイズ等によって異なる。従って、予め複数の選出数（下限，上限）の決め方を用意しておき、医師からのコマンド入力によって、選出数（下限，上限）の決め方を変更可能としてもよい。
【００７８】
なお、第１実施形態においては、類似症例データの選出数の下限値と上限値を決めたが、必ずしも下限値と上限値の両方を決める必要はない。例えば、類似症例データの選出数に幅を持たせずに、各検索対象グループＩＤに対して、それぞれ一つずつ選出数を決めてもよい。この場合、選出数を一つずつ決めるということは、上述の選出数の下限値と上限値を等しくすることと等価である。従って、選出数を一つずつ決めた場合の処理手順は、選出数の下限値と上限値を決める場合の処理手順に含まれることになる。
【００７９】
ステップＳ３７０では、ＣＰＵ１００は、上述の検索対象グループＩＤごとに、類似症例データを選出する。ステップＳ３７０の詳細な処理手順については、図５、図１６および図１７を用いて以下で説明する。
【００８０】
図１６は、図１５に例示した“検索対象グループＩＤ”と類似症例データの“選出数（下限，上限）”との対応表を、“検索対象グループＩＤ”が昇順となる様にソートしたものである。このソートにより、以下で説明するステップＳ３７０の詳細な処理手順を簡素化することができる。
【００８１】
図１７は、検索対象グループ別類似症例データテーブルの一例である。図１６の例では、検索対象グループとしてＧ２、Ｇ３、Ｇ４、Ｇ６およびＧ７の５グループあるため、図１７の例では、それぞれＧ２用、Ｇ３用、Ｇ４用、Ｇ６用およびＧ７用の類似症例データテーブルが作成される。
【００８２】
図５は、ステップＳ３７０の詳細フローチャートである。
【００８３】
ステップＳ５１０では、ＣＰＵ１００は、図１６に例示した対応表の最終行にある“検索対象グループＩＤ”の値を調べ、この値を“検索対象グループＩＤ”の最大値Ｇｍａｘとして主メモリ１０１に記憶する。また、ＣＰＵ１００は、図１６に例示したソート済み対応表の何行目に着目しているかを示すインデックス変数ｋに初期値１を代入し、この値ｋを主メモリ１０１に記憶する。
【００８４】
ステップＳ５１５では、ＣＰＵ１００は、図１６に例示した対応表を参照しながら、図１７に例示した検索対象グループ別類似症例データテーブルを主メモリ１０１上に作成し、全テーブルの全構成要素を値０で初期化する。以下に、図１６と図１７の例を用いて、検索対象グループ別類似症例データテーブルの作成手順を詳細に説明する。
【００８５】
ＣＰＵ１００は、図１６の各行を１行ずつ処理することで、各検索対象グループ用の類似症例データテーブルを作成する。まず、ＣＰＵ１００は、１行目の“検索対象グループＩＤ”の値Ｇ２および“選出数（下限，上限）”の値（２，４）を読み出し、選出数の上限値に等しい行数（４行）を持つＧ２用類似症例データテーブルを作成し、テーブルの全構成要素を値０で初期化する。ＣＰＵ１００は、図１６の２行目以下も同様に処理することで、図１７に例示した各検索対象グループ別類似症例データテーブルを作成する。
【００８６】
ステップＳ５２０では、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルに含まれる症例データの総数（検索用症例データテーブルの行数）Ｎを調べ、この値Ｎを主メモリ１０１に記憶する。なお、値Ｎは、図４のステップＳ４２０においてすでに主メモリ１０１に記憶済みなので、図４の処理（ステップＳ３４０の処理）終了後も値Ｎが記憶されているならば、ステップＳ５２０において再度値Ｎを記憶する必要はない。次に、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルの何行目に着目しているかを示すインデックス変数ｎに初期値１を代入し、この値ｎを主メモリ１０１に記憶する。
【００８７】
ステップＳ５２５では、ＣＰＵ１００は、図１１に例示した検索用症例データテーブルから、ｎ行目の症例データＤ’ｎを読み出す。
【００８８】
ステップＳ５３０では、ＣＰＵ１００は、ステップＳ５２５で読み出した症例データＤ’ｎに含まれる診断グループＩＤ（ＧＩＤ）の値と、以下で説明する値Ｇｋとを比較する。この比較結果が等しい場合、ステップＳ５３５に進み、逆に、比較結果が等しくない場合、ステップＳ５６０に進む。
【００８９】
ここで、図１６および図１７に示した表を用いて、値Ｇｋの求め方を具体的に説明する。まず、値Ｇｋの添え字ｋは、ステップＳ５１０で述べたインデックス変数ｋである。そして、Ｇｋは、図１６のｋ行目の“検索対象グループＩＤ”の値である。つまり、図１６に書かれている通り、ｋ＝１の時はＧｋ＝Ｇ２、ｋ＝２の時はＧｋ＝３、ｋ＝３の時はＧｋ＝４、ｋ＝４の時はＧｋ＝６、ｋ＝５の時はＧｋ＝７、である。
【００９０】
ステップＳ５３０が最初に実行される時は、図１１の１行目の症例データＤ’１が読み出されるので、Ｄ’１のＧＩＤ＝値Ｇ１である。一方、最初はインデックス変数ｋ＝１なので、Ｇｋ＝Ｇ２となる。Ｇ１≠Ｇ２なので、ステップＳ５３０が最初に実行された後は、ステップＳ５６０に進む。この処理により、図１１に例示された症例データの内、症例データの持つ診断グループＩＤ（ＧＩＤ）の値が、図１６に例示された検索対象グループＩＤのいずれかの値と一致する場合のみ、ステップＳ５３５に進む。これにより、検索対象グループに属する症例データのみを、類似症例検索の対象とすることができる。
【００９１】
ステップＳ５３５では、ＣＰＵ１００は、２つの“類似度Ｒ”の値を比較する。一方の“類似度Ｒ”の値は、ステップＳ５２５で読み出した症例データＤ’ｎに含まれる“類似度Ｒ”の値Ｒｎである。もう一方の“類似度Ｒ”の値は、図１７に例示したＧｋ用類似症例データテーブルの最終行ＧＴｍの“類似度Ｒ”の値（Ｇｋ用ＧＴｍのＲ値、と略記する）である。値ＲｎがＧｋ用ＧＴｍのＲ値以上の場合は、Ｇｋ用類似症例データテーブルの内容を更新する必要があるので、ステップＳ５４０に進む。逆に、値ＲｎがＧｋ用ＧＴｍのＲ値未満の場合は、ステップＳ５５０に進む。
【００９２】
ステップＳ５４０では、ＣＰＵ１００は、図１７に例示したＧｋ用類似症例データテーブルの最終行ＧＴｍに、ステップＳ５２５で読み出した症例データＤ’ｎの“症例データＩＤ（ＤＩＤ）”の値Ｄｎと“類似度Ｒ”の値Ｒｎを上書きする。
【００９３】
ステップＳ５４５では、ＣＰＵ１００は、Ｇｋ用類似症例データテーブルの全ての行（ＧＴ１からＧＴｍまで）を“類似度Ｒ”が昇順となる様にソートする。これにより、Ｇｋ用類似症例データテーブル内では、ＧＴｍの“類似度Ｒ”が最も小さい値となる。
【００９４】
ステップＳ５５０では、ＣＰＵ１００は、インデックス変数ｎに１を加算する。
【００９５】
ステップＳ５５５では、ＣＰＵ１００は、インデックス変数ｎと値Ｎ（図１１に例示した検索用症例データテーブルの行数）とを比較する。インデックス変数ｎが値Ｎより大きい場合は、ステップＳ３７０の処理を終了する。逆に、インデックス変数ｎが値Ｎ以下の場合は、ステップＳ５２５に戻って処理を継続する。
【００９６】
ステップＳ５６０では、ＣＰＵ１００は、インデックス変数ｋに１を加算する。
【００９７】
ステップＳ５６５では、ＣＰＵ１００は、インデックス変数ｋと値Ｇｍａｘ（図１６に例示した対応表の最終行の“検索対象グループＩＤ”の値、図１６の例ではＧｍａｘ＝Ｇ７）とを比較する。インデックス変数ｋが値Ｇｍａｘより大きい場合は、ステップＳ３７０の処理を終了する。逆に、インデックス変数ｋが値Ｇｍａｘ以下の場合は、ステップＳ５３０に戻って処理を継続する。
【００９８】
以上、図５を用いて説明したステップＳ３７０の処理により、図１７に例示した検索対象グループ別（＝診断グループ別）の類似症例データテーブルが出来上がる。
【００９９】
図５を用いて説明したステップＳ３７０の処理手順においては、未確定症例データと確定症例データとの間の類似度を単に閾値処理して類似症例データを選出する替わりに、確定症例データを類似度の高い順に並べて、上位から所定数だけ選択するのである。もし、類似度を単に閾値処理して類似症例データを選出したとすると、以下の問題が生じる。すなわち、症例データベース２に保管された症例データ数が増加すると、互いに類似度が高い症例データ数が増加する。従って、類似度の閾値を変えない限り、選出される類似症例データ数が増加してしまう。つまり、類似度の閾値処理による類似症例検索を行う場合は、症例データベース２に保管される症例データ数に応じて、類似症例検索結果が変動してしまう。一方、第１実施形態における処理手順においては、症例データベース２のサイズ変動には影響されないため、常に一定数の診断グループ別類似症例データを検索できるという利点を持つ。
【０１００】
ステップＳ３８０では、ＣＰＵ１００は、ステップＳ３７０で作成した診断グループ別類似症例データテーブルの内容を参照して、診断グループごとにグループ分けして類似症例データを表示する。以下に、図１５および図１７の具体例を用いて、ＣＰＵ１００が、検索対象グループごとに類似症例データを読み出す際の処理手順を詳述する。
【０１０１】
ＣＰＵ１００は、図１５に例示した対応表の“検索対象グループＩＤ”の値を１行目から順番に読み出す。そして、読み出した“検索対象グループＩＤ”の値に対応する類似症例データテーブルを、図１７に例示した検索対象グループ別類似症例データテーブルから選択する。具体的には、まず図１５の対応表の１行目から値Ｇ３を読み出し、次に図１７のＧ３用類似症例データテーブルを選択する。
【０１０２】
次に、ＣＰＵ１００は、図１７のＧ３用類似症例データテーブルの“症例データＩＤ（ＤＩＤ）”の値を１行目から順番に読み出し、読み出したＤＩＤの値に対応する症例データを、図９または図１０に例示した症例データテーブルから読み出す。具体的には、図１７のＧ３用類似症例データテーブルの１行目からＤＩＤの値Ｄ９を読み出し、図９または図１０からＤＩＤの値がＤ９である（＝９行目の）症例データＤ９を読み出す。
【０１０３】
図１０からＤ９を読み出した場合は、Ｄ９に含まれる“確定診断名”、“所定の臨床情報Ｃ”および“関心領域の画像データＩ”を取り出すことで、Ｇ３用の１つ目の確定診断名付き類似症例データが得られる。他の確定診断名付き類似症例データについても、同様の手順で得ることができる。
【０１０４】
一方、図９からＤ９を読み出した場合は、“確定診断名”は直接取り出せるが、所定の臨床情報および関心領域の画像データは、それぞれ診療録データベース４および医用画像データベース３から読み出す必要がある。所定の臨床情報を取り出すためには、まず、図９から読み出したＤ９に含まれる“診療録データへの参照情報”を取り出す。次に、この参照情報によって参照される診療録データを、診療録データベース４から読み出す。そして、この診療録データの中から、所定の臨床情報を取り出すことになる。関心領域の画像データを取り出すためには、まず、図９から読み出したＤ９に含まれる“画像データへの参照情報”を取り出す。次に、この参照情報によって参照される画像データを、医用画像データベース３から読み出す。さらに、図９から読み出したＤ９に含まれる“関心スライス番号”および“関心領域の座標情報（Ｘ０，Ｙ０，Ｘ１，Ｙ１）”を取り出す。そして、これらの情報を用いて、医用画像データベース３から読み出した画像データの関心スライス番号と関心領域を特定することで、関心領域の画像データが得られる。
【０１０５】
このようにして、図１５および図１７の例では、Ｇ３，Ｇ４，Ｇ２，Ｇ６およびＧ７の検索対象グループ別に、それぞれ５症例，５症例，４症例，３症例および３症例ずつ、確定診断名付き類似症例データが得られることになる。つまり、各グループから類似した所定数以上の確定症例データを抽出される。
【０１０６】
もし、類似症例検索結果を表示するウィンドウサイズが小さいなどの理由で、確定診断名付き類似症例データ数を削減したい場合は、検索対象グループ（＝診断グループ）ごとの類似症例データの選出数を減らす。この際、図１５に例示した類似症例データの選出数の下限値を参照することで、検索対象グループ（＝診断グループ）ごとの類似症例データの選出数を、下限値（１以上）を限度として減らすことができる。
【０１０７】
図７は、ステップＳ３８０における処理の結果、表示される画面の例である。図７の最上段には診断中の画像データの一部が表示されている。これらの画像はいずれも、医師が診断中の画像データから関心領域を切り出したものである。例えば、「新画像１」は、胸部ＣＴ画像の肺野領域の一部に写った異常陰影を囲む関心領域を切り出した画像であるかも知れない。医師が「新画像１」と書かれた画像を選択し、類似症例検索の実行を指示するコマンド入力すると、上述の処理の結果、画面の境界線より下の部分に、類似症例検索結果が表示される。この画面例では、診断グループ名、診断グループ（＝検索対象グループ）別に類似度の高い順に並べた確定診断名付き類似症例データ（＝類似画像データ）および診断グループに対するＴｉｐｓ（診断上の注意点など）が表示されている。
【０１０８】
以上説明したとおり第１実施形態に係る類似症例検索装置によれば、入力した未確定症例データに対して、症例データベース２から異なる診断結果を有する複数の確定症例データを抽出することが可能となる。それにより、ユーザ（医者）は、抽出された複数の確定症例データの診断結果に基づいて、入力した症例データに対応する可能性のある複数の診断結果を検討することが可能となる。
【０１０９】
（第２実施形態）
第２実施形態では、第１実施形態に比較しより多彩な確定症例データを抽出する技術について説明する。なお、装置構成は、第１実施形態と同様であるため説明は省略する。また、図３および図４のフローチャートを用いて上述した処理手順についても同様であるため説明は省略する。第２実施形態では、主に第１実施形態におけるＳ３７０の詳細手順の一部が異なる。
【０１１０】
以下、図５および図６のフローチャート、および図１８に示すデータテーブルを参照して、第２実施形態に係るＳ３７０の処理手順について説明する。
【０１１１】
ステップＳ５１０における処理は、第１実施形態における処理と同様である。
【０１１２】
ステップＳ５１５における処理は、第１実施形態における処理とほぼ同様であるが、図１７に例示した検索対象グループ別類似症例データテーブルの変わりに、図１８に例示した検索対象グループ別類似症例データテーブルを作成する点が異なる。
【０１１３】
図１８は、検索対象グループ別類似症例データテーブルの他の例である。図１８に例示したＧｋ用類似症例データテーブルは、図１７に例示したＧｋ用類似症例データテーブルに、後述する２列の情報を加えたものとなっている。なお、追加した第１の列は“関心領域の画像特徴情報Ｆ”であり、追加した第２の列は“重複数”である。
【０１１４】
ステップＳ５１５では、ＣＰＵ１００は、図１８に例示した検索対象グループ別類似症例データテーブルを主メモリ１０１上に作成し、全テーブルの全構成要素を値０で初期化する。
【０１１５】
ステップＳ５２０からステップＳ５３５までの処理、およびステップＳ５５０からステップＳ５６５までの処理は、第１実施形態における処理と同様であるため説明は省略する。
【０１１６】
第２実施形態における処理において第１実施形態と大きく異なるのは、図５のステップＳ５４０およびステップＳ５５０の部分である。第２実施形態における処理手順では、図５のステップＳ５４０およびステップＳ５４５は実行せず、その代わりに、図６のフローチャートに示したステップＳ６１０からＳ６９０までを実行する。
【０１１７】
図６は、第２実施形態に係る処理手順を示したフローチャートである。
【０１１８】
ステップＳ６１０では、ＣＰＵ１００は、図１８に例示したＧｋ用類似症例データテーブルの行数ｍを調べ、この値ｍを主メモリ１０１に記憶する。また、ＣＰＵ１００は、図１８に例示したＧｋ用類似症例データテーブルの何行目に着目しているかを示すインデックス変数ｉに初期値１を代入し、このインデックス変数ｉを主メモリ１０１に記憶する。なお、上述のＧｋ用類似症例データテーブルのＧｋとは、図１６に例示した“検索対象グループＩＤ”の値である。また、Ｇｋの添え字のｋとは、図５のステップＳ５１０において説明した通り、図１６に例示したソート済み対応表の何行目に着目しているかを示すインデックス変数である。
【０１１９】
ステップＳ６２０では、ＣＰＵ１００は、図１８に例示したＧｋ用類似症例データテーブルから、ｉ行目の症例データＧＴｉを読み出す。
【０１２０】
ステップＳ６３０では、ＣＰＵ１００は、図５のステップＳ５２５で読み出した症例データＤ’ｎと、ステップＳ６２０で読み出したＧＴｉとの類似度ＧｋＲｉを計算する。類似度ＧｋＲｉの計算方法は、図４のステップＳ４４０で説明した類似度Ｒｎの計算方法と同様である。つまり、症例データＤ’ｎの関心領域の画像特徴情報をＦｎとし、症例データＧＴｉの関心領域の画像特徴情報をＦｉとすれば、式（４）を用いて類似度ＧｋＲｉを計算できる。
【０１２１】
【数４】

式（４）において、Ｆｎ＝｛ｆｎ１，ｆｎ２，ｆｎ３，…｝であり、Ｆｉ＝｛ｆｉ１，ｆｉ２，ｆｉ３，…｝である。また、図４のステップＳ４４０で説明したのと同様に、類似度ＧｋＲｉの変わりに、式（５）または（６）を用いて相違度ＧｋＲ’ｉまたはＧｋＲ”ｉを計算してもよい。類似度ＧｋＲｉの代わりに相違度ＧｋＲ’ｉまたはＧｋＲ”ｉを計算した場合は、後述のステップＳ６４０における判断方法も変更する。
【０１２２】
【数５】

【０１２３】
【数６】

【０１２４】
ステップＳ６４０では、ＣＰＵ１００は、ステップＳ６３０で計算した類似度ＧｋＲｉと、予め決めた所定の閾値とを比較する。ここで、所定の閾値とは、同じ診断グループに属する２つの症例データが非常に似ているかどうかを判断するための閾値である。類似度ＧｋＲｉが所定閾値以上である（症例データＤ’ｎとＧＴｉが非常に似ている）場合は、ステップＳ６５０に進む。逆に、類似度ＧｋＲｉが所定閾値未満である（症例データＤ’ｎとＧＴｉがそれほど似ていない）場合は、ステップＳ６６０に進む。
【０１２５】
なお、ステップＳ６３０において、類似度ＧｋＲｉの代わりに相違度ＧｋＲ’ｉまたはＧｋＲ”ｉを計算した場合は、ステップＳ６４０の判断方法は以下のように変更する。相違度ＧｋＲ’ｉまたはＧｋＲ”ｉが所定の閾値未満である場合は、ステップＳ６５０に進む。逆に、相違度ＧｋＲ’ｉまたはＧｋＲ”ｉが所定の閾値以上である場合は、ステップＳ６６０に進む。
【０１２６】
ステップＳ６５０では、ＣＰＵ１００は、症例データＧＴｉの“重複数”を１加算した後、図１８に例示されたＧｋ用類似症例データテーブルのｉ行目の“重複数”の列に書き込む。その後、図６の処理を終了する。ここでの処理により、同じ診断グループ（類似グループ）に属する互いによく似た類似症例データがあった場合、いずれか一つの類似症例データしか選出されないようになる。ただし、非常によく似ていたために選出されなかった類似症例データがいくつあったかをユーザ（医師）に知らせるために、“重複数”を加算している。
【０１２７】
ステップＳ６６０では、ＣＰＵ１００は、インデックス変数ｉに１を加算する。
【０１２８】
ステップＳ６７０では、ＣＰＵ１００は、インデックス変数ｉとステップＳ６１０で調べた値ｍとを比較する。ここで、ｉがｍより大きければステップＳ６８０に進み、ｉがｍ以下であればステップＳ６２０に戻る。
【０１２９】
ステップＳ６８０では、ＣＰＵ１００は、Ｇｋ用類似症例データテーブルの最終行ＧＴｍ（図１８のＧ２用類似症例データテーブルの例ではＧＴ４）に、図５のステップＳ５２５で読み出した症例データＤ’ｎの３つの構成要素を上書きする。つまり、ステップＳ６８０に進んだ段階で、ＣＰＵ１００は、図５のステップＳ５２５で読み出した症例データＤ’ｎと非常によく似た類似症例データは、図１８に例示したＧｋ用類似症例データテーブル内には存在しないことを確認したことになるからである。具体的には、上書きする３つの構成要素は、“症例データＩＤ（ＤＩＤ）”の値Ｄｎ、“関心領域の画像特徴情報Ｆ”の値Ｆｎおよび“類似度Ｒ”の値Ｒｎである。また、この時、Ｇｋ用類似症例データテーブルの最終行ＧＴｍの“重複数”には、初期値として０を書き込む。
【０１３０】
ステップＳ６９０では、ＣＰＵ１００は、Ｇｋ用類似症例データテーブル内のすべての行（ＧＴ１からＧＴｍまで）を“類似度Ｒ”の値が昇順となる様にソートする。その後、図６の処理を終了する。
【０１３１】
図８は、第２実施形態に係る図３のステップＳ３８０における処理の結果、表示される画面の例である。図８に例示した画面例の大半は、図７に例示した画面例と同様である。ただし、診断グループ別類似症例検索結果として表示された各類似症例データの表示している。より詳細には、図６のステップＳ６５０において計算した、同じ診断グループに属する類似症例データ同士の“重複数”を、画像データおよび確定診断名と一緒に表示している。これにより、一つ一つの類似症例データがそれぞれ他の何例の類似症例データと非常に似ていたかを知ることができる。つまり、画像診断を行う医師は“重複数”を見ることによって、各類似症例データが症例データベース２においてどの程度頻繁に現れる症例データであるかを知ることができる。なお、上述の“重複数”の代わりに、重複数から導出される他の情報（グラフなど）を表示してもよい。
【０１３２】
以上説明したとおり第２実施形態に係る類似症例検索装置によれば、入力した未確定症例データに対して、症例データベース２から異なる診断結果を有する複数の確定症例データを抽出することが可能となる。特に、第１実施形態に比較しより広範な（多彩な）複数の確定症例データを抽出可能とすると共に、”重複数”を表示することにより入力した症例データとの関連度合いを知ることが可能となる。
【０１３３】
（他の実施形態）
以上、本発明の実施形態について詳述したが、本発明は、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【０１３４】
なお、本発明は、前述した実施形態の機能を実現するプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置が、供給されたプログラムコードを読み出して実行することによっても達成される。従って、本発明の機能処理をコンピュータで実現するために、コンピュータにインストールされるプログラムコード自体も本発明の技術的範囲に含まれる。
【０１３５】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等、プログラムの形態を問わない。
【０１３６】
プログラムを供給するための記録媒体としては、例えば、フロッピー（登録商標）ディスク、ハードディスク、光ディスク（ＣＤ、ＤＶＤ）、光磁気ディスク、磁気テープ、不揮発性のメモリカード、ＲＯＭなどがある。
【０１３７】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【０１３８】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
【図面の簡単な説明】
【０１３９】
【図１】第１実施形態に係る類似症例検索装置の機器構成を示す図である。
【図２】類似症例検索における関心領域の画像特徴量と診断グループとの関係を概念的に示す図である。
【図３】第１実施形態に係る類似症例検索装置の処理フローチャートである。
【図４】ステップＳ３４０の詳細な処理手順を示すフローチャートである。
【図５】ステップＳ３７０の詳細な処理手順を示すフローチャートである。
【図６】ステップＳ３７０の処理手順の一部の詳細手順を示すフローチャートである（第２実施形態）。
【図７】第１実施形態に係る類似症例検索装置における処理結果の表示例を示す図である。
【図８】第２実施形態に係る類似症例検索装置における処理結果の表示例を示す図である。
【図９】症例データベース２に保管される症例データテーブルの例を示す図である。
【図１０】症例データベース２に保管される症例データテーブルの他の例を示す図である。
【図１１】検索用症例データテーブルの例を示す図である。
【図１２】上位類似症例データテーブルの例を示す図である。
【図１３】複数の“確定診断名”と“診断グループＩＤ（ＧＩＤ）”との対応表の例を示す図である。
【図１４】“診断グループＩＤ（ＧＩＤ）”と複数の“関連グループＩＤ”との対応表の例を示す図である。
【図１５】“検索対象グループＩＤ”と類似症例データの“選出数（下限，上限）”との対応表の例を示す図である。
【図１６】図１５の対応表を、“検索対象グループＩＤ”が昇順となる様にソートした表を示す図である。
【図１７】検索対象グループ別類似症例データテーブルの例を示す図である。
【図１８】検索対象グループ別類似症例データテーブルの他の例を示す図である。
【符号の説明】
【０１４０】
１類似症例検索装置
２症例データベース
３医用画像データベース
４診療録データベース
５ＬＡＮ
１０制御部
１００中央処理装置（ＣＰＵ）
１０１主メモリ
１０２磁気ディスク
１０３表示メモリ
１０４モニタ
１０５マウス
１０６キーボード
１０７共有バス

【特許請求の範囲】
【請求項１】
医用画像データと該医用画像データに対応する確定した診断情報とを含む複数の確定症例データを記憶する症例データベースから１以上の確定症例データを抽出するデータ検索装置であって、
少なくとも医用画像データを含む症例データの入力を受け付ける入力受付手段と、
前記症例データベースに記憶された前記複数の確定症例データの各々について、前記入力受付手段により入力された前記症例データとの類似度を導出する導出手段と、
前記症例データベースに記憶される前記複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類手段と、
前記複数の診断グループの各々から、前記導出手段により導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出手段と、
を含むことを特徴とするデータ検索装置。
【請求項２】
前記抽出手段は、前記分類手段により分類された前記複数の診断グループの各々に対して前記類似度に基づく抽出基準を変更することを特徴とする請求項１に記載のデータ検索装置。
【請求項３】
前記複数の診断グループのうち前記症例データとの類似度が所定閾値以上である確定症例データを含む診断グループを類似グループとして選択する選択手段と、
前記複数の診断グループの各々について、診断グループに含まれる確定症例データと類似度が高い確定症例データが含まれる他の１以上の診断グループを関連グループとして設定する設定手段と、
を備え、
前記抽出手段は、前記類似グループおよび該類似グループの関連グループの各々から、前記導出手段により導出された類似度に基づいて所定数以上の確定症例データを抽出することを特徴とする請求項１に記載のデータ検索装置。
【請求項４】
前記選択手段は、前記症例データベースに記憶される前記複数の確定症例データのうち、前記導出手段により導出された類似度が大きい方から所定数だけの確定症例データを選出し、選出された確定症例データが含まれる診断グループを前記類似グループとして選択することを特徴とする請求項３に記載のデータ検索装置。
【請求項５】
医用画像データと該医用画像データに対応する確定した診断情報とを含む複数の確定症例データを記憶する症例データベースから１以上の確定症例データを抽出するデータ検索装置の制御方法であって、
少なくとも医用画像データを含む症例データの入力を受け付ける入力受付工程と、
前記症例データベースに記憶された前記複数の確定症例データの各々について、前記入力受付工程により入力された前記症例データとの類似度を導出する導出工程と、
前記症例データベースに記憶される前記複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類工程と、
前記複数の診断グループの各々から、前記導出工程により導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出工程と、
を含むことを特徴とするデータ検索装置の制御方法。
【請求項６】
医用画像データと該医用画像データに対応する確定した診断情報とを含む複数の確定症例データを記憶する症例データベースと、該症例データベースにアクセスして１以上の確定症例データを抽出するデータ検索装置と、を含むデータ検索システムであって、
少なくとも医用画像データを含む症例データの入力を受け付ける入力受付手段と、
前記症例データベースに記憶された前記複数の確定症例データの各々について、前記入力受付手段により入力された前記症例データとの類似度を導出する導出手段と、
前記症例データベースに記憶される前記複数の確定症例データを、該複数の確定症例データの各々に含まれる確定した診断情報に基づいて複数の診断グループに分類する分類手段と、
前記複数の診断グループの各々から、前記導出手段により導出された類似度に基づいて所定数以上の確定症例データを抽出する抽出手段と、
を含むことを特徴とするデータ検索システム。
【請求項７】
コンピュータを請求項１乃至４の何れか一項に記載のデータ検索装置の各手段として機能させるためのプログラム。

【図１】