説明

疾患名選定装置

【課題】 同義の疾患を表現する疾患名同士を選定可能な技術を提案する。
【解決手段】 疾患名選定装置は、記憶手段1が、疾患名とその診断日時とを含む診断情報を記憶し、判定手段4,5が、記憶手段1に記憶された診断情報から初診日時と疾患名を抽出し、各疾患名の前記初診日時を用いて所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定して、前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、同義の疾患を表現する疾患名同士を選定する疾患名選定装置に関する。
【背景技術】
【0002】
医療分野において、疾患名表記の統一は重要な課題である。疾患名が全国的に統一されていれば、男女別、年代層別等の疾患発生に関する人口動態調査などが可能となり、有益な統計情報を得ることができる。また、臨床の現場においても、疾患名が統一されていれば、疾患に対する検査、治療、薬剤投与等の過去の履歴を病院横断的に参照することが容易に可能となり、患者が転院する際にも病院間でのミスコミュニケーションを軽減することができる。
【0003】
そこで、同義の疾患を表現する異表記を統一するために、種々の手法が従来より提案されている。例えば、入力された疾患名を主たる疾患名と修飾語に分割し、それらを標準コード辞書を用いて標準コード化する手法が提案されている(特許文献1参照)。また、疾患名の文字列の類似度から、同じ疾患名を表現する疾患名表記を特定する手法が提案されている(非特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−220167号公報
【非特許文献】
【0005】
【非特許文献1】「病名データを新病名マスターへ移行する手法の検討」、第22回医療情報学連合大会予稿集、2003年
【発明の概要】
【発明が解決しようとする課題】
【0006】
医療の分野では、技術的な進展に伴って新規な概念とそれを表現する専門用語が常に作られ続けている。疾患についても、検査技術の改善やゲノム解析等の医学的研究の進歩に伴って、新たな疾患の概念が常に発見され、それに対して新規な疾患名が作られる。このような新しい疾患の概念を表現する疾患名の表記は揺れが大きく病院間で全く異なる表記が用いられることが多い。
【0007】
ここで、上記特許文献1に係る手法では、疾患名を分割し、対応するコードを用いることによって疾患名の同一性を判定するが、医療の現場で記述されるレポートやカルテでは、対応するコードの存在しない疾患名や修飾語を用いることも多く、コード化できない疾患名表記が数多く存在する。また、疾患に対するコードの付与は時間的コストの大きい作業であり、新規な疾患概念に対しては少なくとも一定期間対応するコードが存在しないことになる。また、上記非特許文献1に係る手法では、疾患名文字列の類似度を利用しているが、医療レポートやカルテ等では、「肝細胞癌」を「HCC」と表記するなど、同義の疾患を表現する疾患名表記が必ずしも類似する文字列から構成されているとは限らない。
【0008】
本発明は、上記従来の事情に鑑みなされたものであり、同義の疾患を表現する疾患名同士を選定可能な技術を提案することを目的としている。
【課題を解決するための手段】
【0009】
請求項1に記載の本願発明は、疾患名とその診断日時とを含む診断情報を記憶する記憶手段と、前記記憶手段に記憶された診断情報から初診日時と疾患名を抽出し、各疾患名の前記初診日時を用いて所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定する判定手段とを有し、前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置である。
【0010】
請求項2に記載の本願発明は、疾患名とその診断日時と病院IDを含む診断情報を記憶する記憶手段と、前記記憶手段に記憶された診断情報から病院毎の初診日時と疾患名を抽出し、前記病院毎における各疾患名の前記初診日時を用いて所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定する判定手段とを有し、前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置である。
【0011】
請求項3に記載の本願発明は、疾患名とその診断日時と病院IDを含む診断情報を記憶する記憶手段と、前記記憶手段に記憶された複数の診断情報に基づいて、前記病院毎における疾患名の所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定する判定手段とを有し、前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置である。
【0012】
なお、本願明細書には、下記の同義疾患名選定装置に係る発明も記載されている。
第1の同義疾患名選定装置は、患者の疾患名とその診断に係る日時とを含む診断情報を記憶する第1の記憶手段と、前記第1の記憶手段に記憶された複数の診断情報に基づいて、各疾患名の所定期間別の出現頻度を取得する取得手段と、一の疾患名に係る出現頻度の時期的変化の傾向と他の疾患名に係る出現頻度の時期的変化の傾向との類似性を判定する判定手段と、出現頻度の時期的変化の傾向が類似すると判定された疾患名同士を同義として選定して出力する出力手段と、を備える。
第1の同義疾患名選定装置によると、新規な疾患概念のようなコード化が行なわれていない疾患名表記で、かつ、表層文字列が全く異なる疾患名表記であっても、その疾患に係る出現頻度の時期的変化の傾向の類似性に基づいて、同義の疾患を表現する異表記の疾患名を選定することができる。特に、表記の統一が困難な新規な流行性疾患の場合、同地域の同規模病院に限れば、同じ疾患を持つ患者が病院を訪れる時間的確率分布は、病院を問わず一定になると考えられるため、このような新規流行性疾患概念に対する異表記疾患名の選定に有効的である。
【0013】
第2の同義疾患名選定装置は、第1の同義疾患名選定装置において、前記同義疾患名選定装置は、同義の疾患名同士を予め対応付けた同義疾患名情報を記憶する第2の記憶手段を更に備え、前記判定手段は、同義疾患名情報により対応付けられた疾患名同士を判定対象外とする。
第2の同義疾患名選定装置によると、既知の同義疾患名の組合せが判定対象外となり、同義疾患名の選定に係る処理負担が軽減される。
【0014】
第3の同義疾患名選定装置は、第2の同義疾患名選定装置において、前記出力手段は、同義の疾患名同士を前記第2の記憶手段に出力し、同義疾患名情報として記憶させる。
第3の同義疾患名選定装置によると、同義と判定された疾患名の組合せがその後の判定対象外となり、以降の同義疾患名の選定に係る処理負担が軽減される。
【0015】
第4の同義疾患名選定装置は、第1乃至第3のいずれかの同義疾患名選定装置において、前記診断情報は、患者の診断に係る診断主体の識別情報を含んでおり、前記判定手段は、共通の診断主体に係る疾患名同士を判定対象外とする。
第4の同義疾患名選定装置によると、単一の疾患名を用いると考えられる共通の診断主体(病院の部局や課、或いは医師など)に係る疾患名の組合せが判定対象外となり、同義疾患名の選定に係る処理負担が軽減される。
【0016】
第5の同義疾患名選定装置は、第1乃至第4のいずれかの同義疾患名選定装置において、前記診断情報は、患者を診断した病院の識別情報を含んでおり、前記疾患名選定装置は、病院間の距離に係る距離情報を記憶する第3の記憶手段を更に備え、前記判定手段は、距離が近い病院の組合せから順番に判定を行う。
第5の同義疾患名選定装置によると、近い地域における或る症例の出現頻度の時期的変化の傾向は非常に類似することが考えられるため、近い病院から順番に判定することで、同義疾患名の選定精度を高めることができる。
【0017】
また、本願明細書には、下記の同義疾患名選定プログラムに係る発明も記載されている。
同義疾患名選定プログラムは、コンピュータを、患者の疾患名とその診断に係る日時とを含む診断情報を記憶する第1の記憶手段と、前記第1の記憶手段に記憶された複数の診断情報に基づいて、各疾患名の所定期間別の出現頻度を取得する取得手段と、一の疾患名に係る出現頻度の時期的変化の傾向と他の疾患名に係る出現頻度の時期的変化の傾向との類似性を判定する判定手段と、出現頻度の時期的変化の傾向が類似すると判定された疾患名同士を同義として選定して出力する出力手段として機能させる。
同義疾患名選定プログラムによると、上記作用効果を奏する同義疾患名選定装置をコンピュータを利用して実現することができる。
【発明の効果】
【0018】
請求項1に記載の本願発明によれば、各疾患名の前記初診日時を用いて取得する所定期間別の出現頻度により、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似する疾患名同士を同義として選定して出力することができる。
【0019】
請求項2に記載の本願発明によれば、病院毎における各疾患名の初診日時を用いて取得する所定期間別の出現頻度により、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似する疾患名同士を同義として選定して出力することができる。
【0020】
請求項3に記載の本願発明によれば、病院毎における疾患名の所定期間別の出現頻度により、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似する疾患名同士を同義として選定して出力することができる。
【図面の簡単な説明】
【0021】
【図1】本発明の一実施形態に係る疾患名選定装置の機能ブロック図である。
【図2】本発明の一実施形態に係る同義疾患名情報を例示する図である。
【図3】本発明の一実施形態に係る同義疾患名選定処理の処理フロー図である。
【図4】本発明の一実施形態に係る疾患名の出現確率を例示する図である。
【図5】本発明の一実施形態に係る疾患名距離を例示する図である。
【図6】本発明の一実施形態に係る同義疾患名選定処理の結果を例示する図である。
【図7】本発明の一実施形態に係る疾患名選定装置の機能ブロック図である。
【図8】本発明の一実施形態に係る疾患名選定装置のハードウェア構成図である。
【発明を実施するための形態】
【0022】
本発明を、以下に例示する一実施形態に基づいて具体的に説明する。
なお、病院内の部局を単位として考えた場合、カンファレンスミーティング等で患者の治療/検査経過を報告し合うなど、医師同士で頻繁なコミュニケーションがとられていると考えられるため、以下の説明では、単一の病院部局においては疾患名表記がほぼ統一されていることを前提としている。
【0023】
図1は、本例に係る疾患名選定装置の機能ブロック図を示している。
本例の疾患名選定装置は、文書格納手段1、同義疾患名辞書保持手段2、疾患名抽出手段3、疾患名出現分布計算手段4、同義疾患名判定手段5、同義疾患名出力手段6、を備えている。
【0024】
文書格納手段1は、患者の疾患名とその診断に係る診断日時とを含む診断情報を記憶する。本例では、複数の病院の部局で作成された医療レポートや電子カルテ等の医療文書を格納しており、当該医療文書には、病院部局ID、患者ID、疾患名、文書作成日時(診断日時)等の情報が含まれている。なお、異なる病院で診療分野(内科、脳神経科等)が共通する部局の医療文書を対象としており、例えば、同じ市内の或る病院の内科Aと他の病院の内科Bの医療文書が格納されている。
【0025】
同義疾患名辞書保持手段2は、同義の疾患名同士を予め対応付けた同義疾患名情報を記憶する。本例では、図2にデータ例を示すように、既知の同義疾患名を疾患概念毎に保持しており、例えば、「胃癌」「胃がん」「胃ガン」「胃Cancer」「胃Ca.」は同義の疾患概念を表すものであることがわかる。
【0026】
疾患名抽出手段3は、文書格納手段1に格納されている複数の医療文書から疾患名を抽出する。本例では、「診断名」のフィールドが存在する構造化された医療文書から、該フィールドに記載されている文字列を疾患名として抽出しているが、例えば、構造化されていないフリーテキストのような医療文書の場合には、特開平06−019959等に開示されているような固有名詞抽出技術を用いて疾患名を抽出するようにしてもよい。
【0027】
疾患名出現分布計算手段4は、疾患名毎の所定期間別の出現確率を各病院の部局について取得する。
なお、本例では、或る患者に対する一連の診療行為において各診療日毎に医療文書が作成されることを想定しており、各医療文書に記載された疾患名及び診断日時から代表の疾患名(確定疾患名)及び診断日時(初診日時)の特定を行った後に、この確定疾患名及び初診日時に基づいて出現頻度の計算を行っている。
【0028】
具体的には、同一の病院の部局における同一の患者に係る医療文書を時系列(作成日時順)に並べ、この医療文書系列の中で疾患名が確定している医療文書(確定医療文書)を特定し、当該確定医療文書に記載された疾患名を確定疾患名として抽出すると共に、当該医療文書系列の先頭の文書の作成日時を初診日時として抽出する。なお、本例で扱う医療文書には「確定診断名」のフィールドが存在しており、該フィールドに疾患名が書き込まれた医療文書を確定医療文書と判断して確定疾患名を抽出しているが、フリーテキストの医療文書の場合は、例えば「XXXの所見である。」等の確定疾患名を抽出するパターン文字列を用意し、これにマッチする疾患名を確定疾患名として抽出すればよい。以上によっても確定疾患名が特定できない場合は、医療文書系列の中で最後に出現する疾患名を確定疾患名とすればよい。
【0029】
上記のようにして、確定疾患名及び初診日時を特定すると、疾患名出現分布計算手段4は、各病院の部局毎に、各確定疾患名の所定期間別(週単位や月単位など)の出現確率(同一期間中に出現する全確定疾患名の出現頻度合計に対する各確定疾患名の出現頻度の割合)を算出する。
なお、症状の発症日時が医療文書に含まれている場合には、初診日時に代えて発症日時を特定し、これに基づいて確定疾患名の所定期間別の出現確率を算出してもよい。
【0030】
同義疾患名判定手段5は、疾患名出現分布計算手段4で得られた結果に基づき、病院の部局をまたがる疾患名の2項組の全てを対象に疾患名距離を求め、同義の疾患名か否かを判定する。ただし、疾患名表記が完全に一致する2項組、及び、同義語疾患名保持手段2を参照することにより既知の同義疾患名であることが特定できた2項組については判定対象外とする。
【0031】
ここで、疾患名nのi月度における出現確率をP(n,i)とすると、疾患名Xと疾患名Yの疾患名距離D(X,Y)は下記の(式1)により算出される。
【数1】

【0032】
そして、下記の(式2)を満たす、部局をまたがる疾患名Lと疾患名Mを同義疾患名と判定する。ただし、式中のαは、予め定められた閾値(正の実数)である。すなわち、疾患名Lに対する疾患名Mの疾患名距離が、他の疾患名jの疾患名距離と比較して十分小さい場合(例えば、閾値α=5のときは、他の疾患名距離に比べて1/5より小さい場合)に、疾患名Lと疾患名Mを同義であると判定し、これらを同義疾患名と選定する。
【数2】

【0033】
同義疾患名出力手段6は、同義疾患名判定手段5で選定された同義疾患名組を出力する。例えば、同義疾患名をディスプレイ画面に表示出力したり紙等の媒体に印刷出力することで、利用者に同義疾患名を知らしめ、また例えば、同義疾患名を同義疾患名辞書保持手段2に出力して記憶させることで、その後の同義疾患名判定手段5による判定対象外とする。
【0034】
次に、本例に係る同義疾患名選定処理を、図3の処理フロー図を参照して説明する。
まず、疾患名抽出手段3が、文書格納手段1に格納されている各医療文書から疾患名を抽出する(ステップS1)。本例では、病院部局ID、患者ID、文書作成日時も併せて抽出し、これらを組にした診断データを医療文書毎に生成している。
次に、疾患名出現分布計算手段4が、或る病院部局に係る診断データを対象に(ステップS2)、同一患者に係る診断データを時系列(文書作成日時順)に並べ、当該患者の確定疾患名と初診日時を特定する(ステップS3〜S5)。当該病院部局に係る全患者について確定疾患名と初診日時の特定を終えると(ステップS6)、当該病院部局に係る全確定疾患名の所定期間別の出現確率を計算する(ステップS7)。上記処理を他の病院部局についても行い、全病院部局における全確定疾患名の所定期間別の出現確率の計算を終えると(ステップS8)、同義疾患名判定手段5が、異なる病院部局の確定疾患名の組合せを対象に疾患名距離を計算し(ステップS9)、この疾患名距離に基づいて、同義の疾患を表現する異表記疾患名の選定を行う(ステップS10)。
【0035】
図4は、疾患名出現分布計算手段4で算出される、各病院部局における疾患名の月別の出現確率を例示している。
同図によると、例えば、或る病院の内科Aにおいては、疾患名「A/H1亜型インフルエンザ」が2007年2月に“12.2%”の確率で出現し、また例えば、他の病院の内科Bにおいては、疾患名「A香港型インフルエンザ」が2007年3月に“11.5%”の確率で出現していることがわかる。
【0036】
図5は、図4に示した各病院部局における疾患名の月別の出現確率に基づいて、前述の(式1)により算出した疾患名距離を示している。すなわち、内科Aにおける疾患名と内科Bにおける疾患名との組合せの全てについて疾患名距離を算出しており、例えば、内科Aの「A/H1亜型インフルエンザ」と内科Bの「A香港型インフルエンザ」の疾患名距離は“0.2333”であり、内科Aの「A/H1亜型インフルエンザ」と内科Bの「Aソ連型インフルエンザ」の疾患名距離は“0.0453”であることがわかる。
【0037】
ここで、閾値α=5として前述の(式2)の計算を行うと、図6に示す同義疾患名ペアを得ることができる。すなわち、例えば、内科Aの「A/H1亜型インフルエンザ」と内科Bの「Aソ連型インフルエンザ」の疾患名距離は、内科Aの「A/H1亜型インフルエンザ」と内科Bにおける他の疾患名の疾患名距離の1/5より小さく、出現確率の時期的変化の傾向が類似すると判断できることから、「A/H1亜型インフルエンザ」と「Aソ連型インフルエンザ」とが同義疾患名ペアとして選定される。
【0038】
なお、これまでの説明においては、疾患名の出現確率(同一期間中に出現する全疾患名の出現頻度合計に対する対象疾患名の出現頻度の割合)の時期的変化を比較して同義疾患名の選定を行っているが、例えば、疾患名の出現頻度の変化率(前期間の対象疾患名の出現頻度に対する対象期間の疾患名の出現頻度の増減割合)の時期的変化を比較して同義疾患名の選定を行ってもよい。要は、疾患名の出現頻度の時期的変化の傾向が類似する疾患名同士を同義疾患名として選定すればよい。
【0039】
また、病院の部局をまたがる疾患名の2項組を対象に同義疾患名か否かを判定しているが、このような異なる病院部局に係る疾患名同士について同義判定する態様のほか、異なる医師に係る疾患名同士について同義判定する態様であってもよく、単一の疾患名を用いると考えられる共通の診断主体(病院の部局や課、或いは医師など)に係る疾患名同士を判定対象外とすればよい。
【0040】
図7に示す疾患名選定装置の機能ブロック図は、図1に示した疾患名選定装置の機能を拡張したものであり、病院間距離保持手段7、処理終了判定手段8を更に備えている。
【0041】
病院間距離保持手段7は、病院間の距離に係る距離情報を保持しており、同義疾患名判定手段5が当該距離情報を参照して各病院間の距離を取得し、距離が近い病院の組合せから順番に疾患名の同義判定を行う。なお、各病院の座標値(緯度、経度)を距離情報として保持し、これに基づいて病院間の距離を算出してもよく、各病院間の距離を予め算出しておき、これを距離情報として保持するようにしてもよい。
処理終了判定手段8は、未処理の病院の組合せの中で最も近い病院間の距離が所定の閾値を超える場合に、処理を終了すると判定する。
【0042】
当該疾患名選定装置によると、まず、地理的に最も近い2つの病院の部局同士で同義疾患名を選定し、得られた同義疾患名を同義疾患名辞書保持手段2に追加する。次に、地理的に2番目に近い2つの病院の部局同士で同義疾患名を選定し、得られた同義疾患名を同義疾患名辞書保持手段2に追加する。この処理は、処理終了判定手段8により終了判定がなされるまで繰り返される。このように、地理的に近い病院から順次処理を行うことにより、全国的な同義疾患名の選定を高い精度で実施することができる。
【0043】
図8は、本例の疾患名選定装置の主要なハードウェア構成を示している。
すなわち、本例の疾患名選定装置は、各種演算処理を行うCPU、CPUの作業領域となるRAM、基本的な制御プログラムを記憶するROM、本発明に係る各機能を実現するためのプログラム等を記憶するHDD、利用者に対する情報を表示出力する液晶ディスプレイや利用者からの情報の入力を受け付けるマウス・キーボード等の機器とのインターフェースである入出力I/F、他の装置との間で通信を行うインターフェースである通信I/F、等のハードウェア資源を有するコンピュータで構成されている。
【0044】
そして、本発明に係るプログラムをHDDから読み出してRAMに展開し、これをCPUにより実行させることで、本発明に係る第1の記憶手段(文書格納手段1)、第2の記憶手段(同義疾患名辞書保持手段2)、取得手段(疾患名抽出手段3及び疾患名出現分布計算手段4)、判定手段(同義疾患名判定手段5)、出力手段(同義疾患名出力手段6)等を、疾患名選定装置のコンピュータに実現している。
【0045】
なお、本発明に係るプログラムは、例えば、当該プログラムを記憶したCD−ROM等の外部記憶媒体を配布する形式や、ネットワークを介して配信する形式により、本発明の実施者に提供される。
また、本発明に係る疾患名選定装置の各機能手段は、本例のようなソフトウェア構成により実現する態様に限られず、専用のハードウエアモジュールで構成してもよい。
また、本発明に係る疾患名選定装置の各機能手段は、本例のように1台のコンピュータに設ける態様に限られず、複数台のコンピュータに分散して設けてもよい。
【符号の説明】
【0046】
1:文書格納手段、
2:同義疾患名辞書保持手段、
3:疾患名抽出手段、
4:疾患名出現分布計算手段、
5:同義疾患名判定手段、
6:同義疾患名出力手段、
7:病院間距離保持手段、
8:処理終了判定手段

【特許請求の範囲】
【請求項1】
疾患名とその診断日時とを含む診断情報を記憶する記憶手段と、
前記記憶手段に記憶された診断情報から初診日時と疾患名を抽出し、各疾患名の前記初診日時を用いて所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定する判定手段とを有し、
前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置。
【請求項2】
疾患名とその診断日時と病院IDを含む診断情報を記憶する記憶手段と、
前記記憶手段に記憶された診断情報から病院毎の初診日時と疾患名を抽出し、前記病院毎における各疾患名の前記初診日時を用いて所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定する判定手段とを有し、
前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置。
【請求項3】
疾患名とその診断日時と病院IDを含む診断情報を記憶する記憶手段と、
前記記憶手段に記憶された複数の診断情報に基づいて、前記病院毎における疾患名の所定期間別の出現頻度を取得し、一の疾患名と他の疾患名とにそれぞれ係る出現頻度の時期的変化の傾向の類似性を判定する判定手段とを有し、
前記傾向が類似すると判定された疾患名同士を同義として選定して出力する疾患名選定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−33502(P2013−33502A)
【公開日】平成25年2月14日(2013.2.14)
【国際特許分類】
【出願番号】特願2012−235300(P2012−235300)
【出願日】平成24年10月25日(2012.10.25)
【分割の表示】特願2007−241441(P2007−241441)の分割
【原出願日】平成19年9月18日(2007.9.18)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】