説明

文書データ処理装置

【課題】文書データ中の記述の正当性を的確に判定し、この判定のための辞書の管理を容易にする。
【解決手段】概念抽出部13は、入力文書データの第1の欄の表現に対応する表層表現に対応付けられる概念名を表層表現辞書から抽出する。記載概念抽出部15は、入力文書データの第2の欄の表現に対応する表層表現に対応付けられる概念名を表層表現辞書から抽出する。判定部17は、概念抽出部13により抽出した概念名の関連概念リストを階層概念辞書の体系および各体系間のリンク情報をもとに生成する。判定部17は、関連概念リスト中に、記載概念抽出部15により抽出した概念名が含まれていなければ、文書データ中の第1の欄の表現に関連して第2の欄に記述すべき表現が欠落していると判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データの記述の解析を行なう文書データ処理装置に関する。
【背景技術】
【0002】
従来、文書データの作成や校正を支援するために、分野依存辞書を使用して入力文書データ中の記述が対応する分野の単語が優先的に提示する技術や、構文解析により文単位で文法チェックを行なう技術がある。
【0003】
また、例えば特許文献1に開示されるように、入力文書データ中の記述のうち具体性に欠ける部分を提示する技術がある。この技術では、入力文書データ中の記述に予め定められた特徴部分が含まれる場合に、この特徴部分を有する文が具体的であるために欠落すべきでない5W1H(when,whereなど)を含んでいる否かを判定する技術がある。
【0004】
また、例えば特許文献2に開示されるように、語の概念関係を記述したオントロジ辞書を参照し、分野特有の辞書自動構築を支援するものがある。
【特許文献1】特開2002−183117号公報
【特許文献2】特開2001−67356号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、前述したように文書データ中の記述が関わる分野の単語を優先的に表示させたり文法チェックを行なったりする技術では、記述内容の意味的不足を判定することはできない。また、前述したように文書データ中の予め定められた特徴を有する文に5W1Hが含まれているか否かを判定すれば具体性のない文をチェックすることができるが、5W1Hは概念的な要素であるので、文書データが例えば製品の修理報告書である場合に、当該修理報告書に記述されるべき具体的な単語が無い場合にこれを指摘するものではない。
【0006】
また、特許文献2に開示された技術では、語の概念関係を記述したオントロジ辞書を参照し、分野特有の辞書自動構築を支援するために階層化した辞書を用いているが、複数の概念体系の関係付けに関しての言及が不明確であり、装置としての実現が確実ではなかった。
【0007】
そこで、本発明の目的は、文書データ中の記述の正当性を的確に判定し、この判定のための辞書の管理を容易にすることが可能である文書内データ処理装置を提供することにある。
【課題を解決するための手段】
【0008】
すなわち、本発明に係わる文書データ処理装置は、概念名および当該概念名の表層表現を対応付けた表層表現辞書を記憶する表層表現記憶手段と、概念名の体系情報および、前記概念名のうち第1の概念名と当該第1の概念名の上位概念名や下位概念名でなく当該第1の概念名に対応する表現とともに前記文書データ中に含まれるべき表現に対応する第2の概念名とのリンク情報を含む階層概念辞書を記憶する階層概念記憶手段と、入力文書データ中の第1の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する第1の抽出手段と、入力文書データ中に第1の表現とともに記述される第2の表現に関わる表層表現に対応付けられる概念名を表層表現辞書から抽出する第2の抽出手段とを備え、階層概念辞書の体系情報およびリンク情報をもとに、第1の抽出手段により抽出した概念名の関連概念名を抽出し、この関連概念名に第2の抽出手段により抽出した概念名が含まれていない場合に、入力文書データ中に第1の表現とともに記述されるべき表現が不足していると判定することを特徴とする。
【発明の効果】
【0009】
本発明によれば、文書データ中の記述の正当性を的確に判定し、この判定のための辞書の管理を容易にすることができる。
【発明を実施するための最良の形態】
【0010】
以下図面により本発明の実施形態について説明する。
(第1の実施形態)
まず、本発明の第1の実施形態について説明する。
図1は、本発明の実施形態にしたがった文書データ処理装置の構成例を示すブロック図である。
図1に示すように、本発明の実施形態にしたがった文書データ処理装置は、装置全体の制御を司る制御部11、記憶装置12、概念抽出部13、概念選択部14、記載概念抽出部15、入出力インタフェース16、判定部17、を備え、それぞれがバス18を介して相互に接続される。
【0011】
記憶装置12は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。記憶装置12は制御部11、概念抽出部13、概念選択部14、記載概念抽出部15による実行対象の制御プログラムを記憶するのに加え、判定ルール記憶部21、表層表現辞書記憶部22および階層概念辞書記憶部23を有する。
【0012】
判定ルール記憶部21には、入力文書データのある欄、例えば「症状」欄で記載を求められた概念に対して、別の欄、例えば「報告内容」欄の記載が不足しているか否かを判定するための判定ルールが記憶される。
判定ルールは、例えば「症状」欄で記載が求められたと判定された概念Aに対して、「報告内容」欄の記載が、(1)概念Aが記載されていれば良い、(2)概念A、もしくは概念Aの上位概念のいずれかが記載されていれば良い、(3)概念A、もしくは概念Aの上位概念、もしくは概念Aの下位概念のいずれかが記載されていれば良い、(4)概念A、もしくは概念Aのリンク先概念のいずれかが記載されていれば良い、(5)概念A、もしくは概念Aの上位・下位概念、もしくは概念Aのリンク先概念、もしくは概念Aのリンク先概念の上位・下位概念のいずれかが記載されていれば良い、などが挙げられ、いずれかが設定される。
【0013】
図2は、本発明の第1の実施形態にしたがった文書データ処理装置1の記憶装置12に記憶される表層表現辞書の構成例を表形式で示す図である。この表層表現辞書は、家電の故障診断報告書をもとにした例である。
表層表現辞書記憶部22には図2に示した構成の表層表現辞書が記憶される。この表層表現辞書は、入力文書データ中に予め定められた概念に対応する表現が含まれているか否かの判定のために用いられ、概念名に関連付ける表層表現と、その概念が関わる対象機器・機種のリストである。
表層表現とは、入力文書中における実際の表現である。表層表現辞書中の機器、機種や表層表現は、正規表現を用いて記述することができる。
【0014】
表層表現辞書の概念名の欄は、入力文書に記載される可能性のある概念の名称を記述するものである。対象機器・機種の欄は、「概念名」列に記述された概念が記載される可能性がある機器名や機種名が記述される。
表層表現の欄は、入力文書中で、概念名の欄に記述された概念が実際に記載される場合の表現が記述される。報告内容判定時の表層表現の欄は、入力文書中「報告内容」の判定時には表層表現の欄の記載に別の表層表現を加えて判定したい場合に、追加する表層表現が記述される。
【0015】
また、概念体系上の概念としては記述したい一方で入力文書の「症状」、「報告内容」欄からは概念として抽出しない方が良い概念については、「表層表現」欄及び「報告内容判定時の表層表現」欄を特定の記述、例えば「none」としてもよい。
さらに、入力文書データの「症状」欄の記載概念判定時は概念として抽出することが好ましくない一方で、「報告内容」欄では上位概念・下位概念として抽出したい概念については、「表層表現」欄を「none」として、「報告内容判定時の表層表現」欄をその概念が実際に記載される場合の表現としてもよい。
【0016】
本発明の実施形態にしたがった文書データ処理装置1は、入力文書データ中の表現に表層表現辞書で管理される表層表現と同じ表現が存在する場合に、これと表層表現辞書上で関連付けられる概念名に対応する表現が入力文書データに含まれていると判定する。
【0017】
図3は、本発明の第1の実施形態にしたがった文書データ処理装置が管理する階層概念の一例を示す図である。
本発明の第1の実施形態にしたがった文書データ処理装置は、図3に示したような階層概念を管理する。図3に示した階層概念は、「部品」「症状」のような、独立した複数階層概念、つまりカテゴリである。図3に示した階層概念の各階層の概念名は、図2に示した表層表現辞書上の「概念名」の列の各概念名と対応する。
【0018】
具体的には、この階層概念では、第1の階層の概念名「部品」の下位の第2の階層の概念名として「冷熱部品」、「フィルタ」、「ホース」、「回転部品」、「ターンテーブル」、「ヒータ」が関連付けられる。
また、第2の階層の概念名「冷熱部品」の下位の第3の階層の概念名として「コンプレッサ」、「冷媒」が関連付けられ、第2の階層の概念名「回転部品」の下位の第3の階層の概念名として「モータ」、「ベルト」が関連付けられる。
また、第1の階層の概念名「症状」の下位の第2の階層の概念名として「動作時の異常症状」、「電源OFF時の異常」、「目視可能な破損」が関連付けられる。また、第2の階層の概念名「動作時の異常症状」の下位の第3の階層の概念名として「動作不良」、「異常終了」、「その他異常」が関連付けられる。
また、第3の階層の概念名「動作不良」の下位の第4の階層の概念名として「冷えない」、「温まらない」、「回らない」が関連付けられる。また、第3の階層の概念名「異常終了」の下位の第4の階層の概念名として「動かない」、「途中で止まる」が関連付けられる。また、第3の階層の概念名「その他異常」の下位の第4の階層の概念名として「水漏れ」、「異常音」が関連付けられる。
【0019】
また、この階層概念ではカテゴリ内の上下関係だけではなく、別のカテゴリへのリンク情報も管理される。カテゴリを跨るリンク情報は、概念としては直接の関係がないが、文書中の記載判定においては関連性のある概念を関連付ける情報である。つまり、リンク情報とは、階層概念における概念名と、当該概念名が属する体系と別の体系、つまり上位概念でも下位概念でもない概念名との組み合わせである。
【0020】
図3および図4に示した例では、4つのリンク情報が設定される。図3中の点線が、他カテゴリとのリンクを示している。第1のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「冷熱部品」と第1の階層の概念名「症状」の下位の第4の階層の概念名「冷えない」との組み合わせである。
また、第2のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「ホース」と第1の階層の概念名「症状」の下位の第4の階層の概念名「水漏れ」との組み合わせである。
また、第3のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「回転部品」と第1の階層の概念名「症状」の下位の第4の階層の概念名「回らない」との組み合わせである。
また、第4のリンク情報は、第1の階層の概念名「部品」の下位の第2の階層の概念名「ターンテーブル」と第1の階層の概念名「症状」の下位の第4の階層の概念名「回らない」との組み合わせである。
【0021】
これらのリンク情報を管理しておけば、入力文書データの記述が、機器名「電子レンジ」で部品「ターンテーブル」に関する記述である場合、その文書は前述した第4のリンク情報をもとに、当該部品「ターンテーブル」に特有の症状「回らない」に関して記載されるとみなすことができ、部品および当該部品に特有の症状を関連付けることができる。
【0022】
このリンク情報には作成ルールが存在する。この作成ルールは、例えば「同じカテゴリ内にリンクを張らない」、「ある枝から別カテゴリの同一の枝に対して複数リンクを張らない」、「リンクが張られた項目を削除する場合、張られていたリンクは上位概念に移行する」などである。
【0023】
また、図3に示した例では、リンク情報とは別に、第1の階層の概念名「症状」の下位の第4の階層の概念名「水漏れ」と第1の階層の概念名「症状」の下位の第3の階層の概念名「水漏れ」とが同一項目である旨を管理されている。この管理によって、これらの概念名は表層表現などの辞書情報を共有できる。
【0024】
図4は、本発明の第1の実施形態にしたがった文書データ処理装置の記憶装置12に記憶される階層概念辞書の構成例を表形式で示す図である。
図4に示すように、本発明の第1の実施形態にしたがった文書データ処理装置の階層概念辞書記憶部23には階層概念辞書が記憶される。
【0025】
この階層概念辞書は、図3に示した階層構造を具現化したものである。この階層概念辞書では、行のラベル(ID)、概念名、他概念の行ラベルとのリンク情報、階層構成情報が関連付けられて管理される。
階層構成情報は、階層概念辞書上で関連付けられる概念名が属する概念体系を最上位から該当概念名まで列挙する欄である。この欄は図4に示した階層概念辞書上の「階層01」、「階層02、「階層03」、「階層04」が該当する。
階層概念辞書の行のラベルは、各行に異なる文字列が割り付けられる。概念名は、概念体系が異なれば、階層概念辞書中で同じものが複数回現れてもよい。
階層概念辞書は、図4に示した例では、便宜上、上位概念の行から順に並べて管理されるが、概念体系が上位概念から順に取り出せれば、実際に階層概念辞書記憶部23に記憶される順番はこれに限定されない。
【0026】
概念抽出部13は、入力文書の所定の欄の表現に対応する概念名を、表層表現辞書記憶部22に記憶された表層表現辞書から抽出することで、入力文書データ中で記載が求められている概念を抽出する。
概念選択部14は、入力文書の所定の欄の表記に従い、当該入力文書の報告で記載が可能である概念名を表層表現辞書に登録された概念名から選択する。
記載概念抽出部15は、入力文書の所定の欄の表現に対応する概念名を報告内容欄チェック用辞書から抽出する。報告内容欄チェック用辞書は表層表現辞書に後述する必須情報フラグの列を加えたものである。
【0027】
入出力インタフェース16は、ユーザ端末装置2との間でデータのやりとりを行なう。また、入出力インタフェース16は図示しない外部記憶装置とケーブルを介して接続可能であり、この外部記憶装置との間で文書データを入出力する。
判定部17は、概念抽出部13で抽出した概念名と、記載概念抽出部15で抽出した概念名と、判定ルール記憶部21に記憶された判定ルールに従い、入力文書データ中における記載概念抽出部15により参照した欄の記述が不足しているか否かを判定する。
【0028】
図5は、本発明の第1の実施形態にしたがった文書データ処理装置と接続されるユーザ端末装置の構成例を示すブロック図である。
ユーザ端末装置2は、整合性チェックを行なう文書を作成するユーザが取り扱う端末装置である。図5に示すように、ユーザ端末装置2は、装置全体の処理を司る制御部31、記憶装置32、表示装置33、入力装置34、通信インタフェース35を備え、それぞれがバス36を介して相互に接続される。
【0029】
記憶装置32は、例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成された記憶装置である。記憶装置32は、制御用のプログラムを記憶する。また、記憶装置32は、制御部31による各種処理のワークメモリとしても機能する。
表示装置33は、例えば液晶ディスプレイであり、文書データ処理装置1の判定部17の判定結果をユーザに向けて出力する。メッセージは、例えば「症状Aに関する記載が求められていますが、報告内容に関連する記載がありません。」「症状に対して記載が不足した概念はありません。」である。
【0030】
入力装置34は例えばキーボードやマウスであり、文書内整合性チェックを行なう文書作成にかかる操作を受け付ける。通信インタフェース35は、ケーブルを介して文書データ処理装置1と接続され、ユーザ端末装置2において作成された入力文書や文書データ処理装置1の処理結果などのやり取りを行う。
また、通信インタフェース35は外部記憶装置とケーブルを介して接続可能であり、この外部記憶装置との間で入力文書を入出力することもできる。
【0031】
次に、図1に示した構成の文書データ処理装置の動作について説明する。図6は、本発明の第1の実施形態にしたがった文書データ処理装置1の処理動作の一例を示すフローチャートである。
【0032】
まず、入力文書データは、ユーザ端末装置2の入力装置34に対する操作により作成されて、この文書データが通信インタフェース35から文書データ処理装置1の入出力インタフェース16へ入力される、または、外部記憶装置に記憶された作成済みの入力文書データが文書データ処理装置1の入出力インタフェース16に入力されるとする。文書データ処理装置1の制御部11は入出力インタフェース16に入力された文書データを記憶装置12に記憶する(ステップS1)。
【0033】
図7は、本発明の第1の実施形態にしたがった文書データ処理装置に入力される入力文書データの構成例を示す図である。
この入力文書データは冷蔵庫の故障診断報告書であり、対象機器名、機種名、症状および報告内容が表形式で記述されたものである。
図7に示した例では、機器名の欄の記載は「冷蔵庫」であり、機種名の欄の記載は「RFxx−yyy」であり、症状の欄の記載は「庫内が冷えない」であり、報告内容の欄の記載は「コンプレッサ不良。交換必要。」である。
なお、入力文書データは図7に示した表形式に限らず、箇条書き形式であってもよいし通常の文章形式であってもよい。
【0034】
概念選択部14は、表層表現辞書記憶部22に記憶された表層表現辞書を読み込み(ステップS2)、概念抽出部13と連動して表層表現の各行に対する判定を実行する(ステップS3)。
【0035】
概念選択部14は、表層表現辞書の1行を取り出し、入力文書の「機器名」、「機種名」欄の表現に、表層表現辞書の選択行の「対象機器・機種」欄の表現が文字列としてマッチするか否かを判定する(ステップS4)。
概念選択部14は、表層表現辞書の選択行の「対象機器・機種」欄の表現が入力文書の「機器名」「機種名」欄の表現にマッチしない場合は(ステップS4のNO)、当該表層表現辞書の次の行の処理に移る。
一方、概念選択部14が、表層表現辞書の選択行の「対象機器・機種」欄の表現が入力文書の「機器名」、「機種名」欄の表現にマッチすると判定した場合は(ステップS4のYES)、概念抽出部13は、図7に示した入力文書の「症状」欄の表現に、表層表現辞書の選択行の「表層表現」欄の表現が文字列としてマッチするか否かを判定する(ステップS5)。
【0036】
概念抽出部13は、入力文書の「症状」欄の記載に、表層表現辞書の選択行の「表層表現」欄の内容が文字列としてマッチする場合は(ステップS5のYES)、必須情報フラグを新たに付加し、表層表現辞書の選択行の必須情報フラグの値を「1」にする(ステップS6)。
また、概念抽出部13は、入力文書の「症状」欄の記載に、表層表現辞書の選択行の「表層表現」欄の内容が文字列としてマッチしない場合は(ステップS5のNO)、必須情報フラグを新たに付加し、当該選択行の必須情報フラグの値を「0」にする。
【0037】
概念抽出部13は、表層表現辞書の選択行に必須情報フラグを加えた情報を、新たに生成する報告内容欄チェック用辞書のエントリとして記憶装置12に出力する(ステップS7)。
概念抽出部13は、表層表現辞書の全ての行に対する処理の終了後、記憶装置12に出力された報告内容欄チェック用辞書エントリをまとめ、報告内容欄チェック用辞書として記憶する(ステップS8→S9)。
【0038】
図8は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック用辞書の一例を示す図である。
図8に示した報告内容欄チェック用辞書は、図2に示した表層表現辞書の各行のうち「対象機器・機種」欄が図7に示した入力文書の「機器名」、「機種名」欄の表現にマッチしない行は含まれていない。
また、図8に示した報告内容欄チェック用辞書は、図2に示した表層表現辞書と比較して、必須情報フラグの列が追加され、各行のうち入力文書の「症状」欄の表現にマッチする表層表現「冷えない」の行の必須情報フラグの欄に「1」が記入される。
【0039】
記載概念抽出部15は、記憶装置12に記憶された報告内容欄チェック用辞書を読み込み、その1行ごとに判定処理を行なう(ステップS10)。
記載概念抽出部15は、報告内容欄チェック用辞書の1行を取り出し、入力文書の「報告内容」欄の記載に、報告内容欄チェック用辞書の選択行の「表層表現」欄の記載が文字列としてマッチするか否かを判定する(ステップS11)。
ただし、記載概念抽出部15は、報告内容欄チェック用辞書の選択行の「報告内容判定時の表層表現」欄が空欄ではない場合は、その内容を当該辞書の「表層表現」欄の記載と合わせて、マッチするか否かの判定対象とする。
【0040】
記載概念抽出部15は、入力文書の「報告内容」欄の記載が、報告内容欄チェック用辞書の選択行の「表層表現」欄の記載、および「報告内容判定時の表層表現」欄の空白でない記載のいずれかとマッチする場合は(ステップS11のYES)、報告内容欄有無フラグの列を新たに設定し、報告内容欄チェック用辞書の選択行の報告内容欄有無フラグの値を「1」にする(ステップS12)。
一方、記載概念抽出部15は、入力文書の「報告内容」欄の記載が、報告内容欄チェック用辞書の選択行の「表層表現」欄の記載、および「報告内容判定時の表層表現」欄の空白でない記載のいずれともマッチしない場合は(ステップS11のNO)、報告内容欄有無フラグの列を新たに設定し、当該選択行の報告内容欄有無フラグの値を「0」にする。
【0041】
図9は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック結果の一例を示す図である。
図9に示した報告内容欄チェック結果は、図8に示した報告内容欄チェック用辞書の各行のうち、必須情報フラグが「1」である行、つまり概念名が「冷えない」である行について、もしくは、報告内容欄記載有無フラグが「1」である行、つまり概念名が「コンプレッサ」である行を残し、これらの行のうち概念名、必須情報フラグ、報告内容欄記載有無フラグの列を残したものである。
【0042】
記載概念抽出部15は、報告内容欄有無フラグの値を設定した後、報告内容欄チェック用辞書の選択行の必須情報フラグの値と報告内容欄有無フラグの値がともに「0」であるか否かをチェックする(ステップS13)。
記載概念抽出部15は、両方のフラグのいずれかが「1」である場合には(ステップS13のNO)、新たに生成する報告内容チェック結果リストのエントリとして、概念名、必須情報フラグの値、報告内容欄有無フラグの値を記憶装置12に出力する(ステップS14)。
【0043】
記載概念抽出部15は、ステップS14の処理後、もしくはステップS13の処理で「YES」と判定した場合には当該報告内容欄チェック用辞書の次の行の処理に移る(ステップS15)。
記載概念抽出部15は、報告内容欄チェック用辞書の全行に対する処理終了後、記憶装置12に記憶された報告内容欄チェック結果リストエントリをまとめ、報告内容欄チェック結果として記憶する(ステップS16)。
【0044】
判定部17は、記載概念抽出部15の出力である報告内容欄チェック結果と、判定ルール記憶部21に記憶された判定ルールを用い、階層概念辞書記憶部23に記憶された階層概念辞書をチェックする(ステップS17)。
【0045】
ここで、判定部17の処理であるステップS17の処理の詳細を述べる。図10は、本発明の第1の実施形態にしたがった文書データ処理装置1の判定部17の処理動作の一例を示すフローチャートである。
判定部17は、記憶装置12に記憶された報告内容欄チェック結果リストを読み込む(ステップS21)。次に、判定部17は階層概念辞書記憶部23に記憶された階層概念辞書を読み込む(ステップS22)。
【0046】
判定部17は、報告内容欄チェック結果リストを1行ずつ取り出し、この報告内容欄チェック結果リストの選択行の、報告内容欄記載有無フラグの値をチェックする(ステップS24)。
判定部17は、報告内容欄記載有無フラグの値が「1」ならば(ステップS24のYES)、報告欄チェック結果リストの選択行の概念名と同じ概念名の行を階層概念辞書から探し、当該階層概念辞書の同じ概念名の行に「記載」の列を新たに付加し、この値を「有」とする(ステップS25)。
【0047】
判定部17は、ステップS25の処理後、もしくはステップS24の処理で「NO」と判定した場合、報告内容欄チェック結果リストの選択行の必須情報フラグの値をチェックする(ステップS26)。判定部17は、報告内容欄チェック結果リストの選択行で、必須情報フラグの値が「1」ならば(ステップS26のYES)、階層概念辞書の選択行の概念名を、新たに生成するチェック対象概念リストのエントリとして記憶装置12に出力する(ステップS27)。
【0048】
判定部17は、ステップS27の処理後、もしくはステップS26の処理で「NO」と判定した場合には当該報告内容欄チェック結果リストの次の行の処理に移る(ステップS28)。
【0049】
判定部17は、報告内容欄チェック結果リストの全行の処理終了後、記憶装置12に出力されたチェック対象概念リストのエントリをまとめて、チェック対象概念リストとして記憶装置12に記憶する(ステップS29)。
【0050】
図11は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力であるチェック対象概念リストの一例を示す図である。
図11に示した例では、チェック対象概念リストは、報告内容欄チェック結果リストにおいて必須情報フラグの値が「1」であった列の概念名「冷えない」が管理される。図11に示した例では、チェック対象概念リストの行は1行のみであるが、リストは1行とは限らない。
【0051】
図12は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である記載有無情報を付与した階層概念辞書の一例を示す図である。図12に示した例では、図4に示した階層概念辞書に「記載」の列を付与し、この列におけるステップS24の処理で「YES」と判定した時点での当該階層概念辞書の選択行の欄に「有」が設定されている。
【0052】
判定部17は、記憶装置12に記憶されたチェック対象概念リストを読み込み、リストを1行ずつ選択する(ステップS30)
判定部17は、チェック対象概念リストの選択行の概念名を図12に示した階層概念辞書上で探し、判定ルール記憶部21に記憶された判定ルールに従い、チェック対象概念リストの選択行の概念名の関連概念を図12に示した階層概念辞書から抽出してリスト化する(ステップS31)。
【0053】
ここで、例えば、前述した判定ルールの例である、(5)「概念A、もしくは概念Aの上位・下位概念、概念Aの他カテゴリへのリンク先概念、リンク先概念の上位下位概念のいずれかが記載されていれば良い」が設定されているとする。
【0054】
図13は、本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である関連概念リストの一例を示す図である。
図13に示した関連概念リストは、チェック対象概念リストの選択行の概念名「冷えない」の関連概念リストである。
【0055】
まず、判定部17は、チェック対象概念リストの選択行の概念名「冷えない」、ID「s4」および「記載」の列の値からなる行を図12に示した階層概念辞書から抽出して空のリストに追加する。次に、判定部17は、当該選択行の概念名「冷えない」の上位概念である概念名「症状」、「動作時の異常症状」、「動作不良」、当該概念名のIDおよび「記載」の列の値からなる行を図12に示した階層概念辞書から抽出してリストに追加する。
【0056】
上位概念とは、チェック対象概念リストの選択行の概念名「冷えない」よりも階層数が少なく、全階層構成名が概念名「冷えない」の対応する階層の名称と一致する概念を示す。概念名「冷えない」には下位概念がないため、関連概念リストに概念名「冷えない」の下位概念が関わる行は追加されない。
また、下位概念とは、チェック対象概念リストの選択行の概念名「冷えない」よりも階層数が多く、概念名「冷えない」の全階層構成の名称が対応する階層の名称と一致する概念を示す。判定部17は、概念名「冷えない」が図12に示した階層概念辞書上で複数箇所に現れる場合は、その全ての階層概念辞書上の行に対して同じ処理を行う。
【0057】
また、判定部17は、図12に示した階層概念辞書上でIDが「s4」である概念名「冷えない」にはリンク先として「p2_冷熱部品」が設定されているため、図12に示した階層概念辞書上のID「p2」、概念名「冷熱部品」および「記載」の列の値でなる行を図12に示した階層概念辞書から抽出してリストに追加する。
【0058】
さらに、判定部17は、IDが「p2」である概念名「冷熱部品」の上位概念名「部品」、下位概念名「コンプレッサ」、「冷媒」、当該概念名のIDおよび「記載」の列の値からなる行を図12に示した階層概念辞書から抽出して関連概念リストに追加する。
【0059】
判定部17は、作成した関連概念リストを1行ずつ選択する(ステップS32)。判定部17は、関連概念リストの選択行で「記載」欄の「有」の有無をチェックする(ステップS33)。
判定部17は、関連概念リストの選択行の「記載」欄が「有」である場合は(ステップS33のYES)、処理中のチェック対象概念リストの選択行に記載ありを示す情報を付与する(ステップS34)。
【0060】
判定部17は、ステップS34の処理後、もしくはステップS33の処理で「NO」と判定した場合には当該関連概念リストの次の行の処理に移る(ステップS35)。
判定部17は、関連概念リストの全行に対する処理終了後、チェック対象概念リストの選択行に記載ありを示す情報が付与されているか否かをチェックする(ステップS36)。
【0061】
判定部17は、チェック対象概念リストの選択行に記載ありを示す情報が付与されていない場合は(ステップS36のNO)、チェック対象概念リストの選択行の概念名に対応する表現は入力文書中の報告内容の欄に記載されなかったと判定し、これを示す情報をアラームリストエントリとして記憶装置12に出力する(ステップS37)。
【0062】
判定部17は、ステップS37の処理後、もしくはステップS36の処理で「YES」と判定した場合には当該チェック対象概念リストの次の行の処理に移る(ステップS38)。
【0063】
判定部17は、チェック対象概念リストの全行に対する処理終了後(ステップS38)、記憶装置12に記憶されたアラームリストエントリをまとめ、ユーザに提示するメッセージを入出力インタフェース16を介してユーザ端末装置2に出力する(ステップS38)。
ユーザ端末装置2の通信インタフェース35がメッセージを入力すると、制御部31は、メッセージを文書内整合性チェック結果として表示装置33に表示させる(ステップS18)。
また、判定部17は、アラームリストエントリが全くない場合は、「記載不足の概念はありません。」とのメッセージを出力してもよい。
【0064】
以上のように、本発明の第1の実施形態にしたがった文書データ処理装置では、入力文書データ中の例えば「症状」欄で記載が求められたと判定された概念に対して、リンク情報をもつ階層概念辞書と、当該階層概念辞書から関連概念と認識される概念の記載有無をチェックすることにより、記載が求められた概念ばかりでなく、その上位概念、下位概念、他のカテゴリでリンクにより関連付けられた概念などの記載も必要な情報を記載したと判定できる。よって、前述した「症状」欄と完全に同じ表現を用いずに必要な情報を記載した場合も、記載不足と誤判定することがない。
【0065】
また、階層概念辞書上で関連付けられた情報が全く記載されていない場合には記載不足と判定できるので、文書データ作成時の不備の修正を支援することができ、ユーザによる文書データ作成の負荷を軽減することができる。
【0066】
また、階層概念辞書と表層表現辞書を個別に管理するため、図4に示した概念名「水漏れ」のように階層概念辞書中で複数回現れる概念の表層表現を修正する場合にも、表層表現の修正は表層表現辞書上の1行のみでよく、管理の負荷が軽減される。
【0067】
本実施形態では、階層概念管理部で管理される概念体系(カテゴリ)が2つである例を示したが、カテゴリの数は2に限定するものではなく、3以上であってもよい。
また、この発明は、対象を家電機器の故障修理に関する報告書に限らない。例えば、病院の検査レポートを対象とし、階層概念を「身体部位」「疾患」「検査・治療」などのカテゴリから構成し、検査目的欄に記載された疾患に対して、その疾患が関連する部位の検査結果を記載することで、必要な情報が記載されたと判定するように構成することも可能である。
【0068】
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。なお、本実施形態に係る文書データ処理装置の構成のうち図1に示したものと同一部分の説明は省略する。
図14は、本発明の第2の実施形態にしたがった文書データ処理装置の構成例を示すブロック図である。
図14に示すように、本発明の第2の実施形態にしたがった文書データ処理装置は、第1の実施形態の構成に加え、記憶装置12は、階層概念体系の構成ルールを記憶する階層概念ルール記憶部41を有する。また、この階層概念体系構成ルールに従い階層概念体系を解析する階層概念解析部42を備える。
【0069】
階層概念ルール記憶部41に記憶される階層概念体系の構成ルールは、例えば、「同じカテゴリ内にリンクを付与しない」や「階層概念上の同じ枝に属する概念から別カテゴリの同じ枝に属する概念にリンクを付与しない。」である。例えば、階層概念辞書上のリンク付与に関して「同じカテゴリ内にリンクを付与しない」という構成ルールが設定されている場合、図4に示す階層概念辞書において、最上位概念が「部品」の行の間ではユーザ端末装置2への操作を行なってもリンク情報を付与できない。
【0070】
また、同じく階層概念辞書上のリンク付与に関して「階層概念上の同じ枝に属する概念から別カテゴリの同じ枝に属する概念にリンクを付与しない。」という構成ルールが設定されており、図4に示す階層概念辞書上でIDが「p2」である概念名「冷熱部品」とIDが「s4」である概念名「冷えない」の間にリンク情報が設定されている場合、IDが「p2」である概念名「冷熱部品」の下位概念「コンプレッサ」、とIDが「s4」である概念名「冷えない」の上位概念名、つまりIDが「s2」である概念名「動作時の異常症状」の間にはリンクを設定できない。
ここで、「階層概念上の同じ枝に属する概念」とは、お互いが上位概念・下位概念の関係になっている複数概念からなるグループを示す。
【0071】
階層概念解析部42は、階層概念ルール記憶部41に記憶された階層概念体系の構成ルールに従って階層概念辞書をチェックし、構成ルールに反する部分を発見した場合に、ユーザ端末装置2の表示装置33にユーザ向けアラームを提示する。
【0072】
階層概念解析部42は、例えば、IDが「p2」である概念名「冷熱部品」とIDが「s4」である概念名「冷えない」の間と、IDが「p3」である概念名コンプレッサ」とIDが「s2」である概念名動作時の異常症状」の間にそれぞれリンク情報が付与されている場合、「部品カテゴリ上の枝の2箇所から、症状カテゴリの同一の枝にリンクが設定されています。どちらかを削除してください。」とのメッセージと、階層概念上の該当箇所をユーザに提示するための提示対象の情報を入出力インタフェース16を介してユーザ端末装置2に出力する。
【0073】
また、階層概念解析部42は、既に設定されたリンク情報から、さらに設定すべきリンクの候補を解析し、ユーザに提示する機能を有する。
例えば、図4の階層概念辞書上でID「p6」の概念名「ホース」とID「s11」の概念名「水漏れ」の間のリンク情報が付与されている場合、階層概念解析部42は、ID「s11」の概念名「水漏れ」と同じ概念名、つまりID「s14」の概念名「水漏れ」を階層概念辞書から抽出する。
【0074】
そして階層概念解析部42は、前述したID「p6」の概念名「ホース」や当該概念名の上位概念・下位概念にリンクが付与されておらず、その組み合わせが階層概念ルール記憶部41でされる階層概念体系の構成ルールに反しない場合は、新たなリンク付与候補としてID「s14」の概念名「水漏れ」とID「p6」の概念名「ホース」の組み合わせをユーザに提示するために、提示用の情報を入出力インタフェース16を介してユーザ端末装置2に出力する。
【0075】
また、階層概念解析部42は、概念名とその表層表現を解析し、同じ単語を含む概念の組み合わせを新たなリンク付与候補としてユーザに提示する。
例えば、階層概念解析部42は、図2に示した表層表現辞書上の概念名「回らない」の表層表現「回転しない」と、概念名「回転部品」及び当該概念名の表層表現は単語「回転」を含むので、その組み合わせが階層概念ルール記憶部41で管理される階層概念体系の構成ルールに反しない場合は、新たなリンク候補としてユーザに提示するために、提示用の情報を入出力インタフェース16を介してユーザ端末装置2に出力する。なお、概念名もしくは表層表現に含まれる単語を判定する処理は、公知技術である形態素解析により実施できる。
【0076】
以上のように、本発明の第2の実施形態にしたがった文書データ処理装置では、作成済みの階層概念辞書を階層概念解析部42がチェックし、間違いを指摘するので、階層概念管理の負荷が軽減される。また、階層概念解析部42は、新たなリンク候補をユーザに提示するので、階層概念辞書の作成の負荷が軽減される。
【0077】
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。なお、本実施形態に係る文書データ処理装置の構成のうち図1に示したものと同一部分の説明は省略する。
図15は、本発明の第3の実施形態にしたがった文書データ処理装置の構成例を示すブロック図である。
図15に示すように、本発明の第3の実施形態にしたがった文書データ処理装置は、第1の実施形態の構成に加え、表層表現に対応付けられる概念名に関わる構文解析を行う構文解析部52、概念抽出部13の出力から判定事項を抽出する判定事項抽出部53を備える。また、この第3の実施形態にしたがった文書データ処理装置は、第1の実施形態の構成と比較して概念選択部14および記載概念抽出部15を備えない。
【0078】
この第3の実施形態では、RCM(Risk Control Matrix)の記述の正当性をチェックする。
RCMの記述のチェックとは、業務プロセスが正しく遂行されていることを確認するために、業務ステップ毎に、誰が何を実行するか、その業務の責任者は誰か、関連する文書は何か、その業務ステップで発生する可能性があるリスクは何か、などを整理したRCMに不備が無いかをチェックするものである。
【0079】
文書データ処理装置1は、RCMの記述内容に不備がある場合は、その箇所に記載不備を指摘するアラームを表示するなどの処理をする。
本実施形態では、RCMとして、企業内において休暇申請と承認を行なう業務プロセスに関して記述された例を用いる。
【0080】
図16は、本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準の一例を示す図である。
文書データ処理装置1の記憶装置12には、図16に示した休暇取扱基準の情報が記憶される。この休暇取扱基準は、企業内に存在する規程類の一種であり、企業内で休暇の申請と承認に関するルールが記される。
【0081】
図17は、本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準から導出される、申請者と承認者の関係の判定ルールを示した図である。
本実施形態では、判定ルールとして、図17に示した、申請者と承認者の関係の情報が判定ルール記憶部21に記憶される。
【0082】
A社では、図16に示すような休暇取扱基準が規程として定められている。この休暇取扱基準の記述内容を、休暇の申請者と承認者の観点で整理すると、図17のようになる。A社内で休暇申請処理を行なう際は、図17に示された条件を満たす必要がある。
【0083】
図18は、本発明の第3の実施形態にしたがった文書データ処理装置が管理する階層概念の一例を示す図である。
本発明の第3の実施形態にしたがった文書データ処理装置は、図18に示したような階層概念を管理する。図18に示した階層概念は、企業内の、「規程」、「組織・役職」、「社内システム」という3つの概念体系を階層的に示したものである。
また、図18に示すように、第2の階層の概念名「組織構成」の下位の概念名「担当職」と、上位概念でも下位概念でもなく、同一項目であって、第2の階層の概念名「役職」の下位の概念名「担当職」とのリンク情報が記憶装置12に記憶されて管理される。
【0084】
図19は、本発明の第3の実施形態にしたがった文書データ処理装置の記憶装置12に記憶される階層概念辞書の構成例を表形式で示す図である。
本発明の第3の実施形態にしたがった文書データ処理装置の階層概念辞書記憶部23には図19に示した構成の階層概念辞書が記憶される。この階層概念辞書は、図18に示した階層概念の、「規程」、「組織・役職」、「社内システム」の関係を階層化した辞書として表現した例である。
【0085】
図20は、本発明の第3の実施形態にしたがった文書データ処理装置1の記憶装置12に記憶される表層表現辞書の構成例を表形式で示す図である。
表層表現辞書記憶部22には図20に示した構成の表層表現辞書が記憶される。この表層表現辞書は、「規程」、「組織・役職」、「社内システム」内の概念名、概念分類、表層表現が関連付けられて管理される。
【0086】
次に、本発明の第3の実施形態にしたがった文書データ処理装置1の処理動作について説明する。図21は、本発明の第3の実施形態にしたがった文書データ処理装置の処理動作の一例を示すフローチャートである。
図22は、本発明の第3の実施形態にしたがった文書データ処理装置が入力するRCMの一例を示す図である。ここではRCMは休暇申請と承認の方法について記述される。
【0087】
A社にあるB研究所では、自部門のリスク管理のために、ユーザ端末装置2の入力装置34に対する操作により図22に示した構成のRCMが作成される。このRCMが通信インタフェース35から文書データ処理装置1の入出力インタフェース16へ入力される。文書データ処理装置1の制御部11は入出力インタフェース16が入力した文書データを記憶装置12に記憶する(ステップS41)。
【0088】
概念抽出部13は、表層表現辞書記憶部22に記憶された表層表現辞書を読み込む(ステップS42)。また、判定事項抽出部53と判定部17は、それぞれ、判定ルール記憶部21に記憶された判定ルールを読み込む(ステップS43)。構文解析部52は、入力文書データであるRCMの業務内容列の文章を、文単位で構文解析する(ステップS44)。
【0089】
図23は、図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記載された文章中の第3文の構文解析を行った結果の例である。図23中で、サブステップ番号「Step1-01」が関わる行の「業務内容」の列に記載された文章中の第3文は文節に分割されている。
【0090】
図23中で実線で接続された文節の組み合わせは、係り受けの関係があると判定されたものである。概念抽出部13は、ステップS42の処理で読み込んだ表層表現辞書を用い、構文解析結果を解析することで、例えば図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記述された文章中の第3文の構文解析結果から、表層表現辞書の表層表現と一致する「研究主務」「ラボ長」「ラボ長」「SM」を、業務に関わる役職名やそれに準ずる表現として抽出し、これらの表層表現に当該表層表現辞書で対応する概念名を付与する(ステップS45)。
図24は、図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記述された文章中の第3文の構文解析結果に、概念名を付与した結果の例である。
判定事項抽出部53は、ステップS43の処理で読み込んだ判定ルールにしたがって、概念抽出部13の出力から判定事項を抽出する(ステップS46)。図17に示す判定ルールでは、登録された2つのルールで、それぞれ、「承認者」と「申請者」の関係が決められている。この判定ルールにしたがい、判定事項抽出部53は、概念抽出部13の出力で、「承認者」もしくは「申請者」が係り受けしている表層表現に関連付けられた概念名を取得する。
【0091】
図24に示す概念抽出結果、つまり図22に示したRCMのサブステップ番号「Step1-01」が関わる行の「業務内容」の列に記述された文章中の第3文の概念抽出結果からは、第一の申請者として表層表現「研究主務」かつ概念名「主任」、第一の承認者として表層表現「ラボ長」かつ概念名「研究室長」、第二の申請者として表層表現「ラボ長」かつ概念名「研究室長」、第二の承認者として表層表現「SM」かつ概念名「研究部長」が抽出される。
【0092】
判定事項抽出部53は、さらに、抽出した申請者、承認者の組み合わせを判定する。この判定は、例えば、第一の申請者と組み合わせる承認者は、図24に示す概念抽出結果で最も文節間の距離が近い、すなわち、文節間を接続する実線の数が少なくて到達できる第一の承認者を判定することで行う。
【0093】
この組み合わせ判定により、図24に示す概念抽出結果から、図25の第1行および第2行に示す2組の判定事項が抽出される。さらに、図22に示したRCMのサブステップ番号「Step1-02」の行の業務内容の列に対して同様の構文解析及び概念抽出及び判定事項抽出処理を行うことで、図25の第3行に示す判定事項が抽出される。
【0094】
判定部17は、図19に示した階層概念辞書を読み込む(ステップS47)。また、判定部17は、図25に示す判定事項抽出結果リストを1行ずつ取り出し、この判定事項抽出結果リストの選択行の、申請者概念名と承認者概念名の関係をチェックする(ステップS48)。
判定部17は、図25の判定事項抽出結果リストの第1行の処理にあたっては、階層概念辞書における概念名のうち、申請者および承認者に関わる概念名「主任」、「研究室長」が関わる行に着目する。
【0095】
判定部17は、図19に示した階層概念辞書上のID「s25」の概念名「主任」は上位のID「s15」の概念名「役職」に関する階層定義であり、当該概念名「主任」の1つ上の上位概念名がID「s24」の「担当職」であることから、主任が「担当職」であると判定する。
また、判定部17は、主任が所属する組織の管理者が誰かを知るために、前述したリンク情報により関連付けられる同一項目名であって、ID「s14」の概念名「担当職」に着目し、これは上位のID「s2」の概念名「組織構成」に関する階層定義であり、当該概念名「担当職」の1つ上の上位概念名はID「s13」の概念名「研究室長」であると判別する。
【0096】
判定部17は、ステップS43の処理で読み込んだ、判定ルール記憶部21に記憶された判定ルールにしたがい、入力したRCM中の解析箇所に記述された申請者および承認者に関わる概念名「主任」、「研究室長」に対応する当該RCM中の表現の関係が判定ルールに合致するか否かを判定する(ステップS49)。
ステップS49の処理として、具体的には、判定部17は図19に示した階層概念辞書上のID「s25」の概念名「主任」はID「s13」の概念名「研究室長」の下位概念名であり、概念名「主任」に対応するRCM中の表現が申請者「研究主務」であり、概念名「研究室長」に対応するRCM中の表現が申請者「ラボ長」であると判定する。
【0097】
そして、判定部17は、RCM中の解析箇所の表現である承認者「ラボ長」は申請者「研究主務」が所属する組織の管理者であって、判定ルールに合致すると判定する。よって、判定部17は、RCM中の解析箇所の表現である第1の申請者「研究主務」および当該申請者の承認者「ラボ長」の記述は正しいと判定する(ステップS49のYES)。この場合にはアラームが出力されることなく処理が終了し、判定事項抽出結果リストの次の行の処理に移る(ステップS51)。
【0098】
判定部17は、図25に示した判定事項抽出結果リスト第2行に記載された、RCM中の解析箇所の表現のもう一つの組み合わせである、第2の申請者「ラボ長」と承認者「SM」の関係も表層表現辞書と階層概念辞書を用いることにより、同様に正しい記述であると判定できる。
【0099】
一方、図25に示した判定事項抽出結果リスト第3行に記載された、別の業務内容である、図22に示したRCMのサブステップ番号「Step1-02」の行の業務内容の列においては、申請者「SM」と承認者「ラボ長」の組み合わせが記述されている。判定部17は、判定事項抽出結果リストの記載内容から、これらの記述を申請者「研究部長」と承認者「研究室長」に読み替える。
【0100】
判定部17は、図19に示した階層概念辞書の概念名のうち、前述したように表層表現を読み替えた概念名であるID「s12」の概念名「研究部長」を参照し、1階層上の概念名はID「s9」の「研究所長」であり、前述したように読み替えたID「s13」概念名「研究室長」は1階層下の概念名であると判別する。
【0101】
よって、RCMの記述内容である申請者「SM」は承認者「ラボ長」が所属する組織の管理者であるので、判定ルールに合致していないと判定する。よって、判定部17は、RCMチェック結果として、図22に示したRCMのサブステップ番号「Step1-02」の行の業務内容の欄に記述不備のアラームを表示する指示信号を入出力インタフェース16を介してユーザ端末装置2に出力する。
【0102】
図25は、本発明の第3の実施形態にしたがった文書データ処理装置が入力したRCMにアラームを付した例を示す図である。
この指示信号をユーザ端末装置2の通信インタフェース35が入力すると、制御部31は、入力文書データであるRCMのサブステップ番号「Step1-02」の行の業務内容の欄に記述不備のアラームのウインドウを付した画面を表示装置33に表示させる(ステップS50)。
【0103】
以上のように、本発明の第3の実施形態にしたがった文書データ処理装置では入力文書データがRCMである場合に、表層表現辞書や階層概念辞書を活用することにより、RCMの記述内容の不備の有無をチェックすることができる。
【0104】
なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【図面の簡単な説明】
【0105】
【図1】本発明の第1の実施形態にしたがった文書データ処理装置の構成例を示すブロック図。
【図2】本発明の第1の実施形態にしたがった文書データ処理装置の記憶装置に記憶される表層表現辞書の構成例を表形式で示す図。
【図3】本発明の第1の実施形態にしたがった文書データ処理装置が管理する階層概念の一例を示す図。
【図4】本発明の第1の実施形態にしたがった文書データ処理装置の記憶装置に記憶される階層概念辞書の一例を表形式で示す図。
【図5】本発明の第1の実施形態にしたがったユーザ端末装置の構成例を示すブロック図。
【図6】本発明の第1の実施形態にしたがった文書データ処理装置の処理動作の一例を示すフローチャート。
【図7】本発明の第1の実施形態にしたがった文書データ処理装置に入力される入力文書データの構成例を示す図。
【図8】本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック用辞書の一例を示す図。
【図9】本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である報告内容欄チェック結果の一例を示す図。
【図10】本発明の第1の実施形態にしたがった文書データ処理装置の判定部の処理動作の一例を示すフローチャート。
【図11】本発明の第1の実施形態にしたがった文書データ処理装置の途中出力であるチェック対象概念リストの一例を示す図。
【図12】本発明の実施形態にしたがった文書データ処理装置の途中出力である記載有無情報を付与した階層概念辞書の一例を示す図。
【図13】本発明の第1の実施形態にしたがった文書データ処理装置の途中出力である関連概念リストの一例を示す図。
【図14】本発明の第2の実施形態にしたがった文書データ処理装置の構成例を示すブロック図。
【図15】本発明の第3の実施形態にしたがった文書データ処理装置の構成例を示すブロック図。
【図16】本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準の一例を示す図。
【図17】本発明の第3の実施形態にしたがった文書データ処理装置が管理する休暇取扱基準から導出される、申請者と承認者の関係の判定ルールを示した図。
【図18】本発明の第3の実施形態にしたがった文書データ処理装置が入力するRCMの一例を示す図。
【図19】本発明の第3の実施形態にしたがった文書データ処理装置の記憶装置に記憶される階層概念辞書の構成例を表形式で示す図。
【図20】本発明の第3の実施形態にしたがった文書データ処理装置の記憶装置に記憶される表層表現辞書の構成例を表形式で示す図。
【図21】本発明の第3の実施形態にしたがった文書データ処理装置の処理動作の一例を示すフローチャート。
【図22】本発明の第3の実施形態にしたがった文書データ処理装置が入力するRCMの一例を示す図。
【図23】本発明の第3の実施形態にしたがった文書データ処理装置の途中出力である構文解析部の途中出力の一例を示す図。
【図24】本発明の第3の実施形態にしたがった文書データ処理装置の途中出力である構文解析部の出力の一例を示す図。
【図25】本発明の第3の実施形態にしたがった文書データ処理装置の途中出力である判定事項抽出結果の一例を示す図。
【図26】本発明の第3の実施形態にしたがった文書データ処理装置が入力したRCMにアラームを付した例を示す図。
【符号の説明】
【0106】
1…文書データ処理装置、2…ユーザ端末装置、11,31…制御部、12,32…記憶装置、13…概念抽出部、14…概念選択部、15…記載概念抽出部、16…入出力インタフェース、17…判定部、18,36…バス、21…判定ルール記憶部、22…表層表現辞書記憶部、23…階層概念辞書記憶部、33…表示装置、34…入力装置、35…通信インタフェース、52…構文解析部、53…判定事項抽出部。

【特許請求の範囲】
【請求項1】
文書データを入力する入力手段と、
概念名および当該概念名の表層表現を対応付けた表層表現辞書を記憶する表層表現記憶手段と、
概念名の体系情報および、前記概念名のうち第1の概念名と当該第1の概念名の上位概念名や下位概念名でなく当該第1の概念名に対応する表現とともに前記文書データ中に含まれるべき表現に対応する第2の概念名とのリンク情報を含む階層概念辞書を記憶する階層概念記憶手段と、
前記入力手段により入力した文書データ中の第1の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する第1の抽出手段と、
前記入力した文書データ中に前記第1の表現とともに記述される第2の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する第2の抽出手段と、
前記階層概念辞書の体系情報およびリンク情報をもとに、前記第1の抽出手段により抽出した概念名の関連概念名を抽出する第3の抽出手段と、
前記関連概念名に前記第2の抽出手段により抽出した概念名が含まれていない場合に、前記入力した文書データ中に前記第1の表現とともに記述されるべき表現が不足していると判定する判定手段と
を備えたことを特徴とする文書データ処理装置。
【請求項2】
前記リンク情報の構成条件を定めた構成条件定義手段と、
前記構成条件をもとに、前記階層概念辞書のリンク情報の構成の正当性を判定するリンク情報判定手段と
をさらに備えたことを特徴とする請求項1に記載の文書データ処理装置。
【請求項3】
前記リンク情報の構成条件を定めた構成条件定義手段と、
前記構成条件をもとに、前記階層概念記憶手段に記憶される階層概念辞書の概念のうち新たに前記リンク情報に関わるべき概念かどうかを判定するリンク情報判定手段と
をさらに備えたことを特徴とする請求項1に記載の文書データ処理装置。
【請求項4】
事業活動のリスク低減のための管理内容を含む文書データを入力する入力手段と、
概念名および当該概念名の表層表現を対応付けた表層表現辞書を記憶する表層表現記憶手段と、
概念名の体系情報および、前記概念名のうち第1の概念名と当該第1の概念名の上位概念名や下位概念名でない第2の概念名とのリンク情報を含む階層概念辞書を記憶する階層概念記憶手段と、
前記入力した文書データ中の文章の構文解析を行う構文解析部と、
前記構文解析部の出力中の当該文書データの記述の正当性の判定材料となる複数の表現に関わる表層表現に対応付けられる概念名を前記表層表現辞書から抽出する抽出手段と、
前記抽出手段により抽出した概念同士の関係を判定事項として抽出する判定事項抽出部と、
前記階層概念辞書の体系情報およびリンク情報をもとに、前記判定事項抽出手段により抽出した概念名同士の関係が所定の条件を満たさない場合に前記入力した文書データ中の記述が正しくないと判定する判定手段と
を備えたことを特徴とする文書データ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate


【公開番号】特開2009−110405(P2009−110405A)
【公開日】平成21年5月21日(2009.5.21)
【国際特許分類】
【出願番号】特願2007−283722(P2007−283722)
【出願日】平成19年10月31日(2007.10.31)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】