文書評価支援システム、及び文書評価支援方法

【課題】予め定義した任意の文書内容の標準文書構造化データに対して、入力した文書の内容が関連する箇所を可視化することを支援する文書評価支援システムを提供する。
【解決手段】任意の文書の内容についての標準文書構造化データを保管する標準文書構造化データ保管装置、入力文書を文書構造化データに変換する構造化文書変換装置、構造化文書変換装置によって変換された文書構造化データを保管する文書構造化データ保管装置、標準文書構造化データと入力文書構造化データとを比較，評価する構造化データ比較評価装置、入力した文書の中から要注意箇所を抽出して、要注意箇所に対する参考情報を作成する参考情報作成装置、標準文書構造化データと入力文書構造化データとの比較結果から各語句の評価スコアを算出して蓄積する評価結果保管装置、評価結果に応じてグラフや語句の表示を変更する評価結果表示装置を備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、入力文書に記述されている内容が、その文書の内容に関する標準的な知識ネットワーク構造において、どこが関連する箇所であるかを示すために、入力文書の語句間の関係を上記と同様の知識ネットワーク構造で表して、標準的な知識ネットワーク構造とマッチングすることにより、類似度を評価し、その評価結果に応じて関連箇所の表示を行うことを支援する文書評価支援システムに関する。
【背景技術】
【０００２】
従来から、文書内の文を構造化データとして記述し、他のデータベースから情報を検索したり、検索結果についてユーザが経験と裁量をもとに判断して、その結果を活用したりしていた。
【０００３】
任意の内容についての語句、及び語句間の関係のように、ある知識ベース上の概念を体系的に表す技術としてオントロジが知られている。また、オントロジを表す構造化データを記述する形式として、ＸＭＬ（eXtensible Makeup Language）形式や、ＲＤＦ（Resource Description Framework）がある。
【０００４】
オントロジ記述形式で記述された照会文により情報を検索する方法として［特許文献１］［特許文献２］に示すような情報検索システム，構造化データ検索プログラムがある。
【０００５】
オントロジを用いた検索要求により文書を検索し、検索結果についてユーザが評価情報をフィードバックする方法として［特許文献３］に示すような情報検索システムがある。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開２００５−１６５９５８号公報
【特許文献２】特開２０１０−７９８５７号公報
【特許文献３】特開２００３−１０８５９７号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
従来の検索方法では、検索語句や検索文、及びその語句や文に関連する情報を他の文書やデータベースの中から検索することを実現していた。
【０００８】
しかしながら、入力された文書の記述内容がその文書の内容に関する標準的な知識ネットワーク構造、または、その文書が標準的に記載すべき内容を表す知識ネットワーク構造において、どの部分にどの位関連しているか、どの部分について記載されているか、またはどの部分が記載されていないか等を知るためには、入力文書の記述内容についての語句、及び語句と語句との関係を検索するだけでなく、標準的な知識ネットワーク構造と入力文書の知識ネットワーク構造を比較して関連箇所を検索して類似度を評価し、評価結果に対応して、標準的な知識ネットワーク構造を構成する各語句の表示を変えることが必要である。
【課題を解決するための手段】
【０００９】
上記の課題を解決するために、本発明では、任意の文書の内容に関する語句と語句、及び２つの語句の関係を表す標準的な知識ネットワーク構造を保管する手段、入力文書を前記と同様に、語句と語句、及び２つの語句の関係を表し、その文書内に含まれる語句で構成される知識ネットワーク構造に変換する手段、入力文書の中から選択した文の知識ネットワーク構造と、前記標準的な知識ネットワーク構造とを比較し、一致、または類似する箇所を検索する手段、その類似度を各語句のスコアとして評価する手段、標準的なネットワーク構造を構成する各語句の表示を上記の評価結果に応じて変更する手段、を備えたことを特徴とするものである。
【００１０】
また、本発明の文書評価支援システムにおいて、前記入力文書を知識ネットワーク構造に変換する手段とは、入力文書の各文を構文解析して、主語，述語，目的語等の関係を語句と語句、及びその関係として表し、さらに、標準的な知識ネットワーク構造と同様の関係に変換することを特徴とするものである。
【００１１】
また、本発明の文書評価支援システムにおいて、前記入力文書の知識ネットワーク構造と標準的な知識ネットワーク構造が一致する箇所というのは、入力文書の中の各文の知識ネットワーク構造と同じ知識ネットワーク構造が標準的な知識ネットワーク構造の中に存在した場合であり、前記入力文書の知識ネットワーク構造と標準的な知識ネットワーク構造が類似するというのは、入力文書の中の各文の知識ネットワーク構造の語句と語句の間に語句と語句の関係を保持できる状態で、他の語句、及び関係を補間した知識ネットワーク構造が、標準的な知識ネットワーク構造の中に存在した場合、または、入力文書の中の各文の知識ネットワーク構造の語句と語句の間の関係を保持できる状態で削除した知識ネットワーク構造が、標準的な知識ネットワーク構造の中に存在した場合であることを特徴とするものである。
【発明の効果】
【００１２】
本発明の文書評価支援システムによれば、任意の文書の内容についての標準的な知識ネットワーク構造において、入力文書の記載内容の関連箇所や特徴を把握することができる。
【図面の簡単な説明】
【００１３】
【図１】基本構成図。
【図２】標準文書構造化データから入力文書構造化データの一致、類似箇所を抽出，評価，表示するための処理手順。
【図３】標準文書構造化データ例。
【図４】標準文書構造化データに要注意箇所を組み込んだ例。
【図５】標準文書構造化データから入力文書構造化データの要注意箇所を抽出，参考情報を出力するための処理手順。
【図６】入力文書を入力文書構造化データに変換する例。
【図７】構造化データ比較評価装置における処理手順の一例。
【図８】標準文書構造化データにおける、入力文書の任意文の構造化データと一致する箇所の例。
【図９】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の例。
【図１０】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の例。
【図１１】標準文書構造化データにおける、入力文書の任意文の構造化データと一致する箇所の評価例。
【図１２】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の評価例。
【図１３】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の評価例。
【図１４】標準文書構造化データにおける、入力文書の選択範囲についての評価結果を表示する画面例。
【発明を実施するための形態】
【００１４】
以下に図１から図１３を用いて本発明に係る情報参照支援システムの一実施形態について説明する。
【実施例１】
【００１５】
図１に本実施例の文書評価支援システムの基本構成を示す。本システムは、任意の文書内容についての標準的なネットワーク構造データ（以後、標準文書構造化データと呼ぶ）を保存する標準文書構造化データベース（１０１）、入力文書（１０３）を知識ネットワーク構造データ（以後、入力文書構造化データと呼ぶ）に変換する構造化文書変換装置（１０４）、構造化文書変換装置によって変換された入力文書構造化データを保存する入力文書構造化データベース（１０５）、任意の文書内容についての要注意箇所を保管する要注意箇所データベース（１０２）、標準文書構造化データと入力文書構造化データを比較したり、評価することによって、要注意箇所を抽出する構造化データ比較評価装置（１０６）、入力文書構造化データの各文ごとに評価した結果を蓄積する評価結果データベース（１０９）、要注意箇所についての参考情報を保管する参考情報データベース（１０７）、入力した文書の中から要注意箇所が抽出されたとき、対応する参照情報を作成する参考情報作成装置（１０８）、評価結果に応じてグラフや語句の表示を変更して画面等に表示したり、参考情報を表示したりする評価結果表示装置（１１０）によって構成されている。
【００１６】
図２は標準文書構造化データから入力文書構造化データの一致、類似箇所を抽出，評価，表示するための処理手順である。図１に図示した本発明の文書評価支援システムにおける処理手順の一例をフローチャートで示す。
【００１７】
開始（ステップ２０１）後、標準文書構造化データベースを読み込む（ステップ２０２）。標準文書構造化データベースは、対象とする文書の内容によって、予め定義されている。例えば、ある製品の技術仕様書のような契約文書では、その製品の技術仕様書として、どのような内容を記述すべきかといった観点で、構成品や実施事項等について、必要とされる語句とその語句間の予め定義されている相互の関連性（これを関係とよぶ）が知識ネットワーク構造で記述されている。
【００１８】
次に、入力文書を読み込み（ステップ２０３）、その中から今回評価する対象範囲を指定する（ステップ２０４）。文書は１つまたは複数の文によって構成され、指定した対象範囲についてもまた、１つまたは複数の文によって構成される。この指定された対象範囲内の文を標準文書構造化データと同様の知識ネットワーク構造に変換して、入力文書構造化データを作成する（ステップ２０５）。変換方法については、後述する。
【００１９】
次に、前記入力文書構造化データの標準文書構造化データにおける関連箇所との一致，類似度を評価するために、入力文書構造化データの中の全ての文について、各文の知識ネットワーク構造データを標準文書構造化データの中から検索し（ステップ２０６）、検索状況をもとに評価（ステップ２０７）する。検索方法は図８にて、評価方法（一致及び類似の評価）は図８〜図１３にて後述する。このとき、各文の評価により類似度が高い語句については、標準文書構造化データの語句の評価スコアを高くする。入力文書構造化データの中の全ての文について評価が終了したら（ステップ２０８）、標準文書構造化データの各語句の評価スコアを合計して、その結果を表示し（ステップ２０９）、終了する（ステップ２１０）。
【００２０】
図３に、本実施例の文書評価支援システムにおける、図１に図示した標準文書構造化データ１０１の例を示す。
【００２１】
この例３００では、「Ｔ１００」という製品の技術仕様書に記載されるべき内容について、語句と語句、及びその関係をツリー状のデータとして表している。楕円で囲まれているのが技術仕様書の内容に標準的に含まれる語句であり、語句と語句の関係を線でつなぎ、その関係を表す定義語を線付近に記載している。関係を概念的に表す定義語は予め定義されており、この例の定義語は、ｐ／ｏ（part_of）が機器の構成を示し、ａ／ｏ（attribute_of）が属性や種類，実施項目を示す。これにより、例えば、「Ｔ１００」３０１の技術仕様書における構成要素のひとつが「Compressor」３０２であることを示している。標準文書構造化データをここでは、ツリー状のデータとして表しているが、語句と語句、及び２つの語句の関係が定義できれば、例えば、ＸＭＬやＲＤＦ，表形式であっても構わない。
【００２２】
図４に、本実施例の文書評価支援システムにおける、図３で図示した標準文書構造化データ１０１の中に要注意箇所データベース１０２の情報を明示した例を示す。
【００２３】
この例４００では、「Fuel」４０１の属性が「Gas」４０２であるような内容が技術仕様書に記述されていれば、要注意箇所（４０３）であることを示し、参考情報（４０４）がリンクされている。例えば、語句「Fuel」と語句「Gas」、及び２つの語句の関係（ａ／ｏ）を示すようなデータに参考情報のNo.等が付与されている形式が考えられる。このとき、入力文書構造化データにおいて、語句「Fuel」と語句「Gas」、及び２つの語句の関係（ａ／ｏ）が抽出された場合、参考情報データベースに保管されているリンクしている参考情報を提示するといった活用方法が考えられる。標準文書構造化データの中から入力文書構造化データと一致、または類似する箇所を抽出するときに、要注意箇所の検索ができる。
【００２４】
図５に、本実施例の文書評価支援システムにおける、図４に図示した標準文書構造化データの１０１中に要注意箇所１０２を明示している場合の処理手順の一例をフローチャートで示す。
【００２５】
図５では、図２で示したフローチャートに、要注意箇所の判定（ステップ２１１）と要注意箇所が判定された場合に参考情報を出力する（ステップ２１２）処理が追加されている。
【００２６】
図６に、本実施例の文書評価支援システムにおける、図１に図示した標準化文書変換装置１０４が実施する、構造化文書変換方法例を示す。
【００２７】
例えば、入力文書に記載されている文例１（６０１）に示すような文について、自然言語処理等、形式言語の解析で使用される構文解析を実施した結果として、文法的な語句の係り受け関係がわかる。この例では、構文解析の結果として、主語「panel」（６０２），述語「be provided」（６０３），目的語「device」（６０４）を抽出したとする（６０５）。さらに、この中の述語（動詞）を対象文書の内容によって標準文書構造データをもとに定義される、動詞―関係変換表（６０６）を使って、語句「panel」と語句「device」、及び２つの語句の関係「ｐ／ｏ」に変換される（６０７）。文例２（６１１）も同様に、構文解析の結果として、主語「heater」（６１２），述語「have」（６１３），目的語「ＫＯＳＨＡ」（６１４），「ＡＳＭＥ」（６１５）を抽出したとき（６１６）、動詞―関係変換表（６０６）を使って、語句「heater」と語句「ＫＯＳＨＡ」、及び２つの語句の関係「ａ／ｏ」と語句「heater」と語句「ＫＯＳＨＡ」、及び２つの語句の関係「ａ／ｏ」に変換される（６１７）。この結果、入力文書は標準文書構造化データと比較，評価しやすい形式になる。
【００２８】
図７に、本発明の文書評価支援システムにおける、図１に図示した構造化データ比較評価装置１０６における処理手順の一例をフローチャートで示す。
【００２９】
開始（ステップ７０１）後、入力文書構造化データを読み込む（ステップ７０２）。さらに、その中から対象となる文の構造化データを読み込む（ステップ７０３）。文の構造化データ、例えば、文例１から変換された、語句「panel」と語句「device」、及び２つの語句の関係「ｐ／ｏ」（６０７）や、文例２から変換された語句「heater」と語句「ＫＯＳＨＡ」、及び２つの語句の関係「ａ／ｏ」と語句「heater」と語句「ＫＯＳＨＡ」、及び２つの語句の関係「ａ／ｏ」（６１７）を読み込む。次に、文の構造化データから親子関係を全て抽出する（７０４）。例えば、文例１からは、親子関係は１つであるが、文例２では、親子関係は２つになる。親子関係は、親の語句と子の語句、及び２つの語句の関係からなる。さらに、各親子関係を標準構造化データの中から抽出する（７０５，７０６）。これを、対象となる文書の中の全ての文から抽出した親子関係について繰り返し（７０７，７０８，７０９）、終了する。
【００３０】
図８に、本発明の文書評価支援システムにおける、図１に図示した構造化データ比較評価装置１０６が図７に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する例を示す。
【００３１】
図６で図示した文例１（６０１）は、語句「panel」と語句「device」、及び２つの語句の関係「ｐ／ｏ」に変換される（６０７，８１０）。これと一致する、語句と語句、及び２つの語句の関係を標準文書構造化データの中から検索する。その結果、この例では標準文書構造化データの中に、文例と一致する語句と語句、及び２つの語句の関係で示された親子関係が検索される（８２１）。
【００３２】
図９に、本発明の文書評価支援システムにおける、図１に図示した構造化データ比較評価装置１０６が図７に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する他の例を示す。
【００３３】
図６で図示した文例２（６１１）は、語句「heater」と語句「ＫＯＳＨＡ」、及び２つの語句の関係「ａ／ｏ」と語句「heater」と語句「ＡＳＭＥ」、及び２つの語句の関係「ａ／ｏ」に変換される（６１７，９１０）。これと一致する、語句と語句、及び２つの語句の関係を標準文書構造化データの中から検索する。このとき、標準文書構造化データの語句「Heater」と語句「Certificate」、及び２つの語句の関係「ａ／ｏ」と、語句「Certificate」と語句「ＫＯＳＨＡ」、及び２つの語句の関係「ａ／ｏ」（９２１）において、２つの関係が同じことから、「Heater」と語句「ＫＯＳＨＡ」について、２つの語句の関係が継承されて「ａ／ｏ」になる（９３１，９１１）。すなわち、「Heater」の属性（実施事項）の一つが「Certificate」で、「Certificate」の属性（種類）の一つが「ＫＯＳＨＡ」であるとき、「Heater」の属性（実施事項）の一つが「ＫＯＳＨＡ」（９１１）であるとする。その結果、この例では標準文書構造化データの中に、文例と一致する語句と語句、及び２つの語句の関係で示された親子関係が検索される（９３１）。「Heater」と「ＡＳＭＥ」の関係も同様である（９１２，９２２，９３２）。
【００３４】
このように、入力文書構造化データの中の任意の文構造化データについて、２つの語句の間の語句を２つの語句の間の相互の関連性が保持されるように削除，省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い２つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。
【００３５】
このように入力文書の評価結果を表示することによって、入力文書の関連箇所や特徴、また、記載内容の十分な箇所，不十分な箇所等を把握することができる。
【００３６】
図１０に、本発明の文書評価支援システムにおける、図１に図示した構造化データ比較評価装置１０６が図７に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する他の例を示す。
【００３７】
入力文書構造化データの中の文例３の構造化データとして、語句「Fuel」と語句「system」の２つの語句の関係が「ｐ／ｏ」、さらに、語句「system」と語句「Oil」の２つの語句の関係が「ｐ／ｏ」である場合（１０１０）、これと一致する、語句と語句、及び２つの語句の関係を標準文書構造化データの中から検索する。このとき、検索する親子関係のパターンとして、例３（ａ）語句「Fuel」と語句「system」、及び２つの語句の関係「ｐ／ｏ」（１０１１）、例３（ｂ）語句「system」と語句「Oil」、及び２つの語句の関係「ｐ／ｏ」（１０１２）、さらに、２つの関係が同じ「ｐ／ｏ」であることから、例３（ｃ）語句「Fuel」と語句「Oil」、及び２つの語句の関係「ｐ／ｏ」（１０１３）を設定する。その結果、この例では標準文書構造化データの中に、例３（ｃ）と一致する語句と語句、及び２つの語句の関係で示された親子関係が検索される（１０２１）。
【００３８】
図１１，図１２，図１３に、本発明の文書評価支援システムにおける、図１に図示した構造化データ比較評価装置１０６が標準文書構造化データの中から入力文書構造化データを検索したときの評価スコアの算出例を示す。
【００３９】
図１１は、図８で検索した文例１について、評価スコアを算出した例を示す。
親の語句：１.０×α₀₁（α₀₁：「一致」した場合の親の重み）
子の語句：１.０×α₀₂（α₀₂：「一致」した場合の子の重み）
その結果、α₀₁＝α₀₂＝１.０のとき、
親の語句「panel」：１.０×１.０＝１.０
子の語句「device」：１.０×１.０＝１.０
図１２は、図９で検索した文例２について、評価スコアを算出した例を示す。
親の語句：１.０×（１／ｎ）×β₁₁（β₁₁：語句の補間により「類似」した場合
の親の重み）
子の語句：１.０×（１／ｎ）×β₁₂（β₁₂：語句の補間により「類似」した場合
の子の重み）
その結果、β₁₁＝β₁₂＝１.０のとき、ｎ＝２
親の語句「Heater」：１.０×０.５×１.０＝０.５（１）
子の語句「ＫＯＳＨＡ」：１.０×０.５×１.０＝０.５
親の語句「Heater」：１.０×０.５×１.０＝０.５（２）
子の語句「ＡＳＭＥ」：１.０×０.５×１.０＝０.５
（１），（２）から、「Heater」のスコアは、０.５＋０.５＝１.０となる。
【００４０】
このように、入力文書構造化データの中の任意の文構造化データについて、２つの語句の間に２つの語句の相互の関連性が保持されるように語句を追加，補間することによって文構造化データ内の語句と語句、及び相互の関連性が高い２つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。図１３は、図１０で検索した文例３について、評価スコアを算出した例を示す。
親の語句：１.０×（１／ｍ）×γ₂₁（γ₂₁：語句の削除により「類似」した場合
の親の重み）
子の語句：１.０×（１／ｍ）×γ₂₂（γ₂₂：語句の削除により「類似」した場合
の子の重み）
その結果、γ₂₁＝γ₂₂＝１.０のとき、ｍ＝２
親の語句「Fuel」：１.０×０.５×１.０＝０.５
子の語句「Oil」：１.０×０.５×１.０＝０.５
このように、入力文書構造化データの中の任意の文構造化データについて、２つの語句の間の語句を２つの語句の間の相互の関連性が保持されるように削除，省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い２つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。
【００４１】
尚、ここで示した重みについては、標準文書構造化データや入力文書の構成や詳細度によって変更する。
【００４２】
図１４に、本発明の文書評価支援システムにおける、図１に図示した評価結果表示装置１１０によって、評価結果に応じて標準構造化データを構成する語句の表示を変更した出力画面例を示す。この例では、文書の対象範囲を選択して、標準文書構造を表示させると、標準文書構造化データ全体の中に、対象となった文の内容に関連する語句について、評価スコアの大きさに応じて、語句を表す楕円内の色の濃淡を変えて表示している。これによって、例えば、契約文書の中の選択した文の内容の特徴や、標準的な契約文書に対して、どこが関係しているか、内容として不十分なところはどこかといったことが容易にわかる。
【実施例２】
【００４３】
実施例１では、構造化文書変換装置１０４により変換することを前提としていたが、その変換処理を終えたデータは入力文書構造化データベース１０５へ記録しておけば必ずしも解析処理は必要ではない。つまり、図３，図４，図８〜図１４の画面は、構造化データ比較評価装置１０６で、それらデータベースに記録された標準文書構造化データと入力文書構造化データを比較することにより表示する。
【００４４】
つまり、指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い２つの語句の関係を記述した標準的な知識ネットワーク構造データ（以後、標準文書構造化データとよぶ）を予め記録したデータベース（１０１）に保持し、入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い２つの語句の関係を示す知識ネットワーク構造データ（以後、入力文書構造化データ）を記録したデータベース（１０５）に保持し、前記標準文書構造化データ（１０１）と前記入力文書構造化データ（１０５）との一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を表示手段に可視化する文書評価支援システムの表示方法により、任意の文書の内容についての標準的な知識ネットワーク構造において、入力文書の記載内容の関連箇所や特徴を把握することができる。
【００４５】
また、前記語句の表示を変えた箇所に、評価スコアを関連付けて表示する文書評価支援システムの表示方法により、作業者は関連箇所と合わせて、標準文書構造化データと入力文書構造化データの類似の程度を容易に把握することができる。
【００４６】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【００４７】
また、上記の各構成，機能，処理部，処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成，機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム，テーブル，ファイル，測定情報，算出情報等の情報は、メモリや、ハードディスク，ＳＳＤ（Solid State Drive）等の記録装置、または、ＩＣカード，ＳＤカード，ＤＶＤ等の記録媒体に置くことができる。よって、各処理，各構成は、処理部，処理ユニット，プログラムモジュールなどとして各機能を実現可能である。
【００４８】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【符号の説明】
【００４９】
１０１標準文書構造化データベース
１０２要注意箇所データベース
１０３入力文書
１０４構造化文書変換装置
１０５入力文書構造化データベース
１０６構造化データ比較評価装置
１０７参考情報データベース
１０８参考情報作成装置
１０９評価結果データベース

【特許請求の範囲】
【請求項１】
指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い２つの語句の関係を記述した標準的な知識ネットワーク構造データ（以後、標準文書構造化データとよぶ）を予め記録したデータベースと、
入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い２つの語句の関係を示す知識ネットワーク構造データ（以後、入力文書構造化データ）に変換する構造化文書変換装置（１０４）と、
前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を可視化する構造化データ比較評価装置を備えたことを特徴とする文書評価支援システム。
【請求項２】
請求項１の文書評価支援システムにおいて、
前記標準文書構造化データには、指定された種類の文書における要注意箇所を語句と語句、及び相互の関連性が高い２つの語句の関係として記述し、
前記構造化データ比較評価装置は、前記標準文書構造化データの中から前記入力文書構造化データと一致、または類似する箇所を抽出する時に要注意箇所の検索することを特徴とする文書評価支援システム。
【請求項３】
請求項１の文書評価支援システムにおいて、
前記入力した任意の文書は、複数の文からなり、各文ごとに語句と語句、及び相互の関連性が高い２つの語句の関係を示す知識ネットワーク構造データ（以後、文構造化データ）に変換され、１、または複数個の文構造化データによって前記入力文書構造化データが構成され、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を評価するときに、その評価対象となる文を選択することを特徴とする文書評価支援システム。
【請求項４】
請求項１の文書評価支援システムにおいて、
前記標準文書構造化データの中で前記入力文書構造化データと一致する箇所とは、入力文書構造化データの中の任意の文構造化データの語句と語句、及び相互の関連性が高い２つの語句の関係が標準文書構造化データに同様に存在する場合であり、また、類似する箇所とは、入力文書構造化データの中の任意の文構造化データについて、（１）２つの語句の間に２つの語句の相互の関連性が保持されるように語句を追加，補間することによって文構造化データ内の語句と語句、及び相互の関連性が高い２つの語句の関係が標準文書構造化データの一部と一致する場合、または（２）２つの語句の間の語句を２つの語句の間の相互の関連性が保持されるように削除，省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い２つの語句の関係が標準文書構造化データの一部と一致する場合であることを特徴とする文書評価支援システム。
【請求項５】
請求項１の文書評価支援システムにおいて、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データがどのくらい一致、または類似しているかを、入力文書構造化データの中の文構造化データの語句、及び相互の関連性が高い２つの語句の関係が、標準文書構造化データの中の語句、及び相互の関連性が高い２つの語句の関係とどのように一致、または類似するかによって決まる各語句の評価スコアを使って、評価対象である入力文書構造化データの中の全ての文の評価スコアを語句ごとに合計することによって決定することを特徴とする文書評価支援システム。
【請求項６】
請求項１の文書評価支援システムにおいて、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度の結果をもとに、標準文書構造化データの中に入力した任意文書の関連箇所を表示するとは、標準文書構造化データを表すネットワーク図、木構造の語句又は相互の関連性の表示を、各語句の合計評価スコアの大きさによって、色や形等で区別して強調表示し、可視化することを特徴とする文書評価支援システム。
【請求項７】
指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い２つの語句の関係を記述した標準的な知識ネットワーク構造データ（以後、標準文書構造化データとよぶ）を予め記録したデータベースに保持し、
入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い２つの語句の関係を示す知識ネットワーク構造データ（以後、入力文書構造化データ）を記録したデータベースに保持し、
前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を表示手段に可視化することを特徴とする文書評価支援システムの表示方法。
【請求項８】
請求項７において、前記語句の表示を変えた箇所に、評価スコアを関連付けて表示することを特徴とする文書評価支援システムの表示方法。

【図１】