文書評価支援システム、及び文書評価支援方法
【課題】予め定義した任意の文書内容の標準文書構造化データに対して、入力した文書の内容が関連する箇所を可視化することを支援する文書評価支援システムを提供する。
【解決手段】任意の文書の内容についての標準文書構造化データを保管する標準文書構造化データ保管装置、入力文書を文書構造化データに変換する構造化文書変換装置、構造化文書変換装置によって変換された文書構造化データを保管する文書構造化データ保管装置、標準文書構造化データと入力文書構造化データとを比較,評価する構造化データ比較評価装置、入力した文書の中から要注意箇所を抽出して、要注意箇所に対する参考情報を作成する参考情報作成装置、標準文書構造化データと入力文書構造化データとの比較結果から各語句の評価スコアを算出して蓄積する評価結果保管装置、評価結果に応じてグラフや語句の表示を変更する評価結果表示装置を備える。
【解決手段】任意の文書の内容についての標準文書構造化データを保管する標準文書構造化データ保管装置、入力文書を文書構造化データに変換する構造化文書変換装置、構造化文書変換装置によって変換された文書構造化データを保管する文書構造化データ保管装置、標準文書構造化データと入力文書構造化データとを比較,評価する構造化データ比較評価装置、入力した文書の中から要注意箇所を抽出して、要注意箇所に対する参考情報を作成する参考情報作成装置、標準文書構造化データと入力文書構造化データとの比較結果から各語句の評価スコアを算出して蓄積する評価結果保管装置、評価結果に応じてグラフや語句の表示を変更する評価結果表示装置を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力文書に記述されている内容が、その文書の内容に関する標準的な知識ネットワーク構造において、どこが関連する箇所であるかを示すために、入力文書の語句間の関係を上記と同様の知識ネットワーク構造で表して、標準的な知識ネットワーク構造とマッチングすることにより、類似度を評価し、その評価結果に応じて関連箇所の表示を行うことを支援する文書評価支援システムに関する。
【背景技術】
【0002】
従来から、文書内の文を構造化データとして記述し、他のデータベースから情報を検索したり、検索結果についてユーザが経験と裁量をもとに判断して、その結果を活用したりしていた。
【0003】
任意の内容についての語句、及び語句間の関係のように、ある知識ベース上の概念を体系的に表す技術としてオントロジが知られている。また、オントロジを表す構造化データを記述する形式として、XML(eXtensible Makeup Language)形式や、RDF(Resource Description Framework)がある。
【0004】
オントロジ記述形式で記述された照会文により情報を検索する方法として[特許文献1][特許文献2]に示すような情報検索システム,構造化データ検索プログラムがある。
【0005】
オントロジを用いた検索要求により文書を検索し、検索結果についてユーザが評価情報をフィードバックする方法として[特許文献3]に示すような情報検索システムがある。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−165958号公報
【特許文献2】特開2010−79857号公報
【特許文献3】特開2003−108597号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
従来の検索方法では、検索語句や検索文、及びその語句や文に関連する情報を他の文書やデータベースの中から検索することを実現していた。
【0008】
しかしながら、入力された文書の記述内容がその文書の内容に関する標準的な知識ネットワーク構造、または、その文書が標準的に記載すべき内容を表す知識ネットワーク構造において、どの部分にどの位関連しているか、どの部分について記載されているか、またはどの部分が記載されていないか等を知るためには、入力文書の記述内容についての語句、及び語句と語句との関係を検索するだけでなく、標準的な知識ネットワーク構造と入力文書の知識ネットワーク構造を比較して関連箇所を検索して類似度を評価し、評価結果に対応して、標準的な知識ネットワーク構造を構成する各語句の表示を変えることが必要である。
【課題を解決するための手段】
【0009】
上記の課題を解決するために、本発明では、任意の文書の内容に関する語句と語句、及び2つの語句の関係を表す標準的な知識ネットワーク構造を保管する手段、入力文書を前記と同様に、語句と語句、及び2つの語句の関係を表し、その文書内に含まれる語句で構成される知識ネットワーク構造に変換する手段、入力文書の中から選択した文の知識ネットワーク構造と、前記標準的な知識ネットワーク構造とを比較し、一致、または類似する箇所を検索する手段、その類似度を各語句のスコアとして評価する手段、標準的なネットワーク構造を構成する各語句の表示を上記の評価結果に応じて変更する手段、を備えたことを特徴とするものである。
【0010】
また、本発明の文書評価支援システムにおいて、前記入力文書を知識ネットワーク構造に変換する手段とは、入力文書の各文を構文解析して、主語,述語,目的語等の関係を語句と語句、及びその関係として表し、さらに、標準的な知識ネットワーク構造と同様の関係に変換することを特徴とするものである。
【0011】
また、本発明の文書評価支援システムにおいて、前記入力文書の知識ネットワーク構造と標準的な知識ネットワーク構造が一致する箇所というのは、入力文書の中の各文の知識ネットワーク構造と同じ知識ネットワーク構造が標準的な知識ネットワーク構造の中に存在した場合であり、前記入力文書の知識ネットワーク構造と標準的な知識ネットワーク構造が類似するというのは、入力文書の中の各文の知識ネットワーク構造の語句と語句の間に語句と語句の関係を保持できる状態で、他の語句、及び関係を補間した知識ネットワーク構造が、標準的な知識ネットワーク構造の中に存在した場合、または、入力文書の中の各文の知識ネットワーク構造の語句と語句の間の関係を保持できる状態で削除した知識ネットワーク構造が、標準的な知識ネットワーク構造の中に存在した場合であることを特徴とするものである。
【発明の効果】
【0012】
本発明の文書評価支援システムによれば、任意の文書の内容についての標準的な知識ネットワーク構造において、入力文書の記載内容の関連箇所や特徴を把握することができる。
【図面の簡単な説明】
【0013】
【図1】基本構成図。
【図2】標準文書構造化データから入力文書構造化データの一致、類似箇所を抽出,評価,表示するための処理手順。
【図3】標準文書構造化データ例。
【図4】標準文書構造化データに要注意箇所を組み込んだ例。
【図5】標準文書構造化データから入力文書構造化データの要注意箇所を抽出,参考情報を出力するための処理手順。
【図6】入力文書を入力文書構造化データに変換する例。
【図7】構造化データ比較評価装置における処理手順の一例。
【図8】標準文書構造化データにおける、入力文書の任意文の構造化データと一致する箇所の例。
【図9】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の例。
【図10】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の例。
【図11】標準文書構造化データにおける、入力文書の任意文の構造化データと一致する箇所の評価例。
【図12】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の評価例。
【図13】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の評価例。
【図14】標準文書構造化データにおける、入力文書の選択範囲についての評価結果を表示する画面例。
【発明を実施するための形態】
【0014】
以下に図1から図13を用いて本発明に係る情報参照支援システムの一実施形態について説明する。
【実施例1】
【0015】
図1に本実施例の文書評価支援システムの基本構成を示す。本システムは、任意の文書内容についての標準的なネットワーク構造データ(以後、標準文書構造化データと呼ぶ)を保存する標準文書構造化データベース(101)、入力文書(103)を知識ネットワーク構造データ(以後、入力文書構造化データと呼ぶ)に変換する構造化文書変換装置(104)、構造化文書変換装置によって変換された入力文書構造化データを保存する入力文書構造化データベース(105)、任意の文書内容についての要注意箇所を保管する要注意箇所データベース(102)、標準文書構造化データと入力文書構造化データを比較したり、評価することによって、要注意箇所を抽出する構造化データ比較評価装置(106)、入力文書構造化データの各文ごとに評価した結果を蓄積する評価結果データベース(109)、要注意箇所についての参考情報を保管する参考情報データベース(107)、入力した文書の中から要注意箇所が抽出されたとき、対応する参照情報を作成する参考情報作成装置(108)、評価結果に応じてグラフや語句の表示を変更して画面等に表示したり、参考情報を表示したりする評価結果表示装置(110)によって構成されている。
【0016】
図2は標準文書構造化データから入力文書構造化データの一致、類似箇所を抽出,評価,表示するための処理手順である。図1に図示した本発明の文書評価支援システムにおける処理手順の一例をフローチャートで示す。
【0017】
開始(ステップ201)後、標準文書構造化データベースを読み込む(ステップ202)。標準文書構造化データベースは、対象とする文書の内容によって、予め定義されている。例えば、ある製品の技術仕様書のような契約文書では、その製品の技術仕様書として、どのような内容を記述すべきかといった観点で、構成品や実施事項等について、必要とされる語句とその語句間の予め定義されている相互の関連性(これを関係とよぶ)が知識ネットワーク構造で記述されている。
【0018】
次に、入力文書を読み込み(ステップ203)、その中から今回評価する対象範囲を指定する(ステップ204)。文書は1つまたは複数の文によって構成され、指定した対象範囲についてもまた、1つまたは複数の文によって構成される。この指定された対象範囲内の文を標準文書構造化データと同様の知識ネットワーク構造に変換して、入力文書構造化データを作成する(ステップ205)。変換方法については、後述する。
【0019】
次に、前記入力文書構造化データの標準文書構造化データにおける関連箇所との一致,類似度を評価するために、入力文書構造化データの中の全ての文について、各文の知識ネットワーク構造データを標準文書構造化データの中から検索し(ステップ206)、検索状況をもとに評価(ステップ207)する。検索方法は図8にて、評価方法(一致及び類似の評価)は図8〜図13にて後述する。このとき、各文の評価により類似度が高い語句については、標準文書構造化データの語句の評価スコアを高くする。入力文書構造化データの中の全ての文について評価が終了したら(ステップ208)、標準文書構造化データの各語句の評価スコアを合計して、その結果を表示し(ステップ209)、終了する(ステップ210)。
【0020】
図3に、本実施例の文書評価支援システムにおける、図1に図示した標準文書構造化データ101の例を示す。
【0021】
この例300では、「T100」という製品の技術仕様書に記載されるべき内容について、語句と語句、及びその関係をツリー状のデータとして表している。楕円で囲まれているのが技術仕様書の内容に標準的に含まれる語句であり、語句と語句の関係を線でつなぎ、その関係を表す定義語を線付近に記載している。関係を概念的に表す定義語は予め定義されており、この例の定義語は、p/o(part_of)が機器の構成を示し、a/o(attribute_of)が属性や種類,実施項目を示す。これにより、例えば、「T100」301の技術仕様書における構成要素のひとつが「Compressor」302であることを示している。標準文書構造化データをここでは、ツリー状のデータとして表しているが、語句と語句、及び2つの語句の関係が定義できれば、例えば、XMLやRDF,表形式であっても構わない。
【0022】
図4に、本実施例の文書評価支援システムにおける、図3で図示した標準文書構造化データ101の中に要注意箇所データベース102の情報を明示した例を示す。
【0023】
この例400では、「Fuel」401の属性が「Gas」402であるような内容が技術仕様書に記述されていれば、要注意箇所(403)であることを示し、参考情報(404)がリンクされている。例えば、語句「Fuel」と語句「Gas」、及び2つの語句の関係(a/o)を示すようなデータに参考情報のNo.等が付与されている形式が考えられる。このとき、入力文書構造化データにおいて、語句「Fuel」と語句「Gas」、及び2つの語句の関係(a/o)が抽出された場合、参考情報データベースに保管されているリンクしている参考情報を提示するといった活用方法が考えられる。標準文書構造化データの中から入力文書構造化データと一致、または類似する箇所を抽出するときに、要注意箇所の検索ができる。
【0024】
図5に、本実施例の文書評価支援システムにおける、図4に図示した標準文書構造化データの101中に要注意箇所102を明示している場合の処理手順の一例をフローチャートで示す。
【0025】
図5では、図2で示したフローチャートに、要注意箇所の判定(ステップ211)と要注意箇所が判定された場合に参考情報を出力する(ステップ212)処理が追加されている。
【0026】
図6に、本実施例の文書評価支援システムにおける、図1に図示した標準化文書変換装置104が実施する、構造化文書変換方法例を示す。
【0027】
例えば、入力文書に記載されている文例1(601)に示すような文について、自然言語処理等、形式言語の解析で使用される構文解析を実施した結果として、文法的な語句の係り受け関係がわかる。この例では、構文解析の結果として、主語「panel」(602),述語「be provided」(603),目的語「device」(604)を抽出したとする(605)。さらに、この中の述語(動詞)を対象文書の内容によって標準文書構造データをもとに定義される、動詞―関係変換表(606)を使って、語句「panel」と語句「device」、及び2つの語句の関係「p/o」に変換される(607)。文例2(611)も同様に、構文解析の結果として、主語「heater」(612),述語「have」(613),目的語「KOSHA」(614),「ASME」(615)を抽出したとき(616)、動詞―関係変換表(606)を使って、語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」と語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」に変換される(617)。この結果、入力文書は標準文書構造化データと比較,評価しやすい形式になる。
【0028】
図7に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106における処理手順の一例をフローチャートで示す。
【0029】
開始(ステップ701)後、入力文書構造化データを読み込む(ステップ702)。さらに、その中から対象となる文の構造化データを読み込む(ステップ703)。文の構造化データ、例えば、文例1から変換された、語句「panel」と語句「device」、及び2つの語句の関係「p/o」(607)や、文例2から変換された語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」と語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」(617)を読み込む。次に、文の構造化データから親子関係を全て抽出する(704)。例えば、文例1からは、親子関係は1つであるが、文例2では、親子関係は2つになる。親子関係は、親の語句と子の語句、及び2つの語句の関係からなる。さらに、各親子関係を標準構造化データの中から抽出する(705,706)。これを、対象となる文書の中の全ての文から抽出した親子関係について繰り返し(707,708,709)、終了する。
【0030】
図8に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が図7に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する例を示す。
【0031】
図6で図示した文例1(601)は、語句「panel」と語句「device」、及び2つの語句の関係「p/o」に変換される(607,810)。これと一致する、語句と語句、及び2つの語句の関係を標準文書構造化データの中から検索する。その結果、この例では標準文書構造化データの中に、文例と一致する語句と語句、及び2つの語句の関係で示された親子関係が検索される(821)。
【0032】
図9に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が図7に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する他の例を示す。
【0033】
図6で図示した文例2(611)は、語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」と語句「heater」と語句「ASME」、及び2つの語句の関係「a/o」に変換される(617,910)。これと一致する、語句と語句、及び2つの語句の関係を標準文書構造化データの中から検索する。このとき、標準文書構造化データの語句「Heater」と語句「Certificate」、及び2つの語句の関係「a/o」と、語句「Certificate」と語句「KOSHA」、及び2つの語句の関係「a/o」(921)において、2つの関係が同じことから、「Heater」と語句「KOSHA」について、2つの語句の関係が継承されて「a/o」になる(931,911)。すなわち、「Heater」の属性(実施事項)の一つが「Certificate」で、「Certificate」の属性(種類)の一つが「KOSHA」であるとき、「Heater」の属性(実施事項)の一つが「KOSHA」(911)であるとする。その結果、この例では標準文書構造化データの中に、文例と一致する語句と語句、及び2つの語句の関係で示された親子関係が検索される(931)。「Heater」と「ASME」の関係も同様である(912,922,932)。
【0034】
このように、入力文書構造化データの中の任意の文構造化データについて、2つの語句の間の語句を2つの語句の間の相互の関連性が保持されるように削除,省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。
【0035】
このように入力文書の評価結果を表示することによって、入力文書の関連箇所や特徴、また、記載内容の十分な箇所,不十分な箇所等を把握することができる。
【0036】
図10に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が図7に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する他の例を示す。
【0037】
入力文書構造化データの中の文例3の構造化データとして、語句「Fuel」と語句「system」の2つの語句の関係が「p/o」、さらに、語句「system」と語句「Oil」の2つの語句の関係が「p/o」である場合(1010)、これと一致する、語句と語句、及び2つの語句の関係を標準文書構造化データの中から検索する。このとき、検索する親子関係のパターンとして、例3(a)語句「Fuel」と語句「system」、及び2つの語句の関係「p/o」(1011)、例3(b)語句「system」と語句「Oil」、及び2つの語句の関係「p/o」(1012)、さらに、2つの関係が同じ「p/o」であることから、例3(c)語句「Fuel」と語句「Oil」、及び2つの語句の関係「p/o」(1013)を設定する。その結果、この例では標準文書構造化データの中に、例3(c)と一致する語句と語句、及び2つの語句の関係で示された親子関係が検索される(1021)。
【0038】
図11,図12,図13に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が標準文書構造化データの中から入力文書構造化データを検索したときの評価スコアの算出例を示す。
【0039】
図11は、図8で検索した文例1について、評価スコアを算出した例を示す。
親の語句 :1.0×α01(α01:「一致」した場合の親の重み)
子の語句 :1.0×α02(α02:「一致」した場合の子の重み)
その結果、α01=α02=1.0のとき、
親の語句「panel」:1.0×1.0=1.0
子の語句「device」:1.0×1.0=1.0
図12は、図9で検索した文例2について、評価スコアを算出した例を示す。
親の語句 :1.0×(1/n)×β11(β11:語句の補間により「類似」した場合
の親の重み)
子の語句 :1.0×(1/n)×β12(β12:語句の補間により「類似」した場合
の子の重み)
その結果、β11=β12=1.0のとき、n=2
親の語句「Heater」:1.0×0.5×1.0=0.5 (1)
子の語句「KOSHA」:1.0×0.5×1.0=0.5
親の語句「Heater」:1.0×0.5×1.0=0.5 (2)
子の語句「ASME」:1.0×0.5×1.0=0.5
(1),(2)から、「Heater」のスコアは、0.5+0.5=1.0となる。
【0040】
このように、入力文書構造化データの中の任意の文構造化データについて、2つの語句の間に2つの語句の相互の関連性が保持されるように語句を追加,補間することによって文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。図13は、図10で検索した文例3について、評価スコアを算出した例を示す。
親の語句 :1.0×(1/m)×γ21(γ21:語句の削除により「類似」した場合
の親の重み)
子の語句 :1.0×(1/m)×γ22(γ22:語句の削除により「類似」した場合
の子の重み)
その結果、γ21=γ22=1.0のとき、m=2
親の語句「Fuel」:1.0×0.5×1.0=0.5
子の語句「Oil」:1.0×0.5×1.0=0.5
このように、入力文書構造化データの中の任意の文構造化データについて、2つの語句の間の語句を2つの語句の間の相互の関連性が保持されるように削除,省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。
【0041】
尚、ここで示した重みについては、標準文書構造化データや入力文書の構成や詳細度によって変更する。
【0042】
図14に、本発明の文書評価支援システムにおける、図1に図示した評価結果表示装置110によって、評価結果に応じて標準構造化データを構成する語句の表示を変更した出力画面例を示す。この例では、文書の対象範囲を選択して、標準文書構造を表示させると、標準文書構造化データ全体の中に、対象となった文の内容に関連する語句について、評価スコアの大きさに応じて、語句を表す楕円内の色の濃淡を変えて表示している。これによって、例えば、契約文書の中の選択した文の内容の特徴や、標準的な契約文書に対して、どこが関係しているか、内容として不十分なところはどこかといったことが容易にわかる。
【実施例2】
【0043】
実施例1では、構造化文書変換装置104により変換することを前提としていたが、その変換処理を終えたデータは入力文書構造化データベース105へ記録しておけば必ずしも解析処理は必要ではない。つまり、図3,図4,図8〜図14の画面は、構造化データ比較評価装置106で、それらデータベースに記録された標準文書構造化データと入力文書構造化データを比較することにより表示する。
【0044】
つまり、指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い2つの語句の関係を記述した標準的な知識ネットワーク構造データ(以後、標準文書構造化データとよぶ)を予め記録したデータベース(101)に保持し、入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、入力文書構造化データ)を記録したデータベース(105)に保持し、前記標準文書構造化データ(101)と前記入力文書構造化データ(105)との一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を表示手段に可視化する文書評価支援システムの表示方法により、任意の文書の内容についての標準的な知識ネットワーク構造において、入力文書の記載内容の関連箇所や特徴を把握することができる。
【0045】
また、前記語句の表示を変えた箇所に、評価スコアを関連付けて表示する文書評価支援システムの表示方法により、作業者は関連箇所と合わせて、標準文書構造化データと入力文書構造化データの類似の程度を容易に把握することができる。
【0046】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0047】
また、上記の各構成,機能,処理部,処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成,機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム,テーブル,ファイル,測定情報,算出情報等の情報は、メモリや、ハードディスク,SSD(Solid State Drive)等の記録装置、または、ICカード,SDカード,DVD等の記録媒体に置くことができる。よって、各処理,各構成は、処理部,処理ユニット,プログラムモジュールなどとして各機能を実現可能である。
【0048】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0049】
101 標準文書構造化データベース
102 要注意箇所データベース
103 入力文書
104 構造化文書変換装置
105 入力文書構造化データベース
106 構造化データ比較評価装置
107 参考情報データベース
108 参考情報作成装置
109 評価結果データベース
【技術分野】
【0001】
本発明は、入力文書に記述されている内容が、その文書の内容に関する標準的な知識ネットワーク構造において、どこが関連する箇所であるかを示すために、入力文書の語句間の関係を上記と同様の知識ネットワーク構造で表して、標準的な知識ネットワーク構造とマッチングすることにより、類似度を評価し、その評価結果に応じて関連箇所の表示を行うことを支援する文書評価支援システムに関する。
【背景技術】
【0002】
従来から、文書内の文を構造化データとして記述し、他のデータベースから情報を検索したり、検索結果についてユーザが経験と裁量をもとに判断して、その結果を活用したりしていた。
【0003】
任意の内容についての語句、及び語句間の関係のように、ある知識ベース上の概念を体系的に表す技術としてオントロジが知られている。また、オントロジを表す構造化データを記述する形式として、XML(eXtensible Makeup Language)形式や、RDF(Resource Description Framework)がある。
【0004】
オントロジ記述形式で記述された照会文により情報を検索する方法として[特許文献1][特許文献2]に示すような情報検索システム,構造化データ検索プログラムがある。
【0005】
オントロジを用いた検索要求により文書を検索し、検索結果についてユーザが評価情報をフィードバックする方法として[特許文献3]に示すような情報検索システムがある。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−165958号公報
【特許文献2】特開2010−79857号公報
【特許文献3】特開2003−108597号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
従来の検索方法では、検索語句や検索文、及びその語句や文に関連する情報を他の文書やデータベースの中から検索することを実現していた。
【0008】
しかしながら、入力された文書の記述内容がその文書の内容に関する標準的な知識ネットワーク構造、または、その文書が標準的に記載すべき内容を表す知識ネットワーク構造において、どの部分にどの位関連しているか、どの部分について記載されているか、またはどの部分が記載されていないか等を知るためには、入力文書の記述内容についての語句、及び語句と語句との関係を検索するだけでなく、標準的な知識ネットワーク構造と入力文書の知識ネットワーク構造を比較して関連箇所を検索して類似度を評価し、評価結果に対応して、標準的な知識ネットワーク構造を構成する各語句の表示を変えることが必要である。
【課題を解決するための手段】
【0009】
上記の課題を解決するために、本発明では、任意の文書の内容に関する語句と語句、及び2つの語句の関係を表す標準的な知識ネットワーク構造を保管する手段、入力文書を前記と同様に、語句と語句、及び2つの語句の関係を表し、その文書内に含まれる語句で構成される知識ネットワーク構造に変換する手段、入力文書の中から選択した文の知識ネットワーク構造と、前記標準的な知識ネットワーク構造とを比較し、一致、または類似する箇所を検索する手段、その類似度を各語句のスコアとして評価する手段、標準的なネットワーク構造を構成する各語句の表示を上記の評価結果に応じて変更する手段、を備えたことを特徴とするものである。
【0010】
また、本発明の文書評価支援システムにおいて、前記入力文書を知識ネットワーク構造に変換する手段とは、入力文書の各文を構文解析して、主語,述語,目的語等の関係を語句と語句、及びその関係として表し、さらに、標準的な知識ネットワーク構造と同様の関係に変換することを特徴とするものである。
【0011】
また、本発明の文書評価支援システムにおいて、前記入力文書の知識ネットワーク構造と標準的な知識ネットワーク構造が一致する箇所というのは、入力文書の中の各文の知識ネットワーク構造と同じ知識ネットワーク構造が標準的な知識ネットワーク構造の中に存在した場合であり、前記入力文書の知識ネットワーク構造と標準的な知識ネットワーク構造が類似するというのは、入力文書の中の各文の知識ネットワーク構造の語句と語句の間に語句と語句の関係を保持できる状態で、他の語句、及び関係を補間した知識ネットワーク構造が、標準的な知識ネットワーク構造の中に存在した場合、または、入力文書の中の各文の知識ネットワーク構造の語句と語句の間の関係を保持できる状態で削除した知識ネットワーク構造が、標準的な知識ネットワーク構造の中に存在した場合であることを特徴とするものである。
【発明の効果】
【0012】
本発明の文書評価支援システムによれば、任意の文書の内容についての標準的な知識ネットワーク構造において、入力文書の記載内容の関連箇所や特徴を把握することができる。
【図面の簡単な説明】
【0013】
【図1】基本構成図。
【図2】標準文書構造化データから入力文書構造化データの一致、類似箇所を抽出,評価,表示するための処理手順。
【図3】標準文書構造化データ例。
【図4】標準文書構造化データに要注意箇所を組み込んだ例。
【図5】標準文書構造化データから入力文書構造化データの要注意箇所を抽出,参考情報を出力するための処理手順。
【図6】入力文書を入力文書構造化データに変換する例。
【図7】構造化データ比較評価装置における処理手順の一例。
【図8】標準文書構造化データにおける、入力文書の任意文の構造化データと一致する箇所の例。
【図9】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の例。
【図10】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の例。
【図11】標準文書構造化データにおける、入力文書の任意文の構造化データと一致する箇所の評価例。
【図12】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の評価例。
【図13】標準文書構造化データにおける、入力文書の任意文の構造化データと類似する箇所の評価例。
【図14】標準文書構造化データにおける、入力文書の選択範囲についての評価結果を表示する画面例。
【発明を実施するための形態】
【0014】
以下に図1から図13を用いて本発明に係る情報参照支援システムの一実施形態について説明する。
【実施例1】
【0015】
図1に本実施例の文書評価支援システムの基本構成を示す。本システムは、任意の文書内容についての標準的なネットワーク構造データ(以後、標準文書構造化データと呼ぶ)を保存する標準文書構造化データベース(101)、入力文書(103)を知識ネットワーク構造データ(以後、入力文書構造化データと呼ぶ)に変換する構造化文書変換装置(104)、構造化文書変換装置によって変換された入力文書構造化データを保存する入力文書構造化データベース(105)、任意の文書内容についての要注意箇所を保管する要注意箇所データベース(102)、標準文書構造化データと入力文書構造化データを比較したり、評価することによって、要注意箇所を抽出する構造化データ比較評価装置(106)、入力文書構造化データの各文ごとに評価した結果を蓄積する評価結果データベース(109)、要注意箇所についての参考情報を保管する参考情報データベース(107)、入力した文書の中から要注意箇所が抽出されたとき、対応する参照情報を作成する参考情報作成装置(108)、評価結果に応じてグラフや語句の表示を変更して画面等に表示したり、参考情報を表示したりする評価結果表示装置(110)によって構成されている。
【0016】
図2は標準文書構造化データから入力文書構造化データの一致、類似箇所を抽出,評価,表示するための処理手順である。図1に図示した本発明の文書評価支援システムにおける処理手順の一例をフローチャートで示す。
【0017】
開始(ステップ201)後、標準文書構造化データベースを読み込む(ステップ202)。標準文書構造化データベースは、対象とする文書の内容によって、予め定義されている。例えば、ある製品の技術仕様書のような契約文書では、その製品の技術仕様書として、どのような内容を記述すべきかといった観点で、構成品や実施事項等について、必要とされる語句とその語句間の予め定義されている相互の関連性(これを関係とよぶ)が知識ネットワーク構造で記述されている。
【0018】
次に、入力文書を読み込み(ステップ203)、その中から今回評価する対象範囲を指定する(ステップ204)。文書は1つまたは複数の文によって構成され、指定した対象範囲についてもまた、1つまたは複数の文によって構成される。この指定された対象範囲内の文を標準文書構造化データと同様の知識ネットワーク構造に変換して、入力文書構造化データを作成する(ステップ205)。変換方法については、後述する。
【0019】
次に、前記入力文書構造化データの標準文書構造化データにおける関連箇所との一致,類似度を評価するために、入力文書構造化データの中の全ての文について、各文の知識ネットワーク構造データを標準文書構造化データの中から検索し(ステップ206)、検索状況をもとに評価(ステップ207)する。検索方法は図8にて、評価方法(一致及び類似の評価)は図8〜図13にて後述する。このとき、各文の評価により類似度が高い語句については、標準文書構造化データの語句の評価スコアを高くする。入力文書構造化データの中の全ての文について評価が終了したら(ステップ208)、標準文書構造化データの各語句の評価スコアを合計して、その結果を表示し(ステップ209)、終了する(ステップ210)。
【0020】
図3に、本実施例の文書評価支援システムにおける、図1に図示した標準文書構造化データ101の例を示す。
【0021】
この例300では、「T100」という製品の技術仕様書に記載されるべき内容について、語句と語句、及びその関係をツリー状のデータとして表している。楕円で囲まれているのが技術仕様書の内容に標準的に含まれる語句であり、語句と語句の関係を線でつなぎ、その関係を表す定義語を線付近に記載している。関係を概念的に表す定義語は予め定義されており、この例の定義語は、p/o(part_of)が機器の構成を示し、a/o(attribute_of)が属性や種類,実施項目を示す。これにより、例えば、「T100」301の技術仕様書における構成要素のひとつが「Compressor」302であることを示している。標準文書構造化データをここでは、ツリー状のデータとして表しているが、語句と語句、及び2つの語句の関係が定義できれば、例えば、XMLやRDF,表形式であっても構わない。
【0022】
図4に、本実施例の文書評価支援システムにおける、図3で図示した標準文書構造化データ101の中に要注意箇所データベース102の情報を明示した例を示す。
【0023】
この例400では、「Fuel」401の属性が「Gas」402であるような内容が技術仕様書に記述されていれば、要注意箇所(403)であることを示し、参考情報(404)がリンクされている。例えば、語句「Fuel」と語句「Gas」、及び2つの語句の関係(a/o)を示すようなデータに参考情報のNo.等が付与されている形式が考えられる。このとき、入力文書構造化データにおいて、語句「Fuel」と語句「Gas」、及び2つの語句の関係(a/o)が抽出された場合、参考情報データベースに保管されているリンクしている参考情報を提示するといった活用方法が考えられる。標準文書構造化データの中から入力文書構造化データと一致、または類似する箇所を抽出するときに、要注意箇所の検索ができる。
【0024】
図5に、本実施例の文書評価支援システムにおける、図4に図示した標準文書構造化データの101中に要注意箇所102を明示している場合の処理手順の一例をフローチャートで示す。
【0025】
図5では、図2で示したフローチャートに、要注意箇所の判定(ステップ211)と要注意箇所が判定された場合に参考情報を出力する(ステップ212)処理が追加されている。
【0026】
図6に、本実施例の文書評価支援システムにおける、図1に図示した標準化文書変換装置104が実施する、構造化文書変換方法例を示す。
【0027】
例えば、入力文書に記載されている文例1(601)に示すような文について、自然言語処理等、形式言語の解析で使用される構文解析を実施した結果として、文法的な語句の係り受け関係がわかる。この例では、構文解析の結果として、主語「panel」(602),述語「be provided」(603),目的語「device」(604)を抽出したとする(605)。さらに、この中の述語(動詞)を対象文書の内容によって標準文書構造データをもとに定義される、動詞―関係変換表(606)を使って、語句「panel」と語句「device」、及び2つの語句の関係「p/o」に変換される(607)。文例2(611)も同様に、構文解析の結果として、主語「heater」(612),述語「have」(613),目的語「KOSHA」(614),「ASME」(615)を抽出したとき(616)、動詞―関係変換表(606)を使って、語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」と語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」に変換される(617)。この結果、入力文書は標準文書構造化データと比較,評価しやすい形式になる。
【0028】
図7に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106における処理手順の一例をフローチャートで示す。
【0029】
開始(ステップ701)後、入力文書構造化データを読み込む(ステップ702)。さらに、その中から対象となる文の構造化データを読み込む(ステップ703)。文の構造化データ、例えば、文例1から変換された、語句「panel」と語句「device」、及び2つの語句の関係「p/o」(607)や、文例2から変換された語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」と語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」(617)を読み込む。次に、文の構造化データから親子関係を全て抽出する(704)。例えば、文例1からは、親子関係は1つであるが、文例2では、親子関係は2つになる。親子関係は、親の語句と子の語句、及び2つの語句の関係からなる。さらに、各親子関係を標準構造化データの中から抽出する(705,706)。これを、対象となる文書の中の全ての文から抽出した親子関係について繰り返し(707,708,709)、終了する。
【0030】
図8に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が図7に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する例を示す。
【0031】
図6で図示した文例1(601)は、語句「panel」と語句「device」、及び2つの語句の関係「p/o」に変換される(607,810)。これと一致する、語句と語句、及び2つの語句の関係を標準文書構造化データの中から検索する。その結果、この例では標準文書構造化データの中に、文例と一致する語句と語句、及び2つの語句の関係で示された親子関係が検索される(821)。
【0032】
図9に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が図7に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する他の例を示す。
【0033】
図6で図示した文例2(611)は、語句「heater」と語句「KOSHA」、及び2つの語句の関係「a/o」と語句「heater」と語句「ASME」、及び2つの語句の関係「a/o」に変換される(617,910)。これと一致する、語句と語句、及び2つの語句の関係を標準文書構造化データの中から検索する。このとき、標準文書構造化データの語句「Heater」と語句「Certificate」、及び2つの語句の関係「a/o」と、語句「Certificate」と語句「KOSHA」、及び2つの語句の関係「a/o」(921)において、2つの関係が同じことから、「Heater」と語句「KOSHA」について、2つの語句の関係が継承されて「a/o」になる(931,911)。すなわち、「Heater」の属性(実施事項)の一つが「Certificate」で、「Certificate」の属性(種類)の一つが「KOSHA」であるとき、「Heater」の属性(実施事項)の一つが「KOSHA」(911)であるとする。その結果、この例では標準文書構造化データの中に、文例と一致する語句と語句、及び2つの語句の関係で示された親子関係が検索される(931)。「Heater」と「ASME」の関係も同様である(912,922,932)。
【0034】
このように、入力文書構造化データの中の任意の文構造化データについて、2つの語句の間の語句を2つの語句の間の相互の関連性が保持されるように削除,省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。
【0035】
このように入力文書の評価結果を表示することによって、入力文書の関連箇所や特徴、また、記載内容の十分な箇所,不十分な箇所等を把握することができる。
【0036】
図10に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が図7に図示した処理手順に従って実施した、標準文書構造化データの中から入力文書構造化データを検索する他の例を示す。
【0037】
入力文書構造化データの中の文例3の構造化データとして、語句「Fuel」と語句「system」の2つの語句の関係が「p/o」、さらに、語句「system」と語句「Oil」の2つの語句の関係が「p/o」である場合(1010)、これと一致する、語句と語句、及び2つの語句の関係を標準文書構造化データの中から検索する。このとき、検索する親子関係のパターンとして、例3(a)語句「Fuel」と語句「system」、及び2つの語句の関係「p/o」(1011)、例3(b)語句「system」と語句「Oil」、及び2つの語句の関係「p/o」(1012)、さらに、2つの関係が同じ「p/o」であることから、例3(c)語句「Fuel」と語句「Oil」、及び2つの語句の関係「p/o」(1013)を設定する。その結果、この例では標準文書構造化データの中に、例3(c)と一致する語句と語句、及び2つの語句の関係で示された親子関係が検索される(1021)。
【0038】
図11,図12,図13に、本発明の文書評価支援システムにおける、図1に図示した構造化データ比較評価装置106が標準文書構造化データの中から入力文書構造化データを検索したときの評価スコアの算出例を示す。
【0039】
図11は、図8で検索した文例1について、評価スコアを算出した例を示す。
親の語句 :1.0×α01(α01:「一致」した場合の親の重み)
子の語句 :1.0×α02(α02:「一致」した場合の子の重み)
その結果、α01=α02=1.0のとき、
親の語句「panel」:1.0×1.0=1.0
子の語句「device」:1.0×1.0=1.0
図12は、図9で検索した文例2について、評価スコアを算出した例を示す。
親の語句 :1.0×(1/n)×β11(β11:語句の補間により「類似」した場合
の親の重み)
子の語句 :1.0×(1/n)×β12(β12:語句の補間により「類似」した場合
の子の重み)
その結果、β11=β12=1.0のとき、n=2
親の語句「Heater」:1.0×0.5×1.0=0.5 (1)
子の語句「KOSHA」:1.0×0.5×1.0=0.5
親の語句「Heater」:1.0×0.5×1.0=0.5 (2)
子の語句「ASME」:1.0×0.5×1.0=0.5
(1),(2)から、「Heater」のスコアは、0.5+0.5=1.0となる。
【0040】
このように、入力文書構造化データの中の任意の文構造化データについて、2つの語句の間に2つの語句の相互の関連性が保持されるように語句を追加,補間することによって文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。図13は、図10で検索した文例3について、評価スコアを算出した例を示す。
親の語句 :1.0×(1/m)×γ21(γ21:語句の削除により「類似」した場合
の親の重み)
子の語句 :1.0×(1/m)×γ22(γ22:語句の削除により「類似」した場合
の子の重み)
その結果、γ21=γ22=1.0のとき、m=2
親の語句「Fuel」:1.0×0.5×1.0=0.5
子の語句「Oil」:1.0×0.5×1.0=0.5
このように、入力文書構造化データの中の任意の文構造化データについて、2つの語句の間の語句を2つの語句の間の相互の関連性が保持されるように削除,省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合を類似する箇所としている。
【0041】
尚、ここで示した重みについては、標準文書構造化データや入力文書の構成や詳細度によって変更する。
【0042】
図14に、本発明の文書評価支援システムにおける、図1に図示した評価結果表示装置110によって、評価結果に応じて標準構造化データを構成する語句の表示を変更した出力画面例を示す。この例では、文書の対象範囲を選択して、標準文書構造を表示させると、標準文書構造化データ全体の中に、対象となった文の内容に関連する語句について、評価スコアの大きさに応じて、語句を表す楕円内の色の濃淡を変えて表示している。これによって、例えば、契約文書の中の選択した文の内容の特徴や、標準的な契約文書に対して、どこが関係しているか、内容として不十分なところはどこかといったことが容易にわかる。
【実施例2】
【0043】
実施例1では、構造化文書変換装置104により変換することを前提としていたが、その変換処理を終えたデータは入力文書構造化データベース105へ記録しておけば必ずしも解析処理は必要ではない。つまり、図3,図4,図8〜図14の画面は、構造化データ比較評価装置106で、それらデータベースに記録された標準文書構造化データと入力文書構造化データを比較することにより表示する。
【0044】
つまり、指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い2つの語句の関係を記述した標準的な知識ネットワーク構造データ(以後、標準文書構造化データとよぶ)を予め記録したデータベース(101)に保持し、入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、入力文書構造化データ)を記録したデータベース(105)に保持し、前記標準文書構造化データ(101)と前記入力文書構造化データ(105)との一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を表示手段に可視化する文書評価支援システムの表示方法により、任意の文書の内容についての標準的な知識ネットワーク構造において、入力文書の記載内容の関連箇所や特徴を把握することができる。
【0045】
また、前記語句の表示を変えた箇所に、評価スコアを関連付けて表示する文書評価支援システムの表示方法により、作業者は関連箇所と合わせて、標準文書構造化データと入力文書構造化データの類似の程度を容易に把握することができる。
【0046】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0047】
また、上記の各構成,機能,処理部,処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成,機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム,テーブル,ファイル,測定情報,算出情報等の情報は、メモリや、ハードディスク,SSD(Solid State Drive)等の記録装置、または、ICカード,SDカード,DVD等の記録媒体に置くことができる。よって、各処理,各構成は、処理部,処理ユニット,プログラムモジュールなどとして各機能を実現可能である。
【0048】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0049】
101 標準文書構造化データベース
102 要注意箇所データベース
103 入力文書
104 構造化文書変換装置
105 入力文書構造化データベース
106 構造化データ比較評価装置
107 参考情報データベース
108 参考情報作成装置
109 評価結果データベース
【特許請求の範囲】
【請求項1】
指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い2つの語句の関係を記述した標準的な知識ネットワーク構造データ(以後、標準文書構造化データとよぶ)を予め記録したデータベースと、
入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、入力文書構造化データ)に変換する構造化文書変換装置(104)と、
前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を可視化する構造化データ比較評価装置を備えたことを特徴とする文書評価支援システム。
【請求項2】
請求項1の文書評価支援システムにおいて、
前記標準文書構造化データには、指定された種類の文書における要注意箇所を語句と語句、及び相互の関連性が高い2つの語句の関係として記述し、
前記構造化データ比較評価装置は、前記標準文書構造化データの中から前記入力文書構造化データと一致、または類似する箇所を抽出する時に要注意箇所の検索することを特徴とする文書評価支援システム。
【請求項3】
請求項1の文書評価支援システムにおいて、
前記入力した任意の文書は、複数の文からなり、各文ごとに語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、文構造化データ)に変換され、1、または複数個の文構造化データによって前記入力文書構造化データが構成され、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を評価するときに、その評価対象となる文を選択することを特徴とする文書評価支援システム。
【請求項4】
請求項1の文書評価支援システムにおいて、
前記標準文書構造化データの中で前記入力文書構造化データと一致する箇所とは、入力文書構造化データの中の任意の文構造化データの語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データに同様に存在する場合であり、また、類似する箇所とは、入力文書構造化データの中の任意の文構造化データについて、(1)2つの語句の間に2つの語句の相互の関連性が保持されるように語句を追加,補間することによって文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合、または(2)2つの語句の間の語句を2つの語句の間の相互の関連性が保持されるように削除,省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合であることを特徴とする文書評価支援システム。
【請求項5】
請求項1の文書評価支援システムにおいて、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データがどのくらい一致、または類似しているかを、入力文書構造化データの中の文構造化データの語句、及び相互の関連性が高い2つの語句の関係が、標準文書構造化データの中の語句、及び相互の関連性が高い2つの語句の関係とどのように一致、または類似するかによって決まる各語句の評価スコアを使って、評価対象である入力文書構造化データの中の全ての文の評価スコアを語句ごとに合計することによって決定することを特徴とする文書評価支援システム。
【請求項6】
請求項1の文書評価支援システムにおいて、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度の結果をもとに、標準文書構造化データの中に入力した任意文書の関連箇所を表示するとは、標準文書構造化データを表すネットワーク図、木構造の語句又は相互の関連性の表示を、各語句の合計評価スコアの大きさによって、色や形等で区別して強調表示し、可視化することを特徴とする文書評価支援システム。
【請求項7】
指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い2つの語句の関係を記述した標準的な知識ネットワーク構造データ(以後、標準文書構造化データとよぶ)を予め記録したデータベースに保持し、
入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、入力文書構造化データ)を記録したデータベースに保持し、
前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を表示手段に可視化することを特徴とする文書評価支援システムの表示方法。
【請求項8】
請求項7において、前記語句の表示を変えた箇所に、評価スコアを関連付けて表示することを特徴とする文書評価支援システムの表示方法。
【請求項1】
指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い2つの語句の関係を記述した標準的な知識ネットワーク構造データ(以後、標準文書構造化データとよぶ)を予め記録したデータベースと、
入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、入力文書構造化データ)に変換する構造化文書変換装置(104)と、
前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を可視化する構造化データ比較評価装置を備えたことを特徴とする文書評価支援システム。
【請求項2】
請求項1の文書評価支援システムにおいて、
前記標準文書構造化データには、指定された種類の文書における要注意箇所を語句と語句、及び相互の関連性が高い2つの語句の関係として記述し、
前記構造化データ比較評価装置は、前記標準文書構造化データの中から前記入力文書構造化データと一致、または類似する箇所を抽出する時に要注意箇所の検索することを特徴とする文書評価支援システム。
【請求項3】
請求項1の文書評価支援システムにおいて、
前記入力した任意の文書は、複数の文からなり、各文ごとに語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、文構造化データ)に変換され、1、または複数個の文構造化データによって前記入力文書構造化データが構成され、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を評価するときに、その評価対象となる文を選択することを特徴とする文書評価支援システム。
【請求項4】
請求項1の文書評価支援システムにおいて、
前記標準文書構造化データの中で前記入力文書構造化データと一致する箇所とは、入力文書構造化データの中の任意の文構造化データの語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データに同様に存在する場合であり、また、類似する箇所とは、入力文書構造化データの中の任意の文構造化データについて、(1)2つの語句の間に2つの語句の相互の関連性が保持されるように語句を追加,補間することによって文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合、または(2)2つの語句の間の語句を2つの語句の間の相互の関連性が保持されるように削除,省略することによって、文構造化データ内の語句と語句、及び相互の関連性が高い2つの語句の関係が標準文書構造化データの一部と一致する場合であることを特徴とする文書評価支援システム。
【請求項5】
請求項1の文書評価支援システムにおいて、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データがどのくらい一致、または類似しているかを、入力文書構造化データの中の文構造化データの語句、及び相互の関連性が高い2つの語句の関係が、標準文書構造化データの中の語句、及び相互の関連性が高い2つの語句の関係とどのように一致、または類似するかによって決まる各語句の評価スコアを使って、評価対象である入力文書構造化データの中の全ての文の評価スコアを語句ごとに合計することによって決定することを特徴とする文書評価支援システム。
【請求項6】
請求項1の文書評価支援システムにおいて、
前記構造化データ比較評価装置は、前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度の結果をもとに、標準文書構造化データの中に入力した任意文書の関連箇所を表示するとは、標準文書構造化データを表すネットワーク図、木構造の語句又は相互の関連性の表示を、各語句の合計評価スコアの大きさによって、色や形等で区別して強調表示し、可視化することを特徴とする文書評価支援システム。
【請求項7】
指定された種類の文書の内容に関する、語句と語句、及び相互の関連性が高い2つの語句の関係を記述した標準的な知識ネットワーク構造データ(以後、標準文書構造化データとよぶ)を予め記録したデータベースに保持し、
入力した任意の文書を前記標準文書構造化データと同様の形式である、語句と語句、及び相互の関連性が高い2つの語句の関係を示す知識ネットワーク構造データ(以後、入力文書構造化データ)を記録したデータベースに保持し、
前記標準文書構造化データと前記入力文書構造化データとの一致、または類似度を語句ごとに評価し、その評価結果に応じて、標準文書構造化データを構成する語句の表示を変えて、標準文書構造化データのなかの、入力文書に記述されている内容についての関連箇所を表示手段に可視化することを特徴とする文書評価支援システムの表示方法。
【請求項8】
請求項7において、前記語句の表示を変えた箇所に、評価スコアを関連付けて表示することを特徴とする文書評価支援システムの表示方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2012−178079(P2012−178079A)
【公開日】平成24年9月13日(2012.9.13)
【国際特許分類】
【出願番号】特願2011−41118(P2011−41118)
【出願日】平成23年2月28日(2011.2.28)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
【公開日】平成24年9月13日(2012.9.13)
【国際特許分類】
【出願日】平成23年2月28日(2011.2.28)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
[ Back to top ]