情報参照支援システム
【課題】ある文書の選択範囲に対する参照情報を、他の複数の文書の中から精度よくかつ漏れなく検索することを支援する情報参照支援システムを提供する。
【解決手段】文書を1つまたは複数の条項に分割する条項設定手段104と、指定語句1を定義する指定語句1定義手段107と、条項を検出する選択範囲条項判定手段108と、標準項目と条項との関連が設定される標準項目別関連条項データベース109と、標準項目ごとに指定語句が設定された標準項目別指定語句データベースと110、標準項目別関連条項データベース109に設定されている標準項目と条項との関連と、標準項目別指定語句データベース110に設定されている指定語句とに基づき、指定語句2を定義する指定語句2定義手段111と、少なくとも指定語句1と指定語句2の一方を検索条件に用いて、選択範囲に関連する情報を参照情報の中から検索する参照情報検索手段114とを備える。
【解決手段】文書を1つまたは複数の条項に分割する条項設定手段104と、指定語句1を定義する指定語句1定義手段107と、条項を検出する選択範囲条項判定手段108と、標準項目と条項との関連が設定される標準項目別関連条項データベース109と、標準項目ごとに指定語句が設定された標準項目別指定語句データベースと110、標準項目別関連条項データベース109に設定されている標準項目と条項との関連と、標準項目別指定語句データベース110に設定されている指定語句とに基づき、指定語句2を定義する指定語句2定義手段111と、少なくとも指定語句1と指定語句2の一方を検索条件に用いて、選択範囲に関連する情報を参照情報の中から検索する参照情報検索手段114とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書中の選択範囲に関連する情報を参照するのを支援する情報参照支援システムに関する。より詳細には、文書中の選択範囲をもとに検索語句を設定して、他の大量の文書の中から参照する情報を獲得することを支援する情報参照支援システムに関する。
【背景技術】
【0002】
従来、契約文書等の内容の一部について、ノウハウ情報や事例集などの既存図書から関連する情報を参照する場合は、既存図書の文書データの中から関連するファイルや関連する見出し等で範囲を指定して、経験と裁量をもとに語句検索等を実行して情報を抽出していた。
【0003】
大量の文書の中から、ユーザが重要であると考えかつ内容を特定した文を抽出する方法として、特許文献1に示す重要文抽出方法がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−146397号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に示すような重要文抽出方法では、内容を特定するための指定語句(例えば、部品についての文を抽出する場合には「部品名」)と、ユーザが重要であると考え、検索対象である既存図書における記述箇所を特定するための指定語句(例えば、故障について記述されている箇所を特定する場合には、「原因」や「対策」)とを設定して、検索結果の絞込みを実現している。しかしながら、このような重要文抽出方法を使用する情報参照支援システムでは、適切な指定語句を設定できないことがあり、任意の文書中の選択範囲に関連する情報を既存図書の文書データから精度よく検索できず、ユーザの目的にあった参照情報が獲得できない場合がある。
【0006】
本発明は、ある文書の選択範囲に対する参照情報を、他の複数の文書の中から精度よくかつ漏れなく検索することを支援する情報参照支援システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、本発明による情報参照支援システムは次のような特徴を備える。
【0008】
文書の中の選択範囲に関連する情報を、参照情報データベースに登録された参照情報の中から検索する情報参照支援システムにおいて、予め設定されたルールに従って、またはユーザの指定に従って、前記文書を1つまたは複数の条項に分割する条項設定手段と、予め定義された指定語句のうち、前記選択範囲内に記載されている語句を指定語句1と定義する指定語句1定義手段と、前記選択範囲の少なくとも一部を含む前記条項を検出する選択範囲条項判定手段と、前記文書に応じて決まる標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連が設定される標準項目別関連条項データベースと、前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、前記標準項目別関連条項データベースに設定されている前記標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と定義する指定語句2定義手段と、少なくとも前記指定語句1と前記指定語句2の何れか一方を検索条件に用いて、前記選択範囲に関連する情報を前記参照情報の中から検索する参照情報検索手段とを備える。
【0009】
さらに、前記条項の見出しを検出するための文書分割判定ルールを予め格納した条項見出し判定ルールデータベースを備え、前記条項設定手段は、前記文書分割判定ルールに従って、前記文書を1つまたは複数の条項に分割する。
【0010】
また、前記指定語句と前記指定語句に類似する語句とを対応させた指定語句データを予め格納した変換語句データベースを備え、前記指定語句1定義手段は、前記指定語句データに基づき、前記選択範囲内に記載されている語句とこの語句に類似する語句とを指定語句1と定義する。
【0011】
また、前記指定語句と前記指定語句を他言語に翻訳した語句とを対応させた指定語句変換データを予め格納した変換語句データベースを備え、前記指定語句1定義手段は、前記指定語句変換データに基づき、前記選択範囲内に記載されている語句とこの語句を他言語に翻訳した語句とを指定語句1と定義する。
【0012】
また、前記指定語句2定義手段は、前記標準項目別関連条項データベースに設定されている前記標準項目と前記条項との関連に基づき、前記条項がどの前記標準項目に関連するかを定義する。
【0013】
本発明による情報参照支援システムは次のような特徴を備えてもよい。
【0014】
検索対象である文書を記憶した文書データベースと、前記文書を条項に分割するための条項見出し文書分割判定ルールを記憶した条項見出し判定ルールデータベースと、前記文書を前記条項に分割する箇所の語句をユーザが指定するための条項指定入力装置と、前記文書分割判定ルールまたは前記条項指定入力装置により指定された前記語句を基に、前記文書を前記条項に分割する条項設定装置と、前記文書の中の任意の範囲をユーザが指定するための対象範囲指定入力装置と、予め設定した指定語句と前記指定語句の類似語と前記指定語句を他言語に翻訳した語句とを記憶した指定語句データベースと、前記指定語句のうち前記任意の範囲内に記載されている指定語句を抽出し、抽出した前記指定語句と前記類似語と前記翻訳した語句とのうち、少なくとも抽出した前記指定語句を指定語句1として設定する指定語句抽出変換装置と、前記任意の範囲の少なくとも一部を含む前記条項を検出する対象範囲条項判定装置と、前記文書に応じて決まる標準項目と前記条項との関連が設定される標準項目別関連条項データベースと、前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、前記標準項目別関連条項データベースに設定されている前記標準項目と前記任意の範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と設定する指定語句設定装置と、検索条件として、前記指定語句1と前記指定語句2との少なくとも一方をユーザが指定するための検索方法指定入力装置と、参照情報データベースに予め登録された参照情報の中から、前記検索条件に従い、前記任意の範囲に関連する情報を検索する参照情報検索装置と、前記任意の範囲に関連する情報の検索結果を表示する参照情報表示装置とを備える。
【発明の効果】
【0015】
本発明による情報参照支援システムによれば、ある文書中の選択範囲に出現する指定語句と選択範囲が含まれるパラグラフ(条項)の示す項目(文書の内容)についての指定語句とをもとに、選択範囲に関連する参照情報を、他の複数の文書の中から精度よくかつ漏れなく検索することが実現でき、既存情報を有効に活用することができる。
【図面の簡単な説明】
【0016】
【図1】本発明による情報参照支援システムの一実施形態の基本構成を示す図。
【図2】本発明による情報参照支援システムの処理手順の一例を示すフローチャート。
【図3】条項設定の処理手順の一例を示すフローチャート。
【図4(1)】文書・条項データベースのデータフォーマット例を示す図。
【図4(2)】文書・条項データベースのデータ例を示す図。
【図5(1)】指定語句(変換語句)データベースの指定語句データフォーマット例を示す図。
【図5(2)】指定語句(変換語句)データベースの指定語句データ例を示す図。
【図6(1)】指定語句(変換語句)データベースの指定語句変換データフォーマット例を示す図。
【図6(2)】指定語句(変換語句)データベースの指定語句変換データ例を示す図。
【図7】指定語句の検索と指定語句1の定義との処理手順の一例を示すフローチャート。
【図8(1)】標準項目別関連条項データベースのフォーマット例を示す図。
【図8(2)】標準項目別関連条項データベースのデータ例を示す図。
【図9(1)】標準項目別指定語句データベースのフォーマット例を示す図。
【図9(2)】標準項目別指定語句データベースのデータ例を示す図。
【図10】条項が関連する標準項目の検出と指定語句2の定義との処理手順の一例を示すフローチャート。
【図11】指定語句1と指定語句2を設定するときの参照情報表示装置の表示画面例を示す図。
【図12】参照情報の検索実行結果を表示するときの参照情報表示装置の表示画面例を示す図。
【発明を実施するための形態】
【0017】
任意の文書中の選択範囲に関連する情報を、既存の他の文書データから精度よくかつ漏れなく獲得するためには、選択範囲に出現する指定語句(予め設定された語句)を抽出して参照する内容を特定し検索するだけでなく、選択範囲が含まれるパラグラフの示す項目(文書の内容)を特定して、その項目(内容)についての語句を設定し、この語句を用いて検索することが必要である。
【0018】
例えば、契約文書に対し、文書の選択範囲についてのノウハウ情報や過去事例を参照する場合、選択範囲に含まれる予め設定された指定語句はもちろん、その選択範囲が契約文書の中の何の項目について記載されているのかも重要である。契約文書に記載されている標準的な項目であれば、予め各項目についての関連語句を登録しておくことができ、この関連語句を利用することにより、精度がよく、かつ漏れのない情報の絞込みができる。
【0019】
本発明による情報参照支援システムは、ある文書の任意の選択範囲に関連する参照情報を、既存の他の文書データから検索して提示する情報参照支援システムである。参照情報は、選択範囲から抽出する予め設定した指定語句1と、選択範囲の内容について予め設定した指定語句2という2種類の指定語句の組合せによって検索し、獲得する。
【0020】
「参照情報」は、既存の文書データであり、語句検索可能なデータを含む。例えば、契約文書に関するノウハウ情報、過去事例などについてのテキストデータである。
【0021】
本発明による情報参照支援システムは、文書を1つまたは複数個に、自動またはユーザによる手動で分割する。この分割された文を「条項」と称する。
【0022】
「標準項目」とは、文書の種類に応じて決まる、文書に記載されるべき標準的な項目(記述されている内容を示す項目)のことであり、予め定義されている。
【0023】
「指定語句」とは、参照情報の検索に用いられる1つまたは複数個の語句(キーワード)であり、予め定義されている。
【0024】
「指定語句1」とは、文書に関する1つまたは複数個の語句であり、予め設定された指定語句に基づき定義される。指定語句1が任意の選択範囲から抽出されたときには、この語句を他言語に翻訳した語句やこの語句に類似する語句も含めて指定語句1とする。
【0025】
「指定語句2」とは、任意の選択範囲が含まれる条項に関連する1つまたは複数個の標準項目についての1つまたは複数個の語句である。指定語句2も、予め設定された指定語句に基づき定義される。
【0026】
任意の選択範囲は、文書の中の指定した開始語句と指定した終了語句とによって定められる1つまたは複数の語句から構成される範囲である。この選択範囲は、ユーザにより指定される。なお、選択範囲は、複数の条項に渡って含まれてもよい。すなわち、1つの条項には、選択範囲の全てが含まれる場合もあり、選択範囲の一部だけが含まれる場合もある。以下では、選択範囲を対象範囲とも称する。
【0027】
参照情報を検索するときの検索条件には、少なくとも指定語句1と指定語句2の何れか一方を用いる。検索条件の一例として、次の4パターンがある。
1)指定語句1のうち少なくとも1つ、及び、指定語句2のうち少なくとも1つが、参照情報の中に含まれる(AND条件)。
2)指定語句1のうち少なくとも1つ、または、指定語句2のうち少なくとも1つが、参照情報の中に含まれる(OR条件)。
3)指定語句1のうち少なくとも1つだけが、参照情報の中に含まれる。
4)指定語句2のうち少なくとも1つだけが、参照情報の中に含まれる。
【0028】
本発明による情報参照支援システムは、この4パターンのうち1つのパターンを検索条件として参照情報を検索する。3)と4)のパターンは、対象範囲の中に指定語句1がないためや指定語句2が定義できなかったために、指定語句1や指定語句2が設定されていない場合にも用いることができる。
【0029】
以下に、図1から図12を用いて、本発明に係る情報参照支援システムの一実施形態について説明する。
【0030】
図1に、本発明による情報参照支援システムの一実施形態の基本構成を示す。本システムは、文書データベース(DB)101、条項見出し判定ルールデータベース102、条項指定入力装置103、条項設定装置104、対象範囲指定入力装置105、指定語句(変換語句)データベース106、指定語句抽出変換装置107、対象範囲条項判定装置108、標準項目別関連条項データベース109、標準項目別指定語句データベース110、指定語句設定装置111、検索方法指定入力装置112、参照情報データベース113、参照情報検索装置114、参照情報表示装置116、及び文書・条項データベース117によって構成されている。検索結果の参照情報(検索された参照情報)115は、参照情報表示装置116に表示される。
【0031】
指定語句(変換語句)データベース106には、文書に関する指定語句が予め設定されている。指定語句(変換語句)データベース106に格納されている指定語句に基づき、指定語句1が定義される。
【0032】
標準項目別関連条項データベース109には、文書に条項が設定されたときに、条項がどの標準項目に関連するか評価され、標準項目と条項との関連が設定される。この設定は、ユーザが手動で定義するか、または自動的に定義することができる。
【0033】
自動的に定義する場合は、各標準項目について予め定義した重要語句や関連語句の出現数が多い条項を、その標準項目の関連条項として定義する。例えば、ある標準項目の重要語句Iと関連語句Rを1個または複数個定義して、各条項pの評価スコアV(p)を次式で求める。
V(p)=nI(p)×Wi+nR(p)×Wr
nI(p):条項pに出現する重要語句Iの数
Wi:重要語句Iの評価の重み付け
nR(p):条項pに出現する関連語句Rの数
Wr:関連語句Rの評価の重み付け
この式により、全ての条項pについて評価スコアV(p)を算出し、条項pを評価スコアV(p)の値の大きい方から予め決められた数だけ抽出し、抽出した条項pをこの標準項目の関連条項として定義する。
【0034】
標準項目別指定語句データベース110には、標準項目ごとに参照情報を検索するための指定語句が予め設定されている。標準項目別指定語句データベース110に格納されている指定語句に基づき、指定語句2が定義される。
【0035】
参照情報データベース113には、参照情報が予め登録されている。
【0036】
条項指定入力装置103、対象範囲指定入力装置105、及び検索方法指定入力装置112は、マウスやキーボードなどの入力装置であり、ユーザにより条項、対象範囲、検索条件をそれぞれ指定するのに使用される。なお、条項指定入力装置103、対象範囲指定入力装置105、及び検索方法指定入力装置112は、共通の装置であってもよい。
【0037】
図2は、図1に示した情報参照支援システムにおける処理手順の一例を示すフローチャートである。
【0038】
開始(ステップ201)後、文書データベース101に格納されている文書データを読み込み、対象となる文書を選択する(ステップ202)。
【0039】
選択された文書は、1つまたは複数の条項に分割され、条項が設定される(ステップ203)。条項は、文書・条項データベース117に格納される。条項の設定は、自動または手動で行うことができる。
【0040】
自動で条項を設定する場合は、条項設定装置104が条項見出し判定ルールデータベース102に予め格納されている文書分割判定ルールに従って設定する。条項設定装置104の処理手順については、後述する。
【0041】
文書分割判定ルールは、条項見出し判定ルールデータベース102に予め格納されており、特定の語句(例えば、条項の見出し)により文章を分割するというルールである。例えば、文書の中から正規表現等で示された語句を検出し、この語句を検出した箇所(分割語句)から次に検出した箇所(分割語句)の前までを1つの条項とするというものである。
【0042】
手動で条項を設定する場合は、ユーザが条項指定入力装置103により分割箇所を指定して設定する。
【0043】
次に、ユーザが対象範囲指定入力装置105により文書の中の語句を選択して、参照情報を獲得するための対象範囲を指定する(ステップ204)。ユーザは、対象範囲の開始語句と終了語句とを選択して指定する。
【0044】
対象範囲が指定されると、指定語句抽出変換装置107は、対象範囲の中に、指定語句(変換語句)データベース106に設定されている指定語句があるかを検索する(ステップ205)。
【0045】
指定語句があれば、指定語句抽出変換装置107は、その指定語句を検索に用いる語句に変換して指定語句1を定義する(ステップ206)。例えば、文書の対象範囲が英文で記載されていると、対象範囲から検索された指定語句は英語の語句であるが、参照情報が日本文で記載されているような場合には、日本語に翻訳するなど適切な語句に変換する必要がある。また、指定語句に類似している語句も検索に用いる語句に含めて指定語句1とする。このように、指定語句抽出変換装置107は、翻訳後の語句や類似する語句も考慮して指定語句を変換し、指定語句1とする。ステップ206では、このような変換処理を行う。
【0046】
次に、対象範囲条項判定装置108は、対象範囲がどの条項に含まれているかを検出する(ステップ207)。対象範囲は、全てが1つの条項に含まれる場合もあり、複数の条項にわたって含まれる場合もある。
【0047】
対象範囲が含まれている条項が求められると、指定語句設定措置111は、標準項目別関連条項データベース109に設定されている標準項目と条項との関連から、対象範囲が含まれている条項が関連する標準項目を求める(ステップ208)。
【0048】
関連する標準項目が求まると、指定語句設定措置111は、標準項目別指定語句データベース110に設定されている指定語句に基づき、指定語句2を定義する(ステップ209)。
【0049】
さらに、指定語句1と指定語句2を使って、検索方法指定入力装置112により、ユーザが検索条件の設定をする(ステップ210)。
【0050】
この後、参照情報検索装置114は、参照情報データベース113から検索条件に合う参照情報を検索する(ステップ211)。
【0051】
検索結果の参照情報115は、検索結果として参照情報表示装置116によって表示される(ステップ212)。
【0052】
以上で、一連の処理手順が終了する(ステップ213)。
【0053】
図3は、図1に示した条項設定装置104が行う条項設定(図2のステップ203)の処理手順の一例を示すフローチャートである。条項は、予め文書分割判定ルールに設定されている見出し(条項の見出し)の語句に基づいて文書を分割して設定する。すなわち、条項は、文書を条項の見出しで区切ったものである。図3のフローチャートにおいて、iは語句のカウンタ(番号)を、pは条項のカウンタ(番号)を、Fpは条項に関するフラグを表す。また、条項pの見出しの最初の語句をS(p)に、条項pの見出しの最後の語句をE(p)に、条項pの最終語句をF(p)に、それぞれ登録する。
【0054】
開始(ステップ301)後、対象となる文書を読み込む(ステップ302)。このとき、初期値としてi=0、p=1、Fp=offである。
【0055】
読み込んだ文書から、区切り文字等で語句の区切りを判定して、語句を抽出する(ステップ303)。
【0056】
このとき、文章の最後まで到達したか判定し、最後まで到達していない場合はステップ306へ進む(ステップ304)。
【0057】
抽出した各語句は、カウンタ(番号)iを1つ増分させて(i=i+1)割り当てて、語句No.(i)として登録する(ステップ306)。
【0058】
次に、抽出した語句iが、条項の見出しの一部であるか否か、文書分割判定ルールに従って判定する。文書分割判定ルールによって、語句iが1つまたは複数の語句からなる条項pの見出しの最初の語句であるかどうか判定する(ステップ308)。
【0059】
語句iが条項pの見出しの最初の語句であれば、S(p)=iとし、条項pの見出しの開始語句No.(S(p))を登録して、Fp=onとし、ステップ303に戻る(ステップ310)。このとき、1つ前の条項p−1の最終語句No.(F(p−1))が開始語句No.(S(p)−1)であるとわかるので、F(p−1)=i−1とする(ステップ313)。
【0060】
ステップ308において、語句iが条項pの見出しの最初の語句でない場合は、語句iが条項pの見出しの最後の語句であるかどうか判定する(ステップ311)。
【0061】
語句iが条項pの見出しの最後の語句であれば、E(p)=iとし、条項pの見出しの終了語句No.(E(p))を登録して、Fp=off、p=p+1とし、ステップ303に戻る(ステップ312)。このとき、条項pの見出しがわかるので、この見出しと条項No.(p)を登録する(ステップ309)。
【0062】
ステップ311において、語句iが条項pの見出しの最後の語句でない場合は、語句iは条項pの見出しの最初と最後の間の語句であり、ステップ303に戻る。
【0063】
ステップ303〜ステップ312の処理を文書の最後まで繰り返す。文書の最後に到達したら(ステップ304)、上述のステップ313の処理を行って、条項設定の処理を終了する(ステップ305)。
【0064】
条項の見出しによる文書の分割は、上述した文書分割判定ルールに従って実行するほか、ユーザが条項指定入力装置103を用いて、分割する箇所の語句を指定することにより、実行することもできる。ユーザは、分割する箇所の語句の指定により、見出しを追加、削除することができる。何れの場合も、この条項の単位で文書を分割することにより、文書の範囲指定、評価、参照情報を検索するための指定語句2の設定を可能にする。
【0065】
図4(1)と図4(2)は、図1に示した文書・条項データベース117のデータフォーマット例とデータ例を示す。
【0066】
図4(1)に示すように、条項データフォーマット410は、条項No.411、条項の開始語句No.412、見出しの終了語句No.413、条項の見出し414、及び条項の終了語句No.415からなる。条項の最初の語句は見出しの最初の語句であるので、条項の開始語句No.412は、見出しの開始語句No.でもある
p番目の条項に対し、条項No.411、条項の開始語句No.412、見出しの終了語句No.413、及び条項の終了語句No.415には、条項No.(p)、条項No.(p)の見出しの開始語句S(p)、見出しの終了語句E(p)、及び条項の終了語句S(p+1)−1がそれぞれ登録される。条項の見出し414には、p番目の条項の見出しが登録される。
【0067】
例えば、図4(2)に示した条項データ例420では、1番目の条項に対し、条項No.411は「1」、条項の開始語句No.412は「3」、見出しの終了語句No413は「3」、条項の見出し414は「Performance」、条項の終了語句No.415は「11」となる。
【0068】
同様に、2番目の条項に対し、条項No.411は「2」、条項の開始語句No.412は「12」、見出しの終了語句No413は「12」、条項の見出し414は「Warrenty」、条項の終了語句No.415は「62」となる。3番目と4番目の条項に対しても同様に、条項No.411が「3」に対する条項の見出し414は「Inspection」であり、条項No.411が「4」に対する条項の見出し414は「Intellectual Property」であることを示す。
【0069】
ここで、図1に示した指定語句(変換語句)データベース106について説明する。指定語句(変換語句)データベース106は、指定語句データと指定語句変換データとが登録されている。
【0070】
まず、指定語句データについて説明する。図5(1)と図5(2)は、指定語句(変換語句)データベース106の指定語句データフォーマット例と指定語句データ例を示す。
【0071】
図5(1)に示すように、指定語句データフォーマット510は、指定語句No.511、指定語句512、同義語・類似語513、及び関連語514からなる。同義語・類似語513は、指定語句512に対する同義語や類似語であり、関連語514は、指定語句512に関連する語である。すなわち、同義語・類似語513と関連語514は、指定語句512に類似する語句である。
【0072】
具体的には、例えば図5(2)に示した指定語句データ例520では、指定語句No.511が「1」の指定語句512の「cost」に対して、同義語・類似語513として「expense」、関連語514として「pay,price」が登録されている。このような指定語句データベースは、予め作成しておき、その中から各語句を選択できるようにしておくが、語句の追加、削除、変更も可能とする。
【0073】
次に、指定語句変換データについて説明する。図6(1)と図6(2)は、指定語句(変換語句)データベース106の指定語句変換データフォーマット例と指定語句変換データ例を示す。
【0074】
図6(1)に示すように、指定語句変換データフォーマット610は、指定語句No.611、指定語句612、及び変換語句613からなる。変換語句613は、指定語句612を他言語に翻訳した語句である。
【0075】
具体的には、例えば図6(2)に示した指定語句変換データ例620では、指定語句No.611が「1」の指定語句612の「cost」に対して、変換語句613として「値段、原価、費用」が登録されている。
【0076】
指定語句抽出変換装置107は、このようなデータが予め登録されている指定語句(変換語句)データベース106を用いることにより、他言語に翻訳した語句や類似する語句も考慮して指定語句を変換し、指定語句1とする。
【0077】
図7は、図1に示した指定語句抽出変換装置107が行う、指定語句の検索(図2のステップ205)と指定語句1の定義(図2のステップ206)の処理手順の一例を示すフローチャートである。図7のフローチャートにおいて、iは語句のカウンタ(番号)を、jは指定語句のカウンタ(番号)を表す。iとjの初期値は0である。
【0078】
開始(ステップ701)後、対象範囲の開始語句No.と終了語句No.を設定する(ステップ702)。対象範囲の先頭の語句が開始語句で、最後の語句が終了語句であり、それぞれの語句No.を設定する。ここでは、開始語句の語句No.はs、終了語句の語句No.はeであるとする。
【0079】
指定語句のカウンタ(番号)jを1つ増分させ(ステップ710)、指定語句ajを指定語句(変換語句)データベース106の中の指定語句から1つ選んで設定する(ステップ703)。
【0080】
次に、対象範囲内にある語句No.(s+i)の語句w(s+i)を対象語句とする(ステップ704)。語句のカウンタ(番号)iを1つ増分させ(ステップ705)、対象語句w(s+i)が指定語句ajと等しいかを判定する(ステップ706)。
【0081】
次に、対象語句w(s+i)が指定語句ajであれば、指定語句(変換語句)データベース106の中の指定語句に対応する変換語句を指定語句1として登録する(ステップ707)。すなわち、対象語句w(s+i)が指定語句(変換語句)データベース106に含まれる指定語句ajの何れかと等しければ、その指定語句に対応する変換語句を指定語句1とする(図6(1)の指定語句612に対応する変換語句613を指定語句1とする)。
【0082】
ステップ704からステップ707までの処理を、対象範囲の最後まで(s+i>eとなるまで)繰り返す(ステップ708)。
【0083】
そして、全ての指定語句について、対象範囲内にある語句と一致するかの判定を繰り返す(ステップ711)。すなわち、j>n1となるまでステップ710からステップ708までの処理を繰り返す。
【0084】
ステップ708とステップ711での繰り返しにより、ステップ704〜ステップ706では、対象範囲内にある語句(語句No.=sの語句w(s)から語句No.=eの語句w(e)まで)について1語ずつ、指定語句(変換語句)データベース106に含まれるか判定することになる。すなわち、対象語句w(s+i)(iは0からe−sまで)を1語ずつ選択し(ステップ704)、指定語句(変換語句)データベース106の全ての指定語句a1、a2、・・・aj、・・・n1(図6(1)参照)の中に、ステップ704で選択した対象語句w(s+i)と同じ語句があるか否かを判定する(ステップ706)。
【0085】
全ての指定語句に対して対象範囲内にある語句と一致するかの判定をしたら、指定語句の検索と指定語句1の定義の処理を終了する(ステップ709)。
【0086】
例えば、対象範囲の中に、図5(2)に示した指定語句データ例520の指定語句512に登録されている「cost」と「delay」があった場合は、図6(2)に示した指定語句変換データ例620の指定語句612の「cost」と「delay」に対する変換語句613「値段、原価、費用、遅延、猶予」を指定語句1とする。
【0087】
上記の方法は、文書が英文の契約文書であり、参照情報であるノウハウ情報が日本文で構築されているような場合に、指定語句(変換語句)データベース106によって、英語の指定語句が日本語の指定語句1に翻訳されて変換される例である。変換方法には、このように他言語への変換のほか、語句の意味の拡張や語句の意味の限定などを実施する方法もある。なお、他言語への変換の場合、上記の例では英語から日本語への変換を示したが、変換前後の言語の種類は、英語や日本語に限られるものではない。
【0088】
図8(1)と図8(2)は、図1に示した標準項目別関連条項データベース109のフォーマット例とデータ例を示す。標準項目別関連条項データベース109は、標準項目と条項との関連が設定されるデータベースである。
【0089】
図8(1)に示すように、標準項目別関連条項データフォーマット810は、項目No.811、標準項目812、及び関連条項813からなる。関連条項813は、標準項目812に関連する文書内の条項である。
【0090】
具体的には、例えば図8(2)に示した標準項目別関連条項データ例820では、項目No.811が「1」の標準項目812が「受注範囲」のとき、この標準項目に関連する文書内の条項は「1.DEFINITIONS」であることを示す。同様に、標準項目が「支払条件」のとき、関連条項は「4.PAYMENT」であり、標準項目が「性能保証」のとき、関連条項は「11.PERFORMANCE」であり、標準項目が「検査・試験」のとき、関連条項は「7.INSPECTION」であることを示す。
【0091】
上記の標準項目は、文書に記載されるべき標準的な項目であり、文書の種類によって予め決められている。例えば、契約文書であれば、「契約範囲」「支払」「保証」「保険」「検査」「引渡」などである。これに対し、上記の関連条項は、対象となる文書が入力されて条項が設定された後、この条項をもとに決定される。
【0092】
図9(1)と図9(2)は、図1に示した標準項目別指定語句データベース110のフォーマット例とデータ例を示す。標準項目別指定語句データベース110は、標準項目と指定語句との関連が予め設定されているデータベースである。
【0093】
図9(1)に示すように、標準項目別指定語句データフォーマット910は、項目No.911、標準項目912、及び指定語句913からなる。指定語句913は、標準項目912に関連する指定語句である。
【0094】
具体的には、例えば図9(2)に示した標準項目別指定語句データ例920では、項目No.911が「1」の標準項目912が「受注範囲」のとき、この標準項目に関連する指定語句913は「受注、責任」であることを示す、同様に、標準項目が「支払条件」のとき、指定語句は「支払、通貨、税金、為替」であり、標準項目が「性能保証」のとき、指定語句は「性能、検収、合格」であり、標準項目が「検査・試験」のとき、指定語句は「立会い、見做し、法定」であることを示す。
【0095】
図10は、図1に示した指定語句設定装置111が行う、条項が関連する標準項目の検出(図2のステップ208)と指定語句2の定義(図2のステップ209)の処理手順の一例を示すフローチャートである。図10のフローチャートにおいて、Iは標準項目のカウンタ(番号)を表し、初期値はI=0である。
【0096】
開始(ステップ1001)後、対象とする条項(対象条項)を設定する(ステップ1003)。対象条項は、対象範囲指定入力装置105によって指定した対象範囲がどの条項に含まれるかを、対象範囲の最初の語句No.と最後の語句No.と、文書・条項データベース117に定義された各条項の開始語句No.と終了語句No.とから判定して、設定する。図4(1)に示したように、条項データフォーマット410には、各条項の開始語句No.412と終了語句No.415が定義されている。
【0097】
次に、対象条項が標準項目の関連条項であるかを、標準項目別関連条項データベース109に定義された任意の標準項目、及びその標準項目についての関連条項から判定し、対象条項を関連条項とする標準項目、すなわち対象条項と関連する標準項目を設定する。
【0098】
まず、標準項目のカウンタ(番号)Iを1つ増分させ(ステップ1004)、I番目の標準項目No.(I)を選択する(ステップ1005)。標準項目No.(I)の関連条項に対象条項が定義されているかを、標準項目別関連条項データベース109を参照して判定する(ステップ1006)。ステップ1004〜ステップ1006までの処理を、全ての標準項目について行う。
【0099】
図8(1)に示したように、標準項目別関連条項データフォーマット810には、各標準項目812の関連条項813が定義されている。
【0100】
ステップ1006において、対象条項が標準項目No.(I)の関連条項であれば、その対象条項に標準項目No.(I)を設定し、標準項目別指定語句データベース110に定義された標準項目No.(I)、及び標準項目No.(I)についての指定語句を指定語句2として登録する(ステップ1007)。すなわち、対象条項が標準項目No.(I)の関連条項であれば、標準項目別指定語句データベース110を参照し、標準項目No.(I)に対応する指定語句を指定語句2として登録する。
【0101】
図9(1)に示したように、標準項目別指定語句データフォーマット910には、各標準項目912に対する指定語句913が定義されている。
【0102】
ステップ1004からステップ1007までの処理を、全ての標準項目に対して(I>Tとなるまで。Tは標準項目の数)繰り返し(ステップ1008)、終了する(ステップ1009)。
【0103】
図11と図12を用いて、参照情報表示装置116の表示画面例を示す。
【0104】
図11は、指定語句1と指定語句2を設定するときの参照情報表示装置116の表示画面例を示す。上述したように、指定語句1は、対象範囲の中の指定語句をもとに設定され、指定語句2は、対照範囲を含む条項が関連する標準項目をもとに設定される。
【0105】
参照情報表示装置116は、文書本文表示画面1110を表示する。文書本文表示画面1110には、条項ごとに分割された本文1111、1112、対象範囲1113、及び参照情報検索ボタン1114が表示される。本文1111は条項1に対応し、本文1112は条項2に対応する。
【0106】
文書本文表示画面1110において、ユーザが対象範囲指定入力装置105(図1参照)を介して、本文1111、1112から対象範囲1113を選択し、参照情報検索ボタン1114を選択すると、情報参照支援システムは、参照情報表示装置116に検索条件の入力及び指定語句設定画面1120を表示する。
【0107】
検索条件の入力及び指定語句設定画面1120には、対象範囲1121、指定語句1122、指定語句(1)1123、条項1124、関連標準項目1125、指定語句(2)1126、実行ボタン1127、及び検索条件1128が表示される。
【0108】
指定語句1122は、対象範囲1121にある指定語句を判定した結果であり、図11の例では、「pay、cost、delay」である。指定語句(1)1123は、指定語句1122を日本語に変換した結果の語句であり、図11の例では、「値段、原価、・・・、遅延、猶予」である。条項1124は、対象範囲1121の含まれる対象条項であり、図11の例では、「4.Payment」である。関連標準項目1125は、条項1124を関連条項とする標準項目であり、図11の例では、「2.支払条件」である。指定語句(2)1126は、関連標準項目1125の指定語句2であり、図11の例では、「支払、通過、・・・」である。
【0109】
検索条件1128は、前述したように、指定語句(1)1123と指定語句(2)1126とを用いる4パターンの中から1つを選択できる。「AND」はAND条件を、「OR」はOR条件を、「指定語句1」は指定語句1のうち少なくとも1つだけを、「指定語句2」は指定語句2のうち少なくとも1つだけを、それぞれ検索条件に用いる。図11の例では、AND条件が選択されており、「指定語句1のうち少なくとも1つ、及び、指定語句2のうち少なくとも1つが、参照情報の中に含まれる」ことを検索条件としている。
【0110】
検索条件の入力及び指定語句設定画面1120において、ユーザが対象範囲指定入力装置105(図1参照)を介して、実行ボタン1127を選択すると、指定語句(1)1123と指定語句(2)1126と検索条件1128をもとに、参照情報を検索する
図12は、参照情報の検索を実行した結果を表示するときの参照情報表示装置116の表示画面例を示す。参照情報一覧表表示画面1210は、検索結果として獲得した参照情報の一覧表を表示する画面であり、検索条件1211、参照情報一覧表1212、及び内容表示ボタン1214が表示される。検索条件1211は、図11の検索条件の入力及び指定語句設定画面1120で設定した検索条件1128が表示される。
【0111】
ユーザが検索方法指定入力装置112(図1参照)を介して、参照情報一覧表1212の中から1つの参照情報を選択1213し、内容表示ボタン1214を選択すると、情報参照支援システムは、指定参照情報表示画面1220を表示する。
【0112】
指定参照情報表示画面1220は、参照情報一覧表1212の中から指定された1つの参照情報を表示する画面である。指定された参照情報の内容が、参照情報名(参照情報のタイトル1221)とともに表示される。
【符号の説明】
【0113】
101…文書データベース、102…条項見出し判定ルールデータベース、103…条項指定入力装置、104…条項設定装置、105…対象範囲指定入力装置、106…指定語句(変換語句)データベース、107…指定語句抽出変換装置、108…対象範囲条項判定装置、109…標準項目別関連条項データベース、110…標準項目別指定語句データベース、111…指定語句設定装置、112…検索方法指定入力装置、113…参照情報データベース、114…参照情報検索装置、115…検索結果の参照情報、116…参照情報表示装置、117…文書・条項データベース、1110…文書本文表示画面、1111,1112…本文、1113,1121…対象範囲、1114…参照情報検索ボタン、1120…検索条件の入力及び指定語句設定画面、1122…指定語句、1123…指定語句1、1124…条項、1125…標準項目、1126…指定語句2、1127…実行ボタン、1128…検索条件、1210…参照情報一覧表表示画面、1211…検索条件、1212…参照情報一覧表、1213…参照情報の選択、1214…内容表示ボタン、1220…指定参照情報表示画面、1221…タイトル。
【技術分野】
【0001】
本発明は、文書中の選択範囲に関連する情報を参照するのを支援する情報参照支援システムに関する。より詳細には、文書中の選択範囲をもとに検索語句を設定して、他の大量の文書の中から参照する情報を獲得することを支援する情報参照支援システムに関する。
【背景技術】
【0002】
従来、契約文書等の内容の一部について、ノウハウ情報や事例集などの既存図書から関連する情報を参照する場合は、既存図書の文書データの中から関連するファイルや関連する見出し等で範囲を指定して、経験と裁量をもとに語句検索等を実行して情報を抽出していた。
【0003】
大量の文書の中から、ユーザが重要であると考えかつ内容を特定した文を抽出する方法として、特許文献1に示す重要文抽出方法がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−146397号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に示すような重要文抽出方法では、内容を特定するための指定語句(例えば、部品についての文を抽出する場合には「部品名」)と、ユーザが重要であると考え、検索対象である既存図書における記述箇所を特定するための指定語句(例えば、故障について記述されている箇所を特定する場合には、「原因」や「対策」)とを設定して、検索結果の絞込みを実現している。しかしながら、このような重要文抽出方法を使用する情報参照支援システムでは、適切な指定語句を設定できないことがあり、任意の文書中の選択範囲に関連する情報を既存図書の文書データから精度よく検索できず、ユーザの目的にあった参照情報が獲得できない場合がある。
【0006】
本発明は、ある文書の選択範囲に対する参照情報を、他の複数の文書の中から精度よくかつ漏れなく検索することを支援する情報参照支援システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、本発明による情報参照支援システムは次のような特徴を備える。
【0008】
文書の中の選択範囲に関連する情報を、参照情報データベースに登録された参照情報の中から検索する情報参照支援システムにおいて、予め設定されたルールに従って、またはユーザの指定に従って、前記文書を1つまたは複数の条項に分割する条項設定手段と、予め定義された指定語句のうち、前記選択範囲内に記載されている語句を指定語句1と定義する指定語句1定義手段と、前記選択範囲の少なくとも一部を含む前記条項を検出する選択範囲条項判定手段と、前記文書に応じて決まる標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連が設定される標準項目別関連条項データベースと、前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、前記標準項目別関連条項データベースに設定されている前記標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と定義する指定語句2定義手段と、少なくとも前記指定語句1と前記指定語句2の何れか一方を検索条件に用いて、前記選択範囲に関連する情報を前記参照情報の中から検索する参照情報検索手段とを備える。
【0009】
さらに、前記条項の見出しを検出するための文書分割判定ルールを予め格納した条項見出し判定ルールデータベースを備え、前記条項設定手段は、前記文書分割判定ルールに従って、前記文書を1つまたは複数の条項に分割する。
【0010】
また、前記指定語句と前記指定語句に類似する語句とを対応させた指定語句データを予め格納した変換語句データベースを備え、前記指定語句1定義手段は、前記指定語句データに基づき、前記選択範囲内に記載されている語句とこの語句に類似する語句とを指定語句1と定義する。
【0011】
また、前記指定語句と前記指定語句を他言語に翻訳した語句とを対応させた指定語句変換データを予め格納した変換語句データベースを備え、前記指定語句1定義手段は、前記指定語句変換データに基づき、前記選択範囲内に記載されている語句とこの語句を他言語に翻訳した語句とを指定語句1と定義する。
【0012】
また、前記指定語句2定義手段は、前記標準項目別関連条項データベースに設定されている前記標準項目と前記条項との関連に基づき、前記条項がどの前記標準項目に関連するかを定義する。
【0013】
本発明による情報参照支援システムは次のような特徴を備えてもよい。
【0014】
検索対象である文書を記憶した文書データベースと、前記文書を条項に分割するための条項見出し文書分割判定ルールを記憶した条項見出し判定ルールデータベースと、前記文書を前記条項に分割する箇所の語句をユーザが指定するための条項指定入力装置と、前記文書分割判定ルールまたは前記条項指定入力装置により指定された前記語句を基に、前記文書を前記条項に分割する条項設定装置と、前記文書の中の任意の範囲をユーザが指定するための対象範囲指定入力装置と、予め設定した指定語句と前記指定語句の類似語と前記指定語句を他言語に翻訳した語句とを記憶した指定語句データベースと、前記指定語句のうち前記任意の範囲内に記載されている指定語句を抽出し、抽出した前記指定語句と前記類似語と前記翻訳した語句とのうち、少なくとも抽出した前記指定語句を指定語句1として設定する指定語句抽出変換装置と、前記任意の範囲の少なくとも一部を含む前記条項を検出する対象範囲条項判定装置と、前記文書に応じて決まる標準項目と前記条項との関連が設定される標準項目別関連条項データベースと、前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、前記標準項目別関連条項データベースに設定されている前記標準項目と前記任意の範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と設定する指定語句設定装置と、検索条件として、前記指定語句1と前記指定語句2との少なくとも一方をユーザが指定するための検索方法指定入力装置と、参照情報データベースに予め登録された参照情報の中から、前記検索条件に従い、前記任意の範囲に関連する情報を検索する参照情報検索装置と、前記任意の範囲に関連する情報の検索結果を表示する参照情報表示装置とを備える。
【発明の効果】
【0015】
本発明による情報参照支援システムによれば、ある文書中の選択範囲に出現する指定語句と選択範囲が含まれるパラグラフ(条項)の示す項目(文書の内容)についての指定語句とをもとに、選択範囲に関連する参照情報を、他の複数の文書の中から精度よくかつ漏れなく検索することが実現でき、既存情報を有効に活用することができる。
【図面の簡単な説明】
【0016】
【図1】本発明による情報参照支援システムの一実施形態の基本構成を示す図。
【図2】本発明による情報参照支援システムの処理手順の一例を示すフローチャート。
【図3】条項設定の処理手順の一例を示すフローチャート。
【図4(1)】文書・条項データベースのデータフォーマット例を示す図。
【図4(2)】文書・条項データベースのデータ例を示す図。
【図5(1)】指定語句(変換語句)データベースの指定語句データフォーマット例を示す図。
【図5(2)】指定語句(変換語句)データベースの指定語句データ例を示す図。
【図6(1)】指定語句(変換語句)データベースの指定語句変換データフォーマット例を示す図。
【図6(2)】指定語句(変換語句)データベースの指定語句変換データ例を示す図。
【図7】指定語句の検索と指定語句1の定義との処理手順の一例を示すフローチャート。
【図8(1)】標準項目別関連条項データベースのフォーマット例を示す図。
【図8(2)】標準項目別関連条項データベースのデータ例を示す図。
【図9(1)】標準項目別指定語句データベースのフォーマット例を示す図。
【図9(2)】標準項目別指定語句データベースのデータ例を示す図。
【図10】条項が関連する標準項目の検出と指定語句2の定義との処理手順の一例を示すフローチャート。
【図11】指定語句1と指定語句2を設定するときの参照情報表示装置の表示画面例を示す図。
【図12】参照情報の検索実行結果を表示するときの参照情報表示装置の表示画面例を示す図。
【発明を実施するための形態】
【0017】
任意の文書中の選択範囲に関連する情報を、既存の他の文書データから精度よくかつ漏れなく獲得するためには、選択範囲に出現する指定語句(予め設定された語句)を抽出して参照する内容を特定し検索するだけでなく、選択範囲が含まれるパラグラフの示す項目(文書の内容)を特定して、その項目(内容)についての語句を設定し、この語句を用いて検索することが必要である。
【0018】
例えば、契約文書に対し、文書の選択範囲についてのノウハウ情報や過去事例を参照する場合、選択範囲に含まれる予め設定された指定語句はもちろん、その選択範囲が契約文書の中の何の項目について記載されているのかも重要である。契約文書に記載されている標準的な項目であれば、予め各項目についての関連語句を登録しておくことができ、この関連語句を利用することにより、精度がよく、かつ漏れのない情報の絞込みができる。
【0019】
本発明による情報参照支援システムは、ある文書の任意の選択範囲に関連する参照情報を、既存の他の文書データから検索して提示する情報参照支援システムである。参照情報は、選択範囲から抽出する予め設定した指定語句1と、選択範囲の内容について予め設定した指定語句2という2種類の指定語句の組合せによって検索し、獲得する。
【0020】
「参照情報」は、既存の文書データであり、語句検索可能なデータを含む。例えば、契約文書に関するノウハウ情報、過去事例などについてのテキストデータである。
【0021】
本発明による情報参照支援システムは、文書を1つまたは複数個に、自動またはユーザによる手動で分割する。この分割された文を「条項」と称する。
【0022】
「標準項目」とは、文書の種類に応じて決まる、文書に記載されるべき標準的な項目(記述されている内容を示す項目)のことであり、予め定義されている。
【0023】
「指定語句」とは、参照情報の検索に用いられる1つまたは複数個の語句(キーワード)であり、予め定義されている。
【0024】
「指定語句1」とは、文書に関する1つまたは複数個の語句であり、予め設定された指定語句に基づき定義される。指定語句1が任意の選択範囲から抽出されたときには、この語句を他言語に翻訳した語句やこの語句に類似する語句も含めて指定語句1とする。
【0025】
「指定語句2」とは、任意の選択範囲が含まれる条項に関連する1つまたは複数個の標準項目についての1つまたは複数個の語句である。指定語句2も、予め設定された指定語句に基づき定義される。
【0026】
任意の選択範囲は、文書の中の指定した開始語句と指定した終了語句とによって定められる1つまたは複数の語句から構成される範囲である。この選択範囲は、ユーザにより指定される。なお、選択範囲は、複数の条項に渡って含まれてもよい。すなわち、1つの条項には、選択範囲の全てが含まれる場合もあり、選択範囲の一部だけが含まれる場合もある。以下では、選択範囲を対象範囲とも称する。
【0027】
参照情報を検索するときの検索条件には、少なくとも指定語句1と指定語句2の何れか一方を用いる。検索条件の一例として、次の4パターンがある。
1)指定語句1のうち少なくとも1つ、及び、指定語句2のうち少なくとも1つが、参照情報の中に含まれる(AND条件)。
2)指定語句1のうち少なくとも1つ、または、指定語句2のうち少なくとも1つが、参照情報の中に含まれる(OR条件)。
3)指定語句1のうち少なくとも1つだけが、参照情報の中に含まれる。
4)指定語句2のうち少なくとも1つだけが、参照情報の中に含まれる。
【0028】
本発明による情報参照支援システムは、この4パターンのうち1つのパターンを検索条件として参照情報を検索する。3)と4)のパターンは、対象範囲の中に指定語句1がないためや指定語句2が定義できなかったために、指定語句1や指定語句2が設定されていない場合にも用いることができる。
【0029】
以下に、図1から図12を用いて、本発明に係る情報参照支援システムの一実施形態について説明する。
【0030】
図1に、本発明による情報参照支援システムの一実施形態の基本構成を示す。本システムは、文書データベース(DB)101、条項見出し判定ルールデータベース102、条項指定入力装置103、条項設定装置104、対象範囲指定入力装置105、指定語句(変換語句)データベース106、指定語句抽出変換装置107、対象範囲条項判定装置108、標準項目別関連条項データベース109、標準項目別指定語句データベース110、指定語句設定装置111、検索方法指定入力装置112、参照情報データベース113、参照情報検索装置114、参照情報表示装置116、及び文書・条項データベース117によって構成されている。検索結果の参照情報(検索された参照情報)115は、参照情報表示装置116に表示される。
【0031】
指定語句(変換語句)データベース106には、文書に関する指定語句が予め設定されている。指定語句(変換語句)データベース106に格納されている指定語句に基づき、指定語句1が定義される。
【0032】
標準項目別関連条項データベース109には、文書に条項が設定されたときに、条項がどの標準項目に関連するか評価され、標準項目と条項との関連が設定される。この設定は、ユーザが手動で定義するか、または自動的に定義することができる。
【0033】
自動的に定義する場合は、各標準項目について予め定義した重要語句や関連語句の出現数が多い条項を、その標準項目の関連条項として定義する。例えば、ある標準項目の重要語句Iと関連語句Rを1個または複数個定義して、各条項pの評価スコアV(p)を次式で求める。
V(p)=nI(p)×Wi+nR(p)×Wr
nI(p):条項pに出現する重要語句Iの数
Wi:重要語句Iの評価の重み付け
nR(p):条項pに出現する関連語句Rの数
Wr:関連語句Rの評価の重み付け
この式により、全ての条項pについて評価スコアV(p)を算出し、条項pを評価スコアV(p)の値の大きい方から予め決められた数だけ抽出し、抽出した条項pをこの標準項目の関連条項として定義する。
【0034】
標準項目別指定語句データベース110には、標準項目ごとに参照情報を検索するための指定語句が予め設定されている。標準項目別指定語句データベース110に格納されている指定語句に基づき、指定語句2が定義される。
【0035】
参照情報データベース113には、参照情報が予め登録されている。
【0036】
条項指定入力装置103、対象範囲指定入力装置105、及び検索方法指定入力装置112は、マウスやキーボードなどの入力装置であり、ユーザにより条項、対象範囲、検索条件をそれぞれ指定するのに使用される。なお、条項指定入力装置103、対象範囲指定入力装置105、及び検索方法指定入力装置112は、共通の装置であってもよい。
【0037】
図2は、図1に示した情報参照支援システムにおける処理手順の一例を示すフローチャートである。
【0038】
開始(ステップ201)後、文書データベース101に格納されている文書データを読み込み、対象となる文書を選択する(ステップ202)。
【0039】
選択された文書は、1つまたは複数の条項に分割され、条項が設定される(ステップ203)。条項は、文書・条項データベース117に格納される。条項の設定は、自動または手動で行うことができる。
【0040】
自動で条項を設定する場合は、条項設定装置104が条項見出し判定ルールデータベース102に予め格納されている文書分割判定ルールに従って設定する。条項設定装置104の処理手順については、後述する。
【0041】
文書分割判定ルールは、条項見出し判定ルールデータベース102に予め格納されており、特定の語句(例えば、条項の見出し)により文章を分割するというルールである。例えば、文書の中から正規表現等で示された語句を検出し、この語句を検出した箇所(分割語句)から次に検出した箇所(分割語句)の前までを1つの条項とするというものである。
【0042】
手動で条項を設定する場合は、ユーザが条項指定入力装置103により分割箇所を指定して設定する。
【0043】
次に、ユーザが対象範囲指定入力装置105により文書の中の語句を選択して、参照情報を獲得するための対象範囲を指定する(ステップ204)。ユーザは、対象範囲の開始語句と終了語句とを選択して指定する。
【0044】
対象範囲が指定されると、指定語句抽出変換装置107は、対象範囲の中に、指定語句(変換語句)データベース106に設定されている指定語句があるかを検索する(ステップ205)。
【0045】
指定語句があれば、指定語句抽出変換装置107は、その指定語句を検索に用いる語句に変換して指定語句1を定義する(ステップ206)。例えば、文書の対象範囲が英文で記載されていると、対象範囲から検索された指定語句は英語の語句であるが、参照情報が日本文で記載されているような場合には、日本語に翻訳するなど適切な語句に変換する必要がある。また、指定語句に類似している語句も検索に用いる語句に含めて指定語句1とする。このように、指定語句抽出変換装置107は、翻訳後の語句や類似する語句も考慮して指定語句を変換し、指定語句1とする。ステップ206では、このような変換処理を行う。
【0046】
次に、対象範囲条項判定装置108は、対象範囲がどの条項に含まれているかを検出する(ステップ207)。対象範囲は、全てが1つの条項に含まれる場合もあり、複数の条項にわたって含まれる場合もある。
【0047】
対象範囲が含まれている条項が求められると、指定語句設定措置111は、標準項目別関連条項データベース109に設定されている標準項目と条項との関連から、対象範囲が含まれている条項が関連する標準項目を求める(ステップ208)。
【0048】
関連する標準項目が求まると、指定語句設定措置111は、標準項目別指定語句データベース110に設定されている指定語句に基づき、指定語句2を定義する(ステップ209)。
【0049】
さらに、指定語句1と指定語句2を使って、検索方法指定入力装置112により、ユーザが検索条件の設定をする(ステップ210)。
【0050】
この後、参照情報検索装置114は、参照情報データベース113から検索条件に合う参照情報を検索する(ステップ211)。
【0051】
検索結果の参照情報115は、検索結果として参照情報表示装置116によって表示される(ステップ212)。
【0052】
以上で、一連の処理手順が終了する(ステップ213)。
【0053】
図3は、図1に示した条項設定装置104が行う条項設定(図2のステップ203)の処理手順の一例を示すフローチャートである。条項は、予め文書分割判定ルールに設定されている見出し(条項の見出し)の語句に基づいて文書を分割して設定する。すなわち、条項は、文書を条項の見出しで区切ったものである。図3のフローチャートにおいて、iは語句のカウンタ(番号)を、pは条項のカウンタ(番号)を、Fpは条項に関するフラグを表す。また、条項pの見出しの最初の語句をS(p)に、条項pの見出しの最後の語句をE(p)に、条項pの最終語句をF(p)に、それぞれ登録する。
【0054】
開始(ステップ301)後、対象となる文書を読み込む(ステップ302)。このとき、初期値としてi=0、p=1、Fp=offである。
【0055】
読み込んだ文書から、区切り文字等で語句の区切りを判定して、語句を抽出する(ステップ303)。
【0056】
このとき、文章の最後まで到達したか判定し、最後まで到達していない場合はステップ306へ進む(ステップ304)。
【0057】
抽出した各語句は、カウンタ(番号)iを1つ増分させて(i=i+1)割り当てて、語句No.(i)として登録する(ステップ306)。
【0058】
次に、抽出した語句iが、条項の見出しの一部であるか否か、文書分割判定ルールに従って判定する。文書分割判定ルールによって、語句iが1つまたは複数の語句からなる条項pの見出しの最初の語句であるかどうか判定する(ステップ308)。
【0059】
語句iが条項pの見出しの最初の語句であれば、S(p)=iとし、条項pの見出しの開始語句No.(S(p))を登録して、Fp=onとし、ステップ303に戻る(ステップ310)。このとき、1つ前の条項p−1の最終語句No.(F(p−1))が開始語句No.(S(p)−1)であるとわかるので、F(p−1)=i−1とする(ステップ313)。
【0060】
ステップ308において、語句iが条項pの見出しの最初の語句でない場合は、語句iが条項pの見出しの最後の語句であるかどうか判定する(ステップ311)。
【0061】
語句iが条項pの見出しの最後の語句であれば、E(p)=iとし、条項pの見出しの終了語句No.(E(p))を登録して、Fp=off、p=p+1とし、ステップ303に戻る(ステップ312)。このとき、条項pの見出しがわかるので、この見出しと条項No.(p)を登録する(ステップ309)。
【0062】
ステップ311において、語句iが条項pの見出しの最後の語句でない場合は、語句iは条項pの見出しの最初と最後の間の語句であり、ステップ303に戻る。
【0063】
ステップ303〜ステップ312の処理を文書の最後まで繰り返す。文書の最後に到達したら(ステップ304)、上述のステップ313の処理を行って、条項設定の処理を終了する(ステップ305)。
【0064】
条項の見出しによる文書の分割は、上述した文書分割判定ルールに従って実行するほか、ユーザが条項指定入力装置103を用いて、分割する箇所の語句を指定することにより、実行することもできる。ユーザは、分割する箇所の語句の指定により、見出しを追加、削除することができる。何れの場合も、この条項の単位で文書を分割することにより、文書の範囲指定、評価、参照情報を検索するための指定語句2の設定を可能にする。
【0065】
図4(1)と図4(2)は、図1に示した文書・条項データベース117のデータフォーマット例とデータ例を示す。
【0066】
図4(1)に示すように、条項データフォーマット410は、条項No.411、条項の開始語句No.412、見出しの終了語句No.413、条項の見出し414、及び条項の終了語句No.415からなる。条項の最初の語句は見出しの最初の語句であるので、条項の開始語句No.412は、見出しの開始語句No.でもある
p番目の条項に対し、条項No.411、条項の開始語句No.412、見出しの終了語句No.413、及び条項の終了語句No.415には、条項No.(p)、条項No.(p)の見出しの開始語句S(p)、見出しの終了語句E(p)、及び条項の終了語句S(p+1)−1がそれぞれ登録される。条項の見出し414には、p番目の条項の見出しが登録される。
【0067】
例えば、図4(2)に示した条項データ例420では、1番目の条項に対し、条項No.411は「1」、条項の開始語句No.412は「3」、見出しの終了語句No413は「3」、条項の見出し414は「Performance」、条項の終了語句No.415は「11」となる。
【0068】
同様に、2番目の条項に対し、条項No.411は「2」、条項の開始語句No.412は「12」、見出しの終了語句No413は「12」、条項の見出し414は「Warrenty」、条項の終了語句No.415は「62」となる。3番目と4番目の条項に対しても同様に、条項No.411が「3」に対する条項の見出し414は「Inspection」であり、条項No.411が「4」に対する条項の見出し414は「Intellectual Property」であることを示す。
【0069】
ここで、図1に示した指定語句(変換語句)データベース106について説明する。指定語句(変換語句)データベース106は、指定語句データと指定語句変換データとが登録されている。
【0070】
まず、指定語句データについて説明する。図5(1)と図5(2)は、指定語句(変換語句)データベース106の指定語句データフォーマット例と指定語句データ例を示す。
【0071】
図5(1)に示すように、指定語句データフォーマット510は、指定語句No.511、指定語句512、同義語・類似語513、及び関連語514からなる。同義語・類似語513は、指定語句512に対する同義語や類似語であり、関連語514は、指定語句512に関連する語である。すなわち、同義語・類似語513と関連語514は、指定語句512に類似する語句である。
【0072】
具体的には、例えば図5(2)に示した指定語句データ例520では、指定語句No.511が「1」の指定語句512の「cost」に対して、同義語・類似語513として「expense」、関連語514として「pay,price」が登録されている。このような指定語句データベースは、予め作成しておき、その中から各語句を選択できるようにしておくが、語句の追加、削除、変更も可能とする。
【0073】
次に、指定語句変換データについて説明する。図6(1)と図6(2)は、指定語句(変換語句)データベース106の指定語句変換データフォーマット例と指定語句変換データ例を示す。
【0074】
図6(1)に示すように、指定語句変換データフォーマット610は、指定語句No.611、指定語句612、及び変換語句613からなる。変換語句613は、指定語句612を他言語に翻訳した語句である。
【0075】
具体的には、例えば図6(2)に示した指定語句変換データ例620では、指定語句No.611が「1」の指定語句612の「cost」に対して、変換語句613として「値段、原価、費用」が登録されている。
【0076】
指定語句抽出変換装置107は、このようなデータが予め登録されている指定語句(変換語句)データベース106を用いることにより、他言語に翻訳した語句や類似する語句も考慮して指定語句を変換し、指定語句1とする。
【0077】
図7は、図1に示した指定語句抽出変換装置107が行う、指定語句の検索(図2のステップ205)と指定語句1の定義(図2のステップ206)の処理手順の一例を示すフローチャートである。図7のフローチャートにおいて、iは語句のカウンタ(番号)を、jは指定語句のカウンタ(番号)を表す。iとjの初期値は0である。
【0078】
開始(ステップ701)後、対象範囲の開始語句No.と終了語句No.を設定する(ステップ702)。対象範囲の先頭の語句が開始語句で、最後の語句が終了語句であり、それぞれの語句No.を設定する。ここでは、開始語句の語句No.はs、終了語句の語句No.はeであるとする。
【0079】
指定語句のカウンタ(番号)jを1つ増分させ(ステップ710)、指定語句ajを指定語句(変換語句)データベース106の中の指定語句から1つ選んで設定する(ステップ703)。
【0080】
次に、対象範囲内にある語句No.(s+i)の語句w(s+i)を対象語句とする(ステップ704)。語句のカウンタ(番号)iを1つ増分させ(ステップ705)、対象語句w(s+i)が指定語句ajと等しいかを判定する(ステップ706)。
【0081】
次に、対象語句w(s+i)が指定語句ajであれば、指定語句(変換語句)データベース106の中の指定語句に対応する変換語句を指定語句1として登録する(ステップ707)。すなわち、対象語句w(s+i)が指定語句(変換語句)データベース106に含まれる指定語句ajの何れかと等しければ、その指定語句に対応する変換語句を指定語句1とする(図6(1)の指定語句612に対応する変換語句613を指定語句1とする)。
【0082】
ステップ704からステップ707までの処理を、対象範囲の最後まで(s+i>eとなるまで)繰り返す(ステップ708)。
【0083】
そして、全ての指定語句について、対象範囲内にある語句と一致するかの判定を繰り返す(ステップ711)。すなわち、j>n1となるまでステップ710からステップ708までの処理を繰り返す。
【0084】
ステップ708とステップ711での繰り返しにより、ステップ704〜ステップ706では、対象範囲内にある語句(語句No.=sの語句w(s)から語句No.=eの語句w(e)まで)について1語ずつ、指定語句(変換語句)データベース106に含まれるか判定することになる。すなわち、対象語句w(s+i)(iは0からe−sまで)を1語ずつ選択し(ステップ704)、指定語句(変換語句)データベース106の全ての指定語句a1、a2、・・・aj、・・・n1(図6(1)参照)の中に、ステップ704で選択した対象語句w(s+i)と同じ語句があるか否かを判定する(ステップ706)。
【0085】
全ての指定語句に対して対象範囲内にある語句と一致するかの判定をしたら、指定語句の検索と指定語句1の定義の処理を終了する(ステップ709)。
【0086】
例えば、対象範囲の中に、図5(2)に示した指定語句データ例520の指定語句512に登録されている「cost」と「delay」があった場合は、図6(2)に示した指定語句変換データ例620の指定語句612の「cost」と「delay」に対する変換語句613「値段、原価、費用、遅延、猶予」を指定語句1とする。
【0087】
上記の方法は、文書が英文の契約文書であり、参照情報であるノウハウ情報が日本文で構築されているような場合に、指定語句(変換語句)データベース106によって、英語の指定語句が日本語の指定語句1に翻訳されて変換される例である。変換方法には、このように他言語への変換のほか、語句の意味の拡張や語句の意味の限定などを実施する方法もある。なお、他言語への変換の場合、上記の例では英語から日本語への変換を示したが、変換前後の言語の種類は、英語や日本語に限られるものではない。
【0088】
図8(1)と図8(2)は、図1に示した標準項目別関連条項データベース109のフォーマット例とデータ例を示す。標準項目別関連条項データベース109は、標準項目と条項との関連が設定されるデータベースである。
【0089】
図8(1)に示すように、標準項目別関連条項データフォーマット810は、項目No.811、標準項目812、及び関連条項813からなる。関連条項813は、標準項目812に関連する文書内の条項である。
【0090】
具体的には、例えば図8(2)に示した標準項目別関連条項データ例820では、項目No.811が「1」の標準項目812が「受注範囲」のとき、この標準項目に関連する文書内の条項は「1.DEFINITIONS」であることを示す。同様に、標準項目が「支払条件」のとき、関連条項は「4.PAYMENT」であり、標準項目が「性能保証」のとき、関連条項は「11.PERFORMANCE」であり、標準項目が「検査・試験」のとき、関連条項は「7.INSPECTION」であることを示す。
【0091】
上記の標準項目は、文書に記載されるべき標準的な項目であり、文書の種類によって予め決められている。例えば、契約文書であれば、「契約範囲」「支払」「保証」「保険」「検査」「引渡」などである。これに対し、上記の関連条項は、対象となる文書が入力されて条項が設定された後、この条項をもとに決定される。
【0092】
図9(1)と図9(2)は、図1に示した標準項目別指定語句データベース110のフォーマット例とデータ例を示す。標準項目別指定語句データベース110は、標準項目と指定語句との関連が予め設定されているデータベースである。
【0093】
図9(1)に示すように、標準項目別指定語句データフォーマット910は、項目No.911、標準項目912、及び指定語句913からなる。指定語句913は、標準項目912に関連する指定語句である。
【0094】
具体的には、例えば図9(2)に示した標準項目別指定語句データ例920では、項目No.911が「1」の標準項目912が「受注範囲」のとき、この標準項目に関連する指定語句913は「受注、責任」であることを示す、同様に、標準項目が「支払条件」のとき、指定語句は「支払、通貨、税金、為替」であり、標準項目が「性能保証」のとき、指定語句は「性能、検収、合格」であり、標準項目が「検査・試験」のとき、指定語句は「立会い、見做し、法定」であることを示す。
【0095】
図10は、図1に示した指定語句設定装置111が行う、条項が関連する標準項目の検出(図2のステップ208)と指定語句2の定義(図2のステップ209)の処理手順の一例を示すフローチャートである。図10のフローチャートにおいて、Iは標準項目のカウンタ(番号)を表し、初期値はI=0である。
【0096】
開始(ステップ1001)後、対象とする条項(対象条項)を設定する(ステップ1003)。対象条項は、対象範囲指定入力装置105によって指定した対象範囲がどの条項に含まれるかを、対象範囲の最初の語句No.と最後の語句No.と、文書・条項データベース117に定義された各条項の開始語句No.と終了語句No.とから判定して、設定する。図4(1)に示したように、条項データフォーマット410には、各条項の開始語句No.412と終了語句No.415が定義されている。
【0097】
次に、対象条項が標準項目の関連条項であるかを、標準項目別関連条項データベース109に定義された任意の標準項目、及びその標準項目についての関連条項から判定し、対象条項を関連条項とする標準項目、すなわち対象条項と関連する標準項目を設定する。
【0098】
まず、標準項目のカウンタ(番号)Iを1つ増分させ(ステップ1004)、I番目の標準項目No.(I)を選択する(ステップ1005)。標準項目No.(I)の関連条項に対象条項が定義されているかを、標準項目別関連条項データベース109を参照して判定する(ステップ1006)。ステップ1004〜ステップ1006までの処理を、全ての標準項目について行う。
【0099】
図8(1)に示したように、標準項目別関連条項データフォーマット810には、各標準項目812の関連条項813が定義されている。
【0100】
ステップ1006において、対象条項が標準項目No.(I)の関連条項であれば、その対象条項に標準項目No.(I)を設定し、標準項目別指定語句データベース110に定義された標準項目No.(I)、及び標準項目No.(I)についての指定語句を指定語句2として登録する(ステップ1007)。すなわち、対象条項が標準項目No.(I)の関連条項であれば、標準項目別指定語句データベース110を参照し、標準項目No.(I)に対応する指定語句を指定語句2として登録する。
【0101】
図9(1)に示したように、標準項目別指定語句データフォーマット910には、各標準項目912に対する指定語句913が定義されている。
【0102】
ステップ1004からステップ1007までの処理を、全ての標準項目に対して(I>Tとなるまで。Tは標準項目の数)繰り返し(ステップ1008)、終了する(ステップ1009)。
【0103】
図11と図12を用いて、参照情報表示装置116の表示画面例を示す。
【0104】
図11は、指定語句1と指定語句2を設定するときの参照情報表示装置116の表示画面例を示す。上述したように、指定語句1は、対象範囲の中の指定語句をもとに設定され、指定語句2は、対照範囲を含む条項が関連する標準項目をもとに設定される。
【0105】
参照情報表示装置116は、文書本文表示画面1110を表示する。文書本文表示画面1110には、条項ごとに分割された本文1111、1112、対象範囲1113、及び参照情報検索ボタン1114が表示される。本文1111は条項1に対応し、本文1112は条項2に対応する。
【0106】
文書本文表示画面1110において、ユーザが対象範囲指定入力装置105(図1参照)を介して、本文1111、1112から対象範囲1113を選択し、参照情報検索ボタン1114を選択すると、情報参照支援システムは、参照情報表示装置116に検索条件の入力及び指定語句設定画面1120を表示する。
【0107】
検索条件の入力及び指定語句設定画面1120には、対象範囲1121、指定語句1122、指定語句(1)1123、条項1124、関連標準項目1125、指定語句(2)1126、実行ボタン1127、及び検索条件1128が表示される。
【0108】
指定語句1122は、対象範囲1121にある指定語句を判定した結果であり、図11の例では、「pay、cost、delay」である。指定語句(1)1123は、指定語句1122を日本語に変換した結果の語句であり、図11の例では、「値段、原価、・・・、遅延、猶予」である。条項1124は、対象範囲1121の含まれる対象条項であり、図11の例では、「4.Payment」である。関連標準項目1125は、条項1124を関連条項とする標準項目であり、図11の例では、「2.支払条件」である。指定語句(2)1126は、関連標準項目1125の指定語句2であり、図11の例では、「支払、通過、・・・」である。
【0109】
検索条件1128は、前述したように、指定語句(1)1123と指定語句(2)1126とを用いる4パターンの中から1つを選択できる。「AND」はAND条件を、「OR」はOR条件を、「指定語句1」は指定語句1のうち少なくとも1つだけを、「指定語句2」は指定語句2のうち少なくとも1つだけを、それぞれ検索条件に用いる。図11の例では、AND条件が選択されており、「指定語句1のうち少なくとも1つ、及び、指定語句2のうち少なくとも1つが、参照情報の中に含まれる」ことを検索条件としている。
【0110】
検索条件の入力及び指定語句設定画面1120において、ユーザが対象範囲指定入力装置105(図1参照)を介して、実行ボタン1127を選択すると、指定語句(1)1123と指定語句(2)1126と検索条件1128をもとに、参照情報を検索する
図12は、参照情報の検索を実行した結果を表示するときの参照情報表示装置116の表示画面例を示す。参照情報一覧表表示画面1210は、検索結果として獲得した参照情報の一覧表を表示する画面であり、検索条件1211、参照情報一覧表1212、及び内容表示ボタン1214が表示される。検索条件1211は、図11の検索条件の入力及び指定語句設定画面1120で設定した検索条件1128が表示される。
【0111】
ユーザが検索方法指定入力装置112(図1参照)を介して、参照情報一覧表1212の中から1つの参照情報を選択1213し、内容表示ボタン1214を選択すると、情報参照支援システムは、指定参照情報表示画面1220を表示する。
【0112】
指定参照情報表示画面1220は、参照情報一覧表1212の中から指定された1つの参照情報を表示する画面である。指定された参照情報の内容が、参照情報名(参照情報のタイトル1221)とともに表示される。
【符号の説明】
【0113】
101…文書データベース、102…条項見出し判定ルールデータベース、103…条項指定入力装置、104…条項設定装置、105…対象範囲指定入力装置、106…指定語句(変換語句)データベース、107…指定語句抽出変換装置、108…対象範囲条項判定装置、109…標準項目別関連条項データベース、110…標準項目別指定語句データベース、111…指定語句設定装置、112…検索方法指定入力装置、113…参照情報データベース、114…参照情報検索装置、115…検索結果の参照情報、116…参照情報表示装置、117…文書・条項データベース、1110…文書本文表示画面、1111,1112…本文、1113,1121…対象範囲、1114…参照情報検索ボタン、1120…検索条件の入力及び指定語句設定画面、1122…指定語句、1123…指定語句1、1124…条項、1125…標準項目、1126…指定語句2、1127…実行ボタン、1128…検索条件、1210…参照情報一覧表表示画面、1211…検索条件、1212…参照情報一覧表、1213…参照情報の選択、1214…内容表示ボタン、1220…指定参照情報表示画面、1221…タイトル。
【特許請求の範囲】
【請求項1】
文書の中の選択範囲に関連する情報を、参照情報データベースに登録された参照情報の中から検索する情報参照支援システムにおいて、
予め設定されたルールに従って、またはユーザの指定に従って、前記文書を1つまたは複数の条項に分割する条項設定手段と、
予め定義された指定語句のうち、前記選択範囲内に記載されている語句を指定語句1と定義する指定語句1定義手段と、
前記選択範囲の少なくとも一部を含む前記条項を検出する選択範囲条項判定手段と、
前記文書に応じて決まる標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連が設定される標準項目別関連条項データベースと、
前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、
前記標準項目別関連条項データベースに設定されている前記標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と定義する指定語句2定義手段と、
少なくとも前記指定語句1と前記指定語句2の何れか一方を検索条件に用いて、前記選択範囲に関連する情報を前記参照情報の中から検索する参照情報検索手段と、を備えることを特徴とする情報参照支援システム。
【請求項2】
請求項1記載の情報参照支援システムにおいて、
前記条項の見出しを検出するための文書分割判定ルールを予め格納した条項見出し判定ルールデータベースを備え、
前記条項設定手段は、前記文書分割判定ルールに従って、前記文書を1つまたは複数の条項に分割する情報参照支援システム。
【請求項3】
請求項1記載の情報参照支援システムにおいて、
前記指定語句と前記指定語句に類似する語句とを対応させた指定語句データを予め格納した変換語句データベースを備え、
前記指定語句1定義手段は、前記指定語句データに基づき、前記選択範囲内に記載されている語句とこの語句に類似する語句とを指定語句1と定義する情報参照支援システム。
【請求項4】
請求項1記載の情報参照支援システムにおいて、
前記指定語句と前記指定語句を他言語に翻訳した語句とを対応させた指定語句変換データを予め格納した変換語句データベースを備え、
前記指定語句1定義手段は、前記指定語句変換データに基づき、前記選択範囲内に記載されている語句とこの語句を他言語に翻訳した語句とを指定語句1と定義する情報参照支援システム。
【請求項5】
請求項1記載の情報参照支援システムにおいて、
前記指定語句2定義手段は、前記標準項目別関連条項データベースに設定されている前記標準項目と前記条項との関連に基づき、前記条項がどの前記標準項目に関連するかを定義する情報参照支援システム。
【請求項6】
請求項1記載の情報参照支援システムにおいて、
前記参照情報検索手段は、前記検索条件として、前記参照情報の中に、
前記指定語句1のうち少なくとも1つ、及び、前記指定語句2のうち少なくとも1つが含まれる、
前記指定語句1のうち少なくとも1つ、または、前記指定語句2のうち少なくとも1つが含まれる、
前記指定語句1のうち少なくとも1つだけが含まれる、及び、
前記指定語句2のうち少なくとも1つだけが含まれる、
の4つのうち、何れか1つを検索条件として参照情報を検索する情報参照支援システム。
【請求項7】
請求項1または請求項6記載の情報参照支援システムにおいて、
前記検索条件をユーザに選択させる画面を表示する表示装置を備える情報参照支援システム。
【請求項8】
請求項1記載の情報参照支援システムにおいて、
前記条項、前記指定語句1、前記標準項目、前記指定語句2、及び検索結果の情報を表示する表示装置を備える情報参照支援システム。
【請求項9】
検索対象である文書を記憶した文書データベースと、
前記文書を条項に分割するための条項見出し文書分割判定ルールを記憶した条項見出し判定ルールデータベースと、
前記文書を前記条項に分割する箇所の語句をユーザが指定するための条項指定入力装置と、
前記文書分割判定ルールまたは前記条項指定入力装置により指定された前記語句を基に、前記文書を前記条項に分割する条項設定装置と、
前記文書の中の任意の範囲をユーザが指定するための対象範囲指定入力装置と、
予め設定した指定語句と前記指定語句の類似語と前記指定語句を他言語に翻訳した語句とを記憶した指定語句データベースと、
前記指定語句のうち前記任意の範囲内に記載されている指定語句を抽出し、抽出した前記指定語句と前記類似語と前記翻訳した語句とのうち、少なくとも抽出した前記指定語句を指定語句1として設定する指定語句抽出変換装置と、
前記任意の範囲の少なくとも一部を含む前記条項を検出する対象範囲条項判定装置と、
前記文書に応じて決まる標準項目と前記条項との関連が設定される標準項目別関連条項データベースと、
前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、
前記標準項目別関連条項データベースに設定されている前記標準項目と前記任意の範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と設定する指定語句設定装置と、
検索条件として、前記指定語句1と前記指定語句2との少なくとも一方をユーザが指定するための検索方法指定入力装置と、
参照情報データベースに予め登録された参照情報の中から、前記検索条件に従い、前記任意の範囲に関連する情報を検索する参照情報検索装置と、
前記任意の範囲に関連する情報の検索結果を表示する参照情報表示装置と、を備えることを特徴とする情報参照支援システム。
【請求項1】
文書の中の選択範囲に関連する情報を、参照情報データベースに登録された参照情報の中から検索する情報参照支援システムにおいて、
予め設定されたルールに従って、またはユーザの指定に従って、前記文書を1つまたは複数の条項に分割する条項設定手段と、
予め定義された指定語句のうち、前記選択範囲内に記載されている語句を指定語句1と定義する指定語句1定義手段と、
前記選択範囲の少なくとも一部を含む前記条項を検出する選択範囲条項判定手段と、
前記文書に応じて決まる標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連が設定される標準項目別関連条項データベースと、
前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、
前記標準項目別関連条項データベースに設定されている前記標準項目と前記選択範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と定義する指定語句2定義手段と、
少なくとも前記指定語句1と前記指定語句2の何れか一方を検索条件に用いて、前記選択範囲に関連する情報を前記参照情報の中から検索する参照情報検索手段と、を備えることを特徴とする情報参照支援システム。
【請求項2】
請求項1記載の情報参照支援システムにおいて、
前記条項の見出しを検出するための文書分割判定ルールを予め格納した条項見出し判定ルールデータベースを備え、
前記条項設定手段は、前記文書分割判定ルールに従って、前記文書を1つまたは複数の条項に分割する情報参照支援システム。
【請求項3】
請求項1記載の情報参照支援システムにおいて、
前記指定語句と前記指定語句に類似する語句とを対応させた指定語句データを予め格納した変換語句データベースを備え、
前記指定語句1定義手段は、前記指定語句データに基づき、前記選択範囲内に記載されている語句とこの語句に類似する語句とを指定語句1と定義する情報参照支援システム。
【請求項4】
請求項1記載の情報参照支援システムにおいて、
前記指定語句と前記指定語句を他言語に翻訳した語句とを対応させた指定語句変換データを予め格納した変換語句データベースを備え、
前記指定語句1定義手段は、前記指定語句変換データに基づき、前記選択範囲内に記載されている語句とこの語句を他言語に翻訳した語句とを指定語句1と定義する情報参照支援システム。
【請求項5】
請求項1記載の情報参照支援システムにおいて、
前記指定語句2定義手段は、前記標準項目別関連条項データベースに設定されている前記標準項目と前記条項との関連に基づき、前記条項がどの前記標準項目に関連するかを定義する情報参照支援システム。
【請求項6】
請求項1記載の情報参照支援システムにおいて、
前記参照情報検索手段は、前記検索条件として、前記参照情報の中に、
前記指定語句1のうち少なくとも1つ、及び、前記指定語句2のうち少なくとも1つが含まれる、
前記指定語句1のうち少なくとも1つ、または、前記指定語句2のうち少なくとも1つが含まれる、
前記指定語句1のうち少なくとも1つだけが含まれる、及び、
前記指定語句2のうち少なくとも1つだけが含まれる、
の4つのうち、何れか1つを検索条件として参照情報を検索する情報参照支援システム。
【請求項7】
請求項1または請求項6記載の情報参照支援システムにおいて、
前記検索条件をユーザに選択させる画面を表示する表示装置を備える情報参照支援システム。
【請求項8】
請求項1記載の情報参照支援システムにおいて、
前記条項、前記指定語句1、前記標準項目、前記指定語句2、及び検索結果の情報を表示する表示装置を備える情報参照支援システム。
【請求項9】
検索対象である文書を記憶した文書データベースと、
前記文書を条項に分割するための条項見出し文書分割判定ルールを記憶した条項見出し判定ルールデータベースと、
前記文書を前記条項に分割する箇所の語句をユーザが指定するための条項指定入力装置と、
前記文書分割判定ルールまたは前記条項指定入力装置により指定された前記語句を基に、前記文書を前記条項に分割する条項設定装置と、
前記文書の中の任意の範囲をユーザが指定するための対象範囲指定入力装置と、
予め設定した指定語句と前記指定語句の類似語と前記指定語句を他言語に翻訳した語句とを記憶した指定語句データベースと、
前記指定語句のうち前記任意の範囲内に記載されている指定語句を抽出し、抽出した前記指定語句と前記類似語と前記翻訳した語句とのうち、少なくとも抽出した前記指定語句を指定語句1として設定する指定語句抽出変換装置と、
前記任意の範囲の少なくとも一部を含む前記条項を検出する対象範囲条項判定装置と、
前記文書に応じて決まる標準項目と前記条項との関連が設定される標準項目別関連条項データベースと、
前記標準項目ごとに前記指定語句が予め設定された標準項目別指定語句データベースと、
前記標準項目別関連条項データベースに設定されている前記標準項目と前記任意の範囲の少なくとも一部を含む前記条項との関連と、前記標準項目別指定語句データベースに設定されている前記指定語句とに基づき、前記条項と関連のある前記標準項目に対応する前記指定語句を指定語句2と設定する指定語句設定装置と、
検索条件として、前記指定語句1と前記指定語句2との少なくとも一方をユーザが指定するための検索方法指定入力装置と、
参照情報データベースに予め登録された参照情報の中から、前記検索条件に従い、前記任意の範囲に関連する情報を検索する参照情報検索装置と、
前記任意の範囲に関連する情報の検索結果を表示する参照情報表示装置と、を備えることを特徴とする情報参照支援システム。
【図1】
【図2】
【図3】
【図4(1)】
【図4(2)】
【図5(1)】
【図5(2)】
【図6(1)】
【図6(2)】
【図7】
【図8(1)】
【図8(2)】
【図9(1)】
【図9(2)】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4(1)】
【図4(2)】
【図5(1)】
【図5(2)】
【図6(1)】
【図6(2)】
【図7】
【図8(1)】
【図8(2)】
【図9(1)】
【図9(2)】
【図10】
【図11】
【図12】
【公開番号】特開2011−138242(P2011−138242A)
【公開日】平成23年7月14日(2011.7.14)
【国際特許分類】
【出願番号】特願2009−296633(P2009−296633)
【出願日】平成21年12月28日(2009.12.28)
【出願人】(507250427)日立GEニュークリア・エナジー株式会社 (858)
【Fターム(参考)】
【公開日】平成23年7月14日(2011.7.14)
【国際特許分類】
【出願日】平成21年12月28日(2009.12.28)
【出願人】(507250427)日立GEニュークリア・エナジー株式会社 (858)
【Fターム(参考)】
[ Back to top ]