説明

ドキュメント作成支援システム

【課題】テキストを装飾するテキストボックスを含む文書ファイル(ドキュメント)の分析を行い、各々のテキストボックスの配置パタン及びカテゴリの因果関係を管理し、不足するテキストボックス等を報知するためのコメントを付与することでドキュメントの作成支援、品質管理を行うシステムを提供する。
【解決手段】ユーザが作成支援を所望してドキュメントを登録した場合、情報整理機能32によって当該ドキュメントの情報整理を行い、差分抽出機能35にてデータベース4に蓄積される配置パタン等と、情報整理されたドキュメントの配置パタン等との差分を抽出し、差分に基づきコメントを作成してドキュメントに付与することで、足りないテキストボックスやカテゴリの不一致をユーザに報知することでドキュメント作成の支援を行うことができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストボックスとそれに含まれるテキストデータを分析し、新たにドキュメントを作成する際のデータの再利用性を向上させ、記載不備、記載漏れを防止することができるドキュメント作成支援システムに関する。
【背景技術】
【0002】
顧客向けの営業資料や講義・講習会資料として、テキストをボックス等の視覚に訴える装飾が可能な文書ファイル(以降ドキュメントと称呼)を採用することが多い。このドキュメントは総じてバイナリデータで構成されているファイルである。従来、このようなファイルからテキストを抽出し、文節・文章構造の解析を行うシステムが広く用いられている。
【0003】
例えば特許文献1では、文字列からなるテキストデータと文字を含んだ画像からなるドキュメントの解析を行い、通常テキストデータとして扱われない文字を含んだ画像の文字列を判別し、テキストデータ及び文字を含んだ画像の文字列をテキストファイルとして保存し、ドキュメントから文字列を抽出する際、特殊なフォーマットの文字列であったとしても、所望の文字列を抽出することができるとしている。
【0004】
また、特許文献2では、コンテンツデータを解析用データベースに蓄積された解析用データに基づいて分析し、分析結果に基づいてコンテンツデータの作成者の属性を判定する属性判定装置が開示されている。これによって作成者の年齢層や性別、嗜好などの情報をコンテンツデータから得ることができ、当該コンテンツデータのテキストの内容と、解析した作成者の属性をリンクさせて、統計を取ることで有用な資料を自動的に作成することができ、別途顧客に提供する商品やサービスの内容に反映させることができるとしている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−171851号公報
【特許文献2】特開2008−257351号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記特許文献1では、抽出条件として指定した文字列を、画像中に含まれる文字も対象とすることはできるが、テキストボックスや画像単位に単語を分析し、各々の相関関係を分析するまでには至っていない。
【0007】
また、上記特許文献2は、解析用データベースはシステム稼動前に解析データを蓄積しておかなければならず、日々更新されるコンテンツデータの内容が解析データにマッチしなくなる場合もあり、解析結果の信頼性を保つには解析用データベースの定期的な更新を行わなくてはならない。また、テキストから文節や文末、キーワード抽出を行うことはできるが、テキストを格納するテキストボックスの配置、及びテキストボックス間の相関関係まで解析をせず、コンテンツ全体の解析を行うことを目的としていない。
【0008】
本発明は上述した問題点に鑑みてなされたものであり、複雑なレイアウトによって作成されたドキュメントを構成するテキストボックスの配置パタン、テキストボックスに含まれるテキストデータの文節ルール、テキストボックス間の因果関係を分析し、サンプルパタンとして予め登録された配置パタン、文節ルール、因果関係との差分を抽出し、不足している価値や機能のカテゴリに関わるテキストの追加や、既に配置されているテキストボックスの配置修正に関わるコメントを付与し、添削を行うことでドキュメントの品質管理を図るためのドキュメント作成支援システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
請求項1に係るドキュメント作成支援システムは、テキストが入力されたテキストボックスが複数配置された文書ファイル(以降ドキュメントと称呼する)を、ネットワーク上のクライアント端末から送信されたドキュメントを登録する登録手段と、登録されたドキュメントの分析を行う情報整理手段と、登録されたドキュメントを蓄積するためのドキュメント記憶領域と、ドキュメントのテキストボックスの配置パタン、テキストボックスに入力されるテキスト、及びテキストを分類するためのカテゴリを蓄積するデータベースと、該データベースに蓄積される配置パタン、テキスト、カテゴリと、前記情報整理手段によって分析されるドキュメントの配置パタン、テキスト、カテゴリとを比較し、差分を抽出する差分抽出手段と、該差分抽出手段によって抽出された差分に基づいて、ドキュメントに添削コメントを付与するコメント追加手段と、を備え、前記情報整理手段は、ドキュメントを読み込んでテキストボックス毎に情報を抽出するデータ抽出ステップと、抽出したテキストボックスに入力されたテキストデータを所定のカテゴリに分類し前記データベースに登録するカテゴリ分類ステップと、テキストデータを単語及び文節に分解し、キーワードとして抽出して前記データベースに登録するキーワード設定ステップと、配置されたテキストボックス内のキーワードの関連性を検出しテキストボックス同士の因果関係を前記データベースに登録する因果関係設定ステップと、から構成され、前記登録手段によって前記ドキュメント記憶領域に蓄積されたドキュメントを、前記情報整理手段によって分析し、前記差分抽出手段によって当該分析結果と前記データベースに蓄積される配置パタン、テキスト、カテゴリとを比較し、不足するカテゴリ及びテキストボックスを特定してこれを報知するためのコメントを前記コメント追加機能によって付与して前記ドキュメント記憶領域に保存することを特徴とする。
【0010】
請求項2に係るドキュメント作成支援システムは、請求項1記載のドキュメント作成支援システムにおいて、登録されたドキュメントに対するコメントの付与が完了した際、当該ドキュメントを登録したユーザに当該ドキュメントを電子メールにて送信することを特徴とする。
【発明の効果】
【0011】
本発明のドキュメント作成支援システムによれば、登録されたドキュメントからテキストボックスの配置パタン、テキストデータ、テキストデータのカテゴリを抽出し、予めデータベースに蓄積されたサンプルである配置パタン、テキストデータ、カテゴリと比較することで、不足しているテキストボックスやカテゴリを発見し、これをドキュメント作成者である登録ユーザに電子メールにて通知することを、ユーザがドキュメントをシステムに登録するだけで行うことができ、効率のよいドキュメントの添削、作成支援を行うことができる。
【図面の簡単な説明】
【0012】
【図1】本発明の実施例における、ドキュメント作成支援システムのシステム構成を示すブロック図である。
【図2】同上、各データベースが備えるテーブルを示す説明図である。
【図3】同上、案件全体データベースに管理されるテーブルの構成を示す説明図である。
【図4】同上、案件個別データベースに管理されるテーブルの構成を示す説明図である。
【図5】同上、カテゴリ情報データベースに管理されるテーブルの構成を示す説明図である。
【図6】同上、カテゴリ情報データベースに管理されるテーブルの構成を示す説明図である。
【図7】同上、配置情報データベースに管理されるテーブルの構成を示す説明図である。
【図8】同上、クライアント端末からのドキュメントの登録を受け付ける登録機能の動作を示すフローチャートである。
【図9】同上、ドキュメント作成支援システムの動作概要を示すフローチャートである。
【図10】同上、ドキュメント作成支援システムの情報整理機能の動作を示すフローチャートである。
【図11】同上、登録案件抽出処理の動作の詳細を示すフローチャートである。
【図12】同上、データ抽出処理の動作の詳細を示すフローチャートである。
【図13】同上、カテゴリ分類処理の動作の詳細を示すフローチャートである。
【図14】同上、特性KEY設定処理の動作の詳細について説明するフローチャートである。
【図15】同上、因果関係設定処理の動作の詳細を示すフローチャートである。
【図16】同上、案件データベース作成処理の動作の詳細を示すフローチャートである。
【図17】同上、ドキュメント作成支援システムのテーブル推定機能の動作の概要を示すフローチャートである。
【図18】同上、更新テーブル抽出処理の動作の詳細を示すフローチャートである。
【図19】同上、配置パタン設定処理の動作の詳細を示すフローチャートである。
【図20】同上、文節ルール推定処理の動作の詳細を示すフローチャートである。
【図21】同上、特性KEY推定処理の動作の詳細を示すフローチャートである。
【図22】同上、因果関係推定処理の動作の詳細を示すフローチャートである。
【図23】同上、配置パタン推定処理の動作の詳細を示すフローチャートである。
【図24】同上、ドキュメント作成支援システムの推定テーブル評価機能の動作の概要を示すフローチャートである。
【図25】同上、評価テーブル抽出処理の動作の詳細を示すフローチャートである。
【図26】同上、文節ルール評価処理の動作の詳細を示すフローチャートである。
【図27】同上、特性KEY評価処理の動作の詳細を示すフローチャートである。
【図28】同上、因果関係評価処理の動作の詳細を示すフローチャートである。
【図29】同上、配置パタン評価処理の動作の詳細を示すフローチャートである。
【図30】同上、配置ルール評価処理の動作の詳細について説明するフローチャートである。
【図31】同上、提案書作成支援機能の動作の概要を示すフローチャートである。
【図32】同上、支援案件抽出処理の動作の詳細を示すフローチャートである。
【図33】同上、提案書作成支援機能によって添削されたドキュメントの一例を示す説明図である。
【発明を実施するための形態】
【実施例】
【0013】
以下、本発明を実施するための最良の形態としての実施例を図1から図33を参照して説明する。もちろん、本発明は、その発明の趣旨に反さない範囲で、実施例において説明した以外のものに対しても容易に適用可能なことは説明を要するまでもない。
【0014】
本実施例におけるドキュメント作成支援システムの構成について、図1に基づいて説明する。1は、ドキュメント作成支援システムである。ドキュメント作成支援システム1は、プログラム3、データベース4、提案書5を記憶する記憶装置2と、プログラム3を実行するための制御装置たるCPU6、及び一時記憶領域であるメインメモリ7、後述のネットワーク上の端末装置100と通信するための通信装置8、表示装置またはプリンター等の出力部9、キーボードやマウスなどの入力部10を備える。100はパーソナルコンピュータ等の端末装置であり、
【0015】
プログラム3は、端末装置100からのドキュメントファイルの登録を行うための登録機能31、登録されたドキュメントファイルからテキストボックスの配置パタンやキーワード等の情報を取得しデータベースを更新する情報整理機能32、情報整理機能32によって得られた情報から新たなテキストボックス間のルールを配置パタンに基づいて推定するテーブル推定機能33、テーブル推定機能33によって推定されたルールが実用可能か否かを評価する推定テーブル評価機能34を備える。また、ドキュメント作成支援を所望するユーザによって登録されたドキュメントに対して、既に登録されている配置パタンと比較し、その差分を取り出す差分抽出機能35、取り出した差分(即ち不足する情報や誤まった内容等)に基づきドキュメントに添削コメントを付与するコメント追加機能36、ドキュメントの作成支援が終わった際、ドキュメントを登録したユーザに対してそれを電子メールによって通知するためのメール送信機能37、各テーブルの仮登録状態(登録状況=FALSE)のレコードに対してシステムが当該レコードを参照した際に、対応する列(例えば「申請件数」列など)に格納される値に1を加算する参照回数カウント手段38によって構成される。
【0016】
データベース4は、登録されたドキュメント全ての管理をする案件全体データベース41、個々のドキュメントの詳細な情報を管理する案件個別データベース42、テキストボックスに用いられるキーワードや文節のカテゴリを管理し、各ドキュメントの整理・作成支援の際に用いるカテゴリ情報データベース43、カテゴリ情報データベースにない新しい文節ルールや因果関係を推定するために使用するドキュメントの配置パタンを管理する配置情報データベース44によって構成される。
【0017】
提案書記憶領域5は、登録機能31によって登録されたドキュメントの記憶領域である分析用提案書記憶領域51と、作成中のドキュメントやその作成支援の際に用いるドキュメントの記憶領域である作成支援用提案書記憶領域52から構成される。
【0018】
次に、図2に示すデータベース4の各データベースによって管理されるテーブルについて、図3〜7に基づいて説明する。まず、案件全体データベース41によって管理される各テーブルについて、図3に基づいて説明する。案件全体データベース41は、案件データ登録テーブル411と、案件データテーブル412とから構成される。案件データ登録テーブル411は、登録されたドキュメントファイルの管理情報が登録される。案件データ登録テーブル411は、ドキュメントを一意に特定するためのドキュメントナンバー(#)、ドキュメントが登録された時刻を示す「登録時刻」、ドキュメントのアップロードされた場所を示す「ファイルパス」、登録されたドキュメントが情報整理のためかそれとも作成支援のためかを判別するための「登録形式」、ドキュメントのテキストデータを管理するテキストデータテーブル421のテーブル名を格納する「テキストTB」、ドキュメントに用いられるテキストボックスの配置を管理する配置データテーブル422のテーブル名を格納する「配置データ」、配置データが合致する配置パタンを格納する「配置パタン」を備え、各々の項目によってドキュメントの管理を行う。
【0019】
案件データテーブル412は、案件データ登録テーブル411の「#」列をキーとしたドキュメントナンバー(#)、後述の特性KEYの有無を管理する「特性KEY」(図中のKRd1〜KRdn)を備え、各々のドキュメントがどのような内容のファイルであるかを案件データテーブル412で管理することができる。
【0020】
続いて案件個別データベース42によって管理される各テーブルについて、図4に基づいて説明する。テキストデータテーブル421は、ドキュメント1つに対して1つのテーブルが作成される。テキストデータテーブル421は、ドキュメント内のテキストボックスを一意に特定するための「テキストデータナンバー(#)」、テキストボックスの配置属性である「TOP」、「LEFT」、「WIDTH」、「HEIGHT」、テキストボックスに格納されている「テキスト」、当該テキストの文節を示す「文節ルール」、テキストに含まれるキーワードを示す「特性KEY」、当該ドキュメントにおける各テキストボックスと対になる価値または機能といったカテゴリに分類されたテキストボックスが特定されているか否かを示す「因果」からなり、ドキュメント内のテキストボックスの配置状態と、テキストの内容等を管理することができる。
【0021】
配置データテーブル422も、テキストデータテーブル421と同様ドキュメント1つに対して1つのテーブルが作成される。配置データテーブル422は行及び列を用いて座標管理をするものであり、ドキュメントのどこにテキストボックスが配置されたかを記憶するためのテーブルである。例えば、図4では(1,2)、(2,2)、(3,2)の各々の値に「TD1」が格納されているが、これはテキストデータテーブル421のTD1が示すテキストボックスが大凡それらの座標に収まっていることを示すものである。
【0022】
因果関係登録テーブル423もドキュメント1つに対して1つのテーブルが作成される。本発明において因果関係とは、「テキストボックスは機能を示すキーワードには、それに対応する価値を示すキーワードが存在しなければならない」というルールに基づいた2つのテキストボックスの相関関係を示すものである。因果関係を特定するコード(#)、因果関係を形成する2つのキーワードの内価値に該当するキーワードを示す特性KEYを格納する「価値」、他方である機能に該当するキーワードを示す特性KEYを格納する「機能」、当該因果関係の評価を示す「登録状況」から構成される。
【0023】
図5及び6はカテゴリ情報データベース43によって管理される各種のテーブルを示している。文節ルールテーブル431は、テキストボックスに入力される文章の文末・文節を抽出して格納し、機能または価値のカテゴライズを行うものである。文節ルールを一意に特定するための「文節ルールナンバー(#)」、文末やその他の文節を格納する「文節ルール」、文節ルールに格納された文節が属する「カテゴリ」、文節ルールが参照された件数を格納する「申請数」、「文節ルール」列に格納された文節ルールが「カテゴリ」列のカテゴリとして参照された件数を格納する「申請数」、当該文節ルールの登録状況を格納する「登録状況」から構成される。
【0024】
特性KEYテーブル432は、ドキュメント内で使用される単語であって特に多くのドキュメントで用いられるものを管理するためのものである。特性KEYテーブル432は、特性KEYを一意に特定するための「特性KEYナンバー(#)」、特定の単語を示す「特性KEY」、特性KEYが属する「カテゴリ」、新規登録された特性KEYが既存の特性KEYの類似語と判定された場合に、類似語に該当する特性KEYナンバー(#)を格納する「類似語」、特性KEYが参照された件数を格納する「申請数」、特性KEYの登録状況を格納する「登録状況」から構成される。
【0025】
因果関係対応テーブル433は、「価値」にカテゴライズされた特性KEYと、「機能」にカテゴライズされた特性KEYを関連付けて管理するためのものである。因果関係を一意に特定するための因果関係ナンバー(#)、因果関係を形成する特性KEYの内価値を示す特性KEYの特性KEYナンバーを格納する「価値」、機能を示す特性KEYの特性KEYナンバーを格納する「機能」、因果関係の評価を行った件数を格納する「申請件数」、因果関係の申請件数において、当該因果関係を認可した割合を示す「共起度」、当該因果関係の登録状況を格納する「登録状況」から構成される。
【0026】
修正データ登録テーブル434は、文節ルールテーブル431、特性KEYテーブル432、因果関係対応テーブル433の各テーブルにて管理されるデータの修正履歴を登録するものである。本実施例では、各登録案件から抽出される新しい文節ルール・特性KEY・因果関係・配置パタン・配置ルールに関して評価及び登録を行うが、各々のテーブルに格納されるレコードは膨大となるため、これを全件検索すると検索処理に膨大な時間を要してしまうため、新規登録や更新されたデータの各テーブルのキーとなる列に格納されたデータを、評価対象判別のために修正データ登録テーブル434に登録する。これにより、各テーブルにアクセスして新規登録または更新レコードを抽出せずとも、修正データ登録テーブル434にアクセスするのみで新規登録または更新レコードを特定することができる。
【0027】
図7は配置情報データベース44に管理されるテーブルを示している。配置パタン管理テーブル441は、後述の配置パタンテーブル442において、その評価の値を管理するものである。配置パタンを通番で管理する「配置パタンナンバー(#)」、配置パタンのテーブル名を示す「テーブル名」、各配置パタンのレコードを参照された件数を格納する「申請数」、申請数が一定値を超えた場合TRUE、それ以下ではFALSEとなる「登録状況」から構成される。
【0028】
配置パタンテーブル442は、配置データテーブル422と同様、テキストボックスの配置情報を座標管理するためのテーブルであり、複数のドキュメントのテキストボックスをパタン化したものである。テキストボックスを特定する値(RD1、RD2、・・・RDn)が格納される。
【0029】
テキストルールテーブル443は配置パタンテーブル442にて管理されるテキストボックスには何れのカテゴリのテキストが入力されるべきかを管理するものである。テキストルールを一意に特定するための「テキストルールナンバー(#)」、配置パタンテーブル442の何れのテーブルのルールであるかを判別するための配置パタンテーブル名を格納する「配置パタン」、配置パタンテーブル442の何れのテキストボックスのルールであるかを判別するための「テキスト」(配置パタンテーブルにおけるRD1〜RDnが格納される)、当該テキストルールのカテゴリ(機能または価値)を格納する「カテゴリ」、当該テキストルールの評価状況を示す「評価値」、評価値が一定値を超えた場合TRUE、それ以下ではFALSEとなる「登録状況」から構成される。
【0030】
配置ルールテーブル444は、配置パタンテーブル442にて管理されるテキストボックスにおいて、テキストボックス同士の因果関係、すなわちどのテキストボックスが機能を示すものであり、対応する価値のテキストボックスはどれかを管理するものである。配置ルールを一意に特定するための「配置ナンバー(#)」、何れの配置パタンに関する配置ルールかを判別するための「配置パタン」、機能にカテゴリされるテキストボックスを格納する「機能」、対応する価値にカテゴリされるテキストボックスを格納する「価値」、当該配置ルールが参照された件数を示す「評価値」、評価値が一定値を超えた場合TRUE、それ以下ではFALSEとなる「登録状況」から構成される。
【0031】
上記データベースを用いたドキュメント作成支援システムの動作について、図8〜16に基づいて説明する。ドキュメントのシステムへの登録機能31について、図8に基づいて説明する。システム側で端末からのアクセスを受けるまで待機する(S801)。端末からシステムにアクセスし(S802)、アクセスデータを受信した場合(S803)、ドキュメント作成支援システム1は端末向けのWEB画面を作成し(S804)、WEB画面を端末に送信する(S805)。端末側では作成されたWEB画面が表示され、同画面からドキュメントの登録作業を行う(S806)。ドキュメント作成支援システム1はWEB画面送信後、データ受信の待機状態となる(S807、S808)。登録作業を終えた端末からドキュメント作成支援システム1にドキュメントを送信する(S809)。データ受信を行ったドキュメント作成支援システム1は、受信したドキュメントを案件データ登録テーブル411へ登録する「案件登録処理」を行う。ここで登録された案件データは、案件データ登録テーブル411のレコードナンバが振られ、「登録時間」列、「ファイルパス」列、「登録形式」列、「実施」列の各々に値が登録される。なお、「実施」列にはデフォルトでFALSEが登録される(S810)。端末から受信したドキュメントは、内容の分析のためのものか、作成支援用のものかを情報整理し(S811)、分析用であれば分析用提案書記憶領域51に(S812)、作成支援用であれば作成支援用提案書記憶領域52(S813)にそれぞれ記憶する。ドキュメント作成支援システム1は、登録が完了した旨を示す完了画面を作成し(S814)、完了画面を端末宛に送信する(S815)。端末が完了画面を受信し、ユーザが当該画面を確認したことを持って(S816)、ドキュメント作成支援システム1のドキュメント登録処理、及び端末によるドキュメント申請処理が終了する。
【0032】
次に、登録されたドキュメントに対するドキュメント作成支援システム1における分類、作成支援処理等を担う情報整理機能32の動作概要について図9に基づいて説明する。各処理は所定時刻に各処理が行われる定時バッチプログラムとして動作する。分析用提案書記憶領域51に記憶されるドキュメントに対して、所定時刻経過後、情報整理処理がお行われる(S901〜S903)。続いて、所定時刻経過後、整理された上方に基づきテーブル推定処理が行われる(S904〜S906)。更に所定時刻経過後、推定されたテーブルに対して推定テーブル評価処理が行われる(S907〜S909)。上記3つの処理を終え、所定時刻の経過を持って、別途作成支援用に作成支援用提案書記憶領域に登録されたドキュメントに対して提案書作成支援処理が行われる(S910〜S912)。
【0033】
図9に示す情報整理処理(S903)の詳細な動作について、図10〜図16に基づいて説明する。図10は情報整理処理を示している。情報整理処理は、登録案件抽出処理、データ抽出処理、カテゴリ分類処理、特性KEY設定処理、因果関係設定処理、案件データベース(以降、DBと称呼する)作成処理に大きく分類される。最初に、分析用提案書記憶領域51に保存されるドキュメントの中から、情報整理処理を行う対象を抽出するための登録案件抽出処理を行う(S1001)。抽出されたドキュメントがある場合は、続いてデータ抽出処理(S1003)、カテゴリ分類処理(S1004)、特性KEY設定処理(S1005)、因果関係推定処理(S1006)、案件DB作成処理(S1007)を抽出されたドキュメント全てに対して順次行う(S1002)。
【0034】
図10に示す登録案件抽出処理(S1001)の詳細な動作について、図11に基づいて説明する。案件データ登録テーブル411を参照し、登録済み案件で且つ分類処理が行われていないを確認する(S1101)。該当データが存在するかを判別し(S1102)、存在する場合は続いて説明するデータ抽出処理を行う(S1104)。データが存在しない場合、及びデータ抽出処理を終えた場合処理を終了する。
【0035】
以降の処理はステップS1101で抽出されたデータまたはそれに関連付くテキストデータテーブル421のデータを対象に行う処理である。
【0036】
続いて図10のステップS1003及び図11のステップS1104に示すデータ抽出処理について、図12に基づいて説明する。本処理は図11を参照することで明らかなように、分析用のドキュメント1つずつに行われるものである。分析用提案書記憶領域51に記憶されたドキュメントを読み込み、ドキュメント内のページの中からヘッダに「提案のポイント」「提案内容」等の提案に関する記載を示唆するページを特定する(S1201)。特定したページにおいて、テキストボックスを抽出する(S1202)。テキストボックスが存在するか否かを判別し(S1203)、存在する場合はテキストボックスのプロパティ情報(配置座標、テキストの内容、フォントサイズ、フォントカラー、バックグラウンドカラー等のテキストボックスに関する種々の情報)を抽出する(S1204)。抽出したプロパティ情報からテキストボックスに入力されているテキストの内容を抽出し、形態要素(言語で意味を持つ最小要素)に分解する形態要素解析を行い(S1205)、分解した形態要素に基づき係り受け(分解した形態要素同士の文法的な関係)解析を行う(S1206)。抽出されたプロパティ情報、形態要素解析及び係り受け解析によって解析されたテキスト情報をテキストデータテーブル421に登録する(S1207)。続いてカテゴリ分類処理を行う(S1207)。ドキュメントにテキストボックスが無い場合、及びカテゴリ分類処理を終えた場合処理を終了する。
【0037】
続いて図10のステップS1004及び図12のステップS1207に示すカテゴリ分類処理について、図13に基づいて説明する。テキストデータテーブル421の「テキスト」列を読み込み(S1301)、続いて文節ルールテーブル431に記憶されている文節ルールを読み込む(S1301)。読み込んだテキストと文節ルールを照合し(S1304)、合致した文節ルールがあるか否かを判別する(S1305)。合致した場合は、当該文節ルールが示すカテゴリをテキストデータテーブル421の該当レコードに更新し(S1306)、合致しなければNAデータ(該当データが無いことを示すもの)として更新する(S1307)。ステップS1304〜S1307までの処理を、テキストデータテーブル421の対象レコード分繰り返し(S1308)、その後特性KEY設定処理を行う(S1309)。
【0038】
続いて図10のステップS1005及び図13のステップS1309に示す特性KEY設定処理について、図14に基づいて説明する。テキストデータテーブル421を読み込み(S1401)、続いて特性KEYテーブル432を読み込む(S1402)。双方のテーブルのカテゴリが同値であり(S1403)、更に特性KEYテーブル432の特性KEY列に格納される値がテキストデータテーブル421のテキスト列に存在するレコードがあるか否かを照合する(S1404)。レコードが存在する場合(S1405)、テキストデータテーブル421の該当レコードの特性KEY列に、特性KEYテーブルの特性KEYナンバー(#)を格納すると共に登録する当該特性KEYに該当する特性KEYテーブル432の「申請件数」列の値を1増加させる(S1406)。レコードが存在しない場合はNAデータとして更新する。テキストデータテーブル421の全てのレコードについてステップS1403〜ステップS1407までの処理を行い(S1408)、因果関係設定処理を行う(S1408)。
【0039】
図10のステップS1006及び図14のステップS1408に示す因果関係設定処理について、図15に基づいて説明する。テキストデータテーブル421の特性KEY列のデータを読み込む(S1501)。続いて因果関係対応テーブル433を読み込む(S1502)。読み込んだ特性KEYと因果関係対応テーブル433のデータを照合し、当該特性KEYに既存の因果関係が設定されているかを抽出する(S1503)。抽出された因果関係を因果関係登録テーブル423へ登録する(S1504)。登録された因果関係登録テーブル423のレコードを特定する(S1505)。特定したレコードの1つを抽出し、「価値」列及び「機能」列の双方に値が登録されているかを判別する(S1506)。「価値」列及び「機能」列の双方に値が登録されている場合は、当該レコードの「登録状況」列をTRUEとし、対応する価値と機能のセットとなるレコードを因果関係対応テーブル433から抽出し、参照回数カウント手段38によって当該レコードの「共起数」列に登録される値に1を加算する(S1507)。「価値」列または「機能」列の内、一方のみ登録されている場合は、当該レコードの「登録状況」列をFALSEとする(S1508)。ステップS1508の処理が終わった時点で、特定したレコードを参照し、未処理のレコードが存在する場合はステップS1506へ、全ての処理を終えた場合は、ステップS1510へ進む(S1509)。因果関係設定処理を終了し、案件DB作成処理を行う(S1510)。
【0040】
図10のステップ1007及び図15のステップS1510に示す案件DB作成処理について、図16に基づいて説明する。テキストデータテーブル421を読み込み、対象レコードのカテゴリ列を取得する(S1601)。対象レコードのカテゴリ情報を確認し(S1602)、それが機能カテゴリであるかを判別する(S1603)。機能カテゴリである場合、当該レコードの特性KEY列を参照し(S1604)、当該特性KEYを案件データ登録テーブル411へ登録する(S1605)。ステップS1602〜ステップS1605の処理を、対象レコード全てに行うまで繰り返す(S1606)。
【0041】
以上のように、ドキュメント作成支援システム1は、ユーザが登録したドキュメントに含まれるテキストボックスの座標情報やテキストの内容を分析し、テキストボックス同士の因果関係や配置パタンを記憶することができる。
【0042】
続いて、情報整理機能32によって整理分類されたドキュメントの情報から、新たな文節ルールや配置パタン等、ドキュメントの分析や作成支援に用いることのできる情報を推定する機能である、テーブル推定機能33の動作について、図17〜図23に基づいて説明する。
【0043】
図17はテーブル推定機能33の動作概要を示している。まず、各データベースによって管理される種々のテーブルの中から、更新されたレコードが存在するテーブルを抽出する(S1701)。抽出されたテーブルがある場合、以降の処理を行う(S1702)。ドキュメントのテキストボックス配置構造を抽出し、登録された配置パタンから類似するものを選出する配置パタン設定処理(S1703)。テキストボックス内に入力されているテキストであって、文節ルールが不明(NAデータ)の場合、配置パタンを用いて新しい文節ルールを推定する文節ルール推定処理(S1704)。テキストボックス内に入力されているテキストであって、特性KEYが不明(NAデータ)の場合、配置パタンを用いて新しい特性KEYを推定する特性KEY推定処理(S1705)。テキストボックス内に入力されているテキストであって、因果関係が不明(NAデータ)の場合、配置パタンを用いて新しい因果関係を推定する因果関係推定処理(S1706)。新しい配置パタンを登録する配置パタン推定処理(S1707)。これらを順次、更新されたデータに対して行う。
【0044】
図17の更新テーブル抽出処理について、図18に基づいて説明する。テキストデータテーブル421の「文節」、「KEY」、「因果」を確認し、不明なカテゴリがある案件データを特定する(S1801)。上記カテゴリが不明な案件データが存在する場合(S1802)、配置パタン設定処理を行う(S1803)。登録案件が存在しない場合は更新テーブル抽出処理を終了する。
【0045】
続いて図17のステップS1703及び図18のステップS1803に示す配置パタン設定処理について、図19に基づいて説明する。新しく登録されたドキュメントに属するテキストボックスのプロパティ情報を、テキストデータテーブル421から読み込む(S1901)。読み込んだテキストボックスのプロパティ情報から、配置データテーブル422に準じた配置データを作成する(S1902)。作成した配置データと類似した配置パタンを配置パタン管理テーブル441から検索する(S1903)。類似する配置パタンが存在するか否かを判別し、配置パタンが存在する場合は、参照回数カウント手段38によって配置パタン管理テーブル441の「申請数」列の値を1加算する(S1904)。配置ルールテーブル444から対応する配置ルールを読み込み(S1905)、各テキストボックスに該当するカテゴリ(テキストボックスが価値か機能か)を照合する(S1906)。作成した配置データのテキストボックスのカテゴリが、類似する配置パタンのカテゴリと一致するか否かを判別し、一致する場合は、参照回数カウント手段38によってテキストルールテーブル443上の関連するレコードの「評価値」列の値に1を加算する(S1907)。続いて、当該配置パタンを案件データ登録テーブル441の当該ドキュメントのレコードの「配置パタン」列に登録し(S1908)、因果関係設定処理を行う(S1910)。ステップS1904及びステップS1907にて類似する配置パタンが抽出されない場合は、案件データ登録テーブル411の当該ドキュメントのレコードの「配置パタン」列にNAデータを登録し(S1909)、配置パタン推定処理を行う(S1911)。
【0046】
続いて、図17のステップS1704に示す文節ルール推定処理について、図20に基づいて説明する。テキストデータテーブル421から「カテゴリ」列がNAデータのドキュメントを特定し、配置データテーブル422より対象となるドキュメントの配置データを読み込む(S2001)。案件データ登録テーブル411から対象ドキュメントに該当するレコードを抽出し、「配置パタン」列を参照し、当該列の値に対応する配置パタンテーブル442及び配置ルールテーブル444を読み込む(S2002)。文節ルールが特定されていないテキストボックスを検索し、文節ルールを推定する必要のあるテキストデータナンバー(#)を特定する(S2003)。抽出したオブジェクトの不明なカテゴリを推定するカテゴリ推定処理を行う(S2004)。続いてオブジェクトに入力されたテキストの内容から文節ルールを抽出する文節ルール推定処理を行い(S2005)、仮登録を行う。その際、既に仮登録された文節ルールが存在する場合は、参照回数カウント手段38によって当該文節ルールに該当するレコードの「申請数」列の値を1加算し、「カテゴリ」列も一致している場合は「申請一致数」の値も1加算する(S2006)。
【0047】
続いて、図17に示すステップS1705に示す特性KEY推定処理について、図21に基づいて説明する。テキストデータの「カテゴリ」列にNAデータが格納されているレコードを抽出し、該当するドキュメントの配置データを配置データテーブル422から読み込む(S2101)。該当ドキュメントを指し示す案件データ登録テーブル411のレコードにおける、「配置パタン」列を参照し、対応する配置パタンとテキストボックスの配置情報等を配置パタンテーブル442及び配置ルールテーブル444から読み込む(S2102)。テキストデータテーブル421の「KEY」列がNAデータのレコードを読み込み、当該レコードが示すテキストボックスの位置情報と配置パタンの位置を比較して、配置パタン上の該当するテキストボックスのカテゴリ情報を当該レコードの「KEY」列に登録する(S2103)。カテゴリを仮設定したテキストボックスのテキストから名詞及び名詞句を特性KEYとして抽出する(S2104)。抽出した特性KEYに対して既知の類似性判定処理(例えば特開2007−41721号公報記載のような技術)を行い、既に登録済みの特性KEYに類似語が存在するかを確認する(S2105)。類似語がない場合は特性KEYテーブル432の当該レコードの「類似語」列に「−」を登録し(S2106)、当該特性KEYのカテゴリ(価値or機能)を特定し(S2107)、「カテゴリ」列へ特定したカテゴリを、「登録状況」列へFALSEをそれぞれ登録する(S2109)。類似語がある場合は、類似語に該当する特性KEYを特性KEYテーブル432から抽出し、類似語の特性KEYナンバー(#)を「類似語」列へ、類似語の「カテゴリ」列の値を当該レコードの「カテゴリ」列へ、各々コピーし、当該レコードの「登録状況」列の値をFALSEとして登録する(S2108)。
【0048】
続いて、図17のステップS1706に示す因果関係推定処理について、図22に基づいて説明する。因果関係登録テーブル423に登録されていないテキストボックスデータがあるドキュメントをテキストデータテーブル421から特定し、案件データ登録テーブル411の「配置パタン」列から対応する配置パタンテーブル442を特定する(S2201)。因果関係登録テーブル423に登録されていないテキストボックスデータをテキストデータテーブル421から抽出する(S2202)。配置パタンテーブル442と配置ルールテーブル444からドキュメントに対応する配置パタン及びそれに対応する因果関係を読み込む(S2203)。因果関係の推定処理を行う。具体的には、因果関係が不明なテキストボックスの位置に対応する配置パタン上のテキストボックスを特定し、その配置パタンが持つ配置ルールに従い、特定したテキストボックスと因果関係を有するテキストボックスを検索する。そして、特定した因果関係のあるテキストボックスの位置に相当する登録案件上のテキストボックスを特定し、そこに記載されている特性KEYと因果関係が不明なテキストボックス上の特性KEYを、因果関係のある組み合わせとして推定する。この時、推定されたカテゴリのセット(即ち機能と価値)が因果関係対応テーブル433に既に登録されたレコードとして存在する場合、参照回数カウント手段38によって当該レコードの「申請数」列の値に1を加算する(S2204)。因果関係推定処理は、配置ルールテーブル444において因果関係のあるテキストボックスの組み合わせを抽出し、そのテキストボックスの配置場所を配置パタンテーブル442から抽出し、当該は位置関係を配置データテーブル422と比較し、因果関係が不明なテキストボックス間の対応関係を推定するものである。続いて因果関係対応テーブル433を読み込み(S2205)、推定した因果関係を因果関係対応テーブル433及び因果関係登録テーブル423へ登録する(S2206)。各々のテーブルの「登録状況」列の値はFALSEとする。
【0049】
続いて、図17のステップS1707に示す配置パタン推定処理について、図23に基づいて説明する。案件データ登録テーブル411から「配置パタン」列がNAであるドキュメントを示すレコードを抽出する(S2301)。抽出したドキュメントのテキストボックスの配置情報を配置データテーブル422から読み込む(S2302)。当該ドキュメントのテキストボックスデータをテキストデータテーブル421から読み込む(2303)。当該ドキュメントのテキストボックス配置パタンを新規配置パタンの位置データとして配置データテーブル422のデータを配置パタンテーブル442にコピーし新規登録し、配置パタン管理テーブル441に新規登録した配置パタンの管理情報を新規登録する。更にテキストルールテーブル443に当該配置パタンに存在するテキストボックスの数と同数のレコードを新規登録する。新規登録した何れのテーブルのレコードにおいても、「登録状態」列はFALSEとする(S2304)。当該ドキュメントに関連するテキストデータテーブル421のレコードを参照し、各々のテキストボックスについて「カテゴリ」列に「機能」または「価値」のカテゴリが登録されているかを判別する(S2305)。カテゴリ情報が登録されている場合は、本処理にて新規登録されたテキストルールテーブル443の新規配置パタンを示すレコードの「カテゴリ」列に、同内容のカテゴリをコピーして更新する(S2306)。テキストボックスの有無を判別する(S2307)。新たな配置ルールを作成するために参照する因果関係対応テーブル433を読み込む(S2308)。ステップS2306にて参照されたテキストデータテーブル421のレコードを再度参照し、その「KEY」列に登録された値に基づいて、対応する特性KEYを含むレコードを因果関係対応テーブル433から検索する。また、当該特性KEYが記載されたテキストボックスを特定し、先ほど選択したテキストボックスと特定された対応するテキストボックスを配置ルールテーブル444の「価値」列及び「機能」列に登録する。この時、推定された配置ルールが既に配置ルールテーブル444に登録されている場合は、参照回数カウント手段38によって当該レコードの「評価値」列の値に1を加算する(S2309)。
【0050】
以上の動作を行うテーブル推定機能33により、登録されたドキュメントが既存の文節ルール、特性KEY、因果関係、または配置パタンに存在しない場合は、新しいルールとしてデータベースに追加登録を行うことができる。しかしながら、新しい配置パタンが全て有用であるかは登録された段階では不明である。続いて説明する推定テーブル評価機能34は、テーブル推定処理によって新たに登録された各種テーブル及びレコードについて、これを評価し、実用に耐えうるものか否かを評価するものであり、この機能によって評価されたデータを本登録として実際に使用する。以下、推定テーブル評価機能34の動作について、図23〜30に基づいて説明する。
【0051】
図24は、推定テーブル評価機能34の動作概要を示している。各種テーブルから評価対象(「登録状況」列がFALSEのレコード、及び当該レコードの関連テーブル)であるレコードを抽出する(S2401)。評価対象レコードが存在するか否かを判別し(S2402)。存在する場合は、以下の処理を順次行う。テーブル推定機能33にて仮登録された文節ルールを評価し、登録の可否を検討する文節ルール評価処理(S2403)。仮登録された特性KEYを評価して登録の可否を検討する特性KEY評価処理(S2404)。仮登録された因果関係ルールを評価して登録の可否を検討すると因果関係評価処理(S2405)。仮登録された配置パタンを評価して登録の可否を検討する配置パタン評価処理(S2406)。仮登録された配置ルールを評価して登録の可否を検討する配置ルール評価処理(S2407)。以上の処理を行い、評価対象のレコード全ての評価を終えたら(S2408)、推定テーブル評価機能34の動作を終了する。
【0052】
図24のステップS2401に示す評価テーブル抽出処理について、図25に基づいて説明する。文節ルールテーブル431、特性KEYテーブル432、因果関係対応テーブル433の各々に格納されるレコードの内、「登録状況」列がFALSEのレコードを抽出する(S2501)。抽出したレコードの「#」列(各テーブルにおけるレコードを一意に特定するナンバー)を修正データ登録テーブル434に登録する(S2502)。抽出したレコードを終えるまでステップS2502を繰り返し、全てのレコードの処理を終えた場合(S2503)、修正項目が存在する、即ち配置パタン管理テーブル441の「登録状況」列がFALSEのレコードと、当該レコードに関連付く配置パタンテーブル442を特定する(S2504)。修正対象となる配置パタンが存在するか判別し(S2505)、存在する場合は配置ルールテーブル444から該当配置パタンに関連付くレコードであって「登録状況」列がFALSEのものを抽出する(S2506)。抽出したレコードの「配置パタンナンバー」列を修正データ登録テーブル434に登録する(S2507)。抽出したレコードの登録を終えるまでステップS2507を繰り返し、全てのレコードの処理を終えた場合、(S2508)、修正データ登録テーブル434への登録処理を終えたら、続いて文節ルール評価処理を行う(S2509)。
【0053】
図24のS2403及び図25のS2511に示す文節ルール評価処理について図26に基づいて説明する。評価テーブル抽出処理にて修正データ登録テーブル434に登録されたデータのうち文節ルールナンバーを示すもの(図6に示す修正データ登録テーブル434のレコードの内、「TRd」のプレフィックスを有するレコード)を抽出する(S2601)。抽出した文節ルールナンバーに基づき、仮登録中の文節ルールを文節ルールテーブル431から抽出する(S2602)。後述の文節ルールの評価値の算出処理を行う(S2603)。仮登録から本登録へ変更するための条件が成立したかを判別し(S2604)、成立した場合は当該文節ルールの「登録状態」列をTRUEに更新する(S2605)。ステップS2602にて抽出されたレコードに対してステップS2603〜S2605を繰り返し、全てのレコードに対して処理がなされた場合(S2606)、続いて特性KEY評価処理を行う(S2607)。
【0054】
ステップS2603の文節ルールの評価値の算出処理とは、テーブル推定機能33によって仮登録された文節ルールに対して、情報整理機能32で申請された評価申請件数を文節ルールテーブル431の「申請件数」列に、評価申請の一致度(即ち文節とカテゴリの関係が適切であるとするか否か)を「申請一致度」列に蓄積し、各々が閾値を超えたものに関して本登録を行う処理である。例えばユーザの評価申請件数10件以上、且つ申請一致度90%以上を本登録とするための条件とした場合、100人のユーザが評価申請した場合、文節とカテゴリの一致が適切だとする申請件数が90件以上あって初めて本登録となる。
【0055】
続いて、図24のステップS2404及び図26のステップS2607に示す特性KEY評価処理について、図27に基づいて説明する。文節ルール評価処理と同様、修正データ登録テーブル434に登録されたデータのうち特性KEYナンバーを示すもの(図6に示す修正データ登録テーブル434のレコードの内、「KRd」のプレフィックスを有するレコード)を抽出する(S2701)。抽出した修正データ登録テーブル434の特性KEYナンバーに基づき、特性KEYテーブル432から評価対象レコードを抽出する(S2702)。後述の特性KEYの評価値算出処理を行う(S2703)。仮登録から本登録へ変更するための条件が成立したかを判別し(S2704)、成立した場合は当該特性KEYの「登録状態」列をTRUEに更新する(S2705)。ステップS2702にて抽出されたレコードに対してステップS2703〜S2705を繰り返し、全てのレコードに対して処理がなされた場合(S2706)、続いて因果関係評価処理を行う(S2707)。
【0056】
前述の特性KEYの評価値算出処理とは、テーブル推定機能33によって仮登録された特性KEYに対して、特性KEYテーブル432の「申請件数」列に新規登録した特性KEYの参照件数を蓄積し、この参照件数が閾値を超えたものに関して本登録を行う処理である。例えば、閾値を20件とした場合、当該レコードを述べ20人のユーザが参照した場合、当該レコードは本登録として処理される。
【0057】
続いて、図24のステップS2405及び図27のステップS2707に示す因果関係評価処理について、図28に基づいて説明する。修正データ登録テーブル434に登録されたデータのうち因果関係ナンバーを示すもの(図6に示す修正データ登録テーブル434のレコードの内、「ASs」のプレフィックスを有するレコード)を抽出する(S2801)。抽出した修正データ登録テーブル434の因果関係ナンバーに基づき、因果関係対応テーブル433から評価対象レコードを抽出する(S2802)。後述の因果関係の評価値算出処理を行う(S2803)。仮登録から本登録へ変更するための条件が成立したかを判別し(S2804)、成立した場合は当該因果関係の「登録状態」列をTRUEに更新する(S2805)。ステップS2802にて抽出されたレコードに対してステップS2803〜S2805を繰り返し、全てのレコードに対して処理がなされた場合(S2806)、続いて配置パタン評価処理を行う(S2807)。
【0058】
前述の因果関係の評価値算出処理とは、テーブル推定機能33によって仮登録された因果関係に対して、新規登録された価値と機能の因果関係に関して、因果関係設定処理において登録案件の因果関係設定処理で申請された申請数が納められた因果関係対応テーブル433の「共起数」と、因果関係設定処理においては位置パタンから登録案件上で結び付けられた因果関係の申請数が納められた因果関係対応テーブル433の「申請数」列と、が閾値を超えたものに関して本登録を行う処理である。例えば、共起数の閾値が20、申請数の閾値が25の場合、登録案件で参照された因果関係数が20件、因果関係が不明なテキストボックスの因果関係推定処理で推定された件数が25件、双方の条件を満たしたレコードのみ本登録となる。
【0059】
続いて、図24のステップS2406及び図28のステップS2807に示す配置パタン評価処理について、図29に基づいて説明する。修正データ登録テーブル434に登録されたデータのうち配置パタンナンバーを示すもの(図6に示す修正データ登録テーブル434のレコードの内、「DBs」のプレフィックスを有するレコード)を抽出する(S2901)。抽出した修正データ登録テーブル434の配置パタンナンバーに基づき、配置パタン管理テーブル441から評価対象レコードを抽出する(S2902)。後述の配置パタンの評価値算出処理を行う(S2903)。仮登録から本登録へ変更するための条件が成立したかを判別し(S2904)、成立した場合は当該配置パタンの「登録状態」列をTRUEに更新する(S2905)。ステップS2902にて抽出されたレコードに対してステップS2903〜S2905を繰り返し、全てのレコードに対して処理がなされた場合(S2906)、続いて配置ルール評価処理を行う(S2907)。
【0060】
前述の配置パタンの評価値算出処理とは、テーブル推定機能33によって仮登録された配置パタンに対して、配置パタン設定処理で登録され、且つ配置パタンが参照された件数を納める配置パタン管理テーブル441の「申請数」列と、各種テキストボックスのカテゴリ一致度を示すテキストルールテーブル443の「評価値」に基づいて算出されるものであり、申請数に対する評価値の割合及び申請数の値が閾値を超えたものに関して本登録を行う処理である。例えば、申請数の閾値が20件、評価値/申請数の閾値が80%の場合、当該配置パタンが20件以上参照され、且つその内16件以上がテキストボックスのカテゴリが一致している場合において、本登録となる。
【0061】
続いて、図24のステップS2407及び図29のステップS2907に示す配置ルール評価処理について、図30に基づいて説明する。修正データ登録テーブル434に登録されたデータのうち配置ルールナンバーを示すもの(図6に示す修正データ登録テーブル434のレコードの内、「ASp」のプレフィックスを有するレコード)を抽出する(S3001)。抽出した修正データ登録テーブル434の配置ルールナンバーに基づき、配置ルールテーブル444から評価対象レコードを抽出する(S3002)。後述の配置ルールの評価値算出処理を行う(S3003)。仮登録から本登録へ変更するための条件が成立したかを判別し(S3004)、成立した場合は当該配置ルールの「登録状態」列をTRUEに更新する(S3005)。ステップS3002にて抽出されたレコードに対してステップS3003〜S3005を繰り返し、全てのレコードに対して処理がなされた場合(S3006)、全ての評価処理を終了する。
【0062】
前述の配置ルールの評価値算出処理とは、テーブル推定機能33によって仮登録された配置ルールに対して、配置パタン推定処理で登録され、配置ルールが参照された件数を納める配置ルールテーブル444の「評価値」列が閾値を超えたものに関して本登録を行う処理である。例えば、評価値の閾値が20の場合、配置パタン設定処理で推定された配置ルールを、その後の配置パタン設定処理で参照された件数が20件を超えた場合において、本登録となる。
【0063】
以上のような更新テーブルに対する評価処理を行うことで、仮登録されたデータをユーザが精査し、本登録とすることで、その後行われる推定処理の制度を向上させることが可能となる。
【0064】
続いて、上記のようにして作成されたデータベースの各テーブルに基づいて、ドキュメント作成の際の作成支援を行うドキュメント作成支援処理について、図31〜33に基づいて説明する。
【0065】
ドキュメント作成支援処理は、図8に示すドキュメントの登録処理のステップS813にて作成支援用に登録されたドキュメントに対して、各種データベースに記録されるデータに基づいて添削を行う処理である。ドキュメント作成支援処理の動作概要について、図31に基づいて説明する。最初に、登録されているドキュメントから作成支援の対象となるドキュメントを抽出する(S3101)。ドキュメントが抽出された場合(S3102)、当該ドキュメントからテキストボックスを読み込み、テキスト解析を行う(S3103)。当該処理は情報整理処理におけるデータ抽出処理(図10に示すステップS1003)と同等のものである。抽出したテキストボックスのデータを解析し、カテゴリ分類処理を行う(S3104)。当該処理は情報整理処理におけるカテゴリ分類処理(図10に示すステップS1004)と同等のものである。ドキュメントのテキストボックス配置パタンを作成し、類似する配置パタンを配置パタンテーブル442から検索する(S3105)。当該処理はテーブル推定処理における配置パタン設定処理(図17に示すステップS1707)と同等のものである。差分抽出機能35によって、抽出された類似パタンと、ドキュメントの配置パタンとの差分(配置場所の相違や不足するカテゴリ)を抽出する(S3106)。コメント追加機能36によって、抽出した差分を明示し、当該箇所および内容を指摘するメッセージの追加編集をドキュメントに対して行う(S3107)。上記処理が終了し、ドキュメントの編集が完了したら、メール送信機能37によってそれをドキュメント登録ユーザにメールにて通知し、案件データ登録テーブル411の「実施」列をTRUEに変更する(S3108)。ステップS3103〜ステップS3108を、支援対象のドキュメント分繰り返し(S3109)、全てを終えたらドキュメント作成支援処理を終了する。
【0066】
図31のステップS3101に示す支援案件抽出処理の詳細な動作について、図32に基づいて説明する。案件データ登録テーブル411の「登録形式」列の値が「作成支援」であり、且つ「実施」列がFALSEのレコードを抽出し、当該レコードの「カテゴリ」列を読み込む(S3201)。レコードが存在した場合、読み込んだ「カテゴリ」列に格納された値を基に作成支援用提案書記憶領域52を検索し(S3203)、当該ドキュメントが特定できたら、そのドキュメントに基づいてデータ抽出処理を行う(S3204)。以降、図31に基づいてドキュメントの分析、添削を行う。
【0067】
図33は、上記ドキュメント作成支援処理によって添削が行われたドキュメントの一例である。ドキュメント作成支援システム1に登録する前と比較して、テキストボックスがどのカテゴリかを示す新たなテキストボックスと、コメント追加機能36が作成したメッセージが新たに追加され、これによってドキュメントの登録者は、一瞥してそのドキュメントの問題点を把握し、より分かりやすく正確なドキュメントの作成を行うことができる。
【0068】
以上のようなドキュメント作成支援システム1によれば、過去に作成されたドキュメントの統計データとしてデータベース4を用い、類似するドキュメントを支援対象ドキュメントと比較し、配置パタンにあって支援対象ドキュメントに足りないテキストボックスやカテゴリを自動的に示唆することができるので、ドキュメントの作成スピード向上、記載不備防止を図ることができ、一定のドキュメントの品質を保つことができ、更にデータ再利用の効率化をも図ることができる。
【符号の説明】
【0069】
1 ドキュメント作成支援システム
2 記憶装置
3 プログラム
31 登録機能
32 情報整理機能
33 テーブル推定機能
34 推定テーブル評価機能
35 差分抽出機能
36 コメント追加機能
37 メール送信機能
38 参照回数カウント手段
4 データベース
41 案件全体データベース
42 案件個別データベース
43 カテゴリ情報データベース
44 配置情報データベース
5 提案書記憶領域
51 分析用提案書記憶領域
52 作成支援用提案書記憶領域
6 CPU
7 メインメモリ
8 通信装置
9 出力部
10 入力部
100 クライアント端末
101 通信装置
102 CPU
103 記憶装置
104 メモリ
105 入力部
106 出力部
411 案件データ登録テーブル
412 案件データテーブル
421 テキストデータテーブル
422 配置データテーブル
423 因果関係登録テーブル
431 文節ルールテーブル
432 特性KEYテーブル
433 因果関係対応テーブル
434 修正データ登録テーブル
441 配置パタン管理テーブル
442 配置パタンテーブル
443 テキストルールテーブル
444 配置ルールテーブル

【特許請求の範囲】
【請求項1】
テキストが入力されたテキストボックスが複数配置された文書ファイル(以降ドキュメントと称呼する)を、ネットワーク上のクライアント端末から送信されたドキュメントを登録する登録手段と、
登録されたドキュメントの分析を行う情報整理手段と、
登録されたドキュメントを蓄積するためのドキュメント記憶領域と、
ドキュメントのテキストボックスの配置パタン、テキストボックスに入力されるテキスト、及びテキストを分類するためのカテゴリを蓄積するデータベースと、
該データベースに蓄積される配置パタン、テキスト、カテゴリと、前記情報整理手段によって分析されるドキュメントの配置パタン、テキスト、カテゴリとを比較し、差分を抽出する差分抽出手段と、
該差分抽出手段によって抽出された差分に基づいて、ドキュメントに添削コメントを付与するコメント追加手段と、
を備え、
前記情報整理手段は、ドキュメントを読み込んでテキストボックス毎に情報を抽出するデータ抽出ステップと、抽出したテキストボックスに入力されたテキストデータを所定のカテゴリに分類し前記データベースに登録するカテゴリ分類ステップと、テキストデータを単語及び文節に分解し、キーワードとして抽出して前記データベースに登録するキーワード設定ステップと、配置されたテキストボックス内のキーワードの関連性を検出しテキストボックス同士の因果関係を前記データベースに登録する因果関係設定ステップと、から構成され、
前記登録手段によって前記ドキュメント記憶領域に蓄積されたドキュメントを、前記情報整理手段によって分析し、前記差分抽出手段によって当該分析結果と前記データベースに蓄積される配置パタン、テキスト、カテゴリとを比較し、不足するカテゴリ及びテキストボックスを特定してこれを報知するためのコメントを前記コメント追加機能によって付与して前記ドキュメント記憶領域に保存することを特徴とするドキュメント作成支援システム。
【請求項2】
メール送信手段を備え、
登録されたドキュメントに対するコメントの付与が完了した際、当該ドキュメントを登録したユーザに当該ドキュメントを電子メールにて送信することを特徴とする請求項1記載のドキュメント作成支援システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate


【公開番号】特開2011−123623(P2011−123623A)
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願番号】特願2009−279844(P2009−279844)
【出願日】平成21年12月9日(2009.12.9)
【出願人】(000233491)日立電子サービス株式会社 (394)
【Fターム(参考)】