文書データ処理装置、文書データ処理方法および文書データ処理プログラム
【課題】文書データの種別に応じて当該文書データの記述の不適切箇所の解析を適切に行なう。
【解決手段】ユーザ端末2を操作して解析対象の文書データの種別を選択して、この種別の情報を解析対象の文書データとともにサーバ装置1に送信する。サーバ装置1の通信インタフェース14がユーザ端末2からの情報を入力すると、文書データ解析部13は、記憶装置12内の定義情報記憶部21に記憶される解析方式テーブルを読出し、このテーブルから入力済みの文書データ種別と関連付けられるチェックモジュール名を含む各種情報を検索する。文書データ解析部13は、この検索したチェックモジュール名に対応するモジュールを実行して入力済み文書データの記述の不適切箇所の有無を解析し、この結果不適切箇所が存在する場合には、これを示す情報をユーザ端末2に出力して表示させる。
【解決手段】ユーザ端末2を操作して解析対象の文書データの種別を選択して、この種別の情報を解析対象の文書データとともにサーバ装置1に送信する。サーバ装置1の通信インタフェース14がユーザ端末2からの情報を入力すると、文書データ解析部13は、記憶装置12内の定義情報記憶部21に記憶される解析方式テーブルを読出し、このテーブルから入力済みの文書データ種別と関連付けられるチェックモジュール名を含む各種情報を検索する。文書データ解析部13は、この検索したチェックモジュール名に対応するモジュールを実行して入力済み文書データの記述の不適切箇所の有無を解析し、この結果不適切箇所が存在する場合には、これを示す情報をユーザ端末2に出力して表示させる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データの解析を行なう文書データ処理装置、文書データ処理方法および文書データ処理プログラムに関する。
【背景技術】
【0002】
従来、文書データ処理装置には、例えば特許文献1および特許文献2に開示されるように、文書データを入力した後で単語辞書やチェック規則を参照することで文書データ中の記述の不適切箇所を抽出して出力するものがある。
【特許文献1】特開平8−221421号公報
【特許文献2】特開2000−235573号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
前述したように、文書データ処理装置が文書データを解析して記述の不適切箇所を抽出する場合に参照するチェック規則は単一のものであった。しかし、文書データの種別が例えば議事録である場合と報告書である場合とでは、文書の種別が議事録と報告書とで異なってしまうために適切なチェック規則が異なる。
【0004】
この場合に、文書データ処理装置は、例えば文書データの種別などに応じた不適切箇所の解析を行なう場合には、文書データの種別が変わるたびにチェック規則を更新しなければならず、不便である。
【0005】
そこで、本発明の目的は、文書データの種別に応じて当該文書データの記述の不適切箇所の解析を適切に行なうことが可能になる文書データ処理装置、文書データ処理方法および文書データ処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
すなわち、本発明に係わる文書データ処理装置は、文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶しておき、この解析方式情報のうち、入力した文書データの種別と関連付けられる解析方式情報を検索し、この検索した解析方式情報にしたがって入力文書データの記述の不適切箇所の解析を行なうことを特徴とする。
【発明の効果】
【0007】
本発明に係わる文書データ処理装置では、文書データの種別に応じて当該文書データの記述の不適切箇所の適切な解析を行なうことができる。
【発明を実施するための最良の形態】
【0008】
以下図面により本発明の実施形態について説明する。
図1は、本発明の実施形態にしたがった文書データ処理システムのサーバ装置の構成例を示すブロック図である。
【0009】
この文書データ処理システムは、文書データを当該文書データの種別に応じた方式で解析して、文書データの記述が適切であるか否かを判別するものである。
図1に示すように、本発明の実施形態にしたがった文書データ処理システムはサーバ装置1、ユーザ端末2および管理者端末3でなる。
【0010】
サーバ装置1は装置全体の処理を司る制御部11、記憶装置12、文書データ解析部13および通信インタフェース14を備え、それぞれがバス15を介して相互に接続される。
【0011】
記憶装置12は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。記憶装置12は制御部11による実行対象の制御プログラムを記憶するのに加え、定義情報記憶部21および辞書データ記憶部22を備える。定義情報記憶部21や辞書データ記憶部22に記憶される情報については後述する。また、記憶装置12は制御部11による各種処理のワークメモリとしても機能する。
【0012】
文書データ解析部13は、長文指摘モジュール31、形態素解析モジュール32、文体チェックモジュール33、項目抽出モジュール34および宛先チェックモジュール35を備える。これらのモジュールはアプリケーションプログラムで構成される。
【0013】
長文指摘モジュール31は、文書データ中の文の長さが指定された文字数を越えているか否かを判別する。形態素解析モジュール32は文書データの形態素解析を行なう。
文体チェックモジュール33は、文書データ中の記述の文末が「です、ます」体あるいは「である」体などの単一の文体で統一されているか否かを判別する。項目抽出モジュール34は、文書データ中の記述の予め定められた項目を抽出する。宛先チェックモジュール35は、文書データ中の記述の宛先である「様」や「御中」の使い方が適切であるかを判別したり宛先の名称の表記が適切か否かを判別したりする。
【0014】
文書データ解析部13は、これらのモジュールを実行することで文書データの記述の不適切箇所の解析を行なう。通信インタフェース14はユーザ端末2および管理者端末3との間での通信処理を行なう。
【0015】
図2は、本発明の実施形態にしたがった文書データ処理システムのユーザ端末の構成例を示すブロック図である。
図2に示すように、ユーザ端末2は文書データを作成するユーザが取り扱う端末装置である。ユーザ端末2は装置全体の処理を司る制御部41、記憶装置42、入力装置43、表示装置44および通信インタフェース45を備え、それぞれがバス46を介して相互に接続される。
【0016】
制御部41は書式情報付加部51および解析結果付加部52を備える。書式情報付加部51は解析対象の文書データに予め定められた広義の書式情報を付加する。この実施例では広義の書式情報とは位置情報および狭義の書式情報でなる。位置情報とは文書データ中の文の行番号である。この位置情報はパラグラフ番号やページ番号であってもよい。また、狭義の書式情報とは文書データ中の文が中央揃えや左揃えであるかを示したりフォント種類やフォントサイズを示したりする情報である。
解析結果付加部52は、解析対象の文書データにサーバ装置1による当該文書データの解析結果を付加する。
【0017】
記憶装置42は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。また、記憶装置42は制御部41による実行対象の制御プログラムを記憶しており、制御部41による各種処理のワークメモリとしても機能する。
【0018】
入力装置43は例えばキーボードやマウスであり、文書データの新規作成にかかる操作を受け付ける。表示装置44はディスプレイ装置である。通信インタフェース45はサーバ装置1との間での通信処理を行なう。また、通信インタフェース45は図示しない外部記憶装置とケーブルを介して接続可能であり、この外部記憶装置との間で文書データを入出力することもできる。
【0019】
図3は、本発明の実施形態にしたがった文書データ処理システムの管理者端末の構成例を示すブロック図である。
図3に示すように、管理者端末3はサーバ装置1の管理者が取り扱う端末装置である。管理者端末3は装置全体の処理を司る制御部61、記憶装置62、入力装置63、表示装置64および通信インタフェース65を備え、それぞれがバス66を介して相互に接続される。
【0020】
記憶装置62は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。記憶装置62は制御部61による実行対象の制御プログラムを記憶しており、制御部61による各種処理のワークメモリとしても機能する。
【0021】
入力装置63は例えばキーボードやマウスであり、サーバ装置1の記憶装置12に記憶される各種情報の更新にかかる操作を受け付ける。表示装置64はディスプレイ装置である。通信インタフェース65はサーバ装置1との間での通信処理を行なう。
【0022】
次に、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される情報について説明する。図4は、本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される文書種別テーブルの構成例を表形式で示す図である。
【0023】
この文書種別テーブルは、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される情報であり、ユーザ端末2を取り扱うユーザ名および文書データ種別が関連付けられて管理される。図4に示すように文書データ種別は議事録、報告書および紹介状などである。
【0024】
図5は、本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される解析方式テーブルの構成例を表形式で示す図である。
この解析方式テーブルは、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される情報であり、文書データ種別、チェックモジュール名、順位、パラメータ、入力データおよび出力データが関連付けられて管理される。
【0025】
解析方式テーブルで管理される「チェックモジュール名」とは、これと当該テーブル上で関連付けられる文書データ種別に対応する文書データの記述の不適切箇所を文書データ解析部13が解析する場合に実行するモジュールの名称である。前述した「順位」とは、これと解析方式テーブル上で同一の文書データ種別と関連付けられる複数のチェックモジュール名に対応するモジュールの文書データ解析部13による実行順位である。
【0026】
また、解析方式テーブルで管理される「パラメータ」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行した場合に、解析対象の文書データの記述の不適切箇所の解析に必要な情報である。
【0027】
例えば図5に示した解析方式テーブル上のパラメータの項目で管理される文字数の情報や各種辞書データ名に対応する辞書データの情報はサーバ装置1の記憶装置12に記憶される情報であり、特に辞書データは辞書データ記憶部22に記憶される情報である。
【0028】
また、解析方式テーブルで管理される「入力データ」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行する前に入力するデータの種別である。
【0029】
解析方式テーブルで管理される「出力データ」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行した後のデータの種別である。
【0030】
例えば図5に示したテーブル上で管理される「書式情報付テキスト」は、ユーザ端末2からの文書データにサーバ装置1の書式情報付加部51により書式情報が付加された文書データである。
【0031】
また、図5に示したテーブル上の「品詞情報付テキスト」は書式情報付テキストに品詞情報を付加したものであり、「項目情報付テキスト」は品詞情報付テキストに項目情報を付加したものである。項目情報は例えば宛先、差出人および日付のいずれかである。
【0032】
図5に示したテーブル上の「チェック結果」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行することで得られる不適切箇所を示すデータである。
【0033】
次に、図1に示した構成の文書データ処理システムの動作について説明する。図6は、本発明の実施形態にしたがった文書データ処理システムの処理動作の一例を示すフローチャートである。ここでは、解析対象の文書データはユーザ端末2の記憶装置42に予め記憶されていると仮定する。
【0034】
まず、ユーザがユーザ端末2の入力装置43に対する予め定められた操作を行なうと、制御部41は、ユーザ端末2の動作モードを文書データ解析モードに切り替え、ユーザ名入力画面G1を表示装置44に表示させる。
【0035】
図7は、本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示されるユーザ名入力画面の一例を示す図である。
この画面G1にしたがって、入力装置43がユーザ名入力画面G1のフォーム71内へのユーザ名の入力を受け付けて、画面上のOKアイコン72が選択されると(ステップS1)、制御部41はこの入力されたユーザ名の情報を通信インタフェース45を介してサーバ装置1に出力する。
【0036】
サーバ装置1の通信インタフェース14がユーザ端末2からのユーザ名の情報を入力すると、制御部11はこのユーザ名と記憶装置12内の定義情報記憶部21に記憶される文書種別テーブルを読出し、前述したユーザ名と文書種別テーブル上で関連付けられる文書データ種別の情報を検索して、この情報を通信インタフェース14を介してユーザ端末2に出力する。ここではユーザ名を入力項目としているが、「ユーザID」を入力項目として扱っても問題ないことは言うまでもない。この場合には、図4の文書種別テーブルのユーザ名はユーザIDに置き換わることも言うまでもない。
【0037】
例えば制御部11はユーザ端末2で入力されたユーザ名が「CCC」であって検索対象の文書種別テーブルが図4に示したテーブルである場合には、このテーブル上のユーザ名である「CCC」と関連付けられる文章データ種別である「議事録」および「紹介状」を検索する。
【0038】
ユーザ端末2の通信インタフェース45がサーバ装置1からの文書データ種別の情報を入力すると、制御部41はこの文書データ種別の情報を含む文書種別選択画面G2を表示装置44に表示させる。
【0039】
図8は、本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示される文書種別選択画面G2の一例を示す図である。
この画面G2にしたがった入力装置43への操作により、文書種別選択画面G2上の文書データ種別に対応するチェックボックスが有効となって、画面上のOKアイコン73が選択され(ステップS2)、入力装置43へのさらなる操作により、解析対象の文書データが選択されて、制御部41が選択済みの文書データを記憶装置12から入力すると(ステップS3)、書式情報付加部51は入力済みの文書データの各文に前述した広義の書式情報を付加した書式情報付きテキストを生成する。
【0040】
図9は、本発明の実施形態にしたがった文書データ処理システムにステップS3の処理で入力された文書データに書式情報を付加した例を表形式で示す図である。
制御部41は、書式情報付テキストを前述したように有効となったチェックボックスに対応する文書データ種別の情報とともに通信インタフェース45を介してサーバ装置1に出力する。
【0041】
サーバ装置1の通信インタフェース14を介してユーザ端末2からの書式情報付テキストおよび文書データ種別の情報が入力されると、制御部11は、これらを取得して記憶装置12に記憶する(ステップS4)。すると、文書データ解析部13は、記憶装置12内の定義情報記憶部21に記憶される解析方式テーブルを読出し、記憶装置12に記憶される文書データ種別と関連付けられるチェックモジュール名を含む各種情報を解析方式テーブルから検索する(ステップS5)。
【0042】
例えば文書データ解析部13は、入力済みの文書データ種別が「議事録」であって検索対象の解析方式テーブルが図5に示したテーブルである場合には、このテーブル上の「議事録」と関連付けられるチェックモジュール名である「長文指摘」、「形態素解析」、「文体チェック」、「項目抽出」および「宛先チェック」ならびにこれとテーブル上で関連付けられる順位などの各種情報を検索し、検索済みのチェックモジュール名に対応するモジュールを実行して文書データの解析を行なう(ステップS6)。
【0043】
具体的には、まず文書データ解析部13は順位が最先の「10」である長文指摘モジュール31を実行し、記憶装置12に記憶されている書式情報付テキスト中の句点から句点までの文字数を計算し、この文字数が前述したように検索したチェックモジュール名である「長文指摘」と解析方式テーブル上で関連付けられるパラメータで示される文字数を超えるか否かを判別する。
【0044】
このパラメータが図5に示したように「80文字」である場合には、文書データ解析部13は書式情報付テキスト中の句点から句点までの記述のうち80文字を超える記述があれば、この記述の位置情報、指摘対象情報およびコメントとともに長文チェック箇所の情報として記憶装置12に保存する。指摘対象情報とは、書式情報付テキスト中の記述のうち不適切箇所に該当する記述を示す。コメントとは指摘対象が不適切な理由や、修正方法に対する示唆などを示すメッセージである。
ここでは位置情報は10行目を示す「10」となり、指摘対象情報は「文の長さ」となり、コメントは「文の長さが80文字を超えています。」となる。
【0045】
そして、文書データ解析部13は順位が「20」である形態素解析モジュール32を実行し、辞書データ記憶部22に記憶される形態素解析用辞書データにしたがって記憶装置12に記憶されている書式情報付テキスト中の記述に対する形態素解析を行なって、品詞情報付テキストを生成する。
【0046】
図10は、本発明の実施形態にしたがった文書データ処理システムにステップS3の処理で入力された文書データの形態素解析結果の例を表形式で示す図である。
図10に示すように、形態素解析結果では図9に示した書式情報付テキストと比較して文書データ中の単語に品詞情報が付加されている。
【0047】
そして、文書データ解析部13は順位が「30」である文体チェックモジュール33を実行し、辞書データ記憶部22に記憶される文体辞書データにしたがって前述した品詞情報付テキスト中の文末が「である」体に統一されているか否かを判別する。文書データ解析部13は品詞情報付テキスト中の文末に「である」体と異なる記述があれば、この記述の位置情報、指摘対象情報およびコメントとともに文体チェック箇所の情報として記憶装置12に保存する。ここでは位置情報は14行目を示す「14」となり、指摘対象情報は文中の「……です。」となり、コメントは「文体が統一されていません。」となる。
【0048】
文書データ解析部13は順位が「40」である項目抽出モジュール34を実行し、辞書データ記憶部22に記憶される項目抽出用辞書データにしたがって前述した品詞情報付テキスト中の冒頭の左揃えの単語を宛先に該当する記述として抽出して、項目情報付テキストを生成する。
【0049】
図11は、本発明の実施形態にしたがった文書データ処理システムが入力した文書データに項目情報を付加した例を表形式で示す図である。
図11に示すように、形態素解析結果では図10に示した品詞情報付テキストと比較して項目情報が付加されている。
【0050】
そして、文書データ解析部13は順位が最後「50」である宛先チェックモジュール35を実行し、辞書データ記憶部22に記憶される宛先辞書データにしたがって前述した項目情報付テキスト中の項目情報「宛先」の記述が適切であるか否かを判別する。ここでは文書データ解析部13は項目情報付テキスト中の宛先の記述のうち不適切な記述があれば、この記述を位置情報とともに宛先チェック箇所の情報として記憶装置12に保存する。ここでは位置情報は1行目を示す「1」となり、指摘対象情報は文中の宛先である「殿」となり、コメントは「宛先には「様」が適切です。」となる。
制御部11は、文書データ解析部13による解析により記憶装置12に記憶されたチェック結果の情報を通信インタフェース14を介してユーザ端末2に出力する。
【0051】
図12は、本発明の実施形態にしたがった文書データ処理システムによる文書データ解析結果の一例を表形式で示す図である。
図12に示すように、この解析結果では、文書データ解析部13による解析により得られた長文チェック箇所、文体チェック箇所および宛先チェック箇所の情報における前述した位置情報、指摘対象およびコメントが関連付けられる。
【0052】
ユーザ端末2の通信インタフェース45がサーバ装置1からのチェック結果の情報を入力すると、制御部41はこの情報を記憶装置42に記憶し、記憶装置42に記憶されている解析対象の文書データを読み出す。すると、解析結果付加部52は解析対象の文書データにサーバ装置1からのチェック結果を付加したチェック結果付文書データを生成する。制御部41は、このチェック結果付文書データを表示装置44に表示させる(ステップS7)。これにより、ユーザは図12に示したような形式のチェック結果が付加された文書データを確認することができる。
【0053】
以上のように、本発明の実施形態にしたがった文書データ処理システムでは、記述の適切性の解析対象の文書データの種別に応じて解析方式を検索し、この検索した方式に応じて、文書データの記述が適切であるか否かを判別するので、文書データの種別に応じて当該文書データの記述の不適切箇所の解析を適切に行なうことができる。
【0054】
この実施形態にしたがった文書データ処理システムでは、サーバ装置1の記憶装置12の記憶される各種情報を管理者端末3を用いて更新することができる。
例えばサーバ装置1の管理者が管理者端末3の入力装置63に対する予め定められた操作を行なって、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される文書種別テーブルや解析方式テーブルで管理される情報や辞書データ記憶部22に記憶される辞書データの一部の変更、削除および追加のうち少なくとも一種類の更新を指示すると、制御部61は指示内容を示す情報を通信インタフェース65を介してサーバ装置1に出力する。サーバ装置1の通信インタフェース14が管理者端末3からの指示内容を示す情報を入力すると、制御部11は、この指示内容にしたがってサーバ装置1の記憶装置12の定義情報記憶部21に記憶される各種情報を更新する。
【0055】
例えば、文体チェックモジュール33が使用する文体辞書データの内容を修正することにより、チェック方式を「である」体の統一性のチェックから「です、ます」体の統一性のチェックに変更することができる。
【0056】
同様に、図5に示した解析方式テーブルで管理される文書データ種別である「議事録」と関連付けられるチェックモジュール名「長文指摘」と対応するパラメータ「80文字」を「60文字」に変更することにより、議事録の長文指摘の基準となる文字数を変更することができる。
【0057】
また、図5に示した解析方式テーブルで管理される文書データ種別である「議事録」と関連付けられるチェックモジュール名「長文指摘」を削除することにより、議事録のチェックの際に長文指摘を行なわないようにすることができる。
【0058】
また、例えば議事録のチェックの際に、一般的でない略語の使用の有無のチェックも行ないたい場合は、略語リストデータを記憶装置12に記憶した上で、略語チェック用のモジュールを文書データ解析部13に新たに備え、図5に示した解析方式テーブルで管理される文書データ種別である「議事録」に例えばチェックモジュール名「略語チェック」、順位「15」、パラメータ「略語リスト」、入力データ「書式情報付テキスト」および出力データ「チェック結果」を関連付けて管理した上で文書データの解析を行なえばよい。
【0059】
なお、本実施形態では、サーバ装置1、ユーザ端末2および管理者端末3でなる文書データ処理システムを用いて文書データの解析を行なうと説明したが、これらのサーバ装置1、ユーザ端末2および管理者端末3の機能を全て有する単一の装置を用いて文書データの解析を行なってもよい。
【0060】
また、本実施形態では、チェック結果では位置情報、指摘対象およびコメントで構成されると説明したが、これに限らず、例えば指摘対象に対する修正候補を含ませてもよい。
また、文書データ解析部13は、項目抽出モジュール34を実行した場合に、文書データ中の宛先を抽出すると説明したが、これに限らず、例えば差出人抽出用の項目抽出用辞書データをサーバ装置1の辞書データ記憶部22に記憶させて、この項目抽出用辞書データに対応するパラメータを解析方式テーブル上で管理した上で、項目抽出モジュール34を実行することで文書データ中の差出人を抽出するようにすることもできる。
【0061】
また、本実施形態では、文書データ解析部13が実行する新たなモジュールを設けた上で解析方式テーブルを更新する際には、データの入出力を考慮してモジュール間の制約が満たされているか否かを確認することができる。たとえば、入力データが「品詞情報付テキスト」である新たなモジュールに関する情報を解析方式テーブル上の「議事録」に関連付けて追加した場合で、入力データである品詞情報付テキストの生成に必要な形態素解析モジュール32に対応するチェックモジュール名が解析方式テーブル上の「議事録」に関連付けられていない場合には、制御部11はこの「議事録」に形態素解析モジュール32に対応するチェックモジュール名、順位、派ラメータ、入力データおよび出力データの情報を解析方式テーブル上に追加する。
【0062】
この実施例においては、解析方式テーブル上で各モジュールの実行順位を管理すると説明したが、入力データが他のモジュールの実行にしたがった出力データとなっている場合の依存関係のみを管理する構成とした上で、依存関係のない各種モジュールをランダムに実行する構成としてもよい。
【0063】
なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【図面の簡単な説明】
【0064】
【図1】本発明の実施形態にしたがった文書データ処理システムのサーバ装置の構成例を示すブロック図。
【図2】本発明の実施形態にしたがった文書データ処理システムのユーザ端末の構成例を示すブロック図。
【図3】本発明の実施形態にしたがった文書データ処理システムの管理者端末の構成例を示すブロック図。
【図4】本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される文書種別テーブルの構成例を表形式で示す図。
【図5】本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される解析方式テーブルの構成例を表形式で示す図。
【図6】本発明の実施形態にしたがった文書データ処理システムの処理動作の一例を示すフローチャート。
【図7】本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示されるユーザ名入力画面の一例を示す図。
【図8】本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示される文書種別選択画面の一例を示す図。
【図9】本発明の実施形態にしたがった文書データ処理システムが入力した文書データに書式情報を付加した例を表形式で示す図。
【図10】本発明の実施形態にしたがった文書データ処理システムが入力した文書データの形態素解析結果の例を表形式で示す図。
【図11】本発明の実施形態にしたがった文書データ処理システムが入力した文書データに項目情報を付加した例を表形式で示す図。
【図12】本発明の実施形態にしたがった文書データ処理システムによる文書データ解析結果の一例を表形式で示す図。
【符号の説明】
【0065】
1…サーバ装置、2…ユーザ端末、3…管理者端末、11,41,61…制御部、12,42,2…記憶装置、13…文書データ解析部、14,45,65…通信インタフェース、15,46,66…バス、21…定義情報記憶部、22…辞書データ記憶部、31…長文指摘モジュール、32…形態素解析モジュール、33…文体チェックモジュール、34…項目抽出モジュール、35…宛先チェックモジュール、43,63…入力装置、44,64…表示装置、51…書式情報付加部、52…処理結果付加部。
【技術分野】
【0001】
本発明は、文書データの解析を行なう文書データ処理装置、文書データ処理方法および文書データ処理プログラムに関する。
【背景技術】
【0002】
従来、文書データ処理装置には、例えば特許文献1および特許文献2に開示されるように、文書データを入力した後で単語辞書やチェック規則を参照することで文書データ中の記述の不適切箇所を抽出して出力するものがある。
【特許文献1】特開平8−221421号公報
【特許文献2】特開2000−235573号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
前述したように、文書データ処理装置が文書データを解析して記述の不適切箇所を抽出する場合に参照するチェック規則は単一のものであった。しかし、文書データの種別が例えば議事録である場合と報告書である場合とでは、文書の種別が議事録と報告書とで異なってしまうために適切なチェック規則が異なる。
【0004】
この場合に、文書データ処理装置は、例えば文書データの種別などに応じた不適切箇所の解析を行なう場合には、文書データの種別が変わるたびにチェック規則を更新しなければならず、不便である。
【0005】
そこで、本発明の目的は、文書データの種別に応じて当該文書データの記述の不適切箇所の解析を適切に行なうことが可能になる文書データ処理装置、文書データ処理方法および文書データ処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
すなわち、本発明に係わる文書データ処理装置は、文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶しておき、この解析方式情報のうち、入力した文書データの種別と関連付けられる解析方式情報を検索し、この検索した解析方式情報にしたがって入力文書データの記述の不適切箇所の解析を行なうことを特徴とする。
【発明の効果】
【0007】
本発明に係わる文書データ処理装置では、文書データの種別に応じて当該文書データの記述の不適切箇所の適切な解析を行なうことができる。
【発明を実施するための最良の形態】
【0008】
以下図面により本発明の実施形態について説明する。
図1は、本発明の実施形態にしたがった文書データ処理システムのサーバ装置の構成例を示すブロック図である。
【0009】
この文書データ処理システムは、文書データを当該文書データの種別に応じた方式で解析して、文書データの記述が適切であるか否かを判別するものである。
図1に示すように、本発明の実施形態にしたがった文書データ処理システムはサーバ装置1、ユーザ端末2および管理者端末3でなる。
【0010】
サーバ装置1は装置全体の処理を司る制御部11、記憶装置12、文書データ解析部13および通信インタフェース14を備え、それぞれがバス15を介して相互に接続される。
【0011】
記憶装置12は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。記憶装置12は制御部11による実行対象の制御プログラムを記憶するのに加え、定義情報記憶部21および辞書データ記憶部22を備える。定義情報記憶部21や辞書データ記憶部22に記憶される情報については後述する。また、記憶装置12は制御部11による各種処理のワークメモリとしても機能する。
【0012】
文書データ解析部13は、長文指摘モジュール31、形態素解析モジュール32、文体チェックモジュール33、項目抽出モジュール34および宛先チェックモジュール35を備える。これらのモジュールはアプリケーションプログラムで構成される。
【0013】
長文指摘モジュール31は、文書データ中の文の長さが指定された文字数を越えているか否かを判別する。形態素解析モジュール32は文書データの形態素解析を行なう。
文体チェックモジュール33は、文書データ中の記述の文末が「です、ます」体あるいは「である」体などの単一の文体で統一されているか否かを判別する。項目抽出モジュール34は、文書データ中の記述の予め定められた項目を抽出する。宛先チェックモジュール35は、文書データ中の記述の宛先である「様」や「御中」の使い方が適切であるかを判別したり宛先の名称の表記が適切か否かを判別したりする。
【0014】
文書データ解析部13は、これらのモジュールを実行することで文書データの記述の不適切箇所の解析を行なう。通信インタフェース14はユーザ端末2および管理者端末3との間での通信処理を行なう。
【0015】
図2は、本発明の実施形態にしたがった文書データ処理システムのユーザ端末の構成例を示すブロック図である。
図2に示すように、ユーザ端末2は文書データを作成するユーザが取り扱う端末装置である。ユーザ端末2は装置全体の処理を司る制御部41、記憶装置42、入力装置43、表示装置44および通信インタフェース45を備え、それぞれがバス46を介して相互に接続される。
【0016】
制御部41は書式情報付加部51および解析結果付加部52を備える。書式情報付加部51は解析対象の文書データに予め定められた広義の書式情報を付加する。この実施例では広義の書式情報とは位置情報および狭義の書式情報でなる。位置情報とは文書データ中の文の行番号である。この位置情報はパラグラフ番号やページ番号であってもよい。また、狭義の書式情報とは文書データ中の文が中央揃えや左揃えであるかを示したりフォント種類やフォントサイズを示したりする情報である。
解析結果付加部52は、解析対象の文書データにサーバ装置1による当該文書データの解析結果を付加する。
【0017】
記憶装置42は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。また、記憶装置42は制御部41による実行対象の制御プログラムを記憶しており、制御部41による各種処理のワークメモリとしても機能する。
【0018】
入力装置43は例えばキーボードやマウスであり、文書データの新規作成にかかる操作を受け付ける。表示装置44はディスプレイ装置である。通信インタフェース45はサーバ装置1との間での通信処理を行なう。また、通信インタフェース45は図示しない外部記憶装置とケーブルを介して接続可能であり、この外部記憶装置との間で文書データを入出力することもできる。
【0019】
図3は、本発明の実施形態にしたがった文書データ処理システムの管理者端末の構成例を示すブロック図である。
図3に示すように、管理者端末3はサーバ装置1の管理者が取り扱う端末装置である。管理者端末3は装置全体の処理を司る制御部61、記憶装置62、入力装置63、表示装置64および通信インタフェース65を備え、それぞれがバス66を介して相互に接続される。
【0020】
記憶装置62は例えばハ−ドディスクドライブや不揮発性メモリ装置などのハードウェアで構成される。記憶装置62は制御部61による実行対象の制御プログラムを記憶しており、制御部61による各種処理のワークメモリとしても機能する。
【0021】
入力装置63は例えばキーボードやマウスであり、サーバ装置1の記憶装置12に記憶される各種情報の更新にかかる操作を受け付ける。表示装置64はディスプレイ装置である。通信インタフェース65はサーバ装置1との間での通信処理を行なう。
【0022】
次に、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される情報について説明する。図4は、本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される文書種別テーブルの構成例を表形式で示す図である。
【0023】
この文書種別テーブルは、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される情報であり、ユーザ端末2を取り扱うユーザ名および文書データ種別が関連付けられて管理される。図4に示すように文書データ種別は議事録、報告書および紹介状などである。
【0024】
図5は、本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される解析方式テーブルの構成例を表形式で示す図である。
この解析方式テーブルは、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される情報であり、文書データ種別、チェックモジュール名、順位、パラメータ、入力データおよび出力データが関連付けられて管理される。
【0025】
解析方式テーブルで管理される「チェックモジュール名」とは、これと当該テーブル上で関連付けられる文書データ種別に対応する文書データの記述の不適切箇所を文書データ解析部13が解析する場合に実行するモジュールの名称である。前述した「順位」とは、これと解析方式テーブル上で同一の文書データ種別と関連付けられる複数のチェックモジュール名に対応するモジュールの文書データ解析部13による実行順位である。
【0026】
また、解析方式テーブルで管理される「パラメータ」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行した場合に、解析対象の文書データの記述の不適切箇所の解析に必要な情報である。
【0027】
例えば図5に示した解析方式テーブル上のパラメータの項目で管理される文字数の情報や各種辞書データ名に対応する辞書データの情報はサーバ装置1の記憶装置12に記憶される情報であり、特に辞書データは辞書データ記憶部22に記憶される情報である。
【0028】
また、解析方式テーブルで管理される「入力データ」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行する前に入力するデータの種別である。
【0029】
解析方式テーブルで管理される「出力データ」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行した後のデータの種別である。
【0030】
例えば図5に示したテーブル上で管理される「書式情報付テキスト」は、ユーザ端末2からの文書データにサーバ装置1の書式情報付加部51により書式情報が付加された文書データである。
【0031】
また、図5に示したテーブル上の「品詞情報付テキスト」は書式情報付テキストに品詞情報を付加したものであり、「項目情報付テキスト」は品詞情報付テキストに項目情報を付加したものである。項目情報は例えば宛先、差出人および日付のいずれかである。
【0032】
図5に示したテーブル上の「チェック結果」とは、これと当該テーブル上で関連付けられるチェックモジュール名に対応するモジュールを文書データ解析部13が実行することで得られる不適切箇所を示すデータである。
【0033】
次に、図1に示した構成の文書データ処理システムの動作について説明する。図6は、本発明の実施形態にしたがった文書データ処理システムの処理動作の一例を示すフローチャートである。ここでは、解析対象の文書データはユーザ端末2の記憶装置42に予め記憶されていると仮定する。
【0034】
まず、ユーザがユーザ端末2の入力装置43に対する予め定められた操作を行なうと、制御部41は、ユーザ端末2の動作モードを文書データ解析モードに切り替え、ユーザ名入力画面G1を表示装置44に表示させる。
【0035】
図7は、本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示されるユーザ名入力画面の一例を示す図である。
この画面G1にしたがって、入力装置43がユーザ名入力画面G1のフォーム71内へのユーザ名の入力を受け付けて、画面上のOKアイコン72が選択されると(ステップS1)、制御部41はこの入力されたユーザ名の情報を通信インタフェース45を介してサーバ装置1に出力する。
【0036】
サーバ装置1の通信インタフェース14がユーザ端末2からのユーザ名の情報を入力すると、制御部11はこのユーザ名と記憶装置12内の定義情報記憶部21に記憶される文書種別テーブルを読出し、前述したユーザ名と文書種別テーブル上で関連付けられる文書データ種別の情報を検索して、この情報を通信インタフェース14を介してユーザ端末2に出力する。ここではユーザ名を入力項目としているが、「ユーザID」を入力項目として扱っても問題ないことは言うまでもない。この場合には、図4の文書種別テーブルのユーザ名はユーザIDに置き換わることも言うまでもない。
【0037】
例えば制御部11はユーザ端末2で入力されたユーザ名が「CCC」であって検索対象の文書種別テーブルが図4に示したテーブルである場合には、このテーブル上のユーザ名である「CCC」と関連付けられる文章データ種別である「議事録」および「紹介状」を検索する。
【0038】
ユーザ端末2の通信インタフェース45がサーバ装置1からの文書データ種別の情報を入力すると、制御部41はこの文書データ種別の情報を含む文書種別選択画面G2を表示装置44に表示させる。
【0039】
図8は、本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示される文書種別選択画面G2の一例を示す図である。
この画面G2にしたがった入力装置43への操作により、文書種別選択画面G2上の文書データ種別に対応するチェックボックスが有効となって、画面上のOKアイコン73が選択され(ステップS2)、入力装置43へのさらなる操作により、解析対象の文書データが選択されて、制御部41が選択済みの文書データを記憶装置12から入力すると(ステップS3)、書式情報付加部51は入力済みの文書データの各文に前述した広義の書式情報を付加した書式情報付きテキストを生成する。
【0040】
図9は、本発明の実施形態にしたがった文書データ処理システムにステップS3の処理で入力された文書データに書式情報を付加した例を表形式で示す図である。
制御部41は、書式情報付テキストを前述したように有効となったチェックボックスに対応する文書データ種別の情報とともに通信インタフェース45を介してサーバ装置1に出力する。
【0041】
サーバ装置1の通信インタフェース14を介してユーザ端末2からの書式情報付テキストおよび文書データ種別の情報が入力されると、制御部11は、これらを取得して記憶装置12に記憶する(ステップS4)。すると、文書データ解析部13は、記憶装置12内の定義情報記憶部21に記憶される解析方式テーブルを読出し、記憶装置12に記憶される文書データ種別と関連付けられるチェックモジュール名を含む各種情報を解析方式テーブルから検索する(ステップS5)。
【0042】
例えば文書データ解析部13は、入力済みの文書データ種別が「議事録」であって検索対象の解析方式テーブルが図5に示したテーブルである場合には、このテーブル上の「議事録」と関連付けられるチェックモジュール名である「長文指摘」、「形態素解析」、「文体チェック」、「項目抽出」および「宛先チェック」ならびにこれとテーブル上で関連付けられる順位などの各種情報を検索し、検索済みのチェックモジュール名に対応するモジュールを実行して文書データの解析を行なう(ステップS6)。
【0043】
具体的には、まず文書データ解析部13は順位が最先の「10」である長文指摘モジュール31を実行し、記憶装置12に記憶されている書式情報付テキスト中の句点から句点までの文字数を計算し、この文字数が前述したように検索したチェックモジュール名である「長文指摘」と解析方式テーブル上で関連付けられるパラメータで示される文字数を超えるか否かを判別する。
【0044】
このパラメータが図5に示したように「80文字」である場合には、文書データ解析部13は書式情報付テキスト中の句点から句点までの記述のうち80文字を超える記述があれば、この記述の位置情報、指摘対象情報およびコメントとともに長文チェック箇所の情報として記憶装置12に保存する。指摘対象情報とは、書式情報付テキスト中の記述のうち不適切箇所に該当する記述を示す。コメントとは指摘対象が不適切な理由や、修正方法に対する示唆などを示すメッセージである。
ここでは位置情報は10行目を示す「10」となり、指摘対象情報は「文の長さ」となり、コメントは「文の長さが80文字を超えています。」となる。
【0045】
そして、文書データ解析部13は順位が「20」である形態素解析モジュール32を実行し、辞書データ記憶部22に記憶される形態素解析用辞書データにしたがって記憶装置12に記憶されている書式情報付テキスト中の記述に対する形態素解析を行なって、品詞情報付テキストを生成する。
【0046】
図10は、本発明の実施形態にしたがった文書データ処理システムにステップS3の処理で入力された文書データの形態素解析結果の例を表形式で示す図である。
図10に示すように、形態素解析結果では図9に示した書式情報付テキストと比較して文書データ中の単語に品詞情報が付加されている。
【0047】
そして、文書データ解析部13は順位が「30」である文体チェックモジュール33を実行し、辞書データ記憶部22に記憶される文体辞書データにしたがって前述した品詞情報付テキスト中の文末が「である」体に統一されているか否かを判別する。文書データ解析部13は品詞情報付テキスト中の文末に「である」体と異なる記述があれば、この記述の位置情報、指摘対象情報およびコメントとともに文体チェック箇所の情報として記憶装置12に保存する。ここでは位置情報は14行目を示す「14」となり、指摘対象情報は文中の「……です。」となり、コメントは「文体が統一されていません。」となる。
【0048】
文書データ解析部13は順位が「40」である項目抽出モジュール34を実行し、辞書データ記憶部22に記憶される項目抽出用辞書データにしたがって前述した品詞情報付テキスト中の冒頭の左揃えの単語を宛先に該当する記述として抽出して、項目情報付テキストを生成する。
【0049】
図11は、本発明の実施形態にしたがった文書データ処理システムが入力した文書データに項目情報を付加した例を表形式で示す図である。
図11に示すように、形態素解析結果では図10に示した品詞情報付テキストと比較して項目情報が付加されている。
【0050】
そして、文書データ解析部13は順位が最後「50」である宛先チェックモジュール35を実行し、辞書データ記憶部22に記憶される宛先辞書データにしたがって前述した項目情報付テキスト中の項目情報「宛先」の記述が適切であるか否かを判別する。ここでは文書データ解析部13は項目情報付テキスト中の宛先の記述のうち不適切な記述があれば、この記述を位置情報とともに宛先チェック箇所の情報として記憶装置12に保存する。ここでは位置情報は1行目を示す「1」となり、指摘対象情報は文中の宛先である「殿」となり、コメントは「宛先には「様」が適切です。」となる。
制御部11は、文書データ解析部13による解析により記憶装置12に記憶されたチェック結果の情報を通信インタフェース14を介してユーザ端末2に出力する。
【0051】
図12は、本発明の実施形態にしたがった文書データ処理システムによる文書データ解析結果の一例を表形式で示す図である。
図12に示すように、この解析結果では、文書データ解析部13による解析により得られた長文チェック箇所、文体チェック箇所および宛先チェック箇所の情報における前述した位置情報、指摘対象およびコメントが関連付けられる。
【0052】
ユーザ端末2の通信インタフェース45がサーバ装置1からのチェック結果の情報を入力すると、制御部41はこの情報を記憶装置42に記憶し、記憶装置42に記憶されている解析対象の文書データを読み出す。すると、解析結果付加部52は解析対象の文書データにサーバ装置1からのチェック結果を付加したチェック結果付文書データを生成する。制御部41は、このチェック結果付文書データを表示装置44に表示させる(ステップS7)。これにより、ユーザは図12に示したような形式のチェック結果が付加された文書データを確認することができる。
【0053】
以上のように、本発明の実施形態にしたがった文書データ処理システムでは、記述の適切性の解析対象の文書データの種別に応じて解析方式を検索し、この検索した方式に応じて、文書データの記述が適切であるか否かを判別するので、文書データの種別に応じて当該文書データの記述の不適切箇所の解析を適切に行なうことができる。
【0054】
この実施形態にしたがった文書データ処理システムでは、サーバ装置1の記憶装置12の記憶される各種情報を管理者端末3を用いて更新することができる。
例えばサーバ装置1の管理者が管理者端末3の入力装置63に対する予め定められた操作を行なって、サーバ装置1の記憶装置12の定義情報記憶部21に記憶される文書種別テーブルや解析方式テーブルで管理される情報や辞書データ記憶部22に記憶される辞書データの一部の変更、削除および追加のうち少なくとも一種類の更新を指示すると、制御部61は指示内容を示す情報を通信インタフェース65を介してサーバ装置1に出力する。サーバ装置1の通信インタフェース14が管理者端末3からの指示内容を示す情報を入力すると、制御部11は、この指示内容にしたがってサーバ装置1の記憶装置12の定義情報記憶部21に記憶される各種情報を更新する。
【0055】
例えば、文体チェックモジュール33が使用する文体辞書データの内容を修正することにより、チェック方式を「である」体の統一性のチェックから「です、ます」体の統一性のチェックに変更することができる。
【0056】
同様に、図5に示した解析方式テーブルで管理される文書データ種別である「議事録」と関連付けられるチェックモジュール名「長文指摘」と対応するパラメータ「80文字」を「60文字」に変更することにより、議事録の長文指摘の基準となる文字数を変更することができる。
【0057】
また、図5に示した解析方式テーブルで管理される文書データ種別である「議事録」と関連付けられるチェックモジュール名「長文指摘」を削除することにより、議事録のチェックの際に長文指摘を行なわないようにすることができる。
【0058】
また、例えば議事録のチェックの際に、一般的でない略語の使用の有無のチェックも行ないたい場合は、略語リストデータを記憶装置12に記憶した上で、略語チェック用のモジュールを文書データ解析部13に新たに備え、図5に示した解析方式テーブルで管理される文書データ種別である「議事録」に例えばチェックモジュール名「略語チェック」、順位「15」、パラメータ「略語リスト」、入力データ「書式情報付テキスト」および出力データ「チェック結果」を関連付けて管理した上で文書データの解析を行なえばよい。
【0059】
なお、本実施形態では、サーバ装置1、ユーザ端末2および管理者端末3でなる文書データ処理システムを用いて文書データの解析を行なうと説明したが、これらのサーバ装置1、ユーザ端末2および管理者端末3の機能を全て有する単一の装置を用いて文書データの解析を行なってもよい。
【0060】
また、本実施形態では、チェック結果では位置情報、指摘対象およびコメントで構成されると説明したが、これに限らず、例えば指摘対象に対する修正候補を含ませてもよい。
また、文書データ解析部13は、項目抽出モジュール34を実行した場合に、文書データ中の宛先を抽出すると説明したが、これに限らず、例えば差出人抽出用の項目抽出用辞書データをサーバ装置1の辞書データ記憶部22に記憶させて、この項目抽出用辞書データに対応するパラメータを解析方式テーブル上で管理した上で、項目抽出モジュール34を実行することで文書データ中の差出人を抽出するようにすることもできる。
【0061】
また、本実施形態では、文書データ解析部13が実行する新たなモジュールを設けた上で解析方式テーブルを更新する際には、データの入出力を考慮してモジュール間の制約が満たされているか否かを確認することができる。たとえば、入力データが「品詞情報付テキスト」である新たなモジュールに関する情報を解析方式テーブル上の「議事録」に関連付けて追加した場合で、入力データである品詞情報付テキストの生成に必要な形態素解析モジュール32に対応するチェックモジュール名が解析方式テーブル上の「議事録」に関連付けられていない場合には、制御部11はこの「議事録」に形態素解析モジュール32に対応するチェックモジュール名、順位、派ラメータ、入力データおよび出力データの情報を解析方式テーブル上に追加する。
【0062】
この実施例においては、解析方式テーブル上で各モジュールの実行順位を管理すると説明したが、入力データが他のモジュールの実行にしたがった出力データとなっている場合の依存関係のみを管理する構成とした上で、依存関係のない各種モジュールをランダムに実行する構成としてもよい。
【0063】
なお、この発明は前記実施形態そのままに限定されるものではなく実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を省略してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【図面の簡単な説明】
【0064】
【図1】本発明の実施形態にしたがった文書データ処理システムのサーバ装置の構成例を示すブロック図。
【図2】本発明の実施形態にしたがった文書データ処理システムのユーザ端末の構成例を示すブロック図。
【図3】本発明の実施形態にしたがった文書データ処理システムの管理者端末の構成例を示すブロック図。
【図4】本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される文書種別テーブルの構成例を表形式で示す図。
【図5】本発明の実施形態にしたがった文書データ処理システムのサーバ装置の記憶装置に記憶される解析方式テーブルの構成例を表形式で示す図。
【図6】本発明の実施形態にしたがった文書データ処理システムの処理動作の一例を示すフローチャート。
【図7】本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示されるユーザ名入力画面の一例を示す図。
【図8】本発明の実施形態にしたがった文書データ処理システムのユーザ端末に表示される文書種別選択画面の一例を示す図。
【図9】本発明の実施形態にしたがった文書データ処理システムが入力した文書データに書式情報を付加した例を表形式で示す図。
【図10】本発明の実施形態にしたがった文書データ処理システムが入力した文書データの形態素解析結果の例を表形式で示す図。
【図11】本発明の実施形態にしたがった文書データ処理システムが入力した文書データに項目情報を付加した例を表形式で示す図。
【図12】本発明の実施形態にしたがった文書データ処理システムによる文書データ解析結果の一例を表形式で示す図。
【符号の説明】
【0065】
1…サーバ装置、2…ユーザ端末、3…管理者端末、11,41,61…制御部、12,42,2…記憶装置、13…文書データ解析部、14,45,65…通信インタフェース、15,46,66…バス、21…定義情報記憶部、22…辞書データ記憶部、31…長文指摘モジュール、32…形態素解析モジュール、33…文体チェックモジュール、34…項目抽出モジュール、35…宛先チェックモジュール、43,63…入力装置、44,64…表示装置、51…書式情報付加部、52…処理結果付加部。
【特許請求の範囲】
【請求項1】
文書データを入力する入力手段と、
前記文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶する記憶手段と、
前記入力手段により入力した文書データの種別を認識する認識手段と、
前記記憶手段に記憶される解析方式情報のうち、前記認識手段により認識した種別と関連付けられる解析方式情報を検索する検索手段と、
この検索手段により検索した解析方式情報にしたがって前記入力手段により入力した文書データの記述の不適切箇所の解析を行なう解析手段と
を備えたことを特徴とする文書データ処理装置。
【請求項2】
前記記憶手段に記憶された解析方式情報の更新にかかる入力を受け付ける更新入力手段と、
この入力された内容にしたがって前記記憶手段に記憶された解析方式情報を更新する更新手段と
をさらに備えたことを特徴とする請求項1に記載の文書データ処理装置。
【請求項3】
前記記憶手段に記憶される前記種別ごとの解析方式情報は、予め定められた順序と関連付けられる複数の解析方式情報でなり、
前記検索手段は、
前記記憶手段に記憶される解析方式情報のうち、前記認識手段により認識した種別と関連付けられる解析方式情報を当該解析方式情報と関連付けられる順序とあわせて検索し、
前記解析手段は、
前記検索手段により検索した解析方式情報に関連付けられる順序にもとづいて決定した解析方式情報にしたがって前記入力手段により入力した文書データの記述の不適切箇所の解析を行なう
ことを特徴とする請求項1に記載の文書データ処理装置。
【請求項4】
文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶する記憶装置を備えた文書データ処理装置で用いられ、
前記文書データを入力する入力ステップと、
この入力ステップにより入力した文書データの種別を認識する認識ステップと、
前記記憶装置に記憶される解析方式情報のうち、前記認識ステップにより認識した種別と関連付けられる情報を検索する検索ステップと、
この検索ステップにより検索した解析方式情報にしたがって前記入力ステップにより入力した文書データの記述の不適切箇所の解析を行なう解析手段とステップと
を有することを特徴とする文書データ処理方法。
【請求項5】
文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶する記憶装置を備えたコンピュータを制御するためのプログラムであって、
前記コンピュータを、
前記文書データを入力する入力手段、
前記入力手段により入力した文書データの種別を認識する認識手段、
前記記憶装置に記憶される解析方式情報のうち、前記認識手段により認識した種別と関連付けられる解析方式情報を検索する検索手段、
この検索手段により検索した解析方式情報にしたがって前記入力手段により入力した文書データの記述の不適切箇所の解析を行なう解析手段
として機能させるようにした、コンピュータ読み取り可能な文書データ処理プログラム。
【請求項1】
文書データを入力する入力手段と、
前記文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶する記憶手段と、
前記入力手段により入力した文書データの種別を認識する認識手段と、
前記記憶手段に記憶される解析方式情報のうち、前記認識手段により認識した種別と関連付けられる解析方式情報を検索する検索手段と、
この検索手段により検索した解析方式情報にしたがって前記入力手段により入力した文書データの記述の不適切箇所の解析を行なう解析手段と
を備えたことを特徴とする文書データ処理装置。
【請求項2】
前記記憶手段に記憶された解析方式情報の更新にかかる入力を受け付ける更新入力手段と、
この入力された内容にしたがって前記記憶手段に記憶された解析方式情報を更新する更新手段と
をさらに備えたことを特徴とする請求項1に記載の文書データ処理装置。
【請求項3】
前記記憶手段に記憶される前記種別ごとの解析方式情報は、予め定められた順序と関連付けられる複数の解析方式情報でなり、
前記検索手段は、
前記記憶手段に記憶される解析方式情報のうち、前記認識手段により認識した種別と関連付けられる解析方式情報を当該解析方式情報と関連付けられる順序とあわせて検索し、
前記解析手段は、
前記検索手段により検索した解析方式情報に関連付けられる順序にもとづいて決定した解析方式情報にしたがって前記入力手段により入力した文書データの記述の不適切箇所の解析を行なう
ことを特徴とする請求項1に記載の文書データ処理装置。
【請求項4】
文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶する記憶装置を備えた文書データ処理装置で用いられ、
前記文書データを入力する入力ステップと、
この入力ステップにより入力した文書データの種別を認識する認識ステップと、
前記記憶装置に記憶される解析方式情報のうち、前記認識ステップにより認識した種別と関連付けられる情報を検索する検索ステップと、
この検索ステップにより検索した解析方式情報にしたがって前記入力ステップにより入力した文書データの記述の不適切箇所の解析を行なう解析手段とステップと
を有することを特徴とする文書データ処理方法。
【請求項5】
文書データの記述の不適切箇所の解析方式情報を当該文書データの種別ごとに関連付けて記憶する記憶装置を備えたコンピュータを制御するためのプログラムであって、
前記コンピュータを、
前記文書データを入力する入力手段、
前記入力手段により入力した文書データの種別を認識する認識手段、
前記記憶装置に記憶される解析方式情報のうち、前記認識手段により認識した種別と関連付けられる解析方式情報を検索する検索手段、
この検索手段により検索した解析方式情報にしたがって前記入力手段により入力した文書データの記述の不適切箇所の解析を行なう解析手段
として機能させるようにした、コンピュータ読み取り可能な文書データ処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2007−310586(P2007−310586A)
【公開日】平成19年11月29日(2007.11.29)
【国際特許分類】
【出願番号】特願2006−138046(P2006−138046)
【出願日】平成18年5月17日(2006.5.17)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
【公開日】平成19年11月29日(2007.11.29)
【国際特許分類】
【出願日】平成18年5月17日(2006.5.17)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
[ Back to top ]