説明

文書支援システム及び文書支援プログラム

【課題】文書作成者以外の利用者に対する単語等の理解補助や誤解防止を実現することができるばかりでなく、理解補助や誤解防止のための注釈をモニタ画面上のみならずプリント出力した場合であっても目視可能とすることができ、しかも、元の文章に注釈を添付するといった変換を行うことなく元の表現を残したまま注釈を追加することができる文書支援システムを提供する。
【解決手段】取得した文書ファイルの文章中に含まれる単語を解析する解析部6と、解析部6で解析した単語中に注釈対象単語が含まれている場合にそれを抽出する抽出部7と、抽出部7で抽出した注釈対象単語に対応する注釈を予め格納された辞書データベース8から呼び出す検索部9と、検索部9で呼び出した注釈を解析部6で解析した文書ファイルの文書フォーマットを利用して注釈付文書ファイルを作成する書込部10とを備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、作成された文書ファイルの文章中に含まれる単語(語彙)等に対する注釈を付与する文書支援システム及び文書支援プログラムに関する。
【背景技術】
【0002】
従来から、パーソナルコンピュータにインストールされた日本語辞書に基づいてワードプロセッサ等で文書を作成している作業中に単語変換(漢字変換)等を行う場合に、モニタ画面上に同音異義語の意味を注釈的に表示することによって誤った漢字変換を行わないようにする文書支援システムが知られている。
【0003】
また、作成した文章中の単語等を解析し、同一文章中の複数個所で用いている単語(語彙)の使用形態が異なっている場合(例えば、「コンピュータ」と「コンピューター」)にモニタ画面上の該当単語中にアンダーライン等を付与することで同一の使用形態に変換するワードチェックツールや、文章中に使用されている単語(語彙)が複数個所で用いられているような場合に強調語として表示フォントサイズ等を変換する強調変換ツールといった文書支援システムも知られている(例えば、特許文献1参照。)。
【0004】
さらに、上述した同音異義語の意味を注釈的に表示する文書支援システムとして、単語変換時のみならず、変換決定後の文章中に含まれる単語(語彙)を検索し、利用者の理解補助や誤解防止の観点から必要があると判断した単語に対してポップアップメニューやサイクリック表示などによって表現の変換を可能とした文書支援システムも知られている(例えば、特許文献2参照。)。
【0005】
これにより、例えば、「ATM」という略語に関し、金融業界で用いた場合の「ATM」(=現金自動預入支払機[Automated
teller machine])と、軍事業界で用いた場合の「ATM」(=対戦車ミサイル[Anti−Tank Missile])の何れの意味を意図して文書作成者が用いているかを作成者が指定することにより、他の利用者がこの文書を閲覧した場合の理解補助や誤解防止を実現することができる。
【特許文献1】特開平11−238058号公報
【特許文献2】特開2004−151882号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
ところが、上記の如く構成された文書支援システムにあっては、漢字変換等を行う場合に同音異義語の意味を注釈的に表示するものにあっては、主として文書作成中に文書作成者の誤変換を防止するために用いられ、他の利用者がモニタ画面上或いはプリント出力した状態での理解補助や誤解防止に貢献することはできなかった。
【0007】
また、作成した文章中の単語等を解析するワードチェックツールや強調変換ツールにあっては、単なるワードチャックや文字強調といった機能のみに用いられ、検索した単語(語彙)等に対する理解補助や誤解防止に貢献するものではなかった。
【0008】
さらに、変換決定後の文章中に含まれる単語(語彙)を検索し、利用者の理解補助や誤解防止の観点から必要があると判断した単語に対してポップアップメニューやサイクリック表示などによって表現の変換を可能とした文書支援システムにあっては、利用者の観点からのみ単語(語彙)等の意味を注釈的に添付又は変換することができるものであり、しかも、その注釈表示はモニタ画面上でのみ可能であるという問題があった。
【0009】
そこで、本発明は、上記事情を考慮し、文書作成者以外の利用者に対する単語等の理解補助や誤解防止を実現することができる文書支援システムを提供することを目的とする。
【0010】
また、理解補助や誤解防止のための注釈を、モニタ画面上のみならずプリント出力した場合であっても目視可能とすることができ、しかも、元の文章に注釈を添付するといった変換を行うことなく元の表現を残したまま注釈を追加することができる文書支援システム及び文書支援プログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の文書支援システムは、文書ファイルを取得すると共にその取得した文書ファイルの文章中に含まれる単語を解析する解析部と、該解析部で解析した単語中に注釈が必要な注釈対象単語が含まれている場合にそれを抽出する抽出部と、該抽出部で抽出した注釈対象単語に対応する注釈を予め格納された辞書データベースから呼び出す検索部と、該検索部で呼び出した注釈を前記解析部で解析した文書ファイルの文書フォーマットを利用して注釈付文書ファイルを作成する書込部とを備えていることを特徴とする。
【0012】
この際、前記書込部は、文書フォーマットで指定された余白部分又は最終頁に注釈を添付した注釈付文書ファイルを作成するのが好ましい。
【0013】
また、前記辞書データベースには、複数の辞書に対応するデータベースが優先順序立てして格納されていることが好ましい。
【0014】
さらに、前記抽出部は、予め規定された選択基準に応じた名詞を注釈対象単語として抽出するのが好ましい。この際、その選択基準としては、外来語等の可能性の高いカタカナ単語や略語等の可能性の高い大文字のみから構成された英数字を優先して注釈対象単語とすることが考えられる。
【0015】
また、前記抽出部は、文章中に複数回使用されている同一単語は最初の1回のみ注釈対象単語として抽出するのが好ましい。
【0016】
さらに、前記書込部は、文書フォーマットと注釈対象単語数とを考慮して前記検索部によって呼び出した前記辞書データベースに格納された注釈文のうち最初の指定文字数分のみを注釈として使用しても良い。
【0017】
本発明の文書支援システムによれば、文書ファイルの文章中に注釈が必要であると想定される単語を注釈対象単語として解析し、その注釈対象単語に対応する注釈を含む注釈付文書ファイルを作成することにより、文書作成者による文書作成字や文書作成者が任意に指定した単語のみならず、幅広い注釈付きの文章とすることができる。
【0018】
さらに、本発明の文書支援プログラムは、文書ファイルの文章中に含まれる単語を解析し、その解析した単語中に注釈が必要であると想定される注釈対象単語を抽出した後、予め格納された辞書データベースを検索して注釈対象単語に対応する注釈が存在している場合に文書ファイルの文書フォーマットを利用して注釈付文書ファイルを作成する。
【発明の効果】
【0019】
本発明の文書支援システムは、文書作成者以外の利用者に対する単語等の理解補助や誤解防止を実現することができるばかりでなく、理解補助や誤解防止のための注釈をモニタ画面上のみならずプリント出力した場合であっても目視可能とすることができ、しかも、元の文章に注釈を添付するといった変換を行うことなく元の表現を残したまま注釈を追加することができる。
【発明を実施するための最良の形態】
【0020】
次に、本発明の一実施形態に係る文書支援システム及び文書支援プログラムについて、図面を参照して説明する。
【0021】
図1は本発明の一実施形態に係る文書支援システムのシステム構成例の説明図、図2は本発明の一実施形態に係る文書支援システムのシステム構成例のブロック説明図、図3は本発明の一実施形態に係る文書支援システムで作成された文書ファイル例の説明図、図4は本発明の一実施形態に係る文書支援システムルーチンのフロー図である。
【0022】
図1に示すように、本発明の一実施形態に係る文書支援システムは、複数のパーソナルコンピュータ1及び複合機2がネットワーク3を介してサーバー4に接続されている。尚、このようなネットワークシステムは、図示したものに限定されるものではない。また、サーバー4は、インターネット5等と接続することも可能である。
【0023】
サーバー4は、図2に示すように、パーソナルコンピュータ1にインストールされたワードプロセッサソフトを利用して作成・保存された文書ファイルを取得すると共にその取得した文書ファイルの文章中に含まれる単語を解析する解析部6と、解析部6で解析した単語中に注釈が必要な注釈対象単語が含まれている場合にそれを抽出する抽出部7と、抽出部7で抽出した注釈対象単語に対応する注釈を予め格納された辞書データベース8から呼び出す検索部9と、検索部9で呼び出した注釈を解析部6で解析した文書ファイルの文書フォーマットを利用して注釈付文書ファイルを作成する書込部10とを備えている。
【0024】
解析部6は、取得した文書ファイルの文章を句読点や記号(例えば、コンマ、ピリオド、スラッシュ等)毎に区切って形態素解析し、単語(語彙)に分割する。
【0025】
抽出部7は、予め規定された選択基準に応じた名詞を注釈対象単語として抽出する。この際、予め規定された選択基準としては、例えば、人名・地名・国名・団体名(会社名・学校名など)・年号(元号と西暦等との対応)・商号・作品名(書名・映画の題名等)等の固有名詞や、外来語等の可能性の高いカタカナ単語や何らかの略語としての可能性の高い大文字のみから構成された英数字(例えば、「ATM」「MP3」等)を優先して注釈対象単語として抽出するといったように、業界等に応じて設定することができる。また、抽出部7は、文章中に複数回使用されている同一単語は最初の1回のみ注釈対象単語として抽出することで重複を避けることができる。
【0026】
辞書データベース8には、複数の辞書に対応するデータベースが優先順序立てして格納されている。これにより、業界等で異なった意味として用いられる重複単語が存在していても、文書作成者が意図する使用形態と一致する注釈を添付することができる。
【0027】
この際、複数辞書の優先順序設定は、業界等の利用者によって様々であるため、利用者側で設定することができる。
【0028】
尚、辞書データベース8に格納された注釈は、通常の辞書等に記載されている内容よりも簡素な文字数の少ない注釈文で格納するのが好ましい。
【0029】
検索部9は、抽出部7で抽出された単語(語彙)が辞書データベース8に格納されているか否かを検索し、辞書データベース8に該当する単語が含まれていた場合に辞書データベース8からその該当した単語に対する注釈を取得する。また、辞書データベース8に該当する単語が含まれていなかった場合にはスキップして次の単語を検索すると同時に少なくとも同一文書ファイルに対する次回以降(次頁以降)の検索対象から除外する。尚、検索部9は、辞書データベース8以外として(又は併用して)、インターネット5を経由して注釈対象単語を検索して説明文を取得しても良い。この際、辞書データベース8の場合と同様に複数のサイト(専門用語の解説サイトなど)を予め登録しておくと同時に、そのサイトの検索順序等を指定しておくことにより精度を向上することができる。
【0030】
書込部10は文書フォーマットで指定された余白部分又は最終頁に注釈を添付した注釈付文書ファイルを作成する。また、書込部10は、例えば、余白スペース等には文字数の制限が発生することから、文書フォーマットと注釈対象単語数とを考慮して検索部9によって呼び出した辞書データベース8に格納された注釈文のうち最初の指定文字数分のみを注釈として使用しても良い。さらに、書込部10は作成した注釈付文書ファイルを元の文書ファイルのファイル名とは異なった注釈付文書ファイル名でパーソナルコンピュータ1に出力することにより、注釈文無しの原本と注釈文有りの新たなファイルとを別々に保存することができる。
【0031】
尚、書込部10は、パーソナルコンピュータ1から複合機2へと文書ファイルを含む印刷指令データが出力された場合においても、その印刷指令データを解析部6で取得し、注釈付文書ファイルの新たな印刷指令データとして複合機2へと出力しても良い。また、文書作成中においても、例えば、所定時間毎や所定漢字変換操作数をトリガーとしてワードプロセッサソフト上で設定したバックアップデータ保存時等に、上述した解析部6から書込部10を経由して注釈分を余白等に作成し、モニタ画面上で確認しつつ文書作成をすることも可能である。この際、文書作成者が注釈対象単語として指定することも可能であり、その注釈を選択(指定)することも可能である。さらに、利用者側においても注釈付文書ファイルを呼び出してモニタ画面を確認しつつ、不要な注釈文を削除することも可能である。
【0032】
これにより、図3に示すように、プリントアウト後の用紙11(又は、印刷表示モードでのモニタ画面上)には、書込部10で余白部(例えばA4縦向きのレイアウトならば下側)11aに注釈が追記されると共に、本文中の注釈対象単語に注1)、注2)・・・等の注釈記号が添記される。
【0033】
尚、ワードプロセッサソフト上で設定された余白部分が少ない場合には、注釈対象単語数を考慮して注釈文を短くしたり、注釈文のフォントサイズを小さくしたり、余白面積を広げる(行間を短くしたり行数を少なくして次頁以降に繰り越す等)といったレイアウト変更を可能としても良い。また、辞書データベース8に、同一頁内での注釈対象単語数が1つの場合、2つの場合、3つの場合等に応じた専用の注釈文を複数格納し、注釈単語数に応じて検索部9で選択的に用いることも可能である。
【0034】
次に、図4のフロー図を参照しつつ、本発明の文書支援システムの注釈文作成手順を説明する。
【0035】
(ステップS1)
ステップS1では、解析部6により、文書作成者が作成した文書ファイルをその作成者又は他の利用者のパーソナルコンピュータ1から取得してステップS2へと移行する。
【0036】
(ステップS2)
ステップS2では、解析部6により、取得した文書ファイルから図柄等が含まれている場合を想定し、その部分を除いた文章を構成する文章データ(テキストデータ)のみを対象とし、その文章データの句読点や記号(例えば、コンマ、ピリオド、スラッシュ等)毎に区切って形態素解析しつつ単語(語彙)に分割してステップS3へと移行する。
【0037】
尚、この単語(語彙)分割は、JISの区点コード等に基づいて文字を参酌すると同時に、その句点コードの組み合わせから、予め単語登録された単語を抽出するなど、公知の単語検索機能を利用して分割する。
【0038】
(ステップS3)
ステップS3では、抽出部7により、解析部6で分割された単語のうち、文頭から1つ目の単語を参酌してステップS4へと移行する。尚、このステップS3で、抽出部7は、参酌した単語は参酌済み単語として記憶処理しておく。
【0039】
(ステップS4)
ステップS4では、抽出部7により、参酌した単語が難解な単語等、注釈の必要がある注釈対象単語であるか否かが判断され、注釈対象単語である場合にはステップS5へと移行し、注釈対象単語で無い場合にはステップS7へとスキップする。
【0040】
(ステップS5)
ステップS5では、検索部9により、ステップS4で注釈対象単語であると判断した単語に対応する注釈が辞書データベース8に登録されているか否が確認され、注釈有りの場合にはステップS6へと移行し、注釈無しの場合にはステップS7へとスキップする。
【0041】
(ステップS6)
ステップS6では、検索部9により、注釈対象単語に対応する注釈を辞書データベース8から取得してステップS7へと移行する。
【0042】
(ステップS7)
ステップS7では、解析部6により、注釈対象単語の有無処理を行っていない次の単語があるか否かが判断され、以下、全文章データに対する注釈対象単語の検索が終了するまでしてステップS2〜ステップS6のルーチンを繰り返し、全文章データに対する注釈対象単語の検索が終了したらばステップS8へと移行する。
【0043】
(ステップS8)
ステップS8では、書込み部10により、注釈対象単語に対する注釈を、文書フォーマットで指定された余白部分の該当頁に(又は最終頁にまとめて)、その注釈数(注釈対象単語数)や注釈文字数などを考慮して注釈を追加したうえで、新たな文書データ(注釈付文書ファイル)として保存してパーソナルコンピュータ1に出力する。
【0044】
このように、本発明の文書支援システムにあっては、文書作成者以外の利用者がその文書を閲覧(モニタ画面・プリント出力を問わない)した場合に、理解しづらい専門用語等の理解補助や誤解の虞がある単語が含まれている可能性があることから、文書作成者又は利用者が文書ファイルをサーバー4へ送信することにより、そのサーバー4でその文書ファイルを解析し、余白部分に説明が必要と思われる語句への注釈を付加する新たな注釈付文書ファイルを作成することによって、利用者は注釈付の分かりやすい文章を手に入れることができる。
【0045】
ところで、上記実施の形態では、本発明の文書支援システムをサーバー4で行う旨を開示したが、各パーソナルコンピュータ1で行うようにしても良い。この際、本発明の文書支援システムは、辞書データベース7を含めたソフトウエアとしてパーソナルコンピュータ1にインストールすることで実現可能となる。
【図面の簡単な説明】
【0046】
【図1】本発明の一実施形態に係る文書支援システムのシステム構成例の説明図である。
【図2】本発明の一実施形態に係る文書支援システムのシステム構成例のブロック説明図である。
【図3】本発明の一実施形態に係る文書支援システムで作成された文書ファイル例の説明図である。
【図4】本発明の一実施形態に係る文書支援システムルーチンのフロー図である。
【符号の説明】
【0047】
6…解析部
7…抽出部
8…辞書データベース
9…検索部
10…書込部

【特許請求の範囲】
【請求項1】
文書ファイルを取得すると共にその取得した文書ファイルの文章中に含まれる単語を解析する解析部と、該解析部で解析した単語中に注釈が必要な注釈対象単語が含まれている場合にそれを抽出する抽出部と、該抽出部で抽出した注釈対象単語に対応する注釈を予め格納された辞書データベースから呼び出す検索部と、該検索部で呼び出した注釈を前記解析部で解析した文書ファイルの文書フォーマットを利用して注釈付文書ファイルを作成する書込部とを備えていることを特徴とする文書支援システム。
【請求項2】
前記書込部は、文書フォーマットで指定された余白部分又は最終頁に注釈を添付した注釈付文書ファイルを作成することを特徴とする請求項1に記載の文書支援システム。
【請求項3】
前記辞書データベースには、複数の辞書に対応するデータベースが優先順序立てして格納されていることを特徴とする請求項1又は請求項2に記載の文書支援システム。
【請求項4】
前記抽出部は、予め規定された選択基準に応じた名詞を注釈対象単語として抽出することを特徴とする請求項1乃至請求項3に記載の文書支援システム。
【請求項5】
前記抽出部は、カタカナ単語又は大文字のみから構成された英数字を優先して注釈対象単語として抽出することを特徴とする請求項4に記載の文書支援システム。
【請求項6】
前記抽出部は、文章中に複数回使用されている同一単語は最初の1回のみ注釈対象単語として抽出することを特徴とする請求項1乃至請求項5に記載の文書支援システム。
【請求項7】
前記書込部は、文書フォーマットと注釈対象単語数とを考慮して前記検索部によって呼び出した前記辞書データベースに格納された注釈文のうち最初の指定文字数分のみを注釈として使用することを特徴とする請求項1乃至請求項6に記載の文書支援システム。
【請求項8】
文書ファイルの文章中に含まれる単語を解析し、その解析した単語中に注釈が必要であると想定される注釈対象単語を抽出した後、予め格納された辞書データベースを検索して注釈対象単語に対応する注釈が存在している場合に文書ファイルの文書フォーマットを利用して注釈付文書ファイルを作成することを特徴とする文書支援プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2008−102802(P2008−102802A)
【公開日】平成20年5月1日(2008.5.1)
【国際特許分類】
【出願番号】特願2006−285678(P2006−285678)
【出願日】平成18年10月20日(2006.10.20)
【出願人】(000006150)京セラミタ株式会社 (13,173)
【Fターム(参考)】