説明

文書添削装置、文書添削方法及び文書添削プログラム

【課題】或る一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成する。
【解決手段】テンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する。添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テンプレートを用いた文書の添削に関する。
【背景技術】
【0002】
ユーザが文章を作成した後、作成した文書を添削装置に入力することで文書の解析を行い、所定の正解文例と比較することで文書を添削し、その結果をユーザに提示するといった文書添削に関する技術が存在する。
【0003】
また、このような文書添削を行うに際し、規範となる文書であるテンプレート文書を用いるという技術も存在する。
【0004】
例えば、テンプレートを用いて、文書の添削を行っている例が特許文献1に記載されている。また、特許文献2には文書の要素として文章を組み合わせることで文書を作成する技術が記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2000−90080号公報
【特許文献2】特開2001−331481号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した各技術には以下のような問題があった。
【0007】
特許文献1に記載の技術は過去の添削例を元に正解例を提示するものであり、文章の前後関係に挿入できるものではないという問題があった。また、このような技術ではそもそも記載されていない文章を摘出するのは困難であった。
【0008】
また、特許文献2に記載の技術の場合は、文書の要素として文章を組み合わせることで文書を作成しているが、文書を選択することで記載の自由度が妨げられる可能性があるという問題があった。
【0009】
更に、類似する文書そのものを提示するような技術も存在するが、文章単位での指摘ができないため、その文書から必要な文章を抜き出す手間がかかっていた。
【0010】
テンプレートの中からユーザが可変の文字列を埋め込むものや、多くの選択肢から文章を構成していく技術もあるが、文書の自由度が狭められてしまう恐れがあるという問題があった。
そこで、本発明は、或る一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することが可能な、文書添削装置、文書添削方法及び文書添削プログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の第1の観点によれば、添削対象の文書の添削を行う添削装置において、正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、を備えることを特徴とする添削装置が提供される。
【0012】
本発明の第2の観点によれば、添削対象の文書の添削を行う添削装置が行う添削方法において、正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削方法が提供される。
【0013】
本発明の第3の観点によれば、添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラムが提供される。
【発明の効果】
【0014】
本発明によれば、テンプレートに記載された文書からキーワードを読み込み、キーワードと文章の前後関係、文章間の距離において関連度を算出することから、或る一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することが可能となる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態の基本的構成を表す図である。
【図2】本発明の実施形態における文章の関連度を算出する動作を示すフローチャートである。
【図3】本発明の実施形態におけるテーブルの具体例を表す図である。
【図4】抜けている文章の抽出をする動作を示すフローチャートである。
【発明を実施するための形態】
【0016】
本発明の実施形態の構成及び動作を説明するに先立って、まず本実施形態の特徴について説明する。
【0017】
本実施形態では、まず、マスタとなる文書(以下、適宜「テンプレート文書」と呼ぶ)をデータベースに登録する。そして、このテンプレート文書と、添削対象とする文書(以下、適宜「添削文書」と呼ぶ)との比較を行い、後述する関連度の高い順に文章の前後に本来必要な文章の候補を提示し、ユーザに漏れや抜けを提示する。
【0018】
ここで、テンプレート文書は、ユーザが事前に用意しておき、正しい順序で記載されている文書であるものとする。更に、キーワードも事前にユーザが指定しておくものとする。ここで、キーワードとは、文章の中の単語であって、他の文章と関連性が出やすい単語を指すものとする。
【0019】
本実施形態における関連度の算出方法は、以下の通りである。指定されたキーワードが、或る文章と、それ以外の他の文章でも検出されれば、この或る文章と他の文章はそれぞれ関連のある文章として扱うものとする。また関連のある文章同士の前後関係及び文章間の距離を足し合わせることにより、文章の関連度を算出する。文章間の距離とは、句点で区切られた文章と文章の間に何個の文章があるか示したものである。また、マスタとなる文書であるテンプレート文書は随時更新が可能であり、運用を繰り返すことで、より精度の高い検出が可能となる。
【0020】
なお、本実施形態では、句点を基準として「文章」を区切る。すなわち、対象とする文の最初の文字から最初の句点まで、又は、或る句点の次の文字から当該或る句点の次の句点まで、をそれぞれ1つの文章として扱う。そして、この文章の集合を「文書」と呼ぶこととする。
【0021】
ここで、句点とは一般的に「。」を指すが、例えば「.」等の他の文字を句点として扱うようにしてもよい。すなわち句点とは、一般的に指される文字のみならずユーザの設定に応じて任意に定められる文字であるとする。
【0022】
次に、本発明の実施形態について図面を用いて詳細に説明する。
【0023】
図1を参照すると本実施形態は、文章添削装置100、入力装置200及び出力装置300を有する。
【0024】
本実施形態における文章添削装置100は、ソフトウェア設計や、報告書等を含む一定の書式が定まっており、内容に記載漏れがあってはならない文書において、その文章の前後に漏れや抜けがあることを指摘/添削を行う装置である。
【0025】
文章添削装置100は、本実施形態特有の装置により実現されてもよいが、汎用のPCに本実施形態特有のプログラムを組み込むことにより実現してもよい。また、入力装置200及び出力装置300の何れか若しくは双方が文章添削装置101と一体になり、単一の装置として実現されてもよい。
【0026】
ここで、文章添削装置100は、関連度算出部101、テンプレート/関連度格納部102及び添削文章抽出部103を有する。
【0027】
関連度算出部101は、入力されたテンプレート文書から文章の関連度を算出する部分である。また、テンプレート/関連度格納部102は、テンプレート文書及びテンプレート文書から算出された関連度を格納しておく記憶装置である。更に、添削文章抽出部103は、漏れている可能性のある文章を抽出する部分である。
【0028】
入力装置200は、ユーザがテンプレート文書及び添削文書を入力するための装置であり、キーボード等により実現される。また、テンプレート文書及び添削文書は、ユーザが直接入力してもよいが、準備されているテンプレート文書や添削文書を記憶媒体(例えば、USBメモリや外部記憶装置)から読み込んだり、ネットワークを介して取得するようにしてもよい。また、入力装置200をスキャナーにより実現し、紙媒体より読み込んだ文字をOCR(Optical Character Recognition)ソフトにより文字認識することによりテンプレート文書や添削文書を入力するようにしてもよい。
【0029】
出力装置300は、ユーザに情報を提示するための装置であり、ディスプレイ等により実現される。そして出力装置300は、添削した結果漏れている可能性のある文章をユーザに提示する。また、プリンタにより出力装置300を実現して、紙媒体に出力するようにしてもよい。更に、何らかの記憶媒体に出力するようにしてもよい。
【0030】
なお、入力装置200及び出力装置300をタッチパネルディスプレイとして一体化して実現してもよい。
【0031】
上述の各装置及び各部は、それぞれ以下のように動作する。
【0032】
テンプレート文書及び添削文書を入力する入力装置200は、読み込んだテンプレート文書をファイル化して関連度算出部101へ送出する。
【0033】
関連度算出部101は入力された文書ファイルを読み込み、文章(句点)区切りで分割し、文章から関連度を算出する。なお、可能であれば入力装置200が文書を文章(句点)区切りで分割するようにしてもよい。算出した関連度と文章はテンプレート/関連度格納部102にて格納される。
【0034】
入力装置200から添削文章抽出部103に対して添削文書が入力されると、添削文章抽出部103がテンプレート/関連度格納部102から抜けている文章を抽出する。抽出した文章は出力装置300によってユーザに出力される。
【0035】
次に、図2及び図4のフローチャート及び図3に示すテーブルを参照して、本実施形態の動作を説明する。
【0036】
まず、テンプレート文書を入力として、文章の関連度を算出する方法について説明する。
【0037】
テンプレート文書の入力の場合は、まず関連度算出部101がテンプレート/関連度格納部102に格納されているテーブルの初期化を行い、テーブルの中の情報を空にする(ステップS11)。
【0038】
次に、関連度算出部101は、入力装置200から受け取ったテンプレート文章のファイルを読み込み、全体の文章量を計算する(ステップS12)。具体的には、テンプレート文章内に含まれている文章の数がいくつであるのかを算出する。
【0039】
次に、関連度算出部101は、入力した文書を文章単位(句点)で読み取る(ステップS13)。そして、文章毎に、含まれているキーワードを読み込む(ステップS14)。
【0040】
続いて、関連度算出部101は、読み込んだ文章とキーワード及びキーワードの個数から関連度を算出する(ステップS15)。
【0041】
具体的には、以下の数式1により関連度を算出する。
【0042】
関連度=(全文章数−文章間の距離)+一致するキーワードの個数
・・・数式1
【0043】
この数式では、一般的に文章が離れれば離れるほど、文章同士の関連性は低くなり、一致するキーワードが多ければ文書間の関連性は高くなるため(全文章数−文章間の距離)を関連度の要素としている。更に一致するキーワードが多いほど関連度が高いと考えられるため一致するキーワードの個数も関連度の要素としている。但し、一致するキーワードが存在しない場合は、(全文章数−文章間の距離)を考慮することなく関連度をゼロとする。すなわち、間に文章が存在しなくとも関連度はゼロとなる。算出した関連度と文章を図3の形式で、テンプレート/関連度格納部102内のテーブルに登録する(ステップS16)。
【0044】
テーブルの登録方法は、登録されている文章の順番を格納する文章順番番号列と、その文章に含まれるキーワード一覧列と、その文章の後ろに挿入される可能性のある文章の関連度を示した後関連度列及び、その文章の前に挿入される可能性のある文章の関連度を示した前関連度列からなる。後関連度及び前関連度は(文章順番番号,関連度)の形式で保持するものとする。
【0045】
具体例を挙げて説明する。例えば、以下の文書がテンプレートとして入力されていたとする。
<文書例>
「ファイルAを読み込む。ファイルAをファイルBにバックアップとして出力しておく。ファイルAの内容を修正する。修正した内容をファイルAに出力する。ファイルAの出力に成功した場合、ファイルBを削除する。」
この場合、図3に示すような形式でテーブルに格納されることとなる。
【0046】
続いて図4を参照して、添削文章抽出部103が、添削文書を入力として抜けている文章の抽出をする方法について説明する。
【0047】
ユーザが添削文書を入力し、添削文章抽出部103が、入力装置200から添削文書を受け付ける(ステップS21)。
【0048】
読み込んだ文書を句点単位で文章に区切り、各文章からキーワードを抽出し、キーワードが一致する文章をテンプレート/関連度格納部102から検索する(ステップS22)。
【0049】
一致する文章が検索されれば、その前後の文章に対してもテンプレート/関連度格納部102からキーワードが一致する文章になっているか検索をする(ステップS23)。
【0050】
もし、一致するキーワードが存在すれば(ステップS24においてNo)、抜けや漏れはないと考え、次の文章を対象として処理を続ける(ステップS22)。
【0051】
一方、一致するキーワードが存在しない場合は(ステップS24においてYes)、添削文章抽出部103が、一致した文章の前関連度、後関連度を用いて漏れている文章の候補を抽出し、出力装置300が出力する(ステップS22)。
【0052】
具体例を挙げて説明する。上述した説明と同様に以下の文書がテンプレートとして入力されていたとする。
<文書例>
「ファイルAを読み込む。ファイルAをファイルBにバックアップとして出力しておく。ファイルAの内容を修正する。修正した内容をファイルAに出力する。ファイルAの出力に成功した場合、ファイルBを削除する。」
【0053】
この場合、図3に示すような形式でテーブルに格納されている。
【0054】
この状態で、もし文章順番番号2の文章が漏れている文書を添削文書として入力された場合は、1の文章の後ろに後関連度が高い文章順、つまり文章順番番号2→3→4→5の順番となり、3の文章の前に前関連度が高い文章順、つまり文章順番番号2→1の順番で摘出される。また、この場合1及び3,4,5は既に添削文書に記載されているため、指摘文章としては出力しない。結果として、文章順番番号1及び3の間に2が挿入される形式で文書に挿入し出力する。なお、文書として出力するのではなく、挿入候補を出力するようにしてもよい。上述の例でいえば、単に「文章順番番号2の文章が漏れていると考えられる」旨のみを出力するようにしてもよい。更に、「1の後関連度が高い文章を順に」示して挿入候補として出力するようにしてもよい。加えて、「3の前関連度が高い文章を順に」示して挿入候補として出力するようにしてもよい。
【0055】
以上説明した本実施形態では、テンプレートに記載された文書からキーワードを読み込み、キーワードと文章の前後関係、文章間の距離において関連度を算出する。これにより、文章単位で抜けや漏れのある文章を指摘することが可能となるという効果を奏する。
【0056】
これにより、ある一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することができる。そのため、文書の修正や再作成といった工数の短縮化が図れるという効果を奏する。
【0057】
続いて、上述の実施形態を変形した変形例について説明する。本変形例の構成は、図1に示される上述の実施形態の構成と同様である。
【0058】
本変形例では、テンプレート文書に含まれるキーワードを文章に含まれる単語ではなく、章題を指定する。これにより文書の中での大まかな添削を行うことが可能となる。これにより、文章の骨格を作成する段階での添削も可能である。
【0059】
また、上記実施形態では、各装置が隣接しているものとして説明した。しかし、各装置を別のコンピュータとして実現し、バスやUSB規格に準拠したケーブル、インターネット等の手段を用いて接続するようにしてもよい。また、接続は有線接続であってもよいがその一部又は全部を無線による接続としてもよい。
【0060】
更に、上記実施形態では、プログラムが、文章添削装置に予め記憶されているものとして説明した。しかし、コンピュータを、文章添削装置の全部又は一部として動作させ、あるいは、上述の処理を実行させるためのプログラムを、フレキシブルディスク、CD−ROM(Compact Disc Read-Only Memory)、DVD(Digital Versatile Disc)、MO(Magneto Optical Disk(Disc))BD(Blu-ray Disc)等のコンピュータ読み取り可能な記録媒体に格納して配布し、これを別のコンピュータにインストールし、上述の手段として動作させ、あるいは、上述の工程を実行させてもよい。
【0061】
さらに、インターネット上のサーバ装置が有するディスク装置等にプログラムを格納しておき、例えば、搬送波にプログラムを重畳させて、コンピュータにダウンロード等してプログラムを実行してもよい。
【0062】
なお、本発明の実施形態である文章添削装置は、ハードウェアにより実現することもできるが、コンピュータをその文章添削装置として機能させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
【0063】
また、本発明の実施形態による文章添削方法は、ハードウェアにより実現することもできるが、コンピュータにその方法を実行させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
【0064】
また、上述した実施形態は、本発明の好適な実施形態ではあるが、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。例えば上述の説明においては各装置を機能毎に分類して図示したが単一の装置により各機能を実現するようにしてもよい。
【0065】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0066】
(付記1) 添削対象の文書の添削を行う添削装置において、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備えることを特徴とする添削装置。
【0067】
(付記2) 付記1に記載の添削装置において、
前記算出した文章間の距離が近いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数が多いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数がゼロの場合は前記関連度をゼロとする、ことにより前記関連度を算出することを特徴とする添削装置。
【0068】
(付記3) 付記1又は2に記載の添削装置において、
前記関連度は文章の前後関係を加味して、自身より前に位置する文章との関連度である前関連度と、自身より後ろに位置する文章との関連度である後関連度と、の2つの関連度を算出しており、
前記第1の文章の前の文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記前関連度が高い文章を漏れている文章の候補として出力し、前記第1の文章の後ろの文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記後関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削装置。
【0069】
(付記4) 付記1乃至3の何れか1に記載の添削装置において、
前記漏れている文章の候補として、前記第2の文章との関連度が高い順に複数の文章を出力することを特徴とする添削装置。
【0070】
(付記5) 付記1乃至4の何れか1に記載の添削装置において、
前記キーワードとは、文章の中の単語であって他の文章と関連性が出やすい単語であり、予めユーザに指定された単語であることを特徴とする添削装置。
【0071】
(付記6) 付記1乃至5の何れか1に記載の添削装置において、
前記テンプレート文書及び添削文書を句点で区切り、当該区切った文をそれぞれ前記文章として扱うことを特徴とする添削装置。
【0072】
(付記7) 付記1乃至6の何れか1に記載の添削装置において、
前記キーワードに変えて章題を用いることを特徴とする添削装置。
【0073】
(付記8) 添削対象の文書の添削を行う添削装置が行う添削方法において、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削方法。
【0074】
(付記9) 添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラム。
【産業上の利用可能性】
【0075】
本発明は、ソフトウェア設計や、報告書等を含む一定の書式が定まっており、内容に
記載漏れがあってはならない文書の添削に好適である。
【符号の説明】
【0076】
100 文章添削装置
101 関連度算出部
102 テンプレート/関連度格納部
103 添削文章抽出部
200 入力装置
300 出力装置

【特許請求の範囲】
【請求項1】
添削対象の文書の添削を行う添削装置において、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備えることを特徴とする添削装置。
【請求項2】
請求項1に記載の添削装置において、
前記算出した文章間の距離が近いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数が多いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数がゼロの場合は前記関連度をゼロとする、ことにより前記関連度を算出することを特徴とする添削装置。
【請求項3】
請求項1又は2に記載の添削装置において、
前記関連度は文章の前後関係を加味して、自身より前に位置する文章との関連度である前関連度と、自身より後ろに位置する文章との関連度である後関連度と、の2つの関連度を算出しており、
前記第1の文章の前の文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記前関連度が高い文章を漏れている文章の候補として出力し、前記第1の文章の後ろの文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記後関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削装置。
【請求項4】
請求項1乃至3の何れか1項に記載の添削装置において、
前記漏れている文章の候補として、前記第2の文章との関連度が高い順に複数の文章を出力することを特徴とする添削装置。
【請求項5】
請求項1乃至4の何れか1項に記載の添削装置において、
前記キーワードとは、文章の中の単語であって他の文章と関連性が出やすい単語であり、予めユーザに指定された単語であることを特徴とする添削装置。
【請求項6】
請求項1乃至5の何れか1項に記載の添削装置において、
前記テンプレート文書及び添削文書を句点で区切り、当該区切った文をそれぞれ前記文章として扱うことを特徴とする添削装置。
【請求項7】
請求項1乃至6の何れか1項に記載の添削装置において、
前記キーワードに変えて章題を用いることを特徴とする添削装置。
【請求項8】
添削対象の文書の添削を行う添削装置が行う添削方法において、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削方法。
【請求項9】
添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2012−230539(P2012−230539A)
【公開日】平成24年11月22日(2012.11.22)
【国際特許分類】
【出願番号】特願2011−98247(P2011−98247)
【出願日】平成23年4月26日(2011.4.26)
【出願人】(390001395)NECシステムテクノロジー株式会社 (438)
【Fターム(参考)】