文書処理装置およびプログラム
【課題】構文的にわかりにくい文を自動的に検出し、ユーザに対して提示することが可能な文書処理装置およびプログラムを提供することにある。
【解決手段】ルール格納手段は、構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納する。入力手段は、ユーザによって指定された文を入力する。解析手段は、入力手段によって入力された文の構造を解析する。判定手段は、解析手段による解析結果に基づいて、入力手段によって入力された文がルール格納手段に格納されている条件を満たすかを判定する。出力手段は、条件を満たすと判定手段によって判定された場合、入力手段によって入力された文の構造および当該条件に対応づけてルール格納手段に格納されている当該条件に応じたメッセージを出力する。
【解決手段】ルール格納手段は、構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納する。入力手段は、ユーザによって指定された文を入力する。解析手段は、入力手段によって入力された文の構造を解析する。判定手段は、解析手段による解析結果に基づいて、入力手段によって入力された文がルール格納手段に格納されている条件を満たすかを判定する。出力手段は、条件を満たすと判定手段によって判定された場合、入力手段によって入力された文の構造および当該条件に対応づけてルール格納手段に格納されている当該条件に応じたメッセージを出力する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、わかりやすい文の作成を支援するための文書処理装置およびプログラムに関する。
【背景技術】
【0002】
一般的に、わかりやすい文(文書)を作成するためには、わかりにくい(読みにくい)文を発見し、当該文を修正する作業が必要である。
【0003】
ところで、わかりにくい文となる要因には、例えば語彙的な要因および構文的な要因等の様々な要因がある。これらの要因の中でも構文的な要因が主要なものであり、当該構文的な要因によるわかりにくい文の場合、例えば翻訳において翻訳者が内容を誤解する、または機械翻訳において誤訳が発生する等、及ぼす影響が大きい。
【0004】
なお、構文的な要因は、例えば主語と述語の対応の誤り等、文における係り受け関係のわかりにくさに基づくものが多い。
【0005】
このような係り受け関係の誤解を防ぐために、例えば文の係り受け関係をユーザに提示し、当該ユーザが必要に応じて係り受け関係を修正することが考えられる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2001−51998号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記したように文の係り受け関係をユーザに提示すれば、当該係り受け関係がわかりにくい場合に当該ユーザが文を修正することができる。
【0008】
しかしながら、この場合、文がわかりにくい文であるか否かにかかわらず、全ての文の係り受け関係をユーザは確認しなければならない。
【0009】
したがって、例えばユーザによって作成された文の中からわかりにくい文を検出し、当該わかりにくい文のみをユーザに提示することが好ましい。
【0010】
また、わかりにくい文は、一般的に文を作成したユーザ本人は正しく理解できるが、第三者が誤解する危険性を含んでいるものである。したがって、わかりにくい文の検出は、文を作成したユーザ本人が行うのではなく、客観的に行われることが望ましい。
【0011】
そこで、本発明が解決しようとする課題は、構文的にわかりにくい文を自動的に検出し、ユーザに対して提示することが可能な文書処理装置およびプログラムを提供することにある。
【課題を解決するための手段】
【0012】
実施形態に係る文書処理装置は、ルール格納手段と、入力手段と、解析手段と、判定手段と、提示手段とを具備する。
【0013】
ルール格納手段は、構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納する。
【0014】
入力手段は、ユーザによって指定された文を入力する。
【0015】
解析手段は、前記入力された文の構造を解析する。
【0016】
判定手段は、前記解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定する。
【0017】
提示手段は、前記条件を満たすと判定された場合、前記入力された文の構造および当該条件に対応づけて前記ルール格納手段に格納されている当該条件に応じたメッセージを前記ユーザに対して提示する。
【図面の簡単な説明】
【0018】
【図1】実施形態に係る文書処理装置のハードウェア構成を示すブロック図。
【図2】図1に示す文書処理装置30の主として機能構成を示すブロック図。
【図3】図2に示す悪文検出ルール格納部22のデータ構造の一例を示す図。
【図4】本実施形態に係る文書処理装置30の処理手順を示すフローチャート。
【図5】言語解析部32による対象文の構文解析結果の一例を示す図。
【図6】節構造生成部34によって生成された対象文の節構造の一例を示す図。
【図7】候補構造生成部35によって生成された対象文の候補構造の一例を示す図。
【図8】悪文検出結果がユーザに対して表示された場合の表示画面の一例を示す図。
【図9】ユーザによる対象文を修正する操作について具体的に説明するための図。
【図10】修正結果格納部23に格納された修正節構造を用いて対象文が構文解析された場合の構文解析結果の一例を示す図。
【図11】悪文検出部33による悪文判定処理の処理手順を示すフローチャート。
【図12】節構造生成部34による節構造生成処理の処理手順を示すフローチャート。
【図13】候補構造生成部35による候補構造生成処理の処理手順を示すフローチャート。
【発明を実施するための形態】
【0019】
以下、図面を参照して、実施形態について説明する。
【0020】
図1は、本実施形態に係る文書処理装置のハードウェア構成を示すブロック図である。図1に示すように、コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。この外部記憶装置20は、コンピュータ10によって実行されるプログラム21を格納する。コンピュータ10および外部記憶装置20は、文書処理装置30を構成する。
【0021】
この文書処理装置30は、構文的にわかりにくい文(以下、悪文と表記)を自動的に検出する機能を有する。
【0022】
図2は、図1に示す文書処理装置30の主として機能構成を示すブロック図である。図2に示すように、文書処理装置30は、入力部31、言語解析部32、悪文検出部33、節構造生成部34、候補構造生成部35、出力部36および対象文修正部37を含む。本実施形態において、これらの各部31〜37は、図1に示すコンピュータ10が外部記憶装置20に格納されているプログラム21を実行することにより実現されるものとする。このプログラム21は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム21が、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。
【0023】
また、文書処理装置30は、悪文検出ルール格納部22および修正結果格納部23を含む。本実施形態において、悪文検出ルール格納部22および修正結果格納部23は、例えば図1に示す外部記憶装置20に格納される。
【0024】
悪文検出ルール格納部22には、悪文(構文的にわかりにくい文)を検出するためのルール(悪文検出ルール)が予め格納されている。悪文検出ルール格納部22には、悪文検出ルールとして、悪文を検出するための予め定められた条件および当該条件に応じたメッセージが格納されている。悪文検出ルール格納部22に格納されている条件には、例えば動詞(動詞、形容詞等を含む用言)を含む文節と当該文節に対して予め定められた係り受け関係にある名詞(名詞、代名詞等を含む体言)を含む文節との間の文節数が予め定められた数以上であること(を示す条件)等が含まれる。
【0025】
なお、悪文検出ルール格納部22に格納されている条件(悪文を検出するための予め定められた条件)は、後述する判定項目および判定基準によって表される。
【0026】
入力部31は、例えばキーボードおよびマウス等に対するユーザの操作に応じて、当該ユーザからの指示を受け付ける機能を有する。入力部31は、ユーザによって指定された文(悪文か否かの評価対象となる文)を入力する。入力部31によって入力される文は、例えば動詞、名詞または形容詞等を含む文節を含む複数の文節から構成される。
【0027】
言語解析部32は、入力部31によって入力された文(以下、対象文と表記)の構造を解析する。具体的には、言語解析部32は、対象文に対して構文解析および形態素解析を行う。構文解析によれば、複数の文節から構成される対象文が文節毎に分割され、当該文節間に係り受け関係が付与される。一方、形態素解析によれば、対象文が形態素毎に分割され、当該各形態素に品詞が付与される。
【0028】
悪文検出部33は、悪文検出ルール格納部22に格納されている条件および言語解析部32による解析結果に基づいて、対象文が悪文であるか否かを判定する。この場合、悪文検出部33は、悪文検出ルール格納部22に格納されている条件を対象文が満たすか否かを判定する。
【0029】
悪文検出部33は、悪文検出ルール格納部22に格納されている条件を対象文が満たすと判定された場合には、対象文が悪文であると判定する。一方、悪文検出部33は、悪文検出ルール格納部22に格納されている条件を対象文が満たさないと判定された場合には、当該対象文が悪文でないと判定する。
【0030】
節構造生成部34は、言語解析部32による解析結果に基づいて、対象文の節構造(を示す節構造データ)を生成する。なお、節構造生成部34によって生成される対象文の節構造は、当該対象文の構造を表し、当該対象文を構成する文節からなる節から構成される。
【0031】
候補構造生成部35は、言語解析部32による解析結果に基づいて、対象文の候補構造(を示す候補構造データ)を生成する。なお、候補構造生成部35によって生成される対象文の候補構造は、対象文の節構造の候補を表し、節構造生成部34によって生成される対象文の節構造とは異なる節構造である。
【0032】
出力部36は、悪文検出ルール格納部22に格納されている条件を対象文が満たすと悪文検出部33によって判定された場合(つまり、対象文が悪文であると判定された場合)、当該対象文が悪文である旨を示す悪文検出結果を出力する。これにより、出力部36は、悪文検出結果をユーザに対して提示する。出力部36によって出力される悪文検出結果には、悪文検出部33によって対象文が満たすと判定された条件に対応づけて悪文検出ルール格納部22に格納されている当該条件に応じたメッセージ、節構造生成部34によって生成された対象文の節構造(つまり、対象文の構造)および候補構造生成部35によって生成された対象文の候補構造が含まれる。
【0033】
なお、ユーザは、提示された悪文検出結果を参照して、対象文または当該対象文の節構造を修正する操作を文書処理装置30に対して行うことができる。このユーザによって対象文または当該対象文の節構造を修正する操作が行われると、入力部31は、当該ユーザの操作に応じて、対象文または当該対象文の節構造に対する修正指示を受け付ける。
【0034】
対象文修正部37は、対象文または当該対象文の節構造に対する修正指示が入力部31によって受け付けられると、ユーザの操作に応じて対象文または当該対象文の節構造を修正する。対象文修正部37は、対象文または当該対象文の節構造に対する修正結果を修正結果格納部23に格納する。
【0035】
図3は、図2に示す悪文検出ルール格納部22のデータ構造の一例を示す。悪文検出ルール格納部22には、条件およびメッセージが対応づけて予め格納されている。悪文検出ルール格納部22に格納されている条件は、悪文を検出するための条件であり、判定項目および判定基準を含む。
【0036】
図3に示す例では、悪文検出ルール格納部22には、判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」、判定基準「5以上」およびメッセージ「主語と述語が離れています」が対応づけて格納されている。これによれば、「動詞を含む文節と、当該文節に対して「が格」で係り受け関係にある名詞を含む文節との間の文節数が5以上である」という条件に応じたメッセージが「主語と述語が離れています」であることが示されている。
【0037】
また、悪文検出ルール格納部22には、判定項目「動詞と「を格」で係り受け関係にある名詞との間の文節数」、判定基準「6以上」およびメッセージ「目的語と述語が離れています」が対応づけて格納されている。これによれば、「動詞を含む文節と、当該文節に対して「を格」で係り受け関係にある名詞を含む文節との間の文節数が6以上である」という条件に応じたメッセージが「目的語と述語が離れています」であることが示されている。
【0038】
更に、悪文検出ルール格納部22には、判定項目「動詞に対して「が格」で係り受け関係にある名詞の有無」、判定基準「無し」およびメッセージ「主語がありません」が対応づけて格納されている。これによれば、「動詞を含む文節に対して「が格」で係り受け関係にある名詞を含む文節が無い」という条件に応じたメッセージが「主語がありません」であることが示されている。
【0039】
次に、図4のフローチャートを参照して、本実施形態に係る文書処理装置30の処理手順について説明する。
【0040】
まず、入力部31は、ユーザの操作に応じて、当該ユーザによって指定された文を入力する(ステップS1)。入力部31によって入力される文は、複数の文節から構成される。また、入力部31によって入力される文を構成する複数の文節には、例えば動詞、名詞または形容詞を含む文節が含まれる。
【0041】
なお、入力部31は、ユーザによって例えばキーボード等から直接入力された文を入力してもよいし、ユーザによって指定された既存のファイル(文書)から文を読み込んでも構わない。
【0042】
次に、言語解析部32は、入力部31によって入力された文(対象文)を解析する(ステップS2)。このとき、言語解析部32は、対象文に対して構文解析および形態素解析を行う。
【0043】
ここで、図5は、言語解析部32による対象文の構文解析結果の一例を示す。ここでは、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」に対する構文解析結果を示す。構文解析によれば、対象文を構成する複数の文節間に係り受け関係が付与される。なお、対象文を構成する文節の各々は、少なくとも1つ以上の単語からなる。
【0044】
構文解析結果においては、複数の文節から構成される対象文が文節毎に分割される。図5に示す構文解析結果によれば、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」は、文節「薬品は」、「中」、「濃度に」、「濃縮し」、「装置の」、「連続」、「運転を」、「可能に」および「する」に分割されている。
【0045】
なお、図5においては、便宜的に、対象文を構成する各文節における最初の単語(文節の語幹)のみが記されている。また、対象文を構成する文節における最初の単語には、当該単語の品詞が付与されている。図5において、「<V>」は動詞を示し、「<N>」は名詞を示し、「<A>」は形容詞を示す。したがって、図5に示す構文解析結果における例えば「する<V>」は、対象文を構成する複数の文節のうち、文節における最初の単語が動詞の「する」である文節「する」を表している。また、「薬品<N>」は、対象文を構成する複数の文節のうち、文節における最初の単語が名詞の「薬品」である文節「薬品は」を表している。同様に、「可能<A>」は、対象文を構成する複数の文節のうち、文節における最初の単語が形容詞の「可能」である文節「可能に」を表している。
【0046】
また、構文解析結果においては、係り受け関係にある2つの文節間に矢印が付与されている(つまり、2つの文節間が矢印で結ばれている)。なお、構文解析結果における矢印の先が係り受け先の文節を示し、矢印の元が係り受け元の文節を示す。これによって、矢印の先と元との文節間に係り受け関係があることが示される。
【0047】
また、構文解析結果においては、必要に応じて矢印に2つの文節の係り受け関係が付与されている。矢印に例えば「ga」が付与されているときは、当該矢印の先と元との文節間の係り受け関係が「が格」であることを意味する。また、矢印に例えば「wo」が付与されているときは、当該矢印の先と元との文節間の係り受け関係が「を格」であることを意味する。
【0048】
図5に示す構文解析結果によれば、文節「薬品は」および文節「する」の係り受け関係が「が格」であることが示されている。また、図5に示す構文解析結果によれば、文節「運転を」および文節「する」の係り受け関係が「を格」であることが示されている。
【0049】
なお、詳しい説明については省略するが、上記した対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」が形態素解析された場合には、当該対象文が形態素に分割され、当該各形態素に品詞が付与される。
【0050】
再び図4に戻ると、悪文検出部33は、言語解析部32による解析結果(対象文の構文解析結果および形態素解析結果)および悪文検出ルール格納部22に格納されている条件(に含まれる判定項目および判定基準)に基づいて、対象文が悪文であるか否かを判定する処理(以下、悪文判定処理と表記)を実行する(ステップS3)。この悪文判定処理においては、悪文検出ルール格納部22に格納されている条件を対象文が満たすか否かが判定される。悪文判定処理において、悪文検出ルール格納部22に格納されている条件を対象文が満たさないと判定された場合には、当該対象文が悪文でないと判定される。一方、悪文判定処理において、悪文検出ルール格納部22に格納されている条件を対象文が満たすと判定された場合には、当該対象文が悪文であると判定される。なお、悪文判定処理の詳細については後述する。
【0051】
悪文判定処理の結果として対象文が悪文でないと判定された場合(ステップS4のNO)、処理は終了される。
【0052】
一方、悪文判定処理の結果として対象文が悪文であると判定された場合(ステップS4のYES)、節構造生成部34は、当該対象文の構文解析結果に基づいて、当該対象文の節構造を生成する処理(以下、節構造生成処理と表記)を実行する(ステップS5)。節構造生成部34によって生成される対象文の節構造は、ユーザに対して当該対象文の節構造をわかりやすく提示するためのデータである。
【0053】
なお、節構造生成部34によって生成される対象文の節構造は、対象文を構成する文節からなる節から構成される。
【0054】
ここで、図6は、節構造生成部34によって生成された対象文の節構造の一例を示す。図6に示す対象文の節構造においては、当該節構造を構成する節の各々が1つのまとまりとして破線の枠で囲まれている。
【0055】
つまり、図6に示す対象文の節構造は、「薬品は」、「中濃度に濃縮し」、「装置の連続運転を」および「可能に」の4つの節から構成されている。
【0056】
なお、図6に示すような対象文の節構造を生成する節構造生成処理の詳細については後述する。
【0057】
再び図4に戻ると、候補構造生成部35は、対象文の構文解析結果および形態素解析結果に基づいて、対象文の候補構造を生成する処理(以下、候補構造生成処理と表記)を実行する(ステップS6)。候補構造生成処理においては、対象文を構成する複数の文節のうちの動詞を含む文節および当該文節の前方の文節からなる節から構成される対象文の候補構造が生成される。なお、候補構造生成部35によって生成される対象文の候補構造は、上記した節構造生成部34によって生成された対象文の節構造とは異なる。
【0058】
ここで、図7は、候補構造生成部35によって生成された対象文の候補構造の一例を示す。図7に示す対象文の候補構造においては、当該対象文の候補構造を構成する節の各々が1つのまとまりとして破線の枠で囲まれている。
【0059】
つまり、図7に示す対象文の候補構造は、「薬品は中濃度に濃縮し」および「装置の連続運転を可能にする」の2つの節から構成されている。
【0060】
なお、図7に示すような対象文の候補構造を生成する候補構造生成処理の詳細については後述する。
【0061】
再び図4に戻ると、出力部36は、対象文が悪文である旨を示す悪文検出結果を出力する。これによって、悪文検出結果がユーザに対して提示(表示)される(ステップS7)。出力部36によって出力された悪文検出結果には、悪文検出部33によって満たすと判定された条件に対応づけて悪文検出ルール格納部22に格納されている当該条件に応じたメッセージ、節構造生成部34によって生成された対象文の節構造および候補構造生成部35によって生成された対象文の候補構造が含まれる。
【0062】
ここで、図8は、悪文検出結果がユーザに対して表示された場合の表示画面の一例を示す。
【0063】
図8に示す表示画面100は、対象文が「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」であり、節構造生成部34によって図6に示す対象文の節構造が生成され、候補構造生成部35によって図7に示す対象文の候補構造が生成された場合の表示画面の一例である。
【0064】
図8に示す表示画面100においては、上段に対象文の節構造が表示されており、下段に対象文の候補構造が表示されている。
【0065】
ここで、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」は、図3に示す悪文検出ルール格納部22に格納されている判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」および判定基準「5以上」を含む条件を満たすものとする。この場合、表示画面100には、対象文が満たす条件に対応づけて悪文検出ルール格納部22に格納されているメッセージ「主語と述語が離れています」が例えば対象文の節構造とともに表示される。
【0066】
また、表示画面100には、対象文が満たす条件に応じて矢印が対象文の節構造とともに表示されている。図8に示す例では、表示画面100には、対象部の節構造において、動詞(つまり、述語)を含む文節と当該文節に対して「が格」で係り受け関係にある名詞(つまり、主語)を含む文節との位置関係が矢印を用いて表示されている。
【0067】
なお、表示画面100において、対象文の候補構造は、当該対象文の節構造の修正候補として表示されている。
【0068】
ユーザは、このような表示画面100を確認して、文書処理装置30に対して対象文または当該対象文の節構造を修正する操作を行うことができる。対象文または当該対象文の節構造を修正する操作がユーザによって行われると、入力部31は、当該ユーザの操作に応じて、対象文または当該対象文の節構造に対する修正指示を受け付ける。
【0069】
具体的には、ユーザによって対象文を修正する操作が行われた場合には、入力部31は、当該操作に応じて、ユーザによる対象文に対する修正指示を受け付ける。
【0070】
ここで、図9を参照して、ユーザによる対象文を修正する操作について具体的に説明する。ここでは、対象文が例えば「ジョブの実行は、オンライン、オフラインといった処理形態に関わらず、システム内部では一貫して処理される。」であるものとする。
【0071】
この場合、ユーザは、図9に示すように対象文「ジョブの実行は、オンライン、オフラインといった処理形態に関わらず、システム内部では一貫して処理される。」を例えば「オンライン、オフラインといった処理形態に関わらず、ジョブの実行は、システム内部では一貫して処理される。」に修正する操作を文書処理装置30に対して行うことができる。
【0072】
この場合、ユーザは、対象文を修正する操作として、例えば上記した表示画面に表示された対象文の文字列をマウス等を用いて移動させるような操作を行ってもよいし、修正後の対象文を直接指定(入力)するような操作を行ってもよい。
【0073】
図9を用いて具体的に説明すると、ユーザは、対象文「ジョブの実行は、オンライン、オフラインといった処理形態に関わらず、システム内部では一貫して処理される。」に含まれる「ジョブの実行は、」の文字列の位置を修正後の位置に移動させる操作をしてもよいし、「オンライン、オフラインといった処理形態に関わらず、ジョブの実行は、システム内部では一貫して処理される。」の文(修正後の対象文)を直接指定する操作をしてもよい。
【0074】
一方、ユーザによって対象文の節構造を修正する操作が行われた場合には、入力部31は、当該操作に応じて、ユーザによる対象文の節構造に対する修正指示を受け付ける。なお、ユーザは、対象文の節構造を修正する操作として、例えば上記した表示画面100に表示された対象文の候補構造を選択する操作を行うことができる。また、ユーザは、対象文の節構造を修正する操作として、修正後の対象文の節構造を直接指定するような操作を行っても構わない。
【0075】
ここで、対象文修正部37は、ユーザによる対象文に対する修正指示が入力部31によって受け付けられたか否かを判定する(ステップS8)。
【0076】
ユーザによる対象文に対する修正指示が入力部31によって受け付けられたと判定された場合(ステップS8のYES)、対象文修正部37は、ユーザの操作に応じて対象文を修正する(ステップS9)。具体的には、ユーザによって対象文の文字列を移動させるような操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文を当該文字列が移動された後の対象文に修正する。一方、ユーザによって修正後の対象文を直接指定する操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文を当該指定された修正後の対象文に修正する。
【0077】
ステップS8の処理が実行されると、対象文修正部37は、修正された対象文(以下、修正対象文と表記)を修正結果格納部23に対して出力する(ステップS10)。これにより、修正対象文は、修正結果格納部23に格納される。
【0078】
このようにステップS10の処理が実行されると、上記したステップS2に戻って処理が繰り返される。ここでは、修正結果格納部23に格納された修正対象文に対してステップS2以降の処理が繰り返される。
【0079】
一方、ステップS8においてユーザによる対象文に対する修正指示が入力部31によって受け付けられていないと判定された場合、対象文修正部37は、ユーザによる対象文の節構造に対する修正指示が入力部31によって受け付けられたか否かを判定する(ステップS11)。
【0080】
ユーザによる対象文の節構造に対する修正指示が入力部31によって受け付けられたと判定された場合(ステップS11のYES)、対象文修正部37は、ユーザの操作に応じて対象文の節構造を修正する(ステップS12)。具体的には、ユーザによって対象文の候補構造を選択する操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文の節構造を当該選択された対象文の候補構造(つまり、ユーザに対して提示された対象文の候補構造)に修正する。一方、ユーザによって修正後の対象文の節構造を直接指定する操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文の節構造を当該指定された修正後の対象文の節構造に修正する。
【0081】
ステップS12の処理が実行されると、対象文修正部37は、修正された対象文の節構造(以下、修正節構造と表記)を修正結果格納部23に対して出力する(ステップS10)。これにより、修正節構造は、修正結果格納部23に格納される。
【0082】
なお、修正節構造は、対象文にタグ(例えば、SGMLタグ)が付与された形式で修正結果格納部23に対して出力される。例えば図8に示す対象文の候補構造を選択する操作がユーザによって行われた場合、修正節構造は、例えば「<clause>薬品は中濃度に濃縮し</clause>、<clause>装置の連続運転を可能にする</clause>。」という形式で出力される。ここで、「<clause>」および「</clause>」は、節構造(を構成する節)を示すタグである。なお、修正結果格納部23に対して出力される修正節構造の形式は、後の処理に利用できる形式であれば構わない。
【0083】
このようにステップS10の処理が実行されると、上記したステップS2に戻って処理が繰り返される。このステップS2の処理においては、修正結果格納部23に格納された修正節構造を用いて対象文に対する構文解析処理が実行される。なお、修正結果格納部23に格納された修正節構造は、例えば対象文に対する機械翻訳処理等、他の処理において用いられても構わない。
【0084】
ここで、上記した修正節構造「<clause>薬品は中濃度に濃縮し</clause>、<clause>装置の連続運転を可能にする</clause>。」が修正結果格納部23に格納されたものとする。この場合において、修正結果格納部23に格納された修正節構造を用いてステップS2の処理(ここでは、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」に対する構文解析処理)が実行されると、当該修正節構造を構成する各節(ここでは、「薬品は中濃度に濃縮し」および「装置の連続運転を可能にする」の各節)が1つのまとまりとなるような構文解析結果が得られる。具体的には、例えば図10に示すような構文解析結果が得られる。
【0085】
なお、ステップS11においてユーザによる対象文の節構造に対する修正指示が入力部31によって受け付けられていないと判定された場合、処理は終了される。
【0086】
次に、図11のフローチャートを参照して、上述した悪文検出部33による悪文判定処理(図4に示すステップS3の処理)の処理手順について説明する。
【0087】
この悪文判定処理においては、対象文の構文解析結果に対して悪文検出ルール格納部22に格納されている条件が順に適用されることにより、対象文が当該条件を満たすか否かが判定される。
【0088】
まず、悪文検出部33は、悪文検出ルール格納部22に格納されている条件(例えば、1つ目の条件)を対象文の構文解析結果に適用する(ステップS21)。
【0089】
次に、悪文検出部33は、対象文の構文解析結果に適用された条件を当該対象文が満たすか否かを判定する(ステップS22)。ステップS22の処理においては、対象文の構文解析結果に適用された条件に含まれる判定項目の値(内容)が判定基準を満たす場合には、対象文が条件を満たすと判定される。
【0090】
対象文の構文解析結果に適用された条件を対象文が満たすと判定された場合(ステップS22のYES)、悪文検出部33は、対象文が悪文であると判定する(ステップS23)。ステップS23の処理が実行されると、悪文判定処理は終了される。
【0091】
一方、対象文の構文解析結果に適用された条件を対象文が満たさないと判定された場合(ステップS22のNO)、悪文検出部33は、悪文検出ルール格納部22に対象文の構文解析結果に適用されていない条件があるか否かを判定する(ステップS24)。
【0092】
対象文の構文解析結果および形態素解析結果に適用されていない条件があると判定された場合(ステップS24のYES)、ステップS21に戻って処理が繰り返される。この場合、ステップS21においては、対象文の構文解析結果に適用されていない条件(例えば、2つ目の条件)が当該対象文の構文解析結果に適用される。
【0093】
一方、対象文の構文解析結果に適用されていない条件がないと判定された場合(ステップS24のNO)、悪文検出部33は、対象文が悪文でないと判定する(ステップS25)。ステップS25の処理が実行されると、悪文判定処理は終了される。
【0094】
上記したように悪文判定処理においては、悪文検出ルール格納部22に格納されている条件(例えば、1つ目の条件)を対象文が満たすと判定された場合には、対象文が悪文であると判定され、悪文判定処理は終了される。この場合、悪文検出ルール格納部22に格納されている以降の条件(例えば、2つ目以降の条件)は対象文の構文解析結果に適用されない。つまり、悪文判定処理においては、悪文検出ルール格納部22に格納されている条件のうちの1つを満たすと判定された時点で以降の条件については適用が中止される。
【0095】
一方、悪文判定処理においては、悪文検出ルール格納部22に格納されている1つの条件を対象文が満たさないと判定された場合には、次の条件が対象文の構文解析結果に適用されて対象文が当該条件を満たすか否かが判定される。つまり、悪文判定処理においては、悪文検出ルール格納部22に格納されている全ての条件を対象文が満たさないと判定された場合にのみ、対象文が悪文でないと判定される。
【0096】
ここで、対象文が「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」である場合における悪文判定処理について、上述した図3および図5を用いて具体的に説明する。
【0097】
なお、便宜的に、図3に示す悪文検出ルール格納部22に格納されている判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」および判定基準「5以上」を含む条件を第1の条件、判定項目「動詞と「を格」で係り受け関係にある名詞との間の文節数」および判定基準「6以上」を含む条件を第2の条件、判定項目「動詞に対して「が格」で係り受け関係にある名詞の有無」および判定基準「無し」を含む条件を第3の条件と称する。
【0098】
まず、悪文検出部33は、図3に示す悪文検出ルー格納部22に格納されている第1の条件を対象文の構文解析結果に適用する。
【0099】
この場合、悪文検出部33は、上記した対象文の構文解析結果(図5に示す構文解析結果)から動詞を含む文節と当該文節に対して「が格」で係り受け関係にある名詞を含む文節とを抽出する。ここでは、対象文の構文解析結果から、動詞を含む文節として文節「する」が抽出され、当該文節「する」に対して「が格」で係り受け関係にある名詞を含む文節として文節「薬品は」が抽出される。
【0100】
ここで、例えば対象文の構文解析結果(および対象文の形態素解析結果)によれば、構文解析結果から抽出された文節「する」と文節「薬品は」との間には文節「中」、「濃度に」、「濃縮し」、「装置の」、「連続」、「運転を」および「可能に」の7つの文節が存在する。このため、対象文の構文解析結果に適用された第1の条件に含まれる判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」の値は7である。
【0101】
この場合、悪文検出部33は、第1の条件、つまり、「動詞を含む文節と、当該文節に対して「が格」で係り受け関係にある名詞を含む文節との間の文節数が5以上である」という条件を対象文が満たすと判定する。この場合、悪文検出部33は、対象文が悪文であると判定する。
【0102】
ここでは、悪文検出ルール格納部22に格納されている第1の条件を対象文が満たす場合について説明したが、例えば当該第1の条件を対象文が満たさないと判定された場合には、当該悪文検出ルール格納部22に格納されている第2の条件が対象文の構文解析結果に適用される。このように、悪文検出ルール格納部22に格納されている条件は順に適用される。
【0103】
なお、上述したように例えば対象文の節構造が修正され、図10に示す構文解析結果が得られた場合には、詳細な説明は省略するが、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」は、図3に示す悪文検出ルール格納部22に格納されている第1の条件を満たさない。つまり、対象文の節構造が修正される前には第1の条件を満たしていたのに対し、対象文の節構造が修正されることによって対象文が第1の条件を満たさなくなる。
【0104】
上記した悪文判定処理においては、悪文検出ルール格納部22に格納されている条件の1つを満たすと判定された時点で対象文が悪文であると判定されて処理が終了するものとして説明したが、当該悪文検出ルール格納部22に格納されている条件の1つを満たすと判定された場合であっても当該悪文検出ルール格納部22に格納されている全ての条件について満たすか否かの判定が行われても構わない。この場合、悪文検出ルール格納部22に格納されている条件のうち満たすと判定された条件毎の悪文検出結果がユーザに対して提示される。
【0105】
次に、図12のフローチャートを参照して、上述した節構造生成部34による節構造生成処理(図4に示すステップS5の処理)の処理手順について説明する。
【0106】
この節構造生成処理においては、言語解析部32による解析結果(対象文の構文解析結果)に基づいて当該対象文の節構造が生成される。なお、対象文の節構造は、例えば当該対象文を構成する文節からなる節から構成される。
【0107】
まず、節構造生成部34は、対象文の構文解析結果における最上位の文節に接続する文節を抽出する(ステップS31)。
【0108】
次に、節構造生成部34は、ステップS31において抽出された文節の各々について以下のステップS32の処理を実行する。以下、ステップS32の処理の対象となる文節を対象文節と称する。
【0109】
節構造生成部34は、対象文節および当該対象文節に対して係り受け元となる全ての文節(に対応する対象文の一部)を対象文の節構造を構成する1つの節とする(ステップS32)。
【0110】
節構造生成部34は、ステップS31において抽出された全ての文節について上記したステップS32の処理が実行されたか否かを判定する(ステップS33)。
【0111】
全ての文節について処理が実行されていないと判定された場合(ステップS33のNO)、上記したステップS32に戻って処理が繰り返される。この場合、ステップS32の処理が実行されていない文節を対象文節として処理が実行される。
【0112】
一方、全ての文節について処理が実行されたと判定された場合(ステップS33のYES)、節構造生成処理は終了される。
【0113】
ここで、図5に示す構文解析結果を参照して、節構造生成部34による節構造生成処理について具体的に説明する。
【0114】
この場合、節構造生成処理において、節構造生成部34は、図5に示す構文解析結果における最上位の文節である文節「する」に接続する文節「薬品は」、「濃縮し」、「運転を」および「可能に」を抽出する。
【0115】
次に、節構造生成部34によって抽出された文節の各々に対して上記した図11に示すステップS32の処理が実行される。
【0116】
まず、節構造生成部34によって抽出された文節のうちの文節「薬品は」に対して係り受け元となる文節は、図5に示す構文解析結果には存在しない。したがって、節構造生成部34は、「薬品は」を対象文の節構造を構成する1つの節とする。
【0117】
次に、図5に示す構文解析結果において、節構造生成部34によって抽出された文節のうちの文節「濃縮し」に対して係り受け元となる文節は、文節「濃度に」および「中」である。したがって、節構造生成部34は、「中濃度に濃縮し」を対象文の節構造を構成する1つの節とする。
【0118】
また、図5に示す構文解析結果において、節構造生成部34によって抽出された文節のうちの文節「運転を」に対して係り受け元となる文節は、文節「装置の」および「連続」である。したがって、節構造生成部34は、「装置の連続運転を」を対象文の節構造を構成する1つの節とする。
【0119】
更に、節構造生成部34によって抽出された文節のうちの文節「可能に」に対して係り受け元となる文節は、図5に示す構文解析結果には存在しない。したがって、節構造生成部34は、「可能に」を対象文の節構造を構成する1つの節とする。
【0120】
つまり、図5に示す構文解析結果(対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」の構文解析結果)を用いて節構造生成処理が実行された場合、上述した図6に示すように「薬品は」、「中濃度に濃縮し」、「装置の連続運転を」および「可能に」の4つの節から構成される対象文の節構造が生成される。
【0121】
ここでは、節構造生成処理において図6に示すような対象文の節構造が生成されるものとして説明したが、対象文の構造をわかりやすくユーザに対して提示できるデータを生成する処理であれば、上記説明した節構造生成処理以外の処理が実行されても構わない。例えば、節構造生成処理において、対象文の構造(節構造)を木構造で表すようなデータが生成されても構わない。
【0122】
次に、図13のフローチャートを参照して、上述した候補構造生成部35による候補構造生成処理(図4に示すステップS6の処理)の処理手順について説明する。
【0123】
この候補構造生成処理においては、言語解析部32による解析結果(対象文の構文解析結果)に基づいて対象文の候補構造(対象文において候補となる節構造)が生成される。なお、対象文の候補構造は、上記した対象文の節構造と同様に、節から構成される。
【0124】
まず、候補構造生成部34は、対象文の構文解析結果から動詞を含む文節を抽出する(ステップS41)。
【0125】
次に、候補構造生成部34は、ステップS41において抽出された動詞を含む文節の各々について以下のステップS42〜S47処理を実行する。以下、ステップS42〜S47処理の対象となる動詞を含む文節を対象文節と称する。
【0126】
候補構造生成部34は、対象文節を、対象文の候補構造に追加する(ステップS42)。
【0127】
候補構造生成部34は、対象文の構文解析結果(および対象文の形態素解析結果)に基づいて、対象文を構成する文節のうち対象文節の前方の文節を取得する(ステップS43)。
【0128】
候補構造生成部34は、対象文の構文解析結果に基づいて、ステップS43において取得された文節における最初の単語の品詞を取得する(ステップS44)。
【0129】
次に、候補構造生成部34は、取得された品詞が名詞または形容詞であるか(つまり、動詞以外である)か否かを判定する(ステップS45)。
【0130】
品詞が名詞または形容詞であると判定された場合(ステップS45のYES)、候補構造生成部34は、ステップS33において取得された文節を、対象文の候補構造に追加する(ステップS46)。このとき、ステップS43において取得された文節は、対象文の候補構造に最後に追加された文節(ここでは、対象文節)の前方に追加される。
【0131】
次に、候補構造生成部34は、対象文の構文解析結果(および形態素解析結果)に基づいて、対象文を構成する複数の文節のうち、ステップS43において取得された文節の前方に文節があるか否かを判定する(ステップS47)。
【0132】
前方に文節があると判定された場合(ステップS47のNO)、ステップS43に戻って処理が繰り返される。このステップS43においては、ステップ47において前方にあると判定された文節が取得される。以下、上記したステップS44以降の処理が実行される。
【0133】
一方、ステップS45において品詞が名詞または形容詞でないと判定された場合およびステップS47において前方に文節がないと判定された場合、この時点で対象文の候補構造に追加されている全ての文節を当該対象文の候補構造を構成する1つの節とする。つまり、候補構造生成処理においては、1つの対象文節に対してステップS42〜ステップS47の処理が実行されることによって、対象文の候補構造を構成する1つの節が生成される。
【0134】
次に、候補構造生成部34は、ステップS41において抽出された動詞を含む文節の全てについて上記したステップS42〜S47の処理が実行されたか否かを判定する(ステップS48)。
【0135】
動詞を含む文節の全てについて処理が実行されていないと判定された場合(ステップS48のNO)、ステップS42に戻って処理が繰り返される。この場合、ステップS42〜S47の処理が実行されていない動詞を含む文節を対象文節として当該ステップS42以降の処理が実行される。なお、ステップS42に戻って処理が繰り返される場合、上記したステップS42〜S47の処理が実行されることによって生成された対象文の候補構造を構成する節とは異なる節が生成される。
【0136】
一方、動詞を含む文節の全てについて処理が実行されたと判定された場合(ステップS38のYES)、候補構造生成処理は終了される。
【0137】
つまり、候補構造生成処理においては、動詞を含む文節毎に、当該文節から品詞(文節における最初の単語の品詞)が名詞または形容詞以外である文節まで順に文節が取得され、当該動詞を含む文節および取得された全ての文節が対象文の候補構造を構成する節とされる。
【0138】
なお、候補構造生成処理において生成された対象文の候補構造は、上述した節構造生成処理において生成された対象文の節構造とは異なる節構造であるものとする。候補構造生成処理において生成された対象文の候補構造が節構造生成処理において生成された対象文の節構造と同一である場合には、当該対象文の候補構造は、ユーザに対して提示されない(つまり、生成されない)構成であってもよい。
【0139】
また、上記した図12において説明した候補構造生成処理は一例であり、例えば対象文の候補構造を用いることによって異なる構文解析結果(つまり、悪文と判定された対象文の構文解析結果とは異なる構文解析結果)を得ることができるような節構造(候補構造)が生成できればよい。例えば、対象文の構文解析結果の中の係り受け可能な2つの文節を取り出し、それらの間の係り受け関係を設定することによって生成される意味係り受けグラフにおける係り受け候補を用いて対象文の候補構造が生成されても構わない。
【0140】
ここで、図5に示す構文解析結果を参照して、候補構造生成部35による候補構造生成処理について具体的に説明する。
【0141】
候補構造生成処理において、候補構造生成部35は、図5に示す構文解析結果から動詞を含む文節を抽出する。この場合、図5に示す構文解析結果において<V>が記されている文節、つまり、最初の単語の品詞が動詞である文節「濃縮し」および「する」が動詞を含む文節として抽出される。
【0142】
次に、候補構造生成部35によって抽出された動詞を含む文節の各々について上記した図12に示すステップS42以降の処理が実行される。
【0143】
まず、候補構造生成部35によって抽出された動詞を含む文節のうち文節「濃縮し」が対象文節(図12に示すステップS42以降の処理の対象となる文節)である場合について説明する。
【0144】
この場合、候補構造生成部35は、対象文節である文節「濃縮し」を、対象文の候補構造に追加する。これにより、対象文の候補構造は、「濃縮し」となる。
【0145】
また、図5に示す構文解析結果(および形態素解析結果)によれば、対象文において対象文節である文節「濃縮し」の前方の文節は文節「濃度に」である。したがって、候補構造生成部35は、図5に示す構文解析結果から文節「濃度に」を取得する。
【0146】
ここで、図5に示す構文解析結果において文節「濃度に」には<N>が記されているため、当該文節「濃度に」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「濃度に」を、対象文の候補構造において対象文節である文節「濃縮し」の前方に追加する。これにより、対象文の候補構造は、「濃度に濃縮し」となる。
【0147】
また、対象文において文節「濃度に」の前方には文節「中」が存在するため、候補構造生成部35は、当該文節「中」を取得する。
【0148】
ここで、図5に示す構文解析結果によれば、文節「中」における最初の単語の品詞は形容詞である。したがって、候補構造生成部35は、取得された文節「中」を、対象文の候補構造に最後に追加された文節「濃度に」の前方に追加する。これにより、対象文の候補構造は、「中濃度に濃縮し」となる。
【0149】
また、対象文において文節「中」の前方には文節「薬品は」が存在するため、候補構造生成部35は、当該文節「薬品は」を取得する。
【0150】
ここで、図5に示す構文解析結果によれば、文節「薬品は」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「薬品は」を、対象文の候補構造に最後に追加された文節「中」の前方に追加する。これにより、対象文の候補構造は、「薬品は中濃度に濃縮し」となる。
【0151】
なお、対象文において文節「薬品は」の前方には文節が存在しない。したがって、対象文節である文節「濃縮し」に対する処理は終了され、この時点での対象文の候補構造「薬品は中濃度に濃縮し」が当該対象文の候補構造を構成する1つの節とされる。
【0152】
次に、候補構造生成部35によって抽出された動詞を含む文節のうち文節「する」が対象文節である場合について説明する。ここでは、上記した対象文の候補構造を構成する節とされた「薬品は中濃度に濃縮し」とは異なる節が生成される。
【0153】
この場合、候補構造生成部35は、対象文節である文節「する」を、対象文の候補構造に追加する。これにより、対象文の候補構造は、「する」となる。
【0154】
また、図5に示す構文解析結果によれば、対象文において対象文節である文節「する」の前方の文節は文節「可能に」である。したがって、候補構造生成部35は、図5に示す構文解析結果から文節「可能に」を取得する。
【0155】
ここで、図5に示す構文解析結果によれば、文節「可能に」における最初の単語の品詞は形容詞である。したがって、候補構造生成部35は、取得された文節「可能に」を、対象文の候補構造において対象文節である文節「する」の前方に追加する。これにより、対象文の候補構造は、「可能にする」となる。
【0156】
また、対象文において文節「可能に」の前方には文節「運転を」が存在するため、候補構造生成部35は、当該文節「運転を」を取得する。
【0157】
ここで、図5に示す構文解析結果によれば、文節「運転を」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「運転を」を、対象文の候補構造に最後に追加された文節「可能に」の前方に追加する。これにより、対象文の候補構造は、「運転を可能にする」となる。
【0158】
また、対象文において文節「運転を」の前方には文節「連続」が存在するため、候補構造生成部35は、当該文節「連続」を取得する。
【0159】
ここで、図5に示す構文解析結果によれば、文節「連続」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「連続」を、対象文の候補構造に最後に追加された文節「運転を」の前方に追加する。これにより、対象文の候補構造は、「連続運転を可能にする」となる。
【0160】
また、対象文において文節「連続」の前方には文節「装置の」が存在するため、候補構造生成部35は、当該文節「装置の」を取得する。
【0161】
ここで、図5に示す構文解析結果によれば、文節「装置の」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「装置の」を、対象文の候補構造に最後に追加された文節「連続」の前方に追加する。これにより、対象文の候補構造は、「装置の連続運転を可能にする」となる。
【0162】
また、対象文において文節「装置の」の前方には文節「濃縮し」が存在するため、候補構造生成部35は、当該文節「濃縮し」を取得する。
【0163】
ここで、図5に示す構文解析結果によれば、文節「濃縮し」における最初の単語の品詞は動詞である。したがって、対象文節である文節「する」に対する処理は終了され、この時点での対象文の候補構造「装置の連続運転を可能にする」が当該対象文の候補構造を構成する1つの節とされる。
【0164】
このように図5に示す構文解析結果(対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」の構文解析結果)を用いて候補構造生成処理が実行された場合には、上述した図7に示すように「薬品は中濃度に濃縮し」および「装置の連続運転を可能にする」の2つの節から構成される対象文の候補構造が生成される。なお、この対象文の候補構造は、前述した節構造生成部34によって生成された対象文の節構造(つまり、図6に示す対象文の節構造)とは異なる。
【0165】
上記したように本実施形態においては、対象文(入力部31によって入力された文)の解析結果(構文解析結果および形態素解析結果)に基づいて、当該対象文が悪文検出ルール格納部22に格納されている条件を満たすか否かが判定され、当該条件を満たすと判定された場合、当該対象文の構造および当該条件に対応づけて悪文検出ルール格納部22に格納されているメッセージがユーザに対して提示される。また、本実施形態においては、ユーザは提示された対象文の構造およびメッセージを参照して文書処理装置30に対して対象文を修正する操作を行うことができるため、当該ユーザの操作に応じて対象文を修正することが可能となる。
【0166】
これにより、本実施形態においては、対象文が悪文(わかりにくい文)であるか否かを判定することによって悪文を自動的に検出することができるため、ユーザは、対象文の全てについてではなく修正が必要な文のみを確認することができ、わかりやすい文(読みやすい文)の作成を効率的に行うことができる。
【0167】
また、本実施形態においては、対象文の解析結果に基づいて当該対象文の候補構造が生成され、当該生成された対象文の候補構造がユーザに対して提示されるため、ユーザは、当該対象文の候補構造に基づいて当該対象文の節構造を修正することが可能であり、構文的に理解しにくい文(わかりにくい文)の修正を容易に行うことができる。なお、構文解析に誤り等があった場合であっても、当該修正された対象文の節構造を用いて構文解析処理が実行されることによって当該誤りを修正(回避)することができ、更には、当該修正された節構造を利用することによってその後に行われる例えば機械翻訳処理等の他の処理においても正しい効果を得ることができる。
【0168】
また、本実施形態においては、修正された対象文および当該対象文の節構造に基づいて、再度、当該対象文が悪文であるか否かの判定処理が実行されるため、ユーザは、当該修正後の対象文についても悪文であるか否かを確認することができる。
【0169】
なお、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組合せてもよい。
【符号の説明】
【0170】
10…コンピュータ、20…外部記憶装置、22…悪文検出ルール格納部、23…修正結果格納部、30…文書処理装置、31…入力部、32…言語解析部、33…悪文検出部、34…節構造生成部、35…候補構造生成部、36…出力部(提示手段)、37…対象文修正部。
【技術分野】
【0001】
本発明の実施形態は、わかりやすい文の作成を支援するための文書処理装置およびプログラムに関する。
【背景技術】
【0002】
一般的に、わかりやすい文(文書)を作成するためには、わかりにくい(読みにくい)文を発見し、当該文を修正する作業が必要である。
【0003】
ところで、わかりにくい文となる要因には、例えば語彙的な要因および構文的な要因等の様々な要因がある。これらの要因の中でも構文的な要因が主要なものであり、当該構文的な要因によるわかりにくい文の場合、例えば翻訳において翻訳者が内容を誤解する、または機械翻訳において誤訳が発生する等、及ぼす影響が大きい。
【0004】
なお、構文的な要因は、例えば主語と述語の対応の誤り等、文における係り受け関係のわかりにくさに基づくものが多い。
【0005】
このような係り受け関係の誤解を防ぐために、例えば文の係り受け関係をユーザに提示し、当該ユーザが必要に応じて係り受け関係を修正することが考えられる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2001−51998号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記したように文の係り受け関係をユーザに提示すれば、当該係り受け関係がわかりにくい場合に当該ユーザが文を修正することができる。
【0008】
しかしながら、この場合、文がわかりにくい文であるか否かにかかわらず、全ての文の係り受け関係をユーザは確認しなければならない。
【0009】
したがって、例えばユーザによって作成された文の中からわかりにくい文を検出し、当該わかりにくい文のみをユーザに提示することが好ましい。
【0010】
また、わかりにくい文は、一般的に文を作成したユーザ本人は正しく理解できるが、第三者が誤解する危険性を含んでいるものである。したがって、わかりにくい文の検出は、文を作成したユーザ本人が行うのではなく、客観的に行われることが望ましい。
【0011】
そこで、本発明が解決しようとする課題は、構文的にわかりにくい文を自動的に検出し、ユーザに対して提示することが可能な文書処理装置およびプログラムを提供することにある。
【課題を解決するための手段】
【0012】
実施形態に係る文書処理装置は、ルール格納手段と、入力手段と、解析手段と、判定手段と、提示手段とを具備する。
【0013】
ルール格納手段は、構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納する。
【0014】
入力手段は、ユーザによって指定された文を入力する。
【0015】
解析手段は、前記入力された文の構造を解析する。
【0016】
判定手段は、前記解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定する。
【0017】
提示手段は、前記条件を満たすと判定された場合、前記入力された文の構造および当該条件に対応づけて前記ルール格納手段に格納されている当該条件に応じたメッセージを前記ユーザに対して提示する。
【図面の簡単な説明】
【0018】
【図1】実施形態に係る文書処理装置のハードウェア構成を示すブロック図。
【図2】図1に示す文書処理装置30の主として機能構成を示すブロック図。
【図3】図2に示す悪文検出ルール格納部22のデータ構造の一例を示す図。
【図4】本実施形態に係る文書処理装置30の処理手順を示すフローチャート。
【図5】言語解析部32による対象文の構文解析結果の一例を示す図。
【図6】節構造生成部34によって生成された対象文の節構造の一例を示す図。
【図7】候補構造生成部35によって生成された対象文の候補構造の一例を示す図。
【図8】悪文検出結果がユーザに対して表示された場合の表示画面の一例を示す図。
【図9】ユーザによる対象文を修正する操作について具体的に説明するための図。
【図10】修正結果格納部23に格納された修正節構造を用いて対象文が構文解析された場合の構文解析結果の一例を示す図。
【図11】悪文検出部33による悪文判定処理の処理手順を示すフローチャート。
【図12】節構造生成部34による節構造生成処理の処理手順を示すフローチャート。
【図13】候補構造生成部35による候補構造生成処理の処理手順を示すフローチャート。
【発明を実施するための形態】
【0019】
以下、図面を参照して、実施形態について説明する。
【0020】
図1は、本実施形態に係る文書処理装置のハードウェア構成を示すブロック図である。図1に示すように、コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。この外部記憶装置20は、コンピュータ10によって実行されるプログラム21を格納する。コンピュータ10および外部記憶装置20は、文書処理装置30を構成する。
【0021】
この文書処理装置30は、構文的にわかりにくい文(以下、悪文と表記)を自動的に検出する機能を有する。
【0022】
図2は、図1に示す文書処理装置30の主として機能構成を示すブロック図である。図2に示すように、文書処理装置30は、入力部31、言語解析部32、悪文検出部33、節構造生成部34、候補構造生成部35、出力部36および対象文修正部37を含む。本実施形態において、これらの各部31〜37は、図1に示すコンピュータ10が外部記憶装置20に格納されているプログラム21を実行することにより実現されるものとする。このプログラム21は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム21が、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。
【0023】
また、文書処理装置30は、悪文検出ルール格納部22および修正結果格納部23を含む。本実施形態において、悪文検出ルール格納部22および修正結果格納部23は、例えば図1に示す外部記憶装置20に格納される。
【0024】
悪文検出ルール格納部22には、悪文(構文的にわかりにくい文)を検出するためのルール(悪文検出ルール)が予め格納されている。悪文検出ルール格納部22には、悪文検出ルールとして、悪文を検出するための予め定められた条件および当該条件に応じたメッセージが格納されている。悪文検出ルール格納部22に格納されている条件には、例えば動詞(動詞、形容詞等を含む用言)を含む文節と当該文節に対して予め定められた係り受け関係にある名詞(名詞、代名詞等を含む体言)を含む文節との間の文節数が予め定められた数以上であること(を示す条件)等が含まれる。
【0025】
なお、悪文検出ルール格納部22に格納されている条件(悪文を検出するための予め定められた条件)は、後述する判定項目および判定基準によって表される。
【0026】
入力部31は、例えばキーボードおよびマウス等に対するユーザの操作に応じて、当該ユーザからの指示を受け付ける機能を有する。入力部31は、ユーザによって指定された文(悪文か否かの評価対象となる文)を入力する。入力部31によって入力される文は、例えば動詞、名詞または形容詞等を含む文節を含む複数の文節から構成される。
【0027】
言語解析部32は、入力部31によって入力された文(以下、対象文と表記)の構造を解析する。具体的には、言語解析部32は、対象文に対して構文解析および形態素解析を行う。構文解析によれば、複数の文節から構成される対象文が文節毎に分割され、当該文節間に係り受け関係が付与される。一方、形態素解析によれば、対象文が形態素毎に分割され、当該各形態素に品詞が付与される。
【0028】
悪文検出部33は、悪文検出ルール格納部22に格納されている条件および言語解析部32による解析結果に基づいて、対象文が悪文であるか否かを判定する。この場合、悪文検出部33は、悪文検出ルール格納部22に格納されている条件を対象文が満たすか否かを判定する。
【0029】
悪文検出部33は、悪文検出ルール格納部22に格納されている条件を対象文が満たすと判定された場合には、対象文が悪文であると判定する。一方、悪文検出部33は、悪文検出ルール格納部22に格納されている条件を対象文が満たさないと判定された場合には、当該対象文が悪文でないと判定する。
【0030】
節構造生成部34は、言語解析部32による解析結果に基づいて、対象文の節構造(を示す節構造データ)を生成する。なお、節構造生成部34によって生成される対象文の節構造は、当該対象文の構造を表し、当該対象文を構成する文節からなる節から構成される。
【0031】
候補構造生成部35は、言語解析部32による解析結果に基づいて、対象文の候補構造(を示す候補構造データ)を生成する。なお、候補構造生成部35によって生成される対象文の候補構造は、対象文の節構造の候補を表し、節構造生成部34によって生成される対象文の節構造とは異なる節構造である。
【0032】
出力部36は、悪文検出ルール格納部22に格納されている条件を対象文が満たすと悪文検出部33によって判定された場合(つまり、対象文が悪文であると判定された場合)、当該対象文が悪文である旨を示す悪文検出結果を出力する。これにより、出力部36は、悪文検出結果をユーザに対して提示する。出力部36によって出力される悪文検出結果には、悪文検出部33によって対象文が満たすと判定された条件に対応づけて悪文検出ルール格納部22に格納されている当該条件に応じたメッセージ、節構造生成部34によって生成された対象文の節構造(つまり、対象文の構造)および候補構造生成部35によって生成された対象文の候補構造が含まれる。
【0033】
なお、ユーザは、提示された悪文検出結果を参照して、対象文または当該対象文の節構造を修正する操作を文書処理装置30に対して行うことができる。このユーザによって対象文または当該対象文の節構造を修正する操作が行われると、入力部31は、当該ユーザの操作に応じて、対象文または当該対象文の節構造に対する修正指示を受け付ける。
【0034】
対象文修正部37は、対象文または当該対象文の節構造に対する修正指示が入力部31によって受け付けられると、ユーザの操作に応じて対象文または当該対象文の節構造を修正する。対象文修正部37は、対象文または当該対象文の節構造に対する修正結果を修正結果格納部23に格納する。
【0035】
図3は、図2に示す悪文検出ルール格納部22のデータ構造の一例を示す。悪文検出ルール格納部22には、条件およびメッセージが対応づけて予め格納されている。悪文検出ルール格納部22に格納されている条件は、悪文を検出するための条件であり、判定項目および判定基準を含む。
【0036】
図3に示す例では、悪文検出ルール格納部22には、判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」、判定基準「5以上」およびメッセージ「主語と述語が離れています」が対応づけて格納されている。これによれば、「動詞を含む文節と、当該文節に対して「が格」で係り受け関係にある名詞を含む文節との間の文節数が5以上である」という条件に応じたメッセージが「主語と述語が離れています」であることが示されている。
【0037】
また、悪文検出ルール格納部22には、判定項目「動詞と「を格」で係り受け関係にある名詞との間の文節数」、判定基準「6以上」およびメッセージ「目的語と述語が離れています」が対応づけて格納されている。これによれば、「動詞を含む文節と、当該文節に対して「を格」で係り受け関係にある名詞を含む文節との間の文節数が6以上である」という条件に応じたメッセージが「目的語と述語が離れています」であることが示されている。
【0038】
更に、悪文検出ルール格納部22には、判定項目「動詞に対して「が格」で係り受け関係にある名詞の有無」、判定基準「無し」およびメッセージ「主語がありません」が対応づけて格納されている。これによれば、「動詞を含む文節に対して「が格」で係り受け関係にある名詞を含む文節が無い」という条件に応じたメッセージが「主語がありません」であることが示されている。
【0039】
次に、図4のフローチャートを参照して、本実施形態に係る文書処理装置30の処理手順について説明する。
【0040】
まず、入力部31は、ユーザの操作に応じて、当該ユーザによって指定された文を入力する(ステップS1)。入力部31によって入力される文は、複数の文節から構成される。また、入力部31によって入力される文を構成する複数の文節には、例えば動詞、名詞または形容詞を含む文節が含まれる。
【0041】
なお、入力部31は、ユーザによって例えばキーボード等から直接入力された文を入力してもよいし、ユーザによって指定された既存のファイル(文書)から文を読み込んでも構わない。
【0042】
次に、言語解析部32は、入力部31によって入力された文(対象文)を解析する(ステップS2)。このとき、言語解析部32は、対象文に対して構文解析および形態素解析を行う。
【0043】
ここで、図5は、言語解析部32による対象文の構文解析結果の一例を示す。ここでは、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」に対する構文解析結果を示す。構文解析によれば、対象文を構成する複数の文節間に係り受け関係が付与される。なお、対象文を構成する文節の各々は、少なくとも1つ以上の単語からなる。
【0044】
構文解析結果においては、複数の文節から構成される対象文が文節毎に分割される。図5に示す構文解析結果によれば、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」は、文節「薬品は」、「中」、「濃度に」、「濃縮し」、「装置の」、「連続」、「運転を」、「可能に」および「する」に分割されている。
【0045】
なお、図5においては、便宜的に、対象文を構成する各文節における最初の単語(文節の語幹)のみが記されている。また、対象文を構成する文節における最初の単語には、当該単語の品詞が付与されている。図5において、「<V>」は動詞を示し、「<N>」は名詞を示し、「<A>」は形容詞を示す。したがって、図5に示す構文解析結果における例えば「する<V>」は、対象文を構成する複数の文節のうち、文節における最初の単語が動詞の「する」である文節「する」を表している。また、「薬品<N>」は、対象文を構成する複数の文節のうち、文節における最初の単語が名詞の「薬品」である文節「薬品は」を表している。同様に、「可能<A>」は、対象文を構成する複数の文節のうち、文節における最初の単語が形容詞の「可能」である文節「可能に」を表している。
【0046】
また、構文解析結果においては、係り受け関係にある2つの文節間に矢印が付与されている(つまり、2つの文節間が矢印で結ばれている)。なお、構文解析結果における矢印の先が係り受け先の文節を示し、矢印の元が係り受け元の文節を示す。これによって、矢印の先と元との文節間に係り受け関係があることが示される。
【0047】
また、構文解析結果においては、必要に応じて矢印に2つの文節の係り受け関係が付与されている。矢印に例えば「ga」が付与されているときは、当該矢印の先と元との文節間の係り受け関係が「が格」であることを意味する。また、矢印に例えば「wo」が付与されているときは、当該矢印の先と元との文節間の係り受け関係が「を格」であることを意味する。
【0048】
図5に示す構文解析結果によれば、文節「薬品は」および文節「する」の係り受け関係が「が格」であることが示されている。また、図5に示す構文解析結果によれば、文節「運転を」および文節「する」の係り受け関係が「を格」であることが示されている。
【0049】
なお、詳しい説明については省略するが、上記した対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」が形態素解析された場合には、当該対象文が形態素に分割され、当該各形態素に品詞が付与される。
【0050】
再び図4に戻ると、悪文検出部33は、言語解析部32による解析結果(対象文の構文解析結果および形態素解析結果)および悪文検出ルール格納部22に格納されている条件(に含まれる判定項目および判定基準)に基づいて、対象文が悪文であるか否かを判定する処理(以下、悪文判定処理と表記)を実行する(ステップS3)。この悪文判定処理においては、悪文検出ルール格納部22に格納されている条件を対象文が満たすか否かが判定される。悪文判定処理において、悪文検出ルール格納部22に格納されている条件を対象文が満たさないと判定された場合には、当該対象文が悪文でないと判定される。一方、悪文判定処理において、悪文検出ルール格納部22に格納されている条件を対象文が満たすと判定された場合には、当該対象文が悪文であると判定される。なお、悪文判定処理の詳細については後述する。
【0051】
悪文判定処理の結果として対象文が悪文でないと判定された場合(ステップS4のNO)、処理は終了される。
【0052】
一方、悪文判定処理の結果として対象文が悪文であると判定された場合(ステップS4のYES)、節構造生成部34は、当該対象文の構文解析結果に基づいて、当該対象文の節構造を生成する処理(以下、節構造生成処理と表記)を実行する(ステップS5)。節構造生成部34によって生成される対象文の節構造は、ユーザに対して当該対象文の節構造をわかりやすく提示するためのデータである。
【0053】
なお、節構造生成部34によって生成される対象文の節構造は、対象文を構成する文節からなる節から構成される。
【0054】
ここで、図6は、節構造生成部34によって生成された対象文の節構造の一例を示す。図6に示す対象文の節構造においては、当該節構造を構成する節の各々が1つのまとまりとして破線の枠で囲まれている。
【0055】
つまり、図6に示す対象文の節構造は、「薬品は」、「中濃度に濃縮し」、「装置の連続運転を」および「可能に」の4つの節から構成されている。
【0056】
なお、図6に示すような対象文の節構造を生成する節構造生成処理の詳細については後述する。
【0057】
再び図4に戻ると、候補構造生成部35は、対象文の構文解析結果および形態素解析結果に基づいて、対象文の候補構造を生成する処理(以下、候補構造生成処理と表記)を実行する(ステップS6)。候補構造生成処理においては、対象文を構成する複数の文節のうちの動詞を含む文節および当該文節の前方の文節からなる節から構成される対象文の候補構造が生成される。なお、候補構造生成部35によって生成される対象文の候補構造は、上記した節構造生成部34によって生成された対象文の節構造とは異なる。
【0058】
ここで、図7は、候補構造生成部35によって生成された対象文の候補構造の一例を示す。図7に示す対象文の候補構造においては、当該対象文の候補構造を構成する節の各々が1つのまとまりとして破線の枠で囲まれている。
【0059】
つまり、図7に示す対象文の候補構造は、「薬品は中濃度に濃縮し」および「装置の連続運転を可能にする」の2つの節から構成されている。
【0060】
なお、図7に示すような対象文の候補構造を生成する候補構造生成処理の詳細については後述する。
【0061】
再び図4に戻ると、出力部36は、対象文が悪文である旨を示す悪文検出結果を出力する。これによって、悪文検出結果がユーザに対して提示(表示)される(ステップS7)。出力部36によって出力された悪文検出結果には、悪文検出部33によって満たすと判定された条件に対応づけて悪文検出ルール格納部22に格納されている当該条件に応じたメッセージ、節構造生成部34によって生成された対象文の節構造および候補構造生成部35によって生成された対象文の候補構造が含まれる。
【0062】
ここで、図8は、悪文検出結果がユーザに対して表示された場合の表示画面の一例を示す。
【0063】
図8に示す表示画面100は、対象文が「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」であり、節構造生成部34によって図6に示す対象文の節構造が生成され、候補構造生成部35によって図7に示す対象文の候補構造が生成された場合の表示画面の一例である。
【0064】
図8に示す表示画面100においては、上段に対象文の節構造が表示されており、下段に対象文の候補構造が表示されている。
【0065】
ここで、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」は、図3に示す悪文検出ルール格納部22に格納されている判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」および判定基準「5以上」を含む条件を満たすものとする。この場合、表示画面100には、対象文が満たす条件に対応づけて悪文検出ルール格納部22に格納されているメッセージ「主語と述語が離れています」が例えば対象文の節構造とともに表示される。
【0066】
また、表示画面100には、対象文が満たす条件に応じて矢印が対象文の節構造とともに表示されている。図8に示す例では、表示画面100には、対象部の節構造において、動詞(つまり、述語)を含む文節と当該文節に対して「が格」で係り受け関係にある名詞(つまり、主語)を含む文節との位置関係が矢印を用いて表示されている。
【0067】
なお、表示画面100において、対象文の候補構造は、当該対象文の節構造の修正候補として表示されている。
【0068】
ユーザは、このような表示画面100を確認して、文書処理装置30に対して対象文または当該対象文の節構造を修正する操作を行うことができる。対象文または当該対象文の節構造を修正する操作がユーザによって行われると、入力部31は、当該ユーザの操作に応じて、対象文または当該対象文の節構造に対する修正指示を受け付ける。
【0069】
具体的には、ユーザによって対象文を修正する操作が行われた場合には、入力部31は、当該操作に応じて、ユーザによる対象文に対する修正指示を受け付ける。
【0070】
ここで、図9を参照して、ユーザによる対象文を修正する操作について具体的に説明する。ここでは、対象文が例えば「ジョブの実行は、オンライン、オフラインといった処理形態に関わらず、システム内部では一貫して処理される。」であるものとする。
【0071】
この場合、ユーザは、図9に示すように対象文「ジョブの実行は、オンライン、オフラインといった処理形態に関わらず、システム内部では一貫して処理される。」を例えば「オンライン、オフラインといった処理形態に関わらず、ジョブの実行は、システム内部では一貫して処理される。」に修正する操作を文書処理装置30に対して行うことができる。
【0072】
この場合、ユーザは、対象文を修正する操作として、例えば上記した表示画面に表示された対象文の文字列をマウス等を用いて移動させるような操作を行ってもよいし、修正後の対象文を直接指定(入力)するような操作を行ってもよい。
【0073】
図9を用いて具体的に説明すると、ユーザは、対象文「ジョブの実行は、オンライン、オフラインといった処理形態に関わらず、システム内部では一貫して処理される。」に含まれる「ジョブの実行は、」の文字列の位置を修正後の位置に移動させる操作をしてもよいし、「オンライン、オフラインといった処理形態に関わらず、ジョブの実行は、システム内部では一貫して処理される。」の文(修正後の対象文)を直接指定する操作をしてもよい。
【0074】
一方、ユーザによって対象文の節構造を修正する操作が行われた場合には、入力部31は、当該操作に応じて、ユーザによる対象文の節構造に対する修正指示を受け付ける。なお、ユーザは、対象文の節構造を修正する操作として、例えば上記した表示画面100に表示された対象文の候補構造を選択する操作を行うことができる。また、ユーザは、対象文の節構造を修正する操作として、修正後の対象文の節構造を直接指定するような操作を行っても構わない。
【0075】
ここで、対象文修正部37は、ユーザによる対象文に対する修正指示が入力部31によって受け付けられたか否かを判定する(ステップS8)。
【0076】
ユーザによる対象文に対する修正指示が入力部31によって受け付けられたと判定された場合(ステップS8のYES)、対象文修正部37は、ユーザの操作に応じて対象文を修正する(ステップS9)。具体的には、ユーザによって対象文の文字列を移動させるような操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文を当該文字列が移動された後の対象文に修正する。一方、ユーザによって修正後の対象文を直接指定する操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文を当該指定された修正後の対象文に修正する。
【0077】
ステップS8の処理が実行されると、対象文修正部37は、修正された対象文(以下、修正対象文と表記)を修正結果格納部23に対して出力する(ステップS10)。これにより、修正対象文は、修正結果格納部23に格納される。
【0078】
このようにステップS10の処理が実行されると、上記したステップS2に戻って処理が繰り返される。ここでは、修正結果格納部23に格納された修正対象文に対してステップS2以降の処理が繰り返される。
【0079】
一方、ステップS8においてユーザによる対象文に対する修正指示が入力部31によって受け付けられていないと判定された場合、対象文修正部37は、ユーザによる対象文の節構造に対する修正指示が入力部31によって受け付けられたか否かを判定する(ステップS11)。
【0080】
ユーザによる対象文の節構造に対する修正指示が入力部31によって受け付けられたと判定された場合(ステップS11のYES)、対象文修正部37は、ユーザの操作に応じて対象文の節構造を修正する(ステップS12)。具体的には、ユーザによって対象文の候補構造を選択する操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文の節構造を当該選択された対象文の候補構造(つまり、ユーザに対して提示された対象文の候補構造)に修正する。一方、ユーザによって修正後の対象文の節構造を直接指定する操作が行われた場合には、対象文修正部37は、当該操作に応じて対象文の節構造を当該指定された修正後の対象文の節構造に修正する。
【0081】
ステップS12の処理が実行されると、対象文修正部37は、修正された対象文の節構造(以下、修正節構造と表記)を修正結果格納部23に対して出力する(ステップS10)。これにより、修正節構造は、修正結果格納部23に格納される。
【0082】
なお、修正節構造は、対象文にタグ(例えば、SGMLタグ)が付与された形式で修正結果格納部23に対して出力される。例えば図8に示す対象文の候補構造を選択する操作がユーザによって行われた場合、修正節構造は、例えば「<clause>薬品は中濃度に濃縮し</clause>、<clause>装置の連続運転を可能にする</clause>。」という形式で出力される。ここで、「<clause>」および「</clause>」は、節構造(を構成する節)を示すタグである。なお、修正結果格納部23に対して出力される修正節構造の形式は、後の処理に利用できる形式であれば構わない。
【0083】
このようにステップS10の処理が実行されると、上記したステップS2に戻って処理が繰り返される。このステップS2の処理においては、修正結果格納部23に格納された修正節構造を用いて対象文に対する構文解析処理が実行される。なお、修正結果格納部23に格納された修正節構造は、例えば対象文に対する機械翻訳処理等、他の処理において用いられても構わない。
【0084】
ここで、上記した修正節構造「<clause>薬品は中濃度に濃縮し</clause>、<clause>装置の連続運転を可能にする</clause>。」が修正結果格納部23に格納されたものとする。この場合において、修正結果格納部23に格納された修正節構造を用いてステップS2の処理(ここでは、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」に対する構文解析処理)が実行されると、当該修正節構造を構成する各節(ここでは、「薬品は中濃度に濃縮し」および「装置の連続運転を可能にする」の各節)が1つのまとまりとなるような構文解析結果が得られる。具体的には、例えば図10に示すような構文解析結果が得られる。
【0085】
なお、ステップS11においてユーザによる対象文の節構造に対する修正指示が入力部31によって受け付けられていないと判定された場合、処理は終了される。
【0086】
次に、図11のフローチャートを参照して、上述した悪文検出部33による悪文判定処理(図4に示すステップS3の処理)の処理手順について説明する。
【0087】
この悪文判定処理においては、対象文の構文解析結果に対して悪文検出ルール格納部22に格納されている条件が順に適用されることにより、対象文が当該条件を満たすか否かが判定される。
【0088】
まず、悪文検出部33は、悪文検出ルール格納部22に格納されている条件(例えば、1つ目の条件)を対象文の構文解析結果に適用する(ステップS21)。
【0089】
次に、悪文検出部33は、対象文の構文解析結果に適用された条件を当該対象文が満たすか否かを判定する(ステップS22)。ステップS22の処理においては、対象文の構文解析結果に適用された条件に含まれる判定項目の値(内容)が判定基準を満たす場合には、対象文が条件を満たすと判定される。
【0090】
対象文の構文解析結果に適用された条件を対象文が満たすと判定された場合(ステップS22のYES)、悪文検出部33は、対象文が悪文であると判定する(ステップS23)。ステップS23の処理が実行されると、悪文判定処理は終了される。
【0091】
一方、対象文の構文解析結果に適用された条件を対象文が満たさないと判定された場合(ステップS22のNO)、悪文検出部33は、悪文検出ルール格納部22に対象文の構文解析結果に適用されていない条件があるか否かを判定する(ステップS24)。
【0092】
対象文の構文解析結果および形態素解析結果に適用されていない条件があると判定された場合(ステップS24のYES)、ステップS21に戻って処理が繰り返される。この場合、ステップS21においては、対象文の構文解析結果に適用されていない条件(例えば、2つ目の条件)が当該対象文の構文解析結果に適用される。
【0093】
一方、対象文の構文解析結果に適用されていない条件がないと判定された場合(ステップS24のNO)、悪文検出部33は、対象文が悪文でないと判定する(ステップS25)。ステップS25の処理が実行されると、悪文判定処理は終了される。
【0094】
上記したように悪文判定処理においては、悪文検出ルール格納部22に格納されている条件(例えば、1つ目の条件)を対象文が満たすと判定された場合には、対象文が悪文であると判定され、悪文判定処理は終了される。この場合、悪文検出ルール格納部22に格納されている以降の条件(例えば、2つ目以降の条件)は対象文の構文解析結果に適用されない。つまり、悪文判定処理においては、悪文検出ルール格納部22に格納されている条件のうちの1つを満たすと判定された時点で以降の条件については適用が中止される。
【0095】
一方、悪文判定処理においては、悪文検出ルール格納部22に格納されている1つの条件を対象文が満たさないと判定された場合には、次の条件が対象文の構文解析結果に適用されて対象文が当該条件を満たすか否かが判定される。つまり、悪文判定処理においては、悪文検出ルール格納部22に格納されている全ての条件を対象文が満たさないと判定された場合にのみ、対象文が悪文でないと判定される。
【0096】
ここで、対象文が「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」である場合における悪文判定処理について、上述した図3および図5を用いて具体的に説明する。
【0097】
なお、便宜的に、図3に示す悪文検出ルール格納部22に格納されている判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」および判定基準「5以上」を含む条件を第1の条件、判定項目「動詞と「を格」で係り受け関係にある名詞との間の文節数」および判定基準「6以上」を含む条件を第2の条件、判定項目「動詞に対して「が格」で係り受け関係にある名詞の有無」および判定基準「無し」を含む条件を第3の条件と称する。
【0098】
まず、悪文検出部33は、図3に示す悪文検出ルー格納部22に格納されている第1の条件を対象文の構文解析結果に適用する。
【0099】
この場合、悪文検出部33は、上記した対象文の構文解析結果(図5に示す構文解析結果)から動詞を含む文節と当該文節に対して「が格」で係り受け関係にある名詞を含む文節とを抽出する。ここでは、対象文の構文解析結果から、動詞を含む文節として文節「する」が抽出され、当該文節「する」に対して「が格」で係り受け関係にある名詞を含む文節として文節「薬品は」が抽出される。
【0100】
ここで、例えば対象文の構文解析結果(および対象文の形態素解析結果)によれば、構文解析結果から抽出された文節「する」と文節「薬品は」との間には文節「中」、「濃度に」、「濃縮し」、「装置の」、「連続」、「運転を」および「可能に」の7つの文節が存在する。このため、対象文の構文解析結果に適用された第1の条件に含まれる判定項目「動詞と「が格」で係り受け関係にある名詞との間の文節数」の値は7である。
【0101】
この場合、悪文検出部33は、第1の条件、つまり、「動詞を含む文節と、当該文節に対して「が格」で係り受け関係にある名詞を含む文節との間の文節数が5以上である」という条件を対象文が満たすと判定する。この場合、悪文検出部33は、対象文が悪文であると判定する。
【0102】
ここでは、悪文検出ルール格納部22に格納されている第1の条件を対象文が満たす場合について説明したが、例えば当該第1の条件を対象文が満たさないと判定された場合には、当該悪文検出ルール格納部22に格納されている第2の条件が対象文の構文解析結果に適用される。このように、悪文検出ルール格納部22に格納されている条件は順に適用される。
【0103】
なお、上述したように例えば対象文の節構造が修正され、図10に示す構文解析結果が得られた場合には、詳細な説明は省略するが、対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」は、図3に示す悪文検出ルール格納部22に格納されている第1の条件を満たさない。つまり、対象文の節構造が修正される前には第1の条件を満たしていたのに対し、対象文の節構造が修正されることによって対象文が第1の条件を満たさなくなる。
【0104】
上記した悪文判定処理においては、悪文検出ルール格納部22に格納されている条件の1つを満たすと判定された時点で対象文が悪文であると判定されて処理が終了するものとして説明したが、当該悪文検出ルール格納部22に格納されている条件の1つを満たすと判定された場合であっても当該悪文検出ルール格納部22に格納されている全ての条件について満たすか否かの判定が行われても構わない。この場合、悪文検出ルール格納部22に格納されている条件のうち満たすと判定された条件毎の悪文検出結果がユーザに対して提示される。
【0105】
次に、図12のフローチャートを参照して、上述した節構造生成部34による節構造生成処理(図4に示すステップS5の処理)の処理手順について説明する。
【0106】
この節構造生成処理においては、言語解析部32による解析結果(対象文の構文解析結果)に基づいて当該対象文の節構造が生成される。なお、対象文の節構造は、例えば当該対象文を構成する文節からなる節から構成される。
【0107】
まず、節構造生成部34は、対象文の構文解析結果における最上位の文節に接続する文節を抽出する(ステップS31)。
【0108】
次に、節構造生成部34は、ステップS31において抽出された文節の各々について以下のステップS32の処理を実行する。以下、ステップS32の処理の対象となる文節を対象文節と称する。
【0109】
節構造生成部34は、対象文節および当該対象文節に対して係り受け元となる全ての文節(に対応する対象文の一部)を対象文の節構造を構成する1つの節とする(ステップS32)。
【0110】
節構造生成部34は、ステップS31において抽出された全ての文節について上記したステップS32の処理が実行されたか否かを判定する(ステップS33)。
【0111】
全ての文節について処理が実行されていないと判定された場合(ステップS33のNO)、上記したステップS32に戻って処理が繰り返される。この場合、ステップS32の処理が実行されていない文節を対象文節として処理が実行される。
【0112】
一方、全ての文節について処理が実行されたと判定された場合(ステップS33のYES)、節構造生成処理は終了される。
【0113】
ここで、図5に示す構文解析結果を参照して、節構造生成部34による節構造生成処理について具体的に説明する。
【0114】
この場合、節構造生成処理において、節構造生成部34は、図5に示す構文解析結果における最上位の文節である文節「する」に接続する文節「薬品は」、「濃縮し」、「運転を」および「可能に」を抽出する。
【0115】
次に、節構造生成部34によって抽出された文節の各々に対して上記した図11に示すステップS32の処理が実行される。
【0116】
まず、節構造生成部34によって抽出された文節のうちの文節「薬品は」に対して係り受け元となる文節は、図5に示す構文解析結果には存在しない。したがって、節構造生成部34は、「薬品は」を対象文の節構造を構成する1つの節とする。
【0117】
次に、図5に示す構文解析結果において、節構造生成部34によって抽出された文節のうちの文節「濃縮し」に対して係り受け元となる文節は、文節「濃度に」および「中」である。したがって、節構造生成部34は、「中濃度に濃縮し」を対象文の節構造を構成する1つの節とする。
【0118】
また、図5に示す構文解析結果において、節構造生成部34によって抽出された文節のうちの文節「運転を」に対して係り受け元となる文節は、文節「装置の」および「連続」である。したがって、節構造生成部34は、「装置の連続運転を」を対象文の節構造を構成する1つの節とする。
【0119】
更に、節構造生成部34によって抽出された文節のうちの文節「可能に」に対して係り受け元となる文節は、図5に示す構文解析結果には存在しない。したがって、節構造生成部34は、「可能に」を対象文の節構造を構成する1つの節とする。
【0120】
つまり、図5に示す構文解析結果(対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」の構文解析結果)を用いて節構造生成処理が実行された場合、上述した図6に示すように「薬品は」、「中濃度に濃縮し」、「装置の連続運転を」および「可能に」の4つの節から構成される対象文の節構造が生成される。
【0121】
ここでは、節構造生成処理において図6に示すような対象文の節構造が生成されるものとして説明したが、対象文の構造をわかりやすくユーザに対して提示できるデータを生成する処理であれば、上記説明した節構造生成処理以外の処理が実行されても構わない。例えば、節構造生成処理において、対象文の構造(節構造)を木構造で表すようなデータが生成されても構わない。
【0122】
次に、図13のフローチャートを参照して、上述した候補構造生成部35による候補構造生成処理(図4に示すステップS6の処理)の処理手順について説明する。
【0123】
この候補構造生成処理においては、言語解析部32による解析結果(対象文の構文解析結果)に基づいて対象文の候補構造(対象文において候補となる節構造)が生成される。なお、対象文の候補構造は、上記した対象文の節構造と同様に、節から構成される。
【0124】
まず、候補構造生成部34は、対象文の構文解析結果から動詞を含む文節を抽出する(ステップS41)。
【0125】
次に、候補構造生成部34は、ステップS41において抽出された動詞を含む文節の各々について以下のステップS42〜S47処理を実行する。以下、ステップS42〜S47処理の対象となる動詞を含む文節を対象文節と称する。
【0126】
候補構造生成部34は、対象文節を、対象文の候補構造に追加する(ステップS42)。
【0127】
候補構造生成部34は、対象文の構文解析結果(および対象文の形態素解析結果)に基づいて、対象文を構成する文節のうち対象文節の前方の文節を取得する(ステップS43)。
【0128】
候補構造生成部34は、対象文の構文解析結果に基づいて、ステップS43において取得された文節における最初の単語の品詞を取得する(ステップS44)。
【0129】
次に、候補構造生成部34は、取得された品詞が名詞または形容詞であるか(つまり、動詞以外である)か否かを判定する(ステップS45)。
【0130】
品詞が名詞または形容詞であると判定された場合(ステップS45のYES)、候補構造生成部34は、ステップS33において取得された文節を、対象文の候補構造に追加する(ステップS46)。このとき、ステップS43において取得された文節は、対象文の候補構造に最後に追加された文節(ここでは、対象文節)の前方に追加される。
【0131】
次に、候補構造生成部34は、対象文の構文解析結果(および形態素解析結果)に基づいて、対象文を構成する複数の文節のうち、ステップS43において取得された文節の前方に文節があるか否かを判定する(ステップS47)。
【0132】
前方に文節があると判定された場合(ステップS47のNO)、ステップS43に戻って処理が繰り返される。このステップS43においては、ステップ47において前方にあると判定された文節が取得される。以下、上記したステップS44以降の処理が実行される。
【0133】
一方、ステップS45において品詞が名詞または形容詞でないと判定された場合およびステップS47において前方に文節がないと判定された場合、この時点で対象文の候補構造に追加されている全ての文節を当該対象文の候補構造を構成する1つの節とする。つまり、候補構造生成処理においては、1つの対象文節に対してステップS42〜ステップS47の処理が実行されることによって、対象文の候補構造を構成する1つの節が生成される。
【0134】
次に、候補構造生成部34は、ステップS41において抽出された動詞を含む文節の全てについて上記したステップS42〜S47の処理が実行されたか否かを判定する(ステップS48)。
【0135】
動詞を含む文節の全てについて処理が実行されていないと判定された場合(ステップS48のNO)、ステップS42に戻って処理が繰り返される。この場合、ステップS42〜S47の処理が実行されていない動詞を含む文節を対象文節として当該ステップS42以降の処理が実行される。なお、ステップS42に戻って処理が繰り返される場合、上記したステップS42〜S47の処理が実行されることによって生成された対象文の候補構造を構成する節とは異なる節が生成される。
【0136】
一方、動詞を含む文節の全てについて処理が実行されたと判定された場合(ステップS38のYES)、候補構造生成処理は終了される。
【0137】
つまり、候補構造生成処理においては、動詞を含む文節毎に、当該文節から品詞(文節における最初の単語の品詞)が名詞または形容詞以外である文節まで順に文節が取得され、当該動詞を含む文節および取得された全ての文節が対象文の候補構造を構成する節とされる。
【0138】
なお、候補構造生成処理において生成された対象文の候補構造は、上述した節構造生成処理において生成された対象文の節構造とは異なる節構造であるものとする。候補構造生成処理において生成された対象文の候補構造が節構造生成処理において生成された対象文の節構造と同一である場合には、当該対象文の候補構造は、ユーザに対して提示されない(つまり、生成されない)構成であってもよい。
【0139】
また、上記した図12において説明した候補構造生成処理は一例であり、例えば対象文の候補構造を用いることによって異なる構文解析結果(つまり、悪文と判定された対象文の構文解析結果とは異なる構文解析結果)を得ることができるような節構造(候補構造)が生成できればよい。例えば、対象文の構文解析結果の中の係り受け可能な2つの文節を取り出し、それらの間の係り受け関係を設定することによって生成される意味係り受けグラフにおける係り受け候補を用いて対象文の候補構造が生成されても構わない。
【0140】
ここで、図5に示す構文解析結果を参照して、候補構造生成部35による候補構造生成処理について具体的に説明する。
【0141】
候補構造生成処理において、候補構造生成部35は、図5に示す構文解析結果から動詞を含む文節を抽出する。この場合、図5に示す構文解析結果において<V>が記されている文節、つまり、最初の単語の品詞が動詞である文節「濃縮し」および「する」が動詞を含む文節として抽出される。
【0142】
次に、候補構造生成部35によって抽出された動詞を含む文節の各々について上記した図12に示すステップS42以降の処理が実行される。
【0143】
まず、候補構造生成部35によって抽出された動詞を含む文節のうち文節「濃縮し」が対象文節(図12に示すステップS42以降の処理の対象となる文節)である場合について説明する。
【0144】
この場合、候補構造生成部35は、対象文節である文節「濃縮し」を、対象文の候補構造に追加する。これにより、対象文の候補構造は、「濃縮し」となる。
【0145】
また、図5に示す構文解析結果(および形態素解析結果)によれば、対象文において対象文節である文節「濃縮し」の前方の文節は文節「濃度に」である。したがって、候補構造生成部35は、図5に示す構文解析結果から文節「濃度に」を取得する。
【0146】
ここで、図5に示す構文解析結果において文節「濃度に」には<N>が記されているため、当該文節「濃度に」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「濃度に」を、対象文の候補構造において対象文節である文節「濃縮し」の前方に追加する。これにより、対象文の候補構造は、「濃度に濃縮し」となる。
【0147】
また、対象文において文節「濃度に」の前方には文節「中」が存在するため、候補構造生成部35は、当該文節「中」を取得する。
【0148】
ここで、図5に示す構文解析結果によれば、文節「中」における最初の単語の品詞は形容詞である。したがって、候補構造生成部35は、取得された文節「中」を、対象文の候補構造に最後に追加された文節「濃度に」の前方に追加する。これにより、対象文の候補構造は、「中濃度に濃縮し」となる。
【0149】
また、対象文において文節「中」の前方には文節「薬品は」が存在するため、候補構造生成部35は、当該文節「薬品は」を取得する。
【0150】
ここで、図5に示す構文解析結果によれば、文節「薬品は」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「薬品は」を、対象文の候補構造に最後に追加された文節「中」の前方に追加する。これにより、対象文の候補構造は、「薬品は中濃度に濃縮し」となる。
【0151】
なお、対象文において文節「薬品は」の前方には文節が存在しない。したがって、対象文節である文節「濃縮し」に対する処理は終了され、この時点での対象文の候補構造「薬品は中濃度に濃縮し」が当該対象文の候補構造を構成する1つの節とされる。
【0152】
次に、候補構造生成部35によって抽出された動詞を含む文節のうち文節「する」が対象文節である場合について説明する。ここでは、上記した対象文の候補構造を構成する節とされた「薬品は中濃度に濃縮し」とは異なる節が生成される。
【0153】
この場合、候補構造生成部35は、対象文節である文節「する」を、対象文の候補構造に追加する。これにより、対象文の候補構造は、「する」となる。
【0154】
また、図5に示す構文解析結果によれば、対象文において対象文節である文節「する」の前方の文節は文節「可能に」である。したがって、候補構造生成部35は、図5に示す構文解析結果から文節「可能に」を取得する。
【0155】
ここで、図5に示す構文解析結果によれば、文節「可能に」における最初の単語の品詞は形容詞である。したがって、候補構造生成部35は、取得された文節「可能に」を、対象文の候補構造において対象文節である文節「する」の前方に追加する。これにより、対象文の候補構造は、「可能にする」となる。
【0156】
また、対象文において文節「可能に」の前方には文節「運転を」が存在するため、候補構造生成部35は、当該文節「運転を」を取得する。
【0157】
ここで、図5に示す構文解析結果によれば、文節「運転を」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「運転を」を、対象文の候補構造に最後に追加された文節「可能に」の前方に追加する。これにより、対象文の候補構造は、「運転を可能にする」となる。
【0158】
また、対象文において文節「運転を」の前方には文節「連続」が存在するため、候補構造生成部35は、当該文節「連続」を取得する。
【0159】
ここで、図5に示す構文解析結果によれば、文節「連続」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「連続」を、対象文の候補構造に最後に追加された文節「運転を」の前方に追加する。これにより、対象文の候補構造は、「連続運転を可能にする」となる。
【0160】
また、対象文において文節「連続」の前方には文節「装置の」が存在するため、候補構造生成部35は、当該文節「装置の」を取得する。
【0161】
ここで、図5に示す構文解析結果によれば、文節「装置の」における最初の単語の品詞は名詞である。したがって、候補構造生成部35は、取得された文節「装置の」を、対象文の候補構造に最後に追加された文節「連続」の前方に追加する。これにより、対象文の候補構造は、「装置の連続運転を可能にする」となる。
【0162】
また、対象文において文節「装置の」の前方には文節「濃縮し」が存在するため、候補構造生成部35は、当該文節「濃縮し」を取得する。
【0163】
ここで、図5に示す構文解析結果によれば、文節「濃縮し」における最初の単語の品詞は動詞である。したがって、対象文節である文節「する」に対する処理は終了され、この時点での対象文の候補構造「装置の連続運転を可能にする」が当該対象文の候補構造を構成する1つの節とされる。
【0164】
このように図5に示す構文解析結果(対象文「薬品は中濃度に濃縮し、装置の連続運転を可能にする。」の構文解析結果)を用いて候補構造生成処理が実行された場合には、上述した図7に示すように「薬品は中濃度に濃縮し」および「装置の連続運転を可能にする」の2つの節から構成される対象文の候補構造が生成される。なお、この対象文の候補構造は、前述した節構造生成部34によって生成された対象文の節構造(つまり、図6に示す対象文の節構造)とは異なる。
【0165】
上記したように本実施形態においては、対象文(入力部31によって入力された文)の解析結果(構文解析結果および形態素解析結果)に基づいて、当該対象文が悪文検出ルール格納部22に格納されている条件を満たすか否かが判定され、当該条件を満たすと判定された場合、当該対象文の構造および当該条件に対応づけて悪文検出ルール格納部22に格納されているメッセージがユーザに対して提示される。また、本実施形態においては、ユーザは提示された対象文の構造およびメッセージを参照して文書処理装置30に対して対象文を修正する操作を行うことができるため、当該ユーザの操作に応じて対象文を修正することが可能となる。
【0166】
これにより、本実施形態においては、対象文が悪文(わかりにくい文)であるか否かを判定することによって悪文を自動的に検出することができるため、ユーザは、対象文の全てについてではなく修正が必要な文のみを確認することができ、わかりやすい文(読みやすい文)の作成を効率的に行うことができる。
【0167】
また、本実施形態においては、対象文の解析結果に基づいて当該対象文の候補構造が生成され、当該生成された対象文の候補構造がユーザに対して提示されるため、ユーザは、当該対象文の候補構造に基づいて当該対象文の節構造を修正することが可能であり、構文的に理解しにくい文(わかりにくい文)の修正を容易に行うことができる。なお、構文解析に誤り等があった場合であっても、当該修正された対象文の節構造を用いて構文解析処理が実行されることによって当該誤りを修正(回避)することができ、更には、当該修正された節構造を利用することによってその後に行われる例えば機械翻訳処理等の他の処理においても正しい効果を得ることができる。
【0168】
また、本実施形態においては、修正された対象文および当該対象文の節構造に基づいて、再度、当該対象文が悪文であるか否かの判定処理が実行されるため、ユーザは、当該修正後の対象文についても悪文であるか否かを確認することができる。
【0169】
なお、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組合せてもよい。
【符号の説明】
【0170】
10…コンピュータ、20…外部記憶装置、22…悪文検出ルール格納部、23…修正結果格納部、30…文書処理装置、31…入力部、32…言語解析部、33…悪文検出部、34…節構造生成部、35…候補構造生成部、36…出力部(提示手段)、37…対象文修正部。
【特許請求の範囲】
【請求項1】
構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納するルール格納手段と、
ユーザによって指定された文を入力する入力手段と、
前記入力された文の構造を解析する解析手段と、
前記解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定する判定手段と、
前記条件を満たすと判定された場合、前記入力された文の構造および当該条件に対応づけて前記ルール格納手段に格納されている当該条件に応じたメッセージを前記ユーザに対して提示する提示手段と
を具備することを特徴とする文書処理装置。
【請求項2】
候補構造生成手段を更に具備し、
前記入力手段は、動詞を含む文節を含む複数の文節から構成された文を入力し、
前記候補構造生成手段は、前記解析結果に基づいて、前記入力された文を構成する複数の文節のうちの動詞を含む文節および当該動詞を含む文節の前方の文節からなる節から構成される当該入力された文の候補構造を生成し、
前記提示手段は、前記生成された候補構造を更に提示する
ことを特徴とする請求項1記載の文書処理装置。
【請求項3】
前記ユーザの操作に応じて、前記入力された文の構造を前記提示された候補構造に修正する修正手段を更に具備し、
前記解析手段は、前記修正手段によって修正された候補構造に応じて前記入力された文の構造を解析し、
前記判定手段は、前記候補構造に応じた解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定する
ことを特徴とする請求項2記載の文書処理装置。
【請求項4】
前記ルール格納手段に格納されている条件は、用言を含む文節と当該文節に対して予め定められた係り受け関係にある体言を含む文節との間の文節数が予め定められた数以上であることを含み、
前記入力手段は、用言を含む文節および体言を含む文節を含む複数の文節から構成された文を入力し、
前記解析手段による解析結果は、前記入力された文を構成する複数の文節間の係り受け関係を示し、
前記判定手段は、前記解析結果に基づいて、前記ルール格納手段に格納されている条件に含まれる用言を含む文節と当該文節に対して予め定められた係り受け関係にある体言を含む文節との間の文節数が予め定められた数以上であることを前記入力された文が満たすかを判定する
ことを特徴とする請求項1記載の文書処理装置。
【請求項5】
前記ユーザの操作に応じて前記入力された文を修正する修正手段を更に具備することを特徴とする請求項1記載の文書処理装置。
【請求項6】
構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを格納するルール格納手段を有する外部記憶装置と、当該外部記憶装置を利用するコンピュータとから構成される文書処理装置において、前記コンピュータによって実行されるプログラムであって、
前記コンピュータに、
ユーザによって指定された文を入力する入力するステップと、
前記入力された文の構造を解析するステップと、
前記解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定するステップと、
前記条件を満たすと判定された場合、前記入力された文の構造および前記ルール格納手段に格納されているという該条件に応じたメッセージを前記ユーザに対して提示するステップと
を実行させるためのプログラム。
【請求項1】
構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納するルール格納手段と、
ユーザによって指定された文を入力する入力手段と、
前記入力された文の構造を解析する解析手段と、
前記解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定する判定手段と、
前記条件を満たすと判定された場合、前記入力された文の構造および当該条件に対応づけて前記ルール格納手段に格納されている当該条件に応じたメッセージを前記ユーザに対して提示する提示手段と
を具備することを特徴とする文書処理装置。
【請求項2】
候補構造生成手段を更に具備し、
前記入力手段は、動詞を含む文節を含む複数の文節から構成された文を入力し、
前記候補構造生成手段は、前記解析結果に基づいて、前記入力された文を構成する複数の文節のうちの動詞を含む文節および当該動詞を含む文節の前方の文節からなる節から構成される当該入力された文の候補構造を生成し、
前記提示手段は、前記生成された候補構造を更に提示する
ことを特徴とする請求項1記載の文書処理装置。
【請求項3】
前記ユーザの操作に応じて、前記入力された文の構造を前記提示された候補構造に修正する修正手段を更に具備し、
前記解析手段は、前記修正手段によって修正された候補構造に応じて前記入力された文の構造を解析し、
前記判定手段は、前記候補構造に応じた解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定する
ことを特徴とする請求項2記載の文書処理装置。
【請求項4】
前記ルール格納手段に格納されている条件は、用言を含む文節と当該文節に対して予め定められた係り受け関係にある体言を含む文節との間の文節数が予め定められた数以上であることを含み、
前記入力手段は、用言を含む文節および体言を含む文節を含む複数の文節から構成された文を入力し、
前記解析手段による解析結果は、前記入力された文を構成する複数の文節間の係り受け関係を示し、
前記判定手段は、前記解析結果に基づいて、前記ルール格納手段に格納されている条件に含まれる用言を含む文節と当該文節に対して予め定められた係り受け関係にある体言を含む文節との間の文節数が予め定められた数以上であることを前記入力された文が満たすかを判定する
ことを特徴とする請求項1記載の文書処理装置。
【請求項5】
前記ユーザの操作に応じて前記入力された文を修正する修正手段を更に具備することを特徴とする請求項1記載の文書処理装置。
【請求項6】
構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを格納するルール格納手段を有する外部記憶装置と、当該外部記憶装置を利用するコンピュータとから構成される文書処理装置において、前記コンピュータによって実行されるプログラムであって、
前記コンピュータに、
ユーザによって指定された文を入力する入力するステップと、
前記入力された文の構造を解析するステップと、
前記解析結果に基づいて、前記入力された文が前記ルール格納手段に格納されている条件を満たすかを判定するステップと、
前記条件を満たすと判定された場合、前記入力された文の構造および前記ルール格納手段に格納されているという該条件に応じたメッセージを前記ユーザに対して提示するステップと
を実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2012−203586(P2012−203586A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−66709(P2011−66709)
【出願日】平成23年3月24日(2011.3.24)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願日】平成23年3月24日(2011.3.24)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
[ Back to top ]