説明

文書処理装置およびプログラム

【課題】言い換え生成規則の作成にかかっていたコストを削減することを可能とする。
【解決手段】解析部32は、入力文、言い換え前用例および言い換え後用例を解析することによって、解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成する。類似用例選択部33は、解析済み入力文および解析済み言い換え前用例の類似度を算出する。類似用例選択部33は、算出された類似度に基づいて、解析済み言い換え前用例および解析済み言い換え後用例を解析済み類似用例ペアとして選択する。差分抽出部34は、解析済み類似用例ペアとして選択された解析済み言い換え前用例および解析済み言い換え後用例の差分を抽出する。言い換え生成部35は、解析済み入力文に、差分抽出部34によって抽出された差分を適用することによって、入力文が言い換えられた言い換え文を生成する。出力部36は、入力文の言い換え文を出力する。


Notice: Undefined index: DEJ in /mnt/www/gzt_disp.php on line 298

【特許請求の範囲】
【請求項1】
ユーザによって指定された文を入力する入力手段と、
言い換え前の文である言い換え前用例および当該言い換え前用例が言い換えられた言い換え後の文である言い換え後用例を保持する用例集保持手段と、
前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析することによって、解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成する解析手段と、
前記作成された解析済み入力文および解析済み言い換え前用例を比較することによって、当該解析済み入力文および当該解析済み言い換え前用例の類似度を算出する類似度算出手段と、
前記算出された類似度に基づいて、前記作成された解析済み言い換え前用例および解析済み言い換え後用例を解析済み類似用例ペアとして選択する類似用例選択手段と、
前記解析済み類似用例ペアとして選択された解析済み言い換え前用例および解析済み言い換え後用例に基づいて、当該解析済み言い換え前用例および当該解析済み言い換え後用例の差分を抽出する差分抽出手段と、
前記作成された解析済み入力文に前記抽出された差分を適用することによって、前記入力された文が言い換えられた言い換え文を生成する言い換え生成手段と、
前記生成された言い換え文を出力する出力手段と
を具備することを特徴とする文書処理装置。
【請求項2】
前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例は、複数の文字列を含み、
前記解析手段は、前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析することにより、当該入力された文、当該言い換え前用例および当該言い換え後用例に含まれる文字列であって、当該文字列の意味または種別を表す意味クラスが付与された文字列を含む解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成し、
前記類似度算出手段は、前記作成された解析済み入力文および解析済み言い換え前用例に含まれる文字列のうち、同一の意味クラスが付与された文字列同士を対応づけることによって当該解析済み入力文および当該解析済み言い換え前用例の類似度を算出し、
前記差分抽出手段は、前記解析済み類似用例ペアとして選択された解析済み言い換え前用例および解析済み言い換え後用例に基づいて、当該解析済み言い換え前用例および当該解析済み言い換え後用例に含まれる文字列のうち、当該解析済み言い換え前用例および当該解析済み言い換え後用例において同一の位置の文字列を比較し、当該文字列が異なる場合に当該解析済み言い換え前用例および当該解析済み言い換え後用例に含まれる文字列を差分として抽出し、
前記言い換え生成手段は、前記差分として抽出された解析済み言い換え前用例に含まれる文字列に対応づけられた前記作成された解析済み入力文に含まれる文字列を、当該差分として抽出された解析済み言い換え後用例に含まれる文字列の位置に移動することによって前記言い換え文を生成する
ことを特徴とする請求項1記載の文書処理装置。
【請求項3】
前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例は、複数の文字列を含み、
前記解析手段は、前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析することにより、当該入力された文、当該言い換え前用例および当該言い換え後用例に含まれる文字列および当該文字列の品詞を含む解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成し、
前記類似度算出手段は、
前記作成された解析済み言い換え前用例に含まれる文字列および当該文字列の品詞と前記作成された解析済み言い換え後用例に含まれる文字列および当該文字列の品詞を比較することによって、当該解析済み言い換え前用例に含まれる文字列の各々の着目個所を決定し、
前記作成された解析済み言い換え前用例に含まれる文字列の各々について、当該文字列と前記決定された当該文字列の着目個所が一致する前記作成された解析済み入力文に含まれる文字列を対応づけることによって当該解析済み入力文および当該解析済み言い換え前用例の類似度を算出し、
前記差分抽出手段は、前記作成された解析済み言い換え前用例および解析済み言い換え後用例に基づいて、当該解析済み言い換え前用例に含まれている文字列であって当該解析済み言い換え後用例に同一の文字列が含まれていない文字列および当該解析済み言い換え後用例に含まれている文字列であって当該解析済み言い換え前用例に同一の文字列が含まれていない文字列を差分として抽出し、
前記言い換え生成手段は、前記差分として抽出された前記解析済み言い換え前用例に含まれている文字列と前記決定された当該文字列の着目個所が一致する文字列が前記解析済み入力文に含まれている場合、当該解析済み入力文に含まれている文字列を前記差分として抽出された言い換え後用例に含まれている文字列と入れ替えることによって前記言い換え文を生成する
ことを特徴とする請求項1記載の文書処理装置。
【請求項4】
前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析するために用いられる解析方法と、前記類似度を算出するために用いられる類似度算出方法と、前記差分を抽出するために用いられる差分抽出方法と、前記言い換え文を生成するために用いられる言い換え生成方法を表す複数の素性の一覧を保持する素性リストと、
前記ユーザによって指定された前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を、前記素性リストに保持されている素性の各々によって表される解析方法を用いて解析することによって、当該素性毎の解析済み言い換え前用例および解析済み言い換え後用例を作成する作成手段と、
前記作成された素性毎の解析済み言い換え前用例および解析済み言い換え後用例に基づいて、前記ユーザによって指定された前記用例集保持手段に保持されている言い換え前用例および言い換え後用例の変化の度合いである言い換え度を、当該素性毎に算出する言い換え度算出手段と、
前記言い換え度算出手段によって素性毎に算出された言い換え度に基づき、前記素性リストに保持されている複数の素性のうちの1つを選択する素性選択手段と
を更に具備し、
前記解析手段は、前記素性選択手段によって選択された素性によって表される解析方法に基づいて、前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析し、
前記類似度算出手段は、前記素性選択手段によって選択された素性によって表される類似度算出方法に基づいて、前記入力された文および前記言い換え前用例の類似度を算出し、
前記差分抽出手段は、前記素性選択手段によって選択された素性によって表される差分抽出方法に基づいて、前記言い換え前用例および前記言い換え後用例の差分を抽出し、
前記言い換え生成手段は、前記素性選択手段によって選択された素性によって表される言い換え生成方法に基づいて、前記入力された文が言い換えられた言い換え文を生成する
ことを特徴とする請求項1記載の文書処理装置。
【請求項5】
ユーザによって指定された複数の文字列を含む文を入力する入力手段と、
複数の文字列を含む言い換え前の文である言い換え前用例および複数の文字列を含む当該言い換え前用例が言い換えられた言い換え後の文である言い換え後用例を保持する用例集保持手段と、
前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析することにより、当該入力された文、当該言い換え前用例および当該言い換え後用例に含まれる文字列であって、当該文字列の意味または種別を表す意味クラスが付与された文字列を含む解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成する解析手段と、
前記作成された解析済み入力文および解析済み言い換え前用例を比較し、当該解析済み入力文および当該解析済み言い換え前用例に含まれる文字列のうち、同一の意味クラスが付与された文字列同士を対応づけることによって当該解析済み入力文および当該解析済み言い換え前用例の類似度を算出する類似度算出手段と、
前記算出された類似度に基づいて、前記作成された解析済み言い換え前用例および解析済み言い換え後用例を解析済み類似用例ペアとして選択する類似用例選択手段と、
前記解析済み類似用例ペアとして選択された解析済み言い換え前用例および解析済み言い換え後用例に基づいて、当該解析済み言い換え前用例および当該解析済み言い換え後用例に含まれる文字列のうち、当該解析済み言い換え前用例および当該解析済み言い換え後用例において同一の位置の文字列を比較し、当該文字列が異なる場合に当該解析済み言い換え前用例および当該解析済み言い換え後用例に含まれる文字列を差分として抽出する差分抽出手段と、
前記作成された解析済み入力文に含まれる文字列の中に、前記作成された解析済み言い換え前用例に含まれる文字列に対応づけられていない文字列が存在する場合、当該解析済み言い換え前用例に含まれる文字列に対応づけられていない文字列を当該解析済み入力文から除去する除去手段と、
前記除去手段によって文字列が除去された解析済み入力文に含まれる文字列のうち、前記差分として抽出された解析済み言い換え前用例に含まれる文字列に対応づけられた文字列を、当該差分として抽出された解析済み言い換え後用例に含まれる文字列の位置に移動し、当該解析済み入力文に含まれる文字列の移動に応じて前記除去手段によって除去された文字列を当該解析済み入力文に挿入することによって、前記入力された文が言い換えられた言い換え文を生成する言い換え生成手段と、
前記生成された言い換え文を出力する出力手段と
を具備することを特徴とする文書処理装置。
【請求項6】
言い換え前の文である言い換え前用例および当該言い換え前用例が言い換えられた言い換え後の文である言い換え後用例を保持する用例集保持手段を有する外部記憶装置と、当該外部記憶装置を利用するコンピュータとから構成される文書処理装置において、前記コンピュータによって実行されるプログラムであって、
前記コンピュータに、
ユーザによって指定された文を入力するステップと、
前記入力された文、前記用例集保持手段に保持されている言い換え前用例および言い換え後用例を解析することによって、解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成するステップと、
前記作成された解析済み入力文および解析済み言い換え前用例を比較することによって、当該解析済み入力文および当該解析済み言い換え前用例の類似度を算出するステップと、
前記算出された類似度に基づいて、前記作成された解析済み言い換え前用例および解析済み言い換え後用例を解析済み類似用例ペアとして選択するステップと、
前期解析済み類似用例ペアとして選択された解析済み言い換え前用例および解析済み言い換え後用例に基づいて、当該解析済み言い換え前用例および当該解析済み言い換え後用例の差分を抽出するステップと、
前記作成された解析済み入力文に前記抽出された差分を適用することによって、前記入力された文が言い換えられた言い換え文を生成するステップと、
前記生成された言い換え文を出力するステップと
を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40】
image rotate

【図41】
image rotate

【図42】
image rotate

【図43】
image rotate

【図44】
image rotate

【図45】
image rotate

【図46】
image rotate

【図47】
image rotate

【図48】
image rotate

【図49】
image rotate

【図50】
image rotate

【図51】
image rotate

【図52】
image rotate

【図53】
image rotate

【図54】
image rotate

【図55】
image rotate

【図56】
image rotate

【図57】
image rotate

【図58】
image rotate

【図59】
image rotate

【図60】
image rotate

【図61】
image rotate

【図62】
image rotate

【図63】
image rotate

【図64】
image rotate

【図65】
image rotate

【図66】
image rotate

【図67】
image rotate

【図68】
image rotate

【図69】
image rotate

【図70】
image rotate

【図71】
image rotate

【図72】
image rotate

【図73】
image rotate

【図74】
image rotate

【図75】
image rotate

【図76】
image rotate

【図77】
image rotate

【図78】
image rotate

【図79】
image rotate

【図80】
image rotate


【公開番号】特開2011−8754(P2011−8754A)
【公開日】平成23年1月13日(2011.1.13)
【国際特許分類】
【出願番号】特願2009−237464(P2009−237464)
【出願日】平成21年10月14日(2009.10.14)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】