説明

上下関係判定方法、上下関係判定装置、上下関係判定プログラムおよび記録媒体

【課題】文に関連する人間の上下関係をより具体的に判定することができる上下関係判定方法、上下関係判定装置、上下関係判定プログラム、および、記録媒体を提供する。
【解決手段】指示対象特定部17aは、抽出部16により抽出された名詞が話者、相手および対象者の3者の何れに該当するかを特定する。敬語判断部17bは、検出部14から抽出された敬語に基づいて上記3者間の上下関係を判断する。ランク判断部17cは、ランクDB18に基づいて上記3者間の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて上記3者間の上下関係を判断する。親密度判断部17eは、指示対象間の親密度に基づいて上記3者間の上下関係を決定する。これにより、入力文における上記3者間の上下関係が判定される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば機械翻訳や情報検索を行う自然言語処理システムに関するものである。
【背景技術】
【0002】
日本語や英語を始めとする各種言語で記述される自然言語は、往々にして抽象的で曖昧性が高い性質を持つが、文章を数学的に扱うことにより、コンピュータ処理を行うことができる。この結果、機械翻訳システム、対話システム、検索システム、質問応答システムなど、様々な自然言語処理システムが実現されている。
【0003】
ところで、自然言語、特に日本語では尊敬語、謙譲語および丁寧語などからなる敬語が用いられるが、それらの敬語のうち何れを用いるかは絶対的なものではなく、文章に関連する人間の社会的地位、年齢、話者の主観的な親密度、性差等の相対的な尺度により決定される。一例として、「部長が来た」という文章に対して敬語を用いる場合について説明する。例えば、話者が社内の同僚と話すときには、尊敬語を用いて「部長がいらした」となる。また、話者がその同僚に敬意を示すときには、丁寧語も用いて「部長がいらっしゃいました」となる。さらに、話者が顧客に話すときには、謙譲語と丁寧語を用いて「部長が参りました」となる。このような敬語の使い分けは、人間であれば、自身が有する一般常識等に基づいて行うことも可能であるが、機械では、所定のアルゴリズムに基づいて行われる。したがって、自然言語処理システムにおいて正しい敬語の解釈と使い分けをするには、文章に関連する人間の上下関係を判定するアルゴリズムが必要である。このため断片的ではあるが、敬語用法を考慮した提案がなされている(例えば、非特許文献1,2参照。)。
【0004】
【非特許文献1】K.Dohsaka, Identifying the referents of zero-pronouns in Japanese dialogues, In Proc. of the 9th European Conference on Artificial Intelligence. 240-245, 1990
【非特許文献2】M,Siegel, Japanese Honorification in an HPSG Frameworks, In Proc. of the 14th Pacific Asia Conference on Language, Information and Computation, 289-300, Waseda University, Tokyo, 2000
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の自然言語処理システムでは、対話形式の文、または、一人称および二人称の登場人物を中心としており、語彙のみからの絶対的かつ断片的な敬語情報を反映するのみで、文に関連する人間の上下関係を相対的に正しく判定することができず、結果として、処理精度向上に生かされていなかった。
【0006】
そこで、本願発明は上述したような課題を解決するためになされたものであり、文に関連する人間の上下関係を相対的に判定することができる上下関係判定方法、上下関係判定装置、上下関係判定プログラム、および、記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0007】
上述したような課題を解消するために、本発明にかかる上下関係判定方法は、電子化された文を解析し、この文の話者と、この話者の相手と、文が話題としている対象者との3者を特定する特定ステップと、この特定ステップにより特定された3者間の上下関係を判定する判定ステップとを備えることを特徴とする。
【0008】
上記上下関係判定方法において、判定ステップは、文に含まれる敬語に基づいて、3者間の上下関係を判定するようにしてもよい。また、判定ステップは、文に含まれる敬語が尊敬表現の場合、文の主語に対応する3者のうちの何れかが、これ以外の3者より上位と判定し、文に含まれる敬語が謙譲表現の場合、文の主語に対応する3者のうちの何れかが、これ以外の3者より下位と判定し、文に丁寧表現の敬語が含まれない場合、相手は話者と同等または話者より下位と判定するようにしてもよい。
【0009】
上記判定ステップは、文に含まれる敬語が尊敬表現の場合、文の主語に対応する相手、対象者、または、相手および対象者のうちの何れかが、これを除く3者より上位と判定し、文に含まれる敬語が謙譲表現の場合、文の主語に対応する話者または相手が、これを除く3者より下位と判定し、文に含まれる敬語が意味的制約動詞の尊敬表現の場合、文の主語に対応する相手、対象者、または、相手および対象のうちの何れかが、これを除く3者より上位と判定し、文に含まれる敬語が意味的制約動詞の謙譲表現の場合、文の主語に対応する話者または相手が、これを除く3者より下位と判定し、文に丁寧表現の敬語が含まれない場合、相手は話者と同等または話者より下位と判定するようにしてもよい。
【0010】
また、上記上下関係判定方法において、上記判定ステップは、3者間の社会的または年齢的な上下関係に基づいて、3者間の上下関係を判定するようにしてもよい。また、上記判定ステップは、3者間の内外関係に基づいて、3者間の上下関係を判定するようにしてもよい。これらの判定ステップの結果に基づいて、文に使用する敬語を選択する選択ステップをさらに備えるようにしてもよい。
【0011】
また、本発明にかかる上下関係判定装置は、電子化された文を解析し、この文の話者と、この話者の相手と、文が話題としている対象者との3者を特定する特定手段と、この特定ステップにより特定された3者間の上下関係を判定する判定手段とを備えることを特徴とする。
【0012】
また、本発明にかかる上下関係判定プログラムは、コンピュータに、電子化された文を解析し、この文の話者と、この話者の相手と、文が話題としている対象者との3者を特定する特定ステップと、この特定ステップにより特定された3者間の上下関係を判定する判定ステップとを実行させることを特徴とする。
【0013】
また、本発明にかかる記録媒体は、上記上下関係判定プログラムを記録したことを特徴とする。
【発明の効果】
【0014】
本発明によれば、電子化された文を解析し、話者、相手、および、対象者の3者を特定し、この特定された3者間の上下関係を判定することにより、話者、相手、および、対象者という文に関連するより具体的な人間の相対的な上下関係を判定することができる。
【発明を実施するための最良の形態】
【0015】
[第1の実施の形態]
以下、図面を参照して、本発明の第1の実施の形態について図面を参照して説明する。図1は、本実施の形態における上下関係判定装置の構成を示すブロック図である。上下関係検出装置1は、入力部11と、解析部12と、文法辞書13と、検出部14と、敬語辞書15と、抽出部16と、判定部17と、ランクDB(Data Base)18と、内外関係DB19とから構成される。このような上下関係検出装置1は、CPU等の演算装置と、メモリ、HDD(Hard Disc Drive)等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)またはFED(Field Emission Display)等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した入力部11、解析部12、文法辞書13、検出部14、敬語辞書15、抽出部16、判定部17およびランクDB18が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
【0016】
入力部11は、外部から入力される文章(以下、「入力文」と呼ぶ。)を受け付けるインターフェース装置である。
【0017】
解析部12は、入力部11に入力された入力文に対して、文法辞書13に記憶された文法規則に基づいて形態素解析する演算処理部である。
【0018】
文法辞書13は、対象とする自然言語の文法規則が登録されているデータベースである。
【0019】
検出部14は、敬語辞書15に基づいて、解析部12により形態素解析が行われた入力文から敬語を検出する演算処理部である。
【0020】
敬語辞書15は、図2に示すように、「述語」、「文型」、「動詞/サ変名詞の意味的制約」、「名詞」の項目毎に対応する敬語を登録したデータベースである。なお、「尊敬表現」とは、従来の国語文法に規定されるような「尊敬語」や文型や動詞またはサ変名詞の意味的制約等を含むものである。また、「謙譲表現」とは、従来の国語文法に規定されるような「尊敬語」や文型や動詞またはサ変名詞の意味的制約等を含むものである。また、「丁寧表現」とは、従来の国語文法に規定される「丁寧語」等を含むものである。このような敬語辞書15は予め作成される。
【0021】
一例として、「述語」の場合、「動詞」、「助動詞」、「サ変名詞」、「形容詞」、「形容動詞」の各単語の基本形と、この基本形となる単語の対応する「尊敬表現」、「謙譲表現」、「丁寧表現」が記録されている。
具体的には、「動詞」は「尊敬表現」や「謙譲表現」にはなるが、「丁寧表現」にはならない。例えば、動詞の基本形「言う」は、「尊敬表現」では「おっしゃる」になり、「謙譲表現」では「申す」になる。
また、「助動詞」は、「謙譲表現」にはなり得ない。例えば、助動詞の基本形「だ」は、「丁寧表現」では「です、ます」になる。また、助動詞「られる」は「尊敬表現」に該当する。
また、「サ変名詞」は、例えば、基本形「研究」,「訪問」は、「尊敬表現」ではそれぞれ「ご研究」,「ご訪問」になる。また、語彙や文脈によって、例えば基本形「報告」は「ご報告」となり、「尊敬表現」および「謙譲表現」の両方の解釈が可能となる。
また、「形容詞」は、例えば、基本形「早い」は、「尊敬表現」では「お早い」になる。
また、「形容動詞」は、例えば、基本形「元気」は、「尊敬表現」では「お元気」になる。
なお、各単語は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方になり得る。
【0022】
「文型」の場合は、「命令文」と「使役文」の各単語についてそれぞれが「尊敬表現」、「謙譲表現」、「丁寧表現」の何れになり得るかが記録されている。
「命令文」は、「丁寧表現」にはなり得ない。例えば、命令文「〜しなさい」は「謙譲表現」になる。
「使役文」は、「丁寧表現」にはなり得ない。例えば、使役文「〜させる」は「尊敬表現」になる。
【0023】
動詞またはサ変名詞の意味的制約の場合は、例えば、基本形「求める」は、「謙遜語」では「仰ぐ」になり、基本形「たのむ」は「尊敬表現」では「指示する」になり、基本形「同席する」は「謙遜語」では「陪席する」になる。
【0024】
「名詞」の場合は、「単語」、「接頭辞」、「接尾辞」の各単語についてそれぞれが「外の関係」、「内の関係」、「丁寧」の何れになり得るかが記録されている。ここで、「内の関係」とは話者が対象者と親しい関係にあると判断していることを意味し、「外の関係」とはそれほど親しくないことを意味する。なお、名詞の各「単語」は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方になり得る。
例えば、「内の関係」の単語「おかあさん」は、「外の関係」では単語「母」となる。
【0025】
「接頭辞」は、例えば、基本形「荷物」は、「外の関係」では「お荷物」となる。また、基本形「会社」は、「外の関係」では「御社」、「内の関係」では「当社」となる。なお、「接頭辞」は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方に該当する場合がある。
また、「接尾辞」は、例えば、「外の関係」の「佐藤さん」,「学生さん」は、「内の関係」で「佐藤」,「田中」となる。
【0026】
抽出部16は、解析部12により形態素解析が行われた入力文からこの入力文の話者と、この話者の相手と、その文章の話題の対象となる対象者との3者(以下、「指示対象」と呼ぶ。)のうちの何れかを抽出する演算処理部である。
【0027】
判定部17は、入力文の指示対象間の社会的、年齢的または世代的な上下関係を判定する演算処理部であり、指示対象判断部17aと、敬語判断部17bと、ランク判断部17cと、内外判断部17dと、親密度判断部17eと、出力部17fとから構成される。
【0028】
指示対象特定部17aは、抽出部16により抽出された指示対象が何れの指示対象に該当するかを特定する。敬語判断部17bは、検出部14から抽出された敬語に基づいて指示対象の上下関係を判断する。ランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する。親密度判断部17eは、敬語判断部17b,ランク判断部17c,内外判断部17dの判断結果に基づいて、指示対象の上下関係を決定する。出力部17fは、敬語判断部17b,ランク判断部17c,内外判断部17dおよび親密度判断部17eの判断結果を外部に出力する。
【0029】
ランクDB18は、図3に示すような各名詞間の社会的、年齢的または世代的な上下関係を記録したデータベースである。例えば、図3(a)に示す社会的な上下関係には、「師匠」と「弟子」の場合は、「師匠」は「弟子」よりも社会的に上位にあることが記録されている。また、図3(b)に示す年齢的/世代的な上下関係には、「老人」と「成人」の場合、「老人」は「成人」よりも年齢的に上位にあることが記録されている。このようなランクDB18は予め作成される。
【0030】
なお、ランクDB18に記録された上下関係は、異なるカテゴリーの上下関係を関連づけることもできる。例えば、図4に示すように、教育というカテゴリーにおける名詞間の上下関係が記録されたモジュール1と、世代というカテゴリーにおける名詞関係の上下関係が記録されたモジュール2とは、名詞「太郎」により関連づけがなされている。この場合、太郎は、モジュール1では「学生」に相当し、モジュール2では「本人」に相当する。モジュール1の「学生」では最下位にあるが、モジュール2の「本人」では最下位ではない。このように、各モジュールを関連づけることにより、相対的な上下関係を検出することができる。また、「太郎」の「祖父母」が「文科大臣」の「先生」の場合も有り得る。このような場合、モジュール間において複数の関連づけを行うことが可能となる。
【0031】
次に、本実施の形態にかかる上下関係検出装置1の動作について、図5を参照して説明する。なお、本実施の形態において、上下関係検出装置1は、言語として日本語を用いて以下に説明する処理を行うものとする。
【0032】
ユーザの操作入力、記録媒体、通信回線等を介して外部からテキストデータ等からなる文(以下、「入力文」と呼ぶ。)が入力されると、入力部11は、その入力文を受け付け、解析部12に送出する(ステップS501)。なお、入力文としては、1つの文でもあってもよく、複数の文であってもよい。
【0033】
入力文が受け付けられると、解析部12は、その入力文に対して解析、すなわち形態素解析と構文解析を行う(ステップS502)。例えば、入力部11により「社長に進言する」という入力文が受け付けられた場合、解析部12は、「社長(名詞)/に(助詞)/進言(動詞)/する(助動詞)」と単語単位に分割するとともに各単語に品詞を付与する。このような形態素解析と構文解析は、例えば主辞駆動句構造文法(Head-Driven Phrase Structure Grammar:HPSG)等の手法により実現することができる。なお、本実施の形態では、各単語を「/」で区切って記載している。
【0034】
形態素解析と構文解析が行われると、検出部14は、敬語辞書15に基づいて、形態素解析が行われた入力文から敬語を検出する(ステップS503)。具体的には、検出部14は、入力文に含まれる各単語と敬語辞書15に登録されている単語とを比較し、敬語辞書15に登録されている単語を抽出する。例えば、入力文「社長に進言する」の場合、敬語として「進言」が検出される。
【0035】
検出部14により敬語が検出されない場合(ステップS504:NO)、判定部17の出力部17fは、敬語が検出されなかった旨を出力する(ステップS513)。出力部17fは、敬語が検出されなかった旨を上下関係検出装置1の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりする。
【0036】
敬語が検出された場合(ステップS504:YES)、抽出部16は、解析部12により解析された入力文から指示対象となり得る具体的な名詞を抽出する(ステップS504)。ここで、指示対象とは、上述したように、入力文の発した話者と、この話者が入力文を語りかけた相手と、入力文の話題の対象となる対象者の3者のことを意味する。抽出部16は、このような指示対象、すなわち、話者、相手および対象者のうちの何れかとなり得る具体的な名詞を抽出する。このとき、抽出部16は、名詞のみを抽出すると指示対象となり得ない名詞も抽出されることがあるので、格助詞が付随する名詞を抽出する。例えば、入力文「社長に進言する」の場合、格助詞が付随する名詞「社長に」を抽出する。なお、抽出部16は、格助詞が付随した名詞を抽出すると、その名詞のみを判定部17に出力する。
【0037】
指示対象となり得る具体的な名詞が抽出されると、判定部17の指示対象特定部17aは、抽出された名詞が話者、相手、対象者の何れに対応するかを特定する(ステップS506)。具体的には、指示対象特定部17aは、抽出部16により抽出された名詞が一人称ときは「話者」、二人称のときは「相手」、これら以外のときは「対象者」であると特定する。例えば、入力文「社長に進言する」の場合、抽出部16により抽出された「社長に」から抽出した指示対象「社長」は、一人称および二人称ではないので、「対象者」であると特定する。また、入力文に主語が存在しない場合は、入力文の主語は「話者」をデフォルトとする。また、入力文に「相手」に対応する名詞が存在しない場合、「相手」はデフォルトとする。ここで、デフォルトとは、該当する具体的な名詞が存在しない場合に、指示対象に具体的な指示対象を対応付けない状態のことを意味する。
【0038】
なお、入力文によっては、相手と対象者とが同一など、指示対象が重複する場合もあり得る。この場合、各指示対象を独立して扱ってもよく、重複する指示対象を統合して扱うようにしてもよい。
【0039】
指示対象が特定されると、判定部17の敬語判断部17bは、検出部14により検出された敬語に基づいて、指示対象の上下関係を判断する(ステップS507)。具体的には、検出された敬語が尊敬表現の場合、主語が他の指示対象よりも上位となる。また、検出された敬語が謙譲表現の場合、主語が他の指示対象よりも下位となる。また、検出された敬語の意味的制約動詞の尊敬表現に対応する場合、主語が他の指示対象よりも上位となる。また、検出された敬語の意味的制約動詞の謙譲表現に対応する場合、主語が他の指示対象よりも下位となる。また、丁寧表現の敬語が検出されない場合、相手は話者と同等または話者より下位となる。
例えば、入力文「社長に進言する」の場合、検出された敬語「進言」は意味的制約動詞の「謙譲表現」なので、主語である話者は「社長」よりも下位となる。また、丁寧表現の敬語が検出されていないので、相手は話者と同等または話者よりも下位となる。したがって、「社長>話者≧相手」という上下関係が検出される。
【0040】
なお、敬語判断部17bは、入力文に主語がなく、文脈からも主語が特定できないが、その入力文の敬語が謙譲表現の場合、話者が主語であるとデフォルトで特定して、上述した指示対象の上下関係の判断を行う。
【0041】
また、例えば、基本形「見る」は、「見られる」,「ごらんになる」、「ごらんになられる」というように、敬語表現には複数の段階が存在する場合がある。敬語判定部17bは、敬語表現の段階に基づいて、指示対象間の距離を判断するようにしてもよい。例えば、「見られる」などの敬語が用いられる場合には指示対象間の上下関係の距離が比較的近いとし、「ごらんになられる」などのより丁寧な敬語が用いられている場合には指示対象間の距離が比較的遠いと判断する。これにより、指示対象間の上下関係をより詳細に判断することができる。
【0042】
敬語により指示対象の上下関係が検出された場合、または、敬語から上下関係が検出できない場合ランク判断部17cは、ランクDB18に基づいて上下関係の確認または判断を行う(ステップS508)。例えば、入力文「社長に電話を差し上げた」の話者が「部長」場合、ランクDB18から「部長」は「社長」より下位にあることが検出されるので、入力文にある謙譲表現「差し上げた」の用法が正しいことが確認される。
【0043】
なお、話者と対象者の上下関係の検出を行うことにより、主語と目的語との上下関係の検出も同時に行うことができる。したがって、主語のみならず、目的語を用いて指示対象間の上下関係の検出を行うこともできる。
【0044】
また、ランク判断部17cにより上下関係が検出されない場合(ステップS509:NO)、内外判断部17dは、敬語辞書15に含まれる単語の内外関係に基づいて指示対象の上下関係を判断する(ステップS510)。例えば、入力文「夫が田中さんに進言した」の場合、話者は、内の関係にある主語「夫」を用いているので、対象者よりも下位となる。したがって、「話者<対象者」という上下関係が検出される。
【0045】
また、内外判断部17dにより上下関係が検出されない場合(ステップS511:NO)、親密度判断部17eは、指示対象の3者の親密度が低いと判断し、話者が他の指示対象よりも下位であると判断する(ステップS512)。したがって、内外判断部17dは、「対象者>話者,相手≧話者」という上下関係を検出する。
【0046】
上下関係が検出されると(ステップS509:YES,S511:YES,S512)、出力部17fは、検出した上下関係を出力する(ステップS513)。出力部17fは、検出した上下関係を上下関係検出装置1の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりする。これにより、ユーザは、入力した文から導き出される指示対象の上下関係を認識することが可能となる。
【0047】
このように、本実施の形態によれば、敬語の種類、各対象者間の社会的、年齢的または世代的な上下関係、内外関係当等に基づいて、指示対象の上下関係を判定することにより、文に関連する人間の上下関係をより具体的に判定することができる。
【0048】
[第2の実施の形態]
次に、本発明の第2の実施の形態について詳細に説明する、図7は、本実施の形態にかかる文生成装置2の構成を示すブロック図である。なお、本実施の形態において、第1の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
【0049】
文生成装置2は、入力部11と、解析部12と、文法辞書13と、敬語辞書15と、抽出部16と、判定部17と、ランクDB18と、選択部21と、生成部22と、機械翻訳装置23から構成される。このような文生成装置2は、CPU等の演算装置と、メモリ、HDD等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN、WAN等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT、LCDまたはFED等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した入力部11、解析部12、文法辞書13、敬語辞書15、抽出部16、判定部17、ランクDB18、選択部21、生成部22および機械翻訳装置23が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
【0050】
判定部17は、入力文の指示対象の上下関係を判定する演算処理部であり、指示対象特定部17aと、ランク判断部17cと、内外判断部17dと、親密度判断部17eと、出力部17fとから構成される。指示対象特定部17aは、抽出部16により抽出された指示対象が何れの指示対象に該当するかを特定する。ランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する。親密度判断部17eは、敬語判断部17b,ランク判断部17c,内外判断部17dの判断結果に基づいて、指示対象の上下関係を決定する。出力部17fは、敬語判断部17b,ランク判断部17c,内外判断部17dおよび親密度判断部17eの判断結果を選択部21に出力する。
【0051】
受付部20は、外部から入力文を受け付け、この入力文を機械翻訳装置23により翻訳させて翻訳文を生成する演算処理部である。なお、受付部20は、入力文に対して翻訳を行わせるのみならず、例えば、入力文を要約させたり、入力文から文を抽出させたり、入力文に対する質疑応答により文を生成させたりするようにしてもよい。
【0052】
選択部21は、解析部12による解析結果と、判定部17による指示対象の上下関係の検出結果とに基づいて、翻訳文に用いるべき敬語の種類を選択する演算処理部である。
【0053】
生成部22は、選択部21の演算結果に基づいて、敬語辞書15から翻訳文に用いるべき敬語を抽出し、この敬語を用いた翻訳文を生成する。
【0054】
機械翻訳装置23は、外国語辞書や対訳辞書等を用いて、1の言語を他の言語に翻訳する公知の機械翻訳システムである。上記他の言語としては、1カ国語のみならず複数の言語を設定することもできる。
【0055】
次に、本実施の形態にかかる文生成装置2の動作について図7を参照して説明する。なお、以下においては、受付部20には英語の入力文が入力され、機械翻訳装置23は、上記1の言語として英語語、上記他の言語として日本語が設定されている場合を例に説明する。
【0056】
まず、受付部20は、ユーザの操作入力、記録媒体、通信回線等を介して外部からテキストデータ等からなる英語の入力文が入力されると、機械翻訳装置23にその入力文を日本語に翻訳させる(ステップS701)。例えば、受付部20は、入力文「I called the president」が入力されると、この入力文を機械翻訳装置23に日本語に翻訳させ、翻訳文「私は社長に電話した」を生成する。
【0057】
翻訳文が生成されると、解析部12は、その翻訳文に対して解析、すなわち形態素解析および構文解析を行う(ステップS702)。例えば、受付部20により「私は社長に電話した」という翻訳文が生成されると、解析部12は、「私(名詞)/は(助詞)/社長(名詞)/に(助詞)/電話(名詞)/を(助詞)/し(動詞)/た(助動詞)」と単語単位に分割するとともに各単語に品詞を付与する。
【0058】
解析が行われると、抽出部16は、解析が行われた翻訳文から指示対象となり得る具体的な名詞を抽出する(ステップS703)。例えば、翻訳文「私は社長に電話した」の場合、格助詞が付随した名詞である「私は」,「社長に」を抽出する。なお、抽出部16は、格助詞が付随した名詞を抽出すると、その名詞のみを判定部17に出力する。
【0059】
指示対象となり得る具体的な名詞が抽出されると、判定部17の指示対象特定部17aは、抽出された翻訳文の名詞が話者、相手、対象者の何れであるかを特定する(ステップS704)。例えば、翻訳文「私は社長に電話した」の場合、抽出部16により抽出された「私」は一人称であるので「話者」、「社長」は一人称および二人称ではないので「対象者」であると特定する。なお、形態素解析の格助詞の結果から、主語は「私」であることも特定される。
【0060】
指示対象が特定されると、判定部17のランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する(ステップS705)。例えば、翻訳文「私は社長に電話した」の文脈から、話者が「課長」、相手が「部長」、対象者が「社長」ということが検出されている場合、図3(a)に示すようなランクDB18から、「社長>部長>課長」という上下関係が検出される。
【0061】
なお、ランク判断部17cにより上下関係が検出されない場合(ステップS706:NO)、内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する(ステップS707)。例えば、翻訳文「夫が田中に電話した」の場合、主語「夫」は、内の関係である。したがって、「話者<対象者(田中)、話者=対象者(夫)」という上下関係が検出される。
【0062】
また、内外判断部17dにより上下関係が検出されない場合(ステップS708:NO)、親密度判断部17eは、指示対象の3者の親密度が低いと判断し、話者が他の指示対象よりも下位であると判断する(ステップS709)。したがって、内外判断部17dは、「対象者>話者,相手≧話者」という上下関係を検出する。
【0063】
上下関係が検出されると(ステップS706:YES,S708:YES,S709)、出力部17fは、検出した上下関係を選択部21に出力する。選択部21は、出力部17fから入力される指示対象の上下関係と、解析部12により形態素解析された翻訳文とに基づいて、「尊敬表現」、「謙譲表現」、「丁寧表現」のうち何れを用いるべきかを選択する(ステップS710)。具体的には、翻訳文の構造と指示対象の上下関係から目的語が主語より上位にある場合、選択部21は、翻訳文に「謙譲表現」を用いると決定する。また、相手が話者より上位にある場合、選択部21は、翻訳文に「丁寧表現」を用いると決定する。例えば、翻訳文「私は社長に電話をした」の場合、目的語は対象者である「社長」であり、主語は話者である「課長(私)」であるから、翻訳文に「謙譲表現」を使用する。また、相手である「部長」は、話者である「課長(私)」よりも上位であるので、翻訳文に「丁寧表現」を使用する。
【0064】
敬語の種類が選択されると、生成部22は、敬語辞書15から翻訳文に用いるべき敬語を抽出し、この敬語を用いた翻訳文を生成する(ステップS711)。具体的には、まず、生成部22は、翻訳文の中から敬語に置換すべき単語の基本形を検出する。これは、翻訳文の中から述語、文型、動詞またはサ変名詞の意味的制約から適切な単語を検索することにより行われる。次に、生成部22は、検出した単語を置換することができる敬語を、選択部21の選択結果に基づいて敬語辞書15から抽出する。最後に、生成部22は、検出した単語を抽出した敬語に置き換えた翻訳文を生成する。生成された翻訳文は、文生成装置2の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりされる。例えば、翻訳文「私は社長に電話をした」の場合、生成部22は、置換する単語として「し」を検出し、これに置換する敬語として謙譲表現「いたし」と丁寧表現「まし」を敬語辞書15から抽出し、最終的に翻訳文「私は社長に電話をいたしました」を出力する。
【0065】
なお、生成部22は、生成部22は、ランク判断部17cによるランクDB18を用いた上下関係の判断結果に基づいて、翻訳文に用いるべき敬語を抽出するようにしてもよい。例えば、基本形「見る」は、「見られる」,「ごらんになる」、「ごらんになられる」というように、敬語表現に複数の段階が存在する。したがって、例えば、「課長」と「社員」のように指示対象間の距離が近い場合には、「見られる」などの敬語を用い、「会長」と「社員」のように指示対象間の距離が遠い場合には、「ごらんになられる」などのより丁寧な敬語を用いる。このようにすることにより、より詳細に敬語の使い分けを行うことができる。
【0066】
このように、本実施の形態によれば、各指示対象間の社会的、年齢的または世代的な上下関係、内外関係当等に基づいて、指示対象の上下関係を判定し、この判定結果に基づいて翻訳文の敬語を選択することにより、語用的により適切な文を生成することができる。
【0067】
なお、本実施の形態では、英語の入力文を日本語に翻訳した翻訳文について上述した各処理をようにしたが、入力文の言語および翻訳文の言語はそれぞれ英語または日本語に限定されず、適宜自由に設定することができる。
【0068】
また、本実施の形態にかかる文生成装置は、機械翻訳による翻訳文について意味的に正しい文章を生成するようにしたが、語用的に適切な文を生成できる文は翻訳文に限定されず、例えば、機械的に文章を要約した要約文、機械的に文章から抽出した抽出文、質疑応答システムで生成された文章など、各種文章について意味的に正しい文章を生成することができる。
【産業上の利用可能性】
【0069】
本発明は、自然言語処理システムに利用することができる。また、外国語等の言語を学習するための言語学習装置や、企業等の新人研修において正しい文章を学習させるための学習装置等にも利用することができる。
【図面の簡単な説明】
【0070】
【図1】上下関係判定装置1の構成を示すブロック図である。
【図2】敬語辞書の構成を示す図である。
【図3】ランクDBの構成を示す図である。
【図4】ランクDBの各モジュールを関連づけた図である。
【図5】上下関係判定装置1の動作を示すフローチャートである。
【図6】文生成装置2の構成を示すブロック図である。
【図7】文生成装置2の動作を示すフローチャートである。
【符号の説明】
【0071】
1…上下関係判定装置、2…文生成装置、11…入力部、12…解析部、13…文法辞書、14…検出部、15…敬語辞書、16…抽出部、17…判定部、17a…指示対象特定部、17b…敬語判断部、17c…ランク判断部、17d…内外判断部、17e…親密度判断部、17f…出力部、18…ランクDB、19a…述語取得手段、19b…翻訳手段、19c…判断手段、19d…登録手段、20…受付部、21…選択部、22…生成部、23…機械翻訳装置。


【特許請求の範囲】
【請求項1】
電子化された文を解析し、この文の話者と、この話者の相手と、前記文が話題としている対象者との3者を特定する特定ステップと、
この特定ステップにより特定された前記3者間の上下関係を判定する判定ステップと
を備えることを特徴とする上下関係判定方法。
【請求項2】
前記判定ステップは、前記文に含まれる敬語に基づいて、前記3者間の上下関係を判定する
ことを特徴とする請求項1記載の上下関係判定方法。
【請求項3】
前記判定ステップは、
前記文に含まれる敬語が尊敬表現の場合、前記文の主語に対応する前記3者のうちの何れかが、これ以外の前記3者より上位と判定し、
前記文に含まれる敬語が謙譲表現の場合、前記文の主語に対応する前記3者のうちの何れかが、これ以外の前記3者より下位と判定し、
前記文に丁寧表現の敬語が含まれない場合、相手は話者と同等または話者より下位と判定する
ことを特徴とする請求項2記載の上下関係判定方法。
【請求項4】
前記判定ステップは、前記3者間の社会的または年齢的な上下関係に基づいて、前記3者間の上下関係を判定する
ことを特徴とする請求項1または2記載の上下関係判定方法。
【請求項5】
前記判定ステップは、前記3者間の内外関係に基づいて、前記3者間の上下関係を判定する
ことを特徴とする請求項1または2記載の上下関係判定方法。
【請求項6】
前記判定ステップの結果に基づいて、前記文に使用する敬語を選択する選択ステップ
をさらに備えることを特徴とする請求項3乃至5の何れか1項に記載の上下関係判定方法。
【請求項7】
電子化された文を解析し、この文の話者と、この話者の相手と、前記文が話題としている対象者との3者を特定する特定手段と、
この特定ステップにより特定された前記3者間の上下関係を判定する判定手段と
を備えることを特徴とする上下関係判定装置。
【請求項8】
コンピュータに、
電子化された文を解析し、この文の話者と、この話者の相手と、前記文が話題としている対象者との3者を特定する特定ステップと、
この特定ステップにより特定された前記3者間の上下関係を判定する判定ステップと
を実行させることを特徴とする上下関係判定プログラム。
【請求項9】
請求項8に記載の上下関係判定プログラムを記録した記録媒体。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2007−102526(P2007−102526A)
【公開日】平成19年4月19日(2007.4.19)
【国際特許分類】
【出願番号】特願2005−292073(P2005−292073)
【出願日】平成17年10月5日(2005.10.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】