説明

応答生成装置、方法及びプログラム

【課題】コストをかけることなくユーザと円滑に対話を行う。
【解決手段】応答生成装置は、ユーザ発話から音声信号を生成するマイクロホン11と、マイクロホン11から出力された音声信号を認識する認識部12と、ユーザ発話を解析して述語及び格要素を抽出する解析部13と、抽出された述語又は格要素を確認するための応答を生成する応答生成部14と、応答発話を音声出力するスピーカ21と、応答発話を画像出力するディスプレイ22と、を備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、応答生成装置、方法及びプログラムに係り、ユーザと円滑に対話を行うための応答生成装置、方法及びプログラムに関する。
【背景技術】
【0002】
従来、予め決められたプランに基づいて対話を行う対話システムが提案されている。例えば、カーナビゲーションシステムは、目的地検索、旅行案内、文書検索等の予め定められたタスクを実行するために、ドライバとの対話を行うように設計されている。
【0003】
一方、日常の対話では、あらかじめ具体的な目的などは意識されていない。このため、例えば話し相手をするロボットのような非課題遂行型の対話システムは、ユーザが対話を楽しめるように、できる限り長く応答をすることが求められる。よって、上記対話システムは、あらかじめ大局的な制御規則を定めてその枠にはまった対話のみを許すというのではなく、局所的な相互作用を重視して臨機応変な対話を行うという枠組みが必要になってくる。
【0004】
そこで、人同士が日常行っているような自然な対話を行う対話装置が提案されている(例えば特許文献1参照。)。上記対話装置は、ユーザから入力が入ると内部状態記憶部4に記憶されている、その入力の元となった対話装置の発話内容から、入力状態候補選択部6および入力状態同定部8においてユーザの発話内容を同定し、それに適した応答を応答生成部12で作成するという局所的な制御モデルを導入している。
【0005】
具体的には、上記対話装置は、ユーザ発話の意図が質問(「固定情報提供要請」もしくは「一般情報提供要請」)の場合はその質問に答え(受動的情報提供)、ユーザの発話意図があいさつの場合は「情報提供の提起」、「自発的情報提供」、「話題転換」、「あいさつ」のいずれかを発話する、というルールが決められていた。
【0006】
また、断片的な未完成文の入力を許し、不足する情報に応じた問い合わせ文を生成する自然言語対話装置が提案されている(例えば特許文献2参照。)自然言語対話装置は、ユーザから入力された文を形態素解析し、形態素解析結果の単語列をそのまま構文解析する。すでに問い合わせ格が格納されていれば、対応する格要素を構文解析結果から抽出し意味解析する。格納されていなければ、構文解析結果をそのまま意味解析する。実行する機能を遂行するための情報が不足だと、その情報に対応する格を格納し、問い合わせ文を生成してユーザに提示する。
【特許文献1】特開2001−357053号公報
【特許文献2】特開平9−6790号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
特許文献1の対話装置は、例えば、「暑いな」というユーザ発話に対して「ほんまやな」、「泳ぎに行きたいな」に対して「沖縄がええで」と応答するために、ユーザがある事態について述べる「基本対話」に対して予め発話を用意する必要がある。
【0008】
しかし、ユーザ発話(基本対話)のバリエーションは膨大であるため、各々のユーザ発話に対して発話を用意するのは、コストの問題から現実的ではない。
【0009】
また、特許文献2の自然言語対話装置は、ユーザ発話に不足する情報を問い合わすだけだと、対話が一方通行になってしまい、ユーザに対話を楽しませることができない問題がある。
【0010】
本発明は、上述した課題を解決するために提案されたものであり、コストをかけることなくユーザと円滑に対話を行うことができる応答生成装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上述した課題を解決するため、本発明は、発話を入力する入力手段と、前記入力手段に入力された発話を解析して、述語及びそれに対応する格要素を抽出する解析手段と、前記解析手段により抽出された述語又は格要素を確認するための応答を生成する応答生成手段と、前記応答生成手段により生成された応答を出力する応答出力手段と、を備えている。
【0012】
入力手段は、発話内容を入力できればよく、音声であるか否かを問わない。解析手段は、入力手段に入力された発話を解析して、その発話に含まれる述語とその述語に対応する格要素とを抽出する。そして、応答生成手段は、解析手段で抽出された述語又は格要素を確認するための応答を生成し、応答出力手段を介して出力する。応答出力手段は、音声により応答を出力してもよいし、画像により応答を出力してもよい。
【0013】
したがって、上記発明は、入力された発話を解析して、述語及びそれに対応する格要素を抽出し、抽出された述語又は格要素を確認するための応答を生成することにより、応答を生成するための特別な用意をすることなく、発話内容に応じた応答を生成することができる。
【0014】
なお、本発明は、応答生成方法及びプログラムにも適用可能である。
【発明の効果】
【0015】
本発明は、入力された発話を解析して、述語及びそれに対応する格要素を抽出し、抽出された述語又は格要素を確認するための応答を生成することにより、コストをかけることなく、円滑に対話を行うことができる。
【発明を実施するための最良の形態】
【0016】
以下、本発明の好ましい実施の形態について図面を参照しながら詳細に説明する。
【0017】
[第1の実施形態]
図1は、本発明の第1の実施形態に係る応答生成装置の構成を示すブロック図である。
【0018】
第1の実施形態に係る応答生成装置は、ユーザ発話から音声信号を生成するマイクロホン11と、マイクロホン11から出力された音声信号を認識する認識部12と、ユーザ発話を解析する解析部13と、解析結果に基づいて応答発話を生成する応答生成部14と、応答発話を音声出力するスピーカ21と、応答発話を画像出力するディスプレイ22と、を備えている。
【0019】
図2は、解析部13の構成を示すブロック図である。解析部13は、ユーザ発話の形態素解析を行う形態素解析器31と、各文節の係り受け(修飾関係)を解析する係り受け解析器32と、述語と格要素を抽出する格解析器33と、抽出された述語に必須の格を補完する必須格補完エンジン34と、述語と必須格(格要素)との関係を定義する格辞書35と、述語同士の関係を解析する述語関係解析器36と、述語同士の関係を定義する述語関係データベース37と、を備えている。
【0020】
ここで、日本語における格は、ガ格、ヲ格、ニ格、カラ格、ト格、デ格、ヘ格、マデ格、ヨリ格の9種類がある(「基礎日本語文法―改訂版―」くろしお出版、p74−80)。格要素は、格の直前にくる名詞句であり、「述語」を修飾する文節に含まれる。「述語」は、発話の中に表現される動きや状態を表す単語であり、品詞が動詞、形容詞、サ変名詞で始まる文節をいう。
【0021】
図3は、格辞書35の構成を示す図である。格辞書35は、述語と必須格との関係、すなわち、述語とそれに共起する格との関係を示している。格辞書35は、例えば「作る」は「人ガ」、「物ヲ」、「人ニ」と共起し、「器用だ」は「人ガ」と共起することを定義している。ここで、「人」は人に関する名詞、「物」は物に関する名詞を示している。
【0022】
図4は、述語関係データベース37の構成を示す図である。述語関係データベース37は、述語1と述語2の関係を表している。例えば、「器用だ」は、「作る」の「理由」となる。「向かう」は、「行く」と「同格」である。「調べる」は、「知る」の「手段」となる。逆に、「知る」は、「調べる」の「結果」となる。
【0023】
以上のように構成された応答生成装置は、第1の応答生成ルーチンを実行することにより、ユーザとの間で例えば次のような対話例1を実現することができる。以下、ユーザ発話に対する本装置の発話を「システム発話」という。
【0024】
(対話例1)
ユーザ発話1:お父さんはすごく器用で、リビングのサイドボードとかを全部作ったの。
システム発話2:サイドボードを作ったの?
ユーザ発話3:そうなの。リビングにホームシアターシステムを作ったりもして。
システム発話4:お父さんが作ったの?
ユーザ発話5:そう。
システム発話6:それでそれで?
図5は、ユーザ発話に対する応答を生成する第1の応答生成ルーチンを示すフローチャートである。最初に、ユーザ発話1「お父さんはすごく器用で、リビングのサイドボードとかを全部作ったの。」が入力された場合を例に挙げて説明する。
【0025】
ステップS1では、応答生成装置の各部が初期化され、ステップS2に進む。そして、マイクロホン11はユーザ発話に応じた音声信号を生成し、認識部12は音声信号を認識する。
【0026】
ステップS2では、解析部13は、認識部12で認識されたユーザ発話を解析する。このとき、図2に示す解析部13を構成する各部は、次の処理を行う。
【0027】
最初に、形態素解析器31は、形態素解析を行い、ユーザ発話から品詞などの形態素情報を出力する。形態素解析器31は、例えば図6に示すように、「お父さん(名詞)」、「は(助詞)」、「すごく(形容詞)」、・・・、「作っ(動詞)」、「た(助動詞)」、「の(助詞)」を出力する。
【0028】
係り受け解析器32は、形態素解析器31の解析結果を用いて、次のように各文節の係り受け(修飾関係)を解析する。例えば図7に示すように、「お父さんは」及び「すごく」は、「器用で」に係っている。「リビングの」は「サイドボードとかを」に係っている。「器用で」、「サイドボードとかを」、「全部」は、それぞれ「作ったの」に係っている。
【0029】
格解析器33は、係り受け解析器32の解析結果の中から述語と格要素を抽出する。具体的には、格解析器33は、係り受け解析器32の解析結果の中から、図8に示すように、述語である「器用だ」とそれを修飾する「お父さんガ」とを抽出する。格解析器33は、更に、もう1つの述語である「作る」とそれを修飾する「サイドボードヲ」とを抽出する。
【0030】
必須格補完エンジン34は、格解析器33の解析結果と格辞書35とを照合して、本来述語が共起する格である必須格を補完して出力する。例えば、「作る」は、図3の格辞書35によると「人ガ(ガ格)」、「物ヲ(ヲ格)」、「人ニ(ニ格)」と共起する関係にある。一方、図8に示す解析結果では、「作る」は、既に「サイドボードヲ(ヲ格)」と修飾関係があるが、その他のガ格、ニ格と修飾関係がない。
【0031】
そこで、必須格補完エンジン34は、「作る」に共起するその他の格(ガ格、ニ格)を補完する。しかし、図8に示す解析結果ではガ格(お父さんガ)は存在するが、ニ格は存在していない。よって、本実施形態では、必須格補完エンジン34は、図9に示すように、「作る」に対してニ格は補完せず、ガ格(お父さんガ)のみを補完する。
【0032】
なお、「器用だ」は、図3の格辞書35によると「人ガ(ガ格)」、と共起する関係にあるが、図8に示す解析結果では「お父さんガ(ガ格)」と既に修飾関係にある。よって、必須格補完エンジン34は、「器用だ」に対しては補完する必要はない。
【0033】
述語関係解析器36は、述語関係データベース37を参照して、必須格補完エンジン34の補完結果に含まれる述語同士の関係を求める。ここでは、述語関係解析器36は、図10に示すように、「器用だ(現在)」と「作る(過去)」の間には「理由」の関係があることを求める。以上の処理が終わると、図5のステップS3に進む。
【0034】
ステップS3では、図1に示す応答生成部14は、図11に示すように、a)発話された格要素を確認すること(格要素の確認)、b)省略された格要素を質問すること(省略格要素の質問)、c)述語が行われた理由、時、場所を質問すること(述語の質問)、d)述語同士の関係を確認すること(述語同士の関係確認)、の4種類の発話候補を生成して、ステップS4に進む。
【0035】
発話候補としては、ユーザ発話1に対して、a)の場合、例えば「お父さんが器用なの?」、「お父さんが作ったの?」、「サイドボードを作ったの?」が生成される。b)の場合、例えば「誰に作ったの?」が生成される。c)の場合、例えば「どうして器用なの?」、「いつ器用なの?」、「いつ作ったの?」、「どこで作ったの?」が生成される。d)の場合、「器用だから作ったの?」が生成される。
【0036】
ステップS4では、応答生成部14は、発話候補が複数存在するかを判定し、肯定判定のときはステップS5に進み、否定判定のときはステップS6に進む。なお、発話候補が1つの場合、後述のステップにおいてその発話候補が応答発話として用いられる。
【0037】
ステップS5では、応答生成部14は、発話候補の中から1つをランダムに選択し、選択したものを応答発話として、ステップS6に進む。
【0038】
ステップS6では、スピーカ21は応答生成部14で生成された応答発話を音声出力し、又はディスプレイ22は応答生成部14で生成された応答発話を画像出力して、ステップS7に進む。これにより、ユーザ発話に対する応答がユーザに提示される。ここでは、例えば、システム発話2「サイドボードを作ったの?」が提示される。
【0039】
ステップS7では、ユーザ発話の次の入力があるか否かが判定され、肯定判定のとき(例えばユーザ発話3があったとき)はステップS2に戻り、否定判定ときは処理を終了する。
【0040】
以上のように、第1の実施形態に係る応答生成装置は、ユーザ発話から述語及び格要素を抽出し、抽出した述語又は格要素を確認する応答を生成するので、予め対話プランを用意することなく応答することができる。また、応答生成装置は、ユーザ発話がある限り、そのユーザ発話を深掘りする応答を生成するので、円滑に対話をすることができる。さらに、応答生成装置は、ユーザ発話に含まれる述語又は格要素から応答を生成することにより、応答生成の過程で特定のトピックに関するプランや知識が不要となり、あらゆるトピックについて応答することができる。
【0041】
なお、応答生成装置は、上述した構成に限定されるものではなく、例えば図12に示すように、マイクロホン11及び認識部12に代わりにキーボード11aを用いたものであってもよい。すなわち、ユーザ発話を入力する入力部は、特に限定されるものではない。また、後述する実施形態でも同様である。
【0042】
[第2の実施形態]
つぎに、本発明の第2の実施形態について説明する。なお、第1の実施形態と同一の部位には同一の符号を付し、主に第1の実施形態と異なる部分について説明する。
【0043】
図13は、本発明の第2の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図1に示す構成に、相槌を生成する相槌生成部15を追加したものである。
【0044】
相槌生成部15は、図14に示すように、「へぇ」、「ふーん」、「それでそれで?」、「そうなんだ」、「ふむふむ」等の複数の相槌を記憶しており、解析部13の解析結果を用いて相槌を生成する。
【0045】
以上のように構成された応答生成装置は、第2の応答生成ルーチンを実行することにより、応答発話を生成し、又は必要に応じて相槌を生成する。
【0046】
図15は、第2の応答生成ルーチンを示すフローチャートである。第2の応答生成ルーチンは、図5に示す第1の応答生成ルーチンにステップS11及びS12を加えたものである。
【0047】
具体的には、ステップS2が終了すると、ステップS11に進む。ステップS11では、応答生成部14は、解析部13の解析結果を用いて、ユーザ発話中に述部または格要素が存在するか否かを判定し、肯定判定のときはステップS3に進み、否定判定のとき(述部又は格要素が1つもないとき)はステップS12に進む。
【0048】
ステップS12では、応答生成部14は、図14に示す複数の相槌の中から1つをランダムに選択し、選択した相槌(例えば「それでそれで?」)をスピーカ21及びディスプレイ22に供給して、ステップS6に進む。
【0049】
この結果、ステップS6では、スピーカ21は相槌(例えば「それでそれで?」)を音声出力し、又はディスプレイ22はその相槌を画像出力して、ステップS7に進む。
【0050】
以上のように、第2の実施形態に係る応答生成装置は、ユーザ発話に述語又は格要素が存在するか否かを判定し、いずれかが存在するときは第1の実施形態と同様にして応答発話を生成し、いずれも存在しないときは相槌を生成する。これにより、ユーザ発話に明確な単語がない場合であっても、相槌で応答することによってユーザとの対話を円滑にすることができる。
【0051】
[第3の実施形態]
つぎに、本発明の第3の実施形態について説明する。なお、上述の実施形態と同一の部位には同一の符号を付し、主に異なる部分について説明する。
【0052】
図16は、本発明の第3の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図13に示す構成に、複数の発話候補から1つを選択する応答選択部16を追加したものである。
【0053】
応答選択部16は、応答生成部14で生成された複数の発話候補から1つを選択し、選択したものを応答発話としてスピーカ21及びディスプレイ22に供給する。発話候補がない場合、すなわち相槌生成部15で相槌が生成された場合は、応答選択部16は、その相槌をスピーカ21及びディスプレイ22に供給する。
【0054】
また、応答選択部16は、複数の発話候補から1つを選択するための発話選択ルールを記憶している。発話選択ルールは、図17に示すように、優先度1)〜4)まである。優先度1)は最も優先度が高く、優先度4)は最も優先度が低い。優先度1)は発話された格要素を確認すること、優先度2)は述語が省略された理由、時、場所のいずれかを質問すること、優先度3)は省略された格要素を質問すること、優先度4)は述語同士の関係を確認すること、を表している。
【0055】
以上のように構成された応答生成装置は、第3の応答生成ルーチンを実行することにより、発話候補の中から最も優先度の高いものを選択する。
【0056】
図18は、第3の応答生成ルーチンを示すフローチャートである。第3の応答生成ルーチンは、図15に示す第2の応答生成ルーチンにステップS21及びS22を加えたものである。
【0057】
具体的には、ステップS4で肯定判定のときはステップS21に進む。ステップS21では、応答選択部16は、図17に示す発話選択ルールに従って、応答生成部14で生成された発話候補から1つを選択する。本実施形態では、図11に示すa)格要素の確認、b)省略格要素の質問、d)述語同士の関係確認、c)述語の質問の順に優先度が高いものとする。
【0058】
そこで、第1の実施の形態で生成された複数の発話候補を発話選択ルールに照らし合わせると、
優先度1)「お父さんが器用なの?」、「お父さんが作ったの?」、「サイドボードを作ったの?」
優先度2)「どうして器用なの?」、「いつ器用なの?」、「いつ作ったの?」、「どこで作ったの?」
優先度3)「誰に作ったの?」
優先度4)「器用だから作ったの?」
となる。
【0059】
応答選択部16は、複数の発話候補から最も優先度の高い「お父さんが器用なの?」、「お父さんが作ったの?」、「サイドボードを作ったの?」を選択して、ステップS22に進む。
【0060】
ステップS22では、応答選択部16は、同じ優先度の発話候補が複数存在するか否かを判定し、肯定判定のときはステップS5に進み、否定判定のときはステップS6に進む。そして、ステップS22からステップS5に進むと、優先度1)の3つの発話候補の中からランダムに1つが選択され、ステップS6を経て、優先度の高い発話候補が応答発話として、ユーザに提示される。
【0061】
以上のように、第3の実施形態に係る応答生成装置は、複数の発話候補から優先度の高いものを1つ選択してユーザに提示することにより、ユーザとの対話を円滑に進めることができる。
【0062】
なお、発話候補を選択する基準となる優先度は、固定である必要はなく、出力された応答発話に応じて動的に変化してもよい。例えば、応答選択部16は、今回格要素の確認を示す発話候補を選択した場合、次回はその発話候補の優先度を最も低く変更してもよい。これにより、同じ内容の応答が連続して出力されるのが回避されるので、対話が単調になるのを防止することができる。
【0063】
[第4の実施形態]
つぎに、本発明の第4の実施形態について説明する。なお、上述の実施形態と同一の部位には同一の符号を付し、主に異なる部分について説明する。
【0064】
図19は、本発明の第4の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図16に示す構成に、文脈管理部17及び文脈データベース18を追加したものである。
【0065】
文脈データベース18には、文脈管理部17を介して、認識部12、解析部13、応答生成部14、応答選択部16の履歴が逐次記録される。例えば、文脈データベース18には、ユーザとの対話の履歴(文脈情報)として、認識部12における音響モデルの絞り込み、解析部13で抽出された述語及び格要素、さらに補完された必須格、応答生成部14による文脈に基づく応答発話、応答選択部16による選択された発話候補に関する情報が記録される。また、文脈管理部17は、ユーザとの対話を進めながら逐次文脈データベース18の文脈情報を更新する。
【0066】
以上のように構成された応答生成装置は、ユーザとの過去の対話の履歴である文脈情報を用いて、ユーザ発話に対する応答を生成する。ここで、ユーザ発話が「新築した時なんて、リビングのサイドボードとかを全部作ったの。」であるのに対して、その前のユーザとシステムの過去の対話(前文脈)が図20に示す対話例2である場合を挙げて説明する。
【0067】
ここで、文脈データベース18には、前文脈についての解析部13の解析結果が記録されており、例えば、前文脈に含まれる「述語」及びそれと修飾関係(共起関係)にある1つ以上の「格要素」が記録されている。
【0068】
具体的には、文脈データベース18には、図21に示すように、「聞く」に対してそれと修飾関係にある「お父さんガ」及び「言うことヲ」の関係、「おねだり上手だ」に対してそれと修飾関係にある「お母さんガ」の関係、「聞く」に対してそれと修飾関係にある「言うことヲ」の関係が記録されている。
【0069】
そして、マイクロホン11に上記のユーザ発話が入力されると、図2に示す解析部13の格解析器33は、図22に示すように、述語として「作る」を抽出すると共に、「作る」と修飾関係にある格要素「新築した時ニ」、「サイドボードヲ」を抽出する。
【0070】
次に、必須格補完エンジン34は、格解析器33の解析結果と格辞書35とを照合して、本来述語が共起する格を補完して出力する。ここで、「作る」は、図3の格辞書35によるとガ格、ヲ格、ニ格と共起する関係にあるが、図8に示す解析結果ではガ格がない。そこで、必須格補完エンジン34は、図21に示す前文脈の解析結果から最近のガ格である「お父さんガ」を抽出し、その「お父さんガ」を「作る」のガ格として補完する。
【0071】
述語関係解析器36は、述語関係データベース37を参照して、文脈データベース18に記録されている前文脈の述語と必須格補完エンジン34から出力された述語との関係を求める。
【0072】
ここでは、述語関係解析器36は、図23に示すように、「聞く(現在)」→「作る(過去)」の述語同士の間には「理由」の関係があり、「おねだり上手だ(現在)」→「作る(過去)」の述語同士の間には「理由」の関係があるので、これらの関係を求める。
【0073】
応答生成部14は、解析部13の解析結果を用いて応答発話を生成する。例えば、応答生成部14は、述語同士の関係を用いて、今回のユーザ発話に含まれる述語「作る」が行われた理由、時、場所のいずれかについての質問を生成する。本実施形態では、図23に示すように、「聞く(現在)」→「作る(過去)」の述語同士については、「ホイホイ言うこと聞いちゃって?」が生成される。また、「おねだり上手だ(現在)」→「作る(過去)」の述語同士については、「お母さんがおねだり上手だから?」が生成される。
【0074】
また例えば、応答生成部14は、解析部13の必須格補完エンジン34で補完された格を確認する応答発話を生成する。本実施形態では、「お父さんが作ったの?」が生成される。
【0075】
応答選択部16は、文脈データベース18を用いて、相槌生成部15で生成された応答発話の中から1つの応答発話を選択する。例えば、応答選択部16は、文脈データベース18に記憶されている前文脈及び今回のユーザ発話から、対話の主題を抽出し、対話の主題に関連する応答発話を選択する。主題の抽出方法としては、例えば、解析部13で抽出された格要素の中で最近の格要素を抽出してもよいし、前文脈及び今回のユーザ発話の中で最も多い格要素を抽出してもよい。
【0076】
本実施形態では、対話の主題として「サイドボード」が抽出され、図24に示すように、その結果「サイドボードを作ったの?」が選択される。そして、この発話は、スピーカ21及びディスプレイ22に供給され、ユーザに提示される。
【0077】
以上のように、第4の実施形態に係る応答生成装置は、過去の対話の履歴を用いてユーザ発話の述語に不足していた格要素を補完し、述語と補完した格要素とに基づいて応答発話を生成する。これにより、上記応答生成装置は、ユーザ発話の情報が不足した場合であっても、対話の流れに沿った最適な応答をすることができる。
【0078】
また、応答生成装置は、ユーザ発話に対して複数の発話候補を生成した場合は、過去の対話の履歴の中から対話の主題を抽出し、その主題に関する応答発話を選択して出力することにより、対話のポイントを外すことなく円滑に対話を継続することができる。
【0079】
なお、本発明は、上述した実施の形態に限定されるものではなく、特許請求の範囲に記載された範囲内で設計上の変更をされたものにも適用可能であるのは勿論である。
【0080】
例えば応答発話を提示する手段として、スピーカ21やディスプレイ22を使用したが、その他、応答内容を表現できるロボット装置を使用してもよい。また、各実施形態に係る応答生成装置は、スピーカ21、ディスプレイ22の一方のみを備えていてもよい。
【図面の簡単な説明】
【0081】
【図1】本発明の第1の実施形態に係る応答生成装置の構成を示すブロック図である。
【図2】解析部の構成を示すブロック図である。
【図3】格辞書の構成を示す図である。
【図4】述語関係データベースの構成を示す図である。
【図5】ユーザ発話に対する応答を生成する第1の応答生成ルーチンを示すフローチャートである。
【図6】形態素解析器から出力される形態素情報を示す図である。
【図7】文節の係り受けの関係を示す図である。
【図8】格解析器によって抽出された述語とそれに対応する格要素とを示す図である。
【図9】「作る」に対して必須格であるガ格の格要素が補完された状態を示す図である。
【図10】述語同士の関係を示す図である。
【図11】発話候補の種類を示す図である。
【図12】応答生成装置の他の構成を示すブロック図である。
【図13】本発明の第2の実施形態に係る応答生成装置の構成を示すブロック図である。
【図14】相槌の候補を示す図である。
【図15】第2の応答生成ルーチンを示すフローチャートである。
【図16】本発明の第3の実施形態に係る応答生成装置の構成を示すブロック図である。
【図17】発話候補の優先度を示す図である。
【図18】第3の応答生成ルーチンを示すフローチャートである。
【図19】本発明の第4の実施形態に係る応答生成装置の構成を示すブロック図である。
【図20】対話例2を示す図である。
【図21】文脈データベースに記録されている履歴の一部を示す図である。
【図22】格解析器によって抽出される述語と格要素とを示す図である。
【図23】文脈データベースを用いて求められる述語同士の関係を示す図である。
【図24】文脈データベースを用いて選択された発話候補を示す図である。
【符号の説明】
【0082】
11 マイクロホン
12 認識部
13 解析部
14 応答生成部
15 相槌生成部
16 応答選択部
17 文脈管理部
18 文脈データベース
21 スピーカ
22 ディスプレイ

【特許請求の範囲】
【請求項1】
発話を入力する入力手段と、
前記入力手段に入力された発話を解析して、述語及びそれに対応する格要素を抽出する解析手段と、
前記解析手段により抽出された述語又は格要素を確認するための応答を生成する応答生成手段と、
前記応答生成手段により生成された応答を出力する応答出力手段と、
を備えた応答生成装置。
【請求項2】
前記応答生成手段は、述語及びそれに共起する格要素を用いて、前記述語又は前記格要素を確認するための応答を生成する
請求項1に記載の応答生成装置。
【請求項3】
前記応答生成手段は、前記解析手段により抽出された述語に共起する格要素が不足するときに、前記不足する格要素を他の述語に共起する格要素の中から補完する
請求項2に記載の応答生成装置。
【請求項4】
前記解析手段は、複数の述語を抽出したときに述語同士の関係を解析し、
前記応答生成手段は、前記解析手段で解析された述語同士の関係を確認するための応答を生成する
請求項1から請求項3のいずれか1項に記載の応答生成装置。
【請求項5】
前記応答生成手段で複数の応答が生成されたときに複数の応答から優先度の高い応答を選択する応答選択手段を更に備え、
前記応答出力手段は、前記応答選択手段により選択された応答を出力する
請求項1から請求項4のいずれか1項に記載の応答生成装置。
【請求項6】
前記応答生成手段は、前記解析手段で述語、格要素のいずれも抽出されなかったときに、前記応答として相槌を生成する
請求項1から請求項5のいずれか1項に記載の応答生成装置。
【請求項7】
少なくとも前記解析手段の過去の解析結果を記憶する記憶手段を更に備え、
前記応答生成手段は、前記解析手段により抽出された述語に共起する格要素が不足するときに、前記不足する格要素を、前記記憶手段に記憶された解析手段の過去の解析結果に含まれる格要素から補完する
請求項2に記載の応答生成装置。
【請求項8】
少なくとも前記解析手段の過去の解析結果を記憶する記憶手段を更に備え、
前記解析手段は、抽出した述語と、前記記憶手段に記憶されている過去の解析結果に含まれる述語と、の関係を解析する
請求項4に記載の応答生成装置。
【請求項9】
少なくとも前記解析手段の過去の解析結果及び前記応答生成手段の過去の生成結果を記憶する記憶手段と、
前記記憶手段に記憶された情報から発話の主題を抽出し、応答生成手段により生成された複数の応答から、抽出した主題に関する応答を選択する選択手段と、を更に備えた
請求項1から請求項6のいずれか1項に記載の応答生成装置。
【請求項10】
発話を入力し、
前記入力された発話を解析して、述語及びそれに対応する格要素を抽出し、
前記抽出された述語又は格要素を確認するための応答を生成し、
前記生成された応答を出力する
応答生成方法。
【請求項11】
コンピュータに、
発話を入力させ、
前記入力された発話を解析させて、述語及びそれに対応する格要素を抽出させ、
前記抽出された述語又は格要素を確認するための応答を生成させ、
前記生成された応答を出力させる
応答生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate


【公開番号】特開2007−206888(P2007−206888A)
【公開日】平成19年8月16日(2007.8.16)
【国際特許分類】
【出願番号】特願2006−23682(P2006−23682)
【出願日】平成18年1月31日(2006.1.31)
【出願人】(000003609)株式会社豊田中央研究所 (4,200)
【Fターム(参考)】