応答生成装置、方法及びプログラム

【課題】コストをかけることなくユーザと円滑に対話を行う。
【解決手段】応答生成装置は、ユーザ発話から音声信号を生成するマイクロホン１１と、マイクロホン１１から出力された音声信号を認識する認識部１２と、ユーザ発話を解析して述語及び格要素を抽出する解析部１３と、抽出された述語又は格要素を確認するための応答を生成する応答生成部１４と、応答発話を音声出力するスピーカ２１と、応答発話を画像出力するディスプレイ２２と、を備えている。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、応答生成装置、方法及びプログラムに係り、ユーザと円滑に対話を行うための応答生成装置、方法及びプログラムに関する。
【背景技術】
【０００２】
従来、予め決められたプランに基づいて対話を行う対話システムが提案されている。例えば、カーナビゲーションシステムは、目的地検索、旅行案内、文書検索等の予め定められたタスクを実行するために、ドライバとの対話を行うように設計されている。
【０００３】
一方、日常の対話では、あらかじめ具体的な目的などは意識されていない。このため、例えば話し相手をするロボットのような非課題遂行型の対話システムは、ユーザが対話を楽しめるように、できる限り長く応答をすることが求められる。よって、上記対話システムは、あらかじめ大局的な制御規則を定めてその枠にはまった対話のみを許すというのではなく、局所的な相互作用を重視して臨機応変な対話を行うという枠組みが必要になってくる。
【０００４】
そこで、人同士が日常行っているような自然な対話を行う対話装置が提案されている（例えば特許文献１参照。）。上記対話装置は、ユーザから入力が入ると内部状態記憶部４に記憶されている、その入力の元となった対話装置の発話内容から、入力状態候補選択部６および入力状態同定部８においてユーザの発話内容を同定し、それに適した応答を応答生成部１２で作成するという局所的な制御モデルを導入している。
【０００５】
具体的には、上記対話装置は、ユーザ発話の意図が質問（「固定情報提供要請」もしくは「一般情報提供要請」）の場合はその質問に答え（受動的情報提供）、ユーザの発話意図があいさつの場合は「情報提供の提起」、「自発的情報提供」、「話題転換」、「あいさつ」のいずれかを発話する、というルールが決められていた。
【０００６】
また、断片的な未完成文の入力を許し、不足する情報に応じた問い合わせ文を生成する自然言語対話装置が提案されている（例えば特許文献２参照。）自然言語対話装置は、ユーザから入力された文を形態素解析し、形態素解析結果の単語列をそのまま構文解析する。すでに問い合わせ格が格納されていれば、対応する格要素を構文解析結果から抽出し意味解析する。格納されていなければ、構文解析結果をそのまま意味解析する。実行する機能を遂行するための情報が不足だと、その情報に対応する格を格納し、問い合わせ文を生成してユーザに提示する。
【特許文献１】特開２００１−３５７０５３号公報
【特許文献２】特開平９−６７９０号公報
【発明の開示】
【発明が解決しようとする課題】
【０００７】
特許文献１の対話装置は、例えば、「暑いな」というユーザ発話に対して「ほんまやな」、「泳ぎに行きたいな」に対して「沖縄がええで」と応答するために、ユーザがある事態について述べる「基本対話」に対して予め発話を用意する必要がある。
【０００８】
しかし、ユーザ発話（基本対話）のバリエーションは膨大であるため、各々のユーザ発話に対して発話を用意するのは、コストの問題から現実的ではない。
【０００９】
また、特許文献２の自然言語対話装置は、ユーザ発話に不足する情報を問い合わすだけだと、対話が一方通行になってしまい、ユーザに対話を楽しませることができない問題がある。
【００１０】
本発明は、上述した課題を解決するために提案されたものであり、コストをかけることなくユーザと円滑に対話を行うことができる応答生成装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【００１１】
上述した課題を解決するため、本発明は、発話を入力する入力手段と、前記入力手段に入力された発話を解析して、述語及びそれに対応する格要素を抽出する解析手段と、前記解析手段により抽出された述語又は格要素を確認するための応答を生成する応答生成手段と、前記応答生成手段により生成された応答を出力する応答出力手段と、を備えている。
【００１２】
入力手段は、発話内容を入力できればよく、音声であるか否かを問わない。解析手段は、入力手段に入力された発話を解析して、その発話に含まれる述語とその述語に対応する格要素とを抽出する。そして、応答生成手段は、解析手段で抽出された述語又は格要素を確認するための応答を生成し、応答出力手段を介して出力する。応答出力手段は、音声により応答を出力してもよいし、画像により応答を出力してもよい。
【００１３】
したがって、上記発明は、入力された発話を解析して、述語及びそれに対応する格要素を抽出し、抽出された述語又は格要素を確認するための応答を生成することにより、応答を生成するための特別な用意をすることなく、発話内容に応じた応答を生成することができる。
【００１４】
なお、本発明は、応答生成方法及びプログラムにも適用可能である。
【発明の効果】
【００１５】
本発明は、入力された発話を解析して、述語及びそれに対応する格要素を抽出し、抽出された述語又は格要素を確認するための応答を生成することにより、コストをかけることなく、円滑に対話を行うことができる。
【発明を実施するための最良の形態】
【００１６】
以下、本発明の好ましい実施の形態について図面を参照しながら詳細に説明する。
【００１７】
［第１の実施形態］
図１は、本発明の第１の実施形態に係る応答生成装置の構成を示すブロック図である。
【００１８】
第１の実施形態に係る応答生成装置は、ユーザ発話から音声信号を生成するマイクロホン１１と、マイクロホン１１から出力された音声信号を認識する認識部１２と、ユーザ発話を解析する解析部１３と、解析結果に基づいて応答発話を生成する応答生成部１４と、応答発話を音声出力するスピーカ２１と、応答発話を画像出力するディスプレイ２２と、を備えている。
【００１９】
図２は、解析部１３の構成を示すブロック図である。解析部１３は、ユーザ発話の形態素解析を行う形態素解析器３１と、各文節の係り受け（修飾関係）を解析する係り受け解析器３２と、述語と格要素を抽出する格解析器３３と、抽出された述語に必須の格を補完する必須格補完エンジン３４と、述語と必須格（格要素）との関係を定義する格辞書３５と、述語同士の関係を解析する述語関係解析器３６と、述語同士の関係を定義する述語関係データベース３７と、を備えている。
【００２０】
ここで、日本語における格は、ガ格、ヲ格、ニ格、カラ格、ト格、デ格、ヘ格、マデ格、ヨリ格の９種類がある（「基礎日本語文法―改訂版―」くろしお出版、ｐ７４−８０）。格要素は、格の直前にくる名詞句であり、「述語」を修飾する文節に含まれる。「述語」は、発話の中に表現される動きや状態を表す単語であり、品詞が動詞、形容詞、サ変名詞で始まる文節をいう。
【００２１】
図３は、格辞書３５の構成を示す図である。格辞書３５は、述語と必須格との関係、すなわち、述語とそれに共起する格との関係を示している。格辞書３５は、例えば「作る」は「人ガ」、「物ヲ」、「人ニ」と共起し、「器用だ」は「人ガ」と共起することを定義している。ここで、「人」は人に関する名詞、「物」は物に関する名詞を示している。
【００２２】
図４は、述語関係データベース３７の構成を示す図である。述語関係データベース３７は、述語１と述語２の関係を表している。例えば、「器用だ」は、「作る」の「理由」となる。「向かう」は、「行く」と「同格」である。「調べる」は、「知る」の「手段」となる。逆に、「知る」は、「調べる」の「結果」となる。
【００２３】
以上のように構成された応答生成装置は、第１の応答生成ルーチンを実行することにより、ユーザとの間で例えば次のような対話例１を実現することができる。以下、ユーザ発話に対する本装置の発話を「システム発話」という。
【００２４】
（対話例１）
ユーザ発話１：お父さんはすごく器用で、リビングのサイドボードとかを全部作ったの。
システム発話２：サイドボードを作ったの？
ユーザ発話３：そうなの。リビングにホームシアターシステムを作ったりもして。
システム発話４：お父さんが作ったの？
ユーザ発話５：そう。
システム発話６：それでそれで？
図５は、ユーザ発話に対する応答を生成する第１の応答生成ルーチンを示すフローチャートである。最初に、ユーザ発話１「お父さんはすごく器用で、リビングのサイドボードとかを全部作ったの。」が入力された場合を例に挙げて説明する。
【００２５】
ステップＳ１では、応答生成装置の各部が初期化され、ステップＳ２に進む。そして、マイクロホン１１はユーザ発話に応じた音声信号を生成し、認識部１２は音声信号を認識する。
【００２６】
ステップＳ２では、解析部１３は、認識部１２で認識されたユーザ発話を解析する。このとき、図２に示す解析部１３を構成する各部は、次の処理を行う。
【００２７】
最初に、形態素解析器３１は、形態素解析を行い、ユーザ発話から品詞などの形態素情報を出力する。形態素解析器３１は、例えば図６に示すように、「お父さん（名詞）」、「は（助詞）」、「すごく（形容詞）」、・・・、「作っ（動詞）」、「た（助動詞）」、「の（助詞）」を出力する。
【００２８】
係り受け解析器３２は、形態素解析器３１の解析結果を用いて、次のように各文節の係り受け（修飾関係）を解析する。例えば図７に示すように、「お父さんは」及び「すごく」は、「器用で」に係っている。「リビングの」は「サイドボードとかを」に係っている。「器用で」、「サイドボードとかを」、「全部」は、それぞれ「作ったの」に係っている。
【００２９】
格解析器３３は、係り受け解析器３２の解析結果の中から述語と格要素を抽出する。具体的には、格解析器３３は、係り受け解析器３２の解析結果の中から、図８に示すように、述語である「器用だ」とそれを修飾する「お父さんガ」とを抽出する。格解析器３３は、更に、もう１つの述語である「作る」とそれを修飾する「サイドボードヲ」とを抽出する。
【００３０】
必須格補完エンジン３４は、格解析器３３の解析結果と格辞書３５とを照合して、本来述語が共起する格である必須格を補完して出力する。例えば、「作る」は、図３の格辞書３５によると「人ガ（ガ格）」、「物ヲ（ヲ格）」、「人ニ（ニ格）」と共起する関係にある。一方、図８に示す解析結果では、「作る」は、既に「サイドボードヲ（ヲ格）」と修飾関係があるが、その他のガ格、ニ格と修飾関係がない。
【００３１】
そこで、必須格補完エンジン３４は、「作る」に共起するその他の格（ガ格、ニ格）を補完する。しかし、図８に示す解析結果ではガ格（お父さんガ）は存在するが、ニ格は存在していない。よって、本実施形態では、必須格補完エンジン３４は、図９に示すように、「作る」に対してニ格は補完せず、ガ格（お父さんガ）のみを補完する。
【００３２】
なお、「器用だ」は、図３の格辞書３５によると「人ガ（ガ格）」、と共起する関係にあるが、図８に示す解析結果では「お父さんガ（ガ格）」と既に修飾関係にある。よって、必須格補完エンジン３４は、「器用だ」に対しては補完する必要はない。
【００３３】
述語関係解析器３６は、述語関係データベース３７を参照して、必須格補完エンジン３４の補完結果に含まれる述語同士の関係を求める。ここでは、述語関係解析器３６は、図１０に示すように、「器用だ（現在）」と「作る（過去）」の間には「理由」の関係があることを求める。以上の処理が終わると、図５のステップＳ３に進む。
【００３４】
ステップＳ３では、図１に示す応答生成部１４は、図１１に示すように、ａ）発話された格要素を確認すること（格要素の確認）、ｂ）省略された格要素を質問すること（省略格要素の質問）、ｃ）述語が行われた理由、時、場所を質問すること（述語の質問）、ｄ）述語同士の関係を確認すること（述語同士の関係確認）、の４種類の発話候補を生成して、ステップＳ４に進む。
【００３５】
発話候補としては、ユーザ発話１に対して、ａ）の場合、例えば「お父さんが器用なの？」、「お父さんが作ったの？」、「サイドボードを作ったの？」が生成される。ｂ）の場合、例えば「誰に作ったの？」が生成される。ｃ）の場合、例えば「どうして器用なの？」、「いつ器用なの？」、「いつ作ったの？」、「どこで作ったの？」が生成される。ｄ）の場合、「器用だから作ったの？」が生成される。
【００３６】
ステップＳ４では、応答生成部１４は、発話候補が複数存在するかを判定し、肯定判定のときはステップＳ５に進み、否定判定のときはステップＳ６に進む。なお、発話候補が１つの場合、後述のステップにおいてその発話候補が応答発話として用いられる。
【００３７】
ステップＳ５では、応答生成部１４は、発話候補の中から１つをランダムに選択し、選択したものを応答発話として、ステップＳ６に進む。
【００３８】
ステップＳ６では、スピーカ２１は応答生成部１４で生成された応答発話を音声出力し、又はディスプレイ２２は応答生成部１４で生成された応答発話を画像出力して、ステップＳ７に進む。これにより、ユーザ発話に対する応答がユーザに提示される。ここでは、例えば、システム発話２「サイドボードを作ったの？」が提示される。
【００３９】
ステップＳ７では、ユーザ発話の次の入力があるか否かが判定され、肯定判定のとき（例えばユーザ発話３があったとき）はステップＳ２に戻り、否定判定ときは処理を終了する。
【００４０】
以上のように、第１の実施形態に係る応答生成装置は、ユーザ発話から述語及び格要素を抽出し、抽出した述語又は格要素を確認する応答を生成するので、予め対話プランを用意することなく応答することができる。また、応答生成装置は、ユーザ発話がある限り、そのユーザ発話を深掘りする応答を生成するので、円滑に対話をすることができる。さらに、応答生成装置は、ユーザ発話に含まれる述語又は格要素から応答を生成することにより、応答生成の過程で特定のトピックに関するプランや知識が不要となり、あらゆるトピックについて応答することができる。
【００４１】
なお、応答生成装置は、上述した構成に限定されるものではなく、例えば図１２に示すように、マイクロホン１１及び認識部１２に代わりにキーボード１１ａを用いたものであってもよい。すなわち、ユーザ発話を入力する入力部は、特に限定されるものではない。また、後述する実施形態でも同様である。
【００４２】
［第２の実施形態］
つぎに、本発明の第２の実施形態について説明する。なお、第１の実施形態と同一の部位には同一の符号を付し、主に第１の実施形態と異なる部分について説明する。
【００４３】
図１３は、本発明の第２の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図１に示す構成に、相槌を生成する相槌生成部１５を追加したものである。
【００４４】
相槌生成部１５は、図１４に示すように、「へぇ」、「ふーん」、「それでそれで？」、「そうなんだ」、「ふむふむ」等の複数の相槌を記憶しており、解析部１３の解析結果を用いて相槌を生成する。
【００４５】
以上のように構成された応答生成装置は、第２の応答生成ルーチンを実行することにより、応答発話を生成し、又は必要に応じて相槌を生成する。
【００４６】
図１５は、第２の応答生成ルーチンを示すフローチャートである。第２の応答生成ルーチンは、図５に示す第１の応答生成ルーチンにステップＳ１１及びＳ１２を加えたものである。
【００４７】
具体的には、ステップＳ２が終了すると、ステップＳ１１に進む。ステップＳ１１では、応答生成部１４は、解析部１３の解析結果を用いて、ユーザ発話中に述部または格要素が存在するか否かを判定し、肯定判定のときはステップＳ３に進み、否定判定のとき（述部又は格要素が１つもないとき）はステップＳ１２に進む。
【００４８】
ステップＳ１２では、応答生成部１４は、図１４に示す複数の相槌の中から１つをランダムに選択し、選択した相槌（例えば「それでそれで？」）をスピーカ２１及びディスプレイ２２に供給して、ステップＳ６に進む。
【００４９】
この結果、ステップＳ６では、スピーカ２１は相槌（例えば「それでそれで？」）を音声出力し、又はディスプレイ２２はその相槌を画像出力して、ステップＳ７に進む。
【００５０】
以上のように、第２の実施形態に係る応答生成装置は、ユーザ発話に述語又は格要素が存在するか否かを判定し、いずれかが存在するときは第１の実施形態と同様にして応答発話を生成し、いずれも存在しないときは相槌を生成する。これにより、ユーザ発話に明確な単語がない場合であっても、相槌で応答することによってユーザとの対話を円滑にすることができる。
【００５１】
［第３の実施形態］
つぎに、本発明の第３の実施形態について説明する。なお、上述の実施形態と同一の部位には同一の符号を付し、主に異なる部分について説明する。
【００５２】
図１６は、本発明の第３の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図１３に示す構成に、複数の発話候補から１つを選択する応答選択部１６を追加したものである。
【００５３】
応答選択部１６は、応答生成部１４で生成された複数の発話候補から１つを選択し、選択したものを応答発話としてスピーカ２１及びディスプレイ２２に供給する。発話候補がない場合、すなわち相槌生成部１５で相槌が生成された場合は、応答選択部１６は、その相槌をスピーカ２１及びディスプレイ２２に供給する。
【００５４】
また、応答選択部１６は、複数の発話候補から１つを選択するための発話選択ルールを記憶している。発話選択ルールは、図１７に示すように、優先度１）〜４）まである。優先度１）は最も優先度が高く、優先度４）は最も優先度が低い。優先度１）は発話された格要素を確認すること、優先度２）は述語が省略された理由、時、場所のいずれかを質問すること、優先度３）は省略された格要素を質問すること、優先度４）は述語同士の関係を確認すること、を表している。
【００５５】
以上のように構成された応答生成装置は、第３の応答生成ルーチンを実行することにより、発話候補の中から最も優先度の高いものを選択する。
【００５６】
図１８は、第３の応答生成ルーチンを示すフローチャートである。第３の応答生成ルーチンは、図１５に示す第２の応答生成ルーチンにステップＳ２１及びＳ２２を加えたものである。
【００５７】
具体的には、ステップＳ４で肯定判定のときはステップＳ２１に進む。ステップＳ２１では、応答選択部１６は、図１７に示す発話選択ルールに従って、応答生成部１４で生成された発話候補から１つを選択する。本実施形態では、図１１に示すａ）格要素の確認、ｂ）省略格要素の質問、ｄ）述語同士の関係確認、ｃ）述語の質問の順に優先度が高いものとする。
【００５８】
そこで、第１の実施の形態で生成された複数の発話候補を発話選択ルールに照らし合わせると、
優先度１）「お父さんが器用なの？」、「お父さんが作ったの？」、「サイドボードを作ったの？」
優先度２）「どうして器用なの？」、「いつ器用なの？」、「いつ作ったの？」、「どこで作ったの？」
優先度３）「誰に作ったの？」
優先度４）「器用だから作ったの？」
となる。
【００５９】
応答選択部１６は、複数の発話候補から最も優先度の高い「お父さんが器用なの？」、「お父さんが作ったの？」、「サイドボードを作ったの？」を選択して、ステップＳ２２に進む。
【００６０】
ステップＳ２２では、応答選択部１６は、同じ優先度の発話候補が複数存在するか否かを判定し、肯定判定のときはステップＳ５に進み、否定判定のときはステップＳ６に進む。そして、ステップＳ２２からステップＳ５に進むと、優先度１）の３つの発話候補の中からランダムに１つが選択され、ステップＳ６を経て、優先度の高い発話候補が応答発話として、ユーザに提示される。
【００６１】
以上のように、第３の実施形態に係る応答生成装置は、複数の発話候補から優先度の高いものを１つ選択してユーザに提示することにより、ユーザとの対話を円滑に進めることができる。
【００６２】
なお、発話候補を選択する基準となる優先度は、固定である必要はなく、出力された応答発話に応じて動的に変化してもよい。例えば、応答選択部１６は、今回格要素の確認を示す発話候補を選択した場合、次回はその発話候補の優先度を最も低く変更してもよい。これにより、同じ内容の応答が連続して出力されるのが回避されるので、対話が単調になるのを防止することができる。
【００６３】
［第４の実施形態］
つぎに、本発明の第４の実施形態について説明する。なお、上述の実施形態と同一の部位には同一の符号を付し、主に異なる部分について説明する。
【００６４】
図１９は、本発明の第４の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図１６に示す構成に、文脈管理部１７及び文脈データベース１８を追加したものである。
【００６５】
文脈データベース１８には、文脈管理部１７を介して、認識部１２、解析部１３、応答生成部１４、応答選択部１６の履歴が逐次記録される。例えば、文脈データベース１８には、ユーザとの対話の履歴（文脈情報）として、認識部１２における音響モデルの絞り込み、解析部１３で抽出された述語及び格要素、さらに補完された必須格、応答生成部１４による文脈に基づく応答発話、応答選択部１６による選択された発話候補に関する情報が記録される。また、文脈管理部１７は、ユーザとの対話を進めながら逐次文脈データベース１８の文脈情報を更新する。
【００６６】
以上のように構成された応答生成装置は、ユーザとの過去の対話の履歴である文脈情報を用いて、ユーザ発話に対する応答を生成する。ここで、ユーザ発話が「新築した時なんて、リビングのサイドボードとかを全部作ったの。」であるのに対して、その前のユーザとシステムの過去の対話（前文脈）が図２０に示す対話例２である場合を挙げて説明する。
【００６７】
ここで、文脈データベース１８には、前文脈についての解析部１３の解析結果が記録されており、例えば、前文脈に含まれる「述語」及びそれと修飾関係（共起関係）にある１つ以上の「格要素」が記録されている。
【００６８】
具体的には、文脈データベース１８には、図２１に示すように、「聞く」に対してそれと修飾関係にある「お父さんガ」及び「言うことヲ」の関係、「おねだり上手だ」に対してそれと修飾関係にある「お母さんガ」の関係、「聞く」に対してそれと修飾関係にある「言うことヲ」の関係が記録されている。
【００６９】
そして、マイクロホン１１に上記のユーザ発話が入力されると、図２に示す解析部１３の格解析器３３は、図２２に示すように、述語として「作る」を抽出すると共に、「作る」と修飾関係にある格要素「新築した時ニ」、「サイドボードヲ」を抽出する。
【００７０】
次に、必須格補完エンジン３４は、格解析器３３の解析結果と格辞書３５とを照合して、本来述語が共起する格を補完して出力する。ここで、「作る」は、図３の格辞書３５によるとガ格、ヲ格、ニ格と共起する関係にあるが、図８に示す解析結果ではガ格がない。そこで、必須格補完エンジン３４は、図２１に示す前文脈の解析結果から最近のガ格である「お父さんガ」を抽出し、その「お父さんガ」を「作る」のガ格として補完する。
【００７１】
述語関係解析器３６は、述語関係データベース３７を参照して、文脈データベース１８に記録されている前文脈の述語と必須格補完エンジン３４から出力された述語との関係を求める。
【００７２】
ここでは、述語関係解析器３６は、図２３に示すように、「聞く（現在）」→「作る（過去）」の述語同士の間には「理由」の関係があり、「おねだり上手だ（現在）」→「作る（過去）」の述語同士の間には「理由」の関係があるので、これらの関係を求める。
【００７３】
応答生成部１４は、解析部１３の解析結果を用いて応答発話を生成する。例えば、応答生成部１４は、述語同士の関係を用いて、今回のユーザ発話に含まれる述語「作る」が行われた理由、時、場所のいずれかについての質問を生成する。本実施形態では、図２３に示すように、「聞く（現在）」→「作る（過去）」の述語同士については、「ホイホイ言うこと聞いちゃって？」が生成される。また、「おねだり上手だ（現在）」→「作る（過去）」の述語同士については、「お母さんがおねだり上手だから？」が生成される。
【００７４】
また例えば、応答生成部１４は、解析部１３の必須格補完エンジン３４で補完された格を確認する応答発話を生成する。本実施形態では、「お父さんが作ったの？」が生成される。
【００７５】
応答選択部１６は、文脈データベース１８を用いて、相槌生成部１５で生成された応答発話の中から１つの応答発話を選択する。例えば、応答選択部１６は、文脈データベース１８に記憶されている前文脈及び今回のユーザ発話から、対話の主題を抽出し、対話の主題に関連する応答発話を選択する。主題の抽出方法としては、例えば、解析部１３で抽出された格要素の中で最近の格要素を抽出してもよいし、前文脈及び今回のユーザ発話の中で最も多い格要素を抽出してもよい。
【００７６】
本実施形態では、対話の主題として「サイドボード」が抽出され、図２４に示すように、その結果「サイドボードを作ったの？」が選択される。そして、この発話は、スピーカ２１及びディスプレイ２２に供給され、ユーザに提示される。
【００７７】
以上のように、第４の実施形態に係る応答生成装置は、過去の対話の履歴を用いてユーザ発話の述語に不足していた格要素を補完し、述語と補完した格要素とに基づいて応答発話を生成する。これにより、上記応答生成装置は、ユーザ発話の情報が不足した場合であっても、対話の流れに沿った最適な応答をすることができる。
【００７８】
また、応答生成装置は、ユーザ発話に対して複数の発話候補を生成した場合は、過去の対話の履歴の中から対話の主題を抽出し、その主題に関する応答発話を選択して出力することにより、対話のポイントを外すことなく円滑に対話を継続することができる。
【００７９】
なお、本発明は、上述した実施の形態に限定されるものではなく、特許請求の範囲に記載された範囲内で設計上の変更をされたものにも適用可能であるのは勿論である。
【００８０】
例えば応答発話を提示する手段として、スピーカ２１やディスプレイ２２を使用したが、その他、応答内容を表現できるロボット装置を使用してもよい。また、各実施形態に係る応答生成装置は、スピーカ２１、ディスプレイ２２の一方のみを備えていてもよい。
【図面の簡単な説明】
【００８１】
【図１】本発明の第１の実施形態に係る応答生成装置の構成を示すブロック図である。
【図２】解析部の構成を示すブロック図である。
【図３】格辞書の構成を示す図である。
【図４】述語関係データベースの構成を示す図である。
【図５】ユーザ発話に対する応答を生成する第１の応答生成ルーチンを示すフローチャートである。
【図６】形態素解析器から出力される形態素情報を示す図である。
【図７】文節の係り受けの関係を示す図である。
【図８】格解析器によって抽出された述語とそれに対応する格要素とを示す図である。
【図９】「作る」に対して必須格であるガ格の格要素が補完された状態を示す図である。
【図１０】述語同士の関係を示す図である。
【図１１】発話候補の種類を示す図である。
【図１２】応答生成装置の他の構成を示すブロック図である。
【図１３】本発明の第２の実施形態に係る応答生成装置の構成を示すブロック図である。
【図１４】相槌の候補を示す図である。
【図１５】第２の応答生成ルーチンを示すフローチャートである。
【図１６】本発明の第３の実施形態に係る応答生成装置の構成を示すブロック図である。
【図１７】発話候補の優先度を示す図である。
【図１８】第３の応答生成ルーチンを示すフローチャートである。
【図１９】本発明の第４の実施形態に係る応答生成装置の構成を示すブロック図である。
【図２０】対話例２を示す図である。
【図２１】文脈データベースに記録されている履歴の一部を示す図である。
【図２２】格解析器によって抽出される述語と格要素とを示す図である。
【図２３】文脈データベースを用いて求められる述語同士の関係を示す図である。
【図２４】文脈データベースを用いて選択された発話候補を示す図である。
【符号の説明】
【００８２】
１１マイクロホン
１２認識部
１３解析部
１４応答生成部
１５相槌生成部
１６応答選択部
１７文脈管理部
１８文脈データベース
２１スピーカ
２２ディスプレイ

【特許請求の範囲】
【請求項１】
発話を入力する入力手段と、
前記入力手段に入力された発話を解析して、述語及びそれに対応する格要素を抽出する解析手段と、
前記解析手段により抽出された述語又は格要素を確認するための応答を生成する応答生成手段と、
前記応答生成手段により生成された応答を出力する応答出力手段と、
を備えた応答生成装置。
【請求項２】
前記応答生成手段は、述語及びそれに共起する格要素を用いて、前記述語又は前記格要素を確認するための応答を生成する
請求項１に記載の応答生成装置。
【請求項３】
前記応答生成手段は、前記解析手段により抽出された述語に共起する格要素が不足するときに、前記不足する格要素を他の述語に共起する格要素の中から補完する
請求項２に記載の応答生成装置。
【請求項４】
前記解析手段は、複数の述語を抽出したときに述語同士の関係を解析し、
前記応答生成手段は、前記解析手段で解析された述語同士の関係を確認するための応答を生成する
請求項１から請求項３のいずれか１項に記載の応答生成装置。
【請求項５】
前記応答生成手段で複数の応答が生成されたときに複数の応答から優先度の高い応答を選択する応答選択手段を更に備え、
前記応答出力手段は、前記応答選択手段により選択された応答を出力する
請求項１から請求項４のいずれか１項に記載の応答生成装置。
【請求項６】
前記応答生成手段は、前記解析手段で述語、格要素のいずれも抽出されなかったときに、前記応答として相槌を生成する
請求項１から請求項５のいずれか１項に記載の応答生成装置。
【請求項７】
少なくとも前記解析手段の過去の解析結果を記憶する記憶手段を更に備え、
前記応答生成手段は、前記解析手段により抽出された述語に共起する格要素が不足するときに、前記不足する格要素を、前記記憶手段に記憶された解析手段の過去の解析結果に含まれる格要素から補完する
請求項２に記載の応答生成装置。
【請求項８】
少なくとも前記解析手段の過去の解析結果を記憶する記憶手段を更に備え、
前記解析手段は、抽出した述語と、前記記憶手段に記憶されている過去の解析結果に含まれる述語と、の関係を解析する
請求項４に記載の応答生成装置。
【請求項９】
少なくとも前記解析手段の過去の解析結果及び前記応答生成手段の過去の生成結果を記憶する記憶手段と、
前記記憶手段に記憶された情報から発話の主題を抽出し、応答生成手段により生成された複数の応答から、抽出した主題に関する応答を選択する選択手段と、を更に備えた
請求項１から請求項６のいずれか１項に記載の応答生成装置。
【請求項１０】
発話を入力し、
前記入力された発話を解析して、述語及びそれに対応する格要素を抽出し、
前記抽出された述語又は格要素を確認するための応答を生成し、
前記生成された応答を出力する
応答生成方法。
【請求項１１】
コンピュータに、
発話を入力させ、
前記入力された発話を解析させて、述語及びそれに対応する格要素を抽出させ、
前記抽出された述語又は格要素を確認するための応答を生成させ、
前記生成された応答を出力させる
応答生成プログラム。

【図１】