機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム

音声認識部（２）は、音声入力部（１）が入力した話者の音声に音声認識を施して、この音声が表している可能性のある単語とそのスコアとを特定し、自然言語解析部（３）がこれらの単語の品詞を特定して、これらの単語を表す単語データをエージェント処理部（７）に供給する。エージェント処理部（７）は、単語データ等を取得するデータ取得処理や、判別処理、入出力処理を定義する処理項目データと、ひとつの処理から次の処理への遷移を定義しこの遷移に重み係数を与えるデータであるワイヤとを記憶しており、処理項目データとワイヤとが全体として表すフローを実行することにより、話者の要求を適切に把握し、この要求を満たすように、入出力対象機器群（６）に属する機器を制御する。

【発明の詳細な説明】
【技術分野】
【０００１】
この発明は、機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラムに関する。
【背景技術】
【０００２】
近年、音声認識の技術を用いて音声を認識し、認識結果に応答して電気機器などを制御する手法が用いられている。この手法は、具体的には、入力した音声が表す単語を識別し、識別された単語が所定のキーワードに合致するか否かを判別して、判別結果に基づいて外部の機器を制御するものである（例えば、特許文献１参照）。
【特許文献１】特開平８−３３９２８８号公報
【発明の開示】
【発明が解決しようとする課題】
【０００３】
しかし、人間が言語の形で発する指示を完全に認識するのは困難である。このため、上述の手法では、人間が言語の形で発する指示に適切に応答することができない場合があった。
【０００４】
この発明は上記実状に鑑みてなされたものであり、人間が言語の形で発する指示に適切に応答して機器を制御できる機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法あるいはプログラムを提供することを目的とする。
【課題を解決するための手段】
【０００５】
上記目的を達成するため、この発明の第１の観点にかかる機器制御装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする。
【０００６】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定してもよい。
【０００７】
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された複数の語句の組み合わせが所定の条件を満たしているか否かを判別し、判別結果に基づいて、前記音声の発話者の発話内容を特定してもよい。
【０００８】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定してもよい。
【０００９】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定してもよい。
【００１０】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定してもよい。
【００１１】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行してもよい。
【００１２】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促してもよい。
【００１３】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択するようにしてもよい。
【００１４】
また、この発明の第２の観点にかかる機器制御装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする。
【００１５】
また、この発明の第３の観点にかかる音声認識認置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とする。
【００１６】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００１７】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００１８】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００１９】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００２０】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行するものであってもよい。
【００２１】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促すものであってもよい。
【００２２】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択するものであってもよい。
【００２３】
また、この発明の第４の観点にかかる音声認識装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする。
【００２４】
また、この発明の第５の観点にかかるエージェント装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とする。
【００２５】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする。
【００２６】
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された複数の語句の組み合わせが所定の条件を満たしているか否かを判別し、判別結果に基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００２７】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００２８】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００２９】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００３０】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行するものであってもよい。
【００３１】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促すものであってもよい。
【００３２】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択するものであってもよい。
【００３３】
前記処理実行手段（７）は、実行すべき処理として特定した処理が、外部から受信した情報を発話者に提示する処理であるとき、当該情報を読み上げる音声を発生させることにより当該提示を実行する手段を備えるものであってもよい。
【００３４】
また、この発明の第６の観点にかかるエージェント装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする。
【００３５】
また、この発明の第７の観点にかかる車載機器制御装置は、
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする。
【００３６】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００３７】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００３８】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００３９】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００４０】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行するものであってもよい。
【００４１】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促すものであってもよい。
【００４２】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択するものであってもよい。
【００４３】
また、この発明の第８の観点にかかる車載機器制御装置は、
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする。
【００４４】
また、この発明の第９の観点にかかるナビゲーション装置は、
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定して、当該ナビゲーション処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とする。
【００４５】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００４６】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００４７】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００４８】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００４９】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行するものであってもよい。
【００５０】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促すものであってもよい。
【００５１】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択するものであってもよい。
【００５２】
また、この発明の第１０の観点にかかるナビゲーション装置は、
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定したナビゲーション処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段は当該情報に基づいて音声を出力する、
ことを特徴とする。
【００５３】
また、この発明の第１１の観点にかかるオーディオ装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべき音声処理の内容を特定して、当該音声処理を実行し、又は外部の機器に実行させるよう当該外部の機器を制御する処理実行手段（７）と、
を備える、
ことを特徴とする。
【００５４】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００５５】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００５６】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定するものであってもよい。
【００５７】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定するものであってもよい。
【００５８】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行するものであってもよい。
【００５９】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促すものであってもよい。
【００６０】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択するものであってもよい。
【００６１】
また、この発明の第１２の観点にかかるオーディオ装置は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて、実行すべき音声処理の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した音声処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする。
【００６２】
また、この発明の第１３の観点にかかる機器制御方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行ステップと、
より構成される、
ことを特徴とする。
【００６３】
また、この発明の第１４の観点にかかる機器制御方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した制御が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とする。
【００６４】
また、この発明の第１５の観点にかかる音声認識方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行ステップと、
より構成される、
ことを特徴とする。
【００６５】
また、この発明の第１６の観点にかかる音声認識方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とする。
【００６６】
また、この発明の第１７の観点にかかるエージェント処理方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行ステップと、
より構成される、
ことを特徴とする。
【００６７】
また、この発明の第１８の観点にかかるエージェント処理方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とする。
【００６８】
また、この発明の第１９の観点にかかる車載機器制御方法は、
車両に搭載された車載機器を制御するための車載機器制御方法であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行ステップと、
より構成される、
ことを特徴とする。
【００６９】
また、この発明の第２０の観点にかかる車載機器制御方法は、
車両に搭載された車載機器を制御するための車載機器制御方法であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップが特定した制御が、前記情報取得手段で取得された情報を出力するものであるとき、前記音声出力ステップは当該情報に基づいて音声を出力する、
ことを特徴とする。
【００７０】
また、この発明の第２１の観点にかかるナビゲーション方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定して、当該ナビゲーション処理を実行する処理実行ステップと、
より構成される、
ことを特徴とする。
【００７１】
また、この発明の第２２の観点にかかるナビゲーション方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定したナビゲーション処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とする。
【００７２】
また、この発明の第２３の観点にかかるオーディオ装置制御方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、実行すべき音声処理の内容を特定して、当該音声処理を実行し、又は外部のオーディオ装置に実行させるよう当該外部のオーディオ装置を制御する処理実行ステップと、
より構成される、
ことを特徴とする。
【００７３】
また、この発明の第２４の観点にかかるオーディオ装置制御方法は、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、外部のオーディオ装置に実行させるべき音声処理の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した音声処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップで当該情報に基づいて音声を出力する、
ことを特徴とする。
【００７４】
また、この発明の第２５の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする機器制御装置として機能させる。
【００７５】
また、この発明の第２６の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする機器制御装置として機能させる。
【００７６】
また、この発明の第２７の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とする音声認識装置として機能させる。
【００７７】
また、この発明の第２８の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする音声認識装置として機能させる。
【００７８】
また、この発明の第２９の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とするエージェント装置として機能させる。
【００７９】
また、この発明の第３０の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするエージェント装置として機能させる。
【００８０】
また、この発明の第３１の観点にかかるプログラムは、
コンピュータを、
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする車載機器制御装置として機能させる。
【００８１】
また、この発明の第３２の観点にかかるプログラムは、
コンピュータを、
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定する処理特定手段と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする車載機器制御装置として機能させる。
【００８２】
また、この発明の第３３の観点にかかるプログラムは、
コンピュータを、
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定して、当該ナビゲーション処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とするナビゲーション装置として機能させる。
【００８３】
また、この発明の第３４の観点にかかるプログラムは、
コンピュータを、
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定する処理特定手段と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定したナビゲーション処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするナビゲーション装置として機能させる。
【００８４】
また、この発明の第３５の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべき音声処理の内容を特定して、当該音声処理を実行し、又は外部の機器に実行させるよう当該外部の機器を制御する処理実行手段（７）と、
を備える、
ことを特徴とするオーディオ装置として機能させる。
【００８５】
また、この発明の第３６の観点にかかるプログラムは、
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべき音声処理の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した音声処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするオーディオ装置として機能させる。
【発明の効果】
【００８６】
この発明によれば、人間が言語の形で発する指示に適切に応答して機器を制御できる機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法あるいはプログラムが実現される。
【図面の簡単な説明】
【００８７】
【図１】この発明の実施の形態に係るエージェント装置を示す図である。
【図２】この実施の形態に係るエージェント装置のより詳細な構成図である。
【図３】カテゴリ辞書の具体例を模式的に示す図である。
【図４】トリガ取得処理を説明するための図である。
【図５】判別処理を説明するための図である。
【図６】問い合わせ付きの判別処理を説明するための図である。
【図７】出力処理を説明するための図である。
【図８】ワイヤを示す図である。
【図９】処理項目データベース及びワイヤデータベースが全体として表しているフローを示す図である。
【図１０】重み係数の設定を説明するための図である。
【図１１】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートである。
【図１２】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートの続きである。
【図１３】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートの続きである。
【図１４】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートの続きである。
【図１５】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートの続きである。
【図１６】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートの続きである。
【図１７】搭乗者を食事の場所に誘導するために実行する処理を表すフローチャートの続きである。
【図１８】テーブルのデータ構造を示す図である。
【符号の説明】
【００８８】
１音声入力部
２言語認識部
３自然言語解析部
４音声合成処理部
５音声出力部
６入出力対象機器群
６１ナビゲーション部
６２クロック
７エージェント処理部
【発明を実施するための最良の形態】
【００８９】
以下、図面を参照して、この発明の実施の形態を説明する。
［第１の実施の形態]
【００９０】
まず、本発明の第１の実施の形態に係るエージェント装置を説明する。このエージェント装置は、入力情報に応じて状態を遷移させて処理を行うものである。また、以下では、このエージェント装置は、車載用のナビゲーション装置として機能するものとする。また、このエージェント装置の一部は、音声認識装置として機能する。
【００９１】
図１は、このエージェント装置の構成を示すブロック図である。図示するように、このエージェント装置は、音声入力部１と、音声認識部２と、自然言語解析部３と、音声合成処理部４と、音声出力部５と、入出力対象機器群６と、エージェント処理部７とより構成されている。
【００９２】
音声入力部１は、音声を入力し、入力した音声からデジタル形式の音声データを生成し、この音声データを音声認識部２へと供給する。具体的には、音声入力部１は、図２に示すように、例えば、マイクロフォン１１と、ＡＦ（Audio Frequency）増幅器１２と、サンプルホールド回路を内蔵するＡ／Ｄ（Analog-to-Digital）コンバータ１３などより構成されている。マイクロフォン１１は音声を音声信号に変換して出力する。ＡＦ増幅器１２は、マイクロフォン１１からの音声信号を増幅して出力する。Ａ／Ｄコンバータ１３は、ＡＦ増幅器１２からの増幅された音声信号をサンプリング、Ａ／Ｄ変換することにより、デジタル音声データを生成し、音声認識部２へと供給する。
【００９３】
音声認識部２、自然言語解析部３、音声合成処理部４、及びエージェント処理部７は、図２に示すように、それぞれ、例えば、ＣＰＵ（Central Processing Unit）等からなるプロセッサ２１、３１、４１、７１と、このプロセッサ２１、３１、４１、７１が実行するプログラムを記憶するＲＯＭ（Read Only Memory）やハードディスク装置等の不揮発性メモリ（本実施の形態ではＲＯＭを例に説明する）２２、３２、４２、７２と、プロセッサのワークエリアとなる記憶領域を有するＲＡＭ（Random Access Memory）等の揮発性メモリ２３、３３、４３、７３とより構成されている。
なお、音声認識部２、自然言語解析部３、音声合成処理部４、及びエージェント処理部７の一部又は全部の機能を１つのプロセッサや１つの不揮発性メモリや１つの揮発性メモリで構成してもよい。
【００９４】
音声認識部２は、音声入力部１より供給された音声データに音声認識処理を行う。
音声認識部２は、音声入力部１より音声データを供給されると、例えばこの音声データに含まれる雑音を除去する処理等を行った後、後述するエージェント処理部７内の単語データベースＤ３を参照して、この音声データに音声認識を施す処理を行うことにより、この音声データが表している可能性のあるすべての単語の候補と、この候補の尤度（スコア）Ｓと、を特定する。
【００９５】
音声認識部２は、具体的には、例えば、入力された音声と単語データベースＤ３に登録されるすべての単語とのマッチングの度合い、即ち尤度（スコア）Ｓを算出して、どの単語のスコアＳが最も高いかを認識する。例えば、「え〜と、？？？が減ったよ」という文章を表しており、ただし「？？？」の部分が「お腹」とも「お墓」とも認識され得るような音声を表す音声データが供給された場合は、「？？？」の部分については、単語「お腹」に対するスコアＳが８０％、単語「お墓」に対するスコアＳが６５％、などと、それぞれの単語に対するスコアＳを計算する。そして、最も高い値を示した「お腹」を、当該部分「？？？」が表す単語であるとして選択する。そして、音声認識部２は、「え〜と、お腹が減ったよ」という認識結果を示すテキスト文字列（若しくは単語ＩＤ（IDentifier））を生成して、自然言語解析部３に供給する。
【００９６】
なお、音声認識部２が行う音声認識の手法は任意である。また、スコアＳの値が所定値を下回る単語については、候補として選択しないようにしてもよい。さらに、１つの音声入力に対して単語の候補が複数特定されてもよい。そして、特定した候補及び当該候補のスコアＳを示すデータ（以下、単語データと呼ぶ）を生成し、エージェント処理部７へと供給する。尚、単語データは、単語情報そのものとスコアＳを含むものとしても良いが、実際には単語ＩＤとスコアＳを含むものとした方が、データの取扱上有利である。
【００９７】
自然言語解析部３は、音声認識部２より供給された単語データ（若しくはテキストデータ）に形態素解析を施す処理を行うなどすることにより、この単語データが表している単語を品詞ごとに分類し、分類結果を示すデータを単語データに付してエージェント処理部７へと供給する。なお、自然言語解析部３が行う分類の手法は任意であり、例えば、奈良先端科学技術大学で開発された日本語形態素解析の手法である“ＣｈａＳｅｎ”などを用いればよい。
【００９８】
音声合成処理部４の不揮発性メモリ４２は、単語の波形を表すデータを記憶する音片データベースＤ１と、音素を構成するための波形を表すデータを記憶する素片データベースＤ２とを記憶する。
音片データベースＤ１は、単語の波形を表すデータを記憶する。素片データベースＤ２は、音素を構成するための波形を表すデータを記憶する。音声合成処理部４は、音片データベースＤ１及び／又は素片データベースＤ２に格納されているデータを用いて、エージェント処理部６より供給された文章データを読み上げる音声を表すデジタル音声データを生成する。
音声合成処理部４は、生成した音声データを音声出力部５に供給する。
デジタル音声データを生成する手法は任意であるが、例えば、録音編集方式や規則合成方式(Rule-based synthesis)を使用できる。なお、録音編集方式は、例えば、単語単位若しくは文節単位の音声を予めアナウンサーに読んでもらい、それらをつなぎあわせて出力する方式である。若しくは、アナウンサーが読み上げた一連の音声を、後の処理で単語単位若しくは文節単位に区切って記憶し、それらをつなぎあわせて出力するようにしてもよい。また、規則合成方式は、音韻（子音や母音）や仮名、更には、より細分化された単位の音素や素片のような比較的小さな単位をつなぎあわせて出力する方式である。
【００９９】
音声出力部５は、音声合成処理部４から供給されたデジタル音声データが表す音声を再生する。より詳細には、音声出力部５は、図２に示すように、Ｄ／Ａ（Digital-to-Analog）コンバータ５１、ＡＦ増幅器５２及びスピーカ５３を備える。
Ｄ／Ａコンバータ５１は、音声合成処理部４より供給されたデジタル音声データをＤ／Ａ変換して、アナログ音声信号に変換する。ＡＦ増幅器５２は、アナログ音声信号を増幅する。スピーカ５３は、アナログ音声信号に従って振動し、アナログ音声データが表す音声を再生し、放音する。
【０１００】
入出力対象機器群６は、例えば、ナビゲーション部６１や、クロック６２などより構成されている。
【０１０１】
ナビゲーション部６１は、ＧＰＳ（Global Positioning System）の移動局や液晶ディスプレイ等の表示装置やプロセッサを用いた公知のカーナビゲーションシステムなどより構成されている。ナビゲーション部６１は地図を表す地図情報を記憶しており、エージェント処理部７が供給する制御信号に従って車両の現在位置を検知し、検知した現在位置が地図上でどの位置に当たるかを表すデータを生成して、現在位置近隣の地図を表す地図情報と共にエージェント処理部７に供給する。また、現在位置近隣の地図を、現在位置を示す図形と共に表示する。
【０１０２】
クロック６２は、例えば水晶発振器やカウンタ回路等より構成されており、現在の時刻を示すデータを連続的に生成し、エージェント処理部７へと供給する。なお、ナビゲーション部６１を介してＧＰＳから得られる時刻情報を供給するようにしてもよい。
【０１０３】
エージェント処理部７は、モデムやパケット通信端末等からなる通信制御装置７４を備え、この通信制御装置を介して外部のネットワーク（例えば、無線電話回線を介したインターネット）を介して後述する配信サーバ１００に接続している。
【０１０４】
エージェント処理部７の不揮発性メモリ７２は、単語データベースＤ３を記憶する。単語データベースＤ３は、複数の単語のデータと、この単語がどのような概念ないしカテゴリの下にグルーピングされているかを示すためのカテゴリ辞書とを格納するデータベースである。
【０１０５】
カテゴリ辞書は、例えば図３に示すデータ構造を有する。すなわち、カテゴリ辞書は、単語を示すデータと、当該単語が属するカテゴリを示すデータとを、互いに対応付けて格納している。例えば、図３に示す例では、単語「減った」はカテゴリ「食事」に対応付けられている。なお、１個の単語が複数のカテゴリに属していてもよい。（例えば図３に示す例では、単語「お腹」は、カテゴリ「食事」及び「病院」に対応付けられている。）
【０１０６】
そして、このエージェント装置は、複数の単語が同一の文章に含まれていた場合に、これらの単語が共通して属するカテゴリのみを、これらの単語が属するカテゴリとして扱うことにより、これらの単語が発話された意図を文脈に応じて把握することを可能とする。例えば図３に示す例では、「お腹が減った」という文章を構成する単語データの集合が自然言語解析部３からエージェント処理部７に供給された場合、エージェント処理部７が、単語「お腹」及び「減った」が共通して属するカテゴリ、すなわち「食事」のみを、当該文章に係る処理を行う限りでは、単語「お腹」及び「減った」が属するカテゴリとして扱うこととできる。同様に、単語データの集合が、ユーザの発話「食事に行きたいなあ」を表している場合は、単語「食事」及び「行きたい」が共通して属するカテゴリ「食事」のみを、文章「食事に行きたいなあ」に係る処理を行う限りでは、単語「食事」及び「行きたい」が属するカテゴリとして扱うこととできる。
【０１０７】
また、エージェント処理部７は、自然言語解析部３から供給された単語データのうち、特定の品詞を表すもののみ（例えば、名詞と動詞のみ）を、自己が行う後続の処理に用いるようにしてもよい。
【０１０８】
なお、単語が属するカテゴリは必ずしも複数の単語の組み合わせから特定される必要はない。例えば、単語「すいた」はカテゴリ「食事」にのみ対応付けられているから、単語「すいた」を表す単語データが供給された場合、エージェント処理部７は、他の単語と組み合わせて判別処理を行うまでもなく、この単語データをカテゴリ「食事」に属するものとして扱ってよい。
【０１０９】
また、エージェント処理部７の不揮発性メモリは、更に、過去経験データベースＤ６、和食レストランデータベースＤ７、洋食レストランデータベースＤ８及び中華レストランデータベースＤ９を記憶している。過去経験データベースＤ６は、エージェント処理部７が、ナビゲーション部６１に地図上の位置を表示させたり、目的地として設定されたレストランの名称を格納するデータベースである。和食レストランデータベースＤ７、洋食レストランデータベースＤ８及び中華レストランデータベースＤ９は、それぞれ、和食レストランの名称、洋食レストランの名称、及び中華レストランの名称を格納するデータベースである。
【０１１０】
エージェント処理部７の不揮発性メモリは、更に、処理項目データベースＤ４及びワイヤデータベースＤ５を記憶している。
【０１１１】
処理項目データベースＤ４は、エージェント処理部７が行うトリガ取得処理（ＴＧｘｘ）、判別処理（ＢＲｘｘ又はＱＢｘｘ）及び入出力処理（後述するＳＰｘｘ又はＥＸｘｘ）の内容を、処理項目（ポインタ）毎に記述するデータ（処理項目データ）を格納したデータベースである。なお、「ｘｘ」は識別番号である。
【０１１２】
処理項目データベースＤ４に格納される処理項目のうち、「トリガ取得処理（ＴＧｘｘ）」の内容を記述するデータは、これらの処理を開始させるトリガを特定するトリガデータ（トリガとして取得するデータの内容を指定するデータ）と、後述する進行方向決定用の遷移定数（その進行方向に遷移する程度を示すもので、後述する重み係数Ｊの算出基準となる定数）とを含む。トリガデータは任意であり、例えば、ナビゲーション部６１より供給される、車両の現在位置を示すデータや、クロック６２より供給される、現在時刻を示すデータや、自然言語解析部３より供給される上述の単語データである。あるいは、トリガデータは、エージェント処理部７自身が行う処理から引き渡されるデータであってもよい。また、トリガ取得処理で取得されるデータが単語データである場合は、当該単語データが表す単語に代えて、当該単語データが表す単語がグルーピングされているカテゴリが記述されてもよい。ただし、トリガ取得処理の内容は、複数のトリガ取得処理が互いに同一の単語を表す単語データや互いに同一のカテゴリに属す単語データに基づいて動作することがないように記述されるものとする。このように記述しないと、ある単語データによって複数の動作を実行しようとしてしまうことになる。
図４（ａ）にトリガ取得処理ＴＧｘｘの例を示す。この例では、トリガＴＧ０１は、トリガとしてのカテゴリ「食事」を取得する（カテゴリ「食事」にグルーピングされている単語（図３の例では、単語「減った」、「すいた」、「お腹」、「食べ」、「行く」、「設定」、「どこか」、「どこに」、「食事」）を識別する）処理であり、その処理に後続する処理に進む（遷移する）か否かを決定するための遷移定数ｋは０．８である。図４（ｂ）には、トリガ取得処理ＴＧ０１のフローチャートを示す。
トリガ取得処理ＴＧ００は単語「つまんない」を取得する処理である。トリガ取得処理ＴＧ５１は単語「和食」を取得する処理である。トリガ取得処理ＴＧ５２は単語「洋食」を取得する処理である。トリガ取得処理ＴＧ５３は単語「中華」を取得する処理である。
【０１１３】
処理項目データベースＤ４に格納されている「判別処理（ＢＲｘｘ）」の内容を記述するデータは、判別条件と、判別結果としてとり得る結果のリストと、後述する戻り方向の遷移定数ｋとを、判別処理別に記述したデータを含んでいる。判別処理の内容を記述するデータは、進行方向を決定するための遷移定数ｋを、判別結果毎に記述したデータを含んでいる。
図５（ａ）に判別処理ＢＲｘｘの例を示す。この例では、判別処理ＢＲ０１は、「（ａ）１２時より前、（ｂ）１２時以降で１４時より前、（ｃ）１４時以降、のいずれであるかを判別する」である。（ａ）１２時より前と判別したときに後続する処理に進むか否かを決定するための遷移定数ｋが０．４、（ｂ）１２時以降で１４時より前と判別したときに後続する処理に進むか否かを決定するための遷移定数ｋが０．３、（ｃ）１４時以降と判別したときにそれに後続する処理に進むか否かを決定するため遷移定数ｋが０．４である。この例のフローチャートを図５（ｂ）に示す。図５（ｂ）に示すノードＢＲ０１．１は、処理の開始点を示す始点ノード、ノードＢＲ０１．２は、（ａ）１２時より前と判別したときの進行方向のノードであり、その遷移定数ｋは０．４である。さらに、ノードＢＲ０１．３は、（ｂ）１２時以降で１４時より前と判別したときの進行方向のノードであり、その遷移定数ｋは０．３であり、ノードＢＲ０１．４は、（ｃ）１４時以降と判別したときの進行方向のノードであり、その遷移定数ｋは０．４である。
【０１１４】
「判別処理」は、判別に用いるデータを任意の取得源から取得する場合があってもよいとする。取得源としては、例えば、音声認識部２や、自然言語解析部３、エージェント処理部７が実行する他の処理や、入出力対象機器群６に属する機器や、その他外部の機器などが考えられる。そしてこの場合、判別処理の内容を記述するデータは、例えば、判別に用いるデータの取得源を指定するデータを更に含んでいればよい。
【０１１５】
また、「判別処理」では、所定のデータを、判別に先立って所定の出力先に出力するようにしてもよい（この場合は、処理を示す記号を例えばＱＢｘｘとする）。例えば、所定の質問を表すデータを、判別に先立って音声合成処理部４に引き渡す、等が考えられる。判別処理において所定のデータを判別に先立って所定のデータを出力する場合、判別処理の内容を記述するデータは、例えば、出力するデータの内容と、このデータの出力先とを指定するデータを含む。
図６（ａ）に判別処理ＱＢｘｘの例を示す。この例では、例えば、判別処理ＱＢ０１は、「食事に行く？」と利用者に問い合わせ、その応答（利用者の回答）が「はい」であったときの進行方向の遷移定数ｋが０．７、「いいえ」であったときの進行方向の遷移定数ｋが０．４である。この例のフローチャートを図６（ｂ）に示す。図６（ｂ）に示すノードＱＢ０１．１は、処理の開始点を示す始点ノード、ノードＱＢ０１．２は、問い合わせに対して、「食事に行く」ことが指定されたことを判別したときの進行方向のノードであり、その遷移定数ｋは０．７である。さらに、ノードＱＢ０１．３は、「食事に行かない」ことが指定されたことを判別したときの進行方向のノードであり、その遷移定数ｋは０．４である。また、判別処理ＱＢ０２は、「それじゃコンビニに行く？」と利用者に問い合わせ、その応答（利用者の回答）が「はい」であったときの進行方向の遷移定数ｋが０．５、「いいえ」であったときの進行方向の遷移定数ｋが０．３である。
【０１１６】
処理項目データベースＤ４に格納されている「入出力処理」の内容を記述するデータは、入力あるいは出力するデータの内容を指定するデータから構成されている。入力データ及び出力データは任意の内容を有していてよい。例えば、出力データは、音声合成処理部４を介して音声出力部５に発生させる音声の読みを表すデータや外部の機器を制御する制御信号であってもよい。また、入力データは、例えば、外部の機器から供給されるデータであってもよい。
図７（ａ）に出力処理ＥＸｘｘの例を示す。この例では、例えば、出力処理ＥＸ０２は、「ナビゲーション案内を行う」という動作であり、動作後の処理を行う進行方向の遷移定数ｋが０．８である。この例のフローチャートを図７（ｂ）に示す。図７（ｂ）に示すノードＥＸ０１．１は、処理の開始点を示す始点ノード、ノードＥＸ０１．２は、処理の終了を示すノードであり、遷移定数ｋは０．８である。尚、出力処理ＥＸｘｘについては、遷移定数ｋの設定等を行わずに、処理の終了を示すノードの選択を必須の処理としてもよい。
【０１１７】
ワイヤデータベースＤ５は、複数の処理（ＴＧ、ＢＲｘｘ、ＱＢｘｘ、ＳＰｘｘ、ＥＸｘｘ）間の遷移を記述するデータ（以下、この遷移定義データをワイヤと呼ぶ）の集合から構成されている。ワイヤは、例えば図８に示すような書式で記述されたデータから構成されている。ワイヤＷｎ（Ｗ１、Ｗ２...）は図示するように、先行する処理X（From (X))から後続する処理Ｙ(To(Y))への遷移（From (X) To（Ｙ）)について、当該先行の処理（Ｘ）と、当該後続の処理（Ｙ）と、当該遷移に対して与えられた重み係数Ｊと、を指定するデータである。なお、先行の処理Ｘが判別処理である場合は、当該判別処理のどの判別結果からの遷移であるか、まで記述される必要がある。具体的には、例えば、質問への回答を音声データに基づいて判別するような処理項目を先行の処理項目として有する１つのワイヤに対して、肯定を意味する単語「行く」「うん」「そうだね」が定義され、また他のワイヤに対しては、否定を意味する単語「行かない」「いや」等が定義される、等である。
【０１１８】
なお、上述した処理項目データが記述する遷移定数ｋが、接続されるワイヤが示す遷移が実行された実績に従ってエージェント処理部７等により書き換えられるようにしてもよい。例えば、特定のワイヤが示す遷移が実行される頻度が所定量より大きい場合、エージェント処理部７が、このワイヤが示す遷移の遷移元の処理項目を示す処理項目データに記述されている遷移定数ｋの値を従前より大きな値へと書き換えることによって、このワイヤが示す遷移が起こりやすくする、等である。こうすることより、結果的にユーザの意図する応答がなされる確率が高くなる。
【０１１９】
そして、エージェント処理部７は、処理項目データベースＤ４及びワイヤデータベースＤ５が全体として表しているフローを実行する。処理項目データベースＤ４及びワイヤデータベースＤ５は、例えば図９（ａ）に示すようなフローを記述することができる。
【０１２０】
ここで、エージェント処理部７の処理が、具体的にどのように行われるかについて、図９（ａ）を参照して詳述する。エージェント処理部７は、図示するように、先行する第１の処理Ｐ１を実行して後続の第２の処理Ｐ２に遷移するようにワイヤＷ０１により定義されており、また、第２の処理Ｐ２を実行して後続の第３の処理Ｐ３に遷移するようにワイヤＷ０３によって定義されているとき、以下の処理を行う。
【０１２１】
なお、図示するように、処理Ｐ１は、単語「行く」を表す単語データが供給されたか否かを判別する処理であるとし、処理Ｐ２は、単語「食事」を表す単語データが供給されたか否かを判別する処理であるとし、処理Ｐ３は、レストラン又は病院のどちらの位置を示す情報をナビゲーション部６１から取得するか否かを判別する処理であるとする。なお、図示するように、処理Ｐ１〜Ｐ３のいずれについても、各進行方向の遷移定数ｋはいずれも０．５であるものとする。この場合、ワイヤは、例えば、図９（ｂ）に示すように、定義される。また、エージェント処理部７は、音声認識部２が自然言語解析部３に供給した単語データのうち、自然言語解析部３において、名詞又は動詞であると分類された単語を表す単語データのみを取得するものとする。
【０１２２】
まず、エージェント処理部７が第１の処理Ｐ１に到達しているとき、エージェント処理部７は、ワイヤＷ０１、Ｗ０３及びＷ０５のそれぞれの重み係数Ｊを計算し、計算結果をワイヤＷ０１、Ｗ０３及びＷ０５に書き込む。これら値は、各処理に予め設定されている進行方向の遷移定数ｋによって決定される。
【０１２３】
具体的には、処理Ｐ１に処理が到達したとき、ワイヤＷ０１の重み係数Ｊは、処理Ｐ１のワイヤに係る遷移定数ｋの値すなわち０．５となる。
処理Ｐ２のワイヤＷ０３の重み係数Ｊは、処理Ｐ１のワイヤＷ０１に係る遷移定数ｋ＝０．５に処理Ｐ２のワイヤＷ０３に係る遷移定数ｋ＝０．５を乗じた結果すなわち０．２５となる。
ワイヤＷ０５の重み係数Ｊは、処理Ｐ１のワイヤＷ０１に係る遷移定数ｋ＝０．５に処理Ｐ２のワイヤＷ０３に係る遷移定数ｋ＝０．５を乗じた結果に更に処理Ｐ３のワイヤＷ０５に係る遷移定数ｋ＝０．５を乗じた結果、すなわち０．１２５となる。
【０１２４】
このようにして、ある処理を基点としたときのそれぞれのワイヤの重み係数Ｊが計算される。よって、現在の状態が遷移すると、現在の処理を基点にしてその都度重み係数Ｊが計算されることになる。
【０１２５】
具体的には、現在の状態が処理Ｐ２に遷移すると、ワイヤＷ０３の重み係数Ｊは、処理Ｐ２のワイヤＷ０３に係る遷移定数ｋに等しい値０．５となり、ワイヤＷ０５の重み係数Ｊは処理Ｐ２のワイヤＷ０３に係る遷移定数ｋ＝０．５と処理Ｐ３のワイヤＷ０５に係る遷移定数ｋ＝０．５との積すなわち０．２５となる。またこのとき、エージェント処理部７は、逆方向、つまり処理Ｐ１に戻る方向に係るワイヤＷ０１の重み係数Ｊも再度書き込まれる。処理Ｐ２に遷移した場合では、ワイヤＷ０１に係る戻り方向の遷移定数ｋ＝０．１がそのままワイヤＷ０１の重み係数Ｊとなる。処理Ｐ３に遷移した場合は更に、ワイヤＷ０３に係る戻り方向の遷移定数ｋ＝０．１がそのままワイヤＷ０３の重み係数Ｊとなる。そして、処理Ｐ３に遷移した状態におけるワイヤＷ０１の重み係数Ｊは、処理Ｐ３に遷移した状態におけるワイヤＷ０３の遷移定数ｋ＝０．１に、処理Ｐ２の戻り方向の遷移定数ｋ＝０．１を乗じた値すなわち０．０１となる。
各ワイヤＷｎの重み係数Ｊの変化を図９（ｃ）に示す。
【０１２６】
重み係数Ｊの計算は、関連するフローの処理のみではなく、すべてのフローのすべてのワイヤについて設定される。ここで現在の処理に関連のないワイヤについては、予め定められた低い計数値を割り当てるようにすればよい。しかし、特にトリガ取得処理を先行の処理とするワイヤについては、重み係数Ｊをある程度高く設定するようにする。こうすることによって、直前までなされていた会話と著しく異なる内容の会話にもジャンプすることが可能になる。
【０１２７】
なお、各ワイヤには条件がそれぞれ設定されている。具体的には、Ｗ０１には単語「行く」が条件として設定され、Ｗ０３には単語「食事」が条件として設定される。そして、自然言語解析部３から単語データが供給されたとき、その単語データが単語「行く」を示すものである場合には、当該単語データが示すスコアＳをＷ０１に対して設定する。また、自然言語解析部３から供給された単語データが単語「食事」を示すものである場合には、当該単語データが示すスコアＳをＷ０３に対して設定する。尚、各ワイヤに対して異なる単語を複数、条件として設定してもよい。例えば、ある一つのワイヤに対して、「食事」を意味する単語「食事」「めし」等を条件として割り当てると共に、「行く」を意味する単語「行く」「する」等を条件として割り当てる。そして、自然言語解析部３から供給された単語データが、単語「食事」と単語「行く」であった場合、それぞれのスコアＳが当該ワイヤに設定される。そして、この設定されたスコアＳに基づいて当該ワイヤの算出結果を求める。この場合、各スコアＳを合算してもよいし、または平均値を求めてもよい。
【０１２８】
更に、各ワイヤに設定される条件は、ある意味に対して単一の単語が設定される場合に限られない。例えば、同一の意味を表す異なる複数の単語が条件として設定されるようにしてもよい。この条件の設定は、これらの単語とワイヤの関係が記憶されていれば足り、スコアＳ算出の対象となる単語は前述の単語データベースＤ３に記憶される。
【０１２９】
例えば、音声認識を行う場合に、入力された音声について、音声認識部２は単語データベースＤ３に登録されているすべての単語に対してスコアＳの計算を行い、少なくとも所定以上のスコアが得られた単語に関する単語データを生成して、自然言語解析部３を介してエージェント処理部７に単語データを出力する。次に、エージェント処理部７は、入力された各単語データが、いずれのワイヤに関連付けられているかを判別し、単語データが示すスコアＳを関連する各ワイヤに設定する。このようにすれば、複数のワイヤに対して、同じ単語が条件として設定されている場合でも、入力された音声信号と単語とのスコアＳの計算は一度で足りることになる。そして、得られた各単語のスコアＳが、それぞれ関連付けられているワイヤＳに対して設定される。なお、１つのワイヤＳに対して複数のスコアＳが得られる場合が生じることになるが、この場合には、例えば最も値が高いスコアＳを選択するようにすればよい。
【０１３０】
これによって、例えば、「イエス」「はい」「そうだね」等、同一の意味を示す単語データがそれぞれ１つのワイヤに対して設定されていれば、ユーザが「イエス」「はい」「そうだね」のいずれの音声で指示を出しても、音声認識のスコアＳとして適切な結果を得ることができる。
【０１３１】
また、判別処理によっては、入出力対象機器群６からの情報が入力情報として得られる場合がある。この場合、例えば音声認識部２を構成するプロセッサ２１が、上述の不揮発性メモリ等に、入出力対象機器群６に係る各機器の状態を示すデータを、（例えば上述の「単語データベースＤ３」と同様の）状態データベースとして格納し、入力情報がどの機器のどの状態を示すものかを状態データベースを参照して決定し、これとスコアＳとを状態データとしてエージェント処理部７に供給すればよい。なお、音声認識の場合と異なり、対応する状態が状態データベースにあれば、スコアＳは必ず１００％になるものとすればよい。そして、エージェント処理部７は、状態データが示す状態に関連するワイヤを判別し、各ワイヤに対してスコアＳを設定すればよい。
【０１３２】
次に、このように構成されたシステム全体の動作を、図１０を参照して説明する。
音声入力部１と音声認識部２と自然言語解析部３とは、独自に動作して、音声を取り込み、解析し、単語データをエージェント処理部７に提供する。
そして、エージェント処理部７は、判別条件に係る（１個又は複数個の）単語データ（若しくは状態データ）が自然言語解析部３等より供給されると、以下の処理を行う。
供給された単語を認識（識別）し（ステップＳ１１）、それが、単語データベースＤＢ４に登録されている単語に相当するか否かを判別する（ステップＳ１２）。登録されていなければ（ステップＳ１２，Ｎｏ）、単語入力処理を終了する。
一方、登録されていれば（ステップＳ１２，Ｙｅｓ）、その単語又はその単語の属す「カテゴリ」が条件となっている処理に関し、単語の尤度つまりスコアＳとワイヤの重み係数Ｊの積Ｓ・Ｊを計算する（ステップＳ１３）。
例えば、図９（ａ）に示すフローを実行している場合において、処理ポインタＰＰが第１の処理を指示しているとする。この場合の、各ワイヤの重み係数Ｊは図９（ｃ）に示すとおりである。
この状態で、スコアＳが８０％の単語「行く」と、スコアＳが５０％の単語「食事」を示す単語データが入力されたと仮定する。
図９（ａ）と（ｂ）に示す例では、第１の処理Ｐ１では、単語「行く」が判別条件に関連し、第３の処理Ｐ３では、単語「食事」が判別条件に関連する。
図９（ｃ−１）示すように、単語「行く」を示す単語データを入力する処理を先行の処理とするワイヤＷ０１の重み係数Ｊが０．５、単語「食事」を示す単語データを入力する処理を先行の処理とするワイヤＷ０３の重み係数Ｊが０．２５である。この場合、ワイヤＷ５１及びＷ５３について求められる尤度Ｓと重み係数Ｊの積Ｓ・Ｊは、数式１及び２に示すとおりとなる。
【０１３３】
（数１）ワイヤＷ０１についての判別結果：「行く」に対するスコアＳ（＝８０％）×ワイヤＷ０１の重み係数Ｊ（＝０．５）＝４０
【０１３４】
（数２）ワイヤＷ０３についての判別結果：「食事」に対するスコアＳ（＝５０％）×ワイヤＷ０３の重み係数Ｊ（＝０．２５）＝１２．５
【０１３５】
エージェント処理部７は、スコアＳと重み係数Ｊとの積Ｓ・Ｊを求める上述の処理を、フローが有するすべてのワイヤについて行う。
続いて、エージェント処理部７は、計算された積Ｓ・Ｊがもっとも大きいワイヤを選択する（図１０のステップＳ１４）。エージェント処理部７は、選択したワイヤに後続する処理に制御を進める（ステップＳ１５）。例えばワイヤＷ０１について求めた積Ｓ・Ｊが最も高い値を示した場合、入力された単語データは単語「行く」を示すものであったと認識して、ワイヤＷ０１が後続の処理としている第２の処理Ｐ２に遷移する。通常、現在の実行中の処理を起点するとワイヤの重み係数Ｊが比較的大きい。このため、一般的には、次の処理に移るが、従前と全く異なる単語で尤度Ｓの高いものが入力された場合には、その単語に対応する処理が開始されることもある。例えば、上述の例でいえば、「行く」に対するスコアＳが３０％であり、「食事」に対するスコアＳが８０％であった場合、それぞれの積Ｓ・Ｊは１５と２０になり、この場合には、ワイヤＷ０３が選択されることになる。これは、当該エージェント装置のユーザが処理の流れを熟知しており、現在の処理を飛ばして近接する他の処理にジャンプさせる場合などに特に有効である。
【０１３６】
エージェント処理部７は、処理が遷移すると、遷移後の状態に基づいて、各ワイヤの重み係数Ｊを再計算する（ステップＳ１６）。
以後は、その処理の内容に従って処理を進める（ステップＳ１７）。この例では、第２の処理Ｐ２を実行する。
【０１３７】
なお、トリガ取得処理からの遷移に対しては、ある程度高い重み係数Ｊを設定しておくとよい。具体的には、例えば、処理Ｐ１には「行く」という単語を示す単語データを取得するトリガ取得処理が先行しているものとして、このトリガ取得処理から処理Ｐ１への遷移を定義するワイヤに対しては、例えば重み係数Ｊ＝１．０を与えておく。そうすると、例えばエージェント処理部７の処理がこのトリガ取得処理に係るフローに係属している場合において、ユーザが「食事に行く」と発音し、例えば単語「行く」に対するスコアＳが８０％である単語データが得られれば、このスコアＳと、「ユーザが「行く」と言ったか否かの判断」に係るこのワイヤの重み係数Ｊとの積Ｓ・Ｊは、８０％×１．０すなわち８０となる。この値が他のワイヤの判別結果と比べて大きな値であれば、入力された音声は「行く」であったと認識され、エージェント処理部７の処理が処理Ｐ１にジャンプされる。一方で、他のワイヤの重み係数Ｊを極めて低く設定しておけば、これら他のワイヤにより定義されている処理にジャンプされる可能性は極めて低くなり、結果として、ある程度想定される会話の流れに沿って認識率を向上させることができる。
【０１３８】
この実施の形態では、戻り方向への遷移も起こり得る。しかし、現実的には会話を戻すことは好ましくないことが多い。そこで、戻り方向の遷移定数ｋは、進行方向の遷移定数ｋに比べて低い値に設定するようにすればよい。そうすると、入力された音声から高いスコアＳの単語データが仮に得られても、戻り方向の遷移定数ｋが重み係数Ｊとして書き込まれたワイヤについて求めた積Ｓ・Ｊは低い値となるため、戻り方向への遷移の可能性を低く抑えることができる。
また、エージェント処理部７は、求めた積Ｓ・Ｊの値が所定の条件に合致しないような処理（たとえば、積Ｓ・Ｊの値が所定値に達しないような処理）は、遷移を実行する対象から除外するよう取り扱ってもよい。
【０１３９】
なお、例えば図８に示しているように、ワイヤは、処理項目から処理項目への遷移という形で遷移を定義する。そして、ワイヤを図８に示すような形態で記述してデータベースに格納することにより、各処理項目同士の関係を、あたかもコンピュータのマクロ処理のように定義することが可能になる。これによって、各処理項目を容易に接続することができる。
【０１４０】
また、トリガとなる処理項目は、実際には接続されるワイヤに係る条件としての単語等（他の入力対象機器群６に対する状態の場合もあり得る）のスコアＳと重み係数Ｊに基づく判別結果の算出になるので、ワイヤの定義においてトリガ取得処理項目はワイヤの開始点として定義されず、ワイヤそのものが遷移元として定義されることになる。
【０１４１】
更に、上述のように各処理項目の接続関係をワイヤによって定義しているので、簡単に遷移先を追加することができる。例えば、「暑い」という音声入力の後に、ユーザが休憩することを意図して「ファミリーレストランを探して」という音声を入力する機会が多い場合、ファミリーレストランの検索処理項目に対して自動でワイヤを追加する。そうすると、ワイヤが自動で追加された後には、ファミリーレストラン検索処理項目に接続されたワイヤの重み係数Ｊをある程度大きくすることで、当該入力「ファミリーレストランを探して」に適切に対応することができるようになる。（ただしこの場合、エージェント処理部７は、例えばファミリーレストランの位置を示す情報を含んだ地図データ等を記憶し、あるいは外部の地図データ等にアクセスするものとする。）
このワイヤの自動追加は、ある処理項目からある処理項目（若しくはワイヤ）へのジャンプの回数を計数し、これが所定回数に達したときに自動で行うようにすればよい。
【０１４２】
次に、このエージェント装置が、ユーザである搭乗者を食事の場所に誘導するために実行する処理を、図１１〜図１７を参照して説明する。以下では、処理項目データベース及びワイヤデータベースは、例えば、全体として図１１〜図１７に示すようなフローを記述しているものとする。
【０１４３】
図１１〜図１７に示すフローにおいては、エージェント処理部７は、トリガ取得処理ステップＴＧ１ではカテゴリ「食事」に属する単語を示す単語データが自然言語解析部３より供給されると、これを取得して判別処理ステップＱＢ１に引き渡す。トリガ取得処理ステップＴＧ１で取得される単語は「食事」のカテゴリに分類されている単語であればよいので、例えば「ごはん」、「食べ物」など任意の単語をカテゴリ辞書によって「食事」のカテゴリに分類しておけば、このエージェント装置は、様々な単語に応答して判別処理ステップＱＢ１以下の処理を実行するようになる。
【０１４４】
エージェント処理部７は、判別処理ステップＱＢ１では、まず音声合成処理部４に、「食事に行く？」という文章を表す単語データを供給する。音声合成処理部４は、この文章を読み上げる音声を表す音声データを生成して音声出力部５に供給し、音声出力部５は、この音声データが表す音声を再生する。そしてエージェント処理部７は、自然言語解析部３から、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、該当する単語データが供給されると、このデータが「肯定」又は「否定」のいずれに属するかを判別する。そして、「肯定」に属すると判別すると判別処理ステップＱＢ３に処理を移し、「否定」に属すると判別すると判別処理ステップＱＢ２に処理を移す。
尚、カテゴリに基づく処理ではなく、各ワイヤ、例えばＱＢ１からＱＢ３への状態遷移を定義するワイヤに対しては、肯定を意味する単語「はい」「そうだね」等を条件として設定し、また、ＱＢ１からＱＢ２への状態遷移を定義するワイヤに対しては、否定を意味する単語「いや」「行かない」等を条件として設定するようにしてもよい。これによって、自然言語解析部３から入力音声に対応する単語のスコアＳが直接ワイヤに対して設定される。例えば、入力音声の単語「そうだね」に対するスコアＳが８０％であれば、このスコアＳがＱＢ１からＱＢ３への状態遷移を定義するワイヤに対して設定されることになる。
そして、上述のカテゴリに各単語を分類する場合でも同様だが、ここで得られた各スコアＳとワイヤに設定される重み係数Ｊとの乗算によってワイヤの算出結果が求められ、この算出結果が最も高い値を示すワイヤに状態を遷移することになる。
また、「肯定」又は「否定」のいずれのカテゴリに属する単語の単語データも供給されなかった場合は、音声合成処理部４に、「はいかいいえで答えて？」という文章を表す単語データを供給する。音声合成処理部４は、この文章を読み上げる音声を表す音声データを生成して音声出力部５に供給し、音声出力部５にこの音声データが表す音声を再生させる。そして、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、いずれかのカテゴリに属する単語データが供給されると、当該単語データのカテゴリに従って、判別処理ステップＱＢ１の処理における各遷移先のいずれかに処理を移す（判別処理ステップＱＢ６）。
【０１４５】
あるいは、エージェント処理部７は、トリガ取得処理ステップＴＧ０では単語「つまんない」を示す単語データが自然言語解析部３より供給されると、これを取得して判別処理ステップＱＢ０に引き渡す。そして、判別処理ステップＱＢ０では、この単語「つまんない」が、他の単語との所属カテゴリの重なり合いなどの結果、どのカテゴリに属するものとして扱われるかを判別する。そして、カテゴリ「食事」に属すると判別すると、処理を判別処理ステップＱＢ３に移し、他のカテゴリに属すると判別すると、該当するカテゴリに属する単語を取得するトリガ取得処理で当該単語データが取得されたものとして処理を継続する。
【０１４６】
エージェント処理部７は、判別処理ステップＱＢ２では、まず上述の判別処理ステップＱＢ１と同様にして、音声合成処理部４を介し、音声出力部５に、「それじゃコンビニ行く？」という文章を読み上げる音声を再生させる。そして、自然言語解析部３から、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、該当する単語データが供給されると、これが「肯定」又は「否定」のいずれに属するかを判別する。そして、「肯定」に属すると判別すると入出力処理ステップＳＰ２に処理を移し、「否定」に属すると判別すると入出力処理ステップＳＰ３に処理を移す。また、これらのいずれのカテゴリの単語の単語データも供給されなかった場合は、音声出力部５に、「はいかいいえで答えて？」という文章を読み上げる音声を再生させ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、供給された単語データのカテゴリに従い、判別処理ステップＱＢ２の処理における各遷移先のいずれかに処理を移す（判別処理ステップＱＢ４）。
【０１４７】
エージェント処理部７は、入出力処理ステップＳＰ２では、音声合成処理部４を介し、音声出力部５に、「コンビニを案内します。」という文章を読み上げる音声を再生させ、処理を入出力処理ステップＥＸ２に移す。そして、入出力処理ステップＥＸ２では、ナビゲーション部６１に、このエージェント装置が搭載されている車両の地図上における現在位置と、この地図上でのコンビニの位置を示す情報とを表示することを指示する制御信号を送る。ナビゲーション部６１は、この指示に従い、車両の地図上における現在位置と、この地図上でのコンビニの位置を示す情報とを表示し、このコンビニへの案内を開始する。
【０１４８】
入出力処理ステップＳＰ３でエージェント処理部７は、音声合成処理部４を介し、音声出力部５に、「安全運転に気をつけて。」という文章を読み上げる音声を再生させ、処理を入出力処理ステップＥＸ３に移す。そして、入出力処理ステップＥＸ３では、ナビゲーション部６１に制御信号を送ることにより、ナビゲーション部６１に、車両の地図上における現在位置を表示させる。
【０１４９】
一方、エージェント処理部７は、判別処理ステップＱＢ３では、音声出力部５に、「お店は決まっていますか？」という文章を読み上げさせ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、該当する単語データが供給されると、いずれのカテゴリに属するかを判別する。そして、「肯定」に属すると判別すると判別処理ステップＱＢ７に処理を移し、「否定」に属すると判別すると判別処理ステップＢＲ１に処理を移す。また、これらのいずれのカテゴリの単語の単語データも供給されなかった場合は、音声出力部５に、「はいかいいえで答えて？」という文章を読み上げる音声を再生させ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、供給された単語データのカテゴリに従い、判別処理ステップＱＢ３の処理における各遷移先のいずれかに処理を移す。
【０１５０】
エージェント処理部７は、判別処理ステップＱＢ７では、音声合成処理部４を介し、音声出力部５に、「お店の名前は？」という文章を読み上げさせて、単語データが供給されるのを待機し、供給されると、ナビゲーション部６１に、この単語データが示すレストランを検索し、該当するレストランがあれば、車両の地図上における現在位置と、この地図上での当該レストランの位置を示す情報とを表示するよう指示する制御信号を送る。そして、該当するレストランがあれば、ナビゲーション部６１が、車両の地図上における現在位置と、この地図上でのレストランの位置を示す情報とを表示し、このレストランへの案内を開始する（ステップＥＸ１００）。一方、該当するレストランがなければ、ナビゲーション部６１がその旨の情報をエージェント処理部７に返すなどして、エージェント処理部７は処理を入出力処理ステップＳＰ５に移す。入出力処理ステップＳＰ５でエージェント処理部７は、音声出力部５に、「近くにはありません。」という文章を読み上げさせ、処理を判別処理ステップＢＲ１に移す。
【０１５１】
エージェント処理部７は、判別処理ＢＲ１では、クロック６２より現在の時刻を示すデータを取得して、このデータが示す時刻が、（ａ）１２時より前、（ｂ）１２時以降で１４時より前、（ｃ）１４時以降、のいずれであるかを判別する。そして、（ａ）１２時より前であると判別すると、音声出力部５に「モーニングですね。」という文章を読み上げさせ（入出力処理ステップＳＰ８）、処理を判別処理ステップＱＢ１０に移す。（ｂ）１２時以降で１４時より前であると判別すると、音声出力部５に「ランチですね。」という文章を読み上げさせ（入出力処理ステップＳＰ１０）、処理を判別処理ステップＱＢ１２に移す。（ｃ）１４時以降であると判別すると、音声出力部５に「お茶の時間ですね。」という文章を読み上げさせ（入出力処理ステップＳＰ９）、処理を判別処理ステップＱＢ１０に移す。
【０１５２】
一方、エージェント処理部７は、判別処理ステップＱＢ１０では、音声出力部５に、「おすすめのお店を検索しますか？」という文章を読み上げさせ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、該当する単語データが供給されると、いずれのカテゴリに属するかを判別する。そして、「肯定」に属すると判別すると入出力処理ステップＳＰ１４に処理を移し、「否定」に属すると判別すると判別処理ステップＱＢ１２に処理を移す。また、これらのいずれのカテゴリの単語の単語データも供給されなかった場合は、音声出力部５に、「はいかいいえで答えて？」という文章を読み上げる音声を再生させ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、供給された単語データのカテゴリに従い、判別処理ステップＱＢ１０の処理における各遷移先のいずれかに処理を移す（判別処理ステップＱＢ１３）。
【０１５３】
エージェント処理部７は、入出力処理ステップＳＰ１４では、ナビゲーション部６１に、車両の現在位置近隣のレストランを検索し、索出したレストランの名称を示すデータを供給し、車両の地図上における現在位置と、この地図上での当該レストランの位置を示す情報とを表示するよう指示する制御信号を送る。そして、ナビゲーション部６１がレストランの名称を供給すると、エージェント処理部７はこの名称を音声出力部５に読み上げさせる。一方、ナビゲーション部６１は、車両の地図上における現在位置と、この地図上での当該レストランの位置を示す情報とを表示し、このレストランへの案内を開始する（ステップＥＸ５）。
【０１５４】
エージェント処理部７は、判別処理ステップＱＢ１２では、音声出力部５に、「過去経験ＤＢ（データベース）を検索しますか？」という文章を読み上げさせ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、該当する単語データが供給されると、いずれのカテゴリに属するかを判別する。そして、「肯定」に属すると判別すると入出力処理ステップＳＰ１５に処理を移し、「否定」に属すると判別すると判別処理ステップＱＢ１１に処理を移す。また、これらのいずれのカテゴリの単語の単語データも供給されなかった場合は、音声出力部５に、「はいかいいえで答えて？」という文章を読み上げる音声を再生させ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、供給された単語データのカテゴリに従い、判別処理ステップＱＢ１２の処理における各遷移先のいずれかに処理を移す（判別処理ステップＱＢ１４）。
【０１５５】
エージェント処理部７は、入出力処理ステップＳＰ１５では過去経験データベースを、例えばナビゲーション部６１が供給する情報が示す車両の現在位置を検索キーとして検索し、索出したレストランの名称を音声出力部５に読み上げさせる。そしてエージェント処理部７は、ナビゲーション部６１に、車両の地図上における現在位置と、索出したレストランのこの地図上での位置を示す情報とを表示するよう指示する制御信号を送る。ナビゲーション部６１は、車両の地図上における現在位置と、この地図上での当該レストランの位置を示す情報とを表示し、このレストランへの案内を開始する（ステップＥＸ６）。
【０１５６】
エージェント処理部７は、判別処理ステップＱＢ１１では、音声出力部５に、「それじゃ和食・洋食・中華どれがいい？」という文章を読み上げさせ、単語「和食」、「洋食」又は「中華」を表す単語データが供給されるのを待機し、該当する単語データが供給されると、いずれの単語かを判別する。そして、「和食」と判別すると入出力処理ステップＥＸ５１に処理を移し、「洋食」と判別すると入出力処理ステップＥＸ５２に処理を移し、「中華」と判別すると入出力処理ステップＥＸ５３に処理を移す。また、これらのいずれの単語の単語データも供給されなかった場合は、音声出力部５に、「和食／洋食／中華で答えて？」という文章を読み上げる音声を再生させ、単語「和食」、「洋食」又は「中華」を表す単語データが供給されるのを待機し、供給された単語データのカテゴリに従い、判別処理ステップＱＢ１１の処理における各遷移先のいずれかに処理を移す（判別処理ステップＱＢ１５）。
【０１５７】
エージェント処理部７は、入出力処理ステップＥＸ５１では和食レストランデータベースを、例えばナビゲーション部６１が供給する情報が示す車両の現在位置を検索キーとして検索し、処理を判別処理ステップＱＢ１６に移す。なお、エージェント処理部７は、トリガ取得処理ステップＴＧ５１で単語「和食」を表す単語データを取得したときも、入出力処理ステップＥＸ５１に処理を移すものとする。
また、入出力処理ステップＥＸ５２では洋食レストランデータベースを、入出力処理ステップＥＸ５３では中華レストランデータベースを、入出力処理ステップＥＸ５１と同様にして検索し、図示するように、処理を判別処理ステップＱＢ１７又はＱＢ１８に移す。なお、エージェント処理部７は、トリガ取得処理ステップＴＧ５２で単語「洋食」を表す単語データを取得したときも入出力処理ステップＥＸ５２に処理を移すものとする。トリガ取得処理ステップＴＧ５３で単語「中華」を表す単語データを取得したときも入出力処理ステップＥＸ５３に処理を移すものとする。
【０１５８】
判別処理ステップＱＢ１６、ＱＢ１７又はＱＢ１８で、エージェント処理部７は、入出力処理ステップＥＸ５１、ＥＸ５２又はＥＸ５３で索出したレストランの名称と、確認を促す文章とを、音声出力部５に読み上げさせて、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機する。そして、該当する単語データが供給されると、いずれのカテゴリに属するかを判別し、「肯定」に属すると判別すると入出力処理ステップＳＰ１７、ＳＰ１８又はＳＰ１９に処理を移し、「否定」に属すると判別すると入出力処理ステップＳＰ１６に処理を移す。また、これらのいずれのカテゴリの単語の単語データも供給されなかった場合は、音声出力部５に、「はいかいいえで答えて？」という文章を読み上げる音声を再生させ、カテゴリ「肯定」又は「否定」に属する単語データが供給されるのを待機し、供給された単語データのカテゴリに従い、判別処理ステップＱＢ１６、ＱＢ１７又はＱＢ１８の処理における各遷移先のいずれかに処理を移す（判別処理ステップＱＢ１９、ＱＢ２０又はＱＢ２１）。
【０１５９】
そしてエージェント処理部７は、入出力処理ステップＳＰ１７、ＳＰ１８又はＳＰ１９では、音声出力部５に、「ご案内します。」という文章を読み上げさせ、ナビゲーション部６１に、車両の地図上における現在位置と、入出力ステップＥＸ５１、ＥＸ５２又はＥＸ５３で索出したレストランのこの地図上での位置を示す情報とを表示するよう指示する制御信号を送る。ナビゲーション部６１は、車両の地図上における現在位置と、この地図上での当該レストランの位置を示す情報とを表示し、このレストランへの案内を開始する（ステップＥＸ８、ＥＸ９又はＥＸ１０）。
【０１６０】
一方、入出力処理ステップＳＰ１６で、エージェント処理部７は、音声出力部５に、「わがままね。Ｗｅｂでレストラン情報を検索してみるね。」という文章を読み上げさせる。そして、エージェント処理部７は、自己の通信制御装置を介して外部のネットワークにアクセスし、現在位置を基準にしてレストランの位置を示す情報の検索を行う（入出力処理ステップＥＸ７）。そして、該当する情報を索出すると、例えば、ナビゲーション部６１に、車両の地図上における現在位置と、この地図上での当該レストランの位置を示す情報とを表示させる。
【０１６１】
なお、上述の通り、エージェント処理部７に供給される単語データには音声認識部２によってスコアが付され、処理の遷移は、重み係数ＪとスコアＳとの積Ｓ・Ｊが最大となるワイヤが示す内容に従って行われるので、フローがジャンプして上述した順序と異なる処理が行われる場合があり得る。そして、トリガとなる処理項目を先行処理項目として有するワイヤに対しては、遷移定数ｋがある程度高い値に設定されているものとすれば、結果としてこのワイヤの重み係数Ｊも高い値となり、ジャンプが起きやすくなって、エージェント処理部７は突然の話題転換にも対応できるようになる。例えば、「お腹減った」という音声入力を認識し、「食事に行く？」と質問した後に、「つまんない」とユーザが発話した場合、単語「つまんない」の単語データを取得する処理項目に対応するワイヤに設定されている単語「つまんない」の認識スコアＳと重み係数Ｊとの積Ｓ・Ｊが算出され、また、判断処理「食事に行く？」に連なるワイヤに設定される単語のスコアＳと重み係数Ｊとの積Ｓ・Ｊも計算される（もちろん、他のワイヤに対してもそれぞれ計算される）。結果として、単語「つまんない」について求めた積が最も大きな値を示せば、エージェント処理部７は処理のフローをジャンプし、単語「つまんない」の単語データを取得する処理項目に後続する処理項目へと遷移する。
【０１６２】
以上説明したこのエージェント装置は、処理の内容を示すデータやワイヤが適切に記述されれば、ユーザの自然な発話に応答して、ユーザの欲求を満たすためにどの機器にどのような制御を加えればよいかを適切に判断して、判断結果に従った制御を機器に加えることができるようになる。
【０１６３】
なお、このエージェント装置の構成は上述のものに限られない。
例えば、単語データベースＤ３は、必ずしも単語を示すデータのみならず、複数の単語からなる語句を示すデータを単語データベースＤ３の要素として記憶するようにしてもよいし、単語の一部あるいは音素を示すデータを単語データベースＤ３の要素として記憶するようにしてもよい。また、単語等は必ずしも特定の概念の下にグルーピングされている必要はなく、グルーピングを行う場合も、グルーピングを行うために用いられるデータは、必ずしもカテゴリ辞書の形をとっていなくてもよい。
【０１６４】
また、音声認識部２は、ユーザが発話した音声のすべてを認識した結果を自然言語解析部３に供給する代わりに、ある特定の単語のみを認識して、認識した単語を直接にエージェント処理部７へと供給するようにしてもよい（ワードスポッティング方式）。この場合、このエージェント装置は、自然言語解析部３を備えている必要はない。
【０１６５】
また、エージェント処理部７は、複数の単語が属するカテゴリを、これら複数の単語がどのような組み合わせで同一の文章に含まれているかに基づいて決定してもよい。この場合、エージェント処理部７は、例えば図１８にデータ構造を示すようなテーブルを記憶し、このテーブルを参照することにより、組をなす複数の単語のカテゴリを決定すればよい。なお、図１８に例示するテーブルは、例えば、単語「お腹」と単語「減った」が同一の文章中に含まれていた場合は、これら２個の単語は、この文章に係る処理を行う限りではカテゴリ「食事」に属するものとして扱われることを示す。また、単語「設定」と単語「目的地」が同一の文章中に含まれていた場合は、これら２個の単語は、この文章に係る処理を行う限りではカテゴリ「ナビ設定」に属するものとして扱われることを示す。
【０１６６】
また、エージェント処理部７は、ワイヤに対応する遷移定数ｋを、過去に当該ワイヤが表す遷移を実行した数などに基づき所定の基準に従って変化させ、重み係数Ｊが変化後の遷移定数ｋに基づいて計算された値となるようにワイヤを書き換えてもよい。
具体的には、例えば、ワイヤデータベースＤ５に、それぞれのワイヤについて、当該ワイヤが表す遷移が実行された回数を記憶しておく。そしてエージェント処理部７は、当該遷移が新たに行われる毎に、この回数の値を書き換えることにより、この回数の値を１ずつインクリメントし、それぞれのワイヤに対応する遷移定数ｋを、例えば、当該ワイヤについて記憶された回数に比例した値と書き換える。
なお、上述の実施例では、ワイヤに設定される条件は、それぞれのワイヤに対して設定されるとして説明したが、これには限られない。例えば、判別処理の中に各ワイヤの条件を記述するようにしてもよい。この場合、各条件がいずれのワイヤに対応するものかを予め特定しておく。
【０１６７】
また、エージェント処理部７は、判別処理や入出力処理において出力するデータを、これらの処理に引き渡されたデータや、これらの処理に伴って入力したデータや、その他任意の条件に従って変化させるようにしてもよい。
【０１６８】
また、このエージェント装置は、エージェント処理部７の制御に従って画像を出力するための表示装置（例えば、液晶ディスプレイ等）を備えていてもよく、エージェント処理部７は、入出力処理や判別処理において、処理毎に所定の画像を表示させるようこの表示装置を制御してもよい。
【０１６９】
また、エージェント処理部７は、トリガ取得処理、判別処理、入出力処理等の各種処理とワイヤとが全体として形成するフローを分担して行う、互いに接続された複数のデータ処理装置（例えば、コンピュータ等）から構成されていてもよい。この場合、エージェント処理部７を構成するそれぞれのデータ処理装置は、エージェント処理部７が実行し得るフロー全体のうち、自己が実行する可能性がある部分を表すデータを、処理項目データベースやワイヤデータベースの要素として記憶すれば十分である。そして、それぞれのデータ処理装置が記憶するデータが、当該データ処理装置が実行する部分の処理をマクロ定義するようなデータとなっていれば、複数のデータ処理装置に分散処理を行わせることも容易である。
【０１７０】
また、このエージェント装置は、音声入力部１や自然言語解析部３あるいは音声出力部５も複数備えていてよい。
また、音声入力部１は、たとえば、音声を表すデータが記録された記録媒体（たとえば、フロッピー（登録商標）ディスクや、ＣＤ（Compact Disc）や、ＭＯ（Magneto-Optical Disk）など）から波形信号を読み出して自然言語解析部３に供給する記録媒体ドライブ装置（たとえば、フロッピー（登録商標）ディスクドライブや、ＣＤ−ＲＯＭドライブや、ＭＯドライブなど）を備えていてもよい。
【０１７１】
また、このエージェント装置は、例えば、カーナビゲーションシステムの制御に限られず、他の機器の制御を行ってもよい。従って、車載機器の制御装置を制御してもよく、エアコン等の空調機器を制御してもよく、モーターの動力により開閉する窓の開閉や、ライトの点灯／消灯や、電動ワイパーの始動／停止を制御してもよい。
【０１７２】
また、オーディオ機器を制御してもよい。オーディオ機器の制御としては、例えば、ラジオのチューニングの制御、ＣＤ（Compact Disc）やＭＤ（Mini Disc）、ＤＶＤ（Digital Versatile Disc）等の記録媒体に記録された音声や画像を再生する記録媒体ドライブ装置の制御に適用可能である。
【０１７３】
オーディオ機器の制御の具体的な態様としては、例えば、ＣＤプレーヤにより再生されている楽曲を変えたいと思ったユーザが指示のために用いる可能性のある表現（例えば、「曲を変えて」「別の曲」「違う曲」等）を構成する単語の組み合わせ（例えば、「曲」と「変えて」、「別」と「曲」、「違う」と「曲」、等）を、カテゴリ辞書を用いて「曲変更」というカテゴリに分類しておき、ＣＤプレーヤがＣＤに記録された楽曲の再生中に、カテゴリ「曲変更」に属する単語の組み合わせが発声され、該当する各単語を表す単語データが音声認識部２から自然言語解析部３を経てエージェント処理部７に供給されたとき、エージェント処理部７がこれに応答して（具体的には、カテゴリ「曲変更」に属する単語データを取得するトリガ処理項目の後続の処理項目に遷移して）、ＣＤプレーヤに、再生中のトラックを変更することを指示する制御信号を送る、等が考えられる。尚、「曲」という単語と共に、「変えて」「別」「違う」の単語を１つのワイヤに条件として設定するようにしてもよい。これによって、自然言語解析部３から入力音声に対応する単語のスコアが直接ワイヤに対して設定される。自然言語解析部３から供給された単語データが、単語「曲」と単語「変えて」であった場合、それぞれのスコアが当該ワイヤに設定される。そして、この設定されたスコアに基づいて当該ワイヤの算出結果を求める。この場合、各スコアを合算してもよいし、または平均値を求めてもよい。そして、上述のカテゴリに各単語を分類する場合でも同様だが、ここで得られた各スコアとワイヤに設定される重み係数との乗算によってワイヤの算出結果が求められ、この算出結果が最も高い値を示すワイヤに状態を遷移することになる。
【０１７４】
また、他の具体例としては、エージェント処理部７が、音声出力部５に「この曲でいい？」という音声を出力させ、その後、「肯定」のカテゴリに属する単語（「うん」「いい」「ＯＫ」等）又は「否定」のカテゴリに属する単語（例えば「いや」「ちがう」「だめ」「別の」等）の単語データが供給されたとき、供給された単語データのカテゴリに従って、ＣＤプレーヤに楽曲の再生や停止を指示することが考えられる。
［第２の実施の形態］
【０１７５】
場合によって、ユーザはあいまいな表現を発することがある。例えば、「つまんない」という単語は、「音楽再生」「曲変更」「買い物」あるいは「食事」など、様々な要求を意図して発せられ得る。このようなあいまいな表現の指示が発せられたときにこの指示の意図を特定する本発明の第２の実施の形態のエージェント装置を説明する。
【０１７６】
このエージェント装置の物理的構成は、例えば、図１に示す第１の実施の形態の構成と実質的に同一である。ただし、このエージェント装置の入出力対象機器群６には、ナビゲーション部６１やクロック６２に加え、ＣＤプレーヤが含まれているものとする。また、カテゴリ辞書により定義されているカテゴリの少なくとも一部は、入出力対象機器群６に属する少なくともいずれかの機器と対応付けられているものとする。
【０１７７】
このエージェント装置のエージェント処理部７に、単語「つまんない」を表す単語データが供給された場合、エージェント処理部７は、単語「つまんない」が属するカテゴリを検索する。その結果、例えば「音楽再生」「曲変更」「買い物」「食事」の４つのカテゴリに属していたとして、次に、エージェント処理部７は、入出力対象機器群６に属する機器のうち、これらのカテゴリに対応付けられている機器から、当該機器の現在の動作状態を示す情報を取得する。
【０１７８】
取得した情報が、ＣＤプレーヤが何ら音声を再生していないことを示している場合、エージェント処理部７は、例えば「音楽でもかける？それとも買い物にいく？食事にでもいく？」という音声を音声出力部５に発生させることにより、上述の４つのカテゴリのうち「曲変更」を除く「音楽再生」「買い物」「食事」の３つのカテゴリのいずれかを選択するよう促す。
【０１７９】
そして、「ＣＤをかけて」、あるいはその他、カテゴリ「ＣＤ再生」に属する単語ないしそのような単語を含む文章をユーザが発声し、カテゴリ「ＣＤ再生」に属する単語の単語データがエージェント処理部７に供給されると、エージェント処理部７は、カテゴリ「ＣＤ再生」に属する単語の単語データを取得するトリガ取得処理に後続する処理へと遷移する。この結果、例えば「ＣＤを再生するね」という音声を音声出力部５に発生させ、ＣＤプレーヤに音声の再生を指示する制御信号を送る。
【０１８０】
また、単語「うた」を含む文章「なんか“うた”でも聞きたいなあ」、あるいはその他、カテゴリ「音楽」に属する単語ないしそのような単語を含む文章をユーザが発声し、カテゴリ「音楽」に属する単語の単語データがエージェント処理部７に供給されると、エージェント処理部７は、カテゴリ「音楽」に属する単語の単語データを取得するトリガ取得処理に後続する処理へと遷移する。
同様に、カテゴリ「食事」に属する単語ないしそのような単語を含む文章をユーザが発声し、カテゴリ「食事」に属する単語の単語データがエージェント処理部７に供給されると、エージェント処理部７は、カテゴリ「食事」に属する単語の単語データを取得するトリガ取得処理に後続する処理へと遷移する。この場合、例えば図１１に示すＱＢ３に状態を遷移することとなる。
【０１８１】
なお、入出力対象機器群６に属する機器の現在の動作状態を示す情報が、ＣＤプレーヤが音声を再生していることを示している場合、エージェント処理部７は、例えば「曲を変える？それとも買い物にいく？食事にでもいく？」という音声を音声出力部５に発生させることにより、上述の４つのカテゴリのうち「音楽再生」を除く「曲変更」「買い物」「食事」の３つのカテゴリのいずれかを選択するよう促す。
【０１８２】
以上説明した動作を行うことによって、本発明の第２の実施の形態のエージェント装置は、ユーザのあいまいな指示を示す音声に基づいて、ユーザの意図を適切に特定する。
［第３の実施の形態］
【０１８３】
上述の各実施の形態のエージェント装置は、ユーザの要求を的確に判断し、また、あいまいな指示からもユーザの要求を具体的に導いて、機器の制御を行う。しかし、ユーザとしては、単に自らが一方的に発する要求を判断することだけでなく、話し相手を必要とする場合もあり得る。例えば、一人で車を運転するユーザは、そのような必要を感じる場合が多いと考えられる。しかし、車の運転中であれば、携帯電話を使用して会話をするのは危険が伴うし、また、通話料金がかさんでしまうという問題もある。
【０１８４】
このような問題は、エージェント装置がユーザの話し相手になれば解決する。以下では、ユーザとの会話を達成する、本発明の第３の実施の形態に係るエージェント装置を説明する。
【０１８５】
このエージェント装置の物理的構成は、例えば、上述した第１の実施の形態の構成と実質的に同一である。ただし、このエージェント装置の入出力対象機器群６は、ＦＭ多重放送を受信し文字情報を抽出してエージェント処理部７に随時供給するラジオ受信機、あるいは、外部の通信回線を介して文字情報を取得しエージェント処理部７に随時供給する端末を含んでいる受信機を含んでいるものとし、エージェント処理部７は、このラジオ受信機あるいは端末が供給する文字情報を自己の不揮発性メモリに蓄積するものとする。そして、蓄積した文字情報を読み出す際は、読み出しを行ったことを示すデータを生成して格納するものとする。
【０１８６】
そして、例えば単語「なんかニュースない？」を表す単語データを取得するトリガ取得処理が実行されると、このトリガ取得処理に後続する処理として、例えば以下説明する処理を実行する。
【０１８７】
例えば、エージェント処理部７は、自己の不揮発性メモリに蓄積された文字情報のうち、まだ読み出されていないものがあると、該当する文字情報のジャンルを知らせるメッセージ（例えば、「スポーツと、社会経済に関するニュースがあります」等）を読み上げる音声を音声出力部５に発生させる。
【０１８８】
なお、該当する文字情報のジャンルは、受信された文字情報に予め分類を示す情報があればこれに基づいて特定する。ない場合には、エージェント処理部７が当該文字情報の内容に基づいて判断する。具体的には、例えば「○○党の幹部が汚職により更迭を余儀なくされ・・・」等の内容を含む文字情報では、「○○党」「汚職」の単語に基づいて、社会面記事と判断する。同様に、「○○株式会社が発表した決算発表によって同社の株価が高騰し・・・」との内容を含む文字情報では、「決算発表」「株価」の単語に基づいて、経済面記事と判断する。また「サッカーの○○（チーム名）が○○（いつの）試合で勝利し、優勝に王手をかけた」との内容を含む文字情報では、「サッカー」「試合」「優勝」の単語に基づいて、スポーツ面記事と判断する。
【０１８９】
そして、ユーザが発した「スポーツのニュースを教えて」という文章を表す単語データの集合が供給されると、エージェント処理部７は、自ら蓄積している文字情報のうち、まだ読み出されていないスポーツ面記事を反映した文章（例えば、「サッカーの○○（チーム名）が○○（いつの）試合で勝利し、優勝に王手をかけたんだって」等）を読み上げる音声を音声出力部５に発生させる。
【０１９０】
なお、ニュース等で受信する文字情報は文末に「〜した」等の表現が使われることが多く、通常の会話にはそぐわない。そこで、文字情報をそのまま読み上げるようにせず、上述のように、文章の語尾を「んだって」等、友人同士での会話の語尾に使われそうな言葉に置換して読み上げるようにするとよい。
【０１９１】
また、エージェント処理部７は、音声出力部５に文字情報を読み上げさせる際、文字情報の一部（例えば、冒頭の段落）のみをまず読み上げさせ、ユーザが当該文字情報の詳細を求める音声（例えば、「もっと詳しい情報ある？」と問い掛ける音声）を発するのを待機し、発したとき、これに応答して残りの部分を読み上げさせるようにしてもよい。
【０１９２】
また、エージェント処理部７は、ユーザが当該文字情報の詳細を求める音声を発したことに応答して、自ら蓄積している文字情報を検索し、既に全文を読み上げたか否かを判別して、読み上げたと判別した場合には、「ううん、今のところこれだけだね」という音声を出力させ、また、詳細部分がある場合には「あるよ、じゃあ全文読み上げるね」という音声を出力させた後に、該当する詳細部分を読み上げる音声を出力させるようにしてもよい。
【０１９３】
また、エージェント処理部７は、音声出力部５に読み上げさせた文字情報に対する質問を含んだ音声をユーザが発したとき、これに応答して、自らが蓄積している文字情報のうちから、当該質問への回答となり得るものを索出して音声出力部５に読み上げさせてもよい。例えばユーザが、「どことの試合で勝ったの？」という質問を発した場合、当該試合の結果を解説する文字情報を検索し、索出されれば、この文字情報を読み上げさせる、等である。また、「次の試合はいつ？」と質問された場合も、次の試合のスケジュールを解説する文字情報を検索し、索出されればこれを読み上げさせる等すればよい。
【０１９４】
そして、その結果ユーザが更に、「チケット取れる？」等と質問すると、エージェント処理部７は、これまでのユーザとの会話内容に基づいて「チーム名」や「試合日」を特定し、例えば「ちょっと調べてみるね」という音声を音声出力部５に発生させた後に、外部のネットワーク等を通じてチケット販売サイトに接続し、該当するチケットの有無を照会する。
【０１９５】
その結果、当該チケットがまだ購入可能であるとの回答が得られた場合、エージェント処理部７は、「今ならまだ大丈夫。○席で○○円だけど、購入する？」などとチケットの販売状況を説明する音声を音声出力部５に読み上げさせることにより、ユーザの回答を促す。これに対してユーザが「購入する」「注文して」「買う」等、肯定を意味する単語を発声した場合、この単語を表す単語データに応答して、チケットの購入を支援する処理（例えば、ネット決済等を支援する公知の処理）へと移行する。
【０１９６】
一方、チケットが既に完売になっているとの回答が得られた場合、エージェント処理部７は、「残念だけど、もう満席みたい。」等の文章を音声出力部５に読み上げさせて、一連の処理を終了し、その他に、まだ未出力の文字情報があれば、該当する文字情報を出力する処理に移行する。
【０１９７】
以上説明した動作を行うことによって、本発明の第３の実施の形態のエージェント装置は、単にユーザの所望する制御を行うのみでなく、ユーザとの会話を実現する。尚、上述のエージェント装置とユーザの会話は、オーディオ装置に対しても適用することが可能である。例えば、オーディオ装置は、インターネット等を通じて予めユーザが登録したアーティスト条件に基づいて情報を取得してメモリする。取得された情報は、アーティスト条件に基づいて分類される。そして、ユーザが「新着情報ない？」等を問い掛けると、エージェント装置はメモリ内容を検索し、まだ提示していない情報があれば、音声出力によってこれを提示する。もちろんこのとき、映像情報を伴うものであってもよい。例えばこの新着情報が新しいアルバムに関する情報であれば、更にエージェント装置はこのアルバムの購入をユーザに確認し、了解が取れるとこれを購入するようにインターネットＣＤショップに購入手続きをとる。また同様に、コンサート情報であれば、エージェント装置はこのコンサートのチケットの購入をユーザに確認し、了解が取れるとこれを購入するようにインターネットチケットショップに購入手続きをとる。尚、これらの音声認識処理等は上述の実施例に基づいて行われる。
【０１９８】
以上、この発明の実施の形態を説明したが、上述の実施の形態に示されるような以下のいずれかの処理を、又は組み合わせて施すことによって、ユーザが発話する様々な表現の音声を適切に認識して、対応する処理を実行することが可能になる。
１．各ワイヤに対して、当該ワイヤにおいて同じ意味として取り扱われる単語を複数条件として設定する。
２．各ワイヤに対して、一若しくは複数の単語が分類されるカテゴリを設定する。
３．各ワイヤに対して、異なる意味の単語若しくはカテゴリを複数条件として設定する。
４．複数の単語が同一の文章（入力音声）に含まれていた場合に、これらの単語が共通して属するカテゴリのみを、これらの単語が属するカテゴリとして扱うことにより、これらの単語が発話された意図を文脈に応じて把握することを可能とする。
５．単語データが有するカテゴリを、当該単語データの意味として扱う。
６．トリガ取得処理で取得されるデータが単語データである場合は、ワイヤに設定される条件は、当該単語データが表す単語に代えて、当該単語データが表す単語がグルーピングされているカテゴリを記述する。
７．入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促すようにする。
８．外部から取得した情報に基づいて、ユーザに提示する内容を変更する。
尚、この発明にかかる機器制御装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。
例えば、入出力対象機器群６に接続されたパーソナルコンピュータに上述の音声入力部１、自然言語解析部３、音声合成処理部４、音声出力部５及びエージェント処理部７の動作を実行させるためのプログラムを格納した記録媒体から該プログラムをインストールすることにより、上述の処理を実行するエージェント装置を構成することができる。そして、このプログラムを実行するパーソナルコンピュータが、図１のエージェント装置の動作に相当する処理として、例えば、図９（ａ）に示すフローを実行するものとする。
【０１９９】
なお、パーソナルコンピュータに上述のエージェント装置の機能を行わせるプログラムは、例えば、通信回線の掲示板（ＢＢＳ）にアップロードし、これを通信回線を介して配信してもよく、また、このプログラムを表す信号により搬送波を変調し、得られた変調波を伝送し、この変調波を受信した装置が変調波を復調してこのプログラムを復元するようにしてもよい。そして、このプログラムを起動し、ＯＳの制御下に、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行することができる。
【０２００】
なお、ＯＳが処理の一部を分担する場合、あるいは、ＯＳが本願発明の１つの構成要素の一部を構成するような場合には、記録媒体には、その部分を除いたプログラムを格納してもよい。この場合も、この発明では、その記録媒体には、コンピュータが実行する各機能又はステップを実行するためのプログラムが格納されているものとする。
【０２０１】
本発明は、２００３年１２月２６日に出願された、特願２００３−４３６９７６に基づき、その明細書、特許請求の範囲、図面および要約書を含む。上記出願における開示は、本明細書中にその全体が参照として含まれる。
【産業上の利用可能性】
【０２０２】
本発明は、人間が言語の形で発する指示に適切に応答して機器を制御できる種々の機器制御装置等に利用可能である。

【特許請求の範囲】
【請求項１】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする機器制御装置。
【請求項２】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項１に記載の機器制御装置。
【請求項３】
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された複数の語句の組み合わせが所定の条件を満たしているか否かを判別し、判別結果に基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項２に記載の機器制御装置。
【請求項４】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項１に記載の機器制御装置。
【請求項５】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項１に記載の機器制御装置。
【請求項６】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定する
ことを特徴とする請求項１に記載の機器制御装置。
【請求項７】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行する、
ことを特徴とする請求項１に記載の機器制御装置。
【請求項８】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促す、
ことを特徴とする請求項１に記載の機器制御装置。
【請求項９】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択する、
ことを特徴とする請求項１に記載の機器制御装置。
【請求項１０】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする機器制御装置。
【請求項１１】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とする音声認識装置。
【請求項１２】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１３】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１４】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１５】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定する
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１６】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行する、
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１７】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促す、
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１８】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択する、
ことを特徴とする請求項１１に記載の音声認識装置。
【請求項１９】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする音声認識装置。
【請求項２０】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とするエージェント装置。
【請求項２１】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２２】
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された複数の語句の組み合わせが所定の条件を満たしているか否かを判別し、判別結果に基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項２１に記載のエージェント装置。
【請求項２３】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２４】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２５】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２６】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行する、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２７】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促す、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２８】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択する、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項２９】
前記処理実行手段（７）は、実行すべき処理として特定した処理が、外部から受信した情報を発話者に提示する処理であるとき、当該情報を読み上げる音声を発生させることにより当該提示を実行する手段を備える、
ことを特徴とする請求項２０に記載のエージェント装置。
【請求項３０】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするエージェント装置。
【請求項３１】
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする車載機器制御装置。
【請求項３２】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３３】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３４】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３５】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３６】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行する、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３７】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促す、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３８】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択する、
ことを特徴とする請求項３１に記載の車載機器制御装置。
【請求項３９】
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする車載機器制御装置。
【請求項４０】
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定して、当該ナビゲーション処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とするナビゲーション装置。
【請求項４１】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４２】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４３】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４４】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４５】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行する、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４６】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促す、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４７】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択する、
ことを特徴とする請求項４０に記載のナビゲーション装置。
【請求項４８】
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定したナビゲーション処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段は当該情報に基づいて音声を出力する、
ことを特徴とするナビゲーション装置。
【請求項４９】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべき音声処理の内容を特定して、当該音声処理を実行し、又は外部の機器に実行させるよう当該外部の機器を制御する処理実行手段（７）と、
を備える、
ことを特徴とするオーディオ装置。
【請求項５０】
前記音声認識手段（２，３）は、特定した語句の品詞を特定する品詞特定手段（３）を備え、
前記特定手段（７）は、前記音声認識手段（２，３）が特定した語句のうち、所定の品詞であると特定された語句のみに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５１】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した語句が分類されるカテゴリに基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５２】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、異なる意味の語句若しくはカテゴリを複数個対応付ける対応情報を保持しており、前記音声認識手段（２，３）が特定した語句若しくはカテゴリの組み合わせと前記対応情報に基づいて前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５３】
前記特定手段（７）は、語句を１個以上のカテゴリに対応付ける情報を保持しており、前記音声認識手段（２，３）が特定した複数の語句が共通して分類されているカテゴリに基づいて、前記音声の発話者の発話内容を特定する、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５４】
前記特定手段（７）は、前記処理実行手段（７）のそれぞれの処理に対して、複数の語句を割り当てて保持しており、前記音声認識手段（２，３）が特定した語句のうち少なくとも一つが前記処理に対して割り当てられた語句であるとき、対応する処理を実行する、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５５】
前記特定手段（７）は、入力された音声の意味が判別できなかったとき、より判別しやすい表現での入力を促す、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５６】
外部機器からの情報を取得する情報取得手段（７）を更に備え、
前記特定手段（７）は、前記情報取得手段（７）によって得られた情報に基づいて、出力する出力内容を選択する、
ことを特徴とする請求項４９に記載のオーディオ装置。
【請求項５７】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて、実行すべき音声処理の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した音声処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするオーディオ装置。
【請求項５８】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行ステップと、
より構成される、
ことを特徴とする機器制御方法。
【請求項５９】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、より構成され、
前記処理特定ステップで特定した制御が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とする機器制御方法。
【請求項６０】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行ステップと、より構成される、
ことを特徴とする音声認識方法。
【請求項６１】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とする音声認識方法。
【請求項６２】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行ステップと、
より構成される、
ことを特徴とするエージェント処理方法。
【請求項６３】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて実行すべき処理を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とするエージェント処理方法。
【請求項６４】
車両に搭載された車載機器を制御するための車載機器制御方法であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行ステップと、
より構成される、
ことを特徴とする車載機器制御方法。
【請求項６５】
車両に搭載された車載機器を制御するための車載機器制御方法であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップが特定した制御が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップは当該情報に基づいて音声を出力する、
ことを特徴とする車載機器制御方法。
【請求項６６】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定して、当該ナビゲーション処理を実行する処理実行ステップと、
より構成される、
ことを特徴とするナビゲーション方法。
【請求項６７】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定したナビゲーション処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップでは当該情報に基づいて音声を出力する、
ことを特徴とするナビゲーション方法。
【請求項６８】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、実行すべき音声処理の内容を特定して、当該音声処理を実行し、又は外部のオーディオ装置に実行させるよう当該外部のオーディオ装置を制御する処理実行ステップと、
より構成される、
ことを特徴とするオーディオ装置制御方法。
【請求項６９】
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識ステップと、
前記音声認識ステップで特定した語句に基づき、前記音声の発話者の発話内容を特定する特定ステップと、
特定した内容に基づいて、外部のオーディオ装置に実行させるべき音声処理の内容を特定する処理特定ステップと、
所定の通信装置を介して情報を取得する情報取得ステップと、
前記情報取得ステップで取得した情報に基づいて音声を出力する音声出力ステップと、
より構成され、
前記処理特定ステップで特定した音声処理が、前記情報取得ステップで取得された情報を出力するものであるとき、前記音声出力ステップで当該情報に基づいて音声を出力する、
ことを特徴とするオーディオ装置制御方法。
【請求項７０】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする機器制御装置として機能させるためのプログラム。
【請求項７１】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて、制御の対象である外部の機器に対して実行すべき制御の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする機器制御装置として機能させるためのプログラム。
【請求項７２】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とする音声認識装置として機能させるためのプログラム。
【請求項７３】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする音声認識装置として機能させるためのプログラム。
【請求項７４】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定して、当該処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とするエージェント装置として機能させるためのプログラム。
【請求項７５】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて実行すべき処理を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするエージェント装置として機能させるためのプログラム。
【請求項７６】
コンピュータを、
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定して、当該制御を実行する処理実行手段（７）と、
を備える、
ことを特徴とする車載機器制御装置として機能させるためのプログラム。
【請求項７７】
コンピュータを、
外部の車載機器を搭載した車両に搭載可能に構成された車載機器制御装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、前記車載機器に対して実行すべき制御の内容を特定する処理特定手段と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した制御が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とする車載機器制御装置として機能させるためのプログラム。
【請求項７８】
コンピュータを、
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定して、当該ナビゲーション処理を実行する処理実行手段（７）と、
を備える、
ことを特徴とするナビゲーション装置として機能させるためのプログラム。
【請求項７９】
コンピュータを、
車両に搭載可能に構成されたナビゲーション装置であって、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段と、
特定した内容に基づいて、実行すべきナビゲーション処理の内容を特定する処理特定手段と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定したナビゲーション処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするナビゲーション装置として機能させるためのプログラム。
【請求項８０】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべき音声処理の内容を特定して、当該音声処理を実行し、又は外部の機器に実行させるよう当該外部の機器を制御する処理実行手段（７）と、
を備える、
ことを特徴とするオーディオ装置として機能させるためのプログラム。
【請求項８１】
コンピュータを、
音声を表す音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句を特定する音声認識手段（２，３）と、
前記音声認識手段（２，３）が特定した語句に基づき、前記音声の発話者の発話内容を特定する特定手段（７）と、
特定した内容に基づいて、実行すべき音声処理の内容を特定する処理特定手段（７）と、
所定の通信手段（７４）を介して情報を取得する情報取得手段（７）と、
前記情報取得手段（７）が取得した情報に基づいて音声を出力する音声出力手段（５）と、
を備え、
前記処理特定手段（７）が特定した音声処理が、前記情報取得手段（７）で取得された情報を出力するものであるとき、前記音声出力手段（５）は当該情報に基づいて音声を出力する、
ことを特徴とするオーディオ装置として機能させるためのプログラム。

【図１】