説明

対話装置、プログラム及び方法

【課題】相手が子供や幼児であっても、適切な対話を行うことができるようにする。
【解決手段】音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力して対話を行うに際し、多数の単語又は語句を所定の各語彙レベル又は語彙ジャンルに対応付けた語句データを記憶し、入力される単語又は語句の語彙レベル又は語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙レベル又は語彙ジャンルを取得し(ステップS37)、出力する単語又は語句の語彙レベル又は語彙ジャンルを、前記取得される語彙レベル又は語彙ジャンルに基づいて決定し(ステップS39〜S41)、出力する単語又は語句を、前記決定される語彙レベル又は語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する(ステップS42)ようにする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話装置、プログラム及び方法に関する。
【背景技術】
【0002】
従来のカーナビゲーションシステムが有するエージェント機能は、運転者等のユーザの要求に対し、要求に見合った検索結果を導き出し、音声により検索結果を回答するものである。たとえば、音声によるナビゲーション、食事時になったことに基づくレストランの検索、目的地の情報に関する案内、外気と車内の温度差に基づく車内の温度調節の督促、渋滞中や高速道路を走行中等の運転状況を察知したときの対話相手、等の機能を行うことができる(たとえば特許文献1参照)。
【0003】
また、このようなエージェント機能を用いて行うことができるしりとりゲームも知られている。このしりとりゲームは、ユーザが発声した語句に対し、エージェントが、記憶媒体に記憶されている語句のうちから、しりとりゲームの条件に適合する語句を検索し、得られた語句を発声するというものである。検索の条件としては、しりとりゲームのルールに従い、ユーザが言った語句の最後の文字と、検索しようとする語句の初めの文字とが同一であること、及び、ゲーム中にその語句が未だ出てきていないことが適用される(たとえば特許文献2参照)。
【0004】
【特許文献1】特開平11−351901号公報
【特許文献2】実開昭59−167576号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら従来のカーナビゲーションシステムが有するエージェント機能によれば、会話の相手が主に運転者、すなわち大人であることを前提としており、また、会話の内容が運転に関することであるため、同乗者に含まれることがある幼児を相手として会話を行うには適していない。また、運転者は運転という作業を行っているので、ドライブ中に時間を持て余し、会話を必要としているのは、同乗者、特に子供であり、一人のみならず、複数人存在することもある。
【0006】
また、上述のしりとりゲームの機能によれば、しりとりゲームを行うのは、言葉をあまり知らない幼児であったり、いろいろな言葉を知っている大人であったりするが、この点の考慮がなされていない。特に、家族で出かける際には、車両中に大人と幼児が一緒に乗っている場合が多く、一緒にゲームに参加したいと望む場合があるので、問題がある。
【0007】
たとえば、従来のしりとりゲーム機能によれば、特に相手に応じた返答を行うようにはなっていないため、子供が相手である場合に、その子供が知らない言葉や語句ばかりを返してしまい、ゲームが面白くないとの印象を与えるおそれがある。また、大人が相手である場合に、誰でも知っている言葉や語句ばかりを返してしまい、ゲームが面白くないとの印象を与えるおそれがある。また、従来のしりとりゲーム機能は、一人でしか楽しむことができないようになっているため、車両内の皆が楽しめるようにはなっていない。
【0008】
本発明の目的は、上述従来技術の問題点に鑑み、対話装置において、相手が子供や幼児であっても、より適切な対話を行うことができるようにすることにある。
【課題を解決するための手段】
【0009】
上記目的を達成するため、第1の発明に係る対話装置は、音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話装置において、多数の単語又は語句を所定の各語彙レベルに対応付けた語句データを記憶する記憶手段と、入力される単語又は語句の語彙レベルとして、語句データ中の対応する単語又は語句の語彙レベルを取得する語彙レベル取得手段と、出力する単語又は語句の語彙レベルを、前記取得される語彙レベルに基づいて決定する語彙レベル決定手段と、出力する単語又は語句を、前記決定される語彙レベルのものであることを条件として語句データ中の単語又は語句のうちから選択する語句選択手段とを具備することを特徴とする。ここで、対話装置としては、たとえば、カーナビゲーションシステムに付属するものが該当する。
【0010】
この構成において、音声により単語又は語句が入力されると、入力された単語又は語句の語彙レベルとして、語句データ中の、その単語又は語句に対応する単語又は語句の語彙レベルが、語彙レベル取得手段によって取得される。取得された語彙レベルに基づき、出力する単語又は語句の語彙レベルが決定される。そして、決定された語彙レベルのものであることを条件として、語句データより単語又は語句が選択される。選択された単語又は語句は、対話装置から音声により出力されることになる。これによれば、入力される単語又は語句の語彙レベルに応じた語彙レベルの単語又は語句を出力することができる。
【0011】
第2の発明に係る対話装置は、第1発明において、語句データは単語又は語句をさらに所定の各語彙ジャンルに対応付けたものであり、対話装置はさらに、入力される単語又は語句の語彙ジャンルとして、語句データ中の対応する単語又は語句の語彙ジャンルを取得する語彙ジャンル取得手段と、出力する単語又は語句の語彙ジャンルを、前記取得される語彙ジャンルに基づいて決定する語彙ジャンル決定手段とを備え、語句選択手段は、出力する単語又は語句を選択するに際し、前記決定される語彙レベルのものであるという条件に加え、前記決定される語彙ジャンルのものであることをも条件として、その選択を行うものであることを特徴とする。
【0012】
第3の発明に係る対話装置は、第1発明において、入力される単語又は語句は、対話装置を含む各参加者が順番に単語又は語句の発言を行うことにより行われるしりとりゲーム又は連想ゲームにおける対話装置以外の各参加者による発言によって入力されるものであり、出力する単語又は語句は、前記ゲームにおける対話装置の順番において出力するものであり、対話装置はさらに、入力される単語若しくは語句について語彙レベル取得手段により取得できる語彙レベルを各参加者に対応付けて記憶する参加者データ記憶手段を備え、語彙レベル決定手段は、データ記憶手段が記憶している語彙レベルに基づき、出力する単語又は語句の語彙レベルの決定を行うものであることを特徴とする。
【0013】
第4の発明に係る対話装置は、第2発明において、入力される単語又は語句は、対話装置を含む各参加者が順番に単語又は語句の発言を行うことにより行われるしりとりゲームにおける対話装置以外の各参加者による発言によって入力されるものであり、出力する単語又は語句は、前記ゲームにおける対話装置の順番において出力するものであり、対話装置はさらに、入力される単語若しくは語句について語彙レベル取得手段及び語彙ジャンル取得手段により取得できる語彙レベル及び語彙ジャンルを各参加者に対応付けて記憶する参加者データ記憶手段を備え、語彙レベル決定手段は、データ記憶手段が記憶している語彙レベルに基づき、出力する単語又は語句の語彙レベルの決定を行うものであり、語彙ジャンル決定手段は、データ記憶手段が記憶している語彙ジャンルに基づき、出力する単語又は語句の語彙ジャンルの決定を行うものであることを特徴とする。
【0014】
第5の発明に係る対話装置は、第3発明において、語彙レベル決定手段は、データ記憶手段が記憶している語彙レベルのうち、最も低い語彙レベルから最も高い語彙レベルまでの各語彙レベルのうちからランダムに選択した語彙レベルを、出力する単語又は語句の語彙レベルとして決定するものであることを特徴とする。
【0015】
第6の発明に係る対話装置は、第4発明において、語彙ジャンル決定手段は、データ記憶手段が記憶している語彙ジャンルのうちランダムに選択したものを、出力する単語又は語句の語彙ジャンルとして決定するものであり、語彙レベル決定手段は、データ記憶手段が記憶している語彙レベルのうち、前記決定された語彙ジャンルに属する単語又は語句についての語彙レベルであって、最も低い語彙レベルから最も高い語彙レベルまでの各語彙レベルのうちからランダムに選択した語彙レベルを、出力する単語又は語句の語彙レベルとして決定するものであることを特徴とする。
【0016】
第7の発明に係る対話装置は、第3〜第6のいずれかの発明において、対話装置以外の参加者による単語又は語句の発言が所定時間なされなかった場合、その発言により提示することができる単語又は語句の例を暗示させるような所定のヒントを発声する手段を有することを特徴とする。
【0017】
第8の発明に係る対話装置は、第3又は第4発明において、語彙レベル決定手段は、語彙レベルの決定に際し、データ記憶手段が記憶している各参加者の語彙レベルのうち、対話装置の次の順番の参加者の語彙レベル、又は最も低い語彙レベルを、出力する単語又は語句の語彙レベルとして決定し、あるいは所定のタイミングで、データ記憶手段が記憶している参加者の語彙レベルよりも高い語彙レベルを、出力する単語又は語句の語彙レベルとして決定するものであることを特徴とする。
【0018】
第9の発明に係る対話装置は、第3〜第8のいずれかの発明において、語句選択手段は、選択した単語又は語句が既出語データに存在する場合には、再度選択を行うものであり、対話装置は、この再度の選択が所定回数行われた場合、又は所定のタイミングで、ゲームにおいて負けた旨のメッセージを発声し、ゲームを終了するものであることを特徴とする。
【0019】
第10の発明に係る対話装置は、音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話装置において、多数の単語又は語句を所定の各語彙ジャンルに対応付けた語句データを記憶する記憶手段と、入力される単語又は語句の語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙ジャンルを取得する語彙ジャンル取得手段と、出力する単語又は語句の語彙ジャンルを、前記取得される語彙ジャンルに基づいて決定する語彙ジャンル決定手段と、出力する単語又は語句を、前記決定される語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択手段とを具備することを特徴とする。
【0020】
第11の発明に係る対話プログラムは、音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する手順をコンピュータに実行させる対話プログラムであって、前記手順は、多数の単語又は語句を所定の各語彙レベル又は語彙ジャンルに対応付けた語句データを記憶する記憶手順と、入力される単語又は語句の語彙レベル又は語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙レベル又は語彙ジャンルを取得する取得手順と、出力する単語又は語句の語彙レベル又は語彙ジャンルを、前記取得される語彙レベル又は語彙ジャンルに基づいて決定する決定手順と、出力する単語又は語句を、前記決定される語彙レベル又は語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択手順とを具備することを特徴とする。
【0021】
第11の発明に係る対話方法は、第1発明において、音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話方法において、多数の単語又は語句を所定の各語彙レベル又は語彙ジャンルに対応付けた語句データを記憶する記憶工程と、入力される単語又は語句の語彙レベル又は語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙レベル又は語彙ジャンルを取得する取得工程と、出力する単語又は語句の語彙レベル又は語彙ジャンルを、前記取得される語彙レベル又は語彙ジャンルに基づいて決定する決定工程と、出力する単語又は語句を、前記決定される語彙レベル又は語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択工程とを具備することを特徴とする。
【発明の効果】
【0022】
本発明によれば、音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力して対話を行うに際し、多数の単語又は語句を所定の各語彙レベル又は語彙ジャンルに対応付けた語句データに基づいて、入力される単語又は語句の語彙レベル又は語彙ジャンルを取得し、これに基づいて決定した語彙レベル又は語彙ジャンルのものであることを条件として、出力する単語又は語句を、語句データから選択するようにしたため、ユーザの語彙レベル又は語彙ジャンルに応じた対話を行うことができる。したがって、たとえば、相手が子供や幼児であっても、より適切な語彙レベルや語彙ジャンルの単語又は語句を用いて対話を行うことができる。
【発明を実施するための最良の形態】
【0023】
図1は本発明の一実施形態に係るナビゲーションシステムに付随するエージェント装置(以下、単に「エージェント」という。)の主要部の構成を示すブロック図である。このエージェントは、多数の語句を語彙ジャンル及び語彙レベルで分類したデータベースを有するエージェント機能を備えており、その機能により、ユーザが話す語句をデータベース中の語句と照合して、ユーザの語彙ジャンルや語彙レベルを認識し、ユーザの語彙ジャンルや語彙レベルに合わせてゲームの相手役を行うことができるようにしたものである。ゲームとして、しりとりゲーム及び連想ゲームを行うことができるようになっている。
【0024】
同図に示すように、このエージェントは、エージェントが搭載されている車両に関する車両情報を提供するナビゲーション処理部1、エージェント機能に関する処理を行うエージェント処理部3、ゲームに関する処理を行うゲーム処理装置8を備える。これらの処理部及び装置は、処理を行うためのプログラム及びプロセッサを含んで構成される。このエージェントはさらに、運転者等のユーザの発話による音声を入力するためのマイク13、マイク13を介して入力される音声を音声信号に変換してゲーム処理装置8に供給する音声入力装置14、ゲーム処理装置8の処理結果を音声信号に変換する音声出力装置15、及び音声出力装置15からの音声信号を音声に変換して発声するスピーカ16を備える。
【0025】
ナビゲーション処理部1には、目的地データ、現在地データ、走行状況データ等の車両データ2が随時入力される。目的地データは車両の目的地を示すものである。現在地データは車両が現在走行している位置や、どのような所を走行中であるか、たとえば高速道路等を走行中であるといった情報を示すものであり、現在地検出装置により検出される。走行状況データは、車両の走行状況、たとえば渋滞の中を走行中であるといった情報を示すものであり、走行判別装置により得られる。
【0026】
エージェント処理部3は、ユーザとの会話によって得られる車両内データ4を有する。車両内データ4には、同乗者の有無、同乗者の数、同乗者は家族、友人又は恋人であるかどうか等の情報が含まれる。エージェント処理部3はまた、ゲーム用の単語を多数記憶している記録メモリデータ5を有する。
【0027】
図2は記録メモリデータ5の構成を示す。図中の「アシカ」、「アルマジロ」、「ウサギ」等は登録されている単語であり、「あ」、「い」、「う」・・・は、対応する各単語の最初の文字、「動物」・・・は、対応する各単語の語彙ジャンル、「Lv.1」〜「Lv.5」は対応する各単語の語彙レベルをそれぞれ示す。つまり各単語は、最初の文字、語彙ジャンル、及び語彙レベルにより分類して登録されている。
【0028】
各単語の最初の文字は、しりとりゲームの基本となるものである。語彙ジャンルは連想ゲームの基本となるものである。語彙レベル「Lv.1」〜「Lv.5」はレベルの低い方から高い方までレベル1(Lv.1)〜レベル5(Lv.5)の5段階に分けて、各単語を分類するものである。このレベル分けは、インターネットの検索におけるヒット数の多寡等に基づいて行うことができる。
【0029】
ちなみに、レベル1の単語としては、幼児の語彙レベルを想定し、たとえば絵本に出てくる動物の名称が登録される。レベル2の単語としては、小学生低学年の語彙レベルを想定し、たとえば動物園で見られる動物の名称が登録される。レベル3の単語としては、小学生高学年の語彙レベルを想定し、レベル1及びレベル2として登録されている名称に属するより具体的な名称が登録される。レベル4の単語としては、中高生の語彙レベルを想定し、たとえば各地域にしか住んでいない動物の名称が登録される。レベル5の単語としては、大人の語彙レベルを想定し、インターネットで検索してもあまりヒットしないような名称が登録される。
【0030】
記録メモリデータ5に対しては、随時、登録されている単語についての補充が、学習データ6の追加という形で行われる。補充はインターネット接続7を介し、最新の単語等を導入するすることにより行われる。補充はまた、ユーザの発言に基づき、記録メモリデータ5中に存在しない単語が発言された場合にはそれを補充するといったように、フィードバック的に行われる。
【0031】
ゲーム処理装置8には、参加者データ9及び既出語データ12の2種類のデータが入力される。参加者データ9には順番データ10及びレベルデータ11が含まれる。順番データ10は、ゲームへのエージェント以外の参加者(以下、単に「参加者」という。)及びエージェントの発言順番を示す。レベルデータ11は、各参加者の語彙レベルや語彙ジャンルを示す。ゲーム処理装置8はこの参加者データ9に基づき、エージェントがその発言順番において発言する単語の語彙レベルを調整することができる。
【0032】
既出語データ12には、ゲームの開始から、ゲーム中にナビゲーション装置が発言した単語及び各参加者が発言した単語が、すべて追加されてゆく。既出語データ12は、発言された単語がそのゲームにおいて既出か否かを判定するのに用いられる。
【0033】
ゲーム処理装置8は、ゲームを行うに際しては、マイク13を通して入力される参加者が発言する単語を、音声入力装置14により処理し、既出語データ12等と照合して、各ゲームのルールに沿っているか否かを判定する。ルールに反していなければ、参加者データ9に基づくゲームの語彙レベルに適合した単語を既出語データ12中の単語のうちから検索し、音声出力装置15により処理し、スピーカ16を介して発言する。
【0034】
図3及び図4はしりとりゲームを行うプログラムに従った処理を示すフローチャートである。しりとりゲームは、ステップS11において、エージェント処理部3がしりとりゲームを行うことを提案することにより、又はユーザからしりとりゲームを行うことの提案があったことに応答して開始される。
【0035】
エージェント処理部3による提案は、エージェント処理部3が、ナビゲーション処理部1において取得する車両データ(ナビゲーションデータ)やエージェント処理部3において取得する車両内データ4等に基づき、暇な時間を潰すためのゲームを行うことが必要であると判定した場合に行う。この判定は、たとえば、車両データに基づいて得られる、目的地まで遠いかどうか、渋滞に遭遇しているか否か、高速道路を走行中であるために運転が単調であるか否か等の情報や、車両内データ4に基づいて得られる、同乗者が存在するかどうか、音楽がかかっているか否か等の情報に基づいて行ことができる。
【0036】
しりとりゲームの提案があると、エージェントは、ステップS12において、ゲームへの参加者の人数をユーザに指定させる。次に、ステップS13において、指定された人数に応じ、各参加者及びエージェントの発言順番を示す順番データP1、P2、・・・Pnを、参加者データ9における順番データ10として割り当てる。このとき、エージェント自身については、任意のi番目の順番であることを示す順番データPiを割り当てる。これを完了すると、しりとりを開始する(ステップS14)。以後、参加者データ9の順番データ10が示す順番に従い、しりとりを行うことになる。
【0037】
しりとりを開始すると、まず、ステップS15において、既出語データ12をクリアする。次にステップS16において、エージェントの発言順番iが1であるか否かを判定する。1であると判定した場合にはステップS24へ進む。1ではないと判定した場合にはステップS17へ進み、参加者の発言に基づき、マイク13を介して入力される音声について音声認識を行う。次に、ステップS18において、音声認識により認識した入力単語の語頭が前回発言された単語の語尾に一致するか否かを判定する。ただし、初回の発言の場合はこの判定は行わずに直ちにステップS21に進む。ステップS18において、一致しないと判定した場合には、ステップS19において、「今の答えはだめです。」と発声し、ゲームを終了する(ステップS20)。
【0038】
ステップS18において語頭が語尾に一致すると判定した場合には、ステップS21において、入力単語についてさらに、語尾が「ん」であるかどうかを判定する。語尾が「ん」であると判定した場合にはステップS19において、「今の答えはだめです。」と発声し、ゲームを終了する(ステップS20)。
【0039】
ステップS21において語尾が「ん」ではないと判定した場合には、ステップS22において、入力単語を既出語データ12に追加する。そして、ステップS23において、入力単語に一致する単語が記録メモリデータ5に存在するか否かを判定し、一致するものがあればその語彙レベル及び語彙ジャンルを、参加者データ9における今回の発言順番の順番データ10に対応するレベルデータ11における語彙レベル及び語彙ジャンルとして記憶する。ステップS17〜S23の処理は、ステップS19に進んでゲーム終了とならない限り、エージェントの発言順番になるまで(i−1)回繰り返される。エージェントの発言順番になると、ステップS24へ進む。
【0040】
ステップS24へ進むと、エージェントによる発言の準備を行う。しかし、この時点、すなわちエージェントによる最初の発言順番の時点では、まだ発言が一巡していない場合もあるので、レベルデータ11に基づいて各参加者の語彙レベルや語彙ジャンルを認識することができないおそれがある。そこで、ステップS25において、発言する単語の語彙レベルをレベル1に設定する。次に、ステップS26において、記録メモリデータ5中の全語彙ジャンルにおけるレベル1の単語のうちから1つをランダムに選択する。
【0041】
次にステップS27において、選択した単語が既出語データ12中に存在するか否かを判定する。存在すると判定した場合には、さらにステップS28において、ステップS27の判定を所定回数行ったか否かを判定する。所定回数行ってはいないと判定した場合にはステップ26へ戻り、再度単語の選択及び既出か否かの判定を行う(ステップS26、S27)。ステップS27の判定を所定回数行ったと判定した場合には、ステップS47へ進み、「私の負けです。」との発声を行い、ゲームを終了する。
【0042】
一方、ステップS27において、選択した単語が既出語データ12中に存在しないと判定した場合には、ステップS29において、その単語を既出語データ12に追加する。そして、ステップS30において、その単語の発言を行う。
【0043】
次に、ステップS31〜S37において、上述のステップS17〜S23と同様の処理を行う。ただし、ステップS35の処理が追加されている点が異なる。したがって、ステップS31で認識した入力単語については、さらにステップS35において、既出語データ12中にすでに登録されているか否かを判定し、登録されている場合にはゲーム終了(ステップS34、S35)となり、登録されていない場合には、既出語データ12に追加登録することになる(ステップS36)。
【0044】
ステップ31〜S37の処理はステップS33へ進んでゲーム終了となる場合を除き、(n−1)回繰り返される。すなわち(n−i)回繰り返した時点で、エージェント及び各参加者についての最初の一巡が完了することになり、さらに、(i−1)回繰り返した時点で、再度、エージェントの発言順番となる。
【0045】
エージェントの発言順番が来ると、2回目の発言の準備を行う(ステップS38)。エージェントによる2回目の発言のとき、各参加者は少なくとも1回は発言を行っている。そこで、ステップS39及びS40において、それまでに参加者データ9として記憶された各参加者のレベルデータ11を参照して、そこに記憶されているいずれかの語彙ジャンルを選択し、その語彙ジャンルに対応して記憶されている各語彙レベルのうち、一番高い語彙レベルLv.A及び一番低い語彙レベルLv.Bを取得する。
【0046】
次に、ステップS41において、語彙レベルLv.A〜Lv.Bの範囲でランダムに語彙レベルを設定する。さらに、ステップS42において、記憶メモリデータ5中の選択した語彙ジャンル及び設定した語彙レベルに該当する単語のうちから1つをランダムに選択する。次に、ステップS43において、選択した単語が既出語データ12中に存在するか否かを判定する。存在しないと判定した場合にはステップ44においてその単語を既出語データ12へ追加し、ステップS45においてその単語の発言を行う。その後、ステップS31へ戻り、再びステップS31〜S37の処理を(n−1)回繰り返すことになる。
【0047】
ステップS43において、選択した単語が既出語データ12中に存在すると判定した場合には、ステップS46において、ステップS43の判定を所定回数繰り返したか否かを判定する。所定回数繰り返していないと判定した場合にはステップS41に戻り、再度単語の選択を試みる。ステップS46において、ステップS43の判定を所定回数繰り返したと判定した場合には、ステップS47に進み、「私の負けです。」との発声を行い、ゲームを終了する。
【0048】
これによれば、記録メモリデータ5において多数の単語を語彙レベルで分類して登録しておくとともに、参加者データ9において参加者の語彙レベルを記録しておき、エージェントによる単語の発言に際しては、記録メモリデータ5から参加者の語彙レベルに対応した語彙レベルの単語を選択して発言するようにしたため、大人に限らず幼児もエージェントを相手にしてしりとりゲームを楽しむことができる。また、しりとりゲームへの参加者を指定させ、指定された人数を考慮して、音声認識(ステップS17、S31)を繰り返すようにしたため、複数の参加者によりエージェントを含むしりとりゲームを楽しむことができる。また、記録メモリデータ5において各種単語を語彙ジャンルで分類して登録しておくとともに、参加者データ9において参加者の語彙ジャンルを記録しておき、ナビゲーション装置による単語の発声に際しては、参加者データ9の語彙ジャンルを考慮して記録メモリデータ5中の単語を選択し(ステップS42)、発言するようにしたため、参加者の語彙ジャンルに合わせてしりとりゲームの相手を行うことができる。
【0049】
図5及び図6は連想ゲームを行うプログラムに従った処理を示すフローチャートである。基本的には処理の流れはしりとりゲームの場合と同様である。図3及び図4の各ステップと同一の処理を行うステップには同一のステップ番号を付してある。
【0050】
すなわち、連想ゲームはしりとりゲームの場合と同様にして連想ゲームを行うことの提案があったときに開始される(ステップS51)。ゲームの提案があると、エージェントはしりとりゲームの場合と同様にして、参加者人数の指定の受入れ(ステップS12)及び順番データPiの割当て(ステップS13)を行い、連想ゲームを開始する(ステップS52)。
【0051】
連想ゲームを開始すると、既出語データ12をクリアしてから(ステップS15)、ステップS53において、今回の連想ゲームで対象とする語彙ジャンルの参加者による指定を受け入れる。この後、しりとりゲームの場合と同様に、エージェントの発言順番iに関する判定(ステップS16)の結果に応じ、ステップS17又はS24へ進む。
【0052】
ステップS17〜S23の処理は、しりとりゲームの場合と同様に、ステップS19に進んでゲーム終了とならない限り、エージェントの発言順番になるまで(i−1)回繰り返される。ただし、ステップS17で認識した入力単語の適否の判定は、しりとりゲームの場合と異なり、入力単語がステップS53で指定された語彙ジャンルのものに該当するか否かにより行う(ステップS54)。しりとりゲームの場合と同様に、該当しない場合はゲームを終了し(ステップS19、S20)、該当する場合は既出語データ12への追加(ステップS22)、及び参加者データ9への書込みを行う(ステップS23)。
【0053】
ステップS24へ進むと、エージェントによる発言の準備を行うが、発言する単語の語彙レベルをレベル1に設定(ステップS25)した後の記録メモリデータ5からの単語のランダムな選択は、しりとりゲームの場合とは異なり、ステップ53で指定された語彙ジャンルに該当する単語のうちから行う(ステップS55)。この後、しりとりゲームの場合と同様にして、既出か否かの判定(ステップS27)、及びステップS27の判定を所定回数行ったか否かの判定(ステップS28)の結果に応じ、ステップS55の処理を繰り返し、又はステップS29へ進み、若しくはステップS47へ進んでゲームを終了する。
【0054】
ステップS29へ進むと、しりとりゲームの場合と同様に、選択した単語について、既出語データ12への追加(ステップS29)及び発言(ステップS30)を行う。この後さらに、ステップS31〜S37において、上述のステップS17〜S23と同様の処理を行う。この場合もステップS31で認識した入力単語の適否の判定は、しりとりゲームの場合と異なり、入力単語がステップS53で指定された語彙ジャンルのものに該当するか否かにより行う(ステップS56)。ステップS31〜S37の処理は、しりとりゲームの場合と同様に、ステップS33へ進んでゲーム終了となる場合を除き、エージェントの発言順番となるまで、(n−1)回繰り返される。
【0055】
エージェントの発言順番になると、2回目の発言の準備を行うが(ステップS38)、一番高い語彙レベルLv.A及び一番低い語彙レベルLv.Bの取得は、しりとりゲームの場合とは異なり、レベルデータ11中のすべての語彙レベルを対象として行う(ステップS57)。レベルデータ11中の語彙レベルに対応する語彙ジャンルは、すべてステップS53で指定された語彙ジャンルと同一だからである。
【0056】
次に、語彙レベルLv.A〜Lv.Bの範囲でランダムに語彙レベルを設定(ステップS41)した後、発言すべき単語として、設定した語彙レベルに該当するもののうちから1つをランダムに選択するが(ステップ58)、この選択に際しては、しりとりゲームの場合とは異なり、選択される単語がステップS53で指定された語彙ジャンルのものであることが、さらに選択の条件とされる。
【0057】
この後、しりとりゲームの場合と同様に、選択した単語についての既出か否かの判定結果に応じ(ステップS43)、既出語データ12への追加(ステップS44)及び発言を行ってステップ31に戻り、又はステップS43の判定を所定回数繰り返したか否かの判定結果にに応じ(ステップS46)、ステップ41に戻り、若しくは「私の負けです。」と発声して(ステップS47)ゲームを終了する。
【0058】
これによれば、しりとりゲームの場合と同様に、参加者の語彙レベルに対応した語彙レベルの単語を選択して発言するようにしたため、大人に限らず幼児もエージェントを相手にして連想ゲームを楽しむことができる。また、連想ゲームへの参加者を指定させ、指定された人数を考慮して、音声認識(ステップS17、S31)を繰り返すようにしたため、複数の参加者によりナビゲーションエージェントを含む連想ゲームを楽しむことができる。
【0059】
なお、本発明は上述実施形態に限定されることなく、適宜変形して実施することができる。たとえば、上述においては特に言及しなかったが、参加者による単語の発言が所定時間なされなかった場合、その発言により提示することができる単語の例を暗示させるような所定のヒントを発声するようにしてもよい。たとえば、ステップS17やS31の音声認識を所定時間行うことができなかった場合、提示することができる単語の例を構成する文字のうちのいずれかを省略した発声を行うことにより、ヒントとすることができる。具体的には、提示することができる単語の例が記録メモリデータ5中の「カラス」であるとすれば、「カ*ス」(*はビープ音等を意味する。)と発声することにより、ヒントとすることができる。このヒントの発声を行った後、再度、参加者の発言を待ち、ステップS17やS31の音声認識を行う。
【0060】
また、ステップS40(図4)やステップS57(図6)においては、参加者全員の語彙レベルに基づいて最大語彙レベルLv.A及び最小語彙レベルLv.Bを取得し、Lv.A〜Lv.Bの範囲内の語彙レベルを、発言する単語の語彙レベルとして設定するようにしているが、この代わりに、エージェントの次の順番の参加者の語彙レベルを、発言する単語の語彙レベルとして設定するようにしてもよい。あるいは、参加者のうちの最も語彙レベルが低い人に合わせるようにしてもよい。すなわち、発言する単語の語彙レベルをLv.Bに設定するようにしてもよい。さらには所定の頻度で、若しくはランダムに、参加者の語彙レベルよりも高い語彙レベルの単語を発言するようにしてもよい。
【0061】
また、上述においては、選択した単語が既出語データ12中に存在しない旨の判定が所定回数繰り返された場合のみ、エージェントが負けるようにしているが(ステップS28、S46)、この代わりに、あるいはこれに加え、所定の頻度で、若しくはランダムに、エージェントが負けるようにしてもよい。
【0062】
また、上述においては、ゲームを行う場合について述べたが、これに限らず、ゲーム以外の会話においても、話者の語彙レベルを考慮して選択した語句を用いるようにすることができる。このためには、記録メモリデータ5と同様に、多数の単語や語句を所定の各語彙レベルに対応付けて語句データとして記憶しておく。そして、ステップS23及びS37と同様に、入力される単語又は語句の語彙レベルとして、語句データ中の対応する単語又は語句の語彙レベルを取得し、ステップS41と同様に、出力する単語又は語句の語彙レベルを、取得した語彙レベルに基づいて決定し、ステップS42及びS58と同様に、出力する単語又は語句を、決定した語彙レベルのものであることを条件として語句データ中の単語又は語句のうちから選択するようにすればよい。語彙ジャンルについても、同様にして、話者の語彙ジャンルを考慮し、選択した語句を用いて会話を行うようにすることができる。
【図面の簡単な説明】
【0063】
【図1】本発明の一実施形態に係るエージェントの主要部の構成を示すブロック図である。
【図2】図1のエージェントにおける記録メモリデータの構成を示す図である。
【図3】図1のエージェントにおける、しりとりゲームを行う場合の処理を示すフローチャートである。
【図4】図3の処理に引き続く処理を示すフローチャートである。
【図5】図1のエージェントにおける、連想ゲームを行う場合の処理を示すフローチャートである。
【図6】図5の処理に引き続く処理を示すフローチャートである。
【符号の説明】
【0064】
1:ナビゲーション処理部、2:車両データ、3:エージェント処理部、4:車両内データ、5:記録メモリデータ、6:学習データ、7:インターネット接続、8:ゲーム処置装置、9:参加者データ、10:順番データ、11:レベルデータ、12:既出語データ、13:マイク、14:音声入力装置、15:音声出力装置、16:スピーカ。


【特許請求の範囲】
【請求項1】
音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話装置において、
多数の単語又は語句を所定の各語彙レベルに対応付けた語句データを記憶する記憶手段と、
入力される単語又は語句の語彙レベルとして、前記語句データ中の対応する単語又は語句の語彙レベルを取得する語彙レベル取得手段と、
出力する単語又は語句の語彙レベルを、前記取得される語彙レベルに基づいて決定する語彙レベル決定手段と、
出力する単語又は語句を、前記決定される語彙レベルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択手段とを具備することを特徴とする対話装置。
【請求項2】
前記語句データは前記単語又は語句をさらに所定の各語彙ジャンルに対応付けたものであり、
対話装置はさらに、入力される単語又は語句の語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙ジャンルを取得する語彙ジャンル取得手段と、
出力する単語又は語句の語彙ジャンルを、前記取得される語彙ジャンルに基づいて決定する語彙ジャンル決定手段とを備え、
前記語句選択手段は、出力する単語又は語句を選択するに際し、前記決定される語彙レベルのものであるという条件に加え、前記決定される語彙ジャンルのものであることをも条件として、その選択を行うものであることを特徴とする請求項1に記載の対話装置。
【請求項3】
入力される単語又は語句は、対話装置を含む各参加者が順番に単語又は語句の発言を行うことにより行われるしりとりゲーム又は連想ゲームにおける対話装置以外の各参加者による発言によって入力されるものであり、
出力する単語又は語句は、前記ゲームにおける対話装置の順番において出力するものであり、
対話装置はさらに、入力される単語若しくは語句について前記語彙レベル取得手段により取得できる語彙レベルを各参加者に対応付けて記憶する参加者データ記憶手段を備え、
前記語彙レベル決定手段は、前記データ記憶手段が記憶している語彙レベルに基づき、出力する単語又は語句の語彙レベルの決定を行うものであることを特徴とする請求項1に記載の対話装置。
【請求項4】
入力される単語又は語句は、対話装置を含む各参加者が順番に単語又は語句の発言を行うことにより行われるしりとりゲームにおける対話装置以外の各参加者による発言によって入力されるものであり、
出力する単語又は語句は、前記ゲームにおける対話装置の順番において出力するものであり、
対話装置はさらに、入力される単語若しくは語句について前記語彙レベル取得手段及び語彙ジャンル取得手段により取得できる語彙レベル及び語彙ジャンルを各参加者に対応付けて記憶する参加者データ記憶手段を備え、
前記語彙レベル決定手段は、前記データ記憶手段が記憶している語彙レベルに基づき、出力する単語又は語句の語彙レベルの決定を行うものであり、
前記語彙ジャンル決定手段は、前記データ記憶手段が記憶している語彙ジャンルに基づき、出力する単語又は語句の語彙ジャンルの決定を行うものであることを特徴とする請求項2に記載の対話装置。
【請求項5】
前記語彙レベル決定手段は、前記データ記憶手段が記憶している語彙レベルのうち、最も低い語彙レベルから最も高い語彙レベルまでの各語彙レベルのうちからランダムに選択した語彙レベルを、出力する単語又は語句の語彙レベルとして決定するものであることを特徴とする請求項3に記載の対話装置。
【請求項6】
前記語彙ジャンル決定手段は、前記データ記憶手段が記憶している語彙ジャンルのうちランダムに選択したものを、出力する単語又は語句の語彙ジャンルとして決定するものであり、
前記語彙レベル決定手段は、前記データ記憶手段が記憶している語彙レベルのうち、前記決定された語彙ジャンルに属する単語又は語句についての語彙レベルであって、最も低い語彙レベルから最も高い語彙レベルまでの各語彙レベルのうちからランダムに選択した語彙レベルを、出力する単語又は語句の語彙レベルとして決定するものであることを特徴とする請求項4に記載の対話装置。
【請求項7】
対話装置以外の参加者による単語又は語句の発言が所定時間なされなかった場合、その発言により提示することができる単語又は語句の例を暗示させるような所定のヒントを発声する手段を有することを特徴とする請求項3〜6のいずれか1項に記載の対話装置。
【請求項8】
前記語彙レベル決定手段は、前記語彙レベルの決定に際し、前記データ記憶手段が記憶している各参加者の語彙レベルのうち、対話装置の次の順番の参加者の語彙レベル、又は最も低い語彙レベルを、出力する単語又は語句の語彙レベルとして決定し、あるいは所定のタイミングで、前記データ記憶手段が記憶している参加者の語彙レベルよりも高い語彙レベルを、出力する単語又は語句の語彙レベルとして決定するものであることを特徴とする請求項3又は4に記載の対話装置。
【請求項9】
前記語句選択手段は、選択した単語又は語句が前記既出語データに存在する場合には、再度選択を行うものであり、対話装置は、この再度の選択が所定回数行われた場合、又は所定のタイミングで、前記ゲームにおいて負けた旨のメッセージを発声し、ゲームを終了するものであることを特徴とする請求項3〜8のいずれか1項に記載の対話装置。
【請求項10】
音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話装置において、
多数の単語又は語句を所定の各語彙ジャンルに対応付けた語句データを記憶する記憶手段と、
入力される単語又は語句の語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙ジャンルを取得する語彙ジャンル取得手段と、
出力する単語又は語句の語彙ジャンルを、前記取得される語彙ジャンルに基づいて決定する語彙ジャンル決定手段と、
出力する単語又は語句を、前記決定される語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択手段とを具備することを特徴とする対話装置。
【請求項11】
音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する手順をコンピュータに実行させる対話プログラムであって、
前記手順は、多数の単語又は語句を所定の各語彙レベル又は語彙ジャンルに対応付けた語句データを記憶する記憶手順と、
入力される単語又は語句の語彙レベル又は語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙レベル又は語彙ジャンルを取得する取得手順と、
出力する単語又は語句の語彙レベル又は語彙ジャンルを、前記取得される語彙レベル又は語彙ジャンルに基づいて決定する決定手順と、
出力する単語又は語句を、前記決定される語彙レベル又は語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択手順とを具備することを特徴とする対話プログラム。
【請求項12】
音声により単語又は語句が入力されたことに応答して、所定の単語又は語句を音声により出力する対話方法において、
多数の単語又は語句を所定の各語彙レベル又は語彙ジャンルに対応付けた語句データを記憶する記憶工程と、
入力される単語又は語句の語彙レベル又は語彙ジャンルとして、前記語句データ中の対応する単語又は語句の語彙レベル又は語彙ジャンルを取得する取得工程と、
出力する単語又は語句の語彙レベル又は語彙ジャンルを、前記取得される語彙レベル又は語彙ジャンルに基づいて決定する決定工程と、
出力する単語又は語句を、前記決定される語彙レベル又は語彙ジャンルのものであることを条件として前記語句データ中の単語又は語句のうちから選択する語句選択工程とを具備することを特徴とする対話方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2006−330629(P2006−330629A)
【公開日】平成18年12月7日(2006.12.7)
【国際特許分類】
【出願番号】特願2005−157941(P2005−157941)
【出願日】平成17年5月30日(2005.5.30)
【出願人】(000003595)株式会社ケンウッド (1,981)
【Fターム(参考)】