説明

音声発生及び認識装置

【課題】MP3などの音声圧縮方法等により予め作成した種々の会話のデータを、好きな音声に置換し、センサにより簡便に会話モードを適選設定して、当該モードでの対話型の会話を行うことができる音声発生及び認識装置を提供する。
【解決手段】
音声発生及び認識装置に、書き換え可能な記憶手段と、音声入力手段と、MP3などの音声圧縮方法等により予め作成した種々の会話データの入力手段と、音声認識手段と、声紋分析置換手段と、筐体の状態を検出する少なくとも1つのセンサとを設けた構成とした

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予め作成した各種会話データのセリフを適選した音声で発生させることができ、該セリフに対する対話型の各種会話を簡便に切替えて行えるようにした音声発生装置に関するものである。
【背景技術】
【0002】
従来から、本体に内設されたROM等のメモリーに予め記録されている音声発生データを元にセリフを発生し、該セリフに対して、前記本体に内設された音声認識装置を利用して会話を行えるようにした人形やロボットなどが知られている。例えば、B社が販売している音声認識人形玩具「プリモプエル」などがある。一方、特開2001−162055号には、予めお母さんやお父さんなどの声を録音しておく録音手段及び該音声を再生する再生手段が内蔵された音声再生人形玩具が開示されている。
【0003】
これらの人形には接触動作や状態を感知するセンサが内蔵されていて、例えば、人形本体を寝かせると状態を感知し、該状態に対し予め設定記録されているセリフを発生するようになっている。そして、このような会話を通しコミュニケーションや学習などができるとしている。
【0004】
しかしながら、前記の本体に内設されたROM等のメモリーに予め記録されている音声発生データを元にしたセリフを発生し、該セリフに対して、前記本体に内設された音声認識装置を利用した対話型の会話を行えるようにした人形やロボットは、合成音声による単一音声での発生であるため、会話に対する興味を長時間持続させることが、特に、幼児には難しい。また、前記の特開2001−162055号に開示されている音声再生人形玩具は、人形本体に内蔵された録音再生手段により予め録音していたお母さんやお父さんなどの音声を聞くことが出来るものであるが、対話型の会話でなく人形のセリフを一方的に聞かせるものであるため、やはり、興味を長時間持続させることが、特に、幼児には難しい。さらに、これらの会話が単種類の会話(モード)であることも興味を持続させることを難しくしている。このため充分なコミュニケーションや学習などの効果を与えることが難しいものであった。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2001−162055号
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明が目的とするところは、興味を長時間持続させ集中力を継続させることができ充分なコミュニケーションや学習などの効果を高め、汎用的で効率よく安価に作るることができる音声発生装置を提供することにある。
【課題を解決するための手段】
【0007】
上記課題を達成するために本発明の第1実施例は、CPUを備えた制御手段10と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域21等を備えた記憶領域20と、音声を入力するための音声入力手段30と、MP3等の音声圧縮方式で作成した会話モードデータを前記会話データ記憶領域21に記憶するための会話データ入力手段40と、前記音声入力手段30により入力したセリフを前記会話データ記憶領域21に予め記憶されている各種の会話モードデータの中より検索し判定する音声認識手段50と、前記手段等を内設している筐体(本体)の状態を検出する少なくとも1つのセンサ60と、前記制御手段10により決定されたセリフを発生するための音声発生手段70と、を備えている。そして、当該センサ60が検出した筐体の状態の信号に基づいて該筐体の状態モード
(M1〜MjよりMx)を判定し、判定した状態モード(Mx)に対して、前記会話データ記憶領域21内に予め記憶されている会話モードファイル(MFx)の〈案内や質問等のセリフデータファイル(DFx0)に基づくセリフ〉を前記音声発生手段70より発生させ、該セリフに対して前記音声入力手段30を介し使用者が入力した応答の音声〈Q〉を、前記音声認識手段50により会話モードファイル(MFx)の中に予め記憶されているセリフデータファイル(DFx1〜DFxi)から検索し、セリフデータファイル(DFxy)のキーワード(Q)と認識された場合、〈当該セリフデータファイル(DFxy)に基づく説明や解答等のセリフと次の案内や質問等のセリフ〉を発生させ、さらに該当する新たな案内や質問等のセリフに対し使用者が応答する。との工程を順次繰返し実行できることを特徴とする音声発生装置としている。
【0008】
上記課題を達成するために本発明の第2実施例は、CPUを備えた制御手段10と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域21等を備えた記憶領域20と、音声を入力するための音声入力手段30と、MP3等の音声圧縮方式で作成した会話モードデータを前記会話データ記憶領域21に記憶させるための会話データ入力手段40と、前記音声入力手段30により入力したセリフを前記会話データ記憶領域21に予め記憶されている各種の会話モードデータの中より検索し判定する音声認識手段50と、前記音声入力手段30によって適選入力した音声の声紋を分析して前記のMP3等の音声圧縮方式で作成し記憶されている会話モードデータを当該声紋の音声に置換するための声紋分析置換手段80と、前記制御手段10により決定されたセリフを該声紋分析置換手段80で置換された音声で発生するための音声発生手段70と、を備えている。そして、前記会話データ記憶領域21に予め記憶されている〈問診や案内等のセリフデータファイルに基づくセリフ〉を、前記声紋分析置換手段80で分析され音声モードファイルに記録されている適選した音声のデータを元に当該適選音声に置換して音声発生手段70より発生させ、該セリフに対し前記音声入力手段30を介し使用者が入力した応答の音声〈R〉を、前記音声認識手段50により予め記憶されているセリフデータファイルから検索し、セリフデータファイル(DFr)のキーワード(R)と認識された場合、〈当該セリフデータファイル(DFr)に基づく問診や案内等のセリフと次の問診や案内等に関するセリフ〉を発生させ、該新たな案内や質問等のセリフに使用者が応答する。との工程を順次繰返し実行することで目的とする解答や結果などを得ることができることを特徴とする音声発生装置としている。
【0009】
上記課題を達成するために本発明の第3実施例は、CPUを備えた制御手段10と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域21等を備えた記憶領域20と、音声を入力するための音声入力手段30と、MP3等の音声圧縮方式で作成した会話モードデータを前記会話データ記憶領域21に記憶させるための会話データ入力手段40と、前記音声入力手段30により入力した言葉を前記会話データ記憶領域21に予め記憶されている各種の会話モードデータの中より検索し判定する音声認識手段50と、前記手段等を内設している筐体(本体)の状態を検出する少なくとも1つのセンサ60と、前記音声入力手段30によって適選入力した音声の声紋を分析し前記のMP3等の音声圧縮方式で作成し記憶されている会話モードデータを当該声紋の音声に置換させるための声紋分析置換手段80と、前記制御手段10により決定されたセリフを該声紋分析置換手段80で置換された音声で発生するための音声発生手段70と、を備えている。そして、当該センサ60が検出した筐体の状態の信号に基づいて該筐体の状態モードを判定し、判定した状態モードに対して、前記会話データ記憶領域21の中の〈セリフデータファイルに基づく質問や問診等のセリフ〉を、前記声紋分析置換手段80で分析され音声モードファイルに記録されている適選した音声のデータを元に当該適選音声に置換して音声発生手段70より発生させ、該セリフに対し前記音声入力手段30を介し使用者が入力した応答の音声〈S〉を、前記音声認識手段50により予め記憶されているセリフデータファイルから検索し、セリフデータファイル(DFs)のキーワード(S)と認識された場合、〈当該セリフデータファイル(DFs)に基づく問診や案内等のセリフと次の問診や案内等に関する〉セリフを発生させ、該当する新たな案内や質問等のセリフに使用者が応答する。との工程を順次繰返し実行することで目的とする解答や効果などを得られるようにしていることを特徴とする音声発生装置としている。
【発明の効果】
【0010】
本発明による音声発声装置によれば、予め作成した各種の会話モードデータを筐体に設置した会話データ入力手段40を介して会話データ記憶領域21に記録させることができ、会話モードを筐体内に設置したセンサに選択させ、該選択された会話モードのセリフデータファイルに基づく質問や問診等のセリフとの対話型会話を順次繰返し実行することができる。さらに、記録されている会話モードデータを声紋認識手段により適選した音声に置換させることができることから、好きな音声との各種の対話型会話を簡便に切替えて行うことができる。以上のような機能を可能とする構成としたことにより、興味を長時間持続させ集中力を継続させることができ、充分なコミュニケーションや学習などの効果を、高い汎用性で効率よく安価に与えることができる音声発生装置を提供できる。
【図面の簡単な説明】
【0011】
【図1】本発明の第1実施例の音声発生及び認識装置の電気的な構成を示すブロック図である。
【図2】本発明の第1実施例を適用したサイコロ型会話学習機の斜視概観図である。
【図3】本発明の第1実施例を適用したキャラクタ型旅行ガイド機の電気的な構成を示すブロック図である。
【図4】本発明の第2実施例の音声発生及び認識装置の電気的な構成を示すブロック図である。
【図5】本発明の第2実施例を適用したドクター人形型会話診断機の正面概観図である。
【図6】本発明の第3実施例の音声発生及び認識装置装置の電気的な構成を示すブロック図である。
【図7】本発明の第3実施例を適用したスタンド型会話学習機の正面概観図である。
【発明を実施するための形態】
【実施例1】
【0012】
図1は本発明の第1実施例その1に係るサイコロ(正6面体)型会話学習機を構成する音声発生装置の電気的な構成を示すブロック図であり、図2は当該サイコロ型会話学習機の斜視概観図である。以下、本発明の第1実施例に係るサイコロ型会話学習機について説明する
【0013】
図1に示されるように、当該サイコロ(正6面体)型会話学習機は、電源スイッチ111を有する3本の単3電池を搭載した電源110と、CPUを備えた制御手段10と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域21とRAMやROM等の記憶手段などで構成した基本的な制御プログラム等を記憶しておくためのプログラム記憶領域22とを備えた記憶領域20と、音声を入力するための音声入力手段30と、MP3等の音声圧縮方式で作成した会話モードデータを前記会話データ記憶領域21に記憶させるための会話データ入力手段40と、前記音声入力手段30により入力した言葉を前記会話データ記憶領域21に予め記憶されている各種の会話モードデータの中より検索し判定する音声認識手段50と、前記手段等を内設している筐体(本体の上面が6面のどの面(状態モード)であるかを検出するための方向センサ60と、当該センサ60で検出された面(状態モード)を示すための表示灯120と、該センサにより自動設定された状態モードをマニュアルでリセット或いは他の状態モードに変更するためのリセット/モード変更スイッチ112と、前記制御手段のメインスイッチ113と、前記制御手段10により決定されたセリフを発生する音声発生手段70と、を備えている。
【0014】
以上の構成による本実施例におけるサイコロ(正6面体)型会話学習機は、“日本語”と“中国語”と“英語語”と“韓国語”と“仏語”と“独語”との六カ国語の語学学習機として、サイコロの各面が状態モード(M1〜M6)にそれぞれ対応するように初期設定されている。
ここで、本例は以上のような国の語学学習機として初期設定されているが、例えば、“仏語”の会話モードデータに換えて、MP3等の音声圧縮方式で作成した“伊語”の会話モードデータを会話データ入力手段40と通して前記会話データ記憶領域21に記憶させることで、“伊語”の語学学習を可能とできる。さらに、同じ語学学習、例えば、“中国語”の学習でも、“初級版”、“中級版”、“上級版”と難易度など内容を換えた種種の会話モードデータを記憶させての学習も可能とできる。
【0015】
以下では、前記サイコロ型会話学習機による会話学習への使用例について説明する。
図2において、当該サイコロ型会話学習機の筐体内に内設されている電源110の電源スイッチ111(図示せず)がオンの状態で、図示されていない背面に潜設されているメインスイッチをオンする。この際に、図2に示すように”日本国旗”を上面とした状態で10秒間保持すると、筐体内に内設されている方向センサ60により検出された筐体の状態信号に基づいて“日本語モード(M1)にある。”と判定され、”日本国旗”面に設置されている表示灯120が点灯される。さらに、該日本語モード(M1)に対して、前記会話データ記憶領域21の中の会話モードファイル(MF1〜MF6)領域に予め記憶されている日本語会話モードファイル:MF1の中の質問案内セリフデータファイル(DF10)に基づく初期セリフ:「これから挨拶のことばを学習します。朝起きたときの挨拶は、“おはようございます”と”こんにちは”のどちらですか。」が、図2の筐体内部に備えられている前記音声発生手段70より発生され筐体表面の音声通過ホール130を通して該筐体外部に伝えられる。この初期セリフに対して、使用者が、「おはようございます」とのセリフを応答すると、該応答音声は音声通過ホール130を通して図2の筐体内部に備えられている音声入力手段30に入力される。そして、音声認識手段50で認識された該応答音声が制御手段10より正しい応答と判断されると、次のセリフデータDF11に基づくセリフ:「御昼の挨拶は、“こんばんわ”と”こんにちは”のどちらですか。」が、前記音声発生手段70より発生され該筐体外部に伝えられる。
一方、例えば、「さようなら」などの間違った応答をする或いは5秒以上何も応答しないと同じセリフ:本例では、「これから挨拶のことばを学習します。朝起きたときの挨拶は、“おはようございます”と”こんにちは”のどちらですか。」が発生される。
以上のような会話を、会話データ記憶領域21の中の会話モードファイル(MF1〜MF6)領域に予め記憶されている日本語会話モードファイル:MF1の中のセリフデータファイルDF1iに相当する数の各種の会話学習を行うことができる(本例では、DF10〜DF1300に300種類が設定されている)。
ここで、本例ではメインスイッチをオンした後に状態を10秒間保持すると語学モードが判定されるようにプログラム設定しているが、該時間に限定されるものでなく 例えば、5秒、1分など制御プログラムに予め適選設定しておくことができる。同じく、本例では応答待ち時間を5秒としているが、該時間に限定されるものでなく 例えば、10秒、1分など制御プログラムに予め適選設定しておくことができる。
また、本例におけるサイコロ(正6面体)型会話学習機は、メインスイッチをオンした後に語学モードが判定される間に(本例設定は10秒)、図示されていない背面に潜設されているリセット/モード変更スイッチ112を使い状態モードを変更できるように構成している。例えば、当該リセット/モード変更スイッチ112を1回押すことで日本語モード(M1)から中国語モード(M2)に変更できる。さらに、判定された会話モード、例えば英語モード(M3)の会話を開始している際に、該リセット/モード変更スイッチ112を使うことで該英語モード(M3)の英語会話モードファイル:MF3の中の初期セリフデータファイル(DF30)に戻すことができる。
【0016】
以上の本発明の第1実施例に係るサイコロ型会話学習機で構成した音声発生装置により、6カ国の対話型の会話学習を簡便に切替え行うことができるので興味を長時間持続させ集中力を継続させることができる。以上より、充分な学習などの効果を与えることが可能な音声発声装置を提供できる。
【0017】
ここで、以上では本発明の第1実施例に係るサイコロ(正6面体)型会話学習機で構成した音声発生装置について説明したが、同記載内容から明らかなように本発明の第1実施例に係る装置の形態はサイコロ(正6面体)型に限定されるものでなく、また、正面体に限定されるものでない。例えば、4面体、7面体などの多面体として構成することも可能であり、携帯電話などの機器に本発明の第1実施例に係る機能と構成を搭載することも可能である。さらに、センサも方向センサに限定されるものでなく、例えば、携帯電話にGPSセンサを搭載させることで、各国の空港に入ると自動的に該国の会話や辞書となる音声発生装置として構成することもできる。
【0018】
図3に示す装置は、センサとしてGPSを搭載させたキャラクタ型旅行ガイド機として構成したものであり、例えば、フランスのドゴール空港に到着するとGPSセンサによりフランスの旅行ガイドが自動的に選択され、さらに、フランスに居ることを示す表示灯120が点灯されてフランス関する会話型の観光ガイドが可能となる。
【実施例2】
【0019】
図4は本発明の第2実施例に係るドクター人形型会話診断機を構成する音声発生装置の電気的な構成を示すブロック図であり、図5は当該ドクター人形型会話診断機の正面概観図である。以下、本発明の第2実施例に係るドクター人形型会話診断機について説明する
【0020】
図4に示されるように、当該ドクター人形型会話診断機は、6VのACアダプタの電源110と、CPUを備えた制御手段10と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域21とRAMやROM等の記憶手段などで構成した基本的な制御プログラム等を記憶しておくためのプログラム記憶領域22とを備えた記憶領域20と、音声を入力するための音声入力手段30と、MP3等の音声圧縮方式で作成した会話モードデータを前記会話データ記憶領域21に記憶させるための会話データ入力手段40と、前記音声入力手段30により入力した言葉を前記会話データ記憶領域21に予め記憶されている各種の会話モードデータの中より検索し判定する音声認識手段50と、前記音声入力手段30によって適選入力した音声の声紋を分析して前記のMP3等の音声圧縮方式で作成し記憶されている会話モードデータを当該声紋の音声に置換するための声紋分析置換手段80と、会話プログラムに基づき点灯される表示灯120と、診断モードをマニュアルでリセット或いは他の診断モードに変更するためのリセット/モード変更スイッチ112と、前記制御手段のメインスイッチ113と、前記制御手段10により決定されたセリフを発生する音声発生手段70と、を備えている。
【0021】
上記構成による本実施例におけるドクター人形型会話診断機は、小児症状の問診を対話型で行える診断機として初期設定されている。
ここで、本例は小児症状の問診診断機としてとして初期設定されているが、本発明の構成から明らかなように、必要な診断科目の問診会話モードデータをMP3等の音声圧縮方式で作成し会話データ入力手段40を通し会話データ記憶領域21に記憶させておくことで、必要とされる科目の診断ができる。例えば、
“漢方診断”の問診会話モードデータを作成して前記会話データ記憶領域21に記憶させておくことで、“漢方診断”の対話型診断機とできる。さらに、診断以外にも、使用目的に応じた会話モードデータを作成して前記会話データ記憶領域21に記憶させておくことで、例えば、会社の受付を対話型で行う人形型受付案内機などとして構成することもできる。
【0022】
以下では、ドクター人形型会話診断機による小児症状の問診診断への使用例について説明する。
図3において、当該ドクター人形型会話診断機の背面に潜設されているメインスイッチ113をオンすると、前記会話データ記憶領域21の中の会話モードファイル領域に予め記憶されている小児問診会話モードファイル(MFp)の問診サブ会話モードファイ(MFp0〜MFpi)内の症状選択サブ会話モードファイル(MFp0)の症状選択セリフ第1データファイル(DFp01)に基づく第1症状選択セリフ:「どのような症状か教えてください。“発熱がありますか?”、“咳が出ますか?”、“吐きますか?”、“他の症状ですか?”」が、ドクター人形型会話診断機の筐体内部に備えられている前記音声発生手段70より発生されて当該筐体表面の音声通過ホール130を通し該筐体外部に伝えられ、同時に、ドクター人形の両眼にそれぞれ設置されている表示灯120が交互に点灯される。
該第1症状選択セリフに対し、受診者(例えば小児の母親)が、「吐きます。」とのセリフを応答すると、該応答音声は音声通過ホール130を通り前記筐体内部に備えられている音声入力手段30に入力される。同時に前記表示灯121は消灯される。そして、該応答音声が音声認識手段50で
“吐く”と判定されると、“吐く”をキーワードとする問診サブ会話モードファイル(MFp3)に記憶されている問診サブセリフデータファイル(DFp31)に基づく問診セリフ:「吐いても“比較的元気ですか?”、“元気ありませんか?”」が、音声発生手段70より発生され、同時に、ドクター人形の両眼にそれぞれ設置されている表示灯120が交互に点灯される。該問診セリフに対し、受診者が、例えば「元気ありません。」とのセリフを応答すると、該応答音声は音声入力手段30に入力され音声認識手段50で
“元気なし”と判定される。同時に前記表示灯120は消灯される。次に“元気なし”をキーワードとする問診サブ会話モードファイル(MFp3)に記憶されている問診サブセリフデータファイル(例えば、DFp311)に基づく問診セリフ:「
“熱はありますか?”、“熱はありませんか?”、“意識がおかしいですか?”」が、音声発生手段70より発生され、同時に、ドクター人形の両眼にそれぞれ設置されている表示灯120が交互に点灯される。さらに、該問診サブセリフデータファイル(DFp311))に基づく問診セリフに対し、受診者が、例えば「熱があります。」とのセリフを応答し、該応答音声が音声認識手段50で
“熱あり”と判定されると、“熱あり”をキーワードとする問診サブ会話モードファイル(MFp3)に記憶されている問診サブセリフデータファイル(例えば、DFp323)に基づく問診セリフ:「
“その他の特に目立った症状はないですか?”、“下痢を伴い血が混じることがありますか?”、“体に赤い発疹が出ていますか?”」が、音声発生手段70より発生され、同時に、ドクター人形の両眼にそれぞれ設置されている表示灯120が交互に点灯される。該問診セリフデータファイル(DFp323)に基づく問診セリフに対し、受診者が、例えば「特に目立った症状はないです。」とのセリフを応答すると、該応答音声が音声認識手段50で
“目立った症状なし”と判定される。
以上の問診と応答の会話は、プログラム記憶領域22に予め記憶されている症状診断プログラムを基として制御手段10に備えられているCPUにより病状の推測が随時行われている。そして、前記までの問診結果のデータからCPU により“病状の推測を完了”と判断された場合、前記の両眼表示灯121が点灯され、小児問診会話モードファイル(MFp)内の問診結果サブ会話モードファイ(MFps)の病状結果セリフデータファイル(例えば、DFps1)に基づく結果セリフ:「 “急性気管支炎”か“風邪”が疑われます。」が、伝えられる。
以上のように、本発明による構成においては、問診等のセリフに受診者が選択して応答する。との工程を順次繰返し実行できるような会話データとしていることで、目的とする解答や効果などを得られるようにしている。
一方、本実施例のドクター人形型会話診断機は、問診に対して30秒以上何も応答しない場合には同じ問診セリフを繰り返すように、また、病状結果が伝えられた後1分間放置した場合には問診開始モードに移動するように、さらに、リセット/モード変更スイッチ112を押すことで前の問診モードに戻せるように、設定されている。
ここで、上記の時間は、該時間に限定されるものでなく 例えば、5秒、2分など制御プログラムで予め適選設定することができる。
【0023】
さらに、本発明の第2実施例に係るドクター人形型会話診断機を構成する音声発生装置は、会話データ記憶領域21内に予め記憶されている問診会話データを、音声入力手段30を介し適選入力した音声を声紋分析置換手段80により分析することで該適選音声に置換することができる。以下、本例の構成によるドクター人形型会話診断機の音声置換の手順について説明する。
【0024】
まず、適選した音声に置換するための音声の入力の手順について説明する。
この音声入力は、音声設定モード(SF)で行われ、スタンド型会話学習機に設置されているリセット/モード変更スイッチ112と音声切替スイッチ117とを同時に押すことで当該モード(SF)に入ることができる。音声設定モード(SF)に入ると音声モードファイル(SF0〜SF1)領域に予め記憶されている設定案内セリフデータファイル(SDF01)に基づくセリフ:「お好みの音声を入力してください。リセット/モード変更スイッチを押すと10秒間の聞取りが行われます。終了は、“ピー”のサウンドで知らせます。」が、音声発生手段70より発生され、この間、表示灯120が交互に点灯される。
次に受診者(或いは本装置の所有者など)が、リセット/モード変更スイッチ112を押して“適選した音声”をスタンド型会話学習機の音声通過ホール130に向け発生させると、当該音声が音声入力手段30を介して声紋分析置換手段80に入力され声紋分析が開始される。10秒後、声紋分析が終了すると“ピー”のサウンドが発生され、音声に置換させるための該分析データが前記音声モードファイル(SF0〜SF1)領域のSDF1に記憶される。この際、十分な声紋分析データが得られなかった場合には、設定案内セリフデータファイル(SDF02)に基づくセリフ:「十分な音声の聞き取りが出来ませんでした。再度、お好みの音声1を入力してください。」とのセリフが発生され、両眼の表示灯120が一緒に間欠点灯される。十分な声紋分析データが得られた場合には、設定案内セリフデータファイル(SDF03)に基づくセリフ:「音声の入力を完了しました。もう一度リセット/モード変更スイッチを押すと問診モードに移ります。」とのセリフが発生され、同時に、両眼の表示灯120が一緒に点灯され、リセット/モード変更スイッチ112を押すと問診モードに移る。
ここで、お好みの音声への置換を必要としない場合には、リセット/モード変更スイッチ112を10秒以内に再度押すことで問診モードに移動する。この際の音声は、会話データ入力時の音声となる。
【0025】
上記の手順により、例えば、予め録音していたホームドクターの声を入力することで、何時も診断を受けているドクター声による対話型の問診診断を受けることができる。
【0026】
ここで、以上では本発明の第2実施例に係るドクター人形型会話診断機で構成した音声発生装置について説明しているが、同記載内容から明らかなように本発明の第2実施例に係る装置の形態は人形型に限定されるものでなく、携帯電話などの機器に本発明の第2実施例に係る機能と構成を搭載することも可能である。この場合には、例えばテンキ―ボタンを音声切替スイッチ117などのスイッチとして構成することができる。
【0027】
以上の本発明の第2実施例に係るドクター人形型会話診断機で構成した音声発生装置により、例えば信頼できるドクターの音声との対話型の問診診断を、時間を気にすることなく落着いて受けることができ、この結果を元にドクターからの初期的な診療を効率的に受けることが可能となる。
【実施例3】
【0028】
図6は本発明の第3実施例に係るスタンド型会話学習機を構成する音声発生装置の電気的な構成を示すブロック図であり、図7は当該スタンド型会話学習機の斜視概観図である。以下、図6及び図7を使い本発明の第3実施例に係るスタンド型会話学習機について説明する
【0029】
図6に示されるように、当該スタンド型会話学習機は、ランプ115の点灯用の電源スイッチ111が設置されているケーブルラインと途中で分岐されているAC電源ケーブル116の前方に設置されたDC12VのACアダプタ電源110と、CPUを備えた制御手段10と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成された会話データ記憶領域21とRAMやROM等の記憶手段などで構成された基本的な制御プログラム等を記憶しておくためのプログラム記憶領域22とを備えた記憶領域20と、音声を入力するための音声入力手段30と、MP3等の音声圧縮方式で作成した会話モードデータを前記会話データ記憶領域21に記憶するための会話データ入力手段40と、前記音声入力手段30により入力した言葉を前記会話データ記憶領域21に予め記憶されている各種の会話モードデータの中より検索し判定する音声認識手段50と、前記音声入力手段30によって適選入力した音声の声紋を分析して前記のMP3等の音声圧縮方式で作成し記憶されている会話モードデータを当該声紋の音声に置換するための声紋分析置換手段80と、スタンドの柄の部分に取り付けられたモード(学習科目)選択スイッチ114内に設置されている接触センサ60と、当該センサ60で検出された学習科目(学習モード)の内容を図示するためのディスプレ121と、学習項目などを変更するためのリセット/モード変更スイッチ112と、前記制御手段のメインスイッチ113と、音声切替スイッチ117と、前記制御手段10により決定されたセリフを発生する音声発生手段70と、を備えている。
【0030】
第3実施例による本実施例におけるスタンド型会話学習機は、スタンドの柄の部分に取り付けられている4側面を有する回転式のモード(学習科目)選択スイッチ114に対して、高校1年生レベルの
“物理”と“化学”と“数学”と“生物”の4教科、それぞれの学習会話モード(M1〜M4)が対応するように初期設定されている。
ここで、本例では高校1年生レベルの理科系教材が初期設定されているが、本発明の構成から明らかなように、必要なレベルの各種科目の学習会話モードデータをMP3等の音声圧縮方式で作成し会話データ入力手段40を通し会話データ記憶領域21に記憶させておくことで、必要とされるレベルの各種科目を学習することができる。また、回転式のモード(学習科目)選択スイッチ114の面数は4面に限定されるものではなく 例えば、3面、5面、10面などの多面体とでき、同面数に応じた数の学習(学科)モードの設定が可能である。
【0031】
以下では、本例の構成によるスタンド型会話学習機の使用例について説明する。
図7において、当該スタンド型会話学習機に設置されているメインスイッチ113をオンとする。この際、スタンドの柄の部分に取り付けられている回転式のモード(学習科目)選択スイッチ114を水平方向に回転させ学習したい学科のマーク(本例では“数学”)が前面となる位置で停止させる。この状態を5秒間保持すると、当該モード選択スイッチ114内に内設されている接触センサ60により検出された位置信号に基づいて、“数学学習会話モード(M3)”が判定され、会話データ記憶領域21の中の会話モードファイル(MF1〜MF4)領域に予め記憶されている数学学習会話モードファイル(MF3)内の〈初期質問セリフデータファイル:DF301〉に基づく初期質問セリフ:「ここでは数学を学習します。 “三角関数”、“方程式”、”確立”、“集合”のどこから始めましょうか?」が、スタンドの柄の筐体内部に備えられている前記音声発生手段70より発生されて当該筐体表面の音声通過ホール130を通して該筐体外部に伝えられる。同時に、該筐体前側面に設置されているディスプレ121が点灯されて該初期質問の内容が表示される。
該初期質問セリフに対し、学習者が、例えば「三角関数」とのセリフを応答すると、該応答音声は音声通過ホール130を通り前記筐体内部に備えられている音声入力手段30に入力される。そして、該応答音声が音声認識手段50で
“三角関数”と判定されると、“三角関数”をキーワードとする数学学習サブ会話モードファイル(MF3A)に記憶されている三角関数の第1質問セリフデータ(DF3A1)に基づく質問セリフ:「cosθは、ディスプレに示されている三角形に対し、1:a/c、2:b/c、3:b/aのどの関係式で表せますか?」が、音声発生手段70より発生されて音声通過ホール130を通してスタンドの外部に伝えられる。同時に、ディスプレ121に該質問の内容が表示される。
次に、該質問セリフに対して学習者が解答セリフを応答すると、該応答音声は音声通過ホール130を通して音声入力手段30に入力される。そして、該応答音声が音声認識手段50で
“正解”と判定されると、ディスプレ121に“正解!”との表示が2秒間点滅され、その後、三角関数の第2質問セリフデータ(DF3A2)に基づく質問セリフ:「sinθは、ディスプレに示されている三角形に対し、1:a/c、2:b/c、3:b/aのどの関係式で現れますか?」が、前記と同じ工程で伝えられ、同時に第2の質問内容が表示される。
一方、学習者の解答が“不正解”或いは10秒以上応答しなかった場合は、ディスプレ121に“再挑戦!”との表示が2秒間点滅され、その後、直前の質問セリフ:本例では、「sinθは、ディスプレに示されている三角形に対し、1:a/c、2:b/c、3:b/aのどの関係式で現れますか?」が、前記と同じ工程で伝えられ、同時に、該質問内容が表示される。
以上のように質問と解答の対話型の会話学習を繰返すことできる。また、本例では、 “三角関数”の他に、会話データ記憶領域21内に予め記憶されている数学の“方程式”、”確立”、“集合”、“因数分解”、さらに、
“物理”、“化学”と“生物”についての会話学習についての対話型の会話学習も上記と同様の工程により順次繰返し実行することができる。
【0032】
ここで、本例では回転式のモード(学習科目)選択スイッチ114を水平方向に回転させ学習する学科のマーク(本例では“数学”)が前面となる位置に5秒間停止保持すると学習モードが判定されるとしているが、該時間に限定されるものでなく 例えば、10秒、1分など制御プログラムで予め適選設定することができる。同じく、本例では応答待ち時間を10秒としているが、該時間に限定されるものでなく 例えば、5秒、30秒など制御プログラムで予め適選設定することができる。
さらに、本実施例によるスタンド型会話学習機は、リセット/モード変更スイッチ112を使い学習中の質問をスキップさせ別の質問に移動できるように構成されている。例えば、当該リセット/モード変更スイッチ112の短時間(≦1秒以内)押すことで次の質問に移動できる。また、長時間(>1秒)押すことで 該学習モードの初期位置に移動できる。
【0033】
さらに、本発明の第3実施例に係るスタンド型会話学習機を構成する音声発生装置は、会話データ記憶領域21内に予め記憶されている会話データを、音声入力手段30を介し適選入力した音声を声紋分析置換手段80により分析することで該適選音声に置換することができる。以下、本例の構成によるスタンド型会話学習機での音声置換の手順について説明する。
【0034】
まず、適選した音声に置換するための音声の入力の手順について説明する。
この音声入力は、音声設定モード(SF)で行われ、スタンド型会話学習機に設置されているリセット/モード変更スイッチ112と音声切替スイッチ117とを同時に押すことで当該モード(SF)に入ることができる。音声設定モード(SF)に入ると音声モードファイル(SF0〜SF4)領域に予め記憶されている設定案内セリフデータファイル(SDF01)に基づくセリフ:「お好みの音声1を入力してください。リセット/モード変更スイッチを押すと10秒間の聞取りが行われます。終了は、“ピー”のサウンドで知らせます。」が、音声発生手段70より発生され、同時に、ディスプレ121に該セリフ内容が表示される。
次に学習者が、リセット/モード変更スイッチ112を押して“適選した音声”をスタンド型会話学習機の音声通過ホール130に向け発生させると、当該音声が音声入力手段30を介して声紋分析置換手段80に入力され声紋分析が開始される。10秒後、声紋分析が終了すると“ピー”のサウンドが発生され、音声に置換させるための該分析データが前記音声モードファイル(SF1〜SF4)領域のSDF1に記憶される。この際、十分な声紋分析データが得られなかった場合には、設定案内セリフデータファイル(SDF02)に基づくセリフ:「十分な音声の聞き取りが出来ませんでした。再度、お好みの音声1を入力してください。」とのセリフが発生され、ディスプレ121に、該セリフの内容が表示される。十分な声紋分析データが得られた場合には、設定案内セリフデータファイル(SDF03)に基づくセリフ:「音声1の聞き取りを完了しました。次にお好みの音声2を入力してください。リセット/モード変更スイッチを押すと10秒間の聞取りが自動的に行われます。終了は、“ピー”のサウンドで知らせます。」を、前記と同じ工程で該筐体外部に発生させ、同時に、ディスプレ121に該セリフの内容が表示される。SF3とSF4についても同様の手順でお好みの音声を入力する。SF4までの入力が完了すると、設定案内セリフデータファイル(SDF06)に基づくセリフ:「音声の入力が完了しました。もう一度リセット/モード変更スイッチを押すと学習モードに移ります。」とのセリフが発生され、同時に、ディスプレ121に該セリフの内容が表示される。そして、リセット/モード変更スイッチ112を押すと学習モードに移る。
ここで、お好みの音声への置換を必要としない場合には、リセット/モード変更スイッチ112を10秒以内に再度押すことでSF1入力⇒SF2入力⇒SF3入力⇒SF4入力⇒学習モードの順で移動し、音声は、会話データ入力時の音声となる。
【0035】
以上の手順で入力された音声モード(SF1〜SF4)への会話データ記憶領域21内に予め記憶されている会話モードデータの置換は、以下のようにして設定される。
前記している本例の構成によるスタンド型会話学習機の使用工程における、各学習科目の初期質問セリフ:例えば、「ここでは物理を学習します。 “光波”、“運動の法則”、”電流回路”、“力のつりあい”のどこから始めましょうか?」の内容が、ディスプレ121に表示されている状態において、音声切替スイッチ117を1回押すと、設定案内セリフデータファイル(SDF07)に基づくセリフ:「音声1に置換する場合は、音声切替スイッチを長押し(≧3秒)してください。他の音声に置換する場合は短押し(≦1秒)してください。」が発生され、同時に、ディスプレ121に該セリフの内容が表示される。
そして、音声切替スイッチ117を3秒以上押すと、前の学習科目の初期質問モードに戻り、初期質問セリフ:「ここでは物理を学習します。 “光波”、“運動の法則”、”電流回路”、“力のつりあい”のどこから始めましょうか?」が、置換後の音声で発生される。同時に、該筐体前側面に設置されているディスプレ121に該初期質問の内容が表示される。
一方、音声切替スイッチ117を短押し(≦1秒)すると、設定案内セリフデータファイル(SDF08)に基づくセリフ:「音声2に置換する場合は、音声切替スイッチを長押し(≧3秒)してください。他の音声に置換する場合は短押し(≦1秒)してください。」が発生され、同時に、ディスプレ121に該セリフの内容が表示される。音声3或いは音声4に置換させたい場合も、前記の手順で適選した音声で設定する。
【0036】
上記の手順により、例えば、予め録音していたガールフレンドの声を入力することで、ガールフレンドの声との生物の対話型会話学習を行うことができる。
【0037】
ここで、以上では本発明の第3実施例に係るスタンド型会話学習機で構成した音声発生装置について説明しているが、同記載内容から明らかなように本発明の第3実施例に係る装置の形態はスタンド型に限定されるものでなく、携帯電話などの機器に本発明の第3実施例に係る機能と構成を搭載することも可能である。この場合には、例えば、リセット/モード変更スイッチ112や音声切替スイッチ117などのスイッチの換わりにテンキ―ボタンを利用し構成することができる。さらに、本例は物理などへの対話型会話学習機として構成した音声発生装置としているが、同応用に限定されるものでなく、第3実施例の構成についての説明内容から明らかなように、例えば、第1実施例に示されている語学学習機や、第2実施例に示されている診断機などへの応用も可能な音声発生装置を構成することができる。
【0038】
以上の本発明の第3実施例に係るスタンド型会話学習機の構成により、予め作成した各種の学習会話モードデータを筐体に設置した会話データ入力手段40を介して会話データ記憶領域21に記録させることができ、該学習モードをセンサに選択させ、該選択された学習モードの質問セリフデータファイルに基づくセリフとの対話型会話を順次繰返し実行することができる。さらに、記録されている会話モードデータを声紋認識手段により適選した音声に置換させることができることから、好きな音声との各種の対話型会話を簡便に切替えて行うことができる。以上より、興味を長時間持続させ集中力を継続させることができ、充分なコミュニケーションや学習などの効果を高い汎用性で効率よく安価に与えることができる音声発生装置を提供できる。
【産業上の利用可能性】
【0039】
以上の説明から明らかなように、本発明による音声発声装置は、予め作成した各種の会話モードデータを筐体に設置した会話データ入力手段40を介して会話データ記憶領域21に記録させ、この中の特定の会話モードをセンサに選択させ、さらに、声紋認識手段により適選した音声に置換させ好きな音声と対話できるように構成されている。しかも、該会話データを、同データに基づく問診等のセリフに受診者が選択して応答する。との工程を順次繰返し実行していくことで目的とする解答や効果などが得られるように構成している。
以上の本発明による音声発声装置の構成としたことにより、各種科目の学習器、病院や会社や旅行などでの各種案内器、介護などで必要とされる癒しの会話器など様々な分野での利用が可能である。
【符号の説明】
【0040】
10 制御手段
20 記憶領域
21 会話データ記憶領域
22 プログラム記憶領域
30 音声入力手段
40 会話データ入力手段
50 音声認識手段
60 センサ
70 音声発生手段
80 声紋分析置換手段
110 電源
111 電源スイッチ
112 リセット/モード変更スイッチ
113 メインスイッチ
114 モード選択スイッチ
115 ランプ
116 AC電源ケーブル
117 音声切替スイッチ
120 表示灯
121 ディスプレ
130 音声通過ホール

【特許請求の範囲】
【請求項1】
CPUを備えた制御手段と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域とRAMやROM等の記憶手段などで構成した基本的な制御プログラム等を記憶しておくためのプログラム記憶領域とを備えた記憶領域と、音声を入力するための音声入力手段と、MP3等の音声圧縮方式で作成した会話モードデータを前記記憶手段に記憶させるための会話データ入力手段と、前記音声入力手段により入力したセリフを前記記録手段に予め記憶させている各種の会話モードデータの中より検索し判定する音声認識手段と、前記制御手段により決定されたセリフを発生する音声発生手段と、少なくとも1つのセンサとを備え、当該センサが検出した筐体の状態の信号に基づいて前記記録手段の中の各種の会話モードデータより特定の会話モードを選択して、当該会話モードファイル領域のセリフデータファイルに基づくセリフを発生し、さらに該セリフに対して前記音声入力手段を介し入力された使用者からの応答の音声を、前記音声認識手段により検索し、次に、検索された該音声をキーワードとするセリフデータファイルに基づくセリフを前記音声発生手段より発生させることを特徴とする音声発生装置。
【請求項2】
CPUを備えた制御手段と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域とRAMやROM等の記憶手段などで構成した基本的な制御プログラム等を記憶しておくためのプログラム記憶領域とを備えた記憶領域と、音声を入力するための音声入力手段と、MP3等の音声圧縮方式で作成した会話モードデータを前記記憶手段に記憶させるための会話データ入力手段と、前記音声入力手段により入力したセリフを前記記録手段に予め記憶させている各種の会話モードデータの中より検索し判定する音声認識手段と、前記音声入力手段によって適選入力した音声の声紋を分析して前記のMP3等の音声圧縮方式で作成し記憶されている会話モードデータを当該声紋の音声に置換するための声紋分析置換手段と、前記制御手段により決定されたセリフを発生する音声発生手段とを備え、前記会話データ記憶領域に予め記憶されているセリフデータファイルに基づくセリフを、前記声紋分析置換手段で分析され前記会話データ記憶領域の音声モードファイルに記録されている適選した音声のデータを元に当該適選音声に置換して音声発生手段より発生させ、さらに該セリフに対して前記音声入力手段を介し入力された使用者からの応答の音声を、前記音声認識手段により検索し、次に、検索された該音声をキーワードとするセリフデータファイルに基づくセリフを前記音声発生手段より発生させることを特徴とする音声発生装置。
【請求項3】
CPUを備えた制御手段と、RAMや不揮発性ROM等の書き換え可能な記憶手段などで構成した会話データ記憶領域とRAMやROM等の記憶手段などで構成した基本的な制御プログラム等を記憶しておくためのプログラム記憶領域とを備えた記憶領域と、音声を入力するための音声入力手段と、MP3等の音声圧縮方式で作成した会話モードデータを前記記憶手段に記憶させるための会話データ入力手段と、前記音声入力手段により入力したセリフを前記記録手段に予め記憶させている各種の会話モードデータの中より検索し判定する音声認識手段と、前記音声入力手段によって適選入力した音声の声紋を分析して前記のMP3等の音声圧縮方式で作成し記憶されている会話モードデータを当該声紋の音声に置換するための声紋分析置換手段と、前記制御手段により決定されたセリフを発生する音声発生手段と、少なくとも1つのセンサとを備え、当該センサが検出した筐体の状態の信号に基づいて前記記録手段の中の各種の会話モードデータより特定の会話モードを選択して、当該会話モードファイル領域のセリフデータファイルに基づくセリフを発生し、さらに該セリフに対して前記音声入力手段を介し入力された使用者からの応答の音声を、前記音声認識手段により検索し、次に、検索された該音声をキーワードとするセリフデータファイルに基づくセリフを前記音声発生手段より発生させることを特徴とする音声発生装置。
【請求項4】
前記請求項1または請求項2または請求項3記載の音声発生装置に、さらに、会話データと制御プログラムにより点灯制御される表示灯を有していることを特徴とする音声発生装置。
【請求項5】
前記請求項1または請求項2または請求項3記載の音声発生装置に、さらに、会話データと制御プログラムにより表示制御されるディスプレを有していることを特徴とする音声発生装置。
【請求項6】
前記請求項1または請求項2または請求項3記載の音声発生装置において、MP3等の音声圧縮方式で作成され予め記憶手段に記憶されている会話モードデータを、同データに基づくセリフに使用者が選択して応答する。との工程を順次繰返し実行していくことで目的とする解答や効果などが得られるように構成していることを特徴とする音声発生装置。
【請求項7】
多面体の筐体に内蔵したことを特徴とする前記請求項1または請求項2または請求項3記載の音声発生装置。
【請求項8】
人間等を模した外形の筐体に内蔵したことを特徴とする前記請求項1または請求項2または請求項3記載の音声発生装置。
【請求項9】
スタンドの筐体に内蔵したことを特徴とする前記請求項1または請求項2または請求項3記載の音声発生装置。
【請求項10】
携帯電話に内蔵したことを特徴とする前記請求項1または請求項2または請求項3記載の音声発生装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate