音声案内システム
【課題】用途に応じて最適な音声案内システムを構築する。
【解決手段】いずれかの子機1の記憶部10に記憶されている音声案内データであるテキストデータに対応する音声案内を報知すべき事象が発生したときに、上記子機1の制御部11がネットワーク3を介して上記テキストデータを親機2に送信する。続いて、親機2の音声合成部20において、解析部がテキストデータに対して言語データベースの情報を用いて言語解析を実行してテキスト合成データを作成する。その後、音声波形生成部がテキスト合成データ、及びコンテキスト依存HMMからの音響的特徴量を用いて音声信号データを作成する。最後に、報知部21が音声信号データを再生して音声案内を報知する。
【解決手段】いずれかの子機1の記憶部10に記憶されている音声案内データであるテキストデータに対応する音声案内を報知すべき事象が発生したときに、上記子機1の制御部11がネットワーク3を介して上記テキストデータを親機2に送信する。続いて、親機2の音声合成部20において、解析部がテキストデータに対して言語データベースの情報を用いて言語解析を実行してテキスト合成データを作成する。その後、音声波形生成部がテキスト合成データ、及びコンテキスト依存HMMからの音響的特徴量を用いて音声信号データを作成する。最後に、報知部21が音声信号データを再生して音声案内を報知する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声案内を報知する音声案内システムに関するものである。
【背景技術】
【0002】
従来、例えばシステムの状態や操作の案内、異常発生時などに関する音声案内を報知する音声案内システムとして、予め音声案内データを記憶する記憶部と、上記音声案内データに基づいて音声案内を報知する音声変換部(デコーダ部)とを単一のサブシステムに備える第1の従来音声案内システムがある。
【0003】
また、特許文献1には、それぞれが火災感知器と接続する複数の端末装置(子機)と、各端末装置と接続するセンタ装置(親機)とを備える異常報知システム(第2の従来音声案内システム)が開示されている。上記特許文献1の異常報知システムにおいて、センタ装置は、各端末装置からの制御信号に対応する音声案内データを記憶する記憶部を備える。上記特許文献1の異常報知システムの動作について説明すると、まず、端末装置が火災感知器の検知に基づいて火災発生と確定した場合、センタ装置に制御信号を送信する。続いて、センタ装置が制御信号を受信すると、上記制御信号に対応する音声案内データを記憶部から読み出し、上記音声案内データに基づいて音声メッセージ(音声案内)を報知する。
【特許文献1】特開2004−185151号公報(第7頁及び第1〜3図)
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記第1の従来音声案内システムは、音声案内データを記憶する記憶部と音声変換部とを単一のサブシステムに備えるので、システム自身が小規模で事後に拡張されることがなくスタンドアローンで利用される場合には有効であった。しかしながら、第1の従来音声案内システムは、事後にサブシステムを追加したり結合したりすることで拡張して大規模かつ複雑になる場合、当初から想定されるあらゆる音声案内データを抽出して単一のサブシステムに備えることが非常に困難であるという問題があった。また、ユーザごとに希望のシステム構成があるので、それぞれの音声案内データが、一部のユーザに対しては有用なものであっても、別のユーザに対しては不用なものであるといった問題も発生した。
【0005】
一方、第2の従来音声案内システムは、各子機から親機への制御信号の種類が多くなるにつれて音声案内データの種類も多くなることから、親機の記憶部の容量を大きくする必要がある。これにより、上記第2の従来音声案内システムは、親機側に機能が集中して大型かつ高コストになってしまうという問題があった。
【0006】
本発明は上記の点に鑑みて為されたものであり、その目的とするところは、用途に応じて最適に構築することができる音声案内システムを提供することにある。
【課題を解決するための手段】
【0007】
請求項1に記載の発明は、音声案内データ及びその音声案内データに対応する音声案内を報知すべき事象を記憶する子機記憶手段と、前記事象が発生したときに前記音声案内データを送信する子機制御手段とを含む子機を単一又は複数備えるとともに、前記子機から前記音声案内データを受信し、受信された音声案内データに基づいて前記音声案内を報知する親機制御手段を含む親機を備えることを特徴とする。
【0008】
この構成では、親機が子機に対応する音声案内データを記憶する必要がなく、必要な音声案内に応じて子機を親機に接続して用いることができるので、用途に応じて最適な音声案内システムを構築することができる。
【0009】
請求項2に記載の発明は、請求項1に記載の発明において、前記音声案内データを設定する入力機制御手段を含む設定入力機を備え、前記子機制御手段が、前記設定入力機から前記音声案内データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声案内データを記憶することを特徴とする。この構成では、好みの音声案内データを子機に記憶させることができるので、実際に音声案内されたときに直感的にわかりやすくなる。
【0010】
請求項3に記載の発明は、請求項1又は2に記載の発明において、前記子機記憶手段が、テキストデータを前記音声案内データとして記憶し、前記親機制御手段が、前記事象が発生したときに前記子機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する親機解析手段と、前記テキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含むことを特徴とする。この構成では、用途に応じて最適な音声案内システムを構築することができる。
【0011】
請求項4に記載の発明は、請求項1に記載の発明において、前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成し、前記テキスト合成データを前記子機に送信するサーバ解析手段を含むセンターサーバを備え、前記子機制御手段が、前記センターサーバから前記テキスト合成データを受信し、前記子機記憶手段が、前記子機制御手段で受信されたテキスト合成データを前記音声案内データとして記憶し、前記親機制御手段が、前記事象が発生したときに前記子機から前記テキスト合成データを受信し、受信されたテキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含むことを特徴とする。この構成では、親機がテキスト合成データを受信することによって、親機のメモリ容量を小さくすることができ、低コスト化を図ることができる。
【0012】
請求項5に記載の発明は、請求項1に記載の発明において、前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成するサーバ解析手段と、前記テキスト合成データを用いて音声データを作成し、前記音声データを前記子機に送信するサーバ音声信号作成手段とを含むセンターサーバを備え、前記子機制御手段が、前記センターサーバから前記音声データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声データを前記音声案内データとして記憶し、前記親機制御手段が、前記事象が発生したときに前記子機から前記音声データを受信し、受信された音声データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含むことを特徴とする。この構成では、親機を簡単な構成にすることができるので、親機の低コスト化を図ることができる。
【0013】
請求項6に記載の発明は、請求項2に記載の発明において、前記設定入力機が、設定された前記音声案内データに基づいて前記音声案内を報知する入力機報知手段を含むことを特徴とする。この構成では、設定入力機において、入力機制御手段で設定された音声案内データに対応する音声案内を聴いて確認することができる。
【0014】
請求項7に記載の発明は、請求項2〜6のいずれかに記載の発明において、前記子機が、前記子機記憶手段に記憶されている前記音声案内データに基づいて前記音声案内を報知する子機報知手段を含むことを特徴とする。この構成では、子機記憶手段に記憶されている音声案内データに対応する音声案内を、子機で聴いて確認することができる。
【0015】
請求項8に記載の発明は、請求項7に記載の発明において、前記設定入力機が、前記子機報知手段で前記音声案内が報知されたときにその音声案内の読みが誤っていた場合、前記音声案内データを訂正する訂正手段を含むことを特徴とする。この構成では、音声案内の読みが間違っていたとしても、設定入力機で音声案内データを訂正することができる。
【発明の効果】
【0016】
本発明によれば、用途に応じて最適な音声案内システムを構築することができる。
【発明を実施するための最良の形態】
【0017】
(実施形態1)
本発明の実施形態1について図1〜3を用いて説明する。図1は、実施形態1の音声案内システムの構成を示すブロック図である。図2は、実施形態1の音声案内システムにおける親機の動作を示す図である。図3は、実施形態1の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【0018】
まず、実施形態1の基本的な構成について説明する。実施形態1の音声案内システムは、音声案内を報知するものであり、図1に示すように、2つの子機1,1と、親機2とをネットワーク3を介して接続して備えている。実施形態1の音声案内システムにおけるネットワーク3の構築形式は、子機1をサーバ、親機2をクライアントとして、TCP/IPプロトコルでイーサネット(登録商標)接続する形式である。なお、上記ネットワーク3の構築形式は一例であって限定されるものではなく、用途に応じて適宜設定されるものである。
【0019】
各子機1は、記憶部10と、制御部11とを備えている。記憶部10は、子機固有の音声案内に関するテキストデータを音声案内データとして記憶しているとともに、上記テキストデータに対応する音声案内を報知すべき事象(ルール、イベント)も記憶している。一方、制御部11は、上記事象が発生したときにネットワーク3を介して、記憶部10に記憶されているテキストデータを親機2に送信するものである。上記テキストデータとして、日本語が対象の場合、漢字かな混じりテキストデータ、かなテキストデータなどがある。また、他にもローマ字テキストデータや英字のテキストデータなどがある。なお、子機1として複数の種類のものがあり、用途に応じて選択して用いることができる。
【0020】
親機2は、図2に示すように、音声合成部20と、報知部21とを備え、ユーザインタフェースの役割を有する。上記親機2は、音声変換ソフトウェアであるテキスト音声合成ソフトウェアを用いて、HMM(Hidden Markov Model)音声合成方式で音声案内を報知する。なお、親機2の音声合成方式は、HMM音声合成方式に限定されるものではなく、例えば波形接続方式など他の音声合成方式であってもよい。
【0021】
音声合成部20は、図3に示すように、言語データベース(言語D/B)200と、解析部201と、コンテキスト依存HMM(音響D/B)202と、音声波形生成部(音声信号作成手段)203とを備えている。
【0022】
言語データベース200は、テキストデータの読み、アクセント、品詞、ポーズなどといった情報を記憶している。解析部201は、各子機1(図1参照)からテキストデータを受信し、受信されたテキストデータに対して言語データベース200の情報を用いて言語解析を実行してテキスト合成データ(中間ファイル)を作成する。上記テキスト合成データは、読み、アクセント、品詞、ポーズなどの情報がテキスト化されている。コンテキスト依存HMM202は、多くの音響的特徴量を記憶し、この中から必要な音響的特徴量を音声波形生成部203に出力する。音声波形生成部203は、解析部201からのテキスト合成データ及びコンテキスト依存HMM202からの音響的特徴量を用いて音声信号データを作成する。
【0023】
一方、報知部21は、図2に示すように、D/A変換部210と、スピーカ211とを備えている。D/A変換部210は、音声波形生成部203で作成された音声信号データをアナログ音声信号に変換する。一方、スピーカ211は、上記アナログ音声信号を再生して音声案内を報知する。
【0024】
次に、実施形態1の音声案内システムの動作について図1,3を用いて説明する。まず、図1に示すように、いずれかの子機1の記憶部10に記憶されているテキストデータに対応する音声案内を報知すべき事象が発生したときに、上記子機1の制御部11が上記テキストデータを親機2に送信する。続いて、図3に示すように、親機2の音声合成部20において、解析部201がテキストデータに対して言語データベース200の情報を用いて言語解析を実行してテキスト合成データを作成する。その後、音声波形生成部203が、テキスト合成データ及び音響的特徴量を用いて音声信号データを作成する。最後に、報知部21が上記音声信号データを再生して音声案内を報知する。
【0025】
以上、実施形態1によれば、親機2が子機1ごとに対応するテキストデータを記憶する必要がなく、必要な音声案内に応じて子機1を親機2に接続して用いることができるので、用途に応じて最適な音声案内システムを構築することができる。
【0026】
(実施形態2)
本発明の実施形態2について図4を用いて説明する。図4は、実施形態2の音声案内システムの構成を示すブロック図である。
【0027】
実施形態2の音声案内システムは、図4に示すように、親機2を実施形態1の音声案内システムと同様に備えているが、実施形態1の音声案内システムにはない以下に記載の特徴部分がある。
【0028】
実施形態2の音声案内システムは、設定入力機4を備えている。設定入力機4は、例えばパソコン、テレビ、携帯電話などであり、操作部40と、制御部41とを備えている。操作部40は、各子機1に対応する音声案内の文章(例えば漢字かな混じり文章やひらがな、カタカナなど)の作成又は編集がユーザの入力操作で行われる。一方、制御部41は、上記音声案内の文章に基づくテキストデータを音声案内データとして設定する。すなわち、上記ユーザは、設定入力機4がパソコンの場合、操作部40となるキーボードから上記音声案内の文章を入力し、設定入力機4がテレビの場合、リモコンをキーボード代わりの操作部40として上記音声案内の文章を入力し、設定入力機4が携帯電話の場合、本体に設けられている操作ボタンを操作部40として上記音声案内の文章を入力する。また、設定入力機4が携帯電話の場合、ユーザは広い範囲から上記音声案内の文章を入力することができる。上記制御部41は、設定されたテキストデータを、ネットワーク3を介して対象の子機1aに送信する。
【0029】
また、実施形態2の音声案内システムは、実施形態1の2つの子機に代えて、図4に示すような2つの子機1a,1aを備えている。各子機1aは、制御部11aが設定入力機4からテキストデータを受信し、記憶部10aが、制御部11aで受信されたテキストデータを音声案内データとして記憶する。なお、各子機1aは、上記以外の点において、実施形態1の各子機1(図1参照)と同様である。
【0030】
次に、実施形態2の音声案内システムの動作について説明する。まず、ユーザが設定入力機4の操作部40を用いて音声案内の文章を入力し、制御部41が、上記音声案内の文章テキストデータを設定する。続いて、制御部41がテキストデータを子機1aに送信する。子機1aの記憶部10が設定入力機4からのテキストデータを記憶する。その後、実施形態1と同様に、親機2の音声合成部20及び報知部21がテキストデータに基づいて音声案内を報知する。
【0031】
以上、実施形態2によれば、ユーザ自身が好みの音声案内の文章を入力してテキストデータを設定し、上記テキストデータを子機1の記憶部10に記憶させることができるので、実際に音声案内されたときに直感的にわかりやすくなる。
【0032】
(実施形態3)
本発明の実施形態3について図4を用いて説明する。図4は、実施形態3の音声案内システムの構成を示すブロック図である。
【0033】
実施形態3の音声案内システムは、図4に示すように、2つの子機1a,1aと、親機2と、設定入力機4とを、実施形態2の音声案内システムと同様に備えているが、実施形態2の音声案内システムにはない以下に記載の特徴部分がある。
【0034】
実施形態3の音声案内システムでは、音声案内データとしてテキストデータに代えて、音声データを用いている。実施形態3の設定入力機4は、操作部40としてマイク(図示せず)を備え、上記マイクを介してユーザ自身の音声や他人の音声を取り込む。制御部41は、音声データの編集ツール(例えばADPCM)などを利用して音声データを設定する。上記制御部41は、ネットワーク3を介して上記音声データを音声案内データとして子機1aに送信する。
【0035】
一方、実施形態3の親機2の音声合成部20は、解凍処理部204(図2参照)を備えている。解凍処理部204は、例えばADPCMなどで圧縮された音声データに対して解凍処理を行い、音声信号データを作成する。
【0036】
以上、実施形態3によれば、音声案内データが音声データの場合であっても、テキストデータの場合と同様の効果を奏する。
【0037】
(実施形態4)
本発明の実施形態4について図5を用いて説明する。図5は、実施形態4の音声案内システムにおける設定入力機の構成を示すブロック図である。なお、図5のAは、図4のAでネットワーク3を介して各子機1aと接続する。
【0038】
実施形態4の音声案内システムは、実施形態2の音声案内システム(図4参照)と同様に、2つの子機1a,1aと、親機2とを備えているが、実施形態2の音声案内システムにはない以下に記載の特徴部分がある。
【0039】
実施形態4の音声案内システムは、実施形態2の設定入力機に代えて、図5に示すような設定入力機4aを備えている。設定入力機4aは、操作部40及び制御部41aを備えているとともに、音声合成部42と、報知部43とを備えている。音声合成部42は、例えば親機2の音声合成部20(図3参照)と同様の構成であり、制御部41aで設定されたテキストデータを用いて音声信号データを作成する。一方、報知部43は、例えばスピーカなどを設定入力機4の本体に内蔵又は外部接続して備え、上記音声信号データを再生して音声案内を報知する。なお、設定入力機4aは、上記以外の点において、実施形態2の設定入力機4(図4参照)と同様である。
【0040】
以上、実施形態4によれば、実施形態2と同様の効果を得ることができるとともに、設定入力機4において、制御部41aで設定されたテキストデータに基づいた音声案内を、設定時点の段階で聴いて確認することができる。
【0041】
(実施形態5)
本発明の実施形態5について図6,7を用いて説明する。図6は、実施形態5の音声案内システムの構成を示すブロック図である。図7は、実施形態5の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【0042】
実施形態5の音声案内システムは、図6に示すように、2つの子機1b,1bと、親機2aと、設定入力機4bと、センターサーバ5とをネットワーク3及びインターネット6を介して接続して備えている。
【0043】
設定入力機4bの制御部41bは、設定されたテキストデータを、ネットワーク3及びインターネット6を介してセンターサーバ5に送信する。なお、実施形態5の設定入力機4bは、上記以外の点において、実施形態2の設定入力機4(図4参照)と同様である。
【0044】
センターサーバ5は、解析部50を備えている。解析部50は、テキストデータからテキスト合成データを作成する部分のソフトウェアを備え、設定入力機4bからテキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する。上記解析部50は、インターネット6及びネットワーク3を介して、作成されたテキスト合成データを各子機1bに送信する。
【0045】
一方、各子機1bは、制御部11bがセンターサーバ5からテキスト合成データを受信し、記憶部10bが、制御部11bで受信されたテキスト合成データを音声案内データとして記憶している。なお、各子機1bは、上記以外の点において、実施形態1の各子機1(図1参照)と同様である。
【0046】
また、親機2aは、実施形態1と同様の報知部21を備えているとともに、図7に示すような音声合成部20aを備えている。音声合成部20aは、コンテキスト依存HMM202と、音声波形生成部203とを備えている。音声波形生成部203は、子機1bにおいてテキスト合成データに対応する音声案内を報知すべき事象が発生したときに子機1bからテキスト合成データを受信し、受信されたテキスト合成データ及びコンテキスト依存HMM202の音響的特徴量を用いて音声信号データを作成する。報知部21は、図6に示すように、上記音声信号データを再生して音声案内を報知する。
【0047】
次に、実施形態5の音声案内システムの動作について図6を用いて説明する。まず、ユーザが設定入力機4bを用いて音声案内の文章を入力してテキストデータを設定する。続いて、設定入力機4bの制御部41bがテキストデータをセンターサーバ5に送信する。センターサーバ5の解析部50がテキストデータからテキスト合成データを作成し、上記テキスト合成データを子機1bに送信する。続いて、子機1bにおいてテキスト合成データに対応する音声案内を報知すべき事象が発生したときに、子機1bの制御部11bがテキスト合成データを親機2aに送信する。その後、親機2aの音声合成部20aがテキスト合成データ及び音響的特徴量を用いて音声信号データを作成する。最後に、報知部21が上記音声信号データを再生して音声案内を報知する。
【0048】
以上、実施形態5によれば、親機2aの音声合成部20aがテキスト合成データを受信することによって、解析部及び言語データベースを備える必要がないので、音声合成部20aのメモリ容量を小さくすることができ、親機2aの低コスト化を図ることができる。
【0049】
(実施形態6)
本発明の実施形態6について図8を用いて説明する。図8は、実施形態6の音声案内システムにおけるセンターサーバの構成を示すブロック図である。なお、図8のBは、図6のBでネットワーク3を介して各子機1bと接続する。
【0050】
実施形態6の音声案内システムは、実施形態5の音声案内システム(図6参照)と同様に、2つの子機1b,1bと、親機2aと、設定入力機4bとを備えているが、実施形態5の音声案内システムにはない特徴部分がある。
【0051】
実施形態6の音声案内システムは、実施形態5のセンターサーバに代えて、図8に示すようなセンターサーバ5aを備えている。センターサーバ5aは、解析部50aと、音声信号作成部51とを備えている。解析部50aは、設定入力機4bからテキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する。音声信号作成部51は、テキスト合成データから音声信号データを作成するテキスト音声合成ソフトウェアと、音声信号データをADPCM形式の音声データに変換するソフトウェアとを備えている。上記音声信号作成部51は、解析部50aで作成されたテキスト合成データを用いて音声信号データを作成し、上記音声信号データをADPCM形式に圧縮して音声データを作成する。続いて、音声信号作成部51は、インターネット6及びネットワーク3を介して、上記音声データを子機1bに送信する。
【0052】
一方、実施形態6の各子機1bは、制御部11bがセンターサーバ5aから音声データを受信し、記憶部10bが、制御部11bで受信された音声データを音声案内データとして記憶している。上記各子機1bは、音声データに対応する音声案内を報知すべき事象が発生したときに音声データを親機2aに送信する。なお、実施形態6の各子機1bは、上記以外の点において、実施形態5の各子機と同様である。
【0053】
また、実施形態6の親機2aは、解凍処理部204(図2参照)を含む音声合成部20と、報知部21とを備えている。音声合成部20は、子機1bにおいて音声データに対応する音声案内を報知すべき事象が発生したときに子機1bから音声データを受信し、受信された音声データに対して解凍処理(デコード)を実行して音声信号データを作成する。報知部21は、上記音声信号データを再生して音声案内を報知する。
【0054】
以上、実施形態6によれば、親機2aを簡単な構成にすることができるので、親機2aの低コスト化を図ることができる。
【0055】
(実施形態7)
本発明の実施形態7について図9を用いて説明する。図9は、実施形態7の音声案内システムにおける子機の構成を示すブロック図である。なお、図9のC及びDは、図6のC及びDでネットワーク3を介して親機2a、設定入力機4b及びセンターサーバ5と接続する。
【0056】
実施形態7の音声案内システムは、実施形態5の音声案内システム(図6参照)と同様に、親機2aと、設定入力機4bと、センターサーバ5とを備えているが、実施形態5の音声案内システムにはない以下に記載の特徴部分がある。
【0057】
実施形態7の音声案内システムは、実施形態5の2つの子機に代えて、図9に示すような2つの子機1c,1cを備えている。各子機1cは、記憶部10c及び制御部11cを備えているとともに、音声合成部12と、報知部13とを備えている。音声合成部12は、例えば親機2aの音声合成部20a(図7参照)と同様の構成であり、上記テキスト合成データに対応する音声案内を報知すべき事象を擬似的に発生させて、記憶部10cに記憶されているテキスト合成データを用いて音声信号データを作成する。一方、報知部13は、例えばスピーカなどを備え、上記音声信号データを再生して音声案内を報知する。なお、各子機1cは、上記以外の点において、実施形態5の各子機1b(図6参照)と同様である。
【0058】
以上、実施形態7によれば、子機1cの記憶部10cに記憶されているテキスト合成データに対応する音声案内を子機1cで聴いて確認することができる。
【0059】
(実施形態8)
本発明の実施形態8について説明する。
【0060】
実施形態8の音声案内システムは、図6,9に示すように、2つの子機1c,1cと、親機2aと、設定入力機4bと、センターサーバ5とを、実施形態7の音声案内システムと同様に備えているが、実施形態7の音声案内システムにはない以下に記載の特徴部分がある。
【0061】
実施形態8の設定入力機4bの操作部40は、子機1cの報知部13で音声案内が報知されたときに上記音声案内の読みが誤っていた場合、ユーザの操作によって音声案内の文章の再入力が行われる。制御部41bは、上記音声案内の文章に基づいてテキストデータを訂正する。なお、実施形態8の設定入力機4bは、上記以外の点において、実施形態6の設定入力機と同様である。
【0062】
また、実施形態8のセンターサーバ5は、設定入力機4bがテキストデータを訂正するごとに、例えば人名など漢字の読みとアクセントのデータを記憶する。上記より、センターサーバ5の辞書機能が拡張、拡充されるので、多様な読み方をすることができる。なお、実施形態8のセンターサーバ5は、上記以外の点において、実施形態6のセンターサーバと同様である。
【0063】
以上、実施形態8によれば、音声案内の読みが間違っていたとしても、設定入力機4bでテキストデータを訂正することができる。
【0064】
なお、実施形態1〜8の変形例として、子機が2つに限定されるものではなく、1つ又は3つ以上であってもよい。このような構成にしても、実施形態1〜8と同様の効果を奏する。
【0065】
(実施形態9)
本発明の実施形態9について図10を用いて説明する。図10は、実施形態9の音声案内システムの構成を示すブロック図である。
【0066】
実施形態9の音声案内システムは、住宅設備を対象としたものであり、図10に示すように、8つの子機7・・・と、インターホン室内機2bと、パソコン4cとを、ネットワーク3を介して接続して備えている。なお、インターホン室内機2bは、実施形態1の親機2(図1参照)と同様に、音声合成部(図示せず)と、報知部(図示せず)とを備えている。また、パソコン4cは、実施形態2の設定入力機4(図4参照)と同様に、操作部と、制御部とを備えている。
【0067】
各子機7は、記憶部(図示せず)がテキストデータ及び上記テキストデータに対応する音声案内を報知すべき事象を記憶している。複数の子機7・・・として、カメラ70と、インターホン71と、ブレーカ72と、煙・熱センサ73と、窓センサ74と、ドアセンサ75と、人感センサ76と、電気機器77とを備えている。煙・熱センサ73は、煙や熱を検知するものである。窓センサ74は、窓の開閉状態を検知するものである。ドアセンサ75は、ドアの開閉状態を検知するものである。人感センサ76は、人の存在・不在を検知するものである。電気機器77は、JEM−A規格に準拠してネットワーク3に接続されるものであり、例えば、照明器具、エアコン、給湯器、電気錠、床暖房器具、コンロなどである。
【0068】
次に、実施形態9の音声案内システムにおいて窓センサ74又はドアセンサ75を用いた場合における音声案内の報知に関する動作について説明する。なお、窓センサ74又はドアセンサ75の記憶部(図示せず)が、センサデータが閾値を越えたときに報知してかつ「防犯異常発生」という音声案内の文章に対応するテキストデータをネットワーク3上に流すという条件を記憶している。まず、センサデータが閾値を越えたとき、窓センサ74又はドアセンサ75が、「防犯異常発生」という音声案内の文章に対応するテキストデータをインターホン室内機2bに送信する。続いて、インターホン室内機2bが音声合成部及び報知部によって音声案内を報知してユーザに知らせる。
【0069】
続いて、実施形態9の音声案内システムにおいてユーザが音声案内の文章を設定した場合の動作について説明する。まず、ユーザがパソコン4cを用いて、例えば「2階の201号室の部屋で防犯異常発生」という音声案内の文章を入力してテキストデータを設定する。この場合、固有名詞も含めて音声案内の文章をユーザが自由に作成し、編集する。続いて、窓センサ74の記憶部(図示せず)が上記テキストデータを記憶する。
【0070】
上記より、「2階の201号室の部屋で防犯異常発生」という音声案内をユーザが聴くことによって、2階の201号室の部屋を確認しに行かなければならないというように直感的に理解することができる。
【0071】
以上、実施形態9によれば、住宅設備を対象とした場合に音声案内システムを有効に用いることができる。
【0072】
なお、実施形態9の変形例として、パソコンに代えてテレビ又は携帯電話を備えてもよい。このような構成では、ユーザがテレビのリモコン又は携帯電話を用いて音声案内の文章を入力してテキストデータを設定することができる。
【0073】
(実施形態10)
本発明の実施形態10について図11を用いて説明する。図11は、実施形態10の音声案内システムの構成を示すブロック図である。
【0074】
実施形態10の音声案内システムは、住宅設備を対象としたものであり、図11に示すように、窓センサ(子機)74aと、インターホン室内機(親機)2cと、センターサーバ5bとを備え、窓センサ74a、インターホン室内機2c及びセンターサーバ5b間の通信方式としてEMIT(Embedded Micro Internetworking Technology)技術を用いている。
【0075】
実施形態10の窓センサ74aは、検知部740と、アプリケーション741と、EMIT通信ソフト742とを備え、例えばパソコン、テレビ、携帯電話などの設定入力機(図示せず)で設定されたテキストデータ、及び上記テキストデータに対応する音声案内を報知すべき事象をアプリケーション741に記憶している。また、実施形態10のインターホン室内機2cは、報知部21と、テキスト音声合成ソフトウェア22と、EMIT通信ソフト23とを備えている。さらに、実施形態10のセンターサーバ5bは、アプリケーション52と、EMIT通信ソフト53とを備えている。
【0076】
実施形態10の音声案内システムにおいて、新規の子機として窓センサ74aが宅内に追加されると、センターサーバ5bは、EMIT技術を用いているので、インターネット(宅外インターネット)6を介して上記窓センサ74aのネットワーク3との接続を、アプリケーション52によってEMIT通信ソフト53を介して自動的に検出する(コンフィギュレーションの自動検出)。これにより、窓センサ74aは、インターホン室内機2c及びセンターサーバ5bとのPeer−to−peer通信を行う状態になる。
【0077】
次に、実施形態10の音声案内システムにおける音声案内の報知に関する動作について説明する。まず、窓センサ74aのアプリケーション741が検知部740からのセンサデータを読み取って閾値を越えて、音声案内を報知すべき事象が発生したと判断したとき、EMIT通信ソフト742を介して、対応するテキストデータをインターホン室内機2cに送信する。続いて、インターホン室内機2cのテキスト音声合成ソフトウェア22が、EMIT通信ソフト23を介して受信されたテキストデータを変換して音声信号データを作成する。最後に、報知部21が音声信号データを再生して音声案内を報知する。
【0078】
以上、実施形態10によれば、EMIT技術を用いて音声案内を報知することができる。
【0079】
なお、実施形態10の変形例として、子機が1つに限定されるものではなく、2つ以上であってもよい。このような構成にしても、実施形態10と同様の効果を奏する。
【図面の簡単な説明】
【0080】
【図1】本発明による実施形態1の音声案内システムの構成を示すブロック図である。
【図2】同上の音声案内システムにおける親機の動作を示す図である。
【図3】同上の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【図4】本発明による実施形態2,3の音声案内システムの構成を示すブロック図である。
【図5】本発明による実施形態4の音声案内システムにおける設定入力機の構成を示すブロック図である。
【図6】本発明による実施形態5の音声案内システムの構成を示すブロック図である。
【図7】同上の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【図8】本発明による実施形態6の音声案内システムにおけるセンターサーバの構成を示すブロック図である。
【図9】本発明による実施形態7の音声案内システムにおける子機の構成を示すブロック図である。
【図10】本発明による実施形態9の音声案内システムの構成を示すブロック図である。
【図11】本発明による実施形態10の音声案内システムの構成を示すブロック図である。
【符号の説明】
【0081】
1 子機
10 記憶部
11 制御部
2 親機
20 音声合成部
21 報知部
3 ネットワーク
【技術分野】
【0001】
本発明は、音声案内を報知する音声案内システムに関するものである。
【背景技術】
【0002】
従来、例えばシステムの状態や操作の案内、異常発生時などに関する音声案内を報知する音声案内システムとして、予め音声案内データを記憶する記憶部と、上記音声案内データに基づいて音声案内を報知する音声変換部(デコーダ部)とを単一のサブシステムに備える第1の従来音声案内システムがある。
【0003】
また、特許文献1には、それぞれが火災感知器と接続する複数の端末装置(子機)と、各端末装置と接続するセンタ装置(親機)とを備える異常報知システム(第2の従来音声案内システム)が開示されている。上記特許文献1の異常報知システムにおいて、センタ装置は、各端末装置からの制御信号に対応する音声案内データを記憶する記憶部を備える。上記特許文献1の異常報知システムの動作について説明すると、まず、端末装置が火災感知器の検知に基づいて火災発生と確定した場合、センタ装置に制御信号を送信する。続いて、センタ装置が制御信号を受信すると、上記制御信号に対応する音声案内データを記憶部から読み出し、上記音声案内データに基づいて音声メッセージ(音声案内)を報知する。
【特許文献1】特開2004−185151号公報(第7頁及び第1〜3図)
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記第1の従来音声案内システムは、音声案内データを記憶する記憶部と音声変換部とを単一のサブシステムに備えるので、システム自身が小規模で事後に拡張されることがなくスタンドアローンで利用される場合には有効であった。しかしながら、第1の従来音声案内システムは、事後にサブシステムを追加したり結合したりすることで拡張して大規模かつ複雑になる場合、当初から想定されるあらゆる音声案内データを抽出して単一のサブシステムに備えることが非常に困難であるという問題があった。また、ユーザごとに希望のシステム構成があるので、それぞれの音声案内データが、一部のユーザに対しては有用なものであっても、別のユーザに対しては不用なものであるといった問題も発生した。
【0005】
一方、第2の従来音声案内システムは、各子機から親機への制御信号の種類が多くなるにつれて音声案内データの種類も多くなることから、親機の記憶部の容量を大きくする必要がある。これにより、上記第2の従来音声案内システムは、親機側に機能が集中して大型かつ高コストになってしまうという問題があった。
【0006】
本発明は上記の点に鑑みて為されたものであり、その目的とするところは、用途に応じて最適に構築することができる音声案内システムを提供することにある。
【課題を解決するための手段】
【0007】
請求項1に記載の発明は、音声案内データ及びその音声案内データに対応する音声案内を報知すべき事象を記憶する子機記憶手段と、前記事象が発生したときに前記音声案内データを送信する子機制御手段とを含む子機を単一又は複数備えるとともに、前記子機から前記音声案内データを受信し、受信された音声案内データに基づいて前記音声案内を報知する親機制御手段を含む親機を備えることを特徴とする。
【0008】
この構成では、親機が子機に対応する音声案内データを記憶する必要がなく、必要な音声案内に応じて子機を親機に接続して用いることができるので、用途に応じて最適な音声案内システムを構築することができる。
【0009】
請求項2に記載の発明は、請求項1に記載の発明において、前記音声案内データを設定する入力機制御手段を含む設定入力機を備え、前記子機制御手段が、前記設定入力機から前記音声案内データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声案内データを記憶することを特徴とする。この構成では、好みの音声案内データを子機に記憶させることができるので、実際に音声案内されたときに直感的にわかりやすくなる。
【0010】
請求項3に記載の発明は、請求項1又は2に記載の発明において、前記子機記憶手段が、テキストデータを前記音声案内データとして記憶し、前記親機制御手段が、前記事象が発生したときに前記子機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する親機解析手段と、前記テキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含むことを特徴とする。この構成では、用途に応じて最適な音声案内システムを構築することができる。
【0011】
請求項4に記載の発明は、請求項1に記載の発明において、前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成し、前記テキスト合成データを前記子機に送信するサーバ解析手段を含むセンターサーバを備え、前記子機制御手段が、前記センターサーバから前記テキスト合成データを受信し、前記子機記憶手段が、前記子機制御手段で受信されたテキスト合成データを前記音声案内データとして記憶し、前記親機制御手段が、前記事象が発生したときに前記子機から前記テキスト合成データを受信し、受信されたテキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含むことを特徴とする。この構成では、親機がテキスト合成データを受信することによって、親機のメモリ容量を小さくすることができ、低コスト化を図ることができる。
【0012】
請求項5に記載の発明は、請求項1に記載の発明において、前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成するサーバ解析手段と、前記テキスト合成データを用いて音声データを作成し、前記音声データを前記子機に送信するサーバ音声信号作成手段とを含むセンターサーバを備え、前記子機制御手段が、前記センターサーバから前記音声データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声データを前記音声案内データとして記憶し、前記親機制御手段が、前記事象が発生したときに前記子機から前記音声データを受信し、受信された音声データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含むことを特徴とする。この構成では、親機を簡単な構成にすることができるので、親機の低コスト化を図ることができる。
【0013】
請求項6に記載の発明は、請求項2に記載の発明において、前記設定入力機が、設定された前記音声案内データに基づいて前記音声案内を報知する入力機報知手段を含むことを特徴とする。この構成では、設定入力機において、入力機制御手段で設定された音声案内データに対応する音声案内を聴いて確認することができる。
【0014】
請求項7に記載の発明は、請求項2〜6のいずれかに記載の発明において、前記子機が、前記子機記憶手段に記憶されている前記音声案内データに基づいて前記音声案内を報知する子機報知手段を含むことを特徴とする。この構成では、子機記憶手段に記憶されている音声案内データに対応する音声案内を、子機で聴いて確認することができる。
【0015】
請求項8に記載の発明は、請求項7に記載の発明において、前記設定入力機が、前記子機報知手段で前記音声案内が報知されたときにその音声案内の読みが誤っていた場合、前記音声案内データを訂正する訂正手段を含むことを特徴とする。この構成では、音声案内の読みが間違っていたとしても、設定入力機で音声案内データを訂正することができる。
【発明の効果】
【0016】
本発明によれば、用途に応じて最適な音声案内システムを構築することができる。
【発明を実施するための最良の形態】
【0017】
(実施形態1)
本発明の実施形態1について図1〜3を用いて説明する。図1は、実施形態1の音声案内システムの構成を示すブロック図である。図2は、実施形態1の音声案内システムにおける親機の動作を示す図である。図3は、実施形態1の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【0018】
まず、実施形態1の基本的な構成について説明する。実施形態1の音声案内システムは、音声案内を報知するものであり、図1に示すように、2つの子機1,1と、親機2とをネットワーク3を介して接続して備えている。実施形態1の音声案内システムにおけるネットワーク3の構築形式は、子機1をサーバ、親機2をクライアントとして、TCP/IPプロトコルでイーサネット(登録商標)接続する形式である。なお、上記ネットワーク3の構築形式は一例であって限定されるものではなく、用途に応じて適宜設定されるものである。
【0019】
各子機1は、記憶部10と、制御部11とを備えている。記憶部10は、子機固有の音声案内に関するテキストデータを音声案内データとして記憶しているとともに、上記テキストデータに対応する音声案内を報知すべき事象(ルール、イベント)も記憶している。一方、制御部11は、上記事象が発生したときにネットワーク3を介して、記憶部10に記憶されているテキストデータを親機2に送信するものである。上記テキストデータとして、日本語が対象の場合、漢字かな混じりテキストデータ、かなテキストデータなどがある。また、他にもローマ字テキストデータや英字のテキストデータなどがある。なお、子機1として複数の種類のものがあり、用途に応じて選択して用いることができる。
【0020】
親機2は、図2に示すように、音声合成部20と、報知部21とを備え、ユーザインタフェースの役割を有する。上記親機2は、音声変換ソフトウェアであるテキスト音声合成ソフトウェアを用いて、HMM(Hidden Markov Model)音声合成方式で音声案内を報知する。なお、親機2の音声合成方式は、HMM音声合成方式に限定されるものではなく、例えば波形接続方式など他の音声合成方式であってもよい。
【0021】
音声合成部20は、図3に示すように、言語データベース(言語D/B)200と、解析部201と、コンテキスト依存HMM(音響D/B)202と、音声波形生成部(音声信号作成手段)203とを備えている。
【0022】
言語データベース200は、テキストデータの読み、アクセント、品詞、ポーズなどといった情報を記憶している。解析部201は、各子機1(図1参照)からテキストデータを受信し、受信されたテキストデータに対して言語データベース200の情報を用いて言語解析を実行してテキスト合成データ(中間ファイル)を作成する。上記テキスト合成データは、読み、アクセント、品詞、ポーズなどの情報がテキスト化されている。コンテキスト依存HMM202は、多くの音響的特徴量を記憶し、この中から必要な音響的特徴量を音声波形生成部203に出力する。音声波形生成部203は、解析部201からのテキスト合成データ及びコンテキスト依存HMM202からの音響的特徴量を用いて音声信号データを作成する。
【0023】
一方、報知部21は、図2に示すように、D/A変換部210と、スピーカ211とを備えている。D/A変換部210は、音声波形生成部203で作成された音声信号データをアナログ音声信号に変換する。一方、スピーカ211は、上記アナログ音声信号を再生して音声案内を報知する。
【0024】
次に、実施形態1の音声案内システムの動作について図1,3を用いて説明する。まず、図1に示すように、いずれかの子機1の記憶部10に記憶されているテキストデータに対応する音声案内を報知すべき事象が発生したときに、上記子機1の制御部11が上記テキストデータを親機2に送信する。続いて、図3に示すように、親機2の音声合成部20において、解析部201がテキストデータに対して言語データベース200の情報を用いて言語解析を実行してテキスト合成データを作成する。その後、音声波形生成部203が、テキスト合成データ及び音響的特徴量を用いて音声信号データを作成する。最後に、報知部21が上記音声信号データを再生して音声案内を報知する。
【0025】
以上、実施形態1によれば、親機2が子機1ごとに対応するテキストデータを記憶する必要がなく、必要な音声案内に応じて子機1を親機2に接続して用いることができるので、用途に応じて最適な音声案内システムを構築することができる。
【0026】
(実施形態2)
本発明の実施形態2について図4を用いて説明する。図4は、実施形態2の音声案内システムの構成を示すブロック図である。
【0027】
実施形態2の音声案内システムは、図4に示すように、親機2を実施形態1の音声案内システムと同様に備えているが、実施形態1の音声案内システムにはない以下に記載の特徴部分がある。
【0028】
実施形態2の音声案内システムは、設定入力機4を備えている。設定入力機4は、例えばパソコン、テレビ、携帯電話などであり、操作部40と、制御部41とを備えている。操作部40は、各子機1に対応する音声案内の文章(例えば漢字かな混じり文章やひらがな、カタカナなど)の作成又は編集がユーザの入力操作で行われる。一方、制御部41は、上記音声案内の文章に基づくテキストデータを音声案内データとして設定する。すなわち、上記ユーザは、設定入力機4がパソコンの場合、操作部40となるキーボードから上記音声案内の文章を入力し、設定入力機4がテレビの場合、リモコンをキーボード代わりの操作部40として上記音声案内の文章を入力し、設定入力機4が携帯電話の場合、本体に設けられている操作ボタンを操作部40として上記音声案内の文章を入力する。また、設定入力機4が携帯電話の場合、ユーザは広い範囲から上記音声案内の文章を入力することができる。上記制御部41は、設定されたテキストデータを、ネットワーク3を介して対象の子機1aに送信する。
【0029】
また、実施形態2の音声案内システムは、実施形態1の2つの子機に代えて、図4に示すような2つの子機1a,1aを備えている。各子機1aは、制御部11aが設定入力機4からテキストデータを受信し、記憶部10aが、制御部11aで受信されたテキストデータを音声案内データとして記憶する。なお、各子機1aは、上記以外の点において、実施形態1の各子機1(図1参照)と同様である。
【0030】
次に、実施形態2の音声案内システムの動作について説明する。まず、ユーザが設定入力機4の操作部40を用いて音声案内の文章を入力し、制御部41が、上記音声案内の文章テキストデータを設定する。続いて、制御部41がテキストデータを子機1aに送信する。子機1aの記憶部10が設定入力機4からのテキストデータを記憶する。その後、実施形態1と同様に、親機2の音声合成部20及び報知部21がテキストデータに基づいて音声案内を報知する。
【0031】
以上、実施形態2によれば、ユーザ自身が好みの音声案内の文章を入力してテキストデータを設定し、上記テキストデータを子機1の記憶部10に記憶させることができるので、実際に音声案内されたときに直感的にわかりやすくなる。
【0032】
(実施形態3)
本発明の実施形態3について図4を用いて説明する。図4は、実施形態3の音声案内システムの構成を示すブロック図である。
【0033】
実施形態3の音声案内システムは、図4に示すように、2つの子機1a,1aと、親機2と、設定入力機4とを、実施形態2の音声案内システムと同様に備えているが、実施形態2の音声案内システムにはない以下に記載の特徴部分がある。
【0034】
実施形態3の音声案内システムでは、音声案内データとしてテキストデータに代えて、音声データを用いている。実施形態3の設定入力機4は、操作部40としてマイク(図示せず)を備え、上記マイクを介してユーザ自身の音声や他人の音声を取り込む。制御部41は、音声データの編集ツール(例えばADPCM)などを利用して音声データを設定する。上記制御部41は、ネットワーク3を介して上記音声データを音声案内データとして子機1aに送信する。
【0035】
一方、実施形態3の親機2の音声合成部20は、解凍処理部204(図2参照)を備えている。解凍処理部204は、例えばADPCMなどで圧縮された音声データに対して解凍処理を行い、音声信号データを作成する。
【0036】
以上、実施形態3によれば、音声案内データが音声データの場合であっても、テキストデータの場合と同様の効果を奏する。
【0037】
(実施形態4)
本発明の実施形態4について図5を用いて説明する。図5は、実施形態4の音声案内システムにおける設定入力機の構成を示すブロック図である。なお、図5のAは、図4のAでネットワーク3を介して各子機1aと接続する。
【0038】
実施形態4の音声案内システムは、実施形態2の音声案内システム(図4参照)と同様に、2つの子機1a,1aと、親機2とを備えているが、実施形態2の音声案内システムにはない以下に記載の特徴部分がある。
【0039】
実施形態4の音声案内システムは、実施形態2の設定入力機に代えて、図5に示すような設定入力機4aを備えている。設定入力機4aは、操作部40及び制御部41aを備えているとともに、音声合成部42と、報知部43とを備えている。音声合成部42は、例えば親機2の音声合成部20(図3参照)と同様の構成であり、制御部41aで設定されたテキストデータを用いて音声信号データを作成する。一方、報知部43は、例えばスピーカなどを設定入力機4の本体に内蔵又は外部接続して備え、上記音声信号データを再生して音声案内を報知する。なお、設定入力機4aは、上記以外の点において、実施形態2の設定入力機4(図4参照)と同様である。
【0040】
以上、実施形態4によれば、実施形態2と同様の効果を得ることができるとともに、設定入力機4において、制御部41aで設定されたテキストデータに基づいた音声案内を、設定時点の段階で聴いて確認することができる。
【0041】
(実施形態5)
本発明の実施形態5について図6,7を用いて説明する。図6は、実施形態5の音声案内システムの構成を示すブロック図である。図7は、実施形態5の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【0042】
実施形態5の音声案内システムは、図6に示すように、2つの子機1b,1bと、親機2aと、設定入力機4bと、センターサーバ5とをネットワーク3及びインターネット6を介して接続して備えている。
【0043】
設定入力機4bの制御部41bは、設定されたテキストデータを、ネットワーク3及びインターネット6を介してセンターサーバ5に送信する。なお、実施形態5の設定入力機4bは、上記以外の点において、実施形態2の設定入力機4(図4参照)と同様である。
【0044】
センターサーバ5は、解析部50を備えている。解析部50は、テキストデータからテキスト合成データを作成する部分のソフトウェアを備え、設定入力機4bからテキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する。上記解析部50は、インターネット6及びネットワーク3を介して、作成されたテキスト合成データを各子機1bに送信する。
【0045】
一方、各子機1bは、制御部11bがセンターサーバ5からテキスト合成データを受信し、記憶部10bが、制御部11bで受信されたテキスト合成データを音声案内データとして記憶している。なお、各子機1bは、上記以外の点において、実施形態1の各子機1(図1参照)と同様である。
【0046】
また、親機2aは、実施形態1と同様の報知部21を備えているとともに、図7に示すような音声合成部20aを備えている。音声合成部20aは、コンテキスト依存HMM202と、音声波形生成部203とを備えている。音声波形生成部203は、子機1bにおいてテキスト合成データに対応する音声案内を報知すべき事象が発生したときに子機1bからテキスト合成データを受信し、受信されたテキスト合成データ及びコンテキスト依存HMM202の音響的特徴量を用いて音声信号データを作成する。報知部21は、図6に示すように、上記音声信号データを再生して音声案内を報知する。
【0047】
次に、実施形態5の音声案内システムの動作について図6を用いて説明する。まず、ユーザが設定入力機4bを用いて音声案内の文章を入力してテキストデータを設定する。続いて、設定入力機4bの制御部41bがテキストデータをセンターサーバ5に送信する。センターサーバ5の解析部50がテキストデータからテキスト合成データを作成し、上記テキスト合成データを子機1bに送信する。続いて、子機1bにおいてテキスト合成データに対応する音声案内を報知すべき事象が発生したときに、子機1bの制御部11bがテキスト合成データを親機2aに送信する。その後、親機2aの音声合成部20aがテキスト合成データ及び音響的特徴量を用いて音声信号データを作成する。最後に、報知部21が上記音声信号データを再生して音声案内を報知する。
【0048】
以上、実施形態5によれば、親機2aの音声合成部20aがテキスト合成データを受信することによって、解析部及び言語データベースを備える必要がないので、音声合成部20aのメモリ容量を小さくすることができ、親機2aの低コスト化を図ることができる。
【0049】
(実施形態6)
本発明の実施形態6について図8を用いて説明する。図8は、実施形態6の音声案内システムにおけるセンターサーバの構成を示すブロック図である。なお、図8のBは、図6のBでネットワーク3を介して各子機1bと接続する。
【0050】
実施形態6の音声案内システムは、実施形態5の音声案内システム(図6参照)と同様に、2つの子機1b,1bと、親機2aと、設定入力機4bとを備えているが、実施形態5の音声案内システムにはない特徴部分がある。
【0051】
実施形態6の音声案内システムは、実施形態5のセンターサーバに代えて、図8に示すようなセンターサーバ5aを備えている。センターサーバ5aは、解析部50aと、音声信号作成部51とを備えている。解析部50aは、設定入力機4bからテキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する。音声信号作成部51は、テキスト合成データから音声信号データを作成するテキスト音声合成ソフトウェアと、音声信号データをADPCM形式の音声データに変換するソフトウェアとを備えている。上記音声信号作成部51は、解析部50aで作成されたテキスト合成データを用いて音声信号データを作成し、上記音声信号データをADPCM形式に圧縮して音声データを作成する。続いて、音声信号作成部51は、インターネット6及びネットワーク3を介して、上記音声データを子機1bに送信する。
【0052】
一方、実施形態6の各子機1bは、制御部11bがセンターサーバ5aから音声データを受信し、記憶部10bが、制御部11bで受信された音声データを音声案内データとして記憶している。上記各子機1bは、音声データに対応する音声案内を報知すべき事象が発生したときに音声データを親機2aに送信する。なお、実施形態6の各子機1bは、上記以外の点において、実施形態5の各子機と同様である。
【0053】
また、実施形態6の親機2aは、解凍処理部204(図2参照)を含む音声合成部20と、報知部21とを備えている。音声合成部20は、子機1bにおいて音声データに対応する音声案内を報知すべき事象が発生したときに子機1bから音声データを受信し、受信された音声データに対して解凍処理(デコード)を実行して音声信号データを作成する。報知部21は、上記音声信号データを再生して音声案内を報知する。
【0054】
以上、実施形態6によれば、親機2aを簡単な構成にすることができるので、親機2aの低コスト化を図ることができる。
【0055】
(実施形態7)
本発明の実施形態7について図9を用いて説明する。図9は、実施形態7の音声案内システムにおける子機の構成を示すブロック図である。なお、図9のC及びDは、図6のC及びDでネットワーク3を介して親機2a、設定入力機4b及びセンターサーバ5と接続する。
【0056】
実施形態7の音声案内システムは、実施形態5の音声案内システム(図6参照)と同様に、親機2aと、設定入力機4bと、センターサーバ5とを備えているが、実施形態5の音声案内システムにはない以下に記載の特徴部分がある。
【0057】
実施形態7の音声案内システムは、実施形態5の2つの子機に代えて、図9に示すような2つの子機1c,1cを備えている。各子機1cは、記憶部10c及び制御部11cを備えているとともに、音声合成部12と、報知部13とを備えている。音声合成部12は、例えば親機2aの音声合成部20a(図7参照)と同様の構成であり、上記テキスト合成データに対応する音声案内を報知すべき事象を擬似的に発生させて、記憶部10cに記憶されているテキスト合成データを用いて音声信号データを作成する。一方、報知部13は、例えばスピーカなどを備え、上記音声信号データを再生して音声案内を報知する。なお、各子機1cは、上記以外の点において、実施形態5の各子機1b(図6参照)と同様である。
【0058】
以上、実施形態7によれば、子機1cの記憶部10cに記憶されているテキスト合成データに対応する音声案内を子機1cで聴いて確認することができる。
【0059】
(実施形態8)
本発明の実施形態8について説明する。
【0060】
実施形態8の音声案内システムは、図6,9に示すように、2つの子機1c,1cと、親機2aと、設定入力機4bと、センターサーバ5とを、実施形態7の音声案内システムと同様に備えているが、実施形態7の音声案内システムにはない以下に記載の特徴部分がある。
【0061】
実施形態8の設定入力機4bの操作部40は、子機1cの報知部13で音声案内が報知されたときに上記音声案内の読みが誤っていた場合、ユーザの操作によって音声案内の文章の再入力が行われる。制御部41bは、上記音声案内の文章に基づいてテキストデータを訂正する。なお、実施形態8の設定入力機4bは、上記以外の点において、実施形態6の設定入力機と同様である。
【0062】
また、実施形態8のセンターサーバ5は、設定入力機4bがテキストデータを訂正するごとに、例えば人名など漢字の読みとアクセントのデータを記憶する。上記より、センターサーバ5の辞書機能が拡張、拡充されるので、多様な読み方をすることができる。なお、実施形態8のセンターサーバ5は、上記以外の点において、実施形態6のセンターサーバと同様である。
【0063】
以上、実施形態8によれば、音声案内の読みが間違っていたとしても、設定入力機4bでテキストデータを訂正することができる。
【0064】
なお、実施形態1〜8の変形例として、子機が2つに限定されるものではなく、1つ又は3つ以上であってもよい。このような構成にしても、実施形態1〜8と同様の効果を奏する。
【0065】
(実施形態9)
本発明の実施形態9について図10を用いて説明する。図10は、実施形態9の音声案内システムの構成を示すブロック図である。
【0066】
実施形態9の音声案内システムは、住宅設備を対象としたものであり、図10に示すように、8つの子機7・・・と、インターホン室内機2bと、パソコン4cとを、ネットワーク3を介して接続して備えている。なお、インターホン室内機2bは、実施形態1の親機2(図1参照)と同様に、音声合成部(図示せず)と、報知部(図示せず)とを備えている。また、パソコン4cは、実施形態2の設定入力機4(図4参照)と同様に、操作部と、制御部とを備えている。
【0067】
各子機7は、記憶部(図示せず)がテキストデータ及び上記テキストデータに対応する音声案内を報知すべき事象を記憶している。複数の子機7・・・として、カメラ70と、インターホン71と、ブレーカ72と、煙・熱センサ73と、窓センサ74と、ドアセンサ75と、人感センサ76と、電気機器77とを備えている。煙・熱センサ73は、煙や熱を検知するものである。窓センサ74は、窓の開閉状態を検知するものである。ドアセンサ75は、ドアの開閉状態を検知するものである。人感センサ76は、人の存在・不在を検知するものである。電気機器77は、JEM−A規格に準拠してネットワーク3に接続されるものであり、例えば、照明器具、エアコン、給湯器、電気錠、床暖房器具、コンロなどである。
【0068】
次に、実施形態9の音声案内システムにおいて窓センサ74又はドアセンサ75を用いた場合における音声案内の報知に関する動作について説明する。なお、窓センサ74又はドアセンサ75の記憶部(図示せず)が、センサデータが閾値を越えたときに報知してかつ「防犯異常発生」という音声案内の文章に対応するテキストデータをネットワーク3上に流すという条件を記憶している。まず、センサデータが閾値を越えたとき、窓センサ74又はドアセンサ75が、「防犯異常発生」という音声案内の文章に対応するテキストデータをインターホン室内機2bに送信する。続いて、インターホン室内機2bが音声合成部及び報知部によって音声案内を報知してユーザに知らせる。
【0069】
続いて、実施形態9の音声案内システムにおいてユーザが音声案内の文章を設定した場合の動作について説明する。まず、ユーザがパソコン4cを用いて、例えば「2階の201号室の部屋で防犯異常発生」という音声案内の文章を入力してテキストデータを設定する。この場合、固有名詞も含めて音声案内の文章をユーザが自由に作成し、編集する。続いて、窓センサ74の記憶部(図示せず)が上記テキストデータを記憶する。
【0070】
上記より、「2階の201号室の部屋で防犯異常発生」という音声案内をユーザが聴くことによって、2階の201号室の部屋を確認しに行かなければならないというように直感的に理解することができる。
【0071】
以上、実施形態9によれば、住宅設備を対象とした場合に音声案内システムを有効に用いることができる。
【0072】
なお、実施形態9の変形例として、パソコンに代えてテレビ又は携帯電話を備えてもよい。このような構成では、ユーザがテレビのリモコン又は携帯電話を用いて音声案内の文章を入力してテキストデータを設定することができる。
【0073】
(実施形態10)
本発明の実施形態10について図11を用いて説明する。図11は、実施形態10の音声案内システムの構成を示すブロック図である。
【0074】
実施形態10の音声案内システムは、住宅設備を対象としたものであり、図11に示すように、窓センサ(子機)74aと、インターホン室内機(親機)2cと、センターサーバ5bとを備え、窓センサ74a、インターホン室内機2c及びセンターサーバ5b間の通信方式としてEMIT(Embedded Micro Internetworking Technology)技術を用いている。
【0075】
実施形態10の窓センサ74aは、検知部740と、アプリケーション741と、EMIT通信ソフト742とを備え、例えばパソコン、テレビ、携帯電話などの設定入力機(図示せず)で設定されたテキストデータ、及び上記テキストデータに対応する音声案内を報知すべき事象をアプリケーション741に記憶している。また、実施形態10のインターホン室内機2cは、報知部21と、テキスト音声合成ソフトウェア22と、EMIT通信ソフト23とを備えている。さらに、実施形態10のセンターサーバ5bは、アプリケーション52と、EMIT通信ソフト53とを備えている。
【0076】
実施形態10の音声案内システムにおいて、新規の子機として窓センサ74aが宅内に追加されると、センターサーバ5bは、EMIT技術を用いているので、インターネット(宅外インターネット)6を介して上記窓センサ74aのネットワーク3との接続を、アプリケーション52によってEMIT通信ソフト53を介して自動的に検出する(コンフィギュレーションの自動検出)。これにより、窓センサ74aは、インターホン室内機2c及びセンターサーバ5bとのPeer−to−peer通信を行う状態になる。
【0077】
次に、実施形態10の音声案内システムにおける音声案内の報知に関する動作について説明する。まず、窓センサ74aのアプリケーション741が検知部740からのセンサデータを読み取って閾値を越えて、音声案内を報知すべき事象が発生したと判断したとき、EMIT通信ソフト742を介して、対応するテキストデータをインターホン室内機2cに送信する。続いて、インターホン室内機2cのテキスト音声合成ソフトウェア22が、EMIT通信ソフト23を介して受信されたテキストデータを変換して音声信号データを作成する。最後に、報知部21が音声信号データを再生して音声案内を報知する。
【0078】
以上、実施形態10によれば、EMIT技術を用いて音声案内を報知することができる。
【0079】
なお、実施形態10の変形例として、子機が1つに限定されるものではなく、2つ以上であってもよい。このような構成にしても、実施形態10と同様の効果を奏する。
【図面の簡単な説明】
【0080】
【図1】本発明による実施形態1の音声案内システムの構成を示すブロック図である。
【図2】同上の音声案内システムにおける親機の動作を示す図である。
【図3】同上の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【図4】本発明による実施形態2,3の音声案内システムの構成を示すブロック図である。
【図5】本発明による実施形態4の音声案内システムにおける設定入力機の構成を示すブロック図である。
【図6】本発明による実施形態5の音声案内システムの構成を示すブロック図である。
【図7】同上の音声案内システムの親機における音声合成部の構成を示すブロック図である。
【図8】本発明による実施形態6の音声案内システムにおけるセンターサーバの構成を示すブロック図である。
【図9】本発明による実施形態7の音声案内システムにおける子機の構成を示すブロック図である。
【図10】本発明による実施形態9の音声案内システムの構成を示すブロック図である。
【図11】本発明による実施形態10の音声案内システムの構成を示すブロック図である。
【符号の説明】
【0081】
1 子機
10 記憶部
11 制御部
2 親機
20 音声合成部
21 報知部
3 ネットワーク
【特許請求の範囲】
【請求項1】
音声案内データ及びその音声案内データに対応する音声案内を報知すべき事象を記憶する子機記憶手段と、前記事象が発生したときに前記音声案内データを送信する子機制御手段とを含む子機を単一又は複数備えるとともに、
前記子機から前記音声案内データを受信し、受信された音声案内データに基づいて前記音声案内を報知する親機制御手段を含む親機を備える
ことを特徴とする音声案内システム。
【請求項2】
前記音声案内データを設定する入力機制御手段を含む設定入力機を備え、
前記子機制御手段が、前記設定入力機から前記音声案内データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声案内データを記憶する
ことを特徴とする請求項1記載の音声案内システム。
【請求項3】
前記子機記憶手段が、テキストデータを前記音声案内データとして記憶し、
前記親機制御手段が、前記事象が発生したときに前記子機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する親機解析手段と、前記テキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含む
ことを特徴とする請求項1又は2記載の音声案内システム。
【請求項4】
前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、
前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成し、前記テキスト合成データを前記子機に送信するサーバ解析手段を含むセンターサーバを備え、
前記子機制御手段が、前記センターサーバから前記テキスト合成データを受信し、前記子機記憶手段が、前記子機制御手段で受信されたテキスト合成データを前記音声案内データとして記憶し、
前記親機制御手段が、前記事象が発生したときに前記子機から前記テキスト合成データを受信し、受信されたテキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含む
ことを特徴とする請求項1記載の音声案内システム。
【請求項5】
前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、
前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成するサーバ解析手段と、前記テキスト合成データを用いて音声データを作成し、前記音声データを前記子機に送信するサーバ音声信号作成手段とを含むセンターサーバを備え、
前記子機制御手段が、前記センターサーバから前記音声データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声データを前記音声案内データとして記憶し、
前記親機制御手段が、前記事象が発生したときに前記子機から前記音声データを受信し、受信された音声データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含む
ことを特徴とする請求項1記載の音声案内システム。
【請求項6】
前記設定入力機が、設定された前記音声案内データに基づいて前記音声案内を報知する入力機報知手段を含むことを特徴とする請求項2記載の音声案内システム。
【請求項7】
前記子機が、前記子機記憶手段に記憶されている前記音声案内データに基づいて前記音声案内を報知する子機報知手段を含むことを特徴とする請求項2〜6のいずれか記載の音声案内システム。
【請求項8】
前記設定入力機が、前記子機報知手段で前記音声案内が報知されたときにその音声案内の読みが誤っていた場合、前記音声案内データを訂正する訂正手段を含むことを特徴とする請求項7記載の音声案内システム。
【請求項1】
音声案内データ及びその音声案内データに対応する音声案内を報知すべき事象を記憶する子機記憶手段と、前記事象が発生したときに前記音声案内データを送信する子機制御手段とを含む子機を単一又は複数備えるとともに、
前記子機から前記音声案内データを受信し、受信された音声案内データに基づいて前記音声案内を報知する親機制御手段を含む親機を備える
ことを特徴とする音声案内システム。
【請求項2】
前記音声案内データを設定する入力機制御手段を含む設定入力機を備え、
前記子機制御手段が、前記設定入力機から前記音声案内データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声案内データを記憶する
ことを特徴とする請求項1記載の音声案内システム。
【請求項3】
前記子機記憶手段が、テキストデータを前記音声案内データとして記憶し、
前記親機制御手段が、前記事象が発生したときに前記子機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成する親機解析手段と、前記テキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含む
ことを特徴とする請求項1又は2記載の音声案内システム。
【請求項4】
前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、
前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成し、前記テキスト合成データを前記子機に送信するサーバ解析手段を含むセンターサーバを備え、
前記子機制御手段が、前記センターサーバから前記テキスト合成データを受信し、前記子機記憶手段が、前記子機制御手段で受信されたテキスト合成データを前記音声案内データとして記憶し、
前記親機制御手段が、前記事象が発生したときに前記子機から前記テキスト合成データを受信し、受信されたテキスト合成データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含む
ことを特徴とする請求項1記載の音声案内システム。
【請求項5】
前記音声案内の文章の作成又は編集が行われる操作手段と、前記操作手段で作成又は編集が行われた音声案内の文章に基づくテキストデータを設定する入力機制御手段とを含む設定入力機を備えるとともに、
前記設定入力機から前記テキストデータを受信し、受信されたテキストデータに対して言語解析を実行してテキスト合成データを作成するサーバ解析手段と、前記テキスト合成データを用いて音声データを作成し、前記音声データを前記子機に送信するサーバ音声信号作成手段とを含むセンターサーバを備え、
前記子機制御手段が、前記センターサーバから前記音声データを受信し、前記子機記憶手段が、前記子機制御手段で受信された音声データを前記音声案内データとして記憶し、
前記親機制御手段が、前記事象が発生したときに前記子機から前記音声データを受信し、受信された音声データを用いて音声信号データを作成する親機音声信号作成手段と、前記音声信号データを再生して前記音声案内を報知する親機報知手段とを含む
ことを特徴とする請求項1記載の音声案内システム。
【請求項6】
前記設定入力機が、設定された前記音声案内データに基づいて前記音声案内を報知する入力機報知手段を含むことを特徴とする請求項2記載の音声案内システム。
【請求項7】
前記子機が、前記子機記憶手段に記憶されている前記音声案内データに基づいて前記音声案内を報知する子機報知手段を含むことを特徴とする請求項2〜6のいずれか記載の音声案内システム。
【請求項8】
前記設定入力機が、前記子機報知手段で前記音声案内が報知されたときにその音声案内の読みが誤っていた場合、前記音声案内データを訂正する訂正手段を含むことを特徴とする請求項7記載の音声案内システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2007−171698(P2007−171698A)
【公開日】平成19年7月5日(2007.7.5)
【国際特許分類】
【出願番号】特願2005−371085(P2005−371085)
【出願日】平成17年12月22日(2005.12.22)
【出願人】(000005832)松下電工株式会社 (17,916)
【Fターム(参考)】
【公開日】平成19年7月5日(2007.7.5)
【国際特許分類】
【出願日】平成17年12月22日(2005.12.22)
【出願人】(000005832)松下電工株式会社 (17,916)
【Fターム(参考)】
[ Back to top ]