説明

音声コントローラ

【課題】宅内の音響機器が音を出力している環境下でも、誤った音声認識による誤制御を防ぐことができる音声コントローラを提供することにある。
【解決手段】音声コントローラ1は、集音部10で集音した音に含まれる宅内の音響機器の3出力音に対してエコーキャンセル処理部11でエコーキャンセル処理を施した上で、更にエコーキャンセル処理部11の出力信号に雑音信号を重畳させて出力信号を平滑化し、この平滑化した信号と、音声認識モデルとを比較して出力信号に含まれる音声を認識するのである。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、住宅等の建物内に設置され、住宅内の設備を音声で操作する音声コントローラに関するものである。
【背景技術】
【0002】
住宅等の建物内に設置され、住宅内の設備を音声で操作する音声コントローラが提供されている。
【0003】
ところで、住宅内には多様な機器が存在し、これらをスイッチ等で操作するのは煩雑である。例えばキッチン空間には、給湯コントローラ、床暖房コントローラ、照明スイッチ、インターホンなどがあり、また浴室空間には、気泡浴槽コントローラ、照明スイッチ、浴室暖房換気乾燥機のスイッチ、テレビ等がある。
【0004】
また、これらのコントローラ、スイッチが複数存在することは、宅内の景観も損なうという課題がある。
【0005】
これらの課題を解決するために、複数の機器を制御可能とする統合的なコントローラが提供されており、またその操作を音声認識によって行うものが提供されてきている。このコントローラが所謂音声コントローラである。
【0006】
音声コントローラは、発話入力スイッチがあると、発話入力スイッチを操作する必要があるため、発話入力スイッチを設けていない場合が多いが、このような音声コントローラでは、設置している宅内の環境雑音(騒音)が集音用のマイクに入力されるために、環境騒音をユーザの発話音声と認識して、誤った制御を行う可能性がある。特に、対象空間にテレビ、ラジオ等の音響機器がある場合には、人の音声がマイクに入力された音響機器の出力音をエコーキャンセラにより低減する、例えば特許文献1に開示されている音声認識装置を用い方法も考えられる。
【特許文献1】特開2003−241791号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
ところで、エコーキャンセラは、音響機器が出力する音信号を参照信号として適応フィルタを逐次学習することで、音響機器の出力音が集音部であるマイクへ回り込むのを低減する技術である。また音声認識方法は、音声から特徴量を抽出し、この特徴量の時系列変化から発話内容を識別する方法であり、発話音量の個人差は、発話者とマイクとの距離の変動による入力レベルの変動の影響を受けないように、特徴量に音声パワーを用いずに音声パワーの日瓶値を用いるのが一般的である。
【0008】
一方住宅内の設備機器を音声で操作する音声コントローラでは、マイクから離れたユーザの声も認識できるように、集音部の入力ゲインを高く設定しなければならない上に、キッチンや浴室等の音の反射が強い環境では、残響時間が長くなるために、エコーキャンセラが推定するフィルタ長も長くなり、精度の高いフィルタ学習が困難になる。そのため回り込みの抑圧できなかった成分が多くなる。
【0009】
かように従来の音声コントローラでは、エコーキャンセラの抑圧量が十分ではなく、音響機器の出力音をユーザの発話音声と認識してしまい、誤った制御を行うという課題があった。
【0010】
本発明は、上述の点に鑑みて為されたもので、その目的とするところは、宅内の音響機器が音を出力している環境下でも、誤った音声認識による誤制御を防ぐことができる音声コントローラを提供することにある。
【課題を解決するための手段】
【0011】
上述の目的を達成するために、請求項1の発明では、ユーザから発声された音声を認識し、この認識した音声で規定される制御命令に従って制御対象の機器の動作を制御する音声コントローラであって、宅内の音信号を集音する集音部と、該集音部で集音した音に含まれる宅内の音響機器の出力音に対してエコーキャンセル処理を施すエコーキャンセル処理部と、音声認識の基準となる音声認識モデル及び重畳させる雑音信号を記憶している記憶部と、エコーキャンセル処理部の出力信号に雑音信号を重畳させて前記出力信号を平滑化する雑音重畳部と、前記雑音信号が重畳された出力信号と、前記音声認識モデルとを比較して前記出力信号に含まれる音声を認識する音声認識部と、該音声認識部で認識した音声に対応する制御命令を実行する制御実行部とを備えて成ることを特徴とする。
【0012】
請求項1の発明によれば、雑音重畳部を設けてエコーキャンセル部の出力信号に雑音信号を重畳して平滑化するので、宅内の音響機器が音を出力している環境下でも、音声認識部がユーザの音声を認識することができ、その結果誤った音声認識による誤制御を防ぐことができる。
【0013】
請求項2の発明では、請求項1の発明において、前記音響機器からの出力音の大きさを検知する出力音検知部を備え、前記雑音重畳部は、前記出力音検知部が検知した出力音の大きさに応じて、前記出力信号に重畳させる雑音信号の大きさを変化させることを特徴とする。
【0014】
請求項2の発明によれば、出力音のパワーが小さいときには重畳する雑音信号の割合を小さくし、出力音が大きいときには重畳ずる雑音信号の割合を大きくすることができ、そのため音響機器の出力音のパワーが小さいときに過大な雑音信号が重畳され、ユーザの音声信号も雑音信号により平滑化されてしまうことがなく、その結果ユーザの音声を認識できなくなるという問題を回避できる。
【0015】
請求項3の発明では、請求項1又は2の発明において、前記音声認識モデルは、前記出力信号に重畳させる雑音信号を予め組み込んで構成されていることを特徴とする。
【0016】
請求項3の発明によれば、音声認識モデルに重畳用の雑音信号を組み込んでいるので、雑音重畳部で雑音信号が重畳された音声信号と音声認識モデルとの間の音響的ミスマッチが減少することになり、ユーザの音声に雑音を重畳することによる認識性能の低下を減少させることができる。
【0017】
請求項4の発明では、請求項1の発明において、前記記憶部に記憶されている雑音信号は、宅内に設置された機器の定常雑音信号であることを特徴とする。
【0018】
請求項4の発明によれば、重畳用雑音信号が、既に宅内に設置された機器が発生する騒音の信号を用いるので、雑音信号を重畳することによる性能低下が、宅内機器の動作時の騒音による性能低下と同程度になり、ユーザの使用感に不自然さがなくなる。
【0019】
請求項5の発明では、請求項4の発明において、前記音声認識モデルは、前記出力信号に重畳する前記定常雑音信号を予め組み込んで構成されていることを特徴とする。
【0020】
請求項5の発明によれば、音声認識モデルにも重畳用の定常雑音信号を組み込んでいるので、雑音重畳部で定常雑音信号が重畳された音声信号と音声認識モデルとの間の音響的ミスマッチが減少することになり、ユーザの音声に雑音を重畳することによる認識性能の低下を減少させることができる。
【0021】
請求項6の発明では、請求項4又は5の発明において、前記宅内に設置された前記機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記機器の電源がオンしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする。
【0022】
請求項6の発明によれば、機器の電源がオンしている場合には、雑音信号を重畳しないので、雑音信号の重畳分に代わり、浴室機器2の発する騒音が混入されることになるが、ユーザの音声と雑音のS/N比が想定以上に劣化して認識性能が低下することもなく、しかも浴室機器の騒音がエコーキャンセル未抑圧成分を平滑化するので、雑音信号を重畳しなくても音響機器の出力音信号を平滑化し、誤制御することがない。
【0023】
請求項7の発明では、請求項1乃至6の何れかの発明において、前記宅内に設置された前記音響機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記音響機器の電源がオフしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする。
【0024】
請求項7の発明によれば、音響機器の電源がオフしている場合に、雑音信号を重畳しないので、ユーザが小さな声で音声入力しても十分なS/N比を得ることができ、高い認識性能を得ることができる。
【発明の効果】
【0025】
本発明は、雑音重畳部を設けてエコーキャンセル部の出力信号に雑音信号を重畳して平滑化するので、宅内の音響機器が音を出力している環境下でも、音声認識部がユーザの音声を認識することができ、その結果誤った音声認識による誤制御を防ぐことができるという効果がある。
【発明を実施するための最良の形態】
【0026】
以下本発明を実施形態により説明する。
【0027】
(実施形態1)
本実施形態の音声コントローラ1は、例えば図1に示すように浴室に設置した浴室機器2を制御対象とするものであり、図示するようにユーザの発話音声を捉えて音信号(音声信号)に変換するマイクのような集音部10と、集音部10で集音される例えば浴室テレビ等の音響機器3の出力音に対してエコーキャンセル処理を施すエコーキャンセル部11と、音響機器3から、例えばライン入力でエコーキャンセル部11に参照信号として入力される出力音の音信号の信号パワーを計測する出力音検知部12と、エコーキャンセル部11の出力信号に重畳する重畳用雑音信号のデータを記憶する記憶部13と、エコーキャンセル部11の出力信号に重畳用雑音信号を重畳する雑音重畳部14と、制御対象機器である浴室機器2及び音響機器3の電源のオン/オフを検知する機器電源検知部15と、音声認識処理に用いる音声認識モデルのデータを記憶している記憶部16と、雑音重畳部14の出力信号と音声認識モデルとを比較して発話音声を認識する音声認識部17と、音声認識部17で認識した音声に対応する制御命令を実行して、本実施形態の制御対象機器である浴室機器2を制御する制御実行部18とで構成される。尚記憶部13,16は同じ記憶装置を用いて構成しても良い。
【0028】
図2はエコーキャンセル部11の構成を示しており、このエコーキャンセル部11は減算器11aと、適応フィルタ11bとで構成され、集音部10を構成するマイクでユーザの発話音声及び音響機器3のスピーカ3aで再生される出力音からなる音信号を減算器11aに入力する。この減算器11aは、音信号から適応フィルタ11bによって合成された推定エコー信号を減算し、エコーを消去して出力する。一方適応フィルタ11bは、減算器11aによる減算処理後の誤差信号から音響機器3のスピーカ3aから集音部10までの室内の伝達特性を推定し、この推定したフィルタを用いて音響機器3の出力音の音信号(参照信号)から前記推定エコー信号を減算器11aに出力する。
【0029】
次に本実施形態の音声コントローラ1の動作を説明する。
【0030】
まず、ユーザは、浴室機器2の制御を行いたい場合には、集音部10に所定の音声を入力する。
【0031】
このときに、浴室内の音響機器3が動作し、そのスピーカ3a(図2参照)から再生音、つまり出力音が出力されている場合、集音部10にこの出力音も入力することになる。
【0032】
図3(a)はユーザの音声(I)に続いて音響機器3の出力音(II)が集音部10に入力したときの集音部10から出力される音信号の波形例を示す。
【0033】
エコーキャンセル部11は集音部10から出力される音信号を入力するとともに、ライン入力で音響機器3の出力音信号を入力し、この出力音信号により、集音部10から出力される音信号に含まれる音響機器3の出力音(II)の成分を抑制する処理を行う。図3(b)はこの抑制処理され、エコーキャンセル部11から出力される出力信号の波形例である。
【0034】
そしてエコーキャンセル部11の出力信号を入力した雑音重畳部14は、記憶部13から読み出した重畳用雑音信号(図3(c)参照)をエコーキャンセル部11の出力信号に重畳して図3(d)に示すように平滑化を行う。
【0035】
ここで重畳用雑音信号としては、例えば浴室乾燥機のような浴室機器2の動作音信号を用いている。また雑音重畳部14は重畳する雑音信号の割合を出力音検知部12から出力される信号パワーに対応して通知される信号に基づいて制御する。出力音検知部12は、音響機器3からエコーキャンセル部11へ出力される参照信号の単位時間当たりの信号パワーを所定の時間間隔毎に雑音重畳部14へ通知している。尚信号パワーの変動があった場合のみ、雑音重畳部14へ通知するようにしても良い。
【0036】
尚、雑音重畳部14は、機器電源検知部15から浴室機器2の電源がオン状態である信号が出力されている場合、或いは機器電源検知部15から音響機器3の電源がオフ状態である場合に、雑音重畳を行わない。
【0037】
さて、音声認識部17は、雑音重畳部14からの出力信号と音声認識モデルとを比較して、音声認識処理を行っており、ユーザの音声が集音部10に入力されていない場合には、主音部10には音響機器3の出力音のみが入力されているが、エコーキャンセル部11の出力信号に雑音信号が重畳されるため、音声認識部17は音声と認識しない。
【0038】
一方、ユーザの音声が入力されている場合には、重畳されている雑音よりもユーザの音声のパワーが十分に大きいので、正しく音声と判断されて音声認識処理が行われる。このときユーザの音声に雑音が重畳されているが、音声認識モデルも雑音が重畳された学習データから作成されているので、音声と音声認識モデルの音響的ミスマッチによる認識性能の低下は少ない。
【0039】
制御実行部18は、音響認識部17による認識結果に基づいて、浴室機器2に制御命令を出力して所定の制御を実行する。
【0040】
以上のように本実施形態の音声コントローラ1は、上述のように雑音重畳部14を設けてエコーキャンセル部11の出力信号に雑音信号を重畳して平滑化するので、音声認識部17が、エコーキャンセル部11で完全に抑制できなかった音響機器3の出力音を音声と判断して音声認識処理を行うことがなくなり、その結果として出力音をユーザの音声と判断して誤った制御が為されるのを防ぐことができる。
【0041】
また、音響機器3からの出力音の大きさを検知する出力音検知部12を備えていることで、出力音のパワーが小さいときには重畳する雑音信号の割合を小さくし、出力音が大きいときには重畳ずる雑音信号の割合を大きくするので、音響機器3の出力音のパワーが小さいときに過大な雑音信号が重畳され、ユーザの音声信号も雑音信号により平滑化されてしまうことがなく、その結果ユーザの音声を認識できなくなるという問題を回避できる。
【0042】
尚、出力音が大きい場合には、重畳する雑音の割合が大きくするが、ユーザの発話音声の大きさは、音響機器の再生音の大きさに影響されて大きくなるので、雑音によって平滑化されてしまうことはない。
【0043】
更に、また重畳用雑音信号が、既に浴室内に設置された浴室機器2が発生する騒音の信号を用いるので、雑音信号を重畳することによる性能低下が、浴室機器2の動作時の騒音による性能低下と同程度になり、ユーザの使用感に不自然さがなくなる。
【0044】
また、浴室機器2の電源がオンしている場合には、雑音信号を重畳しないので、雑音信号の重畳分に代わり、浴室機器2の発する騒音が混入されることになるが、ユーザの音声と雑音のS/N比が想定以上に劣化して認識性能が低下することもなく、しかも浴室機器2の騒音がエコーキャンセル未抑圧成分を平滑化するので、雑音信号を重畳しなくても音響機器3の出力音信号を平滑化し、誤動作することがない。
【0045】
また音響機器3の電源がオフしている場合にも、雑音信号を重畳しないので、ユーザが小さな声で音声入力しても十分なS/N比を得ることができ、高い認識性能を得ることができる。
【0046】
記憶部16に記憶させている音声認識モデルに、定常雑音信号、例えば重畳用雑音信号<浴室機器2の騒音>を組み込めば、雑音重畳部14で雑音信号を重畳した音声信号と音声認識モデルとの間の音響的ミスマッチが減少することになり、ユーザの音声に雑音を重畳するこことによる認識性能の低下を減少させることができる。この音声認識モデルへの重畳用雑音の組み込みは、音声認識モデルの学習用音声データに対して雑音を重畳した後、音声認識モデルを作成しても良い。
【図面の簡単な説明】
【0047】
【図1】一実施形態の構成図である。
【図2】一実施形態に用いるエコーキャンセル部の構成図である。
【図3】一実施形態の動作説明用の波形図である。
【符号の説明】
【0048】
1 音声コントローラ
10 集音部
11 エコーキャンセル部
12 出力音検知部
13 記憶部
14 雑音重畳部
15 機器電源検知部
16 記憶部
17 音声認識部
18 制御実行部
2 浴室機器
3 音響機器

【特許請求の範囲】
【請求項1】
ユーザから発声された音声を認識し、この認識した音声で規定される制御命令に従って制御対象の機器の動作を制御する音声コントローラであって、
宅内の音信号を集音する集音部と、
該集音部で集音した音に含まれる宅内の音響機器の出力音に対してエコーキャンセル処理を施すエコーキャンセル処理部と、
音声認識の基準となる音声認識モデル及び重畳させる雑音信号を記憶している記憶部と、
エコーキャンセル処理部の出力信号に雑音信号を重畳させて前記出力信号を平滑化する雑音重畳部と、
前記雑音信号が重畳された出力信号と、前記音声認識モデルとを比較して前記出力信号に含まれる音声を認識する音声認識部と、
該音声認識部で認識した音声に対応する制御命令を実行する制御実行部とを備えて成ることを特徴とする音声コントローラ。
【請求項2】
前記音響機器からの出力音の大きさを検知する出力音検知部を備え、
前記雑音重畳部は、前記出力音検知部が検知した出力音の大きさに応じて、前記出力信号に重畳させる雑音信号の大きさを変化させることを特徴とする請求項1記載の音声コントローラ。
【請求項3】
前記音声認識モデルは、前記出力信号に重畳させる雑音信号を予め組み込んで構成されていることを特徴とする請求項1又は2記載の音声コントローラ。
【請求項4】
前記記憶部に記憶されている雑音信号は、宅内に設置された機器の定常雑音信号であることを特徴とする請求項1記載の音声コントローラ。
【請求項5】
前記音声認識モデルは、前記出力信号に重畳する前記定常雑音信号を予め組み込んで構成されていることを特徴とする請求項4記載の音声コントローラ。
【請求項6】
前記宅内に設置された前記機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記機器の電源がオンしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする請求項4又は5記載の音声コントローラ。
【請求項7】
前記宅内に設置された前記音響機器の電源のオン/オフを検知する機器電源検知部を備え、前記雑音重畳部は、前記音響機器の電源がオフしている場合に、前記出力信号への雑音信号の重畳を抑止することを特徴とする請求項1乃至6記載の何れか記載の音声コントローラ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2008−203800(P2008−203800A)
【公開日】平成20年9月4日(2008.9.4)
【国際特許分類】
【出願番号】特願2007−43127(P2007−43127)
【出願日】平成19年2月23日(2007.2.23)
【出願人】(000005832)松下電工株式会社 (17,916)
【Fターム(参考)】