説明

音声判定装置

【課題】音声により入力された語の種別の判定を簡易に行う安価な音声判定装置を提供する。
【解決手段】音声判定装置は、マイクロホン11が音声入力された語に応じた音声信号を出力すると、この音声信号を正電圧に振れる波形のみを含む信号となるように整流手段13が整流して、この整流された音声信号を、音声入力された語に含まれる文字毎に1つの山形波形となるように平滑手段14が平滑する。そして、信号比較判定手段17によって所定の基準信号より平滑された音声信号が大きいと判定された回数を、入力された語に含まれる文字数として計数手段21aが計数して、この計数された文字数に基づいて、種別判定手段21bが、語の種別を判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声により入力された単語や文などの語の種別を判定する音声判定装置に関するものである。
【背景技術】
【0002】
例えば、車両に搭載されるカーナビゲーション装置などにおいては、運転中の手動操作に起因する危険を回避するために音声による操作を可能としている。このようなカーナビゲーション装置は、音声により入力された単語や文などの音声命令(即ち、語)に応じた動作を行うため、音声命令の種別を判定する音声判定装置を備えている。
【0003】
従来、音声判定装置は、入力された音声命令に応じた音声信号を音声データに変換(アナログ−デジタル変換)して、変換した音声データと、辞書部としてのメモリに記憶された認識対象語彙データと、のパターンマッチング処理を行うことにより、音声命令の種別を判定していた。このような音声命令の判定の技術については、例えば、特許文献1、2などに開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−41085号公報
【特許文献2】特開2008−46570号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した音声判定装置では、例えば、カーナビゲーション装置からの問いかけに対して、「はい」、「いいえ」の二択などで答えるような定型的な応答についても、上述したようなパターンマッチング処理を行っているので、このような場合においても、認識対象語彙データを記憶するための大容量メモリや、操作感を損なわないように音声データと認識対象語彙データとのパターンマッチング処理を高速に行う中央演算処理装置(CPU)など、が必要となり、また、パターンマッチング処理も複雑なものであり設計が難しく、そのため、製造コストが高くなってしまうという問題があった。
【0006】
本発明は、上記課題に係る問題を解決することを目的としている。即ち、本発明は、音声により入力された語の種別の判定を簡易に行う安価な音声判定装置を提供することを目的としている。
【課題を解決するための手段】
【0007】
請求項1に記載された発明は、上記目的を達成するために、図1の基本構成図に示すように、音声入力された語の種別を判定する音声判定装置であって、音声入力された語に応じた音声信号を出力するマイクロホン11と、前記マイクロホン11によって出力された前記音声信号を整流する整流手段13と、前記整流手段13によって整流された前記音声信号を、前記語に含まれる文字毎に1つの山形波形となるように平滑する平滑手段14と、前記平滑手段14によって平滑された前記音声信号が所定の基準信号より大きいか否かを判定する信号比較判定手段17と、前記信号比較判定手段17によって前記音声信号が前記基準信号より大きいと判定された回数を、前記語に含まれる文字数として計数する計数手段21aと、前記計数手段21aによって計数された前記語に含まれる文字数に基づいて、前記語の種別を判定する種別判定手段21bと、を有していることを特徴とする音声判定装置である。
【0008】
請求項2に記載された発明は、請求項1に記載された発明において、図1の基本構成図に示すように、前記整流手段13によって整流された前記音声信号を前記平滑手段14より高い平滑度で平滑することにより前記基準信号を生成する基準信号生成手段15を有していることを特徴とするものである。
【0009】
請求項3に記載された発明は、請求項2に記載された発明において、図1の基本構成図に示すように、前記基準信号生成手段15によって生成された前記基準信号に所定のオフセット値を加算するオフセット加算手段16を有していることを特徴とするものである。
【0010】
請求項1に記載された発明によれば、マイクロホン11が音声入力された語に応じた音声信号を出力すると、この音声信号を正電圧に振れる波形のみを含む信号となるように整流手段13が整流して、この整流された音声信号を、音声入力された語に含まれる文字毎に1つの山形波形となるように平滑手段14が平滑する。そして、信号比較判定手段17によって所定の基準信号より平滑された音声信号が大きいと判定された回数、即ち、基準信号を超える山形波形の個数を、入力された語に含まれる文字数として計数手段21aが計数して、この計数された文字数に基づいて、種別判定手段21bが、語の種別を判定する。
【0011】
請求項2に記載された発明によれば、基準信号生成手段15が、整流手段13によって整流された音声信号を平滑手段14より高い平滑度で平滑することにより基準信号を生成する。
【0012】
請求項3に記載された発明によれば、オフセット加算手段16が、基準信号生成手段15によって生成された基準信号に所定のオフセット値を加算する。
【発明の効果】
【0013】
以上説明より、請求項1に記載された発明によれば、マイクロホンが音声入力された語に応じた音声信号を出力すると、この音声信号を正電圧に振れる波形のみを含む信号となるように整流して、この整流された音声信号を、音声入力された語に含まれる文字毎に1つの山形波形となるように平滑し、そして、基準信号を超える山形波形の個数を入力された語に含まれる文字数として計数して、この計数された文字数に基づいて、語の種別を判定するので、音声信号の整流及び平滑化、音声信号と基準信号との比較判定、比較判定結果の計数、並びに、計数値による種別判定、という非常に簡易な処理によって音声入力された語に含まれる文字数を計数して、この文字数によって語の種別を判定することができ、そのため、大容量メモリや高速CPUなどを要することなく簡易に判定を行うことができ、音声判定装置を安価に構成できる。
【0014】
また、音声入力された語の種別を、当該語に含まれる文字数で判定するので、例えば、「はい」、「いいえ」を入力する場合において、これらの代わりに「OK(オーケー)」、「NG(エヌジー)」を入力するなど、利用者の好みに応じて、同一文字数の異なる語を入力することができ、利便性を向上できる。
【0015】
また、文字の間隔をあけるように発声することによって判定精度を向上させることができるので、判定がうまく行かなかった場合の対処(発声)が容易にできる。
【0016】
請求項2に記載された発明によれば、整流された音声信号をより高い平滑度で平滑することにより基準信号を生成するので、平滑された音声信号及び基準信号生成手段で生成された基準信号(即ち、整流された音声信号を異なる平滑度で平滑した2つの信号)における振幅が大きい箇所、即ち、語に含まれる文字に対応した山形波形の部分について、振幅に確実に差異を生じさせて上記音声信号を上記基準信号より大きくすることができ、そのため、音声信号の大きさ(増幅率)などの調整が不要となり、当該山形波形の個数を正確に計数することができ、語の種別の判定精度を向上できる。
【0017】
請求項3に記載された発明によれば、生成された基準信号に所定のオフセット値を加算するので、基準信号にオフセット値を加算して引き上げることで、平滑された音声信号に含まれる雑音などによる小さい山形波形を、語に含まれる文字に対応した山形波形として誤って計数してしまうことを防ぐことができ、そのため、判定精度をさらに向上できる。
【図面の簡単な説明】
【0018】
【図1】本発明の音声判定装置の基本構成を示す図である。
【図2】本発明の音声判定装置の一実施形態を示す構成図である。
【図3】図2の音声判定装置が備える各機能回路の具体的構成の一例を示す回路図である。
【図4】図3に示す回路図において実測した波形の一例を示す図であり、(a)は、「はい」が音声入力されたときの各機能回路の出力波形であり、(b)は、「いいえ」が音声入力されたときの各機能回路の出力波形である。
【図5】図2の音声判定装置のCPUにおける本発明に係る種別判定処理の一例を示すフローチャートである。
【図6】図2の音声判定装置の各機能回路が出力する波形を模式的に示す図であり、(a)は、マイクホロンの出力波形であり、(b)は、増幅回路の出力波形であり、(c)は、整流回路の出力波形であり(d)は、平滑回路及びオフセット加算回路の出力波形であり、(e)は、信号比較判定回路の出力波形である。
【発明を実施するための形態】
【0019】
以下、本発明の音声判定装置の一実施形態を、図2〜図6を参照して説明する。この音声判定装置は、例えば、カーナビゲーション装置等に組み込まれており、音声により入力された語の種別を判定し、当該カーナビゲーション装置において、その判定された種別に応じた動作を行うために用いられる。勿論、音声により入力された語の種別に応じた動作を行うものであれば、例えば、テレビや電子レンジ等の家電製品などに組み込まれていてもよく、本発明の音声判定装置が適用される装置等は任意である。
【0020】
本発明の音声判定装置(以下、符号1で示す)は、音声入力された語の種別として「はい」、「いいえ」の判定を行う。音声判定装置1は、図2に示すように、マイクロホン11と、増幅回路12と、整流回路13と、平滑回路14と、基準信号生成回路15と、オフセット加算回路16と、信号比較判定回路17と、マイクロコンピュータ(MPU)20と、を備えている。
【0021】
マイクロホン11は、例えば、コンデンサマイクやダイナミックマイクなど、入力された音声に応じた音声信号を出力する周知の電子部品である。マイクロホン11の後段には増幅回路12が接続されており、音声入力された語に応じた音声信号を、増幅回路12に出力する。
【0022】
増幅回路12は、オペアンプなどの周知の半導体電子部品などで構成されており、マイクロホン11によって出力された音声信号を後段の各機能回路で処理可能なレベルに増幅して、その後段に接続された整流回路13に出力する。
【0023】
整流回路13は、正電圧及び負電圧の両方に振れる波形を含む交流信号を、正電圧に振れる波形のみを含む直流信号に変換する、即ち、整流する回路である。マイクロホン11(即ち、増幅回路12)によって出力された音声信号は交流信号であり、この音声信号を整流回路13によって直流信号に変換する。整流回路13は、例えば、1又は複数のダイオード等によって構成されている。本実施形態において、整流回路13は、交流信号における負電圧波形を除去することにより上記直流信号に変換する半波整流回路を用いている。又は、これに代えて、整流回路13として、交流信号における負電圧に振れる波形を正電圧に振れるように反転することにより上記直流信号に変換する全波整流回路を用いてもよい。この整流回路13は、増幅回路12で増幅された音声信号を整流して、その後段に接続された平滑回路14及び基準信号生成回路15に出力する。
【0024】
平滑回路14は、整流回路13の出力に直列に接続された抵抗器と、この抵抗器の後段側の端子とグランド(GND)とを接続するコンデンサと、で構成されている。この平滑回路14は、整流回路13で整流された音声信号を、音声入力された語に含まれる文字毎に1つの山形波形に平滑するように時定数(即ち、平滑度)が設定されている。平滑回路14は、平滑した音声信号を、その後段に接続された信号比較判定回路17に出力する。
【0025】
基準信号生成回路15は、平滑回路14と同様に、整流回路13の出力に直列に接続された抵抗器と、この抵抗器の後段側の端子とグランド(GND)とを接続するコンデンサと、で構成されており、平滑回路14より時定数(即ち、平滑度)が大きく設定されている。この基準信号生成回路15は、整流回路13で整流された音声信号を、平滑回路14より波形が鈍る(平坦になる)ように平滑した信号を基準信号として生成し、その後段に接続されたオフセット加算回路16に出力する。
【0026】
オフセット加算回路16は、オペアンプなどの周知の半導体電子部品などで構成されており、基準信号生成回路15で生成された基準信号に所定の電圧値(即ち、オフセット値)を加算して、その後段に接続された信号比較判定回路17に出力する。
【0027】
信号比較判定回路17は、オペアンプなどの周知の半導体電子部品などで構成されたいわゆるコンパレータ回路であり、当該オペアンプの非反転入力端子に平滑回路14の出力が接続されており、反転入力端子にオフセット加算回路16の出力が接続されており、これら端子に入力された信号の比較結果に応じた信号を出力する。この信号比較判定回路17は、これら平滑回路14及びオフセット加算回路16から出力される音声信号及び基準信号のそれぞれの電圧値(振幅)を比較して、音声信号が基準信号より大きいとき、MPU20の外部インタフェースの入力レベルに適合した所定の固定正電圧(例えば、5Vの定電圧(信号レベル=H))を後段に接続されたMPU20に出力し、音声信号が基準信号以下のとき、電圧0(信号レベル=L)をMPU20に出力する。つまり、信号比較判定回路17は、音声信号と基準信号との比較判定結果に応じたパルス信号Pを生成して、MPU20に出力する。また、パルス信号Pに含まれるパルスの個数は、音声信号が基準信号より大きいと判定されたときの回数を示している。
【0028】
これら、整流回路13、平滑回路14、基準信号生成回路15、オフセット加算回路16、及び、信号比較判定回路17は、それぞれ、請求項中の整流手段、平滑手段、基準信号生成手段、オフセット加算手段、及び、信号比較判定手段に相当する。
【0029】
また、図3に、上述した、マイクロホン11、増幅回路12、整流回路13、平滑回路14、基準信号生成回路15、オフセット加算回路16、及び、信号比較判定回路17、の具体的構成の一例を示す。
【0030】
また、この図3に示す構成において実測した波形の一例を図4(a)、(b)に示す。図4(a)は、「はい」が音声入力されたときの出力波形であり、図4(b)は、「いいえ」が音声入力されたときの出力波形である。各図において、実線(CH2)は、平滑回路14の出力波形(図3のF点における信号波形)、即ち、音声信号であり、点線(CH1)は、基準信号生成回路15の出力波形(図3のG点における信号波形)、即ち、基準信号であり、一点鎖線(CH3)は、信号比較判定回路17の出力波形(図3のH点における信号波形)である。これら出力波形から、平滑度を異ならせることで、音声信号(CH2)及び基準信号(CH1)において、音声入力された語に含まれる文字に対応した山形波形の部分について、音声信号を基準信号より大きくすることができることが判る。
【0031】
MPU20は、組込用途に用いられるマイクロコンピュータであり、予め定めたプログラムに従って各種の処理や制御などを行う中央演算処理装置(CPU)21、CPU21のためのプログラムや各種パラメータを格納した読み出し専用のメモリであるROM22、各種データを格納するとともにCPU21の処理作業に必要な領域を有する読み出し書き込み自在のメモリであるRAM23、電力供給が断たれた場合でも、格納された各種データの保持が可能であり、CPU21の処理作業に必要な各種格納エリアを有するEEPROM24、及び、計時に用いられるタイマ25等を備えている。
【0032】
MPU20が備えるROM22には、CPU21を、計数手段及び種別判定手段などの各種手段として機能させる制御プログラム等が格納されている。そして、CPU21は、この制御プログラムを実行することにより、計数手段及び種別判定手段として機能する。RAM23には、音声入力された語に含まれる文字の間の無音声時間の上限を定める無音声上限時間Tmax(例えば、2秒)を示す値が格納されている。
【0033】
また、MPU20には、複数の入力ポート及び出力ポートを備えた外部インタフェース部(不図示)が設けられており、入力ポートには、信号比較判定回路17から出力されるパルス信号P、及び、カーナビゲーション装置から出力される音声入力待ち状態であることを示す入力待機状態信号W、が入力され、出力ポートからは、音声入力された語の種別をカーナビゲーション装置に通知する種別通知信号K_yes、K_noが出力される。種別通知信号K_yesのみがHレベルのとき、音声入力された語の種別が「はい」であることを示し、種別通知信号K_noのみがHレベルのとき、音声入力された語の種別が「いいえ」であることを示す。
【0034】
MPU20は、カーナビゲーション装置が音声入力待ち状態のときに、上述した信号比較判定回路17から出力されたパルス信号Pのパルス数を音声入力された語に含まれる文字数として計数して、文字数が示す語の種別に応じた種別通知信号K_yes、K_noを出力する種別判定処理を行う。MPU20(即ち、CPU21)による種別判定処理の一例を、図5のフローチャートを参照して説明する。
【0035】
音声判定装置1に、電源が投入されるとMPU20のCPU21は所定の初期化処理を実行したのち、ステップS110に進む。
【0036】
ステップS110では、カーナビゲーション装置が音声入力待ち状態であるか否かを判定する。具体的には、入力ポートに入力されている入力待機状態信号WがHレベルになるまで待ち(S110でN)、この入力待機状態信号WがHレベルになったとき、カーナビゲーション装置が音声入力待ち状態であるとして、ステップS120に進む(S110でY)。
【0037】
ステップS120では、変数及び信号のリセットを行う。具体的には、パルス信号Pに含まれるパルス数を示すパルス積算値Sをリセット(S=0)する。また、音声が入力されていない無音声時間を計時するタイマ値である無音声経過時間Tをリセット(T=0)するとともに無音声経過時間Tを計時するタイマ25をスタートする。無音声経過時間Tは、タイマ25によって所定時間(例えば、0.1秒)毎にカウントアップされる。また、音声入力された語の種別を示す種別通知信号K_yes、K_noをリセットする(K_yes=L、K_no=L)。そして、ステップS130に進む。
【0038】
ステップS130では、音声入力があったか否かを判定する。具体的には、入力ポートに入力されているパルス信号PがHレベルであるか否かを判定し、Hレベルであるとき、音声入力があったものとしてステップS140に進み(S130でY)、Lレベルであるとき、音声入力がない(無音声)としてステップS170に進む(S130でN)。
【0039】
ステップS140では、パルス積算値Sを1増加する。そして、ステップS150に進む。
【0040】
ステップS150では、音声入力された語に含まれる1文字の発声が終了したか否かを判定する。具体的には、入力ポートに入力されているパルス信号PがLレベルになるまで待ち(S150でN)、このパルス信号PがLレベルになったとき、1文字の発声(音声入力)が終了したものとして、ステップS160に進む。
【0041】
ステップS160では、無音声経過時間Tをリセット(T=0)する。そして、ステップS130に戻る。
【0042】
ステップS170では、無音声経過時間Tが、所定の無音声上限時間Tmax以下であるか否かを判定し、無音声経過時間Tが無音声上限時間Tmax以下であるとき、継続して音声入力があるものとしてステップS130に戻り(S170でY)、無音声経過時間Tが無音声上限時間Tmaxを超えていたとき、音声入力が終了したものとして、ステップS180に進む(S170でN)。
【0043】
ステップS180では、音声入力された語の種別を判定する。具体的には、音声入力された語に含まれる文字数を示すパルス積算値Sの値を判定して、パルス積算値Sが2のとき、文字数が2(即ち、「はい」)としてステップS190に進み(S180でS=2)、パルス積算値Sが3のとき、文字数が3(即ち、「いいえ」)としてステップS200に進み(S180でS=3)、これら以外のとき、無効な音声入力としてステップS210に進む(S180でS≠2かつS≠3)。
【0044】
ステップS190では、カーナビゲーション装置に、音声入力された語の種別が「はい」であることを通知する。具体的には、種別通知信号K_yesをHレベルにし、種別通知信号K_noをLレベルにする。そして、タイマ25を停止して本フローチャートの処理を終了する。
【0045】
ステップS200では、カーナビゲーション装置に、音声入力された語の種別が「いいえ」であることを通知する。具体的には、種別通知信号K_yesをLレベルにし、種別通知信号K_noをHレベルにする。そして、タイマ25を停止して本フローチャートの処理を終了する。
【0046】
ステップS210では、無効な音声入力がされたものとして、種別通知信号K_yesをHレベルにし、種別通知信号K_noをHレベルにする。そして、タイマ25を停止して本フローチャートの処理を終了する。
【0047】
上述したステップS130〜S140は、請求項中の計数手段に相当し、ステップS180は、請求項中の種別判定手段に相当する。
【0048】
次に、上述した音声判定装置1における本発明に係る動作について、図6(a)〜(e)を参照して説明する。
【0049】
図6において、(a)は、マイクロホン11の出力波形(図2のA点における信号波形)を示し、(b)は、増幅回路12の出力波形(図2のB点における信号波形)を示し、(c)は、整流回路13の出力波形(図2のC点における信号波形)を示し、(d)の実線は、平滑回路14の出力波形(図2のD1点における信号波形)を示し、(d)の点線は、オフセット加算回路16の出力波形(図2のD2点における信号波形)を示し、(e)は、信号比較判定回路17の出力波形(図2のE点における信号波形)を示す。また、各図において、上段は、「はい」が音声入力されたときの各機能回路の出力波形であり、下段は、「いいえ」が音声入力されたときの各機能回路の出力波形である。
【0050】
音声判定装置1に電源が投入されると、CPU21は、カーナビゲーション装置が音声入力待ち状態に遷移するのを待つ(S110でN)。そして、例えば、カーナビゲーション装置において、予め設定された目的地までのルートから外れたことが検知されたとき、カーナビゲーション装置は、その画面に「ルートの再設定をしますか?」との問いかけを表示すると同時に音声による上記問いかけを行い、この問いかけに対する応答ボタン「はい」、「いいえ」を画面に表示する。そして、カーナビゲーション装置は、入力待機状態信号WをHレベルにして、音声入力待ち状態に遷移する。
【0051】
そして、CPU21は、カーナビゲーション装置が音声入力待ち状態に遷移すると(S110でY)、変数等の初期化を行って(S120)、マイクロホン11に音声が入力されるのを待つ(S130)。
【0052】
そして、発話者が上記問いかけに対する応答を発声すると、マイクロホン11は発声された音声に応じた音声信号を出力する(図6(a))。このとき音声信号は、音声入力された語に含まれる文字毎に高周波(即ち、幅の狭い)の山形波形が連続し、且つ、各文字間は平坦な波形となる。そして、この音声信号が増幅回路12で増幅されて(図6(b))、整流回路13で整流されることにより、音声入力された語に含まれる文字毎に正電圧に振れる高周波の山形波形が連続した波形となる(図6(c))。
【0053】
このように整流された音声信号を、平滑回路14で平滑すると、音声入力された語に含まれる文字毎に1つの山形波形となる(図6(d)の実線)。また、同様に、整流された音声信号を、基準信号生成回路15で平滑して基準信号を生成すると、基準信号生成回路15は、平滑回路14より平滑度が高いので、上記文字毎の山形波形がさらに平坦な波形が基準信号として生成される。そして、これにオフセット加算回路16で所定のオフセット値を加算して基準信号をかさ上げする(図6(d)の波線)。
【0054】
そして、信号比較判定回路17において、平滑回路14で平滑された音声信号と、基準信号生成回路15及びオフセット加算回路16を経て生成された基準信号と、が比較されると、音声入力された語に含まれる文字に対応する山形波形が入力される毎にパルス信号Pが出力される(図6(e))。
【0055】
そして、CPU21は、信号比較判定回路17からパルス信号Pが入力されると、当該パルス信号Pに含まれる、所定の無音声上限時間Tmax以下で連続するパルスの個数を、音声入力された語に含まれる文字数として計数し(S130〜S170)、この文字数に応じて、種別通知信号K_yes、K_noを出力する(S180〜S210)。
【0056】
そして、カーナビゲーション装置では、音声入力待ち状態において、種別通知信号K_yesがHレベルで且つ種別通知信号K_noがLレベルに変化したとき、音声入力された語の種別が「はい」であると認識し、種別通知信号K_yesがLレベルで且つ種別通知信号K_noがHレベルに変化したとき、音声入力された語の種別が「いいえ」であると認識して、これら認識に応じた処理を行う。また、カーナビゲーション装置では、種別通知信号K_yesがHレベルで且つ種別通知信号K_noがHレベルのとき、不正な音声入力がされたものと認識して、再度の音声入力を促すなどの処理を行う。
【0057】
以上説明したように、本実施形態によれば、マイクロホン11が音声入力された語に応じた音声信号を出力すると、この音声信号を正電圧に振れる波形のみを含む信号となるように整流回路13が整流して、この整流された音声信号を、音声入力された語に含まれる文字毎に1つの山形波形となるように平滑回路14が平滑する。そして、信号比較判定回路17によって所定の基準信号より平滑された音声信号が大きいと判定された回数、即ち、基準信号を超える山形波形の個数を示すパルス信号Pに含まれるパルスの個数を、入力された語に含まれる文字数としてCPU21が計数して、この計数された文字数に基づいて、CPU21が、語の種別を判定する。
【0058】
また、基準信号生成回路15が、整流回路13によって整流された音声信号を平滑回路14より高い平滑度で平滑することにより基準信号を生成する。
【0059】
また、オフセット加算回路16が、基準信号生成回路15によって生成された基準信号に所定のオフセット値を加算する。
【0060】
以上より、本発明によれば、マイクロホン11が音声入力された語に応じた音声信号を出力すると、この音声信号を正電圧に振れる波形のみを含む信号となるように整流して、この整流された音声信号を、音声入力された語に含まれる文字毎に1つの山形波形となるように平滑し、そして、基準信号を超える山形波形の個数を示すパルス信号Pに含まれるパルスの個数を、入力された語に含まれる文字数として計数して、この計数された文字数に基づいて、語の種別を判定するので、音声信号の整流及び平滑化、音声信号と基準信号との比較判定、比較判定結果の計数、並びに、計数値による種別判定、という非常に簡易な処理によって音声入力された語に含まれる文字数を計数して、この文字数によって語の種別を判定することができ、そのため、大容量メモリや高速CPUなどを要することなく簡易に判定を行うことができ、音声判定装置1を安価に構成できる。
【0061】
また、音声入力された語の種別を、当該語に含まれる文字数で判定するので、例えば、「はい」、「いいえ」を入力する場合において、これらの代わりに「OK(オーケー)」、「NG(エヌジー)」を入力するなど、利用者の好みに応じて、同一文字数の異なる語を入力することができ、利便性を向上できる。
【0062】
また、文字の間隔をあけるように発声することによって判定精度を向上させることができるので、判定がうまく行かなかった場合の対処(発声)が容易にできる。
【0063】
また、基準信号を、整流回路13によって整流された音声信号を平滑回路14より高い平滑度で平滑して生成するので、平滑回路14で平滑された音声信号及び基準信号生成回路15で生成された基準信号(即ち、整流された音声信号を異なる平滑度で平滑した2つの信号)における振幅が大きい箇所、即ち、語に含まれる文字に対応した山形波形の部分について、振幅に確実に差異を生じさせて上記音声信号を上記基準信号より大きくすることができ、そのため、音声信号の大きさ(増幅率)などの調整が不要となり、当該山形波形の個数を正確に計数することができ、語の種別の判定精度を向上できる。
【0064】
また、基準信号生成回路15によって生成された基準信号に所定のオフセット値を加算するので、基準信号にオフセット値を加算して引き上げることで、平滑された音声信号に含まれるロードノイズや風切り音等の雑音などによる小さい山形波形を、語に含まれる文字に対応した山形波形として誤って計数してしまうことを防ぐことができ、そのため、判定精度をさらに向上できる。
【0065】
本実施形態において、音声判定装置1は、オフセット加算手段としてのオフセット加算回路16を備えるものであったが、本発明はこれに限定されるものではなく、雑音等の少ない環境においては、オフセット加算回路16を省いて、基準信号生成回路15の出力を信号比較判定回路17に直接入力してもよい。また、さらに基準信号生成回路15を省いて、基準信号として、例えば、電源電圧を分圧等して生成した所定の定電圧信号を信号比較判定回路17に直接入力してもよい。このようにすることで、さらに簡易な構成とすることができる。
【0066】
また、本実施形態において、音声判定装置1は、独立したMPU20を備えるものであったが、本発明はこれに限定されるものではなく、例えば、音声判定装置1のMPU(CPU)として、音声判定装置とともに用いる装置(例えば、カーナビゲーション装置)が備えるMPUを用いて、音声判定装置1を当該装置と一体に構成してもよい。または、MPU20に代えて、カウンタ回路や論理回路を組み合わせることにより、上述した計数手段及び種別判定手段を構成してもよい。
【0067】
また、本実施形態において、整流回路13、平滑回路14、基準信号生成回路15、オフセット加算回路16、及び、信号比較判定回路17は、オペアンプ、ダイオード、抵抗器、及び、コンデンサなどのディスクリート部品で構成されるものであったが、本発明はこれに限定されるものではない。例えば、アナログ−デジタル変換器を備えたMPUを用いて、増幅回路12で増幅された音声信号を、上記アナログ−デジタル変換器を介して、デジタル化された音声データとしてMPUに取り込み、MPUによるデジタル信号処理によって、上記各機能回路と同等の処理を行うようにしてもよい。この場合、MPUが、整流手段、平滑手段、基準信号生成手段、オフセット加算手段、及び、比較判定手段として機能することになる。
【0068】
なお、前述した実施形態は本発明の代表的な形態を示したに過ぎず、本発明は、実施形態に限定されるものではない。即ち、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。
【符号の説明】
【0069】
1 音声判定装置
11 マイクロホン
12 増幅回路
13 整流回路(整流手段)
14 平滑回路(平滑手段)
15 基準信号生成回路(基準信号生成手段)
16 オフセット加算回路(オフセット加算手段)
17 信号比較判定回路(信号比較判定手段)
20 MPU
21 CPU(計数手段、種別判定手段)

【特許請求の範囲】
【請求項1】
音声入力された語の種別を判定する音声判定装置であって、
前記音声入力された語に応じた音声信号を出力するマイクロホンと、
前記マイクロホンによって出力された前記音声信号を整流する整流手段と、
前記整流手段によって整流された前記音声信号を、前記語に含まれる文字毎に1つの山形波形となるように平滑する平滑手段と、
前記平滑手段によって平滑された前記音声信号が所定の基準信号より大きいか否かを判定する信号比較判定手段と、
前記信号比較判定手段によって前記音声信号が前記基準信号より大きいと判定された回数を、前記語に含まれる文字数として計数する計数手段と、
前記計数手段によって計数された前記語に含まれる文字数に基づいて、前記語の種別を判定する種別判定手段と、を有している
ことを特徴とする音声判定装置。
【請求項2】
前記整流手段によって整流された前記音声信号を前記平滑手段より高い平滑度で平滑することにより前記基準信号を生成する基準信号生成手段を有していることを特徴とする請求項1に記載の音声判定装置。
【請求項3】
前記基準信号生成手段によって生成された前記基準信号に所定のオフセット値を加算するオフセット加算手段を有していることを特徴とする請求項2に記載の音声判定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−13837(P2012−13837A)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願番号】特願2010−148924(P2010−148924)
【出願日】平成22年6月30日(2010.6.30)
【出願人】(000006895)矢崎総業株式会社 (7,019)
【Fターム(参考)】