説明

車両用音声認識装置

【課題】 本発明は、走行中などの車両内において乗員の音声命令により交通情報や携帯電話のE−メール、インターネット接続によるニュースなどを適宜選択できる、認識率の高い車両用音声認識装置を提供するものである。
【解決手段】 本発明は、音声命令を入力する音声入力手段2と、この音声入力手段2からの音声命令を分析し保存してある音声サンプル情報と比較することにより音声命令を音声認識し、この認識された音声命令の要求に対応した命令を実行する車両用音声認識装置において、音声命令に対応する要求が実行できる手動実行手段3を有し、音声入力手段2からの音声命令が音声認識できないとき、この不認識の音声命令に対応した実行を手動実行手段3により行うことができる。

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、走行中などの車両内において乗員の音声命令により交通情報や携帯電話のE−メール、インターネット接続によるニュースなどを適宜選択できるようにした車両用音声認識装置に関するものである。
【0002】近年、音声認識の技術が普及し、パソコンなどや家庭用の種々の機器では、一部実用化されている。パソコンなどの機器において、音声認識を行う場合、話者の特徴を機器側に覚え込ませるため、ある程度の長さの文章などを読ませたりして、話者の特徴をプログラム(ソフト)的に分析や解析して抽出し、認識率を向上させる方法が取られている。また、装置によっては話者を特定し、事前に必要な単語を発音させて登録することで、認識率の向上を図っているものもある。
【0003】
【発明が解決しようとする課題】このような音声認識の技術を、既にラジオやカーナビゲーションシステムのTVなどが車載され、さらにまた、携帯電話やパソコンなどが持ち込まれることの多い、昨今の車両に採用しようとする場合、次のような問題点があった。
【0004】(1)例えば、営業車やレンタカーなどのように、不特定多数の者が使用する場合には勿論のこと、個人用の乗用車などにあっても、幾人かの家族がそれぞ運転することがあるため、少なくとものような複数の乗員に対して、高い認識率が確保される必要がある。
【0005】(2)また、車両では走行中、高速道路などの高速走行中にあっては、相当大きな騒音(ノイズ)がある。このため、仮にノイズのない状態で文章などを読ませて、音声の特徴などを装置側に覚え込ませても、必ずしも音声認識の認識率が上がらないということがある。
【0006】本発明は、このような従来の実情に鑑みてなされたもので、基本的には、乗員の音声命令が音声認識されないことがあっても、確実に乗員の意図した音声命令に対応する要求が実行でき、また、次回からはこの不認識の音声命令に対しても容易に対応することができる装置を提供せんとするものである。
【0007】
【課題を解決するための手段】本発明の請求項1記載は、音声命令を入力する音声入力手段と、この音声入力手段からの音声命令を分析し保存してある音声サンプル情報と比較することにより音声命令を音声認識し、この認識された音声命令の要求に対応した命令を実行する車両用音声認識装置において、前記音声命令に対応する要求が実行できる手動実行手段を有し、前記音声入力手段からの音声命令が音声認識できないとき、当該不認識の音声命令に対応した実行を前記手動実行手段により行うことを特徴とする車両用音声認識装置にある。
【0008】本発明の請求項2記載は、前記音声認識ができなかった不認識の音声命令を、音声サンプル情報として音声サンプル保存部に保存し、次回前記不認識の音声命令と同一又は同種の音声命令があったとき、保存してある音声サンプル情報と比較することにより音声命令を音声認識するようにしたことを特徴とする請求項1記載の車両用音声認識装置にある。
【0009】本発明の請求項3記載は、前記音声入力手段が、乗員の音声を入力する第1マイクと、当該第1マイクの近傍に配置すると共に第1マイクとはほぼ反対方向に指向特性を有し主として周囲の環境ノイズを集音する第2マイクからなり、前記第1マイクの出力と第2マイクの出力の差を求めて、乗員の音声命令とすることを特徴とする請求項1又は2記載の車両用音声認識装置にある。
【0010】
【発明の実施の形態】図1は本発明に係る車両用音声認識装置の一実施例になる全体を示したブロック図である。図中、1は対象車両の適宜部分に設置される、CPUや各種メモリ、その他の電子素子、部品などからなる装置本体(コントローラ)、2はマイクなどからなる音声入力手段、3はスイッチからなる手動実行手段、4は車載や車内に持ち込まれる、ラジオ、カーナビゲーションシステムのTV、携帯電話、パソコンなどの電子機器、5はスピーカなどからなる音声出力機器、6は電源スイッチである。
【0011】装置本体1内には、主として、例えば音声入力手段2からの音声命令を分析する音声分析部110、音声命令を一時的に保存する音声一時保存部120、種々の音声命令がサンブルとして保存されている音声サンプル情報保存部130、入力された乗員の音声命令と予め保存してある音声サンプル情報とを比較、判断する音声比較判断部140、判断された音声命令の要求を実行する命令制御部150、手動実行手段3により不認識の音声命令を強制的に所定の音声命令と関連付ける強制認識関連付部160、電子機器4の各種情報、例えば「交通情報」、「E−メール」、「ニュース」などが更新保存される情報更新部171〜173が内蔵されている。情報更新部171〜173のいずれかが選択されると、対応する更新情報が、音声出力機器5から音読の形で出力されるようになっている。
【0012】上記音声入力手段2は、単一のマイクでは、例えばステアリングコラムカバー部分やフロントガラス横のピラー内側、或いは天井側のバックミラー部分などに設置するとよい。この場合、好ましくは指向性の強いものの使用して、特定の乗員例えばドライバーの音声がよく拾うことができるようにするとよい。また、図2R>2に示すように、ヘッドホンタイプとすることもできる。このタイプでは、乗員側に向けられた第1マイク21と、この第1マイク21の背面(近傍)側に配置されて第1マイク21とほぼ反対方向に指向特性を有する第2マイクが、円弧状のヘッドフレーム23の先端に装着されてなる。この音声入力手段2では、図3に示すように、第1マイク21の出力と第2マイク22の出力の差を引き算回路26により求め、これを乗員の音声命令として、音声分析部110に入力させる。これにより、走行中の騒音(ノイズ)がある程度キャンセルさせる。なお、24、25は各マイク側の増幅器(アンプ)である。
【0013】上記手動実行手段3のスイッチは、乗員特にドライバー側から容易に手の届く部位、例えばステアリングホイール部分やインストルメントパネル部分などに取り付ければよい。その構造も、特に限定されないが、例えば図4に示すような構造のものが挙げられる。この構造では、ドーム状のケース31の一部に押圧式の摘まみ32を組み込むと共に、好ましくはこの近傍に押圧時に発光する動作確認用の発光部33を設けておくとよい。後述するように、この摘まみ32では、1回押すと「交通情報」が出力され、2回押すと「E−メール」が出力され、2回押すと「ニュース」が出力されるようになっている。
【0014】このような構成からなる音声認識装置において、例えば上記のように、「交通情報」、「E−メール」、「ニュース」などを音読させるには、図5に示すフローチャートのようにして行えばよい。
【0015】先ず、音声認識装置の電源スイッチ6をオンにする。そして、乗員が例えば「交通情報」という音声命令を発すれば、ステップ201において、音声命令が音声入力手段2から入力されるため、音声分析部110で分析(解析)できたかを判断する。例えば、ここで、乗員の音声命令なる「交通情報」の発音が癖がなく標準的な発音であれば、通常音声分析部110により、「交通情報」は正しく、正常に分析されされる。また、乗員の音声的な特徴なども捉えられる。しかし、乗員の発音に大きな癖などがあって標準的な発音と異なる場合には、「交通情報」は正常に分析できず、不認識の音声命令として、一種の暗号のようなものとして捉えられる。なお、音声命令の入力がなかったり、失敗したときには、「もう一度入力して下さい」などのアナウンスをさせる。
【0016】このようにして正常に分析された音声命令も、不認識の音声命令も、ステップ202で一旦音声一時保存部120に保存される。次に、ステップ203では、この保存された音声命令や不認識の音声命令と、予め音声サンプル情報保存部130に登録されている音声サンプル情報とが比較され、ステップ204において、その一致が判断される。なお、音声サンプル情報保存部130には、音声サンプル情報として、例えば「交通情報」や単なる「交通」の語句、「E−メール」や単なる「メール」の語句、「ニュース」の語句などが保存されている。
【0017】したがって、正常に分析された音声命令からなる「交通情報」の入力があったときには、音声比較判断部140において、音声サンプル情報の「交通情報」と一致するため、必要により、ステップ205で、「わかりました(或いは了解いたしました)」などのアナウンスをさせた後、ステップ206に至り、音声命令の要求である、「交通情報」が、命令制御部150、情報更新部(交通情報)171、及び音声出力機器5を通じて、音読の形で出力される。
【0018】一方、不一致のとき、つまり不認識の音声命令のときには、例えばステップ210で、「認識できません。手動認識として下さい」とアナウンスさせた後、手動実行手段3のスイッチ操作を誘導させる。ステップ211において、スイッチ操作があったかを判断し、あった場合には、さらに、ステップ212により1回押したか否かを判断する。ここで、1回の場合には、ステップ213で、強制認識関連付部160によって、強制的(ハード的)に不認識の音声命令を「交通情報」に関連付ける。これにより、不認識ではあったが、乗員の音声命令の要求である、「交通情報」が、情報更新部(交通情報)171、及び音声出力機器5を通じて、音読の形で出力される。
【0019】また、強制認識関連付部160では、上記のスイッチ操作により、不認識の音声命令が、「交通情報」と関連付けられた形で、音声サンプル情報保存部130に登録される。したがって、次回からは、乗員の音声命令が発音的な点などで相変わらず不認識相当のなものであっても、音声サンプル情報として既に登録されているため、音声比較判断部140において、一致することとなり、直ちに「交通情報」が、命令制御部150、情報更新部(交通情報)171、及び音声出力機器5を通じて、音読の形で出力されるようになる。
【0020】このような乗員の音声命令に対する、2通りの流れ(正常分析時と不認識時)があって、これは「交通情報」以外の音声命令、「交通」、「E−メール」、「メール」、「ニュース」などについても同様である。ただし、乗員の「E−メール」や「メール」の音声命令が、不認識の音声命令とされたときには、スイッチ操作を2回行うため、ステップ214に進み、ステップ215で、強制認識関連付部160によって強制的に不認識の音声命令をE−メールに関連付ければよい。さらに、乗員の「ニュース」の音声命令が、不認識の音声命令とされたときには、スイッチ操作を3回行うため、ステップ216に進み、ステップ217で、強制認識関連付部160によって強制的に不認識の音声命令をニュースに関連付ければよい。
【0021】これによって、上記と同様、乗員の音声命令の要求に沿って、「E−メール」や「ニュース」が、情報更新部(E−メール)172や情報更新部(ニュース)173、及び音声出力機器5を通じて、音読の形で出力される。勿論この際にも、これらの不認識の音声命令は、「E−メール」や「ニュース」と関連付けられた形で、音声サンプル情報保存部130に登録される。したがって、次回からは、乗員の音声命令が発音的に問題があっても、直ちに目的とする、「E−メール」や「ニュース」が音読の形で出力されるようになる。
【0022】このように本発明の音声認識装置では、例え初回の乗員の音声命令が、不認識の音声命令となるようなことがあっても、手動実行手段3を使用すれば、不認識の音声命令を、乗員の意図する音声命令として関連付けることができるため、結果として、高い認識率が得られる。したがって、使用を繰り返すほど、より多くの乗員に対して、比較的簡単に対応することが可能となる。
【0023】また、本発明の音声認識装置における音声入力手段2として、上記図2に示すような、ヘッドホンタイプのものを用いれば、走行中のノイズがある程度キャンセル(解消)されるため、この点からも認識率の向上が可能となる。
【0024】なお、上記実施例の手動実行手段3におけるスイッチ用の摘まみ32は、押圧回数により乗員の音声命令を区別するものであったが、本発明は、これに限定されない。例えば複数のスイッチを並べた構造とすることも可能である。また、音声命令による要求の数にあっても、本実施例のような3種類に限らず、4種類以上でもよく、また、1種類とすることも可能である。
【0025】
【発明の効果】以上の説明から明らかなように、本発明に係る音声認識装置によると、次のような優れた効果が得られる。
【0026】走行中などの車両内において乗員の音声命令により交通情報や携帯電話のE−メール、インターネット接続によるニュースなどを適宜選択するにおいて、乗員の音声命令が、標準的な発音であれば、目的の音声命令に対応した要求が迅速に実現される。即ち、希望通りの「交通情報」や「E−メール」、「ニュース」などが音読で提供される。
【0027】また、乗員の音声命令が、癖などがあって不認識となる場合でも、手動実行手段と強制認識関連付部によって、強制的に乗員の意図した要求と関連付けられるため、やはり乗員の希望する「交通情報」や「E−メール」、「ニュース」などが音読で提供される。しかも、次回からは、初回の手動実行手段による操作の関連付けにより、不認識の音声命令が音声サンプル情報保存部に登録されることから、正常時とと同様、迅速に音声命令に対応した要求が実現される。
【0028】また、音声入力手段を、乗員の音声を入力する第1マイクと、このマイクの近傍でその指向特性がほぼ反対方向とする第2マイクとで構成し、これら2個のマイクの出力の差を求めて、乗員の音声命令とする場合、車両という特殊な対象において、走行騒音があっても高い認識率が得られる。
【図面の簡単な説明】
【図1】 本発明に係る音声認識装置の一実施例になる全体を示したブロック図である。
【図2】 本発明で用いられる音声入力手段の一例になる斜視図である。
【図3】 図2の音声入力手段で用いられる回路のブロック図である。
【図4】 本発明で用いられる手動実行手段の一例になる斜視図である。
【図5】 本発明に係る音声認識装置のフローチャートである。
【符号の説明】
1 装置本体(コントローラ)
2 音声入力手段
3 手動実行手段
4 電子機器
5 音声出力機器
110 音声分析部
120 音声一時保存部
130 音声サンプル情報保存部
140 音声比較判断部
150 命令制御部
160 強制認識関連付部
171〜173 情報更新部

【特許請求の範囲】
【請求項1】 音声命令を入力する音声入力手段と、この音声入力手段からの音声命令を分析し保存してある音声サンプル情報と比較することにより音声命令を音声認識し、この認識された音声命令の要求に対応した命令を実行する車両用音声認識装置において、前記音声命令に対応する要求が実行できる手動実行手段を有し、前記音声入力手段からの音声命令が音声認識できないとき、当該不認識の音声命令に対応した実行を前記手動実行手段により行うことを特徴とする車両用音声認識装置。
【請求項2】 前記音声認識ができなかった不認識の音声命令を、音声サンプル情報として音声サンプル保存部に保存し、次回前記不認識の音声命令と同一又は同種の音声命令があったとき、保存してある音声サンプル情報と比較することにより音声命令を音声認識するようにしたことを特徴とする請求項1記載の車両用音声認識装置。
【請求項3】 前記音声入力手段が、乗員の音声を入力する第1マイクと、当該第1マイクの近傍に配置すると共に第1マイクとはほぼ反対方向に指向特性を有し主として周囲の環境ノイズを集音する第2マイクからなり、前記第1マイクの出力と第2マイクの出力の差を求めて、乗員の音声命令とすることを特徴とする請求項1又は2記載の車両用音声認識装置。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【図4】
image rotate


【図5】
image rotate