音声認識装置および音声認識方法

【課題】車載装置へ向かってその制御のために発話する発話者をトークスイッチの押下操作のわずらわしさから開放し、該発話が車載装置に対するものであるか否かを明確に認識して誤作動を起こさない音声認識装置および音声認識方法を提供する。
【解決手段】本発明の音声認識装置１０ａは、音声認識処理結果判定処理部１３ｂが音声認識処理部１３ａによって受け付けられた発話語彙がキーワード辞書１２ａに含まれていると判定する場合は、音声認識処理部１３ａは、音声認識辞書１２ｂを参照して対応するコマンドへと変換しカーナビゲーション装置２０へと出力するコマンド変換出力処理部１３ｃへ音声認識結果を受け渡し、音声認識処理結果判定処理部１３ｂが音声認識処理部１３ａによって受け付けられた発話語彙がキーワード辞書１２ａに含まれていると判定されない場合は、音声認識処理部１３ａは、音声認識結果をコマンド変換出力処理部１３ｃへ受け渡さない。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、車両の搭乗者によって発話された発話語彙を音声認識する音声認識手段と、該音声認識手段によって音声認識された該発話語彙を対応するコマンドへ変換して車載装置へと受け渡すコマンド変換手段とを有する音声認識装置および該音声認識装置による音声認識方法に関し、特に、車載装置へ向かってその制御のために発話する発話者をトークスイッチの押下操作のわずらわしさから開放し、かつ該発話が車載装置に対するものであるか否かを明確に認識して誤作動を起こさない音声認識装置および音声認識方法に関する。
【背景技術】
【０００２】
近年、利用者の音声を認識する技術の実現に向けて、各種考案がなされている。利用者の音声を認識することができれば、利用者は各種機器の操作を音声によって実行することが可能であり、特に車載装置では運転者による手動操作の運転への影響が懸念されることから音声操作技術の実用化が切望されている。
【０００３】
ところで、現在では、車両の音声認識機能を搭載した車載装置は、トークスイッチを押下した後に発話された特定のコマンドを認識する仕様となっている。このトークスイッチを使用することによって、車載装置は、特定のコマンドをより的確に認識することが可能となる（例えば、特許文献１参照）。
【０００４】
【特許文献１】特開平１０−９７２８１号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
しかしながら、上記特許文献１に代表される従来技術では、トークスイッチを押下するという操作が発話者の負担になるが、特に、発話者が運転者である場合には、運転操作以外の負荷を与える要因となる。このため、将来的には、トークスイッチを使用しない常時音声認識が主流となってくることが予想される。
【０００６】
しかし、車両に搭乗している発話者が車載装置以外へ向かって発話した場合（例えば、同乗者へ向かう発話や独り言など）にも、車載装置は、自装置へ向かう発話として認識してしまい、この発話に基づいて誤動作を起こしてしまうおそれがあった。
【０００７】
本発明は、上記問題点（課題）を解消するためになされたものであって、車載装置へ向かってその制御のために発話する発話者をトークスイッチの押下操作のわずらわしさから開放し、かつ該発話が車載装置に対するものであるか否かを明確に認識して誤作動を起こさない音声認識装置および音声認識方法を提供することを目的とする。
【課題を解決するための手段】
【０００８】
上述した問題を解決し、目的を達成するため、本発明は、車両の搭乗者によって発話された発話語彙を音声認識する音声認識手段と、該音声認識手段によって音声認識された該発話語彙を対応するコマンドへ変換して車載装置へと受け渡すコマンド変換手段とを有する音声認識装置であって、前記音声認識手段によって音声認識された発話語彙が前記車載装置へ向けられた発話であるか否かを判定する音声認識結果判定手段をさらに有し、前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合にのみ該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする。
【０００９】
また、本発明は、上記発明において、前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が特定語彙であると前記音声認識結果判定手段により判定された場合に、該特定語彙以降に音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする。
【００１０】
また、本発明は、上記発明において、前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が特定語彙であると前記音声認識結果判定手段により判定された場合に、該特定語彙以前に音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする。
【００１１】
また、本発明は、上記発明において、前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が第１の特定語彙であると前記音声認識結果判定手段により判定された場合に、該第１の特定語彙より後に音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを開始し、前記音声認識手段によって該第１の特定語彙以降に音声認識された発話語彙が第２の特定語彙であると前記音声認識結果判定手段により判定された場合に、該第２の特定語彙以降に音声認識した発話語彙を音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを終了すことを特徴とする。
【００１２】
また、本発明は、上記発明において、前記音声認識手段によって音声認識された発話語彙を所定数だけバッファリングするバッファリング手段と、前記発話語彙に、該発話語彙が属するカテゴリを対応付けて記憶する語彙カテゴリ記憶手段とをさらに有し、前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のカテゴリに基づいて、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合にのみ該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする。
【００１３】
また、本発明は、上記発明において、前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリの出現率が所定値以上となったとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合に、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする。
【００１４】
また、本発明は、上記発明において、前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリの出現率が所定値以上となったとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定されなかった場合が所定回数連続して以降、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことをキャンセルすることを特徴とする。
【００１５】
また、本発明は、上記発明において、前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリが所定回数連続したとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合に、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする。
【００１６】
また、本発明は、上記発明において、前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリが所定回数連続したとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定されなかった場合が所定回数連続して以降、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことをキャンセルすることを特徴とする。
【００１７】
また、本発明は、車両の搭乗者によって発話された発話語彙を音声認識する音声認識工程と、該音声認識手段によって音声認識された該発話語彙を対応するコマンドへ変換して車載装置へと受け渡すコマンド変換工程とを含む音声認識方法であって、前記音声認識工程によって音声認識された発話語彙が前記車載装置へ向けられた発話であるか否かを判定する音声認識結果判定工程をさらに含み、前記音声認識工程は、前記音声認識工程によって音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定工程により判定された場合にのみ、該音声認識した発話語彙を前記コマンド変換肯定へと受け渡すことを特徴とする。
【発明の効果】
【００１８】
本発明によれば、音声認識手段は、音声認識された発話語彙が車載装置へ向けられた発話であると音声認識結果判定手段により判定された場合にのみ該音声認識した発話語彙をコマンド変換手段へと受け渡すので、トークスイッチを必要としないために搭乗者はトークスイッチの押下操作のわずらわしさから開放され、かつ音声認識によって、車載装置へ向けられた発話語彙とに車載装置へ向けられたものではない発話語彙とを常時区別し、誤った音声認識に基づくコマンドによって車載装置が誤作動することを防止するという効果を奏する。
【００１９】
また、本発明によれば、音声認識手段によって音声認識された発話語彙が特定語彙であると音声認識結果判定手段により判定された場合に、該特定語彙以降に音声認識した発話語彙を前記コマンド変換手段へと受け渡すので、車載装置の制御のための発話を開始するためのトークスイッチの押下を必要とせず発話開始を音声認識手段に明確に認識させるとともに、搭乗者はトークスイッチの押下操作のわずらわしさから開放されるという効果を奏する。
【００２０】
また、本発明によれば、音声認識手段によって音声認識された発話語彙が特定語彙であると音声認識結果判定手段により判定された場合に、該特定語彙以降に音声認識した発話語彙を前記コマンド変換手段へと受け渡すので、車載装置の制御のための発話を開始するためのトークスイッチの押下を必要とせず発話開始を音声認識手段に明確に認識させるとともに車載装置の制御のための発話の終了を音声認識手段に明確に認識させることができ、搭乗者はトークスイッチの押下操作のわずらわしさから開放されるという効果を奏する。
【００２１】
また、本発明によれば、音声認識手段は、バッファリング手段にバッファリングされる発話語彙のカテゴリに基づいて、音声認識された発話語彙が車載装置へ向けられた発話であると音声認識結果判定手段により判定された場合にのみ該音声認識した発話語彙をコマンド変換手段へと受け渡すので、常時音声認識をしつつも、搭乗者が車載装置を制御するための発話の開始を意識しなくても、車載装置へ向けられた発話語彙とに車載装置へ向けられたものではない発話語彙とが区別され、発話者の負担を軽減するとともに、誤った音声認識に基づくコマンドによって車載装置が誤作動することを防止するという効果を奏する。
【００２２】
また、本発明によれば、音声認識手段は、バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリの出現率が所定値以上となったとして、音声認識された発話語彙が車載装置へ向けられた発話であると音声認識結果判定手段により判定された場合に、該音声認識した発話語彙をコマンド変換手段へと受け渡すので、発話内容が特定の傾向を示すことを認識することによって、搭乗者が車載装置を制御するための発話を意識しなくても、車載装置へ向けられた発話語彙と車載装置へ向けられたものではない発話語彙とが区別され、発話者の負担を軽減するとともに、誤った音声認識に基づくコマンドによって車載装置が誤作動することを防止するという効果を奏する。
【００２３】
また、本発明によれば、音声認識手段は、バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリの出現率が所定値以上となったとして、音声認識された発話語彙が車載装置へ向けられた発話であると音声認識結果判定手段により判定されなかった場合が所定回数連続して以降、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことをキャンセルするので、発話内容が特定の傾向を示さなくなったことを認識することによって、搭乗者が車載装置を制御するための発話の終了を意識しなくても、車載装置へ向けられた発話語彙と車載装置へ向けられたものではない発話語彙とが区別され、発話者の負担を軽減するとともに、誤った音声認識に基づくコマンドによって車載装置が誤作動することを防止するという効果を奏する。
【００２４】
また、本発明によれば、バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリが所定回数連続したとして、音声認識された発話語彙が車載装置へ向けられた発話であると音声認識結果判定手段により判定された場合に、該音声認識した発話語彙をコマンド変換手段へと受け渡すので、発話内容が特定の傾向を一時的であっても強く示すことを認識することによって、搭乗者が車載装置を制御するための発話を意識しなくても、車載装置へ向けられた発話語彙と車載装置へ向けられたものではない発話語彙とが区別され、発話者の負担を軽減するとともに、誤った音声認識に基づくコマンドによって車載装置が誤作動することを防止するという効果を奏する。
【００２５】
また、本発明によれば、音声認識手段は、バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリが所定回数連続したとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると音声認識結果判定手段により判定されなかった場合が所定回数連続して以降、該音声認識した発話語彙をコマンド変換手段へと受け渡すことをキャンセルするので、発話内容が特定の傾向を一時的に強く示さなくなったことを認識することによって、搭乗者が車載装置を制御するための発話の終了を意識しなくても、車載装置へ向けられた発話語彙と車載装置へ向けられたものではない発話語彙とが区別され、発話者の負担を軽減するとともに、誤った音声認識に基づくコマンドによって車載装置が誤作動することを防止するという効果を奏する。
【発明を実施するための最良の形態】
【００２６】
以下に添付図面を参照し、本発明の音声認識装置および音声認識方法に係る実施例を詳細に説明する。
【実施例１】
【００２７】
以下に図１〜図３を参照して、本発明にかかる実施例１を説明する。実施例１は、車両の搭乗者による発話語彙の常時音声認識において、予め設定されている特定のキーワードが音声認識されると、該キーワードの直後に音声認識された発話語彙を、カーナビゲーション装置などを制御可能なコマンドへ変換するために所定のコマンド変換部へと受け渡す実施例である。
【００２８】
先ず、実施例１にかかる音声認識装置の構成について説明する。図１は、実施例１にかかる音声認識装置の構成を示す機能ブロック図である。同図に示すように、車両１において、ＣＡＮ（Controller Area Network）２を介して、実施例１にかかる音声認識装置１０ａと、音声認識された発話内容に基づく制御コマンドによる制御対象であるカーナビゲーション装置２０とが接続されている。以下の実施例では、音声認識された発話内容が変換された、カーナビゲーション装置２０などの車載装置を制御する制御コマンドを、単に“コマンド”と呼ぶ。
【００２９】
音声認識装置１０ａは、所定の表示画面を有するディスプレイ装置などの表示手段である表示部１１ａと、音声を発するスピーカー装置などの音声発生手段である音声発生部１１ｂと、揮発性または不揮発性の記憶手段である記憶部１２と、制御部１３とを有する。また、音声認識装置１０ａには、外部から検知した音声データを音声認識装置１０ａへと入力するマイク１４が接続されている。
【００３０】
記憶部１２は、キーワード辞書１２ａと、音声認識辞書１２ｂとを格納している。キーワード辞書１２ａおよび音声認識辞書１２ｂは、所定のテーブルとして記憶部１２に格納されている。キーワード辞書１２ａは、予め設定された特定の語彙のリストである。また、音声認識辞書１２ｂは、音声認識された発話内容から変換されるべきコマンドのリストである。
【００３１】
制御部１３は、音声認識装置１０ａの全体制御をつかさどるが、特に実施例１に関連する特徴的な機能構成としては、音声認識処理部１３ａと、音声認識処理結果判定処理部１３ｂと、コマンド変換出力処理部１３ｃとを有する。その他の機能構成については省略している。
【００３２】
音声認識処理部１３ａは、車両１の搭乗者によって発話された語彙がマイク１４によって検知されると、その検知された発話語彙をひとまず受け付けて一時記憶しておく。そして、その発話語彙がキーワード辞書１２ａに含まれている場合（以上を前段の音声認識と呼ぶ）に、該発話語彙より後に検知された語彙を音声認識処理（この音声認識処理による音声認識を、後段の音声認識と呼ぶ）する。なお、単に音声認識と呼ぶ場合は、検知された発話語彙が音声認識辞書１２ｂに含まれていると判定された場合を示し、音声認識処理は、音声認識を試みる処理である。
【００３３】
音声認識処理結果判定処理部１３ｂは、音声認識処理部１３ａによって受け付けられた発話語彙がキーワード辞書１２ａに含まれているか否かを判定する処理部である。音声認識処理結果判定処理部１３ｂが音声認識処理部１３ａによって受け付けられた発話語彙がキーワード辞書１２ａに含まれていると判定する場合には、音声認識処理部１３ａは、音声認識結果をコマンド変換出力処理部１３ｃへと受け渡す。なお、音声認識処理結果判定処理部１３ｂが音声認識処理部１３ａによって受け付けられた発話語彙がキーワード辞書１２ａに含まれていると判定されない場合には、音声認識処理部１３ａは、音声認識結果をコマンド変換出力処理部１３ｃへ受け渡さない。
【００３４】
コマンド変換出力処理部１３ｃは、音声認識処理部１３ａから受け渡された音声認識結果を、音声認識辞書１２ｂを参照して対応するコマンドへと変換し、カーナビゲーション装置２０へと出力する。
【００３５】
次に、実施例１の音声認識処理（その１）について説明する。実施例１の音声認識処理（その１）は、前段の音声認識による音声認識結果がキーワードである場合に、そのキーワードの直後に音声認識された１語彙をコマンド変換する場合の処理である。図２は、実施例１の音声認識処理手順（その１）を示すフローチャートである。
【００３６】
先ず、音声認識処理部１３ａは、マイク１４を介して入力された発話語彙の音声認識処理をおこない、その処理結果を音声認識処理結果判定処理部１３ｂへと出力する（ステップＳ１０１）。続いて、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」がオンであるか否かを判定する（ステップＳ１０２）。「コマンド変換フラグ」がオンであると判定された場合に（ステップＳ１０２肯定）、ステップＳ１０３へ移り、「コマンド変換フラグ」がオンであると判定されなかった場合に（ステップＳ１０２否定）、ステップＳ１０５へ移る。
【００３７】
ステップＳ１０３では、音声認識処理部１３ａは、音声認識処理結果判定処理部１３ｂによる判定処理結果に基づき、入力された発話語彙の音声認識処理結果をコマンド変換出力処理部１３ｃへ受け渡す。続いて、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオフにする（ステップＳ１０４）。
【００３８】
ステップＳ１０５では、音声認識処理結果判定処理部１３ｂは、キーワード辞書１２ａを参照し、音声認識処理部１３ａから入力された音声認識処理結果がキーワードであるか否かを判定する。音声認識処理部１３ａから入力された音声認識処理結果がキーワードであると判定された場合に（ステップＳ１０５肯定）、ステップＳ１０６へ移り、音声認識処理部１３ａから入力された音声認識処理結果がキーワードであると判定されなかった場合に（ステップＳ１０５否定）、ステップＳ１０７へ移る。
【００３９】
ステップＳ１０６では、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオンにする。また、ステップＳ１０７では、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオフにする。これらの処理が終了すると、ステップＳ１０８へ移る。
【００４０】
ステップＳ１０８では、音声認識処理部１３ａは、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了するか否かを判定し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了する場合は（ステップＳ１０８肯定）、実施例１の音声認識処理（その１）は終了し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了しない場合は（ステップＳ１０８否定）、ステップＳ１０１へ移る。
【００４１】
次に、実施例１の音声認識処理（その２）について説明する。実施例１の音声認識処理（その２）は、前段の音声認識による音声認識結果がキーワードである場合に、そのキーワードの直前に音声認識された１語彙をコマンド変換する場合の処理である。図３は、実施例１の音声認識処理手順（その２）を示すフローチャートである。
【００４２】
先ず、音声認識処理部１３ａは、「所定のバッファ」をクリアする（ステップＳ１１１）。このバッファは、揮発性または不揮発性の記憶手段に設けられる。
【００４３】
続いて、音声認識処理部１３ａは、マイク１４を介して入力された発話語彙の音声認識処理をおこない、その処理結果を音声認識処理結果判定処理部１３ｂへと出力する（ステップＳ１１２）。続いて、音声認識処理部１３ａは、「所定のバッファ」がクリアされているか否かを判定する（ステップＳ１１３）。「所定のバッファ」がクリアされていると判定される場合に（ステップＳ１１３肯定）、ステップＳ１１７へ移り、「所定のバッファ」がクリアされていると判定されない場合に（ステップＳ１１３否定）、ステップＳ１１４へ移る。
【００４４】
ステップＳ１１４では、音声認識処理結果判定処理部１３ｂは、キーワード辞書１２ａを参照し、音声認識処理部１３ａから入力された音声認識結果がキーワードであるか否かを判定する。音声認識処理部１３ａから入力された音声認識結果がキーワードであると判定された場合に（ステップＳ１１４肯定）、ステップＳ１１５へ移り、音声認識処理部１３ａから入力された音声認識結果がキーワードであると判定されなかった場合に（ステップＳ１１４否定）、ステップＳ１１７へ移る。
【００４５】
ステップＳ１１５では、音声認識処理部１３ａは、音声認識処理結果判定処理部１３ｂによる判定処理結果に基づき、入力された発話語彙の音声認識処理結果をコマンド変換出力処理部１３ｃへ受け渡す。続いて、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオフにする（ステップＳ１１６）。
【００４６】
続いて、音声認識処理部１３ａは、ステップＳ１１２で入力された音声認識結果を「所定のバッファ」に記憶する（ステップＳ１１７）。このステップＳ１１７の処理の際に、すでに「所定のバッファ」に音声認識結果が記憶されている場合は、この古い音声認識結果を消去して、新しい音声認識結果を記憶する。続いて、音声認識処理部１３ａは、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了するか否かを判定し（ステップＳ１１８）、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了する場合は（ステップＳ１１８肯定）、実施例１の音声認識処理（その２）は終了し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了しない場合は（ステップＳ１１８否定）、ステップＳ１１２へ移る。
【実施例２】
【００４７】
以下に図４および図５を参照して、本発明にかかる実施例２を説明する。実施例１は、車両の搭乗者による発話語彙の常時音声認識において、予め設定されている特定の開始キーワードが音声認識されると、該キーワード以降に音声認識された発話語彙を、カーナビゲーション装置などを制御可能なコマンドへ変換するために所定のコマンド変換部へと受け渡し、特定の開始キーワードが音声認識された以降に特定の終了キーワードが音声認識されると、声認識された発話語彙を所定のコマンド変換部へと受け渡すことを終了する実施例である。以下は、実施例１との差異のみを説明することとする。
【００４８】
先ず、実施例２にかかる音声認識装置の構成について説明する。図４は、実施例２にかかる音声認識装置の構成を示す機能ブロック図である。実施例２の音声認識装置１０ｂは、実施例１の音声認識装置１０ａと比較して、記憶部１２においてキーワード辞書１２ａに代えて開始キーワード辞書１２ｃおよび終了キーワード辞書１２ｄが含まれる構成となっている。これらの構成以外は、実施例２の音声認識装置１０ｂは、実施例１の音声認識装置１０ａと同一であるので、説明を省略する。
【００４９】
開始キーワード辞書１２ｃおよび終了キーワード辞書１２ｄは、所定のテーブルとして記憶部１２に格納されている。開始キーワード辞書１２ｃおよび終了キーワード辞書１２ｄは、予め設定された特定の語彙のリストである。特に、開始キーワード辞書１２ｃには、カーナビゲーション装置２０などの車載装置へ向けた発話の開始を示すキーワードが格納されており、終了キーワード辞書１２ｄには、カーナビゲーション装置２０などの車載装置へ向けた発話の終了を示すキーワードが格納されている。
【００５０】
次に、実施例２の音声認識処理について説明する。実施例２の音声認識処理は、前段の音声認識による音声認識結果が開始キーワードである場合に、そのキーワード以降に音声認識された語彙をコマンド変換し、その後終了キーワードが音声認識されると、音声認識された語彙のコマンド変換を終了する処理である。図５は、実施例２の音声認識処理手順を示すフローチャートである。
【００５１】
先ず、音声認識処理部１３ａは、マイク１４を介して入力された発話語彙の音声認識処理をおこない、その処理結果を音声認識処理結果判定処理部１３ｂへと出力する（ステップＳ１２１）。続いて、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」がオンであるか否かを判定する（ステップＳ１２２）。「コマンド変換フラグ」がオンであると判定された場合に（ステップＳ１２２肯定）、ステップＳ１２３へ移り、「コマンド変換フラグ」がオンであると判定されなかった場合に（ステップＳ１２２否定）、ステップＳ１２６へ移る。
【００５２】
ステップＳ１２３では、音声認識処理結果判定処理部１３ｂは、終了キーワード辞書１２ｄを参照し、音声認識処理部１３ａから入力された音声認識結果が終了キーワードであるか否かを判定する。音声認識処理部１３ａから入力された音声認識結果が終了キーワードであると判定された場合に（ステップＳ１２３肯定）、ステップＳ１２４へ移り、音声認識処理部１３ａから入力された音声認識結果が終了キーワードであると判定されなかった場合に（ステップＳ１２３否定）、ステップＳ１２５へ移る。
【００５３】
ステップＳ１２４では、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオフにする。ステップＳ１２５では、音声認識処理部１３ａは、音声認識処理結果判定処理部１３ｂによる判定処理結果に基づき、入力された発話語彙の音声認識処理結果をコマンド変換出力処理部１３ｃへ受け渡す。
【００５４】
一方、ステップＳ１２６では、音声認識処理結果判定処理部１３ｂは、開始キーワード辞書１２ｃを参照し、音声認識処理部１３ａから入力された音声認識結果が開始キーワードであるか否かを判定する。音声認識処理部１３ａから入力された音声認識結果が開始キーワードであると判定された場合に（ステップＳ１２６肯定）、ステップＳ１２７へ移り、音声認識処理部１３ａから入力された音声認識結果が開始キーワードであると判定されなかった場合に（ステップＳ１２６否定）、ステップＳ１２９へ移る。
【００５５】
ステップＳ１２７では、音声認識処理部１３ａは、音声認識処理結果判定処理部１３ｂによる判定処理結果に基づき、入力された発話語彙の音声認識処理結果をコマンド変換出力処理部１３ｃへ受け渡す。続いて、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオンにする（ステップＳ１２８）この処理が終了すると、ステップＳ１２９へ移る。
【００５６】
ステップＳ１２９では、音声認識処理部１３ａは、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了するか否かを判定し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了する場合は（ステップＳ１２９肯定）、実施例２の音声認識処理は終了し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了しない場合は（ステップＳ１２９否定）、ステップＳ１２１へ移る。
【実施例３】
【００５７】
以下に図６〜図９を参照して、本発明にかかる実施例３を説明する。実施例３は、車両の搭乗者による発話語彙の常時音声認識において、特定のカテゴリの語彙が一定時間において音声認識された語彙のなかで所定割合を占める、あるいは特定のカテゴリの語彙が一定回数連続して音声認識されると、これらの条件が充足された以降に音声認識された発話語彙を、カーナビゲーション装置などを制御可能なコマンドへ変換するために所定のコマンド変換部へと受け渡する実施例である。以下は、実施例１または２実施例との差異のみを説明することとする。
【００５８】
先ず、実施例３にかかる音声認識装置の構成について説明する。図６は、実施例３にかかる音声認識装置の構成を示す機能ブロック図である。実施例３の音声認識装置１０ｃは、実施例１の音声認識装置１０ａと比較して、記憶部１２においてキーワード辞書１２ａに代えて語彙カテゴリ分類テーブル１２ｅおよび認識語彙格納バッファ１２ｆが含まれる構成となっている。これらの構成以外は、実施例３の音声認識装置１０ｃは、実施例１の音声認識装置１０ａと同一であるので、説明を省略する。
【００５９】
語彙カテゴリ分類テーブル１２ｅは、音声認識された発話語彙にその所属カテゴリを少なくとも一つ対応付けて記憶するテーブルである。例えば図７にそのテーブル例を示すように、「語彙」“そば”には、「所属カテゴリ」として“食事”、“和食”などが対応付けられている。また、「語彙」“目的地”には、「所属カテゴリ」として“ナビ”、“地図”などが対応付けられている。「語彙」“ｘｘテレビ局”には、「所属カテゴリ」として“テレビ”、“オーディオ”などが対応付けられている。
【００６０】
このように、音声認識処理結果判定処理部１３ｂによって語彙カテゴリ分類テーブル１２ｅに含まれると判定された語彙は、該語彙カテゴリ分類テーブル１２ｅに基づきその所属カテゴリが少なくとも一つ取得されることとなる。
【００６１】
認識語彙格納バッファ１２ｆは、音声認識処理部１３ａによって連続して音声認識がなされた語彙を所定数（例えば、500語彙など）だけバッファリングする記憶領域である。この認識語彙格納バッファ１２ｆにバッファリングされる語彙は、先入れ先出しによって管理され、前述の所定数を超えて新たに音声認識された語彙が格納されようとしたならば、時間的に最も古く格納された語彙を消去して該新たに音声認識された語彙が格納される。
【００６２】
次に、実施例３の音声認識処理（その１）について説明する。実施例３の音声認識処理（その３）は、認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一の所属カテゴリである語彙の割合が所定閾値以上であると判定される場合に、その判定以後に音声認識された語彙をコマンド変換する場合の処理である。図８は、実施例３の音声認識処理手順（その１）を示すフローチャートである。
【００６３】
先ず、音声認識処理部１３ａは、マイク１４を介して入力された発話語彙の音声認識処理をおこない、その処理結果を音声認識処理結果判定処理部１３ｂへと出力する（ステップＳ１３１）。続いて、音声認識処理結果判定処理部１３ｂは、語彙カテゴリ分類テーブル１２ｅを参照して、入力された音声認識結果の語彙の所属カテゴリを取得する（ステップＳ１３２）。
【００６４】
続いて、音声認識処理結果判定処理部１３ｂは、入力された音声認識結果を、認識語彙格納バッファ１２ｆに所定数（例えば、500語彙など）だけバッファリングする（ステップＳ１３３）。
【００６５】
続いて、音声認識処理結果判定処理部１３ｂは、認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙の割合が所定閾値以上（例えば、80％など）であるか否かを判定する（ステップＳ１３４）。認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙の割合が所定閾値以上と判定された場合に（ステップＳ１３４肯定）、ステップＳ１３５へ移り、認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙の割合が所定閾値以上であると判定さなかった場合に（ステップＳ１３４否定）、ステップＳ１３７へ移る。
【００６６】
ステップＳ１３５では、音声認識処理部１３ａは、音声認識処理結果判定処理部１３ｂによる判定処理結果に基づき、入力された発話語彙の音声認識処理結果をコマンド変換出力処理部１３ｃへ受け渡す。続いて、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオンにする（ステップＳ１３６）。この処理が終了すると、ステップＳ１４１へ移る。
【００６７】
一方、ステップＳ１３７では、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」がオンであるか否かを判定する。「コマンド変換フラグ」がオンであると判定された場合に（ステップＳ１３７肯定）、ステップＳ１３８へ移り、「コマンド変換フラグ」がオンであると判定されなかった場合に（ステップＳ１３７否定）、ステップＳ１３９へ移る。
【００６８】
続いて、音声認識処理結果判定処理部１３ｂは、認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙の割合が所定閾値以上であると所定回数判定されなかったか（すなわち、ステップＳ１３４否定が所定回数連続したか）否かを判定する（ステップＳ１３９）。ステップＳ１３４否定が所定回数連続した場合に（ステップＳ１３９肯定）、音声認識処理結果判定処理部１３ｂは、所定の記憶領域に格納される「コマンド変換フラグ」をオフにし（ステップＳ１４０）、ステップＳ１３４否定が所定回数連続しなかった場合に（ステップＳ１３９否定）、ステップＳ１４１へ移る。
【００６９】
ステップＳ１４１では、音声認識処理部１３ａは、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了するか否かを判定し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了する場合は（ステップＳ１４１肯定）、実施例３の音声認識処理は終了し、音声認識結果のコマンド変換出力処理部１３ｃへの出力を終了しない場合は（ステップＳ１４１否定）、ステップＳ１３１へ移る。
【００７０】
以上のステップＳ１３４の判定処理によって、発話語彙のカテゴリ分類による発話内容の傾向がある時間内にある程度現れた場合に、音声認識結果をコマンド変換処理部へと受け渡してコマンド変換をおこなうようにし、ステップＳ１３９の判定処理によって、発話語彙のカテゴリ分類による発話内容の傾向が現れなくなった場合に、音声認識結果をコマンド変換処理部へと受け渡すことをキャンセルしてコマンド変換をおこなわせないように制御することが可能になる。
【００７１】
なお、ステップＳ１３４の判定条件として、「認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙の割合が所定閾値以上であるか否か」に代えて「認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙が所定数連続しているか否か」を採用してもよい。これを図８のステップＳ１３４に代えてステップＳ１３４ａとする（図９参照）。
【００７２】
これに応じて、図８のステップＳ１３９の判定条件として、「認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙の割合が所定閾値以上であると所定回数判定されなかったか（すなわち、ステップＳ１３４否定が所定回数連続したか）否か」に代えて「認識語彙格納バッファ１２ｆにバッファリングされている音声認識結果の語彙のうち同一所属カテゴリの語彙が所定数連続していると所定回数判定されなかったか（すなわち、ステップＳ１３４ａ否定が所定回数連続したか）否か」を採用することとなる。これを図８のステップＳ１３９に代えてステップＳ１３９ａとする（図９参照）。
【００７３】
以上のステップＳ１３４ａの判定処理によって、発話語彙のカテゴリ分類による発話内容に一時的な強い傾向が現れた場合に、音声認識結果をコマンド変換処理部へと受け渡してコマンド変換をおこなうようにし、ステップＳ１３９ａの判定処理によって、発話語彙のカテゴリ分類による発話内容の一時的な強い傾向が現れなくなった場合に、音声認識結果をコマンド変換処理部へと受け渡すことをキャンセルしてコマンド変換をおこなわせないように制御することが可能になる。
【００７４】
以上、本発明の実施例を説明したが、本発明は、これに限られるものではなく、特許請求の範囲に記載した技術的思想の範囲内で、更に種々の異なる実施例で実施されてもよいものである。また、実施例に記載した効果は、これに限定されるものではない。
【００７５】
また、上記実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記実施例で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【００７６】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【００７７】
さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵ（Central Processing Unit）（またはＭＰＵ（Micro Processing Unit）、ＭＣＵ（Micro Controller Unit）などのマイクロ・コンピュータ）および当該ＣＰＵ（またはＭＰＵ、ＭＣＵなどのマイクロ・コンピュータ）にて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現されてもよい。
【産業上の利用可能性】
【００７８】
本発明は、音声認識装置において、車載装置へ向かってその制御のために発話する発話者をトークスイッチの押下操作のわずらわしさから開放し、かつ該発話が車載装置に対するものであるか否かを明確に認識して誤作動を起こさないようにしたい場合に有用である。
【図面の簡単な説明】
【００７９】
【図１】実施例１にかかる音声認識装置の構成を示す機能ブロック図である。
【図２】実施例１の音声認識処理手順（その１）を示すフローチャートである。
【図３】実施例１の音声認識処理手順（その２）を示すフローチャートである。
【図４】実施例２にかかる音声認識装置の構成を示す機能ブロック図である。
【図５】実施例２の音声認識処理手順を示すフローチャートである。
【図６】実施例３にかかる音声認識装置の構成を示す機能ブロック図である。
【図７】語彙カテゴリ分類テーブルの例を示す図である。
【図８】実施例３の音声認識処理手順（その１）を示すフローチャートである。
【図９】実施例３の音声認識処理手順（その２）を示すフローチャートである。
【符号の説明】
【００８０】
１車両
１０ａ音声認識装置
１０ｂ音声認識装置
１０ｃ音声認識装置
１１ａ表示部
１１ｂ音声発生部
１２記憶部
１２ａキーワード辞書
１２ｂ音声認識辞書
１２ｃ開始キーワード辞書
１２ｄ終了キーワード辞書
１２ｅ語彙カテゴリ分類テーブル
１２ｆ認識語彙格納バッファ
１３制御部
１３ａ音声認識処理部
１３ｂ音声認識処理結果判定処理部
１３ｃコマンド変換出力処理部
１４マイク
２０カーナビゲーション装置

【特許請求の範囲】
【請求項１】
車両の搭乗者によって発話された発話語彙を音声認識する音声認識手段と、該音声認識手段によって音声認識された該発話語彙を対応するコマンドへ変換して車載装置へと受け渡すコマンド変換手段とを有する音声認識装置であって、
前記音声認識手段によって音声認識された発話語彙が前記車載装置へ向けられた発話であるか否かを判定する音声認識結果判定手段をさらに有し、
前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合にのみ該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする音声認識装置。
【請求項２】
前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が特定語彙であると前記音声認識結果判定手段により判定された場合に、該特定語彙以降に音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする請求項１に記載の音声認識装置。
【請求項３】
前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が特定語彙であると前記音声認識結果判定手段により判定された場合に、該特定語彙以前に音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする請求項１に記載の音声認識装置。
【請求項４】
前記音声認識手段は、前記音声認識手段によって音声認識された発話語彙が第１の特定語彙であると前記音声認識結果判定手段により判定された場合に、該第１の特定語彙より後に音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを開始し、前記音声認識手段によって該第１の特定語彙以降に音声認識された発話語彙が第２の特定語彙であると前記音声認識結果判定手段により判定された場合に、該第２の特定語彙以降に音声認識した発話語彙を音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを終了すことを特徴とする請求項１に記載の音声認識装置。
【請求項５】
前記音声認識手段によって音声認識された発話語彙を所定数だけバッファリングするバッファリング手段と、
前記発話語彙に、該発話語彙が属するカテゴリを対応付けて記憶する語彙カテゴリ記憶手段と
をさらに有し、
前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のカテゴリに基づいて、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合にのみ該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする請求項１に記載の音声認識装置。
【請求項６】
前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリの出現率が所定値以上となったとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合に、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする請求項５に記載の音声認識装置。
【請求項７】
前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリの出現率が所定値以上となったとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定されなかった場合が所定回数連続して以降、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことをキャンセルすることを特徴とする請求項６に記載の音声認識装置。
【請求項８】
前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリが所定回数連続したとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定された場合に、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことを特徴とする請求項５に記載の音声認識装置。
【請求項９】
前記音声認識手段は、前記バッファリング手段にバッファリングされる発話語彙のなかで特定カテゴリが所定回数連続したとして、音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定手段により判定されなかった場合が所定回数連続して以降、該音声認識した発話語彙を前記コマンド変換手段へと受け渡すことをキャンセルすることを特徴とする請求項８に記載の音声認識装置。
【請求項１０】
車両の搭乗者によって発話された発話語彙を音声認識する音声認識工程と、該音声認識手段によって音声認識された該発話語彙を対応するコマンドへ変換して車載装置へと受け渡すコマンド変換工程とを含む音声認識方法であって、
前記音声認識工程によって音声認識された発話語彙が前記車載装置へ向けられた発話であるか否かを判定する音声認識結果判定工程をさらに含み、
前記音声認識工程は、前記音声認識工程によって音声認識された発話語彙が前記車載装置へ向けられた発話であると前記音声認識結果判定工程により判定された場合にのみ、該音声認識した発話語彙を前記コマンド変換肯定へと受け渡すことを特徴とする音声認識方法。

【図１】