車載装置および音声認識方法
【課題】音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる車載装置20を提供する。
【解決手段】本発明の車載装置20は、座席位置毎に許可される操作コマンドが予め定められており、音声により操作コマンドが入力された場合に、複数のマイクロフォン11を介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、当該音声による操作コマンドが当該発生位置において許可されている操作コマンドである場合に、当該操作コマンドに対応する処理を実行する。
【解決手段】本発明の車載装置20は、座席位置毎に許可される操作コマンドが予め定められており、音声により操作コマンドが入力された場合に、複数のマイクロフォン11を介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、当該音声による操作コマンドが当該発生位置において許可されている操作コマンドである場合に、当該操作コマンドに対応する処理を実行する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する装置に関する。
【背景技術】
【0002】
特許文献1には、車両が停止中の場合には全ての操作を許可し、車両が走行中の場合には予め定められた操作のみを許可する車載用ナビゲーション装置が開示されている。これにより、画面を注視しながら操作する必要がある操作を、車両の走行中に、運転者に操作させることを防止することができ、運転者を運転に集中させることができる。また、特許文献2には、車両に搭載され、音声により入力された操作コマンドに応じて処理を行う音声認識装置が開示されている。
【0003】
【特許文献1】特開平7−270173号公報
【特許文献2】特開平11−15494号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、車両の走行中に、運転者以外の同乗者が、車載装置の機能を利用したい場合がある。同乗者は、運転していないため、画面を注視しながら操作する必要がある操作を行っても、運転の妨げとなることはない。しかし、従来は、車両が走行中の場合には、予め定められた操作のみが許可され、同乗者にとっては利便性の低いものとなっていた。これは、音声により操作コマンドを入力する場合においても同様であった。
【0005】
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、音声により入力された操作コマンドに応じて処理を行う車載装置において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができるようにすることにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の車載装置は、座席位置毎に許可される操作コマンドが予め定められており、音声により操作コマンドが入力された場合に、複数のマイクロフォンを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、入力された操作コマンドが当該発生位置において許可されている操作コマンドである場合に、当該操作コマンドに対応する処理を実行する。
【0007】
例えば、本発明の第一の態様は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置であって、車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを格納する許可コマンド格納手段と、操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付手段と、音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定手段と、音源位置特定手段から出力された音声信号から操作コマンドを認識する音声認識手段と、音源位置特定手段から出力された音声信号に対応する音声の発生位置において許可されている操作コマンドを許可コマンド格納手段から抽出し、音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、音声認識手段によって認識された操作コマンドに対応する処理を実行するコマンド処理手段とを備えることを特徴とする車載装置を提供する。
【0008】
また、本発明の第二の態様は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置における音声認識方法であって、車載装置は、車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを許可コマンド格納手段に格納する許可コマンド格納ステップと、操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付ステップと、音声認識開始受付ステップにおいて操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定ステップと、音源位置特定ステップにおいて出力した音声信号から操作コマンドを認識する音声認識ステップと、音源位置特定ステップにおいて出力した音声信号に対応する音声の発生位置において許可されている操作コマンドを許可コマンド格納手段から抽出し、音声認識ステップにおいて認識した操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、音声認識ステップにおいて認識した操作コマンドに対応する処理を実行するコマンド処理ステップとを実行することを特徴とする音声認識方法を提供する。
【発明の効果】
【0009】
本発明の車載装置によれば、音声により入力された操作コマンドに応じて処理を行う車載装置において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。
【発明を実施するための最良の形態】
【0010】
まず、本発明の第一の実施形態について、図面を参照しながら説明する。
【0011】
図1は、本発明の第一の実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、複数のマイクロフォン11、音声認識開始ボタン12、表示装置13、センサ14、および車載装置20を備える。車載装置20は、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25を有する。
【0012】
開始指示受付部22は、ユーザによって音声認識開始ボタン12が押下された場合に、音声信号に対応する音声の発生位置の特定を音源位置特定部21に指示する。音源位置特定部21は、開始指示受付部22から音声信号の発生位置の特定を指示された場合に、車両内に設けられた複数のマイクロフォン11のそれぞれを介して収集された音声信号の遅延量や振幅の差等に基づいて、当該音声信号に対応する音声の発生位置を特定する。そして、音源位置特定部21は、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に音声認識部23へ出力する。
【0013】
また、複数のマイクロフォン11のそれぞれを介して収集された信号に、異なる位置から発生した複数の音声に対応する音声信号が含まれている場合、音源位置特定部21は、発生位置毎に、当該発生位置から発生した音声に対応する音声信号を、対応する発生位置を示す情報と共に音声認識部23へ出力する。音源位置特定部21から音声認識部23へ出力されるデータ40には、例えば図2に示すように、車両内での音声の発生位置を示す音源位置41に対応付けて、当該音源位置41から発生した音声に対応する音声信号42が格納される。
【0014】
本実施形態において、音源位置41には、車両内の所定の高さにおける水平面をxy平面とした場合のxy平面上の座標が格納される。また、他の例として、音源位置41には、車両内の位置を示す三次元座標が格納されていてもよい。
【0015】
音声認識部23は、音源位置特定部21から出力されたそれぞれの音声信号から公知の音声認識技術を用いて、操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声信号に対応する音声の発生位置を示す情報と共にコマンド処理部24へ出力する。
【0016】
許可コマンド格納部25には、例えば図3に示すように、車両内の座席の領域を示す座席領域250に対応付けて、当該座席領域250で示される座席の属性251、当該座席に座った人に対して車両の走行時に許可する複数の操作コマンドを示す走行中許可コマンド252、および、当該座席に座った人に対して停車中に許可する複数の操作コマンドを示す停止中許可コマンド253が予め格納されている。
【0017】
座席領域250には、例えば図4に示すように、車両内の所定の高さにおける水平面をxy平面とした場合のxy平面上において、それぞれの座席位置を囲む矩形領域の対向する頂点の座標が格納される。図4は、車両の内部を上空から見た図を模式的に表したものであり、ハンドル15近傍の領域30は運転席を示し、領域31は助手席を示し、領域32は後部座席を示している。なお、図4に示す例において、複数のマイクロフォン11および表示装置13は、ダッシュボード付近に設けられる。
【0018】
走行中許可コマンド252または停止中許可コマンド253において、全ての操作コマンドが許可される場合、全ての操作コマンドが許可される旨を示す「ALL」が格納される。
【0019】
コマンド処理部24は、音声認識部23から、音声信号および当該音声信号に対応する音声の発生位置を示す情報を受信した場合に、許可コマンド格納部25を参照して、当該発生位置が含まれる座席領域を特定する。そして、コマンド処理部24は、GPS(Global Positioning System)受信機や方位センサ、距離センサ等のセンサ14から受信した測定信号に基づいて車両が走行中か否かを判定する。
【0020】
車両が走行中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、走行中許可コマンド252に格納されている複数の操作コマンドを抽出する。一方、車両が停止中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、停止中許可コマンド253に格納されている複数の操作コマンドを抽出する。
【0021】
そして、コマンド処理部24は、音声認識部23から受信した操作コマンドが、許可コマンド格納部25から抽出した複数の操作コマンドのいずれかに該当する場合に、当該操作コマンドの元となった音声信号に対応する音声の発生位置が含まれる座席領域を、例えば図5に示すように表示装置13に表示して、音声認識部23から受信した操作コマンドに対応する処理を実行する。
【0022】
図5に示した例において、コマンド処理部24は、表示装置13の画面内に音声信号の発生位置を示すアイコン50を表示している。アイコン50には、助手席を示す領域51、運転席を示す領域52、および後部座席を示す領域53が含まれる。図5に示した例では、運転席から発生した音声による操作コマンドに対応する処理が実行された旨が表示されている。
【0023】
また、他の例として、図6に示すように、画面のふちに沿って、助手席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域55、運転席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域56、および後部座席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域57を表示するようにしてもよい。
【0024】
なお、音声認識部23から複数の音声信号およびそれぞれの音声信号に対応する音声の発生位置を示す情報を受信した場合、コマンド処理部24は、それぞれの音声信号に対応する音声の発生位置に基づいて許可コマンド格納部25を参照し、運転席の領域から発生した音声に対応する音声信号による操作コマンドを優先して処理する。運転席から発生した音声に対応する音声信号による操作コマンドがなかった場合、コマンド処理部24は、例えば助手席、後部座席の順に優先して操作コマンドを実行する。
【0025】
図7は、車載装置20の動作の一例を示すフローチャートである。例えば車両のエンジンが始動する等の所定のタイミングで、車載装置20は、本フローチャートに示す動作を開始する。
【0026】
まず、開始指示受付部22は、音声認識開始ボタン12が押下されたいか否かを判定する(S100)。音声認識開始ボタン12が押下されていない場合(S100:No)、開始指示受付部22は、音声認識開始ボタン12が押下されるまでステップS100に示した処理を繰り返す。
【0027】
音声認識開始ボタン12が押下された場合(S100:Yes)、開始指示受付部22は、音声信号に対応する音声の発生位置の特定を音源位置特定部21に指示する。音源位置特定部21は、車両内に設けられた複数のマイクロフォン11のそれぞれを介して収集された音声信号の遅延量や振幅の差等に基づいて、当該音声信号に対応する音声の発生位置を特定し(S101)、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に音声認識部23へ出力する。
【0028】
次に、音声認識部23は、音源位置特定部21から出力されたそれぞれの音声信号から公知の音声認識技術を用いて、操作コマンドを認識し(S102)、認識した操作コマンドを、当該操作コマンドの元となった音声信号に対応する音声の発生位置を示す情報と共にコマンド処理部24へ出力する。
【0029】
次に、コマンド処理部24は、音声認識部23から出力された操作コマンドを参照して、複数の操作コマンドが認識されたか否かを判定する(S103)。複数の操作コマンドが認識された場合(S103:Yes)、コマンド処理部24は、操作コマンドと共に音声認識部23から出力された音声の発生位置に基づいて許可コマンド格納部25を参照し、運転席の領域から発生した音声に対応する音声信号による操作コマンドを優先して処理する(S104)。
【0030】
次に、コマンド処理部24は、処理した操作コマンドに対応する音声の発生位置が含まれる座席位置を表示装置13に表示し(S105)、開始指示受付部22は、ステップS100に示した処理を実行する。
【0031】
ステップS103において、単一の操作コマンドが認識された場合(S103:No)、コマンド処理部24は、当該認識された操作コマンドに対応する処理を実行し(S106)、ステップS105に示した処理を実行する。
【0032】
以上、本発明の第一の実施形態について説明した。
【0033】
上記説明から明らかなように、本実施形態の車載システム10によれば、音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。
【0034】
次に、本発明の第二の実施形態について説明する。
【0035】
図8は、本発明の第二実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、複数のマイクロフォン11、音声認識開始ボタン12、複数の表示装置13、センサ14、および車載装置20を備える。車載装置20は、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25を有する。なお、以下に説明する点を除き、図8において、図1と同じ符号を付した構成は、図1における構成と同一または同様の機能を有するため説明を省略する。
【0036】
それぞれの表示装置13は、例えば図9に示すように、車両内の異なる位置に設けられる。表示装置13−1は例えば運転席の前に設けられ、運転席に座った者に見せる画面を表示する。表示装置13−2は例えば助手席の前に設けられ、助手席に座った者に見せる画面を表示する。表示装置13−3は、例えば後部座席の前に設けられたルーフモニタであり、後部座席に座った者に見せる画面を表示する。
【0037】
許可コマンド格納部25には、例えば図10に示すように、座席領域250に対応付けて、属性251、走行中許可コマンド252、停止中許可コマンド253、および、座席領域250で示される座席から発生した音声の音声信号に対応する操作コマンドによる処理結果を反映させる表示装置13を識別する表示装置ID254が予め格納されている。
【0038】
コマンド処理部24は、音声認識部23から、音声信号および当該音声信号に対応する音声の発生位置を示す情報を受信した場合に、許可コマンド格納部25を参照して、当該発生位置が含まれる座席領域を特定する。そして、コマンド処理部24は、マイクロフォン11から受信した測定信号に基づいて車両が走行中か否かを判定する。
【0039】
車両が走行中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、走行中許可コマンド252に格納されている複数の操作コマンドを抽出する。一方、車両が停止中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、停止中許可コマンド253に格納されている複数の操作コマンドを抽出する。
【0040】
そして、コマンド処理部24は、音声認識部23から受信した操作コマンドが、許可コマンド格納部25から抽出した複数の操作コマンドのいずれかに該当する場合に、当該操作コマンドに対応する処理を実行する。そして、コマンド処理部24は、許可コマンド格納部25を参照して、当該操作コマンドの元となった音声信号に対応する音声の発生位置が含まれる座席領域250に対応付けられている表示装置IDを特定する。そして、コマンド処理部24は、実行結果を、特定した表示装置IDに対応する表示装置13に反映させる。
【0041】
以上、本発明の第二の実施形態について説明した。
【0042】
本実施形態の車載システム10においても、音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。さらに、操作コマンドによる処理を、当該操作コマンドの元となる音声が発せされた位置に座っている者が見る表示装置13に反映させることができる。
【0043】
なお、上記第一または第二の実施形態における車載装置20は、例えば図11に示すような構成のコンピュータ60によって実現される。図11は、車載装置20の機能を実現するコンピュータ60のハードウェア構成の一例を示すハードウェア構成図である。コンピュータ60は、CPU(Central Processing Unit)61、RAM(Random Access Memory)62、ROM(Read Only Memory)63、HDD(Hard Disk Drive)64、入力インターフェイス(I/F)65、出力インターフェイス(I/F)66、およびメディアインターフェイス(I/F)67を備える。
【0044】
CPU61は、ROM63またはHDD64に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM63は、コンピュータ60の起動時にCPU61が実行するブートプログラムや、コンピュータ60のハードウェアに依存するプログラム等を格納する。HDD64は、CPU61によって実行されるプログラムを格納する。
【0045】
入力インターフェイス65は、マイクロフォン11、音声認識開始ボタン12、またはセンサ14からの信号を受信してCPU61へ送る。CPU61は、入力インターフェイス65を介して、マイクロフォン11、音声認識開始ボタン12、およびセンサ14を制御し、入力インターフェイス65を介して、マイクロフォン11、音声認識開始ボタン12、またはセンサ14から信号を取得する。出力インターフェイス66は、CPU61から取得したデータを、表示装置13へ送る。CPU61は、出力インターフェイス66を介して、表示装置13を制御し、生成したデータを、出力インターフェイス66を介して表示装置13へ出力する。
【0046】
メディアインターフェイス67は、記録媒体68に格納されたプログラムまたはデータを読み取り、RAM62に提供する。RAM62を介してCPU61に提供されるプログラムは、記録媒体68に格納されている。当該プログラムは、記録媒体68から読み出されて、RAM62を介してコンピュータ60にインストールされ、CPU61によって実行される。記録媒体68は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0047】
コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25として機能させる。コンピュータ60は、これらのプログラムを、記録媒体68から読み取って実行するが、他の例として、コンピュータ60に通信機能を設け、通信回線を介してこれらのプログラムを取得するようにしてもよい。
【0048】
また、本発明は、上記した各実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【0049】
例えば、上記した第二の実施形態において、車載システム10は、複数の座席のそれぞれに対応する複数の表示装置13を備えるが、他の形態として、車載システム10は、複数の座席のそれぞれの対応する画面を表示する1台の表示装置13を備えていてもよい。この場合、コマンド処理部24は、操作コマンドに対応する処理の実行結果を、当該操作コマンドに対応する音声信号の発生位置が含まれる座席領域250用の画面に反映させる。
【0050】
複数の座席のそれぞれの対応する画面を表示する表示装置13としては、例えば、パネルの前面にスリットを設け、運転席側用の画像と助手席側用の画像とを水平方向に交互に並べ、上記スリットでバックライトの光を左右に分離することにより運転席側と助手席側とで異なる画像を表示することができる液晶ディスプレイであるデュアルディスプレイが好ましい。
【図面の簡単な説明】
【0051】
【図1】本発明の第一実施形態に係る車載システム10の構成を示すシステム構成図である。
【図2】音源位置特定部21から出力されるデータ40の構造の一例を示す図である。
【図3】第一の実施形態において許可コマンド格納部25に格納されるデータの構造の一例を示す図である。
【図4】座席領域を説明するための概念図である。
【図5】表示装置13に表示される画面の一例を示す概念図である。
【図6】表示装置13に表示される画面の他の例を示す概念図である。
【図7】車載装置20の動作の一例を示すフローチャートである。
【図8】本発明の第二実施形態に係る車載システム10の構成を示すシステム構成図である。
【図9】第二実施形態における表示装置13の配置を説明するための概念図である。
【図10】第二の実施形態において許可コマンド格納部25に格納されるデータの構造の一例を示す図である。
【図11】車載装置20の機能を実現するコンピュータ50の構成の一例を示すハードウェア構成図である。
【符号の説明】
【0052】
10・・・車載システム、11・・・マイクロフォン、12・・・音声認識開始ボタン、13・・・表示装置、14・・・センサ、15・・・ハンドル、20・・・車載装置、21・・・音源位置特定部、22・・・開始指示受付部、23・・・音声認識部、24・・・コマンド処理部、25・・・許可コマンド格納部、30・・・領域、31・・・領域、32・・・領域、40・・・データ、41・・・音源位置、42・・・音声信号、50・・・アイコン、51・・・領域、52・・・領域、53・・・領域、55・・・領域、56・・・領域、57・・・領域、60・・・コンピュータ、61・・・CPU、62・・・RAM、63・・・ROM、64・・・HDD、65・・・入力インターフェイス、66・・・出力インターフェイス、67・・・メディアインターフェイス、68・・・記録媒体
【技術分野】
【0001】
本発明は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する装置に関する。
【背景技術】
【0002】
特許文献1には、車両が停止中の場合には全ての操作を許可し、車両が走行中の場合には予め定められた操作のみを許可する車載用ナビゲーション装置が開示されている。これにより、画面を注視しながら操作する必要がある操作を、車両の走行中に、運転者に操作させることを防止することができ、運転者を運転に集中させることができる。また、特許文献2には、車両に搭載され、音声により入力された操作コマンドに応じて処理を行う音声認識装置が開示されている。
【0003】
【特許文献1】特開平7−270173号公報
【特許文献2】特開平11−15494号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、車両の走行中に、運転者以外の同乗者が、車載装置の機能を利用したい場合がある。同乗者は、運転していないため、画面を注視しながら操作する必要がある操作を行っても、運転の妨げとなることはない。しかし、従来は、車両が走行中の場合には、予め定められた操作のみが許可され、同乗者にとっては利便性の低いものとなっていた。これは、音声により操作コマンドを入力する場合においても同様であった。
【0005】
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、音声により入力された操作コマンドに応じて処理を行う車載装置において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができるようにすることにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の車載装置は、座席位置毎に許可される操作コマンドが予め定められており、音声により操作コマンドが入力された場合に、複数のマイクロフォンを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、入力された操作コマンドが当該発生位置において許可されている操作コマンドである場合に、当該操作コマンドに対応する処理を実行する。
【0007】
例えば、本発明の第一の態様は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置であって、車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを格納する許可コマンド格納手段と、操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付手段と、音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定手段と、音源位置特定手段から出力された音声信号から操作コマンドを認識する音声認識手段と、音源位置特定手段から出力された音声信号に対応する音声の発生位置において許可されている操作コマンドを許可コマンド格納手段から抽出し、音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、音声認識手段によって認識された操作コマンドに対応する処理を実行するコマンド処理手段とを備えることを特徴とする車載装置を提供する。
【0008】
また、本発明の第二の態様は、車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置における音声認識方法であって、車載装置は、車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを許可コマンド格納手段に格納する許可コマンド格納ステップと、操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付ステップと、音声認識開始受付ステップにおいて操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定ステップと、音源位置特定ステップにおいて出力した音声信号から操作コマンドを認識する音声認識ステップと、音源位置特定ステップにおいて出力した音声信号に対応する音声の発生位置において許可されている操作コマンドを許可コマンド格納手段から抽出し、音声認識ステップにおいて認識した操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、音声認識ステップにおいて認識した操作コマンドに対応する処理を実行するコマンド処理ステップとを実行することを特徴とする音声認識方法を提供する。
【発明の効果】
【0009】
本発明の車載装置によれば、音声により入力された操作コマンドに応じて処理を行う車載装置において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。
【発明を実施するための最良の形態】
【0010】
まず、本発明の第一の実施形態について、図面を参照しながら説明する。
【0011】
図1は、本発明の第一の実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、複数のマイクロフォン11、音声認識開始ボタン12、表示装置13、センサ14、および車載装置20を備える。車載装置20は、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25を有する。
【0012】
開始指示受付部22は、ユーザによって音声認識開始ボタン12が押下された場合に、音声信号に対応する音声の発生位置の特定を音源位置特定部21に指示する。音源位置特定部21は、開始指示受付部22から音声信号の発生位置の特定を指示された場合に、車両内に設けられた複数のマイクロフォン11のそれぞれを介して収集された音声信号の遅延量や振幅の差等に基づいて、当該音声信号に対応する音声の発生位置を特定する。そして、音源位置特定部21は、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に音声認識部23へ出力する。
【0013】
また、複数のマイクロフォン11のそれぞれを介して収集された信号に、異なる位置から発生した複数の音声に対応する音声信号が含まれている場合、音源位置特定部21は、発生位置毎に、当該発生位置から発生した音声に対応する音声信号を、対応する発生位置を示す情報と共に音声認識部23へ出力する。音源位置特定部21から音声認識部23へ出力されるデータ40には、例えば図2に示すように、車両内での音声の発生位置を示す音源位置41に対応付けて、当該音源位置41から発生した音声に対応する音声信号42が格納される。
【0014】
本実施形態において、音源位置41には、車両内の所定の高さにおける水平面をxy平面とした場合のxy平面上の座標が格納される。また、他の例として、音源位置41には、車両内の位置を示す三次元座標が格納されていてもよい。
【0015】
音声認識部23は、音源位置特定部21から出力されたそれぞれの音声信号から公知の音声認識技術を用いて、操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声信号に対応する音声の発生位置を示す情報と共にコマンド処理部24へ出力する。
【0016】
許可コマンド格納部25には、例えば図3に示すように、車両内の座席の領域を示す座席領域250に対応付けて、当該座席領域250で示される座席の属性251、当該座席に座った人に対して車両の走行時に許可する複数の操作コマンドを示す走行中許可コマンド252、および、当該座席に座った人に対して停車中に許可する複数の操作コマンドを示す停止中許可コマンド253が予め格納されている。
【0017】
座席領域250には、例えば図4に示すように、車両内の所定の高さにおける水平面をxy平面とした場合のxy平面上において、それぞれの座席位置を囲む矩形領域の対向する頂点の座標が格納される。図4は、車両の内部を上空から見た図を模式的に表したものであり、ハンドル15近傍の領域30は運転席を示し、領域31は助手席を示し、領域32は後部座席を示している。なお、図4に示す例において、複数のマイクロフォン11および表示装置13は、ダッシュボード付近に設けられる。
【0018】
走行中許可コマンド252または停止中許可コマンド253において、全ての操作コマンドが許可される場合、全ての操作コマンドが許可される旨を示す「ALL」が格納される。
【0019】
コマンド処理部24は、音声認識部23から、音声信号および当該音声信号に対応する音声の発生位置を示す情報を受信した場合に、許可コマンド格納部25を参照して、当該発生位置が含まれる座席領域を特定する。そして、コマンド処理部24は、GPS(Global Positioning System)受信機や方位センサ、距離センサ等のセンサ14から受信した測定信号に基づいて車両が走行中か否かを判定する。
【0020】
車両が走行中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、走行中許可コマンド252に格納されている複数の操作コマンドを抽出する。一方、車両が停止中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、停止中許可コマンド253に格納されている複数の操作コマンドを抽出する。
【0021】
そして、コマンド処理部24は、音声認識部23から受信した操作コマンドが、許可コマンド格納部25から抽出した複数の操作コマンドのいずれかに該当する場合に、当該操作コマンドの元となった音声信号に対応する音声の発生位置が含まれる座席領域を、例えば図5に示すように表示装置13に表示して、音声認識部23から受信した操作コマンドに対応する処理を実行する。
【0022】
図5に示した例において、コマンド処理部24は、表示装置13の画面内に音声信号の発生位置を示すアイコン50を表示している。アイコン50には、助手席を示す領域51、運転席を示す領域52、および後部座席を示す領域53が含まれる。図5に示した例では、運転席から発生した音声による操作コマンドに対応する処理が実行された旨が表示されている。
【0023】
また、他の例として、図6に示すように、画面のふちに沿って、助手席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域55、運転席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域56、および後部座席から発生した音声による操作コマンドに対応する処理が実行された旨を表示する領域57を表示するようにしてもよい。
【0024】
なお、音声認識部23から複数の音声信号およびそれぞれの音声信号に対応する音声の発生位置を示す情報を受信した場合、コマンド処理部24は、それぞれの音声信号に対応する音声の発生位置に基づいて許可コマンド格納部25を参照し、運転席の領域から発生した音声に対応する音声信号による操作コマンドを優先して処理する。運転席から発生した音声に対応する音声信号による操作コマンドがなかった場合、コマンド処理部24は、例えば助手席、後部座席の順に優先して操作コマンドを実行する。
【0025】
図7は、車載装置20の動作の一例を示すフローチャートである。例えば車両のエンジンが始動する等の所定のタイミングで、車載装置20は、本フローチャートに示す動作を開始する。
【0026】
まず、開始指示受付部22は、音声認識開始ボタン12が押下されたいか否かを判定する(S100)。音声認識開始ボタン12が押下されていない場合(S100:No)、開始指示受付部22は、音声認識開始ボタン12が押下されるまでステップS100に示した処理を繰り返す。
【0027】
音声認識開始ボタン12が押下された場合(S100:Yes)、開始指示受付部22は、音声信号に対応する音声の発生位置の特定を音源位置特定部21に指示する。音源位置特定部21は、車両内に設けられた複数のマイクロフォン11のそれぞれを介して収集された音声信号の遅延量や振幅の差等に基づいて、当該音声信号に対応する音声の発生位置を特定し(S101)、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に音声認識部23へ出力する。
【0028】
次に、音声認識部23は、音源位置特定部21から出力されたそれぞれの音声信号から公知の音声認識技術を用いて、操作コマンドを認識し(S102)、認識した操作コマンドを、当該操作コマンドの元となった音声信号に対応する音声の発生位置を示す情報と共にコマンド処理部24へ出力する。
【0029】
次に、コマンド処理部24は、音声認識部23から出力された操作コマンドを参照して、複数の操作コマンドが認識されたか否かを判定する(S103)。複数の操作コマンドが認識された場合(S103:Yes)、コマンド処理部24は、操作コマンドと共に音声認識部23から出力された音声の発生位置に基づいて許可コマンド格納部25を参照し、運転席の領域から発生した音声に対応する音声信号による操作コマンドを優先して処理する(S104)。
【0030】
次に、コマンド処理部24は、処理した操作コマンドに対応する音声の発生位置が含まれる座席位置を表示装置13に表示し(S105)、開始指示受付部22は、ステップS100に示した処理を実行する。
【0031】
ステップS103において、単一の操作コマンドが認識された場合(S103:No)、コマンド処理部24は、当該認識された操作コマンドに対応する処理を実行し(S106)、ステップS105に示した処理を実行する。
【0032】
以上、本発明の第一の実施形態について説明した。
【0033】
上記説明から明らかなように、本実施形態の車載システム10によれば、音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。
【0034】
次に、本発明の第二の実施形態について説明する。
【0035】
図8は、本発明の第二実施形態に係る車載システム10の構成を示すシステム構成図である。車載システム10は、複数のマイクロフォン11、音声認識開始ボタン12、複数の表示装置13、センサ14、および車載装置20を備える。車載装置20は、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25を有する。なお、以下に説明する点を除き、図8において、図1と同じ符号を付した構成は、図1における構成と同一または同様の機能を有するため説明を省略する。
【0036】
それぞれの表示装置13は、例えば図9に示すように、車両内の異なる位置に設けられる。表示装置13−1は例えば運転席の前に設けられ、運転席に座った者に見せる画面を表示する。表示装置13−2は例えば助手席の前に設けられ、助手席に座った者に見せる画面を表示する。表示装置13−3は、例えば後部座席の前に設けられたルーフモニタであり、後部座席に座った者に見せる画面を表示する。
【0037】
許可コマンド格納部25には、例えば図10に示すように、座席領域250に対応付けて、属性251、走行中許可コマンド252、停止中許可コマンド253、および、座席領域250で示される座席から発生した音声の音声信号に対応する操作コマンドによる処理結果を反映させる表示装置13を識別する表示装置ID254が予め格納されている。
【0038】
コマンド処理部24は、音声認識部23から、音声信号および当該音声信号に対応する音声の発生位置を示す情報を受信した場合に、許可コマンド格納部25を参照して、当該発生位置が含まれる座席領域を特定する。そして、コマンド処理部24は、マイクロフォン11から受信した測定信号に基づいて車両が走行中か否かを判定する。
【0039】
車両が走行中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、走行中許可コマンド252に格納されている複数の操作コマンドを抽出する。一方、車両が停止中である場合、コマンド処理部24は、特定した座席領域に対応付けられており、停止中許可コマンド253に格納されている複数の操作コマンドを抽出する。
【0040】
そして、コマンド処理部24は、音声認識部23から受信した操作コマンドが、許可コマンド格納部25から抽出した複数の操作コマンドのいずれかに該当する場合に、当該操作コマンドに対応する処理を実行する。そして、コマンド処理部24は、許可コマンド格納部25を参照して、当該操作コマンドの元となった音声信号に対応する音声の発生位置が含まれる座席領域250に対応付けられている表示装置IDを特定する。そして、コマンド処理部24は、実行結果を、特定した表示装置IDに対応する表示装置13に反映させる。
【0041】
以上、本発明の第二の実施形態について説明した。
【0042】
本実施形態の車載システム10においても、音声により入力された操作コマンドに応じて処理を行う車載装置20において、乗員が座っている車両内の位置に応じて、当該位置に座っている乗員に対して許可する操作コマンドを設定することができる。さらに、操作コマンドによる処理を、当該操作コマンドの元となる音声が発せされた位置に座っている者が見る表示装置13に反映させることができる。
【0043】
なお、上記第一または第二の実施形態における車載装置20は、例えば図11に示すような構成のコンピュータ60によって実現される。図11は、車載装置20の機能を実現するコンピュータ60のハードウェア構成の一例を示すハードウェア構成図である。コンピュータ60は、CPU(Central Processing Unit)61、RAM(Random Access Memory)62、ROM(Read Only Memory)63、HDD(Hard Disk Drive)64、入力インターフェイス(I/F)65、出力インターフェイス(I/F)66、およびメディアインターフェイス(I/F)67を備える。
【0044】
CPU61は、ROM63またはHDD64に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM63は、コンピュータ60の起動時にCPU61が実行するブートプログラムや、コンピュータ60のハードウェアに依存するプログラム等を格納する。HDD64は、CPU61によって実行されるプログラムを格納する。
【0045】
入力インターフェイス65は、マイクロフォン11、音声認識開始ボタン12、またはセンサ14からの信号を受信してCPU61へ送る。CPU61は、入力インターフェイス65を介して、マイクロフォン11、音声認識開始ボタン12、およびセンサ14を制御し、入力インターフェイス65を介して、マイクロフォン11、音声認識開始ボタン12、またはセンサ14から信号を取得する。出力インターフェイス66は、CPU61から取得したデータを、表示装置13へ送る。CPU61は、出力インターフェイス66を介して、表示装置13を制御し、生成したデータを、出力インターフェイス66を介して表示装置13へ出力する。
【0046】
メディアインターフェイス67は、記録媒体68に格納されたプログラムまたはデータを読み取り、RAM62に提供する。RAM62を介してCPU61に提供されるプログラムは、記録媒体68に格納されている。当該プログラムは、記録媒体68から読み出されて、RAM62を介してコンピュータ60にインストールされ、CPU61によって実行される。記録媒体68は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0047】
コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、音源位置特定部21、開始指示受付部22、音声認識部23、コマンド処理部24、および許可コマンド格納部25として機能させる。コンピュータ60は、これらのプログラムを、記録媒体68から読み取って実行するが、他の例として、コンピュータ60に通信機能を設け、通信回線を介してこれらのプログラムを取得するようにしてもよい。
【0048】
また、本発明は、上記した各実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【0049】
例えば、上記した第二の実施形態において、車載システム10は、複数の座席のそれぞれに対応する複数の表示装置13を備えるが、他の形態として、車載システム10は、複数の座席のそれぞれの対応する画面を表示する1台の表示装置13を備えていてもよい。この場合、コマンド処理部24は、操作コマンドに対応する処理の実行結果を、当該操作コマンドに対応する音声信号の発生位置が含まれる座席領域250用の画面に反映させる。
【0050】
複数の座席のそれぞれの対応する画面を表示する表示装置13としては、例えば、パネルの前面にスリットを設け、運転席側用の画像と助手席側用の画像とを水平方向に交互に並べ、上記スリットでバックライトの光を左右に分離することにより運転席側と助手席側とで異なる画像を表示することができる液晶ディスプレイであるデュアルディスプレイが好ましい。
【図面の簡単な説明】
【0051】
【図1】本発明の第一実施形態に係る車載システム10の構成を示すシステム構成図である。
【図2】音源位置特定部21から出力されるデータ40の構造の一例を示す図である。
【図3】第一の実施形態において許可コマンド格納部25に格納されるデータの構造の一例を示す図である。
【図4】座席領域を説明するための概念図である。
【図5】表示装置13に表示される画面の一例を示す概念図である。
【図6】表示装置13に表示される画面の他の例を示す概念図である。
【図7】車載装置20の動作の一例を示すフローチャートである。
【図8】本発明の第二実施形態に係る車載システム10の構成を示すシステム構成図である。
【図9】第二実施形態における表示装置13の配置を説明するための概念図である。
【図10】第二の実施形態において許可コマンド格納部25に格納されるデータの構造の一例を示す図である。
【図11】車載装置20の機能を実現するコンピュータ50の構成の一例を示すハードウェア構成図である。
【符号の説明】
【0052】
10・・・車載システム、11・・・マイクロフォン、12・・・音声認識開始ボタン、13・・・表示装置、14・・・センサ、15・・・ハンドル、20・・・車載装置、21・・・音源位置特定部、22・・・開始指示受付部、23・・・音声認識部、24・・・コマンド処理部、25・・・許可コマンド格納部、30・・・領域、31・・・領域、32・・・領域、40・・・データ、41・・・音源位置、42・・・音声信号、50・・・アイコン、51・・・領域、52・・・領域、53・・・領域、55・・・領域、56・・・領域、57・・・領域、60・・・コンピュータ、61・・・CPU、62・・・RAM、63・・・ROM、64・・・HDD、65・・・入力インターフェイス、66・・・出力インターフェイス、67・・・メディアインターフェイス、68・・・記録媒体
【特許請求の範囲】
【請求項1】
車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置であって、
車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを格納する許可コマンド格納手段と、
操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付手段と、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定手段と、
前記音源位置特定手段から出力された音声信号から操作コマンドを認識する音声認識手段と、
前記音源位置特定手段から出力された音声信号に対応する音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、前記音声認識手段によって認識された操作コマンドに対応する処理を実行するコマンド処理手段と
を備えることを特徴とする車載装置。
【請求項2】
請求項1に記載の車載装置であって、
前記許可コマンド格納手段には、
車両内の座席の領域を示す情報として、運転席の領域を示す情報が含まれており、当該運転席の領域を示す情報には、車両が走行中に許可される操作コマンドと、車両が停止中に許可される操作コマンドとが対応付けられており、
前記コマンド処理手段は、
前記音源位置特定手段から出力された音声信号に対応する音声の発生位置が運転席の領域に含まれる場合に、車両が走行中であるならば、車両が走行中に許可される操作コマンドを前記許可コマンド格納手段から抽出し、車両が停止中であるならば、車両が停止中に許可される操作コマンドを前記許可コマンド格納手段から抽出することを特徴とする車載装置。
【請求項3】
請求項1または2に記載の車載装置であって、
前記コマンド処理手段は、
処理が実行される操作コマンドに対応する音声の発生位置を示す情報を表示装置に表示することを特徴とする車載装置。
【請求項4】
請求項1から3のいずれか一項に記載の車載装置であって、
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号に対応する音声の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、運転席の領域から発生した音声による操作コマンドを優先して処理することを特徴とする車載装置。
【請求項5】
請求項1から3のいずれか一項に記載の車載装置であって、
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号に対応する音声の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、それぞれの操作コマンドについて、当該操作コマンドの元となる音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、当該発生位置から発生した音声による操作コマンドであって前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、当該操作コマンドに対応する処理結果を、座席毎に設けられた表示装置の中で、当該操作コマンドに対応する音声の発生位置が含まれる座席の領域に対応する表示装置に表示することを特徴とする車載装置。
【請求項6】
請求項1から3のいずれか一項に記載の車載装置であって、
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、それぞれの操作コマンドについて、当該操作コマンドの元となる音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、当該発生位置から発生した音声による操作コマンドであって前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、当該操作コマンドに対応する処理結果を、座席毎に異なる表示が可能な表示装置において、当該操作コマンドに対応する音声の発生位置が含まれる座席の領域に対応する表示に反映させることを特徴とする車載装置。
【請求項7】
車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置における音声認識方法であって、
前記車載装置は、
車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを許可コマンド格納手段に格納する許可コマンド格納ステップと、
操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付ステップと、
前記音声認識開始受付ステップにおいて操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定ステップと、
前記音源位置特定ステップにおいて出力した音声信号から操作コマンドを認識する音声認識ステップと、
前記音源位置特定ステップにおいて出力した音声信号に対応する音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、前記音声認識ステップにおいて認識した操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、前記音声認識ステップにおいて認識した操作コマンドに対応する処理を実行するコマンド処理ステップと
を実行することを特徴とする音声認識方法。
【請求項1】
車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置であって、
車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを格納する許可コマンド格納手段と、
操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付手段と、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定手段と、
前記音源位置特定手段から出力された音声信号から操作コマンドを認識する音声認識手段と、
前記音源位置特定手段から出力された音声信号に対応する音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、前記音声認識手段によって認識された操作コマンドに対応する処理を実行するコマンド処理手段と
を備えることを特徴とする車載装置。
【請求項2】
請求項1に記載の車載装置であって、
前記許可コマンド格納手段には、
車両内の座席の領域を示す情報として、運転席の領域を示す情報が含まれており、当該運転席の領域を示す情報には、車両が走行中に許可される操作コマンドと、車両が停止中に許可される操作コマンドとが対応付けられており、
前記コマンド処理手段は、
前記音源位置特定手段から出力された音声信号に対応する音声の発生位置が運転席の領域に含まれる場合に、車両が走行中であるならば、車両が走行中に許可される操作コマンドを前記許可コマンド格納手段から抽出し、車両が停止中であるならば、車両が停止中に許可される操作コマンドを前記許可コマンド格納手段から抽出することを特徴とする車載装置。
【請求項3】
請求項1または2に記載の車載装置であって、
前記コマンド処理手段は、
処理が実行される操作コマンドに対応する音声の発生位置を示す情報を表示装置に表示することを特徴とする車載装置。
【請求項4】
請求項1から3のいずれか一項に記載の車載装置であって、
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号に対応する音声の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、運転席の領域から発生した音声による操作コマンドを優先して処理することを特徴とする車載装置。
【請求項5】
請求項1から3のいずれか一項に記載の車載装置であって、
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号に対応する音声の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、それぞれの操作コマンドについて、当該操作コマンドの元となる音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、当該発生位置から発生した音声による操作コマンドであって前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、当該操作コマンドに対応する処理結果を、座席毎に設けられた表示装置の中で、当該操作コマンドに対応する音声の発生位置が含まれる座席の領域に対応する表示装置に表示することを特徴とする車載装置。
【請求項6】
請求項1から3のいずれか一項に記載の車載装置であって、
前記音源位置特定手段は、
前記音声認識開始受付手段が操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された複数の音声信号を含む混合信号から、それぞれの音声信号に対応する音声の発生位置毎に、当該位置から発生する音声の音声信号を分離し、分離した音声信号を、当該音声信号の発生位置を示す情報と共に出力し、
前記音声認識手段は、
前記音源位置特定手段から複数の音声信号が出力された場合に、それぞれの音声信号について操作コマンドを認識し、認識した操作コマンドを、当該操作コマンドの元となった音声の発生位置を示す情報と共に出力し、
前記コマンド処理手段は、
前記音声認識手段によって複数の操作コマンドが認識された場合に、それぞれの操作コマンドについて、当該操作コマンドの元となる音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、当該発生位置から発生した音声による操作コマンドであって前記音声認識手段によって認識された操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、当該操作コマンドに対応する処理結果を、座席毎に異なる表示が可能な表示装置において、当該操作コマンドに対応する音声の発生位置が含まれる座席の領域に対応する表示に反映させることを特徴とする車載装置。
【請求項7】
車両に搭載され、音声により入力された操作コマンドに応じて処理を実行する車載装置における音声認識方法であって、
前記車載装置は、
車両内の座席の領域を示す情報に対応付けて、当該座席に座った人に対して許可する操作コマンドを許可コマンド格納手段に格納する許可コマンド格納ステップと、
操作コマンドの入力開始の指示をユーザから受け付ける音声認識開始受付ステップと、
前記音声認識開始受付ステップにおいて操作コマンドの入力開始の指示をユーザから受け付けた後に、複数のマイクロフォンのそれぞれを介して収集された音声信号から当該音声信号に対応する音声の発生位置を特定し、特定した発生位置を、当該発生位置から発生した音声に対応する音声信号と共に出力する音源位置特定ステップと、
前記音源位置特定ステップにおいて出力した音声信号から操作コマンドを認識する音声認識ステップと、
前記音源位置特定ステップにおいて出力した音声信号に対応する音声の発生位置において許可されている操作コマンドを前記許可コマンド格納手段から抽出し、前記音声認識ステップにおいて認識した操作コマンドが、当該抽出した操作コマンドのいずれかと同一である場合に、前記音声認識ステップにおいて認識した操作コマンドに対応する処理を実行するコマンド処理ステップと
を実行することを特徴とする音声認識方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2009−25715(P2009−25715A)
【公開日】平成21年2月5日(2009.2.5)
【国際特許分類】
【出願番号】特願2007−190866(P2007−190866)
【出願日】平成19年7月23日(2007.7.23)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
【公開日】平成21年2月5日(2009.2.5)
【国際特許分類】
【出願日】平成19年7月23日(2007.7.23)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
[ Back to top ]