音声認識装置、音声認識方法、及び音声認識プログラム
【課題】階層化された音声認識コマンドの操作性を向上させることができる、音声認識装置、音声認識方法、及び音声認識プログラムを提供すること。
【解決手段】ナビゲーション装置1は、ユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部2cと、階層構造により階層化された音声認識コマンドの中から、音声認識コマンド特定部2cにより特定された音声認識コマンドに対応する所定の制御を実行する音声認識制御部2aとを備える。音声認識制御部2aは、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、ディスプレイ6に同時に表示させる。
【解決手段】ナビゲーション装置1は、ユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部2cと、階層構造により階層化された音声認識コマンドの中から、音声認識コマンド特定部2cにより特定された音声認識コマンドに対応する所定の制御を実行する音声認識制御部2aとを備える。音声認識制御部2aは、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、ディスプレイ6に同時に表示させる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識装置、音声認識方法、及び音声認識プログラムに関する。
【背景技術】
【0002】
従来、カーナビゲーションシステム等において、ユーザの音声を認識することで、様々な音声認識コマンドの入力を受け付けることができる音声認識装置が用いられている。
【0003】
このような音声認識コマンドは、一般的に、階層構造(ツリー構造)により階層化されている。そして、最初に、最上位階層に位置付けられた複数の音声認識コマンドのみをディスプレイに表示し、これら複数の音声認識コマンドのいずれかの入力を受け付けた場合には、当該入力を受け付けた音声認識コマンドに対して1段階だけ下位階層に位置付けられた複数の音声認識コマンドのみをディスプレイに表示する。以降、音声認識コマンドの表示と受け付けとを同様に繰り返すことで階層を1段階ずつ下り、最終的に最下位階層に位置付けられた一つの音声認識コマンドを特定する。このような処理を行うことで、1度にディスプレイに表示する音声認識コマンドの数を限定でき、音声認識装置による音声認識率を向上させることが可能になる。
【0004】
しかしながら、カーナビゲーションシステム等が多機能化するに伴って音声認識コマンドの全体数が増えた場合、音声認識コマンドの階層も深くなり、最終的に一つの音声認識コマンドを特定するまでにユーザが入力しなければならない音声認識コマンドの数が増えるため、操作に手間がかかるという問題が生じていた。特に、カーナビゲーションシステム等のように車両に設置される機器の場合には、安全性の面から、車両の走行中には操作項目が制限される場合があった。このため、複数階層の途中まで操作した時点で走行を開始した場合には、それ以上の操作を行うことが制限されてしまい、最終的に一つの音声認識コマンドを特定することができず、操作が無駄になってしまう場合があった。
【0005】
このような点に鑑みて、音声認識を用いた入力装置の操作性を改善する提案も行われている。例えば、移動体入力装置において、移動体が走行状態である場合には、入力部が受け付ける入力が手操作及び音声でそれぞれ実行可能な項目か否かを判定し、手操作及び音声による項目操作の実行可否が区別可能な表示態様を表示部にて表示することが提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2007/069573号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述の如き従来の装置では、走行状態において実行可能な操作項目を把握することができるものの、音声認識コマンドが深い階層で階層化されていることに起因する問題を本質的に解決することはできなかった。すなわち、上述の従来の装置では、以前として、音声認識コマンドの階層を1段階ずつ下ることによって、最下位階層に位置付けられた一つの音声認識コマンドを特定しなければ、所要の機能を実行することができず、操作に手間がかかるものであった。
【0008】
本発明は、上記に鑑みてなされたものであって、階層化された音声認識コマンドの操作性を向上させることができる、音声認識装置、音声認識方法、及び音声認識プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するために、請求項1に記載の音声認識装置は、ユーザの発話音声を検出する音声検出手段と、前記音声検出手段にて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定手段により特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御手段と、を備え、前記音声認識制御手段は、前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、前記表示手段に同時に表示させる。
【0010】
請求項2に記載の音声認識装置は、請求項1に記載の音声認識装置において、前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する。
【0011】
請求項3に記載の音声認識装置は、請求項2に記載の音声認識装置において、前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する。
【0012】
請求項4に記載の音声認識装置は、請求項1から3のいずれか一項に記載の音声認識装置において、前記音声認識制御手段は、前記階層構造の末端に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する。
【0013】
請求項5に記載の音声認識方法は、ユーザの発話音声を検出する音声検出ステップと、前記音声検出ステップにおいて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定ステップにおいて特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御ステップと、を含み、前記音声認識制御ステップにおいては、前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、前記表示手段に同時に表示させる。
【0014】
請求項6に記載の音声認識プログラムは、請求項5に記載の音声認識方法をコンピュータに実行させる。
【発明の効果】
【0015】
請求項1に記載の音声認識装置、請求項5に記載の音声認識方法、及び請求項6に記載の音声認識プログラムによれば、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された第2音声認識コマンドとを、表示手段に同時に表示させるので、従来と同様に階層を経て音声認識コマンドを使用できることに加えて、現在使用する可能性が高い音声認識コマンドを直接的に使用でき、階層化された音声認識コマンドの操作性を向上させることができる。
【0016】
また、請求項2に記載の音声認識装置によれば、第1音声認識コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から第2音声認識コマンドを選択するので、第1音声認識コマンドと第2音声認識コマンドとが重複することを回避でき、第1音声認識コマンドと第2音声認識コマンドを同時に表示する際の利便性を高めることができる。
【0017】
また、請求項3に記載の音声認識装置によれば、第1音声認識コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から第2音声認識コマンドを選択するので、ユーザにより選択された第1音声認識コマンドに関連する第2音声認識コマンドを表示することができ、第1音声認識コマンドと第2音声認識コマンドを同時に表示する際の利便性を高めることができる。
【0018】
また、請求項4に記載の音声認識装置によれば、階層構造の末端に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択するので、ユーザが第2音声認識コマンドを選択することで即時に所要機能を実行することが可能となり、音声認識コマンドの操作性を一層向上させることができる。
【図面の簡単な説明】
【0019】
【図1】本発明の実施の形態に係るナビゲーション装置を例示するブロック図である。
【図2】音声認識コマンドテーブルを例示した表である。
【図3】使用状況履歴情報DBに格納されている使用状況履歴情報を例示した表である。
【図4】音声認識制御処理のフローチャートである。
【図5】適応マッチング処理のフローチャートである。
【図6】地図重畳表示処理のフローチャートである。
【図7】重畳表示コマンドを重畳表示した地図の表示例である。
【図8】音声認識コマンド実行処理のフローチャートである。
【図9】同一画面表示処理のフローチャートである。
【図10】図9に続く、同一画面表示処理のフローチャートである。
【図11】標準コマンドと同一画面表示コマンドの表示例である。
【図12】音声認識コマンドの階層構造を例示した図である。
【発明を実施するための形態】
【0020】
以下、本発明に係る音声認識装置、音声認識方法、及び音声認識プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、この実施の形態によって本発明が限定されるものではない。
【0021】
(基本的概念)
音声認識装置は、単独の装置として、あるいは、他の装置やシステムの一部として、構成することができる。以下では、音声認識装置を、車両に搭載されたナビゲーション装置の一部として構成した例について説明する。
【0022】
「音声認識コマンド」とは、音声認識装置に接続されたナビゲーション装置やエアコン等の各種接続機器に対する操作指示であって、発話音声により特定可能な操作指示である。
この音声認識コマンドは、例えば、従来と同様に、階層構造(ツリー構造)により階層化されている(階層構造に関連付けられている)。この階層構造における各階層のうち、最も上位の階層を「最上位階層」、最も下位の階層を「最下位階層」、これら最上位階層と最下位階層の間の階層を「中位階層」と称する。また、最上位階層に位置付けられた音声認識コマンドを「最上位階層コマンド」、最下位階層に位置付けられた音声認識コマンドを「最下位階層コマンド」、中位階層に位置付けられた音声認識コマンドを「中位階層コマンド」と称する。
【0023】
このように階層化された複数の音声認識コマンドの一部を選択してディスプレイに表示する。このようにディスプレイに表示すべき音声認識コマンドを選択する際の選択方法として、本実施の形態では、従来と同様に階層構造に基づいて選択する方法と、ユーザ(主として車両の運転者であるが、同乗者であってもよい)が使用する可能性が高いか否かを判断する所定の条件に基づいて選択する方法との2通りの方法を使用する。以下、前者の方法による選択を「標準選択」と称し、後者の方法による選択を「適応選択」と称する。また、標準選択により選択された音声認識コマンドを「標準コマンド(第1音声認識コマンド)」、適応選択により選択された音声認識コマンドを「適応コマンド(第2音声認識コマンド)」と称する。
【0024】
適応コマンドをディスプレイに表示する方法として、本実施の形態では、ディスプレイに地図が表示されている場合に当該地図に重畳して適応コマンドを表示させる方法と、ディスプレイに標準コマンドを表示すべき場合に当該標準コマンドと同時に適応コマンドを表示させる方法との2通りの方法を使用する。同時に表示させるとは、ディスプレイにおける同一画面上に、これら標準コマンドと適応コマンドを表示させることを意味する。以下、前者の方法によって表示される適応コマンドを「重畳表示コマンド」、後者の方法によって表示される適応コマンドを「同一画面表示コマンド」と称する。
【0025】
(構成−ナビゲーション装置)
最初に、本実施の形態に係る音声認識装置をその一部とするナビゲーション装置の構成について説明する。図1は、本実施の形態に係るナビゲーション装置1を例示するブロック図である。このナビゲーション装置1は、図1に示すように、制御部2及びデータ記録部3を備えている。また、ナビゲーション装置1には、マイク4、タッチパネル5、ディスプレイ6、スピーカ7、及び現在位置検出処理部8が接続されている。
【0026】
(構成−ナビゲーション装置−制御部)
制御部2は、ナビゲーション装置1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態に係る音声認識プログラムは、任意の記録媒体又はネットワークを介してナビゲーション装置1にインストールされることで、制御部2の各部を実質的に構成する。
【0027】
この制御部2は、機能概念的に、音声認識制御部2a、音声検出部2b、及び音声認識コマンド特定部2cを備える。音声認識制御部2aは、階層構造により階層化された音声認識コマンドの中から、音声認識コマンド特定部2cにより特定された音声認識コマンドに対応する所定の制御を実行すると共に、音声認識コマンドを選択してディスプレイ6に表示させる音声認識制御手段である。音声検出部2bは、ユーザの発話音声を検出する音声検出手段である。音声認識コマンド特定部2cは、音声検出部2bにて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段である。これらの各部によって実行される処理の詳細については後述する。
【0028】
(構成−ナビゲーション装置−データ記録部)
データ記録部3は、ナビゲーション装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記憶装置としてのハードディスク(図示省略)の如き磁気的記録媒体を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリの如き半導体型記憶媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。
【0029】
このデータ記録部3は、地図情報データベース(以下、データベースを「DB」と称する)3a、音声認識コマンドテーブル3b、及び使用状況履歴情報DB3cを備えている。
【0030】
地図情報DB3aは、地図情報を格納する地図情報格納手段である。「地図情報」は、例えばリンクデータ(リンク番号、接続ノード番号、道路座標、道路種別、車線数、法定速度、走行規制等)、ノードデータ(ノード番号、座標)、地物データ(信号機、道路標識、ガードレール、建物等)、施設データ(各施設の位置、各施設の種別等)、地形データ、地図をディスプレイ6に表示するための地図表示データ等を含んで構成されている。
【0031】
音声認識コマンドテーブル3bは、音声認識コマンドを適応選択で選択するために必要な情報(適応選択用情報)を格納するテーブルである。この音声認識コマンドテーブル3bは、図2に例示するように、項目「音声認識コマンド」、項目「機能分類」、項目「選択基準分類」、項目「ユーザID」、項目「優先度」、及び項目「表示アルゴリズム」を含んでおり、これら各項目に対応する情報を相互に対応付けて構成されている。項目「音声認識コマンド」に対応する情報は、音声認識コマンドを特定するコマンド情報である。ただし、ここでは、音声認識コマンドの中で、最下位階層コマンド(図2では、例えば「規制情報」等)のみを含めている。項目「機能分類」に対応する情報は、音声認識コマンドを機能面から分類した場合の分類情報である(図2では、例えば「情報表示」等)。項目「選択基準分類」に対応する情報は、音声認識コマンドを適応選択する場合における選択基準面から分類した場合の分類情報である。この情報としては、「状況適応型」、「環境適応型」、及び「ユーザ適応型」の3つがある。「状況適応型」とは、短期的な状況(例えば、交通状況)に応じて選択される音声認識コマンドが属する分類である。「環境適応型」とは、中長期的な状況(例えば、高速道路走行中)に応じて選択される音声認識コマンドが属する分類である。「ユーザ適応型」とは、ユーザの属性、行動傾向、あるいは行動履歴等に基づいて選択される音声認識コマンドが属する分類である。項目「ユーザID」に対応する情報は、車両のユーザを一意に識別するためのユーザ識別情報である(図3では、例えば「UID0001」等)。項目「優先度」に対応する情報は、複数の適応コマンドをディスプレイ6に表示させる場合において、当該複数の適応コマンドの相互間の優先順位を決定するための優先順位決定条件である。図2の例では、優先度を「1」〜「5」までの数値で示しており、数値が小さい程、優先度が高いことを示している。特に、選択基準分類=ユーザ適応型である適応コマンドの優先度は、ユーザID毎に格納されている。項目「表示アルゴリズム」に対応する情報は、ユーザが使用する可能性が高いか否かを判断する所定の条件(選択条件)である。例えば、図2の一番上のレコードの例は、「高速道路走行中、かつ走行経路上の交通規制情報が受信された場合」という選択条件に合致する場合に、項目「音声認識コマンド」=「規制情報」を適応コマンドとして選択することを示している。このような音声認識コマンドテーブル3bは、任意の基準で決定されナビゲーション装置1の製造時にデータ記録部3に記録される。ただし、選択基準分類=ユーザ適応型の音声認識コマンドに対応する優先度は、後述する音声認識コマンド実行処理において必要に応じて更新される。
【0032】
使用状況履歴情報DB3cは、音声認識コマンドのユーザによる使用状況の履歴に関する情報(以下、使用状況履歴情報)を格納する使用状況履歴情報格納手段である。この使用状況履歴情報は、図3に例示するように、項目「ユーザID」、項目「音声認識コマンド」、項目「出発地」、項目「目的地」、項目「現在位置」、項目「案内開始日時」、項目「現在日時」、項目「走行道路種別」、項目「車速」、及び項目「ガソリン残量」を含んでおり、これら各項目に対応する情報を相互に対応付けて構成されている。項目「ユーザID」に対応する情報は、車両のユーザを一意に識別するためのユーザ識別情報である(図3では、例えば「UID0001」等)。項目「音声認識コマンド」に対応する情報は、図2の音声認識コマンドテーブル3bにおける同一名称の情報と同じである。項目「出発地」に対応する情報は、ナビゲーション装置1に設定されている車両の出発地を特定するための情報である(図3では、座標であり、例えば「35度35分21秒、139度38分18秒」等)。項目「目的地」に対応する情報は、ナビゲーション装置1に設定されている車両の目的地を特定するための情報である(図3では、座標であり、例えば「35度40分12秒、139度12分10秒」等)。項目「現在位置」に対応する情報は、使用状況履歴情報が取得された際の車両の位置を特定するための情報である(図3では、座標であり、例えば「35度37分12秒、139度20分01秒」等)。項目「案内開始日時」に対応する情報は、ナビゲーション装置1によって走行経路の案内を開始した日時を特定するための情報である(図3では、日付(西暦表示)と時刻(24時間表示)を併記したものであり、例えば「2011/08/01 13:55」等)。項目「現在日時」に対応する情報は、使用状況履歴情報が取得された際の日時を特定するための情報である(図3では、日付(西暦表示)と時刻(24時間表示)を併記したものであり、例えば「2011/08/01 14:43」等)。項目「走行道路種別」に対応する情報は、使用状況履歴情報が取得された際に車両が走行している道路の種別を特定するための情報である(図3では、例えば「高速道路」等)。項目「車速」に対応する情報は、使用状況履歴情報が取得された際の車両の車速を特定するための情報である(図3では、例えば「100Km/h」等)。項目「ガソリン残量」に対応する情報は、使用状況履歴情報が取得された際の車両のガソリンの残量を特定するための情報である(図3では、例えば「34L」等)。このような使用状況履歴情報DB3cの使用状況履歴情報は、後述する音声認識コマンド実行処理において更新されデータ記録部3に記録される。
【0033】
(構成−マイク)
図1に戻り、マイク4は、音声を電気信号に変換してナビゲーション装置1に出力する。このマイク4としては、公知のマイクを用いることができる。
【0034】
(構成−タッチパネル)
タッチパネル5は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル5は、透明又は半透明状に形成され、ディスプレイ6の前面において当該ディスプレイ6の表示面と重畳するように設けられている。このタッチパネル5としては、例えば抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
【0035】
(構成−ディスプレイ)
ディスプレイ6は、ナビゲーション装置1の制御に基づいて情報を表示にて出力する表示手段である。特に、ディスプレイ6は、階層構造により階層化された所定の複数の音声認識コマンドの中から、音声認識制御部2aによって選択された音声認識コマンドを表示する表示手段である。なお、このディスプレイ6の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
【0036】
(構成−スピーカ)
スピーカ7は、ナビゲーション装置1の制御に基づいて情報を音声にて出力する音声出力手段である。特に、スピーカ7は、音声認識コマンドをディスプレイ6に表示させた場合に、当該表示させた音声認識コマンドをユーザに認識させるための音声出力を出力する音声出力手段である。このスピーカ7から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。
【0037】
(構成−現在位置検出処理部)
現在位置検出処理部8は、ナビゲーション装置1が搭載された車両の現在位置を検出する現在位置検出手段である。具体的には、現在位置検出処理部8は、GPS、地磁気センサ、距離センサ、又はジャイロセンサ(いずれも図示省略)の少なくとも一つを有し、現在の車両の位置(座標)及び方位等を公知の方法にて検出する。
【0038】
(処理−音声認識制御処理)
次に、このように構成されたナビゲーション装置1によって実行される音声認識制御処理について説明する。図4は音声認識制御処理のフローチャートである(以下の各処理の説明ではステップを「S」と略記する)。この音声認識制御処理は、例えば、ナビゲーション装置1に電源が投入された後に起動される。
【0039】
図4に示すように、音声認識制御処理が開始されると、音声認識制御部2aは、ユーザIDを取得する(SA1)。例えば、ユーザに自己のユーザIDの入力を促すメッセージを、ディスプレイ6に表示させたりスピーカ7から音声出力させたりし、ユーザが自己のユーザIDをタッチパネル5を介して入力した場合には、当該入力されたユーザIDを取得する。この他にも、公知の様々な方法でユーザIDを取得することができ、例えば、車両の内部に取り付けたカメラでユーザの顔部を撮影し、この撮影した画像に基づいてユーザを画像認識することでユーザを識別し、当該識別したユーザに対応するユーザIDを、予めデータ記録部3にユーザ画像と対応付けて記録されたユーザIDの中から取得する。
【0040】
(処理−音声認識制御処理−適応マッチング処理)
次に、音声認識制御部2aは、適応マッチング処理を起動する(SA2)。図5は適応マッチング処理のフローチャートである。この処理において、音声認識制御部2aは、各種情報を取得する(SB1)。この各種情報としては、図2の音声認識コマンドテーブル3bの表示アルゴリズムの充足性を判定するために必要な情報を取得する。例えば、音声認識制御部2aは、出発地、目的地、現在位置、案内開始日時、現在日時、走行道路種別、車速、ガソリン残量を取得する。このうち、出発地、目的地、現在位置、案内開始日時、現在日時、及び走行道路種別は、ユーザによってナビゲーション装置1に設定された情報から取得したり、ナビゲーション装置1によって設定された走行経路から取得したり、地図情報DB3aから取得することができる。車速は、車両に搭載された図示しない車速センサから取得することができ、ガソリン残量は、車両に搭載された図示しない燃焼タンクセンサから取得することができる。また、音声認識制御部2aは、走行経路上の交通規制情報や渋滞情報を、図示しない通信部を介して交通センターやビーコン等から受信する。また、現在の一時的な情報のみでなく、一定の時間経過を伴う情報を取得することもでき、例えば、X分間の平均速度は、上記取得した車速をX分間だけ所定間隔で取得し続け、その平均値を算定することで取得することができる。
【0041】
また、音声認識制御部2aは、使用状況履歴情報を取得する(SB2)。具体的には、音声認識制御部2aは、使用状況履歴情報DB3cに格納された使用状況履歴情報の中から、図4のSA1で取得したユーザIDに対応する使用状況履歴情報を取得する。
【0042】
そして、音声認識制御部2aは、適応コマンドを選択する(SB3)。具体的には、音声認識制御部2aは、図2の音声認識コマンドテーブル3bにおける選択基準分類=環境適応型又は状況適応型である音声認識コマンドの中から、SB1で取得した各種情報によって充足される表示アルゴリズムに対応する音声認識コマンドを特定し、当該特定した音声認識コマンドを適応コマンドとして選択する。例えば、SB1で取得した各種情報として、走行道路種別=高速道路が取得され、かつ、走行経路上の交通規制情報が受信された場合には、音声認識コマンド=規制情報に対応する表示アルゴリズム「高速道路走行中、かつ走行経路上の交通規制情報が受信された場合」が充足されるので、音声認識コマンド=規制情報を適応コマンドの候補とする。また、音声認識制御部2aは、選択基準分類=ユーザ適応型である音声認識コマンドの中から、SB2で取得した使用状況履歴情報に合致する表示アルゴリズムに対応する音声認識コマンドを特定し、当該特定した音声認識コマンドを適応コマンドとして選択する。例えば、SB2で取得した使用状況履歴情報に基づき、現在のユーザが、案内開始直後に一般道路案内をよく設定するユーザである場合(一例として、当該ユーザのユーザIDに対応するレコードとして、案内開始日時から現在日時までの経過時間が所定時間以内であって、音声認識コマンドが一般道優先案内であるレコードが、所定数以上含まれている場合)には、音声認識コマンド=一般道優先案内を、適応コマンドの候補とする。
【0043】
このSB3において、音声認識制御部2aは、適応コマンドを所定数(例えば、3つ)だけ選択する。例えば、選択した適応コマンドが所定数に満たない場合には、音声認識コマンドテーブル3bの中から、未だ選択されていない適応コマンドの中から、音声認識コマンドテーブルに格納された優先度が最も高い適応コマンドを選択してもよい。逆に、選択した適応コマンドが所定数を超えている場合には、当該選択した適応コマンドの中から、音声認識コマンドテーブルに格納された優先度が高い順に所定数の適応コマンドを選択してもよく、あるいは所定数の適応コマンドをランダムに選択してもよい。また、所定数の適応コマンドは、機能分類毎に同じ数の適応コマンドを選択してもよい(例えば、所定数=4である場合に、機能分類=情報表示である音声認識コマンド、機能分類=地図表示切替である音声認識コマンド、機能分類=操作である音声認識コマンド、機能分類=案内である音声認識コマンドを、それぞれ1つずつ選択する等)。若しくは、所定数の適応コマンドは、選択基準分類毎に同じ数の適応コマンドを選択してもよい(例えば、所定数=3である場合に、選択基準分類=環境適応型である音声認識コマンド、選択基準分類=状況適応型である音声認識コマンド、選択基準分類=個人適応型である音声認識コマンドを、それぞれ1つずつ選択する等)。
【0044】
次いで、音声認識制御部2aは、SB3で選択した適応コマンドの相互間の優先順位を、所定の優先順位決定条件に基づいて決定する(SB4)。この優先順位とは、適応コマンドをディスプレイ6に表示する際の優先順位であると共に、適応コマンドを音声出力する際の優先順位である。また、優先順位決定条件としては、音声認識コマンドテーブル3bの優先度を適用する。具体的には、音声認識制御部2aは、SB3で選択した適応コマンドの優先度を音声認識コマンドテーブル3bから取得し、当該取得した優先度が高い順に適応コマンドをソートする。例えば、SB3において、適応コマンドとして、規制情報(優先度=1)、市街図表示(優先度=3)、渋滞情報(優先度=2)を選択した場合には、これらをソートして、規制情報、渋滞情報、市街図表示の順に並び替える。この際、選択基準分類=ユーザ適応型である適応コマンドの優先度は、図4のSA1で取得したユーザIDに対応する優先度を使用する。
【0045】
次に、音声認識制御部2aは、SB4でソートした適応コマンドの更新が有るか否かを判定する(SB5)。すなわち、データ記録部3には、その時点でディスプレイ6に表示されている(あるいは、その時点で表示されていない場合には、過去直近に表示されていた)適応コマンドと、この適応コマンドのソート結果とが、記録されている。そして、音声認識制御部2aは、SB4でソートした適応コマンド及びそのソート結果が、データ記録部3に記録されている適応コマンド及びそのソート結果から一部でも変更されているか否か判定する。そして、変更されていない場合には、適応コマンドの更新がないものとして(SB5、No)、適応マッチング処理を終了する。一方、変更されている場合には、適応コマンドの更新が有るものとして(SB5、Yes)、適応コマンドが更新された旨の更新有りフラグをONとしてデータ記録部3に記録し(SB6)、適応マッチング処理を終了する。
【0046】
(処理−音声認識制御処理)
次に、図4の音声認識制御処理に戻り、音声認識制御部2aは、ディスプレイ6に地図を表示中であるか否かを判定する(SA3)。そして、表示中である場合(SA3、Yes)、音声認識制御部2aは、地図に重畳表示コマンドを重畳表示するための地図重畳表示処理を起動する(SA4)。一方、表示中でない場合(SA3、No)、音声認識制御部2aは、音声識別コマンドを選択するためのメニュー(以下、音声識別メニュー)をディスプレイ6に表示中であるか否を判定し(SA5)、表示中である場合には(SA5、Yes)、同一画面表示コマンドを表示するための同一画面表示処理を起動し(SA6)、表示中でない場合には(SA5、No)、これら地図重畳表示処理や同一画面表示処理を起動することなく、SA7に移行する。
【0047】
(処理−音声認識制御処理−地図重畳表示処理)
まず、地図重畳表示処理(SA4)について説明する。図6は、地図重畳表示処理のフローチャートである。この処理において、音声認識制御部2aは、ディスプレイ6に表示されている地図に、重畳表示コマンドを重畳表示する(SC1)。すなわち、音声認識制御部2aは、図5の適応マッチング処理のSB3で選択されSB4でソートされた適応コマンドを、重畳表示コマンドとして表示する。この重畳表示コマンドは、階層構造において最下位階層に位置付けられている音声認識コマンド(最下位階層コマンド)であることから、ユーザが直に操作内容を特定することができる音声認識コマンドを表示でき、音声認識による操作内容の指示をショートカットして迅速に行うことが可能になる。
【0048】
このように重畳表示コマンドを重畳表示する際の表示領域は、ユーザにとって重要であると考えられる表示領域を除外した表示領域であることが好ましい。ユーザにとって重要であると考えられる表示領域としては、例えば、車両の現在位置が表示されている領域、走行経路が設定されている場合には出発地、目的地、走行経路が表示されている領域、交差点や案内標識の拡大表示領域、あるいは高速略図等の略図表示領域を挙げることができる。図7には、重畳表示コマンドを重畳表示した地図の表示例を示す。この表示例では、地図10に高速略図11が重畳表示されている場合を示しており、この地図10の表示領域のうち、高速略図11の表示領域を除外した表示領域に、複数の重畳表示コマンド12により構成された重畳表示コマンドメニュー13が重畳表示されている。このように縦並びで重畳表示コマンド12を表示する場合、上から下に至る順に、優先度が低くなるように表示することが好ましい。あるいは、重畳表示コマンド12を横並びで重畳表示してもよく、この場合、左から右に至る順に、優先度が低くなるように表示することが好ましい。また、縦並びと横並びのいずれの場合においても、重畳表示コマンド12を、表示領域の外枠に近傍において、当該外枠に沿って表示することが好ましい。
【0049】
次に、図6において、音声認識制御部2aは、データ記録部3の更新有りフラグがONになっているか否かを判定する(SC2)。そして、更新有りフラグがONになっている場合(SC2、Yes)、音声認識制御部2aは、データ記録部3の更新有りフラグをOFFにすると共に(SC3)、SC1で地図に重畳表示した重畳表示コマンドを優先度順に音声出力する(SC4)。具体的には、重畳表示コマンドを、その優先度が高い順(図5の適応マッチング処理のSB4でソートされた順)に、スピーカ7を介して音声出力する。例えば、図7の場合、「音声認識コマンドとして、渋滞情報、高速略図、規制情報、を使用することができます。」のような音声メッセージを出力する。このことにより、ユーザは、現在使用可能な適応コマンドを、ディスプレイ6を見ることなく、優先度が高い順に把握することができる。
【0050】
次いで、図6において、音声出力を行った後や(SC4)、更新有りフラグがONになっていない場合(SC2、No)、音声認識コマンド特定部2cは、所定時間(例えば、1分)以内に、重畳表示コマンドの操作があったか否かを判定する(SC5)。具体的には、音声認識コマンド特定部2cは、ユーザの発話音声がマイク4を介して入力され音声検出部2bにて検出されたか否かを監視し、検出された場合には、当該検出された発話音声に、その時点でディスプレイ6に表示している重畳表示コマンドのいずれか一つが含まれているか否かを、公知の音声認識方法にて音声認識する。そして、重畳表示コマンドが含まれている場合、音声認識コマンド特定部2cは、音声認識コマンドの操作があったものと判定する(SC5、Yes)。この場合、重畳表示コマンドが最下位階層に位置付けられた音声認識コマンドであり、当該重畳表示コマンドが操作された場合には直ちに操作内容を特定できるため、当該重畳表示コマンドを対象とした音声認識コマンド実行処理を起動する(SC6)。そして、音声認識コマンド実行処理が終了した場合や、重畳表示コマンドの操作がないものと判定された場合には(SC5、No)、地図重畳表示処理を終了する。
【0051】
(処理−音声認識制御処理−地図重畳表示処理−音声認識コマンド実行処理)
次に、音声認識コマンド実行処理(SC6)について説明する。図8は、音声認識コマンド実行処理のフローチャートである。この処理において、音声認識制御部2aは、図6のSC5で操作有りと判定された重畳表示コマンドに対応する、所定の操作内容を実行する(SD1)。例えば、重畳表示コマンド=規制情報である場合には、通信部を介して取得した規制情報をディスプレイ6に表示する。
【0052】
次いで、音声認識制御部2aは、各種情報を取得する(SD2)。この各種情報としては、図3の使用状況履歴情報DB3cの使用状況履歴情報から、ユーザID及び音声認識コマンドを除いた各情報を取得する。これら各情報の取得は、図5のSB1と同様に行うことができる。次いで、音声認識制御部2aは、使用状況履歴情報を更新する(SD3)。具体的には、SD1で実行した重畳表示コマンドである音声認識コマンドと、SD2で取得した各種情報と、図4のSA1で取得したユーザIDとを、相互に対応付けて使用状況履歴情報の新規なレコードを構成し、この新規なレコードを使用状況履歴情報DB3cに格納する。
【0053】
その後、音声認識制御部2aは、優先度を必要に応じて更新する(SD4)。具体的には、音声認識制御部2aは、SD3で更新した使用状況履歴情報DB3cの使用状況履歴情報の中で、図4のSA1で取得したユーザIDに対応する使用状況履歴情報を参照する。そして、これまでに選択された音声認識コマンドの数を各音声認識コマンド毎に累計し、累計結果が多い順に優先度が高くなるように、各音声認識コマンドの優先度を新規に設定する。そして、当該新規に設定した優先度と、図4のSA1で取得したユーザIDに対応して図2の音声認識コマンドテーブル3bに既に設定されている優先度とを比較し、相違がある場合には、当該既に設定されている優先度を当該新規に設定した優先度で更新する。このような更新を行うことにより、選択基準分類=ユーザ適応型である音声認識コマンドの優先度が、ユーザによる音声認識コマンドの選択履歴に基づいて、常に最新の優先度に更新される。これにて音声認識コマンド実行処理を終了する。
【0054】
(処理−音声認識制御処理−同一画面表示処理)
次に、図4の同一画面表示処理(SA6)について説明する。図9、10は、同一画面表示処理のフローチャートである。この処理において、音声認識制御部2aは、ディスプレイ6に標準コマンドを表示する(SE1)。この標準コマンドの選択は従来と同様の方法で行うことができ、最初に表示する標準コマンドとしては、階層構造により階層化された所定の音声認識コマンドの中で、最上位階層の標準コマンドを表示する。
【0055】
次いで、音声認識制御部2aは、ディスプレイ6に同一画面表示コマンドを表示する(SE2)。具体的には、音声認識制御部2aは、図5の適応マッチング処理のSB3で選択されSB4でソートされた適応コマンドを、同一画面表示コマンドとして、SE1で表示した標準コマンドと平行に表示する。
【0056】
ここで、標準コマンドや同一画面表示コマンドの表示領域の位置や大きさは、任意に決定することができるが、これら標準コマンドや同一画面表示コマンドの表示数や表示サイズを考慮して決定することが好ましい。例えば、標準コマンドと同一画面表示コマンドを、相互に同一の表示数や表示サイズで表示する場合には、図11に例示するように、複数の標準コマンド20により構成された標準コマンドメニュー21の表示領域と、複数の同一画面表示コマンド22により構成された同一画面表示コマンドメニュー23の表示領域を、ディスプレイ6の表示領域全体の半分ずつとすることが好ましい。このように表示領域を半分ずつとする場合、図11のように左右半分の領域としてもよく、あるいは、上下半分の領域としてもよい。左右半分の領域とする場合には、図11のように、標準コマンド20を左半分の領域に表示し、同一画面表示コマンド22を右半分の領域に表示することが好ましい。あるいは、上下半分の領域とする場合には、標準コマンド20を上半分の領域に表示し、同一画面表示コマンド22を下半分の領域に表示することが好ましい。ただし、標準コマンド20の表示数と同一画面表示コマンド22の表示数を非同一とする場合(例えば、標準コマンド20の表示数を同一画面表示コマンド22の表示数より多くする場合)や、標準コマンド20の表示サイズと同一画面表示コマンド22の表示サイズを非同一とする場合(例えば、標準コマンド20の表示サイズを同一画面表示コマンド22の表示サイズより多くする場合)には、表示数が多くあるいは表示サイズが大きい方の表示領域を他方の表示領域より大きくしてもよい。このように決定した表示領域において、標準コマンド20や同一画面表示コマンド22は、図11のように縦並びで表示してもよく、あるいは横並びで表示してもよい。縦並びで同一画面表示コマンド22を表示する場合、上から下に至る順に、優先度が低くなるように表示することが好ましく、横並びで同一画面表示コマンド22を表示する場合、左から右に至る順に、優先度が低くなるように表示することが好ましい。
【0057】
次に、音声認識制御部2aは、データ記録部3の更新有りフラグがONになっているか否かを判定し(SE3)、更新有りフラグがONになっている場合(SE3、Yes)、更新有りフラグをOFFにすると共に(SE4)、SE2で表示した同一画面表示コマンドを優先度順に音声出力する(SE5)。これらSE3〜SE5は、音声認識コマンドが重畳表示コマンドではなく同一画面表示コマンドである点を除いて、それぞれ図6の地図重畳表示処理におけるSC2〜SC4とほぼ同様に行うことができるので、その詳細な説明を省略する。
【0058】
次に、音声認識コマンド特定部2cは、ユーザからの音声認識コマンドの操作が所定時間以内にあったか否かを図6のSC5と同様に判定し(SE6)、操作があった場合には、当該操作があった音声認識コマンドが、最下位階層コマンドではない標準コマンドの操作であるか否かを判定する(SE7)。そして、最下位階層コマンドではない標準コマンドの操作でないと判定した場合(SE7、No)、同一画面表示コマンドの操作又は最下位階層コマンドの標準コマンドの操作であり、当該操作された同一画面表示コマンド又は標準コマンドによって操作内容が特定できるので、音声認識コマンド特定部2cは、当該同一画面表示コマンド又は標準コマンドを対象とした音声認識コマンド実行処理を起動する(SE8)。この音声認識コマンド実行処理は、上述した図8の音声認識コマンド実行処理と同じであるため、その詳細な説明を省略する。
【0059】
一方、最下位階層コマンドではない標準コマンドの操作であると判定した場合(SE7、Yes)、当該操作された標準コマンドによって操作内容が特定できないので、音声認識コマンド実行処理は未だ起動せず、音声認識制御部2aは、ディスプレイ6に表示している標準コマンドを更新する(SE9)。すなわち、音声認識制御部2aは、ディスプレイ6に現在表示している標準コマンドに代えて、当該標準コマンドが位置付けられている階層の直下の階層(1段階だけ下の階層)に位置付けられている標準コマンドを、ディスプレイ6に表示する。
【0060】
また、音声認識制御部2aは、次に表示すべき同一画面表示コマンドを選択する(SE10)。すなわち、音声認識制御部2aは、SE9の更新後にディスプレイ6に表示されている標準コマンドが位置付けられている階層に対応する最下位階層に位置付けられている音声認識コマンドを特定し、当該特定された音声認識コマンドの中から、図5のSB3と同様に、同一画面表示コマンドを所定数だけ選択する。例えば、図12に例示する音声認識コマンドの階層構造において、最初に最上位階層に位置付けられた音声認識コマンド「コマンド1」、「コマンド2」、「コマンド3」、「コマンド4」、「コマンド5」がディスプレイ6に表示されている状態において、図9のSE6で操作が行われた音声認識コマンドが「コマンド2」であった場合、図10のSE9では、音声認識コマンド「コマンド2」より一つ下の階層に位置付けられている音声認識コマンド「C」〜「F」をディスプレイ6に表示することになる。そして、SE10では、これらの音声認識コマンド「C」〜「F」に対応する最下位階層に位置付けられている音声認識コマンド「P」〜「X」の中から、同一画面表示コマンドを所定数だけ選択する。このように、標準コマンドとは異なる階層の同一画面表示コマンドを選択することで、同じ音声認識コマンドがディスプレイ6に重複して表示されることを防止できる。また、ディスプレイ6に表示されている標準コマンドに対応する最下位階層に位置付けられている同一画面表示コマンドを選択することで、ユーザが選択した音声認識コマンドに対応する音声認識コマンドであって、直に操作内容を特定することができる音声認識コマンドを表示でき、音声認識による操作内容の指示をショートカットして迅速に行うことが可能になる。
【0061】
その後、図10において、音声認識制御部2aは、SE9で更新した標準コマンドと、SE10で選択した同一画面表示コマンドとが、重複するか否かを判定する(SE11)。すなわち、標準コマンドの選択が繰り返されることで、SE9で更新した標準コマンドが最下位階層に位置付けられた標準コマンドになり、SE10で選択された同一画面表示コマンドと重複する可能性があるため、SE11においてこの重複の有無を判定する。そして、重複があった場合には(SE11、Yes)、重複している同一画面表示コマンドを除外して、SE10と同様に同一画面表示コマンドを再度選択する(SE12)。例えば、重複しているものとして除外した同一画面表示コマンドの次に優先度が高い同一画面表示コマンドを選択する。
【0062】
そして、音声認識制御部2aは、ディスプレイ6に現在表示している同一画面表示コマンドに代えて、SE12で再選択した同一画面表示コマンド、又は重複がなかった場合には(SE11、No)、SE10で選択された同一画面表示コマンドを、ディスプレイ6に表示して(SE13)、同一画面表示処理を終了する。
【0063】
(処理−音声認識制御処理)
図6の地図重畳表示処理の後、あるいは、図9、10の同一画面表示処理の後、図4の音声認識制御処理に戻り、音声認識制御部2aは、ナビゲーション装置1を電源OFFする旨の通知を、当該ナビゲーション装置1やその他の外部システム側から受信したか否かを判定する(SA7)。そして、受信していない場合には(SA7、No)、SA2に移行して適応マッチング処理(SA2)を繰り返し、受信した場合には(SA7、Yes)、音声認識制御処理を終了する。
【0064】
(効果)
このように本実施の形態によれば、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された標準コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された適応コマンドとを、ディスプレイ6に同時に表示させるので、従来と同様に階層を経て音声認識コマンドを使用できることに加えて、現在使用する可能性が高い音声認識コマンドを直接的に使用でき、階層化された音声認識コマンドの操作性を向上させることができる。
【0065】
また、標準コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から適応コマンドを選択するので、標準コマンドと適応コマンドとが重複することを回避でき、標準コマンドと適応コマンドを同時に表示する際の利便性を高めることができる。
【0066】
また、標準コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から適応コマンドを選択するので、ユーザにより選択された標準コマンドに関連する適応コマンドを表示することができ、標準コマンドと適応コマンドを同時に表示する際の利便性を高めることができる。
【0067】
また、階層構造の末端に位置付けられた音声認識コマンドの中から、適応コマンドを選択するので、ユーザが適応コマンドを選択することで即時に所要機能を実行することが可能となり、音声認識コマンドの操作性を一層向上させることができる。
【0068】
〔各実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
【0069】
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。
【0070】
(ナビゲーション装置の構成について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、音声認識装置を複数の装置によって分散して構成された音声認識制御システムとして車両に搭載してもよく、あるいは制御部2やデータ記録部3の全部又は一部をネットワーク上に分散配置してもよい。また例えば、音声認識装置を、携帯電話やパーソナルコンピュータに組み込んでもよい。
【0071】
(適応コマンドの選択対象について)
上記実施の形態では、ユーザが現在使用する可能性が高い音声認識コマンドとして、最下位階層コマンドを選択するものとして説明したが、最下位階層コマンドに代えて、あるいは、最下位階層コマンドに加えて、中位階層コマンドを選択するようにしてもよい。
【0072】
(適応コマンドの選択条件について)
ユーザが使用する可能性が高いか否かを判断する所定の条件としては、図2の音声認識コマンドテーブルに示した表示アルゴリズムに代えて、あるいは、表示アルゴリズムに加えて、他の任意の表示アルゴリズムを使用してもよい。
【0073】
(適応コマンドの優先順位決定条件について)
複数の音声認識コマンドの相互間の優先順位を決定するための優先順位決定条件としては、図2の音声認識コマンドテーブルに示した優先度に代えて、あるいは、優先度に加えて、他の任意の優先度を使用してもよい。例えば、ユーザが設定した優先度を使用してもよい。また、図2の例では、選択基準分類=ユーザ適応型である音声認識コマンドに対しては、ユーザID毎に優先度を設定しているが、全てのユーザに対して同一の優先度を設定してもよい。
【0074】
(適応コマンドの表示方法について)
上記実施の形態では、適応コマンドを、地図に重畳表示したり、標準コマンドと同一画面に表示する例を説明したが、他の方法で表示を行ってもよい。例えば、ディスプレイに地図が表示されている場合において、適応コマンドを表示する場合に、地図に代えて適応コマンドのみを表示したり、これら地図と適応コマンドを所定間隔で交互に表示したり、地図と適応コマンドを異なる表示領域に非重畳的に表示してもよい。また、標準コマンドと適応コマンドを表示する場合において、標準コマンドと適応コマンドを所定間隔で交互に表示してもよい。
また、各適応コマンドを個別的に表示する以外にも、例えば、「その他」という音声認識コマンドをディスプレイ6に表示し、当該音声認識コマンドが選択された場合には、その時点でディスプレイ6に表示していない他の適応コマンドをディスプレイ6に表示するようにしてもよい。
【0075】
(使用状況履歴情報について)
データ記録部に記録する使用状況履歴情報の内容や、使用状況履歴情報を使用した優先度の更新方法は、任意に変更することができる。例えば、階層化された音声認識コマンドを最下位階層コマンドまで選択する前に、車両が走行を開始した場合、安全のために音声認識コマンドを用いたそれ以上の操作が規制された場合、当該記載された際の状況(走行経路や、停車してから走行するまでの時間等)と当該操作が規制された際に表示していた音声認識コマンドとを特定するための使用状況履歴情報を記録しておく。そして、その後に、当該状況と同一の状況になったことが特定された場合には、過去に操作が規制された際に表示していた音声認識コマンドに対応する最下位階層コマンドを表示することで、操作が規制される前に音声認識コマンドを用いた操作を完了し易くするようにしてもよい。
【符号の説明】
【0076】
1 ナビゲーション装置
2 制御部
2a 音声認識制御部
2b 音声検出部
2c 音声認識コマンド特定部
3 データ記録部
3a 地図情報DB
3b 音声認識コマンドテーブル
3c 使用状況履歴情報DB
4 マイク
5 タッチパネル
6 ディスプレイ
7 スピーカ
8 現在位置検出処理部
10 地図
11 高速略図
12 重畳表示コマンド
13 重畳表示コマンドメニュー
20 標準コマンド
21 標準コマンドメニュー
22 同一画面表示コマンド
23 同一画面表示コマンドメニュー
【技術分野】
【0001】
本発明は、音声認識装置、音声認識方法、及び音声認識プログラムに関する。
【背景技術】
【0002】
従来、カーナビゲーションシステム等において、ユーザの音声を認識することで、様々な音声認識コマンドの入力を受け付けることができる音声認識装置が用いられている。
【0003】
このような音声認識コマンドは、一般的に、階層構造(ツリー構造)により階層化されている。そして、最初に、最上位階層に位置付けられた複数の音声認識コマンドのみをディスプレイに表示し、これら複数の音声認識コマンドのいずれかの入力を受け付けた場合には、当該入力を受け付けた音声認識コマンドに対して1段階だけ下位階層に位置付けられた複数の音声認識コマンドのみをディスプレイに表示する。以降、音声認識コマンドの表示と受け付けとを同様に繰り返すことで階層を1段階ずつ下り、最終的に最下位階層に位置付けられた一つの音声認識コマンドを特定する。このような処理を行うことで、1度にディスプレイに表示する音声認識コマンドの数を限定でき、音声認識装置による音声認識率を向上させることが可能になる。
【0004】
しかしながら、カーナビゲーションシステム等が多機能化するに伴って音声認識コマンドの全体数が増えた場合、音声認識コマンドの階層も深くなり、最終的に一つの音声認識コマンドを特定するまでにユーザが入力しなければならない音声認識コマンドの数が増えるため、操作に手間がかかるという問題が生じていた。特に、カーナビゲーションシステム等のように車両に設置される機器の場合には、安全性の面から、車両の走行中には操作項目が制限される場合があった。このため、複数階層の途中まで操作した時点で走行を開始した場合には、それ以上の操作を行うことが制限されてしまい、最終的に一つの音声認識コマンドを特定することができず、操作が無駄になってしまう場合があった。
【0005】
このような点に鑑みて、音声認識を用いた入力装置の操作性を改善する提案も行われている。例えば、移動体入力装置において、移動体が走行状態である場合には、入力部が受け付ける入力が手操作及び音声でそれぞれ実行可能な項目か否かを判定し、手操作及び音声による項目操作の実行可否が区別可能な表示態様を表示部にて表示することが提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2007/069573号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述の如き従来の装置では、走行状態において実行可能な操作項目を把握することができるものの、音声認識コマンドが深い階層で階層化されていることに起因する問題を本質的に解決することはできなかった。すなわち、上述の従来の装置では、以前として、音声認識コマンドの階層を1段階ずつ下ることによって、最下位階層に位置付けられた一つの音声認識コマンドを特定しなければ、所要の機能を実行することができず、操作に手間がかかるものであった。
【0008】
本発明は、上記に鑑みてなされたものであって、階層化された音声認識コマンドの操作性を向上させることができる、音声認識装置、音声認識方法、及び音声認識プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するために、請求項1に記載の音声認識装置は、ユーザの発話音声を検出する音声検出手段と、前記音声検出手段にて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定手段により特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御手段と、を備え、前記音声認識制御手段は、前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、前記表示手段に同時に表示させる。
【0010】
請求項2に記載の音声認識装置は、請求項1に記載の音声認識装置において、前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する。
【0011】
請求項3に記載の音声認識装置は、請求項2に記載の音声認識装置において、前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する。
【0012】
請求項4に記載の音声認識装置は、請求項1から3のいずれか一項に記載の音声認識装置において、前記音声認識制御手段は、前記階層構造の末端に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する。
【0013】
請求項5に記載の音声認識方法は、ユーザの発話音声を検出する音声検出ステップと、前記音声検出ステップにおいて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定ステップにおいて特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御ステップと、を含み、前記音声認識制御ステップにおいては、前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、前記表示手段に同時に表示させる。
【0014】
請求項6に記載の音声認識プログラムは、請求項5に記載の音声認識方法をコンピュータに実行させる。
【発明の効果】
【0015】
請求項1に記載の音声認識装置、請求項5に記載の音声認識方法、及び請求項6に記載の音声認識プログラムによれば、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された第2音声認識コマンドとを、表示手段に同時に表示させるので、従来と同様に階層を経て音声認識コマンドを使用できることに加えて、現在使用する可能性が高い音声認識コマンドを直接的に使用でき、階層化された音声認識コマンドの操作性を向上させることができる。
【0016】
また、請求項2に記載の音声認識装置によれば、第1音声認識コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から第2音声認識コマンドを選択するので、第1音声認識コマンドと第2音声認識コマンドとが重複することを回避でき、第1音声認識コマンドと第2音声認識コマンドを同時に表示する際の利便性を高めることができる。
【0017】
また、請求項3に記載の音声認識装置によれば、第1音声認識コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から第2音声認識コマンドを選択するので、ユーザにより選択された第1音声認識コマンドに関連する第2音声認識コマンドを表示することができ、第1音声認識コマンドと第2音声認識コマンドを同時に表示する際の利便性を高めることができる。
【0018】
また、請求項4に記載の音声認識装置によれば、階層構造の末端に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択するので、ユーザが第2音声認識コマンドを選択することで即時に所要機能を実行することが可能となり、音声認識コマンドの操作性を一層向上させることができる。
【図面の簡単な説明】
【0019】
【図1】本発明の実施の形態に係るナビゲーション装置を例示するブロック図である。
【図2】音声認識コマンドテーブルを例示した表である。
【図3】使用状況履歴情報DBに格納されている使用状況履歴情報を例示した表である。
【図4】音声認識制御処理のフローチャートである。
【図5】適応マッチング処理のフローチャートである。
【図6】地図重畳表示処理のフローチャートである。
【図7】重畳表示コマンドを重畳表示した地図の表示例である。
【図8】音声認識コマンド実行処理のフローチャートである。
【図9】同一画面表示処理のフローチャートである。
【図10】図9に続く、同一画面表示処理のフローチャートである。
【図11】標準コマンドと同一画面表示コマンドの表示例である。
【図12】音声認識コマンドの階層構造を例示した図である。
【発明を実施するための形態】
【0020】
以下、本発明に係る音声認識装置、音声認識方法、及び音声認識プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、この実施の形態によって本発明が限定されるものではない。
【0021】
(基本的概念)
音声認識装置は、単独の装置として、あるいは、他の装置やシステムの一部として、構成することができる。以下では、音声認識装置を、車両に搭載されたナビゲーション装置の一部として構成した例について説明する。
【0022】
「音声認識コマンド」とは、音声認識装置に接続されたナビゲーション装置やエアコン等の各種接続機器に対する操作指示であって、発話音声により特定可能な操作指示である。
この音声認識コマンドは、例えば、従来と同様に、階層構造(ツリー構造)により階層化されている(階層構造に関連付けられている)。この階層構造における各階層のうち、最も上位の階層を「最上位階層」、最も下位の階層を「最下位階層」、これら最上位階層と最下位階層の間の階層を「中位階層」と称する。また、最上位階層に位置付けられた音声認識コマンドを「最上位階層コマンド」、最下位階層に位置付けられた音声認識コマンドを「最下位階層コマンド」、中位階層に位置付けられた音声認識コマンドを「中位階層コマンド」と称する。
【0023】
このように階層化された複数の音声認識コマンドの一部を選択してディスプレイに表示する。このようにディスプレイに表示すべき音声認識コマンドを選択する際の選択方法として、本実施の形態では、従来と同様に階層構造に基づいて選択する方法と、ユーザ(主として車両の運転者であるが、同乗者であってもよい)が使用する可能性が高いか否かを判断する所定の条件に基づいて選択する方法との2通りの方法を使用する。以下、前者の方法による選択を「標準選択」と称し、後者の方法による選択を「適応選択」と称する。また、標準選択により選択された音声認識コマンドを「標準コマンド(第1音声認識コマンド)」、適応選択により選択された音声認識コマンドを「適応コマンド(第2音声認識コマンド)」と称する。
【0024】
適応コマンドをディスプレイに表示する方法として、本実施の形態では、ディスプレイに地図が表示されている場合に当該地図に重畳して適応コマンドを表示させる方法と、ディスプレイに標準コマンドを表示すべき場合に当該標準コマンドと同時に適応コマンドを表示させる方法との2通りの方法を使用する。同時に表示させるとは、ディスプレイにおける同一画面上に、これら標準コマンドと適応コマンドを表示させることを意味する。以下、前者の方法によって表示される適応コマンドを「重畳表示コマンド」、後者の方法によって表示される適応コマンドを「同一画面表示コマンド」と称する。
【0025】
(構成−ナビゲーション装置)
最初に、本実施の形態に係る音声認識装置をその一部とするナビゲーション装置の構成について説明する。図1は、本実施の形態に係るナビゲーション装置1を例示するブロック図である。このナビゲーション装置1は、図1に示すように、制御部2及びデータ記録部3を備えている。また、ナビゲーション装置1には、マイク4、タッチパネル5、ディスプレイ6、スピーカ7、及び現在位置検出処理部8が接続されている。
【0026】
(構成−ナビゲーション装置−制御部)
制御部2は、ナビゲーション装置1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態に係る音声認識プログラムは、任意の記録媒体又はネットワークを介してナビゲーション装置1にインストールされることで、制御部2の各部を実質的に構成する。
【0027】
この制御部2は、機能概念的に、音声認識制御部2a、音声検出部2b、及び音声認識コマンド特定部2cを備える。音声認識制御部2aは、階層構造により階層化された音声認識コマンドの中から、音声認識コマンド特定部2cにより特定された音声認識コマンドに対応する所定の制御を実行すると共に、音声認識コマンドを選択してディスプレイ6に表示させる音声認識制御手段である。音声検出部2bは、ユーザの発話音声を検出する音声検出手段である。音声認識コマンド特定部2cは、音声検出部2bにて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段である。これらの各部によって実行される処理の詳細については後述する。
【0028】
(構成−ナビゲーション装置−データ記録部)
データ記録部3は、ナビゲーション装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記憶装置としてのハードディスク(図示省略)の如き磁気的記録媒体を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリの如き半導体型記憶媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。
【0029】
このデータ記録部3は、地図情報データベース(以下、データベースを「DB」と称する)3a、音声認識コマンドテーブル3b、及び使用状況履歴情報DB3cを備えている。
【0030】
地図情報DB3aは、地図情報を格納する地図情報格納手段である。「地図情報」は、例えばリンクデータ(リンク番号、接続ノード番号、道路座標、道路種別、車線数、法定速度、走行規制等)、ノードデータ(ノード番号、座標)、地物データ(信号機、道路標識、ガードレール、建物等)、施設データ(各施設の位置、各施設の種別等)、地形データ、地図をディスプレイ6に表示するための地図表示データ等を含んで構成されている。
【0031】
音声認識コマンドテーブル3bは、音声認識コマンドを適応選択で選択するために必要な情報(適応選択用情報)を格納するテーブルである。この音声認識コマンドテーブル3bは、図2に例示するように、項目「音声認識コマンド」、項目「機能分類」、項目「選択基準分類」、項目「ユーザID」、項目「優先度」、及び項目「表示アルゴリズム」を含んでおり、これら各項目に対応する情報を相互に対応付けて構成されている。項目「音声認識コマンド」に対応する情報は、音声認識コマンドを特定するコマンド情報である。ただし、ここでは、音声認識コマンドの中で、最下位階層コマンド(図2では、例えば「規制情報」等)のみを含めている。項目「機能分類」に対応する情報は、音声認識コマンドを機能面から分類した場合の分類情報である(図2では、例えば「情報表示」等)。項目「選択基準分類」に対応する情報は、音声認識コマンドを適応選択する場合における選択基準面から分類した場合の分類情報である。この情報としては、「状況適応型」、「環境適応型」、及び「ユーザ適応型」の3つがある。「状況適応型」とは、短期的な状況(例えば、交通状況)に応じて選択される音声認識コマンドが属する分類である。「環境適応型」とは、中長期的な状況(例えば、高速道路走行中)に応じて選択される音声認識コマンドが属する分類である。「ユーザ適応型」とは、ユーザの属性、行動傾向、あるいは行動履歴等に基づいて選択される音声認識コマンドが属する分類である。項目「ユーザID」に対応する情報は、車両のユーザを一意に識別するためのユーザ識別情報である(図3では、例えば「UID0001」等)。項目「優先度」に対応する情報は、複数の適応コマンドをディスプレイ6に表示させる場合において、当該複数の適応コマンドの相互間の優先順位を決定するための優先順位決定条件である。図2の例では、優先度を「1」〜「5」までの数値で示しており、数値が小さい程、優先度が高いことを示している。特に、選択基準分類=ユーザ適応型である適応コマンドの優先度は、ユーザID毎に格納されている。項目「表示アルゴリズム」に対応する情報は、ユーザが使用する可能性が高いか否かを判断する所定の条件(選択条件)である。例えば、図2の一番上のレコードの例は、「高速道路走行中、かつ走行経路上の交通規制情報が受信された場合」という選択条件に合致する場合に、項目「音声認識コマンド」=「規制情報」を適応コマンドとして選択することを示している。このような音声認識コマンドテーブル3bは、任意の基準で決定されナビゲーション装置1の製造時にデータ記録部3に記録される。ただし、選択基準分類=ユーザ適応型の音声認識コマンドに対応する優先度は、後述する音声認識コマンド実行処理において必要に応じて更新される。
【0032】
使用状況履歴情報DB3cは、音声認識コマンドのユーザによる使用状況の履歴に関する情報(以下、使用状況履歴情報)を格納する使用状況履歴情報格納手段である。この使用状況履歴情報は、図3に例示するように、項目「ユーザID」、項目「音声認識コマンド」、項目「出発地」、項目「目的地」、項目「現在位置」、項目「案内開始日時」、項目「現在日時」、項目「走行道路種別」、項目「車速」、及び項目「ガソリン残量」を含んでおり、これら各項目に対応する情報を相互に対応付けて構成されている。項目「ユーザID」に対応する情報は、車両のユーザを一意に識別するためのユーザ識別情報である(図3では、例えば「UID0001」等)。項目「音声認識コマンド」に対応する情報は、図2の音声認識コマンドテーブル3bにおける同一名称の情報と同じである。項目「出発地」に対応する情報は、ナビゲーション装置1に設定されている車両の出発地を特定するための情報である(図3では、座標であり、例えば「35度35分21秒、139度38分18秒」等)。項目「目的地」に対応する情報は、ナビゲーション装置1に設定されている車両の目的地を特定するための情報である(図3では、座標であり、例えば「35度40分12秒、139度12分10秒」等)。項目「現在位置」に対応する情報は、使用状況履歴情報が取得された際の車両の位置を特定するための情報である(図3では、座標であり、例えば「35度37分12秒、139度20分01秒」等)。項目「案内開始日時」に対応する情報は、ナビゲーション装置1によって走行経路の案内を開始した日時を特定するための情報である(図3では、日付(西暦表示)と時刻(24時間表示)を併記したものであり、例えば「2011/08/01 13:55」等)。項目「現在日時」に対応する情報は、使用状況履歴情報が取得された際の日時を特定するための情報である(図3では、日付(西暦表示)と時刻(24時間表示)を併記したものであり、例えば「2011/08/01 14:43」等)。項目「走行道路種別」に対応する情報は、使用状況履歴情報が取得された際に車両が走行している道路の種別を特定するための情報である(図3では、例えば「高速道路」等)。項目「車速」に対応する情報は、使用状況履歴情報が取得された際の車両の車速を特定するための情報である(図3では、例えば「100Km/h」等)。項目「ガソリン残量」に対応する情報は、使用状況履歴情報が取得された際の車両のガソリンの残量を特定するための情報である(図3では、例えば「34L」等)。このような使用状況履歴情報DB3cの使用状況履歴情報は、後述する音声認識コマンド実行処理において更新されデータ記録部3に記録される。
【0033】
(構成−マイク)
図1に戻り、マイク4は、音声を電気信号に変換してナビゲーション装置1に出力する。このマイク4としては、公知のマイクを用いることができる。
【0034】
(構成−タッチパネル)
タッチパネル5は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル5は、透明又は半透明状に形成され、ディスプレイ6の前面において当該ディスプレイ6の表示面と重畳するように設けられている。このタッチパネル5としては、例えば抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
【0035】
(構成−ディスプレイ)
ディスプレイ6は、ナビゲーション装置1の制御に基づいて情報を表示にて出力する表示手段である。特に、ディスプレイ6は、階層構造により階層化された所定の複数の音声認識コマンドの中から、音声認識制御部2aによって選択された音声認識コマンドを表示する表示手段である。なお、このディスプレイ6の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
【0036】
(構成−スピーカ)
スピーカ7は、ナビゲーション装置1の制御に基づいて情報を音声にて出力する音声出力手段である。特に、スピーカ7は、音声認識コマンドをディスプレイ6に表示させた場合に、当該表示させた音声認識コマンドをユーザに認識させるための音声出力を出力する音声出力手段である。このスピーカ7から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。
【0037】
(構成−現在位置検出処理部)
現在位置検出処理部8は、ナビゲーション装置1が搭載された車両の現在位置を検出する現在位置検出手段である。具体的には、現在位置検出処理部8は、GPS、地磁気センサ、距離センサ、又はジャイロセンサ(いずれも図示省略)の少なくとも一つを有し、現在の車両の位置(座標)及び方位等を公知の方法にて検出する。
【0038】
(処理−音声認識制御処理)
次に、このように構成されたナビゲーション装置1によって実行される音声認識制御処理について説明する。図4は音声認識制御処理のフローチャートである(以下の各処理の説明ではステップを「S」と略記する)。この音声認識制御処理は、例えば、ナビゲーション装置1に電源が投入された後に起動される。
【0039】
図4に示すように、音声認識制御処理が開始されると、音声認識制御部2aは、ユーザIDを取得する(SA1)。例えば、ユーザに自己のユーザIDの入力を促すメッセージを、ディスプレイ6に表示させたりスピーカ7から音声出力させたりし、ユーザが自己のユーザIDをタッチパネル5を介して入力した場合には、当該入力されたユーザIDを取得する。この他にも、公知の様々な方法でユーザIDを取得することができ、例えば、車両の内部に取り付けたカメラでユーザの顔部を撮影し、この撮影した画像に基づいてユーザを画像認識することでユーザを識別し、当該識別したユーザに対応するユーザIDを、予めデータ記録部3にユーザ画像と対応付けて記録されたユーザIDの中から取得する。
【0040】
(処理−音声認識制御処理−適応マッチング処理)
次に、音声認識制御部2aは、適応マッチング処理を起動する(SA2)。図5は適応マッチング処理のフローチャートである。この処理において、音声認識制御部2aは、各種情報を取得する(SB1)。この各種情報としては、図2の音声認識コマンドテーブル3bの表示アルゴリズムの充足性を判定するために必要な情報を取得する。例えば、音声認識制御部2aは、出発地、目的地、現在位置、案内開始日時、現在日時、走行道路種別、車速、ガソリン残量を取得する。このうち、出発地、目的地、現在位置、案内開始日時、現在日時、及び走行道路種別は、ユーザによってナビゲーション装置1に設定された情報から取得したり、ナビゲーション装置1によって設定された走行経路から取得したり、地図情報DB3aから取得することができる。車速は、車両に搭載された図示しない車速センサから取得することができ、ガソリン残量は、車両に搭載された図示しない燃焼タンクセンサから取得することができる。また、音声認識制御部2aは、走行経路上の交通規制情報や渋滞情報を、図示しない通信部を介して交通センターやビーコン等から受信する。また、現在の一時的な情報のみでなく、一定の時間経過を伴う情報を取得することもでき、例えば、X分間の平均速度は、上記取得した車速をX分間だけ所定間隔で取得し続け、その平均値を算定することで取得することができる。
【0041】
また、音声認識制御部2aは、使用状況履歴情報を取得する(SB2)。具体的には、音声認識制御部2aは、使用状況履歴情報DB3cに格納された使用状況履歴情報の中から、図4のSA1で取得したユーザIDに対応する使用状況履歴情報を取得する。
【0042】
そして、音声認識制御部2aは、適応コマンドを選択する(SB3)。具体的には、音声認識制御部2aは、図2の音声認識コマンドテーブル3bにおける選択基準分類=環境適応型又は状況適応型である音声認識コマンドの中から、SB1で取得した各種情報によって充足される表示アルゴリズムに対応する音声認識コマンドを特定し、当該特定した音声認識コマンドを適応コマンドとして選択する。例えば、SB1で取得した各種情報として、走行道路種別=高速道路が取得され、かつ、走行経路上の交通規制情報が受信された場合には、音声認識コマンド=規制情報に対応する表示アルゴリズム「高速道路走行中、かつ走行経路上の交通規制情報が受信された場合」が充足されるので、音声認識コマンド=規制情報を適応コマンドの候補とする。また、音声認識制御部2aは、選択基準分類=ユーザ適応型である音声認識コマンドの中から、SB2で取得した使用状況履歴情報に合致する表示アルゴリズムに対応する音声認識コマンドを特定し、当該特定した音声認識コマンドを適応コマンドとして選択する。例えば、SB2で取得した使用状況履歴情報に基づき、現在のユーザが、案内開始直後に一般道路案内をよく設定するユーザである場合(一例として、当該ユーザのユーザIDに対応するレコードとして、案内開始日時から現在日時までの経過時間が所定時間以内であって、音声認識コマンドが一般道優先案内であるレコードが、所定数以上含まれている場合)には、音声認識コマンド=一般道優先案内を、適応コマンドの候補とする。
【0043】
このSB3において、音声認識制御部2aは、適応コマンドを所定数(例えば、3つ)だけ選択する。例えば、選択した適応コマンドが所定数に満たない場合には、音声認識コマンドテーブル3bの中から、未だ選択されていない適応コマンドの中から、音声認識コマンドテーブルに格納された優先度が最も高い適応コマンドを選択してもよい。逆に、選択した適応コマンドが所定数を超えている場合には、当該選択した適応コマンドの中から、音声認識コマンドテーブルに格納された優先度が高い順に所定数の適応コマンドを選択してもよく、あるいは所定数の適応コマンドをランダムに選択してもよい。また、所定数の適応コマンドは、機能分類毎に同じ数の適応コマンドを選択してもよい(例えば、所定数=4である場合に、機能分類=情報表示である音声認識コマンド、機能分類=地図表示切替である音声認識コマンド、機能分類=操作である音声認識コマンド、機能分類=案内である音声認識コマンドを、それぞれ1つずつ選択する等)。若しくは、所定数の適応コマンドは、選択基準分類毎に同じ数の適応コマンドを選択してもよい(例えば、所定数=3である場合に、選択基準分類=環境適応型である音声認識コマンド、選択基準分類=状況適応型である音声認識コマンド、選択基準分類=個人適応型である音声認識コマンドを、それぞれ1つずつ選択する等)。
【0044】
次いで、音声認識制御部2aは、SB3で選択した適応コマンドの相互間の優先順位を、所定の優先順位決定条件に基づいて決定する(SB4)。この優先順位とは、適応コマンドをディスプレイ6に表示する際の優先順位であると共に、適応コマンドを音声出力する際の優先順位である。また、優先順位決定条件としては、音声認識コマンドテーブル3bの優先度を適用する。具体的には、音声認識制御部2aは、SB3で選択した適応コマンドの優先度を音声認識コマンドテーブル3bから取得し、当該取得した優先度が高い順に適応コマンドをソートする。例えば、SB3において、適応コマンドとして、規制情報(優先度=1)、市街図表示(優先度=3)、渋滞情報(優先度=2)を選択した場合には、これらをソートして、規制情報、渋滞情報、市街図表示の順に並び替える。この際、選択基準分類=ユーザ適応型である適応コマンドの優先度は、図4のSA1で取得したユーザIDに対応する優先度を使用する。
【0045】
次に、音声認識制御部2aは、SB4でソートした適応コマンドの更新が有るか否かを判定する(SB5)。すなわち、データ記録部3には、その時点でディスプレイ6に表示されている(あるいは、その時点で表示されていない場合には、過去直近に表示されていた)適応コマンドと、この適応コマンドのソート結果とが、記録されている。そして、音声認識制御部2aは、SB4でソートした適応コマンド及びそのソート結果が、データ記録部3に記録されている適応コマンド及びそのソート結果から一部でも変更されているか否か判定する。そして、変更されていない場合には、適応コマンドの更新がないものとして(SB5、No)、適応マッチング処理を終了する。一方、変更されている場合には、適応コマンドの更新が有るものとして(SB5、Yes)、適応コマンドが更新された旨の更新有りフラグをONとしてデータ記録部3に記録し(SB6)、適応マッチング処理を終了する。
【0046】
(処理−音声認識制御処理)
次に、図4の音声認識制御処理に戻り、音声認識制御部2aは、ディスプレイ6に地図を表示中であるか否かを判定する(SA3)。そして、表示中である場合(SA3、Yes)、音声認識制御部2aは、地図に重畳表示コマンドを重畳表示するための地図重畳表示処理を起動する(SA4)。一方、表示中でない場合(SA3、No)、音声認識制御部2aは、音声識別コマンドを選択するためのメニュー(以下、音声識別メニュー)をディスプレイ6に表示中であるか否を判定し(SA5)、表示中である場合には(SA5、Yes)、同一画面表示コマンドを表示するための同一画面表示処理を起動し(SA6)、表示中でない場合には(SA5、No)、これら地図重畳表示処理や同一画面表示処理を起動することなく、SA7に移行する。
【0047】
(処理−音声認識制御処理−地図重畳表示処理)
まず、地図重畳表示処理(SA4)について説明する。図6は、地図重畳表示処理のフローチャートである。この処理において、音声認識制御部2aは、ディスプレイ6に表示されている地図に、重畳表示コマンドを重畳表示する(SC1)。すなわち、音声認識制御部2aは、図5の適応マッチング処理のSB3で選択されSB4でソートされた適応コマンドを、重畳表示コマンドとして表示する。この重畳表示コマンドは、階層構造において最下位階層に位置付けられている音声認識コマンド(最下位階層コマンド)であることから、ユーザが直に操作内容を特定することができる音声認識コマンドを表示でき、音声認識による操作内容の指示をショートカットして迅速に行うことが可能になる。
【0048】
このように重畳表示コマンドを重畳表示する際の表示領域は、ユーザにとって重要であると考えられる表示領域を除外した表示領域であることが好ましい。ユーザにとって重要であると考えられる表示領域としては、例えば、車両の現在位置が表示されている領域、走行経路が設定されている場合には出発地、目的地、走行経路が表示されている領域、交差点や案内標識の拡大表示領域、あるいは高速略図等の略図表示領域を挙げることができる。図7には、重畳表示コマンドを重畳表示した地図の表示例を示す。この表示例では、地図10に高速略図11が重畳表示されている場合を示しており、この地図10の表示領域のうち、高速略図11の表示領域を除外した表示領域に、複数の重畳表示コマンド12により構成された重畳表示コマンドメニュー13が重畳表示されている。このように縦並びで重畳表示コマンド12を表示する場合、上から下に至る順に、優先度が低くなるように表示することが好ましい。あるいは、重畳表示コマンド12を横並びで重畳表示してもよく、この場合、左から右に至る順に、優先度が低くなるように表示することが好ましい。また、縦並びと横並びのいずれの場合においても、重畳表示コマンド12を、表示領域の外枠に近傍において、当該外枠に沿って表示することが好ましい。
【0049】
次に、図6において、音声認識制御部2aは、データ記録部3の更新有りフラグがONになっているか否かを判定する(SC2)。そして、更新有りフラグがONになっている場合(SC2、Yes)、音声認識制御部2aは、データ記録部3の更新有りフラグをOFFにすると共に(SC3)、SC1で地図に重畳表示した重畳表示コマンドを優先度順に音声出力する(SC4)。具体的には、重畳表示コマンドを、その優先度が高い順(図5の適応マッチング処理のSB4でソートされた順)に、スピーカ7を介して音声出力する。例えば、図7の場合、「音声認識コマンドとして、渋滞情報、高速略図、規制情報、を使用することができます。」のような音声メッセージを出力する。このことにより、ユーザは、現在使用可能な適応コマンドを、ディスプレイ6を見ることなく、優先度が高い順に把握することができる。
【0050】
次いで、図6において、音声出力を行った後や(SC4)、更新有りフラグがONになっていない場合(SC2、No)、音声認識コマンド特定部2cは、所定時間(例えば、1分)以内に、重畳表示コマンドの操作があったか否かを判定する(SC5)。具体的には、音声認識コマンド特定部2cは、ユーザの発話音声がマイク4を介して入力され音声検出部2bにて検出されたか否かを監視し、検出された場合には、当該検出された発話音声に、その時点でディスプレイ6に表示している重畳表示コマンドのいずれか一つが含まれているか否かを、公知の音声認識方法にて音声認識する。そして、重畳表示コマンドが含まれている場合、音声認識コマンド特定部2cは、音声認識コマンドの操作があったものと判定する(SC5、Yes)。この場合、重畳表示コマンドが最下位階層に位置付けられた音声認識コマンドであり、当該重畳表示コマンドが操作された場合には直ちに操作内容を特定できるため、当該重畳表示コマンドを対象とした音声認識コマンド実行処理を起動する(SC6)。そして、音声認識コマンド実行処理が終了した場合や、重畳表示コマンドの操作がないものと判定された場合には(SC5、No)、地図重畳表示処理を終了する。
【0051】
(処理−音声認識制御処理−地図重畳表示処理−音声認識コマンド実行処理)
次に、音声認識コマンド実行処理(SC6)について説明する。図8は、音声認識コマンド実行処理のフローチャートである。この処理において、音声認識制御部2aは、図6のSC5で操作有りと判定された重畳表示コマンドに対応する、所定の操作内容を実行する(SD1)。例えば、重畳表示コマンド=規制情報である場合には、通信部を介して取得した規制情報をディスプレイ6に表示する。
【0052】
次いで、音声認識制御部2aは、各種情報を取得する(SD2)。この各種情報としては、図3の使用状況履歴情報DB3cの使用状況履歴情報から、ユーザID及び音声認識コマンドを除いた各情報を取得する。これら各情報の取得は、図5のSB1と同様に行うことができる。次いで、音声認識制御部2aは、使用状況履歴情報を更新する(SD3)。具体的には、SD1で実行した重畳表示コマンドである音声認識コマンドと、SD2で取得した各種情報と、図4のSA1で取得したユーザIDとを、相互に対応付けて使用状況履歴情報の新規なレコードを構成し、この新規なレコードを使用状況履歴情報DB3cに格納する。
【0053】
その後、音声認識制御部2aは、優先度を必要に応じて更新する(SD4)。具体的には、音声認識制御部2aは、SD3で更新した使用状況履歴情報DB3cの使用状況履歴情報の中で、図4のSA1で取得したユーザIDに対応する使用状況履歴情報を参照する。そして、これまでに選択された音声認識コマンドの数を各音声認識コマンド毎に累計し、累計結果が多い順に優先度が高くなるように、各音声認識コマンドの優先度を新規に設定する。そして、当該新規に設定した優先度と、図4のSA1で取得したユーザIDに対応して図2の音声認識コマンドテーブル3bに既に設定されている優先度とを比較し、相違がある場合には、当該既に設定されている優先度を当該新規に設定した優先度で更新する。このような更新を行うことにより、選択基準分類=ユーザ適応型である音声認識コマンドの優先度が、ユーザによる音声認識コマンドの選択履歴に基づいて、常に最新の優先度に更新される。これにて音声認識コマンド実行処理を終了する。
【0054】
(処理−音声認識制御処理−同一画面表示処理)
次に、図4の同一画面表示処理(SA6)について説明する。図9、10は、同一画面表示処理のフローチャートである。この処理において、音声認識制御部2aは、ディスプレイ6に標準コマンドを表示する(SE1)。この標準コマンドの選択は従来と同様の方法で行うことができ、最初に表示する標準コマンドとしては、階層構造により階層化された所定の音声認識コマンドの中で、最上位階層の標準コマンドを表示する。
【0055】
次いで、音声認識制御部2aは、ディスプレイ6に同一画面表示コマンドを表示する(SE2)。具体的には、音声認識制御部2aは、図5の適応マッチング処理のSB3で選択されSB4でソートされた適応コマンドを、同一画面表示コマンドとして、SE1で表示した標準コマンドと平行に表示する。
【0056】
ここで、標準コマンドや同一画面表示コマンドの表示領域の位置や大きさは、任意に決定することができるが、これら標準コマンドや同一画面表示コマンドの表示数や表示サイズを考慮して決定することが好ましい。例えば、標準コマンドと同一画面表示コマンドを、相互に同一の表示数や表示サイズで表示する場合には、図11に例示するように、複数の標準コマンド20により構成された標準コマンドメニュー21の表示領域と、複数の同一画面表示コマンド22により構成された同一画面表示コマンドメニュー23の表示領域を、ディスプレイ6の表示領域全体の半分ずつとすることが好ましい。このように表示領域を半分ずつとする場合、図11のように左右半分の領域としてもよく、あるいは、上下半分の領域としてもよい。左右半分の領域とする場合には、図11のように、標準コマンド20を左半分の領域に表示し、同一画面表示コマンド22を右半分の領域に表示することが好ましい。あるいは、上下半分の領域とする場合には、標準コマンド20を上半分の領域に表示し、同一画面表示コマンド22を下半分の領域に表示することが好ましい。ただし、標準コマンド20の表示数と同一画面表示コマンド22の表示数を非同一とする場合(例えば、標準コマンド20の表示数を同一画面表示コマンド22の表示数より多くする場合)や、標準コマンド20の表示サイズと同一画面表示コマンド22の表示サイズを非同一とする場合(例えば、標準コマンド20の表示サイズを同一画面表示コマンド22の表示サイズより多くする場合)には、表示数が多くあるいは表示サイズが大きい方の表示領域を他方の表示領域より大きくしてもよい。このように決定した表示領域において、標準コマンド20や同一画面表示コマンド22は、図11のように縦並びで表示してもよく、あるいは横並びで表示してもよい。縦並びで同一画面表示コマンド22を表示する場合、上から下に至る順に、優先度が低くなるように表示することが好ましく、横並びで同一画面表示コマンド22を表示する場合、左から右に至る順に、優先度が低くなるように表示することが好ましい。
【0057】
次に、音声認識制御部2aは、データ記録部3の更新有りフラグがONになっているか否かを判定し(SE3)、更新有りフラグがONになっている場合(SE3、Yes)、更新有りフラグをOFFにすると共に(SE4)、SE2で表示した同一画面表示コマンドを優先度順に音声出力する(SE5)。これらSE3〜SE5は、音声認識コマンドが重畳表示コマンドではなく同一画面表示コマンドである点を除いて、それぞれ図6の地図重畳表示処理におけるSC2〜SC4とほぼ同様に行うことができるので、その詳細な説明を省略する。
【0058】
次に、音声認識コマンド特定部2cは、ユーザからの音声認識コマンドの操作が所定時間以内にあったか否かを図6のSC5と同様に判定し(SE6)、操作があった場合には、当該操作があった音声認識コマンドが、最下位階層コマンドではない標準コマンドの操作であるか否かを判定する(SE7)。そして、最下位階層コマンドではない標準コマンドの操作でないと判定した場合(SE7、No)、同一画面表示コマンドの操作又は最下位階層コマンドの標準コマンドの操作であり、当該操作された同一画面表示コマンド又は標準コマンドによって操作内容が特定できるので、音声認識コマンド特定部2cは、当該同一画面表示コマンド又は標準コマンドを対象とした音声認識コマンド実行処理を起動する(SE8)。この音声認識コマンド実行処理は、上述した図8の音声認識コマンド実行処理と同じであるため、その詳細な説明を省略する。
【0059】
一方、最下位階層コマンドではない標準コマンドの操作であると判定した場合(SE7、Yes)、当該操作された標準コマンドによって操作内容が特定できないので、音声認識コマンド実行処理は未だ起動せず、音声認識制御部2aは、ディスプレイ6に表示している標準コマンドを更新する(SE9)。すなわち、音声認識制御部2aは、ディスプレイ6に現在表示している標準コマンドに代えて、当該標準コマンドが位置付けられている階層の直下の階層(1段階だけ下の階層)に位置付けられている標準コマンドを、ディスプレイ6に表示する。
【0060】
また、音声認識制御部2aは、次に表示すべき同一画面表示コマンドを選択する(SE10)。すなわち、音声認識制御部2aは、SE9の更新後にディスプレイ6に表示されている標準コマンドが位置付けられている階層に対応する最下位階層に位置付けられている音声認識コマンドを特定し、当該特定された音声認識コマンドの中から、図5のSB3と同様に、同一画面表示コマンドを所定数だけ選択する。例えば、図12に例示する音声認識コマンドの階層構造において、最初に最上位階層に位置付けられた音声認識コマンド「コマンド1」、「コマンド2」、「コマンド3」、「コマンド4」、「コマンド5」がディスプレイ6に表示されている状態において、図9のSE6で操作が行われた音声認識コマンドが「コマンド2」であった場合、図10のSE9では、音声認識コマンド「コマンド2」より一つ下の階層に位置付けられている音声認識コマンド「C」〜「F」をディスプレイ6に表示することになる。そして、SE10では、これらの音声認識コマンド「C」〜「F」に対応する最下位階層に位置付けられている音声認識コマンド「P」〜「X」の中から、同一画面表示コマンドを所定数だけ選択する。このように、標準コマンドとは異なる階層の同一画面表示コマンドを選択することで、同じ音声認識コマンドがディスプレイ6に重複して表示されることを防止できる。また、ディスプレイ6に表示されている標準コマンドに対応する最下位階層に位置付けられている同一画面表示コマンドを選択することで、ユーザが選択した音声認識コマンドに対応する音声認識コマンドであって、直に操作内容を特定することができる音声認識コマンドを表示でき、音声認識による操作内容の指示をショートカットして迅速に行うことが可能になる。
【0061】
その後、図10において、音声認識制御部2aは、SE9で更新した標準コマンドと、SE10で選択した同一画面表示コマンドとが、重複するか否かを判定する(SE11)。すなわち、標準コマンドの選択が繰り返されることで、SE9で更新した標準コマンドが最下位階層に位置付けられた標準コマンドになり、SE10で選択された同一画面表示コマンドと重複する可能性があるため、SE11においてこの重複の有無を判定する。そして、重複があった場合には(SE11、Yes)、重複している同一画面表示コマンドを除外して、SE10と同様に同一画面表示コマンドを再度選択する(SE12)。例えば、重複しているものとして除外した同一画面表示コマンドの次に優先度が高い同一画面表示コマンドを選択する。
【0062】
そして、音声認識制御部2aは、ディスプレイ6に現在表示している同一画面表示コマンドに代えて、SE12で再選択した同一画面表示コマンド、又は重複がなかった場合には(SE11、No)、SE10で選択された同一画面表示コマンドを、ディスプレイ6に表示して(SE13)、同一画面表示処理を終了する。
【0063】
(処理−音声認識制御処理)
図6の地図重畳表示処理の後、あるいは、図9、10の同一画面表示処理の後、図4の音声認識制御処理に戻り、音声認識制御部2aは、ナビゲーション装置1を電源OFFする旨の通知を、当該ナビゲーション装置1やその他の外部システム側から受信したか否かを判定する(SA7)。そして、受信していない場合には(SA7、No)、SA2に移行して適応マッチング処理(SA2)を繰り返し、受信した場合には(SA7、Yes)、音声認識制御処理を終了する。
【0064】
(効果)
このように本実施の形態によれば、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された標準コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された適応コマンドとを、ディスプレイ6に同時に表示させるので、従来と同様に階層を経て音声認識コマンドを使用できることに加えて、現在使用する可能性が高い音声認識コマンドを直接的に使用でき、階層化された音声認識コマンドの操作性を向上させることができる。
【0065】
また、標準コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から適応コマンドを選択するので、標準コマンドと適応コマンドとが重複することを回避でき、標準コマンドと適応コマンドを同時に表示する際の利便性を高めることができる。
【0066】
また、標準コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から適応コマンドを選択するので、ユーザにより選択された標準コマンドに関連する適応コマンドを表示することができ、標準コマンドと適応コマンドを同時に表示する際の利便性を高めることができる。
【0067】
また、階層構造の末端に位置付けられた音声認識コマンドの中から、適応コマンドを選択するので、ユーザが適応コマンドを選択することで即時に所要機能を実行することが可能となり、音声認識コマンドの操作性を一層向上させることができる。
【0068】
〔各実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
【0069】
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。
【0070】
(ナビゲーション装置の構成について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、音声認識装置を複数の装置によって分散して構成された音声認識制御システムとして車両に搭載してもよく、あるいは制御部2やデータ記録部3の全部又は一部をネットワーク上に分散配置してもよい。また例えば、音声認識装置を、携帯電話やパーソナルコンピュータに組み込んでもよい。
【0071】
(適応コマンドの選択対象について)
上記実施の形態では、ユーザが現在使用する可能性が高い音声認識コマンドとして、最下位階層コマンドを選択するものとして説明したが、最下位階層コマンドに代えて、あるいは、最下位階層コマンドに加えて、中位階層コマンドを選択するようにしてもよい。
【0072】
(適応コマンドの選択条件について)
ユーザが使用する可能性が高いか否かを判断する所定の条件としては、図2の音声認識コマンドテーブルに示した表示アルゴリズムに代えて、あるいは、表示アルゴリズムに加えて、他の任意の表示アルゴリズムを使用してもよい。
【0073】
(適応コマンドの優先順位決定条件について)
複数の音声認識コマンドの相互間の優先順位を決定するための優先順位決定条件としては、図2の音声認識コマンドテーブルに示した優先度に代えて、あるいは、優先度に加えて、他の任意の優先度を使用してもよい。例えば、ユーザが設定した優先度を使用してもよい。また、図2の例では、選択基準分類=ユーザ適応型である音声認識コマンドに対しては、ユーザID毎に優先度を設定しているが、全てのユーザに対して同一の優先度を設定してもよい。
【0074】
(適応コマンドの表示方法について)
上記実施の形態では、適応コマンドを、地図に重畳表示したり、標準コマンドと同一画面に表示する例を説明したが、他の方法で表示を行ってもよい。例えば、ディスプレイに地図が表示されている場合において、適応コマンドを表示する場合に、地図に代えて適応コマンドのみを表示したり、これら地図と適応コマンドを所定間隔で交互に表示したり、地図と適応コマンドを異なる表示領域に非重畳的に表示してもよい。また、標準コマンドと適応コマンドを表示する場合において、標準コマンドと適応コマンドを所定間隔で交互に表示してもよい。
また、各適応コマンドを個別的に表示する以外にも、例えば、「その他」という音声認識コマンドをディスプレイ6に表示し、当該音声認識コマンドが選択された場合には、その時点でディスプレイ6に表示していない他の適応コマンドをディスプレイ6に表示するようにしてもよい。
【0075】
(使用状況履歴情報について)
データ記録部に記録する使用状況履歴情報の内容や、使用状況履歴情報を使用した優先度の更新方法は、任意に変更することができる。例えば、階層化された音声認識コマンドを最下位階層コマンドまで選択する前に、車両が走行を開始した場合、安全のために音声認識コマンドを用いたそれ以上の操作が規制された場合、当該記載された際の状況(走行経路や、停車してから走行するまでの時間等)と当該操作が規制された際に表示していた音声認識コマンドとを特定するための使用状況履歴情報を記録しておく。そして、その後に、当該状況と同一の状況になったことが特定された場合には、過去に操作が規制された際に表示していた音声認識コマンドに対応する最下位階層コマンドを表示することで、操作が規制される前に音声認識コマンドを用いた操作を完了し易くするようにしてもよい。
【符号の説明】
【0076】
1 ナビゲーション装置
2 制御部
2a 音声認識制御部
2b 音声検出部
2c 音声認識コマンド特定部
3 データ記録部
3a 地図情報DB
3b 音声認識コマンドテーブル
3c 使用状況履歴情報DB
4 マイク
5 タッチパネル
6 ディスプレイ
7 スピーカ
8 現在位置検出処理部
10 地図
11 高速略図
12 重畳表示コマンド
13 重畳表示コマンドメニュー
20 標準コマンド
21 標準コマンドメニュー
22 同一画面表示コマンド
23 同一画面表示コマンドメニュー
【特許請求の範囲】
【請求項1】
ユーザの発話音声を検出する音声検出手段と、
前記音声検出手段にて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、
階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定手段により特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御手段と、を備え、
前記音声認識制御手段は、
前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、
ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、
前記表示手段に同時に表示させる、
音声認識装置。
【請求項2】
前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する、
請求項1に記載の音声認識装置。
【請求項3】
前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する、
請求項2に記載の音声認識装置。
【請求項4】
前記音声認識制御手段は、前記階層構造の末端に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する、
請求項1から3のいずれか一項に記載の音声認識装置。
【請求項5】
ユーザの発話音声を検出する音声検出ステップと、
前記音声検出ステップにおいて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、
階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定ステップにおいて特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御ステップと、を含み、
前記音声認識制御ステップにおいては、
前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、
ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、
前記表示手段に同時に表示させる、
音声認識方法。
【請求項6】
請求項5に記載の方法をコンピュータに実行させる音声認識プログラム。
【請求項1】
ユーザの発話音声を検出する音声検出手段と、
前記音声検出手段にて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、
階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定手段により特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御手段と、を備え、
前記音声認識制御手段は、
前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、
ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、
前記表示手段に同時に表示させる、
音声認識装置。
【請求項2】
前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層とは異なる階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する、
請求項1に記載の音声認識装置。
【請求項3】
前記音声認識制御手段は、前記表示手段に表示させている第1音声認識コマンドが位置付けられている階層の下位の階層に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する、
請求項2に記載の音声認識装置。
【請求項4】
前記音声認識制御手段は、前記階層構造の末端に位置付けられた音声認識コマンドの中から、第2音声認識コマンドを選択する、
請求項1から3のいずれか一項に記載の音声認識装置。
【請求項5】
ユーザの発話音声を検出する音声検出ステップと、
前記音声検出ステップにおいて検出されたユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、
階層構造により階層化された音声認識コマンドの中から、前記音声認識コマンド特定ステップにおいて特定された音声認識コマンドに対応する所定の制御を実行すると共に、前記音声認識コマンドを選択して表示手段に表示させる音声認識制御ステップと、を含み、
前記音声認識制御ステップにおいては、
前記階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、
ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、
前記表示手段に同時に表示させる、
音声認識方法。
【請求項6】
請求項5に記載の方法をコンピュータに実行させる音声認識プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2013−54075(P2013−54075A)
【公開日】平成25年3月21日(2013.3.21)
【国際特許分類】
【出願番号】特願2011−190170(P2011−190170)
【出願日】平成23年8月31日(2011.8.31)
【出願人】(000100768)アイシン・エィ・ダブリュ株式会社 (3,717)
【Fターム(参考)】
【公開日】平成25年3月21日(2013.3.21)
【国際特許分類】
【出願日】平成23年8月31日(2011.8.31)
【出願人】(000100768)アイシン・エィ・ダブリュ株式会社 (3,717)
【Fターム(参考)】
[ Back to top ]