説明

キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置

【課題】様々な発話内容を待ち受けることができるキーワードを選択すること。
【解決手段】音声認識部112は、ディスク151に記録された音声認識対象単語の中から音響的な共通部分をキーワードとして選択し、選択したキーワードを用いてマイク130を介して入力された発話音声を認識する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置に関する。
【背景技術】
【0002】
次のような音声認識装置が、例えば特許文献1によって知られている。この音声認識装置は、上位階層辞書で都道府県名の入力を待ち受け、上位階層辞書で認識した都道府県名を含む市町村名を辞書データとして下位階層辞書を構成し、当該下位階層辞書で市町村名の入力を待ち受ける。
【0003】
【特許文献1】特開2001−306088号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の装置では、いずれの階層でも都道府県名や市町村名などのように、意味のある単語を待ち受け単語としているため、上位階層辞書で認識した単語の意味を含まない単語は下位階層辞書で認識することができず、音声認識の自由度が高いものとは言えなかった。
【課題を解決するための手段】
【0005】
本発明によるキーワード選択方法は、音声認識用辞書に記録された音声認識対象単語の中から選択したキーワードを用いて音声入力手段を介して入力された発話音声を認識する音声認識装置で使用するキーワード選択方法であって、音声認識対象単語の音響的な共通部分をキーワードとして選択することを特徴とする。
本発明による音声認識方法は、音声認識用辞書に記録された音声認識対象単語の中から、請求項1〜10のいずれか一項に記載のキーワード選択方法を使用して、音声認識対象単語の音響的な共通部分をキーワードとして選択し、音声認識対象単語の中から、キーワードおよびキーワードを含まない音声認識対象単語を音声認識実行時の待ち受け単語として読み込み、待ち受け単語と、発話音声とをマッチング処理して発話音声を認識することを特徴とする。
本発明によるキーワード選択システムは、音声認識対象単語を記録した音声認識用辞書を有するサーバ、およびサーバから音声認識対象単語を取得する取得手段と、請求項1〜10のいずれか一項に記載のキーワード選択方法を実行して、音声認識対象単語の音響的な共通部分をキーワードとして選択するキーワード選択手段とを備えるキーワード選択装置を所定の通信回線で接続することを特徴とする。
本発明によるキーワード選択装置は、請求項19〜23のいずれか一項に記載のキーワード選択装置であること特徴とする。
【発明の効果】
【0006】
本発明によれば、音声認識対象単語の音響的な共通部分をキーワードとして選択するようにしたので、このように選択したキーワードを待ち受け単語とすることで、単語の意味に関わらず音響的に発話音声を認識することができ、音声認識の自由度を向上することができる。
【発明を実施するための最良の形態】
【0007】
図1は、本実施の形態における音声認識装置の一実施の形態の構成を示すブロック図である。音声認識装置100は、例えば、車両に搭載されたナビゲーション装置に実装され、使用者は、当該音声認識装置100から出力される応答メッセージに従って音声入力を行うことにより、ナビゲーション装置を操作することができる。
【0008】
音声認識装置100は、ユーザが音声認識開始を指示するための発話開始スイッチ120と、ユーザの発話音声を入力するマイク130と、マイク130を介して入力された音声データを音声認識し、その内容に応じて施設や経路を検索してその結果を表示したり応答を返したりする制御装置110と、メモリ140と、地図データやガイダンス音声の音声データ、および音声認識処理の際に使用する音声認識用辞書・文法を格納するディスク151を読み取るディスク読取装置150と、ナビゲーション装置が出力する地図やメニュー画面、および音声認識装置100が出力する音声認識結果を表示するモニタ160と、音声を出力するスピーカ170とを備えている。
【0009】
メモリ140は、音声認識辞書・文法141と、現時点までの発話理解結果142を格納している。音声認識辞書・文法141は、音声認識のために使用する待ち受け単語であり、ナビゲーション装置の操作に使用される語句および文、すなわち操作コマンドおよび地名や施設名、道路名などの固有名詞およびこれらの語句を含む文を受理するために使用される。この音声認識辞書・文法141は、ディスク151に格納された音声認識用辞書・文法(音声認識用辞書)の中から制御装置110によって必要な音声認識対象単語(音声認識対象語句)のみが取り出され、メモリ140上にロードされたものである。
【0010】
なお、本実施の形態では、ナビゲーション装置上での目的地設定をメインタスクとする。そのため、入力文としては「神奈川県」、「横浜駅」などといった施設に関する発話を受理するように音声認識用辞書・文法を整備する必要がある。ただし、本実施の形態で想定するメモリ140の容量は、施設検索タスク全体で取り扱う可能性のある施設名や地名全てを読み込むために必要なメモリ量に対して数分の1程度と小さい。そのため、ディスク151に格納されている音声認識用辞書・文法の全てをメモリ140上に読み込むことはできない。
【0011】
したがって、制御装置110は、ディスク151に格納された音声認識用辞書・文法の中から必要な認識対象語句のみを取り出してメモリ140上にロードする必要がある。このために、例えば、使用者によって施設名が発話されると、最初は後述するキーワード文法によって荒い認識(初回認識)を行ない、この結果に基づいて文法を切り替えて詳細な認識(再認識)処理を行なう。そして、初回認識の結果と再認識の結果とあわせた上で最適な理解結果を最終的な理解結果(発話理解結果)として選択する。発話理解結果142には、この初回認識の結果を保存する。なお、初回認識、再認識の各処理については後述する。
【0012】
制御装置110は、入力制御部111と、音声認識部112と、理解結果生成部113と、対話制御部114と、GUI表示制御部115と、音声合成部116とを備えている。使用者によって音声認識開始スイッチ120が操作され、音声認識開始合図が入力されると、入力制御部111がこれを受け取り、音声認識部112に音声取り込み開始を指示する。音声取り込みが開始されると、音声認識部112はマイク130からの音声入力に対して音声認識処理を実行し、理解結果生成部113は音声認識部112の音声認識結果に基づいて理解結果生成処理を実行する。
【0013】
また、対話制御部114は、使用者に対する応答文を生成してGUI表示制御部115および音声合成部116へ出力する。GUI表示制御部115は応答文のGUIデータを生成してモニタ160へ出力し、音声合成部116は応答文の音声データを生成してスピーカ170を介して出力する。なお、入力制御部111〜音声合成部116の各部は、これらの処理を目的地設定や施設検索など、ナビゲーション装置上での一連のタスクが終了するまで繰り返し実行する。
【0014】
以下、図2に示すフローチャートに従って、制御装置110および制御装置110が備える各部によって実行される音声対話処理について説明する。なお、この図2に示す処理は、ナビゲーション装置の電源がオンされることによって音声認識装置100が起動されると起動するプログラムとして実行される。
【0015】
ステップS1において、制御装置110は、ディスク読み取り装置150を介してディスク151からキーワード認識用のキーワード文法と、キーワードを含まない語句を認識するためのキーワード外文法の2種類を初回認識用の音声認識用辞書・文法141、すなわち音声認識実行時の待ち受け単語としてメモリ140上にロードするためのキーワード選択処理を実行する。
【0016】
ここで、キーワード文法とは、認識対象語句に多く含まれる音素列であるキーワードとそれ以外の部分を吸収するGarbageからなるワードスポット文法であり、キーワードは各認識対象単語に共通する音響的特長である。また、キーワード外文法は、認識対象語句の中で、その発音音素列の中にどのキーワードも含まない語句を認識するための文法である。なお、上述したように、メモリ140の容量の都合上、ディスク151に格納されている音声認識用辞書・文法の全てをメモリ140上に読み込むことはできないため、制御装置110は、ここでは図4で後述するキーワード選択処理を実行して、必要なキーワード文法、およびキーワード外文法のみを取り出すようにする。
【0017】
その後、ステップS2へ進み、入力制御部111は、使用者によって音声認識開始スイッチ120が押下されたか否かを判断する。音声認識開始スイッチ120が押下されたと判断した場合には、入力制御部111は、音声認識部112に対して音声認識処理の開始を指示してステップS3へ進む。ステップS3では、音声認識部112は、マイク130から入力される音声の取り込みを開始する。その後、ステップS4へ進み、音声認識部112は、マイク130からの音声データを検出して、使用者による発話があったか否かを判断する。使用者による発話があったと判断した場合には、ステップS5へ進む。
【0018】
ステップS5では、音声認識部112は、音声認識用辞書・文法141に格納されたキーワード文法、およびキーワード外文法の両方を待ち受け文法(初回認識用の文法)とし、入力された音声データを、初回認識用の文法とマッチングすることによって、初回認識処理を実行する。この初回認識処理の際には、音声認識部112は、入力された音声データと各待ち受け文法との音響的な近さである音響尤度が計算され、この音響尤度が高いものから順に上位N個(=N−best)が認識結果の候補となる。すなわち、初回認識時にはキーワード文法とキーワード外文法の両方を使用して音声認識処理を行なうため、認識結果の候補としては、キーワード文法に含まれるキーワードと、キーワード外文法に含まれる単語との両方が現れる可能性がある。
【0019】
その後、ステップS6へ進み、理解結果生成部113は、音声認識部112によって得られた認識結果の候補N−bestに対して信頼度計算を行なう。なお、信頼度計算については、例えば特開2001−034292号公報に記載されているように公知の技術であるため、詳細についての説明は省略する。そして、ステップS7において、理解結果生成部113は、信頼度計算の結果を初回認識時の発話理解結果142としてメモリ140に保存する。その後、ステップS8へ進む。
【0020】
ステップS8では、音声認識部112は、理解結果生成部113による初回認識における信頼度計算の結果に基づいて、待ち受けに使用する文法を切り替えた再認識が必要か否かを判断する。具体的には、音声認識部112は、事前に行った認識処理が初回認識であり、かつ初回認識の結果得られるN−best中にキーワードが含まれている場合には、当該キーワードを認識結果の候補とし、このキーワードを対象とした再認識が必要であると判断して、ステップS9へ進む。これに対して、N−best中にキーワードが含まれていない場合には、再認識は必要ないと判断して、後述するステップS12へ進む。
【0021】
ステップS9では、再認識処理を行うために、音声認識に使用する文法を初回認識用の文法から再認識用の文法に切り替える。ここでは、キーワード文法の中からN−best中で最も信頼度の高いキーワードを含む認識対象単語を抽出して、再認識用の文法とする。例えば、N−best中で最も信頼度の高いキーワードが「東京」である場合には、キーワード文法の中から「東京駅」や「東京タワー」などの「東京」を含む認識対象単語を抽出して再認識用の文法とする。この再認識用の文法も音声認識用辞書・文法141に格納される。
【0022】
その後、ステップS10へ進み、音声認識部112は、入力された音声データを、音声認識用辞書・文法141に格納した再認識用の文法とマッチングすることによって、再認識処理を実行して、ステップS11へ進む。ステップS11では、理解結果生成部113は、再認識処理の結果に対して信頼度計算を行ってステップS12へ進む。
【0023】
ステップS12では、理解結果生成部113は、初回認識の結果および再認識の結果に基づいて、最適な発話理解結果を選択する。すなわち、再認識処理が実行されなかった場合には、初回認識時にキーワード外文法によって認識された最も信頼度の高い単語を発話理解結果として選択する。これに対して、再認識処理が実行された場合には、再認識時の発話理解結果とメモリ140に保存しておいた初回認識時の発話理解結果142とに基づいて発話理解結果を選択する。すなわち、理解結果生成部113は、再認識処理の結果、最も信頼度が高かったキーワードの尤度と、初回認識時にキーワード外文法によって認識された最も信頼度の高い単語の尤度とを比較し、尤度が高い方を最終的な発話理解結果として選択する。
【0024】
その後、ステップS13へ進み、対話制御部114は、理解結果生成部113によって選択された発話理解結果に応じて、あらかじめ設定されたルールに従って、使用者に対して応答するための応答文を生成して、GUI表示制御部115および音声合成部116へ出力する。そして、ステップS14では、GUI表示制御部115は応答文のGUIデータを生成してモニタ160へ出力し、音声合成部116は応答文の音声データを生成してスピーカ170を介して出力する。その後、ステップS15へ進む。
【0025】
ステップS15では、制御装置100は、目的地設定や経路選択などの一連のタスクが一通り完了したかどうか否かを判断し、完了していないと判断した場合には、ステップS2へ戻って処理を繰り返す。これに対して、完了したと判断した場合には、ステップS16へ進む。ステップS16では、音声認識装置100の電源がオフされたか否かを判断し、オフされていなければステップS2へ戻って処理を繰り返す。一方、オフされたと判断した場合には、処理を終了する。
【0026】
次に、以上説明した処理の具体例について、図3を用いて説明する。ここでは、使用者が「東京ディズニーランド(登録商標)」と発話した場合について説明する。このとき、音声認識部112は、キーワード文法201とキーワード外文法202とを初回認識時の待ち受け文法として音声を待ち受けている。音声認識部112は、まずはこの二つの文法を平行して使用して音声を認識する。このとき、再認識処理のために入力された音声データはメモリ104に保存しておく。図3に示す例では、使用者による発話「東京ディズニーランド」に対して、初回認識時にキーワード文法201で「トウキョウ」が認識されている。
【0027】
このため、音声認識部112は、音素列「トウキョウ」を含む単語のみを受理するための再認識用文法203をメモリ140上に読み込み、先ほど保存しておいた入力された音声データを再認識する。このように、キーワード文法を使った荒い認識によって、詳細な認識を認識対象語句の「あたり」をつけることで、メモリ上に一度にロードできないような大語彙認識であっても、短時間で認識処理を行なうことができる。
【0028】
また、住所上では東京都でない施設や、「コウトウキョウイクセンター」(高等教育センター)のように、意味上の「東京」とは関係のない施設や住所であっても音素列「トウキョウ」を含んでいれば、それらの単語を再認識用文法203に登録することができる。このため、意味上の分類にはとらわれず、音素列の情報のみでキーワードおよび切り替える文法を設定することができ、音さえ認識すれば、その意味や分類上の制約には関係なく、音声認識を行うことができる。
【0029】
同様に、使用者が「サンシャイン60」などといった、キーワードを含まない単語を発話した場合には、キーワード外文法202でこれを受理する。そしてこの入力に対してキーワード文法で認識結果が得られなければ、これをキーワード外文法の認識結果をそのまま理解結果として出力し、キーワード文法とキーワード外文法の両方で認識結果が得られた場合にはそれぞれの尤度を比較して最終的な発話理解結果を選択する。このように、キーワード外文法をキーワード文法と併用することで、キーワードを持たない語句であっても認識することができる。
【0030】
次に、ステップS1で実行されるキーワード選択処理について説明する。図4は、本実施の形態におけるキーワード選択処理を示すフローチャートである。なお、本実施の形態では、次の基準に合致するような音素列をキーワードとして選択する場合について説明する。
(基準1)各キーワードを含む単語の数が、同時認識可能な範囲でなるべく多くなること。
(基準2)キーワードを含まない認識対象語句とキーワードを併せた数が同時認識可能な範囲に納まること。
【0031】
ステップS21において、キーワードを含む単語数のボーダーラインBiの初期値を設定する。Biは、Biよりも多くの単語に含まれる音素列をキーワードとして選択するためのボーダーラインとして使用する。今回、キーワードを含む単語数のボーダーラインBiの初期値は、同時認識可能な最大単語数のMaxRecとした。ここでは、より多くの単語に含まれる音素列を優先してキーワードとして選択するために、ボーダーラインBiを大きい値から徐々に下げながらキーワード選択を行なう。
【0032】
その後、ステップS22へ進み、今回調べるキーワード候補のモーラ数(N)の初期値を設定する。今回のループでは、モーラ数Nの音素列をキーワードの候補として選択する。本実施の形態では、モーラ数Nの初期値は、認識対象単語の中で最も長いモーラ数をもつ単語のモーラ数MaxMoraとしているが、認識対象語彙によっては、MaxMoraの1/2から1/3程度に設定してもよい。
【0033】
その後、ステップS23へ進み、後述する図5に示すキーワード候補選択処理を実行して、認識対象語句Wiに含まれるモーラ数がNの音素列の数を調べる。ここでは、モーラ数がNのある音素列が、認識対象語句Wの中にBi個以上、MaxRec個以下見つかれば、これをキーワード候補Kαに加えるようにする。その後、ステップS24へ進む。
【0034】
ステップS24では、今回調べたキーワードのモーラ数Nとキーワードの最小モーラ数MinMoraとを比較して、NがMinMoraより大きいか否かを判断する。NがMinMoraより大きい場合には、ステップS25へ進み、選択するキーワードのモーラ数Nをひとつ減らして、ステップS23へ戻り、Bi個以上MaxRec個以下の認識対象単語に含まれるキーワード候補の選択を繰り返す。これに対して、NがMinMora以下の場合は、ステップS26へ進み、認識対象単語Wから、キーワード候補Kαリストのどれかひとつ以上のキーワード候補を含む単語を除いた、キーワードをひとつも含まない単語の集合Wiを求める。
【0035】
その後、ステップS27へ進み、キーワードを含まない単語Wiの数Num(Wi)とキーワードKαの数Num(Kα)の合計が同時待ち受け可能単語数MaxRecより大きいか否かを判断する。これは、初回認識時にキーワードと平行して認識するキーワードを持たない単語集合の合計が、同時待ち受け可能な範囲に収まっているかどうかを調べるためである。その結果、キーワードを含まない単語の数Num(Wi)が同時待ち受け可能な語彙数MaxRecに収まっていなければ、ステップS28へ進み、キーワードを含む単語数のボーダーラインBiを1/2倍する。その後、ステップS22へ戻って処理を繰り返す。
【0036】
一方、キーワードを含まない単語の数Num(Wi)が同時待ち受け可能な語彙数MaxRecに収まっていれば、ステップS29へ進み、キーワードをKαとして設定する。その後、ステップS30へ進み、図7で後述するキーワードの再整理処理を実行して、処理を終了する。なお、上述した処理においては、モーラ数の最低値は固定値MinMoraを使用したが、モーラ数が多い音素列を優先してキーワードとするために、モーラ数の最低値MinMoraは大きめの値に設定して、徐々に下げる方法をとってもよい。
【0037】
次に、ステップS23で実行されるキーワード候補選択について、図5を用いて説明する。このキーワード候補選択処理では、単語wsに含まれるモーラ数Nの全ての音素列について、認識対象単語の集合W中にBi個以上、MaxRec個以下含まれているかどうかを調べ、Bi個以上含まれている場合には、これをキーワード候補とする。また、認識対象単語集合Wに含まれる全ての単語を、順に単語サンプルwsとして取り上げ、そこに含まれるモーラ数Nの全ての音素列について調べる。具体的には次のように処理する。
【0038】
ステップS41において、キーワード設定のために今回調べる認識対象単語集合Wから認識対象単語をサンプルとしてひとつ取り出し、これを単語サンプルwsとする。そして、単語サンプルwsの先頭から順に調べていくために、wsの先頭から単語サンプルwsに含まれるモーラ数Nの音素列ksの開始位置までの距離nsを0に設定する。その後、ステップS42へ進み、単語wsから、wsの先頭からの距離nsの位置で始まるモーラ数Nの音素列ksが抽出できるか否かを判断するために、wsの先頭からの距離nsとモーラ数Nの合計が、単語wsのモーラ数len(ws)以下か否かを判断する。
【0039】
wsの先頭からの距離nsとモーラ数Nの合計が、単語wsのモーラ数len(ws)より大きいと判断した場合には、単語wsからモーラ数Nの音素列は抽出できないと判定してステップS43へ進む。ステップS43では、単語wsが単語集合Wiの最後の単語かどうかを判断し、最後でなければ次の単語を調べるためにステップS41へ戻って処理を繰り返す。これに対して、単語wsが単語集合Wiの単語であったならば、キーワード選択処理を終了して図5に示す処理に復帰する。
【0040】
一方、wsの先頭からの距離nsとモーラ数Nの合計が、単語wsのモーラ数len(ws)以下であると判断した場合には、ステップS44へ進む。ステップS44では、ws先頭からの距離nsの位置の文字が促音(「っ」)であるか否かを判断する。ws先頭からの距離nsの位置の文字が促音であると判断した場合には、ステップS55へ進み、wsから取り出す音素列の開始位置を1モーラずらして処理を繰り返す。これに対して、ws先頭からの距離nsの位置の文字が促音でないと判断した場合には、ステップS45へ進む。
【0041】
ステップS45では、単語wsから、wsの先頭からの距離nsの位置で始まるモーラ数Nの音素列を抽出し、wsから取り出した音素列をksとする。このとき、音素列ksを含む単語の数を数えるためのカウンタCksをリセットしておく。すなわち、Cks=0とする。その後、ステップS46へ進み、認識対象単語集合Wから単語をひとつ取り出し、これをwtとする。このとき、単語サンプルwtの先頭から調べるためにwtの先頭から単語サンプルwtに含まれるモーラ数Nの音素列ktの開始位置までの距離ntを0としておく。その後、ステップS47へ進む。
【0042】
ステップS47では、単語の先頭からの距離ntとモーラ数Nの合計が、単語wtのモーラ数len(wt)以下であるか否かを判断する。単語の先頭からの距離ntとモーラ数Nの合計が単語wtのモーラ数len(wt)より大きい場合には、単語wtからこれ以上モーラ数Nの音素列は抽出できないと判断して、後述するステップS52へ進む。これに対して、単語の先頭からの距離ntとモーラ数Nの合計が単語wtのモーラ数len(wt)以下である場合には、単語wtから、先頭からの距離ntの位置で始まるモーラ数Nの音素列ktが抽出できると判断して、ステップS48へ進む。
【0043】
ステップS48では、単語wtから、先頭からの距離ntの位置で始まるモーラ数Nの音素列ktを抽出する。その後、ステップS49へ進み、抽出した音素列ktを単語サンプルwsから取り出した音素列ksと比較して、両者が等しいか否かを判断する。両者が等しい場合には、ステップS51へ進み、カウンタCksをインクリメントして、ステップS52へ進む。一方、両者が異なる場合には、ステップS50へ進み、単語wsから音素列を取り出す位置を1モーラずらしてステップS47へ戻り、次の音素列を調べる。
【0044】
ステップS52では、wtが認識対象語句Wの最後の単語であるか否かを判断する。最後の単語でないと判断した場合には、ステップS46へ戻って次の単語を取り出し、これに音素列ksが含まれるかどうかを調べるためにS46からS52を繰り返す。一方、wtが認識対象語句Wの最後の単語であると判断した場合には、ステップS53へ進み、音素列ksのカウンタCksがボーダーラインBiから最大同時待ち受け可能単語数までに納まっているか否かを判断する。すなわち、カウンタCksがボーダーラインのBi以上、かつ同時待ち受け可能最大単語数MaxRec以下であるか否かを判断する。
【0045】
上述したように、図2におけるステップS6では、あるキーワードを認識した場合にはこのキーワードを部分的に含む単語のみを受理する文法を用いて再認識する処理を行なうため、再認識対象となる語彙は、同時待ち受け可能な範囲である必要がある。よって、このステップS53では、キーワードを含む単語の数Cksが同時待ち受け可能な単語数MaxRecよりも小さいかどうかも調べている。
【0046】
その結果、カウンタCksがボーダーラインのBi以上、かつ同時待ち受け可能最大単語数MaxRec以下であると判断した場合には、ステップS54へ進み、キーワード候補リストのKαにキーワード候補ksを加える。その後、ステップS55へ進んで、wsから取り出す音素列の開始位置を1モーラずらしてステップS42へ戻って処理を繰り返す。これに対して、CksがボーダーラインBi以上、かつ同時待ち受け可能最大単語数MaxRec以下の範囲内にないと判断した場合には、キーワード候補ksをキーワード候補リストのKαには追加せず、そのままステップS55へ進んで、次の音素列を調べる。
【0047】
以上説明した図5の処理を、全ての単語wsを単語サンプルとして一度取り上げ、そこから取り出した全てのNモーラ音素列の中から、他の全ての単語中にBi個以上MaxRec個以下含まれるものが全てKαにリスト化されるまで繰り返す。
【0048】
次に、図6を用いてキーワード候補選択方法の具体例について説明する。なお、図6に示す例においては、キーワードのモーラ数Nは4であるものとし、図6(a)に示すように「シナガワエキ」、「エドガワエキ」、「トウキョウエキ」、および「カナガワエキ」の4つの単語が認識対象語句Wに含まれているものとする。まず、この認識対象語句Wの中から単語「シナガワエキ」をwsとして取り出す。そして、図6(b)に示すように、「シナガワエキ」からモーラ数が4の音素列を抽出すると、「シナガワ」、「ナガワエ」、および「ガワエキ」の3パターンができる。これらの音素列をそれぞれksとして、Wiの他の単語にも含まれているかどうかを調べる。
【0049】
すなわち、Wiの中から「エドガワエキ」をwtとして取り出した場合には、図6(c)に示すように、wtの中から「ガワエキ」が音素列kt(キーワード候補)として取り出される。他の単語についても同様にして調べることによって、図6の例では、音素列「ガワエキ」をksとした場合に、当該音素列ksが「シナガワエキ」、「エドガワエキ」、および「カナガワエキ」の3単語の中に含まれていることが分かり、認識対象語句中のキーワード候補「ガワエキ」の数Cksは3となる。
【0050】
なお、本実施の形態では、モーラ単位で区切った音素列をキーワードとしたが、音素単位、音節単位、または単語単位で認識対象単語を区切ってキーワードと設定してもよい。またキーワードはそれぞれの長さや認識のしやすさには関係なく選択しているが、認識されやすい音素(認識率の高い音素)を含むキーワードを優先してキーワードに設定するようにすればキーワード検出率を上げることもできる。一般的に、母音は子音に比べて発話継続時間が長く、スペクトルが比較的明確であるため音声認識しやすい。このため、母音を含む音素列を優先してキーワードに設定することで認識しやすい音素列を優先してキーワードとすることができる。
【0051】
また、認識対象単語中でキーワードが出現する位置についても考慮するようにすれば、キーワードの検出率をさらに向上させることができる。一般的に音声認識処理では、前方または後方から入力音声と、文法に記述された順に展開された音素モデルとを比較処理し、認識候補の中から最も音響的な距離が近いものを認識結果とするが、途中可能性が明らかに低い認識候補は枝狩りをして候補数を減らすことで、処理時間を短縮することがある。このように、前方から比較する認識エンジンでは後方に出現するキーワードが、後方から比較する認識エンジンでは前方に出現するキーワードが認識しづらい傾向にある。よって、入力音声の前方から比較処理を行なう認識エンジンでは単語の先頭からの距離が短い音素列を優先してキーワードとし、入力音声の後方から比較処理を行なう認識エンジンでは単語の後方からの距離が短い音素列を優先してキーワードとすることで、キーワードの検出率を上げることができる。
【0052】
その他、キーワードは一般に長ければ長いほど検出しやすいため、モーラ数の多い音素列を優先してキーワードとするようにしてキーワードの検出率向上を図ってもよい。またキーワードは同時待ち受け可能な範囲でなるべく多くの単語に含まれるものを選択するが、キーワードを含む単語の数が同時待ち受け可能な範囲を超えてしまった場合には、キーワードを長くすることで、キーワードを含む単語の数を減らしてもよい。例えば、キーワード「ガッコウ」を含む単語の数が同時待ち受け可能な数を超えている場合には、キーワードを「ショウガッコウ」と「チュウガッコウ」に分割することでひとつのキーワードを含む単語の数を制限することができる。さらに、キーワード同士は音響的になるべく遠いもの同士を選択するようにすれば、キーワード同士の誤認識を避けることができる。
【0053】
次に、図4のステップS30で実行されるキーワード再整理処理について説明する。このキーワード再整理処理は、図4のステップS29までの処理で選択された各キーワードを含む単語に重複がある場合に、これらのキーワードを再整理するための実行される処理である。各キーワードを含む単語に重複がある場合とは、例えば、同じキーワードを含む単語としては、「ショウガッコウ」と「ガッコウ」のように、一方のキーワードが他方のキーワードを含んでいるといったように、キーワード自体が近い場合や、「インター」と「チェンジ」(インターチェンジ)のように、同時に発話される可能性が高い音素列同士がそれぞれキーワードとして登録されている場合が考えられる。
【0054】
このように、各キーワードを含む単語が複数ある場合には、複数のキーワードを認識した際に再認識対象とする単語集合同士に重なりができることになる。この重複部分は、そのまま複数のキーワードを認識した場合の再認識対象の中で余計な認識対象となる。よって、この重複部分はなるべく少なくしておきたい。また、キーワード自体の数も少なければ少ないほど個々のキーワードの認識率は高くなるため、キーワードは必要最低限としたい。よって、このような場合には一方の音素列のみをキーワードとして登録しておけば、他方のキーワードがなくても性能はほぼかわらないことを加味して、以下に説明するキーワード再整理処理を実行して、重なりが大きいキーワード同士の場合は各単語に含まれるキーワードの数が1に近い語を優先してキーワードとして選択されるように、どちらか一方を削除する。
【0055】
図7は、キーワード再整理処理の流れを示すフローチャートである。ステップS61において、認識対象単語Wの中で、キーワード候補リストKα中のどのキーワード候補も含まない単語の数UNKαを調べて、ステップS62へ進む。ステップS62では、Kαの先頭から順にキーワード候補kiを取り出す。ここで、Kαからkiを取り出した残りのキーワード候補リストをKβとする。その後、ステップS63へ進む。
【0056】
ステップS63では、Kβ中のどのキーワード候補も含まない単語の数UMKβを調べて、ステップS64へ進む。ステップS64では、kiを含む単語の数Mkiを調べる。その後、ステップS65へ進み、kiがキーワードに加わることによって変化する、どのキーワードも含まない単語の数(UMKβ−UMKα)がMkiに占める割合Dkinを求めて、ステップS66へ進む。ステップS66では、kiがKαの最後であるか否かを判断する。kiがKαの最後ではないと判断した場合には、ステップS62へ戻って処理を繰り返す。これに対して、kiがKαの最後であると判断した場合には、ステップS67へ進む。
【0057】
ステップS67では、Dkinが最も小さいkiを選択し、KαからDkinが最も小さいkiを除いたキーワード候補リストをKβとする。これによって、他のキーワードも含む、キーワードの重なりの割合が最も大きいキーワード候補を選択することができる。その後、ステップS68へ進み、Kβ中のどのキーワードも含まない単語の数UMKβを調べて、ステップS69へ進む。ステップS69では、UMKβとキーワードリストKβの数Num(Kβ)の合計が最大同時待ち受け可能単語数MaxRec以下であるか否かを判断する。
【0058】
UMKβとキーワードリストKβの数Num(Kβ)の合計が最大同時待ち受け可能単語数MaxRec以下である場合には、ステップS70へ進み、キーワードリストKαからkiを削除して、ステップS61へ戻る。一方、UMKβとキーワードリストKβの数Num(Kβ)の合計が最大同時待ち受け可能単語数MaxRecより大きい場合には、キーワードkiはキーワードリストから削除しないで、Kαをキーワードリストとする。その後、図4に示す処理に復帰する。
【0059】
以上説明した本実施の形態によれば、以下のような作用効果を得ることができる。
(1)音声認識用辞書・文法からキーワードを選択して待ち受け単語とするようにしたので、より多くの認識対象語句をカバーし、より検出しやすいキーワードを設定することができる。このため、どの認識対象語句が発話されてもキーワードを検出しやすくすることができる。
【0060】
(2)各認識対象単語に共通する音響的特長をキーワードとするようにした。これによって、キーワードは分類上のカテゴリや地名と関係なく、音響的な特徴のみを使用して設定されるため、分類上のカテゴリ名や地名が音響的な特徴と異なる単語であっても認識することができる。
【0061】
(3)キーワード文法とキーワード外文法とを待ち受け単語として音声認識を行うようにした。これによって、キーワードを持たない語句もキーワードと並列に認識することができ、キーワードを持たない語句の単独発話であっても認識することができる。
【0062】
(4)キーワードを検出した場合には、検出したキーワードを含む認識対象語句全てを認識対象として再認識するようにした。これによって、分類上のカテゴリ名や県名と、語句内に含まれるキーワードが一致しない語句であっても認識することができる。
【0063】
(5)初回認識の結果得られるN−best中にキーワードが含まれている場合には、再認識を行い、再認識処理の結果、最も信頼度が高かったキーワードの尤度と、初回認識時にキーワード外文法によって認識された最も信頼度の高い単語の尤度とを比較し、尤度が高い方を最終的な発話理解結果として選択するようにした。これによって、キーワードを検出した場合にのみ、キーワードを含む単語を受理する文法を使った再認識の結果の尤度と、キーワードを持たない単語の認識結果の尤度を比較するため、認識結果の尤度の出方が異なるキーワード認識の尤度と単語認識の尤度とを比較することを避けることができ、より正確な尤度比較が可能となる。
【0064】
(6)モーラ単位で区切った音素列をキーワードとするようにした。これによって、ひとつ以上のモーラのつながりであれば、意味をなさなくともキーワードとすることができ、より検出しやすいキーワードを選択することができる。また、音素単位、音節単位、または単語単位で認識対象単語を区切ってキーワードと設定してもよいこととした。これにより、音素単位で区切った場合には、ひとつ以上の音素のつながりであれば、意味をなさなくともキーワードとすることができるので、より検出しやすいキーワードを選択することができる。また、音節単位で区切った場合には、ひとつ以上の音節のつながりであれば、意味をなさなくともキーワードとすることができるので、より検出しやすいキーワードを選択することができる。また、単語単位で区切った場合には、意味を持つ単語がキーワードとなるので、これを手がかりに話題を推測することができる。
【0065】
(7)キーワード選択処理においては、各キーワードを含む単語の数が、同時認識可能な範囲でなるべく多くなることをキーワードの選択基準とするようにした。これによって、ひとつひとつのキーワードが多くの単語に含まれるようにキーワードを選択することができるため、少ないキーワード数で多くの単語をカバーすることができる。また、キーワードを含む単語の数が、同時に待ち受けられる単語数内であるため、キーワードが検出された後、キーワードを含む単語を受理する文法に切り替えて、一度の再認識で認識処理を終えることができる。さらにこれに加えて、キーワードを含まない認識対象語句とキーワードを併せた数が同時認識可能な範囲に納まることをキーワードの選択基準とするようにした。これによって、キーワードを含まない単語の数は全体として少なくなるので、キーワードと平行して認識するキーワード外文法の数が減り、キーワードの認識率を向上することができる。
【0066】
(8)モーラ数の多い音素列を優先してキーワードとするようにた。これによって、認識対象のモーラ数は多い程音声認識率は高くなることを加味して、より認識しやすいキーワードを優先することができ、全体としてキーワードの検出率が高くなり、最終的な認識率も高くなる。また、認識されやすい音素を含むキーワードを優先してキーワードに設定したり、単語中で認識しやすい位置に存在するキーワードを優先して設定するようにした。これによって、全体としてキーワードの検出率が高くなり、最終的な認識率も高くなる。
【0067】
(9)キーワード選択処理を行った後、キーワード再整理処理を実行して重なりが大きいキーワード同士の場合はどちらか一方を削除するようにして、ひとつの単語に含まれるキーワードの数を1に近くするようにした。これによって、複数のキーワードを認識した後に各キーワードを含む単語を受理する文法に切り替えて再認識する際に、各キーワードを含む単語を受理する文法内の単語間に重複がなくなる。
【0068】
(10)キーワードを含む単語の数が同時待ち受け可能な範囲を超えてしまった場合には、キーワードを長くすることで、キーワードを含む単語の数を減らすようにした。これによって、キーワードが検出された後、文法を切り替えて一度の再認識で認識処理を終えることができる。
【0069】
(11)キーワード同士は音響的になるべく遠いもの同士を選択するようにした。これによって、あるキーワードを含む単語が発話された場合に、他のキーワードが誤って認識される可能性が少なくなり、キーワード同士の誤認識を避けることができる。
―変形例―
なお、上述した実施の形態の音声認識装置は、以下のように変形することもできる。
(1)上述した実施の形態では、音声認識を行うに当たっては、初回認識時にキーワードとキーワードを含まない単語の両方が認識結果の候補とされた場合、すなわちN−best中にキーワードが含まれている場合には、キーワードの中で最も信頼度が高いものに関しては必ず再認識を行なうこととした。しかしながら、キーワードの信頼度が、キーワード外文法で認識した結果の信頼度と比較して明らかに低い場合には、再認識を行なわず、キーワード外文法で認識した結果を最終的な発話理解結果としてもよい。これによって、キーワードとキーワードを含まない単語の両方が認識結果候補として得られた場合には、一般的にキーワード認識よりも認識尤度が低くなりがちな認識対象語句そのものの認識であるキーワードを含まない単語を認識結果とすることができる。
【0070】
(2)上述した実施の形態では、N−best中にキーワードが複数現れた場合に最も信頼度が高いキーワードに対して再認識を行なう例について説明した。しかしながら、認識された全てのキーワードに関して再認識処理を行なって、その結果を比較するようにしてもよい。これによって、キーワードの認識結果にかかわらず、単語認識結果によってのみ最終認識結果が決まるため、認識結果がキーワードごとの検出されやすさの差に左右されることなく、正しい結果を選択することができる。また、尤度が高い上位N個のキーワードのみに関して再認識処理を行なってもよい。これによって、認識結果がキーワードごとの検出されやすさの差に左右されにくくしつつ、再認識対象となる単語の数を抑えることができる。
【0071】
また、信頼度が一定値以上のキーワードに関してのみ再認識処理を行なってもよい。これによって、キーワードの認識の結果、キーワードが発話された可能性が高いもののみ文法を切り替えて再認識することとなるため、発話された可能性が高いものは全て再認識をしながらも、再認識対象となる単語の数を抑えることができる。さらに、再認識処理を一度にメモリ上に読み込める辞書の範囲で行なうために、各キーワードを含む単語の数の合計が同時認識可能な範囲となるようにキーワードを選択して再認識処理を行なってもよい。これによって、複数のキーワードに対してそれぞれが発話された可能性を残しつつも、再認識対象となる単語数を同時待ち受け可能な範囲に抑えることができる。
【0072】
(3)上述した実施の形態では、音声認識装置100は車両に搭載されたナビゲーション装置に実装される例について説明した。このようなカーナビゲーション装置100においては、種々の情報を格納したディスク151の内容が頻繁に更新される可能性がある。このような場合には、図8に示すように、ディスク151に記録されている情報をサーバ200上に置き、当該サーバ200と音声認識装置100とを所定の通信回線で結ぶ。そして、音声認識装置100は、通信装置180を介してサーバ200から情報を取得するような音声認識システムとしてもよい。これによって、音声認識用辞書・文法が頻繁に更新される場合でも、サーバ200上のデータのみを更新すればよいため、データのメンテナンス性が向上する。
【0073】
この場合、サーバ200上の音声認識用辞書・文法に含まれる音声認識対象語句の一部が更新された場合には、クライアントは更新された認識対象語句のみを受け取って、クライアント側でキーワードを再設定するようにする。すなわち、更新された認識対象語句に基づいてキーワードを再選択するようにする。例えば、市区町村合併に伴い、新しい市区町村名を含む施設名が認識対象語句として新規に複数登録された場合に、この市区町村名を新たなキーワードとして登録するようにすればよい。
【0074】
反対に、音声認識用辞書・文法の更新によってあるキーワードを含む単語の数が一定値を下回った場合にはこのキーワードをキーワード文法から外すようにすれば、データベース更新に伴うキーワード数の増加によってキーワード検出率が低下するのを防ぐことができる。なお、このときには、各キーワードを含む認識対象語句の数はあらかじめクライアント側に保持しておく必要がある。
【0075】
さらに、キーワードを再選択した結果、再選択したキーワードが示す情報が新しい情報に変化した場合には、キーワード文法に登録されている古い情報を削除する。例えば、市区町村名の変更があり、かつ変更前の市区町村名を現す音素列がキーワードとしてキーワード文法に登録されている場合には、この市区町村名を現す音素列をキーワード文法から外すようにする。また、企業同士の合併によって、多くの施設名が、同一施設名の中に同一の組み合わせで複数のキーワードをもつ施設名に変更された場合は、どちらか一方のキーワードを削除するようにする。例えば、A社とB社が合併して、A&B社となり、チェーン店A及びチェーン店Bは全てA&Bの名に登録しなおされた場合は、キーワードAのみを残してキーワードBを削除してもよい。これによって、データベースの更新によってキーワードが増えすぎることを防止できる。また、音声認識用辞書・文法に含まれる認識対象語句の部分的な変更にはキーワードの部分更新によって対応することができる。
【0076】
(4)上述した実施の形態では、図4に示したキーワード選択処理を音声認識装置100で実行する例について説明した。しかしながら、キーワード選択処理を実行するためのキーワード選択装置上で図4に示した処理を実行するようにし、音声認識装置100は、当該キーワード選択装置で選択したキーワードを読み込んで音声認識処理を行うようにしてもよい。また、このキーワード選択装置は、上記変形例(3)と同様に音声認識用辞書・文法を記録したサーバと接続してキーワード選択システムとして適用することも可能である。
【0077】
なお、本発明の特徴的な機能を損なわない限り、本発明は、上述した実施の形態における構成に何ら限定されない。
【0078】
特許請求の範囲の構成要素と実施の形態との対応関係について説明する。マイク130は音声入力手段に、制御装置110は取得手段に、音声認識部112はキーワード選択手段、および削除手段に相当する。なお、以上の説明はあくまでも一例であり、発明を解釈する際、上記の実施形態の記載事項と特許請求の範囲の記載事項の対応関係に何ら限定も拘束もされない。
【図面の簡単な説明】
【0079】
【図1】音声認識装置の一実施の形態の構成を示すブロック図である。
【図2】音声対話処理の流れを示すフローチャート図である。
【図3】音声対話処理の具体例を示す図である。
【図4】キーワード選択処理の流れを示すフローチャート図である。
【図5】キーワード候補選択処理の流れを示すフローチャート図である。
【図6】キーワードの候補選択方法の具体例について説明する。
【図7】キーワード再整理処理の流れを示すフローチャート図である。
【図8】音声認識システムの一実施の形態の構成を示すブロック図である。
【符号の説明】
【0080】
100 ナビゲーション装置
110 制御装置
111 入力制御部
112 音声認識部
113 理解結果生成部
114 対話制御部
115 GUI表示制御部
116 声合成部
120 音声認識開始スイッチ
130 マイク
140 メモリ
141 音声認識用辞書・文法
142 発話理解結果
150 ディスク読み取り装置
151 ディスク
160 モニタ
170 スピーカ
180 通信装置
200 サーバ

【特許請求の範囲】
【請求項1】
音声認識用辞書に記録された音声認識対象単語の中から選択したキーワードを用いて、音声入力手段を介して入力された発話音声を認識する音声認識装置で使用するキーワード選択方法であって、
前記音声認識対象単語の音響的な共通部分を前記キーワードとして選択することを特徴とするキーワード選択方法。
【請求項2】
請求項1に記載のキーワード選択方法において、
前記キーワードは、少なくとも1つ以上の音節からなる語、少なくとも1つ以上のモーラからなる語、少なくとも1つ以上の音素からなる語、または単語であることを特徴とするキーワード選択方法。
【請求項3】
請求項1または2に記載のキーワード選択方法において、
前記キーワードは、多くの前記音声認識対象単語に含まれている語を優先して選択することを特徴とするキーワード選択方法。
【請求項4】
請求項2に記載のキーワード選択方法において、
前記キーワードは、モーラ数の多い語を優先して選択することを特徴とするキーワード選択方法。
【請求項5】
請求項2に記載のキーワード選択方法において、
前記キーワードは、音声認識率の高い語を優先して選択することを特徴とするキーワード選択方法。
【請求項6】
請求項2に記載のキーワード選択方法において、
前記キーワードは、前記音声認識対象単語内の検出率が高い位置に含まれる音素列を優先して選択することを特徴とするキーワード選択方法。
【請求項7】
請求項1または2に記載のキーワード選択方法において、
前記キーワードは、前記音声認識対象単語内に含まれるキーワードの数が1に近い語を優先して選択することを特徴とするキーワード選択方法。
【請求項8】
請求項1〜7のいずれか一項に記載のキーワード選択方法において、
前記キーワードは、前記音声認識用辞書から読み込む前記キーワードを含む前記音声認識対象単語の数が、前記音声認識装置における音声認識時の同時認識可能な単語数以内となるように選択することを特徴とするキーワード選択方法。
【請求項9】
請求項8に記載のキーワード選択方法において、
前記音声認識用辞書から読み込む前記キーワードを含む前記音声認識対象単語の数が前記音声認識時の同時認識可能な単語数より多い場合には、前記キーワードの長さを長くして、前記音声認識用辞書から読み込む前記キーワードを含む前記音声認識対象単語の数を減少させて、前記キーワードを含む前記音声認識対象単語の数が前記音声認識時の同時認識可能な単語数以内になるようにすることを特徴とするキーワード選択方法。
【請求項10】
請求項1〜9のいずれか一項に記載のキーワード選択方法において、
前記キーワードは、各キーワードが音響的に遠いものとなるように選択することを特徴とするキーワード選択方法。
【請求項11】
音声認識用辞書に記録された音声認識対象単語の中から、請求項1〜10のいずれか一項に記載のキーワード選択方法を使用して、前記音声認識対象単語の音響的な共通部分をキーワードとして選択し、
前記音声認識対象単語の中から、前記キーワードおよび前記キーワードを含まない音声認識対象単語を音声認識実行時の待ち受け単語として読み込み、
前記待ち受け単語と、前記発話音声とをマッチング処理して前記発話音声を認識することを特徴とする音声認識方法。
【請求項12】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、前記キーワードが音声認識結果の候補として認識された場合には、認識されたキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。
【請求項13】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、前記キーワードと前記キーワードを含まない音声認識対象単語のそれぞれが音声認識結果の候補として認識された場合には、認識尤度が高いものを音声認識結果とすることを特徴とする音声認識方法。
【請求項14】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、前記キーワードと前記キーワードを含まない音声認識対象単語のそれぞれが音声認識結果の候補として認識された場合には、認識されたキーワードを含む音声認識対象単語を待ち受け単語として再マッチング処理を行い、前記キーワードを含む音声認識対象単語の認識尤度と、前記キーワードを含まない音声認識対象単語の認識尤度とを比較して、前記認識尤度が高い方を音声認識結果とすることを特徴とする音声認識方法。
【請求項15】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識された複数のキーワードの含む全ての音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。
【請求項16】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識された複数のキーワードのうち、認識尤度が高いものから所定数のキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。
【請求項17】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識された複数のキーワードの音声認識に対する信頼度を算出し、前記信頼度が所定値以上のキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。
【請求項18】
請求項11に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識尤度が高いものから、認識された各キーワードを含む単語の総和が所定数以下となるように設定した数のキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。
【請求項19】
音声認識対象単語を記録した音声認識用辞書を有するサーバ、および
前記サーバから前記音声認識対象単語を取得する取得手段と、
請求項1〜10のいずれか一項に記載のキーワード選択方法を実行して、前記音声認識対象単語の音響的な共通部分をキーワードとして選択するキーワード選択手段とを備えるキーワード選択装置を所定の通信回線で接続したキーワード選択システム。
【請求項20】
請求項19に記載のキーワード選択システムにおいて、
前記サーバ側で前記音声認識対象単語が更新された場合には、前記取得手段は、前記サーバから更新された音声認識対象単語を再取得し、
前記キーワード選択手段は、再取得した音声認識対象単語に基づいて前記キーワードを再選択することを特徴とするキーワード選択システム。
【請求項21】
請求項20に記載のキーワード選択システムにおいて、
前記キーワード選択装置は、前記キーワード選択手段によって前記キーワードを再選択した結果、前記音声認識対象単語内に存在する再選択したキーワードを含む単語が所定数以下になった場合には、前記待ち受け単語の中から再選択したキーワードを削除する削除手段をさらに備えることを特徴とするキーワード選択システム。
【請求項22】
請求項20に記載のキーワード選択システムにおいて、
前記キーワード選択装置は、前記キーワード選択手段によって前記キーワードを再選択した結果、前記再選択したキーワードが示す情報が新しい情報に変化した場合には、前記待ち受け単語の中から再選択したキーワードが示す古い情報を削除する削除手段をさらに備えることを特徴とするキーワード選択システム。
【請求項23】
請求項20に記載のキーワード選択システムにおいて、
前記キーワード選択装置は、前記キーワード選択手段によって前記キーワードを再選択した結果、再選択したキーワードを含む音声認識対象単語内に、同一の組み合わせで同一のキーワードが多く含まれるようになった場合には、前記待ち受け単語の中から前記単語内に含まれるいずれかのキーワードを削除する削除手段をさらに備えることを特徴とするキーワード選択システム。
【請求項24】
請求項19〜23のいずれか一項に記載のキーワード選択装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2007−322758(P2007−322758A)
【公開日】平成19年12月13日(2007.12.13)
【国際特許分類】
【出願番号】特願2006−153071(P2006−153071)
【出願日】平成18年6月1日(2006.6.1)
【出願人】(000003997)日産自動車株式会社 (16,386)
【Fターム(参考)】