説明

音声評価システム

【課題】ナビゲーションシステムが発生する音声フレーズの適否を自動的に評価可能な音声評価システムを提供すること。
【解決手段】音声評価ツール50から、発話フレーズを示す音声信号をナビゲーションシステムに入力することにより、トークバックフレーズを発生させる。このトークバックフレーズの音声信号を入力して、ナビゲーションシステムが発したトークバックフレーズを認識する。この認識トークバックフレーズが、発話フレーズに関連付けて記憶されている記憶トークバックフレーズと一致するか否かに基づいて、ナビゲーションシステムのトークバック音声フレーズの適否を評価する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ナビゲーションシステムが発生する音声フレーズを評価する音声評価システムに関する。
【背景技術】
【0002】
例えば、車両用ナビゲーションシステムにおいては、その操作によって車両の運転操作に支障をきたすことがないようにすることが好ましい。このような理由から、車両用ナビゲーションシステムの操作手段として音声入力が利用される場合がある。この場合、ユーザが意図した通りの音声フレーズが車両用ナビゲーションシステムに認識されたかを確認できるようにするために、一般的に、車両用ナビゲーションシステムは、認識した音声フレーズに対応するトークバックフレーズを発生する。
【0003】
また、車両用ナビゲーションシステムは、通常、目的地への経路案内機能を備えている。この経路案内機能の実行時には、車両が進路を変更すべき交差点や分岐点等の手前で、その交差点や分岐点等の拡大図を表示するとともに、案内音声フレーズにより車両が進むべき進路を報知する。
【発明の開示】
【発明が解決しようとする課題】
【0004】
このように、ナビゲーションシステムは各種の音声フレーズを発生するが、その音声フレーズに誤りがあると、音声入力による操作時にユーザを混乱させたり、適切な経路案内を行うことが困難になる。
【0005】
そのため、ナビゲーションシステムが、各状況において音声フレーズを正しく発生するか否かを確認することが好ましい。しかしながら、ナビゲーションシステムが発生する音声フレーズの数は膨大であったり、使用される言語によっては、検査する者が音声フレーズを理解できないなどの理由から、その音声フレーズの確認作業は困難なものとなる。
【0006】
本発明は、上記の点に鑑みてなされたもので、ナビゲーションシステムが発生する音声フレーズの適否を自動的に評価可能な音声評価システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するために、請求項1に記載の音声評価システムは、
ナビゲーションシステムに与える動作信号を生成する動作信号生成手段と、
動作信号生成手段によって生成された動作信号がナビゲーションシステムに与えられたとき、その動作信号に応答してナビゲーションシステムが発生した音声フレーズを示す音声信号を取得する取得手段と、
取得手段によって取得された音声信号に基づいて、ナビゲーションシステムが発生した音声フレーズを認識する認識手段と、
動作信号に応答してナビゲーションシステムが発生すべき音声フレーズを記憶する記憶手段と、
認識手段によって認識された音声フレーズが、記憶手段に記憶された音声フレーズに一致しているか否かを判定する判定手段とを備えることを特徴とする。
【0008】
上述した構成により、動作信号によって、ナビゲーションシステムが音声フレーズを発する各種の状況を作り出すことができる。そして、ナビゲーションシステムが発生した音声フレーズが、動作信号に応答してナビゲーションシステムが発生すべき音声フレーズと一致しているか否かの判定を行うことにより、ナビゲーションシステムが発生した音声フレーズの適否を判断することが可能となる。
【0009】
請求項2に記載したように、ナビゲーションシステムは、音声操作機能を備え、動作信号は、音声操作を実行するためにナビゲーションシステムに入力される発話フレーズを示す音声信号であり、ナビゲーションシステムが発生する音声フレーズは、発話フレーズに対するトークバックフレーズとすることができる。これにより、ナビゲーションシステムが発生するトークバックフレーズの適否を判断することが可能になる。なお、トークバックフレーズとは、ナビゲーションシステムが認識した音声フレーズに基づいて実行する処理による動作や機能を報知するフレーズ、又は認識した音声と同一のフレーズをいう。
【0010】
請求項3に記載したように、記憶手段は、発話フレーズと、その発話フレーズに対して発せられるべきトークバックフレーズとを関連付けて記憶し、動作信号生成手段は、記憶手段に記憶された発話フレーズに基づいて、その発話フレーズを示す音声信号を生成することが好ましい。これにより、期待されるトークバックフレーズに適切に対応した動作信号(発話フレーズに対応する音声信号)をナビゲーションシステムに与えることができる。
【0011】
請求項4に記載したように、判定手段による判定結果は、記憶手段において、発話フレーズ及びトークバックフレーズに関連付けて記憶されることが好ましい。これにより、各トークバックフレーズについての正確な判定結果を得ることができる。
【0012】
請求項5に記載したように、表示装置と、この表示装置に、認識手段によって認識された音声フレーズに対応する文字を表示させる表示制御手段とを備えるように構成しても良い。これにより、ナビゲーションシステムが発生した音声フレーズを目視にて確認することが可能になる。
【0013】
請求項6に記載したように、ナビゲーションシステムは、設定された目的地までの経路を案内する経路案内機能を有し、動作信号は、ナビゲーションシステムを経路上に沿って擬似的に移動させるため擬似信号であり、ナビゲーションシステムが発生する音声フレーズは、経路に従って進行するための案内音声フレーズとすることができる。これにより、ナビゲーションシステムが発生する案内音声フレーズの適否を判断することが可能になる。
【0014】
請求項7に記載したように、記憶手段は、ナビゲーションシステムが経路上を移動するに従ってナビゲーションシステムから発せられるべき複数の案内音声フレーズ及びその順序を記憶し、判定手段は、認識手段によって認識された音声フレーズが、記憶手段に記憶された案内音声フレーズに一致しているか否かの判定に加えて、記憶手段に記憶された順序に合致しているかを判定することが好ましい。例えば、ナビゲーションシステムにおいては、1つの案内対象地点(交差点や分岐点)に対して、複数回の案内音声を出力する場合がある。このとき、それぞれの案内音声フレーズは、案内対象地点までの距離を含むことが多い。このため、案内音声フレーズは、その内容ばかりでなく、ナビゲーションシステムから発生される順序も重要であり、上述した構成により、その順序が正しいか否かも判断することが可能になる。
【0015】
請求項8に記載したように、判定手段による判定結果は、記憶手段において、対応する案内音声フレーズに関連付けて記憶されることが好ましい。これにより、各案内音声フレーズについての正確な判定結果を得ることができる。
【0016】
請求項9に記載したように、表示装置と、この表示装置に、認識手段によって認識された音声フレーズに対応する文字を表示させる表示制御手段とを備えるように構成しても良い。これにより、ナビゲーションシステムが発生した音声フレーズを目視にて確認することが可能になる。
【発明を実施するための最良の形態】
【0017】
以下、本発明の実施形態について説明する。図1は、本実施形態における音声評価システムの全体構成を示す構成図である。
【0018】
図1において、ディスプレイ10、ナビゲーション本体20、オーディオ部30、及びスピーカ40は、車両においてナビゲーションシステムを構成するもので、本実施形態による音声評価システムの評価対象となるものである。なお、これらのナビゲーションシステムの構成要素は、実際に車両に搭載されたものではない。
【0019】
ディスプレイ10は、車両の現在位置やその周辺地図などを表示するためのもので、例えば液晶ディスプレイによって構成される。
【0020】
ナビゲーション本体20は、各種のセンサ信号に基づいて、車両の現在位置を検出し、その検出した現在位置とともに道路地図を表示する地図表示機能や、目的地が設定されたときに、その目的地に達する案内経路を探索し、その探索した案内経路において、車両が進路を変更すべき交差点や分岐点等の手前で、その交差点や分岐点等の拡大図を表示するとともに、案内音声フレーズにより車両が進むべき進路を報知する経路案内機能などの各種のナビゲーション機能を実行するものである。
【0021】
また、このナビゲーション本体20は、音声によって各種の操作を行うことができるように、音声操作機能も備えている。すなわち、ナビゲーション本体20は、入力された音声を認識する音声認識処理、認識した音声に対応する処理を実行する実行処理、及び認識された音声が意図した通りのものかをユーザが確認できるように、トークバック音声フレーズを発生する音声発生処理等の、音声操作機能に必要な処理も実行する。なお、トークバック音声フレーズとは、ナビゲーション本体20が認識した音声に基づいて実行する処理による動作や機能を報知するフレーズ、又は認識した音声と同一のフレーズである。
【0022】
オーディオ部30は、例えば、CDプレーヤやDVDプレーヤ等のオーディオ機器を備えるとともに、そのオーディオ機器からのオーディオ信号とナビゲーション本体20から車両ハーネスを介して送信される音声信号とをリレー等によって切り換えつつ、車両スピーカ40に出力する。なお、オーディオ部30からのオーディオ信号をナビゲーション本体20に取り込んで、ナビゲーション本体20において、いずれの信号を車両スピーカ40に出力するかを切り換えるように構成しても良い。
【0023】
音声評価ツール50は、上述した構成を有するナビゲーションシステムが発生するトークバック音声フレーズや案内音声フレーズの適否を評価するものであり、例えばパーソナルコンピュータを用いることができる。この音声評価ツール50は、マイク端子及びスピーカ端子を備え、そのマイク端子は、オーディオ部30のスピーカ出力に接続され、スピーカ端子は、ナビゲーション本体20のマイク端子に接続される。これにより、ナビゲーションシステムが発生する音声フレーズに対応する音声信号を正確に入力するとともに、ナビゲーションシステムに対して、音声操作を指示する音声を入力することが可能になる。
【0024】
なお、ナビゲーションシステムが発生する音声フレーズのための音声信号の出力仕様と、音声評価ツールのマイク入力仕様とに相違がある場合(例えば、両者のダイナミックレンジに相違がある場合)、信号レベルを変換するための中継器等を介して接続する必要が生じる。また、案内音声の評価時には、ナビゲーションシステムに音声操作のための音声を入力する必要はないので、音声評価ツール50のスピーカ端子とナビゲーション本体20のマイク端子との接続は不要である。
【0025】
車両ベンチ信号発生器60は、車両ハーネスを介してナビゲーションシステムに接続され、実車に搭載された場合と同等の信号を、車両ハーネスを介して、各機器に供給する。例えば、車両ベンチ信号発生器60は、バッテリ電圧やグランド等の電源系の信号の他、車速信号、後退信号、GPSシュミレータ信号などの車両が移動したときに生じる信号を供給する。これにより、ナビゲーションシステムにおいて、所定の出発地から所定の目的地に達する案内経路が設定されているときに、その設定された案内経路に従って車両が移動しているように、ナビゲーションシステムに認識させることができる。
【0026】
次に、音声評価ツール50の構成を、機能ブロックとして、図2に基づいて詳細に説明する。図2に示すように、スピーカ端子51には、そのスピーカ端子51から音声操作を指示する音声フレーズに対応する発話信号を出力する発話制御部53が接続されている。この発話制御部53は、音声フレーズ評価シート記憶部55から、所定の順序で、発話すべき音声フレーズに対応するID情報を読み込む。
【0027】
ここで、音声フレーズ評価シート記憶部55が記憶するトークバックフレーズの評価シートの一例を図3に示す。トークバックフレーズ評価シートは、図3に示すように、発話する音声フレーズ(発話フレーズ)、その発話フレーズに対応する音声ID情報、該当する発話フレーズをナビゲーションシステムに入力したときに、ナビゲーションシステムが発すべきトークバックフレーズ、及びトークバックフレーズに対応して音声評価ツール50の画面に表示させるためのテキスト文字をそれぞれ記憶している。さらに、トークバックフレーズの評価シートには、ナビゲーションシステムが発したトークバックフレーズの適否の判定結果を記憶するための領域が設けられている。
【0028】
上述した発話制御部55は、トークバックフレーズ評価シートから、各発話フレーズに対応する音声ID情報を読み込むと、その音声ID情報に対応する音声ファイルを発話辞書54から検索する。すなわち、発話辞書54は、各音声ID情報と、音声ファイルとしての、各音声ID情報に対応する音声フレーズとを関連付けて記憶したものである。発話制御部55において、検索した音声ファイルを再生することにより、所望の発話フレーズに対応する音声信号を出力することができる。
【0029】
一方、マイク端子52には、音声認識部56が接続されている。従って、ナビゲーションシステムからマイク端子52に入力された音声信号は、音声認識部56に送られる。音声認識部56は、この入力された音声信号の認識処理を行う。具体的には、音声認識部56は、入力された音声信号を音素データに分解するとともに、各音素データに関して、トークバック辞書に登録している各音素データと比較し、最も一致度の高い音素データを抽出する。
【0030】
ここで、トークバック辞書には、ナビゲーションシステムが、トークバックフレーズとして発生する可能性があるフレーズの各音素データと、この音素データに対応する音素フレーズとが関連付けて記憶されている。
【0031】
音声認識部56は、抽出した音素データに対応する音素フレーズを組み合わせて、認識したトークバックフレーズを形成し、その認識結果を、テキスト表示部58及び判定・結果表示部59に送信する。
【0032】
テキスト表示部58は、音声認識部56の認識結果であるトークバックフレーズに基づいて、音声フレーズ評価シートを参照して、その音声フレーズ評価シートに記憶されているトークバックフレーズに対応するテキスト文字を、音声評価ツール50の画面に表示させる。これにより、評価を行う者が、ナビゲーションシステムが発生したトークバックフレーズを目視にて確認することが可能になる。
【0033】
また、判定・結果表示部59は、音声認識部56にて認識したトークバックフレーズが、評価シートにおいて、発話した発話フレーズに関連付けて記憶されているトークバックフレーズと一致するか否かを判定する。そして、その判定結果(例えば「OK」と「NG」、或いは「○」と「×」)を、音声評価ツール50の画面に表示するとともに、音声フレーズ評価シートにおいて、発話された発話フレーズ及びその発話フレーズに対応するトークバックフレーズに関連付けて保存する。これにより、各トークバックフレーズについての正確な判定結果を得ることができる。
【0034】
以上が、音声操作のための音声信号が入力されたときに、ナビゲーションシステムが発するトークバックフレーズの適否を評価するための音声評価ツール50の構成である。
【0035】
次に、ナビゲーションシステムが経路案内機能を実行する際に発する案内音声を評価するための構成について説明する。案内音声フレーズを評価するための音声評価ツール50の構成も、基本的には上述した構成と同様である。ただし、案内音声を評価する際には、音声評価ツール50が何らかの音声フレーズを発する必要はないので、発話制御部53等、発話を行うための構成は不要となる。
【0036】
従って、図4に示すように、音声フレーズ評価シート記憶部55が記憶する案内音声フレーズの評価シートにも、発話フレーズは記憶されず、車両が所定の案内経路を走行するときに、ナビゲーションシステムが発生すべき案内音声フレーズが、その発生順序に従って記憶され、また、その案内音声フレーズに対応するテキスト文字が記憶されている。
【0037】
なお、ナビゲーションシステムにおいては、車両が案内経路に沿って走行したとき、案内音声フレーズの評価シートに記憶された案内音声フレーズが、順番にナビゲーションシステムから発せられる案内経路が事前に設定されている。そして、案内音声フレーズの評価時には、車両ベンチ信号発生器が発生する各種のベンチ信号によって、あたかもその案内経路に沿って車両が走行しているように、ナビゲーションシステムに認識させるのである。
【0038】
次に、上述した構成を備える音声評価システムにおいて、トークバックフレーズの適否を評価するための処理、及び案内音声フレーズの適否を評価するための処理を、それぞれフローチャートを用いて説明する。
【0039】
図5は、トークバックフレーズの適否を評価するための処理を示すフローチャートである。まず、ステップS100において、発話すべき発話フレーズの音声IDを選択する。この選択は、例えば、トークバックフレーズ評価シートに記憶されている順序で、音声IDを選ぶことでなされることができる。ステップS110では、選択した音声IDに対応する音声ファイルを発話辞書54から抽出して再生する。これにより、ナビゲーションシステムに、発話フレーズに対応する音声信号を与えることができる。
【0040】
ステップS120では、ナビゲーションシステムがトークバックフレーズを発生して、その音声信号がマイク端子52に入力されたか否かを判定する。ナビゲーションシステムからトークバックフレーズの音声信号が入力されていないと判定されると、それが入力されるまで待機する。そして、トークバックフレーズの音声信号が入力されたと判定されると、ステップS130に進む。
【0041】
ステップS130では、入力されたトークバックフレーズの音声信号を、音素データに分解する。そして、ステップS140では、分解された各音素データに関して、最も一致度の高い音素データをトークバック辞書において検索し、検索した音素データの音素フレーズから、認識トークバックフレーズを形成する。ステップS150では、トークバックフレーズ評価シートを参照して、認識したトークバックフレーズに対応するテキスト文字を表示する。
【0042】
ステップS160では、認識トークバックフレーズが、トークバックフレーズ評価シートにおいて、発話した発話フレーズに関連付けて記憶された記憶トークバックフレーズと同一か否かを判定する。このステップS160の判定処理において同一であると判定されると、ステップS170に進み、判定OKとの判断がなされ、その判断結果が音声評価ツール50の画面に表示されるとともに、評価シートに保存される。一方、ステップS160において同一ではないと判定されると、ステップS180に進み、判定NGとの判断がなされ、その判断結果が、表示及び保存される。
【0043】
ステップS190では、全ての音声ファイルを再生したか、あるいは評価処理の中断が指示されたか否かを判定する。このステップS190の判定処理において、評価処理の中断が指示されておらず、かつまだ全ての音声ファイルを再生していないと判定されると、上記したステップS100からの処理を繰り返す。
【0044】
上述した処理を実行することにより、ナビゲーションシステムが発生するトークバックフレーズの適否を判断することが可能になる。
【0045】
次に、ナビゲーションシステムが発する案内音声フレーズの適否を評価するための処理について、図6のフローチャートを用いて説明する。まず、ステップS200では、車両ベンチ信号発生器60により、所定の車両ベンチ信号を発生させる。これにより、ナビゲーションシステムにおいて事前に設定されている案内経路に従って、車両が移動しているように、ナビゲーションシステムに認識させることができる。
【0046】
ステップS210では、ナビゲーションシステムが案内音声フレーズを発して、その音声信号がマイク端子52から入力されたか否かを判定する。ナビゲーションシステムから案内音声フレーズの音声信号が入力されていないと判定されると、それが入力されるまで待機する。そして、案内音声フレーズの音声信号が入力されたと判定されると、ステップS220に進む。
【0047】
ステップS220〜ステップS250の処理は、トークバックフレーズを案内音声フレーズと読みかえれば、上述したステップS130〜S160の処理とほぼ同一であるため説明を省略する。
【0048】
ステップS260では、案内音声の発生順序が正しいか否かを判定する。上述したように、案内音声フレーズ評価シートは、車両(ナビゲーションシステム)が案内経路上を移動するに従ってナビゲーションシステムから発せられるべき複数の案内音声フレーズを、発生順序に従って記憶している。このため、単に認識された案内音声フレーズが、評価シートに記憶された案内音声フレーズに一致しているか否かのステップS250の判定に加えて、その発生順序が正しいか否かをも判定することができる。例えば、ナビゲーションシステムにおいては、1つの案内対象地点(交差点や分岐点)に対して異なる距離において、それぞれの距離を含む案内音声を出力する場合などがある。このため、案内音声フレーズは、その内容ばかりでなく、ナビゲーションシステムから発生される順序も重要であるが、上述した判定処理によって、その発生順序が正しいか否かも判断することができる。
【0049】
なお、ステップS270〜S290の処理は、上述したステップS160〜S190の処理と、ほぼ同一であるため説明を省略する。
【0050】
上述した処理を実行することにより、ナビゲーションシステムが発生する案内音声フレーズの適否を判断することが可能になる。
【0051】
以上、本発明の好ましい実施形態について説明したが、本発明は、上述した実施形態になんら制限されることなく、本発明の主旨を逸脱しない範囲において、種々変形して実施することができる。
【0052】
例えば、上述した実施形態では、車両用ナビゲーションシステムを対象としたが、車両用以外のナビゲーションシステムを対象としても良い。
【図面の簡単な説明】
【0053】
【図1】実施形態における音声評価システムの全体構成を示す構成図である。
【図2】音声評価ツール50の構成を、機能ブロックとして示した構成図である。
【図3】トークバックフレーズの評価シートの一例を示す説明図である。
【図4】案内音声フレーズの評価シートの一例を示す説明図である。
【図5】トークバックフレーズの適否を評価するための処理を示すフローチャートである。
【図6】案内音声フレーズの適否を評価するための処理を示すフローチャートである。
【符号の説明】
【0054】
10 ディスプレイ
20 ナビゲーション本体
30 オーディオ部
40 車両スピーカ
50 音声評価ツール
60 車両ベンチ信号発生器

【特許請求の範囲】
【請求項1】
ナビゲーションシステムが発生する音声フレーズを評価する音声評価システムであって、
前記ナビゲーションシステムに与える動作信号を生成する動作信号生成手段と、
前記動作信号生成手段によって生成された動作信号が前記ナビゲーションシステムに与えられたとき、その動作信号に応答して前記ナビゲーションシステムが発生した音声フレーズを示す音声信号を取得する取得手段と、
前記取得手段によって取得された音声信号に基づいて、前記ナビゲーションシステムが発生した音声フレーズを認識する認識手段と、
前記動作信号に応答して前記ナビゲーションシステムが発生すべき音声フレーズを記憶する記憶手段と、
前記認識手段によって認識された音声フレーズが、前記記憶手段に記憶された音声フレーズに一致しているか否かを判定する判定手段とを備えることを特徴とする音声評価システム。
【請求項2】
前記ナビゲーションシステムは、音声操作機能を備え、
前記動作信号は、音声操作を実行するために前記ナビゲーションシステムに入力される発話フレーズを示す音声信号であり、
前記ナビゲーションシステムが発生する音声フレーズは、前記発話フレーズに対するトークバックフレーズであることを特徴とする請求項1に記載の音声評価システム。
【請求項3】
前記記憶手段は、前記発話フレーズと、その発話フレーズに対して発せられるべきトークバックフレーズとを関連付けて記憶し、前記動作信号生成手段は、前記記憶手段に記憶された発話フレーズに基づいて、その発話フレーズを示す音声信号を生成することを特徴とする請求項2に記載の音声評価システム。
【請求項4】
前記判定手段による判定結果は、前記記憶手段において、前記発話フレーズ及びトークバックフレーズに関連付けて記憶されることを特徴とする請求項3に記載の音声評価システム。
【請求項5】
表示装置と、
前記表示装置に、前記認識手段によって認識された音声フレーズに対応する文字を表示させる表示制御手段とを備えることを特徴とする請求項1乃至請求項4のいずれかに記載の音声評価システム。
【請求項6】
前記ナビゲーションシステムは、設定された目的地までの経路を案内する経路案内機能を有し、
前記動作信号は、前記ナビゲーションシステムを前記経路上に沿って擬似的に移動させるため擬似信号であり、
前記ナビゲーションシステムが発生する音声フレーズは、前記経路に従って進行するための案内音声フレーズであることを特徴とする請求項1に記載の音声評価システム。
【請求項7】
前記記憶手段は、前記ナビゲーションシステムが前記経路上を移動するに従って前記ナビゲーションシステムから発せられるべき複数の案内音声フレーズ及びその順序を記憶し、
前記判定手段は、認識手段によって認識された音声フレーズが、前記記憶手段に記憶された案内音声フレーズに一致しているか否かの判定に加えて、前記記憶手段に記憶された順序に合致しているかを判定することを特徴とする請求項6に記載の音声評価システム。
【請求項8】
前記判定手段による判定結果は、前記記憶手段において、対応する案内音声フレーズに関連付けて記憶されることを特徴とする請求項6又は請求項7に記載の音声評価システム。
【請求項9】
表示装置と、
前記表示装置に、前記認識手段によって認識された音声フレーズに対応する文字を表示させる表示制御手段とを備えることを特徴とする請求項6乃至請求項8のいずれかに記載の音声評価システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2007−58091(P2007−58091A)
【公開日】平成19年3月8日(2007.3.8)
【国際特許分類】
【出願番号】特願2005−246242(P2005−246242)
【出願日】平成17年8月26日(2005.8.26)
【出願人】(000004260)株式会社デンソー (27,639)
【Fターム(参考)】