説明

自動車の機能を指定するための音声ダイアログのサポート方法

本発明は、音声出力に加えて非音声信号が出力される、自動車用のボイスコントロールシステムによって達成される、自動車機能を操作するよう使用されるボイスコントロールのサポート方法に関する。ボイスコントロールシステムが、人と機械との間の通信用インターフェースを形成する。個人間の通信と比較した場合の前記システムの欠点は、ボイスコントロールの主要情報量とは別に、個人間の通信中に視覚的に通信される他方の当事者の状態についての追加情報が欠落していることである。本発明の目的は、ボイスコントロールシステムにおける前記欠点を克服することである。本発明によれば、これを達成するために、ボイスコントロールシステムの状態に基づいた非音声信号が音響信号としてユーザに出力される。本発明によるサポート方法は、運転者が同時に道路上の事象から気をそらすことなく、運転者によって受信される情報量が増加するので、自動車を案内し、それらの機能を操作するのに特に好適である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声出力に加えて非音声信号も出力される、自動車用のボイスコントロール用の制御システムによって自動車の機能を操作するサポート方法と、このサポート方法を行うためのボイスコントロール用の制御システムに関する。
【背景技術】
【0002】
音声制御により自動車機能を操作するための、多様なボイスコントロール制御システムが、知られている。これらは、運転中に押しボタンキーを操作する必要なしに、運転者が自動車内の多様な機能を容易に操作でき、運転者が道路上の事象から気をそらされることが少なくなる。
【0003】
このようなボイスコントロールシステムは、基本的に、以下の構成要素からなる:
・音声入力(「音声コマンド」)と音声パターンデータベース内に格納されている音声コマンドとを比較し、どのコマンドが話された可能性が最も高いかを決定する音声認識ユニット。
・ユーザプロンプティングに必要な音声コマンド及び信号音を出力し、適宜、認識された音声コマンドに応答する音声生成ユニット。
・音声入力が正しいかどうかを検査し、認識された音声コマンドに対応する動作又はアプリケーションを生じさせるために、対話を通じてユーザに案内する対話及び順序付けコントローラ。
・たとえば、オーディオ装置、ビデオ設備、空調システム、シート調整装置、電話、ナビゲーションシステム、ミラー調整装置、及び/又は、各種支援システムなどの、多様なハードウェア及びソフトウェアモジュールを構成するアプリケーションユニット。
【0004】
音声認識のための様々な方法が知られている。この結果、たとえば、定義された個々の単語が音声パターンデータベース内にコマンドとして格納されるので、これに対応する自動車の機能が、パターンを比較することによって割り当てられる。
【0005】
音声認識は、個々の音の認識に基づいており、いわゆる音素区分が音声パターンデータベース内に格納されており、音声信号から得られる特徴要因と音声認識に重要な音声信号に関する情報が、格納されたデータと比較される。
【0006】
音声認識を開示する方法が、特許文献1より知られており、音声出力は、非言語的な性質のグラフィック表示によってサポートされる。これらのグラフィック表示は、ユーザがより素早く情報を取り入れることができるようにするためのものであり、また、ユーザがこのようなシステムをより受け入れやすくするためのものでもある。これらのグラフィック表示は、音声出力に応じて出力されるので、たとえばボイスコントロールシステムが入力を予想すると待っている手の記号が表示され、音声入力が成功したことは、これに対応する表情の顔及び拍手の記号が表示され、警告の場合には、同様にこれに対応する表情の顔及び手を挙げている記号が表示される。
【0007】
このような、音声出力に視覚出力が付随する公知のボイスコントロール制御の方法は、自動車の運転者が、この視覚出力により道路上の事象から気をそらされる恐れがあるという欠点を有する。
【0008】
【特許文献1】独国特許発明第10008226C2号明細書
【発明の開示】
【発明が解決しようとする課題】
【0009】
本発明の目的は、運転者が一連の動作中に道路上の事象から気をそらすことなく、音声出力により運転者に伝えられる情報量がさらに増加する、冒頭で説明した方法を開発することである。さらなる目的は、このような方法を行うためのボイスコントロールシステムを提供することである。
【課題を解決するための手段】
【0010】
最初に述べた目的は、請求項1の特徴によって達成され、これにより、非音声信号は、ボイスコントロールシステムの状態に応じて音響信号として出力される。この結果、音声そのものである、音声ダイアログの主要情報要素に加えて、ボイスコントロールシステムの状態についての追加情報も伝えられる。この結果、ユーザは、音声ダイアログの二次要素により、システムが入力準備完了であるかどうか、現在作業命令を処理中であるかどうか、又は対話出力を中止したかどうかを認識することがより容易となる。対話の開始及び対話の終了も、このような非音声信号で特色付けられる。操作される種々の自動車の機能間の区別も、このような非音声信号で特色付けることが可能である。即ち、ユーザによって呼び出される機能には、特定の非音声信号が付随するので、車両の運転者は、これから、これに対応する内容を認識できる。これを基にして、いわゆる事前対応型メッセージ、即ちシステムにより自動的に出力される自発的なメッセージの生成を構築することができるので、ユーザは、これに対応するマーカから情報の性質を直ちに認識することが可能となる。
【0011】
ボイスコントロールシステムの状態として、音声入力段階、音声出力段階、入力された音声の処理段階が区別される。このため、これら区別に対応する時間窓が設定され、ボイスコントロールシステムの状態に同期しながら、それぞれに対応する非音声音響信号がオーディオ出力装置を介して出力される。
【0012】
本発明の1つの特に好ましい発展形態においては、特色付けられた非音声音響信号は、操作され得る自動車機能に応じて、つまりユーザによって呼び出された内容又はユーザによって選択された機能に応じて出力される。音声ダイアログのこのような構造により、自発的なメッセージとしてボイスコントロールシステムにより自動的に生成される、つまり音声ダイアログがアクティブでない場合にも、いわゆる事前対応型メッセージの使用が特に可能となる。特定の機能又は内容の特色付けと合わせて、ユーザは、付随する特徴的な信号を参照することによりメッセージの性質を認識することができる。
【0013】
たとえば、情報がこれに対応する音程及び/又は音域によって伝えられることにより、非音声音響信号をもちいて表示されたリスト内の現在のリスト要素の位置及び前記リストのエントリの総数をユーザに示すこともできる。このようにして、たとえばこのようなリスト内をナビゲートしている時に、全数に対する音響的な一致及び実際の要素の場所に対する一致から組み合せたものを再生することができる。
【0014】
本発明においては、特徴付けをしている非音声音響出力が、断続的な音響パターンとして又は連続的な音響パターンの形態として実現される。本願発明において音響パターンの変形として、音色又は楽器編成、音程又は音域、音量又は強弱、速度又はリズム、及び/又は1連の音又はメロディなどを用いることが可能である。
【0015】
第2に述べた目的は、請求項13の特徴によって達成され、これによれば、ボイスコントロールシステムに必要な機能群に加えて、多様な非音声信号が格納されているサウンドパターンデータベースが設けられ、この信号は、ボイスコントロールシステムの状態に応じて、音声特徴付けユニットによって選択され、出力され、及び/又は音声信号に混合される。この結果、この方法は、ハードウェアに多大な追加経費を使わずに、従来のボイスコントロールシステムに組み込まれる。請求項14及び15の特徴により、好ましい実施形態が実現される。
【発明を実施するための最良の形態】
【0016】
以下、図を参照しながら、例示的実施形態により、本発明について提示し説明する。
【0017】
図1によれば、ボイスコントロールシステム1に、マイクロホン2を介して、認識すべき音声が入力され、音声信号が音声パターンデータベース15に格納されている音声パターンと比較され、対応する音声コマンドが割り当てられる。ボイスコントロールシステム1の対話及び順序付け制御ユニット16により、音声ダイアログの残部が、認識された音声コマンドに従って制御されるか、又はこの音声コマンドに対応する機能が、インターフェースユニット18によって実行される。
【0018】
ボイスコントロールシステム1のインターフェースユニット18は、アプリケーションユニット5及び手動コマンド入力ユニット6と共に、中央表示装置4に接続される。アプリケーションユニット5は、オーディオ/ビデオ装置、空調システム、シート調整装置、電話、ナビゲーションシステム、ミラー調整装置、又はたとえば、車間距離警告システム、車線変更支援システム、自動ブレーキシステム、駐車支援システム、車線キープ装置、又は発進停止支援装置などの、支援システムを構成し得る。
【0019】
起動されたアプリケーションに従って、関連付けられたオペレータ制御及び/又は状態データ及び/又は車両の周囲に関するデータが、中央表示装置4上で運転者に表示される。
【0020】
既に述べたように、マイクロホン2を介した音声によるオペレータ制御に加えて、運転者は、手動コマンド入力ユニット6により、これに対応するアプリケーションを選択し操作することもできる。
【0021】
他方、対話及び順序付け制御ユニット16が有効な音声コマンドを検出できない場合、音声信号がボイスコントロールシステム1の音声生成ユニット12により準備され、スピーカ3を用いて音声によるダイアログが出力される。
【0022】
音声ダイアログは、図2に示されている方法で進み、この音声ダイアログ全体は、これも連続して繰り返される個々の段階からなる。音声ダイアログは、手動で、たとえばスイッチにより、又は自動的にトリガされる対話の開始から出力される。さらに、ボイスコントロールシステム1の側での音声出力で音声ダイアログを開始させることもでき、この場合、これに対応する音声信号は、人工的に又は録音により生成される。この音声出力段階後に、次の音声入力段階があり、入力された音声信号は、その後の処理段階で処理される。この後、ボイスコントロールシステムの側での音声出力で音声ダイアログが続行されるか、又はダイアログの終了に達するが、これも手動で、又はたとえば特定のアプリケーションを呼び出すことにより自動で行われる。音声出力段階、音声入力段階、及び処理段階などの、前述の音声ダイアログの段階については、一時点においてのみ対話の開始及び対話の終了によって特色付けられる、特定の長さの時間窓が利用可能となる。図2に示されているように、音声出力段階、音声入力段階、及び処理段階は、所定の頻度で繰り返される。
【0023】
しかし、このようなボイスコントロールシステムは、人と機械との間の通信用インターフェースとしては、従来の個人間の通信と比較した場合、ある欠点を有する。何故なら、会話する他方の当事者の状態についての追加情報や音声ダイアログの主要情報要素が欠落しており、純然たる人間の会話中に視覚的に伝えられる情報が欠如しているからである。ボイスコントロールシステムにおいては、この追加情報は、システムの状態、つまり、たとえば、ボイスコントロールシステムが入力準備完了であるかどうか、現在「音声入力」状態であるかどうか、又は現在作業命令を処理しているかどうか、即ち「処理」状態であるかどうかに関係するか、又は比較的長い間、音声出力が中止された場合には、即ち「音声出力」状態に関係する。ボイスコントロールシステムのこれらの種々の状態を特徴付けるために、オーディオ出力装置を用いて、つまりスピーカ3により、これらのボイスコントロール状態に同期しながら非音声音響出力が出力される。
【0024】
ボイスコントロールシステム1の音声ダイアログ状態のこの非音声識別が、図3に示されており、ここでは、第1のラインは、図2を参照して既に記述したように、時系列な順序付け中の音声対話の状態を示している。ここに示されている音声ダイアログは、時間t=0から開始し、時間tで終了する。音声起動オペレータ制御状態は、具体的には、「音声出力」段階によって判断され時間tまで持続する状態A、「音声入力」段階によって特徴づけられ時間tで終わる状態E、「処理」段階によって特徴づけられ時間tで終わる状態V、を特徴付ける音声ダイアログの段階からなり、時間t及びtでそれぞれ終わる状態A及びEが、繰り返えされる。これから、各状態の、これに対応する時間帯TからTが定義される。
【0025】
状態Aを特徴付けるために、音声出力には、音響的に付随する非音声信号が、具体的には音要素1が、関連付けられた時間帯T又はT中に提供される。これとは異なり、音要素2が、時間帯T又はT中に、スピーカ3により、ユーザによる音声入力が可能な間、したがってマイクロホンが「スタンバイされている」間に状態Eに出力される。このことにより、ユーザは出力と入力とを区別することができ、このことは、多くのユーザが、前の文が発せられた後、次の文の入力の前に短い休止を使用しようとする傾向があるという状況であっても、複数の文を好適に認識することができる。
【0026】
最後に、ボイスコントロールシステムが処理段階中である状態Vは、音要素3が出力されるので、システムがいつユーザによる音声入力を処理しているかがユーザに通知され、ユーザが、音声出力を予想できずに音声を入力してしまうということを防止できる。非常に短い処理時間帯、たとえばμs領域内では、状態Vの特色付けが省かれるが、より長い時間帯の場合には、ユーザが音声ダイアログが終了したと思い込む危険性があるので、通知は必要である。図3の第3行によれば、サウンドパターン要素1、2、及び3の別個の割当てが、各状態に対して行われる。
【0027】
しかし、基本パターンにより、連続した音要素が、時間t=0から時間tでの対話の中止まで音声ダイアログに付随し得るが、この基本要素は、個々の状態を特徴付ける又は特色付けるよう変えられるので、たとえば、図3のライン4及び5に表されているように、状態Eには変形形態1が割り当てられ、状態Vにはこれとは異なる変形形態2が割り当てられる。
【0028】
図1によれば、ボイスコントロールシステムについて記述した種々の状態の特徴付けは、対話及び順序付け制御ユニット16によって検出された状態が、適宜、サウンドパターンデータベース17からの特定の変形形態を有する、これに対応する音要素又は基本要素を選択し、混合器14に送ることにより、対話及び順序付け制御ユニット16によって作動される音声特徴付けユニット13によって実施される。この混合器14には、この非音声信号に加えて、音声生成ユニット12によって生成された音声信号も供給され、これと混合され、この非音声信号が付随した音声信号は、スピーカ3によって出力される。
【0029】
種々のサウンドパターンが、非音声音響信号としてこのメモリ17内に格納されるが、この場合、音色又は楽器編成、音程又は音域、音量又は強弱、速度又はリズム、又は1連の音又はメロディが、連続した基本要素の可能な変形形態と考えられる。
【0030】
さらに、対話の開始及び対話の終了は、非音声音響信号によって特色付けられるが、このため、音声特徴付けユニット13も、これに対応して、対話及び順序付け制御ユニット16によって作動されるので、非常に短い音響出力が、これに対応する時間に発生する。
【0031】
最後に、ボイスコントロールシステム1は、一方の端部では音声及び順序付け制御ユニット16に、他方の端部ではインターフェースユニット18及びアプリケーションユニット5に接続された、翻音ユニット19を備える。この翻音ユニット19は、アプリケーション、たとえばナビゲーションシステムに従って、特定の非音声信号を作動されたアプリケーションに割り当てる目的を有し、このため、サウンドパターンデータベース17は、このサウンドパターンをこれに対応する関連付けられた音声出力にこのようにして追加するために、この選択されたサウンドパターンを混合器14に供給するよう、この翻音ユニット19に接続される。この結果、それぞれのアプリケーションには特定のサウンドパターンが割り当てられるので、前記アプリケーションが、オペレータによって呼び出されるか又は自動起動によって作動された場合には、これに対応するサウンドパターンが生成される。この結果、ユーザは、この非音声出力、即ちアプリケーションから内容を直ちに認識する。特に、事前対応型メッセージ、即ち音声ダイアログがアクティブでない場合にもシステムによって生成されるメッセージ(自発的なメッセージ)が出力された場合には、ユーザは、この特徴的なサウンドパターンによりメッセージの性質を直ちに認識できる。
【0032】
翻音ユニット19はまた、動的に生成されたリストのエントリ数が変わり、したがってユーザがリスト内の選択された要素の総数及び位置を予想することができるので、現在のリスト要素の位置及び出力されたリスト内のエントリの総数を特徴付けるよう役立つ。リストの長さ又はこのリスト内のリスト要素の位置についてのこのような情報は、これに対応する音程及び/又は音域によって特色付けられる。ユーザがリスト内をナビゲートしている時には、全数に対する音響的な一致とリスト内の現在の要素の位置に対する一致とを組み合せたものが再現される。
【図面の簡単な説明】
【0033】
【図1】本発明によるボイスコントロールシステムを示すブロック回路図である。
【図2】1連の音声認識手順を示すブロック回路図である。
【図3】本発明による方法を示すフローチャートを示す図である。

【特許請求の範囲】
【請求項1】
音声出力に加えて非音声信号が出力される自動車用のボイスコントロールシステムにより、自動車機能を操作するための音声ダイアログのサポート方法であって、
前記非音声信号が、前記ボイスコントロールシステムの状態に応じて、音響信号として出力されることを特徴とするサポート方法。
【請求項2】
音声入力及び音声出力の段階を含む前記音声ダイアログの段階が、前記ボイスコントロールシステムの状態として検出され、該段階のそれぞれに、特定の非音声音響信号が割り当てられることを特徴とする請求項1に記載のサポート方法。
【請求項3】
認識時間窓が、音声入力が可能な時間帯として設定され、該認識時間窓中に前記非音声音響信号が出力されることを特徴とする請求項2に記載のサポート方法。
【請求項4】
再生時間窓が、音声出力が出力される時間帯として設定され、該再生時間窓中に前記非音声音響信号が音声出力に重ね合わされて出力されることを特徴とする請求項2又は3に記載のサポート方法。
【請求項5】
入力された音声の処理時間中に、前記非音声音響信号が前記音声処理システムによって出力されることを特徴とする請求項2〜4のいずれか一項に記載のサポート方法。
【請求項6】
前記非音声音響信号が、前記対話の開始から終了まで、音声ダイアログを特色付けるよう出力されることを特徴とする請求項1〜5のいずれか一項に記載のサポート方法。
【請求項7】
機能を特徴付ける非音声音響信号が、音声コマンドによってオペレータから指定された機能に応じて出力されることを特徴とする請求項1〜6のいずれか一項に記載のサポート方法。
【請求項8】
前記ボイスコントロールシステムが、割り当てられたオペレータ制御機能を特徴付ける前記非音声音響信号と共に、車両の状態及び/又は車両の周囲に応じて、前記オペレータ制御機能に割り当てられ自動的に出力される、自発的なメッセージを生成することを特徴とする請求項1〜7のいずれか一項に記載のサポート方法。
【請求項9】
音声コマンドにより出力されるリストから、個々のリスト項目である選択肢の選択中に、非音声音響信号が、前記リストの、リスト項目数に応じて及び/又は各リスト項目の位置に応じて出力されることを特徴とする請求項1〜8のいずれか一項に記載のサポート方法。
【請求項10】
前記非音声音響信号が、リスト項目数及び/又は各リスト項目の位置に対応する音程及び/又は音域を有する音信号として変えられることを特徴とする請求項9に記載のサポート方法。
【請求項11】
断続的な音信号が、それぞれの音声オペレータ制御システム状態用の非音声音響信号として生成され出力されることを特徴とする請求項1〜10のいずれか一項に記載のサポート方法。
【請求項12】
連続したパターンから導き出される音信号が、それぞれの音声オペレータ制御システム状態用の非音声音響信号として生成されることを特徴とする請求項1〜10のいずれか一項に記載のサポート方法。
【請求項13】
音声ダイアログをサポートするために、音声出力に加えて非音声信号が出力される、自動車機能を操作するための自動車用のボイスコントロールシステム(1)において、
a)音声パターンデータベース(15)により音声入力を評価する音声認識ユニット(11)に接続される音声入力手段(2)と、
b)音声入力の評価に応じて自動車機能を制御するアプリケーションユニット(5)、及び/又は音声生成ユニット(12)を作動させる、対話及び順序付け制御ユニット(16)と、
c)ボイスコントロールシステムの状態に応じて、該状態を特徴付ける非音声音響信号を出力し、該信号が、サウンドパターンデータベース(17)によって利用可能である音声特徴付けユニット(13)と、
d)音声出力ユニット(3)を作動させるものであって、前記音声生成ユニット(12)の信号及び前記音声特徴付けユニット(13)の信号が送られる混合器(14)と、
を有することを特徴とするボイスコントロールシステム。
【請求項14】
非音声音響信号を自動車の機能に割り当てるために、前記対話及び順序付け制御ユニット(16)、前記サウンドパターンデータベース(17)、及び前記アプリケーションユニット(5)に接続される翻音ユニット(19)を設けたことを特徴とする請求項13に記載のボイスコントロールシステム。
【請求項15】
前記アプリケーションユニット(5)が、インターフェースユニット(18)を介して前記対話及び順序付け制御ユニット(16)に接続され、
他のアプリケーションユニット(5)、中央表示装置、及び手動コマンド入力ユニット(6)も、前記アプリケーションユニット(5)に加えて前記インターフェースユニット(18)に接続されることを特徴とする請求項13又は14に記載のボイスコントロールシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公表番号】特表2007−503599(P2007−503599A)
【公表日】平成19年2月22日(2007.2.22)
【国際特許分類】
【出願番号】特願2006−523570(P2006−523570)
【出願日】平成16年8月10日(2004.8.10)
【国際出願番号】PCT/EP2004/008923
【国際公開番号】WO2005/022511
【国際公開日】平成17年3月10日(2005.3.10)
【出願人】(598051819)ダイムラークライスラー・アクチェンゲゼルシャフト (1,147)
【Fターム(参考)】