説明

音声命令語処理装置及びその方法

【課題】使用者との相互作用(Interaction)に基づき音声命令語テーブルを更新することにより、別の音声命令語を入力する過程を必要とせずに、音声認識率を高める音声命令語処理装置及びその方法を提供する。
【解決手段】
本発明は、音声命令語テーブルを格納している格納手段、使用者から音声命令語の入力を受ける音声命令語入力手段、前記音声命令語テーブルに基づき、前記音声命令語入力手段を介して入力された音声命令語を認識する音声命令語認識手段、及び前記音声命令語認識手段が非正常音声命令語と認識した場合、前記入力された音声命令語に係る類似命令語を前記使用者に提供し、前記使用者から選択された類似命令語に前記入力された音声命令語をリンクさせ、前記音声命令語テーブルを更新する音声命令語処理手段を含むことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声命令語処理装置及びその方法に係り、より詳しくは使用者との相互作用(Interaction)に基づき新しい音声命令語を学習する音声命令語処理装置及びその方法に関する。
【背景技術】
【0002】
一般に、電子技術の発展と消費者の利便性の要求に従い車両には各種先端電子制御装置及び便利な装置などが取り付けられており、これら電子制御装置及び便利な装置などに対する動作が運転者の音声命令により行われるようになっている。
従って、車両に取り付けられる各種電子制御装置及び便利な装置に対する多様な動作が音声命令語の入力で行われるようにするためには、各装置別に製作者により予め入力された各アプリケーション(Application)に適する音声認識用命令語リストがテーブルに設定され、これから入力された音声命令語を認識した後、それに該当する動作が行われるようにしている。
【0003】
前記各装置に対する各アプリケーションのための音声認識用命令語リストを設定するに当たり、多数の使用者に対する全ての場合の数を考慮することは現実的に不可能なので、製作者の主観あるいは標本調査資料に基づき設定する方式を適用している。
従って、音声命令語の認識において制的を有することになるので、音声命令語の認識率が低下し、所望の便利な装置及び制御装置に対する動作が行われない短所が発生する。
【0004】
さらに、音声命令語の認識に制的があるため、場合によって使用者に可能な音声命令語をマニュアルを介して報知しなければならず、音声命令語に対するマニュアルを学習できなかった運転者の場合、反復的に動作可能な音声命令語を直接行わせる学習過程を経た場合のみ、便利な装置及び制御装置で所望の動作に対する正常の結果が得られる問題点がある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2004−038179号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、前記問題点を解決するためになされたものであって、使用者との相互作用(Interaction)に基づき音声命令語テーブルを更新することにより、別の音声命令語を入力する過程を必要とせず音声認識率を高めることができる音声命令語処理装置及びその方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る装置は、音声命令語処理装置において、音声命令語テーブルを格納している格納手段、使用者から音声命令語の入力を受ける音声命令語入力手段、前記音声命令語テーブルに基づき前記音声命令語入力手段を介して入力された音声命令語を認識する音声命令語認識手段、及び前記音声命令語認識手段が非正常音声命令語と認識した場合、前記入力された音声命令語に係る類似命令語を前記使用者に提供し、前記使用者から選択された類似命令語に前記入力された音声命令語をリンクさせ、前記音声命令語テーブルを更新する音声命令語処理手段を含むことを特徴とする。
【0008】
また、本発明は、格納手段が音声命令語テーブルを格納する段階、音声命令語入力手段が使用者から音声命令語の入力を受ける段階、音声命令語認識手段が前記音声命令語テーブルに基づき、前記入力された音声命令語を認識する段階、及び音声命令語処理手段が前記音声命令語を非正常に認識した場合、前記入力された音声命令語にかかわる類似命令語を前記使用者に提供し、前記使用者から選択された類似命令語に前記入力された音声命令語をリンクさせ、前記音声命令語テーブルを更新する段階を含むことを特徴とする。
【発明の効果】
【0009】
本発明によれば、使用者からの音声命令語がデータベース上に存在しないことにより前記音声命令語に係る類似命令語リストを使用者に提供し、使用者から選択された類似命令語と前記音声命令語をリンクさせることにより、別の音声命令語を入力する過程を必要とせずに、音声命令語認識率を高める効果がある。
【図面の簡単な説明】
【0010】
【図1】本発明に係る音声命令語処理装置の一実施例の構成を示す図である。
【図2】本発明に係る音声命令語処理方法に対する一実施例のフローチャートである。
【発明を実施するための形態】
【0011】
以下、図を参照して本発明に係る好ましい実施例を詳しく説明する。
図1は、本発明に係る音声命令語処理装置の一実施例の構成を示す図である。
図1に示すように、本発明に係る音声命令語処理装置は、格納部10、音声命令語入力部20、音声命令語認識部30、音声命令語処理部40、表示部50、及びキー入力部60を含む。
前記各構成要素のうち格納部10は一例として下記の[表1]のような電子機器の動作を指示する音声命令語が、当該機能とマッチングされた音声命令語テーブルを格納している。音声命令語は電子機器の各種動作を指示する命令語であって、特定命令語は特定動作を活性化させる。
【0012】
【表1】

【0013】
音声命令語入力部20は使用者から音声命令語の入力を受ける。このとき、音声命令語入力部20は電源が印加されると、活性化モードに動作して使用者から音声命令語の入力を受けることもでき、使用者がキー入力部60を介して音声命令語を入力するとの信号を入力すると、活性化され使用者から音声命令語の入力を受けることもできる。
車両に適用された場合は、車両の始動キーがACC(Accessory)状態になると、活性化モードになって入力される音声命令語を音声命令語認識部30へ伝達することもでき、使用者がキー入力部60を介して音声命令語を入力するとの信号を入力すると、活性化され使用者から音声命令語の入力を受けることもできる。
【0014】
音声命令語認識部30は、音声命令語入力部20を介して入力される音声命令語が音声命令語テーブルに存在するか否かを判断し、存在すれば、これを駆動制御部(図示省略)に伝達して当該機能を行うようにし、存在しなければ、入力される音声命令語と当該認識結果を音声命令語処理部40へ伝達する。
即ち、音声命令語認識部30は音声入力部20を介して入力される音声命令語が、音声命令語テーブルに存在しない命令語の場合、駆動制御部に如何なる情報も伝達せず何らの動作も取らない。
【0015】
音声命令語認識部30から音声命令語とその認識結果を伝達された音声命令語処理部40は、音声命令語テーブルで関連性のある類似命令語を表示部50を介して表示する。ここで、関連性のある類似命令語は一例として同一単語を含む語句を意味する。
この場合、使用者は表示部50を介して示される関連類似命令語の中で意図していた命令語を選択する。
そうすると、音声命令語処理部40はキー入力部60を介して選択された命令語に音声命令語認識部30から伝達された音声命令語をリンクさせる。即ち、音声命令語テーブル上にキー入力部60を介して選択された命令語と音声命令語認識部30から伝達された音声命令語をマッチングさせて格納する。
【0016】
従って、音声命令語認識部30は、追って音声命令語入力部20から類似命令が入力されても使用者が意図していた機能を行うように駆動制御部に音声命令語ナンバーを提供する。即ち、追って使用者が類似命令を入力しても類似命令にマッチングされている音声命令語に相応する機能の提供を受けることができる。
例えば、使用者が「John Smith」と通話を望み音声命令語で「Call Dr. Smith」と言った場合、音声命令語テーブルにこれに対する音声命令語は「Call John Smith」と記録されているので、「John Smith」との通話は行われない。
【0017】
即ち、音声命令語認識部30は音声命令語テーブルで「Call Dr. Smith」を捜すことができないので、誤った音声命令語と認識し、駆動制御部に認識結果を伝達せず、キー入力部60を介して入力された「Call Dr. Smith」と当該認識結果を音声命令語処理部40へ伝達する。
このとき、音声命令語処理部40は音声命令語テーブルで類似命令語である「Call John Smith」を表示し、使用者が「Call John Smith」を選択すると、音声命令語テーブルを下記の[表2]のように更新する。
【0018】
【表2】

【0019】
表示部50は、各種情報を表示するディスプレイであって、特に音声命令語処理部40から提供された音声命令語リストを表示する。このとき、表示部50がタッチスクリーンの場合、直接音声命令語の選択を受けることもできる。
キー入力部60は、ボタン式入力方式は多様な入力方式を含む。
本発明は車両内のテレマティクス端末機に設けられ、テレマティクス端末機とテレマティクスサーバでなるテレマティクスシステムに適用され、音声命令語の入力と表示、及び音声命令語の選択に係るキー入力はテレマティクス端末機で行い、音声認識と音声命令語テーブルの更新はテレマティクスサーバが行う。
【0020】
付加的に、音声入力部20を介して入力された音声命令語が音声命令語テーブルに存在しない命令語でありながら、音声命令語テーブルに前記命令語と関連性のある類似命令語が存在しない場合、音声命令語処理部40はキー入力部60を介して入力されるキー入力をモニタリングする。
例えば、使用者が定義されていない機能、一例としてベース音の調節画面を表示せよとの音声命令語(ベース調節)を入力した場合、このような音声命令語は音声命令語テーブルに格納されていないだけでなく、類似命令語もまた格納されていない。ここで、類似命令語が格納されていてもキー入力部60を介して機能設定信号が入力されると、下記の機能定義動作を行う。
【0021】
このとき、音声命令語処理部40は「ベース調節」との音声命令語を記憶しており、さらにキー入力部60をモニタリングして使用者が命令した「ベース調節」に相応するベース調節画面の表示機能を定義する。これはログファイルを介して知ることができる。
その後、音声命令語処理部40は音声命令語テーブルに「ベース調節」を追加し、それに相応する機能として「ベース音の調節画面を見せよ。」を追加する。勿論、使用者はキーボタン(取消、入力、格納など)を介して既に設定された音声命令語及びそれに相応する機能を変更及び削除することができる。このような過程を経て使用者は音声命令語の追加はもちろん、それに相応する機能まで追加することができ、その利便性を極大化することができる長所がある。
【0022】
図2は、本発明に係る音声命令語処理方法に対する一実施例のフローチャートである。
先ず、格納部10は音声命令語テーブルを格納している(201)。
その後、音声命令語入力部20が使用者から音声命令語の入力を受ける(202)。
その後、音声命令語認識部30が前記音声命令語テーブルに基づき、前記音声命令語入力部20を介して入力された音声命令語を認識する(203)。
【0023】
その後、音声命令語認識部30が非正常音声命令語と認識した場合、音声命令語処理部40は前記入力された音声命令語に係る類似命令語を前記使用者に提供し、前記使用者から選択された類似命令語に前記入力された音声命令語をリンクさせ、前記音声命令語テーブルを更新する(204)。このような過程を経て、使用者は別の音声命令語を入力する過程を必要とせずに、簡単に音声命令語を設定することができ、結果的に音声認識率を向上させることができる。
【0024】
以上本発明に関する好ましい実施形態を説明したが、、本発明は前記実施形態に限定されるものではなく、本発明の属する技術分野を逸脱しない範囲での全ての変更が含まれる。
【符号の説明】
【0025】
10:格納部
20:音声命令語入力部
30:音声命令語認識部
40:音声命令語処理部
50:表示部
60:キー入力部

【特許請求の範囲】
【請求項1】
音声命令語テーブルを格納している格納手段、、
使用者から音声命令語の入力を受ける音声命令語入力手段、、
前記前記音声命令語テーブルに基づき、前記前記音声命令語入力手段を介して入力された音声命令語を認識する音声命令語認識手段、、及び
前記前記音声命令語認識手段が非正常音声命令語と認識された場合、前記前記入力された音声命令語に係る類似命令語を前記前記使用者に提供し、前記前記使用者から選択された類似命令語に前記前記入力された音声命令語をリンクさせ、前記前記音声命令語テーブルを更新する音声命令語処理手段
を含むことを特徴とする音声命令語処理装置。
【請求項2】
前記音声命令語入力手段は、
車両に適用された場合、車両の始動キーがACC状態になると、活性化モードに動作し、使用者から入力される音声命令語を前記音声命令語認識手段へ伝達することを特徴とする請求項1に記載の音声命令語処理装置。
【請求項3】
前記音声命令語認識手段は、
前記音声命令語入力手段を介して入力された音声命令語が非正常の場合、前記音声命令語と当該分析結果を音声命令語処理手段へ伝達することを特徴とする請求項1に記載の音声命令語処理装置。
【請求項4】
前記類似命令語は、
同一単語を含む音声命令語であることを特徴とする請求項1に記載の音声命令語処理装置。
【請求項5】
格納手段が、音声命令語テーブルを格納する段階、
音声命令語入力手段が、使用者から音声命令語の入力を受ける段階、
音声命令語認識手段が、前記音声命令語テーブルに基づき前記入力された音声命令語を認識する段階、及び
音声命令語処理手段が、前記音声命令語を非正常と認識した場合、前記入力された音声命令語にかかわる類似命令語を前記使用者に提供し、前記使用者から選択された類似命令語に前記入力された音声命令語をリンクさせ、前記音声命令語テーブルを更新する段階、
を含むことを特徴とする音声命令語処理方法。
【請求項6】
前記音声命令語入力段階は、
車両に適用された場合、車両の始動キーがACC状態になるに伴い、使用者の音声命令語を入力されることを特徴とする請求項5に記載の音声命令語処理方法。
【請求項7】
前記類似命令語は、
同一単語を含む音声命令語であることを特徴とする請求項5に記載の音声命令語処理方法。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2012−226299(P2012−226299A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2011−274193(P2011−274193)
【出願日】平成23年12月15日(2011.12.15)
【出願人】(591251636)現代自動車株式会社 (1,064)
【Fターム(参考)】