説明

Fターム[5D015LL06]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 認識結果の表示・出力 (271) | 合成音声による出力 (71)

Fターム[5D015LL06]に分類される特許

41 - 60 / 71


【課題】通信端末にあらかじめ内蔵されたプログラムおよびデータと音声処理とを連携させて動作させるシステムの提供。
【解決手段】通信端末100は、第1プログラムおよびデータ格納手段101と、音声処理手段102と、音声処理手段用の言語情報を作成する音声処理言語情報作成手段103と、サーバ200からプログラム/データを取得する送受信手段104と、取得したプログラム/データを記憶する第2プログラムおよびデータ格納手段105と、第2プログラムおよびデータ格納手段105に記憶されたプログラム/データに基づいて、音声処理手段102と、第1プログラムおよびデータ格納手段101のプログラム/データを連携制御する制御手段106を含み、サーバ200は、送受信手段201と、通信端末から送信されたデータを基に言語情報を作成する音声処理言語情報作成手段202を含む。 (もっと読む)


【課題】各アプリケーション機能を別プロセスに分離することで、車載マルチメディア装置全体が大きくなった場合にも、新たな機能を容易に追加可能にし、コンパイル/デバッグの作業効率を向上させることができる車載マルチメディア装置を提供する。
【解決手段】複数の外部ハードウェアの動作制御に用いられる複数のアプリケーションモジュールからなるアプリケーションモジュール群と、アプリケーションモジュール各々の実行を制御するのに用いられるアプリケーション統括モジュールとから構成されるソフトウェアを実行するマイクロプロセッサと、マイクロプロセッサに実行されることにより、アプリケーション統括モジュール及び各アプリケーションモジュールに共通する複数の機能を実現するプログラムを登録した複数のライブラリからなり、全てのライブラリに共通のインタフェースを有するライブラリ群とを備える。 (もっと読む)


【課題】同じ音声の発生をユーザに何度も促すことを回避してデッドロックを防止することができる音声対話システムを提供する。
【解決手段】この音声対話システムは、音声合成部10と、音声認識辞書を参照して入力音声信号に対する認識処理を行い音声認識結果を出力する音声認識部12と、音声認識結果に基づいて検索されるデータベース14と、音声認識辞書を記憶するための音声認識辞書記憶部16と、データベース14を参照して音声認識辞書記憶部16に音声認識辞書を構築する音声認識辞書構築部18と、音声対話のための対話シナリオを記憶及び管理する対話シナリオ部20と、対話シナリオ部20、音声合成部10及び音声認識部12を制御して音声対話を実行させ、音声対話の実行状態に基づいて、音声認識辞書を切り替える処理を音声認識辞書構築部18に実行させる対話制御部22と、を具備する。 (もっと読む)


【課題】ユーザの声紋パターンを登録しておくことで、暗証番号を入力せずに認証を行うことができ、且つ画面を確認しながら音声応答できることで操作の利便性を向上させる画像形成装置を提供する。
【解決手段】この画像形成装置100は、図示しない利用者の音声を電気信号に変換するマイク8と、合成音を発音するスピーカ9と、キーや液晶表示パネルから構成される操作表示部10と、マイク8、スピーカ9及び操作表示部10の信号をインターフェースするユーザインターフェース7と、利用者の音声を認識し、認識した音声からキーワードを抽出する音声認識部4と、指定した音声を合成して出力する音声合成部5と、声紋の特徴を抽出し登録されている声紋パターンと照合する声紋認証部6と、対話を記述した文書を解釈する対話インタプリタ3と、ファイル情報を記憶するハードディスク2と、を備えて構成される。 (もっと読む)


【課題】入力音声信号を認識し、理解することにより応答音声信号を生成してユーザに出力する音声対話装置において、連結する複数の音声信号間における声質の乖離により、応答音声をユーザが聞き落とす可能性があった。このため、上記声質の乖離の影響を軽減した音声対話装置の実現を目的とした。
【解決手段】応答音声信号聞き落としの可能度を、音声信号の音響的特徴の差(基本周波数、エネルギー値、AQ値の何れか)、あるいは話速の差等が予め設定した値以下となるように出力音声信号の調整を行うようにした。この調整は、音声信号の連結部分にポーズを挿入する、話速の変化を少なくする、基本周波数の変化を少なくする等により行う。 (もっと読む)


【課題】車両内や外出先において長文を音声認識する場合でも認識率を向上しつつ素早く音声認識できるようにする。
【解決手段】制御回路は、発話された音声が音声認識された単語を探索し(S6)、この探索された語句の下位カテゴリの語句を選定し(S9)、音声応答要求用の語句に変換して問合せ制御し(S2)、応答された音声に対して再度問合せ制御を順次繰り返して目的地を設定するようにしている。 (もっと読む)


【課題】対話システムにおいて、複雑なルール構築を不要とする。
【解決手段】応答文生成装置100はユーザ発話とその応答文との発話対、およびその発話対における対話状態のラベル値を付与した対話コーパスを記憶する対話コーパス記憶部133を備える構成とした。すなわち、まず対話状態管理部140はこの対話コーパスに含まれるユーザ発話とその応答文と前記したラベル値とに基づき、入力されたユーザ発話がどのような対話状態か(どのようなラベル値に該当するか)を判断する。そして、応答文生成部150は、判断した対話状態に類似するユーザ発話の応答文を対話コーパスから検索する。つまり、入力されたユーザ発話の応答文として最も適切である可能性が高い応答文を対話コーパス記憶部133から検索する。そして、この検索した応答文に修正を行い、入力されたユーザ発話に対する応答文として出力する構成とした。 (もっと読む)


【課題】 画像形成装置に実装される音声認識モジュールは、異なる機種であっても共通に使用可能なように構成される。したがって、音声認識用の辞書についても共通化される。しかし、辞書が共通化されると、機種によっては音声の認識はできても、その機能が実装されていない場合がある。
【解決手段】 音声認識の結果により、動作を切り換え、辞書に一致する言葉はあるが、機能が実装されていない場合は「その機能は実装されていません」などと音声ガイダンスし、代替機能をUI上に提示する。 (もっと読む)


【課題】ユーザが音声対話システムからの案内音声再生中に割り込んで発声する頻度を低減して、音声認識精度の向上した音声対話方法および音声対話システムを提供する。
【解決手段】音声出力する音声出力部と、ユーザからの音声を音声信号に変換する音声入力部と、音声出力部からの音声出力中に音声入力部から入力された音声信号を検出するタイミング検出部と、そのタイミング検出部が検出した割り込みタイミングを記録し、休止区間を挿入する位置を学習する割り込み学習部と、入力された音声信号に対して音声認識を行う音声認識部と、その音声認識部による音声認識結果に基づいて応答文を決定する対話シーケンス部と、その対話シーケンス部で決定した応答文に、割り込み学習部が当該応答文について学習して決定した休止位置に休止区間を挿入し、応答音声を生成する応答音声生成部とを備える。 (もっと読む)


【課題】ICレコーダーなどの音声信号記録装置で一旦コーデック変換した音声信号を精度良く音声認識し、リアルタイム処理及びバッチ処理のいずれの処理も可能な音声通訳システムを提供する。
【解決手段】音声認識装置220は、音声認識に先立ち、音声信号記録装置210のモニター機能を利用し、コーデック変換部212で圧縮及び伸張された音声信号を用いて、音声認識させたい人の声の特徴データを抽出するトレーニング作業をリアルタイムで行い、抽出された特徴データをトレーニングデータとして記録する。次に音声認識装置220は、前記トレーニングデータに基づき、コーデック変換部212からの音声信号をテキストデータに変換する。その後、翻訳装置230で音声認識によって得られたテキストデータを翻訳し、音声合成装置240で、翻訳によって得られたテキストデータを音声合成し、得られた音声信号を音声として再生する。 (もっと読む)


【課題】音声認識において、周囲の雑音の影響を受けることなく、少量の音量
であっても高度な認識率を維持する。
【解決手段】音声認識システムは、音響信号を取得し、取得した音響信号の変化に基づいて音響情報パラメータを算出する音響情報処理部10と、対象物表面の電位変化を筋電信号として取得し、取得した音響信号の変化に基づいて筋電信号パラメータを算出する筋電信号処理部13と、撮影した対象物の映像を画像情報として取得し、映像中の対象物の変化に基づいて画像情報パラメータを算出する画像情報処理部16と、音響情報パラメータ、筋電信号パラメータ及び画像情報パラメータに基づいて音声を認識する音声認識手段20と、音声認識手段による認識結果を提示する認識結果提示手段21とを有する。 (もっと読む)


【課題】 本発明は、ドライバをより良い運転傾向へと誘導することができる対話システムの提供を目的とする。
【解決手段】 本発明は、ドライバに対して適切な運転アドバイスの出力を行う車両における対話システムにおいて、運転操作情報から推定されるドライバの運転操作を、規範となる運転操作を基準にして評価する運転評価手段と、出力した運転アドバイスに対するドライバの反応を、運転アドバイス出力後のドライバの運転操作の変化に基づいて評価する反応評価手段と、ドライバへの運転アドバイスの出力内容に前記運転評価結果を反映させると共に、運転アドバイスの表現方法に前記反応評価結果を反映させる出力制御手段とを備えることを特徴とする。 (もっと読む)


【課題】 ユーザがより安心して操作を行うことが可能な情報処理装置及び情報処理方法等を提供する。
【解決手段】 本願に係る情報処理装置は、ユーザから入力手段を通じて入力された指示情報に基づいて、予め用意された複数の指示候補のうちから1の指示を認識し、当該認識された指示に応じた情報処理を行う情報処理装置であって、前記複数の指示候補のうちから1の指示を認識できなかった場合に、その認識できなかった原因を解析し、当該解析された原因を示す原因情報をユーザに対して提示する。 (もっと読む)


【課題】 音声入力された単語を音声認識し、認識した単語の語尾と同一文字で始まる単語を出力して発話者としりとりを行うこと。
【解決手段】 装置制御106は、マイク101を介して入力された単語の語頭および語尾を音声認識し、音声認識した単語の語頭および語尾に基づいて、入力された単語がしりとりのルールに則って発話されたものであるか否かを判定し、入力された単語がしりとりのルールに則って発話されたものであると判定した場合には、音声認識した単語の語尾と同一文字から始まる応答用単語を抽出してスピーカー105を介して音声出力する。 (もっと読む)


【課題】予め記録された音声データから、キーワードを高精度に抽出できるようにする。
【解決手段】音声データを記録した記録手段から、取り込み対象の音声データの位置をずらしながら、連続する所定量Nの音声データを順次取り込む。そして、取り込んだ各々のこの所定量の音声データと、所定の検索用キーワードの音声データとの音響的特徴をそれぞれ比較照合する。そして、この比較照合の結果この検索用キーワードの音声データと一致していたこの所定量の音声データを、キーワードとして抽出する。 (もっと読む)


【課題】 テキストのみの入力データに対しても、その入力データに対する応答データを出力することが可能な応答データ出力装置を提供する。
【解決手段】 入力部2がテキストデータを入力すると、応答予測部5は、格納部1が格納している文末語を利用して、テキストデータ内の疑問文を推定する。音声合成部3は、そのテキストデータを読み上げる。音声認識部4は、音声合成部3の出力に応じて発せられたユーザーの音声を音声認識する。応答作成部6は、応答予測部5が推定した疑問文と音声認識部6の認識結果とに基づいて応答データを生成する。出力部7は、その応答データを出力する。 (もっと読む)


【課題】 音声対応の画像形成装置の使い勝手を向上させる。
【解決手段】 画像形成装置において、入力された音声を認識し、認識された音声に対応する機能の有無を判断し、判断結果に応じて、警告する。 (もっと読む)


【課題】 簡単な構成によって高い認識率で目的とする語彙を認識させることができる音声認識装置を提供する。
【解決手段】 音声を認識するための複数の認識辞書#1〜#4と、音声認識を開始させる認識開始ボタン15と、認識開始ボタンが操作された回数に応じて複数の認識辞書の1つを有効に設定する制御手段4と、制御手段により有効に設定された認識辞書を用いて音声認識を行う音声認識手段3とを備えている。 (もっと読む)


【課題】携帯型情報端末装置の使用状態に応じて入力した音声レベルを適切な音声レベルに増幅し、認識率低下の防止を行う。
【解決手段】マイクロフォンに入力する音声を認識する音声認識装置に、マイクロフォンから出力される音声信号を増幅する増幅器108と、増幅された音声レベルを検出する音声レベル検出部103Aと、送話ゲイン、適正音声レベル、送話ゲイン更新用の時定数を記憶する送話ゲイン情報記憶部106Aと、送話ゲイン、適正音声レベル、時定数を読み出し、増幅器に送話ゲインを設定し、検出された音声レベルを適正音声レベルにすべきゲインに時定数を乗じた値を送話ゲインに加算して送話ゲインを更新し、更新した送話ゲインを送話ゲイン情報記憶部に記憶させる送話ゲイン設定制御部103Bと、増幅された音声信号を入力して音声認識を行う音声認識部111とを備える。 (もっと読む)


【課題】 ユーザが発話した音声に対して、円滑に対応できる音声処理装置を提供することを主たる課題とする。
【解決手段】 発話された音声を認識し、文字データScに変換する音声認識部3と、
文字データScにより示される動作内容である認識動作内容が、データベース8に登録済みの登録動作内容と一致しているか否かを判断し、認識動作内容が登録動作内容と一致しない場合に、認識動作内容に関連する動作内容を意味する関連文字データSgを生成する人工無脳としての文字データ生成部6と、関連文字データSgを用いて、音声に対する応答を行う音声合成部9と、を備える。 (もっと読む)


41 - 60 / 71