説明

国際特許分類[G10L15/22]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識処理中の手順,例.マン・マシン対話 (884)

国際特許分類[G10L15/22]に分類される特許

81 - 90 / 884


【課題】簡単な構成で利便性をより高めることのできる操作装置を提供する。
【解決手段】音声認識部11で認識された音声情報が発話情報と一致するかどうかを判定する発話情報判定部16と、発話情報と一致すると判定された情報を使用情報として決定する使用情報決定部14とを設け、入力された音声情報の少なくとも一部が発話情報と一致しない判定された場合は、この発話情報と一致しない判定された情報の入力源を直接入力部に切り替え、直接入力部により入力された情報と発話情報と一致すると判定された情報とで構成された情報を、制御に用いる使用情報として決定する。 (もっと読む)


【課題】複数の動作モードのいずれかに設定可能な場合に、各動作モードにおいて音声認識による操作性を向上させる電子機器及び制御方法を提供する。
【解決手段】携帯電話機1は、通常モードで起動可能な複数の機能と音声認識時に参照される当該機能の読み仮名とがそれぞれ対応付けられた通常辞書データ71、及びかんたんモードで起動可能な複数の機能と音声認識時に参照される当該機能の読み仮名とがそれぞれ対応付けられたかんたん辞書データ72を記憶する記憶部70と、音声認識機能起動時において、通常モード又はかんたんモードの内のいずれに設定されているかを判定するモード判定部50と、通常モードに設定されていると判定された場合には通常辞書データ71を参照して音声認識を行い、一方でかんたんモードに設定されていると判定された場合にはかんたん辞書データ72を参照して音声認識を行う音声認識部60と、を備える。 (もっと読む)


【課題】音声認識時に、機能制限に伴う実行エラーの原因をユーザに容易に認知させられる電子機器及び制御方法を提供する。
【解決手段】携帯電話機1は、複数の機能の内、いずれかの機能の実行を制限する制限状態とする制御部30と、音声認識の結果に応じて、複数の機能の内、実行されるべき機能を特定する音声認識部60と、制限状態において、特定された機能が所定の機能の実行が制限される制限状態であるか否かを判定する判定部70と、を備え、制御部30は、制限状態において、特定された機能の実行が制限されていない場合には特定された機能を実行し、特定された機能の実行が制限されている場合には特定された機能を実行させず、特定された機能及び特定された機能の実行が制限されていることを報知する。 (もっと読む)


【課題】走行中における入力時の操作性を向上させることができる、車両用入力装置、車両用入力方法、及び車両用入力プログラムを提供すること。
【解決手段】車両用入力装置1は、利用者から手動入力を受け付ける手動入力部61と、利用者の音声を認識して音声入力を受け付ける音声入力部62と、利用者を特定する利用者特定部63と、手動入力の受け付けを制限する制限条件が満たされている場合、手動入力部61による手動入力の受け付けを制限する入力制御部64とを備え、入力制御部64は、利用者特定部63により特定された利用者が車両の運転者ではない場合には、制限条件が満たされている場合であっても、音声入力部62による音声入力の受け付けに加え手動入力部61による手動入力の受け付けも可能とする。 (もっと読む)


【課題】従来の音声認識エンジンが誤認識する箇所を、前後の単語繋がりに則した単語に変換することのできる音声入力支援システムなどを提供する。
【解決手段】音声入力支援システムは、入力された音声を、音声認識処理によりテキストに変換して出力する音声認識エンジンと、出力されたテキスト内の単語の中に信頼度の低い単語がある場合、テキストに含まれる信頼度の高い一以上の単語からなる文字列に基づく予測変換により、テキストの修正を行い、修正後のテキストを出力する予測変換モジュールと、を備える。 (もっと読む)


【課題】特に声調言語の音声認識について、処理量が少なく、かつ認識性能の高い音声認識装置を提供する。
【解決手段】入力音声から基本周波数を抽出する一方、この入力音声についての音響解析を行う。そして、音声認識によって得られた複数の音声認識結果からいずれか一つを選択し、選択した音声認識結果を示すラベル列を出力する。また、この出力されたラベル列から、予め保持しているパターンリストに基づいて、少なくとも一つのラベルを選択する。そして、入力音声から抽出された基本周波数に基づいて選択されたラベルについての声調を示す声調情報を抽出し、抽出した声調情報とパターンリストの内容とに基づいて、選択されたラベルを修正する。 (もっと読む)


【課題】ユーザの利用状況および学習状況に合わせた強調表示を行うことができる。
【解決手段】会議支援装置は、発音認識情報記憶部、単語強調判定部、表示内容生成部を含む。発音認識情報記憶部は、単語ごとに、単語と、発音情報と、発音認識頻度とを対応付けて記憶情報として記憶する。単語強調判定部は、第1単語と発音情報との第1セットと一致する第2単語と発音情報との第2セットが含まれるかどうかと、第2セットが含まれる場合の第2単語の発音認識頻度とに基づいて、第1単語を強調表示するかどうかの情報を示し、第1単語を強調表示する場合は第2単語の発音認識頻度に応じて決定される強調表示の度合いを示す強調レベルを含む強調判定情報を生成する。表示内容生成部は、強調判定情報に基づいて、第1単語を強調表示する場合は、強調レベルが高いほどより強く強調表示することを示す記号を第1単語に結合した強調文字列を生成する。 (もっと読む)


【課題】実施形態によれば、ユーザからのバージイン発声を精度よく認識することが可能な音声対話装置、方法、及びプログラムが提供される。
【解決手段】検出部は、ユーザの音声を検出する検出する。認識部は、音声を認識する。出力部は、音声の認識結果に対応した応答音声を出力する。制御部は、応答音声の出力中に、ユーザから割り込まれて入力されたバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、応答音声の出力中にユーザから割り込まれて入力されたバージイン発声が起こる確率の時間変化を表すバージイン確率変動に基づいて、バージイン発声を採用するか否かを判定することを特徴とする。 (もっと読む)


【課題】実施形態によれば、効率よく音声対話を行なうことが可能な音声対話システム、方法、及びプログラムが提供される。
【解決手段】履歴記憶部は、現在までに実行された動作の動作名と、その実行回数とを対応付けた動作履歴を記憶する。音声記憶部は、各々の動作名に対応する音声データを記憶する。検出部は、ユーザからの音声入力を省略することを示す省音声信号を検出する。取得部は、検出部が省音声信号を検出した場合、履歴記憶部から、最も実行回数の多い動作名を取得する。生成部は、取得された動作名に対応する音声データを音声記憶部から読み出し、音声信号を生成する。出力部は、音声信号を音声に変換して出力する。キャンセル判定部は、音声の出力が終了するまでに省音声信号がキャンセルされたか否かを判定する。実行部は、省音声信号がキャンセルされていない場合に、動作名に対応する動作を実行する。 (もっと読む)


【課題】音声認識結果に誤りがある場合、翻訳精度は著しく劣化していた。
【解決手段】音素列と文字列とを有する2以上の固有表現情報を格納し得る固有表現情報格納部と、音声を受け付ける音声受付部と、音声受付部が受け付けた音声を音声認識し、音素列を取得する音声認識部と、音声認識部が取得した音素列に類似する音素列を、固有表現情報格納部から取得する類似音素列取得部と、類似音素列取得部が取得した音素列に対応する文字列である類似文字列を取得する類似文字列取得部と、類似文字列取得部が取得した類似文字列を翻訳し、翻訳結果を取得する機械翻訳部と、機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、音声合成結果を用いて音声出力する合成音声出力部とを具備する音声翻訳装置により、音声認識結果に誤りがある場合でも、良好な翻訳結果を得ることができる。 (もっと読む)


81 - 90 / 884