説明

国際特許分類[G10L15/22]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識処理中の手順,例.マン・マシン対話 (884)

国際特許分類[G10L15/22]に分類される特許

21 - 30 / 884


【課題】音声認識結果をコンテキスト情報を用いて修正
する方法を提供する。
【解決手段】音声制御システムは、発話コマンド及び関連付けられた単語(例えば、「call mom at home」)を認識し、選択されたアプリケーション(例えば、電話ダイヤラ)にコマンドを実行させることにより、コマンド(例えば、look up mom’s phone number at home and dial it to establish a telehone call)に基づいてスマートフォン等のデータ処理システムに動作を実行させる。音声制御システムは、音声認識システムから認識されたテキストを修正するためにインタプリタの集合を使用し、集合からの結果は、選択されたアプリケーションに提供される最終的に修正されたトランスクリプションにマージされる。 (もっと読む)


【課題】音声認識の精度を向上させる。
【解決手段】音声認識装置は、番組情報記憶部と、辞書記憶部と、算出部と、更新部と、認識部と、操作制御部とを備える。番組情報記憶部は、放送番組のメタデータとユーザの視聴状態とを記憶する。辞書記憶部は、音声認識の対象となる認識語と優先度とを含む認識辞書を記憶する。算出部は、メタデータと視聴状態とに基づいて、放送番組の特徴語と特徴語に対するユーザの嗜好の度合いを表す第1スコアとを算出する。更新部は、特徴語を含む認識語の優先度を第1スコアに応じて更新する。認識部は、認識辞書を用いて音声を認識する。操作制御部は、認識結果に基づいて放送番組に対する操作を制御する。 (もっと読む)


【課題】発話入力に音声認識アルゴリズムを適用した結果得られた解釈候補が、冗長性を減少させて統合化された方法で提示される方法を提供する。
【解決手段】解釈候補のリストが作成され、各解釈候補は時系列部分に細分化されてグリッドを形成する。他の解釈候補からの部分に重複する時系列部分はグリッドから除去される。ユーザに解釈候補の中から選択する機会を提示し、重複要素なしでこれらの選択肢を提示するように構成されるユーザインタフェース。 (もっと読む)


【課題】高いセキュリティを求められるアプリケーションに対して高精度な音声入力機能を簡単に追加することができる入力支援システムを提供すること。
【解決手段】アプリケーションソフトウェアを含む情報処理装置200と、音声認識処理を行う音声認識サーバ600とを有し、アプリケーションソフトウェアに対する入力作業を支援する入力支援システム100であって、公共通信網500を介して音声認識サーバ600に接続する網通信部と、公共通信網500とは別の通信経路により情報処理装置200に接続する装置通信部と、音声を入力する音声入力部と、入力した音声の音声認識サーバ600への送信と、音声認識サーバ600から受信した音声認識処理の結果を表す情報の情報処理装置200への送信とを、交互に行う音声認識管理部とを有する無線通信端末400を有する。 (もっと読む)


【課題】音声認識コマンドの操作性を向上させることができる、音声認識装置、音声認識方法、及び音声認識プログラムを提供すること。
【解決手段】ナビゲーション装置1は、ユーザの発話音声を検出する音声検出部2bと、音声検出部2bにて検出されたユーザの発話音声に基づいて、当該ユーザの発話音声に含まれる音声認識コマンドを特定する音声認識コマンド特定部2cと、音声認識コマンド特定部2cにより特定された音声認識コマンドに対応する所定の制御を実行すると共に、音声認識コマンドを選択してディスプレイ6に表示する音声認識制御部2aとを備える。音声認識制御部2aは、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択した音声認識コマンドを、ディスプレイ6に表示させる。 (もっと読む)


【課題】階層化された音声認識コマンドの操作性を向上させることができる、音声認識装置、音声認識方法、及び音声認識プログラムを提供すること。
【解決手段】ナビゲーション装置1は、ユーザの発話音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部2cと、階層構造により階層化された音声認識コマンドの中から、音声認識コマンド特定部2cにより特定された音声認識コマンドに対応する所定の制御を実行する音声認識制御部2aとを備える。音声認識制御部2aは、階層構造に関連付けられ、ユーザに表示すべき音声コマンドとして予め定められた条件により選択された音声認識コマンドである、第1音声認識コマンドと、ユーザが使用する可能性が高いか否かを判断する所定の条件に基づいて選択された音声認識コマンドである、第2音声認識コマンドとを、ディスプレイ6に同時に表示させる。 (もっと読む)


【課題】少ない計算量で入力音声の話題を高精度に推定し、また話題の変化にも追従しながら、話題の推定結果に応じた最適な言語モデルを選択する。
【解決手段】話題特徴量記憶部は、言語表現の出現頻度の特徴を表わす話題特徴量データを話題毎に記憶する。フィードバック特徴量生成部は、音声認識結果データに基づいて言語表現の出現頻度の特徴を表わすフィードバック特徴量データを生成する。類似度計算部は、フィードバック特徴量データと話題特徴量記憶部から読み出した話題特徴量データとに基づく類似度を計算し、類似度に基づいて音声認識結果データの話題を推定する。言語モデル切替制御部は、類似度計算部によって推定された話題に対応する言語モデルを使用して入力音声を音声認識処理するよう言語モデルを切り替える。 (もっと読む)


【課題】音声認識処理で間違って認識された文字列に対する変換候補を、上記音声認識処理とは異なる根拠に従って決定すること。
【解決手段】音声認識装置は、音声データを取得する音声データ取得部と、音響モデルおよび第1言語モデルを参照して、音声データに対する音声認識処理をおこない、その認識結果を示す認識文字列を生成する音声認識部と、認識文字列に含まれる一部の文字列を、変換対象文字列として決定する変換対象文字列決定部と、認識文字列において、決定された変換対象文字列の前または後に接続された文字列を、参照文字列として決定する参照文字列決定部と、第2言語モデルを参照して、決定された参照文字列との接続関係が示されている文字列を、変換対象文字列を変換する候補の変換候補文字列として決定する変換候補文字列決定部と、決定された変換候補文字列を出力する出力部とを備える。 (もっと読む)


【課題】音声認識装置の性能を改善すること。
【解決手段】方法は、通信ネットワークを介したユーザの対話を監視して、監視された対話から複数の語を取り込むこと、取り込まれた複数の語を携帯機器に記憶すること、記憶された取り込まれた複数の語にアクセスし、取り込まれた複数の語の少なくともいくつかを用語集に追加して、音声認識装置の性能を改善することを備える。 (もっと読む)


【課題】対話データについて、文脈に依存している度合いを推定することができるようにする。
【解決手段】特徴量抽出部30によって、複数の発話の時系列である対話データから、各発話の特徴量を抽出する。CRPクラスタリング部31によって、抽出された各発話の特徴量に基づいて、CRPの手法を用いて、複数の発話をクラスタリングする。無限HMMクラスタリング部32によって、抽出された各発話の特徴量に基づいて、無限HMMの手法を用いて、複数の発話をクラスタリングする。文脈依存度算出部23によって、CRPのクラスタリング結果及び無限HMMのクラスタリング結果に基づいて、発話の文脈依存度を算出する。 (もっと読む)


21 - 30 / 884