説明

Fターム[5D015LL00]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048)

Fターム[5D015LL00]の下位に属するFターム

Fターム[5D015LL00]に分類される特許

21 - 40 / 79


【課題】音声認識結果の信頼度計算の処理時間を削減する。
【解決手段】この発明の音声認識装置の事前信頼度スコア計算部が、フレーム毎の音声特徴量系列を入力として、モノフォンの最尤状態の出力確率と音声モデル又はポーズモデルの最尤状態の出力確率との差を当該フレームの事前信頼度とし、その事前信頼度を音声ファイル単位で平均した信頼度スコアを出力する。音声認識処理部は、音声特徴量系列と信頼度スコアを入力として、音声認識処理を行い音声認識結果と信頼度スコアを出力する。 (もっと読む)


【課題】作業者の作業の習熟度に適した音声シナリオを容易に設定できる音声シナリオ設定プログラム及び音声シナリオ設定装置を提供することを目的とする。
【解決手段】コンピュータを、ユーザの音声入力実績を取得し、音声入力実績と習熟レベルとを対応付けるテーブルに基づいて、ユーザの音声入力実績に対応する習熟レベルを選択し、ユーザの習熟レベルに応じた音声シナリオを自動設定するシナリオ自動設定処理手段105として機能させることで上記課題を解決する。 (もっと読む)


【課題】ユーザの発話の意味が適切に理解されないことによる動作失敗を減少できる情報処理装置、情報処理方法、プログラム及び対話システムを提供する。
【解決手段】対話ロボットの制御部4は、ユーザの発話の曖昧性を確信度関数として定量化する統合確信度関数演算部19と、確信度関数に基づいて動作応答又は確認発話応答を選択する応答選択部21と、確認発話応答が選択されたときに確認応答を生成する確認発話生成部23とを備える。 (もっと読む)


【課題】長時間にわたって、低コストで会話を音声認識して記録する。
【解決手段】通信システムは、入力された音声信号を音響分析して特徴量を抽出し、無線LANを介して該特徴量を音声認識サーバへ送信し、該音声認識サーバが該特徴量を解析して音声認識した結果である文字データを該音声認識サーバから該無線LANを介して受信し、該文字データを表示する移動体通信端末と、それぞれの前記移動体通信端末から前記特徴量を受信し、該特徴量を解析して音声認識し、該音声認識の結果である文字データを該移動体通信端末へ送信する音声認識サーバと、を有する。 (もっと読む)


【課題】各ユーザの発話態様に応じた音声入力手段のゲイン制御を行い、音声認識漏れのない確実な各種処理を行う。
【解決手段】受付端末20は、音声を入力するためのマイク207を有し、マイク207を介し入力された音により音情報を取得し、患者に係わる患者IDを取得し、この取得された患者IDに応じて、患者の発話音声に基づき取得された発話音情報に対応した振幅情報と当該患者に対応する患者IDとを予め関連付けてHDD150に記憶した振幅情報データベース1510へアクセスし、対応する振幅情報を取得し、この取得された振幅情報の発話振幅値Acに関し、所定の振幅しきい値At1,At2,At3との比較を行い、この比較結果ごとに予め定められた制御態様により、マイク207のゲインを増減制御する。 (もっと読む)


【課題】字幕付きコンテンツの配信サービスの普及を促進させる。
【解決手段】端末1はオンデマンドでコンテンツの配信を配信サーバ2に要求したとき、端末1は配信サーバ2からコンテンツを取得するとともに音声のテキスト化に必要なプラグインの所在を取得して、インターネット4上でそのプラグインを取得し、端末1にインストールされているコンテンツ閲覧用のブラウザの機能を拡張させる。そして、端末1はそのプラグインの機能により音声解析サーバ3に音声のテキスト化を要求すると、音声解析サーバ3から音声のテキストを取得し、取得したコンテンツとともに、そのテキストが字幕として表示される。端末1はブラウザを拡張させるだけで済み、配信サーバ2には音声解析用の設備を導入する必要が無く、音声解析サーバ3はコンテンツを有していなくともコンテンツ配信事業に参入できるので、字幕付きコンテンツの配信サービスはよりいっそう普及する。 (もっと読む)


【課題】音声認識における認識性能をより向上させながら、より高い汎用性を実現することを可能にする音声認識システムを提供する。
【解決手段】音声入力部18に入力された音声コマンドの発話データと当該発話データをもとに情報センタ2で得られた認識結果とを少なくとも対応付けた対応関係リストを登録していくことによって音声認識用の辞書としての簡易辞書を作成・更新するとともに、情報センタ2で音声認識を行わせることが可能でないと判定した場合には、音声入力部18に入力された音声コマンドの発話データをもとに、最新の簡易辞書を用いてこの発話データに対応する認識結果を得ることによってナビゲーション装置1側で音声認識を行う。 (もっと読む)


【課題】 音声認識、音声合成といった機能が有効になっている場合には、音声関連の設定メニューへ容易に画面遷移可能とすることで、主に視覚障害者の方や、上肢障害の方が自分で音声の設定変更を容易にできる画像形成装置を提供する。
【解決手段】 音声モードを音声認識モード、音声合成モードまたは音声認識+音声合成モードのいずれかで起動している場合、そのモードに応じて音声関連の設定メニューへの画面遷移方法を変え、途中の階層を飛ばして直接音声関連の設定メニュー画面を表示する。 (もっと読む)


【課題】音声認識の精度を向上させる音声認識装置、ロボット、音声認識方法、プログラム及び記録媒体を提供する。
【解決手段】音声を入力する音声入力手段と、入力された音声の到来方向を検出し、音源方向検出結果を出力する音源方向検出手段と、入力された音声に発話区間を検出し、発話区間に対し認識処理を行い、音声認識結果を出力する音声認識手段と、音声認識手段が音声検出中であるか否かを出力する音声検出状態取得手段と、音声検出中でない場合は音源方向検出手段から出力された音源方向検出結果を出力し、音声検出中である場合は音声検出中でなくなるまで音源方向検出結果の出力を抑制する出力判定手段と、出力判定手段から出力された音源方向検出結果、若しくは音声認識手段から出力された音声認識結果の少なくともいずれかに従って動作を行う動作手段と、を備えることを特徴とする。 (もっと読む)


【課題】一台の端末で複数の電話番号が利用できるサービスにおいて、モデルの精度を高め、音声認識の性能を向上させる。
【解決手段】音声認識サーバ200は、電話機100からの音声を受信する音声受信部202と、音声受信部202が受信した音声を文字に変換するために用いられる一つ以上の音響モデルおよび一つ以上の言語モデルを格納するモデル格納部208と、電話機100の現在発信番号および他番号を判定する番号判定部204と、現在発信番号および他番号に基づきモデル格納部208に格納された音響モデルを選択し、且つ現在発信番号に基づきモデル格納部208に格納された言語モデルを選択するモデル選択部206と、モデル選択部206が選択した音響モデルおよび言語モデルに基づき、音声受信部202が受信した音声を文字に変換する音声認識部210と、を備える。 (もっと読む)


マークアップ言語ドキュメントに基づいて実施形態が提供される。マークアップ言語ドキュメント及び発話は、コンピューティングデバイスによって受信される。1つ以上の認識器が、前記マークアップ言語ドキュメントにおけるマークアップ言語に基づいて前記発話に対する結果セットを戻す複数の認識器の中から選択される。結果セットは、1つ以上の選択された認識器から、又は、前記マークアップ言語ドキュメントにおいて指定された処理方法によって決定された形態の認識器から受信される。そして、前記結果セットを受信することに応答して、イベントがコンピューティングデバイスにおいて実行される。
(もっと読む)


【課題】分散音声認識プロセスにおいてエラーを緩和する手段を提供する。
【解決手段】特定されたベクトル・グループ内の一つまたはそれ以上の音声認識パラメータが、この特定されたベクトル・グループの後に受信されたベクトルからの一つまたはそれ以上の音声認識パラメータを参照することによって判定された各置換パラメータによって置換される際に、音声認識プロセスにおいて待ち時間(latency)を許容する可能性が有利に利用される。 (もっと読む)


【課題】ユーザの発話に対してユーザの関心に応じた応答を行うことができる対話装置を提供する。
【解決手段】対話装置1は、ユーザ情報入力手段10、主要語抽出手段20、関心度判定手段30、関連語データベース40、関連語選択手段50、定形文データベース60、応答文作成手段70、および、応答文出力手段80を具備する。主要語抽出手段20は、ユーザが表した言語を構成する単語から主要語を抽出する。関心度判定手段30は、ユーザの関心度について少なくとも高低を示すユーザ関心度を判定する。関連語選択手段50は、ユーザ関心度に応じて、複数の単語のそれぞれに関連する関連語を収納した関連語データベース40内から主要語と関連する関連語を選択する。応答文作成手段70は、定形文データベースに収納された定形文に関連語を挿入してユーザが表した言語に対する応答文を作成する。 (もっと読む)


【課題】音声対話システムを携帯電話に組み込んだ場合、携帯電話が大きくなり、持ち運びに不便で、しかも、落下させた際や水没させた際に損傷が大きい。これらに鑑み、小型で付加価値が高く、高機能なユーザーインターフェースを有する携帯電話システムを提供する。
【解決手段】音声対話システムを構成するマイク17、スピーカ21、音声認識ボード55、対話処理部71のうち、マイク17、スピーカ21が被対話体(携帯電話11または可動ユニット15A)に備えられ、音声認識ボード55、対話処理部71がサーバ13に備えられるようにし、被対話体とサーバ13との間を有線または無線で接続した。 (もっと読む)


【課題】 音声対話システムを被対話体に組み込んだ場合、被対話体が大きくなり、持ち運びに不便で、しかも、落下させた際、水没させた際に、損傷が大きい。
【解決手段】 被対話体11と、被対話体11と有線または無線で接続されたサーバ13とを設け、サーバ13に音声認識ボード55、対話処理部71を配置し、また、所定の装置を操作する場合、ゲーム機を操作する場合、所定の作動体を作動させる場合に、可動部を、被対話体11と別体に設け、有線または無線で操作、作動するようにした。 (もっと読む)


【課題】大語彙連続音声認識と局所的個別の語の認識を両立させる音声認識システムを提供する。
【解決手段】クライアント1は、音声信号を入力する音声入力部11と、音声信号を示すデータをサーバ3に送信する送信部12と、を備え、サーバ3は、クライアント1から音声信号を示すデータを受信する受信部32と、受信部32で受信したデータから音声認識する音声認識部33と、音声認識部33で音声認識した結果をクライアント1に送信する送信部34と、を備え、クライアント1はさらに、サーバ3から音声認識した結果を受信する受信部13と、受信部13でサーバ3から受信した音声認識した結果を参照して、受信した音声認識結果に対応する音声信号を示すデータについて、音声認識する音声認識部14と、サーバ3から受信した音声認識結果と、音声認識部14で音声認識した結果と、から認識結果を選択する選択部17と、を備える。 (もっと読む)


【課題】高い正解精度を有する音声認識装置を提供すること。
【解決手段】音声認識装置は、少なくとも1つの言語モデル又は音響モデルを用いて入力発話を音声認識して結果を出力するモデル依存音声認識部を少なくとも2つ備える音声認識部と、複数モデル依存認識結果に含まれる認識結果の相関を計算する発話間相関評価部と、複数モデル依存認識結果に含まれる単語の連鎖の妥当性を計算する単語連鎖妥当性判定部と、発話間相関評価部と単語連鎖妥当性判定部の結果に基づいて複数モデル依存認識結果から最適な音声認識結果を選択する認識結果選択部とを備える。 (もっと読む)


ハイブリッド型音声認識システムは、クライアント側での音声認識エンジンおよびサーバ側での音声認識エンジンを使用して、それらの音声に対する音声認識結果を生成する。アービトレーション・エンジンが、クライアント側での音声認識結果およびサーバ側での音声認識結果のうちの、1つまたはその両方に基づいて、音声認識出力を生成する。 (もっと読む)


【課題】認識率を向上できる文字入力装置、文字入力方法、文字入力システム、文字入力サーバー及び端末を提供する。
【解決手段】カメラにより口唇部を撮影し唇画像データを抽出する撮影抽出手段10と、前記唇画像データから母音、撥音及び長音を認識する母音認識手段20と、前記母音、撥音及び長音に基づいて子音を探索可能な辞書により文字を認識し文字データを生成する文字認識手段30と、前記文字認識手段に接続され、前記文字データを出力する出力手段40と、を備える。 (もっと読む)


【課題】端末の負荷の軽減を達成すると共に簡単な処理にて音声認識を達成することができる音声入力分散処理システムの提供。
【解決手段】 端末100とサーバー装置200を有し、端末100は音声入力の音声認識を行い、テキスト化された音声認識結果を得、テキスト化された音声認識結果を、該テキスト化された音声認識結果に要求識別子が付与された要求コマンドに変換し、該要求コマンドをサーバー装置200に送信し、サーバー装置200は、要求コマンドを受信すると、テキスト化された音声認識結果の解析を行い、解析結果を得、解析結果を、該解析結果に通知識別子が付与された通知コマンドに変換し、該通知コマンドを端末100に送信することを特徴とする音声入力分散処理システム。 (もっと読む)


21 - 40 / 79