説明

Fターム[5D015LL00]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048)

Fターム[5D015LL00]の下位に属するFターム

Fターム[5D015LL00]に分類される特許

41 - 60 / 79


【課題】携帯端末で音声認識を行う際に、使い勝手が向上し、認識精度の向上が図れるようにする。
【解決手段】携帯端末1に、組込型音声認識機能が実装される。組込型音声認識機能の音響モデルデータベース51や辞書データベース52では、小語彙の辞書及び数種類の音響モデルに限定される。ネットワーク網4にはネットワーク型音声認識機能が設けられる。ネットワーク型音声認識機能では、音響モデルデータベース61には、多数の音響モデルが蓄積され、辞書データベース62には、大語彙の辞書が蓄積される。組込型音声認識機能とネットワーク型音声認識機能とでは性質が異なっていることに着目し、組込型音声認識機能とネットワーク型音声認識機能との双方を効果的に使用して、使い勝手が向上し、全体としての性能の向上を図る。 (もっと読む)


【構成】 音声認識システム10はサーバ20を含む、サーバ20は人間16の発する音声を音声認識処理して人間16が指示する物品24を特定する。サーバ20は、人間16の位置を検出し、人間16の近傍に存在する物品24に関する単語を音声認識するのに必要な情報を音声認識辞書126から抽出して音声認識ローカル辞書205Bを構築する。そして、人間16が発した音声を、音声認識ローカル辞書205Bを用いて音声認識する。
【効果】 音声認識処理に必要な時間を短縮するとともに音声認識の精度を向上することができる。 (もっと読む)


【課題】高い帯域の信号に対してフレーム消去隠蔽を行う方法を提供する。
【解決手段】低い帯域の信号に関して高い帯域の信号の周期的な強度を計算し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるかを判断し、高い帯域の信号の周期的な強度が予め構成されたしきい値以上であるならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うピッチ周期反復方法を使用し、高い帯域の信号の周期的な強度が予め構成されたしきい値よりも低いならば、現在の失われたフレームの高い帯域の信号に対してフレーム消去隠蔽を行うために前のフレームデータ反復方法を使用するステップを含んでいる。本発明はさらに高い帯域の信号に対してフレーム消去隠蔽を行う装置とスピーチ復号装置を開示している。音声信号の品質の低下の問題が避けられる。 (もっと読む)


【課題】プログラムの中身を、実行順序が変更可能である複数のシナリオ実行プログラムの集合体とする。
【解決手段】プログラムA,Bの中身をシナリオ1〜3,4〜6に分解し、それらの集合体としてプログラムA,Bを作製する。シナリオ1〜6それぞれを音声認識或いは音声合成の音声に共通部分がある基本シナリオをアレンジして作製する。プログラムCも、シナリオ8〜10と分解することで、基本シナリオをアレンジして作製する。 (もっと読む)


【課題】ユーザに発話を促す提示について正確性を向上させることが可能な音声認識システム及び音声認識装置を提供する。
【解決手段】音声認識システム1は、テレビ23と、音声データ取得部15と、予想判断部16と、発話可能区間判断部17と、表示部11c及び映像出力部23bとを備えている。テレビ23は音声を音声出力部11aから出力する。音声データ取得部15は、テレビ23が音声出力部11aから出力しようとする音声データを出力前に予め取得する。予想判断部16は、予め取得された音声のデータに基づいてエコーの状態を予測判断する。発話区間判断部17は、予想判断されたエコーの状態と、ユーザの発話時間とから、ユーザが発話可能な発話可能区間を判断する。表示部11c及び映像出力部23bは、判断された発話可能区間を提示する。 (もっと読む)


【課題】音声認識機能をオフした後であっても音声認識機能を用いて即座に機器の制御を行うことが出来る音声認識制御装置を提供する。
【解決手段】ユーザが発する音声による命令を認識する音声認識部12を備え、音声による命令に応じた機器の制御を実行する音声認識制御装置であって、この装置は、音声認識部12のオン状態とオフ状態を切替えるスイッチ手段と、音声認識部12をオン状態からオフ状態へ切替えるスイッチ手段の操作が行われた時から時間の計測を開始するカウンタ13aとを備え、カウンタ13aが時間の計測を開始してから所定時間を計測するまでの期間内において、音声認識部12がオン状態であるオン期間を有する。 (もっと読む)


【課題】 既に提供されているアプリケーションプログラムに対して改変を施すことなく、音声認識処理及び音声合成処理の導入やその制御を行うこと。
【解決手段】 情報処理装置を、既存のアプリケーションプログラムを実行する実行手段と、アプリケーションプログラムの実行状態を監視する監視手段と、監視手段による監視結果に基づいて、音声認識処理又は音声合成処理の制御を行う制御手段と、を含む装置として構成する。 (もっと読む)


【課題】適切な応答を選択することにより対話を長続きさせることを可能とする対話処理装置、及び対話処理装置に供される応答スコア情報生成装置を提供する。
【解決手段】発話を示す複数の発話情報、及び発話の各々に対応する応答を示す応答情報を含む応答知識情報が記憶された応答知識情報記憶手段と、応答知識情報記憶手段により記憶された応答知識情報を、発話情報と応答情報との対応を示す発話推移行列に変換する変換手段と、変換手段により変換された発話推移行列の最大固有ベクトルを算出する算出手段と、算出手段により算出された最大固有ベクトルの各要素と応答情報に示される各応答とが対応づけられた応答スコア情報を生成する応答スコア情報生成手段と、応答スコア情報生成手段により生成された応答スコア情報が記憶される応答スコア情報記憶手段と、を有する。 (もっと読む)


【課題】音声認識が失敗した原因を特定し、ユーザが音声認識に失敗した原因を知り、適切な対処を取りうるようにする。
【解決手段】本発明の音声認識装置100は、音声認識失敗原因分析部104が、入力音声録音部102から受け渡された入力音声の録音内容を分析し、音声認識失敗の原因を判明させる。具体的には、雑音の推定や発話の態様(例えば音量や発話速度)を判定して、音声認識の失敗がいずれに起因するかを判明させ、その結果を音声認識失敗原因分析結果通知部105へと受け渡す。音声認識失敗原因分析結果通知部105は、音声認識失敗原因分析部104から受け渡された音声認識失敗の原因の分析結果に基づき、入力音声録音部102から受け渡された録音された入力音声とともに、該分析結果を報知する画像または音声を合成し、出力インターフェース部202を介してディスプレイ400またはスピーカ500から出力するように制御する。 (もっと読む)


【課題】音声操作の利便性を向上させる音声操作装置を提供する。
【解決手段】ジャンル名を示す語句と当該ジャンル名に当てはまらないことを示す語句との組み合わせからなる音声データを催告メッセージSMとし、ジャンル名の異なる前記催告メッセージSMを複数記憶する記憶手段と、前記記憶手段に記憶されている一の催告メッセージSMを出力する出力手段と、前記出力手段により出力された、前記一の催告メッセージSMに対する返答を示す音声を入力する入力手段と、前記入力手段により入力された返答を示す音声を認識する認識手段と、を備え、前記出力手段は、前記認識手段により認識された音声が前記当てはまらないことを示す語句であった場合、前記記憶手段に記録されている他の催告メッセージを出力する。 (もっと読む)


【課題】 簡易で柔軟性に富み、ユーザがストレスを感じることなく利用でき、音声認識の精度の高い音声認識システムを提供する。
【解決手段】 音声情報を入力する音声入力手段と、カテゴリコードを意味するドットパターンが、カテゴリを意味する文字、図形、またはアイコンと重畳印刷された媒体と、からなり、ドットパターンを読み取る光学読取手段で、前記媒体上でカテゴリを意味するドットパターンを読み取ることによって、その後入力される音声認識の精度を高めた音声認識システムとした。 (もっと読む)


【課題】入力音響信号に含まれる非定常的な雑音信号の推定を行って定常的な雑音信号以外にも適用可能な高精度な音声信号区間を推定する方法、及びその装置の提供。
【解決手段】音響信号分析手段により、入力信号を一定区間ごとに切り出したフレームごとに音声特徴量を抽出する。音響信号分析手段で抽出された音声特徴量の分布パラメータをパラメータ生成部で生成し、その分布パラメータに対して、雑音の存在しないクリーン音声確率モデルを記憶したクリーン音声記憶部24のパラメータを加味し、並列非線形カルマンフィルタと並列カルマンスムーザを用いて処理して、雑音モデルパラメータ推定手段15により雑音信号の確率モデルパラメータを生成する。音声/非音声状態確率比算出手段16により、雑音モデルパラメータと入力信号とを処理してフレームごとに音声状態確率と非音声状態確率との確率比を算出して、フレームごとに音声/非音声状態を判定する。 (もっと読む)


【課題】本発明は、利用者の発話内容を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を出力するものである。
【解決手段】本発明は、利用者の前記発話内容を構成する第一形態素情報と予め記憶されている各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報を検索する話題検索部320と、話題検索部320で検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得する回答文検索部330とを備える。 (もっと読む)


音声認識システムのパフォーマンスを評価する方法は、1組の語のうちの1つの語の事例の認識または様々な語の事例の認識のいずれかに対応する、等級315、320を決定する段階を含むことが可能であり、等級はシステムのパフォーマンスのレベルを表示し、等級は認識率および少なくとも1つの認識計数に基づく。音声認識システムのパフォーマンスを評価するための装置は、1組の語のうちの1つの語の事例の認識または様々な語の事例の認識のいずれかに対応する、等級を決定するプロセッサ224を含むことが可能であり、等級はシステムのパフォーマンスのレベルを表示し、等級は認識率および少なくとも1つの認識計数に基づく。
(もっと読む)


車両の通信デバイスを通じた自動音声認識の手段による情報記憶を提供する方法は、外部ソースと車両のユーザとの間に音声通話を確立させることと、外部ソースから情報を受信することと、車両の自動音声認識ユニットを用いて、受信した情報を処理することと、将来の読出または使用のために、認識した発話を文字形式で記憶することとを含む。
(もっと読む)


【課題】認識対象(単語、発話単位など)間の認識確率の不均一を低減し、より確実な音声認識を実現する。
【解決手段】音声認識装置11は、音声信号を入力時系列に従う順方向に認識する順方向認識処理部20と、音声信号を逆方向に再生する逆再生部15と、この逆再生部15が出力する音声信号を認識する逆方向認識処理部30と、認識処理部20,30の処理結果を統合して判定する統合判定部40とを含む。順方向認識処理部20および逆方向認識処理部30は、音声分析部21,31と、音響ライブラリ22,32と、照合部23,33とを含む。照合部23,33は、入力音声信号が、音響ライブラリ22,32に登録された単語(認識候補)である尤もらしさを表す順方向尤度および逆方向尤度をそれぞれ生成する。統合判定部40は、それらを総合的に判定して、認識結果を生成する。 (もっと読む)


【課題】様々な特性を有する認識対象の信号データから評価用データを生成し、且つ当該生成した評価用データに対するパターン認識手段の認識性能の分布情報を生成するのに好適な評価用データ生成装置及び認識性能分布情報生成装置、並びにパターン認識に関する仕様情報に応じたパターン認識手段の認識性能の分布情報を生成するのに好適な認識性能分布情報生成システムを提供する。
【解決手段】評価基準となる認識対象に係る低次信号ベクトル空間を複数の領域に区分し、当該区分された低次信号ベクトル空間に対して、その重心においてそれぞれ例えば、均等に交差する複数本の座標軸を放射状に設定し、当該座標軸と領域の区分境界との交差位置に最も近い位置にある低次信号ベクトルを選択し、当該選択した低次信号ベクトルに対応する信号データを用いて評価用データを生成する。そして、当該生成した評価用データに対する認識結果から認識性能分布情報を生成する。 (もっと読む)


【課題】 対話者が話しかける自然な文章を短時間で正確に認識することが可能な技術を提供する。
【解決手段】 音声を入力して音データに変換する音声入力手段と、対話者を繰り返し撮影して撮影された画像データを時刻と関連付ける撮像手段と、音データに基づいて音声入力開始時刻と音声入力終了時刻を検出する時刻検出手段と、音声入力開始時刻から音声入力終了時刻までの音データから文章データを作成する文章データ作成手段と、音声入力開始時刻から音声入力終了時刻までの画像データから対話者の発話状態を認識する発話状態認識手段と、対話者の発話状態から音声入力開始時刻から音声入力終了時刻までの期間が適切な発話区間であるか否かを判断する発話区間判断手段と、音声入力開始時刻から音声入力終了時刻までの期間が適切な発話区間であると判断された場合に、文章データを出力する文章データ出力手段を備えている。 (もっと読む)


【課題】 音声認識の頭切れを防止するとともに、テンポのよい会話を実現することができる音声認識装置および音声認識装置を備えたロボットを提供する。
【解決手段】 会話の台詞を組み立てる制御部53と、台詞に基づいて出力音声信号を生成する音声合成部55と、出力音声信号に基づいて出力音声を出力するスピーカ18と、ユーザ音声を少なくとも含む音声を入力信号に変換するマイクロフォン14と、入力信号から出力音声に係る信号成分を除去して入力音声信号を生成する出力音声除去部57と、入力音声信号に基づいてユーザ音声を認識し、認識結果を制御部53に出力する音声認識部59とを備え、制御部53,61が、台詞に基づいて、音声認識部59によるユーザ音声の認識開始のタイミングを、出力音声の出力開始から所定時間後、かつ、出力音声の出力終了前に制御することを特徴とする。 (もっと読む)


【課題】 音声対話システムにおいて、ユーザ所望の情報を高い確率で提供すること。
【解決手段】 音声対話システムにおいて、ユーザにより入力された文字列あるいはユーザにより入力された音声から変換された文字列の意味内容を解析する意味解析部4と、意味解析部4から意味情報を入力して、ユーザに対する応答処理を制御する対話制御部6と、ユーザに関連する情報を蓄積するユーザ関連情報データベース9および知識データベース7を参照して、ユーザに提供するレコメンドを生成するレコメンド生成部10と、対話制御部6またはレコメンド生成部10から応答内容に関する情報を入力して、対応する音声情報または画像情報を生成する応答出力生成部12とを有して構成される。 (もっと読む)


41 - 60 / 79