説明

Fターム[5D015LL02]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 後処理 (238) | 判定処理 (81)

Fターム[5D015LL02]の下位に属するFターム

Fターム[5D015LL02]に分類される特許

1 - 20 / 37


【課題】認識対象の音声品質を事前推定して音声品質の変動に対する認識処理時間の増減の影響を少なくした音声認識方法を提供する。
【解決手段】スコアレンジ計算部は、音声特徴量系列を入力として当該音声特徴量系列に対するモノフォン最尤スコアと最もスコアの低いモノフォン最低スコアを求め、その差分をフレーム毎の音響スコアレンジとして計算し、当該音響スコアレンジを時間方向に平均した音響スコアレンジRを出力する。そして、認識処理制御部は、外部から入力されるスコアレンジ基準Rと音響スコアレンジRを入力として、音響スコアレンジRをスコアレンジ基準Rで除した値に基づくスコアビーム変動係数kを計算して出力する。音声認識処理部は、音声特徴量系列とスコアビーム変動係数kを入力として、スコアビーム変動係数kの値に応じて探索ビーム幅を可変して音声認識処理を行う。 (もっと読む)


【課題】ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムを提供すること。
【解決手段】音声認識制御システム1は、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部11aと、音声認識コマンドを特定するコマンド情報と、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度DB12aと、影響度DB12aに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定部11bとを備える。 (もっと読む)


【課題】音声の入出力が可能な電子機器に対して音声入力されるコマンドの誤認識を簡単な構成で防止することを可能にする。
【解決手段】音声の入出力機能を備える電子機器において、マイクロホンから出力されるオーディオ信号に対する音声認識処理と、スピーカに与えるオーディオ信号に対する音声認識処理とを1つの音声認識処理部の時分割制御によって行い、コマンド入力音声と一致する音声がスピーカから偶然に出力される場合のコマンドの誤認識を防止する。 (もっと読む)


【課題】音声認識装置において、雑音や音声入力を意図しない音声に基づく誤認識や誤作動を低減することを目的とする。
【解決手段】音声認識装置は、音声データを入力する音声入力部と、音声認識用の複数の単語がその読み情報と対応付けて登録されている単語辞書と、音声入力部から入力された音声データに対して単語辞書を用いて音声認識し、所定値以上の評価値である読み情報に対応する単語を認識結果情報として出力する音声認識部と、音声認識部により出力される認識結果情報を、音声データが音声入力部に入力された入力時刻とともに過去の認識結果情報として蓄積する認識結果蓄積部と、認識結果蓄積部に蓄積された過去の認識結果情報に基づいて、新たに出力された認識結果情報に対応する出力情報を決定する最終結果判定部とを備える。 (もっと読む)


【課題】従来は、話題やタスク毎の複数の言語モデルにより各認識器で音声認識し、最適な認識結果を選択するが、言語モデルは全て統計言語モデルで、単語間の接続に確率情報を使用しない構文規則型の言語モデルを用いた認識器とのスコア比較は容易ではない。
【解決手段】入力音声の音声認識手段として構文規則型の言語モデルを用いる構文規則型認識手段と、同じく入力音声の音声認識手段として統計言語モデルを用いる統計言語モデル型認識手段と、同じ入力音声に対し前記両音声認識手段が音声認識した認識結果を入力し、認識結果の表記の言語的妥当性を評価して、その評価結果に基づいて前記両音声認識手段から出力される認識スコアを修正し、修正結果により認識結果を選択する結果選択手段を備える。 (もっと読む)


【課題】発話内容の修正にかかる利用者の負担を軽減させることができる音声翻訳装置、方法、およびプログラムを提供する。
【解決手段】音声入力受付部100は、日本語の発話音声の入力を受け付け、音声認識部120は、発話音声の入力が受け付けられる毎に、当該発話音声を認識して文字列を生成し、蓄積部42は文字列を順次蓄積し、判定部130は、新たに蓄積する候補である第2文字列が先に蓄積された第1文字列の言い直しであるか否かを判定し、修正部140は、言い直しでない場合には、第2文字列を蓄積部42に蓄積させ、言い直しである場合には、第1文字列を第2文字列に修正して蓄積部42に蓄積させ、翻訳部150は、蓄積部42に蓄積される毎に、蓄積されている文字列を英語に翻訳し、出力部30は、翻訳結果を出力する。 (もっと読む)


【課題】話者が運動した場合に、音声認識誤りが発生している可能性の高い箇所を抽出することができる音声認識装置を提供する。
【解決手段】話者の発話する音声を入力するマイクロフォン1と、マイクロフォン1で入力した音声から、その発話に対応する文字符号列を抽出する音声認識部2と、話者の動きを検出する話者運動情報取得部4と、話者運動情報取得部4で検出した話者の動きが所定の大きさを超えた場合に、その話者の動きが発生したときの発話から音声認識部2で抽出した文字符号列が、話者の発話する内容に適合していない可能性が高いと判断する音声認識修正スコア計算部5および要修正判定部6と、を備える。 (もっと読む)


【課題】 ドットパターン毎に異なる音声情報を関係付けたり、複数の異なるドットパターンで同一の音声情報を再生させることが可能な音声情報記録方式を提供する。
【解決手段】 リンクテーブルを生成して、ドットパターン毎に音声情報を関連付けておき、スキャナで前記ドットパターンを読み取った際に、当該ドットパターンに関係付けられた音声情報をスピーカから再生する。これにより、絵本やカード等の表面にドットパターンを印刷しておき、絵本の図柄や物語に対応した音声情報を再生したり、カードに記載されたキャラクタに対応した音声情報を再生することができる。またリンクテーブルによって、新たなドットパターンに新たな音声情報を関係付けたり、解除したり変更することができる。 (もっと読む)


【課題】発話対象の認識精度を向上すると共に、発話対象の特定が不十分な状態であっても適切な入力処理を行なうことのできる音声入力処理装置および音声入力処理方法を提供すること。
【解決手段】音声入力処理部10は、運転者の顔の向きや生体情報、車両の状況、音声認識エンジン20による認識確度、音声区間の長さなどからユーザの音声が車載装置に対する音声入力である可能性を判定し、その判定結果に基づいて段階入力処理部11が音声入力の動作を段階的に変化させる。 (もっと読む)


【課題】センサ装置によりユーザに関する情報を取得し、取得された情報を解析して特定の結論を導き出してユーザに提供する。
【解決手段】センサ装置例えば例えばカメラ装置で取得された画像データをユーザIDと共にサーバに送信し、サーバ側では、送信された画像データに対して1次解析処理を施す。1次解析処理では、例えば画像データに対して所定の処理を施し、基準となる参照情報と比較する。1次解析処理の結果に対して閾値判断を行い、閾値を超えたと判断されれば、画像データまたは1次解析結果に対してさらに2次解析処理を行う。2次解析処理は、例えば1次解析処理の結果が閾値を超えた原因を解析するような処理である。2次解析処理の結果は、例えば対応する画像データと共にユーザなどに通知される。 (もっと読む)


【課題】 音声認識中にユーザがマイクロフォンなどの音声入力デバイスを抜いた場合(または挿した場合)、電気的なノイズが発生することにより、音声認識の誤認識が生じる恐れがあった。
【解決手段】 音声認識装置は、音声を入力する音声入力デバイス10と、音声入力デバイス10を取り外し可能に接続する接続部102と、音声入力デバイス10により接続部102を介して入力された音声を認識する音声認識部103と、接続部102における音声入力デバイス10の接続状態を監視し、該接続状態が変化したときに該変化を通知するためのイベントを出力する監視部104とを備える。音声認識部103は、監視部104から上記イベントを受信すると音声認識処理を中断する。 (もっと読む)


【課題】大語彙を対象とした音声対話システムにおいて、語彙を短時間で、かつ確実に認識する。
【解決手段】音声対話システムに、入力された音声を音声データに変換する音声入力部2と、複数の単語が格納される第1の認識辞書と、第1の認識辞書に格納されている何れかの単語と対応付けられた第2の認識辞書とを記憶する音声認識辞書記憶部3と、第1の認識辞書を用いて、変換した音声データの中に含まれるキーワードを音声認識すると共に、その音声認識されたキーワードの信頼度を算出し、算出した信頼度が所定の閾値以上である場合、第2の認識辞書を用いて、音声データを音声認識する音声認識部4と、音声認識の結果を出力する出力部8と、各部の動作を制御する対話管理部6と、を設ける。そして、対話管理部6は、ユーザとの対話状況に応じて閾値を変更する。 (もっと読む)


【課題】音声応答の出力中にユーザからの音声入力があると、出力中の音声応答がユーザにとって重要であるか否かをより的確に判断可能にした音声応対話装置を提供する。
【解決手段】入力音声として認識される単語である認識語、入力音声に対応して出力するための音声応答、認識語および音声応答の優先度、認識語の入力履歴、ならびに音声応答の出力履歴が格納された記憶部と、音声応答の出力中に入力音声を受け付けると、入力音声に重畳する音声応答を除去して認識語を特定し、音声応答および認識語の優先度を入力履歴および出力履歴を用いて補正し、音声応答と認識語の補正後の優先度を比較し、音声応答の方が高ければ出力を維持し、認識語の方が高ければ、音声応答を中断する制御部とを有する。 (もっと読む)


【課題】音声認識用文法を単独で用いる場合、又は離散単語認識用の文法と併用する場合であっても、発話の終了時点を早期に特定することができ音声認識レスポンスを早めることが可能な音声認識装置、音声認識方法、及びコンピュータプログラムを提供する。
【解決手段】音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする。言語モデルに関する情報、音声認識用文法に基づいて変換される認識候補単語列、及び単語列の末尾の単語が最終単語であるか否かを示す情報を記憶しておき、言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する。抽出された認識候補単語列の末尾の単語が最終単語であると判断された場合、基準時間より短時間で音声認識結果を出力し、最終単語ではないと判断された場合、基準時間経過時に音声認識結果を出力する。 (もっと読む)


【課題】入力音声信号を認識し、理解することにより応答音声信号を生成してユーザに出力する音声対話装置において、連結する複数の音声信号間における声質の乖離により、応答音声をユーザが聞き落とす可能性があった。このため、上記声質の乖離の影響を軽減した音声対話装置の実現を目的とした。
【解決手段】応答音声信号聞き落としの可能度を、音声信号の音響的特徴の差(基本周波数、エネルギー値、AQ値の何れか)、あるいは話速の差等が予め設定した値以下となるように出力音声信号の調整を行うようにした。この調整は、音声信号の連結部分にポーズを挿入する、話速の変化を少なくする、基本周波数の変化を少なくする等により行う。 (もっと読む)


【課題】 音声認識結果における誤認識が繰り返されることを回避する。
【解決手段】 音声入力部201から入力された音声に対し、音響処理部202〜探索部204によって音声認識を行い、その複数の認識結果を認識スコアとともに出力する。認識結果選択部205では認識スコアの高い順に認識結果の所定数を選択し、該選択された所定数の認識結果を認識結果出力部209で出力する際に、最高順位の認識結果を認識結果履歴208に保持しておく。このとき、現在の最高順位の認識結果が、認識結果履歴208に保持された前回の履歴と一致する場合、当該認識結果の順位を下げて出力することによって、同じ誤認識が繰り返されることを防ぐ。 (もっと読む)


【課題】音声認識用の音声を入力する際、発声の仕方や発声環境が誤認識を引き起こすものであるかどうかを、誤認識の原因ごとに区別してユーザに通知可能にすること。
【解決手段】マイク入力部10から音声を入力し、音声認識部20で音声認識を行う。マイク入力部10の背景雑音レベル評価部16は、背景雑音が一定レベル以上であるか否かを判定する。オーバーフロー検出部17は、音声区間のうちの局所的(時間局所的)なオーバーフローが音声認識の認識結果に影響を与えるレベル以上であるか否かを判定する。話頭切断検出部18は、入力音声バッファ12に格納された音声信号において話頭切断の有無を判定する。メッセージ表示部15は、これらの判定結果を区別可能にディスプレイ40に表示させる。 (もっと読む)


【課題】従来の音声認識装置においては、誤った認識結果を出力する場合もあり、かかる場合には、本音声認識装置に対するユーザの信頼を構築できない、という課題があった。
【解決手段】音声の入力を受け付ける音声入力部と、格納している音響データを用いて、受け付けた音声に対して音声認識処理を行い、当該音声認識処理の結果である音声認識処理結果情報を取得する音声認識部と、受け付けた音声に対して、前記音響データを用いて発音評定処理を行い、発音評定結果を取得する発音評定部と、前記発音評定結果が所定の閾値に対して所定の関係にあるか否かを判断する判断部と、前記判断部が所定の関係にあると判断した場合のみ、前記音声認識部が取得した音声認識処理結果情報についての音声認識結果を出力する出力部を具備する音声認識装置により、誤った認識結果を出力することを防止できる。 (もっと読む)


【課題】使用者の発話の習熟度を適切に判定し、効率の良い対話を行うことができる音声認識機器制御装置を提供する。
【解決手段】使用者から発話が入力される音声入力手段2と、入力された発話を認識する音声認識手段3と、使用者への応答を出力する応答出力手段10と、音声認識手段3の認識結果に基づいて機器を制御する機器制御手段11とを備える。機器を制御するために必要な所定数の項目のうち、認識された発話から特定される項目の個数を検出する入力項目数検出手段4と、該発話から特定される項目の個数の基準値を設定する基準入力項目数設定手段6と、入力項目数検出手段4により検出された項目の個数と、基準入力項目数設定手段6により設定された基準値とを比較する入力項目数比較手段7と、比較の結果に基づいて使用者の発話の習熟度を判定する習熟度判定手段8と、判定された習熟度に応じて出力する応答を制御する応答制御手段9とを備える。 (もっと読む)


【課題】比較的長い入力音声データに含まれる複数の発話に対する音声認識結果を俯瞰することのできる音声認識システムと方法並びにプログラムの提供。
【解決手段】音声データを入力する音声入力手段110と、音声入力手段より入力音声データを受け音声認識を行う音声認識手段120と、音声認識手段で音声認識された認識結果及び/又は前記認識結果を構成する各部位に対して優先度を求める認識結果評価手段140と、前記認識結果と前記優先度とを記憶する記憶手段130と、前記優先度に従い、前記認識結果及び/又は前記認識結果を構成する各部位の表示/非表示を判定し出力情報を作成する認識結果整形手段150と、前記出力情報を出力する出力手段160と、を備える。 (もっと読む)


1 - 20 / 37