説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

51 - 60 / 119


【課題】離散型HMMの探索コストを低減する。
【解決手段】本発明は、入力されたオリジナルのHMMの状態を初期状態確率、状態遷移確率、または、シンボル出力確率を用いて該HMMをクラスタリングすることにより状態数を削減し、クラスタリングされたHMMと該オリジナルのHMMをデータ格納手段に格納し、近似尤度による探索結果から閾値の初期値を計算し、閾値を用いて近似尤度または正確な尤度を計算し、正確な尤度を用いて閾値を更新する。正確な尤度を計算する際には閾値を用いて計算するかしないかを判断することにより枝刈りを行う。 (もっと読む)


【課題】背景雑音以外の要因による信頼度の低下に対応することができ、探索仮説間の尤度分布を考慮し、音声認識する際の認識精度を維持することができる音声認識装置及び音声認識プログラムを提供する。
【解決手段】音声認識装置1は、特徴ベクトル算出手段3によって、入力音声の音響特徴量を算出し、エントロピー算出手段11によって、音響特徴量の出力確率である音響スコアから、探索仮説の各ノードにおける各時刻のエントロピーを算出する。そして、音声認識装置1は、信頼度算出手段13によって、エントロピーから、各時刻における音響スコアの重み付けを変更する基準となる信頼度を算出し、音響スコア重み付け変更手段15によって、信頼度に基づいて、音響スコアの重み付けを変更する。 (もっと読む)


【課題】 ユーザの操作や他のセンサデバイスの情報を参照して誤認識を確認対話無しに自動的に棄却できる音声対話システム、音声対話方法、音声入力装置、プログラムを提供する。
【解決手段】 認識結果評価手段330は、音声認識結果を受け取ると、利用状態取得手段3301により、利用者が利用状態にあるか否かを利用状態検出手段310から取得し、利用状態でなければ雑音による誤認識と判断し、棄却手段3302により自動的に音声認識結果を棄却する。 (もっと読む)


【課題】雑音の変動に対応できる音声認識システムの提供。
【解決手段】雑音推定手段2が雑音状況を推定すると、音声比較手段3は、前記推定した雑音状況に応じて、音声認識動作に必要な発声回数を決定する。音声比較手段3は、発声回数が、前記決定した必要発声回数に達した場合に、音声記憶手段4に記憶した発声を音声認識手段7に出力する。音声認識手段7は、前記各発声を同一内容と仮定して音声認識を行う。以上により、周囲の雑音状況に応じた制御が実現され、高騒音環境下での高い認識性能を確保するとともに、低騒音環境下での使い勝手の向上を実現できる。 (もっと読む)


テストパターンを既定の部類セットからの部類に割当てるため、テストパターンの部類帰属確率と、特徴空間におけるテストパターンの近傍のトレーニングパターン数に基づいて部類帰属確率の信頼区間を計算する。テストパターンの近傍におけるトレーニングパターンの数は、トレーニングパターンの確率密度関数のたたみ込みを、テストパターンを中心とするガウス平滑関数を用いて、計算して得られる。この計算では、トレーニングパターンの確率密度関数がガウス関数の混合として表される。円滑関数とガウス関数の混合とのたたみ込みは分析的に表すことができる。
(もっと読む)


【課題】ビームサーチに基づく方法と基準フレームに基づく方法とを組み合わせて、音声認識性能に悪影響を与えず、効率的に出力確率計算の回数を削減する音声認識装置を提供する。
【解決手段】音響処理部101、音声区間検出部102、辞書部103、照合部104、探索対象選択部105、記憶部106、判定部107を備え、ビームサーチに基づき探索範囲を選択する処理と、基準フレームを設定し記憶する処理と、ある遷移パスにおける出力確率を記憶する処理と、ある遷移パスにおける出力確率が記憶されているか否かを判定する処理とを備え、ビームサーチに基づき探索範囲を選択するとともに、ある遷移パスの出力確率を基準フレームを設定してから更新するまでの区間において1回だけ計算し、その値を記憶し、それ以降のフレームにおいて遷移パスの出力確率が記憶されている場合は記憶値を出力確率の近似値とすることで、出力確率計算の回数を削減する。 (もっと読む)


【課題】状況に応じて、音声認識によるユーザ所望のコマンド処理を的確に且つ迅速に行うことができる電子機器を提供することである。
【解決手段】ディジタルテレビ受像機100において、判別手段(CPU121、判別プログラム123c)によって、外部から音声入力があった場合、表示手段(受像部9)に表示されたメニュー画面に係るメニュー画面識別情報を判別し、音声認識結果に基づき得られたコマンド情報が当該メニュー画面識別情報に対応付けられてコマンド情報記憶手段(コマンドテーブル123a)に記憶されたコマンド情報に該当するか否かを判別し、判別手段により音声認識結果に基づき得られたコマンド情報が当該コマンド情報記憶手段に記憶されたコマンド情報に該当すると判別されたことに基づいて、制御手段(CPU121、制御プログラム123d)によって、当該コマンド情報に対応する制御を行う。 (もっと読む)


【課題】後ろ向き木構造の辞書データを用いた音声認識装置において、当該木構造の末端からルートまで並んだ語列の途中までの発話であっても認識できるようにする。
【解決手段】音声認識装置が、複数の語を木構造中の複数のノード101〜156として有する木構造辞書データ100´を記憶する記憶媒体を有している。そして、この音声認識装置は、入力音声と、当該木構造の末端のノード151〜156の示す単語を時間的に順再生した音声に対応する順音響モデルとを比較する。さらに音声認識装置は、入力音声が時間的に逆に再生された逆音声と、上記の木構造に沿ってルートに近づく並びの語列を時間的に逆に再生した音声に対応する逆音響モデルとを、区切りノード101、121、122、123のいずれかを先頭として、当該並びの逆順に比較する。そして音声認識装置は、これらの比較結果に基づいて、入力音声に対する一致度が高い語列を出力する。 (もっと読む)


【課題】ユーザーが目的を達成するための適切な入力を行うことを可能にする対話装置を提供することを目的とする。
【解決手段】対話装置10は、音声認識処理部12、音声入力解釈部14、情報抽出処理部16、応答内容生成部18、処理結果評価部20、処理結果比較部22とから構成され、発話内容の単語単位毎に認識処理の誤り度、解釈処理の誤り度及び抽出処理の誤り度を計算し、前記認識処理の誤り度、前記解釈処理の誤り度及び前記抽出処理の誤り度の中で最も誤り度が高い処理結果を前記所定単位毎に求め、前記最も誤り度が高い処理結果に基づいて前記ユーザーに対する修正応答内容を生成する。 (もっと読む)


【課題】本発明は従来システムに関連した問題を実質的に減少、或いは除去する話者に依存しない認識システム及び方法を提供する。
【解決手段】ユーザが定義したフレーズの話者に依存しない認識のための外れ語彙のスコアを決定するシステム及び方法が、登録文法(36)を用いて話者に依存しない(SI)認識モデル(34)のセットと共にユーザが定義したフレーズを登録することを含む。話されたフレーズの登録文法のスコアは、登録文法(36)を用いて話されたフレーズの特徴をSI認識モデル(34)と比較することによって、決定される。登録文法のスコアは、外れスコア(94)を発生するためにペナルティーが適用される。 (もっと読む)


51 - 60 / 119