説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

11 - 20 / 119


【課題】例えばデータマイニングに用いるテキストを生成するのに好適な音声認識方法を提供する。
【解決手段】この発明の音声認識方法は、音声認識過程と、音声文書認識信頼度計算過程と、音声文書除去過程と、単語除去過程と、を含み、音声認識過程は入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力し、音声文書認識信頼度計算過程は音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する。そして、音声文書除去過程は音声認識結果と音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去し、単語除去過程は音声文書除去過程で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する。 (もっと読む)


【課題】認識率を低下させることなく状態仮説を効率良く枝刈りして状態仮説数を削減できるパタン認識方法および装置ならびにパタン認識プログラムおよびその記録媒体を提供する。
【解決手段】探索部15の枝刈り部154は、状態遷移モデルの探索空間を複数の領域に分割する領域分割部154aと、同一時刻で遷移する状態仮説を前記分割された領域のいずれかに振り分ける状態仮説振り分け部154bと、前記分割された各領域の枝刈り条件を設定する枝刈り条件設定部154cと、前記分割された領域ごとに、同一領域内で尤度の低い状態仮説を探索対象から除外する領域別枝刈り部154dとを含む。 (もっと読む)


【課題】音声認識システムを持つ各種情報装置において,装置が想定しない発話が装置利用者から発せられたときに,その発話を棄却することで,誤動作する割合を大幅に減らす。
【解決手段】音声認識システムを持つ各種情報処理装置1において,言語モデル学習手段10が情報処理装置1の想定しない文章をモデル化することで言語モデル7を作製し,音声認識辞書作製装置11が想定しない単語を登録した音声認識辞書8を作製する。音声認識手段3がこれらの言語モデル7と音声認識辞書8,音響モデル9を用いて音声入力手段2より入力された人間の発話を音声認識すると,音声認識結果6には各種情報処理装置1が想定しない単語であるというタグ(ラベル)が付いているため,処理手段4において自動的に情報処理装置1が想定しない発話を棄却することで,出力手段5において誤動作することを防ぐ。 (もっと読む)


【課題】電子機器に対するコマンド入力を目的として発せられたものではない音声がコマンド入力を意図したものであると誤認識されることを回避しつつ、連続音声から認識対象音声を切り出してコマンド制御を行うことを可能にする。
【解決手段】マイクロホンにより収音される連続音声にて無音区間で区切られる有音区間の音声を認識対象音声とし、その認識対象音声に音声認識を施して得られる各コマンド候補の尤度を示すスコア値を、その音声の発話速度に応じた第1の重みと当該音声の発話度とコマンド候補の発話速度との比に応じた第2の重みを乗算して補正し、その補正後のスコア値に応じてコマンド候補を絞り込む。 (もっと読む)


【課題】処理の長時間化を回避しつつ、確実に正しく認識対象情報を認識することができる音声認識装置、音声認識方法、及び、音声認識プログラムを提供する。
【解決手段】ステップS400の音声再認識処理により再認識を行う際、タッチパネル210で入力済みの正解の単語列と一致する単語列候補が設定されたビーム幅Nによる探索範囲の枝刈り対象とならないために、ビーム幅Nを順次更新しつつビーム探索を実行する。そしてステップS80において、その更新されたビーム幅Nを、ビーム幅履歴データベース記憶エリア151に記憶されたビーム幅履歴データベースに格納する。 (もっと読む)


【課題】音声認識結果の信頼度計算の処理時間を削減する。
【解決手段】この発明の音声認識装置の音素認識部が、音響モデルからモノフォン音響モデルを抽出し、そのモノフォン音響モデルを用いた認識文法で、音声特徴量系列の音素認識を行い音声ファイル単位で音素認識結果を出力する。そして、事前信頼度計算部は、フレーム毎の音素認識結果の音響スコアから当該フレームに信頼度を付与し、その信頼度を音声ファイル単位で平均した事前信頼度を計算する。音声認識処理部は、音声特徴量系列と事前信頼度を入力として、音声認識処理を行い音声認識結果と事前信頼度を出力する。 (もっと読む)


【課題】 音声認識処理を要することなく汎用性が高い、かつ簡易な構成で実用的検索精度での音声データ内の音声キーワード照合を実現する。
【解決手段】 入力された検索キーワードテキストから標準音声波形パターンと、前記標準音声波形パターンとその話速及び/又は音量が相違する複数の派生音声波形パターンを合成する音声波形合成部と、照合における類似度の閾値を、基準閾値を増減させることにより可変に設定する類似度閾値算出部と、音声キーワードデータベースを参照して、標準音声波形パターン及び複数の前記派生音声波形パターンを読み出された前記音声データの音声波形パターンと順に比較して類似度を算出し、類似度の閾値以上の類似度が算出された音声キーワードの位置を得る音声キーワード照合部とを備える。 (もっと読む)


【課題】従来よりも探索誤りの危険性が小さい経路探索技術、音声認識装技術を提供する。
【解決手段】仮説更新部6が仮説の枝刈をする際に、仮説素性抽出部61が各仮説についての素性を抽出する。仮説枝刈判別値算出部62が素性を入力として仮説を排除するか否かの指標を出力する判別関数に抽出された素性を入力した場合の出力値を算出してその各仮説についての判別値とする。仮説枝刈判定部63が判別値が所定の閾値より大きいかどうかを判定して、大きい場合には、上記判別値に対応する仮説を仮説の集合から除く。仮説の累積重み以外の属性、例えばどのノードに到達したか、どのアークを通ったか等の素性を用いることでより正確な枝刈判定を行うことができ、探索誤りの危険性を従来よりも小さくすることができる。 (もっと読む)


【課題】 離散型隠れマルコフモデルの探索コストを低減する。
【解決手段】 本発明は、シーケンスを確率密度関数に従う発生モデルを有する状態の遷移として表現する探索対象となる隠れマルコフモデルを格納するデータ記憶手段から読み出された探索対象である隠れマルコフモデルについて、近似の粒度を固定して、それぞれの粒度に対する尤度を計算し、計算された尤度と所定の閾値とを比較して該尤度が該閾値より小さくなるまで該尤度計算を繰り返し、該閾値より小さくなった尤度を新たな解候補として探索結果記憶手段に格納する。 (もっと読む)


【課題】音声認識用の閾値の設定に関わる作業を簡単にし、作業時間を抑制可能な技術を提供することを目的とする。
【解決手段】。
上記課題を解決するために、所定の判断基準に基づいて、入力された音声を認識するか否かを判定するための閾値を決定する判断値を、単語毎の発音を示す読み情報に基づいて算出する判断値算出ステップと、前記判断値に基づいて、前記閾値を求めて、前記単語毎に設定する閾値設定ステップと、をコンピュータに実行させるための音声認識用の閾値管理プログラムを提供する。 (もっと読む)


11 - 20 / 119