説明

Fターム[5D015HH00]の内容

音声認識 (5,191) | パターン照合による認識 (426)

Fターム[5D015HH00]の下位に属するFターム

Fターム[5D015HH00]に分類される特許

1 - 20 / 106


【課題】状態や遷移を多量に含んでいるNFSAを決定化しようとした場合に多くの記憶領域が必要になる。
【解決手段】オートマトン決定化方法は、状態生成ステップと、第1遷移生成ステップと、第2遷移生成ステップと、第1削除ステップと、を含む。状態生成ステップは、有限状態オートマトンに含まれる第1状態から出て行く遷移であって、第1記号が割り当てられている第1遷移が2以上存在する場合に、新たな第2状態を生成する。第1遷移生成ステップは、第1状態から第2状態への遷移であって、第1記号が割り当てられた第2遷移を生成する。第2遷移生成ステップは、第1遷移それぞれに対して、第1遷移の次の状態から出て行く遷移である第3遷移の前の状態を第2状態に置き換えた第4遷移を生成する。第1削除ステップは、第4遷移を生成した第1遷移の次の状態であって、第1遷移以外に入ってくる遷移が存在しない状態を削除し、削除した状態から出て行く遷移を削除し、第4遷移を生成した第1遷移を削除する。 (もっと読む)


【課題】雑音を反映したガウス分布の識別性を、少ない計算量で向上させることができる音響モデル処理装置を提供する。
【解決手段】フレーム集合導出手段92は、雑音を含む音声のデータである雑音重畳データであって、個々のフレームに関して、フレームに対応する音素の特徴を示すガウス分布の識別情報が付加された雑音重畳データを用いて、識別不能ガウス分布の識別情報が付加されたフレームの集合を、識別不能ガウス分布特定手段91によって特定された識別不能ガウス分布毎に導出する。変換行列算出手段93は、フレーム集合導出手段92によって導出されたフレームの集合を、フレームの集合間の分離度を最も高める空間に射影する変換行列を算出する。パラメータ追加手段94は、雑音重畳データを変換行列で変換した結果得られるデータの平均および分散を、音響モデル内のガウス分布の平均および分散に追加する。 (もっと読む)


【課題】状態数、状態遷移数を削減したサイズの小さな音声認識用WFSTを作成する音声認識用WFST作成装置と、その音声認識用WFSTを用いた音声認識装置を提供する。
【解決手段】音素モデル構造表作成部は、音響モデルの要素である音素環境と状態位置と状態数で特定されるHMM状態にHMM状態IDを付与し、そのHMM状態IDの表を音素モデル構造表として作成して音素モデル構造表記憶部に記憶する。構造合致照合部は、複数の音響モデル間において同一の音素環境と状態位置と状態数である複数の状HMM態IDを併合させて新たに併合したHMM状態IDを付与し、そのHMM状態IDと対応する音素環境と状態位置と状態数とから成る表になるように音素モデル構造表を更新する。音響モデルWFST作成部は、その併合されたHMM状態IDを入力とし、出力を音素環境とする併合音響モデルWFSTを作成する。 (もっと読む)


【課題】認識率を低下させることなく状態仮説を効率良く枝刈りして状態仮説数を削減できるパタン認識方法および装置ならびにパタン認識プログラムおよびその記録媒体を提供する。
【解決手段】探索部15の枝刈り部154は、状態遷移モデルの探索空間を複数の領域に分割する領域分割部154aと、同一時刻で遷移する状態仮説を前記分割された領域のいずれかに振り分ける状態仮説振り分け部154bと、前記分割された各領域の枝刈り条件を設定する枝刈り条件設定部154cと、前記分割された領域ごとに、同一領域内で尤度の低い状態仮説を探索対象から除外する領域別枝刈り部154dとを含む。 (もっと読む)


【課題】WFSTを用いたネットワーク表現を利用した音声認識パラメータの最適化を図る。
【解決手段】本発明の音声認識装置は、記録部、WFST合成部、特徴量抽出部、WFST型ログリニアデコーダ、出力シンボル抽出部を備える。記録部は、発音辞書モデルと言語モデルと音響モデルと重みベクトルαとを記録する。WFST合成部は、発音辞書モデルと言語モデルと音響モデルを合成し、WFSTネットワークを出力する。WFST型ログリニアデコーダは、特徴量ベクトルの時系列が与えられたときの対数領域でのアーク系列AのスコアW(X,A)を、特徴量ベクトルの時系列Xとアーク系列Aから得られる素性ベクトルφ(X,A)と、重みベクトルαとの線形表現で表現し、最もスコアの高いアーク系列を出力する。出力シンボル抽出部は、アーク系列に対する単語系列を求め、出力する。 (もっと読む)


【課題】発声者が収音器の近くにおらず低精度の音声認識が行われることを抑制すること。
【解決手段】収音する収音器16と、収音器16に対し音声を発する発声者の画像を撮影する撮影機18と、前記収音される音声に基づく音声認識を行う音声認識機能部132と、前記撮影される画像に前記発声者の少なくとも一部を示す発声者画像が含まれていない場合に、音声認識機能部132が音声認識を行うことを制限する認識・学習判定部142と、を含むことを特徴とする発声内容認識装置10。 (もっと読む)


【課題】従来よりも探索誤りの危険性が小さい経路探索技術、音声認識装技術を提供する。
【解決手段】仮説更新部6が仮説の枝刈をする際に、仮説素性抽出部61が各仮説についての素性を抽出する。仮説枝刈判別値算出部62が素性を入力として仮説を排除するか否かの指標を出力する判別関数に抽出された素性を入力した場合の出力値を算出してその各仮説についての判別値とする。仮説枝刈判定部63が判別値が所定の閾値より大きいかどうかを判定して、大きい場合には、上記判別値に対応する仮説を仮説の集合から除く。仮説の累積重み以外の属性、例えばどのノードに到達したか、どのアークを通ったか等の素性を用いることでより正確な枝刈判定を行うことができ、探索誤りの危険性を従来よりも小さくすることができる。 (もっと読む)


【課題】ある連続音の特徴を改善し、あらゆる言語文を正しく識別でき、よって、サンプルを用いず、台湾中国語、英語、日本語、ドイツ語、フランス語、韓国語、ロシア語、広東語、台湾語等のすべての言語を識別可能なあらゆる言語を識別可能な識別方法を提供する。
【解決手段】ある連続音(word)が1個以上の単音を含み、あらゆる言語のある連続音の特徴は、あらゆる言語の未知の連続音から抽出し、これら未知の連続音は、マトリックス値を用いて表示し、144次元空間内に散布され、あらゆる言語の既知の連続音の特徴は、144次元空間に散らばり、知の連続音周囲の未知の連続音の特徴によりシミュレート及び計算され、本発明は12個の弾性フレームを含み、長さが等しく、フィルターが無く、オーバーラップせず、ある連続音を、長さがさまざまな音波(さまざまな音節数を持つ)12×12マトリックスに転換し、ベイズ識別法により比較識別する。 (もっと読む)


【課題】両手を使ったトランスクリプション等に用いられる場合であっても、できるだけ作業効率を損なわずに、再生に関わる操作が可能となる録音再生装置を提供する。
【解決手段】音声情報の入力を受付けて記録する録音部と、該記録された音声情報の再生を実行する再生部と、を備えた録音再生装置において、前記再生部は、入力された音声情報における歯音を検出する検出部と、前記検出部の検出結果を用いて、再生に関わる動作を制御する動作制御部と、を備えた録音再生装置とする。 (もっと読む)


【課題】音声単位別の正規化された尤度比モデルの作成およびこの尤度比モデルを用いて正規化された音声認識の信頼度を算出する。
【解決手段】音響モデル280と、音声データと正解ラベルで構成される開発データ200と、GMM210とを用いて、音声データの音響特徴量をフレームごとに算出し、音響特徴量に対して、正解ラベルと音響モデル280を用いて、正解ラベルに含まれる音声単位の正解尤度を算出し、音響特徴量に対して、GMM210によるGMM尤度を算出し、フレームごとに、正解尤度とGMM尤度の音声単位別尤度比を算出し、開発データ200に含まれる音声単位ごとに、音声単位に対応する音声単位別尤度比を確率変数とする確率分布関数を正規化した正規化確率分布関数(音声単位別尤度比モデル)を作成する。音声認識結果に対する信頼度は、音声単位別尤度比モデルを用いて算出する。 (もっと読む)


【課題】音声認識装置の処理効率を向上させる。
【解決手段】この発明の音声認識装置のフレーム音質推定部は、フレーム毎に音声ディジタル信号の音質を評価してフレーム音質を出力し、平均音質推定部は、複数フレームのフレーム音質から音質レベルを推定する。そして、音声認識処理制御部が、音質レベルに基づいて音声認識処理時の動作を制御する制御信号を音声認識処理部出力にする。音声認識処理部はその制御信号に基づいて音声認識処理を行う。 (もっと読む)


【課題】従来の音声データ検索は、検索対象の入力単語が比較的短い場合や、音声認識辞書に未登録な未知語の場合、十分な音声認識精度が得られず、音声データ検索も十分な精度が得られない。
【解決手段】入力された検索文字列をもとに、音声データから、検索文字列に対応した所望の音声を検索する音声データ検索装置は、検索文字列を入力する文字入力手段と、前記検索文字列の前後に接続する接続文字列を生成し、検索文字列に接続する接続文字列生成手段と、接続文字列が接続された検索文字列を音声データと照合し、音声データの検索文字列に対する尤度を算出する照合処理手段と、照合処理手段の結果、尤度の高い順に音声データの候補を出力する出力手段を備える。 (もっと読む)


【課題】高精度な統計モデルを生成できるモデル生成方法、モデル生成プログラム、及びモデル生成装置を提供すること。
【解決手段】モデル生成方法において、親ノードの特徴量の出現確率を分布で示す特徴量出現分布モデルがその子ノードの特徴量出現分布モデルの代表となるような階層的な木構造で表現される統計モデルを生成する。また、モデル生成方法において、親ノードの特徴量出現分布モデルとその子ノードの特徴量出現分布モデルとの距離を変分し近似した値が最小となるように、親ノードの特徴量出現分布モデルを生成する。 (もっと読む)


【課題】識別的学習法の計算量を削減する。
【解決手段】この発明の相違度利用型識別的学習装置は、モデルパラメータ記録部と、パターン認識部と、識別関数値生成部と、相違度算出部と、正例認識比較部と、モデルパラメータ最適化部とを具備する。相違度算出部が認識シンボル系列と正例との相違度を算出し、正例認識比較部がN個(N≧2)の減衰係数と識別関数値と相違度を入力としてそのN個の減衰係数を用いて正例側統合値及びその正例側統合値を補正するための統合値を求め、上記正例側統合値を補正した目的関数を出力する。 (もっと読む)


【課題】少ない計算量で認識結果が得られる音声認識装置を提供する。
【解決手段】入力音声からフレーム毎に音響特徴量を抽出する特徴抽出部111と、探索ネットワーク101中の隣接した複数のノードをマージすることにより生成された圧縮ネットワーク102上で前記音響特徴量に対して探索及び枝狩りを行い、圧縮ネットワーク102の前記枝狩りされたノードに対応する探索ネットワーク101のノードを探索対象から除外して、前記入力音声の終端まで探索及び枝狩りを行って、音声認識する探索部112とを有する。 (もっと読む)


本発明は、パターン発見およびパターン認識のための方法に関し、概念に関連する第1のシーケンス・シンボルを含む第1のシーケンスおよび第1のシーケンスと関係づけられたタグが受けられ、遷移確率マトリックスが、第1のシーケンスの中の異なる距離における第1のシーケンス・シンボルの間の遷移の発生の頻度データを表示する遷移頻度マトリックスから得られ、各タグおよび各距離に対する遷移確率マトリックスが、第2のシーケンスの中で発生する概念を確定する活性化関数を得るために習得される。また、本発明は、パターン発見およびパターン認識の方法を実行するコンピュータ・プログラム製品および装置に関する。
(もっと読む)


リアルタイムデータパターン解析システムの動作方法は、集積回路ダイに配置されたメモリモジュール、計算ユニット、および、統合データ転送モジュールを提供すること、メモリモジュール内にデータパターンを記憶すること、統合データ転送モジュールを用いてメモリモジュールから計算ユニットへデータパターンを転送すること、ならびに、計算ユニットを用いて、処理後データとデータパターンとを比較することを含む。
(もっと読む)


【課題】音声入力される駅名を高精度に認識する路線検索装置を実現する。
【解決手段】住所録ADRの住所データやメールボックMBのメールデータからユーザと関係の地域名を導出する毎に、その地域名の優先度を高める重み付けを行い、ユーザが駅名(乗車駅名・下車駅名)を音声入力すると、音声認識した単語と一致する駅名を路線検索用データベース15から検索する。複数の駅名が検索された場合、それら駅名の内、ユーザと関係のある地域名に存在する駅名については該当する地域名の優先度を高める重み付けを行い(ステップSE6)、重み付けされた地域名の優先度の大きさに対応した順序で複数の乗車駅名を並べ換えて路線検索画面中に表示する(ステップSE8)。これによりユーザと関係のある地域名に存在する駅名が上位の選択候補となるため、誤認識を招いたり、検索の手間が掛かることが無くなり、音声入力される駅名を高精度に認識できる。 (もっと読む)


【課題】演算量を少なく、音響モデルを作成する。
【解決手段】今回の適応用音声データの特徴量系列を抽出し、音響モデル中のガウス分布の平均ベクトルパラメータの事後確率分布をガウス分布で表現した際の、当該事後確率分布の平均ベクトルパラメータ、共分散行列パラメータに対するスケーリング因子、初期の共分散行列で表されることに基づき、前回のガウス分布の平均ベクトルパラメータの事後確率分布、今回まで累積された特徴量系列の一部を用い、今回の音響モデル中のガウス分布の平均ベクトルパラメータの事後確率分布をガウス分布で表現した際の、当該事後確率分布の平均ベクトルパラメータ及び、スケーリング因子を計算することで、今回の音響モデル中のガウス分布の平均ベクトルパラメータの事後確率分布を求め、今回の音響モデルパラメータの事後確率分布を新たな音響モデルパラメータに変換して更新する。 (もっと読む)


【課題】追加学習なく音響モデルのサイズを縮小する技術を提供する。
【解決手段】複数の基底正規分布が重み付き加算されることによりそれぞれ構成される複数の混合正規分布から構成される音響モデルが記憶される音響モデル記憶部13を有する。基底正規分布削除部162が、音響モデルを構成する全部又は一部の混合正規分布のそれぞれについて、混合正規分布を構成する複数の基底正規分布から、予め定められた削除重み閾値よりも小さい重みが掛けられた基底正規分布を削除する。正規化部17が、混合正規分布を構成する、削除されずに残った複数の基底正規分布にそれぞれ掛けられる重みの合計が1となるように、音響モデルを構成する混合正規分布のうち基底正規分布が削除された各混合正規分布の重み系列を正規化する。 (もっと読む)


1 - 20 / 106