説明

Fターム[5D015FF05]の内容

音声認識 (5,191) | 特徴抽出 (44) | 二次的特徴抽出 (8) | ベクトル量子化 (5)

Fターム[5D015FF05]に分類される特許

1 - 5 / 5


【課題】VQ符号帳の信頼性が低い場合でも音声間の類否を高い精度で判定できる指標を算定する。
【解決手段】記憶装置30は、音声信号VAの特徴ベクトル系列XAおよびVQ符号帳CAと音声信号VBの特徴ベクトル系列XBおよびVQ符号帳CBとを記憶する。第1算定部161は、VQ符号帳CAと特徴ベクトル系列XBとのVQ歪DAB、VQ符号帳CBと特徴ベクトル系列XAとのVQ歪DBA、VQ符号帳CAと特徴ベクトル系列XAとのVQ歪DAA、VQ符号帳CBと特徴ベクトル系列XBとのVQ歪DBBを算定する。第2算定部162は、VQ歪DABやVQ歪DBAが大きいほどVQクロス歪DCが大きく、VQ歪DAAやVQ歪BBが大きいほどVQクロス歪DCが小さくなるように、第1算定部161による算定の結果から、音声信号VAと音声信号VBとの類否の指標となるVQクロス歪DCを算定する。 (もっと読む)


【課題】 少ない演算量、処理量で、雑音成分を適切に除去できる雑音除去装置を提供する。
【解決手段】 本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去装置に関する。そして、上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段とを有することを特徴とする。 (もっと読む)


【課題】各音響信号の周波数変動に柔軟に対応しながら精度よく、かつ高速に検索することを可能とする音響信号検索装置を提供する。
【解決手段】音響信号検索装置1において、基準周波数検出部11は、参照信号及び蓄積信号それぞれの時間周波数スペクトログラムから、時間間隔ごとの所定の基準特徴部を抽出し、抽出した所定の基準特徴部の周波数を時間間隔ごとの参照信号及び蓄積信号それぞれの基準周波数とする。特徴抽出部12は、当該基準周波数を基準として一意に定められる周波数のパワースペクトル値に基づいて参照信号の信号全体における参照特徴量を抽出する。類似度計算部13は、抽出した参照特徴量に基づいて蓄積信号の時間間隔ごとの特徴量を抽出し、抽出した蓄積信号の区間ごとの区間特徴量を算出し、算出した区間特徴量と、参照特徴量とに基づいて類似度を算出する。 (もっと読む)


【課題】特徴ベクトルとの間の距離を計算する符号ベクトルを限定することで高速のベクトル量子化を可能にし、かつ良好な量子化結果を得ることを可能にすること。
【解決手段】比較符号ベクトル格納器17は、特徴ベクトル空間を複数に分割した各部分領域内に位置する特徴ベクトルとの間で距離計算および比較すべき符号ベクトルの部分集合を記憶する。部分領域判定部16は、入力された特徴ベクトルが特徴ベクトル空間上のどの部分領域に属するかを判定する。距離計算部12は、入力された特徴ベクトルとそれと距離計算および比較すべきとされている符号ベクトルの部分集合の間の距離計算および比較を行う。比較手段14は、距離計算部12により算出された距離が最小値を示す符号ベクトルのコードを量子化ベクトルとして出力する。 (もっと読む)


【課題】長い消失区間に対しても音声を復元する事ができる音声信号の復元装置を提供する。
【解決手段】音声信号の復元装置は、入力される音声信号データ列に消失区間があるか否かを判定し、判定結果を示す第1の信号を出力するモニタ部48と、音響モデル42と言語モデル44とを用いて音声認識を行なう音声認識部46と、音声認識部46の認識結果から音声合成を行なう音声合成部52と、モニタ部48により制御され,消失区間では音声合成部52の出力を、それ以外では入力音声データを、それぞれ選択する信号混合部56とを含む。 (もっと読む)


1 - 5 / 5