説明

国際特許分類[G10L15/12]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | 動的計画法を用いるもの,例.動的時間伸縮[DTW] (22)

国際特許分類[G10L15/12]に分類される特許

1 - 10 / 22


【課題】音声パターンのマッチング精度を向上させる。
【解決手段】この音声認識装置は、認識候補の1つの単語に対し、標準パターンにおける第1処理開始時刻から第1時間範囲分計算した、入力音声の所定時刻の特徴と標準パターンの特徴のパターン間距離を累積することによって得られる第1累積距離を算出し、標準パターンにおける第2処理開始時刻から第2時間範囲分計算した、入力音声の所定時刻の特徴と標準パターンの特徴のパターン間距離を累積することによって得られる第2累積距離を算出し、算出された第1及び第2累積距離の一方の累積距離を、認識候補の単語の累積距離として決定し、複数の認識候補の単語について決定された累積距離に基づいて、入力音声に対応する単語を認識して出力するパターンマッチング処理部を有する。 (もっと読む)


【課題】音声信号から、基準信号と比較される参照信号を検出処理を迅速に行う。
【解決手段】特徴量抽出部110は、基準信号S0と音声信号S1に対してサンプル毎に特徴量を抽出する。マッチング部120は、各特徴量を重みとしてDPマッチングを行う。先頭位置検出部130は、マッチング部120により得られた最小コストパス上の点に対して、該点に夫々対応する、音声信号S1におけるサンプル位置と基準信号S0におけるサンプル位置との差分を求める処理を順次行うと共に、同値の差分に対応する点の数をカウントして差分の値毎にカウント値を得る。そして、閾値を超えたカウント値、または最小コストパス上の全ての点について求めた差分のカウント値のうちの最大値に対応する差分の値を、参照信号の先頭サンプルが音声信号S1における位置を示す先頭位置情報Lとして求める。 (もっと読む)


【課題】標準パターンを圧縮した場合でもマッチングエラーの発生率を低減する。
【解決手段】パターンマッチング装置10は、標準パターンを構成する各特徴要素B1,B2,B3について、パターン圧縮部12で、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって標準パターンを圧縮する。また、圧縮情報生成部13で、圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する。そして、圧縮された圧縮標準パターンを、記憶部14で当該圧縮標準パターンに対して生成された圧縮情報と関連付けて記憶する。そして、記憶された圧縮標準パターンと入力パターンとのパターン間距離を、当該圧縮標準パターンに対して生成された圧縮情報を変数として持つ動的計画法の漸化式によって算出する。 (もっと読む)


【課題】最適な照合によって得られる最大の照合スコアとのずれを小さくする。
【解決手段】自己類似度行列照合部が、照合を行う要素毎に、当該要素が適合要素か又はギャップであるかを判断し、対応する要素が共に適合要素である場合、要素の適合要素インデクスを決定し、決定された適合要素インデクスに基づき得られる要素照合スコアを計算し、要素照合スコアを用いて一方の系列データの要素と他方の系列データの要素とを対応付け、自己類似度行列に基づき動的計画法行列を計算する。 (もっと読む)


【課題】入力された音声に類似する音声を音声データベースから精度良く検索することのできる音声検索装置を提供する。
【解決手段】特徴ベクトル算出部100は、入力音声の特徴ベクトル列と、音声DB14から切り出した比較対象の音声の特徴ベクトル列を算出する。ベクトル間距離算出部102は、両特徴ベクトル列をDPマッチングにより照合し、その照合結果に基づいて、両特徴ベクトル列の各ベクトルの組間の距離を算出する。有効特徴間距離取得部103は、DPマッチングによる照合の結果得られた交点の系列に基づいて、距離の長い順に複数のベクトルの組を抽出し、抽出した複数のベクトルの組間の距離の平均を求め、これを有効特徴間距離として取得する。類似判定部104は、有効特徴間距離と閾値とを比較し、その結果に基づいて、入力音声と比較対象の音声が類似しているか否かを判定する。 (もっと読む)


【課題】
音楽音響信号から小節単位の打楽器パターンを抽出する。
【解決手段】
音楽音響信号に含まれる小節単位の打楽器パターンを複数種類抽出し、それらの演奏箇所も同時に推定することにより、ビートパターンの地図を作る方法を提案する。本方法は、音楽自動ジャンル分類や、音楽情報検索、さらに打楽器パターンを置換するなどの音楽の加工等に利用することができる。One-pass DP法を用いた小節への最適なセグメンテーションとk-meansクラスタリング法によるそれら打楽器パターンのクラスタリングを反復的に行い情報量規準により推定された最適な数の打楽器パターンを抽出し、その結果それらによる楽曲構造を示すマップを得る。 (もっと読む)


【課題】ユーザから音声認識要求と共に入力された音声信号が語彙外であった場合に、ユーザに対して語彙外である旨を通知する。
【解決手段】ユーザから音声認識要求と共に入力された音声信号が語彙外であった場合に、ユーザに対して語彙外である旨を通知する音声認識装置であって、ユーザから音声認識要求および音声信号の入力を受け付ける認識処理要求受信手段10と、前記入力された音声信号が語彙外であるかどうかを判定する語彙外判定部30と、音響モデルおよび言語モデルを用いて、入力された音声信号の音声認識処理を行なう音声認識処理手段20と、を備え、入力された音声信号が語彙外であった場合は、ユーザに対して語彙外である旨を通知する。 (もっと読む)


【課題】動的計画法に基づき2つの自己類似度行列を照合し、長さの異なる2つの系列データの各要素の対応付けられた照合スコアを出力する系列データ照合方法、系列データ照合装置、プログラムおよび記憶媒体を提供することにある。
【解決手段】自己類似度行列計算部2が、入力された系列データに基づき自己類似度行列を計算し、自己類似度行列整列部3が、自己類似度行列のうち互いに対応している適合要素の位置を表わす適合要素インデクスを用いて、一方の系列データの要素と他方の系列データの要素とを対応付け自己類似度行列に基づき動的計画法行列を計算し、適合位置・照合スコア決定部4が、動的計画法行列に基づき系列データの対応関係において適合する部分を特定し、この適合する部分の位置を表わす照合スコアおよび適合位置を出力する系列データ照合方法、系列データ照合装置、プログラムおよび記憶媒体を提供することにある。 (もっと読む)


【課題】少ないデータ量及び計算量で話者の検証が可能となる話者認証の検証方法及び装置を提供する。
【解決手段】話者が話したパスワードを含むテスト用発話を入力し、入力された前記テスト用発話から音響特性ベクトル列を抽出し、登録話者により登録された話者テンプレートと、前記音響特性ベクトル列との間のマッチングパスを求め、前記テスト用発話のスペクトル変化及びまたは前記話者テンプレートのスペクトル変化を考慮して、前記マッチングパスのマッチングスコアを計算し、前記マッチングスコアと予め定義された識別用閾値とを比較して、前記テスト用発話が前記登録話者が話したパスワードを含む発話であるか否かを決定する。 (もっと読む)


【課題】話者認証の登録及び評価のための方法と装置、話者認証システムを提供すること。
【解決手段】話者認証の登録のための方法は、話者によって話された同一内容の複数の発話の各々に基づいて複数の音響特徴ベクトル系列を生成するステップと、前記複数の音響特徴ベクトル系列から参照テンプレートを生成するステップと、複数のコード及び前記複数のコードに対応する特徴ベクトルを含むコードブックに基づいて、前記複数の音響特徴ベクトル系列の各々に対応する擬似詐称者特徴ベクトル系列を生成するステップと、前記複数の音響特徴ベクトル系列、前記参照テンプレート及び前記複数の擬似詐称者特徴ベクトル系列に基づいて最適な音響特徴サブセットを選択するステップと、を含む。 (もっと読む)


1 - 10 / 22