説明

国際特許分類[G10L15/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識のための特徴抽出;認識単位の選択 (203)

国際特許分類[G10L15/02]に分類される特許

81 - 90 / 203


【課題】アクセント型抽出の精度が向上するアクセント情報抽出装置を提供する。
【解決手段】モーラ同期信号を出力するインターフェース部112と、ユーザーの声を入力するマイクロホン105と、入力された音声から声の高さ(基本周波数)の変化パターンであるピッチパターンを抽出するピッチパターン抽出部103と、ピッチパターンとモーラ同期信号とからモーラ同期パターンを生成するモーラ同期パターン生成部104と、アクセント型毎に典型的なパターンを記憶する基準アクセントパターン記憶部107と、モーラ同期パターンと基準アクセントパターンとを照合して、各アクセント型へのモーラ同期パターンの適合度を算出するモーラ同期パターン照合部106と、適合度を参照してアクセント型を決定するアクセント型決定部108とを備えている。 (もっと読む)


【課題】入力される音声を適切に処理し、音源認識、話者認識または音声認識を精度良く行う音声処理装置を提供する。
【解決手段】第1音源100より発生された音声を受信して複数チャネルの第1音声信号を出力する複数のマイクロホン101と;前記チャネル間の相関を示す第1特徴量を算出する算出部110と;第2音源より発生された音声を前記複数のマイクロホン101により受信して得られる複数チャネルの第2音声信号のチャネル間の相関を示す第2特徴量を予め記憶している記憶部120と;前記第1特徴量と前記第2特徴量を照合し、前記第1音源100が前記第2音源に一致するか否かを判定する照合部102と;を具備する。 (もっと読む)


【課題】音声の韻律的特徴に基づく音声解析を高精度に実行する装置および方法を実現する。
【解決手段】入力音声の韻律的特徴に基づいて識別を行う韻律識別処理において、入力音声から生成される分析フレーム対応の周波数特性とテンプレート周波数特性との比較から第1の相対ピッチ差を抽出するとともに分析フレームの周波数特性と先行フレームの周波数特性との比較から第2の相対ピッチ差を算出し、これら2つの相対ピッチ差に基づいて隣接フレーム間の相対ピッチの連続性を考慮して相対ピッチ差の補正処理を実行する構成とした。本構成により、倍ピッチや半ピッチの抽出誤りを解消し、精度の高いかつロバストな韻律識別が可能となる。 (もっと読む)


【課題】ユーザの発話音声を音声認識手段が誤認識する可能性を、ユーザの発話中に報知できる音声対話装置を提供することにある。
【解決手段】
本発明の音声対話装置は、ユーザの発話音声を認識する音声認識部151の音声認識結果に基づいて、所定のタスクを達成する制御部152を有する信号処理装置15およびユーザの発話音声を音声認識部151が誤認識する可能性を判断する誤認識可能性判断部141と、ユーザの発話中に、上記誤認識する可能性をユーザに報知するフィードバック部142とを有する信号処理装置14を備える。 (もっと読む)


【課題】音声学習の効率を向上させること。
【解決手段】本発明の音声認識装置は、入力音声信号を用いて音声認識を行うための音声学習を行う装置である。音声認識装置は、入力音声信号に対して異なる時間から信号分析することにより複数の信号系列を作成し、複数の信号系列ごとに学習を行う。複数の信号系列は、入力音声信号に対し異なる時間から所定のフレーム周期でフレームシフトさせたフレーム毎に特徴量を抽出することにより作成する。上記の異なる時間とは、入力音声信号に対してフレーム周期より短い時間である。 (もっと読む)


【課題】音声信号を区分した複数の区間を正確に分類する。
【解決手段】分類処理部14は、音声信号Sを時間軸上で可変長に区分した各発音区間PAを複数のクラスタに分類する。まず、分類処理部14は、各発音区間PAの分類先となる対象クラスタCLnを指定し、対象クラスタCLnの音響モデルXを含むクラスタ情報CINF[n]を生成する。分類処理部14は、対象クラスタCLnの指定中に音声信号Sの未分類の各発音区間PAを時間の長い順番で順次に選択区間PAとして選択し、選択区間PA内の音声信号Sの特徴量と対象クラスタCLnの音響モデルXとの類否を判定する。類似と判定した場合、分類処理部14は、選択区間PAを対象クラスタCLnに分類するとともに、選択区間PA内の音声信号Sの特徴量に基づいてクラスタ情報CINF[n]の音響モデルXを更新する。 (もっと読む)


【課題】音声信号を区分した各区間について適度な時間長を確保する。
【解決手段】音声区分部121は、音声信号Sを時間軸上で複数の区間bに区分する。音声区分部121は、音声信号SのSN比に基づいて音声信号Sを発音区間PAと非発音区間PBとに区分する第1区分部41と、音声信号Sの包絡線Eの各谷部Dを境界として音声信号Sを区分する第2区分部42とで構成される。特徴抽出部123は、複数の区間bの各々について音声信号Sの音響的な特徴量を抽出する。区間連結部125は、音声信号Sの特徴量が類似する複数の相前後する区間bを連結することで各区間Bを画定する。音声分類部14は、各区間Bの音声信号Sを発声者ごとに分類する。 (もっと読む)


【課題】対象音より大きい雑音を含む入力音であっても、対象音が含まれているかどうかを精度よく判定することができる音響認識装置等を提供する
【解決手段】入力音響信号に、対象音響信号が含まれるかどうかを判定する音響認識装置100であって、前記入力音響信号をフレームごとに分解し、複数の当該フレームからなる入力周波数強度分布を作成する音響信号分析処理部210と、前記対象音響信号を前記フレームごとに分解し、特徴周波数ごとに分析した対象周波数強度分布を格納する対象音記憶部260と、前記入力周波数強度分布から、前記特徴周波数の成分のみを抽出して、特徴周波数強度分布を作成する特徴周波数抽出処理部220と、前記対象周波数強度分布と前記特徴周波数強度分布とをフレームをずらしながら比較して差異を算出する算出処理部230と、前記入力音響信号に前記対象音響信号が含まれるかどうかを判定する判定処理部240とを備えることを特徴とする。 (もっと読む)


【課題】ベクトル量子化およびその復号を経てVQ歪みを含む特徴量を、その確率モデルと照合する際に好適なパターンマッチング方法および装置、ならびに前記特徴量に好適な正規化方法および装置を提供する。
【解決手段】平均値・分散計算部51は、VQ復号部21で復号された音響特徴量(特徴ベクトル)の平均値yおよび分散x1を計算する。平均値yの計算結果は加算部52において音響特徴量から減算される。分散x1は加算部53において、予めVQ歪み分散記憶部27に記憶されているVQ歪みの分散x2と加算され、VQ歪みを考慮した分散xが求められる。正規化部54では、この分散xを用いて音響特徴量が正規化され、MVN後の音響特徴量が算出される。 (もっと読む)


【課題】参照信号と蓄積信号が異なる調で演奏された場合でも1回の照合で正しい探索結果を出力し、また、演奏されるテンポが異なる場合にも正しく探索結果を出力する。
【解決手段】音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む。また、参照音響信号について同様に自己類似度ベクトルを生成して参照特徴ベクトル列とする。参照特徴ベクトル列と、データベース内の蓄積特徴ベクトル列とをフレームを移動しながら照合して、照合スコアの高い楽曲および時刻を特定し、その楽曲に付随する情報と時刻を出力する。 (もっと読む)


81 - 90 / 203