説明

国際特許分類[G10L15/16]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500) | ニューラル・ネットワークを用いるもの (24)

国際特許分類[G10L15/16]に分類される特許

1 - 10 / 24


【課題】高速で音声認識を行うことができる音声認識装置を提供する。
【解決手段】音声波形信号をフレーム単位で解析して音声の特徴量を表す特徴ベクトルを抽出する特徴ベクトル抽出部231と、特徴ベクトルを時系列的に複数フレーム分記憶する特徴ベクトル記憶部232と、音声認識候補となる複数の音声を記憶する認識候補音声記憶部233と、特徴ベクトル記憶部に記憶された複数フレーム分における特徴ベクトルに基づき音声認識候補となる各音声の尤度を算出する第1解析部234と、複数フレーム分における特徴ベクトルからフレーム単位あたりの平均特徴ベクトルを算出し当該平均特徴ベクトルから音声認識候補となる音声の尤度を算出する第2解析部235と、第1解析部において算出した音声認識候補となる各音声の尤度及び第2解析部において算出した音声認識候補となる各音声の尤度に基づき一つの音声を決定する音声決定部236とを備える音声認識装置。 (もっと読む)


【課題】階層型パルスニューラルネットワークに適用可能なバックプロパゲーション学習法を提供する。
【解決手段】パルスニューロンモデルの双対性を利用して教師信号を生成し、該教師信号を用いて学習を行うことを特徴とするパルスニューロンモデルのためのバックプロパゲーション学習法。パルスニューロンモデルの双対性を利用して教師信号を生成することにより、誤差関数を微分する計算が必要でなくなり、階層型パルスニューラルネットワークに適用可能となる。 (もっと読む)


【課題】未知語への対応が可能であり、音声対話や音声検索からの要求に耐えうる高い音素識別精度を有する調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラムを提供する。
【解決手段】調音特徴抽出装置では、入力部201より入力された音声がA/D変換部202においてデジタル変換され、特徴分析部210においてフーリエ解析及びフィルタリングされた結果、音声スペクトルデータが得られる。次いで、調音特徴抽出部220において、調音特徴の時系列データである調音特徴系列が抽出される。そして調音運動修正部230において、調音特徴系列の変位成分より速度成分と加速度成分とが抽出され、さらに各成分に基づき、ニューラルネットワークを経ることにより、調音運動が修正される。そして修正された調音運動に基づき、単語分類部204において該当する単語が検索され、音声認識処理が実行される。 (もっと読む)


【課題】複数音の混在パターンから複数の音源の種類を識別することが可能な複数音識別装置を提供する。
【解決手段】複数個の競合学習ニューロン51と、競合学習ニューロン51の複数発火と無発火とを検出する制御ニューロン群60とを備え、制御ニューロン群60からの出力を用いて、参照ベクトルが入力ベクトルに最も近い競合学習ニューロン51のみが発火する方向に制御を行い、認識単位時間内に発火頻度が最大になった競合学習ニューロン51によって、1の音源種類の特定情報を出力した後、特定された音源種類を示す競合学習ニューロン51の出力を0にして、次の認識単位時間内に発火頻度が最大になった前記競合学習ニューロン51によって、他の音源種類の特定情報を出力することを特徴とする複数音識別装置1。 (もっと読む)


【課題】感情の推定に加えて住宅内での利用者の行動を検出することにより各制御対象機器を的確な制御内容で自動的に制御することを可能にした機器制御システムを提供する。
【解決手段】住宅Mに複数種類の制御対象機器Ldが配置され、宅内サーバSvでは、感情センサ手段Seと行動センサ手段Smとの出力を用いて利用者の感情を推定し行動を検出する。利用者の感情と行動との組合わせを制御対象機器Ldの制御内容と関係付けた制御内容記憶部14を参照し、判定部13が制御内容を決める。この制御内容に応じて出力部15が生成した制御信号により制御対象機器Ldが制御内容に応じて動作する。 (もっと読む)


【課題】誤差を適切に考慮した処理を行う。
【解決手段】本体学習モジュール101は、データDを学習する。誤差学習モジュール102は、データDと、本体学習モジュール101がデータDを再構成した再構成データDRとの誤差ΔDを学習する。また、本体学習モジュール101は、データDの入力があると、そのデータDを再構成して、再構成データDRを出力し、誤差学習モジュール102は、データDと、再構成データDRとの誤差データΔDを再構成して、再構成誤差データΔDRを出力する。そして、学習モジュール100は、再構成データDRと、再構成誤差データΔDRをとを加算して出力する。本発明は、例えば、ロボット等に適用できる。 (もっと読む)


【課題】状態数及び各状態の出力分布を自動的に決定して、時系列データの頑健なモデル化をすることができるパターン認識装置、パターン認識方法、及びプログラムを提供すること。
【解決手段】本発明に係るパターン認識装置1は、入力パターンの一部又は全部を入力ベクトルとしてニューラルネットワークに順次入力し、当該入力ベクトル、及び当該ニューラルネットワークに配置される多次元ベクトルで記述されるノードに基づいて、当該ノードを自動的に増加させる自己増殖型ニューラルネットワーク12を用いて、入力パターンの特徴量に応じたテンプレートモデルを生成するテンプレートモデル生成部10と、生成されたテンプレートモデルと入力パターンをマッチングして当該入力パターンを認識する認識部20とを有するものである。 (もっと読む)


【課題】誤差を適切に考慮した処理を行う。
【解決手段】本体学習モジュール101は、データを学習する。誤差学習モジュール102は、データと、本体学習モジュール101がデータを再構成した再構成データとの誤差を学習する。また、本体学習モジュール101は、データの入力があると、そのデータを再構成して、再構成データを出力し、誤差学習モジュール102は、データと、再構成データとの誤差データを再構成して、再構成誤差データを出力する。そして、学習モジュール100は、再構成データと、再構成誤差データとを加算して出力する。本発明は、例えば、ロボット等に適用できる。 (もっと読む)


【課題】時系列データの教師なし学習を追加的に行う追加学習を適切に行う。
【解決手段】ネットワーク管理部7は、時系列データのパターンである時系列パターンを保持する複数のノードから構成されるネットワークである時系列パターン記憶ネットワークの規模を管理する。一方、生成部6は、時系列パターン記憶ネットワークのノードが保持する時系列パターンの時系列データを生成する。そして、学習部4は、外部から観測することができる時系列データである新規時系列データと、生成部6が生成する時系列データである生成時系列データとを、時系列パターン記憶ネットワークの自己組織的な更新に用いる更新用時系列データとして、その更新用時系列データを用いて、時系列パターン記憶ネットワークを、自己組織的に更新する。 (もっと読む)


【課題】従来に比して音声認識精度が一段と向上し得る音声処理装置及び音声認識装置を提供することを目的とする。
【解決手段】音声認識装置1では、瞬時位相特徴量たる0次予測残差Φ(n)と、包絡線特徴量たる対数包絡線m(n)とを音声信号から算出し、これら瞬時位相特徴量及び包絡線特徴量を、学習済みのサブバンドニューラルネットワーク32a〜32n及び統合ニューラルネットワーク31を用いて識別的に分析し、その分析結果を特徴変換部52により別空間に写像することで音声特徴量を得るようにした。このようにして生成した音声特徴量を用いれば、従来に比して音声認識精度が一段と向上し得る。 (もっと読む)


1 - 10 / 24