説明

国際特許分類[G10L15/20]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 不利な環境に特に適した音声認識技術,例.雑音またはアクセントのある音声 (334)

国際特許分類[G10L15/20]に分類される特許

21 - 30 / 334


【課題】周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供すること。
【解決手段】実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。 (もっと読む)


【課題】訓練データセットでカバーされない種類の雑音が観測特徴量に含まれる場合でも適切に所望特徴量を推定することを可能とする。
【解決手段】観測特徴量の時系列データから雑音特徴量を推定し、時系列データを構成する短時間フレーム毎に、各混合要素に対する事後重みと各混合要素に対する条件つき強調特徴量を、それぞれ観測特徴量だけでなく雑音特徴量を用いて計算し、得られた各混合要素に対する事後重みと各混合要素に対する条件つき強調特徴量とから、前記短時間フレーム毎の所望特徴量の推定値を得る。 (もっと読む)


【課題】高ノイズ環境下においても、処理負荷を増大することなく音声区間判定およびノイズ除去の精度を向上する。
【解決手段】本発明のノイズ除去装置100は、所定区間のオーディオデータが、音声が含まれる音声区間であるか、音声が含まれない非音声区間であるかを判定する音声区間判定部118と、音声区間判定部の判定結果を保持するパラメータ保持部114と、音声区間判定部の判定結果が非音声区間であれば適応フィルタ130の適応処理を行いつつ、音声区間であれば適応フィルタを固定して、所定区間のオーディオデータのノイズ成分を除去するノイズ除去部120とを備え、音声区間判定部が、ノイズ除去部によってノイズ成分が除去されたオーディオデータの音声区間判定を再度実行し、その判定結果がパラメータ保持部に保持された判定結果と異なる場合、ノイズ除去部は、ノイズ成分の除去を再度実行する。 (もっと読む)


【課題】複数の音が混在した音声信号から、特定音源のコマンドを高精度に分離する装置、方法を提供する。
【解決手段】複数音源からの音を含む学習用音声信号に基づいて各音源対応の基底周波数Bからなる学習データを生成し、この各音源対応の基底周波数Bを結合した全基底周波数Ballを生成する。さらに、入力音声信号に対して、時間周波数分析を実行して時間周波数分析結果を生成する。この入力音声信号に対する時間周波数分析結果に対して、全基底周波数Ballを適用した基底分解を行い、入力音声信号に対する基底アクティビティHを生成する。最後に生成した基底アクティビティHの識別処理を実行してコマンド識別を行う。これらの学習データに基づく音源分離処理により、高精度なコマンド識別が実現される。 (もっと読む)


【課題】 小型情報機器で使用される埋込型システム上で音声認識の前処理によって音声入力データの動的状況認知パラメータDIPを推定して音声が認識できる耐雑音化技術が不可欠である。
【解決手段】
本発明による音声認識方法は、図1の状況認知前処理部S1によるA/D変換部の出力になる音声入力データに対して動的状況認知パラメータDIPを算出、算出された動的状況認知パラメータDIPの情報により次の処理部分を決定するインタープリターと、可変雑音処理基準パラメータRTHを算出する状況認知変数推定部を構成しておく。動的状況認知パラメータDIPの基準で状況認知変数IPを生成する状況認知生成部と可変雑音処理基準パラメータRTHと状況認知変数IPを比較する分配部を軽由、音声区間を抽出して音声区間以外部分の雑音を減少/除去する音声抽出処理や騒音やデバイス雑音を除去する雑音処理を使用して音声認識前処理を行う。 (もっと読む)


【課題】非定常騒音の混入に対して頑健な音声認識を行う。
【解決手段】体内に密閉装着され音声を収音する第1気導音マイク11と、体外に装着され音声を収音する第2気導音マイク21と、第1気導音マイク11が収音した音声から第1単語列を認識する第1デコーダ部16と、第1単語列を構成する各単語に対応する発話区間を抽出する第1単語区間抽出部19と、第1単語区間抽出部19が抽出した発話区間について第2気導音マイク21が収音した音声から第2単語列を認識する第2デコーダ部26と、第1単語列のうち騒音レベルが所定値以下の単語列を第2単語列に置き換える単語列置換部28とを備えた。 (もっと読む)


【課題】入力される音の誤認識を抑制することを可能とする音声処理装置、音声処理システム及び音声処理方法の提供。
【解決手段】本実施形態の音声処理装置は、外部からの入力を受け付ける第1受付手段と、前記第1受付手段が前記入力を受け付けた場合に、音声出力機能を有する少なくとも1の外部機器に対して音量制限命令を送出する制限手段と、前記第1受付手段が前記入力を受け付けた後に、音の入力を受け付ける第2受付手段と、前記制限手段により制限された前記1以上の外部機器の音量の解除命令を、前記第2受付手段が受け付けた前記音に応じて異なるタイミングで送出する解除手段とを備える。 (もっと読む)


【課題】デバイスコストを削減しつつ、外部環境の変化に対応して音声認識を精度良く実行すること。
【解決手段】オンラインテンプレート収集部140が、コントローラ200から取得するメタ情報と、発話区間の信号とを基にして、テンプレートメモリ142に記憶されたテンプレートを順次更新する。テンプレート選択部150は、入力信号と一致度の高いテンプレートをテンプレートメモリ142から検索し、雑音除去部160に出力する。雑音除去部160は、入力信号からテンプレートの信号を除去することで雑音成分を除去し、音声認識部170が、雑音成分の除去された信号に対して音声認識を実行する。 (もっと読む)


【課題】定常雑音を含む信号に対する処理において、周波数軸上で処理する技術と比較して処理時間を短縮することを課題とする。
【解決手段】音声処理装置100のゲイン算出部140は、同期減算結果のパワーと、音声入力部110Lにより入力された信号のパワーとを用いて、信号の振幅を抑圧するゲインを算出する。例えば、ゲイン算出部140は、パワー計算部130Lにより計算された信号(inL)のパワー(Power2)から、パワー計算部130Rにより計算された同期減算結果(tmp1)のパワー(Power1)を減算する。そして、ゲイン算出部140は、減算結果(Power21)を信号(inL)のパワー(Power2)で除算した値の平方根を計算することによりゲイン(gain)を算出する。 (もっと読む)


【課題】雑音の音響特徴量を、時間変化を伴わないバイアス成分と残差成分とに分けて推定する雑音抑圧装置を提供する。
【解決手段】雑音バイアス成分推定部は、対数メルスペクトルと、無音GMMとクリーン音声GMMのパラメータと、を入力として雑音信号の音響特徴量空間の重心であるバイアス成分を最適推定し、雑音残差成分推定部が、対数メルスペクトルとバイアス成分と、無音GMMとクリーン音声GMMのパラメータと、を入力として雑音信号とバイアス成分との差分である残差成分を最適推定する。そして、雑音抑圧部は、対数メルスペクトルと複素数スペクトルと、バイアス成分と残差成分と、無音GMMとクリーン音声GMMのパラメータと、を入力として雑音信号を抑圧した音響信号を出力する。 (もっと読む)


21 - 30 / 334