説明

国際特許分類[G10L15/20]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 不利な環境に特に適した音声認識技術,例.雑音またはアクセントのある音声 (334)

国際特許分類[G10L15/20]に分類される特許

71 - 80 / 334


【課題】音声認識時においてユーザの声以外の騒音を抑制することができる騒音データ管理システム10を提供する。
【解決手段】本発明の騒音データ管理システム10は、騒音データ管理サーバ20に環境条件毎に測定された騒音の騒音データを格納し、車載装置30が、音声認識処理の開始時に車両の現在の環境条件を収集して騒音データ管理サーバ20へ送信することにより、騒音データ管理サーバ20から当該環境条件に最も近い環境で測定された騒音データを取得し、騒音データ管理サーバ20から取得した騒音データを用いて、マイクを介して取得したユーザが発声したコマンドを含む音声において騒音を抑制し、騒音が抑制された音声に基づいてユーザが発声したコマンドを認識し、認識したコマンドを実行する。 (もっと読む)


【課題】ミュージカルノイズの低減と雑音成分の効果的な抑圧とを両立する。
【解決手段】第1雑音抑圧部32は、定常雑音のスペクトルNw[j]を減算係数αに応じた度合で各チャネルの音響信号V[j]のスペクトルX[j]から減算する。係数設定部44は、目的音成分を強調するフィルタ係数Wを非定常雑音のスペクトルNd[1]〜Nd[J]から生成する。第2雑音抑圧部42は、第1雑音抑圧部32による処理後のスペクトルY[1]〜Y[J]についてフィルタ係数Wを適用した指向性アレイ処理を実行することでスペクトルZを生成する。指標算定部62は、信号強度の度数分布における尖度が第1雑音抑圧部32の処理前と第2雑音抑圧部の処理後とで変化した度合を示す尖度変化指標KRを算定する。係数調整部64は、尖度変化指標KRが目標値K0に近づくように減算係数αを可変に制御する。 (もっと読む)


【課題】機械装置が発生するノイズを低減するように信号音を含む音データを処理する。
【解決手段】機械装置の動作状態を取得する動作状態取得部101と、取得された動作状態に対応する音データを取得する音データ取得部103と、単位時間における該機械装置の種々の動作状態及び対応する音データをテンプレートとして記憶するデータベース105と、を備えている。音データ処理装置は、データベース105から、取得された動作状態に最も近い動作状態のテンプレートを検索するデータベース検索部107と、取得された音データから、取得された動作状態に最も近い動作状態のテンプレートの音データを減算して機械装置が発生するノイズを低減するテンプレート減算部109と、をさらに備えている。 (もっと読む)


【課題】周期性の無い雑音が発生する環境下でも認識精度を向上させることができる音声認識装置を提供する。
【解決手段】音声認識装置1は、音声を入力して入力音声信号に変換する音声入力部2と、入力音声信号に雑音信号を加算するか否かを判定する加算判定部3と、入力音声信号に雑音信号を加算する雑音加算部4と、入力音声信号、または雑音信号が加算された入力音声信号に基づいて音声認識を行う音声認識部5と、予め雑音信号を記憶する加算雑音データベース6とを備える。 (もっと読む)


【課題】音声認識率を向上させることができる音声認識モデルパラメータ作成装置を提供することである。
【解決手段】音声認識モデルパラメータ作成装置は、無雑音音声データの入力を受け付けると(S11)、複数の雑音重畳データを作成し(S12)、作成した雑音重畳データの特徴量を算出する(S13)。特徴量の算出が終了すると、算出した特徴量を正規化し、正規化特徴量を得る。具体的には、まず、バンドパスフィルタを用いて、特徴量をフィルタリングする(S14)。そして、特徴量のフィルタリングが終了すると、フィルタリングされた特徴量をその最大振幅値で除算する(S15)。そして、学習部により、それぞれの正規化特徴量を用いて、音声認識モデルパラメータを作成する(S16)。そして、音声認識モデルパラメータを音声認識装置の記憶部に記憶させる(S17)。 (もっと読む)


【課題】同時通話状態時に外部音声を抽出する。
【解決手段】スピーカからマイクロフォンへの伝達系を模擬したフィルタ係数の設定および更新を行う第1の適応フィルタ111,114および第2の適応フィルタ112,115と、スピーカに入力される入力音声信号を第1および第2の適応フィルタで演算処理し得られた模擬信号とマイク入力音声信号との差分である第1および第2の残差信号を抽出する減算部12および減算部13と、減算部12におけるマイク入力音声信号および第1の残差信号の差分量と減算部13におけるマイク入力音声信号および第2の残差信号の差分量とを監視するキャンセル量比較部16と、差分量の高い側の残差信号を送出する抽出信号送出部とを備えた。 (もっと読む)


【課題】 目的音と雑音との分離精度を向上させた集音エリア制御方法および音声入力装置を提供する。
【解決手段】 一対のマイクロホンM1,M2が各々出力する音圧信号に基づいて基準位置Oにおける音圧信号に、基準位置と目的音源との間の距離に基づく空間微分関数を適用して第1の空間音圧勾配成分を算出し、マイクロホンM1,M2の各音圧信号の差分をX軸方向成分の距離で除算した第2の空間音圧勾配成分を算出し、第1の空間音圧勾配成分のX軸方向の成分を算出し、第1の空間音圧勾配成分のX軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定し、第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、空間微分関数の逆関数を適用して実時間関数を導出し、当該実時間関数を目的音として抽出する。 (もっと読む)


【課題】音声モデルのパラメータを音声信号から事前に推定する必要がなく、また、雑音変動がガウス分布に依存せずに、雑音の統計量が未知の場合、すなわち、音声モデルが未知である実環境下においても正確度の高い音声認識を可能とする音声認識における雑音抑制方法を提供する。
【解決手段】音声信号の時系列データと、観測値との相関情報を反映した結合確率分布と、高次の相関情報を展開係数に反映した級数展開表現による非線形の音声時系列モデルと、を用いることによって、音声信号を推定する。 (もっと読む)


【課題】発話音声及び騒音が混在する環境において得られる音声信号を適正に処理することのできる「音声処理装置」を提供することである。
【解決手段】利用者の発話に応答してマイクから出力される音声信号を設定されたゲイン値に基づいて増幅する増幅手段12と、増幅手段12での増幅を経た音声信号を処理する音声処理手段120とを有する音声処理装置であって、利用者の発話に際して増幅手段13での増幅を経た音声信号のピーク値を検出する音声ピーク値検出手段130と、ピーク値検出手段130にて検出される音声信号のピーク値の統計的分布を表わす音声ピーク値分布情報を生成する手段140と、前記音声ピーク値分布情報と予め定めた基準ピーク値範囲内とに基づいて増幅手段12に設定すべきゲイン値を決定するゲイン値決定手段150とを有する構成となる。 (もっと読む)


【課題】雑音を推定しつつ、発声開始イベントを通知してから発声可能になるまでの遅延を短くし、かつ、報知音の再生直後に発声ができる音声認識装置を提供する。
【解決手段】音声認識装置は、報知音の周波数帯域において報知音を含む背景雑音の雑音スペクトルを背景雑音のみの雑音スペクトルに補正し、報知音の再生終了後にユーザーによって発声された音響信号のスペクトルから補正後の雑音スペクトルを除去して、雑音スペクトルを除去した音響信号のスペクトルについて音声認識を行う。 (もっと読む)


71 - 80 / 334