説明

国際特許分類[G10L15/20]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 不利な環境に特に適した音声認識技術,例.雑音またはアクセントのある音声 (334)

国際特許分類[G10L15/20]に分類される特許

51 - 60 / 334


【課題】音源分離性能の劣化を少なくする。
【解決手段】本発明の音源分離装置は、目的音と、目的音の音源とは異なる音源から発生した妨害音とを分離するものであり、所定の受音処理に従って2個の音入力部から入力した入力音を受音信号に変換する1又は複数の入力手段と、各入力手段からの各受音信号の周波数成分を分析する1又は複数の周波数分析手段と、各受音信号の周波数成分に基づいて複数の受音信号の周波数成分の特性を正規化する1又は複数の信号特性補正手段と、正規化された各受音信号の周波数成分に基づき目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する1又は複数の分離手段と、各第1音信号成分と第2音信号成分とを用いて目的音特性成分を求める除去手段とを備える。 (もっと読む)


【課題】 目的音と、目的音の到来方向以外の任意の方向から到来する妨害音とを分離する処理において、目的音の到来方向がずれた場合でも、分離処理後の音の品質を保つ。
【解決手段】 本発明は、音源分離装置に関する。そして、音源分離装置は、間隔を置いて配置された複数個のマイクロフォンの受音信号のうち2個のマイクロフォンの受音信号のスペクトルについて目的音の到来方向を含む所定の範囲内のいずれかの方向に信号抑圧の指向性を向けて処理する複数の目的音抑圧部を用いて、目的音抑圧スペクトルを生成する手段と、目的音優勢スペクトルを生成する手段と、目的音抑圧スペクトルと目的音優勢スペクトルとを用いて、受音信号の妨害音成分と目的音成分とを分離する手段とを有することを特徴とする。 (もっと読む)


【課題】 話者が移動しても、雑音に対して頑健な、音声認識システムと認識方法を提供する。
【解決手段】 位置毎の雑音スペクトルを記憶し、位置毎の雑音を含む音響モデルを記憶し、位置を判別する。無発話区間でのマイクロホンからの音響信号のスペクトルと、位置毎の雑音スペクトルとを比較し、閾値以上の差異を検出した際に、閾値を越える部分の少なくとも一部を雑音除去部で雑音除去する。そして位置毎の音響モデルにより、音声認識する。 (もっと読む)


【課題】 音響モデルの学習無しで、環境雑音などの音声以外の雑音を効果的に除去する。
【解決手段】 無音音素を除く単音素により雑音に対する音声認識を行い、ゆう度が上位の単音素を抽出する。抽出した上位の単音素に、言語として意味をなすか否かに係わらず、同一または他の単音素を付加した音素列により、雑音に対する音声認識を行い、再度ゆう度が上位の音素列を抽出し、不要語の辞書に記憶させる。 (もっと読む)


【課題】互いに到来方向が異なる複数の音声のうち、目的とする他の音声の混入を効率的に抑制して目的音声を抽出する技術を提供する。
【解決手段】所定の距離離して配置された第1および第2の音声入力器からそれぞれ取得した音声信号に、目的音声以外の他の音声の影響を受けやすい周波数帯域に対して小さい値をとる重み付きCSP(Cross−Power Spectrum Phase)係数を用いて、利得調整処理および発話区間の切り出し処理の少なくとも一方を行い目的音声の抽出処理を行う。 (もっと読む)


【課題】ロボット及び自動車等の移動体に音声認識システムを搭載する場合に、移動体からの振動に起因する目的音声の認識率低下を抑制する。
【解決手段】マイクロホンアレー1は、マイクロホン素子111〜114を含む。支持部材の一例としての振動抑圧部材12及びステー131〜134は、移動体80に取り付け可能であり、マイクロホン素子111〜114を支持するよう構成されている。振動抑圧部材12は、移動体80に取り付けられた状態で、振動抑圧部材12及びステー131〜134を介して移動体80からマイクロホン素子111〜114へ到達する振動の到達時間が、マイクロホン素子111〜114に含まれる少なくとも2つのマイクロホン素子の間で異なるように決定された形状を有する。 (もっと読む)


【課題】複数音源からの混合信号に対する音源分離と音声認識を実行し、必要とする認識結果を効率的に取得する装置、方法を提供する。
【解決手段】複数音源からの出力を混合した混合信号からなる観測信号に対して、独立成分分析(ICA)を適用した処理により分離信号を生成するとともに、各分離信号に対する音声認識処理を実行する。さらに音声認識結果の評価情報としての付加情報を生成する。付加情報として音声認識結果の認識信頼度や、音声認識結果が音声認識装置において想定したタスクに関連する認識結果であるか否かを示すタスク内発話度を算出する。これらの付加情報を適用して各チャンネル対応の音声認識結果のスコアを算出してスコアの高い認識結果を選択出力する。 (もっと読む)


【課題】複数話者が同時に発声している場合にも、新しい手法を用いてシーケンシャル・グルーピング処理を行うことで、複数話者の識別と照合を適切に行う。
【解決手段】1つの既知音声信号を所定時間間隔の中で信号の最大振幅で正規化した後、サンプルN点の短時間フーリエ変換でM*Nに要素化し、短時間フーリエ変換データのM*N要素をk-means法でK個のクラスターにグループ分けし、クラスター化されたグループを1つのピッチ・クラスター・マップ(PCM)としてPCMデータベースに収納し、以上の操作を繰り返してPCMデータベースを構築しておき、照合のための入力音声信号のスペクトルと、前記PCMデータベース中のPCMのスペクトルとを用いて類似性距離の計算を行い、その類似性距離の計算結果に基づいて、複数話者のスペクトルを、各個人に対するコードブック内のピッチ・クラスター・スペクトルとして分離可能とした。 (もっと読む)


【課題】内部ノイズ源を有する場合でも、計算負荷が少なくかつ正確にユーザー音声を認識できる信号分離システムを提供する。
【解決手段】信号分離システムは、ユーザー音声を集音することを目的とした外部マイクと、システム内部ノイズ源からの内部ノイズだけを検知する内部センサと、を有する。独立成分分析部は、分離フィルタ行列の最適化により、内部ノイズを出力する分離信号とそれを含まない信号群に分離する。パーミュテーション解決部は、内部ノイズを含まない分離信号群に対してパーミュテーション解決を実行する。パーミュテーション解決部では、分離信号をラプラス分布でフィッティングした際のラプラス分布のスケールパラメータの値を求め、そのパラメータの最大値をもつ分離信号をユーザー音声とする。 (もっと読む)


【課題】入力信号の音量が小さいときでも、有音無音の判定精度を向上させること。
【解決手段】有音無音判定装置1aは、フレーム音量算出部11が計算したフレーム音量が閾値音量より小さいときに、フレーム音量を閾値音量に変更するフレーム音量選択部22と、フレーム音量と、推定された前回までの雑音音量とをもとに、今回の雑音音量を推定する雑音音量推定部12と、フレーム音量が今回の雑音音量をもとにした判定用閾値より大きいときに、前記フレーム音量の計算元となるフレームを有音フレームと判定する有音無音判定部13と、を有する。 (もっと読む)


51 - 60 / 334