説明

Fターム[5D015EE06]の内容

音声認識 (5,191) | 前処理 (287) | 音素の強調 (13)

Fターム[5D015EE06]に分類される特許

1 - 13 / 13


【課題】安定的に音声を強調することができる音声強調装置、音声強調方法、及び音声強調プログラムを提供すること。
【解決手段】本発明にかかる音声強調装置2は、雑音成分用カートシス推定部27と、混合信号用カートシス推定部28と、音声成分用カートシス推定部29と、カートシステーブルを格納するメモリ24と、減算係数適応器31と、雑音減算部12と、を備える。音声成分用カートシス推定部29は、雑音成分用カートシス推定部27により推定された雑音成分のカートシス及び混合信号用カートシス推定部28により推定された混合信号のカートシス推定部に対応する音声成分のカートシスを、カートシステーブルを参照して推定する。 (もっと読む)


【課題】アクセントの位置に関係なく高精度で単語を認識する音声認識装置を提供する。
【解決手段】音声認識装置40は、音響信号の中から音声信号を含む発話区間を検出する発話区間検出部41と、発話区間検出部41により検出された発話区間内の音声信号のうち初期部分を増幅する音声初期増幅部42と、発話区間検出部41により検出され、かつ、音声初期増幅部42により増幅された音声信号を分析することにより、その音声信号から音響特徴量を抽出する音声分析部43と、あらかじめ作成された各単語の音響特徴量を記憶する音響ライブラリ44と、音声分析部43により抽出された特徴量を音響ライブラリ44に記憶された各単語の音響特徴量と照合し、各単語の尤度を算出する照合部45と、照合部45により算出された各単語の尤度のうち最尤度の単語を認識結果と判定する判定部46とを備える。 (もっと読む)


【課題】 一般的な音声認識装置は、雑音や目的話者以外が発声する妨害音声によって著しく性能が低下する。大規模なマイクロフォンアレイや雑音の参照信号を必要とすることなく、雑音環境下で目的話者の音声のみを抽出する。
【解決手段】 マイクロホン等から得られる2チャンネルの入力音声についての処理として、スペクトラム・サブトラクション (SS:Spectrum Subtraction)処理とフロアリング(Flooring)処理との間で利得調整を行うことだけによって、実用的な音声認識性能を実現する。利得調整としては、CSP (Cross-power Spectrum Phase:クロス・パワー・スペクトラム・フェーズ) 係数という2チャンネル信号間の相互相関関係を利用できる。オーディオ背景音などが存在する車の室内環境において、カーナビゲーションシステムにおける音声コマンドの認識率を向上させ、ドライバーなど発話者のユーザビリティを向上させる。 (もっと読む)


【課題】突発的な雑音に対しても頑健に音声認識を行なうことができる音声認識装置を提供する。
【解決手段】音声認識装置は、与えられる音声信号中の繰返発声部分を検出する繰返発声検出部220と、検出された繰返発声をDPマッチングし、繰返発声中で互いに対応する音声フレームのパワースペクトル上の各周波数ビンでパワーの小さな方を選択することにより、繰返発声を統合したパワースペクトルを生成する繰返発声統合部222と、繰返発声統合部222により統合されたパワースペクトルを用いて音声認識し、繰返発声を構成する発声単位を出力するための音声認識処理部224とを含む。 (もっと読む)


【課題】自動車内などにおける残響下における目的音除去の問題を緩和して目的音信号の強調を行う。
【解決手段】マイクロホン101−1〜Nからの複数チャネルの入力音響信号に対してチャネル間特徴量算出部102によりチャネル間の差異を表すチャネル間特徴量を算出し、予め用意された重み係数辞書103から選択部104によって該特徴量に対応付けられた複数チャネルの重み係数を選択し、選択した重み係数を用いて重み付け部105−1〜Nと加算器106により入力音響信号を重み付け加算して出力音響信号を生成する。 (もっと読む)


処理システムは、所望の信号成分を含み、トーンノイズを低減または排除する出力信号を生成する。出力信号は、音声認識システム、ピッチ検出器、および他の処理システムを含む任意の後続の信号処理システムに提供され得る。後続の処理システムは、トーン入力信号ノイズを誤って、所望の信号コンテンツとして捉えること、計算リソースを不必要に消費して、ノイズを解析すること、およびトーンノイズによって誘発される偽のアクションを採ることを起こりにくくする。
(もっと読む)


【課題】低負荷な演算処理で聞き取りやすい音声に補正可能な聴覚補助装置等を提供する。
【解決手段】聴覚補助装置は、音声入力部10で入力された音声信号の振幅を量子化し、量子化された各点のデータにつき、隣接する所定の範囲のデータの振幅値を加算し、これを加算したデータの個数で除算して該データを中心とする部分平均値を求め、各点のデータの振幅値と各々の部分平均値とを比較し、比較結果の真偽に基づいて凹凸波形に変換するための凹凸波形変換部14と、音声信号の凹凸波形から、人の声に対応する声成分を抽出するための声成分抽出部16と、声成分の凸部を高く、凹部を低くすることで強調し、強調声波形を生成するための強調処理部18を備える。 (もっと読む)


【課題】 ノイズの影響がある等の多様な環境下においても高い音源分離性能が得られること。
【解決手段】 複数の混合音声信号Xi(t)からICA法に基づくBSS方式の音源分離処理により,1以上の音源信号Si(t)を分離(同定)したSIMO信号を分離生成するSIMO−ICA処理部10と,これにより生成されたSIMO信号に対してバイナリーマスキング処理を施すことによって1以上の音源信号について分離(同定)した分離信号を生成するバイノーラル信号分離処理部20との2段構成を備えた音源分離装置。 (もっと読む)


【課題】音声の歪みが少なくかつノイズを十分に除去すること
【解決手段】音声非音声識別部106は、音声スペクトル信号とノイズベースの値の差が所定の閾値以上である場合、音声成分を含む有音部分と判定し、それ以外の場合、音声成分を含まない雑音のみの無音部分であると判定する。コムフィルタ生成部107は、各周波数成分における音声成分の有無に基づいて音声ピッチを強調するコムフィルタを生成する。減衰係数計算部108は、コムフィルタに周波数特性に基づいた減衰係数を乗算して、各周波数成分毎に入力信号の減衰係数の設定を行い、各周波数成分の減衰係数を乗算部109に出力する。乗算部109は、音声スペクトルに減衰係数を周波数成分単位で乗算する。周波数合成部110は、乗算の結果得られた周波数成分単位のスペクトルを所定の処理時間単位で、周波数領域で連続する音声スペクトルに合成する。 (もっと読む)


雑音及び/又はエコーによって擾乱されたデータ・スペクトグラムを復元する方法を記載する。スペクトグラム・データは信頼尺度の授与にかけられ、低信頼尺度を有するスペクトグラム・データは高信頼度データによって置き換えられる。特に、高信頼度データが記憶されているコードブック・エントリを選択する手段として、高信頼尺度を有するスペクトグラム・データを用いて置き換えが行われる。そのようなコードブックは実施するのが容易であり、本方法は、相関の計算や行列の反転を行わないようにし、使用統計モデルの特定の種類に関する制約がないようにするものである。復元方法は、音声認識結果を改善し、そのことはボイス制御装置では重要なことである。 (もっと読む)


【課題】車室内の音声を、ノイズが低減された状態で取得することができる音声入力装置を提供すること。
【解決手段】車室内部を撮像する撮像部101と、撮像部101から得られる映像を解析し、ノイズ特徴を判定する解析判定部102と、入力音を取得する音声入力部105と、該入力音に含まれるノイズを低減するフィルタを複数記憶するフィルタバンク104と、解析判定部102により判定されたノイズ特徴に基づいて、該入力音に含まれるノイズ成分を低減し、音声成分を強調して抽出するためのフィルタをフィルタバンク104から少なくとも一つ選択して適用するフィルタ選択部103と、フィルタ選択部103によって選択されたフィルタを用いて入力音をフィルタリングするフィルタ部106とを有することを特徴とする音声入力装置を構成する。 (もっと読む)


【課題】 仕分け担当者が各ラインに直交する方向に一列に並んでいる場合において、対応する仕分け担当者の発声についての音声強調や雑音低減の効果が期待できる音声入力装置を提供する。
【解決手段】 音源の周りに並べられ、かつ、音源から同一距離だけ離間した位置に設けられた3つのマイクロフォンで構成されているマイクロフォン群100を備え、各マイクロフォンにおける周波数帯域毎のパワースペクトルを算出し、各マイクロフォンにおける周波数帯域毎のパワースペクトルの最大値及び最小値をそれぞれ求め、パワースペクトルの最大値に対するパワースペクトルの最小値の比率を、音源の周りに並べられた前記3つのマイクロフォンの中で2つのマイクロフォン間に設けられたマイクロフォンにおける周波数帯域毎のパワースペクトルに乗算するようにした。 (もっと読む)


【課題】 本発明は音声認識技術に関するものであり、非定常騒音環境下であっても正しく音声区間検出を行うことを目的とする。
【解決手段】 音声認識装置において、音声パワーとノイズパワーの比であるSN比が一定の閾値を超えるか否かで音声スイッチのON/OFFを切り替え、音声スイッチが最後にONになってからT1秒以上経過し、かつ最後にOFFになってからT2秒以上経過し、かつ認識開始後T6秒以内であって、かつ最大SN比がαdB以上であり、かつ認識対象語彙に対する最大尤度がβ以上であるときに、終了検出する手段をもつ音声認識装置。 (もっと読む)


1 - 13 / 13