説明

国際特許分類[G10L15/20]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 不利な環境に特に適した音声認識技術,例.雑音またはアクセントのある音声 (334)

国際特許分類[G10L15/20]に分類される特許

1 - 10 / 334



Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285


Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285

【課題】音響信号から雑音信号を効果的に抑圧することができる雑音抑圧技術を提供する。
【解決手段】雑音を含まない、多数話者の音声信号を学習データとして学習された話者独立の音声信号の確率モデルである話者独立音声モデルを音響信号に含まれる音声信号の話者に適応させるための話者適応パラメータと、雑音信号の確率モデルである雑音モデルと、話者独立音声モデルとを用いて、音響信号の確率モデルである第一確率モデルを生成し、第一確率モデルと音響信号の音響特徴とに基づいて雑音信号を推定し、推定した雑音信号を学習データとして雑音モデルを教師無し学習し、音響信号の音響特徴と話者独立音声モデルと雑音モデルとを用いて、音響信号に含まれる音声信号を推定し、推定した音声信号を学習データとして、話者適応パラメータを教師無し推定し、音響信号の音響特徴と話者独立音声モデルと雑音モデルと話者適応パラメータとを用いて雑音信号を抑圧する。 (もっと読む)


【課題】安定的に音声を強調することができる音声強調装置、音声強調方法、及び音声強調プログラムを提供すること。
【解決手段】本発明にかかる音声強調装置2は、雑音成分用カートシス推定部27と、混合信号用カートシス推定部28と、音声成分用カートシス推定部29と、カートシステーブルを格納するメモリ24と、減算係数適応器31と、雑音減算部12と、を備える。音声成分用カートシス推定部29は、雑音成分用カートシス推定部27により推定された雑音成分のカートシス及び混合信号用カートシス推定部28により推定された混合信号のカートシス推定部に対応する音声成分のカートシスを、カートシステーブルを参照して推定する。 (もっと読む)


【課題】音量と声質を変化させることなく音声信号の音声の明瞭度を向上させることができる音声強調装置とその方法とプログラムを提供する。
【解決手段】音声分析部は、音声信号を入力として、当該音声信号をpサンプル間隔で分析を行い、上記pサンプルごとの基本周波数f(i)と、非周期性指標A(i,f)と、スペクトルパワーP(i,f)を出力する。そして、非周期性指標変換部は、所定の周波数範囲の非周期性指標の値A(i,f)を、周波数の増加に対して小さくなる変換後非周期性指標A′(i,f)と当該変換後非周期性指標A′(i,f)の最小の変換後非周期性指標A′(i,f)とに変換して出力する。音声合成部は、基本周波数f(i)とスペクトルパワーP(i,f)と変換後非周期性指標A′(i,f)とを用いて音声合成音を合成する。 (もっと読む)


【課題】音によるコンテキストの理解の妨げとなる類似音を認識対象音と区別して、正しいコンテキストの理解を可能とする。
【解決手段】1つ以上の集音手段によって収集された音のデータを用いて、集音手段が配された空間内の特性であって音源からの音に基づく音特性を計測する音特性計測手段101と、音特性計測手段101によって計測された音特性が認識対象音の音特性と合致するか否かを判定して、収集された音が認識対象音であるか類似音であるかを判別する類似音判別手段102とを備える。 (もっと読む)


【課題】雑音成分の大きさにかかわらず、音声を歪ませることなく残響成分のみを正確に抑制する。
【解決手段】音声の入力に応じてマイクロホンから得られる入力信号の電力の時間変化を解析することにより、前記音声が発声されている区間の末尾に続く残響区間における前記入力信号の電力の単位時間当たりの減少量を求める解析部と、前記解析部による解析結果に基づいて、前記入力信号を減衰させる比率を示す抑制ゲインを制御する抑制制御部とを備える。また、音声の入力に応じてマイクロホンから得られる入力信号の電力の時間変化を解析することにより、前記音声が発声されている区間の末尾に続く残響区間における前記入力信号の電力の単位時間当たりの減少量を求め、前記残響区間における前記入力信号の電力の単位時間当たりの減少量に基づいて、前記入力信号を減衰させる比率を示す抑制ゲインを制御する処理をコンピュータに実行させる。 (もっと読む)


【課題】音声認識装置においてクリッピングによる性能劣化を防止する。
【解決手段】変換部は、入力された処理対象の信号をA/D変換し、分析部は、A/D変換された信号がクリップしている場合、クリップしていない信号を分析対象信号として生成し、分析対象信号を分析し、処理部は、分析された信号を処理する。例えば切り出した分析区間がクリップされた部分を含む場合、クリップされている部分が除外されるように、前記分析区間を基準値より短い長さに変更することで、前記分析対象信号を生成する。 (もっと読む)


【課題】計算コストを小さく抑え、より複雑な形状をした確率密度関数を利用することができる、より効率的で高精度な背景音抑圧装置を提供する。
【解決手段】本発明の背景音抑圧装置40は、特徴量抽出部100が観測信号から高解像度音源位置特徴量と高解像度スペクトル特徴量を抽出し、音源位置占有度推定部210が高解像度音源位置占有度を求め、高解像度占有度推定部520が高解像度占有度とスペクトルパラメータを推定し、目的音声推定部600が目的音声を推定する。 (もっと読む)


【課題】クリーン音声の事例モデルのみを用いて音声強調を行う雑音/残響除去装置を提供する。
【解決手段】強調処理結果信頼性計算部は、入力信号の特徴量と、1次音声強調信号とから、その1次音声強調信号の不確かさを示す値を出力する。マッチング部は、1次音声強調信号と、当該1次音声強調信号の不確かさを示す値と、学習データの事例モデルと、を入力として各時間フレームに対して入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントを出力する。音声強調フィルタリング部は、入力信号と学習データセグメントを入力として、該学習データセグメントと対を成す振幅スペクトルデータを事例モデル記憶部から読み出してウィナーフィルタを生成し、入力信号のパワースペクトルにそのウィナーフィルタを乗じてフィルタリングして音声強調信号を出力する (もっと読む)


1 - 10 / 334