説明

国際特許分類[G10L11/06]の内容

国際特許分類[G10L11/06]に分類される特許

31 - 36 / 36


入力信号のレベル変動に依存せず、リアルタイム性に優れ、耐雑音性のある調波構造性音響信号区間検出装置は、入力信号にFFTを施し、フレームごとにパワースペクトル成分を求めるFFT部(200)と、パワースペクトル成分より調波構造のみを残す調波構造抽出部(201)と、調波構造抽出部(201)で抽出された調波構造のフレーム間での相関性を評価することにより、母音の区間であるか否かを評価し、有声区間を抽出する有声評価部(210)と、有声評価部(210)の出力の連続性および持続性に基づいて音声区間を決定する音声区間決定部(205)とを備える。
(もっと読む)


【課題】 どんな音声信号でも明瞭度を向上させることができる音響処理装置を提供すること。
【解決手段】 分析手段15は、A/D変換器12から入力される入力信号を分析し、入力信号の周波数特性から周波数成分間のマスキングが発生する帯域を検出し、マスキングを起す周波数帯域とマスキングされる周波数帯域とが第1の音声出力手段18と第2の音声出力手段19に分割されて出力されるように低域通過フィルタ13及び高域通過フィルタ14の通過帯域を設定する。 (もっと読む)


【課題】音声データのうちの息漏れ領域を自動的に検出する装置を提供する。
【解決手段】息漏れ領域自動検出装置は、音声データを第1および第3フォルマントの周波数にそれぞれ対応する第1および第2の周波数帯域のフィルタでそれぞれ濾波する第1および第2のフィルタ81、82と、第1および第2のフィルタ81、82によって濾波された信号波の包絡波形をそれぞれ求める第1および第2の包絡推定部83、84と、求められた二つの包絡波形の相関を求める相関演算部85と、求められた相関結果と第1のしきい値とを比較する比較部86と、比較結果に基づいて、音声データの息漏れ領域を判定する判定部89とを含む。 (もっと読む)


【課題】 無声音での雑音除去を通して音声品質の低下を減らし、特に、ALEとSSMを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。
【解決手段】 本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ;前記有声音の雑音を除去するための適応フィルタリングを行うステップ;前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。入力音声を有声音と無声音とに区分する決定ブロック;前記有声音に対して適応ライン向上技法(ALE)を行うALEブロック;前記無声音に対してスペクトルサブトラクションを行うSSブロックを含んで構成されることを特徴とする音声品質向上装置。 (もっと読む)


サウンド再生または記録システムにおいて、入力レベル(y)に応じたゲインファクタ(z)をオーディオ信号にかける。無声音素が有声音素より少なくとも6dB、好ましくは少なくとも12dB大きくエンハンスされるように、ゲインファクタの入力レベルに対する依存性を選択する。ここで、平均ゲインは6dBより小さいことが好ましい。これにより、明瞭性が向上する。
(もっと読む)


【課題】 簡単かつ高速に、無音/有音区間の判別、音楽区間と音声区間、あるいは音楽区間と音声区間と雑音区間に分類することを可能とするオーディオ情報分類装置を提供することにある。
【解決手段】 有音判定部4はエネルギー分散演算部3で求められた値σが閾値より大きい時有音と判定する。有音と判定されると、メモリ5に格納されていたオーディオ情報が読み出されて、全サブバンドエネルギー和演算部7とサブバンドエネルギー重心演算部11に入力される。前記演算部7の出力は2値化演算部8で2値化され、2値化数列分散演算部9で2値化数列の単位時間内の分散σが求められる。一方、エネルギー重心平均・分散演算部12はエネルギー重心平均Eg と分散σを求める。オーディオ情報識別部10は、前記分散σ、エネルギー重心平均Eg 、および分散σに対して識別関数を用いて、雑音、音楽、音声の判別を行う。 (もっと読む)


31 - 36 / 36