説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,071 - 1,080 / 1,255


【課題】 目的信号と雑信号との判別誤りを低減し、目的信号を高いSN比で抽出する信号抽出装置を提供すること。
【解決手段】 目的信号源および雑信号源からの信号を受信する少なくとも1つ以上の信号入力手段と、信号入力手段で受信された受信信号の信号特徴量を算出する信号特徴量算出手段と、信号特徴量算出手段で算出された信号特徴量の値に基づき、受信信号に乗算する重み値αを決定する重み値決定手段と、重み値決定手段で決定された重み値を受信信号に乗算する重み値乗算手段とを備えた信号抽出装置とする。信号特徴量としては、ケプストラムの時間軸に関する分散値、自己相関関数の時間軸に関する分散値、尖鋭度を適宜用いる。 (もっと読む)


【課題】曲名を簡単に知ることができるようにする。
【解決手段】端末35は、ユーザが喫茶店などで、たまたま流れていた音楽を入出力部42を操作することにより、記憶部44に記憶されるようになされている携帯可能な機器である。記憶部44に記憶された情報は、処理部45により読み出され、所定の処理が施され、ストレージ部46に記憶される。この記憶された情報は、通信部40により、サーバに転送される。サーバは、転送された情報に対応する曲名をデータベースから読み出し、その結果を端末35に送信する。 (もっと読む)


【課題】音声検出器を必要とせず、簡単且つ容易に入力音声信号のバックグラウンドノイズレベルを推定する。
【解決手段】ノイズレベル推定装置では、短時間フレームと、この短時間フレームの複数の集合からなる長時間フレームの概念を用いる。第1の算出手段11〜14では、短時間フレーム毎に入力音声信号x1の短時間パワーy1をそれぞれ算出する。第2の算出手段16,17では、長時間フレームにおいて前記算出された複数の短時間パワーy1のうちの最小の短時間パワーy2を算出する。出力手段18,19では、前記算出された最小の短時間パワーy2を、入力音声信号x1に対するバックグラウンドノイズのレベルy3として推定して出力する。 (もっと読む)


【課題】 周期性ノイズが混入された音声信号から周期性ノイズを低減する。
【解決手段】 入力端子10に入力された音声入力信号S+Nと、バッファメモリ11から供給された1周期前の音声入力信号との1周期分の相関演算を相関演算部12で行い、相関係数Cを算出する。相関係数Cに基づき、相関判定部13で適応的にゲイン係数を決定し、音声入力信号に対してこのゲイン係数を乗じる。ゲイン係数を乗じた音声信号をノイズメモリ17に格納された加算出力Yに加算して累積し、この累積された信号を音声入力信号S+Nから減ずる。このように、ゲイン係数を乗じた音声信号を、ノイズメモリ17に格納された加算出力Yに加算することにより、加算出力Yの値は、周期性ノイズNの値に収束する。この時、ゲイン係数を相関係数Cに応じて適応的に決定しているので、ゲイン係数を固定的とした場合よりも早く、かつ適切に収束することができる。 (もっと読む)


【課題】 非周期的な雑音を低減する装置では計算量は膨大となると予想されるため、構成が複雑であり、雑音を集音するマイクを設けて雑音を低減する方法は、雑音を集音するマイクに主たる音声が漏れ込んで、集音した主たる音声の利得を減少させてしまう。
【解決手段】 音声認識装置10の内部に設けられた接話型マイク12により音声認識装置10内部の雑音が集音される。接話型マイク12は、近距離音源に対しては平坦な周波数特性を持ち、距離が長い音源に対しては低域減衰特性を有するため、近距離音源である非周期的な装置内雑音だけを集音し、集音マイク20で集音する主たる音声が漏れ込むことは殆どないため、雑音低減処理により、目的の音声の利得を減少させてしまうことはない。また、音声認識装置10内で発生して装置外部へ出力される非周期的な雑音を、集音した目的の音声信号から低減するための膨大な計算量を必要とする演算は不要である。 (もっと読む)


処理システムは、所望の信号成分を含み、トーンノイズを低減または排除する出力信号を生成する。出力信号は、音声認識システム、ピッチ検出器、および他の処理システムを含む任意の後続の信号処理システムに提供され得る。後続の処理システムは、トーン入力信号ノイズを誤って、所望の信号コンテンツとして捉えること、計算リソースを不必要に消費して、ノイズを解析すること、およびトーンノイズによって誘発される偽のアクションを採ることを起こりにくくする。
(もっと読む)


オーディオ応答の適応は、ヘッドホンのイヤピース内の残留環境雑音又は他の妨害のような妨害信号の知覚作用に対処する。一態様では、入力オーディオ信号が妨害信号よりもかなり高いレベルにあるときに、概ね変更されずに与えられ、妨害信号のレベル以下であるときに圧縮される。その手法は、たとえば、ヘッドセットのイヤピース内の音響信号の測定されたレベルを利用することができ、入力オーディオ信号のレベルと共に、測定されたレベルを用いて、モニタされた音響信号内に存在する妨害信号を入力オーディオ信号に関連付けられる成分から分離することを必要とすることなく、圧縮特性を決定することができる。別の態様では、入力オーディオ信号の提供特性が、背景会話からのような、妨害信号からの注意力散逸を低減させるように決定される。
(もっと読む)


入力オーディオ信号x(t)の周波数・時間区間を分類する方法が開示される。入力オーディオ信号の周波数・時間区間はまず、ある知覚モデルに従ってモデル化されて(62…71)第一の表現を与える(Rep1)。その周波数・時間区間は次に、ノイズ置換によって修正された入力信号を使って同じ知覚モデルに従ってモデル化されて(62…71)第二の表現(Rep2)を与える。その周波数・時間区間は次いで、その第一および第二の表現の比較に基づいてノイズありかノイズなしかに分類される。
(もっと読む)


【課題】変化する計算リソース状況下においても、安定した雑音抑圧性能を持つフィルタの生成が可能な音声入力装置及び音声入力方法を提供すること。
【解決手段】音入力手段101-1〜101-nで音信号を取得する音入力部と、該音信号を複数の周波数帯域に分割する帯域分割部103と、雑音成分を除去するフィルタをフィルタ学習計算によって導出するフィルタ計算部106と、該フィルタを用いて前記音信号を濾波するフィルタ部107とを有し、前記フィルタ学習計算に利用可能な計算資源の量を算出するか、または、該フィルタ学習計算のための計算可能時間を決定するリソース取得部104と、前記周波数帯域のうちの少なくとも一つの周波数帯域を、前記フィルタ学習計算に利用可能な計算資源の量、または、前記フィルタ学習計算のための計算可能時間に基づき、優先計算帯域として選択する帯域選択部105とを有する音声入力装置を構成する。 (もっと読む)


【解決手段】(a)ノイズパワー推定器において、スピーチ成分及びノイズ成分を有する信号内のノイズパワーを推定することと、(b)コンプレクスガウシアンン統計モデルと、ステップ(a)からのノイズ信号の推定パワーから、信号中のスピーチの存在に対する尤度比を計算することとの各ステップを含む音声アクティビティ検出方法。 (もっと読む)


1,071 - 1,080 / 1,255