説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,101 - 1,110 / 1,255


【課題】音源への制約を緩和しつつ、マイクロホン数以上の音源を扱うことのできる音源定位と音源分離のための音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体を提供する。
【解決手段】 音響信号入力部2に入力されたマイク1a及び1bの2つの振幅データは周波数分解部3により解析され、2次元データ化部4により両者の位相差が周波数毎に求められる。周波数毎の位相差は2次元の座標値を与えられて2次元データ化される。図形検出部5は生成されたXY平面上の2次元データを解析して図形を検出する。音源情報生成部6は検出された図形の情報を処理し、音響信号の発生源たる音源の数、各音源の空間的な存在範囲、各音源が発した音の時間的な存在期間、各音源音の成分構成、各音源毎の分離音声、各音源音声の記号的内容を含む音源情報を生成する。 (もっと読む)


【解決手段】一実施形態では、本発明は、少なくとも1つの入力および少なくとも1つの出力を有するボコーダと、ボコーダの入力に動作可能に接続される少なくとも1つの入力、および少なくとも1つの出力を有するフィルタを含む符号器と、符号器の少なくとも1つの出力に動作可能に接続されている少なくとも1つの入力、およびボコーダの少なくとも1つの出力に動作可能に接続されている少なくとも1つの出力を有するシンセサイザを含む復号器であって、メモリを含み、音声フレームを位相整合し、タイムワープすることを含む、メモリに格納されている命令を実行するように構成されている復号器とを含む。 (もっと読む)


【課題】 自動車のような走行中の車輌内において音声認識により車載機器を操作する場合に音声認識にたとえ失敗したとしても次にユーザの発声レベルを変化させること無しに音声認識を成功させることを可能とする。
【解決手段】 車輌が停止している場合に、音声入力装置1から入力された音声信号のレベルが音声認識機能部4による音声認識が可能な入力レベルとなるような増幅率を初期値としてプログラマブルゲインアンプ20に設定する。車輌が走行している場合に、音声入力装置1から入力された音声信号のレベルが過大(又は過小)である場合はプログラマブルゲインアンプ20に設定されている増幅率を入力レベル記憶部53が記憶している音声信号のレベルに基づいてより小(大)なる値に変更する。 (もっと読む)


【課題】非定常雑音を除去することができる雑音低減装置を提供する。
【解決手段】
目的となる音声信号を複数の帯域に分割し、最低域の帯域信号の各離散時間点の移動平均を計算して、エンベロープ値を求め、このエンベロープ値を基に高域側の帯域信号のエンベロープ値を推定する。推定した各帯域のエンベロープ値と各帯域の信号の離散時間点の値とを比較し、小さい方の値を採用して雑音を除去し、各帯域の信号を合成して雑音が除去された信号を得る。 (もっと読む)


【課題】加法性雑音及び残響等の外乱による影響を受ける実環境下での音声認識性能を改善し、外乱の成分の抑圧を短時間で行なうことができる外乱成分抑圧装置を提供する。
【解決手段】外乱成分抑圧部114は、加法性雑音及び乗法性歪みが生じる環境下で目的音声を観測することにより得られる観測信号について、所定周期ごとにフレーム化された所定時間長のフレームよりそれぞれ抽出される特徴量124を受け、複数のパーティクルを有するパーティクルフィルタを用いて、外乱を表すパラメータ206をフレームごとに逐次生成するための外乱確率分布推定部200と、観測信号の特徴量124と、外乱の推定パラメータ206と、GMM130とを用いて、フレームごとに目的音声の推定特徴量126を算出するためのパラメータ生成部202及びクリーン音声推定部204とを含む。 (もっと読む)


【課題】 複数の信号源から発せられた信号が混合された混合信号から目的信号を小さな歪みで分離抽出する。
【解決手段】 まず、窓関数の長さTの1/S(S>2)倍シフトで設定された各フレームにおいて当該窓関数を混合信号に掛け合わせ、それらの各演算結果を時間周波数領域の信号に変換する。次に、これらの時間周波数領域の信号から抽出した特徴量をクラスタリングしてクラスタを生成し、これを用いて時間周波数毎のマスクを生成する。その後、マスクと時間周波数領域の信号とを用い、時間周波数毎に時間周波数領域の分離信号を抽出し、この時間周波数領域の分離信号を時間領域の分離信号に変換し、各フレームに対応する時間領域の分離信号を加算合成する。 (もっと読む)


【課題】 話者の音声に応じて、話者の位置も考慮して適切な対応をとる。
【解決手段】 ロボット100は、第一の参加者300、第二の参加者310、および第三の参加者320にそれぞれ付与された第一のマイク306、第二のマイク316、および第三のマイク326から入力された音声に関するデータが所定の条件に合致することを示すイベントを、当該話者に対応づけられた音声識別情報とともに入力する。ロボット100は、入力したイベントに対応づけられた音声識別情報により特定される話者の位置情報を取得して、イベントと、話者の位置情報とに基づき、言動を決定する。 (もっと読む)


本発明は生きている皮膚の感覚及び知覚を得るために音響事象を高感度に検出する方法及び装置並びにその使用に関する。音響事象は、複数のスペクトル領域に分解され、前記領域を示す信号から生きている皮膚の上へ及び/又は生きている皮膚の中へと作用する所定の送信機を選択するために制御電圧が決定される。制御電圧の選択及び割り当てはスペクトル領域を示す信号を使用する信号分析に依存している。本発明は聴覚障害者を音楽に敏感にすることと聴覚障害者に信号の送信をすることの両方に関する。 (もっと読む)


【課題】 複数の信号が混合された音声信号を独立成分分析を用いて信号毎に分離する際のパーミュテーションの問題を解消する。
【解決手段】 短時間フーリエ変換部12は、観測信号を時間周波数領域に変換し、信号分離部13は、この信号から時間周波数領域の分離信号を生成する。具体的には、時間周波数領域の観測信号と初期値が代入された分離行列とから時間周波数領域の分離信号を生成し、この時間周波数領域の分離信号と多次元確率密度関数を用いたスコア関数と上記分離行列とを用いて該分離行列の修正値を計算し、この修正値を用いて、上記分離行列が略々収束するまで該分離行列を修正し、略々収束した分離行列を用いて時間周波数領域の分離信号を生成する。逆フーリエ変換部16は、この分離信号を時間領域に変換する。 (もっと読む)


【課題】従来の残響除去方法では、少ないセンサ数、事前の伝達関数の測定が不要、かつ少量の学習データで、いたるところから到来する残響除去を行うことはできなかった。
【解決手段】本発明では、まず少量の逆フィルタ学習データを用いて調波構造に基づく残響除去法によって残響除去を施し、得られた信号に加法的な雑音を除去する手法を適応し、明瞭性の良い音声を得る。次に、その得られた信号を逆フィルタの参照信号として、正確な逆フィルタを推定し、少量の逆フィルタ学習データで残響除去を行う。
また、本発明では独立な複数のフレームから得られた逆伝達関数の平均をとることにより、より正確な逆伝達関数を得る。 (もっと読む)


1,101 - 1,110 / 1,255