説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,051 - 1,060 / 1,255


【課題】 平均音量が互いに異なる音声が連続して再生される場合に、ユーザは、再生音量を調整しなくてはならず大変面倒であった。
【解決手段】 予め選択された複数の音声データについて、それら音声データの表す各音声を再生する際に用いられる再生情報を生成するための再生情報生成装置であって、複数の音声データから各音声の平均音量が略一定となるような補正量を各音声データ毎に算出する補正量算出部と、算出された各補正量とそれら補正量と各音声データとの対応関係を示す対応関係情報とを少なくとも含むように再生情報を生成する生成部と、を備える再生情報生成装置。 (もっと読む)


音響ビーム形成装置は、2つの音声入力からビーム形成信号を生成するビーム形成プロセッサを有する。更新プロセッサは、更新基準が満たされる場合、ビーム形成プロセッサのビーム形成フィルタを更新する。適応的フィルタは、これらの信号の1つから信号をフィルタリングし、フィルタ信号と他の音声入力からの信号との間の差分信号が生成される。適応化プロセッサは、差分信号を最小化する適応的フィルタを調整する。基準プロセッサは、(おそらく正規化された)差分信号に応答して更新基準を変更する。具体的には、更新基準は、差分信号がビーム形成プロセッサのビームの外部の強力な信号を示す場合、取得パフォーマンスを向上させるため緩和されるかもしれない。

(もっと読む)


【構成】補聴器(50)は,聴覚障害を持つユーザの上限周波数よりも高い周波数を再生する手段(55,56,57,58)を備えている。この発明による補聴器(50)は,聴覚障害を持つユーザが知覚可能な周波数範囲内の低帯域周波数と一致させるために,検出された周波数に基づいて,聴覚障害を持つユーザの上限周波数よりも外側の高帯域周波数を下げる置換を行う手段(55,57)を備えている。置換手段(55,57)は,低周波数帯域の主周波数を検出する適応ノッチフィルタ(15),適応ノッチフィルタ(15)によって制御される適応手段(16),適応手段(16)によって制御される発振器(3),および信号を実際に周波数によって置換する乗算器(4)を備えている。
(もっと読む)


方法および装置が、代替センサ信号および気導マイクロホン信号に基づいて音声状態の尤度を決定する。音声状態の尤度は、クリーン音声信号のクリーン音声値を推定するために、代替センサ信号および気導マイクロホン信号と共に使用される。
(もっと読む)


方法および装置は、代替センサ信号、気導マイクロフォン信号を使用して代替センサについてのチャネル応答を決定する。次いで、このチャネル応答、およびクリーン音声値の事前確率分布を使用して、クリーン音声値を推定する。
(もっと読む)


ある環境において複数の音源からそれぞれ放射される複数の音源信号から1つ以上の音響信号を抽出するためのシステムであり、このシステムは、1つ以上の音響信号を環境から受信するための、かつ、信号を信号処理装置へ送信するためのマイクロホン受信器のアレイを備え、信号処理装置は、受信器のアレイによって受信されたデータを用いて複数の音源信号を推定するように構成され、信号処理装置は、さらに、環境のインパルス応答を推定するために、推定された音源信号を用いて、受信器のアレイによって受信されたデータに演算を施すように構成され、受信器のアレイによって受信されたデータは、複数のチャンネルを備える出力を提供するために、環境のインパルス応答の推定に入力され、チャンネルの中の1つまたは複数は、それぞれ、複数の音源の中の1つからの1つ以上の音響信号に対応する。
(もっと読む)


【課題】 過去のフレームから未来のフレームに渡る時間スペクトルパターンを参照することによって、帯域の音声らしさを正しく推定できるマスク作成装置を提供することを目的とする。
【解決手段】 音声入力部1は、音声信号を入力し分析フレームを生成する。帯域分析部2は、音声入力部1が生成した分析フレームの音声信号から帯域パワーを求める。遅延メモリ3は、帯域分析部2が求めた帯域パワーの時系列を記憶する。時間長探索部61は、帯域パワーの時系列に基づいて、パターンの時間長を求める。時間長メモリ62は、時間長を記憶する。音声らしさ推定部4は、帯域パワーの時系列及びパターンの時間長に基づいて、現在のフレームにおける帯域の音声らしさを推定する。そして、音声らしさに基づいてマスク出力5する。 (もっと読む)


【課題】電話機の送話信号と受話信号とを別々に音声認識する音声認識方法において、受話信号に回り込む側音成分に起因する音声認識率の低下を改善する。
【解決手段】電話機から送話信号と受話信号とを取り出し、これら送話信号と受話信号を別々に音声認識する音声認識装置において、送話信号が受話信号に回り込むゲインを推定する側音ゲイン推定部と、受話信号の最大振幅を推定する受話信号最大振幅推定部と、推定した側音ゲインと受話信号最大振幅を用いて送話信号に対する側音信号を推定する側音信号推定部と、推定した側音信号により受話信号から側音信号を抑圧する側音抑圧処理部と、側音抑圧処理後の受話音声と送話音声とを別々に音声認識する音声認識処理部とを備える。 (もっと読む)


【課題】クロストークが起きがちな電話による会話の音声認識率を向上する。
【解決手段】
受話信号に送話信号が回り込む側音を抑圧処理する側音抑圧処理過程と、送信信号の音声区間を検出する送話音声区間検出過程と、側音抑圧処理過程で抑圧処理後の受話信号の音声区間を検出する受話音声区間検出過程と、送話音声区間検出過程及び受話音声区間検出過程で検出した各音声区間情報を管理し、送話音声区間では同時に受話音声区間でなく、受話音声区間では同時に送話音声区間でないことを判定する音声区間情報管理過程と、この音声区間情報管理過程で管理されている音声区間情報に従って音声区間の音声信号を抽出する音声信号抽出過程と、抽出された音声信号を音声認識処理する音声認識処理過程とを含む。 (もっと読む)


【課題】音源への制約を緩和しつつ、マイクロホン数以上の音源を扱うことのできる音源定位と音源分離のための音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体を提供する。
【解決手段】 音響信号入力部2に入力されたマイク1a及び1bの2つの振幅データは周波数分解部3により解析され、2次元データ化部4により両者の位相差が周波数毎に求められる。周波数毎の位相差は2次元の座標値を与えられて2次元データ化される。図形検出部5は生成されたXY平面上の2次元データを解析して図形を検出する。音源情報生成部6は検出された図形の情報を処理し、音響信号の発生源たる音源の数、各音源の空間的な存在範囲、各音源が発した音の時間的な存在期間、各音源音の成分構成、各音源毎の分離音声、各音源音声の記号的内容を含む音源情報を生成する。 (もっと読む)


1,051 - 1,060 / 1,255