説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,191 - 1,200 / 1,255


【課題】任意の位置に設置される複数のマイクを用いて有効に反射波を除去することのできる反射波除去方法を提供することを目的とするものである。
【解決手段】複数の受波器によって受信された受信波の自己相関関数を算出し、また、これら複数の自己相関関数の平均である平均自己相関関数を算出する。そして、この平均自己相関関数と特定の受波器で受信した受信波に対する自己相関関数との差を求め、ローカルピークを与える遅延時間から、特定の反射経路に対する遅延時間を抽出する。次に、減算率を決定するに際しては、仮に反射波の減算率を定めておき、前記抽出された遅延時間とこの仮の減算率を用いて反射波を除去する。そして、その反射波が除去された信号の自己相関関数と前記平均自己相関関数との差が所定値内に収まるように減算率を決定していく。そして、この遅延時間と減算率を用いて反射波を除去する。 (もっと読む)


マルチチャンネル(例えば、ステレオ)オーディオ信号をエンハンスする装置(10)は、オーディオ信号の元のチャンネル間特性を表す元のパラメータ(α、ILD、ICC)を調節するパラメータ調節装置(13)を有する。装置は、オーディオ信号を処理して、調節されたパラメータ(α’、ILD’、ICC’)を有する、エンハンスされたオーディオ信号を生成する処理装置(11)を更に備える。装置によって、アーチファクトをもたらすことなく、ステレオのワイド化やその他のマルチチャンネル信号エンハンスメントが可能になる。
(もっと読む)


【課題】ハードウェア資源の大幅な増加を伴わず、また実環境での不安定性の少ない特徴をもった、様々な環境で高い認識性能が得られる音声認識装置及び音声認識方法を提供することにある。
【解決手段】減算処理部は、過去Lフレーム分の観測信号Y(f,m−1)〜Y(f,m−L)を記憶する信号記憶部8と、現在の時間フレームの観測信号Y(f,m)から、信号記憶部8に記憶した過去の時間フレームの各観測信号Y(f,m−1)〜Y(f,m−L)に対応する減算係数記憶部9の減算係数α〜αを夫々乗じた信号をパワースペクトル減算してその結果を推定信号Sest(f,m)として出力する減算部10とで構成され、音声特徴量抽出部4は推定信号Sest(f,m)から音声特徴量を抽出する。 (もっと読む)


雑音音響環境内で音響的に別個の音声信号を生成するために、ヘッドセットを構成する。ヘッドセットは、使用者の口の近傍に所定の間隙を介した一対のマイクロフォンを配置する。マイクロフォンは各々使用者の音声を受け取り、さらに音響環境の雑音を受け取る。雑音と情報の両方の成分を有するマイクロフォン信号は、分離プロセス内に受け取る。分離プロセスは、実質的に雑音成分を低減した音声信号を生成する。それから、送信用に音声信号を処理する。一例では、送信プロセスは、ブルートゥース無線を用いて局所的制御モジュールに音声信号を送信することを含んでいる。
(もっと読む)


【課題】収音時にチャネル相互に混合された複数チャネル信号から目的とする音声のみを精度良く抽出する。
【解決手段】人間がシステムに目的音と妨害音の位置や周波数特性を入力するユーザーインターフェースを持つことと、各時間ごとの目的音抽出後の信号パワーと目的音の信号パワーのずれを抑えるような音源分離部を持つことで、従来より高精度な目的音抽出が可能となる。 (もっと読む)


【課題】 ノイズ処理に必要とされる時間と音声符号化処理とからなるデータ処理時間を短縮する。
【解決手段】 本発明は、携帯端末などで発生するキークリックノイズ等に対して、ノイズ部分の符号化データを無音データに置き換えることでノイズを除去し、データ置き換えの判定を符号化処理と並行して行い、データ置換を符号化処理時間内に行うことで処理遅延時間を増やすことなく雑音除去を行う。 (もっと読む)


【課題】 本発明は、受信状態が変化する場合、ユーザが音声又は映像を視聴可能な確率が従来よりも高く、従来よりユーザに与える満足度が高い受信装置を提供する。
【解決手段】 本発明の受信装置は、デジタル音声データを含むデータストリームを受信する受信部と、デジタルストリームから同期信号を検出し、デジタル音声データを検出して復調し、誤り訂正復号化して出力する復調部と、復調部が同期ロック出来ない場合は、デジタル音声データをミュートして出力せず、復調部が同期ロックし且つデジタル音声データの誤り率が所定値以下である場合は、デジタル音声データをそのまま出力し、復調部が同期ロックし且つデジタル音声データの誤り率が所定値より高い場合は、デジタル音声データが人間の聴覚に与える刺激を弱めるようにデジタル音声データに所定の加工をする信号加工処理部と、を有する。 (もっと読む)


【課題】 調波構造音抽出処理に時間伸縮処理技術を用いることで、調波構造音を先行例と比較してより正確に得ることができ、全体としてより正確な残響除去処理を実施するこ残響除去方法、この方法を実施する装置、プログラムおよび記録媒体を提供する。
【解決手段】 入力された残響を含んだ音声信号x(t)に対して、基本周波数推定部1により基本周波数推定処理をし、基本周波数時間微分推定部2により基本周波数時間微分推定処理をし、信号波形の時間伸縮部3により信号波形の時間伸縮処理をし、調波構造音抽出部4により調波構造音抽出処理をし、信号波形の時間伸縮復元部5により信号波形の時間伸縮復元処理をし、逆伝達関数推定部6により逆伝達関数推定処理をし、逆伝達関数適用部7により逆伝達関数適用処理をする残響除去方法、この方法を実施する装置、プログラムおよび記録媒体。 (もっと読む)


【課題】 実環境において信号源の数を正しく推定する。
【解決手段】 周波数領域変換部20が、観測信号xj(t)(j={1,...,M})を周波数毎の時系列データXj(f,τ)に変換し、信号分離部31が、この時系列データXj(f,τ)から分離信号Yi(f,τ)を生成してメモリ10に格納する。次に、パワー算出部32が、各分離信号Yi(f,τ)のパワー値を求めてメモリに格納し、エンベロープ相関算出部33が、異なる分離信号Yi(f,τ)間の時間差Δτに対するエンベロープ相関値を算出してメモリに格納する。そして、判定部34が、各分離信号Yi(f,τ)のパワー値及びエンベロープ相関値と、残響レベル及びエンベロープ相関値のそれぞれのしきい値を示すパラメータthnoise、threv及びthcorとを比較し、当該分離信号Yi(f,τ)が源信号成分であるか否かを判断する。 (もっと読む)


【課題】 妨害音により音声登録時の盗み聞きを防止し、演算量負荷及びコストを低減して、精度が高い話者認識を実現することである。
【解決手段】 妨害音下で音声入力部3から入力された入力音を基にして特徴量計算部4により音声特徴量を計算し、使用者の音声を登録する場合には、その音声特徴量を音声情報である標準パターンとして音声登録部7により標準パターンDB8に登録し、使用者の音声を照合する場合には、その音声特徴量と標準パターンDB8に登録されている標準パターンとを比較することで音声照合を行うようにした。これにより、妨害音により音声登録時の盗み聞きを防止し、演算量負荷及びコストを低減して、精度が高い話者認識を実現することができる。 (もっと読む)


1,191 - 1,200 / 1,255