説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

211 - 220 / 1,255


【課題】音源分離装置において、音源数が未知であっても動作し、周波数成分間のパーミュテーションの問題を生ずることなく音源分離を可能とする。
【解決手段】周波数領域変換部が各マイクにおける時間領域での観測信号をそれぞれ周波数領域の観測信号スペクトルに変換し、位相差計算部が各マイクにおける観測信号スペクトルの位相差(マイク間位相差)を計算し、モデル推定部が前記観測信号スペクトルをスペクトルの分布を示すスペクトル確率モデルに、前記マイク間位相差を位相差の分布を示す位相差確率モデルに、それぞれ逐次当てはめ、各確率モデルを評価する所定の評価関数を用いて信号抽出に適した各確率モデルのモデルパラメタと各音源の存在確率を計算する。この各確率モデルのモデルパラメタと各音源の存在確率を用いて有効音源を抽出し、当該有効音源に対応するマスクを用いて前記観測信号スペクトルを前記有効音源ごとに分離する。 (もっと読む)


【課題】パワースペクトル微細構造も考慮するようにしてより高い雑音抑圧効果を発揮する雑音抑圧フィルタ算出方法を提供する。
【解決手段】最大事後確率パラメータ推定過程とウィーナーフィルタ計算過程と状態事後確率算出過程と重みつき和計算過程を含む。最大事後確率パラメータ推定過程は、観測短時間スペクトルを入力として、混合型包絡事前分布の包絡状態と、取り得る全てのパワースペクトル微細構造が記録されている微細構造符号帳の微細構造符号の各組み合わせについて、観測短時間スペクトルに最も合致する全極パラメータの推定値である全極パラメータ状態依存最大事後確率推定値を計算する。重みつき和計算過程は、状態依存ウィーナーフィルタと結合状態事後確率とを乗じた値を、包絡状態と微細構造符号の全ての組み合わせについて加算して雑音抑圧フィルタを計算する。 (もっと読む)


【課題】 雑音を正確に推定してパターン認識信号中の雑音を低減するシステムおよび方法を提供する。
【解決手段】 本方法およびシステムは、少なくともクリーン信号確率変数および雑音確率変数の関数として、マッピング確率変数を定義する。次いで、マッピング確率変数の値の分布の少なくとも1つのアスペクトを記述するモデルパラメータを判定する。モデルパラメータに基づいて、クリーン信号確率変数の推定値を判定する。本発明の多くの態様では、マッピング確率変数は信号対雑音比変数であり、本方法およびシステムは、モデルパラメータから信号対雑音比変数の値を推定する。 (もっと読む)


【課題】本発明は、ワンセグ放送の音声符号化方式であるHE−AAC方式における子音の音質劣化を改善する。
【解決手段】互いに異なる第1および第2の周波数帯域に分離され多重された音声データが入力され、その音声データに基づき音声信号を再生出力可能な音声信号処理装置であって、入力される前記音声データに対して前記第1の周波数帯域の音声信号をデコードする第1の音声デコーダと、前記第2の周波数帯域の音声信号をデコードする第2の音声デコーダとを有するデコード手段と、入力される前記音声データの音声モードを検出する音声モード検出部とを備え、前記音声モード検出部で検出された音声モードがデュアルモノモードの時は、前記第1の音声デコーダを動作させ、前記第2の音声デコーダの動作を停止する。 (もっと読む)


【課題】マスカ音を放射する領域内の者に違和感を感じさせることなくその領域内において高いマスキング効果を発生させる。
【解決手段】CPU22は、音信号Sa,Sb,Sc,Sd,Se,及びSfをフレームF(i=1〜15)に分割した後、フレームF内の配列を逆転させる処理を行い、この処理を施した音信号Sa,Sb,Sc,Sd,Se,及びSfの波形を整形する。その後、この波形を整形した音信号Sa,Sb,Sc,Sd,Se,及びSfのフレームFの配列をランダムに並べ替えてミキシングした信号をマスカ音信号Mとする処理を時間長T2毎に繰り返し、最新のマスカ音信号Mを領域Bに放音する。 (もっと読む)


【課題】サウンドマスキング装置において、マスキングが必要なエリアにおけるターゲット音とマスカ音の明瞭度を近づけ、マスカ音が耳触りになるのを防止する。
【手段】 不揮発性メモリ13は、ターゲット音の音源位置から衝立100を迂回してマスキングエリア221の受音点220に至る迂回経路Ch1のエコーダイヤグラムから得られたフィルタ係数列をフィルタ用パラメータとして記憶する。明瞭度調整フィルタ32は、マスカ音信号発生部31が出力するマスカ音にこのフィルタ係数列を畳み込み、D/A変換部11、位相調整部12を介してスピーカ40Lおよび40Rに供給する。スピーカ40Lおよび40Rから受音点220に到達するマスカ音の明瞭度は、迂回経路Ch1を経由して受音点220に到達するターゲット音の明瞭度に近いものとなる。 (もっと読む)


【課題】 マスカ音の放音先の領域内の者に違和感を与えることなく、その領域内において高いマスキング効果を得る。
【解決手段】CPU10は、ハードディスク11の音データベース21に記憶されている複数種類の音信号を取得してRAM23に格納し、それら複数種類の音信号の各々を所定時間長毎の複数個のフレームF(i=1,2…)に分割する。次に、フレームF(i=1,2…)に対してフレームF(i=1,2…)毎の平均音量のばらつきを抑えるノーマライズ処理を施す。その後、ノーマライズ処理を施したフレームF(i=1,2…)のうちの一部のフレームF内のサンプルデータを逆転させ、そのサンプルデータを逆転させたフレームFの配列を並べ替える。そして、このフレームFの配列を並べ替えた複数種類の音信号をミキシングしたものをマスカ音信号Mとして放音する。 (もっと読む)


【課題】雑音低減処理を効果的に実施する。
【解決手段】雑音源である機器駆動部の動作中の期間に取得された音声信号を、その期間の前及び/または後に取得された音声信号に基づいて生成された音声信号によって置き換えた音声信号を生成することにより雑音低減する。また雑音低減処理に使用する音声信号が取得される期間に駆動部を駆動させないようにする、または、雑音低減処理に使用する音声信号が取得されるまで記録動作を停止させない。 (もっと読む)


【課題】任意の人物の音声を識別し、識別した音声を改善する音声変更装置、音声変更方法、プログラム及び記録媒体を提供する。
【解決手段】複数の人物が撮影されたカットを含むビデオデータのうち、ユーザに指定された人物のみが撮影されたカットを検索する検索手段と、前記検索手段により検索されたカットから音声を認識する音声認識手段と、前記音声認識手段により認識された音声と同じ人物の音声を変更する音声変更手段と、を備えることを特徴とする。 (もっと読む)


【課題】聴覚情景分析の結果を用いて主要な音声ダイナミクス処理パラメータを制御することによって、ダイナミクス処理によって導入される可聴アーティファクトを劇的に低減させる方法を提供する。
【解決手段】聴覚イベントおよび/または前記聴覚イベント境界に関連する信号特性の変化量に少なくとも部分的に応答して、動的ゲイン変更が音声信号に適用される。音声信号の連続する時間ブロック間の特定ラウドネスの差異を比較することによって、音声信号が聴覚イベントに分割される。 (もっと読む)


211 - 220 / 1,255