説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

171 - 180 / 1,255


【課題】混合音から楽器音を分離・抽出する際の精度を向上させた楽器音分離装置、及びプログラムの提供。
【解決手段】音源分離処理では、スペクトル振幅値tusp(twi,fi)に対して、1つの特定音から導出されたスペクトル振幅値ntsp(twi,fi)の相関値が最大となる、特定音範囲に対応する対応範囲を特定する。そして、特定された対応範囲において、振幅比率krを導出して、その導出された振幅比率krを、スペクトル振幅値ntsp(twi,fi)に乗算することで、特定音に対応する楽音推移tuwfでの楽器音の複素スペクトルを表す分離スペクトルを導出する(S310)。その分離スペクトルを逆フーリエ変換して、区間推移を導出し(S320)、その導出された区間推移にて、楽器音推移trwfにおける対応範囲を置換することで、楽器音推移trwfを新たに更新する(S330)。 (もっと読む)


【課題】エコーキャンセリングしたい音源が、電気的に接続していなくても、当該音源からの音に対してエコーキャンセル処理を確実に施す。
【解決手段】収音装置10のマイクロホンMCからの収音信号Ssはエコーキャンセル部12に与えられるともに音声認識サーバ20へ与えられる。音声認識サーバ20は収音信号Ssに基づいてコンテンツ情報Cimとタイミング情報Ctpとを検出する。コンテンツサーバ30はコンテンツ情報Cimに基づいてコンテンツ音声ファイルCmを読み出す。収音装置10の音声再生部11は、コンテンツ音声ファイルCmをデコードして、タイミング情報Ctpに基づくタイミングで再生し、再生音信号Smをエコーキャンセル部12へ出力する。エコーキャンセル部12は、再生音信号Smに基づいて、収音信号Ssのエコーキャンセル処理を行う。 (もっと読む)


【課題】歌声の周波数構造に拘わらず、歌声と演奏音とを含む混合音から、歌声を抽出可能な歌声分離装置の提供
【解決手段】歌声分離処理では、スペクトル振幅値tusp(twi,fi)に対して、1つの歌声素片siから導出されたスペクトル振幅値vssp(twi,fi)の相関値が最大となる特定範囲を特定する。そして、特定範囲に対して振幅比率krを導出して(S240)、その導出された振幅比率krを、スペクトル振幅値tusp(twi,fi)に乗算することで、スペクトル振幅値vscpsp(twi,fi)を導出する(S250)。そのスペクトル振幅値vscpsp(twi,fi)を逆フーリエ変換して区間推移vscpwfを導出し(S270)、その導出された区間推移vscpwfにて、歌声推移vowfにおける特定範囲を置換することで、歌声推移vowfを更新する(S280)。 (もっと読む)


【課題】人間のスピーチからの音響ノイズの除去のための方法およびシステムを提供し、これにおいては、ノイズのタイプ、大きさあるいは方位に無関係にノイズを除去してその信号を復元する。
【解決手段】 本システムは、プロセッサに結合したマイクロホンおよびセンサを備える。マイクロホンは、音響信号を受け、そしてVADは、スピーチ(有声および無声の両方)が生起しているとき二進1であり、そしてスピーチの不在時に二進0の信号を供給する。プロセッサは、デノイズ処理アルゴリズムを備え、これは、伝達関数を発生する。これら伝達関数は、指定された時間の間受けた音響信号に発声情報が存在しないとの判定に応答して発生する伝達関数を含む。また、それら伝達関数は、指定された時間の間その音響信号に発声情報が存在するとの判定に応答して発生する伝達関数を含む。少なくとも1つのデノイズ処理した音響データ・ストリームは、それら伝達関数を使用して発生する。 (もっと読む)


【課題】環境の変化に適応して、雑音及び残響の両方を自動的に抑圧する。
【解決手段】周波数領域に変換された入力信号を用いて、各周波数での分離フィルタ行列を作成するフィルタ作成部と、推定雑音を算出する雑音推定部と、分離フィルタ行列の逆行列の各要素を時間領域に変換して推定空間伝達特性として取得し、推定空間伝達特性から音声の直接音声及び初期反射に相当する区間を切出し、当該切出した区間を周波数領域に変換して各周波数での直接音声及び初期反射フィルタ行列を作成し、推定直接音声及び初期反射音声を算出する直接音声・初期反射音声推定部と、与えられる空間の残響時間と、直接音声・初期反射音声推定部により切出した区間のパワー量と、から、各周波数での後期残響特性のフィルタ係数を算出し、擬似後期残響を算出する後期残響生成部と、を備え、混合観測信号中の雑音及び後期残響を抑圧する。 (もっと読む)


【課題】レンズデバイスの経年変化や個体間のばらつきを考慮してノイズの低減処理を実行することで、ノイズの低減効果を向上させることができるようにする。
【解決手段】 光学ブロックは、ズームレンズとズーム駆動機構とを少なくとも含み、被写体を撮像して被写体の画像データを出力する。ノイズテーブル141には、開始位置と終了位置との組み合わせを変化させた複数のズームパターンが予め定義されており、ズームパターン毎にノイズが実測され、実測されたノイズのデータをノイズパターンとして保持する。キャリブレーション処理部124は、更新対象のノイズパターンを選択し、更新対象のノイズパターンに対応するズームパターンに従ってズームレンズを駆動させ、そのときに発したノイズを実測して、実測されたノイズのデータを用いてキャリブレーション処理を実行する。本発明は、デジタルビデオカメラに適用することができる。 (もっと読む)


【課題】音声信号に混合されている複数の音声の音量を補正した音声信号を容易に出力する音声処理装置および音声処理方法を提供する。
【解決手段】互いに離間して配置された複数の無指向性マイクロフォンによってそれぞれ取得された音声信号のうち、任意の周波数帯域成分を出力する音声信号出力部110と、音声信号の周波数帯域成分間の位相差に基づいて音声の到来方向を判別する到来方向判別部120と、音声の到来方向に応じて音声信号に対する音量の補正量を導出する音声補正量導出部130と、導出した補正量を用いて音声信号の音量を補正する音量補正実行部140とを備える。 (もっと読む)


【課題】気導マイクロホン以外のセンサから受信した補助センサ信号を利用して、クリーンな音声値を推定する方法およびシステムを提供すること。
【解決手段】クリーンな音声値の推定では、補助センサ信号のみ、または補助センサ信号を気導マイクロホン信号とともに使用する。クリーンな音声値は、気導マイクロホンから収集された雑音のあるトレーニング用データによってトレーニングされたモデルを使わずに推定される。一実施形態では、フィルタを形成するために補助センサ信号から形成されたベクトルに補正ベクトルが加えられ、このフィルタは、気導マイクロホン信号に適用されて、クリーンな音声推定値を作成する。他の実施形態では、音声信号のピッチが、補助センサ信号から判定され、気導マイクロホン信号を分解するのに用いられる。分解された信号は次いで、クリーン信号推定値を決定するのに用いられる。 (もっと読む)


【課題】特徴量に含まれる残留エコー成分を抑制する。
【解決手段】音声判別装置100は、第1音響信号の周波数スペクトルを解析する第1音響信号解析部103と、前記第1音響信号のエコー成分を第2音響信号から抑圧した第3音響信号から、前記第1音響信号の周波数スペクトルを除外して、前記第3音響信号の周波数スペクトルの特徴量を抽出する特徴抽出部101と、を備える。 (もっと読む)


【課題】骨伝導を利用したマイクロホン装置において、利用者の体内で発生する突発性雑音を除去する。
【解決手段】マイクロホン装置10を、骨伝導マイクロホン1と、突発音抽出部4と、突発音除去部5とを備える構成とし、各部の機能を次のようにする。突発音抽出部4は、骨伝導マイクロホン1で検出された音声信号の包絡線を算出し、該包絡線に基づいて音声信号に含まれる突発雑音の信号成分に対応する信号を抽出する。そして、突発音除去部5は、突発音抽出部4で抽出された突発雑音の信号成分に対応する信号に基づいて、音声信号から突発雑音の信号成分を除去する。 (もっと読む)


171 - 180 / 1,255