説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

1,011 - 1,020 / 1,255


【課題】 少ないマイクロホン数と音源数とから正確な音源位置を推定できる音源位置推定方法を提供する。
【解決手段】 収音手段対ごとに観測される受音信号間の遅延時間差の観測値と、事前に既知であり、事前設定された1つ以上の受音位置間距離とから、繰り返し演算を用いて音源位置と受音位置を推定する方法であり、まず、推定音源位置と推定受音位置の初期値を設定する。次に、事前設定された受音位置間距離の設定値と推定受音位置から計算される受音位置間距離の推定値間の2乗誤差が減少し、かつ前記受音信号間の遅延時間差の観測値と推定音源位置と推定受音位置から計算される受音信号間遅延時間差の推定値間の2乗誤差が減少するように、音源位置と受音位置の推定値を繰り返し更新する。更新量と事前に設定した収束閾値を比較し、更新量が閾値以下となった場合に収束と判断し、繰り返し演算を停止する。 (もっと読む)


【課題】スペクトル値のフロアリングを雑音の状況に応じて適切に行うことができる音声分析方法および音声分析装置を提供する。
【解決手段】 音声信号のスペクトル(帯域スペクトルまたは対数帯域スペクトル)が求められ、その所定時間に渡るヒストグラムがヒストグラム作成部31によって作成される。適合分布演算部32は、そのヒストグラムに適合する2成分混合ガウス分布を求める。経験則により、低パワー域の分布が雑音成分の分布と推定され、高パワー域の分布が信号成分の分布と推定される。フロアリング値演算部33は、信号成分または雑音成分の平均値を用いてフロアリング値を定める。フロアリング実行部34は、そのフロアリング値によりスペクトルをフロアリングする。フロアリング値は、信号成分または雑音成分の平均値および標準偏差を用いて定められてもよい。 (もっと読む)


ビデオを、画像を部分的に入れ替えることによって個人化するプロセス及び装置を開示する。個人化処理では、人物の画像の一部分の、または全ての入れ替えを行なう。個人化処理では更に、オブジェクトの挿入または入れ替えを行ない、そして背景及び/又はサウンドトラックの全ての、または一部分の入れ替えを行なう。ビデオ作成プロセスを使用して、個人化処理を施す状態になっているビデオのライブラリを作成することができる。 (もっと読む)


【課題】複数のマイクロフォンからの信号を、所定期間毎に適宜ミニマム(最小化)選択して再合成することで、風雑音を強力に最小化した雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置を得る。
【解決手段】複数の音声信号から複数の所定帯域を抽出した抽出信号の加算平均を演算して、複数の帯域抽出信号の所定期間における信号レベルを検出する複数の第1のレベル検出手段66,68と、加算平均を演算した信号の所定期間における信号レベルを検出する第2のレベル検出手段67と、複数の第1のレベル検出手段66、68及び第2のレベル検出手段67から検出されるレベル値で最もレベルの小さいレベル値を有する信号を所定期間毎に選択手段で選択した信号を帯域制限し、この帯域制限した信号と複数の抽出帯域以外の帯域信号とを夫々の音声チャンネル毎に帯域合成して各音声チャンネルの出力信号とする。 (もっと読む)


【課題】 量子化雑音などの劣化音を含む入力音信号に対して、主観的に劣化音を感じにくく加工する音信号加工方法および音信号加工装置を提供する。
【解決手段】 入力音信号としての復号音声の聴覚重み付け後のスペクトルを変形強度制御部で算出、その振幅の大きさ、スペクトルの連続性に基き、変形強度を算出する。信号変形部で、復号音声のスペクトルを求め、変形強度に基き振幅平滑化、位相擾乱付与を行い、信号領域に戻して変形復号音声とする。信号評価部で、復号音声を分析し背景雑音らしさを求め、これを加算制御値とする。重み付き加算部で、加算制御値が背景雑音らしいことを示す場合には、復号音声への重みを減らし、変形復号音声への重みを増やして加算し、出力音声とする。 (もっと読む)


【課題】音声信号に子音が含まれている時でも、非定常雑音が存在する音声区間を判別する。
【解決手段】入力信号の線形予測残差信号をフレームごとに求め(10、12、14)、各フレームの予測残差信号を複数のサブフレームに分割し、(16)このサブフレームごとの予測残差信号の振幅が第1のしきい値以上となる数k〜kをそれぞれフレームごとに計数し(28−1〜28−s)、同一フレーム内のサブフレームごとの計数値k〜kの最大値を求め(30)、その最大値が第2のしきい値以上か否かにより、そのフレームに非定常雑音が存在するか否かを判別する(32)。 (もっと読む)


【課題】 音声入力部が移動可能な場合でも誤認識を抑えられる音声認識装置を得る。
【解決手段】 音声を視聴空間に出力するスピーカと、視聴空間の音声を取り入れ、取り入れた入力音声の入力音声信号を出力するマイクと、上記マイクの移動状態を監視する加速度センサと、上記スピーカから出力された音声の空間エコーを上記入力音声信号からキャンセルし、当該空間エコーをキャンセルした入力音声信号の音声認識をする音声処理を、上記加速度センサによって監視されたマイクの移動状態に応じて実行する音声処理部とを備える。 (もっと読む)


【課題】車両の各装置のさまざまな作動状態において、音声認識率を向上するように、効果的に雑音を抑圧する。
【解決手段】車両内の話者の音声を認識するために、音声認識装置に入力される音声信号の雑音を抑圧する雑音抑圧装置であって、車両の内部の音響を収集するために該車両に備えられたマイクロフォン1と、前記車両の各装置の作動状態である車両状態を検出する車両状態検出部3と、マイクロフォン1で収集された音響信号を、収集されたときの車両状態に対応づけて記憶する記憶部11と、前記車両状態ごとに記憶された音響信号を所定の期間で平均化した情報を、車両状態に対応づけて記憶する車両音−車両状態対比記憶部13と、マイクロフォン1で収集された音響信号から、音響信号が収集されたときの車両状態に対応した前記平均化された情報を差し引き抑圧する車両音抑圧部14と、を備える。 (もっと読む)


【課題】 少量のデータのみを用い、残響時間が長い残響環境においても高い精度で残響除去を行う。
【解決手段】 後部残響パワー推定部10cが、音響信号のパワー(利得)の最小値又は擬似最小値を、当該音響信号の後部残響音成分のパワー推定値として抽出し、後部残響除去部10dが、後部残響音成分のパワー推定値を用い、音響信号の直接音成分と初期反射音成分との推定値を算出する。そして、残響除去フィルタ計算部10gが、直接音成分と初期反射音成分との推定値を参照信号として用い、推定逆フィルタを算出し、残響除去フィルタ乗算部10hが、推定逆フィルタに音響信号のパワーを乗じ、その演算結果を出力する。
(もっと読む)


【課題】従来の音声処理装置においては、音声の話者である評価対象者の話者特性に応じた音声処理(歌声評定など)が行えず、その結果、精度の高い音声処理ができない、という課題があった。
【解決手段】格納している第一サンプリング周波数で、受け付けた音声をサンプリングし、第一音声データを取得するサンプリング部と、前記音声受付部が受け付けた音声の話者である評価対象者のフォルマント周波数である評価対象者フォルマント周波数を格納しており、第二サンプリング周波数「前記第一サンプリング周波数/(教師データのフォルマント周波数/評価対象者フォルマント周波数)」で、前記受け付けた音声に対して、サンプリング処理を行い、第二音声データを得る声道長正規化処理部と、前記第二音声データを処理する音声処理部を具備する音声処理装置により、話者特性に応じた音声処理ができる。 (もっと読む)


1,011 - 1,020 / 1,255