説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

151 - 160 / 1,255


【課題】より効果的に、ユーザに対して環境音を視覚的に提示する。
【解決手段】解析部24は、コンテンツを構成する音声の音声データにブラインド音源分離処理を行い、各音源の音声の音声データを抽出するとともに、各音源の音声の音声データに基づいて、音源の方向を示す方向データを生成する。また、解析部24は各音源の音声が、人の発話ではない環境音であるか否かを判別し、環境音をテキスト化する。視覚情報生成部25は、テキスト化された環境音に基づいて、環境音を視覚的に提示するエフェクト画像を生成する。画像合成部26は、コンテンツを構成するコンテンツ画像上の方向データにより定まる位置に、エフェクト画像をオーバーレイする。本発明は、ビデオ再生機器に適用することができる。 (もっと読む)


【課題】非定常雑音を含む入力音信号でも、入力信号のパワーに対する閾値を設定したり、複雑な演算処理を行ったりしなくても、正確に音信号区間を抽出する。
【解決手段】音によって発生する振動のアナログ音信号が入力すると、サンプリングして量子化することでデジタル音信号に変換し(ステップ101)、ステップ101で取得したデジタル音信号に基づき振幅値を時系列でグラフ化した2次元画像を作成して2値画像データとし(ステップ102)、ステップ102で作成した2値画像データに、予め定められた数の周辺画素の値に0が1つ以上あると注目画素の値を1から0に変換する収縮処理を施して、当該2値画像データに存在している雑音区間を削除して塊化された領域となる音信号区間を抽出し(ステップ103)、ステップ103で抽出した音信号区間を特定するために、2値画像データにおける塊化された領域の起点と終点とを時系列で検出する(ステップ106)。 (もっと読む)


【課題】電子透かし情報が埋め込まれた音声信号を音として再生する際に、電子透かし情報の埋め込みに起因した雑音を低減し、高品位な音の再生を可能にする。
【解決手段】電子透かし情報を構成する各シンボルに応じた擬似雑音信号が埋め込まれた音声信号を解析してその電子透かし情報を推定し、埋め込まれていると推定されるシンボル列に対応する擬似雑音信号をスペクトラム減算により当該音声信号から減算した後に音として再生する。 (もっと読む)


【課題】2チャネル分の音声信号に対し、任意に指定された方向の音像のみを分離・抑圧することが可能な音声信号処理装置を提供する。
【解決手段】音声信号処理装置(音声信号処理部20で例示)は、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部(信号分離抽出部23で例示)と、信号分離部で分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を減少させる相関信号減少部(相関信号処理部24及びゲイン調整部25bで例示)とを備え、複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを抑圧する。 (もっと読む)


【課題】2チャネル分の音声信号に対し、任意に指定された方向の音像のみを分離・増圧することが可能な音声信号処理装置を提供する。
【解決手段】音声信号処理装置(音声信号処理部20で例示)は、入力音声信号を2つのチャネル間の相関信号と無相関信号とに分離する信号分離部(信号分離抽出部23で例示)と、信号分離部で分離された信号に対し、所定の空間的範囲に合成される音像に関わる相関信号中の成分を増加させる相関信号増加部(相関信号処理部24及びゲイン調整部25bで例示)とを備え、複数のスピーカによって合成される音像群のうち所定の空間的範囲に合成される音像のみを増圧する。 (もっと読む)


【課題】より簡単かつ確実にノイズを検出できるようにする。
【解決手段】全波整流回路51は、入力された入力信号を絶対値化し、代表値決定部52は、絶対値化された入力信号の連続するいくつかのサンプルからなる区間をブロックとして、ブロック内のサンプルのサンプル値の最大値を、そのブロックの代表値とする。平均値算出部53は、複数のブロックからなる区間をフレームとし、フレーム内のブロックの代表値の最大値と平均値を求める。判定部54は、フレームについて求めた、ブロックの代表値の最大値をブロックの代表値の平均値で除算した値が、所定の閾値以上である場合、そのフレームにクリックノイズが含まれているとする。本発明は、信号処理装置に適用することができる。 (もっと読む)


【課題】回動可能な頭部に備えられた音声入力部に、360度全方向から入力される音声から、ノイズ音が出力される方向を除外して、発話者がいる方向を推定するロボットを提供する。
【解決手段】ロボットRは、回動可能な頭部R1にて所定の角度で離間して配設される3以上の音声入力部MCと、それら音声入力部が出力する音声データ(音響信号データ)から全方向音圧成分データを生成する音声データ処理部22と、頭部R1の回動角度を測定する回動角測定部(自律移動制御部50)と、音源として推定しない方向の範囲(除外角度範囲)が記憶された記憶部30と、音源方向を推定する音源方向推定部23とを備え、音源方向推定部23が、測定された回動角度を用いて、全方向音圧成分データから除外角度範囲内にあるデータを除去する。 (もっと読む)


【課題】精度良く残響抑圧を行える残響抑圧装置及び残響抑圧方法を提供することを課題としている。
【解決手段】音声信号を取得する音声取得部111と、取得された音声信号から残響データを演算する残響データ演算部112と、演算された残響データに基づき残響特性を推定する残響特性推定部と、推定された残響特性に基づき残響抑圧を行うフィルタのフィルタ長を推定するフィルタ長推定部116と、推定されたフィルタ長に基づき残響抑圧を行う残響抑圧部とを備える。 (もっと読む)


【課題】ノイズを低減することができる撮影装置を提供する。
【解決手段】撮影装置100が、判断部251により撮影部が動作していると判断されたときにマイク230から出力された電気信号SS1と、撮影部が動作していないと判断されたときにマイク230から出力された電気信号SS1との比が閾値以上であったとき、撮影部が動作していると判断されたときにマイク230から出力された電気信号SS1をノイズ信号として記憶する記憶部160と、記憶部160に記憶されたノイズ信号を用いて、マイク230から出力された電気信号SS1のノイズを低減させるノイズ低減処理部250とを含む。 (もっと読む)


【課題】音響信号の雑音成分を高精度に抑圧する。
【解決手段】行列分解部42は、並列に収音された音響信号s1および音響信号s2の各々について、当該音響信号siの周波数毎の成分値xi[fm,tn]の時系列を要素とする観測行列Viの非負行列因子分解で、複数の基底Ci[1]〜Ci[K]を含む基底行列Wiと複数の重み系列Ei[1]〜Ei[K]を含む係数行列Hiとを生成する。雑音特定部44は、音響信号s1の基底行列W1の複数の基底C1[1]〜C1[K]のうち音響信号s2の基底行列W2の基底C2[k]との相関が高い基底C1[k]を、音響信号s1の雑音成分(風雑音)に対応する雑音基底C1_noiseとして特定する。係数列生成部46は、基底行列W1のうち雑音基底C1_noise以外の各基底C1[k]と係数行列H1のうち当該各基底C1[k]に対応する重み系列E1[k]とに応じて、音響信号s1の雑音成分が抑圧されるように周波数毎の係数値g1[fm,tn]が設定された処理係数列G1を生成する。 (もっと読む)


151 - 160 / 1,255