説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

61 - 70 / 1,255


【課題】
臨場感のある音声の再生または記録を行う手段を提供する。
【解決手段】
一例として、撮像し、映像信号を出力する撮像部と、音声が入力され、音声信号を出力
する音声取得部と、該撮像部から出力された映像信号と該音声取得部から出力された音声
信号とを記録する記録部と、映像信号から特定被写体の位置を検出する物体検出部と、音
声信号から検出された特定被写体に対応する音声を抽出する音声抽出部と、物体検出部で
検出された特定被写体の位置によって、音声抽出部によって抽出された音声信号の調整を
行う音声信号処理部と、を有する。 (もっと読む)


【課題】デバイスコストを削減しつつ、外部環境の変化に対応して音声認識を精度良く実行すること。
【解決手段】オンラインテンプレート収集部140が、コントローラ200から取得するメタ情報と、発話区間の信号とを基にして、テンプレートメモリ142に記憶されたテンプレートを順次更新する。テンプレート選択部150は、入力信号と一致度の高いテンプレートをテンプレートメモリ142から検索し、雑音除去部160に出力する。雑音除去部160は、入力信号からテンプレートの信号を除去することで雑音成分を除去し、音声認識部170が、雑音成分の除去された信号に対して音声認識を実行する。 (もっと読む)


【課題】通話等の音声処理の開始を遅延させることなく、より迅速に適切なフィルタ係数を得ることができるようにする。
【解決手段】音響エコーキャンセラ装置11は、コンテンツを再生してスピーカ25からコンテンツの音声を出力する。音響エコーキャンセラ装置11は、この音声を利用して、マイクロホン26で収音される音声から、スピーカ25からマイクロホン26に到達するエコー成分を除去する処理に用いられるフィルタ係数を学習しておく。そして、音響エコーキャンセラ装置11は、テレビジョン電話の通話が指示されると、通話処理を開始する。このとき、音響エコーキャンセラ装置11は、予めコンテンツの音声を利用して更新されたフィルタ係数を用いて、ユーザにより発せられた音声から、スピーカ25からのエコー成分を除去する。本発明は、音声処理装置に適用することができる。 (もっと読む)


【課題】常に快適に音楽を聴きながら、周囲の音にも配慮することができるようにする。
【解決手段】マイク21は、周囲の音を集音し、集音した音に対応する信号を出力する。音楽検出部22は、マイク21から出力される信号に音楽が含まれているか否かを判定することで、周囲の音の中の音楽を検出する。加工部23は、音楽検出部22の検出結果に基づいて、マイク21から出力される信号を加工する。加工部25は、音楽検出部22の検出結果に基づいて、音楽信号を加工する。加算器24は、加工部23から出力された信号と、加工部25から出力された信号を加算してスピーカ26から出力し、その音がユーザの耳に聞こえる音となる。 (もっと読む)


【課題】使用者が音源の位置とその音源から出る音の情報を直観的に判断可能とする。
【解決手段】集音情報(音信号)を得るためのマイクロホン101を透過型ヘッドマウントディスプレイの前面に配設する。信号処理部104は、マイクロホン101の集音情報に基づき、表示データを生成する。表示部105は、表示データに基づいて、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示する。例えば、音源から出る音のレベル情報を、円の大きさで表示する。また、音源から出る音の周波数情報を、円に付される色で表示する。音源位置が視覚映像内にある場合、その音源位置あるいはその近傍に、音情報を表示する。一方、音源位置が表示面内から外れる場合、その音源位置に近い視覚映像の端部に、音情報を表示する。 (もっと読む)


【課題】音声(オーディオ信号)、映像(ビデオ信号)を含む動画を再生するコンテンツ再生装置において、処理を増やすことなく音声を聴きやすく処理することができるようにすることを目的とする。
【解決手段】映像の解像度、圧縮歪の程度などの情報を解析する映像解析部と、解析された映像の特徴に基づく処理内容で映像を処理する映像処理部をと、解析された映像の特徴に基づく処理内容で、ダイナミックレンジの調整、周波数成分の補完などの音声を処理する音声処理部と、を備える。 (もっと読む)


【課題】オーディオ信号に対して、再生信号の特性と視聴時の周囲の環境音の特性に応じた適切な音質制御処理を施すことを可能とした音質制御装置、音質制御方法及び音質制御用プログラムを提供すること。
【解決手段】実施の形態によれば、音質制御装置は、補正ゲイン算出手段とスコア算出手段と音質制御手段と制御手段とを備える。補正ゲイン算出手段は、入力オーディオ信号の再生音が環境音にマスクされないように周波数帯域毎の補正ゲインを算出する。スコア算出手段は、入力オーディオ信号から音種別毎の確度を示すスコアを算出する。音質制御手段は、外部から供給される音質制御信号に基づいて入力オーディオ信号に音質制御処理を施す。制御手段は、補正ゲインとスコアとに基づいて音質制御信号を生成する。 (もっと読む)


【課題】定常雑音を含む信号に対する処理において、周波数軸上で処理する技術と比較して処理時間を短縮することを課題とする。
【解決手段】音声処理装置100のゲイン算出部140は、同期減算結果のパワーと、音声入力部110Lにより入力された信号のパワーとを用いて、信号の振幅を抑圧するゲインを算出する。例えば、ゲイン算出部140は、パワー計算部130Lにより計算された信号(inL)のパワー(Power2)から、パワー計算部130Rにより計算された同期減算結果(tmp1)のパワー(Power1)を減算する。そして、ゲイン算出部140は、減算結果(Power21)を信号(inL)のパワー(Power2)で除算した値の平方根を計算することによりゲイン(gain)を算出する。 (もっと読む)


【課題】 室内インパルス応答の測定中に突発的なノイズが混入した場合でも、精度の高いインパルス応答を得る。
【解決手段】 測定用信号を複数周期連結してスピーカから発音し、マイクで録音した収音信号中の各周期信号から特徴量を算出する。各周期の特徴量について最小値を基準に比較し、閾値の範囲内に収まらなかった周期は突発ノイズが混入したとして、加算平均の対象から除く。突発ノイズ判定のための閾値は、収音信号と暗騒音のレベル差に応じて決定する。 (もっと読む)


【課題】所望の音声出力強度の周波数特性を有するオーディオ再生環境を容易に構築することができるオーディオ再生システムを提供する
【解決手段】オーディオデータデコード部1042は、記憶部103に格納されているホワイトノイズデータを復号化する。イコライズ部1043は、記憶部103に格納されているイコライズパターンデータを用いて、復号データの周波数特性の調整を行い、データ送信部1051よりオーディオ再生装置20に送信する。オーディオ再生装置20は受信したデータを再生しスピーカ207より出力する。携帯端末10のマイク109は出力された音声信号を拾音して、音声処理部108にて音声信号の周波数解析を行い、得られた周波数分布とイコライズ処理で用いたイコライズパターンデータを照らし合わせて、イコライズパターンデータを修正する。 (もっと読む)


61 - 70 / 1,255