説明

国際特許分類[G10L21/02]の内容

国際特許分類[G10L21/02]に分類される特許

81 - 90 / 1,255


【課題】音響信号の目標成分以外の成分を維持しながら目標成分を高精度に抑圧する。
【解決手段】係数列生成部33は、音響信号xの目標成分を抑圧するための処理係数列G(t)を単位区間Tu毎に順次に生成する要素であり、基礎係数列生成部42と係数列加工部44Aとを含んで構成される。基礎係数列生成部42は、特定帯域B0内の各周波数fの係数値h(f,t)が音響信号xを抑圧する抑圧値γ0に設定されるとともに特定帯域B0外の各周波数fの係数値h(f,t)が音響信号xを維持する通過値γ1に設定された基礎係数列H(t)を生成する。係数列加工部44は、基礎係数列H(t)において特定帯域B0内の各周波数fに対応する複数の係数値h(f,t)のうち目標成分以外の各周波数fの係数値h(f,t)を通過値γ1に変更することで単位区間Tu毎に処理係数列G(t)を生成する。 (もっと読む)


【課題】スピーチを増強する方法およびスピーチエンハンサを提供すること。
【解決手段】スピーチを増強する方法であって、オーディオ信号の中央チャンネルを抽出して、中央チャンネルのスペクトルを平坦化して、平坦化されたスピーチ・チャンネルにオーディオ信号を混合することにより、オーディオ信号における任意のスピーチを増強することを含む。更に、スピーチエンハンサが開示され、これはオーディオ信号の中央チャンネルを抽出するための抽出器と、前記中央チャンネルのスペクトルを平坦化するためのスペクトル平坦化器と、前記中央チャンネルにおけるスピーチ検出における信頼度を生成するスピーチ信頼度生成器と、前記平坦化されたスピーチ・チャンネルを原オーディオ信号に、検出されたスピーチの信頼度に比例して混合することにより、オーディオ信号における任意のスピーチを増強するミキサとを備える。 (もっと読む)


【課題】出力されるガイダンスの内容や声色を車内の状況に合わせて変化させることにより、車内の雰囲気に水を差さず、重要なガイダンスを聞き漏らすことの無い車載用ガイダンス装置を得ることを目的とする。
【解決手段】車載機器の出力音の設定音量に応じて、音声ガイダンスの出力条件を変化させることを特徴とする。 (もっと読む)


【課題】所定の帯域にノイズを含むオーディオ信号を精度良く符号化することができるようにする。
【解決手段】ノイズ検出部51は、オーディオ信号に基づいてPDM信号特有のノイズを検出する。ゲイン調整部52は、PDM信号特有のノイズが検出された場合、オーディオ信号の可聴帯域外の高域成分が減衰するように、オーディオ信号のゲイン調整を行う。ビット配分計算部13は、ゲイン調整後のオーディオ信号の正規化情報idsfに基づいて、正規化周波数スペクトルnspecに配分するビット量を計算する。量子化部14は、そのビット量を表す量子化情報idwlに基づいて、正規化周波数スペクトルnspecを量子化する。本発明は、例えば、オーディオ符号化装置に適用することができる。 (もっと読む)


【課題】騒音の影響による音声認識の精度低下を低コストで防止した受音装置を提供する。
【解決手段】受音装置は、音声取得用マイクロフォン12と、騒音取得用マイクロフォン31と、を備える。音声取得用マイクロフォン12は、作業者の声を含む第1音情報を取得する。騒音取得用マイクロフォン31は、作業者とともに走行するピッキングカートに取り付けられ、作業者の声の音声認識を行うときに不要となる騒音を含む第2音情報を取得する。 (もっと読む)


【課題】音響信号の特定の帯域成分を選択的に信号レベルの調整に反映させる。
【解決手段】信号調整部12は、音響信号SINの信号レベルを調整値Gに応じて調整して音響信号SOUTを生成する。帯域分割部22は、音響信号SINをN個の帯域成分B[1]〜B[N]に分割する。N個の調整値設定部30[1]〜30[N]は帯域成分B[1]〜B[N]に対応する。各調整値設定部30[n]は、帯域成分B[n]の信号レベルL[n]が増加するほど音響信号SINに対する音響信号SOUTの信号レベルが抑制されるように調整値C[n]を可変に設定する。調整値選択部26は、N個の調整値設定部30[1]〜30[N]が設定したN個の調整値C[1]〜C[N]の何れかを信号調整部12に適用される調整値Gとして選択する。 (もっと読む)


【課題】浴室で音声を出力する際に、残響による影響を低減させる。
【解決手段】試験音出力部110は音声データを試験用音声としてスピーカ300から出力する。ここで出力される音声データは、試験用の音声データであるのが好ましい。集音部120は、試験用音声を集音して集音データを生成する。補正方法算出部130は、音声データと集音データを比較することにより、残響を減少させるための補正方法を算出する。音声出力部210は、音声データ補正機能を有している。具体的には、音声出力部210は、補正方法算出部130が算出した補正方法を用いて、出力すべき音声データを補正する。そして音声出力部210は、補正後の音声データをスピーカ300から出力する。 (もっと読む)


【課題】騒音環境下においても、使用者ごとに明瞭な再生音声を提供し、周囲への迷惑を低減する。
【解決手段】携帯電話装置等の通信装置において用いられ、使用者の発話音声及び相手からの受話音声の処理を行う音声処理装置であって、使用者の発話音声の音量を測定する発話音量測定部18と、発話音声の音量が所定条件よりも大きい場合、例えば発話音声の音量が所定の閾値よりも大きい場合に、相手からの受話音声の音声強調を行う音声強調制御部の機能を有する受話音量決定部19と、受話音声を出力する音声出力部13と、を備える。音声強調を行う場合、使用者の聞こえやすい周波数、例えば使用者の聴力の周波数特性に応じて、受話音声において使用者の聴力レベルの高い周波数帯域を優先的に強調する。 (もっと読む)


【課題】自己ノイズが発生する環境において高い精度で音声認識を行なう音声認識装置及び音声認識方法を提供する。
【解決手段】本発明による音声認識装置は、音源分離・音声強調部(100)と、自己ノイズ推定部(200)と、該音源分離・音声強調部及び該自己ノイズ推定部の出力を使用して、ミッシングフィーチャーマスクを生成する、ミッシングフィーチャーマスク生成部(300)と、該音源分離・音声強調部の出力を使用して、音源ごとの音の特徴を抽出する音特徴抽出部(401)と、該音特徴抽出部の出力及び該ミッシングフィーチャーマスクを使用して音声認識を行なう音声認識部(501)と、を備えている。 (もっと読む)


【課題】レベルに基づいたしきい値パラメータを必要とせず、ノイズ環境の変化に対して高いロバスト性を有する、ノイズパワー推定装置を提供する。
【解決手段】本発明による周波数スペクトルの成分ごとのノイズパワーを推定するノイズパワー推定装置であって、横軸がパワーの大きさのインデクスであり縦軸が累積頻度である、指数移動平均の重みをつけた累積ヒストグラムを、時系列入力信号の周波数スペクトルの成分ごとに生成する累積ヒストグラム生成部と、該時系列入力信号の周波数スペクトルの成分ごとに、該累積ヒストグラムからノイズパワーの推定値を求めるノイズパワー推定部と、を備えている。 (もっと読む)


81 - 90 / 1,255