説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

61 - 70 / 242


【課題】複数音源が同時に存在している場合にも頑健な信号区間検出を行う。
【解決手段】この発明の複数信号区間推定装置は、周波数領域変換部と、音声存在確率推定部と、到来方向推定部と、到来方向確率計算部と、乗算部とを具備する。音声存在確率推定部が各フレームにおける音声存在確率を計算する。到来方向推定部と到来方向確率計算部とが、各フレームの全ての周波数における音声到来方向確率を推定する。そして、乗算部が音声存在確率と音声到来方向確率を乗算した値を、全ての音源について、発音確率として出力する。これにより各フレームにおいて複数の音源の存在を許せるようになるため、欠損の少ない区間検出が可能になる。 (もっと読む)


【課題】非定常雑音に対しても音声/非音声の判定精度を向上する音声判定装置を提供する。
【解決手段】フレームごとに音響信号を周波数分析してスペクトルを算出するスペクトル算出部103と、雑音スペクトルを推定する雑音推定部104と、雑音信号のエネルギーに対する音響信号のエネルギーの相対的な大きさを表すエネルギー特徴量を算出するSNR算出部105と、正規化スペクトルエントロピーを算出するエントロピー算出部106と、複数フレームに対して算出されたエネルギー特徴量および正規化スペクトルエントロピーに基づいて特徴ベクトルを作成する特徴ベクトル作成部107と、所定の識別モデルに基づいて特徴ベクトルに対応するフレームの音声尤度を算出する尤度算出部109と、音声尤度が閾値より大きい場合にフレームが音声フレームであると判定する判定部110とを備えた。 (もっと読む)


【課題】映像コンテンツを視聴中に音声データを切替えた場合の利便性を向上させる。
【解決手段】切替地点の再生位置に音声データがないと、再生位置から最も近い過去にある有音データ区間長及び再生位置から未来にある全無音データ区間の総長を計算し、これらを比較する。無音データ区間の方が長いときに限って、再生位置から最初の有音データまでの無音データ区間長を計算して有音データ区間長とを比較する。無音データ区間の方が長いと、有音データを再生位置の後に移動する。移動後、有音データ区間の方が長いと、有音データを再生位置の後に移動する。移動有音データ再生終了位置が次の有音データ再生開始位置と重なっていると、次の有音データを移動させたデータの再生終了位置の後ろに移動する。移動有音データ再生終了位置が次の有音データ再生開始位置より未来にあると、指定位置から音声データを再生する。 (もっと読む)


【課題】 VAD閾値を自動的に判定して信号の検出精度を高める。
【解決手段】 算出手段は、信号の強度を示す強度信号を算出する。フィルタ手段は、前記強度信号をフィルタリングする。追跡手段は、前記強度信号のノイズレベルを追跡する。判別手段は、フィルタリングされた強度信号と前記追跡手段より出力されたノイズレベルとを用いて、前記信号の判別を行う。 (もっと読む)


【課題】2者間の対話の音声データを適切に処理する。
【解決手段】2者間の対話の音声データを処理するシステムであって、2者間の対話における音声データから第1話者の発話割合の推移を算出する第1推移算出部と、2者間の対話における音声データから第2話者の発話割合の推移を算出する第2推移算出部と、第1話者の発話割合と第2話者の発話割合との差分の推移を表す差分データ列を算出する差分算出部と、差分データ列を平滑化した平滑差分データ列を生成する平滑化部と、平滑差分データ列を用いて表わされた、第1話者および第2話者の発話割合の推移を提示する提示部とを備えるシステムを提供する。 (もっと読む)


【課題】低S/N環境下における高精度な発話区間検出法を提供すること。
【解決手段】音声信号から、長時間スペクトル変動成分及び調波構造を特徴量として抽出し、長時間スペクトル変動成分特徴量、又は、長時間スペクトル変動成分抽出及び調波構造特徴量抽出を用いて、前記音声信号に含まれる音声/非音声の特徴量の差を増大させ、発話区間を検出する。音声信号の発話の平均音素長を超える長さの長時間スペクトル変動成分を用いることにより、従来法と比較して発話区間検出の正解率及び正解精度が向上する。本発明の発話区間検出システム及び方法により、発話区間を高精度に検出しうる音声処理、音声認識、音声出力等のシステム及び方法を提供できる。 (もっと読む)


【課題】音声よりも大きな騒音下においても、適切に音声を検出することを課題とする。
【解決手段】音響信号の入力を受け付けると、入力された当該音響信号と所定の時間間隔でずらした当該音響信号との相関の度合いを示す自己相関値を、複数の時間間隔各々に関して算出し、算出した自己相関値各々が、複数の時間間隔において極大値をとる場合に、当該極大値をとる場合の時間間隔でずらした各々の中から、全てもしくはいずれか複数の時間間隔でずらした音響信号各々を、音響信号の基本周期の候補である基本周期候補各々として選択し、選択した複数の基本周期候補各々の連続性を解析し、解析した連続性が所定の閾値以下の場合に、音声信号が含まれているか否かを検出する。 (もっと読む)


【課題】自動音量制御において、雑音レベルが大きくなりすぎることを抑制でき、SN比の悪い話者が存在しても他の話者の音声が聞き取り難くなることを低減することを目的とする。
【解決手段】入力音声信号の音声部分と非音声部分を判定する音声判定手段と、前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、前記音声レベルと前記雑音レベルと前記SN比と予め設定されている目標音量レベルから前記入力音声信号の増幅率を算出する増幅率算出手段と、前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、を有する。 (もっと読む)


【課題】符号化方式の切り替えに伴う音声復号回路の切替時に、音声復号回路からの復号音声信号を抑圧することなく、かつ不連続感のない切り替えを可能にする。
【解決手段】出力信号切替制御回路16は、入力回路11から入力した切替え制御情報に従い、背景雑音重畳回路18の動作を制御する。具体的には、背景雑音重畳回路18において背景雑音をどの程度重畳するかという重畳率を、背景雑音重畳回路18に対して出力する。背景雑音重畳回路18は、出力信号切替制御回路16から入力した重畳率に従い、背景雑音を重畳し、最終出力信号として出力回路19に出力する。 (もっと読む)


【課題】連続値で正確に騒音レベルの推定を行うことが可能である騒音レベル推定装置および振幅制限方法を提供する。
【解決手段】騒音レベル推定装置の一例である携帯電話装置16は、送話信号に含まれる成分のうち音声の成分の度合いを示す有音度合いを連続値で判定する有音度判定部111と、有音度合いに基づいて、送話信号に含まれる騒音の成分のレベルを示す騒音レベルを推定する騒音レベル推定部30Bとを有する。 (もっと読む)


61 - 70 / 242