説明

国際特許分類[G10L11/02]の内容

国際特許分類[G10L11/02]に分類される特許

11 - 20 / 242


【課題】入力信号から雑音信号の推定を行って雑音信号を選択的に低減する際の音質の向上を図る。
【解決手段】雑音抑圧ゲイン算出部32は、事後SNRと事前SNRとから、各帯域の雑音抑圧ゲインを算出する。事前SNR算出部31は、直前フレームおよび現在フレームの事後SNRと、直前フレームの雑音抑圧ゲインと、重み係数α(k,b)を用いて、各帯域の事前SNRを算出する。α算出部30で算出される各帯域の重み係数α(k,b)は、信号の状態に応じて適応的に変化させられる。つまり、重み係数α(k,b)は、雑音と判定される帯域bにあっては最大値αMAX(b)に近づいていくように更新され、非雑音と判定される帯域bにあっては直ちに最小値αMIN(b)とされる。これにより、雑音抑圧ゲイン生成部15で算出される各帯域の雑音抑圧ゲインの精度(追従性)を高めることができ、音質の向上を図ることができる。 (もっと読む)


【課題】音源が変動しても音源信号を分離することができる音源分離装置及び音源分離方法を提供する。
【解決手段】伝達関数記憶部は音源からの伝達関数を記憶し、音源変動検出部は収音部から入力された入力信号に基づき音源の変動を表す変動状態情報を生成し、パラメータ選択部は前記音源変動検出部が生成した変動状態情報に基づいて初期分離行列を算出し、音源分離部はパラメータ選択部が算出した初期分離行列を用いて、前記収音部から入力された入力信号に対して音源分離を行う。 (もっと読む)


【課題】オーディオ情報の再生スタート時点を選択できるようにするためのマーカー指定に関し、誤って挿入されたマーカーの位置をユーザの意図する位置と一致するように修正する。
【解決手段】マーカー設定方法は、複数の無声領域および有声領域を含むオーディオ情報を受信するステップと、選択されたマーカー挿入時点に対する選択を受信するステップと、受信された選択および受信されたオーディオ情報に基づいて、選択されたマーカー挿入時点が有声領域に存在するかを判断するステップと、選択されたマーカー挿入時点が前記有声領域上に存在すると、受信されたオーディオ信号内の複数の無声領域の中で無声領域の時刻を決定し、決定された無声領域の時刻に対応するようにマーカーを設定するステップとを含む。 (もっと読む)


【課題】より正確に通話単位を検出することができる技術を提供する。
【解決手段】入電フレーズを構成する単語が各発話に含まれる割合である入電フレーズ一致率、及び、切電フレーズを構成する単語が各発話に含まれる割合である切電フレーズ一致率を計算する。入電フレーズ一致率が第一閾値よりも高い発話を入電発話とし、切電フレーズ一致率が第二閾値よりも高い発話を切電発話とする。仮検出された各通話を構成する発話の中に入電発話が含まれる場合にはその入電発話の直前でその各通話を分割し、各通話を構成する発話の中に切電発話が含まれる場合にはその切電発話の直後でその各通話を分割し、直前の通話を構成する最後の発話が切電発話ではなくかつ最初の発話が入電発話でない通話がある場合にはその通話とその直前の通話とを結合する。 (もっと読む)


【課題】非定常雑音を含む入力音信号でも、入力信号のパワーに対する閾値を設定したり、複雑な演算処理を行ったりしなくても、正確に音信号区間を抽出する。
【解決手段】音によって発生する振動のアナログ音信号が入力すると、サンプリングして量子化することでデジタル音信号に変換し(ステップ101)、ステップ101で取得したデジタル音信号に基づき振幅値を時系列でグラフ化した2次元画像を作成して2値画像データとし(ステップ102)、ステップ102で作成した2値画像データに、予め定められた数の周辺画素の値に0が1つ以上あると注目画素の値を1から0に変換する収縮処理を施して、当該2値画像データに存在している雑音区間を削除して塊化された領域となる音信号区間を抽出し(ステップ103)、ステップ103で抽出した音信号区間を特定するために、2値画像データにおける塊化された領域の起点と終点とを時系列で検出する(ステップ106)。 (もっと読む)


【課題】雑音の誤検出による応答音声の中断の発生を抑えること。
【解決手段】音声対話装置は、入力音声に含まれる応答音声のエコーを除去したエコー除去音声の始端と終端を検出する音声検出部8と、前記始端が検出されてから所定期間が経過した時点で前記終端が検出されていないときに応答中断指令を出力する応答中断制御部11と、応答中断制御部11から前記応答中断指令を受け取ると応答音声出力部に応答音声の出力を中断させる対話制御部3と、を備える。 (もっと読む)


【課題】 受信した音声信号に対する周波数特性の操作が却って品質劣化を招くことを防止できる音声処理装置を提供する。
【解決手段】 音声処理装置には、送信側で周波数特性が操作された音声信号が到来することもあれば、周波数特性の操作がなされていない音声信号が到来することもある。そこで、送信側で周波数特性が操作されない場合の音声信号の平均的な周波数特性を反映させた基準特性情報を保持しておき、受信した音声信号について、基準特性情報と同様な表現形式の特性情報を得た後、基準特性情報と受信音声信号の特性情報とを比較し、送信側で周波数特性が操作されか否かを判定する。そして、この判定結果に応じて、受信側における周波数特性の操作の有無や、操作量を制御する。 (もっと読む)


【課題】分類の個数を事前に指定しなくても、音声を分類することができ、得られた分類結果の音声の種類を判別できるようにする。
【解決手段】本発明による音声分類装置は、複数の音声区間に分割された音声データを逐次的にクラスタリングして、クラスタリング結果をクラスタ情報として算出する逐次クラスタリング手段と、前記音声データ中の音声区間がいずれのクラスタラベルに対応するかを判別するための情報であるクラスタラベル判別情報を算出するクラスタラベル判別情報算出手段と、前記逐次クラスタリング手段が算出した前記クラスタ情報と、前記クラスタラベル判別情報算出手段が算出した前記クラスタラベル判別情報とを用いて、前記音声データ中の音声区間がいずれのクラスタラベルに対応するかを判別するクラスタラベル判別手段と、を備えたことを特徴とする。 (もっと読む)


【課題】複数の通話端末装置間で行われる通話の通話区間を正確に推定する。
【解決手段】音声入力部11に、何れかの上記通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力され、音声検出部12が、送話側チャネルの音声信号と受話側チャネルの音声信号とを用い、チャネル毎の音声区間と非音声区間とを検出し、通話区間推定部13が、或るチャネルの音声区間の開始時刻を第1起点とし、当該音声区間の開始時刻を除く或る時刻を第2起点とし、当該第2起点から一定時間T1以内に別のチャネルの音声区間が存在しない場合に、上記或るチャネル音声区間の音声は通話の音声ではないと判断し、当該第2起点から一定時間T1以内に別のチャネルの音声区間が存在する場合に、上記第1起点又は上記第1起点の一定時間T4前の時刻を通話区間の開始時刻として推定する(もっと読む)


【課題】わずかな処理量や小規模のハードウェアで効率よく背景雑音レベルを推定することができるようにする。
【解決手段】本発明の背景雑音レベル推定装置は、第1の時定数により、入力音声信号から低域成分の第1の包絡線信号を生成する第1の包絡線信号生成手段と、第1の時定数とは異なる第2の時定数により、入力音声信号から低域成分の第2の包絡線信号を生成する第2の包絡線信号生成手段と、第1の包絡線信号と第2の包絡線信号とに基づいて、入力音声信号のレベル増加度を求めるレベル増加度算出手段と、第1の包絡線信号又は第2の包絡線信号から、第3の時定数によって低域成分の第3の包絡線信号を生成する第3の包絡線信号生成手段と、信号値増加度算出手段が求めたレベル増加度の変化に基づいて音声信号の重畳を検出し、その検出結果に応じて第3の包絡線信号のレベル値を基にして背景雑音レベル推定値を求める背景雑音レベル推定手段を備える。 (もっと読む)


11 - 20 / 242