説明

国際特許分類[G10L11/06]の内容

国際特許分類[G10L11/06]に分類される特許

1 - 10 / 36


【課題】オーディオ信号における子音区間を簡単で処理負荷の軽い信号処理で確実に識別することを可能にする。
【解決手段】オーディオ信号の波形を表すサンプル列を所定サンプル数のブロックに区切り、ブロック毎に当該ブロックにおける全周波数成分のエネルギーと当該ブロックにおける所定の周波数帯域に属する周波数成分のエネルギーとを各々算出し、両者の比を算出する。加えて、各ブロックの単位時間当たりのゼロクロス数をカウントする。そして、上記エネルギー比、および隣接するブロック間でのゼロクロス数の変化態様に基づいてブロック毎に当該ブロックが子音区間に含まれるものであるか否かを判定する。 (もっと読む)


【課題】より簡易に会話スタイルを分析すること。
【解決手段】分析装置10は、取得部14aと、第1の検出部14bと、第2の検出部14cと、抽出部14eと、分析部14fとを有する。取得部14aは、音声データを取得する。第1の検出部14bは、取得された音声データから、第1の確率モデルを用いて、有声音領域および無声音領域を検出する。第2の検出部14cは、検出された有声音領域および無声音領域に基づいて、第2の確率モデルを用いて、音声データにおける発話領域および沈黙領域を検出する。抽出部14eは、検出された発話領域および沈黙領域の会話特性を抽出する。分析部14fは、抽出された会話特性に基づいて、会話スタイルを分析する。 (もっと読む)


【課題】比較的高いノイズレベルの環境下においても精度よく子音区間を検出する。
【解決手段】子音区間検出装置110は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部120と、フレーム化入力信号を、時間領域から周波数領域に変換して、スペクトルパターンを生成するスペクトル生成部122と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部126と、導出された帯域別平均エネルギー同士を比較し、第1の周波数帯域の帯域別平均エネルギーが、第1の周波数帯域より低い周波数帯域である第2の周波数帯域の帯域別エネルギーより高いことを検出することによりフレーム化入力信号に子音が含まれるかどうかを判定する子音判定部128とを備える。 (もっと読む)


【課題】 再構築されたオーディオ信号を処理するための技法およびツールを提供する。
【解決手段】 再構築されたオーディオ信号は、周波数ドメイン内で少なくとも一部が計算されるフィルタリング係数を使用して、時間ドメイン内でフィルタリングされる。他の例として、再構築されたオーディオ信号をフィルタリングするためのフィルタリング係数のセットを生成することは、係数値のセットにおける1つまたは複数の山をクリッピングすることを含む。さらに他の例として、サブ帯域コーデックの場合、2つのサブ帯域の交差部分付近の周波数領域で、再構築された合成信号が拡張される。 (もっと読む)


【課題】背景音と音声が混合している場合でも、安定して適応的な話速変換倍率を決定する。
【解決手段】話速変換倍率決定装置1aは、入力信号の有音区間と無音区間とを判別する有音無音判定部102と、有音区間にて入力信号の基本周波数を算出するとともに安定区間と不安定区間とを決定する基本周波数算出部104と、安定区間にて基本周波数の時間変化を平滑化する周波数平滑化部106と、不安定区間及び無音区間にて基本周波数を内挿した擬似基本周波数を算出する擬似基本周波数算出部108と、平滑化された基本周波数及び擬似基本周波数を接続して基本周波数の概形の標本値を得る基本周波数概形連結部110とを有し、基本周波数の概形の標本値を物理指標として出力する物理指標算出部2と、この物理指標に基づいて話速変換倍率を算出する話速変換倍率指定部120とを備える。 (もっと読む)


【課題】入力信号から雑音信号の推定を行って雑音信号を選択的に低減する際の音質の向上を図る。
【解決手段】雑音抑圧ゲイン算出部32は、事後SNRと事前SNRとから、各帯域の雑音抑圧ゲインを算出する。事前SNR算出部31は、直前フレームおよび現在フレームの事後SNRと、直前フレームの雑音抑圧ゲインと、重み係数α(k,b)を用いて、各帯域の事前SNRを算出する。α算出部30で算出される各帯域の重み係数α(k,b)は、信号の状態に応じて適応的に変化させられる。つまり、重み係数α(k,b)は、雑音と判定される帯域bにあっては最大値αMAX(b)に近づいていくように更新され、非雑音と判定される帯域bにあっては直ちに最小値αMIN(b)とされる。これにより、雑音抑圧ゲイン生成部15で算出される各帯域の雑音抑圧ゲインの精度(追従性)を高めることができ、音質の向上を図ることができる。 (もっと読む)


【課題】雑音推定において、母音区間や小声区間のような音声区間が、雑音モデルに反映されるのを抑える。
【解決手段】雑音推定装置10は、1個以上のマイクで取得した音情報における複数フレーム間のスペクトルの相関値を算出する相関算出部6と、音情報における少なくとも1つの対象フレームの音レベルを表すパワー値を算出するパワー算出部7と、対象フレームのパワー値、および対象フレームを含むフレーム間の相関値とを用いて、記録部12に記録された雑音モデルに対して対象フレームをどの程度反映させるかを示す更新度合いまたは雑音モデルの更新の要否を決定する更新決定部8と、決定にしたがって、音情報を雑音モデルに反映させる更新部9とを備える。 (もっと読む)


【課題】 既存の各種標準化との互換性や音質を保ったまま、コード探索に要する処理を軽減できる音声符号化装置を提供する。
【解決手段】 本発明は、固定コードブックを利用する音声符号化装置に関する。そして、符号化対象の音声信号の特性を分析する信号特性分析手段と、その分析結果に応じ、固定コードブックにおけるコードのうち、符号化情報に含める最適コードの探索に用いるコード群を切り替える候補コード群切替手段とを有することを特徴とする。符号化対象の音声信号の特性に応じて、固定コードブックのコードのうち、最適コードの探索に使用するコードを限定するようにしたので、符号化の高速化を図ることができる。 (もっと読む)


【課題】違和感の少ない短縮された音声信号を作る。
【解決手段】音声データを一区切り毎にブロック化して音声固まりを作り、その音声信号が有声音か無声音か無音かを識別して、音声が始まった位置を始端点とする。有声音の場合には終端に近い複数の音声波形のピーク値から推定近似線を用いて時間軸上にみなし終端点を決定し、無声音の場合にはレベル検出により終端点を決定することにより、有声音に含まれる無音部分と、無声音に含まれる聴感上では短縮できる無声部分と無音部分、音声データが存在しない無音とをカットし、再び音声信号をつなぎ合わせる。 (もっと読む)


【課題】音声モードを変更し、マルチモードの可変ビットレートのコード化技術の最大の性能を可能にするためのロバストな分類のための音声分類技術を提供する。
【解決手段】音声分類器は、高い割合で音声セグメントを正確に分類し、最低ビットレートでコード化し、より低いビットレートの要件を満たす。高精度の音声分類により、平均のコード化ビットレートはより低くなり、デコードされた音声の品質はより高くなる。音声分類器は、各音声フレーム毎に最大数のパラメータを検討し、各フレーム毎に多数の正確な音声モード分類を生成する。音声分類器は、変化する環境条件下で、多数の音声モードを正確に分類する。音声分類器は、外部の構成要素から分類パラメータを入力し、入力パラメータから内部分類パラメータを生成し、正規化された自己相関係数の関数の閾値を設定し、信号環境に従ってパラメータ解析器を選択し、パラメータを解析し、音声モードを分類する。 (もっと読む)


1 - 10 / 36