説明

国際特許分類[G10L11/06]の内容

国際特許分類[G10L11/06]に分類される特許

21 - 30 / 36


【課題】音声コーディングにおけるロバストな音声分類のための方法、特に、暗騒音が存在する場合のロバストな分類のための方法をここに提供する。
【解決手段】雑音の影響を受けないパラメータの組が導出され、それにより、分類処理に対する暗騒音の悪影響が減じられる。音声信号は、音声または非音声として識別される。基本的なパラメータの組が音声フレームに対して導出され、その後、パラメータの雑音成分が推定され、除去される。フレームが非音声である場合、雑音の推定値は更新される。次に、すべてのパラメータが予め定められたしきい値の組と比較される。暗騒音がパラメータから除去されたため、しきい値の組は、雑音がいかに変化しても、ほぼ影響を受けない。フレームが任意の数のクラスに分類されることにより、波形のマッチングよりも知覚的なマッチングを行なって知覚上重要な特徴を強調する。 (もっと読む)


本発明はデジタル装置(4、13、14)のリアルタイム音声制御方法に関する。この方法は、音声解析モジュール(3)の入力側に供給される音声信号から子音および母音(ak、tki)を可能な限り短い待ち時間かつ小さい計算能力で抽出する手段(6)を含む音声解析モジュール(3)を使用する。デジタル装置は、特に、検出された子音の種類(A1−A3)、検出された母音の音色(tki)、ならびにピッチおよびインテンシティに応じて、制御信号(25)を生成する。本発明は特に声の表現性を取り込みテレビゲームを制御するのにきわめて有利に応用される。 (もっと読む)


【課題】本発明は、台詞が対応付けられた一連の静止画像が順次切り替えられて表示される静止画像表示切替システムに関し、特別な操作を要せず、台詞読み上げに応じて容易にタイミングよく静止画像の切り替え表示を行うことを目的とする。
【解決手段】音声検出手段21が、音声入力部19で所定の静止画像に対応する台詞が読み上げられたときの台詞音声の音声入力信号の有無を検出し、第1の画像表示制御手段32が設定時間データ部31に記憶した設定時間内に音声検出手段21が音声入力信号を検出しなかった場合に、表示制御部16に対して次の静止画像を画像DB33より抽出して送出することで画像表示部17の表示切り替えを行わせる構成とする。
(もっと読む)


異なるレートで非アクティブフレームを符号化する音声符号器および音声符号化方法が開示される。第1の周波数帯域上のスペクトル包絡線の記述、および第1の周波数帯域に対する記述が対応する符号化フレームから得られた情報に基づく、また第2の周波数帯域に対する記述が少なくとも1つの先行する符号化フレームから得られた情報に基づく、第2の周波数帯域上のスペクトル包絡線の記述に基づき復号化フレームを計算する符号化音声信号を処理するための装置および方法が開示される。復号化フレームの計算は、さらに、少なくとも1つの先行する符号化フレームから得られた情報に基づく第2の周波数帯域に対する時間情報の記述に基づくことができる。
(もっと読む)


【課題】低から中レートの効率的な符号化および復号化を促進する、音声を表現する方法または装置を提供する。
【解決手段】音声信号をフレームに分割し、基本周波数ω0、有声/無声決定Vk、スペクトル強度Mlのパラメータを算出し、前記算出されたパラメータを量子化し符号化し、ビットストリームとして出力する音声エンコーダと、前記音声エンコーダからのビットストリームをデコードし前記パラメータω0、Vk、Mlを再構築し、これらのパラメータより、有声/無声バンドを決定し、スペクトル位相を再生し、有声成分と無声成分をそれぞれ合成し、前記合成された有声成分と無声成分を合成することにより音声を合成する音声デコーダとを備える。 (もっと読む)


【課題】入力信号の周期性がある区間を精度良く検出すること等ができる自己相関を求める。
【解決手段】ゲイン計算部16は、入力信号X(t)のラグ範囲自己相関(人の基本周波数の範囲に相当するラグτの範囲での正規化自己相関の最大値)Rmax(x(n))と、フレームパワーp(n)とに基づき、入力信号X(t)に付加するノイズgの大きさを表すゲインgain(n)を求め、Rmax計算部20は、入力信号X(t)に、ゲインgain(n)に応じた大きさのノイズC×gain(n)×gを付加したノイズ付加信号Y(t)のラグ範囲自己相関Rmax(y(n))を、入力信号X(t)の特徴量として求める。本発明は、例えば、音声区間を検出する音声区間検出装置等に適用できる。 (もっと読む)


【課題】送信音声と受信音声とで保存すべき方を適切に選択して保存することでメモリ量を削減する。更に、保存時の符号化処理/復号化処理の内部状態も保存し、再生時にはこの保存内容により音声復号化部の内部状態を更新することにより、録音時に音声が送信側/受信側で頻繁に切り替わっていても再生時に異音が生ずることがない。
【解決手段】録音時には、送信音声符号と受信音声符号の音声レベルをレベル判定部132で比較し大きい方を音声符号保存部151に保存するように録音再生制御部131は各スイッチを制御する。更に、その時の音声符号化部112あるいは音声復号化部122の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部152に保存する。再生時には、内部状態保存部152から読み出した情報に基づき音声復号化部122の内部状態を更新して、音声符号保存部151から読み出した音声符号の復号化を行う。 (もっと読む)


【課題】 音声信号が示す音が無声音か有声音かを正確かつ迅速に識別可能な音声識別装置を提供すること。
【解決手段】 本発明の音声識別装置10は、時間軸に沿った音声信号を、それぞれの切り出し開始時刻をずらして複数のフレームに切り出す生成部13と、当該切り出された複数のフレームそれぞれに対応するゼロクロス数を算出する算出部15と、当該算出されたゼロクロス数に基づいて、複数のフレームそれぞれにおけるゼロクロス数を、複数のフレームそれぞれに近接するフレームにおけるゼロクロス数と比較した結果に基づいて、複数のフレームそれぞれに対応する音素が無声音か有声音かを識別する識別部17と、を備える。 (もっと読む)


【課題】本発明は、より正確な有声音/無声音分離を行う音声信号のハーモニック成分の分析を用いた有声音/無声音分離情報を抽出する方法及び装置を提供する。
【解決手段】本発明は、音声信号のハーモニック成分を用いた有声音/無声音分離情報抽出方法において、音声信号が入力されれば、周波数ドメインに変換するステップと、変換された音声信号からハーモニック信号とハーモニック信号を除いた残り信号とを計算するステップと、計算結果を用いてHRRを計算するステップと、HRRをしきい値と比較して、有声音/無声音分離を遂行するステップとを含む。 (もっと読む)


【課題】 音声信号の大小に拘わらず一定の基準で音声を識別できるようにする。
【解決手段】 音声周波数領域に含まれる基本波および各高調波成分の振幅またはパワーの合計に対する、基本波および各高調波成分のそれぞれの振幅またはパワーの比率を寄与率として求め、音声信号の大小に影響を受けることのない比率である寄与率の現れ方から、子音と母音の音素を特定する。 (もっと読む)


21 - 30 / 36