説明

国際特許分類[G10L11/06]の内容

国際特許分類[G10L11/06]に分類される特許

11 - 20 / 36


【課題】 元の音声波形を分析して抽出されるパラメータを用いて常に適切な音声波形を合成できるようにする技術を提供する。
【解決手段】 分析フェーズでは、A/D変換器8から出力された音声データをフレーム単位で分析する。パラメータとしては、PARCOR係数、その音声データが表す音声が有声音である度合いを示す有声音比率、などを抽出する。合成フェーズでは、指定されたピッチで生成したRosenberg 波、ピッチを持たないホワイトノイズ波を有声音比率に応じて混合する形で駆動音源波形を生成する。合成フィルタ部45は、その駆動音源波形、及びPARCOR係数を用いて1フレーム分の音声データを合成する。 (もっと読む)


【課題】無声音を高精度に判別する。
【解決手段】変調スペクトル特定部34は、入力音VINの各単位区間TUについて変調スペクトルMSを特定する。指標算定部42は、変調スペクトルMSのうち変調周波数が所定の範囲に属する成分の強度に応じた指標値D1を算定する。指標算定部44は、入力音VINの零交差数に応じた指標値D2を各単位区間TUについて算定する。指標算定部46は、入力音VINの周波数スペクトルS0の平坦性に応じた指標値D3を各単位区間TUについて算定する。無声音判定部54は、各単位区間TUの入力音VINが無声音であるか否かを指標値D1と指標値D2と指標値D3とに基づいて判定する。 (もっと読む)


【課題】周波数特性が不安定な場合や周波数特性に含まれる調波構造が不安定な場合でもピッチ周波数の推定を精度よく行うことができるようにする。
【解決手段】入力音声の調波構造を表す対数周波数軸上の周波数特性のうち、サーチ周波数を基準として選択された所望部分の周波数特性が複数抽出され、抽出されたそれぞれの周波数特性の次元変換が逆フーリエ変換を用いて行われる。次元変換が行われることによって得られたそれぞれの特徴量系列と、学習データを用いてあらかじめ求められていたテンプレートパターンとの類似度が算出され、テンプレートパターンとの間で最大の類似度が算出された特徴量系列の元になった所望部分を選択するときに用いられたサーチ周波数が、入力音声のピッチ周波数として決定される。本発明は、音声信号を処理する装置に適用することができる。 (もっと読む)


本発明は、音声が有用な信号として理解される、音声区間の検出、背景雑音の推定、および音声信号の分類に関する。本発明は、対応する音声区間検出器、背景雑音推定器、および音声信号分類器にも関する。音声信号の音調を推定する装置および方法は、音声信号の現在の剰余スペクトルを計算するステップと、現在の剰余スペクトルのピークを検出するステップと、検出された各ピークについて、現在の剰余スペクトルと前の剰余スペクトルとの相関マップを計算するステップと、計算された相関マップに基づいて長期相関マップを計算するステップであって、長期相関マップは、音声信号の音調を示すステップとを含む。
(もっと読む)


【課題】ピッチ変動が適度に大きいため自然な印象を与える合成音声を生成することを可能とする音声合成辞書を構築する。
【解決手段】音声合成辞書構築装置は、音声データベース221を用いて既知の処理である音素HMM学習を行うことにより、いったん、仮の音声合成辞書223を作る。続いて、該装置は、該仮の音声合成辞書223を経由して生成された合成音声と、前記音声データベース221に収録されている音声と、を分析し比較した結果に基づいて、該音声のピッチ変動を適度に大きくするためのピッチ系列データの編集方法を決定する。最終的に、該装置は、かかる編集方法が採用された編集過程をあらかじめ織り込んだ上で、音素HMM学習をやり直すことにより、音声合成辞書227を構築する。 (もっと読む)


【課題】話者毎の発話開始位置に対して容易にアクセスすることができる音声記録装置を提供する。
【解決手段】音声記録装置において、発話に基づく音声信号について、話者の特徴を表す所定の特徴量を、所定時間毎に順次検出する検出手段(ステップ34)と、検出手段により順次前記特徴量が検出される毎にその検出値と、その前に検出された特徴量の値とを比較することにより、該特徴量において所定の変化が生じたかどうかを判定する判定手段(ステップ35)と、判定手段により所定の変化が生じたと判定された場合に、その判定時点の所定の近傍の時点を前記音声信号における分割点とする分割手段と、分割手段により分割点とされた時点において、所定の記録単位で分割しながら、前記音声信号の記録を行う記録手段(ステップ36)とを設ける。 (もっと読む)


【課題】 合成音の質を向上させることができる音声合成装置を提供する。
【解決手段】 音声合成装置1は、入力音声信号をフィルタリング処理し、線形予測残差信号を得る分析フィルタ2と、線形予測残差の自己相関関数(残差相関関数)の波形信号を分析する音源特性分析器3と、残差相関関数の雑音比に基づいて母音波形であるかどうかを判断する母音検出部4と、母音波形の極の尖頭度や母音波形におけるフレーム区間内のゼロクロス数から、母音波形の母音種を特定する母音種抽出部5と、母音種に応じた周期パターンを発生させる周期信号発生器9及び雑音パターンを発生させる雑音信号発生器10とを有する音源部6と、雑音パターンをフィルタリング処理する合成フィルタ7と、合成フィルタ7をバイパスした周期パターンと合成フィルタ7を通過した雑音パターンとを合成して、合成音を生成する音声合成部8とを備えている。 (もっと読む)


【課題】 有声音によるマスキングや継時マスキングに対する言葉の聞き取りを改善する。
【解決手段】 入力音声信号S17の子音の帯域の振幅の変更を行なう振幅変更手段15と、信号S17のピッチ成分およびフォルマント成分とを抽出する抽出手段21とを設ける。抽出手段21の抽出出力から有声音のレベルを示す信号を算出するレベル算出手段22と、レベル算出手段22の出力から入力音声信号S17における有声音の開始点および終了点を検出する有声音開始点検出手段23とを設ける。検出手段23により検出された有声音の開始点から終了判定点からの立下がりまでの区間のみ、振幅変更手段15の利得を基準値に対し大きくし、有声音終了点検出手段23により検出された有声音の終了点からの立下がり区間において振幅変更手段15の利得を基準値まで下げるように振幅変更手段15に対して制御を行なう制御手段24を設ける。 (もっと読む)


【課題】分析合成型の音声符号化及び復号において、与えられた情報伝達容量を余さず活用して再生音声の品質を向上させる。
【解決手段】入力音声信号を予測分析部125により予測係数と残差信号とに分解し、前記残差信号の特徴量を取り出した後、符号化部133にて前記予測係数と前記特徴量とをまとめてエントロピ符号化する。生成された符号長が所定の符号長を超える場合には、予測分析次数調整部137により予測分析の次数を1つずつ減らしながら、生成された符号長が所定の符号長以内になるまで符号化の試行を繰り返す。 (もっと読む)


【課題】再生される音声において、破裂部の有無、破裂部に続く帯気部の音素長などの破裂音に係る問題箇所、あるいは摩擦音の振幅変動等に係る問題箇所を自動的に検出して自動修正する。
【解決手段】本発明の音声強調装置は、子音や無声母音が不明瞭であったり、耳障りであったりする音声を入力として、該音声強調装置において、音声を音素に分解し、各音素を無声破裂音、有声破裂音、無声摩擦音、有声摩擦音、破擦音、無声母音のいずれかに分類し、各音素の修正の必要性の判定に応じて各音素を修正することによって、子音や無声母音が明瞭で、耳障りのないクリアな音声の出力が得られるようにした。 (もっと読む)


11 - 20 / 36