説明

国際特許分類[G10L21/04]の内容

国際特許分類[G10L21/04]に分類される特許

51 - 60 / 666


【課題】高周波数帯域が削除された信号を、より高音質に再生することができる周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、再生処理をコンピュータに実行させるプログラム及びそのプログラムか記録された記録媒体を提供する。
【解決手段】入力信号のサイド情報に応じて入力信号の拡大開始帯域を決定する拡大制御部11と、入力信号を複数のサブバンド信号に帯域分割する帯域分割部12とを備え、帯域分割部12で帯域分割された複数のサブバンド信号のうち、拡大開始帯域よりも低域側の複数のサブバンド信号に基づいて周波数帯域を拡大する。 (もっと読む)


【課題】音声素片の種類が不足する発声者の音声を合成する。
【解決手段】第1分布生成部342は、発声者USの音声の単位区間TF毎の特徴量情報Xの分布を、相異なる音素に対応する複数の正規分布NSqの混合分布で近似する。第2分布生成部344は、発声者UTの音声の単位区間TF毎の特徴量情報Yの分布を、相異なる音素に対応する複数の正規分布NTqの混合分布で近似する。関数生成部36は、相互に対応する正規分布NSqおよび正規分布NTqの各々の平均および共分散から、発声者USの音声の特徴量情報Xを発声者UTの音声の特徴量情報Yに変換する変換関数Fq(X)を音素毎に生成する。 (もっと読む)


【課題】プレゼンテーション、講演、選挙演説などの場において、人間が注意を向ける音声要素と心地良く耳を傾けたくなる音声要素に着目し、注目と傾聴の双方の効果を高めることができる音声加工装置を提供する。
【解決手段】音声入力信号に応じた共感音声を生成する共感音生成回路310と、音声入力信号に応じた異質感覚音声を生成する異質感覚音生成回路320とを具備すると共に、上記共感音生成回路310と、上記異質感覚音生成回路320のそれぞれの出力割合を変化させる付加比率制御部500を備える。 (もっと読む)


【課題】
特別なテスト音声信号を用いずに、周波数特性の調整を適切に行う。
【解決手段】
周波数分布解析部210Iが、再生出力の対象となった楽曲コンテンツをそのまま反映したコンテンツ音声の周波数分布解析を行って、基準周波数分布RSPIを得る。引き続き、調整補正量算出部220が、出力音量の設定値を考慮した周波数分布SPIを算出する。そして、調整補正量算出部220が、周波数分布SPIのレベル値が所定レベル値LVTH以上となる範囲を、周波数特性の補正を行う補正周波数範囲に決定する。一方、周波数分布解析部210Oが、当該楽曲コンテンツの再生出力音声が収音された収音音声の周波数分布解析を行って、周波数分布SPOを得る。こうして得られた周波数分布SPOと、周波数分布SPIとの比較結果に基づいて、決定された補正周波数範囲における調整補正量を算出する。 (もっと読む)


【課題】複数の音声データベースから合成された合成音声データに対して、1回の話速変換で合成音声データ全体の話速を均一に揃え、かつ、合成音声データ全体の時間長と番組放送時間とを一致させることができる話速調整装置およびプログラムを提供する。
【解決手段】複数の音声データベースから合成された合成音声データの話速の平均値を、識別番号jに基づいて合成音声データの生成源の音声データベースごとに算出する話速平均値算出手段11と、合成音声データの時間長の累計値を、合成音声データの生成源の音声データベースごとに算出する時間長累計値算出手段12と、該平均値、該累計値、および、番組放送時間に基づいて、合成音声データの時間長の伸縮倍率を、合成音声データの生成源の音声データベースごとに算出する伸縮倍率算出手段14と、該倍率で前記合成音声データの話速を変換する話速変換手段15と、を含む。 (もっと読む)


【課題】音質を改善すること。
【解決手段】本願の開示する技術は、一つの態様において、FFT部110と、SNR算出処理部120と、帯域選択部130と、拡張信号生成部140と、加算部150と、IFFT部160とを有する。FFT部110は、外部から入力された入力信号をフーリエ変換する。SNR算出処理部120は、入力信号の帯域ごとにSNRを算出する。帯域選択部130は、帯域ごとのSNRに基づいて、SNRが閾値を超え、かつ、SNRが最大となる帯域を選択する。拡張信号生成部140は、帯域選択部130により選択された信号を基に拡張信号を生成する。加算部150は、入力信号に拡張信号を加算し、帯域拡張信号を生成する。IFFT部160は、帯域拡張信号を逆フーリエ変換し、出力信号を生成する。 (もっと読む)


【課題】周波数圧縮を実行するために適する補聴器において、補聴器へ入って来る異なる入力信号が周波数圧縮後もなお良好に区別し得るようにする。
【解決手段】補聴器の入力信号から出力信号へ取り込まれない信号成分を含む源周波数帯からフォームファクタ(F1,F2)が求められ、このフォームファクタは、信号成分が補聴器の出力信号へ取り込まれる選択された周波数帯(W1,W2,W3)の増幅に用いられる。 (もっと読む)


【課題】音声合成に必要な素片データの個数を削減する。
【解決手段】記憶装置14は、発声者USの発声音を示す素片データDSを音声素片毎に記憶する。声質変換部24は、発声者USの音声の特徴量情報Xと発声者UTの音声の特徴量情報Yとの確率分布を示す混合分布モデルλ(Z)から生成されて発声者USの音声を発声者UTの音声に変換する変換関数F(X)を、合成対象の発音文字に対応した素片データDSに適用することで、発声者UTの音声に対応する素片データDSTを順次に生成する。音声合成部26は、声質変換部24が生成した各素片データDSTから音声信号VSYNを生成する。 (もっと読む)


【課題】第三者に不快感を与えずに周囲音をマスキングするためのマスキング音を生成することができるマスキング音生成装置を提供する。
【解決手段】話者の音声を含む周囲音をマスキングするマスキング音を生成するマスキング音生成装置1において、信号処理部7で、マイク5Aが収音した周囲音のスペクトルを抽出する。信号処理部7で、周囲音のスペクトルと、記憶部3に記憶された環境音のスペクトルとの間でスペクトル減算を行って、マスキング音のスペクトルを算出する。信号処理部7で生成したマスキング音のスペクトルを、スピーカ6Aからマスキング音としてマスキング領域Aにいる聴取者に対して出力する。 (もっと読む)


【課題】音声コーデックによる圧縮および解凍が施され高次倍音成分が強調された音声データの基本周期を正確に検出し、話速変換でのノイズ発生を回避する。
【解決手段】音声データを受け取り、該音声データから高次倍音成分を除去して出力するフィルタと、前記フィルタの出力データについて位相シフト量を変えつつ位相シフト処理を施し、位相シフト前の出力データと位相シフト後の出力データとの相関値を算出し、相関値がピークになる位相シフト量に応じた時間長を前記音声データの表す音声の基本周期として検出する基本周期検出部とを有することを特徴とする基本周期検出装置を提供する。 (もっと読む)


51 - 60 / 666