説明

国際特許分類[G10L11/04]の内容

国際特許分類[G10L11/04]に分類される特許

201 - 206 / 206


【課題】 簡便な方法で入力音声に抑揚の変化を与える。
【解決手段】 ピッチ検出部2は、入力部1から入力された音声を分析して、そのピッチを検出する。出力ピッチ計算部3は、入力音声のピッチの短時間平均値と、現在のピッチと前記ピッチの短時間平均値の差に係数Aを乗算した値を加算して、新しい出力ピッチを計算する。ピッチ変換器5は、入力音声を前記出力ピッチ計算部3で計算された新しい出力ピッチに変換して出力する。ピッチでなく、音量なども同様に変化させることができる。パラメータ指定部4から前記短時間平均計算の対象となる時間と前記係数Aを指定することにより、抑揚変化の具合を任意に変更することができる。 (もっと読む)


多重音信号から発音数、基本周波数(F0)及び/あるいは周波数成分パワー比を検出する。複数の調波構造が混在したスペクトルのモデルを、単一の調波構造をモデル化した拘束つき混合正規分布モデルを混合することで構築する。本発明は二つの技術手段を含んでいる。一つは多重音信号の音源数推定であり、もう一つは各音源の基本周波数及び/あるいは周波数成分パワー比の推定である。拘束つき混合正規分布モデルのパラメータに関する推定と情報量基準に基づくアルゴリズムにより、発音数、それぞれの基本周波数及び/あるいは周波数成分パワー比を検出する。 (もっと読む)


通信システムにおけるエコーを低減するための方法および装置を提供する。話者に関連する音声成分を含んだ第一信号が受け取られる。第一信号が処理されて、音声成分の調波性特徴が取り出される。第一信号と相関するエコー成分を含んだ第二信号も受け取られる。第二信号は、音声成分の調波性特徴に基づき少なくとも部分的に処理されて、エコー低減信号が取り出されるように、エコー成分を少なくとも部分的に除去する。エコー低減信号は、次いで発せられる。特定の実施では、音声成分の調波性特徴は、音声成分に関連するピッチの推定値である。 (もっと読む)


高調波ノイズ重み付けの大きさを最適化することができるように高調波ノイズ重み付け(HNW)係数(ε)の値を選択する必要性に対処するために、高調波ノイズ重み付けをデジタル音声符号器において行なう方法及び装置を本明細書に開示する。動作状態の間、受信音声を解析して(503)ピッチ周期を求める。次に、HNW係数をピッチ周期に基づいて選択し(505)、知覚ノイズ重み付けフィルタ(C(z))を高調波ノイズ重み付け(HNW)係数(ε)に基づいて決定する。
(もっと読む)


本発明はディスプレイ装置を備えた再生装置に格納された音声ドキュメントのコレクション内を巡回する方法に関する。本方法は、各ドキュメントに固有の「ローレベル」と呼ばれるオーディオパラメータを求めるためにドキュメントを分析するステップを有している。つぎに、音声ドキュメントの少なくとも一部のグラフィック識別子がグラフィックページ内に置かれる。グラフィック識別子の配置は事前に計算されたパラメータに依存している。最後に、本発明は、グラフィックページ内でのドキュメント識別子の位置を考慮に入れて、決定されたストラテジーに従って音声ドキュメントを逐次再生することにより自動巡回を行うステップを有している。
本発明はまた、決定されたストラテジーとグラフィックページ内でのドキュメント識別子の位置とに従って音声ドキュメントを再生するソフトウェアモジュールを実行することのできる装置にも関する。
(もっと読む)


ボイスアプリケーション創出および配置システムが統合された行為適応エンジンが、データに添付された音声ファイルを含むXMLベースクライアント対話データを受信するための少なくとも1つのデータ入力ポートと、外部データシステムおよびモジュールにデータを受信し、かつそれからデータを受信するための少なくとも1つのデータポートと、受信されたデータを処理するためのXML読取装置、ボイスプレーヤ、および分析装置を含む論理処理構成要素と、1つまたは複数の制約に対して結果データを処理するための決定論理構成要素とを有する。エンジンは、提供されるボイスアプリケーションとのクライアント対話からのダイアログを含むクライアントデータを実時間で傍受し、行為パターン、および添付されていれば音声ファイルのボイス特徴について受信データを処理し、その際に、エンジンは、結果および1つまたは複数の有効な制約に従って、対話中にクライアントに戻される可能な企業応答の1つまたはセットを識別する。 (もっと読む)


201 - 206 / 206