説明

国際特許分類[G10L13/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | テキストから音声を合成するための,テキストの分析,またはパラメータの生成,例.表記素から音素への変換,韻律の生成または強勢またはイントネーションの決定 (495)

国際特許分類[G10L13/08]に分類される特許

51 - 60 / 495


【課題】所定の原文に対して互いに異なる複数の合成条件の何れかにて合成音声を作成する場合でも、合成音声の作成に要する時間を短縮できる音声合成装置を提供する。
【解決手段】音声合成装置1は、入力テキスト情報または入力表音情報と入力合成条件の組が少なくとも一つの登録テキスト情報または登録表音情報と登録合成条件の組の何れかと一致するか否か判定する一致判定部10と、入力テキスト情報等の組が登録テキスト情報等の組の何れとも一致しない場合、入力テキスト情報または入力合成条件を修正することにより派生テキスト情報と派生合成条件の組を作成し、派生テキスト情報と派生合成条件の組と、その派生テキスト情報及び派生合成条件に基づいて音声合成部11が合成音声信号を作成する途中で作成された派生中間情報との組を、登録テキスト情報と登録合成条件の組と登録中間情報との組の一つとして記憶部3に記憶させる自動更新部17とを有する。 (もっと読む)


【課題】音声合成に必要な素片データの個数を削減する。
【解決手段】記憶装置14は、発声者USの発声音を示す素片データDSを音声素片毎に記憶する。声質変換部24は、発声者USの音声の特徴量情報Xと発声者UTの音声の特徴量情報Yとの確率分布を示す混合分布モデルλ(Z)から生成されて発声者USの音声を発声者UTの音声に変換する変換関数F(X)を、合成対象の発音文字に対応した素片データDSに適用することで、発声者UTの音声に対応する素片データDSTを順次に生成する。音声合成部26は、声質変換部24が生成した各素片データDSTから音声信号VSYNを生成する。 (もっと読む)


【課題】従来、励振源モデルの学習する際、有声フィルタ特性推定時に生じた周期性を含む誤差が、無声フィルタ特性の推定に用いるターゲット信号に紛れ込み、無声フィルタ特性が過大に推定されてしまう。そのため、音声合成時には、過大推定された無声フィルタ特性から励振信号が生成され、最終的に合成された音声には過剰な非周期成分が雑音として乗ってしまっていた。
【解決手段】1つ以上の分析残差信号を受け付ける分析残差信号受付部と、1つ以上の各分析残差信号から、1つ以上の非周期成分信号を抽出する非周期成分信号抽出部と、1つ以上の非周期成分信号に基づいて無声フィルタ特性を算出する無声フィルタ特性算出部と、無声フィルタ特性算出部が算出した無声フィルタ特性を蓄積する無声フィルタ特性蓄積部とを具備する無声フィルタ学習装置により、無声フィルタの特性を適切に学習できる。 (もっと読む)


【課題】参照音の特徴量の遷移を忠実に反映した確率モデルで自然な合成音を生成する。
【解決手段】区間設定部34は、参照音の参照ピッチPrefの変動の傾向に応じた遷移種別毎(開始部B,定常部S,終了部E)に参照音を単位区間μに区分する。確率モデル生成部421は、複数の状態Stの各々について特徴量の確率分布を示す遷移種別毎の特徴量モデルQAと、複数の状態Stの各々について継続長の確率分布を示す遷移種別毎の継続長モデルQBとを、参照音のうち当該遷移種別の単位区間μにおける参照ピッチPrefの時系列から生成する。 (もっと読む)


【課題】リンク箇所を音声で明確に表示することが可能で、リンクから遷移中であることを認識可能な音声合成機能付き文字情報表示装置およびその制御方法を提供する。
【解決手段】表示部16に表示中の文字情報に含まれる文字列を音声合成部17にて音声に変換する際に、音声に変換する文字列が、リンク先の対応付けられた表示オブジェクトの場合には第1の音声で音声変換させ、リンク先の対応付けられた表示オブジェクトではない場合には第2の音声にて音声変換させるように音声合成部17を制御する制御部19と、操作部18と、を備え、制御部19は、リンク先の対応付けられた表示オブジェクトが操作部18により選択指示または決定指示されると、リンク先の対応付けられた表示オブジェクトに含まれる文字列を第3の音声にて音声変換させる。 (もっと読む)


【課題】周囲の騒音や混雑度合いにかかわらず、音声案内を適確に認識することが可能な音声案内装置を提供する。
【解決手段】音声案内装置は、人感スイッチ12と、この人感スイッチ12の検出信号に基づいて混雑度合いを判定する混雑度合い判定部24と、周囲の騒音を集音するマイク11と、このマイク11の検出信号に基づいて騒音レベルを判定する騒音レベル判定部22と、混雑度合い判定部24により判定した混雑度合いと騒音レベル判定部22で判定した騒音レベルとに基づいて、スピーカ15から出力される音声案内の再生音量と再生間隔とを変更する音声再生制御部23とを備える。 (もっと読む)


【課題】高速に音声波形を生成する。
【解決手段】第1記憶部は、n個の帯域通過フィルタを雑音信号に適用したn個の帯域雑音信号を記憶する。第2記憶部は、n個の帯域通過フィルタをパルス信号に適用したn個の帯域パルス信号を記憶する。パラメータ入力部は、基本周波数、n個の帯域雑音強度およびスペクトルパラメータを入力する。切出部は、ピッチマークごとにn個の帯域雑音信号をシフトしながら切り出す。振幅制御部は、切り出した帯域雑音信号の振幅と帯域パルス信号の振幅とを帯域雑音強度に応じて変更する。生成部は、n個の帯域雑音信号とn個の帯域パルス信号とを加算した混合音源信号を生成する。重畳部は、ピッチマークに基づいて生成された混合音源信号を重畳する。声道フィルタ部は、重畳された混合音源信号にスペクトルパラメータを用いた声道フィルタを適用して音声波形を生成する。 (もっと読む)


【課題】定型部分と可変部分からなる文章の音声データを、録音音声と規則合成音声を組み合わせて生成する音声合成装置において、録音音声と合成音声を接続する際に音質および韻律の不連続が知覚されない、高品質な音声合成装置を提供する。
【解決手段】録音された、定型部分を含む録音音声データを予め格納する録音音声格納部5と、受け付けたテキストから、可変部分と少なくとも前記定型部分の一部を含む規則合成音声データを生成する規則合成部7と、前記テキストに対応する、前記録音音声データおよび前記規則合成音声データの音響特徴情報に基いて、前記録音音声データと前記規則合成音声データとが重複する区間における接続境界位置を算出する接続境界算出部8と、前記接続境界位置で区切って切り出した前記録音音声データと前記規則合成音声データとを接続して、前記テキストに対応する合成音声データを生成する接続合成部9とを備える。 (もっと読む)


【課題】本発明は、テキストの内容によって朗読リズムを制御することができるテキスト読み上げシステム及びテキスト読み上げ方法を提供することを目的とする。
【解決手段】本発明のテキスト読み上げシステムは、テキストソースからテキスト内容を読み取るテキスト読取モジュールと、前記テキスト内容を分析して、前記テキスト内容が含むリズム意味を識別するテキスト分析モジュールと、前記テキスト内容が含むリズム意味に基づいて、リズム制御スクリプトを生成する処理モジュールと、音声合成モジュールと、前記リズム制御スクリプトに基づいて、前記テキスト内容をリズミカルに前記音声合成モジュールに伝送する朗読リズム制御モジュールと、を備え、前記音声合成モジュールは、前記朗読リズム制御モジュールから伝送されるテキストを音声に変換し且つオーディオ出力装置に出力する。本発明は、テキスト読み上げ方法も提供する。 (もっと読む)


【課題】聴感的に自然な合成音を生成する。
【解決手段】区間設定部42は、参照音から検出された参照ピッチPref(t)の時系列を音符毎に複数の音符区間σに区分する。相対化部44は、複数の音符区間σの各々について、当該音符区間σの音符のピッチNAに対する当該音符区間σ内の参照音の各参照ピッチPref(t)の相対値である相対ピッチR(t)の時系列を生成する。情報登録部38は、相対ピッチR(t)の時系列を示す相対ピッチ情報YA2を記憶装置14に格納する。軌跡生成部52は、音名が指定された指定音について、相対ピッチ情報YA2が示す相対ピッチR(t)の時系列と当該指定音の音名に対応するピッチNBとに応じて合成ピッチPsyn(t)の時系列を生成する。 (もっと読む)


51 - 60 / 495