説明

国際特許分類[G10L13/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 音声合成器で使われる音声素片;結合規則 (315)

国際特許分類[G10L13/06]に分類される特許

71 - 80 / 315


【課題】合成音の接続に伴う不自然さを軽減した合成音声を生成することができる音声合成装置、プログラム、及び方法を提供する。
【解決手段】取得部40が、定型部分と非定型部分とを含み、それぞれの文章が類似する複数の雛形文章と、非定型部分を置換する置換語句とを取得し、文章生成部45が、雛形文章それぞれに対し、非定型部分を置換語句で置換して複数の目標文章を生成し、定型合成音生成部50が、目標文章それぞれに対し、定型部分の合成音である第1合成音を生成し、規則合成音生成部55が、目標文章それぞれに対し、置換語句の合成音である第2合成音を生成し、演算部60が、目標文章それぞれに対し、第1合成音と第2合成音との境界の不連続値を演算し、選択部65が、複数の目標文章の中から、不連続値が最小となる目標文章を選択し、接続部70が、選択された目標文章の第1合成音及び第2合成音を接続する。 (もっと読む)


【課題】所望の声質の補間音声を合成可能な音声合成装置を提供する。
【解決手段】音声合成装置は、話者の音声に相当するピッチ波形毎に用意され、各ピッチ波形に含まれる複数のホルマントの各々に関するホルマント周波数、ホルマント位相、ホルマントパワー及び窓関数を含む話者パラメータを、話者毎に1つずつ選択して複数の話者パラメータ421,・・・,42Mを得る選択部42と、ホルマント周波数及び前記ホルマントパワーに基づくコスト関数を利用して複数の話者パラメータの間でホルマント同士の対応付けを行うマッピング部43と、マッピング部43によって互いに対応付けられているホルマント同士でホルマント周波数、ホルマント位相、ホルマントパワー及び窓関数を所望の補間比率に従って補間して補間話者パラメータを生成する生成部44とを具備する。 (もっと読む)


【課題】特定音声に特化されていない音声生成モデル予測器を含む音声合成装置において、音声合成記号と比較的小さい修正情報を用いて、原音声の特徴を再現した音声を合成する。
【解決手段】一連の音声合成記号入力に基づき音声生成モデルを生成し、生成された音声生成モデルに基づき音声波形を生成する音声合成装置であって、音声生成モデルの修正情報を入力する手段と、音声生成モデルの修正情報に基づき、音声合成記号入力に基づき生成された音声生成モデルを修正する手段とを備えており、前記修正情報は、合成対象の原音声から推定された所定の音声合成パラメータを生成する音声生成モデルと、一連の音声合成記号入力から生成された音声生成モデルとの間で定義される、所定の誤差尺度が小さくなるように音声生成モデルを修正する情報で構成される。 (もっと読む)


【課題】利用可能なデータサイズや通信ビットレートが非常に限られた環境で、原音声の特徴をより再現して合成する。
【解決手段】一連の音声合成用情報に基づき音声を合成する音声合成装置であって、音声合成用情報は、対象声質に関係なく音声を合成するための共通情報と、所定の声質を音声合成する場合に機能する修正情報で構成され、音声合成装置は、所定の声質の音声を合成する場合、共通情報の内容を修正情報に基づき変更する修正手段と、前記修正された情報に基づき音声波形を合成する音声合成手段とを備える、さらに共通情報に基づき音声波形生成のための制御指令を生成する制御指令生成手段と、所定の声質の音声を合成する場合、修正情報に基づき生成された制御指令を修正する制御指令修正手段と、修正された制御指令に基づき音声波形を生成する音声波形生成手段とを備える。 (もっと読む)


【課題】応答性の低下を抑制しつつ、音声データを記憶する記憶部を小型化することができる音声出力装置を提供すること。
【解決手段】案内機能処理部111は、地図データ入力器30からのデータに基づいて、案内経路G上における発声地点を予め検出して、検出された発声地点に関連付けられたIDの音声データの発声準備を音声出力機能処理部112に対して要求する(ステップS10〜ステップS12)。次に、音声出力機能処理部112は、そのIDの音声データをHDD70からロードするようにHDDデータ管理部113に対して依頼する(ステップS13)。HDDデータ管理部113は、そのIDの音声データをHDD70からロードする(ステップS15)。そして、音声データデコード部114は、HDD70からロードした音声データをデコードして、そのデコードされた音声データをRAM12に記憶しておく(ステップS16)。 (もっと読む)


【課題】 音素ごとの特徴に応じて異なる処理を行い、各音素の特徴を十分に表現した音声合成を行うことが可能な音素符号補正装置、音素符号データベース、および音声合成装置を提供する。
【解決手段】 母音、子音、長音、促音、拗音等の音素の種別に応じて、合成の手法を変化させる。母音の場合(a)、母音を構成する第1和音を発音する。子音の場合(b)、子音を構成する第1和音、第2和音を発音する。長音の母音の場合(c)、母音を構成する第1和音の発音時間を延長する。長音の子音の場合(d)、子音を構成する第2和音の発音時間を延長する。 (もっと読む)


【課題】来店者に飽きられないように、商品を宣伝する音声情報を再生することを可能とし、もって宣伝対象の商品に対する集客力や購買意欲を高めることを可能とする音声情報生成装置、音声情報再生装置、サーバ装置及び音声情報再生システム等を提供する。
【解決手段】宣伝音声情報の生成に用いられる音声情報である部分音声情報を複数取得する取得手段と、部分音声情報の音声が示す内容の種類毎に当該部分音声情報を少なくとも1つずつ選択する選択手段と、選択手段によって選択された複数種類の部分音声情報を接続して宣伝音声情報を生成する生成手段と、を備え、選択手段は、少なくとも1種類については、前回選択した部分音声情報とは内容が異なる部分音声情報を選択する。 (もっと読む)


【課題】音声メッセージを単語や文節に基づいて分割した音声データを組み合わせて音声メッセージを再生する場合において、音声再生コマンドにより分割した音声データの再生順序を指定せずに音声再生を行う音声再生装置、集積回路装置、電子機器を提供すること。
【解決手段】少なくとも1つの入力ピンを有する音声再生装置10は、前記入力ピンからの入力情報に基づいてフレーズの音声情報の再生順序に関するシーケンス情報44を選択するシーケンス情報選択部20と、選択された前記シーケンス情報44に従って前記フレーズに対応する音声情報に基づいて音声を再生する音声再生部30とを含む。 (もっと読む)


【課題】キャラクタ音声データに不足部分があっても音声案内を実行できるようにする。
【解決手段】ナビゲーションシステムは、標準音声データ記憶手段とキャラクタ音声データ記憶手段とを含み、標準単位音声データおよびキャラクタ単位音声データはそれぞれ識別子に対応付けられて蓄積された音声データ記憶手段317を備え、案内経路データは案内ポイント毎に該案内ポイントにおける案内音声を出力するための単位音声データの識別子情報を含み、キャラクタ音声データによる案内音声出力が選択された場合、音声データ不足判別手段214は、識別子を含む案内経路データに基づいて、案内ポイントにおけるキャラクタ単位音声データの不足分の有無を判別し、不足がある場合、キャラクタ音声データ編集手段220はキャラクタ単位音声データのみに基づいて案内経路データを編集し、音声案内出力手段221は編集された案内経路データに基づいて音声出力する。 (もっと読む)


【課題】素片接続方式の音声合成において、データベース化する素片の数が従来よりも少なくしても自然な音声を合成できるようにする。
【解決手段】曲を構成する音符とその歌詞を示す歌詞データとを示す曲データに基づき、その曲の歌唱音声を合成するのに用いる複数の音声素片、それらの発生時刻、その歌唱音声のピッチを指定する歌唱合成スコア(音声合成指示)を生成する。そして、歌唱合成スコアにより指定される音声素片が無声化母音を含むものである場合には、音声合成の対象言語の母音にうちの予め定められたものの無声発音の波形を、当該母音を有声発音した音声素片のスペクトルエンベロープと同様なスペクトルエンベロープを有するものに変換し、この変換後の波形を前記無声化母音を含む音声素片の波形として歌唱音声の合成に使用する。 (もっと読む)


71 - 80 / 315