説明

国際特許分類[G10L13/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 音声合成器で使われる音声素片;結合規則 (315)

国際特許分類[G10L13/06]に分類される特許

81 - 90 / 315


【課題】素片接続方式の音声合成において、データベース化する素片の数が従来よりも少なくしても自然な音声を合成できるようにする。
【解決手段】曲を構成する音符とその歌詞を示す歌詞データとを示す曲データに基づき、その曲の歌唱音声を合成するのに用いる複数の音声素片、それらの発生時刻、その歌唱音声のピッチを指定する歌唱合成スコア(音声合成指示)を生成する。そして、歌唱合成スコアにより指定される音声素片が無声化母音を含むものである場合には、音声合成の対象言語の母音にうちの予め定められたものの無声発音の波形を、当該母音を有声発音した音声素片のスペクトルエンベロープと同様なスペクトルエンベロープを有するものに変換し、この変換後の波形を前記無声化母音を含む音声素片の波形として歌唱音声の合成に使用する。 (もっと読む)


【課題】素片接続方式の音声合成において、データベース化する素片の数が従来よりも少なくしても自然な音声を合成できるようにする。
【解決手段】曲を構成する音符とその歌詞を示す歌詞データとを示す曲データに基づき、その曲の歌唱音声を合成するのに用いる複数の音声素片、それらの発生時刻、その歌唱音声のピッチを指定する歌唱合成スコア(音声合成指示)を生成する。そして、データベース化された音声素片のうちから歌唱合成スコアにより指定されるものを選択する際に、無声摩擦音から無音への遷移部分を示す音声素片については、無音から当該無声摩擦音への遷移部分の音声素片を選択し、その音声素片の波形に時間反転を施して歌唱音声の合成に使用する。 (もっと読む)


【課題】ピッチ変動が顕著なピッチ部分系列データを削除した音声合成辞書を生成することにより、合成音声が不自然なものとならないようにする。
【解決手段】ピッチ系列データ抽出部220は、音声データベース201から取り出した音声データからピッチ系列データを抽出する。音素切り出し部225は、抽出されたピッチ系列データから音素毎のピッチ部分系列データを切り出す。ピッチデータ評価部230は、各ピッチ部分系列データのピッチ変動が顕著でないか判定する。ピッチデータ編集部240は、ピッチ変動が顕著なピッチ部分系列データを削除する。その後、音素HMM学習部250は、音素ラベルと音素ピッチデータとの対応関係を求める。データ書き出し部260は、学習後の音素ラベルと音素ピッチデータとの対応関係を音声合成辞書202に書き込む。 (もっと読む)


【課題】顕著な音質変動をもたらす音声合成辞書を構築する可能性のあるメルケプストラム部分系列データを削除して、合成音声が不自然なものとならないようにする。
【解決手段】メルケプストラム系列データ生成部220は、音声データからメルケプストラム系列データを生成する。音素切り出し部225は、メルケプストラム系列データから音素毎のメルケプストラム部分系列データを切り出す。メルケプストラムデータ評価部230は、各メルケプストラム部分系列データが顕著な音質変動をもたらす音声合成辞書を構築する可能性のある音声特徴量数値に達しているかを判定する。メルケプストラムデータ編集部240は、メルケプストラム部分系列データを削除する。その後、音素HMM学習部250は、音素ラベルと音素メルケプストラムデータとの対応関係を求める。データ書き出し部260は、その対応関係を音声合成辞書202に書き込む。 (もっと読む)


【課題】音声データを効率よく収集することのできる情報収集装置、その方法およびそのプログラムを提供すること。
【解決手段】サービス提供サーバ100は、認証を行うとともに、画像表示されたテキストに対する音声データを収集する機能を有する。記憶手段として、音声情報データベース101と、音声候補データベース102と、検索履歴データベース103と、を備えている。また、演算処理手段として、音声入力要求手段110と、画像変換手段120と、音声情報取得手段130と、音声認識手段140と、登録判定手段150と、音声登録手段160と、サービス提供判断手段170と、サービス提供手段180と、テキスト抽出手段190と、を備えている。 (もっと読む)


【課題】追加する音声データを少量にし、補強後の音声データベースを用いた音声合成による合成音声の品質を向上させる。
【解決手段】音声データベースを用いて合成対象テキストに含まれる各テキストについて音声合成を行うことで、合成音声を出力し、大規模テキストから合成対象テキストを検索し、検索された共通テキストと対応する音声データを大規模音声データから取り出し、照合音声として求め、合成音声と照合音声との歪み値を合成単位ごとに計算し、予め定められた閾値より歪み値が高い高歪み値合成単位の高歪み値属性値が示された収録重要度リストを作成し、収録候補テキストから、高歪み値属性値を含む収録テキストを取り出し、出力する。 (もっと読む)


【課題】音声データの再生開始時及び再生停止時におけるポップノイズを低減する。
【解決手段】デジタル信号のフェードインデータ及びフェードアウトデータが予めROM60に格納されると共に、デジタル信号の音声データがメモリ50に格納されている。音声LSI30において、MCU40による再生開始時、DAC74により、前記フェードインデータをアナログデータに変換して前記フェードインデータを再生する。前記フェードインデータの再生後、DAC74により、前記音声データをアナログデータに変換して前記音声データを再生する。更に、前記音声データの再生後の停止時に、DAC74により、前記フェードアウトデータをアナログデータに変換して前記フェードインデータを再生する。 (もっと読む)


【課題】データベースを簡素化しつつも自然な合成音声を得る。
【解決手段】文単位またはフレーズ単位で複数の話者により生成された多数話者音声データベース17と、音声合成対象となるテキスト文を入力して、入力されたテキスト文を文単位またはフレーズ単位で解析するテキスト解析部3と、このテキスト解析部3により解析された文単位毎またはフレーズ単位毎に、前記多数話者音声データベース17を切り替えて合成音声を生成する際、音声合成を行う文またはフレーズと一致する音韻を持つ音声データベース17の中から直前に音声合成した文またはフレーズで用いた音声データベース17に最も近い特性を持つ音声データベースを用いて合成音声を生成する。 (もっと読む)


【課題】発声者の発声量を増やすことなく、発声者の声質変化の自動判定を可能にする。
【解決手段】声質変化判定装置1は、基準特徴量と基準テキストとを記録する基準データ記録部7にアクセス可能であり、発声者の音声を入力する音声入力部2と、入力音声に対応するテキストを入力するテキスト入力部3と、入力音声の特徴量を算出する特徴量算出部4と、入力テキストと基準テキストとが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、入力音声の声質変化を判定する声質判定部5と、声質判定部5が、声質変化は許容範囲内であると判定した入力音声に対応するテキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として基準データ記録部7に記録する基準登録部6とを備える。 (もっと読む)


【課題】特定個人に似顔、似声により情報を伝達する人型ロボットにおいて、音声を発する際の動きのなかに、特定の話者の個性を表現することにより、話者が伝達しようとする愛情などを演出できる人型ロボットを提供する。
【解決手段】特定個人に似顔のロボット本体(1)の内部に搭載したストレージ(3)にあらかじめ特定個人の声を収録し発話するために必要となる五十音等の音素データや特定個人の癖となる動作データ等を登録し、発話時にその音声を制御部(2)内のメインCPUユニット(211)により合成して、スピーカ(26)より出力し、同時にアクチュエータ(9)〜(25)を四肢動作させる。 (もっと読む)


81 - 90 / 315