説明

国際特許分類[G10L13/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | テキストから音声を合成するための,テキストの分析,またはパラメータの生成,例.表記素から音素への変換,韻律の生成または強勢またはイントネーションの決定 (495)

国際特許分類[G10L13/08]に分類される特許

71 - 80 / 495


【課題】音声波形の尤度を最大化するように、複数の音響モデルパラメータが複数の励振モデルパラメータと一緒に推定される音声合成方法を提供する。
【解決手段】テキスト入力を受けており、前記テキスト入力に対応する音声を確率論的モデルを使用して出力し、前記確率論的モデルは音響モデル及び励振モデルを具備し、前記音響モデルは単語または単語の部分を特徴に関連づける複数の確率分布を記述する複数のモデルパラメータを有し、前記励振モデルは、前記特徴を使用して前記音声を出力するために、声帯及び肺をモデル化するために使用される励振モデルパラメータを具備し、ここで音響パラメータ及び励振パラメータは一緒に推定され、前記音声を出力することを具備する。 (もっと読む)


【課題】使用者の利便性を高める文字変換装置、文字変換システム、文字変換方法およびプログラムを提供する。
【解決手段】文字変換装置は、所定の単語と、その所定の単語の類義語と、を互いに関連付けて記憶する記憶部と、文書を受け付けると、文書に含まれる構成単語を検出する検出部と、検出手段にて検出された構成単語が、記憶部内の類義語と一致する場合には、その構成単語を、所定の単語に変換する変換部と、を含む。 (もっと読む)


【課題】 話者が音声入力に用いる入力手段に関わらず、話者の特性に応じた応答音声信号を出力することができる音声応答装置を提供する。
【解決手段】 本発明は、ユーザの発話に基づく入力音声信号の発話内容に応答する応答音声信号を出力する音声応答装置に関する。そして、本発明の音声応答装置は、1又は複数の判定項目の各パラメータに対応する判定用発話特徴データを記憶する手段と、ユーザ発話特徴データを抽出する手段と、抽出したユーザ発話特徴データとそれぞれの判定用発話特徴データとを照合し、ユーザが、それぞれの判定項目について、いずれのパラメータに対応するかを判定する手段と、判定結果に対応する発話特徴を備える応答音声信号を保持する手段とを有することを特徴とする。 (もっと読む)


【課題】
合成音声において、自然な発話にとどまらず、作品の特徴や話者の個性や感情を表現する音声合成装置の実現することが、本発明の課題である。
【解決手段】
合成音声において、自然な発話にとどまらず、作品の特徴や話者の個性や感情を表現する音声合成装置を実現するために、音律や抑揚によるパターン化などの試みが始まっているが、それらに欠落しているもので、かつ、作品の特徴や話者の個性や感情を表現する上で重要な役割を果たしている呼気段落をパラメータとして取り込む。そのために、呼気段落における語数、継続時間、話速、そして内容に関するデータベースから、作品の特徴や話者の個性や感情に応じた呼気段落制御関数を構築し、それを組み込んだ音声合成装置を手段とする。 (もっと読む)


【課題】基本周波数パラメータの計算精度が不充分な場合に、学習音声との間で生じる基本周波数分布のずれを低減する。
【解決手段】音声合成装置100は、一連の単位音声列に含まれる単位音声の種類を記述する音声合成用情報から合成音声波形を生成し、与えられた音声合成用情報に基づき、第1の特徴ベクトルの分布情報を用いて、第1の基本周波数時系列データを予測して生成する第1の基本周波数時系列データ生成部134と、与えられた音声合成用情報に基づき、基準となる第2の特徴ベクトルの分布情報を用いて、第2の基本周波数時系列データを予測して生成する第2の基本周波数時系列データ生成部135と、第2の基本周波数時系列データを用いて、第1の基本周波数時系列データを修正する基本周波数時系列データ修正部136とを備え、修正された第1の基本周波数時系列データに基づく合成音声波形を生成する。 (もっと読む)


【課題】画一的な操作により音声の曖昧さを制御することができる音声合成装置を提供する。
【解決手段】レゾナンス変換器22は、第1および第2のターゲットレゾナンス周波数を成分とするターゲットレゾナンスベクトルと、合成すべき音素における第1および第2のレゾナンス周波数を成分とするレゾナンスベクトルとを取得し、レゾナンスベクトルをターゲットレゾナンスベクトルに向けて明瞭度データに応じた量だけ変位させたベクトルの成分である第1および第2の合成用レゾナンス周波数を求める。調和成分生成器23は、第1および第2の合成用レゾナンス周波数においてレゾナンス曲線がピークとなる調和成分波形データを合成する。 (もっと読む)


【課題】自然性の高い肉声韻律パターンを生成し出力する韻律パターン生成装置を得る。
【解決手段】音声データからピッチ情報を抽出し、当該ピッチ情報をテキストデータに対応付けた肉声ピッチ情報を生成する肉声ピッチ情報抽出部21と、複数のピッチパターンを格納したピッチパターン辞書23から肉声ピッチ情報の部分あるいは全体に類似したピッチパターンを1つ以上検索して類似ピッチパターンとして出力する類似ピッチパターン検索部22と、類似ピッチパターンをユーザが認識可能な形式に変換して提示し、ユーザに類似ピッチパターンの選択を要求する類似ピッチパターン提示部24と、ユーザ選択した類似ピッチパターンを出力するピッチパターン出力部25を備える。 (もっと読む)


【課題】小売店等において、外国人店員の作業効率を向上することができる音声出力装置、音声出力装置の制御方法、印刷装置および装着ボードを提供する。
【解決手段】プリントデータを取得するデータ送受信部191と、データ送受信部191により取得したデータの少なくとも一部のデータを解析し、テキストデータに変換するデータ解析部193と、テキストデータを、予め指定した1以上の言語に変換する言語変換部194と、言語変換部194により言語変換したテキストデータに対応した1以上の合成音声データを生成する音声合成部195と、音声合成部195により生成した1以上の合成音声データを、ヘッドフォン104に対して出力する音声データ出力部196と、を備える。 (もっと読む)


【課題】安定して自然な韻律になる韻律情報を作成する韻律作成装置及び韻律作成方法を提供する。
【解決手段】複数の韻律特徴のパターンをそれぞれ示す詳細韻律情報103を予め記憶する詳細韻律情報記憶部2から、入力言語情報101を基に作成された代表韻律情報102と詳細韻律情報103とを参照して、当該代表韻律情報102に類似した詳細韻律情報103を選択する。 (もっと読む)


【課題】姿勢に応じて、違和感のない自然な音声を出力する。
【解決手段】ロボット4は、基体(基体41)に可動連結した可動部(例えば、頭部42)の駆動を制御する駆動制御手段(制御部100)と、音声を生成する音声生成手段(音声生成部110)と、前記音声生成手段において生成された音声を出力する音声出力手段(音声出力部140L、140R)とを有し、前記音声生成手段は、前記駆動制御手段によって制御される前記可動部の前記基体に対する姿勢に基づいて、生成する音声を補正する。 (もっと読む)


71 - 80 / 495