説明

国際特許分類[G10L13/06]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 音声合成器で使われる音声素片;結合規則 (315)

国際特許分類[G10L13/06]に分類される特許

101 - 110 / 315


【課題】本発明は、演算量が少なく、簡易な構成で音声合成用の読上げ文章を生成できる音声合成用読上げ文章生成装置を提供することを目的とする。
【解決手段】音声合成用読上げ文章生成装置1は、グラフ入力手段11と、DPマッチング法によって、統合グラフTを生成する統合グラフ生成手段12と、ノードNの通過回数をノードNに対応するリストLが格納した語句の個数以上とする第1の条件式及びノードN間の接続関係に基づいて、第2の条件式を生成する条件式生成手段13と、第1の条件式及び第2の条件式を満たすように、文章の先頭における通過回数が最小になる最小通過回数をシンプレックス法で算出する最小通過回数算出手段14と、最小通過回数と等しい数、リストLに格納した語句の組み合わせを変えて読上げ文章を生成する読上げ文章生成手段15と、を備える。 (もっと読む)


【課題】グラフにおけるノードの通過回数を安定に求め、かつ、通過回数を決定する処理の処理時間を低減する。
【解決手段】ノード通過回数決定装置10は、有向グラフと各ノードに与えられた最小通過回数とを受け付ける入力部30と、有向グラフの分岐の開始を判定する分岐開始判定部51と、有向グラフの分岐のマージを判定する分岐マージ判定部52と、有向グラフの分岐状態と最小通過回数とに基づいてルートノードの通過回数を最小にするように各ノードの通過回数を始点から終点に向けて逐次的に暫定値として決定し、ルートノードの通過回数を確定するルートノード通過回数決定部53と、分岐前後の差分値を共用通過回数として記憶部40に保持して管理する共用通過回数管理部55と、有向グラフの分岐状態と通過回数の暫定値とルートノードの通過回数とに基づいて各ノードの通過回数を終点から始点に向けて逐次的に確定するトレースバック部56とを備える。 (もっと読む)


【課題】ユーザの音声を好適に取得することができる音声合成モデル生成装置、音声合成モデル生成システム、通信端末、及び音声合成モデル生成方法を提供する。
【解決手段】音声合成モデル生成システム1は、移動通信端末2と、音声合成モデル生成装置3とを含んで構成されている。移動通信端末2は、入力された音声から音声の特徴量を抽出する特徴量抽出部201、及び音声からテキストデータを取得するテキストデータ取得部202を備えている。音声合成モデル3は、学習情報取得部200によって取得された特徴量及びテキストデータに基づいて、音声合成モデルを生成する音声合成モデル生成部301と、特徴量及びテキストデータに基づくパラメータに基づいて画像情報を生成する画像情報生成部307と、画像情報を移動通信端末2に送信する情報出力部309を備えている。 (もっと読む)


【課題】より自然で高音質な合成音声を生成することができる音声合成装置を提供する。
【解決手段】ピッチ波形生成情報に基づいて、ピッチマークに対応する1フレーム分のホルマントパラメータ群を選択するホルマントパラメータ選択部42と、ホルマント周波数及びホルマント位相にしたがって正弦波を生成する正弦波生成部43,44,45と、ピッチ波形のスペクトルにおける各ホルマントのピークのパワーと、前記各ホルマントのそれぞれと隣接するホルマントとのホルマント境界におけるパワーとの比を求めるスペクトル情報算出部49とを有し、前記比が大きいときは、窓関数の帯域を広げ、正弦波にこの広げた帯域の窓関数を掛けることによりホルマント波形を生成し、これらホルマント波形の和によってピッチ波形を生成する。 (もっと読む)


【課題】こもり感やブザー感が少なく、かつ人工的でない高音質な合成音声を生成できる音声処理装置を提供すること。
【解決手段】素片選択部43は、目標音声に係る音韻系列のセグメントごとに複数個ずつの音声素片を選択する。素片融合部44は、セグメントごとに該複数個の音声素片を融合して融合素片を生成する。フォルマント強調度合い推定部46は、セグメントごとに該複数個の音声素片に関する特徴量と融合素片に関する特徴量との少なくとも一方を用いてフォルマント強調の度合いを推定する。フォルマント強調フィルタ部45は、セグメントごとに融合素片に対して推定された強調度合い基づきフォルマント強調する。 (もっと読む)


【課題】電子機器等で出力予定の音声ガイドメッセージの編集からメモリ書き込み情報の作成までを自動化し、複数の音声ガイドメッセージの再生に必要十分な音声ファイルを効率よく生成する。
【解決手段】編集画面から入力されたセンテンスのテキストデータに基づき、センテンスを複数のフレーズに分割し、分割処理結果に基づきセンテンスを構成するフレーズとその再生順序を特定し、複数のセンテンスで使用されているフレーズまたは1つのセンテンスで複数回使用されているフレーズについては同じフレーズの音声データが重複して書き込まれないようにメモリへの格納対象フレーズを決定する。 (もっと読む)


【課題】違和感が軽減された高品質な合成音声を作成することのできる音声合成装置を提供する。
【解決手段】可変部用音声合成部5は、可変部テキスト10に対応する音片データを可変部用音声記憶部2から取得して可変部音声を合成する。韻律規則生成部7は可変部テキスト10または定型部テキスト20から規則ピッチを生成する。定型部音声合成部6は、定型部テキスト20に対応する句音声データを句音声記憶部3から取得し、可変部音声の韻律と滑らかに接続するように、句音声データのピッチを規則ピッチに近づけるように変形して定型部音声を合成する。音声接続部8は、可変部音声と定型部音声とを接続して合成音声9を出力する。 (もっと読む)


【課題】二次元コードに含まれる少ないデータ量の音声データを読み取って、肉声に模した音声を再生することができるようにした携帯電話機を提供する。
【解決手段】携帯電話機1は、二次元コードの読み取り機能を有し、音声二次元コードを含む二次元コードを読み取る読み取り手段20と、読み取った二次元コードを復号するデコード手段31と、デコード手段31が音声二次元コードを復号して得た音声データから音声を再生して出力する音声出力手段50とを備え、音声二次元コードは、音声を分析して母音と子音に分離した音声データを符号化して成るものである。 (もっと読む)


【課題】明瞭で自然性が高い合成音の生成を可能にする音声素片を音声素片辞書に登録することができるようにする。
【解決手段】入力テキスト及び韻律情報に基づき、音声素片辞書3に格納されている音声素片の中から対応する複数の音声素片を取り出し、複数の音声素片を組み合わせて複数の合成音を生成する合成音生成部6aと、合成音生成部6aにより生成された複数の合成音と入力テキストに基づく音声信号との間の誤差を評価し、当該評価結果に基づき代表音声素片を探索する音声素片探索部6bと、音声素片探索部6bにより探索された代表音声素片を音声素片辞書3に登録する音声素片登録部6cを備えた。 (もっと読む)


【課題】音声ガイドメッセージを発話させるための音声データファイルを効率よく編集、生成すること。
【解決手段】本システムは、辞書データ記憶部182と、前記辞書データに基づき、受け取ったテキストデータに対応した付加情報が含まれた付加情報付き音声データを生成する付加情報付き音声データ生成部120と、前記付加情報付き音声データに基づき、編集画面を表示して編集入力情報を受け付け編集処理を行う編集処理部130と、編集処理結果に基づきリスト情報の生成を行うリスト情報生成処理部132と、前記付加情報付き音声データに基づき、付加情報なし音声データを作成する付加情報なし音声データ作成部134と、前記リスト情報に基づき、音声データメモリへの格納対象となる格納対象フレーズを決定し、決定した格納対象フレーズに対応した付加情報なし音声データに基づきメモリ書き込み情報を生成するメモリ書き込み情報生成部136とを含む。 (もっと読む)


101 - 110 / 315