説明

国際特許分類[G10L13/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | テキストから音声を合成するための,テキストの分析,またはパラメータの生成,例.表記素から音素への変換,韻律の生成または強勢またはイントネーションの決定 (495)

国際特許分類[G10L13/08]に分類される特許

101 - 110 / 495


【課題】 合成音声の音質向上を容易にする。
【解決手段】 本発明は、声質変換装置に関する。そして、声質変換装置は、複数の原音話者の音声に基づく合成単位データを、組み合わせた変換対象合成音声データを保持する手段と、変換対象合成音声データを構成する合成単位データのそれぞれについて、少なくとも声質を、所定の変換対象話者の声質に変換する手段と、合成単位データの声質の変換に用いる変換パラメータを、原音話者ごとに保持する手段とを有することを特徴とする。 (もっと読む)


【課題】 五線譜に変換した際に、演奏者が楽器で演奏可能な程度に簡略化された符号データを基本とした音声合成機能の実現にあたり、各話者の声質に依存しない音素符号を得ることが可能であるとともに、音声再生品質の明瞭性の改善が可能な音素符号変換装置、音素符号データベース、音声合成装置を提供する。
【解決手段】 符号コード群として構成される音節符号を読み込み、各音高ごとに発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積で与えられるエネルギー値の総和であるエネルギー総和値を算出し、複数の音節符号間で、各音高ごとに全てのエネルギー総和値を乗算して統合エネルギー値を算出し、統合エネルギー値が高い上位の音高を抽出し、各音高に対応する強度、開始時刻、終了時刻を設定して音素符号を得る。音節符号としては、各音節を話者の人数分用意しておき、統合エネルギー値の算出の際、異なる話者同士の音節符号について、音高の補正を行いながら乗算を行なう。 (もっと読む)


【課題】コンテンツの読み上げ順序を視覚化するための技術を提供する。
【解決手段】読み上げ順序を視覚化するための視覚化装置は、読み上げ対象となる文字列を有する複数の要素の各々について、文字列の書字方向に基づいて、文字列が画面に表示される領域である要素領域を表示位置とし、かつ書字方向を示す有向線分を生成する有向線分生成部と、読み上げの順序で、生成した各要素の有向線分を記憶する記憶手段と、読み上げの順序に従って、各要素に対し生成された有向線分を連結し、画面に表示されている構造化文書に重ねて表示するオーバレイ描画部とを含む。 (もっと読む)


【課題】利用者がよく利用する読み方によって地点名を読み上げる端末を提供する。
【解決手段】複数の単語を読み上げる複数の音声読み上げ端末と、ネットワークを介して前記音声読み上げ端末と接続される読み情報更新サーバとを備える音声読み上げシステムであって、前記音声読み上げ端末は、前記単語と、前記単語に指定される読みとの組み合わせを保持し、前記組み合わせを、前記読み情報更新サーバに送信し、前記読み情報更新サーバは、複数の前記音声読み上げ端末から送信された、複数の前記組み合わせとを保持し、前記組み合わせとを更新し、前記更新された組み合わせを前記音声読み上げ端末に送信し、前記音声読み上げ端末は、保持された前記組み合わせを、前記送信された組み合わせによって更新し、前記更新された組み合わせに基づいて、前記単語を読み上げる。 (もっと読む)


【課題】音素に依存したピッチ変動を加味しつつ歌唱者毎のメロディの歌いまわしに表れる歌唱表現を的確にモデル化し、より自然に聴こえる歌唱音声の合成を可能にする技術を提供する。
【解決手段】歌唱音声の基本周波数の時間変化をメロディに依存したメロディ依存成分と音素に依存した音素依存成分とに分離し、成分毎にモデル化して歌唱合成用データベースに格納する。歌唱合成の実行段階では、歌唱合成用スコアの示す音符の配列と上記メロディ依存成分モデルとにしたがって、メロディの基本周波数の時間変化を表すピッチカーブを合成し、歌詞を構成する音素の区間毎にその音素に対応する音素依存成分モデルを利用して上記ピッチカーブを補正する。 (もっと読む)


【課題】所望の特定話者の声を有した合成音声を出力可能にし、かつ口調も選択可能にした音声合成装置を提供する。
【解決手段】基準話者の声質および口調の情報を有するHMMパラメータが格納された基準話者データベース14を備える。話者適応部21は、音声入力手段35から入力された特定話者の音声データを用いて話者適応を行い、基準話者データベース14のHMMパラメータを変換して特定話者データベース15に格納する。話者選択手段32は、基準話者データベース14と特定話者データベース15とから話者を選択する。口調のHMMパラメータは、基準話者データベース14に格納されている口調の情報から生成される。波形生成部12は、話者選択手段32により選択された話者のHMMパラメータと口調選択手段33により選択された口調のHMMパラメータとを用いて合成音声を出力する。 (もっと読む)


【課題】テキストの内容にかかわらず口調の選択を可能にした音声合成装置を提供する。
【解決手段】基準話者について異なる口調の情報を有するHMMパラメータが格納された複数個の基準話者データベース14a,14bを備える。波形生成部12は、口調選択手段33により選択された口調のHMMパラメータを格納した基準話者データベース14a,14bを選択し、選択した基準話者データベース14a,14bに格納されたHMMパラメータを用いて合成音声を出力する。 (もっと読む)


【課題】入力音声のアクセント型を正確に判定する。
【解決手段】入力音声から基本周波数の変化パターンであるF0変化パターンを抽出すると共に、入力音声の各モーラに同期した時刻情報であるモーラ同期情報を入力する。次に、F0変化パターンのモーラ毎にモーラ代表値を求め、このモーラ代表値を基準とした後方に隣接するモーラのモーラ代表値との変化量であるモーラ変化量をそれぞれ算出する。そして、モーラ変化量が最も小さい負の値を持つモーラを検出し、そのモーラに係るモーラ変化量である変化量最小値が、アクセント型0型を判定するための第1の閾値より大きい場合は0型と判定し、第1の閾値よりも小さい場合は、変化量最小値を持つモーラより前方のモーラのモーラ変化量を連続して探索し、モーラ変化量がアクセント型0型以外を判定するための第2の閾値よりも小さい一番前方のモーラを検出してアクセント型を判定する。 (もっと読む)


【課題】利用者によって新たに作曲された楽曲であっても、他の端末にて再生することを可能とするデータ集配システム、及び通信カラオケシステムの提供
【解決手段】クライアント装置10は、使用者が歌唱することで入力された音声を採譜して、部分楽曲データを生成してサーバ装置30に出力する。この部分楽曲データを取得したサーバ装置30は、部分楽曲データに付加楽曲データを追加して楽曲データを完成させた後、カラオケ楽曲データ(作成楽曲データ)を生成して、記憶装置に格納する。そして、サーバ装置30に公開指令が入力されると、サーバ装置30では、公開指令にて指定された作成楽曲データをカラオケサーバ45に出力する。そして、使用者が、演奏開始を指定すると、カラオケ端末48では、作成楽曲データ中の楽曲データに対応する楽曲の再生演奏が開始される。 (もっと読む)


【課題】 五線譜に自動変換した際に、演奏者が楽器で演奏可能な程度に簡略化された符号データ(MIDIデータ等)を基本として音声合成機能を実現する場合において、作業負荷を軽減するとともに、音声再生品質の明瞭性を改善することが可能な音素符号変換装置、音素符号データベース、および音声合成装置を提供する。
【解決手段】 符号コード群として構成される音節符号を読み込み、各音高ごとに発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積で与えられるエネルギー値の総和であるエネルギー総和値を算出し、複数の音節符号間で、各音高ごとに全てのエネルギー総和値を乗算して統合エネルギー値を算出し、統合エネルギー値が高い上位の音高を抽出し、各音高に対応する強度、開始時刻、終了時刻を設定して音素符号を得る。 (もっと読む)


101 - 110 / 495