説明

国際特許分類[G10L13/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 合成音作成の方法;音声合成器 (464)

国際特許分類[G10L13/02]の下位に属する分類

国際特許分類[G10L13/02]に分類される特許

71 - 80 / 365


【課題】取り扱われる文書データについて充分なセキュリティ性を確保した音声合成機能付き文字情報表示装置、およびその音声合成方法を提供する。
【解決手段】表示部16に表示中のWeb情報に含まれる表示オブジェクトを音声に変換する際に、音声に変換する表示オブジェクトに対応する表示規定を参照し、所定の表示規定(パスワードボックス表示規定、不可視表示規定など)の場合には当該表示オブジェクトに含まれる第1の文字列を音声変換せず、所定の表示規定でない場合には前記第1の文字列を音声変換するように音声合成処理部17を制御する制御部19を有する。 (もっと読む)


【課題】情報データの取得状況の把握を容易にする情報受信通知装置及び情報受信通知方法を提供する。
【解決手段】情報受信通知装置1は、情報データを変調して生成された可聴音域の変調信号と、音声信号とが合成された合成音声を受信して、合成音声に含まれる変調信号を復調して情報データを取得する装置において、情報データの取得状況を判断するデータ取得状況判断部14と、データ取得状況判断部14が判断した取得状況が所定の取得状況に該当するときに、所定の通知音を出力する通知音出力部25とを備えることを特徴とする。このため、ユーザは、容易に情報データの取得状況を把握することができる。 (もっと読む)


【課題】所望の時間長に適応する入力テキストの量をユーザが直感的にわかるような合成音声テキスト入力装置を提供する。
【解決手段】合成音声テキスト入力装置1は、合成音声合成する音声をおさめる時間である設定時間長と、合成音声のテキストとの入力を受付ける入力部101と、入力部101で入力された合成音声の設定時間長を基に、当該設定時間長の合成音声として入力可能なテキストの量を算出するテキスト量計算部105と、入力部101が前記合成音声のテキストを受付ける際に、テキスト量計算部105で算出されたテキストの量を出力するテキスト量出力部104とを備える。 (もっと読む)


【課題】本発明は記憶ユニット、テンポユニット、入力装置、及び処理ユニットを備える歌声合成システムを提供する。
【解決手段】記憶ユニットは少なくとも1つの一旋律を記憶し、テンポユニットはテンポを指示し、入力装置は複数の音声信号を受信し、処理ユニットは音声信号に処理を行って合成歌声信号を生成する。 (もっと読む)


【課題】楽曲の進行に沿った様々な時点で多彩な音声を出力すること。
【解決手段】楽曲の進行に沿った1以上の時点又は1以上の期間の特徴を定義する楽曲進行データを取得するデータ取得部と、前記データ取得部により取得される前記楽曲進行データを用いて、前記楽曲の再生中における音声を出力すべき出力時点を決定する決定部と、前記楽曲の再生中に、前記決定部により決定される前記出力時点において前記音声を出力する音声出力部と、を備える音声処理装置を提供する。 (もっと読む)


【課題】コンテンツの読み上げ順序を視覚化するための技術を提供する。
【解決手段】読み上げ順序を視覚化するための視覚化装置は、読み上げ対象となる文字列を有する複数の要素の各々について、文字列の書字方向に基づいて、文字列が画面に表示される領域である要素領域を表示位置とし、かつ書字方向を示す有向線分を生成する有向線分生成部と、読み上げの順序で、生成した各要素の有向線分を記憶する記憶手段と、読み上げの順序に従って、各要素に対し生成された有向線分を連結し、画面に表示されている構造化文書に重ねて表示するオーバレイ描画部とを含む。 (もっと読む)


【課題】 ドットパターンと音声データとの対応付け、および音声データの再生を実現する。
【解決手段】 第1の携帯電話端末に設けられたマイクを通じて音声を入力するステップと、ドットパターンが印刷された媒体面を撮影するステップと、撮影画像から得られたドットコード番号と音声データとを対応付けて関連情報を生成するステップと、ドットコード番号と、音声データと、関連情報とを第1の携帯電話端末の記憶手段に記憶するステップと、それらを第2の携帯電話端末の記憶手段に転送するステップと、第2の携帯電話端末のカメラによってドットパターンが撮影されたときに、撮影画像から得られたドットコード番号に基づいて第2の携帯電話端末の記憶手段の関連情報を検索し、対応付けられた音声データを記憶手段から読み出して再生するステップとからなる、媒体面のドットパターンに関連付けた音声データの入力・再生方法とした。 (もっと読む)


【課題】メロディの歌いまわしに表れる歌唱者固有の歌唱表現を的確にモデル化することを可能にする技術を提供する。
【解決手段】歌唱曲の歌唱音声を表す波形データを解析し、その歌唱音声にてメロディを表していると推測される基本周波数の時間変動を表すメロディ成分データを生成する。次いで、上記歌唱曲の楽譜を表すスコアデータとメロディ成分データとを用いた機械学習により、上記歌唱音声における音符間の基本周波数の時間変動のうちメロディを表していると推測される変動成分を表現するメロディ成分モデルを音符の組み合わせ毎に生成し、そのメロディ成分モデルを規定するパラメータとそのメロディ成分モデルにより基本周波数の時間変動が表される音符の組み合わせを示す音符識別子とを対応付けてピッチカーブ生成用データベースに格納する。 (もっと読む)


【課題】情報を音声で提示する際に、音声合成によるユーザの待ち時間の発生を有効に防止できる情報提示装置を提供する。
【解決手段】ユーザに提示するための複数の情報を取得する手段と、情報から音声データを生成するのに要する時間である生成時間を算出する手段と、情報に基づいて生成される音声データを音声出力するのに要する時間である音声出力時間を算出する手段と、音声出力時間と、算出された生成時間とに基づいて、情報から音声データを順次生成し、かつ、生成した音声データを順次出力するための処理順序を設定する手段とを、有する情報提示システムであって、設定手段は、処理順序を設定するに際し、処理順序が既に設定された情報についての音声データの生成および出力が全て終了するよりも前に、音声データを生成できる情報を、処理順序が既に設定された情報に続いて音声データを生成し、出力するための情報として設定する情報提示システム。 (もっと読む)


【課題】楽曲等のリズムに合わせて、アクセントを有する英単語等の語と、当該語に対応する日本語訳等の語とを、学習者が確実に効率よく記憶することができる音声情報を配信する。
【解決手段】拍子の拍のタイミングで発音されるリズム音の情報と、ペア語の情報と、に基づいて、同一又は互いに異なる複数のペア語とリズム音とが発音され、且つ、第1の語のアクセントの発音タイミングが拍のタイミングに合わせて第1の語と第2の語とが交互に発音されるように構成された記憶用音声情報を生成し、生成された記憶用音声情報を記憶し、記憶された記憶用音声情報を端末装置に送信し、第2の語の発音終了から当該第2の語の次に発音される第1の語の発音開始までの間隔が所定時間以上になるように、間隔が所定時間未満となる第1の語のアクセントが拍のタイミングからずれて発音される記憶用音声情報を生成する。 (もっと読む)


71 - 80 / 365