説明

国際特許分類[G10L13/04]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 合成音作成の方法;音声合成器 (464) | 音声合成システムの細部,例.合成器の構造またはメモリ管理 (99)

国際特許分類[G10L13/04]に分類される特許

1 - 10 / 99


【課題】
多言語の音声を出力する音声出力装置において、聞き手集団の使用言語を理解していないことに起因する、情報提供の無駄を軽減する。
【解決手段】
音声出力内容を入力する音声出力内容入力部と、前記音声出力内容に基づいて複数の言語から成る出力音声を生成する出力音声生成部と、周囲環境の音声を入力する環境音声入力部と、前記入力した音声の言語を認識し、言語の構成比を算出する言語構成比算出部と、前記言語構成比算出部で算出した言語構成比に応じて、出力する音声の構成を変更する音声出力構成変更部と、変更された音声を出力する音声出力部と、を有する。 (もっと読む)


【課題】 文字/音声変換の応答性を維持しつつコストダウンを図り、さらには、特徴のあるサービスを実現する。
【解決手段】音声変換支援装置はキャッシュデータ保存部、インデックス情報記憶部、検索部、データ処理部を備える。前記データ処理部は前記検索部による検索の結果、前記テキストデータが存在したインデックス情報により示される過去に使用された音声データを前記キャッシュデータ保存部から読み出して前記変換要求元へ返す一方、いずれのインデックス情報にも存在しない前記テキストデータを前記音声変換装置へ送り、前記音声変換装置により変換された音声データを前記要求元へ返す。 (もっと読む)


【課題】録音音声を極力使用して音声案内することができ、また、合成音声を使用する場合であっても、高品質の音声案内を実行可能にする。
【解決手段】車載装置2において、分割された単語あるいは文節に対応する録音音声データが記憶手段に存在するか否かを検索し、録音音声データがない単語あるいは文節については、外部サーバ装置4に送信して、録音音声データがサーバ側記憶手段に存在するか否かを検索し、検索された録音音声データを車載装置2へ送信し、検索手段により検索した録音音声データと外部サーバ装置4から受信した録音音声データとを接続し、接続した音声データを音声出力するように構成した。 (もっと読む)


【課題】サーバとの間の音声データの送受信によるネットワーク負荷を低減するための技術を提供すること。
【解決手段】音声データ通信システム1を、音声合成サーバ10と、メールサーバ20と、第1〜第nの情報処理装置30_1〜30_nとを含む構成とし、情報処理装置30において、テキストメールを音声変換対象情報と共に音声合成サーバ10に送信し、音声合成サーバ10において、受信したメールの文章を複数の文に分割し、各分割文データを音声合成処理によって音声データに変換し、これを圧縮等した分割音声ファイルを情報処理装置30に送信する。情報処理装置30は、最初の分割音声ファイルを受信すると、予め設定した送信タイミングで送信依頼情報を音声合成サーバ10に送信し、音声合成サーバ10は、送信依頼情報を受信するごとに、未処理の分割文データを1つずつ音声合成処理によって分割音声ファイルに変換し情報処理装置30に送信する。 (もっと読む)


【課題】現在、携帯型デバイスの処理電力と記憶容量の制限のために、低品質のTTS技術しか使用できないことがある。したがって、現在の携帯型デバイスの制限に対処できる方法で高品質TTS技術の適用を可能にする。
【解決手段】複雑性が低いデバイス内で高品質のテキスト音声(TTS)出力を提供するシステムおよび方法が開示される。TTS出力は複雑性が高いデバイス上に常駐するTTSシステムによって生成される。TTS出力は複雑性が高いデバイスからは複雑性が低いデバイスに送信され、それ以後、取り出され、再生される。 (もっと読む)


【課題】リンク箇所を音声で明確に表示することが可能で、リンクから遷移中であることを認識可能な音声合成機能付き文字情報表示装置およびその制御方法を提供する。
【解決手段】表示部16に表示中の文字情報に含まれる文字列を音声合成部17にて音声に変換する際に、音声に変換する文字列が、リンク先の対応付けられた表示オブジェクトの場合には第1の音声で音声変換させ、リンク先の対応付けられた表示オブジェクトではない場合には第2の音声にて音声変換させるように音声合成部17を制御する制御部19と、操作部18と、を備え、制御部19は、リンク先の対応付けられた表示オブジェクトが操作部18により選択指示または決定指示されると、リンク先の対応付けられた表示オブジェクトに含まれる文字列を第3の音声にて音声変換させる。 (もっと読む)


【課題】高精度な計算が困難な場合でも、正確な音声合成パラメータ時系列データに基づく音声合成装置、音声合成方法および音声合成プログラムを提供する。
【解決手段】与えられた音声合成用情報に基づく特徴ベクトルの分布情報を用いて、数値範囲の大きい第1の音声合成パラメータ時系列データを生成し、与えられた音声合成用情報に基づく特徴ベクトルの分布情報を修正し、第1の音声合成パラメータとの差の時系列データとして、第1の音声合成パラメータ時系列データよりも数値範囲が小さい第2の音声合成パラメータ時系列データを生成し、第1の音声合成パラメータ時系列データと第2の音声合成パラメータ時系列データとを加算し、第3の音声合成パラメータ時系列データを生成し、第3の音声合成パラメータ時系列データに基づく合成音声波形を生成する。 (もっと読む)


【課題】簡単な操作で、リアルタイムに音声を生成する。
【解決手段】表示部12には、第1ホルマント周波数と第2ホルマント周波数の2次元平面上における分布が音声生成GUIとして表示されており、そのGUI上には、母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数が、「a」、「i」、「u、「e」、「o」としてそれぞれ示されている。ユーザは、発話内容を、マウス11Aを用いて音声生成GUI上で操作する。音声生成装置1は、マウス11Aの動作に追随するポインタPが描いた軌跡から、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標位置を検出し、検出したX座標値で規定されている第1ホルマント周波数の音声と、Y座標値で規定されている第2ホルマント周波数の音声とを合成し、合成した疑似的な音声をスピーカ13から発声させる。 (もっと読む)


【課題】端末装置から受信した処理対象データの音処理で音処理装置が処理済データを生成して端末装置に送信する構成において、端末装置と音処理装置との通信回数を削減するとともに端末装置による処理済データの取得の遅延を低減する。
【解決手段】受信部261は、処理対象データDAを含む処理要求P(PUT)を端末装置10から順次に受信する。音処理部221は、処理対象データDAに対する音処理の実行で処理済データDBを生成する。応答生成部223は、処理済データDBを含む応答通知RPを処理要求Pに対する応答として生成する。送信部263は、応答通知RPを端末装置10に順次に送信する。 (もっと読む)


【課題】音声波形の尤度を最大化するように、複数の音響モデルパラメータが複数の励振モデルパラメータと一緒に推定される音声合成方法を提供する。
【解決手段】テキスト入力を受けており、前記テキスト入力に対応する音声を確率論的モデルを使用して出力し、前記確率論的モデルは音響モデル及び励振モデルを具備し、前記音響モデルは単語または単語の部分を特徴に関連づける複数の確率分布を記述する複数のモデルパラメータを有し、前記励振モデルは、前記特徴を使用して前記音声を出力するために、声帯及び肺をモデル化するために使用される励振モデルパラメータを具備し、ここで音響パラメータ及び励振パラメータは一緒に推定され、前記音声を出力することを具備する。 (もっと読む)


1 - 10 / 99