説明

国際特許分類[G10L13/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 合成音作成の方法;音声合成器 (464)

国際特許分類[G10L13/02]の下位に属する分類

国際特許分類[G10L13/02]に分類される特許

31 - 40 / 365


【課題】音声合成に必要な時間を短縮させ、かつ、音声合成の精度を向上させることができる音声合成装置および音声合成プログラムを提供する。
【解決手段】かな文字キー、濁点キー、半濁点キー、ア行小文字キー、ヤ行小文字キーおよびタ行小文字キーを備える文字入力装置2の入力内容に対応した音声を合成する音声合成装置1であって、清音文字または撥音文字を判別する清音撥音判別手段11と、濁音文字を判別する濁音判別手段12と、半濁音文字を判別する半濁音判別手段13と、拗音文字を判別する拗音判別手段14と、促音付き音節文字を判別する促音付き音節判別手段15と、清音、撥音、濁音、半濁音、拗音および促音付き音節のそれぞれの音声波形を記憶する音声波形記憶手段16と、音声波形記憶手段16から、各判別手段が判別した各音節文字に対応する音声波形を抽出することで音声を合成する音声合成手段17と、を備える。 (もっと読む)


【課題】円滑なコミュニケーションを実現できる。
【解決手段】音声翻訳装置は、入力部、音声認識部、感情認識部、平静文生成部、翻訳部、補足文生成部、及び音声合成部を含む。入力部は、第1言語の音声を音声信号に変換する。音声認識部は、音声信号を音声認識処理し文字列を生成する。感情識別部は、文字列がどの感情種別を含むかを識別して1以上の感情種別を含む感情識別情報を得る。平静文生成部は、感情に伴って語句が変化した非平静語句と、非平静語句に対応しかつ感情による変化を伴わない平静語句とを対応付けたモデルより、文字列に第1言語の非平静語句が含まれる場合、第1言語の非平静語句を対応する第1言語の平静語句に変換した平静文を生成する。翻訳部は、平静文を第2言語に翻訳した訳文を生成する。補足文生成部は、感情識別情報の感情種別を第2言語で説明する補足文を生成する。音声合成部は、訳文と補足文とを音声信号に変換する。 (もっと読む)


【課題】参照音の特徴量の遷移を忠実に反映した確率モデルで自然な合成音を生成する。
【解決手段】区間設定部34は、参照音の参照ピッチPrefの変動の傾向に応じた遷移種別毎(開始部B,定常部S,終了部E)に参照音を単位区間μに区分する。確率モデル生成部421は、複数の状態Stの各々について特徴量の確率分布を示す遷移種別毎の特徴量モデルQAと、複数の状態Stの各々について継続長の確率分布を示す遷移種別毎の継続長モデルQBとを、参照音のうち当該遷移種別の単位区間μにおける参照ピッチPrefの時系列から生成する。 (もっと読む)


【課題】簡単な操作で、リアルタイムに音声を生成する。
【解決手段】表示部12には、第1ホルマント周波数と第2ホルマント周波数の2次元平面上における分布が音声生成GUIとして表示されており、そのGUI上には、母音a,i,u,e,oを発したときの第1ホルマント周波数と第2ホルマント周波数が、「a」、「i」、「u、「e」、「o」としてそれぞれ示されている。ユーザは、発話内容を、マウス11Aを用いて音声生成GUI上で操作する。音声生成装置1は、マウス11Aの動作に追随するポインタPが描いた軌跡から、第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるXY座標位置を検出し、検出したX座標値で規定されている第1ホルマント周波数の音声と、Y座標値で規定されている第2ホルマント周波数の音声とを合成し、合成した疑似的な音声をスピーカ13から発声させる。 (もっと読む)


【課題】本発明は、テキストの内容によって朗読リズムを制御することができるテキスト読み上げシステム及びテキスト読み上げ方法を提供することを目的とする。
【解決手段】本発明のテキスト読み上げシステムは、テキストソースからテキスト内容を読み取るテキスト読取モジュールと、前記テキスト内容を分析して、前記テキスト内容が含むリズム意味を識別するテキスト分析モジュールと、前記テキスト内容が含むリズム意味に基づいて、リズム制御スクリプトを生成する処理モジュールと、音声合成モジュールと、前記リズム制御スクリプトに基づいて、前記テキスト内容をリズミカルに前記音声合成モジュールに伝送する朗読リズム制御モジュールと、を備え、前記音声合成モジュールは、前記朗読リズム制御モジュールから伝送されるテキストを音声に変換し且つオーディオ出力装置に出力する。本発明は、テキスト読み上げ方法も提供する。 (もっと読む)


【課題】聴感的に自然な合成音を生成する。
【解決手段】区間設定部42は、参照音から検出された参照ピッチPref(t)の時系列を音符毎に複数の音符区間σに区分する。相対化部44は、複数の音符区間σの各々について、当該音符区間σの音符のピッチNAに対する当該音符区間σ内の参照音の各参照ピッチPref(t)の相対値である相対ピッチR(t)の時系列を生成する。情報登録部38は、相対ピッチR(t)の時系列を示す相対ピッチ情報YA2を記憶装置14に格納する。軌跡生成部52は、音名が指定された指定音について、相対ピッチ情報YA2が示す相対ピッチR(t)の時系列と当該指定音の音名に対応するピッチNBとに応じて合成ピッチPsyn(t)の時系列を生成する。 (もっと読む)


【課題】音素数が相違する複数の音声素片から適切な音声素片を選択する。
【解決手段】記憶装置12は、音素数が相違する2以上の音声素片を含む複数の音声素片の各々について素片データDVを記憶する。素片選択部26は、指定音毎に音声素片を選択する。具体的には、素片選択部26は、音素数が相違する2以上の音声素片が1個の指定音に対する選択の候補として存在する場合に音素数が多い音声素片を選択する。音声合成部28は、素片選択部26が選択した音声素片の素片データDVを利用して音声信号SOUTを生成する。 (もっと読む)


【課題】ユーザがローカル音声認識とセンタ音声認識を容易に区別できるようにする。
【解決手段】センタ音声認識に伴ってスピーカ11より出力させる音声とローカル音声認識に伴ってスピーカ11より出力させる音声の特徴が区別可能となるようにローカル音声認識に伴ってスピーカ11より出力させる音声を加工し、この加工した音声を用いて音声認識に伴う音声をスピーカ11より出力させる(S104〜S110)。 (もっと読む)


【課題】 言語の発音を正確かつ簡単に理解できるようにする。
【解決手段】 学習用教材1は、所定の言語の原文を表示する原文表示部11と、原文表示部11により表示された原文に対応した発音を音楽記号で示した楽譜を表示する楽譜表示部12とを備える。基準となる五線は表示されず、相対的な音高差を認識し易くするための水平線が必要に応じて付加される。原文に対応した他の言語による訳文を表示する訳文表示部13と、他の言語における表音文字を用いて、楽譜に対応した発音の読みを表示する発音表示部14とをさらに設けることができる。本発明は、言語を学習するための教材に適用できる。 (もっと読む)


【課題】様々な情報を所定のシナリオに沿ってユーザに提示しつつ本体の状態変化をユーザに的確に通知することができる情報処理装置を提供する。
【解決手段】情報取得部42は、外部および自機の記憶媒体の少なくとも一方から所定のシナリオに応じて情報を取得する。情報抽出部43は取得された情報から所定の情報を抽出し、情報提示部44は所定の情報を音声読み上げにより順次出力する。状態変化通知部47は、本体の状態変化があると、その旨の情報をユーザに音を介して通知するためのデータを情報提示部44に与える。情報提示制御部41は、情報提示部44を制御することにより所定のシナリオに応じて所定の情報の音声読み上げによる出力順序を制御する。また、情報提示制御部41は、状態変化通知部47を制御することにより、状態変化があった旨の情報を情報提示部44に音を介して出力させる。 (もっと読む)


31 - 40 / 365