説明

国際特許分類[G10L13/02]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199) | 合成音作成の方法;音声合成器 (464)

国際特許分類[G10L13/02]の下位に属する分類

国際特許分類[G10L13/02]に分類される特許

11 - 20 / 365


【課題】記憶容量を削減しながら音声波形の反復に起因した音質の低下を防止する。
【解決手段】記憶装置12は、有声音の音声波形Vbのうち時間軸上の相異なる位置から抽出されたM個の単位波形u[1]〜u[M]を記憶する。音声合成部28は、N個の処理期間R[1]〜R[N]の各々について、M個の単位波形u[1]〜u[M]から選択された第1単位波形Ua[n]の複数個を処理期間R[n]内で経時的に強度が増加するように配列した第1波形系列Sa[n]と、M個の単位波形u[1]〜u[M]のうち第1単位波形Ua[n]とは相違する第2単位波形Ub[n]の複数個を処理期間R[n]内で経時的に強度が減少するように配列した第2波形系列Sb[n]とを加算(すなわちクロスフェード)した合成波形C[n]を生成する。 (もっと読む)


【課題】適切な音声装置の制御が可能な電子機器を提供する。
【解決手段】対象者を含む画像を撮像可能な撮像装置の撮像結果を取得する取得装置と、前記撮像装置による撮像結果から前記対象者の大きさ情報を検出する第1検出装置と、前記第1検出装置が検出した前記大きさ情報に基づいて、指向性を有する音声装置の位置及び/又は姿勢を調節する駆動制御装置と、を備えている。 (もっと読む)


【課題】
音韻韻律情報の編集前後における音声波形を正確に比較することができる音声合成編集装置を提供することである。
【解決手段】
実施形態の音声合成編集装置は、テキストを解析して音韻韻律情報を取得する音韻韻律情報取得手段と、前記音韻韻律情報を編集する音韻韻律情報編集手段と、前記音韻韻律情報編集手段における編集前および編集後の音韻韻律情報をそれぞれ第1および第2の音声波形に変換する音声合成手段と、前記音韻韻律情報編集手段で編集対象になった音韻韻律情報に対応する前記第1および第2の音声波形の対比区間を算出する対比区間算出手段と、前記対比区間算出手段で算出された前記第1の音声波形の対比区間を含む前記第1の音声波形の部分波形と、前記対比区間算出手段で算出された前記第2の音声波形の対比区間を含む前記第2の音声波形の部分波形を連続的に出力する対比音声生成手段を備える。 (もっと読む)


【課題】 表示されているテキストの記号に対応する音を出力することができる再生装置、再生方法、プログラムおよび記録媒体を提供する。
【解決手段】 タッチイベント&タッチ座標生成部12は、入力部11によって入力された接触状態情報および位置情報に基づいて、タッチイベントおよびタッチ座標を生成する。選択範囲決定部13は、タッチイベントおよびタッチ座標に基づいて、選択範囲を決定するとともに、対応テーブル19を参照して、決定した選択範囲に含まれる各記号に対応する記号音の時間的位置を決定する。アクション決定部14は、タッチイベントおよび選択範囲に基づいて、どのアクションを行うかを決定し、決定したアクションに従って、選択範囲内の記号を表示部15に表示させるとともに、時間的位置が示す時間に、選択範囲内の記号に対応する記号音をオーディオ再生部16に出力させる。 (もっと読む)


【課題】 コミュニケーションの感情を十分に表現でき、趣向的に富んだテキスト音声変換再生をすることができるテキスト音声変換装置を提供する。
【解決手段】 再生される音声データの抑揚再生条件を設定する再生条件設定部54と、与えられたテキストデータ30を前記再生条件設定部54によって決定された抑揚再生条件を具備する読み上げ用の音声データに変換する音声変換部55とを備えるテキスト音声変換装置である。前記再生条件設定部54は、互いに交差する第1及び第2方向に広がりを有する描画領域22に描画された画像情報31を線形的な線状オブジェクトに変換し、前記音声変換部55は、前記線状オブジェクトの第1の方向に沿って前記テキストデータの文字列を割り付け、前記割り付けられたテキストデータの文字に前記線状オブジェクトの第2の方向の位置に応じた抑揚再生条件を与える。 (もっと読む)


【課題】少ない消費電力量で情報を処理する。
【解決手段】ユーザ操作を受け付ける受け付手段と、テキストを音声に変換して読み上げるプレーヤ部404と、テキストにリンクされたリンク情報の所在を示すリンク先データに基づき、当該テキストのリンク情報を取得するブラウザ401と、取得されたリンク情報を含む情報を表示する表示手段と、表示手段を、情報を表示可能な通電状態と非通電状態とに切替える状態切替手段と、を備え、非通電状態におけるテキストの読み上げ中に、受け付手段が通電状態への遷移を指示するための遷移操作を受け付けると、ブラウザ401にリンク情報を取得させる。 (もっと読む)


【課題】 コミュニケーションの感情を十分に表現でき、趣向的に富んだテキスト音声変換再生をすることができるテキスト音声変換装置を提供する。
【解決手段】 再生される音声データの抑揚再生条件を設定する再生条件設定部54と、与えられたテキストデータ30を前記再生条件設定部54によって決定された抑揚再生条件を具備する読み上げ用の音声データに変換する音声変換部55とを備えるテキスト音声変換装置である。再生条件設定部54は、互いに交差する第1及び第2方向に広がりを有する描画領域22に描画された画像情報を前記第1方向に細分したセグメントの画像情報に基づいて音階を決定して線状オブジェクトに変換し、音声変換部55は、前記線状オブジェクトに沿って割り付けられたテキストデータの文字に前記線状オブジェクトの第2の方向の位置に応じた抑揚再生条件を与える。 (もっと読む)


【課題】音声出力のタイミングが重なる場合であってもそれらの内容を確実に伝えることができる音声出力装置を提供すること。
【解決手段】音声情報に対応する音声を出力する音声出力部部36と、音声出力部36に対して、音声の出力タイミングを指示する出力タイミング指示部32と、音声情報の分割位置を設定する音声情報分割部34とを備えている。出力タイミング指示部32は、音声出力部36によって第1の音声情報に対応する第1の音声を出力中に、第2の音声情報に対応する第2の音声の出力開始タイミングが到来する場合に、この出力開始タイミングよりも前に到来する分割位置で第1の音声の出力を中断する指示を音声出力部36に対して行う。 (もっと読む)


【課題】複数の利用者が連続して認証される場合であっても、全員分について認証結果を含む出力用音声情報を出力する顔画像認証装置を提供する。
【解決手段】本発明にかかる顔画像認証装置は、撮像部により取得された入力画像から利用者の入力顔画像を抽出する顔検出部と、1人分の出力用音声情報を入力顔画像の数だけ出力するのに要する総出力時間と本装置の利用者が通行終了までに要する通行時間を算出する時間長算出部と、総出力時間が通行時間を上回る場合には短縮した出力用音声情報生成する音声合成部と、出力用音声情報を利用者に出力する通知部とを有する。
(もっと読む)


【課題】音声認識のための音声が入力された時点での雑音等の環境音や、該入力音声の音量、音声信号の途絶等の特徴を好適に利用する。
【解決手段】音声信号処理システムは、音声信号を入力する音声入力手段101と、音声入力手段101を介して入力された音声信号である入力音声信号を格納する入力音声格納手段102と、入力音声格納手段102に格納された入力音声信号を参照し、入力音声信号に含まれる環境音を含む該入力音声信号によって示される入力音声の特徴を推定する特徴推定手段103と、参照音声となる所定の音声信号を発生させる参照音声発生手段104と、特徴推定手段103によって推定された入力音声の特徴を、参照音声発生手段104が発生させた音声信号である参照音声信号に反映する特徴反映手段105とを備えたことを特徴とする。 (もっと読む)


11 - 20 / 365