説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

121 - 130 / 925


【課題】ある物体を見ている人にのみ、その物体に関連付けられて用意されている音データの再生音を聞かせることができるようにする。
【解決手段】各ユーザは、カメラとヘッドホンが設けられたHMDを装着している。カメラはユーザの前方を撮影可能な位置に取り付けられる。ユーザが携帯する情報処理装置においては、カメラにより撮影された画像に基づいて、ユーザがどのポスターを見ているかが物体認識により認識される。また、ユーザが見ているポスターに関連付けられた音データが再生され、再生音がヘッドホンから出力される。情報処理装置には、ユーザがどのポスターを見ているのかを認識するのに用いられるポスターP1乃至P4のそれぞれの認識用のデータと、ポスターP1乃至P4のそれぞれと関連付けられた音データが記憶されている。本発明は、携帯型のコンピュータに適用することができる。 (もっと読む)


【課題】小売店等において、外国人店員の作業効率を向上することができる音声出力装置、音声出力装置の制御方法、印刷装置および装着ボードを提供する。
【解決手段】プリントデータを取得するデータ送受信部191と、データ送受信部191により取得したデータの少なくとも一部のデータを解析し、テキストデータに変換するデータ解析部193と、テキストデータを、予め指定した1以上の言語に変換する言語変換部194と、言語変換部194により言語変換したテキストデータに対応した1以上の合成音声データを生成する音声合成部195と、音声合成部195により生成した1以上の合成音声データを、ヘッドフォン104に対して出力する音声データ出力部196と、を備える。 (もっと読む)


【課題】所定領域内の対象者に向けて音を伝達すること。
【解決手段】信号処理装置110と、信号処理装置110によって信号処理された音響信号による音を出力する音出力手段160と、音出力手段160によって出力された音が対象者に伝達されるまでの間に減衰する減衰量の評価基準として利用される情報を取得する評価情報取得手段170(180、190、200)とを備え、信号処理装置110は、評価情報取得手段170(180、190、200)によって取得された情報を評価基準として、音が対象者に伝達されるまでの間に減衰する周波数帯域毎の音圧レベルの減衰量を評価する減衰量評価部125と、減衰量評価部125が評価した減衰量を補完すべく、音響信号の周波数帯域毎の音圧レベルを補正する音圧レベル補正部126と、音圧レベル補正部126が補正した音響信号を音出力手段160に出力する音響信号出力部127とを有する。 (もっと読む)


【課題】姿勢に応じて、違和感のない自然な音声を出力する。
【解決手段】ロボット4は、基体(基体41)に可動連結した可動部(例えば、頭部42)の駆動を制御する駆動制御手段(制御部100)と、音声を生成する音声生成手段(音声生成部110)と、前記音声生成手段において生成された音声を出力する音声出力手段(音声出力部140L、140R)とを有し、前記音声生成手段は、前記駆動制御手段によって制御される前記可動部の前記基体に対する姿勢に基づいて、生成する音声を補正する。 (もっと読む)


【課題】画像情報を利用して精度を向上させた音声翻訳を行なうテレビジョン受像装置及びテレビジョン受像方法を提供する。
【解決手段】入力音声から話者が話す指示代名詞を抽出する音声データ処理手段と、入力画像よりオブジェクトを切り出す画像データ処理手段と、話者が話す指示代名詞の変化と、入力画像上における話者とオブジェクトの位置関係の変化に基づいて、切り出したオブジェクトから指示対象物を認識する認識手段とを具備することを特徴とする。 (もっと読む)


【課題】安定して自然な韻律になる韻律情報を作成する韻律作成装置及び韻律作成方法を提供する。
【解決手段】複数の韻律特徴のパターンをそれぞれ示す詳細韻律情報103を予め記憶する詳細韻律情報記憶部2から、入力言語情報101を基に作成された代表韻律情報102と詳細韻律情報103とを参照して、当該代表韻律情報102に類似した詳細韻律情報103を選択する。 (もっと読む)


【課題】
ユーザの挙動に基づいて音声合成装置を自動修正することにより、ユーザに合わせて、ユーザに好まれる音声を合成できるようにする。
【解決手段】
音声合成装置において、音声を合成する音声合成部200と、合成音声を提示し、提示された合成音声に対するユーザの挙動情報を出力する音声判定部310と、ユーザ挙動情報からユーザ挙動特徴を抽出するユーザ挙動特徴抽出部410と、抽出したユーザ挙動特徴から、合成音声に対するユーザの音質評価値を推測する音質評価値推測部420と、前記音質評価値に基づいて、前記音声合成部200を修正する修正部500とを備える。 (もっと読む)


【課題】録音音声と合成音声とが混在した音声を出力することに伴う了解性の低下を防止する。
【解決手段】本発明の音声合成装置は、種々の録音音声データを記憶する記憶手段28と、テキストを単語あるいは文節単位に分割する分割手段22と、分割された単語あるいは文節に対応する録音音声データが記憶手段28に存在するか否かを照合する照合手段26と、分割された単語あるいは文節の全てに対応する録音音声データが記憶手段28に存在するときに、テキスト全文を録音音声で音声合成し、そうでないときに、テキスト全文を規則合成で音声合成する音声合成手段とを備えたものである。 (もっと読む)


【課題】適切なタイミングで応答できる音声対話装置および方法を提供
【解決手段】まず、入力した音声から単語列を抽出する(S30)。また、入力した音声の話速を算出する(S40)。そして、現在の入力単語列に後続すると予測される単語列(以下、後続予測単語列という)とこの後続予測単語列に対応した出現確率とを記憶する出現確率リストと、抽出した単語列とを比較して、抽出した単語列に後続すると予測される後続予測単語列の中で最も出現確率の高い後続予測単語列を抽出する(S50)。更に、算出した話速を用い、後続予測単語列が入力されるのにかかる時間(以下、後続入力時間という)を算出する(S60)。その後、抽出した後続予測単語列の出現確率を確信度とし、抽出した後続予測単語列に付与する(S70)。その後、付与された確信度が応答判定値以上である場合に、この後続入力時間で、出力タイミング予測を確定させる(S80)。 (もっと読む)


【課題】発音が前後の音の影響を受ける英語等の言語を音声合成するに際して、前後の音変化を考慮した音声合成を行う。
【解決手段】本発明は、単語の音声記号を保持する音声記号辞書、及びこの音声記号辞書を参照し言語テキスト中の単語を音声記号へ変換する音声記号変換機能と、音が変化する条件と変化後の音声記号を保持する音変化規則辞書、及び音声記号変換機能により得られた音声記号と音変化規則辞書とを参照し、音変化規則辞書により保持される音変化が生じる条件に合致する音声記号が含まれていた場合、当該箇所を当該音変化規則辞書の変化後の音声記号へと置換する音声記号置換機能と、音声記号を音声出力するテキスト音声合成機能とから成る。 (もっと読む)


121 - 130 / 925