説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

821 - 830 / 925


【課題】
他の空間伝送システムとの共存を可能としながら高品質の音声を提供し得る音声出力システム及び方法を提案する。
【解決手段】
映像表示面と対向する側において、映像表示面に表示される映像に付随する圧縮符号化された音声データを取得して、当該音声データを空間伝送送信し、少なくとも映像表示面側において、空間伝送送信される音声データを受信し伸張して、得られた伸張された音声データに基づく音声を出力するようにした。 (もっと読む)


【課題】音声を利用した、より表現力豊かな電子メールシステムを提供することを課題とする。
【解決手段】マイクより入力した音声は、ノイズゲート処理により録音データ要素V1,V2,V3に分解される。BGMデータ(マーカ付き楽曲データ)には、小節ごとのタイミングマーカが設定されており、各録音要素データV1,V2,V3は、BGMデータの各小節の先頭位置に合成される。また、効果音データが、ユーザ指定操作に応じて任意のタイミングで合成される。このようにして生成された合成音声データは、たとえば、MP3などの圧縮形式で圧縮処理された後、音声電子メールとして送信される。 (もっと読む)


【課題】 アクセント等の発音情報を、不馴れな人でも容易に登録可能な辞書登録方法を提供する。
【解決手段】 第1の文字列と第2の文字列を受信し、第2の文字列を解析して前記第2の文字列に対応する発音情報を抽出し、抽出した発音情報と第1の文字列とを関連付けて登録する。 (もっと読む)


【課題】 音声データを処理する際のCPU(第1の演算処理装置)への負荷の軽減を図った音声データ処理装置を提供する。
【解決手段】 音声データ処理装置は、第1の演算処理装置と第2の演算処理装置とを有する音声データ処理装置であって、第1の演算処理装置で、デジタルデータである音声データを取得する、音声データ取得手段と、第1の演算処理装置で、前記音声データのうち、人間の耳に聞こえにくい小さい音量に対応するビットを省いて、前記第2の演算処理装置に送信する、送信手段と、前記第2の演算処理装置で、前記第1の演算処理装置から送信された前記音声データを受信する、受信手段と、前記第2の演算処理装置で、前記受信した音声データに基づいて、前記音声データの再生に必要な音声再生データを生成する、再生データ生成手段と、を備える。 (もっと読む)


【課題】着信時に設定されているデータを判別することができ、音データを切り替えた際の著作権違反を防止することが可能な動画像再生装置、携帯端末装置、ならびに携帯端末装置のデータ処理方法を提供する。
【解決手段】通信処理部11にて着信もしくはメッセージ受信が検出され、動画再生部21により動画を再生して着信あるいは受信報知を行っているときに、音声合成処理部17を含む読み上げ機能の起動すべき所定のイベントが発生した場合に、たとえば着信した音声を含む動画情報に著作権が存在せず画像と音声のそれぞれのデータを切り離し可能な場合には、動画の音声出力のみを停止するとともに、読み上げ機能を動作させ、著作権が存在し切り離しが不可能な場合には、動画の画像と音声の両データを停止するとともに、読み上げ機能を動作させる制御を行う制御部20を有する。 (もっと読む)


【課題】 利用者が携帯する装置の構成を複雑にすることなく、また周辺に騒音を生じることなく音声案内を提供する音声案内システムを得る。
【解決手段】 無線IDタグ1が、無線IDタグリーダライタ2から呼び出し信号を受信すると応答信号を返信し、無線IDタグリーダライタ2が、定期的に無線IDタグ1の呼び出し信号を出力し、それに対する応答信号を受信すると個別情報を読み出し、コンピュータ3が、設置される場所と個別情報に応じた音声メッセージを記憶する音声メッセージ記憶部32と、無線IDタグ1から読み出した個別情報に対応する音声メッセージを音声メッセージ記憶部32から選択する音声メッセージ選択部33と、音声信号によって超音波帯域の搬送波を変調する変調器41と変調信号を超指向性の音波として放射するパラメトリックスピーカ43とを含むパラメトリックスピーカ装置4とを備える。 (もっと読む)


ディスプレイ上のアイテムを選択してメッセージを組み立てる入力デバイスを用いて、ユーザーが、デバイス(2)によって朗読されるメッセージを作り得る種類の補助通信デバイス(10)は、利用可能な選択肢を聞きながらステップを進むことによって、ユーザーに各選択肢を選択した結果を説明する、視覚障害および/または未経験のユーザーに適切なモードで動作し得る。これらのモードにおいて選択肢が提示される順序は、経験を有する、または視力が完全なユーザーに提示されるモードとは異なり得る。経験を有するユーザーに対しても、ディスプレイ上にハイライトされる選択肢の順序は、ユーザーの使用履歴によって異なり得る。該デバイス(2)は、電話線、電子メール用データネットワークまたは介護者用警報デバイスを含む外部通信(1)と接続され得る。介護者用警報デバイス(3)は、ポータブルまたは介護者用ステーションコンソールであり得る。
(もっと読む)


【課題】対話システムの忠実度を向上させる方法を提供する。
【解決手段】ステップ410において、第1のシステムの第1のユーザからの第1の入力にアクセスする。変更コンポーネント214はテキスト入力121にアクセスし、認識されていないテキスト入力のインスタンスを識別して、それらを辞書に格納する。ステップ420において、第2のシステムの第2のユーザからの第2の入力にアクセスする。変更コンポーネント214はまた、音声入力152にもアクセスし、認識されていない音声入力のインスタンスを識別して、それらを辞書に格納する。ステップ430において、第2の入力を利用して第1のシステムの出力を変更する。変更コンポーネント214は、認識されていないテキスト入力のインスタンスが認識されていない音声入力のインスタンスに対応する場合を判断するように構成される。 (もっと読む)


【課題】 臨場感のある音付き画像データを簡単に作成する。
【解決手段】 音合成部14は、表示装置4によって表示されている発話オブジェクトに関する音源データを音源データ記憶部16から読み出し、当該音源データがテキストである場合には、このテキストに基づいて音データを合成する。音データ加工部13は、発話オブジェクト方向記憶部17から読み出された当該発話オブジェクトに関する発話オブジェクトの方向ベクトルが、例えば、視聴者が向いている方向と同じ方向である場合には、音合成部14からの音データを低域通過フィルタにかけて高周波数成分を抑制する。こうして、発話オブジェクトが視聴者と向き合っている場合の発声音よりも不明瞭にして、視聴者にとって臨場感のある音付き画像を表示する。 (もっと読む)


【課題】音声報知を行う機器の夜間使用時に問題となる生活騒音をなくすこと。また、音声報知のもたらす利便性との両立を図ること。
【解決手段】音声報知装置13は、時計15の計時する時刻が基準時刻帯16の間にあれば、音声報知の音量をなくす(0にする)。または、音声報知の音量を小さく(1/n倍)する。 (もっと読む)


821 - 830 / 925