説明

国際特許分類[G10L13/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声の合成;テキストを音声に変換するシステム (2,199)

国際特許分類[G10L13/00]の下位に属する分類

国際特許分類[G10L13/00]に分類される特許

111 - 120 / 925


【課題】ウェブ・ページを特定するデータのための音声リクエストを処理するための方法を提供する。
【解決手段】前記方法は、ルールベースのグラマ・ステートマントを含む、ウェブ・ページを特定するデータのための音声リクエストを処理するための方法であって、ルールベースのグラマ・ステートマントと関連したグラマを識別する段階と、グラマと関連しているとして識別された第1の接続が、1つまたは複数の接続を識別するデータ構造において特定されているか否かを決定する段階と、グラマと関連しているとして識別された第1の接続がデータ構造内に特定される場合には、ウェブ・ページを提起することができかつ第1の接続と関連するウインドウの少なくとも部分におけるリクエストを処理する段階と、を含む方法。 (もっと読む)


【課題】中断した発話を円滑に再開する音声対話装置を提供する。
【解決手段】 音声対話装置(コミュニケーションロボット)は、音声合成部21aによって、発話情報に基づいて音声出力(発話)する。音声対話装置は、音声入力部21bによって音声の入力を検出すると、発話中断処理手段473aによって音声合成部21aによる発話を中断させる。次に、音声対話装置は、応答行動選択手段473cによって、中断の原因となった入力音声に対する応答行動を選択して実行する。そして、音声対話装置は、再開位置決定手段473bによって、応答行動の実行状況に応じて、中断させた発話情報おける発話の再開位置を決定し、決定した再開位置から発話を再開させる。 (もっと読む)


【課題】入力音声と合成音声との同時出力による競合を回避または低減することができる音声出力装置を提供する。
【解決手段】リアルタイムな入力音声を音声バッファ12が一時保存する。入力音声に対応して合成音声の出力の要否を検知部13が判定する。出力が必要と判定された合成音声を音声合成部15が生成して出力する。出力される合成音声の時間長に対応して一時保存された入力音声を変換部14が調整して出力する。このため、例えば、本来ならば入力音声と合成音声とが同時に出力されるような場合に、入力音声を合成音声が出力されてから高速に出力するようなことができる。 (もっと読む)


【課題】 本発明は、発せられた音声の音量に応じたメッセージを生成し出力することができるコミュニケーション装置を提供することを目的とする。
【解決手段】 人物から発せられた音声をマイク70によって集音することにより得られた音声データが与えられると、音声データの音量を判定する音量判定手段80と、音量判定手段80から出力された判定結果に基づいて、音声データの音量に応じたメッセージからなる音声を生成し、これをスピーカ60から出力する音声生成手段100とを備える。 (もっと読む)


【課題】 話者が音声入力に用いる入力手段に関わらず、話者の特性に応じた応答音声信号を出力することができる音声応答装置を提供する。
【解決手段】 本発明は、ユーザの発話に基づく入力音声信号の発話内容に応答する応答音声信号を出力する音声応答装置に関する。そして、本発明の音声応答装置は、1又は複数の判定項目の各パラメータに対応する判定用発話特徴データを記憶する手段と、ユーザ発話特徴データを抽出する手段と、抽出したユーザ発話特徴データとそれぞれの判定用発話特徴データとを照合し、ユーザが、それぞれの判定項目について、いずれのパラメータに対応するかを判定する手段と、判定結果に対応する発話特徴を備える応答音声信号を保持する手段とを有することを特徴とする。 (もっと読む)



Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285

【課題】雑音の誤検出による応答音声の中断の発生を抑えること。
【解決手段】音声対話装置は、入力音声に含まれる応答音声のエコーを除去したエコー除去音声の始端と終端を検出する音声検出部8と、前記始端が検出されてから所定期間が経過した時点で前記終端が検出されていないときに応答中断指令を出力する応答中断制御部11と、応答中断制御部11から前記応答中断指令を受け取ると応答音声出力部に応答音声の出力を中断させる対話制御部3と、を備える。 (もっと読む)


【課題】ユーザ発話や動作による入力を可能とした情報処理装置において、処理継続が困難となった場合にフィードバック情報を出力する装置および方法を提供する。
【解決手段】ユーザ発話の音声解析や、ユーザ動作(ジェスチャー)の解析を実行し、解析結果に基づいて情報処理装置の処理を決定する。さらに、ユーザ発話やユーザ動作に基づく情報処理装置の処理過程において、処理継続の阻害要因が発生した場合、阻害要因が発生した処理ステージに対応したフィードバック情報を生成して出力する。ユーザはこれらのフィードバック情報を取得することで、処理ステージに応じたエラー発生状況を即座に取得することができ、無駄な待機処理等を行うことなく、再発話等のエラー対応処理を即時、実行することができる。 (もっと読む)


【課題】会議参加者の発話を所望の1又は複数の言語にリアルタイム翻訳する多言語多地点ビデオ会議システムを提供する。
【解決手段】発話を含む音声ストリームがテキストに変換され(220,250)、ビデオストリームに字幕として挿入される(250,240)。発話は或る言語から別の言語に翻訳され(240)、翻訳された発話がビデオストリームに挿入され、字幕を選ぶか、又は、音声合成エンジンによって生成された別の言語の発話に、元の音声ストリームを置き換える(220,240,250)。種々の会議参加者は、それぞれ会議参加者により提供された所望の言語の情報に基づく同じ発話の種々の翻訳を受信する(210)。 (もっと読む)


【課題】見えにくい、または、読みにくい文書の内容を容易に把握すること。
【解決手段】スキャナー11は、受領者が配置した紙媒体の文書をデジタルデータに変換し、撮影画像生成部17aは、デジタルデータから撮影画像を生成する。そして、分割部17bは、撮影画像を複数の領域に分割し、表示制御部17cは、撮影画像を表示部12に表示させるように制御する。そして、表示部12の光センサは、リモコン20から照射された可視光の表示部12における位置を特定し、特定部17dは、光センサが特定した可視光の表示部12における位置を取得し、当該取得した位置に対応する領域を分割部17bにより分割された複数の領域から特定する。そして、拡大画像生成部17eは、特定部17dにより特定された領域を拡大した拡大画像を生成し、表示制御部17cは、拡大画像を表示部12に表示するように制御する。 (もっと読む)


111 - 120 / 925