説明

Fターム[5D015KK04]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 音声合成装置との結合 (119)

Fターム[5D015KK04]に分類される特許

41 - 60 / 119


【課題】音声認識結果に対して適切な応答を生成して、誤応答を低減することができる応答生成装置およびプログラムを提供する。
【解決手段】応答生成装置10を、ユーザの発話を認識し、認識候補を生成する入力部12と、入力部12で生成された各認識候補に対応した応答候補を生成する応答生成部14と、応答生成部14で生成された応答候補から、対応する認識候補が最も多い応答候補を選択する応答選択部16と、応答選択部16で選択された応答候補を出力する出力部18とを備えて構成した。 (もっと読む)


【課題】異なる音声的特徴で発話された場合であっても、ユーザの発話に対して、適切な相槌を生成して出力する。
【解決手段】抽出された複数の事態44の各々と、演算された各グループの頻度46とを対応付けた事態頻度データベース48を生成し、マイク16に入力されたユーザの発話に含まれる事態と一致する事態頻度データベース48に登録されている事態44に対応する頻度46の大きさに基づいて、ユーザの発話に含まれる事態が人間が驚く内容であるか否かを判別し、驚く内容であると判別された場合には、応答するための驚きを表す相槌を生成し、生成された相槌を出力する。 (もっと読む)


【課題】ユーザ感情がネガティブであるか否かによって、適切な感情応答を生成する感情応答装置及び感情応答生成プログラムを提供する。
【解決手段】感情応答生成装置は、ユーザの発話と該発話に対応するユーザの感情とを入力する入力部11と、前記入力部11により入力されたユーザの感情に基づいて、ユーザの感情の状態がネガティブか否かを推定する感情状態推定部12と、前記感情状態推定部12により推定されたユーザの感情の状態がネガティブであるときは感情応答を生成せず、ネガティブ以外のときは前記入力部11により入力されたユーザの感情に同調する感情応答を生成する感情応答生成部13と、前記感情応答生成部13により生成された感情応答を出力する出力部14と、を備えている。 (もっと読む)


本通訳システムは、起点言語で書かれ、または発音された文の視覚的または聴覚的取得手段および音声の変換手段、取得手段で取得した入力信号から、起点言語への文の転写である起点言語文を生成するための認識手段(30)、起点言語文から、目標言語への起点言語文の翻訳である目標言語文を生成するための翻訳手段(32)および目標言語文から、音響変換手段によって再生されることのできる出力音響信号を生成するための音声合成手段 (34)を含む通訳システムである。本発明では、本通訳システムは、リアルタイムで、起点言語での文を目標言語に生成するために、認識手段(30)、翻訳手段(32)および音声合成手段 (35)を呼び出すための平滑化手段(40)を含んでいる。 (もっと読む)


【課題】 運転者が眼鏡やサングラスをかけている場合であっても、運転者の居眠りを検出することができる居眠り検出装置20を提供する。
【解決手段】 本発明の居眠り検出装置20は、変化の少ない走行が所定時間以上続いた場合に運転者に合図を送り、その合図に対して運転者が応答するまでにかかった時間に基づいて運転者の居眠りの有無を判定する。車両が所定の状態となった場合には、運転者に合図を送るタイミングを延期する。 (もっと読む)


【課題】携帯電話等で音声入力すれば、自動的にテキストデータを作成し、その作成したテキストデータを所定の配信先に自動的に配信することのできる音声情報管理システムを提供する。
【解決手段】本発明の音声情報管理システムは、実際の送信番号と受信番号に基づき、第1記憶手段から音声データを読み出し、この音声データをテキストデータ作成手段に送ってテキストデータを作成する一方、第2記憶手段から特定の仕事識別記号を読み出し、この読み出した仕事識別記号に基づき第3記憶手段から仕事情報を読み出し、この仕事情報に関連付けてテキストデータを第4記憶手段に記憶させ、この第4記憶手段に記憶されたテキストデータを、仕事情報中に含まれる配信先データに基づいて該配信先データが示す配信先に配信することを特徴とする音声情報管理システム。 (もっと読む)


【課題】入力音声に含まれる周辺言語情報を反映させた出力音声を生成可能な音声翻訳装置を提供する。
【解決手段】第1言語の入力音声に対して音声認識を行った第1文字列を第1単語に分解して解析した第1言語情報第1言語情報に基づいて第1合成韻律情報を生成する第1の生成部104と;原韻律情報及び第1合成韻律情報を比較して、第1単語にそれぞれ対応する周辺言語情報を抽出する抽出部105と;第1単語と第1言語から翻訳された第2言語の第2単語とを対応付け、第2単語に第1単語に対応する周辺言語情報を割り当てるマッピング部108と;第1文字列から第2言語に翻訳した第2文字列を第2単語に分解して解析した第2言語情報及び周辺言語情報に基づいて第2合成韻律情報を生成する第2の生成部109と;第2言語情報及び第2合成韻律情報に基づいて出力音声を音声合成する音声合成部110と;を具備する。 (もっと読む)


【課題】 音声対話型アプリケーションを、端末装置の使用環境(ネットワーク環境)に依存することなく使用すること。
【解決手段】 VXMLプログラムを記憶する記憶装置を備えた情報処理装置が、音声の入力を受け付け、記憶装置に記憶されるVXMLプログラム及び入力された音声内容に基づき、出力すべき音声内容を決定し、決定された音声内容を音声として出力する。 (もっと読む)


【課題】自然な対話を成立させながら、利用者を退屈させることのない対話装置を実現する技術を提供する。
【解決手段】対話用データベース30には、複数の話題と、夫々の話題に関連付けられた情報が記憶されている。音声特徴量抽出プログラム24が、利用者の音声の特徴量を抽出する。動作特徴量抽出プログラム26が、利用者の動作の特徴量を抽出する。関心度推定プログラム28は音声と動作の特徴量を変数とする状態空間に設定され、順位付けされた複数の領域を記憶しており、抽出された音声の特徴量と動作の特徴量を要素とする特徴量ベクトルが、いずれの領域に属するかを特定する。対話制御プログラム22は、特定された領域の順位が閾値より低い場合に、選択する話題を切り替える。案内ロボット2は、現在の話題に関して出力した情報に対する利用者の関心が低い場合に話題を切り替えるので、利用者を退屈させることがない。 (もっと読む)


【課題】バージイン機能の動作が必要と決定した場合のみ、バージイン機能を動作させることで、認識性能の低下を抑制できる音声認識装置および音声認識方法を提供することにある。
【解決手段】
本発明の音声認識装置は、利用者に発話開始を促すためのシステムプロンプトの出力を行い、システムプロンプトの出力中に音声信号の取得を始め、取得した音声信号に重畳されるシステムプロンプトの影響を削除して、利用者の発話した音声を認識可能とするバージイン機能を有する。更に、システムプロンプトの出力中もしくは出力後に取得した音声信号の特徴に基づいて、バージイン機能の動作の要否を決定し、バージイン機能の動作が必要と決定した場合のみ、バージイン機能を動作させるバージイン制御部107を備えている。 (もっと読む)


装置の情報は、装置のユーザに対して感情に訴える形で伝達される。装置の作動状態を表す入力が受信される。入力は、擬似的な感情状態を表すデータに変換される。アバターにより表現される擬似的な感情状態に関する質問が受信される。質問に対して返答される。 (もっと読む)


【課題】利用者の行動に対応した反応が可能な音声応答装置を提供する。
【解決手段】音声応答装置10は、入力取得部101、応答内容生成部102、応答出力部103、周囲音取得部104、聴取状態判断部105から構成され、周囲音情報に含まれる利用者音声、応答音声、環境音を分析し、(1)前記利用者が前記音声応答に回答している場合は、前記回答に対する新たな音声応答を生成し、(2)前記利用者に前記応答音声が聞こえていない場合は、前記音声応答を繰り返し、(3)前記利用者が前記音声応答に回答できない場合は、前記音声応答を中断する。 (もっと読む)


【課題】メイン話題の情報を含めた応答を生成することにより、ユーザが大局的な話題を認識しながら対話を行える対話装置を提供する。
【解決手段】複数の話題のそれぞれに対応し、当該話題をユーザとの対話により解決するための応答手続きを含む複数の対話シナリオを記憶する対話シナリオ記憶手段を備え、ユーザ発話に基づき導入された未解決の各話題の対話進行状況を示す話題情報を、導入された順に時系列に話題情報記憶手段に記憶し、前記話題情報記憶手段に記憶されている最新の話題情報に対応する前記対話シナリオに含まれる前記応答手続きに基づき、前記最新の話題情報よりも古い話題情報と該古い話題情報に対応する前記対話シナリオのうち、前記最新話題情報に対応する話題をサブ話題とするメイン話題の話題情報あるいは対話シナリオから、ユーザへの応答を生成する際に用いる情報を取得し、該情報を用いて前記応答を生成し、出力する。 (もっと読む)


【課題】適切なタイミングで応答できる音声対話装置および方法を提供
【解決手段】まず、入力した音声から単語列を抽出する(S30)。また、入力した音声の話速を算出する(S40)。そして、現在の入力単語列に後続すると予測される単語列(以下、後続予測単語列という)とこの後続予測単語列に対応した出現確率とを記憶する出現確率リストと、抽出した単語列とを比較して、抽出した単語列に後続すると予測される後続予測単語列の中で最も出現確率の高い後続予測単語列を抽出する(S50)。更に、算出した話速を用い、後続予測単語列が入力されるのにかかる時間(以下、後続入力時間という)を算出する(S60)。その後、抽出した後続予測単語列の出現確率を確信度とし、抽出した後続予測単語列に付与する(S70)。その後、付与された確信度が応答判定値以上である場合に、この後続入力時間で、出力タイミング予測を確定させる(S80)。 (もっと読む)


【課題】
解決しようとする課題は、音声会話に不自由なハンディキャプ者の会話速度、聞き取り能力にあった音声案内機能がなく、病院、役所、施設などでスムースに用件を果たすことができないことである。
【解決手段】
受付ロボットは利用者にとって、聞き易い音声にする音量、音声速度、音声帯域、音声抑揚を変更して発声できる手段を備え、来訪者に問い掛けを行い、来訪者の返答を確認・認識して、来訪者に聞き易い発声音声にチューニングして受付を行なう。 (もっと読む)


【課題】 音声入力を開始を指定するボタンには、押しながら話す方式(PWT)と押して放して話す方式(PTT)の二通りがあり、どちらで使えるのかユーザが分からずに誤用する可能性がある。
【解決手段】 ボタン押下の時間とユーザの発声の有無を検知することで、誤用であるか判断し、正しい使用方法をガイダンスする。PWTでは、ボタン押下の時間が短くかつその後にユーザの発声がある場合、PTTと誤用されているとする。PTTでは、ボタン押下の時間が長くかつその間にユーザの発声がある場合、押しながら話す方式と誤用されているとする。 (もっと読む)


【課題】健聴者および難聴者の双方にとって適切になるように、スピーカの発する音を自動で制御することが可能なスピーカ制御装置等を提供する。
【解決手段】実施形態のスピーカ制御装置は、第一の人の位置と第二の人の位置とを検出する人物認識手段201と、第一および第二の人の位置に基づいて、第二のスピーカ102の指向性の範囲内に第二の人が入り且つ第一の人が入らないような、第二のスピーカ102の位置の範囲を算出する配置算出手段301と、当該範囲内に入るように、第二のスピーカ102の位置を変更する動作手段401と、第一の人に到達する第一のスピーカ101の音量が所定の範囲内となり、且つ、第二の人に到達する第二のスピーカ102の音量が所定の範囲内となるように、第一のスピーカ101および第二のスピーカ102の音量を調整する音量補償手段501と、を備えている。 (もっと読む)


【課題】音声処理装置のコストを増大することなく、自然な合成音声を生成し、複数の言い方で発話した場合であっても、この発話を認識することができる音声処理装置、端末装置、音声情報管理装置、および、プログラムを提供する。
【解決手段】ユーザデータを格納する端末装置2と通信可能な通信処理部31と、合成音声を生成する音声合成部38、および、入力音声を認識する音声認識部37の少なくとも1つとを備えた音声処理装置3において、通信処理部31は、ユーザデータの少なくとも1項目の項目値の韻律情報を含む読み情報、および、ユーザデータの少なくとも1項目の項目値の1または複数の認識文法を示す文法情報の少なくとも1つの情報を、端末装置2から取得し、音声合成部38は、通信処理部31が取得した読み情報を用いて、合成音声を生成し、音声認識部37は、通信処理部31が取得した文法情報を用いて、入力音声を認識する。 (もっと読む)


【課題】音声認識処理や音声合成処理の動作タイミングを外部から制御することにより、又は音声認識処理や音声合成処理を開始することを事前に予告するなど、ユーザや周辺装置等との連携をとることを可能とし、より利便性の高い半導体集積回路装置を提供する。
【解決手段】半導体集積回路装置は、記憶部に格納されたコマンド及びテキストデータに基づいて、テキストデータに対応する音声を合成して外部に出力する音声合成処理部と、音声合成処理開始制御信号に基づいて、コマンド及びテキストデータを音声合成処理部に転送するタイミングを制御する制御部とを含む。制御部は、音声合成処理開始イベントの発生に基づいて、音声合成処理部が合成した音声信号の出力を開始することを予告する音声出力開始予告信号を外部に出力する制御を行った後、音声合成処理部が合成した音声信号の外部への出力を、所与のタイミングで開始する制御を行う。 (もっと読む)


【課題】 歯の検査において、検査者が単独で検査及び記録を行うことを可能とし、その処理の効率化を図る装置や方法などを提供すること。
【解決手段】 歯の各検査部位の検査結果を記録するための記録装置又は記録プログラムに対しての入力をコンピュータに実行させるときに、記録装置又は記録プログラムの状態を監視し、監視により得られた状態に基づいて、音声認識の処理方法を決定し、決定された処理方法によって音声入力装置を介して入力された音声を認識し、認識された認識結果を、検査結果として、記録装置又は記録プログラムに入力する。 (もっと読む)


41 - 60 / 119