説明

Fターム[5D015KK04]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 音声合成装置との結合 (119)

Fターム[5D015KK04]に分類される特許

81 - 100 / 119


【課題】エンターテインメント性を向上させ得る学習装置及び学習方法並びにロボット装置を提案する。
【解決手段】対象とする物体の名前をユーザから取得する前から、当該対象とする物体の複数の異なる所定の特徴を学習するための学習用データを収集して当該物体の各特徴を学習し、対象とする物体の各特徴の学習結果及び予め記憶している既知の物体の各特徴の学習結果に基づいて当該対象とする物体を認識し、ユーザとの対話を通して取得した対象とする物体の名前と、当該対象とする物体の認識結果と、予め記憶している既知の物体の名前、当該既知の物体の各特徴に対する認識結果を関連付けた関連付け情報とに基づいて、対象とする物体が新規であると判断したときには、当該対象とする物体の必要な特徴を学習すると共に、当該対象とする物体についての関連付け情報を新たに記憶するようにした。 (もっと読む)


異言語のユーザと対話して音声翻訳を強化するアーキテクチャである。認識したコンセプトは収束され、装置との相互主導型ユーザ対話により曖昧さ解消がなされて、別言語を話す他者とのユーザコミュニケーションについて簡潔な推論を与える。注目点におけるコンセプト又は注目点となりそうな確立分布に基づいてコミュニケーション目標について推論を適用し、選別した選択肢および、イメージ、テキストおよび/または音声翻訳をユーザの会話相手に対して認識させる。推論は、コンセプト、状況、目標を推論する根拠の一部として、および/または後者の曖昧さを解消する根拠の一部として、ユーザの入力を処理する。コミュニケーションに対するシステムの理解をエコーバックしてユーザに確認させることができる。コンテキスト依存的に認識および情報収集コンポーネントの焦点を絞ることができ、以前または現在のユーザの発話から認識した単語を利用して推論の焦点をさらに絞ることもできる。
(もっと読む)


【課題】検索技術において、擬人化の程度をより向上させる。
【解決手段】所定の検索対象物を所定のジャンルで分類したときの各ジャンルに関するユーザの嗜好状況を示すユーザ嗜好情報を記憶するユーザ嗜好記憶手段9、及び検索対象物を対象とするユーザ嗜好情報を考慮した検索を、検索結果がユーザにより採択されるまで繰り返す検索処理を行う検索手段を備えた検索装置において、検索処理が行われる毎に前記採択に至るまでに要した検索回数Nを、所定の検索履歴を生成すべく記憶する検索履歴記憶手段10、11を設け、検索手段により、検索履歴中の検索回数Nに基づき、所定の場合には、ユーザ嗜好情報により示されるユーザの嗜好と異なる検索結果となる検索を行うようにする。 (もっと読む)


【課題】
本発明は、ユーザとの音声対話によってユーザに情報を取得する情報端末を提供する。
【解決手段】
ユーザの音声をコマンドとして認識し、認識したコマンドに基づいた情報を提供する情報端末において、ユーザの指示によってトーク信号を出力するトーク信号部と、ユーザの発声した音声をコマンドとして認識する音声認識部と、情報端末の周囲の環境に関する環境情報を取得する環境情報取得部と、認識したコマンド及び取得した環境情報からユーザが意図する情報を推定する推定部と、情報端末の処理を制御する制御部と、を備え、制御部は、トーク信号の受信を契機として、音声認識部が認識したユーザのコマンドが得られたか否かを判定し、当該コマンドが得られない場合に、環境情報取得部が取得した環境情報を用いて推定部が推定した情報をユーザに提供する。 (もっと読む)


【課題】 従来、通信回線の品質や帯域について何ら考慮されていないため、通信回線の品質が悪かったり、帯域が不足している場合など、音声が途切れてスムーズに会話ができない、という問題がある。
【解決手段】 音声・文字情報統合手段13は、音声入力手段11から出力された送話音声信号を示す音声情報と、音声認識手段12により音声認識して得られた送話音声を示す文字情報とを統合した統合データを作成して、統合データ送信手段14より受信側の電話機5宛に送信する。受信側の電話機5は、受信した統合データから音声情報と文字情報を音声・文字情報分離手段52で分離し、音声歪み解析手段54で音声情報の歪み量を測定する。音声補完手段55は、音声情報を出力するが、音声の歪み量がしきい値以上の時には音声合成手段53により音声合成処理して得られた音声合成信号で音声情報を補完する。 (もっと読む)


【課題】 利用者にとって必要以上の待ち時間が生じることがなく、円滑な対話を維持することができる音声対話システム及びコンピュータプログラムを提供することを目的とする。
【解決手段】 音声を受け付け、音声認識用文法に基づいて受け付けた音声を認識し、認識した結果及び対話の進行手順を記述した対話シナリオ情報に基づいて対話を進行させ、受け付けた音声に対する応答を出力する音声対話システムにおいて、音声認識用文法を解析し、音声認識用文法の解析結果に基づいて音声を受け付けるまでの待ち時間及び/又は音声を継続して受付ける音声受付時間を増減する。 (もっと読む)


【課題】利便性よく所望の情報を検索することが可能な地図検索装置及び地図検索方法等並びに当該地図検索プログラムを記録した記録媒体を提供する。
【解決手段】本発明は、都道府県名、市町村名、および残りの住所の音声入力を受け付けて音声認識し、当該認識結果に対応する地図を検索する地図検索装置であって、都道府県名の音声入力を受け付けて音声認識し、市町村名の音声入力を受け付けなかった場合には、当該認識した都道府県名で示される都道府県を含む地図を検索する。 (もっと読む)


【課題】音声対話装置で用いる各種コンテンツの作成方法を簡素化する。
【解決手段】開発すべきアプリケーションに適合した対話の順序及び画像の表示順序を定めたシナリオテンプレートと、開発すべきアプリケーションで定められる入力項目名を表わす複数のスロット名及びこれらのスロット名に付したスロットIDと、予めスロットIDが埋め込まれ、このスロットIDの埋め込み位置に従ってスロット名を代入することにより対話相手に対し入力を促し、適正な入力を誘導する複数の対話文のテンプレートとを用意し、対話文のテンプレートに埋め込まれたスロットIDに従ってスロット名を代入し、スロット名が埋め込まれた対話文のそれぞれをシナリオテンプレートに代入し、シナリオファイル及びプロンプト音声ファイルを生成する。 (もっと読む)


【課題】音声対話インターフェース装置及び方法を提供する。
【解決手段】サウンド信号から人間の音声を認識する音声認識モジュールと、認識された音声から文章を抽出してユーザの意図を解釈するユーザ意図解釈モジュールと、解釈されたユーザの意図及び所定のドメインアクションフレーム情報を利用してユーザの意図を選択するユーザ意図選択モジュールと、選択されたユーザの意図に対応するシステム応答文章を生成するシステム応答生成モジュールと、を含み、ドメインアクションフレームは、ユーザが要請したサービス情報及びサービスを行うためのパラメータ情報を含むとともに、階層化されたツリー構造を構成する音声対話インターフェース装置。 (もっと読む)


【課題】 コンテンツの関連情報を簡易且つ迅速に確認可能なコンテンツ提供装置を提供する。
【解決手段】 コンテンツ提供装置100は、コンテンツの提供処理を行う制御ユニット10と、当該コンテンツの提供処理の際に、発話スイッチ20の押下に応じてマイク30によって集音された音声を認識する音声認識エンジン16と、音声認識結果に基づいてコンテンツのタイトルを読み上げる処理を行う読み上げ制御部12と、読み上げ処理に応じた音声を合成し、その合成した音声をスピーカ40から出力する処理を行う音声合成エンジン18とを有する。 (もっと読む)


【課題】従来の音声認識方法では、選択項目を合成音声により出力している間は音声認識を行うことが困難であった。
【解決手段】選択項目をガイドするガイド音声を出力する出力手段101と、出力手段101よって出力されたガイド音声の出力中又はその出力終了後に一定時間内に発声された、選択項目を選択するための選択指示を認識する音声認識手段106と、音声認識手段106によって選択指示が認識された場合、選択指示された選択項目を選択する対話制御・結果選択手段107とを備えることにより、出力手段101によってガイド音声が出力されている間、その出力が終了し一定時間が経過するまでに選択項目を選択する音声を発することで、音声認識手段106によってその選択項目を選択することができ、ガイド音声の出力中でも選択項目を選択することができる。 (もっと読む)


【課題】 その状況にあった、より使い易いインターフェイスをユーザに対して提供することが可能なインターフェイス設定装置及びインターフェイス設定方法等を提供する。
【解決手段】 本願のインターフェイス設定装置は、移動体の状態を示す情報を取得する状態情報取得手段と、ユーザとの間で情報の受け渡しを担うインターフェイスであって互いに異なる複数のインターフェイスに基づき、前記移動体の状態に応じたインターフェイスを設定するインターフェイス設定手段と、を備える。 (もっと読む)


【課題】話者の声質にあったより近い合成音声を出力することが可能な通訳装置、通訳方法、通訳プログラムを記録した記録媒体、および通訳プログラムを提供する。
【解決手段】第1の言語で入力された入力音声を音声認識する音声認識部101と、音声認識された結果を第2の言語に翻訳する翻訳部102と、翻訳された第2の言語を音声合成する音声合成部103と、第1の言語の声質を分析する声質分析部104と、第1の言語の声質と第2の言語の声質との類似性を計量する声質類似性計量部105と、声質類似性計量部105で得られた声質類似性計量結果に基づいて、音声合成部103で音声合成される第2の言語の声質を制御する声質制御部106とを備えることにより、第1の言語の声質と第2の言語の声質とが比較的類似したものになり、違和感を生じるのを極力少なくすることができる。 (もっと読む)


【課題】 入出力情報が音に限定される場合においても、ユーザに対話を中断させることなく対話の進捗率度を対話を中断することなく提示することができる音声対話装置を提供する。
【解決手段】 複数のスロットから構成されるタスクフレームの各スロットにデータを入力する音声対話装置であって、ユーザからの各スロットへのデータの入力を受け付ける入力部101と、タスクフレームの複数のスロットへのデータの入力の進捗度を算出する対話管理部103と、タスクフレームに対応した音情報を記憶する音情報DB105と、進捗度に基づいて、音情報の変化または選択を行なう出力音生成部106と、ユーザへ各スロットのデータの入力を要求する音声出力部104と、音声出力部104によるデータの入力要求と同時に、変化または選択後の音情報を再生出力する音出力部107とを備える。 (もっと読む)


【課題】 テキストのみの入力データに対しても、その入力データに対する応答データを出力することが可能な応答データ出力装置を提供する。
【解決手段】 入力部2がテキストデータを入力すると、応答予測部5は、格納部1が格納している文末語を利用して、テキストデータ内の疑問文を推定する。音声合成部3は、そのテキストデータを読み上げる。音声認識部4は、音声合成部3の出力に応じて発せられたユーザーの音声を音声認識する。応答作成部6は、応答予測部5が推定した疑問文と音声認識部6の認識結果とに基づいて応答データを生成する。出力部7は、その応答データを出力する。 (もっと読む)


【課題】自動スピーチ認識(ASR)エンジンをホストとするシステムから離れた場所にいるユーザがASRを利用できるようにする。
【解決手段】クライアント−サーバアーキテクチャを使用して、主ASRエンジンの場所から離れたクライアントの場所でASRサービスをアクセス可能にする。すなわち、 パケットネットワーク120、たとえばインターネットまたは無線ネットワークを介してクライアントPC140とサーバノード110が接続される。ASR サーバ100がASRクライアント130から文法を受け、または複数の文法からの選択を行い、クライアントからのスピーチを表す情報を受け、スピーチ認識 を実行し、認識したスピーチに基づくスピーチ応答を提供する。このようにして、パケットネットワークを介して、人間であるユーザとASRサーバとの対話が行われる。 (もっと読む)


【課題】 複数の装置間において行われる情報通信の進捗状況を、各装置の操作に不慣れな者でも概括的に理解することが可能であると共に、その進捗状況を各装置から離れている位置でも認識することが可能な情報通信システムを提供する。
【解決手段】 情報を送受信する際に実行される処理を時系列的に分割した処理の夫々に対応する台詞情報であって、当該各処理の内容を擬人的に且つ簡略化して示す台詞情報を記憶する記録部3及び16と、実際に各処理が実行されるとき、実行される処理に対応する台詞情報を記録部3又は16から読み出し、その読み出された台詞情報に対応する処理が実行されるタイミングにおいて、読み出された台詞情報の内容を音声化して出力する音出力部4又は17と、を備える。 (もっと読む)


【課題】 外部からの音に応じて良好に音声を出力させる音声出力装置を提供する。
【解決手段】 外部音を集音して取得した外部音データの音量に基づき、無音部分で外部音データから音声セグメント情報を分割する。音声セグメント情報をテキスト形式に変換して言語解析し、一言となる音声セグメント情報を音声データとする。音声データの前に位置する音声セグメント情報中の語句と音声データの語句との関連度合いを、経過時間が長くかつ語句の数が多くなるに従って小さくなるスコア値に設定し関連度情報を生成する。音声データに語句情報および関連度情報を関連付けて1つの音声情報を生成する。外部音データ中に、音声情報の語句情報と同一の語句を認識すると、この語句情報の音声情報を検索し、無音期間が1〜2秒以上経過した際、最も高いスコア値となる関連度情報の音声情報の音声データを音声出力する。 (もっと読む)


【課題】危険が検知されたときには必ず動作し、効果的かつ効率的に使用される音声認識装置を提供すること。
【解決手段】音声を入力する音声入力手段10と、音声入力手段10によって入力された音声を情報信号に変換する音声認識手段20と、危険を検知する検知手段30と、検知手段30によって危険が検知されたときに音声認識手段20の動作を開始させるスイッチ手段40とを有し、音声入力手段10によって入力された音声を操作信号R100として操作対象機器に送り出すことを特徴とする音声認識装置を構成する。 (もっと読む)


【課題】 外部からの音に応じて良好に音声を出力させる音声出力装置を提供する。
【解決手段】 外部音を集音して取得した外部音データの音量に基づき、無音部分で外部音データから音声セグメント情報を分割する。音声セグメント情報をテキスト形式に変換して言語解析し、一言となる音声セグメント情報を音声データとする。音声データの前に位置する音声セグメント情報中の語句と音声データの語句との関連度合いを、経過時間が長くかつ語句の数が多くなるに従って小さくなるスコア値に設定し関連度情報を生成する。音声データに語句情報および関連度情報を関連付けて1つの音声情報を生成する。外部音データ中に、音声情報の語句情報と同一の語句を認識すると、この語句情報の音声情報を検索し、無音期間が1〜2秒以上経過した際、最も高いスコア値となる関連度情報の音声情報の音声データを音声出力する。 (もっと読む)


81 - 100 / 119