説明

Fターム[5D015KK04]の内容

音声認識 (5,191) | 他機器との結合 (1,170) | 音声合成装置との結合 (119)

Fターム[5D015KK04]に分類される特許

101 - 119 / 119


【課題】危険が検知されたときには必ず動作し、効果的かつ効率的に使用される音声認識装置を提供すること。
【解決手段】音声を入力する音声入力手段10と、音声入力手段10によって入力された音声を情報信号に変換する音声認識手段20と、危険を検知する検知手段30と、検知手段30によって危険が検知されたときに音声認識手段20の動作を開始させるスイッチ手段40とを有し、音声入力手段10によって入力された音声を操作信号R100として操作対象機器に送り出すことを特徴とする音声認識装置を構成する。 (もっと読む)


【課題】 楽しみながらネイティブのイントネーションとリズム/テンポが同時かつ効果的に得られる語学練習機を提供する。
【解決手段】 模範音声データファイルと、マイク(11)から入力された練習者音声とが、任意に、かつ、繰り返し可能にスピーカー(22a)、(22b)から出力可能であると共に、画像データファイルと、テキストデータファイルと、対訳データファイルと、範音声波形データファイルと、練習者音声波形データファイルと、リズム/テンポ採点およびイントネーション採点とを基にして、模範音声と同調した内容でデータが選出されて表示画面を構成し、映像表示手段(21)から出力し、表示画面に表されたテキストデータファイルからのデータおよび対訳データファイルからのデータは、模範音声と同調した内容毎に視覚的変化が施される。 (もっと読む)


【課題】 未知語が含まれている入力音声に対して、精度の高い応答結果を出力する。
【解決手段】 音声データに対応する単語や文字が登録された辞書データを記憶する辞書データ記憶手段61と、文字列を区切る基準を表す予め定められた境界修正データを記憶する境界修正データ記憶手段62と、を備えると共に、入力された音声を辞書データに基づいて文字認識し、単語認識結果文字列と文字認識結果文字列とをそれぞれ生成する音声認識手段52と、単語認識結果文字列と文字認識結果文字列との少なくとも一方に基づいて単語認識結果文字列及び文字認識結果文字列のうち未知語であると判断される区間を推定する未知語区間推定手段53と、単語認識結果文字列と文字認識結果文字列とを組み合わせる文字列組み合わせ手段54と、この組み合わせられた文字列を用いて、未知語区間の境界を境界修正データに基づいて修正する未知語区間修正手段55と、を備えた。 (もっと読む)


【課題】自然で違和感の少ない音響環境下で高精度の音声認識を可能とする。
【解決手段】指向性を有する指向性マイクロフォン50に対して音声入力状態であることを検出したときに、複数のスピーカ41〜45のうち、音声認識の妨げとなるスピーカ41、42、44の音響の出力を抑制し、出力が抑制されたスピーカ41、42、44の音響を、抑制されなかったスピーカ43、45の音響に合成し合成音響を作成して出力する。このようにすれば、音声認識時に、発話者からの音声に混入する可能性のある必要最小限のスピーカ41、42、44の出力を抑制するのみで音声認識率を向上でき、自然で違和感の少ない音響環境下で高精度の音声認識が可能になる。 (もっと読む)


【課題】 入力音声について誤認識が生じた場合に、誤認識を解消するための適切な応答を行うことが可能な音声自動応答装置等を提供する。
【解決手段】 音声自動応答装置1は、音声入力を受け付け、入力音声に対応する音声データを生成する音声入力部11と、音声データについて音声認識処理を行う音声認識部12と、音声認識部12による音声認識処理において音声データの誤認識が生じた場合、音声入力の有無と、音声入力のタイミングと、発話音量と、発話速度と、発話長と、の少なくとも1つに基づいて誤認識要因を特定し、特定した誤認識要因に対応するガイダンスを音声出力部14から出力させる対話制御部13と、を備える。 (もっと読む)


割当装置(1)はテキスト情報(ETI)の1以上のワードにワードクラス情報(WKI)を割り当てる。ユーザに競合を通知するため或いはテキスト情報(TI)中のワードに関するバックグランド情報(HI)をユーザに与えるため、割り当てられたワードクラス情報(WKI)から形成されたワードクラスシーケンス情報(WK−AI)に基づいて、アクション(A)が実行される。
(もっと読む)


【課題】 電話番号入力時の音声認識率を向上させること。
【解決手段】 使用者によってマイク101を介して入力された発話内容の音声信号とメモリ1034bに読み込んだ言語モデルに含まれている各待受け単語との一致度演算を行って音声認識を行い、音声認識結果をスピーカー102を介して出力する。音声認識結果に誤認識が発生しており、使用者によって訂正スイッチ104bが押下された場合には、メモリ1034bに読み込まれている言語モデルの種類に基づいた訂正時用のガイダンス音声をスピーカー102を介して出力する。 (もっと読む)


【課題】 簡単かつ迅速に、データを処理できるようにする。
【解決手段】 CCDビデオカメラ31で、本41のカラーコード42を取り込み、カラーコード識別部61でこれを識別する。音声認識部62は、マイクロホン32で取り込んだ音声を認識する際、識別されたカラーコード42に対応する分野の辞書を選択し、参照する。視覚メッセージ発生部67は、音声認識部62で認知された結果に基づく視覚メッセージを発生する。スーパインポーズ部68は、ビデオ信号に視覚メッセージをスーパインポーズし、テレビジョン受像機33のディスプレイに供給し、表示される。本発明は、音声認識システムに適用できる。 (もっと読む)


【課題】 使用者が必要とするときのみ目的地設定を促すガイダンス音声を出力すること。
【解決手段】 履歴メモリ110に自車両の走行履歴を格納し、制御装置107は履歴メモリ110に格納された自車両の走行履歴に基づいて、自車両が使用者の精通度が低い範囲へ進入する可能性の高い地点を走行中であるか否かを判定して、自車両が使用者の精通度が低い範囲へ進入する可能性の高い地点を走行中であると判定した場合に、使用者に対して目的地設定を促すガイダンスをスピーカー108を介して出力する。 (もっと読む)


【課題】形式と内容が適切な応答を、短時間で返す。
【解決手段】 形式的応答生成部11は、入力文に対して、形式的応答文を生成し、応答出力制御部16に供給する。実質的応答生成部13は、入力文に対して、実質的応答文を生成し、応答出力制御部15に供給する。応答出力制御部16は、形式的応答文と実質的応答文の出力を制御し、入力文に対する最終的な応答文を出力する。即ち、応答出力制御部16は、例えば、形式的応答文を出力し、その後、実質的応答文を出力する。本発明は、例えば、対話を行うロボットなどに適用できる。 (もっと読む)


【課題】本発明は駅及び鉄道の交通機関において、その利用者が簡易に使用することができ、必要な最新情報を供給することかでき、且つ的確な誘導案内をすることができる誘導案内システム及びそのシステムに用いる誘導案内装置を提供することを課題とする。
【解決手段】鉄道、地下鉄、バス等の交通機関を利用する者を、駅の発券装置又は案内板等で目的地/目的物件を誘導案内する誘導案内システムにおいて、誘導案内する際に、利用者の発声する目的地/目的物件等の音声を取り込んで音声の目的地/目的物件等を正確に認識し、蓄積された情報より目的地/目的物件迄の交通機関及び各種情報を検索した後、探索された情報を音声に合成して利用者に報知することである。 (もっと読む)


ユーザの音声信号(SI)に含まれた音声情報を認識するために前記音声信号(SI)を検知し分析する、音声認識システムの動作方法が記載されている。該音声認識システムは、受信品質を表す受信品質値(SQ)またはノイズ値を決定する。前記受信品質値(SQ)が所与の受信品質閾値より下がったとき、または前記ノイズ値がノイズ閾値より上がったとき、前記音声認識システムはノイズに敏感ではない動作モードに切り替わり、および/または前記ユーザにアラート信号(SW)を出力する。また、適当な音声認識システムも記載されている。 (もっと読む)


大規模な自動対話テレコミュニケーションシステムに対するディレクトリアシスタント方法及び装置が開示される。前記ディレクトリアシスタント方法及び装置は、所望のディレクトリエントリを説明するようにユーザに要求するために自然言語対話システムを使用し、これらの説明を解析及び理解し、これらの意味を解釈するために関連知識データベースを使用する。最後に、前記ディレクトリアシスタント方法及び装置は、複数回の対話と、ディレクトリデータベースと、関連知識データベースから全ての利用することができる情報を統合し、前記ユーザの所望のディレクトリエントリ情報を提供する。
(もっと読む)


【課題】対話装置における対話の停滞の回避
【解決手段】 入力情報に含まれるパラメータを抽出する言語理解処理と、入力情報を言い回しパターンデータベースと照合して入力情報の言い回しタイプを抽出する言い回しタイプ抽出処理と、応答内容を決定する応答内容決定処理と、応答文の言い回しタイプを決定する応答文の言い回しタイプ決定処理と、応答内容と、応答文の言い回しタイプを参照して応答文を生成する応答文生成処理と、入力情報から抽出したパラメータと、入力情報から抽出された言い回しタイプと、応答内容と、応答文の言い回しタイプと、応答文とからなる履歴情報を記憶する履歴情報記憶処理とを実行させ、応答内容決定処理は言い換え応答出力判定処理を有し、対話の状況によっては一つの応答の中においてある概念について重複させて言及するような応答内容を決定し、異なる種類の言い回しタイプをそれぞれの言及に用いるように決定する。 (もっと読む)


【課題】システムからの音声出力の際に、ユーザに臨場感を喚起することができること。
【解決手段】複数のスピーカ50a〜50eが設けられている。メッセージに基づいて、複数のスピーカ50a〜50eの中からメッセージを出力するスピーカが決定される。このため、運転席側に設けられたスピーカ50a以外のスピーカ50b〜50eからもメッセージを音声にて出力することができる。この結果、運転席側に設けられたスピーカ50aのみからメッセージが音声にて出力される場合と比較して、臨場感が向上する。これにより、システムからのメッセージを音声にて出力する際に、ユーザに臨場感を喚起することができる。 (もっと読む)


【解決手段】 一実施形態では、利用者との第1の通信チャネルが確立され、相手との通信を可能にする第2の通信チャネルを確立するための音声利用者要求が受信される。前記音声利用者要求が認識されると、前記第2の通信チャネルが確立される。別の実施形態では、コンピュータおよび利用者通信装置の間の通信チャネルが確立され、音声要求を有する利用者入力が検出および格納される。利用者プロファイルにアクセスが行われ、当該利用者プロファイルに基づき第1の文法が選択される。アクティブな前記第1の文法を使って前記音声要求の認識が試行される。前記音声要求が認識されない場合は、前記第1の文法が無効化されて第2の文法が有効化され、この第2の文法を使って前記音声要求の認識が試行される。 (もっと読む)


【課題】長い消失区間に対しても音声を復元する事ができる音声信号の復元装置を提供する。
【解決手段】音声信号の復元装置は、入力される音声信号データ列に消失区間があるか否かを判定し、判定結果を示す第1の信号を出力するモニタ部48と、音響モデル42と言語モデル44とを用いて音声認識を行なう音声認識部46と、音声認識部46の認識結果から音声合成を行なう音声合成部52と、モニタ部48により制御され,消失区間では音声合成部52の出力を、それ以外では入力音声データを、それぞれ選択する信号混合部56とを含む。 (もっと読む)


【課題】 携帯電話などを利用して、曲名が不明であっても、目的の楽曲に関するデータを利用者に対して配信できるようにする。
【解決手段】音声通話部101が、電話による音声通話を着信して応答し、音声変換部103が、応答して受話した音声による楽曲のメロディーを符号化して変換データとし、検索部104が、この変換データにマッチするメロディーデータを備えた楽曲情報をデータベース内より取り出し、送信部105が、取り出した楽曲情報を、応答した音声通話の送話元の電話番号に対応するメールアドレスに送信する。 (もっと読む)


【課題】新規に文法やルールを作成せずに発話の区切りのあいまいさを考慮して解釈することができる音声対話装置、音声対話方法及び音声対話処理プログラムを提供する。
【解決手段】発話された音声の音響的な解析を行った音声解析結果が入力され、少なくとも前回の発話に対する音声解析結果を含む1つ以上の音声解析結果を記憶し、新規発話の音声解析結果が入力された場合に前記新規発話の音声解析結果と前記前回の発話の音声解析結果とを時間順序を保ったまま連結した連結音声解析結果を生成する連結処理を行うものである。 (もっと読む)


101 - 119 / 119