説明

Fターム[5D015LL06]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 認識結果の表示・出力 (271) | 合成音声による出力 (71)

Fターム[5D015LL06]に分類される特許

1 - 20 / 71


【構成】 コミュニケーションシステム10は、ロボット12およびサーバ20を含み、ロボットはユーザに指示された物品を特定し、サーバは、ロボットからの要求に応じて、特定した物品を確認するための指差し動作および発話内容を生成する。発話内容を生成する際には、特定した物品の複数の属性についてのべき集合を生成し、当該特定した物品の近傍に存在する他の物品の複数の属性についてのべき集合を当該他の物品毎に生成する。サーバは、特定した物品についてのべき集合の要素から、他の物品のそれぞれについてのべき集合と共通する要素を削除する。サーバは、残った要素のうち、単語数が最も少ない要素を選択し、さらに、選択した要素のうち、特定した物品の近傍に存在する他の物品の複数の属性の文字列との非類似度が最も高い要素を選択して、発話内容を生成する。
【効果】 確認行動における発話内容を簡単に生成することができる。 (もっと読む)


【課題】操作者が器具を咥えながら喋った単語を正しい単語に変換して送信する通信装置を提供する。
【解決手段】通信装置の補償回路7において、単語変換部72は、A/D変換器6から受けたデジタル信号に基づいて単語を認識し、その認識した単語を判定部73へ出力する。また、単語変換部72は、単語が誤っていることを示す信号ICORを判定部73から受けると、内蔵している電子辞書721を用いて正しい単語の候補単語を抽出して判定部73へ出力する。判定部73は、単語変換部72から受けた単語をスピーカ2を介して潜水者に提示し、その提示した単語が正しい単語であることを示す信号CORを操作ボタン11から受けると、単語変換部72から受けた単語を正しいと判定してモデム8へ出力する。一方、判定部73は、信号CORを受けないとき、信号ICORを単語変換部72へ出力する。 (もっと読む)


【課題】音声認識のための音声が入力された時点での雑音等の環境音や、該入力音声の音量、音声信号の途絶等の特徴を好適に利用する。
【解決手段】音声信号処理システムは、音声信号を入力する音声入力手段101と、音声入力手段101を介して入力された音声信号である入力音声信号を格納する入力音声格納手段102と、入力音声格納手段102に格納された入力音声信号を参照し、入力音声信号に含まれる環境音を含む該入力音声信号によって示される入力音声の特徴を推定する特徴推定手段103と、参照音声となる所定の音声信号を発生させる参照音声発生手段104と、特徴推定手段103によって推定された入力音声の特徴を、参照音声発生手段104が発生させた音声信号である参照音声信号に反映する特徴反映手段105とを備えたことを特徴とする。 (もっと読む)


【課題】音声認識用のデータベースに登録されていない施設の名称等をユーザーが繰り返し発声したような場合に、誤認識が続くことを防止する。
【解決手段】音声認識手段による音声認識結果が連続して誤認識であるとユーザーに指摘されたときに、今回入力された音声データと前回入力された音声データとを比較する比較手段を備え、比較手段により今回入力された音声データと前回入力された音声データとがほぼ一致したと判断されたときに、ユーザーが入力したい施設の名称の別の呼び方を話すようにユーザーに促す旨のガイダンスを出力するガイダンス出力手段を備えた。 (もっと読む)


【課題】ユーザがローカル音声認識とセンタ音声認識を容易に区別できるようにする。
【解決手段】センタ音声認識に伴ってスピーカ11より出力させる音声とローカル音声認識に伴ってスピーカ11より出力させる音声の特徴が区別可能となるようにローカル音声認識に伴ってスピーカ11より出力させる音声を加工し、この加工した音声を用いて音声認識に伴う音声をスピーカ11より出力させる(S104〜S110)。 (もっと読む)


【課題】携帯端末の機能に従って表示される情報に相当する情報を、車両を運転中のドライバがより容易に確認することを可能にする。
【解決手段】車載ナビゲーション装置の車載側BT通信部44が、携帯電話機からBT通信によって音声認識結果を受信し、車載側BT通信部44で受信した音声認識結果をもとに、車載側制御部45が当該音声認識結果についてのトークバック音声を車載側音声出力部42から出力させる。 (もっと読む)


【課題】未登録語を登録する際、ユーザが音声のみを用いて認識した音韻を訂正することができる音声認識装置、音声認識方法、及び音声認識ロボットを提供する。
【解決手段】音声入力部は音声を入力し、音韻認識部は入力された音声の音韻を認識して訂正発話を示す第1の音韻列を生成し、マッチング部は第1の音韻列と元発話を示す第2の音韻列とをマッチングを行い、音韻訂正部はマッチングを行った結果に基づき第2の音韻列の音韻を訂正する。 (もっと読む)


【課題】ユーザ発話の誤認識や不認識を低減して、検索効率の高い音声対話装置及びプログラムを提供する。
【解決手段】音声対話装置は、音声コマンドである語とそれを示す分類との対からなる音声コマンドリストと、検索対象データベースの検索キーワードである語とそれを示す分類との対からなる検索キーワードリストと、音声コマンドでも検索キーワードでもなく検索対象外ワードである語とそれを示す分類との対からなる対象外ワードリストと、を有する音声認識辞書16と、ユーザにより入力された音声データを音声認識して、音声認識辞書16に含まれる語とその分類を抽出する音声認識部17と、抽出された語の分類が検索対象外ワードである場合には、抽出された語が対象外ワードであることを示す応答を生成する対話制御部18と、対話制御部18により生成された応答を提示する提示部20と、を備えている。 (もっと読む)


【課題】ユーザの対話意欲を促進させることができる応答を可能にする。
【解決手段】本発明に係る対話処理装置1は、ユーザの音声を認識する音声認識部2と、音声認識手段2による認識結果に基づいて、ユーザが発話した発話文の少なくとも係り受け関係を解析する構文解析部3と、構文解析手段3により解析された係り受け関係に関する情報を、ユーザの発話の進行に伴い蓄積していく係り受け関係記憶手段4と、係り受け関係記憶手段4に蓄積された係り受け関係に関する情報に基づいて、発話文の内容を纏めた纏め文を生成する応答生成手段6とを備える。 (もっと読む)


【課題】 空港の管制業務に負担をかけることなくヒューマンエラーを防止できるようにする。
【解決手段】空港面の航空機の位置を検知し、管制官の音声による航空機への移動指示を解析する。そして、検知した航空機の現在位置と、解析した音声による移動指示から算出した誘導経路を同時に表示する。これにより、管制官が無線による音声通話でパイロットに対して行う移動経路の指示自体を、指示入力手段の入力とすることができるため、管制業務に負担をかけることなくヒューマンエラーを防止できる。 (もっと読む)


【課題】同音意義の単語、および読みが類似する単語に対しても、これを迅速に且つ有効に識別することを可能とした音声認識応答方法、システム等を提供すること。
【解決手段】入力された音声データを音声認識装置13が認識し対応する同一の又は近似した単語データとその識別用修飾語とを、記憶部から検索して抽出し、これに基づいて音声生成出力装置16が文章形式の確認用定型文を生成、音声再生出力装置18を介して外部出力する。これに対し、話者からその内容否定の応答が入ると前記音声認識装置13及び修飾語検索装置14が他の同一の又は近似した単語データとその修飾語とを記憶部から再抽出し、これに基づいて確認用定型文が生成され、外部出力する。これに対し外部からその内容肯定の応答が入ると、入力された前記音声が認識された旨を表示する確認用定型文を前記音声生成変換装置16が生成し音声再生出力装置18を介して外部出力する。 (もっと読む)


【課題】音声操作を行った人に対して、正確にトークバックすることを課題とする。
【解決手段】音声出力装置30は、マイク11により集音された音声信号から、人が発話した音声信号を示す発話信号を検知し、集音された音声信号を用いて、発話者を特定する。続いて、音声出力装置30は、検知された発話信号を音声認識された結果に基づいて、発話者にトークバックする音声信号であるトークバック信号を作成する。その後、音声出力装置は、特定された発話者に対して、作成されたトークバック信号を出力する。 (もっと読む)


【課題】音声認識処理を利用してテキスト入力を実現しつつ、ユーザビリティを向上可能な対話文生成装置を提供する。
【解決手段】対話相手からの第1のテキストを受信する受信部101と、対話相手となり得る人物毎に、人物固有の情報と人物に対応する定型テキストとが記憶される情報記憶部111と、第1のテキストの内容をユーザに提示する提示部104及び106と、提示された第1のテキストに関するユーザの発話に対して音声認識処理を行って、発話の内容を示す音声認識結果を生成する音声認識部109及び110と、対話相手に対応する情報及び定型テキストと、音声認識結果とに基づき第2のテキストを生成する生成部112と、第2のテキストを対話相手に送信する送信部101とを具備する。 (もっと読む)


【課題】来訪者の発話を高精度に認識することができる音声認識装置、音声認識プログラム、受付装置および受付プログラムを提供する。
【解決手段】来訪者が検知されると、受付装置から来訪者名および担当者名を質問する音声が出力される(S102)。質問に対する来訪者の応答が、複数のカテゴリに属する単語とその発音に関する情報の対応を示す汎用辞書と、予約データベースに予め記憶されている来訪者の予約に関する予約情報を基に作成された予約辞書を参照して音声認識される。汎用辞書の認識結果と予約辞書の認識結果とに基づいて決定された最終結果が得られる(S104)。最終結果が認識失敗を示す結果であれば(S105:YES)、来訪者に対して再発話が促され(S106)、認識に成功していれば(S105:NO)、最終結果に含まれる担当者名が特定され(S120)、その担当者への通知処理が行われる(S133)。 (もっと読む)


【課題】翻訳したい発話内容に目的言語の固有名詞が含まれる場合であっても、当該発話内容を音声入力する必要のある利用者の負担を軽減させることができる音声翻訳装置おび方法を提供する。
【解決手段】固有名詞抽出部は、文書から目的言語の固有名詞と意味クラスを抽出して検索情報記憶部に記憶させ、入力受付部は、原言語の音声発話の入力を受け付け、認識部は、受け付けられた音声発話を認識して文字列を生成し、一般名詞抽出部は、生成された文字列から一般名詞と意味クラスを抽出し、検索部は、抽出された一般名詞が属する意味クラスに属する固有名詞を検索情報記憶部から検索し、表示制御部は、検索された固有名詞を表示させ、選択受付部は、翻訳に用いる固有名詞の選択を受け付け、翻訳部は、生成された原言語の文字列を、翻訳に用いる固有名詞を用いて目的言語に翻訳し、出力制御部は、翻訳結果を出力させる。 (もっと読む)


【課題】ユーザが音声入力内容を複数に区切って発話した場合に、ユーザの発話内容を取りこぼすことがなく、且つ音声入力内容を区切る箇所に関係なくユーザの発話に沿った適切な応答音声を出力することができる「音声認識装置及び音声認識方法」を提供すること。
【解決手段】応答音声生成部から第1の発話に対する応答音声を出力する前にマイクで集音された音声から第2の発話を検出したときに(S20)、応答音声生成部に対し当該応答音声の生成及び出力を中止させる(S31)と共に、第1の発話に係る音声データの後端に第2の発話が終了するまでの音声データを結合させた結合音声データを生成して音声データ記録部に記録し(S36)、音声認識処理部に当該結合音声データの音声に対する音声認識処理を行わせて(S37)、応答音声生成部に音声認識処理部で音声認識された内容に基づいた応答音声を出力させる(S19及びS21)。 (もっと読む)


【課題】音声データの認識結果に対応する動作の内容に応じて、最適な応答内容を決定することができる音声認識装置を提供することを目的とする。
【解決手段】音声データを認識する認識手段104と、認識手段による認識結果の信頼度を算出する算出手段106と、認識手段による認識結果に基づいて応答した場合のユーザに与える影響度を判定する判定手段107と、算出手段により算出された信頼度と、判定手段により判定された影響度とに基づいて応答内容を決定する決定手段108とを備えることを特徴とする音声認識装置。 (もっと読む)


【課題】誤認識にともなう不快感およびストレスを軽減することができ、操作性を向上させることができる「音声認識装置」を提供すること。
【解決手段】再入力要求出力手段12により、音声認識の誤認識の回数の増加にともなって、再入力要求音声に含まれる謝罪表現の丁寧さの度合を高めること。 (もっと読む)


【課題】音声認識された文字列の正誤を容易に判別できるように、トークバック音声を出力する「音声認識装置」を提供する。
【解決手段】マイクロフォン1から入力する、ユーザの発声「024 636 0123」に対して、音声認識部32は間合いの無音区間で区切られた有音区間毎に音声認識を行って、各認識部分文字列「024」、「636」、「0123」を得る。トークバック音声データ生成部34は、各認識部分文字列「024」、「636」、「0123」を間にスペース文字を挿入した形態で連結し、文字列「024 636 0123」を生成する。そして、生成した文字列「024 636 0123」をトークバック音声データとして、音声生成装置35に出力する。音声生成装置35は、トークバック音声データを読み上げた音声を表す音声信号を生成し、スピーカ2から出力する。 (もっと読む)


【課題】ユーザ間のコミュニケーションを円滑に行うための情報処理システム、処理方法及びプログラムを提供すること。
【解決手段】ユーザ間のコミュニケーションを円滑に行うための情報処理システムであり、第一の話者から第二の話者へのコミュニケーションの処理を行う情報処理システムであって、第二の話者の特徴を抽出する第二の話者特徴抽出手段と、第二の話者の特徴に基づいて、第一の話者からの入力データを処理するコミュニケーション処理手段とを有することを特徴とする情報処理システムである。 (もっと読む)


1 - 20 / 71