説明

Fターム[5D015LL01]の内容

音声認識 (5,191) | 音声認識装置の制御 (1,048) | 後処理 (238)

Fターム[5D015LL01]の下位に属するFターム

Fターム[5D015LL01]に分類される特許

21 - 40 / 42


【課題】第1言語による第1定型文を選択するだけで、第2定型文を、そこに含まれる特定名称と共に出力可能とする。
【解決手段】第1言語による第1定型文、及び、第1定型文に対応する、第2言語による第2定型文を記憶する定型文記憶手段7と、定型文記憶手段7に記憶された第1定型文を選択するための定型文選択手段4と、少なくとも、第2定型文に挿入可能で、第2言語による特定名称を登録するための特定名称登録手段4と、定型文選択手段4によって選択された第1定型文に対応する第2定型文に前記特定名称を挿入して出力する定型文出力手段2とを備えた構成とする。 (もっと読む)


【課題】ユーザが適切な音声入力を行うための音声入力支援プログラム、音声入力支援装置、音声入力支援方法を提供する。
【解決手段】騒音環境下の音声入力の支援をコンピュータに実行させる音声入力支援プログラムであって、騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップとをコンピュータに実行させる。 (もっと読む)


【課題】利用者が音声認識された内容を容易に確認すると共に、音声の入力を受け付けた後、翻訳して出力するまでの時間を短縮して会話を適切に進める。
【解決手段】利用者から原言語による音声の入力を受け付ける音声入力受付部と、入力を受け付けた音声を認識し、原言語テキストを生成する音声認識部と、原言語テキストを目的言語に翻訳して、目的言語テキストを生成する翻訳部と、目的言語テキストをフレーズ毎に分割し、目的言語フレーズ群を生成する第2分割部と、原言語テキストをフレーズ毎に分割し、原言語フレーズ群を生成する第1分割部と、各目的語フレーズに対して、当該各目的語フレーズと意味的に等価な原言語フレーズを、対応付ける対応付部と、目的言語テキストにおけるフレーズ順で目的言語フレーズと、当該目的言語フレーズと対応付けられた原言語フレーズとを順次音声で出力する音声出力部と、を備える。 (もっと読む)


【課題】入力された数字区間に含まれる隣接する数字2文字が特定の範囲を意図していると判断された場合に、認識候補に「〜」「、」などの範囲を示す文字を前記2文字の間に挿入した候補を認識結果に示すことができる音声認識装置を提供する。
【解決手段】入力される音声信号を認識辞書を用いて単語列に変換する音声認識部102と、連続する単語列の品詞から数字文節を構成する範囲を切り出す数字文節解析部104と、連続する数字2文字とその後方の条件から特定の範囲を示す数字表現であることを知り、該文字間に範囲文字挿入用コードを付与する範囲文字挿入部105と、入力された数字文字列を、漢数字、アラビア数字、桁の有無など表記可能なパターンに展開し、更に数字文字列に範囲文字挿入用コードが含まれる場合、該コードを適当な範囲文字に置換した候補を作成する候補展開部107とを有する。 (もっと読む)


【課題】音声認識装置において、音声認識結果をユーザが再確認することによる誤り部分の見つけ出しなど、煩わしい作業を要さずに、容易に誤り部分を訂正して修正する。
【解決手段】音声入力部11に入力され音声認識部12で入力音声の文節毎に音声認識された文字列データを未確定文保持部13で保持して表示部14に表示させる。誤って音声入力した文節があった場合に、その文節を含む一文を言い直して音声入力し認識させると、同一判定部15にて前記未確定文保持部13に保持された前回音声認識に伴う未確定文とその文節毎の一致有無および一致数に基づき同じ文であるか否か判定される。そして言い直しによる同じ文と判定された場合は、修正統合部17で当該未確定文と今回認識文とが各文節毎に統合され、例えば一致文節についてはそのままの文節単語で、不一致文節については今回認識された文節単語で統合修正され新たな未確定文として更新表示される。 (もっと読む)


【課題】音声データの書き起こし作業を効率良く行うことができる音声データ書き起こし支援システムを提供する。
【解決手段】依頼者端末2は、音声データを複数の分割データに分割して、各分割データに対応するメタデータをサーバ1に送信する。サーバ1は、作業者端末6からのアクセスに基づいて作業者端末6に分割データのメタデータを提供し、分割データに対応するテキストデータを作業者端末6から受信してメタデータを更新する。依頼者端末2は、サーバ1におけるメタデータの更新を自動検知して、テキストデータを受信する。 (もっと読む)


【課題】騒音による音声認識時の誤認識を減らすこと。
【解決手段】音声認識部102は、使用者から入力された発話音声を認識し、言語理解部104は、音声認識手段による認識結果に基づいて使用者による発話内容を理解する。応答生成部109は、発話内容理解手段で理解した使用者による発話内容に応じて使用者に対する応答文を生成し、さらに騒音検出手段112で検出された音声認識に対する騒音の程度に基づいて、生成した応答文の内容を変化させる。そして、音声合成部110およびGUI表示部111は、内容が変化された後の応答文を出力する。 (もっと読む)


【課題】 ノイズ等の影響が大きい場合や、ささやき声やピッチ性が低い音声においても、ピッチ周波数の検出が有効に行え、入力音声の韻律的特徴に基づいて信頼性の高い音声認識を可能とする。
【解決手段】 入力部11からの入力音声を音響分析部12に送り、認識に必要な特徴量を抽出して識別部13に送る。識別部13では、パラメータ記憶部14のパラメータを用いて未知音声データに対する認識処理を行う。音響分析部12では、周波数特性分析部21にて入力音声から周波数特性への変換処理を行い、得られた周波数特性を特徴量分布移動変化量計算部22に送って、周波数特性の自己相関行列から得られる特徴量分布の移動変化量を求め、識別部13に出力する。 (もっと読む)


【課題】待ち受け語の一部を忘れた場合など、全てを正確に発話出来なくても、目的の語句を検索して所望の処理を実現すること。
【解決手段】まず、認識部101は、入力された音声から発話内容を認識する。識別部102は、認識部101によって認識された発話内容から、あらかじめ定められた置き換え語を識別する。次に、選択部103は、識別部102によって置き換え語が識別された場合、発話内容から置き換え語を除いた部分を待ち受け語と照合し、この部分を含む待ち受け語を選択する。そして、処理部104は、選択部103によって選択された待ち受け語に基づく処理を実行する。 (もっと読む)


【課題】対話シナリオの話題遷移に関する指定の開発・編集に関するコストを削減可能な対話装置、対話方法、対話システム、コンピュータプログラム及び対話シナリオ生成装置を提供する。
【解決手段】各話題を解決する話題シナリオを話題と対応付けて管理する対話シナリオ管理部104の話題シナリオを参照して対話進行部101でユーザとの対話を進行させるとともに、ユーザとの現在の話題情報を管理し且つ対話の進行段階での新規話題情報の導入の必要性を判断し、この判断で現在の話題情報に基づき遷移可能性のある一つ以上の次話題情報を遷移話題情報として次話題情報予測部103で予測し、この遷移話題情報を対話進行部101で管理される話題情報に反映し、この話題情報に基づき遷移話題情報選択部102により話題を継続させる。 (もっと読む)


【課題】新規に導入された対話内容と現在実行中の対話に対し柔軟な対話制御を行うことが可能な対話装置、対話方法、対話システム及びコンピュータプログラムを提供する。
【解決手段】対話進行部102からの新規話題情報の導入により、話題情報反映部103により話題情報管理部101から更新可能な話題情報を探索し、該検索された更新可能な話題情報の対話進行状況を新規の話題情報における対話進行状況に関する情報を用いて更新するとともに、対話進行状況の更新が局所的な話題を更新対象とするとき、該更新対象の更新と共に更新対象を現在の話題とするように前記話題情報管理部101の話題情報を消去する。 (もっと読む)


【課題】マルチモーダル・アプリケーションを含む音声使用可能アプリケーションにヘルプを供給する方法を提供する。
【解決手段】音声使用可能アプリケーションと関連する少なくとも1つの音声文法を識別し、音声文法内のヘルプ・フィールドを定義する。ヘルプ・フィールドは音声使用可能アプリケーション用に利用可能な音声コマンドを含むことができる。音声使用可能アプリケーションが使用するために音声文法がアクティブにされると、利用可能な音声コマンドを音声使用可能アプリケーションのユーザに提示することができる。提示される音声コマンドは、ヘルプ・フィールドから獲得することができる。 (もっと読む)


【課題】使用者の発話から適切に機器を特定して制御を行うことができる音声認識機器制御装置を提供する。
【解決手段】使用者から発話が入力される音声入力手段3と、入力された発話の内容を認識する音声認識手段4と、少なくとも認識された発話の内容に基づいて複数の機器5a〜5cのうちの制御対象となる機器を特定し、該特定した機器の動作を制御する機器制御手段6とを備える。各機器5a〜5cにおける動作の状態変化のうち、少なくとも使用者からの発話により生じた状態変化以外の状態変化を、制御対象となる機器を特定するための第1補助情報として記憶する状態変化記憶手段7を備える。機器制御手段6は、認識された発話の内容に基づいて制御対象となる機器を特定する第1機器特定処理を実行し、第1機器特定処理により該機器を特定できなかった場合には、少なくとも第1補助情報を該機器を特定するために用いる。 (もっと読む)


【課題】 ルールや辞書を複雑にせずに、解釈し得る入力音声の範囲を拡げる。
【解決手段】 入力音声からキーワードを抽出し、サブジェクトとなるオブジェクト毎に設けたビットをセットすると共に、肯定/否定に関するビットをセットする。オブジェクト毎にセットされたビットを連結した範囲を対象と解釈し、肯定/否定のビットで対象に対する入力を解釈する。 (もっと読む)


【課題】認識結果テキストに対して編集を加えた場合や、新規にテキストを編集した場合でも、編集結果テキストと音声データとを対応づけることができる音声テキスト化システム等を提供すること
【解決手段】音声テキスト化システム1は、編集手段22により得られた編集結果テキストに含まれる文字と音声認識手段11により生成された時刻情報つきの音声認識結果に含まれる文字とを対応づけるマッチング手段27と、このマッチング手段27によって得られた対応づけ結果を参照することで編集結果テキストに含まれる文字と音声データとを時刻情報により対応づけるアライメント手段28とを備えている。 (もっと読む)


エンド・ユーザからの記録オーディオ・データを受け入れるワイヤレス通信デバイスを開示する。オーディオ・データは、ユーザの行為を要求するコマンドの形態とすることができる。同様に、オーディオ・データはテキスト・ファイルに変換するテキストとすることができる。オーディオ・データを.wav、.mp3、vnfファイル等のような、デバイスのハードウェアが対応するフォーマットのディジタル声音データに還元する。更に処理するために、保証のあるまたは保証のないワイヤレス通信を通じて1つ以上のサーバ・コンピュータにディジタル声音ファイルを送る。本発明の重要な態様によれば、本システムは音声認識プロセスの信頼度レベルを評価する。信頼度レベルが高い場合、システムは自動的にアプリケーション・コマンドを構築するか、またはテキスト・ファイルを作成し、通信デバイスに送信する。逆に、音声認識の信頼度が低い場合、記録オーディオ・データ・ファイルを、電気通信サービスが雇っている転記者に引き渡し、転記者が手作業でディジタル声音ファイルを見直して、アプリケーション・コマンドまたはテキスト・ファイルを構築する。一旦アプリケーション・コマンドを作成したなら、これを通信デバイスに送信する。本発明の結果、通信デバイスに関しては、音声認識は90%以上の時間高精度であった。
(もっと読む)


【課題】 「回答不能」なユーザ発話に対しても、ユーザ発話状態に応じて会話の成立を維持する。
【解決手段】回答文と、当該回答文の次の順番で出力することが予定される回答文である次候補回答文を指定する次候補指定情報とをそれぞれが有する複数のプランを記憶する会話データベースと、第2のユーザ発話が次候補回答文と関連性がないか、若しくは関連性が不明である場合には、次候補回答文の出力を保留するプラン会話処理部と、プラン会話制御手段が次候補回答文の出力を保留した場合に、第2のユーザ発話に関連する話題を検索し、第2のユーザ発話に関連する話題を発見しない場合には、当該話題に関連する回答文の出力を保留する談話空間会話制御処理部と、談話空間会話手段が回答文の出力を保留した場合には、第2のユーザ発話からユーザの発話を判定し、判定結果に応じた回答文を出力するCA会話処理部とを有する。 (もっと読む)


【課題】ユーザの発話内容に応答しつつも、予め用意された一連の流れのある話や話題などを順々にユーザに出力する。
【解決手段】ユーザ発話に応じて複数の回答文をあらかじめ定めた順番に従って出力する会話制御装置であって、この会話制御装置それぞれが各回答文に対応するアクションであって、順番を定められた複数のアクションであるアクション列を有するプランを記憶したプランデータベースと、ユーザ発話に応じて、プラン記憶手段に記憶されたプランが有するアクションを選択し、アクションに対応する回答文を出力するプラン会話処理部とを有している。 (もっと読む)


【課題】音声認識の過程で得られる情報以外の情報を用いて音声認識結果を検証することができる音声認識結果の検証装置を提供する。
【解決手段】音声認識結果の検証装置38Jは、音声認識結果の妥当性を評価するための、音声認識の過程で得られる信頼度とは異なる所定の基準と、ある発話に対する音声認識装置36Jの出力60Jとを比較することにより、ある発話の音声認識結果の妥当性を表す、ドメイン内信頼度又は談話整合性による信頼度をそれぞれ出力するためのドメイン内検証部52J及び談話整合性検証部56Jと、ドメイン内信頼度又は談話整合性による信頼度と、音声認識装置36Jの出力する信頼度62Jとを所定の方法により統合し、ある発話に対する統合された信頼度尺度を算出するための信頼度尺度統合部58Jとを含む。 (もっと読む)


【課題】認識対象となる音声を装置側に入力する際、適正な状態で入力されたか否かをユーザに対して簡潔に報知する。
【解決手段】たとえば複数の単語を1つの組として発話された認識対象音声をディジタル化した音声データとして出力する音声入力部11と、その音声データを分析し音声パワーと特徴データを算出する音声分析部12と、この音声分析部12で得られた音声パワーに基づいて有効音声区間を検出し、この有効音声区間の時間的長さと音声パワーの大きさによって、認識対象音声が適正な状態で入力されたか否かを判断する音声区間検出・判定部13と、認識対象音声を認識処理する音声認識処理部と14と、認識対象音声が適正であることを示す判断結果を受けると、当該認識対象音声の入力直後にその認識対象音声が適正であることを示す情報を出力する情報出力部15とを有する。 (もっと読む)


21 - 40 / 42