説明

国際特許分類[G10L15/22]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識処理中の手順,例.マン・マシン対話 (884)

国際特許分類[G10L15/22]に分類される特許

101 - 110 / 884


【課題】ユーザとの音声対話を利用して発話テンプレートを生成する音声対話装置を提供する。
【解決手段】特定の話題に関する複数のキーワードと、前記各キーワードにそれぞれ対応した概念とを格納したキーワード辞書171と、ユーザの発話文を音声認識する音声認識部13と、音声認識した前記発話文中に、前記キーワード辞書に格納された前記キーワードが含まれていた場合、前記キーワードを前記キーワードに対応する前記概念に置き換えて、置き換えた前記発話文を新しい発話テンプレートに設定し、テンプレート辞書181に格納するテンプレート生成部12とを有する。 (もっと読む)


【課題】オリジナルの画像データを再生している最中に、オリジナルの画像の構図及び構成を維持したまま、音声データに含まれる音声内容を反映した画像も表示させる処理を容易かつ手軽に実現する。
【解決手段】音声出力部19は、音声データを再生することによって、当該音声データにより表される音声を出力する。音声内容認識部52は、音声出力部19の再生対象の音声データを解析することによって、当該音声データに含まれる音声内容を認識する。表示部18は、画像データを再生することによって、当該画像データにより表される画像を、オリジナルの画像として表示する。音声内容反映部54は、表示部18により画像データが再生されている最中に、オリジナルの画像の構成及び構図を維持したまま、音声内容認識部52により認識された音声内容を反映させた画像を表示する処理を、音声内容反映処理として実行する。 (もっと読む)


【課題】要約装置構築のコストを低減し、要約の精度を向上する。
【解決手段】本発明の対話学習装置は、各対話に含まれる発話にトピックラベルが付与されたN個の対話と各対話がK種類のドメインのいずれに該当するのかを示したドメインラベルを用いて、ドメインごとに、話者の発話を出力する状態を持つ隠れマルコフモデルを学習し、隠れマルコフモデルのすべての状態をエルゴディックに接続して、隠れマルコフモデルを作成する。本発明の要約装置は、特徴量抽出部、トピックラベル付与部、ドメイン推定部、選択部を備える。トピックラベル付与部は、発話ごとに、当該発話に含まれる単語から尤もらしいトピックを推定して、トピックラベルとして当該発話に付与する。ドメイン推定部は、各発話のドメインを推定する。選択部は、対話とドメインが一致する発話を、当該対話の中から選択する。 (もっと読む)


【課題】オペレータと顧客の会話の入力音声データから、コンピュータがオペレータの入力漏れを判定するコールセンタにおけるオペレータ入力業務支援システムを構築する。
【解決手段】会話中に発せられるキーワードと、そのキーワードが発せられた場合にコンピュータのディスプレイ画面に入力が必要となる入力項目との対応関係をあらかじめ定義しておき、会話中から取得したキーワードから、入力が必要な項目を判定し、オペレータが余分な操作をすることなくコンピュータが入力漏れを判定する。 (もっと読む)


【課題】ユーザが音声認識を利用してデータベースから特定の情報を絞り込む際に、効率的に検索結果を絞り込むことのできる音声検索インタフェース装置を得る。
【解決手段】検索手段105は、音声認識結果の単語または単語列に対して検索用データベース104を検索してその検索結果と検索候補数を出力する。修正候補生成手段111は、修正対象単語選択手段109で修正対象単語が選択された場合、その修正対象単語と、読み・音節記憶手段110の単語とのマッチングを行い、単語単位の修正候補を生成し、かつ、修正候補に対する検索候補数を取得する。修正候補表示手段112は、修正候補生成手段111で得られた修正候補と検索候補数とを表示する。 (もっと読む)


【課題】例えばデータマイニングに用いるテキストを生成するのに好適な音声認識方法を提供する。
【解決手段】この発明の音声認識方法は、音声認識過程と、音声文書認識信頼度計算過程と、音声文書除去過程と、単語除去過程と、を含み、音声認識過程は入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力し、音声文書認識信頼度計算過程は音声認識結果を入力として音声文書全体の認識信頼度である音声文書認識信頼度を計算して出力する。そして、音声文書除去過程は音声認識結果と音声文書認識信頼度とを入力として所定の音声文書認識信頼度閾値未満の音声文書を除去し、単語除去過程は音声文書除去過程で除去されなかった音声文書の音声認識結果から所定の単語認識信頼度閾値未満の単語認識信頼度の単語を除去する。 (もっと読む)


【課題】音声認識結果の認識信頼度の精度を向上させる。
【解決手段】この発明の音声認識方法は、音声認識過程と、音声文書認識信頼度計算過程と、を含む。音声認識過程は、入力される音声文書を音声認識処理した単語毎に単語認識信頼度を付与した音声認識結果を出力する。音声文書認識信頼度計算過程は、単語認識信頼度から求めた音響信頼度と、音声認識結果を構成する単語間の関連度を示す関連度テーブルを参照して単語毎に当該単語とその他の単語との関連性を表す関連度から求めた文脈信頼度を求め、音響信頼度と文脈信頼度を統合した音声文書認識信頼度を音声文書毎に求める。 (もっと読む)


【課題】コンテンツのための音声認識パラメータを自動制御する。
【解決手段】音声認識装置は、音声データを含むコンテンツを取得するコンテンツ取得部107と、コンテンツを提供するWebページを取得するWebページ取得部102を含む。この音声認識装置は、コンテンツを提供するWebページに基づく解析を行って、音声データの特徴を示すテキストを抽出するWebページ解析部103を含む。この音声認識装置は、音声データのための音声認識パラメータを、抽出されたテキストに基づいて制御するパラメータ制御部106と、制御された音声認識パラメータに従って音声データに対して音声認識を行う音声認識部111とを含む。 (もっと読む)


【課題】 音声認識等の出力である誤りの含まれる認識文に対して、誤認識箇所の推定・補正候補提示を効率よく実行するとともに、重要な誤りに対して優先的に補正処理を行う装置を提供する。
【解決手段】 認識文に対して、特徴語抽出処理によって特徴語の集合である特徴語リストを抽出し、認識文中の単語のうち、特徴語リストに含まれない単語は、この文脈に即さない単語(以下、特異語と呼ぶ)であると判断し、誤りの可能性があると判断する。特異語と判断された各単語に対して、特徴語リストに含まれる単語ひとつひとつと、類似度を比較し、類似度が高いと判断された単語を、特異語に対する修正候補とする。このようにあらかじめ特徴語を抽出する。 (もっと読む)


【課題】ユーザが音声認識における誤認識結果を修正する際、ユーザによる明示的な区間の修正を行うことなく、正しい修正候補を提示することのできる音声入力インタフェース装置を得る。
【解決手段】音声認識手段103は、音声入力に対する認識結果の単語列を出力する。連結修正候補生成手段109は、音声認識手段103から出力された全ての単語を連結した語句と、複数の単語を連結した語句の情報が登録された連結読み・音節記憶手段108の語句とのマッチングを行い、語句単位の修正候補を生成する。差分抽出手段110は、マッチング結果の差分を抽出する。修正候補表示手段111は、差分抽出手段110で抽出された差分を修正候補として表示する。 (もっと読む)


101 - 110 / 884