説明

国際特許分類[G10L15/22]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識処理中の手順,例.マン・マシン対話 (884)

国際特許分類[G10L15/22]に分類される特許

41 - 50 / 884


【課題】複数の情報供給源が有っても、ユーザが所望する情報を正確に提供できる対話制御装置を提供する。
【解決手段】対話制御装置1は、サービス識別子と情報識別子の複数の組と各組に関連するキーワード及び重み係数とを記憶する記憶部32と、各キーワードについて入力された音声信号から検出された認識候補単語との類似度を重み係数が大きいほど大きくなるように算出し、類似度が最大となるキーワードを検出するキーワード決定部34と、検出されたキーワードと関連するサービス識別子と情報識別子の組により特定される提示情報を取得する提示情報取得部35と、現在の提示情報の供給源を表す第1のサービス識別子が以前に取得された提示情報の供給源を表す第2のサービス識別子との差異の有無に基づいて第1のサービス識別子と関連するキーワードの重み係数及び第2のサービス識別子と関連するキーワードの重み係数を更新する重み更新部39とを有する。 (もっと読む)


【課題】ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムを提供すること。
【解決手段】音声認識制御システム1は、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部11aと、音声認識コマンドを特定するコマンド情報と、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度DB12aと、影響度DB12aに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定部11bとを備える。 (もっと読む)


【課題】用件に対する話者間の対話時の音声信号から用件に係る必要情報を精度よく抽出することができる技術を提供する。
【解決手段】音声認識手段13は、話者間の対話時の音声信号を音声認識情報に変換する。会話単位分割手段14は、音声認識情報を会話単位に分割する。必要情報手掛かり情報付与手段16は、会話単位に含まれている必要情報手掛かり情報を会話単位に付与する。用件判別手段15は、音声認識情報に基づいて話者間の対話の用件を判別する。対話状態遷移判別手段17は、用件に対応する必要情報を抽出するための手掛かりとなる必要情報手掛かり情報が含まれている会話単位を選択する。そして、選択した会話単位と、用件に対応して対話状態判別情報データベース25に記憶されている対話状態判別情報に基づいて、対話状態が、情報要求対話状態、要求受理対話状態、情報開示対話状態、情報受理対話状態の順に遷移したことを判別することにより必要情報を抽出する。 (もっと読む)


【課題】認識誤り単語を除外して認識スコアを再計算する音声認識方法を提供する。
【解決手段】この発明の音声認識方法のNベスト候補スコア再計算過程は、過去発話単語の2単語ペアの関連度の平均値である過去発話関連度と、未来発話単語の2単語ペアの関連度の平均値である未来発話関連度とを求め、Nベストの全順位の現在発話単語と全ての過去発話単語の単語ペアの過去・現在関連度と、Nベストの全順位の上記現在発話単語と全ての上記未来発話単語の単語ペアの現在・未来関連度とを求め、上記過去発話関連度と閾値を比較すると共に上記未来発話関連度と閾値とを比較することで上記過去発話単語集合内の関連性と上記未来発話単語集合内の関連性を評価し、関連性がある場合は上記過去・現在関連度と上記現在・未来関連度の値を考慮した認識スコアを再計算する。 (もっと読む)


【課題】大幅に送信データ量を増やすことなくサーバ端末から音声認識用の音声特徴量と元の音声の発言内容を書き起こすための情報とを送信することができ、かつ、サーバ端末で元の音声の発言内容を示すテキストと音声認識用の音声特徴量を収集することができる技術を提供する。
【解決手段】クライアント端末の音声圧縮部が、入力音声信号を低ビットレートコーデックにより圧縮し圧縮音声信号を生成し、音声特徴量変換部が、入力音声信号を音声特徴量に変換し、送信データ結合部が、圧縮音声信号と音声特徴量とを結合し送信データを生成する。サーバ端末の送信データ分割部が、受信した送信データを圧縮音声信号と音声特徴量とに分割し、音声認識部が、音声特徴量を用いて音声認識を行い、認識結果を求め、音声復元部が、低ビットレートコーデックにより圧縮音声信号を低品質の音声に復元する。 (もっと読む)


【課題】設定された音声認識率と実際の音声認識率との間で大きな誤差が生じないようにする。
【解決手段】音声認識装置10は、複数の単語それぞれの特徴量を記録した記憶部12と、外部から入力された音声の特徴量と記憶部12に記録された複数の単語の特徴量とから各単語の類似度を算出し、算出した各単語の類似度から類似度の最大値を取得する類似度最大値取得部11bと、類似度最大値取得部11bが取得した類似度の最大値と所定値とを用いて類似度の範囲を決定する類似度範囲決定部11cと、類似度範囲決定部11cが決定した類似度の範囲に含まれる類似度を有する単語を選択し、選択した単語を認識結果として表示部15に表示する制御を行う表示制御部11dとを備える。 (もっと読む)


【課題】従来よりも性能の高い評価関数を導出する対話評価技術を提供する。
【解決手段】対話データ記憶部1には、複数のユーザのそれぞれについての各対話の対話データが記憶されている。統計量抽出部2は、対話データから各複数のユーザの対話の所定の発言の数の平均値及び対話の長さの平均値を計算し、また、対話データから評価関数の説明変数となる統計量を抽出する。クラスタリング部3は、計算された対話の所定の発言の数の平均値及び対話の長さの平均値に基づいて複数のユーザをクラスタリングする。評価関数導出部4は、各クラスタに対応する評価関数を、その各クラスタに含まれるユーザについての統計量を説明変数としユーザ評定値を応答変数とする重回帰分析により導出する。 (もっと読む)


【課題】置換コマンドを持つ音声認識方法を提供する。
【解決手段】第二のテキスト情報にて認識される四語の音声入力コマンドを伴う第一のテキスト情報内の誤認識したテキスト情報の要素を編集する音声認識方法において、第一のテキスト情報及び第二のテキスト情報を認識するステップと、第二のテキスト情報の第一の位置の単語が四語の音声入力コマンドのうちの第一の音声入力コマンドの要素との一致をチェックし、第二のテキスト情報の第三の位置又は他の位置の単語が四語の音声入力コマンドのうちの第三の音声入力コマンドの要素との一致をチェックし、四語の音声入力コマンドのうちの第四の音声入力コマンドの要素として第二のテキスト情報が含んでいる新たなテキスト情報の要素に、第一のテキスト情報で誤認識されたテキスト情報の要素を置換するステップとを有する。 (もっと読む)


【課題】単語レベルの変換候補生成に基づく音声認識システム及び方法が開示される。
【解決手段】音声認識システムは、音声認識の結果として、単語列及び単語列に含まれた単語のうち少なくとも1つの単語に対する変換候補単語が提供される場合、単語列及び変換候補単語を確認する音声認識結果確認部及び単語列を表示装置を介して表示するが、変換候補単語が存在する少なくとも1つの単語を単語列の残りの単語と区分して表示する単語列表示部を備え、単語列表示部は区分して表示された単語がユーザによって選択される場合、区分して表示された単語を変換候補単語に変更して表示する。 (もっと読む)


【課題】両手がふさがった状態でも、正解文字列と実際に記載されている文字列との照合作業を音声により行うことを可能とする音認識装置の提供。
【解決手段】装着者の音声を検出するマイクロフォンと、装着者に音声情報を伝達するスピーカと、正解文字列を読み取るための読取装置と、処理装置と、を備えるハンズフリー型の音声認識装置であって、処理装置が、装着者の読み上げた文字列を音声認識処理し、読取装置で読み取った正解文字列とのマッチングを行い、マッチングの判定結果を出力することを特徴とする音声認識装置。 (もっと読む)


41 - 50 / 884