説明

国際特許分類[G10L15/22]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声認識処理中の手順,例.マン・マシン対話 (884)

国際特許分類[G10L15/22]に分類される特許

71 - 80 / 884


【課題】入力音声信号を処理する方法および装置を提供すること。
入力音声信号の開始は、決定される(701)際の出力オーディオ信号に対する、出力オーディオ信号と入力開始時間との生成の間に検出される。入力開始時間は、次に、入力音声信号に応答するのに使用されるために提供される(704)。入力音声信号が、出力オーディオ信号が生ずる間に検出されるとき、出力オーディオ信号の識別は、入力音声信号に応答するのに使用されるために提供される。データおよび/または制御信号を備えている情報の信号(705)は、少なくとも提供されるコンテキスト上の情報、すなわち、入力開始時間および/または出力オーディオ信号の識別に応じて提供される。本発明は、基礎をなす通信システムの遅延特性にかかわらず、出力オーディオ信号に対する入力音声信号のコンテキストを精密に確立する。 (もっと読む)


【課題】観測音が認識対象とする音であるか否かの判定を漏れなく行う。
【解決手段】HMMを用いて、観測音から抽出した特徴量の、目的音に基づく第1の認識モデルおよび非目的音に基づく第2の認識モデルに対する尤度と、観測音が目的音および非目的音のうち何れであるかを示す認識結果とを認識部で求め、認識結果が示す認識モデルに対応する尤度を用いて信頼度算出部で認識結果の信頼度を算出する。認識結果と信頼度とを用いて、認識結果の正解率を、観測音が目的音と仮定した場合と、観測音が非目的音と仮定した場合とについて正解率算出部で算出する。警報出力処理部は、認識結果と正解率と基づき、認識結果が目的音を示し、正解率が第1の閾値以下の場合と、認識結果が非目的音を示し、正解率が第2の閾値以下の場合とにおいて、観測音が目的音と非目的音の何れにも属さない未知音であることを示す情報を出力する。 (もっと読む)


【課題】ユーザからの問い合わせに対して、行動履歴情報を検索して、ユーザにとって有意な回答を出力可能な行動履歴検索装置を提供する。
【解決手段】行動履歴検索装置は、ユーザからの問い合わせを受け付け、当該問い合わせを受け付けた時刻と、問い合わせの対象とを出力し、問い合わせの対象を用いて、ユーザの行動の履歴を時刻と共に示す行動履歴情報を検索する範囲を決定し、この範囲内の行動履歴情報によって示される時刻から、出力された時刻までの経過時間を算出し、経過時間と、行動履歴情報によって示される行動の履歴から求められる問い合わせの回答の候補に対してユーザの所望の回答である可能性を経過時間に応じて判定するための絞込みモデルとを用いて、範囲内の行動履歴情報によって示される行動の履歴から、問い合わせの回答の候補毎に可能性を判定し、この可能性に応じて、回答の候補を出力する。 (もっと読む)


【課題】 ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応可能とする。
【解決手段】 携帯プレーヤ5が端末装置3に装着されると、端末装置3は、携帯プレーヤ5に記憶されている楽曲データのTOCデータを携帯プレーヤ5から読み込んで遠隔サーバ7に送信する。一方、TOCデータを受信した遠隔サーバ7は、このTOCデータに関連する情報を読み込んでTOCデータと関連付けながら辞書データを生成した後、その生成された辞書データを端末装置3に送信する。そして、受信した辞書データの辞書保持メモリ3Dに保存する。これにより、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応することが可能となる。 (もっと読む)


【課題】音声認識結果を用いながら発話単位等の長さに依らない所定の限られた遅延時間で、認識結果を修正してテキストとして逐次出力するテキスト修正装置を提供する。
【解決手段】テキスト区間推定部は、認識結果単語列データ記憶部に書き込まれた認識結果単語列データの長さが予め定められた所定値N以上であるか否かを判定するとともに、当該長さがN以上であると判定されると、テキスト単語列データ記憶部に記憶されている前記テキスト単語列データと認識結果単語列データとのマッチング処理を行ってテキスト単語列データと認識結果単語列データとの間の類似度を算出し、算出された類似度に基づいてテキスト単語列データを修正候補として選択する。誤り修正部は、テキスト区間推定部によって選択されたテキスト単語列データとの間の不一致区間について、テキスト区間推定部によって選択されたテキスト単語列データに基づく修正を行う。 (もっと読む)


【課題】音声対話装置において、話者の感性に即した円滑な対話を行うこと。
【解決手段】応答制御部7は、音声認識部4が認識した話者の発話内容に応じた応答音声を、音声合成部2からスピーカ8を通じて出力する。この場合、通常状態では、音声認識部4が話者の発話の終了を検出した時点から応答音声の提供を開始するまでの応答時間を、話速検出部5により検出された発話速度に応じて変化させる。 (もっと読む)


【課題】 音声認識装置の作動制御が破綻してしまうことを抑制する。
【解決手段】 ユーザが触れて操作するトークスイッチの操作回数(クリック回数c)に基づいて音声認識エンジンが参照すべき認識辞書を選択する。これにより、音声の誤認識に起因して参照すべき認識辞書の選択ミスが発生することはないので、音声認識装置の作動制御が破綻してしまうことを抑制することができる。 (もっと読む)


【課題】コンタクトセンタ等における対話内容の検索・分析・視聴の効率化を図る。
【解決手段】音声認識部は、対話音声信号が入力され、認識辞書を参照して音声認識処理を行うことにより、テキスト文書に変換して出力する。個人情報検出部は、認識辞書を参照してテキスト文書を構成する各単語について個人情報にあたるか否かを判断し、個人情報にあたる各単語のテキスト文書内での位置情報を出力する。本人確認発話位置特定部は、各単語の位置情報に基づき、個人情報にあたる単語が集中して現れている部分を特定する。挨拶発話位置特定部は、テキスト文書が入力され、定型辞書を参照して開始定型文と一致する文字列を含む部分及び終了定型文と一致する文字列を含む部分をそれぞれ特定する。対話内容抽出部は、本人確認発話位置特定部及び挨拶発話位置特定部でそれぞれ特定された部分以外の残りの部分をテキスト文書から時系列に抽出する。 (もっと読む)


【課題】音声認識用のデータベースに登録されていない施設の名称等をユーザーが繰り返し発声したような場合に、誤認識が続くことを防止する。
【解決手段】音声認識手段による音声認識結果が連続して誤認識であるとユーザーに指摘されたときに、今回入力された音声データと前回入力された音声データとを比較する比較手段を備え、比較手段により今回入力された音声データと前回入力された音声データとがほぼ一致したと判断されたときに、ユーザーが入力したい施設の名称の別の呼び方を話すようにユーザーに促す旨のガイダンスを出力するガイダンス出力手段を備えた。 (もっと読む)


【課題】利用者が外出先等で音声を入力して音声認識を行う場合においてその場所で入力された音声の音声認識結果の誤りを低減させる。
【解決手段】音声認識支援システムは、場所を示す場所情報と、該場所についての音声認識結果の精度を示す情報とを対応づけて出力する場所認識結果精度情報出力手段501と、前記場所認識結果精度情報出力手段によって出力された場所情報と音声認識結果の精度を示す情報とに基づいて、認識対象の音声を入力する場所として指定された場所が音声認識に適しているか否かの情報を出力する音声認識場所適否情報出力手段502とを備えている。 (もっと読む)


71 - 80 / 884