説明

国際特許分類[G10L15/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879)

国際特許分類[G10L15/00]の下位に属する分類

国際特許分類[G10L15/00]に分類される特許

1,791 - 1,800 / 1,893


【課題】対環境性能を向上させて、より正確な音声認識を行う。
【解決手段】車両用音声認識装置10は、搭乗者が話す音声をマイクから入力して認識する音響パターン認識部50と、CCDカメラ22により搭乗者の口元を撮像した画像に基づいて音声を認識する画像パターン認識部54とを有する。車両用音声認識装置10の環境評価部70は、車両状態検出手段により検出された車両状態に基づいて、音響パターン認識部50の信頼度を示す第1スコア補正係数と画像パターン認識部54の信頼度を示す第2スコア補正係数とを求めるる。音響パターン認識部50により求められた信頼度スコアを第1スコア補正係数で補正するとともに画像パターン認識部54により求められた信頼度スコアを第2スコア補正係数で補正して補正スコアを求める。同一の結果を示す音声認識結果毎に対応する補正スコアを集計して合計スコアを求める。 (もっと読む)


【課題】 キー入力から音声入力への切り替えを容易にする。
【解決手段】 文字カーソルにより未確定文字列を指定した状態で特定のキーが操作されたことを検出し、この検出に応じて、音声の入力を許可し、キー入力を禁止する。 (もっと読む)


音声制御部100は、
オーディオ信号(103、105、107、109、111)をそれぞれ受け取る複数のマイクロホン(102、104、106、108、110)を有するマイクロホンアレイと、オーディオ信号から、ユーザ(U1)のクリーンな信号(117)を抽出するビーム形成モジュール(116)と、前記ユーザ(U1)により話された、オーディオ信号(111)により表された所定のキーワードを認識するキーワード認識システム(120)であって、前記認識に基づき前記ビーム形成モジュールを制御するように構成されたものと、前記音声信号(117)の認識された音声アイテムに基づき、前記装置(200)への命令を生成する音声認識部(118)とを有する。その結果、音声制御部(100)は、ユーザ(U1)により話された音声アイテムに対応するオーディオ信号の部分を、音声認識のためによりよく選択することができる。
(もっと読む)


【課題】 多言語対応の音声認識機能を搭載した場合の操作性の悪化を防止する。
【解決手段】 静止画像及び動画像の撮影記録が可能とされ、メニュー画面や各種の設定画面を複数種の言語のうち予め選択されたUI用言語で表示すると共に、撮影時に録音された音声に対し、複数種の言語のうち設定された言語で音声認識を行って字幕データを生成する機能を備えた撮影記録装置において、音声認識の実行にあたり、認識対象音声の設定が"AUTO"か否か判定し(120)、判定が肯定された場合はUI用言語として設定されている言語を、音声認識における認識対象言語として自動的に設定し(122)た後に、音声認識を行う。音声認識によって得られた字幕データは、動画像の再生時に字幕として表示される。 (もっと読む)


【課題】
検索結果一覧から目的の検索結果を効率的に選択可能とするシステム及び方法の提供。
【解決手段】
音声を入力する入力装置1と、音声認識部2と、データと、データに対応する音素列を関連付けて格納したデータ格納部3と、入力音声の音素列を検索キーとしてデータ格納部3を検索する検索処理手段41と、入力音声と一致又は類似する音素列を含むデータから代表データを生成する代表語生成手段42と、検索された複数の検索結果データを、代表データを用いて、階層的な構成に変換して表示装置5に出力する検索結果生成手段43を備えている。 (もっと読む)


【課題】特に発話の背景雑音による影響を大幅に低減できるようにして、実用に耐えられる認識能力を有し、使用者の必要とする情報を短時間で取得可能とする音声対話システムに適用可能な言語理解能力を有する対話理解装置を提供する。
【解決手段】対話による文脈情報も考慮してより尤らしい語の選定を行うようにするとともに、言語認識のための統合演算を行う際に、騒音の種類に対応した数値パラメータを用いて演算を行うことで、背景雑音による影響を大幅に低減して高精度の言語認識を行えるようにした。 (もっと読む)


【課題】
検索したい文字列が誤認識されていたり未知語であった場合にも対処可能で、かつ高速に検索することができる音声検索システムを提供する。
【解決手段】
連続単語認識手段12は、検索対象となる音声データを音声データ記憶手段11から読み出して認識し、単語単位の認識結果を認識結果単語列記憶手段13に記憶する。単語候補記憶手段18には、認識結果に出現し得る単語の候補を記憶しておく。単語候補記憶手段18に記憶されている単語は連続単語認識手段12の認識語彙と同一である。検索文字列入力手段14から入力された検索文字列は、検索文字列展開手段15によって、単語候補記憶手段18に記憶されている単語を使用して、検索文字列と音響的な距離が近い単語または単語列に展開される。検索手段16は展開された単語または単語列を認識結果単語列記憶手段13から検索し、結果を検索結果出力手段17に出力する。 (もっと読む)


【課題】操作者が発声した検索項目名の音声を認識し、その認識候補を得ることで、可能性の高い必要最小限の項目に絞り、情報検索の操作性の向上を図る。
【解決手段】ディスプレイ1に音声入力用ウインドウが表示されている状態で、操作者が音声入力部3のマイクロホン31に向かって、現在対象となっている階層に属する所望の検索項目を発声すると、その音声が音声入力部3により入力されて音声認識部5にて認識される。この認識の結果得られる複数の認識候補は、選択ボタンとして定義される検索候補として制御部8により上記ウインドウ内に表示される。ここでは、まず第1位の候補が選択状態となり、マウス2の操作により他の検索候補が選択されると、その選択された候補が新たに選択状態となり、その選択状態にある検索候補に属する次の階層の検索項目が、次の検索範囲となる。このようにして検索範囲を絞り、最終的な検索結果を取得する。 (もっと読む)


【課題】 音声認識機能を持ち隣接する複合機において、ある機器への指示が別の機器で誤認識されることを防止する。
【解決手段】 機器の音声操作が開始された場合に、近隣にある機器に対して音声操作を開始したことを示す情報を通知し、該情報を受信した近隣機器で音声操作を無効にすることで、誤認識を防止する。 (もっと読む)


遠隔教育において録画映像等を用いた第3者による身代わり受講を防止して、正規の受講者が受講していることを確認できる遠隔教育システムを提供する。遠隔教育システム(1)はWebサーバ(10)と双方向通信サーバ(20)とコンテンツ配信サーバ(30)と運営管理システム(40)と講師端末(60)と通信回線接続装置(70)とから構成され、インターネット(2)を介して受講者端末(101、102、…)に対して遠隔教育が提供される。運営管理システム(40)は講座スケジュールと出席簿と受講者の個人情報・顔画像・音声等が登録された講座情報データベース(50)を備え、講座設定処理(41)と受講登録処理(42)と講座開設処理(43)と受講確認処理(44)等を行う。受講確認処理(44)は受講者画像取得処理(45)と顔画像照合処理(46)とアクション要求処理(47)とアクション検出処理(48)とから構成され、受講者の顔画像の照合と要求したアクションに対する画像変化を検出する。
(もっと読む)


1,791 - 1,800 / 1,893