説明

国際特許分類[G10L15/08]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 音声認識 (6,879) | 音声の識別または探索 (1,500)

国際特許分類[G10L15/08]の下位に属する分類

国際特許分類[G10L15/08]に分類される特許

101 - 110 / 119


【課題】音声認識を改善するためのシステムおよび方法を提供すること。
【解決手段】システムのユーザは、システムに対して直接話すことができ、システムは、適切な応答によって、発声される言葉で応答する。特定のアプリケーションのためのシステムが実装される場合、文法規則は、サンプル発話から自動的に生成することができる。動的文法規則は、ユーザとシステムの間の相互作用の際に生成することもできる。予め定められた階層に基づいて文法規則の検索順序を配列することに加えて、音声認識をさらに改良するために、単一の会話のコンテキストの履歴に基づき動的に生成された検索順序を提供することができる。システムとそのユーザの間の対話を、記録し抽出することによって、音声認識エンジンによって使用し、言語モデルを洗練または作成することができ、これにより、特定の知識領域に関連する音声認識の精度を改善することができる。 (もっと読む)


【課題】放送された番組やコマーシャルに登場する対象物を視聴者が発声するときの表現に適するようにして手間がかからず簡単に入手すること。
【解決手段】放送を受信する放送受信部313、及び単語間の類義性を基準にして、複数の単語が各単語クラスに分類された類義語辞書を利用して、放送された言語モデルの表現形式における、所定の単語クラスの組み合わせが出現する頻度及び/または言語モデルの表現形式における、所定の単語クラスを基準とする所定の単語が出現する頻度を既に行われた音声認識の音声認識結果の履歴情報に基づいて補正するクラス重み修正部381、及び補正された言語モデルを利用して、視聴者が発声した音声を音声認識する音声認識部377、及びその音声認識結果に基づいて、キーワード情報を特定する付加情報記憶部317、及びその特定したキーワード情報に対応付けられた付加情報を表示する表示部318とを備える。 (もっと読む)


【課題】 話者の環境において動的に変化する雑音、および資源が限られていることから使用可能な計算能力が限られたシステム(組込み型)で動作する特定の要件に適合した、音声認識の方法およびシステムを提供すること。
【解決手段】 本発明は、音声認識システムを動作させるための方法およびそれぞれのシステムに関し、複数の認識装置プログラムは、音声認識用に活動化させるためにアクセス可能であり、単一の認識装置によって実行される音声認識の結果を効率よく向上させるために必要に応じて組み合される。様々な動作環境の動的に変化する音響条件、および使用可能な計算能力が限られた組込み型システムに適合するために、
a)センサ手段を使用して、たとえば話者および環境雑音などの音声認識境界条件を特徴付ける選択基準データを収集すること(210、220、230、240)、
b)最適な認識装置またはその組合せを複数の使用可能な認識装置から選択する(290)ために、収集されたデータを評価するためのプログラム制御されたアービタ手段、たとえばソフトウェア機構を含む意思決定エンジンおよび物理センサを使用すること(260)、
が提案される。
(もっと読む)


【課題】 乳幼児の泣き声から乳幼児の啼泣原因をより精度良く把握することを可能にする。
【解決手段】 入力された音声信号を周波数解析して音声信号の周波数スペクトルを求め、求めた周波数スペクトルを複数の周波数帯に分割したときの隣接する周波数帯間での変化の度合いq1,q2,q3,q4が予め定めたしきい値よりも大きい場合には、啼泣原因が「眠い」であると推定し、隣接する周波数単位での変化の度合いが予め定めたしきい値よりも小さい場合には、啼泣原因が「空腹」であると推定する。 (もっと読む)


【課題】正確な音を入力する。
【解決手段】入力音の特徴量を抽出する特徴量抽出部13と、抽出した特徴量に基づいて、一定の速度の拍子を生成する拍子生成部14と、生成した拍子を出力する音響出力部16と、楽曲の特徴量と音楽情報とを対応付けて蓄積する音楽情報データベース18を参照して、特徴量抽出部13が抽出した特徴量に基づいて楽曲を検索する検索部17とを備える。 (もっと読む)


音声情報(SI)に対応するテキスト情報(TI)を認識する音声認識装置(1)において、音声情報(SI)を、言語特性に関して特徴付けることができ、先ず、少なくとも二つの言語特性認識手段(20,21,22,23)を設け、言語特性認識手段(20,21,22,23)の各々は、音声情報(SI)を用いることによって、前記手段に割り当てられた言語特性を認識するとともに、認識された言語特性を表す特性情報(ASI,LI,SGI,CI)を発生するように配置され、次に、連続的に特性情報(ASI,LI,SGI,CI)の少なくとも二つのアイテムを考慮する間、音声情報(SI)に対応するテキスト情報(TI)を認識するように配置された音声認識手段(24)を設ける。 (もっと読む)


【課題】信頼性の高いキーワードを用いて認識対象語の辞書の再構築を適切に行い、この再構築した辞書を用いたその後の音声認識処理で適切な認識結果を得られるようにする。
【解決手段】信号処理装置6の認識処理手段11が第1の音声認識処理によりユーザ発話文からキーワードを抽出する際、無発話区間検出手段13がユーザ発話文における無発話区間を検出し、キーワード信頼性評価手段12が無発話区間に隣接して出現するキーワードであるかどうかによって、抽出した各キーワードの信頼性を評価する。そして、認識処理手段11は、所定の基準値以上の信頼度が得られたキーワードを用いて認識対象語の辞書を再構築し、再構築した辞書を用いた第2の音声認識処理により、ユーザ発話文に対する最終的な認識結果を得る。 (もっと読む)


【課題】キーワードによる認識対象語の絞り込みを適切に行って最適な語彙数の辞書を再構築し、その後の音声認識処理で適切な認識結果を得られるようにする。
【解決手段】信号処理装置6の認識処理手段11が、第1の音声認識処理でユーザ発話文から抽出したキーワードを検索キーワードとして用いて、辞書再構築のための認識対象語の絞り込みを行う。このとき、絞り込み度合い判断手段12が認識処理手段11による認識対象語の絞り込み度合いを判断し、絞り込みが過剰であると判断された場合には、絞り込み条件を緩和した上で認識対象語の絞り込みを再度行う。そして、最適な語彙数に絞り込まれた認識対象語で辞書を再構築し、再構築した辞書を用いた第2の音声認識処理により、ユーザ発話文に対する最終的な認識結果を得る。 (もっと読む)


【課題】 少ない演算量で精度良く、クロストーク成分を含む音声データから特定話者の音声データのみを抽出することができる特定話者音声出力装置及び特定話者判定プログラムを提供する。
【解決手段】 クロストーク音声認識装置1は、話者X、Yの各々に設けられたマイクMx、Myから音声データx、yを入力する音声データ入力手段2と、この音声データx、yの各々からフレームを抽出するフレーム抽出手段3と、フレームのパワーの大きさを算出する音声データパワー算出部4a、4bと、2つの音声データx、yのフレームの相互相関係数を算出する相互相関係数算出手段5と、フレームパワーと相互相関係数とに基づいて、フレームが話者X、Yの音声データかを判定する話者音声判定手段7と、話者X又は話者Yの音声データであると判定されたフレームを出力する減衰器8とを備えることを特徴とする。 (もっと読む)


【課題】
検索したい文字列が誤認識されていたり未知語であった場合にも対処可能で、かつ高速に検索することができる音声検索システムを提供する。
【解決手段】
連続単語認識手段12は、検索対象となる音声データを音声データ記憶手段11から読み出して認識し、単語単位の認識結果を認識結果単語列記憶手段13に記憶する。単語候補記憶手段18には、認識結果に出現し得る単語の候補を記憶しておく。単語候補記憶手段18に記憶されている単語は連続単語認識手段12の認識語彙と同一である。検索文字列入力手段14から入力された検索文字列は、検索文字列展開手段15によって、単語候補記憶手段18に記憶されている単語を使用して、検索文字列と音響的な距離が近い単語または単語列に展開される。検索手段16は展開された単語または単語列を認識結果単語列記憶手段13から検索し、結果を検索結果出力手段17に出力する。 (もっと読む)


101 - 110 / 119