説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

451 - 460 / 1,456


【課題】 音声入力した文字列を画像に重畳する際の表示位置の適正化を図った撮像装置、撮像制御方法及びプログラムを提供する。
【解決手段】 撮像装置(1)は、画像を撮像する撮像手段(2)と、入力音声を文字列に変換する変換手段(11)と、前記文字列を前記画像に重畳表示する際の表示位置を決定する決定手段(11)とを備え、好ましくは、前記決定手段(11)は、前記画像内の主要被写体に重ならない位置を、前記文字列の表示位置として決定し、または、前記画像内の主要被写体が人物である場合に、その人物の顔に重ならない位置を、前記文字列の表示位置として決定し、または、前記画像内の主要被写体に重なる位置を、前記文字列の表示位置として決定する。 (もっと読む)


【課題】使用者の視野の邪魔になることなく、使用者に音源の種類と方向とを報知可能な音認識装置を提供する。
【解決手段】 左右のマイクロホン2L、2Rと、マイクロホン2L、2Rから入力された左右の入力音の時間差に基づいて音源の方向を識別し、その音源方向を示す方向情報を出力する音源定位部と、左右の入力音の少なくとも一方の周波数パターンに基づいて音源の種類を識別し、その音源種類を示す種類情報を出力する音源同定部と、使用者に接触する部位に設けられた振動部3L、3Rとを備え、振動部3L、3Rが、種類情報で示される音源種類に対する振動パターンで振動するように構成されるとともに、異なる音源方向に対しては振動部3L、3Rのうち少なくとも1つの異なるものが振動するウェアラブル音認識装置1。 (もっと読む)


【課題】楽曲区間の終点を精度良く検出することが可能となる楽曲抽出装置を提供する。
【解決手段】音声信号から楽曲区間を抽出する楽曲抽出装置であって、音声信号の周波数領域における特徴量を算出する周波数特徴量算出部と、算出された周波数特徴量に基づいて、音声信号が楽曲部分のものか、非楽曲部分のものかを判定する第1判定部と、算出された周波数特徴量に基づいて、音声信号のジャンルを判定するジャンル判定部と、算出された周波数特徴量に基づいて、音声信号が前記ジャンルに係る楽曲部分のものか、それ以外の部分であるかを判定する第2判定部と、第2判定部において、音声信号が前記楽曲部分から、前記それ以外の部分に変化した個所を楽曲区間の終点として検出する、終点検出部と、を備える楽曲抽出装置とする。 (もっと読む)


【課題】未知語への対応が可能であり、音声対話や音声検索からの要求に耐えうる高い音素識別精度を有する調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラムを提供する。
【解決手段】調音特徴抽出装置では、入力部201より入力された音声がA/D変換部202においてデジタル変換され、特徴分析部210においてフーリエ解析及びフィルタリングされた結果、音声スペクトルデータが得られる。次いで、調音特徴抽出部220において、調音特徴の時系列データである調音特徴系列が抽出される。そして調音運動修正部230において、調音特徴系列の変位成分より速度成分と加速度成分とが抽出され、さらに各成分に基づき、ニューラルネットワークを経ることにより、調音運動が修正される。そして修正された調音運動に基づき、単語分類部204において該当する単語が検索され、音声認識処理が実行される。 (もっと読む)


【課題】狭帯域信号から質の良い擬似広帯域信号を生成する。
【解決手段】狭帯域信号を周波数領域に変換することで、低域信号を生成し、狭帯域信号をパーコール分析することでパーコール係数を求め、入力されたパーコール係数が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求め、低域信号に前記ゲイン係数を乗算することで、強調低域信号を生成し、低域信号の一部または全部を複製することで、高域信号を生成し、前記強調低域信号を低域側に前記高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成し、前記擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する。 (もっと読む)


少なくとも1つの例示的実施形態は、個人化音声管理アプリケーションを実装することを対象とする。デバイスを構築するように、ハードウェアおよびソフトウェアを備えるモジュールが製造業者に提供される。個人化音声管理アプリケーションを伴うデバイスの遠隔有効化のためのプロセスが立案される。消費者は、ウェブ環境を介した購入および定期利用ハードウェアおよびアプリケーションを通して、音声環境を管理するためのアプリケーションを選択する。製造業者によって開発された全ての製品は、個人化音声管理アプリケーションを実行して試験され、認証される。製造業者および消費者は、両方とも、損害賠償保険をかけられてもよい。ユーザは、遠隔で購入し、更新し、ハードウェアを購入し、定期利用ベースのアプリケーションを追加してダウンロードし、ウェブ環境を通して消耗品を交換してもよい。
(もっと読む)


システム制御方法は、ユーザの環境において入力装置(14-16)を介してユーザにより通信された情報を表す少なくとも1つの信号を取得し、第1のソース(1,2)からの信号は、環境において認知できる形式で利用可能であり、第1のソース(1,2)から生じる情報とユーザから生じる情報との間の遷移が生じることが想定される時点を少なくとも推定し、予想時間に関してシステムによる機能の実行をタイミング調整することを含む。
(もっと読む)


少なくとも1つの例示的実施形態は、世界中およびそれ以上から音声シグネチャを収集するように構成されるウェブサイトを対象とする。通信デバイスは、通信デバイスのマイクロホンによって受信される音響情報を自動的に記憶する。音響情報は、トリガイベントについて分析される。トリガイベントは、音響情報を記憶し、メタデータを添付し、ガウス混合モデルを作成し、音圧レベルを測定する。通信デバイスは、通信経路が通信デバイスに開かれると、音声シグネチャをデータベースに自動的に送信する。各音声シグネチャは、タイムスタンプおよびジオコードを含む関連メタデータを有する。プロセスのために適合された通信デバイスを使用して、音声を自動的に収集することにより、継続的に音声を世界的に捕捉するデータベースを有効にする。
(もっと読む)


オーディオ信号を分析する方法を開示する。オーディオ信号のディジタル表現が受信され、ディジタル表現への生理学モデルの応答に基づいて、第1の出力関数が生成される。第1の出力関数の少なくとも1つのプロパティが決定され得る。1つまたは複数の値が、オーディオ信号の分析において使用するために、第1の出力関数の決定プロパティに基づいて決定される。
(もっと読む)


【課題】
歌唱練習を行うに際し、過去の自分の歌唱評価、あるいは、他人の歌唱評価との比較を可能とする。
【解決手段】
指定手段にて指定された指定楽曲の演奏情報を再生手段に再生させると共に、マイクロフォンから入力される音声信号とメロディ情報とを比較して時系列評価を作成する再生処理と、指定楽曲に関する時系列参照記録をホスト装置から受信すると共に、作成された時系列評価をホスト装置に送信する通信処理と、作成された時系列評価と、当該時系列評価を行った演奏情報に対応する少なくとも1つの時系列参照記録とを併せて表示手段に表示させる表示処理を行うことを特徴としている。 (もっと読む)


451 - 460 / 1,456