説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

81 - 90 / 1,456


【課題】 予め動画像の撮影者の声を登録することなく、動画像の撮影者の声を決定する。
【解決手段】 本発明に係る情報処理装置は、複数の音声区間に対応する音声を表す第1のデータストリームから、該音声に対応する動画像の撮影者の声を決定する情報処理装置であって、前記第1のデータストリームと、複数の画像からなる前記動画像を表す第2のデータストリームとを取得し、前記複数の画像のうち、人物を示すオブジェクトが含まれない画像を特定し、特定された画像に対応する前記音声区間のうち、声に相当する区間における音に基づいて、前記動画像の撮影者の声を決定する。 (もっと読む)


【課題】 非定常音を効率的に除去することができる技術を提供することを目的とする。
【解決手段】 録音した音声信号の周波数特性から取得した複数の特徴量からなる第1の特徴量データを生成する解析部と、撮像装置の駆動音信号の周波数特性から取得した複数の特徴量からなる第2の特徴量データを記憶する記憶部と、第1の特徴量データおよび第2の特徴量データを用いて内積の演算を行う演算部と、内積の値に基づいて音声信号に駆動音信号が重畳しているか否かを判定する判定部と、を備える。 (もっと読む)


【課題】音情報を検知し、空調空間における使用者の活動状態をより正確に認識することで、操作性や快適性に配慮しながら省エネ運転を行う。
【解決手段】空調空間内の音を収音するマイクロフォン408を備える空気調和機であって、記マイクロフォン408で検知した音信号を増幅する増幅器と、増幅された音信号の中から特定の周波数帯域を抽出する帯域抽出部とを有する。そして、帯域抽出部を複数設け、それぞれ異なる周波数帯域を抽出する。 (もっと読む)


【課題】楽曲からなる音声信号よりサビ部分を高速に精度良く抽出するできるようにする。
【解決手段】特徴量抽出部32は、取得された音声信号より、予め定められた種別の特徴量を時系列に抽出する。変化点検出部33は、時系列に抽出された特徴量の変化量が、所定の閾値よりも大きく変化する変化点を検出する。変化点統合部34は、変化点を統合する。サビ解析部35は、統合された変化点を境界とするブロック単位に特徴量に基づいて、音声信号におけるサビ箇所を解析する。サビ統合部36は、サビ情報を統合する。サビ情報出力部37は、サビ統合部36により統合されたサビ箇所を、サビ情報として出力する。本発明は、音声処理装置に適用することができる。 (もっと読む)


【課題】使用者に入力音声のレベルを変えるなどの処置を強要することなく、一時的な音に対しても簡単な構成で誤動作を軽減することができるようにしたVOX機能付き無線端末を提供する。
【解決手段】第2ホルマントに対応する周波数帯域から消防車における警鐘の周波数帯域を削除した特定周波数帯域を通過する帯域通過フィルタ5を使用し、マイク4からの入力音のうち消防車のモーターサイレン音、警鐘音、救急車のサイレン音をほぼカットして第2ホルマントに対応する特定の周波数帯域の入力信号の有無を検出部6で検出し、この検出部6での検出があったときに、帯域通過型フィルタ5を通過した音声信号のレベルと、基準閾値レベル管理部8で予め設定した基準閾値レベルとを比較し、入力信号のレベルが基準閾値レベルを超えたときPTTスイッチ7をON状態にしVOX機能部を作動させる。 (もっと読む)


【課題】人間の主観に基づくことなく2つの音の差異を評価する技術を提供する。
【解決手段】音発生部2が、所定の時間長の基準音及び所定の時間長の評価対象音を発生させる。脳波計測部3が、基準音及び評価対象音を聞いた人から生じる脳波を計測する。指標計算部4が、基準音の脳波と評価対象音の脳波との差の大きさを表す指標を計算する。これにより、人間の主観に基づくことなく2つの音の差異を評価することができる。また、非可逆符号化前の原音を基準音とし、その原音を非可逆符号化して復号した後の音を評価対象音とすると、計算された指標によりその非可逆符号化方法の性能を評価することができる。 (もっと読む)


【課題】入力信号から楽曲を精度良く同定する。
【解決手段】マスクパターン生成部55は、時間周波数領域に変換された入力信号の各領域における楽曲らしさに応じた重み分布であるマスクパターンを生成し、類似度算出部71は、マスクパターンによる重み付けに基づいて、時間周波数領域に変換された入力信号の各領域における特徴量と、時間周波数領域に変換された参照信号の各領域における特徴量との類似度を算出する。本発明は、入力信号から楽曲を同定する信号処理装置に適用することができる。 (もっと読む)


【課題】 情報記録再生装置の使い勝手を向上させる。特にシーンの区切りの設定を簡便
化する。
【解決手段】 音声認識手段を備え、記録中に特徴抽出されたタイミングで、シーンの区
切りを設定し、同時にサムネールを設定する。再生時には、該サムネールと同時に、特徴
抽出時の音声を同時に出力する。 (もっと読む)


【課題】メロディーが無い曲でも歌唱採点できる歌唱採点装置を実現する。
【解決手段】伴奏データの再生により発生するカラオケ伴奏音に合せてユーザが歌唱する歌唱音をサンプリングして得たユーザ歌唱データと、伴奏データの再生に同期してカラオケデータメモリ13から読み出される手本歌唱データとを所定のデータ数分のフレームで区切り、区切られたフレーム中の手本歌唱データから手本歌唱音の音声特徴量MFCCを、ユーザ歌唱データからユーザ歌唱音の音声特徴量MFCCをそれぞれ抽出する。抽出した手本歌唱音の音声特徴量MFCCとユーザ歌唱音の音声特徴量MFCCとの類似度から適否判定して歌唱を採点する。つまり、曲の歌詞が正しく歌唱されているかどうかを採点する為、「ラップ」と呼ばれるメロディーが無い曲でも歌唱採点できる。 (もっと読む)


【課題】歌唱者の歌唱力評価データを、当該歌唱者の画像と共にプリンタでプリント可能にする。
【解決手段】カラオケシステム(100)は、カラオケ装置(1)と、画像撮影部(23)と、上記カラオケ装置から転送された画像データをプリント可能なプリンタ(3)とを含む。上記カラオケ装置は、上記カラオケ装置に入力された音声の歌唱力を評価する歌唱力評価部(27)と、上記歌唱力評価部で得られた歌唱力評価結果を、上記画像撮影部で得られた画像データに合成する画像合成部(11)と、上記画像合成部で合成された画像データを上記プリンタに転送してプリントさせるためのプリンタ制御部(9)とを含む。上記歌唱力評価部で得られた歌唱力評価結果を、上記画像撮影部で得られた画像データに合成し、それを上記プリンタに転送してプリントさせることにより、歌唱者の歌唱力評価データを、当該歌唱者の画像と共にプリンタでプリントすることができる。 (もっと読む)


81 - 90 / 1,456