説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

151 - 160 / 1,456


【課題】より効果的に、ユーザに対して環境音を視覚的に提示する。
【解決手段】解析部24は、コンテンツを構成する音声の音声データにブラインド音源分離処理を行い、各音源の音声の音声データを抽出するとともに、各音源の音声の音声データに基づいて、音源の方向を示す方向データを生成する。また、解析部24は各音源の音声が、人の発話ではない環境音であるか否かを判別し、環境音をテキスト化する。視覚情報生成部25は、テキスト化された環境音に基づいて、環境音を視覚的に提示するエフェクト画像を生成する。画像合成部26は、コンテンツを構成するコンテンツ画像上の方向データにより定まる位置に、エフェクト画像をオーバーレイする。本発明は、ビデオ再生機器に適用することができる。 (もっと読む)


【課題】付加音響信号が重畳された音響信号に対するユーザの違和感を抑制する音響処理装置や、当該音響処理装置を備える電子機器を提供する。
【解決手段】音響信号解析部81は、音響信号を解析する。調整方法決定部83、音響信号調整部84及び付加音響信号調整部85は、音響信号解析部81の解析結果に基づいて、音響信号及び付加音響信号を調整する。重畳部86は、調整された音響信号に、調整された付加音響信号を重畳する。これにより、所定の効果を得るために付加音響信号のみを調整する場合と比較して、付加音響信号を調整する程度が抑制される。 (もっと読む)


【課題】 カラオケシステムの利用者が、目標とする歌唱者ランキング以内に到達する可能性が無くなった段階で、歌唱者の手を煩わすことなく、それ以降の無駄な歌唱を行わずに済むようにする。
【解決手段】 歌唱採点結果に応じた歌唱者ランキングをランキング管理テーブル54にて管理する歌唱者ランキング管理手段53と、利用者別楽曲毎に設定された目標ランキングを目標ランキングテーブル33dにて管理する目標ランキング管理手段40と、ランキング付け対応曲の各歌唱区間における歌唱採点が終了する毎に、歌唱済歌唱区間の各歌唱採点値と、未歌唱区間の各最高採点値とに基づいて仮想的な歌唱採点結果を算出して、暫定的なランキング付けを行う暫定ランキング付け手段41と、暫定ランキングが目標ランキングよりも下位となった場合に、当該楽曲の演奏を中止させる演奏制御手段42と、を備える。 (もっと読む)


【課題】音響信号などの信号から高精度に特徴を抽出する信号特徴抽出装置および信号特徴抽出方法を提供すること。
【解決手段】信号特徴抽出装置は、所定期間だけサンプリングされたデジタル入力信号を周波数軸に変換する複素フーリエ変換手段、複素フーリエ変換手段において変換されたデータから高次局所相関特徴データを抽出する特徴抽出手段を備える。特徴抽出手段の後あるいは前に所定の帯域毎にデータを加算するフィルター手段を備えてもよい。音声、音響信号あるいはその他の時系列信号から高精度に特徴を抽出することができ、位相に特徴がある信号の識別精度が向上する。 (もっと読む)


【課題】予め特定話者毎に基準情報を作成することなく、発話状態の検出を可能とすることを課題とする。
【解決手段】発話状態検出装置は、発話者の発話データを取得する発話データ取得部と、前記発話データを周波数解析した結果から高域周波数成分を抽出する周波数成分抽出部と、抽出した前記高域周波数成分について単位時間毎の変動度合いを算出する変動度合い算出部と、所定期間における複数の前記変動度合いに基づいて、所定区間毎の統計量を算出する統計量算出部と、特定発話者の発話データから得られた前記統計量に基づいて、前記特定発話者の発話状態を検出する発話状態検出部とを備える。 (もっと読む)


【課題】朗読口調以外の口調で発声した場合にも、音韻列及び韻律特徴のカバレッジを最大化する発声用テキストセットを生成することができる発声用テキストセット作成技術を提供する。
【解決手段】朗読口調の自然音声データから求めたパラメータの分布を、目的とするX口調の自然音声データから求めたパラメータの分布に変換するパラメータ分布変換関数を予め記憶しておき、発声用テキストセット候補を用いて音声合成プログラムにより音声合成処理を行い、音声合成データから所定のパラメータを求め、パラメータ分布変換関数を用いて、求めたパラメータの分布を変換し、変換後のパラメータ分布を用いて発声用テキストセット候補を評価する。 (もっと読む)


【課題】回動可能な頭部に備えられた音声入力部に、360度全方向から入力される音声から、ノイズ音が出力される方向を除外して、発話者がいる方向を推定するロボットを提供する。
【解決手段】ロボットRは、回動可能な頭部R1にて所定の角度で離間して配設される3以上の音声入力部MCと、それら音声入力部が出力する音声データ(音響信号データ)から全方向音圧成分データを生成する音声データ処理部22と、頭部R1の回動角度を測定する回動角測定部(自律移動制御部50)と、音源として推定しない方向の範囲(除外角度範囲)が記憶された記憶部30と、音源方向を推定する音源方向推定部23とを備え、音源方向推定部23が、測定された回動角度を用いて、全方向音圧成分データから除外角度範囲内にあるデータを除去する。 (もっと読む)


【課題】顧客満足度と店員満足度との相関関係を把握する。
【解決手段】店員と顧客の会話を取得する音声取得部102と、会話に含まれる店員および顧客の音声に基づいて、それぞれ店員および顧客の感情を認識する感情認識部155と、感情認識部155の認識結果に基づいて、店員満足度および顧客満足度を算出する満足度算出部156、157と、店員満足度を示す店員満足度データと、顧客満足度を示す顧客満足度データと、を関連付け、接客データとして管理サーバー用データベースDBに記録する接客データ記録部159と、を備えた。 (もっと読む)


【課題】電子番組ガイドデータと音声データを用いて冷却ファンの回転数を制御し、ファンによって発生する騒音を低減させる。
【解決手段】プラズマディスプレイ装置は、番組データに電子番組ガイドデータが付加された放送信号を受信する信号受信部と、受信した電子番組ガイドデータを保持するEPGデータ処理部と、ユーザーが指定した電子番組ガイドデータと保持した電子番組ガイドデータとを比較し、比較結果に応じてファン回転数制御信号を出力するデータ比較部と、受信した番組データに含まれる音声データから拍手または歓声を検出し、検出結果に応じて検出有無信号を出力する音声検出部と、ファン回転数制御信号及び検出有無信号に応じて、ファンの回転数を制御するためのファン回転数情報を出力するパネル制御部と、ファン回転数情報に応じてファンの回転を制御するファン制御部と、を具備することを特徴とする。 (もっと読む)


【課題】特定のシーンを適切に検出する。
【解決手段】カットチェンジ解析部230は、チェンジ点を検出する。動き解析部240は、画像における被写体の遷移を検出する。構図解析部270は、画像における構図と特定シーンの構図との類似の程度を示す構図類似度情報を生成する。振幅解析部320およびスペクトル解析部330は、解析対象の音声データと特定シーンの音声データとの類似の程度を示す音声類似度情報を生成する。区間特徴量生成部350および区間評価部360は、チェンジ点と検出された遷移と構図類似度情報と音声類似度情報とに基づいて、チェンジ点間に含まれる動画が特定シーンに対応する動画であるか否かを判定する。 (もっと読む)


151 - 160 / 1,456