説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

971 - 980 / 1,456


【課題】人間の主観評価に近い得点を算出できる歌唱力評価方法、人間の主観評価に近い
得点を算出できる歌唱力評価機能を有するカラオケ装置を提供すること。
【解決手段】ピッチ抽出部13は、マイク2から入力された音声信号からピッチ抽出を行
う。ピッチ抽出部13は人間の全歌唱音域にて半音階を10等分以上に分割できる非常に
高い音程分解能を持つピッチを抽出する。ビブラート検出部14は入力音声信号からビブ
ラート検出を行う。得点算出部15は入力音声を通常歌唱区間とビブラート歌唱区間に分
離して採点する。通常歌唱区間における採点では、ピッチが平均音階に乗っているかど
うかを判定し、その判定結果を基に得点を算出する。 (もっと読む)


【課題】歌唱力評価に適した信頼性の高い音程変化量抽出方法、ピッチの信頼性算出方法、信頼性の高いビブラート検出方法を提供すること。また、それらを応用した歌唱訓練プログラム及び高精度な歌唱力評価機能を持つカラオケ装置を提供すること。
【解決手段】
入力音声信号よりスペクトルを算出する。スペクトルのずらしマッチングにより信頼性の高いピッチ変化量Δfsを算出する(142)。同時に音声信号より抽出されたピッチf(t)の差分としてピッチ変化量Δfpを算出する(141)。ΔfsとΔfpを比較することで、Δfpを算出する基になったピッチf(t)の信頼性を逆算する。さらに、信頼性の高いピッチ変化量Δfsをビブラート検出に利用することにより、信頼性の高いビブラート検出を実現する。このようにして算出した音程変化量、ピッチの信頼性、ビブラート情報を歌唱訓練プログラムやカラオケ装置に利用する。 (もっと読む)


【課題】音による監視を行う音監視システムにおいて、記録する音のデータ量を少なくすることのできる技術を提供する。
【解決手段】マイクシステム11のCPU1は、マイクロフォン3で収音された音を表す音データを、当該音データの表す音が収音された時刻を表す時刻情報に対応付けて、バッファメモリ4に時系列に記憶する。音声処理部5は、バッファメモリ4に記憶された音データを所定単位毎に読み出し、読み出した音データの音圧が予め定められたしきい値以上である場合には、当該音データと当該音データに対応する時刻情報とを蓄積メモリ6に記憶し、一方、読み出した音データの音圧が予め定められたしきい値未満である場合には、当該音データと当該音データに対応する時刻情報とを蓄積メモリ6に記憶しない。蓄積メモリ6に記憶された音データは、データサーバ200に送信される。 (もっと読む)


【課題】スピーカから会議場特有の雑音が出力されることを効果的に低減することができる音声会議装置を得る。
【解決手段】マイクロホン1からの音声信号をデジタル信号に変換するA/D変換器2、変換されたデジタル信号を一時的に保存する音声データ保存手段4、保存されている音声データ中人の声の周波数領域を通すフィルタ5、フィルタ5を通った音声データのレベル検出手段、音声レベル変化量が大きい場合に人の音声信号であると判定する判定手段6、音声信号であると判定しているとき音声データ保存手段4から読み出される信号レベルの減衰を解除するミュート手段7、ミュート手段7がミュートを解除することによって音声データ保存手段4から読み出される音声データをアナログ音声信号に変換するD/A変換器8、変換されたアナログ音声信号で駆動されるスピーカ10、を備えている。 (もっと読む)


【課題】マイクから入力された音声が、伴奏情報なのか人間の歌声なのかを判定して歌声部分のみを採点する歌唱力評価方法及びカラオケ装置を提供すること。
【解決手段】カラオケ装置1に内臓されている採点処理部12は、マイク2から入力された音声信号がカラオケの伴奏なのか?人間の歌声なのか?を判定する伴奏・歌声判定部21を備える。伴奏・歌声判別部21は、マイク2から入力された音声信号に周波数分析を行いスペクトルを算出し、スペクトルのエネルギーが高周波数帯域に集中していることが検出されたときに『入力音声信号は伴奏情報である』と判定する。 (もっと読む)


【課題】歌唱力評価に適した信頼性の高いビブラート検出方法を提供すること。また、それらを応用した歌唱訓練プログラム及び人間の主観と相関の強い得点を算出できる歌唱力評価機能を持つカラオケ装置を提供すること。
【解決手段】
入力音声信号よりピッチ変化量Δfを算出する。周期性算出モジュール143Aは複数フレーム分のピッチ変化量Δfに対して自己相関分析を行いビブラート検出を行う。ピッチ変化量Δfに対し自己相関分析を用いることによりノイズや外乱に強いビブラート検出が可能となる。正位相・逆位相合成モジュール143Bは、自己相関関数より算出された正位相の相関係数・逆位相の相関係数を合成することにより、さらに信頼性の高いビブラート検出が可能となる。このようにして検出したビブラート情報を歌唱訓練プログラムやカラオケ装置に利用する。 (もっと読む)


【課題】歌唱力評価に適した周波数分解能の高いピッチ抽出方法を提供すること。また、そのピッチ抽出方法を応用した人間の主観に近い歌唱力評価方法、歌唱者の歌の上達を補助する歌唱訓練プログラム、及びカラオケ装置を提供すること。
【解決手段】入力音声信号より、自己相関関数を算出する。次に自己相関関数を複数の周波数帯域毎の部分相関関数に分割して、各帯域の部分相関関数を重ね合わせ合成することで、高音域の周波数分解能を低音域の周波数分解能で補った合成相関関数を算出する。合成相関関数に極大値を与える周波数をピッチとして検出することで、4[oct]以上ある人間の歌声の全音域を精度良く分析することが可能となる。このようにして抽出したピッチを歌唱力評価装置や歌唱訓練プログラムに利用する。 (もっと読む)


【課題】比較的簡素な構成で音楽のジャンルを判別することができる音楽ジャンル判別装置を提供する。
【解決手段】音楽再生機器から出力される音楽再生信号を取り込む信号入力部と、信号入力部に取り込まれた音楽再生信号の低周波成分の積分値及び微分値と高周波成分の微分値とを出力する信号処理部と、信号処理部から出力される積分値及び微分値のそれぞれを所定のサンプリング単位時間Tnずつ取り込んで、サンプリング単位時間Tn内に低周波成分の積分値及び微分値と高周波成分の微分値とが所定レベルを超えるか否かを判定し、音楽再生機器から出力される音楽のジャンルを判別するデータ解析部とを音楽ジャンル判別装置に設ける。 (もっと読む)


応答マシン検出モジュールを使用して、コール受信側が実際の人間であるか、応答マシンであるかを判断する。応答マシン検出モジュールは、音声認識機能およびコール分析モジュールを含む。音声認識機能は、コールに対するコール受信側の可聴応答を受信する。音声認識機能は、該可聴応答を処理し、認識された音声を示す出力を提供する。コール分析モジュールは、音声認識機能の出力を処理し、コール受信側が人間であるか応答マシンであるかを示す出力を生成する。
(もっと読む)


【課題】 TV・CMを、放送手段や、映像フォーマットに関わらずに、自動的に識別するための音声を圧縮したデータを計算する。
【解決手段】 音声信号は、音声帯域通過回路101−10、音声エンベロープ作成回路101−11を経て音声エンベロープ信号としてCPU101−14に供給され、また、エンベローブ信号に基づき、A/Dコンバータ101−9により水平同期でサンプリングされた音声デジタルデータをCPU101−14内部で圧縮して、音声パターン平均化データ、音声パターン偏差を計算する。映像信号は、画像変化信号作成部101−8に導かれ画像変化信号を作成する。CPU101−14では、画像変化信号、フレーム同期信号、音声エンベロープ信号等の各入力信号に基づき、イベント信号の作成、CM切り出しデータ作成等の処理を行う。 (もっと読む)


971 - 980 / 1,456