説明

国際特許分類[G10L11/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 15/00〜21/00のグループ中のどれか一つに限定されない音声または音響の特徴量の測定または検出 (1,940)

国際特許分類[G10L11/00]の下位に属する分類

国際特許分類[G10L11/00]に分類される特許

51 - 60 / 1,456


【課題】歌唱音声の評価において、音高差に応じた歌唱の難易度を反映すること。
【解決手段】本発明の実施形態におけるカラオケ装置は、楽曲データにより指定される歌唱すべき構成音に対応する歌唱難易度を、構成音の指定音高とその構成音の直前の構成音の指定音高との音高差に基づいて設定する。カラオケ装置は、楽曲データの再生中に入力された歌唱音声を取得し、歌唱すべき構成音の評価値を、歌唱音声の歌唱音高、構成音の指定音高、設定された歌唱難易度に基づいて算出する。 (もっと読む)


【課題】ユーザのコンテンツを鑑賞する際の視聴覚特性や感じ方の違いによる嗜好の個人差や変化を配慮した嗜好推定を行うこと
【解決手段】変化対応型嗜好推定装置は、コンテンツの特徴を抽出する特徴量抽出部12と、特徴量抽出部12内にユーザごとの分解能に対応したフィルタを適用する分解能適用部12aと、分解能適用部12aのフィルタ値を、ユーザのコンテンツ鑑賞経験にあわせて変化させてくための分解能推定部30とを備える。 (もっと読む)


【課題】再生される楽曲から次の楽曲を抽出する場合に、先行する楽曲との間で自然なつながりを持たせることができるように、次の楽曲を抽出できるようにする。
【解決手段】先行楽曲の次に再生される後続楽曲を抽出する場合、まず、先行楽曲の末尾を含む一部の区間から当該区間の特徴データである末尾パラメターを抽出するとともに、複数の楽曲の中から楽曲の先頭を含む一部の区間の特徴データである先頭パラメターを抽出する。ここで、一部の区間を抽出する場合は、先頭や末尾から所定時間の区間を抽出する他、拍や小節単位で所定の区間を抽出する。一方、条件記憶手段には、あらかじめ末尾パラメターと先頭パラメターとの接続条件を記憶させておき、後続の楽曲を抽出する場合は、接続条件を満たす先頭パラメターを有する楽曲を抽出する。 (もっと読む)


【課題】演奏された楽曲の楽譜位置をより頑健に推定できる楽譜位置推定装置及び楽譜位置推定方法を提供する。
【解決手段】周波数特性分析部は、入力された音響信号の周波数特性を分析して第1の周波数特性を算出し、関連度算出部は、楽譜情報が表す楽譜の位置毎の音階に基づく第2の周波数特性と前記第1の周波数特性の関連度を表す重み値を、前記第2の周波数特性に含まれる成分毎の前記第1の周波数特性の確率分布に基づいて、前記楽譜の位置毎に算出し、楽譜位置探索部は、前記重み値に基づいて前記音響信号に対応する楽譜の位置を探索する。 (もっと読む)


【課題】音声波形に含まれる非言語情報を使って、一般的音声認識を必要とせず、発話者個人の特性を考慮した発話者の抑圧状態すなわち声帯の緊張状態の時の発話を検出する。
【解決手段】入力部101は、入力された音声を受付ける。解析部102は、音声を複数のフレームごとに解析する。演算部103は、解析の結果の平均値を算出すると共に、予め記憶された複数話者ごとの解析結果の平均値および解析結果の累積頻度分布に関する統計データと、算出された平均値とに基づいて閾値を決定し、複数の解析結果のうち閾値よりも大きな値を有する解析結果の出現頻度を演算する。判定部104は、出現頻度に基づいて、音声を発する声帯の緊張状態を判定する。出力部105は、判定の結果を出力する (もっと読む)


【課題】 再構築されたオーディオ信号を処理するための技法およびツールを提供する。
【解決手段】 再構築されたオーディオ信号は、周波数ドメイン内で少なくとも一部が計算されるフィルタリング係数を使用して、時間ドメイン内でフィルタリングされる。他の例として、再構築されたオーディオ信号をフィルタリングするためのフィルタリング係数のセットを生成することは、係数値のセットにおける1つまたは複数の山をクリッピングすることを含む。さらに他の例として、サブ帯域コーデックの場合、2つのサブ帯域の交差部分付近の周波数領域で、再構築された合成信号が拡張される。 (もっと読む)


【課題】使用者本人の送話中であっても、受話音声の明瞭度を向上させることができる音声処理装置及び方法を提供する。
【解決手段】マイクから入力された音声信号を所定の周波数帯域の複数の音声信号に分割し、該周波数帯域毎の音声信号に対して信号対雑音比に応じた重みづけを行い、該音声信号に含まれる、分割された周波数帯域毎の背景騒音量を推定する。そして、受話音声信号を所定の周波数帯域毎の複数の音声信号に分割し、推定された周波数帯域毎の背景騒音量に基づいて、背景騒音量が大きいほど周波数帯域毎の音声信号が大きくなるように、該周波数帯域毎の音声信号に適用するゲインを設定し、該ゲインを周波数帯域毎の音声信号に乗算することで受話音声信号を補正する。 (もっと読む)


【課題】複数の音が混在した音声信号から、特定音源のコマンドを高精度に分離する装置、方法を提供する。
【解決手段】複数音源からの音を含む学習用音声信号に基づいて各音源対応の基底周波数Bからなる学習データを生成し、この各音源対応の基底周波数Bを結合した全基底周波数Ballを生成する。さらに、入力音声信号に対して、時間周波数分析を実行して時間周波数分析結果を生成する。この入力音声信号に対する時間周波数分析結果に対して、全基底周波数Ballを適用した基底分解を行い、入力音声信号に対する基底アクティビティHを生成する。最後に生成した基底アクティビティHの識別処理を実行してコマンド識別を行う。これらの学習データに基づく音源分離処理により、高精度なコマンド識別が実現される。 (もっと読む)


【課題】を提供する。
【解決手段】携帯電話端末装置は、受信した音声符号化データを復号して音声出力する。このとき、音声符号化データのなかのインデックス情報を用いて各フレームの音声らしさを判定する(ST12)。すなわち、合成フィルタに関するインデックスを用い、合成フィルタの周波数特性またはそれに準ずる特性から各フレームの音声らしさを判定する。詳しくは、現フレームのフィルタ周波数特性と過去フレームのフィルタ周波数特性との類似度を算出し、算出された前記類似度が所定閾値を超えている場合には、現フレームを音声らしくないと判定し、算出された前記類似度が所定閾値以下である場合には、現フレームに音声らしさがあると判定する。音声らしくないフレームに対してその音が出力されないようにパラメータエラー処理を行う(ST14)。 (もっと読む)


【課題】言語では明示的に認識されない情報を反映する語句を分析するための情報処理装置、情報処理方法、情報処理システム、およびプログラムを提供する。
【解決手段】情報処理装置120は、会話を記録した音声データから当該音声データにおける言語では明示されない情報を識別しており、音声データを音響データを使用して音響分析するための音響分析部208と、音声データの前後がポーズで分離された領域を識別し、識別された領域の音響分析により前記識別された領域の語句を識別し、当該語句の韻律特徴値を要素とする当該語句の1以上の韻律特徴値を生成する韻律情報取得部212と、音響分析部208が取得した語句の音声データにおける出現頻度を取得する出現頻度取得部210と、出現頻度の高い語句の韻律特徴値の前記音声データ中におけるばらつき度を計算し、特徴語句を決定する韻律ばらつき解析部214とを含む。 (もっと読む)


51 - 60 / 1,456