説明

国際特許分類[G10L11/04]の内容

国際特許分類[G10L11/04]に分類される特許

21 - 30 / 206


【課題】音符期間を推定する技術において、推定精度を向上させること。
【解決手段】開始・終了タイミング推定処理では、入力音声の音圧推移に基づいて、発音開始タイミングと発音終了タイミングとを検出する(S610,S640)と共に、入力音声における周波数軌跡から、ビブラート期間を特定する(S730:YES)。その特定されたビブラート期間内に対応する発音開始タイミングを消去し(S750)、ビブラート期間外に対応する発音開始タイミングのみを残す。残された発音開始タイミングと、その発音開始タイミングと対となるべき発音終了タイミングとが存在すれば、その対となる発音開始タイミングと発音終了タイミングとの間の期間を音符期間とし、一方、残された2つの発音開始タイミングが、それらの発音開始タイミングの間に発音終了タイミングを挟むことなく存在すれば、2つの発音開始タイミングの間を音符期間とする。 (もっと読む)


【課題】音声基本周波数の推定精度を向上させること。
【解決手段】信頼度算出処理では、各周波数成分の自己相関値に減衰係数を乗じる(S3750)。これにより、音声基本周波数f0の倍音成分が含まれる可能性の高い高周波帯における区間f0候補の自己相関値が抑制される。その値が抑制された自己相関値に、各自己相関値に対応する区間f0候補の振幅値を乗じることで、f0候補信頼度が導出される(S3760)。このf0候補信頼度は、基本周波数に対応するものほど大きな値となる。そして、各周波数に対応するf0候補信頼度の中で、値が最も大きいものに対応する周波数を音声基本周波数f0とする。 (もっと読む)


【課題】プレイヤによる入力された音声を判別し、判別結果に基づいて音階を形成可能な音楽ゲームシステムを提供する。
【解決手段】音声を入力する音声入力装置9と、ゲーム音を再生出力するスピーカ8と、音程の異なる複数の効果音のそれぞれをスピーカ8から出力させるための効果音データ27及びプレイヤの操作と対応して出力すべき効果音との関係を記述するシーケンスデータ29を記憶する外部記憶装置20を備えた音楽ゲームシステムにおいて、音声入力装置9により入力された音声の音声データに基づいて、入力された音声を代表する音程を判別し、その音程判別結果に基づいて音声データと互いに音程の異なる複数の音データを音階が形成されるように生成し、これら複数の音データの集合を効果音データの少なくとも一部として効果音データ27に記憶する。 (もっと読む)


【課題】ピッチの誤検出を抑制すること。
【解決手段】音声信号変換装置1は、レベル補正部2と、自己相関値算出部3とを有している。レベル補正部2は、自己相関値を算出する対象区間、例えば、隣接する2つの有声区間の音声信号のレベルが互いに等しくなるように音声信号を補正する。自己相関値算出部3は、レベル補正を行った(補正後の)音声信号に対して自己相関値を算出する。自己相関値算出部3によって算出された自己相関値は、さらに後段の信号処理回路に出力される。そして、話速変換処理等が施される。 (もっと読む)


【課題】入力信号の適応的話速変換を行う話速変換装置及びプログラムを提供する。
【解決手段】本発明の話速変換装置1は、入力信号を単位時間毎に分割した各セグメントについて当該入力信号の物理指標を算出する物理指標算出部2と、物理指標算出部2によって算出した物理指標に応じて入力信号の各セグメントに指定すべき話速を決定して話速変換を行う話速変換倍率決定部3とを備える。本発明の一態様の話速変換装置1は、入力信号における単位時間あたりの自己相関で得られる相対最大値を表す有声度Un、入力信号における単位時間あたりの基本周波数及び擬似基本周波数の軌跡の変化傾向を表す凹凸度Sn、及び、入力信号における単位時間あたりの帯域分割した低域側パワー成分と高域側パワー成分との比率を表す分割帯域パワー比Enのうちの1つ以上の「物理指標」を用いて入力信号の各セグメントに指定すべき話速変換倍率αnを決定して話速変換を行う。 (もっと読む)


【課題】入力音声のアクセント型を正確に判定する。
【解決手段】入力音声から基本周波数の変化パターンであるF0変化パターンを抽出すると共に、入力音声の各モーラに同期した時刻情報であるモーラ同期情報を入力する。次に、F0変化パターンのモーラ毎にモーラ代表値を求め、このモーラ代表値を基準とした後方に隣接するモーラのモーラ代表値との変化量であるモーラ変化量をそれぞれ算出する。そして、モーラ変化量が最も小さい負の値を持つモーラを検出し、そのモーラに係るモーラ変化量である変化量最小値が、アクセント型0型を判定するための第1の閾値より大きい場合は0型と判定し、第1の閾値よりも小さい場合は、変化量最小値を持つモーラより前方のモーラのモーラ変化量を連続して探索し、モーラ変化量がアクセント型0型以外を判定するための第2の閾値よりも小さい一番前方のモーラを検出してアクセント型を判定する。 (もっと読む)


【課題】どのような環境下であっても、音に含まれる電子音(ベル音、チャイム音、メロディ音等)の存在を正確に検出する信号処理装置等を提供する。
【解決手段】音の信号波形をフレームに分割するフレーム分割部202と、分割されたフレームごとに信号波形を周波数分析する周波数分析部203と、周波数分析結果に基づいて、分割されたフレームごとに、ピッチ周波数を検出するピッチ周波数検出部204と、ピッチ周波数が、予め設定された周波数の範囲内で複数フレーム以上連続しているか否かを解析する連続性解析部205と、連続性の解析結果に基づいて、音に電気的に生成された電子音が含まれているか否かを判定する電子音有無判定部206とを備える。 (もっと読む)


【課題】和音を含む音楽から、和音の構成音数に依存せずに音高を認識することができる音高認識方法、音高認識プログラム、及び音高認識システムを提供する。
【解決手段】音の倍音構造に着目し、それぞれの音高が持つ倍音をそのまま比較することによって、和音の構成音数に依存せずに音高を認識することができる音高認識方法、音高認識プログラム、及び音高認識システムとする。 (もっと読む)


【課題】利用者によって新たに作曲された楽曲であっても、他の端末にて再生することを可能とするデータ集配システム、及び通信カラオケシステムの提供
【解決手段】クライアント装置10は、使用者が歌唱することで入力された音声を採譜して、部分楽曲データを生成してサーバ装置30に出力する。この部分楽曲データを取得したサーバ装置30は、部分楽曲データに付加楽曲データを追加して楽曲データを完成させた後、カラオケ楽曲データ(作成楽曲データ)を生成して、記憶装置に格納する。そして、サーバ装置30に公開指令が入力されると、サーバ装置30では、公開指令にて指定された作成楽曲データをカラオケサーバ45に出力する。そして、使用者が、演奏開始を指定すると、カラオケ端末48では、作成楽曲データ中の楽曲データに対応する楽曲の再生演奏が開始される。 (もっと読む)


【課題】音高を高精度に推定する。
【解決手段】音高推定部10は、高調波構造を示す複数の音モデルM[F]の混合分布として対象音をモデル化したときの各音モデルM[f]の重み値ω[F]を示す基本周波数の確率密度関数Pから対象音の基本周波数F0を推定する。指標算定部50は、対象音を構成する音数に応じた音数指標値Nを算定する。制御部60は、音高推定部10による処理を音数指標値Nに基づいて制御する。例えば、重み値ω[F]を更新する単位処理の反復によって音高推定部10が確率密度関数Pを推定する構成において、制御部60は、単位処理の反復回数mを音数指標値Nに応じて制御する。また、確率密度関数において閾値Pthを上回るピークの周波数を音高推定部10が対象音の基本周波数F0として推定する構成において、制御部60は、音数指標値Nに基づいて閾値Pthを制御する。 (もっと読む)


21 - 30 / 206