説明

国際特許分類[G10L11/04]の内容

国際特許分類[G10L11/04]に分類される特許

101 - 110 / 206


【課題】本発明は、高調波信号の基本周波数を推定するための確実な方法を提供する。
【解決手段】本発明によると、高調波信号の基本周波数を推定する方法は、基本周波数仮定値(f0´)を形成するステップと、基本周波数仮定値に基づいて、くし型フィルタを提供するステップと、くし型フィルタを用いて、与えられた高調波信号のフィルタリングを行うステップと、くし型フィルタにおける各歯毎に、基本周波数仮定値のテストを行うステップと、を備える。 (もっと読む)


【課題】人間の発声から抽出された肉声韻律情報の抽出誤りを、人間の肉声が有する自然性・表現力を損なうことなく、しかも、手間と時間をかけずに修正することができる韻律修正装置、韻律修正方法、および、韻律修正プログラムを提供する。
【解決手段】人間の発声から抽出された肉声韻律情報を受け付ける肉声韻律入力部31と、肉声韻律情報中で修正対象となる音素または音素列を少なくとも含む区間に対して、人間の発声における規則的または統計的な音素長を表すデータを用いることにより、音素間の境界および音素の規則音素長を定める規則音素境界を持つ規則韻律情報を生成する規則韻律生成部34と、生成した規則韻律情報を用いて、肉声韻律情報中の修正対象となる音素または音素列の肉声音素境界および肉声音素長が、実際の人間の発声の音素境界および音素長に近づくように、肉声音素境界を再設定し、肉声韻律情報を修正する肉声韻律修正部35とを備える。 (もっと読む)


【課題】音声のピッチを、より理解し易い形式で表示する技術を提供する。
【解決手段】歌唱者により歌唱が行われると、歌唱者の歌唱音声がマイクロホン15によって収音され、オーディオ信号に変換される。カラオケ装置1の制御部11は、オーディオ信号からピッチを検出し、検出したピッチに対してピッチ丸め処理を行う。次いで、制御部11は、ピッチの時間的変化を解析し、同一のピッチが予め定められた時間以上継続している場合には、そのピッチを選択する一方、それ以外の場合には、直前に選択されたピッチを継続して選択する。制御部11は、選択したピッチの時間的変化を解析し、ピッチが検出されなかった時間区間については、その時間区間の直後に検出されたピッチで、その時間区間のピッチを補間する。制御部11は、補間処理を施したピッチデータの示すピッチの時間的変化を示す画像データを生成し、表示部13に出力する。 (もっと読む)


【課題】楽曲の局面ごとに歌唱を評価することが可能なカラオケ装置を提供する。
【解決手段】本発明に係るカラオケ装置においては、歌唱者による歌唱を表す歌唱音声信号および模範となるリファレンスデータのそれぞれから、ピッチおよび音量レベルが検出され、楽曲を構成する音の全てについて、歌唱音声信号とリファレンスデータとの差分に基づいた歌唱の評価がなされると共に、楽曲を構成する音の一部分(例えば楽曲の高音部分)について歌唱音声信号とリファレンスデータとの差分に基づいた歌唱の評価も行われる。従って、歌唱者は、楽曲全体についての評価を知ることが出来るとともに、高音部分など楽曲の一部分についての評価を知ることができる。 (もっと読む)


【課題】精度の高い音声判別を実現することを課題とする。
【解決手段】音声を判別する音声判別装置と各種操作を実行するカーナビとがネットワークなどを介して相互に通信可能に接続されている。また、音声判別装置は、各種音声を受け付けるマイクを備えている。このような構成において、音声判別装置は、入力された音声信号のパワーから発話された区間を示す発話区間を特定し、特定された発話区間における音声信号のパワーとピッチとから音声信号の特徴を示す音響特徴量を算出し、特定された発話区間の前の区間および/または後ろの区間を特定し、特定した区間における音声信号のパワーとピッチとから音響特徴量を算出し、算出された発話区間の音響特徴量と、算出された発話区間の前後の区間の音響特徴量とから、入力された音声信号が、接続される各種処理を実行する処理装置に対して処理の実行を要求するシステム要求であるか否かを判別する。 (もっと読む)


【課題】演奏音または歌唱音のピッチの変動幅が大きく、ピッチグラフが表示枠の外へはみ出しても、ユーザの手を煩わせることなく、ピッチの変動状況をユーザに視認させることを可能にする。
【解決手段】表示手段と、マイクロホンにより収音された楽音のピッチの時間変化を表すピッチグラフの画像から予め定められた表示枠分の画像を切り出して前記表示手段の表示領域に表示させる表示制御手段とを備えた端末装置の表示制御手段に、前記楽曲の進行に伴って前記表示枠を前期ピッチグラフの時間軸方向へ移動させる第1の処理と、前記第1の処理による移動後の表示枠から前記ピッチグラフがはみ出すか否かを判定し、はみ出すと判定した場合には、はみ出す度合いに応じて前記表示枠をピッチ軸方向に移動させる第2の処理とを実行させる。 (もっと読む)


【課題】車両のエンジン音の種類を識別するエンジン音認識装置において、エンジン音の認識精度を向上させる。
【解決手段】エンジン音認識装置1は、車両のエンジン音を集音し、音信号として出力するマイク11と、マイク11から出力される音信号のピッチ周期を決定するピッチ周期決定部19と、マイク11から出力される音信号からピッチ周期決定部19により決定されたピッチ周期で音信号を切り出すことにより基本音波形を抽出する基本音波形抽出部18と、抽出された基本音波形に基づいてエンジン音の種類を判定するエンジン音判定部24と、を備える。 (もっと読む)


【課題】 入力音響信号の波形がアタック区間で不安定なものとなっても、全体としての基本周波数の推定精度を高める。
【解決手段】 アタック検出1aでは、入力音響信号をフレームに分割してアタック検出を行う。基本周波数の確率密度関数の推定41では、フレーム毎に、EMアルゴリズムにより基本周波数の確率密度関数を推定する。マルチエージェントモデルによる基本周波数の継続的な追跡42では、この確率密度関数から基本周波数を推定する。その際、処理対象となるフレームがアタック区間のものか否かにより、基本周波数を得るための処理41または42の演算の態様を切り換える制御が行われる。 (もっと読む)


【課題】特徴量の瞬間的な変動が対象音の音高の推定に与える影響を低減する。
【解決手段】関数推定部22は、音響信号Vを区分した複数のフレームの各々について基本周波数の確率密度関数Pを推定する。確率密度関数Pは、高調波構造をモデル化する複数の音モデルの混合分布として各フレームの音響信号Vをモデル化したときの音モデルの重み値を示す。平滑化部24Aは、複数のフレームにわたる確率密度関数Pの平均を算定することで確率密度関数Pの関数値の時間的な変動を抑制する。音高特定部26は、平滑化部24による処理後の確率密度関数Pから音響信号Vの基本周波数F0を推定する。 (もっと読む)


【課題】音高を高精度に推定する。
【解決手段】音高推定部10は、高調波構造を示す複数の音モデルM[F]の混合分布として対象音をモデル化したときの各音モデルM[f]の重み値ω[F]を示す基本周波数の確率密度関数Pから対象音の基本周波数F0を推定する。指標算定部50は、対象音を構成する音数に応じた音数指標値Nを算定する。制御部60は、音高推定部10による処理を音数指標値Nに基づいて制御する。例えば、重み値ω[F]を更新する単位処理の反復によって音高推定部10が確率密度関数Pを推定する構成において、制御部60は、単位処理の反復回数mを音数指標値Nに応じて制御する。また、確率密度関数において閾値Pthを上回るピークの周波数を音高推定部10が対象音の基本周波数F0として推定する構成において、制御部60は、音数指標値Nに基づいて閾値Pthを制御する。 (もっと読む)


101 - 110 / 206