説明

国際特許分類[G10L11/04]の内容

国際特許分類[G10L11/04]に分類される特許

31 - 40 / 206


【課題】これまでよりも高品位な音声が得られるノイズ低減装置を提供する。
【解決手段】入力音声信号のピッチに対応する所定の単位周期区間ごとに、生成元信号の時間方向を反転させた区間信号を連結して単位補間信号部分を形成し、さらにこの単位補間信号部分を時系列に並べて補間信号を生成する。この補間信号と、入力音声信号からノイズ音成分を除去して得た音声信号とを合成する。 (もっと読む)


【課題】カラオケ装置において、視覚的な通知を用いることなく、音高のズレの程度を歌唱者に認識させること。
【解決手段】歌唱音高から基準音高を減算して、歌唱音高と基準音高との特定音高差(この音高差の絶対値を音高ズレ量とする)を導出する(S150)と共に、歌唱音声及び基準音高に基づいてハモリ音を生成する(S160)。その生成されたハモリ音が、特定音高差に応じた出力音量にて、スピーカ27から出力されるように制御する(S170)。このとき、音高ズレ量が0であればハモリ音量は0であり、音高ズレ量が大きいほどハモリ音量が大きくなるように制御される。これらの繰り返しにより、カラオケ楽曲の再生演奏に沿って、基準旋律についての再生音、及び歌唱音声に加えて、ハモリ音がスピーカから出力される。このとき、ハモリ音により、歌唱音高と基準音高との間にズレが生じたことをユーザに認識させる。 (もっと読む)


【課題】話者毎の音声の違いを吸収し、より滑らか且つ正確な実ピッチパターンを生成する。
【解決手段】入力音声を音声信号に変換し、所定の信号処理を用いて当該音声信号から音声の基本周波数の時系列データを実ピッチパターンとして抽出し、抽出された実ピッチパターンを次数2以上の縦続一次系モデルの線形和で近似する。 (もっと読む)


変換領域における音声信号を記載している実際の変換領域パラメータに基づく信号の仁号特性の変化を記載しているパラメータを得るための装置は、パラメータ決定器を含む。パラメータ決定器は、信号特性を表している1つ以上のモデルパラメータに依存する変換領域パラメータの変化を記載している変換領域パラメータの1つ以上のモデルパラメータを決定するために構成され、変換領域パラメータのモデル化された時間的な変化、および実際の変換領域パラメータの変化との間の偏差を表わしているモデルエラーは、既定の閾値以下の状態にするか、または、最小化される。 (もっと読む)


【課題】フレーム全体における入力音声信号の相関関数値を計算することなく、ピッチ検索を行うための方法及び装置を提供する。
【解決手段】1つの方法には、入力音声信号から長期予測(LTP)寄与信号を除去した結果である残差信号の特性関数値を得る段階と、残差信号の特性関数値に応じてピッチを得る段階と、が含まれる。ピッチ検索のための他の方法には、入力音声信号において最大振幅のパルスを検索する段階と、最大振幅のパルスの位置に応じて入力音声信号用の対象窓を設定する段階と、対象窓をスライドして引窓を得て、引窓及び対象窓における入力音声信号の相関係数を計算して相関係数の最大値を得る段階と、相関係数の最大値に応じてピッチを得る段階と、が含まれる。 (もっと読む)


【課題】歌唱技法の巧拙を精密に評価する技術を提供することを目的とする。
【解決手段】制御部11は、練習者音声およびお手本音声からビブラート区間およびロングトーン区間を特定する。練習者音声の評価においては、ビブラート技法およびロングトーン技法についてそれぞれ評価を行うと共に、ロングトーン技法からビブラート技法へと連続的に移行する技法(組み合わせ技法)が用いられたことを検出した場合には、該組み合わせ技法に対して加点する。得点は、組み合わされたロングトーン区間の長さとビブラート区間の長さの割合に応じて決定される。 (もっと読む)


【課題】ピッチ変動が顕著なピッチ部分系列データを削除した音声合成辞書を生成することにより、合成音声が不自然なものとならないようにする。
【解決手段】ピッチ系列データ抽出部220は、音声データベース201から取り出した音声データからピッチ系列データを抽出する。音素切り出し部225は、抽出されたピッチ系列データから音素毎のピッチ部分系列データを切り出す。ピッチデータ評価部230は、各ピッチ部分系列データのピッチ変動が顕著でないか判定する。ピッチデータ編集部240は、ピッチ変動が顕著なピッチ部分系列データを削除する。その後、音素HMM学習部250は、音素ラベルと音素ピッチデータとの対応関係を求める。データ書き出し部260は、学習後の音素ラベルと音素ピッチデータとの対応関係を音声合成辞書202に書き込む。 (もっと読む)


【課題】音響信号が倍音成分を含む場合でもピッチ周期を高精度に特定する。
【解決手段】ピーク検出部24は、音響信号Aの正側ピークQPの強度LPと負側ピークQMの強度LMとを特定する。指標算定部32は、強度LP[n-2]および強度LP[n]の平均値と強度LP[n-1]との差分値の絶対値と、強度LM[n-2]および強度LM[n]の平均値と強度LM[n-1]との差分値の絶対値とを加算することで変化指標値F[n]を算定する。周期特定部44は、変化指標値F[n]が閾値TH[n]を下回る場合には正側ピークQP[n-1]や負側ピークQM[n-1]を考慮して音響信号Aのピッチ周期Tpを特定し、変化指標値F[n]が閾値TH[n]を上回る場合には正側ピークQP[n-1]や負側ピークQM[n-1]を無視して音響信号Aのピッチ周期Tpを特定する。 (もっと読む)


【課題】現時点の直前における入力信号の基本周期を精度良く算出することができる信号処理装置及び信号処理方法を提供する。
【解決手段】テンプレート設定部51は、パケットロスが発生したロス発生時点RTから過去に向けてある時間幅の音声信号をテンプレートTMとして設定する。周期検出部52は、テンプレート設定部51により設定されたテンプレートTMを音声信号に対してロス発生時点RTから過去に向けてスライドさせ、テンプレートTMと音声信号との相関を求め、テンプレートTMと音声信号との相関ピークが最も強く現れたときのスライド量からロス発生時点RTの直前の音声信号の基本周期を検出する。ここで、テンプレート設定部51は、周期検出部52がテンプレートTMのスライド量が増大するにつれてテンプレートTMの時間幅を増大させる。 (もっと読む)


【課題】精度良くメロディーライン(又はベースライン)を抽出することが可能な情報処理装置、及びメロディーライン抽出方法(又はベースライン抽出方法)を提供すること。
【解決手段】音声信号を音程毎の信号強度を表す音程信号に変換する信号変換部と、前記音程信号の各音程がメロディー音である確率を推定するメロディー確率推定部と、前記メロディー確率推定部でフレーム毎に推定された前記各音程がメロディー音である確率に基づき、前記音声信号の開始フレームから終了フレームまでを結ぶ音程の経路から最尤経路を検出してメロディーラインに決定するメロディーライン決定部と、を備える、情報処理装置が提供される。 (もっと読む)


31 - 40 / 206