説明

国際特許分類[G10L21/04]の内容

国際特許分類[G10L21/04]に分類される特許

71 - 80 / 666


【課題】復号側で周波数帯域拡大する際に高品質に高域サブバンド信号を生成するための情報を、符号化側で生成する。
【解決手段】信号符号化装置10は、入力された時系列信号を複数のサブバンドに分割し、低域サブバンド信号を符号化して低域サブバンド信号符号化データを生成すると共に、低域サブバンド信号から生成された新たな高域サブバンド信号と、元の高域サブバンド信号との周波数振幅ピークを比較して高域サブバンド信号周波数振幅ピーク情報を生成し、また、低域サブバンド信号を用いて生成した新たな高域サブバンド信号と、元の高域サブバンド信号との利得を比較して高域サブバンド信号利得情報を生成する。その後、信号符号化装置10は、低域サブバンド信号符号化データと高域サブバンド信号周波数振幅ピーク情報と高域サブバンド信号利得情報とを多重化し圧縮データを出力する。 (もっと読む)


【課題】周波数帯域の拡大により、音楽信号をより高音質に再生する。
【解決手段】帯域通過フィルタ13は、入力信号を複数のサブバンド信号に分割し、特徴量算出回路14は、分割された複数のサブバンド信号と入力信号の少なくともいずれか一方を用いて、特徴量を算出し、高域サブバンドパワー推定回路15は、算出された特徴量に基づいて、高域サブバンドパワーの推定値を算出し、高域信号生成回路16は、帯域通過フィルタ13によって分割された複数のサブバンド信号と、高域サブバンドパワー推定回路15によって算出された高域サブバンドパワーの推定値とに基づいて、高域信号成分を生成する。周波数帯域拡大装置10は、高域信号生成回路16によって生成された高域信号成分を用いて、入力信号の周波数帯域を拡大する。本発明は、例えば、周波数帯域拡大装置、符号化装置、および復号装置等に適用することができる。 (もっと読む)


【課題】人間の声を表現した符号化音声データDに対して、簡便な方法により音高シフトを施し、違和感のない自然な音声再生を可能にする。
【解決手段】ユニット110により変換対象となる符号化音声データDを入力し、ユニット120により音高のシフト量を示すオフセット値αを入力する。ユニット140内には、周波数fの増加に従って単調減少する重み関数W(f)を格納しておく。ユニット130は、データD内の各符号について、当該符号が示す周波数fを、α・W(f)に応じた値だけ増減する処理を行い、処理後の符号を符号化音声データDとして出力する。各符号に対する音高の実際のシフト量は、重み関数W(f)を乗じて決定されるため、より高音の符号ほど音高シフト量が減少する。このため、フォルマント成分についての音高シフト量が小さくなり、簡便ながら、自然な音声再生が可能な符号化音声データDが得られる。 (もっと読む)


【課題】多様な品質のコンテンツに対して、それぞれのコンテンツの品質に応じた最適な補正処理を施すことが可能な信号補正装置を提供すること。
【解決手段】信号補正装置を次のように構成する。すなわち、一つ以上のチャネルから入力された信号について音質推定を行い各々のチャネルの重要度を示すチャネル重要度情報及び各々の周波数の重要度を示す周波数重要度情報を生成する音質推定部100と、前記チャネル重要度情報及び周波数重要度情報に基づいて、高音質化処理を行う対象の有効チャネル及び有効周波数成分を決定し、該決定に基づいて有効チャネル情報及び有効処理周波数情報を生成する高音質化処理制御部200と、前記有効チャネル情報及び有効処理周波数情報に基づいて、前記有効チャネル且つ有効周波数成分の信号についてのみ高音質化処理を施す高音質化処理部500と、を具備させる。 (もっと読む)


【課題】音声の音色を変換するカラオケシステムにおいて、ユーザーが容易に変換する音色の種類を選択することができるカラオケシステムを提供する。
【解決手段】マイクロフォン30から出力される音声信号及び伴奏音楽情報に基づいて出力信号を生成する出力信号生成手段を有するカラオケ装置本体20と、前記出力信号を音声に再生するスピーカー40とからなり、傾度を測定する傾度センサーと、前記傾度センサーが測定した傾度情報を前記カラオケ装置本体に送信する通信手段を有する携帯端末60を更に有し、カラオケ装置本体20は、前記傾度情報に基づき、マイクロフォン30が出力する音声信号が変換される音色種類を決定する音色種類決定手段と、前記音色種類に基づいて、マイクロフォン30が出力する音声信号の音色を変換して変換音声情報を生成する音色変換手段を更に有する。 (もっと読む)


【課題】復号時の帯域拡張による遅延時間を削減するとともに、復号側のリソースの増加を抑制する。
【解決手段】高域成分生成部73は、低域スペクトルSP-Lと高域エンベロープENV-Hとを用いて擬似高域スペクトルを生成する。位相ランダム部74は、ランダムフラグRNDに基づいて、擬似高域スペクトルの位相をランダム化する。逆MDCT部75は、低域エンベロープENV-Lを用いて低域スペクトルSP-Lを逆正規化し、位相ランダム部74から供給される擬似高域スペクトルと逆正規化された低域スペクトルSP-Lとを合成し、その合成結果を全帯域のスペクトルとする。本発明は、例えば、帯域拡張復号を行う復号装置に適用することができる。 (もっと読む)


【課題】声音を伴う楽曲の放音において、いわゆるフォルマントシフトの発生を抑えつつピッチを変換する。
【解決手段】記憶部13には、声音の音波形を表すガイドボーカルデータ132及びコーラスデータ133と、楽曲の音波形を表す楽曲データ131とが記憶されている。制御部11がこれらの波形データに基づいてスピーカ15に放音させるときに、ピッチシフト操作子12が操作されてピッチ変換処理を施すことが指示されると、第1ピッチ変換部143は、その操作内容に応じて、ガイドボーカルデータ132及びコーラスデータ133が表す音波形から音素波形を切り出して、ピッチ変換比に応じた周期で繰り返し出力する。一方、楽曲を表す楽曲データ131については、第2ピッチ変換部144は、音波形をピッチシフト操作子12の操作内容に応じた比率で、時間軸上で伸縮させてピッチを変換する。 (もっと読む)


【課題】 帯域拡張成分においてスペクトル包絡のピークを正しく再現することにより、聴認度の向上を図ることができる帯域拡張装置を提供する。
【解決手段】 入力信号に基づいて帯域拡張成分を生成し、この生成した帯域拡張成分を入力信号に付加することにより入力信号の帯域を拡張する帯域拡張装置2である。この帯域拡張装置2は、入力信号から所定の帯域成分を抽出するための帯域成分抽出手段14と、この抽出された所定の帯域成分をシフトさせるための周波数シフト手段20と、シフトにより生成された帯域拡張成分と入力信号とを加算するための加算手段10と、を備えている。周波数シフト手段20は、所定の帯域成分のスペクトル包絡のピークにおける周波数に基づいて、所定の帯域成分をシフトさせる。 (もっと読む)


【課題】入力信号の種類・音質に関わらず、高精度な音声認識結果を得ることができる音声認識装置及びコンテンツ再生装置を提供することができる。
【解決手段】入力信号について音声認識処理を実行する音声認識処理部4を具備する音声認識装置101を次のように構成する。すなわち、前記入力信号の音質を推定する音質推定部2と、前記音質推定部2による推定結果に基づいて前記音声認識処理部4による音声認識処理を制御する処理制御部3と、を音声認識装置101に具備させる。 (もっと読む)


【課題】 受信した音声信号に対する周波数特性の操作が却って品質劣化を招くことを防止できる音声処理装置を提供する。
【解決手段】 音声処理装置には、送信側で周波数特性が操作された音声信号が到来することもあれば、周波数特性の操作がなされていない音声信号が到来することもある。そこで、送信側で周波数特性が操作されない場合の音声信号の平均的な周波数特性を反映させた基準特性情報を保持しておき、受信した音声信号について、基準特性情報と同様な表現形式の特性情報を得た後、基準特性情報と受信音声信号の特性情報とを比較し、送信側で周波数特性が操作されか否かを判定する。そして、この判定結果に応じて、受信側における周波数特性の操作の有無や、操作量を制御する。 (もっと読む)


71 - 80 / 666