説明

国際特許分類[G10L21/04]の内容

国際特許分類[G10L21/04]に分類される特許

101 - 110 / 666


【課題】低ビットレートで高品質に符号化を行うことができるスペクトル符号化装置を開示する。
【解決手段】この装置は、周波数領域変換部403で周波数kが0≦k<FLの帯域の第1のスペクトルを取得し、周波数領域変換部404で周波数kが0≦k<FHの帯域の第2のスペクトルを取得し、内部状態設定部405及びフィルタリング部406で、所定の式を用いて、周波数kがFL≦k<FHの帯域の第2のスペクトルの形状を推定して推定スペクトルを生成し、探索部407及びピッチ係数設定部408で、推定スペクトルの形状と、周波数kがFL≦k<FHの帯域の第2のスペクトルの形状との誤差を最小にするピッチ係数を符号化する。 (もっと読む)


【課題】低ビットレートで高品質に符号化が可能なスペクトル符号化装置を開示する。
【解決手段】この装置は、周波数領域変換部403で周波数kが0≦k<FLの帯域の第1のスペクトルを取得し、周波数領域変換部404で周波数kが0≦k<FHの帯域の第2のスペクトルを取得し、内部状態設定部405及びフィルタリング部406で、第1のスペクトルを用いて、ピッチ係数に基づいて周波数kがFL≦k<FHの帯域の第2のスペクトルの推定スペクトルを生成し、サブバンド分割部409、サブバンド選択部412、探索部407、及びピッチ係数設定部408で、周波数kがFL≦k<FHの帯域において第2のスペクトルを複数のサブバンドに分割し、第2のスペクトルと推定スペクトルとの誤差を最小にするピッチ係数をサブバンド毎に求めることによって第2のスペクトルを推定し、サブバンド毎にピッチ係数を符号化する。 (もっと読む)


【課題】複数チャネルからの入力信号について、入力信号の種類・音質に関わらず、常に効率的且つ効果的に高音質化する信号処理を行うことができる信号処理装置及び携帯端末装置を提供すること。
【解決手段】複数の入力チャネルから入力された複数の入力信号に対して信号帯域を拡張する処理を施す信号処理装置1を次のように構成する。すなわち、信号処理装置1に、複数の入力信号に共通する共通成分と、前記複数の入力信号に共通しない非共通成分と、を抽出する共通成分・非共通成分抽出部10と、前記複数の入力信号の音質を推定する音質推定部20と、前記共通成分に対して、信号帯域拡張処理を含む高音質化処理を施す高音質化処理部40と、前記音質推定部20による推定結果に基づいて、前記高音質化処理部を制御する制御部30と、を具備させる。 (もっと読む)


【課題】USACの規格が利用されるのに際し、適切な方法で、復号化後信号が加工できること。
【解決手段】複数の復号化器102xと、符号化信号が対応復号化器により復号化された復号化後信号を、伝送される情報により特定される方法で加工する帯域拡大器104と、前記複数の復号化器102xの中から、前記対応復号化器を特定する情報を、前記信号加工器に伝送する情報伝送器101とを備えるオーディオデコーダ1a。 (もっと読む)


【課題】音声信号を、抽出ノイズ信号とノイズ除去信号とに分離し、抽出ノイズ信号とノイズ除去信号とで別々に周波数帯域を拡張する処理を行う音声帯域拡張装置を提供する。
【解決手段】音声帯域拡張装置は、通信回線を介して帯域幅が制限された音声信号の受信を行い、音声信号の周波数帯域を拡張する音声帯域拡張装置において、音声信号を、ノイズ除去信号と抽出ノイズ信号とに分離する信号分離部と、ノイズ除去信号の周波数帯域より高い周波数帯域の信号を補充して、拡張ノイズ除去信号を生成するノイズ除去信号成分拡張部と、拡張抽出ノイズ信号を生成する抽出ノイズ信号成分拡張部と、拡張ノイズ除去信号および拡張抽出ノイズ信号の何れか一方または双方の信号強度を調整する信号強度調整部と、調整後の拡張ノイズ除去信号と調整後の拡張抽出ノイズ信号とを合成する信号合成処理部とを備える。 (もっと読む)


【課題】 極めて少ない学習用のデータに基づいて、ある話者によって話された音声を、その話者以外の話者によって話されたような高い品質を有する音声に変換することができる音声変換装置および音声変換方法を提供する。
【解決手段】 学習部10は、変換対象の話者の母音の音声と変換目標の話者の母音の音声とに基づいて、変換対象の話者の音声を変換目標の話者の音声に変換するための個別変換関数を母音ごとに生成した後、生成した母音ごとの個別変換関数を合成して、変換対象の話者の音声を変換目標の話者の音声に変換する実行用合成変換関数を生成するための変換関数合成用汎関数を生成する。実行部20は、学習部10で生成された母音ごとの個別変換関数および変換関数合成用汎関数を含む変換関数に基づいて、実行用合成変換関数を生成し、生成した実行用合成変換関数を用いて、変換対象の話者の音声を変換目標の話者の音声に変換する。 (もっと読む)


【課題】復号側で周波数帯域拡大する際に高品質に高域サブバンド信号を生成するための情報を、符号化側で生成する。
【解決手段】信号符号化装置10は、入力された時系列信号を複数のサブバンドに分割し、低域サブバンド信号を符号化して低域サブバンド信号符号化データを生成すると共に、低域サブバンド信号から生成された新たな高域サブバンド信号と、元の高域サブバンド信号との周波数振幅ピークを比較して高域サブバンド信号周波数振幅ピーク情報を生成し、また、低域サブバンド信号を用いて生成した新たな高域サブバンド信号と、元の高域サブバンド信号との利得を比較して高域サブバンド信号利得情報を生成する。その後、信号符号化装置10は、低域サブバンド信号符号化データと高域サブバンド信号周波数振幅ピーク情報と高域サブバンド信号利得情報とを多重化し圧縮データを出力する。 (もっと読む)


【課題】リアルタイムの放送番組の視聴時や録画コンテンツの再生時に、簡素な構成で、時々刻々話速が変化する適応的な話速変換音声に映像を時間遅れの蓄積なく同期させることが可能な技術を提供する。
【解決手段】映像音声同期再生装置は、音声データを音声区間と非音声区間とに分け、予め設定した伸縮倍率に応じて話速変換前の音声データの発話速度内に収まるように話速変換する。そして、話速変換後の音声データの再生時間と映像データの再生時間のずれが所定時間未満の場合、伸縮倍率に基づいて音声データのタイムスタンプのみを逐次更新する。一方、ずれが所定時間以上の場合、さらに、ずれ時間に応じて映像データを補間または削除し、映像データのタイムスタンプを更新する。そして、音声データのタイムスタンプと映像データのタイムスタンプと、に基づいて、音声と映像とを同期させて出力する。 (もっと読む)


【課題】しゃくりを模擬する頻度を高めることができる効果装置を提供すること。
【解決手段】入力された音声信号が子音から母音へ切り換わり、その切り換わった母音の入力レベルが閾値Lcよりも大きく、更には、変数tが時間Ts以上である場合には、効果音声信号Aを生成する。ここで、子音とは、母音以外の音、即ち、破裂音、摩擦音、鼻音、流音である。よって、音声信号の子音から母音への切り換わりが、例えば、有声音である鼻音や流音から、有声音である母音へと変化する状態であっても、効果音声信号Aを生成することができる。従って、ダブリングエフェクタ1によれば、しゃくりを模擬する頻度を高めることができる。 (もっと読む)


【課題】情報処理端末で文書データを音読するときの音声条件を簡便に設定できるようにする。
【解決手段】表示デバイスを備えた情報処理端末で、位置入力デバイスは、表示デバイスへ位置入力する。表示制御部は、表示デバイスに文字領域を生成すると共に、文字領域に文字を表示する。検出部は、文字領域への入力位置の移動パターンを検出する。条件作成部は、文字領域での移動パターンに基づいて、文字領域に表示されている文字の音読条件を作成する。 (もっと読む)


101 - 110 / 666