説明

国際特許分類[G10L21/04]の内容

国際特許分類[G10L21/04]に分類される特許

41 - 50 / 666


【課題】低ビットレートオーディオコーディングシステムで使用することができ、そのようなシステムによって生成されるオーディオ信号の知覚品質を向上する技術を提供する。
【解決手段】オーディオ符号化システムにおける受信機は、オーディオ信号を表す周波数サブバンド信号を搬送する信号を受信する。オーディオ信号の1つ以上の特性を評価するためにサブバンド信号が検査される。スペクトル成分が合成され評価された特性を有する。合成されたスペクトル成分はサブバンド信号と統合され合成フィルタバンクへ渡されて出力信号が発生する。1実施の形態において、評価される特性は時間的形状であり、ノイズ様のスペクトル成分が合成されて時間的形状のオーディオ信号を有する。 (もっと読む)


【課題】歌唱表現の幅を狭めることなく、歌唱音声のピッチ変換を行う。
【解決手段】ピッチ量子化部121A及び121Bは、歌唱音声のピッチを検出して、当該ピッチを自身に割り当てられた音のピッチのうち最も近似するピッチに変換する。量子化パターン判定部122は、ガイドメロディの音高に基づいて、ピッチ量子化部121A及び121Bのうちのいずれかを指定するデータを生成する。量子化パターン選択部123は、量子化パターン判定部122により生成されたデータに基づいて、ピッチ量子化部121A及び121Bのうちいずれかの生成した信号を出力信号として出力する。 (もっと読む)


【課題】浴室で音声を出力する際に、残響による影響を低減させる。
【解決手段】試験音出力部110は音声データを試験用音声としてスピーカ300から出力する。ここで出力される音声データは、試験用の音声データであるのが好ましい。集音部120は、試験用音声を集音して集音データを生成する。補正方法算出部130は、音声データと集音データを比較することにより、残響を減少させるための補正方法を算出する。音声出力部210は、音声データ補正機能を有している。具体的には、音声出力部210は、補正方法算出部130が算出した補正方法を用いて、出力すべき音声データを補正する。そして音声出力部210は、補正後の音声データをスピーカ300から出力する。 (もっと読む)


【課題】音声の聞き取り易さを向上させること。
【解決手段】携帯電子機器1は、無線通信によって音声を受信する送受信部26と、送受信部26によって受信された音声の品質を判定する音切れ頻度判定部22b、電波品質判定部22cおよびピッチ周波数判定部22dと、送受信部26によって受信された音声を補正する出力音補正部34と、音声の無音区間において、音切れ頻度判定部22b等の判定結果に基づいて出力音補正部34による補正を開始または停止させる補正機能制御部22eとを備える。 (もっと読む)


【課題】高周波数再構成(HFR)方法を使用するデジタル音声のより整合的なコア・コーデック性能を可能にする。
【解決手段】コア・コーデックによってコード化されたローバンドとHFRシステムによってコード化されたハイバンドとの間のクロスオーバ周波数の経時的適合化によって、このようなシステムの全体性能を向上させる方法を教示している。クロスオーバ周波数の瞬間的な最適選択を確立させる異なる方法が導入されている。クロスオーバ周波数の選択は、信号をコア・コーデックで符号化する困難さの程度の測度、短期ビット・デマンドの検出及びスペクトル調性の解析又はこれらの任意の組合せを基礎とすることが可能である。困難さの測度は、知覚エントロピー又は心理音響学に関連するコア・コーデック歪みから導出することができる。 (もっと読む)


【課題】SBRに代表される周波数領域での帯域拡張技術において、ビットレートを著しく増大させることなく、発生するプリエコー・ポストエコーを軽減し復号信号の主観的品質を向上させる。
【解決手段】周波数領域で表現された信号に対し、共分散法または自己相関法によって周波数方向に線形予測分析を行って線形予測係数を求め、さらに求められた線形予測係数に対しフィルタ強度の調整を行った後、調整後の係数により信号を周波数方向にフィルタ処理することにより、信号の時間エンベロープを変形する。 (もっと読む)


【課題】ハウリングを防止しつつ、適切なマスカ音を生成する音声処理装置を提供する。
【解決手段】音声解析部13は、入力された音声信号からフォルマントやピッチ等の音声特徴量を抽出する。マスカ音生成部14は、抽出した音声特徴量に基づいて、データベース15に記憶されている音源(汎用マスカ音)を加工し、出力用マスカ音を生成する。汎用マスカ音は、例えば、男性および女性を含む複数人の音声を録音したものであり、語彙的には何ら意味をなさない(会話内容が理解できない)撹乱音が含まれている。マスカ音生成部14は、撹乱音のフォルマントを入力音声信号のフォルマントに一致させる。生成されたマスカ音は、語彙的には何ら意味をなさないものであり、かつ声質や音高は話者と近似している撹乱音が含まれているため、聴取者は、実際の話者の発言内容を理解することが困難となる。 (もっと読む)


【課題】入力信号の話速変換を行う話速変換装置及びプログラムを提供する。
【解決手段】本発明の話速変換装置100は、入力音声について区分した各区間について所定の倍率で時間伸縮を施す時間伸縮部122,124と、入力音声について区分した各区間における基本周波数の変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して基本周波数を変換する基本周波数変換部206,208及び/又はパワーを変換するパワー変換部306を備える。 (もっと読む)


【課題】プレゼンテーション、講演、選挙演説などの場において、人間が注意を向ける音声要素と心地良く耳を傾けたくなる音声要素に着目し、注目と傾聴の双方の効果を高めることができる音声加工装置を提供する。
【解決手段】音声入力信号に応じた共感音声を生成する共感音生成回路310と、音声入力信号に応じた異質感覚音声を生成する異質感覚音生成回路320とを具備すると共に、上記共感音生成回路310と、上記異質感覚音生成回路320のそれぞれの出力割合を変化させる付加比率制御部500を備える。 (もっと読む)


【課題】
特別なテスト音声信号を用いずに、周波数特性の調整を適切に行う。
【解決手段】
周波数分布解析部210Iが、再生出力の対象となった楽曲コンテンツをそのまま反映したコンテンツ音声の周波数分布解析を行って、基準周波数分布RSPIを得る。引き続き、調整補正量算出部220が、出力音量の設定値を考慮した周波数分布SPIを算出する。そして、調整補正量算出部220が、周波数分布SPIのレベル値が所定レベル値LVTH以上となる範囲を、周波数特性の補正を行う補正周波数範囲に決定する。一方、周波数分布解析部210Oが、当該楽曲コンテンツの再生出力音声が収音された収音音声の周波数分布解析を行って、周波数分布SPOを得る。こうして得られた周波数分布SPOと、周波数分布SPIとの比較結果に基づいて、決定された補正周波数範囲における調整補正量を算出する。 (もっと読む)


41 - 50 / 666