説明

国際特許分類[G10L19/06]の内容

国際特許分類[G10L19/06]に分類される特許

1 - 10 / 51



Notice: Undefined index: from_cache in /mnt/www/gzt_ipc_list.php on line 285

【課題】本発明は、可聴音(オーディオ、音声)圧縮に関し、信号圧縮方法及び装置に関する。
【解決手段】信号圧縮方法は、入力信号にウィンドウ関数を掛け、ウィンドウ処理された入力信号の、元の自己相関係数を計算し、元の自己相関係数に従って、白色雑音補正率又はラグウィンドウを計算し、元の自己相関係数と、白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、修正された自己相関係数に従って、線形予測係数を計算し、線形予測係数に従って、符号化されたビットストリームを出力することを含む。本発明による技術的解決法により、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。 (もっと読む)


【課題】予測量子化において主観品質の劣化を抑えるようにパラメータの補償処理を行うこと。
【解決手段】増幅器(305−1〜305−M)は入力した量子化予測残差ベクトルxn-1〜xn-Mに重み付け係数β1〜βMを乗算する。増幅器(306)は前フレームの復号LSFベクトルyn-1に重み係数β-1を乗算する。増幅器(307)はコードブック(301)から出力されたコードベクトルxn+1に重み係数β0を乗算する。加算器(308)は増幅器(305−1〜305−M)、増幅器(306)および増幅器(307)から出力されたベクトルの総和を計算する。切替スイッチ(309)は、現フレームのフレーム消失符号Bが「第nフレームは消失フレームである」ことを示し、かつ、次フレームのフレーム消失符号Bn+1が「第n+1フレームは正常フレームである」ことを示す場合には、加算器(308)から出力されたベクトルを選択する。 (もっと読む)


【課題】予測量子化において主観品質の劣化を抑えるようにパラメータの補償処理を行うこと。
【解決手段】増幅器(305−1〜305−M)は入力した量子化予測残差ベクトルxn-1〜xn-Mに重み付け係数β1〜βMを乗算する。増幅器(306)は前フレームの復号LSFベクトルyn-1に重み係数β-1を乗算する。増幅器(307)はコードブック(301)から出力されたコードベクトルxn+1に重み係数β0を乗算する。加算器(308)は増幅器(305−1〜305−M)、増幅器(306)および増幅器(307)から出力されたベクトルの総和を計算する。切替スイッチ(309)は、現フレームのフレーム消失符号Bnが「第nフレームは消失フレームである」ことを示し、かつ、次フレームのフレーム消失符号Bn+1が「第n+1フレームは正常フレームである」ことを示す場合には、加算器(308)から出力されたベクトルを選択する。 (もっと読む)


【課題】最小の帯域幅を用いて、複数のソース信号を送信する方法を提供する。
【解決手段】いくつかのオーディオソース信号を、ソース信号を復号化後に、波面合成、マルチチャネルサラウンドまたはステレオ信号を混合する目的で、送信または記憶する必要がある。ソース信号間に冗長性がない場合でさえ、ソース信号をジョイント符号化したときに、それら信号を別々に符号化する場合に比べ、顕著な符号化利得が得られる。これは、ソース信号の統計的特性、ミキシング技術の特性および空間聴覚を考慮することにより可能になる。ソース信号の和は、最終的に混合されたオーディオチャネルの知覚的に重要な空間キューを概ね決定するソース信号の統計的特性とともに送信される。ソース信号は、その統計的特性が元のソース信号の対応する特性に近似するよう受信機で回復される。 (もっと読む)


【課題】線形予測を用いない符号化方式から線形予測符号化に基づく符号化方式への切り替えを行う場合に、線形予測符号化に基づく符号化方式の符号手段または復号手段の内部状態の初期値を適切な値に設定し、切り替え直後のフレームにおける音声品質を改善すること。
【解決手段】線形予測符号化方式に基づく第1符号化部13によって符号化される符号対象フレームの前の符号直前フレームが、この線形予測符号化方式と異なる符号化方式に基づく第2符号化部14によって符号化された場合、第1符号化部13の内部状態を初期化することによって、符号対象フレームの符号化を線形予測符号化方式によって行う。これにより、線形予測符号化方式と、線形予測符号化方式と異なる他の符号化方式とを含む符号化処理が実現できる。 (もっと読む)


【課題】線形予測を用いない符号化方式から線形予測符号化に基づく符号化方式への切り替えを行う場合に、線形予測符号化に基づく符号化方式の符号手段または復号手段の内部状態の初期値を適切な値に設定し、切り替え直後のフレームにおける音声品質を改善すること。
【解決手段】線形予測符号化方式に基づく第1符号化部13によって符号化される符号対象フレームの前の符号直前フレームが、この線形予測符号化方式と異なる符号化方式に基づく第2符号化部14によって符号化された場合、第1符号化部13の内部状態を初期化することによって、符号対象フレームの符号化を線形予測符号化方式によって行う。これにより、線形予測符号化方式と、線形予測符号化方式と異なる他の符号化方式とを含む符号化処理が実現できる。 (もっと読む)


【課題】周波数変換係数を予測することで、符号化効率を向上させる。
【解決手段】周波数変換部162は、デジタル音声信号を周波数変換し、周波数変換係数群を算出する。係数予測部163は、算出された周波数変換係数群の低域側から順に処理対象の周波数変換係数と、該処理対象の周波数変換係数と低域側で隣接する隣接周波数セットとを取得する。そして、予測元データ141を検索して、隣接周波数セットと最も相関の高い予測元周波数セットを取得し、取得した予測元周波数セットに高域側で隣接する周波数変換係数を予測元周波数変換係数として取得する。係数予測部163は、処理対象の周波数変換係数を導出するための予測値を、取得した予測元周波数変換係数に基づいて算出する。エントロピ符号化部164は、算出された予測値を少なくとも含む係数データを符号化し、符号化係数データを生成する。 (もっと読む)


【課題】スピーチ信号の可変ビットレート符号化のための方法および装置であり、低いビットレートを実現する。
【解決手段】入力の分類に基づき適切な符号化モードが選択される。各分類について許容可能なスピーチ再生品質で最も低いビットレートを達成する符号化モードが選択される。高忠実度モードを、この忠実度が許容可能な出力のために要求されるスピーチの部分の期間中に使用するだけで、低い平均ビットレートが達成される。低ビットレートモードはこれらのモードが許容可能な出力を生成するスピーチの部分の期間中に使用される。入力スピーチ信号はアクティブおよび非アクティブ領域に分類される。要求される忠実度のレベルに応じて、種々の符号化モードがアクティブスピーチに適用される。符号化モードは、特定のモードのそれぞれの強さおよび弱さに応じて使用されうる。装置は、スピーチ信号の特性が時間的な変化に伴いモード間で動的に切換わる。 (もっと読む)


【課題】SNRビット率拡張音声符号化及び復号化装置とその方法を提供する。
【解決手段】基本階層、音質向上階層及び多重化器を含む符号化装置。基本階層は線形予測符号化により入力音声信号をフィルタリングし、固定コードブック探索及び適応コードブック探索によりフィルタリングされた音声信号に対応する励起信号を生成し、音質向上階層は基本階層での固定コードブック探索によって生成される媒介変数を利用して固定コードブックを探索するか、または基本階層の固定コードブック探索対象信号から基本階層の固定コードブックの寄与度と音質向上階層で以前の固定コードブックとを合成フィルタリングした信号を除去して得た対象信号を利用して固定コードブックを探索し、多重化器は基本階層で生成される信号と少なくとも1つの音質向上階層で生成される信号を多重化する。 (もっと読む)


1 - 10 / 51