説明

国際特許分類[G10L19/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 冗長を減らすための音声または音響信号の分析合成技術,例.ボコーダーにおける;音声または音響信号のコード化またはデコード化,例.圧縮,拡張,ソースフィルターモデルまたは心理音響分析のためのもの (3,650)

国際特許分類[G10L19/00]の下位に属する分類

国際特許分類[G10L19/00]に分類される特許

2,311 - 2,320 / 2,383


ステレオ信号の処理方法であって:ステレオ信号(L0,R0)と空間パラメータ(wl,wr)中のNチャンネルオーディオ信号を符号化する段階と、処理されたステレオ信号(L0w,R0w)を発生するために空間パラメータを用いてステレオ信号を処理する段階と、を有する。処理されたステレオ信号の行列は、ステレオ信号の行列として記述してフィルタ関数(H)をかける。その要素は空間パラメータ(wl,wr)及び定数(a)で演算されたフィルタ関数(H1,H2,H3,H4)である。フィルタ関数は時間不変であり、行列が可逆であるように選択される。
(もっと読む)


オーディオ・コーデックは、オーディオ・データを、スケーラブル・ビットストリームの一連の分析ウィンドウに可逆符号化する。これは、オーディオ・データをMSB部分とLSB部分に分け、それぞれを異なる可逆アルゴリズムで符号化することによって、適切に行われる。オーサリング・ツールは、それぞれのウィンドウについてバッファ・ペイロードと許容ペイロードとを比較し、非適合のウィンドウ中の可逆符号化オーディオ・データ、適切にはLSB部分、を選択的にスケーリングして、符号化ペイロード、従ってバッファ・ペイロードを低減させる。この手法は、元のオーディオ・データをフィルタする必要も、再符号化する必要もなく、また、可逆ビットストリームを乱すこともなく、媒体ビット・レート及びバッファ容量の制約を満たす。
(もっと読む)


本発明の一実施形態は、国際電気通信連合ITU−T G.729付録Bコンフォートノイズ生成アルゴリズムを、コンフォートノイズ生成アルゴリズムの計算の複雑性を低減することにより改良する。計算の複雑性は、事前計算済みの複数のランダムガウスノイズサンプルをそれぞれの非アクティブボイスフレームのために再使用することにより、付録Bで説明される新しい複数のランダムガウスノイズサンプルをそれぞれの非アクティブボイスフレームのために計算することに対して低減される。 (もっと読む)


速度係数により制御可能な適応予測アルゴリズムが、速度係数が第1の値を有する場合は、第1の適応速度および第1の適応の正確性と、付随する第1の予測正確さとで動作を開始して、速度パラメータが第2の値を有する場合は、第1の適応速度と比較してより遅い第2の適応速度と、そして第1の正確さと比較してより高い第2の正確さとで動作する場合は、リセット時点後に適応継続時間が発生し、まだ適応していない予測係数により初めは予測誤差が増加するが、まず初めに設定速度パラメータを第1の値(42)に設定して、しばらくしてから、第2の値(50)に設定することにより、予測誤差を低減することもできる。リセット時点後に所定の継続時間経過してから、速度パラメータを再び第2の値に設定した後は、従って、第1の速度パラメータ値を用いる場合よりも、送信する予測誤差、そして残差がさらに最適化され、あるいは、より小さくなっている。 (もっと読む)


本発明は、メディアブロックのサイズがビットストリームからの情報の一部に基づいて最初に計算されるかまたは決定される、2ステップの復号化アプローチに関係する。このサイズ情報はメディアブロックのバイト数または長さを定める。サイズ情報は、次に、後続の第2のメディアブロックおよび残りのビットストリームから第1のメディアブロックを切り取るかまたは抽出するため使用される。このステップは、実際の復号化ステップより少ない計算または処理を必要とする。第1のメディアブロックの標準的な復号化が次に進行し、同時に、並列アーキテクチャの処理エレメントは、第1のメディアブロックの処理の終了を待つことなく、第1のステップで獲得されたサイズ情報を使用して第2のメディアブロックへ直ぐにジャンプすることが可能である。このようにして、基礎的なアーキテクチャは複数のブロックを同時に復号化することにより並列性を利用することができるので、復号化時間が短縮される。
(もっと読む)


ステレオオーディオエンコーダ(100)は、モノラル信号と、入力ステレオ信号の少なくとも高周波数部分に対するパラメトリックステレオパラメータとを生成するパラメトリックステレオエンコーダ(115)を有する。ステレオインテンシティエンコーダ(117)は、モノラル信号のステレオインテンシティデータを生成する。モノラル信号とインテンシティデータは、MPEGレイヤーII等の符号化標準規格に従って符号化され、パラメトリックステレオパラメータは出力プロセッサ(113)により補助データセクションに含まれる。よって、レガシーデコーダ(MPEGレイヤーIIデコーダ等)はステレオインテンシティデータを用いてステレオ信号を生成するが、より複雑なデコーダはパラメトリックステレオパラメータを用いて高品質オーディオ信号を生成する。ステレオデコーダ(200)は、エンコーダ(100)から符号化データを受信する。インテンシティデコーダ(203)はインテンシティデータを用いてステレオ信号を生成する。これはパラメトリックステレオデコーダ(207)に入力され、取り出されたパラメトリックステレオデータに従ってステレオ信号を処理する。
(もっと読む)


マルチチャネル信号を処理する装置であって、2つのチャネルのうちの第1のチャネルと2つのチャネルのうちの第2のチャネルとの間の類似性を判定する手段(12)を備える。また、スペクトル係数の予測フィルタリングを実行する手段(16)を備え、この手段は、第1のチャネルおよび第2のチャネルの間の類似性が高い場合は、2つのチャネルに1つの予測フィルタ(16a)だけを用いて予測フィルタリングを行い、第1のチャネルおよび第2のチャネルの間が非類似性を有する場合は、2つの別々の予測フィルタ(16b)を用いて予測フィルタリングを行うように構成されている。これにより、ステレオ符号化技術において、ステレオアーティファクトの生成および符号化利得の低下を回避する。 (もっと読む)


放送源の識別のための方法および装置が提供される。ユーザは、何らかの放送手段から放送されているオーディオ・プログラムを聞くことがあり、オーディオのサンプルを記録することができる。次いで、サンプルは、ユーザがどの放送局を聴いているか決定するために分析手段に伝達される。分析手段は、多くの放送チャネルを監視する。したがって、オーディオ・サンプルの特性と放送チャネルから取られたサンプルの特性が、一致の検出のために比較され得る。次いで、一致が検出された放送チャネルに関係する放送情報が、たとえば販促の広告、懸賞の通知、割引きの案内、および特定のラジオ局に固有の他の情報と組み合わせてユーザに報告し返され得る。
(もっと読む)


マルチチャネル信号をもとに、ステレオ信号を生成するオーディオエンコーダであって、ダウンミックス部100は、2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスする。第1符号化部101は、ダウンミックスされたステレオ信号を符号化し、第1符号化信号を生成する。第2符号化部102は、ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成する。符号量算出部103は、第2符号化信号の符号量を算出する。第1多重化部104は、第1符号化信号または第2符号化信号とのいずれかと、算出された符号量とを多重化する。これにより、デコーダは、上記符号量に基づいてマルチチャネル信号の符号化信号を簡単に抜き取れるので、ダウンミックス信号のみを再生するデコーダを安価に構成することができる。 (もっと読む)


トランスコーダは、符号化信号を表し、第1符号化データと第1パラメトリック拡張データとを有する入力データを表す受信機を有する。符号化データは、デコーダに供給される。デコーダの出力は、異なる符号化プロトコルに従って、又は異なる符号化パラメータにより第2符号化データを生成するエンコーダに供給される。第1パラメトリック拡張データは、第1パラメトリック拡張データから直接第2パラメトリック拡張データを生成する拡張データプロセッサに供給される。第2符号化データ及び第2パラメトリック拡張データは、個別に決定されたパラメトリック拡張データを有する符号変換信号を生成するため、出力プロセッサにおいて合成される。パラメトリック拡張データは、音声ビットストリームのSBR(Spectral Band Replication)又はPS(Parametric Stereo)拡張データであってもよい。品質の向上及び複雑さの低下は、パラメトリック拡張データの個別の符号変換によって達成される。
(もっと読む)


2,311 - 2,320 / 2,383