説明

国際特許分類[G10L19/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 冗長を減らすための音声または音響信号の分析合成技術,例.ボコーダーにおける;音声または音響信号のコード化またはデコード化,例.圧縮,拡張,ソースフィルターモデルまたは心理音響分析のためのもの (3,650)

国際特許分類[G10L19/00]の下位に属する分類

国際特許分類[G10L19/00]に分類される特許

2,331 - 2,340 / 2,383


本発明は、符号化係数によってフレーム毎に表わされた情報の、周波数領域におけるエラー隠蔽技術に関する。基本的な考え方は、時間と周波数の両方における符号化係数の相関を利用することによって、誤り符号化係数を隠蔽することである。この技術は、音声、動画、画像データなど、符号化係数へと圧縮され、不利なチャネル条件の下で送信される情報であれば、いかなる情報にも適用可能である。本発明が提案するエラー隠蔽技術は、元の情報信号の周波数の冗長性だけでなく時間の冗長性も利用するという明らかな優位性を持っている。例えば、これにより、フレーム内の冗長性だけでなく、フレーム間の冗長性も利用する可能性が生まれる。同一フレームからの符号化係数を誤り符号化係数として使用することは、フレーム内係数相関として言及されることがあり、より一般的な周波数相関の内の特殊なケースである。
(もっと読む)


ポリフォニック信号が、通常はモノラル信号である主信号および副信号(xside)を生成するために使用される。副信号(xside)のいくつかの符号化方式(81)が提供される。各符号化方式(81)は、異なる長さのサブフレーム(90)セットによって特徴付けられる。サブフレーム(90)の全長は、符号化方式(81)の符号化フレーム(80)の長さに対応する。副信号(xside)について使用される符号化方式(81)は、ポリフォニック信号の現在の信号内容に応じて選択される。好適な実施形態では、副残差信号が、バランス係数でスケーリングされた副信号と主信号との差として生成される。バランス係数は、副残差信号を最小にするように選択される。最適化された副残差信号およびバランス係数は、符号化され、副信号を表す符号化パラメータとして供給される。
(もっと読む)


本発明は、処理されたメディア信号の配信を簡単化する方法及び装置並びにメディア信号を配信する方法及び装置に関する。プロパティ決定ユニットは、メディア信号の信号従属プロパティ群を決定する。埋め込みユニットは、変更されたメディア信号を提供するため、信号従属プロパティをメディア信号に埋め込む。抽出ユニットは、メディア信号ストレージから変更されたメディア信号を検出し、信号従属プロパティを抽出する。その後、信号処理ユニットは、処理されたメディア信号が少なくとも1人の受信者に配信されるために提供可能となるように、信号従属プロパティを利用してメディア信号を処理する。このようにして、格納スペースを節約し、電子コンテンツ送信システムの複雑さを低減する。
(もっと読む)


パラメトリックモデル(25)が誤り隠蔽に用いられる。モデルフィルタ(25)は、現在失われているか、誤っている元のオーディオチャンネル信号の信号成分(x;(n))を、少なくとも1つの他のオーディオチャンネルの信号成分(m-i(n))から回復可能にする。有効フレームが誤りなしに受信されている間、そのモデルのパラメータ(h1(n))が取得及び保存される(24)。多チャンネル情報に影響を与えるフレーム欠損やフレーム誤りが生じた場合、失われた情報の推測が、保存されたパラメータ(hi(n))を用いるそのモデルの適用により回復される。複数のフレームが連続して欠損した場合や誤った場合には、最新の有効フレーム中で得られたパラメータを用いるか、個々の過去の無効フレームの回復された多チャンネル情報から得られたパラメータのいずれかを用いることができる。さらに、欠損フレームが長く連続する場合、モデルパラメータのいくらかの段階的なミューティングを適用することが好ましく、その結果、基本的にはモデルパラメータの段階的な減衰が得られる。
(もっと読む)


本発明の音声圧縮伸張装置は、ADPCM方式でデジタル音声データを圧縮伸張する際に、ADPCM回路(101)に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断するLPF(102)を備えることで、圧縮率を高めたことによって伸張後のデジタル音声データに発生する高周波数帯域の量子化ノイズを低減する。また、ADPCM回路(101)の圧縮ビットレートに応じてLPF(102)の特性を変えることのできるコントローラー(103)を備えることで、圧縮ビットレートに応じた最適な特性を持つLPFを構成することができ、使用者の好みに合わせた音質で音声データを再生することができる。 (もっと読む)


インパルス応答を複数の連続した制御パラメータフィールド(15,16,17,18)、特にparams[128]フィールドに挿入することにより、室内特性を持ったMPEG−4規格に準拠した音信号の再生のために、実際の、すなわち、測定された室内インパルス応答を伝送及び使用することができるようにする。第1の制御パラメータフィールド(15)は後続フィールドの個数及び内容に関する情報を含んでいる。音信号のプレゼンテーションのために、連続した制御パラメータフィールドの内容が分離され、ノード(12)の追加メモリに格納され、室内特性を計算する際に使用される。
(もっと読む)


本発明は、問い合わせデータオブジェクトを候補データオブジェクトのマッチングを、両データオブジェクトのフィンガープリントを抽出して比較することによって行うための方法および装置に関する。本発明のある実施形態では、フィンガープリント抽出モジュール(110)、フィンガープリントマッチングモジュール(210)、統計モジュール(120)および識別モジュールを有する装置が提供される。フィンガープリント抽出モジュール(110)は、問い合わせオブジェクトの一部をなしていて問い合わせフィンガープリントを構築する情報信号を受信する。フィンガープリントマッチングモジュール(210)は、前記問い合わせフィンガープリントを少なくとも一つの潜在的な最良一致候補を見出すためにデータベース(215)中に保存されている候補と比較する。一方、統計モジュールは、前記問い合わせフィンガープリントの統計的モデルを決定して、それによりたとえば、前記問い合わせフィンガープリントの内部におけるある種の情報の統計分布を決定する。閾値決定器(120)は、前記問い合わせフィンガープリントの分布に基づいて、前記問い合わせフィンガープリントとある潜在的最良一致候補とが識別モジュール(130)によって同様であると宣言されうる範囲の適応的閾値距離Tを導出するよう構成される。閾値を問い合わせおよび/または候補フィンガープリントから導出される統計的データに依存しうるよう設定することによって、他人受入率FARの改善が達成されうる。 (もっと読む)


オーディオプレーヤ装置(1)と方法(2)を開示する。オーディオプレーヤ装置は、オーディオプレーヤ装置の場所に少なくとも1人のユーザがいることを入力する、ボタン(11、12、13、14)またはタッチスクリーン上のソフトボタン等の入力手段(10)を有する。プレーヤ装置(1)は、さらに、オーディオに関する好みの入力手段(20)を有する。よって、オーディオプレーヤ装置(1)により再生されるオーディオは、オーディオプレーヤ装置(1)の場所にいるユーザの現在のオーディオに関する嗜好及び/または気分に合わせられる。
(もっと読む)


入力データを予め定められた単位ごとに符号化することにより符号化データを生成し、1以上の前記単位の前記符号化データを固定長のパケットにマッピングして出力する符号化装置100は、符号化データを蓄積すると共に、蓄積している符号化データのデータサイズを出力する蓄積部103と、蓄積部103に蓄積されている符号化データを前記パケットにマッピングすると共に、1以上の単位の符号化データに対して付与されるヘッダーサイズと、パケットのペイロードサイズとを出力するパケット化部104と、出力された符号化データのデータサイズと、ヘッダーサイズと、ペイロードサイズとに基づいて制御情報を生成し、出力する制御部107と、出力された制御情報に基づいて、パケットにマッピングする符号化データのデータサイズがパケットのペイロードサイズの整数倍になる外部候補値を算出し、外部候補値を目標として前記予め定められた単位の入力データを符号化することにより符号化データを生成する符号化部102とを備える。
(もっと読む)


本発明は音声出力を制御するための方法(300)及びシステム(100)に関する。この方法には、音声信号及び電圧レベル信号を入力する工程(312)と、音声信号及び電圧レベル信号を測定する工程(314)と、所定の対応するゲイン目標値(138)の属する1つ以上のテーブル(134)に対し音声信号をマッピングする工程(316)と、音声信号に対する1つ以上のゲイン目標値を選択する(318)工程とが含まれる。マッピングする工程及び選択する工程は、少なくとも部分的には、電圧レベル信号の測定値及び音声信号の測定値に基づく。また、この方法には、音声信号に対しゲイン目標値を適用する工程(320)も含まれる。
(もっと読む)


2,331 - 2,340 / 2,383