説明

ドルビー・ラボラトリーズ・ライセンシング・コーポレーションにより出願された特許

31 - 40 / 111


量子化されたエネルギ値が評価され、メディア・シーケンスのコンテンツ要素の時間的に関連するグループを最初に表現する。エネルギ値は、最初の表現が分割されてなる複数の領域のマトリックスにわたり評価される。最初の表現は、ダウンサンプルされ、および/または、そのコンテンツから切り取られる。基底ベクトルのセットが、その値から次元空間において推定される。最初の表現は、別の次元空間の次の表現に変換される。次の表現は、基底ベクトルに基づいて、最初の表現を投影する。次の表現は、メディア・コンテンツ部分の幾何学的方向の変化においてメディア・コンテンツ部分に信頼性よく対応する。グループの他のメディア・コンテンツ部分に対し繰り返して、第1部分と他の部分の次の表現は、時間で平均化され、または、変換される。平均化された/変換された値は、速度変化においてコンテンツ部分に信頼性よく対応する。最初の表現は、空間のまたは変換された関連のある情報を含んでもよい。 (もっと読む)


本発明はマルチメディア符号化及び復号システム及び方法に関する。本システム及び方法は追加情報を信号化するために特定の予測モード、例えば、メタデータ、を使用するシステム及び方法を提供する。その一方、符号化効果とメタデータの間のバランスを考慮しつつこれを実現する。予測モードは、ビットに関係するモードテーブル及び符号化の強い影響を考慮することにより符号化することができる。開始及び停止コードがメッセージを信号化するのに使用でき、他方モードをビットテーブルに合わせてどのように適切に設計するかについての種々の技術を提供する。
(もっと読む)


スピーチ成分と雑音成分から構成されるオーディオ信号のスピーチ成分を強調する方法であって、サブバンド中のオーディオ信号の利得を制御することを含み、ここでスピーチ成分のレベルに対して推定された雑音成分のレベルが増加する場合に、サブバンドにおける利得は低減され、推定された雑音成分のレベルの少なくとも一部分が以下の場合に決定される;
(1)サブバンド中の入力信号レベルが、定められた時間を越えて、ある限度だけサブバンド中の推定された雑音成分を超過する場合に、推定された雑音成分のレベルをサブバンド中の前記オーディオ信号のレベルと比較すると共に、予め定められた量によってサブバンド中の推定された雑音成分のレベルを増加する、
(2)サブバンド中の信号対雑音比が、定められた時間を越えて、ある限度を越える場合に、サブバンド中の信号対雑音比を監視して得ると共に、予め定められた量によってサブバンド中の推定された雑音成分のレベルを増加する。 (もっと読む)


スピーチ成分とノイズ成分からなるオーディオ信号のスピーチ成分を改善する方法により、オーディオ信号のサブ帯域を処理が処理され、該処理には、いくつかの前記サブ帯域中のオーディオ信号のゲインを制御することが含まれ、サブ帯域のゲインは、少なくとも、サブ帯域中のスピーチ成分のレベルに対してノイズ成分のレベルが増大するにつれてサブ帯域のゲインを減少させるため、及び、オーディオ信号のサブ帯域中にスピーチ成分が存在するとき、サブ帯域中のゲインを増大させるために、ゲイン中の差異を加算/減算するか、又はゲインの比を乗算する処理により制御され、該処理は、それぞれオーディオ信号のサブ帯域に応答し、ゲインを独立に制御して、処理されたサブ帯域オーディオ信号を出力することを特徴とする。
(もっと読む)


スピーチを増強する方法であって、オーディオ信号の中央チャンネルを抽出して、中央チャンネルのスペクトルを平坦化して、平坦化されたスピーチ・チャンネルにオーディオ信号を混合することにより、オーディオ信号における任意のスピーチを増強することを含む。また、複数のチャンネルによりオーディオ信号から音の中央チャンネルを抽出する方法、オーディオ信号のスペクトルを平坦化する方法、及びオーディオ信号におけるスピーチを検出する方法が開示される。更に、スピーチエンハンサが開示され、これはオーディオ信号の中央チャンネルを抽出するための抽出器と、前記中央チャンネルのスペクトルを平坦化するためのスペクトル平坦化器と、前記中央チャンネルにおけるスピーチ検出における信頼度を生成するスピーチ信頼度生成器と、前記平坦化されたスピーチ・チャンネルを原オーディオ信号に、検出されたスピーチの信頼度に比例して混合することにより、オーディオ信号における任意のスピーチを増強するミキサとを備える。 (もっと読む)


臨界帯域幅での平均エネルギーを計算するための回路と、閾値関数を決定するための回路と、該閾値関数をダイナミックな修正を行うための回路と、該閾値関数により定まる閾値を越えるエネルギーを持つ信号の周波数成分を特定し、特定された該閾値を越えるエネルギーを持つ信号の周波数成分の平均エネルギーを表す第1の平均エネルギー値を決定するための回路と、該閾値関数により定まる閾値未満エネルギーを持つ信号の周波数成分を特定し、特定された該閾値未満エネルギーを持つ信号の周波数成分の平均エネルギーを表す第2の平均エネルギー値を決定するための回路と、前記第1の平均エネルギー値と前記第2の平均エネルギー値のうちの少なくとも1つのオフセットを行うための回路と、結果として生じる平均エネルギーを相互に比較するための回路と、該平均エネルギー値が前記第2の平均エネルギー値未満の場合にノイズアクティビティが生じていることを表示するための回路とを具備するノイズアクティビティ検出器である。
(もっと読む)


一実施例では、第1の信号と第2の信号を整合する方法であって、第1の信号と第2の信号の周波数成分が少なくとも1つの関連する周波数ビンに割り当てられるように、選択された周波数帯上で、第1の信号と第2の信号を周波数領域に変換し、各周波数ビンに関連する換算比を生成し、2つの信号の少なくとも1つ、又は2つの信号のうちの1つから導き出された少なくとも1つの第3の信号のために、その周波数ビンに関連した換算比によって各周波数ビンに関連した周波数成分を換算することを含む。この生成には、非スタートアップ期間において、各周波数ビンにおける第1の信号と第2の信号の信号比を決定し、各々の信号比の使用可能性を決定し、それが使用可能であるとわかる場合に、換算比の計算の中で信号比を使用する。 (もっと読む)


種々の局面による方法と装置は、低ダイナミックレンジ(LDR)フォーマットで入力された画像データとして取り込み、入力された画像データのダイナミックレンジより大きなダイナミックレンジを有する向上した画像データ(すなわち高ダイナミックレンジ(HDR)画像データ)を出力として生成する。実施の形態によっては、本方法はビデオデータに適用され、リアルタイムで実行される(すなわち、ビデオフレームのダイナミックレンジの増大するビデオフレームの処理を、少なくともビデオ信号のフレームレートの平均で終了する)。 (もっと読む)


【課題】信号の時変レベルを平滑化する方法、媒体および装置。
【解決手段】方法は信号の短期間レベルの時変確率密度を推定し、確率密度の使用により信号のレベルを平滑化することを含む。信号はオーディオ信号である。短期間レベルと平滑化レベルは、時系列であって、現在時刻インデックスと前時刻インデックスを各々有する。ここで、平滑化の前に、前時刻インデックスでの平滑化レベルの確率を計算することが生じる。平滑化の前に、確率密度を使用して、平滑化媒介変数を計算することが生じてもよい。平滑化媒介変数の計算は、前時刻インデックスでの平滑化レベル、現在時刻インデックスでの短期間レベル、および前時刻インデックスでの平滑化レベルの確率を使用して、平滑化媒介変数を計算することを含む。平滑化媒介変数の計算は推定された確率密度の幅を使用して、平滑化媒介変数を計算することを含む。 (もっと読む)


音響信号の聴覚イベントのラウドネスをコントロールする方法である。実施の形態では、その方法は、聴覚イベント(聴覚イベントはスペクトルとラウドネスを有する)をスペクトルの歪みを用いて重み付けすることと、その重みを用いて聴覚イベントのラウドネスをコントロールすることを含む。本発明の種々の実施の形態は以下の通りである:重み付けは、スペクトルの歪みの大きさに比例すること;重み付けは、音響信号の振幅に鈍感であること;重み付けは、パワーに鈍感であること;重み付けは、ラウドネスに鈍感であること;信号の大きさと絶対的再生レベルとの関係は、重み付けの時点で分かっていないこと;重み付けには、スペクトルの歪みを用いて、聴覚イベント境界の重要性の重み付けをすることを含む。 (もっと読む)


31 - 40 / 111