説明

受信され、電子透かしがおそらく埋め込まれた信号にリファレンスパターンが存在するか否かを判定する方法及び装置

【課題】相関に基づいた電子透かし検出システムのエコー及び反響音に関するロバスト性を改善する。
【解決手段】多くの電子透かしシステムは、検出メトリックを計算するために相関を利用し、これは、埋め込まれるべきメッセージに依存して、幾つかのリファレンスパターンがエンコーダサイドで生成され、それらの1以上は、コンテンツ信号に埋め込まれることを意味する。埋め込まれたメッセージをデコードするため、そのリファレンスパターンがエンコーダサイドで埋め込まれたかを発見することが必要である。本発明によれば、受信された信号のエコーを、それらをノイズとして扱う代わりに利用する。電子透かし検出結果は、エコーから得られる相関値をメインの相関ピークに統合し、これにより相関結果のピーク振幅の予め決定された近傍に位置され、予め決定された閾値を超える相関結果の振幅値を使用することで改善される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、相関及び相関結果のピーク検出を使用して、受信され、電子透かしがおそらく埋め込まれた信号にリファレンスパターンが存在するか否かを判定する方法及び装置に関する。
【背景技術】
【0002】
オーディオ又はビデオ信号における電子透かしは、たとえばWO2007/031423、WO97/33391(US6584138B1)又はUS6061793に記載されるように、相関を使用してレシーバ又はデコーダサイドで検出することができる。
【0003】
多くの電子透かしシステムは、検出メトリックを計算する相関を利用し、この検出メトリックは、幾つかの擬似ランダム系列又はリファレンスパターンは、エンコーダサイドで生成され、それらの1以上は、埋め込まれるべきメッセージに依存してコンテンツ(たとえばオーディオ又はビデオ信号)に埋め込まれることを意味する。同じ擬似ランダム系列は、デコーダサイドで生成される。埋め込まれたメッセージをエンコード及びデコードするために周波数変換が使用される。埋め込まれたメッセージをデコードするため、埋め込まれたメッセージをデコードするため、どの擬似ランダム系列がエンコーダサイドに埋め込まれたかを発見することが必要である。このことは、既知の擬似ランダム系列を場合によっては電子透かしが埋め込まれているコンテンツと相関計算を行なうことで、これらのシステムで決定され、これにより、相関は、前処理されたバージョンのコンテンツで動作する場合があり、この前処理は、逆周波数変換、スペクトル成形及び/又はホワイトニングを含む場合がある。
【0004】
それぞれ埋め込まれたリファレンスパターンは、埋め込まれたメッセージの1ビットを表す。それぞれ埋め込まれたリファレンスパターンが埋め込まれたメッセージのうちの2以上のビットを表している電子透かしシステムがある。
【0005】
WO2005/078658では、相関結果のクラスタが評価され、あるクラスタは、相関ピークの周辺における相関結果を含み、検出の閾値を超える。
【0006】
電子透かしの検出器は、相関結果の値のサイズに依存して、所与の擬似ランダム系列が埋め込まれているか否かを判定する。
【0007】
関連される改善された判定処理は、PCT/US2007/014037に記載されており、ここでは、相対的な相関結果の値の計算により、誤ったポジティブレート、すなわち、電子透かしが埋め込まれていないコンテンツが埋め込まれているとして分類される確率が減少される。この処理は、電子透かしが埋め込まれたコンテンツがたとえば(mp3、AAC、WMA、AC−3、MPEGのような)知覚的符号化により変更された場合であっても良好に機能すると考えられる。
【図面の簡単な説明】
【0018】
本発明の例示的な実施の形態は、添付図面を参照して記載される。
【0019】
【図1】穏やかに乱れたコンテンツをもつ受信された信号について、デコーダサイドで計算された相関結果の値を表すグラフである。
【図2】ラウドスピーカにより送信され、マイクロフォンで記録された受信された信号についてデコーダサイドで計算された相関結果の値である。
【図3】本発明の処理を説明するフローチャートである。
【図4】ピークの合計の最大値の計算を説明するフローチャートである。
【図5】相関結果の振幅とτとの領域で示される本発明の処理を説明するグラフである。
【発明を実施するための最良の形態】
【0020】
上述されたように、多くの電子透かしシステムは、相関に基づいた検出を使用するものであり、このことは、エンコーダサイドで、ビット又はワード値を表す幾つかの擬似ランダム系列が生成されるか、メモリから選択され、それらの1以上が埋め込まれるべきメッセージ(たとえばウォータマークビット)に依存してコンテンツ又は信号(たとえばオーディオ又はビデオ信号)ことを意味する。デコーダサイドで、同じ擬似ランダム系列が生成されるか、メモリから選択される。埋め込まれたメッセージをデコードするため、どの擬似ランダム系列が受信されたコンテンツ又は信号に埋め込まれたかを発見することが必要である。このことは、既知の擬似ランダム系列を恐らく前処理されたコンテンツ又は信号と相関付けすることで実行される。その後、デコーダ又はレシーバ検出器は、相関結果の振幅値のサイズに依存して、所与の系列が埋め込まれているか否かを判定する。
【0021】
長さNの信号又は系列xは、x=(x(1),x(2),x(3),...,x(N))として定義され、x(n)は、信号又は系列xのn番目のサンプルである。信号x及び擬似ランダムのリファレンスパターンrが既に同期されている場合、正規化された相関値Cは以下のように計算される。
【0022】
【数1】

ここでSum(i=1..N)はΣNi=1を意味し、Nは信号x及び系列rの長さであり、iはサンプルのインデックスであり、“||...||”は、ユークリッドのノルムである。ユークリッドノルムは、以下のように定義される。
【0023】
【数2】

Cの絶対値が大きくなると、現在のリファレンスパターンrがxに埋め込まれる確率が高くなる。Cの負の値は、パターンrが埋め込みステージと検出ステージとの間で無効にされていることを示す。
【0024】
しかし、通常xとrは同期されていない。係るケースでは、異なるオフセットτ=1,2,3,...,Nについて正規化された相関値(相関「ラグ」と呼ばれることがある)は、以下のように計算される。
【0025】
【数3】

この種の計算について、FFT(高速フーリエ変換)を使用した高速アルゴリズムを利用することができる。信号xと所与のリファレンス系列rとの間の対応するオフセットτは、C(τ)を最大にする値τを発見することで計算される。
【0026】
図1は、緩やかに乱れたコンテンツをもつ受信された信号xについて、デコーダサイドで計算される相関結果の値C(τ=0)を示す。水平軸は、サンプルの位置を示し、垂直軸は、相関結果の振幅を示す。水平の位置“0”に関連する明らかな高い振幅のピークを判定することができる。
【0027】
PCT/US2007/014037では、最も大きな正規化された相関値と2番目に大きい正規化された相関値との間の差又は比を使用して、電子透かしの検出をよりロバストにすることが提案されている。しかし、C(τ)の最大値を発見することは、受信された信号又はコンテンツが音響経路の伝送を受ける場合にもはや機能せず、その対応するデコーダの相関結果は、図2に示される。図1における非常に明らかな振幅ピークは、非常に小さく、エコー及び反響音のために時間的に分散されている。リファレンス信号rの存在及びオフセットを示すピークは、受信された信号におけるノイズから得られるピークよりも小さいことさえ生じる。
【0028】
本発明の処理は以下のように機能するものであり、ここでkは現在の擬似ランダムリファレンスパターン又は系列rのインデックスである。
a)たとえばフィルタリング及び/又はホワイトニングのような信号処理によりオーディオ信号又はリファレンス信号をエンハンスした後、上述されたように、受信された信号xの現在のセクションについて、それぞれのリファレンス信号rkについて相関Ck(τ)を計算する。
b)それぞれのCk(τ)について、(ピークグループの)最大の累積されたピークの合計を発見する。
c)PCT/US2007/014037に記載されるように、累積されたピークの合計を相関値として直接的に使用するか、最大のピークの合計を第二に大きいピークの合計で除算し、結果的に得られた値を検出強度の速度として使用する。
d)k個の累積されたピークの合計値のうちの1つが予め決定された又は可変の閾値を超える場合、電子透かし又はリファレンスパターンが存在するものと想定されるかを判定し、受信された信号xの後続のセクションに移る(リファレンスパターンの乱れはレシーバ/デコーダサイドで既知である)。
【0029】
全ての候補となる擬似ランダムリファレンス系列kについて、ある相関のための累積されたピークの合計summax,kは、以下のように計算される。ここでmは相関ピークのグループのインデックスである。
【0030】
k=0;
k(τ)の全ての振幅値について、以下の条件
abs(Ck(τ))>thr1及びabs(Ck(τ))>abs(Ck(τ-1))及びabs(Ck(τ))>abs(Ck(τ+1))を受ける値のグループを発見する(これらCk(τ)の振幅値は、メインピークとして示される)。
do
k=mk+1
sumk(m)=0
(τm,k−t1)≦y≦(τm,k+t2)により定義されるグループmkでの全ての値yについて、
do
if abs(Ck(y))>thr2及びabs(Ck(y))>abs(Ck(y-1))及びabs(Ck(y))>abs(Ck(y+1))
do
sumk(m)=sumk(m)+peak_sumk(y)
全てのmグループについて、maximum summax,k = sumkの値のうちのmax(1≦n≦m) sumk(n)を発見する。
【0031】
値peak_sumk(y)は、以下に定義される。最大の合計summax,kは、候補となるリファレンスパターンkについて、上述された累積されたピークの合計である。他の候補となるリファレンスパターンkについて更なる最大の合計が存在する場合がある。これら最大の合計のうちの最も大きな合計が予め決定された又は可変の閾値thr0を超える場合、対応する電子透かし又はリファレンスパターン(又は擬似ランダムリファレンス系列)kが受信された信号に存在するものと判定される。閾値thr0は、閾値thr1よりも大きい。
【0032】
それぞれ埋め込まれたリファレンスパターンはたとえば埋め込まれたメッセージの1ビットのみを表し、リファレンスパターンの距離は、レシーバ/デコーダサイドで既知であるため、エンコーダサイドで選択された擬似ランダムリファレンス系列kの(受信された信号xにおける)真の位置τを判定すること、及び埋め込まれたメッセージの次の1ビット又は2以上のビットをデコードするため、おそらく電子透かしが埋め込まれたコンテンツの後続の部分を判定することが必要である。
【0033】
しかし、ピークの合計値をノイズからさらに区別するため、位置yでのピーク合計peak_sumkは、以下のように計算される。
【0034】
peak_sumk(y) = abs(Ck(y))
j=1
while (j<t3 and abs(Ck(y-j))>thr3)
peak_sumk(y) = peak_sumk(y)
+ abs(Ck(y-j)) − thr4
j= j+1
j=1
while (j<t3 AND abs(Ck(y+j))>thr3)
peak_sumk(y) = peak_sumk(y)
+ abs(Ck(y+j)) − thr4
j=j+1
相関結果の振幅対τのドメインにおける図5に示されるように、閾値thr1は、それぞれのグループmについて支配的又は最も大きいピーク51,54をサーチするために使用される。グループm1及びm2が示され、グループm1の支配的なピーク51は、τ1に位置され、グループm2の支配的なピーク54は、τ2に位置される。閾値thr2は、閾値thr2よりも小さく、支配的なピークの付近における(たとえばエコーから生じる場合がある)小さいが、なお重要なピーク52,53,55,56をサーチする為に使用される。閾値thr3及びthr4(図示せず)は、ノイズレベルに関連される。thr4はノイズにより生じたオフセットを表す。ノイズレベルが推定される場合、閾値thr4は、より正確に計算される。閾値thr3は、ピークとノイズとを区別する、すなわちノイズに関してピークを高めるために使用される更なる閾値であり、ここでthr3≧thr4である。ノイズがない場合、thr3=thr4である。
【0035】
有利なことに、y−t3<y<y+t3におけるCk(y)の値、及びCk(y)に隣接するCk(y)の値は、累積されたピークの合計値が「ノイズピーク」から更に区別されるように、ピークの合計を増加するために使用される。
【0036】
振幅の閾値thr0,thr1,thr2,thr3,thr4,及びサンプルレンジt1,t2,t3及びt4は、アプリケーションのエコー及び反響音のパラメータに依存して調整される。対称的なレンジ±t3は、非対称(−t3...+t4)又は(−t4...+t3)とすることができる。さらに、y−t3or4<y<y+t3or4におけるCk(y)の値は、それらの振幅が対応するピークの振幅からの予め決定された振幅の距離よりも小さくない場合にのみ累積される。
【0037】
図3における電子透かしデコーダでは、受信されたエンコードされた信号xは、ステップ又はステージ31で取得される。スペクトル成形又はホワイトニングのような前処理は、ステップ又はステージ32で実行される。結果的に得られる出力信号は、ステップ又はステージ33における擬似ランダムリファレンスパターンと相関付けされる。累積される最大のピークの合計は、上述されたように、ステップ又はステージ34で計算される。その後、擬似ランダムリファレンスパターンrのうちのどれがエンコーダサイドで信号xに埋め込まれているかが判定され、対応するワーテーマークデータシンボルが出力される。
【0038】
図4では、ステップ/ステージ34で上述されたように実行された最大のピーク合計の計算は、更に詳細に示される。第一のステップ41は、ピークサーチの初期化である。後続のループでは、ステップ42でピークがサーチされ、ステップ43で中間のピークの合計が計算される。ループに続いて、全ての中間のピークの合計の最大は、ステップ44で決定され、最大のピークの合計summax,kが出力される。
【0039】
閾値thr0を超える最大の合計のうちの最も大きな合計値に応じて、対応するリファレンスパターンが受信された信号に存在するという最終的な判定を発する前に、埋め込まれたメッセージの幾つかのデコードされたビットは、誤り訂正処理を通過することができる。
【産業上の利用可能性】
【0040】
本発明は、たとえば知覚的にエンコードされている電子透かしが埋め込まれているビデオといった、相関がエコー及び反響音に類似するものにより乱される全ての技術に適用可能である。

【特許請求の範囲】
【請求項1】
受信され、電子透かしがおそらく埋め込まれている信号にリファレンスパターンが存在するか否かを判定する方法であって、
前記リファレンスパターンに一致する少なくとも候補となるリファレンスパターンは、前記受信され、電子透かしがおそらく埋め込まれている信号と相関付けられ、対応する相関結果の振幅のピークがチェックされ、
当該方法は、
前記受信された信号の現在のセクションについて、前記リファレンスパターンのそれぞれ1つとの相関を計算するステップと、
相関結果の振幅値において、メインピークで示される現在の相関結果の振幅値の絶対値が第一の閾値よりも大きく、前記メインピークの絶対値がその左の近隣の相関結果の振幅値の絶対値よりも大きく、その右の近隣の相関結果の振幅値の絶対値よりも大きい値のグループを発見するステップと、
前記メインピークのそれぞれ1つの予め決定された周辺において、更なるピークのそれぞれのピークについて、現在の相関結果の振幅値の絶対値が前記第一の閾値よりも小さい第二の閾値よりも大きく、更なるピークのそれぞれについて、その絶対値がその左の近隣の相関結果の振幅値の絶対値よりも大きく、その右の近隣の相関結果の振幅値の絶対値よりも大きい更なるピークを発見するステップと、
前記値のグループのそれぞれ1つについて、グループ当たりの合計値を形成するため、前記メインピーク及び前記更なるピークの絶対値を結合するステップと、
前記リファレンスパターンのそれぞれ1つについて、前記グループの合計値のうちの最大の値を決定し、これら最大値のうちの最も大きな値が予め決定された又は可変の閾値を超える場合、対応するリファレンスパターンが前記受信された信号に存在すると判定するステップと、
を含むことを特徴とする方法。
【請求項2】
受信され、電子透かしがおそらく埋め込まれている信号にリファレンスパターンが存在するか否かを判定する装置であって、
前記リファレンスパターンに一致する少なくとも1つの候補となるリファレンスパターンは、前記受信され、電子透かしがおそらく埋め込まれている信号と相関付けられ、対応する相関結果の振幅のピークがチェックされ、
当該装置は、
前記受信された信号の現在のセクションについて、前記リファレンスパターンのそれぞれ1つとの相関を計算する手段と、
相関結果の振幅値において、メインピークで示される現在の相関結果の振幅値の絶対値が第一の閾値よりも大きく、前記メインピークの絶対値がその左の近隣の相関結果の振幅値の絶対値よりも大きく、その右の近隣の相関結果の振幅値の絶対値よりも大きい値を発見する手段と、
前記メインピークのそれぞれ1つの予め決定された周辺において、更なるピークのそれぞれのピークについて、現在の相関結果の振幅値の絶対値が前記第一の閾値よりも小さい第二の閾値よりも大きく、更なるピークのそれぞれについて、その絶対値がその左の近隣の相関結果の振幅値の絶対値よりも大きく、その右の近隣の相関結果の振幅値の絶対値よりも大きい更なるピークを発見する手段と、
前記値のグループのそれぞれ1つについて、グループ当たりの合計値を形成するため、前記メインピーク及び前記更なるピークの絶対値を結合する手段と、
前記リファレンスパターンのそれぞれ1つについて、前記グループの合計値のうちの最大の値を決定し、これら最大値のうちの最も大きな値が予め決定された又は可変の閾値を超える場合、対応するリファレンスパターンは受信された信号に存在すると判定する手段と、
を有することを特徴とする装置。
【請求項3】
相関結果の振幅値の代わりに、正規化された相関結果の振幅値がピーク値を決定するために使用される、
請求項1記載の方法、又は請求項2記載の装置。
【請求項4】
前記結合において、左のメインピーク及び更なるピーク、並びに右のメインピーク及び更なるピークへの予め決定された近傍のレンジに位置される相関結果の振幅の絶対値であって、第三の閾値を超える相関結果の振幅の絶対値が含まれ、
ノイズを表す第四の閾値の減算に続いて相関結果の振幅の対応する絶対値が結合され、
前記第三の閾値は、前記第四の閾値よりも大きい、
請求項1又は3記載の方法、或いは請求項2又は3記載の装置。
【請求項5】
前記予め決定された周辺は、非対称であり、t1サンプルだけ左に延び、t2サンプルだけ右に延び、
前記予め決定された近隣のレンジは、t3サンプルだけ左に延び、t3サンプルだけ右に延び、
前記予め決定された近隣のレンジは、非対称であり、t3又はt4サンプルだけ左に延び、t3又はt4サンプルだけ右に延びる、
請求項1,3又は4記載の方法、或いは請求項2乃至4の何れか記載の装置。
【請求項6】
前記予め決定された又は可変の閾値、前記第一の閾値、前記第二の閾値、前記第三の閾値、前記第四の閾値、及び前記サンプル値t1〜t4は予め決定されているか、前記受信された信号におけるエコー及び反響音パラメータに依存して処理の間に調整される、
請求項5記載の方法又は装置。
【請求項7】
前記相関値が計算される前に、前記受信された信号はスペクトル成形及び/又はホワイトニングされる、
請求項1,3乃至6の何れか記載の方法、請求項2乃至6の何れか記載の装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−175737(P2009−175737A)
【公開日】平成21年8月6日(2009.8.6)
【国際特許分類】
【出願番号】特願2009−9775(P2009−9775)
【出願日】平成21年1月20日(2009.1.20)
【出願人】(501263810)トムソン ライセンシング (2,848)
【氏名又は名称原語表記】Thomson Licensing 
【住所又は居所原語表記】46 Quai A. Le Gallo, F−92100 Boulogne−Billancourt, France