説明

デジタル信号の保護を容易にする方法

【課題】透かし手法において誤った警報の発生確率とミスの発生確率を最小限に抑える。
【解決手段】非局所的QIM透かし入れアーキテクチャ100は、元のコンテンツを生成し、ネットワーク124上でコンテンツをクライアント126に配布するコンテンツプロデューサ/プロバイダ122を持つ。コンテンツプロデューサ122は、透かしエンコーディングシステム132を備え、コンテンツをオリジナルであると一意に識別する透かしのサインをデジタル信号に入れる。透かしエンコーディングシステム132は、透かしをコンテンツストレージ130からのデジタル信号に適用する。通常、透かしによりコンテンツプロデューサ122を識別し、信号に埋め込まれ、きれいに除去することはできない署名を実現する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ブラインド透かしのための堅牢な非局所的特性の導出と量子化の方法に関する。より詳しくは、一般に、デジタルグッズ(digital good)にブラインド透かし(Blind Watermarking)を入れるために、堅牢な非局所的特性を導出し、そのような特性を量子化するための技術に関する。
【背景技術】
【0002】
「デジタルグッズ」とは、電子的に格納または送信されるコンテンツを示す総称である。デジタルグッズの例としては、画像、オーディオクリップ、ビデオ、デジタルフィルム、マルチメディア、ソフトウェア、およびデータがある。デジタルグッズは、「デジタル信号」、「コンテンツ信号」、「デジタルビットストリーム」、「メディア信号」、「デジタルオブジェクト」、「オブジェクト」などとも呼ばれる。
【0003】
デジタルグッズは、多くの場合、イントラネットやインターネットなど、プライベートネットワークおよびパブリックネットワークを介して消費者に配布される。さらに、デジタルグッズは、コンパクトディスク(CD−ROM)、デジタル多用途ディスク(DVD)、ソフト磁気ディスケット、またはハード磁気ディスク(たとえば、あらかじめ装着されているハードドライブ)などの固定されたコンピュータ読み取り可能媒体を介して消費者に配布される。
【0004】
残念なことに、デジタルグッズの純粋なデジタルコンテンツは比較的容易に盗用され、コンテンツ作成者、発行者、開発者、配布者などを含むコンテンツ所有者は出費と損害を被る。コンテンツを制作し、配布するコンテンツベースの産業(たとえば、娯楽、音楽、映画など)はデジタル盗用による減収に悩まされている。
【0005】
現代の「デジタル海賊」は、実際に、コンテンツ所有者から正当な報酬を奪っている。技術によってコンテンツ所有者の権利を保護するメカニズムを実現しない限り、創造的なコミュニティおよび文化は衰退する。
【0006】
透かし
透かしは、デジタルグッズのコンテンツ所有者の権利(つまりデジタルグッズ)を保護する最も有望な手法の1つである。一般に、透かしとは、知覚的特性が保存されるようにデジタルグッズを改変するプロセスのことである。より具体的には、「透かし」とは、コンテンツ所有者および/または保護された権利を識別するために使用できるデジタルグッズに挿入するビットのパターンである。
【0007】
透かしは、人間や統計分析ツールからまったく見えない、あるいはより正確には、感知できないように設計されている。透かしの入っている信号は、元の信号と知覚的に同一であることが理想である。
【0008】
透かし埋め込み器(watermark embedder)(つまり、エンコーダ)が、透かしをデジタルグッズに埋め込む。通常、秘密鍵を使用して透かしを埋め込む。透かし検出器(つまり、デコーダ)が、透かしの入っているデジタルグッズから透かしを抽出する。
【0009】
ブラインド透かし
透かしを検出するために、ある種の透かし手法では、元のマークが付いてないデジタルグッズまたはマークが付いているデジタルグッズの素の標本へのアクセスが必要なものもある。もちろん、透かし検出器が公開されていると、これらの手法は望ましいものではない。公開されていると、悪意ある攻撃者が元のマークが付いてないデジタルグッズまたはマークが付いているデジタルグッズの素の標本にアクセスできる可能性がある。その結果、これらの種類の手法は、公開されている検出器には使用されない。
【0010】
別法として、透かし手法は「ブラインド」である。つまり、元のマークが付いてないデジタルグッズまたはマークが付いているデジタルグッズの素の標本へのアクセスが必要ないということである。もちろん、透かし検出器が公開されていると、これらの「ブラインド」透かし手法は望ましいものではない。
【0011】
堅牢性
検出前に、透かしの入っている信号はユーザや配布環境によりさまざまな変更が加えられる可能性がある。こうした変更には、ノイズや歪みなどの意図しない修正が含まれることがある。さらに、マークが付けられている信号は、多くの場合、透かしの検出を無効にすることを特に目指す悪意ある攻撃者の対象となる。
【0012】
透かし手法では、知覚的に同じ品質である信号が得られる限り修正および攻撃に耐える検出可能な透かしを埋め込むのが理想的である。修正および攻撃に耐える透かし手法は「堅牢」であると呼ぶことができる。このような手法の側面が「堅牢」と呼ばれるのは、そのような抵抗を高める場合である。
【0013】
一般的に言って、透かしシステムは、意図しないノイズが信号に入り込むのに対処できる十分な堅牢性を備えているべきである(このようなノイズは、A/DおよびD/A変換、圧縮/展開、送信時のデータ破損などで入り込むことがある)。
【0014】
さらに、透かしシステムは、透かしの故意の悪意ある検出、改変、および/または削除を回避できる十分な堅牢性と秘密性を備えているべきである。このような攻撃では、特定の透かしが知られていたり検出されたりしない(が、存在すると想定した)「ショットガン」方式を使用したり、特定の透かしを攻撃する「シャープシューター」方式を使用することがある。
【0015】
このような堅牢性問題は、相当注目を集めていた。一般に、既存の堅牢な透かし手法は、スペクトル拡散と量子化インデックス変調(quantization index modulation)(QIM)という2つのカテゴリに分けられる。
【0016】
スペクトル拡散タイプの手法では、透かしによりホストデータへの修正にインデックスが付けられる。ホストデータは、元のマークの付けられていないデジタル信号(つまり、ホスト信号)のデータである。代表的なスペクトル拡散透かし技術では、信号を少し変化させる(たとえば、+Δまたは+Δからなる透かしの疑似ランダムシーケンスを追加する)ことにより透かしの各ビット(たとえば、0と1)を信号に埋め込む。
【0017】
量子化インデックス変調(QIM)では、修正したホストデータのインデックス付けにより透かしを埋め込む。修正されたホストデータは、マークの付けられているデジタル信号(つまり、マークが付けられたホスト信号)のデータである。以下ではこれについて詳述する。
【0018】
当業者であれば、従来の技術および、透かし、透かし埋め込み、および透かし検出と関連する技術を熟知している。さらに、当業者であれば、マークが付けられた信号に変更が加えられた後、適切な透かし検出と関連して生じる典型的な問題(たとえば、意図しないノイズおよび悪意のある攻撃)を熟知している。
【0019】
透かし技術の要件
透かし技術は、コンテンツ発行者の著作権の保護を促進する非常に望ましい目標(つまり、要件)をいくつか持つ。以下に、そのような目標のいくつかを列挙する。
【0020】
知覚的不可視性。埋め込まれた情報は、その結果の透かしマーク入り信号の信号品質に知覚できる変化を引き起こすべきではない。知覚的不可視性のテスト(test of perceptual invisibility)を、「ゴールデン・アイ・アンド・イヤー(golden eyes and ears)」テストと呼ぶことが多い。
【0021】
統計的不可視性。埋め込まれた情報は、透かしを検出または除去しようとする網羅的、発見的、または確率論的ないかなる試みについても定量的に感知されうるべきではない。このような攻撃を加えて成功させる試みが、公開されているコンピュータシステムの計算能力を十分超えた複雑さを持つものでなければならない。ここでは、統計的不可視性は、知覚的不可視性に明示的に含まれる。
【0022】
改竄防止。透かしを除去しようとする試みがあると、聴覚しきい値を十分超えるデジタルグッズの値を損なうようでなければならない。
【0023】
コスト。システムは、プログラム可能なプラットフォームおよびアプリケーション固有のプラットフォームの両方に対しライセンスも実施も安価でなければならない。
【0024】
オリジナルの非開示。透かしおよび検出プロトコルは、現場および法廷の両方でデジタルグッズのコンテンツ著作権を提供するプロセスが元の記録の使用を伴わないようなものでなければならない。
【0025】
強制および柔軟性。透かし手法は、強力で否定できない著作権証明を提供しなければならない。同様に、ある範囲の保護レベルを使用可能にすべきであり、これは、可変のデジタルグッズの表示および圧縮標準に対応する。
【0026】
よくある攻撃への反発力。強力なデジタルグッズ編集ツールが公開されていると、透かしおよび検出プロセスはそのようなコンソールから生じる攻撃に対して障害許容力があるという条件が加わる。
【0027】
誤った警報およびミス
透かし手法を開発するときに、誤った警報を発生する可能性が高まるようにしたくない。つまり、透かしが検出されたが何も存在していないという場合である。これは、発生しなかった犯罪の証拠を見つけるようなものである。誰かが不正動作を誤って告訴される可能性がある。
【0028】
誤った警報の発生確率が高まると、透かし手法の信頼性が減じる。たとえば、人々は車両盗難防止警報器の警報を無視することが多いが、それは実際の車両盗難ではなく間違った警報であることが少なからずあることを知っているからである。
【0029】
同様に、ミスの確率を高めたくない。これは、信号の透かしが適切に検出されない場合である。これは、犯罪現場で重要な証拠を見逃すようなものである。このため、不正動作がまったく適切に調査されないことがある。ミスの発生確率が高まると、透かし手法の信頼性が減じる。
【0030】
誤った警報およびミスの発生確率が0であるのが理想である。実際には、それらの間で妥協することが多い。通常、一方の確率が減少すると他方の確率が増大する。たとえば、誤った警報の発生確率が減じると、ミスの確率が高まる。
【0031】
したがって、それらの間の適切なバランスを見つけながら両方を最小限に抑える透かし手法が必要とされる。
【0032】
量子化インデックス変調(QIM)
そのために、透かし埋め込みの際に信号(たとえば、ホストデータ)にインデックスを付けて透かしを埋め込む方法を提案するものもある。この手法は、量子化インデックス変調(QIM)と呼ばれており、これについてすでに簡単に説明している。
【0033】
一般に、量子化とは、大きさまたは量の可能な値を値の離散集合に制限することを意味する。量子化は、非離散(たとえば、アナログまたは連続)値から離散値への変換として考えられる。それとは別に、これは、スケールが異なる離散値間の変換とすることができる。量子化は、丸めまたは切り捨てにより数学的に遂行できる。代表的なQIMは、最初に埋め込まれている情報でインデックスまたはインデックス列を変調し、次に、ホスト信号を関連する量子化器または量子化器の列で量子化する。量子化器は、不連続な近似的恒等機能のクラスである。
【0034】
このようなQIM手法の主要な提案者は、Brian ChenおよびGregory W.Wornell(つまり、Chen−Wornell)である。つまり、「埋め込まれた情報でディザ信号を変調し、関連するディザ量子化器でホスト信号を量子化するディザ変調」(IEEE Trans.Inform.TheoryのChen−Wornellの記事の要約から)が提案されている。
【0035】
Chen−Wornellの提案およびQIMに関する詳細については、以下の文書を参照されたい。
【0036】
・B.ChenおよびG.W.Wornell著「ディザ変調を使用するデジタル透かし技術と情報埋め込み」Proc.IEEE Workshop on Multimedia Signal Processing、Redondo Beach、CA、pp.273−278、1998年12月
・B.ChenおよびG.W.Wornell著「ディザ変調:デジタル透かし技術と情報埋め込みの新しい方式」Proc.of SPIE:Security and Watermarking of Multimedia Contents、vol.3657、pp.342−353、1999年
・B.ChenおよびG.W.Wornell著「量子化インデックス変調:デジタル透かし技術と情報埋め込みの適切さが実証可能な方法のあるクラス」IEEE Trans.Inform.Theory、1999年および2000年
【0037】
従来のQIMの制限
しかし、従来のQIMの重要な問題として、攻撃と歪みを受けやすいという点がある。従来のQIMは、信号の特定の表現(たとえば、時間領域や周波数領域で)に関して局所的特性に依存する。量子化するために、従来のQIMは信号の表現の「個別係数」の値にのみ依存する。このような「個別係数」の例として、画像の個別ピクセルの色がある。
【0038】
量子化する際に、「個別係数」の局所的特性のみが考慮される。これらの局所的特性は、個別ビット(たとえば、ピクセル)の値(たとえば、色、振幅)および相対的位置決め(たとえば、時間領域および/または周波数領域の位置決め)を含むことができる。
【0039】
修正−攻撃あるいはある種の意図しないノイズから生じる−は信号の局所的特性をきわめて劇的に変化させる場合がある。たとえば。これらの修正は、ピクセルの色やサウンドのビットの振幅に対し劇的な影響を及ぼすことがある。ただし、このような修正は、信号の非局所的特性にはほとんど影響を与えない。
【発明の開示】
【発明が解決しようとする課題】
【0040】
そこで、誤った警報の発生確率を最小限に抑えることと、ミスの発生確率を最小限に抑えることとの適切なバランスをとるために、QIM透かし手法のような、新しい、堅牢な透かし手法が必要である。しかし、信号内の局所的特性に対して攻撃および歪みの影響をあまり受けない手法が必要である。
【0041】
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、誤った警報の発生確率とミスの発生確率を最小限に抑えることが可能な、ブラインド透かしのための堅牢な非局所的特性の導出と量子化の方法を提供することにある。
【課題を解決するための手段】
【0042】
本明細書では、デジタルグッズにブラインド透かしを入れるために、堅牢な非局所的特性を導出し、そのような特性を量子化するための技術について説明する。
【0043】
この技術では、誤った警報(つまり、存在しない透かしを検出する)の発生確率を最小限に抑えることと、ミス(つまり、既存の透かしを検出できない)の発生確率を最小限に抑えることとの適切なバランスを取る。可能な手法の1つに、量子化インデックス変調(QIM)透かしがある。しかし、従来のQIMは、デジタルグッズの局所的特性に対する攻撃および歪みの影響を受けやすい。
【0044】
本明細書で説明している技術は、デジタルグッズの非局所的特性に基づいてQIMを実行する。非局所的特性は、デジタルグッズの個別部分(たとえば、ピクセル)のグループの統計量(たとえば、平均値、中央値)を含むことができる。
【0045】
この概要自体に、特許請求の範囲を制限する意図はない。さらに、発明の名称に、特許請求の範囲を制限する意図はない。本発明をよく理解できるように、添付図面とともに、以下の詳細な説明および特許請求の範囲の請求項を参照されたい。本発明の範囲は、特許請求の範囲の請求項の中で指摘されている。
【発明の効果】
【0046】
本発明によれば、透かし手法において誤った警報の発生確率とミスの発生確率を最小限に抑えることが可能となる。
【発明を実施するための最良の形態】
【0047】
図面全体を通して類似の要素および特徴を参照するのに同じ番号を使用している。
【0048】
以下の説明では、説明のため本発明の実施形態を完全に理解できるように特定の番号、資料、および構成を定めている。ただし、当業者であれば、こうした具体的内容がなくても本発明を実践できることは明白であろう。他の場合には、本発明の実施形態の説明を明確にし、本発明の説明をしやすくするために、よく知られている特徴については省くか、または簡素化している。さらに、理解を容易にするため、いくつかの方法ステップを別個のステップとして示しているが、これらの別個に示したステップは、実施に際して必ず順序に依存するものとして解釈すべきではない。
【0049】
以下の説明では、特許請求の範囲で説明している要素を組み込んでいる、ブラインド透かし技術の堅牢な非局所的特性の導出と量子化の、1つまたは複数の実施形態を規定している。これらの実施については、法令に定められた書面による説明、実施可能性、およびベストモード要件を満たすように具体的に説明する。しかし、この説明自体に、特許請求の範囲を制限する意図はない。
【0050】
発明者は、これらの実施形態が例であることを意図している。発明者は、これらの実施形態が本発明の特許請求の範囲を制限することを意図していない。むしろ、発明者は、本発明の特許請求の範囲がさらに、他の現在の技術または将来の技術とともに、他の方法で具現化され実施される可能性があると考えている。
【0051】
ブラインド透かしの堅牢な非局所的特性の導出と量子化の実施形態を「非局所的QIM透かしの例」と呼ぶ。
【0052】
参照による取り込み
以下の同時係属出願は参照により本明細書に取り込まれる(すべてMicrosoft Corporationに譲渡されている)。
・1999年9月7日出願の「画像に透かしを入れる手法とその結果得られる透かしの入っている画像」という表題の米国特許出願第09/390271号 ・1999年9月7日出願の「マークされた画像内の透かしを検出する手法」という表題の米国特許出願第09/390272号
・2000年7月12日出願の「改良された秘密オーディオ透かし」という表題の米国特許出願第09/614660号
・1999年5月22日出願の「二重透かしによるオーディオ透かし」という表題の米国特許出願第09/316899号
【0053】
序論
ここで説明する、本実施形態の1つまたは複数の実施の例は、図1の非局所的QIM透かしアーキテクチャ100および/または図6に示されているようなコンピューティング環境により(全部または一部)実施できる。
【0054】
総体的に、非局所的QIM透かし入れ装置(non−local QIM watermarker)例は、デジタルグッズの堅牢な非局所的特性を導出する。これはデジタルグッズのブラインド透かしのそのような特性を量子化する。
【0055】
非局所的QIM透かし入れ装置は、誤った警報(つまり、存在しない透かしを検出する)の発生確率と、ミス(つまり、既存の透かしを検出できない)の発生確率を最小限に抑える。これは、量子化インデックス変調(QIM)透かしを使って実施する。しかし、従来のQIM手法は、デジタルグッズの局所的特性に対する攻撃および歪みの影響を受けやすいため、この手法は採用しない。
【0056】
局所的特性
従来のQIMは、信号(つまり、デジタルグッズ)内の局所的特性に依存する。量子化するために、従来のQIMはホスト信号の「個別要素」の値にのみ依存する。量子化する際に、「個別要素」の局所的特性のみが考慮される。これらの局所的特性は、個別ビット(たとえば、ピクセル)の値(たとえば、色、振幅)および相対的位置決め(たとえば、時間領域および/または周波数領域の位置決め)を含むことができる。
【0057】
修正−攻撃あるいは意図しないノイズから生じる−は信号の局所的特性をきわめて劇的に変化させる場合がある。たとえば、これらの修正は、ピクセルの色やサウンドのビットの振幅に対し劇的な影響を及ぼすことがある。ただし、このような修正は、信号の非局所的特性にはほとんど影響を与えない。
【0058】
非局所的特性
非局所的特性は、個別要素のグループまたは集合の一般的特性を表す。このようなグループをセグメントと呼ぶ。非局所的特性は、個別要素の個別局所的特性を表さず、むしろ、グループ(たとえば、セグメント)を全体として表す。
【0059】
非局所的特性は、グループの数学的または統計的な表現により決定できる。たとえば、これはグループ内のすべてのピクセルの色値の平均値とすることができる。したがって、このような非局所的特性は「統計的特性」とも呼ばれる。局所的特性は、与えられたカテゴリについて値が固定されているため統計的特性を持たない。したがって、単一の値から統計量は導出されない。
【0060】
非局所的特性は局所的特性ではない。大域的特性でもない。むしろ、その中間である。したがって、これは「半大域的」特性と呼ぶこともできる。
【0061】
概要
元のマークなしのデジタルグッズが与えられたとすると、非局所的QIM透かし入れ装置例は、性質上局所的でない堅牢な特性を導出する。たとえば、非局所的QIM透かし入れ装置例は、ランダム化された不可逆変換を使用し、知覚的歪みを生ずることなく修正できる堅牢な非局所的特性を生み出すことができる。これらの特性は、通常、統計および/または数学の理論により表現される。
【0062】
透かしを埋め込むために、非局所的QIM透かし入れ装置例は、1つまたは複数の次元格子(dimensional lattices)またはベクトル空間内でこれらの非局所的特性の量子化を実行する。非局所的QIM透かし入れ装置から生じるマークの付けられているデジタルグッズは、意図しない修正や意図した修正(たとえば、悪意ある攻撃)に対し堅牢である。悪意ある攻撃の例としては、非同期化(de−synching)、ランダムベンディング(random bending)、およびその他多くのベンチマーク攻撃(たとえば、Stirmark攻撃(Stirmark attacks))などがある。
【0063】
非局所的QIM透かし入れアーキテクチャ
図1は、元のコンテンツを生成し、ネットワーク124上でコンテンツをクライアント126に配布するコンテンツプロデューサ/プロバイダ122を持つデジタルグッズ制作および配布アーキテクチャ100(つまり、非局所的QIM透かし入れアーキテクチャ100)を示している。コンテンツプロデューサ/プロバイダ(content producer/provider)122は、元のコンテンツを含んでいるデジタルグッズを格納するコンテンツストレージ(content storage)130を備える。コンテンツプロデューサ122は、透かし埋め込みシステム132を備え、コンテンツをオリジナルであると一意に識別する透かしのサインをデジタル信号に入れる。透かし埋め込みシステム132は、スタンドアローンのプロセスとして実施することも、また他のアプリケーションやオペレーティングシステムに組み込むこともできる。
【0064】
透かし埋め込みシステム132は、透かしをコンテンツストレージ130からのデジタル信号に適用する。通常、透かしによりコンテンツプロデューサ122を識別し、信号に埋め込まれ、きれいさっぱり除去することはできない署名を実現する。
【0065】
コンテンツプロデューサ/プロバイダ122は、透かし入りコンテンツをネットワーク124(たとえば、インターネット)上で配布する配布サーバ134を備える。透かしが埋め込まれている信号は、受信者に対して、コンテンツプロデューサ/プロバイダ122の著作権に従って信号が配布されているということを表す。サーバ134はさらに、従来の圧縮および暗号化手法によりコンテンツを圧縮および/または暗号化してからネットワーク124でコンテンツを配布することができる。
【0066】
通常、クライアント126は、プロセッサ140、メモリ142、および1つまたは複数のコンテンツ出力デバイス144(たとえば、ディスプレイ、サウンドカード、スピーカなど)を備える。プロセッサ140は、信号を圧縮するツール、データを復号化するツール、コンテンツをフィルタ処理するツール、および/または信号コントロール(トーン、音量など)を適用するツールなどさまざまなツールを実行して、マーク付き信号を処理する。メモリ142は、オペレーティングシステム150(Microsoft Windows(登録商標) 2000オペレーティングシステムなど)を格納し、プロセッサ上で実行される。クライアント126は、コンピュータ、携帯型娯楽デバイス、セットトップボックス、テレビ、電気器具などのさまざまな方法で実現することができる。
【0067】
オペレーティングシステム150は、デジタル信号内の透かしを検出するクライアント側の透かし検出システム152と、コンテンツ出力デバイス144を通じてコンテンツを使用しやすくするためのコンテンツローダ(content loader)154(たとえば、マルチメディアプレーヤ、オーディオプレーヤ)とを実装する。透かしが存在していれば、クライアントはその著作権よびその他の関連する情報を識別することができる。
【0068】
オペレーティングシステム150および/またはプロセッサ140は、コンテンツプロデューサ/プロバイダ(または著作権所有者)が課したいくつかの規則を強制するように構成できる。たとえば、有効な透かしが入っていない偽造またはコピーされたコンテンツを拒絶するようにオペレーティングシステムおよび/またはプロセッサを構成することができる。他に、システム側で、検証されていないコンテンツの忠実度レベルを下げる例も可能である。
【0069】
非局所的QIM透かし埋め込みシステム例
図2は、非局所的QIM透かし埋め込みシステム例200を示しており、これは、非局所的QIM透かし入れアーキテクチャ100の一部の実施の例である。このシステムは、図1の透かしエンコーディングシステム132として採用できる。
【0070】
透かし埋め込みシステム200は、振幅正規化装置(amplitude normalizer)210、変換器220、パーティショナ(partitioner)230、セグメント統計量計算機(segment−statistics calculator)240、セグメント量子化器250、デルタシーケンスファインダ(delta−sequence finder)260、および信号マーカ(signal marker)279を備える。
【0071】
振幅正規化装置210は、デジタル信号205(オーディオクリップなど)を取得する。これは、ストレージデバイスやネットワーク通信リンクなどのほとんどどのようなソースからでも信号を取得できる。その名が示すように、信号の振幅を正規化する。
【0072】
変換器220は、正規化装置210から振幅正規化信号を受信する。変換器220は、一組の変換を使って信号を標準形で生成する。特に、離散ウェーブレット変換(DWT;discrete wavelet transform)を使用できるが(特に、入力が画像の場合)、それは、時間と周波数の局所化により意味のある信号特性をコンパクトに捕捉できるからである。他の変換も使用できる。たとえば、シフト不変(shift−invariant)および形状保存(shape−preserving)の「複素ウェーブレット(complex wavelets)」およびオーバーコンプリートウェーブレット(overcomplete wavelet)表現またはウェーブレットパケットは有望である(特に画像の場合)。
【0073】
変換器220は、さらに、信号の初期変換のDCサブバンドを見つける。変換された信号のこのようなDCサブバンドは、パーティショナ230に渡される。
【0074】
パーティショナ230は、変換された信号を複数の疑似ランダムにサイズ設定され、疑似ランダムに配置された隣接する非連続セグメント(つまり、パーティション)に分割する。秘密鍵Kは、ここでは疑似乱数生成のシードとなっている。この同じKを使用して、非局所的QIM透かし検出システム例400によるセグメントの再構築を行える。
【0075】
たとえば、信号が画像であれば、疑似ランダムに設定されたサイズおよび配置の2次元ポリゴン(たとえば、矩形)にパーティション分割できる。他の例として、信号がオーディオクリップであれば、オーディオクリップの2次元表現(周波数と時間を使用する)を疑似ランダムに設定されたサイズおよび配置の2次元ポリゴン(たとえば、三角形)にパーティション分割できる。
【0076】
この実施では、セグメントはオーバーラップしない。これらは隣接し、非連続である。他の実施では、セグメントはオーバーラップする場合がある。
【0077】
各セグメントについて、セグメント統計量計算機240が、パーティショナ230で生成された複数のセグメントの統計量を計算する。各セグメントの統計量が計算される。これらの統計量は、たとえば、セグメントの有限次モーメントとすることもできる。このようなものの例としては、平均値、中央値、および標準偏差がある。
【0078】
一般に、各セグメントの統計量計算は他のセグメントの計算と無関係である。しかし、他の代替手段では、複数のセグメントからのデータに依存する計算が必要になることがある。
【0079】
そのような計算に適した統計量は、セグメントの個々のビットの値の平均値(たとえば、算術平均)である。他の適している統計量とその堅牢さについては、Venkatesan、Koon、Jakubowski、およびMoulin著「Robust image hashing」(Proc.IEEE ICIP 2000、Vancouver、Canada、2000年9月)で説明されている。この文書では、情報埋め込みについては考慮されていないが、類似の統計量について説明されていた。
【0080】
各セグメントについて、セグメント量子化器250は、多重レベル(たとえば、2、3、4)量子化(つまり、高次元、ベクトル次元、または格子次元量子化(lattice−dimensional quantization))をセグメント統計量計算機240の出力に適用し、量子化したデータを取得する。もちろん、他のレベルの量子化も使用できる。量子化器250は適応型でも非適応型でもよい。
【0081】
この量子化は、ランダムにも実行できる。これは、ランダム化した量子化(またはランダム化した丸め)と呼ぶこともできる。つまり、量子化器は切り上げるか切り捨てるかをランダムに決定できるということである。疑似ランダムに実行することもできる(秘密鍵を使用して)。これにより、堅牢さがさらに加わり、透かしを隠しやすくなる。
【0082】
デルタシーケンスファインダ260は、元の変換信号Xと量子化された統計量のセグメントの組み合わせとの差(つまりデルタ)を推定する疑似ランダムシーケンスZを見つける。疑似ランダムシーケンスZは、デルタシーケンスと呼ぶこともある。たとえば、統計量が平均であれば、
【0083】
【数1】

【0084】
であり、
【0085】
【数2】

【0086】
はマーク付き信号、
【0087】
【数3】

【0088】
はセグメントの平均である。
【0089】
デルタシーケンスZを見つけるときに、知覚的歪みを最小化するのが望ましく、したがって、このシーケンスを作成するためにある種の知覚的歪み距離関数を採用することができる。そこで、Zを作成する際に、基準に、X+Z上の視覚的歪みを最小にする(
【0090】
【数4】

【0091】
と比較して)ものと、X+Zの統計量とXの量子化統計量との距離を最小にするものとの組み合わせを含めることができる。
【0092】
信号マーカ270は、信号にデルタシーケンスZのマークを付け、
【0093】
【数5】

【0094】
になるようにする。信号マーカは、QIM手法を使用して信号にマークを付けることができる。このマーク付けされた信号は、消費者とクライアントに公開配布できる。
【0095】
図2の非局所的QIM透かし埋め込みシステム例200の前述のコンポーネントの機能について以下で詳述する。
【0096】
非局所的QIM透かし埋め込み例の方法論的実施
図3は、非局所的QIM透かし埋め込みシステム例200(またはその一部)の方法論的実施を示している。具体的には、この図は非局所的QIM透かし入れ装置例の透かし埋め込みの方法論的実施を示している。この方法論的実施は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの組み合わせで実行することができる。
【0097】
図3の310で、非局所的QIM透かし入れ装置例により、入力の振幅が正規化される。入力は、元のマークの付けられていない信号(つまり、デジタルグッズ)である。312で、振幅正規化された信号の変換を求めて、最低周波数バンド(たとえば、DCサブバンド)を取得する。このブロックの結果が変換された信号である。この変換は、離散ウェーブレット変換(DWT)であるが、ほとんどの他の類似の変換は他の実施でも実行できる。
【0098】
314で、非局所的QIM透かし入れ装置例は、変換された信号を複数の疑似ランダムにサイズ設定され、疑似ランダムに配置された隣接する非連続セグメントに分割する。秘密鍵Kは、ここでは疑似乱数生成のシードとなっている。この同じKを使用して、透かし検出プロセスでセグメントの再構築を行える。
【0099】
たとえば、信号が画像であれば、疑似ランダムに設定されたサイズおよび配置の2次元ポリゴン(たとえば、矩形)に分割できる。他の例として、信号がオーディオクリップであれば、オーディオクリップの2次元表現(周波数と時間を使用する)を疑似ランダムに設定されたサイズおよび配置の2次元ポリゴン(たとえば、台形)にパーティション分割できる。
【0100】
この実施では、セグメントはオーバーラップしない。これらは隣接し、非連続である。他の実施では、セグメントはオーバーラップする場合がある。
【0101】
信号の各セグメントについて、非局所的QIM透かし入れ装置例では、ブロック320〜330を繰り返す。したがって、各セグメントが同じように処理される。
【0102】
図3の322で、非局所的QIM透かし入れ装置例は、現在のセグメントに埋め込む透かし(またはその一部)を持つ。これは、セグメントの統計量の量子化した値を見つける(たとえば、セグメント内の平均やできる限り近い平均)。見つかったら、スカラー一様量子化器(scalar uniform quantizer)および再構成点をKをシードとしてランダムに摂動できる。
【0103】
324で、非局所的QIM透かし入れ装置例は、セグメント化した信号と組み合わせたこのシーケンスの統計量計算(たとえば、平均)により透かしの入っている信号セグメントの計算が行われる、疑似ランダムシーケンスZを見つける。これは、さらに、信号セグメントの量子化した統計量にも等しい。
【0104】
330で、このプロセスは未処理の各セグメントについて320へループして戻る。すべてのセグメントが処理されたら、ループは340に進む。
【0105】
図3の340で、非局所的QIM透かし入れ装置例は、疑似ランダムシーケンスと信号セグメントを組み合わせて、透かしの入っている信号セグメントを取得する。さらに、透かしの入っている信号セグメントを組み合わせて完全な透かし入り信号を形成する。つまり、
【0106】
【数6】

【0107】
である。350で、プロセスは終了する。
【0108】
非局所的QIM透かし検出システム例
図4は、非局所的QIM透かし検出システム例400を示しており、これは、非局所的QIM透かし入れアーキテクチャ100の一部の実施の例である。このシステムは、図1の透かし検出システム152として採用できる。
【0109】
透かし検出システム400は、振幅正規化装置410、変換器420、パーティショナ430、セグメント統計量計算機440、セグメントMAPデコーダ450、透かし存在判定器460、プレゼンター(presenter)470、および表示装置480を備える。
【0110】
図4の透かし検出システム400の振幅正規化装置410、変換器420、パーティショナ430、およびセグメント統計量計算機440は、図2の透かし埋め込みシステム200の類似のラベルが付けられているコンポーネントと似た機能を持つ。例外は、これらのコンポーネントの対象物が「対象の信号(subject signal)」であって、元の信号ではないということである。「対象の信号」信号は不明である。透かしが入っている場合も入っていない場合もある。修正されている可能性もある。
【0111】
各セグメントについて、セグメントMAPデコーダ450は、MAPデコード方式を使用して量子化されている値を判定する。一般に、MAP手法では、「ポイント」からの距離に関してすべての対象(この場合、量子化された値)を見つける(そして、場合によっては距離でランク付ける)必要がある。この例では、「ポイント」は、与えられたセグメントについて計算した統計量である。直近近傍デコードは、MAPデコードの特定の、実施の例の1つである。当業者であれば、MAPと直近近傍手法を理解し評価するであろう。
【0112】
さらに、セグメントMAPデコーダ450は、量子化された値と与えられたセグメントについて計算した統計量との距離に基づいて信頼係数を確定する。これらが共存している場合、係数は信頼度が高いことを示す。離れている場合、係数は信頼度が低いことを示す可能性がある。さらに、デコーダ450は、総信頼係数を取得するためにセグメントの信頼係数を組み合わせる。その組み合わせは、たいていの統計的な組み合わせでよい(たとえば、加算、平均、中央値、標準偏差など)。
【0113】
透かし存在判定器460は透かしが存在しているかどうかを判定する。透かし判定装置は、歪み距離関数
【0114】
【数7】

【0115】
としきい値Tを使って、透かしが存在しているかどうかを決定できる。正規化したハミング距離を使用できる。
【0116】
プレゼンター470は、「透かしが存在する」、「透かしが存在しない」、および「不明」という3つの指示のうちの1つを提示する。信頼係数が低い場合、これは「不明」であることを示す。さらに、信頼指示値を提示することもできる。
【0117】
この情報は、ディスプレイ480に示される。もちろん、このディスプレイは任意の出力デバイスでよい。またストレージデバイスでもよい。
【0118】
図4の非局所的QIM透かし検出システム例400の前述のコンポーネントの機能について以下で詳述する。
【0119】
非局所的QIM透かし検出例の方法論的実施
図5は、非局所的QIM透かし検出システム例400(またはその一部)の方法論的実施を示している。具体的には、この図は非局所的QIM透かし入れ装置例の透かし検出の方法論的実施を示している。この方法論的実施は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの組み合わせで実行することができる。
【0120】
図5の510で、非局所的QIM透かし入れ装置例により、入力の振幅が正規化される。入力は、デジタルグッズの不明な標本(つまり信号)である。この信号に透かしが入っているかどうかが不明である。
【0121】
512で、振幅正規化された信号の変換を見つけて、有意周波数バンドを取得する。これは低あるいは最低サブバンド(たとえば、DCサブバンド)でもよい。一般に、選択したサブバンドは、さらに堅牢な透かしを入れ、透かしの検出をしやすくする方法で信号を表すものでよい。低い周波数サブバンドは、信号摂動後も比較的不変なままである傾向があるため適当である。
【0122】
このブロックの結果が変換された信号である。画像に透かしを入れる場合、適当な変換の例として離散ウェーブレット変換(DWT)がある。オーディオクリップに透かしを入れる場合、適当な変換の例としてMCLT(Modulated Complex Lapped Transform)がある。しかし、ほとんどの他の類似の変換を他の実施で実行できる。
【0123】
514で、非局所的QIM透かし入れ装置例は、変換された信号を複数の疑似ランダムにサイズ設定され、疑似ランダムに配置された隣接する非連続セグメントに分割する。同じ秘密鍵Kを使用しており、これはここでは疑似乱数生成のシードとなっている。したがって、このプロセスで、埋め込みプロセスの場合と同じセグメントを生成する。
【0124】
信号の各セグメントについて、非局所的QIM透かし入れ装置例では、ブロック520〜530を繰り返す。したがって、各セグメントが同じように処理される。
【0125】
図5の522で、非局所的QIM透かし入れ装置例は、セグメントの統計量(たとえば、セグメント内の平均)を見つける。524で、非局所的QIM透かし入れ装置例は、最大帰納(MAP)デコード(Maximum A Posteriori(MAP)decoding)を使用してデコードされた透かし(またはその一部)を見つける。このようなMAPデコードの例として、直近近傍デコードがある。
【0126】
526で、デコードされたそれぞれの値が量子化された値にどれだけ近いかを測定し、そのような測定結果を追跡する。このような測定結果から得られるデータは、透かし存在判定結果の信頼性を示すものと考えられる。
【0127】
530で、このプロセスは未処理の各セグメントについて520へループして戻る。すべてのセグメントが処理されたら、ループは540に進む。
【0128】
図5の540で、非局所的QIM透かし入れ装置例は、透かしが存在しているかどうかを判定する。542で、これは、追跡された測定データに基づく信頼指示を判定する。
【0129】
544で、ブロック540の透かし存在判定とブロック544の信頼指示に基づき、非局所的QIM透かし入れ装置例は、「透かしが存在する」、「透かしが存在しない」、および「不明」の3つの指示の1つを供給する。さらに、信頼指示値を提示することもできる。
【0130】
550で、プロセスは終了する。
【0131】
誤った警報とミスの発生確率
誤った警報の確率(P)、ミスの確率(P)、およびセグメントの平均サイズの間に関係がある。Pは、透かしが存在していないのに存在していると宣言する確率である。Pは、透かしが実際には存在しているのに存在していないと宣言する確率である。一般に、平均セグメントサイズは、Pに比較的直接的に比例するが、Pに比較的間接的に比例する。
【0132】
たとえば、平均セグメントサイズがきわめて小さいとする。そすると、個々のビットに等しいくらい小さい(たとえば、画像内の1ピクセルに等しい)。そのような状況では、透かしは単一の係数に埋め込まれ、これは、局所的特性に基づく従来の方式に相当する。そのような場合、Pは非常に小さく、Pは高い。逆に、平均セグメントサイズがきわめて大きいとする。そうすると、信号の最大サイズとなるくらい大きい(たとえば、画像全体)。そのような状況では、Pはおそらく非常に低いが、Pは高い。
【0133】
その他の実施の詳細
非局所的QIM透かし入れ装置例の実施の以下の説明では、以下を仮定する。
【0134】
入力信号Xは画像である。もちろん、信号は、他の実施の他のタイプでよい。しかし、この実施の例では、信号は画像である。wをXに埋め込む透かし(2進ベクトル)とし、ランダム2進文字列Kを秘密鍵とする。透かしエンコーダの出力
【0135】
【数8】

【0136】
は、情報wが秘密鍵Kで隠されている透かし入り画像である。
【0137】
【数9】

【0138】
を生成するが、この画像は、さまざまな攻撃を受ける可能性がある。透かしデコーダは
【0139】
【数10】

【0140】
を与え、秘密鍵Kは
【0141】
【数11】

【0142】
を生成する。
【0143】
【数12】

【0144】
およびXは、すべての実用目的に関してほぼ同じであり、
【0145】
【数13】

【0146】
はそのまま許容可能な品質である必要がある。デコーダは、ある種の歪み距離関数
【0147】
【数14】

【0148】
としきい値Tを使って、透かしが存在しているかどうかを決定する。非局所的QIM透かし入れ装置例は、正規化されたハミング距離を使用し、これは、通常のハミング距離と入力の長さの比である。
【0149】
量子化によるWM
非局所的QIM透かし入れ装置例は、Xに対し順方向変換Tを適用することによりベクトルμを計算する。非局所的QIM透かし入れ装置例では、Xがグレースケール画像であると想定しており、そうでない場合は、輝度画像を得るために色付き画像に線形変換を適用できる。(色付き画像については、エネルギーのほとんどが輝度平面に集中する)。情報を隠すプロセスが量子化を介して実行されると、
【0150】
【数15】

【0151】
があり、透かし入りデータ
【0152】
【数16】

【0153】
は、
【0154】
【数17】

【0155】
にTを適用することで得られる。非局所的QIM透かし入れ装置例は、秘密鍵Kから導出されたランダム文字列を疑似ランダムジェネレータへのシードとして使用してプロセスをランダム化する。
【0156】
この方式は汎用である。したがってほとんどの変換を使用できる。さらに、T=(T−1は真である必要はなく、あるいはそうであっても逆が存在する。非局所的QIM透かし入れ装置例は、量子化が生じない空間を制約しない。デコーダは、変換Tを入力Yに適用し、μで生成を取得し、可能な埋め込みシーケンス
【0157】
【数18】

【0158】
の近似的最大尤度(ML;Maximum Likelihood)推定を適用する。疑似ランダムジェネレータを通じて、Kにより変換、量子化、および推定段の多くのランダム化機能を決定する。
【0159】
【数19】

【0160】
が見つかったら、埋め込まれている透かしwと比較しそれらの間の距離が0(またはしきい値T未満)に近ければ、透かしが存在していると宣言し、そうでなければ存在しない。これは、透かしが存在している場合に高い相関値を生じるスペクトル拡散手法の自然な測定と対照的である。
【0161】
この方法論的実施の詳細
変換TおよびTは、堅牢性を高めるのに役立つ。Tで有意な画像特性を保持するために、初期段階で離散ウェーブレット変換(DWT)を使用できる。次に、セグメントの半大域的(つまり、非局所的)統計量を画像について判定する。局所的統計量は堅牢ではない。
【0162】
非局所的QIM透かし入れ装置例がたとえば、元の画像信号の1次統計量を計算し、固定サイズのランダム矩形のいくつかの攻撃されたバージョンを計算する場合である。その後、それらの統計量の間の平均平方誤差を求めることができる。誤差は、矩形のサイズが増えるとともに単調減少する。
【0163】
で、μはウェーブレット領域内のランダムに選択された矩形の推定された1次統計量に設定する。ここでTは、矩形の数が係数の個数よりも少ない場合には可逆ではない。Tを選択するには、まず視覚的にほぼ目に付かない特性を持つ画像領域で疑似ランダムシーケンスpを生成し、Tを通じて渡し、対応する統計量μを見つけ、必要な倍率αを計算してαの倍率をかけてXに加えた疑似ランダムシーケンスpから量子化されたμの平均値
【0164】
【数20】

【0165】
を求める。この実施では、ランダムに選択したオーバーラップしない矩形を使用する。非局所的QIM透かし入れ装置例では、2つの量子化器QとQを定義しており、R内のベクトルを近い選択された格子点にマップする。
【0166】
以下に正式な説明を記載する。Q:={(qij,Sij)|j∈Z}、qij∈RをQの再構成点と定義し、Sij⊂は対応する量子化ビン(bin)であり、i∈[0,1],j∈Zである。各jについて、S0j∩[(Uk≠j0k)∪(U1k)]=S1j∩[(Uk≠j1k)∪(U0k)]=φ。ここにq0j、q1jは、疑似ランダム方式で(Kを乱数発生器のシードとして使用して)決定され、nは量子化の次元である。非局所的QIM透かし入れ装置例は、Q[a]q0j<=>a∈S0jを定義し、同様にQについても定義する。QとQは両方とも、単一の量子化器から導出され、(a)Qの再構成点の集合は{q0j∪{q1j}jに等しく、(b)すべてのj、kについて、minl∈ZL2[E(q0j),E(q1l)]=minl∈ZL2[E(q0l),E(q1k)]となる。ξで共通の値(c)を表し、各固定されたkについて、φ:=minj≠kL2[E(q0j),E(q0k)]=minj≠kL2[E(q1j),E(q1k)]かつすべてのi、jについてφ=φ>ξとする。ここで、dL2はL歪み距離関数であり、E(.)は疑似ランダム選択qijに対する期待値演算子である。
【0167】
たとえば、n=1の場合。非局所的QIM透かし入れ装置例は、上述の要求条件を満たす{E(q0j)}と{E(q1j)}を見つける。次に、{E(q0j)}と{E(q1j)}を中心とするR内の近傍であるランダム化領域を導入する。その後、いくつかの適当な確率分布を使用してこれらの領域から{q0j}と{q1j}をランダムに選択する。ランダム化領域のサイズとその形状は入力パラメータになっている。nRをそれぞれ適当にインデックスづけられている矩形の個数とする。Rを矩形内で隠すべき2進透かしベクトルwの長さとする。ベクトルvについて、そのi番目のエントリをv(i)で表す。Lは適用されるDWTのレベルの数を表すものとする。
【0168】
エンコード
NをX内のピクセルの個数とし、s:=[s,...,s]を昇順でソートしたXのピクセルからなるベクトルとする。t:=round(N(1−β)γ)およびt′:=round(N(1+β)γ)とするサブベクトルs:=[s,...,st′]およびu:=round(N[1−(1−β)γ])およびu′:=round(N[(1+β)γ])とするサブベクトルs:=[s,...,su′]を作成する。ここで、round(r)は、rの直近整数に等しく、システムパラメータは0<β,γ≪1である。mとMをそれぞれsおよびsの要素の平均値とする。点演算子P[x]=255*(x−m)/(M−m)をXの各要素に適用してX′を得る。
【0169】
X′のLレベルのDWTを見つける。XをDCサブバンドとする。
【0170】
をランダムなオーバーラップしないnRの矩形に分割し、μ(i)が矩形i(i≦nR)内の係数の平均値となるようにμを計算する。
【0171】
μ:=[μ(n(i−1)+1),...,μ(ni−1),μ(ni)],i≦Rとする。QおよびQを使用して量子化し、i≦Rについて、w(i)=0であれば、Qを使用してμを量子化し、そうでなければQを使用してμを量子化する。量子化した{μ}を結合して、
【0172】
【数21】

【0173】
を得る。
【0174】
元の統計量と量子化した統計量との差
【0175】
【数22】

【0176】
を求める。
【0177】
次のように、空間(つまり、元の画像)領域内で疑似ランダムシーケンスp=[pij]を生成する。t′=round(Nγ)およびt=round(N(1−γ))としてst′<Xij<sの場合に{0,1}からpijをランダムにかつ一様に選択し、それ以外の場合、pij=0に設定する。そこで、LレベルDWTを行列pに適用し、生成のDCサブバンドを抽出し、それをpと呼ぶ。そこで、次のステップのように対応する統計量を計算する。
【0178】
α(i)=d(i)/μ(i),i≦nRとなるように倍率αを計算する。
【0179】
インデックスがiである矩形ごとに、その矩形内のすべての係数pにα(i)をかけて、その結果のベクトルを
【0180】
【数23】

【0181】
とする。
【0182】
逆DWTを
【0183】
【数24】

【0184】
に適用し、生成をp^とする。
【0185】
透かし入りデータ
【0186】
【数25】

【0187】
を計算する。点演算子の逆(ステップ1参照)をX″に適用して、
【0188】
【数26】

【0189】
を得る。
【0190】
デコード(入力Y):
上のエンコードの第1の部分と同様に、Yに対する対応する点演算子を見つける。そこで、演算子をYに適用し、出力に対して、LレベルDWTを適用し、DCサブバンドを抽出して、それをYと呼ぶ。
【0191】
上記のエンコードのパーティション分割手順をYに適用し、その統計量μを見つける。μ(i)をi番目の要素とする。
【0192】
次にQおよびQを使用し、近似的なML推定を実行してデコードされたシーケンスwを見つける方法について説明するが、そこでμ:=[μ(n(i−1)+1),...,μ(ni−1),μ(ni)]とする。n(i−1)+1,...,ni−1,ni,i≦Rでインデックス付けられている矩形について、r0(i)をQの再構成点のうち最もμに近い点とし、同様に、r1(i)をQの再構成点のうち最もμに近い点とする。dlZ(μ,r0(i))<dlZ(μ、r1(i))であれば、w(i)=0とし、そうでなければw(i)=1とする。
【0193】
d(w,w)を計算する。結果がしきい位置Tよりも小さければ、その透かしが検出されたと宣言し、そうでなければ存在していないと宣言する。
【0194】
コンピューティングシステムと環境の例
図6は、非局所的QIM透かし入れ装置例が本実施形形態で説明しているように(完全にまたは部分的に)実施できる適当なコンピューティング環境900の例を示している。コンピューティング環境900は、本実施形態で説明しているコンピュータおよびネットワークアーキテクチャで利用できる。
【0195】
コンピューティング環境例900は、コンピューティング環境の一例にすぎず、コンピュータおよびネットワークアーキテクチャの使用または機能の範囲に関する限定を示唆するものではない。このコンピューティング環境900は例のコンピューティング環境900で示されているコンポーネントのいずれかまたは組み合わせに関して従属している、あるいは必要であるとは解釈すべきではない。
【0196】
この非局所的QIM透かし入れ装置例は、他の多数の汎用または専用のコンピューティングシステム環境または構成でも実施できる。使用するのに適していると思われるよく知られているコンピューティングシステム、環境、構成の例として、パソコン、サーバ・コンピュータ、小型軽量クライアント、大型重量級クライアント、携帯またはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能家電製品、ネットワークPC、ミニコン、メインフレームコンピュータ、上記システムまたはデバイスを含む分散コンピューティング環境などがある。
【0197】
非局所的QIM透かし入れ装置例は、コンピュータによって実行されるプログラムモジュールなどのコンピュータ実行可能命令の一般的状況において説明できる。一般に、プログラムモジュールには、特定のタスクを実行する、あるいは特定の抽象データ型を実施するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。非局所的QIM透かし入れ装置例は、さらに、通信ネットワークを介してリンクされているリモート処理デバイスによってタスクが実行される分散コンピューティング環境で実用することもできる。分散コンピューティング環境では、プログラムモジュールをメモリ記憶デバイスを含むローカルとリモートの両方のコンピュータ記憶媒体に配置できる。
【0198】
コンピューティング環境900は、汎用コンピューティングデバイスをコンピュータ902の形態で備える。コンピュータ902のコンポーネントは、1つまたは複数のプロセッサまたは処理ユニット904、システムメモリ906、およびプロセッサ904を含むさまざまなシステムコンポーネントをシステムメモリ906に結合するシステムバス908を備えるがこれに限られるわけではない。
【0199】
システムバス908は、メモリバスまたはメモリコントローラ、周辺機器バス、グラフィック専用高速バス、およびさまざまなバスアーキテクチャを使用するプロセッサまたはローカルバスを含む数種類のバス構造のうち1つまたは複数を表す。たとえば、前記アーキテクチャには、Industry Standard Architecture(ISA)バス、Micro Channel Architecture(MCA)バス、Enhanced ISA(EISA)バス、Video Electronics Standards Association(VESA)ローカル・バス、およびMezzanineバスとも呼ばれるPeripheral Component Interconnect(PCI)バスがある。
【0200】
コンピュータ902は通常、多数のコンピュータ読み取り可能媒体を備える。このような媒体は、コンピュータ902によってアクセス可能な利用可能な媒体でよく、揮発性および不揮発性媒体、リムーバルおよび取り外し不可能媒体がある。
【0201】
システムメモリ906は、ランダムアクセスメモリ(RAM)910などの揮発性メモリおよび/または読み取り専用メモリ(ROM)912などの不揮発性メモリの形態のコンピュータ読み取り可能媒体を含む。起動時などにコンピュータ902内の要素間の情報伝送を助ける基本ルーチンを含む基本入出力システム(BIOS)914は、ROM 912に格納される。RAM 910は、通常、プロセッサ904に即座にアクセス可能な、また現在操作されているデータやプログラムモジュールを含む。
【0202】
コンピュータ902はさらに、その他のリムーバル/取り外し不可能、揮発性/不揮発性コンピュータ記憶媒体も備えることができる。たとえば、図6は、取り外し不可能不揮発性磁気媒体(図には示されていない)への読み書きを行うハードディスクドライブ916、リムーバル不揮発性磁気ディスク920(たとえば「フロッピー(登録商標)ディスク」)への読み書きを行う磁気ディスクドライブ918、およびCD−ROM、DVD−ROM、またはその他の光媒体などのリムーバル不揮発性光ディスク924への読み書きを行う光ディスクドライブ922を示す。ハードディスクドライブ916、磁気ディスクドライブ918、および光ディスクドライブ922は、それぞれ、1つまたは複数のデータ媒体インタフェース960によりシステムバス908に接続される。それとは別に、ハードディスクドライブ916、磁気ディスクドライブ918、および光ディスクドライブ922は、1つまたは複数のインタフェース(図には示されていない)によりシステムバス908に接続できる。
【0203】
ディスクドライブおよび関連コンピュータ読み取り可能媒体は、コンピュータ902用のコンピュータ読み取り可能命令、データ構造、プログラムモジュール、およびその他のデータを格納する不揮発性ストレージを備える。例では、ハードディスク916、リムーバル磁気ディスク920、およびリムーバル光ディスク924が示されているが、磁気カセットまたはその他の磁気ストレージデバイス、フラッシュメモリカード、CD−ROM、デジタル多用途ディスク(DVD)またはその他の光ストレージ、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的消去可能プログラム可能読み取り専用メモリ(EEPROM)などのコンピュータによってアクセス可能なデータを格納できる他のタイプのコンピュータ読み取り可能媒体も、コンピューティングシステムおよび環境の例を実施するために利用できることは理解できるであろう。
【0204】
ハードディスク916、磁気ディスク920、光ディスク924、ROM 912、および/またはRAM 910には、たとえば、オペレーティングシステム926a、926b、1つまたは複数のアプリケーションプログラム928a、928b、その他のプログラムモジュール930a、930b、およびプログラムデータ932a、932bを含む、プログラムモジュールをいくつでも格納できる。そのようなオペレーティングシステム926a、926b、1つまたは複数のアプリケーションプログラム928a、928b、その他のプログラムモジュール930a、930b、およびプログラムデータ932a、932b(またはその組み合わせ)のそれぞれは、振幅正規化装置、変換器、パーティショナ、セグメント統計量計算機、セグメント量子化器、デルタシーケンスファインダ、および信号マーカを含むことができる。
【0205】
ユーザは、キーボード934およびポインティングデバイス936(たとえば、「マウス」)などの入力デバイスを介してコンピュータ902にコマンドおよび情報を入力できる。他の入力デバイス938(特に示されていない)としては、マイク、ジョイスティック、ゲームパッド、衛星放送受信アンテナ、シリアルポート、スキャナなどがある。これらの入力デバイスやその他の入力デバイスは、システムバス908に結合されている入力/出力インタフェース940を介してプロセッサ904に接続されるが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス(USB)などの他のインタフェースおよびバス構造により接続することもできる。
【0206】
モニタ942やその他のタイプの表示デバイスも、ビデオインタフェース944などのインタフェースを介してシステムバス908に接続できる。モニタ942の他に、入力/出力インタフェース940を介してコンピュータ902に接続可能な、スピーカ(図に示されていない)やプリンタ946などの他の出力周辺デバイスもある。
【0207】
コンピュータ902は、リモートコンピューティングデバイス948などの1つまたは複数のリモートコンピュータへの論理接続を使用してネットワーク環境で動作することもできる。たとえば、リモートコンピューティングデバイス948としては、パーソナルコンピュータ、携帯型コンピュータ、サーバ、ルータ、ネットワークコンピュータ、ピアデバイス、またはその他の共通ネットワークノードなどがある。リモートコンピューティングデバイス948は、コンピュータ902に関して本実施形態で説明している要素および機能の多くまたはすべてを備えることができる携帯型コンピュータとして示されている。
【0208】
コンピュータ902とリモートコンピュータ948との間の論理的接続は、ローカルエリアネットワーク(LAN)950および一般的なワイドエリアネットワーク(WAN)952として示されている。このようなネットワーキング環境は、事務所、企業規模のコンピュータネットワーク、イントラネットおよびインターネットではよくある。
【0209】
LANネットワーキング環境に実施する場合は、コンピュータ902はネットワークインタフェースまたはネットワークアダプタ954を介してローカルネットワーク950に接続される。WANネットワーキング環境に実施する場合は、コンピュータ902は通常、モデム956またはワイドネットワーク952上で通信を確立するためのその他の手段を備える。モデム956は、コンピュータに内蔵でも外付けでもよいが、入力/出力インタフェース940またはその他の適切なメカニズムを介してシステムバス908に接続できる。図解されているネットワーク接続は例であり、コンピュータ902と948の間に通信リンクを確立するその他手段を使用できることは理解されるであろう。
【0210】
コンピューティング環境900で示されているようなものなどのネットワーク環境では、パーソナルコンピュータ902またはその一部に関して示されているプログラムモジュールは、リモートメモリストレージデバイスに格納できる。たとえば、リモートアプリケーションプログラム958は、リモートコンピュータ948のメモリデバイスに常駐する。説明のため、アプリケーションプログラムおよびオペレーティングシステムなどのその他の実行可能プログラムコンポーネントは、ここでは離散ブロックとして示されているが、このようなプログラムおよびコンポーネントはさまざまなときにコンピューティングデバイス902の異なるストレージコンポーネントに常駐し、コンピュータのデータプロセッサによって実行されることは理解されるであろう。
【0211】
コンピュータ実行可能命令
非局所的QIM透かし入れ装置例の実施については、1つまたは複数のコンピュータまたはその他のデバイスによって実行される、プログラムモジュールなどのコンピュータ実行可能命令の一般的状況において説明できる。一般に、プログラムモジュールには、特定のタスクを実行する、あるいは特定の抽象データ型を実施するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。通常、プログラムモジュールの機能をさまざまな実施形態での必要に応じて組み合わせるか、または分散させることができる。
【0212】
操作環境の例
図6は、非局所的QIM透かし入れ装置例を実施できる適当な操作環境900の例を示している。特に、本発明で説明している非局所的QIM透かし入れ装置例は、図6またはその一部の任意のプログラムモジュール928a、928b〜930a、930bおよび/またはオペレーティングシステム926a、926bにより(全部または一部)実施できる。
【0213】
操作環境例は、適当な操作環境の一例にすぎず、本明細書で説明する非局所的QIM透かし入れ装置例の使用または機能の範囲に関する限定を示唆するものではない。使用するのに適している他のよく知られているコンピューティングシステム、環境、構成として、パーソナルコンピュータ(PC)、サーバ・コンピュータ、携帯またはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、プログラム可能家電製品、無線電話および機器、汎用および専用電気器具、特定用途向け集積回路(ASIC)、ネットワークPC、ミニコン、メインフレームコンピュータ、上記システムまたはデバイスを含む分散コンピューティング環境などがあるが、これらに限られるわけではない。
【0214】
コンピュータ読み取り可能媒体
非局所的QIM透かし入れ装置例の実施は、ある形式のコンピュータ読み取り可能媒体に格納またはある形式のコンピュータ読み取り可能媒体を介して送信することができる。コンピュータ読み取り可能媒体は、コンピュータによってアクセス可能な媒体であればどのようなものでも利用できる。たとえば、コンピュータ読み取り可能媒体として、「コンピュータストレージ媒体」や「通信媒体」などがあるが、これらに限られるわけではない。
【0215】
「コンピュータストレージ媒体」には、揮発性および不揮発性のリムーバルおよび取り外し不可能媒体が含まれ、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、またはその他のデータなどの情報の記憶用の方法または技術で実施されている。コンピュータストレージ媒体には、RAM、ROM、EEPROM、フラッシュメモリまたはその他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)、またはその他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたはその他の磁気ストレージデバイス、または目的の情報の格納に使用でき、コンピュータによってアクセスできる他の媒体があるが、これらに限られるわけではない。
【0216】
「通信媒体」は通常、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、またはキャリア波やその他の搬送メカニズムなど変調データ信号にその他のデータを具現化したものである。通信媒体はさらに、情報配信媒体も含む。
【0217】
「変調データ信号」とは、情報を信号内にエンコードするなどの方法で1つまたは複数の特性を設定または変更する信号のことである。たとえば、これには限らないが、通信媒体は有線ネットワークまたは直接有線接続などの有線媒体および音響、RF、赤外線、およびその他の無線媒体などの無線媒体を含む。上記の組み合わせも、コンピュータ読み取り可能媒体の範囲に含まれる。
【0218】
結論
本実施形態は、構造機能および/または方法論的ステップに特に向いている言語で説明されているが、特許請求の範囲で定められている発明は必ずしも説明した特定の機能やステップに限定されるわけではないことを理解すべきである。むしろ、特定の機能およびステップは、発明の好適な形態として開示されている。
【図面の簡単な説明】
【0219】
【図1】本発明の実施形態の透かしアーキテクチャを示す概略ブロック図である。
【図2】本発明の実施形態の透かし埋め込みシステム例を示す概略ブロック図である。
【図3】本発明の実施形態の透かし埋め込み例の方法論的実施を図解した流れ図である。
【図4】本発明の実施形態の透かし検出システム例を示す概略ブロック図である。
【図5】本発明の実施形態の透かし検出例の方法論的実施を図解した流れ図である。
【図6】本発明の実施形態を(全部または部分的に)実施することができるコンピューティング操作環境の例を示す図である。
【符号の説明】
【0220】
100 非局所的QIM透かし入れアーキテクチャ
122 コンテンツプロデューサ/プロバイダ
124 ネットワーク
126 クライアント
130 コンテンツストレージ
132 透かしエンコーディングシステム
134 配布サーバ
140 プロセッサ
142 メモリ
144 コンテンツ出力デバイス
150 オペレーティングシステム
152 透かし検出システム
154 コンテンツローダ
200 非局所的QIM透かし埋め込みシステム
205 マークのない信号(X)
210 振幅正規化装置
220 変換器
230 パーティショナ
240 セグメント統計量計算機
250 セグメント量子化器
260 デルタシーケンスファインダ
279 信号マーカ
400 非局所的QIM透かし検出システム
405 マークのない信号(Y)
410 振幅正規化装置
420 変換器
430 パーティショナ
440 セグメント統計量計算機
450 セグメントMAPデコーダ
460 透かし存在判定器
470 プレゼンター
480 表示装置
900 コンピュータ環境
902 コンピュータ
904 プロセッサ
906 システムメモリ
908 システムバス
910 RAM
912 ROM
914 BIOS
916 ハードディスクドライブ
918 磁気ディスクドライブ
920 リムーバル不揮発性磁気ディスク
922 光ディスクドライブ
924 リムーバル不揮発性光ディスク
926a、926b オペレーティングシステム
928a、928b アプリケーションプログラム
930a、930b その他のプログラムモジュール
932a、932b プログラムデータ
934 キーボード
936 マウス
938 他のデバイス
940 入力/出力インタフェース
942 モニタ
944 ビデオインタフェース
946 プリンタ
948 リモートコンピューティングデバイス
950 LAN
952 インターネット
954 ネットワークアダプタ
956 モデム
958 リモートアプリケーションプログラム
960 データ媒体インタフェース

【特許請求の範囲】
【請求項1】
コンピュータが行う、デジタル信号の保護を容易にする方法であって、
対象のデジタル信号を1つまたは複数のセグメントに分割するステップと、
1つのセグメントについて、そのセグメントを表す統計量を計算するステップと、
前記セグメントについて、セグメントの量子化された値を生成するためにセグメントの前記統計量を量子化するステップと、
前記1つまたは複数のセグメントの量子化された値に基づいて前記デジタル信号内に透かしが存在するかどうかを判定するステップと
を備えたことを特徴とする方法。
【請求項2】
前記対象のデジタル信号の振幅を正規化するステップと、
当該正規化された信号を変換するステップと
をさらに備えたことを特徴とする請求項1に記載の方法。
【請求項3】
1つまたは複数のセグメントについて、セグメントの統計量と該セグメントの量子化された値との距離を測定するステップと、
該測定するステップの測定距離に基づき信頼度の指示を判定するステップと、
信頼度の指示を示すステップと
をさらに備えたことを特徴とする請求項1に記載の方法。
【請求項4】
透かしが存在するかどうかを示すステップをさらに備えたことを特徴とする請求項1に記載の方法。
【請求項5】
透かしが存在するかどうかを示すステップをさらに備え、
そのような指示は「存在する」、「存在しない」、および「不明」からなるグループから選択されることを特徴とする請求項1に記載の方法。
【請求項6】
前記分割するステップは、前記信号を疑似ランダムにセグメント化するステップを含むことを特徴とする請求項1に記載の方法。
【請求項7】
前記分割するステップは、前記信号を疑似ランダムにセグメント化するステップを含み、セグメントは隣接し非連続であることを特徴とする請求項1に記載の方法。
【請求項8】
前記計算するステップの前記統計量は、セグメントの1つまたは複数の有限次モーメントを含むことを特徴とする請求項1に記載の方法。
【請求項9】
前記判定するステップは、量子化インデックス変調(QIM)手法を使用して透かしを検出するステップを含むことを特徴とする請求項1に記載の方法。
【請求項10】
コンピュータによって実行したときに請求項1に記載の方法を実行するコンピュータ実行可能命令を有するコンピュータ読み取り可能な記録媒体を備えたことを特徴とするコンピュータ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−42929(P2008−42929A)
【公開日】平成20年2月21日(2008.2.21)
【国際特許分類】
【出願番号】特願2007−217652(P2007−217652)
【出願日】平成19年8月23日(2007.8.23)
【分割の表示】特願2002−123173(P2002−123173)の分割
【原出願日】平成14年4月24日(2002.4.24)
【出願人】(500046438)マイクロソフト コーポレーション (3,165)
【Fターム(参考)】