説明

マーク付きコンテンツの識別方法

【課題】マーク付きコンテンツの識別方法の提供。
【解決手段】簡潔に言えば、一実施形態に基づいて、マーク付きコンテンツの識別方法を記載する。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、例えばマーク付きコンテンツ(marked content)等のコンテンツの分類又は識別に関する。
【背景技術】
【0002】
デジタルデータ隠蔽技術は、近年盛んに研究されている分野であり、様々なデータ隠蔽方法が提唱されている。コンテンツ保護及び/又は認証を目的とする方法もあれば、秘密通信を目的とする方法もある。後者に分類されるデータ隠蔽を、本明細書ではステガノグラフィと称する。
【発明の開示】
【課題を解決するための手段】
【0003】
本発明の主題は、本願の特許請求の範囲にて詳細に示され、明確に請求される。但し、特許請求の範囲に記載の主題は、操作の機構及び方法の両者に関して、その目的、特徴及び/又は利点と共に、以下の詳細な記述及び添付図面を参照することで、最も理解されよう。
【0004】
詳細な説明
以下の詳細な説明において、特許請求の範囲に記載の主題が十分に理解されるように、具体的な詳細を多数示している。しかしながら、それらの具体的な詳細通りでなくとも特許請求の範囲に記載の主題を実行できることは、当業者に理解されよう。また、特許請求の範囲に記載の主題が不明確にならないように、公知の方法、手順、構成要素、及び/又は回路を、詳細には説明していない場合もある。
【0005】
以下の詳細な説明の中には、コンピューティングシステム(コンピュータ及び/又はコンピューティングシステムメモリ等)に記憶されたデータビット及び/又は2値デジタル信号の操作のアルゴリズム及び/又は記号表現によって記載している部分がある。これらのアルゴリズム的記述及び/又は表現は、データ処理分野の当業者が自分の仕事内容を他の当業者に伝達するために用いる技術である。アルゴリズムは、本明細書で、また一般的にも、所望の結果をもたらす操作及び/又は同様な処理の自己矛盾がないシーケンスと考えられる。上記操作及び/又は処理は、物理量の物理的操作を伴うことがある。これらの物理量は、必ずしもそうとは限らないが、通常、記憶、転送、結合、比較、及び/又は他の操作が可能な電気信号及び/又は磁気信号の形態を採ることとなる。主として一般的使用法の点から、これらの信号をビット、データ、値、要素、記号、文字、用語、数、及び/又は数詞等と呼ぶ方が便利な場合がある。しかしながら、これらの用語及び類似の用語は全て適当な物理量と関連付けられるものであり、単なる便宜的なラベルに過ぎないことを理解されたい。特に明記しない限り、以下の記載から明白であるように、本明細書中、「処理」、「演算」、「計算」、及び/又は「決定」等の用語を用いた記載は、コンピューティングプラットフォームのプロセッサ、メモリ、レジスタ、及び/又は他の情報記憶デバイス、情報送信デバイス、及び/又は情報表示デバイスにおいて物理電子量及び/又は磁気量、及び/又は他の物理量として表されるデータを処理及び/又は変換するコンピューティングプラットフォーム(コンピュータや類似の電子演算デバイス等)により実行される動作及び/又は処理を指すということが理解される。
【0006】
デジタルデータ隠蔽技術は、近年盛んに研究されている分野であり、様々なデータ隠蔽方法が提唱されている。コンテンツ保護及び/又は認証を目的とする方法もあれば、秘密通信を目的とする方法もある。後者に分類されるデータ隠蔽を、本明細書ではステガノグラフィと称する。
【0007】
文献:J.Fridrich,M.Goljan and D.Hogea,“Steganalysis of JPEG Images:Breaking the F5 algorithm”,5th Information Hiding Workshop,2002,pp.310−323(以下「Fridrich et al.」)において、Fridrich et al.は、ステゴ画像を生成するためにF5埋め込み方法を適用した場合、ステゴ画像のブロックDCTドメインのゼロの数が増加することを示している。この特徴を用いることによって、例えばコンテンツにF5方法によって隠しメッセージが埋め込まれているか否かを判断することができる。特定のターゲットデータの隠蔽方法のステガナリシスに関する発明は他にもある。例えば、以下の文献を参照されたい:J.Fridrich,M.Goljan and R.Du,“Detecting LSB steganography in color and gray−scale images”,Magazine of IEEE Multimedia Special Issue on Security,Oct.−Nov.2001,pp.22−28、及び、R.Chandramouli and N.Memon“Analysis of LSB based image steganography techniques”,Proc.of ICIP 2001,Oct.7−10,2001。
【0008】
文献:S.Lyu and H.Farid,“Detecting Hidden Messages Using Higher−Order Statistics and Support Vector Machines”,5th International Workshop on Information Hiding,Noordwijkerhout,The Netherlands,2002(以下「Lyu and Farid」)において、Lyu and Faridは、分離可能な直交ミラーフィルタによる画像分解から導出された画像の高次統計量に少なくとも部分的に基づいた、より一般的なステガナリシス法を提唱している。ウェーブレット高周波数サブバンドの高次統計量は、この手法でのステガナリシスの特徴として抽出される。同様に、この手法によれば、ある成功率でステゴ画像をカバー画像と区別できる。この特定のステガナリシスによって取り扱われるデータ隠蔽方法は、主として最下位ビット平面(LSB)修正タイプステガノグラフィックツールを備えている。
【0009】
文献:K.Sullivan,U.Madhow,S.Chandrasekaran,and B.S.Manjunath,“Steganalysis of Spread Spectrum Data Hiding Exploiting Cover Memory”,SPIE2005,vol.5681,pp38−46(以下「Sullivan et al.」)において、隠れマルコフモデルに少なくとも部分的に基づいたステガナリシス法が提唱されている。テスト画像の経験的遷移行列はこのような手法で形成されている。しかしながら、経験的遷移行列のサイズは大きく、例えば、ビット深度8のグレースケール画像において一画像の要素は65536個である。従って、この行列は直接特徴として用いられることはない。著者は、特徴として、行列の主対角線に沿った最大の確率のうち幾つかをその隣接要素と一緒に選択し、さらに、主対角線に沿ったその他の確率をランダムに選択することとしている。残念ながら、一部の有用な情報は、特徴化のランダムさに少なくとも部分的に起因して無視されることがある。Sullivan et al.によるデータ隠蔽方法は、主としてスペクトル拡散(SS)データ隠蔽方法に関するものであった。これら後者の方法は、一般的にLSB法ほど多くの情報ビットを送ることはないが、SS法は、例えば秘密通信と関連して用いられることがある。加えて、SS法は、LSB法よりロバストであるものとして知られている。従って、ステガナリシスにSS法を検討することが望ましい。
【0010】
例えば画像等のコンテンツ向けの閾値処理された予測誤差セットのマルコフ連鎖に少なくとも部分的に基づいたステガナリシスシステムの一実施形態について後述するが、特許請求の範囲に記載の主題はこの点において範囲を限定されない。この具体的な実施形態では、例えば画像画素等のコンテンツサンプルは隣接画素によって予測される。また、例えば予測誤差画像は、画素値から予測値を減算して閾値処理することによって生成される。マルコフ連鎖の水平、垂直及び対角線方向に沿った経験的遷移行列は、このような実施形態において、ステガナリシスの特徴となり得る。例えばサポートベクトルマシン(SVM)又は遺伝的処理等の分散分析型手法は、分類又は識別に適用されることがあるが、この点においても、特許請求の範囲に記載の主題は範囲を限定されない。
【0011】
さらにこの特定の実施形態においては、特許請求の範囲に記載の主題は範囲を一実施形態にのみに限定されないが、閾値処理された予測誤差画像のマルコフ連鎖モデルに少なくとも部分的に基づいたステガナリシスシステムが適用されてもよい。画像画素は隣接画素によって予測される。この特定の実施形態における予測誤差は、画素値から予測値を減算することによって得られる。差分値の値域は増大するものの、マークなし画像の隣接画素間の相関によって、差分値の多くがゼロ付近の比較的狭い値域に集中することがある。本明細書において、マーク付きコンテンツという用語は、データが隠蔽されているため、そのような隠し情報を含んでいるようには見えないコンテンツのことである。同様に、マークなし又はカバーコンテンツとは、データが隠蔽されていないコンテンツのことである。但し、予測誤差画像における大きな値は、データの隠蔽よりもむしろ画像コンテンツに少なくとも部分的に起因することがある。従って、予測誤差に適用した閾値によって、予測誤差画像における大きな値が削減又は除去されることもあり、これによって予測誤差画像のダイナミックレンジが制限される。
【0012】
この特定の実施形態では、予測誤差画像はマルコフ連鎖を用いてモデル化されてもよいが、特許請求の範囲に記載の主題はこの点において範囲を限定されない。経験的遷移行列が計算されて、ステガナリシスの特徴となる。閾値処理に少なくとも部分的に起因して、経験的遷移行列のサイズは、分類子に対して処理し易いサイズに縮小されるため、行列における確率は特徴ベクトルに含まれることがある。特徴分類について、分散分析又は他の統計的手法が適用されてもよい。例えば、SVM処理を、分類に用いる線形及び非線形のカーネルと共に適用してもよく、その詳細は後述する。ここで、「分散分析処理」という用語は以下のような処理を指す:統計的変動に起因する差分を非統計的変動に起因する差分と十分に区別することによって、このような処理に少なくとも部分的に基づいてデータの相関付け、セグメント化、解析、分類、又は他の特徴化が実行される処理。
【0013】
ステガナリシスという用語は、この特定の実施形態において多様な意味を持ち得るが、この用語は2クラスのパターン分類手法を指す。例えば、テスト画像は、カバー画像(すなわち情報を隠蔽していないもの)、又はステゴ画像若しくはマーク付き画像(隠しデータ若しくは隠しメッセージを保有するもの)のいずれかとして分類される。通常、この特定の手法又は実施形態では、分類は2部構成であるが、特許請求の範囲に記載の主題はその範囲を2つの分類を用いるもののみに限定されない。他の手法も可能であり、特許請求の範囲に記載の主題の範囲内に含まれる。ここで、上記2部の各部はそれぞれ特徴抽出及びパターン分類と称される。多くの例では、画像が含む大量の情報に少なくとも部分的に起因して、この処理における特徴に対して画像自体を用いることが望ましい。しかしながら、同様に、実行性の観点から、特徴の次元数は多くの分類子には高すぎることがある。従って、特徴抽出が適用されることがある。
【0014】
コンピュータビジョンタイプでは、特徴がオブジェクトの形状及び色を表すことが望ましい場合がある。対照的に、この特定の実施形態では、他の特性が有用な情報を提供することもある。例えば、ステガナリシスにおいては、画像のコンテンツに関する情報に対して、データ隠蔽によってもたらされる変化に関する情報を含む特徴を有することが望ましい。
【0015】
概して、例えばマークなし画像は、例えば、連続的であって、平滑であって、及び隣接画素間に相関を持つといった具体的な特性を示す傾向がある。また、隠しデータはコンテンツ自体とは無関係なことがある。例えば、透かし処理は、例えば若干のランダム変動を導入することがあるために、マークなしコンテンツに対して連続性を変化させることがある。その結果、隣接画素、ビット平面及び画像ブロック間の相関を減少させ得る。この特定の実施形態において、データ隠蔽に起因して生じ得るこれらの変動が増幅されることが望ましい。これは、多数の可能な手法のいずれかによって実現可能であるが、特許請求の範囲に記載の主題は範囲を特定の手法に限定されない。但し、以下には、これを実現する具体的な一実施形態について説明する。
【発明を実施するための最良の形態】
【0016】
この特定の実施形態において、隣接画素は、現画素(current pixel)を予測するために用いられてもよい。本実施形態では、予測は3方向で行われてもよい。また、本実施形態では、これらの方向は水平、垂直及び対角線方向を含んでいるが、他の実施形態では、他の方向も可能である。予測については、予測誤差は、(1)に示すように予測画素値をオリジナル画素値から減算することによって推定、又は求めることができる。
【0017】
(i,j)=x(i+1,j)−x(i,j)
(i,j)=x(i,j+1)−x(i,j) (1)
(i,j)=x(i+1,j+1)−x(i,j)
【0018】
式中、e(i,j)は水平方向の画素(i,j)の予測誤差を、e(i,j)は垂直方向の画素(i,j)の予測誤差を、e(i,j)は対角線方向の画素(i,j)の予測誤差をそれぞれ示している。本実施形態では、画像の画素について、このように3つの予測誤差を推定する。こうして、予測誤差において、本明細書中E、E及びEによってそれぞれ示される3つの予測誤差画像が形成される。
【0019】
データ隠蔽によってもたらされる歪みは通常、例えば画像が有する各種オブジェクトに関連した画素の差分と比較して小さいと観察される。そうでなければ、人の目で検査される場合、歪み自体が隠しデータを示唆するので、秘密通信を損なうことになりかねない。従って、大きな予測誤差は、隠しデータよりもむしろ画像コンテンツに関してより反映する傾向がある。この特定の実施形態では、このことに対処するために、閾値Τが採用され、予測誤差は以下のルールに従って調整される。
【0020】
【数1】

【0021】
なお、当然のことながら、特許請求の範囲に記載の主題は範囲をこの特定の手法に限定されない。予測誤差に対処するための多数の他の手法も可能であり、特許請求の範囲に記載の主題の範囲に含まれるものである。同様に、例えば特定の実施形態に応じたΤは固定値を有さなくてもよく、例えば、時間、位置及び多数の他の潜在的要因によって変動してもよい。
【0022】
それでもなお、本実施例においては、大きな予測誤差をゼロとしてもよい。言い換えれば、画像画素又は他のコンテンツサンプルを、データ隠蔽の観点から平滑であるとみなしてもよい。さらにこの具体例では、予測誤差画像の値域は[−T,T]であり、2T+1個の値を取り得る。
【0023】
同様に、本実施形態では、例えば一次元ではなく二次元のマルコフ連鎖モデルを閾値処理された予測誤差画像に適用する。図1Aは、マルコフ連鎖が例えば水平方向にモデル化された水平方向予測誤差画像Eの遷移モデルの実施形態を示す概略図である。図1B及び図1Cは、それぞれE及びEの対応する実施形態を示す概略図である。上記に示唆される通り、またより詳細に後述する通り、本実施形態のE、E及びEの経験的遷移行列の要素は特徴として用いられている。図1A〜Cでは、1つの円が1つの画素を表している。これらの図は、8×8サイズの画像を示している。矢印はマルコフ連鎖の状態変化を表している。
【0024】
様々な状況でデータを解析するために、種々の技術を用いることが出来る。ここでは、「分散分析処理」という用語を、以下のような処理又は技術を指す際に用いる:上記処理又は技術を適用した結果、統計的変動に起因する差分が非統計的変動に起因する差分と十分に区別されて、そのような処理又は技術の適用に少なくとも部分的に基づいてデータの相関付け、セグメント化、分類、解析、又は別な特徴付けがなされる処理又は技術。例として、人工知能技術及び処理、ニュートラルネットワーク、遺伝的処理、経験則、及びサポートベクターマシン(SVM)等が挙げられるが、これらは特許請求の範囲に記載の主題の範囲を限定するものではない。
【0025】
特許請求の範囲に記載の主題は範囲をSVM又はSVM処理に限定されないものの、2クラス分類に対し便利な手法であってもよい。例えば、以下の文献を参照されたい:C.Cortes and V.Vapnik,“Support−vector networks,”in Machine Learning,20,273−297,Kluwer Academic Publishers,1995。例えば、SVMを用いて、線形及び非線形の場合又は状況を処理することができる。線形分離可能な場合においては、例えば、SVM分類子を適用して、ポジティブパターンをネガティブパターンから分離する超平面が求められる。一例として、トレーニングデータ対{y,ω},i=1,...,l(式中、yは特徴ベクトルであり、ポジティブ/ネガティブパターンに対しω=±1である)が挙げられる。
【0026】
この特定の実施形態では、線形サポートベクトル処理は以下のように定式化することができる。分離超平面が存在する場合、トレーニングデータは以下の制約を満たす。
【0027】
【数2】

【0028】
【数3】

【0029】
同様に、ラグランジュ方程式は以下のように構成される。
【0030】
【数4】

【0031】
式中、αは、不等式制約(本明細書では(3)及び(4))に導入される正のラグランジュ乗数である。w及びbについて、勾配Lにより以下の式が得られる。
【0032】
【数5】

【0033】
本実施形態において、SVM分類子をトレーニングすることによって、テストデータからのサンプルzをw及びbを用いて分類してもよい。例えば、一実施形態において、wz+bがゼロ以上の場合、画像を隠しメッセージを有するものとして分類してもよい。あるいは、隠しメッセージを含まないものとして分類してもよい。当然、これは特定の実施形態であり、特許請求の範囲に記載の主題はこの点において範囲を限定されない。例えば、ポジティブ、ネガティブ又は関数形式に関する規定を様々な要因や状態に応じて変化させてもよい。
【0034】
非線形分離可能な場合において、「学習機械(learning machine)」は、入力特徴ベクトルを、線形超平面が潜在的に配置される高次元空間に写像する。この実施形態において、非線形特徴空間から線形高次元空間への変換を、カーネル関数を用いて実施してもよい。カーネルの例として、線形、多項式、動径基底関数、及びシグモイドが挙げられる。この特定の実施形態では、例えば、線形SVM処理について線形カーネルを用いてもよい。同様に、非線形SVM処理については他のカーネルを用いてもよい。
【0035】
例えば画像等のマーク付きコンテンツを識別又は分類するための具体的なシステムを明示したので、性能の構築及び評価が望まれるところだが、やはり、これは説明のための具体的な一実施形態に過ぎず、特許請求の範囲に記載の主題はその範囲をこの特定の実施形態又は手法に限定されないことを注記する。
【0036】
評価のために、Vision Research Lab,University of California,Santa Barbaraのウェブサイト(http://vision.ece.ucsb.edu/〜sullivak/Research_imgs/を参照)から2812個の画像を、さらに、CorelDRAW Version 10.0 software CD#3(www.corel.comを参照)に含まれる1096個のサンプル画像をダウンロードした。
【0037】
このように、3908個の画像をテスト画像データセットとして用いた。カラー画像は、以下の(7)で示されるように不可逆的カラー変換を適用してグレースケール画像に変換した(例えば以下の文献を参照されたい:M.Rabbani and R.Joshi,“An Overview of the JPEG2000 Still Image Compression Standard”,Signal Processing:Image Communication 17(2002)3−48)。
【0038】
Y=0.299R+0.587G+0.114B (7)
【0039】
以下のような通常のデータ隠蔽方法をこれらの画像に適用した:例えば、Cox et al.による非ブラインドSSデータ隠蔽方法(以下の文献を参照されたい:I.J.Cox,J.Kilian,T.Leighton and T.Shamoon,“Secure spread spectrum watermarking for multimedia”,IEEE Trans. on Image Processing,6,12,1673−1687,(1997));Piva et al.によるブラインドSS(以下の文献を参照されたい:A.Piva,M.Barni,E.Bartolini,V.Cappellini,“DCT−based watermark recovering without resorting to the uncorrupted original image”,Proc.ICIP 97,vol.1,pp.520);及び汎用量子化インデックス変調(QIM)データ隠蔽方法(以下の文献を参照されたい:B.Chen and G.W.Wornell,“Digital watermarking and information embedding using dither modulation,”Proceedings of IEEE MMSP 1998,pp273−278.I.S(ここでは、ステップサイズは5であり、埋め込み率は0.1bppである))、及び汎用LSB。
【0040】
これらのデータ隠蔽方法において、各種ランダム又は疑似ランダム信号を各種画像に埋め込んだ。汎用LSBデータ隠蔽では、各種画像ごとに埋め込み位置をランダムに選択した。従って、この手法を、メッセージ埋め込み方法としてLSBを用いるステガノグラフィックツールに適用してもよい。0.3bppから0.01bppの低さに及ぶ種々のデータ埋め込み率を適用した。この埋め込み率の範囲は、上記Lye and FaridでLSBベースステゴツールについて報告されたものと同程度である。しかしながら、この評価は、埋め込み位置の選択に少なくとも部分的に起因して、より一般的なものとみなされることもある。
【0041】
この具体的な試験的評価においては、閾値Τを4に設定したが、上述したように、特許請求の範囲に記載の主題はその範囲を固定された閾値、又は整数値にも限定されない。本実施例の有効予測誤差値の値域は、[−4〜4]であり、計9個の異なる値を有する。従って、遷移行列の次元は9×9であり、これは一誤差画像につき81個の特徴となる。3つの異なる方向において3つの誤差画像を有するため、特徴総数はこの特定の実施例において一画像につき243個であるが、この点においても特許請求の範囲に記載の主題は範囲を限定されない。
【0042】
画像データベースにおける画像について、上記データ隠蔽方法によってステゴ画像を生成した。続いて、本システムを上記データ隠蔽方法によって評価した。オリジナルセット画像の半数をランダム又は疑似ランダムに選択し、対応するステゴ画像と共にトレーニングに用いた。性能を評価するために、本実施形態において、残りのオリジナル及び対応するステゴ画像の対をトレーニングしたSVMにかけた。本明細書では、検出率を、テスト画像数に対する、正しく分類された画像数の比と定義する。テスト手法を20回実施した。以下の試験データは、テスト回数の平均値を表している。
【0043】
まず、線形SVM処理を適用した。線形SVMには、比較的高速なトレーニングであるという利点がある。しかしながら、非線形分離可能なパターンについては同様な利点がもたらされないかもしれない。LIBSVMのMatlab SVMコードを用いた(以下の文献を参照されたい:C.C.Chang and C.J.Lin,LIBSVM:a library for support vector machines,2001,http://www.csie.ntu.edu.tw/〜cjlin/libsvm)。表1にテスト結果を示す。
【0044】
【表1】

【0045】
表1中、「TN」は「真陰性(True Negative)」を表し、本明細書ではオリジナルカバー画像の検出率である。「TP」は「真陽性(True Positive)」を表し、本明細書ではステゴ画像の検出率である。「平均」はこれら2つの検出率の算術平均である。言い換えると、これは、全テスト画像の総合正分類率である。
【0046】
Sullivan et al.に記載されているマルコフ連鎖ベースの方法を、同じセットの画像及び同じデータ隠蔽方法に適用した。同じトレーニング及びテスト手順を用いた。結果を表2に記載する。このデータによれば、本実施例において、示した実施形態は、特にLSB方法について、Sullivan et al.の方法より性能が優れている。
【0047】
【表2】

【0048】
同様に、別の評価においては、多項式カーネルを、上述のように得た243次元特徴及び129次元特徴をトレーニングするために用いた。結果を表3及び表4にそれぞれ記載する。表に示される通り、本実施例において、この特定の実施形態は、CoxのSS、PivaのブラインドSS、QIM、及び、0.1bppを超える埋め込み強度を有するLSBについて90%以上の真陽性率を有する。ここにおいて、埋め込みデータは32×32〜194×194のサイズの画像を含んでいる。対応する埋め込みデータ率は0.02bpp〜0.9bppであり、検出率は1.9%〜78%である。従って、Lyu and Faridで報告された結果と比較すると、この特定の実施形態は、Lyu and Faridにおいて示された手法より性能が優れていると思われる。
【0049】
【表3】

【0050】
【表4】

【0051】
以上、特定の実施形態を記載したが、言うまでもなく、特許請求の範囲に記載の主題は特定の実施形態又は実装に範囲を限定されないことを理解されたい。例えば、一実施形態においてはハードウェアにおけるものであって、例えばデバイス又はデバイスを組み合わせたものにおいて作動するように実装されていてもよく、別の実施形態においてはソフトウェアにおけるものであってもよい。同様に、ある実施形態では、ファームウェアにおいて、又は、例えばハードウェア、ソフトウェア、及び/又はファームウェアを任意に組み合わせたものとして実装されていてもよい。同様に、一実施形態において、記憶媒体(複数可)等の1つ以上の物品が含まれてもよいが、特許請求の範囲に記載の主題はこの点において範囲を限定されない。例えば1つ以上のCD−ROM及び/又はディスクといったこれらの記憶媒体は、そこに命令を記憶していてもよく、例えばコンピュータシステム、コンピューティングプラットフォーム又はその他のシステム等のシステムによって上記命令が実行された場合に、結果として、特許請求の範囲に記載の主題に係る方法の一実施形態、例えば上述の実施形態の1つ等が実行されてもよい。考えられる一実施例として、コンピューティングプラットフォームは、1つ以上の処理装置又はプロセッサ、1つ以上の入力/出力デバイス(ディスプレイ、キーボード及び/又はマウス等)、及び/又は、1つ以上のメモリ(スタティックランダムアクセスメモリ、ダイナミックランダムアクセスメモリ、フラッシュメモリ、及び/又はハードドライブ等)を含んでもよい。例えば、ディスプレイを用いて、1つ以上のクエリー(相関を持ったもの等)、及び/又は1つ以上の木表現を表示してもよいが、ここにおいても、特許請求の範囲に記載の主題は範囲を当実施例に限定されない。
【0052】
以上の記載において、特許請求の範囲に記載の主題の種々の態様を説明した。特許請求の範囲に記載の主題が十分に理解されるように、説明上、特定の数値、システム及び/又は構成を示した。しかしながら、上記の具体的な詳細通りでなくとも特許請求の範囲に記載の主題を実行できることは、本開示の恩恵を受ける当業者に明らかであろう。また、特許請求の範囲に記載の主題が不明確にならないように、公知の特徴を省略及び/又は簡略化している場合もある。本明細書では、特定の特徴が図示及び/又は記載されているが、当業者には多くの変形例、置換例、変更例、及び/又は均等物が想到されるであろう。従って、添付の特許請求の範囲は、そのような変形及び/又は変更の全てを、特許請求の範囲に記載の主題の趣旨に入るものとして包含するものであると理解されたい。
【図面の簡単な説明】
【0053】
【図1】図1A〜1Cは、画像等のコンテンツに適用される予測誤差モデルの一実施形態を示す概略図である。

【特許請求の範囲】
【請求項1】
コンテンツ分類処理をトレーニングする方法であって、
選択されたコンテンツの隣接サンプルから複数の予測誤差セットを形成し;
その形成された予測誤差セットを閾値処理し;且つ
その閾値処理された予測誤差セットを用いて分散分析処理をトレーニングする、
前記選択されたコンテンツの処理
を含む方法。
【請求項2】
前記コンテンツは画像を含む、
請求項1に記載の方法。
【請求項3】
前記分散分析処理はSVM処理を含む、
請求項1に記載の方法。
【請求項4】
前記複数の予測誤差セットは、少なくとも3つの予測誤差画像を含む、
請求項1に記載の方法。
【請求項5】
前記予測誤差画像は、水平方向予測誤差画像、垂直方向予測誤差画像、及び対角線方向予測誤差画像を含む、
請求項4に記載の方法。
【請求項6】
前記閾値処理は非一様閾値処理を含む、
請求項1に記載の方法。
【請求項7】
コンテンツを分類する方法であって、
トレーニングした分散分析処理をコンテンツに適用し、且つ
前記トレーニングした分散分析処理の適用により得た値に少なくとも部分的に基づいて前記コンテンツを分類する
方法。
【請求項8】
前記トレーニングした分散分析処理は、トレーニングしたSVM処理を含む、
請求項7に記載の方法。
【請求項9】
前記コンテンツは画像を含む、
請求項7に記載の方法。
【請求項10】
前記トレーニングした分散分析処理は、閾値処理された予測誤差画像に少なくとも部分的に基づく、
請求項9に記載の方法。
【請求項11】
画像分類処理をトレーニングする方法であって、
選択された画像の隣接画素から3つの予測誤差画像を形成し;
その形成された予測誤差画像を閾値処理し;且つ
その閾値処理された予測誤差画像を用いてSVM処理をトレーニングする、
前記選択された画像の処理
を含む方法。
【請求項12】
前記予測誤差画像は、水平方向予測誤差画像、垂直方向予測誤差画像、及び対角線方向予測誤差画像を含む、
請求項11に記載の方法。
【請求項13】
前記閾値処理は非一様閾値処理を含む、
請求項11に記載の方法。
【請求項14】
画像を分類する方法であって、
トレーニングしたSVM処理を画像に適用し、且つ
前記トレーニングしたSVM処理の適用により得た値に少なくとも部分的に基づいて前記画像を分類する
方法。
【請求項15】
前記トレーニングしたSVM処理は、閾値処理された予測誤差画像に少なくとも部分的に基づく、
請求項14に記載の方法。
【請求項16】
命令を記憶している記憶媒体を含む物品であって、
前記命令が実行された場合に、結果として、
選択されたコンテンツの隣接サンプルから複数の予測誤差セットを形成し;
その形成された予測誤差セットを閾値処理し;且つ
その閾値処理された予測誤差セットを用いて分散分析処理をトレーニングする、
前記選択されたコンテンツの処理方法が
実施される
物品。
【請求項17】
前記コンテンツは画像を含む、
請求項16に記載の物品。
【請求項18】
前記命令が実行された場合に、さらに結果として、
前記分散分析処理がSVM処理を含む、
請求項16に記載の物品。
【請求項19】
前記命令が実行された場合に、さらに結果として、
前記複数の予測誤差セットが少なくとも3つの予測誤差画像を含む、
請求項16に記載の物品。
【請求項20】
前記命令が実行された場合に、さらに結果として、
前記予測誤差画像が水平方向予測誤差画像、垂直方向予測誤差画像、及び対角線方向予測誤差画像を含む、
請求項19に記載の物品。
【請求項21】
前記命令が実行された場合に、さらに結果として、
前記閾値処理が非一様閾値処理を含む、
請求項16に記載の物品。
【請求項22】
命令を記憶している記憶媒体を含む物品であって、
前記命令が実行された場合に、結果として、
トレーニングした分散分析処理をコンテンツに適用し;且つ
前記トレーニングした分散分析処理の適用により得た値に少なくとも部分的に基づいて前記コンテンツを分類する、
前記コンテンツの分類方法が
実施される
物品。
【請求項23】
前記命令が実行された場合に、さらに結果として、
前記トレーニングした分散分析処理がトレーニングしたSVM処理を含む、
請求項22に記載の物品。
【請求項24】
前記コンテンツは画像を含む、
請求項22に記載の物品。
【請求項25】
前記命令が実行された場合に、さらに結果として、前記トレーニングした分散分析処理が実施され、
前記命令は、閾値処理された予測誤差画像に少なくとも部分的に基づく、
請求項24に記載の物品。
【請求項26】
前記選択されたコンテンツの隣接サンプルから複数の予測誤差セットを形成する手段と、
その形成された予測誤差セットを閾値処理する手段と、
その閾値処理された予測誤差セットを用いて分散分析処理をトレーニングする手段と
を含む装置。
【請求項27】
前記コンテンツは画像を含む、
請求項26に記載の装置。
【請求項28】
前記分散分析処理をトレーニングする手段は、SVM処理をトレーニングする手段を含む、
請求項26に記載の装置。
【請求項29】
前記閾値処理する手段は、非一様閾値処理する手段を含む、
請求項26に記載の装置。
【請求項30】
トレーニングした分散分析処理をコンテンツに適用する手段と、
前記トレーニングした分散分析処理の適用により得た値に少なくとも部分的に基づいて前記コンテンツを分類する手段と
を含む装置。
【請求項31】
前記トレーニングした分散分析処理を適用する手段は、トレーニングしたSVM処理を適用する手段を含む、
請求項30に記載の装置。
【請求項32】
前記コンテンツは画像を含む、
請求項30に記載の装置。
【請求項33】
前記トレーニングしたSVM処理を適用する手段は、閾値処理された予測誤差画像に少なくとも部分的に基づく、
請求項32に記載の装置。

【図1】
image rotate


【公表番号】特表2009−524078(P2009−524078A)
【公表日】平成21年6月25日(2009.6.25)
【国際特許分類】
【出願番号】特願2008−550282(P2008−550282)
【出願日】平成18年1月13日(2006.1.13)
【国際出願番号】PCT/US2006/001338
【国際公開番号】WO2007/081344
【国際公開日】平成19年7月19日(2007.7.19)
【出願人】(507250519)ニュー ジャージー インスティテュート オブ テクノロジー (7)
【Fターム(参考)】