画像間のアフィン関係を推定する方法
第1の画像と第2の画像とのアフィン関係を推定する方法(400)が開示される。第1の画像及び第2の画像の各々は、少なくとも4本の互いに平行でない線を有する。方法(400)は、各々の画像の中に現れる線の複数組の交点を識別すること(406)により開始される。次に、方法(400)は、第1の組の交点及び第2の組の交点から、交点間に関係が存在するか否かを判定する(412)。関係が存在する場合、第1の画像及び第2の画像はアフィン関係にあり、アフィン歪は反転されてもよい(418)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、画像処理に関し、特に、画像間のアフィン関係を推定することに関する。
【背景技術】
【0002】
背景
電子透かしは、情報を知覚不可能に画像中に埋め込むために頻繁に使用される。しかし、一般に使用されている電子透かしの多くは、スケーリング、回転、せん断歪(shearing)、アナモフィックスケーリング(anamorphic scaling)などの歪により破壊される。電子透かし検出方法の中には、平行移動を感知するものさえある。
【0003】
これまで、電子透かしを検出するための様々な方法が提案されてきたが、それらの方法のいくつかは、アフィン歪に対して不変であるといえる。しかし、アフィン歪に対して不変である方法の多くは、いずれかの段階で、アフィン歪を定義するパラメータの空間全体にわたる広範囲の検索を必要とする。そのような検索は、多次元であり、通常、相当に大きな計算容量を消費すると考えられる。
【0004】
最近、まず平行移動を除去し、次にスケーリング及び回転を2つの直交方向の別の平行移動効果とする変換を実行することにより、検索空間を縮小するいくつかの方法が提案されている。それらの方法は、RST(回転、スケール及び平行移動)に対して不変な方法として知られる。通常、この技術は埋め込み手順と検出手順との相補性を必要とする。
【0005】
他の技術は、回転対称などの特殊な対称特性を有するパターンを埋め込み、次に、非対称歪パラメータの広範囲な検索によりそれらのパターンを検出することに依存する。
【0006】
上述の方法はいずれも完全アフィン歪の不変性を有していないため、完全不変性を確保するためには、歪パラメータ空間のうちの1つ以上の広範囲な検索が依然として必要とされる。従って、パラメータ空間の広範囲にわたる検索を必要とせずに、アフィン歪のパラメータを推定する方法が必要とされる。
【発明の開示】
【0007】
概要
本発明の目的は、既存の構成の1つ以上の欠点を克服すること又は少なくとも改善することである。
【0008】
上述の問題に対処する構成が開示される。かかる構成は、画像に埋め込まれた線の交点と画像の歪バージョンに埋め込まれた線の交点との対応性を識別することにより、画像に適用されたアフィン歪のパラメータを推定するものである。
【0009】
本発明の1つの側面によれば、各々が少なくとも4本の互いに平行でない線を有する第1の画像と第2の画像との間のアフィン関係を推定する方法であって、
前記第1の画像中に現れる前記線の第1の組の交点を識別するステップと、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係が存在するか否かを判定するステップとから成り、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にある方法が提供される。
【0010】
本発明の別の側面によれば、補助パターンを有し、少なくとも4本の互いに平行でない線を有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の前記補助パターンを検出する方法であって、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別するステップと、
前記第1の組の交点及び前記第2の組の交点を使用して、前記アフィン歪パラメータを推定するステップと、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用するステップと、
前記第2の画像中の前記歪補助パターンを検出するステップとから成る方法が提供される。
【0011】
本発明の更に別の側面によれば、上記の方法のうちのいずれか1つを実現するための装置が提供される。
【0012】
本発明の別の側面によれば、先に説明された方法のうちのいずれか1つを実現するためのコンピュータプログラムが記録されたコンピュータ可読媒体を含むコンピュータプログラム製品が提供される。
【0013】
本発明の他の面も開示される。
【発明を実施するための最良の形態】
【0014】
添付図面のうちのいずれか1つ以上において、同一の図中符号を有するステップ及び/又は特徴が参照される場合、以下の説明中、特に指示のない限り、それらのステップ及び/又は特徴は同一の機能又は動作を有するものとする。
【0015】
図1Aに一例が示されるような画像中の1本の直線nについて考える。直線nを表現する方法がいくつかあることは、当業者には理解されるであろう。例えば、直線nを表現するために2つの点が使用されてもよい。また、直線nは、画像に埋め込まれてもよく、あるいは画像中の1つ以上の特徴と関連付けられてもよい。
【0016】
直線nは、デカルト座標の縦軸(Y軸)に対して角度βnをなし、直線nに対して垂直な方向に、座標の原点から距離rnの位置にある。直線nは、1対のパラメータ{rn, βn}により一意に記述される。図1Bは、極座標空間において直線nを定義するパラメータ対{rn, βn}を示す。
【0017】
再び図1Aを参照すると、直線n上の1点(x, y)及び直線nに沿った距離λnは、標準形式で次のように表されてもよい。
【0018】
【数1】
【0019】
ここで、直線nを含む画像に適用される一般的なアフィン歪を考える。アフィン歪は、回転、スケーリング、せん断歪、鏡映、平行移動及びアナモフィックスケーリングのうちの1つ以上を含んでもよい。アフィン歪後の当初の点(x, y)の画像中の変換座標を(x〜, y〜)とすると、点(x〜, y〜)は次のように表される。
【0020】
【数2】
【0021】
式中、aijは、回転、スケーリング、せん断歪、鏡映及びアナモフィックスケーリングを定義するパラメータであり、(x0, y0)は、平行移動を定義する。ここで、以下のように仮定する。
【0022】
【数2−2】
【0023】
更に、以下に示す場合は、鏡映が起こったことを示す。
【0024】
【数2−3】
【0025】
パラメータaijにより適用される総歪(total distortion)は、次のように、基本歪(prime distortions)、すなわち回転、アナモフィックスケーリング(anamorphic scaling)及びせん断歪の組み合わせに分解されてもよい。
【0026】
【数3】
【0027】
式中、角度ωの回転は、以下の行列により表される。
【0028】
【数4】
【0029】
X軸及びY軸に沿ったアナモフィックスケーリングは、アスペクト比変化(aspect ratio change)と呼ばれる場合もあり、次の形式を有する。
【0030】
【数5】
【0031】
x方向のせん断歪は、次の形式を有する。
【0032】
【数6】
【0033】
また、|ω|≦45°であるように、回転歪を正しい象限に配置するために適用される転位(transposition)は、次の4つのオプションのうちの1つから選択される。
【0034】
【数7】
【0035】
アフィン歪は、アフィン歪中、どの直線も線の平行性(parallelism of lines)と共に保持されるが、長さ及び角度は変化するという特性を有する。従って、画像中の直線nは変形後の画像中の直線に変換されるが、変形後の画像中の直線はパラメータ対{r〜n,β〜n}により定義される。このパラメータ対{r〜n,β〜n}は、通常、アフィン歪前の直線nのパラメータ対{rn,βn}とは異なる。
【0036】
略語cn=cosβn、sn=sinβnを使用すると、式(1)及び(2)から次の関係が成り立つ。
【0037】
【数8】
【0038】
及び
【0039】
【数9】
【0040】
アフィン歪(affine distortion)を定義する6つの未知のパラメータ{a11, a12, a21, a22, x0, y0}を含む式(8)及び(9)によって、各直線nがパラメータ対{rn, βn}により定義される3本の直線を画像中に含め、アフィン歪画像(affine distorted image)中の3本の直線を検出し、アフィン歪直線(affine distorted line)ごとにパラメータ対{r〜n,β〜n}を判定し、式(8)及び(9)を解くことにより、パラメータ{a11, a12, a21, a22, x0, y0}が計算されてもよい。鏡映(reflection)を識別するために、直線を画像中に配置するとき、左右の非対称も要求される。
【0041】
しかし、式(8)及び(9)から、直線にアフィン歪が適用される場合、一般に、パラメータ対{r〜n,β〜n}はかなり複雑で曖昧な方式で変換されることがわかる。この曖昧さは、直線nと平行な方向の平行移動又はスケーリングが、パラメータ対{rn,βn}に全く影響を及ぼさないために起こる。
【0042】
また、アフィン歪前の画像中の直線nに対応する歪後の直線を識別することも明らかではない。これを例示するために、図2Aは歪前の極座標空間における3本の線のパラメータ対{rn,βn}を示し、図2Bは歪後の同一の3本の線のパラメータ対{r〜n,β〜n}を示す。歪前と歪後のパラメータ対{rn,βn}及び{r〜n,β〜n}の対応性は、曖昧になり、その結果、縮退や、不確かさを招く可能性がある。
【0043】
アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために、いくつかの技術が使用されてもよい。1つの技術は複数の線を埋め込む。この場合、線自体が一意性を有し、線の一意性はアフィン歪により破壊されない。例えば、各直線を一意に識別するために、それぞれ異なる型、色などを有する線が使用されてもよい。
【0044】
アフィン歪の別の有用な特性は、1本の直線の2つの線分の比がアフィン歪に関して不変であるということである。好ましい実現形態においては、アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために使用されるのがこの特性である。
【0045】
1つの画像の中にN本の直線があると考えると、各直線は、先の場合と同様に、パラメータ対{rn, βn}、n=1→により一意に記述され、n≠mであるとき、角度はβn≠βmである。従って、それらの直線は互いに平行ではない。
【0046】
直線は互いに平行ではないので、各直線はその長さに沿って他の直線と互いに交差する。N本の(互いに平行でない)直線の交点の最大数は、三角数N(N-1)/2である。直線mが直線kと交差する点(xkm, ykm)は、次のように表される。
【0047】
【数10】
【0048】
式中、λkmは、直線mが交差する直線kに沿った距離である。同様に、距離λmkは、直線kが交差する直線mに沿った距離である。
【0049】
式(10)の連立方程式を解くと、距離λkmは次の式により表される。
【0050】
【数11】
【0051】
直線の本数N=4である場合を考える。各直線kは、他の3本の直線mとの間に3つの交点(xkm, ykm)を有するであろう。この段階で、直線kに沿ったそれぞれの交点(xkm, ykm)までの距離λkmを、大きさに従って次のように順序付けると有用である。
【0052】
【数12】
【0053】
線分の長さξk1及びξk2を次のように定義すると、
【0054】
【数13】
【0055】
及び
【0056】
【数14】
【0057】
直線kの長さ比Rkは次のように定義される。
【0058】
【数15】
【0059】
直線のパラメータ対{rn, βn}を適切に選択すると、各直線kの比Rkは、他のどの直線mの長さ比とも明確に異なる。比Rkは、アフィン歪に関して不変であるため、アフィン歪前とアフィン歪後の各直線の対応性を一意に判定できる。
【0060】
対応する直線が識別されたならば、直線kにより表現される各方向に沿ったスケーリング係数を推定するために、アフィン歪前とアフィン歪後の異なる直線に沿った距離λkmが比較されてもよい。また、アフィン歪の回転成分を推定するために、各直線の向きの変化が使用されてもよい。
【0061】
式(4)及び(5)にそれぞれ定義されるように、当初の画像に回転が適用され、続いてアナモフィックスケーリング(anamorphic scaling)が適用された特定のケースを考える。アナモフィックスケーリングは、水平デカルト座標軸(X軸)と平行な方向に係数Aのスケーリングを有し、それに対して垂直な方向に係数Bのスケーリングを有する。角度ωは回転角である。一般に、角度βnにおける長さlnの線分は、角度β〜nで長さl〜nの線分にマッピングされる。このとき、
【0062】
【数16】
【0063】
【数17】
【0064】
式(16)及び(17)は、3つの未知数、すなわち、スケーリング係数A及びB並びに角度ωを含む。当初の画像に4本の線が埋め込まれているので、次のように、長さlnとして、各直線の外側の交点の距離を使用すると、
【0065】
【数18】
【0066】
4対の式が得られる。最小2乗方法を用いて、このような過剰制約付き系(over-constrained system)を解くことができる。
【0067】
尚、式(16)及び(17)は、平行移動に対して不変であり、平行移動(x0, y0)を想定しない。また、計算されるべき式(2)で定義される一般アフィン歪の全てのパラメータに対して、式(4)及び(5)の行列は式(3)におけるように組み合わされるが、せん断歪係数Rは0である。
【0068】
あるいは、アフィン歪前とアフィン歪後の各直線の対応性から、パラメータ対{rn, βn}及び{r〜n, β〜n}の対応性が一意に判定される。式(10)に式(11)を代入すると、交点(xkm, ykm)は、次のように表される。
【0069】
【数19】
【0070】
直線は互いに平行ではないので、sin(βk-βm)≠0である。実際の状況においては、sin2 (β〜k-β〜m)≧0.25が成立するように、それぞれの角度βk及びβmが選択される。これと同等に、直線k及びmが交差する角度は、30°<|β〜k-β〜m|<150°を満たす。
【0071】
同様に、交点(xkm, ykm)に対応する変換後の点(x〜km, y〜km)は、次の式により表される。
【0072】
【数20】
【0073】
式(19)及び(20)にパラメータ対{rn, βn}及び{r〜n,β〜n}を代入し、対応する交点(xkm, ykm)及び(x〜km, y〜km)を使用して式(2)を解くと、アフィン歪パラメータ{a11, a12, a21, a22, x0, y0}が得られる。
【0074】
アフィンパラメータ推定の好ましい方法は、直線の交点(xkm, ykm)とアフィン歪後の交点(x〜km, y〜km)との最小2乗フィッティング(least squares fitting)(LSF)を使用する。交点(xkm, ykm)及び(x〜km, y〜km)の対応関係は既知であるため、このLSFは大幅に簡略化される。交点(xkm, ykm)及び(x〜km, y〜km)の対応関係が一意に識別されなければ、可能な全ての順列、この場合には、6!=720について、LSFを評価する必要がある。
【0075】
検出され、(一意に)順序付けされた交点を(x^km, y^km)により表すものとする。先の場合と同様に、当初の(歪前の)交点は(xkm, ykm)であり、歪後の交点は(x〜km, y〜km)である。誤差エネルギー(error energy)は、ユークリッドノルム尺度(Euclidean norm measure) Eとして定義される。
【0076】
【数21】
【0077】
変換パラメータpに関する誤差エネルギー最小化(Error energy minimization) により、6つの式が得られる。
【0078】
【数22】
【0079】
変換パラメータpは、変換を定義するパラメータa11、a12、a21、a22、x0及びy0(式(2))のうちの1つである。
【0080】
幸いなことに、p=aijに関する偏導関数のために、式(22)において表される6つの式は大幅に簡略化される。
【0081】
【数23】
【0082】
そこで、式(22)において表される6つの式は、以下の加算を整合することと同等である。
【0083】
【数24】
【0084】
式(22)及び(23)からの全変換パラメータ(full transform parameters)を埋めることにより、同一の対称行列乗数(same symmetric matrix multiplier) Mを有する1対の3×3行列式が得られる。
【0085】
【数25】
【0086】
【数26】
【0087】
【数27】
【0088】
行列Mの逆行列は、別の対称行列M-1である。
【0089】
【数28】
【0090】
【数29】
【0091】
式(25)及び(26)を反転すると、6つの歪パラメータ全ての最小2乗推定(least squares estimate)のための最終解は次のように明示される。
【0092】
【数30】
【0093】
【数31】
【0094】
最小誤差エネルギー(minimum error energy) Eは、式(21)を用いて計算されてもよく、許容限界(allowable limit)と比較されてもよい。誤差エネルギーEが許容限界より大きい場合、アフィン整合(affine match)が探索されなかったと想定される。交点(xkm, ykm)及び(x〜km, y〜km)を比較することにより、最大点偏差(maximum point deviations)を計算することも可能であり、これは推定される歪の信頼性尺度(reliability measure)を確定する上で有用である。特に信頼性推定に関して有用な別のパラメータは、正規化エネルギー(normalized energy)、すなわち、任意の点の集合n=1→Mに対して次のように定義される中心平均2乗点分布(centred mean square point distribution) Gにより誤差エネルギーE(error energy)を除算した値である。すなわち、
【0095】
【数32】
【0096】
式中、測定された点分布の重心(centroid)は、(x^ ̄n,y^ ̄n)として定義される。
【0097】
図3は、少なくとも4本の互いに平行でない直線を含む画像からアフィン歪のパラメータを検出する方法200の概略的なフローチャートを示す。一実施形態においては、互いに平行でない直線は、それらの直線が人間の目に見えないように画像中に埋め込まれる。図4は、電子透かしを使用して直線を埋め込む方法300の概略的なフローチャートを示す。
【0098】
方法200及び300は、図5に示されるような汎用コンピュータシステム100を使用して実施されるのが好ましい。その場合、方法200及び300のステップは、コンピュータシステム100内部で実行するソフトウェアとして実現される。特に、方法200及び300のステップは、コンピュータシステム100により実行されるソフトウェア中の命令により実現される。ソフトウェアは、例えば、以下に説明される記憶装置を含むコンピュータ可読媒体に格納されてもよい。ソフトウェアは、コンピュータ可読媒体からコンピュータにロードされ、コンピュータシステム100により実行される。そのようなソフトウェア又はコンピュータプログラムが記録されたコンピュータ可読媒体は、コンピュータプログラム製品である。
【0099】
コンピュータシステム100は、コンピュータモジュール101と、キーボード102、マウス103及び撮像装置(imaging device)122などの入力装置と、プリンタ115及び表示装置114を含む出力装置とにより形成される。撮像装置122は、デジタル画像を収集するために使用されるスキャナ又はデジタルカメラであってもよい。変復調器(モデム)トランシーバ装置116は、例えば、電話回線121又は他の機能媒体を介して接続可能な通信ネットワーク120との間で通信を実行するために、コンピュータモジュール101により使用される。
【0100】
通常、コンピュータモジュール101は、少なくとも1つのプロセッサユニット105と、例えば、半導体ランダムアクセスメモリ(RAM)及び読み取り専用メモリ(ROM)から形成されるメモリユニット106とを含む。モジュール101は、ビデオ表示装置114に結合するビデオインタフェース107、キーボード102、マウス103及び撮像装置122に対応する入出力(I/O)インタフェース113並びにモデム116及びプリンタ115に対応するインタフェース108を含む複数のI/Oインタフェースを更に含む。記憶装置109が設けられ、通常、記憶装置109は、ハードディスクドライブ110及びフロッピー(登録商標)ディスクドライブ111を含む。CD‐ROMドライブ112は、通常、不揮発性データ源として設けられる。通常、コンピュータモジュール101の構成要素105〜113は、当業者には周知の従来のコンピュータシステム100の動作モードが得られるように相互接続バス104を介して通信する。
【0101】
通常、ソフトウェアは、ハードディスクドライブ110に常駐し、プロセッサ105により読み取られ、ソフトウェアの実行はプロセッサ105により制御される。場合によっては、ソフトウェアは、CD‐ROM又はフロッピー(登録商標)ディスクに符号化された形でユーザに供給され、対応するドライブ112又は111により読み取られてもよく、あるいはユーザによりネットワーク120からモデム装置116を介して読み取られてもよい。更に、他のコンピュータ可読媒体からコンピュータシステム100へソフトウェアをロードすることも可能である。
【0102】
少なくとも4本の互いに平行でない直線を含む画像からアフィン歪のパラメータを検出する方法200及び電子透かしを使用して直線を埋め込む方法300は、上述のようなソフトウェアではなく、方法の機能又は部分機能を実行する1つ以上の集積回路などの専用ハードウェアにおいて実現されてもよい。そのような専用ハードウェアは、グラフィックプロセッサ、デジタルシグナルプロセッサ又は1つ以上のマイクロプロセッサ及び関連メモリを含んでも良い。
【0103】
まず図4を参照すると、パラメータ対{rn, βn}により各直線nが定義されるような複数の直線を電子透かしを使用して埋め込む方法300はステップ310で始まり、ステップ310においては、各直線nと関連するパターンが生成される。
【0104】
埋め込まれるべき直線のパラメータ対{rn,βn}を選択する場合、1つのオプションは、全角度範囲にわたり一様に分布する角度βn、すなわち、0°、45°、90°、135°を有する4本の直線を選択することである。図6は、そのように配列された4本の直線を示す。
【0105】
4本の直線のいくつかの配列は、極めて対称性の高い結果をもたらす。図示される配列はそれほど対称ではない。この配列は、配列の鏡映歪バージョン(reflected and distorted version)と明確に識別できる6つの交点(xkm, ykm)を含む。3本以上の線が1点で出会う縮退配列(degenerate arrangement)においては、交点は6つより少なくなることも可能であるが、ここではそのようなケースを考慮しない。
【0106】
図6には、別のパラメータeに基づいて、線分600の長さpに関連して定義されたn=1〜4に対する線分の長さξn1及びξn2も示される。パラメータeの関数として式(15)で定義される線分の長さ比Rnは、式(18)で定義される線分の長さlnと共に、表1に示されるように計算される。
【0107】
【表1】
【0108】
図7は、線分の長さ比Rnをパラメータeの関数として表す。特定の値e≒0.31により、全く異なる4つの別個の長さ比Rnが求められることが図7からわかる。別の興味深い有用な長さ比Rnの集合は、e=0.5に対して現れる。この場合、4本の直線の全てが中心の基準点から等距離にある。それらの等距離がアフィン歪により均等に変換されない可能性があるため、第7の点はせん断歪又はアナモフィックスケーリングに対して真の不変性を維持しない点であるが、本質的には第7の点を定義できる。
【0109】
好ましい実施形態(e=0.31)においては、4本の直線は次のようなパラメータを伴って埋め込まれる。
【0110】
【数33】
【0111】
式中、pは画像幅に設定される。尚、rnに対応する角度βnが180°回転されるのであれば、負の値であるrnはそれを相補する正の値と等価である。
【0112】
好ましい方向付け角度βnを選択することにより、いずれか1本の直線nと画像境界(image boundaries)との一致は最大限に回避される。
【0113】
直線が電子透かしとして埋め込まれる場合、各電子透かしは、電子透かしが埋め込まれている画像がアフィン歪を受けた後であっても検出可能であるという特性を有していなければならない。好ましい実施形態によれば、各パターンは一方向にのみの変化を有し、その方向は直線nに対して垂直である。パターンは軸を更に有し、その軸は線と一致する(奇数又は偶数)対称の軸又は指定された軸であってもよい。通常、パターンは、変化の方向に適用される1次元基底関数(one-dimensional base function)から生成され、軸と平行に繰り返される。
【0114】
好ましい実施形態においては、基底関数は下記の形態の複素同次関数(complex homogeneous function)である。
【0115】
【数34】
【0116】
式中、vは1次元座標であり、必ずしも正ではない。α及びpは定数である。基底関数g(v)は、基底関数がパターン画像のナイキスト周波数(Nyquist frequency)を超える周波数を有する領域において減衰されるのが好ましい。式(34)は、位相関数(phase function)を振幅変調(amplitude modulating)する振幅関数(amplitude function)としても考えられ、その場合、位相関数は対数位相(logarithmic phase)を有する。そのような複素同次関数g(v)が、例えば係数aによってスケーリングされる場合、スケーリングは次のような複素定数係数(complex constant factor)のみを導入する。
【0117】
【数35】
【0118】
複素同次関数の利点は、複素同次関数の自己相関(auto-correlation)が複素同次関数のスケールバージョン(scaled version)を伴う複素同次関数の相互相関(cross-correlation)に正比例することである。この「スケール不変(scale-invariant)」特性は、スケール変換後であっても、画像を基底関数と相関することにより画像中の電子透かしの検出を可能にする。
【0119】
図8は、式(34)の基底関数の実数部を使用して次のように生成されるパターンの一例を示す。
【0120】
【数36】
【0121】
尚、パターン画像のナイキスト周波数を超える周波数を有する値を除去するために、対称軸に隣接する領域において、マスキングが適用されている。パターンとそのパターンに埋め込まれた直線との関係も示される。直線自体はパターンの一部を形成せず、次のステップにおいては画像に追加されないことが理解される。この例のパターンを示すに際して、パターン値は[0,255]の範囲の値にマッピングされており、0の値は黒色として表現され、255の値は白色として表現される。
【0122】
再び図4を参照すると、ステップ310においては、1つのパターン画像を形成するために、複数の別個のパターンが加算される。パターン画像は、生成後にメモリ106又はHDD110に格納されてもよい。
【0123】
観測者が知覚不可能なパターンを埋め込むために、ステップ320において、メモリ106からパターン画像が検索され、低輝度変化(low intensity variation)を有する画像の領域に対応するパターンのレベルを大幅に減少し、且つ高輝度変化(high intensity variation)を有する画像の領域に対応するパターンのレベルをそれより少ない量だけ減少するために、パターン画像はプロセッサ105により知覚マスキングされる。輝度変化の尺度の一例は、画像中の輝度の局所勾配の大きさである。他の尺度には、輝度の偏導関数、「エネルギー」又は周波数コンテンツの局所推定値(local estimates)、局所分散(local variance)及び更に精巧な人間の視覚系統のマスキングの推定値などがある。
【0124】
ステップ330において、知覚マスキングされたパターン画像が画像に追加される。このパターン画像は電子透かしと呼ばれてもよい。画像がカラー画像である場合、電子透かしはカラー画像の輝度部分に追加されるのが好ましい。これにより、電子透かし入り画像がカラーからグレイスケール表現に変換されるときに電子透かしは残存できる。あるいは、電子透かしは、カラー画像のR、G、B、H、V、S、u、vなどのチャネルのうちの1つ以上又はそれらのチャネルの何らかの組み合わせに追加されてもよい。画像への電子透かしの追加は、単純な代数加算の他にディザリング及びハーフトーン化を更に含む。複素基底関数の実数部及び虚数部が、カラー画像の2つ以上のチャネルに独立して追加されてもよい。
【0125】
電子透かしが埋め込まれた画像は、tiff、gif、jpeg、mpegなどのデジタル画像フォーマットで記憶装置109(図5)に格納されてもよい。電子透かし入り画像のハードコピーを作成するために、電子透かし入り画像はプリンタ115(図5)で印刷されてもよく、あるいはネットワーク120を使用して別のコンピュータモジュール101へ通信されてもよい。
【0126】
画像中に直線が埋め込まれ、画像がアフィン歪を受けているため、直線及びそのパラメータ対{r〜n,β〜n}が検出されなければならない。図4を参照して説明したように、電子透かしを使用して直線が埋め込まれているので、次に図3を参照して、画像からアフィン歪のパラメータを検出する方法200を説明する。方法200はステップ202で始まり、ステップ202において、歪画像のデジタルコピーが獲得される。通常、画像は既にデジタル画像フォーマットになっており、記憶装置109(図5)に格納されてもよい。そのような場合、画像は画素値のアレイに変換される。その時点で画像が写真などのハードコピーフォーマットのままである場合には、まず、撮像装置122(図5)を使用してハードコピーを走査することにより、ハードピー画像はデジタルフォーマットに変換される。
【0127】
続くステップ205において、プロセッサ105は、まず、画像から知覚マスクを形成し、次に、画像の値を知覚マスクの対応する値で除算することにより画像を知覚マスクで強調し、知覚マスキングを解消する。尚、近似知覚マスクが適切である。
【0128】
次に、ステップ210において、得られた画像に射影変換(projective transform)が適用される。射影変換は、画像中の直線に沿って値を加算することによりエネルギーを累積する。ラドン(Radon)(又は等価のHough)変換は、ステップ210において使用されてよい射影変換の1つであり、次のように定義される。
【0129】
【数37】
【0130】
離散型データセットに対してラドン変換(Radon transform)の実施形態を導き出すために、画像関数h(x, y)の射影(projection)とその関数のフーリエ変換のスライスとの対応性が使用されるが、その対応性は、「射影‐スライス定理(projection-slice theorem)として知られる。
【0131】
射影‐スライス定理は、2次元関数の射影の1次元フーリエ変換がその関数の2次元フーリエ変換の半径方向のスライス(radial slice)に等しいと規定する。尚、
【0132】
【数38】
【0133】
であり、式中、H(u, v)は画像h(x, y)の2次元(2D)フーリエ変換である。擬似極座標空間(quasi polar space)において、角度は範囲(-π/2, π/2)であり、距離は範囲(-∞, ∞)にある。フーリエドメイン(Fourier domain)において擬似極座標(quasi-polar coordinate)(q,φ)を定義することにより、座標変換は、u=qcosφ、v=qsinφであり、射影‐スライス定理の1つの形態は、次のように、ラドン射影角(Radon projection angle) φ=θに対応するフーリエ極座標角(Fourier polar angle)について求められる。
【0134】
【数39】
【0135】
式(39)により離散的画像の2D‐FFTの半径方向のスライスとしてラドン射影の(フーリエ変換の)推定が可能になるため、式(39)は有用である。これは、まず、2D-FFTを実行し、続いて、再サンプリング(resampling)を実行するためにbicubic又はchirp-zなどの適切な補間を使用してデカルト座標から極座標への再マッピング(remapping)を実行することにより、離散的ラドン変換(discrete Radon transform)を評価できることを示唆する。
【0136】
方向付け角度(orientation angle)β〜n及び垂直変位(perpendicular displacement) r〜nを有する1次元基底関数g(v)に基づいてN個のパターンが埋め込まれている画像h(x, y)は、画像自体の画素値を無視すると、次のように書き表される。
【0137】
【数40】
【0138】
方向付け角度(orientation angle)β〜nにある1つの方向にのみ変化を有するパターンに射影変換が適用された場合、角度θが角度θの他の全ての値と比較される方向付け角度β〜nに等しいときに、射影の値は著しく大きくなる。図9は、図8に示される歪前のパターンの例の射影を擬似極座標空間(quasi-polar space)において示す図である。角度θが角度βnと等しいとき、射影の値は特に大きくなることがわかる。射影は、オフセット距離rnに関して対称性を更に有する。
【0139】
従って、式(40)の関数に対してラドン変換(Radon transforms)を適用することにより、以下に示されるような関数のラドン変換はθ=β〜nである線に制約されることがわかる。
【0140】
【数41】
【0141】
ラドン変換を用いることにより、パターンg(v)が埋め込まれた画像関数(image function)h(x, y)を擬似極座標空間内のN本の直線に集中したので、極座標角(polar angle) θの全ての値に対して1-D擬似半径方向相関(1-D quasi-radial correlations)(座標rにおける)を用いることにより、更に、各直線に含まれるエネルギーを単一の点(又は1つの点の付近の狭い領域)に集中することが可能である。
【0142】
従って、続くステップ220において、プロセッサ105は、極座標角θの可能な全ての値に対して、擬似半径方向座標(quasi-radial coordinate)rにおける射影(projection)と基底関数(base function)g(v)との1-D相関(1-D correlations)を実行する。用語「相関(correlation)」は、位相相関(phase correlation)及びエネルギーによりスケーリングされた位相相関を更に含む。その結果得られる相関は、擬似極座標(r^n,β^n)にピークを有する。
【0143】
ステップ230において、プロセッサ105は相関の絶対ピーク(absolute
peaks)を探索する。各歪埋め込みパターンの方向付け角度(orientation angle)β〜n及び垂直変位(perpendicular displacement)r^nは、ピークの擬似極座標(r^n,β^n)から直接求められる。また、埋め込み直線のパラメータ対{rn, βn}も利用可能である。
【0144】
検出器の前処理段階は、最高相関大きさピーク(highest correlation magnitude peaks)に基づいて、通常は約64本である複数の候補線を探索する。この数から、4本の直線の全ての組み合わせが精査される。可能な組み合わせの数は、64!/(60!4!)=635376である。4本の直線の角度の中に、少なくとも15°の差を有していない直線が存在する場合、その組み合わせは放棄され、次の段階に進まない。直線の1つの組み合わせがこの段階をパスしたと仮定すると、その後、式(19)を用いて6つの交点が計算され、4組の線分比R^nが評価される。線分比R^nは、この後、サイズが大きくなる順に配列される。次に、予測線比(expected line ratios)(同様に、サイズが大きくなる順に配列される)に対する当てはめの近接度(closeness)に関するメリット関数(merit function)が次のように評価される。
【0145】
【数42】
【0146】
ある閾値(好ましくは0.1)以下のメリット関数を有する全ての組み合わせは、その後の処理に際して、「候補組み合わせ(candidate combinations)」としてラベル付けされる。
【0147】
尚、他のメリット関数も使用可能である。例えば、線強度(line strength)(線相関大きさ(line correlation magnitude)に関する)を反映し、それにより検出レベルが劣る線からの寄与を減少するために、上記のメリット関数を重み付けすることも可能である。
【0148】
次に、候補組み合わせごとに、以下の処理が実行される。
【0149】
ステップ240において、プロセッサは、アフィン歪前とアフィン歪後の各直線nの対応性を一意に識別する。好ましい実現形態においては、歪後の線の長さ比R^nは歪前の長さ比R^nと整合され、式(15)に関連して説明されたように、アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために使用される。
【0150】
アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために使用されてもよい別の技術は、各直線を埋め込むためにそれぞれ異なるパラメータを有する基底関数を使用する方法である。そのような実現形態においては、基底関数ごとにステップ220及び230が繰り返される。
【0151】
次のステップ250においては、プロセッサ105は、式(20)を使用して交点 (x^km,y^km)を計算する。最後に、ステップ260において、式(21)〜(32)に関連して先に説明されたLSFを用いて、アフィン歪パラメータ{a11, a12, a21, a22, x0, y0}が推定される。
【0152】
最終的なアフィン歪パラメータは、全ての候補組み合わせに対して最低の最小誤差エネルギー(lowest minimum error energy) E(式(21))を生成するパラメータになるように選択される。
【0153】
アフィン歪パラメータ{a11, a12, a21, a22, x0, y0}が推定されたならば、アフィン歪は反転されてもよく、これは矯正(rectification)又はレジストレーション(registration)と呼ばれることもある。
【0154】
アフィン歪が反転された後、相関処理を経て擬似ランダムノイズ(pseudo random noise)(PRN)シーケンスの検出などの従来の方法を使用して、ステップ330(図4)においてパターンを追加する以前に画像中に存在していた補助パターンと名付けられた追加パターンが検出されてもよい。そのような処理は、スペクトル拡散電子透かし(spread-spectrum watermarking)としても知られており、幾何学歪(geometric distortion)に対して極めて高い感度を示すことで知られている。通常、数パーセントのスケールの変化でも相関を実質的に破壊するのに十分であり、そのため、わずかにひずんだ画像の中のPRNを検出することは不可能である。
【0155】
しかし、画像の歪を除去し、整列する処理は、補間及び再サンプリングを含み、これらの処理は、通常、計算のために高いコストを必要とする。従って、補助パターンを検出するときに相補歪を含む検出テンプレートを使用することにより、画像を矯正するのを回避することが提案される。
【0156】
この方式の大きな利点は、テンプレートをフーリエドメインで定義できることである。空間ドメインにおけるアフィン歪は、平行移動歪に関連する線形位相係数(linear phase factors)と共に、フーリエドメインにおける対応するアフィン歪をもたらす。フーリエアフィン対応性(Fourier affine correspondence)は、文献に十分詳細に記載されている。本質的には、式(2)のフーリエバージョンがテンプレートに適用される。連続フーリエ変換を次のように定義し、離散的にサンプリングされた画像並びに離散フーリエ変換(DFT)に厳密に対応する関係が適応されることに注意すると、その更に効率のよい実現形態である高速フーリエ変換(FFT)は、次のようになる。
【0157】
【数43】
【0158】
歪テンプレート関数のフーリエ変換は、次の通りである。
【0159】
【数44】
【0160】
フーリエドメインにおける式(2)のアフィン歪は、次の式により表される。
【0161】
【数45】
【0162】
ここで、式中、係数κは実正規化定数(real normalization constant)及び線形位相係数(linear phase factor)を含むが、歪フーリエテンプレート(distorted Fourier template)J(u〜,v〜)には影響を及ぼさないので、歪フーリエテンプレートJ(u〜,v〜)は相関検出のフーリエドメインにおける実現形態で直接使用される。従って、フーリエテンプレート(Fourier template)J(u〜,v〜)が確定的な解析関数記述子(analytic functional descriptor)により定義されるのであれば、補間(interpolation)又は再サンプリング(resampling)の必要なく、いくつかのテンプレートj(x, y)は、式(45)を使用して歪を受けてもよい。テンプレート整合前(template matching)に、フーリエ座標u及びvのみが歪を受けるだけでよい。
【0163】
例えば、URL又はURLに対するポインタを使用して、何らかのデータ又はそのデータに対するポインタを符号化するために、補助パターンが使用されてもよい。また、画像からアフィン歪のパラメータを検出する方法200を使用すると、その画像の何らかの特性に関するデータ又は特性を参照するデータであるいわゆる画像メタデータは、画像がひずんでいたとしても、画像からメタデータを検索できるという意味で画像に拘束されることになる。メタデータが対抗できる歪は上述の射影変換を含むが、印刷、写真複写/複写、走査、色除去、ガンマ修正(gamma correction)、ガンマ変更(gamma change)、JPEG圧縮/一般圧縮(general compression)、フォーマット変換(すなわち、BMPからGIFへ)、ノイズ追加及びノイズ除去(noise addition and removal)、低域フィルタリング(low-pass filtering)などのフィルタリング、クロッピング(cropping)及び画像の基本認識可能度(basic recognizability)を維持するほぼ全ての編集操作(editing operations)を更に含む。
【0164】
いくつかの適用用途においては、直線を知覚不可能なように埋め込む必要がない。また、エングレービング(engraving)又はエッチング(etching)により任意の平坦な面に直線が埋め込まれてもよい。そのような平坦な面はシリコンウェハを含む。その場合、歪後の直線は、光学系(カメラなど)、電磁システム又は近接度に基づくシステムであってもよい何らかのシステムにより検出されてもよい。その後、検出された直線は、表面の位置及び向きを判定するために利用されてもよい。
【0165】
以上、N本の直線を埋め込むことに基づく実施形態を説明した。画像中の特徴と関連して複数本の直線を含む画像に対して、方法200の改訂バージョンが適用されてもよい。そのような固有の直線に対して、可能な4本1組の直線の各組について4つの交差比(intersection ratios)を事前に制約することは不可能である。しかし、第1の画像における現存の直線比を第2の画像における現存の直線比と比較することは可能である。4つ1組の整合比(matching ratios)(任意の規定許容差範囲内)の各組について、方法200のステップ240〜260を使用して対応するアフィン変換が計算される。その後、整合比の組ごとに、ステップ240〜260は繰り返される。対応するアフィン変換が一貫している(すなわち、アフィンパラメータがクラスタリング(clustering)を示す)場合、アフィン変換を経て、それら2つの画像が互いに関連している確率は高い。従って、2つの画像を比較し、第2の画像がアフィン変換を経て第1の画像と関連しているか否かを推定することは可能である。
【0166】
第1の画像I1 (x, y)がアフィン変換又は空間歪(spatial distortion)(x, y)→ (x〜,y〜)により第2の画像I2 (x, y)と関連付けられるものとする。尚、アフィン変換は、式(2)で定義される変換である。第1の画像I1 (x, y)と第2の画像I2 (x, y)との関係は、次のように書き表される。
【0167】
【数46】
【0168】
式中、μは画像輝度増率(image intensity multiplying factor)(又は利得)であり、n(x, y)は第1の画像と第2の画像との差を考慮する関数である。
【0169】
従来の画像整合方法(例えば、相関を使用する)は、より一般的なアフィン歪に対しては容易に実現できないことが知られている。それは、一般に、6次元空間(6つのアフィンパラメータの)の全体にわたる検索が要求されるためである。従って、本発明の開示によれば、第1の画像I1 (x, y)と第2の画像I2 (x, y)とを比較するための更に有効な方法は、それらの画像自体の中で自然に発生する線構造(line structures)の交差比を比較するという方法である。多くの画像は、まっすぐな縁部(straight edges)などのいくつかの線構造又は部分線構造を含む。そのような線構造は、例えば、画素輝度の勾配の係数を使用することにより強調されるのが好ましい。ラプラシアン(Laplacian)などの他の演算子が使用されてもよい。
【0170】
図10は、第2の画像I2 (x, y)が第1の画像I1 (x, y)のアフィン歪バージョンであるか否かを推定する方法400の概略的なフローチャートを示す。方法400も、図5に示される汎用コンピュータシステム100を使用して実施されるのが好ましく、その場合、方法400のステップは、コンピュータシステム100の内部で実行されるソフトウェアとして実現される。
【0171】
方法400はステップ402で始まる。ステップ402において、方法200のステップ210に関連して先に説明されたように、画像I1 (x, y)及びI2 (x, y)の各々に対してラドン変換などの射影変換が適用される。
【0172】
実際には、ラドン変換後のエンハンスメントが好ましいことが明らかになっている。従って、続くステップ404において、勾配エンハンスメント(gradient enhancement)が実行され、その結果、画像ごとの2D-分布関数(2-D distribution function)Ωj (r, θ)が求められる。
【0173】
【数47】
【0174】
ステップ406において、分布関数Ωj(r, θ)の各々でピークが検出される。その目的は、対応する4つ1組の線構造を探索することである。従って、各々の画像I1 (x, y)及びI2 (x, y)の中の32個の最も重要な線構造を表現する各々の分布関数Ωj (r, θ)の中の32個の最高ピークを探索することにより、4本の直線について可能な組み合わせの数は35960通りとなる。
【0175】
次に続くステップ408において、プロセッサ105は、方法200に関連して先に詳細に説明したように、4本の直線の組み合わせごとに4つのピークの(r, θ)値から交差比を計算する。ステップ410において、4つ1組の比の35960通りの組み合わせは、順序付けシーケンス(ordered sequence)として配列される。先の場合と同様に、いずれかの比が1より大きい場合、それは反転される。シーケンスは、値が大きくなる順に順序付けされる。特に、4つ1組の比の全ての組み合わせは、第1の画像I1(x, y)に関して4次元テーブルに配列され、第2の画像I2 (x, y)に関しては別個のテーブルに配列される。
【0176】
次に、ステップ412において、第1の画像I1 (x, y)及び第2の画像I2 (x, y)の比シーケンス(ratio sequences)が比較される。特に、ユークリッド距離(Euclidean distance)又は式(42)に示されるメリット関数(merit function)に基づいて、第1の画像I1 (x, y)のテーブルにおける各順序付けシーケンスと第2の画像I2 (x, y)のテーブル2における各順序付けシーケンスとの対応性が評価される。規定の距離の中の対応性のみが許容される。メリット関数の計算は、計算に関して相当に過酷であり、試される点(points)(シーケンス(sequences))の数の2乗とも関連付けられる。更に効率のよい方式は、4D-比(4-D ratio)テーブルの粗ビンニング(coarse binning)を実行し(例えば、0.2のビン幅(bin widths)は、54=625ビン(bins)を提供する)、単純に、対応するビン又は隣接するビンにおけるシーケンスのメリット関数を評価するという方法である。
【0177】
メリット関数が規定の量より小さい場合、4つ1組の直線は整合すると想定され、その結果、ステップ414において、式(21)〜(32)を使用して、アフィン変換パラメータが交点から計算される。メリット条件を満たす全ての整合シーケンスに対してステップ414が繰り返され、6つのアフィンパラメータが作表(tabulated)される。
【0178】
続くステップ416において、第1の画像I1 (x, y)と第2の画像I2 (x, y)とのアフィン関係の尤度(likelihood)が推定される。例えば、テーブル中のアフィンパラメータエントリの著しく大きなクラスタリング(clustering)が存在する場合、第1の画像I1 (x, y)と第2の画像I2 (x, y)とのアフィン関係又は整合の尤度は高い。クラスタリング統計からアフィン整合の尤度の更に定量的な推定を導き出すことができる。
【0179】
ステップ416において、第1の画像I1 (x, y)と第2の画像I2 (x, y)との整合の尤度が低いと考えられる場合、ステップ417において、例えば画像I1 (x, y)と画像I2 (x, y)との整合は存在しないことをユーザインタフェースに指示することにより、方法400は終了する。しかし、第1の画像I1 (x, y)と第2の画像I2 (x, y)との整合の尤度が高いと考えられる場合には、ステップ418において、第1の画像I1 (x, y)が第2の画像I2 (x, y)と整合するように、第1の画像I1 (x, y)に対して逆アフィン歪(inverse affine distorted)が適用される。
【0180】
最後に、ステップ420において、正規化相関により整合のクオリティ(quality of the match)が判定される。0.9の値は、高レベルの整合を示すであろう。他の尺度(例えば、視覚)は、画像がどれほどよく整合するか及びアフィン歪パラメータがどれほど適切に推定されたかを更に適切に指示できるであろう。
【0181】
以上、本発明のいくつかの実施形態のみを説明したが、本発明の趣旨の範囲から逸脱せずに、上述の実施形態に対して変形及び/又は変形を実施できる。上述の実施形態は単なる例示であり、本発明を限定するものではない。
【0182】
本明細書に関する限り、「具備する(comprising)」という言葉は、「主要な要素として含むが、必ずしも単独に含むのではない」又は「有する(having)」又は「含む(including)」という意味であり、「その要素のみから構成される」という意味ではない。「comprise」及び「comprises」などの「comprising」という言葉の変形は、相応して変更された意味を有するものである。
【図面の簡単な説明】
【0183】
【図1A】画像中に埋め込まれた直線及び直線を定義するパラメータを示す図である。
【図1B】極座標空間において図1Aの直線を定義するパラメータを示す図である。
【図2A】歪前及び歪後の極座標空間における同一の3本の線のパラメータ対を示す図である。
【図2B】歪前及び歪後の極座標空間における同一の3本の線のパラメータ対を示す図である。
【図3】画像からアフィン歪のパラメータを検出する方法を概略的に示すフローチャートである。
【図4】電子透かしを使用して直線を埋め込む方法を概略的に示すフローチャートである。
【図5】説明される構成を実施できる汎用コンピュータを概略的に示すブロック図である。
【図6】線の方向付け角度βnが全角度範囲にわたり一様に分布するように配列された4本の線を示す図である。
【図7】線分の長さ比をパラメータeの関数として示す図である。
【図8】電子透かしとして使用されてもよいパターンの一例を示す図である。
【図9】擬似極座標空間で表された図8に示される例の歪前のパターンの射影を示す図である。
【図10】第2の画像が第1の画像のアフィン歪バージョンであるか否かを推定する方法を概略的に示すフローチャートである。
【技術分野】
【0001】
本発明は、一般に、画像処理に関し、特に、画像間のアフィン関係を推定することに関する。
【背景技術】
【0002】
背景
電子透かしは、情報を知覚不可能に画像中に埋め込むために頻繁に使用される。しかし、一般に使用されている電子透かしの多くは、スケーリング、回転、せん断歪(shearing)、アナモフィックスケーリング(anamorphic scaling)などの歪により破壊される。電子透かし検出方法の中には、平行移動を感知するものさえある。
【0003】
これまで、電子透かしを検出するための様々な方法が提案されてきたが、それらの方法のいくつかは、アフィン歪に対して不変であるといえる。しかし、アフィン歪に対して不変である方法の多くは、いずれかの段階で、アフィン歪を定義するパラメータの空間全体にわたる広範囲の検索を必要とする。そのような検索は、多次元であり、通常、相当に大きな計算容量を消費すると考えられる。
【0004】
最近、まず平行移動を除去し、次にスケーリング及び回転を2つの直交方向の別の平行移動効果とする変換を実行することにより、検索空間を縮小するいくつかの方法が提案されている。それらの方法は、RST(回転、スケール及び平行移動)に対して不変な方法として知られる。通常、この技術は埋め込み手順と検出手順との相補性を必要とする。
【0005】
他の技術は、回転対称などの特殊な対称特性を有するパターンを埋め込み、次に、非対称歪パラメータの広範囲な検索によりそれらのパターンを検出することに依存する。
【0006】
上述の方法はいずれも完全アフィン歪の不変性を有していないため、完全不変性を確保するためには、歪パラメータ空間のうちの1つ以上の広範囲な検索が依然として必要とされる。従って、パラメータ空間の広範囲にわたる検索を必要とせずに、アフィン歪のパラメータを推定する方法が必要とされる。
【発明の開示】
【0007】
概要
本発明の目的は、既存の構成の1つ以上の欠点を克服すること又は少なくとも改善することである。
【0008】
上述の問題に対処する構成が開示される。かかる構成は、画像に埋め込まれた線の交点と画像の歪バージョンに埋め込まれた線の交点との対応性を識別することにより、画像に適用されたアフィン歪のパラメータを推定するものである。
【0009】
本発明の1つの側面によれば、各々が少なくとも4本の互いに平行でない線を有する第1の画像と第2の画像との間のアフィン関係を推定する方法であって、
前記第1の画像中に現れる前記線の第1の組の交点を識別するステップと、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係が存在するか否かを判定するステップとから成り、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にある方法が提供される。
【0010】
本発明の別の側面によれば、補助パターンを有し、少なくとも4本の互いに平行でない線を有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の前記補助パターンを検出する方法であって、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別するステップと、
前記第1の組の交点及び前記第2の組の交点を使用して、前記アフィン歪パラメータを推定するステップと、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用するステップと、
前記第2の画像中の前記歪補助パターンを検出するステップとから成る方法が提供される。
【0011】
本発明の更に別の側面によれば、上記の方法のうちのいずれか1つを実現するための装置が提供される。
【0012】
本発明の別の側面によれば、先に説明された方法のうちのいずれか1つを実現するためのコンピュータプログラムが記録されたコンピュータ可読媒体を含むコンピュータプログラム製品が提供される。
【0013】
本発明の他の面も開示される。
【発明を実施するための最良の形態】
【0014】
添付図面のうちのいずれか1つ以上において、同一の図中符号を有するステップ及び/又は特徴が参照される場合、以下の説明中、特に指示のない限り、それらのステップ及び/又は特徴は同一の機能又は動作を有するものとする。
【0015】
図1Aに一例が示されるような画像中の1本の直線nについて考える。直線nを表現する方法がいくつかあることは、当業者には理解されるであろう。例えば、直線nを表現するために2つの点が使用されてもよい。また、直線nは、画像に埋め込まれてもよく、あるいは画像中の1つ以上の特徴と関連付けられてもよい。
【0016】
直線nは、デカルト座標の縦軸(Y軸)に対して角度βnをなし、直線nに対して垂直な方向に、座標の原点から距離rnの位置にある。直線nは、1対のパラメータ{rn, βn}により一意に記述される。図1Bは、極座標空間において直線nを定義するパラメータ対{rn, βn}を示す。
【0017】
再び図1Aを参照すると、直線n上の1点(x, y)及び直線nに沿った距離λnは、標準形式で次のように表されてもよい。
【0018】
【数1】
【0019】
ここで、直線nを含む画像に適用される一般的なアフィン歪を考える。アフィン歪は、回転、スケーリング、せん断歪、鏡映、平行移動及びアナモフィックスケーリングのうちの1つ以上を含んでもよい。アフィン歪後の当初の点(x, y)の画像中の変換座標を(x〜, y〜)とすると、点(x〜, y〜)は次のように表される。
【0020】
【数2】
【0021】
式中、aijは、回転、スケーリング、せん断歪、鏡映及びアナモフィックスケーリングを定義するパラメータであり、(x0, y0)は、平行移動を定義する。ここで、以下のように仮定する。
【0022】
【数2−2】
【0023】
更に、以下に示す場合は、鏡映が起こったことを示す。
【0024】
【数2−3】
【0025】
パラメータaijにより適用される総歪(total distortion)は、次のように、基本歪(prime distortions)、すなわち回転、アナモフィックスケーリング(anamorphic scaling)及びせん断歪の組み合わせに分解されてもよい。
【0026】
【数3】
【0027】
式中、角度ωの回転は、以下の行列により表される。
【0028】
【数4】
【0029】
X軸及びY軸に沿ったアナモフィックスケーリングは、アスペクト比変化(aspect ratio change)と呼ばれる場合もあり、次の形式を有する。
【0030】
【数5】
【0031】
x方向のせん断歪は、次の形式を有する。
【0032】
【数6】
【0033】
また、|ω|≦45°であるように、回転歪を正しい象限に配置するために適用される転位(transposition)は、次の4つのオプションのうちの1つから選択される。
【0034】
【数7】
【0035】
アフィン歪は、アフィン歪中、どの直線も線の平行性(parallelism of lines)と共に保持されるが、長さ及び角度は変化するという特性を有する。従って、画像中の直線nは変形後の画像中の直線に変換されるが、変形後の画像中の直線はパラメータ対{r〜n,β〜n}により定義される。このパラメータ対{r〜n,β〜n}は、通常、アフィン歪前の直線nのパラメータ対{rn,βn}とは異なる。
【0036】
略語cn=cosβn、sn=sinβnを使用すると、式(1)及び(2)から次の関係が成り立つ。
【0037】
【数8】
【0038】
及び
【0039】
【数9】
【0040】
アフィン歪(affine distortion)を定義する6つの未知のパラメータ{a11, a12, a21, a22, x0, y0}を含む式(8)及び(9)によって、各直線nがパラメータ対{rn, βn}により定義される3本の直線を画像中に含め、アフィン歪画像(affine distorted image)中の3本の直線を検出し、アフィン歪直線(affine distorted line)ごとにパラメータ対{r〜n,β〜n}を判定し、式(8)及び(9)を解くことにより、パラメータ{a11, a12, a21, a22, x0, y0}が計算されてもよい。鏡映(reflection)を識別するために、直線を画像中に配置するとき、左右の非対称も要求される。
【0041】
しかし、式(8)及び(9)から、直線にアフィン歪が適用される場合、一般に、パラメータ対{r〜n,β〜n}はかなり複雑で曖昧な方式で変換されることがわかる。この曖昧さは、直線nと平行な方向の平行移動又はスケーリングが、パラメータ対{rn,βn}に全く影響を及ぼさないために起こる。
【0042】
また、アフィン歪前の画像中の直線nに対応する歪後の直線を識別することも明らかではない。これを例示するために、図2Aは歪前の極座標空間における3本の線のパラメータ対{rn,βn}を示し、図2Bは歪後の同一の3本の線のパラメータ対{r〜n,β〜n}を示す。歪前と歪後のパラメータ対{rn,βn}及び{r〜n,β〜n}の対応性は、曖昧になり、その結果、縮退や、不確かさを招く可能性がある。
【0043】
アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために、いくつかの技術が使用されてもよい。1つの技術は複数の線を埋め込む。この場合、線自体が一意性を有し、線の一意性はアフィン歪により破壊されない。例えば、各直線を一意に識別するために、それぞれ異なる型、色などを有する線が使用されてもよい。
【0044】
アフィン歪の別の有用な特性は、1本の直線の2つの線分の比がアフィン歪に関して不変であるということである。好ましい実現形態においては、アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために使用されるのがこの特性である。
【0045】
1つの画像の中にN本の直線があると考えると、各直線は、先の場合と同様に、パラメータ対{rn, βn}、n=1→により一意に記述され、n≠mであるとき、角度はβn≠βmである。従って、それらの直線は互いに平行ではない。
【0046】
直線は互いに平行ではないので、各直線はその長さに沿って他の直線と互いに交差する。N本の(互いに平行でない)直線の交点の最大数は、三角数N(N-1)/2である。直線mが直線kと交差する点(xkm, ykm)は、次のように表される。
【0047】
【数10】
【0048】
式中、λkmは、直線mが交差する直線kに沿った距離である。同様に、距離λmkは、直線kが交差する直線mに沿った距離である。
【0049】
式(10)の連立方程式を解くと、距離λkmは次の式により表される。
【0050】
【数11】
【0051】
直線の本数N=4である場合を考える。各直線kは、他の3本の直線mとの間に3つの交点(xkm, ykm)を有するであろう。この段階で、直線kに沿ったそれぞれの交点(xkm, ykm)までの距離λkmを、大きさに従って次のように順序付けると有用である。
【0052】
【数12】
【0053】
線分の長さξk1及びξk2を次のように定義すると、
【0054】
【数13】
【0055】
及び
【0056】
【数14】
【0057】
直線kの長さ比Rkは次のように定義される。
【0058】
【数15】
【0059】
直線のパラメータ対{rn, βn}を適切に選択すると、各直線kの比Rkは、他のどの直線mの長さ比とも明確に異なる。比Rkは、アフィン歪に関して不変であるため、アフィン歪前とアフィン歪後の各直線の対応性を一意に判定できる。
【0060】
対応する直線が識別されたならば、直線kにより表現される各方向に沿ったスケーリング係数を推定するために、アフィン歪前とアフィン歪後の異なる直線に沿った距離λkmが比較されてもよい。また、アフィン歪の回転成分を推定するために、各直線の向きの変化が使用されてもよい。
【0061】
式(4)及び(5)にそれぞれ定義されるように、当初の画像に回転が適用され、続いてアナモフィックスケーリング(anamorphic scaling)が適用された特定のケースを考える。アナモフィックスケーリングは、水平デカルト座標軸(X軸)と平行な方向に係数Aのスケーリングを有し、それに対して垂直な方向に係数Bのスケーリングを有する。角度ωは回転角である。一般に、角度βnにおける長さlnの線分は、角度β〜nで長さl〜nの線分にマッピングされる。このとき、
【0062】
【数16】
【0063】
【数17】
【0064】
式(16)及び(17)は、3つの未知数、すなわち、スケーリング係数A及びB並びに角度ωを含む。当初の画像に4本の線が埋め込まれているので、次のように、長さlnとして、各直線の外側の交点の距離を使用すると、
【0065】
【数18】
【0066】
4対の式が得られる。最小2乗方法を用いて、このような過剰制約付き系(over-constrained system)を解くことができる。
【0067】
尚、式(16)及び(17)は、平行移動に対して不変であり、平行移動(x0, y0)を想定しない。また、計算されるべき式(2)で定義される一般アフィン歪の全てのパラメータに対して、式(4)及び(5)の行列は式(3)におけるように組み合わされるが、せん断歪係数Rは0である。
【0068】
あるいは、アフィン歪前とアフィン歪後の各直線の対応性から、パラメータ対{rn, βn}及び{r〜n, β〜n}の対応性が一意に判定される。式(10)に式(11)を代入すると、交点(xkm, ykm)は、次のように表される。
【0069】
【数19】
【0070】
直線は互いに平行ではないので、sin(βk-βm)≠0である。実際の状況においては、sin2 (β〜k-β〜m)≧0.25が成立するように、それぞれの角度βk及びβmが選択される。これと同等に、直線k及びmが交差する角度は、30°<|β〜k-β〜m|<150°を満たす。
【0071】
同様に、交点(xkm, ykm)に対応する変換後の点(x〜km, y〜km)は、次の式により表される。
【0072】
【数20】
【0073】
式(19)及び(20)にパラメータ対{rn, βn}及び{r〜n,β〜n}を代入し、対応する交点(xkm, ykm)及び(x〜km, y〜km)を使用して式(2)を解くと、アフィン歪パラメータ{a11, a12, a21, a22, x0, y0}が得られる。
【0074】
アフィンパラメータ推定の好ましい方法は、直線の交点(xkm, ykm)とアフィン歪後の交点(x〜km, y〜km)との最小2乗フィッティング(least squares fitting)(LSF)を使用する。交点(xkm, ykm)及び(x〜km, y〜km)の対応関係は既知であるため、このLSFは大幅に簡略化される。交点(xkm, ykm)及び(x〜km, y〜km)の対応関係が一意に識別されなければ、可能な全ての順列、この場合には、6!=720について、LSFを評価する必要がある。
【0075】
検出され、(一意に)順序付けされた交点を(x^km, y^km)により表すものとする。先の場合と同様に、当初の(歪前の)交点は(xkm, ykm)であり、歪後の交点は(x〜km, y〜km)である。誤差エネルギー(error energy)は、ユークリッドノルム尺度(Euclidean norm measure) Eとして定義される。
【0076】
【数21】
【0077】
変換パラメータpに関する誤差エネルギー最小化(Error energy minimization) により、6つの式が得られる。
【0078】
【数22】
【0079】
変換パラメータpは、変換を定義するパラメータa11、a12、a21、a22、x0及びy0(式(2))のうちの1つである。
【0080】
幸いなことに、p=aijに関する偏導関数のために、式(22)において表される6つの式は大幅に簡略化される。
【0081】
【数23】
【0082】
そこで、式(22)において表される6つの式は、以下の加算を整合することと同等である。
【0083】
【数24】
【0084】
式(22)及び(23)からの全変換パラメータ(full transform parameters)を埋めることにより、同一の対称行列乗数(same symmetric matrix multiplier) Mを有する1対の3×3行列式が得られる。
【0085】
【数25】
【0086】
【数26】
【0087】
【数27】
【0088】
行列Mの逆行列は、別の対称行列M-1である。
【0089】
【数28】
【0090】
【数29】
【0091】
式(25)及び(26)を反転すると、6つの歪パラメータ全ての最小2乗推定(least squares estimate)のための最終解は次のように明示される。
【0092】
【数30】
【0093】
【数31】
【0094】
最小誤差エネルギー(minimum error energy) Eは、式(21)を用いて計算されてもよく、許容限界(allowable limit)と比較されてもよい。誤差エネルギーEが許容限界より大きい場合、アフィン整合(affine match)が探索されなかったと想定される。交点(xkm, ykm)及び(x〜km, y〜km)を比較することにより、最大点偏差(maximum point deviations)を計算することも可能であり、これは推定される歪の信頼性尺度(reliability measure)を確定する上で有用である。特に信頼性推定に関して有用な別のパラメータは、正規化エネルギー(normalized energy)、すなわち、任意の点の集合n=1→Mに対して次のように定義される中心平均2乗点分布(centred mean square point distribution) Gにより誤差エネルギーE(error energy)を除算した値である。すなわち、
【0095】
【数32】
【0096】
式中、測定された点分布の重心(centroid)は、(x^ ̄n,y^ ̄n)として定義される。
【0097】
図3は、少なくとも4本の互いに平行でない直線を含む画像からアフィン歪のパラメータを検出する方法200の概略的なフローチャートを示す。一実施形態においては、互いに平行でない直線は、それらの直線が人間の目に見えないように画像中に埋め込まれる。図4は、電子透かしを使用して直線を埋め込む方法300の概略的なフローチャートを示す。
【0098】
方法200及び300は、図5に示されるような汎用コンピュータシステム100を使用して実施されるのが好ましい。その場合、方法200及び300のステップは、コンピュータシステム100内部で実行するソフトウェアとして実現される。特に、方法200及び300のステップは、コンピュータシステム100により実行されるソフトウェア中の命令により実現される。ソフトウェアは、例えば、以下に説明される記憶装置を含むコンピュータ可読媒体に格納されてもよい。ソフトウェアは、コンピュータ可読媒体からコンピュータにロードされ、コンピュータシステム100により実行される。そのようなソフトウェア又はコンピュータプログラムが記録されたコンピュータ可読媒体は、コンピュータプログラム製品である。
【0099】
コンピュータシステム100は、コンピュータモジュール101と、キーボード102、マウス103及び撮像装置(imaging device)122などの入力装置と、プリンタ115及び表示装置114を含む出力装置とにより形成される。撮像装置122は、デジタル画像を収集するために使用されるスキャナ又はデジタルカメラであってもよい。変復調器(モデム)トランシーバ装置116は、例えば、電話回線121又は他の機能媒体を介して接続可能な通信ネットワーク120との間で通信を実行するために、コンピュータモジュール101により使用される。
【0100】
通常、コンピュータモジュール101は、少なくとも1つのプロセッサユニット105と、例えば、半導体ランダムアクセスメモリ(RAM)及び読み取り専用メモリ(ROM)から形成されるメモリユニット106とを含む。モジュール101は、ビデオ表示装置114に結合するビデオインタフェース107、キーボード102、マウス103及び撮像装置122に対応する入出力(I/O)インタフェース113並びにモデム116及びプリンタ115に対応するインタフェース108を含む複数のI/Oインタフェースを更に含む。記憶装置109が設けられ、通常、記憶装置109は、ハードディスクドライブ110及びフロッピー(登録商標)ディスクドライブ111を含む。CD‐ROMドライブ112は、通常、不揮発性データ源として設けられる。通常、コンピュータモジュール101の構成要素105〜113は、当業者には周知の従来のコンピュータシステム100の動作モードが得られるように相互接続バス104を介して通信する。
【0101】
通常、ソフトウェアは、ハードディスクドライブ110に常駐し、プロセッサ105により読み取られ、ソフトウェアの実行はプロセッサ105により制御される。場合によっては、ソフトウェアは、CD‐ROM又はフロッピー(登録商標)ディスクに符号化された形でユーザに供給され、対応するドライブ112又は111により読み取られてもよく、あるいはユーザによりネットワーク120からモデム装置116を介して読み取られてもよい。更に、他のコンピュータ可読媒体からコンピュータシステム100へソフトウェアをロードすることも可能である。
【0102】
少なくとも4本の互いに平行でない直線を含む画像からアフィン歪のパラメータを検出する方法200及び電子透かしを使用して直線を埋め込む方法300は、上述のようなソフトウェアではなく、方法の機能又は部分機能を実行する1つ以上の集積回路などの専用ハードウェアにおいて実現されてもよい。そのような専用ハードウェアは、グラフィックプロセッサ、デジタルシグナルプロセッサ又は1つ以上のマイクロプロセッサ及び関連メモリを含んでも良い。
【0103】
まず図4を参照すると、パラメータ対{rn, βn}により各直線nが定義されるような複数の直線を電子透かしを使用して埋め込む方法300はステップ310で始まり、ステップ310においては、各直線nと関連するパターンが生成される。
【0104】
埋め込まれるべき直線のパラメータ対{rn,βn}を選択する場合、1つのオプションは、全角度範囲にわたり一様に分布する角度βn、すなわち、0°、45°、90°、135°を有する4本の直線を選択することである。図6は、そのように配列された4本の直線を示す。
【0105】
4本の直線のいくつかの配列は、極めて対称性の高い結果をもたらす。図示される配列はそれほど対称ではない。この配列は、配列の鏡映歪バージョン(reflected and distorted version)と明確に識別できる6つの交点(xkm, ykm)を含む。3本以上の線が1点で出会う縮退配列(degenerate arrangement)においては、交点は6つより少なくなることも可能であるが、ここではそのようなケースを考慮しない。
【0106】
図6には、別のパラメータeに基づいて、線分600の長さpに関連して定義されたn=1〜4に対する線分の長さξn1及びξn2も示される。パラメータeの関数として式(15)で定義される線分の長さ比Rnは、式(18)で定義される線分の長さlnと共に、表1に示されるように計算される。
【0107】
【表1】
【0108】
図7は、線分の長さ比Rnをパラメータeの関数として表す。特定の値e≒0.31により、全く異なる4つの別個の長さ比Rnが求められることが図7からわかる。別の興味深い有用な長さ比Rnの集合は、e=0.5に対して現れる。この場合、4本の直線の全てが中心の基準点から等距離にある。それらの等距離がアフィン歪により均等に変換されない可能性があるため、第7の点はせん断歪又はアナモフィックスケーリングに対して真の不変性を維持しない点であるが、本質的には第7の点を定義できる。
【0109】
好ましい実施形態(e=0.31)においては、4本の直線は次のようなパラメータを伴って埋め込まれる。
【0110】
【数33】
【0111】
式中、pは画像幅に設定される。尚、rnに対応する角度βnが180°回転されるのであれば、負の値であるrnはそれを相補する正の値と等価である。
【0112】
好ましい方向付け角度βnを選択することにより、いずれか1本の直線nと画像境界(image boundaries)との一致は最大限に回避される。
【0113】
直線が電子透かしとして埋め込まれる場合、各電子透かしは、電子透かしが埋め込まれている画像がアフィン歪を受けた後であっても検出可能であるという特性を有していなければならない。好ましい実施形態によれば、各パターンは一方向にのみの変化を有し、その方向は直線nに対して垂直である。パターンは軸を更に有し、その軸は線と一致する(奇数又は偶数)対称の軸又は指定された軸であってもよい。通常、パターンは、変化の方向に適用される1次元基底関数(one-dimensional base function)から生成され、軸と平行に繰り返される。
【0114】
好ましい実施形態においては、基底関数は下記の形態の複素同次関数(complex homogeneous function)である。
【0115】
【数34】
【0116】
式中、vは1次元座標であり、必ずしも正ではない。α及びpは定数である。基底関数g(v)は、基底関数がパターン画像のナイキスト周波数(Nyquist frequency)を超える周波数を有する領域において減衰されるのが好ましい。式(34)は、位相関数(phase function)を振幅変調(amplitude modulating)する振幅関数(amplitude function)としても考えられ、その場合、位相関数は対数位相(logarithmic phase)を有する。そのような複素同次関数g(v)が、例えば係数aによってスケーリングされる場合、スケーリングは次のような複素定数係数(complex constant factor)のみを導入する。
【0117】
【数35】
【0118】
複素同次関数の利点は、複素同次関数の自己相関(auto-correlation)が複素同次関数のスケールバージョン(scaled version)を伴う複素同次関数の相互相関(cross-correlation)に正比例することである。この「スケール不変(scale-invariant)」特性は、スケール変換後であっても、画像を基底関数と相関することにより画像中の電子透かしの検出を可能にする。
【0119】
図8は、式(34)の基底関数の実数部を使用して次のように生成されるパターンの一例を示す。
【0120】
【数36】
【0121】
尚、パターン画像のナイキスト周波数を超える周波数を有する値を除去するために、対称軸に隣接する領域において、マスキングが適用されている。パターンとそのパターンに埋め込まれた直線との関係も示される。直線自体はパターンの一部を形成せず、次のステップにおいては画像に追加されないことが理解される。この例のパターンを示すに際して、パターン値は[0,255]の範囲の値にマッピングされており、0の値は黒色として表現され、255の値は白色として表現される。
【0122】
再び図4を参照すると、ステップ310においては、1つのパターン画像を形成するために、複数の別個のパターンが加算される。パターン画像は、生成後にメモリ106又はHDD110に格納されてもよい。
【0123】
観測者が知覚不可能なパターンを埋め込むために、ステップ320において、メモリ106からパターン画像が検索され、低輝度変化(low intensity variation)を有する画像の領域に対応するパターンのレベルを大幅に減少し、且つ高輝度変化(high intensity variation)を有する画像の領域に対応するパターンのレベルをそれより少ない量だけ減少するために、パターン画像はプロセッサ105により知覚マスキングされる。輝度変化の尺度の一例は、画像中の輝度の局所勾配の大きさである。他の尺度には、輝度の偏導関数、「エネルギー」又は周波数コンテンツの局所推定値(local estimates)、局所分散(local variance)及び更に精巧な人間の視覚系統のマスキングの推定値などがある。
【0124】
ステップ330において、知覚マスキングされたパターン画像が画像に追加される。このパターン画像は電子透かしと呼ばれてもよい。画像がカラー画像である場合、電子透かしはカラー画像の輝度部分に追加されるのが好ましい。これにより、電子透かし入り画像がカラーからグレイスケール表現に変換されるときに電子透かしは残存できる。あるいは、電子透かしは、カラー画像のR、G、B、H、V、S、u、vなどのチャネルのうちの1つ以上又はそれらのチャネルの何らかの組み合わせに追加されてもよい。画像への電子透かしの追加は、単純な代数加算の他にディザリング及びハーフトーン化を更に含む。複素基底関数の実数部及び虚数部が、カラー画像の2つ以上のチャネルに独立して追加されてもよい。
【0125】
電子透かしが埋め込まれた画像は、tiff、gif、jpeg、mpegなどのデジタル画像フォーマットで記憶装置109(図5)に格納されてもよい。電子透かし入り画像のハードコピーを作成するために、電子透かし入り画像はプリンタ115(図5)で印刷されてもよく、あるいはネットワーク120を使用して別のコンピュータモジュール101へ通信されてもよい。
【0126】
画像中に直線が埋め込まれ、画像がアフィン歪を受けているため、直線及びそのパラメータ対{r〜n,β〜n}が検出されなければならない。図4を参照して説明したように、電子透かしを使用して直線が埋め込まれているので、次に図3を参照して、画像からアフィン歪のパラメータを検出する方法200を説明する。方法200はステップ202で始まり、ステップ202において、歪画像のデジタルコピーが獲得される。通常、画像は既にデジタル画像フォーマットになっており、記憶装置109(図5)に格納されてもよい。そのような場合、画像は画素値のアレイに変換される。その時点で画像が写真などのハードコピーフォーマットのままである場合には、まず、撮像装置122(図5)を使用してハードコピーを走査することにより、ハードピー画像はデジタルフォーマットに変換される。
【0127】
続くステップ205において、プロセッサ105は、まず、画像から知覚マスクを形成し、次に、画像の値を知覚マスクの対応する値で除算することにより画像を知覚マスクで強調し、知覚マスキングを解消する。尚、近似知覚マスクが適切である。
【0128】
次に、ステップ210において、得られた画像に射影変換(projective transform)が適用される。射影変換は、画像中の直線に沿って値を加算することによりエネルギーを累積する。ラドン(Radon)(又は等価のHough)変換は、ステップ210において使用されてよい射影変換の1つであり、次のように定義される。
【0129】
【数37】
【0130】
離散型データセットに対してラドン変換(Radon transform)の実施形態を導き出すために、画像関数h(x, y)の射影(projection)とその関数のフーリエ変換のスライスとの対応性が使用されるが、その対応性は、「射影‐スライス定理(projection-slice theorem)として知られる。
【0131】
射影‐スライス定理は、2次元関数の射影の1次元フーリエ変換がその関数の2次元フーリエ変換の半径方向のスライス(radial slice)に等しいと規定する。尚、
【0132】
【数38】
【0133】
であり、式中、H(u, v)は画像h(x, y)の2次元(2D)フーリエ変換である。擬似極座標空間(quasi polar space)において、角度は範囲(-π/2, π/2)であり、距離は範囲(-∞, ∞)にある。フーリエドメイン(Fourier domain)において擬似極座標(quasi-polar coordinate)(q,φ)を定義することにより、座標変換は、u=qcosφ、v=qsinφであり、射影‐スライス定理の1つの形態は、次のように、ラドン射影角(Radon projection angle) φ=θに対応するフーリエ極座標角(Fourier polar angle)について求められる。
【0134】
【数39】
【0135】
式(39)により離散的画像の2D‐FFTの半径方向のスライスとしてラドン射影の(フーリエ変換の)推定が可能になるため、式(39)は有用である。これは、まず、2D-FFTを実行し、続いて、再サンプリング(resampling)を実行するためにbicubic又はchirp-zなどの適切な補間を使用してデカルト座標から極座標への再マッピング(remapping)を実行することにより、離散的ラドン変換(discrete Radon transform)を評価できることを示唆する。
【0136】
方向付け角度(orientation angle)β〜n及び垂直変位(perpendicular displacement) r〜nを有する1次元基底関数g(v)に基づいてN個のパターンが埋め込まれている画像h(x, y)は、画像自体の画素値を無視すると、次のように書き表される。
【0137】
【数40】
【0138】
方向付け角度(orientation angle)β〜nにある1つの方向にのみ変化を有するパターンに射影変換が適用された場合、角度θが角度θの他の全ての値と比較される方向付け角度β〜nに等しいときに、射影の値は著しく大きくなる。図9は、図8に示される歪前のパターンの例の射影を擬似極座標空間(quasi-polar space)において示す図である。角度θが角度βnと等しいとき、射影の値は特に大きくなることがわかる。射影は、オフセット距離rnに関して対称性を更に有する。
【0139】
従って、式(40)の関数に対してラドン変換(Radon transforms)を適用することにより、以下に示されるような関数のラドン変換はθ=β〜nである線に制約されることがわかる。
【0140】
【数41】
【0141】
ラドン変換を用いることにより、パターンg(v)が埋め込まれた画像関数(image function)h(x, y)を擬似極座標空間内のN本の直線に集中したので、極座標角(polar angle) θの全ての値に対して1-D擬似半径方向相関(1-D quasi-radial correlations)(座標rにおける)を用いることにより、更に、各直線に含まれるエネルギーを単一の点(又は1つの点の付近の狭い領域)に集中することが可能である。
【0142】
従って、続くステップ220において、プロセッサ105は、極座標角θの可能な全ての値に対して、擬似半径方向座標(quasi-radial coordinate)rにおける射影(projection)と基底関数(base function)g(v)との1-D相関(1-D correlations)を実行する。用語「相関(correlation)」は、位相相関(phase correlation)及びエネルギーによりスケーリングされた位相相関を更に含む。その結果得られる相関は、擬似極座標(r^n,β^n)にピークを有する。
【0143】
ステップ230において、プロセッサ105は相関の絶対ピーク(absolute
peaks)を探索する。各歪埋め込みパターンの方向付け角度(orientation angle)β〜n及び垂直変位(perpendicular displacement)r^nは、ピークの擬似極座標(r^n,β^n)から直接求められる。また、埋め込み直線のパラメータ対{rn, βn}も利用可能である。
【0144】
検出器の前処理段階は、最高相関大きさピーク(highest correlation magnitude peaks)に基づいて、通常は約64本である複数の候補線を探索する。この数から、4本の直線の全ての組み合わせが精査される。可能な組み合わせの数は、64!/(60!4!)=635376である。4本の直線の角度の中に、少なくとも15°の差を有していない直線が存在する場合、その組み合わせは放棄され、次の段階に進まない。直線の1つの組み合わせがこの段階をパスしたと仮定すると、その後、式(19)を用いて6つの交点が計算され、4組の線分比R^nが評価される。線分比R^nは、この後、サイズが大きくなる順に配列される。次に、予測線比(expected line ratios)(同様に、サイズが大きくなる順に配列される)に対する当てはめの近接度(closeness)に関するメリット関数(merit function)が次のように評価される。
【0145】
【数42】
【0146】
ある閾値(好ましくは0.1)以下のメリット関数を有する全ての組み合わせは、その後の処理に際して、「候補組み合わせ(candidate combinations)」としてラベル付けされる。
【0147】
尚、他のメリット関数も使用可能である。例えば、線強度(line strength)(線相関大きさ(line correlation magnitude)に関する)を反映し、それにより検出レベルが劣る線からの寄与を減少するために、上記のメリット関数を重み付けすることも可能である。
【0148】
次に、候補組み合わせごとに、以下の処理が実行される。
【0149】
ステップ240において、プロセッサは、アフィン歪前とアフィン歪後の各直線nの対応性を一意に識別する。好ましい実現形態においては、歪後の線の長さ比R^nは歪前の長さ比R^nと整合され、式(15)に関連して説明されたように、アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために使用される。
【0150】
アフィン歪前とアフィン歪後の各直線の対応性を一意に識別するために使用されてもよい別の技術は、各直線を埋め込むためにそれぞれ異なるパラメータを有する基底関数を使用する方法である。そのような実現形態においては、基底関数ごとにステップ220及び230が繰り返される。
【0151】
次のステップ250においては、プロセッサ105は、式(20)を使用して交点 (x^km,y^km)を計算する。最後に、ステップ260において、式(21)〜(32)に関連して先に説明されたLSFを用いて、アフィン歪パラメータ{a11, a12, a21, a22, x0, y0}が推定される。
【0152】
最終的なアフィン歪パラメータは、全ての候補組み合わせに対して最低の最小誤差エネルギー(lowest minimum error energy) E(式(21))を生成するパラメータになるように選択される。
【0153】
アフィン歪パラメータ{a11, a12, a21, a22, x0, y0}が推定されたならば、アフィン歪は反転されてもよく、これは矯正(rectification)又はレジストレーション(registration)と呼ばれることもある。
【0154】
アフィン歪が反転された後、相関処理を経て擬似ランダムノイズ(pseudo random noise)(PRN)シーケンスの検出などの従来の方法を使用して、ステップ330(図4)においてパターンを追加する以前に画像中に存在していた補助パターンと名付けられた追加パターンが検出されてもよい。そのような処理は、スペクトル拡散電子透かし(spread-spectrum watermarking)としても知られており、幾何学歪(geometric distortion)に対して極めて高い感度を示すことで知られている。通常、数パーセントのスケールの変化でも相関を実質的に破壊するのに十分であり、そのため、わずかにひずんだ画像の中のPRNを検出することは不可能である。
【0155】
しかし、画像の歪を除去し、整列する処理は、補間及び再サンプリングを含み、これらの処理は、通常、計算のために高いコストを必要とする。従って、補助パターンを検出するときに相補歪を含む検出テンプレートを使用することにより、画像を矯正するのを回避することが提案される。
【0156】
この方式の大きな利点は、テンプレートをフーリエドメインで定義できることである。空間ドメインにおけるアフィン歪は、平行移動歪に関連する線形位相係数(linear phase factors)と共に、フーリエドメインにおける対応するアフィン歪をもたらす。フーリエアフィン対応性(Fourier affine correspondence)は、文献に十分詳細に記載されている。本質的には、式(2)のフーリエバージョンがテンプレートに適用される。連続フーリエ変換を次のように定義し、離散的にサンプリングされた画像並びに離散フーリエ変換(DFT)に厳密に対応する関係が適応されることに注意すると、その更に効率のよい実現形態である高速フーリエ変換(FFT)は、次のようになる。
【0157】
【数43】
【0158】
歪テンプレート関数のフーリエ変換は、次の通りである。
【0159】
【数44】
【0160】
フーリエドメインにおける式(2)のアフィン歪は、次の式により表される。
【0161】
【数45】
【0162】
ここで、式中、係数κは実正規化定数(real normalization constant)及び線形位相係数(linear phase factor)を含むが、歪フーリエテンプレート(distorted Fourier template)J(u〜,v〜)には影響を及ぼさないので、歪フーリエテンプレートJ(u〜,v〜)は相関検出のフーリエドメインにおける実現形態で直接使用される。従って、フーリエテンプレート(Fourier template)J(u〜,v〜)が確定的な解析関数記述子(analytic functional descriptor)により定義されるのであれば、補間(interpolation)又は再サンプリング(resampling)の必要なく、いくつかのテンプレートj(x, y)は、式(45)を使用して歪を受けてもよい。テンプレート整合前(template matching)に、フーリエ座標u及びvのみが歪を受けるだけでよい。
【0163】
例えば、URL又はURLに対するポインタを使用して、何らかのデータ又はそのデータに対するポインタを符号化するために、補助パターンが使用されてもよい。また、画像からアフィン歪のパラメータを検出する方法200を使用すると、その画像の何らかの特性に関するデータ又は特性を参照するデータであるいわゆる画像メタデータは、画像がひずんでいたとしても、画像からメタデータを検索できるという意味で画像に拘束されることになる。メタデータが対抗できる歪は上述の射影変換を含むが、印刷、写真複写/複写、走査、色除去、ガンマ修正(gamma correction)、ガンマ変更(gamma change)、JPEG圧縮/一般圧縮(general compression)、フォーマット変換(すなわち、BMPからGIFへ)、ノイズ追加及びノイズ除去(noise addition and removal)、低域フィルタリング(low-pass filtering)などのフィルタリング、クロッピング(cropping)及び画像の基本認識可能度(basic recognizability)を維持するほぼ全ての編集操作(editing operations)を更に含む。
【0164】
いくつかの適用用途においては、直線を知覚不可能なように埋め込む必要がない。また、エングレービング(engraving)又はエッチング(etching)により任意の平坦な面に直線が埋め込まれてもよい。そのような平坦な面はシリコンウェハを含む。その場合、歪後の直線は、光学系(カメラなど)、電磁システム又は近接度に基づくシステムであってもよい何らかのシステムにより検出されてもよい。その後、検出された直線は、表面の位置及び向きを判定するために利用されてもよい。
【0165】
以上、N本の直線を埋め込むことに基づく実施形態を説明した。画像中の特徴と関連して複数本の直線を含む画像に対して、方法200の改訂バージョンが適用されてもよい。そのような固有の直線に対して、可能な4本1組の直線の各組について4つの交差比(intersection ratios)を事前に制約することは不可能である。しかし、第1の画像における現存の直線比を第2の画像における現存の直線比と比較することは可能である。4つ1組の整合比(matching ratios)(任意の規定許容差範囲内)の各組について、方法200のステップ240〜260を使用して対応するアフィン変換が計算される。その後、整合比の組ごとに、ステップ240〜260は繰り返される。対応するアフィン変換が一貫している(すなわち、アフィンパラメータがクラスタリング(clustering)を示す)場合、アフィン変換を経て、それら2つの画像が互いに関連している確率は高い。従って、2つの画像を比較し、第2の画像がアフィン変換を経て第1の画像と関連しているか否かを推定することは可能である。
【0166】
第1の画像I1 (x, y)がアフィン変換又は空間歪(spatial distortion)(x, y)→ (x〜,y〜)により第2の画像I2 (x, y)と関連付けられるものとする。尚、アフィン変換は、式(2)で定義される変換である。第1の画像I1 (x, y)と第2の画像I2 (x, y)との関係は、次のように書き表される。
【0167】
【数46】
【0168】
式中、μは画像輝度増率(image intensity multiplying factor)(又は利得)であり、n(x, y)は第1の画像と第2の画像との差を考慮する関数である。
【0169】
従来の画像整合方法(例えば、相関を使用する)は、より一般的なアフィン歪に対しては容易に実現できないことが知られている。それは、一般に、6次元空間(6つのアフィンパラメータの)の全体にわたる検索が要求されるためである。従って、本発明の開示によれば、第1の画像I1 (x, y)と第2の画像I2 (x, y)とを比較するための更に有効な方法は、それらの画像自体の中で自然に発生する線構造(line structures)の交差比を比較するという方法である。多くの画像は、まっすぐな縁部(straight edges)などのいくつかの線構造又は部分線構造を含む。そのような線構造は、例えば、画素輝度の勾配の係数を使用することにより強調されるのが好ましい。ラプラシアン(Laplacian)などの他の演算子が使用されてもよい。
【0170】
図10は、第2の画像I2 (x, y)が第1の画像I1 (x, y)のアフィン歪バージョンであるか否かを推定する方法400の概略的なフローチャートを示す。方法400も、図5に示される汎用コンピュータシステム100を使用して実施されるのが好ましく、その場合、方法400のステップは、コンピュータシステム100の内部で実行されるソフトウェアとして実現される。
【0171】
方法400はステップ402で始まる。ステップ402において、方法200のステップ210に関連して先に説明されたように、画像I1 (x, y)及びI2 (x, y)の各々に対してラドン変換などの射影変換が適用される。
【0172】
実際には、ラドン変換後のエンハンスメントが好ましいことが明らかになっている。従って、続くステップ404において、勾配エンハンスメント(gradient enhancement)が実行され、その結果、画像ごとの2D-分布関数(2-D distribution function)Ωj (r, θ)が求められる。
【0173】
【数47】
【0174】
ステップ406において、分布関数Ωj(r, θ)の各々でピークが検出される。その目的は、対応する4つ1組の線構造を探索することである。従って、各々の画像I1 (x, y)及びI2 (x, y)の中の32個の最も重要な線構造を表現する各々の分布関数Ωj (r, θ)の中の32個の最高ピークを探索することにより、4本の直線について可能な組み合わせの数は35960通りとなる。
【0175】
次に続くステップ408において、プロセッサ105は、方法200に関連して先に詳細に説明したように、4本の直線の組み合わせごとに4つのピークの(r, θ)値から交差比を計算する。ステップ410において、4つ1組の比の35960通りの組み合わせは、順序付けシーケンス(ordered sequence)として配列される。先の場合と同様に、いずれかの比が1より大きい場合、それは反転される。シーケンスは、値が大きくなる順に順序付けされる。特に、4つ1組の比の全ての組み合わせは、第1の画像I1(x, y)に関して4次元テーブルに配列され、第2の画像I2 (x, y)に関しては別個のテーブルに配列される。
【0176】
次に、ステップ412において、第1の画像I1 (x, y)及び第2の画像I2 (x, y)の比シーケンス(ratio sequences)が比較される。特に、ユークリッド距離(Euclidean distance)又は式(42)に示されるメリット関数(merit function)に基づいて、第1の画像I1 (x, y)のテーブルにおける各順序付けシーケンスと第2の画像I2 (x, y)のテーブル2における各順序付けシーケンスとの対応性が評価される。規定の距離の中の対応性のみが許容される。メリット関数の計算は、計算に関して相当に過酷であり、試される点(points)(シーケンス(sequences))の数の2乗とも関連付けられる。更に効率のよい方式は、4D-比(4-D ratio)テーブルの粗ビンニング(coarse binning)を実行し(例えば、0.2のビン幅(bin widths)は、54=625ビン(bins)を提供する)、単純に、対応するビン又は隣接するビンにおけるシーケンスのメリット関数を評価するという方法である。
【0177】
メリット関数が規定の量より小さい場合、4つ1組の直線は整合すると想定され、その結果、ステップ414において、式(21)〜(32)を使用して、アフィン変換パラメータが交点から計算される。メリット条件を満たす全ての整合シーケンスに対してステップ414が繰り返され、6つのアフィンパラメータが作表(tabulated)される。
【0178】
続くステップ416において、第1の画像I1 (x, y)と第2の画像I2 (x, y)とのアフィン関係の尤度(likelihood)が推定される。例えば、テーブル中のアフィンパラメータエントリの著しく大きなクラスタリング(clustering)が存在する場合、第1の画像I1 (x, y)と第2の画像I2 (x, y)とのアフィン関係又は整合の尤度は高い。クラスタリング統計からアフィン整合の尤度の更に定量的な推定を導き出すことができる。
【0179】
ステップ416において、第1の画像I1 (x, y)と第2の画像I2 (x, y)との整合の尤度が低いと考えられる場合、ステップ417において、例えば画像I1 (x, y)と画像I2 (x, y)との整合は存在しないことをユーザインタフェースに指示することにより、方法400は終了する。しかし、第1の画像I1 (x, y)と第2の画像I2 (x, y)との整合の尤度が高いと考えられる場合には、ステップ418において、第1の画像I1 (x, y)が第2の画像I2 (x, y)と整合するように、第1の画像I1 (x, y)に対して逆アフィン歪(inverse affine distorted)が適用される。
【0180】
最後に、ステップ420において、正規化相関により整合のクオリティ(quality of the match)が判定される。0.9の値は、高レベルの整合を示すであろう。他の尺度(例えば、視覚)は、画像がどれほどよく整合するか及びアフィン歪パラメータがどれほど適切に推定されたかを更に適切に指示できるであろう。
【0181】
以上、本発明のいくつかの実施形態のみを説明したが、本発明の趣旨の範囲から逸脱せずに、上述の実施形態に対して変形及び/又は変形を実施できる。上述の実施形態は単なる例示であり、本発明を限定するものではない。
【0182】
本明細書に関する限り、「具備する(comprising)」という言葉は、「主要な要素として含むが、必ずしも単独に含むのではない」又は「有する(having)」又は「含む(including)」という意味であり、「その要素のみから構成される」という意味ではない。「comprise」及び「comprises」などの「comprising」という言葉の変形は、相応して変更された意味を有するものである。
【図面の簡単な説明】
【0183】
【図1A】画像中に埋め込まれた直線及び直線を定義するパラメータを示す図である。
【図1B】極座標空間において図1Aの直線を定義するパラメータを示す図である。
【図2A】歪前及び歪後の極座標空間における同一の3本の線のパラメータ対を示す図である。
【図2B】歪前及び歪後の極座標空間における同一の3本の線のパラメータ対を示す図である。
【図3】画像からアフィン歪のパラメータを検出する方法を概略的に示すフローチャートである。
【図4】電子透かしを使用して直線を埋め込む方法を概略的に示すフローチャートである。
【図5】説明される構成を実施できる汎用コンピュータを概略的に示すブロック図である。
【図6】線の方向付け角度βnが全角度範囲にわたり一様に分布するように配列された4本の線を示す図である。
【図7】線分の長さ比をパラメータeの関数として示す図である。
【図8】電子透かしとして使用されてもよいパターンの一例を示す図である。
【図9】擬似極座標空間で表された図8に示される例の歪前のパターンの射影を示す図である。
【図10】第2の画像が第1の画像のアフィン歪バージョンであるか否かを推定する方法を概略的に示すフローチャートである。
【特許請求の範囲】
【請求項1】
各々が少なくとも4本の互いに平行ではない線を有する第1の画像と第2の画像とのアフィン関係を推定する方法であって、
前記第1の画像中に現れる前記線の第1の組の交点を識別するステップと、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間に関係が存在するか否かを判定するステップとを備え、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にあることを特徴とする方法。
【請求項2】
前記第1の組の交点及び前記第2の組の交点を用いて、アフィン歪パラメータを推定するステップを更に備えることを特徴とする請求項1に記載の方法。
【請求項3】
アフィン歪を反転するステップを更に備え、前記アフィン歪は、前記アフィン歪パラメータにより定義されることを特徴とする請求項2に記載の方法。
【請求項4】
正規化相関により前記関係の尺度を判定するステップを更に備えることを特徴とする請求項3に記載の方法。
【請求項5】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記判定するステップは、
前記第2の画像中の各線の線分比を判定するサブステップと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するサブステップと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するサブステップとを備えることを特徴とする請求項1に記載の方法。
【請求項6】
前記線の各々は前記第1の画像中に1つのパターンを埋め込むことにより前記第1の画像中に埋め込まれ、各パターンは実質的に1次元基底関数から形成されており、前記方法は、
前記第2の画像の射影変換を計算する初期ステップと、
角度の選択するために、前記射影変換と前記基底関数との1次元相関を計算する初期ステップと、
前記相関のピークを探索する初期ステップとを備え、前記ピークの各々の位置は、前記埋め込みパターンのうちの1つのパターンの空間パラメータを提供することを特徴とする請求項1又は5に記載の方法。
【請求項7】
補助パターンと少なくとも4本の互いに平行でない線とを有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の補助パターンを検出する方法であって、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別するステップと、
前記第1の組の交点及び前記第2の組の交点を用いて、前記アフィン歪パラメータを推定するステップと、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用するステップと、
前記第2の画像中の前記歪補助パターンを検出するステップとを備えることを特徴とする方法。
【請求項8】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記交点間の関係を識別するステップは、
前記第2の画像中の各線の線分比を判定するサブステップと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するサブステップと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するサブステップとを備えることを特徴とする請求項7に記載の方法。
【請求項9】
前記線の各々は前記第1の画像中に1つのパターンを埋め込むことにより前記第1の画像中に埋め込まれ、各パターンは実質的に1次元基底関数から形成されており、前記方法は、
前記第2の画像の射影変換を計算する初期ステップと、
角度の選択するために、射影変換と前記基底関数との1次元相関を計算する初期ステップと、
前記相関のピークを探索する初期ステップとを備え、前記ピークの各々の位置は、前記埋め込みパターンのうちの1つのパターンの空間パラメータを提供することを特徴とする請求項7又は8に記載の方法。
【請求項10】
各々が少なくとも4本の互いに平行でない線を有する第1の画像と第2の画像とのアフィン関係を推定する装置であって、
前記第1の画像中に現れる前記線の第1の組の交点を識別する手段と、
前記第2の画像中に現れる前記線の第2の組の交点を識別する手段と、
前記第1の組の交点及び前記第2の組の交点から、交点間に関係が存在するか否かを判定する手段とを備え、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にあることを特徴とする装置。
【請求項11】
前記第1の組の交点及び前記第2の組の交点を用いて、アフィン歪パラメータを推定する手段を更に備えることを特徴とする請求項10に記載の装置。
【請求項12】
アフィン歪を反転する手段を更に備え、前記アフィン歪は、前記アフィン歪パラメータにより定義されることを特徴とする請求項11に記載の装置。
【請求項13】
正規化相関により、前記関係の尺度を判定する手段を更に備えることを特徴とする請求項12に記載の装置。
【請求項14】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点間に特有の線分比を有し、前記判定する手段は、
前記第2の画像中の各線の線分比を判定する手段と、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合する手段と、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別する手段とを備えることを特徴とする請求項10に記載の装置。
【請求項15】
補助パターンと少なくとも4本の互いに平行でない線とを有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の補助パターンを検出する装置であって、
前記第2の画像中に現れる前記線の第2の組の交点を識別する手段と、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別する手段と、
前記第1の組の交点及び前記第2の組の交点を用いて、前記アフィン歪パラメータを推定する手段と、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用する手段と、
前記第2の画像中の前記歪補助パターンを検出する手段とを備えることを特徴とする装置。
【請求項16】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記交点間の関係を識別する手段は、
前記第2の画像中の各線の線分比を判定する手段と、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合する手段と、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別する手段とを備えることを特徴とする請求項15に記載の装置。
【請求項17】
各々が少なくとも4本の互いに平行でない線を有する第1の画像と第2の画像とのアフィン関係を推定するためのコンピュータ可読媒体に格納されたプログラムであって、
前記第1の画像中に現れる前記線の第1の組の交点を識別するためのコードと、
前記第2の画像中に現れる前記線の第2の組の交点を識別するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、交点間に関係が存在するか否かを判定するためのコードとを備え、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にあることを特徴とするプログラム。
【請求項18】
前記第1の組の交点及び前記第2の組の交点を用いて、アフィン歪パラメータを推定するためのコードを更に備えることを特徴とする請求項17に記載のプログラム。
【請求項19】
アフィン歪を反転するためのコードを更に備え、前記アフィン歪は、前記アフィン歪パラメータにより定義されることを特徴とする請求項18に記載のプログラム。
【請求項20】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記判定するためのコードは、
前記第2の画像中の各線の線分比を判定するためのコードと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するためのコードとを含むことを特徴とする請求項17に記載のプログラム。
【請求項21】
補助パターンと少なくとも4本の互いに平行でない線とを有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の補助パターンを検出するためのコンピュータ可読媒体に格納されたプログラムであって、
前記第2の画像中に現れる前記線の第2の組の交点を識別するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別するためのコードと、
前記第1の組の交点及び前記第2の組の交点を用いて、前記アフィン歪パラメータを推定するためのコードと、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用するためのコードと、
前記第2の画像中の前記歪補助パターンを検出するためのコードとを備えることを特徴とするプログラム。
【請求項22】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点間に特有の線分比を有し、前記交点間の関係を識別するためのコードは、
前記第2の画像中の各線の線分比を判定するためのコードと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するためのコードとを備えることを特徴とする請求項21に記載のプログラム。
【請求項23】
実質的に添付の図面を参照して説明されることを特徴とする方法。
【請求項24】
実質的に添付の図面を参照して説明されることを特徴とする装置。
【請求項1】
各々が少なくとも4本の互いに平行ではない線を有する第1の画像と第2の画像とのアフィン関係を推定する方法であって、
前記第1の画像中に現れる前記線の第1の組の交点を識別するステップと、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間に関係が存在するか否かを判定するステップとを備え、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にあることを特徴とする方法。
【請求項2】
前記第1の組の交点及び前記第2の組の交点を用いて、アフィン歪パラメータを推定するステップを更に備えることを特徴とする請求項1に記載の方法。
【請求項3】
アフィン歪を反転するステップを更に備え、前記アフィン歪は、前記アフィン歪パラメータにより定義されることを特徴とする請求項2に記載の方法。
【請求項4】
正規化相関により前記関係の尺度を判定するステップを更に備えることを特徴とする請求項3に記載の方法。
【請求項5】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記判定するステップは、
前記第2の画像中の各線の線分比を判定するサブステップと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するサブステップと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するサブステップとを備えることを特徴とする請求項1に記載の方法。
【請求項6】
前記線の各々は前記第1の画像中に1つのパターンを埋め込むことにより前記第1の画像中に埋め込まれ、各パターンは実質的に1次元基底関数から形成されており、前記方法は、
前記第2の画像の射影変換を計算する初期ステップと、
角度の選択するために、前記射影変換と前記基底関数との1次元相関を計算する初期ステップと、
前記相関のピークを探索する初期ステップとを備え、前記ピークの各々の位置は、前記埋め込みパターンのうちの1つのパターンの空間パラメータを提供することを特徴とする請求項1又は5に記載の方法。
【請求項7】
補助パターンと少なくとも4本の互いに平行でない線とを有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の補助パターンを検出する方法であって、
前記第2の画像中に現れる前記線の第2の組の交点を識別するステップと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別するステップと、
前記第1の組の交点及び前記第2の組の交点を用いて、前記アフィン歪パラメータを推定するステップと、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用するステップと、
前記第2の画像中の前記歪補助パターンを検出するステップとを備えることを特徴とする方法。
【請求項8】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記交点間の関係を識別するステップは、
前記第2の画像中の各線の線分比を判定するサブステップと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するサブステップと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するサブステップとを備えることを特徴とする請求項7に記載の方法。
【請求項9】
前記線の各々は前記第1の画像中に1つのパターンを埋め込むことにより前記第1の画像中に埋め込まれ、各パターンは実質的に1次元基底関数から形成されており、前記方法は、
前記第2の画像の射影変換を計算する初期ステップと、
角度の選択するために、射影変換と前記基底関数との1次元相関を計算する初期ステップと、
前記相関のピークを探索する初期ステップとを備え、前記ピークの各々の位置は、前記埋め込みパターンのうちの1つのパターンの空間パラメータを提供することを特徴とする請求項7又は8に記載の方法。
【請求項10】
各々が少なくとも4本の互いに平行でない線を有する第1の画像と第2の画像とのアフィン関係を推定する装置であって、
前記第1の画像中に現れる前記線の第1の組の交点を識別する手段と、
前記第2の画像中に現れる前記線の第2の組の交点を識別する手段と、
前記第1の組の交点及び前記第2の組の交点から、交点間に関係が存在するか否かを判定する手段とを備え、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にあることを特徴とする装置。
【請求項11】
前記第1の組の交点及び前記第2の組の交点を用いて、アフィン歪パラメータを推定する手段を更に備えることを特徴とする請求項10に記載の装置。
【請求項12】
アフィン歪を反転する手段を更に備え、前記アフィン歪は、前記アフィン歪パラメータにより定義されることを特徴とする請求項11に記載の装置。
【請求項13】
正規化相関により、前記関係の尺度を判定する手段を更に備えることを特徴とする請求項12に記載の装置。
【請求項14】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点間に特有の線分比を有し、前記判定する手段は、
前記第2の画像中の各線の線分比を判定する手段と、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合する手段と、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別する手段とを備えることを特徴とする請求項10に記載の装置。
【請求項15】
補助パターンと少なくとも4本の互いに平行でない線とを有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の補助パターンを検出する装置であって、
前記第2の画像中に現れる前記線の第2の組の交点を識別する手段と、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別する手段と、
前記第1の組の交点及び前記第2の組の交点を用いて、前記アフィン歪パラメータを推定する手段と、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用する手段と、
前記第2の画像中の前記歪補助パターンを検出する手段とを備えることを特徴とする装置。
【請求項16】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記交点間の関係を識別する手段は、
前記第2の画像中の各線の線分比を判定する手段と、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合する手段と、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別する手段とを備えることを特徴とする請求項15に記載の装置。
【請求項17】
各々が少なくとも4本の互いに平行でない線を有する第1の画像と第2の画像とのアフィン関係を推定するためのコンピュータ可読媒体に格納されたプログラムであって、
前記第1の画像中に現れる前記線の第1の組の交点を識別するためのコードと、
前記第2の画像中に現れる前記線の第2の組の交点を識別するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、交点間に関係が存在するか否かを判定するためのコードとを備え、前記関係が存在する場合、前記第1の画像及び前記第2の画像はアフィン関係にあることを特徴とするプログラム。
【請求項18】
前記第1の組の交点及び前記第2の組の交点を用いて、アフィン歪パラメータを推定するためのコードを更に備えることを特徴とする請求項17に記載のプログラム。
【請求項19】
アフィン歪を反転するためのコードを更に備え、前記アフィン歪は、前記アフィン歪パラメータにより定義されることを特徴とする請求項18に記載のプログラム。
【請求項20】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点の間に特有の線分比を有し、前記判定するためのコードは、
前記第2の画像中の各線の線分比を判定するためのコードと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するためのコードとを含むことを特徴とする請求項17に記載のプログラム。
【請求項21】
補助パターンと少なくとも4本の互いに平行でない線とを有し、前記線が所定の位置で第1の組の交点を形成する第1の画像のアフィン歪バージョンである第2の画像の中の補助パターンを検出するためのコンピュータ可読媒体に格納されたプログラムであって、
前記第2の画像中に現れる前記線の第2の組の交点を識別するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、交点間の関係を識別するためのコードと、
前記第1の組の交点及び前記第2の組の交点を用いて、前記アフィン歪パラメータを推定するためのコードと、
歪補助パターンを形成するために、前記アフィン歪パラメータにより定義される前記アフィン歪を前記補助パターンに適用するためのコードと、
前記第2の画像中の前記歪補助パターンを検出するためのコードとを備えることを特徴とするプログラム。
【請求項22】
前記線の各々は、前記第1の画像中に埋め込まれ、前記第1の画像中に埋め込まれたその他の線との交点間に特有の線分比を有し、前記交点間の関係を識別するためのコードは、
前記第2の画像中の各線の線分比を判定するためのコードと、
対応する線分比を有する前記第1の画像及び前記第2の画像中の線を整合するためのコードと、
前記第1の組の交点及び前記第2の組の交点から、前記交点間の関係を識別するためのコードとを備えることを特徴とする請求項21に記載のプログラム。
【請求項23】
実質的に添付の図面を参照して説明されることを特徴とする方法。
【請求項24】
実質的に添付の図面を参照して説明されることを特徴とする装置。
【図1A】
【図1B】
【図2A】
【図2B】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図1B】
【図2A】
【図2B】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【公表番号】特表2007−510335(P2007−510335A)
【公表日】平成19年4月19日(2007.4.19)
【国際特許分類】
【出願番号】特願2006−537008(P2006−537008)
【出願日】平成16年11月4日(2004.11.4)
【国際出願番号】PCT/AU2004/001532
【国際公開番号】WO2005/045763
【国際公開日】平成17年5月19日(2005.5.19)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公表日】平成19年4月19日(2007.4.19)
【国際特許分類】
【出願日】平成16年11月4日(2004.11.4)
【国際出願番号】PCT/AU2004/001532
【国際公開番号】WO2005/045763
【国際公開日】平成17年5月19日(2005.5.19)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]