説明

形状の不変量アフィン認識方法及びデバイス

本発明は、少なくとも1つのデジタル画像における物体認識方法であって:
a)各回転・チルト対ごとにシミュレート画像を作成するために、前記デジタル画像から、複数のデジタル回転と、1ではない少なくとも2つのデジタルチルトとをシミュレートすること;そして、
b)物体認識で使用されるいわゆるSIF(スケール不変特性)局所的特徴を決定するために、シミュレート画像上で、並進、回転及びズームにおいて不変である値を生成するアルゴリズムを適用すること;
を含む前記方法に関するものである。SIFT法は、工程bで使用することができる。

【発明の詳細な説明】
【発明の詳細な説明】
【0001】
本発明は、少なくとも1つのデジタル画像における物体認識方法及びデバイスに関する。
【0002】
一般に、形状認識方法の目的は、物体と、実際の撮影デバイス又はシミュレートされた撮影デバイスとの相対位置が未知である場合、あるいは、物体がおそらくは歪んでいる場合に、撮影された物体又は物体の種類を認識することである。物体自体は、グラフィック且つ非物質的な物体(例えば、デジタルロゴ又はシミュレーション結果)であることができる。簡潔にするために、本明細書では撮影デバイス(又は撮影をシミュレートするデバイス)を「カメラ」と呼ぶが、本発明は、任意の画像の取得と、物体に対するカメラの位置の変化によって、あるいは、画像の取得又はシミュレーション用のデバイスの特定の特徴によって生じる物体のビューの任意の歪みもしくは幾何学的変形とに関するものである。更に、撮影され、又はシミュレートされる物体は同一である必要はなく、それらの物体が類似したもの(工業生産又は図形生成から生じる物体の一般的な状態として)であることだけで十分である。認識されるべき物体の1つ以上の画像を利用することができる:これらの画像が「クエリー」画像である。1つ以上の画像(ここで、物体が捜し求められる)は、必ずしもその物体を含むとは限らない。この目的は、分析される画像内に物体が存在するかどうかを知るための確実な兆候を見つけること、及び、その画像内での位置を与えることである。
【0003】
認識問題を扱う全ての方法によって提案される最初の単純化は、対象画像における局所的変形がクエリー画像の平面アフィン変形として解釈されるのに十分な規則的レリーフを、その物体が有していると仮定することである。大部分の物理的対象は、実際、その表面が平坦な、又は、わずかに湾曲した面を有する体積である。例外はまれである。例外の例としては、視角を変えるとその外観が劇的に変化し得る葉のない木、又は、液体のさざ波が考えられる。任意の規則的変形は、その(弁別可能な)用語の数学的意味で、画像において局所的に、アフィン変形に近いものである。これは特に、かなり規則的な物体の光学画像の明らかな変形について、前記画像の明らかな変形が、カメラの移動によって、又はカメラの光学的歪みによって、又は物体の移動によって、更に又は物体自体の漸次的変形によって生じる場合である。例えば、平らな物体の場合、その物体を観察するカメラの位置の変化によって生じるその画像の変形は、あらゆる点においてアフィンアプリケーションと接する平面ホモグラフィである。更に、観察される物体からカメラが非常に遠く離れている場合、この画像の変形は全般的アフィン変換にますます似たものになる。逆に、正の行列式を用いた画像平面のアフィン変換はいずれも、画像から遠く離れた(事実上無限遠の)位置にあり且つ画像を観察するカメラの空間的移動に起因する、画像の変形として解釈することができる。(x,y)座標平面のアフィン変形は、
【数1】

の形で表すことができ、パラメータa、b、c、dは、本明細書中にAとして示される2行2列の行列を形成することを想起されたい。従って、画像u(x,y)のアフィン変形は次式で表される。
【数2】

【0004】
上記の理由により、形状の認識の問題を軽減して、アフィン変換を法として不変である画像の局所的特徴を見つけることができる。この場合、これらの特性は、物体とカメラとの相対的移動によって生じる明らかな局所的変形に対して、及び、取得デバイスによって生じる歪み(例えば、レンズの光学的歪み)に対して、並びに、最終的には物体自体の変形に起因する歪みに対してロバストである。
【0005】
本明細書では、「チルト」及び「デジタル」という用語を使用する;これらはそれぞれ、チルトとデジタルを意味し、当業者によって一般的に使用される用語である。SIF及びSIFTという用語も使用する;これらは当業者には公知の略語であり、それぞれ、「スケール不変特性」と「スケール不変特性変換」とを意味するものである。
【0006】
米国特許第6711293号(Lowe)明細書には、カメラによって正面から撮影された画像内の物体を認識することを可能にする「スケール不変特性変換」のためのSIFT法と呼ばれる方法が記載されている。この米国特許第6711293号明細書では、アフィン空間全体を探索することは非常に高く(prohibitive)、非効率的になるはずであるとみなしている。Loweは最後に、LoweのSIFT法の不変性の欠点は、30度の間隔を置いた3D物体の実像を撮影することによって補正することができるはずであると述べている。
【0007】
文献“Cloth Motion Capture”,by D.Pritchard and W.Heidrich,Eurographics 2003/Volume 22,Number 3には、正面から撮影された初期画像から、チルトが2である4つのシミュレート画像を生成する、SIFT特性の決定方法が記載されている。第1のシミュレート画像は水平線上で、第2の画像は垂線上で、第3及び第4の画像は45度の2本の軸上で実現されたチルトについて得られる。従ってこの方法は、認識を改善するための4つのシミュレート画像を提供する。
【0008】
本発明は、アフィン変換を適用された平面画像の一部分を認識する新規の方法に関するものである。本発明の目的は、物体と対向する正面の視点、又は、斜めからの視点と比べた、斜めから撮影された画像における物体認識を可能にすることでもある。従って本発明の目的は、視点にかかわらず認識率を改善することである。
【0009】
前述の目的のうちの少なくとも1つは、少なくとも1つのデジタル画像における物体認識方法であって:
a)各回転・チルト対ごとにシミュレート画像を作成するために、各デジタル画像から、複数のデジタル回転と1ではない少なくとも2つのデジタルチルトをシミュレートし;そして、
b)クエリーとターゲットとの間の類似又は同一の物体を認識するのに使用される、SIF(スケール不変特性)と呼ばれる局所的特徴を決定するために、シミュレート画像上で、並進、回転及びズームにおいて不変である値を生成するアルゴリズムを適用する;
前記方法を用いて達成される。
【0010】
言い換えると、デジタル画像から開始して、無限遠でそのデジタル画像を観察するカメラの光軸の方向の数回の変化がシミュレートされる。カメラの各位置は回転・チルト対によって定義されるが、変化する複雑さの他の変換を使用してカメラの位置を定義することもできることを当業者は容易に理解するであろう。それでもなお、本発明は、カメラ軸の向きの任意の変更を、回転(その後にチルト続く)として表すことができるという点で注目に値する。
【0011】
本発明の方法は、平面の任意のアフィン変換を、無限遠にあるカメラの位置変化に起因する画像の変換として解釈することができるという知見に基づくものである。この解釈に基づき、アフィン変換を:
− 光軸に沿ったカメラの移動、又はズーム(1パラメータ)と;
− 焦点面に対して平行な並進(2パラメータ)と;
− カメラの軸方向回転(1パラメータ)と;
− カメラの光軸方向の変化(2パラメータ)と;
の積に分解することができる。
【0012】
SIFT法といった先行技術のアルゴリズムは、その最初の3つの変換を任意とする画像の認識を可能にする。これらの変換は、カメラの軸方向回転、ズーム、及び焦点面に対して平行な(従って光軸に垂直な)並進の4つのパラメータに対応する。SIFT法は、SIF(「スケール不変特性」)、すなわち、より正確には、画像のズーム、並進及び回転による不変特性を決定することを可能にするが、カメラの光軸方向の変化に関連する最後の2つのパラメータは考慮に入れない。Loweは、SIFT法の感度を改善するために追加のビューを提供するが、これらのビューは実像であり、操作が追加されると共に、処理すべきデータが大幅に増えることを意味する。Pritchardは4つのシミュレート画像だけしか提供しない。なぜなら、それ以上は計算時間の点で非生産的であり、非常に高くなるとみなしたからである。本発明は、一般に当然視されている予断(それによると、シミュレート画像の数が増えた場合に、計算時間が非常に高くなるはずである)を越えるものである。
【0013】
本発明の方法では、SIFT法で扱われない2つのパラメータ、すなわちカメラの光軸方向の変化のパラメータの変動に起因する画像のすべての歪みを十分な精度でシミュレートすることができる。
【0014】
本発明では、まず、いくつかのシミュレート画像が、回転とチルトによって記述される上記最後の2つのパラメータに関連して生成される。詳細には回転・チルト対を、デジタル画像の上方にある半球に内接させることができる。回転とチルトは、それぞれ、空間内の経度と緯度とに対応するものとみなされる。Pritchardは実際には、正面画像からの4つの回転と1つのチルト値とを記述する。本発明では初期画像を、非正面、すなわち、最大約80°までの斜めの視点から獲得することができる。
【0015】
先行技術のシステムは、最大3又は4の実際のチルトをもたらすカメラ軸の向きの変化に耐える物体の認識を可能にする。本発明の方法は、最大で40を超える値までのチルトを扱うことができる。実際、カメラがチルトt及びt’で平らな物体の2つのビューを撮影する状況において、これら斜めの(他方のビューから開始される)一方のビューのシミュレーションは、最大で値tt’までのチルトをシミュレートすることを必要とし得る。例えば、80°の緯度では、チルトは5.76であり、これら斜めのビューが90°の経度差を有するときの合成チルトは5.76=33.2に等しいものになる。従って、2よりはるかに大きい、例えば最大30以上までのチルトが可能であり、本発明の方法により、相互に斜め方向にあるビューを認識することが可能になる。
【0016】
従ってこの方法は、無限遠にある画像のすべての可能なビューを認識することができる。なぜなら、シミュレートされるビューはその場合、SIFの計算を用いる、最新技術において熟知されている問題である、並進、回転及びズームによる1つの不変量認識アルゴリズムしか必要としないからである。
【0017】
本発明の方法が基づく原理は、完全に平坦な物体の場合と無限遠にあるカメラの場合とにしか当てはまらない、単一のアフィン変換が画像全体に適用されていると仮定するものではない。これとは対照的に、画像のすべてのアフィン変換を考慮に入れる認識アルゴリズムを適用することにより、完全な認識が確実に得られ、ここで、各変形は局所的にアフィンアプリケーションと接する。この状況は、すべてのアフィン変換のシミュレーションは画像のすべての局所的変形を有効にシミュレートするのに十分であると要約することができる。
【0018】
本発明の或る実施態様によれば、この方法は、クエリーと呼ばれる画像と、ターゲットと呼ばれる画像とに適用される。この場合は、クエリーのシミュレート画像のSIFをターゲットのシミュレート画像のSIFと比較して、クエリーとターゲットの間の類似又は同一の物体を認識する。
【0019】
非限定的例として、本発明の方法が1つ又は複数のクエリーと呼ばれる画像及び1つ又は複数のターゲットと呼ばれる画像に適用される場合に、クエリーに関連するSIFをその前の較正段の間に決定して、SIFの辞書を構成することができる。また、ターゲットに関連するSIFは、そのターゲットの順番において、各ターゲットから獲得されたSIFが上記辞書内のSIFと比較される操作段の間に決定することができる。
【0020】
許容できる結果を保証するための、実施されるべき回転・チルト対の数及び最適位置を経験的に決定するために、本発明の方法を実行する。この方法において、クエリーが任意のビューからのターゲットに含まれる別の物体の形状と類似又は同一の形状の物体の撮影された任意のビューを含み、そして、回転・チルト対を決定する。すなわち、この最適数及びこれらの最適位置は、検査された多数の物体についてそれら2つの物体のSIFが類似する最適数及び最適位置である。
【0021】
本発明の方法は、クエリーとターゲットとに、並びに、同じ回転・チルト対とに同一数のシミュレート画像を生成することを想定するものである。しかし、本発明の方法は同時に、特に、異なるチルト又は同一のチルトを用いて、クエリーとターゲットとで異なる数のシミュレート画像が生成される場合も想定している。
【0022】
有利には、1チルト当たりの回転の数は、チルトの値が増加するに従って同時に増加する。好ましくは、チルトは、デジタル画像の上方の半球における緯度に応じて定義され、そして、2つの連続するチルト間の緯度の差はチルトが増加するに従って同時に減少する。特に緯度は、0から90°までの範囲におけるパラメータθによって、あるいはt=1/|cos(θ)|で定義されるチルトパラメータによって測定することができる。これらの特性によって、緯度が90°に向かう傾向にあるときにシミュレートされる位置をカメラにだんだん近づけることができる。
【0023】
本発明の有利な特性によれば、所与の回転について、考察されるチルトは、ほぼ(すなわち、許容差ありで)有限等比数列1,a,a,a,…,a(ここで、aを1より大きい数とする)を形成する。非限定的例として、aはおおよそルート2(√2)であり、nは、回転・チルト対がターゲットとクエリーとの両方に適用される場合には、2〜6であり、回転・チルト対が2つの画像の一方だけに適用される場合には、2〜12である。
【0024】
本発明の別の有利な特性によれば、所与のチルトtについて、例えば、チルトt=aから開始するデジタル回転は、ほぼ(すなわち、許容差ありで)等差数列0,b/t,2b/t,…,kb/t°(ここで、bは度数であり、そして、kは整数である)を形成する。
【0025】
好ましくは、bはおおよそ72°であり、kは、kb/tが180°未満になるような最後の整数値(whole value)である。これらの典型的な値を用いれば、検査されるチルトtごとに(180/72).t画像=2.5t画像がシミュレートされる。
【0026】
有利には、チルトtを適用することは、tと等しい値を用いて一方向にデジタル画像をアンダーサンプリングすることからなり、これは画像の面積をtで除算する。またチルトは、一方向によるデジタル画像のアンダーサンプリングと、前記方向と直交する方向でのオーバーサンプリングとを組み合わせることによっても適用することができる。
【0027】
シミュレートされる合計面積が初期画像の面積を過度に上回らないようにするために、例えば、a=ルート2及びn=4を使用することができる。各チルトtがアンダーサンプリングによって得られる場合、これはチルト後の画像の面積をtで除算する。従って、画像(その合計面積が、初期画像の面積の180.t/(72.t)=2.5倍である)が、各々のtごとにシミュレートされる。従って、処理される面積は、初期画像の面積の2.5倍にチルトの数をかけたものに等しい。従って、シミュレートされる面積は、初期画像の面積の2.5.n=10倍である。しかしながら、本発明の方法が、クエリー画像及びターゲット画像の3を係数とするズームアウトに適用される場合、シミュレートされる面積は初期面積の10/9=1.11倍にすぎない。従って、本発明の方法は、例えば、SIFT法に匹敵する時間をとり、その間に、最大で16の転位(translation)チルトまでの斜めのビューの認識が可能である。しかしながら、チルトは、一方向でのオーバーサンプリングと、直交する方向でのアンダーサンプリングを組み合わせることによってシミュレートすることができるので、その結果、画像の面積が一定のままあり、縮小することがない(後述のチルトの定義を参照されたい)。
【0028】
従って、本発明の方法では、妥当な計算時間とメモリとを保持しながら、2つのパラメータによってすべてのビューをシミュレートすることが可能である。なぜなら、2つのパラメータ回転とチルトとの空間が、パラメータごとにごく少数の値を用いてサンプリングされること、並びに、斜めのビューに起因する歪みのシミュレーションが、アンダーサンプリングによって画像のサイズを縮小することができることからである。このことによって、必要とされる保存容量を過度に拡大することなく、所与の精度で事実上すべての可能なビューを生成することが可能となる。
【0029】
本発明の有利な実施態様によれば、本発明の方法は、前記デジタル画像(このデジタル画像又は同じデジタル画像の変換(例えば、軸対象)と比較して)に適用して、このデジタル画像内の対称、反復形状又は周期性を有する形状を決定する。
【0030】
本発明の別の態様によれば、本発明の少なくとも1つのデジタル画像における物体認識の方法の適用のためのデバイスが想定される。このデバイスは:
a)各回転・チルト対ごとにシミュレート画像を作成するために、前記デジタル画像から、複数のデジタル回転と1ではない少なくとも2つのデジタルチルトとを適用し;そして、
b)物体を認識するのに使用される、SIF(スケール不変特性)と呼ばれる局所的特徴を決定するために、シミュレート画像上で、並進、回転及びズームにおいて不変であるアルゴリズムを適用する;
ように構成された処理回路を含む。
【0031】
有利には、前記デバイスが、SIFの辞書が記憶されるメモリ空間を含み;処理回路は、前記デジタル画像(初期画像)のSIFを前記辞書のSIFと比較するように構成されている。
【0032】
本発明によれば、処理回路は、任意の数の画像を並行して処理するように構成することができる。
【図面の簡単な説明】
【0033】
本発明のその他の利点及び特性は、完全に非限定的な或る実施態様の詳細な説明と、添付の図とを考察することにより明らかになるであろう。
【図1】本発明の方法を実施するデバイスの一般図である。
【図2】本発明の方法の各ステップを示す簡略化したフローチャートである。
【図3】カメラの位置を示す4つの主なパラメータを表す一般図である。
【図4】シミュレート画像間の複数の比較を表す一般図である。
【図5】回転・チルト対が内接する球を表す一般図である。
【図6】図5の球上のシミュレートされたチルト及び回転の位置の分布を表す一般図である。
【図7】絶対チルトと相対チルト、又は転位チルトの差を表す図である。
【図8】絶対チルトと相対チルト、又は転位チルトの差を表す図である。
【0034】
図1に、ソフトウェアと、その適正な動作のために必要な周辺機器とを含むコンピュータとしての処理ユニット1を示す。処理ユニット1は、特に、処理回路2(例えば、マイクロプロセッサ又は専用マイクロコントローラ)を含み、前記処理回路は、本発明の方法に従って画像を処理するように構成されている。特に、SIFを辞書の形態で保存するのに適当な通常のメモリ空間3も設置される。このコンピュータは、処理画像を表示することのできる表示モニタ4を備える。
【0035】
カメラ5は接続ケーブルを介してコンピュータ1に接続される。しかしながら、他の接続手段(特に、無線の接続手段)も使用することができる。以前に取得され、コンピュータの固定式又はポータブル式保存手段に保存された画像を再生させることも可能である。
【0036】
本発明はこれだけに限定されるものではないが、ターゲット画像とクエリー画像との間での物体認識に適用される、本発明の認識方法を説明する。
【0037】
図2において、フローチャートには、2つの画像、クエリー6、及びターゲット10の並行処理が示されている。
【0038】
2つの画像、クエリー6、及びターゲット10から開始して、回転7、11とチルト8、12との対について第1のシミュレート画像を生成し、そして、ステップ7、11及びステップ8、12を数回(例えば、p回)実施して、9及び13においてp個のシミュレート画像を生成する。言い換えると、各画像には同じ処理が適用され、前記処理は、経度及び緯度と呼ばれる2つのパラメータを有する空間であるカメラ軸の向きの変化に起因する、全ての可能な歪みをシミュレートすることからなる。例えば、図3において、角度シータθは緯度であり、角度ファイφは経度である。
【0039】
シミュレート画像は、サンプリングを用いて、経度と緯度との有限数pの対について生成され、前記サンプリングは、実質的にシミュレートされるビューの数を小さく(数十個)すると同時に、その数十個のシミュレート画像が他の任意の可能なビューに近いままであることを保証する。
【0040】
従って、図2のステップ14において、シミュレートされた画像は、次に、画像の回転(=カメラの光軸の周りのカメラの回転)、並進(=カメラの軸に垂直なカメラの移動)、及びズーム(=カメラの光軸上のカメラの移動)を法として有効な認識を行う既存のアルゴリズムのいずれか1つによって、相互に比較される。そのようなアルゴリズムは、特に、米国特許第6711293号明細書に記載されるSIFTアルゴリズムである。図4は、シミュレート画像上で実行される複数の比較図を示す。2つの正方形で表される2つの画像クエリーA及びターゲットBは、2つにチルトと関連付けられた回転とによって獲得されるそれらのシミュレートビュー(平行四辺形)に取り囲まれている。一方の画像の平行四辺形(複数)と他方の画像のいくつかの平行四辺形とを結び付ける矢印は、一方の画像のシミュレートビューと他方のシミュレートビューとの間で比較が行われることを表している。
【0041】
出力15は、2つの画像上で認識された物体と、サブ画像の一方を他方に変換することを可能にするものとして識別されたアフィン変換をと含む、クエリー及びターゲットのサブ画像の対の(場合により空の)リストであることができる。
【0042】
図3には、カメラによって撮影された画像の変形を引き起こす4つの主なパラメータが示されており:ここで、カメラは角度サイψで回転することができ、カメラの光軸は正面軸に対して角度シータθ(緯度)を取ることができ、そして、この角度シータの傾きは、一定方向について角度ファイφ(経度)をなす垂直面において生じる。
【0043】
本発明の方法は、平面画像を正面から観察する無限遠にあるカメラの軸方向の変化に起因するはずのすべてのアフィン変形を生成することを可能にし、従ってこれらの変形は、生成されるビューの数が数十個になるようにサンプリングされる2つのパラメータ、すなわち経度と緯度に依存するものである。シミュレートされる経度は、緯度が増加するに従ってますます多くなる。しかし、緯度が増加する場合には、画像も場合により一方向においてますますアンダーサンプリングされ、従ってだんだんと小さくなり、その場合アンダーサンプリングのレートは等比数列になる。
【0044】
更に一層正確にいうと、緯度は、0から90°までの範囲のパラメータθによって、あるいは、t=1/|cos(θ)|で定義されるチルトパラメータによって測定される。経度は、パラメータφによって記述される(図3参照)。チルトtの値は対数的に、φの値は等差級数的にずれる。
【0045】
ある位置から別の位置へのカメラの移動は、次式で与えられる変換Aによって定義することができる。
【数3】

【0046】
変換Aは、4つの要素(a,b,c,d)を有する2×2行列と関連付けられる平面の線形変換である。光学カメラによって正面から見た画像として解釈される画像u(x,y)が与えられたとすると、この場合、u(x,y)→u(A(x,y))の適用は、カメラがその光軸上に角度サイψで回転するとき、カメラがその光軸上を摺動してこの軸上でラムダ倍だけ離れる(又はラムダλ<1の場合にはより近づく)とき、及び、カメラの光軸がその正面位置から緯度シータθの変化と経度ファイφとの変化の組み合わせの分だけ離れるとき、に観察される画像の変形として解釈される。カメラは、その光軸に垂直な並進の移動を開始することもでき、これは、前述の式で考慮に入れられていない画像の前の並進(e,f)をもたらす。この並進(e,f)、ズームラムダλ、及び回転サイψが、先行技術により熟知される4つのパラメータである。本発明は、緯度及び経度の変化によって生じる変形を更に画像が受ける場合での、画像の認識方法にも関するものである。
【0047】
図5に、チルトと回転とが位置決めされる球を示す。この図には、チルト2、チルト
2√2、及びチルト4について(すなわち、角度60°、角度69.30°、及び角度75.52°)についてそれぞれシミュレートされるはずのカメラの位置の斜視図が示されている。チルトが増加するとますます多くの回転の角度が生じる。
【0048】
図6に、チルト及び回転の位置の分布を示す。各円は1チルトに対応する。最も内側の円はシータθ=45°と関連付けられたチルトのものであり、続く各円は、シータθ=60°、70°、75°及び80°に対応するものである。チルトが増加するほど、円上の位置の数(すなわち、経度ファイφの数)を増やすことが必要になる。従って表示される各点は、座標として、sin(θ)cos(φ)及びsin(θ)sin(φ)を有する。長方形は、各チルトによって生じた正方形画像の変形を示している。
【0049】
《本発明の方法は、以下に要約される当業者に公知のいくつかの用語に関する。》
デジタル画像u(x,y)の回転:値u(x,y)から画像の画素(x,y)への補間による、値v(x,y)=u(R(x,y))の計算(ここで、Rは、パラメータ(cos(φ),−sin(φ),sin(φ),cos(φ))の2行2列の行列によって記述される角度ファイの平面回転である)。その視覚効果は、画像がコンピュータ画面上に角度φで回転するというものである。この操作は、特に、正面ビューとして画像を撮影するカメラの、その光軸の周りでの回転によって生じるはずの効果をシミュレートするものである。
【0050】
x方向でのデジタル画像のチルト:v(x,y)=u(xa,y/b)を設定し、ab=tは「チルト係数」であり、「チルト」と略される。この操作は、無限遠にあるカメラによって正面から観察されるものと想定される、x方向のカメラの光軸の傾きの、画像u(x,y)上での結果をシミュレートするものである。法線方向に対する光軸の角度は、t=1/|cos(θ)|になるように、−90°から+90°までのシータθの2つの値のうちの1つである。画像u(x,y)は正面ビューであり、従って画像v(x,y)は、x方向への角度θのチルトt後の斜めのビューである。デジタル画像上でこのチルトは、画像をy方向にb倍にオーバーサンプリングすることによって、そして、画像をx方向にa倍にアンダーサンプリングすることによって獲得することができる(ここで、bは1からtまでの任意の係数である)。a=t、b=1である場合には、x方向でのアンダーサンプリングだけが行われ、a=1、b=tである場合には、y方向でのオーバーサンプリングだけが行われる。アンダーサンプリングの場合、画像は、1次元ローパスフィルタを用いた画像の畳み込みによってx方向に事前に平滑化されなければならない。a=t、b=1である場合、チルト後のデジタル画像は、tで除算された面積を有する(またこの面積は、a=√t、b=√tである場合には変化しない)。
【0051】
デジタル画像のズームアウト:低域フィルタG(x,y)=(1/h)G(x/h,y/h)による、画像u(x,y)に対する畳み込みv(x,y)=(Gu)の適用に続く、アンダーサンプリングv(x,y)=(Gh*u)(xh,yh)(ここで、hはズームアウト係数である)。この操作は、画像に対してカメラが遠ざかる(moving-away)のをシミュレートするものであり、遠ざかる前の物体からの距離の、遠ざかった後の距離に対する比率はhである。関数G(x,y)は、多くの場合ガウス関数であり、カメラの光学的畳み込みカーネルをシミュレートするものである。デジタルズームインは単純な補間によって得られる。ズームアウト又はズームインはきわめて短いズームである。
【0052】
絶対チルト及び相対チルト:絶対チルトは、平面物体と対向する正面位置から斜めのビューへのカメラの移動から生じる一方向での画像圧縮の係数t=1/|cos(θ)|のための用語である。光軸が画像の同じ点を貫通する2つの位置において、同一の平面物体がカメラによって撮影されているものと仮定する。第1のカメラの軸の位置は2つの角度θ及びφによって記述され、第2のカメラの軸の位置は2つの角度θ’及びφ’によって記述される。φ=φ’であるとき、(ズームは別として)他方に直接移動するために2つの画像のうちの一方に適用されなければならないチルトは、比t’/tに等しく、この場合t’は2つのチルトのうちの大きい方を表し、tは小さい方を表す。φ=φ’+90°であるとき、他方u(x,t’y)に移動するために2つの画像のうちの一方u(tx,y)に適用される必要のあるこの同じチルトは最大であり、積tt’に等しい。これは、斜めのビューを比較する場合に、40を上回り得る多数のチルトをシミュレートすることがなぜ有利であるかを説明するものである。図7及び図8には、特に、絶対チルト及び相対チルト、又は転位チルトの差が示されている。左側の図7には、φ=φ’での、θ=30°及び60°の値に対応する2つの位置にあるカメラが示されている。チルトのうちの一方は2に等しく、他方は2/√3であり、従って、vからv’まで移動する場合の相対転位チルトは√3であり、これはuからv’まで移動した場合のチルトより小さい。従って、チルトが同じ平面内で発生する(φ=φ’)とき、シミュレートされるべきチルトは元のチルトより小さいことが分かる。右側では、チルト平面が変化している。すなわち、φ−φ’=90°であり、チルトはuからvまではt=2であり、そして、uからv’まではt’=4である。この場合には、チルトが乗算され、vからv’までの転位の相対チルトは2×4=8である。
【0053】
SIF(「スケール不変特性」):画像が回転されるとき、又は画像が並進するときにはほとんど変化せず、画像にズームが適用されるときにもわずかな変化だけで維持することができる、デジタル画像に添付される数又は数の集合。従ってSIFは、画像内の画素を、その位置、フレーミング、向き、及びズームとは無関係に、認識することを可能にする。そのような指標の典型的な例が、SIFT(「スケール不変特性変換」)法によって得られる。
【0054】
本発明は、以下の分野:
− 1本のフィルムの種々の画像又は数本のフィルムの種々の画像の比較;
− 連続位置又は同時位置に配置された1台のカメラ又は数台のカメラによって撮影された種々の画像の比較;
− カメラを搭載した車両内での、例えばそのナビゲーションなどのための使用;
− 画像と任意の直線に対して対称化された画像とにこの方法適用することによる、画像内の斜対称の検出;
− 動く物体(人間、動物、機械)の認識;
− 写真、絵画、及び一般的な視覚芸術作品の比較又は分類;
− 大規模な個別の、又は集合的画像データベースの編成及び管理;
− 数個のビューからの場面又は物体のレリーフの再構築;
− 1台又は複数のカメラによって撮影された画像の較正又は格付け;
− 空中、空間、又は地上のビューの比較による、平面又はレリーフとしての地図製作;
− 記号、単語、印刷文字又はロゴの認識;及び
− 1つの完全なシーケンスに存在する物体を追跡するためのフィルムへの適用;
のうちの1つに有効に適用することができる。
【0055】
当然ながら本発明は、前述の例だけに限定されるものではなく、これらの例には、本発明の範囲を超えることなく多くの調整を加えることができる。

【特許請求の範囲】
【請求項1】
クエリーと呼ばれるデジタル画像とターゲットと呼ばれるデジタル画像とに適用される物体認識方法であって:
a)各回転・チルト対ごとにシミュレート画像を作成するために、各デジタル画像から、複数のデジタル回転と1ではない少なくとも2つのデジタルチルトをシミュレートし;そして、
b)クエリーとターゲットとの間の類似又は同一の物体を認識するのに使用される、SIF(スケール不変特性)と呼ばれる局所的特徴を決定するために、シミュレート画像上で、並進、回転及びズームにおいて不変である値を生成するアルゴリズムを適用する;
前記方法。
【請求項2】
任意のビューからのターゲットに含まれる別の物体の形状と類似又は同一の形状を有する物体の、撮影された任意のビューをクエリーが含むこと、そして、2つの物体のSIFが類似している回転・チルト対が決定されること、を特徴とする、請求項1に記載の方法。
【請求項3】
クエリーとターゲットについて、及び、同じ回転・チルト対について、同一数のシミュレート画像が生成されることを特徴とする、請求項1又は2に記載の方法。
【請求項4】
クエリーとターゲットについて、異なる数のシミュレート画像が生成されることを特徴とする、請求項1又は2に記載の方法。
【請求項5】
1チルト当たりの回転の数が、チルトの値が増加するに従って同時に増加することを特徴とする、請求項1〜4のいずれか1項に記載の方法。
【請求項6】
チルトが、デジタル画像の上方の半球における緯度の関数であって、2つの連続するチルト間の緯度の差が、チルトが増加するに従って同時に減少することを特徴とする、請求項1〜5のいずれか1項に記載の方法。
【請求項7】
考慮されるチルトは、有限等比数列1,a,a,a,…,a(ここで、aは1より大きい数である)をほぼ形成することを特徴とする、請求項1〜6のいずれか1項に記載の方法。
【請求項8】
aはほぼルート2であり、そして、nは、回転・チルト対がターゲットとクエリーとの両方に適用される場合に2〜6の範囲にあり、回転・チルト対が2つの画像のうちの一方だけに適用される場合に2〜12の範囲にあることを特徴とする、請求項7に記載の方法。
【請求項9】
所与のチルトtについて、デジタル回転が、ほぼ等差数列0,b/t,2b/t,…,kb/t°(ここで、bは度数であり、そして、kは整数である)を形成することを特徴とする、請求項1〜8のいずれか1項に記載の方法。
【請求項10】
bはほぼ72°であり、kは、kb/tが180°未満になるような最後の整数値であることを特徴とする、請求項9に記載の方法。
【請求項11】
チルトtを適用することが、デジタル画像をtに等しい値から一定方向にアンダーサンプリングすることからなることを特徴とする、請求項1〜10のいずれか1項に記載の方法。
【請求項12】
チルトtを適用することが、デジタル画像を一定方向にアンダーサンプリングし、そして、一定方向と直交する方向にオーバーサンプリングすることからなることを特徴とする、請求項1〜11のいずれか1項に記載の方法。
【請求項13】
クエリーと呼ばれる1つ以上の画像とターゲットと呼ばれる1つ以上の画像とに適用されること;SIFの辞書を構築するように、クエリーに関連するSIFが、前の較正段階の過程において決定されること;及び、各ターゲットから獲得されたSIFが前記辞書内のSIFと比較される操作段階の過程において、ターゲットに関連するSIFがそれぞれ決定されることを特徴とする、請求項1〜12のいずれか1項に記載の方法。
【請求項14】
同じデジタル画像との比較によるデジタル画像に適用されるか、あるいは、前記同じデジタル画像の変換に適用されて、このデジタル画像内の斜対称、反復形状、又は周期性を有する形状を決定することを特徴とする、請求項1〜13のいずれか1項に記載の方法。
【請求項15】
クエリーと呼ばれるデジタル画像とターゲットと呼ばれるデジタル画像とに適用される、請求項1〜14のいずれか1項に記載の物体認識方法の適用のためのデバイスであって:
a)各回転・チルト対ごとにシミュレート画像を作成するために、各デジタル画像から、複数のデジタル回転と1ではない少なくとも2つのデジタルチルトとを適用すること;及び
b)クエリーとターゲットの間の類似又は同一の物体を認識するのに使用される、SIF(スケール不変特性)と呼ばれる局所的特徴を決定するために、シミュレート画像上に、並進、回転及びズームにおいて不変である値を生成するアルゴリズムを適用すること;
のために構成された処理回路を備える前記デバイス。
【請求項16】
SIFの辞書が記憶されるメモリ空間を備えること、そして、処理回路が前記デジタル画像のSIFを前記辞書内のSIFと比較するように構成されていることを特徴とする、請求項15に記載のデバイス。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2011−521372(P2011−521372A)
【公表日】平成23年7月21日(2011.7.21)
【国際特許分類】
【出願番号】特願2011−510028(P2011−510028)
【出願日】平成21年5月18日(2009.5.18)
【国際出願番号】PCT/FR2009/050923
【国際公開番号】WO2009/150361
【国際公開日】平成21年12月17日(2009.12.17)
【出願人】(508133880)エコル ポリテクニック (2)
【出願人】(510304667)
【氏名又は名称原語表記】ECOLE NORMALE SUPERIEURE
【Fターム(参考)】