説明

拡張画像識別

画像の表現を導出する方法を説明する。この方法は、画像に対応する信号を処理することを含む。画像の3次元表現が導出される。画像の3次元表現は、画像の表現を導出するのに使用される。1つの実施の形態では、画像の各線は第1のパラメータ(d)と第2のパラメータ(θ)によって定義され、各線上の位置は第3のパラメータ(t)によって定義される。これらの第1のパラメータ、第2のパラメータ、及び第3のパラメータによって3次元表現がパラメータ化される。第1のパラメータの或る値において3次元表現から値の集合を抽出し、抽出値の集合における線又は線の一部に沿って汎関数を適用する。それらの線は第2のパラメータ又は第3のパラメータの値に沿って延在する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像を表現する方法及び装置、並びに、例えば検索又は検証のために画像を比較又は照合する方法及び装置に関する。
【背景技術】
【0002】
本発明は、画像のトレース変換から特徴を抽出する新たな方法に関する。この方法は、同時係属中の欧州特許出願第06255239.3号、同時係属中の英国特許出願第0700468.2号、及び英国特許出願第0712388.8号に記載の画像識別方法及び画像識別装置に対する改善を提供する。欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号の内容は参照により本明細書に援用され、それらの特許文献に記載されているそれらの発明の詳細及び実施の形態は、本発明及び本発明の実施の形態にも同様に適用される。
【0003】
欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号に記載されている画像識別方法及び画像識別装置のそれぞれは、画像から短いバイナリ記述子を抽出し(図2を参照)、従来技術の多くの欠点に対処し、特に以下によって特徴付けられる:
・特徴抽出及び特徴マッチングの双方の計算複雑度の低減
・画像記述子サイズの低減
・様々な画像の変更に対するロバスト性の増加、
・広範囲にわたる画像の変更に関して通常99.8%の検出率(detection rate)を維持しながら、誤検出率(false alarm rate)を0.1ppmレベルへ低減
【0004】
しかしながら、実際の用途では、誤検出率が0.1ppm未満であり且つ検出率が99.8%以上に維持されることが望ましい。また、この性能レベルを、複雑な画像の変更を含む、より困難な試験条件下で維持することが望ましい。
【発明の概要】
【0005】
第1の態様によれば、本発明は、添付の請求項1又は請求項21において定義される、画像の表現(representation of an image)を導出する方法を提供する。
【0006】
第2の態様によれば、本発明は、本発明の第1の態様に従って導出された画像の表現を比較することによって、例えば画像マッチングのために画像を比較する方法を提供する。
【0007】
本発明の他の態様は、本発明の第1の態様に従って導出された画像表現の使用、本発明の第1の態様及び/又は第2の態様による方法を実行するための装置及びコンピュータプログラムを含む。
【0008】
本発明は、画像のトレース変換(又は等価な画像の2次元関数)から特徴を抽出する新たな方法に関する。この技術分野において既知のように、トレース変換は、全ての可能な線を画像上に射影し、この表現は、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号において開示されている技法において使用される。
【0009】
説明される本発明の実施の形態は、画像から円形情報(circular information)を抽出することによって従来技術による研究を拡張する。この円形情報は、トレース変換を行うのと同時に非常に効率的に抽出することができる。
【0010】
欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号では、トレース変換は、画像を直線でトレースすることによって計算され、この直線に沿って画像強度又はカラー関数の特定の汎関数Tが計算される。汎関数は、通常は関数のベクトル空間V上の実数値関数である。トレース変換の場合、画像領域における線にトレース汎関数が適用される。異なる複数の汎関数Tを使用して、所与の入力画像から異なる複数のトレース変換を作成する。2D平面において、線は角θ及び距離dという2つのパラメータによって特徴付けられる。そのため、画像のトレース変換は、各トレース線のパラメータの2D関数となる。次に、トレース変換の距離パラメータに沿ってダイアメトリック汎関数(diametrical functional)Pを適用することによって、サーカス関数(circus function)が計算される。
【0011】
欧州特許出願第06255239.3号では、(例えばフーリエ変換によって)サーカス関数の周波数表現を計算し、周波数振幅成分に対して定義された特定の関数(例えば、関数は任意の2つの隣り合う周波数振幅の大きさの差分とすることができる)の符号を取ることによって、成分バイナリ識別子(component binary identifier)が構築される。
【0012】
英国特許出願第0700468.2号では、画像はストリップ及び/又は二重円錐を用いてさらにトレースされる。異なる幅のストリップ及び/又は異なる開口角の円錐を使用することによって、トレース変換のマルチ解像度表現、すなわちサーカス関数が得られる。欧州特許出願第06255239.3号のように、各サーカス関数からバイナリ識別子が抽出される。英国特許出願第0712388.8号では、トレース領域における空間的に制限された領域(バンド)を使用してサーカス関数を計算し、これらの空間的に制限された領域は画像領域における円錐に対応する。ここでもまた、周波数表現を計算することによって成分バイナリ識別子が構築される。この識別子は、異なる複数の汎関数を使用することによって得られる成分識別子の「族」から選択されたストリングフラグメント(string fragment)を、ストリップ及び/若しくは二重円錐と、並びに/又は空間的に制限された異なる複数のバンドと組み合わせて単一の記述子にすることによって得られる。
【0013】
本発明の実施形態を添付の図面を参照して説明する。
【図面の簡単な説明】
【0014】
【図1】図1aは、画像を示す図である。図1bは、図1aの画像を縮小したバージョンを示す図である。図1cは、図1aの画像を回転させたバージョンを示す図である。図1dは、図1aの画像をぼかしたバージョンを示す図である。図1eは、図1aの画像を(左右に)反転させたバージョンを示す図である。図1fは、図1aの画像を高圧縮したバージョンを示す図である。図1gは、図1aの画像をクロップしたバージョンを示す図である。
【図2】従来技術による、画像とそのビット列表現を示す図である。
【図3】バイナリ識別子の抽出を示す図である。
【図4】トレース変換の線パラメータ化を示す図である。
【図5】本明細書では「トレースキューブ」と呼ばれる、角θ、距離d、及び線上の位置tに関する画像の3D表現を示す図である。
【図6】トレースキューブから画像領域における円形情報に等価な情報を抽出する方法を示す図である。θの線に沿って汎関数を適用することによって画像領域における円に関する情報を取得し、1Dトレース円形関数は、円の半径に対応する線の上の位置tに関する。
【図7】トレースキューブから取得することができるさらなる円形情報を示す図である。線位置t上の区間に沿って汎関数を適用することによって、画像領域における円形バンドに関する情報を得ることができる。
【図8】本発明の実施形態による装置のブロック図である。
【発明を実施するための形態】
【0015】
画像の表現(representation of an image)、具体的には画像識別子(image identifier)を導出し、そのような表現/識別子を、例えば1つ又は複数の画像の識別、マッチング、或いは検証のために使用する様々な実施形態を以下に説明する。本発明は、画像を識別するために特に有用であるが、画像の識別に限定されるものではない。説明する実施形態において、「画像識別子」(又は単純に「識別子」)は画像の表現の一例であり、この用語は単に画像の表現又は記述子を表すのに使用される。
【0016】
当業者であれば、本発明の実施形態による画像識別装置及び画像識別方法の具体的設計の詳細、並びに、画像識別において使用するための画像識別子の導出は、ロバストであるべき画像変更の種類、識別子の大きさ、抽出及びマッチングの複雑度、目標誤検出率等に関連する要件によって決まることを理解するであろう。
【0017】
実施形態において、本発明は、(i)トレース変換の3次元への拡張(本明細書において「トレースキューブ」と呼ばれる)と、(ii)効率的な円形画像特徴の新たなクラスと、(iii)トレースキューブからの特徴抽出の方法と、(iv)特徴マッチングの方法とを含む。本発明の1つの態様によれば、画像のトレース変換を行うとき、トレース変換において従来から使用されるパラメータd、θに加えて、トレース線に沿った位置を表す追加のパラメータtを導入することによって、画像の3D表現が得られる。本発明の別の態様によれば、3次元構造からスライスが切り取られ、中間表現、すなわち3次元構造から抽出された値の集合を生成する。本発明のさらなる態様によれば、d=0においてスライスが切り取られ、2種類の円形情報(circular information)が抽出されて識別子を作成するのに使用される。
【0018】
以下の例では、画像に対する以下の変更に対してロバストな識別子をもたらす一般的設計を示す(これは網羅的なリストではない)。
・減色
・ぼかし
・輝度値変更
・反転(左右及び上下)
・グレースケール変換
・ヒストグラム等化
・JPEG圧縮
・ノイズ
・回転
・クロップ
・スケーリング
【0019】
この一般的設計は、広範な画像に対して0.05ppm(百万分率)未満という非常に低い誤検出率を達成することができ、検出率は通常、99.7%を超えることがわかっている。
【0020】
図1は、画像とその画像の変更バージョンの一例を示す。より具体的には、図1aは原画像であり、図1bは図1aの画像を縮小したバージョンであり、図1cは図1aの画像を回転させたバージョンであり、図1dは図1aの画像をぼかしたバージョンであり、図1eは図1aの画像を反転させたバージョンであり、図1fは図1aの画像を圧縮したバージョンであり、図1gは図1aの画像をクロップしたバージョンである。
【0021】
本発明の実施形態は、画像の表現を導出する。より具体的には、画像に対応する信号を処理することによって画像識別子を導出する。
【0022】
抽出の初期段階において、画像はサイズ変更及びフィルタリングによって任意選択で前処理される。サイズ変更ステップは、画像を処理前に正規化するために使用される。フィルタリングステップは、エイリアシング等の効果を除去するためのフィルタリングを含むことができ、また領域選択及びテーパリングも含むことができる。好ましい実施形態では、画像は192×N又はN×192の解像度にサイズ変更される。ここで、N≧192であり、画像の縦横比を維持する。別の実施形態では、画像は192×192の正方形にサイズ変更される。次に、画像は3×3のガウスカーネルを使用してローパスフィルタリングされ、さらなる処理のために画像の中心から円形領域が抽出される。いくつかの変換においては、円形中心領域を抽出するときにテーパリングされたエッジを使用することによって性能が改善される。好ましい実施形態では、7ピクセルのテーパサイズを使用する。前処理ステップは任意選択であり、上記のものの任意の組み合わせを含むことができる。代替的な値、例えば異なる画像変更サイズや、異なるガウスカーネルサイズを使用することもできる。
【0023】
トレース変換は、全ての可能な線を画像に射影し、これらの線に汎関数を適用する。汎関数は、通常は関数のベクトル空間V上の実数値関数である。トレース変換の場合、画像領域における線にトレース汎関数が適用される。図4に示されるように、線は、距離d、角θ、及び線上の位置tによってパラメータ化される。トレース変換の列にさらなる汎関数を適用して、実数値ベクトルを得ることができる。この第2の汎関数はダイアメトリック汎関数として知られ、結果として得られるベクトルはサーカス関数として知られている。第3の汎関数であるサーカス汎関数(circus functional)をサーカス関数に適用して、単一の数を得ることができる。この結果の特性は、3つの異なる汎関数(トレース汎関数、ダイアメトリック汎関数、及びサーカス汎関数)を適切に選択することによって制御することができる。画像及び対応するトレース変換の例を含むトレース変換の全詳細は、例えば参照として本明細書中に援用される下記の参考文献[1]に見ることができる。
【0024】
トレース変換は画像から線を抽出することに関するものであるが、トレース変換の概念及びトレース変換の抽出プロセスを、画像から或る円形情報(circular information)を効率的に抽出することに拡張することができる。本発明によれば、図5に示すように、パラメータd、θ、及びtに関する画像の3D表現が生成される。この新たな表現は3Dボリュームであり、本明細書において「トレースキューブ」と呼ばれる。トレースキューブは従来のトレース変換よりもはるかに多くの情報を保有し、円又は楕円のような画像領域における非線形領域に関する情報を含む。本発明の1つの実施形態によれば、d=0の位置においてトレースキューブからスライスが切り取られ、これによって2つの種類の円形情報を抽出することが可能になる。
【0025】
図6に示す第1の種類の情報の抽出プロセスでは、θパラメータに沿って汎関数を適用する。これは汎関数を画像領域における円周に適用することと等価である。その結果、線上の位置tに関する1次元関数が得られ、この場合にはtは円の半径に関連する。本明細書において、この関数はトレース円形関数(trace-circular function)と呼ばれる。
【0026】
図7に示すように、第2の種類の円形情報は、画像領域における円形領域に関する。汎関数を区間t0≦|t|≦t1における線の一部分のみに適用することによって、角θに関する1次元信号が得られる。図7はt0=0の場合を示しているが、これは必須ではなく、より大きな値t0>0を取れば環形が得られる。環形は2つの同心円から成る。t0及びt1の値は、同心円の半径を定義する。この関数を、トレース環形関数(trace-annular function)と呼ぶことにする。
【0027】
実際には離散データを使用するためd=0を利用できない場合がある。その場合には、+/−Δdに対応する2つのスライスを使用することができる。これらの2つのスライスは、例えば、結果として得られるトレース円形関数及びトレース環形関数を2つのスライスに関して合算することによって組み合わされる。
【0028】
本方法の1つの特定の例において、トレース汎関数は
【0029】
【数1】

【0030】
によって与えられる。
【0031】
しかしながら、当業者であれば理解するように、用途の具体的な要件に応じて他の種類の汎関数を使用することができる。
【0032】
次に、本発明によるトレース環形関数とトレース円形関数は、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号において記載される方法と類似した、以下で完全を期して説明される方法を使用してバイナリ識別子に変換される。
【0033】
上で挙げた多くの画像の変更操作に関して汎関数を適切に選択すると、画像aのトレース環形関数又はトレース円形関数f(a)は、変更された画像a’の関数f(a’)をシフト又は(振幅を)拡大縮小したものに過ぎない。
【0034】
【数2】

【0035】
ここで、式(2)のフーリエ変換を行うことによって次式が得られる。
【0036】
【数3】

【0037】
次に、式(5)の振幅を取ると次式が得られる。
【0038】
【数4】

【0039】
式(6)から、変更された画像と原画像とは、もはやスケーリング係数κを除いて同じであることが分かる。
【0040】
図3は、フーリエ変換係数に対するバイナリ関数を定義する方法を示している。特に、ステップ171においてフーリエ変換の高調波(harmonics)を得た後、ステップ172において複数のフーリエ変換の高調波の振幅の対数を得る。
【0041】
本実施形態によれば、ステップ173において、複数のフーリエ変換の高調波の振幅係数上で関数c(ω)を定義する。この関数の1つの例示は、近傍高調波の差分を取ることである。
【0042】
【数5】

【0043】
ステップ174において、結果として得られるベクトル(式(7))に以下のような閾値を適用することによって、バイナリ列を抽出することができる。
【0044】
【数6】

【0045】
Sの適切な選択には、S=0及びS=mean(c)が含まれる。次に、これらの値B={b0,...,bn}から出力画像識別子(ステップ175)が構築される。
【0046】
長さが共にNの2つの異なる識別子B1とB2の間で識別子のマッチングを行うために、正規化ハミング距離を取る。
【0047】
【数7】

【0048】
ここで
【0049】
【数8】

【0050】
は排他的OR(XOR)演算子である。代替的には、識別子内の様々な成分(ビットの部分集合)が独立した情報を保有しているため、スケーラブルな識別子構造及びスケーラブルなマッチングを使用することができる。Nビットから成る識別子全体を、S個の重複しない(別個の)ビットの部分集合{B1,B2,...,BS}に分割することができる。
【0051】
そして、要求される性能、或いはこの用途に利用可能な計算資源/メモリ資源/送信資源に応じて、選択された部分集合に対してマッチングを行うことができる。
【0052】
好ましい実施態様では、N=512であり、要求される性能に基づいて、それぞれが128ビットから成る4つの部分集合が選択される。通常、部分集合B1によるマッチングは98.82%の検出率をもたらす。部分集合B1∪B2では99.60%、B1∪B2及びB1∪B2∪B3では99.69%の検出率を与える。全体集合Nは99.72%の標準性能を有する。
【0053】
当業者であれば理解するように、集合の数及びそれらの構造は、用途の要件に応じて決まる。さらに、特定の部分集合を、特定の変更に対するロバスト性を提供するように選択することができることに留意されたい。識別子又は表現を比較する他の方法を使用することもできる。
【0054】
識別子内の特定ビットを選択することによって、性能をさらに改善することができる。周波数変換における低い周波数に対応するビットは一般にロバスト性が高く、上位ビットは識別性が高い。本発明の特定の実施形態では、DC成分に対応する最初のビットb0を無視し、識別子は次の48ビットから成る。
【0055】
好ましい実施形態では、本発明において説明される円形情報から抽出されたビットは、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号のうちの1つ又は複数において記載されている方法で抽出されたビットと組み合わされる。本発明の円形情報を使用しない場合、最良の性能は、英国特許出願第0712388.8号の好ましい実施形態を使用して得られ、0.05ppm(百万分率)の誤検出率における性能は98.9%であり、本発明において説明される円形情報を加えると、性能は通常では99.7%を超えて上昇する。
【0056】
好ましい実施形態では、英国特許出願第0712388.8号に記載されるように、画像から17個の基本識別子が抽出される。さらに、トレース円形関数から1つの識別子が抽出され、3つのトレース環形関数から3つの識別子が抽出される。3つのトレース環形関数は、半径が増加する環形に対応する。
【0057】
上記の方法を実行する本発明の実施形態による装置の一例が図8に示されている。このアプリケーションは、データベース230内に記憶される画像に関する識別子データベース240を構築することを含む。2つのデータベース230及び240は、同じデータベース又は別個のデータベースとすることができる。この装置によって、問い合わせ画像250から抽出された識別子260を検索して、データベース内の一致するものを見つけることが可能になる。おそらく順序付けされている画像のリストがユーザ290又は問い合わせアプリケーションに返される。
【0058】
代替的な実施態様
好ましい実施形態では、d=0においてトレースキューブからスライスが切り取られる。代替的には、スライスはd≠0において切り取られてもよく、このスライス内の情報は画像領域における円ではなく楕円に対応する。
【0059】
トレース環形関数とトレース円形関数から導出される識別子は、好ましくは、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号において記載されている識別子と組み合わされる。しかしながら、この組み合わせは必須ではなく、トレース環形関数及び/又はトレース円形関数のみを使用することによっても良好な識別性能を得ることができる。
【0060】
代替的なアプリケーション
識別子はまた、ビデオシーケンス内のフレームをインデックス付けするために使用することもできる。新たなシーケンスが与えられると、フレームから識別子が抽出され、同一シーケンスを見つけるために検索を行うことができる。これは、著作権の検出及びシーケンスの識別のために有用であり得る。
【0061】
複数の放送会社が同一のコンテンツ、例えば広告或いは株式ニュースの映像を送信する場合が多い。放送会社間のナビゲーションのために、識別子を使用してこれらのコンテンツ間にリンクを形成することができる。
【0062】
画像識別子は、画像によってコンテンツを結びつける機会を提供する。ユーザがウェブページ上の特定の画像に興味がある場合、同一画像を有する他のページを見つける有効な方法はない。識別子を使用することによって画像間のナビゲーション経路を提供することができる。
【0063】
識別子を使用することによってブロードキャストフィード内の広告を検出することができる。これを用いて広告主が自社のキャンペーンを追跡するための自動監視を提供することができる。
【0064】
大規模な商用セットからパーソナルコンピュータ上の小規模なコレクションまで多くの画像データベースが存在する。データベースが厳格に制御されていない限り、通常はセット内の画像に重複があり、それによって余分な記憶領域が無駄に必要となる。識別子は、これらのデータセット内の重複画像を削除又は紐付けするツールとして用いることができる。
【0065】
品質の悪い、おそらく高圧縮率の画像を受信すると、ユーザはより高品質のバージョンを見つけることを望む場合がある。識別子を使用することによって、高解像度のバージョンを求めてデータベース又はインターネットを検索することができる。
【0066】
本明細書中、「画像」という用語は、フィルタリング、解像度の変更、アップサンプリング、ダウンサンプリング等の後処理を含む画像単位を説明するために使用されるが、フレーム、フィールド、ピクチャ、又は画像、フレーム等のサブユニット若しくは領域等の他の同様の用語にも当てはまる。本明細書中、画像という用語は、文脈から明らかである場合を除き、画像全体又は画像の領域を意味する。同様に、画像の領域は画像全体を意味し得る。画像は、フレーム又はフィールドを含み、静止画、又はフィルム若しくはビデオのような画像シーケンス、若しくは関連画像群内の画像に関連する。画像は、グレースケール画像若しくはカラー画像、又は別の種類のマルチスペクトル画像、例えば、IR画像、UV画像若しくは他の電磁波画像、又は音響画像等であり得る。
【0067】
説明された実施形態において、周波数表現はフーリエ変換を使用して導出されたが、周波数表現はハール変換等の他の技法を用いて導出することもできる。さらに、フーリエ変換という用語は、DFT及びFFT等の変形を包含することを意図する。
【0068】
本発明は、適切な装置を使用して電気信号を処理することによって実施されることが好ましい。
【0069】
本発明は、例えば、適切なソフトウェア及び/又はハードウェアの変更を加えたコンピュータシステムにおいて実施することができる。例えば、本発明は、プロセッサ若しくは制御装置等の制御手段若しくは処理手段、メモリ、磁気記憶装置、CD、DVD等のような画像記憶手段を含むデータ記憶手段、ディスプレイ若しくはモニタ若しくはプリンタのようなデータ出力手段、キーボードのようなデータ入力手段、及びスキャナのような画像入力手段、又はこれらの構成要素の任意の組み合わせを付加的な構成要素と共に有するコンピュータ等を使用して実施することができる。本発明の態様は、ソフトウェア及び/若しくはハードウェアの形態において提供することができる。又は、特定用途向け装置或いはチップ等の特定用途向けモジュールを提供することができる。本発明の実施形態による装置におけるシステムの構成要素は、他の構成要素から離れた場所に、例えばインターネットを介して設けられてもよい。
【0070】
当業者であれば理解するように、説明した実施形態に対して多くの変形及び修正を行ってもよい。例えば、説明した実施形態では、トレース変換の概念を拡張することによって、画像の3次元表現を生成するが、他の技法を使用して画像を3次元で表現することもできる。さらに、円形情報又は楕円形情報のような非線形情報を導出する他の技法を使用することもできる。本発明の精神及び範囲に入る変形、修正、及び等価物を全て含むことが意図される。
【0071】
参考文献
[1]Alexander Kadyrov、Maria Petrou著「The Trace Transform and Its Applications」(IEEE Trans. PAMI, 23(8), Aug., 2001, pp 811-828)

【特許請求の範囲】
【請求項1】
画像に対応する信号を処理することによって該画像の表現を導出する方法であって、
前記画像を処理して該画像の3次元表現を得ることと、
前記画像の3次元表現を使用して前記画像の表現を導出することと
を含む、画像の表現を導出する方法。
【請求項2】
前記画像を横切る線が第1のパラメータと第2のパラメータによって定義され、
該線上の位置が第3のパラメータによって定義され、
前記画像の3次元表現は、前記第1のパラメータ、前記第2のパラメータ、及び前記第3のパラメータによってパラメータ化される、請求項1に記載の方法。
【請求項3】
前記画像の3次元表現は、
前記画像を横切る複数の線をトレースすることであって、それぞれの線は第1のパラメータと第2のパラメータによって定義され、それぞれの線上の位置は第3のパラメータによって定義される、トレースすることと、
前記第1のパラメータ、前記第2のパラメータ、及び前記第3のパラメータによって表される前記画像の3次元表現を導出することと
によって得られる、請求項1又は2に記載の方法。
【請求項4】
前記3次元表現を使用して前記画像の表現を導出することは、
前記3次元表現における複数の線に沿って汎関数を適用して前記画像の表現を導出することを含み、
前記3次元表現は、第1のパラメータ、第2のパラメータ、及び第3のパラメータによって定義される、請求項1、2、又は3に記載の方法。
【請求項5】
前記第1のパラメータが所定値のときの前記3次元表現における複数の値を抽出することと、
該3次元表現における該複数の抽出値における1つ又は複数の線に沿って前記汎関数を適用することと
をさらに含み、
それぞれの線は、前記第3のパラメータが固定値のときの前記第2のパラメータの値に沿って延在する、請求項3又は4に記載の方法。
【請求項6】
前記第1のパラメータが所定値のときの前記3次元表現における複数の値を抽出することと、
該複数の抽出値における1つ又は複数の線分に沿って前記汎関数を適用することと
をさらに含み、
該線分は、前記第3のパラメータによる所定位置の間の区間によって定義され、それぞれの線は、前記第2のパラメータが固定値のときの前記第3のパラメータの値に沿って延在する、請求項3又は4に記載の方法。
【請求項7】
複数の隣接する線分に沿って前記汎関数を適用することを含む、請求項6に記載の方法。
【請求項8】
前記第1のパラメータが0に等しいときの前記3次元表現における複数の値を抽出することを含む、請求項5、6、又は7に記載の方法。
【請求項9】
前記第1のパラメータが正の所定値のときの前記3次元表現における複数の値を抽出して、第1の抽出値の集合を導出することと、
前記3次元表現における複数の値を抽出して、第2の抽出値の集合を導出することと
を含む、請求項5、6、又は7に記載の方法。
【請求項10】
前記第1の抽出値の集合及び前記第2の抽出値の集合におけるそれぞれの線に沿って汎関数を適用して、第1の関数及び第2の関数をそれぞれ導出することと、
該第1の関数と該第2の関数とを組み合わせることと
をさらに含む、請求項9に記載の方法。
【請求項11】
1次元関数を導出することを含む、請求項1〜10のいずれか一項に記載の方法。
【請求項12】
前記1次元関数を使用して前記画像のバイナリ表現を導出することをさらに含む、請求項11に記載の方法。
【請求項13】
周波数成分の振幅を使用して前記画像の表現を導出することを含む、請求項1〜12のいずれか一項に記載の方法。
【請求項14】
前記周波数成分は、フーリエ変換又はハール変換を使用して求められる、請求項13に記載の方法。
【請求項15】
前記周波数成分の振幅を使用して前記画像の表現を導出することは、
複数の周波数係数の振幅を計算することと、
各係数の振幅とその次の係数の振幅との間の差分を求めることと
を含む、請求項13又は14に記載の方法。
【請求項16】
前記周波数成分の振幅を使用して前記画像の表現を導出することは、
複数の周波数係数の振幅の対数を計算することと、
各係数の振幅の対数とその次の係数の振幅の対数との間の差分を求めることと
を含む、請求項13又は14に記載の方法。
【請求項17】
バイナリ関数を導出することをさらに含み、
該バイナリ関数は、前記求められた差分のそれぞれに閾値を適用して一連のバイナリ値を導くことによって導出され、
前記閾値を適用することは、前記差分が該閾値未満である場合にバイナリ値0を与え、前記差分が該閾値以上である場合にバイナリ値1を与える、請求項15又は16に記載の方法。
【請求項18】
n個の数字又はビットを有する表現を導出することを含み、m個の数字又はビットの部分集合を選択することをさらに含む、請求項1〜17のいずれか一項に記載の方法。
【請求項19】
前記3次元表現における複数の線に沿って異なる複数の汎関数を適用することによって前記画像の複数の表現を導出することと、
該複数の表現のうちの2つ以上を組み合わせることと
を含む、請求項1〜18のいずれか一項に記載の方法。
【請求項20】
前記組み合わせることは、前記2つ以上の表現を連結することを含む、請求項18に記載の方法。
【請求項21】
画像に対応する信号を処理することによって該画像の表現を導出する方法であって、
前記画像を処理して該画像の非線形領域に関する情報を得ることと、
前記情報を使用して前記画像の表現を導出することと
を含む、画像の表現を導出する方法。
【請求項22】
前記情報は円形情報である、請求項21に記載の方法。
【請求項23】
請求項1〜22のいずれか一項に記載の方法を使用することによって、画像を識別又は比較する方法。
【請求項24】
画像を識別する方法であって、
請求項1〜23のいずれか一項に記載の方法を使用することによって、該画像の表現を導出することと、
該表現を該画像と関連付けることとを含む、画像を識別する方法。
【請求項25】
画像を比較する方法であって、請求項1〜24のいずれか一項に記載の方法を使用することによって導出される各画像の表現を比較することを含む、画像を比較する方法。
【請求項26】
前記比較は、式:
【数1】

を使用してハミング距離を求めることを含み、ここで、
【数2】

は排他的OR(XOR)演算子であり、Nは識別子B1及びB2の長さである、請求項25に記載の方法。
【請求項27】
表現の前記比較に基づいて画像を選択することを含む、請求項25又は26に記載の方法。
【請求項28】
請求項1〜27のいずれか一項に記載の方法を使用することによって導出される表現の、例えば送信又は受信を含む使用。
【請求項29】
請求項1〜27のいずれか一項に記載の方法を実行する装置。
【請求項30】
前記装置の動作を制御して請求項1〜27のいずれか一項に記載の方法を実行させる制御装置を備える、請求項29に記載の装置。
【請求項31】
画像及び/又は画像の表現を記憶する記憶手段、例えば画像データベース及び/又は記述子データベース、表示手段、並びに画像選択手段のうちの1つ又は複数をさらに備える、請求項29又は30に記載の装置。
【請求項32】
請求項1〜27のいずれか一項に記載の方法を実行するコンピュータプログラム、システム、又はコンピュータ読み取り可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2011−501257(P2011−501257A)
【公表日】平成23年1月6日(2011.1.6)
【国際特許分類】
【出願番号】特願2010−528467(P2010−528467)
【出願日】平成20年6月30日(2008.6.30)
【国際出願番号】PCT/GB2008/002251
【国際公開番号】WO2009/047471
【国際公開日】平成21年4月16日(2009.4.16)
【出願人】(501253316)ミツビシ・エレクトリック・アールアンドディー・センター・ヨーロッパ・ビーヴィ (77)
【氏名又は名称原語表記】MITSUBISHI ELECTRIC R&D CENTRE EUROPE B.V.
【住所又は居所原語表記】20 Frederick Sanger Road, The Surrey Research Park, Guildford, Surrey GU2 5YD, Great Britain
【Fターム(参考)】