説明

情報処理装置及びその制御方法、プログラム

【課題】 画像の種類にかかわらず、検索精度を維持しつつ画像検索の処理速度を向上させるための技術を提供する。
【解決手段】 画像の局所的な特徴がそれぞれ対応づけて予めデータベースに登録された複数の登録画像から、入力画像と類似する画像を検索する情報処理装置は、前記入力画像を解析して中間値を算出する算出手段と、前記中間値を使用して、前記入力画像にマスク範囲を設定する設定手段と、前記マスク範囲を用いて前記入力画像中の特徴抽出領域を限定し、前記設定手段において使用された中間値を再利用して局所的な特徴を抽出する抽出手段と、前記入力画像の局所的な特徴と、前記複数の登録画像の局所的な特徴の各々とを比較して、該入力画像の類似画像を検索する検索手段とを備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報処理装置及びその制御方法、プログラムに関し、特に、画像から局所的な特徴を抽出する技術に関する。
【背景技術】
【0002】
画像内のオブジェクトに着目して類似画像を検索する構成として、画像の局所的な特徴を数値化した局所特徴量を使って検索を行うものが知られている(特許文献1)。この構成では、まず、画像の2次元の輝度分布に対して各種のフィルタ(Gauss、Sobel、Prewitt等)を作用させることで画像中の特徴的な点(特徴点)を抽出する。次に、特徴点及びその近傍の画素の画素値を使用して、その特徴点に関する特徴量(局所特徴量)を計算する。画像の検索は、クエリとなる画像と検索対象の画像とについて、局所特徴量をマッチングして行う。このような処理によって、画像の回転や縮小、部分的な切取りや隠れがあっても、精度が安定した画像検索が実現される。
【0003】
また、背景差分法を使って特徴点や局所特徴量を計算する領域を限定する手法が知られている(非特許文献1)。この手法では、固定カメラを使って物体を撮影することを前提とし、撮影画像とあらかじめ撮影した背景画像との差分を取ることによって前景領域を特定する。特定した前景領域をマスク領域として、マスク領域内だけで特徴点や局所特徴量を計算することで計算コストを削減している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−65399号公報
【非特許文献】
【0005】
【非特許文献1】古畑俊一郎,北原格,亀田能成,大田友一,“領域を限定したSIFT 特徴量の抽出”,情報処理学会第70回全国大会(2008)
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に記載の構成では、画像上のオブジェクトの有無や種類にかかわらず画像全体から局所特徴候補を抽出する。つまり、局所特徴が抽出される可能性が低い領域に対してもフィルタ適用時のコンボリューション処理など計算コストが高い処理を等しく実行している。このため、無駄な処理に起因して処理速度低下を招くことがある。
【0007】
一方、非特許文献1の手法では確かに計算コストの削減が可能だが、あらかじめ背景画像を準備する必要がある。そのため背景画像が準備されていない一般的な画像の検索には適用できない。また、マスク領域の設定処理と特徴点や局所特徴量の計算処理とが独立して別個に行われる。このため、例えば、前景領域の範囲が広くなると逆に計算コストが増加する恐れがある。
【0008】
本発明は上記課題に鑑みなされたものであり、画像の種類にかかわらず、検索精度を維持しつつ画像検索の処理速度を向上させるための技術を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明による情報処理装置は以下の構成を備える。即ち、
画像の局所的な特徴がそれぞれ対応づけて予めデータベースに登録された複数の登録画像から、入力画像と類似する画像を検索する情報処理装置であって、
前記入力画像を解析して中間値を算出する算出手段と、
前記中間値を使用して、前記入力画像にマスク範囲を設定する設定手段と、
前記マスク範囲を用いて前記入力画像中の特徴抽出領域を限定し、前記設定手段において使用された中間値を再利用して局所的な特徴を抽出する抽出手段と、
前記入力画像の局所的な特徴と、前記複数の登録画像の局所的な特徴の各々とを比較して、該入力画像の類似画像を検索する検索手段と
を備えることを特徴とする。
【発明の効果】
【0010】
本発明によれば、画像の種類にかかわらず、検索精度を維持しつつ画像検索の処理速度を向上させるための技術を提供することができる。
【図面の簡単な説明】
【0011】
【図1】情報処理装置の機能構成例を示すブロック図。
【図2】情報処理装置の概略ハード構成例を示す図。
【図3】画像の登録処理の手順を表すフローチャート。
【図4】画像の縮小変換処理を示す模式図。
【図5】画像の検索処理の手順を表すフローチャート。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して本発明に係る実施の形態を詳細に説明する。
【0013】
<<第1実施形態>>
(特徴点と局所特徴量)
まず、特徴量、局所特徴点、および局所特徴量について説明する。画像を検索条件(クエリ画像)として指定して、類似する画像を検索する場合は、2つの画像(クエリ画像とデータベース内画像)を比較する処理を繰り返し行う。画像の比較では予めその画像の内容をよく表す数値や数列を特徴として画像毎に算出する。そして、この特徴が似ている画像を類似する画像と判断し検索結果として出力する。画像を検索する際に、画像の内容を示すキーワードを用いる事もあるが、本実施形態では画像の画素値から算出した特徴量を検索・認識に用いる。なお、本明細書では、画像の特徴には、画像の特徴点と、画像の特徴点に関する特徴量との少なくともいずれかが含まれる。
【0014】
このような画像検索の例として、クエリ画像に含まれる局所的な特徴を比較する手法がある。この方式では、画像の中から両者の対応を取り易い点を選び、更に画像間で点の対応をとる。この対応の取り易い点を本実施形態では局所特徴点(feature point)と呼ぶ。このような局所特徴点はできるだけ画像内のコーナやエッジの近傍から抽出されるように構成する。局所特徴点が抽出されると、次に局所特徴点を中心とした局所的な領域を設定する。この領域内に含まれる画素値を使い、局所特徴点ごとに対応する特徴量を計算する。本実施形態ではこのように計算された特徴量を局所特徴量と呼ぶ。
【0015】
(機能構成)
図1は、第1実施形態における装置の機能構成例を示すブロック図である。図1(a)は画像登録装置100の機能構成であり、図1(b)は画像検索装置200の機能構成である。
【0016】
□画像登録装置
まず、図1(a)に示す画像登録装置100について説明する。画像登録装置100は、入力された画像の局所特徴量を算出して画像特徴データベース109に登録する情報処理装置である。画像登録装置100により、類似画像の検索対象となる画像の特徴量がデータベースに登録される。図1(a)に示すように、画像登録装置100は、画像入力部102、縮小画像生成部103、要素値計算部104、マスク範囲設定部105、局所特徴点抽出部106、局所特徴量算出部107、特徴登録部108を有している。
【0017】
画像登録装置100において、画像入力部102は局所特徴量を算出する画像(登録画像)を入力する機能要素である。縮小画像生成部103は、画像入力部102に入力された登録画像101から縮小率が異なる複数の縮小画像を生成する。
【0018】
要素値計算部104では、複数の縮小画像それぞれについて、後段のマスク範囲設定部105で利用する要素値(中間値)を計算する。ただし、要素値は、局所特徴点抽出部106での局所特徴点抽出処理あるいは局所特徴量算出部107での局所特徴量算出処理の少なくともどちらかで再利用可能な値である。本実施形態では、要素値として、入力画像の各画素位置で輝度勾配振幅を計算する例を説明するが、第2実施形態で説明するようにこれに限られない。なお、もちろん局所特徴点抽出部106と局所特徴量算出部107の両方で再利用可能であってもよい。
【0019】
マスク範囲設定部105では、要素値を使って登録画像101上にマスク範囲を設定する。局所特徴点抽出部106では、マスク範囲内だけで局所特徴点の抽出処理を行う。局所特徴点の抽出処理において、要素値を利用可能であるならば利用する。
【0020】
局所特徴量算出部107では、局所特徴点抽出部106で抽出した局所特徴点それぞれについて、局所特徴量を算出する。局所特徴量の算出処理において、要素値を利用可能であるならば利用する。特徴登録部108では、局所特徴点に関する情報と局所特徴量に関する情報とを登録画像101の画像特徴として、画像特徴データベース109に登録する。本実施形態における登録処理の詳細については後述する。
【0021】
□画像検索装置
次に、図1(b)に示す画像検索装置200について説明する。画像検索装置200は、クエリとして入力された画像に類似する画像を、画像特徴データベース109に局所特徴量が登録された画像から検索する情報処理装置である。すなわち、画像検索装置200は、画像の特徴量がそれぞれ予めデータベースに登録された複数の登録画像から、入力画像と類似する画像を検索する。ただし、図1(a)の画像登録装置100と同一機能を有する構成には同一符号を付すとともに、構成的、機能的にかわらないものについてはその説明を省略する。画像検索装置200は、画像入力部102(クエリとなる画像を入力する)、縮小画像生成部103、要素値計算部104、マスク範囲設定部105、局所特徴点抽出部106、局所特徴量算出部107、特徴比較部202を有している。
【0022】
比較手段としての特徴比較部202は、局所特徴量算出部107が算出した局所特徴量に基づいてクエリ画像201に類似した画像を画像特徴データベース109に局所特徴量が登録された画像から検索し検索結果203として出力する。本実施形態における検索処理の詳細については後述する。
【0023】
(ハードウェア構成)
上記の画像登録装置100又は画像検索装置200は、コンピュータ(情報処理装置)が所定の処理を実行することにより実現される。このようなコンピュータのハードウェア構成について、図2を参照して説明する。図2は、コンピュータのハードウェア構成例を示すブロック図である。なお、本実施形態では、コンピュータに実行させるプログラムを記憶した記憶媒体を、システム或いは装置に供給してプログラムを実行させる。
【0024】
図2に示すコンピュータ1400は、ROM1430の中に後述するフローチャートの処理をCPU1410に実行させるプログラムを格納している。そして、プログラムを実行させる際にROM1430のプログラムをRAM1420に読出しCPU1410が処理できるようにする。ここで、1450はバスであり、ROM1430、RAM1420、CPU1410およびHDD1440のデータをやりとりする。
【0025】
また、コンピュータ1400はユーザインターフェースに接続されるキーボードやマウスなどの入出力機器からの入力を受ける。コンピュータ1400は、ネットワークインターフェース1470に対して入出力等を行う。コンピュータ1400のネットワークインターフェース1470はネットワーク1500を介して、データベース(DB)1510、クライアント(CLIENT)1520、プリンタ(PRINTER)1530と通信可能である。
【0026】
コンピュータ1400は、複数のハードウェアとソフトウェアの協同によって前述の実施形態の処理を実現してもよい。例えば、図1(a),(b)で示す構成は、その構成の一部をソフトウェアで実現可能であるし、あるいは、特定の処理に特化したICでも実現可能である。他にも、ネットワークで接続している複数の機器の協同によって実現してもよい。図2を用いて例を挙げると、コンピュータ1400がプリンタ1530やクライアント1520から画像を受付けて、コンピュータ1400が図3のフローチャートの処理を行い、データベース1510に登録する構成が挙げられる。また、例えば、コンピュータ1400がクライアント1520やプリンタ1530から検索依頼とクエリ画像を受付けて、後述する図5のフローチャートの処理を行い、データベース1510からクエリ画像に類似する画像を検索する構成も挙げられる。
【0027】
(登録処理)
次に、画像から抽出する局所特徴量を登録する際に行う処理の詳細について説明する。図3は、画像登録装置100における登録処理の手順を表すフローチャートである。図3の各ステップは、CPU1410がコンピュータ1400の処理を制御して実行される。
【0028】
S201で、画像入力部102が登録画像101を読み込む。S202〜S204では、入力画像を解析して要素値(中間値)を算出する処理を行う。S202で、画像入力部102が登録画像101から輝度成分を抽出する。以下、抽出した輝度成分からなる画像データを輝度成分画像とも呼ぶ。
【0029】
S203では、画像入力部102が抽出した輝度成分を縮小画像生成部103が縮小変換し、n種の異なる解像度の輝度成分画像を新たに生成する。具体的には、例えば、縮小画像生成部103が、画像入力部102から取得した輝度成分画像を所定の縮小率pに従ってn回縮小処理を行い、結果としてn枚の縮小画像を取得する(図4参照)。ここで、縮小率p及び縮小回数nは予め決められているが、nは0以上の整数である必要がある。ただ好ましくは縮小変換を複数回実行することが好ましい。例えば、縮小して2×2画素になる回数を予め演算して決めておいてもよい。
【0030】
図4は、縮小画像生成部103の縮小変換処理を示す図である。図4は、縮小率pが2-1/4、縮小画像の枚数n(=縮小回数)が8の場合である。図4において、画像301は画像入力部102が入力画像101から抽出した輝度成分画像である。画像302は輝度成分画像から縮小率pに従って4回縮小された縮小画像である。画像303は輝度成分画像から縮小率pに従って8回縮小された縮小画像である。図中のScはスケール番号であり、縮小回数と一対一に対応している(縮小回数n=Sc−1)。
【0031】
この例では、画像302は画像入力部102からの輝度成分画像301が1/2(=p4)に縮小された画像に相当し、画像303は輝度成分画像が1/4(=p8)に縮小された画像に相当する。
【0032】
なお、本実施形態では線形補間による画像の縮小変換を想定して説明するが、これに限られない。例えば、画像を縮小変換する手法としては他にも、単純に画素を間引く手法や低域フィルタ適用後にサンプリングする手法などを用いてもよい。
【0033】
次に、S204では、縮小画像ごとに要素値(中間値)を算出する。本実施形態では、以下に示す式(1)〜(3)の値を要素値として算出する。ここで、式(1)右辺のG(x,y)はガウス関数、I(x,y)は画像の座標(x,y)における画素値であり、“*”は畳み込み演算を表す記号である。式(2)は式(1)で定義された変数Lのxに関する偏導関数、式(3)は変数Lのyに関する偏導関数である。ここで、G(x,y)は予め定められたガウス関数であり、通常は標準偏差σを変数として持つが、式(1)では省略している。本実施形態ではσ=a・rとして予め定められる。ここでaは定数であり、rは後段の処理で局所特徴量を算出する際に参照する、局所特徴点を中心とした円形領域の半径である。
【0034】
【数1】

【0035】
ステップS205では、要素値を使ってマスク範囲を設定する。本実施形態では、以下に示す式(4)を満たす画素位置にマスクを設定していく。ただし、thはあらかじめ定めるしきい値である。すなわち、本実施形態では輝度勾配の振幅がしきい値以上(th以上)となる画素位置にマスクが設定されるようにした。これは、エッジとその近傍画素をマスク範囲に設定したと見ることもできる。
【0036】
【数2】

【0037】
S206、S207では、マスク範囲を用いて入力画像中の特徴抽出領域を限定し、マスク範囲の設定において使用された要素値(中間値)を再利用して局所的な特徴を抽出する。まず、S206では、局所特徴点を抽出する。局所特徴点の抽出処理は、S205で設定したマスク範囲内の画素に対してHarris作用素(非特許文献2)を作用させて実行する。
【0038】
【非特許文献2】C.Harris and M.J. Stephens,“A combined corner and edge detector,” In Alvey Vision Conference,pages 147−152, 1988。
【0039】
具体的には、Harris作用素を作用させて得られた出力画像H(x,y)上の画素について、当該画素及び当該画素の周囲8近傍にある画素(合計9画素)の画素値を調べる。そして、この画素値が局所極大になる(当該9画素の中で当該画素の画素値が最大になる)点を局所特徴点として抽出する。ただし、画素値が局所極大になったときでも、当該画素値があらかじめ定めたしきい値以下の場合には、強健で耐性のある局所特徴点ではないものと判断し、局所特徴点として抽出しないようにする。ここで、H(x,y)は以下に示す式(5)で計算される。ただし、“*”は畳み込み演算を表す記号、kは予め定められた定数、Mは式(6)で計算される行列である。また、det(M)は行列Mの行列式、trace(M)は行列Mのトレースを表す。式(6)において、σhはあらかじめ定めた標準偏差を表す定数である。LxおよびLyはそれぞれ式(2)および式(3)で計算された数であり、S204で算出した要素値LxおよびLyを再利用することができる。
【0040】
【数3】

【0041】
S207では、S206で抽出した局所特徴点ごとに局所特徴量を算出する。本実施形態では、局所特徴点とその近傍の画素パターンを数値化したLocal Jet及びそれらの導関数の組み合わせを用いて、式(7)で示す局所特徴量を算出する(非特許文献3)。ただし、式(7)の右辺で用いている記号は、式(1)〜(3)および以下に示す式(8)〜(10)で定義される。式(8)は式(2)で定義された変数Lxのxに関する偏導関数であり、式(9)は式(2)で定義された変数Lxのyに関する偏導関数である。式(10)は式(3)で定義されたLyのyに関する偏導関数である。
【0042】
【非特許文献3】C.Schmid and R.Mohr“Localgray value invariants for image retrieval,”IEEE Trans. PAMI.Vol.19,No.5,pp530−535,1997。
【0043】
【数4】

【0044】
式(7)において、LxおよびLyはそれぞれ式(2)および式(3)で計算された数である。LxおよびLyは、例えば、S204で算出した要素値LxおよびLyを再利用することができる。なお、式(8)〜(10)で計算されるLxx、Lxy、Lyyをそれぞれ式(11)〜(13)を使って計算してもよい。この場合、Lxx、Lxy、Lyyの算出時にもS204で算出した要素値LxおよびLyを再利用できる。
【0045】
【数5】

【0046】
このように、本実施形態では、要素値として算出された輝度勾配振幅を、画像データ値として再利用して、入力画像の局所特徴量を算出する。このため、処理を効率的に実行することが可能である。
【0047】
ステップ208では、局所特徴点に関する情報と局所特徴量に関する情報とを登録画像101(画像データ、画像の識別情報など)と関連付けて画像特徴データベース109に登録する。本実施形態では、局所特徴点に関する情報として、局所特徴点の座標とスケール番号、局所特徴量に関する情報として、式(7)を使って算出される局所特徴量を登録する。
【0048】
(検索処理)
次に、画像を検索する際に行う各部の動作について説明する。図5は、画像検索装置200における検索処理の手順を表すフローチャートである。図5において、図3と同一の機能を有する工程については、同じ符号を付すとともに機能的に同等のものについてはその説明を省略する。図5の各ステップは、CPU1410がコンピュータ1400の処理を制御して実行される。
【0049】
検索処理では、まず、クエリ画像に対してS201〜S207の処理を行い、局所特徴量を算出する。そして、S401、S402において、入力画像の特徴量と、複数の登録画像の特徴量の各々とを比較して、該入力画像の類似画像を検索する。
【0050】
S401では、特徴比較部202において、局所特徴量算出部107がクエリ画像201から抽出した局所特徴量と画像特徴データベース109に登録されている局所特徴量とを比較する。この比較処理は、画像特徴データベース109に登録されている入力画像毎に実行し、比較処理の結果として入力画像毎に類似度を算出する。
【0051】
次に、S402では検索結果203を出力する。検索結果203として、例えば、ステップ401で算出した類似度と当該類似度の算出元となった画像とを関連付けて類似度の高い順にソートしたものを出力することができる。検索結果として画像のサムネイルも合わせて出力してもよい。
【0052】
(類似度算出法)
本実施形態における類似度算出法を説明する。説明を簡単にするために、クエリ画像をQとし画像データベースから取り出した比較対象画像をSとして、QとSとの類似度を算出する手法(類似度算出法)の詳細を説明する。
【0053】
クエリ画像Q上にはqn個局所特徴量が存在し、i番目の局所特徴量をVq(i)と表す。比較対象画像S上にはsn個の局所特徴量が存在し、j番目の局所特徴量をVs(j)と表す。
【0054】
まず、Vq(i)とVs(j)のすべての組み合わせについて、それぞれベクトル間のユークリッド距離d_ijを求める。d_ijがあらかじめ定めたしきい値以下の時に、比較対象画像Sに対して一票投票する。Vq(i)とVs(j)のすべての組み合わせについて比較対象画像Sに対する投票が終わったときの投票数をVote(S)とする。この場合、クエリ画像Qの比較対象画像Sに対する類似度Sim_QSを以下の式(14)で算出する。
[数6]
Sim_QS=Vote(S)/qn ・・・(14)
なお、本実施形態では、ベクトル間距離としてユークリッド距離を使ったが、ベクトルの変動との相関があるならば、マハラノビス距離など他の距離を採用してもよい。また、類似度算出に必ずしもベクトル間距離を使う必要はなく、ベクトルの変動との相関がある量であれば、それを使ってもよい。例えば、ベクトル間の角度に基づく類似度算出法を採用してもよい。この場合、ベクトル間の角度が小さいほど類似度が大きくなるような式を定義する必要がある。
【0055】
上記のように本実施形態の構成においては、後段の特徴点抽出処理あるいは特徴量算出処理で再利用する値を要素値として算出し、この要素値を使って処理対象領域を限定する。このため、検索精度を維持しつつ処理速度を向上させることが可能になる。すなわち、本実施形態では、入力画像にマスク範囲を設定する際に使用した中間値(要素値)を、入力画像から局所的な特徴を抽出する際に再利用するため、高い検索精度と高速な処理速度が両立可能となる。
【0056】
また、本実施形態では、中間値として輝度勾配振幅を算出する場合の例を説明したが、上述のように、輝度勾配振幅は比較的単純な演算で算出することができるため、全体の演算コストを低く抑えることが可能である。
【0057】
<<第2実施形態>>
第1実施形態ではS206における局所特徴点の抽出法としてHarris作用素を使った手法を説明したが、画像の回転時や縮小時などの画像処理後でも安定して抽出されるような局所特徴点の抽出法であれば他の局所特徴点の抽出法を使ってもよい。他の手法としては、例えば、DOG(Difference of Gaussian)を使った局所特徴点の抽出法などがある(非特許文献4)。
【0058】
【非特許文献4】David G. Lowe, “Distinctive Image Features from Scale−Invariant Keypoints,” International Journal of Computer Vision,60,2(2004),pp.91−110。
【0059】
また、S207における局所特徴量の算出法として、式(7)で示したようにLocal Jet及びそれらの導関数の組み合わせを使って算出したが、この算出法に限定されない。画像の回転時や縮小時などの画像処理後でも変動の少ない局所特徴量が算出可能であればよく、他の手法としては、例えば、SIFT特徴量(非特許文献4)やPCA−SIFT特徴量(非特許文献5)などを利用可能である。あるいはフーリエ変換などの周波数変換後の係数を組み合せて特徴量を構成してもよい。
【0060】
【非特許文献5】Y.Ke and R.Sukthankar,“PCA−SIFT: A More Distinctive Representation for Local Image Descriptors,” Proc.CVPR,2004。
【0061】
ただし、第1実施形態で説明した手法とは別の手法を適用する場合は、S204において算出する要素値は、S206あるいはS207のいずれかあるいは両方で再利用可能であることが好適である。さらに、S205において当該要素値を使って有効なマスク範囲を設定可能であることが好適である。
【0062】
例えば、S206において局所特徴点抽出にDOGを使う場合は、S204で算出する要素値として、式(1)で算出したLの値を再利用可能である。また、S207において局所特徴量の算出にSIFT特徴量又はPCA−SIFT特徴量を使う場合は、S204で算出する要素値として、式(2)及び式(3)で算出したLx及びLyの値を再利用可能である。これらいずれの場合でも、S205において第1実施形態で説明した手法と同じマスク範囲設定法を利用可能である。あるいは、フーリエ変換などの周波数変換後の係数を組み合せて局所特徴量を算出するように構成することも可能である。この場合、S204で算出する要素値は周波数係数となり、S205でのマスク範囲設定条件として、例えば、周波数変換された入力画像においてピークとなる周波数係数があらかじめ定めた周波数(所定のしきい値)以上であることを条件にする。これにより、S206の処理領域からエッジ成分が少ない画像領域を除くことが可能となり、局所特徴量の算出に要素値を再利用可能となる。
【0063】
このように、S204において算出する要素値が、S206とS207との少なくともいずれかで再利用可能であり、S205において当該要素値を使って有効なマスク範囲を設定可能であればよい。この条件が満たされれば、上記の例だけでなく、例えば、色情報を使って要素値を算出し、マスク範囲を設定してもよい。
【0064】
また、ステップ208で登録する情報として局所特徴点の座標とスケール番号、および式(7)を使って算出される局所特徴量を登録するように説明したが、登録情報はこれに限定されない。例えば、登録前にk−means法などを使って局所特徴量をクラスタリングし、クラスタ番号をインデクスとして登録するように構成してもよい。インデクスの登録により検索処理を高速化することができる。
【0065】
上記のように、後段の特徴点抽出あるいは特徴量算出処理で利用する値を要素値として算出し、この要素値を使って処理対象領域を限定することで、検索精度を維持しつつ処理速度を向上させることが可能になる。
【0066】
<<第3実施形態>>
なお、第1実施形態では、S205において輝度勾配の振幅があらかじめ定めたしきい値th以上となる画素位置にマスクが設定されるようにしたが、マスク範囲をさらに拡張するように構成してもよい。マスク範囲の拡張法には特に制限はなく、例えば、太線化処理を用いてもよい。このように、マスク範囲をさらに拡張することでより多くの局所特徴点を抽出可能になる。そして、処理速度を向上させつつ、さらに検索精度の維持を確実にすることができる。
【0067】
また、S205において、例えば、マスク範囲の面積があらかじめ定めた大きさ以上になった場合は、マスク範囲設定を中断してマスク範囲を全画面に設定してもよい。具体的には、マスク範囲を設定する処理を開始してから設定済みのマスク範囲の面積を計測し、当該面積が予め定められた値を以上になった場合は、当該処理を中断して、入力画像の全領域に前記マスク範囲を設定してもよい。この場合、入力画像の全領域にマスク範囲を設定して、次の処理に移ることになる。このように構成することで、マスク範囲の設定処理が計算コスト増大の原因になることを避けることが可能になり、処理全体として検索精度を維持しつつ処理速度を向上させることが可能になる。
【0068】
同様に、輝度勾配の振幅がしきい値th以上の画素位置すべてにマスクを設定するのではなく、マスク範囲の設定処理時間があらかじめ定めた時間以上になった場合はマスク範囲設定処理を中断してマスク範囲を全画面に設定し次の処理に移行してもよい。すなわち、マスク範囲を設定する処理を開始してから、当該処理が完了するまでに予め定められた時間が経過した場合は、入力画像の全領域にマスク範囲を設定してもよい。このようにしても、マスク範囲の設定処理が計算コスト増大の原因になることを避けることが可能になり、処理全体として検索精度を維持しつつ処理速度を向上させることが可能になる。
【0069】
また、S205でのマスク範囲設定において、通常は画面の走査順、すなわち画面右上から左下に向けて処理を実行するが、処理をランダムに実行してもよい。この場合、入力画像を複数の部分領域に分割し、該部分領域をランダムな順序で選択し、選択された順序で部分領域毎にエッジ部分から一定の範囲内の領域にマスク範囲を設定することになる。これにより、例えば、画面の上半分が空で下半分が草原であるような画像を処理する場合に、走査順にマスク設定処理を実行するよりも早い段階でマスク設定処理の計算コストの増大を検知できる。この処理と前述のマスク処理の中断処理とを組み合せることで、マスク範囲の設定処理が計算コスト増大の原因になることを避けることが可能になり、処理全体として検索精度を維持しつつ処理速度を向上させることが可能になる。
【0070】
あるいは、S205のマスク範囲設定における画面の走査において、画面の走査順、すなわち画面右上から左下に向けて処理を実行するのではなく、この順番を逆順、すなわち左下から右上に向けて処理を実行してもよい。この構成によっても、例えば、画面の上半分が空で下半分が草原であるような画像を処理する場合に、早い段階でマスク設定処理の計算コストの増大を検知できるようになる。この構成と前述のマスク処理の中断処理とを組み合せることで、マスク範囲の設定処理が計算コスト増大の原因になることを避けることが可能になり、処理全体として検索精度を維持しつつ処理速度を向上させることが可能になる。
【0071】
<<その他の実施形態>>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

【特許請求の範囲】
【請求項1】
画像の局所的な特徴がそれぞれ対応づけて予めデータベースに登録された複数の登録画像から、入力画像と類似する画像を検索する情報処理装置であって、
前記入力画像を解析して中間値を算出する算出手段と、
前記中間値を使用して、前記入力画像にマスク範囲を設定する設定手段と、
前記マスク範囲を用いて前記入力画像中の特徴抽出領域を限定し、前記設定手段において使用された中間値を再利用して局所的な特徴を抽出する抽出手段と、
前記入力画像の局所的な特徴と、前記複数の登録画像の局所的な特徴の各々とを比較して、該入力画像の類似画像を検索する検索手段と
を備えることを特徴とする情報処理装置。
【請求項2】
前記画像の局所的な特徴には、画像の特徴点と、画像の特徴点に関する特徴量との少なくともいずれかが含まれることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記算出手段は、前記入力画像の各画素位置での輝度勾配振幅を前記中間値として算出することを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記設定手段は、前記輝度勾配振幅の値が所定のしきい値以上である領域に前記マスク範囲を設定することを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記算出手段は、前記入力画像を周波数変換し、当該周波数変換された入力画像においてピークとなる周波数係数を前記中間値として算出することを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記設定手段は、前記ピークとなる周波数係数が所定のしきい値以上である領域に前記マスク範囲を設定することを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記設定手段は、前記マスク範囲を設定する処理を開始してから設定済みのマスク範囲の面積を計測し、当該面積が予め定められた値を以上になった場合は、当該処理を中断して、前記入力画像の全領域に前記マスク範囲を設定することを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。
【請求項8】
前記設定手段は、前記マスク範囲を設定する処理を開始してから、当該処理が完了するまでに予め定められた時間が経過した場合は、当該処理を中断して、前記入力画像の全領域に前記マスク範囲を設定することを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。
【請求項9】
前記設定手段は、前記入力画像を複数の部分領域に分割し、該部分領域をランダムな順序で選択し、選択された該順序で該部分領域毎に前記マスク範囲を設定することを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。
【請求項10】
類似画像の検索対象となる画像の局所的な特徴をデータベースに登録する情報処理装置であって、
前記入力画像を解析して中間値を算出する算出手段と、
前記中間値を使用して、前記入力画像にマスク範囲を設定する設定手段と、
前記マスク範囲を用いて前記入力画像中の特徴抽出領域を限定し、前記設定手段において使用された中間値を再利用して局所的な特徴を抽出する抽出手段と、
抽出した前記局所的な特徴を前記データベースに登録する登録手段と、
を備えることを特徴とする情報処理装置。
【請求項11】
画像の局所的な特徴がそれぞれ対応づけて予めデータベースに登録された複数の登録画像から、入力画像と類似する画像を検索する情報処理装置の制御方法であって、
算出手段が、前記入力画像を解析して中間値を算出する算出工程と、
設定手段が、前記中間値を使用して、前記入力画像にマスク範囲を設定する設定工程と、
抽出手段が、前記マスク範囲を用いて前記入力画像中の特徴抽出領域を限定し、前記設定工程において使用された中間値を再利用して局所的な特徴を抽出する抽出工程と、
検索手段が、前記入力画像の局所的な特徴と、前記複数の登録画像の局所的な特徴の各々とを比較して、該入力画像の類似画像を検索する検索工程と
を有することを特徴とする情報処理装置の制御方法。
【請求項12】
コンピュータを請求項1から10のいずれか1項に記載の情報処理装置が備える各手段として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2011−100293(P2011−100293A)
【公開日】平成23年5月19日(2011.5.19)
【国際特許分類】
【出願番号】特願2009−254446(P2009−254446)
【出願日】平成21年11月5日(2009.11.5)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】