説明

画像検索装置、画像検索装置のデータ処理方法、および画像検索システム

【課題】効率よく高精度な画像検索が可能な画像検索装置、画像検索装置のデータ処理方法、および画像検索システムを提供する。
【解決手段】画像検索装置100は、検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶部102と、検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、構成直線情報記憶部102から構成直線の組合せ候補情報を抽出する構成直線候補抽出部104と、構成直線候補抽出部104で抽出した構成直線の組合せ候補情報とクエリーなす角度情報とから、形状間距離を算出する形状間距離算出部106と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像検索装置、画像検索装置のデータ処理方法、および画像検索システムに関し、特に、形状情報をクエリーとした画像検索装置、画像検索装置のデータ処理方法、および画像検索システムに関する。
【背景技術】
【0002】
ユーザの指定するクエリー形状による画像検索を実現するためには、ユーザが指定するクエリー形状と、検索対象画像中の形状に関する類似度を算出する必要がある。
検索時に高速に照合するためには、検索対象画像群からあらかじめ特徴量を抽出しておく必要がある。画像全面が検索対象の場合は画像全体から特徴量を抽出すればよいが、画像の一部であるオブジェクトが検索対象となる場合、検索対象画像から該当する領域の特徴量を抽出する必要がある。
【0003】
図17は、形状をクエリーとした画像検索方法の一例を説明する図である。ユーザは検索したい形状をクエリー形状として入力すると、類似形状を含む画像が検索結果として出力される。
画像検索装置の例が以下の各特許文献に記載されている。
特許文献1に記載された画像検索装置は、ユーザが選択した検索対象となるクエリーの形状及び色特徴および検索対象となる位置を取得し、検索対象画像群の画像の中から、探索窓を走査して類似する領域を探索し、類似画像を抽出する。
【0004】
特許文献2に記載された画像検索装置は、検索対象画像に含まれる主要な形状(たとえば、円形、三角形、または四角形など)の種類を予め決定し、登録しておくことで、ユーザが与える特定のオブジェクトの形状の種類をクエリーとし検索する。
【0005】
特許文献3に記載された画像検索装置は、検索対象画像から予め注目領域を自動で抽出し、クエリー領域との類似度を判定している。
特許文献4に記載された直線による画像の検索装置は、検索対象画像に含まれる直線の特徴(始点、終点、重心、傾き、または長さ)を登録しておき、ユーザが与える直線情報と直線周辺の色などの類似度を算出し、検索する。連続する可能性のある直線を一直線とみなすことで、一部欠けのある直線も検索できる。
【0006】
特許文献5に記載された画像特徴抽出装置は、画像中に含まれる直線の傾きを登録しておき、ユーザが与える画像内の直線情報との類似度を算出し検索する。また、特許文献6に記載された画像形成システムは、線分のなす角度を用いて形状の類似度を算出する。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2000−76302号公報
【特許文献2】特開2009−193398号公報
【特許文献3】特開2007−199749号公報
【特許文献4】特開2000−82075号公報
【特許文献5】特開平5−135174号公報
【特許文献6】特開2006−252007号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上述した従来のシステムでは、次のような問題があった。
特許文献1に記載の例での問題点は、探索窓を設定するためスケールや回転の影響を受けやすく、検索時に検索対象画像を探索し、特徴量を抽出するため非常に時間がかかることである。
特許文献2に記載の例での問題点は、ユーザが検索に用いるクエリー形状は多様であり、予め形状を規定することは困難である。また、その形状登録の自動化が困難であることである。
【0009】
特許文献3に記載の例の問題点はユーザが所望する検索結果が出ないことである。その理由は、検索対象画像の注目領域は、支配的な単一色として抽出されており、ユーザの関心に関わらず固定されるが、クエリーとなる領域はユーザが自由に選択できるため、注目領域として選択されたものがユーザの意図と異なるためである。ユーザが関心を持つ注目領域は一定ではなく、検索目的などにより変化するため、予め検索対象画像から注目領域を決定することは非常に困難である。
【0010】
特許文献4に記載の例での問題点は、画像中における直線位置や周辺色などの類似度を判定するため、特定の形状による検索は行えないことや、位置情報に依存するため回転に頑強ではないことである。
特許文献5に記載の例での問題点は、大きな角度の回転に頑強ではないことである。その理由は、メンバシップ関数の導入による吸収可能な回転ずれは小さな角度に限定され、45度や90度の回転には対応できないためである。また、画像全体の直線の傾きの集合を特徴量としているため、クエリーと類似する形状が画像の大部分を占める場合以外では、検索精度が落ちると考えられる。
【0011】
また、特許文献6に記載の例での問題点は、線分のなす角度のみに基づく類似度であるため、たとえば、長方形と正方形など、いずれもなす角度が、90度、90度、90度、90度の場合、区別がつかない点である。
【0012】
このように、形状による画像検索では、ユーザが検索に用いるクエリー形状が未知であるため、その多様性から予め決定しておくことは困難であり、また検索時に決定された形状の探索を行うのでは時間がかかりすぎる問題がある。特別な選択基準に基づき画像中の検索対象領域を自動抽出する方法では、選択基準が固定されているため、多様な形状に対応できない。検索対象画像群から直線成分を抽出して一致度を判定する方法があるものの、直線の傾きを用いているため、画像の回転に弱い問題がある。
【0013】
本発明は上記事情に鑑みてなされたものであり、その目的とするところは、効率よく高精度な画像検索が可能な画像検索装置、画像検索装置のデータ処理方法、および画像検索システムを提供することにある。
【課題を解決するための手段】
【0014】
本発明の第一の画像検索装置は、
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶手段と、
検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、前記構成直線情報記憶手段から構成直線の組合せ候補情報を抽出する構成直線候補抽出手段と、
前記構成直線候補抽出手段で抽出した前記構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する形状間距離算出手段と、
を備える。
【0015】
本発明の第二の画像検索装置は、
検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得するクエリー多角形情報取得手段と、
前記検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報を算出するなす角度情報算出手段と、
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶手段と、
前記なす角度情報算出手段で取得した前記クエリーなす角度情報の類似性に基づき、前記構成直線情報記憶手段から構成直線の組合せ候補情報を抽出する構成直線候補抽出手段と、
前記構成直線候補抽出手段で抽出した前記構成直線の組合せ候補情報と、前記クエリー多角形情報取得手段で得た前記検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する形状間距離算出手段と、
を備える。
【0016】
本発明の第1の画像検索装置のデータ処理方法は、
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶装置を有する画像検索装置のデータ処理方法であって、
前記画像検索装置が、
検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、前記構成直線情報記憶装置から構成直線の組合せ候補情報を抽出し、
抽出した構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する。
【0017】
本発明の第2の画像検索装置のデータ処理方法は、
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶装置を有する画像検索装置のデータ処理方法であって、
前記画像検索装置が、
検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得し、
前記検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報を算出し、
取得した前記クエリーなす角度情報の類似性に基づき、前記構成直線情報記憶装置から構成直線の組合せ候補情報を抽出し、
抽出した前記構成直線の組合せ候補情報と、得られた前記検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する。
【0018】
本発明の画像検索システムは、
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶手段と、
検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、前記構成直線情報記憶手段から構成直線の組合せ候補情報を抽出する構成直線候補抽出手段と、
前記構成直線候補抽出手段で抽出した構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する形状間距離算出手段と、
算出された前記形状間距離をユーザに提示する提示手段と、
を備える。
【0019】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【0020】
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
【0021】
また、本発明のデータ処理方法またはコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明のデータ処理方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障しない範囲で変更することができる。
【0022】
さらに、本発明のデータ処理方法またはコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
【発明の効果】
【0023】
本発明によれば、効率よく高精度な画像検索が可能な画像検索装置、画像検索装置のデータ処理方法、および画像検索システムが提供される。
【図面の簡単な説明】
【0024】
【図1】本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
【図2】本発明の実施の形態に係る画像検索装置における検索対象画像から直線情報の抽出を説明するための図である。
【図3】本発明の実施の形態に係る画像検索装置の構成直線情報記憶部に記録される直線情報の例を示す図である。
【図4】本発明の実施の形態に係る画像検索装置の構成直線情報記憶部に記録される直線情報の例を示す図である。
【図5】本発明の実施の形態に係る画像検索装置における検索クエリーに対応する検索対象画像内の類似する図形の検索を説明するための図である。
【図6】本発明の実施の形態に係る画像検索装置の動作の一例を示すフローチャートである。
【図7】本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
【図8】本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
【図9】本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
【図10】本発明の実施の形態に係る画像検索装置の動作の一例を示すフローチャートである。
【図11】本発明の実施の形態に係る画像検索装置の構成直線検出処理を説明するための図である。
【図12】本発明の実施の形態に係る画像検索装置の検索結果表示画面の一例を示す図である。
【図13】本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
【図14】本発明の実施の形態に係る画像検索装置の動作の一例を示すフローチャートである。
【図15】本発明の実施の形態に係る画像検索装置の2直線の交点座標の算出精度を説明するための図である。
【図16】本発明の実施の形態に係る画像検索装置の検索対象画像の直線抽出における直線の角度パラメータ精度を説明するための図である。
【図17】検索対象画像群からの検索クエリー形状を用いた画像検索を説明するための図である。
【発明を実施するための形態】
【0025】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0026】
(第1の実施の形態)
図1は、本発明の実施の形態に係る画像検索装置100の構成を示す機能ブロック図である。
本実施形態の画像検索装置100は、検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶部102と、検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、構成直線情報記憶部102から構成直線の組合せ候補情報を抽出する構成直線候補抽出部104と、構成直線候補抽出部104で抽出した構成直線の組合せ候補情報とクエリーなす角度情報とから、形状間距離を算出する形状間距離算出部106と、を備える。
【0027】
詳細には、図1を参照すると、本発明の実施の形態の画像検索装置100は、構成直線情報記憶部102と、構成直線候補抽出部104と、形状間距離算出部106と、を含む。
【0028】
画像検索装置100の各構成要素は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶ユニット、ネットワーク接続用インタフェースを中心にハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各図は、ハードウェア単位の構成ではなく、機能単位のブロックを示している。
【0029】
具体的には、画像検索装置100は、たとえば、図示しないCPUやメモリ、ハードディスク、および通信装置を備え、キーボードやマウス等の入力装置やディスプレイやプリンタ等の出力装置と接続されるサーバコンピュータやパーソナルコンピュータ、またはそれらに相当する装置により実現することができる。そして、CPUが、ハードディスクに記憶されるプログラムをメモリに読み出して実行することにより、上記各ユニットの各機能を実現することができる。
なお、以下の各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。
【0030】
構成直線情報記憶部102は、検索対象となる画像群から抽出した直線に関する情報を記憶する。
本発明では、検索対象となる画像とは、静止画像および動画像を含むことができる。
【0031】
直線を抽出する方法は、特許文献4に記載されているハフ変換を用いるとよい。または、Harris Corner Detector(シー. ハリス(C. Harris)、外1名、「ア コンバインド コーナー アンド エッジ デテクター(A combined corner and edge detector)」、第4回アルビービジョンカンファレンス予稿集(Proc. 4th Alvey Vision Conf.)、(英国)、ザ プレシー カンパニー ピーエルシー.(The Plessey Company plc.)、1988年8月、p.147-151)などのコーナー点検出により抽出した画像内のコーナー点の組合せのうち、点と点を結んだ直線上にエッジを有する画素が多数存在するものを直線として抽出してもよい。
このようにして抽出された直線における原点からの距離ρと直線へ引いた垂線の傾き角度θのペアを直線情報として構成直線情報記憶部102に記録する。
【0032】
図2に、検索対象画像から直線情報を抽出する例を示す。
直線情報は、距離と傾き以外にも、直線の方程式ax+by+c=0の係数a、b、およびcを用いてもよく、また、コーナー点間の直線上のエッジ画素による直線検出では、容易に直線を線分として求めることができるため、線分の2つの端点の座標(x1,y1)および(x2,y2)を直線に関する情報として記憶してもよい。ただし、本発明では、なす角度を頻繁に利用するため、傾き角度θを記録しておくのが望ましい。
【0033】
抽出した直線情報は、直線ごとのρ、θの値とし、図3に示すように記録する。このとき、後の処理を容易化するため、図4に示すように、直線同士の組合せに対する、角度の差を表す値を表として記録しておくとよい。このとき、全ての頂点が画像内に位置する多角形のみを検索対象とする場合は、画像範囲内で交差する直線の組のみを記録することで、処理量を削減することができる。
【0034】
これらのデータはCD−ROM、DVD−R、ハードディスク、メモリなどの記録媒体に一括または複数に分割して記憶する。記憶されているデータはCD−ROMドライブなどの読み込み装置により単数または複数の媒体から読み込まれるか、あるいはネットワークインターフェースを通じてインターネットやLAN(Local Area Network)等のネットワークを介して取得することができる。
【0035】
構成直線候補抽出部104は、n角形の検索クエリーの多角形のなす角度θqi(ここで、i=1〜nの自然数。)の情報10を入力し、入力したクエリーなす角度と一致するなす角度を保有する可能性のある構成直線の候補を構成直線情報記憶部102から抽出し、その構成直線の候補に関する情報(対応する構成直線の候補情報12)を出力する。
【0036】
ここで、構成直線候補抽出部104に入力されるクエリーなす角度情報10は、たとえば、ユーザが操作部を操作して指定した情報でよいし、予め準備された情報を記録媒体またはネットワークを介して他の装置から読み込んで入力した情報でもよく、特に限定されない。クエリーなす角度情報10は、受付部(不図示)が受け付け、構成直線候補抽出部104および形状間距離算出部106に入力することができる。
【0037】
構成直線情報記憶部102に記憶されている全てのN枚の画像中の画像jにおける構成直線がなす角度の個数をmjとし、画像jにおけるなす角度の集合を、以下の式(1)とする。
Gj={θj1,θj2,・・・,θjmj} ・・・式(1)
このとき、検索クエリーのなす角度q{θq1,θq2,・・・,θqn}に対し、以下の式(2)となるn個の組合せを探索する。
θqi=θjk ・・・式(2)
ただし、角度抽出の誤差などを考慮し、θaとθbを同一とみなす条件として、閾値thを用いて、以下の式(3)とするとよい。
|θa−θb|<th ・・・式(3)
【0038】
検出したなす角度の順列から、クエリー形状の辺と対応する直線の順列を求め、各直線のθ、ρの値もしくは頂点位置などの構成直線の候補に関する情報を出力する。
【0039】
図5の例では、θq1=θj1、θq2=θj2、θq3=θj3となることから、θq1とθq2を両端に持つL1と、θj1とθj2を両端に持つL1’が対応する直線であることが判り、同様に、L2とL2’、L3とL3’がそれぞれ対応する直線であることが判る。
【0040】
対応する直線の組の順列と、各直線の傾き角度θと距離ρなどの直線に関する情報を出力する。
形状間距離算出部106は、構成直線候補抽出部104で検出したクエリー形状の辺とそれに対応する直線候補を抽出した画像ごとに、形状間距離14を算出し、出力する。
形状間距離とは、2つの形状の異なる度合いを表す尺度であり、形状間距離が小さいほど2つの形状は類似していることになり、大きいほど似ていないことになる。
【0041】
なお、算出された形状間距離に基づき、検索クエリーとの類似性を判定する判定部(不図示)をさらに備えることもできる。
【0042】
形状間距離の算出方法としては、クエリー形状のなす角度の順列q{θq1,θq2,・・・,θqn}と、検索対象画像jにおける直線群のなす角度の順列Gj’={θj1,θj2,・・・,θjn}から、対応するなす角度の差の絶対値の和を距離djとして以下の式(4)により算出する。
dj=Σ|θqi−θji| ・・・式(4)
ただし、iは1〜nの自然数。
これ以外にも、2乗和やより一般化したLpノルムなど、距離の公理を満たすものであればどのようなものを用いてもよい。
【0043】
本実施形態では、この形状間距離を類似度の尺度として用いる。ただし、以下の説明では、形状間距離が小さいほど類似度が高くなることに注意を要する。もちろん、類似度の尺度として、形状間距離のかわりに、類似性を表す(類似度が高いほど大きくなる)指標を用いてもよい。例えば、1/(1+d)(dは距離)のような指標を用いてもよい。
この処理をすべての検索対象画像(j=1〜N)に対しておこない、算出した形状間距離djを出力する。
【0044】
本実施形態の画像検索装置100は、コンピュータプログラムに対応する各種の処理動作をCPUが実行することにより、前述のような各種ユニットが各種機能として実現される。
【0045】
本実施形態のコンピュータプログラムは、画像検索装置100を実現させるためのコンピュータに、検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、構成直線情報記憶部102から構成直線の組合せ候補情報を抽出する手順、抽出した構成直線の組合せ候補情報とクエリーなす角度情報とから、形状間距離を算出する手順を実行させるように記述されている。
【0046】
本実施形態のコンピュータプログラムは、コンピュータで読み取り可能な記憶媒体に記録されてもよい。記録媒体は特に限定されず、様々な形態のものが考えられる。また、プログラムは、記録媒体からコンピュータのメモリにロードされてもよいし、ネットワークを通じてコンピュータにダウンロードされ、メモリにロードされてもよい。
【0047】
上述のような構成において、本実施の形態の画像検索装置100によるデータ処理方法を以下に説明する。図6は、本実施形態の画像検索装置100の動作の一例を示すフローチャートである。
【0048】
本実施形態のデータ処理方法は、画像検索装置100が、検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、構成直線情報記憶部102から構成直線の組合せ候補情報を抽出し(ステップS103、ステップS105)、抽出した構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する(ステップS107)。
【0049】
このように構成された本実施形態の画像検索装置100の動作について、図6を用いて以下に説明する。
図6は、本実施形態の画像検索装置100の動作の一例を示すフローチャートである。
構成直線候補抽出部104にn角形の検索クエリーのクエリーなす角度情報10が入力される(ステップS101)。
【0050】
そして、構成直線候補抽出部104が、構成直線情報記憶部102を参照し、構成直線情報記憶部102に記憶されている全てのN枚の検索対象画像中の一つの画像jにおける構成直線を抽出し(ステップS103)、入力したクエリーなす角度と一致するなす角度を有する可能性のある構成直線の候補を抽出する(ステップS105)。ここでは、対応する直線の組の順列と、各直線の傾き角度θと距離ρなどの直線に関する情報を出力する。
【0051】
そして、形状間距離算出部106が、構成直線候補抽出部104で検出したクエリー形状の辺とそれに対応する直線候補を抽出した画像ごとに、形状間距離14を算出し、出力する(ステップS107)。これらの処理を構成直線情報記憶部102に記憶されている全ての検索対象画像について繰り返し行い(ステップS109のNO)、すべての検索対象画像について処理が終了した場合(ステップS109のYES)、本処理を終了する。このようにして、検索対象画像について、クエリー多角形との形状間距離が出力される。
【0052】
以上、説明したように、本実施形態の画像検索装置100によれば、検索時にクエリー形状と類似する形状を効率的に再構築することが可能となる。このため、検索ごとに検索対象画像から対象となる形状を抽出する必要が無いという効果がある。その理由は、予め検索対象となる検索対象画像について、形状の最小単位である直線情報を抽出してあるためである。また、形状構成成分を直線として記述するため、一部欠けや遮蔽などに頑強となるといった効果も奏する。
【0053】
(第2の実施の形態)
次に、本発明の実施の形態に係る画像検索システムについて、図7を参照して詳細に説明する。図7は、本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。本実施形態に係る画像検索システムにおいて、画像検索装置200は、上記実施の形態の画像検索装置100とは、検索対象の画像の情報を記憶する点、または、検索結果をユーザに提示する点で相違する。図7を参照すると、本実施形態の画像検索装置200は、図1の上記実施形態の画像検索装置100の構成に加えて、検索対象画像情報記憶部202と、検索結果表示部204と、をさらに含む。
【0054】
本実施形態の画像検索システムは、上記実施形態の画像検索装置100の構成に加え、さらに、算出された形状間距離をユーザに提示する提示部(検索結果表示部204)を備える。本実施形態の画像検索システムにおいて、提示部は、画像検索装置200とは異なる他の端末であってもよく、ネットワークなどを介して画像検索装置200に接続可能な構成とすることができる。
【0055】
具体的には、検索対象画像情報記憶部202は、構成直線情報記憶部102に記憶されている検索対象となってすべての画像に関する情報が記憶されている。記憶する情報として、画像のファイル名、サイズ、解像度、作成日、ダウンロードされた画像の場合はURLなどのほか、オリジナル画像やサムネイル画像などを含むことができる。これらの情報は、構成直線情報記憶部102の情報と1対1に対応して記録してもよいが、記憶する容量を削減するため複数の「構成直線情報記憶部102に記憶されている情報を抽出した画像」に対し、1つの情報を割り当ててもよい。この場合、例えば動画像における前後数フレーム間はほぼ同一内容を表すため、このような類似性の高いフレーム群に対しては同一の情報(例えば、フレーム群の中央フレームを代表フレームとして設定し、これに対する情報)を割り当てるとよい。
【0056】
検索結果表示部204は、形状間距離算出部で出力した検索対象の形状間距離を昇順にソートし、検索結果をユーザに提示する。提示方法は、画像のファイル名を表示する方法でもよいし、画像を表示してもよい。形状間距離の小さい順(または大きい順)に画像の順位(ランキング)や形状間距離を同時に表示させてもよい。また、クエリー形状と類似する形状の領域を丸印で囲ったり、多角形の辺の色を変えたりして表示するなど目立たせるとよい。検索結果は、画面に提示するだけでなく、結果情報ファイルとして出力したり、印字出力したりしてもよい。また、算出された形状間距離に基づき、検索クエリーとの類似性を判定した結果を提示してもよい。
【0057】
また、出力するデータとしては、全ての画像における形状間距離を出力してもよいが、予め設定した閾値以下の形状間距離の画像のみを出力するとよい。
検索結果は、図12に示すように、該当する形状の線分を太くしたり、赤色などの目立つ色に変えたりして表示することにより、検索された形状をユーザに判りやすく提示することができる。
【0058】
以上、説明したように、本実施形態の画像検索システムによれば、上記実施形態と同様な効果を奏するとともに、検索結果をユーザに視覚的に提示することができる。
【0059】
(第3の実施の形態)
次に、本発明の実施の形態に係る画像検索装置300について、図8を参照して詳細に説明する。図8は、本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
本実施形態の画像検索装置300は、図1の上記実施の形態とは、クエリー多角形の形状をユーザがユーザインタフェースを用いて指定できる点で相違する。図8を参照すると、本実施形態の画像検索装置300は、図1の上記実施形態の画像検索装置100の構成に加えて、クエリー多角形情報取得部312と、なす角度情報算出部314と、をさらに含む。なお、本実施形態の画像検索装置300は、図7の上記実施形態の画像検索装置200の構成も含むことができる。
【0060】
本実施形態の画像検索装置300は、検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得するクエリー多角形情報取得部312と、検索クエリーの多角形情報からクエリーなす角度情報を算出するなす角度情報算出部314と、をさらに備え、構成直線候補抽出部104および形状間距離算出部106は、なす角度情報算出部314が算出したクエリーなす角度情報を用いる。
【0061】
本実施形態において、画像検索装置300のユーザは、ディスプレイなどの表示部(不図示)に表示された操作画面上などで、ペン型やマウス型などのポインティングデバイス(不図示)を用いることで任意の多角形形状を指定することができる。
【0062】
形状の指定方法は、多角形の頂点を指定してもよいし、辺を組み合わせて指定してもよいし、予め用意されている多角形の位置や角度、大きさを変形させて組み合わせた形状を指定してもよい。いずれの方法においても、クエリー多角形情報取得部312は、ユーザが指定した多角形の辺をたどって繋がっている頂点の座標位置を順に受け付けて、クエリー頂点座標情報30として取得する。
【0063】
クエリー多角形情報取得部312は、取得した頂点を順にV1,V2,・・・,Vnとする。
ユーザが多角形の頂点を選択する際に、参考とする画像を表示部に表示させることで、ユーザにポインティングデバイスを用いて、表示された画像中のオブジェクトの頂点位置を選択させて、選択されたオブジェクトの頂点位置をクエリー多角形情報取得部312が受け付けてもよい。この構成によれば、ユーザは特定のオブジェクト形状をクエリーとして容易に選択することができる。
【0064】
なす角度情報算出部314は、取得した頂点Viにおけるなす角度θiを算出し、クエリーなす角度情報10として出力する。ここで、取得した頂点Viにおけるなす角度θiは、ベクトルLi−1=Vi−1−Vi、Li=Vi−Vi+1を用いて、以下の式(5)により算出できる。
【数1】

だたし、・は内積、||はノルムを表す。
【0065】
これを1〜nに対し行うことにより、クエリーなす角度情報10を算出し、出力する。
ただし、一般に2つのベクトルのなす角度は、αを正数とした場合、αまたは180−αの2通りが考えられる。そこで、小さいなす角度を2つのベクトルのなす角度とすることにより、曖昧性を無くすことができる。このため、θiが、90度を越える場合、180−θiを改めてθiとすればよい。すなわち、以下の式(6)のようにするとよい。
θi =min(θi、180−θi) ・・・式(6)
ここで、minは小さい方の値を選択する関数である。
【0066】
以上、説明したように、本実施形態の画像検索装置300によれば、上記実施形態と同様な効果を奏するとともに、ユーザがクエリー形状をポインティングデバイスなどを用いて簡単に指定できる。
【0067】
(第4の実施の形態)
次に、本発明の実施の形態に係る画像検索装置400について、図9を参照して詳細に説明する。図9は、本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
本実施形態の画像検索装置400は、図8の上記実施の形態とは、ユーザが指定した多角形のクエリー形状から、回転、拡大、または移動の変化に頑強な特徴である各辺のなす角度を基に、検索対象画像の直線成分集合から、候補形状を構成する線群を抽出し、類似度判定を行う点で相違する。なお、本実施形態の画像検索装置400は、図7の上記実施形態の画像検索装置200の構成も含むこともできる。
【0068】
本実施形態の画像検索装置400は、検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得するクエリー多角形情報取得部412と、検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報を算出するなす角度情報算出部414と、検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶部402と、なす角度情報算出部414で取得したクエリーなす角度情報の類似性に基づき、構成直線情報記憶部402から構成直線の組合せ候補情報を抽出する構成直線候補抽出部404と、構成直線候補抽出部404で抽出した構成直線の組合せ候補情報と、クエリー多角形情報取得部412で得た検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量(幾何パラメータ)を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する形状間距離算出部406と、を備える。
【0069】
具体的には、図9を参照すると、本実施形態の画像検索装置400は、クエリー多角形情報取得部412と、なす角度情報算出部414と、構成直線候補抽出部404と、形状間距離算出部406と、を備える。
【0070】
クエリー多角形情報取得部412は、検索クエリーの形状を表す頂点位置または線分のいずれかを含む多角形情報を取得する。
なす角度情報算出部414は、前記検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報10を算出する。
【0071】
構成直線情報記憶部402は、検索対象画像中の輪郭を構成する直線の情報を記憶する。
構成直線候補抽出部404は、なす角度情報算出部414で取得したクエリーなす角度情報の類似性に基づき、構成直線情報記憶部402から構成直線の組合せ候補情報を抽出する。
【0072】
形状間距離算出部406は、構成直線候補抽出部404で抽出した構成直線の組合せ候補情報と、クエリー多角形情報取得部412で得た検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量(幾何パラメータ)を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する。
【0073】
上記第1の実施の形態と同様にして、形状間距離の算出方法としては、クエリー形状のなす角度の順列q{θq1,θq2,・・・,θqn}と、検索対象画像jにおける直線群のなす角度の順列Gj’={θj1,θj2,・・・,θjn}を取得する。そして、対応する直線候補のうちすくなくとも3つの対応する辺の交点を2つ抽出し、幾何変換パラメータを算出し、幾何補正を施した上で形状の形状間距離を算出する。
【0074】
2つの交点の選択基準としては、たとえば、n個の点から2点を抽出する方法として、クエリー形状の頂点Xqiにおける両辺をベクトルvr,vlとした際の外積の絶対値|vr×vl|の大きい順に2つの点を選択するとよい。外積を利用する理由は、辺長の長さとなす角度の直交性を用いるためである。
【0075】
まず、図15を参照し、2直線L1およびL2の交点座標の算出精度について説明する。直線L1の幅(太さ)をΔdとすると、L1とL2の交点としてユーザが選択するブレ幅は図中破線で示す範囲となる。このブレ幅はΔd/sinθであり、なす角度θが直角に近いほど小さい値となる。
【0076】
また、図16を参照し、検索対象画像の直線抽出における直線の角度パラメータ精度について説明する。2点P1およびP2を通る直線L1の角度誤差Δθは、点P2の位置ブレ幅Δdと、点間の距離Lを用いてΔd/Lと近似することができる。このため、点間距離Lである辺長が長いほど抽出される直線の角度パラメータが安定して抽出できる。
【0077】
幾何補正方法を、以下詳細に説明する。
点P(x,y)からP’(x’,y’)への回転Δθ、拡大率α、並進ΔX,ΔYの幾何変換は、以下の式(7)で表せる。式(7)から、2つの点P1(x1,y1)、P2(x2,y2)とそれらの幾何補正後の対応する点P1’(x1’,y1’)、P2’(x2’,y2’)の座標位置から、パラメータΔθ、α、ΔX,ΔYを解くことができる。
【0078】
【数2】

【0079】
例えば、図5において、θq1とθj1が等しく、θq2とθj2が等しいことから、直線L1とL1’が対応する直線であることが判り、同様にして,L2,とL2’、L3とL3’がそれぞれ対応する直線であることが判る。対応付けられた3直線L1,L2,L3とL1’,L2’,L3’を用いると、L1とL3の交点(Xq1,Yq1)とL1’とL3’の交点(Xj1,Yj1)が対応する頂点同士であることがさらに判る。
【0080】
同様に(Xq2,Yq2)と(Xj2,Yj2)が対応する頂点である。この2つの対応する頂点を、式(7)に代入し、連立方程式を解くことで、パラメータΔθ、α、ΔX,ΔYを得ることができる。そして、検索対象画像の形状を幾何補正し、頂点をクエリー形状と同一平面に投影し、各頂点の位置のずれを算出する。位置ずれは、2点のX,Y各座標値の差分の絶対値の和として、以下の式(8)のように求めることができる。
dj=Σ(|Xqi−Xji|+|Yqi−Yji|) ・・・式(8)
ここで、i=1〜nの自然数である。
【0081】
また、差分の二乗和など、距離の公理を満たしているものであれば何を用いてもよく、上記実施形態と同様であり、これに限定されることはない。
【0082】
なお、本実施形態の変形として、図8の実施形態の画像検索装置300の構成に加え、構成直線候補抽出部104で抽出した構成直線の組合せ候補情報と、クエリー多角形情報取得部312で得た検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正する補正部(不図示)をさらに備え、形状間距離算出部106が、補正部により幾何補正した後の形状との頂点の位置ずれ量を基に形状間距離を算出する構成としてもよい。
【0083】
上述のような構成において、本実施の形態の画像検索装置400によるデータ処理方法を以下に説明する。図10は、本実施形態の画像検索装置400の動作の一例を示すフローチャートである。
【0084】
本実施形態のデータ処理方法は、画像検索装置400が、検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得し(ステップS301)、検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報を算出し(ステップS303)、取得したクエリーなす角度情報の類似性に基づき、構成直線情報記憶部402から構成直線の組合せ候補情報を抽出し(ステップS103、ステップS105)、抽出した構成直線の組合せ候補情報と、得られた検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する(ステップS107)。
【0085】
以下、図10に示すフローチャートを用いて本実施形態における画像検索装置400の動作を説明する。
図10において、上記実施形態の図6のフローチャートのステップS103〜ステップS109と同様なステップを含むとともに、ステップS301、ステップS303、およびステップS311を、さらに含む。
ユーザがペン型ポインティングデバイスなどを用いて指定した多角形の頂点位置(座標)を順に取得し、メモリに格納する(ステップS301)。
【0086】
例えば、ユーザがn角形を指定した場合、n個の頂点の位置を以下のようにメモリに記録する。
Q[1].x=10
Q[1].y=30
Q[2].x=40
Q[2].y=70

Q[n].x=100
Q[n].y=20
Q[0].x=100
Q[0].y=20
このとき、n角形は閉じた形状をするため、Q[0]には、Q[n]と同じ値を代入する。
ここで、Q[n].x、Q[n].yは、Q[n]のx座標およびy座標成分を表すものとする。
【0087】
n角形のクエリー形状が、図11(a)に示すように短い辺を持ち、かつこの辺の両端のなす角A,Bの和が180度を超える場合、図11(b)に示すようなn−1角形を想定し、クエリー形状として検索に用いるとよい。こうすることにより、検索対象画像における直線検出で短い辺が未検出となる場合でも検索することができるからである。
【0088】
すなわち、なす角度情報算出部314が、クエリー多角形内の鈍角を持つ辺の両端の辺の線分を伸ばしてできる多角形を検索クエリーの多角形とし、クエリーなす角度情報を算出するとよい。
【0089】
なす角度情報算出部314が、クエリー多角形情報取得部312で取得したクエリー多角形形状Qの各頂点がなす角度を算出する(ステップS303)
なす角θiの配列(i=1、2、・・・、n)は、以下の式(9)、式(10)のように算出することができる。
θ[i]=arccos((β[i−1].x*β[i].x+β[i−1].y*β[i].y)/√((β[i−1].x^2+β[i−1].y^2)(β[i].x^2+β[i].y^2))) ・・・式(9)

if(θ[i]>π){θ[i]=π−θ[i]} ・・・式(10)

ここで、βは以下の式(11)〜式(14)により求めることができる。
β[i].x=Q[i+1].x−Q[i].x ・・・式(11)
β[i].y=Q[i+1].y−Q[i].y ・・・式(12)

β[i−1].x=Q[i−1].x−Q[i].x ・・・式(13)
β[i−1].y=Q[i−1].y−Q[i].y ・・・式(14)
【0090】
構成直線情報記憶部102で記憶している1つの検索対象画像の直線情報を抽出する(ステップS103)。
直線情報は、配列L[M]に、なす角情報は、2次元配列A[M][M]記憶されているとする。
なす角情報が記憶されていない場合は、直線情報を用いてなす角度情報を作成する。
【0091】
図3の例で示すと、以下のようになる。
L[1].ρ= 50、L[1].θ= 60、
L[2].ρ= 60、L[2].θ= 15、
L[3].ρ= 40、L[3].θ= 105、
A[1][1]=0, A[1][2]=45, A[1][3]=45,
A[2][1]=45, A[2][2]=0, A[2][3]=90,
A[3][1]=45, A[3][2]=90, A[3][3]=0
【0092】
構成直線候補抽出部404では、なす角度情報算出部314で算出したクエリー多角形と一致する可能性のある検索対象画像の候補を構成直線情報記憶部402から抽出する。
クエリー多角形のなす角度の順列を表す配列θ[i]と一致するなす角度の組合せを、構成直線情報記憶部402に記憶されているなす角情報2次元配列A[M][M]から探索する。
【0093】
すなわち、なす角度情報算出部414は、検索クエリーの多角形のなす角度を隣接する順に抽出したなす角度順列情報をクエリーなす角度情報に含み、さらに、構成直線候補抽出部404は、なす角度順列情報を用い、構成直線情報記憶部402から順列にしたがい類似するなす角度を持つ構成直線の組合せを抽出する。
【0094】
簡単なフィルタリングとして、すべてのi(1〜n)において、以下の式(15)を満たすp、q(1=<p,q<=M)が存在する場合のみ、以後の処理を行い、存在しない場合は、ステップS103に戻り、構成直線情報記憶部102で記憶している別の画像の直線情報を抽出する。
|θ[i]−A[p][q]|<th ・・・式(15)
【0095】
次に、θ[i](i=1〜n)の順列と同様の順列をA[M][M]から探索する。
探索方法としては、以下の再帰法を用いるとよい。
ステップS201:A[p0][q0]==θ[1]となるp0,q0を見つける。
ステップS202:A[q0][q]==θ[2]となるp0以外のqを探し、p1とする。
ステップS203:A[p1][q]==θ[3]となるp0、p1以外のqを探し、p2とする。
ステップS204:A[pi−1][q]==θ[i]となるpj(j=0,…,i−1)以外のqを探し、piとする。
ステップS205:i<nならばi=i+1としてステップS204を繰り返す。
ステップS206:i=n、かつ、pi=p0であれば抽出した頂点のなす角度順列と同一の構成直線の組合せpj(1,2,・・・,n)を出力する。それ以外は組合せがないものとする。
このように頂点のなす角度順列と同一の構成直線の組合せpj(1,2,・・・,n)を取得する(ステップS105)。
【0096】
形状間距離算出部406では、構成直線候補抽出部404で検出したクエリー多角形の辺とそれに対応する直線候補を抽出した画像ごとに、形状間距離を算出する(ステップS107)。
pjの組が得られた場合は、paおよびpbの2直線の交点(Xb,Yb)を求めることで、1つの頂点座標を算出することができる。これをn個のペアに対して行うことで、n角形の頂点座標(Xi,Yi)を算出する。このようにして抽出したn角形の頂点座標(Xi,Yi)(i=1〜nの自然数)と、クエリー多角形(Q[i].x,Q[i].y)との対応から、幾何変形パラメータα、Δθ、ΔX,ΔYを算出する。n個の頂点のうち2つを用いて式(7)に代入し、連立方程式を解くことで得られる。
【0097】
得られたパラメータを基に、クエリー多角形(Q[i].x,Q[i].y)を上記式(7)のX,Yに代入することにより、幾何変形後のクエリー多角形(Q[i]’.x,Q[i]’.y)を算出できる。
【0098】
形状間距離は、幾何変形後のクエリー多角形(Q[i]’.x,Q[i]’.y)と、抽出したn角形の頂点座標(Xi,Yi)との距離を以下の式(16)によって算出することで得られる。ここで、i=1〜nの自然数。
d=Σ(|Q[i].x−Xj|+|Q[i].y−Yj|) ・・・式(16)
また、距離の算出はこれに限らず、距離の公理を満たすものであればどのようなものを用いてもよい。
【0099】
構成直線情報記憶部402に記憶されている全ての検索対象画像に対して処理が行われたかを確認し、行われていない場合は(ステップS109のNO)、ステップS103へ戻り、新たな検索対象画像を抽出する。
構成直線情報記憶部402に記憶されている全ての検索対象画像に対して処理が行われた場合(ステップS109のYES)、算出した形状間距離を距離の短い順にソートする。ソートした形状に対応する画像情報を距離の短い順に検索結果として画面に表示する(ステップS311)。
【0100】
以上、説明したように、本実施形態の画像検索装置400によれば、上記実施形態と同様な効果を奏するとともに、回転、移動、またはスケール変動に頑強な検索が行えることができるという効果がある。その理由は、回転、移動、またはスケール変動に不変な多角形の隣接する辺のなす角度の順列を用いて検索対象画像群から同一順列のなす角度を保有する線の候補を抽出し、類似度を判定するためである。
【0101】
(第5の実施の形態)
次に、本発明の実施の形態に係る画像検索装置500について、図13を参照して詳細に説明する。図13は、本発明の実施の形態に係る画像検索装置の構成を示す機能ブロック図である。
本実施形態の画像検索装置500は、図9の上記実施の形態とは、クエリー多角形の内部領域に対応する視覚的特徴量もさらに考慮して距離を算出する点で相違する。
【0102】
本実施形態の画像検索装置500は、クエリー多角形情報取得部412で取得した検索クエリーの多角形の形状を表す頂点の位置および線分のすくなくとも1つを含む情報を基に、クエリー多角形の内部領域に対応する視覚的情報を抽出するクエリー視覚的特徴量抽出部522と、検索対象画像の色およびエッジのすくなくとも1つを含む情報を記録する検索対象画像情報記憶部202と、構成直線候補抽出部404において抽出された構成直線が囲む領域における検索対象画像の視覚的特徴量を、検索対象画像情報記憶部202に記憶されている情報を基に抽出する視覚的特徴量抽出部524と、クエリー視覚的特徴量抽出部522と視覚的特徴量抽出部524で抽出した視覚的特徴量の距離を算出する視覚的特徴量距離算出部526と、形状間距離算出部406と視覚的特徴量距離算出部526とで算出した距離を基に総合距離を算出する総合距離算出部528と、をさらに備える。
【0103】
図13を参照すると、本実施形態の画像検索装置500は、図9の上記実施形態の画像検索装置400の構成に加えて、クエリー視覚的特徴量抽出部522と、視覚的特徴量抽出部524と、視覚的特徴量距離算出部526と、総合距離算出部528と、をさらに含む。なお、本実施形態の画像検索装置500は、図8の上記実施形態の画像検索装置の構成も含むことができる。
【0104】
クエリー視覚的特徴量抽出部522は、クエリー多角形情報取得部412で取得したクエリー多角形を表す頂点の位置や線分の情報を基に、クエリー多角形の内部領域に対応する視覚的情報を抽出する。視覚的特徴量を抽出する方法として、該当領域の色に関する特徴量であるドミナントカラー(Dominant Color)(配色全体の印象を支配する色)や対象領域内の色の配置に関する特徴であるカラーレイアウト(Color Layout)、または、模様に関する特徴であるエッジヒストグラムなどの特徴を抽出するとよい。これらの特徴量は予め複数のサンプル色やサンプルパターンに対して作成しておき、ユーザに選択してもらってもよいし、ユーザが検索クエリーの多角形を選択する際に特徴量を抽出するべき画像とその画像内の領域を指定し、その画像の領域から特徴量を算出してもよい。
【0105】
視覚的特徴量抽出部524は、構成直線候補抽出部404において抽出された構成直線によって囲まれる領域における検索対象画像の視覚的特徴量を抽出する。検索対象画像情報記憶部202に記憶されている画像情報から、構成直線が囲む領域に対応する画素の色およびエッジなどを抽出し、Dominant ColorやColor Layout、エッジヒストグラムなどの特徴量を算出する。ここで算出される特徴量は上述したクエリー視覚的特徴量抽出部522と同一のものを用いる。また、検索対象画像を細かな領域に分割しておき、分割した領域ごとに特徴量を抽出して予め記憶しておくことにより、構成直線が囲む領域に対する特徴量を、範囲内の分割領域の特徴量で代用することにより特徴量の算出処理を省くことができる。
【0106】
視覚的特徴量距離算出部526は、クエリー視覚的特徴量抽出部522と、視覚的特徴量抽出部524でそれぞれ抽出した視覚的特徴量の距離である視覚的特徴量距離を算出する。視覚的特徴量距離の算出方法として、視覚的特徴量間のユークリッド距離を用いるとよい。具体的には、視覚的特徴量の各次元での値の差分の2乗をすべての次元において算出し、総和の平方根をとることで距離を算出することができる。差分の2乗の他にも、差分の絶対値など、距離の公理を満たしているものであれば何を用いてもよく、これに限定されることはない。
【0107】
総合距離算出部528は、形状間距離算出部406と、視覚的特徴量距離算出部526で算出した2つの距離を用いて統合距離を算出する。距離算出は、2つの距離を足し合わせたり、形状と視覚的の類似度の重要性に応じてそれぞれ重み付けした距離を足し合わせたりして求めることができる。
【0108】
検索対象画像情報記憶部202と検索結果表示部204は、図7の上記実施形態で説明したものと同じであるが、本実施形態では、検索対象画像情報記憶部202に、視覚的特徴量の算出に用いるためオリジナル画像やサムネイル画像を記憶しておくとさらによい。
【0109】
このように構成された本実施形態の動作について、図14を用いて以下に説明する。図14は、本発明の実施の形態に係る画像検索装置の動作の一例を示すフローチャートである。本実施形態では、図10の上記実施形態の画像検索装置400のフローチャートで、各画像の形状間距離を求めるとともに、以下の処理を行う。
【0110】
まず、クエリー視覚的特徴量抽出部522が、クエリー多角形情報取得部412で取得したクエリー多角形を表す頂点の位置や線分の情報を基に、クエリー多角形の内部領域に対応する視覚的情報を抽出する(ステップS501)。
【0111】
そして、視覚的特徴量抽出部524が、構成直線候補抽出部404において抽出された構成直線によって囲まれる領域における検索対象画像の視覚的特徴量を抽出する(ステップS503)。さらに、視覚的特徴量距離算出部526が、クエリー視覚的特徴量抽出部522と、視覚的特徴量抽出部524でそれぞれ抽出した視覚的特徴量の距離である視覚的特徴量距離を算出する(ステップS505)。そして、総合距離算出部528が、形状間距離算出部406と、視覚的特徴量距離算出部526で算出した2つの距離を用いて統合距離を算出し、出力する(ステップS507)。
【0112】
出力された総合距離は、上記第2の実施の形態における形状間距離と同様な方法でユーザに提示することができる。
【0113】
以上、説明したように、本実施形態の画像検索装置500によれば、上記実施形態と同様な効果を奏するとともに、クエリー多角形の内部領域の視覚的特徴量を考慮して距離を算出できるので、輪郭だけでなく、よりクエリーに類似した画像を検出できるとともに、検索処理の負荷を低減できる。
【0114】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【0115】
また、図13の上記実施形態の画像検索装置500において、画像検索装置400は、図1、図2または図7の上記実施形態の画像検索装置の構成とすることもできる。この場合は、クエリー視覚的特徴量抽出部522は、ユーザが選択したサンプル色またはパターンに対する視覚的情報を、クエリー多角形の内部領域に対応する視覚的情報として抽出する。また、視覚的特徴量抽出部524は、構成直線候補抽出部104において抽出された構成直線によって囲まれる領域における検索対象画像の視覚的特徴量を抽出する。また、総合距離算出部528は、形状間距離算出部106形状間距離算出部406と、視覚的特徴量距離算出部526で算出した2つの距離を用いて統合距離を算出する。
【0116】
また、図9の上記実施形態において、図10のステップS311で、検索結果を表示する際に、ソートした形状に対応する画像情報を、図7の画像検索装置200の検索対象画像情報記憶部202から取得し、距離の短い順にオリジナル画像やサムネイル画像を表示するように構成してもよい。この構成によれば、検索結果をユーザに視覚的に分かり易く提示することができる。
【0117】
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【符号の説明】
【0118】
1 クエリーなす角度情報
12 対応する構成直線の候補情報
14 形状間距離
30 クエリー頂点座標情報
100 画像検索装置
102 構成直線情報記憶部
104 構成直線候補抽出部
106 形状間距離算出部
200 画像検索装置
202 検索対象画像情報記憶部
204 検索結果表示部
300 画像検索装置
312 クエリー多角形情報取得部
314 角度情報算出部
400 画像検索装置
402 構成直線情報記憶部
404 構成直線候補抽出部
406 形状間距離算出部
412 クエリー多角形情報取得部
414 なす角度情報算出部
500 画像検索装置
522 クエリー視覚的特徴量抽出部
524 視覚的特徴量抽出部
526 視覚的特徴量距離算出部
528 総合距離算出部

【特許請求の範囲】
【請求項1】
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶手段と、
検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、前記構成直線情報記憶手段から構成直線の組合せ候補情報を抽出する構成直線候補抽出手段と、
前記構成直線候補抽出手段で抽出した前記構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する形状間距離算出手段と、
を備える画像検索装置。
【請求項2】
請求項1に記載の画像検索装置において、
検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得するクエリー多角形情報取得手段と、
前記検索クエリーの多角形情報からクエリーなす角度情報を算出するなす角度情報算出手段と、
をさらに備え、
前記構成直線候補抽出手段および前記形状間距離算出手段は、前記なす角度情報算出手段が算出した前記クエリーなす角度情報を用いる画像検索装置。
【請求項3】
請求項2に記載の画像検索装置において、
前記構成直線候補抽出手段で抽出した前記構成直線の組合せ候補情報と、前記クエリー多角形情報取得手段で得た前記検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正する補正手段をさらに備え、
前記形状間距離算出手段は、前記補正手段により幾何補正した後の形状との頂点の位置ずれ量を基に前記形状間距離を算出する画像検索装置。
【請求項4】
検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得するクエリー多角形情報取得手段と、
前記検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報を算出するなす角度情報算出手段と、
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶手段と、
前記なす角度情報算出手段で取得した前記クエリーなす角度情報の類似性に基づき、前記構成直線情報記憶手段から構成直線の組合せ候補情報を抽出する構成直線候補抽出手段と、
前記構成直線候補抽出手段で抽出した前記構成直線の組合せ候補情報と、前記クエリー多角形情報取得手段で得た前記検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する形状間距離算出手段と、
を備える画像検索装置。
【請求項5】
請求項2乃至4いずれかに記載の画像検索装置において、
前記なす角度情報算出手段は、前記クエリー多角形内の鈍角を持つ辺の両端の辺の線分を伸ばしてできる多角形を前記検索クエリーの多角形とし、前記クエリーなす角度情報を算出することを特徴とする画像検索装置。
【請求項6】
請求項1または4に記載の画像検索装置において、
前記なす角度情報算出手段は、検索クエリーの多角形のなす角度を隣接する順に抽出したなす角度順列情報をクエリーなす角度情報に含み、
前記構成直線候補抽出手段は、なす角度順列情報を用い、前記構成直線情報記憶手段から順列にしたがい類似するなす角度を持つ構成直線の組合せを抽出する画像検索装置。
【請求項7】
請求項4に記載の画像検索装置において、
クエリー多角形情報取得手段で取得した前記検索クエリーの多角形の形状を表す頂点の位置および線分のすくなくとも1つを含む情報を基に、クエリー多角形の内部領域に対応する視覚的情報を抽出するクエリー視覚的特徴量抽出手段と、
検索対象画像の色およびエッジのすくなくとも1つを含む情報を記録する検索対象画像情報記憶手段と、
構成直線候補抽出手段において抽出された構成直線が囲む領域における検索対象画像の視覚的特徴量を、前記検索対象画像情報記憶手段に記憶されている情報を基に抽出する視覚的特徴量抽出手段と、
前記クエリー視覚的特徴量抽出手段と前記視覚的特徴量抽出手段で抽出した視覚的特徴量の距離を算出する視覚的特徴量距離算出手段と、
前記形状間距離算出手段と前記視覚的特徴量距離算出手段とで算出した距離を基に総合距離を算出する総合距離算出手段と、
をさらに備える画像検索装置。
【請求項8】
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶装置を有する画像検索装置のデータ処理方法であって、
前記画像検索装置が、
検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、前記構成直線情報記憶装置から構成直線の組合せ候補情報を抽出し、
抽出した前記構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する画像検索装置のデータ処理方法。
【請求項9】
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶装置を有する画像検索装置のデータ処理方法であって、
前記画像検索装置が、
検索クエリーの形状を表す、頂点位置または線分のいずれかを含む多角形情報を取得し、
前記検索クエリーの多角形情報から多角形のなす角度を含むクエリーなす角度情報を算出し、
取得した前記クエリーなす角度情報の類似性に基づき、前記構成直線情報記憶装置から構成直線の組合せ候補情報を抽出し、
抽出した前記構成直線の組合せ候補情報と、得られた前記検索クエリーの多角形情報とから、多角形の移動、回転、およびスケールのうち少なくとも1つの幾何変形量を算出して幾何補正した後の形状との頂点の位置ずれ量を基に距離を算出する画像検索装置のデータ処理方法。
【請求項10】
検索対象画像中の輪郭を構成する直線の情報を記憶する構成直線情報記憶手段と、
検索クエリーの多角形のなす角度を含むクエリーなす角度情報の類似性に基づき、前記構成直線情報記憶手段から構成直線の組合せ候補情報を抽出する構成直線候補抽出手段と、
前記構成直線候補抽出手段で抽出した構成直線の組合せ候補情報と前記クエリーなす角度情報とから、形状間距離を算出する形状間距離算出手段と、
算出された前記形状間距離をユーザに提示する提示手段と、
を備える画像検索システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2011−253442(P2011−253442A)
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願番号】特願2010−128157(P2010−128157)
【出願日】平成22年6月3日(2010.6.3)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】