画像検索装置、画像検索方法、画像検索プログラム、記録媒体、及び画像類似度算出プログラム
【課題】解像度、構図、画質等の画像を変容させる要因の影響を受けにくい類似度に基づいた画像検索装置等を提供する。
【解決手段】第1の画像における第1の特徴点を抽出し、検索クエリ画像として第2の画像の入力を受け付け(S20)、第2の画像から第2の特徴点を抽出し(S21)、第1の特徴点と第2の特徴点とにおいて、互いに対応する対応特徴点を探索し(S23)、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度を算出し(S24)、記対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出し(S25)、画像類似度に基づき、第1の画像を選択し(S26)、選択された第1の画像を検索結果として出力する(S27)。
【解決手段】第1の画像における第1の特徴点を抽出し、検索クエリ画像として第2の画像の入力を受け付け(S20)、第2の画像から第2の特徴点を抽出し(S21)、第1の特徴点と第2の特徴点とにおいて、互いに対応する対応特徴点を探索し(S23)、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度を算出し(S24)、記対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出し(S25)、画像類似度に基づき、第1の画像を選択し(S26)、選択された第1の画像を検索結果として出力する(S27)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像の類似度を利用して画像を検索する技術分野に関する。
【背景技術】
【0002】
画像の検索方法においては、タグと呼ばれるテキスト情報を付加して画像を記憶したり、画像の特徴量に関連付けて画像を記憶したりして、検索データベースが構築されている。検索の際、この検索データベースが参照され、タグを利用して検索キーワードにより画像検索が行われたり、検索クエリ画像の特徴量の類似度に基づき、画像検索が行われたりしている。
【0003】
これら画像の検索方法において、画像検索の精度を向上させ、ユーザが探している画像に的確にヒットさせるために様々な工夫がなされている。例えば、特許文献1には、画像検索のための基本クエリ画像を受け付け、基本クエリ画像に画像処理を施すことによって、疑似クエリ画像を生成し、基本クエリ画像及び疑似クエリ画像の両方について、それぞれ、複数の対象画像から、類似画像を検索することにより、仮検索結果を得て、仮検索結果を統合して、全体的な順位付けを行うことにより、出力用検索結果を得る画像検索技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2010−61285号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、インターネット等のネットワーク上にある画像においては、画像の解像度の違い、画像における構図の違い、画像の画質の違い等、画像を変容させる画像変容要因が様々あるため、上記技術等の従来技術では、人間の主観的評価に近い適切な類似度を算出することが難しかった。そのため、画像検索において、類似な画像を取りこぼすという問題があった。また、画質の評価において、基準画像と、評価対象画像との類似度に基づき、画像変容要因の影響を受けにくい画質評価をすることが難しかった。
【0006】
本発明は、このような問題に鑑みてなされたものであり、その目的は、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい類似度に基づいた画像検索装置、画像検索方法、画像検索プログラム、記録媒体、及び画像類似度算出プログラムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る画像検索装置は、第1の画像を記憶する第1画像記憶手段と、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出手段と、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力手段と、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出手段と、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索手段と、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出手段と、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出手段と、前記第1画像記憶手段を参照して、前記画像類似度に基づき、第1の画像を選択する選択手段と、前記選択された第1の画像を検索結果として出力する第1画像出力手段と、を備える。
【0008】
本発明に係る画像検索装置において、前記特徴点に対して特徴点の選定を行う特徴点選定手段を更に備えるように構成する。
【0009】
本発明に係る画像検索装置において、前記特徴点選定手段が、所定の閾値に基づき前記特徴点の選定を行うように構成する。
【0010】
本発明に係る画像検索装置において、前記第1又は第2画像特徴点抽出手段が、前記画像に対して所定のスケールにより平滑化処理して平滑化画像を求め、スケールの異なる前記平滑化画像間での差分処理をして差分・平滑化画像を求め、前記差分・平滑化画像において、極値となる前記特徴点を抽出するように構成する。
【0011】
本発明に係る画像検索装置において、前記特徴点の周辺領域における勾配情報を算出する勾配情報算出手段を更に備え、前記対応特徴点探索手段が、前記勾配情報に基づき、前記対応特徴点を探索するように構成する。
【0012】
本発明に係る画像検索装置において、前記対応領域類似度算出手段が、各前記対応領域の画素値の平均及び分散と、前記対応領域の間における画素値の相互相関とに基づき、前記対応領域類似度を算出するように構成する。
【0013】
本発明に係る画像検索装置において、前記対応領域類似度算出手段が、各前記対応領域の画素値の最大値と、前記対応領域の間における画素値の差とに基づき、前記対応領域類似度を算出するように構成する。
【0014】
本発明に係る画像検索装置において、抽出された前記第1の特徴点を予め記憶する第1画像特徴点記憶手段を更に備えるように構成する。
【0015】
上記課題を解決するために、本発明に係る画像検索方法は、画像の検索を行う画像検索装置の画像検索方法において、前記画像検索装置が、第1の画像を記憶する第1画像記憶ステップと、前記画像検索装置が、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、前記画像類似度に基づき、第1の画像を選択する選択ステップと、前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、を有する。
【0016】
上記課題を解決するために、本発明に係る画像検索プログラムは、コンピュータに、第1の画像を記憶する第1画像記憶ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、前記画像類似度に基づき、第1の画像を選択する選択ステップと、前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、を実行させる。
【0017】
上記課題を解決するために、本発明に係る記録媒体は、コンピュータに、第1の画像を記憶する第1画像記憶ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、前記画像類似度に基づき、第1の画像を選択する選択ステップと、前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、を実行させる画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0018】
上記課題を解決するために、本発明に係る画像類似度算出プログラムは、コンピュータを、第1の画像の入力を受け付ける第1画像入力ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、を実行させる。
【0019】
上記課題を解決するために、本発明に係る記録媒体は、コンピュータを、第1の画像の入力を受け付ける第1画像入力ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、を実行させる画像類似度算出プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0020】
本発明によれば、第1の画像における第1の特徴点を抽出し、検索クエリ画像として第2の画像から第2の特徴点を抽出し、第1の特徴点と第2の特徴点とにおいて、互いに対応する対応特徴点を探索し、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出し、この画像類似度に基づき画像検索をすることにより、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい対応領域間の対応領域類似度を算出し、各対応特徴点における対応領域類似度から第1画像と第2画像との画像全体の画像類似度を算出して、この画像類似度に基づき画像検索を行っているので、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい画像検索ができる。
【図面の簡単な説明】
【0021】
【図1】本発明の一実施形態に係る画像検索システムの概要構成例を示す模式図である。
【図2】図1の画像検索サーバの概要構成の一例を示すブロック図である。
【図3】図2の画像関連情報データベースに記憶された画像関連情報テーブルの一例を示す模式図である。
【図4】図1の端末の概要構成の一例を示すブロック図である。
【図5】図1の画像検索システムにおけるデータベース構築の動作例を示すフローチャートである。
【図6】図2の画像データベースに保存されている画像の一例を示す模式図である。
【図7】図6の画像に対して特徴点を示した模式図である。
【図8】特徴点抽出のサブルーチンを示すフローチャートである。
【図9】図1の画像検索システムの動作例を示すフローチャートである。
【図10】検索クエリ画像の一例を示す模式図である。
【図11】検索クエリ画像とデータベース中の画像との間で対応する特徴点を示す模式図である。
【図12】画像検索結果の一例を示す模式図である。
【図13】検索クエリ画像とデータベース中の画像との間で対応する特徴点を示す模式図である。
【図14】画像評価装置の動作例を示すフローチャートである。
【発明を実施するための形態】
【0022】
以下、図面を参照して本発明を実施するための形態について説明する。
【0023】
<第1実施形態>
まず、本発明の第1実施形態に係る画像検索システムについて説明する。
【0024】
[1.画像検索システムの構成及び機能概要]
本発明の第1実施形態に係る画像検索システムの構成及び概要機能について、図1を用いて説明する。図1は、本実施形態に係る画像検索システム1の概要構成例を示す模式図である。
【0025】
図1に示すように、画像検索システム1は、受信した検索クエリ画像に対する検索結果の画像を求める画像検索サーバ(画像検索装置の一例)10と、検索クエリ画像を送信する端末20(端末の一例)と、を備えている。
【0026】
画像検索サーバ10と、端末20とは、ネットワーク3により接続され、通信プロトコル(例えば、TCP/IP)により、データの送受信が可能になっている。なお、ネットワーク3は、例えば、インターネット、専用通信回線(例えば、CATV(Community Antenna Television)回線)、移動体通信網(基地局等を含む)、及び、ゲートウェイ等により構築されている。
【0027】
また、画像検索サーバ10は、ネットワーク3を通して、外部のウェブサーバ5に接続していて、ウェブサーバ5等から画像を収集してくる。そして、画像検索サーバ10は、高速に画像検索を行うため、収集した画像から、画像の特徴点等の情報を抽出して、画像と共に予めデータベースを構築しておく。
【0028】
[2.画像検索サーバ等の構成及び機能]
(2.1 画像検索サーバ10の構成及び機能)
次に、画像検索サーバ10の構成及び機能について、図2及び図3を用いて説明する。図2は、画像検索サーバ10の概要構成の一例を示すブロック図である。図3は、画像関連情報データベースに記憶された画像関連情報テーブルの一例を示す模式図である。
【0029】
図2に示すように、コンピュータとして機能する画像検索サーバ10は、通信部11と、記憶部12と、表示部13と、操作部14と、入出力インターフェース部15と、システム制御部16とを備えている。そして、システム制御部16と入出力インターフェース部15とは、システムバス17を介して接続されている。
【0030】
通信部11は、ネットワーク3に接続して端末20、ウェブサーバ5等との通信状態を制御し、データの送受信を行う。
【0031】
記憶部12は、例えば、ハードディスクドライブ等により構成されており、オペレーティングシステム及びサーバプログラム等の各種プログラムや、データ等を記憶する。なお、各種プログラムは、例えば、他のサーバ装置等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置を介して読み込まれるようにしてもよい。
【0032】
また、記憶部12には、ウェブサーバ5等から収集した画像を記憶する画像データベース(DB)12a(以下「画像DB」とする。)、画像関連情報データベース(DB)12a(以下「画像関連情報DB」とする。)等が構築されている。
【0033】
画像DB12a(第1画像記憶手段の一例)には、ウェブサーバ5等から収集した画像(第1の画像の一例)が、割り当てられた画像IDに関連付けられて記憶されている。
【0034】
画像関連情報DB12b(第1画像特徴点記憶手段の一例)には、図3に示すように、画像関連情報テーブルには、画像IDにより各画像に関連付けられ、画像のURL(Uniform Resource Locator)情報、画像の解像度、画像の特徴点の座標、特徴点周辺の勾配情報、特徴点を選択する際の閾値(所定の閾値の一例)、画像に付されたタグ情報等が記憶されている。なお、特徴点、勾配情報、閾値に関する詳細は、後述する。
【0035】
表示部13は、例えば、液晶表示素子又はEL(Electro Luminescence)素子等によって構成されている。
【0036】
操作部14は、例えば、キーボード及びマウス等によって構成されている。
【0037】
次に、入出力インターフェース部15は、通信部11及び記憶部12とシステム制御部16との間のインターフェース処理を行う。
【0038】
システム制御部16は、CPU(Central Processing Unit)16a、ROM(Read Only Memory)16b、RAM(Random Access Memory)16c等により構成されている。システム制御部16は、CPU16aがROM16bや記憶部12に記憶された各種プログラムを読み出し実行することにより、画像から特徴点を抽出する処理等を行う。
【0039】
(2.2 端末20の構成及び機能)
次に、端末20の構成及び機能について、図4を用いて説明する。図4は、端末20の概要構成の一例を示すブロック図である。
【0040】
図4に示すように、コンピュータとして機能する端末20は、例えば、パーソナルコンピュータや携帯型無線電話機やPDA等の携帯端末であり、通信部21と、記憶部22と、表示部23と、操作部24と、入出力インターフェース部25と、システム制御部26とを備えている。そして、システム制御部26と入出力インターフェース部25とは、システムバス27を介して接続されている。
【0041】
通信部21は、ネットワーク3を通して、画像検索サーバ10等と通信を制御する。なお、端末20が携帯型無線電話機の場合、ネットワーク3の移動体通信網に接続するために、通信部21は、無線通信機能を有する。
【0042】
記憶部22は、例えば、ハードディスクドライブ等からなり、オペレーティングシステム、Webブラウザプログラム等の各種のプログラムを記憶する。なお、各種プログラムは、例えば、サーバ装置等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置を介して読み込まれるようにしてもよい。
【0043】
表示部23は、例えば、液晶表示素子又はEL素子等によって構成されている。表示部23には、画像検索サーバ10から取得した画像検索結果のウェブページ等が表示される。
【0044】
操作部24は、例えば、キーボード及びマウス等によって構成されている。ユーザは、操作部34により画像を含む検索クエリ等を入力する。なお、表示部23がタッチパネルのようなタッチスイッチ方式の表示パネルの場合、操作部24は、表示部23の画面が押された箇所の位置情報を取得する。
【0045】
入出力インターフェース部25は、通信部21及び記憶部22とシステム制御部26とのインターフェースである。
【0046】
システム制御部26は、例えば、CPU26aと、ROM26bと、RAM26cとを有する。
【0047】
システム制御部26は、CPU26aが、ROM26bや、RAM26cや、記憶部22に記憶された各種プログラムを読み出して実行する。
【0048】
[3.画像検索システムの動作]
(3.1 画像データベースの構築)
本発明の一実施形態に係る画像検索システム1における画像DB12a及び画像関連情報DB12bの構築について図5、図6、及び、図7を用いて説明する。図5は、画像検索システム1においてデータベース構築の手順を示すブロック図である。図6は、画像データベースに保存されているデータベース画像の一例を示す模式図である。図7は、データベース画像における特徴点を示した模式図である。
【0049】
画像検索サーバ10は、検索用のデータベース画像(DB画像)を取得する(ステップS1)。具体的には、画像検索サーバ10のシステム制御部16は、クローリング等によりウェブサーバ5等から収集したDB画像(第1の画像の一例)を取得する。そして、画像検索サーバ10のシステム制御部16は、取得した画像に画像IDを割り当て、画像IDに関連付けて、図6に示すような複数のDB画像30を画像DB12aに記憶する。また、画像検索サーバ10のシステム制御部16は、取得した画像のURL情報や画像の解像度、画像に付されたタグ等を、画像関連情報DB12bに記憶する。このように画像検索サーバ10のシステム制御部16は、第1の画像を記憶する第1画像記憶手段の一例として機能する。
【0050】
次に、画像検索サーバ10は、DB画像の特徴点を抽出する(ステップS2)。具体的には、画像検索サーバ10のシステム制御部16は、特徴点抽出サブルーチンにより、図7に示すように、DB画像から特徴点(第1の特徴点の一例)を抽出する。この特徴点抽出は、例えば、SIFT(Scale Invariant Feature Transform)の手法を用いて実行される。この特徴点は、SIFTの場合、キーポイントと呼ばれる。なお、詳細は、後述する特徴点抽出サブルーチンにて説明する。このように画像検索サーバ10のシステム制御部16は、第1の画像における第1の特徴点を抽出する第1画像特徴点抽出手段の一例として機能する。
【0051】
次に、画像検索サーバ10は、特徴点の周辺領域の勾配情報を算出する(ステップS3)。具体的には、まず画像検索サーバ10のシステム制御部16は、取得した画像の各特徴点におけるオリエンテーションを算出する。オリエンテーションは、後で算出する画像の特徴量が、回転に不変な特徴量となるように、特徴点のオリエンテーションを求め、オリエンテーションにより正規化するために利用される。
【0052】
このオリエンテーションは、特徴点における方向を表し、特徴点に対して求めた重み付き勾配方向ヒストグラムによって決定される。例えば、システム制御部16は、画像データI(x,y)に対してあるスケール(標準偏差σ)を有するガウシアンフィルタG(x,y,σ)を適用し、平滑化画像L(x,y)を得る。次に、システム制御部16は、特徴点を中心とした局所領域における平滑化画像L(x,y)の勾配強度と勾配方向を求め、勾配強度と勾配方向とから、例えば36方向に量子化した勾配方向ヒストグラムを算出する。なお、特徴点に近い領域の勾配をより強く反映させるため、システム制御部16は、勾配強度に対して、特徴点を中心としたガウシアンウインドを被せて、重み付けされた勾配方向ヒストグラムを算出する。
【0053】
そして、システム制御部16は、この36方向に対するヒストグラムの最大値をオリエンテーションとして割り当てる。なお、システム制御部16は、この最大値を100%とした場合における80%以上となる方向も特徴点のオリエンテーションとして割り当ててもよい。
【0054】
次に、システム制御部16は、周辺領域の勾配情報として、算出したオリエンテーションに基づき128次元の特徴量を算出する。例えば、システム制御部16は、算出したオリエンテーションに合わせて、特徴点の周辺領域を回転させる。この周辺領域を、1辺を4ブロックの計16ブロックに分割し、特徴点のオリエンテーションを算出したように、各ブロックに対して8方向の勾配方向ヒストグラムを算出する。
【0055】
システム制御部16は、4×4=16ブロックに対して、各8方向の勾配方向ヒストグラムを作成するため、128次元の特徴ベクトルとして、特徴点の周辺領域の勾配情報を算出する。この勾配情報は、各特徴点が持つオリエンテーション方向に座標軸を合わせた領域で特徴を算出しているので、回転に不変な特徴量となる。また、勾配情報の一例である128次元の各特徴ベクトルの長さはベクトルの総和で正規化されるので、照明変化に対して影響の少ない特徴量となる。
【0056】
次に、画像検索サーバ10は、DB画像、特徴点、及び勾配情報を記憶する(ステップS4)。具体的には、画像検索サーバ10のシステム制御部16は、図3に示すように、DB画像の各特徴点、及び、各特徴点における勾配情報を画像IDに関連付けて画像関連情報DB12bに記憶する。このように画像検索サーバ10のシステム制御部16は、抽出された第1の特徴点を予め記憶する第1画像特徴点記憶手段の一例として機能する。
【0057】
(3.2 特徴点抽出のサブルーチン)
次に、特徴点抽出のサブルーチンについて、図8を用いて説明する。図8は、特徴点抽出のサブルーチンを示すフローチャートである。なお、この特徴点抽出のサブルーチンは、例えば、SIFTの手法におけるキーポイントの検出及びキーポイントのローカライズに当たる。
【0058】
図8に示すように、まず、画像検索サーバ10は、取得したDB画像に対して、所定のスケールの平滑化画像を求める(ステップS10)。具体的には、画像検索サーバ10のシステム制御部16は、スケール(ガウス関数の標準偏差)の異なるガウシアンフィルタを用いて、取得したDB画像に対する複数の平滑化画像を求める。更に具体的には、画像検索サーバ10のシステム制御部16は、ガウス関数G(x,y,σ)と入力画像の画像データI(u,v)を畳み込んで、平滑化画像L(u,v,σ)を求める。なお、ここでx、yは、注目画素からの距離、標準偏差σはガウシアンフィルタのスケール、u及びvは、注目画素を表す。
【0059】
次に、画像検索サーバ10は、スケールが異なる平滑化画像間のDoG画像(Difference-of-Gaussian 画像)を求める(ステップS11)。具体的には、画像検索サーバ10のシステム制御部16は、スケールの異なるガウス関数で平滑化した2枚の平滑化画像の差分画像を求めることで、DoG画像(差分・平滑化画像の一例)を求める。例えば、ガウシアンフィルタのスケールの初期値σ0、ガウシアンフィルタのスケールの増加率kとすると、画像検索サーバ10のシステム制御部16は、スケールの初期値σ0からk倍ずつ増加させたスケール(σ0、kσ0、k2σ0、k3σ0・・・)において、異なるスケール間(例えば、スケールkσ0とスケールk2σ0との間)で、差分画像を求めることで、複数のDoG画像を求める。
【0060】
次に、画像検索サーバ10は、複数のDoG画像における極値を求める(ステップS12)。具体的には、画像検索サーバ10のシステム制御部16は、DoG画像3枚1組に対して、例えば、DoG画像D(u,v,k2σ0)の注目画素と、その周りの例えば26近傍を比較し、極値を求める。この極値検出は、スケールの値の小さいDoG画像から順に行い、一度極値が検出された画素は、より大きなスケールで極値が検出されたとしても特徴点にしない。この処理をスケールの異なるDoG画像の全画素に対して行う。ここで、DoG画像は、異なるスケールによる2枚の平滑化画像の差分からなる画像であるため、DoG画像内のある座標の画素値が大きくなるスケールでは、スケールの変化領域にエッジ等の情報量を多く含んでいるといえる。そこで、DoG画像から極値を検出し、特徴点(キーポイント)とスケールが決定される。なお、画像サイズが2倍となると、極値探索により検出された特徴点のスケールも比例して2倍となる。SIFT法は、特徴を最も含むスケールを自動的に決定するため、空間的に同範囲の領域から特徴量を記述することで、画像の拡大・縮小に対して不変な特徴量となる。
【0061】
このように画像検索サーバ10のシステム制御部16は、画像に対して所定のスケールにより平滑化処理して平滑化画像を求め、スケールの異なる平滑化画像間での差分処理をして差分・平滑化画像を求め、差分・平滑化画像において、極値となる特徴点を抽出する第1又は第2画像特徴点抽出手段の一例として機能する。
【0062】
次に、画像検索サーバ10は、極値となった画素を特徴点とする(ステップS13)。具体的には、画像検索サーバ10のシステム制御部16は、注目画素の周辺の近傍における値を比較し、極値であった場合には、その画素を特徴点として検出する。
【0063】
次に、画像検索サーバ10は、特徴点を選定する(ステップS14)。この特徴点選定は、SIFTの手法におけるキーポイントのローカライズに当たり、検出された特徴点のうち、特徴点として適切でない点が削除される。例えば、特徴点として適切でないものとしては開口問題に影響を受けやすいエッジ上の特徴点と、ノイズの影響を受けやすいDoG画像中の画素値が低い特徴点が挙げられる。エッジ上の特徴点は主曲率により、画素値が低い特徴点はコントラストを利用することにより、安定したキーポイントに絞り込む。
【0064】
まず、画像検索サーバ10のシステム制御部16は、各特徴点におけるDoG画像の画素値の2次微分から2次元ヘッセ行列を計算し、主曲率を求める。そして、画像検索サーバ10のシステム制御部16は、ヘッセ行列の第1固有値と第2固有値との固有値の比率の関係式を、ヘッセ行列のトレース和と行列式とから求め、エッジ上にあるか否かを判定する。画像検索サーバ10のシステム制御部16は、固有値の比率が、所定の閾値より大きい場合、エッジ上に存在する不要な特徴点として、特徴点を削除する。
【0065】
次に、画像検索サーバ10のシステム制御部16は、DoG画像D(x,y,σ)の2次のテイラー展開に対し、点X=(x、y、σ)に関する偏導関数を求め、その偏導関数が0となる点をサブピクセル位置X^=(x^,y^,σ^)とする。
【0066】
画像検索サーバ10のシステム制御部16は、サブピクセル位置X^でのDoG画像の画素値の関係式より、サブピクセル位置X^でのDoG画像の画素値を求め、この画素値の絶対値が、所定の閾値より小さい場合(コントラストが低い場合)、ノイズに影響されやすい特徴点であるため、この特徴点を削除する。このように画像検索サーバ10のシステム制御部16は、特徴点に対して特徴点の選定を行う特徴点選定手段の一例として機能する。また、画像検索サーバ10のシステム制御部16は、所定の閾値に基づき特徴点の選定を行う特徴点選定手段の一例として機能する。
【0067】
これらの処理により、図7に示すように、各DB画像に対して、選定された特徴点が求まる。なお、所定の閾値は、図3に示すように、予め設定しておく。
【0068】
(3.3 画像検索)
次に、端末から受け付けた検索クエリ画像に基づき、画像検索をする動作について、図9〜図13を用いて説明する。図9は、画像検索システム1の動作例を示すフローチャートである。図10は、検索クエリ画像の一例を示す模式図である。図11及び図13は、検索クエリ画像とデータベース中の画像との間で対応する特徴点を示す模式図である。図12は、画像検索結果の一例を示す模式図である。
【0069】
まず、端末20のシステム制御部26は、ユーザにより画像データが添付された検索クエリを、画像検索サーバ10に送信する。
【0070】
次に、図9に示すように、画像検索サーバ10は、検索クエリ画像の入力を受け付ける(ステップS20)。具体的には、画像検索サーバ10のシステム制御部16は、通信部11を通して、端末20から検索クエリ画像(第2の画像の一例)を受信する。なお、図10(A)には人物像の検索クエリ画像35、図10(B)には、建物の検索クエリ画像35、図10(C)には、複数のオブジェクトが写っている検索クエリ画像35が例示してある。このように画像検索サーバ10のシステム制御部16は、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力手段の一例として機能する。
【0071】
次に、画像検索サーバ10は、検索クエリ画像の特徴点を抽出する(ステップS21)。具体的には、画像検索サーバ10のシステム制御部16は、図8に示した特徴点抽出のサブルーチンにより、DB画像の場合のステップS2と同様に、検索クエリ画像に対しても特徴点(第2の特徴点の一例)を抽出する。このように画像検索サーバ10のシステム制御部16は、第2の画像から第2の特徴点を抽出する第2画像特徴点抽出手段の一例として機能する。
【0072】
次に、画像検索サーバ10は、特徴点の周辺領域の勾配情報を算出する(ステップS22)。具体的には、画像検索サーバ10のシステム制御部16は、DB画像の場合のステップS3と同様に、検索クエリ画像の特徴点の周辺領域の勾配情報(128次元の特徴量)を算出する。このように画像検索サーバ10のシステム制御部16は、特徴点の周辺領域における勾配情報を算出する勾配情報算出手段の一例として機能する。
【0073】
次に、画像検索サーバ10は、勾配情報に基づき、検索クエリ画像の特徴点とDB画像の特徴点との対応特徴点を探索する(ステップS23)。具体的には、画像検索サーバ10のシステム制御部16は、まず、検索クエリ画像35のある特徴点における勾配情報と、画像関連情報DB12bを参照して、あるDB画像30におけるすべての特徴点の勾配情報との距離(例えば、ユークリッド距離)を算出する。そして、画像検索サーバ10のシステム制御部16は、これらの距離の最小値を求め、最小値を示すこのDB画像30の特徴点を特定する。次に、画像検索サーバ10のシステム制御部16は、この最小値が所定の閾値以下となった場合に、検索クエリ画像35のある特徴点と、この特定されたDB画像30の特徴点とを、互いに対応する対応特徴点とする。
【0074】
次に、画像検索サーバ10のシステム制御部16は、同様に、検索クエリ画像の他の特徴点に対しても対応特徴点を求める。図11(A)は、検索クエリ画像35の対応特徴点と、あるDB画像30の対応特徴点とを直線により結んだ図である。
【0075】
次に、図11(B)及び図11(C)に示すように、画像検索サーバ10のシステム制御部16は、画像関連情報DB12bを参照して、他のDB画像30においても、対応特徴点を探索する。また、画像検索サーバ10のシステム制御部16は、対応特徴点の組の個数も算出する。なお、図11(A)は、DB画像30が検索クエリ画像35と同一の画像の場合で、図11(B)の図11(A)の画像の一部からトリミングしたトリミング画像(DB画像30)の場合で、図11(C)は、図11(A)の画像(特に顔の部分)に歪みを加えた画像(DB画像30)である。
【0076】
これらのように画像検索サーバ10のシステム制御部16は、第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索手段の一例として機能する。また画像検索サーバ10のシステム制御部16は、勾配情報に基づき、対応特徴点を探索する対応特徴点探索手段の一例として機能する。
【0077】
次に、画像検索サーバ10は、各対応特徴点を含む各対応領域間の領域類似度を算出する(ステップS24)。まず、画像検索サーバ10のシステム制御部16は、検索クエリ画像及びDB画像のそれぞれに対して、対応特徴点を含む局所領域を対応領域として抽出する。そして、画像検索サーバ10のシステム制御部16は、SSIM(Structural SIMilarity)アルゴリズムにより、検索クエリ画像及びDB画像において対応する対応領域間の領域類似度を算出する。画像検索サーバ10のシステム制御部16は、各対応領域間に対して領域類似度を算出する。このように画像検索サーバ10のシステム制御部16は、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出手段の一例として機能する。
【0078】
ここで、SSIMアルゴリズムは、2つの画像における画素値の平均値、分散、及び共分散(相互相関の一例)より、画像間の類似度を計測する。この類似度は、0〜1の数値で表現され,結果が1の場合には画像の完全な一致を表す。このように画像検索サーバ10のシステム制御部16は、各対応領域の画素値の平均及び分散と、対応領域の間における画素値の相互相関とに基づき、対応領域類似度を算出する対応領域類似度算出手段の一例として機能する。
【0079】
次に、画像検索サーバ10は、領域類似度に基づき、画像類似度を算出する(ステップS25)。具体的には、画像検索サーバ10のシステム制御部16は、各領域類似度の合計(加算)し、対応特徴点の組の個数で割ることにより平均し、正規化された画像類似度を算出する。画像検索サーバ10は、各DB画像に対して、画像類似度を算出し、この画像類似度を画像IDに関連付けて、記憶部やRAM16c等に一時的に記憶する。このように画像検索サーバ10のシステム制御部16は、対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出する画像類似度算出手段の一例として機能する。
【0080】
なお、正規化された画像類似度に検索クエリ画像の特徴点数に対するDB画像の特徴点数の割合を考慮して決定して(例えば、正規化された画像類似度にこの割合を乗算する)、画像類似度を算出してもよい。この場合、検索対象のDB画像が、検索クエリ画像の部分的な特徴を多く含む場合に、類似の評価が高くなり、人間が類似と感じやすい検索結果の画像の順位が高くなる。
【0081】
次に、画像検索サーバ10は、画像類似度に基づき検索クエリ画像に類似したDB画像を選択する(ステップS26)。具体的には、画像検索サーバ10のシステム制御部16は、画像DB12aや画像関連情報DB12bから、画像類似度の高い順に、例えば、上位10件の画像(画像ID)を選択する。このように画像検索サーバ10のシステム制御部16は、第1画像記憶手段を参照して、画像類似度に基づき、第1の画像を選択する選択手段の一例として機能する。
【0082】
次に、画像検索サーバ10は、選択した画像を出力する(ステップS27)。具体的には、画像検索サーバ10のシステム制御部16は、選択した画像IDに基づき、画像DB12aや画像関連情報DB12bを参照して、選択した画像IDに関連した画像やURL情報やスニペット等を読み出す。そして、画像検索サーバ10のシステム制御部16は、図12に示すように、検索結果が端末20の表示部23に表示されるように、HTML(Hyper Text Markup Language)、XML(Extensible Markup Language)等のマークアップ言語によりファイルを生成し、端末20に送信することにより、端末20に出力する。このように画像検索サーバ10のシステム制御部16は、選択された第1の画像を検索結果として出力する第1画像出力手段の一例として機能する
【0083】
次に、端末20のシステム制御部26は、通信部21を通して、検索結果としてHTMLファイルのデータを受信し、表示部23に画像を表示させる。
【0084】
ここで、対応特徴点のシミュレーション結果について図11及び図13を用いて説明する。図13は、他の検索クエリ画像の場合の対応特徴点の様子を示した場合である。
【0085】
図11(B)及び図13(A)に示すように、検索クエリ画像35のトリミング画像の場合、トリミング画像(DB画像30)の特徴点と、検索クエリ画像35のトリミングされた部分の特徴点とが対応していることが分かる。また、図13(B)に示すように、解像度が異なる画像(DB画像30)の場合、対応特徴点の個数は減少するが、対応特徴点同士を結んだ直線の交差がほとんど無く、各対応特徴点同士の対応がよく取れていることが分かる。また、図13(D)に示すように、検索クエリ画像35に対してSeam Carvingの処理がされた画像(DB画像30)の場合、画像内の各オブジェクトの特徴点同士が対応していることが分かる。また、図11(C)に示すように、歪められた顔の部分に対応特徴点がほとんど無いことが分かる。また、画像が類似しなくなると、対応特徴点の組の個数が減少することも分かる。
【0086】
以上、本実施形態によれば、DB画像30を記憶し、DB画像30の特徴点を抽出し、検索クエリ画像35の入力を受け付け、検索クエリ画像35の特徴点を抽出し、DB画像30の特徴点と検索クエリ画像35の特徴点とにおいて、互いに対応する対応特徴点を探索し、DB画像30の対応特徴点を含む対応領域と、検索クエリ画像35の対応特徴点を含む対応領域との対応領域類似度を算出し、対応領域類似度に基づき、DB画像30と検索クエリ画像35との画像類似度を算出し、画像類似度に基づき、DB画像30を選択し、選択されたDB画像30を検索結果として出力することにより、解像度、構図、画質等の画像を変容させる要因が異なっても、人間の主観的評価に近い適切な類似度に基づいた画像検索結果を得ることができる。
【0087】
また、DB画像30からDB画像30の特徴点を選定し、検索クエリ画像35から検索クエリ画像35の特徴点を選定する場合、ステップS14のように、特徴点として適切でない点が削除され、特徴点の数が減少するため、画像関連情報DB12bの規模を小さくでき、かつ、画像検索が高速になる。また、画像を表す特徴量として適切な特徴点に選定されているため、画像検索の精度も向上する。
【0088】
また、所定の閾値に基づき、DB画像30からDB画像30の特徴点を選定する場合、又は、検索クエリ画像35から検索クエリ画像35の特徴点を選定する場合、閾値を調整することにより、例えば、閾値を高くすると、検索結果の候補が絞られ、ほぼ同一の画像を得ることができる。
【0089】
また、DB画像30又は検索クエリ画像35に対して所定のスケールにより平滑化処理して平滑化画像を求め、スケールの異なる平滑化画像間での差分処理をして差分・平滑化画像(例えば、DoG画像)を求め、差分・平滑化画像において、極値となる特徴点を抽出する場合、平滑化により雑音に対して頑健で、差分・平滑化画像により、画像の特徴的部分である画像値の極値となる部分を取り出すことができる。
【0090】
また、特徴点の周辺領域における勾配情報を算出し、勾配情報に基づき、対応特徴点を探索する場合、特徴点の周辺領域の画像変化を表す勾配情報により、DB画像30と検索クエリ画像35において、互いに勾配情報が類似した特徴点を、対応特徴点として的確に見つけ出すことができる。
【0091】
また、各対応領域の画素値の平均及び分散と、対応領域の間における画素値の相互相関とに基づき、対応領域類似度を算出する場合、対応領域間において、構造的類似度を算出しているため、人間の主観に近い類似度を算出できる。
【0092】
また、DB画像30から抽出された特徴点を予め記憶する場合、検索の速度が高速化できる。
【0093】
なお、ステップS24において、画像検索サーバ10のシステム制御部16は、対応領域類似度算出手段として、各対応領域の画素値の最大値と、対応領域の間における画素値の差とに基づき、対応領域類似度を算出してもよい。例えば、PSNR(Peak Signal to Noise Ratio)やWSNR(Weighted SNR)等により、対応領域類似度が算出される。
【0094】
この場合も、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい画像類似度を算出できる。
【0095】
また、ステップS2やステップS21の特徴点の抽出において、特徴点抽出のサブルーチンに示した方法以外でもよい。例えば、コーナーの検出や、エッジの強調やHough変換等による線・輪郭の抽出や、領域の抽出等が挙げられる。線や領域の場合は、ステップS14の特徴点の選定により、特徴点を求める。
【0096】
また、検索クエリ画像35の特徴点における勾配情報と、DB画像30における特徴点の勾配情報との距離は、ユークリッド距離の他に、マハラノビス距離等、特徴量空間における距離ならばよい。また領域類似度から画像類似度を求める際、領域類似度の算術平均の他に、幾何平均、調和平均、重み付け平均や、対応特徴点の組の個数を考慮して画像類似度が算出されてもよい。
【0097】
<第2実施形態>
次に、本発明の第2実施形態に係る画像評価装置の概略構成、機能及び動作について、図14を用いて説明する。なお、前記第1実施形態と同一又は対応する部分には、同一の符号を用いて異なる構成及び作用のみを説明する。その他の実施形態及び変形例も同様とする。
【0098】
本実施形態は、画像評価装置の一例として端末20が単独で動作し、記憶部22に画像評価用の画像類似度算出プログラムが予め記憶されている。
【0099】
図14は、画像評価装置(画像類似度算出装置の一例)の動作例を示すフローチャートである。図14に示すように、画像評価装置の一例の端末20は、基準画像の入力を受け付ける(ステップS30)。端末20のシステム制御部26は、画像評価を行う画像の基準となる基準画像(第1の画像の一例)の入力を、操作部24の操作により受け付ける。例えば、システム制御部26は、操作部24の操作により選択された、記憶部22に記憶してある基準画像をRAM26cに読み込む。なお、この基準画像は、第1実施形態のDB画像に対応する。
【0100】
次に、端末20は、基準画像の特徴点を抽出する(ステップS31)。端末20のシステム制御部26は、ステップS2に対応して、特徴点抽出サブルーチンにより、基準画像から特徴点(第1の特徴点の一例)を抽出する。
【0101】
次に、端末20は、特徴点の周辺領域の勾配情報を算出する(ステップS32)。端末20のシステム制御部26は、ステップS3に対応して、取得した画像の各特徴点におけるオリエンテーションを算出し、勾配情報として算出したオリエンテーションに基づき128次元の特徴量を算出する。
【0102】
次に、端末20は、評価対象画像の入力を受け付ける(ステップS33)。端末20のシステム制御部26は、評価対象画像(第2の画像の一例)の入力を操作部24により受け付ける。例えば、システム制御部26は、操作部24の操作により選択された、記憶部22に記憶してある評価対象画像をRAM26cに読み込む。なお、この評価対象画像は、第1実施形態のクエリ画像に対応し、このステップは、ステップS20に対応する。
【0103】
次に、端末20は、評価対象画像の特徴点を抽出する(ステップS34)。端末20のシステム制御部26は、ステップS21に対応して特徴点抽出のサブルーチンにより評価対象画像の特徴点を抽出する。
【0104】
次に、端末20は、特徴点の周辺領域の勾配情報を算出する(ステップS35)。端末20のシステム制御部26は、ステップS22に対応して、評価対象画像の特徴点の周辺領域の勾配情報を算出する。
【0105】
次に、端末20は、勾配情報に基づき、基準画像の特徴点と評価対象画像の特徴点との対応特徴点を探索する(ステップS36)。端末20のシステム制御部26は、ステップS23に対応して、対応特徴点を探索して求める。
【0106】
次に、端末20は、各対応特徴点を含む各対応領域間の領域類似度を算出する(ステップS37)。端末20のシステム制御部26は、ステップS24に対応して、各対応領域間の領域類似度を算出する。
【0107】
次に、端末20は、領域類似度に基づき、画像類似度(画質評価値)を算出する(ステップS38)。端末20のシステム制御部26は、ステップS25に対応して、各領域類似度を合計し、対応特徴点の組の個数で割ることにより平均し、正規化された画像類似度を算出して画質評価値とする。そして、端末20のシステム制御部26は、この画質評価値を表示部23に表示させる。
【0108】
このように、基準画像(第1の画像の一例)の入力を受け付け、基準画像における第1の特徴点を抽出し、評価対象画像(第2の画像の一例)の入力を受け付け、評価対象画像から第2の特徴点を抽出し、第1の特徴点と第2の特徴点とにおいて、互いに対応する対応特徴点を探索し、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度を算出し、対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出することにより、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい類似度を算出でき、画像の評価を行うことができる。
【0109】
特に、各対応領域の画素値の平均及び分散と、対応領域の間における画素値の相互相関とに基づき、対応領域類似度を算出する場合、対応領域間において、構造的類似度を算出しているため、人間の主観に近い画像評価を行うことができる。
【0110】
なお、画像検索サーバ10に基準画像が入力されて、DB画像として記憶させておき、端末20が、評価対象画像を画像検索サーバ10に送信し、画像検索サーバ10が、画質評価値として画像類似度を検索結果として応答を返すという構成でもよい。
【0111】
さらに、本発明は、上記各実施形態に限定されるものではない。上記各実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。
【符号の説明】
【0112】
1:画像検索システム
10:画像検索サーバ(画像検索装置)
20:端末(画像類似度算出装置)
30:DB画像(第1の画像)
35:検索クエリ画像(第2の画像)
【技術分野】
【0001】
本発明は、画像の類似度を利用して画像を検索する技術分野に関する。
【背景技術】
【0002】
画像の検索方法においては、タグと呼ばれるテキスト情報を付加して画像を記憶したり、画像の特徴量に関連付けて画像を記憶したりして、検索データベースが構築されている。検索の際、この検索データベースが参照され、タグを利用して検索キーワードにより画像検索が行われたり、検索クエリ画像の特徴量の類似度に基づき、画像検索が行われたりしている。
【0003】
これら画像の検索方法において、画像検索の精度を向上させ、ユーザが探している画像に的確にヒットさせるために様々な工夫がなされている。例えば、特許文献1には、画像検索のための基本クエリ画像を受け付け、基本クエリ画像に画像処理を施すことによって、疑似クエリ画像を生成し、基本クエリ画像及び疑似クエリ画像の両方について、それぞれ、複数の対象画像から、類似画像を検索することにより、仮検索結果を得て、仮検索結果を統合して、全体的な順位付けを行うことにより、出力用検索結果を得る画像検索技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2010−61285号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、インターネット等のネットワーク上にある画像においては、画像の解像度の違い、画像における構図の違い、画像の画質の違い等、画像を変容させる画像変容要因が様々あるため、上記技術等の従来技術では、人間の主観的評価に近い適切な類似度を算出することが難しかった。そのため、画像検索において、類似な画像を取りこぼすという問題があった。また、画質の評価において、基準画像と、評価対象画像との類似度に基づき、画像変容要因の影響を受けにくい画質評価をすることが難しかった。
【0006】
本発明は、このような問題に鑑みてなされたものであり、その目的は、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい類似度に基づいた画像検索装置、画像検索方法、画像検索プログラム、記録媒体、及び画像類似度算出プログラムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る画像検索装置は、第1の画像を記憶する第1画像記憶手段と、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出手段と、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力手段と、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出手段と、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索手段と、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出手段と、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出手段と、前記第1画像記憶手段を参照して、前記画像類似度に基づき、第1の画像を選択する選択手段と、前記選択された第1の画像を検索結果として出力する第1画像出力手段と、を備える。
【0008】
本発明に係る画像検索装置において、前記特徴点に対して特徴点の選定を行う特徴点選定手段を更に備えるように構成する。
【0009】
本発明に係る画像検索装置において、前記特徴点選定手段が、所定の閾値に基づき前記特徴点の選定を行うように構成する。
【0010】
本発明に係る画像検索装置において、前記第1又は第2画像特徴点抽出手段が、前記画像に対して所定のスケールにより平滑化処理して平滑化画像を求め、スケールの異なる前記平滑化画像間での差分処理をして差分・平滑化画像を求め、前記差分・平滑化画像において、極値となる前記特徴点を抽出するように構成する。
【0011】
本発明に係る画像検索装置において、前記特徴点の周辺領域における勾配情報を算出する勾配情報算出手段を更に備え、前記対応特徴点探索手段が、前記勾配情報に基づき、前記対応特徴点を探索するように構成する。
【0012】
本発明に係る画像検索装置において、前記対応領域類似度算出手段が、各前記対応領域の画素値の平均及び分散と、前記対応領域の間における画素値の相互相関とに基づき、前記対応領域類似度を算出するように構成する。
【0013】
本発明に係る画像検索装置において、前記対応領域類似度算出手段が、各前記対応領域の画素値の最大値と、前記対応領域の間における画素値の差とに基づき、前記対応領域類似度を算出するように構成する。
【0014】
本発明に係る画像検索装置において、抽出された前記第1の特徴点を予め記憶する第1画像特徴点記憶手段を更に備えるように構成する。
【0015】
上記課題を解決するために、本発明に係る画像検索方法は、画像の検索を行う画像検索装置の画像検索方法において、前記画像検索装置が、第1の画像を記憶する第1画像記憶ステップと、前記画像検索装置が、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、前記画像類似度に基づき、第1の画像を選択する選択ステップと、前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、を有する。
【0016】
上記課題を解決するために、本発明に係る画像検索プログラムは、コンピュータに、第1の画像を記憶する第1画像記憶ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、前記画像類似度に基づき、第1の画像を選択する選択ステップと、前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、を実行させる。
【0017】
上記課題を解決するために、本発明に係る記録媒体は、コンピュータに、第1の画像を記憶する第1画像記憶ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、前記画像類似度に基づき、第1の画像を選択する選択ステップと、前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、を実行させる画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0018】
上記課題を解決するために、本発明に係る画像類似度算出プログラムは、コンピュータを、第1の画像の入力を受け付ける第1画像入力ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、を実行させる。
【0019】
上記課題を解決するために、本発明に係る記録媒体は、コンピュータを、第1の画像の入力を受け付ける第1画像入力ステップと、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、第2の画像の入力を受け付ける第2画像入力ステップと、前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、を実行させる画像類似度算出プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0020】
本発明によれば、第1の画像における第1の特徴点を抽出し、検索クエリ画像として第2の画像から第2の特徴点を抽出し、第1の特徴点と第2の特徴点とにおいて、互いに対応する対応特徴点を探索し、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出し、この画像類似度に基づき画像検索をすることにより、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい対応領域間の対応領域類似度を算出し、各対応特徴点における対応領域類似度から第1画像と第2画像との画像全体の画像類似度を算出して、この画像類似度に基づき画像検索を行っているので、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい画像検索ができる。
【図面の簡単な説明】
【0021】
【図1】本発明の一実施形態に係る画像検索システムの概要構成例を示す模式図である。
【図2】図1の画像検索サーバの概要構成の一例を示すブロック図である。
【図3】図2の画像関連情報データベースに記憶された画像関連情報テーブルの一例を示す模式図である。
【図4】図1の端末の概要構成の一例を示すブロック図である。
【図5】図1の画像検索システムにおけるデータベース構築の動作例を示すフローチャートである。
【図6】図2の画像データベースに保存されている画像の一例を示す模式図である。
【図7】図6の画像に対して特徴点を示した模式図である。
【図8】特徴点抽出のサブルーチンを示すフローチャートである。
【図9】図1の画像検索システムの動作例を示すフローチャートである。
【図10】検索クエリ画像の一例を示す模式図である。
【図11】検索クエリ画像とデータベース中の画像との間で対応する特徴点を示す模式図である。
【図12】画像検索結果の一例を示す模式図である。
【図13】検索クエリ画像とデータベース中の画像との間で対応する特徴点を示す模式図である。
【図14】画像評価装置の動作例を示すフローチャートである。
【発明を実施するための形態】
【0022】
以下、図面を参照して本発明を実施するための形態について説明する。
【0023】
<第1実施形態>
まず、本発明の第1実施形態に係る画像検索システムについて説明する。
【0024】
[1.画像検索システムの構成及び機能概要]
本発明の第1実施形態に係る画像検索システムの構成及び概要機能について、図1を用いて説明する。図1は、本実施形態に係る画像検索システム1の概要構成例を示す模式図である。
【0025】
図1に示すように、画像検索システム1は、受信した検索クエリ画像に対する検索結果の画像を求める画像検索サーバ(画像検索装置の一例)10と、検索クエリ画像を送信する端末20(端末の一例)と、を備えている。
【0026】
画像検索サーバ10と、端末20とは、ネットワーク3により接続され、通信プロトコル(例えば、TCP/IP)により、データの送受信が可能になっている。なお、ネットワーク3は、例えば、インターネット、専用通信回線(例えば、CATV(Community Antenna Television)回線)、移動体通信網(基地局等を含む)、及び、ゲートウェイ等により構築されている。
【0027】
また、画像検索サーバ10は、ネットワーク3を通して、外部のウェブサーバ5に接続していて、ウェブサーバ5等から画像を収集してくる。そして、画像検索サーバ10は、高速に画像検索を行うため、収集した画像から、画像の特徴点等の情報を抽出して、画像と共に予めデータベースを構築しておく。
【0028】
[2.画像検索サーバ等の構成及び機能]
(2.1 画像検索サーバ10の構成及び機能)
次に、画像検索サーバ10の構成及び機能について、図2及び図3を用いて説明する。図2は、画像検索サーバ10の概要構成の一例を示すブロック図である。図3は、画像関連情報データベースに記憶された画像関連情報テーブルの一例を示す模式図である。
【0029】
図2に示すように、コンピュータとして機能する画像検索サーバ10は、通信部11と、記憶部12と、表示部13と、操作部14と、入出力インターフェース部15と、システム制御部16とを備えている。そして、システム制御部16と入出力インターフェース部15とは、システムバス17を介して接続されている。
【0030】
通信部11は、ネットワーク3に接続して端末20、ウェブサーバ5等との通信状態を制御し、データの送受信を行う。
【0031】
記憶部12は、例えば、ハードディスクドライブ等により構成されており、オペレーティングシステム及びサーバプログラム等の各種プログラムや、データ等を記憶する。なお、各種プログラムは、例えば、他のサーバ装置等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置を介して読み込まれるようにしてもよい。
【0032】
また、記憶部12には、ウェブサーバ5等から収集した画像を記憶する画像データベース(DB)12a(以下「画像DB」とする。)、画像関連情報データベース(DB)12a(以下「画像関連情報DB」とする。)等が構築されている。
【0033】
画像DB12a(第1画像記憶手段の一例)には、ウェブサーバ5等から収集した画像(第1の画像の一例)が、割り当てられた画像IDに関連付けられて記憶されている。
【0034】
画像関連情報DB12b(第1画像特徴点記憶手段の一例)には、図3に示すように、画像関連情報テーブルには、画像IDにより各画像に関連付けられ、画像のURL(Uniform Resource Locator)情報、画像の解像度、画像の特徴点の座標、特徴点周辺の勾配情報、特徴点を選択する際の閾値(所定の閾値の一例)、画像に付されたタグ情報等が記憶されている。なお、特徴点、勾配情報、閾値に関する詳細は、後述する。
【0035】
表示部13は、例えば、液晶表示素子又はEL(Electro Luminescence)素子等によって構成されている。
【0036】
操作部14は、例えば、キーボード及びマウス等によって構成されている。
【0037】
次に、入出力インターフェース部15は、通信部11及び記憶部12とシステム制御部16との間のインターフェース処理を行う。
【0038】
システム制御部16は、CPU(Central Processing Unit)16a、ROM(Read Only Memory)16b、RAM(Random Access Memory)16c等により構成されている。システム制御部16は、CPU16aがROM16bや記憶部12に記憶された各種プログラムを読み出し実行することにより、画像から特徴点を抽出する処理等を行う。
【0039】
(2.2 端末20の構成及び機能)
次に、端末20の構成及び機能について、図4を用いて説明する。図4は、端末20の概要構成の一例を示すブロック図である。
【0040】
図4に示すように、コンピュータとして機能する端末20は、例えば、パーソナルコンピュータや携帯型無線電話機やPDA等の携帯端末であり、通信部21と、記憶部22と、表示部23と、操作部24と、入出力インターフェース部25と、システム制御部26とを備えている。そして、システム制御部26と入出力インターフェース部25とは、システムバス27を介して接続されている。
【0041】
通信部21は、ネットワーク3を通して、画像検索サーバ10等と通信を制御する。なお、端末20が携帯型無線電話機の場合、ネットワーク3の移動体通信網に接続するために、通信部21は、無線通信機能を有する。
【0042】
記憶部22は、例えば、ハードディスクドライブ等からなり、オペレーティングシステム、Webブラウザプログラム等の各種のプログラムを記憶する。なお、各種プログラムは、例えば、サーバ装置等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置を介して読み込まれるようにしてもよい。
【0043】
表示部23は、例えば、液晶表示素子又はEL素子等によって構成されている。表示部23には、画像検索サーバ10から取得した画像検索結果のウェブページ等が表示される。
【0044】
操作部24は、例えば、キーボード及びマウス等によって構成されている。ユーザは、操作部34により画像を含む検索クエリ等を入力する。なお、表示部23がタッチパネルのようなタッチスイッチ方式の表示パネルの場合、操作部24は、表示部23の画面が押された箇所の位置情報を取得する。
【0045】
入出力インターフェース部25は、通信部21及び記憶部22とシステム制御部26とのインターフェースである。
【0046】
システム制御部26は、例えば、CPU26aと、ROM26bと、RAM26cとを有する。
【0047】
システム制御部26は、CPU26aが、ROM26bや、RAM26cや、記憶部22に記憶された各種プログラムを読み出して実行する。
【0048】
[3.画像検索システムの動作]
(3.1 画像データベースの構築)
本発明の一実施形態に係る画像検索システム1における画像DB12a及び画像関連情報DB12bの構築について図5、図6、及び、図7を用いて説明する。図5は、画像検索システム1においてデータベース構築の手順を示すブロック図である。図6は、画像データベースに保存されているデータベース画像の一例を示す模式図である。図7は、データベース画像における特徴点を示した模式図である。
【0049】
画像検索サーバ10は、検索用のデータベース画像(DB画像)を取得する(ステップS1)。具体的には、画像検索サーバ10のシステム制御部16は、クローリング等によりウェブサーバ5等から収集したDB画像(第1の画像の一例)を取得する。そして、画像検索サーバ10のシステム制御部16は、取得した画像に画像IDを割り当て、画像IDに関連付けて、図6に示すような複数のDB画像30を画像DB12aに記憶する。また、画像検索サーバ10のシステム制御部16は、取得した画像のURL情報や画像の解像度、画像に付されたタグ等を、画像関連情報DB12bに記憶する。このように画像検索サーバ10のシステム制御部16は、第1の画像を記憶する第1画像記憶手段の一例として機能する。
【0050】
次に、画像検索サーバ10は、DB画像の特徴点を抽出する(ステップS2)。具体的には、画像検索サーバ10のシステム制御部16は、特徴点抽出サブルーチンにより、図7に示すように、DB画像から特徴点(第1の特徴点の一例)を抽出する。この特徴点抽出は、例えば、SIFT(Scale Invariant Feature Transform)の手法を用いて実行される。この特徴点は、SIFTの場合、キーポイントと呼ばれる。なお、詳細は、後述する特徴点抽出サブルーチンにて説明する。このように画像検索サーバ10のシステム制御部16は、第1の画像における第1の特徴点を抽出する第1画像特徴点抽出手段の一例として機能する。
【0051】
次に、画像検索サーバ10は、特徴点の周辺領域の勾配情報を算出する(ステップS3)。具体的には、まず画像検索サーバ10のシステム制御部16は、取得した画像の各特徴点におけるオリエンテーションを算出する。オリエンテーションは、後で算出する画像の特徴量が、回転に不変な特徴量となるように、特徴点のオリエンテーションを求め、オリエンテーションにより正規化するために利用される。
【0052】
このオリエンテーションは、特徴点における方向を表し、特徴点に対して求めた重み付き勾配方向ヒストグラムによって決定される。例えば、システム制御部16は、画像データI(x,y)に対してあるスケール(標準偏差σ)を有するガウシアンフィルタG(x,y,σ)を適用し、平滑化画像L(x,y)を得る。次に、システム制御部16は、特徴点を中心とした局所領域における平滑化画像L(x,y)の勾配強度と勾配方向を求め、勾配強度と勾配方向とから、例えば36方向に量子化した勾配方向ヒストグラムを算出する。なお、特徴点に近い領域の勾配をより強く反映させるため、システム制御部16は、勾配強度に対して、特徴点を中心としたガウシアンウインドを被せて、重み付けされた勾配方向ヒストグラムを算出する。
【0053】
そして、システム制御部16は、この36方向に対するヒストグラムの最大値をオリエンテーションとして割り当てる。なお、システム制御部16は、この最大値を100%とした場合における80%以上となる方向も特徴点のオリエンテーションとして割り当ててもよい。
【0054】
次に、システム制御部16は、周辺領域の勾配情報として、算出したオリエンテーションに基づき128次元の特徴量を算出する。例えば、システム制御部16は、算出したオリエンテーションに合わせて、特徴点の周辺領域を回転させる。この周辺領域を、1辺を4ブロックの計16ブロックに分割し、特徴点のオリエンテーションを算出したように、各ブロックに対して8方向の勾配方向ヒストグラムを算出する。
【0055】
システム制御部16は、4×4=16ブロックに対して、各8方向の勾配方向ヒストグラムを作成するため、128次元の特徴ベクトルとして、特徴点の周辺領域の勾配情報を算出する。この勾配情報は、各特徴点が持つオリエンテーション方向に座標軸を合わせた領域で特徴を算出しているので、回転に不変な特徴量となる。また、勾配情報の一例である128次元の各特徴ベクトルの長さはベクトルの総和で正規化されるので、照明変化に対して影響の少ない特徴量となる。
【0056】
次に、画像検索サーバ10は、DB画像、特徴点、及び勾配情報を記憶する(ステップS4)。具体的には、画像検索サーバ10のシステム制御部16は、図3に示すように、DB画像の各特徴点、及び、各特徴点における勾配情報を画像IDに関連付けて画像関連情報DB12bに記憶する。このように画像検索サーバ10のシステム制御部16は、抽出された第1の特徴点を予め記憶する第1画像特徴点記憶手段の一例として機能する。
【0057】
(3.2 特徴点抽出のサブルーチン)
次に、特徴点抽出のサブルーチンについて、図8を用いて説明する。図8は、特徴点抽出のサブルーチンを示すフローチャートである。なお、この特徴点抽出のサブルーチンは、例えば、SIFTの手法におけるキーポイントの検出及びキーポイントのローカライズに当たる。
【0058】
図8に示すように、まず、画像検索サーバ10は、取得したDB画像に対して、所定のスケールの平滑化画像を求める(ステップS10)。具体的には、画像検索サーバ10のシステム制御部16は、スケール(ガウス関数の標準偏差)の異なるガウシアンフィルタを用いて、取得したDB画像に対する複数の平滑化画像を求める。更に具体的には、画像検索サーバ10のシステム制御部16は、ガウス関数G(x,y,σ)と入力画像の画像データI(u,v)を畳み込んで、平滑化画像L(u,v,σ)を求める。なお、ここでx、yは、注目画素からの距離、標準偏差σはガウシアンフィルタのスケール、u及びvは、注目画素を表す。
【0059】
次に、画像検索サーバ10は、スケールが異なる平滑化画像間のDoG画像(Difference-of-Gaussian 画像)を求める(ステップS11)。具体的には、画像検索サーバ10のシステム制御部16は、スケールの異なるガウス関数で平滑化した2枚の平滑化画像の差分画像を求めることで、DoG画像(差分・平滑化画像の一例)を求める。例えば、ガウシアンフィルタのスケールの初期値σ0、ガウシアンフィルタのスケールの増加率kとすると、画像検索サーバ10のシステム制御部16は、スケールの初期値σ0からk倍ずつ増加させたスケール(σ0、kσ0、k2σ0、k3σ0・・・)において、異なるスケール間(例えば、スケールkσ0とスケールk2σ0との間)で、差分画像を求めることで、複数のDoG画像を求める。
【0060】
次に、画像検索サーバ10は、複数のDoG画像における極値を求める(ステップS12)。具体的には、画像検索サーバ10のシステム制御部16は、DoG画像3枚1組に対して、例えば、DoG画像D(u,v,k2σ0)の注目画素と、その周りの例えば26近傍を比較し、極値を求める。この極値検出は、スケールの値の小さいDoG画像から順に行い、一度極値が検出された画素は、より大きなスケールで極値が検出されたとしても特徴点にしない。この処理をスケールの異なるDoG画像の全画素に対して行う。ここで、DoG画像は、異なるスケールによる2枚の平滑化画像の差分からなる画像であるため、DoG画像内のある座標の画素値が大きくなるスケールでは、スケールの変化領域にエッジ等の情報量を多く含んでいるといえる。そこで、DoG画像から極値を検出し、特徴点(キーポイント)とスケールが決定される。なお、画像サイズが2倍となると、極値探索により検出された特徴点のスケールも比例して2倍となる。SIFT法は、特徴を最も含むスケールを自動的に決定するため、空間的に同範囲の領域から特徴量を記述することで、画像の拡大・縮小に対して不変な特徴量となる。
【0061】
このように画像検索サーバ10のシステム制御部16は、画像に対して所定のスケールにより平滑化処理して平滑化画像を求め、スケールの異なる平滑化画像間での差分処理をして差分・平滑化画像を求め、差分・平滑化画像において、極値となる特徴点を抽出する第1又は第2画像特徴点抽出手段の一例として機能する。
【0062】
次に、画像検索サーバ10は、極値となった画素を特徴点とする(ステップS13)。具体的には、画像検索サーバ10のシステム制御部16は、注目画素の周辺の近傍における値を比較し、極値であった場合には、その画素を特徴点として検出する。
【0063】
次に、画像検索サーバ10は、特徴点を選定する(ステップS14)。この特徴点選定は、SIFTの手法におけるキーポイントのローカライズに当たり、検出された特徴点のうち、特徴点として適切でない点が削除される。例えば、特徴点として適切でないものとしては開口問題に影響を受けやすいエッジ上の特徴点と、ノイズの影響を受けやすいDoG画像中の画素値が低い特徴点が挙げられる。エッジ上の特徴点は主曲率により、画素値が低い特徴点はコントラストを利用することにより、安定したキーポイントに絞り込む。
【0064】
まず、画像検索サーバ10のシステム制御部16は、各特徴点におけるDoG画像の画素値の2次微分から2次元ヘッセ行列を計算し、主曲率を求める。そして、画像検索サーバ10のシステム制御部16は、ヘッセ行列の第1固有値と第2固有値との固有値の比率の関係式を、ヘッセ行列のトレース和と行列式とから求め、エッジ上にあるか否かを判定する。画像検索サーバ10のシステム制御部16は、固有値の比率が、所定の閾値より大きい場合、エッジ上に存在する不要な特徴点として、特徴点を削除する。
【0065】
次に、画像検索サーバ10のシステム制御部16は、DoG画像D(x,y,σ)の2次のテイラー展開に対し、点X=(x、y、σ)に関する偏導関数を求め、その偏導関数が0となる点をサブピクセル位置X^=(x^,y^,σ^)とする。
【0066】
画像検索サーバ10のシステム制御部16は、サブピクセル位置X^でのDoG画像の画素値の関係式より、サブピクセル位置X^でのDoG画像の画素値を求め、この画素値の絶対値が、所定の閾値より小さい場合(コントラストが低い場合)、ノイズに影響されやすい特徴点であるため、この特徴点を削除する。このように画像検索サーバ10のシステム制御部16は、特徴点に対して特徴点の選定を行う特徴点選定手段の一例として機能する。また、画像検索サーバ10のシステム制御部16は、所定の閾値に基づき特徴点の選定を行う特徴点選定手段の一例として機能する。
【0067】
これらの処理により、図7に示すように、各DB画像に対して、選定された特徴点が求まる。なお、所定の閾値は、図3に示すように、予め設定しておく。
【0068】
(3.3 画像検索)
次に、端末から受け付けた検索クエリ画像に基づき、画像検索をする動作について、図9〜図13を用いて説明する。図9は、画像検索システム1の動作例を示すフローチャートである。図10は、検索クエリ画像の一例を示す模式図である。図11及び図13は、検索クエリ画像とデータベース中の画像との間で対応する特徴点を示す模式図である。図12は、画像検索結果の一例を示す模式図である。
【0069】
まず、端末20のシステム制御部26は、ユーザにより画像データが添付された検索クエリを、画像検索サーバ10に送信する。
【0070】
次に、図9に示すように、画像検索サーバ10は、検索クエリ画像の入力を受け付ける(ステップS20)。具体的には、画像検索サーバ10のシステム制御部16は、通信部11を通して、端末20から検索クエリ画像(第2の画像の一例)を受信する。なお、図10(A)には人物像の検索クエリ画像35、図10(B)には、建物の検索クエリ画像35、図10(C)には、複数のオブジェクトが写っている検索クエリ画像35が例示してある。このように画像検索サーバ10のシステム制御部16は、検索クエリ画像として第2の画像の入力を受け付ける第2画像入力手段の一例として機能する。
【0071】
次に、画像検索サーバ10は、検索クエリ画像の特徴点を抽出する(ステップS21)。具体的には、画像検索サーバ10のシステム制御部16は、図8に示した特徴点抽出のサブルーチンにより、DB画像の場合のステップS2と同様に、検索クエリ画像に対しても特徴点(第2の特徴点の一例)を抽出する。このように画像検索サーバ10のシステム制御部16は、第2の画像から第2の特徴点を抽出する第2画像特徴点抽出手段の一例として機能する。
【0072】
次に、画像検索サーバ10は、特徴点の周辺領域の勾配情報を算出する(ステップS22)。具体的には、画像検索サーバ10のシステム制御部16は、DB画像の場合のステップS3と同様に、検索クエリ画像の特徴点の周辺領域の勾配情報(128次元の特徴量)を算出する。このように画像検索サーバ10のシステム制御部16は、特徴点の周辺領域における勾配情報を算出する勾配情報算出手段の一例として機能する。
【0073】
次に、画像検索サーバ10は、勾配情報に基づき、検索クエリ画像の特徴点とDB画像の特徴点との対応特徴点を探索する(ステップS23)。具体的には、画像検索サーバ10のシステム制御部16は、まず、検索クエリ画像35のある特徴点における勾配情報と、画像関連情報DB12bを参照して、あるDB画像30におけるすべての特徴点の勾配情報との距離(例えば、ユークリッド距離)を算出する。そして、画像検索サーバ10のシステム制御部16は、これらの距離の最小値を求め、最小値を示すこのDB画像30の特徴点を特定する。次に、画像検索サーバ10のシステム制御部16は、この最小値が所定の閾値以下となった場合に、検索クエリ画像35のある特徴点と、この特定されたDB画像30の特徴点とを、互いに対応する対応特徴点とする。
【0074】
次に、画像検索サーバ10のシステム制御部16は、同様に、検索クエリ画像の他の特徴点に対しても対応特徴点を求める。図11(A)は、検索クエリ画像35の対応特徴点と、あるDB画像30の対応特徴点とを直線により結んだ図である。
【0075】
次に、図11(B)及び図11(C)に示すように、画像検索サーバ10のシステム制御部16は、画像関連情報DB12bを参照して、他のDB画像30においても、対応特徴点を探索する。また、画像検索サーバ10のシステム制御部16は、対応特徴点の組の個数も算出する。なお、図11(A)は、DB画像30が検索クエリ画像35と同一の画像の場合で、図11(B)の図11(A)の画像の一部からトリミングしたトリミング画像(DB画像30)の場合で、図11(C)は、図11(A)の画像(特に顔の部分)に歪みを加えた画像(DB画像30)である。
【0076】
これらのように画像検索サーバ10のシステム制御部16は、第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索手段の一例として機能する。また画像検索サーバ10のシステム制御部16は、勾配情報に基づき、対応特徴点を探索する対応特徴点探索手段の一例として機能する。
【0077】
次に、画像検索サーバ10は、各対応特徴点を含む各対応領域間の領域類似度を算出する(ステップS24)。まず、画像検索サーバ10のシステム制御部16は、検索クエリ画像及びDB画像のそれぞれに対して、対応特徴点を含む局所領域を対応領域として抽出する。そして、画像検索サーバ10のシステム制御部16は、SSIM(Structural SIMilarity)アルゴリズムにより、検索クエリ画像及びDB画像において対応する対応領域間の領域類似度を算出する。画像検索サーバ10のシステム制御部16は、各対応領域間に対して領域類似度を算出する。このように画像検索サーバ10のシステム制御部16は、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出手段の一例として機能する。
【0078】
ここで、SSIMアルゴリズムは、2つの画像における画素値の平均値、分散、及び共分散(相互相関の一例)より、画像間の類似度を計測する。この類似度は、0〜1の数値で表現され,結果が1の場合には画像の完全な一致を表す。このように画像検索サーバ10のシステム制御部16は、各対応領域の画素値の平均及び分散と、対応領域の間における画素値の相互相関とに基づき、対応領域類似度を算出する対応領域類似度算出手段の一例として機能する。
【0079】
次に、画像検索サーバ10は、領域類似度に基づき、画像類似度を算出する(ステップS25)。具体的には、画像検索サーバ10のシステム制御部16は、各領域類似度の合計(加算)し、対応特徴点の組の個数で割ることにより平均し、正規化された画像類似度を算出する。画像検索サーバ10は、各DB画像に対して、画像類似度を算出し、この画像類似度を画像IDに関連付けて、記憶部やRAM16c等に一時的に記憶する。このように画像検索サーバ10のシステム制御部16は、対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出する画像類似度算出手段の一例として機能する。
【0080】
なお、正規化された画像類似度に検索クエリ画像の特徴点数に対するDB画像の特徴点数の割合を考慮して決定して(例えば、正規化された画像類似度にこの割合を乗算する)、画像類似度を算出してもよい。この場合、検索対象のDB画像が、検索クエリ画像の部分的な特徴を多く含む場合に、類似の評価が高くなり、人間が類似と感じやすい検索結果の画像の順位が高くなる。
【0081】
次に、画像検索サーバ10は、画像類似度に基づき検索クエリ画像に類似したDB画像を選択する(ステップS26)。具体的には、画像検索サーバ10のシステム制御部16は、画像DB12aや画像関連情報DB12bから、画像類似度の高い順に、例えば、上位10件の画像(画像ID)を選択する。このように画像検索サーバ10のシステム制御部16は、第1画像記憶手段を参照して、画像類似度に基づき、第1の画像を選択する選択手段の一例として機能する。
【0082】
次に、画像検索サーバ10は、選択した画像を出力する(ステップS27)。具体的には、画像検索サーバ10のシステム制御部16は、選択した画像IDに基づき、画像DB12aや画像関連情報DB12bを参照して、選択した画像IDに関連した画像やURL情報やスニペット等を読み出す。そして、画像検索サーバ10のシステム制御部16は、図12に示すように、検索結果が端末20の表示部23に表示されるように、HTML(Hyper Text Markup Language)、XML(Extensible Markup Language)等のマークアップ言語によりファイルを生成し、端末20に送信することにより、端末20に出力する。このように画像検索サーバ10のシステム制御部16は、選択された第1の画像を検索結果として出力する第1画像出力手段の一例として機能する
【0083】
次に、端末20のシステム制御部26は、通信部21を通して、検索結果としてHTMLファイルのデータを受信し、表示部23に画像を表示させる。
【0084】
ここで、対応特徴点のシミュレーション結果について図11及び図13を用いて説明する。図13は、他の検索クエリ画像の場合の対応特徴点の様子を示した場合である。
【0085】
図11(B)及び図13(A)に示すように、検索クエリ画像35のトリミング画像の場合、トリミング画像(DB画像30)の特徴点と、検索クエリ画像35のトリミングされた部分の特徴点とが対応していることが分かる。また、図13(B)に示すように、解像度が異なる画像(DB画像30)の場合、対応特徴点の個数は減少するが、対応特徴点同士を結んだ直線の交差がほとんど無く、各対応特徴点同士の対応がよく取れていることが分かる。また、図13(D)に示すように、検索クエリ画像35に対してSeam Carvingの処理がされた画像(DB画像30)の場合、画像内の各オブジェクトの特徴点同士が対応していることが分かる。また、図11(C)に示すように、歪められた顔の部分に対応特徴点がほとんど無いことが分かる。また、画像が類似しなくなると、対応特徴点の組の個数が減少することも分かる。
【0086】
以上、本実施形態によれば、DB画像30を記憶し、DB画像30の特徴点を抽出し、検索クエリ画像35の入力を受け付け、検索クエリ画像35の特徴点を抽出し、DB画像30の特徴点と検索クエリ画像35の特徴点とにおいて、互いに対応する対応特徴点を探索し、DB画像30の対応特徴点を含む対応領域と、検索クエリ画像35の対応特徴点を含む対応領域との対応領域類似度を算出し、対応領域類似度に基づき、DB画像30と検索クエリ画像35との画像類似度を算出し、画像類似度に基づき、DB画像30を選択し、選択されたDB画像30を検索結果として出力することにより、解像度、構図、画質等の画像を変容させる要因が異なっても、人間の主観的評価に近い適切な類似度に基づいた画像検索結果を得ることができる。
【0087】
また、DB画像30からDB画像30の特徴点を選定し、検索クエリ画像35から検索クエリ画像35の特徴点を選定する場合、ステップS14のように、特徴点として適切でない点が削除され、特徴点の数が減少するため、画像関連情報DB12bの規模を小さくでき、かつ、画像検索が高速になる。また、画像を表す特徴量として適切な特徴点に選定されているため、画像検索の精度も向上する。
【0088】
また、所定の閾値に基づき、DB画像30からDB画像30の特徴点を選定する場合、又は、検索クエリ画像35から検索クエリ画像35の特徴点を選定する場合、閾値を調整することにより、例えば、閾値を高くすると、検索結果の候補が絞られ、ほぼ同一の画像を得ることができる。
【0089】
また、DB画像30又は検索クエリ画像35に対して所定のスケールにより平滑化処理して平滑化画像を求め、スケールの異なる平滑化画像間での差分処理をして差分・平滑化画像(例えば、DoG画像)を求め、差分・平滑化画像において、極値となる特徴点を抽出する場合、平滑化により雑音に対して頑健で、差分・平滑化画像により、画像の特徴的部分である画像値の極値となる部分を取り出すことができる。
【0090】
また、特徴点の周辺領域における勾配情報を算出し、勾配情報に基づき、対応特徴点を探索する場合、特徴点の周辺領域の画像変化を表す勾配情報により、DB画像30と検索クエリ画像35において、互いに勾配情報が類似した特徴点を、対応特徴点として的確に見つけ出すことができる。
【0091】
また、各対応領域の画素値の平均及び分散と、対応領域の間における画素値の相互相関とに基づき、対応領域類似度を算出する場合、対応領域間において、構造的類似度を算出しているため、人間の主観に近い類似度を算出できる。
【0092】
また、DB画像30から抽出された特徴点を予め記憶する場合、検索の速度が高速化できる。
【0093】
なお、ステップS24において、画像検索サーバ10のシステム制御部16は、対応領域類似度算出手段として、各対応領域の画素値の最大値と、対応領域の間における画素値の差とに基づき、対応領域類似度を算出してもよい。例えば、PSNR(Peak Signal to Noise Ratio)やWSNR(Weighted SNR)等により、対応領域類似度が算出される。
【0094】
この場合も、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい画像類似度を算出できる。
【0095】
また、ステップS2やステップS21の特徴点の抽出において、特徴点抽出のサブルーチンに示した方法以外でもよい。例えば、コーナーの検出や、エッジの強調やHough変換等による線・輪郭の抽出や、領域の抽出等が挙げられる。線や領域の場合は、ステップS14の特徴点の選定により、特徴点を求める。
【0096】
また、検索クエリ画像35の特徴点における勾配情報と、DB画像30における特徴点の勾配情報との距離は、ユークリッド距離の他に、マハラノビス距離等、特徴量空間における距離ならばよい。また領域類似度から画像類似度を求める際、領域類似度の算術平均の他に、幾何平均、調和平均、重み付け平均や、対応特徴点の組の個数を考慮して画像類似度が算出されてもよい。
【0097】
<第2実施形態>
次に、本発明の第2実施形態に係る画像評価装置の概略構成、機能及び動作について、図14を用いて説明する。なお、前記第1実施形態と同一又は対応する部分には、同一の符号を用いて異なる構成及び作用のみを説明する。その他の実施形態及び変形例も同様とする。
【0098】
本実施形態は、画像評価装置の一例として端末20が単独で動作し、記憶部22に画像評価用の画像類似度算出プログラムが予め記憶されている。
【0099】
図14は、画像評価装置(画像類似度算出装置の一例)の動作例を示すフローチャートである。図14に示すように、画像評価装置の一例の端末20は、基準画像の入力を受け付ける(ステップS30)。端末20のシステム制御部26は、画像評価を行う画像の基準となる基準画像(第1の画像の一例)の入力を、操作部24の操作により受け付ける。例えば、システム制御部26は、操作部24の操作により選択された、記憶部22に記憶してある基準画像をRAM26cに読み込む。なお、この基準画像は、第1実施形態のDB画像に対応する。
【0100】
次に、端末20は、基準画像の特徴点を抽出する(ステップS31)。端末20のシステム制御部26は、ステップS2に対応して、特徴点抽出サブルーチンにより、基準画像から特徴点(第1の特徴点の一例)を抽出する。
【0101】
次に、端末20は、特徴点の周辺領域の勾配情報を算出する(ステップS32)。端末20のシステム制御部26は、ステップS3に対応して、取得した画像の各特徴点におけるオリエンテーションを算出し、勾配情報として算出したオリエンテーションに基づき128次元の特徴量を算出する。
【0102】
次に、端末20は、評価対象画像の入力を受け付ける(ステップS33)。端末20のシステム制御部26は、評価対象画像(第2の画像の一例)の入力を操作部24により受け付ける。例えば、システム制御部26は、操作部24の操作により選択された、記憶部22に記憶してある評価対象画像をRAM26cに読み込む。なお、この評価対象画像は、第1実施形態のクエリ画像に対応し、このステップは、ステップS20に対応する。
【0103】
次に、端末20は、評価対象画像の特徴点を抽出する(ステップS34)。端末20のシステム制御部26は、ステップS21に対応して特徴点抽出のサブルーチンにより評価対象画像の特徴点を抽出する。
【0104】
次に、端末20は、特徴点の周辺領域の勾配情報を算出する(ステップS35)。端末20のシステム制御部26は、ステップS22に対応して、評価対象画像の特徴点の周辺領域の勾配情報を算出する。
【0105】
次に、端末20は、勾配情報に基づき、基準画像の特徴点と評価対象画像の特徴点との対応特徴点を探索する(ステップS36)。端末20のシステム制御部26は、ステップS23に対応して、対応特徴点を探索して求める。
【0106】
次に、端末20は、各対応特徴点を含む各対応領域間の領域類似度を算出する(ステップS37)。端末20のシステム制御部26は、ステップS24に対応して、各対応領域間の領域類似度を算出する。
【0107】
次に、端末20は、領域類似度に基づき、画像類似度(画質評価値)を算出する(ステップS38)。端末20のシステム制御部26は、ステップS25に対応して、各領域類似度を合計し、対応特徴点の組の個数で割ることにより平均し、正規化された画像類似度を算出して画質評価値とする。そして、端末20のシステム制御部26は、この画質評価値を表示部23に表示させる。
【0108】
このように、基準画像(第1の画像の一例)の入力を受け付け、基準画像における第1の特徴点を抽出し、評価対象画像(第2の画像の一例)の入力を受け付け、評価対象画像から第2の特徴点を抽出し、第1の特徴点と第2の特徴点とにおいて、互いに対応する対応特徴点を探索し、第1の画像の対応特徴点を含む対応領域と、第2の画像の対応特徴点を含む対応領域との対応領域類似度を算出し、対応領域類似度に基づき、第1の画像と第2の画像との画像類似度を算出することにより、解像度、構図、画質等の画像を変容させる要因の影響を受けにくい類似度を算出でき、画像の評価を行うことができる。
【0109】
特に、各対応領域の画素値の平均及び分散と、対応領域の間における画素値の相互相関とに基づき、対応領域類似度を算出する場合、対応領域間において、構造的類似度を算出しているため、人間の主観に近い画像評価を行うことができる。
【0110】
なお、画像検索サーバ10に基準画像が入力されて、DB画像として記憶させておき、端末20が、評価対象画像を画像検索サーバ10に送信し、画像検索サーバ10が、画質評価値として画像類似度を検索結果として応答を返すという構成でもよい。
【0111】
さらに、本発明は、上記各実施形態に限定されるものではない。上記各実施形態は、例示であり、本発明の特許請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、いかなるものであっても本発明の技術的範囲に包含される。
【符号の説明】
【0112】
1:画像検索システム
10:画像検索サーバ(画像検索装置)
20:端末(画像類似度算出装置)
30:DB画像(第1の画像)
35:検索クエリ画像(第2の画像)
【特許請求の範囲】
【請求項1】
第1の画像を記憶する第1画像記憶手段と、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出手段と、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力手段と、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出手段と、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索手段と、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出手段と、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出手段と、
前記第1画像記憶手段を参照して、前記画像類似度に基づき、第1の画像を選択する選択手段と、
前記選択された第1の画像を検索結果として出力する第1画像出力手段と、
を備えたことを特徴とする画像検索装置。
【請求項2】
請求項1に記載の画像検索装置において、
前記特徴点に対して特徴点の選定を行う特徴点選定手段を更に備えたことを特徴とする画像検索装置。
【請求項3】
請求項2に記載の画像検索装置において、
前記特徴点選定手段が、所定の閾値に基づき前記特徴点の選定を行うことを特徴とする画像検索装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の画像検索装置において、
前記第1又は第2画像特徴点抽出手段が、
前記画像に対して所定のスケールにより平滑化処理して平滑化画像を求め、
スケールの異なる前記平滑化画像間での差分処理をして差分・平滑化画像を求め、
前記差分・平滑化画像において、極値となる前記特徴点を抽出することを特徴とする画像検索装置。
【請求項5】
請求項1から請求項4のいずれか1項に記載の画像検索装置において、
前記特徴点の周辺領域における勾配情報を算出する勾配情報算出手段を更に備え、
前記対応特徴点探索手段が、前記勾配情報に基づき、前記対応特徴点を探索することを特徴とする画像検索装置。
【請求項6】
請求項1から請求項5のいずれか1項に記載の画像検索装置において、
前記対応領域類似度算出手段が、各前記対応領域の画素値の平均及び分散と、前記対応領域の間における画素値の相互相関とに基づき、前記対応領域類似度を算出することを特徴とする画像検索装置。
【請求項7】
請求項1から請求項5のいずれか1項に記載の画像検索装置において、
前記対応領域類似度算出手段が、各前記対応領域の画素値の最大値と、前記対応領域の間における画素値の差とに基づき、前記対応領域類似度を算出することを特徴とする画像検索装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の画像検索装置において、
抽出された前記第1の特徴点を予め記憶する第1画像特徴点記憶手段を更に備えたことを特徴とする画像検索装置。
【請求項9】
画像の検索を行う画像検索装置の画像検索方法において、
前記画像検索装置が、第1の画像を記憶する第1画像記憶ステップと、
前記画像検索装置が、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
前記画像類似度に基づき、第1の画像を選択する選択ステップと、
前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、
を有することを特徴とする画像検索方法。
【請求項10】
コンピュータに、
第1の画像を記憶する第1画像記憶ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
前記画像類似度に基づき、第1の画像を選択する選択ステップと、
前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、
を実行させることを特徴とする画像検索プログラム。
【請求項11】
コンピュータに、
第1の画像を記憶する第1画像記憶ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
前記画像類似度に基づき、第1の画像を選択する選択ステップと、
前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、
を実行させる画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項12】
コンピュータを、
第1の画像の入力を受け付ける第1画像入力ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
を実行させることを特徴とする画像類似度算出プログラム。
【請求項13】
コンピュータを、
第1の画像の入力を受け付ける第1画像入力ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
を実行させる画像類似度算出プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項1】
第1の画像を記憶する第1画像記憶手段と、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出手段と、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力手段と、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出手段と、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索手段と、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出手段と、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出手段と、
前記第1画像記憶手段を参照して、前記画像類似度に基づき、第1の画像を選択する選択手段と、
前記選択された第1の画像を検索結果として出力する第1画像出力手段と、
を備えたことを特徴とする画像検索装置。
【請求項2】
請求項1に記載の画像検索装置において、
前記特徴点に対して特徴点の選定を行う特徴点選定手段を更に備えたことを特徴とする画像検索装置。
【請求項3】
請求項2に記載の画像検索装置において、
前記特徴点選定手段が、所定の閾値に基づき前記特徴点の選定を行うことを特徴とする画像検索装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の画像検索装置において、
前記第1又は第2画像特徴点抽出手段が、
前記画像に対して所定のスケールにより平滑化処理して平滑化画像を求め、
スケールの異なる前記平滑化画像間での差分処理をして差分・平滑化画像を求め、
前記差分・平滑化画像において、極値となる前記特徴点を抽出することを特徴とする画像検索装置。
【請求項5】
請求項1から請求項4のいずれか1項に記載の画像検索装置において、
前記特徴点の周辺領域における勾配情報を算出する勾配情報算出手段を更に備え、
前記対応特徴点探索手段が、前記勾配情報に基づき、前記対応特徴点を探索することを特徴とする画像検索装置。
【請求項6】
請求項1から請求項5のいずれか1項に記載の画像検索装置において、
前記対応領域類似度算出手段が、各前記対応領域の画素値の平均及び分散と、前記対応領域の間における画素値の相互相関とに基づき、前記対応領域類似度を算出することを特徴とする画像検索装置。
【請求項7】
請求項1から請求項5のいずれか1項に記載の画像検索装置において、
前記対応領域類似度算出手段が、各前記対応領域の画素値の最大値と、前記対応領域の間における画素値の差とに基づき、前記対応領域類似度を算出することを特徴とする画像検索装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の画像検索装置において、
抽出された前記第1の特徴点を予め記憶する第1画像特徴点記憶手段を更に備えたことを特徴とする画像検索装置。
【請求項9】
画像の検索を行う画像検索装置の画像検索方法において、
前記画像検索装置が、第1の画像を記憶する第1画像記憶ステップと、
前記画像検索装置が、前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
前記画像類似度に基づき、第1の画像を選択する選択ステップと、
前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、
を有することを特徴とする画像検索方法。
【請求項10】
コンピュータに、
第1の画像を記憶する第1画像記憶ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
前記画像類似度に基づき、第1の画像を選択する選択ステップと、
前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、
を実行させることを特徴とする画像検索プログラム。
【請求項11】
コンピュータに、
第1の画像を記憶する第1画像記憶ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
検索クエリ画像として第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
前記画像類似度に基づき、第1の画像を選択する選択ステップと、
前記選択された第1の画像を検索結果として出力する第1画像出力ステップと、
を実行させる画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項12】
コンピュータを、
第1の画像の入力を受け付ける第1画像入力ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
を実行させることを特徴とする画像類似度算出プログラム。
【請求項13】
コンピュータを、
第1の画像の入力を受け付ける第1画像入力ステップと、
前記第1の画像における第1の特徴点を抽出する第1画像特徴点抽出ステップと、
第2の画像の入力を受け付ける第2画像入力ステップと、
前記第2の画像から第2の特徴点を抽出する第2画像特徴点抽出ステップと、
前記第1の特徴点と前記第2の特徴点とにおいて、互いに対応する対応特徴点を探索する対応特徴点探索ステップと、
前記第1の画像の前記対応特徴点を含む対応領域と、前記第2の画像の前記対応特徴点を含む対応領域との対応領域類似度を算出する対応領域類似度算出ステップと、
前記対応領域類似度に基づき、前記第1の画像と前記第2の画像との画像類似度を算出する画像類似度算出ステップと、
を実行させる画像類似度算出プログラムを記録したコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2012−83873(P2012−83873A)
【公開日】平成24年4月26日(2012.4.26)
【国際特許分類】
【出願番号】特願2010−228110(P2010−228110)
【出願日】平成22年10月8日(2010.10.8)
【出願人】(304036743)国立大学法人宇都宮大学 (209)
【Fターム(参考)】
【公開日】平成24年4月26日(2012.4.26)
【国際特許分類】
【出願日】平成22年10月8日(2010.10.8)
【出願人】(304036743)国立大学法人宇都宮大学 (209)
【Fターム(参考)】
[ Back to top ]