説明

画像検索システム及び画像検索方法

【課題】人物領域を厳密に検出せず、人物又は人物の特定の部位に依存しない検索キーによって、対象の人物を効率的に検索する。
【解決手段】ユーザによって指定された画像に類似する画像を検索する画像検索システムであって、カメラによって撮影された映像などから取得した画像を所定の大きさのブロックに分割し、色ヒストグラムに基づいて、ブロックの特徴量を抽出し、画像の識別子と、ブロックがどの位置にあるかを示す情報と、ブロックの特徴量と、の対応関係を示す第1の情報を作成し、第1の情報に基づいて、分割されたブロックのうち、ユーザによって選択された少なくとも一のブロックを第1の検索キーとし、第1の検索キーの特徴量と他のブロックの特徴量とを比較することによって、第1の検索キーに類似する所定の数のブロックを検索結果として検出し、検索結果を含む画像をユーザに表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像情報検索に関し、特に、撮影された画像情報から人物又は物体を検索する画像検索システム及び画像検索方法に関する。
【背景技術】
【0002】
近年、凶悪犯罪が増加し、セキュリティの意識が向上している。これに伴い、店舗、空港などの人が集まる場所に、多くの監視カメラが設置されている。これらの監視カメラによって撮影された映像情報は、監視レコーダなどの蓄積装置に格納され、必要に応じて閲覧される。
【0003】
また、IPカメラの普及によって、ネットワーク経由で多数のカメラが接続され、さらに、蓄積装置の容量が大きくなっているため、蓄積装置には大量の映像情報が格納されている。したがって、従来のように、格納された映像情報を目視によって確認することが非常に困難になっている。
【0004】
そこで、このような大量の映像情報から、特定の人物又は物体が映っている画像を検索し、検索された画像を提示するために、様々な類似検索技術が提案されている。ここで、類似検索技術とは、対象の情報から、ユーザによって指定された検索キーに類似する情報を検出し、検出されたデータを提示する技術である。特に、類似画像検索技術とは、検索キーとなる画像から取得した色合い、形状などの特徴量に基づいて、検索キーの画像との類似度が大きい画像を検索する技術である。人物を検索する場合、顔の画像、服の色などの特徴を検索キーとして用いることができる。
【0005】
ここで、エッジ情報及び色情報を用いたクラスタリングによって、蓄積された映像のフレーム画像を複数の領域に分割する方法が提案されている(例えば、特許文献1参照)。特許文献1に記載された方法では、まず、エッジ抽出及び平滑化によって、フレーム画像からエッジ画像を作成する。次に、該フレーム画像の画素値を用いてクラスタリングを実行し、各領域をラベリングする。ラベリングされた任意の二つの領域の境界上にエッジがない場合、それらの二つの領域を統合する。そして、各領域から色のヒストグラム、セントラルモーメントなどの特徴量を抽出し、抽出された特徴量を用いて、検索を実行する。
【0006】
また、映像のフレーム画像から各カメラの背景画像を作成し、作成された背景画像と原画像との差分に基づいて、人物領域を抽出する方法が提案されている(例えば、特許文献2参照)。特許文献2に記載された方法では、抽出された人物領域全体の画素値から作成されたヒストグラム、及び人物領域を複数の領域に分割した各部分領域から作成されたヒストグラムを用いて、人物の特徴量を算出し、算出された特徴量を検索に利用する。
【0007】
また、映像のフレーム画像のうち、移動する物体の領域を矩形領域として抽出し、抽出された矩形領域を複数のブロックに分割した後、分割されたブロックの各々から代表色を抽出する方法が提案されている(例えば、特許文献3)。なお、抽出された矩形領域をブロックに分割する方法には、単純に十字に四分割する方法、色情報を用いて、頭、上半身、下半身、足などの領域に分割する方法がある。特許文献3に記載された方法では、ユーザが指定した人物か代表色を抽出し、同じ位置関係にある各ブロックの代表色を比較することによって、人物を検索する。具体的には、各ブロックの上半身の色、靴の色などを比較することによって、類似度を計算する。つまり、人物の各部位の相対的な位置関係を考慮し、人物を同定している。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2002−133412号公報
【特許文献2】特開2001−268657号公報
【特許文献3】特開2005−202938号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
映像から所望の人物又は物体を検索することを目的とする従来の画像検索システムには、以下に示す問題があった。
【0010】
図23は、従来の画像検索システムによって検出される人物領域を示す説明図である。
【0011】
図23の左図(A)は、画像から人物領域を厳密に切り出した図である。中図(B)は、人物領域を矩形領域として切り出して、切り出された矩形領域を四等分した図である。右図(C)は、人物領域を矩形領域として切り出し、切り出された矩形領域を人物の部位によって分割した図である。
【0012】
まず、特許文献1及び2に記載された方法では、図23の(A)の破線で示すように人物の形状を囲んだ人物領域が抽出されるが、そもそも人物領域と背景とを厳密に分けることが難しいので、抽出された人物領域の精度が低い。このため、所望の検索結果が得られないことが多い。
【0013】
したがって、人物領域を厳密に抽出せずに、領域の特徴量を抽出し、抽出された特徴量を検索に利用する方法が考えられた。例えば、特許文献3に記載された方法では、図23の(B)又は(C)に示す破線のように、抽出された人物領域を大まかな矩形領域で囲み、その矩形領域を複数のブロックに分割する。しかし、この方法では、分割されたブロックを検索キーとする場合、ブロックの互いの位置関係を考慮しなければならない。
【0014】
具体的には、例えば、図23の(B)に示したブロックでは、検索キーとなる人物を含む画像と検索対象となる人物を含む画像と比較するために、それぞれの左上のブロック、右上のブロック、左下のブロック、右下のブロックを比較しなければならない。
【0015】
このため、検索キーとなる人物と検索対象となる人物との姿勢が異なる場合、又はカメラに映っている人物の領域が異なる場合、各ブロックに含まれる人物の部位が異なるので、検索の精度は低下する。例えば、起立した状態の人物と、座っている状態の人物とを比較することは難しい。また、全身が映っている人物と、上半身のみが映っている人物とを比較することは難しい。
【0016】
このように人物の特徴量に基づいて人物を検索する画像検索システムでは、そもそも人物が存在している領域を厳密に検出することが難しいので、人物領域と判定された領域からどのような特徴量を抽出したとしても、検索の精度は低い。また、人物領域を厳密に検出せず、大まかな矩形領域で囲まれた人物領域を、例えば、左上部分、上半身などといった何らかの意味を持つ領域に分割したとしても、検索の精度は、人物の姿勢及び大きさに影響される。
【0017】
本発明は前述した問題に鑑みてなされたものであって、人物領域を厳密に検出せず、人物又は人物の特定の部位に依存しない検索キーによって、対象の人物を効率的に検索することができる画像検索システムを提供することを目的とする。なお、本画像検索システムは、人物のみならず移動する物体を検索することもできる。
【課題を解決するための手段】
【0018】
本発明の代表的な一例を示せば以下のとおりである。すなわち、ユーザによって指定された画像に類似する画像を検索する画像検索システムであって、プロセッサと、前記プロセッサに接続されるメモリと、記憶装置とを備える少なくとも一以上の計算機を備え、前記プロセッサは、カメラによって撮影された映像、又は前記記憶装置に記憶された映像を取得し、前記取得された映像から、単位時間当たりに所定の枚数の画像を抽出し、前記抽出された画像を所定の大きさのブロックに分割し、色ヒストグラムに基づいて、前記分割されたブロックの特徴量を抽出し、前記抽出された画像の識別子と、前記抽出された画像の領域のうちで前記ブロックがどの位置にあるかを示す情報と、前記抽出されたブロックの特徴量と、の対応関係を示す第1の情報を作成し、前記第1の情報に基づいて、前記分割されたブロックのうち、前記ユーザによって選択された少なくとも一のブロックを第1の検索キーとし、前記第1の検索キーの特徴量と他のブロックの特徴量とを比較することによって、前記第1の検索キーに類似する所定の数のブロックを検索結果として検出し、
前記検出された検索結果を含む画像を前記ユーザに表示することを特徴とする。
【発明の効果】
【0019】
本発明の一実施形態によれば、ユーザが所望する人物又は物体を効率的に検索することができる。
【図面の簡単な説明】
【0020】
【図1】第1の実施形態の画像検索システムの構成を示すブロック図である。
【図2】第1の実施形態の画像登録処理を示すブロック図である。
【図3】第1の実施形態のブロック分割処理を示すフローチャートである。
【図4】第1の実施形態のブロック分割処理によって取得される画像を示す説明図である。
【図5】第1の実施形態の検索処理を示すブロック図である。
【図6】第1の実施形態のブロック選択時に表示される画像を示す説明図である。
【図7】第1の実施形態の検索結果統合処理を示すフローチャートである。
【図8】第2の実施形態の画像検索システムの構成を示すブロック図である。
【図9】第2の実施形態の画像登録処理を示すブロック図である。
【図10】第2の実施形態のブロック分割処理を示すフローチャートである。
【図11】第2の実施形態の検索処理を示すブロック図である。
【図12】第2の実施形態の検索処理を示すフローチャートである。
【図13】第3の実施形態の検索処理を示すブロック図である。
【図14】第3の実施形態の複数ブロック選択時に表示される画像を示す説明図である。
【図15】第3の実施形態の検索結果統合処理を示すフローチャートである。
【図16】第4の実施形態の検索処理を示すブロック図である。
【図17】第4の実施形態の検索キー領域指定時に表示される画像を示す説明図である。
【図18】第4の実施形態の検索結果の表示画面を示す説明図である。
【図19】第1の実施形態の画像管理情報を示す説明図である。
【図20】第1の実施形態の特徴量管理情報を示す説明図である。
【図21】第1の実施形態の検索処理を示すフローチャートである。
【図22】第4の実施形態の検索結果統合処理を示すフローチャートである。
【図23】従来の画像検索システムによって検出される人物領域を示す説明図である。
【発明を実施するための形態】
【0021】
以下、本発明の実施形態を、図面を参照して説明する。
【0022】
[実施形態1]
以下、本発明の第1の実施形態の画像検索システムについて、図面に従って説明する。
【0023】
図1は、第1の実施形態の画像検索システムの構成を示すブロック図である。
【0024】
第1の実施形態の画像検索システムは、サーバ計算機110、クライアント計算機130、画像データベース140、特徴量データベース150、及びカメラ160を備える。各装置は、通信基盤120によって相互に接続される。
【0025】
サーバ計算機110は、外部インタフェース111、中央処理演算装置(CPU)112、メモリ113及び大容量外部記憶装置(HD)114を備える。サーバ計算機110は、検索エンジンが稼動する計算機であり、通信基盤120を経由し、クライアント計算機130に検索のサービスを提供する。
【0026】
外部インタフェース111は、サーバ計算機110を通信基盤120に接続するためのインタフェース(I/F)である。CPU112は、サーバ計算機の処理を制御するプロセッサである。メモリ113は、CPU112によって実行される制御処理のための作業領域であり、各種データ、及び、HD114からロードされたプログラムを格納する。HD114は、ハードディスクなどの大容量記憶装置であり、CPU112によって実行されるプログラム、データなどを格納する。
【0027】
クライアント計算機130は、CRTなどのディスプレイ装置を備え、ディスプレイ装置に、サーバ計算機110によって作成された出力画面及びインタフェース画面などを表示する。また、クライアント計算機130は、キーボード、マウスなどの入力装置を備え、ユーザが入力装置を操作することによって入力したデータ、コマンドなどをサーバ計算機110に出力する。
【0028】
なお、本実施形態の画像検索システムは、ネットワークを介して接続されたサーバ計算機110とクライアント計算機130とがサービスを提供する構成であるが、一般的なパーソナルコンピュータが画像検索のアプリケーションによって検索のサービスを提供する構成であってもよい。
【0029】
画像データベース140は、画像又は画像のサムネイルを格納するためのデータベースであり、例えば、画像管理情報(図19参照)を格納する。また、特徴量データベース150は、対象とする画像から抽出された特徴量及び検索用のインデクスを格納するためのデータベースであり、例えば、特徴量管理情報(図20参照)を格納する。
【0030】
図19は、第1の実施形態の画像管理情報2000を示す説明図である。
【0031】
画像管理情報2000は、画像ID2001、カメラID2002、撮影時刻2003、及び画像2004を含む。画像ID2001は、画像を識別するための識別子である。カメラID2002は、画像を撮影したカメラを識別するための識別子である。撮影時刻2003は、画像を撮影した時刻情報である。画像2004は、検索の対象となる画像である。なお、画像2004は、画像自身(例えば、JPEGデータ)ではなく、画像へのポインタ情報であってもよい。
【0032】
図20は、第1の実施形態の特徴量管理情報2100を示す説明図である。
【0033】
特徴量管理情報2100は、特徴量ID2101、画像ID2102、ブロック位置2103及び2104を含む。特徴量ID2101は、特徴量を識別するための識別子である。画像ID2102は、図19の画像2004に格納された画像を識別するための識別子である。
【0034】
ブロック位置2103は、画像ID2102によって特定される画像に含まれるブロック(矩形領域)の位置を示す情報である。例えば、ブロック位置は、矩形領域の左上の点のX座標及びY座標と右下の点のX座標及びY座標とによって示される。また、矩形領域の左上の点のX座標及びY座標と矩形領域の幅及び高さによって示されてもよい。
【0035】
特徴量ベクトル2104は、画像ID2102によって特定される画像のうち、ブロック位置2103によって特定される領域から抽出された特徴量ベクトルである。特徴量ベクトルとは、後述する図2の特徴量抽出部204によって、例えば、色ヒストグラムに基づいて作成される多次元ベクトルである。
【0036】
なお、画像データベース140及び特徴量データベース150は、サーバ計算機110が備えるHD114に格納されてもよいし、HD114とは異なる他のハードディスクに格納されてもよい。
【0037】
カメラ160Aから160Nは、追跡対象エリアに設置されたカメラである。以下、カメラ160Aから160Nのいずれにも共通する説明をする場合、その説明において、カメラ160Aから160Nを総称してカメラ160と記載する。
【0038】
以下に、画像登録処理について説明する。
【0039】
図2は、第1の実施形態の画像登録処理を示すブロック図である。
【0040】
本実施形態の画像検索システムは、映像入力部201、静止画抽出部202、ブロック分割部203、及び特徴量抽出部204によって、画像登録処理を実行し、検索対象の画像の情報を特徴量データベース150及び画像データベース140に格納する。なお、図1に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、映像入力部201、静止画抽出部202、ブロック分割部203、特徴量抽出部204の処理を実現する。
【0041】
まず、映像入力部201は、カメラ160によって撮影された映像情報を取得する。なお、映像入力部201は、HD114又は任意の記録媒体に格納された映像情報を取得してもよい。
【0042】
次に、静止画抽出部202は、映像入力部201によって取得した映像情報から静止画フレーム(画像)を作成する。なお、静止画抽出部202は、ユーザの指定によって、1秒間当たりの映像データから、何枚の画像を作成するのかを設定することができる。
【0043】
次に、ブロック分割部203は、ブロック分割処理を実行し、特徴量抽出の対象となるブロックを決定する。具体的には、ブロック分割部203は、静止画抽出部202によって作成された画像が前景(人物又は物体が映っている領域)を含むか否かを判定し、画像が前景を含むと判定された場合、画像をブロックに分割する。ブロック分割処理の詳細については図3を用いて後述する。
【0044】
また、ブロック分割部203は、前景を含む画像(人物が映っている画像)を選択し、選択された画像の情報を示す画像管理情報2000を作成し、作成された画像管理情報2000を画像データベース140に格納する。
【0045】
具体的には、ブロック分割部203は、図19に示した画像管理情報2000の各エントリの画像ID2001、カメラID2002、撮影時刻2003及び画像2004に、それぞれ、前景の領域を含む画像に付与された画像の識別子、画像を撮影したカメラの識別子、撮影時刻及び画像のデータを格納する。ここで、画像ID2001は、例えば、画像を識別するための任意の数字である。また、画像2004には、画像のデータそのものが格納されてもよいし、画像から作成されたサムネイルが格納されてもよい。また、画像を参照するためのリンク情報が格納されてもよい。なお、ブロック分割部203は、画像データベース140に、すべての画像を格納しなくてもよい。
【0046】
次に、特徴量抽出部204は、ブロック分割部203によって分割され、特徴量抽出の対象に決定された各ブロックの特徴量を、例えば、色情報に基づいて、抽出する。具体的には、特徴量抽出部204は、ブロック分割部203によって分割されたブロックのうちの、前景を含むと判定された特徴量抽出の対象となるブロックを、さらに細かい格子状の領域に分割する。そして、特徴量抽出部204は、分割された各領域の色ヒストグラムを計算し、計算された色ヒストグラムに基づいて、多次元ベクトル(特徴量ベクトル)を作成する。
【0047】
なお、特徴量抽出部204は、色情報のほか、輝度値、明度値などの情報、及びやそれらを組み合わせた情報によって、各ブロックの特徴を示す特徴量ベクトルを作成してもよい。また、特徴量抽出部204は、ブロックの一部の領域の特徴量ベクトルを作成してもよい。
【0048】
また、特徴量抽出部204は、特徴量管理情報2100を作成し、作成された特徴量管理情報2100を特徴量データベース150に格納する。具体的には、特徴量抽出部204は、図20に示した特徴量管理情報2100のエントリの特徴量ID2101、画像ID2102、ブロック位置2103、及び特徴量ベクトル2104に、それぞれ、特徴量を識別するため識別子、元画像の識別子、特徴量が抽出されたブロックの位置情報、及びブロックから抽出された特徴量ベクトルを格納する。
【0049】
以上の処理によって、画像登録処理が終了する。後述する図5に示す検索処理の対象は、各データベースに格納された画像管理情報2000及び特徴量管理情報2100である。なお、画像登録処理は、あらかじめ実行されるのではなく、ユーザが検索処理を実行する時に実行されてもよい。
【0050】
以下に、ブロック分割部203の処理の詳細について説明する。
【0051】
図3は、第1の実施形態のブロック分割処理を示すフローチャートである。
【0052】
まず、ブロック分割部203は、静止画抽出部202によって作成された画像を取得する(S101)。ステップS101において、ブロック分割部203が取得した画像の一部は、例えば、後述する図4に示す(A)である。
【0053】
次に、ブロック分割部203は、背景差分値を計算する(S102)。具体的には、まず、ブロック分割部203は、事前に用意された背景画像をグレースケールに変換する。ここで、背景画像とは、例えば、取得した画像と同じ範囲が撮影された画像であって、人物又は物体が映っていない背景のみの画像である。
【0054】
次に、ブロック分割部203は、取得した画像をグレースケールに変換する。そして、グレースケールに変換された背景画像と、グレースケールに変換された画像と、を比較することによって、各画像の画素の差分値(背景差分値)を計算する。取得した画像の領域のうち、背景差分値が大きい領域は、「背景」とは異なった人物又は物体が映っている可能性が高いので、ブロック分割部203は、背景差分値が大きい領域を「前景」と判定する。ステップS102において、背景差分値によって表わされる背景差分画像は、例えば、後述する図4の(B)である。
【0055】
次に、ブロック分割部203は、ステップS102によって得られた背景差分画像を所定の大きさのブロックに分割する(S103)。ステップS103において、ブロック分割部203によって格子状のブロックに分割された背景差分画像は、例えば、後述する図4の(C)である。なお、ブロック分割部203は、取得した画像に映っている人物又は物体の大きさに応じて、ブロックの大きさ、又は分割数を変更してもよい。また、ブロックの大きさは、すべて同じでもよいし、画像の領域に応じて変更されてもよい。例えば、画像の上部、すなわち、撮影範囲の奥方向のブロックを画像の下部と比べて小さくしてもよい。また、静止画の上部には小さい物体しか映っていないことが多いので、画像の上部を特徴量抽出の対象としなくてもよい。
【0056】
次に、ブロック分割部203は、各ブロックの前景度を計算する(S104)。具体的には、まず、ブロック分割部203は、取得した画像に対応する背景差分画像の各ブロックの背景差分値の合計を計算する。次に、計算された各ブロックの背景差分値の合計値を各ブロックの前景度に設定する。なお、ブロック分割部203は、分割された各ブロックの大きさが異なる場合、ブロックの面積に応じて、背景差分値の合計値を正規化する。
【0057】
最後に、ブロック分割部203は、特徴量抽出の対象となるブロックを決定する(S105)。
【0058】
ここで、例えば、ブロック分割部203は、ブロックの前景度が所定の閾値を越える場合、前景度が大きいブロックには背景とは異なった人物又は物体が映っている可能性が高いので、そのブロックを特徴量抽出の対象としてもよい。また、前景度の大きさの順にソートされた各ブロックのうち、前景度が大きいブロックを所定の数だけ選択し、選択されたブロックを特徴量抽出の対象としてもよい。ステップS105において、ブロック分割部203によって決定された特徴量抽出の対象となるブロックは、例えば、後述する図4の(D)に示される網掛けのブロックである。
【0059】
なお、ブロック分割部203は、ステップS101からS104の処理を省略してもよい。この場合、ブロック分割部203は、取得した画像を格子状のブロックに分割し、分割された各ブロックを特徴量抽出の対象に決定してもよい。
【0060】
図4は、第1の実施形態のブロック分割処理によって取得される画像を示す説明図である。
【0061】
左上図(A)は、ブロック分割部203によってはじめに取得した画像の一部であり、例えば、人物が映っている画像である。右上図(B)は、ブロック分割部203によって作成された背景差分画像であり、人物又は物体(前景)が映っている可能性の高い領域が背景差分値によって示される。
【0062】
左下図(C)は、ブロック分割部203によって格子状のブロックに分割された背景差分画像である。右下図(D)は、ブロック分割部203によって決定された特徴量抽出の対象となるブロックを示す画像である。特徴量抽出の対象となるブロック領域は網掛けされている。
【0063】
以下に、検索処理の詳細について説明する。
【0064】
図5は、第1の実施形態の検索処理を示すブロック図である。
【0065】
本実施形態の画像検索システムは、画像取得部301、ブロック分割部302、画像表示部303、ブロック選択部304、検索部305、検索結果統合部306、検索結果表示部307、画像データベース140及び特徴量データベース150によって、検索処理を実行する。なお、図1に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、画像取得部301、ブロック分割部302、画像表示部303、ブロック選択部304、検索部305、検索結果統合部306、検索結果表示部307の処理を実現する。
【0066】
画像取得部301は、カメラ160によって撮影された映像から抽出された画像から、ユーザによって選択された、検索キーとなる人物又は物体が含まれた画像を取得する。
【0067】
又は、画像取得部301は、画像データベース140の画像管理情報2000から、ユーザによって選択された、検索キーとなる人物又は物体が含まれた画像を取得する。この場合、画像検索システムは、ユーザがカメラ番号(カメラID)、画像の撮影時刻などを参照することによって検索キーとなるブロックを含む画像を選択することができるインタフェース画面を、クライアント計算機130のディスプレイに表示してもよい。
【0068】
画像取得部301がカメラ160から画像を取得した場合、ブロック分割部302は、図2に示したブロック分割部203と同じ処理によって、取得した画像をブロックに分割し、分割されたブロックのうちで特徴量抽出の対象となるブロックを決定する。
【0069】
一方、画像取得部301が画像データベース140から画像を取得した場合、既にデータ登録処理は終了しているので、ブロック分割部302は、特徴量データベース150の特徴量管理情報2100から、取得した画像に対応する画像ID及びブロック位置を取得する。
【0070】
次に、画像表示部303は、クライアント計算機130のディスプレイに取得した画像を表示する。この場合、ブロック分割部302によって取得したブロック位置の情報も合わせて表示する。
【0071】
図6は、第1の実施形態のブロック選択時に表示される画像を示す説明図である。
【0072】
右図(A)は、検索キー候補のブロックを示す。左図(B)のブロック401は、ユーザによって、検索キーとして選択されたブロックである。
【0073】
なお、画像表示部303は、検索キー候補のブロックを表示する場合、図6の(A)に示したように、取得した画像の検索キー候補の各ブロックを矩形で表示してもよいし、また、取得した画像の横に検索キー候補の各ブロックを並べて表示してもよい。
【0074】
次に、ブロック選択部304は、ユーザによって選択された検索キーとなるブロックを取得する。なお、ユーザは、クライアント計算機130のディスプレイに表示された画像に含まれる各ブロックから、マウスなどの入力装置を用いて検索キーとなるブロックを選択することができる。
【0075】
また、画像表示部303は、選択された検索キーのブロックを明示するために、例えば、選択されたブロックの矩形を着色してもよいし、矩形の線を太くしてもよい。また、選択されたブロックの矩形の内部を着色してもよい。
【0076】
次に、検索部305は、特徴量データベース150の特徴量管理情報2100から、選択された検索キーのブロックの特徴量と類似する特徴量を持つブロックを検索し、検索結果を取得する。検索部305が実行する検索処理の詳細については、図21を用いて後述する。
【0077】
なお、本実施形態では、検索結果表示部307が、検索結果のブロックではなく、検索結果のブロックを含む画像(検索結果画像)を表示するので、検索部305は、特徴量データベース150の特徴量管理情報2100から、検索結果のブロックを含む画像の画像IDを取得する。
【0078】
次に、検索結果統合部306は、検索部305によって取得した検索結果を統合し、検索結果表示リストを作成する。検索結果統合部306が実行する検索結果統合処理の詳細については、図7を用いて後述する。
【0079】
検索結果表示部307は、クライアント計算機130のディスプレイに、検索結果統合部306によって作成された検索結果表示リストに含まれる画像IDを持つ画像を表示する。この場合、検索結果表示部307は、画像のみを表示してもよいし、矩形で示された検索結果のブロックを含む画像を表示してもよい。
【0080】
以下に、検索部305が実行する検索処理の詳細について説明する。
【0081】
図21は、第1の実施形態の検索処理を示すフローチャートである
検索部305は、まず、選択されたブロックの特徴量を取得する(S601)。なお、画像取得部301がカメラ160から画像を取得した場合、検索部305は、図2に示した特徴量抽出部204と同じ処理を実行し、選択されたブロックの特徴量を抽出する。一方、画像取得部301が画像データベース140から画像を取得した場合、取得した画像の各ブロックの特徴量は既に計算されているので、検索部305は、特徴量データベース150の特徴量管理情報2100から、選択されたブロックの特徴量を取得する。
【0082】
次に、検索部305は、選択された検索キーのブロックの特徴量と特徴量管理情報2100の各エントリの特徴量との間の類似度を計算する(S602)。本実施形態では、類似度を計算するために、各特徴量ベクトルの間のユークリッド距離を用いる。なお、各特徴量の間の類似度は、ユークリッド距離のほか、例えば、マンハッタン距離などを用いて計算されてもよい。
【0083】
最後に、検索部305は、特徴量データベース150の特徴量管理情報2100から、検索キーのブロックとの類似度が大きいN件のブロックを検索結果として取得する(S603)。ここで、Nは、検索結果表示部307が一度に表示することができる件数よりも十分大きい数でもよい。例えば、表示することができる件数が20であるとすると、ステップS603において取得される検索結果の数Nは1000程度が好ましい。
【0084】
以下に、検索結果統合部306が実行する検索結果統合処理の詳細について説明する。
【0085】
図7は、第1の実施形態の検索結果統合処理を示すフローチャートである。
【0086】
まず、検索結果統合部306は、検索部305から出力された、検索キーのブロックとの類似度が大きいN件の検索結果を取得し、カウンタiを0にする(S201)。さらに、検索結果表示リストを初期化する。ここで、検索結果表示リストとは、検索結果表示部307が検索結果のブロックを含む画像(検索結果画像)を表示するために、検索結果統合部306によって作成される、画像IDとその画像IDを持つ画像に設定された類似度とが対応付けられたリストである。
【0087】
次に、検索結果統合部306は、特徴量データベース150の特徴量管理情報2100から、N件の検索結果のブロックのうち、類似度がi番目のブロックを含む画像の画像IDを取得する(S202)。
【0088】
その後、検索結果統合部306は、取得した画像IDが検索結果表示リストに含まれるか否かを判定する(S203)。ステップS203において、取得した画像IDが検索結果表示リストに含まれないと判定された場合、検索結果統合部306は、検索結果表示リストに取得した画像IDとその画像IDを持つ画像に対応する類似度とを追加する(S204)。一方、ステップS203において、取得した画像IDが検索結果表示リストに含まれると判定された場合、検索結果統合部306は、検索結果表示リストに取得した画像IDを追加せず、ステップS205に移る。
【0089】
次に、検索結果統合部306は、検索部305から出力されたすべての検索結果が処理されたか否かを判定する(S205)。ステップS205において、すべての検索結果が処理されていないと判定された場合、すなわち、カウンタiが検索結果数N未満である場合、検索結果統合部306は、カウンタiに1を追加し(S206)、S202以降の処理を繰り返す。
【0090】
一方、ステップS205において、すべての検索結果が処理されたと判定された場合、すなわち、カウンタiが検索結果数N以上である場合、検索結果統合部306は、検索結果表示リストに追加された画像IDを類似度が大きい順にソートし(S207)、処理を終了する。
【0091】
なお、本実施形態では、ソートの対象として追加された画像IDを持つ画像に複数の検索結果のブロックを含む場合、複数の検索結果のブロックのうち、検索キーのブロックとの類似度が最も大きい検索結果のブロックを選択し、選択されたブロックの類似度を追加された画像IDを持つ画像に対応する類似度に設定する。なお、複数の検索結果のブロックの類似度の平均値を計算し、計算された類似度の平均値を追加された画像IDを持つ画像に対応する類似度に設定してもよい。
【0092】
以上説明したように、第1の実施形態の画像検索システムによると、格子状のブロックに分割された画像をブロック単位で検索するので、人物又は物体の領域を厳密に抽出することなく、検索キーと類似する人物又は物体を検索することができる。さらに、検索キーのブロックと類似した部分が画像の一部に映っていれば検索が可能なため、検索対象となる画像に映っている人物の姿勢及びオクルージョン(カメラに対して手前の物体が後方の物体を遮蔽する現象)の影響が小さくなる。
【0093】
[実施形態2]
以下、本発明の第2の実施形態の画像検索システムについて、図面を用いて説明する。
【0094】
図8は、第2の実施形態の画像検索システムの構成を示すブロック図である。
【0095】
第2の実施形態の画像検索システムは、サーバ計算機110、クライアント計算機130、特徴量データベース150、カメラ画像データベース410及びサムネイル画像データベース420を備える。各装置は、通信基盤120によって相互に接続される。
【0096】
サーバ計算機110、クライアント計算機130、特徴量データベース150及び通信基盤120は、それぞれ、図1に示した第1の実施形態の画像検索システムが備える同じ符号が付与された装置と同じであるので、説明を簡略化する。
【0097】
カメラ画像データベース410は、カメラによって事前に撮影されたカメラ画像(映像データから抽出された静止画)を格納するデータベースである。なお、カメラ画像データベース410は、図1に示した画像データベース140と同様に、図19に示した画像管理情報2000を格納してもよい。この場合、事前に撮影されたカメラ画像(例えば、JPEG画像)は、画像管理情報2000の画像2004に格納される。また、事前に撮影された画像の画像ID、カメラID、及び撮影時刻は、それぞれ、画像管理情報2000の画像ID2001、カメラID2002、撮影時刻2003に格納される。
【0098】
サムネイル画像データベース420は、カメラ画像のサムネイルを格納するデータベースである。なお、サムネイル画像データベース420は、図1に示した画像データベース140と同様に、図19に示した画像管理情報2000を格納してもよい。ただし、この場合、画像管理情報2000の画像2004には、サムネイル画像、又はサムネイル画像の元のカメラ画像を参照するためのリンク情報が格納される。
【0099】
なお、画像検索システムは、サムネイル画像を利用しない場合、サムネイル画像データベース420を備えなくてもよい。
【0100】
以下に、画像登録処理について説明する。
【0101】
図9は、第2の実施形態の画像登録処理を示すブロック図である。
【0102】
本実施形態の画像検索システムは、画像入力部501、ブロック分割部502、特徴量抽出部204及びカメラ画像データベース410によって、画像登録処理を実行し、検索対象となる画像の情報を特徴量データベース150及びサムネイル画像データベース420に格納する。なお、図8に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、画像入力部501、ブロック分割部502、特徴量抽出部204の処理を実現する。
【0103】
特徴量抽出部204及び特徴量データベース150は、それぞれ、図2に示した第1の実施形態の特徴量抽出部204及び特徴量データベース150と同じである。
【0104】
まず、画像入力部501は、検索対象となる画像を取得する。ここで、検索対象となる画像とは、カメラ画像データベース410に格納されている画像である。
【0105】
次に、ブロック分割部502は、ブロック分割処理を実行する。具体的には、ブロック分割部502は、画像入力部501から出力された画像をブロックに分割し、分割されたブロックのうち、特徴量抽出の対象となるブロックを決定する。ブロック分割部502が実行するブロック分割処理の詳細については、図10を用いて後述する。
【0106】
また、ブロック分割部502は、特徴量抽出の対象に決定されたブロックを含む画像を選択し、選択された画像のサムネイルを作成する。ブロック分割部502は、サムネイル画像データベース420の画像管理情報2000の画像2004に作成されたサムネイル画像を格納する。また、サムネイル画像に元画像へのリンク情報を付与してもよい。
【0107】
また、ブロック分割部502は、サムネイル画像データベース420の画像管理情報2000の各項目に、サムネイル画像の画像ID、カメラID及び撮影時刻を格納する。
【0108】
なお、画像検索システムがサムネイル画像データベース420を備えない場合、ブロック分割部502は、例えば、カメラ画像データベース410の画像管理情報2000に格納されている画像のうち、特徴量抽出の対象に決定されたブロックが含まれる画像の画像IDを、特徴量抽出の対象のブロックが含まれていることを示す画像IDに書き換えてもよい。
【0109】
特徴量抽出部204は、ブロック分割部502によって決定された特徴量抽出の対象のブロックから特徴量を抽出し、抽出された特徴量のID、元画像の画像ID、ブロックの位置情報及び抽出された特徴量(特徴量ベクトル)を、特徴量データベース150の特徴量管理情報2100の各項目に格納する。
【0110】
以下に、ブロック分割部502処理の詳細について説明する。
【0111】
図10は、第2の実施形態のブロック分割処理を示すフローチャートである。
【0112】
まず、ブロック分割部502は、画像入力部501から出力された画像を取得する(S301)。次に、ブロック分割部502は、取得した画像を格子状のブロックに分割する(S302)。
【0113】
なお、ブロック分割部203は、取得した画像に映っている人物又は物体の大きさに応じて、ブロックの大きさ、又は分割数を変更してもよい。また、ブロックの大きさは、すべて同じでもよいし、画像の領域によって変更されてもよい。例えば、画像の上部、すなわち、撮影範囲の奥方向のブロックを画像の下部と比べて小さくしてもよい。また、静止画の上部には小さい物体しか映っていないことが多いので、画像の上部を特徴量抽出の対象としなくてもよい。
【0114】
次に、ブロック分割部502は、分割された各ブロックの色ヒストグラムを計算する(S303)。具体的には、まず、RGBの値を複数の値域に分割する。例えば、RGBの各値が0から255の間の範囲にある場合、この範囲を0から63、64から127、128から191、192から255、の4段階に区分する。一の段階に含まれる画素値を同じ値とみなすと、RGBの組合わせは、全部で、4×4×4=64通りになる。なお、ブロック分割部502は、RGBのそれぞれを同じ段階に区分しなくてもよい。例えば、人間の視覚特性に合わせて、Rを12段階、Gを21段階、Bを6段階に区分することによって、分解能に差をつけてもよい。
【0115】
次に、ブロック分割部502は、分割された各ブロックに含まれる各画素毎にRGBの値を計算し、計算された各画素のRGBの値が、どの組合わせ(例えば、64通りの組合せ)に該当する判定する。そして、各組合せに該当する画素の合計を計算する。これによって、対象ブロックの色ヒストグラムが作成される。
【0116】
次に、ブロック分割部502は、ステップS302と同様に、事前に用意された背景画像を格子状のブロックに分割する。そして、ステップS303と同様に、背景画像の各ブロックの色ヒストグラムを計算する。そして、ブロック分割部502は、取得した画像と背景画像とを比較し、対応する各ブロック毎に、それぞれの色ヒストグラムの差分を計算する(S304)。この場合、例えば、ユークリッド距離を用いて、各色ヒストグラムの差分を計算してもよい。
【0117】
最後に、ブロック分割部502は、特徴量を抽出する対象となるブロックを決定する(S305)。ここで、例えば、ブロック分割部502は、ブロックの差分値が所定の閾値を越える場合、そのブロックを特徴量抽出の対象としてもよい。また、差分値の大きさの順にソートされた各ブロックのうち、差分値が大きいブロックを所定の数だけ選択し、選択されたブロックを特徴量抽出の対象としてもよい。
【0118】
以下に、人物又は物体の検索処理について説明する。
【0119】
図11は、第2の実施形態の検索処理を示すブロック図である。
【0120】
第2の実施形態の画像検索システムは、画像取得部601、画像表示部602、ブロック選択部304、検索部603、検索結果統合部306、検索結果表示部307、特徴量データベース150及びサムネイル画像データベース420によって、検索処理を実行する。
【0121】
なお、図8に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、画像取得部601、画像表示部602、ブロック選択部304、検索部603、検索結果統合部306及び検索結果表示部307の処理を実現する。
【0122】
特徴量データベース150、ブロック選択部304、検索結果統合部306及び検索結果表示部307は、図5に示した同一の符号が付けられた各処理部と同じであるので、説明を簡略化する。
【0123】
なお、画像検索システムがサムネイル画像データベース420を備えない場合、画像検索システムは、サムネイル画像データベース420の代わりに、カメラ画像データベース410を用いて検索処理を実行する。
【0124】
まず、画像取得部601は、サムネイル画像データベース420から、ユーザによって選択された、検索キーとなる人物又は物体が含まれた画像を取得する。サムネイル画像データベース420には、既に画像登録処理が終了しており、検索キーの対象となる画像が格納されている。
【0125】
この場合、画像検索システムは、カメラ番号(カメラID)、画像の撮影時刻などを参照することによって、ユーザが検索キーとなるブロックを含む画像を選択することができるインタフェース画面を、クライアント計算機130のディスプレイに表示してもよい。画像取得部601は、ユーザがマウス又はキーボードなとの入力装置を操作することによってインタフェース画面から選択した検索キーとなるブロックを含む画像を取得する。
【0126】
画像表示部602は、画像取得部601から出力された、検索キーとなるブロックを含む画像を、クライアント計算機130のディスプレイに表示する。この場合、画像表示部602は、特徴量データベース150の特徴量管理情報2100から画像のブロックの位置情報を取得し、取得した画像とブロックの位置情報とを合わせて表示する。
【0127】
画像表示部602は、図6の(A)に示したように、取得した画像に含まれる検索キー候補の各ブロックを矩形で表示してもよいし、また、取得した画像の横に検索キー候補の各ブロックを並べて表示してもよい。
【0128】
次に、ブロック選択部304は、図5に示したブロック選択部304と同じ処理によって、検索キー(後述する図12の検索処理における第1の検索キー)となるブロックを選択する。
【0129】
次に、検索部603は、特徴量データベース150の画像管理情報2000から、選択された検索キーのブロックの特徴量と類似した特徴量を持つブロックを検索する。検索部603の処理の詳細については図12を用いて後述する。
【0130】
次に、検索結果統合部306は、検索部603から出力された検索結果を取得し、図7に示した検索結果統合処理によって、取得した検索結果を統合する。
【0131】
次に、検索結果表示部307は、図5に示した検索結果表示部307と同じ処理によって、検索結果統合部306が作成した検索結果表示リストに含まれる画像IDを持つ画像を、クライアント計算機130のディスプレイに表示する。
【0132】
以下に、検索部603が実行する検索処理の詳細について説明する。
【0133】
図12は、第2の実施形態の検索処理を示すフローチャートである。
【0134】
まず、検索部603は、ブロック選択部304によって選択された第1の検索キーのブロックを含む画像のカメラID及び撮影時刻を、サムネイル画像データベース420の画像管理情報2000から取得する(S401)。
【0135】
次に、検索部603は、選択された第1の検索キーのブロックを含む画像の前後フレームの画像のブロックのうち、選択された第1の検索キーのブロックに類似したM件の第2の検索キーのブロックを取得する(S402)。
【0136】
ここで、まず、検索部603は、取得したカメラIDによって撮影された画像から、取得した撮影時刻の前後t秒(例えば、10秒程度)の範囲で撮影された画像を抽出し、抽出された前後の画像に含まれる各ブロック(各ブロック位置の情報)を取得する。
【0137】
次に、検索部603は、特徴量データベース150の画像管理情報2000を参照し、第1の検索キーのブロックの特徴量と、取得した前後の画像に含まれるブロックの特徴量との間の類似度を計算する。そして、第1の検索キーのブロックとの類似度が大きいM件のブロックを取得する。
【0138】
なお、ここでは、類似度を計算するために、各特徴量ベクトルの間のユークリッド距離を用いたが、ユークリッド距離のほか、例えば、マンハッタン距離などを用いてもよい。また、検索部603は、計算された類似度が所定の閾値を超えた場合、そのブロックを取得してもよい。
【0139】
次に、検索部603は、取得したブロックの数MがM>0を満たすか否かを判定する(S403)。
【0140】
ステップS403において、検索結果件数MがM>0を満たさないと判定された場合、すなわち、選択された第1の検索キーのブロックの撮影時刻の前後t秒に他の画像がない場合、又は、第1の検索キーのブロックと前後の画像に含まれるブロックとの間の類似度が所定の閾値以下であった場合、検索部603は、選択された第1の検索キーを用いて、特徴量管理情報2100のすべてのブロックを検索する。そして、検索部603は、第1の検索キーのブロックとの類似度が大きいN件のブロックを取得する(S406)。ステップS406の処理は、図21に示したステップS601からS603の検索処理と同じである。
【0141】
一方、ステップS403において、検索結果件数MがM>0を満たすと判定された場合、検索部603は、取得したブロックを第2の検索キーに設定し、第1の検索キー及び第2の検索キーを用いて、特徴量管理情報2100のすべてのブロックを検索する(S404)。
【0142】
そして、検索部603は、第1の検索キーのブロックとの類似度が大きい所定の数の第1のブロックを取得する。また、第2の検索キーのブロックとの類似度が大きい所定の数の第2のブロックを取得する。取得した第1のブロックの数及び第2のブロックの数は、例えば、合わせてN件になるように設定されてもよい。ステップS404の処理は、図21に示したステップS601からS603の検索処理と同じである。
【0143】
ただし、ステップS404の処理によって取得された検索結果(第2のブロック)は、複数の第2の検索キーを用いて検索されたので、重複することがある。このため、重複した第2のブロックを統合する(S405)。この場合、複数の第2の検索キーのブロックと第2のブロックとの間の類似度を再設定しなければならない。
【0144】
ここでは、複数の第2のブロックのうち、第2の検索キーとの類似度が最も大きい第2のブロックを選択し、その類似度を第2のブロックに対応する類似度に設定する。なお、複数の第2のブロックに対応する各類似度の平均値を計算し、計算された類似度をその第2ブロックの類似度に設定してもよい。また、選択された第1の検索キーのブロックを用いて検索された第1のブロックと第2の検索キーのブロックを用いて検索された第2のブロックとが重複した場合、第1のブロックに対応する類似度を、統合されたブロックに対応する類似度に設定してもよい。
【0145】
次に、検索結果統合部306は、ステップS405又はS406によって取得された検索結果を統合する。検索結果統合処理は、図7に示した検索結果統合処理と同じである。
【0146】
最後に、検索結果表示部307は、クライアント計算機130のディスプレイに、検索結果統合部306によって作成された検索結果表示リストに含まれる画像IDを持つ画像を表示する。
【0147】
以上説明したとおり、第2の実施形態の画像検索システムによると、第1の実施形態の効果に加え、特徴量が少しずつ異なる検索キーを用いて検索処理を実行するので、多様な検索結果を得ることができ、検索精度を向上させることができる。
【0148】
[実施形態3]
以下、本発明の第3の実施形態の画像検索システムについて、図面を用いて説明する。
【0149】
本実施形態の画像検索システムの構成、及び画像データ登録処理は、第1の実施形態又は第2の実施形態と同じであるので、説明を省略する。以下に、本実施形態の検索処理について説明する。
【0150】
図13は、第3の実施形態の検索処理を示すブロック図である。
【0151】
本実施形態の画像検索システムは、画像取得部701、画像表示部702、ブロック選択部703、検索部704、検索結果統合部705、検索結果表示部706、画像データベース710、及び特徴量データベース150によって、検索処理を実行する。
【0152】
なお、図1又は図8に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、各処理部の処理を実現する。
【0153】
また、特徴量データベース150は、図1に示した特徴量データベース150と同じである。また、本実施形態の画像検索システムが第1の実施形態の画像検索システムの構成と同じである場合、画像データベース710は、図1に示した画像データベース140と同じである。また、本実施形態の画像検索システムが第2の実施形態の画像検索システムの構成と同じである場合、画像データベース710は、サムネイル画像データベース420と同じである。
【0154】
まず、画像取得部701は、ユーザによって選択された、検索キーとなる人物又は物体が含まれる画像を画像データベース710から取得する。ここで、画像データベース710には、既に画像登録処理が終了しており、検索キーの対象となる画像が格納されている。
【0155】
この場合、画像検索システムは、カメラ番号(カメラID)、画像の撮影時刻などを参照することによって、ユーザが検索キーとなるブロックを含む画像を選択することができるインタフェース画面を、クライアント計算機130のディスプレイに表示してもよい。画像取得部701は、ユーザがマウス又はキーボードなとの入力装置を操作することによってインタフェース画面から選択した画像を取得する。
【0156】
次に、画像表示部702は、取得した画像を、クライアント計算機130のディスプレイに表示する。この場合、画像表示部702は、特徴量データベース150の特徴量管理情報2100からブロック位置の情報を取得し、取得したブロック位置の情報と取得した画像とを表示する。例えば、画像表示部702は、図6の(A)に示したように、取得した画像に含まれる各ブロックを矩形で表示してもよい。
【0157】
次に、ブロック選択部703は、ユーザによって選択された検索キーとなるブロックを取得する。本実施形態では、ブロック選択部703は、ユーザによって選択された複数のブロックを取得することができる。なお、ユーザは、クライアント計算機130のディスプレイに表示された画像に含まれる各ブロックから、マウスなどの入力装置を用いて検索キーとなる複数のブロックを選択することができる。
【0158】
なお、画像検索システムは、選択されたすべての検索キーに対応する検索結果を取得するか、又は、選択された複数の検索キーのうちのいずれかの検索キーに対応する検索結果を取得するかをユーザが指定するためのインタフェース画面を表示してもよい。
【0159】
図14は、第3の実施形態の複数ブロック選択時に表示される画像を示す説明図である。
【0160】
図14では、ユーザによって選択された検索キーとなるブロック801及び802が示される。なお、画像表示部602は、選択されたブロックを明示するために、該ブロックを囲む各矩形を着色してもよい。また、各ブロックを囲む矩形を異なる色で着色してもよい。
【0161】
図13の検索処理の説明に戻る。
【0162】
次に、検索部704は、選択された検索キーのブロックと類似した特徴量を持つブロックを特徴量データベース150から検索する。ブロック選択部703によって複数のブロックが選択された場合、検索部704は、選択された検索キーのブロックの数だけ検索処理を繰り返す。
【0163】
次に、検索結果統合部705は、検索部704から出力された検索結果を取得し、取得した検索結果を統合する。検索結果統合部705の処理の詳細については図15を用いて後述する。
【0164】
次に、検索結果表示部706は、検索結果統合部705によって作成された検索結果表示リストに含まれる画像IDを持つ画像を、クライアント計算機130のディスプレイに表示する。この場合、検索結果表示部706は、画像のみを表示してもよいし、画像中の矩形で囲まれた検索結果ブロックを表示してもよい。また、検索結果表示部706は、検索結果ブロックを矩形で囲む場合、検索結果のブロックがどの検索キーのブロックに対応するかを示すため、各検索キーのブロックに対応する検索結果のブロックを異なる色で着色してもよい。
【0165】
以下に、検索結果統合部705の処理の詳細について説明する。
【0166】
図15は、第3の実施形態の検索結果統合処理を示すフローチャートである。
【0167】
まず、検索結果統合部705は、検索結果表示リストの内容を初期化し、カウンタiを0にする(S501)。
【0168】
次に、検索結果統合部705は、選択されたL件の検索キーのうちのi番目の検索キーを用いて検索部704が取得したNi件の検索結果を取得する。さらに、検索結果統合部705は、カウンタjを0にし、i番目の検索キーに対応する検索結果リスト(検索キー別検索結果リスト)を初期化する(S502)。ここで、検索キー別検索結果表示リストとは、検索キー毎の検索結果のブロックを含む画像の画像IDとその画像に設定された類似度とが対応付けられたリストである。なお、検索キーの件数と同じL件の検索キー別検索結果リストが作成される。
【0169】
次に、検索結果統合部705は、取得したNi件の検索結果のうち、類似度がj番目のブロックを含む画像の画像IDを、特徴量データベース150の特徴量管理情報2100から取得する(S503)。この画像IDは、画像データ登録時に抽出された特徴量と合わせて特徴量データベース150の特徴量管理情報2100に格納された画像IDである。
【0170】
次に、検索結果統合部705は、取得した画像IDが検索キー別検索結果リストに含まれるか否かを判定する(S504)。ステップS504において、取得した画像IDが検索キー別検索結果リストに含まれないと判定された場合、検索結果統合部705は、検索キー別検索結果リストに、取得した画像IDとその画像IDを持つ画像に対応する類似度とを追加する(S505)。一方、ステップS504において、取得した画像IDが検索キー別検索結果リストに含まれると判定された場合、検索結果統合部705は、検索キー別検索結果リストに、取得した画像IDを追加せず、ステップS506に移る。
【0171】
次に、検索結果統合部705は、取得したNi件のすべての検索結果を処理したか否かを判定する(S506)。ステップS506において、すべての検索結果が処理されていないと判定された場合、すなわち、カウンタjが検索結果数Ni未満である場合、検索結果統合部705は、カウンタjに1を追加し(S507)、ステップS503以降の処理を繰り返す。一方、ステップS506において、すべての検索結果が処理されたと判定された場合、すなわち、カウンタjが検索結果数Ni以上である場合、検索結果統合部705は、i番目の検索キーを用いて取得されたすべての検索結果を処理したので、ステップS508に移る。
【0172】
次に、検索結果統合部705は、ブロック選択部703が選択されたL件の検索キーを用いて取得したすべての検索結果を処理したかどうかを判定する(S508)。ステップS508において、すべての検索結果を処理していないと判定された場合、すなわち、カウンタiが選択した検索キー数L未満である場合、検索結果統合部705は、カウンタiに1を追加し(S509)、ステップS502以降の処理を繰り返す。
【0173】
一方、ステップS508において、すべての検索結果を処理したと判定された場合、すなわち、カウンタiが検索キー数L以上である場合、検索結果統合部705は、すべての検索結果を処理したので、ステップS510に移る。
【0174】
検索結果統合部705は、ステップS501からS509の処理によって得られた検索キー別検索結果リストのいずれにも含まれる画像IDを検索結果表示リストに追加する(S510)。これによって、検索結果表示部706は、選択されたL件の検索キーのそれぞれに対応するすべての検索結果のブロックを含む画像を表示する。
【0175】
この場合、その画像IDを持つ画像に対応する類似度は、各検索キー別検索結果リスト毎に異なるので、検索結果統合部705は、検索結果表示リストに追加されるその画像IDの画像には、最も大きい類似度を設定する。なお、検索結果表示リストに追加されるその画像IDの画像に、類似度の平均値を設定してもよい。
【0176】
なお、ステップS510において、検索結果統合部705は、各検索キー別検索結果リストのいずれかに少なくとも一つ含まれる画像IDを検索結果表示リストに追加してもよい。この場合、検索結果表示部706は、選択されたL件の検索キーのうちのいずれか一つの検索キーに対応する検索結果を含む画像を表示する。
【0177】
なお、検索結果統合部705は、ステップS510の処理のために、各検索キーに対応する検索結果のブロックの位置関係を利用してもよい。具体的には、検索結果統合部705は、画像に含まれる各検索キーブロックの相対的な位置関係を記憶し、記憶された各検索キーブロックの相対的な位置と各検索結果のブロックの相対的な位置とを比較する。そして、それぞれの相対的な位置が一致する場合、その検索結果を含む画像の画像IDを検索結果表示リストに追加する。
【0178】
最後に、検索結果統合部705は、検索結果表示リストに含まれる画像IDを類似度の大きさに従ってソートした後、処理を終了する(S511)。
【0179】
以上説明したように、第3の実施形態の画像検索システムによると、第1及び第2の実施形態の効果に加え、複数の検索キーを用いるので、複数の特徴を持つ人物及び物体を検索することができる。
【0180】
[実施形態4]
以下に、本発明の第4の実施形態の画像検索システムについて、図面を用いて説明する。本実施形態の追跡マップ表示部904は、人物及び物体の移動順序を地図上に表示する。
【0181】
本実施形態の画像検索システムの構成及び画像データ登録処理は、それぞれ、第1又は第2の実施形態の画像検索システムの構成及び画像データ登録処理と同じである。
【0182】
図16は、第4の実施形態の検索処理を示すブロック図である。
【0183】
本実施形態の画像検索システムは、画像取得部701、画像表示部602、検索キー領域指定部901、検索部902、検索結果統合部903、追跡マップ表示部904、画像データベース710、及び特徴量データベース150によって、検索処理を実行する。なお、図1又は図8に示したCPU112は、HD114に格納された各種プログラムをメモリ113にロードし、メモリ113にロードされた各種プログラムを読み出し、読み出された各種プログラムを実行することによって、各処理部の処理を実現する。
【0184】
なお、特徴量データベース150は、図1に示した特徴量データベース150と同じである。また、画像取得部701は、図13に示した画像取得部701と同じである。画像データベース710は、図13に示した画像データベース710と同じである。画像表示部602は、図11に示した画像表示部602と同じである。
【0185】
まず、画像取得部701は、ユーザによって選択された、検索キーとなる人物又は物体が含まれた画像を取得する。
【0186】
次に、画像表示部602は、取得した画像を、クライアント計算機130のディスプレイに表示する。
【0187】
次に、検索キー領域指定部901は、ユーザによって指定された、検索キーとなる領域を取得する。ユーザは、マウスなどの入力装置を操作することによって、画像表示部602によって表示された画像のうち、検索キーとなる領域を指定する。
【0188】
図17は、第4の実施形態の検索キー領域指定時に表示される画像を示す説明図である。
【0189】
図17では、ユーザによって指定された、検索キーとなる任意の形状の領域1001が示される。
【0190】
次に、検索キー領域指定部901は、特徴量抽出部204が実行する処理と同様に、指定された領域から特徴量を抽出する。ただし、指定された領域の大きさに応じて、抽出された特徴量の値を正規化する。
【0191】
次に、検索部902は、特徴量データベース150の特徴量管理情報2100から、指定された領域の特徴量と各エントリの特徴量との間の類似度を計算し、指定された領域との類似度が大きいブロックを検索結果として取得する。ここで、検索部902は、指定された領域の特徴量と各ブロックの特徴量との間の類似度を、ユークリッド距離を用いて計算する。
【0192】
次に、検索結果統合部903は、検索結果のブロックをカメラID別にグループ化する。以下に、検索結果統合処理の詳細について説明する。
【0193】
図22は、第4の実施形態の検索結果統合処理を示すフローチャートである。
【0194】
まず、検索結果統合部903は、検索部902から出力された検索結果を取得し、カウンタiを0に初期化する(S701)。次に、検索結果統合部903は、特徴量データベース150の特徴量管理情報2100から、類似度がi番目となる検索結果のブロックを含む画像の画像IDを取得する。次に、検索結果統合部903は、画像データベース710の画像管理情報2000から、取得した画像IDに対応するカメラIDを取得する(S702)。
【0195】
その後、検索結果統合部903は、取得したカメラIDを持つグループに、i番目の検索結果のブロックを含む画像の画像IDを追加する(S703)。なお、既にその画像IDがグループに含まれている場合、その画像IDを持つ画像には複数の検索結果のブロックを含むので、その画像IDを持つ画像には、複数の検索結果のブロックの類似度のうちで最も大きい類似度を設定する。
【0196】
なお、取得したカメラIDを持つグループが存在しない場合、検索結果統合部903は、新しいグループを作成し、作成されたグループにi番目の検索結果のブロックを含む画像の画像IDを追加する。
【0197】
次に、検索結果統合部903は、カウンタiが検索結果数Nを超えているか否かを判定する(S704)。ステップS704において、カウンタiが検索結果数Nを超えていると判定された場合、検索結果統合部903は、iに1を加算し(S705)、ステップS702以降の処理を繰り返す。なお、検索結果統合部903は、あらかじめ設定された撮影時刻の範囲に含まれない検索結果を検索結果統合処理の対象から除外してもよい。
【0198】
追跡マップ表示部904は、検索結果統合部903によって作成されたカメラID毎の検索結果のブロックを含む画像(検索結果画像)を、クライアント計算機130のディスプレイに表示する。第4の実施形態では、追跡マップ表示部904は、カメラが設置されている空間の簡易地図を作成し、作成された簡易地図の周囲に検索結果のブロックを含む画像を表示する。
【0199】
図18は、第4の実施形態の検索結果の表示画面を示す説明図である。
【0200】
第4の実施形態の検索結果の表示画面は、簡易地図1101及び検索結果画像1102(又は1103)を含む。簡易地図1101の周囲に表示された検索結果画像1102は、各カメラに対応しており、カメラの設置位置(カメラの撮影範囲)と引出線によって結び付けられる。なお、カメラと検索結果画像1102との対応関係が明示されるならば、検索結果画像1102は他の方法によって表示されてもよい。また、引き出し線の先に付与された撮影番号1104は、検索結果画像1102の撮影時刻の順に付与された数字である。つまり、撮影番号1104は、検索結果として示された人物の移動順序を示す。
【0201】
図16の説明に戻る。
【0202】
追跡マップ表示部904は、例えば、HD114に格納された地図情報に基づいて、カメラが設置されている空間の簡易地図1101を作成し、その周囲に検索結果画像1102を表示する。
【0203】
また、追跡マップ表示部904は、検索結果統合部903によって作成されたカメラID別のグループに含まれる検索結果のうち、最も類似度が大きい検索結果の画像IDを持つ画像を、カメラIDに対応する検索結果画像1102として表示する。該当するグループが存在しない場合、何も表示しない。なお、追跡マップ表示部904は、所定の閾値以下の類似度である画像を表示しなくてもよい。また、同一グループに、撮影時刻が大きく異なる画像がある場合、重ねられた検索結果画像1103を表示してもよい。
【0204】
なお、画像検索システムは、重ねられた複数の検索結果画像のうち、クリックされた画像を手前に表示するためのインタフェース画面をユーザに提示してもよい。
【0205】
さらに、追跡マップ表示部904は、検索結果画像1102の引き出し線の先に撮影番号1104を付してもよい。
【0206】
以上説明したように、第4の実施形態の画像検索システムによると、第1及び第2の実施形態の効果に加え、ユーザによって指定された任意の領域、すなわち、検索人物又は物体の特徴的な部分を検索キーに設定することができるので、検索精度を向上させることができる。さらに、検索結果を時系列に沿って簡易地図に表示させるので、特定の監視対象の移動経路を追跡することができる。
【0207】
なお、第1の実施形態から第4の実施形態について説明したが、本発明の適用範囲は、それぞれの実施形態に限定されるものではない。例えば、複数の実施形態を組み合せることもできる。
【符号の説明】
【0208】
110 サーバ計算機
111 外部インタフェース
112 中央処理演算装置(CPU)
113 主記憶装置(メモリ)
114 大容量外部記憶装置(HD)
120 通信基盤
130 クライアント計算機
140 画像データベース
150 特徴量データベース
160A〜160N カメラ
201 映像入力部
202 静止画抽出部
203 ブロック分割部
204 特徴量抽出部
301 画像取得部
302 ブロック分割部
303 画像表示部
304 ブロック選択部
305 検索部
306 検索結果統合部
307 検索結果表示部
401 選択ブロック領域
410 カメラ画像データベース
420 サムネイルデータベース
501 画像入力部
502 ブロック分割部
601 画像取得部
602 画像表示部
603 検索部
701 画像取得部
702 画像表示部
703 ブロック選択部
704 検索部
705 検索結果統合部
706 検索結果表示部
710 画像データベース
901 検索結果統合部
902 検索結果表示部

【特許請求の範囲】
【請求項1】
ユーザによって指定された画像に類似する画像を検索する画像検索システムであって、
プロセッサと、前記プロセッサに接続されるメモリと、記憶装置とを備える少なくとも一以上の計算機を備え、
前記プロセッサは、
カメラによって撮影された映像、又は前記記憶装置に記憶された映像を取得し、
前記取得された映像から、単位時間当たりに所定の枚数の画像を抽出し、
前記抽出された画像を所定の大きさのブロックに分割し、
色ヒストグラムに基づいて、前記分割されたブロックの特徴量を抽出し、
前記抽出された画像の識別子と、前記抽出された画像の領域のうちで前記ブロックがどの位置にあるかを示す情報と、前記抽出されたブロックの特徴量と、の対応関係を示す第1の情報を作成し、
前記第1の情報に基づいて、前記分割されたブロックのうち、前記ユーザによって選択された少なくとも一のブロックを第1の検索キーとし、前記第1の検索キーの特徴量と他のブロックの特徴量とを比較することによって、前記第1の検索キーに類似する所定の数のブロックを検索結果として検出し、
前記検出された検索結果を含む画像を前記ユーザに表示することを特徴とする画像検索システム。
【請求項2】
前記抽出された画像の識別子と、前記抽出された画像を撮影したカメラの識別子と、前記抽出された画像の撮影時刻と、の対応関係を示す第2の情報を作成し、
前記第2の情報に基づいて、前記第1の検索キーを含む画像を撮影したカメラ及び撮影時刻を特定し、
前記特定されたカメラによって撮影された画像のうち、前記特定された撮影時刻の前後の所定の時間内に撮影された画像を取得し、
前記第1の情報に基づいて、前記第1の検索キーの特徴量と、前記取得した所定の時間内に撮影された画像に含まれるブロックの特徴量と、を比較することによって、前記第1の検索キーに類似する所定の数のブロックを第2の検索キーとして検出し、
さらに、前記検出された第2の検索キーの特徴量と前記他のブロックの特徴量とを比較することによって、前記第2の検索キーに類似する所定の数のブロックを検索結果として検出し、
前記検出された検索結果を含む画像を前記ユーザに表示することを特徴とする請求項1に記載の画像検索システム。
【請求項3】
前記抽出された画像のうち、人物が映っている第1の画像と、人物が映っていない背景のみの第2の画像との間の画素値の差を計算し、
前記計算された画素値の差に基づいて、前記第1の画像と前記第2の画像との背景差分画像を作成し、
前記作成された背景差分画像を所定の大きさのブロックに分割し、
前記分割されたブロックの前記画素値の差の合計を前景度として計算し、
前記分割されたブロックの前景度が所定の閾値を越える場合、色ヒストグラムに基づいて、そのブロックの特徴量を抽出することを特徴とする請求項1に記載の画像検索システム。
【請求項4】
前記第1の検索キーは、前記分割されたブロックのうち、前記ユーザによって選択された複数のブロックであることを特徴とする請求項1に記載の画像検索システム。
【請求項5】
前記第1の検索キーは、前記分割されたブロックの領域のうち、前記ユーザによって指定された大きさ及び形状を持つ領域であることを特徴とする請求項1に記載の画像検索システム。
【請求項6】
前記第1の検索キーの特徴量と前記他のブロックの特徴量との間の距離に基づいて、前記第1の検索キーと前記他のブロックとの間の特徴の類似を示す類似度を計算し、
前記第1の検索キーとの類似度が大きい所定の数の他のブロックを検索結果として検出し、
前記抽出された画像の識別子と、前記抽出された画像を撮影したカメラの識別子と、前記抽出された画像の撮影時刻と、の対応関係を示す第2の情報を作成し、
前記作成された第2の情報に基づいて、前記検出された検索結果を含む画像を撮影したカメラを特定し、
前記特定されたカメラの識別子に従って、前記検出された検索結果を含む画像を分類し、
前記分類された画像のうち、前記第1の検索キーと特徴量の類似度が最も大きいブロックを含む画像であって、かつ、前記類似度が所定の閾値よりも大きいブロックを含む画像を表示することを特徴とする請求項1に記載の画像検索システム。
【請求項7】
前記カメラが設置された空間の地図を作成し、
前記カメラの識別子に従って分類された画像のうち、前記第1の検索キーと特徴量の類似度が大きいブロックを含む少なくとも一の画像を取得し、
前記取得した少なくとも一の画像と前記カメラの撮影範囲との対応関係を前記作成された地図に表示し
さらに、前記第2の情報に基づいて、前記カメラの識別子に従って分類された画像の撮影時刻を特定し、
前記特定された撮影時刻によって、前記画像の撮影順序を示す情報を前記作成された地図に表示することを特徴とする請求項6に記載の画像検索システム。
【請求項8】
前記抽出された画像に映っている人物の大きさ及び位置に応じて、前記画像をいくつかの異なる大きさのブロックに分割することを特徴とする請求項1に記載の画像検索システム。
【請求項9】
ユーザによって指定された画像に類似する画像を検索する画像検索システムにおいて実行される画像検索方法であって、
画像検索システムは、プロセッサと、前記プロセッサに接続されるメモリと、記憶装置とを備える少なくとも一以上の計算機を備え、
前記画像検索方法は、
前記プロセッサが、
カメラによって撮影された映像、又は前記記憶装置に記憶された映像を取得し、
前記取得された映像から、単位時間当たりに所定の枚数の画像を抽出し、
前記抽出された画像を所定の大きさのブロックに分割し、
色ヒストグラムに基づいて、前記分割されたブロックの特徴量を抽出し、
前記抽出された画像の識別子と、前記抽出された画像の領域のうちで前記ブロックがどの位置にあるかを示す情報と、前記抽出されたブロックの特徴量と、の対応関係を示す第1の情報を作成し、
前記第1の情報に基づいて、前記分割されたブロックのうち、前記ユーザによって選択された少なくとも一のブロックを第1の検索キーとし、前記第1の検索キーの特徴量と他のブロックの特徴量とを比較することによって、前記第1の検索キーに類似する所定の数のブロックを検索結果として検出し、
前記検出された検索結果を含む画像を前記ユーザに表示することを特徴とする画像検索方法。
【請求項10】
前記プロセッサが、
前記抽出された画像の識別子と、前記抽出された画像を撮影したカメラの識別子と、前記抽出された画像の撮影時刻と、の対応関係を示す第2の情報を作成し、
前記第2の情報に基づいて、前記第1の検索キーを含む画像を撮影したカメラ及び撮影時刻を特定し、
前記特定されたカメラによって撮影された画像のうち、前記特定された撮影時刻の前後の所定の時間内に撮影された画像を取得し、
前記第1の情報に基づいて、前記第1の検索キーの特徴量と、前記取得した所定の時間内に撮影された画像に含まれるブロックの特徴量と、を比較することによって、前記第1の検索キーに類似する所定の数のブロックを第2の検索キーとして検出し、
さらに、前記検出された第2の検索キーの特徴量と前記他のブロックの特徴量とを比較することによって、前記第2の検索キーに類似する所定の数のブロックを検索結果として検出し、
前記検出された検索結果を含む画像を前記ユーザに表示することを特徴とする請求項9に記載の画像検索方法。
【請求項11】
前記プロセッサが、
前記抽出された画像のうち、人物が映っている第1の画像と、人物が映っていない背景のみの第2の画像との間の画素値の差を計算し、
前記計算された画素値の差に基づいて、前記第1の画像と前記第2の画像との背景差分画像を作成し、
前記作成された背景差分画像を所定の大きさのブロックに分割し、
前記分割されたブロックの前記画素値の差の合計を前景度として計算し、
前記分割されたブロックの前景度が所定の閾値を越える場合、色ヒストグラムに基づいて、そのブロックの特徴量を抽出することを特徴とする請求項9に記載の画像検索方法。
【請求項12】
前記第1の検索キーは、前記分割されたブロックのうち、前記ユーザによって選択された複数のブロックであることを特徴とする請求項9に記載の画像検索方法。
【請求項13】
前記第1の検索キーは、前記分割されたブロックの領域のうち、前記ユーザによって指定された大きさ及び形状を持つ領域であることを特徴とする請求項9に記載の画像検索方法。
【請求項14】
前記プロセッサが、
前記第1の検索キーの特徴量と前記他のブロックの特徴量との間の距離に基づいて、前記第1の検索キーと前記他のブロックとの間の特徴の類似を示す類似度を計算し、
前記第1の検索キーとの類似度が大きい所定の数の他のブロックを検索結果として検出し、
前記抽出された画像の識別子と、前記抽出された画像を撮影したカメラの識別子と、前記抽出された画像の撮影時刻と、の対応関係を示す第2の情報を作成し、
前記作成された第2の情報に基づいて、前記検出された検索結果を含む画像を撮影したカメラを特定し、
前記特定されたカメラの識別子に従って、前記検出された検索結果を含む画像を分類し、
前記分類された画像のうち、前記第1の検索キーと特徴量の類似度が最も大きいブロックを含む画像であって、かつ、前記類似度が所定の閾値よりも大きいブロックを含む画像を表示することを特徴とする請求項9に記載の画像検索方法。
【請求項15】
前記プロセッサが、
前記カメラが設置された空間の地図を作成し、
前記カメラの識別子に従って分類された画像のうち、前記第1の検索キーと特徴量の類似度が大きいブロックを含む少なくとも一の画像を取得し、
前記取得した少なくとも一の画像と前記カメラの撮影範囲との対応関係を前記作成された地図に表示し
さらに、前記第2の情報に基づいて、前記カメラの識別子に従って分類された画像の撮影時刻を特定し、
前記特定された撮影時刻によって、前記画像の撮影順序を示す情報を前記作成された地図に表示することを特徴とする請求項14に記載の画像検索方法。
【請求項16】
前記プロセッサが、
前記抽出された画像に映っている人物の大きさ及び位置に応じて、前記画像をいくつかの異なる大きさのブロックに分割することを特徴とする請求項9に記載の画像検索方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図4】
image rotate

【図18】
image rotate


【公開番号】特開2011−18238(P2011−18238A)
【公開日】平成23年1月27日(2011.1.27)
【国際特許分類】
【出願番号】特願2009−163095(P2009−163095)
【出願日】平成21年7月9日(2009.7.9)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】