類似画像検索システム
【課題】複数の検索キーを用いて類似画像検索を繰り返すことで網羅的な検索を行う類似画像検索システムに関し、検索回数の抑制と検索精度の向上を両立させることが可能な技術を提案する。
【解決手段】検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する複数検索キー選択部113と、複数検索キー選択部113により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する類似人物検索部218と、を備えた構成において、複数検索キー選択部113が、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、類似人物検索部218が、検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うように構成した。
【解決手段】検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する複数検索キー選択部113と、複数検索キー選択部113により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する類似人物検索部218と、を備えた構成において、複数検索キー選択部113が、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、類似人物検索部218が、検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うように構成した。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、類似画像検索システム及び類似画像検索方法に係り、特に、映像監視システムの人物の検索のためのユーザインタフェースを使い勝手のよいものにする用途に用いて好適な類似画像検索システム及び類似画像検索方法に関する。
【背景技術】
【0002】
従来から、ホテル、ビル、コンビニエンスストア、金融機関、ダムや道路といった不特定多数の人が訪れる施設には、犯罪抑止や事故防止等の目的で、映像監視システムが設置されている。これは、監視対象の人物等をカメラ等の撮像装置で撮影し、その映像を、管理事務所や警備室等の監視センタに伝送し、常駐する監視者がそれを監視し、目的や必要に応じて注意する、或いは映像を記録するものである。
【0003】
映像監視システムにおいて、映像を記録するための記録媒体には、従来のビデオテープ媒体から、HDD(Hard Disk Drive)に代表されるランダムアクセス媒体が用いられる事例が増えている。さらに近年ではこのような記録媒体の大容量化が進んでいる。
記録媒体の大容量化は、記録できる映像の量を飛躍的に増大させ、より多地点や長時間の記録を可能にしつつある反面、記録画像を目視でチェックする負担の増加が問題として顕在化しつつある。
【0004】
このような背景から、所望の映像をより簡単に見つけ出すための検索機能を備える映像監視システムが普及しつつある。特に、近年では、映像中の特定の事象(イベント)の発生に対して、画像認識技術を用いてリアルタイムに自動検知して映像と共に記録し、事後にそれらのイベントを検索可能とする、より高度な検索機能を備えたシステムが登場しつつある。その中の代表的な一つに人物検索機能がある。
人物検索機能とは、映像中への人物の登場を自動検知の対象として、リアルタイムに記録し、事後に記録画像中から人物登場画像を探し出せる機能である。
【0005】
機能面から人物検索機能は、以下の2種類に大別される。
1つ目は、登場イベント検索機能である。登場イベント検索機能は、映像中への人物の登場(イベント)の有無を、単純に探し出す機能である。検索結果にはイベントの有無に加え、イベント有と判定された場合には、そのイベント数と各イベントの発生時刻やイベントを撮影した撮像装置番号、撮影した画像(人物登場画像)等を提示する。なお、この検索のクエリ(Query)には、イベント発生時刻や撮像装置番号等の検索対象範囲を絞込むための情報として与える場合が多い。以下では、この検索対象範囲を絞込むための情報を、「絞込みパラメータ」ということにする。
【0006】
2つ目は、類似人物検索機能である。上述の登場イベント検索機能が、登場人物を特定しない検索であるのに対し、こちらはユーザが指定する特定人物が、他の時間、或いは他の地点の撮像装置で撮影されていないかどうかを、記録画像中から探し出す機能である。検索結果には、特定人物が映った他の画像の有無に加え、有の場合には、その数と撮影時刻、撮像装置番号、撮影した画像(人物登場画像)、後述の類似度等を返す。
特定人物の指定は、探したい人物が映った画像(以降、検索キー画像)をユーザが1ケ指定することで実施される。検索キー画像は、記録画像や外部装置からの任意の画像から指定される。検索は、この検索キー画像中の人物の画像特徴量を画像認識技術により抽出し、記録画像中の人物の画像特徴量と照合し、その類似性(類似度)を求め、同一人物判定を実施することにより実現される。同一人物判定では、一例として、比較する2つの画像の人物について画像特徴量の類似度を求め、その結果(類似度)が所定の基準値以上である場合に、これらの人物は同一人物であると判定する。なお、記録画像中の人物の画像特徴量の抽出と記録は、映像録画時等の別タイミングにて予め実施しておく。この検索のクエリにおいても、絞込みパラメータを与えることが可能である場合が多い。
【0007】
両検索機能のどちらにおいても、検索結果には記録画像を取り出すためのリンケージ情報が付与されており、検索結果から記録画像の頭出し再生が可能になっている。
特許文献1には、このように検索キー画像を指定して、検索結果の画像から選択して、別の表示領域に表示して、それを次の検索キー画像にするなどしてユーザの利便性を高めるようにした画像検索装置が開示されている。
また、特許文献2には、ユーザの利便性をさらに高める類似画像検索システムが開示されている。この特許文献2では、ユーザは、類似画像検索の結果に対して、人名や特徴などのキーワードを付与する。画像検索には、二種類の検索方法が用意されており、キーワードを付与された画像を検索の対象から除く類似画像検索と、キーワードを付与された画像のみを検索の対象とする登場イベント検索がある。ユーザは、類似画像検索を複数回行い、充分多くの画像にキーワードを付与した判断した後に、登場イベント検索を行う。
また、特許文献3には、類似画像検索システムを画像認識における識別器として使う場合において、単一の画像を格子状に分割して類似した画像を集約し検索回数を減らす類似画像検索システムが開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2009−123196号公報
【特許文献2】特開2011−090476号公報
【特許文献3】特開2011−107795号公報
【特許文献4】特開2009−294855号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
類似人物検索において、1枚の画像から見つからない場合でも、類似人物検索結果から再度類似人物検索すると(つまり、同じ人物でも検索キー画像を変えて検索すると)従来見つからなかった画像が見つかる場合がある。
また、類似人物検索において、動画像から検索キー画像を選択して用いる場合において、検索キー画像の前後の画像(検索キー画像と同一の人物が写った画像)を用いて検索すると従来見つからなかった画像が見つかる場合がある。
また、類似人物検索において、検索キー画像に画像処理(例えばマスク有無・サングラス有無・向き・明暗を変えるような画像処理)を加えて、新たに検索キー画像となる画像を仮想的に作成し、その画像を検索キーとして検索すると従来見つからなかった画像を見つけることができる場合がある。
上記の3つの例は組み合わせることもできる。
【0010】
このような類似人物検索方法、すなわち、最初の検索キー画像による検索結果の画像、動画像における検索キー画像(或いは検索結果の画像)の前後の画像、検索キー画像(或いは検索結果の画像)に画像処理を加えた画像といった最初の検索キー画像に関連する画像を新たな検索キー画像として用いる類似人物検索方法は、或る人物を網羅的に見つける必要がある場合などに非常に有用である。
【0011】
しかしながら、このような検索を行うと、新たな検索キー画像による検索回数が増えることによって処理時間が多くかかるという問題がある。特許文献3には、これに類する課題が挙げられているが、類似画像検索システムを識別器として用いるために、単純に1枚の画像中から類似する画像を集約するのではなく、検索結果、前後の画像、画像処理結果を考慮する必要がある。
【0012】
本発明は、このような状況に鑑みてなされたものであり、複数の検索キーを用いて類似画像検索を繰り返すことで網羅的な検索を行う類似画像検索システムに関し、検索回数の抑制と検索精度の向上を両立させることが可能な技術を提案することを目的とする。
【課題を解決するための手段】
【0013】
上記の目的を達成するために、本発明では、類似画像検索システムを以下のように構成した。
すなわち、検索キーとなる画像の特徴量に類似する特徴量を有する画像を検索する類似画像検索システムにおいて、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、前記検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた。
【0014】
そして、前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、前記検索手段は、前記検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うようにした。
【0015】
或いは、前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量の平均に最も近い画像の特徴量又は平均そのものを第1の検索キーに決定し、検索キーの候補である複数の画像の特徴量の中で第1の検索キーから最も遠い画像の特徴量を第2の検索キーに決定し、更に、検索キーの候補である複数の画像の特徴量の中でこれまでに検索キーに決定された画像の特徴量の全てから最も遠い画像の特徴量を更なる検索キーに決定することを行い、前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて検索を行うようにした。
【0016】
また、更に、前記検索手段は、ユーザにより1回目の検索キーに指定された画像の特徴量を用いて1回目の検索を行い、前記検索キー決定手段は、前記検索手段による1回目の検索結果の画像、当該検索結果の画像を含む動画における当該検索結果の画像の前後の画像、当該検索結果の画像を画像処理した結果の画像を含む複数の画像の特徴量を2回目以降の検索に用いる検索キーの候補として、2回目以降の検索に用いる複数の検索キーを決定する処理を行い、前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて2回目以降の検索を行うようにした。
【発明の効果】
【0017】
本発明によれば、複数の検索キーを用いて類似画像検索を繰り返すことで網羅的な検索を行う類似画像検索システムにおいて、検索回数の抑制と検索精度の向上を両立させることが可能になる。
【図面の簡単な説明】
【0018】
【図1】本発明の一実施形態に係る類似画像検索システムのシステム構成を例示する図である。
【図2】本発明の一実施形態に係る類似画像検索システムに用いる撮像装置のハードウェア構成を例示する図である。
【図3】本発明の一実施形態に係る類似画像検索システムに用いる録画装置のハードウェア構成を例示する図である。
【図4】本発明の一実施形態に係る類似画像検索システムに用いる端末装置のハードウェア構成を例示する図である。
【図5A】第1実施例において、最初の検索キー画像の特徴量を例示する図である。
【図5B】第1実施例において、検索結果から同一人物を選択する処理によって得られた画像の特徴量を例示する図である。
【図5C】第1実施例において、検索結果前後の同一人物を選択する処理によって得られた画像の特徴量を例示する図である。
【図5D】第1実施例において、所定の画像処理によって得られた画像の特徴量を例示する図である。
【図5E】第1実施例において、検索キー画像の候補をクラスタリングした結果と各クラスタを代表する特徴量を例示する図である。
【図5F】第2実施例において、全体平均算出処理及び遠距離点算出処理により指定された画像の特徴量を例示する図である。
【図5G】第3実施例において、クラスタ番号取得処理によって取得されたクラスタ番号を検索キー画像の候補の特徴量に付した様子を例示する図である。
【図6】第1実施例において、類似人物検索を実施する手順を例示する図である。
【図7】第2実施例において、類似人物検索を実施する手順を例示する図である。
【図8】第3実施例において、類似人物検索を実施する手順を例示する図である。
【図9】本発明の一実施形態に係る類似画像検索システムに使用可能な検索画面を例示する図である。
【発明を実施するための形態】
【0019】
以下、本発明に係る一実施形態について図面を参照して説明する。なお、各図の説明において、共通な機能を有する構成要素には同一の参照番号を付し、できるだけ説明の重複を避けるため、説明を省略するようにした。
【0020】
まず、図1〜図4を参照して、本発明の一実施形態に係る類似画像検索システムの構成について説明する。
図1には、本発明の一実施形態に係る類似画像検索システムのシステム構成を例示してある。
類似画像検索システムは、図1に示すように、ネットワーク200に、撮像装置201、録画装置102、端末装置103が接続され、互いに通信可能な状態で構成される。
【0021】
ネットワーク200は、データ通信を行う専用ネットワークやイントラネット、インターネット、無線LAN(Local Area Network)等の各装置を相互に接続して通信を行う通信手段である。
【0022】
撮像装置201は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)素子等で撮像した画像にデジタル変換処理を施し、変換結果の画像データを、ネットワーク200を介して録画装置へ出力するネットワークカメラや監視カメラ等の装置である。
【0023】
録画装置102は、ネットワーク200を介して撮像装置201より入力された画像データをHDD等の記録媒体に記録するネットワークデジタルレコーダ等の装置である。また、本装置には、本発明の方式を含む人物検索機能も搭載してある。
録画装置102は、機能構成として、画像送受信部210、画像記録部211、再生制御部212、人物領域検出部213、人物特徴量抽出部214、人物特徴量記録部215、属性情報記録部216、要求受信部217、類似人物検索部218、登場イベント検索部219、検索結果送信部220、キーワード記録部110、キーワード検索部111の各処理部を有する。
【0024】
画像送受信部210は、装置外部からの画像の入出力を行う処理部であり、撮像装置201からの入力画像データの受信、端末装置103への出力画像データの送信を行う。
画像記録部211は、入力画像データの記録媒体へ書込みや出力画像データの記録媒体からの読出しを行う。書込みの際には、画像データに加え、画像データを読出す際の情報となる画像ID(画像の識別情報)も併せて記録する。
再生制御部212は、端末装置103への映像再生を制御する。
【0025】
人物領域検出部213は、入力画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う。
人物特徴量抽出部214は、人物領域検出部213で検出した領域に対して画像認識技術を用いて特徴量算出を行う。ここで算出する人物特徴量とは、例えば、人物の輪郭の形状や方向、皮膚の色、歩容(どの脚をどのようにどんなタイミングで動かすかといった脚の捌き方)、或いは、人物を特定する代表的な部位である顔の輪郭の形状や方向、目や鼻、口といった主要構成要素の大きさ、形状、配置関係等が挙げられるが、本実施形態においては、使用する特徴量の種類や数はいずれであってもよい。
人物特徴量記録部215は、人物特徴量抽出部214で算出した特徴量の記録媒体への書込みと読出しを行う。画像記録部211における画像データの記録媒体と本処理部における人物特徴量の記録媒体とは同一であっても別個であってもよい。
属性情報記録部216は、画像データに関連する属性情報の記録媒体への書込みと読出しを行う。属性情報とは、例えば、画像の撮影時刻や撮像装置番号等である。
【0026】
要求受信部217は、端末装置103からの検索要求やキーワード付与要求の受信を行う。検索要求には、類似画像検索要求と、登場イベント検索要求がある。
類似人物検索部218は、要求受信部217にて受信した要求が類似人物検索要求であった場合に、類似画像検索を行う。
登場イベント検索部219は、要求受信部にて受信した要求が登場イベント検索要求であった場合に、登場イベント検索を行う。
検索結果送信部220は、類似人物検索部218や登場イベント検索部219から得た類似人物検索結果や登場イベント検索結果の端末装置103への送信を行う。
キーワード記録部110は、要求受信部217にて受信したキーワード付与要求に基づくキーワードの記録媒体への書込みと読出しを行う。
キーワード検索部111は、要求受信部217にて受信した検索要求データ中にキーワードが含まれていた場合に、キーワード検索を行う。
【0027】
端末装置103は、ネットワーク機能を有する一般のPC(パーソナルコンピュータ)で実現してもよいし、専用の検索端末でもよい。
端末装置103は、機能構成として、検索要求送信部221、検索結果受信部222、検索結果表示部223、再生画像表示部224、画面操作検知部225、キーワード付与要求送信部112、複数検索キー選択部113の各処理部を有する。また、本装置には、本発明の方式を実現するための人物検索機能も搭載してある。
【0028】
検索要求送信部221は、検索要求の録画装置102への送信を行う。類似人物検索の場合、検索要求データには、類似人物検索の検索キーとして、検索キー画像或いはその特徴量が含まれる。また、検索要求データには、絞込みパラメータを含めることも可能である。
検索結果受信部222は、検索結果の録画装置102からの受信を行う。検索結果として受信するデータには、録画装置102において、類似人物検索、或いは、登場イベント検索を実施して得られた画像の集合が含まれる。集合を構成する個々の画像は、録画装置102に記録された映像から画像サイズ縮小処理等を施して生成される。以下、この個々の画像を「検索結果画像」、検索結果として送受信するデータを「検索結果データ」という。
検索結果表示部223は、検索結果受信部222にて受信した検索結果の画面表示を行う。表示される画面例については後述する。
再生画像表示部224は、録画装置102から入力された画像データの画面への連続動画表示を行う。
画面操作検知部225は、ユーザによる操作内容の検知及び取得を行う。
キーワード付与要求送信部112は、キーワード付与要求の録画装置102への送信を行う。
複数検索キー選択部113は、検索キー画像の候補が複数選択されたときに、より少ない数の検索キー画像を適切に選択する処理を行う。複数検索キー選択部113は録画装置102内に設けても良い。
【0029】
図2には、本発明の一実施形態に係る類似画像検索システムに用いる撮像装置201のハードウェア構成を例示してある。
撮像装置201のハードウェア構成は、図2に示すように、撮像部241、主記憶部242、符号化部243、ネットワークインタフェース(I/F)245が、バス240で結合された形態である。
【0030】
撮像部241は、レンズで撮像した光信号をデジタルデータに変換する。符号化部243は、撮像部241が出力するデジタルデータを符号化して、JPEG(Joint Photographic Experts Group)などの画像データに変換する。主記憶部242は、撮像したデジタルデータ、符号化された画像データを記憶する。ネットワークI/F245は、ネットワーク200を介して、主記憶部242上の画像データを録画装置102に送信するためのインタフェースである。
【0031】
図3には、本発明の一実施形態に係る類似画像検索システムに用いる録画装置102のハードウェア構成を例示してある。
録画装置102のハードウェア構成は、図3に示すように、CPU(Central Processing Unit)251、主記憶部252、補助記憶部253、ネットワークI/F254が、バス250で結合された形態である。
【0032】
CPU251は、録画装置102の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部252は、DRAM(Dynamic Random Access Memory)などの半導体装置で実現され、検索のための画像データやCPU251で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部253は、HDDやフラッシュメモリなどで実現され、主記憶部252より大容量のメモリであり、画像データやプログラムを格納する。ネットワークI/F254は、ネットワーク200を介して、撮像装置201からの画像データを受信したり、端末装置103から検索キーワードを受信したり、端末装置103に画像データを送信するためのインタフェースである。
【0033】
図4には、本発明の一実施形態に係る類似画像検索システムに用いる端末装置103のハードウェア構成を例示してある。
端末装置103のハードウェア構成は、図4に示すように、CPU261、主記憶部262、補助記憶部263、表示I/F264、入出力I/F265、ネットワークI/F266が、バス260で結合された形態である。また、表示I/F264は、表示装置270と接続され、入出力I/F265は、キーボード280やマウス282などの入出力装置と接続される。
【0034】
CPU261は、端末装置103の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部262は、DRAMなどの半導体装置で実現され、表示のための画像データやCPU261で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部263は、HDDやフラッシュメモリなどで実現され、主記憶部262より大容量のメモリであり、検索キーワード、画像データやプログラムを格納する。表示I/F264は、表示装置270と接続するためのインタフェースである。入出力I/F265は、キーボード280やマウス282などの入出力装置と接続するためのインタフェースである。ネットワークI/F266は、ネットワーク200を介して、録画装置102からの画像データを受信したり、録画装置102に検索キーワードを送信するためのインタフェースである。表示装置270は、例えば、LCD(Liquid Crystal Display)などの装置であり、画像や動画をその表示部に表示する装置である。ユーザは、表示装置270の表示部に表示された画像を、キーボード280やマウス282などの入出力装置を操作して、例えばGUI(Graphical User Interface)操作することによって、端末装置103、及び、類似画像検索システムを操作する。
【0035】
次に、本発明の一実施形態に係る類似画像検索システムにおける類似人物検索の実施例について説明する。
【実施例1】
【0036】
本発明の一実施形態に係る類似画像検索システムにおける第1実施例を、 図5A〜図5G及び図6を参照して説明する。
図6には、第1実施例において、類似人物検索を実施する手順を例示してある。また、 図5A〜図5Gには、第1実施例において、類似人物検索を実施する手順に沿って、検索キー画像の候補となった画像の特徴量を例示してある。
【0037】
まず、最初のキー画像による検索処理6001では、ユーザが選択した最初の検索キー画像によって最初の検索が行われる。ここでは、最初の検索キー画像に選択された画像の特徴量(本例では、画像中の人物の特徴量)と距離が近い特徴量を有する画像を録画装置102内の類似人物検索部218を通じて検索し、その結果、例えば10件の画像が検索される。
【0038】
図5Aには、最初の検索キー画像の特徴量を「○」で示してある。ここでは、説明の分かり易さのために画像の特徴量を2次元で表現しているが、実際には、画像の特徴量は例えば数百次元といった非常に多くの次元数を持つ場合が多い。
【0039】
ここで、検索結果である10件の画像のうち3件が最初の検索キー画像と同一の対象であるとする。検索結果から同一人物を選択する処理6002では、10件の検索結果画像から目的の3件の画像を選択する。具体的には、例えば、ユーザが端末装置103のマウス282を操作して目的の画像をクリックして選択する。なお、画像の特徴量について閾値を設け、最初の検索キー画像の特徴量と検索結果画像の特徴量との距離が閾値以下なら同一の対象(同一人物)であると判断し、該当する検索結果画像を自動選択する方法としてもよい。
【0040】
図5Bには、図5Aの内容に加え、検索結果から同一人物を選択する処理6002によって選択された画像の特徴量を「△」で示してある。このような処理によって選択された画像は、新たな検索キー画像の候補となる。
【0041】
ここで、検索結果画像が動画を形成する連続的な画像のうちの1枚であるとすると、その動画における検索結果画像の前後にも同一人物の画像が含まれている場合が多い。検索結果前後の同一人物を選択する処理6003では、検索結果画像が抽出された動画における検索結果画像の前又は後の所定長の時間帯に含まれる複数の画像から、人物の位置や進行速度等に基づいて検索結果画像の人物と同一人物(すなわち、検索キー画像の人物と同一人物)と判定される画像を自動的に選択する。なお、ユーザが指定できるようにしても良い。
【0042】
図5Cには、図5Bの内容に加え、検索結果前後の同一人物を選択する処理6003によって選択された画像の特徴量を「□」で示してある。このような処理によって選択された画像は、新たな検索キー画像の候補となる。
【0043】
マスクを付加する画像処理6004では、これまでの処理で新たな検索キー画像の候補とした人物の画像に対し、画像処理で鼻や口を覆うマスクを付加した画像を生成し、新たな検索キー画像の候補に追加する処理を行う。なお、これとは逆に、画像処理前の人物の画像が鼻や口を覆うマスクをしている場合に、画像処理でマスクを外すようにする処理を行っても良い。また、マスクの画像は複数種類の画像を準備しても良い。
【0044】
サングラスや眼鏡を付加する画像処理6005では、これまでの処理で新たな検索キー画像の候補とした人物の画像に対し、画像処理でサングラスや眼鏡を付加した画像を生成し、新たな検索キー画像の候補に追加する処理を行う。なお、これとは逆に、画像処理前の人物の画像がサングラスや眼鏡をかけている場合に、画像処理でサングラスや眼鏡を外すようにする処理を行っても良い。また、サングラスや眼鏡の画像は複数種類の画像を準備しても良い。
【0045】
人物の向きを変更する画像処理6006では、これまでの処理で新たな検索キー画像の候補とした人物の画像に対し、画像処理で人物の向きを変更した画像を生成し、新たな検索キー画像の候補に追加する処理を行う。人物の向きは通常複数であるが、単純な左右反転であってもよい。
【0046】
図5Dには、図5Cの内容に加え、マスクを付加する画像処理6004、サングラスや眼鏡を付加する画像処理6005、人物の向きを変更する画像処理6006の結果生成された複数の画像の特徴量を「×」で示してある。このような処理によって生成された画像は、新たな検索キー画像の候補として追加される。
【0047】
なお、マスクを付加する画像処理6004、サングラスや眼鏡を付加する画像処理6005、人物の向きを変更する画像処理6006は、最初の検索キー画像、検索結果から同一人物を選択する処理6002の結果の画像、検索結果前後の同一人物を選択する処理6003の結果の画像のいずれを対象にして施してもよい。また、対象の画像に対していずれか1つの画像処理を施してもよく、任意の2つの画像処理を施してもよく、3つの画像処理を全て施してもよい。また、対象の画像の明暗を変える画像処理など、上記以外の画像処理を施してもよい。
【0048】
次に、クラスタリング処理6007では、これまでの処理6001〜6006により検索キー画像の候補とされた複数の画像をクラスタリングして、各クラスタを代表する画像(或いはその特徴量)を求める。クラスタリング方法としては、k−means法などの公知の技術を用いることができる。各クラスタを代表する画像としては、例えば、そのクラスタに含まれる画像の特徴量の平均に最も近い画像が用いられ、その画像の特徴量が新たな検索キーとされる。なお、クラスタに含まれる画像の特徴量の平均をそのまま新たな検索キーとしてもよい。
【0049】
図5Eには、これまでの処理6001〜6006によって得られた新たな検索キー画像の候補がクラスタリング処理6007によってクラスタに分けられた様子と、各クラスタを代表する画像の特徴量を例示してある。図5Eでは、3つのクラスタを枠線で囲って示してあり、各クラスタを代表する画像の特徴量として、各クラスタの重心に最も近い画像の特徴量P11,P12,P13がそれぞれ選択されている。
【0050】
代表する検索キーによる検索処理6008では、クラスタリング処理6007によって得られた各クラスタを代表する画像の特徴量を新たな検索キーに用いて類似画像検索を行い、結果を出力する。
ここで、図5Eの例では、最初の検索キー画像に関連する画像(処理6001〜6006により得られた画像)は29枚あるため、従来であれば、これらの画像の特徴量を新たな検索キーとした検索を29回繰り返していたところ、本実施例においては、クラスタリング処理6007によって得られた各クラスタを代表する3つの画像の特徴量を用いて類似画像検索を行うことで、特徴量のバランスをとりつつ3回の検索で済むようにしている。ここでは、クラスタの数を3としたが、これは設定によって変えることができる。
【0051】
次に、端末装置103の画面について説明する。図9には、本例の類似画像検索システムに使用可能な検索画面を例示してある。
検索画面は、再生画像表示領域3001、画像再生操作領域3003、検索キー画像指定領域3004、検索絞込パラメータ指定領域3008、検索実行領域3017、検索結果表示領域3020を有する。
【0052】
再生画像表示領域3001は、録画装置102に記録された画像を動画像として表示する領域である。また、再生画像表示領域3001の動画3002は、録画装置102に記録された画像を動画像として表示するものである。
画像再生操作領域3003は、録画装置102に記録された画像を再生操作する領域である。本領域3003を構成する各ボタンには、それぞれ固有の再生種類が割当てられている。本図においては、巻戻し、逆再生、再生停止、順再生、早送りの再生種類が左から順に割当てられている例を示している。ユーザが各ボタンをマウス282で適宜押下することにより、動画3002がボタンに割当てられた再生種類に切り替る。
【0053】
検索キー画像指定領域3004は、検索キー画像の指定と表示を行う領域である。本領域3004は、検索キー画像3005と、映像指定ボタン3006、ファイル指定ボタン3007を有する。
検索キー画像3005は、類似検索のための最初の検索キー画像とする画像である。初期状態においては、検索キー画像は、未指定であるので、画像表示はされていない状態となる。なお、未指定の場合に、別途用意した未指定状態を示す画像を表示する等、未指定である旨の表記をするようにしてもよい。
【0054】
映像指定ボタン3006は、押下時に再生画像表示領域3001に表示されている画像を、検索キー画像3005として指定するボタンである。
ファイル指定ボタン3007は、録画装置102に記録されている画像以外の画像、例えば、デジタルスチルカメラで撮影した画像やスキャナで取込んだ画像等を、検索キー画像3005として指定するボタンである。このボタン3007を押下すると、それらの画像をファイル指定するダイアログボックスが表示され、ユーザはそこで所望の画像を指定することができる。
【0055】
検索絞込パラメータ指定領域3008は、検索の際の絞込パラメータの種類とその値(範囲)を指定する領域である。本領域3008は、撮像装置指定チェックボックス3009,3010,3011,3012と、時刻指定チェックボックス3013,3014と、時刻指定欄3015,3016を有する。
【0056】
撮像装置指定チェックボックス3009,3010,3011,3012は、検索の際に検索対象とする撮像装置201を指定するチェックボックスである。本チェックボックス3009,3010,3011,3012は、押下すると選ばれたことを示すチェックマークがそれぞれ表示される。このマークは再押下すると非表示となり、押下で表示・非表示を繰り返す。
初期状態においては、全ての撮像装置201(カメラ1〜4)を検索対象とするため、撮像装置指定チェックボックス3009,3010,3011,3012は全て選択状態となる。
【0057】
時刻指定チェックボックス3013,3014は、検索の際に検索対象とする時刻範囲を指定するチェックボックスである。表示の態様については本チェックボックスも他のチェックボックスと同様である。時刻指定チェックボックス3013を選択状態にした場合には時刻範囲に先頭時刻を与える。非選択状態にした場合には、時刻範囲に先頭時刻を与えない、すなわち、録画装置102に記録された最も古い時刻の画像までを検索対象範囲とすることを意味する。
同様に時刻指定チェックボックス3014を選択状態にした場合には時刻範囲に末尾時刻を与える。非選択状態にした場合には、時刻範囲に末尾時刻を与えない、すなわち、録画装置102に記録された最も新しい時刻の画像までを検索対象範囲とすることを意味する。
時刻指定欄3015,3016は、上述の先頭時刻と末尾時刻の値を指定する入力欄である。
初期状態においては、全時間帯を検索対象とするため、時刻指定チェックボックス3013,3014は全て非選択状態、時刻指定欄3015,3016は空欄とする。
【0058】
検索実行領域3017は、検索実行を指示する領域である。本領域3017は、類似人物検索ボタン3018、登場イベント検索ボタン3019に加え、検索結果からの類似人物検索ボタン3300、同一シーンチェックボックス3201、マスクチェックボックス3202、サングラスチェックボックス3203、異なる角度チェックボックス3204を有する。
【0059】
類似人物検索ボタン3018は、検索キー画像3005による類似人物検索(最初のキー画像による検索処理6001)の実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って類似人物検索の実行を指示する。
登場イベント検索ボタン3019は、登場イベント検索の実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って登場イベント検索の実行を指示する。
【0060】
検索結果表示領域3020は、検索結果を表示する領域である。検索結果の表示は、検索結果画像を一覧表示することにより実施する。初期状態においては、検索結果表示領域3020には何も表示されない。
【0061】
ここで、ユーザが、映像指定ボタン3006を押下し、また、撮像装置指定チェックボックス3009,3010,3012を押下し、更に、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015,3016にそれぞれ「2009/6/26 15:30:20」,「2009/7/13 12:30:20」と入力したとする。
これにより、図9に示すように、検索キー画像3005には、動画3002に表示された人物「Aさん」の画像が検索キー画像として指定され、また、検索対象としたい撮像装置201として「カメラ1」、「カメラ2」、「カメラ4」の3つが指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」が指定される。
【0062】
その後、ユーザが、類似人物検索ボタン3018を押下したとする。すると、検索結果表示領域3020には、検索キー画像3005を用いて類似人物検索を実行して得られた検索結果が表示される。図9は、この状態における検索画面の一例を示したものである。検索結果の表示は、検索結果画像(本例では、検索結果画像3031〜3141)を一覧表示することにより実施する。
検索結果画像3031〜3141は、例えば、最上段左から右へ、次に2段目左から右へと検索キー画像3005に対する類似度順に表示する。この表示例においては、検索結果画像3031が検索キー画像3005に対し最も類似度が高く、検索結果画像3141が最も類似度が低いということを示している。
【0063】
この図に示された例の表記において、検索結果表示領域3020内の検索結果画像3031〜3141上に図示した円とアルファベットは、人物の顔と人物名称を簡略表示したものであり、例えば、検索結果画像3031には、人物「Aさん」が登場することを示している。この簡略表示している部分には、もちろん、実際のシステムでの表示では実画像が表示される。
検索結果画像3031の周辺には、頭出し再生ボタン3032、検索キー画像指定ボタン3033、検索対象チェックボックス3301を備える。他の検索結果画像3041〜3141も同様である。
【0064】
頭出し再生ボタン3032は、検索結果画像3031を先頭とした連続動画再生開始を指示するボタンである。例えば、頭出し再生ボタン3032を押下すると動画3002が検索結果画像3031に切り替り、その検索結果画像3031を先頭として始まる動画をユーザは、視聴することができる。
検索キー画像指定ボタン3033は、検索結果画像3031を新たな検索キー画像に指定するボタンである。例えば、検索キー画像指定ボタン3033を押下すると、検索結果画像3031が検索キー画像3005に表示される。これにより、検索結果画像3031を使って再検索を実施することができる。
【0065】
検索対象チェックボックス3301は、検索結果からの類似人物検索ボタン3300を押下した場合に新たな検索キー画像(或いはその候補)として検索結果画像3031を指定するチェックボックスである。例えば、検索結果に出てきた「Aさん」の画像(本例では、検索結果画像2031〜3061,3081,3091,3121,3141)を全てチェックして、検索結果からの類似人物検索ボタン3300を押すことで、様々なパターンの「Aさん」を検索することが可能である。
【0066】
検索結果からの類似人物検索ボタン3300は、検索キー画像3005による類似人物検索の結果に基づく再度の類似人物検索(代表する検索キーによる検索処理6008)の実行を指示するボタンである。再度の類似人物検索では、検索結果表示領域3020の表示(最初のキー画像による検索処理6001の結果)の中からユーザに選択された(検索対象チェックボックスがチェックされた)画像を新たな検索キー画像(或いはその候補)として類似人物検索を再実行する。
【0067】
同一シーンチェックボックス3201は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にして検索結果前後の同一人物を選択する処理6003を実行し、その結果の画像(対象の画像中の人物と同一人物を映した前後の画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
マスクチェックボックス3202は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にしてマスクを付加する画像処理6004を実行し、その結果の画像(対象の画像中の人物にマスクを付加した画像或いは当該人物からマスクを外した画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
サングラスチェックボックス3203は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にしてサングラスや眼鏡を付加する画像処理6005を実行し、その結果の画像(対象の画像中の人物にサングラス等を付加した画像或いは当該人物からサングラス等を外した画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
異なる角度チェックボックス3204は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にして人物の向きを変更する画像処理6006を実行し、その結果の画像(対象の画像中の人物の向きを変更した画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
【0068】
これらのチェックボックス3201〜3204の1以上がチェックされた状態で検索結果からの類似人物検索ボタン3300が押下された場合には、検索結果表示領域3020の表示の中からユーザに選択された各々の画像を対象にして、チェックされた状態のチェックボックスに対応する画像処理を実行し、その結果生成された画像を新たな検索キー画像の候補を追加し、その後、新たな検索キー画像の候補に対してクラスタリング処理6007を実行して各クラスタを代表する検索キー画像を求め、各クラスタを代表する画像の特徴量を検索キーとして用いて類似画像検索を実行する。
【0069】
以上のように、第1実施例では、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた構成において、検索キー決定手段が、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、検索手段が、検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うように構成した。
なお、本例では、端末装置103の複数検索キー選択部113の機能により検索キー決定手段を実現し、録画装置102の類似人物検索部218の機能により検索手段を実現しているが、他の態様により検索キー決定手段及び検索手段を実現しても構わない。
【実施例2】
【0070】
本発明の一実施形態に係る類似画像検索システムにおける第2実施例を、 図5F及び図7を参照して説明する。なお、第1実施例と同様の部分は説明を省略する。
図7には、第2実施例において、類似人物検索を実施する手順を例示してある。
図7の処理6001〜6006は、図6の処理6001〜6006と同一であるので説明を省略する。
【0071】
全体平均算出処理7001では、これまでの処理6001〜6006により新たな検索キー画像の候補とされた複数の画像の全てを対象にして画像の特徴量の平均を算出し、平均に最も近い検索キー画像の候補を第1の検索キー画像に指定し、その画像の特徴量が新たな第1の検索キーとする。なお、新たな検索キー画像の候補となった全ての画像の特徴量の平均をそのまま第1の検索キーとしてもよい。
遠距離点算出処理7002では、新たな検索キー画像の候補のうち、第1の検索キー画像から特徴量が最も遠い画像を第2の検索キー画像に指定し、その画像の特徴量が新たな第2の検索キーとする。更に、新たな検索キー画像の候補のうち、第1の検索キーと第2の検索キーの両方から特徴量が最も遠い画像を第3の検索キー画像に指定し、その画像の特徴量を新たな第3の検索キーとする。また、同様にして、これまでに指定された全ての新たな検索キーから最も遠い画像を第4以降の新たな検索キー画像に指定し、その画像の特徴量を第4以降の新たな検索キーとすることを繰り返しても良い。
【0072】
図5Fには、これまでの処理6001〜6006によって得られた新たな検索キー画像の候補に基づいて、全体平均算出処理7001により第1の検索キーとされた画像の特徴量P21(本例では、新たな検索キー画像の候補となった全ての画像の特徴量の平均)と、遠距離点算出処理7002により第2の検索キーとされた画像の特徴量P22及び第3の検索キーとされた画像の特徴量P23が示されている。
【0073】
代表する検索キーによる検索処理6008では、全体平均算出処理7001及び遠距離点算出処理7002によって得られた新たな検索キー(本例では、第1〜第3の検索キー)の特徴量を用いて類似画像検索を行い、結果を出力する。
ここで、図5Fの例では、最初の検索キー画像に関連する画像(処理6001〜6006により得られた画像)は29枚あるため、従来であれば、これらの画像の特徴量を新たな検索キーとした検索を29回繰り返していたところ、本実施例においては、全体平均算出処理7001及び遠距離点算出処理7002によって得られた3つの画像の特徴量を用いて類似画像検索を行うことで、特徴量のバランスをとりつつ3回の検索で済むようにしている。
【0074】
以上のように、第2実施例では、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた構成において、検索キー決定手段が、検索キーの候補である複数の画像の特徴量の平均に最も近い画像の特徴量又は平均そのものを第1の検索キーに決定し、検索キーの候補である複数の画像の特徴量の中で第1の検索キーから最も遠い画像の特徴量を第2の検索キーに決定し、更に、検索キーの候補である複数の画像の特徴量の中でこれまでに検索キーに決定された画像の特徴量の全てから最も遠い画像の特徴量を更なる検索キーに決定することを行い、検索手段が、検索キー決定手段により決定された複数の検索キーをそれぞれ用いて検索を行うように構成した。
なお、本例では、端末装置103の複数検索キー選択部113の機能により検索キー決定手段を実現し、録画装置102の類似人物検索部218の機能により検索手段を実現しているが、他の態様により検索キー決定手段及び検索手段を実現しても構わない。
【実施例3】
【0075】
本発明の一実施形態に係る類似画像検索システムにおける第3実施例を、 図5G及び図8を参照して説明する。なお、第1実施例と同様の部分は説明を省略する。また、録画装置102の人物特徴量記録部215では、例えば特許文献4に示すようなクラスタリング処理が行われ、各クラスタにはクラスタ番号が付与されているものとする。
図8には、第3実施例において、類似人物検索を実施する手順を例示してある。
図8の処理6001〜6006は、図6の処理6001〜6006と同一であるので説明を省略する。
【0076】
クラスタ番号取得処理8001では、これまでの処理6001〜6006により新たな検索キー画像の候補とされた複数の画像をクラスタリングして、各画像にその画像が属するクラスタを識別するクラスタ番号を付与し、新たな検索キー画像の候補とされた各画像についてクラスタ番号を取得する。なお、録画装置102の人物特徴量記録部215に画像の特徴量と共にその画像のクラスタ番号を記録しておき、録画装置102の人物特徴量記録部215から新たな検索キー画像の候補とされた画像のクラスタ番号を取得する通信を行うようにしてもよく、この場合には、最初のキー画像による検索処理6001を実行する際にクラスタ番号を取得する通信を行ってもよい。
【0077】
次に、クラスタ番号を考慮した検索キー選択処理8002では、最初のキー画像による検索処理6001における検索キー画像とクラスタ番号が同一の候補を除外し、それ以外の候補の中から、クラスタ番号が重ならないように、つまりクラスタ番号が同一のものが複数ある場合はうち1つを検索キー画像とするように、検索キー画像を選択する。
【0078】
図5Gには、これまでの処理6001〜6006によって得られた新たな検索キー画像の候補に、クラスタ番号取得処理8001によって取得されたクラスタ番号を付した例が示されている。クラスタ番号を考慮した検索キー選択処理8002では、クラスタ番号#11については既に最初の検索キー画像として使用済みであるので検索キー画像としては選択されず、クラスタ番号#12については新たな検索キー画像の候補が1つしかない(同じクラスタ番号のものが他にない)ので新たな検索キー画像として選択され、クラスタ番号#23については新たな検索キー画像の候補が複数あるのでそのうち1つが新たな検索キー画像として選択され、クラスタ番号#31についても新たな検索キー画像の候補が複数あるのでそのうち1つが新たな検索キー画像として選択される。
【0079】
代表する検索キーによる検索処理6008では、クラスタ番号取得処理8001及びクラスタ番号を考慮した検索キー選択処理8002によって得られた検索キー画像の特徴量を新たな検索キーに用いて類似画像検索を行い、結果を出力する。
ここで、図5Gの例では、最初の検索キー画像に関連する画像(処理6001〜6006により得られた画像)は9枚あるため、従来であれば、これらの画像の特徴量を新たな検索キーとした検索を9回繰り返していたところ、本実施例においては、クラスタ番号取得処理8001及びクラスタ番号を考慮した検索キー選択処理8002によって得られた3つの画像の特徴量を用いて類似画像検索を行うことで、特徴量のバランスをとりつつ3回の検索で済むようにしている。
【0080】
以上のように、第3実施例では、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた構成において、検索キー決定手段が、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、検索手段が、検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うように構成した。更に、検索キー決定手段は、ユーザにより1回目の検索キーに指定された画像の特徴量を用いて検索手段により行われた1回目の検索結果の画像及びこれに関連する画像(検索結果の画像を含む動画における検索結果の画像の前後の画像や、検索結果の画像を画像処理した結果の画像など)の特徴量を2回目以降の検索に用いる検索キーの候補として、2回目以降の検索に用いる複数の検索キーを決定する処理を行うものであり、その際に、1回目の検索キーの画像の特徴量が属するクラスタ以外の各クラスタについて、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定するように構成した。
なお、本例では、端末装置103の複数検索キー選択部113の機能により検索キー決定手段を実現し、録画装置102の類似人物検索部218の機能により検索手段を実現しているが、他の態様により検索キー決定手段及び検索手段を実現しても構わない。
【0081】
これまで第1実施例〜第3実施例を用いて説明したように、本発明に係る類似画像検索システムでは、検索キーの候補となった複数の画像の特徴量の分布を特徴付ける代表的な特徴量を検索キーに決定することで、複数の検索キーを用いた類似画像検索における検索回数の抑制と検索精度の向上を両立させるようにした。
【0082】
ここで、本例においては、人物検索に関わる人物検出処理や人物特徴量抽出処理等を録画装置102上で実施する構成で説明したが、ネットワークで接続された録画装置102とは別個の装置にて実施するようにしてもよい。
また、本例においては、人物検索を対象に示したが、本発明は人物だけでなく一般的な画像検索にも適用することができる。
また、撮像装置201、録画装置102、端末装置103の各装置は1台に限られず、それぞれ複数台を用いる構成としてもよい。
【0083】
なお、本発明に係る類似画像検索システムは、以下のような発明として把握することもできる。
すなわち、第1の発明例として、撮像した画像の画像データを記憶し、前記画像の特徴量を抽出して、画像間の類似度を評価し、検索キーの画像を指定して、その画像との類似度が高い画像を複数検索する類似画像検索システムであって、同一の対象(例えば人物)を指す複数の画像を検索キーとして複数回検索を行う類似画像検索システムにおいて、同一の対象を指す複数の画像のうち画像の類似性が高い複数の画像の特徴をまとめた1つの検索キーを得ることで、検索回数を減らすことを特徴とする。
【0084】
また、第2の発明例として、撮像した画像の画像データを記憶し、前記画像の特徴量を抽出して、画像間の類似度を評価し、検索キーの画像を指定して、その画像との類似度が高い画像を複数検索する類似画像検索システムであって、同一の対象(例えば人物)を指す複数の画像を検索キーとして複数回検索を行う類似画像検索システムにおいて、同一の対象を指す複数の画像の特徴の平均を第1の検索キーとし、同一の対象を指す複数の画像の中で第1の検索キーから最も特徴が離れた画像の特徴を第2の検索キーとし、更に、第1の検索キーと第2の検索キーの両方から最も特徴が離れた画像の特徴を第3の検索キーとし、以後、第3以降の検索キーも同様に決めることで、検索回数を減らすことを特徴とする。
【0085】
なお、第1又は第2の発明例における同一の対象を指す複数の画像としては、種々の画像を用いることができる。
例えば、直前に実施された検索により得られた検索結果の画像が用いられる。
例えば、検索キーの画像が複数枚の画像で成り立つ動画における1枚の画像である場合において、検索キーの画像が含まれる動画における検索キーの画像より時間的に前又は後の複数枚の画像が用いられる。
例えば、検索キーの画像を画像処理した結果の画像が用いられる。
また、これらの画像例の2つの組み合わせを適用して得られる画像や、全て(3つ)の組み合わせを適用して得られる画像を用いてもよい。
また、検索回数を減らす度合いや、同一の対象を指す複数の画像として上述した3つの画像例のどれ(或いはどの組み合わせ)を使用するかは、検索の都度任意に変更可能にしてもよい。
【0086】
また、同一の対象を指す複数の画像として検索キーの画像を画像処理した結果の画像を用いる場合において、検索キーの画像に対する画像処理としては、種々の画像処理を用いることができる。
例えば、検索キーの画像が人物を映した画像である場合において、画像中の人物が鼻や口を覆うマスクをしていない場合にマスクを付加する画像処理、或いは、画像中の人物が鼻や口を覆うマスクをしている場合にマスクを除去する画像処理を行う。
例えば、検索キーの画像が人物を映した画像である場合において、画像中の人物が眼鏡やサングラスをかけていない場合に眼鏡やサングラスを付加する画像処理、或いは、画像中の人物が眼鏡やサングラスをかけている場合に眼鏡やサングラスを除去する画像処理を行う。
例えば、検索キーの画像の角度を変える画像処理を行う。一例として、検索キーの画像が人物を映した画像である場合において、画像中の人物の向きを変える画像処理を行う。
例えば、検索キーの画像の明暗を変える画像処理を行う。
【0087】
ここで、本発明に係るシステムや装置などの構成としては、必ずしも以上に示したものに限られず、種々な構成が用いられてもよい。また、本発明は、例えば、本発明に係る処理を実行する方法或いは方式や、このような方法や方式を実現するためのプログラムや当該プログラムを記録する記録媒体などとして提供することも可能であり、また、種々なシステムや装置として提供することも可能である。
また、本発明の適用分野としては、必ずしも以上に示したものに限られず、本発明は、種々な分野に適用することが可能なものである。
また、本発明に係るシステムや装置などにおいて行われる各種の処理としては、例えばプロセッサやメモリ等を備えたハードウェア資源においてプロセッサがROM(Read Only Memory)に格納された制御プログラムを実行することにより制御される構成が用いられてもよく、また、例えば当該処理を実行するための各機能手段が独立したハードウェア回路として構成されてもよい。
また、本発明は上記の制御プログラムを格納したフロッピー(登録商標)ディスクやCD(Compact Disc)−ROM等のコンピュータにより読み取り可能な記録媒体や当該プログラム(自体)として把握することもでき、当該制御プログラムを当該記録媒体からコンピュータに入力してプロセッサに実行させることにより、本発明に係る処理を遂行させることができる。
【符号の説明】
【0088】
102:録画装置、 103:端末装置、 110:キーワード記録部、 111:キーワード検索部、 112:キーワード付与要求送信部、 113:複数検索キー選択部、 200:ネットワーク、 201:撮像装置、 210:画像送受信部、 211:画像記録部、 212:再生制御部、 213:人物領域検出部、 214:人物特徴量抽出部、 215:人物特徴量記録部、 216:属性情報記録部、 217:要求受信部、 218:登場人物検索部、 219:登場イベント検索部、 220:検索結果送信部、 240:バス、 241:撮像部、 242:主記憶部、 243:符号化部、 244:ネットワークI/F、 250:バス、 251:CPU、 252:主記憶部、 253:補助記憶部、 254:ネットワークI/F、 260:バス、 261:CPU、 262:主記憶部、 263:補助記憶部、 264:表示I/F、 266:ネットワークI/F、 270:表示装置、 280:キーボード、 282:マウス、 3001:再生画像表示領域、 3002:動画、 3003:画像再生操作領域、 3004:検索キー画像指定領域、 3005:検索キー画像、 3006:映像指定ボタン、 3007:ファイル指定ボタン、 3008:検索絞込パラメータ指定領域、 3009〜3012:撮像装置指定チェックボックス、 3013,3014:時刻指定チェックボックス、 3015,3016:時刻指定欄、 3017:検索実行領域、 3018:類似人物検索ボタン、 3019:登場イベント検索ボタン、 3020:検索結果表示領域、 3031,3041,3051,3061,3071,3081,3091,3101,3111,3121,3131,3141:検索結果画像、 3032:頭出し再生ボタン、 3033:検索キー画像指定ボタン、 3201:同一シーンチェックボックス、 3202:マスクチェックボックス、 3203:サングラスチェックボックス、 3204:異なる角度チェックボックス、 3300:検索結果からの類似人物検索ボタン、 3301:検索対象チェックボックス
【技術分野】
【0001】
本発明は、類似画像検索システム及び類似画像検索方法に係り、特に、映像監視システムの人物の検索のためのユーザインタフェースを使い勝手のよいものにする用途に用いて好適な類似画像検索システム及び類似画像検索方法に関する。
【背景技術】
【0002】
従来から、ホテル、ビル、コンビニエンスストア、金融機関、ダムや道路といった不特定多数の人が訪れる施設には、犯罪抑止や事故防止等の目的で、映像監視システムが設置されている。これは、監視対象の人物等をカメラ等の撮像装置で撮影し、その映像を、管理事務所や警備室等の監視センタに伝送し、常駐する監視者がそれを監視し、目的や必要に応じて注意する、或いは映像を記録するものである。
【0003】
映像監視システムにおいて、映像を記録するための記録媒体には、従来のビデオテープ媒体から、HDD(Hard Disk Drive)に代表されるランダムアクセス媒体が用いられる事例が増えている。さらに近年ではこのような記録媒体の大容量化が進んでいる。
記録媒体の大容量化は、記録できる映像の量を飛躍的に増大させ、より多地点や長時間の記録を可能にしつつある反面、記録画像を目視でチェックする負担の増加が問題として顕在化しつつある。
【0004】
このような背景から、所望の映像をより簡単に見つけ出すための検索機能を備える映像監視システムが普及しつつある。特に、近年では、映像中の特定の事象(イベント)の発生に対して、画像認識技術を用いてリアルタイムに自動検知して映像と共に記録し、事後にそれらのイベントを検索可能とする、より高度な検索機能を備えたシステムが登場しつつある。その中の代表的な一つに人物検索機能がある。
人物検索機能とは、映像中への人物の登場を自動検知の対象として、リアルタイムに記録し、事後に記録画像中から人物登場画像を探し出せる機能である。
【0005】
機能面から人物検索機能は、以下の2種類に大別される。
1つ目は、登場イベント検索機能である。登場イベント検索機能は、映像中への人物の登場(イベント)の有無を、単純に探し出す機能である。検索結果にはイベントの有無に加え、イベント有と判定された場合には、そのイベント数と各イベントの発生時刻やイベントを撮影した撮像装置番号、撮影した画像(人物登場画像)等を提示する。なお、この検索のクエリ(Query)には、イベント発生時刻や撮像装置番号等の検索対象範囲を絞込むための情報として与える場合が多い。以下では、この検索対象範囲を絞込むための情報を、「絞込みパラメータ」ということにする。
【0006】
2つ目は、類似人物検索機能である。上述の登場イベント検索機能が、登場人物を特定しない検索であるのに対し、こちらはユーザが指定する特定人物が、他の時間、或いは他の地点の撮像装置で撮影されていないかどうかを、記録画像中から探し出す機能である。検索結果には、特定人物が映った他の画像の有無に加え、有の場合には、その数と撮影時刻、撮像装置番号、撮影した画像(人物登場画像)、後述の類似度等を返す。
特定人物の指定は、探したい人物が映った画像(以降、検索キー画像)をユーザが1ケ指定することで実施される。検索キー画像は、記録画像や外部装置からの任意の画像から指定される。検索は、この検索キー画像中の人物の画像特徴量を画像認識技術により抽出し、記録画像中の人物の画像特徴量と照合し、その類似性(類似度)を求め、同一人物判定を実施することにより実現される。同一人物判定では、一例として、比較する2つの画像の人物について画像特徴量の類似度を求め、その結果(類似度)が所定の基準値以上である場合に、これらの人物は同一人物であると判定する。なお、記録画像中の人物の画像特徴量の抽出と記録は、映像録画時等の別タイミングにて予め実施しておく。この検索のクエリにおいても、絞込みパラメータを与えることが可能である場合が多い。
【0007】
両検索機能のどちらにおいても、検索結果には記録画像を取り出すためのリンケージ情報が付与されており、検索結果から記録画像の頭出し再生が可能になっている。
特許文献1には、このように検索キー画像を指定して、検索結果の画像から選択して、別の表示領域に表示して、それを次の検索キー画像にするなどしてユーザの利便性を高めるようにした画像検索装置が開示されている。
また、特許文献2には、ユーザの利便性をさらに高める類似画像検索システムが開示されている。この特許文献2では、ユーザは、類似画像検索の結果に対して、人名や特徴などのキーワードを付与する。画像検索には、二種類の検索方法が用意されており、キーワードを付与された画像を検索の対象から除く類似画像検索と、キーワードを付与された画像のみを検索の対象とする登場イベント検索がある。ユーザは、類似画像検索を複数回行い、充分多くの画像にキーワードを付与した判断した後に、登場イベント検索を行う。
また、特許文献3には、類似画像検索システムを画像認識における識別器として使う場合において、単一の画像を格子状に分割して類似した画像を集約し検索回数を減らす類似画像検索システムが開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2009−123196号公報
【特許文献2】特開2011−090476号公報
【特許文献3】特開2011−107795号公報
【特許文献4】特開2009−294855号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
類似人物検索において、1枚の画像から見つからない場合でも、類似人物検索結果から再度類似人物検索すると(つまり、同じ人物でも検索キー画像を変えて検索すると)従来見つからなかった画像が見つかる場合がある。
また、類似人物検索において、動画像から検索キー画像を選択して用いる場合において、検索キー画像の前後の画像(検索キー画像と同一の人物が写った画像)を用いて検索すると従来見つからなかった画像が見つかる場合がある。
また、類似人物検索において、検索キー画像に画像処理(例えばマスク有無・サングラス有無・向き・明暗を変えるような画像処理)を加えて、新たに検索キー画像となる画像を仮想的に作成し、その画像を検索キーとして検索すると従来見つからなかった画像を見つけることができる場合がある。
上記の3つの例は組み合わせることもできる。
【0010】
このような類似人物検索方法、すなわち、最初の検索キー画像による検索結果の画像、動画像における検索キー画像(或いは検索結果の画像)の前後の画像、検索キー画像(或いは検索結果の画像)に画像処理を加えた画像といった最初の検索キー画像に関連する画像を新たな検索キー画像として用いる類似人物検索方法は、或る人物を網羅的に見つける必要がある場合などに非常に有用である。
【0011】
しかしながら、このような検索を行うと、新たな検索キー画像による検索回数が増えることによって処理時間が多くかかるという問題がある。特許文献3には、これに類する課題が挙げられているが、類似画像検索システムを識別器として用いるために、単純に1枚の画像中から類似する画像を集約するのではなく、検索結果、前後の画像、画像処理結果を考慮する必要がある。
【0012】
本発明は、このような状況に鑑みてなされたものであり、複数の検索キーを用いて類似画像検索を繰り返すことで網羅的な検索を行う類似画像検索システムに関し、検索回数の抑制と検索精度の向上を両立させることが可能な技術を提案することを目的とする。
【課題を解決するための手段】
【0013】
上記の目的を達成するために、本発明では、類似画像検索システムを以下のように構成した。
すなわち、検索キーとなる画像の特徴量に類似する特徴量を有する画像を検索する類似画像検索システムにおいて、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、前記検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた。
【0014】
そして、前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、前記検索手段は、前記検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うようにした。
【0015】
或いは、前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量の平均に最も近い画像の特徴量又は平均そのものを第1の検索キーに決定し、検索キーの候補である複数の画像の特徴量の中で第1の検索キーから最も遠い画像の特徴量を第2の検索キーに決定し、更に、検索キーの候補である複数の画像の特徴量の中でこれまでに検索キーに決定された画像の特徴量の全てから最も遠い画像の特徴量を更なる検索キーに決定することを行い、前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて検索を行うようにした。
【0016】
また、更に、前記検索手段は、ユーザにより1回目の検索キーに指定された画像の特徴量を用いて1回目の検索を行い、前記検索キー決定手段は、前記検索手段による1回目の検索結果の画像、当該検索結果の画像を含む動画における当該検索結果の画像の前後の画像、当該検索結果の画像を画像処理した結果の画像を含む複数の画像の特徴量を2回目以降の検索に用いる検索キーの候補として、2回目以降の検索に用いる複数の検索キーを決定する処理を行い、前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて2回目以降の検索を行うようにした。
【発明の効果】
【0017】
本発明によれば、複数の検索キーを用いて類似画像検索を繰り返すことで網羅的な検索を行う類似画像検索システムにおいて、検索回数の抑制と検索精度の向上を両立させることが可能になる。
【図面の簡単な説明】
【0018】
【図1】本発明の一実施形態に係る類似画像検索システムのシステム構成を例示する図である。
【図2】本発明の一実施形態に係る類似画像検索システムに用いる撮像装置のハードウェア構成を例示する図である。
【図3】本発明の一実施形態に係る類似画像検索システムに用いる録画装置のハードウェア構成を例示する図である。
【図4】本発明の一実施形態に係る類似画像検索システムに用いる端末装置のハードウェア構成を例示する図である。
【図5A】第1実施例において、最初の検索キー画像の特徴量を例示する図である。
【図5B】第1実施例において、検索結果から同一人物を選択する処理によって得られた画像の特徴量を例示する図である。
【図5C】第1実施例において、検索結果前後の同一人物を選択する処理によって得られた画像の特徴量を例示する図である。
【図5D】第1実施例において、所定の画像処理によって得られた画像の特徴量を例示する図である。
【図5E】第1実施例において、検索キー画像の候補をクラスタリングした結果と各クラスタを代表する特徴量を例示する図である。
【図5F】第2実施例において、全体平均算出処理及び遠距離点算出処理により指定された画像の特徴量を例示する図である。
【図5G】第3実施例において、クラスタ番号取得処理によって取得されたクラスタ番号を検索キー画像の候補の特徴量に付した様子を例示する図である。
【図6】第1実施例において、類似人物検索を実施する手順を例示する図である。
【図7】第2実施例において、類似人物検索を実施する手順を例示する図である。
【図8】第3実施例において、類似人物検索を実施する手順を例示する図である。
【図9】本発明の一実施形態に係る類似画像検索システムに使用可能な検索画面を例示する図である。
【発明を実施するための形態】
【0019】
以下、本発明に係る一実施形態について図面を参照して説明する。なお、各図の説明において、共通な機能を有する構成要素には同一の参照番号を付し、できるだけ説明の重複を避けるため、説明を省略するようにした。
【0020】
まず、図1〜図4を参照して、本発明の一実施形態に係る類似画像検索システムの構成について説明する。
図1には、本発明の一実施形態に係る類似画像検索システムのシステム構成を例示してある。
類似画像検索システムは、図1に示すように、ネットワーク200に、撮像装置201、録画装置102、端末装置103が接続され、互いに通信可能な状態で構成される。
【0021】
ネットワーク200は、データ通信を行う専用ネットワークやイントラネット、インターネット、無線LAN(Local Area Network)等の各装置を相互に接続して通信を行う通信手段である。
【0022】
撮像装置201は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)素子等で撮像した画像にデジタル変換処理を施し、変換結果の画像データを、ネットワーク200を介して録画装置へ出力するネットワークカメラや監視カメラ等の装置である。
【0023】
録画装置102は、ネットワーク200を介して撮像装置201より入力された画像データをHDD等の記録媒体に記録するネットワークデジタルレコーダ等の装置である。また、本装置には、本発明の方式を含む人物検索機能も搭載してある。
録画装置102は、機能構成として、画像送受信部210、画像記録部211、再生制御部212、人物領域検出部213、人物特徴量抽出部214、人物特徴量記録部215、属性情報記録部216、要求受信部217、類似人物検索部218、登場イベント検索部219、検索結果送信部220、キーワード記録部110、キーワード検索部111の各処理部を有する。
【0024】
画像送受信部210は、装置外部からの画像の入出力を行う処理部であり、撮像装置201からの入力画像データの受信、端末装置103への出力画像データの送信を行う。
画像記録部211は、入力画像データの記録媒体へ書込みや出力画像データの記録媒体からの読出しを行う。書込みの際には、画像データに加え、画像データを読出す際の情報となる画像ID(画像の識別情報)も併せて記録する。
再生制御部212は、端末装置103への映像再生を制御する。
【0025】
人物領域検出部213は、入力画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う。
人物特徴量抽出部214は、人物領域検出部213で検出した領域に対して画像認識技術を用いて特徴量算出を行う。ここで算出する人物特徴量とは、例えば、人物の輪郭の形状や方向、皮膚の色、歩容(どの脚をどのようにどんなタイミングで動かすかといった脚の捌き方)、或いは、人物を特定する代表的な部位である顔の輪郭の形状や方向、目や鼻、口といった主要構成要素の大きさ、形状、配置関係等が挙げられるが、本実施形態においては、使用する特徴量の種類や数はいずれであってもよい。
人物特徴量記録部215は、人物特徴量抽出部214で算出した特徴量の記録媒体への書込みと読出しを行う。画像記録部211における画像データの記録媒体と本処理部における人物特徴量の記録媒体とは同一であっても別個であってもよい。
属性情報記録部216は、画像データに関連する属性情報の記録媒体への書込みと読出しを行う。属性情報とは、例えば、画像の撮影時刻や撮像装置番号等である。
【0026】
要求受信部217は、端末装置103からの検索要求やキーワード付与要求の受信を行う。検索要求には、類似画像検索要求と、登場イベント検索要求がある。
類似人物検索部218は、要求受信部217にて受信した要求が類似人物検索要求であった場合に、類似画像検索を行う。
登場イベント検索部219は、要求受信部にて受信した要求が登場イベント検索要求であった場合に、登場イベント検索を行う。
検索結果送信部220は、類似人物検索部218や登場イベント検索部219から得た類似人物検索結果や登場イベント検索結果の端末装置103への送信を行う。
キーワード記録部110は、要求受信部217にて受信したキーワード付与要求に基づくキーワードの記録媒体への書込みと読出しを行う。
キーワード検索部111は、要求受信部217にて受信した検索要求データ中にキーワードが含まれていた場合に、キーワード検索を行う。
【0027】
端末装置103は、ネットワーク機能を有する一般のPC(パーソナルコンピュータ)で実現してもよいし、専用の検索端末でもよい。
端末装置103は、機能構成として、検索要求送信部221、検索結果受信部222、検索結果表示部223、再生画像表示部224、画面操作検知部225、キーワード付与要求送信部112、複数検索キー選択部113の各処理部を有する。また、本装置には、本発明の方式を実現するための人物検索機能も搭載してある。
【0028】
検索要求送信部221は、検索要求の録画装置102への送信を行う。類似人物検索の場合、検索要求データには、類似人物検索の検索キーとして、検索キー画像或いはその特徴量が含まれる。また、検索要求データには、絞込みパラメータを含めることも可能である。
検索結果受信部222は、検索結果の録画装置102からの受信を行う。検索結果として受信するデータには、録画装置102において、類似人物検索、或いは、登場イベント検索を実施して得られた画像の集合が含まれる。集合を構成する個々の画像は、録画装置102に記録された映像から画像サイズ縮小処理等を施して生成される。以下、この個々の画像を「検索結果画像」、検索結果として送受信するデータを「検索結果データ」という。
検索結果表示部223は、検索結果受信部222にて受信した検索結果の画面表示を行う。表示される画面例については後述する。
再生画像表示部224は、録画装置102から入力された画像データの画面への連続動画表示を行う。
画面操作検知部225は、ユーザによる操作内容の検知及び取得を行う。
キーワード付与要求送信部112は、キーワード付与要求の録画装置102への送信を行う。
複数検索キー選択部113は、検索キー画像の候補が複数選択されたときに、より少ない数の検索キー画像を適切に選択する処理を行う。複数検索キー選択部113は録画装置102内に設けても良い。
【0029】
図2には、本発明の一実施形態に係る類似画像検索システムに用いる撮像装置201のハードウェア構成を例示してある。
撮像装置201のハードウェア構成は、図2に示すように、撮像部241、主記憶部242、符号化部243、ネットワークインタフェース(I/F)245が、バス240で結合された形態である。
【0030】
撮像部241は、レンズで撮像した光信号をデジタルデータに変換する。符号化部243は、撮像部241が出力するデジタルデータを符号化して、JPEG(Joint Photographic Experts Group)などの画像データに変換する。主記憶部242は、撮像したデジタルデータ、符号化された画像データを記憶する。ネットワークI/F245は、ネットワーク200を介して、主記憶部242上の画像データを録画装置102に送信するためのインタフェースである。
【0031】
図3には、本発明の一実施形態に係る類似画像検索システムに用いる録画装置102のハードウェア構成を例示してある。
録画装置102のハードウェア構成は、図3に示すように、CPU(Central Processing Unit)251、主記憶部252、補助記憶部253、ネットワークI/F254が、バス250で結合された形態である。
【0032】
CPU251は、録画装置102の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部252は、DRAM(Dynamic Random Access Memory)などの半導体装置で実現され、検索のための画像データやCPU251で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部253は、HDDやフラッシュメモリなどで実現され、主記憶部252より大容量のメモリであり、画像データやプログラムを格納する。ネットワークI/F254は、ネットワーク200を介して、撮像装置201からの画像データを受信したり、端末装置103から検索キーワードを受信したり、端末装置103に画像データを送信するためのインタフェースである。
【0033】
図4には、本発明の一実施形態に係る類似画像検索システムに用いる端末装置103のハードウェア構成を例示してある。
端末装置103のハードウェア構成は、図4に示すように、CPU261、主記憶部262、補助記憶部263、表示I/F264、入出力I/F265、ネットワークI/F266が、バス260で結合された形態である。また、表示I/F264は、表示装置270と接続され、入出力I/F265は、キーボード280やマウス282などの入出力装置と接続される。
【0034】
CPU261は、端末装置103の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部262は、DRAMなどの半導体装置で実現され、表示のための画像データやCPU261で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部263は、HDDやフラッシュメモリなどで実現され、主記憶部262より大容量のメモリであり、検索キーワード、画像データやプログラムを格納する。表示I/F264は、表示装置270と接続するためのインタフェースである。入出力I/F265は、キーボード280やマウス282などの入出力装置と接続するためのインタフェースである。ネットワークI/F266は、ネットワーク200を介して、録画装置102からの画像データを受信したり、録画装置102に検索キーワードを送信するためのインタフェースである。表示装置270は、例えば、LCD(Liquid Crystal Display)などの装置であり、画像や動画をその表示部に表示する装置である。ユーザは、表示装置270の表示部に表示された画像を、キーボード280やマウス282などの入出力装置を操作して、例えばGUI(Graphical User Interface)操作することによって、端末装置103、及び、類似画像検索システムを操作する。
【0035】
次に、本発明の一実施形態に係る類似画像検索システムにおける類似人物検索の実施例について説明する。
【実施例1】
【0036】
本発明の一実施形態に係る類似画像検索システムにおける第1実施例を、 図5A〜図5G及び図6を参照して説明する。
図6には、第1実施例において、類似人物検索を実施する手順を例示してある。また、 図5A〜図5Gには、第1実施例において、類似人物検索を実施する手順に沿って、検索キー画像の候補となった画像の特徴量を例示してある。
【0037】
まず、最初のキー画像による検索処理6001では、ユーザが選択した最初の検索キー画像によって最初の検索が行われる。ここでは、最初の検索キー画像に選択された画像の特徴量(本例では、画像中の人物の特徴量)と距離が近い特徴量を有する画像を録画装置102内の類似人物検索部218を通じて検索し、その結果、例えば10件の画像が検索される。
【0038】
図5Aには、最初の検索キー画像の特徴量を「○」で示してある。ここでは、説明の分かり易さのために画像の特徴量を2次元で表現しているが、実際には、画像の特徴量は例えば数百次元といった非常に多くの次元数を持つ場合が多い。
【0039】
ここで、検索結果である10件の画像のうち3件が最初の検索キー画像と同一の対象であるとする。検索結果から同一人物を選択する処理6002では、10件の検索結果画像から目的の3件の画像を選択する。具体的には、例えば、ユーザが端末装置103のマウス282を操作して目的の画像をクリックして選択する。なお、画像の特徴量について閾値を設け、最初の検索キー画像の特徴量と検索結果画像の特徴量との距離が閾値以下なら同一の対象(同一人物)であると判断し、該当する検索結果画像を自動選択する方法としてもよい。
【0040】
図5Bには、図5Aの内容に加え、検索結果から同一人物を選択する処理6002によって選択された画像の特徴量を「△」で示してある。このような処理によって選択された画像は、新たな検索キー画像の候補となる。
【0041】
ここで、検索結果画像が動画を形成する連続的な画像のうちの1枚であるとすると、その動画における検索結果画像の前後にも同一人物の画像が含まれている場合が多い。検索結果前後の同一人物を選択する処理6003では、検索結果画像が抽出された動画における検索結果画像の前又は後の所定長の時間帯に含まれる複数の画像から、人物の位置や進行速度等に基づいて検索結果画像の人物と同一人物(すなわち、検索キー画像の人物と同一人物)と判定される画像を自動的に選択する。なお、ユーザが指定できるようにしても良い。
【0042】
図5Cには、図5Bの内容に加え、検索結果前後の同一人物を選択する処理6003によって選択された画像の特徴量を「□」で示してある。このような処理によって選択された画像は、新たな検索キー画像の候補となる。
【0043】
マスクを付加する画像処理6004では、これまでの処理で新たな検索キー画像の候補とした人物の画像に対し、画像処理で鼻や口を覆うマスクを付加した画像を生成し、新たな検索キー画像の候補に追加する処理を行う。なお、これとは逆に、画像処理前の人物の画像が鼻や口を覆うマスクをしている場合に、画像処理でマスクを外すようにする処理を行っても良い。また、マスクの画像は複数種類の画像を準備しても良い。
【0044】
サングラスや眼鏡を付加する画像処理6005では、これまでの処理で新たな検索キー画像の候補とした人物の画像に対し、画像処理でサングラスや眼鏡を付加した画像を生成し、新たな検索キー画像の候補に追加する処理を行う。なお、これとは逆に、画像処理前の人物の画像がサングラスや眼鏡をかけている場合に、画像処理でサングラスや眼鏡を外すようにする処理を行っても良い。また、サングラスや眼鏡の画像は複数種類の画像を準備しても良い。
【0045】
人物の向きを変更する画像処理6006では、これまでの処理で新たな検索キー画像の候補とした人物の画像に対し、画像処理で人物の向きを変更した画像を生成し、新たな検索キー画像の候補に追加する処理を行う。人物の向きは通常複数であるが、単純な左右反転であってもよい。
【0046】
図5Dには、図5Cの内容に加え、マスクを付加する画像処理6004、サングラスや眼鏡を付加する画像処理6005、人物の向きを変更する画像処理6006の結果生成された複数の画像の特徴量を「×」で示してある。このような処理によって生成された画像は、新たな検索キー画像の候補として追加される。
【0047】
なお、マスクを付加する画像処理6004、サングラスや眼鏡を付加する画像処理6005、人物の向きを変更する画像処理6006は、最初の検索キー画像、検索結果から同一人物を選択する処理6002の結果の画像、検索結果前後の同一人物を選択する処理6003の結果の画像のいずれを対象にして施してもよい。また、対象の画像に対していずれか1つの画像処理を施してもよく、任意の2つの画像処理を施してもよく、3つの画像処理を全て施してもよい。また、対象の画像の明暗を変える画像処理など、上記以外の画像処理を施してもよい。
【0048】
次に、クラスタリング処理6007では、これまでの処理6001〜6006により検索キー画像の候補とされた複数の画像をクラスタリングして、各クラスタを代表する画像(或いはその特徴量)を求める。クラスタリング方法としては、k−means法などの公知の技術を用いることができる。各クラスタを代表する画像としては、例えば、そのクラスタに含まれる画像の特徴量の平均に最も近い画像が用いられ、その画像の特徴量が新たな検索キーとされる。なお、クラスタに含まれる画像の特徴量の平均をそのまま新たな検索キーとしてもよい。
【0049】
図5Eには、これまでの処理6001〜6006によって得られた新たな検索キー画像の候補がクラスタリング処理6007によってクラスタに分けられた様子と、各クラスタを代表する画像の特徴量を例示してある。図5Eでは、3つのクラスタを枠線で囲って示してあり、各クラスタを代表する画像の特徴量として、各クラスタの重心に最も近い画像の特徴量P11,P12,P13がそれぞれ選択されている。
【0050】
代表する検索キーによる検索処理6008では、クラスタリング処理6007によって得られた各クラスタを代表する画像の特徴量を新たな検索キーに用いて類似画像検索を行い、結果を出力する。
ここで、図5Eの例では、最初の検索キー画像に関連する画像(処理6001〜6006により得られた画像)は29枚あるため、従来であれば、これらの画像の特徴量を新たな検索キーとした検索を29回繰り返していたところ、本実施例においては、クラスタリング処理6007によって得られた各クラスタを代表する3つの画像の特徴量を用いて類似画像検索を行うことで、特徴量のバランスをとりつつ3回の検索で済むようにしている。ここでは、クラスタの数を3としたが、これは設定によって変えることができる。
【0051】
次に、端末装置103の画面について説明する。図9には、本例の類似画像検索システムに使用可能な検索画面を例示してある。
検索画面は、再生画像表示領域3001、画像再生操作領域3003、検索キー画像指定領域3004、検索絞込パラメータ指定領域3008、検索実行領域3017、検索結果表示領域3020を有する。
【0052】
再生画像表示領域3001は、録画装置102に記録された画像を動画像として表示する領域である。また、再生画像表示領域3001の動画3002は、録画装置102に記録された画像を動画像として表示するものである。
画像再生操作領域3003は、録画装置102に記録された画像を再生操作する領域である。本領域3003を構成する各ボタンには、それぞれ固有の再生種類が割当てられている。本図においては、巻戻し、逆再生、再生停止、順再生、早送りの再生種類が左から順に割当てられている例を示している。ユーザが各ボタンをマウス282で適宜押下することにより、動画3002がボタンに割当てられた再生種類に切り替る。
【0053】
検索キー画像指定領域3004は、検索キー画像の指定と表示を行う領域である。本領域3004は、検索キー画像3005と、映像指定ボタン3006、ファイル指定ボタン3007を有する。
検索キー画像3005は、類似検索のための最初の検索キー画像とする画像である。初期状態においては、検索キー画像は、未指定であるので、画像表示はされていない状態となる。なお、未指定の場合に、別途用意した未指定状態を示す画像を表示する等、未指定である旨の表記をするようにしてもよい。
【0054】
映像指定ボタン3006は、押下時に再生画像表示領域3001に表示されている画像を、検索キー画像3005として指定するボタンである。
ファイル指定ボタン3007は、録画装置102に記録されている画像以外の画像、例えば、デジタルスチルカメラで撮影した画像やスキャナで取込んだ画像等を、検索キー画像3005として指定するボタンである。このボタン3007を押下すると、それらの画像をファイル指定するダイアログボックスが表示され、ユーザはそこで所望の画像を指定することができる。
【0055】
検索絞込パラメータ指定領域3008は、検索の際の絞込パラメータの種類とその値(範囲)を指定する領域である。本領域3008は、撮像装置指定チェックボックス3009,3010,3011,3012と、時刻指定チェックボックス3013,3014と、時刻指定欄3015,3016を有する。
【0056】
撮像装置指定チェックボックス3009,3010,3011,3012は、検索の際に検索対象とする撮像装置201を指定するチェックボックスである。本チェックボックス3009,3010,3011,3012は、押下すると選ばれたことを示すチェックマークがそれぞれ表示される。このマークは再押下すると非表示となり、押下で表示・非表示を繰り返す。
初期状態においては、全ての撮像装置201(カメラ1〜4)を検索対象とするため、撮像装置指定チェックボックス3009,3010,3011,3012は全て選択状態となる。
【0057】
時刻指定チェックボックス3013,3014は、検索の際に検索対象とする時刻範囲を指定するチェックボックスである。表示の態様については本チェックボックスも他のチェックボックスと同様である。時刻指定チェックボックス3013を選択状態にした場合には時刻範囲に先頭時刻を与える。非選択状態にした場合には、時刻範囲に先頭時刻を与えない、すなわち、録画装置102に記録された最も古い時刻の画像までを検索対象範囲とすることを意味する。
同様に時刻指定チェックボックス3014を選択状態にした場合には時刻範囲に末尾時刻を与える。非選択状態にした場合には、時刻範囲に末尾時刻を与えない、すなわち、録画装置102に記録された最も新しい時刻の画像までを検索対象範囲とすることを意味する。
時刻指定欄3015,3016は、上述の先頭時刻と末尾時刻の値を指定する入力欄である。
初期状態においては、全時間帯を検索対象とするため、時刻指定チェックボックス3013,3014は全て非選択状態、時刻指定欄3015,3016は空欄とする。
【0058】
検索実行領域3017は、検索実行を指示する領域である。本領域3017は、類似人物検索ボタン3018、登場イベント検索ボタン3019に加え、検索結果からの類似人物検索ボタン3300、同一シーンチェックボックス3201、マスクチェックボックス3202、サングラスチェックボックス3203、異なる角度チェックボックス3204を有する。
【0059】
類似人物検索ボタン3018は、検索キー画像3005による類似人物検索(最初のキー画像による検索処理6001)の実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って類似人物検索の実行を指示する。
登場イベント検索ボタン3019は、登場イベント検索の実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って登場イベント検索の実行を指示する。
【0060】
検索結果表示領域3020は、検索結果を表示する領域である。検索結果の表示は、検索結果画像を一覧表示することにより実施する。初期状態においては、検索結果表示領域3020には何も表示されない。
【0061】
ここで、ユーザが、映像指定ボタン3006を押下し、また、撮像装置指定チェックボックス3009,3010,3012を押下し、更に、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015,3016にそれぞれ「2009/6/26 15:30:20」,「2009/7/13 12:30:20」と入力したとする。
これにより、図9に示すように、検索キー画像3005には、動画3002に表示された人物「Aさん」の画像が検索キー画像として指定され、また、検索対象としたい撮像装置201として「カメラ1」、「カメラ2」、「カメラ4」の3つが指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」が指定される。
【0062】
その後、ユーザが、類似人物検索ボタン3018を押下したとする。すると、検索結果表示領域3020には、検索キー画像3005を用いて類似人物検索を実行して得られた検索結果が表示される。図9は、この状態における検索画面の一例を示したものである。検索結果の表示は、検索結果画像(本例では、検索結果画像3031〜3141)を一覧表示することにより実施する。
検索結果画像3031〜3141は、例えば、最上段左から右へ、次に2段目左から右へと検索キー画像3005に対する類似度順に表示する。この表示例においては、検索結果画像3031が検索キー画像3005に対し最も類似度が高く、検索結果画像3141が最も類似度が低いということを示している。
【0063】
この図に示された例の表記において、検索結果表示領域3020内の検索結果画像3031〜3141上に図示した円とアルファベットは、人物の顔と人物名称を簡略表示したものであり、例えば、検索結果画像3031には、人物「Aさん」が登場することを示している。この簡略表示している部分には、もちろん、実際のシステムでの表示では実画像が表示される。
検索結果画像3031の周辺には、頭出し再生ボタン3032、検索キー画像指定ボタン3033、検索対象チェックボックス3301を備える。他の検索結果画像3041〜3141も同様である。
【0064】
頭出し再生ボタン3032は、検索結果画像3031を先頭とした連続動画再生開始を指示するボタンである。例えば、頭出し再生ボタン3032を押下すると動画3002が検索結果画像3031に切り替り、その検索結果画像3031を先頭として始まる動画をユーザは、視聴することができる。
検索キー画像指定ボタン3033は、検索結果画像3031を新たな検索キー画像に指定するボタンである。例えば、検索キー画像指定ボタン3033を押下すると、検索結果画像3031が検索キー画像3005に表示される。これにより、検索結果画像3031を使って再検索を実施することができる。
【0065】
検索対象チェックボックス3301は、検索結果からの類似人物検索ボタン3300を押下した場合に新たな検索キー画像(或いはその候補)として検索結果画像3031を指定するチェックボックスである。例えば、検索結果に出てきた「Aさん」の画像(本例では、検索結果画像2031〜3061,3081,3091,3121,3141)を全てチェックして、検索結果からの類似人物検索ボタン3300を押すことで、様々なパターンの「Aさん」を検索することが可能である。
【0066】
検索結果からの類似人物検索ボタン3300は、検索キー画像3005による類似人物検索の結果に基づく再度の類似人物検索(代表する検索キーによる検索処理6008)の実行を指示するボタンである。再度の類似人物検索では、検索結果表示領域3020の表示(最初のキー画像による検索処理6001の結果)の中からユーザに選択された(検索対象チェックボックスがチェックされた)画像を新たな検索キー画像(或いはその候補)として類似人物検索を再実行する。
【0067】
同一シーンチェックボックス3201は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にして検索結果前後の同一人物を選択する処理6003を実行し、その結果の画像(対象の画像中の人物と同一人物を映した前後の画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
マスクチェックボックス3202は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にしてマスクを付加する画像処理6004を実行し、その結果の画像(対象の画像中の人物にマスクを付加した画像或いは当該人物からマスクを外した画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
サングラスチェックボックス3203は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にしてサングラスや眼鏡を付加する画像処理6005を実行し、その結果の画像(対象の画像中の人物にサングラス等を付加した画像或いは当該人物からサングラス等を外した画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
異なる角度チェックボックス3204は、検索結果表示領域3020の表示の中からユーザに選択された画像を対象にして人物の向きを変更する画像処理6006を実行し、その結果の画像(対象の画像中の人物の向きを変更した画像)を新たな検索キー画像の候補に追加することを指定するチェックボックスである。
【0068】
これらのチェックボックス3201〜3204の1以上がチェックされた状態で検索結果からの類似人物検索ボタン3300が押下された場合には、検索結果表示領域3020の表示の中からユーザに選択された各々の画像を対象にして、チェックされた状態のチェックボックスに対応する画像処理を実行し、その結果生成された画像を新たな検索キー画像の候補を追加し、その後、新たな検索キー画像の候補に対してクラスタリング処理6007を実行して各クラスタを代表する検索キー画像を求め、各クラスタを代表する画像の特徴量を検索キーとして用いて類似画像検索を実行する。
【0069】
以上のように、第1実施例では、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた構成において、検索キー決定手段が、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、検索手段が、検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うように構成した。
なお、本例では、端末装置103の複数検索キー選択部113の機能により検索キー決定手段を実現し、録画装置102の類似人物検索部218の機能により検索手段を実現しているが、他の態様により検索キー決定手段及び検索手段を実現しても構わない。
【実施例2】
【0070】
本発明の一実施形態に係る類似画像検索システムにおける第2実施例を、 図5F及び図7を参照して説明する。なお、第1実施例と同様の部分は説明を省略する。
図7には、第2実施例において、類似人物検索を実施する手順を例示してある。
図7の処理6001〜6006は、図6の処理6001〜6006と同一であるので説明を省略する。
【0071】
全体平均算出処理7001では、これまでの処理6001〜6006により新たな検索キー画像の候補とされた複数の画像の全てを対象にして画像の特徴量の平均を算出し、平均に最も近い検索キー画像の候補を第1の検索キー画像に指定し、その画像の特徴量が新たな第1の検索キーとする。なお、新たな検索キー画像の候補となった全ての画像の特徴量の平均をそのまま第1の検索キーとしてもよい。
遠距離点算出処理7002では、新たな検索キー画像の候補のうち、第1の検索キー画像から特徴量が最も遠い画像を第2の検索キー画像に指定し、その画像の特徴量が新たな第2の検索キーとする。更に、新たな検索キー画像の候補のうち、第1の検索キーと第2の検索キーの両方から特徴量が最も遠い画像を第3の検索キー画像に指定し、その画像の特徴量を新たな第3の検索キーとする。また、同様にして、これまでに指定された全ての新たな検索キーから最も遠い画像を第4以降の新たな検索キー画像に指定し、その画像の特徴量を第4以降の新たな検索キーとすることを繰り返しても良い。
【0072】
図5Fには、これまでの処理6001〜6006によって得られた新たな検索キー画像の候補に基づいて、全体平均算出処理7001により第1の検索キーとされた画像の特徴量P21(本例では、新たな検索キー画像の候補となった全ての画像の特徴量の平均)と、遠距離点算出処理7002により第2の検索キーとされた画像の特徴量P22及び第3の検索キーとされた画像の特徴量P23が示されている。
【0073】
代表する検索キーによる検索処理6008では、全体平均算出処理7001及び遠距離点算出処理7002によって得られた新たな検索キー(本例では、第1〜第3の検索キー)の特徴量を用いて類似画像検索を行い、結果を出力する。
ここで、図5Fの例では、最初の検索キー画像に関連する画像(処理6001〜6006により得られた画像)は29枚あるため、従来であれば、これらの画像の特徴量を新たな検索キーとした検索を29回繰り返していたところ、本実施例においては、全体平均算出処理7001及び遠距離点算出処理7002によって得られた3つの画像の特徴量を用いて類似画像検索を行うことで、特徴量のバランスをとりつつ3回の検索で済むようにしている。
【0074】
以上のように、第2実施例では、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた構成において、検索キー決定手段が、検索キーの候補である複数の画像の特徴量の平均に最も近い画像の特徴量又は平均そのものを第1の検索キーに決定し、検索キーの候補である複数の画像の特徴量の中で第1の検索キーから最も遠い画像の特徴量を第2の検索キーに決定し、更に、検索キーの候補である複数の画像の特徴量の中でこれまでに検索キーに決定された画像の特徴量の全てから最も遠い画像の特徴量を更なる検索キーに決定することを行い、検索手段が、検索キー決定手段により決定された複数の検索キーをそれぞれ用いて検索を行うように構成した。
なお、本例では、端末装置103の複数検索キー選択部113の機能により検索キー決定手段を実現し、録画装置102の類似人物検索部218の機能により検索手段を実現しているが、他の態様により検索キー決定手段及び検索手段を実現しても構わない。
【実施例3】
【0075】
本発明の一実施形態に係る類似画像検索システムにおける第3実施例を、 図5G及び図8を参照して説明する。なお、第1実施例と同様の部分は説明を省略する。また、録画装置102の人物特徴量記録部215では、例えば特許文献4に示すようなクラスタリング処理が行われ、各クラスタにはクラスタ番号が付与されているものとする。
図8には、第3実施例において、類似人物検索を実施する手順を例示してある。
図8の処理6001〜6006は、図6の処理6001〜6006と同一であるので説明を省略する。
【0076】
クラスタ番号取得処理8001では、これまでの処理6001〜6006により新たな検索キー画像の候補とされた複数の画像をクラスタリングして、各画像にその画像が属するクラスタを識別するクラスタ番号を付与し、新たな検索キー画像の候補とされた各画像についてクラスタ番号を取得する。なお、録画装置102の人物特徴量記録部215に画像の特徴量と共にその画像のクラスタ番号を記録しておき、録画装置102の人物特徴量記録部215から新たな検索キー画像の候補とされた画像のクラスタ番号を取得する通信を行うようにしてもよく、この場合には、最初のキー画像による検索処理6001を実行する際にクラスタ番号を取得する通信を行ってもよい。
【0077】
次に、クラスタ番号を考慮した検索キー選択処理8002では、最初のキー画像による検索処理6001における検索キー画像とクラスタ番号が同一の候補を除外し、それ以外の候補の中から、クラスタ番号が重ならないように、つまりクラスタ番号が同一のものが複数ある場合はうち1つを検索キー画像とするように、検索キー画像を選択する。
【0078】
図5Gには、これまでの処理6001〜6006によって得られた新たな検索キー画像の候補に、クラスタ番号取得処理8001によって取得されたクラスタ番号を付した例が示されている。クラスタ番号を考慮した検索キー選択処理8002では、クラスタ番号#11については既に最初の検索キー画像として使用済みであるので検索キー画像としては選択されず、クラスタ番号#12については新たな検索キー画像の候補が1つしかない(同じクラスタ番号のものが他にない)ので新たな検索キー画像として選択され、クラスタ番号#23については新たな検索キー画像の候補が複数あるのでそのうち1つが新たな検索キー画像として選択され、クラスタ番号#31についても新たな検索キー画像の候補が複数あるのでそのうち1つが新たな検索キー画像として選択される。
【0079】
代表する検索キーによる検索処理6008では、クラスタ番号取得処理8001及びクラスタ番号を考慮した検索キー選択処理8002によって得られた検索キー画像の特徴量を新たな検索キーに用いて類似画像検索を行い、結果を出力する。
ここで、図5Gの例では、最初の検索キー画像に関連する画像(処理6001〜6006により得られた画像)は9枚あるため、従来であれば、これらの画像の特徴量を新たな検索キーとした検索を9回繰り返していたところ、本実施例においては、クラスタ番号取得処理8001及びクラスタ番号を考慮した検索キー選択処理8002によって得られた3つの画像の特徴量を用いて類似画像検索を行うことで、特徴量のバランスをとりつつ3回の検索で済むようにしている。
【0080】
以上のように、第3実施例では、検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備えた構成において、検索キー決定手段が、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、検索手段が、検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行うように構成した。更に、検索キー決定手段は、ユーザにより1回目の検索キーに指定された画像の特徴量を用いて検索手段により行われた1回目の検索結果の画像及びこれに関連する画像(検索結果の画像を含む動画における検索結果の画像の前後の画像や、検索結果の画像を画像処理した結果の画像など)の特徴量を2回目以降の検索に用いる検索キーの候補として、2回目以降の検索に用いる複数の検索キーを決定する処理を行うものであり、その際に、1回目の検索キーの画像の特徴量が属するクラスタ以外の各クラスタについて、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定するように構成した。
なお、本例では、端末装置103の複数検索キー選択部113の機能により検索キー決定手段を実現し、録画装置102の類似人物検索部218の機能により検索手段を実現しているが、他の態様により検索キー決定手段及び検索手段を実現しても構わない。
【0081】
これまで第1実施例〜第3実施例を用いて説明したように、本発明に係る類似画像検索システムでは、検索キーの候補となった複数の画像の特徴量の分布を特徴付ける代表的な特徴量を検索キーに決定することで、複数の検索キーを用いた類似画像検索における検索回数の抑制と検索精度の向上を両立させるようにした。
【0082】
ここで、本例においては、人物検索に関わる人物検出処理や人物特徴量抽出処理等を録画装置102上で実施する構成で説明したが、ネットワークで接続された録画装置102とは別個の装置にて実施するようにしてもよい。
また、本例においては、人物検索を対象に示したが、本発明は人物だけでなく一般的な画像検索にも適用することができる。
また、撮像装置201、録画装置102、端末装置103の各装置は1台に限られず、それぞれ複数台を用いる構成としてもよい。
【0083】
なお、本発明に係る類似画像検索システムは、以下のような発明として把握することもできる。
すなわち、第1の発明例として、撮像した画像の画像データを記憶し、前記画像の特徴量を抽出して、画像間の類似度を評価し、検索キーの画像を指定して、その画像との類似度が高い画像を複数検索する類似画像検索システムであって、同一の対象(例えば人物)を指す複数の画像を検索キーとして複数回検索を行う類似画像検索システムにおいて、同一の対象を指す複数の画像のうち画像の類似性が高い複数の画像の特徴をまとめた1つの検索キーを得ることで、検索回数を減らすことを特徴とする。
【0084】
また、第2の発明例として、撮像した画像の画像データを記憶し、前記画像の特徴量を抽出して、画像間の類似度を評価し、検索キーの画像を指定して、その画像との類似度が高い画像を複数検索する類似画像検索システムであって、同一の対象(例えば人物)を指す複数の画像を検索キーとして複数回検索を行う類似画像検索システムにおいて、同一の対象を指す複数の画像の特徴の平均を第1の検索キーとし、同一の対象を指す複数の画像の中で第1の検索キーから最も特徴が離れた画像の特徴を第2の検索キーとし、更に、第1の検索キーと第2の検索キーの両方から最も特徴が離れた画像の特徴を第3の検索キーとし、以後、第3以降の検索キーも同様に決めることで、検索回数を減らすことを特徴とする。
【0085】
なお、第1又は第2の発明例における同一の対象を指す複数の画像としては、種々の画像を用いることができる。
例えば、直前に実施された検索により得られた検索結果の画像が用いられる。
例えば、検索キーの画像が複数枚の画像で成り立つ動画における1枚の画像である場合において、検索キーの画像が含まれる動画における検索キーの画像より時間的に前又は後の複数枚の画像が用いられる。
例えば、検索キーの画像を画像処理した結果の画像が用いられる。
また、これらの画像例の2つの組み合わせを適用して得られる画像や、全て(3つ)の組み合わせを適用して得られる画像を用いてもよい。
また、検索回数を減らす度合いや、同一の対象を指す複数の画像として上述した3つの画像例のどれ(或いはどの組み合わせ)を使用するかは、検索の都度任意に変更可能にしてもよい。
【0086】
また、同一の対象を指す複数の画像として検索キーの画像を画像処理した結果の画像を用いる場合において、検索キーの画像に対する画像処理としては、種々の画像処理を用いることができる。
例えば、検索キーの画像が人物を映した画像である場合において、画像中の人物が鼻や口を覆うマスクをしていない場合にマスクを付加する画像処理、或いは、画像中の人物が鼻や口を覆うマスクをしている場合にマスクを除去する画像処理を行う。
例えば、検索キーの画像が人物を映した画像である場合において、画像中の人物が眼鏡やサングラスをかけていない場合に眼鏡やサングラスを付加する画像処理、或いは、画像中の人物が眼鏡やサングラスをかけている場合に眼鏡やサングラスを除去する画像処理を行う。
例えば、検索キーの画像の角度を変える画像処理を行う。一例として、検索キーの画像が人物を映した画像である場合において、画像中の人物の向きを変える画像処理を行う。
例えば、検索キーの画像の明暗を変える画像処理を行う。
【0087】
ここで、本発明に係るシステムや装置などの構成としては、必ずしも以上に示したものに限られず、種々な構成が用いられてもよい。また、本発明は、例えば、本発明に係る処理を実行する方法或いは方式や、このような方法や方式を実現するためのプログラムや当該プログラムを記録する記録媒体などとして提供することも可能であり、また、種々なシステムや装置として提供することも可能である。
また、本発明の適用分野としては、必ずしも以上に示したものに限られず、本発明は、種々な分野に適用することが可能なものである。
また、本発明に係るシステムや装置などにおいて行われる各種の処理としては、例えばプロセッサやメモリ等を備えたハードウェア資源においてプロセッサがROM(Read Only Memory)に格納された制御プログラムを実行することにより制御される構成が用いられてもよく、また、例えば当該処理を実行するための各機能手段が独立したハードウェア回路として構成されてもよい。
また、本発明は上記の制御プログラムを格納したフロッピー(登録商標)ディスクやCD(Compact Disc)−ROM等のコンピュータにより読み取り可能な記録媒体や当該プログラム(自体)として把握することもでき、当該制御プログラムを当該記録媒体からコンピュータに入力してプロセッサに実行させることにより、本発明に係る処理を遂行させることができる。
【符号の説明】
【0088】
102:録画装置、 103:端末装置、 110:キーワード記録部、 111:キーワード検索部、 112:キーワード付与要求送信部、 113:複数検索キー選択部、 200:ネットワーク、 201:撮像装置、 210:画像送受信部、 211:画像記録部、 212:再生制御部、 213:人物領域検出部、 214:人物特徴量抽出部、 215:人物特徴量記録部、 216:属性情報記録部、 217:要求受信部、 218:登場人物検索部、 219:登場イベント検索部、 220:検索結果送信部、 240:バス、 241:撮像部、 242:主記憶部、 243:符号化部、 244:ネットワークI/F、 250:バス、 251:CPU、 252:主記憶部、 253:補助記憶部、 254:ネットワークI/F、 260:バス、 261:CPU、 262:主記憶部、 263:補助記憶部、 264:表示I/F、 266:ネットワークI/F、 270:表示装置、 280:キーボード、 282:マウス、 3001:再生画像表示領域、 3002:動画、 3003:画像再生操作領域、 3004:検索キー画像指定領域、 3005:検索キー画像、 3006:映像指定ボタン、 3007:ファイル指定ボタン、 3008:検索絞込パラメータ指定領域、 3009〜3012:撮像装置指定チェックボックス、 3013,3014:時刻指定チェックボックス、 3015,3016:時刻指定欄、 3017:検索実行領域、 3018:類似人物検索ボタン、 3019:登場イベント検索ボタン、 3020:検索結果表示領域、 3031,3041,3051,3061,3071,3081,3091,3101,3111,3121,3131,3141:検索結果画像、 3032:頭出し再生ボタン、 3033:検索キー画像指定ボタン、 3201:同一シーンチェックボックス、 3202:マスクチェックボックス、 3203:サングラスチェックボックス、 3204:異なる角度チェックボックス、 3300:検索結果からの類似人物検索ボタン、 3301:検索対象チェックボックス
【特許請求の範囲】
【請求項1】
検索キーとなる画像の特徴量に類似する特徴量を有する画像を検索する類似画像検索システムにおいて、
検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、
前記検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備え、
前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、
前記検索手段は、前記検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行う、
ことを特徴とする類似画像検索システム。
【請求項2】
検索キーとなる画像の特徴量に類似する特徴量を有する画像を検索する類似画像検索システムにおいて、
検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、
前記検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備え、
前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量の平均に最も近い画像の特徴量又は平均そのものを第1の検索キーに決定し、検索キーの候補である複数の画像の特徴量の中で第1の検索キーから最も遠い画像の特徴量を第2の検索キーに決定し、更に、検索キーの候補である複数の画像の特徴量の中でこれまでに検索キーに決定された画像の特徴量の全てから最も遠い画像の特徴量を更なる検索キーに決定することを行い、
前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて検索を行う、
ことを特徴とする類似画像検索システム。
【請求項3】
請求項1又は請求項2に記載の類似画像検索システムにおいて、
前記検索手段は、ユーザにより1回目の検索キーに指定された画像の特徴量を用いて1回目の検索を行い、
前記検索キー決定手段は、前記検索手段による1回目の検索結果の画像、当該検索結果の画像を含む動画における当該検索結果の画像の前後の画像、当該検索結果の画像を画像処理した結果の画像を含む複数の画像の特徴量を2回目以降の検索に用いる検索キーの候補として、2回目以降の検索に用いる複数の検索キーを決定する処理を行い、
前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて2回目以降の検索を行う、
ことを特徴とする類似画像検索システム。
【請求項1】
検索キーとなる画像の特徴量に類似する特徴量を有する画像を検索する類似画像検索システムにおいて、
検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、
前記検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備え、
前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量をクラスタリングし、クラスタ毎にそのクラスタを代表する画像の特徴量を検索キーとして決定し、
前記検索手段は、前記検索キー決定手段により決定されたクラスタ毎の検索キーをそれぞれ用いて検索を行う、
ことを特徴とする類似画像検索システム。
【請求項2】
検索キーとなる画像の特徴量に類似する特徴量を有する画像を検索する類似画像検索システムにおいて、
検索キーの候補である複数の画像の特徴量に基づいて、検索キーとする画像の特徴量を決定する検索キー決定手段と、
前記検索キー決定手段により検索キーに決定された画像の特徴量に類似する特徴量を有する画像を検索する検索手段と、を備え、
前記検索キー決定手段は、検索キーの候補である複数の画像の特徴量の平均に最も近い画像の特徴量又は平均そのものを第1の検索キーに決定し、検索キーの候補である複数の画像の特徴量の中で第1の検索キーから最も遠い画像の特徴量を第2の検索キーに決定し、更に、検索キーの候補である複数の画像の特徴量の中でこれまでに検索キーに決定された画像の特徴量の全てから最も遠い画像の特徴量を更なる検索キーに決定することを行い、
前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて検索を行う、
ことを特徴とする類似画像検索システム。
【請求項3】
請求項1又は請求項2に記載の類似画像検索システムにおいて、
前記検索手段は、ユーザにより1回目の検索キーに指定された画像の特徴量を用いて1回目の検索を行い、
前記検索キー決定手段は、前記検索手段による1回目の検索結果の画像、当該検索結果の画像を含む動画における当該検索結果の画像の前後の画像、当該検索結果の画像を画像処理した結果の画像を含む複数の画像の特徴量を2回目以降の検索に用いる検索キーの候補として、2回目以降の検索に用いる複数の検索キーを決定する処理を行い、
前記検索手段は、前記検索キー決定手段により決定された複数の検索キーをそれぞれ用いて2回目以降の検索を行う、
ことを特徴とする類似画像検索システム。
【図1】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図6】
【図7】
【図8】
【図9】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図5F】
【図5G】
【図6】
【図7】
【図8】
【図9】
【公開番号】特開2013−101431(P2013−101431A)
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2011−243715(P2011−243715)
【出願日】平成23年11月7日(2011.11.7)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願日】平成23年11月7日(2011.11.7)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】
[ Back to top ]