類似画像検索システム
【課題】キーワード付与機能の向上、検索の容易性の向上した類似画像検索システムの提供する。
【解決手段】撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有する。
【解決手段】撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、類似画像検索システム、および、類似画像検索方法に係り、特に、映像監視システムの人物の検索のためのユーザインタフェースを使い勝手のよいものにする用途に用いて好適な類似画像検索システム、および、類似画像検索方法に関する。
【背景技術】
【0002】
従来から、ホテル、ビル、コンビニエンスストア、金融機関、ダムや道路といった不特定多数の人が訪れる施設には、犯罪抑止や事故防止等の目的で、映像監視システムが設置されている。これは、監視対象の人物等をカメラ等の撮像装置で撮影し、その映像を、管理事務所や警備室等の監視センタに伝送し、常駐する監視者がそれを監視し、目的や必要に応じて注意する、あるいは映像を記録するものである。
【0003】
映像監視システムにおいて、映像を記録するための記録媒体には、従来のビデオテープ媒体から、ハードディスクドライブ(HDD)に代表されるランダムアクセス媒体が用いられる事例が増えている。さらに近年ではこのような記録媒体の大容量化が進んでいる。
記録媒体の大容量化は、記録できる映像の量を飛躍的に増大させ、より多地点や長時間の記録を可能にしつつある反面、記録画像を目視でチェックする負担の増加が問題として顕在化しつつある。
【0004】
このような背景から、所望の映像をより簡単に見つけ出すための検索機能を備える映像監視システムが普及しつつある。特に、近年では、映像中の特定の事象(イベント)の発生に対して、画像認識技術を用いてリアルタイムに自動検知して映像と共に記録し、事後にそれらのイベントを検索可能とする、より高度な検索機能を備えたシステムが登場しつつある。その中の代表的な一つに人物検索機能がある。
人物検索機能とは、映像中への人物の登場を自動検知の対象として、リアルタイムに記録し、事後に記録画像中から人物登場画像を探し出せる機能である。
【0005】
機能面から人物検索機能は、以下の2種類に大別される。
1つ目は、登場イベント検索機能である。登場イベント検索機能は、映像中への人物の登場(イベント)の有無を、単純に探し出す機能である。検索結果にはイベントの有無に加え、イベント有と判定された場合には、そのイベント数と各イベントの発生時刻やイベントを撮影した撮像装置番号、撮影した画像(人物登場画像)等を提示する。なお、この検索のクエリ(Query)には、イベント発生時刻や撮像装置番号等の検索対象範囲を絞込むための情報として与える場合が多い。以下では、この検索対象範囲を絞込むための情報を、「絞込みパラメータ」ということにする。
2つ目は、類似人物検索機能である。上述の登場イベント検索機能が、登場人物を特定しない検索であるのに対し、こちらはユーザが指定する特定人物が、他の時間、あるいは他の地点の撮像装置で撮影されていないかどうかを、記録画像中から探し出す機能である。検索結果には、特定人物が映った他の画像の有無に加え、有の場合には、その数と撮影時刻、撮像装置番号、撮影した画像(人物登場画像)、後述の類似度等を返す。
特定人物の指定は、探したい人物が映った画像(以降、検索キー画像)をユーザが1ケ指定することで実施される。検索キー画像は、記録画像や外部装置からの任意の画像から指定される。検索は、この検索キー画像中の人物の画像特徴量を画像認識技術により抽出し、記録画像中の人物の画像特徴量と照合し、その類似性(類似度)を求め、同一人物判定を実施することにより実現される。記録画像中の人物特徴量の抽出と記録は、映像録画時等の別タイミングにて予め実施しておく。この検索のクエリにおいても、絞込みパラメータを与えることが可能である場合が多い。
【0006】
両検索機能のどちらにおいても、検索結果には記録画像を取り出すためのリンケージ情報が付与されており、検索結果から記録画像の頭出し再生が可能になっている。
特許文献1には、このように検索キー画像を指定して、検索結果の画像から選択して、別の表示領域に表示して、それを次の検索キー画像にするなどしてユーザの利便性を高めるようにした画像検索装置が開示されている。
また、特許文献2には、ユーザの利便性をさらに高める類似画像検索システムが記載されている。この特許文献2では、ユーザは、類似画像検索の結果に対して、人名や特徴などのキーワードを付与する。画像検索には、二種類の検索方法が用意されており、キーワードを付与された画像を検索の対象から除く類似画像検索と、キーワードを付与された画像のみを検索の対象とする登場イベント検索がある。ユーザは、類似画像検索を複数回行い、充分多くの画像にキーワードを付与した判断した後に、登場イベント検索を行う。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2009−123196号公報
【特許文献2】特開2011−090476号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献2に示すようなキーワード付与機能は、類似画像検索を行う場合に非常に便利である。しかしながら、現状の類似人物検索におけるキーワード付与機能は、ユーザの入力負荷が大きいという問題がある。
即ち、ユーザは類似画像検索の結果に対し、検索結果から多数の正解画像を選択してキーワードの付与を行う必要がある。
また、登場イベント検索の結果に対してキーワードを付与したい場合には、キーワードを、その都度キーボードから入力する手間をかける必要がある。
さらに、当該システムの運用において、例えば名字と名前を合わせたフルネームをキーワードとして入力することと規定されていた場合には、ユーザはそのフルネームを完全に知っておく必要がある。つまり、以前に入力したことはあるが、姓を覚えているが名を忘れてしまった場合や、漢字やスペルを忘れてしまった場合に、別途調査して完全な情報を手に入れないと入力できない問題がある。
本発明は、上記のような問題に鑑み、キーワード付与機能の向上、検索の容易性の向上した類似画像検索システムの提供を目的とする。
【課題を解決するための手段】
【0009】
上記の目的を達成するため、本発明の類似画像検索システムは、撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有するものである。
【0010】
上記本発明の類似画像検索システムにおいて、前記端末装置は、前記録画装置が検索した結果から、類似度が高い画像を自動的に選択状態にして表示することを特徴とする。
【0011】
また上記の目的を達成するため、本発明の類似画像検索システムは、撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記端末装置は、前記録画装置が当該登場イベント検索手段を実行した結果を表示し、前記録画装置は、前記端末装置に表示された画像データの一覧から、ユーザによって選択された画像を検索キー画像として類似度が高い画像データを検索し、類似画像検索結果にキーワード付与済みの結果が含まれていれば、そのキーワードを付与候補として表示する、画像の類似度によらず画像データの一覧を提示する登場イベント検索する手段を有するものである。
【発明の効果】
【0012】
本発明によれば、類似画像検索の結果から、多数の画像を選択して、一度にキーワードを付与することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の類似画像検索システムの一実施例のシステム構成図である。
【図2】本発明の類似画像検索システムに用いる撮像装置のハードウェア構成の一実施例を示す図である。
【図3】本発明の類似画像検索システムに用いる録画装置のハードウェア構成の一実施例を示す図である。
【図4】本発明の類似画像検索システムに用いる端末装置のハードウェア構成の一実施例を示す図である。
【図5A】本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
【図5B】本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
【図5C】本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
【図6】本発明の類似画像検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。
【図7】本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置と端末装置の間の処理シーケンス図の一実施例を示すである。
【図8A】本発明の類似画像検索システムにおいて、検索実行前の初期状態における検索画面の一実施例を示した図である。
【図8B】本発明の類似画像検索システムにおいて、類似人物検索実行直前状態における検索画面の一実施例を示した図である。
【図8C】本発明の類似画像検索システムにおいて、類似人物検索実行直後状態における検索画面の一実施例を示した図である。
【図8D】本発明の類似画像検索システムにおいて、キーワード付与実行直後状態における検索画面の一実施例を示した図である。
【図8E】本発明の類似画像検索システムにおいて、登場イベント検索実行直前状態における検索画面の一実施例を示した図である。
【図8F】本発明の類似画像検索システムにおいて、登場イベント検索実行直後状態における検索画面の一実施例を示した図である。
【図8G】本発明の類似画像検索システムにおいて、登場イベント検索後のユーザよる人物選択操作後の検索画面の一実施例を示した図である。
【図8H】本発明の類似画像検索システムにおいて、登場イベント検索後のキーワード付与実行直後状態における検索画面の一実施例を示した図である。
【発明を実施するための形態】
【0014】
本発明の類似画像検索システムは、例えば、撮像装置、撮像装置から送信された画像データを記録する録画装置、および録画装置に記録された画像データから所望の画像を検索し、当該検索した画像を要求して表示する端末装置から構成される類似画像検索システムにおいて、録画装置は、当該録画装置の各部の制御および所定の機能を実現するための第1のプログラムを実行する第1のCPUと、検索のための画像データおよび第1のCPUで実行する前記第1のプログラムをロードして格納する第1の主記憶部と、撮像装置から受信した画像データおよび第1のプログラムを格納する第1の補助記憶部とからなる。
また端末装置は、例えば、当該端末装置の各部の制御および所定の機能を実現するための第2のプログラムを実行する第2のCPUと、表示装置に表示するための画像データや第2のCPU261で実行する第2のプログラムをロードして格納するための第2の主記憶部と、検索キーワード、画像データ、および第2のプログラムを格納する第2の補助記憶部とからなる。
【0015】
また例えば、第1のCPUは、撮像装置から受信した画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う人物領域検出部、人物領域検出部で検出した領域に対して画像認識技術を用いて特徴量算出を行う人物特徴量抽出部、人物特徴量抽出部で算出した特徴量を主記憶部に記録する人物特徴量記録部、端末装置からの検索要求の受信を行う要求受信部、要求受信部にて受信した検索要求に応じて検索を行う検索部、検索部から得た検索結果を端末装置に送信する検索結果送信部、要求受信部が前記端末装置から受信したキーワード付与要求に基づきキーワードを主記憶部に記録するキーワード記録部、要求受信部が受信した検索要求データ中にキーワードが含まれていた場合には、補助記憶部に記録された画像データについてキーワードで検索を行うキーワード検索部を備える。
また例えば、第2のCPUは、検索要求の録画装置への送信を行う検索要求送信部、検索結果画像および検索結果データを録画装置から受信する検索結果受信部、検索結果受信部にて受信した検索結果画像を画面表示する検索結果表示部、録画装置から入力された画像データを連続動画表示する再生画像表示部、ユーザによる操作内容の検知および取得を行う画面操作検知部、キーワード付与要求を前記録画装置に送信するキーワード付与要求送信部を備える。
【0016】
さらに、本発明の類似画像検索システムの検索要求は、類似画像検索要求と登場イベント検索要求である。
【0017】
以下、本発明に係る一実施形態を、図1〜図7および図8A〜図8Hを用いて説明する。なお、各図の説明において、共通な機能を有する構成要素には同一の参照番号を付し、できるだけ説明の重複を避けるため、説明を省略するようにした。
【0018】
まず、図1〜図4を用いて、本発明の一実施形態に係る類似画像検索システムの構成について説明する。図1は、本発明の類似画像検索システムの一実施例のシステム構成図である。また図2は、撮像装置のハードウェア構成図である。また図3は、録画装置のハードウェア構成図である。また図4は、端末装置のハードウェア構成図である。
【0019】
類似画像検索システムは、図1に示すように、ネットワーク200に、撮像装置201、録画装置102、端末装置103が接続され、互いに通信可能な状態で構成される。
ネットワーク200は、データ通信を行う専用ネットワークやイントラネット、インターネット、無線LAN(Local Area Network)等の各装置を相互に接続して通信を行う通信手段である。
撮像装置201は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)素子等で撮像した画像にデジタル変換処理を施し、変換処理された画像データを、ネットワーク200を介して録画装置へ送信するネットワークカメラや監視カメラ等の装置である。
録画装置102は、ネットワーク200を介して撮像装置201より入力された画像データをHDD等の記録媒体に記録するネットワークデジタルレコーダ等の装置である。また、本装置には、本発明の類似画像検索システムを含む人物検索機能を搭載している。
【0020】
録画装置102は、機能構成として、画像送受信部210、画像記録部211、再生制御部212、人物領域検出部213、人物特徴量抽出部214、人物特徴量記録部215、属性情報記録部216、要求受信部217、検索部、検索結果送信部220、キーワード記録部110、キーワード検索部111の各処理部よりなる。検索部は、類似人物検索部218および登場イベント検索部219で構成される。
【0021】
図1の録画装置102において、画像送受信部210は、装置外部からの画像の入出力を行う処理部であり、撮像装置201からの入力画像データの受信、端末装置103への出力画像データの送信を行う。
画像記録部211は、入力画像データの記録媒体への書込みや出力画像データの記録媒体からの読出しを行う。書込みの際には、画像データに加え、画像データを読出す際の情報となる画像ID(後述)も併せて記録する。
再生制御部212は、端末装置103への映像再生を制御する。
【0022】
人物領域検出部213は、入力画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う。
人物特徴量抽出部214は、人物領域検出部212で検出した領域に対して画像認識技術を用いて特徴量算出を行う。ここで算出する人物特徴量とは、例えば、人物の輪郭の形状や方向、皮膚の色、歩容(どの脚をどのようにどんなタイミングで動かすかといった脚の捌き方)、あるいは、人物を特定する代表的な部位である顔の輪郭の形状や方向、目や鼻、口といった主要構成要素の大きさ、形状、配置関係等が挙げられるが、本実施形態においては、使用する特徴量の種類や数はいずれであってもよい。
人物特徴量記録部215は、人物特徴量抽出部で算出した特徴量の記録媒体への書込みと読出しを行う。画像記録部における画像データの記録媒体と本処理部における人物特徴量の記録媒体とは同一であっても別個であってもよい。
属性情報記録部216は、画像データに関連する属性情報の記録媒体への書込みと読出しを行う。属性情報とは、例えば、画像の撮影時刻や撮像装置番号等である。
【0023】
要求受信部217は、端末装置からの検索要求やキーワード付与要求の受信を行う。検索要求には、類似画像検索要求と、登場イベント検索要求がある。
類似人物検索部218は、要求受信部にて受信した要求が類似人物検索要求であった場合に、類似画像の検索を行う。
登場イベント検索部219は、要求受信部にて受信した要求が登場イベント検索要求であった場合に、登場イベントの検索を行う。
検索結果送信部220は、類似人物検索部218や登場イベント検索部219から得た類似人物検索結果や登場イベント検索結果の端末装置への送信を行う。
キーワード記録部110は、要求受信部にて受信したキーワード付与要求に基づくキーワードの記録媒体への書込みと読出しを行う。
キーワード検索部111は、要求受信部にて受信した検索要求データ中にキーワードが含まれていた場合に、キーワード検索を行う。
【0024】
端末装置103は、ネットワーク機能を有する一般のPC(パーソナルコンピュータ)で実現してもよいし、専用の検索端末でもよい。
端末装置103は、機能構成として、検索要求送信部221、検索結果受信部222、検索結果表示部223、再生画像表示部224、画面操作検知部225、キーワード付与要求送信部112の各処理部にて構成される。また、端末装置103には、本発明を実現するための人物検索機能も搭載している。
【0025】
検索要求送信部221は、検索要求の録画装置への送信を行う。類似人物検索の場合、検索要求データには、検索キー画像が含まれる。また、検索要求データには、絞込みパラメータを含めることも可能である。
検索結果受信部222は、検索結果の録画装置からの受信を行う。検索結果として受信するデータには、録画装置において、類似人物検索、あるいは、登場イベント検索を実施して得られた画像の集合が含まれる。集合を構成する個々の画像は、録画装置に記録された映像から画像サイズ縮小処理等を施して生成される。以下、この個々の画像を「検索結果画像」、検索結果として送受信するデータを「検索結果データ」と称する。
検索結果表示部223は、検索結果受信部にて受信した検索結果の画面表示を行う。表示される画面例については後述する。
再生画像表示部224は、録画装置から入力された画像データの画面への連続動画表示を行う。
画面操作検知部225は、ユーザによる操作内容の検知および取得を行う。
キーワード付与要求送信部112は、キーワード付与要求の録画装置への送信を行う。
【0026】
図2によって、本発明の類似画像検索システムに用いる撮像装置201のハードウェア構成の一実施例を説明する。図2は、本発明の類似画像検索システムに用いる撮像装置のハードウェア構成の一実施例を示す図である。撮像装置201の構成は、撮像部241、主記憶部242、符号化部243、ネットワークインタフェース(I/F)244が、バス240で結合された形態である。
【0027】
図2において、撮像部241は、レンズで撮像した光信号をデジタルデータに変換する。符号化部243は、撮像部241が出力するデジタルデータを符号化して、JPEG(Joint Photographic Experts Group)などの画像データに変換する。主記憶部242は、撮像したデジタルデータ、符号化された画像データを記憶する。ネットワークI/F244は、ネットワーク200を介して、主記憶部242上の画像データを録画装置102に送信するためのインタフェースである。
【0028】
図3によって、本発明の類似画像検索システムに用いる録画装置102のハードウェア構成の一実施例を説明する。図3は、本発明の類似画像検索システムに用いる録画装置のハードウェア構成の一実施例を示す図である。録画装置102のハードウェア構成としては、図3に示すように、CPU(Central Processing Unit)251、主記憶部252、補助記憶部253、ネットワークI/F254が、バス250で結合された形態である。
【0029】
CPU251は、録画装置102の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部252は、DRAMなどの半導体装置で実現され、検索のための画像データやCPU251で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部253は、HDDやフラッシュメモリなどで実現され、主記憶部252より大容量のメモリであり、画像データやプログラムを格納する。ネットワークI/F254は、ネットワーク200を介して、撮像装置201からの画像データを受信したり、端末装置103から検索キーワードを受信したり、端末装置103に画像データを送信するためのインタフェースである。
【0030】
図4によって、本発明の類似画像検索システムに用いる端末装置103のハードウェア構成の一実施例を説明する。図4は、本発明の類似画像検索システムに用いる端末装置のハードウェア構成の一実施例を示す図である。端末装置103のハードウェア構成としては、図4に示すように、CPU261、主記憶部262、補助記憶部263、表示I/F264、入出力I/F265、ネットワークI/F266が、バス260で結合された形態である。また、表示I/F264は、表示装置270と接続し、入出力I/F265は、キーボード280やマウス282などの入出力装置と接続する。
【0031】
図4において、CPU261は、端末装置103の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部262は、DRAM(Dynamic Random Access Memory)などの半導体装置で実現され、表示のための画像データやCPU261で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部263は、HDDやフラッシュメモリなどで実現され、主記憶部262より大容量のメモリであり、検索キーワード、画像データやプログラムを格納する。表示I/F264は、表示装置270と接続するためのインタフェースである。入出力I/F265は、キーボード280やマウス282などの入出力装置と接続するためのインタフェースである。ネットワークI/F266は、ネットワーク200を介して、録画装置102からの画像データを受信したり、録画装置102に検索キーワードを送信したり、録画装置102から画像データを受信するためのインタフェースである。表示装置270は、例えば、LCD(Liquid Crystal Display)などの装置であり、画像や動画をその表示部に表示する装置である。ユーザは、表示装置270の表示部に表示された画像を、キーボード280やマウス282などの入出力装置を操作して、例えばGUI(Graphical User Interface)操作することによって、端末装置103、および、類似画像検索システムを操作する。
【0032】
次に、図5Aと図5Bを用いて本発明の一実施形態に係る類似画像検索システムに用いられるデータ構造について説明する。図5Aと図5Bは、本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
本発明の類似画像検索システムに用いられるデータ構造の一実施例には、図5Aに示すようなフレームテーブル300と、図5Bに示すような属性情報データテーブル310がある。
【0033】
フレームテーブル300は、映像データを格納するためのテーブルである。フレームテーブル300には、画像ID301が付され、付された画像IDと関連付けられたフレームデータ302が記録される。フレームデータ302は、例えば、JPEG形式のデータなどで記録される。
【0034】
属性情報データテーブル310は、画像データを解析した結果の画像についての属性情報データを格納するためのテーブルである。属性情報データテーブル310には、登録ID311が識別のために付与され、付与された登録ID311と関連付けられて、画像ID312、特徴量313、カメラID314、時刻情報315、およびキーワード316が記録される。
例えば、付与された登録ID311と関連付けられて、フレームテーブル300に格納されたフレームの一部が、画像ID312により指定される。また、その画像の特徴量は、特徴量313に、撮像した撮像装置201のIDは、カメラID314に、フレームの撮像時刻に関する情報は、時刻情報315に、フレームに付与されたキーワードは、キーワード316にと、各々のフィールドに格納される。
【0035】
なお、例えば、録画のフレームレートが、30fps(Frames Per Second)のときに、画像の解析を行うのは、その内で、人がいると認識した部分あり、最大3fps程度のフレームレートで画像を捉えて解析を行うのが一般的である。
【0036】
次に図6、図8A、図8B、図8C、および図8Dを用いて、本発明の類似画像検索における類似度が高い検索結果画像を自動的に選択状態にして提示する選択方式について説明する。図6は、本発明の類似画像検索システムの一実施例の類似画像検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。また、図8A〜図8Dは、本発明の類似画像検索において、端末装置103の表示装置270に表示される類似画像検索を行っているときの各フェーズの画面を示す図である。
【0037】
図6において、軸501は、録画装置102の上部から下部へ進む時系列を表し、軸502は、端末装置103の上部から下部へ進む時系列を表している。また、タイミング503〜506は、それぞれ時系列上でのタイミングを表している。各タイミングにおける端末装置103上に表示される画面の一実施例や、ユーザ操作内容の一例については後述する。
【0038】
図6において、通信510〜512は、録画装置102と端末装置103間の主な通信を示している。
通信510と通信511は、リクエストとレスポンスの関係にあり、通信510は、類似人物検索要求を含み、通信511は、類似人物検索結果を含む。この2つの通信により、1回の類似人物検索が実行されることになる。
通信512は、画像に対するキーワード付与要求を含む。
ここで、通信511に含まれる類似人物検索結果には、画像ID301等の属性情報データテーブル310の静的な情報だけでなく、録画装置102における検索処理時に算出された検索キー画像に対する類似度を含むようにする。
本実施例では類似度は0〜100までの範囲の数値とし、100に近いほど検索キー画像に似た画像であることを表すものとする。
【0039】
次に、図8A〜図8Dを用いて、本発明の類似画像検索システムの端末装置103におけるユーザの操作イメージについて説明する。
【0040】
図8Aは、検索実行前の初期状態、すなわち、図6のタイミング503における端末装置103の表示部に表示される検索画面801の一実施例である。ユーザは、この検索画面801から検索を開始する。
図8Aの検索画面801は、再生画像表示領域3001、画像再生操作領域3003、検索キー画像指定領域3004、検索絞込パラメータ指定領域3008、検索実行領域4017、および、検索結果表示領域4020よりなる。
【0041】
図8Aの検索画面801において、再生画像表示領域3001は、録画装置102に記録された画像を動画像として表示する領域である。また再生画像表示領域3001の動画3002は、録画装置に記録された画像を動画像として表示するものである。
画像再生操作領域3003は、録画装置に記録された画像を再生操作する領域である。
本領域3003を構成する各ボタンには、それぞれ固有の再生種類が割当てられている。図8Aにおける各ボタンには、例えば左から、巻戻し、逆再生、再生停止、順再生、早送りの再生種類が割当てられている。ユーザが各ボタンをマウス282で適宜押下することにより、動画3002がボタンに割当てられた再生種類に切り替る。
【0042】
検索キー画像指定領域3004は、検索キー画像の指定と表示を行う領域である。本領域は、検索キー画像3005と、映像指定ボタン3006、ファイル指定ボタン3007よりなる。
検索キー画像3005は、類似検索のためのキーとする画像である。初期状態においては、検索キー画像は、未指定であるので、画像表示はされていない状態となる。なお、未指定の場合に、別途用意した未指定状態を示す画像を表示する等、未指定である旨の表記をするようにしてもよい。
【0043】
映像指定ボタン3006は、押下時に再生画像表示領域3001に表示されている画像を、検索キー画像3005として指定するボタンである。
ファイル指定ボタン3007は、録画装置102に記録されている画像以外の画像、例えば、デジタルスチルカメラで撮影した画像やスキャナで取込んだ画像等を、検索キー画像3005として指定するボタンである。このボタン3007を押下すると、それらの画像をファイル指定するダイアログボックスが表示され、ユーザはそこで所望の画像を指定することができる。
【0044】
検索絞込パラメータ指定領域3008は、検索の際の絞込パラメータの種類とその値(範囲)を指定する領域である。この領域3008は、撮像装置(カメラ)指定チェックボックス3009、3010、3011、3012と、時刻指定チェックボックス3013、3014、時刻指定欄3015、3016から構成される。
【0045】
撮像装置指定チェックボックス3009、3010、3011、3012は、検索の際に検索対象とする撮像装置(カメラ1〜4)を指定するボタンである。本ボタンは、押下すると選ばれたことを示すチェックマークがそれぞれ表示される。このマークは再押下すると非表示となり、押下で表示と非表示を繰り返す。
初期状態においては、全撮像装置を検索対象とするため、撮像装置指定チェックボックスは全て選択状態となる。
【0046】
時刻指定チェックボックス3013、3014は、検索の際に検索対象とする時刻範囲を指定するボタンである。表示の態様については本ボタンも他のチェックボックスと同様である。時刻指定チェックボックス3013を選択状態にした場合には時刻範囲に先頭時刻を与える。非選択状態にした場合には、時刻範囲に先頭時刻を与えない、即ち、録画装置に記録された最も古い時刻の画像までを検索対象範囲とすることを意味する。
同様に時刻指定チェックボックス3014を選択状態にした場合には時刻範囲に末尾時刻を与える。非選択状態にした場合には、時刻範囲に末尾時刻を与えない、すなわち、録画装置に記録された最も新しい時刻の画像までを検索対象範囲とすることを意味する。
時刻指定欄3015、3016は、上述の先頭時刻と末尾時刻の値を指定する入力欄である。
初期状態においては、全時間帯を検索対象とするため、時刻指定チェックボックスは全て非選択状態、時刻指定欄は空欄とする。
【0047】
検索実行領域4017は、検索実行を指示する領域である。本領域は、類似人物検索ボタン3018と登場イベント検索ボタン3019に加え、キーワード指定チェックボックス4021とキーワード指定欄4022、キーワード付与ボタン4023よりなる。
類似人物検索ボタン3018は、検索キー画像3005による類似人物検索実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って検索の実行をすることを指示する。
登場イベント検索ボタン3019は、登場イベント検索実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って検索の実行をすることを指示する。
キーワード指定チェックボックス4021は、キーワード指定欄4022の有効または無効を指定するボタンである。表示の態様については本ボタンも撮像装置指定チェックボックスと同様である。
キーワード指定欄4022は、キーワードの値を指定する入力欄である。
キーワード付与ボタン4023は、キーワード指定欄4022に入力されたキーワードの付与実行を指示するボタンである。
初期状態においては、キーワード指定チェックボックス4021は、非選択状態、キーワード指定欄4022は、空欄とする。
キーワードの働きや、類似人物検索ボタン3018や登場イベント検索ボタン3019とキーワードとの関係については、後述する。
【0048】
検索結果表示領域4020は、検索結果を表示する領域である。検索結果の表示は、検索結果画像を一覧表示することにより実施する。初期状態においては、検索結果表示領域4020には何も表示されない。
ここで、ユーザは、映像指定ボタン3006を押下し、また、撮像装置指定チェックボックス3009、3010、3012を押下し、さらに、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015、3016にそれぞれ「2009/6/26 15:30:20」「2009/7/13 12:30:20」と入力する。
この操作により、検索画面は、類似人物検索実行直前状態、すなわち、図6のタイミング504の端末装置103の状態に遷移する。図8Bは、この状態における検索画面802の一実施例を示したものである。
【0049】
図8Bの検索画面802において、検索キー画像3005には、動画3002に表示された人物「Aさん」が検索キー画像として表示され、また、検索対象としたい撮像装置として「カメラ1、カメラ2、カメラ4」の3つの撮像装置が指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」と指定されている状態を示している。
ここで、ユーザが、類似人物検索ボタン3018を押下する。この押下によって、タイミング504から、検索画面は、類似人物検索実行直後状態、即ち、図6のタイミング505の端末装置103の状態に遷移する。図8Cは、この状態における検索画面803の一実施例を示したものである。
【0050】
図8Cの検索画面803において、検索結果表示領域4020には、検索キー画像3005をキーとして類似人物検索を実行し得られた検索結果を表示している。検索結果の表示は、検索結果画像3031〜3141を検索結果表示領域4020に一覧表示することにより実施する。
検索結果画像3031〜3141は、例えば、最上段左から右へ、次に2段目左から右へと検索キー画像に対する類似度順に表示する。この表示例においては、検索結果画像3031が検索キー画像3005に対し最も類似度が高く、検索結果画像3141が最も類似度が低いということを示している。
ここで検索結果表示領域4020に表示されているのは、「カメラ1、カメラ2、カメラ4の2009/6/26 15:30:20から2009/7/13 12:30:20までの画像で、Aさんと類似した画像」を検索要求した検索結果である。
【0051】
図8Cに示された表記において、検索結果表示領域4020内の検索結果画像上に図示した円とアルファベットは、人物の顔と人物名称を簡略表示したものである。
例えば、検索結果画像3031には、人物「Aさん」が登場することを示している。この簡略表示している部分には、もちろん、実際のシステムでの表示では実画像が表示される。
検索結果画像3031の周辺には、頭出し再生ボタン3032と検索キー画像指定ボタン3033、キーワード対象チェックボックス4034を備える。他の検索結果画像でも同様である。
頭出し再生ボタン3032は、検索結果画像を先頭とした連続動画再生開始を指示するボタンである。例えば、頭出し再生ボタン3032を押下すると動画3002が検索結果画像3031に切り替り、その検索結果画像を先頭として始まる動画をユーザは、視聴することができる。
【0052】
検索キー画像指定ボタン3033は、検索結果画像3031を検索キー画像3005として指定するボタンである。例えば、検索キー画像指定ボタン3033を押下すると、検索結果画像3031が、検索キー画像3005に表示される。これにより、指定された検索結果画像3005を使って、画像の再検索を実施することができる。
類似度表示欄8035は、検索キー画像に対する類似度を表示する領域である。検索結果画像3031の類似度表示欄8035には、例えば、90という値が表示されており、他の検索結果の類似度表示欄にもそれぞれ数値が表示されている。
キーワード付与チェックボックス4034は、キーワード付与の対象となる検索結果画像を指定するボタンである。表示の態様については本ボタンも他のチェックボックスと同様である。例えば、ユーザが、キーワード付与チェックボックス4034を押下すると、チェックマークが表示され、検索結果画像3031が、キーワード付与対象となる。
【0053】
この図8Cに示された実施例は、「Aさん」を目的に類似人物検索を実行した際の検索結果である。したがって、検索結果画像3031、3041、3051、3061、3081、3091、3121、3141が正解で、検索結果画像3071、3101、3111、3131が不正解であるということを示している。
ここで、類似度表示欄8035の数値が一定以上、図8Cにおいては75以上の検索結果画像3031、3041、3051、3061、3071、3081、3091のキーワード付与チェックボックスが既選択状態になっている。
【0054】
類似人物検索実行直後(タイミング505)の状態において、キーワード対象チェックボックス4034を、本発明のように類似度によって選択状態か否かを切り替える処理を設けることによって、全て非選択状態にする方法や全て選択状態にする従来の方法と比較し、少ない選択操作数で正解画像を選択できる。
例えば、正解である検索結果画像3031、3041、3051、3061、3081、3091、3121、3141を全て選択する場合、類似人物検索実行直後状態に全て非選択状態にする方法では、8回の選択操作が必要であり、類似人物検索実行直後状態に全て選択状態にする方法では4回の選択を外す操作が必要である。一方、本発明の方法では1回の選択を外す操作と2回の選択する操作の計3回の操作で良い。
【0055】
また、ユーザがキーワード指定チェックボックス4021を押下し、キーワード指定欄4022に「Aさん」と入力し、さらにキーワード付与ボタン4023を押下する。ユーザのこの操作によって、検索画面803は、キーワード付与実行直後のキーワード指定欄4022に「Aさん」入力状態となる。即ち、図6のタイミング506の端末状態103に遷移する。図8Dは、タイミング506における検索画面804の一例を示したものである。
【0056】
次に図7、図8A、図8D、図8F、図8G、図8H、および図5Cを用いて、本発明の登場イベント検索における類似度を用いたキーワードの付与候補を提示する方式について説明する。図7は、本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置と端末装置の間の処理シーケンス図の一実施例を示すである。また図5Cは、本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図であり、類似画像検索の検索結果に含まれるデータ320を示すものである。
【0057】
図7を用いて、本発明の登場イベント検索結果からのキーワード付与における録画装置102と端末装置103の間の登場イベント検索の処理シーケンスを説明する。図7は、本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。
ここで、図6と同様に、図7の軸501と軸502は、録画装置102、端末装置103の上部から下部へ進む時系列を表している。また、タイミング703〜707は、それぞれ時系列上でのタイミングを表している。各タイミングにおける端末装置103の表示部上に表示される画面の一例や、ユーザ操作内容の一例については後述する。
【0058】
図7において、通信711〜718は、録画装置102と端末装置103間の主な通信を示している。
通信711と通信712は、リクエストとレスポンスの関係にあり、通信711には登場イベント検索要求を、通信712には登場イベント検索結果を含み、この2つの通信により、1回の登場イベント検索要求が実行されることになる。さらに通信713は類似人物検索要求を、通信714は類似人物検索結果を含む。通信716、717についても同様である。通信715には、画像に対するキーワード付与要求を含む。通信718についても同様である。
【0059】
次に、図8E、図8D、図8F、図8G、および図8Hを用いて本発明の類似画像検索システムの端末装置103におけるユーザの操作イメージについて説明する。
図8A、図8E、図8F、図8G、図8Hは、本発明の類似画像検索において、端末装置103の表示装置270に表示される登場イベント検索を行っているときの各フェーズの画面を示す図である。
【0060】
図8Aは、前述したように、検索実行前の初期状態(検索画面801)である。ここでは、図7のタイミング703における端末装置103での検索画面の一実施例である。
ここで、ユーザは、撮像装置指定チェックボックス3009、3010、および3012を押下し、さらに、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015、3016にそれぞれ「2009/6/26 15:30:20」「2009/7/13 12:30:20」と入力する。
このユーザ操作により、検索画面は、登場イベント検索実行直前状態、即ち、図7のタイミング704の端末装置103の状態に遷移する。図8Eは、この状態における検索画面805の一実施例を示したものである。
【0061】
検索対象としたい撮像装置として「カメラ1、カメラ2、カメラ4」の3つが指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」と指定されている状態を示している。
図8Bの検索画面802と比較すると、図8Eの検索画面805では、検索キー画像3005が指定されていない。
ここで、ユーザが、登場イベント検索ボタン3019を押下する。すると、検索画面805は、登場イベント検索実行直後状態、すなわち、図7のタイミング705の端末装置103の状態に遷移する。図8Fは、この状態における検索画面806の一例を示したものである。
【0062】
ここで、図8F等における8036は、人物矩形表示であり、人物を矩形で囲ったものである。人物矩形表示8036の選択は、マウスでクリックするなどのユーザ操作によって可能である。選択状態の人物顔矩形表示8036を再度選択すると、非選択状態にできる。選択状態と非選択状態は矩形枠の太さを変えて提示する場合や、色を変えて提示する場合がある。
登場イベント検索では、検索結果画像3081のように1つの画像に2つ以上の選択すべき人物が現れる場合がある。このため、図8Cのキーワード対象チェックボックス4034ではなく、人物矩形表示8036のような選択可能な表示を設ける。
なお、他の項目に関しては図8Cと同じであるので説明を省略する。
【0063】
ここで、ユーザが、検索結果画像のうちの1つである検索結果画像3031にキーワードを付与したいと考えていて、キーワードを与える操作を、過去にユーザあるいは他のユーザが行っている場合を想定する。
このとき、ユーザは、検索結果画像3031の人物矩形表示8036をマウスでクリックして選択操作を行う。その結果、検索画面は、人物選択済み状態、即ち、図7のタイミング706の端末装置103の状態に遷移する。
このとき、端末装置103内部ではAさんの人物画像をキー画像にして類似人物検索要求を行っている。
【0064】
ここで、前術の実施例で、図8Aから図8B、および図8Bから図8Cに遷移したときと比較すると、検索キー画像3005は指定されておらず、検索結果表示領域4020も更新されず、バックグランドで類似人物検索要求処理が行われることに注意されたい。
本実施例では、類似人物検索結果に属性情報と検索キー画像に対する類似度が格納されている。即ち、ここではAさんに類似した画像のキーワードと類似度が取得できる。
図5(c)に示すデータ320は、類似画像検索の検索結果に含まれるデータであり、検索結果の返送データのうち本発明に必須の部分である。
類似画像検索の検索結果に含まれるデータ302は、ここでは、キーワード「Aさん」「Bさん」「Cさん」が付与されているものおよび空欄すなわちキーワード未付与のものが検索結果として返送されていることを表す。
【0065】
図7のタイミング706の端末装置103の状態では、図8Gの検索画面807が表示される。図8Gは、登場イベント検索後のユーザよる人物選択操作後の検索画面の一実施例を示したものである。
ここで、人物矩形表示8036は、選択済み状態を表す太枠表示になっている。
また、キーワード指定欄4022がキーワード指定およびキーワード候補選択欄8100になっている。
キーワード指定およびキーワード候補選択欄8100は、キーワードを入力することが可能であり、候補表示されている中から選択することも可能である。
【0066】
端末装置103は、検索結果データのうち同一キーワードで最も類似度が高いものを選んで、キーワード候補表示欄である8100に表示する。
ユーザは、これを見て、キーワード候補表示欄8100の「Aさん」が目的の「Aさん」であることを確認し、マウスを使ってクリックなどで選択する。すると、図7のタイミング707の端末装置103の状態に遷移する。図7のタイミング707の端末装置103の状態では図8Hの検索画像808が表示される。
図8Hの8037はキーワード表示欄である。キーワード表示欄8037には付与済みのキーワードが表示される。
【0067】
ユーザは、以後も、検索結果画像の中から1つあるいは複数同時に選択して、キーワード付与操作を行うことができる。1回の登場イベント検索におけるユーザのキーワード付与操作が全て終われば、ユーザは条件を変えて再度登場イベント検索を行うこともできる。
このようにすることで、ユーザが「Aさん」の名前の正確な漢字やスペルを知らなくても、他のユーザが正確な漢字やスペルを入力済みであれば、誤りなく入力できる。また、ユーザが、毎回キーボードで「Aさん」の名前を入力しなくても、マウスでクリックするだけで、キーワードを付与する作業を行うことができる。
【0068】
ここまでに示したように、本実施形態に示した類似画像検索システムより、ユーザは類似画像検索の結果に対し、より少ない結果画像の選択回数でキーワードの付与を行うことを可能にした。また、ユーザが登場イベント検索においてキーワードを付与する場合に毎回キーボードによる正確なキーワードの入力を行う必要のないキーワード付与を可能にした。
【0069】
また、ここまでの説明においては、撮像装置、録画装置、および端末装置は、各1台に限られず、図1に示したように、撮像装置や端末装置が複数台接続されていてもよい。また、図1では、録画装置は、1台のみであったが、録画装置が複数台接続されていてもよい。
【0070】
本実施形態においては、図7に示すように、登場イベント検索後の検索結果選択後に類似人物検索要求を行った。しかし、登場イベント検索要求711時に録画装置102内部において類似人物検索要求されたのと同等の処理を行い、あらかじめ各々の検索結果画像に対する類似度によるキーワード付与候補を含めたものを登場イベント検索結果712として、検索結果選択時に都度行う類似人物検索要求を省略するような実施形態でもよい。
【0071】
また、本実施形態においては、図8Gに示すように、キーワード候補表示欄である8100にキーワードと類似度を表示したが、件数を含めてもよい。図5(c)の類似画像検索の検索結果に含まれるデータ302においては「Aさん」が3件、「Bさん」および「Cさん」がそれぞれ1件という結果となり、これをキーワード候補表示欄である8100に表示することでユーザの判断の参考情報を増やすような実施形態でもよい。
【0072】
また、本実施形態においては、類似度を図5(c)に示すように、キーワード未付与の検索結果も通信したが、キーワード未付与のものを通信から除くような実施形態でもよい。
また、本実施形態においては、人物検索に関わる人物検出処理や人物特徴量抽出処理等を録画装置上で実施する構成で説明したが、ネットワークで接続された録画装置とは別個の装置にて実施するようにしてもよい。
また、本実施形態においては、キーワードが文字列であるように示したが、特定の番号や記号列にて実施するようにしてもよい。
さらに、本実施形態においては、人物検索を対象に示したが、本発明は人物だけでなく一般的な画像検索にも適用することができる。
【符号の説明】
【0073】
102:録画装置、 103:端末装置、 110:キーワード記録部、 111:キーワード検索部、 112:キーワード付与要求送信部、 200:ネットワーク、 201:撮像装置、 202:録画装置、 203:端末装置、 210:画像送受信部、 211:画像記録部、 212:再生制御部、 213:人物領域検出部、 214:人物特徴量抽出部、 215:人物特徴量記録部、 216:属性情報記録部、 217:要求受信部、 218:類似人物検索部、 219:登場イベント検索部、 220:検索結果送信部、 221:検索要求送信部、 222:検索結果受信部、 223:検索結果表示部、 224:再生画像表示部、 225:画面操作検知部、 240:バス、 241:撮像部、 242:主記憶部、 243:符号化部、 244:ネットワークI/F、 250:バス、 251:CPU、 252:主記憶部、 253:補助記憶部、 254:ネットワークI/F、 260:バス、 261:CPU、 262:主記憶部、 263:補助記憶部、 264:表示I/F、 265:入出力I/F、 266:ネットワークI/F、 270:表示装置、 280:キーボード、 282:マウス、 300:フレームテーブル、 301:画像ID、 302:フレームデータ、 310:属性情報データテーブル、 311:登録ID、 312:画像ID、 313:特徴量、 314:カメラID、 315:時刻情報、 316:キーワード、 320:類似画像検索の検索結果に含まれるデータ、 801、802、803、804、805、806、807、808:検索画面、 3001:再生画像表示領域、 3002:動画、 3003:画像再生操作領域、 3004:検索キー画像指定領域、 3005:検索キー画像、 3006:映像指定ボタン、 3007:ファイル指定ボタン、 3008:検索絞込パラメータ指定領域、 3009〜3012:撮像装置指定チェックボックス、 3013〜3014:時刻指定チェックボックス、 3015〜3016:時刻指定欄、 3017:検索実行領域、 3018:類似人物検索ボタン、 3019:登場イベント検索ボタン、 3020:検索結果表示領域、 3031、3041、3051、3061、3071、3081、3091、3101、3111、3121、3131、3141:検索結果画像、 3032:頭出し再生ボタン、 3033:検索キー画像指定ボタン、 4017:検索実行領域、 4020:検索結果表示領域、 4021:キーワード指定チェックボックス、 4022:キーワード指定欄、 4023:キーワード付与ボタン、 4034:キーワード付与チェックボックス、 8035:類似度表示欄、 8036:人物矩形表示、 8037:キーワード表示欄、 8100:キーワード指定およびキーワード候補選択欄。
【技術分野】
【0001】
本発明は、類似画像検索システム、および、類似画像検索方法に係り、特に、映像監視システムの人物の検索のためのユーザインタフェースを使い勝手のよいものにする用途に用いて好適な類似画像検索システム、および、類似画像検索方法に関する。
【背景技術】
【0002】
従来から、ホテル、ビル、コンビニエンスストア、金融機関、ダムや道路といった不特定多数の人が訪れる施設には、犯罪抑止や事故防止等の目的で、映像監視システムが設置されている。これは、監視対象の人物等をカメラ等の撮像装置で撮影し、その映像を、管理事務所や警備室等の監視センタに伝送し、常駐する監視者がそれを監視し、目的や必要に応じて注意する、あるいは映像を記録するものである。
【0003】
映像監視システムにおいて、映像を記録するための記録媒体には、従来のビデオテープ媒体から、ハードディスクドライブ(HDD)に代表されるランダムアクセス媒体が用いられる事例が増えている。さらに近年ではこのような記録媒体の大容量化が進んでいる。
記録媒体の大容量化は、記録できる映像の量を飛躍的に増大させ、より多地点や長時間の記録を可能にしつつある反面、記録画像を目視でチェックする負担の増加が問題として顕在化しつつある。
【0004】
このような背景から、所望の映像をより簡単に見つけ出すための検索機能を備える映像監視システムが普及しつつある。特に、近年では、映像中の特定の事象(イベント)の発生に対して、画像認識技術を用いてリアルタイムに自動検知して映像と共に記録し、事後にそれらのイベントを検索可能とする、より高度な検索機能を備えたシステムが登場しつつある。その中の代表的な一つに人物検索機能がある。
人物検索機能とは、映像中への人物の登場を自動検知の対象として、リアルタイムに記録し、事後に記録画像中から人物登場画像を探し出せる機能である。
【0005】
機能面から人物検索機能は、以下の2種類に大別される。
1つ目は、登場イベント検索機能である。登場イベント検索機能は、映像中への人物の登場(イベント)の有無を、単純に探し出す機能である。検索結果にはイベントの有無に加え、イベント有と判定された場合には、そのイベント数と各イベントの発生時刻やイベントを撮影した撮像装置番号、撮影した画像(人物登場画像)等を提示する。なお、この検索のクエリ(Query)には、イベント発生時刻や撮像装置番号等の検索対象範囲を絞込むための情報として与える場合が多い。以下では、この検索対象範囲を絞込むための情報を、「絞込みパラメータ」ということにする。
2つ目は、類似人物検索機能である。上述の登場イベント検索機能が、登場人物を特定しない検索であるのに対し、こちらはユーザが指定する特定人物が、他の時間、あるいは他の地点の撮像装置で撮影されていないかどうかを、記録画像中から探し出す機能である。検索結果には、特定人物が映った他の画像の有無に加え、有の場合には、その数と撮影時刻、撮像装置番号、撮影した画像(人物登場画像)、後述の類似度等を返す。
特定人物の指定は、探したい人物が映った画像(以降、検索キー画像)をユーザが1ケ指定することで実施される。検索キー画像は、記録画像や外部装置からの任意の画像から指定される。検索は、この検索キー画像中の人物の画像特徴量を画像認識技術により抽出し、記録画像中の人物の画像特徴量と照合し、その類似性(類似度)を求め、同一人物判定を実施することにより実現される。記録画像中の人物特徴量の抽出と記録は、映像録画時等の別タイミングにて予め実施しておく。この検索のクエリにおいても、絞込みパラメータを与えることが可能である場合が多い。
【0006】
両検索機能のどちらにおいても、検索結果には記録画像を取り出すためのリンケージ情報が付与されており、検索結果から記録画像の頭出し再生が可能になっている。
特許文献1には、このように検索キー画像を指定して、検索結果の画像から選択して、別の表示領域に表示して、それを次の検索キー画像にするなどしてユーザの利便性を高めるようにした画像検索装置が開示されている。
また、特許文献2には、ユーザの利便性をさらに高める類似画像検索システムが記載されている。この特許文献2では、ユーザは、類似画像検索の結果に対して、人名や特徴などのキーワードを付与する。画像検索には、二種類の検索方法が用意されており、キーワードを付与された画像を検索の対象から除く類似画像検索と、キーワードを付与された画像のみを検索の対象とする登場イベント検索がある。ユーザは、類似画像検索を複数回行い、充分多くの画像にキーワードを付与した判断した後に、登場イベント検索を行う。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2009−123196号公報
【特許文献2】特開2011−090476号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献2に示すようなキーワード付与機能は、類似画像検索を行う場合に非常に便利である。しかしながら、現状の類似人物検索におけるキーワード付与機能は、ユーザの入力負荷が大きいという問題がある。
即ち、ユーザは類似画像検索の結果に対し、検索結果から多数の正解画像を選択してキーワードの付与を行う必要がある。
また、登場イベント検索の結果に対してキーワードを付与したい場合には、キーワードを、その都度キーボードから入力する手間をかける必要がある。
さらに、当該システムの運用において、例えば名字と名前を合わせたフルネームをキーワードとして入力することと規定されていた場合には、ユーザはそのフルネームを完全に知っておく必要がある。つまり、以前に入力したことはあるが、姓を覚えているが名を忘れてしまった場合や、漢字やスペルを忘れてしまった場合に、別途調査して完全な情報を手に入れないと入力できない問題がある。
本発明は、上記のような問題に鑑み、キーワード付与機能の向上、検索の容易性の向上した類似画像検索システムの提供を目的とする。
【課題を解決するための手段】
【0009】
上記の目的を達成するため、本発明の類似画像検索システムは、撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有するものである。
【0010】
上記本発明の類似画像検索システムにおいて、前記端末装置は、前記録画装置が検索した結果から、類似度が高い画像を自動的に選択状態にして表示することを特徴とする。
【0011】
また上記の目的を達成するため、本発明の類似画像検索システムは、撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、前記端末装置は、前記録画装置が当該登場イベント検索手段を実行した結果を表示し、前記録画装置は、前記端末装置に表示された画像データの一覧から、ユーザによって選択された画像を検索キー画像として類似度が高い画像データを検索し、類似画像検索結果にキーワード付与済みの結果が含まれていれば、そのキーワードを付与候補として表示する、画像の類似度によらず画像データの一覧を提示する登場イベント検索する手段を有するものである。
【発明の効果】
【0012】
本発明によれば、類似画像検索の結果から、多数の画像を選択して、一度にキーワードを付与することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の類似画像検索システムの一実施例のシステム構成図である。
【図2】本発明の類似画像検索システムに用いる撮像装置のハードウェア構成の一実施例を示す図である。
【図3】本発明の類似画像検索システムに用いる録画装置のハードウェア構成の一実施例を示す図である。
【図4】本発明の類似画像検索システムに用いる端末装置のハードウェア構成の一実施例を示す図である。
【図5A】本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
【図5B】本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
【図5C】本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
【図6】本発明の類似画像検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。
【図7】本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置と端末装置の間の処理シーケンス図の一実施例を示すである。
【図8A】本発明の類似画像検索システムにおいて、検索実行前の初期状態における検索画面の一実施例を示した図である。
【図8B】本発明の類似画像検索システムにおいて、類似人物検索実行直前状態における検索画面の一実施例を示した図である。
【図8C】本発明の類似画像検索システムにおいて、類似人物検索実行直後状態における検索画面の一実施例を示した図である。
【図8D】本発明の類似画像検索システムにおいて、キーワード付与実行直後状態における検索画面の一実施例を示した図である。
【図8E】本発明の類似画像検索システムにおいて、登場イベント検索実行直前状態における検索画面の一実施例を示した図である。
【図8F】本発明の類似画像検索システムにおいて、登場イベント検索実行直後状態における検索画面の一実施例を示した図である。
【図8G】本発明の類似画像検索システムにおいて、登場イベント検索後のユーザよる人物選択操作後の検索画面の一実施例を示した図である。
【図8H】本発明の類似画像検索システムにおいて、登場イベント検索後のキーワード付与実行直後状態における検索画面の一実施例を示した図である。
【発明を実施するための形態】
【0014】
本発明の類似画像検索システムは、例えば、撮像装置、撮像装置から送信された画像データを記録する録画装置、および録画装置に記録された画像データから所望の画像を検索し、当該検索した画像を要求して表示する端末装置から構成される類似画像検索システムにおいて、録画装置は、当該録画装置の各部の制御および所定の機能を実現するための第1のプログラムを実行する第1のCPUと、検索のための画像データおよび第1のCPUで実行する前記第1のプログラムをロードして格納する第1の主記憶部と、撮像装置から受信した画像データおよび第1のプログラムを格納する第1の補助記憶部とからなる。
また端末装置は、例えば、当該端末装置の各部の制御および所定の機能を実現するための第2のプログラムを実行する第2のCPUと、表示装置に表示するための画像データや第2のCPU261で実行する第2のプログラムをロードして格納するための第2の主記憶部と、検索キーワード、画像データ、および第2のプログラムを格納する第2の補助記憶部とからなる。
【0015】
また例えば、第1のCPUは、撮像装置から受信した画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う人物領域検出部、人物領域検出部で検出した領域に対して画像認識技術を用いて特徴量算出を行う人物特徴量抽出部、人物特徴量抽出部で算出した特徴量を主記憶部に記録する人物特徴量記録部、端末装置からの検索要求の受信を行う要求受信部、要求受信部にて受信した検索要求に応じて検索を行う検索部、検索部から得た検索結果を端末装置に送信する検索結果送信部、要求受信部が前記端末装置から受信したキーワード付与要求に基づきキーワードを主記憶部に記録するキーワード記録部、要求受信部が受信した検索要求データ中にキーワードが含まれていた場合には、補助記憶部に記録された画像データについてキーワードで検索を行うキーワード検索部を備える。
また例えば、第2のCPUは、検索要求の録画装置への送信を行う検索要求送信部、検索結果画像および検索結果データを録画装置から受信する検索結果受信部、検索結果受信部にて受信した検索結果画像を画面表示する検索結果表示部、録画装置から入力された画像データを連続動画表示する再生画像表示部、ユーザによる操作内容の検知および取得を行う画面操作検知部、キーワード付与要求を前記録画装置に送信するキーワード付与要求送信部を備える。
【0016】
さらに、本発明の類似画像検索システムの検索要求は、類似画像検索要求と登場イベント検索要求である。
【0017】
以下、本発明に係る一実施形態を、図1〜図7および図8A〜図8Hを用いて説明する。なお、各図の説明において、共通な機能を有する構成要素には同一の参照番号を付し、できるだけ説明の重複を避けるため、説明を省略するようにした。
【0018】
まず、図1〜図4を用いて、本発明の一実施形態に係る類似画像検索システムの構成について説明する。図1は、本発明の類似画像検索システムの一実施例のシステム構成図である。また図2は、撮像装置のハードウェア構成図である。また図3は、録画装置のハードウェア構成図である。また図4は、端末装置のハードウェア構成図である。
【0019】
類似画像検索システムは、図1に示すように、ネットワーク200に、撮像装置201、録画装置102、端末装置103が接続され、互いに通信可能な状態で構成される。
ネットワーク200は、データ通信を行う専用ネットワークやイントラネット、インターネット、無線LAN(Local Area Network)等の各装置を相互に接続して通信を行う通信手段である。
撮像装置201は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)素子等で撮像した画像にデジタル変換処理を施し、変換処理された画像データを、ネットワーク200を介して録画装置へ送信するネットワークカメラや監視カメラ等の装置である。
録画装置102は、ネットワーク200を介して撮像装置201より入力された画像データをHDD等の記録媒体に記録するネットワークデジタルレコーダ等の装置である。また、本装置には、本発明の類似画像検索システムを含む人物検索機能を搭載している。
【0020】
録画装置102は、機能構成として、画像送受信部210、画像記録部211、再生制御部212、人物領域検出部213、人物特徴量抽出部214、人物特徴量記録部215、属性情報記録部216、要求受信部217、検索部、検索結果送信部220、キーワード記録部110、キーワード検索部111の各処理部よりなる。検索部は、類似人物検索部218および登場イベント検索部219で構成される。
【0021】
図1の録画装置102において、画像送受信部210は、装置外部からの画像の入出力を行う処理部であり、撮像装置201からの入力画像データの受信、端末装置103への出力画像データの送信を行う。
画像記録部211は、入力画像データの記録媒体への書込みや出力画像データの記録媒体からの読出しを行う。書込みの際には、画像データに加え、画像データを読出す際の情報となる画像ID(後述)も併せて記録する。
再生制御部212は、端末装置103への映像再生を制御する。
【0022】
人物領域検出部213は、入力画像データに対し画像認識技術を用いた人物検出を行い、画像中の人物の存在判定をし、人物が存在する場合には、その領域の座標算出を行う。
人物特徴量抽出部214は、人物領域検出部212で検出した領域に対して画像認識技術を用いて特徴量算出を行う。ここで算出する人物特徴量とは、例えば、人物の輪郭の形状や方向、皮膚の色、歩容(どの脚をどのようにどんなタイミングで動かすかといった脚の捌き方)、あるいは、人物を特定する代表的な部位である顔の輪郭の形状や方向、目や鼻、口といった主要構成要素の大きさ、形状、配置関係等が挙げられるが、本実施形態においては、使用する特徴量の種類や数はいずれであってもよい。
人物特徴量記録部215は、人物特徴量抽出部で算出した特徴量の記録媒体への書込みと読出しを行う。画像記録部における画像データの記録媒体と本処理部における人物特徴量の記録媒体とは同一であっても別個であってもよい。
属性情報記録部216は、画像データに関連する属性情報の記録媒体への書込みと読出しを行う。属性情報とは、例えば、画像の撮影時刻や撮像装置番号等である。
【0023】
要求受信部217は、端末装置からの検索要求やキーワード付与要求の受信を行う。検索要求には、類似画像検索要求と、登場イベント検索要求がある。
類似人物検索部218は、要求受信部にて受信した要求が類似人物検索要求であった場合に、類似画像の検索を行う。
登場イベント検索部219は、要求受信部にて受信した要求が登場イベント検索要求であった場合に、登場イベントの検索を行う。
検索結果送信部220は、類似人物検索部218や登場イベント検索部219から得た類似人物検索結果や登場イベント検索結果の端末装置への送信を行う。
キーワード記録部110は、要求受信部にて受信したキーワード付与要求に基づくキーワードの記録媒体への書込みと読出しを行う。
キーワード検索部111は、要求受信部にて受信した検索要求データ中にキーワードが含まれていた場合に、キーワード検索を行う。
【0024】
端末装置103は、ネットワーク機能を有する一般のPC(パーソナルコンピュータ)で実現してもよいし、専用の検索端末でもよい。
端末装置103は、機能構成として、検索要求送信部221、検索結果受信部222、検索結果表示部223、再生画像表示部224、画面操作検知部225、キーワード付与要求送信部112の各処理部にて構成される。また、端末装置103には、本発明を実現するための人物検索機能も搭載している。
【0025】
検索要求送信部221は、検索要求の録画装置への送信を行う。類似人物検索の場合、検索要求データには、検索キー画像が含まれる。また、検索要求データには、絞込みパラメータを含めることも可能である。
検索結果受信部222は、検索結果の録画装置からの受信を行う。検索結果として受信するデータには、録画装置において、類似人物検索、あるいは、登場イベント検索を実施して得られた画像の集合が含まれる。集合を構成する個々の画像は、録画装置に記録された映像から画像サイズ縮小処理等を施して生成される。以下、この個々の画像を「検索結果画像」、検索結果として送受信するデータを「検索結果データ」と称する。
検索結果表示部223は、検索結果受信部にて受信した検索結果の画面表示を行う。表示される画面例については後述する。
再生画像表示部224は、録画装置から入力された画像データの画面への連続動画表示を行う。
画面操作検知部225は、ユーザによる操作内容の検知および取得を行う。
キーワード付与要求送信部112は、キーワード付与要求の録画装置への送信を行う。
【0026】
図2によって、本発明の類似画像検索システムに用いる撮像装置201のハードウェア構成の一実施例を説明する。図2は、本発明の類似画像検索システムに用いる撮像装置のハードウェア構成の一実施例を示す図である。撮像装置201の構成は、撮像部241、主記憶部242、符号化部243、ネットワークインタフェース(I/F)244が、バス240で結合された形態である。
【0027】
図2において、撮像部241は、レンズで撮像した光信号をデジタルデータに変換する。符号化部243は、撮像部241が出力するデジタルデータを符号化して、JPEG(Joint Photographic Experts Group)などの画像データに変換する。主記憶部242は、撮像したデジタルデータ、符号化された画像データを記憶する。ネットワークI/F244は、ネットワーク200を介して、主記憶部242上の画像データを録画装置102に送信するためのインタフェースである。
【0028】
図3によって、本発明の類似画像検索システムに用いる録画装置102のハードウェア構成の一実施例を説明する。図3は、本発明の類似画像検索システムに用いる録画装置のハードウェア構成の一実施例を示す図である。録画装置102のハードウェア構成としては、図3に示すように、CPU(Central Processing Unit)251、主記憶部252、補助記憶部253、ネットワークI/F254が、バス250で結合された形態である。
【0029】
CPU251は、録画装置102の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部252は、DRAMなどの半導体装置で実現され、検索のための画像データやCPU251で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部253は、HDDやフラッシュメモリなどで実現され、主記憶部252より大容量のメモリであり、画像データやプログラムを格納する。ネットワークI/F254は、ネットワーク200を介して、撮像装置201からの画像データを受信したり、端末装置103から検索キーワードを受信したり、端末装置103に画像データを送信するためのインタフェースである。
【0030】
図4によって、本発明の類似画像検索システムに用いる端末装置103のハードウェア構成の一実施例を説明する。図4は、本発明の類似画像検索システムに用いる端末装置のハードウェア構成の一実施例を示す図である。端末装置103のハードウェア構成としては、図4に示すように、CPU261、主記憶部262、補助記憶部263、表示I/F264、入出力I/F265、ネットワークI/F266が、バス260で結合された形態である。また、表示I/F264は、表示装置270と接続し、入出力I/F265は、キーボード280やマウス282などの入出力装置と接続する。
【0031】
図4において、CPU261は、端末装置103の各部の制御と、機能を実現するためのプログラムの実行を行う。主記憶部262は、DRAM(Dynamic Random Access Memory)などの半導体装置で実現され、表示のための画像データやCPU261で実行するプログラムをロードして格納するための中間的なメモリである。補助記憶部263は、HDDやフラッシュメモリなどで実現され、主記憶部262より大容量のメモリであり、検索キーワード、画像データやプログラムを格納する。表示I/F264は、表示装置270と接続するためのインタフェースである。入出力I/F265は、キーボード280やマウス282などの入出力装置と接続するためのインタフェースである。ネットワークI/F266は、ネットワーク200を介して、録画装置102からの画像データを受信したり、録画装置102に検索キーワードを送信したり、録画装置102から画像データを受信するためのインタフェースである。表示装置270は、例えば、LCD(Liquid Crystal Display)などの装置であり、画像や動画をその表示部に表示する装置である。ユーザは、表示装置270の表示部に表示された画像を、キーボード280やマウス282などの入出力装置を操作して、例えばGUI(Graphical User Interface)操作することによって、端末装置103、および、類似画像検索システムを操作する。
【0032】
次に、図5Aと図5Bを用いて本発明の一実施形態に係る類似画像検索システムに用いられるデータ構造について説明する。図5Aと図5Bは、本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図である。
本発明の類似画像検索システムに用いられるデータ構造の一実施例には、図5Aに示すようなフレームテーブル300と、図5Bに示すような属性情報データテーブル310がある。
【0033】
フレームテーブル300は、映像データを格納するためのテーブルである。フレームテーブル300には、画像ID301が付され、付された画像IDと関連付けられたフレームデータ302が記録される。フレームデータ302は、例えば、JPEG形式のデータなどで記録される。
【0034】
属性情報データテーブル310は、画像データを解析した結果の画像についての属性情報データを格納するためのテーブルである。属性情報データテーブル310には、登録ID311が識別のために付与され、付与された登録ID311と関連付けられて、画像ID312、特徴量313、カメラID314、時刻情報315、およびキーワード316が記録される。
例えば、付与された登録ID311と関連付けられて、フレームテーブル300に格納されたフレームの一部が、画像ID312により指定される。また、その画像の特徴量は、特徴量313に、撮像した撮像装置201のIDは、カメラID314に、フレームの撮像時刻に関する情報は、時刻情報315に、フレームに付与されたキーワードは、キーワード316にと、各々のフィールドに格納される。
【0035】
なお、例えば、録画のフレームレートが、30fps(Frames Per Second)のときに、画像の解析を行うのは、その内で、人がいると認識した部分あり、最大3fps程度のフレームレートで画像を捉えて解析を行うのが一般的である。
【0036】
次に図6、図8A、図8B、図8C、および図8Dを用いて、本発明の類似画像検索における類似度が高い検索結果画像を自動的に選択状態にして提示する選択方式について説明する。図6は、本発明の類似画像検索システムの一実施例の類似画像検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。また、図8A〜図8Dは、本発明の類似画像検索において、端末装置103の表示装置270に表示される類似画像検索を行っているときの各フェーズの画面を示す図である。
【0037】
図6において、軸501は、録画装置102の上部から下部へ進む時系列を表し、軸502は、端末装置103の上部から下部へ進む時系列を表している。また、タイミング503〜506は、それぞれ時系列上でのタイミングを表している。各タイミングにおける端末装置103上に表示される画面の一実施例や、ユーザ操作内容の一例については後述する。
【0038】
図6において、通信510〜512は、録画装置102と端末装置103間の主な通信を示している。
通信510と通信511は、リクエストとレスポンスの関係にあり、通信510は、類似人物検索要求を含み、通信511は、類似人物検索結果を含む。この2つの通信により、1回の類似人物検索が実行されることになる。
通信512は、画像に対するキーワード付与要求を含む。
ここで、通信511に含まれる類似人物検索結果には、画像ID301等の属性情報データテーブル310の静的な情報だけでなく、録画装置102における検索処理時に算出された検索キー画像に対する類似度を含むようにする。
本実施例では類似度は0〜100までの範囲の数値とし、100に近いほど検索キー画像に似た画像であることを表すものとする。
【0039】
次に、図8A〜図8Dを用いて、本発明の類似画像検索システムの端末装置103におけるユーザの操作イメージについて説明する。
【0040】
図8Aは、検索実行前の初期状態、すなわち、図6のタイミング503における端末装置103の表示部に表示される検索画面801の一実施例である。ユーザは、この検索画面801から検索を開始する。
図8Aの検索画面801は、再生画像表示領域3001、画像再生操作領域3003、検索キー画像指定領域3004、検索絞込パラメータ指定領域3008、検索実行領域4017、および、検索結果表示領域4020よりなる。
【0041】
図8Aの検索画面801において、再生画像表示領域3001は、録画装置102に記録された画像を動画像として表示する領域である。また再生画像表示領域3001の動画3002は、録画装置に記録された画像を動画像として表示するものである。
画像再生操作領域3003は、録画装置に記録された画像を再生操作する領域である。
本領域3003を構成する各ボタンには、それぞれ固有の再生種類が割当てられている。図8Aにおける各ボタンには、例えば左から、巻戻し、逆再生、再生停止、順再生、早送りの再生種類が割当てられている。ユーザが各ボタンをマウス282で適宜押下することにより、動画3002がボタンに割当てられた再生種類に切り替る。
【0042】
検索キー画像指定領域3004は、検索キー画像の指定と表示を行う領域である。本領域は、検索キー画像3005と、映像指定ボタン3006、ファイル指定ボタン3007よりなる。
検索キー画像3005は、類似検索のためのキーとする画像である。初期状態においては、検索キー画像は、未指定であるので、画像表示はされていない状態となる。なお、未指定の場合に、別途用意した未指定状態を示す画像を表示する等、未指定である旨の表記をするようにしてもよい。
【0043】
映像指定ボタン3006は、押下時に再生画像表示領域3001に表示されている画像を、検索キー画像3005として指定するボタンである。
ファイル指定ボタン3007は、録画装置102に記録されている画像以外の画像、例えば、デジタルスチルカメラで撮影した画像やスキャナで取込んだ画像等を、検索キー画像3005として指定するボタンである。このボタン3007を押下すると、それらの画像をファイル指定するダイアログボックスが表示され、ユーザはそこで所望の画像を指定することができる。
【0044】
検索絞込パラメータ指定領域3008は、検索の際の絞込パラメータの種類とその値(範囲)を指定する領域である。この領域3008は、撮像装置(カメラ)指定チェックボックス3009、3010、3011、3012と、時刻指定チェックボックス3013、3014、時刻指定欄3015、3016から構成される。
【0045】
撮像装置指定チェックボックス3009、3010、3011、3012は、検索の際に検索対象とする撮像装置(カメラ1〜4)を指定するボタンである。本ボタンは、押下すると選ばれたことを示すチェックマークがそれぞれ表示される。このマークは再押下すると非表示となり、押下で表示と非表示を繰り返す。
初期状態においては、全撮像装置を検索対象とするため、撮像装置指定チェックボックスは全て選択状態となる。
【0046】
時刻指定チェックボックス3013、3014は、検索の際に検索対象とする時刻範囲を指定するボタンである。表示の態様については本ボタンも他のチェックボックスと同様である。時刻指定チェックボックス3013を選択状態にした場合には時刻範囲に先頭時刻を与える。非選択状態にした場合には、時刻範囲に先頭時刻を与えない、即ち、録画装置に記録された最も古い時刻の画像までを検索対象範囲とすることを意味する。
同様に時刻指定チェックボックス3014を選択状態にした場合には時刻範囲に末尾時刻を与える。非選択状態にした場合には、時刻範囲に末尾時刻を与えない、すなわち、録画装置に記録された最も新しい時刻の画像までを検索対象範囲とすることを意味する。
時刻指定欄3015、3016は、上述の先頭時刻と末尾時刻の値を指定する入力欄である。
初期状態においては、全時間帯を検索対象とするため、時刻指定チェックボックスは全て非選択状態、時刻指定欄は空欄とする。
【0047】
検索実行領域4017は、検索実行を指示する領域である。本領域は、類似人物検索ボタン3018と登場イベント検索ボタン3019に加え、キーワード指定チェックボックス4021とキーワード指定欄4022、キーワード付与ボタン4023よりなる。
類似人物検索ボタン3018は、検索キー画像3005による類似人物検索実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って検索の実行をすることを指示する。
登場イベント検索ボタン3019は、登場イベント検索実行を指示するボタンである。検索絞込パラメータ指定領域3008にてパラメータが指定されている場合には、指定されたパラメータに従って検索の実行をすることを指示する。
キーワード指定チェックボックス4021は、キーワード指定欄4022の有効または無効を指定するボタンである。表示の態様については本ボタンも撮像装置指定チェックボックスと同様である。
キーワード指定欄4022は、キーワードの値を指定する入力欄である。
キーワード付与ボタン4023は、キーワード指定欄4022に入力されたキーワードの付与実行を指示するボタンである。
初期状態においては、キーワード指定チェックボックス4021は、非選択状態、キーワード指定欄4022は、空欄とする。
キーワードの働きや、類似人物検索ボタン3018や登場イベント検索ボタン3019とキーワードとの関係については、後述する。
【0048】
検索結果表示領域4020は、検索結果を表示する領域である。検索結果の表示は、検索結果画像を一覧表示することにより実施する。初期状態においては、検索結果表示領域4020には何も表示されない。
ここで、ユーザは、映像指定ボタン3006を押下し、また、撮像装置指定チェックボックス3009、3010、3012を押下し、さらに、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015、3016にそれぞれ「2009/6/26 15:30:20」「2009/7/13 12:30:20」と入力する。
この操作により、検索画面は、類似人物検索実行直前状態、すなわち、図6のタイミング504の端末装置103の状態に遷移する。図8Bは、この状態における検索画面802の一実施例を示したものである。
【0049】
図8Bの検索画面802において、検索キー画像3005には、動画3002に表示された人物「Aさん」が検索キー画像として表示され、また、検索対象としたい撮像装置として「カメラ1、カメラ2、カメラ4」の3つの撮像装置が指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」と指定されている状態を示している。
ここで、ユーザが、類似人物検索ボタン3018を押下する。この押下によって、タイミング504から、検索画面は、類似人物検索実行直後状態、即ち、図6のタイミング505の端末装置103の状態に遷移する。図8Cは、この状態における検索画面803の一実施例を示したものである。
【0050】
図8Cの検索画面803において、検索結果表示領域4020には、検索キー画像3005をキーとして類似人物検索を実行し得られた検索結果を表示している。検索結果の表示は、検索結果画像3031〜3141を検索結果表示領域4020に一覧表示することにより実施する。
検索結果画像3031〜3141は、例えば、最上段左から右へ、次に2段目左から右へと検索キー画像に対する類似度順に表示する。この表示例においては、検索結果画像3031が検索キー画像3005に対し最も類似度が高く、検索結果画像3141が最も類似度が低いということを示している。
ここで検索結果表示領域4020に表示されているのは、「カメラ1、カメラ2、カメラ4の2009/6/26 15:30:20から2009/7/13 12:30:20までの画像で、Aさんと類似した画像」を検索要求した検索結果である。
【0051】
図8Cに示された表記において、検索結果表示領域4020内の検索結果画像上に図示した円とアルファベットは、人物の顔と人物名称を簡略表示したものである。
例えば、検索結果画像3031には、人物「Aさん」が登場することを示している。この簡略表示している部分には、もちろん、実際のシステムでの表示では実画像が表示される。
検索結果画像3031の周辺には、頭出し再生ボタン3032と検索キー画像指定ボタン3033、キーワード対象チェックボックス4034を備える。他の検索結果画像でも同様である。
頭出し再生ボタン3032は、検索結果画像を先頭とした連続動画再生開始を指示するボタンである。例えば、頭出し再生ボタン3032を押下すると動画3002が検索結果画像3031に切り替り、その検索結果画像を先頭として始まる動画をユーザは、視聴することができる。
【0052】
検索キー画像指定ボタン3033は、検索結果画像3031を検索キー画像3005として指定するボタンである。例えば、検索キー画像指定ボタン3033を押下すると、検索結果画像3031が、検索キー画像3005に表示される。これにより、指定された検索結果画像3005を使って、画像の再検索を実施することができる。
類似度表示欄8035は、検索キー画像に対する類似度を表示する領域である。検索結果画像3031の類似度表示欄8035には、例えば、90という値が表示されており、他の検索結果の類似度表示欄にもそれぞれ数値が表示されている。
キーワード付与チェックボックス4034は、キーワード付与の対象となる検索結果画像を指定するボタンである。表示の態様については本ボタンも他のチェックボックスと同様である。例えば、ユーザが、キーワード付与チェックボックス4034を押下すると、チェックマークが表示され、検索結果画像3031が、キーワード付与対象となる。
【0053】
この図8Cに示された実施例は、「Aさん」を目的に類似人物検索を実行した際の検索結果である。したがって、検索結果画像3031、3041、3051、3061、3081、3091、3121、3141が正解で、検索結果画像3071、3101、3111、3131が不正解であるということを示している。
ここで、類似度表示欄8035の数値が一定以上、図8Cにおいては75以上の検索結果画像3031、3041、3051、3061、3071、3081、3091のキーワード付与チェックボックスが既選択状態になっている。
【0054】
類似人物検索実行直後(タイミング505)の状態において、キーワード対象チェックボックス4034を、本発明のように類似度によって選択状態か否かを切り替える処理を設けることによって、全て非選択状態にする方法や全て選択状態にする従来の方法と比較し、少ない選択操作数で正解画像を選択できる。
例えば、正解である検索結果画像3031、3041、3051、3061、3081、3091、3121、3141を全て選択する場合、類似人物検索実行直後状態に全て非選択状態にする方法では、8回の選択操作が必要であり、類似人物検索実行直後状態に全て選択状態にする方法では4回の選択を外す操作が必要である。一方、本発明の方法では1回の選択を外す操作と2回の選択する操作の計3回の操作で良い。
【0055】
また、ユーザがキーワード指定チェックボックス4021を押下し、キーワード指定欄4022に「Aさん」と入力し、さらにキーワード付与ボタン4023を押下する。ユーザのこの操作によって、検索画面803は、キーワード付与実行直後のキーワード指定欄4022に「Aさん」入力状態となる。即ち、図6のタイミング506の端末状態103に遷移する。図8Dは、タイミング506における検索画面804の一例を示したものである。
【0056】
次に図7、図8A、図8D、図8F、図8G、図8H、および図5Cを用いて、本発明の登場イベント検索における類似度を用いたキーワードの付与候補を提示する方式について説明する。図7は、本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置と端末装置の間の処理シーケンス図の一実施例を示すである。また図5Cは、本発明の類似画像検索システムに用いられるデータ構造の一実施例を示す図であり、類似画像検索の検索結果に含まれるデータ320を示すものである。
【0057】
図7を用いて、本発明の登場イベント検索結果からのキーワード付与における録画装置102と端末装置103の間の登場イベント検索の処理シーケンスを説明する。図7は、本発明の類似画像検索システムにおいて、登場イベント検索結果からのキーワード付与における録画装置102と端末装置103の間の処理シーケンス図である。
ここで、図6と同様に、図7の軸501と軸502は、録画装置102、端末装置103の上部から下部へ進む時系列を表している。また、タイミング703〜707は、それぞれ時系列上でのタイミングを表している。各タイミングにおける端末装置103の表示部上に表示される画面の一例や、ユーザ操作内容の一例については後述する。
【0058】
図7において、通信711〜718は、録画装置102と端末装置103間の主な通信を示している。
通信711と通信712は、リクエストとレスポンスの関係にあり、通信711には登場イベント検索要求を、通信712には登場イベント検索結果を含み、この2つの通信により、1回の登場イベント検索要求が実行されることになる。さらに通信713は類似人物検索要求を、通信714は類似人物検索結果を含む。通信716、717についても同様である。通信715には、画像に対するキーワード付与要求を含む。通信718についても同様である。
【0059】
次に、図8E、図8D、図8F、図8G、および図8Hを用いて本発明の類似画像検索システムの端末装置103におけるユーザの操作イメージについて説明する。
図8A、図8E、図8F、図8G、図8Hは、本発明の類似画像検索において、端末装置103の表示装置270に表示される登場イベント検索を行っているときの各フェーズの画面を示す図である。
【0060】
図8Aは、前述したように、検索実行前の初期状態(検索画面801)である。ここでは、図7のタイミング703における端末装置103での検索画面の一実施例である。
ここで、ユーザは、撮像装置指定チェックボックス3009、3010、および3012を押下し、さらに、時刻指定チェックボックス3013、3014を押下し、時刻指定欄3015、3016にそれぞれ「2009/6/26 15:30:20」「2009/7/13 12:30:20」と入力する。
このユーザ操作により、検索画面は、登場イベント検索実行直前状態、即ち、図7のタイミング704の端末装置103の状態に遷移する。図8Eは、この状態における検索画面805の一実施例を示したものである。
【0061】
検索対象としたい撮像装置として「カメラ1、カメラ2、カメラ4」の3つが指定され、検索対象としたい時刻範囲として「2009/6/26 15:30:20から2009/7/13 12:30:20まで」と指定されている状態を示している。
図8Bの検索画面802と比較すると、図8Eの検索画面805では、検索キー画像3005が指定されていない。
ここで、ユーザが、登場イベント検索ボタン3019を押下する。すると、検索画面805は、登場イベント検索実行直後状態、すなわち、図7のタイミング705の端末装置103の状態に遷移する。図8Fは、この状態における検索画面806の一例を示したものである。
【0062】
ここで、図8F等における8036は、人物矩形表示であり、人物を矩形で囲ったものである。人物矩形表示8036の選択は、マウスでクリックするなどのユーザ操作によって可能である。選択状態の人物顔矩形表示8036を再度選択すると、非選択状態にできる。選択状態と非選択状態は矩形枠の太さを変えて提示する場合や、色を変えて提示する場合がある。
登場イベント検索では、検索結果画像3081のように1つの画像に2つ以上の選択すべき人物が現れる場合がある。このため、図8Cのキーワード対象チェックボックス4034ではなく、人物矩形表示8036のような選択可能な表示を設ける。
なお、他の項目に関しては図8Cと同じであるので説明を省略する。
【0063】
ここで、ユーザが、検索結果画像のうちの1つである検索結果画像3031にキーワードを付与したいと考えていて、キーワードを与える操作を、過去にユーザあるいは他のユーザが行っている場合を想定する。
このとき、ユーザは、検索結果画像3031の人物矩形表示8036をマウスでクリックして選択操作を行う。その結果、検索画面は、人物選択済み状態、即ち、図7のタイミング706の端末装置103の状態に遷移する。
このとき、端末装置103内部ではAさんの人物画像をキー画像にして類似人物検索要求を行っている。
【0064】
ここで、前術の実施例で、図8Aから図8B、および図8Bから図8Cに遷移したときと比較すると、検索キー画像3005は指定されておらず、検索結果表示領域4020も更新されず、バックグランドで類似人物検索要求処理が行われることに注意されたい。
本実施例では、類似人物検索結果に属性情報と検索キー画像に対する類似度が格納されている。即ち、ここではAさんに類似した画像のキーワードと類似度が取得できる。
図5(c)に示すデータ320は、類似画像検索の検索結果に含まれるデータであり、検索結果の返送データのうち本発明に必須の部分である。
類似画像検索の検索結果に含まれるデータ302は、ここでは、キーワード「Aさん」「Bさん」「Cさん」が付与されているものおよび空欄すなわちキーワード未付与のものが検索結果として返送されていることを表す。
【0065】
図7のタイミング706の端末装置103の状態では、図8Gの検索画面807が表示される。図8Gは、登場イベント検索後のユーザよる人物選択操作後の検索画面の一実施例を示したものである。
ここで、人物矩形表示8036は、選択済み状態を表す太枠表示になっている。
また、キーワード指定欄4022がキーワード指定およびキーワード候補選択欄8100になっている。
キーワード指定およびキーワード候補選択欄8100は、キーワードを入力することが可能であり、候補表示されている中から選択することも可能である。
【0066】
端末装置103は、検索結果データのうち同一キーワードで最も類似度が高いものを選んで、キーワード候補表示欄である8100に表示する。
ユーザは、これを見て、キーワード候補表示欄8100の「Aさん」が目的の「Aさん」であることを確認し、マウスを使ってクリックなどで選択する。すると、図7のタイミング707の端末装置103の状態に遷移する。図7のタイミング707の端末装置103の状態では図8Hの検索画像808が表示される。
図8Hの8037はキーワード表示欄である。キーワード表示欄8037には付与済みのキーワードが表示される。
【0067】
ユーザは、以後も、検索結果画像の中から1つあるいは複数同時に選択して、キーワード付与操作を行うことができる。1回の登場イベント検索におけるユーザのキーワード付与操作が全て終われば、ユーザは条件を変えて再度登場イベント検索を行うこともできる。
このようにすることで、ユーザが「Aさん」の名前の正確な漢字やスペルを知らなくても、他のユーザが正確な漢字やスペルを入力済みであれば、誤りなく入力できる。また、ユーザが、毎回キーボードで「Aさん」の名前を入力しなくても、マウスでクリックするだけで、キーワードを付与する作業を行うことができる。
【0068】
ここまでに示したように、本実施形態に示した類似画像検索システムより、ユーザは類似画像検索の結果に対し、より少ない結果画像の選択回数でキーワードの付与を行うことを可能にした。また、ユーザが登場イベント検索においてキーワードを付与する場合に毎回キーボードによる正確なキーワードの入力を行う必要のないキーワード付与を可能にした。
【0069】
また、ここまでの説明においては、撮像装置、録画装置、および端末装置は、各1台に限られず、図1に示したように、撮像装置や端末装置が複数台接続されていてもよい。また、図1では、録画装置は、1台のみであったが、録画装置が複数台接続されていてもよい。
【0070】
本実施形態においては、図7に示すように、登場イベント検索後の検索結果選択後に類似人物検索要求を行った。しかし、登場イベント検索要求711時に録画装置102内部において類似人物検索要求されたのと同等の処理を行い、あらかじめ各々の検索結果画像に対する類似度によるキーワード付与候補を含めたものを登場イベント検索結果712として、検索結果選択時に都度行う類似人物検索要求を省略するような実施形態でもよい。
【0071】
また、本実施形態においては、図8Gに示すように、キーワード候補表示欄である8100にキーワードと類似度を表示したが、件数を含めてもよい。図5(c)の類似画像検索の検索結果に含まれるデータ302においては「Aさん」が3件、「Bさん」および「Cさん」がそれぞれ1件という結果となり、これをキーワード候補表示欄である8100に表示することでユーザの判断の参考情報を増やすような実施形態でもよい。
【0072】
また、本実施形態においては、類似度を図5(c)に示すように、キーワード未付与の検索結果も通信したが、キーワード未付与のものを通信から除くような実施形態でもよい。
また、本実施形態においては、人物検索に関わる人物検出処理や人物特徴量抽出処理等を録画装置上で実施する構成で説明したが、ネットワークで接続された録画装置とは別個の装置にて実施するようにしてもよい。
また、本実施形態においては、キーワードが文字列であるように示したが、特定の番号や記号列にて実施するようにしてもよい。
さらに、本実施形態においては、人物検索を対象に示したが、本発明は人物だけでなく一般的な画像検索にも適用することができる。
【符号の説明】
【0073】
102:録画装置、 103:端末装置、 110:キーワード記録部、 111:キーワード検索部、 112:キーワード付与要求送信部、 200:ネットワーク、 201:撮像装置、 202:録画装置、 203:端末装置、 210:画像送受信部、 211:画像記録部、 212:再生制御部、 213:人物領域検出部、 214:人物特徴量抽出部、 215:人物特徴量記録部、 216:属性情報記録部、 217:要求受信部、 218:類似人物検索部、 219:登場イベント検索部、 220:検索結果送信部、 221:検索要求送信部、 222:検索結果受信部、 223:検索結果表示部、 224:再生画像表示部、 225:画面操作検知部、 240:バス、 241:撮像部、 242:主記憶部、 243:符号化部、 244:ネットワークI/F、 250:バス、 251:CPU、 252:主記憶部、 253:補助記憶部、 254:ネットワークI/F、 260:バス、 261:CPU、 262:主記憶部、 263:補助記憶部、 264:表示I/F、 265:入出力I/F、 266:ネットワークI/F、 270:表示装置、 280:キーボード、 282:マウス、 300:フレームテーブル、 301:画像ID、 302:フレームデータ、 310:属性情報データテーブル、 311:登録ID、 312:画像ID、 313:特徴量、 314:カメラID、 315:時刻情報、 316:キーワード、 320:類似画像検索の検索結果に含まれるデータ、 801、802、803、804、805、806、807、808:検索画面、 3001:再生画像表示領域、 3002:動画、 3003:画像再生操作領域、 3004:検索キー画像指定領域、 3005:検索キー画像、 3006:映像指定ボタン、 3007:ファイル指定ボタン、 3008:検索絞込パラメータ指定領域、 3009〜3012:撮像装置指定チェックボックス、 3013〜3014:時刻指定チェックボックス、 3015〜3016:時刻指定欄、 3017:検索実行領域、 3018:類似人物検索ボタン、 3019:登場イベント検索ボタン、 3020:検索結果表示領域、 3031、3041、3051、3061、3071、3081、3091、3101、3111、3121、3131、3141:検索結果画像、 3032:頭出し再生ボタン、 3033:検索キー画像指定ボタン、 4017:検索実行領域、 4020:検索結果表示領域、 4021:キーワード指定チェックボックス、 4022:キーワード指定欄、 4023:キーワード付与ボタン、 4034:キーワード付与チェックボックス、 8035:類似度表示欄、 8036:人物矩形表示、 8037:キーワード表示欄、 8100:キーワード指定およびキーワード候補選択欄。
【特許請求の範囲】
【請求項1】
撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、
前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有することを特徴とする類似画像検索システム。
【請求項2】
撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、
前記端末装置は、前記録画装置が当該登場イベント検索手段を実行した結果を表示し、
前記録画装置は、前記端末装置に表示された画像データの一覧から、ユーザによって選択された画像を検索キー画像として類似度が高い画像データを検索し、類似画像検索結果にキーワード付与済みの結果が含まれていれば、そのキーワードを付与候補として表示する、画像の類似度によらず画像データの一覧を提示する登場イベント検索する手段を有することを特徴とする類似画像検索システム。
【請求項1】
撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、
前記録画装置は、前記画像データの特徴量を抽出して、画像の類似度を評価し、検索キー画像を指定して、指定された当該検索キー画像に対して類似度が高い画像データを検索し、各々の画像データにキーワードを付与する手段と、前記キーワードの付与候補を動的に提示する手段を有することを特徴とする類似画像検索システム。
【請求項2】
撮像装置、前記撮像装置から入力された画像データを記録媒体に記録する録画装置、および端末装置から構成される類似画像検索システムにおいて、
前記端末装置は、前記録画装置が当該登場イベント検索手段を実行した結果を表示し、
前記録画装置は、前記端末装置に表示された画像データの一覧から、ユーザによって選択された画像を検索キー画像として類似度が高い画像データを検索し、類似画像検索結果にキーワード付与済みの結果が含まれていれば、そのキーワードを付与候補として表示する、画像の類似度によらず画像データの一覧を提示する登場イベント検索する手段を有することを特徴とする類似画像検索システム。
【図1】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図6】
【図7】
【図8A】
【図8B】
【図8C】
【図8D】
【図8E】
【図8F】
【図8G】
【図8H】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図6】
【図7】
【図8A】
【図8B】
【図8C】
【図8D】
【図8E】
【図8F】
【図8G】
【図8H】
【公開番号】特開2012−242878(P2012−242878A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−109071(P2011−109071)
【出願日】平成23年5月16日(2011.5.16)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願日】平成23年5月16日(2011.5.16)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】
[ Back to top ]