説明

ジョブ監査システム

【課題】 属性検索および全文検索と画像検索のプリサーチを統合し、1回の検索で効率的な絞込みを行なえるようにする。また、属性検索および全文検索の結果を画像検索に受け渡す処理を不要として、検索パフォーマンスを向上する。
【解決手段】 属性・全文検索命令とプリサーチ命令を合わせてデータベースへ発行する。そのために、属性・全文検索命令を画像検索サーバーへ送信する。画像検索サーバーは、属性・全文検索命令を受信し、別途生成したプリサーチ命令と統合してからデータベースへ発行する。その結果に対し、画像検索として類似度算出処理を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置で実行されたジョブのログデータを蓄積し、後に追跡可能とすることで、情報漏洩を抑止するジョブ監査システムに関するものである。
【背景技術】
【0002】
近年、コンピュータ技術の発達やデジタル複合機の普及に伴い、原稿の印刷や複写、送信などの作業が容易に行なえるようになっている。このような利便性向上の反面、機密文書の印刷やコピーといった情報漏洩の可能性が増加し、企業活動において情報管理が重要な問題となっている。こうした情報漏洩の対策として、プリンタ及びデジタル複合機などのジョブ(プリントやコピー、FAX送受信など)の実行情報をログデータとして記憶装置に蓄積しておくジョブ履歴監査システムがある。このようなシステムでは、蓄積されたジョブログデータを参照することで、情報が漏洩した場合にその情報がいつ、どこで、どのような処理をされたか、といった情報を追跡できる。したがって、不正なジョブ実行の抑止、ひいては情報漏洩の抑止が期待できる。
【0003】
このようなジョブ監査システムでは一般的に、ジョブ実行ユーザーやジョブ開始時刻などの属性情報と、ジョブで扱った文書の内容であるコンテンツ情報を関連付けて、ログとして蓄積する。コンテンツ情報には、文書に含まれるテキスト情報と、文書に含まれる画像情報がある。そのため、ジョブログを検索するためには、属性情報に対する属性検索、テキスト情報に対する全文検索、そして画像情報に対する画像検索を組み合わせる必要がある。
【0004】
属性検索および全文検索は、指定した文字列と一致するものを検索する単純なキーワードマッチング処理である。それに対し画像検索は、二つの画像の特徴量を比較し、類似度を算出する処理である。画像検索は演算処理が必要なため、属性検索や全文検索に対して検索処理に時間がかかる。そのため、これらの検索を組み合わせて行なう場合は、まず属性検索や全文検索で絞込みを行ない、その結果に対して画像検索を行なうことで、検索パフォーマンスが改善される。これらの検索を行なう手法として、特許文献1および特許文献2がある。
【0005】
特許文献1では、属性検索と画像検索の複合検索を行っている。特許文献2では、画像検索のコストを削減する方法として、類似度算出処理の前に画像の内容に基づき絞込みを行っている(プリサーチと呼ぶ)。プリサーチの手法として、特許文献2のように画像領域数を考慮するものや、特徴量の輝度を考慮するもの、画像の縦横比を考慮するものなどがある。
【特許文献1】特開平07−160731号公報
【特許文献2】特開2004−355370号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来の技術では、まず特許文献1に書かれている方法では、画像検索の前に属性検索を行い絞り込んでいるが、画像特徴量での絞込みが考慮されていない。そのため、属性検索でヒットしたものについては、明らかに類似していない画像に対しても、類似度算出処理を行なう必要があり、無駄なコストがかかる。一方、特許文献2に書かれている方法では、画像の内容を考慮し、類似度算出の前にプリサーチを行い、画像検索のコストを削減している。しかし、属性検索や全文検索と組み合わせることで、さらに検索コストを削減することが可能である。ただし、ジョブ監査システムでは大量のデータを蓄積するため、検索結果が膨大になる。そのため、複数の検索を組み合わせて行なう場合、それぞれの検索結果が膨大であると、その受け渡しに時間がかかるという問題がある。
【課題を解決するための手段】
【0007】
上述した課題を解決するために、データベースにジョブログデータを蓄積するジョブ監査システムは、
検索条件としてキーワードとクエリ画像を入力する検索条件入力手段と、
前記キーワードから属性・全文検索命令を生成する属性・全文検索命令生成手段と、
前記クエリ画像から抽出した特徴量と類似した特徴量をもつ画像を選択するための命令を生成する、類似画像選択命令生成手段と、
前記属性・全文検索命令と前記類似画像選択命令を1つに結合する検索命令結合手段と、
前記検索命令手段によって結合された検索命令で検索を行い、一時結果を作成する一時結果作成手段と、
前記一時結果を母集団とし、その母集団に含まれる画像の特徴量と前記クエリ画像の特徴量を比較する類似度算出手段と、
前記類似度算出手段の結果を一時結果テーブルに追記する検索結果作成手段と、
前記検索結果を表示する検索結果表示手段と、
を有することを特徴とする。
【発明の効果】
【0008】
本発明は、上記のような構成を有することで、属性検索および全文検索と画像検索のプリサーチを統合し、1回の検索で効率的な絞込みを行なうことができる。また、属性検索および全文検索の結果を画像検索に受け渡す処理が不要になるため、検索パフォーマンスが向上する。
【発明を実施するための最良の形態】
【0009】
次に、本発明の詳細を実施例の記述に従って説明する。
【実施例1】
【0010】
以下、本発明の実施例を図面に基づいて説明する。
【0011】
図1は、本実施形態におけるシステム構成図を示す。図示するように、LANなどのネットワーク101を介して、各構成要素が相互に接続されている。クライアントPC102は、ユーザーの検索指示に応じて検索条件を検索サーバー103へ送信する。検索サーバー103は、クライアントPC102から受信した検索条件に応じて、属性検索用の検索命令、および全文検索用の検索命令を生成し、データベースサーバー105に対して属性全文検索を行なう。また、検索サーバー103は、クライアントPC102から検索条件として入力された画像で画像検索を行なうために、画像検索サーバー104へ画像検索要求を送信する。画像検索サーバー104は、検索サーバー103から受信した検索要求に応じて、データベースサーバー105に対して画像検索を行なう。そして、画像検索が完了したら検索サーバー103に対して画像検索完了通知を行なう。検索サーバー103は、データベースサーバー105に発行した属性検索および全文検索の完了と、画像検索サーバー104からの画像検索完了通知の受信をもって、すべての検索完了とし、検索結果をクライアントPC102へ提示する。
【0012】
本実施例では、検索サーバー103と画像検索サーバー104を異なるPCとして示しているが、同一のPCに配置しても良い。
【0013】
図2は、クライアントPC102、検索サーバー103、画像検索サーバー104、データベースサーバー105のハードウェア構成を示すブロック図である。いずれもIBM−PC/AT互換機などの汎用PCなので、同じブロック図としている。なお、本発明の機能が実行されるのであれば、単体の機器であっても、複数の機器からなるシステムであっても、LAN等のネットワークを介して接続され、処理が行われるシステムであってもよい。
【0014】
CPU201は、内部バスで接続される各デバイス(後述のROM、RAM他)を直接或いは間接的に制御し、本発明を実現するためのプログラムを実行する。ROM202は、BIOSなどの基本ソフトウェアを格納している。RAM203は、CPU201のワークスペースや、本発明を実現するためのプログラムをロードするための一時記憶領域として利用される。HDD204は、前記プログラムをファイルとして格納してある。入力装置205は、前記プログラムの中で操作画面を持つものを操作する機能を備える。モニタ206は、前記操作やプログラムの動作を確認するのため表示機能を備える。ネットワークインタフェース207は、ネットワークに接続するための機能を備える。
【0015】
システムで動作するアプリケーションやサービスはHDD204に格納されており、実行時にはRAM203上にロードされ、CPU201の制御のもと実行される。
【0016】
図3は、検索サーバー103の処理を示すフローチャートである。ステップS301では、クライアントPC102でユーザーが入力した検索条件を受信する。検索条件としては、ジョブ開始時刻やジョブ実行ユーザーなどを対象とした属性検索条件と、文書に含まれる文字列を対象とした全文検索条件と、文書に含まれる画像を対象とした画像検索条件がある。ステップS302では、ステップS301で受信した検索条件に、属性検索条件および全文検索条件と、画像検索条件の両方が指定されているかどうかを判断する。属性検索条件および全文検索条件と、画像検索条件の両方が検索条件に含まれている場合、ステップS303では、属性検索条件と全文検索条件から属性全文検索命令を生成する。ステップS304では、ステップS303で生成した属性全文検索命令と、ステップS301で受信した画像検索条件を画像検索サーバー104へ送信する。ここで、従来の技術では、ステップS304において属性全文検索命令をデータベースサーバー105へ送信し、作成された属性全文検索結果と画像検索条件を画像検索サーバー104へ送信していた。そして、画像検索サーバー104において、データベースサーバー105で生成した属性全文検索結果を対象とし、プリサーチ命令を実行していた。
【0017】
ステップS305では、画像検索サーバー104からの画像検索終了通知を受信する。ステップS306では、検索結果をクライアントPC102へ提示する。
【0018】
ステップ302において、属性検索条件および全文検索条件と、画像検索条件の一方のみが指定されていた場合、属性全文検索命令と画像検索のプリサーチ命令が同時に実行されることはない。そのため、ステップS307では、ステップS301で指定された検索条件に基づき、検索サーバー103で属性全文検索を行なうか、画像検索サーバー104で画像検索を行なうか、一方の処理となる。
【0019】
図4は、画像検索サーバー104の処理を示すフローチャートである。ステップS401では、検索サーバー103から属性全文検索命令と画像検索条件を受信する。ステップS402では、画像検索条件から画像検索のプリサーチ命令を生成する。ステップS403では、検索サーバー103から受信した属性全文検索命令と、ステップS402で生成したプリサーチ命令を統合する。なお、ステップS402とステップS403を統合し、プリサーチ命令を生成する際に属性全文検索命令を解析することで、統合された検索命令を直接生成してもよい。ここで、検索命令を統合する手段は、検索命令を統合せずに2回実行した場合と結果が同じになるような方法であれば、どのようなものでも構わない。S404では、ステップS403で生成した統合検索命令を、データベースサーバー105へ発行する。すなわち、ステップ404で属性条件、全文条件、および画像検索のプリサーチを行い、絞込みを行っている。絞り込んだ結果は、一時結果テーブルとしてデータベース内に書き込む。ステップS405では、ステップS404で作成した一時結果に対して画像検索を行なう。すなわち、ステップS404で作成した一時結果テーブルに対して、画像検索条件として入力された画像との類似度を算出して追記していく。ステップS406では、ステップS405で一時結果テーブルのすべての画像に対する類似度算出が完了した後に、その結果を検索サーバー103へ送信する。
【0020】
図5は、ジョブログの例を示している。コンテンツ情報501は、ジョブで処理した文書の画像情報やテキスト情報から構成される。属性情報502は、IDやジョブ開始時刻などから構成される。ジョブログ503は、コンテンツ情報501と属性情報502が関連付けられた形で蓄積されている。
【0021】
図5に示すジョブログに対して検索を行なうことを考える。属性検索条件として「ジョブタイプ=プリント」や、全文検索条件として「社外秘」が指定されている場合、図5のジョブログは属性全文検索でヒットする。しかし、さらにプリサーチでヒットしなければ画像検索の対象とはならない。すなわち、画像検索条件として与えられた画像が、コンテンツ情報501に含まれる画像と極端に異なる場合には、ジョブログ503は一時結果テーブルに書き出されない。
【0022】
図6は、ステップS404で作成される一時結果テーブルの例である。一時結果として書き出されるジョブログは、属性全文検索でヒットし、かつ画像検索のプリサーチでヒットしたものである。一時結果テーブルが作成された直後は、類似度の列は空欄である。ステップS405の画像検索において、画像検索条件として与えられた画像と、一時結果テーブルに含まれる画像の類似度を算出し、一時結果テーブルに追記する。ステップS306でクライアントPCに対して検索結果を提示する際には、類似度が追記された一時結果テーブルを利用する。
【実施例2】
【0023】
別の実施例では、属性全文検索命令とプリサーチ命令を、検索サーバー103で統合しても良い。
【0024】
図7は、検索サーバー103の処理を示すフローチャートである。ステップS701はステップS301と同一である。ステップS702では、ステップS701で受信した画像検索条件を画像検索サーバー104へ送信する。ステップS703では、画像検索サーバー104からプリサーチ命令を受信する。ステップS704、S705、S706は、それぞれステップS303、S403、S404と同一である。ステップS707は、ステップS706で作成した一時結果テーブルの情報を画像検索サーバー104へ送信する。ステップS708、S709は、それぞれステップS305、S306と同一である。
【0025】
図8は、画像検索サーバー104でのプリサーチ命令生成処理を示すフローチャートである。ステップS801では、ステップS702で検索サーバー103から送信された画像検索条件を受信する。ステップS802は、ステップS402と同一である。ステップS803では、ステップS802で生成したプリサーチ命令を検索サーバー103へ送信する。
【0026】
なお、ステップS802において、プリサーチ命令ではなくプリサーチ命令を生成するために必要な情報を生成し、ステップ803ではその情報を検索サーバー103へ送信しても良い。この場合、検索サーバー103でプリサーチ命令を生成する。
【0027】
図9は、画像検索サーバーでの画像検索処理を示すフローチャートである。ステップS901では、ステップS707で検索サーバー103から送信された一時結果テーブル情報を受信する。ステップS902、S903は、それぞれステップS405、S406と同一である。
【図面の簡単な説明】
【0028】
【図1】本発明の実施形態に係るブロック図
【図2】本発明の実施形態に係るクライアントPC102、検索サーバー103、画像検索サーバー104、データベースサーバー105、の構成を示すブロック図
【図3】検索サーバーの処理を示すフローチャート
【図4】画像検索サーバーの処理を示すフローチャート
【図5】ジョブログの例
【図6】一時結果テーブルの例
【図7】実施例2における検索サーバーの処理を示すフローチャート
【図8】実施例2における画像検索サーバーのプリサーチ命令生成処理を示すフローチャート
【図9】実施例2における画像検索サーバーの画像検索処理を示すフローチャート
【符号の説明】
【0029】
101 ネットワーク
102 クライアントPC
103 属性・全文検索サーバー
104 画像検索サーバー
105 データベースサーバー
201 CPU
202 ROM
203 RAM
204 HDD
205 入力装置
206 モニタ
207 ネットワークインタフェース
501 ジョブログのコンテンツ情報
502 ジョブログの属性情報
503 ジョブログ

【特許請求の範囲】
【請求項1】
データベースに印刷とコピーのログデータを蓄積するジョブ監査システムであって、検索条件としてキーワードとクエリ画像を入力する検索条件入力手段と、
前記キーワードから属性・全文検索命令を生成する属性・全文検索命令生成手段と、
前記クエリ画像から抽出した特徴量と類似した特徴量をもつ画像を選択するための命令を生成する類似画像選択命令生成手段と、
前記属性・全文検索命令と前記類似画像選択命令を1つに結合する検索命令結合手段と、
前記検索命令手段によって結合された検索命令で検索を行い、一時結果を作成する一時結果作成手段と、
前記一時結果を母集団とし、その母集団に含まれる画像の特徴量と前記クエリ画像の特徴量を比較する類似度算出手段と、
前記類似度算出手段の結果を一時結果テーブルに追記する検索結果作成手段と、
前記検索結果を表示する検索結果表示手段と、
を有することを特徴とするジョブ監査システム。
【請求項2】
前記一時結果作成手段は、
検索結果をデータベースに一時的なテーブルとして作成する
ことを特徴とする請求項1に記載のジョブ監査システム。
【請求項3】
前記一時結果作成手段は、
検索結果をメモリ上に保持する
ことを特徴とする請求項1に記載のジョブ監査システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2009−134441(P2009−134441A)
【公開日】平成21年6月18日(2009.6.18)
【国際特許分類】
【出願番号】特願2007−309012(P2007−309012)
【出願日】平成19年11月29日(2007.11.29)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】