情報処理装置、データ処理方法およびプログラム
【課題】 従来、原稿から抽出されるオブジェクトデータをユーザの特性に応じて効率よく再利用することができなかった。
【解決手段】 本発明における情報処理装置は、スキャン画像などの一部に基づく、オブジェクトデータを抽出し、該抽出されたオブジェクトデータと、該オブジェクトデータの属性情報を関連付けて記憶する。そして、ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索し、前記検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合し、当該結合されたオブジェクトデータを検索結果として表示するための制御を行う。また、これら制御において異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、表示される検索結果が異なる。
【解決手段】 本発明における情報処理装置は、スキャン画像などの一部に基づく、オブジェクトデータを抽出し、該抽出されたオブジェクトデータと、該オブジェクトデータの属性情報を関連付けて記憶する。そして、ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索し、前記検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合し、当該結合されたオブジェクトデータを検索結果として表示するための制御を行う。また、これら制御において異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、表示される検索結果が異なる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、原稿から読み取られる画像に含まれるオブジェクトデータの登録と、登録されたオブジェクトの検索とを行う技術に関するものである。
【背景技術】
【0002】
従来から、文書処理システムとして、紙文書やイメージデータの形態で保存された情報の再利用を容易にするために、入力された画像をベクトルデータに変換することを目的とする技術がある(特許文献1)。特許文献1においては、スキャナで読み取り保存された画像をベクトルデータに変換することで、ファイル検索を可能とし、再利用性の向上を図っている。
【特許文献1】特開2004−326490号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ここで、スキャナで読み取り、ベクトルデータとして保存された画像が、ユーザにとって必ずしも再利用しやすいデータであるとは限らない。この点において、上記特許文献1に関して改良の余地がある。
【0004】
例えば、新車の説明をしているカタログをスキャンした場合に、当然そのスキャナで読み取った画像の中には、車の画像と、その説明文など様々な情報が含まれている。このときユーザが、新たに他の車のカタログを作成する際に、車の画像を検索すると、当然車の画像とその説明文など様々な情報が含まれた入力画像全体が検索されてしまうことが考えられる。
【0005】
このような場合において、ユーザの車の画像の検索に対して、入力画像に含まれる一部のデータ(オブジェクトデータ)である、車の画像のみが抽出されれば、ユーザにとって再利用しやすい画像データが入手できることになる。当然、オブジェクトデータを利用して文書作成するユーザの目的が異なれば、例えば車と説明文の組み合わせた情報を検索結果として入手したいかもしれない。
【0006】
つまり、車の画像を検索するユーザにとって再利用に適したデータは、入力画像の中の、車の画像のみや、車と説明文の組み合わせた情報など、様々想定できる。
【0007】
そこで本発明の目的は、スキャナなどで入力された入力画像から抽出されたオブジェクトデータを効率よく再利用することができる仕組みを提供することである。
【課題を解決するための手段】
【0008】
上記目的を達成する本発明の情報処理装置は以下に示す構成を備える。
【0009】
入力画像を処理する情報処理装置であって、前記入力画像の一部に基づく、オブジェクトデータを抽出する抽出手段と、前記抽出手段により抽出されたオブジェクトデータと、当該オブジェクトデータの属性情報を関連付けて記憶する記憶手段と、ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索する検索手段と、前記検索手段により検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合する結合手段と、前記結合手段により結合されたオブジェクトデータを検索結果として表示するための制御手段とを有し、異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、前記制御手段に基づき表示される検索結果が異なることを特徴とする。
【発明の効果】
【0010】
本発明によれば、入力画像から抽出されるオブジェクトデータをユーザの特性に応じて効率よく再利用することができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の発明を実施するための最良の形態について説明する。
【0012】
[システム構成]
図1は、本実施形態を示す情報処理装置を含む文書管理システムの構成を説明する概念図である。
【0013】
図1において、ユーザは、クライアントPC10のブラウザを介して文書管理システムにアクセスする。WebアプリケーションサーバPC20は、文書管理システムのWebアプリケーションを提供する。ユーザ管理サービスサーバPC30は、システムにアクセスするユーザの情報を管理する。オブジェクト管理サービスサーバPC40は、オブジェクトデータを保存/管理する。
【0014】
なお、本システムを構成する各デバイスは、ネットワークを介して通信可能に接続されている。
【0015】
ユーザ管理サービスサーバPC30は、システムへのユーザのログイン認証を行う。このために、ユーザに関する認証情報、ユーザ特性を保持する。なお、本実施形態にかかるユーザ特性として、例えば、ユーザの所属組織(部門)やプロジェクトといった情報も、当該ユーザ管理サービスサーバPC30に保持されている。ここで、ユーザ特性には、例えばユーザの役割、及び所属部門に関する情報が含まれる。
【0016】
複合デバイス50は、紙文書をスキャンする機能を有しており、画像データを生成する際に当該画像データの中からオブジェクトデータを抽出し保存することができる。オブジェクトデータは、当該複合デバイス50が備えるHDDへ格納されるが、オブジェクト管理サービスサーバPC40へ送信して保存させることもできる。ここで、オブジェクトデータをどちらで保存するかはユーザが選択することができるように構成されている。
【0017】
複合デバイス50のHDD中に保持されているオブジェクトデータは、文書管理機能を提供するWebアプリケーションサーバPC20からも参照することができる。
【0018】
つまり、ユーザはオブジェクト管理サービスサーバPC40に格納されているオブジェクトデータと合わせて格納先を意識する必要がない。
【0019】
WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40は、別々に配置されている構成としているが、一つのPCにおいて構成されても構わない。
【0020】
また、WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40は、所定のオペレーティングシステムがインストールされており、ハードディスク等に記憶されるアプリケーションを実行してデータ処理を行う。
【0021】
また、WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40は、後述する図2に示すハードウェア資源を備える。
【0022】
また、ユーザがクライアントPC10を操作する構成としているが、これら3つのサーバPCのいずれか、もしくは全てと同じPCで操作しても構わない。
【0023】
本実施形態に係る文書管理システムは、ユーザがクライアントPC10のブラウザを介してアクセスする構成としているが、図示しない専用のクライアントアプリケーションを該クライアントPC10に配置し、ユーザがそれを操作する構成であっても構わない。
【0024】
この場合、該WebアプリケーションサーバPC20ではなく、該文書管理サービスサーバPC30と該専用クライアントアプリケーションが通信する構成でも構わない。
【0025】
[ハードウェア構成]
図2は、本実施形態に係る文書管理システムを構成する各PCのハードウェアの構成を説明する図である。なお、図2に示されるハードウェア構成は、一般的な情報処理装置のハードウェア構成図に相当するものとし、本実施形態の各PCには一般的な情報処理装置のハードウェア構成を適用できる。
【0026】
図2において、CPU100は、ROM102のプログラム用ROMに記憶された、或いはハードディスク109からRAM101にロードされたOSやアプリケーション等のプログラムを実行する。ここでOSとはコンピュータ上で稼動するオペレーティングシステムの略語であり、以下オペレーティングシステムのことをOSと呼ぶ。後述する各フローチャートの処理はこのプログラムの実行により実現できる。
【0027】
RAM101は、CPU100の主メモリ、ワークエリア等として機能する。キーボードコントローラ103は、キーボード107や図示しないポインティングデバイスからのキー入力を制御する。ディスプレイコントローラ104は、各種ディスプレイ108の表示を制御する。ディスクコントローラ105は、各種データを記憶するハードディスク(HD)やフレキシブル(登録商標)ディスク(FD)等の外部メモリ109におけるデータアクセスを制御する。ネットワークコントロ−ラ(NC)106はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。
【0028】
[ソフトウエア構成]
図3、図4は、本実施形態に係る文書管理システムの一例を示すソフトウエア構成を示す図である。図3は、図1に示したWebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40内のソフトウエア構成を示している。本例は、図1に示したWebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40により文書管理システム500が構成される場合に対応する。
【0029】
また、図4は、図1に示した複合デバイス50のPC40内のソフトウエア構成を示している。本例は、図1に示した複合デバイス50に文書管理システム600の各構成が構成される場合に対応する。
【0030】
なお、図3、図4に示した各々矩形で図示した構成要素は、それぞれがソフトウエアコンポーネントに該当しており、コンポーネントの配置構成はシステム構成やプラットフォームに依存する。
【0031】
図3において、文書管理システム500は、図1で示したユーザ管理サービスサーバPC30、WebアプリケーションサーバPC20、オブジェクト管理サービスサーバPC40に配置されるすべてのソフトウエアコンポーネントが含まれる。
【0032】
図3において、メイン制御部200は、本実施形態に係る文書管理システムのシステム全体を制御し、後述する各部に対する指示、管理を行う。
【0033】
データ送受信部201は、クライアントPC10においてユーザがブラウザを介して出した命令を受け取り、メイン制御部200より指示を受けた結果をクライアントPC10に返答する。
【0034】
セッション記憶部202は、クライアントPC10においてユーザがブラウザを介して本文書管理システムにアクセスしてから、同一ユーザからのアクセスであることを示すためのセッション情報を生成する。更に、ユーザが本文書管理システムへのアクセスをやめる(ログアウト)、もしくは自動タイムアウトなどでセッションが切れるまでの間、繰り返し使用する各種情報をセッション情報と関連付けて保持する。
【0035】
Web UI生成部203は、該メイン制御部200より指示を受け、状況に応じたWeb UI(HTML)を生成する。ここで、該Web UI生成部203が生成するWeb UIは、HTMLだけに限定するものではなく、Java(登録商標)Scriptなどのスクリプト言語が埋まっていても構わない。
【0036】
次に、ユーザ情報操作部300は、該メイン制御部200からの指示に従い、ユーザ情報記憶部301に保存されている本文書管理システム500にアクセス可能なユーザ、及びユーザ特性の取得、設定などの操作を行う。ここで、ユーザ管理に関して、本文書管理システム500の独自管理ではなく、既知の技術であるActive Directory、LDAPなどとユーザ情報操作部300が連携し、該ユーザ情報記憶部301においてはユーザ特性のみを保存しても構わない。
【0037】
次に、オブジェクトデータ操作部400は、メイン制御部200からの指示に従い、オブジェクトデータ記憶部401に対するオブジェクトデータの登録、保存、更新などの操作を行う。ここでは、入力画像データから抽出された部分的なデータであるオブジェクトデータと当該オブジェクトデータに関連する属性情報とが対応付けて管理される。入力画像としては、スキャン画像や画像形成装置で印刷処理される際に扱った画像が含まれる。
【0038】
オブジェクトデータ記憶部401には、オブジェクトデータの属性情報に対するインデックス情報も合わせて保持される。インデックス情報は、属性情報に基づくオブジェクトデータの検索に使用される。オブジェクトデータ記憶部401は、オブジェクトデータ操作部400によって制御される。
【0039】
検索処理部402は、オブジェクトデータ記憶部401に格納されている情報に対して検索処理を行う。ここで、検索処理は、例えばオブジェクトデータに関連付けられている属性情報に対する属性検索処理が挙げられる。また、オブジェクトデータの属性情報に含まれるテキストデータに対する全文検索処理と、画像データに対する類似画像検索処理がある。検索処理部402は、これらの各検索処理を統括し複合検索を行う。また、検索処理のタイムアウトや結果上限値制限、検索処理の中断などといった検索プロセスの管理を行う。
【0040】
決定処理部403は、図6の(B)に示すようにユーザ特性とこれに関連付けて定義されたユーザ意味属性を決定する。ここで、ユーザ意味属性は、ユーザがログインしたときや検索処理を実行する前に決定される。
【0041】
結合処理部404は、検索されたオブジェクトデータをユーザ意味属性に応じて結合する。結合処理の実行については、オブジェクトデータに含まれている位置情報にも、基づく。
【0042】
図4に示す複合デバイス50における文書管理システム600は、上記200〜203、300、301に加えて、意味属性関連付け処理部405、位置情報関連付け処理部406、並びに領域判定部407を備えている。以下、これらの追加のコンポーネントについて説明する。なお、本例の複合デバイス50は、後述するスキャナ部を備え、読み取られる画像情報に含まれるオブジェクトを抽出する処理を行うハードウェア資源を備えている。
【0043】
意味属性関連付け処理部405は、オブジェクトデータを抽出する際に、図6の(A)に示すテーブルを参照して、当該オブジェクトデータに対する意味属性を決定し割り当てる。ここで、オブジェクトデータに対する意味属性の決定は、オブジェクトデータの属性情報である種別属性の判定に加えて、あらかじめ定義してある定義画像A〜Dやキーワード等との類似性をもとに、定義済みの意味属性を決定し割り当てる。ここで、種別属性とは、オブジェクトデータがテキストか画像かといったことを示すための属性である。
【0044】
ここで、意味属性とは、画像データから抽出されたオブジェクトデータが、個々の部品であるか全体かを示す情報を含む。更に、定義済みの定義画像が、例えば、自動車のタイヤであれば(自動車、タイヤ)といった、より一般化したカテゴリと定義済み画像の名称を示す情報も含む。
【0045】
位置情報関連付け処理部406は、画像データから抽出したオブジェクトデータの画像データ中の位置情報を検出し、当該オブジェクトデータに属性情報として関連付ける。
【0046】
領域判定部407は、画像データの中からオブジェクトデータとして切り出せる領域を判定する。ここで、領域判定には、画像データの輝度情報、色情報、エッジ情報などといった要素を元に判断する。
【0047】
[ユースケース並びに検索結果画面]
図5A〜図5Eは、本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。以下、文書管理システムにおけるユースケースを説明する。また、ユーザA501がスキャンした原稿画像から抽出されるオブジェクトデータを、他のユーザがユーザ特性に従い検索処理する例を説明する。
【0048】
図5Aにおいて、ユーザA501は、自動車のカタログ(原稿510)を複合デバイス50上でスキャンし、複合デバイス50の記憶領域(図9に示すHDD611)にデータ登録する。複合デバイス50には、図4で示した領域判定部407、位置情報関連付け処理部406、意味属性関連付け処理部405が備えている。
【0049】
スキャンデータは領域判定され、前述のカタログ内の画像において、複数のオブジェクトデータに分割される。ここで、テキストオブジェクトについてはOCR処理により得られたテキスト情報を属性情報の一部として関連付ける。また、画像オブジェクトは図6の(A)に示す意味属性マップテーブルに基づいて意味属性マッチングが行われ、意味属性がオブジェクトデータに関連付けて付与される。なお、図6の(A)に示す意味属性マップテーブルは、複合デバイス50のHDD611に記憶されている。ここで、意味属性マップテーブルは、オブジェクトデータの特徴を示す複数の定義画像に対して割り当てる意味属性を画像毎に記憶している。
【0050】
オブジェクトデータとこれに関連付けられた属性情報は、複合デバイス50や文書管理システム600のオブジェクトデータ記憶部401へ格納される。
【0051】
次に、ユーザB502、ユーザC504、ユーザD506、ユーザE508は、それぞれの部門の目的に則して自動車の情報を検索して利用するために、文書管理システム500に接続可能に構成されている。
【0052】
各ユーザは、文書管理システム500において、使用するPC上のブラウザを介して検索処理を実行し、文書管理システム600等に記憶されたオブジェクトデータから自動車に関する情報の検索処理を指示する。
【0053】
例えば、ユーザB502は、設計部門に所属しており自動車画像の中のタイヤやホイールなどといった部品画像を再利用するケースが多い。ここで、ユーザB502がキーワードとして「自動車」を指定して検索を指示した場合を考える。まず、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性が決定され、ユーザ意味属性も決定される。そして、ユーザAが保存したオブジェクトデータから、検索処理部402等がユーザ意味属性で特定された部品に着目した検索処理を行う。具体的には、図6の(A)に示す定義画像を参照して、自動車のタイヤやホイール、ボディ、テールランプなどの部品画像がより優先的に検索される。
【0054】
本実施形態では、図5Bに示すように、ユーザB502にはブラウザにより検索結果画面503が表示される。
【0055】
さらに、ユーザC504は、デザイン部門に所属しているため、自動車の画像全体とその自動車のコンセプトに関するテキストオブジェクトを参照するケースが多い。この場合も、まず後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性、及びユーザ意味属性が決定される。
【0056】
ユーザC504がキーワードとして「自動車」を指定して検索を指示した場合を考える。この場合、ユーザA501が保存したオブジェクトデータから自動車の全体画像、背面画像、及びこれらの画像の周辺に配置していたテキストオブジェクトが結合された検索結果が優先的に表示される。本実施形態では、図5Cに示すように、ユーザC504は、ユーザC504が使用するPC上のブラウザにより検索結果画面505が表示される。
【0057】
また、ユーザD506は、企画部門に所属しており、自動車の全体画像と使用に関するテキストオブジェクトを参照するケースが多い。この場合も、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性、及びユーザ意味属性が決定される。
【0058】
ユーザD506はキーワードとして「自動車」を指定して検索を指示した場合を考える。ユーザA501が保存したオブジェクトデータから自動車の全体画像と仕様に関するテキストオブジェクトが結合された検索結果が表示される。ここで、検索結果は、図5Dに示すように、ユーザD506のブラウザにより、自動車全体と、近接テキスト、仕様書が表示される。
【0059】
以下、デザイナのユーザD506におけるユーザ特性の決定と、それに伴う意味属性の決定処理について具体的に説明する。
【0060】
デザイナのユーザD506がログインすると、ユーザ情報が参照されて、当該ユーザがいずれの部門であるかが特定される。これにより、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性が「デザイン」と決定され、ユーザ意味属性も決定される。そして、同様に図6の(A)に示す意味属性マップを参照して、完成品である画像が検索される。そして、ユーザ意味属性から近接テキスト、仕様書等が検索される。この結果、デザイナのユーザD506が使用するPC上のブラウザにより検索結果画面507が表示される。
【0061】
また、ユーザE508はその他の一般ユーザであり、自動車に関するカタログ全体を参照するケースが多い。この場合も、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性が決定され、ユーザ意味属性も決定される。このため、ユーザE508はキーワードとして「自動車」を指定して検索した場合、ユーザA501が保存したオブジェクトデータから各オブジェクトをすべて結合してカタログ全体画像を表示する。本実施形態では、図5Eに示すように、ユーザE508が使用するPC上のブラウザにより検索結果画面509が表示される。
【0062】
ユーザA501以外に自動車の画像をコピー、スキャンしてオブジェクトデータ記憶部401に保持してある場合は、それらのオブジェクトデータも前述のユースケースに従って検索結果として表示される。各ユーザは、表示された結果の中から所望のオブジェクトデータを選択し、各自の文書の作成時などに再利用することができる。
【0063】
本実施形態において、所望のオブジェクトデータを再利用するためには、検索結果として表示された画像をドラッグ&ドロップして再利用先の文書に貼り付けたり、あるいは選択して個別にローカルフォルダに保存したりして利用する。なお、表示された画像のドラッグ&ドロップは、各ユーザが使用するPCのアプリケーション、ブラウザの機能として実行可能に構成されているものとする。
【0064】
なお、ユーザA501は自動車のカタログを複合デバイス上でスキャンし、オブジェクトデータを登録する際に、各データに再利用の許可、不許可を指定することができる。文書に対するセキュリティを確保するためである。オブジェクトデータの抽出・保存時に許可されたデータのみが検索時にヒットすることになる。
【0065】
[意味属性マップ]
図6は、図4に示した意味属性関連付け処理部405が参照する意味属性マップテーブルの一例を示す図である。なお、意味属性マップテーブルは、例えば属性情報記憶手段、ユーザ意味属性記憶手段として機能するオブジェクトデータ記憶部401に記憶されている。
【0066】
図6において、(A)は、オブジェクトデータ登録時の画像オブジェクトに対する意味属性マップテーブル(テーブル)Iを示し、図4で示した意味属性関連付け処理部405において参照される。本テーブルは、画像オブジェクトとその意味属性を関連付けるものであり、複数の定義画像A〜Dに対するそれぞれの意味属性が割り当てられている。なお、本実施形態ではこれらを総称して意味属性情報とする。
【0067】
例えば、自動車のタイヤ画像(図6の(A)に示すテーブルIの定義画像A)であれば、「部品、自動車、タイヤ」といった意味属性がマップされる。また、複写機のフィニッシャー画像(図6の(A)に示すテーブルIの定義画像C)については、「部品、複写機、フィニッシャー」といった意味属性がマップされている。
【0068】
図4において、領域判定部407で画像オブジェクトとして抽出されたオブジェクトデータに対して、意味属性関連付け処理部405は図6の(A)に示すテーブルIで定義された定義画像A〜Dと比較して類似度を判定する。そして、意味属性関連付け処理部405は、類似度の最も高い意味属性を画像の当該オブジェクトの属性情報として関連付ける。
【0069】
ここで、類似度の判定は、画像の輝度情報、色情報、並びにエッジ情報から既知のアルゴリズム演算によって求める。これら一連の演算処理やマッピング処理は、意味属性関連付け処理部405が行う。
【0070】
なお、図6の(A)に示すテーブルIは、汎用的な画像オブジェクトについてはあらかじめ規定してあり、これを製品にビルトインし、さらにユーザ定義による拡張が可能になっている。
【0071】
図6の(B)は、オブジェクトデータ検索時のユーザ意味属性マップテーブル(テーブルII)を示し、テーブルIIは、ユーザ特性とこれに関連づいた画像オブジェクトに対して予め設定されたユーザ意味属性がマップされている。
【0072】
例えば、ユーザ特性として設計部門に所属するユーザは、部品に対する画像オブジェクトを参照するケースが多いため、ユーザ意味属性には予め部品を割り当てる。
【0073】
また、企画部門のユーザであれば、画像オブジェクトは部品としてではなく完成品として再利用することが多い。また、これに加えて近接するテキストオブジェクト、特に仕様に関するテキストオブジェクトを参照すること多い。このため、ユーザ意味属性は「完成品、近接テキスト、仕様」といった定義を行う。
【0074】
図3及び図4で示した結合処理部404は、検索処理部402でヒットした複数のオブジェクトデータの属性情報を参照し、テーブルIIで定義されたユーザ意味属性との整合性を判定する。ユーザ意味属性で定義された属性値を属性情報に含む画像オブジェクトは、後述する画像オブジェクトの位置情報も参考にして結合される。
【0075】
ここで、ユーザ意味属性は、図3及び図4で示した決定処理部403によって決定される。ユーザが文書管理システム500(または600)にログインする時に識別されるユーザ特性に基づいて、テーブルIIにマップされたユーザ意味属性が決定される。
【0076】
また、ユーザ特性は、ユーザ情報記憶部301にあらかじめ登録されている情報に基づいて特定される。図6の(B)に示す例では、設計、デバイス、企画、一般ユーザ等のように登録されているが、これ以外のユーザ特性を加えてもよい。つまり、オブジェクトデータを利用するユーザ環境に適応してユーザ特性をテーブルIIにマップすることが望ましい。
【0077】
例えば、ユーザBは、図5Bに示すように設計部門に所属し、システムログイン時に設計部門のユーザとしてシステム内で識別される。この結果、ユーザBのユーザ意味属性はテーブルIIに従って「部品」がマップされるのである。また、ユーザDは企画部門に所属するため、システムログイン時にユーザDのユーザ意味属性は「完成品、近接テキスト、仕様」といったように決定される。
【0078】
図6の(B)に示すテーブルIIは、汎用的なユーザ特性とユーザ意味属性のマップについてはあらかじめ規定してあり、これを製品にビルトインしてあるが、ユーザ定義による拡張が可能になっている。検索した時によりユーザ固有の結合画像として再利用したい場合は、ユーザ特性としてユーザ名を指定して、当該ユーザ名毎にユーザ意味属性として固有名詞を使った意味属性を割り当てることも可能である。
【0079】
以下、ユーザ固有の結合画像として再利用したい場合のテーブルIIの拡張例として、自動車のデザイン部門に所属し、車のホイールをデザインしているユーザX(不図示)の事例をについて説明する。
【0080】
テーブルIIのユーザ特性には、ユーザXを指定する。このユーザ特性に対するユーザ意味属性は、「部品、自動車、タイヤ、ホイール」を指定する。
【0081】
ユーザXが、図3に示した文書管理システム500のオブジェクト検索画面に「自動車」と入力すると、検索結果画面には、ホイール画像が結合された複数のタイヤ画像が表示される。
【0082】
この検索結果は、テーブルIIのユーザ特性でユーザXを指定しているため、ユーザXのみにしか得られない。その他のユーザが「自動車」を指定して検索すると、検索結果画面には、自動車のカタログ画像が表示される。これは、テーブルIIにおいてユーザ特性が「一般ユーザ」は、ユーザ意味属性が「ページ全体」がマップされているからである。
【0083】
ところで、図6に示すテーブルIIのユーザ意味属性は、ユーザが検索結果から実際に選択し使用したオブジェクトデータの意味属性をフィードバックしてテーブルIIのマップ自体を自動的に更新する形態でも良い。
【0084】
つまり、実際にユーザ特性に適合した意味属性を過去の実績に基づいてマップを更新するのである。ここで、過去の実績(検索履歴を含む)としては、例えば、ユーザが特定のオブジェクトデータを実際に選択した回数の累計値、若しくはオブジェクトデータをユーザが選択する際に合わせて入力する点数(合致の度合いを表現する数値)などがある。
【0085】
マップの更新に際しては、ユーザが検索結果から実際に選択して使用したオブジェクトデータの意味属性と当該ユーザのユーザ特性を別テーブルで保持しておき、その頻度に応じてテーブルIIを更新するといった実施形態がある。
【0086】
このように構成することにより、ユーザ意味属性マップ(図6の(B)に示すテーブルII)は自動更新することが可能であり、かつシステムの利用頻度に応じて精度の高いユーザ意味属性マップが作成可能である。
【0087】
ところで、複合デバイス50においてオブジェクトデータが抽出されるとき、部品を構成するさらに小さなオブジェクト単位でオブジェクトデータが抽出されることがある。
【0088】
例えば、自動車のタイヤを構成する円や線、四角といった図形の基本要素がこれに該当する。このような図形の基本要素として抽出されるオブジェクトデータは、再利用のオブジェクト単位としては小さすぎるため、図6の(A)に示すテーブルIの意味属性マップを適用しても意味属性が割り当てられない場合がある。
【0089】
また、複合デバイス50でスキャンする原稿の汚れやゆがみなどの都合で、抽出されるオブジェクトデータが小さくなくても非常に複雑な画像オブジェクトとして抽出されるケースがある。
【0090】
例えば、自動車のタイヤ図形であるにもかかわらず、円形ではなく扇形に欠けて抽出されるなどといったケースである。
【0091】
そこで、本実施形態に示すシステムにおいて、上記の場合は抽出時に三通りの抽出オプションを事前設定しておくことができる。
【0092】
オブジェクトデータに意味属性がマップされない場合は、あらかじめ決められた汎用的な意味属性が自動的にマップされるオプションで、これを第一のオプション設定とする。
【0093】
また、図6の(A)に示すテーブルIに定義された意味属性がマップされない場合、当該オブジェクトを抽出しないオプションで、これを第二のオプション設定とする。
【0094】
さらに、図6の(A)に示すテーブルIに定義された意味属性がマップされない場合、近接する他のオブジェクトデータにマップした意味属性を流用してマップするオプションで、これを第三のオプション設定とする。
【0095】
上記第一のオプションの場合、抽出される画像オブジェクトの意味属性は図6の(A)に示すテーブルIに該当する意味属性がなく、替わりに「図形要素、円」、「図形要素、線」などといった汎用的な値がマップされる。この場合、実際には画像オブジェクトの意味としてこれらの属性は余り有効ではないため、検索時にヒットしにくくユーザからはアクセスされにくい。このようなオブジェクトデータは、近接する他のオブジェクトデータが参照されたときに当該参照されたオブジェクトデータと結合して一緒に表示させるようにすることができる。
【0096】
また、第二のオプションの場合、図6の(A)に示すテーブルIで定義してあるオブジェクトのみ抽出するため、全て一致するオブジェクトデータは効果的に再利用できるが、一方でオブジェクトデータが抽出されない場合もある。
【0097】
さらに、第三のオプションの場合、近接する他のオブジェクトデータと同じ意味属性がマップされるので、余りアクセスされないオブジェクトデータに対しても効率的な再利用が可能である。
【0098】
本実施形態においては、第三のオプションがデフォルトの処理オプションとして設定されているが、アプリケーションユーザはその利用形態に応じてこれらのオプション設定を変更することが可能である。
【0099】
[位置情報及び意味属性の指定方法]
図7は、本実施形態を示す文書管理システムにおける位置情報及び意味属性の指定方法を説明する図である。以下、位置情報及び意味属性の指定方法について説明する。
【0100】
図7において、700はスキャン画像全体であり、図4に示したの領域判定部407は、スキャン画像全体700から切り出し可能なオブジェクトを判定し抽出する。701は自動車の画像オブジェクト(オブジェクトA)であり、705はテキストオブジェクト(オブジェクトB)である。
【0101】
位置情報関連付け処理部406は、スキャン画像全体700の左上を原点として各オブジェクトの位置と大きさを特定する座標データを識別し、各オブジェクトの属性情報に埋め込む。オブジェクト701については、属性情報がオブジェクトデータ702に関連付けられて指定される。
【0102】
例えば、オブジェクト701の位置は座標A1(30,50)によって、また大きさは座標A2(130,100)によって指定されるため、これらの値が属性情報として埋め込まれる。本実施形態では、属性情報として、例えば入力画像中のオブジェクトデータの位置情報が含まれる例を示す。
【0103】
また、意味属性関連付け処理部405は、意味属性マップ(図6の(A)に示すテーブルI)を参照して当該オブジェクトの意味属性に「完成品、自動車」が埋め込まれる。
【0104】
オブジェクト705の属性情報706についても位置情報は同様である。すなわち、座標B1(20,150)と座標B2(150,200)が属性情報に埋め込まれる。
【0105】
しかし、意味属性はオブジェクトB705が画像オブジェクトではないことから、異なる属性情報が埋め込まれる。
【0106】
図4に示した領域判定部407は、領域を判定する際に切り出すオブジェクトが画像であるか、テキストであるかも合わせて判定することができる。オブジェクトB705は、この段階でテキストの画像オブジェクトであることがわかるため、意味属性は当該テキストオブジェクト内のテキストデータが埋め込まれる。なお、テキストオブジェクトからテキストデータを抽出する際にはOCR処理を利用している。
【0107】
このようにしてオブジェクトB705の属性情報706には、意味属性としてテキストデータが格納されるが、さらにテキストデータを単語に分割し、これをキーワードとして埋め込むことも可能である。
【0108】
ここで、キーワードはテキストデータを既知の形態素解析アルゴリズムを用いて得ることができる。なお、キーワードはオブジェクトB705の検索を行うためのインデックス情報として使用できる。具体的には、このような自動車のカタログに含まれるテキスト部分には、「自動車」などがキーワードとして設定されやすい。
【0109】
[検索及び表示処理]
図8は、本実施形態を示す文書管理システム500の検索及び結合における処理概念を説明する図である。以下、検索及び表示の処理について説明する。
【0110】
図8において、800は抽出された画像オブジェクトであり、属性情報801と関連付けられてオブジェクトデータとして保持されている。また、802はテキストオブジェクトであり、属性情報803と関連付けられてオブジェクトデータとして保持されている。これらのオブジェクトデータは、図3または図4のオブジェクトデータ記憶部401に格納されている。
【0111】
図8において、804は検索処理である。ユーザが入力したクエリー(検索条件)をキーとして、オブジェクトデータ記憶部401に格納されているオブジェクトデータを検索する。検索処理は、図3または図4の検索処理部402が実行する。
【0112】
図8において、805は、オブジェクトデータの結合処理である。結合処理には二つのサブシーケンスがある。1つはユーザ意味属性による結合(結合処理1)806と位置情報による結合(結合処理2)807である。いずれの結合処理も図3または図4の結合処理部404によって実行される。また、結合処理2において、近さの基準値として第1の基準値と、第2の基準値とに基づいて位置情報を判定する処理を行う。なお、第1の基準値<第2の基準値の関係を満たしている。
【0113】
図8において、808はオブジェクトデータをユーザ特性に応じて結合し画面表示したときのイメージである。二つのオブジェクトデータは、共に自動車というキーワードでヒットし、ユーザ特性に応じて結合処理が施され、1つの画像オブジェクトとして808のごとく表示される。
【0114】
ここで結合処理2は、位置情報による結合807であるが、これはオブジェクト同士の近さを基準として結合するかどうかの判定を行うものである。
【0115】
結合処理1のユーザ意味属性によって結合することとなったオブジェクトは、さらにそれぞれのオブジェクトが近い場合に実際に結合するが、位置的に遠い場合は結合しない。もともとオブジェクトの位置関係が離れており、関連性が低い可能性が高いためである。
【0116】
[オブジェクトデータ抽出・登録のフロー]
図9は、図1に示した複合デバイス50の構成を説明するブロック図である。
【0117】
図9において、操作部610は、操作部I/F606を介して内部バスに接続され、画像表示部とキ−入力部から成り立ち、ユーザの操作指示を受け付けるものである。また、複合デバイス50の情報をユーザに表示する機能も含む。HDD611は、入出力するデータおよび画像を記憶しておくためのものである。
【0118】
スキャナ部612は、スキャナI/F608を介して内部バスに接続され、図示しない原稿台に積置された原稿の画像を光学的に読み取る。プリンタ部613は、プリンタI/F609を介して内部バスに接続され、複合デバイス50にて形成された画像を、記録媒体に印刷出力する。
【0119】
CPU601は、ROM602に記憶された制御プログラム、HDD611に記憶されたアプリケーションをRAM603にロードすることで、プリント機能、スキャン機能、コピー機能、画像処理機能、通信機能を制御する。なお、HDD611は、HDDI/F607を介して内部バスに接続され、アプリケーション、各種データの記憶装置として機能する。また、HDD611は、スキャナ部612で読み取られる画像を図4に示したシステムで処理したデータのデータベースとして機能する。604はページメモリで、プリンタ部613が画像処理を行う場合に、印刷データが展開されて保持される領域として機能する。
【0120】
図10は、本実施形態を示す文書管理システムにおける第1のデータ処理手順の一例を示すフローチャートである。本例は、オブジェクトデータを抽出し、これをオブジェクトデータ記憶部401に格納する処理例である。この処理工程はスキャナ機能を備える複合デバイス50で実行される。なお、S901〜S907は各ステップを示す。また、各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。また、本例は、図7に示すようにユーザAが原稿ORをスキャンしてオブジェクトデータをオブジェクトデータ記憶部401に登録するまでの一連の処理である。
【0121】
S901で、図4で示した領域判定部407が読み込まれた画像データに対して領域判定処理を実行する。次に、S902で、位置情報関連付け処理部406が、図7に示したように位置情報関連付け処理を実行する。領域判定処理及び位置情報関連付け処理は、いずれもページ画像全体に対する処理であり、ページ単位に処理される。
【0122】
S903で、意味属性関連付け処理部405が、図6の(A)に示す意味属性マップテーブルIを参照して、いずれかの定義画像のうち、類似度の高い定義画像を特定する。そして、特定された定義画像に対応づけられている意味属性を、抽出したオブジェクトデータに属性情報として関連付ける処理を実行する。
【0123】
次に、S904で、オブジェクトデータ操作部400が、上記抽出されたオブジェクトデータ、及び属性情報を関連付けてをオブジェクトデータ記憶部401に登録する処理を実行する。
【0124】
なお、オブジェクトデータ登録処理は、第4図で示したメイン制御部200の指示によって行われる。意味属性の関連付け処理及びオブジェクトデータ登録処理は、抽出されたオブジェクトデータごとに行われる。
【0125】
次に、S905は、メイン制御部200は、ページ内のすべての切り出されたオブジェクトデータに対して処理が終了したかどうかを判断する。ここで、ページ全体画像から抽出されたオブジェクトデータすべてに対して、意味属性関連付け処理とオブジェクトデータ登録処理が行われていないと判断した場合、S903へ戻る。
【0126】
一方、S905で、オブジェクトデータが残っていないとメイン制御部200が判断した場合は、次のページに処理が移行する。このようにして、すべてのオブジェクトデータに対して処理が終了した場合は、S906に進む。
【0127】
そして、S906で、メイン制御部200は、ページインクリメント処理を行う。そして、S907で、メイン制御部200は、ページインクリメントの結果を参照し、次ページがあるかどうかを判断する。ここで、次ページがあるとメイン制御部200が判断した場合は、S901へ戻る。
【0128】
一方、S907で、次ページがないとメイン制御部200が判断した場合は、本処理を終了する。
【0129】
これにより、ユーザAが登録したオブジェクトデータを、部門を異にするユーザが検索する場合に、ユーザの部門に適応した種々の検索結果が得られるようにオブジェクトデータが登録される。
【0130】
[オブジェクトデータ検索時のフロー]
図11は、本実施形態を示す文書管理システムにおける第2のデータ処理手順の一例を示すフローチャートである。本例は、オブジェクトデータ検索時の処理例である。なお、S1001〜S1003は各ステップを示す。各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。
【0131】
S1001は、決定処理部403は、図6の(B)に示したユーザ意味属性マップテーブルIIを参照して、ユーザ意味属性の決定処理を実行する。次に、S1002で、検索処理部402がユーザにより検索条件として入力されるキーワードに従い検索処理を実行する。この際、ユーザはキーワードとして「自動車」のようなテキストを指定する。これを受けて、検索処理部402が再利用可能なオブジェクトデータを検索する。ここでは、少なくとも属性情報に自動車とい情報を含むオブジェクトデータが検索される。
【0132】
次に、S1003は、結合処理部404がオブジェクトデータ結合並びに表示処理を実行する。
【0133】
なお、表示の際の画面レイアウトはメイン制御部200の指示によってWeb UI生成部203で実行生成される。
【0134】
また、ユーザ意味属性の決定処理及びオブジェクトデータ結合・表示処理の詳細は後述する。
【0135】
[ユーザ意味属性決定処理のフロー]
図12は、本実施形態を示す文書管理システムにおける第3のデータ処理手順の一例を示すフローチャートである。本例は、図11に示すS1001におけるユーザ意味属性決定処理の詳細例である。なお、S1101、S1102は各ステップを示す。各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。
【0136】
S1101で、ユーザ意味属性決定処理部403は、ログインユーザのユーザ特性を取得する処理を実行する。ここで、ユーザ特性の取得処理は、ユーザ意味属性決定処理部403が処理を開始するが、直接にはメイン制御部200の指示に基づいて、ユーザ情報操作部300がユーザ情報記憶部301から情報を取得する。
【0137】
次に、S1102で、ユーザ意味属性決定処理部403がユーザ意味属性の決定処理を実行して、本処理を終了する。具体的には、ユーザの部門等が特定されると、ユーザ特性が確定する。そして、確定したユーザ特性に応じて図6の(B)に示したユーザ意味属性テーブルIIよりユーザ意味属性が決定される。これにより、図6の(A)に示す意味属性を参照することで、画像として検索すべき特徴を絞り込むことができる。なお、ここで、絞り込むべき特徴は、ユーザの特性に適応しているため、ユーザは、例えば、自分の所属する部門などに適した画像やテキストを検索結果として得ることができる。
【0138】
[オブジェクトデータ結合・表示フロー]
図13は、本実施形態を示す文書管理システムにおける第4のデータ処理手順の一例を示すフローチャートである。本例は、結合処理部404が検索の結果ヒットしたオブジェクトデータを結合して表示する処理例である。なお、S1201〜S1207は各ステップを示す。各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。
【0139】
S1201で、検索してヒットしたオブジェクトデータの属性情報にユーザ意味属性値が含まれているかを結合処理部404が判定する。図6に示したマップテーブルIIで示したユーザ意味属性の値、例えば、「部品」、「完成品、近接テキスト、仕様」などといった値が、検索してヒットしたオブジェクトデータの属性情報に含まれているかどうかを判定する。
【0140】
ここで、「完成品、近接テキスト、仕様」などといった値が1つでも含まれていれば真とする場合と、すべて含まれていたときに真と判定する場合があるが、結合の程度を調整するための外部パラメータとして変更することが可能である。
【0141】
S1201で、「完成品、近接テキスト、仕様」などといった値が含まれていると結合処理部404が判定した場合は、S1202へ進み、含まれていないと判定した場合は、S1206へ遷移する。なお、本実施形態に示すS1201は、着目しているオブジェクトデータとヒットしたその他のオブジェクトデータとの関係において判定される。その他のオブジェクトデータには、既に結合済みのオブジェクトも含まれており、後述する判定の結果によっては3つ以上のオブジェクトデータが結合するケースもある。
【0142】
次に、S1202で、オブジェクトデータ間の距離が値(第1の閾値)よりも小さいかどうかを、属性情報に含まれる位置情報に基づき結合処理部404が判定する。ここでは、オブジェクト同士の近さを判断する。つまり、距離の近いオブジェクトは互いに相関関係が強いという経験則に基づくもので、その程度は第1の設定値によって、例えばユーザの入力により調整可能となっている。
【0143】
ここで、距離が近いと結合処理部404が判断した場合は、S1203へ遷移するが、距離が遠いと結合処理部404が判断した場合はS1206へ遷移する。
【0144】
なお、S1202で、距離が近いか否かを判断するのは、距離が近い場合はオブジェクト同士の結合処理(S1203)が適切であり、一方、S1202で、第1の閾値以上の場合、つまりオブジェクト同士が遠い場合は結合しない方がよいからである。
【0145】
S1206で、着目しているオブジェクトデータとヒットしたその他のオブジェクトデータの距離が第2の閾値よりも小さいかを結合処理部404が判断する。この判断処理において、オブジェクトデータ結合処理部404は、オブジェクト同士の遠さを判定し、距離が第2の閾値よりも小さい場合は結合するほどではないが、ヒットしたオブジェクトデータとして表示すべきものとして処理する。
【0146】
しかし、第2の閾値よりも大きい場合は、検索でヒットしても表示するに値しないオブジェクトデータとして判断し処理する。ここで、検索結果として表示するかどうかの程度は、第2の閾値を用いて調整することができる。
【0147】
S1206で、着目しているオブジェクトとヒットしたその他のオブジェクトの距離が第2の閾値よりも小さいと結合処理部404が判定した場合は、S1204へ進む。
【0148】
一方、S1206で、着目しているオブジェクトとヒットしたその他のオブジェクトの距離が第2の閾値よりも大きいと結合処理部404が判定した場合は、S1207へ進む。
【0149】
一方、S1203で、結合処理部404は、オブジェクトを結合する処理を実行する。ここで、ユーザ意味属性が含まれており、かつオブジェクト間距離が近いオブジェクトデータは、結合して表示する対象となる。従って、当該処理工程によってオブジェクトが結合される。
【0150】
ここで、オブジェクトの結合は、各オブジェクトデータの属性情報に含まれる座標データに基づき結合される。オブジェクトとオブジェクトが離れている場合、オブジェクト間は無地の画像データで補完されて結合される。
【0151】
なお、S1203によって結合しても、結合前のオブジェクトデータは破棄せずに保持しておく。検索結果を表示したときにユーザの操作で結合したオブジェクトを再分離することが容易になるからである。
【0152】
次に、S1204で、結合処理部404がオブジェクト表示処理を実行する。なお、結合されたオブジェクトデータ、あるいは結合されずに表示するオブジェクトデータがあるが、どちらも同じ画面に検索結果として表示される。
【0153】
ここで、表示画面は、図4に示すメイン制御部200の指示によりWeb UI生成部203で生成され、データ送受信部201からクライアントPC10へ送信され所定のブラウザに表示される。
【0154】
次に、S1207は、着目しているオブジェクトデータ以外に検索でヒットした他のオブジェクトデータがあるかどうかを結合処理部404が判定する。ここで、残りのオブジェクトデータがあると結合処理部404が判定した場合は、S1205へ進み、残りのオブジェクトデータがないと結合処理部404が判定した場合は、本処理を終了する。
【0155】
そして、S1205で、メイン制御部200が着目ポインタを移動する処理を実行する。ここで、着目ポインタは、一度も着目されなかったオブジェクトデータに対して移動する。既に着目したオブジェクトデータや結合済みのオブジェクトデータには移動しない。なお、着目ポインタの移動処理を終了したら、S1205を経て、再びS1201から同様の処理を繰り返す。
【0156】
〔第2実施形態〕
以下、図14に示すメモリマップを参照して本実施形態に係る情報処理装置で読み取り可能なデータ処理プログラムの構成について説明する。
【0157】
図14は、本実施形態を示す情報処理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
【0158】
なお、特に図示しないが、記憶媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
【0159】
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラムや、インストールするプログラムが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
【0160】
本実施形態における図10〜図13に示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記憶媒体により、あるいはネットワークを介して外部の記憶媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
【0161】
以上のように、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
【0162】
この場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0163】
従って、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
【0164】
プログラムを供給するための記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
【0165】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0166】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、該ホームページから本発明のコンピュータプログラムそのもの、もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバやftpサーバ等も本発明の請求項に含まれるものである。
【0167】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0168】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではない。例えばそのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行う。そして、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0169】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込ませる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0170】
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。
【0171】
本発明の様々な例と実施形態を示して説明したが、当業者であれば、本発明の趣旨と範囲は、本明細書内の特定の説明に限定されるのではない。
【図面の簡単な説明】
【0172】
【図1】本実施形態を示す情報処理装置を含む文書管理システムの構成を説明する概念図である。
【図2】本実施形態に係る文書管理システムを構成する各PCのハードウェアの構成を説明する図である。
【図3】本実施形態に係る文書管理システムの一例を示すソフトウエア構成を示す図である。
【図4】本実施形態に係る文書管理システムの一例を示すソフトウエア構成を示す図である。
【図5A】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5B】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5C】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5D】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5E】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図6】図4に示した意味属性関連付け処理部が参照する意味属性マップテーブルの一例を示す図である。
【図7】本実施形態を示す文書管理システムにおける位置情報及び意味属性の指定方法を説明する図である。
【図8】本実施形態を示す文書管理システムの検索及び結合における処理概念を説明する図である。
【図9】図1に示した複合デバイスの構成を説明するブロック図である。
【図10】本実施形態を示す文書管理システムにおける第1のデータ処理手順の一例を示すフローチャートである。
【図11】本実施形態を示す文書管理システムにおける第2のデータ処理手順の一例を示すフローチャートである。
【図12】本実施形態を示す文書管理システムにおける第3のデータ処理手順の一例を示すフローチャート図である。
【図13】本実施形態を示す文書管理システムにおける第4のデータ処理手順の一例を示すフローチャートである。
【図14】本実施形態を示す情報処理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
【符号の説明】
【0173】
10 クライアントPC
20 WebアプリケーションサーバPC
30 ユーザ管理サービスサーバPC
40 オブジェクト管理サービスサーバPC40
50 複合デバイス50
【技術分野】
【0001】
本発明は、原稿から読み取られる画像に含まれるオブジェクトデータの登録と、登録されたオブジェクトの検索とを行う技術に関するものである。
【背景技術】
【0002】
従来から、文書処理システムとして、紙文書やイメージデータの形態で保存された情報の再利用を容易にするために、入力された画像をベクトルデータに変換することを目的とする技術がある(特許文献1)。特許文献1においては、スキャナで読み取り保存された画像をベクトルデータに変換することで、ファイル検索を可能とし、再利用性の向上を図っている。
【特許文献1】特開2004−326490号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ここで、スキャナで読み取り、ベクトルデータとして保存された画像が、ユーザにとって必ずしも再利用しやすいデータであるとは限らない。この点において、上記特許文献1に関して改良の余地がある。
【0004】
例えば、新車の説明をしているカタログをスキャンした場合に、当然そのスキャナで読み取った画像の中には、車の画像と、その説明文など様々な情報が含まれている。このときユーザが、新たに他の車のカタログを作成する際に、車の画像を検索すると、当然車の画像とその説明文など様々な情報が含まれた入力画像全体が検索されてしまうことが考えられる。
【0005】
このような場合において、ユーザの車の画像の検索に対して、入力画像に含まれる一部のデータ(オブジェクトデータ)である、車の画像のみが抽出されれば、ユーザにとって再利用しやすい画像データが入手できることになる。当然、オブジェクトデータを利用して文書作成するユーザの目的が異なれば、例えば車と説明文の組み合わせた情報を検索結果として入手したいかもしれない。
【0006】
つまり、車の画像を検索するユーザにとって再利用に適したデータは、入力画像の中の、車の画像のみや、車と説明文の組み合わせた情報など、様々想定できる。
【0007】
そこで本発明の目的は、スキャナなどで入力された入力画像から抽出されたオブジェクトデータを効率よく再利用することができる仕組みを提供することである。
【課題を解決するための手段】
【0008】
上記目的を達成する本発明の情報処理装置は以下に示す構成を備える。
【0009】
入力画像を処理する情報処理装置であって、前記入力画像の一部に基づく、オブジェクトデータを抽出する抽出手段と、前記抽出手段により抽出されたオブジェクトデータと、当該オブジェクトデータの属性情報を関連付けて記憶する記憶手段と、ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索する検索手段と、前記検索手段により検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合する結合手段と、前記結合手段により結合されたオブジェクトデータを検索結果として表示するための制御手段とを有し、異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、前記制御手段に基づき表示される検索結果が異なることを特徴とする。
【発明の効果】
【0010】
本発明によれば、入力画像から抽出されるオブジェクトデータをユーザの特性に応じて効率よく再利用することができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の発明を実施するための最良の形態について説明する。
【0012】
[システム構成]
図1は、本実施形態を示す情報処理装置を含む文書管理システムの構成を説明する概念図である。
【0013】
図1において、ユーザは、クライアントPC10のブラウザを介して文書管理システムにアクセスする。WebアプリケーションサーバPC20は、文書管理システムのWebアプリケーションを提供する。ユーザ管理サービスサーバPC30は、システムにアクセスするユーザの情報を管理する。オブジェクト管理サービスサーバPC40は、オブジェクトデータを保存/管理する。
【0014】
なお、本システムを構成する各デバイスは、ネットワークを介して通信可能に接続されている。
【0015】
ユーザ管理サービスサーバPC30は、システムへのユーザのログイン認証を行う。このために、ユーザに関する認証情報、ユーザ特性を保持する。なお、本実施形態にかかるユーザ特性として、例えば、ユーザの所属組織(部門)やプロジェクトといった情報も、当該ユーザ管理サービスサーバPC30に保持されている。ここで、ユーザ特性には、例えばユーザの役割、及び所属部門に関する情報が含まれる。
【0016】
複合デバイス50は、紙文書をスキャンする機能を有しており、画像データを生成する際に当該画像データの中からオブジェクトデータを抽出し保存することができる。オブジェクトデータは、当該複合デバイス50が備えるHDDへ格納されるが、オブジェクト管理サービスサーバPC40へ送信して保存させることもできる。ここで、オブジェクトデータをどちらで保存するかはユーザが選択することができるように構成されている。
【0017】
複合デバイス50のHDD中に保持されているオブジェクトデータは、文書管理機能を提供するWebアプリケーションサーバPC20からも参照することができる。
【0018】
つまり、ユーザはオブジェクト管理サービスサーバPC40に格納されているオブジェクトデータと合わせて格納先を意識する必要がない。
【0019】
WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40は、別々に配置されている構成としているが、一つのPCにおいて構成されても構わない。
【0020】
また、WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40は、所定のオペレーティングシステムがインストールされており、ハードディスク等に記憶されるアプリケーションを実行してデータ処理を行う。
【0021】
また、WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40は、後述する図2に示すハードウェア資源を備える。
【0022】
また、ユーザがクライアントPC10を操作する構成としているが、これら3つのサーバPCのいずれか、もしくは全てと同じPCで操作しても構わない。
【0023】
本実施形態に係る文書管理システムは、ユーザがクライアントPC10のブラウザを介してアクセスする構成としているが、図示しない専用のクライアントアプリケーションを該クライアントPC10に配置し、ユーザがそれを操作する構成であっても構わない。
【0024】
この場合、該WebアプリケーションサーバPC20ではなく、該文書管理サービスサーバPC30と該専用クライアントアプリケーションが通信する構成でも構わない。
【0025】
[ハードウェア構成]
図2は、本実施形態に係る文書管理システムを構成する各PCのハードウェアの構成を説明する図である。なお、図2に示されるハードウェア構成は、一般的な情報処理装置のハードウェア構成図に相当するものとし、本実施形態の各PCには一般的な情報処理装置のハードウェア構成を適用できる。
【0026】
図2において、CPU100は、ROM102のプログラム用ROMに記憶された、或いはハードディスク109からRAM101にロードされたOSやアプリケーション等のプログラムを実行する。ここでOSとはコンピュータ上で稼動するオペレーティングシステムの略語であり、以下オペレーティングシステムのことをOSと呼ぶ。後述する各フローチャートの処理はこのプログラムの実行により実現できる。
【0027】
RAM101は、CPU100の主メモリ、ワークエリア等として機能する。キーボードコントローラ103は、キーボード107や図示しないポインティングデバイスからのキー入力を制御する。ディスプレイコントローラ104は、各種ディスプレイ108の表示を制御する。ディスクコントローラ105は、各種データを記憶するハードディスク(HD)やフレキシブル(登録商標)ディスク(FD)等の外部メモリ109におけるデータアクセスを制御する。ネットワークコントロ−ラ(NC)106はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。
【0028】
[ソフトウエア構成]
図3、図4は、本実施形態に係る文書管理システムの一例を示すソフトウエア構成を示す図である。図3は、図1に示したWebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40内のソフトウエア構成を示している。本例は、図1に示したWebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及びオブジェクト管理サービスサーバPC40により文書管理システム500が構成される場合に対応する。
【0029】
また、図4は、図1に示した複合デバイス50のPC40内のソフトウエア構成を示している。本例は、図1に示した複合デバイス50に文書管理システム600の各構成が構成される場合に対応する。
【0030】
なお、図3、図4に示した各々矩形で図示した構成要素は、それぞれがソフトウエアコンポーネントに該当しており、コンポーネントの配置構成はシステム構成やプラットフォームに依存する。
【0031】
図3において、文書管理システム500は、図1で示したユーザ管理サービスサーバPC30、WebアプリケーションサーバPC20、オブジェクト管理サービスサーバPC40に配置されるすべてのソフトウエアコンポーネントが含まれる。
【0032】
図3において、メイン制御部200は、本実施形態に係る文書管理システムのシステム全体を制御し、後述する各部に対する指示、管理を行う。
【0033】
データ送受信部201は、クライアントPC10においてユーザがブラウザを介して出した命令を受け取り、メイン制御部200より指示を受けた結果をクライアントPC10に返答する。
【0034】
セッション記憶部202は、クライアントPC10においてユーザがブラウザを介して本文書管理システムにアクセスしてから、同一ユーザからのアクセスであることを示すためのセッション情報を生成する。更に、ユーザが本文書管理システムへのアクセスをやめる(ログアウト)、もしくは自動タイムアウトなどでセッションが切れるまでの間、繰り返し使用する各種情報をセッション情報と関連付けて保持する。
【0035】
Web UI生成部203は、該メイン制御部200より指示を受け、状況に応じたWeb UI(HTML)を生成する。ここで、該Web UI生成部203が生成するWeb UIは、HTMLだけに限定するものではなく、Java(登録商標)Scriptなどのスクリプト言語が埋まっていても構わない。
【0036】
次に、ユーザ情報操作部300は、該メイン制御部200からの指示に従い、ユーザ情報記憶部301に保存されている本文書管理システム500にアクセス可能なユーザ、及びユーザ特性の取得、設定などの操作を行う。ここで、ユーザ管理に関して、本文書管理システム500の独自管理ではなく、既知の技術であるActive Directory、LDAPなどとユーザ情報操作部300が連携し、該ユーザ情報記憶部301においてはユーザ特性のみを保存しても構わない。
【0037】
次に、オブジェクトデータ操作部400は、メイン制御部200からの指示に従い、オブジェクトデータ記憶部401に対するオブジェクトデータの登録、保存、更新などの操作を行う。ここでは、入力画像データから抽出された部分的なデータであるオブジェクトデータと当該オブジェクトデータに関連する属性情報とが対応付けて管理される。入力画像としては、スキャン画像や画像形成装置で印刷処理される際に扱った画像が含まれる。
【0038】
オブジェクトデータ記憶部401には、オブジェクトデータの属性情報に対するインデックス情報も合わせて保持される。インデックス情報は、属性情報に基づくオブジェクトデータの検索に使用される。オブジェクトデータ記憶部401は、オブジェクトデータ操作部400によって制御される。
【0039】
検索処理部402は、オブジェクトデータ記憶部401に格納されている情報に対して検索処理を行う。ここで、検索処理は、例えばオブジェクトデータに関連付けられている属性情報に対する属性検索処理が挙げられる。また、オブジェクトデータの属性情報に含まれるテキストデータに対する全文検索処理と、画像データに対する類似画像検索処理がある。検索処理部402は、これらの各検索処理を統括し複合検索を行う。また、検索処理のタイムアウトや結果上限値制限、検索処理の中断などといった検索プロセスの管理を行う。
【0040】
決定処理部403は、図6の(B)に示すようにユーザ特性とこれに関連付けて定義されたユーザ意味属性を決定する。ここで、ユーザ意味属性は、ユーザがログインしたときや検索処理を実行する前に決定される。
【0041】
結合処理部404は、検索されたオブジェクトデータをユーザ意味属性に応じて結合する。結合処理の実行については、オブジェクトデータに含まれている位置情報にも、基づく。
【0042】
図4に示す複合デバイス50における文書管理システム600は、上記200〜203、300、301に加えて、意味属性関連付け処理部405、位置情報関連付け処理部406、並びに領域判定部407を備えている。以下、これらの追加のコンポーネントについて説明する。なお、本例の複合デバイス50は、後述するスキャナ部を備え、読み取られる画像情報に含まれるオブジェクトを抽出する処理を行うハードウェア資源を備えている。
【0043】
意味属性関連付け処理部405は、オブジェクトデータを抽出する際に、図6の(A)に示すテーブルを参照して、当該オブジェクトデータに対する意味属性を決定し割り当てる。ここで、オブジェクトデータに対する意味属性の決定は、オブジェクトデータの属性情報である種別属性の判定に加えて、あらかじめ定義してある定義画像A〜Dやキーワード等との類似性をもとに、定義済みの意味属性を決定し割り当てる。ここで、種別属性とは、オブジェクトデータがテキストか画像かといったことを示すための属性である。
【0044】
ここで、意味属性とは、画像データから抽出されたオブジェクトデータが、個々の部品であるか全体かを示す情報を含む。更に、定義済みの定義画像が、例えば、自動車のタイヤであれば(自動車、タイヤ)といった、より一般化したカテゴリと定義済み画像の名称を示す情報も含む。
【0045】
位置情報関連付け処理部406は、画像データから抽出したオブジェクトデータの画像データ中の位置情報を検出し、当該オブジェクトデータに属性情報として関連付ける。
【0046】
領域判定部407は、画像データの中からオブジェクトデータとして切り出せる領域を判定する。ここで、領域判定には、画像データの輝度情報、色情報、エッジ情報などといった要素を元に判断する。
【0047】
[ユースケース並びに検索結果画面]
図5A〜図5Eは、本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。以下、文書管理システムにおけるユースケースを説明する。また、ユーザA501がスキャンした原稿画像から抽出されるオブジェクトデータを、他のユーザがユーザ特性に従い検索処理する例を説明する。
【0048】
図5Aにおいて、ユーザA501は、自動車のカタログ(原稿510)を複合デバイス50上でスキャンし、複合デバイス50の記憶領域(図9に示すHDD611)にデータ登録する。複合デバイス50には、図4で示した領域判定部407、位置情報関連付け処理部406、意味属性関連付け処理部405が備えている。
【0049】
スキャンデータは領域判定され、前述のカタログ内の画像において、複数のオブジェクトデータに分割される。ここで、テキストオブジェクトについてはOCR処理により得られたテキスト情報を属性情報の一部として関連付ける。また、画像オブジェクトは図6の(A)に示す意味属性マップテーブルに基づいて意味属性マッチングが行われ、意味属性がオブジェクトデータに関連付けて付与される。なお、図6の(A)に示す意味属性マップテーブルは、複合デバイス50のHDD611に記憶されている。ここで、意味属性マップテーブルは、オブジェクトデータの特徴を示す複数の定義画像に対して割り当てる意味属性を画像毎に記憶している。
【0050】
オブジェクトデータとこれに関連付けられた属性情報は、複合デバイス50や文書管理システム600のオブジェクトデータ記憶部401へ格納される。
【0051】
次に、ユーザB502、ユーザC504、ユーザD506、ユーザE508は、それぞれの部門の目的に則して自動車の情報を検索して利用するために、文書管理システム500に接続可能に構成されている。
【0052】
各ユーザは、文書管理システム500において、使用するPC上のブラウザを介して検索処理を実行し、文書管理システム600等に記憶されたオブジェクトデータから自動車に関する情報の検索処理を指示する。
【0053】
例えば、ユーザB502は、設計部門に所属しており自動車画像の中のタイヤやホイールなどといった部品画像を再利用するケースが多い。ここで、ユーザB502がキーワードとして「自動車」を指定して検索を指示した場合を考える。まず、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性が決定され、ユーザ意味属性も決定される。そして、ユーザAが保存したオブジェクトデータから、検索処理部402等がユーザ意味属性で特定された部品に着目した検索処理を行う。具体的には、図6の(A)に示す定義画像を参照して、自動車のタイヤやホイール、ボディ、テールランプなどの部品画像がより優先的に検索される。
【0054】
本実施形態では、図5Bに示すように、ユーザB502にはブラウザにより検索結果画面503が表示される。
【0055】
さらに、ユーザC504は、デザイン部門に所属しているため、自動車の画像全体とその自動車のコンセプトに関するテキストオブジェクトを参照するケースが多い。この場合も、まず後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性、及びユーザ意味属性が決定される。
【0056】
ユーザC504がキーワードとして「自動車」を指定して検索を指示した場合を考える。この場合、ユーザA501が保存したオブジェクトデータから自動車の全体画像、背面画像、及びこれらの画像の周辺に配置していたテキストオブジェクトが結合された検索結果が優先的に表示される。本実施形態では、図5Cに示すように、ユーザC504は、ユーザC504が使用するPC上のブラウザにより検索結果画面505が表示される。
【0057】
また、ユーザD506は、企画部門に所属しており、自動車の全体画像と使用に関するテキストオブジェクトを参照するケースが多い。この場合も、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性、及びユーザ意味属性が決定される。
【0058】
ユーザD506はキーワードとして「自動車」を指定して検索を指示した場合を考える。ユーザA501が保存したオブジェクトデータから自動車の全体画像と仕様に関するテキストオブジェクトが結合された検索結果が表示される。ここで、検索結果は、図5Dに示すように、ユーザD506のブラウザにより、自動車全体と、近接テキスト、仕様書が表示される。
【0059】
以下、デザイナのユーザD506におけるユーザ特性の決定と、それに伴う意味属性の決定処理について具体的に説明する。
【0060】
デザイナのユーザD506がログインすると、ユーザ情報が参照されて、当該ユーザがいずれの部門であるかが特定される。これにより、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性が「デザイン」と決定され、ユーザ意味属性も決定される。そして、同様に図6の(A)に示す意味属性マップを参照して、完成品である画像が検索される。そして、ユーザ意味属性から近接テキスト、仕様書等が検索される。この結果、デザイナのユーザD506が使用するPC上のブラウザにより検索結果画面507が表示される。
【0061】
また、ユーザE508はその他の一般ユーザであり、自動車に関するカタログ全体を参照するケースが多い。この場合も、後述する図6の(B)に示すユーザ意味属性マップを参照して、ユーザ特性が決定され、ユーザ意味属性も決定される。このため、ユーザE508はキーワードとして「自動車」を指定して検索した場合、ユーザA501が保存したオブジェクトデータから各オブジェクトをすべて結合してカタログ全体画像を表示する。本実施形態では、図5Eに示すように、ユーザE508が使用するPC上のブラウザにより検索結果画面509が表示される。
【0062】
ユーザA501以外に自動車の画像をコピー、スキャンしてオブジェクトデータ記憶部401に保持してある場合は、それらのオブジェクトデータも前述のユースケースに従って検索結果として表示される。各ユーザは、表示された結果の中から所望のオブジェクトデータを選択し、各自の文書の作成時などに再利用することができる。
【0063】
本実施形態において、所望のオブジェクトデータを再利用するためには、検索結果として表示された画像をドラッグ&ドロップして再利用先の文書に貼り付けたり、あるいは選択して個別にローカルフォルダに保存したりして利用する。なお、表示された画像のドラッグ&ドロップは、各ユーザが使用するPCのアプリケーション、ブラウザの機能として実行可能に構成されているものとする。
【0064】
なお、ユーザA501は自動車のカタログを複合デバイス上でスキャンし、オブジェクトデータを登録する際に、各データに再利用の許可、不許可を指定することができる。文書に対するセキュリティを確保するためである。オブジェクトデータの抽出・保存時に許可されたデータのみが検索時にヒットすることになる。
【0065】
[意味属性マップ]
図6は、図4に示した意味属性関連付け処理部405が参照する意味属性マップテーブルの一例を示す図である。なお、意味属性マップテーブルは、例えば属性情報記憶手段、ユーザ意味属性記憶手段として機能するオブジェクトデータ記憶部401に記憶されている。
【0066】
図6において、(A)は、オブジェクトデータ登録時の画像オブジェクトに対する意味属性マップテーブル(テーブル)Iを示し、図4で示した意味属性関連付け処理部405において参照される。本テーブルは、画像オブジェクトとその意味属性を関連付けるものであり、複数の定義画像A〜Dに対するそれぞれの意味属性が割り当てられている。なお、本実施形態ではこれらを総称して意味属性情報とする。
【0067】
例えば、自動車のタイヤ画像(図6の(A)に示すテーブルIの定義画像A)であれば、「部品、自動車、タイヤ」といった意味属性がマップされる。また、複写機のフィニッシャー画像(図6の(A)に示すテーブルIの定義画像C)については、「部品、複写機、フィニッシャー」といった意味属性がマップされている。
【0068】
図4において、領域判定部407で画像オブジェクトとして抽出されたオブジェクトデータに対して、意味属性関連付け処理部405は図6の(A)に示すテーブルIで定義された定義画像A〜Dと比較して類似度を判定する。そして、意味属性関連付け処理部405は、類似度の最も高い意味属性を画像の当該オブジェクトの属性情報として関連付ける。
【0069】
ここで、類似度の判定は、画像の輝度情報、色情報、並びにエッジ情報から既知のアルゴリズム演算によって求める。これら一連の演算処理やマッピング処理は、意味属性関連付け処理部405が行う。
【0070】
なお、図6の(A)に示すテーブルIは、汎用的な画像オブジェクトについてはあらかじめ規定してあり、これを製品にビルトインし、さらにユーザ定義による拡張が可能になっている。
【0071】
図6の(B)は、オブジェクトデータ検索時のユーザ意味属性マップテーブル(テーブルII)を示し、テーブルIIは、ユーザ特性とこれに関連づいた画像オブジェクトに対して予め設定されたユーザ意味属性がマップされている。
【0072】
例えば、ユーザ特性として設計部門に所属するユーザは、部品に対する画像オブジェクトを参照するケースが多いため、ユーザ意味属性には予め部品を割り当てる。
【0073】
また、企画部門のユーザであれば、画像オブジェクトは部品としてではなく完成品として再利用することが多い。また、これに加えて近接するテキストオブジェクト、特に仕様に関するテキストオブジェクトを参照すること多い。このため、ユーザ意味属性は「完成品、近接テキスト、仕様」といった定義を行う。
【0074】
図3及び図4で示した結合処理部404は、検索処理部402でヒットした複数のオブジェクトデータの属性情報を参照し、テーブルIIで定義されたユーザ意味属性との整合性を判定する。ユーザ意味属性で定義された属性値を属性情報に含む画像オブジェクトは、後述する画像オブジェクトの位置情報も参考にして結合される。
【0075】
ここで、ユーザ意味属性は、図3及び図4で示した決定処理部403によって決定される。ユーザが文書管理システム500(または600)にログインする時に識別されるユーザ特性に基づいて、テーブルIIにマップされたユーザ意味属性が決定される。
【0076】
また、ユーザ特性は、ユーザ情報記憶部301にあらかじめ登録されている情報に基づいて特定される。図6の(B)に示す例では、設計、デバイス、企画、一般ユーザ等のように登録されているが、これ以外のユーザ特性を加えてもよい。つまり、オブジェクトデータを利用するユーザ環境に適応してユーザ特性をテーブルIIにマップすることが望ましい。
【0077】
例えば、ユーザBは、図5Bに示すように設計部門に所属し、システムログイン時に設計部門のユーザとしてシステム内で識別される。この結果、ユーザBのユーザ意味属性はテーブルIIに従って「部品」がマップされるのである。また、ユーザDは企画部門に所属するため、システムログイン時にユーザDのユーザ意味属性は「完成品、近接テキスト、仕様」といったように決定される。
【0078】
図6の(B)に示すテーブルIIは、汎用的なユーザ特性とユーザ意味属性のマップについてはあらかじめ規定してあり、これを製品にビルトインしてあるが、ユーザ定義による拡張が可能になっている。検索した時によりユーザ固有の結合画像として再利用したい場合は、ユーザ特性としてユーザ名を指定して、当該ユーザ名毎にユーザ意味属性として固有名詞を使った意味属性を割り当てることも可能である。
【0079】
以下、ユーザ固有の結合画像として再利用したい場合のテーブルIIの拡張例として、自動車のデザイン部門に所属し、車のホイールをデザインしているユーザX(不図示)の事例をについて説明する。
【0080】
テーブルIIのユーザ特性には、ユーザXを指定する。このユーザ特性に対するユーザ意味属性は、「部品、自動車、タイヤ、ホイール」を指定する。
【0081】
ユーザXが、図3に示した文書管理システム500のオブジェクト検索画面に「自動車」と入力すると、検索結果画面には、ホイール画像が結合された複数のタイヤ画像が表示される。
【0082】
この検索結果は、テーブルIIのユーザ特性でユーザXを指定しているため、ユーザXのみにしか得られない。その他のユーザが「自動車」を指定して検索すると、検索結果画面には、自動車のカタログ画像が表示される。これは、テーブルIIにおいてユーザ特性が「一般ユーザ」は、ユーザ意味属性が「ページ全体」がマップされているからである。
【0083】
ところで、図6に示すテーブルIIのユーザ意味属性は、ユーザが検索結果から実際に選択し使用したオブジェクトデータの意味属性をフィードバックしてテーブルIIのマップ自体を自動的に更新する形態でも良い。
【0084】
つまり、実際にユーザ特性に適合した意味属性を過去の実績に基づいてマップを更新するのである。ここで、過去の実績(検索履歴を含む)としては、例えば、ユーザが特定のオブジェクトデータを実際に選択した回数の累計値、若しくはオブジェクトデータをユーザが選択する際に合わせて入力する点数(合致の度合いを表現する数値)などがある。
【0085】
マップの更新に際しては、ユーザが検索結果から実際に選択して使用したオブジェクトデータの意味属性と当該ユーザのユーザ特性を別テーブルで保持しておき、その頻度に応じてテーブルIIを更新するといった実施形態がある。
【0086】
このように構成することにより、ユーザ意味属性マップ(図6の(B)に示すテーブルII)は自動更新することが可能であり、かつシステムの利用頻度に応じて精度の高いユーザ意味属性マップが作成可能である。
【0087】
ところで、複合デバイス50においてオブジェクトデータが抽出されるとき、部品を構成するさらに小さなオブジェクト単位でオブジェクトデータが抽出されることがある。
【0088】
例えば、自動車のタイヤを構成する円や線、四角といった図形の基本要素がこれに該当する。このような図形の基本要素として抽出されるオブジェクトデータは、再利用のオブジェクト単位としては小さすぎるため、図6の(A)に示すテーブルIの意味属性マップを適用しても意味属性が割り当てられない場合がある。
【0089】
また、複合デバイス50でスキャンする原稿の汚れやゆがみなどの都合で、抽出されるオブジェクトデータが小さくなくても非常に複雑な画像オブジェクトとして抽出されるケースがある。
【0090】
例えば、自動車のタイヤ図形であるにもかかわらず、円形ではなく扇形に欠けて抽出されるなどといったケースである。
【0091】
そこで、本実施形態に示すシステムにおいて、上記の場合は抽出時に三通りの抽出オプションを事前設定しておくことができる。
【0092】
オブジェクトデータに意味属性がマップされない場合は、あらかじめ決められた汎用的な意味属性が自動的にマップされるオプションで、これを第一のオプション設定とする。
【0093】
また、図6の(A)に示すテーブルIに定義された意味属性がマップされない場合、当該オブジェクトを抽出しないオプションで、これを第二のオプション設定とする。
【0094】
さらに、図6の(A)に示すテーブルIに定義された意味属性がマップされない場合、近接する他のオブジェクトデータにマップした意味属性を流用してマップするオプションで、これを第三のオプション設定とする。
【0095】
上記第一のオプションの場合、抽出される画像オブジェクトの意味属性は図6の(A)に示すテーブルIに該当する意味属性がなく、替わりに「図形要素、円」、「図形要素、線」などといった汎用的な値がマップされる。この場合、実際には画像オブジェクトの意味としてこれらの属性は余り有効ではないため、検索時にヒットしにくくユーザからはアクセスされにくい。このようなオブジェクトデータは、近接する他のオブジェクトデータが参照されたときに当該参照されたオブジェクトデータと結合して一緒に表示させるようにすることができる。
【0096】
また、第二のオプションの場合、図6の(A)に示すテーブルIで定義してあるオブジェクトのみ抽出するため、全て一致するオブジェクトデータは効果的に再利用できるが、一方でオブジェクトデータが抽出されない場合もある。
【0097】
さらに、第三のオプションの場合、近接する他のオブジェクトデータと同じ意味属性がマップされるので、余りアクセスされないオブジェクトデータに対しても効率的な再利用が可能である。
【0098】
本実施形態においては、第三のオプションがデフォルトの処理オプションとして設定されているが、アプリケーションユーザはその利用形態に応じてこれらのオプション設定を変更することが可能である。
【0099】
[位置情報及び意味属性の指定方法]
図7は、本実施形態を示す文書管理システムにおける位置情報及び意味属性の指定方法を説明する図である。以下、位置情報及び意味属性の指定方法について説明する。
【0100】
図7において、700はスキャン画像全体であり、図4に示したの領域判定部407は、スキャン画像全体700から切り出し可能なオブジェクトを判定し抽出する。701は自動車の画像オブジェクト(オブジェクトA)であり、705はテキストオブジェクト(オブジェクトB)である。
【0101】
位置情報関連付け処理部406は、スキャン画像全体700の左上を原点として各オブジェクトの位置と大きさを特定する座標データを識別し、各オブジェクトの属性情報に埋め込む。オブジェクト701については、属性情報がオブジェクトデータ702に関連付けられて指定される。
【0102】
例えば、オブジェクト701の位置は座標A1(30,50)によって、また大きさは座標A2(130,100)によって指定されるため、これらの値が属性情報として埋め込まれる。本実施形態では、属性情報として、例えば入力画像中のオブジェクトデータの位置情報が含まれる例を示す。
【0103】
また、意味属性関連付け処理部405は、意味属性マップ(図6の(A)に示すテーブルI)を参照して当該オブジェクトの意味属性に「完成品、自動車」が埋め込まれる。
【0104】
オブジェクト705の属性情報706についても位置情報は同様である。すなわち、座標B1(20,150)と座標B2(150,200)が属性情報に埋め込まれる。
【0105】
しかし、意味属性はオブジェクトB705が画像オブジェクトではないことから、異なる属性情報が埋め込まれる。
【0106】
図4に示した領域判定部407は、領域を判定する際に切り出すオブジェクトが画像であるか、テキストであるかも合わせて判定することができる。オブジェクトB705は、この段階でテキストの画像オブジェクトであることがわかるため、意味属性は当該テキストオブジェクト内のテキストデータが埋め込まれる。なお、テキストオブジェクトからテキストデータを抽出する際にはOCR処理を利用している。
【0107】
このようにしてオブジェクトB705の属性情報706には、意味属性としてテキストデータが格納されるが、さらにテキストデータを単語に分割し、これをキーワードとして埋め込むことも可能である。
【0108】
ここで、キーワードはテキストデータを既知の形態素解析アルゴリズムを用いて得ることができる。なお、キーワードはオブジェクトB705の検索を行うためのインデックス情報として使用できる。具体的には、このような自動車のカタログに含まれるテキスト部分には、「自動車」などがキーワードとして設定されやすい。
【0109】
[検索及び表示処理]
図8は、本実施形態を示す文書管理システム500の検索及び結合における処理概念を説明する図である。以下、検索及び表示の処理について説明する。
【0110】
図8において、800は抽出された画像オブジェクトであり、属性情報801と関連付けられてオブジェクトデータとして保持されている。また、802はテキストオブジェクトであり、属性情報803と関連付けられてオブジェクトデータとして保持されている。これらのオブジェクトデータは、図3または図4のオブジェクトデータ記憶部401に格納されている。
【0111】
図8において、804は検索処理である。ユーザが入力したクエリー(検索条件)をキーとして、オブジェクトデータ記憶部401に格納されているオブジェクトデータを検索する。検索処理は、図3または図4の検索処理部402が実行する。
【0112】
図8において、805は、オブジェクトデータの結合処理である。結合処理には二つのサブシーケンスがある。1つはユーザ意味属性による結合(結合処理1)806と位置情報による結合(結合処理2)807である。いずれの結合処理も図3または図4の結合処理部404によって実行される。また、結合処理2において、近さの基準値として第1の基準値と、第2の基準値とに基づいて位置情報を判定する処理を行う。なお、第1の基準値<第2の基準値の関係を満たしている。
【0113】
図8において、808はオブジェクトデータをユーザ特性に応じて結合し画面表示したときのイメージである。二つのオブジェクトデータは、共に自動車というキーワードでヒットし、ユーザ特性に応じて結合処理が施され、1つの画像オブジェクトとして808のごとく表示される。
【0114】
ここで結合処理2は、位置情報による結合807であるが、これはオブジェクト同士の近さを基準として結合するかどうかの判定を行うものである。
【0115】
結合処理1のユーザ意味属性によって結合することとなったオブジェクトは、さらにそれぞれのオブジェクトが近い場合に実際に結合するが、位置的に遠い場合は結合しない。もともとオブジェクトの位置関係が離れており、関連性が低い可能性が高いためである。
【0116】
[オブジェクトデータ抽出・登録のフロー]
図9は、図1に示した複合デバイス50の構成を説明するブロック図である。
【0117】
図9において、操作部610は、操作部I/F606を介して内部バスに接続され、画像表示部とキ−入力部から成り立ち、ユーザの操作指示を受け付けるものである。また、複合デバイス50の情報をユーザに表示する機能も含む。HDD611は、入出力するデータおよび画像を記憶しておくためのものである。
【0118】
スキャナ部612は、スキャナI/F608を介して内部バスに接続され、図示しない原稿台に積置された原稿の画像を光学的に読み取る。プリンタ部613は、プリンタI/F609を介して内部バスに接続され、複合デバイス50にて形成された画像を、記録媒体に印刷出力する。
【0119】
CPU601は、ROM602に記憶された制御プログラム、HDD611に記憶されたアプリケーションをRAM603にロードすることで、プリント機能、スキャン機能、コピー機能、画像処理機能、通信機能を制御する。なお、HDD611は、HDDI/F607を介して内部バスに接続され、アプリケーション、各種データの記憶装置として機能する。また、HDD611は、スキャナ部612で読み取られる画像を図4に示したシステムで処理したデータのデータベースとして機能する。604はページメモリで、プリンタ部613が画像処理を行う場合に、印刷データが展開されて保持される領域として機能する。
【0120】
図10は、本実施形態を示す文書管理システムにおける第1のデータ処理手順の一例を示すフローチャートである。本例は、オブジェクトデータを抽出し、これをオブジェクトデータ記憶部401に格納する処理例である。この処理工程はスキャナ機能を備える複合デバイス50で実行される。なお、S901〜S907は各ステップを示す。また、各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。また、本例は、図7に示すようにユーザAが原稿ORをスキャンしてオブジェクトデータをオブジェクトデータ記憶部401に登録するまでの一連の処理である。
【0121】
S901で、図4で示した領域判定部407が読み込まれた画像データに対して領域判定処理を実行する。次に、S902で、位置情報関連付け処理部406が、図7に示したように位置情報関連付け処理を実行する。領域判定処理及び位置情報関連付け処理は、いずれもページ画像全体に対する処理であり、ページ単位に処理される。
【0122】
S903で、意味属性関連付け処理部405が、図6の(A)に示す意味属性マップテーブルIを参照して、いずれかの定義画像のうち、類似度の高い定義画像を特定する。そして、特定された定義画像に対応づけられている意味属性を、抽出したオブジェクトデータに属性情報として関連付ける処理を実行する。
【0123】
次に、S904で、オブジェクトデータ操作部400が、上記抽出されたオブジェクトデータ、及び属性情報を関連付けてをオブジェクトデータ記憶部401に登録する処理を実行する。
【0124】
なお、オブジェクトデータ登録処理は、第4図で示したメイン制御部200の指示によって行われる。意味属性の関連付け処理及びオブジェクトデータ登録処理は、抽出されたオブジェクトデータごとに行われる。
【0125】
次に、S905は、メイン制御部200は、ページ内のすべての切り出されたオブジェクトデータに対して処理が終了したかどうかを判断する。ここで、ページ全体画像から抽出されたオブジェクトデータすべてに対して、意味属性関連付け処理とオブジェクトデータ登録処理が行われていないと判断した場合、S903へ戻る。
【0126】
一方、S905で、オブジェクトデータが残っていないとメイン制御部200が判断した場合は、次のページに処理が移行する。このようにして、すべてのオブジェクトデータに対して処理が終了した場合は、S906に進む。
【0127】
そして、S906で、メイン制御部200は、ページインクリメント処理を行う。そして、S907で、メイン制御部200は、ページインクリメントの結果を参照し、次ページがあるかどうかを判断する。ここで、次ページがあるとメイン制御部200が判断した場合は、S901へ戻る。
【0128】
一方、S907で、次ページがないとメイン制御部200が判断した場合は、本処理を終了する。
【0129】
これにより、ユーザAが登録したオブジェクトデータを、部門を異にするユーザが検索する場合に、ユーザの部門に適応した種々の検索結果が得られるようにオブジェクトデータが登録される。
【0130】
[オブジェクトデータ検索時のフロー]
図11は、本実施形態を示す文書管理システムにおける第2のデータ処理手順の一例を示すフローチャートである。本例は、オブジェクトデータ検索時の処理例である。なお、S1001〜S1003は各ステップを示す。各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。
【0131】
S1001は、決定処理部403は、図6の(B)に示したユーザ意味属性マップテーブルIIを参照して、ユーザ意味属性の決定処理を実行する。次に、S1002で、検索処理部402がユーザにより検索条件として入力されるキーワードに従い検索処理を実行する。この際、ユーザはキーワードとして「自動車」のようなテキストを指定する。これを受けて、検索処理部402が再利用可能なオブジェクトデータを検索する。ここでは、少なくとも属性情報に自動車とい情報を含むオブジェクトデータが検索される。
【0132】
次に、S1003は、結合処理部404がオブジェクトデータ結合並びに表示処理を実行する。
【0133】
なお、表示の際の画面レイアウトはメイン制御部200の指示によってWeb UI生成部203で実行生成される。
【0134】
また、ユーザ意味属性の決定処理及びオブジェクトデータ結合・表示処理の詳細は後述する。
【0135】
[ユーザ意味属性決定処理のフロー]
図12は、本実施形態を示す文書管理システムにおける第3のデータ処理手順の一例を示すフローチャートである。本例は、図11に示すS1001におけるユーザ意味属性決定処理の詳細例である。なお、S1101、S1102は各ステップを示す。各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。
【0136】
S1101で、ユーザ意味属性決定処理部403は、ログインユーザのユーザ特性を取得する処理を実行する。ここで、ユーザ特性の取得処理は、ユーザ意味属性決定処理部403が処理を開始するが、直接にはメイン制御部200の指示に基づいて、ユーザ情報操作部300がユーザ情報記憶部301から情報を取得する。
【0137】
次に、S1102で、ユーザ意味属性決定処理部403がユーザ意味属性の決定処理を実行して、本処理を終了する。具体的には、ユーザの部門等が特定されると、ユーザ特性が確定する。そして、確定したユーザ特性に応じて図6の(B)に示したユーザ意味属性テーブルIIよりユーザ意味属性が決定される。これにより、図6の(A)に示す意味属性を参照することで、画像として検索すべき特徴を絞り込むことができる。なお、ここで、絞り込むべき特徴は、ユーザの特性に適応しているため、ユーザは、例えば、自分の所属する部門などに適した画像やテキストを検索結果として得ることができる。
【0138】
[オブジェクトデータ結合・表示フロー]
図13は、本実施形態を示す文書管理システムにおける第4のデータ処理手順の一例を示すフローチャートである。本例は、結合処理部404が検索の結果ヒットしたオブジェクトデータを結合して表示する処理例である。なお、S1201〜S1207は各ステップを示す。各ステップは、複合デバイス50のCPU601がROM602、HDD611から制御プログラムをRAM603にロードして実行することで実現される。ここで、制御プログラムには、図4に示した各種モジュールが含まれる。
【0139】
S1201で、検索してヒットしたオブジェクトデータの属性情報にユーザ意味属性値が含まれているかを結合処理部404が判定する。図6に示したマップテーブルIIで示したユーザ意味属性の値、例えば、「部品」、「完成品、近接テキスト、仕様」などといった値が、検索してヒットしたオブジェクトデータの属性情報に含まれているかどうかを判定する。
【0140】
ここで、「完成品、近接テキスト、仕様」などといった値が1つでも含まれていれば真とする場合と、すべて含まれていたときに真と判定する場合があるが、結合の程度を調整するための外部パラメータとして変更することが可能である。
【0141】
S1201で、「完成品、近接テキスト、仕様」などといった値が含まれていると結合処理部404が判定した場合は、S1202へ進み、含まれていないと判定した場合は、S1206へ遷移する。なお、本実施形態に示すS1201は、着目しているオブジェクトデータとヒットしたその他のオブジェクトデータとの関係において判定される。その他のオブジェクトデータには、既に結合済みのオブジェクトも含まれており、後述する判定の結果によっては3つ以上のオブジェクトデータが結合するケースもある。
【0142】
次に、S1202で、オブジェクトデータ間の距離が値(第1の閾値)よりも小さいかどうかを、属性情報に含まれる位置情報に基づき結合処理部404が判定する。ここでは、オブジェクト同士の近さを判断する。つまり、距離の近いオブジェクトは互いに相関関係が強いという経験則に基づくもので、その程度は第1の設定値によって、例えばユーザの入力により調整可能となっている。
【0143】
ここで、距離が近いと結合処理部404が判断した場合は、S1203へ遷移するが、距離が遠いと結合処理部404が判断した場合はS1206へ遷移する。
【0144】
なお、S1202で、距離が近いか否かを判断するのは、距離が近い場合はオブジェクト同士の結合処理(S1203)が適切であり、一方、S1202で、第1の閾値以上の場合、つまりオブジェクト同士が遠い場合は結合しない方がよいからである。
【0145】
S1206で、着目しているオブジェクトデータとヒットしたその他のオブジェクトデータの距離が第2の閾値よりも小さいかを結合処理部404が判断する。この判断処理において、オブジェクトデータ結合処理部404は、オブジェクト同士の遠さを判定し、距離が第2の閾値よりも小さい場合は結合するほどではないが、ヒットしたオブジェクトデータとして表示すべきものとして処理する。
【0146】
しかし、第2の閾値よりも大きい場合は、検索でヒットしても表示するに値しないオブジェクトデータとして判断し処理する。ここで、検索結果として表示するかどうかの程度は、第2の閾値を用いて調整することができる。
【0147】
S1206で、着目しているオブジェクトとヒットしたその他のオブジェクトの距離が第2の閾値よりも小さいと結合処理部404が判定した場合は、S1204へ進む。
【0148】
一方、S1206で、着目しているオブジェクトとヒットしたその他のオブジェクトの距離が第2の閾値よりも大きいと結合処理部404が判定した場合は、S1207へ進む。
【0149】
一方、S1203で、結合処理部404は、オブジェクトを結合する処理を実行する。ここで、ユーザ意味属性が含まれており、かつオブジェクト間距離が近いオブジェクトデータは、結合して表示する対象となる。従って、当該処理工程によってオブジェクトが結合される。
【0150】
ここで、オブジェクトの結合は、各オブジェクトデータの属性情報に含まれる座標データに基づき結合される。オブジェクトとオブジェクトが離れている場合、オブジェクト間は無地の画像データで補完されて結合される。
【0151】
なお、S1203によって結合しても、結合前のオブジェクトデータは破棄せずに保持しておく。検索結果を表示したときにユーザの操作で結合したオブジェクトを再分離することが容易になるからである。
【0152】
次に、S1204で、結合処理部404がオブジェクト表示処理を実行する。なお、結合されたオブジェクトデータ、あるいは結合されずに表示するオブジェクトデータがあるが、どちらも同じ画面に検索結果として表示される。
【0153】
ここで、表示画面は、図4に示すメイン制御部200の指示によりWeb UI生成部203で生成され、データ送受信部201からクライアントPC10へ送信され所定のブラウザに表示される。
【0154】
次に、S1207は、着目しているオブジェクトデータ以外に検索でヒットした他のオブジェクトデータがあるかどうかを結合処理部404が判定する。ここで、残りのオブジェクトデータがあると結合処理部404が判定した場合は、S1205へ進み、残りのオブジェクトデータがないと結合処理部404が判定した場合は、本処理を終了する。
【0155】
そして、S1205で、メイン制御部200が着目ポインタを移動する処理を実行する。ここで、着目ポインタは、一度も着目されなかったオブジェクトデータに対して移動する。既に着目したオブジェクトデータや結合済みのオブジェクトデータには移動しない。なお、着目ポインタの移動処理を終了したら、S1205を経て、再びS1201から同様の処理を繰り返す。
【0156】
〔第2実施形態〕
以下、図14に示すメモリマップを参照して本実施形態に係る情報処理装置で読み取り可能なデータ処理プログラムの構成について説明する。
【0157】
図14は、本実施形態を示す情報処理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
【0158】
なお、特に図示しないが、記憶媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
【0159】
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラムや、インストールするプログラムが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
【0160】
本実施形態における図10〜図13に示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記憶媒体により、あるいはネットワークを介して外部の記憶媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
【0161】
以上のように、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
【0162】
この場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0163】
従って、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
【0164】
プログラムを供給するための記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
【0165】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0166】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、該ホームページから本発明のコンピュータプログラムそのもの、もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバやftpサーバ等も本発明の請求項に含まれるものである。
【0167】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0168】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではない。例えばそのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行う。そして、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0169】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込ませる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0170】
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。
【0171】
本発明の様々な例と実施形態を示して説明したが、当業者であれば、本発明の趣旨と範囲は、本明細書内の特定の説明に限定されるのではない。
【図面の簡単な説明】
【0172】
【図1】本実施形態を示す情報処理装置を含む文書管理システムの構成を説明する概念図である。
【図2】本実施形態に係る文書管理システムを構成する各PCのハードウェアの構成を説明する図である。
【図3】本実施形態に係る文書管理システムの一例を示すソフトウエア構成を示す図である。
【図4】本実施形態に係る文書管理システムの一例を示すソフトウエア構成を示す図である。
【図5A】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5B】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5C】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5D】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図5E】本実施形態を示す文書管理システムにおける文書処理の概要を説明する図である。
【図6】図4に示した意味属性関連付け処理部が参照する意味属性マップテーブルの一例を示す図である。
【図7】本実施形態を示す文書管理システムにおける位置情報及び意味属性の指定方法を説明する図である。
【図8】本実施形態を示す文書管理システムの検索及び結合における処理概念を説明する図である。
【図9】図1に示した複合デバイスの構成を説明するブロック図である。
【図10】本実施形態を示す文書管理システムにおける第1のデータ処理手順の一例を示すフローチャートである。
【図11】本実施形態を示す文書管理システムにおける第2のデータ処理手順の一例を示すフローチャートである。
【図12】本実施形態を示す文書管理システムにおける第3のデータ処理手順の一例を示すフローチャート図である。
【図13】本実施形態を示す文書管理システムにおける第4のデータ処理手順の一例を示すフローチャートである。
【図14】本実施形態を示す情報処理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
【符号の説明】
【0173】
10 クライアントPC
20 WebアプリケーションサーバPC
30 ユーザ管理サービスサーバPC
40 オブジェクト管理サービスサーバPC40
50 複合デバイス50
【特許請求の範囲】
【請求項1】
入力画像を処理する情報処理装置であって、
前記入力画像の一部に基づく、オブジェクトデータを抽出する抽出手段と、
前記抽出手段により抽出されたオブジェクトデータと、当該オブジェクトデータの属性情報を関連付けて記憶する記憶手段と、
ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索する検索手段と、
前記検索手段により検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合する結合手段と、
前記結合手段により結合されたオブジェクトデータを検索結果として表示するための制御手段とを有し、
異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、前記制御手段に基づき表示される検索結果が異なることを特徴とする情報処理装置。
【請求項2】
前記オブジェクトデータの属性情報としてイメージまたはテキストが含まれ、
オブジェクトデータの属性情報としてテキストが含まれる場合は当該オブジェクトデータを解析して得られるテキスト情報を属性情報として設定し、
オブジェクトデータの属性情報としてイメージが含まれる場合は当該オブジェクトデータに基づく画像と類似した画像に予め設定されている属性情報を設定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記ユーザ特性は、ユーザの役割、及び所属部門に関する情報であることを特徴とする請求項1または請求項2に記載の情報処理装置。
【請求項4】
前記属性情報として、入力画像中のオブジェクトデータの位置情報が含まれることを特徴とする請求項1乃至請求項3の何れか1項に記載の情報処理装置。
【請求項5】
前記結合手段は、前記入力画像から抽出された複数のオブジェクトデータが前記検索手段により検索された際に、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値に満たない場合は当該2つのオブジェクトデータを結合し、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値以上の場合は当該2つのオブジェクトデータを結合しないことを特徴とする請求項1乃至請求項4の何れか1項に記載の情報処理装置。
【請求項6】
入力画像を処理する情報処理装置におけるデータ処理方法であって、
前記入力画像の一部に基づく、オブジェクトデータを抽出する抽出ステップと、
前記抽出ステップにより抽出されたオブジェクトデータと、当該オブジェクトデータの属性情報を関連付けて記憶手段に記憶する記憶ステップと、
ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索する検索ステップと、
前記検索ステップにより検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合する結合ステップと、
前記結合ステップにより結合されたオブジェクトデータを検索結果として表示するための制御ステップとを有し、
異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、前記制御ステップに基づき表示される検索結果が異なることを特徴とするデータ処理方法。
【請求項7】
前記オブジェクトデータの属性情報としてイメージまたはテキストが含まれ、
オブジェクトデータの属性情報としてテキストが含まれる場合は当該オブジェクトデータを解析して得られるテキスト情報を属性情報として設定し、
オブジェクトデータの属性情報としてイメージが含まれる場合は当該オブジェクトデータに基づく画像と類似した画像に予め設定されている属性情報を設定することを特徴とする請求項6に記載のデータ処理方法。
【請求項8】
前記ユーザ特性は、ユーザの役割、及び所属部門に関する情報であることを特徴とする請求項6または請求項7に記載のデータ処理方法。
【請求項9】
前記属性情報として、入力画像中のオブジェクトデータの位置情報が含まれることを特徴とする請求項6乃至請求項8の何れか1項に記載のデータ処理方法。
【請求項10】
前記結合ステップは、前記入力画像から抽出された複数のオブジェクトデータが前記検索ステップにより検索された際に、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値に満たない場合は当該2つのオブジェクトデータを結合し、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値以上の場合は当該2つのオブジェクトデータを結合しないことを特徴とする請求項6乃至請求項9の何れか1項に記載のデータ処理方法。
【請求項11】
請求項6〜10のいずれか1項に記載のデータ処理方法をコンピュータに実行させることを特徴とするプログラム。
【請求項1】
入力画像を処理する情報処理装置であって、
前記入力画像の一部に基づく、オブジェクトデータを抽出する抽出手段と、
前記抽出手段により抽出されたオブジェクトデータと、当該オブジェクトデータの属性情報を関連付けて記憶する記憶手段と、
ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索する検索手段と、
前記検索手段により検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合する結合手段と、
前記結合手段により結合されたオブジェクトデータを検索結果として表示するための制御手段とを有し、
異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、前記制御手段に基づき表示される検索結果が異なることを特徴とする情報処理装置。
【請求項2】
前記オブジェクトデータの属性情報としてイメージまたはテキストが含まれ、
オブジェクトデータの属性情報としてテキストが含まれる場合は当該オブジェクトデータを解析して得られるテキスト情報を属性情報として設定し、
オブジェクトデータの属性情報としてイメージが含まれる場合は当該オブジェクトデータに基づく画像と類似した画像に予め設定されている属性情報を設定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記ユーザ特性は、ユーザの役割、及び所属部門に関する情報であることを特徴とする請求項1または請求項2に記載の情報処理装置。
【請求項4】
前記属性情報として、入力画像中のオブジェクトデータの位置情報が含まれることを特徴とする請求項1乃至請求項3の何れか1項に記載の情報処理装置。
【請求項5】
前記結合手段は、前記入力画像から抽出された複数のオブジェクトデータが前記検索手段により検索された際に、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値に満たない場合は当該2つのオブジェクトデータを結合し、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値以上の場合は当該2つのオブジェクトデータを結合しないことを特徴とする請求項1乃至請求項4の何れか1項に記載の情報処理装置。
【請求項6】
入力画像を処理する情報処理装置におけるデータ処理方法であって、
前記入力画像の一部に基づく、オブジェクトデータを抽出する抽出ステップと、
前記抽出ステップにより抽出されたオブジェクトデータと、当該オブジェクトデータの属性情報を関連付けて記憶手段に記憶する記憶ステップと、
ユーザから入力された検索条件に合致する属性情報に関連付いたオブジェクトデータを検索する検索ステップと、
前記検索ステップにより検索されたオブジェクトデータを、前記ユーザの特性に応じて他のオブジェクトデータと結合する結合ステップと、
前記結合ステップにより結合されたオブジェクトデータを検索結果として表示するための制御ステップとを有し、
異なるユーザ特性を持つユーザが同じ検索条件を入力した場合、前記制御ステップに基づき表示される検索結果が異なることを特徴とするデータ処理方法。
【請求項7】
前記オブジェクトデータの属性情報としてイメージまたはテキストが含まれ、
オブジェクトデータの属性情報としてテキストが含まれる場合は当該オブジェクトデータを解析して得られるテキスト情報を属性情報として設定し、
オブジェクトデータの属性情報としてイメージが含まれる場合は当該オブジェクトデータに基づく画像と類似した画像に予め設定されている属性情報を設定することを特徴とする請求項6に記載のデータ処理方法。
【請求項8】
前記ユーザ特性は、ユーザの役割、及び所属部門に関する情報であることを特徴とする請求項6または請求項7に記載のデータ処理方法。
【請求項9】
前記属性情報として、入力画像中のオブジェクトデータの位置情報が含まれることを特徴とする請求項6乃至請求項8の何れか1項に記載のデータ処理方法。
【請求項10】
前記結合ステップは、前記入力画像から抽出された複数のオブジェクトデータが前記検索ステップにより検索された際に、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値に満たない場合は当該2つのオブジェクトデータを結合し、前記複数のオブジェクトデータの中の2つのオブジェクトデータの位置情報に基づく距離が第1の閾値以上の場合は当該2つのオブジェクトデータを結合しないことを特徴とする請求項6乃至請求項9の何れか1項に記載のデータ処理方法。
【請求項11】
請求項6〜10のいずれか1項に記載のデータ処理方法をコンピュータに実行させることを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図5C】
【図5D】
【図5E】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2009−271892(P2009−271892A)
【公開日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願番号】特願2008−124434(P2008−124434)
【出願日】平成20年5月12日(2008.5.12)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願日】平成20年5月12日(2008.5.12)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]