説明

情報処理装置、情報処理方法、そのプログラム及び記憶媒体

【課題】文書データが異なるタイプのデバイスに分散して保存されている場合でも、統一的に精度の高いキーワード検索を可能とする。
【解決手段】認証手段と、認証手段によりアクセスを許可されたユーザの操作に従って文書データを保存する保存手段と、認証されたユーザの操作により、保存手段に文書データが保存されたときに、ユーザ情報に関連付けられた、キーワードからなるユーザキーワード情報を取得し、該情報から、該ユーザキーワード情報に含まれるキーワードを文書データに関連付けたキーワード情報タグを生成するキーワード情報タグ生成手段と、ユーザキーワード情報内のキーワードの重み付けに従ってキーワード情報タグ内のキーワードの重み付けを設定する重み付け設定手段と、キーワード情報タグ生成手段によって生成された前記文書データのキーワード情報タグの登録処理を行う登録手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書管理のための情報処理装置、情報処理方法、そのプログラム及び記憶媒体に関する。
【背景技術】
【0002】
近年、ハードウェアの進歩に伴いコンピュータのハードディスクの記憶容量が増大し、保存できるデータファイル数は膨大になっている。さらにオフィスなどでは、文書を共有して保存するためのサーバや、プリントやスキャンを行った文書データや画像データを保存する機能を持つデジタル複合機などの文書管理デバイスがネットワーク上に多数存在している。
【0003】
このような状況において、オフィス内でユーザが膨大な数のデータの中から所望の文書データを検索するには、まず複数のサーバや文書管理デバイスから、文書データが保存されていると思われるデバイスを特定しなければならない。ユーザは自分の記憶に頼りデバイスを特定し、デバイス内のディレクトリを探索し所望の文書データを探し出す。もしそのデバイスに所望の文書データがなければ、データが見つかるまで他のデバイスも同様に探索していくことになる。
【0004】
また、検索を行う際のキーワードを付与する技術が開示されている。例えば、特許文献1では、ユーザの指示に基づいて、情報に対してキーワードを付与することが記載されている。
【0005】
【特許文献1】特開2006−92251号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、オフィス内のネットワーク上にタイプの異なる多数の文書管理デバイスがある場合、所望の特定の文書データを検索するときは、どのデバイスのどのディレクトリに保存されているか自分の記憶を頼りに探すしかなく検索性が悪い。また業務に関するあるキーワードに関して複数の文書データから情報を収集したい場合も、文書データが異なるタイプのデバイスに分散して保存されていると統一的にキーワード検索を行うことができない。
【0007】
また、1つの閉じたオフィス内では似たような用語が使われていることが多い。このような環境では、複数のデバイスに分散している文書データを統一的に全文検索可能になったとしても、業務に関する用語を用いた検索で、必要な情報が載っている文書データが検索結果の高い順位になるとは限らない。
【0008】
検索性を高めるために文書データにユーザがキーワード等の情報を設定することも考えられるが、ユーザが文書管理デバイスの文書データにアクセスするたびにキーワード登録を行わせると利便性が悪くなってしまう。
【課題を解決するための手段】
【0009】
上記課題を解決するために、請求項1に記載の発明は、ネットワーク接続可能な情報処理装置であって、ユーザ認証によってユーザをログインさせる認証手段と、前記認証手段によってアクセスを許可されたユーザの操作に従って文書データを保存する保存手段と、前記認証手段によって認証されたユーザの操作により、前記保存手段に文書データが保存されたときに、ユーザ情報に関連付けられた、キーワードからなるユーザキーワード情報を取得し、該情報から、該ユーザキーワード情報に含まれるキーワードを文書データに関連付けたキーワード情報タグを生成するキーワード情報タグ生成手段と、前記ユーザキーワード情報内のキーワードの重み付けに従って前記キーワード情報タグ内のキーワードの重み付けを設定する重み付け設定手段と、前記キーワード情報タグ生成手段によって生成された前記文書データのキーワード情報タグの登録処理を行う登録手段と、を有することを特徴する。
【0010】
また、請求項2に記載の発明は、請求項1に記載の情報処理装置において、前記保存手段により保存されている文書データへのアクセスを監視する監視手段と、
前記監視手段によって、前記認証手段により認証されたユーザによる保存された文書データに対する内容の変更が検出された場合、アクセスしている前記ユーザに関連付けられたユーザキーワード情報から生成されたキーワード情報タグを更新する更新手段と
をさらに有することを特徴とする。
【0011】
また、請求項3に記載の発明は、請求項2に記載の情報処理装置において、キーワード情報タグ生成よりも優先される処理が行われている場合、前記キーワード情報タグ生成手段もしくは前記更新手段によってキーワード情報タグが生成または更新されるべき文書データにアクセスしているユーザのユーザ情報とその文書データのアクセス履歴とを保存するアクセス履歴保存手段をさらに有し、前記キーワード情報タグ生成手段は、前記キーワード情報タグ生成よりも優先される処理が完了した後に、または事前に設定された時刻に、前記アクセス履歴保存手段に保存されたユーザ情報および文書データのアクセス履歴を基にキーワード情報タグを生成することを特徴とする。
【0012】
また、請求項4に記載の発明は、請求項2または請求項3に記載の情報処理装置において、キーワード情報タグ生成よりも優先される処理が行われていない状態であるとき、前記キーワード情報タグ生成手段は、新規の文書データに対し新規のキーワード情報タグを生成し、新規でない文書データに対し当該文書データと関連付けられているキーワード情報タグを更新し、前記登録手段は、生成または更新された前記キーワード情報タグの登録処理を行うことを特徴とする。
【0013】
また、請求項5に記載の発明は、請求項1から請求項4のいずれかに記載の情報処理装置と協働するネットワーク接続可能な情報処理装置であって、キーワードを保存するキーワード保存手段と、前記キーワード保存手段に対して前記キーワードを階層化して登録するキーワード登録手段と、前記キーワード登録手段により登録された登録キーワードを、他の情報データベースから抽出した情報と関連付けたキーワード情報を生成するキーワード情報生成手段と前記登録手段によって登録される、文書データのキーワード情報タグを保存するキーワード情報タグ保存手段と、前記キーワード情報タグ保存手段に保存されたキーワード情報タグを用いて、文書データを保存する1または複数の前記情報処理装置から文書データを検索する検索手段とを有することを特徴とする。
【0014】
また、請求項6に記載の発明は、請求項5に記載の情報処理装置において、前記情報データベースは、前記認証手段がユーザ認証のために使用するユーザ情報が登録されたユーザ情報データベースあることを特徴とする。
【0015】
また、請求項7に記載の発明は、請求項5または請求項6に記載の情報処理装置において、前記キーワード情報生成手段において、抽出された前記登録キーワードから階層構造上近隣に位置しているキーワードが存在すればそれを関連するキーワードとして抽出し、前記抽出された登録キーワードとは異なる重み付けを設定する重み付け設定手段をさらに有する。
【0016】
また、請求項8に記載の発明は、請求項5から請求項7のいずれかに記載の情報処理装置において、ユーザに、文書データ検索画面で前記キーワード情報タグによる検索か、全文検索かを選択させる選択手段と、前記選択手段によって全文検索を行う場合、ユーザにより入力された検索語句が前記キーワード登録手段によって登録されているキーワードに一致する場合は、全文検索の選択にかかわらずキーワード情報タグによる検索を優先しておこなう検索手段とをさらに有することを特徴とする。
【0017】
また、請求項9に記載の発明は、ネットワーク接続可能な情報処理装置おける情報処理方法であって、前記情報処理装置に備わる制御装置により、ユーザ認証によってユーザをログインさせる認証ステップと、前記認証ステップにおいてアクセスを許可されたユーザの操作に従って文書データを保存する保存ステップと、前記認証ステップによって認証されたユーザの操作により、前記保存ステップにより文書データが保存されたときに、ユーザ情報に関連付けられた、キーワードからなるユーザキーワード情報を取得し、該情報から、該ユーザキーワード情報に含まれるキーワードを文書データに関連付けたキーワード情報タグを生成するキーワード情報タグ生成ステップと、前記ユーザキーワード情報内のキーワードの重み付けに従って前記キーワード情報タグ内のキーワードの重み付けを設定するステップと、前記キーワード情報タグ生成手段によって生成された前記文書データのキーワード情報タグの登録処理を行う登録ステップと、を含むステップ群が実行されることを特徴する。
【0018】
また、請求項10に記載の発明は、請求項9に記載の情報処理方法において、前記保存ステップにより保存されている文書データへのアクセスを監視する監視ステップと、前記監視ステップによって、前記認証ステップにより認証されたユーザによる保存された文書データに対する内容の変更が検出された場合、アクセスしている前記ユーザに関連付けられたユーザキーワード情報から生成されたキーワード情報タグを更新する更新ステップとをさらに含むことを特徴とする。
【0019】
また、請求項11に記載の発明は、請求項10に記載の情報処理方法において、キーワード情報タグ生成よりも優先される処理が行われている場合、前記キーワード情報タグ生成ステップもしくは前記更新ステップによってキーワード情報タグが生成または更新されるべき文書データにアクセスしているユーザのユーザ情報とその文書データのアクセス履歴とを保存するアクセス履歴保存ステップをさらに含み、前記キーワード情報タグ生成ステップは、前記キーワード情報タグ生成よりも優先される処理が完了した後に、または事前に設定された時刻に、前記アクセス履歴保存ステップにより保存されたユーザ情報および文書データのアクセス履歴を基にキーワード情報タグを生成することを特徴とする。
【0020】
また、請求項12に記載の発明は、請求項10または請求項11に記載の情報処理方法において、キーワード情報タグ生成よりも優先される処理が行われていない状態であるとき、前記キーワード情報タグ生成手段は、新規の文書データに対し新規のキーワード情報タグを生成し、新規でない文書データに対し当該文書データと関連付けられているキーワード情報タグを更新し、前記登録手段は、生成または更新された前記キーワード情報タグの登録処理を行うことを特徴とする。
【0021】
また、請求項13に記載の発明は、請求項1から請求項4のいずれかに記載の情報処理装置と協働するネットワーク接続可能な情報処理装置における情報処理方法であって、当該情報処理装置に備わる制御装置により、キーワードを保存するキーワード保存ステップと、前記キーワード保存ステップにより保存された前記キーワードを階層化して登録するキーワード登録手段と、前記キーワード登録ステップにより登録された登録キーワードを、他の情報データベースから抽出した情報と関連付けたキーワード情報を生成するキーワード情報生成ステップと、前記登録ステップによって登録される、文書データのキーワード情報タグを保存するキーワード情報タグ保存ステップと、前記キーワード情報タグ保存ステップにより保存されたキーワード情報タグを用いて、文書データを保存する1または複数の前記情報処理装置から文書データを検索する検索手段とを含むステップ群が実行されることを特徴とする。
【0022】
また、請求項14に記載の発明は、請求項13に記載の情報処理方法において、前記情報データベースは、前記認証ステップにおいてユーザ認証のために使用するユーザ情報が登録されたユーザ情報データベースあることを特徴とする。
【0023】
また、請求項15に記載の発明は、請求項13または請求項14に記載の情報処理方法において、前記キーワード情報生成ステップにおいて、抽出された前記登録キーワードから階層構造上近隣に位置しているキーワードが存在すればそれを関連するキーワードとして抽出し、前記抽出された登録キーワードとは異なる重み付けを設定する重み付け設定ステップをさらに含むことを特徴とする。
【0024】
また、請求項16に記載の発明は、請求項13から請求項15のいずれかに記載の情報処理方法において、ユーザに、文書データ検索画面で前記キーワード情報タグによる検索か、全文検索かを選択させる選択ステップと、前記選択ステップにおいて全文検索を行う場合、ユーザにより入力された検索語句が前記キーワード登録ステップによって登録されているキーワードに一致する場合は、全文検索の選択にかかわらずキーワード情報タグによる検索を優先しておこなうステップとをさらに含むことを特徴とする。
【0025】
上記各情報処理方法における諸ステップは、各種情報処理装置に備わるコンピュータに実行させるためのプログラムとして構成することができる。そして、このプログラムを前記コンピュータに読み込ませることにより当該情報処理装置の情報処理方法としてコンピュータに実行させることができる。また、このプログラムは、このプログラムを記憶させたコンピュータ読み取り可能な記憶媒体を介して前記コンピュータに読み込ませることができる。
【発明の効果】
【0026】
本発明によれば、異なるタイプの文書管理デバイスに文書データが分散して保存されている場合であっても、統一的に文書の検索を行うことができる。また、本発明では、検索するキーワードを階層化して管理する。さらに、文書データを使用したユーザの情報などをもとに、重み付けを設定しながら管理されているキーワードから文書データのタグを生成する。これによって、特にオフィスなどの閉じたネットワーク内で使用される頻度の高い語句について、文書データの検索精度を向上させることができる。
【発明を実施するための最良の形態】
【0027】
以下に、図面を参照して、本発明の好適な実施の形態を例示的に詳しく説明する。ただし、以下に説明する実施の形態に記載されている構成要素はあくまで例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。
【0028】
[ネットワークシステムの構成]
はじめに、本発明の好適な実施形態に係る情報処理装置を含むネットワークシステムの構成について図1を参照し説明する。
【0029】
図1は本ネットワークシステムの構成図である。
【0030】
図1中、1000はオフィスなどで文書データを共有して保存するために使用される文書管理サーバである。1100は文書データをスキャン、コピー、プリント等を行うデジタル複合機であり、文書データ、画像データを保存できる機能を持ち、文書管理サーバ1000と同様に文書データを共有して保存するためにも使用される。1200はユーザが管理する情報処理装置としてのユーザ端末である。パーソナルコンピュータや携帯端末やプリンタや複写機など、ネットワークに接続可能なあらゆる情報処理装置がユーザ端末1200となりうる。1300はユーザ認証に必要なユーザ情報(ユーザ名、ユーザID、パスワード、所属等)を持つユーザ情報データベースである。1400は文書データに関連するキーワード情報を管理するキーワード管理サーバであり、データベース機能をもつ。
【0031】
1600はインターネット、イントラネットなどのネットワークである。文書管理サーバ1000、デジタル複合機1100、ユーザ端末1200、ユーザ情報データベース1300、およびキーワード管理サーバ1400は、ネットワーク接続可能であり、ネットワーク1600を介して互いに接続され協働する。なお、キーワード管理サーバ1400の機能は、ネットワーク1600上の他の装置に含めてもよい。
【0032】
次に、文書管理サーバ1000の内部構成の詳細を説明する。
1001は、ユーザの認証処理を行うユーザ認証部である。1002は文書データ解析部であり、文書データを解析しキーワードを検出する文書解析部1003と、後述するキーワード情報タグ生成部1004を含む。1005は文書データ保存部であり、保存されている文書データへのアクセスを監視するデータ監視部1006、ユーザのアクセス履歴を保存するアクセス履歴保存部1007、文書データを保存するデータ保存部1008を含む。
【0033】
次いで、デジタル複合機1100の内部構成の詳細を説明する。
1101は表示部、1102は操作部、1103はユーザ認証部である。1104はデジタル複合機1100に含まれる画像形成部であり、画像スキャン等を行う画像入力部1105、各種画像処理を行う画像変換部1106、印刷用紙への印字・印刷を行う画像出力部1107を含む。画像形成部1104は、デジタル複合機1100のスキャン、プリント機能を実現する部分である。1108はデジタル複合機1100に含まれる文書データ解析部であり、文書データを解析しキーワードを検出する文書解析部1109、後述するキーワード情報タグ生成部1110を含む。文書解析部1109はアプリケーションソフトで作成された文書データの解析だけでなく、画像形成部1104で生成された画像データを解析するためのOCR(Optical Character Reader)の機能も備える。1111はデジタル複合機1100に含まれる文書データ保存部である。これには、保存されている文書データへのアクセスを監視するデータ監視部1112、ユーザのアクセス履歴を保存するアクセス履歴保存部1113、および文書データを保存するデータ保存部1114を含む。
【0034】
次に、ユーザ端末1200の内部構成を説明する。
1201は表示部、1202は操作部、1203はユーザ認証部である。このユーザ端末1200としては、ネットワーク1600に接続するためのインターフェースを備えたパーソナルコンピュータ(PC)等を用いることができる。 文書管理サーバ1000、デジタル複合機1100、ユーザ端末1200はそれぞれユーザ認証部(1001、1103、1203)を持つ。ユーザはいずれかのユーザ認証部の許可を受けネットワーク1600を介してユーザ情報データベース1300にアクセスすることになる。そして、このユーザ情報データベース1300内のユーザ情報テーブル1301のユーザ情報を基に認証がなされ、ネットワーク1600上の他のデバイスにアクセス可能となる。
【0035】
次に、キーワード管理サーバ1400の内部構成を説明する。
1401はキーワード登録部であり、ユーザはユーザ端末1200などからこれを起動して、キーワード保存部1405内の登録キーワード保存部1406へのキーワードの新規登録、編集、および削除を行う。
1402はキーワードテーブル生成部であり、ユーザ情報テーブル1301の各ユーザ情報から(例えば、職場(オフィス)情報等を基に)、登録キーワード保存部1406に登録されているキーワードを抽出する。そして、抽出したキーワードを各ユーザに関連付けたキーワード情報をキーワード保存部1405内のユーザキーワード保存部1407に登録するものである。
【0036】
1403はキーワード情報タグ保存部であり、文書管理サーバ1000やデジタル複合機1100などの文書管理デバイスのキーワード情報タグ生成部(1004、1110)によって生成されたキーワード情報タグが保存される。なお、このキーワード情報タグは、文書管理デバイスによってキーワード情報タグ保存部1403に登録される。また、このキーワード情報タグには、当該文書データに関する情報(ファイル名や、この文書データの保存場所を特定する情報(文書管理デバイスのアドレスや文書データが格納されたディレクトリ情報など))が含められる。これによりキーワード情報タグは、文書データに関連付けられる。
【0037】
1404はキーワード情報タグ検索部である。ユーザはユーザ端末1200からキーワード情報タグ検索部1404を起動させることにより、キーワード情報タグ保存部1403に保存されているキーワード情報タグによる文書データのキーワード検索が可能となる。
【0038】
次に、図2を参照し、文書管理サーバ1000についてさらに詳細に説明する。
【0039】
図2は文書管理サーバ1000の概略構成を示すブロック図である。
【0040】
図2において、201はCRTや液晶パネルによる表示装置であり、その表示画面には、例えばウインドウ、アイコン、メッセージ、メニューその他のユーザインターフェース情報が表示される。202はVRAMであり、表示装置201に表示するための画像が描画される。このVRAM202上に生成された画像データは、所定の規約に従って表示装置201に転送され、これにより表示装置201に画像が表示される。203はCDD(コンパクトディスクドライブ)であり、CD−ROMや、CD−Rなどの記録メディアとの間で各種制御プログラムやデータの読み書きを行う装置である。これはDVDドライブであってもよい。
【0041】
204はキーボードであり、文字入力を行うための各種キーを有する。205はマウスやタッチパネルなどのPD(ポインティングデバイス)であり、例えば、表示部201の表示画面上に表示されたアイコン、メニューその他のオブジェクトを指示するために使用される。206はCPUであり、ROM207、HDD(ハードディスクドライブ)209、FDD(フレキシブルディスクドライブ)210及び外部記憶装置(図示せず)に格納された制御プログラムに基づいてCPUデバイスに接続された各デバイスを制御する。207はROM(リードオンリメモリ)であり、各種の制御プログラムやデータを保持する。208はRAM(ランダムアクセスメモリ)でありCPU206のワーク領域、エラー処理時のデータの退避領域、制御プログラムのロード領域等を有する。
【0042】
209は記憶装置としてのHDDであり、各種制御プログラムや各種データを保存する。211はネットワーク・インターフェース(Net−I/F)であり、他の情報処理装置やプリンタ等とネットワーク213を介して通信を行うことができる。212はCPUバスであり、アドレスバス、データバス及びコントロールバスを含む。CPU206に対する制御プログラムの提供は、ROM207、HDD209、FDD210、CDD203から行うこともできるし、ネットワーク213を介して他の情報処理装置等から行うこともできる。
【0043】
以上、文書管理サーバ1000のハードウェア構成について図2を用いて説明したが、ユーザ端末1200およびキーワード管理サーバ1400も、そのハードウェア構成は図2したものと同じ構成を取ることができる。また、各サーバおよびユーザ端末1200において実行される各種処理は、それぞれに備わるCPUにより実行され、生成されるデータは、RAM、HDDなど読み出し・書き込み可能な記憶デバイスに記憶される。
【0044】
次に、本実施形態における処理の詳細の詳細について図面を参照し説明する。
【0045】
[キーワード登録処理]
キーワード登録部1401におけるキーワード登録処理について図6のキーワード登録ページ画面を用いて説明する。
【0046】
ユーザがユーザ端末1200からキーワード登録部1401に対してアクセスすると、ユーザ端末1200の表示部1201にキーワード登録ページ6000が表示される。6001は登録キーワード表示ビューであり、キーワードを階層的に登録することができる。ユーザは登録キーワードビュー6001からキーワードを選択すると、選択されたことが分かるよう強調表示される。図6の例の場合「DEF」が選択されており、6002のように強調表示されていることが分かる。さらに6003のキーワード編集フォームに現在選択しているキーワードが表示され、ユーザはキーワードの編集を行うことができる。また6004のキーワード登録フォームでは、新規登録したいキーワードを入力すると現在登録キーワードビュー6001で選択しているキーワードの1つ下に登録することができる。最後に6005の設定ボタンを押下することによって、設定した内容が登録キーワード保存部1406に反映される。
【0047】
[ユーザキーワードテーブル生成処理]
次にキーワードテーブル生成部1402におけるユーザキーワードテーブル生成処理(キーワード情報生成処理)について説明する。
まずその概要について述べる。
【0048】
キーワードテーブル生成部1402は、あるデータベースのテーブルのレコード情報を基に、登録キーワード保存部1406に登録されているキーワードを抽出し関連付けることによって、文書検索のためのキーワード情報を新たに生成する。新たにキーワード情報を生成するための元となるデータベースのテーブルは、予めキーワードテーブル生成部1402が参照するために登録されているものとする。本実施形態の場合、ユーザ情報テーブル1301が、その元となるデータベースのテーブルにあたる。
【0049】
以上の前提を踏まえた上で、図3のフローチャートを用いてユーザキーワードテーブル生成処理について説明する。
【0050】
ユーザ情報テーブル1301が変更されると、キーワードテーブル生成部1402に通知され本フローが起動される。
【0051】
はじめに、S3001において、キーワードテーブル生成部1402は新規登録・修正・削除等が行われたユーザ情報を取得する。
【0052】
次いで、S3002において、ユーザ情報が削除されたのか、もしくは新規登録・修正が行われたのか判断する。ユーザ情報が削除されていた場合は、S3003において削除されたユーザ情報に関連付けられているユーザキーワード情報をユーザキーワード保存部1407から削除して、本フローを終了する。一方、ユーザ情報が新規登録・修正が行われていた場合は、S3004において、取得したユーザ情報を基に、登録キーワード保存部1406に登録されているキーワードを抽出する。例えば、ユーザの所属が変わったことで、ユーザ情報が変更されている場合、新たに所属する職場でよく用いられる用語をキーワードとして抽出するようにしてもよい。この場合、どの用語がその職場でよく用いられるかは別途登録できるようにするとよい。新規登録の場合も同様にすることができる。
【0053】
登録キーワード保存部1406では、図6に示したようにキーワードが階層構造になって登録されている。この階層構造を利用し、S3005において、登録キーワード保存部1406から抽出した各キーワードから、階層構造上近隣に位置しているキーワードが存在すれば、S3006にて関連しているキーワードとして抽出する。S3004において抽出されたキーワードが独立したものであれば、関連するキーワードはないものとして抽出しない。
【0054】
各抽出したキーワードについて関連するキーワードを抽出したところで、S3007おいてユーザキーワード情報を生成する。ユーザキーワード情報を生成する際には、ユーザ情報を基に直接抽出されたキーワードとそれに関連したキーワードとでは、直接抽出されたキーワードがより高い順位でヒットされるよう重み付けを行う。
【0055】
最後に、S3008において、生成されたユーザキーワード情報をユーザキーワード保存部1407に登録する。
【0056】
[文書管理サーバ、デジタル複合機への文書登録処理]
次に、文書管理サーバ1000、デジタル複合機1100への文書登録処理について、図4のフローチャートを用いて説明する。
なお、以下の説明において、特に断りがない場合は、文書管理デバイスは文書管理サーバ1000とデジタル複合機1100を指すものとする。
【0057】
はじめに、S4001において、ユーザがユーザ端末1200、もしくは直接文書管理デバイスにログインする。ログインすることによって、ユーザはS4002において、ユーザは文書データを文書管理デバイスに保存することが可能となる。S4003において、文書管理デバイス内でキーワード情報タグ生成よりも優先される処理が行われている場合は、S4004においてユーザ情報と保存された文書データのアクセス履歴とをアクセス履歴保存部(1007、1113)に保存して処理を終了する。
【0058】
アクセス履歴保存部(1007、1113)に保存されたユーザ情報と文書データのアクセス履歴は、文書管理デバイス内で優先される処理が完了後、もしくは定期的に事前に時刻を設定しておき、後から前述のキーワード情報タグ生成を行うことを想定している。例えば、デジタル複合機の場合、印刷処理などリアルタイム性を求められる処理が優先されるため、キーワード情報タグ生成のようなリアルタイム性を求められない処理はデジタル複合機がidle状態のときに後から行われる。
【0059】
なお、キーワード情報タグ生成に必要なユーザキーワード情報は、保存されたユーザ情報を基に取得することができる。また保存されたアクセス履歴からキーワード情報タグ生成の対象となる文書データが特定される。したがって、ユーザ情報と文書データのアクセス履歴を保存することにより、時間をおいてキーワード情報タグを生成することができる。
【0060】
一方、優先される処理が行われていない場合は、S4005においてログインしているユーザのユーザキーワード情報をキーワード管理サーバ1400のユーザキーワード保存部1407から取得する。
【0061】
次いで、S4006において、文書管理デバイスは保存された文書データから、ユーザキーワード情報に含まれるキーワードを抽出する。そしてS4007において、登録された文書データが新規文書データであるかどうかを判断する。
【0062】
このとき登録された文書データが新規文書であった場合は、S4008において、文書管理デバイスのキーワード情報タグ生成部(1004、1110)によって新規キーワード情報タグを生成する。そして、S4009でユーザキーワード情報内に設定されているキーワードの重みに従い、キーワード情報タグの各キーワードの重みを設定する。さらに、S4011において、新規に生成されたキーワード情報タグをキーワード情報タグ保存部1403に登録する処理を行う。
【0063】
一方、登録された文書データが新規文書でなかった場合は、すなわち、保存されている文書に対する更新、結合、削除等、その内容に対する変更が行われた場合(これはデータ監視部1006、1112による監視により検出される)、S4010へと移行する。そしてS4010において、キーワード情報タグ保存部1403から更新すべきキーワード情報タグを取得する。そして、S4011において、ユーザキーワード情報に設定されている重みに従いキーワード情報タグ内のキーワードの重みを更新し、更新されたキーワード情報タグをキーワード情報タグ保存部1403に登録する。
【0064】
以上のようにユーザキーワード情報やキーワード情報タグを生成する際に、後述する文書検索に利用するキーワードに対する重み付けを設定している。この重み付けのロジックおよび重み付けによる検索方法については、用いるシステムで最適なロジックを選択すればよく、本提案ではその詳細は言及しない。
【0065】
[文書データ検索処理]
次に、キーワード情報タグ検索部1404における文書データ検索処理について、図5のフローチャートと、図7のキーワード検索ページ画面(文書データ検索画面)、図8の検索結果ページ画面を用いて説明する。
【0066】
ユーザはユーザ端末1200からログインし、キーワード管理サーバ1400のキーワード情報タグ検索部1404を起動させると、ユーザ端末1200の表示部1201に図7のキーワード検索ページ画面7000が表示される。
【0067】
7001は登録キーワード表示ビューであり、階層的に登録キーワードが表示される。ユーザが登録キーワードビュー7001からキーワードを選択すると、選択されたことが分かるように強調表示される。図7の例の場合、「×××」が選択されており、7002のように強調表示されていることが分かる。この状態で検索ボタン7004を押下すると、キーワード情報タグ検索部1404によって、選択したキーワード7002をキーとしてタグによる文書データ検索処理が開始する。一方、7003の全文検索フォームに検索したい語句を入力して検索ボタン7003を押下すると、キーワード情報タグ検索部1404によって入力した検索語句による文書データ検索処理が開始される。
【0068】
したがって、検索ボタン7004が押下されると、S5001において、キーワード情報タグ検索部1404においてタグによる検索か、全文検索か判断される。タグによる検索の場合、S5002において、キーワード情報タグ保存部1403からキーワードが一致するキーワード情報タグを検索する。そして、S5003において、検索されたキーワード情報タグから文書データへのリンクを読み出し、検索結果ページ画面8000よって、キーワードに設定された重み付けの高い順にユーザ端末1200の表示部1201に表示させる。ユーザがここでさらに全文検索を行いたい場合は、検索結果表ページ8000内の全文検索フォーム8001に検索語句を入力し、検索ボタン8002を押下することで続けて全文検索を行うことができる。
【0069】
一方、S5001において全文検索と判断された場合は、S5004によってユーザによって入力された検索語句が登録キーワードに含まれているかどうかを判断する。もし登録キーワードに含まれている語句であった場合は、S5002、5003によってタグによる検索と同じ処理を行う。そしてタグによる検索に失敗した場合、引き続き全文検索を行う。他方、検索語句が登録キーワードに含まれていない場合は、S5005において、各文書管理デバイスに保存されている文書データに対し全文検索を行う。そして、S4011において、図8の検索結果ページ画面8000に示すように、検索結果である文書データへのリンクの一覧8001をユーザ端末1200の表示部1201に表示させる。
【0070】
以上、本発明の実施形態について説明した。
【0071】
なお、本発明の目的は、上述した実施形態で示したフローチャートの手順(ステップ群)を実現するプログラムコードによっても達成される。すなわち、このプログラムコードを記憶した記憶媒体から、システムあるいは装置のコンピュータ(またはCPUやMPU)がそのプログラムコードを読出し実行することによっても達成することができる。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになる。そのため、このプログラムコード及びプログラムコードを記憶/記録したコンピュータ読み取り可能な記憶媒体も本発明の一つを構成することになる。
【0072】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0073】
また、前述した実施形態の機能は、コンピュータが、読み出したプログラムを実行することによって実現される。また、このプログラムの実行とは、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行う場合も含まれる。
【0074】
さらに、前述した実施形態の機能は、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットによっても実現することもできる。この場合、まず、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。こうした機能拡張ボードや機能拡張ユニットによる処理によっても前述した実施形態の機能が実現される。
【図面の簡単な説明】
【0075】
【図1】本発明の一実施の形態における文書管理サーバ、デジタル複合機、キーワード管理サーバ、ユーザ端末を含む全体システム図である。
【図2】本発明の一実施の形態における文書管理サーバの概略構成を示すブロック図である。
【図3】本発明の一実施の形態におけるユーザキーワードテーブル生成処理のフローチャートである。
【図4】本発明の一実施の形態における文書管理デバイスへの文書登録処理のフローチャートである。
【図5】本発明の一実施の形態における文書データ検索処理のフローチャートである。
【図6】本発明の一実施の形態におけるキーワード登録ページ画面の一例を示す図である。
【図7】本発明の一実施の形態におけるキーワード検索ページ画面の一例を示す図である。
【図8】本発明の一実施の形態におけるよる検索結果ページ画面の一例を示す図である。
【符号の説明】
【0076】
1000 文書管理サーバ
1001 ユーザ認証部
1002 文書データ解析部
1003 文書解析部
1004 キーワード情報タグ生成部
1005 文書データ保存部
1006 データ監視部
1007 アクセス履歴保存部
1008 データ保存部
1100 デジタル複合機
1101 表示部
1102 操作部
1103 ユーザ認証部
1104 画像形成部
1105 画像入力部
1106 画像変換部
1107 画像出力部
1108 文書データ解析部
1109 文書解析部
1110 キーワード情報タグ生成部
1111 文書データ保存部
1112 データ監視部
1113 アクセス履歴保存部
1114 データ保存部
1200 ユーザ端末
1201 表示部
1202 操作部
1203 ユーザ認証部
1300 ユーザ情報データベース
1301 ユーザ情報テーブル
1400 キーワード管理サーバ
1401 キーワード登録部
1402 キーワードテーブル生成部
1403 キーワード情報タグ保存部
1404 キーワード情報タグ検索部
1405 キーワード保存部
1406 登録キーワード保存部
1407 ユーザキーワード保存部

【特許請求の範囲】
【請求項1】
ネットワーク接続可能な情報処理装置であって、
ユーザ認証によってユーザをログインさせる認証手段と、
前記認証手段によってアクセスを許可されたユーザの操作に従って文書データを保存する保存手段と、
前記認証手段によって認証されたユーザの操作により、前記保存手段に文書データが保存されたときに、ユーザ情報に関連付けられた、キーワードからなるユーザキーワード情報を取得し、該情報から、該ユーザキーワード情報に含まれるキーワードを文書データに関連付けたキーワード情報タグを生成するキーワード情報タグ生成手段と、
前記ユーザキーワード情報内のキーワードの重み付けに従って前記キーワード情報タグ内のキーワードの重み付けを設定する重み付け設定手段と、
前記キーワード情報タグ生成手段によって生成された前記文書データのキーワード情報タグの登録処理を行う登録手段と、
を有することを特徴する情報処理装置。
【請求項2】
前記保存手段により保存されている文書データへのアクセスを監視する監視手段と、
前記監視手段によって、前記認証手段により認証されたユーザによる保存された文書データに対する内容の変更が検出された場合、アクセスしている前記ユーザに関連付けられたユーザキーワード情報から生成されたキーワード情報タグを更新する更新手段と
をさらに有することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
キーワード情報タグ生成よりも優先される処理が行われている場合、前記キーワード情報タグ生成手段もしくは前記更新手段によってキーワード情報タグが生成または更新されるべき文書データにアクセスしているユーザのユーザ情報とその文書データのアクセス履歴とを保存するアクセス履歴保存手段をさらに有し、
前記キーワード情報タグ生成手段は、前記キーワード情報タグ生成よりも優先される処理が完了した後に、または事前に設定された時刻に、前記アクセス履歴保存手段に保存されたユーザ情報および文書データのアクセス履歴を基にキーワード情報タグを生成する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
キーワード情報タグ生成よりも優先される処理が行われていない状態であるとき、前記キーワード情報タグ生成手段は、新規の文書データに対し新規のキーワード情報タグを生成し、新規でない文書データに対し当該文書データと関連付けられているキーワード情報タグを更新し、前記登録手段は、生成または更新された前記キーワード情報タグの登録処理を行うことを特徴とする請求項2または請求項3に記載の情報処理装置。
【請求項5】
請求項1から請求項4のいずれかに記載の情報処理装置と協働するネットワーク接続可能な情報処理装置であって、
キーワードを保存するキーワード保存手段と、
前記キーワード保存手段に対して前記キーワードを階層化して登録するキーワード登録手段と、
前記キーワード登録手段により登録された登録キーワードを、他の情報データベースから抽出した情報と関連付けたキーワード情報を生成するキーワード情報生成手段と
前記登録手段によって登録される、文書データのキーワード情報タグを保存するキーワード情報タグ保存手段と、
前記キーワード情報タグ保存手段に保存されたキーワード情報タグを用いて、文書データを保存する1または複数の前記情報処理装置から文書データを検索する検索手段と
を有することを特徴とする情報処理装置。
【請求項6】
前記情報データベースは、前記認証手段がユーザ認証のために使用するユーザ情報が登録されたユーザ情報データベースあることを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記キーワード情報生成手段において、抽出された前記登録キーワードから階層構造上近隣に位置しているキーワードが存在すればそれを関連するキーワードとして抽出し、前記抽出された登録キーワードとは異なる重み付けを設定する重み付け設定手段をさらに有する請求項5または請求項6に記載の情報処理装置。
【請求項8】
ユーザに、文書データ検索画面で前記キーワード情報タグによる検索か、全文検索かを選択させる選択手段と、
前記選択手段によって全文検索を行う場合、ユーザにより入力された検索語句が前記キーワード登録手段によって登録されているキーワードに一致する場合は、全文検索の選択にかかわらずキーワード情報タグによる検索を優先しておこなう検索手段と
をさらに有することを特徴とする請求項5から請求項7のいずれかに記載の情報処理装置。
【請求項9】
ネットワーク接続可能な情報処理装置おける情報処理方法であって、前記情報処理装置に備わる制御装置により、
ユーザ認証によってユーザをログインさせる認証ステップと、
前記認証ステップにおいてアクセスを許可されたユーザの操作に従って文書データを保存する保存ステップと、
前記認証ステップによって認証されたユーザの操作により、前記保存ステップにより文書データが保存されたときに、ユーザ情報に関連付けられた、キーワードからなるユーザキーワード情報を取得し、該情報から、該ユーザキーワード情報に含まれるキーワードを文書データに関連付けたキーワード情報タグを生成するキーワード情報タグ生成ステップと、
前記ユーザキーワード情報内のキーワードの重み付けに従って前記キーワード情報タグ内のキーワードの重み付けを設定するステップと、
前記キーワード情報タグ生成手段によって生成された前記文書データのキーワード情報タグの登録処理を行う登録ステップと、
を含むステップ群が実行されることを特徴する情報処理方法。
【請求項10】
前記保存ステップにより保存されている文書データへのアクセスを監視する監視ステップと、
前記監視ステップによって、前記認証ステップにより認証されたユーザによる保存された文書データに対する内容の変更が検出された場合、アクセスしている前記ユーザに関連付けられたユーザキーワード情報から生成されたキーワード情報タグを更新する更新ステップと
をさらに含むことを特徴とする請求項9に記載の情報処理方法。
【請求項11】
キーワード情報タグ生成よりも優先される処理が行われている場合、前記キーワード情報タグ生成ステップもしくは前記更新ステップによってキーワード情報タグが生成または更新されるべき文書データにアクセスしているユーザのユーザ情報とその文書データのアクセス履歴とを保存するアクセス履歴保存ステップをさらに含み、
前記キーワード情報タグ生成ステップは、前記キーワード情報タグ生成よりも優先される処理が完了した後に、または事前に設定された時刻に、前記アクセス履歴保存ステップにより保存されたユーザ情報および文書データのアクセス履歴を基にキーワード情報タグを生成する
ことを特徴とする請求項10に記載の情報処理方法。
【請求項12】
キーワード情報タグ生成よりも優先される処理が行われていない状態であるとき、前記キーワード情報タグ生成手段は、新規の文書データに対し新規のキーワード情報タグを生成し、新規でない文書データに対し当該文書データと関連付けられているキーワード情報タグを更新し、前記登録手段は、生成または更新された前記キーワード情報タグの登録処理を行うことを特徴とする請求項10または請求項11に記載の情報処理方法。
【請求項13】
請求項1から請求項4のいずれかに記載の情報処理装置と協働するネットワーク接続可能な情報処理装置における情報処理方法であって、当該情報処理装置に備わる制御装置により、
キーワードを保存するキーワード保存ステップと、
前記キーワード保存ステップにより保存された前記キーワードを階層化して登録するキーワード登録手段と、
前記キーワード登録ステップにより登録された登録キーワードを、他の情報データベースから抽出した情報と関連付けたキーワード情報を生成するキーワード情報生成ステップと、
前記登録ステップによって登録される、文書データのキーワード情報タグを保存するキーワード情報タグ保存ステップと、
前記キーワード情報タグ保存ステップにより保存されたキーワード情報タグを用いて、文書データを保存する1または複数の前記情報処理装置から文書データを検索する検索手段と
を含むステップ群が実行されることを特徴とする情報処理方法。
【請求項14】
前記情報データベースは、前記認証ステップにおいてユーザ認証のために使用するユーザ情報が登録されたユーザ情報データベースあることを特徴とする請求項13に記載の情報処理方法。
【請求項15】
前記キーワード情報生成ステップにおいて、抽出された前記登録キーワードから階層構造上近隣に位置しているキーワードが存在すればそれを関連するキーワードとして抽出し、前記抽出された登録キーワードとは異なる重み付けを設定する重み付け設定ステップをさらに含むことを特徴とする請求項13または請求項14に記載の情報処理方法。
【請求項16】
ユーザに、文書データ検索画面で前記キーワード情報タグによる検索か、全文検索かを選択させる選択ステップと、
前記選択ステップにおいて全文検索を行う場合、ユーザにより入力された検索語句が前記キーワード登録ステップによって登録されているキーワードに一致する場合は、全文検索の選択にかかわらずキーワード情報タグによる検索を優先しておこなうステップと
をさらに含むことを特徴とする請求項13から請求項15のいずれかに記載の情報処理方法。
【請求項17】
請求項9から請求項16のいずれかに記載の方法をコンピュータに実行させるためのプログラム。
【請求項18】
請求項17に記載のプログラムを記憶させたコンピュータ読み取り可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−75849(P2009−75849A)
【公開日】平成21年4月9日(2009.4.9)
【国際特許分類】
【出願番号】特願2007−244099(P2007−244099)
【出願日】平成19年9月20日(2007.9.20)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】