文書管理システム
【課題】 文書管理システムの用途や利用者の要求に適した検索インデックスを持つことを可能にすることを目的とする。
【解決手段】 検索インデックスを作成するか否かの判断基準を、文書の属性情報を利用して柔軟に設定できるようにし、設定した判断基準に基づいて検索インデックスを作成・削除する構成とした。
【解決手段】 検索インデックスを作成するか否かの判断基準を、文書の属性情報を利用して柔軟に設定できるようにし、設定した判断基準に基づいて検索インデックスを作成・削除する構成とした。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、指定されたキーワードを含む文書を検索する機能を持つ文書作成装置に関わり、特に、検索の際に利用されるインデックスの管理方法に関するものである。
【背景技術】
【0002】
従来、指定されたキーワードを含む文書を検索する方法として大きく2通りの方法がある。一つは、文書内のテキストデータを直接参照して、指定されたキーワードを検索する方法である。もう一つは、検索対象となる文書に、文書内のテキストデータから検索インデックスを作成しておき、そのインデックスを参照することによって、高速な検索を実現する方法である。
【0003】
後者の方法は、前者の方法よりも高速に検索結果を得ることができる反面、文書が頻繁に登録される、または、文書のテキストデータが頻繁に更新されるなどの場合に、検索インデックスの作成処理に要する負荷が大きくなってしまうという欠点がある。また、テキストデータとは別に検索インデックスを持つことになるため、記憶容量が大きく必要になってしまうという欠点がある。そのため、ある条件に従って検索インデックスの作成可否を決定する方法があり、例えば特許文献1、特許文献2において提案されている。
【0004】
特許文献1では、所定の時間以上利用されていない文書については検索インデックスを削除して記憶容量を節約する方法が提案されている。
【0005】
特許文献2では、一旦登録した文書の変更修正頻度を監視し、変更修正頻度が所定以下の文書については、後で元のテキストデータが復元できるような検索インデックスを作成し、元のテキストデータを削除することによって、文書データが変更されたときに生じる検索インデックス作成処理の負荷の軽減と、記憶容量の節約を図っている。
【特許文献1】特開平8−161346号公報
【特許文献2】特開平8−212235号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載の方法では、所定の時間以上利用されていない文書の中から、所望の文書を検索したいときには、検索インデックスを利用しないため、検索に時間がかかるという問題がある。
【0007】
また、特許文献2に記載の方法では、頻繁に更新されている文書の中から、所望の文書を検索したいときには、検索インデックスを利用しないため、検索に時間がかかってしまう。さらに、記憶容量の節約のために、検索インデックスが作られた文書に関して、テキストデータを削除した場合には、検索インデックスのある文書に対して頻繁に参照が発生した場合、検索インデックスから元のテキストデータを復元する処理の負荷が高くなってしまう。
【0008】
また、特許文献1および特許文献2に記載の方法では、検索インデックスを作成するかどうかの判断基準が予め単一に決まっていた。そのため、システムの用途やユーザの使い方にその判断基準が適していないときに、別の判断基準を用いることや複数の判断基準を切り替えて使用することが出来なかった。
【0009】
本発明は上記の問題点を鑑みてなされたものであり、検索インデックスを作成するか否かの基準を柔軟に設定できるようにすることで、文書検索装置の利用形態および利用者の要求に適した検索インデックスを作成できるようにすることを目的とする。
【課題を解決するための手段】
【0010】
上述した課題を解決するために、本発明は、電子化された文書を格納して管理する手段と、入力されたキーワードに合致する文書を検索する文書検索手段と、を備えた文書管理システムであって、前記文書検索手段は、高速に検索を行うために格納している文書から作成された検索インデックスまたは文書のテキストデータを参照して検索を行うことを特徴とし、検索インデックスを作成する対象とする文書を決定するための条件を記憶する検索インデックス作成ポリシー格納手段と、前記検索インデックス作成ポリシー格納手段に記憶されている条件に基づいて格納している文書の検索インデックスを持つかどうかを管理する検索インデックス管理手段と、前記検索インデックス管理手段からの要求に応じて、格納している文書から検索インデックスを作成する検索インデックス作成手段と、作成した前記検索インデックスを格納する検索インデックス格納手段と、を有することを特徴とする。
【発明の効果】
【0011】
従来のシステムでは、検索インデックスの作成可否は、システム上の全ての文書について、一様に作成するか、ある利用頻度以上のときに作成するか、ある更新頻度以下のときに作成するか、のいずれかで予め決められていたが、本発明によって、それを柔軟に設定することができるようになる。このため、従来のシステムよりも、多様な利用目的やユーザの要求およびそれらの変化にも対応可能な検索インデックス作成が可能になり、システムの利便性が高まる。
【発明を実施するための最良の形態】
【0012】
(実施例1)
本発明の第1の実施例について図を用いて説明する。
【0013】
図1は、本実施例で用いる文書管理システムを実現するデジタルコンピュータのハードウェア構成例を示すブロック図である。
【0014】
図1において、CPU101は、ROM103のプログラム用ROMに記憶された、あるいはハードディスク(HD)113からRAM102にロードされたOSや後述する付随処理優先度決定部等のプログラムを実行する。RAM102はCPU101の主メモリ、ワークエリア等として機能する。キーボードコントローラ(KBC)105は、キーボード(KB)111からのキー入力やポインティングデバイスとしてのマウス110からの入力を制御する。CRTコントローラ(CRTC)106は表示部112の表示を制御する。なお、この表示部112はCRTに限定されず、例えば、液晶のディスプレイ等でも良い。ディスクコントローラ(DKC)107は、ブートプログラム、種々のアプリケーション、ユーザデータ等を記憶するハードディスク(HD)113や不図示のフレキシブルディスク等の外部記憶装置との間でのアクセスを制御する。PRTC108は、プリンタが接続されたときにプリンタとの間の信号の交換を制御する。NC109はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。
【0015】
図2は、本実施例で用いる文書管理システムのソフトウェア構成例を示すブロック図である。
【0016】
図2において、201は、ユーザに文書や文書の属性情報および処理結果を表示したり、ユーザに各種操作を入力させたりするユーザインタフェース部である。202は、文書の入出力、属性値付与、検索などの処理を行う文書管理部である。203は、文書および文書の属性値が更新されたときなどに必要に応じて検索インデックスの削除および検索インデックス作成部204に検索インデックス作成の要求を行う検索インデックス管理部である。検索インデックス管理部203は、文書が新規に保存されたか更新・削除された場合または属性値が変更された場合または後述する検索インデックス作成ポリシーが変更された場合または後述する定期処理部205から通知を受けた場合に起動する。204は、検索インデックス管理部203からの要求に応じて、検索インデックスの作成および再作成を行う検索インデックス作成部である。本実施例のシステムにおいて、検索インデックスは1文書単位で作成される。205は、所定の時間が経過した際に起動する定期処理部である。定期処理部205は、各文書の更新頻度および参照頻度の値をバックグラウンド処理で更新する。本実施例のシステムでは、更新頻度および参照頻度は日次で計算されるように設定されているため、毎日0時に定期処理部は起動する。もちろん、1時間毎や1週間毎などであってもよい。さらに、定期処理部205は、後述する検索インデックスポリシーの設定によっては、所定時間毎に、各文書が作成日時または最終更新日時または最終参照日時からどれくらい経過しているかを確認する。210は、システムの各種データを格納するデータベースである。211は、検索インデックスを格納する検索インデックス格納部である。212は、文書本体および各文書の属性値を格納する文書格納部である。213は、後述する検索インデックス作成ポリシーを格納する検索インデックス作成ポリシー格納部である。
【0017】
図2におけるユーザインタフェース部201、文書管理部202、検索インデックス管理部203、検索インデックス作成部204、日次処理部205は、それぞれROM103に記憶され、CPU101によって実行されるか、または、ハードディスク(HD)113に記憶され、RAM102にロードされ、CPU101によって実行される。データベース210は、ハードディスク(HD)113に記憶される。また、ユーザインタフェース部201は、キーボードコントローラ(KBC)105を介してマウス110およびキーボード(KB)111の入力を受け付け、CRTコントローラ(CRTC)106を介して処理結果等をCRT112に表示する。
【0018】
図3は、本実施例におけるシステムに格納されている文書が持つ属性の例を示す図である。本実施例において、これらの属性の値は、基本的に文書管理部202によって設定される。
【0019】
以下に各属性について説明する。
【0020】
文書名は、当該文書を識別するために付けられた名称である。場所は、当該文書が格納されている本システム上の論理パスである。サイズは、当該文書のファイルサイズをバイトで表したものである。作成者は、当該文書を本システムに最初に保存したユーザの名前である。最終更新者は、当該文書を最後に更新したユーザの名前である。作成日時は、当該文書が本システムに最初に保存された日時である。最終更新日時は、当該文書が最後に更新された日時である。最終参照日は、当該文書が最後に参照された日時である。更新回数は、当該文書が更新された回数である。参照回数は、当該文書が参照された回数である。更新回数および参照回数は、当該文書が最初に保存されてからの累積の回数である。更新頻度は、当該文書が更新される頻度である。本実施例では、何日に1回の割合で更新されるかという形式で表現され、この値は、当該文書が更新されて更新回数が変わったときまたは日付が変わって定期処理部205が処理したときに変更される。参照頻度は、当該文書が参照される頻度である。本実施例では、何日に1回の割合で参照されるかという形式で表現され、この値は当該文書が参照されて参照回数が変わったときまたは日付が変わって定期処理部205が処理したときに変更される。読み取り専用は、当該文書が読み取り専用の文書であるかどうかを表す。本実施例では、この属性の値は、ユーザがユーザインタフェース部201を介して設定でき、デフォルト値はNOである。検索インデックス作成可否は、当該文書の検索インデックスを作成するかどうかを表す。本実施例において、この値は、検索インデックス作成ポリシーが設定されている場合は、検索インデックス管理部203によって設定され、検索インデックス作成ポリシーで作成の条件を満たしていれば可となり検索インデックスが作成される。逆に、作成の条件を満たしていなければ否となり検索インデックスは作成されず、既に作成されている検索インデックスについては削除される。検索インデックス作成ポリシーが設定されていない場合は、ユーザがユーザインタフェース部201を介して手動で可否を設定でき、デフォルト値についても同様にユーザが設定できる。
【0021】
図4は、検索インデックス作成ポリシーとして設定できるパターンの一覧を表す図である。本実施例のシステムでは、図3に示した属性の内、文書名と場所とを除いた属性に関して、所定の条件を満たすとき検索インデックスを作るまたは作らないというポリシーを一つ設定することができる。
【0022】
サイズについては、所定バイト以上または以下という条件を設定できる。例えば、1,048,576バイト以上の文書については検索インデックスを作成するという設定が可能である。
【0023】
作成者、最終更新者については、ユーザの名前を複数指定して、その中の誰かまたは指定した人以外を設定できる。例えば、山田以外の人が作成した文書には検索インデックスを作成するという設定ができる。
【0024】
作成日時、最終更新日時、最終参照日時については、所定日以前・以後およびある所定日からまたある所定日までの間および属性値の日時から所定日経過・所定時間経過という条件を設定できる。例えば、作成日時が2003/06/30以前の文書には検索インデックスを作成しないという設定や、最終更新日から10日経過した文書には検索インデックスを作成するという設定ができる。また、所定日経過の条件を設定した場合には、定期処理部205が1日毎に、条件として設定している各文書の作成日時または最終更新日時または最終参照日時からの経過日数を確認し、検索インデックス管理部203に通知する。所定時間経過の条件を設定した場合には、定期処理部205が1時間毎に、条件として設定している各文書の作成日時または最終更新日時または最終参照日時からの経過日数を確認し、検索インデックス管理部203に通知する。
【0025】
更新回数、参照回数については、所定回数以上・以下という条件を設定できる。例えば、参照回数が10回以下の文書には検索インデックスを作成しないという設定ができる。
【0026】
更新頻度については、所定日に1回以上・以下という設定ができる。例えば、0.5日に1回以上の頻度で参照される文書には検索インデックスを作成できるという設定ができる。
【0027】
読み取り専用については、YESまたはNOという設定ができる。例えば、読取専用がNOの文書には検索インデックスを作成しないという設定ができる。
【0028】
次に、ユーザが検索インデックス作成ポリシーを設定する画面について図5,6,7を用いて説明する。まず、検索インデックス作成ポリシーをどの属性について設定するかを選択する(図5)。ここでは、チョイスボタン501の中のリストから属性を一つ選択する。次に、図5の画面で選択した属性で、条件を設定する(図6)。図6は、最終更新日時属性について条件を設定する画面である。不図示であるが、属性によってこの画面は異なる。最終更新日時属性に関しては、範囲指定601または経過指定602のどちらかのラジオボタンを選択して条件を設定する。範囲指定時に以後603・以前604の両方に年月日を指定するとそれらの期間、以後603のみに年月日を指定すると当該年月日以後、以前604のみに年月日を指定すると当該年月日以前で条件が設定される。最後に図5、図6で指定した条件に該当する文書に対して検索インデックスを作成する・作成しないをラジオボタン701で選択して(図7)、検索インデックス作成ポリシーが設定される。
【0029】
図8は、文書を登録・更新されたときまたは当該文書の属性値が変更されたときの検索インデックス管理部203の動作フローである。
【0030】
まず、検索インデックス作成ポリシーが設定されているかどうかを判断する(ステップS801)。設定されている場合、当該文書の属性と設定されているポリシーとから、当該文書に検索インデックスを作成するかどうかを判断する(ステップS802)。検索インデックスを作成すると判断された場合、検索作成インデックス作成可否の属性値を可にする(ステップS803)。そして、検索インデックス作成部に対して、当該文書の検索インデックスを作成するように要求し(ステップS804)、処理を終了する。
【0031】
ステップS802において、検索インデックスを作成しないと判断した場合、検索インデックス作成可否の属性値を否にする(ステップS805)。そして、当該文書の検索インデックスを削除(検索インデックスを持っていない場合は何もしない)し(ステップS806)、処理を終了する。
【0032】
ステップS801において、検索インデックス作成ポリシーが設定されていない場合、当該文書が新規に保存された文書であるかどうかを判断する(ステップS807)。新規に保存された文書である場合は、検索インデックス作成可否の属性値のデフォルト値が可であるかどうかを判断する(ステップS808)。可であった場合は、当該文書の検索インデックス作成可否の属性値を可に設定し、検索インデックス作成部に対して当該文書の検索インデックスの作成を要求して処理を終了する(ステップS803、S804)。ステップS808において、検索インデックス作成可否の属性値のデフォルト値が否であった場合、当該文書の検索インデックス作成可否の属性値を否に設定し(ステップS805、S806)、処理を終了する。
【0033】
ステップS807において、新規に保存された文書ではない(既存の文書が更新された)場合、検索インデックス作成可否の属性値が可であるかどうかを判断する(ステップS808)。可であった場合、引き続き検索インデックス作成可否の属性値を可にし(ステップS803)、検索インデックス作成部に対して、当該文書の検索インデックスを作成するように要求し(ステップS804)、処理を終了する。ステップS808において、検索インデックス作成可否の属性値が否であった場合、引き続き検索インデックス作成可否の属性値を否にし(ステップS805、S806)、処理を終了する。
【0034】
図9は、文書の検索を行う画面である。文書の検索は、探し出したい文書に含まれるキーワードを、テキストボックス901に入力して行われる。検索の際、検索対象として、検索インデックスが付加されている文書か全文書かをラジオボタン902で選択することができる。検索インデックスが付加されている文書を選択すると、検索インデックス作成ポリシーに従って検索インデックスが作成されている文書のみが検索対象となるため、検索が高速に行われる。検索インデックスの有無以外で検索対象を限定する絞込み条件を追加する場合には、絞込み追加条件のボタン903を押し、不図示である別画面によって条件を設定することができる。
【0035】
本実施例によれば、検索インデックスを作成するポリシーを様々な条件によって設定でき、必要な文書についてのみ検索インデックスを作成することで、システムやユーザの多様な要求や変化に対応できる。そのため、システムの記憶容量の節約が求められる場合には、検索インデックスが作成される文書が少なくなるようにすることや、更新頻度の低い文書ばかりが検索対象となるような場合には、更新頻度の低い文書についてのみ検索インデックスを作成するなど様々な設定が可能である。
【0036】
また、本実施例においては、検索インデックス作成ポリシーは単項の条件のみしか設定できなかったが、ANDやORによって条件を組み合わせられるようにしてもよい。
【0037】
また、本実施例においては、スタンドアローン環境のシステムであったが、複数のユーザが同時に使用できるようなクライアント/サーバ型のシステムであってもよい。この場合、検索インデックス作成ポリシーは、特別な権限を持つユーザしか変更できないようにしてもよい。
【0038】
また、本実施例においては、検索インデックス作成ポリシーが設定されている場合、検索インデックス作成可否の属性値は自動的に決定されていたが、検索インデックス作成ポリシーが設定されていてもユーザが検索インデックス作成可否の属性値を変更できるようにしてもよい。
【0039】
(実施例2)
次に本発明の第2の実施例について説明する。
【0040】
本実施例のシステムは、検索インデックスを文書毎ではなく、所定の文書管理単位(本実施例のシステムではフォルダ単位とする)で作成するシステムである。本実施例のシステムでは、文書に検索インデックス作成可否の属性はなく、基本的に全文書が検索インデックス作成の対象となる。そして、検索インデックス作成ポリシーは、全文書を対象にして作成された検索インデックスに加えて、ポリシーの条件に合致した文書のみを対象にして冗長的に検索インデックスを作成するためのものである。
【0041】
本実施例のシステムを実現するデジタルコンピュータのハードウェア構成例およびソフトウェア構成例は実施例1と同様である。
【0042】
図10は、設定されている検索インデックス作成ポリシーの例を示す図である。本実施例のシステムにおいては、検索インデックス作成ポリシーを複数設定することができる。図中のポリシーIDが1のポリシーは最終参照日時の属性が2004/12/01以後の文書について検索インデックスを作成することを示している。ポリシーIDが2のポリシーは最終更新者が山田である文書について検索インデックスを作成することを示している。
【0043】
図11は、文書を登録・更新されたときまたは当該文書の属性値が変更されたときの検索インデックス管理部203の動作フローである。
【0044】
本実施例のシステムでは、前述した通り全文書が検索インデックス作成の対象となるため、文書が新規に登録または更新されたときに必ず検索インデックスを作成する(ステップS1101)。次に、検索インデックス作成ポリシーが設定されているかどうかを判断する(ステップS1102)。設定されていなければ、処理を終了する。設定されていた場合は、設定されている各ポリシーに対して(ステップS1103)、当該文書がそのポリシーの条件を満足するかどうか判断する(ステップS1104)。満たしていた場合は、そのポリシーについての検索インデックスを作成する(ステップS1105)。満たしていない場合は、そのポリシーについての検索インデックスに当該文書の情報が含まれていればそのポリシーについての検索インデックスから当該文書の情報を削除する(ステップS1106)。全てのポリシーについてステップS1104からS1106までの処理が終わったら、処理を終了する。
【0045】
図12は、フォルダAに含まれている文書の例を示す図である。フォルダAには、1201から1206までの文書が存在している。そのため、フォルダAには、1201から1206の全文書から作成した検索インデックスが作られている。さらに図6のように検索インデックス作成ポリシーが設定されている場合、図6のポリシーIDが1の条件に当てはまるインデックスが、12012103、1205の文書から作成されていることになる。また、図6のポリシーIDが2の条件に当てはまるインデックスが、1201、1202の文書から作成されていることになる。
【0046】
図13は文書の検索を行うときの画面例である。検索の画面中に、検索範囲の絞込み条件として、設定されている検索インデックス作成ポリシーの一覧1301がチェックボックスと共に表示される。そして、検索を行う際、各ポリシーのチェックボックスをチェックすることによって、検索範囲の絞込みを行うことができる。絞込み条件でポリシーを指定した場合は、検索対象の文書が当該ポリシーに該当する文書になるため、全文書からなる検索インデックスは使用せずに、当該ポリシーに合致する文書からなる検索インデックスを使用して検索を行う。これによって、検索インデックスの参照範囲が小さくなり、検索の速度を高めることができる。また、設定されているポリシー以外の条件で絞込みを行うためには、その他の条件ボタン1302を押し、不図示である別画面によって条件を設定することができる。
【0047】
本実施例のシステムでは、検索インデックス作成ポリシーとは関係なく、全文書を検索インデックス作成の対象としていたが、逆に、検索インデックス作成ポリシーが設定されていない場合は、検索インデックスを一切作成しないようになっていても良い。
【0048】
また、検索インデックス作成ポリシーの条件として、ANDやORによる条件の設定をしてもよいことと、クライアント/サーバ型のシステムとして実装してもよいことと、などは、実施例1と同様である。
【0049】
また、本実施例においては、検索インデックス作成可否の属性はなかったが、実施例1のように検索インデックス作成可否の属性を設けて、ユーザがその属性値を変更できるようにし、当該文書を検索インデックス作成の対象とするかどうかを変更できるようにしてもよい。
【0050】
[その他の実施形態]
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0051】
また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行う。その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0052】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0053】
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【図面の簡単な説明】
【0054】
【図1】実施例1の文書管理システムを実現するハードウェア構成例を示すブロック図である。
【図2】実施例1の文書管理システムのソフトウェア構成例を示すブロック図である。
【図3】実施例1のシステムにおいて文書に付加される属性の例を示す図である。
【図4】実施例1のシステムにおいて検索インデックス作成ポリシーに設定できる条件の一覧を示す図である。
【図5】実施例1のシステムにおいてユーザが検索インデックス作成ポリシーを設定する画面例(1/3)を示す図である。
【図6】実施例1のシステムにおいてユーザが検索インデックス作成ポリシーを設定する画面例(2/3)を示す図である。
【図7】実施例1のシステムにおいてユーザが検索インデックス作成ポリシーを設定する画面例(3/3)を示す図である。
【図8】実施例1のシステムにおいて文書を登録・更新したときの検索インデックス管理部の動作フローを示す図である。
【図9】実施例1において文書の検索を行うときの画面例を示す図である。
【図10】実施例2のシステムにおいてにおいて設定されている検索インデックス作成ポリシーの例を示す図である。
【図11】実施例2のシステムにおいて文書を登録・更新したときの検索インデックス管理部の動作フローを示す図である。
【図12】実施例2におけるフォルダAの文書情報を示す図である。
【図13】実施例2において文書の検索を行うときの画面例を示す図である。
【技術分野】
【0001】
本発明は、指定されたキーワードを含む文書を検索する機能を持つ文書作成装置に関わり、特に、検索の際に利用されるインデックスの管理方法に関するものである。
【背景技術】
【0002】
従来、指定されたキーワードを含む文書を検索する方法として大きく2通りの方法がある。一つは、文書内のテキストデータを直接参照して、指定されたキーワードを検索する方法である。もう一つは、検索対象となる文書に、文書内のテキストデータから検索インデックスを作成しておき、そのインデックスを参照することによって、高速な検索を実現する方法である。
【0003】
後者の方法は、前者の方法よりも高速に検索結果を得ることができる反面、文書が頻繁に登録される、または、文書のテキストデータが頻繁に更新されるなどの場合に、検索インデックスの作成処理に要する負荷が大きくなってしまうという欠点がある。また、テキストデータとは別に検索インデックスを持つことになるため、記憶容量が大きく必要になってしまうという欠点がある。そのため、ある条件に従って検索インデックスの作成可否を決定する方法があり、例えば特許文献1、特許文献2において提案されている。
【0004】
特許文献1では、所定の時間以上利用されていない文書については検索インデックスを削除して記憶容量を節約する方法が提案されている。
【0005】
特許文献2では、一旦登録した文書の変更修正頻度を監視し、変更修正頻度が所定以下の文書については、後で元のテキストデータが復元できるような検索インデックスを作成し、元のテキストデータを削除することによって、文書データが変更されたときに生じる検索インデックス作成処理の負荷の軽減と、記憶容量の節約を図っている。
【特許文献1】特開平8−161346号公報
【特許文献2】特開平8−212235号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載の方法では、所定の時間以上利用されていない文書の中から、所望の文書を検索したいときには、検索インデックスを利用しないため、検索に時間がかかるという問題がある。
【0007】
また、特許文献2に記載の方法では、頻繁に更新されている文書の中から、所望の文書を検索したいときには、検索インデックスを利用しないため、検索に時間がかかってしまう。さらに、記憶容量の節約のために、検索インデックスが作られた文書に関して、テキストデータを削除した場合には、検索インデックスのある文書に対して頻繁に参照が発生した場合、検索インデックスから元のテキストデータを復元する処理の負荷が高くなってしまう。
【0008】
また、特許文献1および特許文献2に記載の方法では、検索インデックスを作成するかどうかの判断基準が予め単一に決まっていた。そのため、システムの用途やユーザの使い方にその判断基準が適していないときに、別の判断基準を用いることや複数の判断基準を切り替えて使用することが出来なかった。
【0009】
本発明は上記の問題点を鑑みてなされたものであり、検索インデックスを作成するか否かの基準を柔軟に設定できるようにすることで、文書検索装置の利用形態および利用者の要求に適した検索インデックスを作成できるようにすることを目的とする。
【課題を解決するための手段】
【0010】
上述した課題を解決するために、本発明は、電子化された文書を格納して管理する手段と、入力されたキーワードに合致する文書を検索する文書検索手段と、を備えた文書管理システムであって、前記文書検索手段は、高速に検索を行うために格納している文書から作成された検索インデックスまたは文書のテキストデータを参照して検索を行うことを特徴とし、検索インデックスを作成する対象とする文書を決定するための条件を記憶する検索インデックス作成ポリシー格納手段と、前記検索インデックス作成ポリシー格納手段に記憶されている条件に基づいて格納している文書の検索インデックスを持つかどうかを管理する検索インデックス管理手段と、前記検索インデックス管理手段からの要求に応じて、格納している文書から検索インデックスを作成する検索インデックス作成手段と、作成した前記検索インデックスを格納する検索インデックス格納手段と、を有することを特徴とする。
【発明の効果】
【0011】
従来のシステムでは、検索インデックスの作成可否は、システム上の全ての文書について、一様に作成するか、ある利用頻度以上のときに作成するか、ある更新頻度以下のときに作成するか、のいずれかで予め決められていたが、本発明によって、それを柔軟に設定することができるようになる。このため、従来のシステムよりも、多様な利用目的やユーザの要求およびそれらの変化にも対応可能な検索インデックス作成が可能になり、システムの利便性が高まる。
【発明を実施するための最良の形態】
【0012】
(実施例1)
本発明の第1の実施例について図を用いて説明する。
【0013】
図1は、本実施例で用いる文書管理システムを実現するデジタルコンピュータのハードウェア構成例を示すブロック図である。
【0014】
図1において、CPU101は、ROM103のプログラム用ROMに記憶された、あるいはハードディスク(HD)113からRAM102にロードされたOSや後述する付随処理優先度決定部等のプログラムを実行する。RAM102はCPU101の主メモリ、ワークエリア等として機能する。キーボードコントローラ(KBC)105は、キーボード(KB)111からのキー入力やポインティングデバイスとしてのマウス110からの入力を制御する。CRTコントローラ(CRTC)106は表示部112の表示を制御する。なお、この表示部112はCRTに限定されず、例えば、液晶のディスプレイ等でも良い。ディスクコントローラ(DKC)107は、ブートプログラム、種々のアプリケーション、ユーザデータ等を記憶するハードディスク(HD)113や不図示のフレキシブルディスク等の外部記憶装置との間でのアクセスを制御する。PRTC108は、プリンタが接続されたときにプリンタとの間の信号の交換を制御する。NC109はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。
【0015】
図2は、本実施例で用いる文書管理システムのソフトウェア構成例を示すブロック図である。
【0016】
図2において、201は、ユーザに文書や文書の属性情報および処理結果を表示したり、ユーザに各種操作を入力させたりするユーザインタフェース部である。202は、文書の入出力、属性値付与、検索などの処理を行う文書管理部である。203は、文書および文書の属性値が更新されたときなどに必要に応じて検索インデックスの削除および検索インデックス作成部204に検索インデックス作成の要求を行う検索インデックス管理部である。検索インデックス管理部203は、文書が新規に保存されたか更新・削除された場合または属性値が変更された場合または後述する検索インデックス作成ポリシーが変更された場合または後述する定期処理部205から通知を受けた場合に起動する。204は、検索インデックス管理部203からの要求に応じて、検索インデックスの作成および再作成を行う検索インデックス作成部である。本実施例のシステムにおいて、検索インデックスは1文書単位で作成される。205は、所定の時間が経過した際に起動する定期処理部である。定期処理部205は、各文書の更新頻度および参照頻度の値をバックグラウンド処理で更新する。本実施例のシステムでは、更新頻度および参照頻度は日次で計算されるように設定されているため、毎日0時に定期処理部は起動する。もちろん、1時間毎や1週間毎などであってもよい。さらに、定期処理部205は、後述する検索インデックスポリシーの設定によっては、所定時間毎に、各文書が作成日時または最終更新日時または最終参照日時からどれくらい経過しているかを確認する。210は、システムの各種データを格納するデータベースである。211は、検索インデックスを格納する検索インデックス格納部である。212は、文書本体および各文書の属性値を格納する文書格納部である。213は、後述する検索インデックス作成ポリシーを格納する検索インデックス作成ポリシー格納部である。
【0017】
図2におけるユーザインタフェース部201、文書管理部202、検索インデックス管理部203、検索インデックス作成部204、日次処理部205は、それぞれROM103に記憶され、CPU101によって実行されるか、または、ハードディスク(HD)113に記憶され、RAM102にロードされ、CPU101によって実行される。データベース210は、ハードディスク(HD)113に記憶される。また、ユーザインタフェース部201は、キーボードコントローラ(KBC)105を介してマウス110およびキーボード(KB)111の入力を受け付け、CRTコントローラ(CRTC)106を介して処理結果等をCRT112に表示する。
【0018】
図3は、本実施例におけるシステムに格納されている文書が持つ属性の例を示す図である。本実施例において、これらの属性の値は、基本的に文書管理部202によって設定される。
【0019】
以下に各属性について説明する。
【0020】
文書名は、当該文書を識別するために付けられた名称である。場所は、当該文書が格納されている本システム上の論理パスである。サイズは、当該文書のファイルサイズをバイトで表したものである。作成者は、当該文書を本システムに最初に保存したユーザの名前である。最終更新者は、当該文書を最後に更新したユーザの名前である。作成日時は、当該文書が本システムに最初に保存された日時である。最終更新日時は、当該文書が最後に更新された日時である。最終参照日は、当該文書が最後に参照された日時である。更新回数は、当該文書が更新された回数である。参照回数は、当該文書が参照された回数である。更新回数および参照回数は、当該文書が最初に保存されてからの累積の回数である。更新頻度は、当該文書が更新される頻度である。本実施例では、何日に1回の割合で更新されるかという形式で表現され、この値は、当該文書が更新されて更新回数が変わったときまたは日付が変わって定期処理部205が処理したときに変更される。参照頻度は、当該文書が参照される頻度である。本実施例では、何日に1回の割合で参照されるかという形式で表現され、この値は当該文書が参照されて参照回数が変わったときまたは日付が変わって定期処理部205が処理したときに変更される。読み取り専用は、当該文書が読み取り専用の文書であるかどうかを表す。本実施例では、この属性の値は、ユーザがユーザインタフェース部201を介して設定でき、デフォルト値はNOである。検索インデックス作成可否は、当該文書の検索インデックスを作成するかどうかを表す。本実施例において、この値は、検索インデックス作成ポリシーが設定されている場合は、検索インデックス管理部203によって設定され、検索インデックス作成ポリシーで作成の条件を満たしていれば可となり検索インデックスが作成される。逆に、作成の条件を満たしていなければ否となり検索インデックスは作成されず、既に作成されている検索インデックスについては削除される。検索インデックス作成ポリシーが設定されていない場合は、ユーザがユーザインタフェース部201を介して手動で可否を設定でき、デフォルト値についても同様にユーザが設定できる。
【0021】
図4は、検索インデックス作成ポリシーとして設定できるパターンの一覧を表す図である。本実施例のシステムでは、図3に示した属性の内、文書名と場所とを除いた属性に関して、所定の条件を満たすとき検索インデックスを作るまたは作らないというポリシーを一つ設定することができる。
【0022】
サイズについては、所定バイト以上または以下という条件を設定できる。例えば、1,048,576バイト以上の文書については検索インデックスを作成するという設定が可能である。
【0023】
作成者、最終更新者については、ユーザの名前を複数指定して、その中の誰かまたは指定した人以外を設定できる。例えば、山田以外の人が作成した文書には検索インデックスを作成するという設定ができる。
【0024】
作成日時、最終更新日時、最終参照日時については、所定日以前・以後およびある所定日からまたある所定日までの間および属性値の日時から所定日経過・所定時間経過という条件を設定できる。例えば、作成日時が2003/06/30以前の文書には検索インデックスを作成しないという設定や、最終更新日から10日経過した文書には検索インデックスを作成するという設定ができる。また、所定日経過の条件を設定した場合には、定期処理部205が1日毎に、条件として設定している各文書の作成日時または最終更新日時または最終参照日時からの経過日数を確認し、検索インデックス管理部203に通知する。所定時間経過の条件を設定した場合には、定期処理部205が1時間毎に、条件として設定している各文書の作成日時または最終更新日時または最終参照日時からの経過日数を確認し、検索インデックス管理部203に通知する。
【0025】
更新回数、参照回数については、所定回数以上・以下という条件を設定できる。例えば、参照回数が10回以下の文書には検索インデックスを作成しないという設定ができる。
【0026】
更新頻度については、所定日に1回以上・以下という設定ができる。例えば、0.5日に1回以上の頻度で参照される文書には検索インデックスを作成できるという設定ができる。
【0027】
読み取り専用については、YESまたはNOという設定ができる。例えば、読取専用がNOの文書には検索インデックスを作成しないという設定ができる。
【0028】
次に、ユーザが検索インデックス作成ポリシーを設定する画面について図5,6,7を用いて説明する。まず、検索インデックス作成ポリシーをどの属性について設定するかを選択する(図5)。ここでは、チョイスボタン501の中のリストから属性を一つ選択する。次に、図5の画面で選択した属性で、条件を設定する(図6)。図6は、最終更新日時属性について条件を設定する画面である。不図示であるが、属性によってこの画面は異なる。最終更新日時属性に関しては、範囲指定601または経過指定602のどちらかのラジオボタンを選択して条件を設定する。範囲指定時に以後603・以前604の両方に年月日を指定するとそれらの期間、以後603のみに年月日を指定すると当該年月日以後、以前604のみに年月日を指定すると当該年月日以前で条件が設定される。最後に図5、図6で指定した条件に該当する文書に対して検索インデックスを作成する・作成しないをラジオボタン701で選択して(図7)、検索インデックス作成ポリシーが設定される。
【0029】
図8は、文書を登録・更新されたときまたは当該文書の属性値が変更されたときの検索インデックス管理部203の動作フローである。
【0030】
まず、検索インデックス作成ポリシーが設定されているかどうかを判断する(ステップS801)。設定されている場合、当該文書の属性と設定されているポリシーとから、当該文書に検索インデックスを作成するかどうかを判断する(ステップS802)。検索インデックスを作成すると判断された場合、検索作成インデックス作成可否の属性値を可にする(ステップS803)。そして、検索インデックス作成部に対して、当該文書の検索インデックスを作成するように要求し(ステップS804)、処理を終了する。
【0031】
ステップS802において、検索インデックスを作成しないと判断した場合、検索インデックス作成可否の属性値を否にする(ステップS805)。そして、当該文書の検索インデックスを削除(検索インデックスを持っていない場合は何もしない)し(ステップS806)、処理を終了する。
【0032】
ステップS801において、検索インデックス作成ポリシーが設定されていない場合、当該文書が新規に保存された文書であるかどうかを判断する(ステップS807)。新規に保存された文書である場合は、検索インデックス作成可否の属性値のデフォルト値が可であるかどうかを判断する(ステップS808)。可であった場合は、当該文書の検索インデックス作成可否の属性値を可に設定し、検索インデックス作成部に対して当該文書の検索インデックスの作成を要求して処理を終了する(ステップS803、S804)。ステップS808において、検索インデックス作成可否の属性値のデフォルト値が否であった場合、当該文書の検索インデックス作成可否の属性値を否に設定し(ステップS805、S806)、処理を終了する。
【0033】
ステップS807において、新規に保存された文書ではない(既存の文書が更新された)場合、検索インデックス作成可否の属性値が可であるかどうかを判断する(ステップS808)。可であった場合、引き続き検索インデックス作成可否の属性値を可にし(ステップS803)、検索インデックス作成部に対して、当該文書の検索インデックスを作成するように要求し(ステップS804)、処理を終了する。ステップS808において、検索インデックス作成可否の属性値が否であった場合、引き続き検索インデックス作成可否の属性値を否にし(ステップS805、S806)、処理を終了する。
【0034】
図9は、文書の検索を行う画面である。文書の検索は、探し出したい文書に含まれるキーワードを、テキストボックス901に入力して行われる。検索の際、検索対象として、検索インデックスが付加されている文書か全文書かをラジオボタン902で選択することができる。検索インデックスが付加されている文書を選択すると、検索インデックス作成ポリシーに従って検索インデックスが作成されている文書のみが検索対象となるため、検索が高速に行われる。検索インデックスの有無以外で検索対象を限定する絞込み条件を追加する場合には、絞込み追加条件のボタン903を押し、不図示である別画面によって条件を設定することができる。
【0035】
本実施例によれば、検索インデックスを作成するポリシーを様々な条件によって設定でき、必要な文書についてのみ検索インデックスを作成することで、システムやユーザの多様な要求や変化に対応できる。そのため、システムの記憶容量の節約が求められる場合には、検索インデックスが作成される文書が少なくなるようにすることや、更新頻度の低い文書ばかりが検索対象となるような場合には、更新頻度の低い文書についてのみ検索インデックスを作成するなど様々な設定が可能である。
【0036】
また、本実施例においては、検索インデックス作成ポリシーは単項の条件のみしか設定できなかったが、ANDやORによって条件を組み合わせられるようにしてもよい。
【0037】
また、本実施例においては、スタンドアローン環境のシステムであったが、複数のユーザが同時に使用できるようなクライアント/サーバ型のシステムであってもよい。この場合、検索インデックス作成ポリシーは、特別な権限を持つユーザしか変更できないようにしてもよい。
【0038】
また、本実施例においては、検索インデックス作成ポリシーが設定されている場合、検索インデックス作成可否の属性値は自動的に決定されていたが、検索インデックス作成ポリシーが設定されていてもユーザが検索インデックス作成可否の属性値を変更できるようにしてもよい。
【0039】
(実施例2)
次に本発明の第2の実施例について説明する。
【0040】
本実施例のシステムは、検索インデックスを文書毎ではなく、所定の文書管理単位(本実施例のシステムではフォルダ単位とする)で作成するシステムである。本実施例のシステムでは、文書に検索インデックス作成可否の属性はなく、基本的に全文書が検索インデックス作成の対象となる。そして、検索インデックス作成ポリシーは、全文書を対象にして作成された検索インデックスに加えて、ポリシーの条件に合致した文書のみを対象にして冗長的に検索インデックスを作成するためのものである。
【0041】
本実施例のシステムを実現するデジタルコンピュータのハードウェア構成例およびソフトウェア構成例は実施例1と同様である。
【0042】
図10は、設定されている検索インデックス作成ポリシーの例を示す図である。本実施例のシステムにおいては、検索インデックス作成ポリシーを複数設定することができる。図中のポリシーIDが1のポリシーは最終参照日時の属性が2004/12/01以後の文書について検索インデックスを作成することを示している。ポリシーIDが2のポリシーは最終更新者が山田である文書について検索インデックスを作成することを示している。
【0043】
図11は、文書を登録・更新されたときまたは当該文書の属性値が変更されたときの検索インデックス管理部203の動作フローである。
【0044】
本実施例のシステムでは、前述した通り全文書が検索インデックス作成の対象となるため、文書が新規に登録または更新されたときに必ず検索インデックスを作成する(ステップS1101)。次に、検索インデックス作成ポリシーが設定されているかどうかを判断する(ステップS1102)。設定されていなければ、処理を終了する。設定されていた場合は、設定されている各ポリシーに対して(ステップS1103)、当該文書がそのポリシーの条件を満足するかどうか判断する(ステップS1104)。満たしていた場合は、そのポリシーについての検索インデックスを作成する(ステップS1105)。満たしていない場合は、そのポリシーについての検索インデックスに当該文書の情報が含まれていればそのポリシーについての検索インデックスから当該文書の情報を削除する(ステップS1106)。全てのポリシーについてステップS1104からS1106までの処理が終わったら、処理を終了する。
【0045】
図12は、フォルダAに含まれている文書の例を示す図である。フォルダAには、1201から1206までの文書が存在している。そのため、フォルダAには、1201から1206の全文書から作成した検索インデックスが作られている。さらに図6のように検索インデックス作成ポリシーが設定されている場合、図6のポリシーIDが1の条件に当てはまるインデックスが、12012103、1205の文書から作成されていることになる。また、図6のポリシーIDが2の条件に当てはまるインデックスが、1201、1202の文書から作成されていることになる。
【0046】
図13は文書の検索を行うときの画面例である。検索の画面中に、検索範囲の絞込み条件として、設定されている検索インデックス作成ポリシーの一覧1301がチェックボックスと共に表示される。そして、検索を行う際、各ポリシーのチェックボックスをチェックすることによって、検索範囲の絞込みを行うことができる。絞込み条件でポリシーを指定した場合は、検索対象の文書が当該ポリシーに該当する文書になるため、全文書からなる検索インデックスは使用せずに、当該ポリシーに合致する文書からなる検索インデックスを使用して検索を行う。これによって、検索インデックスの参照範囲が小さくなり、検索の速度を高めることができる。また、設定されているポリシー以外の条件で絞込みを行うためには、その他の条件ボタン1302を押し、不図示である別画面によって条件を設定することができる。
【0047】
本実施例のシステムでは、検索インデックス作成ポリシーとは関係なく、全文書を検索インデックス作成の対象としていたが、逆に、検索インデックス作成ポリシーが設定されていない場合は、検索インデックスを一切作成しないようになっていても良い。
【0048】
また、検索インデックス作成ポリシーの条件として、ANDやORによる条件の設定をしてもよいことと、クライアント/サーバ型のシステムとして実装してもよいことと、などは、実施例1と同様である。
【0049】
また、本実施例においては、検索インデックス作成可否の属性はなかったが、実施例1のように検索インデックス作成可否の属性を設けて、ユーザがその属性値を変更できるようにし、当該文書を検索インデックス作成の対象とするかどうかを変更できるようにしてもよい。
【0050】
[その他の実施形態]
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0051】
また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行う。その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0052】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0053】
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【図面の簡単な説明】
【0054】
【図1】実施例1の文書管理システムを実現するハードウェア構成例を示すブロック図である。
【図2】実施例1の文書管理システムのソフトウェア構成例を示すブロック図である。
【図3】実施例1のシステムにおいて文書に付加される属性の例を示す図である。
【図4】実施例1のシステムにおいて検索インデックス作成ポリシーに設定できる条件の一覧を示す図である。
【図5】実施例1のシステムにおいてユーザが検索インデックス作成ポリシーを設定する画面例(1/3)を示す図である。
【図6】実施例1のシステムにおいてユーザが検索インデックス作成ポリシーを設定する画面例(2/3)を示す図である。
【図7】実施例1のシステムにおいてユーザが検索インデックス作成ポリシーを設定する画面例(3/3)を示す図である。
【図8】実施例1のシステムにおいて文書を登録・更新したときの検索インデックス管理部の動作フローを示す図である。
【図9】実施例1において文書の検索を行うときの画面例を示す図である。
【図10】実施例2のシステムにおいてにおいて設定されている検索インデックス作成ポリシーの例を示す図である。
【図11】実施例2のシステムにおいて文書を登録・更新したときの検索インデックス管理部の動作フローを示す図である。
【図12】実施例2におけるフォルダAの文書情報を示す図である。
【図13】実施例2において文書の検索を行うときの画面例を示す図である。
【特許請求の範囲】
【請求項1】
電子化された文書を格納して管理する手段と、
入力されたキーワードに合致する文書を検索する文書検索手段と、を備えた文書管理システムであって、
前記文書検索手段は、高速に検索を行うために格納している文書から作成された検索インデックスまたは文書のテキストデータを参照して検索を行うことを特徴とし、
検索インデックスを作成する対象とする文書を決定するための条件を記憶する検索インデックス作成ポリシー格納手段と、
前記検索インデックス作成ポリシー格納手段に記憶されている条件に基づいて格納している文書の検索インデックスを持つかどうかを管理する検索インデックス管理手段と、
前記検索インデックス管理手段からの要求に応じて、格納している文書から検索インデックスを作成する検索インデックス作成手段と、
作成した前記検索インデックスを格納する検索インデックス格納手段と、
を有することを特徴とする文書管理システム。
【請求項2】
前記文書管理システムは、各文書に複数の属性を付加して格納することを特徴とし、
前記検索インデックス作成ポリシーは、前記属性についての条件によって設定されることを特徴とする請求項1に記載の文書管理システム。
【請求項3】
前記検索インデックス作成ポリシーは複数の条件を持ち、条件毎に検索インデックスを作成することを特徴とする請求項2に記載の文書管理システム。
【請求項4】
前記属性として、検索インデックス作成の対象とするかどうかを表す検索インデックス作成可否属性を持つことを特徴とする請求項2および3に記載の文書管理システム。
【請求項5】
前記検索インデックス管理手段は、前記検索インデックス作成ポリシーに加えて、検索インデックス作成可否属性の情報にも基づいて、格納している文書の検索インデックスを持つかどうかを管理することを特徴とする請求項4に記載の文書管理システム。
【請求項6】
前記検索手段は、前記属性を利用して検索する対象の文書を絞り込むことを特徴とする請求項2から5に記載の文書管理システム。
【請求項7】
前記検索手段は、前記検索インデックス作成ポリシー格納手段が記憶しているのと同一の条件によって検索する対象の文書を絞り込んだ場合、当該条件によって作成されている検索インデックスのみを参照して検索を行うことを特徴とする請求項6に記載の文書管理システム。
【請求項1】
電子化された文書を格納して管理する手段と、
入力されたキーワードに合致する文書を検索する文書検索手段と、を備えた文書管理システムであって、
前記文書検索手段は、高速に検索を行うために格納している文書から作成された検索インデックスまたは文書のテキストデータを参照して検索を行うことを特徴とし、
検索インデックスを作成する対象とする文書を決定するための条件を記憶する検索インデックス作成ポリシー格納手段と、
前記検索インデックス作成ポリシー格納手段に記憶されている条件に基づいて格納している文書の検索インデックスを持つかどうかを管理する検索インデックス管理手段と、
前記検索インデックス管理手段からの要求に応じて、格納している文書から検索インデックスを作成する検索インデックス作成手段と、
作成した前記検索インデックスを格納する検索インデックス格納手段と、
を有することを特徴とする文書管理システム。
【請求項2】
前記文書管理システムは、各文書に複数の属性を付加して格納することを特徴とし、
前記検索インデックス作成ポリシーは、前記属性についての条件によって設定されることを特徴とする請求項1に記載の文書管理システム。
【請求項3】
前記検索インデックス作成ポリシーは複数の条件を持ち、条件毎に検索インデックスを作成することを特徴とする請求項2に記載の文書管理システム。
【請求項4】
前記属性として、検索インデックス作成の対象とするかどうかを表す検索インデックス作成可否属性を持つことを特徴とする請求項2および3に記載の文書管理システム。
【請求項5】
前記検索インデックス管理手段は、前記検索インデックス作成ポリシーに加えて、検索インデックス作成可否属性の情報にも基づいて、格納している文書の検索インデックスを持つかどうかを管理することを特徴とする請求項4に記載の文書管理システム。
【請求項6】
前記検索手段は、前記属性を利用して検索する対象の文書を絞り込むことを特徴とする請求項2から5に記載の文書管理システム。
【請求項7】
前記検索手段は、前記検索インデックス作成ポリシー格納手段が記憶しているのと同一の条件によって検索する対象の文書を絞り込んだ場合、当該条件によって作成されている検索インデックスのみを参照して検索を行うことを特徴とする請求項6に記載の文書管理システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2008−129645(P2008−129645A)
【公開日】平成20年6月5日(2008.6.5)
【国際特許分類】
【出願番号】特願2006−310490(P2006−310490)
【出願日】平成18年11月16日(2006.11.16)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成20年6月5日(2008.6.5)
【国際特許分類】
【出願日】平成18年11月16日(2006.11.16)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]