説明

ストレージ装置に保存されたデータの重要性判定方法および保管システム並びにプログラム

【課題】指定した条件に合致するファイルデータの複製を漏れなく更新及び消去は不可能なストレージ装置システムに自動的に保存する。
【解決手段】ファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録するステップと、前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させるステップと、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードが条件データベースに登録されていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして判定するステップとを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ストレージ装置に保存されたファイルデータの重要性を予め設定された条件に従って判定する方法及び判定結果に基づいて重要度の高いデータの複製を更新及び消去が不可能なストレージ装置に保存する方法及びシステム並びにプログラム関するものである。
【背景技術】
【0002】
利用できるストレージ装置の大容量化と低コスト化に伴って、企業は多くの情報を電子化してストレージ装置に蓄積している。
最近、企業内にあるストレージ装置に保存されているファイルデータに対して検索処理を行い、有効利用するためのエンタープライズサーチシステムが普及しつつある。
また、企業で使用されるストレージシステムの中には、ファイルデータを参照はできるが改変および削除操作をできないようするWORM(Write Once Read Many、更新禁止)機能を持つものがある。
さらに、複数の利用者が同一の電子文書に対して、同時に参照・編集を行うことができるWikiと呼ばれるハイパーテキストを扱うWebアプリケーションがファイルデータの整理・収集に利用されている。
【0003】
図9は、エンタープライズサーチシステムの概要を示すブロック構成図であり、ストレージ装置90にあるキーワードを取り出して検索インデックスの構成を行うインデックス作成部91、インデックスデータを格納するインデックスデータベース92、ユーザからの検索要求の入力を受け付ける検索要求入力部93、検索要求からインデックスデータベース92を参照して検索結果を作成する検索処理部94、検索結果を表示する検索結果表示部95とから構成されている。
【0004】
このような構成のエンタープライズサーチシステムにおいては、インデックス作成部91はストレージ装置90に登録されている情報を取得し、取得した情報に含まれるキーワードと取得元の情報の場所をインデックスデータベース92に登録する。
一方、検索要求入力部93から入力された検索要求は、検索処理部94においてインデックスデータベース92を参照して処理され、検索結果表示部95で検索結果を表示させる。この時、表示する検索結果には検索要求に合致する情報の名称と保存されている場所が含まれる。
なお、本発明に関連する公知技術文献としては下記の特許文献1がある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−72957号
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、e-Discovery関連法案の整備により、企業においては業務文書等のデータの長期保存を義務付ける法規制が強化されている。
WORM機能を持つストレージ装置を利用すれば、消去及び更新が不可能であるので長期にわたって重要なデータを消去または更新することなく保存することができる。しかし、データをそのまま保存した場合、ストレージ装置の記憶容量が膨大なものとなってしまう。
従って、重要度の高いデータのみについてその複製をWORM機能を持つストレージ装置に保存するのが望ましい。
しかしながら、従来においては、ストレージ装置に保存されたデータの重要性を如何にして判定するかについて適切な方法が存在しない。
【0007】
本発明の目的は、ストレージ装置に保存されたデータの重要性を適切に判定する方法および判定結果に基づいて重要データであった場合にはその複製をWORM機能を持つストレージ装置に保存し、原本が失われたり改変されたりした場合であっても、元の内容を取得することができるシステム並びにプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明の方法は、ストレージ装置に保存されたデータの重要性を判定するコンピュータにおいて、ストレージ装置に保存された検索対象ファイルデータのキーワードが既登録のものであるか否かをハッシュ値によって判定し、未登録のものであれば当該ファイルデータに含まれるキーワードを取得すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録し、既登録のものであり、更新されたファイルデータであれば当該ファイルデータに含まれるキーワードとハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録するステップと、
前記ストレージ装置に保存されるファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録するステップと、
前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、前記インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させるステップと、
前記インデックスデータベースに記憶されたファイルデータ毎の重要度を示す値と前記条件データベースに登録された各ファイルデータの重要度を判定する値とを比較し、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードを前記インデックスデータベースから取得し、前記条件データベースに登録されたキーワードが含まれていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして前記ストレージ装置に保存されたファイルデータの複製を更新及び消去が不可能なストレージ装置に保存するステップとを備えることを特徴とする。
また、前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算するステップを備えることを特徴とする。
【0009】
また、本発明に係るシステムは、ストレージ装置に保存された検索対象のファイルデータのキーワードが既登録のものであるか否かをハッシュ値によって判定し、未登録のものであれば当該ファイルデータに含まれるキーワードを取得すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録し、既登録のものであり、更新されたファイルデータであれば当該ファイルデータに含まれるキーワードとハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録する手段と、
前記ストレージ装置に保存されるファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録する手段と、
前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、前記インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させる手段と、
前記インデックスデータベースに記憶されたファイルデータ毎の重要度を示す値と前記条件データベースに登録された各ファイルデータの重要度を判定する値とを比較し、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードを前記インデックスデータベースから取得し、前記条件データベースに登録されたキーワードが含まれていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして前記ストレージ装置に保存されたファイルデータの複製を更新及び消去が不可能なストレージ装置に保存する手段とを備えることを特徴とする。
また、前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算する手段を備えることを特徴とする。
【0010】
また本発明に係るプログラムは、ストレージ装置に保存されたデータの重要性を判定するコンピュータを、ストレージ装置に保存された検索対象ファイルデータのキーワードが既登録のものであるか否かをハッシュ値によって判定し、未登録のものであれば当該ファイルデータに含まれるキーワードを取得すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録し、既登録のものであり、更新されたファイルデータであれば当該ファイルデータに含まれるキーワードとハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録する手段と、
前記ストレージ装置に保存されるファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録する手段と、
前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、前記インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させる手段と、
前記インデックスデータベースに記憶されたファイルデータ毎の重要度を示す値と前記条件データベースに登録された各ファイルデータの重要度を判定する値とを比較し、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードを前記インデックスデータベースから取得し、前記条件データベースに登録されたキーワードが含まれていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして前記ストレージ装置に保存されたファイルデータの複製を更新及び消去が不可能なストレージ装置に保存する手段として機能させることを特徴とする。
また、前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算する手段を備えることを特徴とする。
【発明の効果】
【0011】
本発明によれば、ファイルデータの重要度をそのファイルデータに張られているリンク数によって判定し、設定条件で指定したリンク数より高いものはその複製を消去及び更新が不可能なストレージ装置に移動した保存するようにしたので、原本が失われたり改変されたりした場合であっても、元の内容を取得することができる。
【図面の簡単な説明】
【0012】
【図1】本発明の一実施の形態例を示すシステム構成図である。
【図2】インデックスデータベースに格納されているデータの構成図である。
【図3】ハイパーテキストデータベースに格納されているデータの構成図である。
【図4】条件データベースに格納されているデータの構成図である。
【図5】インデックス情報の更新処理の概要を示すフローチャートである。
【図6】ハイパーリンクを含む文書の保存処理の概要を示すフローチャートである。
【図7】ファイルデータの移動処理の概要を示すフローチャートである。
【図8】条件データベースに情報を登録する処理の概要を示すフローチャートである。
【図9】従来におけるエンタープライズサーチシステムの概要を示すブロック構成図である。
【発明を実施するための最良の形態】
【0013】
以下、本発明を適用した保管システムの一実施の形態について説明する。
図1は、本発明の実施の形態の一例を示すシステム構成図である。
本システムは、ネットワーク1に、ホストシステム2と、ストレージ装置装置3と、WORM(Write Once Read Many)機能を持つストレージ装置装置4と、端末5が接続されることで構成されている。
【0014】
ホストシステム2と端末5は、ネットワーク1を通じてストレージ装置3とWORM機能を持つストレージ装置装置4に対しファイルデータの保存と参照を行うことができる。
ホストシステム2は検索プログラム6と、ハイパーテキスト管理プログラム7と、データ複製プログラム8と、インデックスデータベース9と、ハイパーテキストデータベース10と、条件データベース11を備えている。
端末5はブラウザー12を備えている。
【0015】
ハイパーテキストとしてHTML文書を利用する場合、ホストシステム2はWebサーバーに相当し、ハイパーテキスト管理プログラム7とハイパーテキストデータベース10はWikiソフトウェアに、ブラウザー12はWebブラウザーに相当する。
ブラウザー12はホストシステム2を通じて検索プログラム6と、ハイパーテキスト管理プログラム7と、データ複製プログラム8を利用することができる。
【0016】
インデックスデータベース9に格納されるファイルデータのインデックス情報は、図2に示すように、保存先21、ハッシュ値22、キーワード23、重要度24の各エリアデータから構成される。
保存先21は、特定のファイルデータがどのファイルサーバのどの位置に保存されているのか示しており、ファイルデータの識別子となる。
ハッシュ値22はファイルデータをハッシュ関数に通して得た値で、ファイルデータの内容が変更されたかどうか確認するのに使用する。
キーワード23はファイルデータの内容をスペースや記号、形態素で分解した単語の一覧となる。
重要度24はハイパーテキスト管理プログラム7が判定したファイルデータの重要度を表す値が代入される。
【0017】
ハイパーテキストデータベース10に格納されるファイルデータへのハイパーリンクを含む文書は、図3に示すように、データのタイトル31とハイパーリンクを複数含むことができる本文32から構成される。
本文32に含まれるハイパーリンクは、ストレージ装置3とWORM機能を持つストレージ装置4に保存されるファイルデータを参照するものであり、インターネットのWebページに対するハイパーリンクとは区別される。
タイトル31は、ハイパーテキストデータベース10に保存される文書の識別子となる。本文32には複数のハイパーリンクや文章等を挿入することができる。例えば、図3の本文32にある「契約書A」という文字列は、ストレージ装置3に保存されている同名のファイルデータへのハイパーリンクとなっている。
【0018】
ストレージ装置3からWORM機能を持つストレージ装置装置4へ移動するファイルデータの条件には、図4に示すように重要度41、キーワード42を指定することができる。図3に示す重要度41、キーワード42は条件データベース11に格納される。
重要度41にはファイルデータの重要度を判定する単一の値を登録でき、インデックスデータベース9の重要度24と比較するのに利用される。
キーワード42には重要文書であることを判定する複数のキーワードを登録することができ、データ複製プログラム8は登録されたそれぞれのキーワードがインデックスデータベース8のキーワード22に含まれるかどうか確認するのに使用する。
【0019】
図5は、検索プログラム6における、インデックスデータベース9に登録されるインデックス情報の初期化処理の概要を示すフローチャートである。
最初に、インデックス情報の元となるファイルデータをストレージ装置3とWORM機能を持つストレージ装置4から取得する(ステップ501)。
次に、取得したファイルデータにハッシュ関数を適用し、そのハッシュ値を取得する(ステップ502)。
【0020】
次に、取得したファイルデータの情報がインデックスデータベース9に登録されているかどうか判定する(ステップ503)。
もし、取得したファイルデータがインデックスデータベース9に登録されていない場合は、重要度24に初期値として「0」を登録する(ステップ505)。
【0021】
しかし、取り出したファイルデータの情報がインデックスデータベース9に既に登録されている場合は、取り出したファイルデータとインデックスデータベース9に登録されているハッシュ値22とを比較し、前回のインデックス情報の初期化を行った時点からファイルデータの内容が更新されていないかどうか判定する(ステップ504)。
【0022】
もし、取り出したファイルデータのハッシュ値がインデックスデータベース9に登録されているハッシュ値と一致しない場合は、ファイルデータが更新されていることになるので、当該ファイルデータに含まれているキーワードを取得し、インデックスデータベース9へ新しい情報(キーワードとハッシュ値)を登録する(ステップ506、507)。また、重要度24も初期化する。
【0023】
検索プログラム6は、以上の処理をストレージ装置装置3とWORM機能を持つストレージ装置4に保存されている全てのファイルデータに対し、定期的に繰り返して実行する。
ハイパーリンクを含む文書は複製するファイルデータを選択するための情報の取得先であり、その内容にはユーザが検索して見つけ出したファイルデータの中から特に重要と判断されたものに対するハイパーリンクが含まれている。
【0024】
図6は、ハイパーテキスト管理プログラム7における、ユーザが指定したファイルデータへのハイパーリンクを含む文書の保存処理の概要を示すフローチャートである。
ユーザがブラウザー10に入力したキーワードによるファイルデータの検索をホストシステム2に要求すると、ホストシステム2からブラウザーに、入力されたキーワードを含むファイルデータへのハイパーリンクの一覧を含むデータが送信される。
ユーザはホストシテム2から受け取ったハイパーリンクの一覧のうち必要なハイパーリンクを選び、そのタイトルとハイパーリンクの一覧をホストシステム2に送信する。すると、そのハイパーリンクを含むデータはハイパーテキストデータベース10に保存される。
【0025】
この時、ハイパーテキスト管理プログラム7はホストシステム2からハイパーリンクを含む文書を受け取り、ハイパーリンクが指し示すファイルデータの保存先の一覧を取得する(ステップ601)。
【0026】
次に、ハイパーリンクを含む文書のタイトルをハイパーテキストデータベース10のタイトル31から探し、ハイパーリンクを含む文書がすでに登録されているものかどうか判定する(ステップ602)。すなわち、既に存在するタイトルであるか否かを判定する。
もし、登録されていない場合は、ハイパーリンクを含む文書のデータを新規に作成して、最初に取得したファイルデータの保存先の一覧からインデックスデータベース9を参照して、それぞれのファイルデータの重要度24に「1」を加算してから、受け取ったハイパーリンクを含む文書のタイトルと本文をハイパーテキストデータベース10に登録する(ステップ603、604)。
【0027】
もし、ハイパーリンクを含む文書のタイトルがハイパーテキストデータベース10に登録されている場合は、すなわち既に存在するタイトルであった場合には、すでに登録されている文書と受け取ったハイパーリンクを含む文書の間で差分を取得し、受け取った文書において削除されたハイパーリンクと追加されたハイパーリンクが存在するかどうか判定する(ステップ605、606、607)。
【0028】
受け取った文書に、削除されたハイパーリンクが存在する場合は、全ての削除されたハイパーリンクが指し示すファイルデータの保存先から、インデックスデータベース9を参照し、その重要度24を減算する(ステップ608)。
逆に、追加されたハイパーリンクが存在する場合は、全ての追加されたハイパーリンクが指し示すファイルデータの保存先から、インデックスデータベース9を参照し、その重要度24を加算する(ステップ603)。
【0029】
すでに存在するタイトルの、受け取ったハイパーリンクを含む文書を、ハイパーテキストデータベース10で上書き保存することでハイパーリンクを含む文書の保存処理は終了する。
なお、ハイパーリンクを含む文書を削除する場合は、対象のタイトル31の本文32を空にしたデータを保存する。
【0030】
図7は、ファイルデータ複製プログラム8における、ストレージ装置3からWORM機能を持つストレージ装置4へファイルデータを移動する処理の概要を示すフローチャートである。
最初に、条件データベース8から、移動処理を行うファイルデータの条件となる、重要度41とキーワード42を取得する。(ステップ701)
【0031】
次に、移動処理対象のファイルデータの保存先21とハッシュ値22とキーワード23と重要度24をインデックスデータベース9から取得する(ステップ702)。
次に、移動処理対象のファイルデータがストレージ装置3に格納されているファイルデータかどうか保存先21によって判定する(ステップ703)。
【0032】
さらに、同じファイルデータがすでにWORM機能を持つストレージ装置4に存在するかどうか判定する(ステップ704)。もし、WORM機能を持つストレージ装置4にファイルデータが保存されている場合は、データ移動を行う必要が無いため、次のファイルデータの処理に移る。
【0033】
次に、条件データベース11に設定された重要度41とインデックスデータベース9に保存された重要度24とを比較し、重要度24の値がより大きければ、条件データベース11のキーワード42の中にインデックスデータベース9のキーワード23の単語が含まれていないか確認する(ステップ705、706)。
【0034】
もし、含まれている場合は、保存先21のファイルデータを読み込み、WORM機能を持つストレージ装置4に読み込んだファイルデータを保存する(ステップ707)。
データ複製プログラム8は、以上の処理をインデックスデータベース9の保存先21に登録されているすべてのファイルデータに対して定期的に実行する。
【0035】
図8は、データ複製プログラム8による、条件データベース11の初期化処理の概要を示すフローチャートである。
データ複製プログラム8は、ブラウザー12に重要度の値と複製を作成するファイルデータに含まれるキーワードの入力を求める画面を表示する。(ステップ801)
データ複製プログラム8は、ブラウザー12から送信されたユーザの入力内容を受信し、条件データベース11に重要度41とキーワード42を登録する(ステップ802、803、804)。これによって、条件データベース11の初期化処理が終了する。
【符号の説明】
【0036】
1 ネットワーク
2 ホストシステム
3 ストレージ装置
4 WORM機能を持つストレージ装置
5 端末
6 検索プログラム
7 ハイパーテキスト管理プログラム
8 データ複製プログラム
9 インデックスデータベース
10 ハイパーテキストデータベース
11 条件データベース
12 ブラウザー
21 保存先
22 ハッシュ値
23 キーワード
24 重要度
31 タイトル
32 本文
41 重要度
42 キーワード

【特許請求の範囲】
【請求項1】
ストレージ装置に保存されたデータの重要性を判定するコンピュータにおいて、
ストレージ装置に保存された検索対象のファイルデータのキーワードが既登録のものであるか否かをハッシュ値によって判定し、未登録のものであれば当該ファイルデータに含まれるキーワードを取得すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録し、既登録のものであり、更新されたファイルデータであれば当該ファイルデータに含まれるキーワードとハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録するステップと、
前記ストレージ装置に保存されるファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録するステップと、
前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、前記インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させるステップと、
前記インデックスデータベースに記憶されたファイルデータ毎の重要度を示す値と前記条件データベースに登録された各ファイルデータの重要度を判定する値とを比較し、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードを前記インデックスデータベースから取得し、前記条件データベースに登録されたキーワードが含まれていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして前記ストレージ装置に保存されたファイルデータの複製を更新及び消去が不可能なストレージ装置に保存するステップとを備えることを特徴とするストレージ装置に保存されたデータの重要性判定方法。
【請求項2】
前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算するステップを備えることを特徴とする請求項1に記載のストレージ装置に保存されたデータの重要性判定方法。
【請求項3】
検索対象とするファイルデータを保存しているストレージ装置と、このストレージ装置に保存されたファイルデータのキーワードが既登録のものであるか否かをハッシュ値によって判定し、未登録のものであれば当該ファイルデータに含まれるキーワードを取得すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録し、既登録のものであり、更新されたファイルデータであれば当該ファイルデータに含まれるキーワードとハッシュ値を取得し、すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録する手段と、
前記ストレージ装置に保存されるファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録する手段と、
前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、前記インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させる手段と、
前記インデックスデータベースに記憶されたファイルデータ毎の重要度を示す値と前記条件データベースに登録された各ファイルデータの重要度を判定する値とを比較し、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードを前記インデックスデータベースから取得し、前記条件データベースに登録されたキーワードが含まれていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして前記ストレージ装置に保存されたファイルデータの複製を更新及び消去が不可能なストレージ装置に保存する手段とを備えることを特徴とする。
また、前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算する手段を備えることを特徴とする保管システム。
【請求項4】
前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算するステップを備えることを特徴とする請求項4に記載の保管システム。
【請求項5】
また本発明に係るプログラムは、ストレージ装置に保存されたデータの重要性を判定するコンピュータを、ストレージ装置に保存された検索対象のファイルデータのキーワードが既登録のものであるか否かをハッシュ値によって判定し、未登録のものであれば当該ファイルデータに含まれるキーワードを取得すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録し、既登録のものであり、更新されたファイルデータであれば当該ファイルデータに含まれるキーワードとハッシュ値を取得し、すると共にハッシュ値を取得したうえ当該ファイルの重要度を示す値を初期化してインデックスデータベースに登録する手段と、
前記ストレージ装置に保存されるファイルデータの重要度を判定する値と重要文書であることを判定するキーワードとを予め条件データベースに登録する手段と、
前記ファイルデータの保存先への参照情報を含むハイパーテキスト文書をハイパーテキストデータベースに記憶し、記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を、参照されたファイルデータごとに更新し、前記インデックスデータベースの当該ファイルデータの重要度を示す値として記憶させる手段と、
前記インデックスデータベースに記憶されたファイルデータ毎の重要度を示す値と前記条件データベースに登録された各ファイルデータの重要度を判定する値とを比較し、ファイルデータ毎の重要度を示す値が大きく、かつ当該ファイルデータに含まれるキーワードを前記インデックスデータベースから取得し、前記条件データベースに登録されたキーワードが含まれていた場合には、当該ファイルデータが重要度の高い重要文書データであるものとして前記ストレージ装置に保存されたファイルデータの複製を更新及び消去が不可能なストレージ装置に保存する手段として機能させることを特徴とするプログラム。
【請求項6】
前記ハイパーテキストデータベースに記憶されたハイパーテキスト文書に含まれるファイルデータへの参照数の値を参照されたファイルデータごとに更新する場合に、削除されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を減算し、追加されたハイパーリンクが存在する場合、当該ファイルデータへの参照数の値を加算する手段として機能させることを特徴とする請求項5に記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−164891(P2011−164891A)
【公開日】平成23年8月25日(2011.8.25)
【国際特許分類】
【出願番号】特願2010−26445(P2010−26445)
【出願日】平成22年2月9日(2010.2.9)
【出願人】(000233055)株式会社日立ソリューションズ (1,610)
【Fターム(参考)】