説明

ファイル管理システム、ファイル管理プログラム及びファイル管理方法

【課題】有用なファイルを効率的に検索するファイル管理システムを提供する。
【解決手段】ファイルを格納し、クライアントからの要求に応じ、ネットワークを通じてファイルを提供するファイルサーバを備えるファイル管理システムであって、ファイルサーバは、ネットワークと接続するインターフェイスと、プログラムを実行するプロセッサと、プログラム及びプログラムが使用する情報を格納するメモリと、ファイルを格納するストレージ装置とを備え、メモリは組織を構成する部署を記録した組織情報を格納し、プロセッサは、ファイルのアクセス履歴を記録し、組織情報に格納された部署ごとのアクセス履歴を集計し、アクセス数の多い部署についてファイルの有用性が高いと判定し、有用性が高いと判定されたファイルを検索する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ファイル共有システムに関し、特に、ファイルサーバに格納されたファイルを管理する技術に関する。
【背景技術】
【0002】
近年、業務効率を向上させるために多くの組織がファイル共有システムを導入している。ファイル共有システムでは、メンバ間で活用可能なファイルをファイル所有者がファイルサーバに登録することによって、他のメンバも登録されたファイルを利用することができる。
【0003】
例えば、あるメンバが新製品の特徴及びメリットを顧客に効果的に紹介する資料を作成すれば、他のメンバも作成された製品紹介資料を活用できる。ファイル共有システムでは、資料作成者が新製品の製品紹介資料をファイルサーバに登録すると、他のメンバは新製品を顧客に紹介する際にこの製品紹介資料を容易に入手することができ、同種の資料を作成する手間を省くことができる。
【0004】
このようなファイル共有システムは、いくつかの特許文献に開示される技術によって利便性の向上が図られている。例えば、特許文献1では、有用なファイルをファイルサーバに登録することを促進するための技術が開示されている。詳細には、ファイルサーバにファイルを登録したメンバに、人事評価に影響するポイントが付与される。
【0005】
また、特許文献2では、ファイルサーバに登録されたファイルをより多くのメンバが活用するための技術が開示されている。詳細には、登録されたファイルからキーワードを抽出し、キーワードと、部署などのグループに対応付けられたキーワードが一致すれば、ファイルが登録されたことをキーワードが一致した部署のメンバに通知する。
【0006】
さらに、特許文献3では、共有ファイルの検索結果を並び替える技術が開示されている。詳細には、メンバの所属部署内で過去に使用されたキーワードに基づいてファイルの検索結果を並び替えることによって、必要なファイルの取得を容易にする。
【特許文献1】特開2001−222597号公報
【特許文献2】特開2005−92340号公報
【特許文献3】特開2004−348626号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかし、前述の従来技術によってファイル共有システムの利便性が向上しても、共有ファイルを有効に活用できない場合がある。
【0008】
特許文献2に開示された技術では、他の部署のファイルでも所属する部署に付与したキーワードとマッチすればサーバに登録されたことが所属する部署のメンバに通知される。しかし、無駄な通知を排除し、有用なファイルの登録通知を効率的に取得するためには、キーワードを頻繁にメンテナンスしなければならない。また、有用なファイルが自部署のサーバに格納されていても、不要なファイルがサーバに多く含まれていると、検索の処理速度及び精度が低下してしまう。
【0009】
特許文献3に開示された技術では、検索結果から有用なファイルを見つけ出すことができても、検索の処理速度及び精度そのものを改善することはできない。
【課題を解決するための手段】
【0010】
本発明の代表的な一形態では、ファイルを格納し、クライアントからの要求に応じ、ネットワークを通じて前記ファイルを提供するファイルサーバを備えるファイル管理システムであって、前記ファイルサーバは、前記ネットワークと接続する第1インターフェイスと、前記第1インターフェイスと接続され、プログラムを実行する第1プロセッサと、前記プログラム及び前記プログラムが使用する情報を格納する第1メモリと、前記ファイルを格納する第1ストレージ装置と、を備え、前記第1メモリは、組織を構成する部署を記録した組織情報を格納し、前記第1プロセッサは、前記ファイルのアクセス履歴を記録し、前記組織情報に格納された部署ごとのアクセス履歴を集計し、アクセス数の多い部署について前記ファイルの有用性が高いと判定し、前記有用性が高いと判定されたファイルを検索することを特徴とする。
【発明の効果】
【0011】
本発明の一形態によれば、有用性が高いと判定されたファイルを部署と対応付けて管理することによって、検索精度の向上及び検索速度の高速化を図ることができる。
【発明を実施するための最良の形態】
【0012】
以下、本発明の実施の形態を添付図面に基づいて説明する。
【0013】
(第1の実施の形態)
第1の実施の形態では、ファイルサーバに格納されたファイルに対するアクセス履歴を記録し、周期的にアクセス履歴を解析してファイルが高い有用性を持つ部署を判定し、ファイルのメタデータを当該部署に対応付けて管理する。
【0014】
(システムの全体構成)
図1は、第1の実施の形態のファイル共有システム全体の構成図である。第1の実施の形態のファイル共有システムは、ファイルサーバ1、メタデータサーバ2及びクライアント3を含む。ファイルサーバ1、メタデータサーバ2及びクライアント3は、ネットワーク4によって接続される。ネットワーク4は、例えば、IPネットワークによって構成される。
【0015】
ファイルサーバ1は、メンバ間で共有するファイルを格納及び管理する計算機である。例えば、ファイルサーバ1は、CIFS(COMMON INTERNET FILE SYSTEM、MICROSOFT社のWINDOWS(登録商標)のファイル共有サービスで利用されるプロトコル)あるいはSamba(WINDOWS(登録商標)
マシンにファイル共有のサービスを提供するUNIX(登録商標)系OS向けのフリーソフトウェア)などを実装することによって、クライアント3にファイル共有機能を提供する。
【0016】
メタデータサーバ2は、ファイルサーバ1に格納されたファイルのメタデータを格納及び管理する計算機である。メタデータサーバ2は、リレーショナルデータベース(以下、「RDB」)が実装され、メタデータを格納及び管理する。なお、メタデータとは、ファイルに関する情報を記述したデータであり、例えば、ファイルのパス、作成者及び作成日などの書誌的/システム的情報、ファイルに含まれる文字列やキーワードなどである。
【0017】
クライアント3は、組織のメンバが使用する計算機である。クライアント3は、ファイルをファイルサーバ1に登録したり、ファイルサーバ1に格納されたファイルにアクセスする。
【0018】
なお、図1では、ファイルサーバ1及びメタデータサーバ2は、それぞれ1台ずつの計算機が対応しているが、これに限定する必要はない。ファイルサーバ1及びメタデータサーバ2は同一の計算機に実装されてもよいし、ファイルサーバ1又はメタデータサーバ2がそれぞれ複数の計算機によって構成されてもよい。
【0019】
(ハードウェア構成)
図2は、第1の実施の形態のファイルサーバ1のハードウェア構成図である。なお、ファイルサーバ1、メタデータサーバ2及びクライアント3のハードウェアは、すべて同一である。
【0020】
ファイルサーバ1は、CPU10、ネットワークインターフェース15、ハードディスク20、メモリ30、ディスプレイ40、ディスプレイ制御部41、キーボード50、キーボード制御部51、マウス60、マウス制御部61及びバス70を含む。
【0021】
CPU10は、メモリ30に格納されたプログラムを実行することによって、データの入出力及び各種処理を実行する。ネットワークインターフェース15は、ネットワークを介して他の計算機と通信する。ハードディスク20は、プログラム及びデータを格納する。メモリ30は、CPU10によって実行されるプログラム及びデータを記憶する。
【0022】
ディスプレイ40は、利用者にデータを表示し、ディスプレイ制御部41によって制御される。キーボード50は、利用者からの入力を受け付け、キーボード制御部51によって制御される。マウス60は、利用者からの入力を受け付け、マウス制御部61によって制御される。バス70は、各構成要素にデータを受け渡す。
【0023】
(ファイルサーバ1のモジュール構成)
図3は、第1の実施の形態のファイルサーバ1のモジュール構成図である。ファイルサーバ1は、各種処理を実行する処理部、データを格納するデータ格納部及び一時的に生成されるデータを格納するテンポラリデータ部を含む。処理部は矩形、データ格納部はドラム形、テンポラリデータ部はテープ形で表す。
【0024】
(ファイルサーバ1のモジュール構成:処理部)
ファイルサーバ1の処理部は、ファイル登録部11A、ファイル管理部11B及びファイル検索部11Cを含む。
【0025】
ファイル登録部11Aは、クライアント3から送信された登録ファイル13Aをファイル格納部12Aに格納する。また、ファイル登録部11Aは、登録ファイル13Aを格納するとき、登録ファイル13Aを基にメタデータを生成する。そして、ファイル登録部11Aは、メタデータ配置コマンド13Bを作成してメタデータサーバ2に送信する。
【0026】
ファイル管理部11Bは、ファイルサーバ1に格納されたファイルの有用性を判定し、メタデータを再配置する。ファイル管理部11Bの構成は、図4にて詳細を後述する。
【0027】
ファイル検索部11Cは、クライアント3で入力された検索条件13Cを受信して検索コマンド13Dを生成し、メタデータサーバ2に送信する。そして、ファイル検索部11Cは、メタデータサーバ2から検索結果13Eを受信し、表示用検索結果13Fを生成してクライアント3に送信する。さらに、ファイル検索部11Cは、クライアント3でファイル名13Gが選択されると、ファイル格納部12Aから該当するファイル13Hを抽出し、クライアント3に送信する。
【0028】
(ファイル管理部11Bの詳細なモジュール構成)
図4は、第1の実施の形態のファイル管理部11Bの詳細なモジュール構成図である。ファイル管理部11Bは、処理部(矩形)、データ格納部(ドラム形)、テンポラリデータ部(テープ形)及びテーブル(平行四辺形)の4種類のモジュールを含む。なお、図4に示すアクセスログ格納部12B、アクセス履歴格納部12C、組織情報格納部12D及びメタデータ配置コマンド13Bは、図3に示すファイルサーバ1を構成するモジュールと同じであり、詳細は後述する。
【0029】
(ファイル管理部11Bの詳細なモジュール構成:処理部)
ファイル管理部11Bの処理部は、アクセス履歴抽出部11B1、ファイル有用性判定部11B2及びメタデータ配置部11B3を含む。
【0030】
アクセス履歴抽出部11B1は、アクセスログ格納部12Bからファイルサーバ1に格納されたアクセスログを取得する。アクセスログとは、ファイルサーバ1にファイルを登録したり、ファイルサーバ1に格納されたファイルを参照した履歴である。
【0031】
また、アクセス履歴抽出部11B1は、アクセスログからアクセス履歴を抽出し、アクセス履歴格納部12Cに格納する。アクセス履歴とは、アクセスログに記録された情報のうち、ファイルを参照した記録のみを抽出したものである。
【0032】
ファイル有用性判定部11B2は、アクセス履歴格納部12Cに格納されたアクセス履歴を解析し、ファイルの有用性を判定する。なお、ファイルの有用性を判定する処理については、図24にて後述する。
【0033】
メタデータ配置部11B3は、有用と判定されたファイルを部署と対応付ける。具体的には、このファイルのメタデータを部署と対応付けるためのメタデータ配置コマンド13Bを作成し、メタデータサーバ2に送信する。なお、メタデータを再配置する処理については、図22にて後述する。
【0034】
(ファイル管理部11Bの詳細なモジュール構成:テーブル)
図5は、第1の実施の形態のアクセス履歴テーブル11B4の構成を示す図である。アクセス履歴テーブル11B4は、エントリ11B401及び所属11B402を含む。
【0035】
エントリ11B401は、あるファイルを参照したメンバの氏名又は当該メンバが所属する部署名を格納する。所属11B402は、エントリ11B401に格納されたメンバ又は部署が所属する部署名を格納する。
【0036】
図5は、第5行目にエントリとしてメンバの氏名「鈴木一郎」が格納されており、所属は「営業1課」であることを示している。
【0037】
(ファイルサーバ1のモジュール構成:データ格納部)
ファイルサーバ1のデータ格納部は、ファイル格納部12A、アクセスログ格納部12B、アクセス履歴格納部12C及び組織情報格納部12Dを含む。
【0038】
ファイル格納部12Aは、共有ファイルを格納する。アクセスログ格納部12Bは、ファイルサーバ1に対するアクセスログを格納する。例えば、ファイル共有機能を提供するCIFSプロトコル又はSambaが出力するログを使用する。アクセス履歴格納部12Cは、前述のように、アクセスログ格納部12Bに格納されたアクセスログから抽出されたアクセス履歴を格納する。組織情報格納部12Dは、部署及び組織のメンバを含む組織の構成情報を格納する。
【0039】
以下、各データ格納部の構成について説明する。
【0040】
(ファイル格納部12Aの構成)
図6は、第1の実施の形態のファイル格納部12Aの構成図である。ファイル格納部12Aは、ファイル名12A01、ファイルデータ12A02、メタデータテーブル名12A03及びメタデータ配置日12A04を含む。
【0041】
ファイル名12A01は、ファイルサーバ1に格納された共有ファイルのパスを含んだファイル名を格納する。ファイルデータ12A02は、ファイルの文字列や書式情報などを含むファイルの内容を格納する。ファイルデータ12A02は、ファイルそのものであってもよいし、ファイルの格納場所を示すリンクであってもよい。
【0042】
メタデータテーブル名12A03は、後述するメタデータ格納部22Aに含まれるメタデータテーブル22A00の名前を格納する。メタデータ配置日12A04は、メタデータをメタデータテーブル22A00に配置した日付を格納する。
【0043】
図6に示すように、第1行目にはファイル名が「¥¥fs¥file1.doc」であるファイルのデータ「○月×日に、課長同行の下、A社殿にご提案し、…」が格納されている。さらに、このファイルのメタデータは、テーブル「eigyo1」に格納され、2005年12月3日に配置されたことが記録されている。
【0044】
なお、図6ではファイルデータ12A02としてテキストデータのみを示しているが、画像ファイル又は動画ファイルなどであってもよい。また、図6は、ファイル格納部12Aを表形式で示しているが、ファイルに属性としてこれらの情報を保持させてもよい。
【0045】
(アクセスログ格納部12Bの構成)
図7は、第1の実施の形態のアクセスログ格納部12Bの構成図である。アクセスログ格納部12Bは、アクセス日12B01、アクセス者12B02、ファイル名12B03及びアクセス種別12B04を含む。
【0046】
アクセス日12B01は、ファイルサーバ1に格納されたファイルにアクセスした日付が格納される。図7では日付のみが表示されているが、詳細なアクセス時刻を記録してもよい。アクセス者12B02は、ファイルにアクセスしたメンバのユーザIDを格納する。ファイル名12B03は、アクセスされたファイルのファイル名を格納する。アクセス種別12B04は、ファイルの登録、参照又は削除などアクセスの種別が格納される。
【0047】
図7に示すように、第1行目には、2005年の10月24日にユーザIDが「katoh」であるメンバがファイル「¥¥fs¥file1.doc」を登録したことが記録されている。
【0048】
(アクセス履歴格納部12Cの構成)
図8は、第1の実施の形態のアクセス履歴格納部12Cの構成図である。アクセス履歴格納部12Cは、アクセス日12C01、アクセス者12C02、及びファイル名12C03を含む。
【0049】
アクセス日12C01には、ファイルのアクセス日を格納する。なお、図8では日付のみを記録されているが、詳細なアクセス時刻を記録してもよい。アクセス者12C02には、ファイルにアクセスしたメンバのユーザIDを格納する。ファイル名12C03には、アクセスされたファイル名を格納する。
【0050】
図8に示すように、第1行目には2005年の10月24日にユーザIDが「yamada」であるメンバがファイル「¥¥fs¥file1.doc」にアクセスした履歴が記録されている。
【0051】
(組織情報格納部12Dの構成)
図9は、第1の実施の形態の組織情報格納部12Dの構成図である。組織情報格納部12Dは、エントリ12D01、ユーザID12D02、所属12D03及びメタデータテーブル名12D04を含む。
【0052】
エントリ12D01は、組織を構成する部署名又は部署に所属するメンバ名が格納される。ユーザID12D02は、ファイル共有システムにおけるエントリのユーザIDが格納される。所属12D03は、エントリが所属する部署名が格納される。メタデータテーブル名12D04は、後述するメタデータ格納部22Aにおいてエントリに対応するメタデータテーブル名が格納される。
【0053】
図9に示すように、第1行目にはエントリ「庶務課」が「総務部」に所属し、対応するメタデータテーブルの名前が「syomu」であることが記録されている。また、第5行目にはエントリ「鈴木一郎」のユーザIDは「suzuki」であり、「営業1課」に所属していることが記録されている。
【0054】
なお、図9ではエントリが部署の場合はユーザIDが付与されていないが、部署にユーザIDを付与して部署としての権限でファイルをファイルサーバ1に登録及びアクセスすることも可能である。また、エントリがメンバ(人)の場合には、メタデータテーブル名が対応付けられていないが、メンバを組織を構成する最小の単位として対応付けてもよい。このとき、あるメンバのみが利用するファイルのメタデータは、当該メンバに対応させて管理する。
【0055】
さらに、組織情報格納部12Dは、組織で導入/利用されているITシステムのデータを流用してもよい。具体的には、セキュリティシステムにおけるLDAP、メールシステムにおける電子電話帳、文書管理システムにおけるユーザ情報などを組織情報として用いてもよい。
【0056】
(ファイルサーバ1のモジュール構成:テンポラリデータ部)
テンポラリデータ部は、登録ファイル13A、メタデータ配置コマンド13B、検索条件13C、検索コマンド13D、検索結果13E、表示用検索結果13F、ファイル名13G及びファイル13Hを含む。
【0057】
登録ファイル13Aは、クライアント3からファイルサーバ1に登録するファイルである。メタデータ配置コマンド13Bは、メタデータサーバ2にメタデータを配置するコマンドである。検索条件13Cは、クライアント3からメンバが入力したファイルの検索条件である。検索コマンド13Dは、メタデータを検索するためのコマンドである。検索結果13Eは、検索コマンド13Dを実行した結果である。表示用検索結果13Fは、検索結果13Eを表示するために加工されたデータである。ファイル名13Gは、メンバが選択したファイルのファイル名である。ファイル13Hは、ファイル名13Gに対応するファイルそのものである。
【0058】
(登録ファイル13Aの一例)
図10は、第1の実施の形態の登録ファイル13Aの一例を示す図である。登録ファイル13Aは、ファイルデータ13A01を格納する。図10に示すように、ファイルデータ13A01の内容は、「営業日報 ○月×日、A社殿に事務システムのご提案…」となっている。
【0059】
(メタデータ配置コマンド13Bの一例)
図11及び図12は、第1の実施の形態のファイルサーバ1からメタデータサーバ2に送信するメタデータ配置コマンド13Bの一例を示す図である。第1の実施の形態では、前述のようにメタデータサーバ2にはRDBが実装されているため、メタデータ配置コマンド13Bは、RDBに対するSQLコマンドとなる。
【0060】
SQLコマンド13B01は、メタデータをメタデータサーバ2のRDBに登録するためのコマンドの一例である。SQLコマンド13B01は、ファイル名が「¥¥fs¥file1.doc」及びメタデータが「A社」「提案」「事務システム」となるレコードをメタデータテーブル「eigyo1」に挿入する。
【0061】
SQLコマンド13B02は、メタデータサーバ2に登録済みのメタデータを再配置するSQLコマンドの一例である。SQLコマンド13B02は、ファイル名「¥¥fs¥file1.doc」のメタデータをメタデータテーブル名「eigyo1」から「eigyo」に移動させる。
【0062】
(検索条件13Cの一例)
図13は、第1の実施の形態のファイル検索条件13Cの一例を示す図である。検索条件13Cは、ユーザID13C01、クライアント13C02、部署13C03及びキーワード13C04を含む。
【0063】
ユーザID13C01は、検索条件を入力した利用者のユーザIDを格納する。クライアント13C02は、検索条件を入力した利用者が使用しているクライアント3の識別名を格納する。部署13C03は、利用者が検索条件として指定した部署を格納する。キーワード13C04は、利用者が検索条件として入力したキーワードを格納する。
【0064】
図13は、ユーザIDが「satoh」であるメンバがクライアント「satoh−pc」において、「営業1課」にて有用性が高いと判定されたファイルのうち「A社、提案」をキーワードとして含むファイルを検索する条件を示している。
【0065】
(検索コマンド13Dの一例)
図14は、第1の実施の形態のファイル検索部12Cがメタデータサーバ2に送信する検索コマンド13Dの一例を示す図である。前述のようにメタデータはRDBに格納されているため、検索コマンド13DはSQLコマンド13D01である。
【0066】
SQLコマンド13D01は、メタデータテーブル「eigyo1」からメタデータに「A社」及び「提案」を含むレコードのファイル名を取得する。
【0067】
(検索結果13Eの一例)
図15は、第1の実施の形態のファイル検索部12Cがメタデータサーバ2から受信する検索結果13Eの一例を示す図である。
【0068】
検索結果13Eは、検索コマンド13Dの実行結果13E01である。図15に示すように、第1行目には、図14に示す検索コマンド13Dの実行結果13E01としてファイル名「¥¥fs¥file1.doc」が格納されている。
【0069】
(表示用検索結果13Fの一例)
図16は、第1の実施の形態のファイル検索部12Cがクライアント3に送信する表示用検索結果13Fの一例を示す図である。
【0070】
表示用検索結果13Fには、検索結果13Eから取得されたファイル名と、ファイルの内容の一部又は全部とが含まれている。図16に示すように、表示用検索結果13Fの第1行目には表示内容13F01として、ファイル名「file1.doc」が、第2行目にはファイルの内容「○月×日,課長同行の下,A社殿に…」が格納されている。
【0071】
(ファイル名13Gの一例)
図17は、第1の実施の形態の利用者によって選択されたファイル名13Gの一例を示す図である。図17に示すように、利用者が選択したファイル名13G01として「file1.doc」が格納されている。
【0072】
(ファイル13Hの一例)
図18は、第1の実施の形態のメンバが指定したファイル名を有するファイル13Hの一例を示す図である。ファイル13Hは、ファイルデータ13H01を格納する。図18に示すように、ファイルデータ13H01には「○月×日,課長同行の下,A社殿にご提案…」が格納されている。
【0073】
(メタデータサーバ2のモジュール構成)
図19は、第1の実施の形態のメタデータサーバ2のモジュール構成図である。メタデータサーバ2は、図3に示したファイルサーバ1と同様に、処理部、データ格納部及びテンポラリデータ部を含む。
【0074】
(メタデータサーバ2のモジュール構成:処理部)
メタデータサーバ2の処理部は、メタデータ登録部21A、メタデータ管理部21B及びメタデータ検索部21Cを含む。
【0075】
メタデータ登録部21Aは、ファイルサーバ1から送信されたメタデータ配置コマンド13Bを受信し、メタデータ格納部22Aにメタデータを格納する。メタデータ管理部21Bは、ファイルサーバ1からメタデータ配置コマンド13Bを受信し、メタデータ格納部22Aに格納されているメタデータを再配置する。メタデータ検索部21Cは、ファイルサーバ1から検索コマンド13Dを受信し、メタデータ格納部22に対して検索コマンド13Dを実行し、検索結果13Eをファイルサーバ1に送信する。
【0076】
(メタデータサーバ2のモジュール構成:データ格納部)
図20は、第1の実施の形態のメタデータ格納部22Aの構成図である。前述のようにメタデータサーバ2にはRDBが実装されており、メタデータ格納部22Aは、組織の各部署に対応するテーブル22A00を格納する。
【0077】
テーブル22A00は、ファイル名22A01及びメタデータ22A02を含む。ファイル名22A01は、ファイルサーバ1に格納されているファイルのファイル名を格納する。メタデータ22A02は、当該ファイルのメタデータを格納する。
【0078】
図20に示すように、第1行目のレコードにファイル名「¥¥fs¥file1.doc」と、対応するメタデータ「営業日報、A社、提案…」が格納されている。
【0079】
なお、メタデータ22A02には、一例として、ファイルから抽出したキーワードを示しているが、ファイルの作成者名又は作成日のようにファイル属性として取得可能な書誌的データ又はアノテーションなどを含んでもよい。
【0080】
(メタデータサーバ2のモジュール構成:テンポラリデータ格納部)
メタデータサーバ2のテンポラリデータ格納部は、メタデータ配置コマンド13B、検索コマンド13D及び検索結果13Eを含む。メタデータ配置コマンド13B、検索コマンド13D及び検索結果13Eは、ファイルサーバ1のテンポラリデータ格納部と共通であるため、説明を省略する。
【0081】
以上、第1の実施の形態のファイル共有システムの構成について説明した。
【0082】
(ファイル共有システムの処理手順)
続いて、第1の実施の形態のファイル共有システムで実行される処理について説明する。第1の実施の形態では、部署によってファイルの有用性が異なる点に着目し、ファイルのアクセス履歴に基づき、利用者の多い部署において有用性が高いと判定する。そこで、ファイルが有用と判定された部署に対応させてファイルのメタデータを配置する。さらに、時間の経過とともにファイルの有用性が変化しうる点を考慮し、周期的にファイルの有用性を判定し、メタデータを再配置する。
【0083】
図21は、第1の実施の形態のファイル共有システム内に常駐して実行される処理を示すフローチャートである。なお、説明文の末尾の括弧内の数字は、各フローチャートにおける処理番号である。
【0084】
ファイルサーバ1は、現在時刻が予め定められたメタデータ再配置処理の実行時刻と一致するか否かを判定する(S101)。ファイルサーバ1は、メタデータ再配置処理の実行時刻になると(S101の結果が「Y」)、メタデータ再配置処理を実行する(S102)。メタデータ再配置処理の詳細は、図24にて後述する。
【0085】
ファイルサーバ1は、現在時刻がメタデータを再配置する時刻でない場合には(S101の結果が「N」)、クライアント3からの入力の有無を判定する(S103)。
【0086】
ファイルサーバ1は、クライアント3から指示が入力された場合には(S103の結果が「Y」)、入力指示が登録指示であるか否かを判定する(S104)。一方、クライアント3からの入力がなかった場合には、S101の処理に戻る。
【0087】
ファイルサーバ1は、クライアント3からの入力が登録指示であった場合には(S104の結果が「Y」)、ファイルの登録処理を実行する(S105)。ファイルの登録処理は、ファイル登録部11Aによって実行される。
【0088】
ファイル登録部11Aは、クライアント3から送信された登録ファイル13Aを受信し、ファイル格納部12Aに格納する。
【0089】
また、ファイル登録部11Aは、登録ファイル13Aを格納するとともに、登録ファイル13Aからキーワードを抽出する。キーワードの抽出は、非特許文献1(下畑光夫等、“文字種切り出しと複合語分解によるキーワード抽出”、情報処理学会、自然言語処理研究会報告、120−13、1997)又は非特許文献2(原正巳等“テキストのフォーマットと単語の範囲内重要度を利用したキーワード抽出”、情報処理学会、論文誌、VOL.38、NO.2、1997)に記載の従来技術を適用することによって実現できる。また、ファイルを登録する者がキーワードを手入力する構成としてもよい。
【0090】
また、ファイル登録部11Aは、組織情報格納部12Dを参照し、登録ファイル13Aを送信したメンバの所属を取得し、さらに取得した所属からメタデータテーブル名12D04を取得する。そして、ファイル登録部11Aは、抽出したキーワードをメタデータとしてメタデータテーブルに挿入する。具体的には、メタデータ配置コマンド13Bを作成し、メタデータサーバ2に送信する。
【0091】
メタデータサーバ2のメタデータ登録部21Aは、メタデータ配置コマンド13Bを受信すると、メタデータ格納部22Aに対してコマンドを実行し、メタデータを格納する。
【0092】
その後、ファイル登録部11Aは、メタデータを格納したメタデータテーブル名をファイル格納部12Aのメタデータテーブル名12A03に記録する。さらに、ファイル登録部11Aは、登録日をファイル格納部12Aのメタデータ配置日12A04に記録して、S101の処理に戻る(S105)。
【0093】
ファイルサーバ1は、クライアント3からの入力が検索指示であるかを判定する(S106)。検索指示でない場合には、S101の処理に戻る(S106の結果が「N」)。
【0094】
ファイルサーバ1は、クライアント3からの入力が検索指示であった場合には(S106の結果が「Y」)、ファイル検索を実行する(S107)。ファイル検索は、ファイル検索部11Cによって実行される。
【0095】
ファイル検索部11Cは、クライアントから送信された検索条件13Cを受信する。ファイル検索部11Cは、検索コマンド13Dを生成し、メタデータサーバ2に送信する。メタデータサーバ2のメタデータ検索部21Cは、検索コマンド13Dを受信すると、検索コマンド13Dをメタデータ格納部22Aに対して実行する。メタデータ検索部21Cは、検索結果13Eをファイルサーバ1のファイル検索部11Cに送信する。
【0096】
ファイル検索部11Cは、検索結果13Eを基に表示用検索結果13Fを作成する。表示用検索結果13Fには、ファイル名及びファイルの内容の一部又は全部が含まれる。ファイル検索部11Cは、作成した表示用検索結果13Fをクライアント3に送信する。
【0097】
クライアント3は、受信した表示用検索結果13Fを画面に表示する。メンバが表示されたファイル名を選択すると、クライアント3は、選択されたファイル名13Gをファイルサーバ1に送信する。ファイルサーバ1は、ファイル名13Gを受信し、該当するファイル13Hをファイル格納部11Aから取得し、クライアント3に送信する。クライアント3は、ファイルサーバ1から送信されたファイル13Hを画面に表示する(S107)。
【0098】
(メタデータ再配置処理の詳細な処理手順)
図22は、第1の実施の形態のメタデータ再配置処理の処理手順を示すフローチャートである。
【0099】
ファイル管理部11Bは、まずアクセス履歴格納部12Cをクリアしてアクセスログ格納部12Bからアクセス種別12B04が「参照」であるアクセスログを抽出してアクセス履歴格納部12Cに格納する(S201)。さらに、ファイル管理部11Bは、ファイル名12C03をキーとしてアクセス履歴格納部12Cのレコードをソートする(S202)。したがって、アクセス履歴格納部12Cには、同一ファイルに対するアクセスを記録したレコードが連続して格納される。そして、アクセス履歴格納部12Cを先頭レコードから順次処理し、ファイルごとの有用性を判定する。
【0100】
ファイル管理部11Bは、アクセス履歴格納部12Cの処理対象となるレコードのインデックスを示す大域変数iに1をセットする(S203)。
【0101】
ファイル管理部11Bは、アクセス履歴格納部12Cのi番目のレコードに格納されているファイル名を大域変数FNにセットする(S204)。変数FNには、有用性を判定するファイルのファイル名が格納される。ファイル管理部11Bは、ファイル格納部12Aを参照し、FNに対応するメタデータテーブル名を取得し、大域変数TN1にセットする(S205)。
【0102】
ファイル管理部11Bは、大域変数TN2を初期化する(S206)。TN2は、S207の処理にてファイルの有用性を判定し、有用と判定された部署に対応するメタデータテーブルのテーブル名を格納する変数である。
【0103】
続いて、ファイル管理部11Bは、インデックスiの値を増やしながらアクセス履歴格納部12Cからアクセス履歴を読み込み、FNの有用性を判定する(S207)。ファイル有用性判定処理では、TN2に現時点で有用と判定された部署に対応するメタデータテーブルのテーブル名を格納する。
【0104】
ファイル管理部11Bは、TN1とTN2とが異なっているか否かを判定する(S208)。ファイル管理部11Bは、TN1とTN2とが異なっている場合には(S208の結果が「Y」)、FNを有用と判定した部署が変化したため、メタデータを再配置する(S209)。メタデータの再配置は、ファイル名がFNに対応するメタデータをテーブルTN1からTN2に移動する。具体的には、ファイル管理部11Bは、メタデータ配置コマンド13Bを作成し、メタデータサーバ2に送信する(S209)。
【0105】
一方、ファイル管理部11Bは、TN1とTN2とが等しい場合(S208の結果が「N」)、又はメタデータの再配置を完了した場合には、ファイル格納部12AのFNに対応するレコードを更新する(S210)。具体的には、メタデータテーブル名12A03及びメタデータ配置日12A04を更新する。メタデータを再配置しない場合であっても、メタデータ配置日12A04を更新することによって、メタデータ配置日時点でファイルが有用であることを判断することができる。
【0106】
ファイル管理部11Bは、インデックスiの値とアクセス履歴格納部12Cのレコード件数とを比較する(S211)。インデックスiがアクセス履歴格納部12Cに格納されたアクセス履歴数以下の場合には(S211の結果が「N」)、すべてのファイルについて有用性が判定されていないため、S204の処理に移行し、残りのファイルの有用性を判定する。インデックスiがアクセス履歴数よりも大きい場合には(S211の結果が「Y」)、アクセスされたすべてのファイルの有用性の判定が終了したため、メタデータ再配置処理S102を終了する。
【0107】
(組織におけるファイルの有用性)
ここで、ファイルの有用性判定処理について説明する前に、組織におけるファイルの有用性について説明する。
【0108】
ファイルの有用性は、前述のように、ファイルに対するアクセスの頻度によって判定する。具体的には、アクセス頻度が高ければファイルの有用性が高いと判定し、反対に頻度が低ければ有用性が低いと判定する。
【0109】
さらに、ファイルが「誰にとって」有用であるかを考慮し、あるファイルが有用である可能性が高いメンバがこのファイルにアクセスしやすいように管理する。具体的には、あるファイルにアクセスしたメンバを多く含む部署にとってファイルが有用であると判定し、ファイルと部署とを対応付けて管理する。
【0110】
また、ファイルの有用性は時間の経過とともに変化する。アクセス頻度が高く有用であったファイルであってもアクセス頻度が低くなれば有用性も低下する。また、ファイルを作成した段階ではアクセス頻度が低かったファイルであっても時間の経過とともにアクセス頻度が高くなれば有用性は高くなる。そこで、有用である部署が変化したか否かを周期的にチェックし、変化していれば新たに有用であると判定された部署とファイルとを対応付ける。
【0111】
図23は、ファイルのアクセス頻度とファイルが有用である部署との関係を説明する図である。一例として、組織は、「X部」、「Y部」及び「Z部」によって構成され、「X部」はさらに「X1課」、「X2課」及び「X3課」によって構成される。
【0112】
図23の(A)は、ファイルサーバに登録されているファイルが「X1課」のメンバからアクセスされている状態を表す。この状態では、当該ファイルは「X1課」において有用であると考えられる。
【0113】
ここで、(A)の状態から(B)の状態に変化し、「X3課」からも当該ファイルにアクセスされるようになったとする。このとき、(C)に示すように、「X1課」に加えて「X3課」でも当該ファイルが有用になったと考えられる。
【0114】
しかし、(C)では、「X3課」のみで有用であるファイルと、「X1課」と「X3課」とで共通して有用なファイルが同様に扱われてしまう。その結果、「X3課」のみで有用なファイル、例えば、「X3課」の業務にのみ関連したファイルを検索する場合であっても、「X1課」と「X3課」で共通の有用なファイルがともに抽出され、検索精度が悪化するなどの問題が生じてしまう。
【0115】
そこで、第1の実施の形態では、あるファイルについて(A)から(B)に示す状態に変化した場合には、ファイルが有用である組織のレベルが変化したものとする。具体的には、(D)に示すように「X1課」と「X3課」の共通の上位部署である「X部」が当該ファイルが有用である部署と判定する。こうすることによって、「X3課」のみで有用なファイルと明確に区別することができる。そして、ファイルが有用である部署を指定することによって、業務に直結したファイル又は組織内で一段上位のレベルで有用なファイルなど、利用者が必要とするファイルを容易に取得することができる。
【0116】
また、(A)の状態から(B)の状態にアクセス頻度が変化したということは、今後「X部」に属する部署で「X1課」及び「X3課」以外の部署、すなわち「X2課」からもアクセス頻度が増加する可能性がある。そこで、(D)に示すように上位部署である「X部」で有用であると判定すれば、「X2課」からも容易に当該ファイルにアクセスできるようになる。
【0117】
(ファイル有用性判定処理の処理手順)
図24は、図22に示すメタデータ再配置処理S102のファイル有用性判定処理S207の処理手順を示すフローチャートである。ファイル有用性判定処理S207は、ファイル管理部11Bによって実行される。
【0118】
ファイル管理部11Bは、アクセス履歴テーブル11B4のインデックスを示す変数jに1をセットして初期化する(S301)。
【0119】
続いて、ファイル管理部11Bは、アクセス履歴格納部12Cのi番目のアクセス者12C02を抽出し、組織情報格納部12Dを参照してユーザID12D02と一致するエントリ12D01を取得する。そして、取得したエントリ12D01をアクセス履歴テーブル11B4のj番目のレコードのエントリ11B401に格納する(S302)。同様に、アクセス履歴格納部i番目のアクセス者の所属を取得し、アクセス履歴テーブル11B4のj番目のレコードの所属11B402にセットする(S303)。
【0120】
次に、ファイル管理部11Bは、iとjをそれぞれ1ずつ加算する(S304)。さらに、アクセス履歴格納部12Cのi番目のファイル名がFNと一致するか否かを判定する(S305)。一致する場合には(S305の結果が「Y」)、該当するレコードがFNに対するアクセス履歴であるため、ファイル管理部11Bは、S302の処理を実行し、アクセス履歴テーブル11B4にレコードを追加する。
【0121】
また、ファイル管理部11Bは、アクセス履歴格納部12Cのi番目のファイル名がFNと一致しない場合には(S305の結果が「N」)、アクセス履歴テーブル11B4に対するレコードの追加が完了したため、S306以降の処理を実行する。アクセス履歴格納部12Cは、前述のように、ファイル名でソートされており、アクセス履歴はファイルごとに連続して格納される。したがって、アクセス履歴12Cのi番目のファイル名がFNと一致しなくなった時点で、FNのアクセス履歴に対応するレコードがアクセス履歴テーブル11B4に生成されている。なお、この時点で、インデックスjには、FNのアクセス数+1の値が格納されている。
【0122】
そして、ファイル管理部11Bは、アクセス履歴テーブル11B4を集計する(S306)。アクセス履歴テーブル11B4の集計とは、FNに対する総アクセス数に占める各所属のアクセス数の割合を算出することである。
【0123】
ファイル管理部11Bは、アクセス数が最も多い所属の割合が所定の値α(例えば80%)を超えるか否かを判定する(S307)。アクセス数が最も多い所属の割合がαを超える場合には(S307の結果が「Y」)、当該所属にとってFNの有用性が高いと判定されたため、組織情報格納部12Dを参照し、この所属に対応するメタデータテーブル名12D04を取得し、TN2に格納する(S308)。
【0124】
一方、ファイル管理部11Bは、アクセス数が最も多い所属の割合がαを超えない場合には(S307の結果が「N」)、FNの有用性が高いと判定された部署が存在しなかったため、アクセス履歴テーブル11B4に格納された所属の上位の所属で再度集計する。以下、上位の所属で再集計する処理について説明する。
【0125】
ファイル管理部11Bは、まず、アクセス履歴テーブル11B4のインデックスを示す変数kに1をセットして初期化する(S309)。
【0126】
次に、ファイル管理部11Bは、アクセス履歴テーブル11B4のk番目の所属11B402をエントリ11B401に複写する(S310)。ここで、ファイル管理部11Bは、組織情報格納部12Dを参照し、複写されたエントリに上位の所属が存在するか否かを判定する(S311)。上位の所属が存在する場合には(S311の結果が「Y」)、アクセス履歴テーブル11B4のk番目の所属11B402に上位の所属をセットする(S312)。
【0127】
その後、ファイル管理部11Bは、kの値に1を加算し(S313)、kの値がjの値以上であるか否かを判定する(S314)。S314の処理では、変数jにファイルFNのアクセス数+1の値が格納されているため、アクセス履歴テーブル11B4に格納された所属を上位の所属にすべて更新したか否かを判定することができる。
【0128】
ファイル管理部11Bは、kの値がjの値よりも小さい場合には(S314の結果が「N」)、アクセス履歴テーブル11B4の残りのレコードについてS310からS313までの処理を実行する。kの値がjの値以上の場合には(S314の結果が「Y」)、アクセス履歴テーブル11B4のすべてのレコードの更新が完了したため、更新した所属で再度集計し(S306)、ファイルの有用性を判定する(S307)。
【0129】
なお、S308の処理にて、アクセス数の最も多い所属のメタデータテーブル名12D04をTN2に格納しているが、TN2にセットするテーブル名は1つに限定する必要はない。ファイルをアクセスする利用者の利便性を考慮し、複数のテーブルにメタデータを配置することも可能である。以下、その一例について図23を用いて説明する。
【0130】
あるファイルが主にX1課のメンバによってアクセスされていた状態((A)の状態)から、X3課のメンバによってもアクセスされる状態((B)の状態)となったとする。このとき、通常の処理では、このファイルのメタデータは、X1課に対応するメタデータテーブルからX部に対応するメタデータテーブルに移動する((D)の状態)。
【0131】
一方、メタデータを再配置する際に依然としてX1課からのアクセスも多い場合には、X1課に対応するテーブルに格納されているメタデータをそのまま残し、同時にX部に対応するメタデータテーブルにも同じメタデータを格納してもよい。具体的には、S308の処理において、アクセス数の最も多い所属に対応するメタデータテーブル名12D04及びTN1をTN2に格納すればよい。
【0132】
以上、フローチャートを用いて本発明の第1の実施の形態のファイル共有システムの処理手順について説明した。
【0133】
(ファイル検索におけるクライアント画面の一例)
ここで、ファイル検索処理S107を実行するための検索指示画面と、検索結果表示画面について説明する。検索指示画面及び検索結果表示画面は、クライアント3にて表示される。
【0134】
(ファイル検索におけるクライアント画面の一例:検索指示画面)
図25は、第1の実施の形態のクライアント3に表示される検索指示画面の一例を示す図である。検索指示画面は、検索キー入力エリア401、検索範囲指定エリア402、検索指示ボタン403、終了指示ボタン404及び検索結果表示エリア405を含む。
【0135】
検索キー入力エリア401は、ファイルを検索するためのキーワードを入力する領域である。図25には、検索キー入力エリア401に利用者がキーワードとして「A社」及び「提案」と入力されている。
【0136】
検索範囲指定エリア402は、ファイルを検索する部署の範囲を指定する項目である。図25には、検索対象の部署として「営業1課」及び「営業部」が指定されている。
【0137】
検索指示ボタン403は、利用者がファイル共有システムにファイルの検索の実行を指示する。終了指示ボタン404は、システムにファイル検索の終了を指示する。検索結果表示エリア405は、ファイルの検索結果を表示するエリアである。
【0138】
(ファイル検索におけるクライアント画面の一例:検索結果表示画面)
図26は、図25に示した検索条件にしたがって実行された検索結果を表示する画面の一例を示している。なお、画面の構成は、図25と同じである。
【0139】
図25で入力された検索条件は、検索指示ボタン403が押下されると、検索条件13Cとしてネットワーク4を通じてファイルサーバ1のファイル検索部11Cに送信される。ファイル検索部11Cは、検索条件13Cを受信すると、前述のようにファイル検索処理S107を実行し、表示用検索結果13Fをクライアント3に送信する。クライアント3は、表示用検索結果13Fを受信すると、図26に示すように、抽出されたファイルのファイル名とその内容の一部を検索結果表示エリア405に表示する。
【0140】
(ファイル検索におけるクライアント画面の一例:部署指定一覧表示画面)
また、キーワードを指定せずに部署のみを指定してファイルを検索してもよい。部署のみを指定してファイルを検索することによって、部署ごとに有用性が高いと判定されたファイルの一覧を取得することができる。
【0141】
図27は、部署指定一覧表示画面の一例である。部署指定一覧表示画面は、部署指定欄402、一覧表示ボタン406、終了指示ボタン404及び一覧表示部408を含む。なお、図25と同じ符号が割り当てられている要素については、同じ機能を備えるものとし、説明を省略する。また、キーワードを入力せずに検索可能とすれば、図25に示した検索指示画面を使用してもよい。
【0142】
一覧表示ボタン406は、指定された部署をファイルサーバ1に送信する。ファイルサーバ1は、検索条件13Cとして部署を受信すると、検索コマンド13Dを生成して検索処理を実行し、表示用検索結果13Fをクライアント3に送信する。このとき、表示用検索結果13Fは、部署ごとの一覧としてクライアント3に送信される。
【0143】
クライアント3は、表示用検索結果13Fを受信すると、一覧表示部408に部署ごとに有用性が高いと判定されたファイルの一覧を表示する。図27では、一覧表示部408は、ファイルの一覧を部署ごとに切替えて表示できるように構成されている。
【0144】
(第1の実施の形態の効果)
第1の実施の形態によれば、有用性が高いファイルと判定されたを部署と対応付けて管理することによって、検索精度の向上及び検索速度の高速化を図ることができる。
【0145】
第1の実施の形態では、ファイルのメタデータを利用し、有用性が高いと判定されたファイルのメタデータを部署と対応付けて管理する。したがって、ファイルそのものではなく、メタデータを検索対象とするため、検索速度を高速化することができる。
【0146】
さらに、第1の実施の形態によれば、ファイルの有用性に応じてメタデータを再配置する処理が周期的に実行されるため、管理者及び利用者がメタデータを再配置する必要が無く、メンテナンス性を向上させることができる。
【0147】
(第1の実施の形態の変形例)
第1の実施の形態では、ファイル共有機能の実装をCIFSプロトコル又はSambaを利用する構成としたが、文書管理システムのファイル共有機能を利用してもよい。すなわち、文書管理システムにおける文書管理サーバをファイルサーバ1とし、さらに、文書格納部をファイル格納部12A、システムログをアクセスログ格納部12B、ユーザ情報を組織情報12D、文書登録部をファイル登録部11Aとすることによって、第1の実施の形態を実装できる。
【0148】
また、WEBサーバをファイルサーバ1とみなし、WEBシステムにおけるWEBページ格納エリアをファイル格納部12A、WEBページに対するアクセスログをアクセスログ格納部12Bとみなして本発明を実装することも可能である。
【0149】
(第2の実施の形態)
第2の実施の形態では、有用性が低いファイルのメタデータを各部署に対応させずに不要ファイルとして管理する。なお、第1の実施の形態と同様の機能を果たす構成には同一の符号を付して重複する説明を適宜省略する。
【0150】
第2の実施の形態のファイル共有システムの構成は、第1の実施の形態の構成と同じであり、それぞれ図1〜図20に示した通りである。ただし、図20のメタデータ格納部22Aには、各部署に対応するテーブルに加え、不要と判定されたファイルのメタデータを格納するテーブルを追加する。なお、不要と判定されたファイルのメタデータを格納するテーブルの構成は、各部署に対応するメタデータを格納するテーブルの構成と同じである。
【0151】
第2の実施の形態におけるファイル共有システムの処理手順は、S102のメタデータを再配置する処理を除いて、第1の実施の形態と同じである。したがって、システムに常駐して実行される処理は、図21のフローチャートに示した手順と同じである。
【0152】
(第2の実施の形態のメタデータ再配置処理S102の詳細な処理手順)
図28は、第2の実施の形態のメタデータ再配置処理S102の処理手順を示すフローチャートである。
【0153】
図28に示すフローチャートのS201からS211までの処理は、図22に示した第1の実施の形態のS201からS211の処理と同じである。すなわち、ファイル管理部11Bは、まずアクセス履歴格納部12Cをクリアしてアクセスログ格納部12Bからアクセス履歴を抽出してアクセス履歴格納部12Cに格納し(S201)、ファイル名でソートする(S202)。そして、アクセス履歴格納部12Cの先頭レコードから順にファイルの有用性を判定し、メタデータを再配置する(S204〜S211)。なお、ファイルの有用性を判定する手順は、図24のフローチャートに示した手順と同じである。
【0154】
ファイル管理部11Bは、メタデータの再配置処理が完了すると、不要ファイルのメタデータを再配置する(S212)。なお、第2の実施の形態では、一定期間(例えば6ヶ月間)、利用者にアクセスされていないファイルを不要ファイルと判定する。そして、ファイル管理部11Bは、該当するファイルのメタデータを不要ファイルのメタデータを格納するメタデータテーブルに移動させる。
【0155】
具体的には、まず、ファイル管理部11Bは、ファイル格納部12Aを参照し、メタデータ配置日12A04がγ(例えば6ヶ月前の日付)以前のレコードを抽出する。次に、ファイル管理部11Bは、抽出されたレコードからファイル名とメタデータテーブル名を取得する。さらに、ファイル管理部11Bは、取得したメタデータテーブル名から取得したファイル名をもとにメタデータを抽出する。そして、抽出したメタデータを不要ファイルのメタデータを格納するメタデータテーブルに移動させるメタデータ配置コマンド13Bを作成し、メタデータサーバ2に送信する。
【0156】
(第2の実施の形態の効果)
第2の実施の形態によれば、一定期間、アクセスされていないファイルは有用性が低下したものとし、メタデータを不要データを格納するメタデータテーブルに移動させる。こうすることで、検索対象となるメタデータを有用性の高いファイルのメタデータに限定することができ、ファイルの検索精度の向上及び検索速度の高速化を図ることができる。
【0157】
また、第2の実施の形態の変形例として、不要と判定されたファイルのメタデータを移動させるのではなく、ファイルの登録者に削除を依頼するように通知してもよい。
【0158】
(第3の実施の形態)
他部署のファイルサーバに格納された有用なファイルは、メール又はインスタントメッセージなどの情報伝達ツールを利用して、間接的に取得される場合がある。例えば、他部署のファイルサーバに有用なファイルが格納されている場合、このファイルを利用しようとする者は他部署のメンバにファイルの送付を依頼することが考えられる。そこで、依頼を受けた他部署のメンバは、メールシステムの添付ファイル機能又はインスタントメッセージシステムのファイル転送機能を用いて依頼者にファイルを送付する。
【0159】
このような場合には、ファイルサーバにアクセスした者は、依頼を受けた他部署のメンバではなく、依頼者と考えるべきである。
【0160】
そこで、第3の実施の形態のファイル共有システムでは、メールシステムにおける添付ファイルの送信ログからもアクセス履歴を抽出する。
【0161】
(第3の実施の形態におけるシステム構成)
図29は、第3の実施の形態のファイル共有システムの構成を示す図である。第3の実施の形態のファイル共有システムは、ファイルサーバ1、メタデータサーバ2、クライアント3、ネットワーク4及びメールサーバ5を含む。ファイルサーバ1、メタデータサーバ2、クライアント3及びネットワーク4は、第1の実施の形態と同じ構成である。
【0162】
メールサーバ5は、送信されたメールを受信し、メールのヘッダに記載されたあて先を参照してメールを送信する。また、クライアント3からメールを参照する指示があれば、クライアント3の利用者宛に送信されたメールをクライアント3に送信する。
【0163】
第3の実施の形態のメールサーバ5のハードウェア構成は、図2に示した構成と同一である。
【0164】
(第3の実施の形態におけるモジュール構成)
続いて、第3の実施の形態のファイル共有システムのモジュール構成を説明する。
【0165】
図30は、第3の実施の形態のファイル共有システムのファイルサーバ1のモジュール構成図である。処理部(矩形)、データ格納部(ドラム形)及びテンポラリデータ部(テープ形)は、図3に示す第1の実施の形態のモジュール構成と同じである。ただし、第3の実施の形態では、ファイル管理部11Bがクライアント3のメールログ格納部32Aを参照する点が相違する。他のモジュールについては、図5から図18に示す構成と同じであり、説明を省略する。
【0166】
メタデータサーバ2のモジュール構成は、図19に示す構成と同一であり、詳細な説明は省略する。また、メールサーバ5は、SENDMAIL(登録商標)などの既存のソフトウェアを実装することによって構築可能であり、詳細な説明は省略する。
【0167】
クライアント3は、第1の実施の形態の構成に加え、メールシステムのクライアント機能を有する。
【0168】
図31は、クライアント3のメールクライアント機能に関連するモジュール構成を示す図である。クライアント3のメールクライアント機能のモジュールは、メールクライアント部31A、メールログ格納部32A、メール33A及びファイル33Bを含む。
【0169】
メールクライアント部31Aは、メールを送受信する。メールログ格納部32Aは、メールクライアント部31Aが実行した処理のログを格納する。メール33Aは、利用者が送受信したメールのデータである。ファイル33Bは、利用者がメールを作成するときに添付したファイルのデータである。
【0170】
(第3の実施の形態におけるファイル共有システムの処理手順)
次に、第3の実施の形態のファイル共有システムの処理手順を説明する。第3の実施の形態の処理手順は、第1の実施の形態の処理手順と概ね同じである。ただし、メタデータ配置処理S102において、ファイルのアクセス履歴を抽出する処理S201が相違する。
【0171】
第3の実施の形態では、アクセスログ格納部12Bからファイルに対するアクセス履歴を抽出するとともに、クライアント3のメールログ格納部32Aからメールログを取得する。メールログの内容からファイルサーバ1のファイル格納部12Aに格納されたファイルを添付ファイルとして送信した場合には、メールの受信者をファイルのアクセス者とする。そして、メールの受信者は、ファイルを送信したメールのヘッダ情報に含まれる宛先を参照することによって抽出される。
【0172】
なお、第3の実施の形態では、クライアント3からメールログを収集しているが、メールサーバ5でメールログを収集してもよい。
【0173】
(第3の実施の形態の効果)
第3の実施の形態によれば、メールシステムなどによる第三者を介したファイルアクセスをアクセス履歴に含むことによって、より実態に近いアクセス履歴を取得することができる。したがって、ファイルの有用性をより正確に判定することができ、ファイルの検索精度をさらに向上させることができる。
【0174】
(第3の実施の形態の変形例)
第3の実施の形態の変形例として、メールシステムの代わりにインスタントメッセージシステムに対して適用してもよい。この場合には、メールサーバ5の代わりにインスタントメッセージングサーバを使用する。アクセス履歴は、インスタントメッセージングサーバ上で収集してもよいし、クライアント3から収集してもよい。
【図面の簡単な説明】
【0175】
【図1】第1の実施の形態のファイル共有システムの構成を示す図である。
【図2】第1の実施の形態のファイルサーバ1、メタデータサーバ2及びクライアント3のハードウェア構成を示す図である。
【図3】第1の実施の形態のファイルサーバ1のモジュール構成を示す図である。
【図4】第1の実施の形態のファイルサーバ1のファイル管理部11Bのモジュール構成を示す図である。
【図5】第1の実施の形態のアクセス履歴テーブルの構成を示す図である。
【図6】第1の実施の形態のファイル格納部の構成を示す図である。
【図7】第1の実施の形態のアクセスログ格納部の構成を示す図である。
【図8】第1の実施の形態のアクセス履歴格納部の構成を示す図である。
【図9】第1の実施の形態の組織情報格納部の構成を示す図である。
【図10】第1の実施の形態の登録ファイルの一例を示す図である。
【図11】第1の実施の形態のメタデータ配置コマンド(登録)の一例を示す図である。
【図12】第1の実施の形態のメタデータ配置コマンド(移動)の一例を示す図である。
【図13】第1の実施の形態の検索条件の一例を示す図である。
【図14】第1の実施の形態の検索コマンドの一例を示す図である。
【図15】第1の実施の形態の検索結果の一例を示す図である。
【図16】第1の実施の形態の表示用検索結果の一例を示す図である。
【図17】第1の実施の形態のファイル名の一例を示す図である。
【図18】第1の実施の形態のファイルの一例を示す図である。
【図19】第1の実施の形態のメタデータサーバ2のモジュール構成を示す図である。
【図20】第1の実施の形態のメタデータ格納部の構成を示す図である。
【図21】第1の実施の形態のファイル共有システムの処理手順を示すフローチャートである。
【図22】第1の実施の形態のメタデータ再配置処理の手順を示すフローチャートである。
【図23】第1の実施の形態のファイルのアクセス頻度とファイルが有用である部署との関係を説明する図である。
【図24】第1の実施の形態のファイル有用性判定処理の手順を示すフローチャートである。
【図25】第1の実施の形態のファイル検索指示画面の画面の一例である。
【図26】第1の実施の形態のファイルの検索結果を表示する画面の一例である。
【図27】第1の実施の形態の部署ごとの有用なファイルの一覧を表示する画面の一例である。
【図28】第2の実施の形態のメタデータ再配置処理の手順を示すフローチャートである。
【図29】第3の実施の形態のファイル共有システムの構成を示す図である。
【図30】第3の実施の形態のファイルサーバのモジュール構成を示す図である。
【図31】第3の実施の形態のクライアントのモジュール構成を示す図である。
【符号の説明】
【0176】
1 ファイルサーバ
2 メタデータサーバ
3 クライアント
4 ネットワーク
5 メールサーバ
10 CPU
15 ネットワークインターフェイス
20 ハードディスク
30 メモリ
40 ディスプレイ
41 ディスプレイ制御部
50 キーボード
51 キーボード制御部
60 マウス
61 マウス制御部
70 バス
11A ファイル登録部
11B ファイル管理部
11C ファイル検索部
12A ファイル格納部
12B アクセスログ格納部
12C アクセス履歴格納部
12D 組織情報格納部
13A 登録ファイル
13B メタデータ配置コマンド
13C 検索条件
13D 検索コマンド
13E 検索結果
13F 表示用検索結果
13G ファイル名
13H ファイル
21A メタデータ登録部
21B メタデータ管理部
21C メタデータ検索部
22A メタデータ格納部
11B1 アクセス履歴抽出部
11B2 ファイル有用性判定部
11B3 メタデータ配置部
11B4 アクセス履歴テーブル

【特許請求の範囲】
【請求項1】
ファイルを格納し、クライアントからの要求に応じ、ネットワークを通じて前記ファイルを提供するファイルサーバを備えるファイル管理システムであって、
前記ファイルサーバは、前記ネットワークと接続する第1インターフェイスと、前記第1インターフェイスと接続され、プログラムを実行する第1プロセッサと、前記プログラム及び前記プログラムが使用する情報を格納する第1メモリと、前記ファイルを格納する第1ストレージ装置と、を備え、
前記第1メモリは、組織を構成する部署を記録した組織情報を格納し、
前記第1プロセッサは、
前記ファイルのアクセス履歴を記録し、
前記組織情報に格納された部署ごとのアクセス履歴を集計し、アクセス数の多い部署について前記ファイルの有用性が高いと判定し、
前記有用性が高いと判定されたファイルを検索することを特徴とするファイル管理システム。
【請求項2】
前記ファイルのメタデータを格納するメタデータサーバを、さらに備え、
前記メタデータサーバは、前記ネットワークと接続する第2インターフェイスと、前記第2インターフェイスと接続され、プログラムを実行する第2プロセッサと、前記プログラム及び前記プログラムが使用する情報を格納する第2メモリと、前記メタデータを格納する第2ストレージ装置と、を備え、
前記第2プロセッサは、前記有用性が高いと判定されたファイルのメタデータと、前記アクセス数の多い部署との対応を前記第2ストレージ装置に記録することを特徴とする請求項1に記載のファイル管理システム。
【請求項3】
前記ファイルは、ファイルの有用性が高いと判定される部署が存在しないとき、不要ファイルとして管理されることを特徴とする請求項2に記載のファイル管理システム。
【請求項4】
前記第1プロセッサは、前記ファイルの有用性が高いと判定される部署が存在しないとき、前記ファイルサーバから前記ファイルの削除の依頼を通知することを特徴とする請求項3に記載のファイル管理システム。
【請求項5】
前記第1プロセッサは、周期的に前記ファイルの有用性を判定することを特徴とする請求項1に記載のファイル管理システム。
【請求項6】
検索条件として部署の指定を受け付け、前記指定された部署にとって有用性が高いと判定されたファイルを検索することを特徴とする請求項1に記載のファイル管理システム。
【請求項7】
前記有用性が高いと判定されたファイルを前記部署ごとに表示することを特徴とする請求項1に記載のファイル管理システム。
【請求項8】
メールシステム又はインスタントメッセージシステムをさらに備え、
前記メールシステム又はインスタントメッセージシステムによってファイルサーバに格納されたファイルが送信されたとき、前記送信されたファイルは、受信した者によってアクセスされたものとしてアクセス履歴が記録されることを特徴とする請求項1に記載のファイル管理システム。
【請求項9】
前記第1プロセッサは、前記ファイルごとの特定の部署からのアクセス数の当該ファイルの総アクセス数に対する比率が所定の値よりも大きいとき、前記特定の部署を前記アクセス数の多い部署と判定することを特徴とする請求項1に記載のファイル管理システム。
【請求項10】
ファイルサーバに格納されたファイルを管理するプログラムであって、
クライアントからのアクセス履歴を記録する手順と、
組織情報に格納された部署ごとに前記アクセス履歴を集計し、アクセス数の多い部署について前記ファイルの有用性が高いと判定する手順と、
前記有用性が高いと判定されたファイルを検索する手順とを計算機に実行させることを特徴とするファイル管理プログラム。
【請求項11】
前記ファイルに関する情報を記述したメタデータを格納する手順と、
前記有用性が高いと判定されたファイルのメタデータと、前記アクセス数の多い部署とを対応付ける手順とを、さらに計算機に実行させることを特徴とする請求項10に記載のファイル管理プログラム。
【請求項12】
有用性が高いと判定される部署が存在しないファイルを、不要ファイルとして管理する手順を、さらに計算機に実行させることを特徴とする請求項11に記載のファイル管理プログラム。
【請求項13】
有用性が高いと判定される部署が存在しないファイルを、前記ファイルサーバから削除するように通知する手順を、さらに計算機に実行させることを特徴とする請求項12に記載のファイル管理プログラム。
【請求項14】
前記ファイルの有用性を判定する手順を周期的に計算機に実行させることを特徴とする請求項10に記載のファイル管理プログラム。
【請求項15】
検索条件として前記部署の指定を受け付け、前記指定された部署について有用性が高いと判定されたファイルを検索する手順を、さらに計算機に実行させることを特徴とする請求項10に記載のファイル管理プログラム。
【請求項16】
前記有用性が高いと判定されたファイルを前記部署ごとに表示する手順をさらに計算機に実行させることを特徴とする請求項10に記載のファイル管理プログラム。
【請求項17】
前記アクセス履歴を記録する手順は、メールシステム又はインスタントメッセージシステムによって前記ファイルが送信されたとき、受信側で前記ファイルをアクセスしたものとしてアクセス履歴を記録することを特徴とする請求項10に記載のファイル管理プログラム。
【請求項18】
前記ファイルの有用性を判定する手順は、前記ファイルごとの特定の部署からのアクセス数の当該ファイルの総アクセス数に対する比率が所定の値よりも大きいとき、前記特定の部署を前記アクセス数の多い部署と判定することを特徴とする請求項10に記載のファイル管理プログラム。
【請求項19】
ファイルを格納し、クライアントからの要求に応じ、ネットワークを通じて前記ファイルを提供するファイルサーバを備えるファイル管理システムにおけるファイル管理方法であって、
組織を構成する部署を記録した組織情報を格納し、
前記ファイルのアクセス履歴を記録し、
前記組織情報に格納された部署ごとのアクセス履歴を集計し、アクセス数の多い部署について前記ファイルの有用性が高いと判定し、
前記有用性が高いと判定されたファイルを検索することを特徴とするファイル管理方法。
【請求項20】
前記ファイル管理システムは、前記ファイルに関する情報を記述したメタデータを格納するメタデータサーバをさらに備え、
前記有用性が高いと判定されたファイルのメタデータと、前記アクセス数の多い部署とを対応付けることを特徴とする請求項19に記載のファイル管理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate


【公開番号】特開2007−293746(P2007−293746A)
【公開日】平成19年11月8日(2007.11.8)
【国際特許分類】
【出願番号】特願2006−123193(P2006−123193)
【出願日】平成18年4月27日(2006.4.27)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】