説明

ファイル管理装置、プログラム並びに方法

【課題】重複ファイルにかかるコストをシステム全体として低減するファイル管理装置。
【解決手段】複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容(ファイル内容)に関する情報を含むファイル情報を取得して比較し、互いに同じファイルの内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出手段520と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御手段510、とを有することを特徴とするファイル管理装置501。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はファイル管理装置、プログラム並びに方法に関する。
【背景技術】
【0002】
昨今、情報の電子化、ネットワークの充実により、ユーザは、社内外への情報の共有を電子化されたデータをメールに添付することなどにより、容易に行えるようになった。
ストレージの単価も下がり、PC(Personal Computer)やサーバのストレージ容量も大幅に増加した。ユーザは、データ量を気にせずに保存できるという便宜を謳歌できるようになった。しかし、その一方、PCやサーバに保存されるデータ量が肥大化するという事態も発生している。現在、情報共有のため複製した情報など、同一のデータから成るファイルが組織内で各自のPCや共有ストレージに散乱しているという現象が現実に起こっている。
【0003】
今後、オフィス環境のクラウド化が進むと、デスクトップ環境・共有ストレージなどがデータセンターに移され、ユーザは、ローカルの端末(PC、シンクライアントシステム、携帯電話など)からクラウドを利用することが想定される。この時、クラウド化したデスクトップ環境・ストレージを、ユーザがサービスとして利用した場合、散乱している同一のファイルが、それぞれ従量課金制度によって課金される。ユーザにとって、同一のファイルに対してそれぞれ料金を支払うのは、無駄なコストをかけることになる。そこで、ユーザが利用するシステム全体において、蓄積されたファイルを最適化することが望まれる。
【0004】
ここで、クラウドとは、コンピュータのハードウェア、ソフトウェア、データなどを、インターネット介して利用し、その利用に対してサービス利用料金を払う形態を言う。データセンターとはインターネット用のサーバやデータ通信、固定・携帯・IP(Internet Protocol)電話などの装置を設置・運用することに特化した建物の総称である。また、シンクライアントシステムとは、ユーザが使うクライアント端末に必要最小限の処理をさせ、ほとんどの処理をサーバ側に集中させたシステムである。
【0005】
一般的な重複ファイルの最適化手法は、ストレージ装置内に閉じた手法が主であった。
削除するファイルを選択するためにファイルに優先度を規定している方法については、特許文献1に開示されている。特許文献1は、削除ファイルポリシーテーブル内の優先度を比較し、ファイル受信装置内のファイルのうち、もっとも優先度が低い論理的グループ内のファイルから削除する、という方法を開示している。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2004−21303
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明が解決しようとする課題は、効率的なファイルアクセスを可能とするファイル管理装置を得ることである。ファイルは、ユーザのデスクトップ環境だけでなく、ネットワーク上のストレージ上にも存在しているので、ストレージ装置内だけではなく、企業など組織全体としてファイルを最適に管理することは難しい。特許文献1の技術が最適化する、ファイルの存在場所は、ファイル受信装置内にとどまる。すなわち、この方法をもってしても、ファイル受信装置内でしか最適化を図ることができず、組織全体としての、ファイルの重複排除の最適化はできない。
【0008】
全体を最適化する手法としては、あるファイルAに対して重複して保存されている別のファイルを削除し、削除されたファイルを有していたストレージに、ファイルAへのリンクを張る、という方法がある。この方法により、全体のデータ量を最適化することが可能ではある。この場合、特定の組織や団体が保有するネットワーク全体に点在している重複ファイルに関し、どのファイルを削除し、どのファイルを残すかによって、ユーザの使い勝手が大幅に変わってくる。
【0009】
例えば、アクセスに時間のかかるストレージに頻繁に使うファイルが残された場合、ユーザの作業効率は著しく低下する。また、ある特定の個人以外が使用する確率がひじょうに小さいファイルは、その個人の端末に保存されていることが望ましい。逆に不特定多数のユーザに頻繁に使われるファイルは、中央のサーバに保存されていることが望ましい。このようなユーザの便宜を図るためには、どの場所のファイルを残すかについて、一定の優先順位を決めておく必要がある。
【0010】
これまでの最適化方法は、ストレージ装置内に閉じた手法であった。したがって、ユーザはファイルアクセスの良好な使い勝手を享受しつつ、重複ファイルにかかるコストをシステム全体として低減することはできなかった。
【0011】
本発明の目的は、上記課題を解決して、効率的なファイルアクセスを可能とするファイル管理装置を得ることである。
【課題を解決するための手段】
【0012】
本発明によれば、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイルの内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、
重複ファイル抽出手段と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御手段、と、を有することを特徴とするファイル管理装置が得られる。
【0013】
本発明によれば、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出処理と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御処理、と、をコンピュータに実行させることを特徴とするファイル管理プログラムが得られる。
【0014】
本発明によれば、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、前記優先度情報に基づいて各ファイル格納装置の優先度を決定し、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力すること、を有することを特徴とするファイル管理方法が得られる。
【発明の効果】
【0015】
本発明によれば、重複ファイルにかかるコストをシステム全体として低減するファイル管理装置を得ることができる。
【図面の簡単な説明】
【0016】
【図1】図1は本発明の第1の実施形態の構成を示す。
【図2】図2は本発明の第1の実施形態のファイルリストメッセージの一例を示す。
【図3】図3は本発明の第1の実施形態の重複データ制御メッセージの一例を示す。
【図4】図4は本発明の第1の実施形態の各機器のステータスの一例を示す。
【図5】図5は本発明の第1の実施形態の優先度決定木の一例を示す。
【図6】図6は本発明の第2の実施形態のネットワークの階層関係の一例を示す。
【図7】図7は本発明の第3の実施形態の構成を示すブロック図である。
【発明を実施するための形態】
【0017】
(第1の実施形態)
以下は、本発明の第1の実施形態についての、図面を参照した詳細な説明である。図1は、発明のシステム構成を示す。本実施形態のファイル管理システム100は、ネットワーク101、ネットワーク102とネットワーク103と、で構成されている。ネットワーク102とネットワーク103はネットワーク101の下位ネットワークである。ネットワーク101は上位ネットワークとルータ114経由で接続されており、ネットワーク102とネットワーク103はネットワーク101とそれぞれルータ115とルータ116経由で接続されている。ネットワークの階層はファイル管理システム100外のネットワークに近い方(経由するルータ数が少ない方)が上位で、遠い方(経由するルータ数が多い方)が下位となる。
【0018】
ネットワーク101にはストレージサーバ301、端末401(以下端末はPCと略すこともある)、端末402、ファイル管理装置501が接続されている。ファイル管理装置501は、重複ファイル抽出部510とファイル制御部520とで構成されている。重複ファイル抽出部510、ファイル制御部520は、論理回路等のハードウェアで構成されている。重複ファイル抽出部510、ファイル制御部520は、ファイル管理装置501内の、図示されていないプロセッサが、同じく図示されていないメモリに格納されているプログラムを実行することで実現されてもよい。ネットワーク102はストレージサーバ302、端末403と端末404、ネットワーク103には端末405と端末406とが接続されている。
【0019】
ここで端末(PC)は、仮想デスクトップ環境を含んだデスクトップ環境を指し、物理的、仮想的なハードウェアに依存しない。仮想デスクトップ環境は主にシンクライアントシステムによってクラウド側(データセンター側)にて構築されるデスクトップ環境を言う。なお、ここでは、端末、ストレージサーバ等、ファイルを格納する機能を有する各種別の装置を総称してファイル格納装置とも呼ぶ。
【0020】
各機器(ストレージサーバ301とストレージサーバ302及び端末401、端末402、端末403、端末404、端末405、端末406)は、それぞれ最適化クライアント部502を備えている。最適化クライアント部502は、例えばソフトウェアとしてインストールされていてもよい。最適化クライアント部502は、自己がインストールされている機器の空き容量と、各ファイルの絶対パス、ファイル内容のハッシュ値、更新日時等の情報を、自己がインストールされている機器から取得し、これらの情報を含むファイルリストメッセージ201を作成する。
【0021】
最適化クライアント部502は、ファイル管理装置501にファイルリストメッセージ201を送信することで、自機器内に保存されているファイルの情報をファイル管理装置501の重複ファイル抽出部510に通知する。
【0022】
重複ファイル抽出部510は各機器から送付されたファイルリストメッセージ201の内容を分析し、ネットワーク内に点在する重複ファイルにおいて、どの機器に保存されているファイルを残し、どのファイルを削除するかを決定する。
【0023】
ファイル管理装置501のファイル制御部520は、重複ファイル抽出部510が決定した内容を、重複データ制御メッセージ202として各機器へ送信し、重複データを保存するか削除するか等を最適化クライアント部502へ通知する。最適化クライアント部502は受信した重複データ制御メッセージ202の指示に従って重複データに対して処理を実行する。
【0024】
図2は、ファイルリストメッセージ201の例を示す。ファイルリストメッセージ201はメッセージを送信する側のホスト名、ホストのネットワークアドレス(例えばIPアドレス等)、ホスト種別、ストレージ総容量及び空き容量、データリストで構成されている。また、ホスト種別とは、ストレージサーバであるか、PCであるか等の区別である。データリストは、各ファイル単位の情報が含まれており、具体的には、ファイル名、ホスト内の絶対パス、ファイル内容のハッシュ値、更新日時が含まれている。
【0025】
図3は重複データ制御メッセージ202の例を示す。重複データ制御メッセージ202は、制御対象であるファイル名、ステータス(重複有り または 無を示す)、制御フラグ(保留または 削除の表示)、リンク先(制御フラグが削除の表示の場合)、アクセス権(どの機器に設定するかを表示)が含まれている。ここで重複データ制御メッセージ202は複数のファイルに対する制御の指示も行なうこともできる。
【0026】
以下は、本発明の第1の実施の形態の動作についての、図面を参照した説明である。
本実施形態の動作については、図1、図2、図3、図4、図5を参照して詳細に説明する。
【0027】
まず各機器の最適化クライアント部502は、各機器が保持しているファイルについてファイルリストメッセージ201を作成し、ファイル管理装置501の重複ファイル抽出部510に送付する。重複ファイル抽出部510はファイルリストメッセージ201を受信することで、ネットワークの構成及び各機器がどのネットワークに存在しているかを把握することができる。その結果、重複ファイル抽出部510は、複数の機器の点在状況も知ることができる。同時に重複ファイル抽出部510は、各機器のストレージ総容量、空き容量も把握することができる。
【0028】
図4は、ファイル管理装置501の重複ファイル抽出部510が、取得したファイルリストメッセージ201の内容をもとに作成した、各機器のステータスの一例である。重複ファイル抽出部510は、あらかじめ定められたファイルを記憶するにあたっての各機器の優先度を、各機器のホスト名に関連づけて記憶する。この実施形態1では、重複ファイル抽出部510は、優先度を、優先度情報記憶部511に格納されている、図5に示す優先度決定木に沿って決定している。重複ファイル抽出部510は図5に示した各機器の優先度を図4の表の最右列に追記する。
【0029】
ここで、図5に示した優先度決定木は、機器種別、ネットワーク階層の上下、ストレージの空き容量によって決定されている。パラメータとして前記以外にも機器コスト(月額ストレージ単価)、機器SLA(Service Level Agreement:可動時間、処理スピードなど、通信サービスの事業者が利用者に保証したサービスの品質)なども含めることができる。
【0030】
優先度決定木のパラメータ分岐順はユーザによって自由に決めることができる。つまり、ネットワーク階層の上下よりもストレージの空き容量の優先度が高ければ、分岐する順をストレージ空き容量を先にしてもよい。
【0031】
次に重複ファイル抽出部510は、各機器から取得したファイルリストメッセージ201を比較することで重複ファイルが存在しないかを分析する。具体的にはファイルリストメッセージ201に記載されているファイル内容のハッシュ値、ファイル名、更新日時などを用いて同一ファイルであることを判定する。
【0032】
重複ファイルが存在した場合、重複ファイル抽出部510は図5の優先度決定木を用いて作成した図4の優先度に従ってファイルを保持する機器を決定する。例として重複ファイルが、全機器に保存されていた場合について、どの機器に保存すべきかの優先度を求める。図5の優先度決定木を基に、端末よりストレージサーバの方が優先される。また、階層が上位のネットワークが下位のネットワークより優先される。また、ストレージ容量が大きいものの方が、小さいものよりも優先される。その結果、もっともネットワーク階層が上にあるストレージサーバのうち、ストレージ容量が最も大きいものが保存する機器として選ばれる。
【0033】
この実施形態の場合は、図1に示すように、ストレージサーバで、もっとも階層が上にあるものは、ストレージサーバ301であるので、ストレージサーバ301にあるファイルが保持される。すべての残りの機器にあるこのファイルと重複するファイルは削除され、それぞれの残りの機器からストレージサーバ301のファイルへのリンクが張られる。
【0034】
別の例としてストレージサーバ302、端末403、端末405にファイルが保存されている場合について説明する。図5の優先度決定木を基に、端末よりストレージサーバの方が優先されるので、ストレージサーバ302にあるファイルが保持され、残りの機器端末403、端末405のファイルは削除される。また、これとともに、残りの機器端末403、端末405からストレージサーバ302のファイルへのリンクが張られる。
【0035】
最初に挙げた、ストレージサーバ301のファイルを保持する例の場合、重複ファイル抽出部510の決定を受けて、ファイル制御部520はファイルを削除し、他の機種へのリンクを張るべき機器に対して重複データ制御メッセージ202を送信する。各機器にインストールされている最適化クライアント部502は受信した重複データ制御メッセージ202に従って、該当するファイルに対して指示通りに削除し、リンクを新規に作成する。
【0036】
一方、ストレージサーバ301の最適化クライアント部502は、受信した重複データ制御メッセージ202に従って各機器から当該ファイルへの利用が可能なように当該ファイルに必要なアクセス権を付与する。また、必要に応じてファイル制御部520は各機器がストレージサーバ301へアクセス可能なように、ルータ115 及び116の設定を変更する。この実施形態のファイル管理システム100は、ネットワーク階層の最上位にあるストレージサーバ301にファイルを保存するので、いずれの端末からも共通にアクセスし易く、効率的なファイルアクセスが可能となる。
【0037】
(第2の実施形態)
ネットワークが大きく、重複ファイルを保持している機器がネットワーク内に分散している場合、単なるネットワーク階層の上下だけで優先度を決めるのは、かえってファイルアクセスの効率を下げることがある。このような場合は、ファイルにアクセスする各機器のアクセスし易さを考慮し、ネットワーク帯域、ネットワークコスト、各機器からネットワークへの距離を考慮した優先度決めが有効と考えられる。第2の実施形態ではアクセスする機器へのネットワーク上の距離の大小により、優先度を決定する。第1の実施形態の構成において、ネットワークが図1から図6のように置き換えられる他は、第1の実施形態と装置の基本的な構成は変わらない。
【0038】
図6のネットワークは、ネットワーク101からネットワーク108までを有し、これらのネットワークは階層構造となっている。ここで、ある重複ファイルを保持している機器がネットワーク105に6台、ネットワーク106に4台、ネットワーク108に2台点在していると仮定する。第1の実施形態で説明した図5の優先度決定木でファイルを残す機器を決定すると、ネットワーク105もしくはネットワーク106に存在する機器の中で空き容量が多い機器が選択されることとなる。しかし、この実施形態では、最適な機器に先んじて、ネットワークを選択する。
【0039】
選択するネットワークは、以下に述べる手順で決定する。なお、以下の手順で用いられれる図6に示すネットワーク構成情報は、優先度情報記憶部511に格納されている。1)重複ファイル抽出部510は、ファイルを保持している機器が存在するネットワークから各ネットワークへのアクセスコストを算出する。2)重複ファイル抽出部510は、アクセスコストを比較し、ファイルを保持すべき最適なネットワークの優先順位を決定する。3)ファイル管理装置501の重複ファイル抽出部510は、ネットワーク優先順位に従って、該当ネットワーク内の機器優先度よりファイル保持機器を決定する。
【0040】
この実施形態は、アクセスコストを、「該当ネットワークへのホップ数Xファイルアクセス機器数」と定義する。この実施形態は、アクセスコストの算出方法として、ネットワーク帯域を含める方法として「ネットワーク帯域の逆数」を掛けることも可能である。以下に示すのは、アクセスコストの計算結果である。
【0041】
・ネットワーク101へのアクセスコスト
ネットワーク105からのアクセスコスト:2HopX6Machines=12
ネットワーク106からのアクセスコスト:2HopX4Machines=8
ネットワーク108からのアクセスコスト:3HopX2Machines=6
合計アクセスコスト数:12+8+6=26
・ネットワーク102へのアクセスコスト
ネットワーク105からのアクセスコスト:3HopX6Machines=18
ネットワーク106からのアクセスコスト:3HopX4Machines=12
ネットワーク108からのアクセスコスト:2HopX2Machines=4
合計アクセスコスト数:18+12+4=34
・ネットワーク103へのアクセスコスト
ネットワーク105からのアクセスコスト:1HopX6Machines=6
ネットワーク106からのアクセスコスト:1HopX4Machines=4
ネットワーク108からのアクセスコスト:4HopX2Machines=8
合計アクセスコスト数:6+4+8=18
・ネットワーク104へのアクセスコスト
ネットワーク105からのアクセスコスト:4HopX6Machines=24
ネットワーク106からのアクセスコスト:4HopX4Machines=16
ネットワーク108からのアクセスコスト:1HopX2Machines=2
合計アクセスコスト数:24+16+2=42
・ネットワーク105へのアクセスコスト
ネットワーク105からのアクセスコスト:0HopX6Machines=0
ネットワーク106からのアクセスコスト:2HopX4Machines=8
ネットワーク108からのアクセスコスト:5HopX2Machines=10
合計アクセスコスト数:0+8+10=18
・ネットワーク106へのアクセスコスト
ネットワーク105からのアクセスコスト:2HopX6Machines=12
ネットワーク106からのアクセスコスト:0HopX4Machines=0
ネットワーク108からのアクセスコスト:5HopX2Machines=10
合計アクセスコスト数:12+0+10=22
・ネットワーク107へのアクセスコスト
ネットワーク105からのアクセスコスト:5HopX6Machines=30
ネットワーク106からのアクセスコスト:5HopX4Machines=20
ネットワーク108からのアクセスコスト:2HopX2Machines=4
合計アクセスコスト数:30+20+4=54
・ネットワーク108へのアクセスコスト
ネットワーク105からのアクセスコスト:5HopX6Machines=30
ネットワーク106からのアクセスコスト:5HopX4Machines=20
ネットワーク108からのアクセスコスト:0HopX2Machines=0
合計アクセスコスト数:30+20+0=50
上記のアクセスコストの結果を反映し、ファイルを保持すべき最適なネットワークの優先度は、次のようになる。
【0042】
ネットワーク103=ネットワーク105>
ネットワーク106>
ネットワーク101>
ネットワーク102>
ネットワーク104>
ネットワーク108>
ネットワーク107
ネットワーク103とネットワーク105はアクセスコストとしては同値であるが、重複ファイル抽出部510は、ネットワーク階層が高いネットワーク103を最優先するネットワークとして選択する。
【0043】
重複ファイル抽出部510は、最終的なファイルを保持する機器として最適なものを、ネットワーク103内から選択する。重複ファイル抽出部510は、最適なものがネットワーク103に存在しない場合は、ネットワーク105内から選択する、という形で優先度の高いネットワークから順に、その中にある最適な機器を探索していく。
【0044】
上記のような選択を行うことで、例えば重複ファイルを保持している機器が端末のみだった場合、重複ファイル抽出部510は、よりアクセスし易いネットワーク上のストレージサーバを、ファイルを保持する機器として選定することができる。ファイルを利用するユーザは、効率的にファイルを利用することができる。
【0045】
なお、本実施形態では、ファイル管理装置501をネットワーク101においているが、ファイル管理装置501は、どのネットワークに配置しても構わない。
【0046】
この実施形態のファイル管理システム100は、ネットワークが大きく、アクセス対象のファイルを有する端末が、ネットワークの下位にある場合に、効率的なファイルアクセスが可能とする。その理由は、最上位にあるストレージサーバにアクセスしなくとも、比較的アクセスコストの低いストレージサーバを選択して使用できるからである。
【0047】
(第3の実施形態)
図7は本発明の第4の実施形態を表すブロック図である。本発明の第4の実施形態は、複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、
前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出部510と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御部520、と、を有することを特徴とするファイル管理装置501である。
【0048】
以上の実施形態では優先度の決定方針として、ストレージサーバを端末より優先すること、アクセスコストの低い端末を優先することを述べたが、優先度の決定方法はこれらにとどまるものではない。ファイルの利用者数、ファイルの利用頻度、ファイルの機密性により、優先度は、臨機応変に決定することができる。
【0049】
たとえば、第1の実施形態のようにストレージサーバの優先度を端末より高く設定することには限られず、ファイルの利用者数、ファイルの利用頻度、ファイルの機密性、を考慮して、優先度を決定することができる。具体的には下記のような重み付けを行った、優先度が適用されてもよい。
【0050】
・ファイル利用者数が少ない場合、端末>ストレージサーバの優先度とする。(しきい値はユーザ定義による)・ファイルの利用頻度が多い場合、ネットワーク帯域、ホップ数のアクセスコストに重み付けをする。また、不特定多数が対象の場合はサーバ>端末の優先順位とする。・ファイルの機密性が高い場合、ネットワークの安全性(暗号化レベル)に重み付けをする。上記手法により、ファイルの特性に最適な重複ファイルの排除及び保持場所を設定することができる。
【0051】
また、優先度情報記憶部511は、必ずしも使用する必要はない。ネットワークアドレス等で優先度が単純に決まる場合は、重複ファイル抽出部が、決められたルールに従って、優先度を決定してもよい。
【符号の説明】
【0052】
100 ファイル管理システム
101 ネットワーク
102 ネットワーク
103 ネットワーク
104 ネットワーク
105 ネットワーク
106 ネットワーク
107 ネットワーク
108 ネットワーク
114 ルータ
115 ルータ
116 ルータ
201 ファイルリストメッセージ
202 重複データ制御メッセージ
301 ストレージサーバ
302 ストレージサーバ
401 端末
402 端末
403 端末
404 端末
405 端末
406 端末
501 ファイル管理装置
502 最適化クライアント部
510 重複ファイル抽出部
520 ファイル制御部

【特許請求の範囲】
【請求項1】
複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、
前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出手段と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御手段と、を有することを特徴とするファイル管理装置。
【請求項2】
前記重複ファイル抽出手段は、前記優先度情報を参照して、ファイル格納装置の種別、ストレージ容量の大小、ファイル格納装置の位置するネットワーク階層の上下、のいずれかに基づいて、前記ファイル格納装置の前記優先度を決定することを特徴とする、請求項1のファイル管理装置。
【請求項3】
前記重複ファイル抽出手段は、前記優先度情報を参照して、ファイル格納装置の位置するネットワーク上の階層と、各階層におけるファイル格納装置の台数とを取得し、前記優先度を決定する対象のファイル格納装置(優先度決定対象装置)への他の階層の前記優先度決定対象装置の保有する前記重複ファイルと同じ前記重複ファイルを保有するファイル格納装置(重複ファイル装置)からのホップ数をn、前記他の階層における重複ファイル装置の台数をmとし、前記優先度決定対象装置の優先度を、すべての階層に関して各々得られるnxmの総和とすることを特徴とする請求項1のファイル管理装置。
【請求項4】
請求項1乃至3の何れかのファイル管理装置と、前記複数のファイル格納装置を包含するファイル管理システム。
【請求項5】
複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、
前記優先度情報に基づいて各ファイル格納装置の優先度を決定する、重複ファイル抽出処理と、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力するファイル制御処理と、をコンピュータに実行させることを特徴とするファイル管理プログラム。
【請求項6】
前記優先度情報を参照して、ファイル格納装置の種別、ストレージ容量の大小、ファイル格納装置の位置するネットワーク階層の上下、のいずれかに基づいて、前記ファイル格納装置の前記優先度を決定する前記重複ファイル抽出処理を前記コンピュータに実行させることを特徴とする請求項5のファイル管理プログラム。
【請求項7】
前記優先度情報を参照して、ファイル格納装置の位置するネットワーク上の階層と、各階層におけるファイル格納装置の台数とを取得し、前記優先度を決定する対象のファイル格納装置(優先度決定対象装置)への他の階層の前記優先度決定対象装置の保有する前記重複ファイルと同じ前記重複ファイルを保有するファイル格納装置(重複ファイル装置)からのホップ数をn、前記他の階層における重複ファイル装置の台数をmとし、前記優先度決定対象装置の優先度を、すべての階層に関して各々得られるnxmの総和とする前記重複ファイル抽出処理を前記コンピュータに実行させることを特徴とする請求項5のファイル管理プログラム。
【請求項8】
複数のファイル格納装置から、各ファイル格納装置が保有するファイルの内容に関する情報を含むファイル情報を取得して比較し、互いに同じファイル内容に関する情報を有するファイルを重複ファイルとして抽出し、優先度情報記憶手段から優先度情報を取得し、
前記優先度情報に基づいて各ファイル格納装置の優先度を決定し、前記優先度の高さに応じて、各ファイル格納装置が保有する前記重複ファイルを保存するか削除するかを決定し、前記重複ファイルを保有する各ファイル格納装置に、前記重複ファイルの削除もしくは保存の指示情報を出力することを特徴とするファイル管理方法。
【請求項9】
前記優先度情報を参照して、ファイル格納装置の種別、ストレージ容量の大小、ファイル格納装置の位置するネットワーク階層の上下、のいずれかに基づいて、前記ファイル格納装置の前記優先度を決定することを特徴とする請求項8のファイル管理方法。
【請求項10】
前記優先度情報を参照して、ファイル格納装置の位置するネットワーク上の階層と、各階層におけるファイル格納装置の台数とを取得し、前記優先度を決定する対象のファイル格納装置(優先度決定対象装置)への他の階層の前記優先度決定対象装置の保有する前記重複ファイルと同じ前記重複ファイルを保有するファイル格納装置(重複ファイル装置)からのホップ数をn、前記他の階層における重複ファイル装置の台数をmとし、前記優先度決定対象装置の優先度を、すべての階層に関して各々得られるnxmの総和とすることを特徴とする請求項8のファイル管理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−63902(P2012−63902A)
【公開日】平成24年3月29日(2012.3.29)
【国際特許分類】
【出願番号】特願2010−206454(P2010−206454)
【出願日】平成22年9月15日(2010.9.15)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】