説明

文書処理装置、及びファイルサーバ管理支援方法、並びにファイルサーバ管理支援プログラム

【課題】ファイルサーバにおいて削除できる可能性のあるファイルを効率よく絞り込み、ユーザの削除可否確認作業の負担が軽減することができる技術を提供する。
【解決手段】 ファイルサーバ内のファイルの容量分布・容量累計の表示および、ファイルサーバ内のファイルのうち慎重に保存していると思われるものおよび重複して保存していると疑われるものや、削除による容量削減効果が高いものの選択表示を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書処理装置、及びファイルサーバ管理支援方法、並びにファイルサーバ管理支援プログラムに関し、例えば、ファイルサーバに保存されている複数のファイルを整理するための支援情報を提示し、ファイルサーバの容量削減を支援することを可能にする技術に関する。
【背景技術】
【0002】
組織内のファイルサーバは電子データの保存・共有のために利便性が高く、広く普及している。しかし容量が増大しがちであるため、不要なファイルの削除を支援・促進するための技術に対する要求が高まっている。例えば、デジタルデータが爆発的に増大していることや(非特許文献1参照)、企業内ではRDB(Relational Database)に格納されている構造データは全体の2割に過ぎず、大半は文書ファイルなどの非構造文書であることなどが調査・報告されている(例えば、非特許文献2参照)。また、不要なファイルの削除を支援するソフトウェア(例えば、非特許文献3乃至5参照)が提案されている。
【0003】
これらの技術では、最終更新日が古い・最終アクセス日が古い・内容が重複したファイルがある・ファイル名が類似したファイルがあるなどの条件を用い、不要と思われるファイルの提示を行う機能を持つ。これらのファイルについて、自動的なアーカイブ化・削除の機能を持つものや、ファイルを利用しているユーザの確認・了承によりアーカイブ化・削除の機能を持つものがある。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】J. F. Gantz, et al. The Diverse and Exploding Digital Universe, An IDC White Paper,http://japan.emc.com/collateral/analyst-reports/diverse-exploding-digital-universe.pdf
【非特許文献2】S. Grimes, "Unstructured Data and the 80 Percent Rule", Clarabridge Bridgepoints, http://clarabridge.com/default.aspx?tabid=137&ModuleID=635&ArticleID=551
【非特許文献3】NEC, 文書・コンテンツ管理支援システム, InfoFrame PROCENTER/C, http://www.nec.co.jp/pfsoft/procenter/index.html
【非特許文献4】ジャストシステム, GDMS, http://just-enterprise.com/product/gdms/
【非特許文献5】株式会社日立ソリューションズ, MEANSファイルサーバスリム化ソリューション, http://hitachisoft.jp/products/means/slimserver/
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、既存技術では、上述のように「削除可能と思われる」かどうかに着目しており、実際のファイルサーバ上でファイルがどのように作成・保存されているかの傾向に従うものではない。つまり、文書を扱う現場にとっては、古いファイルだからといって直ちに削除できるファイルであるとは限らない。このため、目標とする削減量を達成できるまでに、ユーザは膨大な数のファイルの削除可否を確認しなくてはならないという課題がある。また、その削除可否確認の手間・工数が未知であることから、工数見積もりを行えず管理しにくいという課題および、手間を回避する考えからユーザが削除可否確認作業に着手しづらいという課題もある。
【0006】
また、ファイルの内容によらず機械的に不要と思われるかどうかの判断を行って提示を行うため、提示されたものを削除できるとは限らないという課題がある。そして、このことからユーザの削除可否確認作業の意欲を減退させるという課題がある。
【0007】
また、内容が重複したファイルを削除可能と思われるファイルとして提示する場合は確認を省略して自動的に削除することも考えられる。しかし、設定されたフォルダ名・ファイル名情報に基づいて自動的にファイルにアクセスする処理を行う場合などに、必要なファイルにアクセスできないという状況が発生してしまうため、確認を省略した自動削除には限界がある。さらに、ファイルの全文や全ビットを比較して重複を確認することは計算時間を要する一方、ハッシュ値を用いて重複を確認することは微少ながら誤判定の危険があるという課題がある。
【0008】
本発明はこのような状況に鑑みてなされたものであり、ファイルサーバにおいて削除できる可能性のあるファイルを効率よく絞り込み、ユーザの削除可否確認作業の負担が軽減することができる技術を提供するものである。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明による文書処理装置は、ファイルサーバに格納されている複数のファイルのファイル名、フォルダ名、ファイルサイズ、及び更新日の情報を含むファイル情報と、ファイルがユーザによって慎重にバックアップされたことを示唆する慎重保存示唆情報と、を格納する記憶デバイスと、ファイル情報に基づいて、複数のファイルを整理するための支援情報を生成し、表示装置を介して前記支援情報を提示するプロセッサと、を有する。そして、プロセッサは、複数のファイルのそれぞれについて、ファイル情報を慎重保存示唆情報と照合することにより、複数のファイルのそれぞれが慎重にバックアップされた慎重保存ファイルであるか否か判定し、複数の慎重保存ファイルをファイルサイズ順にソートして、当該ソート結果を支援情報として提示する。
【0010】
本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、本発明の態様は、要素及び多様な要素の組み合わせ及び以降の詳細な記述と添付される特許請求の範囲の様態により達成され実現される。
【0011】
本明細書の記述は典型的な例示に過ぎず、本発明の特許請求の範囲又は適用例を如何なる意味に於いても限定するものではないことを理解する必要がある。
【発明の効果】
【0012】
本発明によれば、ファイルサーバにおいて削除できる可能性のあるファイルを効率よく絞り込み、ユーザの削除可否確認作業の負担が軽減することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の実施形態による業務文書処理装置の概略構成例を示す機能ブロック図である。
【図2】ファイル情報、頻繁更新業務名、一時業務名、生データ示唆拡張子およびバックアップ示唆文字列のデータ構成例を示す図である。
【図3】日付正規表現、バックアップ示唆拡張子、メールデータ示唆文字列、削除済み示唆文字列、ファイルサイズ削除候補およびファイルサイズ慎重保存削除候補のデータ構成例を示す図である。
【図4】業務文書処理装置において実行される処理の全体概要を説明するためのフローチャートである。
【図5】慎重保存ファイル選択処理(S402)の詳細を説明するためのフローチャートである。
【図6】慎重バックアップファイル選択処理(S503)の詳細を説明するためのフローチャートである。
【図7】重複保存ファイル選択処理(S507)の詳細を説明するためのフローチャートである。
【図8】削除候補選択処理(S403)の詳細を説明するためのフローチャートである。
【図9】サイズ表示処理によって表示される画面例(棒グラフ表示)を示す図である。
【図10】サイズ表示処理によって表示される画面例(折れ線グラフ表示)を示す図である。
【図11】サイズ表示処理によって表示される画面例(円グラフ表示)を示す図である。
【図12】サイズ表示処理によって表示される画面例(面グラフ表示)を示す図である。
【図13】サイズ表示処理によって表示される画面例(表に基づく表示)を示す図である。
【図14】サイズ表示処理によって表示される画面例(棒グラフによる累計表示)を示す図である。
【図15】サイズ表示処理によって表示される画面例(棒グラフによる累計比較表示)を示す図である。
【図16】サイズ表示処理によって表示される画面例(折れ線グラフによる累計表示)を示す図である。
【図17】サイズ表示処理によって表示される画面例(折れ線グラフによる累計比較表示)を示す図である。
【図18】サイズ表示処理によって表示される画面例(面グラフによる累計表示)を示す図である。
【図19】サイズ表示処理によって表示される画面例(面グラフによる累計比較表示)を示す図である。
【図20】サイズ表示処理によって表示される画面例(表による累計表示)を示す図である。
【図21】サイズ表示処理によって表示される画面例(表示のよる累計比較表示)を示す図である。
【図22】部署ごとに占める容量割合の分布とファイルサイズの分布の組み合わせを用いた画面例(棒グラフ表示)を示す図である。
【図23】ユーザごとに占める容量割合の分布とファイルサイズの分布の組み合わせを用いた画面例(棒グラフ表示)を示す図である。
【図24】ファイルサーバのファイルサイズ調査結果例を示す図である。
【発明を実施するための形態】
【0014】
本発明は、ファイルサーバにおける不要なファイルの削除において、目標とする削減量を達成できるまでに、ユーザは膨大な数のファイルの削除可否を確認しなくてはならないという課題を解決するものである。そして、このために、本発明では、ファイルサーバ内のファイルの容量分布・容量累計の表示および、ファイルサーバ内のファイルのうち慎重に保存していると思われるものおよび重複して保存していると疑われるものや、削除による容量削減効果が高いものの選択表示を行う。
【0015】
以下、添付図面を参照して本発明の実施形態について説明する。添付図面では、機能的に同じ要素は同じ番号で表示される場合もある。なお、添付図面は本発明の原理に則った具体的な実施形態と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではなく様々な変形例が考えられる。
【0016】
本実施形態では、当業者が本発明を実施するのに十分詳細にその説明がなされているが、他の実装・形態も可能で、本発明の技術的思想の範囲と精神を逸脱することなく構成・構造の変更や多様な要素の置き換えが可能であることを理解する必要がある。従って、以降の記述をこれに限定して解釈してはならない。
【0017】
更に、本発明の実施形態は、後述されるように、汎用コンピュータ上で稼動するソフトウェアで実装しても良いし専用ハードウェア又はソフトウェアとハードウェアの組み合わせで実装しても良い。
【0018】
なお、以後の説明では「テーブル」形式によって本発明の各情報について説明するが、これら情報は必ずしもテーブルによるデータ構造で表現されていなくても良く、リスト、DB、キュー等のデータ構造やそれ以外で表現されていても良い。そのため、データ構造に依存しないことを示すために「テーブル」、「リスト」、「DB」、「キュー」等について単に「情報」と呼ぶことがある。
【0019】
また、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現を用いることが可能であり、これらについてはお互いに置換が可能である。
【0020】
以下では「プログラム」を主語(動作主体)として本発明の実施形態における各処理について説明を行うが、プログラムはプロセッサによって実行されることで定められた処理をメモリ及び通信ポート(通信制御装置)を用いながら行うため、プロセッサを主語とした説明としてもよい。また、プログラムを主語として開示された処理は管理サーバ等の計算機、情報処理装置が行う処理としてもよい。プログラムの一部または全ては専用ハードウェアで実現してもよく、また、モジュール化されていても良い。各種プログラムはプログラム配布サーバや記憶メディアによって各計算機にインストールされてもよい。
【0021】
<ファイルサーバにおける保存ファイルの傾向>
以下では、発明者が企業内ファイルサーバを調査した結果、発見した保存ファイルの保存形態の傾向について説明する。発明者は、当該調査の結果、大きく分けて2つの傾向があることを見出した。
【0022】
(1)特徴(傾向)1:ファイルサーバに保存されているファイルのサイズは均一ではなく、少数の大容量ファイルが多くの容量割合を占めている。
【0023】
ファイルサーバに保存されているファイルのサイズが様々であることは自明である。テキスト情報しか持たないファイルであれば、小さいサイズのものは1キロバイトにも満たない。逆に、画像を多く貼りこんだプレゼンテーションであれば、近年では1メガバイトを超えるものも珍しくない。
【0024】
また、コンピュータの処理能力の向上に伴い、ユーザが快適に作成・閲覧できるファイルの最大サイズは徐々に増加している。ファイルサーバには過去から現在に至るファイルが保存されていることから、小さいサイズのファイルの方が多く存在するであろうことは容易に想像できる。
【0025】
しかし、実際にファイルを収集してサイズを調査すると、その分布の偏りは予想をはるかにしのぐものであった。
【0026】
図24は、ファイルを収集してサイズの順に並べ替え、横軸にファイルサイズの順位を、縦軸にファイルサイズの値を設定し、ファイルサーバに存在する各ファイルをプロットしたものを示している。このグラフから、非常に少数の割合の非常に巨大なファイルが存在し、それ以外の大多数のファイルのサイズは相対的に無視できるほど小さいという状況が観察された。
【0027】
一般に「パレートの法則」「80:20の法則」と言われる経験則があり、「売上の80%は、20%の顧客から得られる」「売り上げの80%は、20%の商品銘柄から得られる」「社会全体の所得の80%は、20%の高額所得者が得ている」「不良全体の80%は、20%の原因に由来する」ということが知られている。
【0028】
しかし、ファイルサーバに関しては偏在の度合いははるかに強く、全体容量の90%がサイズ上位1%のファイルで占められている場合さえあった。
【0029】
これらのことから、ファイルサーバの使用容量増大を防ぐためにファイルを削除するのであれば、参照番号(点線枠)2400に示す部分のファイルから削除可否を確認するのでなければ効果が上がらないこと(逆に、既存技術で着目している「削除可能と思われる」ファイルであっても、それが参照番号(点線枠)2401に示す部分に存在するファイルなのであれば、どんなに削除しても、削除可否確認の手間・工数が増大するばかりで、ファイルサーバの容量確保は遅々として進まないことが分かった。例えば、前述の「全体容量の90%がサイズ上位1%のファイルで占められている」場合では、99%の数のファイルについての削除可否確認という膨大な工数を投じて、仮にそれらがすべて削除可能であったとしても、全体容量の10%しか削減できないことが分かった。
【0030】
(2)特徴(傾向)2:ファイルサーバに保存されている大容量ファイルのうち、個人がフォルダ単位で行ったバックアップファイルを慎重・過剰に保存していると思われるファイルが一定割合を占めている。
【0031】
特徴1で述べたように、少数の大容量ファイルが多くの容量割合を占めている状況であっても、もしそれらが削除できないものであれば、容量を削除することができない。
【0032】
しかし、実際にファイルを収集して大容量ファイルがどのようなものであるかを調べたところ、個人がフォルダ単位で行ったバックアップファイルを慎重・過剰に保存しているらしい、削除可能と思われるファイルが多く見つかった。また、ユーザは、通常のファイル操作において、メール送信時以外にはファイルサイズを意識する機会はほとんどない。このため、ファイルサーバの中でどのようなファイルが容量を圧迫しているかの認識は、実態とは異なることも多い。ファイルの作成者自身が「まさかこんなファイルがこんなに容量を圧迫しているとは思わなかった」と驚き呆れるようなファイルも少なくなかった。
【0033】
さらに、発明者は、上記の特徴2に関してさらなる調査を行った結果、下記の傾向があることを見出した。
【0034】
特徴2−1:ファイル名に進歩が速い技術分野名称・定常的に行う業務名称などが含まれ、頻繁な更新を行うべき内容であることが推測できるにも関わらず、そのファイルの最終更新日が古い場合がある。
【0035】
特徴2−2:ファイル名に一時的な内容であることを示す業務名称が含まれ、長期の保存必要性が低いことが推測できるにも関わらず、そのファイルの最終更新日が古い場合がある。
【0036】
特徴2−3:加工前の生データであることを示唆する拡張子を持ち、かつ、同一フォルダ内にファイル名が類似しており拡張子が異なるファイルが存在するため加工後ファイルが存在することが推測できるにも関わらず、そのファイルの最終更新日が古い場合がある。
【0037】
特徴2−4:ファイル名にバックアップであることを示唆する文字列が含まれるにも関わらず、そのファイルの更新日が古い場合がある。
【0038】
特徴2−5:ファイル名に日付文字列が含まれバックアップであることが推測できるにも関わらず、そのファイルの更新日が古い場合がある。
【0039】
特徴2−6:バックアップであることを示唆する拡張子を持つにも関わらず、そのファイルの更新日が古い場合がある。
【0040】
特徴2−7:メールデータであることを示すフォルダ名であるにも関わらず、そのフォルダに含まれるファイル全ての最終更新日が古い場合がある。
【0041】
特徴2−8:ファイル名に削除済みデータであることを示唆する文字列が含まれるにも拘わらず、そのファイルの更新日が古い場合がある。
【0042】
特徴2−9:フォルダ名に削除済みデータであることを示唆する文字列が含まれるにも拘わらず、そのフォルダに含まれるファイル全ての最終更新日が古い場合がある。
【0043】
特徴2−10:類似した名前のフォルダに、ファイル名・サイズ・更新日が等しいファイルがあり、重複が疑われる場合がある。
【0044】
特徴2−11:サイズが大きく、かつ、サイズが等しいファイルがあり、内容の重複が疑われる場合がある。
【0045】
特徴2−12:類似した名前のフォルダに、サイズ・更新日が近くファイル名が等しいファイルがあり、世代が異なるバックアップファイルであることが推測できる場合がある。
【0046】
特徴2−13:同一フォルダに存在する他のファイルよりも極端に古い更新日付のファイルがあり、他の場所から古いファイルを参考用にコピーしてきたことが示唆される場合がある。
【0047】
以上のように見出された傾向(特徴)に基づいて、本発明の実施形態による削除可能なファイルを提示する処理について、業務文書処理装置(文書処理システム)の構成から順に詳細に説明する。
【0048】
<業務文書処理装置の構成>
図1は、業務文書処理装置1の内部の概略構成を示す機能ブロック図である。図1において、当該業務文書処理装置1は、単独の計算機として示されているが、各構成部が遠隔的に配置され、それぞれがネットワークを介して接続されて構成される、計算機システムとして構成されるようにしても良い。
【0049】
業務文書処理装置1は、データを表示するための表示装置100と、ファイル情報DB101と、表示されたデータに対してメニューを選択するなどの操作を行うためのキーボード102と、マウスなどのポインティングデバイス103と、頻繁更新業務名DB104と、一時業務名DB105と、生データ示唆拡張子DB106と、バックアップ示唆文字列DB107と、日付正規表現DB108と、バックアップ示唆拡張子DB109と、メールデータ示唆文字列DB110と、削除済み示唆文字列DB111と、必要な演算処理や制御処理などを行う中央処理装置(プロセッサ)112と、中央処理装置112での処理に必要なプログラムを格納するプログラムメモリ113と、中央処理装置112での処理に必要なデータを格納するデータメモリ114と、を有している。
【0050】
中央処理装置112は、慎重保存ファイル選択処理部115と、削除候補選択処理部118と、サイズ表示処理部119と、削除候補表示処理部120と、を有している。慎重保存ファイル選択処理部115は、慎重バックアップファイル選択処理部116と、重複保存ファイル選択処理部117と、を有している。なお、本実施形態においては、各処理部115乃至120は、コンピュータによって構成される。従って、慎重保存ファイル選択処理部115と、削除候補選択処理部118と、サイズ表示処理部119と、削除候補表示処理部120は、いずれもコンピュータ上で実行されるプログラムの機能の一部として実現される。よって、各処理部を、処理プログラムと読み替えることも可能である。これらのプログラムは、プログラムメモリ113に格納されている。
【0051】
データメモリ114は、ファイル情報121と、頻繁更新業務名122と、一時業務名123と、生データ示唆拡張子124と、バックアップ示唆文字列125と、日付正規表現126と、バックアップ示唆拡張子127と、メールデータ示唆文字列128と、削除済み示唆文字列129と、ファイルサイズ削除候補130と、ファイルサイズ慎重保存重複疑い削除候補131と、を格納する情報として有している。
【0052】
<管理情報の構成例>
図2及び3は、データメモリ114に含まれる管理情報の構成例を示す図である。
図2は、ファイル情報121、頻繁更新業務名122、一時業務名123、生データ示唆拡張子124およびバックアップ示唆文字列125のデータ構造例を示す図である。
【0053】
ファイル情報121は、ファイルID200、フォルダ名201、ファイル名202、ファイル種別203、サイズ204および更新日205の情報を含み、例えば配列の形式でこれらの情報を保持している。ファイルID200は、ファイルに対して一意に振られたIDである。フォルダ名201は、そのファイルが格納されたフォルダの絶対パスを示す情報である。ファイル名202は、そのファイルの名前等の識別名を示す情報である。ファイル種別203は、初期状態では空文字列であり、ファイル種別特定の処理の結果が入力される。サイズ204は、対象ファイルの容量を示す情報であり、バイト単位で保持される。更新日205は、対象ファイルに対する書き込み処理が最後に行われた時点の情報である。
【0054】
頻繁更新業務名122は、頻繁に更新する業務名206を構成情報として有する。業務名206は、進歩が非常に高速な技術名や定期的に繰り返される管理業務名など、頻繁に文書を更新することが求められると想定される業務名称であり、文字列の配列の形式で保持される。
【0055】
一時業務名123は、一次業務を示す業務名207を構成情報として有する。業務名207は、仮の成果物など、一時的にしか用いないと文書であると想定される業務名称であり、文字列の配列の形式で保持される。
【0056】
生データ示唆拡張子124は、ファイルの拡張子を含む拡張子208を構成情報として有する。拡張子208は、画像や音声の加工前の保存ファイルに用いられる拡張子名であり、文字列の配列の形式で保持される。
【0057】
バックアップ示唆文字列125は、バックアップを示唆する示唆文字列209を構成情報として有する。示唆文字列209は、ユーザがファイルを予備のために保存した場合に含まれると想定される名称であり、文字列の配列の形式で保持される。
【0058】
図3は、日付正規表現126、バックアップ示唆拡張子127、メールデータ示唆文字列128、削除済み示唆文字列129、ファイルサイズ削除候補130およびファイルサイズ慎重保存重複疑い削除候補131のデータ構造例を示す図である。日付正規表現126は、日付についての正規表現300を構成情報として有する。正規表現300は「年」「月」「日」を含むなど、年月日を記載したと想定される正規表現であり、文字列の配列の形式で保持される。
【0059】
バックアップ示唆拡張子127は、バックアップを示す可能性がある拡張子301を構成情報として有する。拡張子301は、ユーザがファイルを予備のために保存したと想定される拡張子であり、文字列の配列の形式で保持される。
【0060】
メールデータ示唆文字列128は、メールデータであることを示唆すると思われる示唆文字列302を構成情報として有する。示唆文字列302は、メールデータを保存したファイルに含まれると想定される名称であり、文字列の配列の形式で保持される。
【0061】
削除済み示唆文字列129は、既に削除したファイルであることを示唆する示唆文字列303を構成情報として有する。示唆文字列303は、削除済みフラグを持つデータを保存したファイルに含まれると想定される名称であり、文字列の配列の形式で保持される。
【0062】
ファイルサイズ削除候補130は、ファイルサイズ削除候補となるファイルのファイルID304を配列の形式で保持する。ファイルID304は、ファイル情報のファイルID200を示している。
【0063】
ファイルサイズ慎重保存重複疑い削除候補131は、慎重に保存或いは重複して保存されたファイルである可能性があるファイルのファイルID305を配列の形式で保持している。ファイルID305は、ファイル情報のファイルID200を示している。
【0064】
<業務文書処理装置における処理の概要>
次に、上記のように構成された本実施形態の業務文書処理装置1において行われる処理の概要について説明する。図4は、業務文書処理装置1において行われる処理の概要について説明するためのフローチャートである。
【0065】
図4において、まず、中央処理装置(プロセッサ)112は、DB104乃至111から各DBの登録情報の読み込みを行う(ステップ400)。そして、中央処理装置112は、頻繁更新業務名DB104の情報を頻繁更新業務名122に、一時業務名DB105の情報を一時業務名123に、生データ示唆拡張子DB106の情報を生データ示唆拡張子124に、バックアップ示唆文字列DB107の情報をバックアップ示唆文字列125に、日付正規表現DB108の情報を日付正規表現126に、バックアップ示唆拡張子DB109の情報をバックアップ示唆拡張子127に、メールデータ示唆文字列DB110の情報をメールデータ示唆文字列128に、削除済み示唆文字列DB111の情報を削除済み示唆文字列129に、それぞれ読み込んで保存する。ただし、ファイルサイズ削除候補130およびファイルサイズ慎重保存重複疑い削除候補131については、読み込み対象のDBがないため、初期段階ではここには何も保存されない。
【0066】
次に、中央処理装置112は、ファイル情報DB101からファイル情報の読み込みを行う(ステップ401)。読み込んだ結果は、ファイル情報121に保持される。この段階ではまだそれぞれのファイルの種別は調べられていないため、ファイル種別203は空欄となっている。
【0067】
その後、慎重保存ファイル選択処理プログラム115は、慎重保存ファイルの選択処理を実行する(ステップ402)。当該処理の詳細については、図5を参照して説明する。
【0068】
そして、削除候補選択処理プログラム118は、削除候補選択処理を実行する(ステップ403)。当該処理の詳細については、図8を参照して説明する。
【0069】
さらに、サイズ表示処理プログラム119は、サイズ表示処理を実行する(ステップ404)。当該処理の結果得られる画面表示例については、図9乃至図21を参照して説明する。
【0070】
最後に、削除処理候補表示処理プログラム120は、削除候補表示処理を実行する(ステップ405)。当該処理は、非特許文献5に記載されている既存技術を用いて実行することができる。よって、その詳細については説明を省略する。
【0071】
<慎重保存ファイル選択処理(S402)の詳細>
図5は、図4のステップ402における慎重保存ファイル選択処理の詳細を説明するためのフローチャートである。
【0072】
まず、慎重保存ファイル選択処理プログラム115は、処理対象となる各ファイルについて処理を繰り返し行うためのインデックス変数file_idx1を初期化する(ステップ500)。
【0073】
次に、慎重保存ファイル選択処理プログラム115は、ファイル情報121にはfile_idx1以上のデータがあるかどうかを調べる(ステップ501)。対象データがない場合(S501でNoの場合)、処理は終了する。ステップ501においてfile_idx1以上のファイルがある場合(S501でYesの場合)、処理はステップ502に移行する。
【0074】
ステップ502では、慎重保存ファイル選択処理プログラム115は、file_idx1番目のファイル情報要素におけるファイル種別203が登録済みであるかどうかを調べる(ステップ502)。ファイル種別203が登録済みであれば(S502でYesの場合)、慎重保存ファイル選択処理プログラム115は、file_idx1をインクリメントし(ステップ510)、ステップ501から処理を繰り返す。一方、ファイル種別203が登録済みでなければ(S502でNoの場合)、処理はステップ503に移行し、慎重保存ファイル選択処理プログラム115は、慎重なバックアップと思われるかどうかを調べる(ステップ503)。この処理は、慎重保存ファイル選択処理プログラム115によって呼び出された慎重バックアップファイル選択処理プログラム116によって実行されるものであり、その処理の詳細については図6を参照して後述する。
【0075】
続いて、慎重保存ファイル選択処理プログラム115は、ステップ503の処理によって得られた結果であるファイル種別203の情報を確認し、慎重なバックアップと思われるものであると判断されたかどうかを調べる(ステップ504)。慎重なバックアップと思われたと判断されていれば(S504でYesの場合)、慎重保存ファイル選択処理プログラム115は、file_idx1をインクリメントし(ステップ510)、ステップ501から処理を繰り返す。ステップ504において慎重なバックアップと思われるものではないと判断されていれば(S504でNoの場合)、慎重保存ファイル選択処理プログラム115は、ファイルの組を調べるためのインデックス変数file_idx2(比較対象となる別のファイル)をfile_idx1+1で初期化する(ステップ505)。
【0076】
そして、慎重保存ファイル選択処理プログラム115は、ファイル情報121にfile_idx2以上のデータがあるかどうかを調べる(ステップ506)。該当するデータがない場合(S506でNoの場合)、慎重保存ファイル選択処理プログラム115は、file_idx1をインクリメントし(ステップ510)、ステップ501から処理を繰り返す。ステップ506においてfile_idx2以上のファイルがあると判断された場合(S506でYesの場合)、慎重保存ファイル選択処理プログラム115は、file_idx1番目とfile_idx2番目のファイルについて重複が疑われるかどうかを調べる(ステップ507)。この処理は、慎重保存ファイル選択処理プログラム115によって呼び出された重複保存ファイル選択処理プログラム117によって実行されるものであり、その処理の詳細については、図7を参照して後述する。
【0077】
次に、慎重保存ファイル選択処理プログラム115は、ステップ507によって得られた結果であるファイル種別203の情報を確認し、重複が疑われたものであると判断されたのであれば(S508でYesの場合)、慎重保存ファイル選択処理プログラム115は、file_idx1をインクリメントし(ステップ510)、ステップ501から処理を繰り返す。ステップ508において重複が疑われなかったと判断されたのであれば(S508でNoの場合)、慎重保存ファイル選択処理プログラム115は、比較対象のファイルのfile_idx2をインクリメントし(ステップ509)、ステップ506から処理を繰り返す。
以上により、処理対象のファイルについて、慎重保存ファイルの選択が完了する。
【0078】
<慎重バックアップファイル確認処理(S503)の詳細>
図6は、図5のステップ503における慎重なバックアップと思われるかどうか確認する処理の詳細を説明するためのフローチャートである。
【0079】
まず、慎重バックアップファイル選択処理プログラム116は、ファイル情報121に含まれるフォルダ名201またはファイル名202が、頻繁更新業務名122の業務名206のいずれかの配列要素を含み、かつ、更新日205が閾値よりも古いかを調べる(ステップ600)。閾値としては、例えば現在日時の1年前の値や、前年度の開始日などを用いる。ステップ600において両方の条件を満たす場合(S600でYesの場合)、慎重バックアップファイル選択処理プログラム116は、特徴2−1に従い慎重なバックアップと思われるので、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ600において条件のいずれか一方でも満たさなかった場合(S600でNoの場合)、処理はステップ601に移行する。
【0080】
ステップ601において、慎重バックアップファイル選択処理プログラム116は、フォルダ名201またはファイル名202が一時業務名123の業務名207のいずれかの配列要素を含み、かつ、更新日205が閾値よりも古いかを調べる(ステップ601)。当該両方の条件を満たす場合(S601でYesの場合)、特徴2−2に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ601において当該条件のいずれか一方でも満たさなかった場合(S601でNoの場合)、処理はステップ602に移行する。
【0081】
ステップ602において、慎重バックアップファイル選択処理プログラム116は、ファイル名202が生データ示唆拡張子124の拡張子208のいずれかの配列要素を含み、かつ、フォルダ名201が同一でファイル名202が類似しているファイル情報があり、かつ、更新日205が閾値よりも古いかを調べる(ステップ602)。ファイル名の類似についてはダイナミックプログラミングなどの既存技術で判断することができる。ステップ602において上記条件のいずれも満たす場合(S602でYesの場合)、特徴2−3に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ602において上記条件のいずれか1つでも満たさなかった場合(S602でNoの場合)、処理はステップ603に移行する。
【0082】
ステップ603において、慎重バックアップファイル選択処理プログラム116は、フォルダ名201またはファイル名202がバックアップ示唆文字列125の示唆文字列209のいずれかの配列要素を含み、かつ、更新日205が閾値よりも古いかを調べる(ステップ603)。両方の条件を満たす場合(S603でYesの場合)、特徴2−4に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。ステップ603において、上記条件のいずれか一方でも満たさなかった場合(S603でNoの場合)、処理はステップ604に移行する。
【0083】
ステップ604において、慎重バックアップファイル選択処理プログラム116は、フォルダ名201またはファイル名202が日付正規表現126のいずれかの配列要素の正規表現300にマッチし、かつ、その日付の値が閾値よりも古いかを調べる(ステップ604)。両方の条件を満たす場合(S604でYesの場合)、特徴2−5に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ604において上記条件のいずれか一方でも満たさなかった場合(S604でNoの場合)、処理はステップ605に移行する。
【0084】
ステップ605において、慎重バックアップファイル選択処理プログラム116は、ファイル名202がバックアップ示唆拡張子127の拡張子301のいずれかの配列要素を含み、かつ、更新日205が閾値よりも古いかを調べる(ステップ605)。両方の条件を満たす場合(S605でYesの場合)、特徴2−6に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ605において、上記条件のいずれか一方でも満たさなかった場合(S605でNoの場合)、処理はステップ606に移行する。
【0085】
ステップ606において、慎重バックアップファイル選択処理プログラム116は、フォルダ名201またはファイル名202がメールデータ示唆文字列128の示唆文字列302のいずれかの配列要素を含み、かつ、更新日205が閾値よりも古いかを調べる(ステップ606)。両方の条件を満たす場合(S606でYesの場合)、特徴2−7に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ606において、上記条件のいずれか一方でも満たさなかった場合(S606でNoの場合)、処理はステップ607に移行する。
【0086】
ステップ607において、慎重バックアップファイル選択処理プログラム116は、ファイル名202が削除済み示唆文字列129の示唆文字列303のいずれかの配列要素を含み、かつ、更新日205が閾値よりも古いかを調べる(ステップ607)。両方の条件を満たす場合(S607でYesの場合)、特徴2−8に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ607において、上記条件のいずれか一方でも満たさなかった場合(S607でNoの場合)、処理はステップ608に移行する。
【0087】
ステップ608において、慎重バックアップファイル選択処理プログラム116は、フォルダ名201が削除済み示唆文字列129の示唆文字列303のいずれかの配列要素を含み、かつ、同じフォルダに存在する全てのファイルにおいて更新日205が閾値よりも古いかを調べる(ステップ608)。両方の条件を満たす場合(S608でYesの場合)、特徴2−9に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ608において、上記条件のいずれか一方でも満たさなかった場合(S608でNoの場合)、処理はステップ609に移行する。
【0088】
ステップ609において、慎重バックアップファイル選択処理プログラム116は、同じフォルダに存在する他の全てのファイルと比べて更新日205が極端に古いかを調べる(ステップ609)。「極端に古い」とみなすべきかどうかは、通常の統計解析手法を用いて判断できる。当該条件を満たす場合(S609でYesの場合)、特徴2−13に従い慎重なバックアップと思われるので、慎重バックアップファイル選択処理プログラム116は、ファイル種別203に“慎重保存”と登録し(ステップ610)、処理を終える。一方、ステップ609において、上記条件を満たさなかった場合(S609でNoの場合)、そのまま処理は終了する。
【0089】
以上の処理により、処理対象ファイルが慎重にバックアップされて残存してしまったファイル(慎重バックアップファイル)か否か判断され、該当するファイルは、”慎重保存”に分類されることになる。
【0090】
<重複ファイル確認処理(S508)の詳細>
図7は、図5のステップ508における対象ファイルが重複ファイルであると疑われるものかどうか確認する処理の詳細を説明するためのフローチャートである。
【0091】
まず、重複保存ファイル選択処理プログラム117は、図5におけるfile_idx1番目およびfile_idx2番目の2つのファイルが、ファイル名202、サイズ204および更新日205が互いに等しく、かつ、フォルダ名201が類似しているか調べる(ステップ700)。フォルダ名が類似しているかどうかは、文字列を比較して比較結果が閾値以上であるかによって判断するダイナミックプログラミングなどの既存技術で判断することができる。上記両方の条件を満たす場合(S700でYesの場合)、特徴2−10に従い重複が疑われるので、重複保存ファイル選択処理プログラム117は、ファイル種別203に“重複疑い”と登録し(ステップ703)、処理を終える。一方、ステップ700において、上記条件のいずれか一方でも満たさなかった場合(S700でNoの場合)、処理はステップ701に移行する。
【0092】
ステップ701において、重複保存ファイル選択処理プログラム117は、図5におけるfile_idx1番目およびfile_idx2番目の2つのファイルのサイズ204が共に大きく、かつ、等しいか調べる(ステップ701)。サイズが大きいかどうかは、例えば1GB以上などの閾値を用いて判断できる。上記両方の条件を満たす場合(ステップ701でYesの場合)、特徴2−11に従い重複が疑われるので、重複保存ファイル選択処理プログラム117は、ファイル種別203に“重複疑い”と登録し(ステップ703)、処理を終える。一方、ステップ701において、上記条件のいずれか一方でも満たさなかった場合(S701でNoの場合)、処理はステップ702に移行する。
【0093】
ステップ702において、重複保存ファイル選択処理プログラム117は、図5におけるfile_idx1番目およびfile_idx2番目の2つのファイルのファイル名202が互いに等しく、かつ、サイズ204および更新日205が近い値であり、かつ、フォルダ名201が類似しているか調べる(ステップ702)。サイズや更新日が近いかどうかは、例えば、差が最大値の10%以下であるかなどの計算と閾値を用いて判断できる。また、フォルダ名が類似しているかどうかは、通常のアライメント技術を用いて判断できる。上記全ての条件を満たす場合(S702でYesの場合)、特徴2−12に従い重複が疑われるので、重複保存ファイル選択処理プログラム117は、ファイル種別203に“重複疑い”と登録し(ステップ703)、処理を終える。一方、ステップ702において、上記条件のいずれか1つでも満たさなかった場合(S702でNoの場合)、そのまま処理は終了する。
【0094】
以上の処理により、処理対象ファイルが重複して保存されてしまっている疑いのあるファイル(重複疑義ファイル)か否か判断され、該当するファイルは、”重複疑い”に分類されることになる。
【0095】
<削除候補選択処理(S403)の詳細>
図8は、図4のステップ403における削除候補の選択を行う処理の詳細を説明するためのフローチャートである。
【0096】
まず、削除候補選択処理プログラム118は、ファイル情報121に保持されている全ての配列要素のファイルID200を、ファイルサイズ削除候補130のそれぞれの配列要素のファイルID304にコピーする(ステップ800)。
【0097】
次に、削除候補選択処理プログラム118は、ファイルサイズ削除候補130の配列要素を、ファイルID304と同じファイルID200を持つファイル情報121の配列要素におけるサイズ204の降順にソートする(ステップ801)。ステップ800及び801の処理によって、全てのファイルがファイルサイズに関してソートされ、削除候補が抽出される。
【0098】
また、削除候補選択処理プログラム118は、ファイル情報121に保存されている配列要素のうち、ファイル種別203に“慎重保存”または“重複疑い”が登録されているファイルについて、ファイルID200を、ファイルサイズ慎重保存重複疑い削除候補131のそれぞれの配列要素のファイルID305にコピーする(ステップ802)。
【0099】
そして、削除候補選択処理プログラム118は、ファイルサイズ慎重保存重複疑い削除候補131の配列要素を、ファイルID305と同じファイルID200を持つファイル情報121の配列要素におけるサイズ204の降順にソートする(ステップ803)。ステップ802及び803の処理によって、全ての慎重保存ファイル及び重複保存疑義ファイルがファイルサイズに関してソートされ、削除候補が抽出される。
【0100】
<サイズ表示処理(処理結果画面例)>
図9乃至21は、図4のステップ404におけるサイズ表示処理を実行した結果得られる表示画面例について説明するための図である。
【0101】
(i)棒グラフ表示例
図9は、図4のステップ404におけるサイズ表示処理について、棒グラフの場合の画面例を示す図である。
【0102】
図9において、ユーザによって、ラジオボタン900の「全ファイル」が選択される場合(全てのファイルを表示するよう指定される場合)、サイズ表示処理プログラム119は、表示装置100の画面上に、ファイルサイズ削除候補130のデータを表示する。図9は、「全ファイル」が選択された場合のサイズ表示画面例を示している。
【0103】
また、ユーザによって、ラジオボタン900の「慎重・重複のみ」が選択される場合(慎重・重複のみ表示するよう指定される場合)、サイズ表示処理プログラム119は、ファイルサイズ慎重保存重複疑い削除候補131のデータを表示する。
【0104】
ユーザによって、ラジオボタン900の「比較して表示」が選択される場合(比較して表示するよう指定される場合)、サイズ表示処理プログラム119は、ファイルサイズ削除候補130およびファイルサイズ慎重保存重複疑い削除候補131両方のデータを表示する。
【0105】
サイズ表示処理プログラム119は、グラフ表示エリア901において、ファイルサイズ削除候補130の配列要素番号を横軸に、ファイルサイズ削除候補130のファイルID304と同じファイルID200を持つファイル情報121の配列要素におけるサイズ204の値を縦軸にプロットする。そして、サイズ表示処理プログラム119は、軸スケール指定902における縦軸および横軸のスケール指定に従い、通常のスケールまたは対数スケールでグラフを表示する。さらに、ユーザがテキストボックス903および904は片方に値を入力すると、サイズ表示処理プログラム119は、もう片方の値を自動的に再計算し、ファイルサイズ削除候補130の配列要素順に、ファイルID304と同じファイルID200を持つファイル情報121の配列要素におけるサイズ204の累計和を求めた場合、ファイル情報121の全ての配列要素のサイズ204の合計のどれだけの割合に達するかを示す。例えば、図9のグラフを見たユーザは、棒グラフのサイズ表示処理プログラム119は、ユーザによる削除候補の表示ボタン905の押下を受け付けると、ファイルサイズ削除候補130の配列要素順にテキストボックス903に指定された割合だけ、ファイルID304と同じファイルID200を持つファイル情報121の配列要素について、図4のステップ405において削除候補表示処理を行う。そして、削除候補のファイル名が降順に表示され、表示の内容からユーザは削除すべきか判断することができるようになる。
【0106】
なお、図9では、「慎重・重複のみ」が選択された場合、慎重保存ファイルと重複疑義ファイルの総和を表示するようにしたが、どちらか一方を表示するようにしても良い。このことは、以下で説明する図10乃至23の表示形態を用いた場合でも同様である。
【0107】
(ii)折れ線グラフ表示例
図10は、図4のステップ404におけるサイズ表示処理について、折れ線グラフの場合の画面例を示す図である。ファイルの分布が折れ線で表現される以外は、図9と同様である。
【0108】
(iii)円グラフ表示例
図11は、図4のステップ404におけるサイズ表示処理について、円グラフの場合の画面例を示す図である。ファイルの分布が円グラフで表現される以外は、図9と同様である。
【0109】
(iv)面グラフ表示例
図12は、図4のステップ404におけるサイズ表示処理について、面グラフの場合の画面例を示す図である。ファイルの分布が面グラフで表現される以外は、図9と同様である。
【0110】
(v)表による表示例
図13は、図4のステップ404におけるサイズ表示処理について、表の場合の画面例を示したものである。ファイルの分布が表によって表現される以外は、図9と同様である。
【0111】
(vi)累計値グラフ表示例
図14は、図4のステップ404におけるサイズ表示処理について、サイズの累計値を棒グラフ表示する場合の画面例を示す図である。
【0112】
グラフ表示エリア1400において、サイズ表示処理プログラム119は、ファイルサイズ削除候補130の配列要素数に対する割合を横軸に、ファイルサイズ削除候補130の配列要素順に、ファイルID304と同じファイルID200を持つファイル情報121の配列要素におけるサイズ204の累計和を縦軸にプロットする。その他の点については図9と同様である。
【0113】
図15は、図14において、ユーザが「比較して表示」を選択した場合の画面表示例を示す図である。つまり、図15は、図4のステップ404におけるサイズ表示処理について、ファイルサイズ削除候補130のデータとファイルサイズ慎重保存重複疑い削除候補131のデータを比較して表示する場合の画面例を示している。
【0114】
図15のグラフ表示エリア1500において、サイズ表示処理プログラム119は、ファイルサイズ削除候補130の配列要素を使って求めた縦軸の値と、ファイルサイズ慎重保存重複疑い削除候補131の配列要素を使って求めた縦軸の値を同時に、表示装置100の画面上に表示する。
【0115】
図16及び17は、図14及び15と同様の画面例について、折れ線グラフの場合を示している。また、図18及び19は、図14及び15と同様の画面例について、面グラフの場合を示している。さらに、図20及び21は、図14及び15と同様の画面例について、表を用いて表示した場合を示している。図16乃至21について、表示形態以外は、図14及び15と同様である。
【0116】
<変形例>
(i)図6(慎重バックアップファイル確認処理)のステップ600乃至608における更新日205の確認については、フォルダ名201またはファイル名202が日付正規表現126のいずれかの配列要素の正規表現300にマッチする場合に、その日付の値の確認処理で差し替えることもできる。また、本明細書では更新日を用いたが、最終アクセス日または作成日などを用いても良い。
【0117】
上記の説明の図9乃至21におけるサイズ表示処理では、ファイル数を一定の範囲で区切って表示する形態が示されている。このことについて、一定の範囲で区切る際に、ファイル数の絶対値ではなく割合で表示する形態も可能である。また、個々のファイル単位で表示する形態も可能である。また、本実施形態では、サイズ表示処理部においてサイズを縦軸とした表示の例を示しているが、サイズを横軸において値を区切り、ヒストグラム表示を行っても良い。
【0118】
また、図9乃至21で用いられる棒グラフや円グラフ等の表示形態は、ユーザの指示によって変化するようにしても良い。つまり、例えば、棒グラフ(図9)の形態で表示されていたものが、ユーザの指示によって、折れ線グラフ表示(図10)、表に基づく表示(図13)や累計表示(図14)等に変化するようにしても良い。
【0119】
さらに、上記図9乃至図21におけるサイズ表示処理では、グラフの縦軸において、容量の具体的な値を表示する形態を示しているが、全体容量に対する割合で表示する形態も可能である。
【0120】
また、上記図14乃至21におけるサイズ表示処理では、ファイル数の値の増加に伴って容量の値も増加していく表示形態を示したが、ファイル数の値が0における容量の値を100%にし、ファイル数の値の増加に伴って容量の値が減少していくように、「削除を行った場合の残容量合計」を示す表示形態としても良い。
【0121】
(ii)本実施形態では、個々のファイルについて容量分布および容量累計の表示を行うことにより効率的な容量削減を行うための発明について述べたが、ユーザが指定したフォルダの直下に存在するサブフォルダごとの容量分布および容量累計・組織ごとの容量分布および容量累計・ファイルサーバなど物理マシンごとの容量分布および容量累計・エンタープライズサーチやアーカイビングシステムなどにおける管理対象ごとの容量分布および容量累計などの表示を行うことにより、容量削減の重点項目の管理を実現することも可能である。
【0122】
(iii)本実施形態では、個人がフォルダ単位で行ったバックアップファイルを慎重・過剰に保存していると思われるファイルの例として特徴2−1から特徴2−13を挙げたが、その他の特徴を利用しても良い。例えば、コピー&ペーストを行う際にペーストの操作を複数回繰り返したことを示唆する文字列がファイル名に含まれる場合がある。また、例えば、過去に所属していたが現在では退職や異動した従業員の名前などがフォルダ名やファイル名に含まれたりファイルシステムの所有者情報として保持されたりして、かつ、そのファイルの更新日が古い場合がある。また、例えば、インストール作業終了後はインストーラが不要になる種類のソフトウェアやプリンタのインストーラであることを示唆する文字列がファイル名やフォルダ名に含まれる場合がある。また、例えば、製造業以外の業種における図面ファイルや、広告・営業以外の業種における動画ファイルや、業務上利用可能なソフトウェアが指定されている環境における実行可能ファイルなど、業務上利用することが想定されない拡張子を持つ場合がある。さらに、例えば、社外のWebページや社内のポータルサイトから容易に入手可能であることを示唆する文字列がファイル名に含まれる場合がある。また、例えば、圧縮ファイルであることを示す拡張子を持つファイルと、拡張子以外の部分は同一でありサイズがその圧縮ファイルよりも大きいファイルまたはフォルダが両方とも存在しており、圧縮ファイルとその元ファイルが両方とも保存されていることが示唆される場合がある。
【0123】
(iv)本実施形態では、少数の大容量ファイルが多くの容量割合を占めていることについて述べたが、この特徴は部署やユーザ個人などでも同様である。すなわち、組織全体のうち少数の部署が多くの容量割合を占めており、部署の構成員全体のうち少数のユーザが多くの容量割合を占めており、一人のユーザが作成したファイルのうち少数のものが多くの容量割合を占めている。したがって、サイズ表示処理部における表示をファイル単位ではなく部署単位またはユーザ個人単位で行っても良い。
【0124】
また、部署ごとに占める容量割合の分布とファイルサイズの分布を組み合わせて図22のような表示を行い、参照番号2200に示すように、部署名の指定を受け付けて、削除候補表示処理部への画面遷移を行ってもよい。また、参照番号(点線枠)2201に示すように、ポインティングデバイスによるファイルの指定を受け付けて、削除候補表示処理部への画面遷移を行ってもよい。
【0125】
さらに、ユーザごとに占める容量割合の分布とファイルサイズの分布を組み合わせて図23のような表示を行い、参照番号2300に示すようにユーザ名の指定を受け付けて、削除候補表示処理部への画面遷移を行ってもよい。さらに、参照番号(点線枠)2301に示すように、ポインティングデバイスによるファイルの指定を受け付けて、削除候補表示処理部への画面遷移を行ってもよい。また、部署ごとに占める容量割合の分布とユーザごとに占める容量割合の分布を組み合わせて表示を行っても良い。また、部署ごとに占める容量割合の分布とユーザごとに占める容量割合の分布とファイルサイズの分布を組み合わせて三次元上にプロットを行っても良い。また、図23及び24は、棒グラフで表示を行っている例であるが、折れ線グラフ・円グラフ・面グラフ・その他のグラフ・表形式で表示を行っても良い。
【0126】
(v)本実施形態では、ファイルサーバ内のファイルのうち削除による容量削減効果が高いもの・慎重に保存していると思われるものおよび重複して保存していると疑われるもので削除による容量削減効果が高いものについて、選択および表示を行っている。しかし、削除ではなく圧縮やアーカイブストレージへの退避によっても容量の問題を解決できる。したがって、ファイルサーバ内のファイルのうち圧縮による容量削減効果が高いもの・慎重に保存していると思われるものおよび重複して保存していると疑われるもので圧縮による容量削減効果が高いもの・ファイルサーバ内のファイルのうちアーカイブによる容量削減効果が高いもの・慎重に保存していると思われるものおよび重複して保存していると疑われるものでアーカイブによる容量削減効果が高いものについて、選択および表示を行っても良い。
【0127】
(vi)本実施形態では、実際に削除・圧縮・アーカイブなどにより容量の問題を解決させるための処理について述べたが、削除可否確認工数・圧縮可否確認工数・アーカイブ可否確認工数の見積もりを行っても良い。すなわち、ファイルサーバ内のファイルのうち削除による容量削減効果が高いもの・慎重に保存していると思われるものおよび重複して保存していると疑われるもので削除による容量削減効果が高いものの数を調べ、それを元に確認工数の見積もりを行っても良い。また、ファイルサーバのファイル数と容量総和から、平均的な分布を用いて、ファイルサーバ内のファイルのうち削除による容量削減効果が高いもの・慎重に保存していると思われるものおよび重複して保存していると疑われるもので削除による容量削減効果が高いものの数を見積もり、それを元に確認工数の見積もりを行っても良い。
【0128】
<まとめ>
本実施形態による業務文書処理装置は、DBやメモリに、ファイルサーバに格納されている複数のファイルのファイル名、フォルダ名、ファイルサイズ、及び更新日の情報を含むファイル情報と、ファイルがユーザによって慎重にバックアップされたことを示唆する慎重保存示唆情報と、を少なくとも格納している。そして、これらの情報を用いて、ファイルサーバ容量管理のための支援情報を生成し、これを表示画面上に表示する。支援情報を生成する場合、複数のファイルのそれぞれについて、ファイル情報を慎重保存示唆情報と照合することにより、複数のファイルのそれぞれが慎重にバックアップされた慎重保存ファイルであるか否か判定する。そして、複数の慎重保存ファイルをファイルサイズ順にソートして、当該ソート結果を支援情報として表示する。また、複数のファイルについて、ぞれぞれのファイルのファイル情報を比較することにより、複数のファイルに重複して保存された可能性のある重複保存疑義ファイルがあるか否か判定する。そして、複数の重複保存疑義ファイルを支援情報生成のための集合に含めた場合には、これと複数の慎重保存ファイルを合わせたファイルをファイルサイズ順にソートして、当該ソート結果を支援情報として表示する。このようにすることにより、効率的に削除可能なファイルの情報をユーザに提示することができ、ユーザはより少ない削除可否確認工数で効率的な容量削除を行うことができる。
【0129】
より具体的には、発明者が見出した特徴2−1乃至2−13の条件に基づいて、過去に慎重にバックアップとして保存して長期間放置され、重要性が希薄になったファイル(慎重保存ファイル)を特定する。このような条件を用いることにより、ユーザがイメージしている不要ファイルとは全く異なる意外なファイル(特徴1参照)であって、容量を非常に消費しているファイルを特定することができる。ユーザにとって意外なものであるため、通常の探索の仕方ではこのようなファイルを見つけ出すことはできないが、本発明によれば、容易に発見することができるようになる。また、ユーザは、削除するファイルの数と削減可能容量との関係が分かるようになる。このため、ユーザは、工数見積もりに基づく管理が可能となると共に、ユーザの削除可否確認の意欲を促進することができる。
【0130】
また、複数のファイルをファイルサイズ順にソートし、全ファイルのソート結果を生成し、ユーザの要求に応じて、全ファイルのソート結果と重複保存疑義ファイル及び慎重保存ファイルのソート結果とを比較した情報を支援情報として表示するようにしても良い。このようにすることにより、ユーザは、ファイルサーバ内の全ファイルに占める削除可能なファイルの割合と、それらを削除することによりどの程度のファイルサーバ容量削減に繋がるか知ることができる。
【0131】
また、重複保存疑義ファイル及び慎重保存ファイルのファイル容量累計を算出し、当該ファイルの容量累計に従って、重複保存疑義ファイルと慎重保存ファイルのソート結果を表示するようにして良い(図14乃至21参照)。このようにすることにより、ユーザは、どこまでのファイルを削除すれば、どの位の容量圧縮に繋がるか直感的に把握することが可能となる。
【0132】
また、ユーザは、ファイルサーバにおけるファイルサイズが上位のファイルの割合(図9の903参照)及びファイルサーバの全体容量に占める割合(図9の904参照)のうちどちらか一方の割合を指定することができる。ユーザが指定すると、これに応答して、指定されなかった他方の割合が算出される。そして、指定された割合及び算出された割合を支援情報と共に表示する。このようにすることにより、ユーザは、意図してどこまで容量の圧縮を行うか決定することが可能となる。さらに、このとき、さらに、ユーザが削除候補表示(図9の905参照)を押下すると、それに応答して、ファイルのソート結果の上位から指定割合或いは算出割合であるファイルサイズが上位のファイルの割合に相当するファイルのファイル情報(ファイル名やフォルダ名)を表示する。このようにすることにより、ファイルサーバにおけるファイルの容量表示や容量累計表示の形態から、ファイルサーバ内のファイルのうち削除による容量削減の効果が高いものの表示へ画面遷移することが可能となり、ファイルサーバの容量管理が効率的に行うことができるようになる。
【0133】
本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
【0134】
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
【0135】
さらに、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
【0136】
最後に、ここで述べたプロセス及び技術は本質的に如何なる特定の装置に関連することはなく、コンポーネントの如何なる相応しい組み合わせによってでも実装できることを理解する必要がある。更に、汎用目的の多様なタイプのデバイスがここで記述した教授に従って使用可能である。ここで述べた方法のステップを実行するのに、専用の装置を構築するのが有益であることが判るかもしれない。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。本発明は、具体例に関連して記述したが、これらは、すべての観点に於いて限定の為ではなく説明の為である。本分野にスキルのある者には、本発明を実施するのに相応しいハードウェア、ソフトウェア、及びファームウエアの多数の組み合わせがあることが解るであろう。例えば、記述したソフトウェアは、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
【0137】
さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。
【0138】
加えて、本技術分野の通常の知識を有する者には、本発明のその他の実装がここに開示された本発明の明細書及び実施形態の考察から明らかになるである。記述された実施形態の多様な態様及び/又はコンポーネントは、単独又は如何なる組み合わせでも使用することが出来る。明細書と具体例は典型的なものに過ぎず、本発明の範囲と精神は後続する請求範囲で示される。
【符号の説明】
【0139】
100・・・表示装置
101・・・ファイル情報DB
102・・・キーボード
103・・・ポインティングデバイス
104乃至111・・・各種データベース
112・・・中央処理装置
113・・・プログラムメモリ
114・・・データメモリ

【特許請求の範囲】
【請求項1】
ファイルサーバに保存されている複数のファイルを整理するための支援情報を提示し、前記ファイルサーバの容量削減を支援することを可能にする文書処理装置であって、
前記複数のファイルのファイル名、フォルダ名、ファイルサイズ、及び更新日の情報を含むファイル情報と、ファイルがユーザによって慎重にバックアップされたことを示唆する慎重保存示唆情報と、を格納する記憶デバイスと、
前記ファイル情報に基づいて、前記支援情報を生成し、表示装置を介して前記支援情報を提示するプロセッサと、を有し、
前記プロセッサは、前記複数のファイルのそれぞれについて、前記ファイル情報を前記慎重保存示唆情報と照合することにより、前記複数のファイルのそれぞれが慎重にバックアップされた慎重保存ファイルであるか否か判定し、複数の慎重保存ファイルを前記ファイルサイズ順にソートして、当該ソート結果を前記支援情報として提示することを特徴とする文書処理装置。
【請求項2】
請求項1において、
前記プロセッサは、前記複数のファイルについて、ぞれぞれのファイルの前記ファイル情報を比較することにより、前記複数のファイルに重複して保存された可能性のある重複保存疑義ファイルがあるか否か判定し、複数の重複保存疑義ファイルと前記複数の慎重保存ファイルを前記ファイルサイズ順にソートして、当該ソート結果を前記支援情報として提示することを特徴とする文書処理装置。
【請求項3】
請求項2において、
前記プロセッサは、前記複数のファイルを前記ファイルサイズ順にソートし、当該全ファイルのソート結果を生成し、ユーザの要求に応じて、前記全ファイルのソート結果と前記重複保存疑義ファイル及び前記慎重保存ファイルのソート結果とを比較した情報を前記支援情報として提示することを特徴とする文書処理装置。
【請求項4】
請求項2において、
前記プロセッサは、前記重複保存疑義ファイル及び前記慎重保存ファイルのファイル容量累計を算出し、当該ファイルの容量累計に従って、前記重複保存疑義ファイルと前記慎重保存ファイルのソート結果を前記表示装置に表示することを特徴とする文書処理装置。
【請求項5】
請求項3において、
前記プロセッサは、前記複数のファイルについて、前記ファイルサーバにおけるファイルサイズが上位のファイルの割合及び前記ファイルサーバの全体容量に占める割合のうちどちらか一方の割合の指定に応答して、他方の割合を算出し、指定された割合及び算出された割合を前記支援情報と共に表示することを特徴とする文書処理装置。
【請求項6】
請求項5において、
前記プロセッサは、さらに、ユーザの削除候補表示の指示に応答して、前記全ファイルのソート結果の上位から前記指定割合或いは前記算出割合である前記ファイルサイズが上位のファイルの割合に相当するファイルの前記ファイル情報を表示することを特徴とする文書処理装置。
【請求項7】
文書処理装置を用いて、ファイルサーバに保存されている複数のファイルを整理するための支援情報を提示し、前記ファイルサーバの容量削減を支援することを可能にするファイルサーバ管理支援方法であって、
前記文書処理装置は、前記複数のファイルのファイル名、フォルダ名、ファイルサイズ、及び更新日の情報を含むファイル情報と、ファイルがユーザによって慎重にバックアップされたことを示唆する慎重保存示唆情報と、を格納する記憶デバイスと、前記ファイル情報に基づいて、前記支援情報を生成し、表示装置を介して前記支援情報を提示するプロセッサと、を有し、
前記ファイルサーバ管理支援方法は、
前記プロセッサが、前記複数のファイルのそれぞれについて、前記ファイル情報を前記慎重保存示唆情報と照合するステップと、
前記プロセッサが、前記照合の結果に基づいて、前記複数のファイルのそれぞれが慎重にバックアップされた慎重保存ファイルであるか否か判定するステップと、
前記プロセッサが、前記慎重保存ファイルであるか否か判定するステップにおいて判定された複数の慎重保存ファイルを、前記ファイルサイズ順にソートして、当該ソート結果を前記支援情報として提示するステップと、
を有することを特徴とするファイルサーバ管理支援方法。
【請求項8】
請求項7において、さらに、
前記プロセッサが、前記複数のファイルについて、ぞれぞれのファイルの前記ファイル情報を比較するステップと、
前記プロセッサが、前記比較の結果に基づいて、前記複数のファイルに重複して保存された可能性のある重複保存疑義ファイルがあるか否か判定するステップと、
前記プロセッサが、前記重複保存疑義ファイルがあるか否か判定するステップにおいて判定された複数の重複保存疑義ファイルと、前記複数の慎重保存ファイルと、を前記ファイルサイズ順にソートして、当該ソート結果を前記支援情報として提示するステップと、
を有することを特徴とするファイルサーバ管理支援方法。
【請求項9】
請求項8において、さらに、
前記プロセッサが、前記複数のファイルを前記ファイルサイズ順にソートし、当該全ファイルのソート結果を生成するステップと、
前記プロセッサが、ユーザの要求に応じて、前記全ファイルのソート結果と前記重複保存疑義ファイル及び前記慎重保存ファイルのソート結果とを比較した情報を、前記支援情報として提示するステップと、
を有することを特徴とするファイルサーバ管理支援方法。
【請求項10】
請求項8において、さらに、
前記プロセッサが、前記重複保存疑義ファイル及び前記慎重保存ファイルのファイル容量累計を算出するステップと、
前記プロセッサが、前記ファイルの容量累計に従って、前記重複保存疑義ファイルと前記慎重保存ファイルのソート結果を前記表示装置に表示するステップと、
を有することを特徴とするファイルサーバ管理支援方法。
【請求項11】
請求項9において、さらに、
前記プロセッサが、前記複数のファイルについて、前記ファイルサーバにおけるファイルサイズが上位のファイルの割合及び前記ファイルサーバの全体容量に占める割合のうちどちらか一方の割合の指定に応答して、他方の割合を算出するステップと、
前記プロセッサが、前記指定された割合及び前記算出された割合を前記支援情報と共に表示するステップと、
を有することを特徴とするファイルサーバ管理支援方法。
【請求項12】
請求項11において、さらに、
前記プロセッサが、ユーザの削除候補表示の指示に応答して、前記全ファイルのソート結果の上位から前記指定割合或いは前記算出割合である前記ファイルサイズが上位のファイルの割合に相当するファイルの前記ファイル情報を表示するステップを有することを特徴とするファイルサーバ管理支援方法。
【請求項13】
文書処理装置を用いて、ファイルサーバに保存されている複数のファイルを整理するための支援情報を提示し、前記ファイルサーバの容量削減を支援することを可能にするファイルサーバ管理支援プログラムであって、
前記文書処理装置は、前記複数のファイルのファイル名、フォルダ名、ファイルサイズ、及び更新日の情報を含むファイル情報と、ファイルがユーザによって慎重にバックアップされたことを示唆する慎重保存示唆情報と、を格納する記憶デバイスと、前記ファイル情報に基づいて、前記支援情報を生成し、表示装置を介して前記支援情報を提示するプロセッサと、を有し、
前記ファイルサーバ管理支援プログラムは、前記プロセッサに、
前記複数のファイルのそれぞれについて、前記ファイル情報を前記慎重保存示唆情報と照合する処理と、
前記照合の結果に基づいて、前記複数のファイルのそれぞれが慎重にバックアップされた慎重保存ファイルであるか否か判定する処理と、
前記慎重保存ファイルであるか否か判定するステップにおいて判定された複数の慎重保存ファイルを、前記ファイルサイズ順にソートして、当該ソート結果を前記支援情報として提示する処理と、
を実行させることを特徴とするファイルサーバ管理支援プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate


【公開番号】特開2012−174210(P2012−174210A)
【公開日】平成24年9月10日(2012.9.10)
【国際特許分類】
【出願番号】特願2011−38590(P2011−38590)
【出願日】平成23年2月24日(2011.2.24)
【出願人】(000233055)株式会社日立ソリューションズ (1,610)
【Fターム(参考)】