説明

ファイル分類装置

【課題】既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することが可能なファイル分類装置を提供すること。
【解決手段】ファイル分類装置100は、ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する分類規則推定部101を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ファイルをディレクトリに分類するファイル分類装置に関する。
【背景技術】
【0002】
ファイルをディレクトリに分類するファイル分類装置が知られている。この種のファイル分類装置の一つとして特許文献1に記載のファイル分類装置は、ユーザにより入力された分類規則を受け付ける。分類規則は、ファイルが格納されるべきディレクトリを特定するための情報である。
【0003】
ファイル分類装置は、受け付けられた分類規則に基づいて、ファイルが格納されるべきディレクトリを特定し、当該ファイルを特定されたディレクトリへ格納する。これによれば、ユーザは、当該ユーザが希望するファイルへ容易にアクセスすることができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−199103号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、複数のユーザが比較的多数のファイルをディレクトリに既に分類した場合を想定する。この場合において、上記複数のユーザによって実行された分類の基となった分類規則に基づいて、上記ファイル分類装置を用いることにより、未分類のファイルを分類するためには、ユーザが分類規則を適切に入力する必要があった。
【0006】
従って、ユーザにより適切な分類規則が入力されなかった場合、上記ファイル分類装置は、既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができない。即ち、上記ファイル分類装置においては、既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができない虞があった。
【0007】
このため、本発明の目的は、上述した課題である「既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができない場合が生じること」を解決することが可能なファイル分類装置を提供することにある。
【課題を解決するための手段】
【0008】
かかる目的を達成するため本発明の一形態であるファイル分類装置は、
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する分類規則推定手段を備える。
【0009】
また、本発明の他の形態であるファイル分類方法は、
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する方法である。
【0010】
また、本発明の他の形態であるファイル分類プログラムは、
情報処理装置に、
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する、処理を実行させるためのプログラムである。
【発明の効果】
【0011】
本発明は、以上のように構成されることにより、既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができる。
【図面の簡単な説明】
【0012】
【図1】本発明の第1実施形態に係るファイル分類装置の機能の概略を表すブロック図である。
【図2】本発明の第1実施形態に係るファイル分類装置が、分類規則を推定するために実行するプログラムを示したフローチャートである。
【図3】本発明の第1実施形態に係るファイル分類装置が、ファイルをディレクトリに格納するために実行するプログラムを示したフローチャートである。
【図4】本発明の第1実施形態に係るファイル分類装置が出力するディレクトリの一覧を概念的に示した説明図である。
【図5】本発明の第1実施形態に係るファイル分類装置が備える記憶装置において構築されたファイルシステムの一例を概念的に示した説明図である。
【図6】本発明の第1実施形態に係るファイル分類装置が備える記憶装置に記憶されているファイルが有するファイル情報の一例を示したテーブルである。
【図7】本発明の第1実施形態に係るファイル分類装置が推定した分類規則の一例を概念的に示した説明図である。
【図8】本発明の第1実施形態に係るファイル分類装置が備える記憶装置に記憶されている分類規則の一例を示したテーブルである。
【図9】本発明の第2実施形態に係るファイル分類装置の機能の概略を表すブロック図である。
【発明を実施するための形態】
【0013】
以下、本発明に係る、ファイル分類装置、ファイル分類方法、及び、ファイル分類プログラム、の各実施形態について図1〜図9を参照しながら説明する。
【0014】
<第1実施形態>
(構成)
図1に示したように、第1実施形態に係るファイル分類装置10は、情報処理装置(本例では、サーバ装置)である。なお、ファイル分類装置10は、パーソナル・コンピュータ、携帯電話端末、PHS(Personal Handyphone System)、PDA(Personal Data Assistance、Personal Digital Assistant)、スマートフォン、カーナビゲーション端末、又は、ゲーム端末等であってもよい。
【0015】
ファイル分類装置10は、図示しない中央処理装置(CPU;Central Processing Unit)、記憶装置(メモリ及びハードディスク駆動装置(HDD;Hard Disk Drive))、入力装置(キーボード、及び、マウス等)、及び、出力装置(ディスプレイ等)を備える。ファイル分類装置10は、記憶装置に記憶されているプログラムをCPUが実行することにより、後述する機能を実現するように構成されている。
【0016】
(機能)
図1は、上記のように構成されたファイル分類装置10の機能を表すブロック図である。
ファイル分類装置10の機能は、ファイル格納部(ファイル格納手段)11と、ディレクトリレコメンド制御部12と、分類規則記憶部13と、ファイル受付部(ファイル受付手段)14と、ディレクトリ一覧出力部(ディレクトリ一覧出力手段)15と、ディレクトリ特定情報受付部(ディレクトリ特定情報受付手段)16と、を含む。
【0017】
ファイル格納部11は、ファイルを記憶装置に記憶させる。本例では、ファイルは、コンテンツ(例えば、文書、映像、及び、音声等)を表すデータにより構成される。また、記憶装置においては、ファイルシステムが構築されている。従って、ファイル格納部11は、ファイルをディレクトリ(フォルダとも呼ばれる)に格納するように当該ファイルを記憶装置に記憶させる。
【0018】
ディレクトリレコメンド制御部12は、分類規則推定部(分類規則推定手段)12aと、ディレクトリ選択部(ディレクトリ選択手段)12bと、を含む。
【0019】
分類規則推定部12aは、ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する。
【0020】
ファイル情報は、ファイルの種類を表す種別情報、ファイルが含む文字列、ファイルの属性を表す属性情報が含む文字列、ファイルを識別するためのファイル識別情報、ファイルの重要度、ファイルの活用度、及び、ファイルの属性を表す属性情報が含む日時の少なくとも1つを含む。
【0021】
本例では、種別情報は、ファイルの拡張子である。また、ファイルが含む文字列は、例えば、ファイルを構成するデータが表すコンテンツとしての文書に含まれる文字列である。属性情報は、ファイルのタイトル、ファイルの名称(ファイル名)、ファイルを作成したユーザ名、ファイルが作成された日時、ファイルが更新された日時、ファイル識別情報、ファイルの重要度、ファイルの活用度、及び、ファイルに付与されたタグ等である。ファイルの重要度は、ファイルが重要である程度を表す数値である。ファイルの活用度は、ファイルが活用される程度を表す数値である。
【0022】
分類規則推定部12aは、ファイルシステムにて配置されているディレクトリのそれぞれに対して、ファイル情報毎の共通度を算出する。共通度は、上記ディレクトリに格納されているファイルの総数に対する、当該ディレクトリに格納され且つ上記ファイル情報を有するファイルの数の割合である。
【0023】
分類規則推定部12aは、算出された共通度が予め設定された閾値共通度よりも大きい(本例では、閾値共通度以上である)場合、当該ファイル情報を当該ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を分類規則として推定する。
【0024】
更に、分類規則推定部12aは、分類規則の推定を、下位の階層(下層)に位置しているディレクトリから順に実行する。そして、分類規則推定部12aは、分類規則を推定する対象であるディレクトリ(対象ディレクトリ)が、他のディレクトリ(子ディレクトリ)を格納している場合、子ディレクトリに対して推定された分類規則に基づいて対象ディレクトリ(親ディレクトリ)に対する分類規則を推定する。
【0025】
具体的には、分類規則推定部12aは、子ディレクトリに対して推定された分類規則により定められるファイル情報を有するファイルのすべてが共通して有するファイル情報を、親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を分類規則として推定する。
【0026】
これによれば、子ディレクトリに対して推定された分類規則により定められるファイル情報を有するファイルは、親ディレクトリに対して推定された分類規則により定められるファイル情報も有している。従って、ディレクトリが階層構造(ツリー構造)を有する場合であっても、既に実行された分類の基となった分類規則を反映しながら、ファイルを適切に分類することができる。
【0027】
分類規則記憶部13は、分類規則推定部12aにより推定された分類規則を記憶する。
ファイル受付部14は、ユーザにより入力されたファイルを受け付ける。なお、ファイル受付部14は、他の情報処理装置からファイルを受信することにより、当該ファイルを受け付けるように構成されていてもよい。また、ファイル受付部14は、記憶媒体からファイルを読み出すことにより、当該ファイルを受け付けるように構成されていてもよい。
【0028】
ディレクトリ選択部12bは、ファイル受付部14により受け付けられたファイルが有するファイル情報と、分類規則記憶部13に記憶されている分類規則と、に基づいて、当該ファイルを格納すべきディレクトリを選択する。
【0029】
ディレクトリ一覧出力部15は、ディレクトリ選択部12bにより選択されたディレクトリの一覧を、出力装置を介して出力する(本例では、ディスプレイに表示させる)。
【0030】
ディレクトリ特定情報受付部16は、ディレクトリ一覧出力部15により出力されたディレクトリの一覧の中から、ユーザが選択したディレクトリを特定するためのディレクトリ特定情報を受け付ける。
【0031】
ファイル格納部11は、ディレクトリ特定情報受付部16により受け付けられたディレクトリ特定情報により特定されるディレクトリに、ファイル受付部14により受け付けられたファイルを格納する。
【0032】
(作動)
次に、上述したファイル分類装置10の作動について説明する。
ファイル分類装置10は、図2にフローチャートにより示したプログラムを、予め設定されたタイミング(例えば、ファイル分類装置10を使用するユーザが相対的に少ない深夜のある時刻)にて実行するようになっている。
【0033】
ファイル分類装置10は、上記プログラムの処理を開始すると、先ず、ディレクトリ構成を取得する(ステップS101)。ディレクトリ構成は、ファイルシステムにおけるすべてのディレクトリのそれぞれに対する、当該ディレクトリを特定するための情報、及び、当該ディレクトリに格納されているディレクトリ(子ディレクトリ)を特定するための情報を含む情報である。
【0034】
本例では、ディレクトリ構成は、各ディレクトリに対する、当該ディレクトリの名称(ディレクトリ名)、当該ディレクトリのパス(パス)、及び、当該ディレクトリに格納されている子ディレクトリの名称(子ディレクトリ名)を含む。
【0035】
そして、ファイル分類装置10は、取得されたディレクトリ構成を記憶装置に記憶させる(ステップS102)。
【0036】
次いで、ファイル分類装置10は、記憶されているディレクトリ構成に含まれるディレクトリのそれぞれを、下層から、1つずつ順に処理対象とするループ処理(ステップS103〜ステップS107)を実行する。
【0037】
ループ処理において、先ず、ファイル分類装置10は、処理対象となるディレクトリ(処理対象ディレクトリ)に対して、ファイル情報毎の共通度を算出する(ステップS104)。
【0038】
次いで、ファイル分類装置10は、算出された共通度が予め設定された閾値共通度よりも大きい場合、当該共通度を算出する基となったファイル情報を処理対象ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を分類規則として推定する(ステップS105)。
【0039】
そして、ファイル分類装置10は、推定された分類規則を処理対象ディレクトリと対応付けて記憶装置に記憶させる(ステップS106)。
【0040】
そして、ファイル分類装置10は、記憶されているディレクトリ構成に含まれるディレクトリのすべてに対して、上記ループ処理(ステップS103〜ステップS107)を実行した後、図2のプログラムの処理を終了する。
【0041】
ここで、ステップS104〜ステップS106の処理の詳細について説明する。
本例では、ファイル情報は、第1のファイル情報、第2のファイル情報、第3のファイル情報、及び、第4のファイル情報からなる。
【0042】
第1のファイル情報は、ファイルの種類を表す種別情報である。
第2のファイル情報は、ファイルが含む文字列、及び、ファイルの属性を表す属性情報が含む文字列である。
第3のファイル情報は、ファイルを識別するための識別情報(本例では、数字のみからなる文字列)、ファイルの重要度、及び、ファイルの活用度である。
第4のファイル情報は、ファイルの属性を表す属性情報が含む日時である。
【0043】
ファイル分類装置10は、第1のファイル情報に対して、下記のように分類規則を推定する。
具体的には、ファイル分類装置10は、処理対象ディレクトリに直接に格納されている(処理対象ディレクトリの直下に配置された)ファイルのそれぞれの拡張子を取得する。そして、ファイル分類装置10は、拡張子毎に取得されたファイルの数を計数する。
【0044】
次いで、ファイル分類装置10は、計数された数の最大値の、処理対象ディレクトリに直接に格納されているファイルの総数に対する割合(本例では、百分率にて表した値)を第1のファイル情報に対する共通度として算出する。
【0045】
そして、ファイル分類装置10は、算出された共通度が閾値共通度(例えば、75%)よりも大きい(本例では、閾値共通度以上である)場合、計数された数が最大である拡張子を、処理対象ディレクトリに格納されるファイルが有するべき拡張子として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
【0046】
例えば、10個のファイルが、処理対象ディレクトリに直接に格納されている場合において、9個のファイルの拡張子が「pdf」であり、1個のファイルの拡張子が「xls」である場合を想定する。
【0047】
この場合、ファイル分類装置10は、拡張子が「pdf」であるファイルの数として、9を計数し、拡張子が「xls」であるファイルの数として1を計数する。そして、ファイル分類装置10は、共通度として90%を算出する。
【0048】
この例においては、算出された共通度は、閾値共通度以上である。従って、ファイル分類装置10は、「pdf」を、処理対象ディレクトリに格納されるファイルが有するべき拡張子として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
このようにして、ファイル分類装置10は、第1のファイル情報に対して分類規則を推定する。
【0049】
次に、ファイル分類装置10は、第2のファイル情報に対して、下記のように分類規則を推定する。
具体的には、ファイル分類装置10は、処理対象ディレクトリに直接に格納されているファイルのそれぞれが含む文字列、及び、処理対象ディレクトリに直接に格納されているファイルのそれぞれの属性を表す属性情報が含む文字列から、単語を抽出する。
【0050】
そして、ファイル分類装置10は、抽出された単語毎に、処理対象ディレクトリに直接に格納されているファイルのうちの、当該単語を含む、又は、当該単語を属性情報が含む、ファイルの数を計数する。
【0051】
次いで、ファイル分類装置10は、抽出された単語毎に、計数された数の、処理対象ディレクトリに直接に格納されているファイルの総数に対する割合を第2のファイル情報に対する共通度として算出する。
【0052】
そして、ファイル分類装置10は、算出された共通度が閾値共通度(例えば、75%)よりも大きい(本例では、閾値共通度以上である)単語のすべてを、処理対象ディレクトリに格納されるファイルが含む文字列、又は、当該ファイルの属性を表す属性情報が含む文字列、が含むべき単語として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
【0053】
例えば、属性情報として「AAA仕様書」というタイトルを含むファイルと、属性情報として「BBB仕様書」というタイトルを含むファイルと、が処理対象ディレクトリに直接に格納されている場合を想定する。
【0054】
この場合、ファイル分類装置10は、「AAA」、「仕様書」、及び、「BBB」を単語として抽出する。そして、ファイル分類装置10は、「AAA」を含む、又は、「AAA」を属性情報が含む、ファイルの数として1を計数する。
【0055】
同様に、ファイル分類装置10は、「仕様書」を含む、又は、「仕様書」を属性情報が含む、ファイルの数として2を計数する。同様に、ファイル分類装置10は、「BBB」を含む、又は、「BBB」を属性情報が含む、ファイルの数として1を計数する。
【0056】
そして、ファイル分類装置10は、「AAA」に対する共通度として50%を算出し、「仕様書」に対する共通度として100%を算出し、「BBB」に対する共通度として50%を算出する。
【0057】
この例においては、「仕様書」に対して算出された共通度のみが、閾値共通度以上である。従って、ファイル分類装置10は、「仕様書」を、処理対象ディレクトリに格納されるファイルが含む文字列、又は、当該ファイルの属性を表す属性情報が含む文字列、が含むべき単語として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
このようにして、ファイル分類装置10は、第2のファイル情報に対して分類規則を推定する。
【0058】
なお、ファイルが含む文字列からすべての単語を抽出した場合、ファイル分類装置10の処理負荷が過大となる虞がある。そこで、ファイル分類装置10は、他の方法を用いて、第2のファイル情報に対して分類規則を推定するように構成されていてもよい。
【0059】
例えば、ファイル分類装置10が全文検索を実行するように構成されている場合、ファイル分類装置10は、検索単語と、検索結果と、を対応付けて記憶するように構成されていてもよい。全文検索は、ユーザにより入力された検索単語を含むファイルを抽出する処理である。検索結果は、検索単語を含むファイルの一覧を含む。
【0060】
この場合、ファイル分類装置10は、処理対象ディレクトリに直接に格納されているファイルを含む検索結果と対応付けて記憶されている検索単語を、ファイルが含む文字列から抽出された単語として用いる。
【0061】
更に、ファイル分類装置10は、処理対象ディレクトリに直接に格納されているファイルのうちの、検索結果に含まれるファイルの数の、処理対象ディレクトリに直接に格納されているファイルの総数に対する割合を第2のファイル情報に対する共通度として算出する。
このような構成によれば、ファイル分類装置10の処理負荷が過大となることを回避することができる。
【0062】
また、ファイル分類装置10は、第3のファイル情報に対して、下記のように分類規則を推定する。
具体的には、ファイル分類装置10は、処理対象ディレクトリに直接に格納されているファイルのそれぞれの属性を表す属性情報が含む、ファイル識別情報、ファイルの重要度、及び、ファイルの活用度を抽出する。
【0063】
そして、ファイル分類装置10は、抽出された、ファイル識別情報、ファイルの重要度、及び、ファイルの活用度のそれぞれに対して、最小値、及び、最大値を取得する(即ち、値の範囲を特定する)。更に、ファイル分類装置10は、抽出された、ファイル識別情報、ファイルの重要度、及び、ファイルの活用度のそれぞれに対して、抽出されたファイルの数を計数する。
【0064】
次いで、ファイル分類装置10は、計数された数の最大値の、処理対象ディレクトリに直接に格納されているファイルの総数に対する割合(本例では、百分率にて表した値)を第3のファイル情報に対する共通度として算出する。
【0065】
そして、ファイル分類装置10は、算出された共通度が閾値共通度(例えば、75%)よりも大きい(本例では、閾値共通度以上である)場合、計数された数が最大である情報(本例では、ファイル識別情報、ファイルの重要度、又は、ファイルの活用度)に対して特定された範囲内の値を、処理対象ディレクトリに格納されるファイルが有するべき当該情報の値として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
【0066】
例えば、10個のファイルが、処理対象ディレクトリに直接に格納されている場合を想定する。この場合において、ファイルの重要度として、「4」、及び、「8」が抽出され、ファイルの活用度として「50」が抽出され、ファイル識別情報として、「00011」、「00012」、「00013」、「00014」、「00015」、「00022」、「00024」、「00025」、及び、「00026」が抽出された場合を想定する。
【0067】
この場合、ファイル分類装置10は、ファイルの重要度に対する値の範囲として「4〜8」を特定し、ファイルの活用度に対する値の範囲として「50〜50」を特定し、ファイル識別情報に対する値の範囲として「00011〜00026」を特定する。
【0068】
そして、ファイル分類装置10は、ファイルの重要度に対して抽出されたファイルの数として2を計数し、ファイルの活用度に対して抽出されたファイルの数として1を計数し、ファイル識別情報に対して抽出されたファイルの数として9を計数する。次いで、ファイル分類装置10は、共通度として90%を算出する。
【0069】
この例においては、算出された共通度は、閾値共通度以上である。従って、ファイル分類装置10は、ファイル識別情報に対して特定された範囲である「00011〜00026」内の値を、処理対象ディレクトリに格納されるファイルが有するべきファイル識別情報の値として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
このようにして、ファイル分類装置10は、第3のファイル情報に対して分類規則を推定する。
【0070】
また、ファイル分類装置10は、第4のファイル情報に対して、下記のように分類規則を推定する。
具体的には、ファイル分類装置10は、処理対象ディレクトリに直接に格納されているファイルのそれぞれの属性を表す属性情報が含む日時(を表す情報)を抽出する。ファイル分類装置10は、抽出された日時を形式毎に分類する。
【0071】
本例では、日時の形式は、第1の形式〜第4の形式を含む。
第1の形式は、8桁の数字の列である。第1の形式は、最上位の4桁が西暦年を表し、西暦年の下位側に隣接する2桁が月を表し、最下位の2桁が日を表す。
第2の形式は、6桁の数字の列である。第2の形式は、最上位の4桁が西暦年を表し、最下位の2桁が月を表す。
第3の形式は、4桁の数字の列である。第3の形式は、4桁が西暦年を表す。
第4の形式は、4桁の数字の列である。第4の形式は、最上位の2桁が月を表し、最下位の2桁が日を表す。
【0072】
そして、ファイル分類装置10は、分類された形式毎に、抽出された日時の、最も古い日時、及び、最も新しい日時を取得する(即ち、日時の範囲を特定する)。更に、ファイル分類装置10は、分類された形式毎に、日時が抽出されたファイルの数を計数する。
【0073】
次いで、ファイル分類装置10は、計数された数の最大値の、処理対象ディレクトリに直接に格納されているファイルの総数に対する割合(本例では、百分率にて表した値)を第4のファイル情報に対する共通度として算出する。
【0074】
そして、ファイル分類装置10は、算出された共通度が閾値共通度(例えば、75%)よりも大きい(本例では、閾値共通度以上である)場合、計数された数が最大である形式を有する日時に対して特定された範囲内の日時を、処理対象ディレクトリに格納されるファイルが有するべき当該形式の日時として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
【0075】
例えば、15個のファイルが、処理対象ディレクトリに直接に格納されている場合を想定する。この場合において、第1の形式を有する日時として、1つの「20100824」が抽出され、第1の形式を有する日時として、1つの「20100703」が抽出され、第3の形式を有する日時として、7つの「2010」が抽出され、第3の形式を有する日時として、5つの「2009」が抽出され、第4の形式を有する日時として、1つの「0824」が抽出された場合を想定する。
【0076】
この場合、ファイル分類装置10は、第1の形式に対する日時の範囲として「20100703〜20100824」を特定し、第3の形式に対する日時の範囲として「2009〜2010」を特定し、第4の形式に対する日時の範囲として「0824〜0824」を特定する。
【0077】
そして、ファイル分類装置10は、第1の形式に対して日時が抽出されたファイルの数として2を計数し、第3の形式に対して日時が抽出されたファイルの数として12を計数し、第4の形式に対して日時が抽出されたファイルの数として1を計数する。次いで、ファイル分類装置10は、共通度として80%を算出する。
【0078】
この例においては、算出された共通度は、閾値共通度以上である。従って、ファイル分類装置10は、第3の形式を有する日時に対して特定された範囲である「2009〜2010」内の日時を、処理対象ディレクトリに格納されるファイルが有するべき第3の形式の日時として定める規則を、処理対象ディレクトリに対する分類規則として推定する。
このようにして、ファイル分類装置10は、第4のファイル情報に対して分類規則を推定する。
【0079】
更に、ファイル分類装置10は、処理対象ディレクトリにディレクトリ(子ディレクトリ)が格納されていない場合、処理対象ディレクトリに対して推定された分類規則を記憶装置に記憶させる。
【0080】
一方、ファイル分類装置10は、処理対象ディレクトリに子ディレクトリが格納されている場合、子ディレクトリに対して推定された分類規則と、処理対象ディレクトリ(親ディレクトリ)に対して推定された分類規則と、の間で共通する部分のみを処理対象ディレクトリに対する分類規則として再び推定する。
【0081】
例えば、処理対象ディレクトリが第1の子ディレクトリと第2の子ディレクトリを格納している場合を想定する。更に、第1の子ディレクトリに対して、「pdf」を、ファイルが有するべき拡張子として定めるとともに、「仕様書」を、ファイルが含む文字列が含むべき単語として定める分類規則が推定された場合を想定する。加えて、第2の子ディレクトリに対して、「xls」を、ファイルが有するべき拡張子として定めるとともに、「仕様書」を、ファイルが含む文字列が含むべき単語として定める分類規則が推定された場合を想定する。
【0082】
更に、処理対象ディレクトリに対して、「pdf」を、ファイルが有するべき拡張子として定め、且つ、「仕様書」を、ファイルが含む文字列が含むべき単語として定め、
且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める分類規則が推定された場合を想定する。
【0083】
この場合、ファイル分類装置10は、「仕様書」を、ファイルが含む文字列が含むべき単語として定める規則を、処理対象ディレクトリに対する分類規則として再び推定する。
【0084】
このように、ファイル分類装置10は、処理対象ディレクトリに子ディレクトリが格納されている場合、子ディレクトリに対して推定された分類規則により定められるファイル情報を有するファイルのすべてが共通して有するファイル情報を、親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を分類規則として推定する。
そして、ファイル分類装置10は、処理対象ディレクトリに対して推定された分類規則を記憶装置に記憶させる。
【0085】
このようにして、より上位の階層に位置するディレクトリほど、分類規則に含まれる規則の数が少なくなる。これにより、より下位の階層に位置するディレクトリに、より多くのファイルを格納させることができる。
【0086】
一方、ファイル分類装置10は、図3にフローチャートにより示したプログラムを実行するようになっている。
ファイル分類装置10は、上記プログラムの処理を開始すると、先ず、ユーザにより入力されたファイルを受け付けるまで待機する(ステップS201)。そして、ファイル分類装置10がファイルを受け付けると、ファイル分類装置10は、「Yes」と判定してステップS202へ進み、ファイルシステムにおけるすべてのディレクトリのそれぞれに対して適合度を算出する。
【0087】
適合度は、受け付けられたファイルと、分類規則と、が適合している程度を表す。本例では、ファイル分類装置10は、分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報の数を、適合度として算出する。
【0088】
具体的には、ファイル分類装置10は、分類規則により定められる第1のファイル情報としての拡張子と、受け付けられたファイルの拡張子と、が一致している場合、分類規則により定められる第1のファイル情報を、受け付けられたファイルが有すると判定する。
【0089】
また、ファイル分類装置10は、分類規則により定められる第2のファイル情報としての単語のすべてを、受け付けられたファイルが含む文字列、又は、当該ファイルの属性を表す属性情報が含む文字列、が含む場合、分類規則により定められる第2のファイル情報を、受け付けられたファイルが有すると判定する。
【0090】
また、ファイル分類装置10は、分類規則により定められる第3のファイル情報としての、特定の情報(本例では、ファイル識別情報、ファイルの重要度、又は、ファイルの活用度)の範囲に、受け付けられたファイルの当該情報の値が含まれる場合、分類規則により定められる第3のファイル情報を、受け付けられたファイルが有すると判定する。
【0091】
なお、ファイル分類装置10は、分類規則により定められる第3のファイル情報としての、特定の情報の範囲の境界の近傍に、受け付けられたファイルの当該情報の値が存在する場合にも、分類規則により定められる第3のファイル情報を、受け付けられたファイルが有すると判定するように構成されていてもよい。この場合、例えば、ファイル分類装置10は、範囲の境界の近傍を、当該範囲に隣接するとともに、当該範囲の10%の領域に定めるように構成されていてもよい。
【0092】
また、ファイル分類装置10は、分類規則により定められる第4のファイル情報としての、特定の形式を有する日時の範囲に、受け付けられたファイルの属性を表す属性情報が含む当該形式の日時が含まれる場合、分類規則により定められる第4のファイル情報を、受け付けられたファイルが有すると判定する。
【0093】
このようにして、ファイル分類装置10は、分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報の数を、適合度として算出する(ステップS202)。
【0094】
そして、ファイル分類装置10は、算出された適合度に基づいてディレクトリを選択する(ステップS203)。具体的には、ファイル分類装置10は、算出された適合度が多いディレクトリから順に、予め設定された候補数だけディレクトリを選択する。なお、ファイル分類装置10は、予め設定された閾値適合度よりも大きい適合度が算出されたディレクトリを選択するように構成されていてもよい。
【0095】
なお、ファイル分類装置10は、算出された適合度が同一である場合、より下位の階層に位置するディレクトリを優先して選択するように構成されていてもよい。これによれば、ファイルがより下位の階層に位置するディレクトリに格納される可能性を高めることができる。
【0096】
また、ファイル分類装置10は、分類規則に対して予め順位を付与し、付与された順位がより上位である分類規則に対するディレクトリを優先して選択するように構成されていてもよい。順位は、ユーザにより設定されていてもよいし、算出された共通度に基づいてファイル分類装置10により設定されていてもよい。
【0097】
次いで、ファイル分類装置10は、図4に示したように、選択されたディレクトリの一覧を出力装置を介して出力する(ステップS204)。そして、ファイル分類装置10は、ユーザにより入力されるディレクトリ特定情報を受け付けるまで待機する(ステップS205)。
【0098】
ユーザが、出力されたディレクトリの一覧の中から1つのディレクトリを選択し、当該ディレクトリを特定するためのディレクトリ特定情報をファイル分類装置10に入力すると、ファイル分類装置10は、ディレクトリ特定情報を受け付ける。
【0099】
そして、ファイル分類装置10は、「Yes」と判定してステップS206へ進み、受け付けられたディレクトリ特定情報により特定されるディレクトリに、ステップS201にて受け付けられたファイルを格納する。その後、ファイル分類装置10は、ステップS201へ戻り、ステップS201〜ステップS206の処理を繰り返し実行する。
【0100】
(具体的な作動例)
次に、上述したファイル分類装置10のより具体的な作動例について説明する。
いま、図5に示したように、ディレクトリ#1にディレクトリ#3及びディレクトリ#4が格納され、ディレクトリ#2にファイル#8及びファイル#9が格納され、ディレクトリ#3にディレクトリ#5及びディレクトリ#6が格納され、ディレクトリ#4にファイル#6及びファイル#7が格納され、ディレクトリ#5にファイル#1〜ファイル#3が格納され、ディレクトリ#6にファイル#4及びファイル#5が格納されている場合を想定する。
【0101】
更に、図6に示したように、ファイル#1〜ファイル#9がファイル情報を有している場合を想定する。具体的には、ファイル#1は、ファイルの拡張子が「pdf」であり、属性情報が含むタイトルが「AAA仕様書V1」であり、作成された日時(作成日時)が「2009」であり、ファイル識別情報が「8」であり、活用度が「1」である。ファイル#2〜ファイル#9も同様である。
【0102】
先ず、ファイル分類装置10は、ディレクトリ#5に対して分類規則を推定する。ディレクトリ#5に格納されているファイルは、ファイル#1〜ファイル#3である。本例では、ファイル分類装置10は、ディレクトリ#5に対して、「pdf」を、ファイルが有するべき拡張子として定め、且つ、「AAA」及び「仕様書」を、属性情報が含む文字列が含むべき単語として定め、且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める分類規則を推定する。
【0103】
次に、ファイル分類装置10は、ディレクトリ#6に対して分類規則を推定する。ディレクトリ#6に格納されているファイルは、ファイル#4及びファイル#5である。本例では、ファイル分類装置10は、ディレクトリ#6に対して、「pdf」を、ファイルが有するべき拡張子として定め、且つ、「AAA」及び「設計書」を、属性情報が含む文字列が含むべき単語として定め、且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める分類規則を推定する。
【0104】
次に、ファイル分類装置10は、ディレクトリ#3に対して分類規則を推定する。ディレクトリ#3に格納されているファイルは存在しない。従って、本例では、ファイル分類装置10は、ディレクトリ#3に格納されているディレクトリに対して推定された分類規則に基づいて、ディレクトリ#3に対する分類規則を推定する。
【0105】
本例では、ディレクトリ#5に対して推定された分類規則と、ディレクトリ#6に対して推定された分類規則と、の間で共通する部分は、「pdf」を、ファイルが有するべき拡張子として定め、且つ、「AAA」を、属性情報が含む文字列が含むべき単語として定め、且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める規則である。従って、ファイル分類装置10は、この規則を、ディレクトリ#3に対する分類規則として推定する。
【0106】
次に、ファイル分類装置10は、ディレクトリ#4に対して分類規則を推定する。ディレクトリ#4に格納されているファイルは、ファイル#6及びファイル#7である。本例では、ファイル分類装置10は、ディレクトリ#4に対して、「pdf」を、ファイルが有するべき拡張子として定め、且つ、「BBB」を、属性情報が含む文字列が含むべき単語として定め、且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める分類規則を推定する。
【0107】
次に、ファイル分類装置10は、ディレクトリ#1に対して分類規則を推定する。ディレクトリ#1に格納されているファイルは存在しない。従って、本例では、ファイル分類装置10は、ディレクトリ#1に格納されているディレクトリに対して推定された分類規則に基づいて、ディレクトリ#1に対する分類規則を推定する。
【0108】
本例では、ディレクトリ#3に対して推定された分類規則と、ディレクトリ#4に対して推定された分類規則と、の間で共通する部分は、「pdf」を、ファイルが有するべき拡張子として定め、且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める規則である。従って、ファイル分類装置10は、この規則を、ディレクトリ#1に対する分類規則として推定する。
【0109】
次に、ファイル分類装置10は、ディレクトリ#2に対して分類規則を推定する。ディレクトリ#2に格納されているファイルは、ファイル#8及びファイル#9である。本例では、ファイル分類装置10は、ディレクトリ#2に対して、「xls」を、ファイルが有するべき拡張子として定め、且つ、「2009〜2010」内の日時を、ファイルが有するべき第3の形式の日時として定める分類規則を推定する。
【0110】
このようにして、ファイル分類装置10は、図7に示したように、各ディレクトリに対して分類規則を推定する。そして、ファイル分類装置10は、図8に示したように、ディレクトリと、当該ディレクトリに対して推定された分類規則と、を対応付けて記憶装置に記憶させる。
【0111】
その後、ファイル分類装置10が、ユーザにより入力されたファイルを受け付けた場合を想定する。更に、このファイルが、ファイルの拡張子が「pdf」であり、属性情報が含むタイトルが「AAA仕様書V3」であり、作成日時が「2010」である場合を想定する。
【0112】
この場合、ファイル分類装置10は、各ディレクトリに対する適合度を算出する。ディレクトリ#1に対する分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報は、第1のファイル情報(拡張子)、及び、第4のファイル情報(日時)である。従って、ファイル分類装置10は、ディレクトリ#1に対する適合度として2を算出する。
【0113】
また、ディレクトリ#2に対する分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報は、第4のファイル情報(日時)である。従って、ファイル分類装置10は、ディレクトリ#2に対する適合度として1を算出する。
【0114】
また、ディレクトリ#3に対する分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報は、第1のファイル情報(拡張子)、第2のファイル情報(単語「AAA」)、及び、第4のファイル情報(日時)である。従って、ファイル分類装置10は、ディレクトリ#3に対する適合度として3を算出する。
【0115】
また、ディレクトリ#4に対する分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報は、第1のファイル情報(拡張子)、及び、第4のファイル情報(日時)である。従って、ファイル分類装置10は、ディレクトリ#4に対する適合度として2を算出する。
【0116】
また、ディレクトリ#5に対する分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報は、第1のファイル情報(拡張子)、第2のファイル情報(単語「AAA」、及び、単語「仕様書」)、及び、第4のファイル情報(日時)である。従って、ファイル分類装置10は、ディレクトリ#5に対する適合度として3を算出する。
【0117】
また、ディレクトリ#6に対する分類規則により定められるファイル情報のうちの、受け付けられたファイルが有するファイル情報は、第1のファイル情報(拡張子)、及び、第4のファイル情報(日時)である。従って、ファイル分類装置10は、ディレクトリ#6に対する適合度として2を算出する。
【0118】
従って、適合度が最も大きいディレクトリは、ディレクトリ#3及びディレクトリ#5である。本例では、ファイル分類装置10は、適合度が同一である場合、より下位の階層に位置するディレクトリを優先して選択するように構成される。従って、ファイル分類装置10は、ディレクトリ#3、ディレクトリ#5、ディレクトリ#6、ディレクトリ#4、及び、ディレクトリ#1、をこの順に上から下へ向かって並べたディレクトリの一覧を出力する。
【0119】
その後、ファイル分類装置10は、ディレクトリの一覧からユーザが選択したディレクトリへ、受け付けられたファイルを格納する。
【0120】
以上、説明したように、第1実施形態に係るファイル分類装置10によれば、既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができる。
【0121】
更に、第1実施形態に係るファイル分類装置10は、親ディレクトリとしてのあるディレクトリに格納されている、子ディレクトリとしてのディレクトリに対して推定された分類規則により定められるファイル情報を有するファイルのすべてが共通して有するファイル情報を、当該親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を分類規則として推定する。
【0122】
これによれば、子ディレクトリに対して推定された分類規則により定められるファイル情報を有するファイルは、親ディレクトリに対して推定された分類規則により定められるファイル情報も有している。従って、ディレクトリが階層構造(ツリー構造)を有する場合であっても、既に実行された分類の基となった分類規則を反映しながら、ファイルを適切に分類することができる。
【0123】
なお、第1実施形態に係るファイル分類装置10は、ファイル分類装置10が備える記憶装置に構築されているファイルシステムにおいて、既に実行されたファイルの分類の状態に基づいて分類規則を推定するように構成されていた。
【0124】
ところで、第1実施形態の変形例に係るファイル分類装置10は、他の情報処理装置が備える記憶装置に構築されているファイルシステムにおけるファイルの分類の状態に基づいて分類規則を推定するように構成されていてもよい。この場合、ファイル分類装置10は、他の情報処理装置からファイルの分類の状態を表す情報を取得するように構成されることが好適である。
【0125】
また、第1実施形態に係るファイル分類装置10は、予め設定されたタイミングにて分類規則を推定するように構成されていたが、ファイルがディレクトリに新たに格納される毎に分類規則を推定し直すように構成されていてもよい。
【0126】
また、第1実施形態に係るファイル分類装置10は、ファイルを格納するディレクトリをユーザに決定させるように構成されていたが、ファイルを格納するディレクトリをファイル分類装置10が決定するように構成されていてもよい。
【0127】
例えば、第1実施形態の変形例に係るファイル分類装置10は、算出された適合度が最大であるディレクトリに、受け付けられたファイルを格納するように構成されていてもよい。また、第1実施形態の変形例に係るファイル分類装置10は、適合度に基づいて選択されたディレクトリンの1つを決定し、決定されたディレクトリにファイルを格納するように構成されていてもよい。
【0128】
なお、第1実施形態に係るファイル分類装置10は、ファイルを受け付けた場合に、当該ファイルを格納すべきディレクトリの一覧を出力するように構成されていた。更に、第1実施形態の変形例に係るファイル分類装置10は、ディレクトリを受け付けた場合に、当該ディレクトリを格納すべきディレクトリの一覧を出力するように構成されていてもよい。
【0129】
この場合、ファイル分類装置10は、受け付けられたディレクトリがファイル及びディレクトリを格納していない場合、受け付けられたディレクトリの属性を表す属性情報と、他のディレクトリに対して推定された分類規則と、に基づいて、当該受け付けられたディレクトリを格納すべきディレクトリを選択するように構成されることが好適である。
【0130】
また、ファイル分類装置10は、受け付けられたディレクトリがファイル、又は、ディレクトリを格納している場合、受け付けられたディレクトリに対して、第1実施形態と同様に分類規則を推定し、推定された分類規則と、他のディレクトリに対して推定された分類規則と、に基づいて、当該受け付けられたディレクトリを格納すべきディレクトリを選択するように構成されることが好適である。
【0131】
<第2実施形態>
次に、本発明の第2実施形態に係るファイル分類装置について図9を参照しながら説明する。
第2実施形態に係るファイル分類装置100は、
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する分類規則推定部(分類規則推定手段)101を備える。
【0132】
これによれば、既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができる。
【0133】
以上、上記実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成及び詳細に、本願発明の範囲内において当業者が理解し得る様々な変更をすることができる。
【0134】
なお、上記各実施形態においてファイル分類装置の各機能は、CPUがプログラム(ソフトウェア)を実行することにより実現されていたが、回路等のハードウェアにより実現されていてもよい。
【0135】
また、上記各実施形態においてプログラムは、記憶装置に記憶されていたが、コンピュータが読み取り可能な記録媒体に記憶されていてもよい。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。
【0136】
また、上記実施形態の他の変形例として、上述した実施形態及び変形例の任意の組み合わせが採用されてもよい。
【0137】
<付記>
上記実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限られない。
【0138】
(付記1)
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する分類規則推定手段を備えるファイル分類装置。
【0139】
これによれば、既に実行された分類の基となった分類規則を、その後のファイルの分類に適切に反映することができる。
【0140】
(付記2)
付記1に記載のファイル分類装置であって、
前記分類規則推定手段は、前記ディレクトリに格納されているファイルの総数に対する、当該ディレクトリに格納され且つあるファイル情報を有するファイルの数の割合である共通度が予め設定された閾値共通度よりも大きい場合、当該ファイル情報を当該ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類装置。
【0141】
(付記3)
付記1又は付記2に記載のファイル分類装置であって、
ファイルを受け付けるファイル受付手段と、
前記受け付けられたファイルが有するファイル情報と、前記推定された分類規則と、に基づいて、当該ファイルを格納すべきディレクトリを選択するディレクトリ選択手段と、
を備えるファイル分類装置。
【0142】
(付記4)
付記3に記載のファイル分類装置であって、
前記受け付けられたファイルを、前記選択されたディレクトリに格納するファイル格納手段を備えるファイル分類装置。
【0143】
(付記5)
付記3に記載のファイル分類装置であって、
前記選択されたディレクトリの一覧を出力するディレクトリ一覧出力手段と、
前記出力されたディレクトリの一覧の中から、ユーザが選択したディレクトリを特定するためのディレクトリ特定情報を受け付けるディレクトリ特定情報受付手段と、
前記受け付けられたディレクトリ特定情報により特定されるディレクトリに、前記受け付けられたファイルを格納するファイル格納手段と、
を備えるファイル分類装置。
【0144】
(付記6)
付記1乃至付記5のいずれかに記載のファイル分類装置であって、
前記分類規則推定手段は、親ディレクトリとしてのあるディレクトリに格納されている、子ディレクトリとしてのディレクトリに対して推定された分類規則により定められる前記ファイル情報を有するファイルのすべてが共通して有するファイル情報を、当該親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類装置。
【0145】
これによれば、子ディレクトリに対して推定された分類規則により定められるファイル情報を有するファイルは、親ディレクトリに対して推定された分類規則により定められるファイル情報も有している。従って、ディレクトリが階層構造(ツリー構造)を有する場合であっても、既に実行された分類の基となった分類規則を反映しながら、ファイルを適切に分類することができる。
【0146】
(付記7)
付記1乃至付記6のいずれかに記載のファイル分類装置であって、
前記ファイル情報は、前記ファイルの種類を表す種別情報、前記ファイルが含む文字列、前記ファイルの属性を表す属性情報が含む文字列、前記ファイルを識別するための識別情報、前記ファイルの重要度、前記ファイルの活用度、及び、前記ファイルの属性を表す属性情報が含む日時の少なくとも1つを含むファイル分類装置。
【0147】
(付記8)
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する、ファイル分類方法。
【0148】
(付記9)
付記8に記載のファイル分類方法であって、
前記ディレクトリに格納されているファイルの総数に対する、当該ディレクトリに格納され且つあるファイル情報を有するファイルの数の割合である共通度が予め設定された閾値共通度よりも大きい場合、当該ファイル情報を当該ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類方法。
【0149】
(付記10)
付記8又は付記9に記載のファイル分類方法であって、
親ディレクトリとしてのあるディレクトリに格納されている、子ディレクトリとしてのディレクトリに対して推定された分類規則により定められる前記ファイル情報を有するファイルのすべてが共通して有するファイル情報を、当該親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類方法。
【0150】
(付記11)
情報処理装置に、
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する、処理を実行させるためのファイル分類プログラム。
【0151】
(付記12)
付記11に記載のファイル分類プログラムであって、
前記ディレクトリに格納されているファイルの総数に対する、当該ディレクトリに格納され且つあるファイル情報を有するファイルの数の割合である共通度が予め設定された閾値共通度よりも大きい場合、当該ファイル情報を当該ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類プログラム。
【0152】
(付記13)
付記11又は付記12に記載のファイル分類プログラムであって、
親ディレクトリとしてのあるディレクトリに格納されている、子ディレクトリとしてのディレクトリに対して推定された分類規則により定められる前記ファイル情報を有するファイルのすべてが共通して有するファイル情報を、当該親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類プログラム。
【産業上の利用可能性】
【0153】
本発明は、ファイルをディレクトリに分類するファイル分類装置、及び、コンテンツとしてのファイルを記憶するコンテンツ記憶装置等に適用可能である。
【符号の説明】
【0154】
10 ファイル分類装置
11 ファイル格納部
12 ディレクトリレコメンド制御部
12a 分類規則推定部
12b ディレクトリ選択部
13 分類規則記憶部
14 ファイル受付部
15 ディレクトリ一覧出力部
16 ディレクトリ特定情報受付部
100 ファイル分類装置
101 分類規則推定部

【特許請求の範囲】
【請求項1】
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する分類規則推定手段を備えるファイル分類装置。
【請求項2】
請求項1に記載のファイル分類装置であって、
前記分類規則推定手段は、前記ディレクトリに格納されているファイルの総数に対する、当該ディレクトリに格納され且つあるファイル情報を有するファイルの数の割合である共通度が予め設定された閾値共通度よりも大きい場合、当該ファイル情報を当該ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類装置。
【請求項3】
請求項1又は請求項2に記載のファイル分類装置であって、
ファイルを受け付けるファイル受付手段と、
前記受け付けられたファイルが有するファイル情報と、前記推定された分類規則と、に基づいて、当該ファイルを格納すべきディレクトリを選択するディレクトリ選択手段と、
を備えるファイル分類装置。
【請求項4】
請求項3に記載のファイル分類装置であって、
前記受け付けられたファイルを、前記選択されたディレクトリに格納するファイル格納手段を備えるファイル分類装置。
【請求項5】
請求項3に記載のファイル分類装置であって、
前記選択されたディレクトリの一覧を出力するディレクトリ一覧出力手段と、
前記出力されたディレクトリの一覧の中から、ユーザが選択したディレクトリを特定するためのディレクトリ特定情報を受け付けるディレクトリ特定情報受付手段と、
前記受け付けられたディレクトリ特定情報により特定されるディレクトリに、前記受け付けられたファイルを格納するファイル格納手段と、
を備えるファイル分類装置。
【請求項6】
請求項1乃至請求項5のいずれかに記載のファイル分類装置であって、
前記分類規則推定手段は、親ディレクトリとしてのあるディレクトリに格納されている、子ディレクトリとしてのディレクトリに対して推定された分類規則により定められる前記ファイル情報を有するファイルのすべてが共通して有するファイル情報を、当該親ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類装置。
【請求項7】
請求項1乃至請求項6のいずれかに記載のファイル分類装置であって、
前記ファイル情報は、前記ファイルの種類を表す種別情報、前記ファイルが含む文字列、前記ファイルの属性を表す属性情報が含む文字列、前記ファイルを識別するための識別情報、前記ファイルの重要度、前記ファイルの活用度、及び、前記ファイルの属性を表す属性情報が含む日時の少なくとも1つを含むファイル分類装置。
【請求項8】
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する、ファイル分類方法。
【請求項9】
請求項8に記載のファイル分類方法であって、
前記ディレクトリに格納されているファイルの総数に対する、当該ディレクトリに格納され且つあるファイル情報を有するファイルの数の割合である共通度が予め設定された閾値共通度よりも大きい場合、当該ファイル情報を当該ディレクトリに格納されるファイルが有するべきファイル情報として定める規則を前記分類規則として推定するように構成されたファイル分類方法。
【請求項10】
情報処理装置に、
ディレクトリに格納されているファイルが有する情報であるファイル情報に基づいて、当該ディレクトリに格納されるファイルが有するべきファイル情報を定める規則である分類規則を推定する、処理を実行させるためのファイル分類プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate