説明

ファイル圧縮装置、方法、プログラム

【課題】利用者のファイルに対する操作回数が多いほどそのファイルの重要度が高いとみなし、かつ当該操作が最近であるほどそのファイルの重要度が高いとみなして、当該重要度の低いものから優先して圧縮を行うことができる。
【解決手段】ファイルを圧縮するファイル圧縮装置であって、利用者がファイルを操作した操作回数と前記操作を行った日にちである操作日とからなる操作履歴N日分(Nは2以上の整数)を入力とし、前記操作日が新しくなるほど大きな絶対値をとる重みを、前記操作回数に乗算して重みつき操作回数を計算し、当該重みつき操作回数を累計して重みつき累計操作回数とし、当該重みつき累計操作回数に基づいて前記ファイルの圧縮の可否を判定することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は利用者のファイルに対する操作回数が多いほどそのファイルの重要度が高いとみなし、かつ当該操作が最近であるほどそのファイルの重要度が高いとみなして、当該重要度の低いものから優先して圧縮を行うファイル圧縮装置、方法、プログラムに関する。
【背景技術】
【0002】
使用頻度の低いファイルを圧縮することにより、副作用である処理パフォーマンスの低下を抑えながら、実容量以上の記憶容量でファイルを管理することができるファイル圧縮管理方式として特許文献1が知られている。
【0003】
以下、特許文献1のファイル圧縮管理方式について図1、2を用いて説明する。図1は特許文献1のファイル圧縮管理方式で用いられる日次アクセス履歴テーブルと、アクセス履歴集計テーブルとを例示して説明する図である。図2は、特許文献1のファイル圧縮管理方式を説明するフローチャートである。特許文献1のファイル圧縮管理方式は、履歴管理機能と、圧縮および再圧縮機能とを有する。これらのうち、履歴管理機能は、ファイルのアクセス履歴を管理/記録する機能であり、具体的には、アクセス回数をカウントし、アクセス回数が多いものから順に順位付けを行い、一定数これを保持する。この履歴管理はテーブル化されて圧縮および再圧縮機能に於いて使用される。一方、圧縮および再圧縮機能は、アクセス履歴テーブル外のファイルから圧縮し、所定の圧縮条件を満たすまで再圧縮する。ここでいう再圧縮とは一度圧縮したファイルを再度圧縮することを意味するのではなく、何れかのファイルをすでに圧縮した場合にも所定の圧縮条件がなお満たされていない場合に、当該所定の圧縮条件が満たされるまで、未だ圧縮がなされていない何れかのファイルを選択して、当該選択されたファイルの圧縮を行うことを意味する。なお、圧縮条件は、ハードディスク等におけるパーティーションの使用領域に対する割合または圧縮後の全体容量によって設定される。
【0004】
図1に示す日次アクセス履歴テーブルは、日毎のアクセス回数などが記録され保存されている。この発明では、この日次アクセス履歴テーブルを設定された日数n分だけ保持する。この日数を履歴管理日数と呼ぶ。この履歴管理日数は、前回圧縮を行ってから、再圧縮を行うまでのインターバルの日数でもある。この履歴管理日数nを5日とした場合には、図1のように当日を含めて5日分の日次アクセス履歴テーブル10〜14が保持される。再圧縮処理では、まず図1に示すように、日次アクセス履歴テーブル10〜14を集計し、アクセス履歴集計テーブル15を作成し、このアクセス履歴集計テーブル15外のファイルを大きいものから順に、前記圧縮条件を満たすまで圧縮する。こうして、アクセス履歴集計テーブル15外のファイルをすべて圧縮しても条件を満たさない場合には、アクセス履歴集計テーブル15内のファイルを順位の低いものから条件を満たすまで圧縮する。この再圧縮処理の詳細を図2のフローチャートを参照しながら説明する。まず、アクセス履歴集計テーブル15外のファイル(アクセス頻度の低いファイル)を容量の大きなものから順に圧縮し(S101)、続いて、前記圧縮条件を満たしているか否かをチェックする(S102)。この圧縮条件を満たしている場合は再圧縮を終了し、一方、満たしていない場合は、アクセス履歴集計テーブル15外のファイル(アクセス頻度の低いファイル)をすべて圧縮したか否かをチェックし(S103)、すべて圧縮していない場合には、S101以下の処理を実行する(圧縮を行う)。一方、すべてを圧縮してしまった場合には、アクセス履歴集計テーブル15内のファイル(アクセス頻度の低いファイル)を順位の低いものから順に圧縮する(S104)。次に前記圧縮条件を満たしているか否かをチェックし(S105)、その圧縮条件を満たしている場合は、再圧縮を終了し、一方、満たしていない場合は、アクセス履歴集計テーブル15内のファイルをすべて圧縮したか否かをチェックする(S106)。すべて圧縮してしまった場合には、圧縮条件を満たせなかった旨を通知して(S107)、終了する。一方、すべて圧縮していない場合には、S104の処理へもどって、圧縮を行う。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2000−029756号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1のファイル圧縮管理方式では、履歴管理日数内に行われたアクセスについては当該アクセスがいつ行われたとしても、そのアクセスの重要度に差をつけることができない。例えば履歴管理日数を10日とした場合に、あるファイルへの当日のアクセス回数は、同じファイルに対する10日前のアクセス回数と重要度において差が無い。しかしながら、あるファイルへの当日のアクセス回数は同じファイルに対する10日前のアクセス回数と比較して、圧縮の可否を判定するにあたって重要度が高いと考えられる。ファイルにアクセスする利用者の最も直近の挙動(アクセス回数)が、そのファイルの圧縮の可否を判定するうえで最も重要であると考えられるからである。従って当該ファイル圧縮管理方式では、ファイルにアクセスする利用者の直近のアクセスをより重要なアクセスとみなして圧縮可否の判定を行うことができないという課題がある。
【0007】
この課題を解決するために、履歴管理日数をもっと短く、例えば1日もしくは2日として圧縮の可否を判定することは可能である。しかしながら、このように圧縮の可否を判定する場合、例えば3日か4日おきにファイルに対してアクセスを行うことが通常であるような利用者にとっては有効ではない。このような利用者にとっては十分に使用頻度が高いファイルをも誤って圧縮してしまう可能性があるからである。また、履歴管理日数を極端に短くしてしまうと、使用頻度の判定精度が著しく劣化してしまい実用に適さない。
【課題を解決するための手段】
【0008】
本発明では、利用者のファイルに対する操作回数が多いほどそのファイルの重要度が高いとみなし、かつ当該操作が最近であるほどそのファイルの重要度が高いとみなして、当該重要度の低いものから優先して圧縮を行うことができるファイル圧縮装置が提供される。本発明のファイル圧縮装置は、利用者がファイルを操作した操作回数と前記操作を行った日にちである操作日とからなる操作履歴N日分(Nは2以上の整数)を入力とし、前記操作日が新しくなるほど大きな絶対値をとる重みを、前記操作回数に乗算して重みつき操作回数を計算し、当該重みつき操作回数を累計して重みつき累計操作回数とし、当該重みつき累計操作回数に基づいて前記ファイルの圧縮の可否を判定することを特徴とする。
【発明の効果】
【0009】
本発明のファイル圧縮装置は、操作日が新しくなるほど大きな絶対値をとる重みによって、利用者の操作が直近に行われたか否かに基づいてファイルの重要度を決定することができる。また、利用者の操作が直近でなくても予め定めたN日以内の操作であれば、直近の操作よりも小さな重みを与えられ、ファイルの重要度を決定する際に適切に考慮される。また、当該重みを操作回数に乗算して重みつき操作回数を計算し、当該重みつき操作回数を累計して重みつき累計操作回数とし、当該重みつき累計操作回数に基づいてファイルの圧縮の可否を判定するため、直近の操作が行われたか否かだけでなく、そのファイルに対する累計操作回数をも考慮してファイルの重要度を決定することができ、この重要度が低いものから優先して圧縮を行うことができるファイル圧縮装置が実現する。
【図面の簡単な説明】
【0010】
【図1】従来技術にかかるファイル圧縮管理方式で用いられる日次アクセス履歴テーブルと、アクセス履歴集計テーブルとを例示して説明する図。
【図2】従来技術にかかるファイル圧縮管理方式を説明するフローチャート。
【図3】実施例1にかかるDLサーバとファイル圧縮装置の構成を示すブロック図。
【図4】実施例1にかかるファイル圧縮装置の動作を示すフローチャート。
【図5】実施例1にかかるファイルの操作履歴等を例示して説明する表。
【図6】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルAについて多項式(2次)近似を行った例を説明する図。
【図7】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルBについて多項式(2次)近似を行った例を説明する図。
【図8】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルCについて多項式(2次)近似を行った例を説明する図。
【図9】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルDについて多項式(2次)近似を行った例を説明する図。
【図10】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルEについて多項式(2次)近似を行った例を説明する図。
【図11】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルFについて多項式(2次)近似を行った例を説明する図。
【図12】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルGについて多項式(2次)近似を行った例を説明する図。
【図13】実施例1にかかるファイル圧縮装置の圧縮対象ファイル判定部が、ファイルHについて多項式(2次)近似を行った例を説明する図。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【実施例1】
【0012】
図3から図13を参照して、本発明の実施例1にかかるファイル圧縮装置を説明する。図3はDLサーバ91とファイル圧縮装置30の構成を示すブロック図である。図4はファイル圧縮装置30の動作を示すフローチャートである。図5はファイルの操作履歴等を例示して説明する表である。図6〜図13はファイル圧縮装置30の圧縮対象ファイル判定部36が、ファイルA〜Hの重みつき累計操作回数について多項式(2次)近似を行った例を説明する図である。ファイル圧縮装置30は、ファイルDL部31と、ファイル格納部32と、ファイルDL履歴格納部33と、空き指定容量判定部34と、自動圧縮可否設定格納部35と、圧縮対象ファイル判定部36と、ファイル利用履歴格納部37と、圧縮実行部38とを備える。ファイル圧縮装置30の外部にはインターネット92を介してDLサーバ91が通信可能に接続されている。本実施例では、ファイル圧縮装置30は図示しない携帯端末の内部に存在するものとする。また、当該携帯端末は図示しないコンテンツプロバイダーと予め定額課金によってPUSH配信を契約しており、コンテンツプロバイダーからDLサーバ91に、DLサーバ91から携帯端末に、それぞれインターネット92を介して様々なコンテンツファイルがPUSH配信される状況下にあるものとする。
【0013】
以下、DLサーバ91と、ファイル圧縮装置30の動作について詳細に説明する。携帯端末内のファイル圧縮装置30は、DLサーバ91に対して定期的にコンテンツファイルのダウンロード要求を送信する。その他の場合や、DLサーバ91にダウンロード対象となるファイルが存在しない場合には、ファイル圧縮装置30は待受状態を維持する(S301)。DLサーバ91はコンテンツプロバイダーからコンテンツファイル(以下、単にファイルと表記する)が配信されると、このファイルを自身に格納して、ファイル圧縮装置30からのファイルダウンロード要求を待つ。コンテンツサーバからの新着ファイルがある場合で、ファイル圧縮装置30からファイルダウンロード要求を受け取った場合にはインターネット92を介して携帯端末内のファイル圧縮装置30内のファイルDL部31に当該ファイルをダウンロードさせる(S302)。上記のファイルダウンロード要求の送受信は必須ではない。例えば、コンテンツプロバイダーからDLサーバ91にファイルが配信された場合に、DLサーバ91は、ファイルダウンロード要求を待たずに当該配信されたファイルを携帯端末内のファイル圧縮装置30内のファイルDL部31に配信してもよい(S302)。また、コンテンツプロバイダーからDLサーバ91にファイルが配信された場合に、DLサーバ91は、携帯端末内のファイル圧縮装置30のファイルDL部31に対してファイル新着の通知を行うものとし、当該通知を受け取ったファイルDL部31が、DLサーバ91にアクセスして、当該ファイルのダウンロードを行うこととしても良い(S302)。ファイルDL部31は、ダウンロードされたファイルと、ダウンロードされたファイルのダウンロードサイズ情報とを出力する。ファイル格納部32は、ダウンロードされたファイルを入力とし、当該ダウンロードされたファイルを格納し、当該ファイル格納後に残された自身の保存領域容量を検出し、当該検出された保存領域容量の情報を残保存領域容量情報として出力する。ファイルDL履歴格納部33は、ダウンロードサイズ情報を入力とし、ダウンロードサイズ情報を予め定めたファイル数分記録し、当該記録をファイルダウンロード履歴として出力する。ファイルダウンロード履歴は例えば、直近過去20回分のダウンロードを記録することとしてもよい。この場合には、直近過去にダウンロードされたファイル20個分のダウンロードサイズ情報を記録しておき、当該記録をファイルダウンロード履歴として出力する。次に、空き指定容量判定部34は、ファイルダウンロード履歴と、残保存領域容量情報とを入力とし、ファイルダウンロード履歴から空き指定容量を抽出する(S303)。
【0014】
以下、空き指定容量の抽出方法について詳細に説明する。空き指定容量判定部34は、ファイルダウンロード履歴から平均ダウンロードサイズと、最大ダウンロードサイズとを求める。そして、平均ダウンロードサイズにP(Pは正の数)を乗じた値よりも最大ダウンロードサイズが大きい場合には、利用者の最近のダウンロードサイズの傾向は増加傾向ではないと判断し、当該最大ダウンロードサイズを空き指定容量として抽出する。また、平均ダウンロードサイズにPを乗じた値よりも最大ダウンロードサイズが小さい場合には、利用者の最近のダウンロードサイズの傾向は増加傾向にあると判断し、当該平均ダウンロードサイズにPを乗じた値を空き指定容量として抽出する。Pには例えば2を設定することができ、この場合には以下の表のように空き指定容量が抽出される。
【0015】
【表1】


上記のように空き指定容量を抽出することにより、最近にダウンロードされたファイルのダウンロードサイズの傾向を考慮することができ、精度よく次回のファイルダウンロードの可否を判定することが可能となる。
【0016】
次に、空き指定容量判定部34は、残保存領域容量と、抽出された空き指定容量を比較して、残保存領域容量が空き指定容量よりも大きい場合には、次回のダウンロードを可とし、残保存領域容量が空き指定容量以下である場合には、次回のダウンロードを不可とする(S304)。
【0017】
残保存領域容量が空き指定容量よりも大きく、次回のダウンロードが可であるときには、S305以下のステップは実行されない。この場合は次回のダウンロードに十分な残保存領域容量が確保されているため、S301に戻って、次回のファイルダウンロード要求まで待受状態を維持する。残保存領域容量が空き指定容量以下であり、次回のダウンロードが不可であるときには、圧縮対象ファイル判定部36が、自動圧縮可否設定格納部35にアクセスし、自動圧縮可否設定を得る(S305)。自動圧縮可否設定とは、本実施例では携帯端末の利用者がS306以降の自動圧縮機能をONにしているか、OFFにしているかの情報を示すものである。利用者が自動圧縮機能をOFFにしている場合には、S306以降の自動圧縮処理は行われない。この場合には、次回のファイルダウンロードに必要な空き指定容量が確保できない旨を利用者に通知するユーザ通知が行われる(S314)。一方、利用者が自動圧縮機能をONにしている場合には、S306以降の自動圧縮処理を、圧縮対象ファイル判定部36と、ファイル利用履歴格納部37と、圧縮実行部38が実行する。
【0018】
以下、S306以降の自動圧縮処理について詳細に説明する。図5を参照してファイル利用履歴格納部37は、利用者がファイルを操作した操作回数と操作を行った日にちである操作日とからなる操作履歴N日分を入力とする。Nは何日とすることもできるが、本実施例ではN=30とする。図5の例では、操作履歴は操作日2010年3月15日を最も古い履歴とし、そこから30日後の2010年4月13日を最も新しい履歴としている。ファイル利用履歴格納部37は、入力された操作履歴30日分を参照して、操作日のうち最も古い操作日である2010年3月15日から、最も新しい操作日である2010年4月13日に向かって1から30まで近似式計算用日にちを割り当てる。次に、ファイル利用履歴格納部37は、最も古い操作日(2010/03/15)から最も新しい操作日(2010/04/13)に向かって重みD〜Dを割り当てる。本実施例では、D=1,D=2,…,D30=30とし、単純に近似式計算用日にちと同じ値をとることとするが、本実施例の値の定め方に限定されない。D〜Dは符号が一致した数であれば、その正負は問わないものとする。ただし、D〜Dは0でないものとし、D〜Dが正である場合には、i>jであるときD≧Dを満たすものとし(広義の単調増加)、D〜Dが負である場合には、i>jであるときD≦Dを満たすものとする(広義の単調減少)。このようにD〜Dが取りうる値の範囲について制限を課すことの理由については後述する。次に、ファイル利用履歴格納部37は、操作履歴の任意の操作日に対応する操作回数と、当該操作日に割り当てられた重みとを乗算して重みつき操作回数を計算する。図5の例では、操作日2010年3月21日における重みはD=7であり、操作回数は1回である。従って、重みつき操作回数は7×1=7回となる。次に、ファイル利用履歴格納部37は、計算された重みつき操作回数を、対応する近似式計算用日にちと対応付けて圧縮対象ファイル判定部36に出力する。
【0019】
圧縮対象ファイル判定部36は、近似式計算用日にちと重みつき操作回数とを入力とする。圧縮対象ファイル判定部36は、任意のX(Xは1以上N以下の整数、本実施例では、1以上30以下)に対して、近似式計算用日にち1日からX日にそれぞれ対応する重みつき操作回数を累計する(S306)。例えば、X=15であれば、近似式計算用日にち1日から15日までにそれぞれ対応する重みつき操作回数を累計する。この累計結果を近似式計算用日にち15日における重みつき累計操作回数と呼ぶ。以下、近似式計算用日にちX日における重みつき累計操作回数をf(X)と表現するものとし、図5の例では近似式計算用日にち15日における重みつき累計操作回数f(15)=153回となっている。次に、圧縮対象ファイル判定部36は、近似式計算用日にち1,2,…,30と、重みつき累計操作回数f(1),f(2),…f(30)との関係を2次の多項式にて近似して近似曲線を導出する(S307)。圧縮対象ファイル判定部は、近似した多項式の係数を用いて、ファイルの圧縮の可否をS308、S309にて判定する。本実施例では、2次の多項式にて近似を行うこととしたが、近似に用いる多項式の次数はこれに限られず、1次や3次の多項式を用いることとしてもよい。
【0020】
以下S308、S309のファイル圧縮可否判定について詳細を説明する。圧縮対象ファイル判定部36は、近似式である2次式の2次の項の係数の符号が重みDの符号と異なるかもしくは0である場合であってかつ、2次式が説明変数Xに対してg(X)と表されるときに、X=N(本実施例では30)のときの2次式の微分値であるg’(N)(本実施例ではg’(30))の符号が重みDの符号と異なるかもしくは0である場合に、前記ファイル判定部が前記ファイルの圧縮が可能であると判定する(S308、S309)。本実施例では、重みD〜D30はすべて正の値をとるため、近似式g(x)の2次の項の符号が0以下であって、g’(30)の符号が0以下であれば、そのファイルは圧縮対象と判定されることとなる。S308において近似式の2次の項が正である場合には当該ファイルについては圧縮不可であると判定し、S306に戻って次のファイルについて圧縮の可否を判定する。S308において近似式の2次の項が0以下である場合であっても、S309において現在の傾き、つまりg’(30)の符号が正である場合には、当該ファイルについては圧縮不可であると判定し、S306に戻って次のファイルについて圧縮の可否を判定する。一方、S308で近似式の2次の項が0以下であってかつ、S309で現在の傾きg’(30)の符号が0以下である場合には、当該ファイルを圧縮対象として、全ファイルの判定終了まで一時保存する(S310)。ファイル格納部32のすべてのファイルについて圧縮可否判定が終了していなければ、残りのファイルの圧縮可否判定を行い、すべてのファイルの圧縮可否判定が終了していれば(S311)、一時保存された圧縮対象ファイルの圧縮を実行する(S312)。圧縮の方法はZIP形式、LZH形式など従来方法で構わない。S312の圧縮処理を行った結果、残保存領域容量が空き指定容量以上となった場合には、S301に戻って次回のファイルダウンロード要求まで待受状態を維持する。S312の圧縮処理を行ってもなお、残保存領域容量が空き指定容量以下となってしまい、空き指定容量を確保することができない場合には、次回のファイルダウンロードに必要な空き指定容量が確保できない旨を利用者に通知するユーザ通知が行われる(S314)。
【0021】
以下、具体例であるコンテンツファイルA〜Hを例示しながらS308、S309を解説する。本実施例では、携帯端末内部のファイル圧縮装置30のファイル格納部32にコンテンツファイルA〜H(以下単にファイルA〜Hと表記する)が格納されているものとし、圧縮対象ファイル判定部36によりファイルA〜Hまでの重みつき累計操作回数が求められているものとする。図6はファイルAの重みつき累計操作回数を縦軸とし、近似式計算用日にちを横軸として各重みつき累計操作回数をプロットしたものである。ファイルAの重みつき累計操作回数について従来方法により、2次の多項式による近似曲線g(x)=0.13x+8.2x−16が導出される。ここで、近似曲線g(x)の2次の項の係数は0.13であって0以下でないため、ファイルAについては前述の圧縮条件を満たさない。このため、ファイルAは圧縮対象とされないで、次のファイル(ファイルB)が圧縮対象であるか否かが判定される。図7はファイルBの重みつき累計操作回数について図6と同様にプロットした図である。ファイルBの近似式g(x)の2次の項の係数は−0.017であって0以下である。従って、ファイルBは前述の圧縮可否判定のうちS308の判定については圧縮対象と判定される。次に近似式計算用日にち30日での微分値はg’(30)=3.68となり、0以下でないため、S309の判定では、圧縮対象とされないで、次のファイル(ファイルC)が圧縮対象であるか否かが判定される。図8を参照してファイルCの近似式g(x)の2次の項の係数は0.22であって0以下でないため、ファイルCは圧縮対象とならずに次のファイル(ファイルD)が圧縮対象であるか否かが判定される。図9のファイルDについては、近似式g(x)の2次の項の係数は0以下であり、g’(30)=−0.4≦0となるため、S308とS309の双方の判定を満たし圧縮対象と判定される。このようにして、最終的にファイルA〜HのうちファイルD、F、Hが圧縮対象と判定され、圧縮実行部38によって圧縮処理がなされる。
【0022】
S308において、近似式の2次の項の係数が正であるようなファイルを圧縮対象としないのは、近似式の2次の項が正である場合、近似曲線が下に凸の形状であるためである。近似曲線が下に凸の形状を示すということは、例えばファイルA、Cのように重みつき累計操作回数が、比較的近い過去において増加傾向にあり、下に凸の曲線で近似するほうが当てはまりが良いことを意味する。比較的近い過去に操作されたファイルは、現在において利用者が必要としているファイルである可能性が高く、圧縮に適さない。このため、近似式の2次の項が正であるようなファイルの圧縮を不可としている。一方近似式の2次の項が負である場合、近似曲線は上に凸の形状を示す。これは、例えばファイルD、E、F、Gなどのように比較的近い過去において重みつき累計操作回数に変化が無いために上に凸の近似曲線で近似するほうが当てはまりが良いことを意味する。換言すれば比較的近い過去において利用者は当該ファイルをほとんどもしくはまったく操作していないことを意味する。比較的近い過去にほとんどもしくはまったく操作されていないファイルは、現在において利用者が必要としていないファイルである可能性が高く、圧縮に適している。このため、近似式の2次の項が負であるようなファイルについては、圧縮対象候補としてS309の判定を行う。また、実施例におけるファイルHのように2次の多項式にて近似を行ったものの近似式の2次の項が0となってしまった場合には、利用者はこのファイルについてN日以内に全く使用していないことを示しているため、当該ファイルについても圧縮対象候補とするものとする。
【0023】
S308で圧縮対象候補となったファイルについて、S309において最も新しい近似式計算用日にちにおける近似曲線の傾きg’(N)(実施例ではN=30)を計算し、当該傾きが正であるときは圧縮対象としないのは、当該傾きが正であるときは、当該近似曲線である放物線の軸が、最も新しい近似式計算用日にち(N)よりも未来側に存在することを意味する。近似式の2次の項が負であり、かつ近似曲線の軸が前述のように最新の近似式計算用日にち(N)よりも未来側にあるということは、曲線は、現在に向かって緩やかな増加傾向にあることを意味する。したがって本実施例では、このように現在に向かって緩やかな増加傾向にある近似曲線で近似できるファイルについては、利用者にとって重要なファイルである可能性があるので、圧縮対象から除外することとした。一方、最も新しい履歴における近似曲線の傾きg’(N)(N=30)が負である場合には、近似曲線の軸が、最も新しい近似式計算用日にち(N)よりも過去側に存在することを意味する。この多項式近似においては目的変数に累計値を用いているので、実際には値が減少することは起こりえないが、近似式の2次の項の係数が負であってかつ軸が最も新しい近似計算用日にち(N)よりも過去側にあるということは、直近過去長期にわたりファイルの重みつき累計操作回数に変化が無いことを意味する。したがって本実施例では、このような軸が最新の近似計算用日にち(N)よりも過去側に存在し、かつ重みつき累計操作回数が上に凸の放物線で近似できるようなファイルについては、利用者にとって重要なファイルである可能性が低いため、圧縮対象とすることにした。また、最も新しい履歴における近似曲線の傾きg’(N)が0となるのは、軸がちょうどNと等しい場合か、もしくは実施例のファイルHの事例のようにそもそも全く操作が行われておらず、2次式による近似ができなかった場合などである。これらのファイルについても利用者にとって重要なファイルである可能性が低いため、圧縮対象とすることにした。このようにして、利用者にとって重要でないファイルである可能性の高いファイルD、F、Hが選択され圧縮される。
【0024】
なお、本実施例では重みD〜D30を1〜30の正の整数としたが、代わりに例えば負の整数−1〜−30を重みD〜D30に用いることもできる。この場合には、図6〜図12に示した重みつき累計操作回数のプロット点は、x軸を対称軸として、線対称な点に移動する。従って、近似曲線の形状もx軸を対称軸として反転するため、圧縮可否の条件は、前述と逆と考えればよい。この場合には、近似式の2次の項の符号は0以上であってかつ、最も新しい履歴における近似曲線の傾きg’(30)が0以上である場合には、当該ファイルは圧縮対象と判定される。結局のところ、近似式の2次の項の符号および、近似曲線の傾きの符号がいずれも重みD〜D30の符号と異なるかもしくは0である場合には圧縮対象と判定して、少なくとも何れか一方が重みD〜D30の符号と等しい場合には圧縮対象と判定しないことで足りる。D〜Dが正である場合には、D〜Dは広義の単調増加を満たし、D〜Dが負である場合には、D〜Dは広義の単調減少を満たしていれば良く、この制約の中でD〜Dは自由な値をとることができる。
【0025】
なお、本実施形態はS308、S309の双方で条件を満たした場合のみ、ファイルを圧縮対象と判定することとしたが、これに限られず、例えばS309を省略して近似式の2次の項のみを圧縮対象判定条件としてもよい。この場合には、近似式の2次の項が重みD〜Dの符号と異なるかもしくは0であるファイルはすべて圧縮対象と判定される。この場合、図6〜13のファイルA〜Hのうち、ファイルD〜Hが圧縮対象と判定される。
【0026】
本実施例のファイル圧縮装置30は、圧縮対象ファイル判定部36と、ファイル利用履歴格納部37とを備えたことにより、操作日が新しくなるほど大きな絶対値をとる重みによって、利用者の操作が直近に行われたか否かに基づいてファイルの重要度を決定することができる。また、利用者の操作が直近でなくても予め定めたN日以内の操作であれば、直近の操作よりも小さな絶対値の重みを与えられ、ファイルの重要度を決定する際に適切に考慮される。また、当該重みを操作回数に乗算して重みつき操作回数を計算し、当該重みつき操作回数を累計して重みつき累計操作回数とし、当該重みつき累計操作回数に基づいてファイルの圧縮の可否を判定するため、直近の操作が行われたか否かだけでなく、そのファイルに対する累計操作回数をも考慮してファイルの重要度を決定することができ、この重要度が低いものから優先して圧縮を行うことができる。また、重みDは一定の制限を除いて任意に設定することができるため、操作回数の操作日ごとの重要度の設定に自由度が高い。また、多項式近似の近似式の係数や微分値を用いて圧縮の可否を判定するため、重みつき累計操作回数の推移を細かく分析することができ、利用者にとって必要なファイルと不必要なファイルとの選別の精度が高くなる。また、以上の処理が利用者の何らかの操作を伴わずに実現されるため、空き指定容量が確保できないためにファイルのダウンロードが不可能になるという事態が自動かつ暗黙裡に回避され、利用者はPUSH配信を煩わしく感じることがなくなる。これにともなってコンテンツファイルの定額課金といったサービスの普及を促進することが可能となる。また、本実施例は、PUSH配信が行われることを前提に説明したが、様々なコンテンツがパッケージ化されて一括でダウンロードされる場合、PUSH配信によらずに利用者が自らダウンロードを実施する場合にも同様の効果が生じる。何れの場合にも空き指定容量が確保できないためにファイルのダウンロードが不可能になることで、利用者が煩わしさを感じることを自動かつ暗黙裡に回避できる。また、ファイルDL履歴格納部33と、空き指定容量判定部34とを備えたことにより、次回のダウンロードに必要な空き指定容量を利用者の最近のファイルダウンロード履歴から推測して確保するため、最近にダウンロードされたファイルのダウンロードサイズの傾向を考慮することができ、精度よく次回のファイルダウンロードの可否を判定することが可能となる。また、自動圧縮可否設定格納部35を備えたことにより、自動圧縮を好まない利用者に対しては、自動圧縮処理を行わないこととすることができるため、利用者にとっての利便性が向上する。
【0027】
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0028】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0029】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0030】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0031】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0032】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項1】
ファイルを圧縮するファイル圧縮装置であって、
利用者がファイルを操作した操作回数と前記操作を行った日にちである操作日とからなる操作履歴N日分(Nは2以上の整数)を入力とし、前記操作日が新しくなるほど大きな絶対値をとる重みを、前記操作回数に乗算して重みつき操作回数を計算し、当該重みつき操作回数を累計して重みつき累計操作回数とし、当該重みつき累計操作回数に基づいて前記ファイルの圧縮の可否を判定すること
を特徴とするファイル圧縮装置。
【請求項2】
ファイルを圧縮するファイル圧縮装置であって、
利用者がファイルを操作した操作回数と前記操作を行った日にちである操作日とからなる操作履歴N日分(Nは2以上の整数)を入力とし、前記操作日のうち最も古い操作日から最も新しい操作日に向かって1からNまで近似式計算用日にちを割り当て、前記操作日のうち最も古い操作日から最も新しい操作日に向かって重みD〜D(D〜Dは、すべて符号が一致した数であるものとし、D〜Dが正である場合には、i>jであるときD≧Dを満たすものとし、D〜Dが負である場合には、i>jであるときD≦Dを満たすものとする)を割り当て、前記操作履歴の任意の操作日に対応する操作回数と、当該操作日に割り当てられた重みとを乗算して重みつき操作回数を計算し、当該重みつき操作回数を、対応する近似式計算用日にちと対応付けて出力するファイル利用履歴格納部と、
前記近似式計算用日にちと前記重みつき操作回数とを入力とし、前記近似式計算用日にち1からXにそれぞれ対応する重みつき操作回数を累計して、当該1からXまでの累計を重みつき累計操作回数f(X)として計算する処理をX=1,…,Nのそれぞれに対して行い、前記近似式計算用日にち1,2,…,Nと、前記重みつき累計操作回数f(1),f(2),…f(N)との関係を近似した多項式の係数を用いて、前記ファイルの圧縮の可否を判定する圧縮対象ファイル判定部と、
を備えるファイル圧縮装置。
【請求項3】
請求項2に記載のファイル圧縮装置であって、
前記近似式計算用日にち1,2,…,Nと、前記重みつき累計操作回数f(1),f(2),…,f(N)との関係を近似する多項式が2次式であり、当該2次式の2次の項の係数の符号が前記重みD〜Dの符号と異なるかもしくは0である場合に、前記圧縮対象ファイル判定部が、前記ファイルの圧縮が可能であると判定すること
を特徴とするファイル圧縮装置。
【請求項4】
請求項3に記載のファイル圧縮装置であって、
前記2次式の2次の項の係数の符号が前記重みD〜Dの符号と異なるかもしくは0である場合であってかつ、前記2次式が説明変数Xに対してg(X)と表されるときに、X=Nのときの前記2次式の微分値であるg’(N)の符号が前記重みD〜Dの符号と異なるかもしくは0である場合に、前記圧縮対象ファイル判定部が前記ファイルの圧縮が可能であると判定すること
を特徴とするファイル圧縮装置。
【請求項5】
請求項2から4の何れかに記載のファイル圧縮装置であって、
前記ファイルをダウンロードして、前記ダウンロードされたファイルと、前記ダウンロードされたファイルのダウンロードサイズ情報とを出力するファイルDL部と、
前記ダウンロードされたファイルを入力とし、当該ダウンロードされたファイルを格納し、当該ファイル格納後に残された自身の保存領域容量を検出し、当該検出された保存領域容量の情報を残保存領域容量情報として出力するファイル格納部と、
前記ダウンロードサイズ情報を入力とし、前記ダウンロードサイズ情報を予め定めたファイル数分記録し、当該記録をファイルダウンロード履歴として出力するファイルDL履歴格納部と、
前記ファイルダウンロード履歴と、前記残保存領域容量情報とを入力とし、前記ファイルダウンロード履歴から空き指定容量を抽出し、前記残保存領域容量と、前記抽出された空き指定容量を比較して、前記残保存領域容量が前記空き指定容量よりも大きい場合には、次回のダウンロードを可とし、前記残保存領域容量が前記空き指定容量以下である場合には、次回のダウンロードを不可とする空き指定容量判定部とをさらに備え、
前記空き指定容量判定部が次回のダウンロードを不可とした場合に、前記ファイル利用履歴格納部と、前記圧縮対象ファイル判定部が前記ダウンロードされたファイルに対して動作して、前記ダウンロードされたファイルの圧縮の可否を判定すること
を特徴とするファイル圧縮装置。
【請求項6】
請求項5に記載のファイル圧縮装置であって、
前記空き指定容量判定部が、
前記ファイルダウンロード履歴から平均ダウンロードサイズと、最大ダウンロードサイズとを求め、平均ダウンロードサイズにP(Pは正の数)を乗じた値よりも最大ダウンロードサイズが大きい場合には、当該最大ダウンロードサイズを空き指定容量として抽出し、平均ダウンロードサイズにPを乗じた値よりも最大ダウンロードサイズが小さい場合には、当該平均ダウンロードサイズにPを乗じた値を空き指定容量として抽出すること
を特徴とするファイル圧縮装置。
【請求項7】
ファイルを圧縮するファイル圧縮方法であって、
利用者がファイルを操作した操作回数と前記操作を行った日にちである操作日とからなる操作履歴N日分(Nは2以上の整数)を入力とし、前記操作日のうち最も古い操作日から最も新しい操作日に向かって1からNまで近似式計算用日にちを割り当て、前記操作日のうち最も古い操作日から最も新しい操作日に向かって重みD〜D(D〜Dは、すべて符号が一致した数であるものとし、D〜Dが正である場合には、i>jであるときD≧Dを満たすものとし、D〜Dが負である場合には、i>jであるときD≦Dを満たすものとする)を割り当て、前記操作履歴の任意の操作日に対応する操作回数と、当該操作日に割り当てられた重みとを乗算して重みつき操作回数を計算し、当該重みつき操作回数を、対応する近似式計算用日にちと対応付けて出力するファイル利用履歴格納ステップと、
前記近似式計算用日にちと前記重みつき操作回数とを入力とし、前記近似式計算用日にち1からXにそれぞれ対応する重みつき操作回数を累計して、当該1からXまでの累計を重みつき累計操作回数f(X)として計算する処理をX=1,…,Nのそれぞれに対して行い、前記近似式計算用日にち1,2,…,Nと、前記重みつき累計操作回数f(1),f(2),…f(N)との関係を近似した多項式の係数を用いて、前記ファイルの圧縮の可否を判定する圧縮対象ファイル判定ステップと、
を備えるファイル圧縮方法。
【請求項8】
請求項7に記載のファイル圧縮方法であって、
前記近似式計算用日にち1,2,…,Nと、前記重みつき累計操作回数f(1),f(2),…,f(N)との関係を近似する多項式が2次式であり、当該2次式の2次の項の係数の符号が前記重みD〜Dの符号と異なるかもしくは0である場合に、前記圧縮対象ファイル判定ステップが、前記ファイルの圧縮が可能であると判定すること
を特徴とするファイル圧縮方法。
【請求項9】
請求項8に記載のファイル圧縮方法であって、
前記2次式の2次の項の係数の符号が前記重みD〜Dの符号と異なるかもしくは0である場合であってかつ、前記2次式が説明変数Xに対してg(X)と表されるときに、X=Nのときの前記2次式の微分値であるg’(N)の符号が前記重みD〜Dの符号と異なるかもしくは0である場合に、前記圧縮対象ファイル判定ステップが前記ファイルの圧縮が可能であると判定すること
を特徴とするファイル圧縮方法。
【請求項10】
コンピュータを請求項1から6の何れかに記載のファイル圧縮装置として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2012−14236(P2012−14236A)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願番号】特願2010−147361(P2010−147361)
【出願日】平成22年6月29日(2010.6.29)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】