説明

スナップショットデータ保管方法

【課題】
NASにデータを格納する際に、現用データ、スナップショットをそれぞれ独立してデータの価値を判断し、これらのデータ価値に応じた最適ストレージに自動保管することを実現する。
【解決手段】
データが格納されているデータ記憶部からファイルを順番に読み出し、ファイル属性に加えてスナップショットの世代を組み合わせてデータ価値を決定するポリシーテーブルと、そのデータ価値に対応する階層ストレージが定義されている保管先管理テーブルを参照し、顧客ポリシーに基づいた階層ストレージに転送する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク接続ストレージ装置に関し、データを保管する際に保管先を最適化する方法に関する。特にスナップショットデータの保管先を最適化する方法に関する。
【背景技術】
【0002】
ネットワーク接続ストレージ装置(NAS)のバックアップに関する従来技術として、ある時点でのファイルシステムの静止ポイントを取得するスナップショットがある。スナップショット取得の対象となったデータをオリジナルデータと呼ぶ。スナップショットはオリジナルデータからの差分ブロックとポインタ情報のみを保持する。
【0003】
一方、データの重要度や利用頻度などの変化に応じて、それを格納するのに適したストレージへ適宜、移動・配置することにより、効果的な情報活用と効率的なストレージ投資を実現する情報ライフサイクル管理/インフォメーションライフサイクル・マネジメント(ILM)という考え方があり、この考え方をとりいれたILMソリューションがある。現在、各社が提供しているILMソリューションは、現用ファイル(スナップショットのオリジナルデータ)に対して、利用頻度などでルールとポリシーを作成し、これに基づいてデータの格納などを自動的に行なうといったものである。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】SnapShothttp://www.netapp.com/jp/products/platform−os/snapshot−ja.html
【非特許文献2】ARX http://www.f5networks.co.jp/product/arx/index.html
【発明の概要】
【発明が解決しようとする課題】
【0005】
現状のILM技術では、データの最適配置の対象となるのはNASの現用データ(スナップショットのオリジナルデータ)となり、スナップショットは対象外である。ストレージの技術で作成されるスナップショットは、現用データに付随する形で保管される。つまり、現用データ、スナップショットを個別に認識し、個々のデータの価値に応じた最適なストレージに自動配置することはできない。
【0006】
ファイル1とファイル2があり、それぞれにスナップショットが存在する場合、データの価値を比較できるのは現用のファイル1とファイル2だけであり、例えば、ファイル1のスナップショットとファイル2の現用データを比較して価値(重要度)を判断する技術は存在しない。
【0007】
即ち、現用データのデータ量はデータ更新によってあまり変化しないが、スナップショットのデータ量はデータ更新の度に増加していく。また、一般に、スナップショットを用いて過去の時点におけるデータを復元する頻度は、最近のものほど高く、古いデータの復元の頻度は少ない傾向がある。従って、同じスナップショットのデータでもデータ更新の時期に応じて重要度が変化する。しかし、データ更新の度に、個々のデータの重要度が変化し、かつ、データ量が増加するスナップショットの特性は、従来のIMLのデータ保管方法では考慮されていない。
【0008】
従って、本発明の目的は、現用データとスナップショットをそれぞれ独立してデータの価値を判断し、これらのデータ価値に応じた最適ストレージへ自動保管する仕組みを提供することである。
【0009】
特に、データ更新の度に、現用データに対する重要度が随時変化し、データ量が増加するスナップショットデータを、重要度に応じた記憶装置に自動保管する方法を提供する。
【課題を解決するための手段】
【0010】
上記目的を達成するため、本発明では、データを格納するデータ記憶部と、前記データを階層化されたストレージに振り分けて転送するためのポリシー(スナップショットの世代と重要度との対応関係)が記載されたポリシー記憶部と、前記データを前記ポリシー記憶部に記載されているポリシーに基づいて最適なストレージに転送するデータ保管先最適化処理部と、前記データの転送先である階層化されたストレージを備えるストレージ装置を提供する。
【0011】
特に、データ更新の時期が新しいスナップショットデータほど一般に重要度が高い(データ復元のための利用頻度が高い)ため、本発明では、アクセス性能が高い上位階層の記憶装置に格納することによって、データ復元の頻度が高い、更新の時期が新しい時点におけるデータほど速やかに復元できるようにする。
【0012】
又、本発明では、データ更新の度に、又は、古い世代のスナップショットを下位の階層に移動させる度に、スナップショットの世代と重要度との対応関係を更新する。
【発明の効果】
【0013】
本発明によれば、現用データとスナップショットをそれぞれ独立してデータの価値を判断し、これらのデータ価値に応じた最適ストレージへ自動保管する仕組みを提供することが可能になる。
【0014】
即ち、本発明によれば、データ更新の時期が新しいスナップショットデータほどアクセスが速やかに行える記憶装置に格納するので、要求の頻度が高い、更新の時期が新しい時点のデータ復元が速やかに行えるようになる。
【図面の簡単な説明】
【0015】
【図1】本実施形態におけるNAS装置の構成を示すブロック図である。
【図2】スナップショットの世代と重要度との対応関係を示すポリシーテーブルの一例を示す図である。
【図3】重要度とデータ格納先の階層との対応関係を示す保管先管理テーブルの一例を示す図である。
【図4】データ保管先最適化処理手順を示すフローチャートである。
【図5】世代番号Gx、gy及び重要度Wzとの対応関係の変化を示す図である。
【発明を実施するための形態】
【0016】
以下、本発明のNASのデータ保管先最適化機能の実施の形態を、図面を用いて詳細に説明する。
【0017】
図1は、本実施形態におけるNAS装置の構成を示すブロック図である。
【0018】
NAS装置100は、データ保管先最適化処理部101を備えており、これらはメモリ130に格納されたプログラムをCPU120が実行することによって実現される。また、記憶部140には、ポリシーテーブル102、保管先管理テーブル103、データ記憶部104、階層ストレージ105を備えている。階層ストレージ105は、NAS装置100の外部に備えてもよい。
【0019】
データ保管先最適化処理部101は、データ保管先最適化処理の要求があった時に起動し、ポリシーテーブル102、保管先管理テーブル103を参照し、顧客ポリシーに基づいた最適な階層ストレージ105へ、データ記憶部104に保管されているデータを転送する。
【0020】
ポリシーテーブル102は、データの価値に関する顧客のポリシーに基づいて、個々のデータの重要度をシステム管理者があらかじめ設定している。ポリシーテーブル102は、データ保管先最適化処理の要求が生じ、データ記憶部に保管されているファイルが存在する場合に参照される。
【0021】
保管先管理テーブル103では、データ重要度に応じてデータをどの階層ストレージに振り分け転送を行なうかシステム管理者があらかじめ設定している。保管管理テーブル103は、データ保管先最適化処理の要求が生じ、データ記憶部に保管されているファイルが存在する場合に参照される。
【0022】
データ記憶部104は、データ保管先最適化処理で最適な階層ストレージに転送される前のデータが保管されている。
【0023】
階層ストレージ105は、データ保管先最適化処理で振り分けされたデータが保管されている。例えば、Tier1、Tier2、Tier3と3つのストレージに階層化し、Tier1ストレージは、先進技術である高品質高性能のSSD、Tier2ストレージは高品質高性能のFCディスクやSASディスク、Tier3ストレージは低価格大容量のSATAディスクというように特性の異なる数種類のストレージで構成する。
(スナップショットにおける世代番号と重要度との対応関係)
スナップショット(以下ではSSと略記)の実行毎に順次対応づけられるSSの実行毎の世代番号をGx、最新のSSから新しいSSの順に対応付けられるSSの相対的な世代番号gyとし、各SSデータに対応付けられるデータの重要度のランクをWzとする。実行毎の世代番号Gxは、SSが実行されるたびに増加していくが、各SSデータとGxとの対応関係は変化しない。また、GxはSSデータの格納の順番でもある。一方、相対的な世代番号gyは、SSが実行される度に最新のSSのデータから新しい順に世代番号が対応付けられるため、新しいSSデータが追加される度に、各SSデータとgyとの対応関係は相対的に変化する。また、一般に、新しいSSデータほど重要度の高いランクが割り当てられるため、新しいSSデータが追加される度に、重要度と各SSデータとの対応関係は変化するが、相対的な世代番号gyと重要度との対応関係は変化しない。ここで、Gx、gy及びWzは世代や重要度を表す整数であるが、「G」,「g」及び「W」はこれらの整数を区別するための記号であり、例えば「G1」は整数の「1」を表す。
【0024】
従って、現在のGxの最大値をn−1とすると、各ファイル名におけるGxとGy、更にはWzとの対応(重要度との対応も含む)は図5(a)のようになる。
【0025】
SS実行時における世代番号がnの時のGxとgyの対応関係は、gy=n+1−Gxとなる。このとき、更に1回SSが実行されると、このSSに対する相対的な世代番号はg1、今までのgkはg(k+1)(但し、k=1〜n)となり、SS実行時の世代番号としては、新たなg1に対応するG(n+1)が追加されるだけである。このとき、相対的な世代番号がg1〜gkのSSデータの重要度はW1で、g(k+1)以降の相対的な世代番号のSSデータの重要度はW2であり、これらの対応関係は新たなSSデータの追加によっても変化しないとする。このような場合におけるGx、gy及びWzとの対応関係の変化は、図5(a)及び(b)のようになる。
【0026】
図5の対応関係に示すように、相対的な世代番号gyと重要度Wzとの対応関係は変化していないが、SS実行時における世代番号がGkのSSデータの重要度は、新たなSSデータの追加によって重要度がW2に変化している。
【0027】
以上に示したように、実際のSSデータはSS実行毎の世代番号Gxで管理されるが、SSデータの重要度を管理するためには、この重要度との対応関係が変化しない相対的な世代番号gyを用いた方が管理し易い。従って、以下では、主に相対的な世代番号を用いて説明する。但し、データ格納領域が満杯又は閾値以上のために下位階層の記憶装置にデータを移動する場合、又は、SSデータを所定の世代の状態に復元する場合には、SSデータの格納順序を示すGxを用いてデータにアクセスする必要があるが、SS実行時における世代番号がnの場合における上記のGxとgyの対応関係gy=n+1−Gxを用いて世代番号の変換が可能である。
【0028】
図2は、ポリシーテーブル102の一例を示す図である。ポリシーテーブル102のファイル属性欄201には、NAS装置100のデータ記憶部104に格納されているデータをファイル単位でみた時にファイルに付与されている属性のうち、データ価値の重要度を決めるファイル属性が、顧客のポリシーに基づいてあらかじめシステム管理者によって設定されている。ファイル属性とは例えば、ファイルの所有者や部署、拡張子、サイズ、アクセス日時などである。ポリシーテーブル102の重要度の欄202には、重要度の高い順に各重要度(W1〜WM)が配列されている。ファイル属性欄201で設定したファイル属性をもつデータに対して、各重要度に対応した現用データ、又はスナップショットの相対的な世代番号の範囲が、顧客のポリシーに基づいてあらかじめシステム管理者によって設定されている。現用データを表す世代番号g0、及び比較的新しいSSデータを表す相対的な世代番号が小さい値の範囲が重要度の高い欄に定義されている。図2では、重要度の高い世代については世代の範囲がシステム管理者によって設定されているが、「−」で示す重要度の低いランクについては世代の範囲は設定されていない。このように重要度の低い世代のSSデータは、適宜、削除もしくは磁気テープ装置などの記憶装置にバックアップされる。
【0029】
図3は、保管先管理テーブル103の一例を示す図である。保管先管理テーブル103のデータ重要度欄301には、顧客ポリシーに基づいてレベル分けしたデータ価値である重要度が重要度の高い順(W1〜WM)に配置されている。階層ストレージ欄302には、データ重要度欄301で設定した各データ重要度に対応したストレージの階層が、あらかじめシステム管理者によって設定されている。一般に、上位の階層ほど高い重要度が対応付けられる。なお、1つのデータ重要度に対して、複数の階層ストレージが指定されてもよいし、複数のデータ重要度に対して、1つの階層ストレージが指定されてもよい。
【0030】
以上に示した図2及び3を用いると、例えば、ファイル属性がBの現用データ(g0)及び相対的な世代がg1〜g2のSSデータは重要度がW1で、Tier1の階層のストレージに格納されており、相対的な世代がg3〜gnBのSSデータは重要度がW2で、Tier2の階層のストレージに格納されていることがわかる。また、SS実行時における世代番号がnBの場合における上記のGxとgyの対応関係から、SS実行時における世代番号(Gx)が1〜nB−2の古いSSデータがTier2の階層のストレージに格納されており、SS実行時における世代番号(Gx)がnB−1〜nBの新しいSSデータがTier1の階層のストレージに格納されていることがわかる。
【0031】
図4は、NAS装置100に格納されるデータを階層化されたストレージに転送する際に、現行データとスナップショットを個別に管理してデータの重要度を決め、顧客ポリシーに基づいて最適な階層ストレージに転送する手順の具体例を示すフローチャートである。
【0032】
最初に、NAS装置100において、データ保管先最適化処理の要求を検知する(ステップ401)。この要求は、システム管理者等からNAS装置100に対して任意のタイミングで行なわれてもよいし、顧客があらかじめ指定した時間にデータ保管先最適化処理の要求がNAS装置100に対して行なわれるようにしておいてもよい。
【0033】
この要求を検知したNAS装置100のデータ保管先最適化処理部101は、データ記憶部104を参照し、保管されているファイルの有無を調べる(ステップ402)。データ記憶部104に保管されているファイルが有る場合(ステップ402=Yes)、ファイルを順番に一つずつ読み出す(ステップ403)。続いて、ポリシーテーブル102を参照して、該当ファイルに対応するデータ価値の重要度を読み取る(ステップ404)。続いて、保管先管理テーブル103を参照し、該当データ重要度に対応する階層ストレージを読み取り(ステップ405)、該当ファイルを対応する階層ストレージに転送する(ステップ406)。データ記憶部104に保管されているファイルが無い場合(ステップ402=No)、データ保管先最適化処理を終了する。
(世代番号を用いたSSデータの保管先への移動処理)
図2に示したファイル属性BのSSデータを例として、上記の世代番号を用いた、図4に示したデータ保管先最適化処理の具体的な手順を以下に示す。
【0034】
初期状態として、世代番号がnBのSSが実行され、世代番号が1〜nBの全てのSSデータが、とりあえず重要度がW1であるとして、Tier1のストレージに格納されているものとする。以下では、Tier1のストレージに更にSSデータを格納することが困難になった等の理由により、これらのSSデータのうち、古いSSデータは重要度が低い(W2)としてTier2のストレージに移動させるものとする。
(1)図2のポリシーテーブル102に基づいて、ファイル属性BのSSデータに関しては、重要度が低い(W2)SSデータの相対的な世代番号がg3〜gnBであることを抽出する。
(2)SS実行時における世代番号がnBの場合における上記のGxとgyの対応関係から、上記(1)で抽出した相対的な世代番号g3〜gnBに対応するSS実行時における世代番号(Gx)が1〜nB−2であることがわかるので、この世代番号Gxに基づいてこれら古い世代のSSデータをTier1のストレージから取り出す。即ち、これら古い世代のSSデータをTier1のストレージから読み出し、Tier1のストレージからこれらのSSデータを削除する。
(3)図3の保管先管理テーブル103に基づいて、上記(2)で取り出した、重要度がW2のSSデータの保管先がTier2の階層のストレージであることを抽出する。
(4)上記(2)で取り出した、相対的な世代番号がg3〜gnBであって、重要度がW2のSSデータを上記(3)で抽出したTier2の階層のストレージに格納する。
なお、上記の手順(1)〜(4)の後でも、現用データ(g0)及び相対的な世代番号がg1〜g2のSSデータは、重要度がW1に対応するTier1の階層のストレージに格納されたままである。
【0035】
このように、本実施形態によれば、現用データとスナップショットをそれぞれ独立してデータの価値を判断し、これらのデータ価値に応じた最適ストレージへ自動保管する仕組みを提供することが可能となる。
【符号の説明】
【0036】
100:NAS装置、
101:データ保管先最適化処理部、
102:ポリシーテーブル、
103:保管先管理テーブル、
104:データ記憶部、
105:階層ストレージ、
120:CPU、
130:メモリ、
140:記憶部。

【特許請求の範囲】
【請求項1】
データを格納するデータ記憶部と、前記データをデータの価値によって重要度を決定するポリシーテーブルと、前記ポリシーテーブルに基づいて前記データを最適な階層ストレージに転送するデータ保管先最適化処理部と、前記データ保管先最適化処理部で振り分けされたデータを保管する階層ストレージを備えることを特徴とするストレージ装置。
【請求項2】
請求項1記載のストレージ装置であって、前記ポリシーテーブルは、ファイル属性や現行データ、スナップショットの世代を組み合わせてデータの重要度を定義することを特徴とするストレージ装置。
【請求項3】
請求項1記載のストレージ装置であって、前記階層ストレージは、特性の異なる数種類のストレージ(SSD、FC、SAS,SATA)で構成することを特徴とするストレージ装置。
【請求項4】
それぞれの性能に応じて階層が対応付けられた少なくとも一つの記憶装置に接続され、現用データ及び前記現用データに対するスナップショットデータを前記少なくとも一つの記憶装置のいずれかに振り分ける処理装置におけるスナップショットデータ保管方法は、
前記階層と重要度との対応を定義した保管先管理テーブルを保持し、スナップショットデータの保管先を変更する際に、
スナップショットの実行毎にそれぞれのスナップショットデータに順次第1の世代番号を対応付け、最新のスナップショットから新しい順にそれぞれのスナップショットデータに第2の世代番号を対応付け、それぞれのスナップショットデータに対応付けられた重要度と前記第2の世代番号の範囲との対応を定義したポリシーテーブルに基づいて、第1の階層の記憶装置に格納されたスナップショットデータに関して、前記第1の階層に対応する第1の重要度よりも低い第2の重要度のスナップショットデータに対する前記第2の世代番号の範囲を抽出し、
現時点における前記第1の世代番号の最大値を含む、前記第1の世代番号と前記第2の世代番号との対応関係に基づいて、前記抽出した第2の世代番号の範囲に対応する前記第1の世代番号の範囲を求め、前記求めた第1の世代番号の範囲に対応するスナップショットデータを前記第1の階層の記憶装置から取り出し、
前記保管先管理テーブルに基づいて、前記第1の階層の記憶装置から取り出した、前記第2の重要度のスナップショットデータに対する保管先が前記第2の重要度に対応する第2の階層の記憶装置であることを抽出し、
前記第1の階層の記憶装置から取り出した、前記抽出した前記第2の世代番号の範囲であって、前記第2の重要度であるスナップショットデータを前記第2の階層の記憶装置に格納する、ことを特徴とするスナップショットデータ保管方法。
【請求項5】
前記スナップショットデータの保管先の変更は、前記第1の階層の記憶装置が満杯になった場合、あるいは、前記第1の階層の記憶装置に格納されているデータのデータ量が所定の閾値を超えた場合、のいずれかであることを特徴とする請求項4記載のスナップショットデータ保管方法。
【請求項6】
前記保管先管理テーブルに定義されていない更に下位の階層に属し、かつ、重要度が更に低いスナップショットデータは、削除、もしくは、他の記憶装置にバックアップすることを特徴とする請求項4記載のスナップショットデータ保管方法。
【請求項7】
それぞれの性能に応じて階層が対応付けられた少なくとも一つの記憶装置に接続され、現用データ及び前記現用データに対するスナップショットデータを前記少なくとも一つの記憶装置のいずれかに振り分ける処理装置におけるスナップショットデータ保管方法は、
スナップショットデータの保管先を変更する際に、
最新のスナップショットから新しい順にそれぞれのスナップショットデータに対応付けた世代番号の中から、低い重要度世代番号の範囲を抽出し、
前記抽出した世代番号の範囲に対応する、重要度が低いスナップショットデータを、スナップショットの実行毎に順序付けられてそれぞれのスナップショットデータが格納されている、重要度が高い上位階層の記憶装置から取り出し、
予め定めた、前記低い重要度に対応する下位階層の記憶装置に格納する、ことを特徴とするスナップショットデータ保管方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−243039(P2012−243039A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−111754(P2011−111754)
【出願日】平成23年5月18日(2011.5.18)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】