説明

ストレージシステム

【課題】ストレージシステムの性能の向上を図ること。
【解決手段】記憶要求された一群のデータを区別する識別情報を当該一群のデータに付与する識別情報付与手段と、上記一群のデータの一部である記憶対象データを複数に分割し、冗長化して、複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御手段と、を備えると共に、上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ストレージシステムにかかり、特に、データを分散して複数の記憶装置に記憶するストレージシステムに関する。
【背景技術】
【0002】
近年、コンピュータの発達及び普及に伴い、種々の情報がデジタルデータ化されている。このようなデジタルデータを保存しておく装置として、磁気テープや磁気ディスクなどの記憶装置がある。そして、保存すべきデータは日々増大し、膨大な量となるため、大容量なストレージシステムが必要となっている。また、記憶装置に費やすコストを削減しつつ、信頼性も必要とされる。これに加えて、後にデータを容易に取り出すことが可能であることも必要である。その結果、自動的に記憶容量や性能の増大を実現できると共に、重複記憶を排除して記憶コストを削減し、さらには、冗長性の高いストレージシステムが望まれている。
【0003】
このような状況に応じて、近年では、特許文献1に示すように、コンテンツアドレスストレージシステムが開発されている。このコンテンツアドレスストレージシステムは、データを分散して複数の記憶装置に記憶すると共に、このデータの内容に応じて特定される固有のコンテンツアドレスによって、当該データを格納した格納位置が特定される。
【0004】
具体的に、コンテンツアドレスストレージシステムでは、所定のデータを複数のフラグメントに分割すると共に、冗長データとなるフラグメントをさらに付加して、これら複数のフラグメントをそれぞれ複数の記憶装置にそれぞれ格納している。そして、後に、コンテンツアドレスを指定することにより、当該コンテンツアドレスにて特定される格納位置に格納されているデータつまりフラグメントを読み出し、複数のフラグメントから分割前の所定のデータを復元することができる。
【0005】
また、上記コンテンツアドレスは、データの内容に応じて固有となるよう生成される。このため、重複データであれば同じ格納位置のデータを参照することで、同一内容のデータを取得することができる。従って、重複データを別々に格納する必要がなく、重複記録を排除し、データ容量の削減を図ることができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−235171号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
ここで、コンテンツアドレスストレージシステムでは、上述したように、所定のデータを複数のフラグメントに分割して、複数の記憶装置にそれぞれ格納している。そして、複数の上位ホストからデータの格納命令が出された場合であっても、データを受信した順に記憶装置に格納している。
【0008】
このため、特定の上位ホストから受信したデータであっても、種々の上位ホストからのデータが、記憶装置内では交互に記憶される場合がある(図10参照)。すると、仮に、特定の上位ホストから受信したひとまとまりのデータを読み出そうとした場合や、データを読み出すときに後続のデータも同時に読み出してキャッシュしておく場合であっても、関連するデータをまとめて読み出すことが困難となる。つまり、各記憶装置には、複数の上位ホストからのデータが、その順番がバラバラに格納されることがあるため、この場合には、関連するデータをまとめて読み出すことができず、効率的なデータの読み出しを実現することができない。その結果、読み出し速度の向上を図ることができず、ストレージシステムとしての性能の向上を図ることができない、という問題が生じる。
【0009】
このため、本発明の目的は、上述した課題である、冗長性を維持しつつ、読み出し速度の向上を図り、性能の向上を図ることができるストレージシステムを提供する、ことにある。
【課題を解決するための手段】
【0010】
かかる目的を達成するため本発明の一形態であるストレージシステムは、
複数の記憶手段と、これら複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段と、を備え、
上記データ処理手段は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段と、
上記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御手段と、を備えると共に、
上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
という構成を有する。
【0011】
また、本発明の他の形態であるプログラムは、
複数の記憶手段を備えた情報処理装置に、
上記複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段を実現させるプログラムであり、
上記データ処理手段は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段と、
上記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御手段と、を備え、
上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
という構成を有する。
【0012】
また、本発明の他の形態であるデータ処理方法は、
複数の記憶手段を備えた情報処理装置にて、
上記複数の記憶手段に対してデータを記憶するデータ記憶工程と、当該記憶手段に記憶されているデータを読み出すデータ読み出し工程を有する。
上記データ記憶工程は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与工程と、
上記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成工程と、
上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御工程と、を有し、
上記分散記憶制御工程は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
という構成を有する。
【発明の効果】
【0013】
本発明は、以上のように構成されることにより、冗長性を維持しつつ、読み出し速度の向上を図り、ストレージシステムの性能の向上を図ることができる。
【図面の簡単な説明】
【0014】
【図1】本発明の実施形態1におけるストレージシステムの構成を示す機能ブロック図である。
【図2】本発明の実施形態2におけるストレージシステムを含むシステム全体の構成を示すブロック図である。
【図3】本発明の実施形態2におけるストレージシステムの構成の概略を示すブロック図である。
【図4】本発明の実施形態2におけるストレージシステムの構成を示す機能ブロック図である。
【図5】図4に開示したストレージシステムにおけるデータ記憶処理の様子を説明するための説明図である。
【図6】図4に開示したストレージシステムにおけるデータ記憶処理の様子を説明するための説明図である。
【図7】図4に開示したストレージシステムにおけるデータ読み出し処理の様子を説明するための説明図である。
【図8】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図9】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図10】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図11】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図12】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図13】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図14】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図15】図4に開示したストレージシステムにおける記憶装置に対するデータの格納の様子を示す図である。
【図16】図4に開示したストレージシステムの動作を示すフローチャートである。
【発明を実施するための形態】
【0015】
<実施形態1>
本発明の第1の実施形態を、図1を参照して説明する。図1は、ストレージシステムの構成を示す機能ブロック図である。なお、本実施形態では、ストレージシステムの概略を説明する。
【0016】
図1に示すように、本実施形態におけるストレージシステム1は、
複数の記憶手段6と、これら複数の記憶手段6に対してデータを記憶すると共に当該記憶手段6に記憶されているデータを読み出すデータ処理手段2と、を備えている。
そして、上記データ処理手段2は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段3と、
上記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段4と、
上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段6に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御手段5と、を備える。
さらに、上記分散記憶制御手段5は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、という構成を採る。
【0017】
上記発明によると、まず、ストレージシステムは、上位ホストからのデータ記憶要求により一群のデータを受け付け、この一群のデータを区別する識別情報を付与する。そして、一群のデータを複数の記憶対象データに分割し、1つの記憶対象データをさらに複数の分割データに分割すると共に、当該記憶対象データを復元するための冗長データを生成し、これら分割データと冗長データとである複数のフラグメントデータから成るデータセットを生成する。続いて、ストレージシステムは、1つのデータセットを構成する各フラグメントデータを各記憶手段に分散して記憶する。このとき、ストレージシステムは、一のデータセットを構成する各フラグメントデータを、各記憶手段に形成された各記憶領域内の同一位置に格納する。さらに、ストレージシステムは、上記記憶領域内へのフラグメントデータの格納時、あるいは、その後の任意のタイミングで、同一の識別情報が付与された一群のデータに含まれる複数の記憶対象データに対応する複数のデータセットをそれぞれ構成する各フラグメントデータを、各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する。
【0018】
これにより、記憶手段には、一群のデータを構成する複数の記憶対象データが連続して記憶されるため、関連する内容のデータがまとまって記憶されることとなる。従って、ストレージシステムが記憶したデータを読み出す際に、関連するデータをまとめて読み出すことが可能となる。その結果、データ読み出し速度及び効率の向上を図ることができ、ストレージシステムの性能の向上を図ることができる。
【0019】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記記憶手段に格納される前であって、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。
【0020】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記識別番号毎にそれぞれ異なる上記バッファメモリに格納し、当該識別番号毎にそれぞれ設けられた上記各バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。
【0021】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記バッファメモリの容量が所定容量に達したタイミングで、当該バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。
【0022】
これにより、ストレージシステムは、一旦、バッファメモリに、一群のデータが連続するよう格納し、その後、記憶手段に格納する。従って、関連する内容のデータをまとめて格納する処理が簡易となり、ストレージシステムの性能の向上を図ることができる。
【0023】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記各記憶手段に既に格納されている、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
という構成を採る。
【0024】
これにより、ストレージシステムは、すでに記憶手段に格納したデータであっても、後に、一群のデータを構成する記憶対象データが連続するよう再格納する。従って、その後のデータ読み出し速度及び効率の向上を図ることができる。
【0025】
また、上記ストレージシステムでは、
上記データセット生成手段は、上記識別情報付与手段にて上記一群のデータに付与された上記識別情報を、当該一群のデータに含まれる複数の上記記憶対象データに対応する上記データセットを構成する上記各フラグメントデータに含める、
という構成を採る。
【0026】
これにより、各記憶領域に格納する各フラグメントデータが、どの一群のデータに属しているものであるかを容易に把握することができる。従って、各フラグメントデータに含まれる識別情報に基づいて、一群のデータに含まれる記憶対象データを連続して格納する処理を容易に実行することができる。
【0027】
また、上記ストレージシステムでは、
上記データ処理手段は、上記分散記憶制御手段にて上記各記憶手段に格納した上記記憶対象データの格納位置を表す格納位置情報を生成して管理する格納位置情報管理手段を備え、
この格納位置情報管理手段は、データの読み出し要求時に特定された当該データの上記格納位置情報に基づいて、当該格納位置情報にて表される上記各記憶手段内の格納位置に格納されたデータを読み出す、
という構成を採る。
【0028】
また、上記ストレージシステムでは、
上記データ処理手段は、上記記憶対象データの内容に固有の内容識別情報を生成すると共に、上記各記憶手段に既に格納されている記憶対象データの内容に固有の内容識別情報と比較して、上記各記憶手段に同一内容の上記記憶対象データが記憶されているか否かを調べる重複チェック手段を備え、
当該重複チェック手段は、上記記憶対象データと同一内容のデータが既に上記各記憶手段に記憶されている場合に、当該記憶対象データを上記各記憶手段に格納せず、当該記憶対象データの格納位置情報として上記同一内容のデータの格納位置情報を用いる、
という構成を採る。
【0029】
これにより、記憶対象データの内容に基づいて当該データの格納した位置を表す格納位置情報を特定するコンテンツアドレスストレージシステムに、上述した構成を適用することができる。従って、既に記憶されているデータと同一内容の記憶対象データを重複して記憶することを抑制することができ、データ記憶使用量を低減でき、システム自体の低コスト化を図ることができる。
【0030】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記各記憶手段に生成された各ファイルのデータ格納領域の先頭を基準とした同一位置に、上記データセットを構成する上記各フラグメントデータをそれぞれ格納する、
という構成を採る。
【0031】
これにより、ストレージシステムが記憶したデータを読み出す際には、当該データを構成するデータセットのうち1つのフラグメントデータの格納位置を特定することで、他のフラグメントデータの格納位置も容易に特定することができる。従って、データ読み出し時に、データセットを構成する全てのフラグメントの位置を特定する必要がなく、高速にデータを読み出すことができる。その結果、冗長性を維持しつつ、高速にデータを読み出すことが可能な高性能のストレージシステムを実現することができる。
【0032】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記各記憶手段に生成された各ファイルに既に格納されているデータの次に空いている格納位置に、上記データセットを構成する上記各フラグメントデータをそれぞれ格納する、
という構成を採る。
【0033】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータを、同一のタイミングで上記各記憶手段にそれぞれ格納する、
という構成を採る。
【0034】
上述したように、分散記憶制御手段にて各フラグメントデータを各記憶手段内にそれぞれ格納することで、簡易な処理にてデータセットを構成する各フラグメントデータを同一位置にそれぞれ格納することができる。従って、データ記憶処理も高速化することができる。
【0035】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータに、当該データセットを識別するための同一の識別情報をそれぞれ付与して、当該データセットを構成する上記各フラグメントデータを上記各記憶手段にそれぞれ格納する、
という構成を採る。
【0036】
また、上記ストレージシステムでは、
上記分散記憶制御手段は、上記データセットを構成する上記各フラグメントデータが上記各記憶手段に形成された上記各記憶領域内のそれぞれ同一位置に格納されているか否かを、当該各フラグメントデータに付与された上記識別情報に基づいて調べ、当該各フラグメントデータが上記各記憶領域内の同一位置に格納されていない場合に、上記データセットを構成する上記各フラグメントデータが上記各記憶領域内の同一位置にそれぞれ格納されるよう当該各フラグメントデータの格納位置を変更する、
という構成を採る。
【0037】
これにより、データセットを構成する各フラグメントデータには、同一の識別情報が付与されて複数の記憶手段に格納される。従って、既に記憶されているフラグメントデータに付与されている識別情報を調べることで、一のデータセットを構成する各フラグメントデータが各記憶手段の同一位置に格納されているか否かを判別できる。そして、各フラグメントデータに含まれる識別情報に基づいて、各記憶手段に格納された当該フラグメントデータの格納位置を変更することができる。その結果、上述同様に、一のデータセットを構成する各フラグメントデータを、各記憶手段内に形成された記憶領域内においてそれぞれ同一位置に格納することができ、高速にデータを読み出すことが可能となる。
【0038】
また、上述したストレージシステムは、情報処理装置(システム)に、プログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、
複数の記憶手段を備えた情報処理装置に、
上記複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段を実現させるプログラムである。
そして、上記データ処理手段は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段と、
上記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御手段と、を備え、
上記分散記憶制御手段は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
という構成を採る。
【0039】
そして、上記プログラムでは、
上記分散記憶制御手段は、上記記憶手段に格納される前であって、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。
【0040】
また、上記プログラムでは、
上記分散記憶制御手段は、上記各記憶手段に既に格納されている、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
という構成を採る。
【0041】
また、上述したストレージシステムが作動することにより実行される、本発明の他の形態であるデータ処理方法は、
複数の記憶手段を備えた情報処理装置にて、
上記複数の記憶手段に対してデータを記憶するデータ記憶工程と、当該記憶手段に記憶されているデータを読み出すデータ読み出し工程を有する。
そして、上記データ記憶工程は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与工程と、
上記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、上記分割データと上記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成工程と、
上記データセットを構成する上記各フラグメントデータを分散して、上記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して上記記憶対象データを記憶する分散記憶制御工程と、を有し、
上記分散記憶制御工程は、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
という構成を採る。
【0042】
また、上記データ処理方法では、
上記分散記憶制御工程は、上記記憶手段に格納される前であって、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された上記各フラグメントデータを上記各記憶手段に格納する、
という構成を採る。
【0043】
また、上記データ処理方法では、
上記分散記憶制御工程は、上記各記憶手段に既に格納されている、同一の上記識別情報が付与された上記一群のデータに含まれる複数の上記記憶対象データに対応する複数の上記データセットをそれぞれ構成する上記各フラグメントデータを、上記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
という構成を採る。
【0044】
上述した構成を有する、プログラム、又は、データ処理方法、の発明であっても、上記ストレージシステムと同様の作用を有するために、上述した本発明の目的を達成することができる。
【0045】
<実施形態2>
本発明の第2の実施形態を、図2乃至図16を参照して説明する。図2は、システム全体の構成を示すブロック図である。図3は、ストレージシステムの概略を示すブロック図であり、図4は、構成を示す機能ブロック図である。図5乃至図7は、ストレージシステムの動作を説明するための説明図である。図8乃至図15は、ストレージシステムにおけるデータの格納状態を示す図である。図16は、ストレージシステムの動作を示すフローチャートである。
【0046】
ここで、本実施形態は、上述した実施形態1にて開示したストレージシステムの具体的な一例を示すものである。そして、以下では、ストレージシステムが、複数台のサーバコンピュータが接続されて構成されている場合を説明する。但し、本発明におけるストレージシステムは、複数台のコンピュータにて構成されることに限定されず、1台のコンピュータで構成されていてもよい。
【0047】
[構成]
図2に示すように、本発明におけるストレージシステム10は、ネットワークNを介してバックアップ処理を制御するバックアップシステム11に接続している。そして、バックアップシステム11は、ネットワークNを介して接続されたバックアップ対象装置12に格納されているバックアップ対象データ(記憶対象データ)を取得し、ストレージシステム10に対して記憶するよう要求する。これにより、ストレージシステム10は、記憶要求されたバックアップ対象データをバックアップ用に記憶する。
【0048】
そして、図3に示すように、本実施形態におけるストレージシステム10は、複数のサーバコンピュータが接続されて構成を採っている。具体的に、ストレージシステム10は、ストレージシステム10自体における記憶再生動作を制御するサーバコンピュータであるアクセラレータノード10Aと、データを格納する記憶装置を備えたサーバコンピュータであるストレージノード10Bと、を備えている。なお、アクセラレータノード10Aの数とストレージノード10Bの数は、図3に示したものに限定されず、さらに多くの各ノード10A,10Bが接続されて構成されていてもよい。
【0049】
さらに、本実施形態におけるストレージシステム10は、データを分割及び冗長化し、分散して複数の記憶装置に記憶すると共に、記憶するデータの内容に応じて設定される固有のコンテンツアドレスによって、当該データを格納した格納位置を特定するコンテンツアドレスストレージシステムである。このコンテンツアドレスストレージシステムについては、後に詳述する。
【0050】
なお、以下では、ストレージシステム10が1つのシステムであるとして、当該ストレージシステム10が備えている構成及び機能を説明する。つまり、以下に説明するストレージシステム10が有する構成及び機能は、アクセラレータノード10Aあるいはストレージノード10Bのいずれに備えられていてもよい。なお、ストレージシステム10は、図3に示すように、必ずしもアクセラレータノード10Aとストレージノード10Bとを備えていることに限定されず、いかなる構成であってもよく、例えば、1台のコンピュータにて構成されていてもよい。さらには、ストレージシステム10は、コンテンツアドレスストレージシステムであることにも限定されない。
【0051】
図4に、ストレージシステム10の構成を示す。この図に示すように、ストレージシステム10は、データを記憶するデータ記憶装置30と、当該データ記憶装置30に対するデータの記憶及び読み出し動作を制御するデータ処理装置20と、を備えている。なお、実際には、データ処理装置20は、図3に示したアクセラレータノード10A及びストレージノード10Bが備えているCPU(Central Processing Unit)などの複数の演算装置にて構成されている。また、記憶装置30は、図3に示したアクセラレータノード10A及びストレージノード10Bが備えているハードディスクなどの記憶装置にて構成されている。
【0052】
そして、図4に示すように、上記データ処理装置20は、プログラムが組み込まれることにより構築された、ストリームID付与部21と、ブロック生成部22と、重複チェック部23と、フラグメント生成部24と、分散記憶制御部25と、格納位置管理部26と、を備えている。また、データ記憶装置30は、バックアップ対象データを格納する複数の記憶装置31と、格納したデータの格納位置を記憶する格納位置情報記憶部32と、を備えている。以下、各構成について詳述する。なお、同時に、上記各構成によるデータの処理の様子を、図5乃至図15を参照して説明する。
【0053】
まず、上記ストリームID付与部21(識別情報付与手段)は、図6の矢印Y1に示すようにバックアップ対象データAの入力を受けると、一群のデータである当該バックアップ対象データAを区別する識別情報であるストリームIDを付与する。例えば、バックアップ対象データAに対してストリームID=ST1を付与し、バックアップ対象データB(図示せず)に対してストリームID=ST2を付与する。
【0054】
なお、ストリームIDは、バックアップ対象データを区別するのみならず、当該バックアップ対象データAの出力元であるバックアップ対象装置12を区別する情報であってもよい。つまり、ストリームID付与部21は、所定のルールによりまとめられたバックアップ対象データ毎に、異なるストリームIDを付与する。
【0055】
また、上記ブロック生成部22は、上記バックアップ対象データAの入力を受けると、図5及び図6の矢印Y2に示すように、当該バックアップ対象データAを、所定容量(例えば、64KB)のブロックデータDに分割する。そして、このブロックデータDのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値H(内容識別情報)を算出する(矢印Y3)。例えば、ハッシュ値Hは、予め設定されたハッシュ関数を用いて、ブロックデータDのデータ内容から算出する。なお、このブロック生成部21による処理は、アクセラレータノード10Aにて実行される。
【0056】
そして、上記ブロック生成部22は、バックアップ対象データAをブロックデータDに分割する際に、上述したようにバックアップ対象データAに付与したストリームIDを、各ブロックデータDにも引き継いで付与する。なお、上記ストリームID付与部21は、上述したように、バックアップ対象データAに対してストリームIDを付与することに限定されない。例えば、ブロック生成部22にてバックアップ対象データAをブロックデータDに分割する際に、当該ブロックデータD毎にバックアップ対象データAを識別する同一のストリームIDを付与してもよい。
【0057】
また、上記重複チェック部23(重複チェック手段)は、バックアップ対象データAのブロックデータDのハッシュ値Hを用いて、当該ブロックデータDが既に記憶装置31に格納されているか否かを調べる。具体的には、まず、既に格納されているブロックデータDは、そのハッシュ値Hと格納位置を表すコンテンツアドレスCAが、関連付けてMFI(Main Fragment Index)ファイルに登録されている。従って、重複チェック部23は、格納前に算出したブロックデータDのハッシュ値HがMFIファイル内に存在している場合には、既に同一内容のブロックデータDが格納されていると判断できる(図6の矢印Y4)。この場合には、格納前のブロックデータDのハッシュ値Hと一致したMFI内のハッシュ値Hに関連付けられているコンテンツアドレスCAを、当該MFIファイルから取得する。そして、このコンテンツアドレスCAを、記憶要求にかかるブロックデータDのコンテンツアドレスCAとして返却する。これにより、このコンテンツアドレスCAにて参照される既に格納されているデータが、記憶要求されたブロックデータDとして使用されることとなり、当該記憶要求にかかるブロックデータDは記憶する必要がなくなる。
【0058】
なお、ストレージノード10Bが複数存在する場合には、ブロックデータDから上述したように算出したハッシュ値Hに基づいて、Write Initiator(WI)と呼ばれる、データ格納時の初期処理(後述する、圧縮処理やフラグメント化処理)を担当する1つのストレージノード10Bが決定される。
【0059】
また、上記フラグメント生成部24(データセット生成手段)は、上述したように重複チェック部23にてまだ記憶されていないと判断されたブロックデータDを、圧縮して、図6の矢印Y5に示すように、複数の所定の容量のフラグメントデータに分割する。例えば、図5の符号D1〜D9に示すように、9つのフラグメントデータ(分割データ41)に分割する。さらに、フラグメント生成部24は、分割したフラグメントデータのうちいくつかが欠けた場合であっても、元となるブロックデータを復元可能なよう冗長データを生成し、上記分割したフラグメントデータ41に追加する。例えば、図5の符号D10〜D12に示すように、3つのフラグメントデータ(冗長データ42)を追加する。これにより、9つの分割データ41と、3つの冗長データとにより構成される12個のフラグメントデータからなるデータセット40を生成する。なお、上記フラグメント生成部24による処理は、上述したWIと呼ばれる1つのストレージノード10Bによって実行される。
【0060】
そして、上記フラグメント生成部24は、生成した全てのフラグメントデータD1〜D12に、当該フラグメントデータの元となるブロックデータD、つまり、フラグメントデータD1〜D12から復元されるブロックデータDに付与されたストリームIDを、それぞれ付与する。
【0061】
次に、上記分散記憶制御部25(分散記憶制御手段)の基本的な機能について説明する。分散記憶制御部25は、上記フラグメント生成部24にて生成されたデータセットを構成する各フラグメントデータを、記憶装置31に形成された各記憶領域に、それぞれ分散して格納する。例えば、図5に示すように、12個のフラグメントデータD1〜D12を生成した場合には、12個の記憶装置31内にそれぞれ形成したデータ格納ファイルF1〜F12(データ格納領域)に、各フラグメントデータD1〜D12を1つずつそれぞれ格納する(図6の矢印Y6参照)。
【0062】
このとき、分散記憶制御部25は、各データ格納ファイルF1〜F12内における同一位置に、1つのデータセット40を構成する各フラグメントデータD1〜D12を格納する。例えば、図8に示すように、各データ格納ファイルF1〜F12の先頭を基準とした同一位置に、全てのフラグメントデータD1〜D12をそれぞれ格納する。なお、図8の例では、図の上端をファイルの先頭としている。
【0063】
具体的に、分散記憶制御部25は、各データ格納ファイルF1〜F12に対する格納位置を予め設定することなく、当該各データ格納ファイルF1〜F12に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータD1〜D12を格納する。例えば、図9に示す例では、すでに各データ格納ファイルF1〜F12の網掛け部分までそれぞれデータが格納されているが、その次の領域に、各フラグメントデータD1〜D12を格納して、1つのデータセット40を構成する全てのフラグメントデータD1〜D12の格納位置が揃うようにする。また、特に、分散記憶制御手段25は、一のデータセット40を構成する各フラグメントデータD1〜D12を、同一のタイミングで各データ格納ファイルF1〜F12に格納する。
【0064】
但し、上述したように格納した場合には、同時に複数のバックアップ対象データの記憶要求があると、図10に示すように、各データ格納ファイルF1〜F12に、ストリームID(ST1,ST2,ST3)が異なる各データセットを構成する各フラグメントデータが交互に格納される事態が生じうる。なお、図10では、ストリームIDが同一のデータセットを、同一の模様にて図示している。
【0065】
このため、本実施形態における分散記憶制御部25では、各データ格納ファイルF1〜F12に格納する前に、各フラグメントデータD1〜D12をストリームID毎に区別して異なるバッファメモリに一旦格納する。そして、その後、バッファメモリ内のフラグメントデータD1〜D12を各データ格納ファイルF1〜F12に格納する。その具体例を、図11乃至図14を参照して説明する。
【0066】
まず、分散記憶制御部25は、各データ格納ファイルF1〜F12毎に、それぞれストリームID毎のバッファメモリを設定する。例えば、3つのストリームID(ST1,ST2,ST3)に対応するバッファメモリBF1,BF2,BF3を設定する場合には、図11に示すように、1つのデータ格納ファイルF1に対して3つのバッファメモリBF1,BF2,BF3を設定し、これを12セット設定する。
【0067】
そして、分散記憶制御部25は、フラグメントデータD1〜D12に含まれているストリームIDに対応するバッファメモリBF1,BF2,BF3に、当該各フラグメントデータD1〜D12をそれぞれ格納する。例えば、図11に示す例では、元となるブロックデータD(バックアップ対象データA)のデータセット40がストリームID=ST1であるとする。この場合には、データセット40を構成する各フラグメントデータD1〜D12を、それぞれ後に格納先となる各データ格納ファイルF1〜F12にそれぞれ設定されたストリームID=ST1の各バッファメモリBF1に格納する。つまり、フラグメントデータD1をデータ格納ファイルF1のバッファメモリBF1に格納し、フラグメントデータD2をデータ格納ファイルF2のバッファメモリBF2に格納し、同様に、全てのデータ格納ファイルのバッファメモリに対してフラグメントデータを格納する。このとき、各フラグメントデータD1〜D12を、各バッファメモリBF1〜BF3内に既に格納されているデータの次に空いている格納領域に、全てを同時のタイミングで格納する。
【0068】
これにより、各バッファメモリBF1〜BF3内には、対応するストリームIDのフラグメントデータが連続して位置して格納される。また、このとき、同一のデータセットを構成する各フラグメントデータD1〜D12は、各バッファメモリBF1〜BF3内において同一の位置に格納される。例えば、図11に示すように、データセット40のフラグメントデータD1,D2を各バッファメモリBF1に格納した場合には、図12に示すように、当該バッファメモリBF1のそれぞれ同一の位置である最後の格納位置に格納される。このように、各フラグメントデータをストリームID毎に振り分けて、当該ストリームIDに対応する各バッファメモリに格納していくことで、全てのデータ記憶ファイルF1〜F12にそれぞれ対応する特定のストリームIDの各バッファメモリが、どのタイミングにおいても全て同一の容量となる。例えば、図12の例では、各バッファメモリBF1は全ての同じ容量であり、その他のバッファメモリBF2,BF3も、対応するストリームID毎に、全て同じ容量である。
【0069】
そして、分散記憶制御部25は、上記各バッファメモリBF1〜BF3の容量が所定容量、例えば、満杯となったタイミングで、そのバッファメモリBF1〜BF3内の全てのフラグメントデータを、データ格納ファイルF1〜F12に格納する。例えば、図12の例では、ストリームID=ST1の全てのバッファメモリBF1が同時に満杯となるため、当該各バッファメモリBF1内のフラグメントデータを同一のタイミングで各データ格納ファイルF1〜F12に格納する。このとき、分散記憶制御部25は、各データ格納ファイルF1〜F12に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータD1〜D12を格納する。例えば、図13に示す例では、各データ格納ファイルF1〜F12が空の状態であり、当該各データ格納ファイルF1〜F12の先頭から、フラグメントデータを格納する。
【0070】
すると、図13に示すように、各データ格納ファイルF1〜F12では、同一のデータセット40を構成する各フラグメントデータD1〜D12の格納位置が揃うよう格納される。このとき、さらに、同じストリームIDが付与されたデータセットが連続して格納されることとなる。なお、図14には、その後、さらに別のストリームID(ST2)に対応するバッファメモリBF2が満杯となり、当該バッファメモリBF2内のフラグメントデータが、データ格納ファイルF1〜F12に格納されたときの様子を示している。
【0071】
また、分散記憶制御部25は、上述したように、フラグメントデータをデータ格納ファイルに格納する時のみならず、すでに格納されたフラグメントデータに対しても、同一のストリームIDのフラグメントデータが連続して配置されるよう、事後的に格納位置を変更する機能も有する。例えば、ストレージシステム10自体のリソースが所定値以上空いているときに、各データ格納ファイルF1〜F12に格納されているフラグメントデータを、ストリームIDが同一のものが連続するよう格納位置を移動する。具体的には、図10に示すように、各データ格納ファイルF1〜F12の同一の格納位置(横一列)に格納されている全てのフラグメントデータの格納位置を、当該各フラグメントデータにて構成されるデータセット40ごと、変更することができる。これにより、図10に示すように、ストリームIDが異なるデータセットが交互に格納された状態から、図15に示すように、同一のストリームIDのものが連続する格納状態にすることができる。
【0072】
なお、上記では、フラグメント生成部24にて、ブロックデータDを分割してデータセット40を生成する際に、当該データセット40を構成する各フラグメントデータD1〜D12にそれぞれ同一のストリームIDを付与したが、必ずしも各フラグメントデータD1〜D12に付与する必要はない。例えば、ブロックデータDから生成したデータセット40を構成する各フラグメントデータF1〜F12を、当該ブロックデータDに付与されたストリームIDに対応するデータバッファBF1〜BF3に格納することで、ストリームID毎にフラグメントデータを連続させて格納することができる。そして、その後は、同じデータセット40を構成する各フラグメントデータD1〜D12は、各バッファメモリBF1〜BF3内及びデータ格納ファイルF1〜F12内で同一の格納位置に格納されているため、当該同一の格納位置にある全てのフラグメントデータの格納位置をまとめて変更することで、データセット毎の格納位置の変更が可能となる。
【0073】
さらに、分散記憶制御部25は、データセット40を構成する各フラグメントデータD1〜D12に、同一のデータセット40を構成していることを識別するために、同一の識別情報(WriteRecordSeqNum)を付与して、各データ格納ファイルF1〜F12にそれぞれ格納する。そして、分散記憶制御部25は、ストレージシステム10のリソースが空いているときなど任意のタイミングで、上記識別情報を調べることで、同一のデータセット40を構成している各フラグメントデータが、各データ格納ファイルF1〜F12内の同一の格納位置に格納されているか、ということを調べることができる。従って、分散記憶制御部25は、各データ格納ファイルF1〜F12内の同一の格納位置に格納されている各フラグメントデータが、全て同一の識別情報(WriteRecordSeqNum)を含んでいなければ、当該各フラグメントデータが同一の格納位置に格納されるよう当該格納位置を修正して、データを再格納する。
【0074】
なお、上記では、分散記憶制御部25が、データ格納ファイルF1〜F12といった論理的な各記憶領域内における同一位置に、データセット40を構成する各フラグメントデータD1〜D12を格納することを説明したが、複数の各記憶装置31内において物理的に同一位置に格納してもよい。
【0075】
また、上記格納位置管理部26(格納位置情報管理手段)は、上述したように記憶装置31に格納したフラグメントデータD1〜D12の格納位置、つまり、当該フラグメントデータD1〜D12にて復元されるブロックデータDの格納位置を表す、コンテンツアドレスCAを生成して管理する。具体的には、格納したブロックデータDの内容に基づいて算出したハッシュ値Hの一部(ショートハッシュ)(例えば、ハッシュ値Hの先頭8B(バイト))と、論理格納位置を表す情報と、を組み合わせて、コンテンツアドレスCAを生成する。そして、このコンテンツアドレスCAを、ストレージシステム10内のファイルシステム、つまり、アクセラレータノード10Aに返却する(図6の矢印Y7)。すると、アクセラレータノード10Aは、バックアップ対象データのファイル名などの識別情報と、コンテンツアドレスCAとを関連付けてファイルシステムで管理する。
【0076】
また、上記格納位置管理部26は、ブロックデータDのコンテンツアドレスCAと、当該ブロックデータDのハッシュ値Hと、を関連付けて、各ストレージノード10BがMFIファイルにて管理する。このように、上記コンテンツアドレスCAは、ファイルを特定する情報やハッシュ値Hなどと関連付けられて、アクセラレータノード10Aやストレージノード10Bの記憶装置30に格納される(格納位置情報記憶部32)。
【0077】
さらに、上記格納位置管理部26は、上述したように格納したバックアップ対象データを読み出す制御を行う。例えば、ストレージシステム10に対して、特定のファイルを指定して読み出し要求があると(図7の矢印Y11参照)、まず、ファイルシステムに基づいて、読み出し要求にかかるファイルに対応するハッシュ値の一部であるショートハッシュと論理位置の情報からなるコンテンツアドレスCAを指定する(図7の矢印Y12参照)。そして、格納位置管理部26は、コンテンツアドレスCAがMFIファイルに登録されているか否かを調べる(図7の矢印13参照)。登録されていなければ、要求されたデータは格納されていないため、エラーを返却する。
【0078】
一方、読み出し要求にかかるコンテンツアドレスCAが登録されている場合には、上記コンテンツアドレスCAにて指定される格納位置を特定し、この特定された格納位置に格納されている各フラグメントデータを、読み出し要求されたデータとして読み出す(図7の矢印Y14参照)。このとき、各フラグメントが格納されているデータ格納ファイルF1〜F12と、当該データ格納ファイルのうち1つのフラグメントデータの格納位置が分かれば、同一の格納位置から他のフラグメントデータの格納位置を特定することができる。
【0079】
そして、格納位置管理部26は、読み出し要求に応じて読み出した各フラグメントデータからブロックデータDを復元する(図7の矢印Y15参照)。さらに、格納位置管理部25は、復元したブロックデータDを複数連結し、ファイルAなどの一群のデータに復元して、読み出し制御を行っているアクセラレータノード10Aに返却する(図17の矢印Y16参照)。
【0080】
[動作]
次に、上述したストレージシステムの動作を、図10のフローチャートを参照して説明する。
【0081】
はじめに、ストレージシステム10が、所定のバックアップ対象装置12からバックアップシステム11を介してバックアップ対象データを受け、当該バックアップ対象データを記憶装置31に記憶する動作(データ記憶工程)について説明する。
【0082】
まず、ストレージシステム10、つまり、アクセラレータノード10Aは、バックアップ対象データAの入力を受けると、一群のデータである当該バックアップ対象データAを区別する識別情報であるストリームIDを付与する(ステップS1、識別情報付与工程)。
【0083】
そして、アクセラレータノード10Aは、バックアップ対象データAを、所定容量(例えば、64KB)のブロックデータDに分割する(ステップS2)。そして、このブロックデータDのデータ内容に基づいて、当該データ内容を代表する固有のハッシュ値H(内容識別情報)を算出する(ステップS3)。そして、このハッシュ値Hが、MFIファイルに登録されているか否かを調べる。このとき、登録されている場合には、当該データブロックDのハッシュ値HにMFIファイル内で関連付けられているコンテンツアドレスCAを、このデータブロックDの格納位置として、ファイルシステムに返却する。つまり、バックアップ対象データと同一のデータが記憶されているため、この既に記憶されている同一のデータを用いて、バックアップ対象データを記憶したこととする。従って、後にこのバックアップ対象データを読み出す際には、ファイルシステムが上記コンテンツアドレスCAが表す格納位置のデータを読み出すことで、同一のデータを読み出すことができる。
【0084】
一方、ブロックデータDのハッシュ値がMFIファイルに登録されていなかった場合、つまり、ブロックデータDと同一のデータが記憶されていなかった場合には、当該ブロックデータDを記憶する処理を行う。このとき、まず、上述したように算出したハッシュ値の一部に基づいて、実際にデータを格納するストレージノード10Bを特定し、また、そのうちの1つのストレージノード10Bを、以下に説明するようブロックデータDに対する記憶前処理を実行するWrite Initiator(WI)として決定する。
【0085】
なお、上述したようにバックアップ対象データAをブロックデータDに分割する際には、上述したようにバックアップ対象データAに付与したストリームIDを、各ブロックデータDにも引き継いで付与する。
【0086】
続いて、上述したようにWIとして決定されたストレージノード10Bは、ブロックデータDを圧縮した後に、例えば、9つのフラグメントデータに分割する(ステップS4)。また、この分割データがいくつかが欠けた場合であっても、上記ブロックデータDを復元できるよう、上記フラグメントデータに冗長データを例えば3つ付加する。そして、9つの分割データと3つの冗長データとにより構成される12個のフラグメントデータによるデータセットを生成する(ステップS5、データセット生成工程)。
【0087】
続いて、WIとして決定されたストレージノード10Bは、上記各フラグメントにデータセットを識別するためのIDを付与する(ステップS6)。つまり、一のブロックデータDから分割されて生成されたデータセットを構成する各フラグメントデータに、全て同一のIDを付与する。
【0088】
そして、ストレージノード10Bは、各データ格納ファイルF1〜F12毎に、それぞれストリームID毎のバッファメモリを設定する。そして、フラグメントデータD1〜D12に含まれているストリームIDに対応するバッファメモリBF1,BF2,BF3に、当該各フラグメントデータD1〜D12をそれぞれ格納する(ステップS7)。このとき、各フラグメントデータD1〜D12を、各バッファメモリBF1〜BF3内に既に格納されているデータの次に空いている格納領域に、全て同時のタイミングで格納する。
【0089】
これにより、各バッファメモリBF1〜BF3内には、対応するストリームIDのフラグメントデータが連続して位置して格納される。また、このとき、同一のデータセットを構成する各フラグメントデータD1〜D12は、各バッファメモリBF1〜BF3内において同一の格納位置に格納される。
【0090】
その後、上記各バッファメモリBF1〜BF3の容量が所定容量、例えば、満杯となったタイミングで(ステップS8でYes)、そのバッファメモリBF1〜BF3内のフラグメントデータを、データ格納ファイルF1〜F12に格納する(ステップS9、分散記憶制御工程)。このとき、各データ格納ファイルF1〜F12に格納されているデータの次に空いている格納位置に、それぞれフラグメントデータD1〜D12を格納する。なお、バッファメモリからデータ格納ファイルにフラグメントデータを格納するタイミングは、必ずしも上記タイミングに限定されない。例えば、ある基準時間から設定された時間が経過したタイミングで実行してもよい。
【0091】
これにより、ストレージノード10Bは、各データ格納ファイルF1〜F12内において同一位置に、1つのデータセット40を構成する全てのフラグメントデータD1〜D12を格納することができる。さらに、各データ格納ファイルF1〜F12内には、同一のストリームIDのデータが連続して格納されることとなる。
【0092】
そして、ストレージノード10Bは、格納したブロックデータDの内容に基づいて算出したハッシュ値Hの一部(先頭8B)と、論理格納位置を表す情報と、を組み合わせて、記憶装置31に格納したフラグメントデータD1〜D12の格納位置を表す、コンテンツアドレスCAを生成する。そして、ストレージノード10Bは、このコンテンツアドレスCAを、アクセラレータノード10Aに返却する。すると、アクセラレータノード10Aでは、返却されたコンテンツアドレスCAを、実際に記憶したバックアップ対象データのファイル名などと関連付けて、ファイルシステムにて管理する。
【0093】
また、ストレージノード10Bは、上記生成したブロックデータDのコンテンツアドレスCAと、当該ブロックデータDのハッシュ値Hと、を関連付けて、MFIファイルにて管理する。このハッシュ値HとコンテンツアドレスCAとを管理するMFIファイルは、上述したように、新たにバックアップ対象データを格納する際に、すでに同一内容のデータが格納されているか否かを確認するために用いられる。
【0094】
その後、例えば、ストレージシステム10自体のリソースが所定値以上空いているときなどの任意のタイミングで(ステップS10でYes)、すでに格納されたフラグメントデータに対して、同一のストリームIDのフラグメントデータが連続して配置されるよう、事後的に格納位置を変更する処理を実行する(ステップS11)。この処理は、各データ格納ファイルF1〜F12の同一の格納位置に格納されている各フラグメントデータ内のストリームIDを調べ、なるべく多くの同じストリームIDのフラグメントデータつまりデータセットの格納位置が連続するよう、当該フラグメントデータの格納位置を変更する。
【0095】
ここで、上述した各フラグメントデータD1〜D12を各データ格納ファイルF1〜F12に格納する際、つまり、WIとして決定されたストレージノード10Bから、他の各ストレージノード10Bにフラグメントデータを格納する際には、当該ストレージノード10B間で通信がダウンしたり、通信遅延が発生する場合が生じうる。その場合には、1つのデータセット40の構成する全てのフラグメントデータD1〜D12が、各データ格納ファイルF1〜F12内の同一位置に格納されない事態が生じうる。このような事態を想定して、ストレージシステム10では、リソースが空いているなど任意のタイミングで、すでに記憶されている各フラグメントデータD1〜D12に含まれるデータセット毎の識別情報(WriteRecordSeqNum)を参照して、一つのデータセット40の構成する全てのフラグメントデータD1〜D12が、各データ格納ファイルF1〜F12内の同一位置に格納されるよう、再格納処理を行う。
【0096】
次に、ストレージシステム10が、バックアップシステム11を介してデータの読み出し要求を受け、記憶装置31からデータを読み出す動作(データ読み出し工程)について説明する。
【0097】
ストレージシステム10に読み出し要求があると、まず、アクセラレータノード10Aが読み出し要求にかかるファイルに対応するショートハッシュと論理位置の情報からなるコンテンツアドレスCAを指定する。そして、このコンテンツアドレスCAを受けたストレージノード10Bは、当該コンテンツアドレスCAがMFIファイルに登録されているか否かを調べ、登録されていなければ、要求されたデータは格納されていないため、エラーを返却する。
【0098】
一方、登録されている場合には、上記コンテンツアドレスCAに基づいて、読み出し要求にかかるデータを構成する各フラグメントデータの格納位置を特定する。このとき、各フラグメントが格納されているデータ格納ファイルF1〜F12と、当該データ格納ファイルのうち1つのフラグメントデータの格納位置が分かれば、同一の格納位置から他のフラグメントデータの格納位置を特定することができる。
【0099】
そして、ストレージノード10Bは、読み出し要求に応じて読み出した各フラグメントデータからブロックデータDを復元する。さらに、ストレージノード10Bは、復元したブロックデータDを複数連結し、ファイルAなどの一群のデータに復元して、読み出し制御を行っているアクセラレータノード10Aに返却する。
【0100】
なお、仮に、記憶装置31の障害により、1つのデータセットを構成する12個のフラグメントデータのうち3つのフラグメントデータを読み取ることができなかった場合であっても、上述した3つの冗長データを付加している場合であれば、元のブロックデータを復元することができる。特に、12個のフラグメントデータをそれぞれ異なる記憶装置31(ディスク)に格納した場合には、3つの記憶装置31の同時障害までは対応可能である。
【0101】
そして、特に、本実施形態では、読み出し要求にかかるデータを読み出すと共に、そのデータの格納位置の前後などの近辺の格納位置に格納されているデータも事前に読み出す。このようにすることで、読み出し要求にかかるデータの近辺には、当該読み出し要求にかかるデータとストリームIDが同じ可能性が高いため、後に必要とされるデータを予測して読み出すことができる。従って、データの読み出し速度及び効率が向上する。
【0102】
以上により、本実施形態におけるストレージシステム10によると、記憶したデータを読み出す際に、当該データを構成するデータセットのうち1つのフラグメントデータの格納位置を特定することで、他のフラグメントデータの格納位置も容易に特定することができる。また、一群のデータを構成する複数の記憶対象データが連続して記憶されるため、関連する内容のデータがまとまって記憶されることとなる。従って、ストレージシステムが記憶したデータを読み出す際に、関連するデータをまとめて読み出すことが可能となる。その結果、データ読み出し速度及び効率の向上を図ることができ、ストレージシステムの性能の向上を図ることができる。
【産業上の利用可能性】
【0103】
本発明は、複数のコンピュータを接続して構成されるストレージシステムに利用することができ、産業上の利用可能性を有する。
【符号の説明】
【0104】
1 ストレージシステム
2 データ処理手段
3 識別情報付与手段
4 データセット生成手段
5 分散記憶制御手段
6 記憶手段
10 ストレージシステム
10A アクセラレータノード
10B ストレージノード
11 バックアップシステム
12 バックアップ対象装置
20 データ処理装置
21 ストリームID付与部
22 ブロック生成部
23 重複チェック部
24 フラグメント生成部
25 分散記憶制御部
26 格納位置管理部
30 データ記憶装置
31 記憶装置
32 格納位置記憶部
40 データセット
41 分割データ
42 冗長データ
A バックアップ対象データ
BF1,BF2,BF3 バッファメモリ
CA コンテンツアドレス
D ブロックデータ
D1〜D12 フラグメントデータ
F1〜F12 データ格納ファイル
H ハッシュ値


【特許請求の範囲】
【請求項1】
複数の記憶手段と、これら複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段と、を備え、
前記データ処理手段は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段と、
前記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、前記分割データと前記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
前記データセットを構成する前記各フラグメントデータを分散して、前記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して前記記憶対象データを記憶する分散記憶制御手段と、を備えると共に、
前記分散記憶制御手段は、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
ストレージシステム。
【請求項2】
請求項1記載のストレージシステムであって、
前記分散記憶制御手段は、前記記憶手段に格納される前であって、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された前記各フラグメントデータを前記各記憶手段に格納する、
ストレージシステム。
【請求項3】
請求項2記載のストレージシステムであって、
前記分散記憶制御手段は、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記識別番号毎にそれぞれ異なる前記バッファメモリに格納し、当該識別番号毎にそれぞれ設けられた前記各バッファメモリに格納された前記各フラグメントデータを前記各記憶手段に格納する、
ストレージシステム。
【請求項4】
請求項2又は3記載のストレージシステムであって、
前記分散記憶制御手段は、前記バッファメモリの容量が所定容量に達したタイミングで、当該バッファメモリに格納された前記各フラグメントデータを前記各記憶手段に格納する、
ストレージシステム。
【請求項5】
請求項1乃至4記載のいずれか一項に記載のストレージシステムであって、
前記分散記憶制御手段は、前記各記憶手段に既に格納されている、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
ストレージシステム。
【請求項6】
請求項1乃至5のいずれか一項に記載のストレージシステムであって、
前記データセット生成手段は、前記識別情報付与手段にて前記一群のデータに付与された前記識別情報を、当該一群のデータに含まれる複数の前記記憶対象データに対応する前記データセットを構成する前記各フラグメントデータに含める、
ストレージシステム。
【請求項7】
請求項1乃至6のいずれか一項に記載のストレージシステムであって、
前記データ処理手段は、前記分散記憶制御手段にて前記各記憶手段に格納した前記記憶対象データの格納位置を表す格納位置情報を生成して管理する格納位置情報管理手段を備え、
この格納位置情報管理手段は、データの読み出し要求時に特定された当該データの前記格納位置情報に基づいて、当該格納位置情報にて表される前記各記憶手段内の格納位置に格納されたデータを読み出す、
ストレージシステム。
【請求項8】
請求項7記載のストレージシステムであって、
前記データ処理手段は、前記記憶対象データの内容に固有の内容識別情報を生成すると共に、前記各記憶手段に既に格納されている記憶対象データの内容に固有の内容識別情報と比較して、前記各記憶手段に同一内容の前記記憶対象データが記憶されているか否かを調べる重複チェック手段を備え、
当該重複チェック手段は、前記記憶対象データと同一内容のデータが既に前記各記憶手段に記憶されている場合に、当該記憶対象データを前記各記憶手段に格納せず、当該記憶対象データの格納位置情報として前記同一内容のデータの格納位置情報を用いる、
ストレージシステム。
【請求項9】
複数の記憶手段を備えた情報処理装置に、
前記複数の記憶手段に対してデータを記憶すると共に当該記憶手段に記憶されているデータを読み出すデータ処理手段を実現させると共に、
前記データ処理手段は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与手段と、
前記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、前記分割データと前記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成手段と、
前記データセットを構成する前記各フラグメントデータを分散して、前記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して前記記憶対象データを記憶する分散記憶制御手段と、を備え、
前記分散記憶制御手段は、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
プログラム。
【請求項10】
請求項9記載のプログラムであって、
前記分散記憶制御手段は、前記記憶手段に格納される前であって、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された前記各フラグメントデータを前記各記憶手段に格納する、
プログラム。
【請求項11】
請求項9又は10記載のプログラムであって、
前記分散記憶制御手段は、前記各記憶手段に既に格納されている、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
プログラム。
【請求項12】
複数の記憶手段を備えた情報処理装置にて、
前記複数の記憶手段に対してデータを記憶するデータ記憶工程と、当該記憶手段に記憶されているデータを読み出すデータ読み出し工程と、を有すると共に、
前記データ記憶工程は、
記憶要求された一群のデータを区別する識別情報を、当該一群のデータに付与する識別情報付与工程と、
前記一群のデータの一部である記憶対象データを複数に分割して分割データを生成すると共に、この記憶対象データを復元するための冗長データを生成し、前記分割データと前記冗長データとである複数のフラグメントデータからなるデータセットを生成するデータセット生成工程と、
前記データセットを構成する前記各フラグメントデータを分散して、前記各記憶手段に形成された各記憶領域内の同一位置にそれぞれ格納して前記記憶対象データを記憶する分散記憶制御工程と、を有し、
前記分散記憶制御工程は、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記各記憶領域内における格納位置が連続するよう当該各記憶領域に格納する、
データ処理方法。
【請求項13】
請求項2記載のデータ処理方法であって、
前記分散記憶制御工程は、前記記憶手段に格納される前であって、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、バッファメモリ内の格納位置が連続するよう格納し、当該バッファメモリに格納された前記各フラグメントデータを前記各記憶手段に格納する、
データ処理方法。
【請求項14】
請求項12又は13記載のデータ処理方法であって、
前記分散記憶制御工程は、前記各記憶手段に既に格納されている、同一の前記識別情報が付与された前記一群のデータに含まれる複数の前記記憶対象データに対応する複数の前記データセットをそれぞれ構成する前記各フラグメントデータを、前記各記憶領域内における格納位置が連続するよう当該各記憶領域に再格納する、
データ処理方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate