説明

データ格納装置のデータ復旧方法及びその装置並びにディスクアレイシステムのデータ復旧方法及びその装置

【課題】ディスクアレイシステムの信頼性の向上等を図る。
【解決手段】ディスクアレイシステム1がRAID5で動作しているときに、ホスト2からディスクアレイ3へのアクセスコマンドを受け取るRAID情報管理部11は、当該コマンド対応の制御をディスク処理制御部12に対して行う。そのアクセス処理中のエラー回数がディスク処理制御部12からエラー情報管理部13へ通知する。エラー情報管理部13は、エラー回数が多いランクを検出し、検出されたランクについてのQパリティのスペアディスクへの作成依頼がRAID情報管理部11に行われると、RAID情報管理部11によって制御されるスペアディスク制御部14は、選択されたスペアディスクのQパリティディスクへの切り替えを行って検出された上記ランクをRAID6に移行させる。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、データ格納装置のデータ復旧方法及びその装置、ディスクアレイシステムのデータ復旧方法及びその装置並びにそれらの制御プログラムに関し、詳しくはデータ処理システムの信頼性の向上に有用なデータ格納装置のデータ復旧方法及びその装置、ディスクアレイシステムのデータ復旧方法及びその装置並びにそれらの制御プログラムに関する。
【背景技術】
【0002】
ディスクアレイシステムにおいて、従来からRAID(Redundant Arrays of Inexpensive Disks、又はRedundant Arrays of Independent Disks)技術は、よく知られている。RAID技術は、複数のハードディスク(HDD(Hard Disk))にデータを並列に書き込むことにより耐障害性を向上させる技術である。RAID技術には、RAIDレベル0からRAIDレベル5までの他に、RAIDレベル6も開発され実用に供されている。
【0003】
RAID技術のうちのRAID5は、パリテイを1つ使用してハードディスクにデータエラーが発生したとき、そのデータエラーが発生したデータの復旧を行うようにしている。
しかし、例えば、RAID5で構成されるランク(複数のハードディスク内の一部集合)内の1つのディスク(図6の61)が故障し、スペアディスク(図6の62)に対して復旧する際に、復旧元のディスクでメディアエラー等のエラーが発生した場合に、復旧が失敗したアドレスについてのデータが消失するという問題がある。なお、図6において、ディスク63は、ディスク62にエラーが発生する前に縮退したディスクである。
【0004】
この問題を解決するための手段として、図7に示すように、各ディスク毎のエラー情報を監視し、しきい値を超えたディスク(図7の71)をスペアディスク(図7の72)にコピーし、コピー完了後縮退(予防コピー)する技術(以下、従来の改良技術という)が開発されている。
また、特許文献1には、RAIDアレイの故障後に、ディスクアレイのストライプ情報に基づいてパリテイの再計算をすべきストライプと再計算をしないストライプとを判別し、これによりRAIDアレイを適正に回復させる技術が開示されている。
【0005】
また、特許文献2には、ディスク装置のエラー数が基準値以上か否かを判断し、基準値以上と判断されたとき当該ディスク装置の故障診断をした後に、そのディスク装置の縮退を行う技術が開示されている。
また、特許文献3には、ディスクアレイの複数の冗長グループ単位に対して複数のRAIDレベルを用意しておき、ディスクアレイの複数の冗長グループ単位の中のデータ損失の確率が高いと判断されるRAIDレベル、すなわち、最も弱いRAIDレベルから、データ再構築を、RAIDレベルでのシステム構成を変更することなく、冗長グループ単位全体について順次に行う技術が開示されている。
【特許文献1】特開2007−184011号公報
【特許文献2】特開2007−241837号公報
【特許文献3】特開2001−147785号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
上述した従来の改良技術は、しきい値を超えたディスクをスペアディスクにコピーしてしまうため、エラー情報がしきい値を超えたが、なお、使用し得るディスクのコピーを行い、縮退させるため、縮退率の上昇が避けられないという問題がある。
【0007】
特許文献1は、RAIDアレイの故障があるとき、RAIDアレイを適正に回復させるための手段として、RAIDアレイの故障後に、ディスクアレイのストライプ情報に基づいてパリテイの再計算をすべきストライプと再計算をしないストライプとを判別することを必須要件とするものであり、RAIDアレイの回復のためのその他の技術的事項への言及はない。
【0008】
特許文献2は、エラー数が基準値以上にあるディスク装置の故障診断後に、そのディスク装置の縮退を行う技術であり、同一のディスク装置保護レベルの中での技術的処置を採用しているに過ぎない。
特許文献3は、ディスクアレイの複数の冗長グループ単位の中のデータ損失の確率が高いと判断されるRAIDレベル、すなわち、最も弱いRAIDレベルから、データ再構築を、RAIDレベルでのシステム構成を変更することなく、冗長グループ単位全体について順次に行うため、複数の冗長グループ単位分のスペアディスクが必要となるという技術的課題がある。
【0009】
この発明は、上述の事情に鑑みてなされたもので、データ処理システムの信頼性の向上に寄与し得るデータ格納装置のデータ復旧方法及びその装置、ディスクアレイシステムのデータ復旧方法及びその装置並びにそれらの制御プログラムを提供することを目的としている。
【課題を解決するための手段】
【0010】
上記課題を解決するために、この発明の第1の構成は、格納制御手段によってアクセスされる複数の格納領域のデータについて第1のパリテイを生成して上記データを第1のレベルで管理するデータ格納システムで上記データにエラーが発生したとき当該データの復旧を行うデータ復旧方法に係り、上記エラーの情報を管理し、管理されている上記エラーの情報に基づいて上記エラーが多く発生する可能性の高い上記格納領域を予測し、予測される当該格納領域のデータについて上記第1のパリテイとは異なる第2のパリテイを生成し、上記格納制御手段によってアクセスされる上記格納領域であって予測された上記格納領域を、一時的に、生成された上記第2のパリティに用いて上記第1のレベルとは異なる第2のレベルで管理することを特徴としている。
【0011】
この発明の第2の構成は、格納制御手段によってアクセスされる複数の格納領域のデータについて第1のパリテイを生成して上記データを第1のレベルで管理するデータ格納システムに係り、上記データに発生するエラーの情報を管理する情報管理手段と、該情報管理手段によって管理されている上記エラーの情報に基づいて上記エラーが多く発生する可能性の高い上記格納領域を予測する予測手段と、該予測手段によって予測される当該格納領域のデータについて上記第1のパリテイとは異なる第2のパリテイを生成するパリテイ生成手段と、上記格納制御手段によってアクセスされる上記格納領域であって上記予測手段によって予測された上記格納領域を、一時的に、上記生成手段によって生成された上記第2のパリティに用いて上記第1のレベルとは異なる第2のレベルで管理するレベル管理手段とを備えることを特徴としている。
【0012】
この発明の第3の構成は、データ格納システムのデータ復旧方法を実行させる制御プログラムに係り、コンピュータに上記第1の構成に係るデータ格納システムのデータ復旧方法を実行させることを特徴としている。
【0013】
この発明の第4の構成は、データ格納システムを制御させる制御プログラムに係り、コンピュータに上記第2の構成に係るデータ格納システムを制御させることを特徴としている。
【発明の効果】
【0014】
この発明によれば、格納制御手段によってアクセスされる複数の格納領域のデータについて第1のパリテイを生成して上記データを第1のレベルで管理するデータ格納システムで上記データにエラーが発生したとき当該データを復旧する際に、上記エラーの情報を管理し、管理されているエラーの情報に基づいてエラーが多く発生する可能性の高い格納領域を予測し、予測される当該格納領域のデータについて上記第1のパリテイとは異なる第2のパリテイを生成し、上記格納制御手段によってアクセスされる上記格納領域であって予測された上記格納領域を、一時的に、生成された上記第2のパリティに用いて上記第1のレベルとは異なる第2のレベルで管理するようにしたので、縮退率を上げずに信頼性を強化することができる。
また、この信頼性を得るのに必要なディスク台数を低減させることができる。
【発明を実施するための最良の形態】
【0015】
この発明は、格納制御手段によってアクセスされる複数の格納領域のデータについて第1のパリテイを生成して上記データを第1のレベルで管理するデータ格納システムで発生するエラーの情報を管理すること、そのエラーの情報に基づいてエラーが多く発生する可能性の高い格納領域を予測すること、予測される当該格納領域のデータについて上記第1のパリテイとは異なる第2のパリテイを生成すること、上記格納制御手段によってアクセスされる上記格納領域であって予測された上記格納領域を、一時的に、生成された上記第2のパリティに用いて上記第1のレベルとは異なる第2のレベルで管理することを含んで構成される。
【実施形態1】
【0016】
図1は、この発明の実施形態1であるディスクアレイシステムの電気的構成を示すブロック図、図2は、同ディスクアレイ装置の制御を説明する概念図、また、図3は、同ディスクアレイ装置の制御手順を示すフローチャートである。
この実施形態のディスクアレイシステム1は、RAID5で動作するように構成されたディスクアレイシステムの中の、エラーの多いランクをRAID6で動作させる装置に係り、図1に示すように、ディスクアレイシステム1は、ディスクアレイ装置10とディスクアレイ3とで概略構成されている。
【0017】
ディスクアレイ装置10は、RAID情報管理部11と、ディスク処理制御部12と、エラー情報管理部13と、スペアディスク制御部14とから概略構成されている。そのRAID情報管理部11は、ホスト2に接続され、ディスク処理制御部12は、ディスクアレイ3に接続されている。
ディスクアレイ3は、複数のディスク(HDD)3ijに(i=0,1,2,…,mのうちの1つ、j=0,1,2,…,nのうちの1つ)接続されている。
複数のディスク3ijは、複数のディスク群(ランク)に組み込まれるディスクと、ランクに組み込まれないディスクとがあり、後者のディスクは、スペアディスク又はQパリティディスクと呼ばれるディスクとして管理されている。ランクは、例えば、ディスクアレイの行方向の一部のディスク群から構成されている。
【0018】
RAID情報管理部11は、ホスト2から受け取るコマンドがどのディスク3ij対応のものであるか否かの判定、ディスク処理制御部12に対する受信コマンド対応の処理制御の発行(生成)、受け取ったコマンドの処理についての終了報告等を行う機能部である。受信コマンド対応の処理制御の生成は、受信コマンドについてRAID5で行うべきデータ及びPパリテイの処理指示並びにエラー情報管理部13からのQパリテイの処理依頼に基づくQパリテイの生成及びそのQパリテイディスクへの書き込みのための処理指示を含み、これらの処理指示は、同期して、すなわち、一連の処理の中で順次発行されるように構成されており、発行される指示は、ディスク処理制御部12へ渡される。
【0019】
ディスク処理制御部12は、複数のディスク3ijとのデータ転送の制御、データ転送中の障害検出、障害が検出されたときのエラー情報管理部13へのエラーの内容(エラー回数)の通知を行う機能部である。上記のデータ転送の制御には、RAID情報管理部11から発行される処理制御に基づくデータ転送を含む。
【0020】
エラー情報管理部13は、上述の複数のディスク3ijとのデータ転送中に発生したエラーの内容についてのランク毎の管理、管理中のランク毎にエラー回数を計数し、複数のランクの中からエラー回数が多いランクを検出すること、及び検出されるランクについてのQパリティのスペアディスクへの生成をRAID情報管理部11への依頼を行う機能部である。
スペアディスク制御部14は、エラー情報管理部13からRAID情報管理部11を介して上記依頼を受け取ったことに応答しての未使用のスペアディスクの選択、選択されたスペアディスクをQパリティディスクとして使用することの切り替えと、通常のスペアディスクが必要になった場合に、ランク毎のエラー回数の比較、その比較結果に基づき一番エラー回数の少ないランクに割り当てられているQパリティディスクの選択、その選択されたQパリティディスクを通常のスペアディスクとして使用するための切り替えとを行う機能部である。
RAID情報管理部11、ディスク処理制御部12、エラー情報管理部13及びスペアディスク制御部14は、プログラムで制御可能に構成されている。
【0021】
次に、図1乃至図3を参照して、この実施形態の動作を説明する。
この実施形態をスペアディスクを使用した復旧方法について説明する。
ディスクアレイシステム1においてディスクの故障検出を開始すると、エラー情報管理部13が、ディスクアレイ3のランク毎のエラーの情報管理を行い(図3のステップS1)、スペアディスク制御部14が、未使用のスペアディスクの台数を確認して未使用のスペアディスクの台数が2以上であるか否かを判定する(図3のステップS2)
【0022】
未使用のスペアディスクが1台以下であるならば(図3のステップS2のno)、エラー情報管理部13が、ランク毎のエラー回数を比較し、一番エラー回数の少ないランクに割り当てられているQパリティディスクを選び、スペアディスク制御部14が、そのQパリティディスクをスペアディスクに変更する(図3のステップS3)。
未使用のスペアディスクが2台以上であるならば(図3のステップS2のyes)、スペアディスク制御部14が、未使用のスペアディスクをQパリティディスクに変更する(図3のステップS4)。
【0023】
そして、スペアディスク制御部14が、未使用のQパリティディスクの数を確認する(図3のステップS5)。未使用のQパリティディスクがないならば(図3のステップS5のno)、ステップS1へ戻る。
未使用のQパリティディスクがあるならば(図3のステップS5のyes)、エラー情報管理部13が、Qパリティを使用していないランクの中で、一番エラーの多いランク(図2のエラーの多いHDD)を選び、Qパリティディスクの生成をRAID情報制御部11に依頼する(図3のステップS6)。
RAID情報制御部11は、エラー情報管理部13から依頼のあったQパリティのデータを未使用のQパリティディスクに作成する(図3のステップS7)。
これにより、RAID5で動作していた一番エラーの多いランクを、一時的に、RAID6に切り替えて動作させることができる。
また、その逆への復帰もできる。
【0024】
このように、この実施形態の構成によれば、スペアディスクを使用しているRAID5において、ランク毎にエラーの情報を管理し、エラーの情報が多いランクについてQパリティを作成し、当該ランクのみを一時的にRAID6に設定するようにしたので、縮退率を上げずに信頼性を強化することができる。
また、RAID5でのシステム構成において、使用していないスペアディスクをエラーの多いランクのQパリティディスクとして使用して信頼性を強化しているので、この信頼性を得るのに必要なディスク台数を、RAID6によるシステム構成に比して低減する、換言すれば、RAID6のランク分のディスクを事前に用意しておく必要性が無くすことができる。
【実施形態2】
【0025】
図4は、この発明の実施形態2であるディスクアレイ装置の制御を説明する概念図である。
この実施形態の構成が、実施形態1のそれと大きく異なる点は、RAID5からRAID6への移行に必要なQパリテイの生成をデータ及びPパリテイの生成と非同期で行うようにした点である。
すなわち、この実施形態のディスクアレイ装置の特徴部分は、実施形態1でのRAID情報管理部においてエラー情報管理部からの依頼に応答してデータ及びPパリテイについての処理指示の発行に続く一連の処理の中でQパリテイについての処理指示を発行するのではなく、データ及びPパリテイについて発行した処理指示から許容し得る時間経過時にQパリテイの生成指示を発行するようにRAID情報管理部を変更することにある。図4において、線41は、書き込み時にデータとPパリティのみを更新し、ホストにレスポンスを返す場合を示し、線42は、ホストにレスポンスを返した後、これと非同期でQパリティの生成指示をRAID情報管理部で発行する場合を示す。
但し、Qパリティの生成が完了している場合に有効になるという制限はある。
【0026】
この実施形態の構成によれば、実施形態1と同効が得られるほか、実施形態1ではRAID5で構成されるランクのうちのエラーの多いランクに対するQパリティについての処理指示を上述した態様で発行するため、Qパリティが1台に集まるのを回避できて、書き込みの性能の劣化を防止することもできる。
【実施形態3】
【0027】
図5は、この発明の実施形態3であるディスクアレイ装置の制御を説明する概念図である。
この実施形態の構成が、実施形態1のそれと大きく異なる点は、スペアディスクとQパリティディスクとの切り替えなく同一の機能を達成し得るようにした点である。
すなわち、この実施形態のディスクアレイ装置の特徴部分は、スペアディスクに大容量のディスクを使用し、このスペアディスクを複数ランクのQパリティディスクとしも使用することにある。
【0028】
この実施形態の構成によれば、スペアディスクとQパリティディスクとの切り替えなしに、実施形態1と同効を得ることができる。
【0029】
以上、この発明の実施例を、図面を参照して詳述してきたが、この発明の具体的な構成は、これらの実施例に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があってもそれらはこの発明に含まれる。
例えば、上記のいずれの実施形態は、1つのランクについてRAID6を構築する例を説明したが、2以上のランクについてもRAID6を構築する仕組みに拡張することもできる。
上記各実施形態を構成するプログラムは、プログラミング言語で構成されるほか、その全部又は一部がファームウェアで構成されてもよい。
また、ディスクは、磁気ディスクであっても、半導体ディスクであってもよい。
上述したエラー発生度の高いランクをRAID構成のシステムの中で決定する例について説明したが、これと同等のことをその他の冗長アレイ構成のデータ格納システムにおいて実施し得る。
【産業上の利用可能性】
【0030】
ここに開示しているデータ格納装置のデータ復旧方法及びその装置、ディスクアレイシステムのデータ復旧方法及びその装置並びにそれらの制御プログラムは、ディスクアレイを記憶手段として使用する各種の情報処理装置で利用し得る。
【図面の簡単な説明】
【0031】
【図1】この発明の実施形態1であるディスクアレイ装置の電気的構成を示すブロック図である。
【図2】同ディスクアレイ装置の制御を説明する概念図である。
【図3】同ディスクアレイ装置の制御手順を示すフローチャートである。
【図4】この発明の実施形態2であるディスクアレイ装置の制御を説明する概念図である。
【図5】この発明の実施形態3であるディスクアレイ装置の制御を説明する概念図である。
【図6】従来の1つのディスクアレイシステムの欠点を説明するための概念図である。
【図7】従来の他のディスクアレイシステムの欠点を説明するための概念図である。
【符号の説明】
【0032】
1 ディスクアレイシステム
10 ディスクアレイ装置
11 RAID情報管理部(パリティ生成手段、レベル管理手段の一部)
12 ディスク処理制御部(格納制御手段)
13 エラー情報管理部(情報管理手段、予測手段)
14 スペアディスク制御部(レベル管理手段の残部)

【特許請求の範囲】
【請求項1】
格納制御手段によってアクセスされる複数の格納領域のデータについて第1のパリテイを生成して前記データを第1のレベルで管理するデータ格納システムで前記データにエラーが発生したとき当該データの復旧を行うデータ復旧方法であって、
前記エラーの情報を管理し、
管理されている前記エラーの情報に基づいて前記エラーが多く発生する可能性の高い前記格納領域を予測し、
予測される当該格納領域のデータについて前記第1のパリテイとは異なる第2のパリテイを生成し、
前記格納制御手段によってアクセスされる前記格納領域であって予測された前記格納領域を、一時的に、生成された前記第2のパリティに用いて前記第1のレベルとは異なる第2のレベルで管理することを特徴とするデータ格納システムのデータ復旧方法。
【請求項2】
格納制御手段によってアクセスされるデータをRAID5で管理するディスクアレイのデータ復旧方法であって、
前記ディスクアレイシステムのランク毎に前記エラーの情報を管理し、
管理されている前記エラーの情報に基づいて前記エラーが多く発生する可能性の高いランクを予測し、
予測される当該ランクのQパリティを生成し、
前記格納制御手段によってアクセスされる前記ランクであつて予測された前記ランクを、一時的に、生成された上記Qパリテイに用いてRAID6で管理することを特徴とするディスクアレイシステムのデータ復旧方法。
【請求項3】
予測される前記ランクは、複数であることを特徴とする請求項2記載のディスクアレイシステムのデータ復旧方法。
【請求項4】
生成された前記Qパリテイは、RAID5で動作しているディスクアレイシステムの中の未使用のスペアディスクから変更されたQパリテイディスクに格納されることを特徴とする請求項2又は3記載のディスクアレイシステムのデータ復旧方法。
【請求項5】
前記Qパリテイは、RAID5についてのデータ及びPパリティの生成と非同期で生成することを特徴とする請求項2、3又は4記載のディスクアレイシステムのデータ復旧方法。
【請求項6】
前記スペアディスクの記憶領域と前記Qパリテイディスクの記憶領域とを単一のディスクに設けることを特徴とする請求項4又は5記載のディスクアレイシステムのデータ復旧方法。
【請求項7】
格納制御手段によってアクセスされる複数の格納領域のデータについて第1のパリテイを生成して前記データを第1のレベルで管理するデータ格納システムであって、
前記データに発生するエラーの情報を管理する情報管理手段と、
該情報管理手段によって管理されている前記エラーの情報に基づいて前記エラーが多く発生する可能性の高い前記格納領域を予測する予測手段と、
該予測手段によって予測される当該格納領域のデータについて前記第1のパリテイとは異なる第2のパリテイを生成するパリテイ生成手段と、
前記格納制御手段によってアクセスされる前記格納領域であって前記予測手段によって予測された前記格納領域を、一時的に、前記生成手段によって生成された前記第2のパリテイに用いて前記第1のレベルとは異なる第2のレベルで管理するレベル管理手段とを備えることを特徴とするデータ格納システム。
【請求項8】
格納制御手段によってアクセスされるディスクアレイのランクをRAID5で管理するディスクアレイシステムであって、
前記ディスクアレイシステムのランク毎に前記エラーの情報を管理する情報管理手段と、
該情報管理手段によって管理されている前記エラーの情報に基づいて前記エラーが多く発生する可能性の高いランクを予測する予測手段と、
該予測手段によって予測される当該ランクのQパリティを生成する生成手段と、
前記格納制御手段によってアクセスされる前記ランクであつて前記予測手段によって予測された前記ランクを、一時的に、前記生成手段によって生成されたQパリテイに用いてRAID6で管理するレベル管理手段とを備えることを特徴とするディスクアレイシステム。
【請求項9】
前記予測手段によって予測される前記ランクは、複数であることを特徴とする請求項8記載のディスクアレイシステム。
【請求項10】
前記生成手段によって生成された前記Qパリテイは、RAID5で動作しているディスクアレイ装置の中の未使用のスペアディスクから変更されたQパリテイディスクに格納されることを特徴とする請求項8又は9記載のディスクアレイシステム。
【請求項11】
前記生成手段によって生成される前記Qパリテイは、RAID5についてのデータ及びPパリティの生成と非同期で生成することを特徴とする請求項8、9又は10記載のディスクアレイシステム。
【請求項12】
前記スペアディスクの記憶領域と前記Qパリテイディスクの記憶領域とを単一のディスクに設けることを特徴とする請求項10又は11記載のディスクアレイシステム。
【請求項13】
コンピュータに請求項1記載のデータ格納システムのデータ復旧方法又は請求2乃至6のいずれか一に記載のディスクアレイシステムのデータ復旧方法を実行させることを特徴とする制御プログラム。
【請求項14】
コンピュータに請求項7記載のデータ格納システム又は請求項8乃至12のいずれか一に記載のディスクアレイシステムを制御させることを特徴とする制御プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−217408(P2009−217408A)
【公開日】平成21年9月24日(2009.9.24)
【国際特許分類】
【出願番号】特願2008−58822(P2008−58822)
【出願日】平成20年3月7日(2008.3.7)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】