説明

ストレージ制御方式

【課題】 CRCエラー又はパリティエラーの発生を契機としてRAID機能でデータ復元するストレージ装置では、リアルタイム性が重要とされる高ビットレートアプリケーションではデータ転送が間に合わず、正常なアプリケーションの実行が困難であった。
【解決手段】 ストレージデバイス1〜5にデータが破壊されるまでには至っていない障害が発生したことをストレージデバイス1〜5から読み出したデータを一次蓄積するデータバッファ101〜105の残量を見て検知し、RAID機能によりデータ復旧することで、継続してアプリケーションが実行可能に構成した。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、各種データを蓄積する複数のストレージデバイスからなり、RAID機能によって耐障害性を向上したストレージ装置に関し、特にリアルタイムアプリケーション実行時における耐障害性を向上したストレージ制御方式に関する。
【背景技術】
【0002】
アプリケーションやデータが急速に増大するにしたがって、データ蓄積するストレージデバイスの容量も益々大きくなってきた。このような状況下で、ストレージデバイスに障害が発生すると、失われたデータの損失も大きいが、業務の中断、復旧作業のコストも甚大なものとなる。RAID(Redundant Arrays Independent Disks)技術による耐障害性の向上は、こうしたストレージデバイスの障害によるシステムのダウンを回避する方式の一つとして提案されている。
【0003】
複数のストレージデバイスからなり、RAID機能を有する従来技術として特許文献1に記載されたものがある。特許文献1に記載されたストレージ装置は、複数のストレージデバイスの一つにCRCエラー又はパリティエラーが発生した場合に当該エラーが発生したストレージデバイスを切り離して系の切り替えを行い、残りのストレージデバイスのパリティ情報からエラーが発生したストレージデバイスのデータの復元を行うようにしたものである。
【0004】
【特許文献1】特開2005−122338号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来のストレージ装置は、CRCエラー又はパリティエラーの発生を契機としてRAID機能でデータ復元するものである。しかし、このようなエラーが発生するには至らない障害がストレージデバイスに発生した場合、例えば、データが破壊されるまでには至っていないが、磁気情報の弱化によりデータを読み出すために数回のシークを必要とするような障害が発生した場合、必要とされるデータレートが得られず、リアルタイム性が重要とされる高ビットレート映像アプリケーションなどのリアルタイムアプリケーションではデータ転送が間に合わず、映像遅延、フレーム落ち、デコードチップのハングアップなどが発生し、正常な映像上映が継続できないという問題があった。
【0006】
本発明は、上記のような従来の問題点に鑑みてなされたものであり、データが破壊されるまでには至っていない障害発生を検知することにより、リアルタイム性が要求されるアプリケーションに対してもRAID機能で継続してアプリケーションが実行可能なストレージ方式を提供することを目的としている。
【課題を解決するための手段】
【0007】
本発明におけるストレージ制御方式は、データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから順次データを読み出して上記クライアントへ送出するストレージ制御部を備え、該ストレージデバイス制御部は上記複数のストレージデバイス各々のデータ読み出し処理速度を監視し、規定された読み出し処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出するように構成したものである。
【0008】
また、本発明におけるストレージ制御方式は、データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスへ蓄積するデータの書き込みを要求するクライアント、このクライアントの上記書き込み要求に基づき、上記複数のストレージデバイスへ順次データを書き込むストレージ制御部を備え、該ストレージデバイス制御部は上記複数のストレージデバイス各々のデータ書き込み処理速度を監視し、規定された書き込み処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離すように構成したものである。
【発明の効果】
【0009】
本発明によれば、複数のストレージデバイス各々のデータ読み出し処理速度を監視し、規定された読み出し処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によってクライアントへデータを送出するようにしたので、リアルタイム性が要求されるアプリケーションに対してもRAID機能で継続してアプリケーションを実行することができる効果がある。
【0010】
また、本発明によれば、複数のストレージデバイス各々のデータ書き込み処理速度を監視し、規定された書き込み処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離すようにしたので、リアルタイム処理が必要なアプリケーションにおいて高速のデータ書き込みができる効果がある。
【発明を実施するための最良の形態】
【0011】
実施の形態1.
以下、本発明の実施の形態1を図について説明する。図1は本発明の実施の形態1に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。図において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。101〜105は上記ストレージデバイス1〜5に各々対応して設けられたデータバッファであり、ストレージデバイス1〜5から読み出されるデータを一次蓄積する。201はストレージデバイス1〜5およびデータバッファ101〜105を制御するストレージ制御部、301はストレージ制御部201に対してリードコマンドを送信し、ストレージデバイス101〜105に蓄積されたデータの読み出しを要求するクライアントである。
【0012】
次に、この実施の形態1に係るストレージ制御方式の動作について説明する。ストレージデバイス101〜105には画像データ等が蓄積されており、クライアント301はストレージデバイス101〜105に蓄積された画像データを読み出して、例えば映像装置によってリアルタイムに画像表示させるように構成される。
【0013】
即ち、クライアント301はストレージ制御部201に対してリードコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してリードコマンドが指定するデータが格納されたストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データバッファ101〜105へのデータ読み込みを指示する。前出のデータ読み込みコマンドにしたがって該当するストレージデバイス1〜5から読み出されたデータはデータバッファ101〜105に蓄積される。データバッファ101〜105に一次蓄積されたデータはアプリケーションが要求する読み出し応答速度で順次クライアント301に読み出され、アプリケーションが実行される。ストレージ制御部201はデータバッファ101〜105を監視するとともに、前出のデータ読み出しコマンドに対するストレージデバイス1〜5の読み出し応答速度が、データバッファ101〜105からクライアント301への読み出し速度を下回ることがないように管理する。
【0014】
以下、障害発生時におけるリカバリー手順を図2にしたがって説明する。いま、図1における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを読み出すために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで読み出し応答速度が低下し、データバッファ102からクライアント301への読み出し速度を下回るようになると一次蓄積しているデータ残量が減少して行くことになる。ストレージ制御部201はデータバッファ101〜105のデータ残量を監視しており(ST11、ST12)、データバッファ102の前出しのデータ残量が規定の残量を下回るとデータバッファ102に対応したストレージデバイス2に障害が発生したものと判断し、ストレージデバイス2の切り離し処理を実行する(ST13)。
【0015】
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスからデータを読み出すことによりリカバリーを行い(ST14)、図1の下図のようにアプリケーションの実行を継続する(ST15)。
【0016】
また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に記録されたデータのパリティー情報から切り離したストレージデバイス2に蓄積していたデータを復元することによりリカバリーを行い、アプリケーションの実行を継続する。
【0017】
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
【0018】
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。
【0019】
実施の形態2.
以下、本発明の実施の形態2を図について説明する。図3は本発明の実施の形態2に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。この実施の形態2のストレージ制御方式は各ストレージデバイス1〜5からの読み出しが同期している実施の形態である。即ち、1読み出し単位ごとに各ストレージデバイス1〜5から必要なデータ読み出しが全て完了するまで、次のデータ読み出しを行わない方式を採用した実施の形態である。
【0020】
図において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。101〜105は上記ストレージデバイス1〜5に各々対応して設けられたデータバッファであり、ストレージデバイス1〜5から読み出されるデータを一次蓄積する。401〜405は上記ストレージデバイス101〜105に各々対応して設けられ、対応するストレージデバイス101〜105の読み出しコマンドに対する応答処理時間が規定の時間を上回った回数を計数するカウンタ、201は上記ストレージデバイス1〜5、データバッファ101〜105及びカウンタ401〜405を制御するストレージ制御部、301はストレージ制御部201に対してリードコマンドを送信し、ストレージデバイス101〜105に蓄積されたデータの読み出しを要求するクライアントである。
【0021】
次に、この実施の形態2に係るストレージ制御方式の動作について説明する。即ち、クライアント301はストレージ制御部201に対してリードコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してリードコマンドが指定するデータが格納されたストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データバッファ101〜105へのデータ読み込みを指示する。このとき、各ストレージデバイス1〜5からの読み出しは同期しているので、1読み出し単位ごとに各ストレージデバイス1〜5から必要なデータ読み出しが全て完了すると、次の読み出し単位の読み出しが実行されることになる。
【0022】
前出のデータ読み込みコマンドにしたがってストレージデバイス1〜5から読み出されたデータはデータバッファ101〜105に蓄積される。データバッファ101〜105に一次蓄積されたデータはアプリケーションが要求する読み出し応答速度で順次クライアント301に読み出され、アプリケーションが実行される。ストレージ制御部201はデータバッファ101〜105の何れかを監視するとともに、前出のデータ読み出しコマンドに対するストレージデバイス1〜5の読み出し応答速度が、データバッファ101〜105からクライアント301への読み出し速度を下回ることがないように管理する。
【0023】
また、カウンタ401〜405は対応するストレージデバイス101〜105の読み出しコマンドに対する応答処理時間が規定の時間を上回った回数をカウントするものであり、具体的には読み出しコマンド発行時にスタートし、読み出し完了の応答が帰ったときにリセットを行う計数手段を有し、ある計数値のときにNOT回路を組み合わせ、計数手段の出力とAND出力が出るように回路を組み、その出力の回数をカウントするように構成したものである。
【0024】
以下、障害発生時におけるリカバリー手順を図4にしたがって説明する。いま、図3における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを読み出すために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで読み出し応答速度が低下し、データバッファ102からクライアント301への読み出し速度を下回るようになると一次蓄積しているデータ残量が減少して行くことになる。さらに、各ストレージデバイス1〜5の読み出しは同期しているので、他のストレージデバイス1、3〜5はストレージデバイス2の読み出し完了を待って次の読み出し単位を読み出すことになるので、データバッファ101、103〜105のデータ残量も減少して行く。
【0025】
ストレージ制御部201はデータバッファ101〜105の何れかのデータ残量を監視しており(ST21、ST22)、何れかのデータバッファの前出しデータ残量が規定の残量を下回ると何れかのストレージデバイス1〜5に障害が発生したものと判断する。そして、各カウンタ401〜405の計数値を参照して計数値が最大のもの、例えば、時間平均で一番計数値の大きいカウンタに対応したストレージデバイスを一番多く遅延が発生した異常のあるストレージデバイスと判断する。ここでは、ストレージデバイス2に障害が発生しているので、カウンタ402の計数値が最大であり、それに対応したストレージデバイス2が異常と判断し、ストレージデバイス2の切り離し処理を実行する(ST23)。
【0026】
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスからデータを読み出すことによりリカバリーを行い(ST24)、図3の下図のようにアプリケーションの実行を継続する(ST25)。
【0027】
また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に記録されたデータのパリティー情報から切り離したストレージデバイス2に蓄積していたデータを復元することによりリカバリーを行い、アプリケーションの実行を継続する。
【0028】
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
【0029】
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。
【0030】
なお、上記実施の形態2では、各ストレージデバイス1〜5に各々対応して1つのカウンタ401〜405を設けているが、データ読み込みコマンドに対する応答時間が規定された時間を上回った回数がカウントされるカウンタをストレージデバイス1〜5ごとに複数持つ構成とし、各々短い規定の応答時間以上に応答時間がかかった回数を計数するカウンタと、長い規定の応答時間以上に応答時間がかかった回数を計数するカウンタとを設けた構成としてもよい。この場合、まず、長い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断するが、全てのカウンタの計数値が同じであったときに、短い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断することができ、さらに精度をあげて障害が発生しているストレージデバイス1〜5を判断することができる。
【0031】
また、上記実施の形態2では、データバッファ101〜105に一次蓄積されているデータ残量が規定の残量を下回ったときに、カウンタ401〜405の計数値を参照して障害が発生しているストレージデバイスを判断するものとしているが、ストレージ制御部201が所定のタイミングでカウンタ401〜405の計数値を参照し、障害が発生しているストレージデバイスを判断するようにしてもよい。この場合、ストレージ制御部201がカウンタ401〜405の計数値を参照するタイミングは、ストレージ制御部201が何らかの異常の兆候を検知したときに行う。
【0032】
さらに、ストレージ制御部201が常時カウンタ401〜405の計数値を監視するものとし、計数値が規定値を超えたもの、あるいは所定の時間平均で計数値の最大のカウンタ401〜405に対応したストレージデバイス1〜5を障害が発生しているストレージデバイスと判断するようにしてもよい。
【0033】
実施の形態3.
以下、本発明の実施の形態3を図について説明する。図5は本発明の実施の形態3に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。この実施の形態3に係るストレージ制御方式はデータバッファを介在しないデータ読み込みを行うストレージ制御方式である。
【0034】
図5において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。401〜405は上記ストレージデバイス101〜105に各々対応して設けられ、対応するストレージデバイス101〜105の読み出しコマンドに対する応答処理時間が規定の時間を上回った回数を計数するカウンタ、201はストレージデバイス1〜5及びカウンタ401〜405を制御するストレージ制御部、301はストレージ制御部201に対してリードコマンドを送信し、ストレージデバイス101〜105に蓄積されたデータの読み出しを要求するクライアントである。
【0035】
次に、この実施の形態3に係るストレージ制御方式の動作について説明する。即ち、クライアント301はストレージ制御部201に対してリードコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してリードコマンドが指定するデータが格納されたストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データバッファ101〜105へのデータ読み込みを指示する。
【0036】
データ読み出しコマンドにしたがってストレージデバイス1〜5から読み出されたデータは順次クライアント301に読み出され、アプリケーションが実行される。
【0037】
以下、障害発生時におけるリカバリー手順を説明する。いま、図5における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを読み出すために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで読み出し応答速度が低下し、データの読み出し量が低下する。
【0038】
ストレージ制御部201はストレージデバイス1〜5からの例えばLBA(Logical Block Addressing)数などに代表される読み出し処理済サイズと経過時間(単位時間当たりのタイマー処理としてもよい)から読み出し処理速度を算出し、その処理速度が規定された処理速度を下回ったストレージデバイス2を異常と判断する。以下、具体的にストレージデバイス1〜5の障害を検知する手順を図6に従って説明すると、ストレージ制御部201はデータ読み込みコマンドに対する応答時間が規定された時間を上回った回数が計数されるカウンタ401〜405を参照し、ストレージデバイス1〜5のうち、データ読み込みコマンドに対する応答時間が規定された時間を上回った回数が、例えば、時間平均で最大のものを一番多く遅延が発生した異常のあるストレージデバイスと判断する。ここでは、ストレージデバイス2に障害が発生しているので、カウンタ402の計数値が最大であり、対応するストレージデバイス2を切り離す(ST31)。
【0039】
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスからデータを読み出すことによりリカバリーを行い(ST32)、図5の下図のようにアプリケーションの実行を継続する(ST33)。
【0040】
また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に記録されたデータのパリティー情報から切り離したストレージデバイス2に蓄積していたデータを復元することによりリカバリーを行い、アプリケーションの実行を継続する。
【0041】
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
【0042】
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。
【0043】
なお、上記実施の形態3では、各ストレージデバイス1〜5に各々対応して1つのカウンタ401〜405を設けているが、データ読み込みコマンドに対する応答時間が規定された時間を上回った回数がカウントされるカウンタをストレージデバイス1〜5ごとに複数持つ構成とし、各々短い規定の応答時間以上に応答時間がかかった回数を計数するカウンタと、長い規定の応答時間以上に応答時間がかかった回数を計数するカウンタとを設けた構成としてもよい。この場合、まず、長い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断するが、全てのカウンタの計数値が同じであったときに、短い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断することができ、さらに精度をあげて障害が発生しているストレージデバイス1〜5を判断することができる。
【0044】
実施の形態4.
以下、本発明の実施の形態4を図について説明する。図7は本発明の実施の形態4に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。この実施の形態4に係るストレージ制御方式はストレージデバイスへの書き込み時におけるストレージ制御方式である。
【0045】
図7において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。401〜405は上記ストレージデバイス101〜105に各々対応して設けられ、対応するストレージデバイス101〜105の書き込みコマンドに対する応答処理時間が規定の時間を上回った回数をカウントするカウンタ、201はストレージデバイス1〜5及びカウンタ401〜405を制御するストレージ制御部、301はストレージ制御部201に対してライトコマンドを送信し、ストレージデバイス101〜105にデータの書き込みを要求するクライアントである。
【0046】
次に、この実施の形態4に係るストレージ制御方式の動作について説明する。即ち、クライアント301はストレージ制御部201に対してライトコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してライトコマンドが指定するストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データ書き込みを指示する。ストレージデバイス101〜105はRAID機能を構築するストレージ装置であるので、複数のストレージデバイス101〜105に対してRAID処理を行い、分散書き込みがなされる。
【0047】
以下、障害発生時におけるリカバリー手順を説明する。いま、図7における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを書き込むために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで書き込み応答速度が低下する。
【0048】
ストレージ制御部201はストレージデバイス1〜5からの例えばLBA(Logical Block Addressing)数などに代表される書き込み処理済サイズと経過時間(単位時間当たりのタイマー処理としてもよい)から書き込み処理速度を算出し、その処理速度が規定された処理速度を下回ったストレージデバイス2を異常と判断する。即ち、ストレージ制御部201はデータ書き込みコマンドに対する応答時間が規定された時間を上回った回数が計数されるカウンタ401〜405を参照し、ストレージデバイス1〜5のうち、データ書き込みコマンドに対する応答時間が規定された時間を上回った回数が、例えば、時間平均で最大のものを一番多く遅延が発生した異常のあるストレージデバイスと判断する。ここでは、ストレージデバイス2に障害が発生しているので、カウンタ402の計数値が最大であり、対応するストレージデバイス2を切り離す。
【0049】
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスに書き込みを続ける。また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に対してパリティ演算を行いつつ、切り離したストレージデバイス2に書き込みを行わず書き込みを続ける。
【0050】
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
【0051】
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。
【0052】
なお、上記実施の形態4では、各ストレージデバイス1〜5に各々対応して1つのカウンタ401〜405を設けているが、データ書き込みコマンドに対する応答時間が規定された時間を上回った回数がカウントされるカウンタをストレージデバイス1〜5ごとに複数持つ構成とし、各々短い規定の応答時間以上に応答時間がかかった回数を計数するカウンタと、長い規定の応答時間以上に応答時間がかかった回数を計数するカウンタとを設けた構成としてもよい。この場合、まず、長い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断するが、全てのカウンタの計数値が同じであったときに、短い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断することができ、さらに精度をあげて障害が発生しているストレージデバイス1〜5を判断することができる。
【0053】
さらに、上記各実施の形態ではストレージデバイス1〜5を5台具備した形態を示しているが、これに限るものではない。
【産業上の利用可能性】
【0054】
本発明は、RAID機能を有したストレージ装置であり、特にリアルタイム性が要求されるアプリケーションを実行するシステムに適用される。
【図面の簡単な説明】
【0055】
【図1】本発明の実施の形態1に係るストレージ制御方式を示したブロック図である。
【図2】本発明の実施の形態1に係るストレージデバイスの障害を検知する手順を示したフローチャートである。
【図3】本発明の実施の形態2に係るストレージ制御方式を示したブロック図である。
【図4】本発明の実施の形態2に係るストレージデバイスの障害を検知する手順を示したフローチャートである。
【図5】本発明の実施の形態3に係るストレージ制御方式を示したブロック図である。
【図6】本発明の実施の形態3に係るストレージデバイスの障害を検知する手順を示したフローチャートである。
【図7】本発明の実施の形態4に係るストレージ制御方式を示したブロック図である。
【符号の説明】
【0056】
1〜5 ストレージデバイス 101〜105 データバッファ 201 ストレージ制御部 301 クライアント 401〜405 カウンタ

【特許請求の範囲】
【請求項1】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから順次データを読み出して上記クライアントへ送出するストレージ制御部を備え、該ストレージデバイス制御部は上記複数のストレージデバイス各々のデータ読み出し処理速度を監視し、規定された読み出し処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出することを特徴とするストレージ制御方式。
【請求項2】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスから読み出されたデータを一次蓄積する複数のデータバッファ、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから順次データを読み出し、上記複数のデータバッファを介して上記クライアントへ送出するストレージ制御部を備え、該ストレージ制御部は上記複数のストレージデバイスから上記複数のデータバッファへ読み出す処理速度が上記複数のデータバッファからクライアントへ読み出す速度を下回らないように各ストレージデバイスの読み出しを管理する一方で、上記複数のデータバッファに一次蓄積されているデータ残量を監視し、規定の残量を下回ったデータバッファを検知した場合、当該データバッファに対応するストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出することを特徴とするストレージ制御方式。
【請求項3】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスから読み出されたデータを一次蓄積するデータバッファ、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから同期したデータの読み出しを行い、上記データバッファを介して上記クライアントへ送出するストレージ制御部、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスの読み出しコマンドに対する処理応答時間が規定の時間を上回った回数をカウントする複数のカウンタを備え、上記ストレージ制御部は上記複数のストレージデバイスから上記データバッファへ読み出す処理速度が上記データバッファからクライアントへ読み出す速度を下回らないように各ストレージデバイスの読み出しを管理する一方で、上記データバッファに一次蓄積されているデータ残量を監視し、規定の残量を下回った場合、上記複数のカウンタの内、カウント値が最大のカウンタに対応するストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出することを特徴とするストレージ制御方式。
【請求項4】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスから読み出されたデータを一次蓄積する複数のデータバッファ、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから同期したデータの読み出しを行い、上記複数のデータバッファを介して上記クライアントへ送出するストレージ制御部、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスの読み出しコマンドに対する処理応答時間が規定の時間を上回った回数をカウントする複数のカウンタを備え、上記ストレージ制御部は上記複数のストレージデバイスから上記複数のデータバッファへ読み出す処理速度が上記複数のデータバッファからクライアントへ読み出す速度を下回らないように各ストレージデバイスの読み出しを管理する一方で、任意のデータバッファに一次蓄積されているデータ残量を監視し、規定の残量を下回った場合、上記複数のカウンタの内、カウント値が最大のカウンタに対応するストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出することを特徴とするストレージ制御方式。
【請求項5】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから順次データを読み出し、上記クライアントへ送出するストレージ制御部、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスの読み出しコマンドに対する処理応答時間が規定の時間を上回った回数をカウントする複数のカウンタを備え、上記ストレージ制御部は所定のタイミングで上記複数のカウンタのカウント値を確認し、カウント値が最大のカウンタに対応するストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出することを特徴とするストレージ制御方式。
【請求項6】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから順次データを読み出し、上記クライアントへ送出するストレージ制御部、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスの読み出しコマンドに対する処理応答時間が規定の時間を上回った回数をカウントする複数のカウンタを備え、上記ストレージ制御部は上記複数のカウンタのカウント値を監視しており、カウント値が規定のカウント値に達したカウンタに対応するストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出することを特徴とするストレージ制御方式。
【請求項7】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスへ蓄積するデータの書き込みを要求するクライアント、このクライアントの上記書き込み要求に基づき、上記複数のストレージデバイスへ順次データを書き込むストレージ制御部を備え、該ストレージデバイス制御部は上記複数のストレージデバイス各々のデータ書き込み処理速度を監視し、規定された書き込み処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離すことを特徴とするストレージ制御方式。
【請求項8】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスへ蓄積するデータの書き込みを要求するクライアント、このクライアントの上記書き込み要求に基づき、上記複数のストレージデバイスへ順次データを書き込むストレージ制御部、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスの書き込みコマンドに対する処理応答時間が規定の時間を上回った回数をカウントする複数のカウンタを備え、上記ストレージ制御部は所定のタイミングで上記複数のカウンタのカウント値を確認し、カウント値が最大のカウンタに対応するストレージデバイスを切り離すことを特徴とするストレージ制御方式。
【請求項9】
データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスへ蓄積するデータの書き込みを要求するクライアント、このクライアントの上記書き込み要求に基づき、上記複数のストレージデバイスへ順次データを書き込むストレージ制御部、上記複数のストレージデバイスに各々対応して設けられ、各ストレージデバイスの書き込みコマンドに対する処理応答時間が規定の時間を上回った回数をカウントする複数のカウンタを備え、上記ストレージ制御部は上記複数のカウンタのカウント値を監視しており、カウント値が規定のカウント値に達したカウンタに対応するストレージデバイスを切り離すことを特徴とするストレージ制御方式。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−59280(P2009−59280A)
【公開日】平成21年3月19日(2009.3.19)
【国際特許分類】
【出願番号】特願2007−227711(P2007−227711)
【出願日】平成19年9月3日(2007.9.3)
【出願人】(000006013)三菱電機株式会社 (33,312)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【出願人】(000102739)エヌ・ティ・ティ・アドバンステクノロジ株式会社 (265)
【Fターム(参考)】