情報記憶装置の制御方法、情報記憶装置、プログラム及びコンピュータ読取可能な情報記録媒体
【課題】格納情報を冗長化する情報記憶装置において、冗長化状態の維持に障害が生じた際に効果的に対処され得る構成を提供することを目的とする。
【解決手段】冗長化障害記録手段が情報が冗長化された状態の維持に障害が生じた場合にその旨を状態記録手段に記録し、冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行う構成とした。
【解決手段】冗長化障害記録手段が情報が冗長化された状態の維持に障害が生じた場合にその旨を状態記録手段に記録し、冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行う構成とした。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は情報記憶装置の制御方法、情報記憶装置、プログラム及びコンピュータ読取可能な情報記録媒体に係り、特に情報記憶装置に格納された情報を冗長化する機能を有する情報記憶装置の制御方法、その情報記憶装置、同制御方法をコンピュータに実行させるためのプログラム及び同プログラムを格納したコンピュータ読取可能な情報記録媒体に関する。
【背景技術】
【0002】
高信頼化を目的としてハードディスク装置を冗長化して実装する情報記憶装置において、冗長化ハードディスク装置の軽度故障、いわゆる「冗長化崩れ」が生ずることがある。
【0003】
例えば図1に示す如く、大型コンピュータを管理制御するためのSVP(サービスプロセッサ)100'と称されるコンピュータとしてユーザ運用機能、保守機能、試験機能、外部監視装置との通信機能等を提供し、これら機能の実現に必要なSVP制御プログラム20'および制御データを格納する2台のハードディスク装置HDD#0 151,HDD#1 152を実装するものとする。
【0004】
このSVPには又、このように2台のハードディスク装置を冗長な二重化構成の資源として管理、制御するためのHDD二重化制御部31'が設けられている。
【0005】
このHDD二重化制御部は2台のハードディスク装置を同一の構成で区分けし、区分けしたパーティション単位で二重化制御を行う。
【0006】
又HDD二重化制御部は一方のハードディスク装置(図1の例の場合、ハードディスク装置#0)に復旧不可能な故障を検出すると、故障の発生したパーティション(図1の例の場合、パーティション#1)については正常なハードディスク装置のみを用いた一重化制御に切り替えて上位のSVP制御プログラムの運用を継続する。
【0007】
又このようにハードディスク装置の冗長化、すなわち二重化状態が一部崩れたことを上記HDD二重化制御部が保守員に通報する。
【0008】
ここで本願の明細書及び特許請求の範囲において「冗長化が崩れる」あるいは「冗長化崩れ」とは、情報が冗長化された状態、すなわち冗長化すべき情報がコピーされ同じ内容を有する情報が複数個重複して生成され、当該内容が同じ複数個の情報が複数の記録媒体のそれぞれに格納された状態、すなわち冗長化状態に対し、上記内容が同じ複数個の情報の内、全数ではない一又は複数個の情報に何らかの障害が生じることにより冗長化状態が損なわれることを意味する。
【0009】
尚この「冗長化崩れ」では、上記内容が同じ複数個の情報の内少なくとも一個の情報には何ら障害が無く、もって実質的に情報の欠損は生じておらず、あくまで当該冗長化によって当初期待した情報の安全性向上の効果がその分低下するにすぎない。
【0010】
すなわち図1の例では冗長化崩れにより二重化状態が崩れたパーティションについて、さらに正常なハードディスク装置側にも復旧不可能な故障が発生する頻度は低い。もって当該冗長化崩れの要因たる故障ハードディスク装置の交換作業に対する緊急度はあまり高くないとも言える。
【0011】
しかしながらこの冗長化崩れの状態が長期間放置されることは望ましくない。さらに当該パーティションについて正常なハードディスク装置側にも故障が発生する可能性は小さいながらも存在するからである。そのような事態が生じた場合当該SPV自体の運用を停止する事態となるため、このような事態を防止するために保守員は早期に冗長化崩れからの復旧のために新たなハードディスク装置を手配して故障ハードディスク装置を交換することが望ましい。
【0012】
一方、当該SVPが監視制御対象とする大型コンピュータは、その装置数、部品数が多く、SVPに接続されるハードディスク装置の故障以外にも保守に必要な通報事象が多く存在し、それらの発生頻度も高い。
【0013】
ここでハードディスク装置の軽度故障(すなわちパーティションの「冗長化崩れ」)が検出された場合、その旨がSVPから保守員に通報される。ここでたまたま同時にその他の優先度の高い通報事象が多く発生する場合を想定すると、それらがほぼ同時期に保守員に通報されることとなり、ハードディスク装置の軽度故障の通報が見落とされるおそれがある。
【特許文献1】特開2004−271983号公報
【発明の開示】
【発明が解決しようとする課題】
【0014】
本発明はこのような状況に鑑みてなされたものであり、情報記憶装置においてその格納情報の冗長化を維持するのに障害が生じた場合、同障害を解消するための措置が確実になされるような構成を提供することを目的とする。
【課題を解決するための手段】
【0015】
本発明では冗長化手段が前記情報記憶装置に格納されている情報の冗長化を行い、情報が冗長化された状態の維持に障害が生じた場合冗長化障害記録手段が当該冗長化障害の旨を状態記録手段に記録し、冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行うようにした。
【0016】
本発明ではこのように冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行う。
【0017】
このため仮に保守員が当該冗長化障害の発生の際の最初の通報に対する対応を行わず放置したような場合であっても、冗長化監視手段により状態記録手段から冗長化障害の旨の記録を読み出され、冗長化監視手段により冗長化障害の旨の記録が読み出された場合に通報手段によりその旨の通報がなされる。
【0018】
したがって冗長化障害の状態が長期間にわたって放置されるような状況を確実に回避可能である。
【発明の効果】
【0019】
このように本発明によれば、格納情報を冗長化する機能を有する情報記憶装置において冗長化の維持に対する障害が生じた場合、当該冗長化障害の状態が長期間にわたって放置されるような状況が確実に回避可能となる。このため、情報記憶装置において格納情報の冗長化の状態が確実に維持されるようになり、もって格納情報の安全性を効果的に確保し得る。
【発明を実施するための最良の形態】
【0020】
以下図とともに本発明の実施例につき、詳細に説明を行う。
【実施例1】
【0021】
本発明の実施例1について説明を行う。
【0022】
本発明の実施例1によれば、冗長な二重化構成のハードディスク装置を管理、制御し、一方のハードディスク装置に故障が発生しても冗長でない構成で運用が継続可能な装置において、当該故障検出時に故障を通報した後、当該故障が放置された場合には一定時間ごとに、あるいは電源投入時のたびごとに自動で当該故障の放置が再検出され、繰り返し通報がなされる。
【0023】
図2は本発明の実施例1による情報記録装置の制御方法を実行するコンピュータとしてのSVP(サービスプロセッサ)を含むコンピュータシステムの概要を説明するためのブロック図である。
【0024】
図2中、当該コンピュータシステムの本体装置200はシステムボード211を中心に様々な機能ユニットSSM 212,SSX0 124,SSX1 215,SSU216,IOP217,I/O219及びCLK213を有する。
【0025】
本体装置コンソール201は、当該コンピュータシステムがユーザに提供する諸機能(システムボード211上で動作するOSにより提供される機能)をユーザが操作する為のコンソールである。
【0026】
SVPコンソール101は、ユーザ運用機能、保守機能、試験機能の操作を行う為のコンソールである。ユーザモード時はユーザ運用機能のみ操作が可能となる。保守モード時は、保守に必要な機能の操作が可能となる。保守モードはユーザの運用を停止して保守を行う場合に使用する。
【0027】
保守用端末202は、ユーザの運用を停止せずに保守(活性保守)を行う場合に、保守に必要な機能の操作を行う為のコンソールである。活性保守時のみ接続する。
【0028】
SVP100はMPU(マイクロプロセッサユニット)111,キャッシュ112,ROM121,RAM122,上記二重化構成とされたハードディスク装置151,152、MOドライブ161,フレキシブルディスクドライブ162等を有する。
【0029】
上記SSU216,I/O219は本体装置200の外部に接続され、SSU(System Storage Unit)216はシステム記憶装置であり、I/O(Input/Output)219はDASD等の入出力装置である。
【0030】
又以下の各部は本体装置200内に接続され、SVP100による制御、保守等の対象となる。
【0031】
システムボード211:複数のCPUとメモリとが実装される。
【0032】
CLK(Clock Board)213:システムボード211にクロックを分配する。
【0033】
SSM(SS Mover)212:上記SSU216と接続され、主記憶とシステム記憶との間のデータ転送を行う。
【0034】
IOP(Input/Output Processor)217:入出力装置との間のデータ転送を行う。
【0035】
SCI(System Console Interface)103:SVP100が本体装置200内の各部を制御、通信する為のインタフェースを提供する。
【0036】
SPC(System Power Controller)102:本体装置200全体の電源の制御を行う。
【0037】
FAN105:冷却用ファンである。
【0038】
FEP(Front End Power Supply)106:本体装置200内の各部に電源を供給する。
【0039】
又以下の各部は本体装置200内に接続されるSVP100自体と、SVP100の内部のアダプタである。
【0040】
SVP(Service Processor)100:本体装置200のユーザ運用機能、保守機能、試験機能と、外部監視装置300との通信機能とを提供する。
【0041】
SCIA(SCI Adapter)144:SCI103を介して本体装置200との通信および制御を行うアダプタである。
【0042】
SPCA(System Power controller adapter)145:SPC103とのインタフェースの制御を行うアダプタである。
【0043】
DPA(Display Adapter)143:ディスプレイ装置を接続するアダプタである。
【0044】
SIA(Serial Interface Adapter)146:回線を接続するアダプタである。
【0045】
FDA(Floppy Disk Adapter)141:フレキシブルディスクを制御するアダプタである。(「Floppy」は登録商標)
【0046】
MDA(Micro Disk Adapter)130:ハードディスク装置及びMOドライブを制御するアダプタである。
【0047】
SCA(SVP Communication Adapter)135:LANに接続するアダプタであり、外部監視装置300、他のSVP400との間の通信を行う。
【0048】
図3はこのSVP100のソフトウェア構成を説明するためのブロック図である。
【0049】
SVP100のソフトウェアはROM121に設けられたSVP内部診断機能を提供するプログラム及び上記ハードディスク装置151,152に格納されたSVP制御プログラム20を有する。このSVP制御プログラム20はカーネル10,フレームタスク21,割り込みタスク22,初期化タスク23,エラーログタスク24及びパトロールタスク25を有する。
【0050】
初期化タスク23はハードディスク装置151,152の故障の検出を行う機能を提供し、パトロールタスク25はハードディスク装置151,152の故障の放置を検出する機能を提供する。
【0051】
更に上記SVP制御プログラム20は、ハードディスク装置ドライバ30,フレキシブルディスクドライバ41,LANポートドライバ42,ディスプレイ装置制御ドライバ43,SCIドライバ、SPCドライバ45及びRS232Cポートドライバ46を含む。
【0052】
ハーディスク装置ドライバ30はHDD二重化制御部31及びSCSI制御部32を有する。
【0053】
上記ROM121に設けられたプログラムはSVP100内部の診断を行う。すなわちハードディスク装置151,152のヘッダ部(パーティション#0)に書き込まれたHDD二重化制御情報を読み出し、その内容をメモリ(RAM122)上に展開する(HDD二重化制御情報31a)。又同プログラムはハードディスク装置151,152からSVP制御プログラム20のロードを行う。
【0054】
カーネル10は又上記SVP制御プログラム20が有する各タスクの状態制御、タスク間の排他制御、通信制御を行う。更にメモリ資源、タイマ資源、ファイルの管理、制御を行う。
【0055】
ハードディスク装置ドライバ30のHDD二重化制御部31は上記二重化制御情報31aを用いてハードディスク装置151,152の二重化、すなわち冗長化に関する制御を行う。
【0056】
又ハードディスク装置151,152の始動、停止、情報の読み出し、書き込み等の動作は、このHDD二重化制御部31がSCSI制御部32を呼び出して実行させる。
【0057】
又HDD二重化制御部31はハードディスク装置151,152の故障検出時、システムコール経由でエラーログタスク24を起動し、故障の通報を行わせる。
【0058】
SCSI制御部32はハードディスク装置151,152の始動、停止、動作モードの設定、ハードディスク装置151,152への情報の書き込み、同装置からの情報の読み出し、故障情報の取得等を行う。
【0059】
ここでSCSI制御部32の制御対象は2台のハードディスク装置151,152とMOドライブ161である。
【0060】
フレキシブルディスクドライバ41はフロッピーディスクドライブ162(図2参照)(「フロッピー」は登録商標)の制御を行う。
【0061】
LANポートドライバ42は監視装置300との通信制御を行う。
【0062】
ディスプレイ装置制御ドライバ43は本体装置100のコンソール201及びSVP100のコンソール101との通信制御を行う。
【0063】
RS232Cポートドライバ46は保守用端末202とRS232Cによる通信制御を行う。
【0064】
SPCドライバ45はSPC102との通信制御を行う。このSPC102との通信によってコンピュータシステムの電源投入、切断時の制御がなされる。
【0065】
SCIドライバ44はSCI103を経由して本体装置200の制御を行う。
【0066】
初期化タスク23はSVP100の起動時にSVP制御プログラム20が有する各タスクの初期化、起動を行うとともにハードディスク装置151,152故障の放置のチェックを行う。そして初期化タスクハードディスク装置151,152の故障の放置を検出時、システムコール経由でエラーログタスク24を起動し、故障の通報を行う。
【0067】
又パトロールタスク25が定期的に起動され、本体装置200の状態の監視とともにハードディスク装置151,152の故障の放置の監視を行う。ここではその監視対象によって、500ms単位、60分単位、1日単位、1週間単位で起動される。
【0068】
パトロールタスク25によるハードディスク装置151,152の故障の放置の監視は1週間単位で実施され、ハードディスク装置151,152の故障の放置を検出時はシステムコール経由でエラーログタスク24を起動し、故障の通報を行う。
【0069】
エラーログタスク24は本体装置200の故障、SVP100内部の故障あるいはハードディスク装置151,152の故障が発生した場合、検出元のタスク又はドライバからシステムコール経由で起動され、エラーログの格納、コンソール、パネルへの表示、監視装置300への通報等の処理を行う。
【0070】
フレームタスク21はSVPコンソール101あるいは保守用端末202経由で所定のユーザ運用機能21a及び保守機能等21bを提供する。
【0071】
ユーザ運用機能21aとは本体装置200による制御機能に該当し、本来当該コンピュータシステムがユーザに対し提供すべき諸機能(例えば大規模通信網の通信制御機能等)を提供する機能である。
【0072】
保守機能21bは本体装置200及びSVP100自体の部品の保守交換機能を提供する。
【0073】
割り込みタスク50はSCI103経由で通知される本体装置200からの割り込みに対する処理を行う。
【0074】
図4はSVP100が有する機能の内、特に本発明に係る機能部分を抽出して示すブロック図である。
【0075】
すなわち本発明の実施例1ではHDD二重化制御部31がハードディスク装置151,152からの情報の読み出し、同装置への情報の書き込み時にハードディスク装置151,152の故障を検出し、通報する(ステップS1)。
【0076】
すなわちハードディスク装置151,152の軽度故障、すなわち特定のパーティション(図4に例ではパーティション#1)の二重化崩れ(冗長化崩れ)を検出した際、通信網LAN#0,LAN#1を介し監視装置300により、あるいはSVPコンソール101により保守員にその旨を通報する。
【0077】
又パトロールタスク25の機能により定期的な監視を行いハードディスク装置151,152故障の放置を検出して通報する(ステップS2)。
【0078】
すなわちハードディスク装置151,152に軽度故障、すなわちパーティション(パーティション#1)の二重化崩れが発生してから一定時間経過後においても当該故障が放置されている場合、これを検出して再度通信網LAN#0,LAN#1経由で監視装置300によりあるいはSVPコンソール101により保守員に「軽度故障」の旨を通報する。同様にしてさらに一定時間ごとに状態を監視し、二重化状態が回復する迄保守員への「軽度故障」の旨の通報を繰り返し行う。
【0079】
又初期化タスク23の機能により当該コンピュータシステムの運用開始時にハードディスク装置151,152故障の放置が検出され通報される(ステップS3)。
【0080】
すなわちハードディスク装置151,152の軽度故障、すなわちパーティション#1の二重化崩れを検出後、保守員によって一旦システムの運用が停止された後に再度運用が再開される場合に依然としてハードディスク装置151,152の軽度故障、すなわちパーティション#1の二重化崩れが放置されておりこれが検出された場合、再度通信網LAN#0,LAN#1経由で監視装置300あるいはSVPコンソール101により保守員に軽度故障の旨が通報される。
【0081】
その結果ハードディスク装置151,152の軽度故障が長期間にわたって放置される事態を効果的に回避可能となり、もってハードディスク装置151,152の重複故障によるSVPの運用停止の事態を回避し高信頼な機能を提供することが可能となる。
【0082】
以下に上記SVP100の機能の内、情報の冗長化機能に係る構成につき更に詳細に説明を行う。
【0083】
(1)二重化ハードディスク装置151,152の構成:
2台のハードディスク装置151,152は互いに同一の構成で区分され、各ハードディスク装置151,152の同じ位置の領域には同じデータが格納される。
【0084】
ここでこれら2台のハードディスク装置151,152の同じ位置に割り当てられる領域をパーティションと称され、当該二重化制御対象の単位とされる。
【0085】
各パーティションについて同一の情報がマスターハードディスク装置及びスレーブハードディスク装置により重複して保有される。すなわち各パーティションの情報が二重化あるいは冗長化状態で格納される。
【0086】
(2)HDD二重化制御情報31a:
2台のハードディスク装置151,152は、コンピュータシステムの本体装置200に対する実装位置に対応する識別番号が#0から順に割り振られる。以下、ハードディスク装置151,152は説明の便宜上、それぞれハードディスク装置HDD#0,HDD#1と称される場合がある。
【0087】
又複数のパーティションはハードディスク装置151,152内のアドレス順に、#0から識別番号が割り振られる。
【0088】
HDD二重化制御情報31aはパーティションの番号に対応したデータテーブルにより構成される。
【0089】
又各テーブルには当該パーティションを保有するマスターハードディスク装置の番号及び当該パーティションを重複して保有する故障ハードディスク装置の番号が示される。
【0090】
このHDD二重化制御情報31aはパーティション#0(ハードディスク装置151,152の各々が有する記録領域のヘッダ部に対応)に格納される。
【0091】
HDD二重化制御情報31aはコンピュータシステムの電源投入時にハードディスク装置151,152から読み出されてメモリ122上に展開され、前回運用時のハードディスク装置151,152の二重化の構成及びその状態がそのまま引き継がれる。
【0092】
又当該コンピュータシステムの運用中にハードディスク装置151,152の状態が変化した場合、メモリ122上の情報の更新と同時に、パーティション#0に書き込まれたHDD二重化制御情報も更新される。
【0093】
又HDD二重化制御情報31aには故障ハードディスク装置151又は152の交換時、当該故障ハードディスク装置の切り離しの際に参照される二重化有効状態が記録される。この二重化有効状態とは、ハードディスク装置151,152が二重化状態か一重化状態かを示す情報である。
【0094】
尚HDD二重化制御情報については図5とともに後述する。
【0095】
(3)HDD二重化制御部31:
HDD二重化制御部31はハードディスク装置151,152への情報の書き込みの際、該当するパーティションを重複して保有する2台のハードディスク装置151,152のそれぞれの該当する領域に同じ情報を書き込む。
【0096】
又ハードディスク装置151,152からの情報の読み出しの際、該当するパーティションについてのマスターハードディスク装置の領域から情報を読み出す。
【0097】
上記書き込み処理でエラーが発生した場合エラーを生じたパーティションについてのマスターハードディスク装置又はスレーブハードディスク装置を故障状態として認識する。
【0098】
又読み出し処理でエラーが発生した場合、エラーを生じたパーティションについてのマスターハードディスク装置が故障状態にあるものと認識する。
【0099】
又読み出し又は書き込み処理で該当するパーティションについてのマスターハードディスク装置が故障した場合、当該パーティションについて故障が発生していない側のハードディスク装置、すなわちスレーブハードディスク装置を当該パーティションについてのマスターハードディスク装置として認識し直す。
【0100】
(4)HDDニ重化制御部31によるハードディスク装置151,152の故障通報処理(図6〜9中、ステップS4):
HDD二重化制御部31はあるパーティションについてのマスターハードディスク装置又はスレーブハードディスク装置のいずれかが故障した場合、ハードディスク装置151,152に軽度故障、すなわちパーティションのニ重化崩れが発生したものと認識する。
【0101】
HDD二重化制御部31はこのようにしてハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れを検出した場合、上記の如く監視装置300あるいはSVPコンソール101を介して保守員に軽度故障の旨を通報する。
【0102】
(5)ハードディスク装置151,152故障の定期監視処理(図6〜9中、ステップS5):
SVP制御プログラム20のパトロールタスク25は、ハードディスク装置151,152の故障に対する定期監視処理を行う。パトロールタスク25は一週間間隔に起動され、ハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れの有無を監視する。
【0103】
そこで故障を検出した場合、再度監視装置300又はSVPコンソール101を介して保守員に軽度故障の旨を通報する。
【0104】
さらにパトロールタスク25は一週間経過するごとにハードディスク装置151,152の軽度故障の有無を監視し、ハードディスク装置151,152のニ重化状態(冗長化状態)が回復する迄保守員への軽度故障の通報を繰り返し行う。
【0105】
(6)初期化処理におけるハードディスク装置151,152の故障検出処理(図6〜9中、ステップS6):
SVP制御プログラム20の初期化タスク23は、保守員により当該コンピュータシステムの運用の停止操作がなされた後更に同システムの運用の再開操作がなされた場合、ハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れの有無の検出を行う。
【0106】
ハードディスク装置151,152の軽度故障を検出した場合には再度監視装置300又はSVPコンソール101を介して保守員に軽度故障の旨を通報する。
【0107】
図5はHDD二重化制御情報31aの例を示す図である。
【0108】
図中「二重化有効状態」とは、以下の如く、ハードディスク装置151,152の上記二重化状態又は一重化状態を示す。
0:二重化有効状態
1:HDD#0での一重化運用状態
2:HDD#1での一重化運用状態
ハードディスク装置の活性交換時に故障ハードディスク装置を切り離す際には「HDD#0一重化運用」、又は「HDD#1一重化運用」の状態となる。すなわち何れかのハードディスク装置による単独運転となり、したがってその格納情報の二重化(冗長化)状態が無効化された状態、すなわち一重化状態となる。
【0109】
すなわちハードディスク装置151,152のうち、何れかに故障が生じた場合、正常状態のもののみによる運用となり、これを「一重化運用」と称している。そのような場合には故障が生じたハードディスク装置を切り離し、活性状態で新たに手配したハードディスク装置と交換する。
【0110】
図5中「復元中フラグ」とは以下の通りハードディスク装置151,152のニ重化復元作業中の状態を示す。
0:復元の為のコピー未実施状態
1:HDD#0からHDD#1へデータコピー中状態
2:HDD#1からHDD#0へデータコピー中状態
すなわち二重化が崩れた際はハードディスク装置151,152のうちの何れかが故障しているため、正常状態のもののみの運用となる。そして二重化を復元する際、運用中の正常のものから、新たに手配され交換して装着されたものへ情報のコピーを行う。
【0111】
図5中「パーティション数」は当該ハードディスク装置151,152が有するパーティション数を示す。
【0112】
又「パーティション#nの二重化状態」(n:0,1,2,...)とは、以下の通り当該パーティションについての二重化状態の有無を示す。
0:パーティションは二重化正常状態
1:パーティションのHDD#0側が故障状態
2:パーティションのHDD#1側が故障状態
図5中「パーティション#nのマスタHDD」(n:0,1,2,...)とは、以下の通り当該パーティションについてのマスターハードディスク装置及びスレーブハードディスク装置151,152を示す。
0:HDD#0側がマスタ:
すなわち当該パーティションの二重化状態(すなわち上記「パーティション#nの二重化状態」(n:0,1,2,...)))が「HDD#1側故障」となっていた場合等にはHDD#0側が運用ハードディスク装置でありマスタとされる。
1:HDD#1側がマスタ:
上記同様、当該パーティションの二重化状態が「HDD#0側故障」であった場合、HDD#1側が運用ハードディスク装置でありマスタとされる。
図5中「パーティション#nの物理位置」とは各パーティションの開始位置(アドレス)を示す。
【0113】
図6〜9はSVP100のSVP制御プログラム20の動作の流れを説明するためのフローチャートである。
【0114】
ここではハードディスク装置151,152故障発生から故障ハードディスク装置の交換までの流れについて説明する。
【0115】
図6〜7はハードディスク装置151,152の故障発生後2週間その故障が放置された上でコンピュータシステムの電源が切断される迄の流れを示す。
【0116】
又図8〜9は上記コンピュータシステムの電源切断後再度電源の投入が行われ、その1週間経過後にハードディスク装置の活性交換が行われる迄の流れを示す。
【0117】
この場合ハードディスク装置151,152の二重化状態では、ハードディスク装置HDD#0がマスタとされていたとする。
【0118】
尚パーティション#0上の二重化制御情報についても他のパーティションのものと同様にハードディスク装置151,152の二重化制御の対象であるが、説明の便宜上単なる情報として位置づけ特に二重化制御に係る論理的な記述については省略する。
【0119】
図6中、保守員がコンピュータシステムの電源を投入すると(ステップS11)、上記ROM121内のプログラムによるSVP内部診断機能によりハードディスク装置151,152のヘッダ部が読み出され(ステップS12)、読み出されたHDD二重化制御情報31aがメモリ122に展開される(ステップS13)。この処理については図10〜図13とともに後述する。
【0120】
次に上記SPV内部診断機能により、同じくハードディスク装置151,152の内のマスターハードディスク装置HDD#0のヘッダ部からSVP制御プログラム20が読み出されメモリ122にロードされ(ステップS14)、カーネル10のブートが完了される(ステップS15)。
【0121】
次にカーネル10はSVP制御プログラム20の初期化タスク23を起動する(ステップS16)。初期化タスク23はハードディスク装置151,152の故障検出処理を行う。この処理、すなわち上記ステップS6の処理については図14,図16とともに後述する。
【0122】
初期化タスク23による初期化処理が無事完了すると(ステップS17),所定のユーザ運用機能21aが実行され(ステップS18)、HDD二重化制御部31の機能によりマスターハードディスク装置HDD#0から所定の運用データファイルが読み込まれる(ステップS19)。
【0123】
ここでユーザ運用機能21aを果たす目的で所定の運用データファイルをハードディスク装置151,152から読み出し中に異常が生じた場合を想定する。すなわちマスターハードディスク装置HDD#0に故障が生じ、そのパーティション#2からの読み出し時に異常が検出されたとする(ステップS20)。
【0124】
その場合HDD二重化制御部31は当該パーティション#2についてスレーブ側のハードディスク装置HDD#1からの読み出しを試み、これが成功したとする(ステップS21)。
【0125】
その結果を受けHDD二重化制御部31は、ハードディスク装置HDD#0のパーティション#2が故障の旨でメモリ122に展開中のHDD二重化制御情報31aを更新する(ステップS22)。又HDD二重化制御部31は同内容でハードディスク装置151,152のヘッダ部(パーティション#0)の内容を更新する(ステップS22)。
【0126】
次にHDD二重化制御部31はカーネル10に対し、上記ハードディスク装置HDD#0の故障を「軽度故障」として通報する(ステップS24)。
【0127】
このようにして、上記ステップS20における「読み出し失敗」を除き上記運用データファイルの読み込みが正常に終了したとする(ステップS25)。
【0128】
そして上記ユーザ運用機能21aの実行が正常に終了したとする(ステップS26)。
【0129】
次に図7中、カーネル10はエラーログタスク24を起動し、監視装置300又はSVPコンソール101を介して保守員に上記「軽度故障」発生の旨を通報する(ステップS27)。
【0130】
そして1週間経過後、カーネル10はパトロールタスク25を起動し、ハードディスク装置151,152の二重化状態チェック処理を実施させる(ステップS5)。この処理については図15〜16とともに後述する。
【0131】
その結果パーティション#2についてのハードディスク装置HDD#0の故障の状態が継続していることが検出される(ステップS30)。
【0132】
そこでパトロールタスク25はカーネル10に対しハードディスク装置HDD#0の故障を通報する(ステップS31)。
【0133】
これが完了すると(ステップS31)カーネル10はエラーログタスク24を起動し、監視装置300又はSVPコンソール101を介して再び保守員に「軽度故障」発生の旨を通報する(ステップS32)。
【0134】
更に1週間後、カーネル10は再度パトロールタスク25を起動する(ステップS33)。以後ステップS34〜S37の処理は上記ステップS29〜32の処理と同様でありその説明を省略する。
【0135】
次に保守員がコンピュータシステムの電源停止の操作をしたとする(ステップS38)。
【0136】
その結果カーネル10の制御の下、初期化タスク23を介し、HDD二重化制御部31によりハードディスク装置151,152が停止される(ステップS39〜41)。これを受け、初期化タスク23によりコンピュータシステムの電源が切断される(ステップS42)。
【0137】
次に図8中、ステップS51にて保守員によってコンピュータシステムの電源投入操作がなされると、上記ステップS11以降の動作同様、上記ROM121のプログラムによるSVP内部診断機能によってハードディスク装置151,152のヘッダ部が読み取られる(ステップS52)。尚前記ステップS23において同ヘッダ部にはハードディスク装置HDD#0のパーティション#2の故障の旨が記録されている。
【0138】
又上記ROM121のプログラムによるSVP内部診断機能はこのように読み出したHDD二重化制御情報をメモリ122に展開する(ステップS53)。そしてSVP制御プログラムをメモリ122にロードし(ステップS54)、カーネル10のブートを完了する(ステップS55)。
【0139】
次にカーネル10はSVP制御プログラム20の初期化タスク23を起動し(ステップS56)、初期化タスク23によりハードディスク装置151,152の故障検出処理が行われる。上記の如くこの処理、すなわち上記ステップS6の処理については図14,図16とともに後述する。
【0140】
この場合初期化タスク23はこの処理において上記ハードディスク装置HDD#0のパーティション#2の故障を認識しエラーログタスク24を介し監視装置300又はSVPコンソール101を介して「軽度故障」の旨を保守員に通報し(ステップS57、S59)、当該初期化処理を終了する(ステップS58)。
【0141】
更に1週間後カーネル10は再度パトロールタスク25を起動する(ステップS60)。以後ステップS61〜S64の処理は上記ステップS29〜32の処理と同様であり、その説明を省略する。
【0142】
ここで図9中、ステップS65にて保守員が上記故障ハードディスク装置HDD#0の活性交換を行うものとする。
【0143】
その場合SVP制御プログラム20におけるフレームタスク21の保守機能21bにより、既に上記ステップS53にてメモリ122に展開されているHDD二重化制御情報31aが参照され(ステップS66)、その結果当該活性交換の対象たる故障ハードディスク装置がハードディスク装置HDD#0で有ることが認識される。
【0144】
その結果上記保守機能21bにより故障ハードディスク装置HDD#01をSVP100から切り離す旨の指示が出され(ステップS67)、これを受けたHDD二重化制御部31により当該ハードディスク装置のモータが停止され(ステップS68)、正常な側のハードディスク装置#1のみによるいわゆる「HDD一重化運用」状態とされる。そしてこのHDD一重化運用状態とされた旨により、メモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報がそれぞれ更新される(ステップS69,S70)。そしてこのようにしてHDD一重化運用状態へ移行する処理が完了した旨が上記保守機能21bに通報される(ステップS71)。
【0145】
その後保守員により故障ハードディスク装置HDD#0が正常なものと活性状態で交換されると、上記保守機能21bからHDD二重化制御装置31に対し、当該交換後のハードディスク装置HDD#0を使用した元のHDD二重化状態を復元する旨の指示が出される(ステップS75)。
【0146】
これを受けてHDD二重化制御部31はHDD二重化復元中の状態である旨で、メモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報をそれぞれ更新する(ステップS76,S77)。
【0147】
そしてステップS78にてHDD二重化制御部31は、現在運用中のハードディスク装置HDD#1から、交換された新たなハードディスク装置HDD#0に対し、その格納情報をコピーすることによって元のHDD二重化状態を復元する。
【0148】
このコピー処理が全パーティションについて正常に完了すると、その旨でメモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報がそれぞれ更新される(ステップS79,S80)。
【0149】
そしてHDD二重化制御部31は保守機能21bに対しHDD二重化状態復元が完了した旨を通知する(ステップS81)。
【0150】
そしてその1週間後カーネル10は再度パトロールタスク25を起動する(ステップS83)。
【0151】
この場合、メモリに展開されているHDD二重化制御情報31aにはステップS79にて「正常状態」の旨が記録されているため、その参照の結果、パトロールタスク25はHDD二重化状態チェック処理が正常に完了した旨をカーネル10に返す(ステップS85)。
【0152】
このように本発明の実施例1によれば初期化タスク23及びパトロールタスク25の機能により、ハードディスク装置151,152の二重化状態が損なわれた状態が放置された場合SVP100の再起動の際及びコンピュータシステムの運用中は定期的にその状態が保守員に通報される。
【0153】
したがって保守員は仮に当該二重化状態が損なわれた際の最初の通報に応じた対処ができなかったような場合でも、その後上記コンピュータシステムの再起動の際、あるいは運用中の定期的な通報によりその都度注意が喚起される。
【0154】
したがって当該ハードディスク装置151,152の二重化状態が損なわれた状態が長期間にわたって放置されるような事態を効果的に回避可能である。
【0155】
次に図10〜13とともに上記ROM121に格納されたプログラムのSVP内部診断機能による、ハードディスク装置151,152のヘッダ部からHDD二重化制御情報を読み出し、メモリ122に展開する処理の詳細を説明する。
【0156】
図10中、上記SVP内部診断機能によりハードディスク装置HDD#0のヘッダ部が読み出され(ステップS101)、同ヘッダ部の読み込みが失敗した場合にはその旨を示すフラグが設定される(ステップS102のYes,ステップS103)。
【0157】
同様にハードディスク装置HDD#1のヘッダ部が読み出され(ステップS104)、同ヘッダ部の読み込みが失敗した場合にはその旨を示すフラグが設定される(ステップS105のYes,ステップS106)。
【0158】
次に図11中、ステップS107において、上記フラグの設定状態の参照により、ハードディスク装置#0,#1の双方においてヘッダ部の読み込みが成功したか否かを判定する。
【0159】
ハードディスク装置HDD#0,HDD#1の双方でヘッダ読み出しが失敗していた場合(ステップS108のYes),当該ROM121のプログラムのSVP内部診断機能の動作が異常終了する。その場合、SVP制御プログラムをロードせずに処理を停止する。(SPC102は、SVPに対する生存チェック機能によりSVPの停止を検出すると、パネルにSVPの起動失敗を示すエラーコードを表示する。SPCはROMプログラム121の再起動を3回まで実施し起動ができない場合は処理を停止する。)
他方ハードディスク装置HDD#0のみでヘッダ部の読み込みが失敗していた場合(ステップS109のYes)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS110)。
【0160】
又ハードディスク装置HDD#1のみでヘッダ部の読み込みが失敗していた場合(ステップS109のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS111)。
【0161】
又ハードディスク装置HDD#0,#1の双方でヘッダ部の読み込みが成功していた場合(ステップS107のYes),そのヘッダ部から読み込まれた情報において、ハードディスク装置HDD#0,#1の両方のパーティション#0(ヘッダ部に対応)についての故障が記録されていた場合(図12中ステップS121のYes、ステップS22のYes)、当該ROM121のプログラムのSVP内部診断機能の動作が異常終了する。その場合、SVP制御プログラムをロードせずに処理を停止する。(SPC102は、SVPに対する生存チェック機能によりSVPの停止を検出すると、パネルにSVPの起動失敗を示すエラーコードを表示する。SPCはROMプログラム121の再起動を3回まで実施し起動ができない場合は処理を停止する。)
他方ハードディスク装置HDD#0のみについてパーティション#0の故障が記録されていた場合(ステップS123のYes)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS124)。
【0162】
又ハードディスク装置HDD#1のみについてパーティション#0の故障が記録されていた場合(ステップS123のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS125)。
【0163】
又ステップS121にてハードディスク装置HDD#0,#1のいずれについてもパーティション#0の故障の記録が無かった場合、図13中ステップS126に移行する。
【0164】
ここでハードディスク装置HDD#0によるHDD一重化運用状態であった場合(ステップS126のYes,S127のYes),ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS128)。
【0165】
他方ハードディスク装置HDD#1によるHDD一重化運用状態であった場合(ステップS126のYes,S127のNo)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS129)。
【0166】
他方このようなHDD一重化運用はなされておらず、すなわち通常通りHDD二重化運用がなされていた場合(ステップS126のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS130)。
【0167】
このように本発明の実施例1では、図6中ステップS13あるいは図8中ステップS53においてハードディスク装置HDD#0,#1のヘッダ部からHDD二重化制御情報を読み出してメモリ122に展開する際、ハードディスク装置のヘッダ部からの読み込みが失敗した場合、読み込まれたヘッダ部の内容からヘッダ部が格納されているパーティション#0の故障が認識された場合、あるいはHDD一重化運用状態であった場合には、それぞれ、読み込みが成功した側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開し(ステップS108〜S111)、パーティション#0が故障していない側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開し(ステップS122〜S125)、あるいは運用中の側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開する(ステップS127〜S129)。
【0168】
その結果、より信頼性の高いHDD二重化制御情報をメモリ122に展開することが可能となる。
【0169】
次に図14、図15,図16とともに、初期化処理時(図6中ステップS16,S6あるいは図8中ステップS56,S6)、又は一週間ごとの定期的なHDD二重化状態チェック処理(図7中ステップS28,S5;S33,S5、図8中、ステップS60,S5,図9中ステップS83,S5)の詳細について説明する。
【0170】
まず初期化処理時カーネル10により初期化タスク23が起動され、HDD二重化状態チェック処理が実行される(図14中ステップS141)。
【0171】
同様に一週間ごとの定期的なHDD二重化状態チェック処理では、カーネル10によってパトロールタスク24が起動され、同じくHDD二重化状態チェック処理が実行される(図15中ステップS151)。
【0172】
これらステップS141及びS151の各々において実行される上記HDD二重化状態チェック処理の流れを図16に示す。
【0173】
図16中、まずメモリ122に展開されているHDD二重化制御情報31aが参照される(ステップS161)。その際参照するハードディスク装置の番号として#0(すなわちHDD#0)が設定される(ステップS162)。
【0174】
そして設定されたハードディスク装置HDD#0以外のハードディスク装置、すなわちハードディスク装置HDD#1でのHDD一重化運用状態であった場合(ステップS163のYes),当該ハードディスク装置HDD#0の故障の旨がカーネル10に通報される(ステップS164)。
【0175】
他方HDD一重化運用状態ではなかった場合、すなわち通常通りHDD二重化運用であった場合(ステップS163のNo),参照すべきパーティション番号を#0に設定する(ステップS165)。そして、上記HDD二重化制御情報31a中、当該パーティションについて故障が記録されていた場合(ステップS166の「故障」)、その旨がカーネル10に通報される(ステップS167)。
【0176】
そして参照すべきパーティション番号が1インクリメントされ(ステップS169)、全パーティションのチェックが完了したかが判断され(ステップS169)、全パーティションについてチェックが完了する(ステップS169の「完了」)まで、順次参照するパーティション番号がインクリメントされ(ステップS168)、各パーティションについて故障の記録の有無チェックされる(ステップS166)。故障が有ればその都度カーネル10にその旨が通報される(ステップS167)。
【0177】
このようにして全パーティションがチェックされると(ステップS169の「完了」)、チェックすべきハードディスク装置の番号が1インクリメントされ(ステップS170)、他方のハードディスク装置、すなわちHDD#1につき上記同様のチェック及び必要に応じカーネル10への故障通報がなされる(ステップS163〜S169)。
【0178】
次に図17〜図18とともに、図9中ステップS66以降の故障ハードディスク装置の活性交換処理の流れの詳細について説明する。
【0179】
図17中ステップS181にて前記保守機能21bは、メモリ122に展開されているHDD二重化制御情報31aを参照し、その内容を保守用端末202に設けられた画面上で保守員に対し表示する(ステップS182)。
【0180】
それに対し保守員が故障ハードディスク装置の切り離しを指示する操作を保守用端末202上で行うと(ステップS183)、HDD二重化制御部31の機能により故障ハードディスク装置がSVP100から切り離され、その完了がHDD二重化制御部を介して保守機能21bに通知される。
【0181】
これを受け保守機能21bは、上記の動作によりHDD一重化運用状態となった旨により、運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS184)。
【0182】
又保守機能21bは保守用端末202の画面上で保守員に対し、故障ハードディスク装置の交換作業を促す(ステップS185)。
【0183】
次に図18中、保守員が故障ハードディスク装置の交換作業を行い、交換後の新たなハードディスク装置に対する接続を指示すると、保守機能21bはHDD二重化制御部31を介して当該交換に係る新たなハードディスク装置をSVP100へ接続する動作を行い(ステップS187)、HDD二重化復元中の状態である旨で運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS188)。
【0184】
そしてHDD二重化制御部31を介し、運用中のハードディスク装置から前記交換に係る新たなハードディスク装置に対しその格納情報をコピーすることによって元のHDD二重化状態を復元するための動作を開始する旨を保守用端末202の画面上で表示する(ステップS189)。
【0185】
その後実際に運用中のハードディスク装置から前記交換に係る新たなハードディスク装置に対しその格納情報をコピーすることによって元のHDD二重化状態を復元するための動作が順次実施される(ステップS190)。その際保守用端末202の画面上では当該格納情報のコピー動作の進捗状況が表示される(ステップS191)。
【0186】
同格納情報のコピー動作がすべてのパーティションについて終了すると保守機能21bはHDD二重化制御部31を介し、HDD二重化状態となった旨で、運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS192)。
【0187】
そして保守用端末202の画面上で、故障ハードディスク装置の活性交換作業の完了の旨を表示する(ステップS193)。
【0188】
ユーザの運用を停止中に保守する場合は、SVPコンソール101を保守モードにして同様な操作により故障部品の交換を行うことができる。
【実施例2】
【0189】
以下、本発明の実施例2の構成について説明する。
【0190】
実施例2は上述の実施例1と同様の構成及び機能を有し、実施例1との相違は、冗長化するハードディスク装置が2台ではなく3台以上の場合を想定している点である。
【0191】
以下この相違点に関する内容のみ説明し、それ以外の重複する説明を省略する。
【0192】
この場合、(1)冗長化ハードディスク装置の構成として、上記実施例1同様全ハードディスク装置は互いに同一の構成で区分され、各ハードディスク装置の同じ位置の領域には同じデータが格納される。
【0193】
又上記実施例1同様全ハードディスク装置の同じ位置に割り当てられた領域をパーティションと称され、冗長化制御対象の単位とされる。
【0194】
各パーティションは一つのマスターハードディスク装置と、一つ以上のスレーブハードディスク装置とにより重複して保有される。
【0195】
(2)上記HDD二重化制御情報31aに対応するHDD冗長化制御情報として、上記複数のハードディスク装置に対し、実装位置に対応する識別番号が#0から順に割り振られる。
【0196】
又上記複数のパーティションは、ハードディスク装置内のアドレス順に#0から識別番号が割り振られる。
【0197】
HDD冗長化制御情報はこのパーティションの番号に対応したデータテーブルにより構成される。
【0198】
各テーブルには当該パーティションを保有するマスターハードディスク装置の番号及び同パーティションを保有する故障ハードディスク装置の番号が示される。ここで冗長化制御情報はパーティション#0に格納される。
【0199】
HDD冗長化制御情報はコンピュータシステムの電源投入時にハードディスク装置からSVPのメモリ上に展開され、前回運用時のHDD冗長化状態が引き継がれる。
【0200】
運用中に冗長化ハードディスク装置の状態が変化した場合、上記メモリ上のHDD冗長化制御情報の更新と同時に、ハードディスク装置中のパーティション#0のHDD冗長化制御情報も同時に更新される。
【0201】
(3)実施例1におけるHDD二重化制御部31に対応するHDD冗長化制御部によるハードディスク装置への書き込み処理では、各パーティションを有する全ハードディスク装置の領域に同じデータが書き込まれる。
【0202】
ハードディスク装置からの読み出し処理では、パーティションを有するマスターハードディスク装置の領域からデータが読み出される。
【0203】
上記書き込み処理でエラーが発生した場合、該当するパーティションを有するマスターハードディスク装置又はスレーブハードディスク装置が故障状態として認識される。
【0204】
上記読み出し処理でエラーが発生した場合、該当するパーティションを有するマスターハードディスク装置が故障状態として認識される。
【0205】
これら読み出し又は書き込み処理で該当するパーティションを有するマスターハードディスク装置が故障した場合、当該パーティションを有する、故障の発生していない任意のハードディスク装置が当該パーティションについてのマスターハードディスク装置として割り当てられる。
【0206】
(4)HDD冗長化制御部によるハードディスク装置故障通報処理では、各パーティションを有するマスターハードディスク装置又はスレーブハードディスク装置の内規定個数以上のものが故障した場合、冗長化ハードディスク装置に軽度故障(すなわちパーティションの冗長化崩れ)が発生したと判断される。
【0207】
そしてこのハードディスク装置の軽度故障(パーティションの冗長化崩れ)が検出された場合、保守員に軽度故障の旨が通報される。
【0208】
(5)ハードディスク装置故障の定期監視処理機能を有するパトロールタスク(実施例1のパトロールタスク25に対応)が定期的に起動され、ハードディスク装置の軽度故障(パーティションの冗長化崩れ)の有無が監視される。
【0209】
同処理において軽度故障が検出された場合、再度保守員に軽度故障の旨が通報される。そしてさらに、一定時間経過するごとに、ハードディスク装置の軽度故障の有無がチェックされ、元のハードディスク装置の冗長化状態が回復する迄、保守員への軽度故障の旨の通報が繰り返しなされる。
【0210】
(6)初期化処理によるハードディスク装置故障検出処理では、保守員によりSVPの運用停止後に運用の再開があった場合、ハードディスク装置の軽度故障(パーティションの冗長化崩れ)の検出がなされる。
【0211】
同処理においてハードディスク装置の軽度故障が検出された場合、再度保守員に軽度故障の旨が通報される。
【0212】
このように本発明の実施例2によれば、複数個のハードディスク装置による格納情報の冗長化を行う場合、すなわち複数個のハードディスク装置に同じ内容の情報をそれぞれ重複して格納することによりその内の一又は複数個(上記冗長化に係るハードディスク装置の全個数より少ない個数)のハードディスク装置の格納情報が損なわれても残りのハードディスク装置に同じ内容の情報が格納されているため格納情報の安全化が図られる場合、当該冗長化に係るハードディスク装置の全個数より少ない一以上の所定の個数のハードディスク装置の格納情報が損なわれたと判断された場合にはその旨が保守員に自動的に通報され、又その通報はSVPの起動のたびごとに、さらには運用中は一定期間ごとに行われる。
【0213】
その結果、仮に最初の軽度故障の通報の際に保守員が故障ハードディスク装置の交換等による対応を行わなかったような場合であっても、SVPの起動のたびごと、さらには運用中は一定期間ごとに同様の通報が自動的に保守員に対してなされるため、冗長化状態が損なわれた状態、いわゆる冗長化崩れの状態が長期間にわたって放置されるような事態が効果的に回避され得る。
【0214】
本発明は以下の付記の各々に記載の構成をとり得る。
(付記1)
情報記憶装置の制御方法であって、
前記情報記憶装置に格納されている情報は冗長化されており、
冗長化障害記録手段が、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録し、
冗長化監視手段が前記状態記録手段から冗長化障害の旨の記録を読み出し、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、通報手段がその旨の通報を行う各段階を備える情報記憶装置の制御方法。
(付記2)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記1に記載の情報記憶装置の制御方法。
(付記3)
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は定期的に実行される構成の付記1に記載の情報記憶装置の制御方法。
(付記4)
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は前記情報記憶装置が起動する際に実行される構成の付記1に記載の情報記憶装置の制御方法。
(付記5)
情報記憶装置であって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記冗長化の状態に関する情報を記録する状態記録手段と、
前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段と、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段と、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段とを備える情報記憶装置。
(付記6)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記5に記載の情報記憶装置。
(付記7)
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の付記5に記載の情報記憶装置。
(付記8)
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の付記5に記載の情報記憶装置。
(付記9)
情報記憶装置を制御するためのプログラムであって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記情報記憶装置を制御するためのコンピュータを、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段及び、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段として機能させるための命令を含むプログラム。
(付記10)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記9に記載のプログラム。
(付記11)
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の付記9に記載のプログラム。
(付記12)
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の付記9に記載のプログラム。
(付記13)
付記9〜12のうちの何れか一項に記載のプログラムを格納したコンピュータ読取可能な情報記録媒体。
【図面の簡単な説明】
【0215】
【図1】従来の一例の情報記憶装置の制御方法を説明するためのブロック図である。
【図2】本発明の一実施例による情報記憶装置の制御方法を実施する機能を有するコンピュータのハードウェア構成について説明するためのブロック図である。
【図3】本発明の一実施例による情報記憶装置の制御方法をコンピュータに実行させるためのプログラムの構成について説明するためのブロック図である。
【図4】本発明の一実施例による情報記憶装置の制御方法を説明するためのブロック図である。
【図5】図4中のHDD二重化制御情報の一例を説明するための図である。
【図6】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その1)である。
【図7】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その2)である。
【図8】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その3)である。
【図9】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その4)である。
【図10】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その1)である。
【図11】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その2)である。
【図12】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その3)である。
【図13】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その4)である。
【図14】本発明の一実施例による情報記憶装置の制御方法における初期化時のハードディスク装置故障検出処理の動作の流れを説明するためのフローチャートである。
【図15】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置故障の定期監視処理の動作の流れを説明するためのフローチャートである。
【図16】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置故障の放置検出処理の動作を説明するためのフローチャートである。
【図17】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置二重化復旧処理の動作を説明するためのフローチャート(その1)である。
【図18】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置二重化復旧処理の動作を説明するためのフローチャート(その2)である。
【符号の説明】
【0216】
10 カーネル
20 SVP制御プログラム
21 フレームタスク
23 初期化タスク
24 エラーログタスク
25 パトロールタスク
30 ハードディスクドライバ
31 HDD二重化制御部
31a HDD二重化制御情報
100 SVP
121 ROM
151,152 ハードディスク装置
200 本体装置
【技術分野】
【0001】
本発明は情報記憶装置の制御方法、情報記憶装置、プログラム及びコンピュータ読取可能な情報記録媒体に係り、特に情報記憶装置に格納された情報を冗長化する機能を有する情報記憶装置の制御方法、その情報記憶装置、同制御方法をコンピュータに実行させるためのプログラム及び同プログラムを格納したコンピュータ読取可能な情報記録媒体に関する。
【背景技術】
【0002】
高信頼化を目的としてハードディスク装置を冗長化して実装する情報記憶装置において、冗長化ハードディスク装置の軽度故障、いわゆる「冗長化崩れ」が生ずることがある。
【0003】
例えば図1に示す如く、大型コンピュータを管理制御するためのSVP(サービスプロセッサ)100'と称されるコンピュータとしてユーザ運用機能、保守機能、試験機能、外部監視装置との通信機能等を提供し、これら機能の実現に必要なSVP制御プログラム20'および制御データを格納する2台のハードディスク装置HDD#0 151,HDD#1 152を実装するものとする。
【0004】
このSVPには又、このように2台のハードディスク装置を冗長な二重化構成の資源として管理、制御するためのHDD二重化制御部31'が設けられている。
【0005】
このHDD二重化制御部は2台のハードディスク装置を同一の構成で区分けし、区分けしたパーティション単位で二重化制御を行う。
【0006】
又HDD二重化制御部は一方のハードディスク装置(図1の例の場合、ハードディスク装置#0)に復旧不可能な故障を検出すると、故障の発生したパーティション(図1の例の場合、パーティション#1)については正常なハードディスク装置のみを用いた一重化制御に切り替えて上位のSVP制御プログラムの運用を継続する。
【0007】
又このようにハードディスク装置の冗長化、すなわち二重化状態が一部崩れたことを上記HDD二重化制御部が保守員に通報する。
【0008】
ここで本願の明細書及び特許請求の範囲において「冗長化が崩れる」あるいは「冗長化崩れ」とは、情報が冗長化された状態、すなわち冗長化すべき情報がコピーされ同じ内容を有する情報が複数個重複して生成され、当該内容が同じ複数個の情報が複数の記録媒体のそれぞれに格納された状態、すなわち冗長化状態に対し、上記内容が同じ複数個の情報の内、全数ではない一又は複数個の情報に何らかの障害が生じることにより冗長化状態が損なわれることを意味する。
【0009】
尚この「冗長化崩れ」では、上記内容が同じ複数個の情報の内少なくとも一個の情報には何ら障害が無く、もって実質的に情報の欠損は生じておらず、あくまで当該冗長化によって当初期待した情報の安全性向上の効果がその分低下するにすぎない。
【0010】
すなわち図1の例では冗長化崩れにより二重化状態が崩れたパーティションについて、さらに正常なハードディスク装置側にも復旧不可能な故障が発生する頻度は低い。もって当該冗長化崩れの要因たる故障ハードディスク装置の交換作業に対する緊急度はあまり高くないとも言える。
【0011】
しかしながらこの冗長化崩れの状態が長期間放置されることは望ましくない。さらに当該パーティションについて正常なハードディスク装置側にも故障が発生する可能性は小さいながらも存在するからである。そのような事態が生じた場合当該SPV自体の運用を停止する事態となるため、このような事態を防止するために保守員は早期に冗長化崩れからの復旧のために新たなハードディスク装置を手配して故障ハードディスク装置を交換することが望ましい。
【0012】
一方、当該SVPが監視制御対象とする大型コンピュータは、その装置数、部品数が多く、SVPに接続されるハードディスク装置の故障以外にも保守に必要な通報事象が多く存在し、それらの発生頻度も高い。
【0013】
ここでハードディスク装置の軽度故障(すなわちパーティションの「冗長化崩れ」)が検出された場合、その旨がSVPから保守員に通報される。ここでたまたま同時にその他の優先度の高い通報事象が多く発生する場合を想定すると、それらがほぼ同時期に保守員に通報されることとなり、ハードディスク装置の軽度故障の通報が見落とされるおそれがある。
【特許文献1】特開2004−271983号公報
【発明の開示】
【発明が解決しようとする課題】
【0014】
本発明はこのような状況に鑑みてなされたものであり、情報記憶装置においてその格納情報の冗長化を維持するのに障害が生じた場合、同障害を解消するための措置が確実になされるような構成を提供することを目的とする。
【課題を解決するための手段】
【0015】
本発明では冗長化手段が前記情報記憶装置に格納されている情報の冗長化を行い、情報が冗長化された状態の維持に障害が生じた場合冗長化障害記録手段が当該冗長化障害の旨を状態記録手段に記録し、冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行うようにした。
【0016】
本発明ではこのように冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行う。
【0017】
このため仮に保守員が当該冗長化障害の発生の際の最初の通報に対する対応を行わず放置したような場合であっても、冗長化監視手段により状態記録手段から冗長化障害の旨の記録を読み出され、冗長化監視手段により冗長化障害の旨の記録が読み出された場合に通報手段によりその旨の通報がなされる。
【0018】
したがって冗長化障害の状態が長期間にわたって放置されるような状況を確実に回避可能である。
【発明の効果】
【0019】
このように本発明によれば、格納情報を冗長化する機能を有する情報記憶装置において冗長化の維持に対する障害が生じた場合、当該冗長化障害の状態が長期間にわたって放置されるような状況が確実に回避可能となる。このため、情報記憶装置において格納情報の冗長化の状態が確実に維持されるようになり、もって格納情報の安全性を効果的に確保し得る。
【発明を実施するための最良の形態】
【0020】
以下図とともに本発明の実施例につき、詳細に説明を行う。
【実施例1】
【0021】
本発明の実施例1について説明を行う。
【0022】
本発明の実施例1によれば、冗長な二重化構成のハードディスク装置を管理、制御し、一方のハードディスク装置に故障が発生しても冗長でない構成で運用が継続可能な装置において、当該故障検出時に故障を通報した後、当該故障が放置された場合には一定時間ごとに、あるいは電源投入時のたびごとに自動で当該故障の放置が再検出され、繰り返し通報がなされる。
【0023】
図2は本発明の実施例1による情報記録装置の制御方法を実行するコンピュータとしてのSVP(サービスプロセッサ)を含むコンピュータシステムの概要を説明するためのブロック図である。
【0024】
図2中、当該コンピュータシステムの本体装置200はシステムボード211を中心に様々な機能ユニットSSM 212,SSX0 124,SSX1 215,SSU216,IOP217,I/O219及びCLK213を有する。
【0025】
本体装置コンソール201は、当該コンピュータシステムがユーザに提供する諸機能(システムボード211上で動作するOSにより提供される機能)をユーザが操作する為のコンソールである。
【0026】
SVPコンソール101は、ユーザ運用機能、保守機能、試験機能の操作を行う為のコンソールである。ユーザモード時はユーザ運用機能のみ操作が可能となる。保守モード時は、保守に必要な機能の操作が可能となる。保守モードはユーザの運用を停止して保守を行う場合に使用する。
【0027】
保守用端末202は、ユーザの運用を停止せずに保守(活性保守)を行う場合に、保守に必要な機能の操作を行う為のコンソールである。活性保守時のみ接続する。
【0028】
SVP100はMPU(マイクロプロセッサユニット)111,キャッシュ112,ROM121,RAM122,上記二重化構成とされたハードディスク装置151,152、MOドライブ161,フレキシブルディスクドライブ162等を有する。
【0029】
上記SSU216,I/O219は本体装置200の外部に接続され、SSU(System Storage Unit)216はシステム記憶装置であり、I/O(Input/Output)219はDASD等の入出力装置である。
【0030】
又以下の各部は本体装置200内に接続され、SVP100による制御、保守等の対象となる。
【0031】
システムボード211:複数のCPUとメモリとが実装される。
【0032】
CLK(Clock Board)213:システムボード211にクロックを分配する。
【0033】
SSM(SS Mover)212:上記SSU216と接続され、主記憶とシステム記憶との間のデータ転送を行う。
【0034】
IOP(Input/Output Processor)217:入出力装置との間のデータ転送を行う。
【0035】
SCI(System Console Interface)103:SVP100が本体装置200内の各部を制御、通信する為のインタフェースを提供する。
【0036】
SPC(System Power Controller)102:本体装置200全体の電源の制御を行う。
【0037】
FAN105:冷却用ファンである。
【0038】
FEP(Front End Power Supply)106:本体装置200内の各部に電源を供給する。
【0039】
又以下の各部は本体装置200内に接続されるSVP100自体と、SVP100の内部のアダプタである。
【0040】
SVP(Service Processor)100:本体装置200のユーザ運用機能、保守機能、試験機能と、外部監視装置300との通信機能とを提供する。
【0041】
SCIA(SCI Adapter)144:SCI103を介して本体装置200との通信および制御を行うアダプタである。
【0042】
SPCA(System Power controller adapter)145:SPC103とのインタフェースの制御を行うアダプタである。
【0043】
DPA(Display Adapter)143:ディスプレイ装置を接続するアダプタである。
【0044】
SIA(Serial Interface Adapter)146:回線を接続するアダプタである。
【0045】
FDA(Floppy Disk Adapter)141:フレキシブルディスクを制御するアダプタである。(「Floppy」は登録商標)
【0046】
MDA(Micro Disk Adapter)130:ハードディスク装置及びMOドライブを制御するアダプタである。
【0047】
SCA(SVP Communication Adapter)135:LANに接続するアダプタであり、外部監視装置300、他のSVP400との間の通信を行う。
【0048】
図3はこのSVP100のソフトウェア構成を説明するためのブロック図である。
【0049】
SVP100のソフトウェアはROM121に設けられたSVP内部診断機能を提供するプログラム及び上記ハードディスク装置151,152に格納されたSVP制御プログラム20を有する。このSVP制御プログラム20はカーネル10,フレームタスク21,割り込みタスク22,初期化タスク23,エラーログタスク24及びパトロールタスク25を有する。
【0050】
初期化タスク23はハードディスク装置151,152の故障の検出を行う機能を提供し、パトロールタスク25はハードディスク装置151,152の故障の放置を検出する機能を提供する。
【0051】
更に上記SVP制御プログラム20は、ハードディスク装置ドライバ30,フレキシブルディスクドライバ41,LANポートドライバ42,ディスプレイ装置制御ドライバ43,SCIドライバ、SPCドライバ45及びRS232Cポートドライバ46を含む。
【0052】
ハーディスク装置ドライバ30はHDD二重化制御部31及びSCSI制御部32を有する。
【0053】
上記ROM121に設けられたプログラムはSVP100内部の診断を行う。すなわちハードディスク装置151,152のヘッダ部(パーティション#0)に書き込まれたHDD二重化制御情報を読み出し、その内容をメモリ(RAM122)上に展開する(HDD二重化制御情報31a)。又同プログラムはハードディスク装置151,152からSVP制御プログラム20のロードを行う。
【0054】
カーネル10は又上記SVP制御プログラム20が有する各タスクの状態制御、タスク間の排他制御、通信制御を行う。更にメモリ資源、タイマ資源、ファイルの管理、制御を行う。
【0055】
ハードディスク装置ドライバ30のHDD二重化制御部31は上記二重化制御情報31aを用いてハードディスク装置151,152の二重化、すなわち冗長化に関する制御を行う。
【0056】
又ハードディスク装置151,152の始動、停止、情報の読み出し、書き込み等の動作は、このHDD二重化制御部31がSCSI制御部32を呼び出して実行させる。
【0057】
又HDD二重化制御部31はハードディスク装置151,152の故障検出時、システムコール経由でエラーログタスク24を起動し、故障の通報を行わせる。
【0058】
SCSI制御部32はハードディスク装置151,152の始動、停止、動作モードの設定、ハードディスク装置151,152への情報の書き込み、同装置からの情報の読み出し、故障情報の取得等を行う。
【0059】
ここでSCSI制御部32の制御対象は2台のハードディスク装置151,152とMOドライブ161である。
【0060】
フレキシブルディスクドライバ41はフロッピーディスクドライブ162(図2参照)(「フロッピー」は登録商標)の制御を行う。
【0061】
LANポートドライバ42は監視装置300との通信制御を行う。
【0062】
ディスプレイ装置制御ドライバ43は本体装置100のコンソール201及びSVP100のコンソール101との通信制御を行う。
【0063】
RS232Cポートドライバ46は保守用端末202とRS232Cによる通信制御を行う。
【0064】
SPCドライバ45はSPC102との通信制御を行う。このSPC102との通信によってコンピュータシステムの電源投入、切断時の制御がなされる。
【0065】
SCIドライバ44はSCI103を経由して本体装置200の制御を行う。
【0066】
初期化タスク23はSVP100の起動時にSVP制御プログラム20が有する各タスクの初期化、起動を行うとともにハードディスク装置151,152故障の放置のチェックを行う。そして初期化タスクハードディスク装置151,152の故障の放置を検出時、システムコール経由でエラーログタスク24を起動し、故障の通報を行う。
【0067】
又パトロールタスク25が定期的に起動され、本体装置200の状態の監視とともにハードディスク装置151,152の故障の放置の監視を行う。ここではその監視対象によって、500ms単位、60分単位、1日単位、1週間単位で起動される。
【0068】
パトロールタスク25によるハードディスク装置151,152の故障の放置の監視は1週間単位で実施され、ハードディスク装置151,152の故障の放置を検出時はシステムコール経由でエラーログタスク24を起動し、故障の通報を行う。
【0069】
エラーログタスク24は本体装置200の故障、SVP100内部の故障あるいはハードディスク装置151,152の故障が発生した場合、検出元のタスク又はドライバからシステムコール経由で起動され、エラーログの格納、コンソール、パネルへの表示、監視装置300への通報等の処理を行う。
【0070】
フレームタスク21はSVPコンソール101あるいは保守用端末202経由で所定のユーザ運用機能21a及び保守機能等21bを提供する。
【0071】
ユーザ運用機能21aとは本体装置200による制御機能に該当し、本来当該コンピュータシステムがユーザに対し提供すべき諸機能(例えば大規模通信網の通信制御機能等)を提供する機能である。
【0072】
保守機能21bは本体装置200及びSVP100自体の部品の保守交換機能を提供する。
【0073】
割り込みタスク50はSCI103経由で通知される本体装置200からの割り込みに対する処理を行う。
【0074】
図4はSVP100が有する機能の内、特に本発明に係る機能部分を抽出して示すブロック図である。
【0075】
すなわち本発明の実施例1ではHDD二重化制御部31がハードディスク装置151,152からの情報の読み出し、同装置への情報の書き込み時にハードディスク装置151,152の故障を検出し、通報する(ステップS1)。
【0076】
すなわちハードディスク装置151,152の軽度故障、すなわち特定のパーティション(図4に例ではパーティション#1)の二重化崩れ(冗長化崩れ)を検出した際、通信網LAN#0,LAN#1を介し監視装置300により、あるいはSVPコンソール101により保守員にその旨を通報する。
【0077】
又パトロールタスク25の機能により定期的な監視を行いハードディスク装置151,152故障の放置を検出して通報する(ステップS2)。
【0078】
すなわちハードディスク装置151,152に軽度故障、すなわちパーティション(パーティション#1)の二重化崩れが発生してから一定時間経過後においても当該故障が放置されている場合、これを検出して再度通信網LAN#0,LAN#1経由で監視装置300によりあるいはSVPコンソール101により保守員に「軽度故障」の旨を通報する。同様にしてさらに一定時間ごとに状態を監視し、二重化状態が回復する迄保守員への「軽度故障」の旨の通報を繰り返し行う。
【0079】
又初期化タスク23の機能により当該コンピュータシステムの運用開始時にハードディスク装置151,152故障の放置が検出され通報される(ステップS3)。
【0080】
すなわちハードディスク装置151,152の軽度故障、すなわちパーティション#1の二重化崩れを検出後、保守員によって一旦システムの運用が停止された後に再度運用が再開される場合に依然としてハードディスク装置151,152の軽度故障、すなわちパーティション#1の二重化崩れが放置されておりこれが検出された場合、再度通信網LAN#0,LAN#1経由で監視装置300あるいはSVPコンソール101により保守員に軽度故障の旨が通報される。
【0081】
その結果ハードディスク装置151,152の軽度故障が長期間にわたって放置される事態を効果的に回避可能となり、もってハードディスク装置151,152の重複故障によるSVPの運用停止の事態を回避し高信頼な機能を提供することが可能となる。
【0082】
以下に上記SVP100の機能の内、情報の冗長化機能に係る構成につき更に詳細に説明を行う。
【0083】
(1)二重化ハードディスク装置151,152の構成:
2台のハードディスク装置151,152は互いに同一の構成で区分され、各ハードディスク装置151,152の同じ位置の領域には同じデータが格納される。
【0084】
ここでこれら2台のハードディスク装置151,152の同じ位置に割り当てられる領域をパーティションと称され、当該二重化制御対象の単位とされる。
【0085】
各パーティションについて同一の情報がマスターハードディスク装置及びスレーブハードディスク装置により重複して保有される。すなわち各パーティションの情報が二重化あるいは冗長化状態で格納される。
【0086】
(2)HDD二重化制御情報31a:
2台のハードディスク装置151,152は、コンピュータシステムの本体装置200に対する実装位置に対応する識別番号が#0から順に割り振られる。以下、ハードディスク装置151,152は説明の便宜上、それぞれハードディスク装置HDD#0,HDD#1と称される場合がある。
【0087】
又複数のパーティションはハードディスク装置151,152内のアドレス順に、#0から識別番号が割り振られる。
【0088】
HDD二重化制御情報31aはパーティションの番号に対応したデータテーブルにより構成される。
【0089】
又各テーブルには当該パーティションを保有するマスターハードディスク装置の番号及び当該パーティションを重複して保有する故障ハードディスク装置の番号が示される。
【0090】
このHDD二重化制御情報31aはパーティション#0(ハードディスク装置151,152の各々が有する記録領域のヘッダ部に対応)に格納される。
【0091】
HDD二重化制御情報31aはコンピュータシステムの電源投入時にハードディスク装置151,152から読み出されてメモリ122上に展開され、前回運用時のハードディスク装置151,152の二重化の構成及びその状態がそのまま引き継がれる。
【0092】
又当該コンピュータシステムの運用中にハードディスク装置151,152の状態が変化した場合、メモリ122上の情報の更新と同時に、パーティション#0に書き込まれたHDD二重化制御情報も更新される。
【0093】
又HDD二重化制御情報31aには故障ハードディスク装置151又は152の交換時、当該故障ハードディスク装置の切り離しの際に参照される二重化有効状態が記録される。この二重化有効状態とは、ハードディスク装置151,152が二重化状態か一重化状態かを示す情報である。
【0094】
尚HDD二重化制御情報については図5とともに後述する。
【0095】
(3)HDD二重化制御部31:
HDD二重化制御部31はハードディスク装置151,152への情報の書き込みの際、該当するパーティションを重複して保有する2台のハードディスク装置151,152のそれぞれの該当する領域に同じ情報を書き込む。
【0096】
又ハードディスク装置151,152からの情報の読み出しの際、該当するパーティションについてのマスターハードディスク装置の領域から情報を読み出す。
【0097】
上記書き込み処理でエラーが発生した場合エラーを生じたパーティションについてのマスターハードディスク装置又はスレーブハードディスク装置を故障状態として認識する。
【0098】
又読み出し処理でエラーが発生した場合、エラーを生じたパーティションについてのマスターハードディスク装置が故障状態にあるものと認識する。
【0099】
又読み出し又は書き込み処理で該当するパーティションについてのマスターハードディスク装置が故障した場合、当該パーティションについて故障が発生していない側のハードディスク装置、すなわちスレーブハードディスク装置を当該パーティションについてのマスターハードディスク装置として認識し直す。
【0100】
(4)HDDニ重化制御部31によるハードディスク装置151,152の故障通報処理(図6〜9中、ステップS4):
HDD二重化制御部31はあるパーティションについてのマスターハードディスク装置又はスレーブハードディスク装置のいずれかが故障した場合、ハードディスク装置151,152に軽度故障、すなわちパーティションのニ重化崩れが発生したものと認識する。
【0101】
HDD二重化制御部31はこのようにしてハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れを検出した場合、上記の如く監視装置300あるいはSVPコンソール101を介して保守員に軽度故障の旨を通報する。
【0102】
(5)ハードディスク装置151,152故障の定期監視処理(図6〜9中、ステップS5):
SVP制御プログラム20のパトロールタスク25は、ハードディスク装置151,152の故障に対する定期監視処理を行う。パトロールタスク25は一週間間隔に起動され、ハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れの有無を監視する。
【0103】
そこで故障を検出した場合、再度監視装置300又はSVPコンソール101を介して保守員に軽度故障の旨を通報する。
【0104】
さらにパトロールタスク25は一週間経過するごとにハードディスク装置151,152の軽度故障の有無を監視し、ハードディスク装置151,152のニ重化状態(冗長化状態)が回復する迄保守員への軽度故障の通報を繰り返し行う。
【0105】
(6)初期化処理におけるハードディスク装置151,152の故障検出処理(図6〜9中、ステップS6):
SVP制御プログラム20の初期化タスク23は、保守員により当該コンピュータシステムの運用の停止操作がなされた後更に同システムの運用の再開操作がなされた場合、ハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れの有無の検出を行う。
【0106】
ハードディスク装置151,152の軽度故障を検出した場合には再度監視装置300又はSVPコンソール101を介して保守員に軽度故障の旨を通報する。
【0107】
図5はHDD二重化制御情報31aの例を示す図である。
【0108】
図中「二重化有効状態」とは、以下の如く、ハードディスク装置151,152の上記二重化状態又は一重化状態を示す。
0:二重化有効状態
1:HDD#0での一重化運用状態
2:HDD#1での一重化運用状態
ハードディスク装置の活性交換時に故障ハードディスク装置を切り離す際には「HDD#0一重化運用」、又は「HDD#1一重化運用」の状態となる。すなわち何れかのハードディスク装置による単独運転となり、したがってその格納情報の二重化(冗長化)状態が無効化された状態、すなわち一重化状態となる。
【0109】
すなわちハードディスク装置151,152のうち、何れかに故障が生じた場合、正常状態のもののみによる運用となり、これを「一重化運用」と称している。そのような場合には故障が生じたハードディスク装置を切り離し、活性状態で新たに手配したハードディスク装置と交換する。
【0110】
図5中「復元中フラグ」とは以下の通りハードディスク装置151,152のニ重化復元作業中の状態を示す。
0:復元の為のコピー未実施状態
1:HDD#0からHDD#1へデータコピー中状態
2:HDD#1からHDD#0へデータコピー中状態
すなわち二重化が崩れた際はハードディスク装置151,152のうちの何れかが故障しているため、正常状態のもののみの運用となる。そして二重化を復元する際、運用中の正常のものから、新たに手配され交換して装着されたものへ情報のコピーを行う。
【0111】
図5中「パーティション数」は当該ハードディスク装置151,152が有するパーティション数を示す。
【0112】
又「パーティション#nの二重化状態」(n:0,1,2,...)とは、以下の通り当該パーティションについての二重化状態の有無を示す。
0:パーティションは二重化正常状態
1:パーティションのHDD#0側が故障状態
2:パーティションのHDD#1側が故障状態
図5中「パーティション#nのマスタHDD」(n:0,1,2,...)とは、以下の通り当該パーティションについてのマスターハードディスク装置及びスレーブハードディスク装置151,152を示す。
0:HDD#0側がマスタ:
すなわち当該パーティションの二重化状態(すなわち上記「パーティション#nの二重化状態」(n:0,1,2,...)))が「HDD#1側故障」となっていた場合等にはHDD#0側が運用ハードディスク装置でありマスタとされる。
1:HDD#1側がマスタ:
上記同様、当該パーティションの二重化状態が「HDD#0側故障」であった場合、HDD#1側が運用ハードディスク装置でありマスタとされる。
図5中「パーティション#nの物理位置」とは各パーティションの開始位置(アドレス)を示す。
【0113】
図6〜9はSVP100のSVP制御プログラム20の動作の流れを説明するためのフローチャートである。
【0114】
ここではハードディスク装置151,152故障発生から故障ハードディスク装置の交換までの流れについて説明する。
【0115】
図6〜7はハードディスク装置151,152の故障発生後2週間その故障が放置された上でコンピュータシステムの電源が切断される迄の流れを示す。
【0116】
又図8〜9は上記コンピュータシステムの電源切断後再度電源の投入が行われ、その1週間経過後にハードディスク装置の活性交換が行われる迄の流れを示す。
【0117】
この場合ハードディスク装置151,152の二重化状態では、ハードディスク装置HDD#0がマスタとされていたとする。
【0118】
尚パーティション#0上の二重化制御情報についても他のパーティションのものと同様にハードディスク装置151,152の二重化制御の対象であるが、説明の便宜上単なる情報として位置づけ特に二重化制御に係る論理的な記述については省略する。
【0119】
図6中、保守員がコンピュータシステムの電源を投入すると(ステップS11)、上記ROM121内のプログラムによるSVP内部診断機能によりハードディスク装置151,152のヘッダ部が読み出され(ステップS12)、読み出されたHDD二重化制御情報31aがメモリ122に展開される(ステップS13)。この処理については図10〜図13とともに後述する。
【0120】
次に上記SPV内部診断機能により、同じくハードディスク装置151,152の内のマスターハードディスク装置HDD#0のヘッダ部からSVP制御プログラム20が読み出されメモリ122にロードされ(ステップS14)、カーネル10のブートが完了される(ステップS15)。
【0121】
次にカーネル10はSVP制御プログラム20の初期化タスク23を起動する(ステップS16)。初期化タスク23はハードディスク装置151,152の故障検出処理を行う。この処理、すなわち上記ステップS6の処理については図14,図16とともに後述する。
【0122】
初期化タスク23による初期化処理が無事完了すると(ステップS17),所定のユーザ運用機能21aが実行され(ステップS18)、HDD二重化制御部31の機能によりマスターハードディスク装置HDD#0から所定の運用データファイルが読み込まれる(ステップS19)。
【0123】
ここでユーザ運用機能21aを果たす目的で所定の運用データファイルをハードディスク装置151,152から読み出し中に異常が生じた場合を想定する。すなわちマスターハードディスク装置HDD#0に故障が生じ、そのパーティション#2からの読み出し時に異常が検出されたとする(ステップS20)。
【0124】
その場合HDD二重化制御部31は当該パーティション#2についてスレーブ側のハードディスク装置HDD#1からの読み出しを試み、これが成功したとする(ステップS21)。
【0125】
その結果を受けHDD二重化制御部31は、ハードディスク装置HDD#0のパーティション#2が故障の旨でメモリ122に展開中のHDD二重化制御情報31aを更新する(ステップS22)。又HDD二重化制御部31は同内容でハードディスク装置151,152のヘッダ部(パーティション#0)の内容を更新する(ステップS22)。
【0126】
次にHDD二重化制御部31はカーネル10に対し、上記ハードディスク装置HDD#0の故障を「軽度故障」として通報する(ステップS24)。
【0127】
このようにして、上記ステップS20における「読み出し失敗」を除き上記運用データファイルの読み込みが正常に終了したとする(ステップS25)。
【0128】
そして上記ユーザ運用機能21aの実行が正常に終了したとする(ステップS26)。
【0129】
次に図7中、カーネル10はエラーログタスク24を起動し、監視装置300又はSVPコンソール101を介して保守員に上記「軽度故障」発生の旨を通報する(ステップS27)。
【0130】
そして1週間経過後、カーネル10はパトロールタスク25を起動し、ハードディスク装置151,152の二重化状態チェック処理を実施させる(ステップS5)。この処理については図15〜16とともに後述する。
【0131】
その結果パーティション#2についてのハードディスク装置HDD#0の故障の状態が継続していることが検出される(ステップS30)。
【0132】
そこでパトロールタスク25はカーネル10に対しハードディスク装置HDD#0の故障を通報する(ステップS31)。
【0133】
これが完了すると(ステップS31)カーネル10はエラーログタスク24を起動し、監視装置300又はSVPコンソール101を介して再び保守員に「軽度故障」発生の旨を通報する(ステップS32)。
【0134】
更に1週間後、カーネル10は再度パトロールタスク25を起動する(ステップS33)。以後ステップS34〜S37の処理は上記ステップS29〜32の処理と同様でありその説明を省略する。
【0135】
次に保守員がコンピュータシステムの電源停止の操作をしたとする(ステップS38)。
【0136】
その結果カーネル10の制御の下、初期化タスク23を介し、HDD二重化制御部31によりハードディスク装置151,152が停止される(ステップS39〜41)。これを受け、初期化タスク23によりコンピュータシステムの電源が切断される(ステップS42)。
【0137】
次に図8中、ステップS51にて保守員によってコンピュータシステムの電源投入操作がなされると、上記ステップS11以降の動作同様、上記ROM121のプログラムによるSVP内部診断機能によってハードディスク装置151,152のヘッダ部が読み取られる(ステップS52)。尚前記ステップS23において同ヘッダ部にはハードディスク装置HDD#0のパーティション#2の故障の旨が記録されている。
【0138】
又上記ROM121のプログラムによるSVP内部診断機能はこのように読み出したHDD二重化制御情報をメモリ122に展開する(ステップS53)。そしてSVP制御プログラムをメモリ122にロードし(ステップS54)、カーネル10のブートを完了する(ステップS55)。
【0139】
次にカーネル10はSVP制御プログラム20の初期化タスク23を起動し(ステップS56)、初期化タスク23によりハードディスク装置151,152の故障検出処理が行われる。上記の如くこの処理、すなわち上記ステップS6の処理については図14,図16とともに後述する。
【0140】
この場合初期化タスク23はこの処理において上記ハードディスク装置HDD#0のパーティション#2の故障を認識しエラーログタスク24を介し監視装置300又はSVPコンソール101を介して「軽度故障」の旨を保守員に通報し(ステップS57、S59)、当該初期化処理を終了する(ステップS58)。
【0141】
更に1週間後カーネル10は再度パトロールタスク25を起動する(ステップS60)。以後ステップS61〜S64の処理は上記ステップS29〜32の処理と同様であり、その説明を省略する。
【0142】
ここで図9中、ステップS65にて保守員が上記故障ハードディスク装置HDD#0の活性交換を行うものとする。
【0143】
その場合SVP制御プログラム20におけるフレームタスク21の保守機能21bにより、既に上記ステップS53にてメモリ122に展開されているHDD二重化制御情報31aが参照され(ステップS66)、その結果当該活性交換の対象たる故障ハードディスク装置がハードディスク装置HDD#0で有ることが認識される。
【0144】
その結果上記保守機能21bにより故障ハードディスク装置HDD#01をSVP100から切り離す旨の指示が出され(ステップS67)、これを受けたHDD二重化制御部31により当該ハードディスク装置のモータが停止され(ステップS68)、正常な側のハードディスク装置#1のみによるいわゆる「HDD一重化運用」状態とされる。そしてこのHDD一重化運用状態とされた旨により、メモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報がそれぞれ更新される(ステップS69,S70)。そしてこのようにしてHDD一重化運用状態へ移行する処理が完了した旨が上記保守機能21bに通報される(ステップS71)。
【0145】
その後保守員により故障ハードディスク装置HDD#0が正常なものと活性状態で交換されると、上記保守機能21bからHDD二重化制御装置31に対し、当該交換後のハードディスク装置HDD#0を使用した元のHDD二重化状態を復元する旨の指示が出される(ステップS75)。
【0146】
これを受けてHDD二重化制御部31はHDD二重化復元中の状態である旨で、メモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報をそれぞれ更新する(ステップS76,S77)。
【0147】
そしてステップS78にてHDD二重化制御部31は、現在運用中のハードディスク装置HDD#1から、交換された新たなハードディスク装置HDD#0に対し、その格納情報をコピーすることによって元のHDD二重化状態を復元する。
【0148】
このコピー処理が全パーティションについて正常に完了すると、その旨でメモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報がそれぞれ更新される(ステップS79,S80)。
【0149】
そしてHDD二重化制御部31は保守機能21bに対しHDD二重化状態復元が完了した旨を通知する(ステップS81)。
【0150】
そしてその1週間後カーネル10は再度パトロールタスク25を起動する(ステップS83)。
【0151】
この場合、メモリに展開されているHDD二重化制御情報31aにはステップS79にて「正常状態」の旨が記録されているため、その参照の結果、パトロールタスク25はHDD二重化状態チェック処理が正常に完了した旨をカーネル10に返す(ステップS85)。
【0152】
このように本発明の実施例1によれば初期化タスク23及びパトロールタスク25の機能により、ハードディスク装置151,152の二重化状態が損なわれた状態が放置された場合SVP100の再起動の際及びコンピュータシステムの運用中は定期的にその状態が保守員に通報される。
【0153】
したがって保守員は仮に当該二重化状態が損なわれた際の最初の通報に応じた対処ができなかったような場合でも、その後上記コンピュータシステムの再起動の際、あるいは運用中の定期的な通報によりその都度注意が喚起される。
【0154】
したがって当該ハードディスク装置151,152の二重化状態が損なわれた状態が長期間にわたって放置されるような事態を効果的に回避可能である。
【0155】
次に図10〜13とともに上記ROM121に格納されたプログラムのSVP内部診断機能による、ハードディスク装置151,152のヘッダ部からHDD二重化制御情報を読み出し、メモリ122に展開する処理の詳細を説明する。
【0156】
図10中、上記SVP内部診断機能によりハードディスク装置HDD#0のヘッダ部が読み出され(ステップS101)、同ヘッダ部の読み込みが失敗した場合にはその旨を示すフラグが設定される(ステップS102のYes,ステップS103)。
【0157】
同様にハードディスク装置HDD#1のヘッダ部が読み出され(ステップS104)、同ヘッダ部の読み込みが失敗した場合にはその旨を示すフラグが設定される(ステップS105のYes,ステップS106)。
【0158】
次に図11中、ステップS107において、上記フラグの設定状態の参照により、ハードディスク装置#0,#1の双方においてヘッダ部の読み込みが成功したか否かを判定する。
【0159】
ハードディスク装置HDD#0,HDD#1の双方でヘッダ読み出しが失敗していた場合(ステップS108のYes),当該ROM121のプログラムのSVP内部診断機能の動作が異常終了する。その場合、SVP制御プログラムをロードせずに処理を停止する。(SPC102は、SVPに対する生存チェック機能によりSVPの停止を検出すると、パネルにSVPの起動失敗を示すエラーコードを表示する。SPCはROMプログラム121の再起動を3回まで実施し起動ができない場合は処理を停止する。)
他方ハードディスク装置HDD#0のみでヘッダ部の読み込みが失敗していた場合(ステップS109のYes)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS110)。
【0160】
又ハードディスク装置HDD#1のみでヘッダ部の読み込みが失敗していた場合(ステップS109のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS111)。
【0161】
又ハードディスク装置HDD#0,#1の双方でヘッダ部の読み込みが成功していた場合(ステップS107のYes),そのヘッダ部から読み込まれた情報において、ハードディスク装置HDD#0,#1の両方のパーティション#0(ヘッダ部に対応)についての故障が記録されていた場合(図12中ステップS121のYes、ステップS22のYes)、当該ROM121のプログラムのSVP内部診断機能の動作が異常終了する。その場合、SVP制御プログラムをロードせずに処理を停止する。(SPC102は、SVPに対する生存チェック機能によりSVPの停止を検出すると、パネルにSVPの起動失敗を示すエラーコードを表示する。SPCはROMプログラム121の再起動を3回まで実施し起動ができない場合は処理を停止する。)
他方ハードディスク装置HDD#0のみについてパーティション#0の故障が記録されていた場合(ステップS123のYes)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS124)。
【0162】
又ハードディスク装置HDD#1のみについてパーティション#0の故障が記録されていた場合(ステップS123のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS125)。
【0163】
又ステップS121にてハードディスク装置HDD#0,#1のいずれについてもパーティション#0の故障の記録が無かった場合、図13中ステップS126に移行する。
【0164】
ここでハードディスク装置HDD#0によるHDD一重化運用状態であった場合(ステップS126のYes,S127のYes),ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS128)。
【0165】
他方ハードディスク装置HDD#1によるHDD一重化運用状態であった場合(ステップS126のYes,S127のNo)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS129)。
【0166】
他方このようなHDD一重化運用はなされておらず、すなわち通常通りHDD二重化運用がなされていた場合(ステップS126のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS130)。
【0167】
このように本発明の実施例1では、図6中ステップS13あるいは図8中ステップS53においてハードディスク装置HDD#0,#1のヘッダ部からHDD二重化制御情報を読み出してメモリ122に展開する際、ハードディスク装置のヘッダ部からの読み込みが失敗した場合、読み込まれたヘッダ部の内容からヘッダ部が格納されているパーティション#0の故障が認識された場合、あるいはHDD一重化運用状態であった場合には、それぞれ、読み込みが成功した側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開し(ステップS108〜S111)、パーティション#0が故障していない側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開し(ステップS122〜S125)、あるいは運用中の側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開する(ステップS127〜S129)。
【0168】
その結果、より信頼性の高いHDD二重化制御情報をメモリ122に展開することが可能となる。
【0169】
次に図14、図15,図16とともに、初期化処理時(図6中ステップS16,S6あるいは図8中ステップS56,S6)、又は一週間ごとの定期的なHDD二重化状態チェック処理(図7中ステップS28,S5;S33,S5、図8中、ステップS60,S5,図9中ステップS83,S5)の詳細について説明する。
【0170】
まず初期化処理時カーネル10により初期化タスク23が起動され、HDD二重化状態チェック処理が実行される(図14中ステップS141)。
【0171】
同様に一週間ごとの定期的なHDD二重化状態チェック処理では、カーネル10によってパトロールタスク24が起動され、同じくHDD二重化状態チェック処理が実行される(図15中ステップS151)。
【0172】
これらステップS141及びS151の各々において実行される上記HDD二重化状態チェック処理の流れを図16に示す。
【0173】
図16中、まずメモリ122に展開されているHDD二重化制御情報31aが参照される(ステップS161)。その際参照するハードディスク装置の番号として#0(すなわちHDD#0)が設定される(ステップS162)。
【0174】
そして設定されたハードディスク装置HDD#0以外のハードディスク装置、すなわちハードディスク装置HDD#1でのHDD一重化運用状態であった場合(ステップS163のYes),当該ハードディスク装置HDD#0の故障の旨がカーネル10に通報される(ステップS164)。
【0175】
他方HDD一重化運用状態ではなかった場合、すなわち通常通りHDD二重化運用であった場合(ステップS163のNo),参照すべきパーティション番号を#0に設定する(ステップS165)。そして、上記HDD二重化制御情報31a中、当該パーティションについて故障が記録されていた場合(ステップS166の「故障」)、その旨がカーネル10に通報される(ステップS167)。
【0176】
そして参照すべきパーティション番号が1インクリメントされ(ステップS169)、全パーティションのチェックが完了したかが判断され(ステップS169)、全パーティションについてチェックが完了する(ステップS169の「完了」)まで、順次参照するパーティション番号がインクリメントされ(ステップS168)、各パーティションについて故障の記録の有無チェックされる(ステップS166)。故障が有ればその都度カーネル10にその旨が通報される(ステップS167)。
【0177】
このようにして全パーティションがチェックされると(ステップS169の「完了」)、チェックすべきハードディスク装置の番号が1インクリメントされ(ステップS170)、他方のハードディスク装置、すなわちHDD#1につき上記同様のチェック及び必要に応じカーネル10への故障通報がなされる(ステップS163〜S169)。
【0178】
次に図17〜図18とともに、図9中ステップS66以降の故障ハードディスク装置の活性交換処理の流れの詳細について説明する。
【0179】
図17中ステップS181にて前記保守機能21bは、メモリ122に展開されているHDD二重化制御情報31aを参照し、その内容を保守用端末202に設けられた画面上で保守員に対し表示する(ステップS182)。
【0180】
それに対し保守員が故障ハードディスク装置の切り離しを指示する操作を保守用端末202上で行うと(ステップS183)、HDD二重化制御部31の機能により故障ハードディスク装置がSVP100から切り離され、その完了がHDD二重化制御部を介して保守機能21bに通知される。
【0181】
これを受け保守機能21bは、上記の動作によりHDD一重化運用状態となった旨により、運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS184)。
【0182】
又保守機能21bは保守用端末202の画面上で保守員に対し、故障ハードディスク装置の交換作業を促す(ステップS185)。
【0183】
次に図18中、保守員が故障ハードディスク装置の交換作業を行い、交換後の新たなハードディスク装置に対する接続を指示すると、保守機能21bはHDD二重化制御部31を介して当該交換に係る新たなハードディスク装置をSVP100へ接続する動作を行い(ステップS187)、HDD二重化復元中の状態である旨で運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS188)。
【0184】
そしてHDD二重化制御部31を介し、運用中のハードディスク装置から前記交換に係る新たなハードディスク装置に対しその格納情報をコピーすることによって元のHDD二重化状態を復元するための動作を開始する旨を保守用端末202の画面上で表示する(ステップS189)。
【0185】
その後実際に運用中のハードディスク装置から前記交換に係る新たなハードディスク装置に対しその格納情報をコピーすることによって元のHDD二重化状態を復元するための動作が順次実施される(ステップS190)。その際保守用端末202の画面上では当該格納情報のコピー動作の進捗状況が表示される(ステップS191)。
【0186】
同格納情報のコピー動作がすべてのパーティションについて終了すると保守機能21bはHDD二重化制御部31を介し、HDD二重化状態となった旨で、運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS192)。
【0187】
そして保守用端末202の画面上で、故障ハードディスク装置の活性交換作業の完了の旨を表示する(ステップS193)。
【0188】
ユーザの運用を停止中に保守する場合は、SVPコンソール101を保守モードにして同様な操作により故障部品の交換を行うことができる。
【実施例2】
【0189】
以下、本発明の実施例2の構成について説明する。
【0190】
実施例2は上述の実施例1と同様の構成及び機能を有し、実施例1との相違は、冗長化するハードディスク装置が2台ではなく3台以上の場合を想定している点である。
【0191】
以下この相違点に関する内容のみ説明し、それ以外の重複する説明を省略する。
【0192】
この場合、(1)冗長化ハードディスク装置の構成として、上記実施例1同様全ハードディスク装置は互いに同一の構成で区分され、各ハードディスク装置の同じ位置の領域には同じデータが格納される。
【0193】
又上記実施例1同様全ハードディスク装置の同じ位置に割り当てられた領域をパーティションと称され、冗長化制御対象の単位とされる。
【0194】
各パーティションは一つのマスターハードディスク装置と、一つ以上のスレーブハードディスク装置とにより重複して保有される。
【0195】
(2)上記HDD二重化制御情報31aに対応するHDD冗長化制御情報として、上記複数のハードディスク装置に対し、実装位置に対応する識別番号が#0から順に割り振られる。
【0196】
又上記複数のパーティションは、ハードディスク装置内のアドレス順に#0から識別番号が割り振られる。
【0197】
HDD冗長化制御情報はこのパーティションの番号に対応したデータテーブルにより構成される。
【0198】
各テーブルには当該パーティションを保有するマスターハードディスク装置の番号及び同パーティションを保有する故障ハードディスク装置の番号が示される。ここで冗長化制御情報はパーティション#0に格納される。
【0199】
HDD冗長化制御情報はコンピュータシステムの電源投入時にハードディスク装置からSVPのメモリ上に展開され、前回運用時のHDD冗長化状態が引き継がれる。
【0200】
運用中に冗長化ハードディスク装置の状態が変化した場合、上記メモリ上のHDD冗長化制御情報の更新と同時に、ハードディスク装置中のパーティション#0のHDD冗長化制御情報も同時に更新される。
【0201】
(3)実施例1におけるHDD二重化制御部31に対応するHDD冗長化制御部によるハードディスク装置への書き込み処理では、各パーティションを有する全ハードディスク装置の領域に同じデータが書き込まれる。
【0202】
ハードディスク装置からの読み出し処理では、パーティションを有するマスターハードディスク装置の領域からデータが読み出される。
【0203】
上記書き込み処理でエラーが発生した場合、該当するパーティションを有するマスターハードディスク装置又はスレーブハードディスク装置が故障状態として認識される。
【0204】
上記読み出し処理でエラーが発生した場合、該当するパーティションを有するマスターハードディスク装置が故障状態として認識される。
【0205】
これら読み出し又は書き込み処理で該当するパーティションを有するマスターハードディスク装置が故障した場合、当該パーティションを有する、故障の発生していない任意のハードディスク装置が当該パーティションについてのマスターハードディスク装置として割り当てられる。
【0206】
(4)HDD冗長化制御部によるハードディスク装置故障通報処理では、各パーティションを有するマスターハードディスク装置又はスレーブハードディスク装置の内規定個数以上のものが故障した場合、冗長化ハードディスク装置に軽度故障(すなわちパーティションの冗長化崩れ)が発生したと判断される。
【0207】
そしてこのハードディスク装置の軽度故障(パーティションの冗長化崩れ)が検出された場合、保守員に軽度故障の旨が通報される。
【0208】
(5)ハードディスク装置故障の定期監視処理機能を有するパトロールタスク(実施例1のパトロールタスク25に対応)が定期的に起動され、ハードディスク装置の軽度故障(パーティションの冗長化崩れ)の有無が監視される。
【0209】
同処理において軽度故障が検出された場合、再度保守員に軽度故障の旨が通報される。そしてさらに、一定時間経過するごとに、ハードディスク装置の軽度故障の有無がチェックされ、元のハードディスク装置の冗長化状態が回復する迄、保守員への軽度故障の旨の通報が繰り返しなされる。
【0210】
(6)初期化処理によるハードディスク装置故障検出処理では、保守員によりSVPの運用停止後に運用の再開があった場合、ハードディスク装置の軽度故障(パーティションの冗長化崩れ)の検出がなされる。
【0211】
同処理においてハードディスク装置の軽度故障が検出された場合、再度保守員に軽度故障の旨が通報される。
【0212】
このように本発明の実施例2によれば、複数個のハードディスク装置による格納情報の冗長化を行う場合、すなわち複数個のハードディスク装置に同じ内容の情報をそれぞれ重複して格納することによりその内の一又は複数個(上記冗長化に係るハードディスク装置の全個数より少ない個数)のハードディスク装置の格納情報が損なわれても残りのハードディスク装置に同じ内容の情報が格納されているため格納情報の安全化が図られる場合、当該冗長化に係るハードディスク装置の全個数より少ない一以上の所定の個数のハードディスク装置の格納情報が損なわれたと判断された場合にはその旨が保守員に自動的に通報され、又その通報はSVPの起動のたびごとに、さらには運用中は一定期間ごとに行われる。
【0213】
その結果、仮に最初の軽度故障の通報の際に保守員が故障ハードディスク装置の交換等による対応を行わなかったような場合であっても、SVPの起動のたびごと、さらには運用中は一定期間ごとに同様の通報が自動的に保守員に対してなされるため、冗長化状態が損なわれた状態、いわゆる冗長化崩れの状態が長期間にわたって放置されるような事態が効果的に回避され得る。
【0214】
本発明は以下の付記の各々に記載の構成をとり得る。
(付記1)
情報記憶装置の制御方法であって、
前記情報記憶装置に格納されている情報は冗長化されており、
冗長化障害記録手段が、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録し、
冗長化監視手段が前記状態記録手段から冗長化障害の旨の記録を読み出し、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、通報手段がその旨の通報を行う各段階を備える情報記憶装置の制御方法。
(付記2)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記1に記載の情報記憶装置の制御方法。
(付記3)
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は定期的に実行される構成の付記1に記載の情報記憶装置の制御方法。
(付記4)
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は前記情報記憶装置が起動する際に実行される構成の付記1に記載の情報記憶装置の制御方法。
(付記5)
情報記憶装置であって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記冗長化の状態に関する情報を記録する状態記録手段と、
前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段と、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段と、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段とを備える情報記憶装置。
(付記6)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記5に記載の情報記憶装置。
(付記7)
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の付記5に記載の情報記憶装置。
(付記8)
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の付記5に記載の情報記憶装置。
(付記9)
情報記憶装置を制御するためのプログラムであって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記情報記憶装置を制御するためのコンピュータを、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段及び、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段として機能させるための命令を含むプログラム。
(付記10)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記9に記載のプログラム。
(付記11)
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の付記9に記載のプログラム。
(付記12)
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の付記9に記載のプログラム。
(付記13)
付記9〜12のうちの何れか一項に記載のプログラムを格納したコンピュータ読取可能な情報記録媒体。
【図面の簡単な説明】
【0215】
【図1】従来の一例の情報記憶装置の制御方法を説明するためのブロック図である。
【図2】本発明の一実施例による情報記憶装置の制御方法を実施する機能を有するコンピュータのハードウェア構成について説明するためのブロック図である。
【図3】本発明の一実施例による情報記憶装置の制御方法をコンピュータに実行させるためのプログラムの構成について説明するためのブロック図である。
【図4】本発明の一実施例による情報記憶装置の制御方法を説明するためのブロック図である。
【図5】図4中のHDD二重化制御情報の一例を説明するための図である。
【図6】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その1)である。
【図7】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その2)である。
【図8】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その3)である。
【図9】本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その4)である。
【図10】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その1)である。
【図11】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その2)である。
【図12】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その3)である。
【図13】本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その4)である。
【図14】本発明の一実施例による情報記憶装置の制御方法における初期化時のハードディスク装置故障検出処理の動作の流れを説明するためのフローチャートである。
【図15】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置故障の定期監視処理の動作の流れを説明するためのフローチャートである。
【図16】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置故障の放置検出処理の動作を説明するためのフローチャートである。
【図17】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置二重化復旧処理の動作を説明するためのフローチャート(その1)である。
【図18】本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置二重化復旧処理の動作を説明するためのフローチャート(その2)である。
【符号の説明】
【0216】
10 カーネル
20 SVP制御プログラム
21 フレームタスク
23 初期化タスク
24 エラーログタスク
25 パトロールタスク
30 ハードディスクドライバ
31 HDD二重化制御部
31a HDD二重化制御情報
100 SVP
121 ROM
151,152 ハードディスク装置
200 本体装置
【特許請求の範囲】
【請求項1】
情報記憶装置の制御方法であって、
前記情報記憶装置に格納されている情報は冗長化されており、
冗長化障害記録手段が、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録し、
冗長化監視手段が前記状態記録手段から冗長化障害の旨の記録を読み出し、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、通報手段がその旨の通報を行う各段階を備える情報記憶装置の制御方法。
【請求項2】
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる請求項1に記載の情報記憶装置の制御方法。
【請求項3】
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は定期的に実行される構成の請求項1に記載の情報記憶装置の制御方法。
【請求項4】
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は前記情報記憶装置が起動する際に実行される構成の請求項1に記載の情報記憶装置の制御方法。
【請求項5】
情報記憶装置であって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記冗長化の状態に関する情報を記録する状態記録手段と、
前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段と、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段と、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段とを備える情報記憶装置。
【請求項6】
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる請求項5に記載の情報記憶装置。
【請求項7】
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の請求項5に記載の情報記憶装置。
【請求項8】
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の請求項5に記載の情報記憶装置。
【請求項9】
情報記憶装置を制御するためのプログラムであって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記情報記憶装置を制御するためのコンピュータを、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段及び、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段として機能させるための命令を含むプログラム。
【請求項10】
請求項9に記載のプログラムを格納したコンピュータ読取可能な情報記録媒体。
【請求項1】
情報記憶装置の制御方法であって、
前記情報記憶装置に格納されている情報は冗長化されており、
冗長化障害記録手段が、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録し、
冗長化監視手段が前記状態記録手段から冗長化障害の旨の記録を読み出し、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、通報手段がその旨の通報を行う各段階を備える情報記憶装置の制御方法。
【請求項2】
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる請求項1に記載の情報記憶装置の制御方法。
【請求項3】
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は定期的に実行される構成の請求項1に記載の情報記憶装置の制御方法。
【請求項4】
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は前記情報記憶装置が起動する際に実行される構成の請求項1に記載の情報記憶装置の制御方法。
【請求項5】
情報記憶装置であって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記冗長化の状態に関する情報を記録する状態記録手段と、
前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段と、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段と、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段とを備える情報記憶装置。
【請求項6】
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる請求項5に記載の情報記憶装置。
【請求項7】
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の請求項5に記載の情報記憶装置。
【請求項8】
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の請求項5に記載の情報記憶装置。
【請求項9】
情報記憶装置を制御するためのプログラムであって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記情報記憶装置を制御するためのコンピュータを、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段及び、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段として機能させるための命令を含むプログラム。
【請求項10】
請求項9に記載のプログラムを格納したコンピュータ読取可能な情報記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【公開番号】特開2008−158768(P2008−158768A)
【公開日】平成20年7月10日(2008.7.10)
【国際特許分類】
【出願番号】特願2006−346213(P2006−346213)
【出願日】平成18年12月22日(2006.12.22)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成20年7月10日(2008.7.10)
【国際特許分類】
【出願日】平成18年12月22日(2006.12.22)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]