説明

フォールト・トレラントサーバ

【課題】二重化された両方のモジュールに障害が発生した際に、短時間で復旧することができるフォールト・トレラントサーバ及びその制御方法を提供する。
【解決手段】フォールト・トレラントサーバ100は、第1CPU111、第1メモリ112、及び第1補助記憶装置(第1HDD113)を有する第1モジュール110と、第2CPU121、第2メモリ122、及び第2補助記憶装置(第2HDD123)を有する第2モジュール120とを備え、第1モジュール110及び第2モジュール120によって業務アプリケーションを二重化して実行する。バックアップ時において、第1モジュール110は、業務アプリケーションの実行を継続し、第2モジュール120は、業務アプリケーションの実行を中断すると共に、中断時の第2メモリ112及び第2補助記憶装置113のデータに基づいて、バックアップ情報を作成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、フォールト・トレラントサーバに関する。
【背景技術】
【0002】
近年、障害耐性を確保するために、サーバシステムを二重化するフォールトレラント技術が注目されている。特許文献1には、CPU(Central Processing Unit)サブシステムを含むシステムが二重化されたフォールト・トレラントサーバにおいて、火災等によって二重化された両方のシステムに障害が発生した場合を考慮して、定期的に二重化された各システムのハードディスクのフルバックアップを作成する方法が開示されている。
【0003】
また、特許文献2には、第1の記憶領域と第2の記憶領域を有する第1の記憶装置と、アプリケーションプログラムによるデータの書き込みを第1の記憶領域と第2の記憶領域に二重化するコンピュータと、第1の記憶装置のバックアップが格納される第2の記憶装置と、を備えたコンピュータシステムが開示されている。このシステムにおいては、第1の記憶領域と第2の記憶領域との二重化を停止させている間に、第2の記憶領域に保持されたデータを第2の記憶装置にコピーすることにより第1の記憶装置のバックアップを作成している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−205630号公報
【特許文献2】特開2002−41345号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1及び特許文献2では、いずれもハードディスクのデータのみバックアップを作成している。そのため、万が一、二重化された両方のシステムに障害が発生し、オペレーションシステムを再起動する際には、ハードウェアの初期化等の起動シーケンスや業務アプリケーションを起動しなければならず、復旧までに時間がかかるという問題を有する。
【0006】
そこで、本発明は、二重化された両方のモジュールに障害が発生した際に、短時間で復旧することができるフォールト・トレラントサーバ及びその制御方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様に係るフォールト・トレラントサーバは、第1CPU、第1メモリ、及び第1補助記憶装置を有する第1モジュールと、第2CPU、第2メモリ、及び第2補助記憶装置を有する第2モジュールとを備え、第1モジュール及び第2モジュールによって業務アプリケーションを二重化して実行するフォールト・トレラントサーバである。このフォールト・トレラントサーバは、バックアップ時において、前記第1モジュールは、前記業務アプリケーションの実行を継続し、前記第2モジュールは、前記業務アプリケーションの実行を中断すると共に、中断時の前記第2メモリ及び前記第2補助記憶装置のデータに基づいて、バックアップ情報を作成することを特徴とする。
【0008】
本発明の他の態様に係るフォールト・トレラントサーバの制御方法は、第1CPU、第1メモリ、及び第1補助記憶装置を有する第1モジュールと、第2CPU、第2メモリ、及び第2補助記憶装置を有する第2モジュールとを備え、第1モジュール及び第2モジュールによって業務アプリケーションを二重化して実行するフォールト・トレラントサーバの制御方法である。この制御方法では、バックアップ時において、前記第1モジュールに前記業務アプリケーションの実行を継続させ、前記第2モジュールに前記業務アプリケーションの実行を中断させると共に、中断時の前記第2メモリ及び前記第2補助記憶装置のデータに基づいて、バックアップ情報を作成する、ことを特徴とする。
【発明の効果】
【0009】
本発明に係るフォールト・トレラントサーバにおいては、二重化された両方のモジュールに障害が発生した際に、短時間で復旧することができる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施の形態に係るフォールト・トレラントサーバの構成を示すブロック図である。
【図2】本発明の実施の形態に係るフォールト・トレラントサーバの動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
実施の形態.
以下、図面を参照して本発明の実施の形態について説明する。図1に示すように、このフォールト・トレラントサーバ100は、第1CPU(Central Processing Unit)111、第1メモリ112、及び第1HDD(Hard Disk Drive)113を含む第1モジュール110と、第2CPU121、第2メモリ122、及び第2HDD123を含む第2モジュール120とを備えている。
【0012】
第1メモリ112及び第2メモリ122は、第1CPU111及び第2CPU121が演算処理を行う際に使用するそれぞれの主記憶装置である。また、第1HDD113及び第2HDD123は、第1CPU111及び第2CPU121によって実行されるプログラム等が格納される補助記憶装置である。
【0013】
フォールト・トレラントサーバ100は、通常動作時において、第1モジュール110と第2モジュール120とが同期して同一の業務アプリケーションの処理を二重化して行う。通常動作時において、第1モジュール110と第2モジュール120のいずれかにソフトウェアエラー等による障害が発生した場合には、障害が発生したモジュールが正常に動作するよう修復した後に、正常に機能しているモジュールのメモリやHDDのデータを、障害が発生した他方のモジュールのメモリやHDDにコピーし、再同期化を行なう。
【0014】
フォールト・トレラントサーバ100は、第1モジュール110と第2モジュール120との二重化を解除する機能を備えている。フォールト・トレラントサーバ100は、定期的に二重化を解除し、第2モジュール120の第2HDD123のデータ及び第2メモリ122のメモリダンプをバックアップ情報としてバックアップ装置130に格納する。フォールト・トレラントサーバ100が二重化を解除した時には、各モジュール110、120は、それぞれ個別に動作可能である。
【0015】
第2モジュール120にはバックアップ装置130が接続されている。バックアップ装置130は、定期的に実施されるバックアップ時に、第2HDD123のデータ及び第2メモリ122のメモリダンプを含むバックアップ情報が格納される。このバックアップ情報は、災害等によって第1モジュール110及び第2モジュール120のいずれにも障害が発生した場合に、第1モジュール110及び第2モジュール120の復旧作業に用いられる。
【0016】
次に、図1、図2を参照してシステムの中断なしにバックアップ情報を作成する動作について説明する。図2は、フォールト・トレラントサーバ100の動作を示すフローチャートである。フォールト・トレラントサーバ100は、定期的にバックアップ情報を作成するために、二重化の解除を行なう(ステップS21)。二重化が解除された状態では、第1モジュール110は、継続して業務アプリケーションを実行する。一方、第2モジュール120は、第2メモリ122のデータを情報元として中断時のバックアップ情報を作成する(ステップS22)。
【0017】
そして、第2CPU121は、作成した第2メモリ122のバックアップと、第2HDD123のデータとをバックアップ情報としてバックアップ装置130に保存する(ステップS23)。バックアップ情報のバックアップ装置130への保存が完了すると、フォールト・トレラントサーバ100は、第2モジュール120を起動し、第2CPU121を第1CPU111に、第2メモリ122を第1メモリ112に同期させると共に、第1HDD113のデータを第2HDD123にコピーする。すなわち、第1モジュール110を同期元として、第1モジュール110と第2モジュール120を同期させる(ステップS24)。
【0018】
災害等によって第1モジュール110及び第2モジュール120のいずれにも障害が発生した場合には、バックアップ装置130に保持されたバックアップ情報に基づいて、第1モジュール110及び第2モジュール120の復旧作業が実施される。
【0019】
上記のように、本実施の形態は、ノートパソコン等に搭載されるハイバネーション機能をフォールト・トレラントサーバのバックアップに応用している。このハイバネーション機能は、一般的に、電源を切断する前に、物理メモリに記憶されている作業内容をハードディスクに退避させ、次にコンピュータを起動させた際に、作業途中から再開する機能である。本実施の形態では、上記のハイバネーション機能を、フォールト・トレラントサーバ100上で行ない、第2HDD123のデータのみならず、第2メモリ122のデータをバックアップ装置130に保持している。
【0020】
これにより、万が一、第1モジュール110及び第2モジュール120の両方に障害が発生した場合であっても、復旧時には、第2HDD123及び第2メモリ122のデータに基づいて、第1モジュール110及び第2モジュール120の復旧作業を行うことができるため、第1モジュール110及び第2モジュール120を再起動させる際には、起動アプリケーションや業務アプリケーション等の起動を省くことができる。これにより、短時間で復旧作業を行うことができる。また、第2メモリ122のデータをバックアップ情報として扱うことにより、HDDのバックアップのみに比べ、バックアップ作成時の状態を忠実に再現可能となる。
【0021】
また、本実施形態に係るフォールト・トレラントサーバ100は、バックアップ時に、第2メモリ122のコピー及び第2HDD123のデータをバックアップ情報としてバックアップ装置130に保存することで、特別なバックアップ情報を作成する処理を必要とせず、バックアップ時の作業や、障害発生時の復旧作業にかかる時間を短縮することができる。
【0022】
また、本実施の形態では、バックアップ時から通常の二重化動作に戻る際には、第2CPU121を第1CPU111に、第2メモリ122を第1メモリ112に同期さると共に、第1HDD113のデータを第2HDD123にコピーすることにより、バックアップを行なった第2モジュール120にあっては、再度業務アプリケーション等を起動することなく、第1モジュール110が継続して実行している業務アプリケーションから処理を開始することができる。これにより、短時間でバックアップを行う状態から通常の二重化動作に戻ることができる。
【0023】
また、本実施の形態では、二重化された一方の第2モジュール120においてバックアップ情報を作成するため、メモリのデータをコピーする際にも、第1モジュール110において、業務アプリケーションを継続して実行することができ、システムの中断なしにメモリのデータをコピーすることができる。
【0024】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【0025】
なお、上述の実施の形態では、本発明をハードウェアの構成として説明したが、本発明は、これに限定されるものではない。本発明は、任意の処理を、CPUにコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の通信媒体を介して伝送することにより提供することも可能である。また、記憶媒体には、例えば、フレキシブルディスク、ハードディスク、磁気ディスク、光磁気ディスク、CD−ROM、DVD、ROMカートリッジ、バッテリバックアップ付きRAMメモリカートリッジ、フラッシュメモリカートリッジ、不揮発性RAMカートリッジ等が含まれる。また、通信媒体には、電話回線等の有線通信媒体、マイクロ波回線等の無線通信媒体等が含まれる。
【符号の説明】
【0026】
100 フォールト・トレラントサーバ
110 第1モジュール
111 第1CPU
112 第1メモリ
113 第1HDD
120 第2モジュール
121 第2CPU
122 第2メモリ
123 第2HDD
130 バックアップ装置

【特許請求の範囲】
【請求項1】
第1CPU、第1メモリ、及び第1補助記憶装置を有する第1モジュールと、第2CPU、第2メモリ、及び第2補助記憶装置を有する第2モジュールとを備え、第1モジュール及び第2モジュールによって業務アプリケーションを二重化して実行するフォールト・トレラントサーバであって、
バックアップ時において、
前記第1モジュールは、前記業務アプリケーションの実行を継続し、
前記第2モジュールは、前記業務アプリケーションの実行を中断すると共に、中断時の前記第2メモリ及び前記第2補助記憶装置のデータに基づいて、バックアップ情報を作成する、フォールト・トレラントサーバ。
【請求項2】
前記バックアップ情報を格納するバックアップ装置を更に備えた、請求項1に記載のフォールト・トレラントサーバ。
【請求項3】
前記バックアップ情報の格納が完了すると、
前記第2CPUを前記第1CPUに同期させると共に、前記第2メモリを前記第1メモリに同期させ、前記第1補助記憶装置のデータを前記第2補助記憶装置にコピーする、請求項2に記載のフォールト・トレラントサーバ。
【請求項4】
第1CPU、第1メモリ、及び第1補助記憶装置を有する第1モジュールと、第2CPU、第2メモリ、及び第2補助記憶装置を有する第2モジュールとを備え、第1モジュール及び第2モジュールによって業務アプリケーションを二重化して実行するフォールト・トレラントサーバの制御方法であって、
バックアップ時において、
前記第1モジュールに前記業務アプリケーションの実行を継続させ、
前記第2モジュールに前記業務アプリケーションの実行を中断させると共に、中断時の前記第2メモリ及び前記第2補助記憶装置のデータに基づいて、バックアップ情報を作成する、フォールト・トレラントサーバの制御方法。
【請求項5】
前記バックアップ情報を、前記第2モジュールに接続されたバックアップ装置に格納する、請求項4に記載のフォールト・トレラントサーバ。
【請求項6】
前記バックアップ情報の格納が完了すると、
前記第2CPUを前記第1CPUに同期させると共に、前記第2メモリを前記第1メモリに同期させ、前記第1補助記憶装置のデータを前記第2補助記憶装置にコピーする、請求項5に記載のフォールト・トレラントサーバの制御方法。
【請求項7】
第1CPU、第1メモリ、及び第1補助記憶装置を有する第1モジュールと、第2CPU、第2メモリ、及び第2補助記憶装置を有する第2モジュールとを備えたフォールト・トレラントサーバに、第1モジュール及び第2モジュールによって業務アプリケーションを二重化して実行する処理を実行させるプログラムであって、
バックアップ時において、
前記第1モジュールに前記業務アプリケーションの実行を継続させ、
前記第2モジュールに前記業務アプリケーションの実行を中断させると共に、中断時の前記第2メモリ及び前記第2補助記憶装置のデータに基づいて、バックアップ情報を作成する処理をフォールト・トレラントサーバに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2011−170680(P2011−170680A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願番号】特願2010−34837(P2010−34837)
【出願日】平成22年2月19日(2010.2.19)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】