計算機システム及び計算機システムの系切替制御方法

【課題】ＯＳの種別に係わらずメモリダンプを取得しながら系切替を高速で行うことを目的とする。
【解決手段】第１の計算機及び第２の計算機とストレージ装置との間で、第１の計算機からのＩ／Ｏ出力を一時的に格納するバッファと、バッファの内容をストレージ装置に出力する制御部と、を備えたＩ／Ｏ処理部を備えて、管理計算機は系切替の契機で、第１の計算機のＩ／Ｏ出力をＩ／Ｏ処理部のバッファへ格納し、ミラーボリュームの第１の記憶部と第２の記憶部を分離させ、バッファと第２の記憶部とを接続し、第２の計算機と第１の記憶部とを接続させ、バッファの内容を第２の記憶部に出力し、第２の計算機を第１の記憶部から起動させる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、障害の発生した計算機を切り替えるコールドスタンバイシステムに関し、特に系切替を高速化することによる可用性を向上させる技術に関する。
【背景技術】
【０００２】
計算機システムにおいて、障害が発生した計算機のＯＳが出力するメモリダンプは、障害の原因を特定する上で有益な情報である。また、障害が発生した計算機システムを早期に復旧させ、業務を再開することは計算機システムにとって重要である。例えば、コールドスタンバイシステムにおいて、系切替時に障害解析用のメモリダンプを取得する方法が提案されている。現用系におけるメモリダンプ出力が完了した後、予備系へＬＵ（Logical Unit）を接続して系切替を実施するが、メモリダンプの採取と系切替がシーケンシャルであるため切替までに時間を要する。そのため、メモリダンプを採取しつつ、障害発生後に速やかに予備系で業務を再開させる、迅速なシステム復旧の実現が望まれている。また、ＯＳによってはメモリダンプ用の領域をブートボリュームに持つ必要があり、メモリダンプ用の領域を分離出来ない。
【０００３】
また、障害発生時のメモリダンプを高速化する技術としては特許文献１が知られている。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２００７−２５７４８６
【発明の概要】
【発明が解決しようとする課題】
【０００５】
従来のコールドスタンバイシステムでは、メモリダンプの出力が完了するのを待って、系切替を行うか、一部のＯＳは対応していないブートボリュームとメモリダンプ出力先となるＬＵを分離するシステム構成にせざるを得なかった。
【０００６】
また、上記特許文献１では、メモリを二重化することで、系切替を実施する際にメモリの内容を保存出来るシステム構成となっている。ただし、特許文献１ではメモリダンプを取得する計算機が同一のため、系切替時にメモリダンプを採取できない、という問題があった。
【０００７】
そこで、本発明は上記問題点に鑑みてなされたもので、ＯＳの種別に係わらずメモリダンプを取得しながら系切替を高速で行うことを目的とする。
【課題を解決するための手段】
【０００８】
本発明は、プロセッサとメモリ及びＩ／Ｏインターフェースを備える第１の計算機と、プロセッサとメモリ及びＩ／Ｏインターフェースを備える第２の計算機と、前記第１の計算機と第２の計算機からアクセス可能なストレージ装置と、ネットワークを介して前記第１の計算機と第２の計算機に接続されて、所定のタイミングで前記第１の計算機を、前記第２の計算機に引き継ぐ系切替を行う管理計算機と、を備え、前記第１の計算機が、所定の条件となったときに前記メモリの内容を前記ストレージ装置に書き込むＩ／Ｏ出力を送信するメモリダンプ部を有する計算機システムにおいて、前記ストレージ装置は、前記第１の計算機がアクセスする第１の記憶部と、前記第１の記憶部のミラーリングを行う第２の記憶部と、を有し、前記第１の計算機及び第２の計算機と前記ストレージ装置との間で、前記Ｉ／Ｏ出力を一時的に格納するバッファと、前記バッファの内容を前記ストレージ装置に出力する制御部と、を備えたＩ／Ｏ処理部と、前記Ｉ／Ｏ処理部と前記第１の計算機及び第２の計算機が前記ストレージ装置をアクセスする経路を切り替えるスイッチ部と、を備え、前記管理計算機は、前記所定のタイミングとなったときに、前記第１の計算機の前記Ｉ／Ｏ出力を前記バッファへ格納する指令を前記前記Ｉ／Ｏ処理部に送信するバッファリング指示部と、前記第１の記憶部と第２の記憶部を分離する指令を前記ストレージ装置に送信するストレージ制御部と、前記バッファと前記第２の記憶部とを接続し、前記第２の計算機と前記第１の記憶部とを接続する指令を前記スイッチ部に送信する経路切替部と、前記バッファの内容を前記第２の記憶部に出力する指令を前記Ｉ／Ｏ処理部へ送信する書き出し指示部と、前記第２の計算機を前記第１の記憶部から起動させる系切替部と、を有する。
【発明の効果】
【０００９】
したがって、本発明は、障害等の所定のタイミングで、現用系の第１の計算機からのＩ／Ｏ出力の収集をＯＳの種類にかかわらず確実に行いながらも、予備系の第２の計算機への系切替を迅速に行うことが可能となる。特に、ミラーボリュームの第１の記憶部と第２の記憶部をスプリットした後には、第１の計算機のＩ／Ｏ出力と第２の計算機への系切替を並列的に行うことで、Ｉ／Ｏ出力の完了を待たずに系切替を開始できるので、コールドスタンバイによるフェイルオーバの高速化を図ることができる。
【図面の簡単な説明】
【００１０】
【図１】本発明の第１の実施形態を示し、系切替を行う計算機システムの一例を示すブロック図である。
【図２】本発明の第１の実施形態を示し、管理サーバの構成を示すブロック図である。
【図３】本発明の第１の実施形態を示し、現用系のサーバ１０２または予備系のサーバ１０６の構成を示すブロック図である。
【図４】本発明の第１の実施形態を示し、ＰＣＩｅｘ−ＳＷ１０７及びアダプタの構成を示すブロック図である。
【図５】本発明の第１の実施形態を示し、ＰＣＩｅｘ−ＳＷ１０７を主体とするフェイルオーバの概略を示すブロック図である。
【図６】本発明の第１の実施形態を示し、サーバ管理テーブル２２１を示す説明図である。
【図７】本発明の第１の実施形態を示し、ＬＵマッピング管理テーブル２２２を示す説明図である。
【図８】本発明の第１の実施形態を示し、ＬＵ管理テーブル２２３を示す説明図である。
【図９】本発明の第１の実施形態を示し、ＰＣＩｅｘ−ＳＷ１０７のＩ／Ｏ処理機構３２２内のＩ／Ｏバッファ管理テーブル４１１を示す説明図である。
【図１０】本発明の第１の実施形態を示し、管理サーバ１０１の制御部１１０で行われる処理の一例を示すフローチャートである。
【図１１】本発明の第１の実施形態を示し、管理サーバ１０１のＩ／Ｏバッファリング指示部２１１で行われる処理の一例を示すフローチャートである。
【図１２】本発明の第１の実施形態を示し、管理サーバ１０１の経路切替部２１３で行われる処理の一例を示すフローチャートである。
【図１３】本発明の第１の実施形態を示し、管理サーバ１０１のＩ／Ｏバッファ書出し指示部２１４で行われる処理の一例を示すフローチャートである。
【図１４】本発明の第１の実施形態を示し、管理サーバ１０１のＮ＋Ｍ切替指示部２１５で行われる処理の一例を示すフローチャートである。
【図１５】本発明の第１の実施形態を示し、Ｉ／Ｏ処理機構３２２のＩ／Ｏバッファリング制御部４０１で行われる処理の一例を示すフローチャートである。
【図１６】本発明の第１の実施形態を示し、管理サーバ１０１が管理する業務及びＳＬＡ管理テーブル２２４の一例を示す説明図である。
【図１７】本発明の第２の実施形態を示し、第２の実施形態を示すサーバ１０２（または１０６）のブロック図である。
【図１８】本発明の第２の実施形態の処理の概要を示すブロック図である。
【図１９】本発明の第３の実施形態を示し、ＰＣＩｅｘ−ＳＷ１０７を主体とするフェイルオーバの概略を示すブロック図である。
【図２０】本発明の第１の実施形態を示し、メモリダンプの書き込みが完了したＬＵ１を、予め設定した保守用の領域へ退避させる例を示すブロック図である。
【発明を実施するための形態】
【００１１】
以下、本発明の一実施形態を添付図面に基づいて説明する。
【００１２】
図１は、本発明の第１の実施形態を示し、系切替を行う計算機システムの一例を示すブロック図である。
【００１３】
管理サーバ１０１は、ＮＷ−ＳＷ（管理用ネットワークスイッチ）１０３を介して、ＮＷ−ＳＷ１０３の管理インタフェース(管理Ｉ／Ｆ)１１３、ＮＷ−ＳＷ（業務用ネットワークスイッチ）１０４の管理インタフェース１１４へ接続されており、管理サーバ１０１から各ＮＷ−ＳＷのＶＬＡＮ（ＶｉｒｔｕａｌＬＡＮ）を設定することが可能である。
【００１４】
ＮＷ-ＳＷ１０３は、管理用のネットワークを構成し、現用系のサーバ１０２や予備系のサーバ１０６に対して、ＯＳやアプリケーションの配布や電源制御等の運用管理をするためのネットワークである。ＮＷ−ＳＷ１０４は、業務用のネットワークを構成し、サーバ１０２、１０６上で実行される業務用アプリケーションが使用するネットワークである。なお、ＮＷ−ＳＷ１０４は、ＷＡＮ等に接続されて計算機システムの外部のクライアント計算機と通信を行う。
【００１５】
管理サーバ１０１は、ＦＣ−ＳＷ（ファイバーチャネル・スイッチ）５１１を介してストレージサブシステム１０５に接続される。管理サーバ１０１は、ストレージサブシステム１０５内のＮ個のＬＵ（Logical Unit）１〜ＬＵｎを管理する。
【００１６】
管理サーバ１０１上では、サーバ１０２、１０６を管理する制御部１１０が実行され、管理テーブル群１１１を参照および更新する。管理テーブル群１１１は制御部１１０によって所定の周期などで更新される。
【００１７】
管理対象となるサーバ１０２は、Ｎ＋Ｍコールドスタンバイを提供するシステムにおける現用系サーバであり、同様に予備系である物理サーバ１０６とともに、ＰＣＩｅｘ−ＳＷ１０７とＩ／Ｏデバイス（図中、ＨＢＡ）を介して、ＮＷ−ＳＷ１０３および１０４に接続される。ＰＣＩｅｘ−ＳＷ１０７には、ＰＣＩＥｘｐｒｅｓｓ規格のＩ／Ｏデバイス（ＮＩＣ（Network Interface Card）、ＨＢＡ（Host Bus Adapter）、ＣＮＡ（Converged Network Adapter）、といったＩ／Ｏアダプタ）が接続されている。一般的に、ＰＣＩｅｘ−ＳＷ１０７は、マザーボード（またはサーバブレード）より外へＰＣＩＥｘｐｒｅｓｓのバスを延長し、さらに多数のＰＣＩ−ＥＸｐｒｅｓｓデバイスを接続することを可能とするＩ／Ｏスイッチを構成するハードウェアである。また、Ｎ＋Ｍコールドスタンバイシステムは、Ｎ個の現用系のサーバ１０２と、Ｍ個の予備系のサーバ１０６で構成される。現用系のサーバ１０２と予備系のサーバ１０６の数は、Ｎ＞Ｍとするのが望ましい。
【００１８】
本実施形態の計算機システムでは、ＰＣＩｅｘ−ＳＷ１０７内の通信経路を切り替えることで、Ｎ＋Ｍコールドスタンバイシステムを実現する。Ｎ＋Ｍコールドスタンバイシステムでは、現用系のサーバ１０２に障害が発生すると、当該サーバ１０２の業務を予備系のサーバ１０６に引き継ぐ系切替が管理サーバ１０１によって実施される。系切替の際、障害が発生した瞬間から特定のＩ／Ｏ出力として出力される現用系サーバ１０２のメモリダンプを漏れなく収集し、かつ、障害発生から間を置かずに、障害が発生した現用系サーバ１０２で稼働していた業務システムを予備系のサーバ１０６へフェイルオーバさせる。これにより、収集したメモリダンプから障害原因を特定しつつ、業務システムは再起動程度の寸断で動き続けることが可能になる。
【００１９】
また、管理サーバ１０１はＰＣＩｅｘ−ＳＷ１０７の管理インターフェース１０７０に接続され、サーバ１０２、１０６とＩ／Ｏデバイスの接続関係を管理する。
【００２０】
また、サーバ１０２、１０６は、ＰＣＩｅｘ−ＳＷ１０７に接続されたＩ／Ｏデバイス（図中ＨＢＡ）を介してストレージサブシステム１０５のＬＵ１〜ＬＵｎにアクセスする。また、ディスクインターフェース２０３は、管理サーバ１０１の内蔵ディスクやストレージサブシステム１０５のインターフェースである。また、現用系のサーバ１０２は図中＃１〜＃３で識別し、予備系のサーバ１０６は、図中＃Ｓ１、＃Ｓ２で識別する。
【００２１】
図２は、管理サーバ１０１の構成を示すブロック図である。管理サーバ１０１は、演算を処理するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２０１、ＣＰＵ２０１で演算するプログラムや、プログラムの実行に伴うデータを格納するメモリ２０２、プログラムやデータを格納するストレージ装置とのディスクインタフェース２０３、ＩＰネットワークを介した通信のためのネットワークインタフェース２０４から構成される。
【００２２】
図２では、ネットワークインタフェース２０４及びディスクインタフェース２０３を、それぞれ代表して一つずつ示しているが、各々が複数あるものとする。たとえば、管理用ネットワークのＮＷ−ＳＷ１０３と業務用ネットワークのＮＷ−ＳＷ１０４との接続は、各々異なるネットワークインタフェース２０４を用いる。
【００２３】
メモリ２０２には、制御部１１０および管理テーブル群１１１が格納されている。制御部１１０は、障害検出部２１０、Ｉ／Ｏバッファリング指示部２１１（図１１参照）、ストレージ制御部２１２、経路切替部２１３（図１２参照）、Ｉ／Ｏバッファ書出し指示部２１４（図１３参照）、及びＮ＋Ｍ切替指示部２１５（図１４参照）を有する。
【００２４】
障害検出部２１０は、サーバ１０２、１０６の障害を検知し、障害を検知したときにはＮ＋Ｍ切替指示部２１５により後述のサーバ管理テーブル２２１を参照して上述の系切替を実施する。なお、障害の検知及びフェイルオーバについては公知または周知の技術を適用すればよいので、本実施形態では詳述しない。
【００２５】
ストレージ制御部２１２は後述のＬＵ管理テーブル２２３を用いてストレージサブシステム１０５のＬＵ１〜ＬＵｎを管理する。
【００２６】
管理テーブル群１１１は、サーバ管理テーブル２２１（図６参照）、ＬＵマッピング管理テーブル２２２（図７参照）、ＬＵ管理テーブル２２３（図８参照）、業務及びＳＬＡ（Service Level Agreement）管理テーブル２２４（図１６参照）を有する。
【００２７】
各テーブルの情報収集はＯＳ（図示省略）の標準インタフェースや情報収集用プログラムを使用した自動収集でも良いし、手動で利用者（または管理者）に入力させても良い。ただし、規則や方針といった情報のうち物理的要件や法律の要請で限界値が決定されるもの以外は、利用者に予め入力させる必要があり、入力用のインタフェースを備えてもよい。また、利用者の方針によって、限界値に至らない運用をする場合も同様に条件を入力するインタフェースを備えてもよい。
【００２８】
管理サーバ１０１の種別については、物理サーバ、ブレードサーバ、仮想化されたサーバ、論理分割または物理分割されたサーバなどのいずれであっても良く、いずれを使った場合も本発明の効果を得ることが出来る。
【００２９】
図３は、現用系のサーバ１０２または予備系のサーバ１０６の構成を示すブロック図である。現用系のサーバ１０２と予備系のサーバ１０６の構成が一致する必要性は必ずしもない。ただし、構成が一致する場合、Ｎ＋Ｍコールドスタンバイにて切替えを実施した場合に、問題が発生しにくい。これは、Ｎ＋Ｍコールドスタンバイによる切替動作が、ＯＳにとっては再起動と同じように見えることに起因する。この効果は、本願でも有効である。以下では、現用系のサーバ１０２と予備系のサーバ１０６が同一の構成である場合について説明する。
【００３０】
サーバ１０２、１０６は、演算を処理するＣＰＵ３０１、ＣＰＵ３０１で演算するプログラムや、プログラムの実行に伴いデータを格納するメモリ３０２、プログラムやデータを格納するストレージ装置とのディスクインタフェース３０４、ＩＰネットワークを介して通信を行うためのネットワークインタフェース３０３、電源制御や各インタフェースの制御を行うＢＭＣ（ＢａｓｅｍｅｎｔＭａｎａｇｅｍｅｎｔＣｏｎｔｒｏｌｌｅｒ）３０５、ＰＣＩｅｘ−ＳＷに接続するためのＰＣＩ−Ｅｘｐｒｅｓｓインタフェース３０６を有する。
【００３１】
メモリ３０２上のＯＳ３１１がＣＰＵ３０１によって実行され、サーバ１０２または１０６内のデバイス及びタスクの管理を行っている。ＯＳ３１１の下で、業務を提供するアプリケーション３２１や監視プログラム３２２などが動作する。監視プログラム３２２はサーバ１０２、１０６の障害を検知し、管理サーバ１０１に通知する。ＯＳ３１１は、所定の条件でメモリ３０２の内容を、ストレージサブシステム１０５に書き込むメモリダンプを出力するメモリダンプ部３１１０を有する。なお、ＯＳ３１１がメモリダンプ部３１１０を機能させる所定の条件は、システム障害の発生時や、所定のコマンドの受け付け時などである。
【００３２】
図３では、ネットワークインタフェース３０３、ディスクインタフェース３０４およびＰＣＩ−Ｅｘｐｒｅｓｓインタフェース３０６を、それぞれ代表して一つずつ示しているが、各々が複数あるものとする。たとえば、管理用ネットワークのＮＷ−ＳＷ１０３と業務用ネットワークのＮＷ−ＳＷ１０４との接続は、各々異なるネットワークインタフェース３０３を用いる。あるいは、サーバ１０２、１０６は、図１のようにＰＣＩｅｘインターフェースを介して接続されたＮＩＣを経由してＮＷ−ＳＷ１０３と業務用ネットワークのＮＷ−ＳＷ１０４に接続してもよい。
【００３３】
現用系のサーバ１０２に障害が発生しておらずＮ＋Ｍ切替が発生していない場合、予備系のサーバ１０６のメモリ３０２上ではＯＳ３１１や他のプログラムは動作していない。ただし、情報収集や障害が発生していないかをチェックするプログラムが所定の周期などで実行されることはある。
【００３４】
図４は、ＰＣＩｅｘ−ＳＷ１０７を中心に、現用系のサーバ１０２、予備系のサーバ１０６と、ＰＣＩ−Ｅｘｐｒｅｓｓのアダプタ４５１−１〜４５１−５（ＮＩＣ、ＨＢＡ、ＣＮＡなどのＩ／Ｏデバイス）およびそれらを格納したアダプタラック４６１やアダプタ４５１との接続構成を示している。なお、以下ではアダプタ４５１−１〜４５１−５の総称をアダプタ４５１とする。
【００３５】
ＰＣＩｅｘ−ＳＷ１０７は、現用系のサーバ１０２および予備系のサーバ１０６と、ＰＣＩｅｘインタフェース３０６を介して接続されている。また、ＰＣＩｅｘ−ＳＷ１０７は、複数のＰＣＩ−ｅｘｐｒｅｓｓアダプタ４５１に接続されている。アダプタ４５１は、アダプタラック４６１に収められていても良いし、アダプタ４５１が直接、ＰＣＩｅｘ−ＳＷ１０７に接続されていても良い。
【００３６】
ＰＣＩｅｘ−ＳＷ１０７は、Ｉ／Ｏ処理機構３２２を備え、現用系のサーバ１０２または予備系のサーバ１０６がアダプタ４５１に接続される際に、Ｉ／Ｏ処理機構３２２を経由するパスと経由しないパスを持つ。本実施形態では、現用系のサーバ１０２のメモリダンプを漏れなく取得する機構の動作には、Ｉ／Ｏ処理機構３２２がメモリダンプを一時的に保持するバッファ領域４４３と、バッファ領域４４３を制御する制御部４４１ならびに管理テーブル群４４２を備える。管理テーブル群４４２は、制御部４４１によって所定の周期、あるいは管理サーバ１０１からの構成変更の指令などに応じて更新される。
【００３７】
制御部４４１は、アダプタ（Ｉ／Ｏデバイス）４５１と現用系のサーバ１０２及び予備系のサーバ１０６の接続を制御し、バッファ領域４４３へのアクセスを制御するＩ／Ｏバッファリング制御部４０１から構成されている（図１５参照）。
【００３８】
管理テーブル群４４２は、Ｉ／Ｏバッファリング管理テーブル４１１から構成されている（図９参照）。
【００３９】
また、ＰＣＩｅｘ−ＳＷ１０７は、後述するように、サーバ１０２、１０６に接続されるポート（上流ポート）と、アダプタ４５１−１〜４５１−５に接続されるポート（下流ポート）を備える。制御部４４１は、上流ポートと下流ポートの接続関係を変更することで、サーバ１０２、１０６に割り当てるアダプタ４５１−１〜４５１−５を変更することができる。なお、図示の例では、アダプタ４５１−１〜４５１−５が５つの場合を示しているが、図１に示すＮＩＣ、ＨＢＡのように、多数のアダプタ４５１を備えることができる。また、本実施形態では、アダプタ４５１−１〜４５１−３がＨＢＡで構成された例を示す。
【００４０】
図５は、ＰＣＩｅｘ−ＳＷ１０７を主体とするフェイルオーバの概略を示すブロック図である。図５の例は、現用系のサーバ１０２（以下、現用系サーバ＃１）で障害が発生して、現用系サーバ＃１のメモリダンプを行いながら、予備系のサーバ１０６（以下、予備系サーバ＃Ｓ１）に系切替を行う例を示している。
【００４１】
前提条件としては、現用系サーバ＃１は、ＰＣＩｅｘ−ＳＷ１０７のポートａ５３１に接続され、予備系サーバ＃Ｓ１はポートｃ５３３に接続される。また、ＰＣＩｅｘ−ＳＷ１０７を介して現用系サーバ＃１に割り当てられたストレージサブシステム１０５の記憶領域は、ＬＵ２（５２２−２）がポートｙ５３６に接続されて主ボリュームとして機能する。ＬＵ２にはＯＳのブートイメージ、業務アプリケーション等が格納される。また、ＬＵ１（５２２−１）はＬＵ２の副ボリュームとして設定され、ミラーボリュームが構成される。ポートｙ５３６にはＨＢＡで構成されたアダプタ４５１−２が接続され、ＦＣ−ＳＷ５１１を介してＬＵ２に接続される。また、ポートｙ５３５にはＨＢＡで構成されたアダプタ４５１−１が接続される。
【００４２】
現用系サーバ＃１がミラーボリュームの主ボリュームであるＬＵ２にデータを書き込むと、ストレージサブシステム１０５のミラーリング機能によって、ＬＵ２の内容が副ボリュームＬＵ１に複製される。
【００４３】
ＰＣＩｅｘ−ＳＷ１０７は、ポートａ５３１とポートｙ５３６を接続し、現用系サーバ＃１からＨＢＡで構成されたアダプタ４５１−２を介して主ボリュームのＬＵ２にアクセスする。ＬＵ２に書き込まれたデータは、ストレージサブシステム１０５によってＬＵ１ｎ複製される。また、ＬＵ２（及びＬＵ１）には、障害が発生したときに現用系サーバ＃１のメモリ３０２の内容をダンプする領域として、メモリダンプ用仮想領域５４２が設定される。
【００４４】
管理サーバ１０１は、（１）現用系サーバ＃１（または他の現用系のサーバ１０２）から送られてくる障害通知５０１を受信した契機で、（２）Ｉ／Ｏ処理機構３２２へＩ／Ｏバッファリング指示を出し、ポートａ５３１とポートｙ５３６が接続されていた構成から、ポートａ５３１とＩ／Ｏ処理機構３２２を接続する。そして、Ｉ／Ｏ処理機構内のバッファ領域４４３へ、障害が発生した現用系サーバ＃１のＩ／Ｏ（メモリダンプ）を蓄積可能な構成へ変更する（５０２）。
【００４５】
障害が発生した現用系サーバ＃１は、障害発生と同時にメモリダンプを出力（送信）しており、メモリダンプの一部は既に主ＶＯＬであるＬＵ２（５２２−２）のメモリダンプ用仮想領域５４２へ出力されている。本実施形態では、ＬＵ２（５２２−２）を副ボリュームＬＵ１とミラー構成とすることで、既に出力されたメモリダンプを漏らすことなく副ボリュームであるＬＵ１にもコピーしておく。そして、Ｉ／Ｏ処理機構３２２は、現用系のサーバ１０２からのメモリダンプをバッファ領域４４３に蓄積する。Ｉ／Ｏ処理機構５２３はバッファ領域４４３にバッファリングしたメモリダンプを続けて書き込むことで、全てのメモリダンプのデータを回収することが可能になる。
【００４６】
（３）管理サーバ１０１のストレージ制御部２１２が、主ボリュームのＬＵ２と副ボリュームのＬＵ１のミラーリングをスプリットする指示を出す（５０３）。なお、ストレージ制御部２１２はスプリット前に、強制的にミラーリングの同期をとるよう指示を出しても良い。強制的にミラー同期処理を入れる場合、同期処理が完了してからスプリットを実行する。次に、ストレージ制御部２１２スプリットした副ボリュームのＬＵ１を主ボリュームに変更するよう指示を出す。これにより、障害発生と同時に主ボリュームのＬＵ２のメモリダンプ用仮想領域５４２に書き込まれたメモリダンプを持つＬＵ１、２が２つ作成されたことになる。どちらも、サーバ１０２または１０６に接続し、再起動することで業務を再開することが出来、また、メモリダンプを引き続いて書き込んでも漏れなくメモリダンプを採取することが可能である。
【００４７】
ここで、予備系のサーバ１０６に接続して業務を再開するＬＵ１と、副ボリュームとして、ある別のＬＵｎ（第３の記憶部）をミラー構成のペアとすることで、再度、障害が発生しても、本発明の効果を得つつ、別のシステムに高速に切替えることが可能になる。
【００４８】
（４）経路切替部２１３（図１２参照）が、Ｉ／Ｏ処理機構３２２と先の２つの主ボリュームのＬＵ１を接続する（５０４）。すなわち、Ｉ／Ｏ処理機構５２３のバッファ領域４４３とポートｘ５３５を接続し、ＨＢＡ４５１−１を介してＬＵ１に接続する。このとき、元々、副ボリュームであったＬＵ１を選択し、メモリダンプを書き出す先として選択しても良いし、予備系のサーバ１０６に接続するようにしても良い。ＬＵ１をメモリダンプの書き出し先として選択すると、残ったＬＵ２（最初から主ボリュームで、元々業務を提供していたＬＵ５２２−２）は予備系のサーバ１０６（＃Ｓ１）に接続することになる。この構成をとるメリットは、ＨＢＡ４５１−２が切替前後で変わらないことである。これにより、予備系サーバ＃Ｓ１を稼動させて業務を提供するＯＳやミドルウェアをはじめとするソフトウェア群からは、現用系サーバ＃１から予備系サーバ＃Ｓ１に代わっただけ（サーバ部分（主にＣＰＵやメモリ）のみが代わっただけ）のようになるため、切替後の稼動に悪影響を及ぼしにくい。悪影響には、起動しない、だけでなく、起動後にデバイスが変わったとＯＳが認識することによるデバイスドライバの再組み込みや、再組み込みによるＯＳ設定情報の破棄（再設定が必要になる）を回避することが出来る。しかし、ＨＢＡ４５１−２が他のＨＢＡに変わることで特に業務継続に支障がないことが分かっていたり、対策を実施している場合、どちらのＬＵ１、２を使っても良い。例えば、本実施形態ではＩ／Ｏ処理機構３２２とＰＣＩｅｘ−ＳＷ１０７のポートｘ５３５を接続してバッファ領域４４３の内容を書き込む場合を詳述する。
【００４９】
この場合、障害が発生した現用系サーバ＃１は、ＰＣＩｅｘ−ＳＷ１０７のポートａ５３１と接続されているため、Ｉ／Ｏ処理機構３２２を介して、元々副ボリュームとしてペアを組んでいたＬＵ２に接続されることになる。
【００５０】
（５）Ｉ／Ｏバッファ書出し指示部２１４（図１３参照）が、Ｉ／Ｏ処理機構３２２へバッファ領域４４３に蓄積しているメモリダンプを書き出すよう指示を出す（５０５）。これにより、ＬＵ１のメモリダンプ用仮想領域５４２にバッファリングされた後のデータがバッファ領域４４３から書き加えられていく。
【００５１】
このようにして、障害発生と同時に書き出されるメモリダンプのデータを漏らすことなく、ＬＵ１に格納することが可能になる。
【００５２】
（６）Ｎ＋Ｍ切替指示部２１５（図１４）が、ＰＣＩｅｘ−ＳＷ１０７にＬＵ２と予備系サーバ＃Ｓ１を接続するよう指示する。具体的には、ＰＣＩｅｘ−ＳＷ１０７のポートｃ５３３とポートｙ５３６を接続する（５０６）。
【００５３】
上記のようにして、ブート用ＬＵ２とメモリダンプ用仮想領域５４２が同じＬＵまたはひとつのボリュームにしかメモリダンプ用仮想領域５４２の存在を許さない種類のＯＳでも、メモリダンプを採取しつつ、予備系サーバ＃Ｓ１への切替と再起動を実施することが可能になる。
【００５４】
上記の（４）、（５）と（６）は並行して処理が実行されても良く、並行して実施することで予備系のサーバ１０６での起動開始を早められ、更なる高速切替を実現できる。
【００５５】
また、メモリダンプの書き込みが完了したＬＵ１は、保守用の領域へ退避させたり、アクセス制限するなどして保護することで、操作ミスによるメモリダンプを採取したＬＵ１の喪失を防ぐことができ、本実施形態の効果を更に高めることが可能である。この例については、図２０に後述する。
【００５６】
図６は、サーバ管理テーブル２２１を示す説明図である。サーバ管理テーブル２２１は管理サーバ１０１の制御部１１０で管理される。
【００５７】
カラム６０１には、サーバ１０２、１０６の識別子を格納しており、本識別子によって各サーバ１０２、１０６を一意に識別する。カラム６０１へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、識別子は昇順などで管理サーバ１０１等が自動的に割り振っても良い。
【００５８】
カラム６０２には、ＵＵＩＤ（ＵｎｉｖｅｒｓａｌＵｎｉｑｕｅＩＤｅｎｔｉｆｉｅｒ）が格納されている。ＵＵＩＤは、重複しないように形式が規定された識別子である。そのため、各サーバ１０２、１０６に対応して、ＵＵＩＤを保持することにより、確実なユニーク性を保証する識別子となる。ただし、カラム６０１には、システム管理者がサーバを識別する識別子を設定すれば良く、また管理する対象となるサーバ１０２，１０６間で重複することがなければ問題ないため、ＵＵＩＤを使うことが望ましいものの必須とはならない。例えば、カラム６０１のサーバ識別子には、ＭＡＣアドレス、ＷＷＮ（ＷｏｒｌｄＷｉｄｅＮａｍｅ）などを用いても良い。
【００５９】
カラム６０３には、サーバの種別として、現用系サーバか予備系サーバかを格納している。また、系切替時にはどのサーバからの切替を受け付けたかも格納しても良い。
【００６０】
カラム６０４には、サーバ１０２，１０６のステータスが格納されており、問題がなければ正常、障害が発生していれば障害を、それぞれ表すステータスが格納されている。障害発生時には、メモリダンプを書き出し中などの情報を格納しても良い。
【００６１】
カラム６０５（カラム６２１〜カラム６２３）は、アダプタ４５１に関する情報を格納している。カラム６２１には、アダプタ４５１のデバイス種別を格納している。ＨＢＡ（ＨｏｓｔＢｕｓＡｄａｐｔｏｒ）やＮＩＣやＣＮＡ（ＣｏｎｖｅｒｇｅｄＮｅｔｗｏｒｋＡｄａｐｔｅｒ）などが格納される。カラム６２２には、ＨＢＡの識別子であるＷＷＮ、ＮＩＣの識別子であるＭＡＣアドレスが格納されている。
【００６２】
カラム６０６には、現用系のサーバ１０２や予備系のサーバ１０６がアダプタ４５１を介して接続しているＮＷ−ＳＷ１０３、１０４やＦＣ−ＳＷ５１１に関する情報が格納されている。種別や接続ポートおよびセキュリティ設定情報が格納されている。
【００６３】
カラム６０７には、サーバのモデルを格納している。インフラに関する情報であり、性能や構成可能なシステム限界を知ることが出来る情報である。また、構成が同じか否かを判別することが出来る情報である。
【００６４】
カラム６０８は、サーバの構成を格納している。プロセッサのアーキテクチャ、シャーシやスロットなどの物理位置情報、特徴機能（ブレード間ＳＭＰ：ＳｙｍｍｅｔｒｉｃＭｕｌｔｉ-Ｐｒｏｃｅｓｓｉｎｇ、ＨＡ構成などの有無）を格納している。
【００６５】
カラム６０９には、サーバの性能情報を格納している。
【００６６】
図７は、ＬＵマッピング管理テーブル２２２を示す説明図である。ＬＵマッピング管理テーブル２２２は、管理サーバ１０１の制御部１１０で管理され、ＬＵ５２２とアダプタ４５１とサーバ１０２、１０６との接続関係を格納している。
【００６７】
カラム７０１には、ストレージサブシステム１０５内のＬＵの識別子を格納しており、本識別子によって各ＬＵを一意に識別する。
【００６８】
カラム７０２（カラム７２１〜カラム７２２）には、アダプタ４５１に関する情報を格納している。カラム７２１には、デバイス種別を格納している。ＨＢＡ（ＨｏｓｔＢｕｓＡｄａｐｔｏｒ）やＮＩＣやＣＮＡ（ＣｏｎｖｅｒｇｅｄＮｅｔｗｏｒｋＡｄａｐｔｅｒ）などが格納される。カラム７２２には、ＨＢＡの識別子であるＷＷＮ、ＮＩＣの識別子であるＭＡＣアドレスが格納されている。
【００６９】
カラム７０３には、ＰＣＩｅｘ−ＳＷ情報を格納している。ＰＣＩｅｘ−ＳＷ１０７のどのポートとポートが接続関係にあるか、また、Ｉ／Ｏ処理機構３２２との接続関係を格納している。
【００７０】
図８は、ＬＵ管理テーブル２２３を示す説明図である。ＬＵ管理テーブル２２３は、管理サーバ１０１の制御部１１０で管理され、ＬＵの種別やミラーリングの有無、ミラーのペア、ステータスを管理している。
【００７１】
カラム８０１には、ＬＵの識別子を格納しており、本識別子によって各ＬＵを一意に識別する。
【００７２】
カラム８０２には、ＬＵ種別を格納している。主ボリュームか副ボリュームか、といったミラーリングの主従関係を示す情報などが格納されている。
【００７３】
カラム８０３には、ミラーリングを組んでいるペアとなる副ボリュームのＬＵを格納している。
【００７４】
カラム８０４には、ＬＵのステータスを格納している。ミラーリング状態、スプリット中、副ボリュームから主ボリュームへ変更中、ミラーリングする予定である予約、などを格納している。
【００７５】
図９は、ＰＣＩｅｘ−ＳＷ１０７のＩ／Ｏ処理機構３２２内のＩ／Ｏバッファリング管理テーブル４１１を示す説明図である。Ｉ／Ｏバッファリング管理テーブル４１１は、制御部４４１によって管理され、バッファ領域４４３が接続されているサーバ１０２やアダプタ４５１および、バッファ領域４４３のステータスを管理している。
【００７６】
カラム９０１は、Ｉ／Ｏバッファの識別子を格納しており、本識別子によって各バッファ領域４４３を一意に識別する。この識別子は、制御部４４１が予め設定した識別子を用いることができる。
【００７７】
カラム９０２は、サーバ１０２、１０６の識別子を格納しており、本サーバ識別子によって各サーバを一意に識別する。サーバ識別子は管理サーバ１０１のサーバ管理テーブル２２１から取得した値を用いることができる。
【００７８】
カラム９０３（カラム９２１〜カラム９２２）には、アダプタ４５１に関する情報を格納している。カラム９２１には、デバイス種別を格納している。ＨＢＡ（ＨｏｓｔＢｕｓＡｄａｐｔｏｒ）やＮＩＣやＣＮＡ（ＣｏｎｖｅｒｇｅｄＮｅｔｗｏｒｋＡｄａｐｔｅｒ）などが格納される。カラム９２２には、ＨＢＡの識別子であるＷＷＮ、ＮＩＣの識別子であるＭＡＣアドレスが格納されている。アダプタ４５１に関する情報は管理サーバ１０１のサーバ管理テーブル２２１から取得した値を用いることができる。あるいは、制御部４４１がアダプタ４５１をアクセスした値を用いてもよい。
【００７９】
カラム９０４には、バッファ領域４４３のステータスを格納している。バッファ要求受付、データをバッファ中、バッファしたデータを書き出し中、などが格納される。
【００８０】
カラム９０５には、バッファ領域４４３の使用ステータスが格納されている。使用中なのか未使用なのか、また使用している場合は使用している容量、エラー情報などである。また、予約する容量や優先順位に関する情報を格納し、バッファ領域４４３の容量を超えるデータをバッファするよう要求されたときに、どのバッファ領域のデータを救済するかを判定することが可能になる。
【００８１】
カラム９０２やカラム９０３に格納されているアダプタ、デバイス、サーバはＰＣＩｅｘ−ＳＷ１０７のポート番号またはスロット番号で置き換えられる情報が格納されても良い。
【００８２】
さらに、Ｉ／Ｏバッファリング管理テーブル４１１にはバッファ領域４４３でバッファリングに失敗した場合の対処を格納するカラムを設けても良い。例えば、再送要求を現用系のサーバ１０２に出す、失敗通知を管理サーバ１０１へ通知する、などである。また、管理サーバ１０１は、別のＬＵにつながったアダプタ４５１を障害が発生した現用系のサーバ１０２へ通知し、別ＬＵへメモリ３０２の内容を書き出すようにしても良い。それにより、あふれたデータを救済することが可能になる。
【００８３】
図１０は、管理サーバ１０１の制御部１１０で行われる処理の一例を示すフローチャートである。この処理は、管理サーバ１０１がサーバ１０２、１０６から障害通知５０１を受信したときに起動される。なお、障害通知５０１は、サーバ１０２、１０６のＢＭＣ３０５やＯＳ３１１等が障害を検知したときに管理サーバ１０１へ送信する。なお、以下では、現用系サーバ、ＬＵの識別子を図５に示した値を用いる。
【００８４】
ステップ１００１で、障害検出部２１０が障害通知５０１により障害を検出する。障害を検出した場合、ステップ１００２へ進む。
【００８５】
ステップ１００２で、Ｉ／Ｏバッファリング指示部２１１が、Ｉ／Ｏ処理機構３２２へ障害が発生した現用系サーバ＃１のＩ／Ｏ出力（メモリダンプ）をバッファするよう指示し、ステップ１００３へ進む。
【００８６】
ステップ１００３で、ストレージ制御部２１２が、ストレージサブシステム１０５に対して現用系サーバ＃１が使用している主ボリュームＬＵ２へミラーリングの同期処理を指示し、ステップ１００４へ進む。
【００８７】
ステップ１００４で、ストレージ制御部２１２が、ストレージサブシステム１０５へＬＵ２のミラーリング構成のスプリットを指示し、ステップ１００５へ進む。このとき、スプリットした後に、必要に応じてペアであった副ボリュームのＬＵ１を主ボリューム化する。また、別の副ボリュームであるＬＵを用意しておき、元のＬＵ（予備系のサーバ１０６と接続して業務を再開するＬＵ）とペアを組み、ミラーリング構成を再構成しても良い。
【００８８】
ステップ１００５で、経路切替部２１３が、Ｉ／Ｏ処理機構３２２とアダプタ４５１（メモリダンプ出力用のＬＵ１に接続されているデバイス）と接続するよう指示し、ステップ１００６へ進む。
【００８９】
ステップ１００６で、Ｉ／Ｏバッファ書出し指示部２１４がＩ／Ｏ処理機構３２２に対してバッファ領域４４３へ蓄積したメモリダンプのデータをステップ１００５で設定したＬＵ１に書き出すよう指示し、ステップ１００７へ進む。
【００９０】
ステップ１００７で、Ｎ＋Ｍ切替指示部２１５が、ＰＣＩｅｘ−ＳＷ１０７に予備系サーバ＃Ｓ１に、障害が発生した現用系サーバ＃１が使用していたアダプタ４５１（ＬＵ２）を接続するよう指示し、ステップ１００８へ進む。
【００９１】
ステップ１００８で、予備系サーバ＃Ｓ１を起動するよう指示し、処理を完了する。
【００９２】
上記処理により、図５で示したように、現用系サーバ＃１から障害通知５０１を受信すると、管理サーバ１０１はＰＣＩｅｘ−ＳＷ１０７に対してバッファ領域４４３で現用系サーバ＃１からのＩ／Ｏ出力を格納する指令を送信する。次に、管理サーバ１０１はストレージサブシステム１０５に対して現用系サーバ＃１が利用しているＬＵ２についてミラーリングの同期指示を送信し、主ボリュームのＬＵ２と副ボリュームのＬＵ１を同期させる。その後、管理サーバ１０１はストレージサブシステム１０５のミラーボリュームにスプリットを指示し、ミラーリングのペアを分離する指示を送信する。次に、管理サーバ１０１は、ミラーリングのペアを解除した一方のＬＵ１にバッファ領域４４３の内容を書き込むようＰＣＩｅｘ−ＳＷ１０７の制御部４４１に指令する。さらに、管理サーバ１０１は、ミラーリングのペアを解除した他方のＬＵ２を主ボリュームとし、予備系サーバ＃Ｓ１に接続するようＰＣＩｅｘ−ＳＷ１０７に対して指令する。その後、管理サーバ１０１は予備系サーバ＃Ｓ１に起動を指令してフェイルオーバを完了する。
【００９３】
以上により、障害が発生した現用系サーバ＃１のメモリダンプの収集をＯＳの種類にかかわらず確実に行いながらも、予備系サーバ＃Ｓ１への系切替を迅速に行うことが可能となるのである。特に、ミラーボリュームＬＵ１，ＬＵ２をスプリットした後には、障害が発生した現用系サーバ＃１のメモリダンプと予備系サーバ＃Ｓ１への系切替を並列的に行うことで、メモリダンプの完了を待たずに系切替を開始できるので、フェイルオーバの高速化を図ることができる。
【００９４】
図１１は、管理サーバ１０１のＩ／Ｏバッファリング指示部２１１で行われる処理の一例を示すフローチャートである。この処理は、図１０のステップ１００２で行われる処理である。
【００９５】
ステップ１１０１で、Ｉ／Ｏバッファリング指示部２１１は、サーバ管理テーブル２２１を参照し、ステップ１１０２へ進む。
【００９６】
ステップ１１０２で、Ｉ／Ｏバッファリング指示部２１１は、障害通知５０１とサーバ管理テーブル２２１から障害が発生した現用系サーバ＃１に接続されたアダプタ４５１とＰＣＩｅｘ−ＳＷ１０７の接続ポートを特定し、ステップ１１０３へ進む。
【００９７】
ステップ１１０３で、Ｉ／Ｏバッファリング指示部２１１は、Ｉ／Ｏ処理機構３２２に対して、ステップ１００４で特定したＰＣＩｅｘ−ＳＷ１０７の接続ポートとＩ／Ｏ処理機構３２２のバッファ領域４４３とを接続するよう指示し、ステップ１１０４へ進む。
【００９８】
ステップ１１０４で、Ｉ／Ｏバッファリング指示部２１１は、Ｉ／Ｏ処理機構３２２に対して、当該現用系サーバ＃１からのＩ／Ｏ出力をバッファするよう指示し、ステップ１１０５へ進む。
【００９９】
ステップ１１０５で、Ｉ／Ｏバッファリング指示部２１１は、Ｉ／Ｏバッファリング管理テーブル４１１を更新し、処理を完了する。
【０１００】
上記処理により、障害が発生した現用系サーバ＃１からのＩ／Ｏ出力は、ＰＣＩｅｘ−ＳＷ１０７のバッファ領域４４３に格納される。
【０１０１】
図１２は、管理サーバ１０１の経路切替部２１３で行われる処理の一例を示すフローチャートである。この処理は、図１０のステップ１００５で行われる処理である。
【０１０２】
ステップ１２０１で、経路切替部２１３は、ＬＵ管理テーブル２２３を参照し、障害が発生した現用系サーバ＃１に割り当てられたＬＵとペアの関係にあるＬＵ１を特定し、ステップ１２０２へ進む。
【０１０３】
ステップ１２０２で、経路切替部２１３は、ＬＵマッピング管理テーブル２２２を参照し、障害が発生した現用系サーバ＃１に割り当てられたＬＵとポートの関係を特定してステップ１２０３へ進む。
【０１０４】
ステップ１２０３で、経路切替部２１３は、Ｉ／Ｏ処理機構３２２のバッファ領域４４３と、メモリダンプ出力用ＬＵ１（スプリットした元々副ボリュームであったＬＵ）とを接続するよう指示し、処理を完了する。
【０１０５】
以上の処理により、バッファ領域４４３に副ボリュームのＬＵ１が接続され、バッファ領域４４３の内容をＬＵ１に書き込むことができる。
【０１０６】
図１３は、管理サーバ１０１のＩ／Ｏバッファ書出し指示部２１４で行われる処理の一例を示すフローチャートである。この処理は、図１０のステップ１００６で行われる処理である。
【０１０７】
ステップ１３０１で、Ｉ／Ｏバッファ書出し指示部２１４は、Ｉ／Ｏ処理機構３２２に対してバッファ領域４４３へ蓄積したＩ／Ｏデータを書き出すよう指示し、ステップ１３０２へ進む。
【０１０８】
ステップ１３０２で、Ｉ／Ｏバッファ書出し指示部２１４は、書き出しを指令したバッファ領域４４３についてＩ／Ｏバッファリング管理テーブル４１１を更新し、処理を完了する。
【０１０９】
上記処理により、ＰＣＩｅｘ−ＳＷ１０７のバッファ領域４４３に格納されたメモリダンプが、スプリットによりペアが解除されたＬＵ１に書き込まれる。
【０１１０】
図１４は、管理サーバ１０１のＮ＋Ｍ切替指示部２１５で行われる処理の一例を示すフローチャートである。この処理は、図１０のステップ１００７で行われる処理である。
【０１１１】
ステップ１４０１で、Ｎ＋Ｍ切替指示部２１５は、サーバ管理テーブル２２１を参照し、障害が発生した現用系サーバ＃１と、引き継ぎ先の予備系サーバ＃Ｓ１を特定してステップ１４０２へ進む。
【０１１２】
ステップ１４０２で、Ｎ＋Ｍ切替指示部２１５は、ステップ１４０１で特定した予備系サーバ＃Ｓ１と、障害が発生した現用系サーバ＃１が使用していたアダプタ４５１を接続するよう、ＰＣＩｅｘ−ＳＷ１０７に指示し、ステップ１４０３へ進む。
【０１１３】
ステップ１４０３で、Ｎ＋Ｍ切替指示部２１５は、予備系サーバ＃Ｓ１に接続したＬＵ２について、ＬＵ管理テーブル２２３を更新し、ステップ１４０４へ進む。
【０１１４】
ステップ１４０４で、Ｎ＋Ｍ切替指示部２１５は、予備系サーバ＃Ｓ１に接続したＬＵ２について、ＬＵマッピング管理テーブル２２２を更新し、ステップ１４０５へ進む。
【０１１５】
ステップ１４０５で、Ｎ＋Ｍ切替指示部２１５は、障害が発生した現用系サーバ＃１と、引き継ぎ先の予備系サーバ＃Ｓ１についてサーバ管理テーブル２２１を更新し、処理を完了する。
【０１１６】
上記処理により、障害が発生した現用系サーバ＃１のＬＵ２が、予備系サーバ＃Ｓ１に引き継がれる。
【０１１７】
図１５は、Ｉ／Ｏ処理機構３２２のＩ／Ｏバッファリング制御部４０１で行われる処理の一例を示すフローチャートである。この処理は、図１１のステップ１１０４で行われる処理である。
【０１１８】
ステップ１５０１で、Ｉ／Ｏバッファリング制御部４０１は、Ｉ／Ｏバッファリング管理テーブル４１１を参照し、メモリダンプの書き込み先となるバッファ領域４４３を特定してステップ１５０２へ進む。
【０１１９】
ステップ１５０２で、障害が発生した現用系サーバ＃１とＩ／Ｏ処理機構３２２およびバッファ領域４４３を接続されるのを待って、ステップ１５０３へ進む。
【０１２０】
ステップ１５０３で、Ｉ／Ｏバッファリング制御部４０１は、当該バッファ領域４４３へ当該現用系サーバ＃１からのＩ／Ｏデータをバッファリングし、処理を完了する。
【０１２１】
図１６は、管理サーバ１０１が管理する業務及びＳＬＡ管理テーブル２２４の一例を示す説明図である。業務及びＳＬＡ管理テーブル２２４は、現用系サーバ１０２が提供する業務毎にどのような業務およびソフトウェアで、どのような設定がされていて、どのようなＳｅｒｖｉｃｅＬｅｖｅｌを、どの程度満たす必要があるか、それぞれの優先順位付け、といった情報を管理している。
【０１２２】
カラム１６０１には、業務識別子を格納しており、本識別子によって業務を一意に識別する。
【０１２３】
カラム１６０２には、ＵＵＩＤが格納されている。カラム１６０１に格納されている業務識別子の候補であり、広範囲に渡ったサーバ管理には非常に有効である。ただし、カラム１６０１には、システム管理者がサーバを識別する識別子を使用すれば良く、また管理する対象となるサーバ間で重複することがなければ問題ないため、ＵＵＩＤを使うことが望ましいものの必須とはならない。例えば、カラム１６０１のサーバ識別子には、業務設定情報（カラム１６０４へ格納）を用いても良い。
【０１２４】
カラム１６０３は、業務種別を格納しており、使用するアプリケーションやミドルウェアといった業務を特定するソフトウェアに関する情報が格納されている。業務で使用する論理的なＩＰアドレスやＩＤ、パスワード、ディスクイメージ、業務で使用するポート番号などが格納されている。ディスクイメージは、設定前後の業務が現用系のサーバ１０２上のＯＳへ配信されたシステムディスクのディスクイメージを指す。カラム１６０４へ格納するディスクイメージに関する情報は、データディスクを含めても良い。
【０１２５】
カラム１６０５は、優先順位やＳＬＡの内容を格納しており、それぞれの業務間の優先順位やそれぞれの業務が必要とする要件が格納されている。これにより、どの業務が優先的に救済される必要があり、メモリダンプ採取が必要か否か、またＮ＋Ｍ切替高速が必要か否か、を設定することが出来る。本発明では、バッファ領域４４３をどのように使うかが重要なポイントであり、これにより最も本発明の効果を得ることが出来る運用を決めることが可能になる。
【０１２６】
管理サーバ１０１は、業務及びＳＬＡ管理テーブル２２４で、ＳＬＡ１６０５がメモリダンプ不要であれば、上記図５に示した処理を行わずに、フェイルオーバを実施すればよい。
【０１２７】
図２０は、メモリダンプの書き込みが完了したＬＵ１を、予め設定した保守用の領域へ退避させる例を示すブロック図である。管理サーバ１０１は、メモリダンプの書き込みが完了したＬＵ１を、予備系サーバ＃Ｓ１が使用するホストグループ１（５５０）から分離して、予め設定した保守用グループ５５１に変更し、アクセスを制限する。
【０１２８】
以上により、障害が発生した現用系サーバ＃１のメモリダンプを、ＯＳの種類にかかわらず、確実にＬＵ１に収集し、保守用グループ５５１に移動させることで、メモリダンプの内容を誤って消去するなどの誤操作を防止することができる。
【０１２９】
＜第２実施形態＞
図１７は、第２の実施形態を示すサーバ１０２（または１０６）のブロック図である。第２実施形態は、前記第１実施形態のＩ／Ｏ処理機構３２２を、仮想化機構１７１１に組み込んだものである。図１７では、サーバ１０２、仮想化機構１７１１および仮想サーバ１７１２の構成を示す。サーバ１０２の物理的な計算機資源を仮想化機構１７１１が仮想化し、複数の仮想サーバ１７１２を提供している。なお、仮想化機構１７１１としては、ＶＭＭ（Virtual Machine Monitor）やハイパーバイザで構成することができる。
【０１３０】
メモリ３０２には、物理的な計算機資源を仮想化するサーバ仮想化技術を提供する仮想化機構１７１１が配備され、仮想サーバ１７１２を提供する。また、仮想化機構１７１１は、制御用インタフェースとして仮想化機構管理用インタフェース１７２１を備えている。
【０１３１】
仮想化機構１７１１は、サーバ１０２（ブレードサーバでも良い）の物理的な計算機資源を仮想化し、仮想サーバ１７１２を構成する。仮想サーバ１７１２は、仮想ＣＰＵ１７３１、仮想メモリ１７３２、仮想ネットワークインタフェース１７３３、仮想ディスクインタフェース１７３４、仮想ＰＣＩｅｘインタフェース１７３５から構成されている。仮想メモリ１７３２には、ＯＳ１７４１が配備され仮想サーバ１７１２内の仮想デバイス群を管理している。また、ＯＳ１７４１上では、業務アプリケーション１７４２が実行されている。ＯＳ１７４１上で稼働する管理プログラム１７４３によって、障害検知やＯＳ電源制御、インベントリ管理などが提供されている。仮想化機構１７１１は、物理計算機資源と仮想計算機資源の対応付けを管理しており、物理計算機資源と仮想計算機資源の対応付けの生成や解除を行うことが出来る。また、どの仮想サーバ１７１２がサーバ１０２の計算機資源を、どれくらい割り当てられ、また、使用しているかといった構成情報および稼働履歴を保持している。なお、ＯＳ１７４１は、前記第１実施形態と同様に、所定の条件で仮想メモリ１７３２の内容を出力するメモリダンプ部１７４１０を有する。
【０１３２】
仮想化機構管理用インタフェース１７２１は、管理サーバ１０１と通信をするためのインタフェースであり、仮想化機構１７１１から管理サーバ１０１へ情報を通知したり、管理サーバ１０１から仮想化機構１７１１へ指示を送るときに使われる。また、ユーザが直接、使用することも可能である。
【０１３３】
仮想化機構１７１１には、Ｉ／Ｏ処理機構３２２が内包され、例えば、仮想ＰＣＩｅｘインタフェース１７３５と物理ＰＣＩｅｘインタフェース３０６の接続に関わる。仮想サーバ１７１２の障害発生時に、仮想メモリ１７３２のダンプを取得しつつ、他の仮想サーバ（同じ物理サーバ上または別の物理サーバ上）で業務を再開させるフェイルオーバを実施する。
【０１３４】
本第２実施形態では、サーバ１０２とストレージサブシステム１０５の接続について、前記第１実施形態に示したＰＣＩｅｘ−ＳＷ１０７を使用してもよいが、ＰＣＩｅｘ−ＳＷ１０７の内部で経路を切り替えることなく、仮想化機構１７１１で複数の仮想サーバ１７１２とＬＵの接続関係を切り替えることができる。
【０１３５】
このため、本第２実施形態では、サーバ１０２は、仮想サーバ１７１２が使用するストレージサブシステム１０５のＬＵの経路数に応じて複数のディスクインターフェース３０４−１、３０４−２を備えるものとする。以下の説明では、サーバ１０２のディスクインターフェース３０４−１、３０４−２がＦＣ−ＳＷ５１１（図１参照）を介してストレージサブシステム１０５のＬＵ２（及びＬＵ１）に接続された例を示す。
【０１３６】
図１８は、第２の実施形態の処理の概要を示すブロック図である。図１８において、仮想サーバ＃ＶＳ１（１７１２−１）が現用系サーバとして稼動し、仮想サーバ＃ＶＳ１に障害が発生したときに、仮想サーバ＃ＶＳ１のメモリダンプを収集しながら、予備系として機能する仮想サーバ＃ＶＳ２（１７１２−２）へ処理を引き継ぐ例を示す。
【０１３７】
現用系の仮想サーバ＃ＶＳ１は、前記第１実施形態の図５と同様に、ＬＵ１を主ボリュームとし、ＬＵ２副ボリュームとするミラーボリュームに対してアクセスする。
【０１３８】
仮想化機構１７１１は、仮想サーバ＃ＶＳ１の仮想メモリの監視と、ストレージサブシステム１０５のメモリダンプ用仮想領域５４２への仮想サーバ＃ＶＳ１からの書き込みの監視と、仮想サーバ＃ＶＳ１等のＯＳ１７４１のシステム領域（メモリダンプ用プログラム）の読み込みの監視と、ＯＳ１７４１のメモリダンプ用プログラムを呼び出すシステムコールの監視と、仮想サーバ＃ＶＳ１の障害発生の監視を行う。この他、仮想化機構１７１１は、予備系の仮想サーバ＃ＶＳ２への計算機資源の割り当てなどを管理する。なお、管理サーバ１０１は、仮想化機構１７１１の仮想化機構管理用インターフェース１７２１を介して指令を行う。
【０１３９】
仮想サーバ＃ＶＳ１に障害が発生すると、仮想化機構１７１１は管理サーバ１０１に対して障害通知を送信する（Ｓ１）。管理サーバ１０１は、仮想化機構１７１１に対して仮想サーバ＃ＶＳ１のＩ／Ｏ出力をバッファ領域４４３に格納する指令を送信する（Ｓ２）。
【０１４０】
仮想化機構１７１１は、現用系の仮想サーバ＃ＶＳ１の仮想ディスクインターフェース１７３４の接続先を、Ｉ／Ｏ処理機構３２２のバッファ領域４４３に切り替える（Ｓ３）。これにより、障害が発生した仮想サーバ＃ＶＳ１は、仮想メモリ１７３２の内容をＩ／Ｏ処理機構３２２のバッファ領域４４３に格納する。
【０１４１】
次に、管理サーバ１０１は、ストレージサブシステム１０５に対して、仮想サーバ＃ＶＳ１に接続されているＬＵ１、ＬＵ２をスプリットする指令を送信する（Ｓ３）。
【０１４２】
次に、管理サーバ１０１は、仮想化機構１７１１に対して、バッファ領域４４３の内容を副ボリュームであったＬＵ１に書き込むよう経路を切り替える指令を送信する（Ｓ４）。仮想化機構１７１１は、バッファ領域４４３の接続先をＬＵ１に接続されたディスクインターフェース３０４−２に切り替える。これにより、仮想化機構１７１１はバッファ領域４４３の内容をＬＵ１に書き込む。
【０１４３】
管理サーバ１０１は、仮想化機構１７１１に対して予備系の仮想サーバ＃ＶＳ２を割り当てて、ＬＵ２を仮想サーバ＃ＶＳ２に切り替える指令を送信する（Ｓ６）。仮想化機構１７１１は、管理サーバ１０１からの指令に基づいて仮想サーバ＃ＶＳ２に計算機資源を割り当て、仮想ディスクインターフェース１７３４の接続先をＬＵ１に設定されたディスクインターフェース３０４−１に設定する。
【０１４４】
管理サーバ１０１は、仮想化機構１７１１に対して予備系の仮想サーバ＃ＶＳ２を起動する指令を送信する（Ｓ７）。仮想化機構１７１１は、計算機資源とディスクインターフェース３０４−１を割り当てた仮想サーバ＃ＶＳ２を起動して、ＬＵ２のＯＳ１７４１及び業務アプリケーション１７４２を実行することで、現用系の仮想サーバ＃ＶＳ１の処理を引き継ぐことができる。
【０１４５】
以上のように、現用系の仮想サーバ＃ＶＳ１に障害が発生した場合にも、ＯＳの種類にかかわらず、メモリダンプとフェイルオーバを並列的に行って、系切替を高速化することができる。
【０１４６】
＜第３実施形態＞
図１９は、第３の実施形態を示し、ＰＣＩｅｘ−ＳＷ１０７を主体とするフェイルオーバの概略を示すブロック図である。第３の実施形態では、ストレージサブシステム１０５に、メモリダンプ用仮想領域５４２への書き込みを監視する管理及び監視インターフェース６００を配備して、現用系サーバ＃１（１０２）がメモリダンプを開始したことを契機にして、フェイルオーバとメモリダンプのバッファリングを実行するものである。その他の構成は、前記第１実施形態と同様である。
【０１４７】
管理及び監視インターフェース６００は、現用系サーバ＃１がアクセスする主ボリュームとしてのＬＵ１について、メモリダンプ用仮想領域５４２への書き込みを監視する。メモリダンプ用仮想領域５４２への書き込みが開始されると、管理及び監視インターフェース６００は、管理サーバ１０１に現用系サーバ＃１のメモリダンプが発生したことを通知する。
【０１４８】
管理サーバ１０１は、メモリダンプの発生を検知すると、前記第１実施形態と同様にして、現用系サーバ＃１から予備系サーバ＃Ｓ１へのフェイルオーバと、現用系サーバ＃１のメモリダンプを並列的に実行する。
【０１４９】
ここで、管理及び監視インターフェース６００は、メモリダンプ用仮想領域５４２への書き込みを監視し、また、ＯＳ３１１のシステム領域（メモリダンプ用プログラム）の著見込みを監視する。
【０１５０】
メモリダンプ用仮想領域５４２への書き込みの検知は、管理及び監視インターフェース６００が、ストレージサブシステム１０５内の特定の領域（ブロック）からメモリダンプ用の書き込みの有無を検知する。メモリダンプ用仮想領域５４２の位置を特定するために、前以てメモリダンプ用の特定ファイルにサンプルデータを書き込む、または、疑似障害を用いてプログラムを起動しメモリダンプ用のデータを書き込ませる、などして領域を特定しても良い。
【０１５１】
なお、管理及び監視インターフェースは、ストレージサブシステム１０５の他に、図示の６０１、６０２のようにＦＣ−ＳＷ５１１またはアダプタラック４６１に設けることができる。この場合、管理及び監視インターフェース６０１、６０２はＩ／Ｏ出力をスヌーフィングするなどで監視し、宛先と内容からメモリダンプの開始を検知する。
【０１５２】
以上のように、第１〜第３の実施形態によれば、現用系サーバ＃１のメモリダンプを一時的に蓄積するバッファ領域４４３を備えたＩ／Ｏ処理機構３２２と、メモリダンプの経路をミラーボリュームの主ボリューム（ＬＵ）から副ボリューム（ＬＵ２）へ切り替える経路切替部としてＰＣＩｅｘ−ＳＷ１０７または仮想化機構１７１１に備える。そして、管理サーバ１０１がミラーボリュームをスプリットした後に、予備系サーバ＃Ｓ１を主ボリューム（ＬＵ１）で起動させることで、系切替とメモリダンプを並列的に実行する。これにより、メモリダンプの完了を待たずに系切替を開始できるので、ＯＳの種類にかかわらずメモリダンプを確実に収集しながらも系切替の高速化を図ることができる。
【０１５３】
なお、上記各実施形態では、ストレージサブシステム１０５のＬＵでミラーボリュームを構成した例を示したが、物理的なディスク装置でミラーボリュームを構成してもよい。
【０１５４】
また、上記各実施形態では、ＦＣ−ＳＷ５１１とＮＷ−ＳＷ１０３、１０４でＳＡＮとＩＰネットワークを分離する例を示したが、ＩＰ−ＳＡＮ等を用いてひとつのネットワークとしてもよい。
【産業上の利用可能性】
【０１５５】
以上のように、本発明はコールドスタンバイを用いて系切替を行う計算機システムやＩ／Ｏスイッチあるいは仮想化機構に適用することができる。
【符号の説明】
【０１５６】
１０１管理サーバ
１０２サーバ
１０５ストレージサブシステム
１０７ＰＣＩｅｘ−ＳＷ
１１０制御部
２１０障害検出部
２１１Ｉ／Ｏバッファリング指示部
２１２ストレージ制御部
２１３経路切替部
２１４Ｉ／Ｏバッファ書き出し指示部
２１５Ｎ＋Ｍ切替指示部
２２１サーバ管理テーブル
２２２ＬＵマッピング管理テーブル
２２３ＬＵ管理テーブル
２２４業務及びＳＬＡ管理テーブル
３２２Ｉ／Ｏ処理機構
４０１Ｉ／Ｏバッファリング制御部
４１１Ｉ／Ｏバッファリング管理テーブル
４４１制御部

【特許請求の範囲】
【請求項１】
プロセッサとメモリ及びＩ／Ｏインターフェースを備える第１の計算機と、
プロセッサとメモリ及びＩ／Ｏインターフェースを備える第２の計算機と、
前記第１の計算機と第２の計算機からアクセス可能なストレージ装置と、
ネットワークを介して前記第１の計算機と第２の計算機に接続されて、所定のタイミングで前記第１の計算機を、前記第２の計算機に引き継ぐ系切替を行う管理計算機と、を備え、前記第１の計算機が、所定の条件となったときに前記メモリの内容を前記ストレージ装置に書き込むＩ／Ｏ出力を送信する計算機システムにおいて、
前記ストレージ装置は、
前記第１の計算機がアクセスする第１の記憶部と、前記第１の記憶部のミラーリングを行う第２の記憶部と、を有し、
前記第１の計算機及び第２の計算機と前記ストレージ装置との間で、前記Ｉ／Ｏ出力を一時的に格納するバッファと、前記バッファの内容を前記ストレージ装置に出力する制御部と、を備えたＩ／Ｏ処理部と、
前記Ｉ／Ｏ処理部と前記第１の計算機及び第２の計算機が前記ストレージ装置をアクセスする経路を切り替えるスイッチ部と、を備え、
前記管理計算機は、
前記所定のタイミングとなったときに、前記第１の計算機の前記Ｉ／Ｏ出力を前記バッファへ格納する指令を前記前記Ｉ／Ｏ処理部に送信するバッファリング指示部と、
前記第１の記憶部と第２の記憶部を分離する指令を前記ストレージ装置に送信するストレージ制御部と、
前記バッファと前記第２の記憶部とを接続し、前記第２の計算機と前記第１の記憶部とを接続する指令を前記スイッチ部に送信する経路切替部と、
前記バッファの内容を前記第２の記憶部に出力する指令を前記Ｉ／Ｏ処理部へ送信する書き出し指示部と、
前記第２の計算機を前記第１の記憶部から起動させる系切替部と、を有することを特徴とする計算機システム。
【請求項２】
請求項１に記載の計算機システムであって、
前記管理計算機は、
前記第１の計算機に障害が発生したことを検知する障害検知部をさらに有し、
前記障害を検知したときを前記所定のタイミングとして前記系切替を行うことを特徴とする計算機システム。
【請求項３】
請求項１に記載の計算機システムであって、
前記第１の計算機が前記Ｉ／Ｏ出力を出力したことを検知する監視部をさらに有し、
前記管理計算機は、
前記監視部が、前記第１の計算機が前記Ｉ／Ｏ出力を検知したときを、前記所定のタイミングとして前記系切替を行うことを特徴とする計算機システム。
【請求項４】
請求項１に記載の計算機システムであって、
前記ストレージ制御部は、
前記第１の記憶部へ前記Ｉ／Ｏ出力が完了した後に、当該第１の記憶部を予め設定した保守用のグループへ移動させることを特徴とする計算機システム。
【請求項５】
請求項１に記載の計算機システムであって、
前記ストレージ制御部は、
前記第２の計算機がアクセスする前記第２の記憶部のミラーリングを行う第３の記憶部を設定することを特徴とする計算機システム。
【請求項６】
請求項１に記載の計算機システムであって、
前記スイッチ部は、
前記第１の計算機のＩ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、前記第２の計算機のＩ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、を制御するＩ／Ｏスイッチであることを特徴とする計算機システム。
【請求項７】
請求項１に記載の計算機システムであって、
物理計算機を仮想化する仮想化部をさらに有し、
前記仮想化部は、
前記第１の計算機として、仮想プロセッサと仮想メモリ及び仮想Ｉ／Ｏインターフェースとを備えた第１の仮想計算機を割り当て、
前記第２の計算機として、仮想プロセッサと仮想メモリ及び仮想Ｉ／Ｏインターフェースとを備えた第２の仮想計算機を割り当て、
前記スイッチ部として、前記第１の仮想計算機のＩ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、前記第２の仮想計算機の仮想Ｉ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、を制御し、
前記第１の計算機は、所定の条件となったときに前記仮想メモリの内容を出力するメモリダンプ部を有し、
前記メモリダンプ部は、
前記所定の条件となったときに前記仮想メモリの内容を前記ストレージ装置に書き込むＩ／Ｏ出力を前記仮想Ｉ／Ｏインターフェースに送信することを特徴とする計算機システム。
【請求項８】
請求項１に記載の計算機システムであって、
前記経路切替部は、
前記第１の計算機のＩ／Ｏインターフェースと前記バッファとを接続し、前記バッファと前記第２の記憶部とを接続する指令を前記スイッチ部へ送信し、
前記第２の計算機のＩ／Ｏインターフェースと前記第１の記憶部とを接続する指令を前記スイッチ部に送信することを特徴とする計算機システム。
【請求項９】
プロセッサとメモリ及びＩ／Ｏインターフェースを備える第１の計算機と、プロセッサとメモリ及びＩ／Ｏインターフェースを備える第２の計算機と、前記第１の計算機と第２の計算機からアクセス可能なストレージ装置と、ネットワークを介して前記第１の計算機と第２の計算機に接続されて、所定のタイミングで前記第１の計算機を前記第２の計算機に引き継ぐ系切替を行う管理計算機と、を備えて、前記第１の計算機が、所定の条件となったときに前記メモリの内容を前記ストレージ装置に書き込むＩ／Ｏ出力を送信する計算機システムの系切替制御方法において、
前記計算機システムは、
前記第１の計算機及び第２の計算機と前記ストレージ装置との間で、前記Ｉ／Ｏ出力を一時的に格納するバッファと、前記バッファの内容を前記ストレージ装置に出力する制御部と、を備えたＩ／Ｏ処理部と、
前記Ｉ／Ｏ処理部と前記第１の計算機及び第２の計算機が前記ストレージ装置をアクセスする経路を切り替えるスイッチ部と、を備え、
前記系切替制御方法は、
前記管理計算機が、前記第１の計算機がアクセスする第１の記憶部と、前記第１の記憶部のミラーリングを行う第２の記憶部とを前記ストレージ装置に設定する第１のステップと、
前記管理計算機が、前記所定のタイミングとなったときに、前記第１の計算機の前記Ｉ／Ｏ出力を前記バッファへ格納する指令を前記前記Ｉ／Ｏ処理部に送信する第２のステップと、
前記管理計算機が、前記第１の記憶部と第２の記憶部を分離する指令を前記ストレージ装置に送信する第３のステップと、
前記管理計算機が、前記バッファと前記第２の記憶部とを接続し、前記第２の計算機と前記第１の記憶部とを接続する指令を前記スイッチ部に送信する第４のステップと、
前記管理計算機が、前記バッファの内容を前記第２の記憶部に出力する指令を前記Ｉ／Ｏ処理部へ送信する第５のステップと、
前記管理計算機が、前記第２の計算機を前記第１の記憶部から起動させる第６のステップと、を含むことを特徴とする計算機システムの系切替制御方法。
【請求項１０】
請求項９に記載の計算機システムの系切替制御方法であって、
前記第２のステップは、
前記管理計算機が、前記第１の計算機に障害が発生したことを検知するステップをさらに有し、
前記障害を検知したときを前記所定のタイミングとして前記系切替を行うことを特徴とする計算機システムの系切替制御方法。
【請求項１１】
請求項９に記載の計算機システムの系切替制御方法であって、
前記計算機システムは、
前記第１の計算機が前記Ｉ／Ｏ出力を出力したことを検知する監視部をさらに有し、
前記第２のステップは、
前記管理計算機が、前記第１の計算機が前記Ｉ／Ｏ出力を前記監視部で検知したときを、前記所定のタイミングとして前記系切替を行うことを特徴とする計算機システムの系切替制御方法。
【請求項１２】
請求項９に記載の計算機システムの系切替制御方法であって、
前記管理計算機は、前記第１の記憶部へ前記Ｉ／Ｏ出力が完了した後に、当該第１の記憶部を予め設定した保守用のグループへ移動させる指令を送信する第７のステップを、さらに含むことを特徴とする計算機システムの系切替制御方法。
【請求項１３】
請求項９に記載の計算機システムの系切替制御方法であって、
前記第６のステップは、
前記管理計算機が、前記第２の計算機がアクセスする前記第２の記憶部のミラーリングを行う第３の記憶部を設定する指令を前記ストレージ装置に送信するステップを含むことを特徴とする計算機システムの系切替制御方法。
【請求項１４】
請求項９に記載の計算機システムの系切替制御方法であって、
前記スイッチ部は、
前記第１の計算機のＩ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、前記第２の計算機のＩ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、を制御するＩ／Ｏスイッチであることを特徴とする計算機システムの系切替制御方法。
【請求項１５】
請求項９に記載の計算機システムの系切替制御方法であって、
物理計算機を仮想化する仮想化部をさらに有し、
前記仮想化部は、
前記第１の計算機として、仮想プロセッサと仮想メモリ及び仮想Ｉ／Ｏインターフェースとを備えた第１の仮想計算機を割り当て、
前記第２の計算機として、仮想プロセッサと仮想メモリ及び仮想Ｉ／Ｏインターフェースとを備えた第２の仮想計算機を割り当て、
前記スイッチ部として、前記第１の仮想計算機のＩ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、前記第２の仮想計算機の仮想Ｉ／Ｏインターフェースと前記ストレージ装置とを接続するＩ／Ｏデバイスの経路と、を制御し、
前記第１の計算機は、所定の条件となったときに前記仮想メモリの内容を出力するメモリダンプ部を有し、
前記メモリダンプ部は、
前記所定の条件となったときに前記仮想メモリの内容を前記ストレージ装置に書き込むＩ／Ｏ出力を前記仮想Ｉ／Ｏインターフェースに送信することを特徴とする計算機システムの系切替制御方法。
【請求項１６】
請求項９に記載の計算機システムの系切替制御方法であって、
前第４のステップは、
前記管理計算機が、前記第１の計算機のＩ／Ｏインターフェースと前記バッファとを接続し、前記バッファと前記第２の記憶部とを接続する指令を前記スイッチ部へ送信し、
前記管理計算機が、前記第２の計算機のＩ／Ｏインターフェースと前記第１の記憶部とを接続する指令を前記スイッチ部に送信することを特徴とする計算機システムの系切替制御方法。

【図１】