説明

プロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体

【課題】システム内で稼動するプロセスの優先度を判断し、プロセス障害復旧の1手段であるプロセスの再起動、プロセスが稼動しているOSの再起動を自動的に行うことが可能なプロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体を提供する。
【解決手段】ネットワークを介して監視対象となるサーバ上で稼動するプロセスを監視し、プロセスに生じた障害を検知するプロセス障害検知部と、プロセス障害検知部によって障害が生じたプロセスが検知された場合に、障害が生じたプロセスを再起動した回数に基づいて、プロセスを再起動させるかまたはプロセスを稼動しているサーバを再起動させるかを判定し、判定した結果に従ってプロセスまたはサーバを再起動させ、障害を復旧させる障害判定復旧部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、OS(Operating System)上で稼動するプロセスに異常が発生した場合に、プロセスやOSの再起動を行うプロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体に関するものである。
【背景技術】
【0002】
従来、OS上で稼動しているプロセスやそのプロセスの子プロセスを監視することによってアプリケーションの実行を制御するものがある。例えば、複数のアプリケーションが起動中であっても、それらのプロセスの実行を監視することによって、複数のアプリケーションの同時実行によるアプリケーションの破損の危険性を最小限にしている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特表2003−501720号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
一般的に、プロセスの障害が発生した場合、プロセス障害を検知する技術は確立している。検知後の復旧手段としては、人が介在してプロセスを再起動したり、あるいはOSを手動で再起動する事が多く、自動で再起動を行う手段が確立されていない状況である。従来の技術では、アプリケーション内で実行される子プロセスの状態を効率的に監視する手段は存在したが、複数アプリケーションで動作するシステムにおいて、各プロセスの優先度を判断し、再起動の実施を人を介在せず自動で行うことは困難であった。
【0005】
本発明は、上記に鑑みてなされたものであって、システム内で稼動するプロセスの優先度を判断し、プロセス障害復旧の1手段であるプロセスの再起動、プロセスが稼動しているOSの再起動を自動的に行うことが可能なプロセス障害判定復旧システム、プロセス障害判定復旧装置、およびプロセス障害判定復旧プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した目的を達成するために、本発明にかかるプロセス障害判定復旧装置は、ネットワークを介して監視対象となるサーバ上で稼動するプロセスを監視し、前記プロセスに生じた障害を検知するプロセス障害検知部と、前記プロセス障害検知部によって障害が生じたプロセスが検知された場合に、障害が生じた前記プロセスを再起動した回数に基づいて、前記プロセスを再起動させるかまたは前記プロセスを稼動している前記サーバを再起動させるかを判定し、判定した結果に従って前記プロセスまたは前記サーバを再起動させ、前記障害を復旧させる障害判定復旧部と、を備えることを特徴とする。
【0007】
また、本発明は、上記プロセス障害判定復旧装置で行われるプロセス障害判定復旧方法、プロセス障害判定復旧プログラム、またはこれを格納した記録媒体である。
【発明の効果】
【0008】
本発明によれば、システム内で稼動するプロセスの優先度を判断し、プロセス障害復旧の1手段であるプロセスの再起動、プロセスが稼動しているOSの再起動を自動的に行うことが可能なプロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体を提供できる。
【図面の簡単な説明】
【0009】
【図1】本実施の形態におけるプロセス障害判定復旧システムの構成を示す図である。
【図2】プロセス障害検知DBが記憶するデータの例を示す図である。
【図3】監視対象プロセスDBが記憶するデータの例を示す図である。
【図4】冗長サーバDBが記憶するデータの例を示す図である。
【図5】プロセス再起動処理部が行うプロセス再起動処理の処理手順を示すフローチャートである。
【図6】サーバ再起動処理部が行うサーバ再起動処理の処理手順を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下に添付図面を参照して、この発明にかかるプロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体の実施の形態を詳細に説明する。
【0011】
図1は、本実施の形態におけるプロセス障害判定復旧システム1000の構成を示す図である。図1に示すように、プロセス障害判定復旧システム1000は、監視対象となるプロセスが稼動されているプロセス監視対象サーバ100、プロセス監視対象サーバ110、プロセス監視対象サーバ120と、プロセス障害判定復旧サーバ200と、ネットワーク300とを含んで構成されている。なお、ネットワーク300は、例えば、LAN(Local Area Network)やWAN(Wide Area Network)等の一般的な通信回線網である。まず、プロセス監視対象サーバ100について説明する。
【0012】
図1に示すように、プロセス監視対象サーバ100は、OS(Operating System)1010を有し、そのOS1010上で、複数のプロセス1001〜1003が稼動している。本実施の形態においては特に説明を行わないが、OS1010は、プロセス監視対象サーバ100が有する不図示のRAM(Random Access Memory)等のメモリにロードされているものとする。プロセス監視対象サーバ110およびプロセス監視対象サーバ120は、プロセス監視対象サーバ100と同様に、複数のプロセス1101〜1103あるいはプロセス1201〜1203が稼動した状態となっている。
【0013】
プロセス障害判定復旧サーバ200は、OS203を有し、そのOS203上で、プロセス障害検知システム201とプロセス障害判定復旧システム202とが稼動している。OS203は、上述したOS1010と同様に、プロセス障害判定復旧サーバ200が有する不図示のRAM等のメモリにロードされている。また、プロセス障害判定復旧サーバ200が有する各システムは、後述するプロセス障害検知部、プロセス再起動処理部、およびサーバ再起動処理部等の各部の機能を実現するためのプログラムにより実行される。
【0014】
これらのプログラムは、例えば、上述した各部を含むモジュール構成となっており、実際のハードウェアとしては、CPU(Central Processing Unit)等の制御部がHDD(Hard Disk Drive)等の記録装置からこれらのプログラムを読み出して実行することにより、上記各部が主記憶装置上にロードされ、プロセス障害検知部、プロセス再起動処理部、およびサーバ再起動処理部等の各部が主記憶装置上に生成されるようになっている。
【0015】
なお、上述したプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記録媒体に記録されて提供することも可能である。さらに、これらのプログラムを、ネットワーク経由でダウンロードさせて提供または配布するように構成してもよい。
【0016】
プロセス障害検知システム201は、上述したプロセス監視対象サーバ100等で稼動するプロセスを監視し、その障害を検知するシステムである。プロセス障害検知システム201の具体的な処理については後述するが、プロセス障害検知システム201は、プロセス障害判定復旧システム1000において、プロセス障害検知部として機能する。
【0017】
また、プロセス障害検知システム201は、プロセス監視対象サーバ100等のそれぞれで稼動しているプロセスの稼働状況を記憶するプロセス障害検知DB2011を有している。プロセス障害検知DB2011は、例えば、HDD等の記憶装置に記憶されているものとする。
【0018】
図2は、プロセス障害検知DB2011が記憶するデータの例を示す図である。図2に示すように、プロセス障害検知DB2011は、プロセス監視対象サーバ100等を示すサーバ名と、プロセス監視対象サーバ100等で稼動しているプロセスを示すプロセス名と、そのプロセスの稼働状況を示すプロセス稼働状況とが対応付けて記憶されている。
【0019】
図2では、例えば、サーバ名「Server001」であるプロセス監視対象サーバ100では、「Process001」(すなわち、プロセス1001)と、「Process002」(すなわち、プロセス1002)と、「Process003」(すなわち、プロセス1003)とが稼働中(プロセス稼働状況「0」)であることを示している。
【0020】
また、サーバ名「Server002」であるプロセス監視対象サーバ110では、「Process002」(すなわち、プロセス1102)と、「Process003」(すなわち、プロセス1103)とは稼働中であるが、「Process001」(すなわち、プロセス1101)とは不稼働(プロセス稼働状況「1」)であることを示している。なお、プロセス稼働状況が示す値は、それぞれのプロセス監視対象サーバから送信されるプロセスが稼働中であるか否かを示す稼動情報に従って更新されるものとする。続いて、図1に戻り、プロセス障害判定復旧システム202について説明する。
【0021】
プロセス障害判定復旧システム202は、プロセス障害検知システム201が、それぞれのプロセス監視対象サーバにおいて稼動しているプロセスの障害を検知した場合に、その障害をプロセスの再起動またはOSの再起動により復旧させるか否かを判定し、その判定結果に従ってプロセスの障害を復旧させるシステムである。プロセス障害判定復旧システム202の具体的な処理については後述するが、プロセス障害判定復旧システム202は、プロセス障害判定復旧システム1000において、プロセス再起動処理部2021およびサーバ再起動処理部2022として機能する。
【0022】
また、プロセス障害判定復旧システム202は、プロセス監視対象サーバ100等のそれぞれで稼動しているプロセスをどのようにして復旧させるかを判断するための基準となる情報を記憶する監視対象プロセスDB2023と、プロセスの障害を復旧させるためにプロセス監視対象サーバ100等を再起動する際に、そのプロセス監視対象サーバが冗長構成を満たしていることを判断するための基準となる情報を記憶する冗長サーバDB2024とを有している。これらの各DBは、上述したプロセス障害検知DB2011と同様に、例えば、HDD等の記憶装置に記憶されているものとする。
【0023】
図3は、監視対象プロセスDB2023が記憶するデータの例を示す図である。図3に示すように、監視対象プロセスDB2023は、プロセス監視対象サーバ100等を示すサーバ名と、プロセス監視対象サーバ100等で稼動しているプロセスを示すプロセス名と、そのプロセスを再起動する場合の最大回数を示すプロセス再起動閾値と、そのプロセスの再起動を行った回数を示すプロセス再起動実施回数と、そのプロセス監視対象サーバで稼動しているプロセスの中での優先順位を示すプロセス優先度とが対応付けて記憶されている。
【0024】
図3では、例えば、サーバ名「Server001」であるプロセス監視対象サーバ100の「Process001」(すなわち、プロセス1001)は、再起動する回数の最大値が5回であり(すなわち、5回まではプロセスの再起動をする)、現時点では再起動の回数はゼロ回であることを示している。また、そのプロセス1001は、優先度が「40」であり、他のプロセス(プロセス1002およびプロセス1003)に比べて優先度が高いことを示している。このように、プロセス優先度は、その数値が小さいほど、そのプロセスを稼動させるための優先度が高いことを示している。なお、後述するように、プロセス再起動実施回数がプロセス再起動閾値を超えている場合には、プロセスの再起動だけでは障害を解消できないと判断し、サーバの再起動を行っている。続いて、冗長サーバDB2024について説明する。
【0025】
図4は、冗長サーバDB2024が記憶するデータの例を示す図である。図4に示すように、冗長サーバDB2024は、プロセス監視対象サーバ100等を示すサーバ名と、プロセス監視対象サーバ100等で稼動しているプロセスを示すプロセス名と、そのプロセスが稼動しているプロセス監視対象サーバの必要な数を示す最低稼働サーバ閾値と、そのプロセスが稼動しているプロセス監視対象サーバの数を示す稼動サーバ数とが対応付けて記憶されている。
【0026】
図4では、例えば、プロセス名「Process001」のプロセス(すなわち、プロセス1001)が稼動しているプロセス監視対象サーバは、少なくとも2台必要であることを示している。図4に示した例では、「Process001」は、プロセス監視対象サーバ100およびプロセス監視対象サーバ110の2台で稼動しており、その要件を満たしていることを示している。続いて、プロセス障害判定復旧システム1000で行われる処理について説明する。
【0027】
図5は、プロセス再起動処理部2021が行うプロセス再起動処理の処理手順を示すフローチャートである。
【0028】
図5に示すように、まず、プロセス再起動処理部2021は、プロセス障害検知DB2011にアクセスし、プロセス監視対象サーバ100等で稼動しているプロセスの稼動状況を判定する(ステップS501)。具体的には、プロセス再起動処理部2021は、プロセス障害検知DB2011のプロセス稼働状況が「1」となっているプロセスがあるか否かを判定する。
【0029】
そして、プロセス再起動処理部2021は、プロセス監視対象サーバ100等で稼動しているプロセスの稼動状況が「1」となっているプロセスがあると判定した場合(ステップS501;Yes)、プロセスの稼動状況が「1」となっているプロセスに対応するサーバ名とプロセス名とを取得する(ステップS502)。一方、プロセス再起動処理部2021は、プロセス監視対象サーバ100等で稼動しているプロセスの稼動状況が「1」となっているプロセスがないと判定した場合(ステップS501;No)、何も処理をせず、そのまま監視を続ける。
【0030】
例えば、図2において、サーバ名「Server001」およびプロセス名「Process001」のレコードは、プロセス稼働状況「0」である為、プロセス再起動処理部2021は、何も処理を実施しない。一方、サーバ名「Server002」およびプロセス名「Process001」のレコードは、プロセス稼動状態に不稼動を表す「1」が設定されている為、次のステップS502に進む。
【0031】
そして、プロセス再起動処理部2021は、ステップS501において取得したサーバ名とプロセス名とをキーとして監視対象プロセスDB2023にアクセスし、そのプロセスについて、プロセス再起動実施回数がプロセス再起動閾値を超えているか否かを判定する(ステップS503)。
【0032】
プロセス再起動処理部2021は、プロセス再起動実施回数がプロセス再起動閾値を超えていないと判定した場合(ステップS503;Yes)、プロセスを再起動するコマンドをそのプロセスが稼動しているプロセス監視対象サーバに対して発行し(ステップS504)、監視対象プロセスDB2023に記憶されているプロセス再起動実施回数を、そのプロセス再起動実施回数に1を加えた値に更新する(ステップS505)。
【0033】
例えば、図3において、サーバ名「Server001」およびプロセス名「Process001」のレコードの場合、プロセス再起動閾値として「5」が設定されているところ、プロセス再起動実施回数は「0」であり、プロセス再起動実施回数がプロセス再起動閾値を超えていない。したがって、プロセス再起動処理部2021は、ステップS504において、プロセス再起動コマンドを監視対象サーバ「Server001」に対して発行する処理を実行する。その後、プロセス再起動処理部2021は、ステップS505において、現在のプロセス再起動実施回数「0」に1を加えた数「1」をプロセス再起動実施回数に格納する。そして、このステップS505の処理が終了すると、ステップS501に戻り、例えば、プロセス障害判定復旧サーバ200の電源がOFF状態となるまで、以降の処理を繰り返す。
【0034】
ステップS503において、プロセス再起動処理部2021は、プロセス再起動実施回数がプロセス再起動閾値以上であると判定した場合(ステップS503;No)、そのプロセスの再起動実施回数を「0」に設定する(ステップS506)。このステップS506の処理が終了すると、プロセス再起動処理部2021は、サーバ再起動処理部2022を呼び出し、サーバ再起動処理部2022は、サーバ再起動処理(ステップS507)を行う。
【0035】
例えば、図3において、サーバ名「Server002」およびプロセス名「Process002」のレコードの場合、プロセス再起動閾値として「5」が設定されているところ、プロセス再起動実施回数は「5」であり、プロセス再起動実施回数がプロセス再起動閾値以上となっている。したがって、プロセス再起動処理部2021は、ステップS506において、そのプロセス再起動実施回数を「0」に更新する処理を実行し、サーバ再起動処理部2022を呼び出し、サーバ再起動処理の実行が開始される。
【0036】
図6は、サーバ再起動処理部2022が行うサーバ再起動処理の処理手順を示すフローチャートである。
【0037】
図6に示すように、まず、サーバ再起動処理部2022は、図5に示したプロセス再起動処理において処理対象となっていたプロセス障害となっているサーバ名およびプロセス名を引き継ぎ、これらをキーとして冗長サーバDB2024にアクセスし、設定されている稼動サーバ数から1を減じた値を格納する(ステップS601)。
【0038】
例えば、図4において、サーバ名「Server001」およびプロセス名「Process001」のレコードの場合、稼動サーバ数に「2」が設定されているところ、サーバ再起動処理部2022は、これから1を減じた「1」に更新する処理を実行する。
【0039】
次に、サーバ再起動処理部2022は、サーバ名およびプロセス名をキーとして監視対象プロセスDB2023にアクセスし、そのサーバ内で優先順位の高いプロセスがあるか否かを判定し(ステップS602)、そのサーバ内でそのプロセスのプロセス優先度の値よりも値が小さいプロセスがないと判定した場合(ステップS602;Yes)、優先順位の高いプロセスが稼動していないものと判断する。一方、サーバ再起動処理部2022は、そのサーバ内でそのプロセスのプロセス優先度の値よりも値が小さいプロセスがあったと判定した場合(ステップS602;No)、何もせずにそのまま処理を終了させる。
【0040】
例えば、図3において、サーバ名「Server001」およびプロセス名「Process002」のレコードの場合、プロセス優先度に「50」が設定されているところ、そのサーバ名「Server001」と同じサーバでは、プロセス「Process001」および「Process003」が稼動している。ここで、これらのプロセス優先度は、それぞれ「40」および「60」が設定されており、「Process001」のプロセス優先度は、「Process002」のプロセス優先度「50」よりも小さい値となっている。従って、サーバ再起動処理部2022は、優先順位が高いプロセスが稼動しているものと判断し、何もせずに処理を終了させる。
【0041】
サーバ再起動処理部2022は、ステップS602において、優先順位の高いプロセスがなかったと判断した場合(ステップS602;No)、最低限稼動すべきプロセス監視対象サーバの数を満たしているか否か判定するため、ステップS603に進む。
【0042】
例えば、図3において、サーバ名「Server002」およびプロセス名「Process001」のレコードの場合、プロセス優先度に「40」が設定されているところ、そのサーバ名「Server002」と同じサーバでは、プロセス「Process002」および「Process003」が稼動している。ここで、これらのプロセス優先度は、それぞれ「50」および「60」が設定されており、「Process001」のプロセス優先度は、「Process002」のプロセス優先度「50」および「Process003」のプロセス優先度「60」よりも小さい値となっている。従って、サーバ再起動処理部2022は、優先順位が高いプロセスは稼動していないものと判断し、ステップS603に進む。
【0043】
そして、ステップS603において、サーバ再起動処理部2022は、そのサーバ名およびプロセス名をキーとして冗長サーバDB2024にアクセスし、稼動サーバ数が最低稼動サーバ閾値以下であるか否かを判定し(ステップS603)、稼動サーバ数が最低稼動サーバ閾値以下であると判定した場合(ステップS603;No)、何もせずに処理を終了させる。
【0044】
例えば、図4において、サーバ名「Server001」およびプロセス名「Process001」のレコードの場合、稼動サーバ数に「2」が設定され、最低稼動サーバ閾値に「2」が設定されているところ、稼動サーバ数が最低稼動サーバ閾値以下となっているため、サーバ再起動処理部2022は、最低限稼動すべきプロセス監視対象サーバの数を満たしていないと判定し、何もせず処理を終了する。
【0045】
一方、サーバ再起動処理部2022は、稼動サーバ数が最低稼動サーバ閾値より大きいと判定した場合(ステップS603;Yes)、その監視対象サーバに対してOS再起動コマンドを送信し(ステップS604)、現在設定されている冗長サーバDB2024の稼動サーバ数を、その稼動サーバ数に「1」を加えた数に更新し(ステップS605)、処理を終了させる。
【0046】
例えば、図4において、サーバ名「Server001」およびプロセス名「Process002」のレコードの場合、稼動サーバ数に「2」が設定され、最低稼動サーバ閾値に「1」が設定されているところ、稼動サーバ数が最低稼動サーバ閾値より大きいため、サーバ再起動処理部2022は、監視対象サーバであるServer001」に対して、OS再起動コマンドを送信する処理を実行し、冗長サーバDB2024の稼動サーバ数に、現在の稼動サーバ数「2」に「1」を加えた「3」に更新する処理を実行し、処理を終了させる。
【0047】
そして、ステップS605の処理が終了すると、図6に示したサーバ再起動処理の全ての処理が終了し、図5に示したプロセス再起動処理に戻り、プロセス再起動処理では、そのままステップS501に戻って以降の処理を繰り返すこととなる。
【0048】
このように、本実施の形態におけるプロセス障害判定復旧システム1000では、プロセス障害が発生した際、プロセス再起動実施回数を判定し、プロセスの再起動で復旧するかを自動で判定しプロセスの再起動を実施しシステム正常稼動に自動復旧させ、プロセス再起動実施回数が閾値以上の場合には、プロセスの再起動では復旧が不可能と判断し、プロセスが稼動するOSを自動再起動を実施すると判断し、OSを再起動させる際には、同一サーバ内でプロセス障害となったプロセスより優先度の高いプロセスが無いか、また障害プロセスと同一プロセスが稼動する別サーバが、システム全体の稼動維持の為に必要稼動サーバ数以下になっていないかを自動で判断した上でOSの再起動を行っている。
【0049】
したがって、プロセス障害時に、人が判断して復旧していた部分(例えば、プロセスの再起動により対応すべきか、OSの再起動により対応すべきか等の判断)を自動的に復旧できる手段を提供することができる。また、手動での作業が無くなる事により人為的ミスの発生を排除でき、その結果として、利用するユーザに対しては、障害時のシステムのダウンタイムの短縮を提供することができる。さらには、システム運用者に対しては、システムの自立運用を提供することができるようになる。
【0050】
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。例えば、プロセス障害検知システム201とプロセス障害判定復旧システム202とを1つのシステムとして構成する等、実施の形態に示される全構成要素からいくつかの構成要素を変更したり、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。
【符号の説明】
【0051】
1000 プロセス障害判定復旧システム
100、110、120 プロセス監視対象サーバ
1001〜1003、1101〜1103、1201〜1203 プロセス
1010、1110、1210 OS(監視対象サーバ)
200 プロセス障害判定復旧サーバ
203 OS(プロセス障害判定復旧サーバ)
201 プロセス障害検知システム
2011 プロセス障害検知DB
202 プロセス障害判定復旧システム
2021 プロセス再起動処理部
2022 サーバ再起動処理部
2023 監視対象プロセスDB
2024 冗長サーバDB
300 ネットワーク。

【特許請求の範囲】
【請求項1】
ネットワークを介して監視対象となるサーバ上で稼動するプロセスを監視し、前記プロセスに生じた障害を検知するプロセス障害検知部と、
前記プロセス障害検知部によって障害が生じたプロセスが検知された場合に、障害が生じた前記プロセスを再起動した回数に基づいて、前記プロセスを再起動させるかまたは前記プロセスを稼動している前記サーバを再起動させるかを判定し、判定した結果に従って前記プロセスまたは前記サーバを再起動させ、前記障害を復旧させる障害判定復旧部と、
を備えることを特徴とするプロセス障害判定復旧装置。
【請求項2】
前記障害判定復旧部は、障害が生じた前記プロセスを再起動した回数が所定の閾値を超えた場合にはじめて前記サーバを再起動させる、
ことを特徴とする請求項1に記載のプロセス障害判定復旧装置。
【請求項3】
前記障害判定復旧部は、前記サーバを再起動させる場合において、前記サーバ上で稼動する他のプロセスと障害が生じた前記プロセスとの間での優先順位を判定し、障害が生じた前記プロセスよりも優先順位の高い前記他のプロセスがない場合にのみ、前記サーバを再起動させる、
ことを特徴とする請求項1または2に記載のプロセス障害判定復旧装置。
【請求項4】
前記サーバは複数台から構成され、前記障害判定復旧部は、前記サーバを再起動させる場合において、最低限稼動させるべき前記サーバの数を満たしているか否かを判定し、最低限稼動させるべき前記サーバの数を満たしていると判定した場合にのみ、前記サーバを再起動させる、
ことを特徴とする請求項1〜3のいずれか1項に記載のプロセス障害判定復旧装置。
【請求項5】
プロセス障害検知部は、複数の前記サーバ上で稼動するプロセスを監視し、
前記障害判定復旧部は、複数の前記サーバのそれぞれについて、稼動するプロセスの優先順位を判定する、
ことを特徴とする請求項3に記載のプロセス障害判定復旧装置。
【請求項6】
ネットワークを介して監視対象となるサーバ上で稼動するプロセスを監視し、前記プロセスに生じた障害を検知するプロセス障害検知ステップと、
前記プロセス障害検知ステップにおいて障害が生じたプロセスが検知された場合に、障害が生じた前記プロセスを再起動した回数に基づいて、前記プロセスを再起動させるかまたは前記プロセスを稼動している前記サーバを再起動させるかを判定する判定ステップと、
前記判定ステップにおいて判定した結果に従って前記プロセスまたは前記サーバを再起動させ、前記障害を復旧させる障害判定復旧ステップと、
を含むことを特徴とするプロセス障害判定復旧方法。
【請求項7】
コンピュータに、
ネットワークを介して監視対象となるサーバ上で稼動するプロセスを監視し、前記プロセスに生じた障害を検知するプロセス障害検知ステップと、
前記プロセス障害検知ステップにおいて障害が生じたプロセスが検知された場合に、障害が生じた前記プロセスを再起動した回数に基づいて、前記プロセスを再起動させるかまたは前記プロセスを稼動している前記サーバを再起動させるかを判定する判定ステップと、
前記判定ステップにおいて判定した結果に従って前記プロセスまたは前記サーバを再起動させ、前記障害を復旧させる障害判定復旧ステップと、
を実行させることを特徴とするプロセス障害判定復旧プログラム。
【請求項8】
請求項7に記載されたプロセス障害判定復旧プログラムを格納したコンピュータの読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−256227(P2012−256227A)
【公開日】平成24年12月27日(2012.12.27)
【国際特許分類】
【出願番号】特願2011−129273(P2011−129273)
【出願日】平成23年6月9日(2011.6.9)
【出願人】(000233491)株式会社日立システムズ (394)
【Fターム(参考)】