説明

障害解決優先度決定支援システム及び障害解決優先度決定支援方法

【課題】複数のジョブを連携するコンピュータシステムの障害対策の優先度を支援すること。
【解決手段】障害管理コンピュータ10が、コンピュータAのジョブと連帯するコンピュータBとコンピュータCとコンピュータDとから障害情報を入力したとき、入力した障害情報を基に障害管理テーブル部12から、障害が生じたコンピュータ情報と前記抽出したコンピュータが実行するジョブと前記ジョブが連帯する他のコンピュータ情報と前記他のコンピュータが実行する実行年月日時刻と障害カテゴリとを抽出し、この抽出した他のコンピュータが実行するジョブの実行年月日時刻と障害カテゴリとを用いて、障害に対応する優先度を判定する障害解決優先度決定支援システム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のコンピュータを接続したコンピュータシステムにおける障害回復優先順位の決定を支援することができる障害解決優先度決定支援システム及び障害解決優先度決定支援方法に係り、特に、障害メッセージや閾値を基にした障害カテゴリを用いて障害解決の優先順位の決定を支援することができる障害解決優先度決定支援システム及び障害解決優先度決定支援方法に関する。
【背景技術】
【0002】
近年のコンピュータシステムは、複数の業務(ジョブ)を実行するジョブプログラムを複数のコンピュータに分散し、複数のコンピュータが連携して一連の業務処理を実行することが行われている。例えば、企業においては、従業員の名簿等を管理する従業員管理ジョブを実行するコンピュータと、従業員の勤怠管理を行う勤怠管理ジョブを実行するコンピュータと、前記従業員ジョブからの従業員情報と勤怠管理ジョブからの勤怠情報とを用いて給与計算ジョブを実行するコンピュータとを設け、これら複数のコンピュータを連携させることによって、毎月の給与計算の業務を行うように構成されている。
【0003】
このように複数のコンピュータが連帯して接続されたコンピュータシステムの場合、何れかのコンピュータが実行中のジョブに障害が発生した場合、複数のジョブの関連性や障害のシステム全体中の重要度によって、優先して対策が必要な障害を選択する必要がある。
【0004】
なお、前述の複数のコンピュータを用いて複数ジョブを実行するコンピュータシステムにおける障害発生時の障害発生コンピュータの特定や影響のある他のジョブの特定を行う技術が記載された文献としては、下記特許文献1が挙げられ、ジョブ実行負荷の分散技術やストレージシステムにおける障害対策技術が記載された文献としては下記特許文献2から特許文献13が挙げられる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−7431号公報
【特許文献2】特開2006−202322号公報
【特許文献3】特開平11−3323号公報
【特許文献4】特開2000−330801号公報
【特許文献5】特開平2−171932号公報
【特許文献6】特開2004−295811号公報
【特許文献7】特開2001−222439号公報
【特許文献8】特開2008−204243号公報
【特許文献9】特開平5−40766号公報
【特許文献10】特開平11−96024号公報
【特許文献11】特開平10−190897号公報
【特許文献12】特開平6−4274号公報
【特許文献13】特開2005−149436号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
前述の特許文献1記載の技術は、複数ジョブの実行手順を記録装置に記憶しておき、影響のあるジョブ及びコンピュータを特定し、障害が発生したジョブ以降に実行予定のジョブ実行を待たせることが記載されているが、障害のシステム全体中の重要度により優先して対策が必要な障害を選択することは考慮されていないという課題があった。
【0007】
この課題を具体的に説明すると、例えば、ある環境で複数の障害が発生したとき、暫定対策をとりたいが割り当て可能な担当者に限りがあるため同時に複数の障害に対応することができず、一つずつ対応していかなくてはいけないが、どれを優先的に解決していけばよいか判らず、その優先度を調べるのに時間を費やしてしまう課題や、この優先度を担当者独自の判断で決めてしまうと、実際は業務へ影響の小さい障害を優先して対応してしまう課題や、影響の大きい障害を後回しにしてしまう可能性があるという課題が挙げられる。更に、前述の課題によって、優先度を調べるのに時間を費やしたり、担当者が間違った優先度付けしたりすることにより、その分だけ障害による事業への影響が大きくなっていくことも懸念される。
【0008】
本発明は、前述の課題を解決するためにされたものであって、その目的は、発生した障害の内容によって解決の優先度を自動的に決定し、複数のジョブ実行への影響を最小限に抑えることができる障害解決優先度決定支援システム及び障害解決優先度決定支援方法を提供することである。
【課題を解決するための手段】
【0009】
前記目的を達成するために請求項1に係る発明は、プログラムである複数のジョブを実行する第1のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第2のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第3のコンピュータと、前記第1のコンピュータと第2のコンピュータと第3のコンピュータよりの障害情報を入力とし、前記第1のコンピュータと第2のコンピュータと第3のコンピュータのジョブの実行を制御する障害管理コンピュータとを備える優先度決定支援システムであって、
前記障害情報は、前記第1のコンピュータと第2のコンピュータと第3のコンピュータから発せられる障害メッセージと閾値情報と応答情報とを含み、
前記障害管理コンピュータは、前記第1のコンピュータと第2のコンピュータと第3のコンピュータに割り当てられたジョブと、前記ジョブが連携する他のコンピュータと、前記割り当てられたジョブを実行する年月日時刻と、前記障害メッセージと閾値情報と応答情報の種類に応じた障害対応の優先度を付した障害カテゴリとの各情報を格納する障害管理テーブル部を備え、
前記障害管理コンピュータは、前記第2コンピュータ及び又は第3のコンピュータから障害情報を入力したとき、前記入力した障害情報を基に障害が生じたコンピュータ情報を前記障害管理テーブル部から抽出する第1ステップと、前記第1ステップにより抽出したコンピュータが実行するジョブを前記障害管理テーブル部から抽出する第2ステップと、前記第2ステップにより抽出したジョブが連帯する他のコンピュータ情報を前記障害管理テーブル部から抽出する第3ステップと、前記第3ステップにより抽出した他のコンピュータが実行する実行年月日時刻を抽出する第4ステップと、前記障害情報に対応した障害カテゴリを抽出する第5ステップとを実行し、
前記障害管理コンピュータは、前記第4ステップにより抽出した他のコンピュータにより実行するジョブの実行年月日時刻と、前記第5ステップにより抽出した障害カテゴリとを用い、障害に対応する優先度を判定する第6ステップを実行することを第1の特徴とする。
【0010】
また、請求項2に係る発明は、第1の特徴の障害解決優先度決定支援システムにおいて、前記障害管理コンピュータは、前記第6ステップにおいて、障害カテゴリが同一の障害が複数あるか否かを判定し、複数でないと判定したとき、前記判定した障害を、最優先の対策を講ずる障害として出力する第7ステップを実行することを第2の特徴とする。
【0011】
また、請求項3に係る発明は、第2の特徴の障害解決優先度決定支援システムにおいて、前記障害管理コンピュータは、前記障害カテゴリに対して優先度の重み付けを行う第8ステップと、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記第8ステップにより重み付けをした最も重み付けが大きい障害を、最優先の対策を講ずる障害として出力する第9ステップを実行することを第3の特徴とする。
【0012】
また、請求項4に係る発明は、第2の特徴の障害解決優先度決定支援システムにおいて、前記障害管理コンピュータは、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記複数の障害に対応する複数ジョブの実行年月日時刻を比較し、最も現在時刻に近くジョブを実行するコンピュータに影響のある障害を、最優先の対策を講ずる障害として出力する第10ステップを実行することを第4の特徴とする。
【0013】
更に、請求項5に係る発明は、プログラムである複数のジョブを実行する第1のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第2のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第3のコンピュータと、前記第1のコンピュータと第2のコンピュータと第3のコンピュータよりの障害情報を入力とし、前記第1のコンピュータと第2のコンピュータと第3のコンピュータのジョブの実行を制御する障害管理コンピュータとを備える障害解決優先度決定支援システムであって、
前記障害情報は、前記第1のコンピュータと第2のコンピュータと第3のコンピュータから発せられる障害メッセージと閾値情報と応答情報とを含み、
前記障害管理コンピュータは、前記第1のコンピュータと第2のコンピュータと第3のコンピュータに割り当てられたジョブと、前記ジョブが連携する他のコンピュータと、前記割り当てられたジョブを実行する年月日時刻と、前記障害メッセージと閾値情報と応答情報の種類に応じた障害対応の優先度を付した障害カテゴリとの各情報を格納する障害管理テーブル部を備え、
前記障害管理コンピュータは、前記第2コンピュータ及び又は第3のコンピュータから障害情報を入力したとき、前記入力した障害情報を基に障害が生じたコンピュータ情報を前記障害管理テーブル部から抽出する第1ステップと、前記第1ステップにより抽出したコンピュータが実行するジョブを前記障害管理テーブル部から抽出する第2ステップと、前記第2ステップにより抽出したジョブが連帯する他のコンピュータ情報を前記障害管理テーブル部から抽出する第3ステップと、前記第3ステップにより抽出した他のコンピュータが実行する実行年月日時刻を前記障害管理テーブル部から抽出する第4ステップと、前記障害情報に対応した障害カテゴリを抽出する第5ステップとを実行し、
前記障害管理コンピュータは、前記第4ステップにより抽出した他のコンピュータにより実行するジョブの実行年月日時刻と、前記第5ステップにより抽出した障害カテゴリとを用い、障害に対応する優先度を判定する第6ステップを実行することを第5の特徴とする。
【0014】
また、請求項6に係る発明は、第5の特徴の障害解決優先度決定支援方法において、前記障害管理コンピュータは、前記第6ステップにおいて、障害カテゴリが同一の障害が複数あるか否かを判定し、複数でないと判定したとき、前記判定した障害を、最優先の対策を講ずる障害として出力する第7ステップを実行することを第6の特徴とする。
【0015】
また、請求項7に係る発明は、第6の特徴の障害解決優先度決定支援方法において、前記障害管理コンピュータは、前記障害カテゴリに対して優先度の重み付けを行う第8ステップと、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記第8ステップにより重み付けをした最も重み付けが大きい障害を、最優先の対策を講ずる障害として出力する第9ステップを実行することを第7の特徴とする。
【0016】
また、請求項8に係る発明は、第6の特徴の障害解決優先度決定支援方法において、前記障害管理コンピュータは、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記複数の障害に対応する複数ジョブの実行年月日時刻を比較し、最も現在時刻に近くジョブを実行するコンピュータに影響のある障害を、最優先の対策を講ずる障害として出力する第10ステップを実行することを第8の特徴とする。
【発明の効果】
【0017】
本発明による障害解決優先度決定支援システム及び障害解決優先度決定支援方法は、第1のコンピュータのジョブと連帯する第2コンピュータ及び又は第3のコンピュータから障害情報を入力したとき、入力した障害情報を基に前記障害管理テーブル部から、障害が生じたコンピュータ情報と前記抽出したコンピュータが実行するジョブと前記ジョブが連帯する他のコンピュータ情報と前記他のコンピュータが実行する実行年月日時刻と障害カテゴリとを抽出し、この抽出した他のコンピュータにより実行するジョブの実行年月日時刻と障害カテゴリとを用いて、障害に対応する優先度を判定することによって、障害担当者の独自の判断を防ぎ、優先度設定の誤りを無くし、担当者の優先度調査の負担を軽減することができる。
【図面の簡単な説明】
【0018】
【図1】本発明の一実施形態による障害解決優先度決定支援システムの説明図
【図2】本実施形態に障害管理テーブルの説明図
【図3】本実施形態による障害解決優先度決定支援処理のフロー図
【図4】本実施形態の対象となるコンピュータシステムの説明図
【発明を実施するための形態】
【0019】
[本願請求項に係る発明の原理の説明]
まず、本願請求項に係る発明の対象となるコンピュータシステムは、例えば、図4に示す如く、コンピュータAとコンピュータBとコンピュータCとコンピュータDとがネットワークNを介して接続され、コンピュータAが実行する複数のジョブが、他のコンピュータBとコンピュータCとコンピュータDのジョブの実行結果のデータを利用するシステムとし、本願発明は、次に説明する原理A及びBを採用したものである。
[原理A]:
本願請求項に係る発明は、前述の構成のコンピュータシステムを前提とし、障害が発生したコンピュータと影響するコンピュータすべてに対して依存するジョブを検出し、「障害のカテゴリ化」と「実行予定ジョブへの影響度(実行予定時刻からも判断)」と「他のコンピュータへの影響度」と「障害の緊急度」との観点から優先度を自動的に決定する。なお、本願発明においては、各コンピュータから発せられる後述の障害メッセージと閾値情報と応答情報とを障害情報と記載する。
(イ)前記「障害のカテゴリ化」は、あるコンピュータで障害が発生したとき、その障害の内容を基に事前に定義したカテゴリに分類する処理であり、カテゴリの例としては次のような分類別けを行う処理である。
【0020】
(1)障害メッセージの監視
各コンピュータからの障害メッセージに含まれる用語をキーワードとして障害を監視する。この例は、次の通りである。
「CPU故障」
例:「CPU」及び「エラー」という用語が障害メッセージに含まれる。なお、CPUとは、セントラル プロセッシング ユニット(Central Processing Unit)の略である。
「メモリ故障」
例:「メモリ」及び「エラー」という用語が障害メッセージに含まれる。
「ハードディスク故障」
例:「ハードディスク」、「エラー」という用語が障害メッセージに含まれる。
【0021】
(2)閾値監視
各コンピュータからのメッセージに含まれる数値が予め設定した閾値を超えるか否かを監視する。この例は、次の通りである。
「CPU閾値超過」
例:CPU使用率が70%を超えたとき、警告を出す。
「メモリ閾値超過」
例:メモリ使用率が80%を超えたとき、エラーを出す。
「ハードディスク空き容量の閾値超過」
例:ハードディスク空き容量が1GBに達したときに警告を出す。
【0022】
(3)死活監視
各コンピュータに対する問いかけに対する応答情報を用いて障害を監視する。この例は、次の通りである。
「コンピュータからの応答なし」
例:ホスト名***からピング(ping:ネットワークを診断するプログラム。)による応答がなくなった場合はエラーを出す。
【0023】
(ロ)前記「実行予定ジョブへの影響度(実行予定時刻からも判断)」は、前述のカテゴリ化した内容に前記当する処理のジョブを抽出し、それらを障害により影響するジョブとして抽出する処理である。
【0024】
(ハ)「他のコンピュータへの影響度」は、前記(ロ)により特定したジョブの実行先となっているコンピュータを抽出し、それらを障害により影響するコンピュータとする処理である。
【0025】
(ニ)「障害の緊急度」は、(ロ)によって特定したジョブそれぞれの実行日時刻を抽出し、それらを緊急度の指標とする(より間近の実行予定ジョブを緊急度高とする。)処理である。このとき、実行予定として計画されていないジョブは優先度を決定するための判断要素から除外する。
【0026】
[原理B]:
本願請求項に係る発明においては、上記(イ)と(ロ)と(ハ)と(ニ)の要素に基づき、最も影響が大きいと考えられる障害を判断し、その障害を優先度高として扱う。最も影響が大きいと考えられる障害の判断基準は、次のようなものが考えられる。
(1)影響するジョブ実行予定の数
(2)影響するコンピュータの数
(3)実行予定間近のジョブの数
これらの判断基準は、コンピュータの規模と、登録しているジョブ数と、内容等によってどれに重み付けを置くかが変化するため、実際の環境に合わせて重み付けの設定をすることが望ましい。
【0027】
[構成]
本実施形態による障害解決優先度決定支援方法を実現するコンピュータシステムは、図1に示す如く、基本ソフトウェアであるOS(オペレーティングシステム)上でジョブaとジョブbとジョブcとジョブdとを実行するコンピュータAと、前記コンピュータAのジョブa及びジョブcと連携して動作するコンピュータBと、前記コンピュータAのジョブa及びジョブbと連携して動作するコンピュータCと、前記コンピュータAのジョブa及びジョブdと連携して動作するコンピュータDと、本実施形態の特徴である各コンピュータの障害を管理する障害管理コンピュータ10とから構成される。なお、前記障害管理コンピュータ10は、他のコンピュータAとコンピュータBとコンピュータCとコンピュータDとからの各種情報を受信すると共に、各コンピュータのジョブの実行を制御する機能を備え、各コンピュータとネットワーク接続されている。なお、本願発明におけるコンピュータとは、一般のCPU(Central Processing Unit)、メモリ、磁気ディスク装置等の記憶装置、入出力インタフェース部、システムタイマー等のハードウェアと、これらハードウェアを制御するソフトウェアとにより構成される。
【0028】
前記障害管理コンピュータ10は、図2に示した障害管理テーブル部12と、前記障害管理テーブル部12の各情報を参照して後述する障害管理プログラムを実行する制御部11とを備え、前記障害管理テーブル部12は、障害のシステムに与える影響度に応じて設定された重み値と、コンピュータの監視対象に応じて区分した障害の種類名を示す障害種と、障害種の内容を大分類と小分類とに区分した障害カテゴリと、障害が発生したコンピュータ名を示す障害発生コンピュータと、この障害が発生したコンピュータにより影響を受けるコンピュータの名称を示す影響コンピュータと、前記実行予定ジョブの実行予定の日時を示す実行予定日の各欄の情報とから成る。
【0029】
前記障害管理テーブル部12の「重み値」は、値が大きくなるほど重大な障害であり、図示の例では、値「3」が最も重大な障害である。「障害種」は、各コンピュータからの前記障害メッセージを監視対象とする障害カテゴリを「障害A」、各コンピュータに予め設定した前記閾値(例えば、メモリ使用率)を超えたか否かを監視対象とする障害カテゴリを「閾値監視」、各コンピュータからの応答の有無を監視対象とする障害カテゴリを「死活監視」に区分している。
【0030】
[動作]
前述のように構成された本実施形態による障害解決優先度決定支援方法が適用されるコンピュータシステムは、障害管理コンピュータ10の制御部11が前記障害管理テーブル部12を参照し、図3に示す如く、各コンピュータから得た情報を前記障害管理テーブル部12の「障害種」別にカテゴリ化するステップS401と、障害発生元のコンピュータを特定するステップS402と、前記特定したコンピュータで実行予定のジョブの一覧情報を取得するステップS403と、前記ステップS403により取得したジョブ一覧情報から前記ステップS401によりカテゴリ化したジョブを抽出するステップS404と、前記抽出したジョブの実行先に指定されているコンピュータを特定するステップS405と、前記ステップS404により抽出したジョブの実行予定日時を抽出するステップS406とを実行することによって、各コンピュータから得た障害情報を基に障害が発生したコンピュータと、この障害が発生したコンピュータで実行中のジョブと、このジョブの実行予定日時の各情報を取得するように動作する。
【0031】
これら一連の動作は、例えば、コンピュータAからハードディスク装置の故障との障害メッセージが発せられた場合、障害管理コンピュータ10の制御部11が、この障害情報を基に障害管理テーブル部12を参照し、障害が発生したコンピュータAにおいて、実行中のジョブが「ジョブc」及び「ジョブd」であり、これらジョブの実行予定日時が「2009/1/1 19:00」及び「2009/1/1 23:00」との各情報を取得するように動作する。
【0032】
次いで本システムは、取得した障害が発生したコンピュータと前記障害発生コンピュータで実行中のジョブと前記ジョブの実行予定日時の各情報を基に、障害を解決するための優先順位を前記「重み値」を抽出するステップS410と、前記抽出した「重み値」と前述した原理A及びBとして記載した優先度判定基準を用いた重み付けを決定するステップS411と、前記ステップS411にて決定した重み付けと同レベルの他の障害があるか否かを判定し、ないと判定したとき、後述のステップS419に移行するステップS414と、前記ステップS414において、同レベルの障害があると判定したとき、他の判定基準があるか否かを判定するステップS415と、前記ステップS415により他の判定基準がないと判定したとき、該当する障害を最優先に設定するステップS417と、前記ステップS415において他の判定基準があると判定したとき、判定基準のうち、次に重み付けが大きい障害を最優先に設定するステップS415と、前記ステップS414又はステップS415又はステップS417に続き、障害解決の優先度を保守員や管理者に知らせるためのデータ出力を行うステップS419とを実行する。
【0033】
これら一連の動作によって本実施形態による障害解決優先度決定支援システム及び同方法は、コンピュータAとコンピュータBとコンピュータCとコンピュータDとから得た障害情報を基に、他のコンピュータにより実行するジョブの実行年月日時刻と障害カテゴリとを用いて、障害に対応する優先度を判定し、障害担当者の独自の判断を防ぎ、優先度設定の誤りを無くし、担当者の優先度調査の負担を軽減することができる。
【0034】
即ち、本実施形態による障害解決優先度決定支援システム及び同方法は、(1)障害担当者の独自の判断を防ぎ、優先度設定の誤りを無くし、担当者の優先度調査の負担を軽減すること、(2)障害カテゴリに該当する実行予定のジョブを抽出し、保守員等へ知らせることにより異常終了の可能性があるジョブをすべて把握でき、予期せぬ障害を未然に防ぐことができること、(3)障害によって受ける事業の損失を最小限に抑えることができる。
【符号の説明】
【0035】
A コンピュータ、B コンピュータ、C コンピュータ、D コンピュータ、N ネットワーク、10 障害管理コンピュータ、11 制御部、12 障害管理テーブル部

【特許請求の範囲】
【請求項1】
プログラムである複数のジョブを実行する第1のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第2のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第3のコンピュータと、前記第1のコンピュータと第2のコンピュータと第3のコンピュータよりの障害情報を入力とし、前記第1のコンピュータと第2のコンピュータと第3のコンピュータのジョブの実行を制御する障害管理コンピュータとを備える優先度決定支援システムであって、
前記障害情報は、前記第1のコンピュータと第2のコンピュータと第3のコンピュータから発せられる障害メッセージと閾値情報と応答情報とを含み、
前記障害管理コンピュータは、前記第1のコンピュータと第2のコンピュータと第3のコンピュータに割り当てられたジョブと、前記ジョブが連携する他のコンピュータと、前記割り当てられたジョブを実行する年月日時刻と、前記障害メッセージと閾値情報と応答情報の種類に応じた障害対応の優先度を付した障害カテゴリとの各情報を格納する障害管理テーブル部を備え、
前記障害管理コンピュータは、前記第2コンピュータ及び又は第3のコンピュータから障害情報を入力したとき、前記入力した障害情報を基に障害が生じたコンピュータ情報を前記障害管理テーブル部から抽出する第1ステップと、前記第1ステップにより抽出したコンピュータが実行するジョブを前記障害管理テーブル部から抽出する第2ステップと、前記第2ステップにより抽出したジョブが連帯する他のコンピュータ情報を前記障害管理テーブル部から抽出する第3ステップと、前記第3ステップにより抽出した他のコンピュータが実行する実行年月日時刻を抽出する第4ステップと、前記障害情報に対応した障害カテゴリを抽出する第5ステップとを実行し、
前記障害管理コンピュータは、前記第4ステップにより抽出した他のコンピュータにより実行するジョブの実行年月日時刻と、前記第5ステップにより抽出した障害カテゴリとを用い、障害に対応する優先度を判定する第6ステップを実行する優先度決定支援システム。
【請求項2】
前記障害管理コンピュータは、前記第6ステップにおいて、障害カテゴリが同一の障害が複数あるか否かを判定し、複数でないと判定したとき、前記判定した障害を、最優先の対策を講ずる障害として出力する第7ステップを実行する請求項1記載の障害解決優先度決定支援システム。
【請求項3】
前記障害管理コンピュータは、前記障害カテゴリに対して優先度の重み付けを行う第8ステップと、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記第8ステップにより重み付けをした最も重み付けが大きい障害を、最優先の対策を講ずる障害として出力する第9ステップを実行する請求項2記載の障害解決優先度決定支援システム。
【請求項4】
前記障害管理コンピュータは、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記複数の障害に対応する複数ジョブの実行年月日時刻を比較し、最も現在時刻に近くジョブを実行するコンピュータに影響のある障害を、最優先の対策を講ずる障害として出力する第10ステップを実行する請求項2記載の障害解決優先度決定支援システム。
【請求項5】
プログラムである複数のジョブを実行する第1のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第2のコンピュータと、前記第1のコンピュータの複数のジョブ中の任意のジョブと連携して所定のジョブを実行する第3のコンピュータと、前記第1のコンピュータと第2のコンピュータと第3のコンピュータよりの障害情報を入力とし、前記第1のコンピュータと第2のコンピュータと第3のコンピュータのジョブの実行を制御する障害管理コンピュータとを備える障害解決優先度決定支援システムであって、
前記障害情報は、前記第1のコンピュータと第2のコンピュータと第3のコンピュータから発せられる障害メッセージと閾値情報と応答情報とを含み、
前記障害管理コンピュータは、前記第1のコンピュータと第2のコンピュータと第3のコンピュータに割り当てられたジョブと、前記ジョブが連携する他のコンピュータと、前記割り当てられたジョブを実行する年月日時刻と、前記障害メッセージと閾値情報と応答情報の種類に応じた障害対応の優先度を付した障害カテゴリとの各情報を格納する障害管理テーブル部を備え、
前記障害管理コンピュータは、前記第2コンピュータ及び又は第3のコンピュータから障害情報を入力したとき、前記入力した障害情報を基に障害が生じたコンピュータ情報を前記障害管理テーブル部から抽出する第1ステップと、前記第1ステップにより抽出したコンピュータが実行するジョブを前記障害管理テーブル部から抽出する第2ステップと、前記第2ステップにより抽出したジョブが連帯する他のコンピュータ情報を前記障害管理テーブル部から抽出する第3ステップと、前記第3ステップにより抽出した他のコンピュータが実行する実行年月日時刻を前記障害管理テーブル部から抽出する第4ステップと、前記障害情報に対応した障害カテゴリを抽出する第5ステップとを実行し、
前記障害管理コンピュータは、前記第4ステップにより抽出した他のコンピュータにより実行するジョブの実行年月日時刻と、前記第5ステップにより抽出した障害カテゴリとを用い、障害に対応する優先度を判定する第6ステップを実行する障害解決優先度決定支援方法
【請求項6】
前記障害管理コンピュータは、前記第6ステップにおいて、障害カテゴリが同一の障害が複数あるか否かを判定し、複数でないと判定したとき、前記判定した障害を、最優先の対策を講ずる障害として出力する第7ステップを実行する請求項5載の障害解決優先度決定支援方法。
【請求項7】
前記障害管理コンピュータは、前記障害カテゴリに対して優先度の重み付けを行う第8ステップと、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記第8ステップにより重み付けをした最も重み付けが大きい障害を、最優先の対策を講ずる障害として出力する第9ステップを実行する請求項6載の障害解決優先度決定支援方法。
【請求項8】
前記障害管理コンピュータは、前記第6ステップにおける障害カテゴリが同一の障害が複数あると判定したとき、前記複数の障害に対応する複数ジョブの実行年月日時刻を比較し、最も現在時刻に近くジョブを実行するコンピュータに影響のある障害を、最優先の対策を講ずる障害として出力する第10ステップを実行する請求項6載の障害解決優先度決定支援方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate