監視補助装置、監視補助方法および監視補助プログラム
【課題】保守の効率を向上させること。
【解決手段】装置障害検出部111は、ネットワーク120の各通信装置の障害を検出する。サービス障害検出部112は、ネットワーク120の通信サービスの障害を検出する。記憶部113は、サービス障害検出部112によって障害が検出されたときの通信サービスの経路上の各通信装置を記憶する。サービス復旧検出部114は、通信サービスの経路切替による通信サービスの障害からの復旧を検出する。特定部115は、サービス復旧検出部114によって復旧が検出された場合に、装置障害検出部111によって検出された通信装置の障害の中から、記憶部113によって記憶された各通信装置に含まれる通信装置の障害を特定する。出力部116は、装置障害検出部111によって検出された障害をユーザに通知し、障害のうちの特定部115によって特定された障害を他の障害と区別して通知する。
【解決手段】装置障害検出部111は、ネットワーク120の各通信装置の障害を検出する。サービス障害検出部112は、ネットワーク120の通信サービスの障害を検出する。記憶部113は、サービス障害検出部112によって障害が検出されたときの通信サービスの経路上の各通信装置を記憶する。サービス復旧検出部114は、通信サービスの経路切替による通信サービスの障害からの復旧を検出する。特定部115は、サービス復旧検出部114によって復旧が検出された場合に、装置障害検出部111によって検出された通信装置の障害の中から、記憶部113によって記憶された各通信装置に含まれる通信装置の障害を特定する。出力部116は、装置障害検出部111によって検出された障害をユーザに通知し、障害のうちの特定部115によって特定された障害を他の障害と区別して通知する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、監視補助装置、監視補助方法および監視補助プログラムに関する。
【背景技術】
【0002】
従来、IP(Internet Protocol)ネットワークなどのネットワークの保守を容易にするために、ネットワーク全体の接続構成や経路を算出して可視化する技術が知られている。ネットワーク全体の接続構成や経路の算出は、たとえば、OSPF(Open Shortest Path First)のLSA(Link State Advertisement:リンク状態広告)情報を収集してルーティング解析することにより行われる。
【0003】
また、ネットワークにおいて発生した通信装置の障害を通知する技術や、ネットワークにおいて発生した通信サービスの障害を通知する技術が知られている。また、ネットワークオペレーションシステムにおいて、ネットワーク障害により影響を受ける顧客回線を特定する技術が知られている(たとえば、下記特許文献1参照。)。通信装置の障害および通信サービスの障害を検出する場合に、通信装置が故障して装置障害が検出されるより、通信装置が故障する前に不安定になってサービス障害が先に検出される場合が多い。
【0004】
また、IPネットワークなどのネットワークにおいては、たとえば、通信サービスの経路上の装置障害が発生した場合に、障害が発生した通信装置を迂回した経路へ自律的に切り替えることで通信サービスを復旧する技術が用いられている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−101042号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来技術では、経路切替によってサービス障害から復旧した後も、サービス障害の要因となっていた経路切替前の経路上の装置障害も他の装置障害とともに保守者に通知される。このため、保守者は、通信サービスに現に影響が出ている装置障害と、通信サービスに影響が出ていない装置障害と、を区別することができず、保守を効率よく行うことができなかった。
【0007】
本発明は、上述した従来技術による問題点を解消するため、保守の効率を向上させることができる監視補助装置、監視補助方法および監視補助プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するため、本発明の一側面によれば、ネットワークの通信装置の障害を検出し、前記ネットワークの通信サービスの障害を検出し、前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を記憶し、前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、前記復旧を検出した場合に、検出した前記通信装置の障害の中から、記憶した各通信装置に含まれる通信装置の障害を特定し、検出した前記各通信装置の障害をユーザに通知し、検出した前記各通信装置の障害のうちの特定した障害を他の障害と区別して通知する監視補助装置、監視補助方法および監視補助プログラムが提案される。
【発明の効果】
【0009】
本発明の一側面によれば、保守の効率を向上させることができるという効果を奏する。
【図面の簡単な説明】
【0010】
【図1】図1は、本発明にかかる監視補助装置の一例を示す図である。
【図2−1】図2−1は、監視補助装置によるネットワークの監視の一例を示す図(その1)である。
【図2−2】図2−2は、監視補助装置によるネットワークの監視の一例を示す図(その2)である。
【図2−3】図2−3は、監視補助装置によるネットワークの監視の一例を示す図(その3)である。
【図2−4】図2−4は、監視補助装置によるネットワークの監視の一例を示す図(その4)である。
【図2−5】図2−5は、監視補助装置によるネットワークの監視の一例を示す図(その5)である。
【図3】図3は、監視補助装置のハードウェア構成の一例を示す図である。
【図4】図4は、実施の形態1にかかる監視補助装置の構成の一例を示す図である。
【図5】図5は、経路情報の一例を示す図である。
【図6】図6は、装置障害情報の一例を示す図である。
【図7】図7は、影響展開経路情報の一例を示す図である。
【図8】図8は、経路情報管理部による経路収集処理の一例を示すフローチャートである。
【図9】図9は、装置障害監視部による装置障害監視処理の一例を示すフローチャートである。
【図10】図10は、装置障害監視部による重要度変更処理の一例を示すフローチャートである。
【図11】図11は、サービス障害監視部によるサービス障害監視処理の一例を示すフローチャートである。
【図12】図12は、障害影響展開部によるサービス障害発生に対する処理の一例を示すフローチャートである。
【図13】図13は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。
【図14】図14は、実施の形態2にかかる監視補助装置の構成の一例を示す図である。
【図15】図15は、検出遅延時間情報の一例を示す図である。
【図16】図16は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下に添付図面を参照して、本発明にかかる監視補助装置、監視補助方法および監視補助プログラムの実施の形態を詳細に説明する。
【0012】
(本発明にかかる監視補助装置)
図1は、本発明にかかる監視補助装置の一例を示す図である。図1に示す監視補助装置110は、たとえば、監視対象ネットワーク120の監視者による監視対象ネットワーク120の装置障害およびサービス障害の監視を補助する監視補助装置である。装置障害は、たとえば、監視対象ネットワーク120における通信装置の障害である。サービス障害は、たとえば、監視対象ネットワーク120における通信装置によって提供される通信サービスの障害である。
【0013】
図1に示すように、監視補助装置110は、装置障害検出部111と、サービス障害検出部112と、記憶部113と、サービス復旧検出部114と、特定部115と、出力部116と、を備えている。
【0014】
装置障害検出部111は、監視対象ネットワーク120の各通信装置の障害を検出する。たとえば、監視対象ネットワーク120の各通信装置は、装置障害の発生状態を示す装置障害情報を監視補助装置110へ送信する。装置障害検出部111は、監視対象ネットワーク120の通信装置から送信された装置障害情報を受信し、受信した装置障害情報に基づいて通信装置の障害を検出する。装置障害検出部111は、通信装置の障害を検出すると、検出結果を特定部115および出力部116へ通知する。
【0015】
サービス障害検出部112は、監視対象ネットワーク120の通信サービスの障害を検出する。たとえば、監視対象ネットワーク120には、監視対象ネットワーク120における通信サービスの状態を監視するサービス監視補助装置が設けられており、サービス監視補助装置は監視結果を監視補助装置110へ送信する。サービス障害検出部112は、サービス監視補助装置から送信された監視結果を受信し、受信した監視結果に基づいて通信サービスの障害を検出する。サービス障害検出部112は、通信サービスの障害を検出すると、障害を検出した通信サービスの経路上の各通信装置を示す識別情報を記憶部113へ出力する。
【0016】
記憶部113は、サービス障害検出部112から出力された識別情報を記憶する。これにより、記憶部113は、サービス障害検出部112によって通信サービスの障害が検出されたときの通信サービスの経路上の各通信装置を記憶することができる。
【0017】
サービス復旧検出部114は、通信サービスの経路切替による障害からの復旧を検出する。通信サービスの経路切替は、監視対象ネットワーク120の各通信装置によって自律的に行われる。具体的には、監視対象ネットワーク120の各通信装置は、通信サービスの経路上の通信装置の障害発生時に、障害が発生した通信装置を迂回する経路への自律的な経路切替を行うことで通信サービスを復旧する。サービス復旧検出部114は、通信サービスの障害からの復旧を検出すると、検出結果を特定部115へ通知する。
【0018】
特定部115は、通信サービスの障害からの復旧がサービス復旧検出部114から通知されると、装置障害検出部111から障害が通知された通信装置の中から、記憶部113によって記憶されている識別情報が示す各通信装置に含まれる通信装置を特定する。特定部115は、特定した通信装置を出力部116へ通知する。
【0019】
出力部116は、装置障害検出部111から通知された通信装置を示す障害情報を出力する。たとえば、出力部116は、障害情報が示す通信装置を、障害が発生した通信装置として通知する。これにより、ユーザは、監視対象ネットワーク120において障害が発生した通信装置を知ることができる。出力部116による通知は、画面による表示であってもよいし、音声による通知などであってもよい。ユーザは、たとえば監視対象ネットワーク120の保守者である。
【0020】
また、出力部116は、装置障害検出部111から通知された各障害のうちの特定部115から通知された障害を他の通信装置と区別してユーザに通知する。これにより、ユーザは、障害が発生した通信装置のうちの、経路切替によりすでに復旧した通信サービスの元の経路上の通信装置を他の通信装置と区別して知ることができる。
【0021】
このため、ユーザは、経路切替により復旧済みの通信サービスの元の経路上で障害が発生している通信装置については、他の障害が発生している通信装置よりも優先度を下げて対応することが可能になる。経路切替により復旧済みの通信サービスの元の経路上の通信装置については、障害が発生していても通信サービスは提供されている。
【0022】
したがって、経路切替により復旧済みの通信サービスの元の経路上で障害が発生している通信装置については、他の通信装置の障害より優先度を下げて対応することで、通信サービスに影響する通信装置の障害に優先的に対応することができる。このため、保守の効率を向上させることができる。
【0023】
たとえば、出力部116は、特定部115から通知された障害よりも他の障害を強調して通知する。これにより、ユーザは、経路切替により復旧済みの通信サービスの元の経路上の通信装置の障害が、他の通信装置の障害よりも優先度が低いことを容易に知ることができる。このため、保守の効率をさらに向上させることができる。
【0024】
(監視補助装置によるネットワークの監視)
図2−1は、監視補助装置によるネットワークの監視の一例を示す図(その1)である。図2−1に示す監視対象ネットワーク200は、図1に示した監視対象ネットワーク120の状態を監視補助装置110の出力部116が表示した画面の一例である。監視対象ネットワーク200は、たとえばIPによって通信が行われるIPネットワークである。
【0025】
監視対象ネットワーク200は、端末211〜21n(nは自然数)と、端末221〜22m(mは自然数)と、ネットワーク装置#1〜#10と、を含んでいる。たとえば、監視対象ネットワーク200において、端末211と端末221が、ネットワーク装置#1,#2,#4,#5,#7,#8,#10を介してデータ通信を行っているとする。
【0026】
具体的には、端末211から端末221へデータを送信する通信サービス201が提供されている。通信サービス201は、ネットワーク装置#1,#2,#4,#5,#7,#8,#10の順に経由して提供されている。また、端末221から端末211へデータを送信する通信サービス202が提供されている。通信サービス202は、ネットワーク装置#10,#8,#7,#5,#4,#2,#1の順に経由して提供されている。監視補助装置110は、通信サービス201,202の経路を実線矢印で示すことで、通信サービス201,202が提供されていることをユーザへ通知する。
【0027】
また、監視対象ネットワーク200において、ネットワーク装置#6に装置障害が発生しているとする。監視補助装置110は、ネットワーク装置#6の部分に障害発生マーク203を表示することによってネットワーク装置#6に装置障害が発生したことをユーザへ通知する。なお、ネットワーク装置#6は通信サービス201,202の経路上にないため、ネットワーク装置#6の障害は通信サービス201,202に影響しない。
【0028】
図2−2は、監視補助装置によるネットワークの監視の一例を示す図(その2)である。図2−2において、図2−1に示した部分と同様の部分については同一の符号を付して説明を省略する。図2−1に示した状態の後に、ネットワーク装置#2,#4の間で装置障害が発生したとする。ネットワーク装置#2,#4の間の経路は通信サービス201,202の経路上にあるため、ネットワーク装置#2,#4の間の装置障害により通信サービス201,202の障害が発生したとする。
【0029】
図2−2に示すように、監視補助装置110は、通信サービス201,202の障害を検出し、通信サービス201,202を実線から点線に変更することによって通信サービス201,202の障害が発生したことをユーザへ通知する。また、監視補助装置110は、通信サービス201,202の障害発生時の経路としてネットワーク装置#1,#2,#4,#5,#7,#8,#10を記憶しておく。なお、監視補助装置110は、ネットワーク装置#2,#4の間で発生した装置障害についてはまだ検出していない。
【0030】
図2−3は、監視補助装置によるネットワークの監視の一例を示す図(その3)である。図2−3において、図2−2に示した部分と同様の部分については同一の符号を付して説明を省略する。図2−2に示した状態の後に、監視補助装置110は、ネットワーク装置#2,#4の間で発生した装置障害を検出したとする。
【0031】
図2−3に示すように、監視補助装置110は、ネットワーク装置#2,#4の間に障害発生マーク231を表示することによってネットワーク装置#2,#4の間で装置障害が発生したことをユーザへ通知する。
【0032】
図2−4は、監視補助装置によるネットワークの監視の一例を示す図(その4)である。図2−4において、図2−3に示した部分と同様の部分については同一の符号を付して説明を省略する。図2−3に示した状態の後に、監視対象ネットワーク200は、ネットワーク装置#2,#4の間で装置障害が発生したことにより、ネットワーク装置#2,#4の間の経路を迂回するように自律的な経路切替を行ったとする。具体的には、通信サービス201,202のそれぞれが、ネットワーク装置#1,#3,#4,#5,#7,#8,#10を経由するように経路切替が行われたとする。
【0033】
図2−4に示すように、監視補助装置110は、通信サービス201,202の各矢印の経路を変更することによって通信サービス201,202の経路が切り替わったことをユーザへ通知する。また、監視補助装置110は、通信サービス201,202の各矢印を点線から実線に変更することによって通信サービス201,202の障害が復旧したことをユーザへ通知する。
【0034】
図2−5は、監視補助装置によるネットワークの監視の一例を示す図(その5)である。図2−5において、図2−4に示した部分と同様の部分については同一の符号を付して説明を省略する。ネットワーク装置#2,#4の間で発生した装置障害は、通信サービス201,202の障害発生時の経路として記憶しておいたネットワーク装置#1,#2,#4,#5,#7,#8,#10に含まれる通信装置の障害である。
【0035】
このため、図2−4に示した状態の後に、監視補助装置110は、図2−5に示すように、障害発生マーク231の色を薄くすることにより、ネットワーク装置#2,#4の間で発生した装置障害の重要度が低くなったことをユーザへ通知する。
【0036】
また、監視補助装置110は、障害発生マーク203については色を変更しないことで、ネットワーク装置#6の障害の方が、ネットワーク装置#2,#4の間の障害より重要度が高いことをユーザへ通知する。これにより、ユーザは、ネットワーク装置#2,#4の間の障害よりも通信サービスに影響を与える可能性が高いネットワーク装置#6の障害に優先的に対応することができる。
【0037】
図2−1〜図2−5においては、監視補助装置110の出力部116が、監視対象ネットワーク120の装置障害を監視対象ネットワーク120の画像によって通知する場合について説明した。ただし、装置障害の通知は監視対象ネットワーク120の画像によるものに限らない。たとえば、出力部116は、障害が発生した通信装置の識別情報を示すリストを表示することによって装置障害を通知してもよい。
【0038】
この場合は、出力部116は、たとえば、特定部115によって特定された障害にかかる通信装置よりも他の障害にかかる通信装置を上の行に表示することにより、特定部115によって特定された障害よりも他の障害を強調して通知する。または、出力部116は、特定部115によって特定された障害にかかる通信装置よりも他の障害にかかる通信装置を目立つ色やフォントで表示することにより、特定部115によって特定された障害よりも他の障害を強調して通知する。
【0039】
(監視補助装置のハードウェア構成)
図3は、監視補助装置のハードウェア構成の一例を示す図である。図1に示した監視補助装置110は、たとえば図3に示す情報処理装置300によって実現することができる。情報処理装置300は、CPU310と、メインメモリ320と、補助メモリ330と、ユーザインタフェース340と、通信インタフェース350と、を備えている。CPU310、メインメモリ320、補助メモリ330、ユーザインタフェース340および通信インタフェース350は、バス301によって接続されている。
【0040】
CPU310(Central Processing Unit)は、情報処理装置300の全体の制御を司る。また、情報処理装置300はCPU310を複数備えていてもよい。メインメモリ320は、たとえばRAM(Random Access Memory)である。メインメモリ320は、CPU310のワークエリアとして使用される。補助メモリ330は、たとえば、ハードディスク、光ディスク、フラッシュメモリなどの不揮発メモリである。補助メモリ330には、情報処理装置300を動作させる各種のプログラムが記憶されている。補助メモリ330に記憶されたプログラムは、メインメモリ320にロードされてCPU310によって実行される。
【0041】
ユーザインタフェース340は、たとえば、ユーザからの操作入力を受け付ける入力デバイスや、ユーザへ情報を出力する出力デバイスなどを含む。入力デバイスは、たとえばキー(たとえばキーボード)やリモコンなどによって実現することができる。出力デバイスは、たとえばディスプレイやスピーカなどによって実現することができる。また、タッチパネルなどによって入力デバイスおよび出力デバイスを実現してもよい。ユーザインタフェース340は、CPU310によって制御される。
【0042】
通信インタフェース350は、たとえば、無線によって情報処理装置300の外部(たとえば監視対象ネットワーク120)との間で通信を行う通信インタフェースである。通信インタフェース350は、CPU310によって制御される。
【0043】
図1に示した装置障害検出部111、サービス障害検出部112およびサービス復旧検出部114は、たとえばCPU310および通信インタフェース350によって実現することができる。また、記憶部113は、たとえば補助メモリ330によって実現することができる。また、特定部115は、たとえばCPU310によって実現することができる。また、出力部116は、たとえばユーザインタフェース340や通信インタフェース350によって実現することができる。
【0044】
(実施の形態1)
(監視補助装置の構成)
図4は、実施の形態1にかかる監視補助装置の構成の一例を示す図である。図4に示す実施の形態1にかかる監視補助装置410は、図1に示した監視補助装置110の具体例である。監視対象ネットワーク420は、たとえば図1に示した監視対象ネットワーク120に対応するネットワークである。
【0045】
監視補助装置410は、経路情報管理部411と、装置障害監視部413と、サービス障害監視部415と、障害影響展開部416と、を備えている。経路情報管理部411、装置障害監視部413およびサービス障害監視部415は、たとえば図3に示したCPU310および通信インタフェース350によって実現することができる。障害影響展開部416は、たとえば図3に示したCPU310によって実現することができる。
【0046】
また、監視補助装置410は、経路情報412と、装置障害情報414と、影響展開経路情報417と、を記憶している。経路情報412、装置障害情報414および影響展開経路情報417は、たとえば図3に示したメインメモリ320または補助メモリ330に記憶される。
【0047】
経路情報管理部411は、監視対象ネットワーク420からOSPFのLSA情報を受信して収集する。経路情報管理部411は、収集したLSA情報に基づいてルーティング解析を行うことにより、監視対象ネットワーク420において提供されているサービスのアクティブ経路を取得する。そして、経路情報管理部411は、取得したアクティブ経路をサービスごとに経路情報412に格納する。
【0048】
装置障害監視部413は、監視対象ネットワーク420から装置障害情報を受信して収集する。装置障害情報は、たとえば、SNMP(Simple Network Management Protocol)Trap、MIB(Management Information Base)ポーリング、システムログなどである。装置障害監視部413は、収集した装置障害情報に基づいて、監視対象ネットワーク420において発生した装置障害を検出する。装置障害監視部413は、検出した装置障害の情報を装置障害情報414に格納する。
【0049】
また、装置障害監視部413は、検出した装置障害をユーザへ通知する。また、装置障害監視部413は、障害影響展開部416から重要度変更通知があると、装置障害の通知における重要度を変更する。たとえば、装置障害監視部413は、図2−1〜図2−5に示した監視対象ネットワーク200を表示することによって装置障害を通知する。
【0050】
サービス障害監視部415は、監視対象ネットワーク420からサービス障害情報を受信して収集する。サービス障害情報は、たとえば、通信サービスにおけるデータの遅延やゆらぎを示す情報などである。サービス障害監視部415は、収集したサービス障害情報に基づいて、監視対象ネットワーク420において発生したサービス障害を検出する。たとえば、サービス障害監視部415は、通信サービスにおけるデータの遅延量が閾値を超えるとサービス障害が発生したと判断する。サービス障害監視部415は、サービス障害の検出結果をサービス障害発生通知として障害影響展開部416へ通知する。
【0051】
また、サービス障害監視部415は、収集したサービス障害情報に基づいて、監視対象ネットワーク420の通信サービスの障害からの復旧を検出する。たとえば、サービス障害監視部415は、通信サービスにおけるデータの遅延量が閾値を下回ると通信サービスが障害から復旧したと判断する。サービス障害監視部415は、通信サービスの障害からの復旧の検出結果をサービス障害復旧通知として障害影響展開部416へ通知する。
【0052】
障害影響展開部416は、サービス障害監視部415からサービス障害発生通知があると、障害が発生した通信サービスの経路上の各通信装置を影響展開経路情報417へ格納する。また、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があると、障害の特定処理を行う。すなわち、障害影響展開部416は、装置障害情報414に格納された通信装置の障害の中から、復旧した通信サービスの障害発生時の経路として影響展開経路情報417に格納された各通信装置に含まれる通信装置の障害を特定する。そして、障害影響展開部416は、特定した障害の重要度を下げることを要求する重要度変更通知を装置障害監視部413に対して行う。
【0053】
図1に示した装置障害検出部111および出力部116は、たとえば装置障害監視部413によって実現することができる。図1に示したサービス障害検出部112およびサービス復旧検出部114は、たとえばサービス障害監視部415によって実現することができる。図1に示した記憶部113は、たとえば影響展開経路情報417を記憶するメインメモリ320や補助メモリ330によって実現することができる。図1に示した特定部115は、たとえば障害影響展開部416によって実現することができる。
【0054】
(経路情報)
図5は、経路情報の一例を示す図である。図5に示すように、経路情報412には、監視対象ネットワーク420において提供されるサービスごとにアクティブ経路が格納されている。図5に示す経路情報412には、レコードNo1として、たとえば図2−1に示した通信サービス201の経路であるネットワーク装置#1,#2,#4,#5,#7,#8,#10が格納されている。また、図5に示す経路情報412では、レコードNo2として、たとえば図2−1に示した通信サービス202の経路であるネットワーク装置#10,#8,#7,#5,#4,#2,#1が格納されている。
【0055】
(装置障害情報)
図6は、装置障害情報の一例を示す図である。図6に示すように、装置障害情報414には、たとえば、監視対象ネットワーク420において発生した装置障害ごとに、装置障害の発生日時と、復旧日時と、発生箇所と、発生種別と、が格納されている。
【0056】
図6に示す装置障害情報414には、たとえば図2−3に示したネットワーク装置#2,#4の間のリンクの障害が格納されている。ネットワーク装置#2,#4の間のリンクの障害の種別はポート障害となっている。また、図6に示す装置障害情報414には、図2−3に示したネットワーク装置#6の障害が格納されている。ネットワーク装置#6の障害の種別はDK(ディスク)障害となっている。
【0057】
(影響展開経路情報)
図7は、影響展開経路情報の一例を示す図である。図7に示すように、影響展開経路情報417には、たとえば、通信サービスごとに、サービス障害の発生日時と、サービス障害の復旧日時と、サービス障害発生時のアクティブ経路と、が格納されている。
【0058】
図7に示す影響展開経路情報417には、たとえば図2−2に示した通信サービス201,202の障害発生時のアクティブ経路が格納されている。通信サービス201,202のサービス障害の発生日時は、たとえば図2−2に示した状態の日時を示している。通信サービス201,202のサービス障害の復旧日時は、たとえば図2−4に示した状態の日時を示している。
【0059】
(経路情報管理部による経路収集処理)
図8は、経路情報管理部による経路収集処理の一例を示すフローチャートである。経路情報管理部411は、たとえば以下の各ステップを実行する。まず、経路情報管理部411は、経路収集処理の実行タイミングになったか否かを判断し(ステップS801)、実行タイミングになるまで待つ(ステップS801:Noのループ)。経路収集処理の実行タイミングは、たとえばあらかじめ設定された定期的なタイミングである。
【0060】
ステップS801において、実行タイミングになると(ステップS801:Yes)、経路情報管理部411は、監視対象ネットワーク420からLSA情報を収集する(ステップS802)。つぎに、経路情報管理部411は、ステップS802によって収集したLSA情報に基づいて、通信サービスのアクティブ経路を取得する(ステップS803)。つぎに、経路情報管理部411は、ステップS803によって取得したアクティブ経路に基づいて経路情報412を更新し(ステップS804)、ステップS801へ戻る。
【0061】
以上の各ステップにより、経路情報管理部411は、監視対象ネットワーク420のLSA情報を定期的に収集して経路情報412におけるアクティブ経路の情報を更新することができる。
【0062】
(装置障害監視部による装置障害監視処理)
図9は、装置障害監視部による装置障害監視処理の一例を示すフローチャートである。装置障害監視部413は、たとえば以下の各ステップを実行する。まず、装置障害監視部413は、装置障害監視処理の実行タイミングになったか否かを判断し(ステップS901)、実行タイミングになるまで待つ(ステップS901:Noのループ)。装置障害監視処理の実行タイミングは、たとえばあらかじめ設定された定期的なタイミングである。
【0063】
ステップS901において、実行タイミングになると(ステップS901:Yes)、装置障害監視部413は、監視対象ネットワーク420から装置障害情報を収集する(ステップS902)。つぎに、装置障害監視部413は、ステップS902によって収集した装置障害情報に基づいて、監視対象ネットワーク420において装置障害が発生したか否かを判断する(ステップS903)。装置障害が発生していない場合(ステップS903:No)は、装置障害監視部413は、ステップS901へ戻る。
【0064】
ステップS903において、装置障害が発生した場合(ステップS903:Yes)は、装置障害監視部413は、装置障害情報414を更新する(ステップS904)。つぎに、装置障害監視部413は、ステップS903において発生したと判断した装置障害を表示し(ステップS905)、ステップS901へ戻る。
【0065】
以上の各ステップにより、装置障害監視部413は、監視対象ネットワーク420の装置障害情報を定期的に収集して監視対象ネットワーク420における装置障害を検出し、装置障害を検出した場合に装置障害情報を更新することができる。また、装置障害監視部413は、装置障害を検出した場合に装置障害の通知を開始することができる。
【0066】
(装置障害監視部による重要度変更処理)
図10は、装置障害監視部による重要度変更処理の一例を示すフローチャートである。装置障害監視部413は、図9に示した処理とともに、たとえば以下の各ステップを実行する。まず、装置障害監視部413は、障害影響展開部416から重要度変更通知があったか否かを判断し(ステップS1001)、重要度変更通知があるまで待つ(ステップS1001:Noのループ)。
【0067】
ステップS1001において、重要度変更通知があると(ステップS1001:Yes)、装置障害監視部413は、重要度変更通知に基づいて、ステップS905によって開始した装置障害の表示を更新し(ステップS1002)、ステップS1001へ戻る。たとえば、装置障害監視部413は、たとえば図2−5に示したように、装置障害を示すマークの色を薄くすることによって装置障害の重要度が下がったことをユーザへ通知する。
【0068】
以上の各ステップにより、装置障害監視部413は、障害影響展開部416から重要度変更通知があった場合に、重要度変更通知にかかる装置障害の重要度が下がったことをユーザへ通知することができる。
【0069】
(サービス障害監視部によるサービス障害監視処理)
図11は、サービス障害監視部によるサービス障害監視処理の一例を示すフローチャートである。サービス障害監視部415は、たとえば以下の各ステップを実行する。まず、サービス障害監視部415は、サービス障害監視処理の実行タイミングになったか否かを判断し(ステップS1101)、実行タイミングになるまで待つ(ステップS1101:Noのループ)。サービス障害監視処理の実行タイミングは、たとえばあらかじめ設定された定期的なタイミングである。
【0070】
ステップS1101において、実行タイミングになった場合(ステップS1101:Yes)は、サービス障害監視部415は、監視対象ネットワーク420からサービス障害情報を収集する(ステップS1102)。つぎに、サービス障害監視部415は、ステップS1102によって収集したサービス障害情報に基づいて、監視対象ネットワーク420においてサービス障害が発生したか否かを判断する(ステップS1103)。
【0071】
ステップS1103において、監視対象ネットワーク420にサービス障害が発生した場合(ステップS1103:Yes)は、サービス障害監視部415は、障害影響展開部416に対してサービス障害発生通知を行い(ステップS1104)、ステップS1101へ戻る。
【0072】
ステップS1103において、サービス障害が発生していない場合(ステップS1103:No)は、サービス障害監視部415は、ステップS1105へ移行する。すなわち、サービス障害監視部415は、ステップS1102によって収集したサービス障害情報に基づいて、監視対象ネットワーク420において発生していたサービス障害が復旧したか否かを判断する(ステップS1105)。
【0073】
ステップS1105において、サービス障害が復旧していない場合(ステップS1105:No)は、サービス障害監視部415は、ステップS1101へ戻る。サービス障害が復旧した場合(ステップS1105:Yes)は、サービス障害監視部415は、障害影響展開部416に対してサービス障害復旧通知を行い(ステップS1106)、ステップS1101へ戻る。
【0074】
以上の各ステップにより、サービス障害監視部415は、監視対象ネットワーク420のサービス障害情報を定期的に収集して監視対象ネットワーク420におけるサービス障害を検出し、サービス障害を検出した場合にサービス障害発生通知を行うことができる。また、サービス障害監視部415は、サービス障害の復旧を検出した場合にサービス障害復旧通知を行うことができる。
【0075】
(障害影響展開部によるサービス障害発生に対する処理)
図12は、障害影響展開部によるサービス障害発生に対する処理の一例を示すフローチャートである。障害影響展開部416は、たとえば以下の各ステップを実行する。まず、障害影響展開部416は、サービス障害監視部415からサービス障害発生通知があったか否かを判断し(ステップS1201)、サービス障害発生通知があるまで待つ(ステップS1201:Noのループ)。
【0076】
ステップS1201において、サービス障害発生通知があると(ステップS1201:Yes)、障害影響展開部416は、経路情報412を取得する(ステップS1202)。つぎに、障害影響展開部416は、ステップS1202によって取得した経路情報412から、サービス障害が発生したアクティブ経路を取得する(ステップS1203)。
【0077】
つぎに、障害影響展開部416は、ステップS1203によって取得したアクティブ経路とサービス障害発生日時を影響展開経路情報417に格納し(ステップS1204)、ステップS1201へ戻る。
【0078】
以上の各ステップにより、障害影響展開部416は、サービス障害監視部415からサービス障害発生通知があった場合に、通信サービスの障害発生時のアクティブ経路を影響展開経路情報417に格納することができる。
【0079】
(障害影響展開部によるサービス障害復旧に対する処理)
図13は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。障害影響展開部416は、図12に示した処理とともに、たとえば以下の各ステップを実行する。まず、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があったか否かを判断し(ステップS1301)、サービス障害復旧通知があるまで待つ(ステップS1301:Noのループ)。
【0080】
ステップS1301において、サービス障害復旧通知があると(ステップS1301:Yes)、障害影響展開部416は、サービス障害復旧日時を影響展開経路情報417に格納する(ステップS1302)。つぎに、障害影響展開部416は、装置障害情報414および影響展開経路情報417を参照する(ステップS1303)。
【0081】
つぎに、障害影響展開部416は、ステップS1303によって参照した装置障害情報414および影響展開経路情報417に基づいて、サービス障害復旧済みの経路に含まれる装置障害があるか否かを判断する(ステップS1304)。具体的には、障害影響展開部416は、装置障害情報414が示す装置障害の発生箇所が、影響展開経路情報417が示すサービス障害復旧済みのアクティブ経路に含まれているか否かを判断する。
【0082】
影響展開経路情報417が示すサービス障害復旧済みのアクティブ経路は、たとえばサービス障害復旧日時が格納された通信サービスのアクティブ経路である。たとえば、図6に示した装置障害情報414のうちのネットワーク装置#2〜#4の間のリンクの障害は、図7に示した通信サービス201,202のサービス障害発生時のアクティブ経路に含まれていると判断される。また、図6に示した装置障害情報414のうちのネットワーク装置#6の障害は、図7に示した通信サービス201,202のサービス障害発生時のアクティブ経路に含まれていないと判断される。
【0083】
ステップS1304において、サービス障害復旧済みのアクティブ経路に含まれる装置障害がない場合(ステップS1304:No)は、障害影響展開部416は、ステップS1301へ戻る。サービス障害復旧済みのアクティブ経路に含まれる装置障害がある場合(ステップS1304:Yes)は、障害影響展開部416は、装置障害監視部413に対して重要度変更通知を行い(ステップS1305)、ステップS1301へ戻る。
【0084】
以上の各ステップにより、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があった場合に、経路切替により復旧済みの通信サービスの元の経路上の通知装置の障害を特定することができる。そして、障害影響展開部416は、特定した障害の表示の重要度を下げるように装置障害監視部413に通知することができる。
【0085】
このように、実施の形態1にかかる監視補助装置410は、通信サービスの障害発生時の経路を記憶しておく。そして、監視補助装置410は、経路切替により通信サービスが復旧した場合に、記憶しておいた経路に含まれる装置障害を他の装置障害と区別してユーザに通知する。これにより、ユーザは、通信サービスへの影響が少ない装置障害には低い優先度で対応することが可能になる。このため、通信サービスへの影響が大きい装置障害に優先的に対応することが可能になり、保守の効率を向上させることができる。
【0086】
(実施の形態2)
実施の形態2においては、実施の形態1と異なる部分について説明する。
【0087】
(監視補助装置の構成)
図14は、実施の形態2にかかる監視補助装置の構成の一例を示す図である。図14において、図4に示した部分と同様の部分については同一の符号を付して説明を省略する。図14に示すように、実施の形態2にかかる監視補助装置410は、図4に示した構成において、検出遅延時間情報1411をさらに記憶している。検出遅延時間情報1411は、たとえば図3に示したメインメモリ320または補助メモリ330に記憶される。
【0088】
検出遅延時間情報1411は、監視対象ネットワーク420の通信装置の種別および装置障害の種別ごとに、最大遅延時間が対応付けられた対応情報である。最大遅延時間は、サービス障害がサービス障害監視部415によって検出されてから、サービス障害の要因となった装置障害が装置障害監視部413によって検出されるまでの最大の遅延時間を示す情報である。
【0089】
障害影響展開部416は、特定した装置障害の種別、発生日時および装置障害が発生した通信装置を装置障害情報414から取得する。そして、障害影響展開部416は、特定した装置障害が発生した通信装置の種別を取得する。たとえば、監視補助装置410の補助メモリ330には、監視対象ネットワーク420の各通信装置の種別を示す装置種別情報が記憶されており、障害影響展開部416は、装置種別情報に基づいて通信装置の種別を取得することができる。
【0090】
つぎに、障害影響展開部416は、取得した通信装置の種別および装置障害の種別の組み合わせに対応する最大遅延時間を検出遅延時間情報1411から取得する取得部の機能を有する。また、障害影響展開部416は、サービス障害復旧通知にかかる通信サービスのサービス障害の発生日時を影響展開経路情報417から取得する。
【0091】
また、障害影響展開部416は、サービス障害の発生日時から装置障害の発生日時までの経過時間を算出する算出部としての機能を有する。これにより、通信サービスの障害が検出された時点から、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害として特定された障害が検出された時点までの経過時間を算出することができる。
【0092】
また、障害影響展開部416は、算出した経過時間が、検出遅延時間情報1411から取得した最大遅延時間以内であるか否かを判断する判断部としての機能を有する。障害影響展開部416は、経過時間が最大遅延時間以内である場合は、サービス障害発生通知にかかるサービス障害は特定した装置障害に起因して発生したと判断する。この場合は、障害影響展開部416は、装置障害監視部413へ重要度変更通知を行う。
【0093】
また、障害影響展開部416は、算出した経過時間が、検出遅延時間情報1411から取得した最大遅延時間を超えている場合は、サービス障害発生通知にかかるサービス障害は特定した装置障害とは異なる要因で発生したと判断する。この場合は、特定した装置障害は、サービス障害発生通知にかかる通信サービスとは異なる通信サービスに影響を与えている可能性が高い。このため、障害影響展開部416は、装置障害監視部413へ重要度変更通知を行わない。この場合は、特定された装置障害の表示の重要度が低下しない。
【0094】
(検出遅延時間情報)
図15は、検出遅延時間情報の一例を示す図である。図15に示すように、検出遅延時間情報1411においては、装置種別と障害種別との組み合わせごとに最大遅延時間が対応付けられている。装置種別は、監視対象ネットワーク420における各通信装置の種別である。障害種別は、装置障害の種別である。たとえば、ポート障害は、通信装置の通信ポートに発生した障害を示している。DK障害は、通信装置のディスクに発生した障害を示している。
【0095】
(障害影響展開部によるサービス障害復旧に対する処理)
図16は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。実施の形態2にかかる障害影響展開部416は、図12に示した処理とともに、たとえば以下の各ステップを実行する。図16に示すステップS1601〜S1604は、図13に示したステップS1301〜S1304と同様である。
【0096】
ステップS1604において、サービス障害復旧済みのアクティブ経路に含まれる装置障害がある場合(ステップS1604:Yes)は、障害影響展開部416は、サービス障害発生日時から、サービス障害復旧済みのアクティブ経路に含まれる装置障害の発生日時までの経過時間を算出する(ステップS1605)。
【0097】
つぎに、障害影響展開部416は、検出遅延時間情報1411から、サービス障害復旧済みのアクティブ経路に含まれる装置障害にかかる装置種別および障害種別に対応する最大遅延時間を取得する(ステップS1606)。つぎに、障害影響展開部416は、ステップS1605によって算出した経過時間が、ステップS1606によって取得した最大遅延時間以下か否かを判断する(ステップS1607)。
【0098】
ステップS1607において、経過時間が最大遅延時間を超えている場合(ステップS1607:No)は、障害影響展開部416は、ステップS1601へ戻る。経過時間が最大遅延時間以下である場合(ステップS1607:Yes)は、障害影響展開部416は、装置障害監視部413に対して重要度変更通知を行い(ステップS1608)、ステップS1601へ戻る。
【0099】
以上の各ステップにより、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があった場合に、経路切替により復旧済みの通信サービスの元の経路上の通知装置の障害を特定することができる。そして、障害影響展開部416は、特定した障害の表示の重要度を下げるように装置障害監視部413に通知することができる。
【0100】
また、障害影響展開部416は、サービス障害発生日時から装置障害の発生日時までの経過時間が最大遅延時間を超えている場合は装置障害監視部413へ通知を行わない。これにより、復旧した通信サービスの障害に関連がない装置障害について重要度を下げてしまうことを回避することができる。
【0101】
このように、実施の形態2にかかる監視補助装置410は、通信サービスの障害が検出された時点から、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害として特定された障害が検出された時点までの経過時間を算出する。そして、監視補助装置410は、算出した経過時間が所定時間以内である場合に、特定した装置障害を他の装置障害と区別して通知する。
【0102】
これにより、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害のうちの、サービス障害と関連のある可能性の高い障害を他の装置障害と区別して通知することができる。このため、通信サービスへの影響が大きい装置障害に優先的に対応することが可能になり、保守の効率をさらに向上させることができる。
【0103】
また、監視補助装置410は、算出した経過時間が所定時間を超えている場合に、たとえば、特定した装置障害を他の装置障害と区別せずに通知する。これにより、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害のうちの、サービス障害と関連のある可能性の低い障害を他の装置障害と区別せずに通知することができる。このため、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害であるが、他の通信サービスへの影響がある可能性のある装置障害については優先的に対応することが可能になり、保守の効率をさらに向上させることができる。
【0104】
たとえば、監視補助装置410は、通信サービスの障害が検出されてから、通信サービスの障害の要因となった通信装置の障害が検出されるまでの最大遅延時間を取得してもよい。最大遅延時間は、あらかじめ監視補助装置410の補助メモリ330などに記憶しておくことができる。そして、監視補助装置410は、算出した経過時間が取得した最大遅延時間であるか否かを判断する。
【0105】
通信サービスの障害が検出されてから、通信サービスの障害の要因となった通信装置の障害が検出されるまでの最大遅延時間は、通信装置の種別や通信装置の障害の種別によって左右される。このため、監視補助装置410は、通信装置の種別や通信装置の障害の種別の組み合わせごとに最大遅延時間を対応付ける対応情報を記憶しておいてもよい。監視補助装置410は、特定した障害が発生した通信装置の種別および特定した障害の種別の組み合わせに対応する最大遅延情報を対応情報から取得してもよい。
【0106】
これにより、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害のうちの、サービス障害と関連のある可能性の高い障害を、他の装置障害とより精度よく区別して通知することができる。このため、通信サービスへの影響が大きい装置障害に優先的に対応することが可能になり、保守の効率をさらに向上させることができる。
【0107】
なお、検出遅延時間情報1411(対応情報)において、通信装置の種別および装置障害の種別ごとに最大遅延時間が対応付けられている構成について説明したが、このような構成に限らない。たとえば、検出遅延時間情報1411において、通信装置の種別ごとに最大遅延時間が対応付けられていてもよい。また、検出遅延時間情報1411において、装置障害の種別ごとに最大遅延時間が対応付けられていてもよい。
【0108】
以上説明したように、監視補助装置、監視補助方法および監視補助プログラムによれば、通信障害の発生時の通信経路を記憶しておき、経路切替で通信が復旧した場合に、記憶しておいた通信経路に含まれる装置障害を他と区別して通知することができる。これにより、通信への影響が少ない装置障害には低優先度で対応できるようになり、保守の効率を向上させることができる。
【0109】
なお、上述した各実施の形態で説明した監視補助方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【0110】
上述した各実施の形態に関し、さらに以下の付記を開示する。
【0111】
(付記1)ネットワークの通信装置の障害を検出する装置障害検出部と、
前記ネットワークの通信サービスの障害を検出するサービス障害検出部と、
前記サービス障害検出部によって障害が検出されたときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶する記憶部と、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出するサービス復旧検出部と、
前記サービス復旧検出部によって前記復旧が検出された場合に、前記装置障害検出部によって障害が検出された通信装置の中から、前記記憶部によって記憶された識別情報が示す各通信装置に含まれる通信装置を特定する特定部と、
前記装置障害検出部によって障害が検出された通信装置を示す障害情報を出力し、前記障害が検出された通信装置のうちの前記特定部によって特定された通信装置を示す障害情報を他の障害情報と区別して出力する出力部と、
を備えることを特徴とする監視補助装置。
【0112】
(付記2)前記出力部は、前記他の障害情報を、前記特定された通信装置を示す障害情報より強調した状態で通知することを特徴とする付記1に記載の監視補助装置。
【0113】
(付記3)前記通信サービスの障害が前記サービス障害検出部によって検出された時点から、前記特定部によって特定された通信装置の障害が前記装置障害検出部によって検出された時点までの経過時間を算出する算出部と、
前記算出部によって算出された経過時間が所定時間以内であるか否かを判断する判断部と、を備え、
前記出力部は、前記特定された通信装置のうちの前記判断部によって前記経過時間が前記所定時間以内であると判断された通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする付記1または2に記載の監視補助装置。
【0114】
(付記4)前記通信サービスの障害が前記サービス障害検出部によって検出されてから、前記通信サービスの障害の要因となった前記通信装置の障害が前記装置障害検出部によって検出されるまでの最大遅延時間を取得する取得部を備え、
前記判断部は、前記算出部によって算出された経過時間が、前記取得部によって取得された最大遅延時間以内であるか否かを判断することを特徴とする付記3に記載の監視補助装置。
【0115】
(付記5)前記取得部は、前記通信装置の種別および前記通信装置の障害の種別の組み合わせごとに前記最大遅延時間が対応付けられた対応情報から、前記特定された障害が発生した通信装置の種別および前記特定された障害の種別の組み合わせに対応する最大遅延情報を取得することを特徴とする付記4に記載の監視補助装置。
【0116】
(付記6)前記取得部は、前記通信装置の種別ごとに前記最大遅延時間が対応付けられた対応情報から、前記特定された障害が発生した通信装置の種別および前記特定された障害の種別の組み合わせに対応する最大遅延情報を取得することを特徴とする付記4に記載の監視補助装置。
【0117】
(付記7)前記取得部は、前記通信装置の障害の種別ごとに前記最大遅延時間が対応付けられた対応情報から、前記特定された障害が発生した通信装置の種別および前記特定された障害の種別の組み合わせに対応する最大遅延情報を取得することを特徴とする付記4に記載の監視補助装置。
【0118】
(付記8)ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする監視補助方法。
【0119】
(付記9)ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力する処理をコンピュータに実行させることを特徴とする監視補助プログラム。
【符号の説明】
【0120】
110,410 監視補助装置
120,200,420 監視対象ネットワーク
#1〜#10 ネットワーク装置
211〜21n,221〜22m 端末
201,202 通信サービス
203,231 障害発生マーク
300 情報処理装置
301 バス
【技術分野】
【0001】
本発明は、監視補助装置、監視補助方法および監視補助プログラムに関する。
【背景技術】
【0002】
従来、IP(Internet Protocol)ネットワークなどのネットワークの保守を容易にするために、ネットワーク全体の接続構成や経路を算出して可視化する技術が知られている。ネットワーク全体の接続構成や経路の算出は、たとえば、OSPF(Open Shortest Path First)のLSA(Link State Advertisement:リンク状態広告)情報を収集してルーティング解析することにより行われる。
【0003】
また、ネットワークにおいて発生した通信装置の障害を通知する技術や、ネットワークにおいて発生した通信サービスの障害を通知する技術が知られている。また、ネットワークオペレーションシステムにおいて、ネットワーク障害により影響を受ける顧客回線を特定する技術が知られている(たとえば、下記特許文献1参照。)。通信装置の障害および通信サービスの障害を検出する場合に、通信装置が故障して装置障害が検出されるより、通信装置が故障する前に不安定になってサービス障害が先に検出される場合が多い。
【0004】
また、IPネットワークなどのネットワークにおいては、たとえば、通信サービスの経路上の装置障害が発生した場合に、障害が発生した通信装置を迂回した経路へ自律的に切り替えることで通信サービスを復旧する技術が用いられている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−101042号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来技術では、経路切替によってサービス障害から復旧した後も、サービス障害の要因となっていた経路切替前の経路上の装置障害も他の装置障害とともに保守者に通知される。このため、保守者は、通信サービスに現に影響が出ている装置障害と、通信サービスに影響が出ていない装置障害と、を区別することができず、保守を効率よく行うことができなかった。
【0007】
本発明は、上述した従来技術による問題点を解消するため、保守の効率を向上させることができる監視補助装置、監視補助方法および監視補助プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するため、本発明の一側面によれば、ネットワークの通信装置の障害を検出し、前記ネットワークの通信サービスの障害を検出し、前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を記憶し、前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、前記復旧を検出した場合に、検出した前記通信装置の障害の中から、記憶した各通信装置に含まれる通信装置の障害を特定し、検出した前記各通信装置の障害をユーザに通知し、検出した前記各通信装置の障害のうちの特定した障害を他の障害と区別して通知する監視補助装置、監視補助方法および監視補助プログラムが提案される。
【発明の効果】
【0009】
本発明の一側面によれば、保守の効率を向上させることができるという効果を奏する。
【図面の簡単な説明】
【0010】
【図1】図1は、本発明にかかる監視補助装置の一例を示す図である。
【図2−1】図2−1は、監視補助装置によるネットワークの監視の一例を示す図(その1)である。
【図2−2】図2−2は、監視補助装置によるネットワークの監視の一例を示す図(その2)である。
【図2−3】図2−3は、監視補助装置によるネットワークの監視の一例を示す図(その3)である。
【図2−4】図2−4は、監視補助装置によるネットワークの監視の一例を示す図(その4)である。
【図2−5】図2−5は、監視補助装置によるネットワークの監視の一例を示す図(その5)である。
【図3】図3は、監視補助装置のハードウェア構成の一例を示す図である。
【図4】図4は、実施の形態1にかかる監視補助装置の構成の一例を示す図である。
【図5】図5は、経路情報の一例を示す図である。
【図6】図6は、装置障害情報の一例を示す図である。
【図7】図7は、影響展開経路情報の一例を示す図である。
【図8】図8は、経路情報管理部による経路収集処理の一例を示すフローチャートである。
【図9】図9は、装置障害監視部による装置障害監視処理の一例を示すフローチャートである。
【図10】図10は、装置障害監視部による重要度変更処理の一例を示すフローチャートである。
【図11】図11は、サービス障害監視部によるサービス障害監視処理の一例を示すフローチャートである。
【図12】図12は、障害影響展開部によるサービス障害発生に対する処理の一例を示すフローチャートである。
【図13】図13は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。
【図14】図14は、実施の形態2にかかる監視補助装置の構成の一例を示す図である。
【図15】図15は、検出遅延時間情報の一例を示す図である。
【図16】図16は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下に添付図面を参照して、本発明にかかる監視補助装置、監視補助方法および監視補助プログラムの実施の形態を詳細に説明する。
【0012】
(本発明にかかる監視補助装置)
図1は、本発明にかかる監視補助装置の一例を示す図である。図1に示す監視補助装置110は、たとえば、監視対象ネットワーク120の監視者による監視対象ネットワーク120の装置障害およびサービス障害の監視を補助する監視補助装置である。装置障害は、たとえば、監視対象ネットワーク120における通信装置の障害である。サービス障害は、たとえば、監視対象ネットワーク120における通信装置によって提供される通信サービスの障害である。
【0013】
図1に示すように、監視補助装置110は、装置障害検出部111と、サービス障害検出部112と、記憶部113と、サービス復旧検出部114と、特定部115と、出力部116と、を備えている。
【0014】
装置障害検出部111は、監視対象ネットワーク120の各通信装置の障害を検出する。たとえば、監視対象ネットワーク120の各通信装置は、装置障害の発生状態を示す装置障害情報を監視補助装置110へ送信する。装置障害検出部111は、監視対象ネットワーク120の通信装置から送信された装置障害情報を受信し、受信した装置障害情報に基づいて通信装置の障害を検出する。装置障害検出部111は、通信装置の障害を検出すると、検出結果を特定部115および出力部116へ通知する。
【0015】
サービス障害検出部112は、監視対象ネットワーク120の通信サービスの障害を検出する。たとえば、監視対象ネットワーク120には、監視対象ネットワーク120における通信サービスの状態を監視するサービス監視補助装置が設けられており、サービス監視補助装置は監視結果を監視補助装置110へ送信する。サービス障害検出部112は、サービス監視補助装置から送信された監視結果を受信し、受信した監視結果に基づいて通信サービスの障害を検出する。サービス障害検出部112は、通信サービスの障害を検出すると、障害を検出した通信サービスの経路上の各通信装置を示す識別情報を記憶部113へ出力する。
【0016】
記憶部113は、サービス障害検出部112から出力された識別情報を記憶する。これにより、記憶部113は、サービス障害検出部112によって通信サービスの障害が検出されたときの通信サービスの経路上の各通信装置を記憶することができる。
【0017】
サービス復旧検出部114は、通信サービスの経路切替による障害からの復旧を検出する。通信サービスの経路切替は、監視対象ネットワーク120の各通信装置によって自律的に行われる。具体的には、監視対象ネットワーク120の各通信装置は、通信サービスの経路上の通信装置の障害発生時に、障害が発生した通信装置を迂回する経路への自律的な経路切替を行うことで通信サービスを復旧する。サービス復旧検出部114は、通信サービスの障害からの復旧を検出すると、検出結果を特定部115へ通知する。
【0018】
特定部115は、通信サービスの障害からの復旧がサービス復旧検出部114から通知されると、装置障害検出部111から障害が通知された通信装置の中から、記憶部113によって記憶されている識別情報が示す各通信装置に含まれる通信装置を特定する。特定部115は、特定した通信装置を出力部116へ通知する。
【0019】
出力部116は、装置障害検出部111から通知された通信装置を示す障害情報を出力する。たとえば、出力部116は、障害情報が示す通信装置を、障害が発生した通信装置として通知する。これにより、ユーザは、監視対象ネットワーク120において障害が発生した通信装置を知ることができる。出力部116による通知は、画面による表示であってもよいし、音声による通知などであってもよい。ユーザは、たとえば監視対象ネットワーク120の保守者である。
【0020】
また、出力部116は、装置障害検出部111から通知された各障害のうちの特定部115から通知された障害を他の通信装置と区別してユーザに通知する。これにより、ユーザは、障害が発生した通信装置のうちの、経路切替によりすでに復旧した通信サービスの元の経路上の通信装置を他の通信装置と区別して知ることができる。
【0021】
このため、ユーザは、経路切替により復旧済みの通信サービスの元の経路上で障害が発生している通信装置については、他の障害が発生している通信装置よりも優先度を下げて対応することが可能になる。経路切替により復旧済みの通信サービスの元の経路上の通信装置については、障害が発生していても通信サービスは提供されている。
【0022】
したがって、経路切替により復旧済みの通信サービスの元の経路上で障害が発生している通信装置については、他の通信装置の障害より優先度を下げて対応することで、通信サービスに影響する通信装置の障害に優先的に対応することができる。このため、保守の効率を向上させることができる。
【0023】
たとえば、出力部116は、特定部115から通知された障害よりも他の障害を強調して通知する。これにより、ユーザは、経路切替により復旧済みの通信サービスの元の経路上の通信装置の障害が、他の通信装置の障害よりも優先度が低いことを容易に知ることができる。このため、保守の効率をさらに向上させることができる。
【0024】
(監視補助装置によるネットワークの監視)
図2−1は、監視補助装置によるネットワークの監視の一例を示す図(その1)である。図2−1に示す監視対象ネットワーク200は、図1に示した監視対象ネットワーク120の状態を監視補助装置110の出力部116が表示した画面の一例である。監視対象ネットワーク200は、たとえばIPによって通信が行われるIPネットワークである。
【0025】
監視対象ネットワーク200は、端末211〜21n(nは自然数)と、端末221〜22m(mは自然数)と、ネットワーク装置#1〜#10と、を含んでいる。たとえば、監視対象ネットワーク200において、端末211と端末221が、ネットワーク装置#1,#2,#4,#5,#7,#8,#10を介してデータ通信を行っているとする。
【0026】
具体的には、端末211から端末221へデータを送信する通信サービス201が提供されている。通信サービス201は、ネットワーク装置#1,#2,#4,#5,#7,#8,#10の順に経由して提供されている。また、端末221から端末211へデータを送信する通信サービス202が提供されている。通信サービス202は、ネットワーク装置#10,#8,#7,#5,#4,#2,#1の順に経由して提供されている。監視補助装置110は、通信サービス201,202の経路を実線矢印で示すことで、通信サービス201,202が提供されていることをユーザへ通知する。
【0027】
また、監視対象ネットワーク200において、ネットワーク装置#6に装置障害が発生しているとする。監視補助装置110は、ネットワーク装置#6の部分に障害発生マーク203を表示することによってネットワーク装置#6に装置障害が発生したことをユーザへ通知する。なお、ネットワーク装置#6は通信サービス201,202の経路上にないため、ネットワーク装置#6の障害は通信サービス201,202に影響しない。
【0028】
図2−2は、監視補助装置によるネットワークの監視の一例を示す図(その2)である。図2−2において、図2−1に示した部分と同様の部分については同一の符号を付して説明を省略する。図2−1に示した状態の後に、ネットワーク装置#2,#4の間で装置障害が発生したとする。ネットワーク装置#2,#4の間の経路は通信サービス201,202の経路上にあるため、ネットワーク装置#2,#4の間の装置障害により通信サービス201,202の障害が発生したとする。
【0029】
図2−2に示すように、監視補助装置110は、通信サービス201,202の障害を検出し、通信サービス201,202を実線から点線に変更することによって通信サービス201,202の障害が発生したことをユーザへ通知する。また、監視補助装置110は、通信サービス201,202の障害発生時の経路としてネットワーク装置#1,#2,#4,#5,#7,#8,#10を記憶しておく。なお、監視補助装置110は、ネットワーク装置#2,#4の間で発生した装置障害についてはまだ検出していない。
【0030】
図2−3は、監視補助装置によるネットワークの監視の一例を示す図(その3)である。図2−3において、図2−2に示した部分と同様の部分については同一の符号を付して説明を省略する。図2−2に示した状態の後に、監視補助装置110は、ネットワーク装置#2,#4の間で発生した装置障害を検出したとする。
【0031】
図2−3に示すように、監視補助装置110は、ネットワーク装置#2,#4の間に障害発生マーク231を表示することによってネットワーク装置#2,#4の間で装置障害が発生したことをユーザへ通知する。
【0032】
図2−4は、監視補助装置によるネットワークの監視の一例を示す図(その4)である。図2−4において、図2−3に示した部分と同様の部分については同一の符号を付して説明を省略する。図2−3に示した状態の後に、監視対象ネットワーク200は、ネットワーク装置#2,#4の間で装置障害が発生したことにより、ネットワーク装置#2,#4の間の経路を迂回するように自律的な経路切替を行ったとする。具体的には、通信サービス201,202のそれぞれが、ネットワーク装置#1,#3,#4,#5,#7,#8,#10を経由するように経路切替が行われたとする。
【0033】
図2−4に示すように、監視補助装置110は、通信サービス201,202の各矢印の経路を変更することによって通信サービス201,202の経路が切り替わったことをユーザへ通知する。また、監視補助装置110は、通信サービス201,202の各矢印を点線から実線に変更することによって通信サービス201,202の障害が復旧したことをユーザへ通知する。
【0034】
図2−5は、監視補助装置によるネットワークの監視の一例を示す図(その5)である。図2−5において、図2−4に示した部分と同様の部分については同一の符号を付して説明を省略する。ネットワーク装置#2,#4の間で発生した装置障害は、通信サービス201,202の障害発生時の経路として記憶しておいたネットワーク装置#1,#2,#4,#5,#7,#8,#10に含まれる通信装置の障害である。
【0035】
このため、図2−4に示した状態の後に、監視補助装置110は、図2−5に示すように、障害発生マーク231の色を薄くすることにより、ネットワーク装置#2,#4の間で発生した装置障害の重要度が低くなったことをユーザへ通知する。
【0036】
また、監視補助装置110は、障害発生マーク203については色を変更しないことで、ネットワーク装置#6の障害の方が、ネットワーク装置#2,#4の間の障害より重要度が高いことをユーザへ通知する。これにより、ユーザは、ネットワーク装置#2,#4の間の障害よりも通信サービスに影響を与える可能性が高いネットワーク装置#6の障害に優先的に対応することができる。
【0037】
図2−1〜図2−5においては、監視補助装置110の出力部116が、監視対象ネットワーク120の装置障害を監視対象ネットワーク120の画像によって通知する場合について説明した。ただし、装置障害の通知は監視対象ネットワーク120の画像によるものに限らない。たとえば、出力部116は、障害が発生した通信装置の識別情報を示すリストを表示することによって装置障害を通知してもよい。
【0038】
この場合は、出力部116は、たとえば、特定部115によって特定された障害にかかる通信装置よりも他の障害にかかる通信装置を上の行に表示することにより、特定部115によって特定された障害よりも他の障害を強調して通知する。または、出力部116は、特定部115によって特定された障害にかかる通信装置よりも他の障害にかかる通信装置を目立つ色やフォントで表示することにより、特定部115によって特定された障害よりも他の障害を強調して通知する。
【0039】
(監視補助装置のハードウェア構成)
図3は、監視補助装置のハードウェア構成の一例を示す図である。図1に示した監視補助装置110は、たとえば図3に示す情報処理装置300によって実現することができる。情報処理装置300は、CPU310と、メインメモリ320と、補助メモリ330と、ユーザインタフェース340と、通信インタフェース350と、を備えている。CPU310、メインメモリ320、補助メモリ330、ユーザインタフェース340および通信インタフェース350は、バス301によって接続されている。
【0040】
CPU310(Central Processing Unit)は、情報処理装置300の全体の制御を司る。また、情報処理装置300はCPU310を複数備えていてもよい。メインメモリ320は、たとえばRAM(Random Access Memory)である。メインメモリ320は、CPU310のワークエリアとして使用される。補助メモリ330は、たとえば、ハードディスク、光ディスク、フラッシュメモリなどの不揮発メモリである。補助メモリ330には、情報処理装置300を動作させる各種のプログラムが記憶されている。補助メモリ330に記憶されたプログラムは、メインメモリ320にロードされてCPU310によって実行される。
【0041】
ユーザインタフェース340は、たとえば、ユーザからの操作入力を受け付ける入力デバイスや、ユーザへ情報を出力する出力デバイスなどを含む。入力デバイスは、たとえばキー(たとえばキーボード)やリモコンなどによって実現することができる。出力デバイスは、たとえばディスプレイやスピーカなどによって実現することができる。また、タッチパネルなどによって入力デバイスおよび出力デバイスを実現してもよい。ユーザインタフェース340は、CPU310によって制御される。
【0042】
通信インタフェース350は、たとえば、無線によって情報処理装置300の外部(たとえば監視対象ネットワーク120)との間で通信を行う通信インタフェースである。通信インタフェース350は、CPU310によって制御される。
【0043】
図1に示した装置障害検出部111、サービス障害検出部112およびサービス復旧検出部114は、たとえばCPU310および通信インタフェース350によって実現することができる。また、記憶部113は、たとえば補助メモリ330によって実現することができる。また、特定部115は、たとえばCPU310によって実現することができる。また、出力部116は、たとえばユーザインタフェース340や通信インタフェース350によって実現することができる。
【0044】
(実施の形態1)
(監視補助装置の構成)
図4は、実施の形態1にかかる監視補助装置の構成の一例を示す図である。図4に示す実施の形態1にかかる監視補助装置410は、図1に示した監視補助装置110の具体例である。監視対象ネットワーク420は、たとえば図1に示した監視対象ネットワーク120に対応するネットワークである。
【0045】
監視補助装置410は、経路情報管理部411と、装置障害監視部413と、サービス障害監視部415と、障害影響展開部416と、を備えている。経路情報管理部411、装置障害監視部413およびサービス障害監視部415は、たとえば図3に示したCPU310および通信インタフェース350によって実現することができる。障害影響展開部416は、たとえば図3に示したCPU310によって実現することができる。
【0046】
また、監視補助装置410は、経路情報412と、装置障害情報414と、影響展開経路情報417と、を記憶している。経路情報412、装置障害情報414および影響展開経路情報417は、たとえば図3に示したメインメモリ320または補助メモリ330に記憶される。
【0047】
経路情報管理部411は、監視対象ネットワーク420からOSPFのLSA情報を受信して収集する。経路情報管理部411は、収集したLSA情報に基づいてルーティング解析を行うことにより、監視対象ネットワーク420において提供されているサービスのアクティブ経路を取得する。そして、経路情報管理部411は、取得したアクティブ経路をサービスごとに経路情報412に格納する。
【0048】
装置障害監視部413は、監視対象ネットワーク420から装置障害情報を受信して収集する。装置障害情報は、たとえば、SNMP(Simple Network Management Protocol)Trap、MIB(Management Information Base)ポーリング、システムログなどである。装置障害監視部413は、収集した装置障害情報に基づいて、監視対象ネットワーク420において発生した装置障害を検出する。装置障害監視部413は、検出した装置障害の情報を装置障害情報414に格納する。
【0049】
また、装置障害監視部413は、検出した装置障害をユーザへ通知する。また、装置障害監視部413は、障害影響展開部416から重要度変更通知があると、装置障害の通知における重要度を変更する。たとえば、装置障害監視部413は、図2−1〜図2−5に示した監視対象ネットワーク200を表示することによって装置障害を通知する。
【0050】
サービス障害監視部415は、監視対象ネットワーク420からサービス障害情報を受信して収集する。サービス障害情報は、たとえば、通信サービスにおけるデータの遅延やゆらぎを示す情報などである。サービス障害監視部415は、収集したサービス障害情報に基づいて、監視対象ネットワーク420において発生したサービス障害を検出する。たとえば、サービス障害監視部415は、通信サービスにおけるデータの遅延量が閾値を超えるとサービス障害が発生したと判断する。サービス障害監視部415は、サービス障害の検出結果をサービス障害発生通知として障害影響展開部416へ通知する。
【0051】
また、サービス障害監視部415は、収集したサービス障害情報に基づいて、監視対象ネットワーク420の通信サービスの障害からの復旧を検出する。たとえば、サービス障害監視部415は、通信サービスにおけるデータの遅延量が閾値を下回ると通信サービスが障害から復旧したと判断する。サービス障害監視部415は、通信サービスの障害からの復旧の検出結果をサービス障害復旧通知として障害影響展開部416へ通知する。
【0052】
障害影響展開部416は、サービス障害監視部415からサービス障害発生通知があると、障害が発生した通信サービスの経路上の各通信装置を影響展開経路情報417へ格納する。また、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があると、障害の特定処理を行う。すなわち、障害影響展開部416は、装置障害情報414に格納された通信装置の障害の中から、復旧した通信サービスの障害発生時の経路として影響展開経路情報417に格納された各通信装置に含まれる通信装置の障害を特定する。そして、障害影響展開部416は、特定した障害の重要度を下げることを要求する重要度変更通知を装置障害監視部413に対して行う。
【0053】
図1に示した装置障害検出部111および出力部116は、たとえば装置障害監視部413によって実現することができる。図1に示したサービス障害検出部112およびサービス復旧検出部114は、たとえばサービス障害監視部415によって実現することができる。図1に示した記憶部113は、たとえば影響展開経路情報417を記憶するメインメモリ320や補助メモリ330によって実現することができる。図1に示した特定部115は、たとえば障害影響展開部416によって実現することができる。
【0054】
(経路情報)
図5は、経路情報の一例を示す図である。図5に示すように、経路情報412には、監視対象ネットワーク420において提供されるサービスごとにアクティブ経路が格納されている。図5に示す経路情報412には、レコードNo1として、たとえば図2−1に示した通信サービス201の経路であるネットワーク装置#1,#2,#4,#5,#7,#8,#10が格納されている。また、図5に示す経路情報412では、レコードNo2として、たとえば図2−1に示した通信サービス202の経路であるネットワーク装置#10,#8,#7,#5,#4,#2,#1が格納されている。
【0055】
(装置障害情報)
図6は、装置障害情報の一例を示す図である。図6に示すように、装置障害情報414には、たとえば、監視対象ネットワーク420において発生した装置障害ごとに、装置障害の発生日時と、復旧日時と、発生箇所と、発生種別と、が格納されている。
【0056】
図6に示す装置障害情報414には、たとえば図2−3に示したネットワーク装置#2,#4の間のリンクの障害が格納されている。ネットワーク装置#2,#4の間のリンクの障害の種別はポート障害となっている。また、図6に示す装置障害情報414には、図2−3に示したネットワーク装置#6の障害が格納されている。ネットワーク装置#6の障害の種別はDK(ディスク)障害となっている。
【0057】
(影響展開経路情報)
図7は、影響展開経路情報の一例を示す図である。図7に示すように、影響展開経路情報417には、たとえば、通信サービスごとに、サービス障害の発生日時と、サービス障害の復旧日時と、サービス障害発生時のアクティブ経路と、が格納されている。
【0058】
図7に示す影響展開経路情報417には、たとえば図2−2に示した通信サービス201,202の障害発生時のアクティブ経路が格納されている。通信サービス201,202のサービス障害の発生日時は、たとえば図2−2に示した状態の日時を示している。通信サービス201,202のサービス障害の復旧日時は、たとえば図2−4に示した状態の日時を示している。
【0059】
(経路情報管理部による経路収集処理)
図8は、経路情報管理部による経路収集処理の一例を示すフローチャートである。経路情報管理部411は、たとえば以下の各ステップを実行する。まず、経路情報管理部411は、経路収集処理の実行タイミングになったか否かを判断し(ステップS801)、実行タイミングになるまで待つ(ステップS801:Noのループ)。経路収集処理の実行タイミングは、たとえばあらかじめ設定された定期的なタイミングである。
【0060】
ステップS801において、実行タイミングになると(ステップS801:Yes)、経路情報管理部411は、監視対象ネットワーク420からLSA情報を収集する(ステップS802)。つぎに、経路情報管理部411は、ステップS802によって収集したLSA情報に基づいて、通信サービスのアクティブ経路を取得する(ステップS803)。つぎに、経路情報管理部411は、ステップS803によって取得したアクティブ経路に基づいて経路情報412を更新し(ステップS804)、ステップS801へ戻る。
【0061】
以上の各ステップにより、経路情報管理部411は、監視対象ネットワーク420のLSA情報を定期的に収集して経路情報412におけるアクティブ経路の情報を更新することができる。
【0062】
(装置障害監視部による装置障害監視処理)
図9は、装置障害監視部による装置障害監視処理の一例を示すフローチャートである。装置障害監視部413は、たとえば以下の各ステップを実行する。まず、装置障害監視部413は、装置障害監視処理の実行タイミングになったか否かを判断し(ステップS901)、実行タイミングになるまで待つ(ステップS901:Noのループ)。装置障害監視処理の実行タイミングは、たとえばあらかじめ設定された定期的なタイミングである。
【0063】
ステップS901において、実行タイミングになると(ステップS901:Yes)、装置障害監視部413は、監視対象ネットワーク420から装置障害情報を収集する(ステップS902)。つぎに、装置障害監視部413は、ステップS902によって収集した装置障害情報に基づいて、監視対象ネットワーク420において装置障害が発生したか否かを判断する(ステップS903)。装置障害が発生していない場合(ステップS903:No)は、装置障害監視部413は、ステップS901へ戻る。
【0064】
ステップS903において、装置障害が発生した場合(ステップS903:Yes)は、装置障害監視部413は、装置障害情報414を更新する(ステップS904)。つぎに、装置障害監視部413は、ステップS903において発生したと判断した装置障害を表示し(ステップS905)、ステップS901へ戻る。
【0065】
以上の各ステップにより、装置障害監視部413は、監視対象ネットワーク420の装置障害情報を定期的に収集して監視対象ネットワーク420における装置障害を検出し、装置障害を検出した場合に装置障害情報を更新することができる。また、装置障害監視部413は、装置障害を検出した場合に装置障害の通知を開始することができる。
【0066】
(装置障害監視部による重要度変更処理)
図10は、装置障害監視部による重要度変更処理の一例を示すフローチャートである。装置障害監視部413は、図9に示した処理とともに、たとえば以下の各ステップを実行する。まず、装置障害監視部413は、障害影響展開部416から重要度変更通知があったか否かを判断し(ステップS1001)、重要度変更通知があるまで待つ(ステップS1001:Noのループ)。
【0067】
ステップS1001において、重要度変更通知があると(ステップS1001:Yes)、装置障害監視部413は、重要度変更通知に基づいて、ステップS905によって開始した装置障害の表示を更新し(ステップS1002)、ステップS1001へ戻る。たとえば、装置障害監視部413は、たとえば図2−5に示したように、装置障害を示すマークの色を薄くすることによって装置障害の重要度が下がったことをユーザへ通知する。
【0068】
以上の各ステップにより、装置障害監視部413は、障害影響展開部416から重要度変更通知があった場合に、重要度変更通知にかかる装置障害の重要度が下がったことをユーザへ通知することができる。
【0069】
(サービス障害監視部によるサービス障害監視処理)
図11は、サービス障害監視部によるサービス障害監視処理の一例を示すフローチャートである。サービス障害監視部415は、たとえば以下の各ステップを実行する。まず、サービス障害監視部415は、サービス障害監視処理の実行タイミングになったか否かを判断し(ステップS1101)、実行タイミングになるまで待つ(ステップS1101:Noのループ)。サービス障害監視処理の実行タイミングは、たとえばあらかじめ設定された定期的なタイミングである。
【0070】
ステップS1101において、実行タイミングになった場合(ステップS1101:Yes)は、サービス障害監視部415は、監視対象ネットワーク420からサービス障害情報を収集する(ステップS1102)。つぎに、サービス障害監視部415は、ステップS1102によって収集したサービス障害情報に基づいて、監視対象ネットワーク420においてサービス障害が発生したか否かを判断する(ステップS1103)。
【0071】
ステップS1103において、監視対象ネットワーク420にサービス障害が発生した場合(ステップS1103:Yes)は、サービス障害監視部415は、障害影響展開部416に対してサービス障害発生通知を行い(ステップS1104)、ステップS1101へ戻る。
【0072】
ステップS1103において、サービス障害が発生していない場合(ステップS1103:No)は、サービス障害監視部415は、ステップS1105へ移行する。すなわち、サービス障害監視部415は、ステップS1102によって収集したサービス障害情報に基づいて、監視対象ネットワーク420において発生していたサービス障害が復旧したか否かを判断する(ステップS1105)。
【0073】
ステップS1105において、サービス障害が復旧していない場合(ステップS1105:No)は、サービス障害監視部415は、ステップS1101へ戻る。サービス障害が復旧した場合(ステップS1105:Yes)は、サービス障害監視部415は、障害影響展開部416に対してサービス障害復旧通知を行い(ステップS1106)、ステップS1101へ戻る。
【0074】
以上の各ステップにより、サービス障害監視部415は、監視対象ネットワーク420のサービス障害情報を定期的に収集して監視対象ネットワーク420におけるサービス障害を検出し、サービス障害を検出した場合にサービス障害発生通知を行うことができる。また、サービス障害監視部415は、サービス障害の復旧を検出した場合にサービス障害復旧通知を行うことができる。
【0075】
(障害影響展開部によるサービス障害発生に対する処理)
図12は、障害影響展開部によるサービス障害発生に対する処理の一例を示すフローチャートである。障害影響展開部416は、たとえば以下の各ステップを実行する。まず、障害影響展開部416は、サービス障害監視部415からサービス障害発生通知があったか否かを判断し(ステップS1201)、サービス障害発生通知があるまで待つ(ステップS1201:Noのループ)。
【0076】
ステップS1201において、サービス障害発生通知があると(ステップS1201:Yes)、障害影響展開部416は、経路情報412を取得する(ステップS1202)。つぎに、障害影響展開部416は、ステップS1202によって取得した経路情報412から、サービス障害が発生したアクティブ経路を取得する(ステップS1203)。
【0077】
つぎに、障害影響展開部416は、ステップS1203によって取得したアクティブ経路とサービス障害発生日時を影響展開経路情報417に格納し(ステップS1204)、ステップS1201へ戻る。
【0078】
以上の各ステップにより、障害影響展開部416は、サービス障害監視部415からサービス障害発生通知があった場合に、通信サービスの障害発生時のアクティブ経路を影響展開経路情報417に格納することができる。
【0079】
(障害影響展開部によるサービス障害復旧に対する処理)
図13は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。障害影響展開部416は、図12に示した処理とともに、たとえば以下の各ステップを実行する。まず、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があったか否かを判断し(ステップS1301)、サービス障害復旧通知があるまで待つ(ステップS1301:Noのループ)。
【0080】
ステップS1301において、サービス障害復旧通知があると(ステップS1301:Yes)、障害影響展開部416は、サービス障害復旧日時を影響展開経路情報417に格納する(ステップS1302)。つぎに、障害影響展開部416は、装置障害情報414および影響展開経路情報417を参照する(ステップS1303)。
【0081】
つぎに、障害影響展開部416は、ステップS1303によって参照した装置障害情報414および影響展開経路情報417に基づいて、サービス障害復旧済みの経路に含まれる装置障害があるか否かを判断する(ステップS1304)。具体的には、障害影響展開部416は、装置障害情報414が示す装置障害の発生箇所が、影響展開経路情報417が示すサービス障害復旧済みのアクティブ経路に含まれているか否かを判断する。
【0082】
影響展開経路情報417が示すサービス障害復旧済みのアクティブ経路は、たとえばサービス障害復旧日時が格納された通信サービスのアクティブ経路である。たとえば、図6に示した装置障害情報414のうちのネットワーク装置#2〜#4の間のリンクの障害は、図7に示した通信サービス201,202のサービス障害発生時のアクティブ経路に含まれていると判断される。また、図6に示した装置障害情報414のうちのネットワーク装置#6の障害は、図7に示した通信サービス201,202のサービス障害発生時のアクティブ経路に含まれていないと判断される。
【0083】
ステップS1304において、サービス障害復旧済みのアクティブ経路に含まれる装置障害がない場合(ステップS1304:No)は、障害影響展開部416は、ステップS1301へ戻る。サービス障害復旧済みのアクティブ経路に含まれる装置障害がある場合(ステップS1304:Yes)は、障害影響展開部416は、装置障害監視部413に対して重要度変更通知を行い(ステップS1305)、ステップS1301へ戻る。
【0084】
以上の各ステップにより、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があった場合に、経路切替により復旧済みの通信サービスの元の経路上の通知装置の障害を特定することができる。そして、障害影響展開部416は、特定した障害の表示の重要度を下げるように装置障害監視部413に通知することができる。
【0085】
このように、実施の形態1にかかる監視補助装置410は、通信サービスの障害発生時の経路を記憶しておく。そして、監視補助装置410は、経路切替により通信サービスが復旧した場合に、記憶しておいた経路に含まれる装置障害を他の装置障害と区別してユーザに通知する。これにより、ユーザは、通信サービスへの影響が少ない装置障害には低い優先度で対応することが可能になる。このため、通信サービスへの影響が大きい装置障害に優先的に対応することが可能になり、保守の効率を向上させることができる。
【0086】
(実施の形態2)
実施の形態2においては、実施の形態1と異なる部分について説明する。
【0087】
(監視補助装置の構成)
図14は、実施の形態2にかかる監視補助装置の構成の一例を示す図である。図14において、図4に示した部分と同様の部分については同一の符号を付して説明を省略する。図14に示すように、実施の形態2にかかる監視補助装置410は、図4に示した構成において、検出遅延時間情報1411をさらに記憶している。検出遅延時間情報1411は、たとえば図3に示したメインメモリ320または補助メモリ330に記憶される。
【0088】
検出遅延時間情報1411は、監視対象ネットワーク420の通信装置の種別および装置障害の種別ごとに、最大遅延時間が対応付けられた対応情報である。最大遅延時間は、サービス障害がサービス障害監視部415によって検出されてから、サービス障害の要因となった装置障害が装置障害監視部413によって検出されるまでの最大の遅延時間を示す情報である。
【0089】
障害影響展開部416は、特定した装置障害の種別、発生日時および装置障害が発生した通信装置を装置障害情報414から取得する。そして、障害影響展開部416は、特定した装置障害が発生した通信装置の種別を取得する。たとえば、監視補助装置410の補助メモリ330には、監視対象ネットワーク420の各通信装置の種別を示す装置種別情報が記憶されており、障害影響展開部416は、装置種別情報に基づいて通信装置の種別を取得することができる。
【0090】
つぎに、障害影響展開部416は、取得した通信装置の種別および装置障害の種別の組み合わせに対応する最大遅延時間を検出遅延時間情報1411から取得する取得部の機能を有する。また、障害影響展開部416は、サービス障害復旧通知にかかる通信サービスのサービス障害の発生日時を影響展開経路情報417から取得する。
【0091】
また、障害影響展開部416は、サービス障害の発生日時から装置障害の発生日時までの経過時間を算出する算出部としての機能を有する。これにより、通信サービスの障害が検出された時点から、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害として特定された障害が検出された時点までの経過時間を算出することができる。
【0092】
また、障害影響展開部416は、算出した経過時間が、検出遅延時間情報1411から取得した最大遅延時間以内であるか否かを判断する判断部としての機能を有する。障害影響展開部416は、経過時間が最大遅延時間以内である場合は、サービス障害発生通知にかかるサービス障害は特定した装置障害に起因して発生したと判断する。この場合は、障害影響展開部416は、装置障害監視部413へ重要度変更通知を行う。
【0093】
また、障害影響展開部416は、算出した経過時間が、検出遅延時間情報1411から取得した最大遅延時間を超えている場合は、サービス障害発生通知にかかるサービス障害は特定した装置障害とは異なる要因で発生したと判断する。この場合は、特定した装置障害は、サービス障害発生通知にかかる通信サービスとは異なる通信サービスに影響を与えている可能性が高い。このため、障害影響展開部416は、装置障害監視部413へ重要度変更通知を行わない。この場合は、特定された装置障害の表示の重要度が低下しない。
【0094】
(検出遅延時間情報)
図15は、検出遅延時間情報の一例を示す図である。図15に示すように、検出遅延時間情報1411においては、装置種別と障害種別との組み合わせごとに最大遅延時間が対応付けられている。装置種別は、監視対象ネットワーク420における各通信装置の種別である。障害種別は、装置障害の種別である。たとえば、ポート障害は、通信装置の通信ポートに発生した障害を示している。DK障害は、通信装置のディスクに発生した障害を示している。
【0095】
(障害影響展開部によるサービス障害復旧に対する処理)
図16は、障害影響展開部によるサービス障害復旧に対する処理の一例を示すフローチャートである。実施の形態2にかかる障害影響展開部416は、図12に示した処理とともに、たとえば以下の各ステップを実行する。図16に示すステップS1601〜S1604は、図13に示したステップS1301〜S1304と同様である。
【0096】
ステップS1604において、サービス障害復旧済みのアクティブ経路に含まれる装置障害がある場合(ステップS1604:Yes)は、障害影響展開部416は、サービス障害発生日時から、サービス障害復旧済みのアクティブ経路に含まれる装置障害の発生日時までの経過時間を算出する(ステップS1605)。
【0097】
つぎに、障害影響展開部416は、検出遅延時間情報1411から、サービス障害復旧済みのアクティブ経路に含まれる装置障害にかかる装置種別および障害種別に対応する最大遅延時間を取得する(ステップS1606)。つぎに、障害影響展開部416は、ステップS1605によって算出した経過時間が、ステップS1606によって取得した最大遅延時間以下か否かを判断する(ステップS1607)。
【0098】
ステップS1607において、経過時間が最大遅延時間を超えている場合(ステップS1607:No)は、障害影響展開部416は、ステップS1601へ戻る。経過時間が最大遅延時間以下である場合(ステップS1607:Yes)は、障害影響展開部416は、装置障害監視部413に対して重要度変更通知を行い(ステップS1608)、ステップS1601へ戻る。
【0099】
以上の各ステップにより、障害影響展開部416は、サービス障害監視部415からサービス障害復旧通知があった場合に、経路切替により復旧済みの通信サービスの元の経路上の通知装置の障害を特定することができる。そして、障害影響展開部416は、特定した障害の表示の重要度を下げるように装置障害監視部413に通知することができる。
【0100】
また、障害影響展開部416は、サービス障害発生日時から装置障害の発生日時までの経過時間が最大遅延時間を超えている場合は装置障害監視部413へ通知を行わない。これにより、復旧した通信サービスの障害に関連がない装置障害について重要度を下げてしまうことを回避することができる。
【0101】
このように、実施の形態2にかかる監視補助装置410は、通信サービスの障害が検出された時点から、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害として特定された障害が検出された時点までの経過時間を算出する。そして、監視補助装置410は、算出した経過時間が所定時間以内である場合に、特定した装置障害を他の装置障害と区別して通知する。
【0102】
これにより、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害のうちの、サービス障害と関連のある可能性の高い障害を他の装置障害と区別して通知することができる。このため、通信サービスへの影響が大きい装置障害に優先的に対応することが可能になり、保守の効率をさらに向上させることができる。
【0103】
また、監視補助装置410は、算出した経過時間が所定時間を超えている場合に、たとえば、特定した装置障害を他の装置障害と区別せずに通知する。これにより、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害のうちの、サービス障害と関連のある可能性の低い障害を他の装置障害と区別せずに通知することができる。このため、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害であるが、他の通信サービスへの影響がある可能性のある装置障害については優先的に対応することが可能になり、保守の効率をさらに向上させることができる。
【0104】
たとえば、監視補助装置410は、通信サービスの障害が検出されてから、通信サービスの障害の要因となった通信装置の障害が検出されるまでの最大遅延時間を取得してもよい。最大遅延時間は、あらかじめ監視補助装置410の補助メモリ330などに記憶しておくことができる。そして、監視補助装置410は、算出した経過時間が取得した最大遅延時間であるか否かを判断する。
【0105】
通信サービスの障害が検出されてから、通信サービスの障害の要因となった通信装置の障害が検出されるまでの最大遅延時間は、通信装置の種別や通信装置の障害の種別によって左右される。このため、監視補助装置410は、通信装置の種別や通信装置の障害の種別の組み合わせごとに最大遅延時間を対応付ける対応情報を記憶しておいてもよい。監視補助装置410は、特定した障害が発生した通信装置の種別および特定した障害の種別の組み合わせに対応する最大遅延情報を対応情報から取得してもよい。
【0106】
これにより、障害から復旧した通信サービスの障害発生時の経路上の通信装置の障害のうちの、サービス障害と関連のある可能性の高い障害を、他の装置障害とより精度よく区別して通知することができる。このため、通信サービスへの影響が大きい装置障害に優先的に対応することが可能になり、保守の効率をさらに向上させることができる。
【0107】
なお、検出遅延時間情報1411(対応情報)において、通信装置の種別および装置障害の種別ごとに最大遅延時間が対応付けられている構成について説明したが、このような構成に限らない。たとえば、検出遅延時間情報1411において、通信装置の種別ごとに最大遅延時間が対応付けられていてもよい。また、検出遅延時間情報1411において、装置障害の種別ごとに最大遅延時間が対応付けられていてもよい。
【0108】
以上説明したように、監視補助装置、監視補助方法および監視補助プログラムによれば、通信障害の発生時の通信経路を記憶しておき、経路切替で通信が復旧した場合に、記憶しておいた通信経路に含まれる装置障害を他と区別して通知することができる。これにより、通信への影響が少ない装置障害には低優先度で対応できるようになり、保守の効率を向上させることができる。
【0109】
なお、上述した各実施の形態で説明した監視補助方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【0110】
上述した各実施の形態に関し、さらに以下の付記を開示する。
【0111】
(付記1)ネットワークの通信装置の障害を検出する装置障害検出部と、
前記ネットワークの通信サービスの障害を検出するサービス障害検出部と、
前記サービス障害検出部によって障害が検出されたときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶する記憶部と、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出するサービス復旧検出部と、
前記サービス復旧検出部によって前記復旧が検出された場合に、前記装置障害検出部によって障害が検出された通信装置の中から、前記記憶部によって記憶された識別情報が示す各通信装置に含まれる通信装置を特定する特定部と、
前記装置障害検出部によって障害が検出された通信装置を示す障害情報を出力し、前記障害が検出された通信装置のうちの前記特定部によって特定された通信装置を示す障害情報を他の障害情報と区別して出力する出力部と、
を備えることを特徴とする監視補助装置。
【0112】
(付記2)前記出力部は、前記他の障害情報を、前記特定された通信装置を示す障害情報より強調した状態で通知することを特徴とする付記1に記載の監視補助装置。
【0113】
(付記3)前記通信サービスの障害が前記サービス障害検出部によって検出された時点から、前記特定部によって特定された通信装置の障害が前記装置障害検出部によって検出された時点までの経過時間を算出する算出部と、
前記算出部によって算出された経過時間が所定時間以内であるか否かを判断する判断部と、を備え、
前記出力部は、前記特定された通信装置のうちの前記判断部によって前記経過時間が前記所定時間以内であると判断された通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする付記1または2に記載の監視補助装置。
【0114】
(付記4)前記通信サービスの障害が前記サービス障害検出部によって検出されてから、前記通信サービスの障害の要因となった前記通信装置の障害が前記装置障害検出部によって検出されるまでの最大遅延時間を取得する取得部を備え、
前記判断部は、前記算出部によって算出された経過時間が、前記取得部によって取得された最大遅延時間以内であるか否かを判断することを特徴とする付記3に記載の監視補助装置。
【0115】
(付記5)前記取得部は、前記通信装置の種別および前記通信装置の障害の種別の組み合わせごとに前記最大遅延時間が対応付けられた対応情報から、前記特定された障害が発生した通信装置の種別および前記特定された障害の種別の組み合わせに対応する最大遅延情報を取得することを特徴とする付記4に記載の監視補助装置。
【0116】
(付記6)前記取得部は、前記通信装置の種別ごとに前記最大遅延時間が対応付けられた対応情報から、前記特定された障害が発生した通信装置の種別および前記特定された障害の種別の組み合わせに対応する最大遅延情報を取得することを特徴とする付記4に記載の監視補助装置。
【0117】
(付記7)前記取得部は、前記通信装置の障害の種別ごとに前記最大遅延時間が対応付けられた対応情報から、前記特定された障害が発生した通信装置の種別および前記特定された障害の種別の組み合わせに対応する最大遅延情報を取得することを特徴とする付記4に記載の監視補助装置。
【0118】
(付記8)ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする監視補助方法。
【0119】
(付記9)ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力する処理をコンピュータに実行させることを特徴とする監視補助プログラム。
【符号の説明】
【0120】
110,410 監視補助装置
120,200,420 監視対象ネットワーク
#1〜#10 ネットワーク装置
211〜21n,221〜22m 端末
201,202 通信サービス
203,231 障害発生マーク
300 情報処理装置
301 バス
【特許請求の範囲】
【請求項1】
ネットワークの通信装置の障害を検出する装置障害検出部と、
前記ネットワークの通信サービスの障害を検出するサービス障害検出部と、
前記サービス障害検出部によって障害が検出されたときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶する記憶部と、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出するサービス復旧検出部と、
前記サービス復旧検出部によって前記復旧が検出された場合に、前記装置障害検出部によって障害が検出された通信装置の中から、前記記憶部によって記憶された識別情報が示す各通信装置に含まれる通信装置を特定する特定部と、
前記装置障害検出部によって障害が検出された通信装置を示す障害情報を出力し、前記障害が検出された通信装置のうちの前記特定部によって特定された通信装置を示す障害情報を他の障害情報と区別して出力する出力部と、
を備えることを特徴とする監視補助装置。
【請求項2】
前記通信サービスの障害が前記サービス障害検出部によって検出された時点から、前記特定部によって特定された通信装置の障害が前記装置障害検出部によって検出された時点までの経過時間を算出する算出部と、
前記算出部によって算出された経過時間が所定時間以内であるか否かを判断する判断部と、を備え、
前記出力部は、前記特定された通信装置のうちの前記判断部によって前記経過時間が前記所定時間以内であると判断された通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする請求項1に記載の監視補助装置。
【請求項3】
前記通信サービスの障害が前記サービス障害検出部によって検出されてから、前記通信サービスの障害の要因となった前記通信装置の障害が前記装置障害検出部によって検出されるまでの最大遅延時間を取得する取得部を備え、
前記判断部は、前記算出部によって算出された経過時間が、前記取得部によって取得された最大遅延時間以内であるか否かを判断することを特徴とする請求項2に記載の監視補助装置。
【請求項4】
ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする監視補助方法。
【請求項5】
ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力する処理をコンピュータに実行させることを特徴とする監視補助プログラム。
【請求項1】
ネットワークの通信装置の障害を検出する装置障害検出部と、
前記ネットワークの通信サービスの障害を検出するサービス障害検出部と、
前記サービス障害検出部によって障害が検出されたときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶する記憶部と、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出するサービス復旧検出部と、
前記サービス復旧検出部によって前記復旧が検出された場合に、前記装置障害検出部によって障害が検出された通信装置の中から、前記記憶部によって記憶された識別情報が示す各通信装置に含まれる通信装置を特定する特定部と、
前記装置障害検出部によって障害が検出された通信装置を示す障害情報を出力し、前記障害が検出された通信装置のうちの前記特定部によって特定された通信装置を示す障害情報を他の障害情報と区別して出力する出力部と、
を備えることを特徴とする監視補助装置。
【請求項2】
前記通信サービスの障害が前記サービス障害検出部によって検出された時点から、前記特定部によって特定された通信装置の障害が前記装置障害検出部によって検出された時点までの経過時間を算出する算出部と、
前記算出部によって算出された経過時間が所定時間以内であるか否かを判断する判断部と、を備え、
前記出力部は、前記特定された通信装置のうちの前記判断部によって前記経過時間が前記所定時間以内であると判断された通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする請求項1に記載の監視補助装置。
【請求項3】
前記通信サービスの障害が前記サービス障害検出部によって検出されてから、前記通信サービスの障害の要因となった前記通信装置の障害が前記装置障害検出部によって検出されるまでの最大遅延時間を取得する取得部を備え、
前記判断部は、前記算出部によって算出された経過時間が、前記取得部によって取得された最大遅延時間以内であるか否かを判断することを特徴とする請求項2に記載の監視補助装置。
【請求項4】
ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力することを特徴とする監視補助方法。
【請求項5】
ネットワークの通信装置の障害を検出し、
前記ネットワークの通信サービスの障害を検出し、
前記通信サービスの障害を検出したときの前記通信サービスの経路上の各通信装置を示す識別情報を記憶し、
前記通信サービスの経路切替による前記通信サービスの障害からの復旧を検出し、
前記復旧を検出した場合に、障害を検出した通信装置の中から、記憶した識別情報が示す各通信装置に含まれる通信装置を特定し、
障害を検出した通信装置を示す障害情報を出力し、障害を検出した通信装置のうちの特定した通信装置を示す障害情報を他の障害情報と区別して出力する処理をコンピュータに実行させることを特徴とする監視補助プログラム。
【図1】
【図2−1】
【図2−2】
【図2−3】
【図2−4】
【図2−5】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2−1】
【図2−2】
【図2−3】
【図2−4】
【図2−5】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2013−58818(P2013−58818A)
【公開日】平成25年3月28日(2013.3.28)
【国際特許分類】
【出願番号】特願2011−194446(P2011−194446)
【出願日】平成23年9月6日(2011.9.6)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成25年3月28日(2013.3.28)
【国際特許分類】
【出願日】平成23年9月6日(2011.9.6)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]