説明

監視装置及びプログラム

【課題】 複数の被監視装置を監視する監視装置において、一部の被監視装置に対して予定作業が発生する場合に、容易にその予定作業に伴うアラームを抑止する。
【解決手段】 本発明は、複数の被監視装置を監視する監視装置に関する。そして、監視装置は、それぞれの被監視装置に対する監視結果に基づいたアラーム情報を生成するアラーム情報生成手段と、アラーム情報生成手段が生成したアラーム情報を当該監視装置のユーザに出力するアラーム出力手段と、被監視装置のうち作業が予定されている作業対象被監視装置に関する情報を記憶する作業情報記憶手段と、作業情報記憶手段が管理している情報に基づいて、アラーム出力手段によるアラーム情報の出力を抑止させるか否か判定する出力判定手段と、出力判定手段の判定結果に基づいてアラーム出力手段によるアラーム情報の出力を制御するアラーム出力抑止手段とを有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、監視装置及びプログラムに関し、例えば、コンピュータやネットワーク装置等を監視するシステム(EMS:Element Management System)に適用し得る。
【背景技術】
【0002】
従来のEMSでは、被監視装置からの故障通知(アラーム通知)を受信し、保守者等のユーザへ通報(例えば、音声やディスプレイへの画面表示、ランプ表示等)する処理を行う。また、従来のEMSでは、EMSからも定期的に、被監視装置へポーリングを行い、そのポーリング処理の結果や、ポーリング処理により収集した情報に基づいて、当該被監視装置について異常を検知した場合に、保守者へその旨の通報を行う。
【0003】
EMS(監視装置)に関する従来技術としては、特許文献1〜3の記載技術がある。
【0004】
特許文献1の記載技術では、監視装置で、被監視装置からのアラームが大量に発生した場合に、監視装置側で輻輳状態が継続しないように、被監視装置側で監視装置側への自発的なアラーム送信を停止して蓄積する処理を行う。
【0005】
特許文献2の記載技術では、上位監視装置の配下に、複数の下位監視装置が配置されているシステムについて記載されている。そして、特許文献3に記載された上位監視装置では、複数の下位監視装置から通知された複数のアラームについて、一つの被監視装置の障害と評価できる場合に、一つのアラームとして表示することについて記載されている。
【0006】
特許文献3の記載技術では、監視装置側で、ユーザが登録したアラームのみが、表示されるような処理を行っている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2001−223722号公報
【特許文献2】特開平10−327216号公報
【特許文献3】特開平05−257755号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
ところで、従来のEMSでは、例えば、被監視装置でメンテナンスに伴う再起動等が発生した場合には、被監視装置が故障でない場合でも、監視装置側では、当該被監視装置からの再起動の報告や、ポーリングの失敗等により、障害を検知してアラームを発生させてしまう場合がある。このような場合、監視装置を使用する保守者にとっては、メンテナンスを行っている被監視装置と、障害が発生した被監視装置とを区別してアラーム確認を行わなくてはならず、アラームの見落とし等が発生するおそれがあった。
【0009】
しかしながら、特許文献1の記載技術をEMSに利用した場合、被監視装置側でアラームが蓄積されEMS側に通知されず、EMSの監視機能に支障を来たす可能性があり、上述のような課題を解決することはできない。
【0010】
また、特許文献2の記載技術をEMS利用した場合、発生するアラームの数を抑制することはできるが、例えば、メンテナンスを行っている被監視装置に関するアラームの発生自体を抑制することはできないため、やはり、上述のような課題を解決することができない。
【0011】
さらに、特許文献3の記載技術をEMSに利用した場合でも、上述ように被監視装置の一部についてメンテナンスを行う場合には、細かい定義変更等が必要となるため、やはり保守者にとっての負担が大きかった。
【0012】
そのため、複数の被監視装置を監視する監視装置(例えば、EMS等)において、一部の被監視装置に対して予定作業(例えば、メンテナンス等)が発生する場合に、容易にその予定作業に伴うアラームを抑止する監視装置及びプログラムが望まれている。
【課題を解決するための手段】
【0013】
第1の本発明は、複数の被監視装置を監視する監視装置において、(1)それぞれの被監視装置に対する監視結果に基づいたアラーム情報を生成するアラーム情報生成手段と、(2)上記アラーム情報生成手段が生成したアラーム情報を当該監視装置のユーザに出力するアラーム出力手段と、(3)被監視装置のうち作業が予定されている作業対象被監視装置に関する情報を記憶する作業情報記憶手段と、(4)上記作業情報記憶手段が管理している情報に基づいて、上記アラーム情報生成手段が生成するアラーム情報のそれぞれについて、上記アラーム出力手段による出力を抑止させるか否か判定する出力判定手段と、(5)上記出力判定手段により出力を抑止すると判定された抑止対象アラーム情報について、上記アラーム出力手段に出力させないように制御するアラーム出力抑止手段とを有することを特徴とする。
【0014】
第2の本発明の監視プログラムは、複数の被監視装置を監視する監視装置に搭載されたコンピュータを、(1)それぞれの被監視装置に対する監視結果に基づいたアラーム情報を生成するアラーム情報生成手段と、(2)上記アラーム情報生成手段が生成したアラーム情報を当該監視装置のユーザに出力するアラーム出力手段と、(3)被監視装置のうち作業が予定されている作業対象被監視装置に関する情報を記憶する作業情報記憶手段と、(4)上記作業情報記憶手段が管理している情報に基づいて、上記アラーム情報生成手段が生成するアラーム情報のそれぞれについて、上記アラーム出力手段による出力を抑止させるか否か判定する出力判定手段と、(5)上記出力判定手段により出力を抑止すると判定された抑止対象アラーム情報について、上記アラーム出力手段に出力させないように制御するアラーム出力抑止手段として機能させることを特徴とする。
【発明の効果】
【0015】
本発明によれば、複数の被監視装置を監視する監視装置において、一部の被監視装置に対して予定作業が発生する場合に、容易にその予定作業に伴うアラームを抑止することができる。
【図面の簡単な説明】
【0016】
【図1】実施形態に係るEMS(監視装置)の機能的構成について示したブロック図である。
【図2】実施形態に係るEMS(監視装置)及び被監視装置の接続構成について示したブロック図である。
【図3】実施形態に係る被監視装置から通知されるアラーム通知に含まれる情報について示した説明図である。
【図4】実施形態に係るアラームログ蓄積部で記憶される内容の例について示した説明図である。
【図5】実施形態に係るアラーム抑止テーブルの内容の例について示した説明図である。
【図6】実施形態に係る作業対象装置管理テーブルの内容の例について示した説明図である。
【図7】実施形態に係るEMS(監視装置)の動作の概要について示した説明図である。
【図8】実施形態に係るEMS(監視装置)がアラーム抑止モードで動作した場合の動作について示した説明図である。
【発明を実施するための形態】
【0017】
(A)主たる実施形態
以下、本発明による監視装置及びプログラムの一実施形態を、図面を参照しながら詳述する。なお、この実施形態の監視装置は、EMSである。
【0018】
(A−1)実施形態の構成
図2は、実施形態のEMS10と、被監視装置31〜34について示したブロック図である。
【0019】
EMS10は、ネットワークを経由して4台の被監視装置31〜34と通信し、被監視装置31〜34を監視する監視装置である。ここでは、保守用端末20と被監視装置31〜34との間の具体的なネットワーク構成については限定されないものであるが、ここでは、スイッチやルータ等により構成されたIPネットワークを介して通信可能であるものとする。なお、図2において、装置間の点線は論理的な接続構成(接続パス)を示しており、実線は物理的な接続構成を示しているものとする。
【0020】
各被監視装置31〜34は、自装置の状態について管理するデータベースを備えており、そのデータベースの内容や、その他自装置で発生したイベント(例えば、再起動した場合等)に応じて、EMS10へその旨の通知(以下、「アラーム通知」と呼ぶ)を行うように構成されているものとする。アラーム通知の内容の詳細については、後述する。
【0021】
図2では、被監視装置34は、スイッチングハブとして示しており、被監視装置31〜33は、被監視装置34(スイッチングハブ)に接続収容されたコンピュータ(例えば、サーバコンピュータ等)として示している。すなわち、被監視装置31〜33は、スイッチングハブである被監視装置34と直接イーサネット(登録商標)ケーブル等により接続されているものとする。
【0022】
図2に示すように被監視装置34は、通信制御部341、装置管理部342、及び3つのポート343(343−1〜343−3)を有している。
【0023】
ポート343−1〜343−3は、それぞれ被監視装置31〜33とイーサネットケーブルで接続するための物理ポートである。ポート343−1〜343−3が対応するコネクタについては限定されないものであるが、例えば、STP(Shielded Twist Pair)ケーブルのRJ−45のコネクタに対応したポートとしても良い。
【0024】
なお、被監視装置34では、各ポート343に対して識別子(発生元識別子)が定義されているものとする。ここでは、例として、ポート343−1〜343−3に対して、それぞれ1〜3の識別子が付与されているものとする。なお、以下では、ポート343−1を「ポート1」、ポート343−2を「ポート2」、ポート343−1を「ポート3」ともそれぞれを呼ぶものとする。
【0025】
通信制御部341は、当該装置内で各ポートの制御(例えば、ポートごとのリンク状態の監視や、ARPテーブルの更新等)を行う機能を担っている。通信制御部341は、例えば、プロセッサ及びメモリ等により構成されたプログラム(ソフトウェア)の実施構成に、通信ソフトをインストールすることにより、一部又は全部の機能を実現するようにしても良い。
【0026】
装置管理部342は、被監視装置34の状態を管理し、当該装置においてEMS10との通信を行う機能も担っているものとする。
【0027】
なお、各被監視装置31〜34については、アラーム通知を生成してEMS10に送信する処理や、EMS10からのポーリングに応じたデータの送信処理等、EMS10の監視機能に係る処理以外の構成(すなわち、当該装置の本来機能に関する構成)については、既存のサーバコンピュータやスイッチングハブと同様のものを適用することができるので詳しい説明を省略する。
【0028】
次に、被監視装置31〜34から送信されるアラーム通知の内容例について説明する。
【0029】
図3は、各被監視装置31〜34からEMS10へ向けて送信されるアラーム通知のデータ構成について示した説明図である。なお、図3では、IPパケットのデータ部に挿入される部分のデータの一部についてのみ示している。
【0030】
例えば、各被監視装置31〜34は、自装置で、所定のイベント(例えば、再起動した場合等)が発生した場合には、当該アラーム通知の発生元を示す識別子(以下、「発生元識別子」と呼ぶ)と、当該アラーム通知の内容を示す識別子(以下、「アラーム識別子」と呼ぶ)と、そのイベントに応じたメッセージとを含むパケットを生成し、アラーム通知としてEMS10に対して送信するものとする。
【0031】
次に、各被監視装置31〜34が、EMS10に送信するアラーム通知の内容について説明する。
【0032】
アラーム通知に含まれる発生元識別子の形式は限定されないものであるが、例えば、各被監視装置31〜34のホスト名、ユーザが識別しやすい呼び名等を適用することができる。ここでは、例として、被監視装置31の発生元識別子を「装置A」、被監視装置32の発生元識別子を「装置B」、被監視装置32の発生元識別子を「装置C」、被監視装置33の発生元識別子を「装置D」とそれぞれ定義されているものとする。なお、発生元識別子として、IPアドレス等を用いるようにしてもよく、その場合、アラーム通知のIPパケットの送信元アドレスを、上述の発生元識別子としても利用するようにしても良い。
【0033】
EMS10側で、アラーム識別子のパケットであることを識別する方法については限定されないものであるが、例えば、当該パケットのタイプ値や送信先ポート番号(TCP又はUDPのポート番号)等、ヘッダ情報の一部を用いて識別するようにしても良い。
【0034】
アラーム通知に含まれるアラーム識別子は、EMS10と各被監視装置31〜34との間で共通に定義されたイベント内容に応じた識別子である。ここでは、当該被監視装置で再起動が発生した場合のアラーム識別子は「0」であるものとする。また、スイッチングハブとして機能する被監視装置34で、いずれかのポートにリンクダウン等の異常が発生した場合のアラーム識別子は「1」であるものとする。さらに、スイッチングハブとして機能する被監視装置34で、いずれかのポートの動作が停止し、当該ポートに関する処理を停止(縮退)するというイベント(以下、「通信ソフト機能縮退」と呼ぶ)が発生した場合のアラーム識別子は「2」であるものとする。
【0035】
ここでは、説明を簡易にするためのアラーム識別子としては、上述の0、1、2の3つだけを用いて説明するが、その他にも温度異常や管理者モードでのログインがあった場合等、細かくアラーム識別子を定義するようにしても良い。また、アラーム識別子について、既存のSNMP(Simple Network Management Protocol)で用いられるトラップ番号(Trap Typeフィールドの値)を用いて表現するようにしても良い。
【0036】
アラーム通知に含まれるメッセージの内容は、アラーム識別子に示すアラーム内容の詳細について記述された内容である。メッセージの項目の具体的な記述形式については限定されないものであるが、被監視装置31〜34には予め、アラームの内容に応じたメッセージの記述形式が定義されており、アラーム通知を生成する際に、その定義に従ったメッセージが生成されるものとする。
【0037】
ここでは、例として、被監視装置31〜34では、再起動が発生した場合のアラーム通知(アラーム識別子:0)については、一律に「再起動発生」というメッセージが適用されるものとする。また、スイッチングハブとして機能する被監視装置34では、ポートのリンクダウンが発生した場合のアラーム通知(アラーム識別子:1)については、「ポートx故障発生」(xには、故障が発生したポートの識別子が適用される)というメッセージを生成するものとする。また、スイッチングハブとして機能する被監視装置34では、通信ソフト機能縮退が発生した場合のアラーム通知(アラーム識別子:2)については、「通信ソフト機能縮退」というメッセージを生成するものとする(機能縮退した場合にはポートの指定はされないものとする)。
【0038】
次に、被監視装置31〜34がEMS10からポーリングにより情報収集を受けた場合の処理について説明する。
【0039】
被監視装置31〜34では、自装置の状態を管理するデータベースが備えられており、EMS10からの要求(ポーリング)に応じた項目の情報を、返答する機能に対応しているものとする。すなわち、各被監視装置31〜34では、ポーリング応答に関して、既存のSNMPのエージェント機能(被監視機能)に対応しているものとする。具体的には、被監視装置31〜34は自装置の状態を管理するためのデータベースとしてMIB(Management Information Base)を備えているものとする。そして、被監視装置31〜34では、SNMPに対応し、EMS10からのポーリング(GetRequest等)に応じたMIB値を返答(GetResponse)するものとする。
【0040】
次に、EMS10の内部構成について図1を用いて説明する。
【0041】
EMS10は、アラーム管理部11、ポーリング処理部12、通知受信部13、アラームログ蓄積部14、保守者向アラーム出力部15、アラーム抑止データ記憶部16、及び保守者向アラームログ蓄積部17を備えている。また、EMS10には、保守者とのインタフェース機能を担う保守用端末20が接続されているものとする。EMS10と保守用端末20とは同一装置として構築するようにしても良いが、ここでは、別の装置(コンピュータ)を用いて構築されているものとする。
【0042】
なお、EMS10は、PCなどの情報処理装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)上に、実施形態の監視プログラム(固定データを含む)をインストールすることにより、構築されるものであるが、機能的には図1のように表すことができる。
【0043】
通知受信部13は、各被監視装置31〜34から送信されたアラーム通知のパケットを受信すると、そのアラームの情報(発生元識別子、アラーム識別子、及びメッセージの内容を含む情報であり、以下「アラーム情報」と呼ぶものとする)を、アラーム管理部11に通知する処理を行う。
【0044】
ポーリング処理部12は、各被監視装置31〜34に対して、ポーリングによる監視処理を行う。ポーリング処理部12が行うポーリング処理の内容については限定されないものであるが、例えば、一度のポーリングでは、予め設定された項目のMIB値の収集処理や、ネットワーク疎通確認(例えば、Ping(ICMP)による疎通確認)等の処理を行う。ポーリング処理部12は、各被監視装置31〜34に対するポーリング処理で、異常値を収集した場合(例えば、ネットワークポートのリンクダウン等)には、その異常の内容に応じたアラーム情報を、アラーム管理部11に通知する。ポーリング処理部12は、例えば、予め設定された周期のタイミングや、保守者の操作に応じたタイミングで、各被監視装置31〜34に対してポーリング処理を行うようにしても良い。なお、ポーリング処理部12が、各被監視装置31〜34に対して行うポーリング処理については、例えば、既存のEMS等でSNMPエージェントに対して行うポーリング処理と同様の処理を適用することができる。
【0045】
アラーム管理部11は、ポーリング処理部12又は通知受信部13から供給されたアラーム情報について、アラームログ蓄積部14及び保守者向アラーム出力部15に供給する処理を行う。
【0046】
保守者向アラーム出力部15は、アラーム管理部11から供給されたアラーム情報について、アラーム抑止データ記憶部16の内容に基づいて、保守者に出力(提示)するか否かを判断する。以下では、保守者に出力をせず抑止する対象のアラーム情報を、「抑止対象アラーム情報」と呼ぶものとする。そして、保守者向アラーム出力部15は、当該アラーム情報について、抑止対象アラーム情報に該当しない(保守者に提示する)と判断した場合、そのアラーム情報について、保守用端末20を介して保守者に出力すると共に、保守者向アラームログ蓄積部17に供給する。一方、保守者向アラーム出力部15は、当該アラーム情報について、抑止対象アラーム情報である(保守者に出力しない)と判断した場合、当該アラーム情報については、フィルタ処理(例えば、保守者に出力せず廃棄)を行う。なお、保守者向アラーム出力部15において、各アラーム情報について抑止対象アラーム情報に該当するか否かを判定する方法については後述する。
【0047】
また、保守者向アラーム出力部15は、アラーム管理部11から供給されたアラーム情報について、抑止対象アラーム情報であるか否かを判断し、フィルタ処理を行う動作モード(以下、「アラーム抑止モード」と呼ぶ)と、アラーム管理部11から供給されたアラーム情報について特にフィルタ処理を行わず、全て保守者(保守用端末20)に出力する動作モード(以下、「通常動作モード」と呼ぶ)を備えているものとする。ここでは、保守者向アラーム出力部15の動作モードは、保守者等の保守用端末20に対する操作により制御されるものとする。
【0048】
保守者向アラームログ蓄積部17は、保守者向アラーム出力部15から供給されたアラーム情報(抑止対象アラーム情報ではないと判定されたアラーム情報)について蓄積する機能を担っている。なお、EMS10において、アラームログ蓄積部14と保守者向アラームログ蓄積部17とで別個にアラーム情報を管理するようにしても良いが、一つのデータベースに統合して管理するようにしても良い。例えば、全てのアラーム情報について蓄積されたアラームログ蓄積部14のデータベースの各アラーム情報について、抑止対象アラーム情報に該当する情報、又は、抑止対象アラーム情報に該当しない情報について、識別可能な形式(例えば、その旨を示すマークのフィールド等カテゴリー分けが可能な形式)で構築するようにしても良い。
【0049】
次に、アラームログ蓄積部14に蓄積される情報の例について説明する。なお、保守者向アラームログ蓄積部17についても管理するアラーム情報の項目については同様であるため、詳しい説明については省略する。
【0050】
図4は、アラームログ蓄積部14に蓄積されるアラーム情報についてテーブル形式で示した説明図である。
【0051】
図4では、1行で1つのアラーム情報について表わしており、各アラーム情報は、管理番号、アラーム名、アラーム識別子、アラーム発生元装置、メッセージの項目の情報を有している。
【0052】
管理番号の項目は、データベース上における当該アラーム情報を識別するための識別子を示している。
【0053】
「アラーム識別子」の項目は、当該アラーム情報に含まれるアラーム識別子を示している。
【0054】
「アラーム発生元装置」は、当該アラーム情報の発生元となる被監視装置の発生元識別子を示している。
【0055】
「メッセージ」の項目は、当該アラーム情報に含まれるメッセージの内容について示している。なお、当該アラーム情報にメッセージが含まれていない場合には、何も表示されない。
【0056】
「アラーム名」は、当該アラーム情報のアラーム識別子に対応するアラーム名称(ユーザに理解しやすい形式の内容)を示している。なお、図4では、説明を簡易にするためアラーム名としては、「アラームa」、「アラームb」といった表示にしているが、実際にはユーザに理解しやすい他の内容に置き換えて適用されるものとする。なお、EMS10では、アラーム識別子に対応するアラーム名を記憶しており、各アラーム情報には、アラーム識別子に応じたアラーム名が付与されるものとする。
【0057】
保守者向アラーム出力部15は、アラーム抑止データ記憶部16の内容を利用して、アラーム情報を保守者に出力するか否かを判定する処理を行う。そして、アラーム抑止データ記憶部16には、アラーム抑止テーブル161及び作業対象装置管理テーブル162の2つの情報(テーブル)が記憶されている。アラーム抑止テーブル161及び作業対象装置管理テーブル162の詳細については後述する。
【0058】
次に、保守用端末20の構成について説明する。
【0059】
保守用端末20は、保守者とのインタフェースの機能を担う出力部21及び入力部22を有している。
【0060】
出力部21は、保守者に対してアラーム情報の出力を行う。出力部21によるアラーム情報の出力構成は限定されないものであるが、例えば、ディスプレイによる表示出力したり、ランプの点灯やアラーム音の鳴動により保守者に通報するように構成してもよい。また、アラーム情報をディスプレイに表示する場合の表示形式については限定されないものであるが、例えば、図4に示すようなテーブル形式でアラーム情報を表示(必要に応じて、各アラーム情報の発生時刻も付加するようにしても良い)するようにしても良い。
【0061】
入力部22は、保守者からの操作を受付けるインタフェース(例えば、GUI環境等)の機能を担っている。入力部22は、例えば、マウスやキーボード等を利用して構成するようにしても良い。
次に、アラーム抑止データ記憶部16に記憶される内容、及び、保守者向アラーム出力部15による抑止対象アラーム情報の判定方法について説明する。
【0062】
図6は、作業対象装置管理テーブル162の内容例について示した説明図である。
【0063】
作業対象装置管理テーブル162は、メンテナンス作業等を行う予定となっている被監視装置(以下、「作業対象装置」と呼ぶ)のリストを管理するためのテーブルである。
【0064】
作業対象装置管理テーブル162では、管理番号ごとに作業対象装置を発生元識別子で表わしている。図6では、作業対象装置を発生元識別子で識別しているが、その他の形式(例えば、IPアドレスやホスト名等)を用いるようにしても良い。図6では、作業対象装置として、装置A(被監視装置31)が登録される例について示している。なお、ここでは、作業対象装置として装置A、装置B及び装置Cのうち、一部又は全部を選択して、保守用端末20から設定することができるように成されているものとする。すなわち、図6に示すアラーム抑止テーブル161の内容は、装置A、装置B及び装置Cのうち、一部又は全部が作業対象装置として指定された場合に対応する内容となっている。
【0065】
図5は、アラーム抑止テーブル161の内容例について示した説明図である。
【0066】
アラーム抑止テーブル161では、各アラーム情報について、抑止対象アラーム情報に該当するための条件(以下、「アラーム抑止条件」と呼ぶ)のリストを示している。アラーム抑止テーブル161では、1行で、1つのアラーム抑止条件について示している。保守者向アラーム出力部15は、供給されたアラーム情報について、アラーム抑止テーブル161の各アラーム抑止条件と比較し、いずれかのアラーム抑止条件に該当する場合には、当該アラーム情報を抑止対象アラーム情報と判定する。一方、いずれのアラーム抑止条件にも該当しない場合には、保守者向アラーム出力部15は、当該アラーム情報を、抑止対象アラーム情報に該当しないと判定する。
【0067】
アラーム抑止テーブル161には、抑止対象アラーム情報に該当する条件のそれぞれについて、管理番号、アラーム識別子、アラーム原因装置、キーワード、アラーム発生元装置の項目の情報が登録されている。
【0068】
「管理番号」の項目は、アラーム抑止条件を識別するための番号を示している。
【0069】
「アラーム識別子」の項目は、当該アラーム抑止条件に該当するアラーム識別子のリストを示している。例えば、管理番号1のアラーム抑止条件では、アラーム識別子の内容が「0、1、2、…、n」となっている。これは、0〜nまでの識別子のリスト(ここでは、全てのアラーム識別子を指定したワイルドカードと同様の意味)を示しており、アラーム情報のアラーム識別子の内容に関わらず、他の項目の条件が一致すれば、当該アラーム抑止条件に該当することを示している。また、管理番号4のアラーム抑止条件では、アラーム識別子の内容が「1」となっている。これは、アラーム識別子が「1」のアラーム情報については、他の条件が一致すれば当該アラーム抑止条件に該当することを示している。
【0070】
「キーワード」の項目は、当該アラーム抑止条件に該当するアラーム情報のメッセージに含まれるキーワード(文字列)を示している。例えば、図5で、管理番号が5のキーワードは「ポート0」となっている。これは、メッセージに「ポート0」というキーワードが含まれているアラーム情報については、他の項目の条件が一致すれば、当該アラーム抑止条件に該当することを示している。また、例えば、図5で、管理番号が1のキーワードは、指定なし(ワイルドカード)であることを示す「−」となっている。これは、メッセージの内容に関わらず、他の項目の条件が一致すれば、当該アラーム抑止条件に該当することを示している。
【0071】
「アラーム原因装置」の項目は、作業対象装置ではないが、作業対象装置の作業(再起動等)により影響を受ける被監視装置(以下、「作業影響装置」と呼ぶ)を発生元とするアラーム情報に関する定義に用いる項目である。また、「アラーム原因装置」の項目は、当該アラーム抑止条件の有効または無効に関わる項目であり、作業対象装置管理テーブル162に登録された作業対象装置と関連する。例えば、アラーム原因装置に記載された被監視装置の発生元識別子が、作業対象装置管理テーブル162に登録された作業対象装置と一致する場合、当該アラーム抑止条件は有効となり、他の項目の条件が一致するアラーム情報については、アラーム抑止の対象となることになる。
【0072】
例えば、図5において、管理番号4のアラーム抑止条件では、「アラーム原因装置」の項目が「装置A」となっている。そして、図6に示すように、作業対象装置管理テーブル162では、作業対象装置として、装置Aが指定されている。したがって、管理番号4のアラーム抑止条件は有効となっており、その他の項目の条件が一致するアラーム情報については、アラーム抑止の対象となる。
【0073】
また、図5において、管理番号7のアラーム抑止条件では、「アラーム原因装置」の項目が「装置A,装置B、装置C」となっている。したがって、管理番号7のアラーム抑止条件は、「アラーム原因装置」の項目に作業対象装置である「装置A」が含まれているため有効となる。
【0074】
さらに、図5において、管理番号5のアラーム抑止条件では、「アラーム原因装置」の項目が「装置B」となっている。しかし、作業対象装置管理テーブル162では、作業対象装置として、装置Bは指定されていない。したがって、管理番号5のアラーム抑止条件は無効となっており、その他の項目の条件が一致するアラーム情報であっても、アラーム抑止の対象とはならない。
【0075】
さらにまた、図5において、管理番号が1のキーワードは、指定なし(ワイルドカード)であることを示す「−」となっている。これは、作業対象装置管理テーブル162の内容に関わらず、当該アラーム抑止条件は有効であることを示している。
【0076】
「アラーム発生元装置」の項目は、当該アラーム抑止条件に該当するアラーム情報の送信元(被監視装置の発生元識別子)を示している。ただし、アラーム原因装置の項目が指定なし(−)となっているアラーム抑止条件については、アラーム発生元装置に記載された被監視装置の発生元識別子が、作業対象装置管理テーブル162に登録された作業対象装置と一致するときだけ、有効となるものとする。
【0077】
例えば、図5において、管理番号1のアラーム発生元装置は「装置A」となっており、さらに、アラーム原因装置の項目が指定なし(−)となっている。さらに、ここでは、図6に示すように、作業対象装置管理テーブル162では、作業対象装置として、装置Aが指定されているため、管理番号1のアラーム抑止条件は有効となる。従って、送信元が装置A(被監視装置31)であるアラーム情報については、他の条件が一致すれば、管理番号1のアラーム抑止条件に該当することになる。
【0078】
また、図5で、管理番号2のアラーム発生元装置は「装置B」となっており、さらに、アラーム原因装置の項目が指定なし(−)となっている。しかし、図6に示すように、作業対象装置管理テーブル162では、作業対象装置として、装置Bは指定されていないため管理番号2のアラーム抑止条件は無効となる。
【0079】
さらに、図5で、管理番号4のアラーム抑止条件では、アラーム発生元装置は「装置D」となっており、さらにアラーム原因装置の項目には「装置A」が指定されている。したがって、管理番号4のアラーム抑止条件は有効となる。
【0080】
以上のように、図5に示すアラーム抑止テーブル161では、作業対象装置管理テーブル162で指定される作業対象装置自体から発生するアラームを抑止するためのアラーム抑止条件として管理番号1〜3のアラーム抑止条件を設定している。また、図5に示すアラーム抑止テーブル161では、作業対象装置(装置A〜装置C)で作業(再起動等)が行われた場合に影響する作業影響装置として装置Dが設定されている。具体的には、作業影響装置である装置Dから、作業対象装置(装置A〜装置C)での作業に伴って発生したアラーム情報の出力を抑止するためのアラーム抑止条件として、管理番号4〜7のアラーム情報が設定されている。
【0081】
(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態のEMS10の動作を説明する。
【0082】
まず、被監視装置31(装置A)で、再起動を伴うメンテナンス作業を行う場合の、EMS10の動作概要について図7を用いて説明する。なお、ここでは、初期状態として保守者向アラーム出力部15は、通常動作モードで動作しているものとして説明する。
【0083】
まず、保守者等により、保守用端末20を介して、EMS10に対する事前設定(アラーム抑止テーブル161及び作業対象装置管理テーブル162の設定)が行われたものとする(S101)。
【0084】
ここでは、ステップS101において、アラーム抑止テーブル161の内容は図5に示す内容に設定されたものとする。また、作業対象装置管理テーブル162の内容は、図6に示す内容に設定されたものとする。すなわち、作業対象装置管理テーブル162の内容により、再起動を伴うメンテナンス対象として被監視装置31(装置A)が設定されたものとする。なお、アラーム抑止テーブル161については、固定的に設定しておき、メンテナンス作業を行う都度、作業対象装置管理テーブル162の内容だけを変更するようにしても良い。
【0085】
そして、次に、保守者等により、保守用端末を介して、保守者向アラーム出力部15に対して、アラーム抑止モードで動作するように操作が行われたものとする。そうすると、保守者向アラーム出力部15では、その操作に伴って、通常動作モードからアラーム抑止モードに動作モードが切り替わる(S102)。
【0086】
そして、その後、作業者により被監視装置31(装置A)に対するメンテナンス作業が行われ、それに伴い、被監視装置31(装置A)について再起動処理が実施されたものとする(S103)。
【0087】
そして、被監視装置31(装置A)の再起動に伴って、作業対象装置である被監視装置31(装置A)、及び、作業影響装置である被監視装置34(装置D)から、EMS10にアラーム通知が送信される。しかし、それらのアラーム通知に基づくアラーム情報は、保守者向アラーム出力部15のアラーム抑止の処理により、保守者には出力されない(S104)。
【0088】
ここでは、ステップS104において、アラーム管理部11から保守者向アラーム出力部15へは、図4に示す管理番号1〜3のアラーム情報が供給されたものとする。しかし、これらの全てのアラーム情報は、保守者向アラーム出力部15で抑止対象アラーム情報として判定され、保守者へは出力されない。図4に示すように、装置A(被監視装置31)が再起動を行うと、装置Aだけでなく、装置Aを収容するスイッチングハブである装置D(被監視装置34)においても影響がある。具体的には、図4に示すように、装置Dからは、リンクダウンや通信ソフト機能縮退のアラーム情報が発生することになる。
【0089】
そして、被監視装置31(装置A)に対するメンテナンス作業が終了した後、保守者等により、保守用端末を介して、保守者向アラーム出力部15に対し、通常動作モードで動作するように操作が行われたものとする。そして、保守者向アラーム出力部15では、その操作に伴って、アラーム抑止モードが解除され、通常動作モードに復帰する(S105)。
【0090】
なお、EMS10では、保守者向アラーム出力部15を通常動作モードに復帰した直後に、ポーリング処理部12を制御して、作業対象装置管理テーブル162に登録された作業対象装置に対するポーリング処理を行い、作業後の正常性(残存アラームが存在しないこと)を自動的に確認するようにしても良い。また、作業対象装置だけでなく、アラーム抑止テーブル161で有効なアラーム抑止条件のうち、アラーム発生元装置として設定されている作業対象装置以外の被監視装置(例えば、図5の例では装置D)についても同様にポーリング処理を行って正常性を確認するようにしても良い。
【0091】
次に、上述のステップS104において、EMS10の保守者向アラーム出力部15によるアラーム抑止の処理について、図8のフローチャートを用いて説明する。
【0092】
まず、アラーム抑止モードで動作中の保守者向アラーム出力部15に対して、アラーム管理部11からアラーム情報が供給されたものとする(S201)。
【0093】
そして、保守者向アラーム出力部15では、アラーム抑止データ記憶部16の内容に基づいて、供給されたアラーム情報について、抑止対象アラーム情報に該当するか否かが判断される(S202)。
【0094】
上述のステップS202で、当該アラーム情報が、抑止対象アラーム情報に該当すると判定された場合には、保守者向アラーム出力部15では、当該アラーム情報が廃棄され、保守用端末20には出力されない(S205)。
【0095】
一方、ステップS202で、当該アラーム情報が、抑止対象アラーム情報に該当しないと判定された場合には、保守者向アラーム出力部15により、当該アラーム情報が、保守用端末20を介して保守者に出力され(S203)、さらに保守者向アラームログ蓄積部17に蓄積される(S204)。
【0096】
次に、被監視装置31(装置A)の再起動処理に伴って発生する具体的なアラーム情報と、保守者向アラーム出力部15で、そのアラーム情報を抑止対象アラーム情報として判定する処理について説明する。
【0097】
最初に、アラーム抑止テーブル161に登録されているアラーム抑止条件のうち保守者向アラーム出力部15で、無効となるものについて説明する。
【0098】
ここでは、図6に示す通り、作業対象装置として装置Aが登録されている。したがって、アラーム原因装置の項目が記載されている管理番号4〜7のアラーム抑止条件のうち、作業対象装置と一致しない管理番号5、6については無効となる。また、アラーム原因装置の項目で、指定がない(−)旨記載されている管理番号1〜3のアラーム抑止条件のうち、アラーム発生元装置の項目が作業対象装置と一致しない管理番号2、3については無効となる。したがって、ここでは、管理番号が1、4、7のアラーム抑止条件についてだけが有効となる。
【0099】
そして、ここでは、被監視装置31(装置A)の再起動処理に伴って、上述の図4に示す管理番号1〜3のアラーム情報が、保守者向アラーム出力部15に供給されることになる。
【0100】
管理番号1のアラーム情報では、アラーム識別子が「0」、アラーム発生元装置が「装置A」、メッセージが「再起動発生」である。従って、上述の管理番号1のアラーム情報は、有効なアラーム抑止条件のうち管理番号1のアラーム抑止条件に該当する。
【0101】
管理番号2のアラーム情報では、アラーム識別子が「1」、アラーム発生元装置が「装置D」、メッセージが「ポート0故障発生」である。従って、上述の管理番号2のアラーム情報は、有効なアラーム抑止条件のうち管理番号4のアラーム抑止条件に該当する。
【0102】
管理番号3のアラーム情報では、アラーム識別子が「2」、アラーム発生元装置が「装置D」、メッセージが「通信ソフト機能縮退」である。従って、上述の管理番号3のアラーム情報は、有効なアラーム抑止条件のうち管理番号7のアラーム抑止条件に該当する。
【0103】
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
【0104】
この実施例によれば、EMS10で保守者向アラーム出力部15をアラーム抑止モードで動作させることにより、作業対象装置(装置A)だけでなく、作業影響装置(装置D)からのアラーム情報についても保守者に対する出力を抑止することができる。一方、保守者向アラーム出力部15をアラーム抑止モードで動作させている間に、保守者向アラーム出力部15に対して、有効なアラーム抑止条件に該当しないアラーム情報が供給された場合には、保守者に出力される。したがって、保守者には本当に発生している障害に関するアラーム情報だけが出力されることになり、保守者の負担を減らし、作業効率を向上させることができる。
【0105】
さらに、アラーム抑止テーブル161で、キーワードの項目を指定なし(−)に設定することにより、作業影響装置に対するアラーム抑止を広範囲に設定することになった場合でも、アラーム抑止モードの解除時に、ポーリング処理を行い、残存アラームの有無を確認している。これにより、EMS10では、アラーム抑止モードにより、本来保守者に出力すべきアラーム情報があった場合でも、その欠落を防止することができる。
【0106】
(B)他の実施形態
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
【0107】
(B−1)上記の実施形態では、被監視装置から送出されるアラーム通知の形式について上述の図3の例について説明したが、同様のアラーム通知をSNMPのトラップ通知を用いてアラーム通知を実現するようにしても良い。例えば、トラップ通知のトラップ番号(例えば、Trap Typeのフィールド)を、図3のアラーム識別子として利用するようにしても良い。また、Trap通知に付加する値(数値)を、図3のメッセージとして利用するようにしても良い。例えば、トラップ通知に付加する値ごとに対応するメッセージを、EMS10で保持しておき、受信したトラップ通知に付加された値に基づいてメッセージを再現して利用するようにしても良い。
【0108】
(B−2)上記の実施形態では、アラーム抑止テーブル及び作業対象装置管理テーブルは、それぞれ一つずつしか保持していないが、複数保持しておき、保守者等の操作に応じた組合せで、保守者向アラーム出力部15のアラーム抑止モードを動作させるようにしても良い。
【0109】
また、上記の実施形態では、保守者向アラーム出力部に対して、アラーム抑止モードで動作させる処理や、アラーム抑止モードを解除する処理に関しては、保守者等により手動で行われるものとしているが、予め設定したスケジュールに従って、アラーム抑止モードの開始及び解除を行うように構成しても良い。さらに、アラーム抑止テーブル及び作業対象装置管理テーブルが複数存在する場合には、保守者向アラーム出力部に対して、アラーム抑止モードのスケジュールを設定する際に、アラーム抑止テーブル及び作業対象装置管理テーブルの組合せについても、併せて指定できるように構成しても良い。
【0110】
(B−3)上記の実施形態では、本発明の監視装置をEMSに適用する例について説明したが、NMS(Network Management System)等、その他の監視装置に適用するようにしても良い。
【符号の説明】
【0111】
10…EMS(監視装置)、11…アラーム管理部、12…ポーリング処理部、13…通知受信部、14…アラームログ蓄積部、15…保守者向アラーム出力部、16…アラーム抑止データ記憶部、161…アラーム抑止テーブル、162…作業対象装置管理テーブル、17…保守者向アラームログ蓄積部、20…保守用端末、21…出力部、22…入力部、31〜34…被監視装置。

【特許請求の範囲】
【請求項1】
複数の被監視装置を監視する監視装置において、
それぞれの被監視装置に対する監視結果に基づいたアラーム情報を生成するアラーム情報生成手段と、
上記アラーム情報生成手段が生成したアラーム情報を当該監視装置のユーザに出力するアラーム出力手段と、
被監視装置のうち作業が予定されている作業対象被監視装置に関する情報を記憶する作業情報記憶手段と、
上記作業情報記憶手段が管理している情報に基づいて、上記アラーム情報生成手段が生成するアラーム情報のそれぞれについて、上記アラーム出力手段による出力を抑止させるか否か判定する出力判定手段と、
上記出力判定手段により出力を抑止すると判定された抑止対象アラーム情報について、上記アラーム出力手段に出力させないように制御するアラーム出力抑止手段と
を有することを特徴とする監視装置。
【請求項2】
上記作業情報記憶手段が記憶する情報には、少なくとも、作業対象被監視装置自体を発生元として生成されるアラーム情報を抽出する条件の情報が含まれていることを特徴とする請求項1に記載の監視装置。
【請求項3】
上記作業情報記憶手段が記憶する情報には、さらに、作業対象被監視装置に対する作業に伴って影響を受ける作業影響被監視装置を発生元として生成されるアラーム情報を抽出する条件の情報も含まれていることを特徴とする請求項2に記載の監視装置。
【請求項4】
複数の被監視装置を監視する監視装置に搭載されたコンピュータを、
それぞれの被監視装置に対する監視結果に基づいたアラーム情報を生成するアラーム情報生成手段と、
上記アラーム情報生成手段が生成したアラーム情報を当該監視装置のユーザに出力するアラーム出力手段と、
被監視装置のうち作業が予定されている作業対象被監視装置に関する情報を記憶する作業情報記憶手段と、
上記作業情報記憶手段が管理している情報に基づいて、上記アラーム情報生成手段が生成するアラーム情報のそれぞれについて、上記アラーム出力手段による出力を抑止させるか否か判定する出力判定手段と、
上記出力判定手段により出力を抑止すると判定された抑止対象アラーム情報について、上記アラーム出力手段に出力させないように制御するアラーム出力抑止手段と
して機能させることを特徴とする監視プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−249250(P2012−249250A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2011−121805(P2011−121805)
【出願日】平成23年5月31日(2011.5.31)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】