説明

アラームパターン解析装置、アラームパターン解析プログラム、およびネットワーク監視システム

【課題】作業者による作業工数を抑えることができ、且つ複雑に発生する作業アラームを正しく抑止させる。
【解決手段】ネットワーク40に接続されたネットワーク装置群30に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部14と、アラームの発生時を特定する情報とそのアラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込むアラーム情報取得部12と、取り込んだアラーム情報を記憶するアラーム情報記憶部13と、作業申請情報を用いて、アラーム情報記憶部13から作業時間内にアラームが発生して且つそのアラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部15とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アラームパターン解析装置、アラームパターン解析プログラム、およびネットワーク監視システムに関する。
【背景技術】
【0002】
通信事業者は、ネットワークシステムにおいて発生した通信障害を把握するために、ネットワーク装置が発生させるアラーム(障害アラーム)をネットワーク監視システムに検出させることにより、監視を行っている。このネットワークシステムでは、ネットワーク装置の交換等の保守作業が実施されることによってもアラーム(作業アラーム)が発生する。しかしながら、アラームそのものから、アラームの発生要因が障害によるものか、または保守作業によるものかを区別することができず、この区別のために多くの手間が発生する。
【0003】
これに対し、登録された作業情報に基づき、波及情報記憶装置から、保守作業に関する波及情報を読み出して管理端末内の作業管理テーブルに登録し、保守作業実施に応じて各装置から通知される障害アラームについて、登録された波及情報を参照することにより波及アラーム(作業アラーム)であるか否かを判断するネットワーク障害管理方法が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平7−87191号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、ネットワークシステムには多種多数のネットワーク装置が接続されており、さらにネットワーク装置は複数のデバイスを含んで構成されている。各デバイスに対する操作手順やソフトウェア・バージョンの状態等によって、作業アラームは複雑に発生する。よって、特許文献1記載のネットワーク障害管理方法では、作業アラームを正しく抑止することが困難となる。
【0006】
また、ネットワークシステムの管理者は、保守作業に対応するアラームパターンを抑止パターンとして事前に作成する必要がある。しかし、ネットワーク装置の接続構成が変更された場合、作業アラームの発生パターンが変化するため、抑止パターンの更新が必要となり、管理者による作業工数が増加することとなる。
【0007】
本発明は、上記問題を解決するためになされたものであり、作業者による作業工数を抑えることができ、且つ複雑に発生する作業アラームを正しく抑止させることができる、アラームパターン解析装置、アラームパターン解析プログラム、およびネットワーク監視システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
[1]上記の課題を解決するため、本発明の一態様であるアラームパターン解析装置は、監視対象のネットワークに接続された作業対象であるネットワーク装置に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部と、アラームの発生時を特定する情報と前記アラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込むアラーム情報取得部と、前記アラーム情報取得部が取り込んだ前記アラーム情報を記憶するアラーム情報記憶部と、前記作業申請受付部が取り込んだ前記作業申請情報を用いて、前記アラーム情報記憶部から前記作業時間内にアラームが発生して且つ前記アラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部と、を備えることを特徴とする。
[2]上記[1]記載のアラームパターン解析装置において、前記監視対象のネットワークに接続された複数のネットワーク装置それぞれの構成と前記複数のネットワーク装置の接続関係とを示すネットワーク装置構成情報を記憶するネットワーク装置構成情報記憶部をさらに備え、前記作業申請情報は、前記作業対象の指定を含み、前記アラーム情報は、前記アラームの発生元を特定する情報を含み、前記抑止パターン生成部は、前記作業申請情報と前記ネットワーク装置構成情報記憶部に記憶された前記ネットワーク装置構成情報とに基づいて、前記作業対象の接続先である接続先対象を特定し、前記抽出した前記作業アラームから、前記作業アラームにおける前記発生元が作業対象との接続関係にあるアラーム情報を作業アラームとして抽出することを特徴とする。
[3]上記の課題を解決するため、本発明の一態様であるアラームパターン解析プログラムは、アラーム情報を記憶するアラーム情報記憶部を備えたコンピュータを、監視対象のネットワークに接続された作業対象であるネットワーク装置に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部と、アラームの発生時を特定する情報と前記アラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込み、前記アラーム情報を前記アラーム情報記憶部に記憶させるアラーム情報取得部と、前記作業申請受付部が取り込んだ前記作業申請情報を用いて、前記アラーム情報記憶部から前記作業時間内にアラームが発生して且つ前記アラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部と、として機能させる。
[4]上記[3]記載のアラームパターン解析プログラムにおいて、前記監視対象のネットワークに接続された複数のネットワーク装置それぞれの構成と前記複数のネットワーク装置の接続関係とを示すネットワーク装置構成情報を記憶するネットワーク装置構成情報記憶部を、前記コンピュータにさらに備えさせ、前記作業申請情報は、前記作業対象の指定を含み、前記アラーム情報は、前記アラームの発生元を特定する情報を含み、前記抑止パターン生成部は、前記作業申請情報と前記ネットワーク装置構成情報記憶部に記憶された前記ネットワーク装置構成情報とに基づいて、前記作業対象の接続先である接続先対象を特定し、前記抽出した前記作業アラームから、前記作業アラームにおける前記発生元が作業対象との接続関係にあるアラーム情報を作業アラームとして抽出することを特徴とする。
[5]上記の課題を解決するため、本発明の一態様であるネットワーク監視システムは、監視対象のネットワークを介してアラームパターン解析装置とネットワーク監視装置とが接続されたネットワーク監視システムであって、前記アラームパターン解析装置は、前記ネットワークに接続された作業対象であるネットワーク装置に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部と、アラームの発生時を特定する情報と前記アラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込むアラーム情報取得部と、前記アラーム情報取得部が取り込んだ前記アラーム情報を記憶するアラーム情報記憶部と、前記作業申請受付部が取り込んだ前記作業申請情報を用いて、前記アラーム情報記憶部から前記作業時間内にアラームが発生して且つ前記アラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部と、前記抑止パターン生成部が生成した抑止パターンを前記ネットワーク監視装置に供給する抑止パターン設定制御部と、を備え、前記ネットワーク監視装置は、前記アラームパターン解析装置の抑止パターン設定制御部から供給される前記抑止パターンを取り込み、前記抑止パターンをフィルタ登録して前記ネットワークを監視することを特徴とする。
[6]上記[5]記載のネットワーク監視システムにおいて、前記アラームパターン解析装置は、前記監視対象のネットワークに接続された複数のネットワーク装置それぞれの構成と前記複数のネットワーク装置の接続関係とを示すネットワーク装置構成情報を記憶するネットワーク装置構成情報記憶部をさらに備え、前記作業申請情報は、前記作業対象の指定を含み、前記アラーム情報は、前記アラームの発生元を特定する情報を含み、前記抑止パターン生成部は、前記作業申請情報と前記ネットワーク装置構成情報記憶部に記憶された前記ネットワーク装置構成情報とに基づいて、前記作業対象の接続先である接続先対象を特定し、前記抽出した前記作業アラームから、前記作業アラームにおける前記発生元が作業対象との接続関係にあるアラーム情報を作業アラームとして抽出することを特徴とする。
【発明の効果】
【0009】
本発明によれば、作業者による作業工数を抑えることができ、且つ複雑に発生する作業アラームを正しく抑止させることができる。
【図面の簡単な説明】
【0010】
【図1】本発明の一実施形態であるアラームパターン解析装置を適用したネットワークシステムの全体構成を示すブロック図である。
【図2】ネットワーク装置群における各ネットワーク装置が備えるデバイスの構成と、各デバイス間の接続関係とを模式的に示した構成図である。
【図3】ネットワーク装置構成情報記憶部に記憶されたネットワーク装置構成情報のデータ構成を示す図である。
【図4】アラーム情報記憶部に記憶されたアラーム情報のデータ構成を示す図である。
【図5】作業申請受付部の記憶部に記憶された作業申請情報のデータ構成を示す図である。
【図6】抑止パターン生成部の記憶部に記憶された作業時間内発生アラーム情報のデータ構成を示す図である。
【図7】抑止パターン生成部が生成する抑止パターン選出情報のデータ構成を示す図である。
【図8】アラームパターン解析装置による抑止パターン生成処理の手順を示す概略のフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明を実施するための形態について、図面を参照して詳細に説明する。
図1は、本発明の一実施形態であるアラームパターン解析装置を適用したネットワークシステムの全体構成を示すブロック図である。
同図に示すように、ネットワークシステム1は、ネットワーク40を介して、アラームパターン解析装置10と、ネットワーク監視装置20と、ネットワーク装置群30とが接続された構成を有する。ネットワーク監視システムは、アラームパターン解析装置10とネットワーク監視装置20とを含む。
【0012】
ネットワーク40は、コンピュータネットワーク等の電気通信回線である。ネットワーク40は、インターネットに接続されていてもよい。
ネットワーク装置群30は、ネットワーク40に接続されるネットワーク装置全体を指すものである。本実施形態では、ネットワーク装置群30は、ネットワーク装置31〜34を含む。
【0013】
ネットワーク装置31〜34は、例えば、ルータ、スイッチ、サーバ等のネットワーク接続機器である。
ネットワーク装置31〜34は、稼働中に動作異常や通信障害が発生した場合にアラーム情報を発生させる。このアラーム情報を障害アラームと呼ぶ。また、ネットワーク装置31〜34は、当該装置にインストールされているソフトウェアのバージョンアップ、設定情報(パラメータ等)の変更、内蔵するデバイスの交換や増設等の作業(保守作業)が開始されたときにもアラーム情報を発生させる。このアラーム情報を作業アラームと呼ぶ。アラーム情報は、障害アラームと作業アラームとを区別する情報を含まない。例えば、ネットワーク装置31が電源装置の故障によって電源が切れた場合に発生する障害アラームと、保守作業によってネットワーク装置31の電源が切られた場合に発生する作業アラームとは、電源装置が切断状態になったことを示すアラームコードを含み、障害アラームと作業アラームとを区別する情報を含まない。また、ネットワーク装置31〜34は、一旦、アラーム情報を発生させた後に当該ネットワーク装置が正常動作に戻ったときに復旧情報を発生させる。復旧情報は、例えば復旧フラグである。復旧情報を発生させるとは、例えば、復旧フラグをオン(“0(ゼロ)”から“1”に変化させる)にすることである。ネットワーク装置31〜34は、例えば、当該ネットワーク装置の保守作業が終了したときに復旧情報を発生させる(復旧フラグをオンにする)。
【0014】
ネットワーク監視装置20は、アラームパターン解析装置10から供給される抑止パターンを取り込み、この抑止パターンをフィルタとして登録する。
抑止パターンが登録されたネットワーク監視装置20は、ネットワーク装置群30が発生させるアラーム情報を取り込んでネットワーク装置群30の動作を監視する。具体的には、ネットワーク監視装置20は、取り込んだアラーム情報のうち、作業アラームについてはフィルタリングし、障害アラームについては障害が発生したことを示す情報を提示する。
【0015】
アラームパターン解析装置10は、ネットワーク装置群30が過去に発生させたアラーム情報を記憶し、これらのアラーム情報(アラーム情報履歴)から保守作業に関係する作業アラームを切り分け、これら作業アラームを適用して抑止パターン生成処理を行うことによって、作業アラームを抑止するための抑止パターンを生成する装置である。
【0016】
具体的には、アラームパターン解析装置10は、ネットワーク装置群30が発生させるアラーム情報を取り込んで記憶する。また、アラームパターン解析装置10は、記憶されたアラーム情報と、保守作業に関する作業申請情報と、ネットワーク装置群30に関するネットワーク装置構成情報とに基づき、保守期間(作業時間)におけるアラーム情報について抑止パターン生成処理を実行して作業アラームのパターンを生成する。そして、アラームパターン解析装置10は、その作業アラームのパターンを抑止パターン(アラームパターン)として記憶する。
【0017】
アラームパターン解析装置10は、その機能構成として、ネットワーク装置構成情報記憶部11と、アラーム情報取得部12と、アラーム情報記憶部13と、作業申請受付部14と、抑止パターン生成部15と、抑止パターン記憶部16と、抑止パターン設定制御部17とを備える。
【0018】
ネットワーク装置構成情報記憶部11は、ネットワーク装置群30に関するネットワーク装置構成情報を記憶する。ネットワーク装置構成情報は、監視対象のネットワーク40に接続されたネットワーク装置31〜34それぞれの構成と、ネットワーク装置31〜34の接続関係とを示す情報である。具体的には、ネットワーク装置構成情報は、例えば、ネットワーク装置群30におけるネットワーク装置間の接続関係と、ネットワーク装置31〜34それぞれが備えるデバイスの構成と、各デバイス間の接続関係と、ネットワーク装置31〜34それぞれにインストールされたソフトウェアのバージョンとを、ネットワーク装置ごとにまとめた情報である。ネットワーク装置構成情報の詳細については後述する。
【0019】
アラーム情報取得部12は、ネットワーク装置群30、つまりネットワーク装置31〜34が発生させるアラーム情報(障害アラームまたは作業アラーム)を取り込み、このアラーム情報をアラーム情報記憶部13に供給する。アラーム情報は、アラームの発生時を特定する情報と、アラームの発生元を特定する情報と、アラームの内容を特定する情報と、アラームの状態が復旧したか否かを示す情報とを対応付けて含む情報である。具体的には、アラーム情報は、例えば、アラームの発生日時を示す情報と、アラームを発生させたネットワーク装置およびデバイスを特定する情報と、アラームの内容を特定するアラームコードと、復旧情報とを対応付けて含む情報である。アラーム情報の詳細については後述する。
【0020】
アラーム情報記憶部13は、アラーム情報取得部12から供給されるアラーム情報を記憶する。
【0021】
作業申請受付部14は、ネットワーク装置群30におけるいずれかのネットワーク装置の保守作業に関する作業申請を受け付けて取り込む。作業申請の内容は、作業開始日時および作業終了日時(作業時間の時間情報)と、保守作業の対象であるネットワーク装置およびデバイス(これらを作業対象と呼ぶ)の指定と、作業対象に対する作業項目の指定とである。作業申請は、キーボードやマウス等の入力装置から供給される。または、作業申請は、ネットワーク40を介して外部の端末から供給されてもよい。
【0022】
作業申請受付部14は、作業申請を受け付けて、作業開始日時および作業終了日時を示す情報と、保守作業の対象となるネットワーク装置およびデバイスを指定する情報と、作業対象に対する作業項目を指定する情報とを、保守作業を特定する作業番号に対応付けて内部の記憶部(不図示)に記憶させる。この記憶部に記憶される情報を作業申請情報と呼ぶ。つまり、作業申請情報は、ネットワーク40に接続されたネットワーク装置群30に対する作業(保守作業等)に関する作業時間と作業対象と作業対象に対する作業項目とを示す情報である。
【0023】
保守作業が完了した後、抑止パターン生成部15は、作業申請受付部14の記憶部に記憶された作業申請情報から当該保守作業に対応する作業申請情報のレコードを読み込む。そして、抑止パターン生成部15は、読み込んだレコードにおける作業開始日時および作業終了日時により求められる作業時間内に発生したアラーム情報のレコードを、アラーム情報記憶部13から読み込み、この読み込んだレコードの情報を作業時間内発生アラーム情報として内部の記憶部(不図示)に記憶させる。そして、抑止パターン生成部15は、作業時間内発生アラーム情報において復旧情報が示されたアラーム情報を推定作業アラームとして選択する。つまり、抑止パターン生成部15は、作業時間内にアラームが発生して且つそのアラームの状態が復旧しているアラーム情報を、推定作業アラームとしてアラーム情報記憶部13から抽出する。
【0024】
抑止パターン生成部15は、ネットワーク装置構成情報記憶部11からネットワーク装置構成情報を読み込む。そして、抑止パターン生成部15は、作業申請情報のレコードと、ネットワーク装置構成情報とに基づいて、保守作業の対象であるネットワーク装置およびデバイスの接続先である、接続先ネットワーク装置および接続先デバイスを特定する。そして、抑止パターン生成部15は、作業時間内発生アラーム情報において、推定作業アラームにおけるネットワーク装置およびデバイスが、保守作業の対象との接続関係にあるネットワーク装置およびデバイスであるアラーム情報を検出し、このアラーム情報に抽出フラグを付加する。つまり、抑止パターン生成部15は、推定作業アラームの中から、ネットワーク構成に基づいて保守作業に関係するアラーム情報のみを抽出する。
【0025】
上記は、一回の保守作業に基づいて生成される作業時間内発生アラーム情報から保守作業に関係するアラーム情報を抽出するものである。また、その抽出の精度をより高めるために、同一ネットワーク装置および同一デバイスに対する同一の作業項目を複数回実施した結果にもとづいて、保守作業に関係するアラーム情報の抽出を行ってもよい。
【0026】
つまり、同一ネットワーク装置および同一デバイスに対する同一の作業項目が複数回繰り返された後、抑止パターン生成部15は、作業時間内発生アラーム情報において、ネットワーク装置とデバイスとアラームコードとの組み合わせごとに作業実績を集計する。この作業実績は、保守作業の実施回数である。そして、抑止パターン生成部15は、ネットワーク装置とデバイスとアラームコードとの組み合わせごとに作業実績の頻度を計算して抑止パターン選出情報を生成する。そして、抑止パターン生成部15は、この抑止パターン選出情報の中から、頻度があらかじめ決定された閾値を越えるアラームコードを抑止パターンとして選出する。閾値は二種類である。第1の閾値であるαは、抽出フラグが付加されているアラーム情報について適用される。αは、例えば“0.6”である。また、第2の閾値であるβは、抽出フラグが付加されていないアラーム情報について適用される。βは、例えば“1”である。抽出フラグが付加されていないアラーム情報は、接続先ネットワーク装置および接続先デバイス以外のネットワーク装置およびデバイスについてのアラーム情報である。つまり、抽出フラグが付加されていないアラーム情報は、保守対象のネットワーク装置およびデバイスと関係がないアラーム情報であるため、第2の閾値βは、第1の閾値αよりも大きな値に設定する。また、抽出フラグは付加されていないが、比較的高い頻度で発生するアラーム情報は保守作業に関連していると想定される。よって、このアラーム情報についても、第2の閾値βを適用する。
【0027】
抑止パターン生成部15は、選出した抑止パターンを抑止パターン記憶部16に供給する。
抑止パターン記憶部16は、抑止パターン生成部15から供給される抑止パターンを記憶する。
抑止パターン設定制御部17は、抑止パターン記憶部16に記憶された抑止パターンを読み込み、この抑止パターンをネットワーク監視装置20に供給する。
【0028】
ネットワーク装置構成情報記憶部11と、アラーム情報記憶部13と、抑止パターン記憶部16とは、磁気ハードディスク装置、半導体ディスク装置、メモリ等の記憶装置により実現される。
【0029】
図2は、ネットワーク装置群30におけるネットワーク装置31〜34それぞれが備えるデバイスの構成と、各デバイス間の接続関係とを模式的に示した構成図である。
同図に示すように、ネットワーク31は、デバイス31a,31b,31cを備える。また、ネットワーク装置32は、デバイス32a,32b,32cを備える、また、ネットワーク装置33は、デバイス33a,33b,33cを備える。また、ネットワーク装置34は、デバイス34a,34bを備える。
【0030】
図2のネットワーク装置群30において、ネットワーク装置31とネットワーク装置32とは、デバイス31bとデバイス32aとが通信接続することによって接続を確立する。また、ネットワーク装置32とネットワーク装置33とは、デバイス32bとデバイス33aとが通信接続することによって接続を確立する。また、ネットワーク装置32とネットワーク装置34とは、デバイス32cとデバイス34aとが通信接続することによって接続を確立する。
【0031】
図3は、ネットワーク装置構成情報記憶部11に記憶されたネットワーク装置構成情報のデータ構成を示す図である。このネットワーク装置構成情報は、図2に示したネットワーク装置群30に対応する構成情報である。
【0032】
図2に示すように、ネットワーク装置構成情報は、「ネットワーク装置」と、「バージョン」と、「デバイス」と、「接続先装置」と、「接続先デバイス」との各項目対応付けて含む。項目「ネットワーク装置」は、ネットワーク装置群30に含まれるネットワーク装置を特定する情報を格納する項目である。項目「ネットワーク装置」には、例えば、ネットワーク装置の識別情報が格納される。項目「バージョン」は、ネットワーク装置にインストールされたソフトウェアのバージョン番号を格納する項目である。項目「バージョン」には、例えば、ネットワーク装置にインストールされたアプリケーションソフトウェアやファームウェアのバージョン番号が格納される。項目「デバイス」は、ネットワーク装置に含まれるデバイスを特定する情報を格納する項目である。項目「デバイス」には、例えば、デバイスの識別情報が格納される。項目「接続先装置」は、接続先のネットワーク装置を特定する情報を格納する項目である。項目「接続先装置」には、例えば、接続先であるネットワーク装置の識別情報が格納される。未接続である場合は、例えば“ヌル(null)”が格納される。なお、同図では、“−”で表現している。項目「接続先デバイス」は、接続先のデバイスを特定する情報を格納する項目である。項目「接続先デバイス」には、例えば、接続先であるデバイスの識別情報が格納される。未接続である場合は、例えば“ヌル(null)”が格納される。なお、同図では、“−”で表現している。
【0033】
図4は、アラーム情報記憶部13に記憶されたアラーム情報のデータ構成を示す図である。
同図に示すように、アラーム情報は、「発生日時」と、「ネットワーク装置」と、「デバイス」と、「アラームコード」と、「復旧フラグ」との各項目を対応付けて含む。項目「発生日時」は、アラームが発生したときの日時を示す情報を格納する項目である。項目「発生日時」には、例えば、障害アラームまたは作業アラームが発生したときの“年月日時分秒”を示す情報が格納される。項目「ネットワーク装置」は、アラームが発生したネットワーク装置を特定する情報を格納する項目である。項目「ネットワーク装置」には、障害アラームまたは作業アラームが発生したネットワーク装置の識別情報が格納される。項目「デバイス」は、アラームが発生したデバイスを特定する情報を格納する項目である。項目「デバイス」には、障害アラームまたは作業アラームが発生したデバイスの識別情報が格納される。項目「アラームコード」は、発生したアラームを特定するコードが格納される。項目「復旧フラグ」は、アラームが発生した後に当該アラームの原因となる状態が復旧したか否かを示すフラグを格納する項目である。項目「復旧フラグ」には、例えば、復旧したことを示す“1”(オン)、または未復旧であることを示す“0(ゼロ)”(オフ)が格納される。
【0034】
図5は、作業申請受付部14の記憶部に記憶された作業申請情報のデータ構成を示す図である。
同図に示すように、作業申請情報は、「作業番号」と、「作業開始日時」と、「作業終了日時」と、「対象装置」と、「対象デバイス」と、「作業項目」との各項目を対応付けて含む。項目「作業番号」は、保守作業を特定する番号である。項目「作業番号」には、例えば、作業申請受付部14により決定された保守作業の識別情報が格納される。項目「作業開始日時」は、保守作業が開始されるときの日時を示す情報を格納する項目である。項目「作業開始日時」には、例えば、保守作業が開始されるときの“年月日時分秒”を示す情報が格納される。項目「作業終了日時」は、保守作業が修了されるときの日時を示す情報を格納する項目である。項目「作業終了日時」には、例えば、保守作業が修了されるときの“年月日時分秒”を示す情報が格納される。項目「対象装置」は、保守作業の対象であるネットワーク装置を特定する情報を格納する項目である。項目「対象装置」には、例えば、保守作業の対象であるネットワーク装置の識別情報が格納される。項目「対象デバイス」は、保守作業の対象であるデバイスを特定する情報を格納する項目である。項目「対象デバイス」には、例えば、保守作業の対象であるデバイスの識別情報が格納される。項目「作業項目」は、保守作業の項目、つまり操作内容を示す情報を格納する。項目「作業項目」には、例えば、“Down”等の作業(操作)を示す情報が格納される。“Down”は、対象デバイスの電源を切る作業を示す情報である。
【0035】
図6は、抑止パターン生成部15の記憶部に記憶された作業時間内発生アラーム情報のデータ構成を示す図である。
同図に示すように、作業時間内発生アラーム情報は、一の保守作業にしたがって作業時間内に発生したアラーム情報と抽出フラグとを対応付けた情報である。項目「抽出フラグ」は、復旧フラグがオンであるアラーム情報(推定作業アラーム)において、ネットワーク装置およびデバイスが相互に接続関係を有するアラーム情報である場合にオンの状態値、ネットワーク装置およびデバイスが相互に接続関係を有さないアラーム情報である場合にオフの状態値を格納する項目である。項目「抽出フラグ」には、例えば、復旧フラグがオン(“1”)であるアラーム情報(推定作業アラーム)において、ネットワーク装置およびデバイスが相互に接続関係を有するアラーム情報である場合に“1”(オン)が格納される。また、項目「抽出フラグ」には、例えば、復旧フラグがオン(“1”)であるアラーム情報(推定作業アラーム)において、ネットワーク装置およびデバイスが相互に接続関係を有さないアラーム情報である場合に“0”(オフ)が格納される。
【0036】
図7は、抑止パターン生成部15が生成する抑止パターン選出情報のデータ構成を示す図である。同図に示すように、抑止パターン選出情報は、「デバイス」と、「アラームコード」と、「抽出フラグ」と、「作業実績」と、「発生頻度」との各項目を対応付けて含む。同図は、実施回数を3回とした例である。項目「作業実績」において、“1”は実施されたことを示し、“0(ゼロ)”は未実施であることを示す。項目「発生頻度」は、作業実績における実施の割合を格納する項目である。
【0037】
次に、本発明の一実施形態であるアラームパターン解析装置10の動作について説明する。
図8は、アラームパターン解析装置10による抑止パターン生成処理の手順を示す概略のフローチャートである。ここでは、作業申請受付部14が、保守作業の対象であるネットワーク装置およびデバイスの指定と、作業項目の指定とを取り込んで内部の記憶部に記憶させてあるものとして、本フローチャートの処理を説明する。
【0038】
ステップS1において、作業者による保守作業が開始される際、作業申請受付部14は、作業開始日時を記憶部に記憶された作業申請情報に登録する。例えば、作業者が保守作業を開始する際に、作業申請受付部14を直接または遠隔に操作することによって、作業開始日時を作業申請情報に登録する。
【0039】
次に、ステップS2において、アラーム情報取得部12は、ネットワーク装置31〜34が発生させるアラーム情報を取り込み、このアラーム情報をアラーム情報記憶部13に記憶させる。ここで取り込まれるアラーム情報は、作業者によって実施される保守作業によって発生する作業アラーム、または障害アラームである。
【0040】
次に、ステップS3において、作業者による保守作業が終了される際、作業申請受付部14は、作業終了日時を記憶部に記憶された作業申請情報に登録する。例えば、作業者が保守作業を終了する際に、作業申請受付部14を直接または遠隔に操作することによって、作業終了日時を作業申請情報に登録する。
【0041】
次に、ステップS4において、抑止パターン生成部15は、作業申請受付部14の記憶部に記憶された作業申請情報から当該保守作業に対応する作業申請情報のレコードを読み込む。
次に、抑止パターン生成部15は、読み込んだレコードにおける作業開始日時および作業終了日時により作業時間を計算し、この作業時間内に発生したアラーム情報のレコードを、アラーム情報記憶部13から読み込む。
次に、抑止パターン生成部15は、読み込んだレコードの情報を作業時間内発生アラーム情報として内部の記憶部に記憶させる。
次に、抑止パターン生成部15は、作業時間内発生アラーム情報において復旧情報が示されたアラーム情報を推定作業アラームとして選択する。
【0042】
次に、ステップS5において、抑止パターン生成部15は、ネットワーク装置構成情報記憶部11からネットワーク装置構成情報を読み込む。
次に、抑止パターン生成部15は、既に取り込んである作業申請情報のレコードと、ネットワーク装置構成情報とに基づいて、保守作業の対象であるネットワーク装置およびデバイスの接続先である、接続先ネットワーク装置および接続先デバイスを特定する。
次に、抑止パターン生成部15は、作業時間内発生アラーム情報において、推定作業アラームにおけるネットワーク装置およびデバイスが、相互に接続関係にあるネットワーク装置およびデバイスであるアラーム情報を検出し、このアラーム情報に抽出フラグを付加する。
【0043】
次に、抑止パターン生成部15は、作業時間内発生アラーム情報において、デバイスとアラームコードとの組み合わせごとに作業実績(保守作業の実施回数)を集計する。
次に、抑止パターン生成部15は、デバイスとアラームコードとの組み合わせごとに作業実績の頻度を計算して抑止パターン選出情報を生成する。
次に、抑止パターン生成部15は、この抑止パターン選出情報の中から、頻度があらかじめ決定された閾値を越えるデバイスとアラームコードとの組み合わせを、抑止パターンとして選出する。
【0044】
次に、ステップS6において、抑止パターン生成部15は、選出した抑止パターンを抑止パターン記憶部16に供給する。
【0045】
次に、アラームパターン解析装置10による抑止パターン再生成処理について説明する。アラームパターン解析装置10は、抑止パターン記憶部16に抑止パターンを登録する際に、既に同一対象の抑止パターンが登録されている場合に抑止パターン再生成処理を実行する。抑止パターン再生成処理として、例えば、以下の二つの方法がある。
【0046】
[1]抑止パターン再生成処理の第1の方法
第1の方法は、抑止パターンが適用されるたびに、アラーム情報ごとに適用頻度または適用回数、最終適用日時を記憶させる。再作成パターンで新たに追加されるアラーム情報については、このアラーム情報を抑止パターンに追加する。再作成パターンで削減されているアラーム情報については、上記の適用頻度(適用回数)および最終適用日時を参照し、適用頻度が低く(適用回数が少なく)、且つ最終適用日時が抑止パターンを最後に参照した日時よりも古い場合には抑止パターンには含めない。
【0047】
[2]抑止パターン再生成処理の第2の方法
第2の方法は、抑止パターン生成処理と同様に実行する方法である。この第2の方法では、既存の抑止パターンおよび新規の抑止パターンの生成時に抽出した全てのアラーム情報を計数し、抑止パターン生成処理における閾値を適用して抑止パターンを再生成する。
【0048】
次に、ネットワークシステム1における、抑止パターンを用いたフィルタリングの方法について説明する。
保守作業が開始される際に、作業者による操作に基づき、作業申請受付部14は、事前登録された作業申請情報に対し、作業開始および作業終了を指定する登録を行う。作業開始の登録処理では、作業申請受付部14の記憶部に記憶された全ての作業申請情報を用いて抑止パターン記憶部16に記憶された抑止パターンを検索する。そして、作業申請情報に含まれる作業対象と、ネットワーク装置構成情報記憶部11に記憶されたネットワーク装置構成情報とに基づいて、作業対象と接続されているネットワーク装置およびデバイスに関係する情報を参照し、検索した抑止パターンに対してネットワーク装置およびデバイスの識別情報を追加してネットワーク監視装置20にフィルタとして登録する。作業申請情報にレコードが複数ある場合、ネットワーク監視装置20には、各抑止パターンの論理和である抑止パターン群をフィルタとして登録させる。作業終了の登録処理の際も同様に作業申請受付部14を経由して、ネットワーク監視装置20から抑止パターンを削除する。
【0049】
以上、詳述したとおり、本発明の一実施形態であるアラームパターン解析装置10は、作業アラームを抑止するアラームパターン(抑止パターン)をアラーム発生要因単位で生成する。作業アラームは保守作業等の作業行為によって発生するため、そのアラーム発生要因単位に抑止パターンを生成することにより、複雑に発生する作業アラームを抑止することができる。アラームパターン解析装置10は、ネットワーク装置構成情報を抑止パターンの生成処理ごとに参照するため、ネットワーク構成が変更された場合でも最適な抑止パターンを生成でき、よってネットワーク管理者の作業量を大きく削減することができる。
【0050】
また、アラームパターン解析装置10は、事前申請した作業申請に対して作業開始および終了登録を行って、正確な作業開始時刻および作業終了時刻を取得する。これらの時刻を用いて、アラームパターン解析装置10は、アラーム情報記憶部13に記憶された過去のアラーム情報から作業時間内にアラームが発生して復旧したアラーム情報を抽出し、推定作業アラームとする。抽出結果に対し、アラームパターン解析装置10は、作業申請情報およびネットワーク装置構成情報に基づいて、作業対象のネットワーク装置およびデバイスと接続を有する接続先ネットワーク装置および接続先デバイスの情報を追加することにより、抑止パターン生成のもととなるアラーム情報が作業アラームのみとなり、よって、抑止パターンの正確性を高く保つことができる。
【0051】
また、アラームパターン解析装置10は、作業内容を、作業対象デバイスとこの作業対象デバイスに対する作業項目との組(作業行為)で表現する。同一作業行為の作業申請数は、同一作業内容を有する作業申請数よりも多く存在する。よって、作業行為単位で抑止パターン作成することにより、迅速に抑止パターンの生成が可能となる作業回数を満たすことが可能となる。さらに、作業行為を抑止パターンの単位とすることにより、作業内容ごとに抑止パターンを生成するよりもパターン生成数が削減され、多種多数の作業内容に対して柔軟に申請の受付を行うことができる。
【0052】
また、アラームパターン解析装置10は、ウェブ(Web)等の遠隔操作によって作業受付申請部14に対して作業登録を行う。これにより、正確な作業開始時刻および作業終了時刻を取得することができ、また、連絡応対する人員の業務を削減することができる。
また、作業登録時に作業申請に含まれる作業行為の抑止パターンが抑止パターン生成部15によって生成されている場合は、作業者の作業登録と同時に、ネットワーク監視装置20に対してフィルタ登録することができる。
【0053】
したがって、本実施形態によれば、作業者による作業工数を抑えることができ、且つ複雑に発生する作業アラームを正しく抑止させることができる。
【0054】
なお、上述した実施形態であるアラームパターン解析装置10の一部の機能をコンピュータで実現するようにしてもよい。この場合、その機能を実現するためのアラームパターン解析プログラムをコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたアラームパターン解析プログラムをコンピュータシステムに読み込ませて、このコンピュータシステムが実行することによって実現してもよい。なお、このコンピュータシステムとは、オペレーティング・システム(Operating System;OS)や周辺装置のハードウェアを含むものである。また、コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに備えられる磁気ハードディスクやソリッドステートドライブ等の記憶装置のことをいう。さらに、コンピュータ読み取り可能な記録媒体とは、インターネット等のコンピュータネットワーク、および電話回線や携帯電話網を介してプログラムを送信する場合の通信回線のように、短時間の間、動的にプログラムを保持するもの、さらには、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持するものを含んでもよい。また上記のアラームパターン解析プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
【0055】
以上、本発明の実施の形態について図面を参照して詳述したが、具体的な構成はその実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0056】
1 ネットワークシステム
10 アラームパターン解析装置
11 ネットワーク装置構成情報記憶部
12 アラーム情報取得部
13 アラーム情報記憶部
14 作業申請受付部
15 抑止パターン生成部
16 抑止パターン記憶部
17 抑止パターン設定制御部
20 ネットワーク監視装置
30 ネットワーク装置群
31〜34 ネットワーク装置
31a,31b,31c デバイス
32a,32b,32c デバイス
33a,33b,33c デバイス
34a,34b デバイス
40 ネットワーク

【特許請求の範囲】
【請求項1】
監視対象のネットワークに接続された作業対象であるネットワーク装置に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部と、
アラームの発生時を特定する情報と前記アラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込むアラーム情報取得部と、
前記アラーム情報取得部が取り込んだ前記アラーム情報を記憶するアラーム情報記憶部と、
前記作業申請受付部が取り込んだ前記作業申請情報を用いて、前記アラーム情報記憶部から前記作業時間内にアラームが発生して且つ前記アラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部と、
を備えることを特徴とするアラームパターン解析装置。
【請求項2】
前記監視対象のネットワークに接続された複数のネットワーク装置それぞれの構成と前記複数のネットワーク装置の接続関係とを示すネットワーク装置構成情報を記憶するネットワーク装置構成情報記憶部をさらに備え、
前記作業申請情報は、前記作業対象の指定を含み、
前記アラーム情報は、前記アラームの発生元を特定する情報を含み、
前記抑止パターン生成部は、前記作業申請情報と前記ネットワーク装置構成情報記憶部に記憶された前記ネットワーク装置構成情報とに基づいて、前記作業対象の接続先である接続先対象を特定し、前記抽出した前記作業アラームから、前記作業アラームにおける前記発生元が作業対象との接続関係にあるアラーム情報を作業アラームとして抽出する
ことを特徴とする請求項1記載のアラームパターン解析装置。
【請求項3】
アラーム情報を記憶するアラーム情報記憶部を備えたコンピュータを、
監視対象のネットワークに接続された作業対象であるネットワーク装置に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部と、
アラームの発生時を特定する情報と前記アラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込み、前記アラーム情報を前記アラーム情報記憶部に記憶させるアラーム情報取得部と、
前記作業申請受付部が取り込んだ前記作業申請情報を用いて、前記アラーム情報記憶部から前記作業時間内にアラームが発生して且つ前記アラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部と、
として機能させるためのアラームパターン解析プログラム。
【請求項4】
前記監視対象のネットワークに接続された複数のネットワーク装置それぞれの構成と前記複数のネットワーク装置の接続関係とを示すネットワーク装置構成情報を記憶するネットワーク装置構成情報記憶部を、前記コンピュータにさらに備えさせ、
前記作業申請情報は、前記作業対象の指定を含み、
前記アラーム情報は、前記アラームの発生元を特定する情報を含み、
前記抑止パターン生成部は、前記作業申請情報と前記ネットワーク装置構成情報記憶部に記憶された前記ネットワーク装置構成情報とに基づいて、前記作業対象の接続先である接続先対象を特定し、前記抽出した前記作業アラームから、前記作業アラームにおける前記発生元が作業対象との接続関係にあるアラーム情報を作業アラームとして抽出する
ことを特徴とする請求項3記載のアラームパターン解析プログラム。
【請求項5】
監視対象のネットワークを介してアラームパターン解析装置とネットワーク監視装置とが接続されたネットワーク監視システムであって、
前記アラームパターン解析装置は、
前記ネットワークに接続された作業対象であるネットワーク装置に対する作業時間の時間情報を含む作業申請情報を取り込む作業申請受付部と、
アラームの発生時を特定する情報と前記アラームの状態が復旧したか否かを示す情報とを対応付けて含むアラーム情報を取り込むアラーム情報取得部と、
前記アラーム情報取得部が取り込んだ前記アラーム情報を記憶するアラーム情報記憶部と、
前記作業申請受付部が取り込んだ前記作業申請情報を用いて、前記アラーム情報記憶部から前記作業時間内にアラームが発生して且つ前記アラームの状態が復旧しているアラーム情報を作業アラームとして抽出して抑止パターンを生成する抑止パターン生成部と、
前記抑止パターン生成部が生成した抑止パターンを前記ネットワーク監視装置に供給する抑止パターン設定制御部と、
を備え、
前記ネットワーク監視装置は、
前記アラームパターン解析装置の抑止パターン設定制御部から供給される前記抑止パターンを取り込み、前記抑止パターンをフィルタ登録して前記ネットワークを監視する
ことを特徴とするネットワーク監視システム。
【請求項6】
前記アラームパターン解析装置は、
前記監視対象のネットワークに接続された複数のネットワーク装置それぞれの構成と前記複数のネットワーク装置の接続関係とを示すネットワーク装置構成情報を記憶するネットワーク装置構成情報記憶部をさらに備え、
前記作業申請情報は、前記作業対象の指定を含み、
前記アラーム情報は、前記アラームの発生元を特定する情報を含み、
前記抑止パターン生成部は、前記作業申請情報と前記ネットワーク装置構成情報記憶部に記憶された前記ネットワーク装置構成情報とに基づいて、前記作業対象の接続先である接続先対象を特定し、前記抽出した前記作業アラームから、前記作業アラームにおける前記発生元が作業対象との接続関係にあるアラーム情報を作業アラームとして抽出する
ことを特徴とする請求項5記載のネットワーク監視システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−73593(P2013−73593A)
【公開日】平成25年4月22日(2013.4.22)
【国際特許分類】
【出願番号】特願2011−214598(P2011−214598)
【出願日】平成23年9月29日(2011.9.29)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 電子情報通信学会ソサイエティ大会、社団法人電子情報通信学会、2011年9月13日〜16日
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】