説明

アラート管理装置およびアラート管理方法

【課題】複数の通信装置からのアラートがユーザに提示される場合、障害の発生原因の特定に時間を要することがあった。
【解決手段】実施の1形態の監視装置10は、複数の通信装置のアラートを管理する。この装置は、複数の通信装置から出力されたアラートのうち基準となる通信装置から出力されたアラートである主アラートを、その主アラートの発生に伴って他の通信装置から出力されたアラートである付随アラートよりも視認性を高めて所定の表示装置に表示させる表示制御部36を備える。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、データ処理技術に関し、特に、複数の通信装置から出力されたアラートを管理するアラート管理装置と、その装置により実行されるアラート管理方法に関する。
【背景技術】
【0002】
通信網を構成する通信装置は障害の発生を検出すると、一般的にアラートを出力する。通信装置を管理するユーザは、そのアラートを確認することで障害の原因を特定し、障害の回復や予防等を実施する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平11−205318号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
1つの通信装置で障害が発生すると、その障害の影響を受けた他の通信装置においても障害が検出されることがある。この場合、そもそも初めに障害が発生した通信装置からアラートが出力されるのみならず、他の通信装置からもアラートが出力されて、多数のアラートがユーザに提示される。その結果、そもそも初めに発生した障害を示すアラートの特定が困難になり、障害の発生原因の特定に時間を要することがあった。
【0005】
本発明は、こうした課題に鑑みてなされたものであり、その主たる目的は、複数の通信装置からのアラートに基づいて障害の根本原因を特定することを支援する技術を提供することである。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明のある態様のアラート管理装置は、複数の通信装置のアラートを管理する装置であって、基準となる通信装置からのアラートである主アラートの発生に伴って、他の通信装置からのアラートである付随アラートが発生することを示す依存関係を保持する依存関係保持部と、複数の通信装置から出力されたアラートを取得するアラート取得部と、依存関係を参照し、付随アラートよりも主アラートの視認性を高めて所定の表示装置に表示させる表示制御部と、を備える。
【0007】
通信装置は、LAN・WAN・インターネット等、種々の通信網を構成する通信装置であってよい。例えば、WDM(Wavelength Division Multiplex)網を構成する光伝送装置であってもよい。また、ルータやL3・L2スイッチであってもよい。主アラートは、基準となる通信装置における障害の発生や回復を通知するものであってもよい。付随アラートは、基準となる通信装置における障害に伴って他の通信装置で検出された障害の発生や回復を通知するものであってもよい。
【0008】
この態様によれば、複数の通信装置のそれぞれから出力されたアラートのうち主アラートの視認性を相対的に向上させることで、通信装置を監視するユーザに主アラートを容易に判別させ、その内容を確認させることができる。これにより、ユーザは、障害の根本原因を特定しやすくなり、障害の回復・予防を迅速に実施できる。
【0009】
表示制御部は、付随アラートが取得された一方で主アラートが未取得である場合、主アラートが未取得である旨をさらに表示させてもよい。この態様によれば、種々の要因により主アラートが未検出の場合でも、その主アラートに関連する障害の発生をユーザに示唆でき、障害の根本原因をユーザが特定することを支援できる。
【0010】
他の通信装置からのアラートが示すイベント発生時刻が、基準となる通信装置からのアラートが示すイベント発生時刻から所定の期間内であることを条件として、それら両アラートの間に依存関係を設定する依存関係設定部をさらに備えてもよい。
【0011】
所定の期間は、ユーザにより任意の期間が設定されてよく、障害の発生や回復を通信装置が検出してから、その旨を示すアラートを外部へ送信するまでの猶予期間であってもよい。この猶予期間は、検出された動作状態が確定したものであるか否かを判定するための期間であってもよく、例えば1秒から2秒程度の期間でもよい。
【0012】
この態様によれば、複数の通信装置のそれぞれにおける障害の検出からアラート通知までのタイムラグを吸収して、アラート間の依存関係を適切に設定できる。
【0013】
基準となる通信装置から出力された障害回復を示すアラートと、他の通信装置から出力された障害回復を示すアラートとの間に依存関係が成立することを条件として、基準となる通信装置から出力された障害発生を示すアラートと、他の通信装置から出力された障害発生を示すアラートとの間に依存関係を設定する依存関係設定部をさらに備えてもよい。
【0014】
障害の回復アラート間に依存関係が成立すれば、その障害の発生アラート間にも依存関係が成立する可能性が高いため、この態様によれば、アラート間の依存関係を一層適切に設定できる。
【0015】
依存関係保持部は、基準となる通信装置に隣接する通信装置と、当該隣接する通信装置に隣接し、当該隣接する通信装置を介して基準となる通信装置と接続される通信装置とを他の通信装置の範囲とした依存関係を保持してもよい。同様に、依存関係設定部は、基準となる通信装置に隣接する通信装置と、当該隣接する通信装置に隣接し、当該隣接する通信装置を介して基準となる通信装置と接続される通信装置とを他の通信装置の範囲とした依存関係を設定してもよい。
【0016】
この態様によれば、監視対象の通信装置が多数存在する場合でも付随アラートの対象となる範囲が限定されるため、アラート管理装置で保持すべき依存関係のデータ量や、その依存関係を設定するための処理量を低減できる。これにより、依存関係を設定または保持するために必要となるハードウェアリソースや処理時間を低減できる。
【0017】
表示制御部は、主アラートの視認性を高める際、その根拠として、依存関係を示す情報を所定のファイルに記録してもよい。この態様によれば、主アラートの視認性を相対的に高めた証跡が記録されるため、必要に応じて後からその証跡を参照できる。例えば、詳細な処理内容を後から確認でき、また、処理の妥当性を後から検証できる。
【0018】
本発明の別の態様もまた、アラート管理装置である。この装置は、複数の通信装置のアラートを管理する装置であって、複数の通信装置から出力されたアラートのうち基準となる通信装置から出力されたアラートである主アラートを、その主アラートの発生に伴って他の通信装置から出力されたアラートである付随アラートよりも視認性を高めて所定の表示装置に表示させる表示制御部を備える。この態様によれば、上記と同様に、主アラートの視認性を相対的に向上させることで、通信装置を監視するユーザによる障害への対処作業を支援できる。
【0019】
本発明のさらに別の態様は、アラート管理方法である。この方法は、複数の通信装置のアラートを管理する装置により実行される方法であって、複数の通信装置から出力されたアラートを取得するステップと、基準となる通信装置からのアラートである主アラートの発生に伴って、他の通信装置からのアラートである付随アラートが発生することを示す依存関係を参照し、付随アラートよりも主アラートの視認性を高めて所定の表示装置に表示させるステップと、を備える。この態様によれば、上記と同様に、主アラートの視認性を相対的に向上させることで、通信装置を監視するユーザによる障害への対処作業を支援できる。
【0020】
なお、以上の構成要素の任意の組合せ、本発明の表現を装置、方法、システム、プログラム、プログラムを格納した記録媒体などの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0021】
本発明によれば、複数の通信装置からのアラートに基づいて障害の根本原因を特定することを支援できる。
【図面の簡単な説明】
【0022】
【図1】本実施の形態の通信システムの構成を示す図である。
【図2】図1の監視装置の機能構成を示すブロック図である。
【図3】原本アラート保持部に格納されるデータ例を示す図である。
【図4】依存関係保持部に格納されるデータ例を示す図である。
【図5】表示アラート保持部に格納されるデータ例を示す図である。
【図6】証跡保持部に格納されるデータ例を示す図である。
【図7】依存関係の判定例を示す図である。
【図8】表示態様決定部の処理アルゴリズムを示すフローチャートである。
【発明を実施するための形態】
【0023】
本発明の実施の形態を説明する前に、まず概要を説明する。
通信装置で発生した障害にユーザが対処する場合、通信装置から出力されたアラートから障害の原因を特定し、その原因を取り除くことで障害を解決する。ところで、通信網は複数の通信装置から構成されることが一般的であり、このうちの1つの通信装置で障害が発生すると、その障害に起因して複数の通信装置からアラートが出力されることがある。複数のアラートがユーザに提示される結果、障害の根本原因を示すアラートの特定に時間を要することがあった。
【0024】
また、アラートの出力元である通信装置は、最初に障害を検出してから、その障害が継続していることを確認するための猶予期間が経過した後に、その障害を示すアラートを通知することがある。この場合は特に、複数の通信装置それぞれからのアラートの通知順序がランダムになりやすく、障害の根本原因を示すアラートの特定に時間を要することがあった。
【0025】
そこで本実施の形態では、複数の通信装置からのアラートに基づいて障害の根本原因を特定することを支援するためのアラート管理技術を適用した監視装置を提案する。この監視装置は、複数の通信装置のそれぞれから出力されたアラートをディスプレイに表示させる。その際に、複数のアラートを、障害の根本原因を示す、言い換えれば根本の障害が検出されたことで出力された「主アラート」と、その主アラートの発生に伴って出力された「付随アラート」とに区別し、付随アラートよりも主アラートの視認性を高めた状態でディスプレイに表示させる。主アラートは通信網において連鎖的に発生した複数の障害の根本原因を示すため、その主アラートの視認性が高まることにより、ユーザは障害の根本原因を迅速に特定して、障害の回復作業や予防作業を迅速に実施できるようになる。
【0026】
図1は、本実施の形態の通信システムの構成を示す。通信システム100は、監視装置10と、ネットワークエレメント(NE)12で総称されるNE−A12a〜NE−J12jを備える。NE−A12a〜NE−F12fはWDM網を構成する通信装置であり、NE−G12g〜NE−J12jは図示しないクライアント端末に対するアクセス網を構成する通信装置である。
【0027】
NE−A12a〜NE−J12jは、クライアント端末間で送受されるユーザフレームの通信線路となる主信号線16により相互に接続されており、ユーザフレームの中継処理を実行する。NE−A12a〜NE−J12jのそれぞれは、自装置において所定の障害を検出した場合、その障害内容および検出時刻を示すアラートのデータを監視装置10へ送信する。
【0028】
なお、NE−A12a〜NE−J12jは、自装置における障害の発生を検出してから、予め定められた猶予期間の間にその障害の回復を検出しない場合、猶予期間の経過後にアラートを通知する。この猶予期間は、障害の発生からその直後に回復する場合の発生時からの経過時間や、頻度等に応じて適宜決定されてよい。
【0029】
監視装置10は、NE−A12a〜NE−J12jのそれぞれの動作状態を監視する情報処理装置であり、NE12の監視のために使用される制御フレーム専用の通信経路となる制御信号線14や、主信号線16を介して各NE12と接続される。監視装置10は、NE−A12a〜NE−J12jのそれぞれからアラートのデータを受信して、そのアラートの内容を、通信システム100を監視するユーザに提示する。
【0030】
図2は、図1の監視装置10の機能構成を示すブロック図である。監視装置10は、各種のデータを保持する記憶領域であるデータ保持部20と、各種のデータ処理を実行するデータ処理部30とを有する。
【0031】
本明細書のブロック図において示される各ブロックは、ハードウェア的には、コンピュータのCPUやメモリをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。
【0032】
例えば、データ保持部20は、ハードディスク等の記録媒体と、その記録媒体に保持されるデータにより実現されてもよい。また、データ処理部30は、コンピュータプログラムとして実装されて記録媒体に格納され、メインメモリに適宜読み出されて、プロセッサにより実行されてもよい。
【0033】
データ保持部20は、原本アラート保持部22と、依存関係保持部24と、表示アラート保持部26と、証跡保持部28とを含む。原本アラート保持部22は、NE−A12a〜NE−J12jのそれぞれから出力されたアラートの原本データが逐次格納される記憶領域である。
【0034】
図3は、原本アラート保持部22に格納されるデータ例を示す。図3の1つのレコードは、1つのアラートに含まれる情報を示している。レコードIDフィールドには、格納されたアラートを一意に示すための通し番号が設定される。アラートIDフィールドには、アラートの識別情報が設定される。装置名称フィールドには、アラートを出力したNE12の識別情報が設定される。検出日時フィールドには、障害の発生もしくは回復がNE12において検出された日時が設定される。アラート内容フィールドには、障害の内容、例えば障害が発生したのか、回復したのかを示す情報が設定される。
【0035】
図2に戻り依存関係保持部24は、2つのNE12からそれぞれ出力されるアラート間の依存関係を保持する記憶領域である。すなわち、NE−A12aとNE−B12b、NE−A12aとNE−C12c、NE−B12bとNE−C12c、・・・等のそれぞれの組み合わせにおけるアラートの依存関係が保持される。
【0036】
図4は、依存関係保持部24に格納されるデータ例を示す。同図は、NE−A12aのアラートとNE−B12bのアラートとの間の依存関係を示している。その縦軸はNE−A12aから出力されるアラートの一覧、横軸はNE−B12bから出力されるアラートの一覧を示している。
【0037】
第1インジケータ60は、NE−A12aでのアラートの発生に伴って、NE−B12bでもアラートが発生する関係を示す。例えば、NE−A12aから「ERROR−008」が出力されると、それに伴って、NE−B12bから「ERROR−005」が出力されることを示している。これは、NE−A12aで障害が発生して、その障害に起因してNE−B12bでも障害が発生した状況、言い換えれば、NE−B12bにおける障害の根本原因がNE−A12aにおける障害である状況において典型的に発生する。この場合、NE−A12aの「ERROR−008」が主アラートとなり、NE−B12bの「ERROR−005」が付随アラートとなる。
【0038】
第2インジケータ62は、NE−B12bでのアラートの発生に伴って、NE−A12aでもアラートが発生する関係を示す。すなわち、NE−B12bから「ERROR−007」が出力されると、それに伴って、NE−A12aから「ERROR−011」が出力されることを示している。この場合、NE−B12bの「ERROR−007」が主アラートとなり、NE−A12aの「ERROR−011」が付随アラートとなる。
【0039】
波及度64には、NE−A12aの各アラートの発生がNE−B12bの各アラートの発生を引き起こす度合い(以下、「波及度」とも呼ぶ)が設定される。具体的には、NE−A12aの各アラートに設定された第1インジケータ60の合計数が波及度として設定される。依存度66には、NE−A12aの各アラートが、NE−B12bの各アラートの発生に依存して引き起こされる度合い(以下、「依存度」とも呼ぶ)が設定される。具体的には、NE−A12aの各アラートに設定された第2インジケータ62の合計数が依存度として設定される。
【0040】
依存度68には、NE−A12aの各アラートに対するNE−B12bの各アラートの依存度が設定される。具体的には、NE−B12bの各アラートに設定された第1インジケータ60の合計数が依存度として設定される。波及度70には、NE−A12aの各アラートに対するNE−B12bの各アラートの波及度が設定される。具体的には、NE−B12bの各アラートに設定された第2インジケータ62の合計数が波及度として設定される。
【0041】
なお、依存関係保持部24は、基準となるNE12(以下「基準NE」と呼ぶ)からの主アラートとの間で依存関係を有する付随アラートの範囲として、通信システム100を構成する一部のNE12からのアラートに限定して依存関係を保持する。本実施の形態では、基準NEに隣接するNE12(以下、「隣接NE」と呼ぶ)と、その隣接NEに隣接し、隣接NEを介して基準NEと接続されたNE12(以下、「近接NE」と呼ぶ)とから出力されるアラートを依存アラートの範囲とする。例えば、通信システム100において図1のNE−A12aを基準NEとする場合、隣接NEであるNE−B12bと、近接NEであるNE−C12cとから出力されるアラートを依存アラートの範囲とする。
【0042】
この付随アラートの範囲を近接NEまでに限定することは、付随アラートを多数検出するためには付随アラートの範囲を広く設定すべきことと、監視装置10の処理量やハードウェアリソースを低減するためには付随アラートの範囲を狭く設定すべきこととを、本発明者が比較考量して想到したものである。すなわち、アラート間の依存関係の多くは近接NEまでの範囲でカバーできるとの知見に基づき、付随アラートの範囲を近接NEまでに限定することで、付随アラートの検出精度を維持しつつ、監視装置10の処理量やハードウェアリソースの低減を実現する。
【0043】
図2に戻り表示アラート保持部26は、ディスプレイに表示する形式へ編集された後の、アラートの表示用データを保持する記憶領域である。図5は、表示アラート保持部26に格納されるデータ例を示す。同図は、図3に示した各アラートの編集後の状態を示している。すなわち、レコードID「00501」、「00503」、「00506」、「00508」のアラートは削除(非表示と)されており、その一方でレコードID「00502−1」、「00505−1」のアラートが追加されている。
【0044】
図2に戻り証跡保持部28は、アラートの原本データから表示用データへ編集した処理の内容を証跡として保持する記憶領域である。具体的には、原本アラート保持部22の原本データが、表示アラート保持部26の表示用データとされる際に改変された内容および改変理由を記憶する。
【0045】
図6は、証跡保持部28に格納されるデータ例を示す。処理内容フィールドには、編集処理の内容が設定され、例えばアラートを非表示としたことを示す「非表示」と、新たなアラートを追加したことを示す「追加」が設定される。処理理由フィールドには、それらの編集処理を実行した理由が設定される。
【0046】
例えば、レコードID「00501」について、NE−B12bが出力したERROR−005は、NE−A12aが出力したERROR−008の付随アラートであるため、非表示としたことを示している。また、レコードID「00502−1」について、NE−B12bのERROR−010は付随アラートであるにもかかわらず、主アラートであるNE−A12aのERROR−012が未検出であるため、その旨を示すアラートを追加したことを示している。
【0047】
図2に戻りデータ処理部30は、アラート取得部32と、依存関係設定部34と、表示制御部36とを含む。アラート取得部32は、NE−A12a〜NE−J12jのそれぞれから送信されたアラートを受信し、そのデータをアラートの原本データとして原本アラート保持部22に格納する。
【0048】
依存関係設定部34は、原本アラート保持部22に保持されたアラートの原本データを参照して、異なるNE12のそれぞれで出力されるアラート間の依存関係を判別する。そして、その依存関係を示すデータ、例えば図4で示すデータを依存関係保持部24へ格納する。具体的には、依存関係設定部34は、基準NEから出力される各アラートについて、各アラートが示す検出日時と、その基準NEで予め設定された猶予期間とに応じて、隣接NEおよび近接NEから出力される各アラートとの依存関係を判別する。
【0049】
なお猶予期間は、NE12において検出された障害について、その障害が即時に回復した場合や、障害の誤検出を回避して、確度の高いアラートを通知するために予め設けられた期間であり、例えば1秒であってもよい。NE12は、猶予期間の間に障害の回復を検出した場合、監視装置10に対するその障害のアラート通知をキャンセルする。
【0050】
図7は、依存関係の判定例を示す。同図の横軸は経過時間である。NE−A12aからERROR−008の発生を示すアラートと回復を示すアラートとが受け付けられたと仮定する。同図のt1+t2の時間帯は、ERROR−008の障害発生検出時刻の前後に猶予期間(=t1=t2)を加えたものである。t3+t4の時間帯は、ERROR−008の障害回復検出時刻の前後に猶予期間(=t3=t4)を加えたものである。この場合、NE−B12bから出力されたアラートのうち、障害発生検出時刻がt1+t2に含まれ、かつ、障害回復検出時刻がt3+t4に含まれるERROR−005を依存関係があるアラートとして特定する。そして、NE−A12aのERROR−008を主アラート、NE−B12bのERROR−005を付随アラートとする依存関係を設定する。
【0051】
依存関係設定部34は、まずNE−A12aを基準NEとして、NE−B12bとの依存関係を特定し、図4の第1インジケータ60を設定する。次に、NE−B12bを基準NEとして、NE−A12aとの依存関係を特定し、図4の第2インジケータ62を設定する。そして、波及度64、依存度66、依存度68、波及度70を算出して、NE−A12aのアラートと、NE−B12bのアラートとの依存関係の設定を完了する。同様に、NE−A12aのアラートと、NE−C12cのアラートとの依存関係を設定する。
【0052】
本実施の形態では、依存関係の設定処理において、全てのNE12が順次交代で基準NEとされる。すなわち、1つのNE12が基準NEとして依存関係が設定された後に、別のNE12が基準NEとして依存関係が設定される。ただし、複数のNE12間で、依存関係が重複する場合は、複数のNE12間で予め定められた優先度が大きいNE12のアラートを主アラートとし、他方のNE12のアラートを付随アラートとする。この優先度は、障害が他のNE12へ波及しやすいと想定されるNE12や、通信回線の収容数の多いNE12や、大都市に設置されたNE12ほど大きく設定されてもよい。例えば、本実施の形態では、NE−A12a>NE−B12bの優先度が設定される。このため、NE−A12aのアラート「ERROR−008」とNE−B12bのアラート「ERROR−005」間では、前者が主アラート、後者が付随アラートとなる。
【0053】
変形例として、複数のNE12の一部のみが基準NEとしてユーザにより選択されてもよい。例えば、障害が他のNE12へ波及しやすいと想定されるNE12や、通信回線の収容数の多いNE12や、大都市に設置されたNE12が選択されてもよい。
【0054】
表示制御部36は、通信システム100の各NE12から出力されたアラートのデータを所定のディスプレイに送出して表示させる。表示制御部36は、表示態様決定部38と、証跡記録部40と、アラート表示部42とを含む。
【0055】
表示態様決定部38は、アラート間の依存関係を参照して、ユーザに提示されるアラートの表示態様を、付随アラートよりも主アラートの視認性を高めるように決定する。本実施の形態では、付随アラートを非表示とすることにより、主アラートの視認性を相対的に高める。また表示態様決定部38は、アラート取得部32により付随アラートが取得された一方で、その付随アラートに対応する主アラートが未取得である場合、本来は取得されるべき主アラートが未取得である旨を表示させるよう表示態様を決定する。
【0056】
表示態様決定部38は、決定した表示態様にしたがって、原本アラート保持部22に保持されたアラートの原本データから、アラートの表示用データを設定して表示アラート保持部26へ格納する。具体的には、原本アラート保持部22から表示アラート保持部26へ、主アラートのデータを転記し、付随アラートのデータは転記しない。また、主アラートが未取得である旨を示すデータを表示アラート保持部26にさらに格納する。
【0057】
図8は、表示態様決定部38の処理アルゴリズムを示すフローチャートである。表示態様決定部38は、前回の表示態様決定処理から所定の処理インターバル(例えば1分)が経過している場合は(S10のY)、以下の処理を実行する。前回の表示態様決定処理からその処理インターバルが未経過であれば(S10のN)、以下の処理をスキップして本図のフローを終了する。
【0058】
表示態様決定部38は、処理インターバルの間に受け付けられたアラートのうち、表示態様決定処理の対象とするアラート(以下、「対象アラート」とも呼ぶ。)であるERROR−jを選択する。本実施の形態では、原本アラート保持部22におけるレコードIDが若い順に対象アラートを選択する。表示態様決定部38は、依存関係保持部24を参照して、他のアラートに対する対象アラートの依存度合いを、NE12間の距離関係に応じて調整した指標値(以下、「調整依存度」とも呼ぶ)算出する(S12)。
【0059】
表示態様決定部38は、対象アラートを出力したNE12を基準NEとし、その隣接NEおよび近接NEから出力される各アラートと対象アラートとの組み合わせごとに調整依存度を算出する。例えば、NE−A12aのERROR−001を対象アラートとする場合、「その対象アラートと、NE−B12bのERROR−001およびNE−C12cのERROR−001との組み合わせ」、「その対象アラートと、NE−B12bのERROR−002およびNE−C12cのERROR−002との組み合わせ」、・・・、「その対象アラートと、NE−B12bのERROR−015およびNE−C12cのERROR−015との組み合わせ」ごとに調整依存度を算出する。
【0060】
具体的には、次の計算式にしたがって調整依存度を算出する。
調整依存度 = Σ(依存関係の有無を示す指標値/基準NEからの距離)
「基準NEからの距離」は、基準NEから、その隣接NEまたは近接NEまでの距離を示す指標値であり、隣接NEの場合は1、近接NEの場合は2となる。また「依存関係の有無を示す指標値」は、対象アラートを付随アラートとする主アラートの存在有無を示す指標値である。例えば、図4の依存関係において、NE−A12aが基準NEである場合は第2インジケータ62が設定されていれば1、未設定であれば0となる。またNE−B12bが基準NEである場合は第1インジケータ60が設定されていれば1、未設定であれば0となる。
【0061】
上記計算式によれば、対象アラートが、隣接NEからのアラートに対する付随アラートであれば、調整依存度は1となる。また、対象アラートが、近接NEからのアラートに対する付随アラートであれば、調整依存度は0.5となる。また、隣接NEからのアラートと近接NEからのアラートとの両方に対する付随アラートであれば、調整依存度は1.5となる。また、隣接NEからのアラートと近接NEからのアラートとのいずれに対しても付随アラートでなければ、調整依存度は0となる。
【0062】
調整依存度が1以上となるERROR−kが存在する場合(S14のY)で、そのERROR−kが隣接NEから取得されていれば(S16のY)、ERROR−jを非表示とする(S18)。すなわち、対象アラートが隣接NEから出力済の主アラートに対する付随アラートであれば、その対象アラートを非表示とする。ERROR−kが隣接NEから未取得であれば(S16のN)、ERROR−jを表示対象とするとともにERROR−kを未検出候補とする(S20)。
【0063】
調整依存度が1以上となるERROR−kは存在しない(S14のN)が、調整依存度が0.5以上となるERROR−lが存在する場合(S22のY)で、そのERROR−lが近接NEから取得されていれば(S24のY)、ERROR−jを非表示とする(S18)。すなわち、対象アラートが近接NEから出力済の主アラートに対する付随アラートであれば、その対象アラートを非表示とする。ERROR−lが近接NEから未取得であれば(S24のN)、ERROR−jを表示対象とするとともにERROR−lを未検出候補とする(S26)。
【0064】
調整依存度が0.5以上となるERROR−lも存在しない場合(S22のN)、対象アラートERROR−jを表示対象とする(S28)。この場合、対象アラートは、そもそも他のアラートの付随アラートではないためである。全アラートの表示態様決定処理が終了すれば(S30のY)、本図のフローを終了し、未処理のアラートがあれば(S30のN)、S12へ戻る。
【0065】
証跡記録部40は、付随アラートを非表示とした理由と、主アラートが未取得である旨のメッセージを追加した理由とを証跡保持部28へ逐次記録する。表示制御部36は、証跡保持部28に記録された処理理由を外部のディスプレイへ適宜表示させてもよい。
【0066】
アラート表示部42は、表示対象とされたアラート、すなわち、表示アラート保持部26へ追加されたレコードを外部のディスプレイへ逐次出力して表示させる。アラートの表示要求を外部装置から受け付けて、その要求への応答として、表示アラート保持部26の表示用データをその外部装置や、所定の出力装置へ出力してもよい。
【0067】
以上の構成による動作を以下説明する。
監視装置10の依存関係設定部34は、通信システム100における複数のNE12から過去出力されたアラートの原本データを参照して、複数のアラート間の依存関係を設定し、そのデータを依存関係保持部24へ格納しておく。複数のNE12のそれぞれは、障害の発生や回復を検出し、その旨を示すアラートを逐次出力する。監視装置10のアラート取得部32は、各NE12から出力されたアラートを逐次取得して、そのデータを原本アラート保持部22へ格納する。
【0068】
表示態様決定部38は、依存関係保持部24に保持されたアラート間の依存関係を参照し、アラートの原本データから、アラートの表示用データを設定して表示アラート保持部26へ格納する。証跡記録部40は、アラートの表示用データの設定処理における処理理由、言い換えればアラートの原本データからの改変理由を証跡保持部28へ記録する。アラート表示部42は、表示アラート保持部26へ追加された表示用データのレコードを外部のディスプレイへ逐次表示させる。
【0069】
例えば、NE−A12aのアラートとNE−B12bのアラートとの間に図4の依存関係が設定されている場合、図3のアラートの原本データから、図5のアラートの表示用データが設定されてもよい。またそれとともに、図6の処理理由が記録されてもよい。
【0070】
これまでは、例えば、一瞬の回線断やエラーレートが悪くなるような現象の発生・回復が繰り返して通知されるような状況において、主アラートと付随アラートとが混在し、また猶予期間の設定も相まって、障害の根本原因を特定することに時間を要していた。本実施の形態の監視装置10によれば、付随アラートを非表示とすることで、相対的に主アラートの視認性を高めることができる。主アラートは障害の根本原因を示すものであるため、主アラートの視認性を高めることにより、障害の根本原因を特定するためのユーザの作業を支援できる。ユーザは、障害の根本原因を迅速に特定して、その根本原因の除去や、予防のための措置を迅速に行うことができる。したがって、通信システム100の保守性が向上し、MTTR(Mean Time To Repair)が低減される。
【0071】
また監視装置10によれば、付随アラートのみが取得された場合、その付随アラートの表示に加えて、対応する主アラートが取得されていない旨を表示する。これにより、主アラートが検出されない事態、例えば、主アラートを出力すべきNEにおいて主アラートを通知できないような障害が発生した場合でも、障害の根本原因を示す主アラートをユーザに示唆できる。さらにアラートの表示用データの設定理由が記録されることで、表示用データの設定処理の妥当性を、ユーザが必要に応じて検証できる。
【0072】
さらに監視装置10によれば、NE12で設定された猶予期間を踏まえてアラート間の依存関係を適切に設定できる。また、障害回復を示すアラート間に依存関係が成立することを条件として、障害発生を示すアラート間に依存関係を設定することで、依存関係の誤設定の可能性を低減できる。
【0073】
さらにまた、依存関係が設定される範囲は、依存関係が成立する可能性が高いと想定される、基準NEと隣接NEと近接NEとが出力するアラート間に限定される。これにより、監視装置10において依存関係を設定するために要するデータ処理量、および保持すべき依存関係のデータ量を低減できる。
【0074】
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下変形例を示す。
【0075】
第1の変形例を説明する。上記実施の形態では、基準NEと隣接NEと近接NEとが出力するアラート間で依存関係を設定した。変形例として、基準NEと、近接NEよりも離れたNEとが出力するアラート間でも依存関係を設定してもよい。また、通信システム100に存在する全てのNEが出力するアラート間で依存関係を設定してもよい。この場合、調整依存度の設定において、近接NEより離れたNEについては、基準NEとの距離を順次3、4、5・・・としてもよい。また、追加されるNEごとに、図8のS14〜S20、S22〜S26と同様の処理を追加してもよく、調整依存度との比較閾値はそれぞれ、3分の1、4分の1、5分の1・・・と設定されてもよい。この変形例によれば、依存関係の設定範囲が拡大されるため、非表示となる付随メッセージがより多く特定されやすくなり、アラートが簡潔に表示されやすくなる。
【0076】
第2の変形例を説明する。上記実施の形態では、基準NEと隣接NEとが出力するアラート間の依存関係を示す第1の依存関係データと、基準NEと近接NEとが出力するアラート間の依存関係を示す第2の依存関係データとは別個に保持された。変形例では、第1の依存関係データを、基準NEと近接NEとが出力するアラート間の依存関係として適用してもよい。この変形例によれば、NEの複数の組み合わせにおいて共通の依存関係のデータを使用できるため、保持すべき依存関係のデータ量を低減できる。隣接NEと近接NEとの両方が同一種類のNEである場合は、共通の依存関係となる可能性が高まるため、特に有用な態様である。
【0077】
第3の変形例を説明する。表示態様決定部38は、対象アラートを選択する際に、複数のNE12から受け付けられた各アラートの依存関係を参照して、他のアラートへ波及する度合い、すなわち波及度64や波及度70が大きいアラートほど優先して選択してもよい。この変形例によれば、付随アラートである可能性が低い、すなわち主アラートの可能性が高いアラートの表示態様をいち早く決定し、主アラートを迅速にユーザへ提示しやすくなる。
【0078】
第4の変形例を説明する。表示態様決定部38は、対象アラートを選択する際に、複数のNE12から受け付けられた各アラートの依存関係を参照して、他のアラートに依存する度合い、すなわち依存度66や依存度68が大きいアラートほど優先して選択してもよい。この変形例によれば、付随アラートである可能性が高い、すなわち主アラートの可能性が低いアラートの表示態様をいち早く決定し、未検出の主アラートがある場合にその主アラートを迅速にユーザへ提示しやすくなる。
【0079】
第5の変形例を説明する。上記実施の形態においては、付随アラートを非表示とした。変形例においては、付随アラートを表示させ、その際に、主アラートよりも目立たない、視認性が低いと想定される態様で付随アラートを表示させてもよい。例えば、主アラートを黒色で表示させる場合、付随アラートを薄い灰色で表示させてもよく、主アラートより小さな文字サイズで付随アラートを表示させてもよい。
【0080】
第6の変形例を説明する。上記実施の形態においては、付随アラートを非表示とした。変形例においては、付随アラートを表示させるか否か、表示させる場合はどのような態様で表示させるかを、ユーザにより選択可能に構成されてもよい。表示態様決定部38は、ユーザの選択にしたがって各アラートの表示態様を決定する。これにより、アラート監視の運用ポリシーに応じて、付随アラートの適切な表示方法をユーザが選択できる。
【0081】
上述した実施の形態および変形例の任意の組み合わせもまた本発明の実施の形態として有用である。組み合わせによって生じる新たな実施の形態は、組み合わされる実施の形態および変形例それぞれの効果をあわせもつ。
【0082】
請求項に記載の各構成要件が果たすべき機能は、実施の形態および変形例において示された各構成要素の単体もしくはそれらの連係によって実現されることも当業者には理解されるところである。
【符号の説明】
【0083】
10 監視装置、 12 NE、 22 原本アラート保持部、 24 依存関係保持部、 26 表示アラート保持部、 28 証跡保持部、 32 アラート取得部、 34 依存関係設定部、 36 表示制御部、 38 表示態様決定部、 40 証跡記録部、 42 アラート表示部、 100 通信システム。

【特許請求の範囲】
【請求項1】
複数の通信装置のアラートを管理する装置であって、
基準となる通信装置からのアラートである主アラートの発生に伴って、他の通信装置からのアラートである付随アラートが発生することを示す依存関係を保持する依存関係保持部と、
前記複数の通信装置から出力されたアラートを取得するアラート取得部と、
前記依存関係を参照し、付随アラートよりも主アラートの視認性を高めて所定の表示装置に表示させる表示制御部と、
を備えることを特徴とするアラート管理装置。
【請求項2】
前記表示制御部は、前記付随アラートが取得された一方で前記主アラートが未取得である場合、前記主アラートが未取得である旨をさらに表示させることを特徴とする請求項1に記載のアラート管理装置。
【請求項3】
前記他の通信装置からのアラートが示すイベント発生時刻が、前記基準となる通信装置からのアラートが示すイベント発生時刻から所定の期間内であることを条件として、それら両アラートの間に依存関係を設定する依存関係設定部をさらに備えることを特徴とする請求項1または2に記載のアラート管理装置。
【請求項4】
前記基準となる通信装置から出力された障害回復を示すアラートと、前記他の通信装置から出力された障害回復を示すアラートとの間に依存関係が成立することを条件として、前記基準となる通信装置から出力された障害発生を示すアラートと、前記他の通信装置から出力された障害発生を示すアラートとの間に依存関係を設定する依存関係設定部をさらに備えることを特徴とする請求項1または2に記載のアラート管理装置。
【請求項5】
前記依存関係保持部は、前記基準となる通信装置に隣接する通信装置と、当該隣接する通信装置に隣接し、当該隣接する通信装置を介して前記基準となる通信装置と接続される通信装置とを前記他の通信装置の範囲とした依存関係を保持することを特徴とする請求項1から4のいずれかに記載のアラート管理装置。
【請求項6】
前記表示制御部は、前記主アラートの視認性を高める際、その根拠として、前記依存関係を示す情報を所定のファイルに記録することを特徴とする請求項1から5のいずれかに記載のアラート管理装置。
【請求項7】
複数の通信装置のアラートを管理する装置であって、
前記複数の通信装置から出力されたアラートのうち基準となる通信装置から出力されたアラートである主アラートを、その主アラートの発生に伴って他の通信装置から出力されたアラートである付随アラートよりも視認性を高めて所定の表示装置に表示させる表示制御部を備えることを特徴とするアラート管理装置。
【請求項8】
複数の通信装置のアラートを管理する装置により実行される方法であって、
前記複数の通信装置から出力されたアラートを取得するステップと、
基準となる通信装置からのアラートである主アラートの発生に伴って、他の通信装置からのアラートである付随アラートが発生することを示す依存関係を参照し、付随アラートよりも主アラートの視認性を高めて所定の表示装置に表示させるステップと、
を備えることを特徴とするアラート管理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−109489(P2011−109489A)
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願番号】特願2009−263495(P2009−263495)
【出願日】平成21年11月19日(2009.11.19)
【出願人】(000237662)富士通テレコムネットワークス株式会社 (682)
【Fターム(参考)】