説明

監視サーバ、ネットワーク監視方法

【課題】ネットワークを監視する監視サーバが検知する複数の異常通知のうち、異常発生の信頼性が高いと思われる異常通知を管理者が発見しやすいように出力する。
【解決手段】複数のネットワークエレメントのそれぞれから受信する異常通知の種別に対応付けられて予め記憶された優先条件を読み出して異常通知の優先度の高低を判定し、異常通知の優先度が高いと判定した場合は異常通知を優先異常通知記憶部に記憶させ、異常通知の種別に応じた優先度が低いと判定した場合は異常通知を非優先異常通知記憶部に記憶させ、優先異常通知記憶部および非優先異常通知記憶部に記憶された異常通知から、優先異常通知記憶部に記憶された異常通知を優先して読み出して出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信ネットワークを構成する複数のネットワークエレメントのそれぞれの状態を監視する監視サーバ、ネットワーク監視方法に関する。
【背景技術】
【0002】
従来のIP(Internet Protocol)ネットワークにおいて、IPネットワークを構成するスイッチやルータ、ホストといったネットワーク機器、コンピュータ装置などのネットワークエレメントを管理する通信プロトコルが定められ、利用されている。
例えば、ネットワークエレメントに対して送信したIPパケットがネットワークエレメントに到達するか否かを示す通信の到達性を確認するPingコマンドでは、ICMP(Internet Control Message Protocol)の通信プロトコルによるIPパケットをネットワークエレメントに送信する。ネットワークエレメントが受信したICMPに基づくIPパケットに応答することにより通信の到達性や回線状況などを調べることができる。
【0003】
SNMP(Simple Network Management Protocol)の通信プロトコルでは、監視サーバにインストールされたSNMPマネージャのプログラムと、監視対象となるネットワークエレメントにインストールされたSNMPエージェントのプログラムとが通信を行うことにより、監視サーバ側にネットワークエレメントの状態が送信される。ネットワークエレメント内のSNMPエージェントは、自身が備えるMIB(Management Information Base)と呼ばれるデータベースに自身の管理情報を記憶させており、SNMPマネージャから管理情報のリクエストを受信すると、リクエストに応じた管理情報をSNMPマネージャに送信する。また、SNMPエージェントは、自身のネットワークエレメントに異常が発生した場合、自発的にSNMPトラップと呼ばれる異常通知をSNMPマネージャに送信し、自身の変化を通知する。
【0004】
例えば、図6は、ルータ600−1と、その配下に接続されるルータ600−11、ルータ600−12と、その配下にそれぞれ接続されるルータ600−21、ルータ600−22、・・・と、その配下にそれぞれ接続されるホスト610−31、ホスト610−32、ホスト610−33、・・・などのネットワークエレメントによりIPネットワーク(a)が構成される例を示す図である。監視サーバ700は、IPネットワーク(a)を構成する各ネットワークエレメントとICMPやSNMPに基づく通信を行ってネットワークエレメントの状態を監視する。監視サーバ700は、ネットワークエレメントの異常を検知すると、管理サーバ800に異常通知を送信する。管理サーバ800には、監視サーバ700から送信された異常通知が記憶され、蓄積される。ここで、図6には一台の監視サーバ700を図示しているが、複数台の監視サーバ700を設置し、多数のネットワークエレメントのうち管理対象のネットワークエレメントを複数台の監視サーバ700がそれぞれに分担して管理し、それぞれの監視サーバ700が検知した異常通知を管理サーバ800に集約して送信する構成がとられる場合がある。IPネットワーク(a)の管理者は、管理サーバ800に記憶される異常通知によってネットワークエレメントに発生した異常を知ることができ、故障の早期発見と復旧等の適切な処置を行うことができる。
【0005】
特許文献1には、IPネットワーク上のネットワークエレメントに送信した情報に対する応答に応じてネットワークの輻輳状況を判定することで、サービスの提供または停止を制御する技術が提案されている。
【特許文献1】特開平11−27283号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述のような通信プロトコルによりネットワークエレメントの状態を監視する際、特に監視対象のネットワークエレメントの数が大量になると、異常発生時に大量の異常通知が管理サーバに蓄積され、ネットワークエレメントの異常に対する迅速な対応を効率よく行うことが困難となる場合がある。
【0007】
例えば、図6において、監視サーバ700がPingコマンドによって定期的にそれぞれのネットワークエレメントにICMPパケットを送信し、応答がなければ通信到達性がないと判定して異常通知を管理サーバ800に送信する場合を考える。例えばルータ600−11に異常が発生し、ICMP通信の応答がなければ、ルータ600−11の配下に接続されたルータ600−21、ルータ600−22、ルータ600−23、ホスト610−31、ホスト610−32、ホスト610−33などのネットワークエレメントからも応答がなく、それぞれのネットワークエレメントについて通信到達性がなく異常と判定される。このため、異常が発生しているのはルータ600−11のみである場合にも、その配下に接続されたネットワークエレメント全てについての異常通知がそれぞれ管理サーバ800に送信され、大量の異常通知が記憶されることとなる。
【0008】
このとき、ICMPに基づく大量の異常通知のうちルータ600−11以外の異常通知は、実質的にそのネットワークエレメントに異常が発生したものではないため管理者にとってはノイズとなる場合がある。一方、SNMPトラップによる異常通知は、異常が発生したネットワークエレメントから自発的に送信され、異常のないネットワークエレメントから送信されることはないため、ICMPに基づく大量の異常通知に比べてそのネットワークエレメントに異常が発生したことを示す信頼性が高いと考えられる。このように、大量のネットワークエレメントにより構成されるIPネットワークをICMPやSNMPにより監視する場合、異常通知が管理サーバ800に一様に蓄積されると、例えば異常の発生を示す信頼性が高いSNMPによる異常通知が、その他の大量のICMPによる異常通知に埋もれることとなり、発生した異常に対する迅速な対応を管理者が効率よく行うことが困難となる場合がある。
【0009】
特に、図6に示したようなネットワーク構成において、複数の監視サーバ700がそれぞれに異なるネットワークエレメントを監視対象とし、それら複数の監視サーバ700からの異常通知が特定の管理サーバ800に集約されて送信される場合、監視サーバ700と管理サーバ800との間の通信回線が輻輳を起こし、監視サーバ700から管理サーバ800へ送信された異常通知が到達しないことがある。このような場合、監視サーバ700は、管理サーバ800への異常通知の送信を複数回リトライした後、到達しなければ異常通知を破棄する場合があった。このとき、監視サーバ700が受信した異常通知が管理サーバ800に記憶されず、管理者が異常の発生を知ることができない場合があった。
【0010】
本発明は、このような状況に鑑みてなされたもので、ネットワークを監視する監視サーバが検知する複数の異常通知のうち、異常発生の信頼性が高いと思われる異常通知を管理者が発見しやすいように出力する監視サーバを提供する。
【課題を解決するための手段】
【0011】
上述した課題を解決するために、本発明は、通信ネットワークを構成する複数のネットワークエレメントを監視し、ネットワークエレメントに異常が発生した場合にネットワークエレメントから異常に応じた種別の異常通知を受信し、受信した異常通知を出力する監視サーバであって、ネットワークエレメントから受信する異常通知のうち、異常通知の種別に応じて優先度が高いと判定された異常通知が記憶される優先異常通知記憶部と、ネットワークエレメントから受信する異常通知のうち、異常通知の種別に応じて優先度が低いと判定された異常通知が記憶される非優先異常通知記憶部と、ネットワークエレメントから受信する異常通知の種別に対応付けて、異常通知の優先度の高低が定められた優先条件が記憶される優先条件記憶部と、ネットワークエレメントから受信する異常通知の種別に対応付けられた優先条件を読み出して異常通知の優先度の高低を判定し、異常通知の優先度が高いと判定した場合は異常通知を優先異常通知記憶部に記憶させ、異常通知の種別に応じた優先度が低いと判定した場合は異常通知を非優先異常通知記憶部に記憶させる異常通知登録部と、優先異常通知記憶部および非優先異常通知記憶部に記憶された異常通知から、優先異常通知記憶部に記憶された異常通知を優先して読み出して出力する異常通知出力部と、を備えることを特徴とする。
【0012】
また、本発明は、上述の優先条件記憶部に記憶された優先条件には、ネットワークエレメントから受信した異常通知の通信プロトコルの種別に応じて、異常通知の優先度の高低が定められることを特徴とする。
【0013】
また、本発明は、上述の異常通知には、異常通知の送信元のネットワークエレメントを識別する識別情報が含まれており、優先条件記憶部に記憶された優先条件には、異常通知に含まれる識別情報に応じて、異常通知の優先度の高低が定められることを特徴とする。
【0014】
また、本発明は、上述の異常通知出力部は、優先異常通知記憶部に記憶された異常通知を、予め定められた第1の時間間隔で出力し、非優先異常通知記憶部に記憶された異常通知を、第1の時間間隔より時間間隔が長い予め定められた第2の時間間隔で出力することを特徴とする。
【0015】
また、本発明は、上述の異常通知出力部は、優先異常通知記憶部に記憶された異常通知の全てを出力した後、非優先異常通知記憶部に記憶された異常通知を出力することを特徴とする。
【0016】
また、本発明は、通信ネットワークを構成する複数のネットワークエレメントを監視し、ネットワークエレメントに異常が発生した場合にネットワークエレメントから異常に応じた種別の異常通知を受信して出力し、ネットワークエレメントから受信する異常通知のうち、異常通知の種別に応じて優先度が高いと判定された異常通知が記憶される優先異常通知記憶部と、ネットワークエレメントから受信する異常通知のうち、異常通知の種別に応じて優先度が低いと判定された異常通知が記憶される非優先異常通知記憶部と、ネットワークエレメントから受信する異常通知の種別に対応付けて、異常通知の優先度の高低が定められた優先条件が記憶される優先条件記憶部と、を備えた監視サーバを用いたネットワーク監視方法であって、ネットワークエレメントから受信する異常通知の種別に対応付けられた優先条件を読み出して異常通知の優先度の高低を判定し、異常通知の優先度が高いと判定した場合は異常通知を優先異常通知記憶部に記憶させ、異常通知の種別に応じた優先度が低いと判定した場合は異常通知を非優先異常通知記憶部に記憶させるステップと、優先異常通知記憶部および非優先異常通知記憶部に記憶された異常通知から、優先異常通知記憶部に記憶された異常通知を優先して読み出して出力するステップと、を備えることを特徴とする。
【発明の効果】
【0017】
以上説明したように、本発明によれば、複数のネットワークエレメントのそれぞれから受信する異常通知の種別に対応付けられて予め記憶された優先条件を読み出して異常通知の優先度の高低を判定し、異常通知の優先度が高いと判定した場合は異常通知を優先異常通知記憶部に記憶させ、異常通知の種別に応じた優先度が低いと判定した場合は異常通知を非優先異常通知記憶部に記憶させ、優先異常通知記憶部および非優先異常通知記憶部に記憶された異常通知から、優先異常通知記憶部に記憶された異常通知を優先して読み出して出力するようにしたので、複数のネットワークエレメントから送信される異常通知を、その種別に応じて優先度をつけて記憶させ、優先度に応じて出力することができる。
【発明を実施するための最良の形態】
【0018】
以下、本発明の一実施形態について、図面を参照して説明する。
図1は、本実施形態によるネットワークシステム1の概要を示す図である。本実施形態によるネットワークシステム1は、複数台のNE(ネットワークエレメント)100(NE100−1、NE100−2、NE100−3)と、複数台の監視サーバ200(監視サーバ200−1、監視サーバ200−2、監視サーバ200−3)と、管理サーバ300と、APサーバ400と、複数台の監視用クライアント端末500(監視用クライアント端末500−1、監視用クライアント端末500−2、監視用クライアント端末500−3)とを備えている。
【0019】
複数台のNE100は、IPネットワーク(a)を構成するスイッチやルータ、ホストといったネットワーク機器、コンピュータ装置などであり、これらを総称してネットワークエレメントと呼ぶ。複数台の監視サーバ200のそれぞれは、IPネットワーク(a)を構成する複数台のNE100のうち、自身の監視対象として定められたNE100とICMPやSNMPに基づく通信を行って監視対象のNE100の状態を監視する。監視サーバ200は、監視対象のNE100の異常を検知すると、NE100に異常が発生したことを示す異常通知を管理サーバ300に送信する。管理サーバ300には、複数台の監視サーバ200のそれぞれから送信される異常通知が記憶され、蓄積される。APサーバ400は、監視用クライアント端末500からの要求に応じて管理サーバ300に記憶された異常通知を読み出し、読み出した異常通知を監視用クライアント端末500に送信する。
【0020】
複数台の監視用クライアント端末500は、IPネットワーク(a)の管理者に利用されるコンピュータ端末であり、管理者からの要求に応じてAPサーバ400から監視対象のNE100の異常通知を受信して表示する。IPネットワーク(a)の管理者は、監視用クライアント端末500に表示される異常通知によって監視対象のNE100の状態や発生した異常を知ることができ、故障の早期発見と復旧等の適切な処置を行うことができる。ここで、NE100、監視サーバ200、管理サーバ300、APサーバ400、監視用クライアント端末500のそれぞれの台数は、NE100により構成されるIPネットワーク(a)の規模や、各機器の性能等に応じて定められ、構成されるようにして良い。
【0021】
次に、本実施形態によるネットワークシステム1が備える各コンピュータ機器の構成を詳細に説明する。図2は、ネットワークシステム1の構成を示すブロック図である。ネットワークシステム1は、NE100と、監視サーバ200と、管理サーバ300と、APサーバ400と、監視用クライアント端末500とを備えている。
【0022】
NE100は、スイッチやルータ、ホストといったネットワーク機器、コンピュータ装置などのネットワークエレメントであり、複数台のNE100によりIPネットワークを構成する。NE100は、SNMPエージェント110とICMP通信部120とを備えている。
【0023】
SNMPエージェント110は、自身が備えるMIBと呼ばれるデータベースに自身の管理情報を記憶させており、監視サーバ200に備えられるSNMPマネージャ211から管理情報のリクエストを受信すると、リクエストに応じた管理情報をMIBから読み出して送信する。ここでは、SNMPエージェント110は、一定間隔毎に監視サーバ200から管理情報リクエストのポーリングを受信する。また、SNMPエージェント110は、NE100に異常が発生した場合には、自発的にSNMPトラップと呼ばれる異常通知を監視サーバ200のSNMPマネージャ211に送信し、NE100の状態変化を通知する。
【0024】
ICMP通信部120は、IP通信におけるデータ処理の誤りや通信に関する情報を通知する通信プロトコルであるICMPに基づく通信を行う。例えば、NE100が送信されたIPパケットを通信先ホストへ転送するルータであり、転送するIPパケットの通信先ホストへのルーティングが見つからない場合、NE100は、宛先への到達が不可能であること示すICMPメッセージ(Destination Unreachable Message)をICパケットの送信元に送信する。
【0025】
監視サーバ200は、自身の監視対象として定められたNE100との間でICMPやSNMPに基づく通信を行い、監視対象のNE100の状態を監視するコンピュータ装置であり、異常検知部210と、異常通知送信部220と、異常通知到達判定部230と、異常通知登録部240と、異常通知記憶部250と、異常通知読出部260とを備えている。
【0026】
異常検知部210は、SNMPマネージャ211とICMP通信部212と異常通知生成部213とを備えており、定められた監視対象のNE100と通信を行ってNE100の異常を検知する。
SNMPマネージャ211は、SNMPに基づいてNE100のSNMPエージェント110に、予め定められた一定間隔毎に管理情報リクエストのポーリングを送信して通信を行い、NE100のSNMPエージェント110に記憶されたSNMPエージェント110の管理情報を受信する。また、SNMPマネージャ211は、NE100に異常が発生した場合にNE100のSNMPエージェント110から自発的に送信されるSNMPトラップと呼ばれる異常通知を受信する。SNMPマネージャ211は、ポーリングによってNE100から取得した管理情報が予め定められた異常を示す異常通知である場合、またはNE100からSNMPトラップの異常通知を受信した場合には、受信した異常通知を異常通知送信部220に出力する。
【0027】
ICMP通信部212は、NE100のICMP通信部120とICMPに基づく通信を行ってNE100の異常を検知する。ICMP通信部212は、例えば、自身に予め記憶されたPingプログラムに基づいてICMPに基づくエコー要求通知(Echo Message)をNE100に送信し、NE100からの応答を受信する。NE100からの応答としては、例えば、エコー要求通知に対する応答を示すエコー応答通知(Echo Reply Message)や、宛先への到達が不可能であることを示す宛先到達不可能通知(Destination Unreachable Message)などが送信される。
【0028】
異常通知生成部213は、ICMP通信部212がNE100から受信した応答が予め定められた異常を示す異常通知である場合には、ICMP通信部212が受信したICMPによる異常通知に基づいてSNMPによる異常通知のメッセージを生成し、異常通知送信部220に出力する。
このように、本実施形態では、異常検知部210が異常通知送信部220に出力する異常通知には、NE100から自発的に送信されたSNMPトラップと、監視サーバ200がNE100にSNMPによるポーリングを行った応答として受信したSNMPメッセージと、監視サーバ200がNE100にICMPによるポーリングを行った応答として受信したICMPメッセージに基づいて異常通知生成部213により生成されたSNMPメッセージとの3種の異常通知が存在する。
【0029】
異常通知送信部220は、SNMPエージェント221を備えており、管理サーバ300と通信を行って、異常検知部210から出力された異常通知を管理サーバ300に送信する。また、異常通知送信部220は、送信した異常通知が管理サーバ300に受信された場合、管理サーバ300から、送信した異常通知が受信されたことを示す応答を受信する。
【0030】
異常通知到達判定部230は、異常通知送信部220が管理サーバ300に送信した異常通知が、管理サーバ300に到達したか否かを判定する。例えば、異常通知到達判定部230は、異常通知送信部220が管理サーバ300に送信した異常通知に対する応答(ACK)を受信した場合には、異常通知が到達したと判定し、送信した異常通知に対する応答を一定時間内に受信しない場合には、異常通知が到達していないと判定する。
【0031】
異常通知登録部240は、優先条件記憶部241と優先条件判定部242とを備えており、異常通知到達判定部230によって異常通知が管理サーバ300に到達していないと判定されると、管理サーバ300に到達していないと判定された異常通知を、異常通知記憶部250に記憶させる。優先条件記憶部241には、異常通知の種別に対応付けて、異常通知の優先度の高低が定められた優先条件が記憶される。優先条件判定部242は、優先条件記憶部241に記憶された優先条件に基づいて、異常通知到達判定部230によって異常通知が管理サーバ300に到達していないと判定された異常通知の優先度の高低を判定する。例えば、優先条件記憶部241に記憶された優先条件には、NE100から送信された異常通知の通信プロトコルの種別に応じた優先度が定められている。本実施形態では、SNMPトラップによる異常通知の優先度が高く、SNMPトラップ以外の異常通知の優先度が低く定められる。このようにすれば、NE100が自発的に送信する異常通知であるSNMPトラップの優先度を高く、異常が発生したNE100の配下に接続された他のNE100から大量に送信されることがあるICMPによる異常通知の優先度を低くし、より信頼性が高いと考えられる異常通知を優先して出力することが可能となる。
【0032】
異常通知記憶部250は、優先ファイル251と非優先ファイル252とを備えており、NE100から送信された異常通知が優先度に応じて記憶される。
優先ファイル251には、異常通知登録部240によって優先度が高いと判定された異常通知が記憶される。優先ファイル251には、複数件の異常通知が書き込まれる。
【0033】
非優先ファイル252には、異常通知登録部240によって優先度が低いと判定された異常通知が記憶される。非優先ファイル252には、複数件の異常通知が書き込まれる。
ここで、異常通知記憶部250には、電源の供給が途絶えても記憶された情報が保持される不揮発性メモリや磁気ディスクが適用され、大量の異常通知を記憶するために充分な容量が確保されることとする。このように、本実施形態によれば、NE100から送信された異常通知がそのままの状態で記憶されるため、NE100から異常通知が送信された時点で監視サーバ200と管理サーバ300との間の通信回線が輻輳していた場合にも、異常通知を破棄せずに記憶させておくことが可能となる。
【0034】
異常通知読出部260は、優先異常通知読出部261と非優先異常通知読出部262とを備えており、異常通知記憶部250に記憶された異常通知を優先度に応じて読み出し、異常通知送信部220に出力する。
優先異常通知読出部261は、異常通知記憶部250の優先ファイル251をオープンし、予め定められた優先ファイル251に書き込まれた異常通知を一定間隔毎に読み出して、異常通知送信部220を介して管理サーバ300に送信する。また、優先異常通知読出部261は、異常通知送信部220が送信した異常通知が管理サーバ300に到達し、応答を受信すると、送信した異常通知を優先ファイル251から削除する。
【0035】
非優先異常通知読出部262は、異常通知記憶部250の非優先ファイル252をオープンし、予め定められた非優先ファイル252に書き込まれた異常通知を一定間隔毎に読み出して、異常通知送信部220を介して管理サーバ300に送信する。ここで、非優先異常通知読出部262が異常通知を読み出して異常通知送信部220に出力する一定間隔の処理待機時間は、優先異常通知読出部261が異常通知を読み出して異常通知送信部220に出力する一定間隔の処理待機時間よりも長い間隔であるとする。また、非優先異常通知読出部262は、優先異常通知読出部261と同様に、異常通知送信部220が送信した異常通知が管理サーバ300に到達し、応答を受信すると、送信した異常通知を非優先ファイル252から削除する。
【0036】
管理サーバ300は、複数の監視サーバ200に接続されたコンピュータ装置であり、複数の監視サーバ200から送信される異常通知を受信して記憶する。管理サーバ300は、異常通知受信部310と異常通知記憶部320とを備えている。
異常通知受信部310は、SNMPマネージャ311を備えており、監視サーバ200の異常通知送信部220と通信を行って、異常通知送信部220から送信される異常通知を受信する。また、異常通知受信部310は、異常通知送信部220から異常通知を受信すると、送信された異常通知が自身に到達したことを示す応答を、異常通知送信部220に送信する。
異常通知記憶部320には、異常通知受信部310が監視サーバ200から受信する異常通知が記憶される。
【0037】
APサーバ400は、監視用クライアント端末500からの要求に応じて管理サーバ300に記憶された異常通知を読み出し、監視用クライアント端末500に送信する。本実施形態では、APサーバ400はウェブサービス部410を備えており、管理サーバ300から読み出した異常通知を、HTTP(HyperText Transfer Protocol)などの通信により監視用クライアント端末500に送信する。
【0038】
監視用クライアント端末500は、ウェブブラウザ510を備えており、通信ネットワークを構成する複数のNE100の状態を出力するコンピュータ端末である。ウェブブラウザ510は、APサーバ400と通信を行って、APサーバ400から送信される異常通知を監視用クライアント端末500が備えるディスプレイに出力する。図3は、監視用クライアント端末500のディスプレイに出力される異常通知監視画面の例を示す図である。異常通知監視画面には、例えば、NE100に異常が発生した発生日時、異常通知に含まれる異常通知メッセージ、異常通知を送信したNE100のIPアドレスなどが表示される。また、この他に、NE100のホスト名などが表示されるようにしても良い。
【0039】
次に、図4を参照して、本実施形態による監視サーバ200が、NE100の異常を検知して異常通知を記憶する動作例を説明する。まず、監視サーバ200の異常検知部210は、NE100と通信を行って異常通知を受信し、NE100に発生した異常を検知する(ステップS1)。異常通知送信部220は、異常検知部210が受信した異常通知を管理サーバ300に送信する(ステップS2)。
【0040】
監視サーバ200の異常通知送信部220は、管理サーバ300に送信した異常通知に対する管理サーバ300からの応答送信を待機する。監視サーバ200の異常通知送信部220が、送信した異常通知に対する応答を管理サーバ300から受信すると(ステップS3:YES)、異常通知到達判定部230は、異常通知が到達したと判定して処理を終了する。一方、ステップS3において、異常通知送信部220が、送信した異常通知に対する応答を管理サーバ300から受信しないまま一定時間が経過すると、異常通知到達判定部230は、異常通知が管理サーバ300に到達していないと判定する(ステップS3:NO)。ここでは、例えば、監視サーバ200に接続された複数の管理サーバ300から大量の異常通知が管理サーバ300に送信されており、監視サーバ200と管理サーバ300との間の通信回線が輻輳を起こしている場合には、異常通知が監視サーバ200に受信されず、管理サーバ300に到達されていないと判定される。
【0041】
そして、異常通知登録部240の優先条件判定部242は、ステップS1において異常検知部210が検知した異常通知と、自身の記憶領域に記憶された予め定められた優先条件とを比較する。本実施形態では、優先条件判定部242は、異常通知がSNMPトラップであるか否かを判定する(ステップS4)。優先条件判定部242が、異常通知はSNMP以外であると判定すると(ステップS4:NO)、異常通知登録部240が、異常通知記憶部250の非優先ファイル252に異常通知を書き込み、記憶させる(ステップS5)。一方、ステップS4において、優先条件判定部242が、異常通知はSNMPトラップであると判定すると(ステップS4:YES)、異常通知登録部240が、異常通知記憶部250の優先ファイル251に異常通知を書き込み、記憶させ(ステップS6)、異常通知の書き込み処理を終了する。
【0042】
次に、図5を参照して、本実施形態による監視サーバ200の異常通知記憶部250に記憶された異常通知を、監視サーバ200が異常通知の優先順位に応じて読み出し、管理サーバ300に送信する動作例を説明する。まず、異常通知記憶部250の優先ファイル251に記憶された異常通知が読み出されて管理サーバ300に送信される動作例について説明する。
【0043】
まず、監視サーバ200が備える異常通知読出部260の優先異常通知読出部261は、優先ファイル251をファイルオープンし(ステップS10)、優先ファイル251の内容を読み出す(ステップS11)。ここで、優先異常通知読出部261は、優先ファイル251に異常通知が記憶されていないと判定すれば(ステップS12:NO)、ステップS16に進む。
【0044】
一方、優先異常通知読出部261は、優先ファイル251に異常通知が記憶されていると判定すれば(ステップS12:YES)、一件の異常通知を優先ファイル251から読み出し、異常通知送信部220に出力する。異常通知送信部220は、優先ファイル251が読み出した異常通知を、管理サーバ300に送信する(ステップS13)。監視サーバ200の異常通知送信部220は、管理サーバ300に送信した異常通知に対する管理サーバ300からの応答送信を待機する。監視サーバ200の異常通知送信部220が、送信した異常通知に対する応答(ACK)を管理サーバ300から受信すると(ステップS14:YES)、異常通知到達判定部230は、異常通知が到達したと判定し、管理サーバ300に送信した異常通知を優先ファイル251から削除し(ステップS15)、ステップS16に進む。
【0045】
一方、ステップS14において、異常通知送信部220が、送信した異常通知に対する応答を管理サーバ300から受信しないまま一定時間が経過すると、異常通知到達判定部230は、異常通知が管理サーバ300に到達していないと判定し(ステップS14:NO)、ステップS16に進む。そして、優先異常通知読出部261は、監視サーバ200が備える計時機能により経過時間を計測して処理を待機し(ステップS16)、予め定められた処理待機時間が経過するとステップS11の処理に戻り、ステップS11からステップS16までの処理を繰り返す。
【0046】
次に、異常通知記憶部250の非優先ファイル252に記憶された異常通知が読み出されて管理サーバ300に送信される動作例について説明する。非優先ファイル252に記憶された異常通知が管理サーバ300に送信される動作例は、図5を参照して説明した上述の優先異常通知読出部261により異常通知が読み出される動作例と同様であるが、非優先異常通知読出部262がステップS11からステップS13までと、ステップS16との処理を行う。ここで、ステップS16における処理待機時間は、優先異常通知読出部261の処理待機時間よりも長い時間であるとする。
【0047】
これにより、非優先ファイル252に記憶された異常通知よりも、優先ファイル251に記憶された異常通知の方が管理サーバ300に送信される頻度が高くなり、優先ファイル251に記憶された異常通知が優先されて管理サーバ300に送信される。よって、管理サーバ300と監視サーバ200との間の通信回線が輻輳を起こして監視サーバ200から送信した異常通知が管理サーバ300に到達する頻度が少なくなっている場合に、予め定められた優先条件によって優先度が高いと設定された異常通知を優先して管理サーバ300に送信することができる。このため、APサーバ400を介して管理サーバ300に記憶された異常通知を取得する監視用クライアント端末500を監視する管理者は、優先度の高い異常通知を、より早く発見することが可能となる。
【0048】
なお、本実施形態では、監視サーバ200が備える異常通知登録部240の優先条件記憶部241に記憶される優先条件には、異常通知の通信プロトコルに対応付けて優先度の高低が定められることとしたが、異常通知の送信元のNE100の識別情報に対応付けて優先度を定めるようにしても良い。ここで、識別情報には、例えばNE100のIPアドレスが適用できる。このようにすれば、複数のNE100によって構成されるIPネットワークのうち、特定のNE100から送信される異常通知の優先度を高く、他のNE100から送信される異常通知の優先度を低く定めて、特定のNE100からの異常通知を優先して出力することが可能となる。
【0049】
また、本実施形態では、異常通知読出部260の優先異常通知読出部261と非優先異常通知読出部262とは、異なる時間間隔で異常通知記憶部250から異常通知を読み出すことで優先ファイル251に記憶された異常通知を優先して出力するようにしたが、例えば、優先異常通知読出部261が優先ファイル251に記憶された全ての異常通知を出力した後、非優先異常通知読出部262が動作するようにしても良い。ここで、異常通知読出部260がどのような順序で異常通知記憶部250から異常通知を読み出して出力するかは、優先ファイル251や非優先ファイル252に記憶された異常通知のデータサイズ、データ件数、または優先ファイル251に記憶された異常通知と非優先ファイル252に記憶された異常通知との件数やサイズの比率に応じて定められ、または変化するように構成しても良い。
【0050】
また、異常通知読出部260が備える優先異常通知読出部261と非優先異常通知読出部262とのそれぞれの処理待機時間も同様に、優先ファイル251や非優先ファイル252に記憶された異常通知のデータサイズ、データ件数、または優先ファイル251に記憶された異常通知と非優先ファイル252に記憶された異常通知との件数やサイズの比率に応じて定められ、または変化するように構成しても良い。例えば、優先ファイル251に記憶され蓄積されたメッセージの件数が、予め静的に定められた閾値を超えた場合、優先ファイル251から読み出すメッセージを送信する際の処理待機時間を短縮化し、非優先ファイル252から読み出すメッセージを送信する際の処理待機時間を長期化する。これにより、異常通知記憶部250に異常通知のメッセージが多量に蓄積された場合に、優先ファイル251に記憶された異常通知のメッセージを優先的に送信することが可能となる。一方、上述とは異なる閾値を予め静的に定め、優先ファイル251に記憶され蓄積されたメッセージの件数が、この閾値を下回る場合は、優先ファイル251に記憶されたメッセージの件数は少ないため、非優先ファイル252から読み出すメッセージを送信する際の処理待機時間を短期化する。すなわち、優先ファイル251のメッセージ件数が少なければ、優先ファイル251のメッセージを特に優先的に送信せずとも一定時間内に送信できると考えられるため、非優先ファイル252から読み出すメッセージを送信する処理待機時間を短期化することで、異常通知記憶部250に記憶された全件の異常通知のメッセージを効率的に送信することが可能である。
【0051】
同様に、例えば、優先ファイル251と非優先ファイル252とのそれぞれに記憶され蓄積されたメッセージの件数の割合が、予め静的に定められた閾値を超えた場合、優先ファイル251から読み出すメッセージを送信する際の処理待機時間を短縮化し、非優先ファイル252から読み出すメッセージを送信する際の処理待機時間を長期化する。一方、上述とは異なる閾値を予め静的に定め、優先ファイル251と非優先ファイル252とのそれぞれに記憶され蓄積されたメッセージの件数の割合が、この閾値を下回る場合は、優先ファイル251に記憶されたメッセージの件数の割合は少ないため、非優先ファイル252から読み出すメッセージを送信する際の処理待機時間を短期化する。
【0052】
ここで、監視サーバ200が、優先ファイル251から読み出すメッセージを管理サーバ300に送信する際の回線の占有率を元に閾値を定めるようにしても良い。例えば、回線占有率として、固定の周期(例えば、10秒)毎に、メッセージの送信にかかった総時間を固定の周期(この場合、10秒)で除算して、回線占有率を算出する。算出した回線占有率が、予め定められた占有率の閾値を上回った場合、非優先ファイル252から読み出すメッセージを送信する際の処理待機時間を長期化することで、優先ファイル251から読み出すメッセージの送信割合を高くする制御を行うことが可能である。
【0053】
ここで、事象発生時刻を元に、メッセージの送信制御を行うようにしても良い。例えば、メッセージの許容遅延時間を予め静的(例えば、優先を30秒、非優先を30分)に定める。この際、次に送信する非優先ファイル252に記憶されたメッセージの発生時刻が1時間前であり、一方、次に送信する優先ファイル251に記憶されたメッセージの発生時刻が10秒前であるような場合、優先のメッセージは許容遅延時間内にあり、非優先のメッセージは許容遅延時間外にあるので、非優先のメッセージの送信時の処理待機時間を短期化することで、異常通知記憶部250に記憶された異常通知のメッセージを効率的に送信することが可能である。
【0054】
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりネットワークの監視を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0055】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【図面の簡単な説明】
【0056】
【図1】本発明の一実施形態によるネットワークシステムの構成を示す図である。
【図2】本発明の一実施形態によるネットワークシステムの構成を示すブロック図である。
【図3】本発明の一実施形態により監視用クライアント端末に表示される監視画面の例を示す図である。
【図4】本発明の一実施形態によるネットワークシステムの動作例を示す図である。
【図5】本発明の一実施形態によるネットワークシステムの動作例を示す図である。
【図6】従来技術によるネットワークシステムの構成を示す図である。
【符号の説明】
【0057】
1 ネットワークシステム
100 NE
110 SNMPエージェント
120 ICMP通信部
200 監視サーバ
210 異常検知部
211 SNMPマネージャ
212 ICMP通信部
213 異常通知生成部
220 異常通知送信部
221 SNMPエージェント
230 異常通知到達判定部
240 異常通知登録部
241 優先条件記憶部
242 優先条件判定部
250 異常通知記憶部
251 優先ファイル
252 非優先ファイル
260 異常通知読出部
261 優先異常通知読出部
262 非優先異常通知読出部
300 管理サーバ
310 異常通知受信部
311 SNMPマネージャ
320 異常通知記憶部
400 APサーバ
410 ウェブサービス部
500 監視用クライアント端末
510 ウェブブラウザ
600 ルータ
610 ホスト
700 監視サーバ
800 管理サーバ

【特許請求の範囲】
【請求項1】
通信ネットワークを構成する複数のネットワークエレメントを監視し、当該ネットワークエレメントに異常が発生した場合に前記ネットワークエレメントから前記異常に応じた種別の異常通知を受信し、受信した前記異常通知を出力する監視サーバであって、
前記ネットワークエレメントから受信する前記異常通知のうち、当該異常通知の種別に応じて優先度が高いと判定された前記異常通知が記憶される優先異常通知記憶部と、
前記ネットワークエレメントから受信する前記異常通知のうち、当該異常通知の種別に応じて優先度が低いと判定された前記異常通知が記憶される非優先異常通知記憶部と、
前記ネットワークエレメントから受信する前記異常通知の種別に対応付けて、当該異常通知の優先度の高低が定められた優先条件が記憶される優先条件記憶部と、
前記ネットワークエレメントから受信する前記異常通知の種別に対応付けられた前記優先条件を読み出して当該異常通知の優先度の高低を判定し、当該異常通知の前記優先度が高いと判定した場合は当該異常通知を前記優先異常通知記憶部に記憶させ、当該異常通知の種別に応じた前記優先度が低いと判定した場合は当該異常通知を前記非優先異常通知記憶部に記憶させる異常通知登録部と、
前記優先異常通知記憶部および前記非優先異常通知記憶部に記憶された前記異常通知から、前記優先異常通知記憶部に記憶された前記異常通知を優先して読み出して出力する異常通知出力部と、
を備えることを特徴とする監視サーバ。
【請求項2】
前記優先条件記憶部に記憶された前記優先条件には、前記ネットワークエレメントから受信した前記異常通知の通信プロトコルの種別に応じて、当該異常通知の優先度の高低が定められる
ことを特徴とする請求項1に記載の監視サーバ。
【請求項3】
前記異常通知には、当該異常通知の送信元の前記ネットワークエレメントを識別する識別情報が含まれており、
前記優先条件記憶部に記憶された前記優先条件には、前記異常通知に含まれる前記識別情報に応じて、当該異常通知の優先度の高低が定められる
ことを特徴とする請求項1に記載の監視サーバ。
【請求項4】
前記異常通知出力部は、前記優先異常通知記憶部に記憶された前記異常通知を、予め定められた第1の時間間隔で出力し、前記非優先異常通知記憶部に記憶された前記異常通知を、前記第1の時間間隔より時間間隔が長い予め定められた第2の時間間隔で出力する
ことを特徴とする請求項1から請求項3までのいずれか1項に記載の監視サーバ。
【請求項5】
前記異常通知出力部は、前記優先異常通知記憶部に記憶された前記異常通知の全てを出力した後、前記非優先異常通知記憶部に記憶された前記異常通知を出力する
ことを特徴とする請求項1から請求項3までのいずれか1項に記載の監視サーバ。
【請求項6】
通信ネットワークを構成する複数のネットワークエレメントを監視し、当該ネットワークエレメントに異常が発生した場合に前記ネットワークエレメントから前記異常に応じた種別の異常通知を受信して出力し、前記ネットワークエレメントから受信する前記異常通知のうち、当該異常通知の種別に応じて優先度が高いと判定された前記異常通知が記憶される優先異常通知記憶部と、前記ネットワークエレメントから受信する前記異常通知のうち、当該異常通知の種別に応じて優先度が低いと判定された前記異常通知が記憶される非優先異常通知記憶部と、前記ネットワークエレメントから受信する前記異常通知の種別に対応付けて、当該異常通知の優先度の高低が定められた優先条件が記憶される優先条件記憶部と、を備えた監視サーバを用いたネットワーク監視方法であって、
前記ネットワークエレメントから受信する前記異常通知の種別に対応付けられた前記優先条件を読み出して当該異常通知の優先度の高低を判定し、当該異常通知の前記優先度が高いと判定した場合は当該異常通知を前記優先異常通知記憶部に記憶させ、当該異常通知の種別に応じた前記優先度が低いと判定した場合は当該異常通知を前記非優先異常通知記憶部に記憶させるステップと、
前記優先異常通知記憶部および前記非優先異常通知記憶部に記憶された前記異常通知から、前記優先異常通知記憶部に記憶された前記異常通知を優先して読み出して出力するステップと、
を備えることを特徴とするネットワーク監視方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−86095(P2010−86095A)
【公開日】平成22年4月15日(2010.4.15)
【国際特許分類】
【出願番号】特願2008−251981(P2008−251981)
【出願日】平成20年9月30日(2008.9.30)
【出願人】(000102728)株式会社エヌ・ティ・ティ・データ (438)
【Fターム(参考)】