説明

監視システム及びサーバ切替方法

【課題】通信ネットワーク毎に運用系サーバ及び予備系サーバを設けずとも、冗長構成を形成することが可能な監視システム及びサーバ切替方法を提供する。
【解決手段】SNMPを用いて複数の通信ネットワークを監視する監視システム10において、N個の運用系サーバ12−1〜12−nは、互いに相違する論理IPアドレスが割り当てられ、N個の記録部15−1〜15−nは、互いに相違する識別IDを有する。スイッチ部14は、運用系サーバ12−1〜12−nと、記録部15−1〜15−nとの間に接続経路を確立させる。待機系サーバ13は、N個の運用系サーバ12−1〜12−nのうちいずれかに異常が発生した場合、異常が発生した運用系サーバの論理IPアドレスを取得し、接続経路を自サーバに切り替えるようにスイッチ部14を制御することで、異常が発生した運用系サーバの動作を引き継ぐ。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、SNMP(Simple Network Management Protocol)を用いて通信ネットワークを監視する監視システム及びサーバ切替方法に関する。
【背景技術】
【0002】
通信ネットワークを監視する監視システムでは、再送等がなくシンプルかつ軽実装なSNMP(Simple Network Management Protocol)が使用されることが多い。この種の監視システムでは、通信ネットワーク毎に設置された運用系サーバにより、通信ネットワークに属する被監視装置から通知されるイベント通知であるTRAPを記録する。通信ネットワークの監視者は、PC等の表示装置により運用系サーバにアクセスし、記録されたTRAPを確認することで、被監視装置及び通信ネットワークの動作状態を監視する。
【0003】
ところで、従来の監視システムでは、信頼性向上のために、通信ネットワーク毎に運用系サーバ及び予備系サーバを設置する二重冗長構成を構築していた。このため、通信ネットワーク毎に2台のサーバが必要となり、監視システムの大規模化及び高コスト化の要因となっている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−274255号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
以上のように、従来の監視システムでは、通信ネットワーク毎に運用系サーバ及び予備系サーバを設置するようにしていたため、システムの大規模化及び高コスト化等の要因となっている。
【0006】
そこで、目的は、通信ネットワーク毎に運用系サーバ及び予備系サーバを設けずとも、冗長構成を形成することが可能な監視システム及びサーバ切替方法を提供することにある。
【課題を解決するための手段】
【0007】
実施形態によれば、SNMP(Simple Network Management Protocol)を用いて複数の通信ネットワークを監視する監視システムにおいて、N個の運用系サーバと、N個の記録部と、スイッチ部と、待機系サーバとを具備する。N個の運用系サーバは、互いに異なる論理IPアドレスが割り当てられ、それぞれが前記複数の通信ネットワークのうちいずれかと接続し、前記接続された通信ネットワークに属する被監視装置から前記論理IPアドレス宛に送信されるTRAPを受信する。N個の記録部は、互いに異なる識別IDを有し、前記N個の運用系サーバのいずれかで受信されたTRAPをそれぞれ記録する。スイッチ部は、前記複数の論理IPアドレスと、前記複数の識別IDとを予め対応付け、前記対応付けた論理IPアドレスが割り当てられた運用系サーバと、前記対応付けた識別IDを有する記録部との間に接続経路を確立させる。待機系サーバは、前記N個の運用系サーバのうちいずれかに異常が発生した場合、前記異常が発生した運用系サーバの論理IPアドレスを取得し、前記異常が発生した運用系サーバに対して確立されている接続経路を自サーバに切り替えるように前記スイッチ部を制御することで、前記異常が発生した運用系サーバの動作を引き継ぐ。
【図面の簡単な説明】
【0008】
【図1】実施形態に係る監視システムの機能構成を示すブロック図である。
【図2】図1の表示装置へ通信ネットワークの監視情報を供給する際の監視システムの動作を示すシーケンス図である。
【図3】図1の表示装置が記録する対応テーブルの一例を示す図である。
【図4】図1の運用系サーバに異常が発生した際の監視システムの動作を示すシーケンス図である。
【図5】図1の待機系サーバが記録する管理テーブルの一例を示す図である。
【図6】実施形態に係る監視システムのその他の機能構成を示すブロック図である。
【発明を実施するための形態】
【0009】
以下、実施の形態について、図面を参照して説明する。
【0010】
図1は、一実施形態に係る監視システム10の機能構成を示すブロック図である。図1における監視システム10は、NTP(Network Time Protocol)サーバ11、運用系サーバ12−1〜12−n、待機系サーバ13、スイッチ部14、記録部15−1〜15−n及び表示装置16−1〜16−mを具備する。
【0011】
NTPサーバ11は、標準時刻を管理するサーバであり、NTPに基づいて運用系サーバ12−1〜12−n及び待機系サーバ13へ標準時刻情報を送信する。
【0012】
運用系サーバ12−1〜12−nは、それぞれが通信ネットワークNW−1〜NW−nのいずれかと接続する。運用系サーバ12−1〜12−nには、相互に異なる論理IPアドレスが予め割り当てられている。運用系サーバ12−1〜12−nは、SNMP(Simple Network Management Protocol)に基づいて、通信ネットワークNW−1〜NW−nに属する被監視装置から自己の論理IPアドレス宛に送信されるTRAPを受信する。
【0013】
運用系サーバ12−1〜12−nは、被監視装置からのTRAPを受信すると、受信したTRAPに自己の論理IPアドレスを付加する。また、運用系サーバ12−1〜12−nは、NTPサーバ11からの標準時刻情報に基づいたタイムスタンプをTRAPにさらに付加する。運用系サーバ12−1〜12−nは、論理IPアドレスとタイムスタンプとを付加したTRAPをスイッチ部14へ出力する。
【0014】
また、運用系サーバ12−1〜12−nは、切替制御部121−1〜121−nを備える。切替制御部121−1〜121−nは、待機系サーバ13からの切替信号を受信した場合、既存のクラスタ制御ソフトに則った所定の処理を実行し、運用系サーバ12−1〜12−nとしての動作を待機系サーバ13に切り替えるための処理を行う。
【0015】
また、運用系サーバ12−1〜12−nは、それぞれが接続する通信ネットワークNW−1及び通信ネットワークNW−1に属する被監視装置についての監視情報を管理する。
【0016】
スイッチ部14と、記録部15−1〜15−nとは、SAN(Storage Area Network)を形成する。スイッチ部14は、ファイバチャネルスイッチであり、運用系サーバ12−1〜12−n、待機系サーバ13及び記録部15−1〜15−nと接続する。記録部15−1〜15−nには、相互に異なる識別IDが予め設定されている。
【0017】
スイッチ部14では、運用系サーバ12−1〜12−nに割り当てられる論理IPアドレスと、記録部15−1〜15−nに設定される識別IDとが予め対応付けられている。また、スイッチ部14により、互いに対応付けられた論理IPアドレスと識別IDとを接続する接続経路が予め確立されている。スイッチ部14は、運用系サーバ12−1〜12−nからのTRAPを受信すると、TRAPに付加された論理IPアドレスを参照する。そして、スイッチ部14は、この論理IPアドレスに対応付けられた識別IDを有する記録部と接続する接続経路へ、受信したTRAPを送信する。記録部15−1〜15−nは、スイッチ部14からのTRAPを受信し、受信したTRAPを記録する。
【0018】
また、スイッチ部14は、待機系サーバ13による切替制御に従って接続経路を切り替える。
【0019】
待機系サーバ13は、切替制御部131及びメモリ132を備える。切替制御部131は、運用系サーバ12−1〜12−nに異常が発生したか否かを監視する。切替制御部131は、異常が発生した場合、既存のクラスタ制御ソフトに則った所定の処理を実行し、メモリ132に記録された管理テーブルを参照して運用系サーバ12−1〜12−nの動作を引き継ぐための処理を行う。
【0020】
表示装置16−1〜16−mは、例えば、PC(Personal Computer)等である。表示装置16−1〜16−mは、通信ネットワークNW−1〜NW−nと、通信ネットワークNW−1〜NW−nそれぞれについての監視情報を管理する運用系サーバ12−1〜12−nに割り当てられる論理IPアドレスとが対応付けられた対応テーブルを予め記録する。表示装置16−1〜16−mは、ユーザからの要求に応じて、対応テーブルを参照し、運用系サーバ12−1〜12−nのうちいずれかの運用系サーバへアクセスする。表示装置16−1〜16−mは、アクセスした運用系サーバを介してTRAPを取得する。そして、表示装置16−1〜16−mは、取得したTRAPを監視情報としてディスプレイに表示する。
【0021】
次に、以上のように構成された監視システム10の動作を説明する。
【0022】
図2は、一実施形態に係る監視システム10における表示装置16−1が通信ネットワークNW−1の監視情報を取得する際の監視システム10の動作を示すシーケンス図である。なお、表示装置16−1〜16−mの動作は互いに同一であるため、図2では表示装置16−1を例に説明する。
【0023】
表示装置16−1は、ユーザから通信ネットワークNW−1についての監視情報を要求された場合(シーケンスS21)、図3に示す対応テーブルを参照し、通信ネットワークNW−1の監視情報を管理する運用系サーバ12−1を特定する(シーケンスS22)。表示装置16−1は、運用系サーバ12−1に対して監視情報を要求する(シーケンスS23)。
【0024】
運用系サーバ12−1は、表示装置16−1からの要求に応じ、スイッチ部14を介し、運用系サーバ12−1との接続経路が確立されている記録部15−1に対してTRAPの読出し指示を与える(シーケンスS24)。記録部15−1は、運用系サーバ12−1からの読出し指示に応じて、記録しているTRAPを読み出す(シーケンスS25)。記録部15−1は、読み出したTRAPを、スイッチ部14を介して運用系サーバ12−1へ送信する(シーケンスS26)。運用系サーバ12−1は、記録部15−1からのTRAPをタイムスタンプ順に整列させ、通信ネットワークNW−1の監視情報として表示装置16−1へ出力する(シーケンスS27)。
【0025】
表示装置16−1は、運用系サーバ12−1からの監視情報をユーザに表示する(シーケンスS28)。なお、図2では、ユーザが表示装置16−1に対して通信ネットワークNW−1の監視情報を要求する場合を例に説明したが、本実施形態はこの例に限定される訳ではない。例えば、ユーザが表示装置16−1〜16−mに対して複数の通信ネットワークの監視情報を要求する場合であっても同様に実施可能である。
【0026】
また、表示装置16−1〜16−mは、予め設定された所定の期間内に運用系サーバ12−1〜12−nで受信されたTRAPをマージし、運用系サーバ12−1〜12−nにおける受信時間順にソートして表示するようにしても構わない。このとき、表示装置16−1〜16−mは、例えば以下のような処理を行う。表示装置16−1〜16−mは、所定の期間毎に運用系サーバ12−1〜12−nに対して、その期間内に受信したTRAPを要求する。運用系サーバ12−1〜12−nは、表示装置16−1〜16−mからの要求を受けると、それぞれに対応付けられた記録部15−1〜15−nからTRAPを読み出し、読み出したTRAPを表示装置16−1〜16−mへ出力する。表示装置16−1〜16−mは、運用系サーバ12−1〜12−nからのTRAPをマージし、運用系サーバ12−1〜12−nにおける受信時間順にソートして自身のメモリに記録する。そして、表示装置16−1〜16−mは、ユーザからの要求に応じてマージしたTRAPを表示する。
【0027】
図4は、一実施形態に係る監視システム10における運用系サーバ12−1に異常が発生した場合の監視システム10の動作を示すシーケンス図である。なお、図4においては、初期状態において、スイッチ部14により、運用系サーバ12−1と記録部15−1とを接続する接続経路が確立されている場合について説明する。また、運用系サーバ12−1は、論理IPアドレス1が割り当てられ、記録部15−1は識別ID1で識別されるものとして説明する。
【0028】
まず、待機系サーバ13は、切替制御部131により、運用系サーバ12−1〜12−nのいずれかで異常が発生したことを検出する(シーケンスS41)。切替制御部131は、運用系サーバ12−1へ切替信号を出力する(シーケンスS42)。
【0029】
運用系サーバ12−1は、切替信号を受信すると、切替制御部121−1により、自己に割り当てられた論理IPアドレス1を無効とする(シーケンスS43)。続いて、切替制御部121−1は、通信ネットワークNW−1及び通信ネットワークNW−1に属する被監視装置の動作状態の監視処理及び、通信ネットワークNW−1及び通信ネットワークNW−1に属する被監視装置についての監視対象設備情報の管理処理等を停止する(シーケンスS44)。続いて、切替制御部121−1は、記録部15−1との間で確立されている経路を切断する(シーケンスS45)。そして、切替制御部121−1は、シーケンスS23〜S25の処理が終了すると、処理が終了した旨を待機系サーバ13へ通知する(シーケンスS46)。
【0030】
待機系サーバ13は、運用系サーバ12−1からの通知を受けると、切替制御部131により、運用系サーバ12−1に割り当てられていた論理IPアドレス1を取得する(シーケンスS47)。続いて、切替制御部131は、図5に示されるメモリ132に記録された管理テーブルを参照し、論理IPアドレス1に対応する識別ID1を特定する(シーケンスS48)。切替制御部131は、識別ID1との間に経路を確立するように、スイッチ部14に対して切替制御を実行する(シーケンスS49)。
【0031】
そして、切替制御部131は、通信ネットワークNW−1及び通信ネットワークNW−1に属する被監視装置の動作状態の監視処理、及び、通信ネットワークNW−1及び通信ネットワークNW−1に属する被監視装置についての監視情報の管理処理等を開始する(シーケンスS410)。待機系サーバ13は、運用系サーバ12−1の動作を引き継ぐと、NTPサーバ11からの標準時刻情報に従い、通信ネットワークNW−1からのTRAPにタイムスタンプ及び割り当てられた論理IPアドレスを付し、記録部15−1へ出力する。
【0032】
以上のように、上記実施形態では、待機系サーバ13は、運用系サーバ12−1〜12−nのいずれかで異常が発生した場合、異常の発生した運用系サーバの論理IPアドレスを取得する。また、待機系サーバ13は、スイッチ部14を制御し、異常の発生した運用系サーバと接続されていた記録部と自サーバとの間に接続経路を確立させる。これにより、異常が発生した運用系サーバの動作を待機系サーバ13により引き継ぐことが可能となる。
【0033】
また、上記実施形態では、n台の運用系サーバ12−1〜12−nの動作を1台の待機系サーバ13で保障するようにしている。このため、監視する通信ネットワークを増設する際には、運用系サーバと記録部とを増設しても、待機系サーバを増設する必要はない。監視する通信ネットワークを増設する際には、待機系サーバ13に記録された管理テーブルを、新たに増設された運用系サーバの論理IPアドレスと、新たに増設された記録部の識別IDとを対応付けて更新すれば良い。これにより、監視システムの大規模化及び高コスト化を抑えることが可能となる。
【0034】
また、上記実施形態では、運用系サーバ12−1〜12−n及び待機系サーバ13は、NTPサーバ11から標準時刻情報を供給され、この標準時刻情報に従って駆動している。これにより、待機系サーバ13が、異常が発生した運用系サーバを引き継いだとしても、記録部15−1〜15−nに記録されたTRAPのタイムスタンプが乱れることはない。
【0035】
また、上記実施形態では、表示装置16−1〜16−mに記録される対応テーブルは、通信ネットワークNW−1〜NW−nと運用系サーバ12−1〜12−nとの対応を、運用系サーバ12−1〜12−nに割り当てられる論理IPアドレスを用いるようにしている。これにより、表示装置16−1〜16−mは、異常を生じた運用系サーバの動作を待機系サーバ13が引き継いだ場合であっても、アクセスする論理IPアドレスに変更がないため、対応テーブルを更新する必要がない。つまり、表示装置16−1〜16−mは、運用系サーバに異常が発生した場合であっても、TRAPを通常通り取得することが可能となる。
【0036】
したがって、本実施形態に係る監視システムによれば、通信ネットワーク毎に運用系サーバ及び予備系サーバを設けずとも、冗長構成を形成することができる。
【0037】
なお、本実施形態は、上述の内容に限定される訳ではない。例えば、上記一実施形態では、スイッチ部14及び記録部15−1〜15−nにより、SANが形成される場合を例に説明したが、これに限定される訳ではない。例えば、イーサネット(登録商標)に準拠したスイッチ部14により、記録部15−1〜15−n、運用系サーバ12−1〜12−n及び待機系サーバ13を接続する場合であっても構わない。
【0038】
また、上記実施形態では、図1に示す監視システム10について説明したが、監視システム10の構成は図1に限定される訳ではない。例えば、図6に示すように、監視システム10が制御装置17を備えるようにしても構わない。このとき、制御装置17は、待機系サーバ13の代わりに、運用系サーバ12−1〜12−nにおける異常の発生を監視する。そして、制御装置17は、異常が発生した場合、待機系サーバ13の切替制御部131へ、異常が発生した運用系サーバについての情報を通知し、切替制御部131に引継ぎ処理を開始させる。また、制御部17は、運用系サーバ12−1〜12−nに異常が発生した場合、運用系サーバ12−1〜12−nの切替制御部121−1〜121−n及び待機系サーバ13の切替制御部131に対して、引継ぎ処理を開始するように制御しても良い。
【0039】
また、上記実施形態では、待機系サーバ13が運用系サーバ12−1〜12−nの動作を引き継ぐ例について説明した。本実施形態においては、待機系サーバ13がこのまま運用系サーバの動作を継続させるか、運用系サーバの動作を異常の回復した運用系サーバに戻すか、についての制限はない。
【0040】
さらに、この発明は、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
【符号の説明】
【0041】
10…監視システム
11…NTPサーバ
12−1〜12−n…運用系サーバ
121−1〜121−n…切替制御部
13…待機系サーバ
131…切替制御部
132…メモリ
14…スイッチ部
15−1〜15−n…記録部
16−1〜16−m…表示装置
17…制御装置

【特許請求の範囲】
【請求項1】
SNMP(Simple Network Management Protocol)を用いて複数の通信ネットワークを監視する監視システムにおいて、
互いに異なる論理IPアドレスが割り当てられ、それぞれが前記複数の通信ネットワークのうちいずれかと接続し、前記接続された通信ネットワークに属する被監視装置から前記論理IPアドレス宛に送信されるTRAPを受信するN(Nは2以上の自然数)個の運用系サーバと、
互いに異なる識別IDを有し、前記N個の運用系サーバのいずれかで受信されたTRAPをそれぞれ記録するN(Nは2以上の自然数)個の記録部と、
前記複数の論理IPアドレスと、前記複数の識別IDとを予め対応付け、前記対応付けた論理IPアドレスが割り当てられた運用系サーバと、前記対応付けた識別IDを有する記録部との間に接続経路を確立させるスイッチ部と、
前記N個の運用系サーバのうちいずれかに異常が発生した場合、前記異常が発生した運用系サーバの論理IPアドレスを取得し、前記異常が発生した運用系サーバに対して確立されている接続経路を自サーバに切り替えるように前記スイッチ部を制御することで、前記異常が発生した運用系サーバの動作を引き継ぐ待機系サーバと
を具備することを特徴とする監視システム。
【請求項2】
システム内で使用される時刻情報を生成するNTPサーバをさらに具備し、
前記N個の運用系サーバは、前記時刻情報に従って前記TRAPに対してタイムスタンプを付加し、
前記待機系サーバは、前記異常が発生した運用系サーバの動作を引き継いだ後、前記事項情報に従って前記TRAPに対してタイムスタンプを付加することを特徴とする請求項1記載の監視システム。
【請求項3】
前記複数の通信ネットワークのうち要求された通信ネットワークについての監視情報を表示する表示装置をさらに具備し、
前記表示装置は、前記複数の通信ネットワークと、前記複数の通信ネットワークについての監視情報をそれぞれ管理する運用系サーバに割り当てられる論理IPアドレスとを予め対応付けた対応テーブルを有し、前記対応テーブルを参照し、前記要求された通信ネットワークに対応付けられた運用系サーバの論理IPアドレスに対して前記監視情報を要求し、
前記N個の運用系サーバは、接続する前記通信ネットワークについての監視情報をそれぞれ管理し、前記表示装置からの要求に応じて前記監視情報を前記表示装置へ送信することを特徴とする請求項1及び2のいずれかに記載の監視システム。
【請求項4】
前記N個の運用系サーバにおいて異常が発生したか否かを監視し、異常が発生した場合、前記待機系サーバに対して前記異常が発生した運用系サーバを通知する制御装置をさらに具備することを特徴とする請求項1乃至3のいずれかに記載の監視システム。
【請求項5】
前記スイッチ部と、前記N個の記録部とは、SAN(Storage Area Network)を形成することを特徴とする請求項1乃至4のいずれかに記載の監視システム。
【請求項6】
SNMP(Simple Network Management Protocol)を用いて複数の通信ネットワークを監視する監視システムで用いられるサーバ切替方法において、
互いに異なる論理IPアドレスが割り当てられたN個の運用系サーバが、前記複数の通信ネットワークのうちいずれかと接続し、前記接続された通信ネットワークに属する被監視装置から前記論理IPアドレス宛に送信されるTRAPを受信し、
スイッチ部が、前記複数の論理IPアドレスと、N個の記録部に設定された複数の識別IDとを予め対応付け、前記対応付けた論理IPアドレスが割り当てられた運用系サーバと、前記対応付けられた識別IDを有する記録部との間に接続経路を確立させ、
前記N個の記録部が、前記接続経路により接続された運用系サーバで受信されたTRAPをそれぞれ記録し、
待機系サーバが、前記N個の運用系サーバのうちいずれかに異常が発生した場合、前記異常が発生した運用系サーバの論理IPアドレスを取得し、前記異常が発生した運用系サーバに対して確立されている接続経路を自サーバに切り替えるように前記スイッチ部を制御することで、前記異常が発生した運用系サーバの動作を引き継ぐことを特徴とするサーバ切替方法。
【請求項7】
NTPサーバが、システム内で使用される時刻情報を生成し、
前記N個の運用系サーバが、前記時刻情報に従って前記TRAPに対してタイムスタンプを付加し、
前記待機系サーバが、前記異常が発生した運用系サーバの動作を引き継いだ後、前記事項情報に従って前記TRAPに対してタイムスタンプを付加することを特徴とする請求項6記載のサーバ切替方法。
【請求項8】
表示装置が、前記複数の通信ネットワークと、前記複数の通信ネットワークについての監視情報をそれぞれ管理する運用系サーバに割り当てられる論理IPアドレスとを予め対応付けた対応テーブルを有し、
前記表示装置は、前記複数の通信ネットワークのうちいずれかの通信ネットワークについての監視情報が要求された場合、前記対応テーブルを参照して、前記監視情報が要求された通信ネットワークに対応付けられた論理IPアドレスに対して前記監視情報を要求し、
前記N個の運用系サーバは、前記表示装置からの要求に応じて管理する監視情報を前記表示装置へ送信し、
前記表示装置は、前記運用系サーバからの前記監視情報を表示することを特徴とする請求項6及び7のいずれかに記載のサーバ切替方法。
【請求項9】
制御装置が、前記N個の運用系サーバにおいて異常が発生したか否かを監視し、異常が発生した場合、前記待機系サーバに対して前記異常が発生した運用系サーバを通知することを特徴とする請求項6乃至8のいずれかに記載のサーバ切替方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−250033(P2011−250033A)
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願番号】特願2010−119757(P2010−119757)
【出願日】平成22年5月25日(2010.5.25)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】