説明

ユーザネットワークとサービスの影響範囲を特定する装置、方法及びプログラム

【課題】キャリアが提供する広域なネットワーク及びデータセンター内のネットワーク装置やサーバ装置において、障害が発生した場合に、影響するユーザネットワークとサービスを特定する。
【解決手段】影響範囲特定装置は、ネットワークおよびサーバの警報情報を収集し、さらに、前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納し、警報情報の障害装置から、資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、キャリアにおけるネットワークにおいて、設備に障害が起きたときに、ユーザに提供しているネットワークおよびサービスの影響範囲を特定する装置、方法及びプログラムに関する。
【背景技術】
【0002】
現状、キャリアが提供する広域なネットワークを利用して、多様な業種の企業活動が行われている。これらの企業はこのネットワークを介して本社、支社、協力会社、データセンターなど、多様な拠点との回線接続を行い、独自のユーザネットワークを形成している。キャリアが提供するネットワークは、1つの障害が多数のユーザネットワークに支障を与え、また、ネットワーク装置から発生する警報情報や、監視装置が監視しているネットワーク装置の監視情報が数多く監視装置に上がってくる。また、データセンターではサービスを提供しているサーバ装置やネットワーク装置を監視しており、サーバ装置やネットワーク装置から発生する警報情報や、監視装置が監視しているサーバ装置やネットワーク装置の監視情報も数多く監視装置に上がってくる。
【0003】
ネットワーク装置やサーバ装置を監視する運用者は、これらの警報や監視情報からユーザネットワークおよびサービスの影響範囲を調査し、影響のあった企業ユーザの担当者への連絡や障害復旧作業にあたらなければならない。現状の監視手法としては、ネットワーク装置毎、サーバ装置毎に存在する監視装置(NMS(Network Management System)やEMS(Element Management System))等の複数の監視装置をネットワーク通じて接続し、各監視装置が受信及び収集した警報情報を統合監視装置へ転送し、これらの警報情報を一元的に管理する手法(特許文献1〜2)がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平7−183932号公報
【特許文献2】特開2003−308261号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、監視する運用者が、複数の監視装置の表示画面、または統合監視装置によって複数の監視装置に跨って発生した警報情報が統合された表示画面を見て、経験を元に障害発生箇所の確認を行っている。そのため、属人的な対応になり精度にばらつきが生じ、影響範囲の特定に時間を要する。
【0006】
したがって、本発明はキャリアが提供する広域なネットワーク及びデータセンター内のネットワーク装置やサーバ装置において、障害が発生した場合に、影響するユーザネットワークとサービスの影響範囲を迅速に把握するための装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を実現するため本発明による影響範囲特定装置は、ネットワークおよびサーバの警報情報を収集し、影響範囲特定手段へ転送する統合監視手段と、前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納する資源管理手段と、前記警報情報の障害装置から、前記資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する影響範囲特定手段とを備える。
【0008】
また、前記特定した影響範囲を格納する影響情報データベースをさらに備えていることも好ましい。
【0009】
また、前記ネットワークは、複数のユーザネットワークを構成し、前記影響範囲特定手段は、前記警報情報の障害装置から、ユーザネットワーク番号を検索して、該ユーザネットワーク番号のネットワーク、及び該ユーザネットワーク番号のネットワーク上のサービスを影響範囲と特定するも好ましい。
【0010】
また、前記影響範囲特定機能は、前記障害装置のIPアドレス及びホスト名、または、IPアドレス、ホスト名、及びインタフェース番号から前記ユーザネットワーク番号を検索することも好ましい。
【0011】
上記目的を実現するため本発明による方法は、ネットワークおよびサーバの警報情報を収集し、影響範囲特定ステップへ転送する統合監視ステップと、前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納する資源管理ステップと、前記警報情報の障害装置から、前記資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する影響範囲特定ステップとを有する。
【0012】
上記目的を実現するため本発明によるプログラムは、ネットワークおよびサーバの警報情報を収集し、影響範囲特定手段へ転送する統合監視手段と、前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納する資源管理手段と、前記警報情報の障害装置から、前記資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する影響範囲特定手段として、コンピュータを機能させる。
【発明の効果】
【0013】
本発明による影響範囲特定装置を用いれば、簡便なアルゴリズムで、障害箇所に応じたユーザネットワークやサービスの影響範囲を迅速に把握することが可能となり、障害発生時のユーザサポートの向上が実現できる。
【図面の簡単な説明】
【0014】
【図1】本実施形態におけるネットワークと監視環境を示す。
【図2】資源管理機能にて集約したデータベースの関係を示す。
【図3】一元的に集約した資源情報のデータベースを示す。
【図4】影響範囲特定機能がユーザネットワークやサービスの影響範囲を特定するためのフローチャートを示す。
【図5】ユーザネットワークの構成を例示する。
【図6】図5の構成で障害が起こった際の影響範囲を例示する。
【発明を実施するための形態】
【0015】
本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。図1は、本実施形態におけるネットワークと監視環境を示す。
【0016】
本実施形態のネットワークは、ネットワークA、ネットワークB、およびサーバを含むデータセンターから構成される。
【0017】
ネットワーク監視装置1は、対応するネットワークの状態を監視し、障害によって発生する警報情報を収集・取得する。その警報情報を、影響範囲特定装置6の統合監視機能61に転送する。
【0018】
サーバ監視装置2は、対応するサーバの状態を監視し、障害によって発生する警報情報を収集・取得する。その警報情報を、影響範囲特定装置6の統合監視機能61に転送する。
【0019】
ネットワーク管理装置3は、ネットワークとして通信機能を提供するためのネットワーク装置の構成情報を管理している。例えば、ホスト名、IPアドレス、インタフェース番号、VLAN番号、ユーザネットワーク番号、ドメイン名、設置場所名、装置種別情報が挙げられる。
【0020】
サーバ管理装置4は、サーバとしてプラットフォーム機能を提供するためのサーバ装置の構成情報を管理している。例えば、ホスト名、IPアドレス、インタフェース番号、VLAN番号、ユーザネットワーク番号、ドメイン名、設置場所名、装置種別情報が挙げられる。
【0021】
ユーザ・サービス・回線情報管理装置5は、ネットワーク及びサーバを利用するユーザ・サービス・回線の情報を管理している。例えば、ユーザは、企業名、部署名、担当者名、電話番号、メールアドレスが挙げられる。サービスは、サービス番号、サービス名称が挙げられる。回線は、回線番号、回線名が挙げられる。
【0022】
影響範囲特定装置6は、統合監視機能61、資源管理機能62、影響範囲特定機能63の機能群と、資源情報64や影響情報65を格納するデータベースからなっている。
【0023】
統合監視機能61は、受信した警報情報を影響範囲特定機能63に転送する。資源管理機能62は、各管理装置の管理情報を集約し、管理情報間の接続関係性を基に、資源情報を一元的に集約して資源情報データベース64に格納する。
【0024】
図2は、資源管理機能にて集約したデータベースの関係を示す。図2の片方向矢印が接続関係を表しており、図3がこの接続関係によって一元的に集約した資源情報のデータベースである。この資源情報を用いて後述するユーザネットワークの影響範囲を特定する。
【0025】
ここで、接続関係とは、ネットワーク装置の構成情報、サーバ装置の構成情報、およびユーザ・サービス・回線の情報の各資源情報における主キーが、他の資源情報により参照されることであり、他のテーブルへの矢印として示される。例えば、図2において、設置場所情報から装置情報への矢印は、設置場所情報の主キー設置場所IDが装置情報で参照されることを示している。
【0026】
資源管理機能62は、この接続関係性を基に、資源情報毎に一元的に集約した資源情報のデータベースを作成する。例えば、図2のように資源情報が、装置情報である場合、装置情報の装置IDを参照しているインタフェース情報のインタフェース番号を取得し、このインタフェース情報のインタフェースIDを参照しているVLAN情報のVLAN番号、ユーザネットワーク番号を取得する。同様にして、回線情報から回線番号、回線名称を、サービス情報からサービス番号、サービス名称を取得する。さらに、資源管理機能62は、装置情報の設置場所IDを主キーとする設置場所情報から設定場所名を取得する。同様にして、ドメイン情報からドメイン名、ユーザ情報から企業名、部署名、担当者名、電話番号、メールアドレスが取得される。このようにして、一元的に集約した作成された資源情報は、図3のようになる。
【0027】
図4に、影響範囲特定機能がユーザネットワークやサービスの影響範囲を特定するためのフローチャートを示す。このフローチャートは、影響範囲特定機能63が受信した警報情報に対して動作するものである。
(S1)統合監視機能61から転送された警報情報を影響範囲特定機能63が受信する。
(S2)警報情報にインタフェース番号の有/無を確認する。インタフェース番号が有の場合S3に進み、インタフェース番号が無の場合、S4に進む。
(S3)警報情報にインタフェース番号が有の場合、影響範囲特定機能63は、受信した警報情報に含まれるIPアドレス、ホスト名、インタフェース番号を抽出する。例えば、イーサネット(登録商標)スイッチのインタフェース障害の場合、障害スイッチのIPアドレス、ホスト名、障害箇所のインタフェース番号が警報情報に含まれる。影響範囲特定機能63は、抽出したIPアドレスとホスト名とインタフェース番号を用いて資源情報データベース64に問い合わせを行い、ユーザネットワーク番号を抽出する。ただし、インタフェースには複数のVLAN番号が含まれる場合がある。この場合は複数のユーザネットワーク番号が抽出されるので、ユーザネットワーク番号の数量もカウントする。
(S4)警報情報にインタフェース番号が無の場合、影響範囲特定機能63は、上記と同様に、受信した警報情報に含まれるIPアドレス、ホスト名、インタフェース番号を抽出する。例えば、サーバの場合、CPU使用率、メモリ使用量、ディスク使用量を監視しており、これらに対して予め指定されている閾値を超えた場合に発出される障害の場合、障害サーバのIPアドレス、ホスト名情報が警報情報に含まれる。また、これらは仮想サーバ(Virtual Machine)の場合も同様である。影響範囲特定機能63は、抽出したIPアドレスとホスト名を用いて資源情報に問い合わせを行い、ユーザネットワーク番号を抽出する。ただし、IPアドレスとホスト名には、複数のインタフェース番号やVLAN番号が含まれる場合がある。この場合は複数のユーザネットワーク番号が抽出されるので、ユーザネットワーク番号の数量もカウントする。
(S5)ユーザネットワーク番号が単一/複数か確認する。単一の場合、S6に進み、複数一の場合、S7に進む。
(S6)ユーザネットワーク番号が単一の場合、抽出したユーザネットワーク番号を用いて資源情報データベース64に問い合せを行い、影響範囲一覧の情報を取得する。情報は、VLAN番号、ドメイン名、インタフェース番号、ホスト名、IPアドレス、装置種別、設置場所名、回線番号、回線名称、サービス番号、サービス名称、企業名、部署名、担当者名、電話番号、メールアドレスが挙げられる。
(S7)ユーザネットワーク番号が複数の場合、抽出したユーザネットワーク番号の数だけ繰り返し資源情報に問い合せを行い、影響範囲一覧の情報を取得する。情報は、VLAN番号、ドメイン名、インタフェース番号、ホスト名、IPアドレス、装置種別、設置場所名、回線番号、回線名称、サービス番号、サービス名称、企業名、部署名、担当者名、電話番号、メールアドレスが挙げられる。
(S8)取得した影響範囲一覧の情報を影響情報データベース65に登録する。
【0028】
図5にユーザネットワークの構成を例示する。下段は、キャリアが提供する広域なネットワークである。ユーザC及びDは、これを利用して独自のユーザネットワークを形成する。中段はユーザCのユーザネットワークであり、上段はユーザDのユーザネットワークである。実線部分が通信経路となる。
【0029】
図6では、図5の構成で障害が起こった際の影響範囲を例示する。ネットワークA上の装置Eにて障害が起きたとする。この場合、ユーザCは障害が起きた装置を介して通信を行っていないので影響が無い。ユーザDは装置Eを介して通信を行っているので影響が有る。図4のフローチャートに従うと、装置Eのホスト名、IPアドレス、インタフェース番号からユーザネットワーク番号を抽出することとなり、ユーザネットワークCのユーザネットワーク番号が判明する。この判明したユーザネットワーク番号を用いて影響範囲を把握することが可能となる。
【0030】
また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様および変更態様で実施することができる。従って本発明の範囲は特許請求の範囲およびその均等範囲によってのみ規定されるものである。
【符号の説明】
【0031】
1 ネットワーク監視装置
2 サーバ監視装置
3 ネットワーク管理装置
4 サーバ管理装置
5 ユーザ・サービス・回線情報管理装置
6 影響範囲特定装置
61 統合監視機能
62 資源管理機能
63 影響範囲特定機能
64 資源情報データベース
65 影響情報データベース

【特許請求の範囲】
【請求項1】
ネットワークおよびサーバの警報情報を収集し、影響範囲特定手段へ転送する統合監視手段と、
前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納する資源管理手段と、
前記警報情報の障害装置から、前記資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する影響範囲特定手段と、
を備えることを特徴とする影響範囲特定装置。
【請求項2】
前記特定した影響範囲を格納する影響情報データベースをさらに備えていることを特徴とする請求項1に記載の影響範囲特定装置。
【請求項3】
前記ネットワークは、複数のユーザネットワークを構成し、
前記影響範囲特定手段は、前記警報情報の障害装置から、ユーザネットワーク番号を検索して、該ユーザネットワーク番号のネットワーク、及び該ユーザネットワーク番号のネットワーク上のサービスを影響範囲と特定することを特徴とする請求項1または2に記載の影響範囲特定装置。
【請求項4】
前記影響範囲特定機能は、前記障害装置のIPアドレス及びホスト名、または、IPアドレス、ホスト名、及びインタフェース番号から前記ユーザネットワーク番号を検索することを特徴とする請求項3に記載の影響範囲特定装置。
【請求項5】
ネットワークおよびサーバの警報情報を収集し、影響範囲特定ステップへ転送する統合監視ステップと、
前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納する資源管理ステップと、
前記警報情報の障害装置から、前記資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する影響範囲特定ステップと、
を有することを特徴とする影響範囲特定方法。
【請求項6】
ネットワークおよびサーバの警報情報を収集し、影響範囲特定手段へ転送する統合監視手段と、
前記ネットワークおよびサーバを管理する管理装置から管理情報を収集し、各情報間の接続関係性を基に、資源情報毎に各情報を一元的に集約し、資源情報データベースに格納する資源管理手段と、
前記警報情報の障害装置から、前記資源情報データベースを検索して、ネットワークおよびサービスの影響範囲を特定する影響範囲特定手段と、
して、コンピュータを機能させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate