説明

ネットワーク監視支援装置、ネットワーク監視支援方法およびネットワーク監視支援プログラム

【課題】機器からの情報取得、障害原因の診断をして、診断した障害影響範囲を回避する通信経路を算出することを目的とする。また、ネットワーク、ネットワーク機器の負荷に基づき通信経路を設定することにより、効率の良い通信経路を設定することを目的とする。
【解決手段】障害機器の情報を障害機器情報として収集する機器監視部120と、障害機器情報に対応する障害の原因を示す障害原因情報を有する診断ファイルを記憶する診断ファイル記憶部150と、上記障害機器情報に基づき上記診断ファイルから障害原因情報を取得して障害の原因を診断する障害原因解析部112と、障害機器情報とネットワークトポロジ情報とに基づき障害の影響範囲を特定する障害影響範囲解析部111と、上記障害の影響範囲を回避する通信経路である回避経路を機器の負荷情報に基づき算出する障害復旧部130とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、ネットワーク機器を監視し、ネットワーク機器の障害の調査、復旧などを行うネットワーク装置に関するものである。
【背景技術】
【0002】
これまで、ネットワーク機器の障害の通知または原因を診断する方法には、様々な取り組みが行われている。
特開平7−183932号公報は、以下の方法による障害の上位監視装置への通知方式を開示する。特開平7−183932号公報では、まず上位監視装置と監視対象のネットワーク機器の間にサブ監視装置を設ける。次に、サブ監視装置は、監視対象のネットワーク機器から通知された警報を解析する。そして、サブ監視装置は、サブ監視装置が備えるデータベース(MIB)に登録された障害のみ上位監視装置へ通知する。このため、上位監視装置に通知される警報の数が削減され、上位監視装置の負担を軽減する。
【0003】
また、特開5−95357号公報は、同一の装置で同一の障害が発生した場合に通知される障害通知や、1つの障害に関連して他の装置から通知される障害通知を、監視装置が解析して、同一の障害であれば障害内容をまとめ、集約することを開示する。これにより、システム全体の負荷を軽減する。
【0004】
特開2003−244143号公報は、ネットワーク機器の障害原因を診断する方式を開示する。特開2003−244143号公報では、監視装置は、SNMP(Simple Network Management Protocol)のポーリングを用いて順次監視対象のネットワーク機器の情報を収集する。次に、監視装置は、収集した情報に基づき機器の状態変化を部品単位で検出する。これにより、障害発生時の該当機器への集中的な情報収集を回避して、他の機器の監視が行うことができ監視効率が向上する。
【0005】
特開2004−350198号公報は、トラフィック情報に基づいてポリシーの設定を変更する方式を開示する。特開2004−350198号公報では、ネットワーク制御システムは、ネットワーク機器からトラフィック情報を取得して分析する。そして、ネットワーク制御システムは、分析結果に基づきネットワーク機器に適したネットワークの運用方針であるポリシー情報の決定と設定変更を行う。また、この手法では、監視対象機器からの情報収集ができない場合は、障害発生であると判断する。
【0006】
特開2002−111666号公報、特開2003−229888号公報は、障害原因を特定し、通信経路を変更する方式を開示する。上記方式の1つは、MPLS(Multi Protocol Label Switching)ネットワークにおいて、MPLSプロトコルのLDP(Label Distribution Protocol)を利用して障害原因を特定する方式である。また、上記方式のもう1つは、通信経路であるLSP(Label Switched Path)情報によって通信経路上の障害発生箇所の特定とプロテクションポイントへの通知を行う。そして、プロテクションポイントは、通知された障害情報から障害発生箇所を迂回する。
【0007】
特開2001−24635号公報は、監視対象のネットワーク機器から情報を収集する方式を開示する。特開2001−24635号公報では、SNMPプロトコルを用いたネットワーク管理方式において、Get Request, Get Next Requestにより定期的にネットワーク機器の情報を収集する。これにより、Trapによる通知によらずに状態変化を検出する。
【特許文献1】特開平7−183932号公報
【特許文献2】特開5−95357号公報
【特許文献3】特開2003−244143号公報
【特許文献4】特開2004−350198号公報
【特許文献5】特開2002−111666号公報
【特許文献6】特開2003−229888号公報
【特許文献7】特開2001−24635号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
従来は、障害の監視を効率化するものであったため、ネットワーク機器の詳細な障害情報の収集や障害診断または通信経路の変更を行うことはできないという課題がある。そのため、従来は、障害の復旧には人手が必要であるという課題がある。さらに、従来は、ネットワーク機器ではなく、ネットワーク自体の障害については診断することができないという課題がある。また、さらに、従来は、ネットワーク、ネットワーク機器の負荷に基づき通信経路の設定はされていないため、最適経路の設定が不十分であるという課題がある。
本発明は、例えば、機器からの情報取得、障害原因の診断をして、診断した障害影響範囲を回避する通信経路を算出することを目的とする。また、該当するネットワーク機器の通信経路を人手によらずに変更することを目的とする。さらに、ネットワーク、ネットワーク機器の負荷に基づき通信経路を設定することにより、効率の良い通信経路を設定することを目的とする。
【課題を解決するための手段】
【0009】
本発明にかかるネットワーク監視支援装置は、例えば、ネットワークに存在する所定の機器を監視して障害を検出するとともに、障害が検出された障害機器の情報を障害機器情報として通信装置を介して収集する機器監視部と、障害機器情報に対応する障害の原因を示す障害原因情報を有する診断ファイルを記憶装置に記憶する診断ファイル記憶部と、上記機器監視部が収集した障害機器情報に基づき上記診断ファイル記憶部が記憶した診断ファイルから障害原因情報を取得して障害の原因を診断する障害原因解析部と、ネットワークの接続形態を示すネットワークトポロジ情報を、ネットワークを監視するネットワーク監視装置から取得するとともに、上記障害機器情報と上記ネットワークトポロジ情報とに基づき障害の影響範囲を処理装置により特定する障害影響範囲解析部とを備えることを特徴とする。
【発明の効果】
【0010】
本発明にかかるネットワーク監視支援装置は、例えば、障害原因解析部を備えることにより、障害の原因を診断することが可能である。また、障害影響範囲解析部を備えることにより障害の影響範囲を特定することが可能である。
【発明を実施するための最良の形態】
【0011】
以下、図に基づいて本発明にかかる実施の形態について説明する。
【0012】
まず、図1、図2、図3に基づき本発明にかかるネットワーク監視支援装置100のハードウェア構成の一例について説明する。
【0013】
図1は、実施の形態にかかるネットワーク監視支援装置100の外観の一例を示した図である。
図1において、ネットワーク監視支援装置100は、CRT(Cathode Ray Tube)表示装置901、キーボード(K/B)902、マウス903、コンパクトディスク装置(CDD)905、データベース908、システムユニット909、サーバ910を備え、これらはケーブルで接続されている。
さらに、ネットワーク監視支援装置100は、ローカルエリアネットワーク(LAN)942、ゲートウェイ941を介してインターネット940に接続されている。
【0014】
図2は、実施の形態におけるネットワーク監視支援装置100のハードウェア構成の一例を示す図である。
図2において、ネットワーク監視支援装置100は、コンピュータであり、プログラムを実行するCPU(Central Processing Unit)911を備えている。CPU911は、バス912を介してROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、CRT表示装置901、K/B902、マウス903、FDD(Flexible Disk)904、CDD905、磁気ディスク装置920と接続されている。
RAM914は、揮発性メモリの一例である。ROM913、磁気ディスク装置920は、不揮発性メモリの一例である。これらは、記憶装置984の一例である。
通信ボード915は、LAN942等に接続されている。
また、CPU911は、処理装置980の一例である。また、処理装置980は、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサなどでも構わない。つまり、処理装置980は、命令、コマンド、プログラムなどの実行をする装置であり、あらゆる演算を行うものである。
また、通信ボード915は、通信装置988の一例である。
【0015】
ここで、通信ボード915は、LAN942に限らず、直接、インターネット940、或いはISDN等のWAN(ワイドエリアネットワーク)に接続されていても構わない。直接、インターネット940、或いはISDN等のWANに接続されている場合、ネットワーク監視支援装置100は、インターネット940、或いはISDN等のWANに接続され、ゲートウェイ941は不用となる。
磁気ディスク装置920には、オペレーティングシステム(OS)921、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923は、CPU911、OS921、ウィンドウシステム922により実行される。
【0016】
上記プログラム群923には、以下に述べる実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、以下に述べる実施の形態の説明において、「〜判定」として説明するものが、「〜ファイル」として記憶されている。
また、以下に述べる実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータの入出力を示し、そのデータの入出力のためにデータは、磁気ディスク装置920、FD、光ディスク、CD、MD(ミニディスク)、DVD(Digital Versatile Disk)等のその他の記録媒体に記録される。あるいは、信号線やその他の伝送媒体により伝送される。
【0017】
また、以下に述べる実施の形態の説明において「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、ハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
【0018】
また、以下に述べる実施の形態を実施するプログラムは、また、磁気ディスク装置920、FD、光ディスク、CD、MD、DVD等のその他の記録媒体による記録装置を用いて記憶されても構わない。
【0019】
実施の形態1.
次に、実施の形態1について説明する。実施の形態1では、定期的にネットワークに存在する機器を監視することにより、障害を検出し、さらに障害検出時に通信経路を変更するネットワーク監視支援装置100について説明する。
【0020】
従来、上位監視装置と監視対象のネットワーク機器の間にサブ監視装置を設ける。また、サブ監視装置において監視対象のネットワーク機器から通知される警報であるTrap情報を、サブ監視装置のMIBの登録情報と比較する。これにより、上位監視装置への通知が必要なTrap情報のみ通知するという警報のフィルタ機能に関するネットワーク監視装置がある。このネットワーク監視装置では、障害通知の件数の削減は可能である。しかし、通知に関する機能のみのため、該当ネットワーク機器の詳細な障害情報の収集や障害診断または通信経路の変更を行うことはできないという課題がある。
【0021】
また、従来、同一障害のフィルタ機能に関するネットワーク監視装置がある。しかし、これに関しても上記と同様に、警報の削減によりシステム全体の負荷を下げることはできるが、該当ネットワーク機器の詳細な障害情報の収集や障害診断または通信経路の変更を行うことはできないという課題がある。
【0022】
さらに、従来、SNMPプロトコルを用いた情報収集に関するネットワーク監視装置がある。しかし、ネットワーク機器の情報収集機能の効率向上は可能であるが、障害検出後の障害復旧には人手を要すという課題がある。
【0023】
そこで、実施の形態1にかかるネットワーク監視支援装置100は、一般的なIP(Internet Protocol)ネットワークにおいて、定期的に監視対象のネットワーク機器を監視する。また、ネットワーク監視支援装置100は、応答がない機器が見つかった場合は、該当機器に対して応答があるまで監視し続ける。その後に応答があれば、ネットワーク監視支援装置100は、該当機器からの情報の取得と、障害の原因を診断する。さらに、ネットワーク監視支援装置100は、診断した障害の影響範囲を回避する通信経路を算出し、該当するネットワーク機器の経路テーブルを更新する。これにより、人手によらずに通信経路を変更することができる。つまり、実施の形態1にかかるネットワーク監視支援装置100は、障害診断と共に経路変更を行うことにより、ルーティングプロトコルなどによる障害回復よりも高速に復旧することを目的とする。
【0024】
まず、図3に基づき実施の形態1にかかるネットワーク監視支援装置100の機能について説明する。図3は、実施の形態1にかかるネットワーク監視支援装置100の機能を示す機能ブロック図である。
【0025】
ネットワーク監視支援装置100は、障害診断部110、機器監視部120、障害復旧部130、診断ファイル記憶部150、処理装置980、記憶装置984、通信装置988を備える。また、ネットワーク監視支援装置100は、ネットワーク監視装置200、および、複数のルータを備えるルータ群400とネットワークを介して接続される。
【0026】
障害診断部110は、監視対象のネットワーク機器の障害を診断する。障害診断部110は、障害影響範囲解析部111、障害原因解析部112を備える。
障害影響範囲解析部111は、障害が検出された機器である障害機器に隣接または関連するネットワーク機器への障害の影響範囲を特定する。例えば、障害影響範囲解析部111は、ネットワークの接続形態を示すネットワークトポロジ情報を、ネットワーク監視装置200から取得する。そして、障害影響範囲解析部111は、後述する機器監視部120が障害機器と障害機器に隣接する機器から取得した障害機器情報とネットワークトポロジ情報とに基づき障害の影響範囲を処理装置980により特定する。つまり、処理装置980が、障害機器情報とネットワークトポロジ情報とに基づき障害の影響範囲を算出する。
障害原因解析部112は、障害の原因を診断する。例えば、障害原因解析部112は、機器監視部120が収集した障害機器情報に基づき後述する診断ファイル記憶部150が記憶した診断ファイルから障害原因情報を取得して障害の原因を診断する。
【0027】
機器監視部120は、監視対象のネットワーク機器の状態を定期的に監視する。ここで、機器監視部120は、ネットワーク機器の状態を定期的に監視することに限定されず、指示があった場合などの所定の場合にのみ監視するものであっても構わない。つまり、機器監視部120は、ネットワークに存在する所定の機器を監視して障害を検出する。そして、機器監視部120は、障害が検出された障害機器の情報と障害機器に隣接する機器の情報とを障害機器情報として通信装置988を介して収集する。
【0028】
障害復旧部130は、障害影響範囲解析部111が解析した障害の影響範囲を回避する通信経路である回避経路を算出する。そして、障害復旧部130は、ネットワークにおいて、算出した回避経路を構成するネットワーク機器が備える経路テーブルを、通信装置988を介して設定更新する。これにより、通信経路が変更される。ここで、経路テーブルとは、各ネットワーク機器が備えるテーブルで、通信経路情報を記憶するものである。また、障害復旧部130は、算出した回避経路を構成するネットワーク機器が備える経路テーブルに限らず、ネットワークに存在する他の機器が備える経路テーブルを設定更新しても構わない。
【0029】
診断ファイル記憶部150は、障害機器情報に対応する障害の原因を示す障害原因情報を有する診断ファイルを記憶装置984に記憶する。例えば、診断ファイル記憶部150は、ネットワークの管理者が障害発生時に障害情報とその原因を規定することにより、診断ファイルを記憶装置984に記憶する。
【0030】
ネットワーク監視装置200は、ネットワーク全体を監視する。つまり、ネットワーク監視装置200は、ネットワーク監視支援装置100が監視する範囲と同等または広い、あるいは、上位のネットワークを監視する。
【0031】
ルータ群400は、ネットワークを構成するネットワーク機器である複数のルータである。ルータ群400は、単数であっても構わない。また、ルータ群400は、ルータに限らず、モデム、スイッチ、その他のコンピュータなどの機器であっても構わない。
【0032】
次に、図4に基づき診断ファイルについて説明する。図4は、診断ファイル記憶部150が記憶する診断ファイルの一例である。
診断ファイルは、診断キーワード1、診断キーワード2、障害原因を備える。ここで、診断キーワード1は、障害機器情報に含まれるキーワードとなり得る情報である。診断キーワード2は、診断キーワード1に対応した数値である。障害原因は、診断キーワード1、2に対応した障害の原因を示す情報である。
例えば、障害原因解析部112は、取得した情報中に図4の診断キーワード1が含まれている場合は、それに対応した診断キーワード2を参照する。障害原因解析部112は、診断キーワード2がない場合には、診断キーワード1に対応した障害原因に記述されている情報を障害原因と診断する。また、障害原因解析部112は、診断キーワード1に対応する診断キーワード2がある場合には、取得した情報中の数値情報が診断キーワード2に記載されている数値を超えているか否かを判定する。障害原因解析部112は、取得した情報中の数値情報が診断キーワード2に記載されている数値を超えている場合、それに対応する情報を障害原因と診断する。
つまり、具体的には、障害原因解析部112は、障害機器情報にshutdownという文字列が含まれている場合、診断キーワード1からshutdownを検索して、それに対応した障害原因を特定する。そして、障害原因解析部112は、障害の原因はルータの停止であると診断する。また、例えば、障害原因解析部112は、障害機器情報にCPUという文字列が含まれている場合、診断キーワード1からCPUを検索する。次に、障害原因解析部112は、障害機器情報からCPUの使用率を取得し、診断キーワード1のCPUに対応した診断キーワード2と比較する。次に、障害原因解析部112は、CPUの使用率が診断キーワード2の数値よりも大きい場合、それに対応した障害原因を特定する。そして、障害原因解析部112は、障害の原因はルータ高負荷であると診断する。
ここで、診断ファイルは、診断キーワード1毎に診断キーワード2をどのように使用するかを判断するためのキーワード2使用情報を記憶していても構わない。つまり、キーワード2使用情報は、例えば、診断キーワード1がshutdownの場合には、診断キーワード2は使用しないという情報である。また、キーワード2使用情報は、例えば、診断キーワード1がCPUの場合には、CPUの使用率が診断キーワード2より大きいことを判定するという情報である。
【0033】
次に、図5に基づきネットワーク監視支援装置100の動作について説明する。図5は、ネットワーク監視支援装置100の動作である障害復旧処理を示すフローチャートである。障害復旧処理は、ネットワーク監視支援方法、および、ネットワーク監視支援プログラムの処理の一例である。
【0034】
まず、監視ステップ(S100)では、機器監視部120は、定期的に監視対象のネットワーク機器であるルータ群400を監視する。次に、第1応答確認ステップ(S101)では、機器監視部120は、該当ネットワーク機器からの応答を確認する。該当ネットワーク機器からの応答があった場合(S101でYes)、機器監視部120は、(S100)へ戻り、次の監視対象のネットワーク機器からの応答を確認する。一方、該当ネットワーク機器からの応答がない場合(S101でNo)、機器監視部120は、(S102)へ進む。次に、障害検出ステップ(S102)では、機器監視部120は、応答がない機器を障害が発生している障害機器であると判定する。次に、第2応答確認ステップ(S103)では、機器監視部120は、障害と判定した障害機器に対して応答があるまで監視し続ける。障害機器から応答があった場合(S103でYes)、機器監視部120は、(S105)へ進む。一方、障害機器から応答がない場合(S103でNo)、機器監視部120は、(S104)へ進む。待ちステップ(S104)では、障害機器からの応答が一定時間ないか否かを判定する。一定時間経過した場合(S104でYes)、(S110)へ進む。一方、一定時間経過していない場合(S104でNo)、機器監視部120は、(S103)へ戻り、改めて障害機器からの応答を監視する。次に、障害機器情報取得ステップ(S105)では、機器監視部120は障害機器にログインし障害機器情報を収集する。
ここで、(S100)から(S105)までは、機器監視ステップである。
【0035】
次に、障害原因解析ステップ(S106)では、障害原因解析部112は、機器監視部120が取得した障害情報と診断ファイル記憶部150が記憶した診断ファイルに記述されている情報に基づき障害原因を診断する。そして、障害原因解析部112は、ネットワーク監視装置200へ障害原因を通知する。
【0036】
次に、トポロジ情報取得ステップ(S107)では、障害影響範囲解析部111は、ネットワーク監視装置200から監視ネットワークのトポロジ情報を取得する。そして、影響範囲解析ステップ(S108)では、障害影響範囲解析部111は、障害機器に隣接するネットワーク機器の情報を解析して障害の影響範囲を特定する。
(S107)と(S108)とは、障害影響範囲解析ステップである。
【0037】
次に、障害復旧ステップ(S109)では、障害復旧部130は、各ネットワーク機器から障害機器を経由しない通信経路である回避経路(迂回経路)を算出する。障害復旧部130が回避経路を算出する方法については後述する。そして、障害復旧部130は、算出した回避経路に基づいて、障害ネットワーク機器に隣接する機器など関連するネットワーク機器の通信経路情報(テーブル)を更新する。これにより、通信経路が変更される。
【0038】
一方、障害通知ステップ(S110)で、機器監視部120は、障害としてネットワーク監視装置200へ通知する。
【0039】
つまり、実施の形態1にかかるネットワーク監視支援装置100は、例えば定期的に監視対象のネットワーク機器であるルータ群400を機器監視部120にて監視する。そして、機器監視部120は、応答がない機器が見つかった場合は、該当機器に対して応答があるまで監視し続ける。機器監視部120は、その後に応答があれば、該当機器からの情報を取得する。次に、障害原因解析部112によって原因を診断する。また、障害影響範囲解析部111は障害の影響範囲を特定する。そして、障害機器に隣接するネットワーク機器の障害の影響範囲に基づいて、障害復旧部130は通信経路を変更する。
【0040】
次に図6に基づき障害復旧部130が回避経路を算出する方法について説明する。図6は、障害復旧部130が回避経路を算出する処理の一例を示す図である。
図6において、各ルータからルータ4への通信を例として説明する。ここで、ルータ1からルータ4への通信経路は、通常、ルータ2、ルータ3を経由するものであるとする。また、ルータ2からルータ4への通信経路は、通常、ルータ3を経由するものであるとする。また、ルータ5からルータ4への通信経路は、通常、ルータ6を経由するものであるとする。また、ルータ3、ルータ6は、ルータ4へ直接通信するものであるとする。ここで、ルータ3に障害が発生したとする。障害復旧部130は、隣接ルータであるルータ2からのルータ3への通信経路、および、隣接ルータであるルータ4からルータ3への通信経路を無効とする。そして、ルータ1からルータ4への通信には、ルータ1からルータ5、ルータ6を経由する経路を回避経路として算出する。さらに、ルータ2からルータ4への通信には、ルータ1、ルータ5、ルータ6を経由する経路を回避経路として算出する。したがって、この例では、ルータ3の障害によってルータ4への通信に影響を受けるのは、ルータ1とルータ2となる。障害復旧部130は、ルータ1、ルータ2の通信経路情報を更新することで、ルータ1、ルータ2の通信経路の変更を実現する。
【0041】
なお、経路の算出方法には、最短路、最短距離を求めるアルゴリズムであるダイクストラ法など既存方式を利用してもよい。
【0042】
以上のように、実施の形態1にかかるネットワーク監視支援装置100は、機器監視部120において定期的なネットワーク機器の監視をする。そして、機器監視部120は、障害発生を判定して該当機器からの情報を収集する。障害原因解析部112は、収集した情報と診断ファイルとを合わせてネットワーク情報を解析する。そのため、実施の形態1にかかるネットワーク監視支援装置100は、ネットワーク管理者など人の手によらずに障害の原因を特定することができる。これにより、ネットワーク管理者の障害解析の手間を省き、作業負荷を軽減することができる。
【0043】
また、実施の形態1にかかるネットワーク監視支援装置100は、障害影響範囲解析部111によって障害の影響範囲を解析し、障害復旧部130により障害機器を回避する通信経路に変更することでシステム全体の障害を回復することができる。これにより、実施の形態1にかかるネットワーク監視支援装置100は、障害原因の特定だけでなく、障害の復旧も可能になる。そのため、実施の形態1にかかるネットワーク監視支援装置100は、ネットワーク管理者の障害復旧作業の負荷を軽減することができる。さらに、実施の形態1にかかるネットワーク監視支援装置100は、障害判定時に速やかに、障害復旧部130にて回避経路算出し、障害ネットワーク機器に隣接するネットワーク機器など影響を受ける機器の通信経路情報を回避経路で更新する。そのため、実施の形態1にかかるネットワーク監視支援装置100は、ルーティングプロトコルなどによる障害回復よりも高速に復旧することが可能となる。
【0044】
ここで、実施の形態1にかかるネットワーク監視支援装置100をまとめると以下のようになる。
【0045】
実施の形態1にかかるネットワーク監視支援装置100は、障害が見つかったときは障害箇所を診断し、影響範囲を回避して経路を変更する装置構成であることを特徴とする。
【0046】
また、実施の形態1にかかるネットワーク監視支援装置100は、定期的に監視対象のネットワーク機器を監視することで、応答がない機器が見つかった場合は、該当機器に対して応答があるまで監視し続け、その後に応答があれば、該当機器からの情報を取得し、原因を診断するネットワーク監視支援装置100において、
監視対象のネットワーク機器を定期的に監視する機器監視部120と、ネットワークの管理者が障害発生時に障害情報とその原因を規定する診断ファイルと、診断ファイルに基づき、収集した機器の情報を解析し、障害原因を診断する障害原因解析部112と、障害機器に隣接するネットワーク機器の影響範囲を特定する障害影響範囲解析部111とからなる障害診断部110と、解析した障害影響範囲を回避する通信経路を算出し、算出したネットワークを構成するネットワーク機器の経路テーブルを更新することで通信経路を変更する障害復旧部130と、を備えたことを特徴とする。
【0047】
さらに、実施の形態1にかかるネットワーク監視支援装置100は、定期的にネットワーク機器の応答の有無を機器監視部120によって監視することにより、応答のない機器が見つかった場合は、該当機器に対して応答があるまで監視し続け、その後の応答回復時に該当機器から情報を取得し、取得した情報とネットワークの管理者が障害発生時の障害情報およびその原因を規定する診断ファイルとを障害原因解析部112によって比較解析することにより、障害を診断する。さらに、上位ネットワーク監視装置から取得したネットワークトポロジに基づき、障害原因のネットワーク機器に関連する障害の影響範囲を障害影響範囲解析部111によって解析し、解析した情報から障害の影響範囲を回避する通信経路を障害復旧部130によって算出し、算出した結果をネットワーク機器の経路テーブルに設定することにより、障害診断と通信経路を変更することによって障害回復を行うことを特徴とする。
【0048】
実施の形態2.
次に、実施の形態2について説明する。実施の形態2では、トラフィックの利用状況に基づいた回避経路を算出して、通信帯域に余裕のある通信経路へ変更するネットワーク監視支援装置100について説明する。
【0049】
従来、ネットワーク機器からトラフィック情報を取得し、分析したトラフィック情報に基づいて管理対象のネットワーク機器のポリシー情報であるQoS(Quality of Service)やセキュリティ情報の設定を行うことを可能するネットワーク監視装置がある。これは、情報収集の効率化と設定の高速化により、障害発生を未然に防ぐ手法である。しかしながら、情報収集とネットワーク機器のポリシー変更機能に着目した手法のため、障害発生後の障害復旧やネットワーク機器のトラフィック以外のCPUの利用率やキュー長などの負荷に関しては考慮されていない。そのため、最適な通信経路の設定には不十分であるという課題がある。また、障害検出時の障害原因の診断ができないこと、および、障害の復旧には人手を要すという課題もある。
【0050】
そこで、まず、実施の形態2では、障害発生時にネットワーク機器から収集した情報に基づいて、経路変更の際に障害発生箇所を回避するだけでなく、トラフィックの利用状況に応じた経路を算出する。これにより、通信帯域に余裕のある経路を設定し、ネットワーク復旧時に効率の良い通信経路を確立することを目的とする。
【0051】
さらに、実施の形態3では、通信経路変更の際にトラフィックの利用状況で経路を算出するのではなく、CPU利用率などネットワークの負荷に基づいて経路を算出し、負荷の低いネットワーク機器からなる通信経路を設定することにより、効率の良い通信経路を確立することを目的とする。
【0052】
そして、さらに、実施の形態4では、トラフィックの利用状況、および、CPU利用率などネットワークの負荷に基づいて経路を算出し、より効率の良い通信経路の確立することを目的とする。
【0053】
実施の形態1では、定期的にネットワークに存在する機器を監視することにより、障害検出時に通信経路を変更するネットワーク監視支援装置100について説明した。それに加え、実施の形態2では、通信経路変更時において、障害復旧部130がネットワークのトラフィックの利用状況に基づいて回避経路を算出するネットワーク監視支援装置100の動作について説明する。
【0054】
実施の形態2にかかるネットワーク監視支援装置100の機能は、実施の形態1にかかるネットワーク監視支援装置100の機能と概ね同様である。そこで、実施の形態2にかかるネットワーク監視支援装置100の機能について、図3に基づき、実施の形態1にかかるネットワーク監視支援装置100の機能と異なる部分についてのみ説明する。
【0055】
機器監視部120は、さらに、ネットワークに存在する所定の機器の負荷情報を収集する。ここでは、負荷情報として、ネットワークのトラフィックの利用情報を取得する。
障害復旧部130は、ネットワークに存在する所定の機器の負荷情報に基づき回避経路を算出する。ネットワークに存在する所定の機器の負荷情報とは、ここではトラフィックの利用情報である。つまり、障害復旧部130は、トラフィックの利用情報に基づきトラフィックの利用状況の低い通信経路を算出する。また、障害復旧部130は、例えば、算出した回避経路が複数ある場合、トラフィックの利用状況に基づき回避経路を選択するとしても構わない。
【0056】
次に、図7に基づき実施の形態2にかかるネットワーク監視支援装置100の動作について説明する。図7は、実施の形態2にかかるネットワーク監視支援装置100の動作である障害復旧処理を示すフローチャートである。障害復旧処理は、ネットワーク監視支援方法、および、ネットワーク監視支援プログラムの処理の一例である。
【0057】
(S200)から(S208)までは、実施の形態1の(S100)から(S108)までと同様である。つまり、機器監視部120は、所定の機器について定期的な監視を行う。そして、機器監視部120は、応答がない機器が見つかった場合には、その後の応答回復したときに、障害機器情報を取得する。また、障害原因解析部112は障害原因を診断する。さらに、障害影響範囲解析部111は、障害の影響範囲を特定する。
【0058】
次に、回避経路算出ステップ(S209)では、障害復旧部130は、各ネットワーク機器から障害機器を経由しない通信経路である回避経路を算出する。
【0059】
次に、経路数判定ステップ(S210)では、障害復旧部130は、算出した回避経路が複数存在するか否かを判定する。回避経路が複数存在する場合(S210でYes)、障害復旧部130は、(S211)へ進む。回避経路が複数存在しない場合(S210でNo)、障害復旧部130は、算出した回避経路に基づいて、通信経路情報を更新する。
【0060】
次に、回避経路選択ステップ(S211)では、機器監視部120は、ネットワークのトラフィックの利用情報を収集する。また、障害復旧部130は、トラフィックの利用状況に基づき回避経路を算出する。例えば、障害復旧部130は、トラフィックの利用状況が低い経路を選択する。
ここで、(S209)から(S211)までは、障害復旧ステップである。
【0061】
(S212)は、(S110)と同様である。
【0062】
次に、図8に基づき障害復旧部130がトラフィックの利用状況が低い回避経路を算出する方法について説明する。図8は、障害復旧部130が回避経路を算出する処理の一例を示す図である。
図8において、ルータ1からルータ4への通信を例として説明する。ルータ1からルータ4への通信経路は、通常、ルータ2、ルータ3を経由するものであるとする。ここで、ルータ3に障害が発生したとする。障害復旧部130は、ルータ1からルータ4への通信にはルータ1からルータ5、ルータ6を経由する回避経路とルータ1からルータ2、ルータ5、ルータ6を経由する回避経路とが算出できる。障害復旧部130は、例えば、ルータ1、ルータ2、ルータ5の情報から送信および受信キューのキュー長を解析することなどにより、ルータ1からルータ2を経由する通信経路またはルータ1からルータ5を経由する通信経路のどちらの経路の方がトラフィックの利用状況が低いか判定できる。この例では、ルータ3の障害によって通信経路をルータ1からルータ2、ルータ5、ルータ6を経由する回避経路へ変更する。
【0063】
以上のように、実施の形態2にかかるネットワーク監視支援装置100は、障害発生時にネットワーク機器から収集した情報に基づいて、経路変更の際に障害発生箇所を回避するだけでなく、トラフィックの利用状況に応じた経路を算出する。したがって、実施の形態2にかかるネットワーク監視支援装置100は、通信帯域に余裕のある経路を設定し、ネットワーク復旧時に効率の良い通信経路を確立することができる。
【0064】
実施の形態3.
次に、実施の形態3について説明する。実施の形態3では、CPU利用率などネットワーク機器の負荷に基づいた回避経路を算出して、ネットワーク機器の処理量に余裕のある通信経路へ変更するネットワーク監視支援装置100について説明する。
【0065】
実施の形態2では、障害復旧部130はトラフィックの利用状況に基づいて回避経路を算出した。実施の形態3では、通信経路変更時において、障害復旧部130がCPU利用率やメモリの使用量などネットワーク機器の負荷に基づいて回避経路を算出するネットワーク監視支援装置100の動作について説明する。
【0066】
実施の形態3にかかるネットワーク監視支援装置100の機能は、実施の形態2にかかるネットワーク監視支援装置100の機能と概ね同様である。そこで、実施の形態3にかかるネットワーク監視支援装置100の機能について、図3に基づき、実施の形態2にかかるネットワーク監視支援装置100の機能と異なる部分についてのみ説明する。
【0067】
機器監視部120は、負荷情報として、CPU利用率やメモリの使用量などネットワーク機器の負荷を取得する。
障害復旧部130は、CPU利用率やメモリの使用量などの負荷に基づきネットワーク機器の負荷の低い通信経路を算出する。また、障害復旧部130は、例えば、算出した回避経路が複数ある場合、CPU利用率やメモリの使用量など負荷に基づき回避経路を選択するとしても構わない。
【0068】
次に、実施の形態3にかかるネットワーク監視支援装置100の動作について説明する。実施の形態3にかかるネットワーク監視支援装置100の動作は、実施の形態2にかかるネットワーク監視支援装置100の動作と概ね同様である。そこで、実施の形態3にかかるネットワーク監視支援装置100の動作について、図7に基づき実施の形態2にかかるネットワーク監視支援装置100の動作と異なる部分のみ説明する。
【0069】
(S200)から(S210)までは、実施の形態2にかかるネットワーク監視支援装置100の動作と同様である。
【0070】
回避経路選択ステップ(S211)では、機器監視部120は、CPU利用率やメモリ使用量などの負荷情報を収集する。また、障害復旧部130は、CPU利用率やメモリ使用量などの負荷情報に基づき回避経路を算出する。例えば、障害復旧部130は、CPU利用率やメモリ使用量などの負荷が低い経路を選択する。
【0071】
(S212)は、実施の形態2にかかるネットワーク監視支援装置100の動作と同様である。
【0072】
次に、図9に基づき障害復旧部130がCPU利用率やメモリ使用量などの負荷が低い回避経路を算出する方法について説明する。図9は、障害復旧部130が回避経路を算出する処理の一例を示す図である。
図9において、ルータ1からルータ4への通信を例として説明する。ルータ1からルータ4への通信経路は、通常、ルータ2、ルータ3を経由するものであるとする。ここで、ルータ3に障害が発生したとする。障害復旧部130は、ルータ1からルータ4への通信にはルータ1からルータ5、ルータ6を経由する回避経路と、ルータ1からルータ2、ルータ5、ルータ6を経由する回避経路と、ルータ1からルータ2、ルータ6を経由する回避経路とが算出できる。障害復旧部130は、例えば、ルータ2およびルータ5の情報からCPU利用率やメモリ使用量を解析することにより、ルータ1からルータ2を経由する通信経路またはルータ1からルータ5を経由する通信経路のどちらが負荷の低い通信経路であるか判定できる。この例では、ルータ3の障害によって通信経路をルータ1からルータ5、ルータ6を経由する回避経路へ変更する。
【0073】
以上のように、実施の形態3にかかるネットワーク監視支援装置100は、障害発生時にネットワーク機器から収集した情報に基づいて、経路変更の際に障害発生箇所を回避するだけでなく、CPU利用率などネットワーク機器の負荷に応じた経路を算出する。したがって、実施の形態3にかかるネットワーク監視支援装置100は、負荷の低いネットワーク機器からなる経路を設定し、ネットワーク復旧時に効率の良い通信経路を確立することができる。
【0074】
実施の形態4.
次に、実施の形態4について説明する。実施の形態4では、トラフィックの利用状況やCPU利用率などネットワーク機器の負荷を合わせて考慮して回避経路を算出するネットワーク監視支援装置100について説明する。
【0075】
実施の形態2では、障害復旧部130はトラフィックの利用状況に基づいて回避経路を算出した。また、実施の形態3では、障害復旧部130はCPU利用率やメモリの使用量などネットワーク機器の負荷に基づいて回避経路を算出した。実施の形態4では、通信経路変更時において、障害復旧部130がトラフィックの利用状況とCPU利用率やメモリの使用量などネットワーク機器の負荷に基づいて回避経路を算出するネットワーク監視支援装置100の動作について説明する。
【0076】
実施の形態4にかかるネットワーク監視支援装置100の機能は、実施の形態2にかかるネットワーク監視支援装置100の機能と概ね同様である。そこで、実施の形態4にかかるネットワーク監視支援装置100の機能について、図3に基づき、実施の形態2にかかるネットワーク監視支援装置100の機能と異なる部分についてのみ説明する。
【0077】
機器監視部120は、負荷情報として、ネットワークのトラフィックの利用情報、および、CPU利用率やメモリの使用量などネットワーク機器の負荷を取得する。
障害復旧部130は、ネットワークのトラフィックの利用情報、および、CPU利用率やメモリの使用量などの負荷に基づきネットワーク機器の負荷の低い通信経路を算出する。また、障害復旧部130は、例えば、算出した回避経路が複数ある場合、ネットワークのトラフィックの利用情報、および、CPU利用率やメモリの使用量など負荷に基づき回避経路を選択するとしても構わない。
【0078】
次に、実施の形態4にかかるネットワーク監視支援装置100の動作について説明する。実施の形態4にかかるネットワーク監視支援装置100の動作は、実施の形態2にかかるネットワーク監視支援装置100の動作と概ね同様である。そこで、実施の形態4にかかるネットワーク監視支援装置100の動作について、図7に基づき実施の形態2にかかるネットワーク監視支援装置100の動作と異なる部分のみ説明する。
【0079】
(S200)から(S210)までは、実施の形態2にかかるネットワーク監視支援装置100の動作と同様である。
【0080】
回避経路選択ステップ(S211)では、機器監視部120は、ネットワークのトラフィックの利用情報、および、CPU利用率やメモリ使用量などの負荷情報を収集する。また、障害復旧部130は、ネットワークのトラフィックの利用情報、および、CPU利用率やメモリ使用量などの負荷情報に基づき回避経路を算出する。例えば、障害復旧部130は、ネットワークのトラフィックの利用状況が低く、かつ、CPU利用率やメモリ使用量などの負荷が低い経路を選択する。
【0081】
(S212)は、実施の形態2にかかるネットワーク監視支援装置100の動作と同様である。
【0082】
次に、図10に基づき障害復旧部130がトラフィックの利用状況が低く、かつ、CPU利用率やメモリ使用量などの負荷が低い回避経路を算出する方法について説明する。図10は、障害復旧部130が回避経路を算出する処理の一例を示す図である。
図10において、ルータ1からルータ4への通信を例として説明する。ルータ1からルータ4への通信経路は、通常、ルータ2、ルータ3を経由するものであるとする。ここで、ルータ3に障害が発生したとする。障害復旧部130は、ルータ1からルータ4への通信にはルータ1からルータ5、ルータ6を経由する回避経路と、ルータ1からルータ2、ルータ5、ルータ6を経由する回避経路と、ルータ1からルータ2、ルータ6を経由する回避経路とが算出できる。障害復旧部130は、例えば、まず、ルータ1、ルータ2、ルータ5、ルータ6の情報から送信および受信キューのキュー長を解析することにより、ルータ1−ルータ2間、ルータ1−ルータ5間のトラフィックを解析する。次に、障害復旧部130は、ルータ2、ルータ5の情報からCPU利用率やメモリ使用量を解析する。これにより、障害復旧部130は、ルータ1から次のルータへの経路が確定できる。この例ではルータ1−ルータ2間の経路が確定する。ここで、トラフィックの利用状況から算出した結果とネットワークの機器の負荷から算出した結果が異なるときは、どちらを優先するか優先度を決めることによって解決できる。次にルータ2−ルータ5間、ルータ2−ルータ6間のトラフィックとルータ5、ルータ6のネットワーク機器の負荷を解析することでルータ2から次のルータへの経路が確定できる。この例ではルータ2−6間の経路が確定する。この結果、ルータ3の障害によって通信経路をルータ1からルータ2、ルータ6を経由する回避経路へ変更する。
【0083】
以上のように、実施の形態4にかかるネットワーク監視支援装置100は、障害発生時にネットワーク機器から収集した情報に基づいて、経路変更の際に障害発生箇所を回避するだけでなく、トラフィックの利用状況と、CPU利用率などネットワーク機器の負荷に応じた経路を算出する。したがって、実施の形態2にかかるネットワーク監視支援装置100は、トラフィックの利用状況が低く、かつ、ネットワーク機器の負荷が低い経路を設定し、ネットワーク復旧時に効率の良い通信経路を確立することができる。
【0084】
ここで、実施の形態2〜4にかかるネットワーク監視支援装置100をまとめると以下のようになる。
【0085】
実施の形態2〜4にかかるネットワーク監視支援装置100は、トラフィックの利用状況やCPU利用率などネットワーク機器の負荷によって経路を変更する機能を備えることを特徴とする。
【0086】
また、実施の形態2〜4にかかるネットワーク監視支援装置100は、障害発生時または運用中において、障害原因解析部112によって解析したトラフィック情報やCPU利用率などの負荷情報と、上位のネットワーク監視装置200から取得したネットワークトポロジに基づき、トラフィックの利用状況や負荷に応じた経路を障害復旧部130によって算出し、算出した結果をネットワーク機器の経路テーブルに設定することにより、通信帯域に余裕のあるネットワークや処理負荷の低いネットワーク機器からなる経路を設定することで効率の良い通信経路を確立することを特徴とする。
【0087】
実施の形態5.
次に、実施の形態5について説明する。実施の形態5では、ネットワーク機器の情報を蓄積し、蓄積した情報を統計データとして利用するネットワーク監視支援装置100について説明する。
【0088】
実施の形態5では、運用中に取得したネットワーク機器情報を蓄積し、蓄積した情報を統計データとして利用する。これにより、時間や季節などに応じてネットワーク機器の負荷に特徴がある場合など、時間や季節などに応じた経路の算出することを目的とする。さらに、運用中に通信帯域に余裕があるネットワークや負荷の低いネットワーク機器からなる経路へ変更することで、効率の良い通信経路の確立と、障害発生の可能性を抑制することを目的とする。
【0089】
そこで、実施の形態2、3、4では、障害復旧部130がトラフィックの利用状況とCPU利用率やメモリの使用量などネットワーク機器の負荷に基づいて回避経路を算出した。さらに、実施の形態5では、機器監視部120が運用中に例えば定期的に取得したネットワーク機器の情報を蓄積する。蓄積した情報を統計情報として利用することで経路を算出するネットワーク監視支援装置100の動作について説明する。
【0090】
実施の形態5にかかるネットワーク監視支援装置100の機能は、実施の形態1にかかるネットワーク監視支援装置100の機能と概ね同様である。そこで、実施の形態5にかかるネットワーク監視支援装置100の機能について、図11に基づき、実施の形態1にかかるネットワーク監視支援装置100の機能と異なる部分についてのみ説明する。図11は、実施の形態5にかかるネットワーク監視支援装置100の機能を示す機能ブロック図である。
【0091】
機器監視部120は、所定の場合にネットワークに存在する所定の機器の負荷情報を収集する。所定の場合とは、例えば、定期的であっても、指示などがあった場合であっても構わない。
また、実施の形態5にかかるネットワーク監視支援装置100は、さらに、経路最適化部140、診断履歴情報記憶部160を備える。
経路最適化部140は、機器監視部120が取得したトラフィックの利用状況やCPU利用率などのネットワーク機器の負荷情報と、ネットワークトポロジに基づいてトラフィックの利用状況やCPUの利用率に応じた経路を算出する。つまり、経路最適化部140は、ネットワークトポロジ情報と後述する診断履歴情報記憶部160が記憶した負荷情報の履歴とに基づき通信経路を算出する。言い換えると、経路最適化部140は、診断履歴情報記憶部160が記憶した負荷情報の履歴を統計情報として利用し、効率の良い経路を算出する。例えば、経路最適化部140は、時間や季節などによってネットワーク機器の負荷が異なるなどの特徴を割り出し、効率の良い経路を算出する。そして、経路最適化部140は、算出した通信経路を所定の機器に通信装置988を介して設定する。ここで、所定の機器とは、例えば、機器監視部120が監視する機器すべてであっても、算出された経路が以前と異なる機器のみに限定するなどしても構わない。また、経路最適化部140は、ネットワークトポロジ情報をネットワーク監視装置200から直接取得しても、障害診断部110や機器監視部120がネットワーク監視装置200から取得したものを使用しても構わない。
診断履歴情報記憶部160は、機器監視部120が収集した負荷情報を履歴として記憶装置984に記憶する。負荷情報とは、例えば、トラフィックの利用状況やCPU利用率などのネットワーク機器の負荷情報である。また、診断履歴情報記憶部160は、機器監視部120が例えば定期的にネットワーク機器から取得して、障害原因解析部112が解析した負荷情報を蓄積しても構わない。診断履歴情報記憶部160が記憶する負荷情報の履歴については後述する。
【0092】
次に、図12に基づき実施の形態5にかかるネットワーク監視支援装置100の動作について説明する。図12は、実施の形態5にかかるネットワーク監視支援装置100の動作である経路最適化処理を示すフローチャートである。経路最適化処理は、ネットワーク監視支援方法、および、ネットワーク監視支援プログラムの処理の一例である。
【0093】
まず、トポロジ情報取得ステップ(S500)では、経路最適化部140は、ネットワーク監視装置200から監視ネットワークのトポロジ情報を取得する。次に、トポロジ比較ステップ(S501)では、経路最適化部140は、取得したネットワークのトポロジ情報と前回取得したトポロジ情報を比較する。そして、変更判定ステップ(S502)では、経路最適化部140は、トポロジ情報が変更されているか否かを判定する。トポロジ情報が変更されている場合(S502でYes)、経路最適化部140は、(S503)へ進む。一方、トポロジ情報が変更されていない場合(S502でNo)、経路最適化部140は、(S504)へ進む。次に、診断履歴更新ステップ(S503)では、経路最適化部140は、履歴を新規の情報として更新する。次に、障害原因解析ステップ(S504)では、機器監視部120は、ネットワークに存在する所定のネットワーク機器それぞれにログインして負荷情報を収集する。次に、診断履歴情報記憶ステップ(S505)では、診断履歴情報記憶部160は、経路最適化部140を介し、機器監視部120が収集した負荷情報を履歴情報として記憶装置984に記憶する。次に、最適経路算出ステップ(S506)では、経路最適化部140は、診断履歴情報記憶部160が記憶した履歴情報から各ネットワーク機器のデータを解析し、情報の変化を確認する。そして、経路最適化部140は、効率の良い経路を算出する。次に、経路変更確認ステップ(S507)では、経路最適化部140は、各ネットワーク機器の経路を変更すべきか否か判定する。経路を変更すべきである場合(S507でYes)、経路最適化部140は、(S508)へ進む。一方、経路を変更すべきでない場合(S507でNo)、経路最適化部140は、(S500)へ戻る。そして、経路変更ステップ(S508)では、経路最適化部140は、該当ネットワーク機器に隣接する機器などの関連するネットワーク機器の通信経路情報をステップS507で算出した通信経路に基づいて更新する。これにより、通信経路が変更される。
ここで、(S506)から(S508)までは、経路最適化ステップである。
【0094】
上記処理を例えば定期的に繰り返すことにより、ネットワーク機器の情報がさらに蓄積され、統計データとして利用可能となる。
【0095】
次に、図13に基づき経路最適化部140が統計情報を利用して効率的な経路を算出する方法の一例について説明する。図13は、診断履歴情報記憶部160が記憶した履歴情報である診断履歴情報の一例である。
図13は、診断履歴情報の一例として、05/10/01の10:00と05/10/14の10:00と05/11/01の10:00との各ルータのCPU使用率、メモリ使用量、トラフィック利用状況を示している。ここで、ルータ1の各負荷が05/10/01の10:00と05/11/01の10:00とにおいて、05/10/14の10:00よりも高い。このことから、ルータ1の各負荷は、月初においては高いことが予想される。この傾向が、同様に続くとすると次の月初においてもルータ1の負荷が高くなることが予想される。そこで、経路最適化部140は、月末にはルータ1を経由しない通信経路を算出して、設定することにより、月初においてはルータ1を経由しない経路を使用することができる。
【0096】
以上のように、実施の形態5にかかるネットワーク監視支援装置100は、運用中に取得したネットワーク機器情報を蓄積し、蓄積した情報を統計データとして利用する。そのため、実施の形態5にかかるネットワーク監視支援装置100は、時間や季節などによってネットワーク機器の負荷が異なるなどの特徴を割り出し、効率の良い経路を算出することができる。つまり、実施の形態5にかかるネットワーク監視支援装置100は、運用中に通信帯域に余裕のあるネットワークや負荷の低いネットワーク機器からなる経路へ変更し、効率の良い通信経路を確立と、障害発生の可能性を抑制することができる。
【0097】
ここで、実施の形態5にかかるネットワーク監視支援装置100をまとめると以下のようになる。
【0098】
実施の形態5にかかるネットワーク監視支援装置100は、運用中にトラフィックの利用状況やCPUの利用率を蓄積し、蓄積した統計データに基づいて運用中に負荷の低いネットワーク機器を利用した経路に変更する装置構成であることを特徴とする。
【0099】
また、実施の形態5にかかるネットワーク監視支援装置100は、定期的にネットワーク機器の情報を機器監視部120にて取得し、取得したトラフィックの利用状況やCPU利用率などのネットワーク機器の負荷情報を蓄積した診断履歴情報と、診断履歴情報である統計データと上位のネットワーク監視装置200から取得したネットワークトポロジに基づき、トラフィックの利用状況やCPUの利用率に応じた経路を算出する経路最適化部140と、を備えたことを特徴とする。
【0100】
さらに、実施の形態5にかかるネットワーク監視支援装置100は、定期的にネットワーク機器の情報を取得し、機器監視部120によって取得したトラフィックの利用状況やCPU利用率などのネットワーク機器の負荷情報を診断履歴情報に蓄積することで、診断履歴情報を統計データとして利用し、上位のネットワーク監視装置200から取得したネットワークトポロジにしたがって、時間や季節等においてネットワーク機器の負荷に応じた経路を経路最適化部140によって算出し、運用中に算出した結果から時間や季節等に応じてあらかじめネットワーク機器の経路テーブルに設定することにより、通信帯域に余裕のあるネットワークや負荷の低いネットワーク機器からなる経路を設定することで効率の良い通信経路を確立し、障害発生の可能性を抑制することを特徴とする。
【0101】
実施の形態6.
次に、実施の形態6について説明する。実施の形態6では、応答のない機器が見つかった場合、応答のない原因がネットワーク上の問題なのか、ネットワーク機器の問題なのか特定するネットワーク監視支援装置100について説明する。実施の形態6では、特に、ネットワークがリニア構成の場合について説明する。
【0102】
従来、例えば、SNMPのポーリングを用いてネットワーク機器の情報を収集するネットワーク監視システムがある。また、該当機器の状態変化を部品単位で検出することにより、故障した部品の障害を特定するネットワーク監視システムがある。これらのネットワーク監視システムは、狭帯域のネットワークにおいても障害発生時の集中的な情報収集を回避しつつ、他のネットワーク機器への監視を可能にする。しかし、これは、ネットワーク機器の情報収集機能の効率向上に関する手法である。そのため、障害検出後の障害復旧には人手を要すという課題がある。また、ネットワーク機器の課題に関しては検出可能であるが、ネットワーク機器の情報による障害診断のため、ネットワーク上の障害については診断することができないという課題がある。
【0103】
そこで、実施の形態6、7では、例えば、定期的にネットワーク機器の応答を監視して、所定の時間応答がない場合、障害の原因がネットワーク上の課題なのか、接続先のネットワーク機器の課題なのか特定することを目的とする。これにより、障害発生箇所を特定して、ネットワークの保守員の負荷を軽減することを目的とする。
【0104】
そこで、実施の形態6では、応答のない機器が見つかった場合に、応答のない原因がネットワーク上の問題なのか、ネットワーク機器の問題なのか特定する動作について説明する。特に、ネットワークがリニア構成の場合について説明する。
【0105】
実施の形態6にかかるネットワーク監視支援装置100の機能は、実施の形態1にかかるネットワーク監視支援装置100の機能と概ね同様である。そこで、実施の形態6にかかるネットワーク監視支援装置100の機能について、図3に基づき、実施の形態1にかかるネットワーク監視支援装置100の機能と異なる部分についてのみ説明する。
【0106】
障害原因解析部112は、障害機器への通信経路を解析して障害機器に隣接する機器である隣接機器を特定する。また、障害原因解析部112は、特定した隣接機器の情報を取得して障害の原因を診断する。障害原因解析部112は、例えば、隣接機器の情報に基づき障害機器へネットワークが物理的に接続されているか否かなどを判定する。
【0107】
次に、図14に基づき実施の形態6にかかるネットワーク監視支援装置100の動作について説明する。図14は、実施の形態6にかかるネットワーク監視支援装置100の動作である障害原因解析処理を示すフローチャートである。障害原因解析処理は、ネットワーク監視支援方法、および、ネットワーク監視支援プログラムの処理の一例である。
【0108】
まず、監視ステップ(S600)では、機器監視部120は、例えば定期的に監視対象のネットワーク機器であるルータ群400を監視する。次に、応答確認ステップ(S601)では、機器監視部120は、該当ネットワーク機器からの応答を確認する。該当ネットワーク機器からの応答があった場合(S601でYes)、機器監視部120は、(S600)へ戻り、次の監視対象のネットワーク機器からの応答を確認する。一方、該当ネットワーク機器からの応答がない場合(S601でNo)、機器監視部120は、(S602)へ進む。障害検出ステップ(S602)では、機器監視部120は、応答がない機器を障害が発生している障害機器であると判定する。
ここで、(S600)から(S602)までは、機器監視ステップである。
【0109】
次に、経路調査(障害原因解析)ステップ(S603)では、障害原因解析部112は、障害と判断した機器への通信経路を調査する。通信経路の調査には、既存の方式によって確認できる。障害原因解析部112は、例えば、Linuxなどの場合、tracerouteコマンドによって確認できる。次に、隣接機器情報取得(機器監視)ステップ(S604)では、機器監視部120は、通信経路の調査結果を解析して、障害と判断した障害機器に最も近いネットワーク機器を特定する。機器監視部120は、特定したネットワーク機器に対してログインして情報を収集する。次に、接続状態確認(障害原因解析)ステップ(S605)では、障害原因解析部112は、取得したネットワーク機器の情報からネットワークの物理的な接続状態を確認する。この結果、物理的(電気的)にネットワークにつながっている場合、障害原因解析部112は、相手先ネットワーク機器の障害であると判定する。一方、ネットワークがつながっていない場合、障害原因解析部112は、ネットワーク上の障害または相手先ネットワーク機器の障害であると判定する。そして、障害通知ステップ(S606)では、障害原因解析部112は、障害原因をネットワーク監視装置200へ通知する。
【0110】
次に、図15に基づき機器監視部120が障害機器に最も近いネットワーク機器を特定する方法について説明する。さらに、図15に基づき障害原因解析部112が障害の原因を判定する方法について説明する。図15は、リニア型ネットワーク構成の一例である。
機器監視部120は、障害原因解析部112が調査した通信経路を辿ることで、障害発生のネットワーク機器に最も近いネットワーク機器を特定できる。つまり、機器監視部120は、ルータ1、ルータ2、ルータ3の順で辿ることで、障害発生のネットワーク機器に最も近いネットワーク機器はルータ2であると特定する。
障害原因解析部112は、例えば、障害機器であるルータ2のSNMPのlinkupまたはlinkdownの情報を解析することにより、ネットワークの接続状態を確認できる。つまり、障害原因解析部112は、物理的な接続が異常であれば、ネットワークの障害またはルータ3の機器の障害と判断する。一方、物理的な接続が正常であれば、物理層より上のプロトコルによる通信に異常があるため、ルータ3の機器の障害と判断できる。
【0111】
以上のように、実施の形態6にかかるネットワーク監視支援装置100は、機器監視部120において定期的なネットワーク機器の監視を行う。障害原因解析部112は、所定の時間応答がない場合、該当機器までのネットワーク経路を解析して、最も該当機器に近いネットワーク機器の情報を取得する。そして、障害原因解析部112は、ネットワーク構成がリニア型の場合には、物理的にネットワークが接続されているかを確認し、障害の原因が接続先ネットワーク機器の問題であるか特定することができる。これにより、障害発生箇所が限定でき、ネットワークの保守員の負荷が軽減される。
【0112】
ここで、実施の形態6にかかるネットワーク監視支援装置100をまとめると以下のようになる。
【0113】
実施の形態6にかかるネットワーク監視支援装置100は、監視装置と監視対象のネットワーク機器間の通信が無応答のとき、Tracerouteやネットワークトポロジ情報を利用し、最も監視対象のネットワーク機器に近い機器を特定し、該当機器の情報(linkup,linkdownなど)を収集することにより、無応答の原因が該当機器の先に接続しているネットワーク上の問題か、相手先ネットワーク機器の問題かを特定する機能を備えることを特徴とする。
【0114】
また、実施の形態6にかかるネットワーク監視支援装置100は、定期的にネットワーク機器の応答の有無を機器監視部120によって監視することにより、応答のない機器が見つかった場合は、該当機器に対して応答があるまで監視し続け、応答が回復しない時に、該当機器までのネットワーク経路を障害原因解析部112によって解析し、解析の結果、最も該当機器に近いネットワーク機器の情報を取得することで、障害原因を障害原因解析部112によって診断する。このとき、物理的にネットワークが接続されているかを確認し、障害の原因がネットワーク上の問題なのか、接続先のネットワーク機器の問題なのか特定することを特徴とする。
【0115】
実施の形態7.
次に、実施の形態7について説明する。実施の形態7では、実施の形態6と同様、応答のない機器が見つかった場合、応答のない原因がネットワーク上の問題なのか、ネットワーク機器の問題なのか特定するネットワーク監視支援装置100について説明する。実施の形態7では、特に、ネットワークがメッシュ構成およびリング構成の場合について説明する。
【0116】
実施の形態6では、ネットワーク構成がリニア型の場合について説明した。実施の形態7では、障害原因解析部112にてネットワーク構成がメッシュ型またはリング型のときに障害原因を特定する動作について説明する。
【0117】
実施の形態7にかかるネットワーク監視支援装置100の機能は、実施の形態6にかかるネットワーク監視支援装置100の機能と同様である。
【0118】
次に、実施の形態7にかかるネットワーク監視支援装置100の動作について説明する。実施の形態7にかかるネットワーク監視支援装置100の動作は、実施の形態6にかかるネットワーク監視支援装置100の動作と概ね同様である。そこで、実施の形態7にかかるネットワーク監視支援装置100の動作について、図14に基づき実施の形態6にかかるネットワーク監視支援装置100の動作と異なる部分についてのみ説明する。
【0119】
(S600)から(S602)までは、実施の形態6にかかるネットワーク監視支援装置100の動作と同様である。
【0120】
次に、経路調査(障害原因解析)ステップ(S603)では、障害影響範囲解析部111は、ネットワーク監視装置200から監視ネットワークのトポロジ情報を取得する。そして、障害影響範囲解析部111は、トポロジ情報に基づき通信経路を解析して障害と判断した機器に最も近いネットワーク機器を特定する。障害と判断した機器に最も近いネットワーク機器の特定の方法については後述する。
【0121】
(S604)については、実施の形態6にかかるネットワーク監視支援装置100の動作と同様である。
【0122】
次に、接続状態確認(障害原因解析)ステップ(S605)では、障害原因解析部112は、取得したネットワーク機器の情報からネットワークの物理的な接続状態を確認する。この結果、物理的にネットワークにつながっている場合、障害原因解析部112は、相手先ネットワーク機器の障害であると判定する。一方、ネットワークがつながっていない場合、障害原因解析部112は、ネットワーク上の障害または相手先ネットワーク機器の障害であると判定する。さらに、隣接したネットワーク機器が複数ある場合、障害原因解析部112は、それらの機器も同様に確認することで、他の経路からの接続が正常であれば、障害と診断した経路のネットワーク上の問題であると判断する。障害の原因を判定する方法については後述する。
【0123】
そして、障害通知ステップ(S606)では、障害原因解析部112は、障害原因をネットワーク監視装置200へ通知する。
【0124】
次に、図6、図16に基づき機器監視部120が障害機器に最も近いネットワーク機器を特定する方法について説明する。さらに、図6、図16に基づき障害原因解析部112が障害の原因を判定する方法について説明する。図6は、リング型ネットワーク構成の一例である。図16は、メッシュ型ネットワーク構成の一例である。
まず、図6に示すリング型ネットワーク構成の例では、監視ネットワークのトポロジ情報に基づき障害原因解析部112が調査した通信経路を機器監視部120が辿ることで、障害発生のネットワーク機器に最も近いネットワーク機器を特定できる。つまり、機器監視部120は、ルータ1、ルータ2、ルータ3の順で辿ることでルータ2を該当するネットワーク機器であると特定し、ルータ1、ルータ5、ルータ6、ルータ4、ルータ3の順で辿ることでルータ4を該当するネットワーク機器であると特定する。したがって、機器監視部120は、ルータ2およびルータ4の情報を収集する。
次に、図16に示すメッシュ型ネットワーク構成の例でも同様に、監視ネットワークのトポロジ情報に基づき障害原因解析部112が調査した通信経路を機器監視部120が辿ることで、障害発生のネットワーク機器に最も近いネットワーク機器を特定できる。つまり、機器監視部120は、例えば、ルータ1、ルータ2、ルータ3の順で辿ることでルータ2を該当するネットワーク機器であると特定し、ルータ1、ルータ5、ルータ6、ルータ4、ルータ3の順で辿ることでルータ4を該当するネットワーク機器であると特定し、ルータ1、ルータ5、ルータ6、ルータ3の順で辿ることでルータ6を該当するネットワーク機器であると特定する。したがって、機器監視部120は、ルータ2、ルータ4、ルータ6の情報を収集する。
そして、図3のリング型ネットワーク構成の例では、障害原因解析部112は、例えば、障害機器であるルータ2およびルータ4から取得した情報のSNMPのlinkupまたはlinkdownの情報を解析することにより、ネットワークの接続状態を確認できる。つまり、障害原因解析部112は、ルータ2の物理的な接続状態が異常で、かつ、ルータ4経由のルータ3の定期的な監視を含めた全ての接続が正常の場合、ルータ2−ルータ3間のネットワーク上の異常またはルータ2と接続しているルータ3のインタフェースの障害と判定する。両者の物理的な接続が異常のときは、ルータ3の機器の障害と判定できる。両者の物理的な接続が正常で、かつ、ルータ4を経由してルータ3の定期的な監視も可能である場合は、物理層より上のプロトコルによる通信に異常があるため、ルータ2に接続しているルータ3のインタフェース障害と判定できる。図16に示すメッシュ型ネットワーク構成の例でも同様の判定を行うことができる。
【0125】
リニア型の場合は、機器の障害までしか特定できなかった。しかし、リング型およびメッシュ型では障害発生の通信経路の他方からの通信経路の確認により、ネットワーク機器のインタフェースの障害まで特定できる。
さらに、ネットワークのトポロジ情報を取得しない場合にも、実施の形態6に示す方法で単純に通信経路を辿ることで、実施の形態6と同様に機器の障害を特定できるという効果を得ることができる。
【0126】
以上のように、実施の形態7にかかるネットワーク監視支援装置100は、機器監視部120において定期的にネットワーク機器の応答を監視する。障害原因解析部112は、所定の時間応答がない場合、該当機器までのネットワーク経路を解析して、最も該当機器に近いネットワーク機器の情報を取得する。そして、障害原因解析部112は、物理的にネットワークが接続されているかを確認する。また、障害原因解析部112は、ネットワーク構成がリング型およびメッシュ型の場合には、他の経路から物理的にネットワークが接続されているかを確認する。これにより、リニア型の場合と比べ、さらに障害箇所の特定が可能となり、ネットワークの保守員の負荷がより軽減される。
【0127】
実施の形態8.
次に、実施の形態8について説明する。実施の形態8では、ネットワーク機器から通知される警報を解析して、障害情報を診断ファイルに追加するネットワーク監視支援装置100について説明する。
【0128】
実施の形態8では、人手によらずに診断ファイルの情報を充実化することで診断機能の精度を向上することを目的とする。
【0129】
実施の形態8では、警報解析部113がネットワーク機器から通知される警報を解析する。そして、警報に含まれる情報が診断ファイルに登録されていない情報であれば、障害情報を診断ファイル記憶部150が追加する動作について説明する。
【0130】
実施の形態8にかかるネットワーク監視支援装置100の機能は、実施の形態1にかかるネットワーク監視支援装置100の機能と概ね同様である。そこで、実施の形態6にかかるネットワーク監視支援装置100の機能について、図17に基づき、実施の形態1にかかるネットワーク監視支援装置100の機能と異なる部分についてのみ説明する。図17は、実施の形態8にかかるネットワーク監視支援装置100の機能を示す機能ブロック図である。
【0131】
実施の形態8にかかるネットワーク監視支援装置100の障害診断部110は、さらに、警報解析部113を備える。警報解析部113は、監視対象のネットワーク機器の通信状態に障害が発生したときに該当機器から警報として通知された障害情報である警報情報を解析する。つまり、警報解析部113は、ネットワークに存在する所定の機器に障害が発生した場合に所定の機器により警報として通知される警報情報を解析する。そして、警報解析部113は、障害の内容と原因とを処理装置980により抽出する。つまり、処理装置980は、警報情報を解析して、障害の内容と原因とであることを特定して、障害の内容と原因とを抽出する。
診断ファイル記憶部150は、警報解析部113が抽出した障害の内容と原因とを診断ファイルとして記憶装置984に記憶する。
【0132】
次に、図18に基づき実施の形態8にかかるネットワーク監視支援装置100の動作について説明する。図18は、実施の形態8にかかるネットワーク監視支援装置100の動作である障害情報追加処理を示すフローチャートである。障害情報追加処理は、ネットワーク監視支援方法、および、ネットワーク監視支援プログラムの処理の一例である。
【0133】
まず、警報受信(機器監視)ステップ(S800)では、警報解析部113は、ネットワーク機器からの警報として通知される警報情報を受信する。次に、警報解析ステップ(S801)では、警報解析部113は、受信した警報情報を解析する。警報解析部113は、例えば、IPネットワークにおいて利用されているSNMPのTrapなどの情報を警報情報として受信して解析する。次に、診断ファイル確認ステップ(S802)では、警報解析部113は、解析した警報情報を診断ファイル記憶部150が記憶していることを確認する。次に、新規情報確認ステップ(S803)では、警報解析部113は、(S802)での確認の結果、警報情報が新規であるか否かを判定する。警報情報が新規である場合(S803でYes)、警報解析部113は、(S804)へ進む。警報情報が新規でない場合(S803でNo)、警報解析部113は、処理を終了する。そして、障害原因情報追加ステップ(S804)では、警報解析部113は、新たな障害情報として診断ファイルに追加する指示を診断ファイル記憶部150へ出す。そして、診断ファイル記憶部150は、警報情報を診断ファイルとして記憶する。
ここで、(S802)から(S804)までは診断ファイル記憶ステップである。
【0134】
次に、図19に基づき警報解析部113と診断ファイル記憶部150との動作の一例について説明する。図19は、警報情報を追加した診断ファイルの一例である。
例えば、警報解析部113が受信した警報情報を解析して、警報情報が示す内容がcoldstartであると識別した場合、診断ファイル記憶部150は、coldstartを診断キーワード1として記憶する。そして、診断ファイル記憶部150は、警報情報のその他の情報を障害原因として記憶する。例えば、図19では、診断キーワード1がcoldstartである場合の障害原因を全設定初期化とした。警報解析部113は、例えば、SNMPのTrapを警報情報として受信して、受信したTrapのフィールドの値に基づき診断キーワード1、2と障害原因とを解析する。
【0135】
以上のように、実施の形態8にかかるネットワーク監視支援装置100は、ネットワーク機器の通信状態などに障害が発生したときに警報として通知される警報情報を警報解析部113によって解析する。そして、警報解析部113は、警報の内容とその原因とを抽出する。そして、診断ファイル記憶部150は、警報解析部113が抽出した情報を、障害情報とその原因を規定した診断ファイルに追加する。これにより、人手によらずに診断ファイルの情報を充実化することで診断機能の精度が向上できる。
【0136】
ここで、実施の形態8にかかるネットワーク監視支援装置100をまとめると以下のようになる。
【0137】
実施の形態8にかかるネットワーク監視支援装置100は、警報情報を収集、蓄積して、診断ファイルに情報を追加することにより、診断ファイルを自動的に充実化する装置構成であることを特徴とする。
【0138】
また、実施の形態8にかかるネットワーク監視支援装置100は、ネットワーク機器の通信状態に障害が発生したときに該当機器から警報として通知された障害情報を解析する警報解析部113と、を備えたことを特徴とする。
【0139】
さらに、実施の形態8にかかるネットワーク監視支援装置100は、ネットワーク機器の通信状態に障害が発生したときに該当機器から警報として通知される障害情報を警報解析部113によって解析することで、障害の内容と原因とを抽出し、抽出した情報を、障害情報とその原因を規定した診断ファイルに追加することにより、人手によらずに診断ファイルの情報を充実化することで診断機能の精度を向上することを特徴とする。
【0140】
また、従来、MPLS(Multi−Protocol Label Switching)ネットワークにおいて、LDP(Label Distribution Protocol)やLSP(Label Switched Path)を管理することにより、通信経路上の障害発生箇所を特定し、障害情報の解析により障害発生箇所を迂回するネットワーク管理装置がある。これは、MPLSプロトコルを使用しないネットワークにおいては、適用することができない。
【0141】
上記実施の形態では、特定のプロトコルに依存しないため、様々なネットワークにおいて適用することができる。
【図面の簡単な説明】
【0142】
【図1】実施の形態にかかるネットワーク監視支援装置100の外観の一例を示した図である。
【図2】実施の形態におけるネットワーク監視支援装置100のハードウェア構成の一例を示す図である。
【図3】実施の形態1、2、3、4、6、7にかかるネットワーク監視支援装置100の機能を示す機能ブロック図である。
【図4】診断ファイル記憶部150が記憶する診断ファイルの一例である。
【図5】ネットワーク監視支援装置100の動作である障害復旧処理を示すフローチャートである。
【図6】障害復旧部130が回避経路を算出する処理の一例を示す図である。
【図7】実施の形態2、3、4にかかるネットワーク監視支援装置100の動作を示すフローチャートである。
【図8】障害復旧部130が回避経路を算出する処理の一例を示す図である。
【図9】障害復旧部130が回避経路を算出する処理の一例を示す図である。
【図10】障害復旧部130が回避経路を算出する処理の一例を示す図である。
【図11】実施の形態5にかかるネットワーク監視支援装置100の機能を示す機能ブロック図である。
【図12】実施の形態5にかかるネットワーク監視支援装置100の動作である経路最適化処理を示すフローチャートである。
【図13】診断履歴情報記憶部160が記憶した履歴情報である診断履歴情報の一例である。
【図14】実施の形態6、7にかかるネットワーク監視支援装置100の動作である障害原因解析処理を示すフローチャートである。
【図15】リニア型ネットワーク構成の一例である。
【図16】メッシュ型ネットワーク構成の一例である。
【図17】実施の形態8にかかるネットワーク監視支援装置100の機能を示す機能ブロック図である。
【図18】実施の形態8にかかるネットワーク監視支援装置100の動作である障害情報追加処理を示すフローチャートである。
【図19】警報情報を追加した診断ファイルの一例である。
【符号の説明】
【0143】
100 ネットワーク監視支援装置、110 障害診断部、111 障害影響範囲解析部、112 障害原因解析部、113 警報解析部、120 機器監視部、130 障害復旧部、140 経路最適化部、150 診断ファイル記憶部、160 診断履歴情報記憶部、901 CRT表示装置、902 K/B、903 マウス、904 FDD、905 CDD、908 データベース、909 システムユニット、910 サーバ、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 FAX機、940 インターネット、941 ゲートウェイ、942 LAN、980 処理装置、982 入力装置、984 記憶装置、986 表示装置、988 通信装置。

【特許請求の範囲】
【請求項1】
ネットワークに存在する所定の機器を監視して障害を検出するとともに、障害が検出された障害機器の情報を障害機器情報として通信装置を介して収集する機器監視部と、
障害機器情報に対応する障害の原因を示す障害原因情報を有する診断ファイルを記憶装置に記憶する診断ファイル記憶部と、
上記機器監視部が収集した障害機器情報に基づき上記診断ファイル記憶部が記憶した診断ファイルから障害原因情報を取得して障害の原因を診断する障害原因解析部と、
ネットワークの接続形態を示すネットワークトポロジ情報を、ネットワークを監視するネットワーク監視装置から取得するとともに、上記障害機器情報と上記ネットワークトポロジ情報とに基づき障害の影響範囲を処理装置により特定する障害影響範囲解析部と
を備えることを特徴とするネットワーク監視支援装置。
【請求項2】
上記ネットワーク監視支援装置は、さらに、
上記障害影響範囲解析部が特定した障害の影響範囲を回避する通信経路である回避経路を算出し、算出した回避経路を上記所定の機器に通信装置を介して設定する障害復旧部
を備えることを特徴とする請求項1記載のネットワーク監視支援装置。
【請求項3】
上記機器監視部は、ネットワークに存在する所定の機器の負荷情報を収集し、
上記障害復旧部は、上記回避経路が複数ある場合、上記負荷情報に基づき回避経路を選択する
ことを特徴とする請求項2記載のネットワーク監視支援装置。
【請求項4】
上記機器監視部は、所定の場合にネットワークに存在する所定の機器の負荷情報を収集し、
上記ネットワーク監視支援装置は、さらに、
上記機器監視部が収集した負荷情報を履歴として記憶装置に記憶する診断履歴情報記憶部と、
上記ネットワークトポロジ情報と上記診断履歴情報記憶部が記憶した負荷情報の履歴とに基づき通信経路を算出し、算出した通信経路を上記所定の機器に通信装置を介して設定する経路最適化部と
を備えることを特徴とする請求項1記載のネットワーク監視支援装置。
【請求項5】
上記障害原因解析部は、上記障害機器への通信経路を解析して上記障害機器に隣接する機器である隣接機器を特定するとともに、特定した隣接機器の情報を取得して障害の原因を診断する
ことを特徴とする請求項1記載のネットワーク監視支援装置。
【請求項6】
上記障害原因解析部は、上記隣接機器の情報に基づき上記障害機器へネットワークが物理的に接続されているか否かを判定する
ことを特徴とする請求項5記載のネットワーク監視支援装置。
【請求項7】
上記ネットワーク監視支援装置は、さらに、
上記所定の機器に障害が発生した場合に上記所定の機器により警報として通知される警報情報を解析して、障害の内容と原因とを処理装置により抽出する警報解析部を備え、
上記診断ファイル記憶部は、上記警報解析部が抽出した障害の内容と原因とを診断ファイルとして記憶する
ことを特徴とする請求項1記載のネットワーク監視支援装置。
【請求項8】
ネットワークに存在する所定の機器を監視して障害を検出するとともに、障害を検出された機器である障害機器の情報を障害機器情報として機器監視部が通信装置を介して収集する機器監視ステップと、
障害機器情報に対応する障害の原因である障害原因情報を有する診断ファイルを診断ファイル記憶部が記憶装置に記憶する診断ファイル記憶ステップと、
上記機器監視ステップで収集した障害機器情報に基づき上記診断ファイル記憶ステップで記憶した診断ファイルから障害原因情報を取得して障害の原因を処理装置により障害原因解析部が診断する障害原因解析ステップと、
ネットワークの接続形態を示すネットワークトポロジ情報を、ネットワークを監視するネットワーク監視装置から取得するとともに、上記障害機器情報と上記ネットワークトポロジ情報とに基づき障害の影響範囲を処理装置により障害影響範囲解析部が特定する障害影響範囲解析ステップと
を備えることを特徴とするネットワーク監視支援方法。
【請求項9】
ネットワークに存在する所定の機器を監視して障害を検出するとともに、障害を検出された機器である障害機器の情報を障害機器情報として機器監視部が通信装置を介して収集する機器監視ステップと、
障害機器情報に対応する障害の原因である障害原因情報を有する診断ファイルを診断ファイル記憶部が記憶装置に記憶する診断ファイル記憶ステップと、
上記機器監視ステップで収集した障害機器情報に基づき上記診断ファイル記憶ステップで記憶した診断ファイルから障害原因情報を取得して障害の原因を処理装置により障害原因解析部が診断する障害原因解析ステップと、
ネットワークの接続形態を示すネットワークトポロジ情報を、ネットワークを監視するネットワーク監視装置から取得するとともに、上記障害機器情報と上記ネットワークトポロジ情報とに基づき障害の影響範囲を処理装置により障害影響範囲解析部が特定する障害影響範囲解析ステップと
をコンピュータに実行させることを特徴とするネットワーク監視支援プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2007−189615(P2007−189615A)
【公開日】平成19年7月26日(2007.7.26)
【国際特許分類】
【出願番号】特願2006−7609(P2006−7609)
【出願日】平成18年1月16日(2006.1.16)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】