説明

ネットワーク監視装置及び方法及びプログラム

【課題】 装置台数や1台の装置における構成モジュール数が時間的に変化する、同一階梯に複数種類の装置が利用されている運用中の階梯構造ネットワークにおいて、故障発生時の被疑箇所特定を行う。
【解決手段】 本発明は、モジュール毎の故障件数を算出し、評価対象となるモジュールの数が装置内で変化するかしないかを分類し、モジュール数を算出し、ユーザ数を分配し、未来のユーザ数を求め、収容率パラメータとモジュール毎の収容可能上限ユーザ数から、モジュール数を求め、特定期間毎のモジュール毎の故障件数とモジュール数からモジュール毎のモジュール故障率を算出し、故障検知情報から故障被疑箇所候補を抽出し、故障被疑箇所候補に基づいて、対応する故障被疑箇所のモジュール故障率を抽出し、表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信ネットワークにおける信頼性評価技術に係り、特に、装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所特定に利用するためのネットワーク監視装置及び方法及びプログラムに関する。
【背景技術】
【0002】
一般的に、ネットワークの監視では、SNMP(Simple Network Management Protocol)(例えば、非特許文献1,2参照)を利用し、監視装置のSNMPマネージャへ監視対象装置のSNMPエージェントが異常検知(TRAP)を送信することによって故障を検知している。また、監視対象装置へ定期的にICMP(Internet Control Message Protocol)(PING)による死活監視と組み合わせて監視を行っている。
【0003】
しかし、図1のようなネットワークの構成の場合、監視対象ネットワークにおける装置Aの故障をSNMPエージェントがデータコネクションネットワーク(DCN)におけるSNMPマネージャである監視装置に異常値検知(TRAP)を送信することによって検知すると、ログ確認やステータス確認コマンド等によって保守者が確認のうえ、交換が必要であると判断した場合、故障被疑箇所として装置Aのインタフェースと装置Cのインタフェースの2箇所あるため、故障被疑箇所をさらに絞り込むことが難しい場合が多い。このような場合、この故障がサービスに影響している場合は、サービス中断時間をできる限り短くするため、装置A,Cの両方の同時手配が行われる。このとき、故障被疑箇所が特定できないために、現地駆けつけ人員、物品手配のコストが2倍発生してしまい、OPEX(運用コスト)の増加を招く。
【0004】
この問題に対して、故障率などの評価尺度を利用して、被疑箇所を特定する技術が提案されている(例えば、非特許文献参照)。
【0005】
また、MIB(Management Information Base)情報により取得した装置データを元に最尤推定法を用いて、寿命分布のパラメータを推定し、信頼区間を求め、故障率を評価する方法がある(例えば、特許文献1参照)。
【0006】
また、事前に記録した装置故障率の信頼区間とネットワーク装置の累積故障数による故障率を比較し、ネットワーク装置の信頼性の良し悪しを判断する監視システムを提案している(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2004-191359号公報
【特許文献1】特開2007-68090号公報
【非特許文献】
【0008】
【非特許文献1】RFC1157 A Simple Network Management Protocol (SNMP)
【非特許文献2】RFC1213 Management Information Base of Network Management of TCP/IP-based Internets: MIB-II.
【非特許文献3】塩見弘著「信頼性の基礎」"2.2 故障率の算出"、pp20-23,株式会社コロナ社、1975.
【発明の概要】
【発明が解決しようとする課題】
【0009】
故障被疑箇所の特定のために故障率を利用する場合、交換の最小単位は装置全体ではなくモジュールである。ここで、モジュールとは単体で交換できる部品の最小単位と定義する。そのため、被疑箇所の特定にはモジュール単位の故障率の比較を行うべきである。
【0010】
モジュール毎の故障率は、非特許文献3より、故障件数を総稼動時間(=測定時間×総モジュール数)で除算することから求められるため、モジュール数の情報が正確に得られない場合、故障率の算出・比較に大きな影響を及ぼす。例えば、モジュール数を過剰に計上した場合、故障率は小さく見積もられてしまい、問題の大きい故障原因を見逃してしまう。逆の場合は、問題の小さい故障原因を過大評価する可能性がある。
【0011】
上記内容は、故障率の逆数であるMTBF(Mean Time Between Failure)でも同様のことが言える。
【0012】
通信ネットワークでは、時間経過によるユーザ数の変化に伴って、ネットワーク装置が増設される。このとき、通信キャリアはCAPEX(=設備投資コスト)を考慮して装置の増設時に全てのモジュールを搭載するのではなく、需要を予測する形での増設が行われるモジュールも存在する。このため、モジュールの数も時間と共に変化しているといえる。
【0013】
また、近年ネットワークもマルチベンダ化が進み、階梯構造のネットワークにおける同一階梯の装置でも複数ベンダの装置が利用されることが多い。つまり、全装置における総モジュール数の算出が現実的な稼動では難しくなっている。
【0014】
SNMPエージェントが保持している装置の管理情報(MIB情報)を用いてモジュール数を取得する場合、頻度の高い情報収集は装置の負荷を高める危険性が存在し、さらに監視トラヒックの増加という懸念も考えられる。また、近年ネットワーク装置のマルチベンダ化に伴い、さらにインタフェース物品も多様化しているため、MIB情報だけでは、モジュール情報の区別ができない場合も存在する。以上のことから、一般的なMIB情報を用いてモジュール情報を収集することが望ましいとはいえない。
【0015】
前述の特許文献1,2の技術とも装置を単位とした情報であり、モジュール単位の故障率を求めておらず、被疑装置は特定できても、被疑モジュールまでの特定はできない。モジュール単位の故障率計算を行う場合、総モジュール数の情報が必要となる。しかし、装置台数やモジュール数は時間の経過と共に変化していく値であり、かつ、現在の通信ネットワークにおける装置数のオーダは数万以上とされているため、全てのモジュール数の変化についての情報を収集することが困難であり、全てのモジュール情報を収集できない場合の推定方法が必要である。
【0016】
本発明は、上記の点に鑑みなされたもので、特に装置台数や1台の装置における構成モジュール数が時間的に変化する、同一階梯に複数種類の装置が利用されている運用中の階梯構造ネットワークにおいて、構成モジュール数を推定することでモジュール故障率を算出し、その結果を用いて、故障発生時の被疑箇所特定を行うことが可能なネットワーク監視装置及び方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0017】
上記の課題を解決するため、本発明は、同一階梯に複数の装置種別が存在する階梯構造ネットワークに対する装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所の特定を行う監視装置であって、
故障被疑モジュール情報を含むネットワーク故障情報と、
ユーザ数時系列情報と、
装置1台当りの搭載可能な最大モジュール数や装置を構成するモジュール数が変化するフラグ、モジュール毎の収容可能上限ユーザ数、装置階梯種別を含む装置モジュール構成情報と、
装置台数時系列情報と、
インタフェースの対向装置、モジュールを含むネットワーク構成情報と、
ユーザ数予測に用いるユーザ数予測パラメータと収容率パラメータと、
を格納した記憶手段と、
前記ネットワーク故障情報を装置別・モジュール別に分類し、モジュール毎の故障件数を算出する分類手段と、
前記装置モジュール構成情報を、評価対象となるモジュールの数が装置内で変化するかしないかを前記フラグに基づいて分類する変化判断手段と、
前記変化判断手段で「変化しない」と判断された場合に、前記装置モジュール構成情報における装置1台当りのモジュール最大搭載数と前記装置台数時系列情報の装置台数からモジュール数を算出するモジュール数算出手段と、
前記装置モジュール構成情報における前記装置階梯種別を用いて、同一階梯装置の情報と前記装置台数時系列情報の装置台数の情報から、同一階梯の装置台数比率より、ユーザ数を分配し、前記ユーザ数予測パラメータと分類したユーザ数から未来のユーザ数を求めるユーザ数予測手段と、
前記収容率パラメータと前記装置モジュール構成情報における前記モジュール毎の収容可能上限ユーザ数から、モジュール数を求めるモジュール数予測手段と、
前記分類手段で求められた前記特定期間毎のモジュール毎の故障件数と前記モジュール数算出手段で求められた前記モジュール数からモジュール毎のモジュール故障率を算出し、故障率記憶手段に格納するモジュール故障率算出手段と、
前記ネットワーク構成情報と任意の手段で検知した故障検知情報から故障被疑箇所候補を抽出する故障被疑箇所抽出手段と、
前記故障被疑箇所候補に基づいて、前記故障率記憶手段を参照して、対応する故障被疑箇所のモジュール故障率を抽出し、表示する出力手段と、を有する。
【発明の効果】
【0018】
上記のように、本発明によれば、特に装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種別の装置が利用されるネットワークにおいて、総モジュール数を推定することで、モジュール毎の故障率を算出することができる。それによって、故障発生時の原因箇所の優先順位をつけることが可能となる。結果として冗長となっていた無駄な保守稼動を減らすことが可能となり、運用コストの削減を可能とする。
【図面の簡単な説明】
【0019】
【図1】本発明の一実施の形態におけるネットワーク装置と監視装置の関係の一例を示す図である。
【図2】本発明の一実施の形態における監視装置の構成図である。
【図3】本発明の一実施の形態における故障管理DBのネットワーク故障情報の一例である。
【図4】本発明の一実施の形態におけるユーザ管理DBのユーザ数時系列情報の一例である。
【図5】本発明の一実施の形態における設備管理DBの装置モジュール構成情報の一例である。
【図6】本発明の一実施の形態における設備管理DBの装置台数時系列情報の一例である。
【図7】本発明の一実施の形態における設備管理DBのネットワーク構成情報の一例である。
【図8】本発明の一実施の形態におけるモジュール故障率算出処理のフローチャートである。
【図9】本発明の一実施の形態におけるパラメータ記憶部に格納されるユーザ数予測パラメータ、収容率パラメータの一例である。
【図10】本発明の一実施の形態における故障被疑箇所特定処理のフローチャートである。
【図11】本発明の一実施例におけるモジュール毎に月間故障件数を分類した一例である。
【図12】本発明の一実施例におけるモジュール数が変化しない場合のモジュール数算出の一例である。
【図13】本発明の一実施例における同一階梯の装置毎に装置台数比率から分配ユーザ数を算出した一例である。
【図14】本発明の一実施例における最小二乗法の1次関数近似で分配ユーザ数を推定した一例である。
【図15】本発明の一実施例における装置を構成するモジュール数が変化する場合のモジュール数算出の一例である。
【図16】本発明の一実施例におけるモジュール故障率算出の一例である。
【図17】本発明の一実施例における接続構成例である。
【発明を実施するための形態】
【0020】
以下図面と共に、本発明の実施の形態を説明する。
【0021】
図1は、本発明の一実施の形態におけるネットワーク構成と監視装置との関係の一例を示す。
【0022】
ネットワーク全体としては、コアネットワーク20、アクセスネットワーク30、ホームネットワーク40、データコネクションネットワーク(DCN)10の4種類存在し、監視対象ネットワークはそのうちのコアネットワーク20、アクセスネットワーク30であり、監視装置100はデータコネクションネットワーク10に存在する。
【0023】
また、監視対象のネットワークはそれぞれ、ネットワーク装置によって構成されており、それぞれ階梯構造を持っている。同一階梯の装置は複数の装置種別が存在するネットワークを仮定する。
【0024】
監視装置100と監視対象装置は、SNMPプロトコル等を利用し、故障の検知を行っている。具体的には、監視装置100は、SNMPマネージャ機能200が、監視対象装置21にはSNMPエージェント機能22が備わっている。
【0025】
上記のネットワーク構成を前提とし、実施の形態について説明する。
【0026】
図2は、本発明の一実施の形態における監視装置の構成とその処理の流れを示す図である。同図に示す監視装置100は、外部の入力部101からの情報を受信する装置情報受信部111、ユーザ時系列情報受信部112、故障情報受信部113、パラメータ受信部114、設備管理DB(データベース)110、ユーザ管理DB120、故障管理DB130、故障率管理DB140、モジュール故障率算出部150、故障被疑候補抽出部160、パラメータ記憶部171、故障率記憶部172、抽出結果記憶部173、監視システム201、ネットワークインタフェース202、SNMPマネージャ200を有する。
【0027】
故障管理DB140は、図3に示すように、故障情報受信部113で受信されたネットワーク故障情報として、故障装置、故障発生日時、故障被疑モジュールを格納する。
【0028】
ユーザ管理DB120は、図4に示すように、ユーザ時系列情報受信部112で受信された、ユーザ数時系列情報として、情報取得年月日、総ユーザ数を格納する。
【0029】
設備管理DB110は、装置情報受信部111で受信された装置モジュール構成情報と装置台数時系列情報、ネットワーク構成情報を格納する。装置モジュール構成情報としては、図5に示すように、装置種別、装置階梯種別、モジュール種別、装置一台当りに搭載可能な最大モジュール数、装置を構成するモジュール数が変化し得るかのフラグ、モジュール毎の収容可能上限ユーザ数を含む。また、装置台数時系列情報としては、図6に示すように、装置種別、装置台数、情報取得年月日を含む。ネットワーク構成情報としては、図7に示すように、装置種別、インタフェース、対応モジュール、対向装置、対向インタフェース、対向モジュールを含む。
【0030】
ここで、「装置階梯種別」とは、同一階梯の装置群を判断できる情報とする。以下で対象とするネットワークは図1に示すようなネットワーク構造をしており、全体として、階梯構造を持つネットワーク構成を持つ。ネットワーク構成情報は、同一階梯の装置に対して、マルチベンダの装置が収容されていることを想定しているため、同一階梯、異機種を区分するための情報である。
【0031】
パラメータ受信部114は、以下のような処理を行う。
【0032】
図8は、本発明の一実施の形態におけるモジュール故障率算出処理のフローチャートである。
【0033】
ステップ110) パラメータ受信部114において、入力部101からユーザ数予測パラメータ、収容率パラメータを取得し、図9に示すように、パラメータ記憶部171に格納されているものとする。モジュール故障率算出部150は、故障管理DB130からネットワーク故障情報、ユーザDB120からユーザ数時系列情報、設備管理DB110から装置モジュール構成情報、装置時系列情報を、パラメータ記憶部171から図9に示すユーザ数予測パラメータ、収容率パラメータを抽出する。
【0034】
ステップ120) モジュール故障率算出部150は、故障管理DB130から抽出したネットワーク故障情報を装置別、故障被疑モジュール別に分類し、特定期間毎のモジュール毎の故障件数を算出する。
【0035】
ステップ130) モジュール故障率算出部150は、装置を構成するモジュール数が変化するか否かのフラグを参照し、変化する(フラグ="1")場合には、ステップ150に移行し、変化しない(フラグ"0")場合はステップ140に移行する。
【0036】
ステップ140) 装置を構成するモジュール数が変化しない場合、装置台数の時系列変化とモジュール数変化が追随することから、モジュール枚数は装置1台当りのモジュール最大搭載数の情報を利用して算出が可能になる。つまり、モジュール故障率算出部150は、装置モジュール構成情報における装置1台当りのモジュール最大数搭載数と装置台数時系列情報の装置台数からモジュール数を算出し、故障率記憶部172に格納してステップ170に移行する。
【0037】
ステップ150) モジュール故障率算出部150は、装置を構成するモジュール数が変化し得る場合、モジュール数の予測にあたって、ユーザ数の予測を行う。これは設計段階でのモジュール・装置増設判断はユーザ数の増加見合いで行われているという仮定を用いている。装置階梯種別情報を用いて同一の装置における装置台数の比率を求め、装置毎の収容ユーザ情報を算出する。以降装置台数比率によって配分されたユーザ数を分配ユーザ数と定義する。入力されたユーザ数予測パラメータを用いた最小二乗法により未来の配分ユーザ数を予測する。
【0038】
ステップ160) さらに、モジュール故障率算出部150は、入力された収容率パラメータとモジュール毎の収容可能上限ユーザ数とステップ150で予測した分配ユーザ数からモジュール数を推定し、その値を故障率記憶部172に格納する。
【0039】
ステップ170) モジュール故障率算出部150は、上記のステップ140とステップ160で算出・推定され、故障率記憶部172に格納されているモジュール数とある期間のモジュール毎の故障件数と、その期間情報から前述の非特許文献3に示す手法により故障率を算出する。
【0040】
ステップ180) 算出したモジュール故障率を故障率DB140に保存する。
【0041】
上記の処理を、全装置、全モジュールに対して行う。
【0042】
図10は、本発明の一実施の形態における故障被疑箇所特定処理のフローチャートである。
【0043】
ステップ210) 故障被疑候補抽出部160は、SNMP TRAP機能等による故障を監視システム201が検知したTRAP情報を取得する。
【0044】
ステップ220) 故障被疑候補抽出部160は、これにより受信したTRAP.情報に基づいて故障被疑箇所候補を抽出する。このとき、インタフェース等の故障であればそのインタフェースの接続先のモジュールも被疑対象として考えられる。そのため、設備管理DB110からネットワーク構成情報(装置種別、インタフェース、モジュール種別、接続対向装置、接続対向インタフェース、モジュール種別)(図7)を抽出し、隣接装置のモジュールも被疑対象とする。
【0045】
ステップ230) 故障率管理DB140から故障被疑箇所候補のモジュール故障率を抽出し、表示部102に表示する。
【実施例】
【0046】
以下、上記の実施の形態を具体的に説明する。
【0047】
以下に、モジュール故障率算出部150と故障被疑候補抽出部160の処理について説明する。本実施例での時系列データの扱いとして、特定期間における情報投入精度について説明を行う際、この期間については任意に決めることが可能であるとする。また、それぞれの一例を示す図では、1ヶ月毎のデータ、かつ、月末の情報が投入されている前提において説明を行うこととする。
【0048】
最初に、入力部101からネットワーク故障情報、ユーザ数時系列情報、装置モジュール構成情報、装置台数時系列情報、ネットワーク構成情報、ユーザ数予測パラメータ、収容率パラメータの入力を行う。
【0049】
本実施例では、上記の情報を、受信部111〜113を介して、管理者によってネットワーク故障情報を故障管理DB130に、ユーザ数時系列情報をユーザ管理DB120に、装置モジュール構成情報、装置台数時系列情報、ネットワーク構成情報を設備管理DB110に格納される。また、ユーザ数予測パラメータと収容率パラメータも同様にパラメータ受信部114を介してパラメータ記憶部171に格納される。
【0050】
故障管理DB140のネットワーク故障情報には、図3に示すように、故障装置、故障発生日時、故障被疑モジュールの情報が含まれている。
【0051】
ユーザ管理DB120のユーザ時系列情報は、特定期間毎に集計された、監視対象ネットワークに収容されている全ユーザ数情報が含まれている。図4は、月間ユーザ数時系列情報の一例である。
【0052】
設備管理DB130の装置モジュール個性情報には、図5に示すように、装置種別、装置階梯種別、モジュール種別、装置一台当りに搭載可能な最大モジュール数、装置を構成するモジュール数が変化し得るかのフラグ、モジュール毎の収容可能上限ユーザ数が含まれる。
【0053】
設備管理DB130の装置台数時系列情報には、図6に示すように、装置種別、装置台数、情報取得年月日の情報が含まれる。
【0054】
設備管理DB130のネットワーク構成情報には、図7に示すように、装置種別、インタフェース、モジュール種別、接続対向装置、接続対向インタフェース、モジュール種別が含まれる。
【0055】
パラメータ記憶部171に格納されるユーザ数予測パラメータには、図9に示すように、予測に利用する過去のデータの期間と予測する未来の期間を含み、収容率パラメータには、終了率の情報が管理者によって入力される。
【0056】
以下に、本実施例の動作を図8に沿って説明する。
【0057】
ネットワーク故障情報、ユーザ数時系列情報、装置モジュール構成情報、装置台数時系列情報、ネットワーク構成情報、ユーザ数予測パラメータ、収容率パラメータが入力される。当該手順は、事前に管理者が行う手順であり、以下の処理とは別に行われるものである。
【0058】
ステップ110)モジュール故障率算出部150は、事前に格納されている情報を各DBより抽出する。
【0059】
ステップ120) モジュール故障率算出部150は、装置モジュール構成情報から装置種別とモジュール種別を取得し、ネットワーク故障情報における故障被疑モジュール情報毎に故障を分類する。特定期間毎に故障発生件数を集計し、故障率記憶部172に格納する。図11に、月別に求めた装置Aと装置Cにおける各モジュールの故障件数を集計した結果を示す。
【0060】
ステップ140)<装置内のモジュール数が変化しない場合のモジュール数算出>
モジュール故障率算出部150は、装置モジュール構成情報における装置を構成するモジュール数が変化しうるかのフラグ情報を用いて"変化しない"(=0)というフラグが付けられているモジュールについて、モジュール数の算出を行う。この場合、装置台数がモジュール数に追随する形、つまり常に最大数搭載されていることになるため、装置モジュール情報の装置一台当りに搭載可能な最大モジュール数と装置台数時系列情報の装置台数を乗じることによりモジュール数を算出し、故障率記憶部172に格納する。図12は、図5と図6の上述の情報から、「2010年7月」における装置を構成するモジュール数が変化しないモジュール数を算出した一例である。
【0061】
ステップ150)<装置内のモジュール数が変化する場合のモジュール数予測>
モジュール故障率算出部150は、装置モジュール構成情報における装置を構成するモジュール数が変化しうるかのフラグ情報を用いて"変化する"(=1)というフラグが付けられているモジュールについて、ユーザ数予測パラメータにおける予測する未来の期間に対するユーザ数を予測し、そのユーザを収容するために必要なモジュール数を求める。また、対象とするネットワークは同一階梯に対して複数種別の装置によって構成されると仮定している。つまり、全体のユーザ数を同一階梯の装置台数比率によって収容分配が行われていると仮定する。
【0062】
ユーザ数の予測方法は、まず、上述の通り、装置モジュール構成情報の装置階梯種別が同一の装置に対して、装置台数時系列情報から装置台数の比率を求める。この比率が、各装置間のユーザ比率になっていると判断し、分配ユーザ数を算出する。図13に分配ユーザ数の一例を示す。図5に示す装置モジュール構成情報における装置階梯種別情報により、装置Aと装置Bは同一階梯の装置であることがわかる。図4のユーザ系列のユーザ数を図6の装置台数時系列情報における装置A,Bの装置台数の比率を用いて、分配ユーザ数を算出する。
【0063】
ユーザ数の予測については、パラメータ記憶部171に格納されているユーザ数予測パラメータにおける2つのパラメータと収容率パラメータにおける1つのパラメータの計3パラメータを用いる。予測に利用する過去のデータの期間をA、予測する未来の期間をBとし、モジュール数は時系列Nの時点のものを求める。そして、時系列N-A+1〜Nまでの分配ユーザ数の情報から時系列N+B(未来)の分配ユーザ数を最小二乗法の1次関数近似を用いて算出する。
【0064】
時系列t月の分配ユーザ数をUtとする。Nのモジュール数を求めるとき、時系列tにおける時系列Nまでの差分をMtとする。つまりMN=0である。(MN-A+1,U N-A+1)…(0,UN)という時系列N-A+1〜Nまで時系列差分と分配ユーザ数データを用いてユーザ数の変化を最小二乗法による1次関数近似(y=ax+b)を行ない、パラメータ(傾きaと切片b)を計算する。ここでxは上述のとおり、時系列Nまでの時系列差分Mtであり、yは分類ユーザ数Utである。
【0065】
【数1】

上記で求めたaとbの情報を元に、時系列N+B(未来)の分配ユーザ数を計算する。
【0066】
図14は、上述の方法でN=2010年7月として、図13の分類ユーザ数のデータからA=3ヶ月分の情報を元に、B=6ヶ月(2011年1月)の分類ユーザ数を予測した一例である。
【0067】
ステップ160) <装置内のモジュール数が変化する場合のモジュール数推定>
モジュール故障率算出部150は、装置モジュール構成情報において、モジュール毎の収容可能上限ユーザ数と収容率パラメータC%を用いて、ステップ150で求めた時系列N+B(未来)の分配ユーザに対する時系列Nでのモジュール数を推定する。つまり、時系列N+B(未来)時点での分配ユーザ数を見越して、収容可能上限ユーザ数のC%が収容できるように、時系列Nのモジュール数を決定していると考える。
【0068】
具体的には、ステップ150で求めた時系列N+B(未来)の分配ユーザ数を各モジュールの収容可能上限ユーザ数と収容率パラメータを乗じたもので割るという形で算出し、故障率記憶部172に格納する。図15は、上述の方法で求めたモジュールの数の一例である。
【0069】
ステップ170) <モジュール故障率算出>
モジュール故障率算出部150は、非特許文献3にあるように、ステップ120で分類したモジュール毎の故障件数をステップ140、ステップ160でそれぞれ求められ、故障率記憶部172に格納されているモジュール数と時系列差分で割ることにより、モジュール故障率を算出する。図16は、N=2010年7月としたときの装置A,Cにおける1ヶ月の各モジュール故障率を示した一例である。
【0070】
ステップ180) モジュール故障率算出部150は、ステップ170で算出したモジュール故障率を故障率管理DB140に記録する。
【0071】
以上の処理を全装置におけるモジュール種類分繰り返す。
【0072】
ステップ210) 故障被疑候補抽出部160における故障被疑箇所特定処理は、上記のステップ180までの処理とは異なり、リアルタイムの監視業務で行われる。
【0073】
監視対象ネットワーク20,30に対して、SNMP等を用いて障害をTRAPとして検知する。この場合、ICMP(Ping)による検知でもよい。
【0074】
ステップ220) <故障被疑箇所候補抽出>
故障被疑候補抽出部160は、受信したTRAP情報を元に、故障被疑箇所候補を判断する。故障被疑箇所候補は、基本的にTRAP発出装置の全モジュールが候補となる。この他、インタフェースの状態変化アラームであれば、ネットワーク構成情報を用いて該当インタフェースの対向装置のモジュールも被疑箇所候補とする。その他のアラームの場合は、TRAPを発出した装置の全てのモジュールを被疑箇所候補とする。
【0075】
以上の処理は自動で行われるが、ネットワーク構成情報による隣接装置のインタフェースも手動で被疑箇所候補とすることは可能である。
【0076】
図17に、装置Aと装置Cの接続構成例を示す。装置AのモジュールCと装置Cのモジュールaが接続されている。モジュールbはモジュールaを包含したモジュールである。この場合、装置Cのモジュールaに関する状態変化のTRAPを検出した場合、故障被疑箇所候補は装置Cの全モジュールa,b,c,d及び装置AにおけるモジュールCの5種類である。
【0077】
ステップ230) <故障被疑箇所候補のモジュール故障率を表示>
故障被疑箇所候補のモジュールに対して、故障率管理DB140より該当モジュールの故障率を取得して、抽出結果記憶部173に読み込み、表示する。この結果を元に、運用者は優先度をつけた対応を行うことができる。図16,17の例では、故障被疑箇所候補の中での対応優先順位は装置AにおけるモジュールCが最も高いということが判断できる。
【0078】
なお、図2に示す監視装置の各構成要素で行われる処理や機能は、監視装置として利用されるコンピュータに内蔵されるCPUやメモリなどのハードウェア資源を用いて、各部で実施される処理に対応するプログラムを実行することによって実現される。また、当該プログラムはフレキシブルディスク、CD−ROM,DVD等の記録媒体や、インターネットなどのネットワークを介して市場に流通させることが可能である。
【0079】
本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【符号の説明】
【0080】
10 データコネクションネットワーク(DCN)
20 コアネットワーク
21 装置
22 SNMPエージェント
30 アクセスネットワーク
40 ホームネットワーク
100 監視装置
101 入力部
102 表示部
111 装置情報受信部
112 ユーザ時系列情報受信部
113 故障情報受信部
110 設備管理DB
120 ユーザ管理DB
130 故障管理DB
140 故障率管理DB
150 モジュール故障率算出部
160 故障被疑候補抽出部
171 パラメータ記憶部
172 故障率記憶部
200 SNMPマネージャ
201 監視システム
202 ネットワークインタフェース

【特許請求の範囲】
【請求項1】
同一階梯に複数の装置種別が存在する階梯構造ネットワークに対する装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所の特定を行う監視装置であって、
故障被疑モジュール情報を含むネットワーク故障情報と、
ユーザ数時系列情報と、
装置1台当りの搭載可能な最大モジュール数や装置を構成するモジュール数が変化するフラグ、モジュール毎の収容可能上限ユーザ数、装置階梯種別を含む装置モジュール構成情報と、
装置台数時系列情報と、
インタフェースの対向装置、モジュールを含むネットワーク構成情報と、
ユーザ数予測に用いるユーザ数予測パラメータと収容率パラメータと、
を格納した記憶手段と、
前記ネットワーク故障情報を装置別・モジュール別に分類し、モジュール毎の故障件数を算出する分類手段と、
前記装置モジュール構成情報を、評価対象となるモジュールの数が装置内で変化するかしないかを前記フラグに基づいて分類する変化判断手段と、
前記変化判断手段で「変化しない」と判断された場合に、前記装置モジュール構成情報における装置1台当りのモジュール最大搭載数と前記装置台数時系列情報の装置台数からモジュール数を算出するモジュール数算出手段と、
前記装置モジュール構成情報における前記装置階梯種別を用いて、同一階梯装置の情報と前記装置台数時系列情報の装置台数の情報から、同一階梯の装置台数比率より、ユーザ数を分配し、前記ユーザ数予測パラメータと分類したユーザ数から未来のユーザ数を求めるユーザ数予測手段と、
前記収容率パラメータと前記装置モジュール構成情報における前記モジュール毎の収容可能上限ユーザ数から、モジュール数を求めるモジュール数予測手段と、
前記分類手段で求められた前記特定期間毎のモジュール毎の故障件数と前記モジュール数算出手段で求められた前記モジュール数からモジュール毎のモジュール故障率を算出し、故障率記憶手段に格納するモジュール故障率算出手段と、
前記ネットワーク構成情報と任意の手段で検知した故障検知情報から故障被疑箇所候補を抽出する故障被疑箇所抽出手段と、
前記故障被疑箇所候補に基づいて、前記故障率記憶手段を参照して、対応する故障被疑箇所のモジュール故障率を抽出し、表示する出力手段と、
を有することを特徴とするネットワーク監視装置。
【請求項2】
前記分類手段は、
前記ネットワーク故障情報を、装置別・モジュール別に分類し、特定期間毎のモジュール毎のモジュール毎の故障件数を算出する手段を含む
請求項1記載のネットワーク監視装置。
【請求項3】
前記ユーザ数予測手段は、
前記モジュール数算出手段において、前記評価対象となるモジュール数が装置内で変化すると判定された場合に、前記装置モジュール構成情報における装置階梯種別を用いて、同一階梯装置の情報と装置台数時系列情報の装置台数の情報から求められた同一階梯の装置台数比率より、ユーザ数を分配し、ユーザ予測パラメータと分類したユーザ数から未来のユーザ数を予測する手段を含み、
前記モジュール数予測手段は、
前記収容率パラメータと前記装置モジュール構成情報におけるモジュール毎の収容可能上限ユーザ数情報から、モジュール数を予測する手段を含む
請求項1記載のネットワーク監視装置。
【請求項4】
同一階梯に複数の装置種別が存在する階梯構造ネットワークに対する装置台数や1台の装置における構成モジュールの数が時間的に変化し、同一階梯に複数種類の装置が利用されている階梯構造ネットワークにおいて、故障発生時に故障被疑箇所の特定を行うネットワーク監視方法であって、
入力手段が、
故障被疑モジュール情報を含むネットワーク故障情報と、
ユーザ数時系列情報と、
装置1台当りの搭載可能な最大モジュール数や装置を構成するモジュール数が変化するフラグ、モジュール毎の収容可能上限ユーザ数、装置階梯種別を含む装置モジュール構成情報と、
装置台数時系列情報と、
インタフェースの対向装置、モジュールを含むネットワーク構成情報と、
ユーザ数予測に用いるユーザ数予測パラメータと収容率パラメータと、
を入力し、記憶手段に格納する情報取得ステップと、
分類手段が、前記ネットワーク故障情報を装置別・モジュール別に分類し、モジュール毎の故障件数を算出する分類ステップと、
変化判断手段が、前記装置モジュール構成情報を、評価対象となるモジュールの数が装置内で変化するかしないかを前記フラグに基づいて分類する変化判断ステップと、
モジュール数算出手段が、前記変化判断ステップで「変化しない」と判断された場合に、
前記装置モジュール構成情報における装置1台当りのモジュール最大搭載数と前記装置台数時系列情報の装置台数からモジュール数を算出するモジュール数算出ステップと、
ユーザ数予測手段が、前記装置モジュール構成情報における前記装置階梯種別を用いて、同一階梯装置の情報と前記装置台数時系列情報の装置台数の情報から、同一階梯の装置台数比率より、ユーザ数を分配し、前記ユーザ数予測パラメータと分類したユーザ数から未来のユーザ数を求めるユーザ数予測ステップと、
モジュール数予測手段が、前記収容率パラメータと前記装置モジュール構成情報における前記モジュール毎の収容可能上限ユーザ数から、モジュール数を求めるモジュール数予測ステップと、
モジュール故障率算出手段が、前記分類手段で求められた前記特定期間毎のモジュール毎の故障件数と前記モジュール数算出ステップで求められた前記モジュール数からモジュール毎のモジュール故障率を算出し、故障率記憶手段に格納するモジュール故障率算出ステップと、
故障被疑箇所抽出手段が、前記ネットワーク構成情報と任意の手段で検知した故障検知情報から故障被疑箇所候補を抽出する故障被疑箇所抽出ステップと、
出力手段が、前記故障被疑箇所候補に基づいて、前記故障率記憶手段を参照して、対応する故障被疑箇所のモジュール故障率を抽出し、表示する出力ステップと、
を行うことを特徴とするネットワーク監視方法。
【請求項5】
前記分類ステップにおいて、
前記ネットワーク故障情報を、装置別・モジュール別に分類し、特定期間毎のモジュール毎のモジュール毎の故障件数を算出する
請求項4記載のネットワーク監視方法。
【請求項6】
前記ユーザ数予測ステップにおいて、
前記モジュール数算出手段において、前記評価対象となるモジュール数が装置内で変化すると判定された場合に、前記装置モジュール構成情報における装置階梯種別を用いて、同一階梯装置の情報と装置台数時系列情報の装置台数の情報から求められた同一階梯の装置台数比率より、ユーザ数を分配し、ユーザ予測パラメータと分類したユーザ数から未来のユーザ数を予測し、
前記モジュール数予測ステップにおいて、
前記収容率パラメータと前記装置モジュール構成情報におけるモジュール毎の収容可能上限ユーザ数情報から、モジュール数を予測する
請求項5記載のネットワーク監視方法。
【請求項7】
請求項1乃至3のいずれか1項に記載のネットワーク監視装置を構成する各手段としてコンピュータを機能させるためのネットワーク監視プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2012−156641(P2012−156641A)
【公開日】平成24年8月16日(2012.8.16)
【国際特許分類】
【出願番号】特願2011−12108(P2011−12108)
【出願日】平成23年1月24日(2011.1.24)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】