説明

ネットワーク障害における影響サービス特定装置、および方法

【課題】ネットワークにおいて障害発生時に、ユーザへのサービス提供(予約)区間に関する情報と障害発生情報を用いることで、実際に影響を受けるサービスを確実かつ迅速に特定する影響サービス特定装置を提供する。
【解決手段】影響サービス特定装置は、提供または予約サービスの端点情報を収集し、端点からの障害情報を収集し、障害情報と端点情報から、障害により影響を受けるサービス候補を抽出し、抽出された影響サービス候補の端点間の疎通を確認することで、障害により影響を受けるサービスを特定する特定手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク障害時における、ユーザサービスへの影響範囲、および障害発生地点を特定する装置、および方法に関する。
【背景技術】
【0002】
現状では、ネットワークでの障害発生時に、影響するサービス情報を特定する方法としては、ネットワークごと、装置ごと、およびサービスごとに存在する管理装置(NMS(Network Management System)やEMS(Element Management System))内で特定する方法が提案されている(特許文献1から3)。また、それらの管理装置、または直接装置の警報を上位警報装置(統合監視装置)へ転送し、この警報情報をもとに統合監視装置が特定する手法がある。
【0003】
また、障害を検出したOAM(Operation Administration and Maintenance)の端点(MEP:Maintenance group End Point)とサービス提供(もしくは、サービス予約)端点を関連づけ、ネットワークリソースが割り当てられた(もしくは、割り当てられる予定)区間(サービス提供(予約)区間)を検出することで、「障害により影響を受けるサービス」として特定可能である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平5−114899号公報
【特許文献2】特開2007−189615号公報
【特許文献3】特開2007−235897号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、管理装置内で特定する方法では、運用管理者が複数台の管理装置の表示画面を見て、経験を元に解析しているのが現状であり、非常に効率が悪い。複数台の管理装置の表示画面を統合する装置があるが、単に警報を閲覧するだけの機能しかない。統合監視装置を用いる方法では、統合監視装置が全てのネットワークノードおよびサービスのインベントリ情報を保持する必要があり、構築するためには膨大な装置となってしまう。
【0006】
また、「障害により影響を受けるサービス」を特定する方式では、障害により影響を受けるサービスを、確実には特定できない場合がある。以下に、その例を示す。ここで、障害を検出したMEPとサービス提供(予約)端点を関連づけて、障害による影響を受けるサービスとして表示する場合を考える。障害を検出したMEPはネットワーク内のリンク断などの障害により影響を受ける端点であり、そのMEPで障害が実際に起きている訳ではない。また、障害発生時に、実際にはサービス提供(予約)端点間に障害があるとは限らないので、端点間は疎通している可能性もある。従って「障害により影響を受けているサービス」として特定されるが、実際には障害の影響を受けていないサービスという状態が発生してしまう可能性があるという課題があった。
【0007】
下記に、その例について、図1を用いて示す。各MEP同士は、定常的にCCM(Continuity Check Message)により疎通を確認している。(ここで、各MEP同士は、対向MEPとして設定されている。)ここで、<MIP1>−<MIP2>間で障害が発生した場合、各MEPは、以下のように障害を検出する。
1.MEP1は、MEP3からのCCMが届かないため障害通知する。
2.MEP2は、MEP3からのCCMが届かないため障害通知する。
3.MEP3は、MEP1およびMEP2からのCCMが届かないため障害通知する。
【0008】
上記のように各MEPは、<MIP1>−<MIP2>間で障害が発生した場合に障害通知を実行することになる。ここで、仮に、サービス提供(予約)の端点が[MEP1]−[MEP2]間であった場合を考える。[MEP1]−[MEP2]間は、実際には障害の影響を受けないが、MEP1およびMEP2から障害が通知されているため、「障害により影響を受けたサービス」と判断されてしまう。
【0009】
障害発生点を特定する方法としては、IEEE802.1 ag "Connectivity Fault Management"、またはITU-T Y.1731 "OAM functions and Mechanisms for Ethernet based Networks"に記載されたイーサネット(登録商標)OAMのループバック機能や、特開2008−28801号公報に記載されたリンクトレース機能により確認する方法がある。しかしながら、ループバック機能やリンクトレース機能は、一回の実行に5秒〜10秒以上の時間を要するため、障害発生点の確認に時間を要してしまう。例えば、提供(予約)サービス区間数がSとした場合は、障害による影響サービスの特定時間=(サービス区間数:S)x(リンクトレース要する時間)となる。図1の場合、サービス区間は3つしかないため、特定時間は少なくて済むが、MEPが増えるにつれてサービス区間も増えていき、膨大な特定時間がかかるようになる。そのため、ループバック機能やリンクトレース機能では、迅速な「影響サービス範囲の特定、および障害発生点の特定」が困難という課題もあった。
【0010】
したがって、本発明は、イーサネット(登録商標)ネットワークにおいて障害発生時に、ユーザへのサービス提供(もしくは、予約)区間に関する情報と障害発生情報を用いることで、実際に影響を受けるサービスを確実かつ迅速に特定すると共に、障害発生地点を特定する影響サービス特定装置、および方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
上記目的を実現するため本発明による影響サービス特定装置は、提供または予約サービスの端点情報を収集する収集手段と、前記端点間の疎通を確認する確認手段と、前記端点からの障害情報を収集する障害通知手段と、前記障害情報と前記端点情報から、前記障害により影響を受けるサービス候補を抽出する抽出手段と、前記抽出された影響サービス候補の端点間の疎通を前記確認手段により確認することで、障害により影響を受けるサービスを特定する特定手段とを備えている。
【0012】
また、前記確認手段は、前記サービスの端点において受信可能なCCMのMEP IDを確認することにより前記端点間の疎通を確認する手段であることも好ましい。
【0013】
また、前記抽出手段は、前記障害情報から障害発生IPアドレスを取り出し、前記端点情報の全てのシングル予約に対して、前記障害発生IPアドレスが前記シングル予約の端点のIPアドレスのいずれかと等しいか比較し、等しい場合、該シングル予約を影響サービス候補として抽出する手段であることも好ましい。
【0014】
また、前記特定手段により特定された影響を受けるサービスの端点間にリンクトレースを実行し、障害発生地点を特定する手段をさらに備えていることも好ましい。
【0015】
上記目的を実現するため本発明による影響サービス特定方法は、提供または予約サービスの端点情報を収集する収集ステップと、前記端点からの障害情報を収集する障害通知ステップと、前記障害情報と前記端点情報から、前記障害により影響を受けるサービス候補を抽出する抽出ステップと、前記抽出された影響サービス候補の端点間の疎通を確認することで、障害により影響を受けるサービスを特定する特定ステップとを含む。
【発明の効果】
【0016】
本発明により、これまで障害切り分けや影響解析が困難であったイーサネット(登録商標)網やアプリケーション層まで連携したOAM技術を実現することが可能となり、実際に影響を受けるサービスを確実かつ迅速に特定すると共に、障害発生地点を特定することが実現される。
【図面の簡単な説明】
【0017】
【図1】MEPが3つのネットワークの例を示す。
【図2】本発明による影響サービス特定装置と本システムが監視するネットワークの構成概略図を示す。
【図3】本発明による影響サービス特定装置の機能概略図を示す。
【図4】影響を受けるサービスを特定するフローチャートを示す。
【図5】影響を受けるサービス候補を抽出するフローチャートを示す。
【図6】図1のネットワークで障害が発生した場合に、影響サービスを特定する例を示す。
【図7】ツリー状ネットワークの例を示す。
【図8】図7のネットワークで障害が発生した場合に、影響サービスを特定する例を示す。
【発明を実施するための形態】
【0018】
本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。図2は、本発明による影響サービス特定装置と本システムが監視するネットワークの構成概略図を示す。影響サービス特定装置1は、イーサネット(登録商標)OAM管理システム2が検出した障害情報を収集すると共に、ネットワーク管理システム3が提供する情報を利用することで、障害により影響を受けるサービス、および障害発生箇所を抽出する。
【0019】
イーサネット(登録商標)OAMは、イーサネット(登録商標)網の保守・管理機能であり、ITU−T(国際電気通信連合電気通信標準化部門)が国際勧告「Y.1731」として標準化した。また、IEEE802委員会でも「IEEE802.1ag」として標準化されている(参考文献:ITU-T勧告 Y.1731 "OAM functions and Mechanisms for Ethernet based Networks"およびIEEE802.1 ag "Connectivity Fault Management")。イーサネット(登録商標)OAM管理システム2は、イーサネット(登録商標)OAM機器を管理するサーバモジュール、ユーザ操作用のクライアントモジュールおよびMACアドレス−名前変換サーバから構成されている。影響サービス特定装置1は、イーサネット(登録商標)OAM管理システム2から、イーサネット(登録商標)網内の機器で発生した障害を受けとる。イーサネット(登録商標)網内の機器は、通信機器、接続装置、およびイーサネット(登録商標)網に接続するクライアント、サーバ等のアクセス機器を含む。
【0020】
ネットワーク管理システム3は、クライアントからの要求に応じて、コア網、メトロ網、アクセス網の各NRM(NRM:Network Resource Manager)へネットワークリソースの予約要求等を行うシステムであり、NRMは要求されたネットワークリソースの予約に基づき、ネットワークリソースの割り当てを実行するシステムのことである。影響サービス特定装置1は、ネットワーク管理システム3と通信し、トランザクション情報等の必要な情報を収集する。なお、トランザクション情報は、提供サービス情報および予約サービス情報に関連する複数の情報をひとつにまとめた情報であり、例えば、提供(予約)されているネットワークリソースの端点のIPアドレス、ポート番号、およびQoS値が含まれる。
【0021】
図3は、本発明によるネットワーク障害における影響サービス特定装置の機能概略図を示す。影響サービス特定装置1は、障害通知機能11、通信機能12、影響サービス解析機能13およびデータベース14を備えている。
【0022】
障害通知機能11は、イーサネット(登録商標)OAM管理システム2からの障害通知を受信する機能を有する。また、通知された情報をデータベース14に格納する。通知を受けた場合、影響サービス解析機能13に、影響サービス解析の開始を要求する。
【0023】
イーサネット(登録商標)OAM管理システム2から通知される情報には、障害を検出したMEP(Maintenance group End Point)に対応するユーザID、状態(正常状態および障害状態)が含まれる。MEP(Maintenance group End Point)は、OAMの端点であり、OAMの中継点であるMIP(Maintenance group Intermediate Point)の障害をMEPが検知することでMEPが障害を通知する。障害状態として、対向側の装置に障害が発生したことを示すRDI(Remote Defect Indicator)を受信したこと、規定時間以内に接続性確認メッセージ(CCM、Continuity Check Message)を受信できないこと、および下位レイヤに関する障害を上位レイヤへ通知するAIS(Alarm Indication Signal)を受けたこと等がある。
【0024】
通信機能12は、ネットワーク管理システム3と通信する機能を有する。また、通知されたトランザクション情報をデータベース14に格納する。
【0025】
影響サービス解析機能13は、データベース14に保存された情報を基に、障害情報が通知された際、影響サービスを解析する。
【0026】
データベース14は、影響サービスを解析するために必要な情報を保存する。例えば、提供(予約)されているネットワークリソースの端点のIPアドレス、ポート番号、およびQoS値を保存する。これらの情報はネットワーク管理システム3が監視するネットワークに、サービスが追加・更新された場合に追加・更新される。また、障害通知機能11に通知された障害状態の情報を保存する。
【0027】
図4は、影響サービス特定装置が影響を受けるサービスを特定するフローチャートを示す。本フローチャートに基づいて、影響サービス特定装置1の動作を説明する。
【0028】
S1.各MEPが、対向MEPのCCM断を検出する。各MEPがイーサネット(登録商標)OAM管理システム2に障害を通知し、イーサネット(登録商標)OAM管理システム2がネットワーク障害発生を障害通知機能11に通知する。通知された障害情報をデータベース14に格納すると共に、影響サービス解析機能13に解析を依頼する。
【0029】
S2.影響サービス解析機能13は、障害により影響を受けるサービスを抽出する。なお、抽出方法は別途説明する。影響サービス解析機能13は、抽出したサービスの提供(予約)端点(A点、Z点)のMEPにおいて、ピアMEP IDを有するCCMが受信されているか否かを確認する。具体的には、端点AのMEPでは、端点ZのMEP IDを有するCCMが受信可能か否かを確認し、端点ZのMEPでは、端点AのMEP IDが受信可能を有するCCMか否かを確認する。
【0030】
S3.端点AのMEPにおいて、端点ZのMEP IDが受信可能かつ、端点ZのMEPにおいて、端点AのMEP IDが受信可能であった場合、S4に進む。逆に、どちらか一方の端点、もしくは、両方の端点において、ピアMEP IDが受信出来ない場合は、S5に進む。
【0031】
S4.この場合、提供(予約)サービスは、障害の影響を受けていないことになり、このまま終了する。
【0032】
S5.この場合、提供(予約)サービスは、障害の影響を受けていることが判明する。
【0033】
S6.障害によるサービスへの影響が確認された場合、障害発生地点を特定する必要がある時、S7に進み。エンドエンドでのサービスが不可能であることだけ分かれば良いのであれば、そのまま終了する。
【0034】
S7.提供(予約)サービスの端点間にリンクトレースを実行する。
【0035】
S8.障害発生地点を特定し、終了する。
【0036】
以上のようにして、影響サービス特定装置1は、ネットワークにおいて障害発生時に、、実際に影響を受ける提供(予約)サービスを確実かつ迅速に特定する。また、リンクトレースを実行することにより、障害発生地点を特定することもできる。また、本発明の方式の場合、障害により実際に影響を受ける区間のみにリンクトレースを実行し、従来技術のように全てのサービス区間においてリンクトレースを実行しないため、障害発生地点の特定に多くの時間を必要としない。
【0037】
図5は、影響を受けるサービス候補を抽出するフローチャートを示す。本フローチャートに基づいて、S2での障害により影響を受ける提供(予約)サービスを抽出する方法を説明する。ここでは障害発生IPアドレスを基に、ネットワーク管理システム3から得られるトランザクション情報を用いて、影響を受けるサービスを抽出する
【0038】
S51.障害発生IPアドレスを検出する。このIPアドレスはイーサネット(登録商標)OAM管理システム2からの障害通知に含まれ、障害通知機能11から通知される。
【0039】
S52.トランザクション情報に含まれているシングル予約をひとつ抽出する。なお、シングル予約は、A点、Z点を結ぶネットワークリソースの予約情報を示し、A点、Z点は、リソース予約で指定される2つの端点を示す。
【0040】
S53.抽出されたシングル予約の両端点(A点、Z点)のどちらかのIPアドレスが障害発生IPアドレスと一致するか確認する。どちらかの端点のIPアドレスが障害発生IPアドレスと一致する場合、S54に進み、それ以外は、S55に進む。
【0041】
S54.上記のシングル予約を障害発生箇所の影響サービス候補として選択し、影響サービス一覧に追加する。
【0042】
S55.トランザクション情報に含まれている全てのシングル予約に対して、S52からS54までの処理を繰り返した後、影響サービス抽出を終了する。
【0043】
次に、影響サービス特定装置が障害発生時に影響サービスを特定する例を示す。最初は、MEPが3つの図1のネットワークで説明する。図6は、図1のネットワークで障害が発生した場合に、影響サービスを特定する例を示す。
【0044】
図6のように<MIP1>−<MIP2>間に障害が発生したとする。各MEPは次のように障害を検出する。MEP1は、MEP3からのCCMが届かないため、障害を検出する。同様にMEP2は、MEP3からのCCMが届かないため障害を検出し、MEP3は、MEP1およびMEP2からのCCMが届かないため障害を検出する。
【0045】
次に、各MEPは、CCMのピアMEP IDを確認する。MEP1が、受信可能なピアMEP IDを確認すると、MEP2のMEP IDの受信を確認できる。MEP2が、受信可能なピアMEP IDを確認すると、MEP1のMEP IDの受信を確認できる。MEP3が、受信可能なピアMEP IDを確認すると、MEP1およびMEP2からのMEP IDの受信が確認できない。
【0046】
上記で得られた情報を用いて、サービス提供(予約)端点のMEPにおいて、ピアMEP IDが受信されているか確認する。端点AのMEPでは、端点ZのMEP IDが受信可能か確認する。端点ZのMEPでは、端点AのMEP IDが受信可能か確認する。この時、端点AのMEPにおいて、端点ZのMEP IDが受信可能かつ、端点ZのMEPにおいて、端点AのMEP IDが受信可能であれば、サービスは、障害の影響は受けていないことになる。表1に、端点A、端点ZにおけるMEP IDの確認組み合わせを示す。
【0047】
【表1】

表1において、#1は、通信路に障害が発生していない場合を示す。#2は、通信路の両方向に障害が発生した場合を示す。また、#3、4は、通信路の片方向に障害が発生した場合を示す。
【0048】
例えば、端点AがMEP1であり、端点ZがMEP2であった場合、#1に該当し、障害により影響を受けていないことが確認できる。また、端点AがMEP1であり、端点ZがMEP3であった場合、#2に該当し、障害により影響を受けていることが確認できる。
【0049】
次に、一般的なネットワークで影響サービス特定装置が影響サービスを特定する例を示す。図7は、ツリー状ネットワークの例を示す。図8は、図7のネットワークで障害が発生した場合に、影響サービスを特定する例を示す。
【0050】
ここで、端点はMEP(1)、MEP(2)、MEP(α)・・・MEP(η)とし、中継点はMIP(1)、MIP(2)、MIP(m)・・・MIP(s)とする。各MEP間は、CCMにより接続性が確認されており、CCMが届かなくなった場合に障害を検出する。ここで、図8のように<MIP(2)>−<MIP(n)>間に障害が発生した場合を考える。この障害により、各MEPは以下のような振る舞いをする。
【0051】
MEP(1)は、MEP(2)〜MEP(α)からのCCMが届かないため障害を検出する。MEP(2)〜MEP(α)は、MEP(2)〜MEP(α)以外からのCCMが届かないため障害を検出する。MEP(β)〜MEP(η)は、MEP(2)〜MEP(α)からのCCMが届かないため障害を検出する。なお、従来の方法の場合、サービス提供端点が[MEP(1)]−[MEP(β)]間であった場合、[MEP(1)]−[MEP(β)]間は実際には障害の影響を受けていないが、各MEPにおいてCCM断による障害が検出されるため、[MEP(1)]−[MEP(β)]間のサービスは影響を受けるサービスと判定されてしまう場合がある。
【0052】
次に、各MEPにおいて、CCMのピアMEP IDを確認する。MEP(1)が、受信可能なピアMEP IDを確認すると、MEP(2)〜MEP(α)からのMEP IDを確認できない(破線)。MEP(2)〜MEP(α)が、受信可能なピアMEP IDを確認すると、MEP(2)〜MEP(α)以外のMEP IDを確認できない(破線、点線、一点鎖線)。MEP(β)〜MEP(η)が、受信可能なピアMEP IDを確認すると、MEP(2)〜MEP(α)からのMEP ID受信を確認できない(点線、一点鎖線)。
【0053】
上記で得られた情報を用いて、サービス提供(予約)端点Aと端点ZのMEPにおいて、どのピアMEP IDが受信されているか確認する。端点AのMEPでは、端点ZのMEP IDが受信可能か確認する。端点ZのMEPでは、端点AのMEP IDが受信可能か確認する。この時、端点AのMEPにおいて、端点ZのMEP IDが受信可能かつ、端点ZのMEPにおいて、端点AのMEP IDが受信可能であれば、サービスは、障害の影響は受けていないことになる。また、端点A、Z両方から、もしくは、片方からのMEP IDが確認できない場合は、提供(予約)サービスに影響が及んでいることになる。端点A、端点ZにおけるMEP IDの確認組み合わせは表1と同じになる。
【0054】
表1の#2〜4の場合は、[MEP(1)]−[MEP(2)〜MEP(α)]間で実際に障害が発生していることが判断できる。これにより、障害発生時に実際に影響を受ける稼働中サービスは、[MEP(1)]−[MEP(2)〜MEP(α)]間で提供されているサービスであることを特定することができる。
【0055】
また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様および変更態様で実施することができる。従って本発明の範囲は特許請求の範囲およびその均等範囲によってのみ規定されるものである。
【符号の説明】
【0056】
1 影響サービス特定装置
2 イーサネット(登録商標)OAM管理システム
3 ネットワーク管理システム
11 障害通知機能
12 通信機能
13 影響サービス解析機能
14 データベース

【特許請求の範囲】
【請求項1】
提供または予約サービスの端点情報を収集する収集手段と、
前記端点間の疎通を確認する確認手段と、
前記端点からの障害情報を収集する障害通知手段と、
前記障害情報と前記端点情報から、前記障害により影響を受けるサービス候補を抽出する抽出手段と、
前記抽出された影響サービス候補の端点間の疎通を前記確認手段により確認することで、障害により影響を受けるサービスを特定する特定手段と、
を備えていることを特徴とする影響サービス特定装置。
【請求項2】
前記確認手段は、前記サービスの端点において受信可能なCCMのMEP IDを確認することにより前記端点間の疎通を確認する手段であることを特徴とする請求項1に記載の影響サービス特定装置。
【請求項3】
前記抽出手段は、
前記障害情報から障害発生IPアドレスを取り出し、
前記端点情報の全てのシングル予約に対して、
前記障害発生IPアドレスが前記シングル予約の端点のIPアドレスのいずれかと等しいか比較し、等しい場合、該シングル予約を影響サービス候補として抽出する手段であることを特徴とする請求項1または2に記載の影響サービス特定装置。
【請求項4】
前記特定手段により特定された影響を受けるサービスの端点間にリンクトレースを実行し、障害発生地点を特定する手段をさらに備えていることを特徴とする請求項1から3のいずれか1項に記載の影響サービス特定装置。
【請求項5】
提供または予約サービスの端点情報を収集する収集ステップと、
前記端点からの障害情報を収集する障害通知ステップと、
前記障害情報と前記端点情報から、前記障害により影響を受けるサービス候補を抽出する抽出ステップと、
前記抽出された影響サービス候補の端点間の疎通を確認することで、障害により影響を受けるサービスを特定する特定ステップと、
を含むことを特徴とする影響サービス特定方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2010−206582(P2010−206582A)
【公開日】平成22年9月16日(2010.9.16)
【国際特許分類】
【出願番号】特願2009−50277(P2009−50277)
【出願日】平成21年3月4日(2009.3.4)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】