説明

故障管理システムおよび故障管理方法

【課題】ブリッジ装置におけるMACアドレス学習情報の有無に関係なく、イーサネットにおける故障箇所を特定することを課題とする。
【解決手段】故障管理装置は、ブリッジネットワーク内に構築されたVLANごとに、MEPを、通信断検出グループと通信断非検出グループにそれぞれグループ化する。さらに、故障管理装置は、通信断検出グループおよび通信断非検出グループについて、グループ内のMEP間の経路上にあるポート、さらに、通信断検出グループに属するMEPから通信断非検出グループに属するMEPへ向う経路上の送信側のポートをネットワーク内で導通がとれている箇所として特定する。そして、故障管理装置は、ネットワーク内で導通がとれている箇所として特定したポート、回線、またはブリッジ装置以外の、ポート、回線またはブリッジ装置を故障箇所候補として抽出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、故障管理システムおよび故障管理方法に関する。
【背景技術】
【0002】
従来、異なるネットワークセグメント同士を接続するブリッジ装置から構成されるEthernet(登録商標、以下、イーサネットと記載する。)における故障検出・故障箇所特定に、Ping(Packet internet groper)を用いられている。Pingとは、TCP/IP(Transmission Control Protocol/Internet Protocol)のプロトコルを用いるインターネットやイントラネットなどのネットワーク診断を行うプログラムである。
【0003】
しかし、Pingは、ネットワーク層の技術であるIP(Internet Protocol)における故障検出・故障箇所特定するための技術である。このため、イーサネットにおける故障検出・故障箇所特定にPingを用いた場合、故障が検出されても、IPが利用されるネットワーク層(レイヤ3)に問題があるのか、あるいは、イーサネットが利用されるデータリンク層(レイヤ2)に問題があるのかが判断できないという不都合が生じてしまう。
【0004】
このように、Pingは、イーサネットにおける故障検出・故障箇所特定に適した技術ではないので、イーサネットを保守管理するための技術として、Pingに代わる新たな技術の開発が進められている。例えば、イーサネットを保守管理するための技術の一つに、「Ethernet OAM(Operations,Administration,Maintenance)」がある(非特許文献1参照)。
【0005】
「Ethernet OAM」の代表的な機能として、例えば、CC(Continuity Check)やLT(Link Trace)などがある。CCは、保守・管理の対象となるネットワークの端点となるブリッジ装置のポート間で検査用のCCMフレームを定期的に送り、接続性を確認する機能である。また、LTは、LTMフレームを送信したときに、LTMフレームが途中通過した全てのポートがLTRフレームを返信する機能である。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】IEEE Computer Society,「IEEE Standards for Local and Metropolitan Area Networks:Virtual Bridged Local Area Networks Amendment 5:Connectivity Fault Management」,IEEE Std 802.1ag-2007,December 2007
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述した「Ethernet OAM」では、イーサネットの故障箇所を特定できない場合があるという課題があった。「Ethernet OAM」では、ブリッジ装置が保持するMAC(Media Access Control)アドレス学習情報を元にLTがLTMフレームを転送することで、OAM(操作、管理、保守)の中継点であるMIP(Maintenance Intermediate Point)、およびOAMの端点であるMEP(Maintenance End Point)の特定を可能としている。つまり、「Ethernet OAM」では、MAC(Media Access Control)アドレス学習情報がなければ、イーサネットの経路を特定できない。例えば、イーサネットに故障が発生し、疎通できないCCMフレームの送信元MACアドレスの学習情報は一定時間が経過すると自動的に消去される。このため、「Ethernet OAM」では、LTの機能を利用して、イーサネットの故障箇所を特定できない場合もあるという課題があった。
【0008】
本発明は、上記に鑑みてなされたものであって、ブリッジ装置におけるMACアドレス学習情報の有無に関係なく、イーサネットにおける故障箇所を特定することが可能な故障管理システムおよび故障管理方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するために、本発明は、イーサネットフレームを送受信する複数のポートを有する複数のブリッジ装置を収容するネットワークにおける通信を監視する故障管理装置を備えた故障管理システムであって、前記ネットワークの端点となるブリッジ装置のポートに対し、VLANごとに設定されたMEP間で通信断を検出するためのCCMフレームが送受信され、前記故障管理装置は、前記ネットワーク内に設定されたVLANごとの構成情報を記憶するVLAN情報記憶部と、前記MEPから通信断である旨の通知を受信した場合に、通信断となった対向MEPが同じであるMEPからなる通信断検出グループと、通信断を検出していないMEPからなる通信断非検出グループとを前記VLANごとに作成するグループ作成部と、前記構成情報を参照して、前記通信断検出グループに属するMEP間の経路上にあるポートおよび前記通信断非検出グループに属するMEP間の経路上にあるポートをそれぞれ特定するとともに、前記通信断非検出グループについては前記通信断検出グループに属するMEPから前記通信断非検出グループに属するMEPへ向う経路上の送信側のポートをさらに特定する特定部と、前記特定部により特定されなかったポート、当該ポートを有する回線、当該ポートを有するブリッジ装置のいずれか一つ又は複数を故障箇所の候補として抽出する故障箇所候補抽出部とを有することを特徴する。
【0010】
また、本発明は、イーサネットフレームを送受信する複数のポートを有する複数のブリッジ装置を収容するネットワークにおける通信を監視する故障管理装置を備えた故障管理システムにて行われる故障管理方法であって、前記ネットワークの端点となるブリッジ装置のポートに対し、VLANごとに設定されたMEP間で通信断を検出するためのCCMフレームが送受信され、前記故障管理装置は、前記MEPにて通信断が検出された場合には、前記ネットワーク内に設定されたVLANごとに、通信断となった対向MEPが同じであるMEPからなる通信断検出グループと、通信断を検出していないMEPからなる通信断非検出グループとを作成するグループ作成工程と、前記VLANの構成情報を参照して、前記VLANごとに、前記通信断検出グループに属するMEP間の経路上にあるポートおよび前記通信断非検出グループに属するMEP間の経路上にあるポートをそれぞれ特定するとともに、前記通信断非検出グループについては前記通信断検出グループに属するMEPから前記通信断非検出グループに属するMEPへ向う経路上の送信側のポートをさらに特定する特定工程と、前記特定工程により特定されなかったポート、当該ポートを有する回線、当該ポートを有するブリッジ装置のいずれか一つ又は複数を故障箇所の候補として抽出する故障箇所候補抽出工程とを含むことを特徴する。
【発明の効果】
【0011】
本発明によれば、ブリッジ装置におけるMACアドレス学習情報の有無に関係なく、イーサネットにおける故障箇所を特定することができる。
【図面の簡単な説明】
【0012】
【図1】図1は、実施例1に係る故障管理システムの全体構成を示す図である。
【図2】図2は、実施例1に係る故障管理装置の構成を示す機能ブロック図である。
【図3】図3は、VLAN単位の木構造の一例を示す図である。
【図4】図4は、グループ作成部および特定部による処理の一例を示す図である。
【図5】図5は、グループ作成部および特定部による処理の一例を示す図である。
【図6】図6は、グループ作成部および特定部による処理の一例を示す図である。
【図7】図7は、グループ作成部および特定部による処理の一例を示す図である。
【図8】図8は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【図9】図9は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【図10】図10は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【図11】図11は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【図12】図12は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【図13】図13は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【図14】図14は、通信断方向の判定方法の一例を示す図である。
【図15】図15は、通信断方向の判定方法の一例を示す図である。
【図16】図16は、通信断方向の判定方法の一例を示す図である。
【図17】図17は、ブリッジネットワークの故障箇所の表示例を示す図である。
【図18】図18は、ブリッジネットワークの故障箇所の表示例を示す図である。
【図19】図19は、実施例1に係る故障管理システムによる処理の流れを説明する図である。
【図20】図20は、故障管理装置の各種処理を実現するためのプログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0013】
以下に、図面を参照しつつ、本願に係る故障管理システムおよび故障管理方法の各実施例について詳細に説明する。後述する実施例は一例にすぎず、本願に係る故障管理システムおよび故障管理方法を限定するものではない。また、後述する各実施例は処理内容に矛盾を生じさせない範囲で適宜組み合わせることもできる。
【実施例1】
【0014】
[故障管理システムの構成(実施例1)]
図1は、実施例1に係る故障管理システムの全体構成を示す図である。図1に示すように、実施例1に係る故障管理システムは、通信ネットワーク1を介して、故障管理装置100とブリッジネットワークとが通信可能な状態に接続されて構成される。そして、故障管理装置100は、ブリッジネットワークにおける通信を監視する。
【0015】
実施例1に係る故障管理システムでは、図1に示すブリッジネットワークの構築に使用されるブリッジ装置などの各通信装置に対して、データリンク層(レイヤ2)で発生する様々な事象を保守・管理するための規格であるEthernet−OAMプロトコルを実装する。そして、実施例1に係る故障管理システムは、このEthernet−OAMプロトコルの機能を利用し、ブリッジネットワークの保守・管理を実行する。
【0016】
なお、Ethernet−OAMでは、保守・管理対象となるネットワークをMEG(Maintenance Entity Group)と呼ばれるグループ単位で管理する。そして、MEG内の終端となる通信装置にはネットワークの終端を示すMEP(MEG End Point)が設定され、MEG内の中継装置となる通信装置にはMIP(MEG Intermediate Point)が設定され、二つのMEP間の通信区間にはME(Maintenance Entity)が設定される。これに対応して、実施例1に係る故障管理システムでは、ブリッジネットワークに仮想サブネットとして設定されたVLAN(Virtual LAN)単位で保守・管理を行い、上述のMEPが設定されたブリッジ装置をPEとし、それ以外のブリッジ装置をCSとする。
【0017】
Ethernet−OAMプロトコルは、保守・管理対象であるネットワークの端点となるブリッジ装置のポート間でイーサネットフレームを送受信することで、データリンク層(レイヤ2)で発生する様々な事象を保守・管理するための機能を有する。例えば、Ethernet−OAMプロトコルは、CC(Continuity Check)機能、LB(Loop Back)機能、LT(Link Trace)機能を有する。
【0018】
CC機能は、管理対象グループの端点(終端)である自MEPと複数の対向MEP間の接続性を定常的に監視し、導通断、混入、ループの発生を検出するための機能である。具体的には、対向MEPが定期送信しているマルチキャストCCMフレームまたはユニキャストCCMフレームを受信することで、対向MEPとの接続性を確認する。また、CC機能は、自MEPからマルチキャストCCMフレームやユニキャストCCMフレームを、接続される他のMEPに対して定期送信することで、対向MEPにおいても自MEPとの接続性を確認することができる。
【0019】
また、LB機能は、自MEPと1ターゲットの対向MEPもしくはMIP間の双方向の接続性を確認するための機能である。具体的には、ターゲットとなるMEP(または、MIP)に対して、LBMフレームを送信し、当該ターゲットとなるMEP(または、MIP)からのLBMに対する応答として、LBRフレームを受信することで、双方向の接続性を確認する。
【0020】
また、LT機能は、自MEPと1ターゲットの対向MEPもしくはMIP間の経路を確認するための機能であり、経路確認ができる点から接続断発生時の障害箇所特定に活用される。具体的には、ターゲットとなるMEP(または、MIP)に対して、LTMフレームを送信し、その経路上にあるMIPが送信元MEPに対して、LTRフレームを送信し、かつ、LTMフレームを他の装置に転送する。最終的に、LT機能は、ターゲットとなるMEP(または、MIP)が、自MEPから送信されたLTMフレームに対してLTRフレームを応答することで、自MEPからターゲットとなるMEP(または、MIP)までの経路上にある全てのMEPおよびMIPからのLTRフレームを受信することができ、自MEPからターゲットまでのパスを確認することができる。
【0021】
例えば、このEthernet−OAMプロトコルでは、OAMフレームに、上述したCC、LB、LTのいずれかの試験の実施を識別するためのOPCODEを挿入する。例えば、CC機能による試験を実施する場合には、OPCODE=1、LB機能による試験を実施する場合には、OPCODE=2または3、LT機能による試験を実施する場合には、OPCODE=4または5などのように指定する。
【0022】
図2に、実施例1に係る故障管理装置100の機能構成を示す。図2は、実施例1に係る故障管理装置の構成を示す機能ブロック図である。なお、図2では、実施例1に係る故障管理装置100の機能を説明する上で必要となる機能のみを図示する。
【0023】
図2に示すように、実施例1に係る故障管理装置100は、VLAN情報記憶部101と、フロー情報記憶部102と、回線選択ロジック記憶部103と、物理構成情報記憶部104と、グループ作成部105と、特定部106と、故障箇所候補抽出部107と、判定部108と、表示部109とを有する。
【0024】
VLAN情報記憶部101は、ブリッジネットワークに仮想サブネットとして設定されたVLAN(Virtual LAN)に関する情報を記憶する。例えば、VLAN情報記憶部101は、VLANに収容されるブリッジ装置、ポートの接続関係、ポート間を接続する回線、STP(Spanning Tree Protocol)によるVLAN毎のブロッキングポートなどの情報を記憶する。
【0025】
フロー情報記憶部102は、ブリッジ装置のポートにて送受信されるトラヒックの情報をフロー情報として記憶する。例えば、フロー情報記憶部102は、ブリッジ装置ごとに、ポートごとのフロー情報と、フロー情報の取得時刻とを対応付けて記憶する。なお、フロー情報は、sFlowなどのトラヒックのモニタリング技術を用いて、故障管理装置100により適時取得される。
【0026】
回線選択ロジック記憶部103は、冗長構成されたLAG(Link Aggregation)論理ポートを構成する物理ポートの情報を記憶するとともに、冗長構成されたLAGの論理ポートの中から、フレームを割り当てる物理ポートを選択するためのロジックを記憶する。例えば、回線選択ロジック記憶部103は、ハッシュ値を用いたロジックやコンフィグを用いたロジックなどを記憶する。
【0027】
物理構成情報記憶部104は、ブリッジネットワークの物理構成に関する情報を記憶する。例えば、物理構成情報記憶部104は、物理構成に関する情報の一つとして、ブリッジネットワークに収容されるブリッジ装置のポートと、このポートに対向する対向ポートに関する情報を記憶する。
【0028】
物理構成情報記憶部104、VLAN情報記憶部101、回線選択ロジック記憶部103の情報から、図3に示すようにVLAN毎の構成情報を取得可能である。イーサネットにおけるVLAN毎の構成は必ず木構造になる特徴がある。例えば、図3に示す「VLAN100」には、MEPが設定された「PE1」〜「PE6」の6つのブリッジ装置と、「CS1」〜「CS4」の4つのブリッジ装置が収容されており、CS1を頂点とする木構造となる。図3は、VLAN単位の木構造の一例を示す図である。
【0029】
グループ作成部105は、通信断となった対向MEPが同じであるMEPからなる通信断検出グループと、通信断を検出していないMEPからなる通信断非検出グループとをVLANごとに作成する。
【0030】
特定部106は、グループ作成部105により作成された通信断検出グループおよび通信断非検出グループについて、グループ内のMEP間の経路上にあるポートを特定する。
【0031】
以下、図4〜図7を用いて、上述したグループ作成部105および特定部106による処理について具体的に説明する。図4〜図7は、グループ作成部および特定部による処理の一例を示す図である。
【0032】
(通信断検出グループ)
まず、図4および図5を用いて、通信断検出グループの作成および作成後の処理について説明する。図4に示すように、VLAN100には、MEPが設定されたブリッジ装置である「PE1」〜「PE6」と、それ以下のブリッジ装置「CS1」〜「CS4」が収容されている。
【0033】
グループ作成部105は、MEPが設定されたブリッジ装置から通信断である旨の通知(以下、LOC(Loss Of Continuity)の通知と記載する。)を受信すると、VLANごとに、LOCの通知を分類する。例えば、グループ作成部105は、受信したLOCの通知のうち、「MEP101〜MEP106」から受信したLOCの通知をVLAN100に関する通知として分類する。続いて、グループ作成部105は、通信断を検出したMEPのうち、対向MEPが同じMEP同士をグループ化した通信断(LOC)検出グループをVLANごとに作成する。例えば、グループ作成部105は、図4に示すように、VLAN100に関し、通信断を検出した「MEP101〜MEP106」のうち、対向MEP「MEP103〜MEP106」が同じである「MEP101,MEP102」を同一の通信断検出グループとする。同様に、グループ作成部105は、図4に示すように、VLAN100に関し、通信断を検出した「MEP101〜MEP106」のうち、対向MEP「MEP101,MEP102」が同じである「MEP103〜MEP106」を同一の通信断検出グループとする。
【0034】
続いて、特定部106は、グループ作成部105により作成された通信断検出グループについて、グループ内のMEP間の経路上にあるポートを特定する。例えば、特定部106は、図4のG1に示すように、同一の通信検出グループとされた「MEP101」と「MEP102」との経路上にある「CS2,PE1,PE2」の各ポート(図4中丸印)をそれぞれ特定する。同様に、特定部106は、図4のG2に示すように、同一の通信検出グループとされた「MEP103〜MEP106」の各MEP間の経路上にある「CS3,CS1,CS4,PE3〜PE6」の各ポート(図4中丸印)をそれぞれ特定する。
【0035】
次に、図5を用いて、ブリッジネットワークに設定されたVLAN200について、上述したグループ作成部105および特定部106による処理を説明する。図5に示すように、VLAN200には、MEPが設定されたブリッジ装置である「PE1」〜「PE4」と、それ以下のブリッジ装置「CS1」〜「CS3」が収容されている。
【0036】
グループ作成部105および特定部106は、図5に示すVLAN200についても、上述した図4に示すVLAN100と同様に処理を行う。すなわち、グループ作成部105は、図5に示すように、VLAN200に関し、通信断を検出した「MEP201〜MEP204」のうち、対向MEP「MEP203,MEP204」が同じである「MEP201,MEP202」を同一の通信断検出グループとする。同様に、グループ作成部105は、図5に示すように、VLAN200に関し、対向MEP「MEP201,MEP202」が同じである「MEP203,MEP204」を同一の通信断検出グループとする。
【0037】
続いて、特定部106は、図5のG1に示すように、同一の通信検出グループとされた「MEP201」と「MEP202」との経路上にある「CS2,PE1,PE2」の各ポート(図5中丸印)をそれぞれ特定する。同様に、特定部106は、図5のG2に示すように、同一の通信検出グループとされた「MEP203」と「MEP204」との経路上にある「CS3,PE3,PE4」の各ポート(図5中丸印)をそれぞれ特定する。
【0038】
(通信断非検出グループ)
続いて、図6および図7を用いて、通信断非検出グループの作成および作成後の処理について説明する。図6に示すVLAN100には、上述した図4と同様に、MEPが設定されたブリッジ装置である「PE1」〜「PE6」と、それ以下のブリッジ装置「CS1」〜「CS4」が収容されている。
【0039】
グループ作成部105は、受信したLOCの通知をVLANごとに分類した結果、通信断を検出していないMEPがある場合には、このMEP同士をグループ化した通信断非検出グループをVLANごとに作成する。例えば、図6に示すように、グループ作成部105は、受信したLOCの通知をVLANごとに分類した結果、VLAN100に関し、「MEP101,MEP102」にて通信断が検出されなかったものとする。この場合、グループ作成部105は、図6に示すように、VLAN100に関し、通信断を検出しなかった「MEP101,MEP102」を同一の通信断非検出グループとする。
【0040】
続いて、特定部106は、グループ作成部105により作成された通信断非検出グループについて、グループ内のMEP間の経路上にあるポートを特定する。さらに、特定部106は、通信断非検出グループについては、通信断検出グループから、通信断非検出グループに属するMEPへ向う経路上の送信側のポートをさらに特定する。特定部106は、例えば、図7に示すように、「PE3,CS3,CS1,CS2」の各ポートのうち、「MEP103」から「MEP101,MEP102」へ向う経路上の送信側のポートを特定する。
【0041】
故障箇所候補抽出部107は、上述の通信断検出グループおよび通信断非検出グループについて、VLANごとに特定されたポート、当該ポートを有する回線および当該ポートを有するブリッジ装置以外の、ポート、回線、またはブリッジ装置(つまり、特定部106により、VLANごとに特定されなかったポート、当該ポートを有する回線および当該ポートを有するブリッジ装置)を故障箇所の候補として抽出する。
【0042】
例えば、上述の図4に示す場合では、故障箇所候補抽出部107は、VLAN100について、図4に示すCS2の上部に設けられたポート(故障論理ポート候補1)、図4に示すCS1の下部左側に設けられたポート(故障論理ポート候補2)、故障論理ポート候補間の回線を故障箇所候補として抽出する。
【0043】
例えば、上述の図5に示す場合では、故障箇所候補抽出部107は、VLAN200について、図5に示すCS2の上部に設けられたポート(故障論理ポート候補1)、図5に示すCS1の下部左側に設けられたポート(故障論理ポート候補2)、図5に示すCS1の下部右側に設けられたポート(故障論理ポート候補3)、図5に示すCS3の上部に設けられたポート(故障論理ポート候補4)、各故障論理ポート候補間の回線、およびCS1装置を故障箇所候補として抽出する。
【0044】
続いて、故障箇所候補抽出部107は、故障箇所の候補として抽出した故障論理ポート候補が、冗長構成の物理ポートを仮想的に単一のポートとみなす、上述したLAG(Link Aggregation)の論理ポートである場合には、LAGの論理ポートをなす冗長な物理ポートから故障箇所候補となるポートを絞り込む。
【0045】
具体的には、故障箇所候補抽出部107は、フロー情報記憶部102から、LOCの通知を受信した時刻を基準とした前後の所定時刻に対応するフロー情報を取得するとともに、回線選択ロジック記憶部103から回線選択ロジックを取得する。続いて、故障箇所候補抽出部107は、故障論理ポート候補として抽出した論理ポートについて、LOCの通知があった後に転送フレーム数がゼロとなっているポートがある場合には、そのポートを故障箇所の物理ポートとして特定する。
【0046】
図8〜図13を用いて、故障箇所候補となるポートの絞込み方法について説明する。図8〜図13は、故障箇所候補となるポートの絞込み方法の一例を示す図である。
【0047】
例えば、図8に示すように、VLAN100について故障箇所候補として抽出された故障論理ポート候補1が「2/1〜2/4」の4つの物理ポートで構成され、故障論理ポート候補2が「2/11〜2/14」の4つの物理ポートで構成されているものとする。このとき、故障箇所候補抽出部107は、フロー情報および回線選択ロジックに基づいて、LOCの通知があった後(通信断検出後)に転送フレーム数がゼロとなっている物理ポートを特定する。図8に示すように、故障論理ポート候補1を構成する物理ポートの1つである「2/2」により転送されたフレーム数が、通信断検出後にゼロとなっているので、故障箇所候補抽出部107は、故障論理ポート候補1から物理ポート「2/2」を特定する。また、図8に示すように、故障論理ポート候補2を構成する物理ポートの1つである「2/12」により転送されたフレーム数が、通信断検出後にゼロとなっているので、故障箇所候補抽出部107は、故障論理ポート候補2から物理ポート「2/12」を特定する。
【0048】
また、図9に示すように、VLAN200について故障箇所候補として抽出された故障論理ポート候補1が「2/1〜2/4」の4つの物理ポートで構成され、故障論理ポート候補2が「2/11〜2/14」の4つの物理ポートで構成され、故障論理ポート候補3が「2/21〜2/24」の4つの物理ポートで構成され、故障論理ポート候補4が「2/1〜2/4」の4つの物理ポートで構成されているものとする。
【0049】
そして、図10に示すように、故障論理ポート候補3を構成する物理ポート「2/21〜2/24」には、通信断検出後に転送されたフレーム数がゼロとなっているものがない。よって、故障箇所候補抽出部107は、故障論理ポート候補3については物理ポートの特定を行わない。
【0050】
続いて、図11に示すように、故障論理ポート候補4を構成する物理ポートの1つである「2/2」により転送されたフレーム数が、通信断検出後にゼロとなっているので、故障箇所候補抽出部107は、故障論理ポート候補4から物理ポート「2/2」を特定する。
【0051】
続いて、図12に示すように、故障論理ポート候補1を構成する物理ポートの1つである「2/2」により転送されたフレーム数が、通信断検出後にゼロとなっているので、故障箇所候補抽出部107は、故障論理ポート候補1から物理ポート「2/2」を特定する。
【0052】
続いて、図13に示すように、故障論理ポート候補2を構成する物理ポートの1つである「2/12」により転送されたフレーム数が、通信断検出後にゼロとなっているので、故障箇所候補抽出部107は、故障論理ポート候補1から物理ポート「2/12」を特定する。
【0053】
このように、故障箇所候補抽出部107は、故障箇所の候補として抽出した故障論理ポート候補のそれぞれについて、上述してきた処理を実行する。
【0054】
図1に戻り、判定部108は、故障箇所候補抽出部107により特定された物理ポート間を接続する物理回線の通信断の方向を判定する。
【0055】
図14〜図16は、通信断方向の判定方法の一例を示す図である。図14に示すように、判定部108は、物理構成情報記憶部104に記憶されている物理構成情報を参照して、故障箇所候補として特定した物理ポートである故障物理ポート候補Aに対向するポートを検索する。検索の結果、判定部108は、故障物理ポート候補Aに対向するポートが故障物理ポート候補Bである場合には、故障物理ポート候補Aと故障物理ポート候補Bとを接続する物理回線の通信断方向を両方向と判定する。
【0056】
同様にして、例えば、図15に示すように、判定部108は、故障物理ポート候補Aに対向するポートが故障物理ポート候補ではない場合(故障なしである場合)には、故障物理ポート候補Aと対向ポートとを接続する物理回線の通信断方向を片方向と判定する。
【0057】
同様にして、例えば、図16に示すように、故障物理ポート候補Aに対向するポートが故障物理ポート候補Bであり、故障物理ポート候補Cの対向ポートが故障物理ポート候補ではない場合(故障なしである場合)には、故障物理ポート候補Aと故障物理ポート候補Bとを接続する物理回線の通信断方向を両方向と判定し、故障物理ポート候補Cと対向ポートとを接続する物理回線の通信断方向を片方向と判定する。
【0058】
そして、判定部108は、図16に示すように、故障箇所候補として、双方向通信断の物理回線と、片方向通信断の物理回線とが存在する場合には、双方向通信断の物理回線を故障箇所候補とする。
【0059】
上述してきた処理によって、保守・管理対象となるブリッジネットワークについて、VLANごとに、故障箇所の候補である物理ポートおよび物理回線の通信断の方向が特定される。
【0060】
表示部109は、上述してきた故障箇所候補抽出部107および判定部108の処理結果に基づいて、ブリッジネットワークについての故障箇所の表示を行う。例えば、表示部109は、通信断を検出していない場合には、ブリッジネットワークを単一の仮想的なハブとして表示し、通信断を検出している場合には、ブリッジネットワークを通信断検出グループまたは通信断非検出グループごとに仮想的なハブとして表示し、上述してきた処理により特定された故障箇所の候補を仮想的なハブの間の回線の故障として表示する。
【0061】
図17および図18は、ブリッジネットワークの故障箇所の表示例を示す図である。表示部109は、例えば、図17に示すように、VLAN100について、「大阪・福岡」を収容する仮想的なハブを表す立体モデルと、「名古屋・東京・札幌」を収容する仮想的なハブを表す立体モデルとの間で通信断が発生している様子を表示する。また、図18に示すように、表示部109は、図17と同様の表示に合わせて、不通となっているIPアドレスの一覧を付随情報として表示する。
【0062】
[故障管理システムによる処理(実施例1)]
以下、図19を用いて、実施例1に係る故障管理システムによる処理の流れを説明する。なお、図19に示す処理は、例えば、MEPからLOCの通知を受信したタイミングで開始される。
【0063】
図19に示すように、グループ作成部105は、MEPからLOCの通知を受信すると、VLAN単位にLOCの通知を分類する(S1)。続いて、グループ作成部105は、LOCの対向MEPが同じMEPをグループ化する(S2)。
【0064】
続いて、グループ作成部105は、LOCを分類した結果、LOC非検出MEPがあるか否かを判定する(S3)。
【0065】
判定の結果、LOC非検出MEPがない場合には(S3、No)、特定部106は、S2にてグループ化したグループ内のMEP間の経路上にあるポートを特定する(S4)。
【0066】
一方、LOC非検出MEPがある場合には(S3、Yes)、グループ作成部105は、LOC非検出MEPを新たなグループとする(S5)。続いて、特定部は、S5にてグループ化したグループ内のMEP間の経路上にあるポートを特定し(S4)、さらに、LOC非検出グループ以外からLOC検出グループに向う経路の送信ポートを特定する(S6)。
【0067】
続いて、故障箇所候補抽出部107は、上述したS4やS6にて特定されていないポートを故障箇所候補として抽出する(S7)。続いて、故障箇所候補抽出部107は、故障箇所候補として抽出したポートがLAGの論理ポートであるか否かを判定する(S8)。
【0068】
判定の結果、故障箇所候補として抽出したポートがLAGの論理ポートである場合には(S8、Yes)、故障箇所候補抽出部107は、物理ポートごとに選択するフロー情報を分類し(S9)、該ポートを送信ポートとするフローのうち、特定の物理ポートを選択するフローがLOC検出時刻前後でゼロに変化するかを判定する(S10)。判定の結果、特定の物理ポートを選択するフローがゼロに変化する場合には(S10、Yes)、その物理ポートを故障物理ポートとして特定する(S11)。言い換えれば、故障箇所候補抽出部107は、LAGの論理ポートをなす冗長な物理ポートから故障箇所候補となるポートを絞り込む。具体的には、故障箇所候補抽出部107は、LOCの通知があった後に特定の物理ポートを選択するフローがゼロに変化したポートがある場合には、そのポートを故障箇所の物理ポートとして特定する。
【0069】
続いて、故障箇所候補抽出部107は、他の故障箇所ポートがあるか、つまり、他に、故障箇所候補のポートが残っているか否かを判定する(S12)。判定の結果、故障箇所候補のポートが残っている場合には(S12、Yes)、故障箇所候補抽出部107は、上述したS8の処理に戻る。一方、判定の結果、故障箇所候補のポートが残っていない場合には(S12、No)、判定部108は、故障物理ポート群(候補)について、各ポートの対向物理ポートの状況に応じて、通信断の片方向/双方向をチェックする(S13)。そして、表示部109は、ブリッジネットワークについての故障箇所を表示し(S14)、処理を終了する。
【0070】
また、上述したS10において、LAGの論理ポートを送信ポートとするフローのうち、いずれの物理ポートに対しても選択するフローがLOC検出時刻前後でゼロに変化しない場合には(S10、No)、その物理ポートを故障物理ポートではないものとして(S15)、故障物理ポートとして特定はせず、上述したS12の判定に移行する。
【0071】
[実施例1による効果]
上述してきたように、故障管理装置100は、ブリッジネットワーク内に構築されたVLAN(図3参照)ごとに、MEPを、通信断検出グループと通信断非検出グループにそれぞれグループ化する。例えば、故障管理装置100は、通信断が検出されたMEPについて、対向MEPが同じMEP同士を通信断検出グループとし、通信断が検出されていないMEP同士を通信断非検出グループとする。さらに、故障管理装置100は、通信断検出グループおよび通信断非検出グループについて、グループ内のMEP間の経路上にあるポート、さらに、通信断検出グループから通信断非検出グループへ向う経路上の送信側のポートをネットワーク内で導通がとれている箇所として特定する。そして、故障管理装置100は、ネットワーク内で導通がとれている箇所として特定したポート、当該ポートを有する回線、および当該ポートを有するブリッジ装置以外の、ポート、回線、またはブリッジ装置を故障箇所候補として抽出する。このようなことから、実施例1に係る故障管理システムによれば、ブリッジ装置におけるMACアドレス学習情報の有無に関係なく、イーサネットにおける故障箇所を特定することができる。
【0072】
また、故障管理装置100は、故障箇所候補として抽出されたポートがLAGの論理ポートである場合には、フロー情報および回線選択ロジックに基づいて、LAGの論理ポートをなす冗長な物理ポートから故障箇所候補となる物理ポートを特定する。このようなことから、実施例1に係る故障管理システムによれば、VLANで故障箇所の候補として抽出されたLAGの論理ポートを、故障箇所の候補となる物理ポートにまで展開させることができる。
【0073】
また、故障管理装置100は、ブリッジネットワークの物理構成情報に基づいて、故障物理ポート候補と対向する物理ポートを特定し、対向する物理ポートが故障箇所候補であるか否かに基づいて、物理ポート間の物理回線の通信断の方向を判定する。そして、故障管理装置100は、双方向通信断の物理回線と、片方向通信断の物理回線とが存在する場合には、双方向通信断の物理回線を故障箇所候補とする。このように、実施例1に係る故障管理システムによれば、故障箇所の候補となる物理ポートから、故障箇所の候補となる物理回線とその通信断の方向性にまで展開させることができるので、より故障箇所である可能性が高い箇所を絞り込むことができる。
【0074】
また、故障管理装置100は、故障箇所候補として抽出されたポート、回線、またはブリッジ装置が、同一のVLAN内に複数ある場合には、他のVLANにて重複して抽出されているものを故障箇所候補として選択することができる。これにより、より故障箇所である可能性が高い箇所を絞り込むことができる。
【0075】
また、故障管理装置100は、通信断を検出していない場合には、ブリッジネットワークを単一の仮想的なハブとして表示し、通信断を検出している場合には、ブリッジネットワークを通信断検出グループまたは通信断非検出グループごとに仮想的なハブとして表示し、上述してきた処理により特定された故障箇所の候補を仮想的なハブの間の回線の故障として表示する。このようなことから、ブリッジネットワーク内の故障箇所を、ネットワーク管理者およびネットワーク利用者に分かりやすく提供できる。
【0076】
また、故障管理装置100は、不通となっているIPアドレスの一覧を付随情報として表示する。このようなことから、ネットワーク管理者およびネットワーク利用者に、故障箇所に関連する情報を提供できる。
【0077】
なお、上述してきた実施例1において、ブリッジ装置をブリッジネットワークに追加・削除をする場合、あるいはMEPの追加・削除をする場合に、ブリッジネットワークの既存部分の監視に影響を与えることは好ましくない。すなわち、既存の試験フレームの送受信を停止することなく、ブリッジやMEPの追加削除を可能とすることが好ましい。そこで、例えば、ブリッジ装置のMEPにおけるLOC監視の有効無効は予め設定した対向MEP毎に設定できるようにすることができる。
【0078】
なお、故障管理装置100は、上述してきた実施例1では、ネットワーク内で導通がとれている箇所として特定したポート、当該ポートを有する回線、および当該ポートを有するブリッジ装置を特定し、特定されなかったポート等を故障箇所候補として抽出する場合を説明した。しかしながら、これに限定されるものではなく、ネットワーク内で導通がとれている箇所として特定されなかったポート、回線、ブリッジ装置のいずれか一つまたは複数を、故障箇所候補として抽出するようにしてもよい。迅速かつ簡便に、故障箇所の可能性がある箇所のあたりをつける場合などに有効である。
【実施例2】
【0079】
以下、本発明にかかる故障管理システムおよび故障管理方法の他の実施形態として実施例2を説明する。
【0080】
(1)装置構成等
図1に示した故障管理装置100の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、故障管理装置100の分散または統合の具体的形態は図1に示すものに限られず、例えば、グループ作成部105と特定部106とが機能的あるいは物理的に統合されていてもよい。このように、故障管理装置100の各構成要素の全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0081】
(2)故障管理方法
実施例1で説明した故障管理システムにより、以下のような故障管理方法が実現される。
【0082】
フレームを送受信する複数のポートを有する複数のブリッジ装置を収容するネットワークと、該ネットワークにおける通信を監視する故障管理装置とで構成される故障管理システムにおいて、故障管理装置が行う故障管理方法であって、ネットワークの端点となるブリッジ装置のポートに設定されたMEP間で、通信断を検出するためのCCMフレームが送受信され、故障管理装置は、MEPにて通信断が検出された場合には、ネットワーク内に設定されたVLANごとに、通信断となった対向MEPが同じであるMEPからなる通信断検出グループと、通信断を検出していないMEPからなる通信断非検出グループとを前記VLANごとに作成するグループ作成工程と(図19のS2,S5)、VLANの構成情報を参照して、VLANごとに、通信断検出グループおよび通信断非検出グループに属するMEP間の経路上にあるポートをそれぞれ特定するとともに、通信断非検出グループについては通信断検出グループから通信断非検出グループに属するMEPへ向う経路上の送信側のポートをさらに特定する特定工程と(図19のS4,S6)、特定工程により特定されなかったポート、当該ポートを有する回線および当該ポートを有するブリッジ装置を故障箇所の候補として抽出する故障箇所候補抽出工程と(図19のS7)を含む故障管理方法が実現される。
【0083】
また、実施例1で説明した故障管理装置100の各種の処理(例えば、図4〜図19等参照)は、あらかじめ用意されたプログラムをサーバやワークステーションなどのコンピュータで実行することによって実現することができる。
【0084】
そこで、以下では、図20を用いて、実施例1で説明した故障管理装置100の各種処理を実現するためのプログラムを実行するコンピュータの一例を説明する。図20は、故障管理装置の各種処理を実現するためのプログラムを実行するコンピュータの一例を示す図である。
【0085】
図20に示すように、故障管理装置100が有する機能と同様の機能を有するコンピュータ300は、例えば、メモリ301と、CPU(Central Processing Unit)302を有する。
【0086】
また、コンピュータ300は、図20に示すように、ハードディスクドライブインタフェース303と、光ディスクドライブインタフェース304を有する。
【0087】
また、コンピュータ300は、図20に示すように、シリアルポートインタフェース305と、ビデオアダプタ306と、ネットワークインタフェース307を有する。
【0088】
そして、コンピュータ300は、これらの各部301〜307をバス308によって接続する。
【0089】
メモリ301は、図20に示すように、ROM(Read Only Memory)及びRAM(Random Access Memory)を含む。ROMは、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。
【0090】
ハードディスクドライブインタフェース303は、図20に示すように、ハードディスクドライブ309に接続される。光ディスクドライブインタフェース304は、図20に示すように、光ディスクドライブ310に接続される。例えば、光ディスクドライブ310には、光ディスク等の着脱可能な記憶媒体が挿入される。
【0091】
シリアルポートインタフェース305は、図20に示すように、例えば、マウス400およびキーボード500に接続される。ビデオアダプタ306は、図20に示すように、例えば、ディスプレイ600に接続される。
【0092】
ここで、図20に示すように、ハードディスクドライブ309は、例えば、OS(Operating System)、アプリケーションプログラム、プログラムモジュール、プログラムデータを記憶する。
【0093】
すなわち、上述した故障管理装置100と同様の機能を実現するプログラムは、コンピュータ300によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ309に記憶される。つまり、上述の実施例1で説明した故障管理装置100と同様の処理(図4〜図19等)を実行する手順が記述されたプログラムモジュールが、ハードディスクドライブ309に記憶される。このプログラムモジュールは、例えば、上述の実施例1で説明したグループ作成部105と、特定部106と、故障箇所候補抽出部107と、判定部108と、表示部109により実行される処理と同様の機能を実現する。
【0094】
また、故障管理装置100と同様の機能を実現するプログラムによる処理に用いられるデータは、プログラムデータとして、例えばハードディスクドライブ309に記憶される。例えば、このプログラムデータは、上述の実施例1で説明したVLAN情報記憶部101と、フロー情報記憶部102と、回線選択ロジック記憶部103と、物理構成情報記憶部104などに記憶される各種情報に対応する。
【0095】
そして、CPU302が、ハードディスクドライブ309に記憶されたプログラムモジュールやプログラムデータを必要に応じてRAMに読み出し、上述の実施例1で説明したものと同様の処理(図4〜図19等)を実行するための手順を実行する。
【0096】
なお、プログラムモジュールやプログラムデータは、ハードディスクドライブ309に記憶される場合に限られるものではなく、例えば、着脱可能な記憶媒体である光ディスクドライブ310等に記憶されていてもよい。この場合には、CPU302が、光ディスクドライブ310を介して、プログラムモジュールやプログラムデータを読み出す。あるいは、プログラムモジュールやプログラムデータは、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されていてもよい。この場合には、CPU302が、ネットワークインタフェース307を介して、プログラムモジュールやプログラムデータを他のコンピュータから読み出す。
【0097】
なお、プログラムによりCPU302が動作して各種処理を行う代わりに、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの電子回路を用いて処理を行うこともできる。また、メモリ301として、フラッシュメモリ(flash memory)などを用いることもできる。
【符号の説明】
【0098】
1 通信ネットワーク
100 故障管理装置
101 VLAN情報記憶部
102 フロー情報記憶部
103 回線選択ロジック記憶部
104 物理構成情報記憶部
105 グループ作成部
106 特定部
107 故障箇所候補抽出部
108 判定部
109 表示部
300 コンピュータ
301 メモリ
302 CPU
303 ハードディスクドライブインタフェース
304 光ディスクドライブインタフェース
305 シリアルポートインタフェース
306 ビデオアダプタ
307 ネットワークインタフェース
308 バス
309 ハードディスクドライブ
400 マウス
500 キーボード
600 ディスプレイ

【特許請求の範囲】
【請求項1】
イーサネットフレームを送受信する複数のポートを有する複数のブリッジ装置を収容するネットワークにおける通信を監視する故障管理装置を備えた故障管理システムであって、
前記ネットワークの端点となるブリッジ装置のポートに対し、VLANごとに設定されたMEP間で通信断を検出するためのCCMフレームが送受信され、
前記故障管理装置は、
前記ネットワーク内に設定されたVLANごとの構成情報を記憶するVLAN情報記憶部と、
前記MEPから通信断である旨の通知を受信した場合に、通信断となった対向MEPが同じであるMEPからなる通信断検出グループと、通信断を検出していないMEPからなる通信断非検出グループとを前記VLANごとに作成するグループ作成部と、
前記構成情報を参照して、前記通信断検出グループに属するMEP間の経路上にあるポートおよび前記通信断非検出グループに属するMEP間の経路上にあるポートをそれぞれ特定するとともに、前記通信断非検出グループについては前記通信断検出グループに属するMEPから前記通信断非検出グループに属するMEPへ向う経路上の送信側のポートをさらに特定する特定部と、
前記特定部により特定されなかったポート、当該ポートを有する回線、当該ポートを有するブリッジ装置のいずれか一つ又は複数を故障箇所の候補として抽出する故障箇所候補抽出部と
を有することを特徴する故障管理システム。
【請求項2】
前記ブリッジ装置は、自装置のポートと、該ポートにて送受信されるトラヒックの情報とを対応付けたフロー情報を前記故障管理装置に送信し、
前記故障管理装置は、
前記フロー情報と該フロー情報の取得時刻とを対応付けて記憶するフロー情報記憶部と、
前記ブリッジ装置間を接続する冗長構成の回線に関する回線選択ロジック情報を記憶する回線選択ロジック情報記憶部とをさらに有し、
前記故障箇所候補抽出部は、故障箇所の候補として抽出したポートが冗長構成のポートを仮想的に単一のポートとみなす論理ポートである場合に、前記通信断が検出された時刻を基準として該時刻前後のフロー情報を前記フロー情報記憶部から取得し、前記回線選択ロジック情報を前記回線選択ロジック情報記憶部から取得し、前記論理ポートを構成する物理ポートごとに、選択するフロー情報を分類し、前記通信断が検出された後に対応するフロー数がゼロに変化した物理ポートを、故障箇所候補のポートとして抽出することを特徴とする請求項1に記載の故障管理システム。
【請求項3】
前記故障管理装置は、
前記ネットワークの物理構成情報を記憶する物理構成情報記憶部と、
前記物理構成情報を参照して、前記故障箇所候補抽出部により抽出された物理ポートに対向する対向物理ポートを特定し、特定した対向物理ポートが故障箇所の候補である場合には、物理ポート間の回線が双方向通信断であると判定し、特定した対向物理ポートが故障箇所の候補ではない場合には、物理ポート間の回線が片方向通信断と判定する判定部と
をさらに有し、
前記故障箇所候補抽出部は、故障箇所の候補として、前記双方向通信断の回線と、前記片方向通信断の回線が残った場合には、前記双方向通信断の回線を故障箇所の候補として選択することを特徴とする請求項2に記載の故障管理システム。
【請求項4】
前記故障箇所候補抽出部により前記VLANごとに故障箇所の候補として抽出された物理ポート、当該物理ポートを有する回線、および当該物理ポートを有するブリッジ装置が、同一のVLAN内に複数ある場合には、他のVLANでも重複して選択されている物理ポート、当該物理ポートを有する回線、および当該物理ポートを有するブリッジ装置のいずれか一つ又は複数を故障箇所の候補として優先的に選択することを特徴とする請求項3に記載の故障管理システム。
【請求項5】
前記故障管理装置は、
通信断を検出していない場合には、前記ネットワークを単一の仮想的なハブとして表示し、通信断を検出している場合には、前記ネットワークを通信断検出グループまたは通信断非検出グループごとに仮想的なハブとして表示し、前記故障箇所候補抽出部により抽出された故障箇所の候補を仮想的なハブの間の回線の故障として表示する表示部をさらに有することを特徴とする請求項1〜4のいずれか一つに記載の故障管理システム。
【請求項6】
前記表示部は、前記故障箇所候補抽出部により抽出された故障箇所の候補を仮想的なハブの間の回線の故障として表示する場合に、該回線に接続された物理ポートに対応する付随情報を合わせて表示することを特徴とする請求項5に記載の故障管理システム。
【請求項7】
イーサネットフレームを送受信する複数のポートを有する複数のブリッジ装置を収容するネットワークにおける通信を監視する故障管理装置を備えた故障管理システムにて行われる故障管理方法であって、
前記ネットワークの端点となるブリッジ装置のポートに対し、VLANごとに設定されたMEP間で通信断を検出するためのCCMフレームが送受信され、
前記故障管理装置は、
前記MEPにて通信断が検出された場合には、前記ネットワーク内に設定されたVLANごとに、通信断となった対向MEPが同じであるMEPからなる通信断検出グループと、通信断を検出していないMEPからなる通信断非検出グループとを作成するグループ作成工程と、
前記VLANの構成情報を参照して、前記VLANごとに、前記通信断検出グループに属するMEP間の経路上にあるポートおよび前記通信断非検出グループに属するMEP間の経路上にあるポートをそれぞれ特定するとともに、前記通信断非検出グループについては前記通信断検出グループに属するMEPから前記通信断非検出グループに属するMEPへ向う経路上の送信側のポートをさらに特定する特定工程と、
前記特定工程により特定されなかったポート、当該ポートを有する回線、当該ポートを有するブリッジ装置のいずれか一つ又は複数を故障箇所の候補として抽出する故障箇所候補抽出工程と
を含むことを特徴する故障管理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2013−26928(P2013−26928A)
【公開日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願番号】特願2011−161376(P2011−161376)
【出願日】平成23年7月22日(2011.7.22)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】