説明

ネットワーク接続装置

【課題】階層型ネットワークに適用するネットワーク接続装置において、自装置内の部分的な故障を検出し、故障箇所を推定できるようにすることで、ネットワークの可用性を高めることのできるネットワーク接続装置を提供する。
【解決手段】ネットワーク接続装置1は、下位レイヤトポロジ情報を取得する下位レイヤトポロジ情報取得手段13と、上位レイヤトポロジ情報を取得する上位レイヤトポロジ情報取得手段12と、下位レイヤトポロジ情報と上位レイヤトポロジ情報を比較するトポロジ情報比較手段14と、トポロジ情報比較手段14のトポロジ情報比較の結果に基づいて故障箇所を推定する故障箇所推定手段15とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、上位レイヤと下位レイヤを含む階層型ネットワークにおいて、接続装置内部の故障を検出し、故障箇所を推定して、復旧動作を行なうネットワーク接続装置に関するものである。
【背景技術】
【0002】
従来、階層型ネットワークでは、ネットワークの冗長性を確保するため、各レイヤにおいてネットワークトポロジに応じたネットワーク構成管理プロトコルを用いてネットワーク経路の管理が行われていた。例えば、レイヤ2ネットワークの構成方法としてIEEE802.17 RPR(Resilient Packet Ring)や、レイヤ3ネットワークの構成方法としてRFC(Request for Comments)2328 OSPF(Open Shortest Path First)がある。これらはレイヤ毎に独立して動作し、経路制御を行なっていた。
また、下位レイヤの情報を利用して上位レイヤの制御を行なうネットワーク管理システムも提案されている(例えば、特許文献1参照)。
特許文献1のネットワーク管理システムでは、下位レイヤ回線の故障又は性能劣化をイベントとして検出し、イベントによって影響を受ける上位レイヤ回線を抽出し、上位レイヤ回線に関する制御を行なっている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−354038号公報(段落[0013]〜[0015]、[0082]、1図)
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のネットワーク管理システムでは、故障箇所が自装置内の部品故障やソフトウェア処理内の異常があった場合には、故障を正しく検出できず、通信が行なえなくなっていた。
例えば、下位レイヤ回線は正常で自装置内の受信処理部に部分的な故障が発生したとき、下位レイヤ回線異常のイベントが発行されないため、上位プロトコルでは異常を検出できない。
また、あるネットワークに複数のルータが接続され、それぞれのルータが当該ネットワークへの経路を外部に広告しているとき、あるルータで部分的な故障が発生すると、当該ルータは異常を検出できず、前記経路の広告を継続する。当該ルータをNext Hopとして選択している他ルータは、当該広告を受信し続けていることから当該ルータに向けてデータを送り続けるため、通信が行えなくなる問題があった。
【0005】
この発明は、上記のような問題点を解決するためになされたものであり、自装置内の部分的な故障を検出し、故障箇所を推定できるようにすることで、ネットワークの可用性を高めることのできるネットワーク接続装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
この発明に係るネットワーク接続装置は、下位レイヤトポロジ情報を取得する下位レイヤトポロジ情報取得手段と、上位レイヤトポロジ情報を取得する上位レイヤトポロジ情報取得手段と、下位レイヤトポロジ情報と上位レイヤトポロジ情報を比較するトポロジ情報比較手段と、トポロジ情報比較手段のトポロジ情報比較の結果に基づいて故障箇所を推定する故障箇所推定手段とを備えるものである。
【発明の効果】
【0007】
この発明に係るネットワーク接続装置は、下位レイヤトポロジ情報を取得する下位レイヤトポロジ情報取得手段と、上位レイヤトポロジ情報を取得する上位レイヤトポロジ情報取得手段と、下位レイヤトポロジ情報と上位レイヤトポロジ情報を比較するトポロジ情報比較手段と、トポロジ情報比較手段のトポロジ情報比較の結果に基づいて故障箇所を推定する故障箇所推定手段とを備えるものであるため、自装置内の部分的な故障を検出し、故障箇所を推定でき、ネットワークの可用性を高めることができる。
【図面の簡単な説明】
【0008】
【図1】この発明の実施の形態1のネットワーク接続装置に係るシステム構成図である。
【図2】この発明の実施の形態1のネットワーク接続装置に係る全体システム構成図である。
【図3】この発明の実施の形態1のネットワーク接続装置に係る状態遷移図である。
【図4】この発明の実施の形態1のネットワーク接続装置に係るトポロジ情報テーブルである。
【図5】この発明の実施の形態1のネットワーク接続装置に係るトポロジ情報テーブルである。
【図6】この発明の実施の形態1のネットワーク接続装置に係る機能故障説明図である。
【図7】この発明の実施の形態1のネットワーク接続装置に係るトポロジ情報テーブルである。
【図8】この発明の実施の形態1のネットワーク接続装置に係る機能故障説明図である。
【図9】この発明の実施の形態1のネットワーク接続装置に係るトポロジ情報テーブルである。
【図10】この発明の実施の形態1のネットワーク接続装置に係るトポロジ情報テーブルである。
【図11】この発明の実施の形態2のネットワーク接続装置に係るシステム構成図である。
【発明を実施するための形態】
【0009】
実施の形態1.
実施の形態1は、自装置内の部分的な故障を検出し、故障箇所を推定できるとともに、更に故障箇所に応じた復旧処理を行なえるネットワーク接続装置に関するものである。
以下、本願発明の実施の形態1について、図1から図10に基づいて説明する。図1はネットワーク接続装置のシステム構成図、図2は図1のネットワーク接続装置を使用するネットワーク全体のシステム構成図、図3は状態遷移図、図4、5はトポロジ情報テーブル、図6は機能故障説明図、図7はトポロジ情報テーブル、図8は機能故障説明図、図9、10はトポロジ情報テーブルである。
【0010】
まず、本願発明の実施の形態1に係るネットワーク接続装置のシステム構成について説明する。
図1は、本発明の実施の形態1に係るネットワーク接続装置1のシステム構成を表したものである。ネットワーク接続装置1は、大きく分けてネットワーク制御部および故障検出部の2つの主要部から構成される。
【0011】
ネットワーク制御部は、レイヤ3制御部2、レイヤ2制御部3、4およびレイヤ1制御部5、6、7から構成される。
レイヤ3制御部2は、レイヤ2制御部3、4に接続され、それぞれの間でレイヤ3インタフェースを持つ。また、レイヤ3制御部2は、レイヤ3プロトコルにより得たレイヤ3トポロジ情報を格納するレイヤ3トポロジデータベース8を備える。
レイヤ2制御部3は、レイヤ1制御部5に接続され、バス型のネットワーク10を構成している。
レイヤ2制御部4は、レイヤ1制御部6およびレイヤ1制御部7に接続され、両系を使用したリング状のネットワーク11を構成している。
また、レイヤ2制御部4は、レイヤ2プロトコルにより得たレイヤ2トポロジ情報を格納するレイヤ2トポロジデータベース9を備える。
【0012】
故障検出部は、上位レイヤトポロジ情報取得手段12、下位レイヤトポロジ情報取得手段13、故障箇所推定手段15および復旧処理手段16から構成される。
上位レイヤトポロジ情報取得手段12は、レイヤ3制御部3に接続され、レイヤ3トポロジデータベース8から上位レイヤトポロジ情報であるレイヤ3トポロジ情報を取得する。
下位レイヤトポロジ情報取得手段13は、レイヤ2制御部4に接続され、レイヤ2トポロジデータベース9から下位レイヤトポロジ情報であるレイヤ2トポロジ情報を取得する。
トポロジ情報比較手段14は、上位レイヤトポロジ情報取得手段12および下位レイヤトポロジ情報取得手段13に接続され、各々のトポロジ情報を取得して、トポロジ情報の比較を実施する。
故障箇所推定手段15は、トポロジ情報比較手段14に接続され、トポロジ情報比較手段14による比較の結果を取得し、この情報から故障箇所の推定を実施する。
復旧処理手段16は、故障箇所推定手段15に接続され、推定された故障箇所に応じた復旧処理を実施する。
【0013】
次に、ネットワーク接続装置1を使用したネットワーク全体のシステム構成を、図2に基づいて説明する。
リングノード21〜24は、幹線ネットワーク20でリング状に接続されている。各リングノード21〜24は、先に図1で説明したネットワーク接続装置1のシステム構成を備えている。
リングノード21、22は、支線ネットワーク30に接続され、この支線ネットワーク30は、ルータ25、26に接続され、ルータ25経由で、例えば他の支線ネットワーク32に接続されている。
また、リングノード23、24は、支線ネットワーク31に接続され、この支線ネットワーク31は、ルータ27、28に接続され、ルータ27経由で、例えば他の支線ネットワーク33に接続されている。
【0014】
ここで、図1と図2の対応を説明する。図1のネットワーク接続装置1が、リングノード21に該当するとして、以下の機能および動作説明をする。この場合、図1のネットワーク11が、図2の幹線ネットワーク20のA、Bに相当し、図1のネットワーク10は、図2のリングノード21と支線ネットワーク30の間のネットワークCに相当する。
また、図1のシステム構成を有するリングノード21から見て、リングノード22〜24は隣接ノード(隣接装置)である。
【0015】
次に、本願発明の実施の形態1に係るネットワーク接続装置1の機能および動作について、図1、図2のシステム構成図および図3〜図10の状態遷移図、トポロジ情報テーブル、機能故障説明図を用いて説明する。
【0016】
まず、ネットワークシステムの全体的な機能、動作について説明し、その後、ネットワーク接続装置1内に送信・受信機能故障が発生した場合のネットワーク接続装置1の機能および動作について説明する。
【0017】
ネットワークシステムの全体的機能、動作について説明する。
本実施の形態1では、上位レイヤのルーティングプロトコルとしてOSPF(Open Shortest Path First)を用いて、下位レイヤプロトコルとしてRPR(Resilient Packet Ring)を用いた例を想定して説明する。
【0018】
OSPFでは、接続される各ネットワークに対しHelloパケットを定期的に送信し、ネットワーク上の各OSPFルータは、Helloパケットを受信して、ネットワーク上に存在するOSPFルータを隣接ルータとして認識する。各隣接ルータとの関係はHelloプロトコル隣接状態として管理される。この隣接関係(ネイバ状態)はトポロジ情報の一部となっている。
隣接ルータとの接続関係は、LSA(Link State Advertisement)としてネットワーク上に広告され、各ルータがLSAをデータベース(LSDB:Link State DataBase)として保持し、LSDBをもとにルーティングテーブルを構築する。
RPRでは、各ノードをリング状に接続し、各ノードがそれぞれの物理アドレスを定期的にネットワーク上に広告し、各リングノードはそれらの広告情報を収集してノードの並び順情報を取得する。このノードの並び順情報はトポロジマップと呼ばれ、ネットワーク上の全ノードを認識可能である。
【0019】
ネットワーク接続装置1は、論理ネットワーク階層に沿った機能構成を取っており、レイヤ1物理層、レイヤ2データリンク層、レイヤ3ネットワーク層という階層構成を持つ。
レイヤ1物理層は、インタフェース毎に終端し、いずれかのレイヤ2データリンク層に接続する。図1に示したネットワーク接続装置1の物理層インタフェースは3つあり、そのうちレイヤ1制御部5は10/100/1000BASE−Tを構成するインタフェースであり、レイヤ1制御部6、7はリングネットワークを構成するインタフェースであるとする。
レイヤ2データリンク層は、1つまたは複数の物理層に接続し、レイヤ2ネットワークで接続されたノードのトポロジ管理を行う。
図1において、レイヤ2制御部3は1つの物理層インタフェースに接続し、ネットワーク10上で10/100/1000BASE−T Ethernet(登録商標)機能を持つ。
レイヤ2制御部4は、2系統の物理層インタフェース、レイヤ1制御部6、レイヤ1制御部7に接続し、RPR機能を有している。
【0020】
本実施の形態1では、ネットワーク接続装置1を構成する複数のレイヤ2制御部のうち、トポロジ情報を管理可能なRPR機能を有するレイヤ2制御部4を本発明の適用対象とする。
トポロジ情報を管理しない10/100/1000BASE−T Ethernet(登録商標)機能を有するレイヤ2制御部3は、本発明の適用対象外である。しかし、レイヤ2制御部3についても、RPRあるいはトポロジ情報を管理可能なSRP(Spatial Reuse Protocol)などのプロトコルを使用すれば、本発明を適用することができる。
したがって、以下の機能、動作説明では、レイヤ3制御部2およびレイヤ2制御部4を対象とする。
【0021】
RPRでは、各リングノードのレイヤ2制御部4が自ノードの物理アドレスを定期的に広告しており、ネットワーク接続装置1はネットワーク11においてそれらの広告情報を収集し、トポロジ情報として保持する。トポロジ情報にはトポロジマップとしてネットワーク上のノードの並び順が含まれており、ネットワーク上に存在するノードの数が把握可能である。
【0022】
レイヤ3ネットワーク層は、1つまたは複数のデータリンク層に接続し、複数のデータリンク層間の中継を行なうほか、ネットワーク全体の経路制御を行なうため、ルーティングプロトコルを持つ。また、各データリンク層とインタフェースを持っており、一般にはレイヤ3インタフェース毎にIPアドレスおよびMACアドレスが割り付けられる。
ネットワーク接続装置1では、レイヤ3ルーティングプロトコルとしてOSPFを用い、各レイヤ2制御部に接続している。
【0023】
OSPFでは、各ノードがOSPF Helloパケットを定期的に送信している。ネットワーク接続装置1は、ネットワーク11においてそれらのHelloパケットを受信することで、OSPFネイバを認識し、OSPFネイバ状態を管理する。ここで、図3の状態遷移図は、Heloプロトコルの状態遷移を表している。
また、自ノードの送信するHelloパケットに、自ノードの認識するOSPFネイバのリストを格納する。
【0024】
OSPF Helloパケットを受信したネットワーク接続装置1は、隣接ルータ毎に受信した情報を保持しており、状態遷移はそれぞれの隣接ルータ毎に個別に管理される。
図3において、初期状態は「Down」であり、イベントHello Receivedは、隣接ルータからOSPF Helloパケットを受信した場合に発生するイベントである。イベント2−Way Receivedは、隣接ルータから自ルータの情報を含むOSPF Helloパケットを受信した場合に発生するイベントである。イベント1−Way Recivedは、隣接ルータから自ルータの情報を含まないOSPF Helloパケットを受信した場合に発生するイベントである。
【0025】
同様に他の隣接ノードも、Helloパケット内にOSPFネイバの情報を格納して送信するため、ネットワーク接続装置1は、自ノードの情報を含むHelloパケットを受信することで、相互にOSPFネイバとして認識したことを確認できる。相互にOSPFネイバとして認識したことを確認したときのOSPFネイバ状態は、「2−Way」または「ExStart」となる。
ExStartとなったOSPFネイバとは、データベース交換プロセスを行ない、トポロジデータベースを共有して「Full」状態となり、トポロジデータベースを基にルーティングテーブル計算を実施する。
【0026】
図2において、幹線ネットワークは、各リングノード内のレイヤ2をRPRで構成したリングネットワークであり、幹線ネットワークを構成する複数のリングノード装置がルータ機能を持ち、幹線ネットワークと支線ネットワークを接続している。幹線ネットワークでは、レイヤ2プロトコルとしてRPRが動作しており、リングノード21は他のリングノードからのRPR広告を受信し、トポロジマップをレイヤ2トポロジデータベース9に格納する。リングノード22、23、24のRPRインタフェースMACアドレスをそれぞれMAC−22、MAC−23、MAC−24としたとき、各リングノードは定周期でRPR広告を送信し、自ノードの存在を他ノードに示す。それらのRPR広告を受信したリングノード21は、各ノードのMACアドレスをレイヤ2トポロジデータベース9に格納する。レイヤ2トポロジデータベース9に格納される内容の一例が図4であり、これら3台のMACアドレスがトポロジマップに含まれる。
【0027】
図2のネットワークにおいて、幹線ネットワーク20と支線ネットワーク30に接続されたリングノード21は、それぞれのネットワークでOSPF Helloプロトコルを動作させている。
幹線ネットワーク20上で動作しているOSPF Helloプロトコルでは、リングノード22、23、24からのOSPF Helloパケットを受信しており、それぞれのリングノードについて、図3に示したHelloプロトコル状態遷移を管理している。
その結果を幹線ネットワーク20についてまとめた情報を図5のトポロジ情報テーブルに示す。
【0028】
図5において、「IP−20−22」はリングノード22のRPRインタフェースIPアドレス、「IP−20−23」はリングノード23のRPRインタフェースIPアドレス、「IP−20−24」はリングノード24のRPRインタフェースIPアドレスである。
図5は、幹線ネットワーク20で受信したOSPF Helloパケットに含まれる情報から得たネットワーク構成を含んでおり、幹線ネットワーク20ではリングノード22、23、24を検出し、それらをOSPFネイバとして認識し、IPアドレスを登録している。また各OSPFネイバのネイバ状態を保持しており、HelloプロトコルシーケンスおよびDB交換プロセスを終えた後は、図3の状態遷移図において「Full」または「2−Way」状態となっている。
【0029】
なお、2−Way Received受信後の処理では、自ルータと当該隣接ルータの状態に基づき「2−Way」に移行するか、「ExStart」に移行してDB交換プロセスを実施するかどうかが決定されるが、その判定条件はRFC2328に規定されている。
【0030】
支線ネットワーク30についても、同様に隣接ルータのOSPF Helloパケットを受信して登録を行なう。リングノード22は、支線ネットワーク30にも接続しており、ネイバIPアドレス「IP−30−22」として学習する。また、支線ネットワーク30に接続された2台のルータについても、それぞれのアドレスIP−30−25、IP−30−26を学習し、それぞれのネイバ状態を管理する。
【0031】
このような階層構成のネットワークでは、各ルータは支線ネットワークに対し、幹線ネットワークおよび他の幹線ネットワーク接続ルータの先に接続されたネットワークへの経路情報を広告する。
【0032】
階層構成のネットワークでは、各ルータで保持する経路情報、トポロジ情報を効率的に保持するための集約化が一般に行なわれており、支線ネットワーク側に集約ルート情報(デフォルトルート情報を含む)を広告する。
図2においても、支線ネットワーク30と幹線ネットワーク20を接続するリングノード21およびリングノード22はそれぞれ、支線ネットワークに対して、デフォルトルート情報を広告しているものとする。
支線ネットワーク内にあり、それらの広告を受けたルータ25およびルータ26は、それぞれの広告内容で示されたメトリック情報などを基に、デフォルトルートへのNext Hopを選定する。
【0033】
図2では、リングノード21がより小さなメトリック値を示しているものとし、ルータ25およびルータ26は、デフォルトルートへのNext Hopとしてリングノード21を選択するものとする。
ルータ25は、ルーティングテーブルにNext Hopをリングノード21としてデフォルトルートを登録する。ルータ25は、パケットを中継する際、中継パケットの宛先IPアドレスがルーティングテーブルで他にマッチするエントリがないときは、デフォルトルート設定情報に従って、Next Hopであるリングノード21にパケットを転送する。
【0034】
なお、幹線ネットワーク20と支線ネットワーク30を接続するリングノード21において、幹線ネットワーク20に接続する両系インタフェースのリンクがダウンしていれば幹線ネットワーク20へ向けたパケットの中継が行なえない。この場合、ルータ25は、幹線ネットワーク20へ接続するインタフェースのリンク状態をもって集約ルート情報広告の有無を判定する機能を有する。この機能は、トラッキングあるいはインタフェーストラッキングと称される一般的な機能である。
インタフェーストラッキングでは、幹線ネットワーク20へ接続するレイヤ1制御部6またはレイヤ1制御部7のいずれかでリンクアップを検出していれば、支線ネットワーク30へ集約ルート情報の広告を行ない、レイヤ1制御部6およびレイヤ1制御部7の双方でリンクダウンを検出していれば、RPRインタフェースがダウンしているものとみなして、支線ネットワーク30へ集約ルート情報の広告を行なわない。
【0035】
次に、ネットワークシステムに故障が発生した場合について説明する。
ネットワークシステムは、端末、ネットワーク接続装置、ケーブル等多くの装置、部品で構成されており、様々な箇所での故障が考えられる。
ケーブル断線、停電や装置故障による装置停止などが発生した場合には、下位レイヤでのリンク断検出や上位レイヤでの隣接装置周期確認タイムアウトなどで故障を検出し、ルーティングプロトコルにより代替経路への動的な切替えが行なわれ、通信の復旧が行なわれる。
しかし、装置内の部分的故障が発生した場合には、通信の復旧が行なわれず、端末間の通信が不能となる場合がある。
【0036】
ここで、まずネットワーク接続装置1の送信機能に故障が発生した場合について説明する。
例えば、図2のリングノード21において、図6の機能故障説明図のように、データリンク層のレイヤ2制御部4とネットワーク層のレイヤ3制御部2を接続するレイヤ3インタフェースを構成するH/WまたはS/Wにおいて送信機能の故障が発生した場合を想定する。
【0037】
送信機能の故障が発生し、当該ネットワークへのパケットを送信できない状態では、パケットの中継は行なえない。また、ネットワーク上に存在する装置との間で論理IPアドレスと物理MACアドレスの対応付けを行なうARP(Address Resolution Protocol)プロトコルシーケンスも実施できず、OSPF Helloパケットの送信も行なえない。
しかし、レイヤ2ネットワークでは装置間の通信に支障はなく、正常動作が可能である。そのため、RPRのトポロジ管理も正常に動作し、幹線ネットワーク20に接続されたリングノード22〜24の情報を得て、図4のトポロジ情報テーブルに示すようなRPRトポロジマップを構築している。
一方、レイヤ3のOSPFでは、自ノードのOSPF機能が送信するHelloパケットが幹線ネットワーク20上に送信されず、リングノード22〜24ではリングノード21のHelloを受信しないため、やがてリングノード22〜24の送信するHelloパケット上にリングノード21の情報が現れなくなる。
【0038】
自ノードの情報を表示しないHelloパケットを受信したリングノード21では、そのHelloパケットの送信元隣接ルータのネイバ状態について、図3のHelloプロトコル状態遷移に従い、1−Way Receivedイベントが発生し、「Init」状態に遷移する。そのときのリングノード21のネイバ状態は図7のトポロジ情報テーブルようになる。
この内容は、レイヤ3トポロジ情報としてレイヤ3トポロジデータベース8に格納される。
【0039】
このときリングノード21では、RPRインタフェースはリンクアップしており正常と認識しているので、幹線ネットワーク20への経路情報を支線ネットワーク30側に広告し続けている。また、インタフェーストラッキング機能はインタフェース正常時の動作として、デフォルトルート情報等を支線ネットワーク30側に広告し続けている。
その広告を受信しているルータ25、26では、リングノード21をNext Hopとして認識し続けており、リングノード21に向けて中継パケットを送り続けるため、パケットは廃棄され、通信を行なうことができなくなる。
【0040】
ここで、本発明の実施の形態1に係るネットワーク接続装置1では、トポロジ情報比較手段14は、レイヤ3のトポロジ情報として上位レイヤトポロジ情報取得手段12が取得したOSPFネイバ状態の情報と、レイヤ2のトポロジ情報として下位レイヤトポロジ情報取得手段13が取得したRPRトポロジマップの情報とを比較する。故障箇所推定手段15は、リングネットワーク上に複数のリングノードが存在し、かつ、リングネットワーク上で認識する全ての隣接ルータの隣接状態が「Init」になっているとき、すなわち、すべての隣接装置からの隣接装置情報に自ノードの情報が含まれないときは、自装置のインタフェース送信機能の故障と推定する。
【0041】
具体的には、下位レイヤトポロジ情報取得手段13が取得した図4のトポロジ情報テーブルで2ノード以上の情報を有しているのにもかかわらず、上位レイヤトポロジ情報取得手段12が取得した図7のOSPFネイバ状態情報に含まれるIP−20−22、IP−20−23、IP−20−24の全ての隣接状態が「Init」であることをもって、自装置のインタフェース送信機能の故障と推定する。
ここで故障箇所推定にあたっては、自ノード以外に複数のリングノードが存在することを条件とすることで、隣接装置の受信機能故障による誤推定の可能性を低減できる。
【0042】
つぎに復旧処理手段16は、インタフェース送信機能の故障が推定されたインタフェースを無効化する。例えば、当該インタフェースにかかわるレイヤ1制御部6および7のリンクを強制的にダウンさせることで無効化する。
そのため、当該インタフェースを監視するインタフェーストラッキング機能により、リングノード21は当該インタフェースに接続するネットワークの広告を停止する。ルータ25および26は、代替経路にリングノード22を新たなNext Hopとして選択し、経路迂回を行なうことが可能となり、通信を継続することができる。
【0043】
あるいは、復旧処理手段16は、1つまたは複数のインタフェース送信機能の停止が推定されると、全ポートを閉塞し、一切のパケット送受信を停止して縮退動作に入る。これにより、隣接ノードはリングノード21の消失を検知し、経路再構成動作を行なう。
OSPFにおいては、ルータ25、26はNext Hopの消失により代替ルータとしてリングノード22を新たなNext Hopに選択し、経路迂回を行なうことが可能となり、通信を継続することができる。
【0044】
あるいは、復旧処理手段16は、1つまたは複数のインタフェース送信機能の停止が推定されると、装置の再起動を実施する。これにより、隣接ノードはリングノード21消失を検知し、経路再構成動作を行なう。また、リングノード21の再起動完了後には、より適切な経路への切替判定を行なう。
OSPFにおいては、ルータ25、26はNext Hopの消失により代替ルータとしてリングノード22を新たなNext Hopに選択し、経路迂回を行なうことが可能となり、装置再起動中も通信を継続することができる。
【0045】
これらの復旧処理は、動的に取得した冗長経路の情報によって選択しても良いし、各復旧処理を段階的に実施しても良い。また、あらかじめ管理者によってなされた設定に基づいて行うこともできる。
【0046】
次に、ネットワーク接続装置1の受信機能に故障が発生した場合について説明する。
例えば、図2のリングノード21において、図8の機能故障説明図のようにデータリンク層のレイヤ2制御部4とネットワーク層のレイヤ3制御部2を接続するレイヤ3インタフェースを構成するH/WまたはS/Wにおいて受信機能の故障が発生した場合を想定する。
【0047】
当該箇所に故障が発生した場合、リングノード21のレイヤ3制御部2には受信パケットが到着しないため、レイヤ3制御部2で動作するOSPFには、幹線ネットワーク20上に存在するリングノード22〜24の送信するOSPF Helloパケットが到着しない。
それまでリングノード22〜24からOSPF Helloパケットを受信し、隣接ノード毎にネイバ状態管理を行っているとき、レイヤ3制御部2にOSPF Helloパケットが一定時間到着しなければ、図3の状態遷移図のInactivity Timer イベントが発生する。
【0048】
図3の状態遷移図が示すように、Inactivity Timer イベント発生時は「Down」状態へ遷移することから、レイヤ3トポロジデータベース8においては、図9のトポロジ情報テーブルに示すように、リングノード22〜24はいずれも「Down」状態となる。
あるいは、隣接ノードからのHelloを受信する以前からリングノード21における受信機能の故障が発生していた場合は、隣接状態管理の対象にも登録されず、自装置の持つ幹線ネットワーク20のトポロジ情報には隣接ノードは現れない。その場合のレイヤ3トポロジデータベース8の内容は、図10のトポロジ情報テーブルのようになる。
【0049】
一方、レイヤ2ネットワークでは、装置間の通信に支障はなく、正常動作が可能である。そのため、RPRのトポロジ管理は正常に動作し、幹線ネットワーク20に接続されたリングノード22〜24の情報を得てトポロジマップを生成する。
このとき、リングノード21では、RPRインタフェースはリンクアップしており正常と認識しているので、幹線ネットワーク20への経路情報や、デフォルトルート情報等を支線ネットワーク30側に広告し続けている。
この広告を受信しているルータ25、26では、リングノード21をNext Hopとして認識し続けており、リングノード21に向けて中継パケットを送信し続ける。しかし、リングノード21では、レイヤ3制御部2においてパケット受信が行なえないため、ARPプロトコルシーケンスを完了できず、パケットの中継が行なえなくなる。
【0050】
ここで、本発明の実施の形態1に係るネットワーク接続装置1では、トポロジ情報比較手段14は、レイヤ3のトポロジ情報として上位レイヤトポロジ情報取得手段12が取得したOSPFネイバ状態の情報と、レイヤ2のトポロジ情報として下位レイヤトポロジ情報取得手段13が取得したRPRトポロジマップの情報とを比較する。故障箇所推定手段15は、リングネットワーク上に複数のリングノードが存在しているにもかかわらず、
レイヤ3トポロジで隣接ノードが存在しない、すなわち、ネイバ状態情報なし、または全てのネイバ状態が「Down」であることをもって、自装置のインタフェース受信機能の故障と推定する。
ここで故障箇所推定にあたっては、自ノード以外に複数のリングノードが存在することを条件とすることで、隣接装置の送信機能故障によりOSPF Helloが送信されない場合に自装置の受信機能故障と誤推定することを抑止できる。
【0051】
次に復旧処理手段16は、インタフェース受信機能の故障が推定されたインタフェースを無効化する。例えば、当該インタフェースにかかわるレイヤ1制御部6および7のリンクを強制的にダウンさせることで無効化する。
そのため、当該インタフェースを監視するインタフェーストラッキング機能により、リングノード21は、当該インタフェースに接続するネットワークの広告を停止する。ルータ25および26は、代替経路にリングノード22を新たなNext Hopとして選択し、経路迂回を行なうことが可能となり、通信を継続することができる。
【0052】
あるいは、復旧処理手段16は、1つまたは複数のインタフェース受信機能の停止が推定されると、全ポートを閉塞し、一切のパケット送受信を停止して縮退動作に入る。それにより、隣接ノードはリングノード21の消失を検知し、経路の再構成動作を行なう。
OSPFにおいては、ルータ25、26はNext Hopの消失により代替ルータとしてリングノード22を新たなNext Hopに選択し、経路迂回を行なうことが可能となり、通信を継続することができる。
【0053】
あるいは、復旧処理手段16は、1つまたは複数のインタフェース受信機能の停止が推定される、装置の再起動を実施する。これにより、隣接ノードはリングノード21消失を検知し、経路の再構成動作を行なう。また、リングノード21の再起動完了後には、より適切な経路への切替判定を行なう。
OSPFにおいては、ルータ25、26はNext Hopの消失により代替ルータとしてリングノード22を新たなNext Hopに選択し、経路迂回を行なうことが可能となり、装置再起動中も通信を継続することができる。
【0054】
これらの復旧処理は、動的に取得した冗長経路の情報によって選択しても良いし、各復旧処理を段階的に実施しても良い。また、あらかじめ管理者によってなされた設定に基づいて行うこともできる。
【0055】
以上、実施の形態1の説明では、上位レイヤプロトコルにOSPFを使用することを想定した。ネットワーク接続装置1の受信機能に部分的故障が発生した場合に、故障箇所を推定するためには、上位レイヤプロトコルにOSPFを使用することが前提となる。しかし、受信機能に部分的故障が発生した場合に、故障箇所を推定するためには、必ずしも上位レイヤプロトコルにOSPFを使用する必要はなく、他のプロトコルを使用しても、故障箇所の推定は可能である。
【0056】
また、ネットワーク接続装置1内の故障状態を保持したまま縮退動作となる場合、装置保守者は、ネットワーク接続装置1内の保守インタフェースに保守用端末を接続して、保守インタフェース経由で装置内の故障情報を入手できる。故障状態の解析を詳細に行なうことで、装置の保守性を向上させることができる。
【0057】
以上説明したように、実施の形態1においては、上位レイヤトポロジ情報と下位レイヤトポロジ情報を比較する故障箇所推定手段を備えるとともに復旧処理を備えることで、装置内部の故障を検出し、故障箇所を推定することが可能となり、更に故障箇所に応じた復旧処理を実施することで、ネットワークの可用性を向上させることができる効果がある。
【0058】
実施の形態2.
実施の形態2は、実施の形態1のネットワーク接続装置1に対して、トポロジ管理が可能なRPRインタフェースを複数有するネットワーク接続装置に関するものである。
本願発明の実施の形態2について、図11のネットワーク接続装置51に係るシステム構成図に基づいて説明する。図11において、図1と同一あるいは相当部分には、同一符号を付している。
【0059】
まず、本願発明の実施の形態2に係るネットワーク接続装置51のシステム構成について説明する。実施の形態1のネットワーク接続装置1に対して、追加した構成部分を説明する。
レイヤ2制御部54は、レイヤ1制御部56およびレイヤ1制御部57に接続され、両系を使用したリング状のネットワーク61を構成している。また、レイヤ2制御部54は、レイヤ2プロトコルにより得たレイヤ2トポロジ情報を格納するレイヤ2トポロジデータベース59を備える。
下位レイヤトポロジ情報取得手段63は、レイヤ2制御部54に接続され、レイヤ2制御部54がレイヤ2プロトコルにより得たレイヤ2トポロジ情報を取得する。
トポロジ情報比較手段64は、上位レイヤトポロジ情報取得手段12および下位レイヤトポロジ情報取得手段63に接続され、各々のトポロジ情報を取得して、トポロジ情報の比較を実施する。
故障箇所推定手段15は、トポロジ情報比較手段14およびトポロジ情報比較手段64に接続され、トポロジ情報比較手段14およびトポロジ情報比較手段64が実施したトポロジ情報の比較結果を取得し、故障箇所の推定を実施する。
復旧処理手段16は、故障箇所推定手段15に接続され、推定された故障箇所に応じた復旧処理を実施する。
【0060】
次に、本願発明の実施の形態2に係るネットワーク接続装置51機能および動作について、図11のシステム構成図および実施の形態1でも参照した図4、7のトポロジ情報テーブルを用いて説明する。
【0061】
図11における、レイヤ2制御部54、下位レイヤトポロジ情報取得手段63、レイヤ2トポロジデータベース59、トポロジ情報比較手段64の各機能、動作は、実施の形態1におけるレイヤ2制御部4、下位レイヤトポロジ情報取得手段13、レイヤ2トポロジデータベース9、トポロジ情報比較手段14の各機能、動作と同等である。
【0062】
故障箇所推定手段15は、複数のインタフェースに関係したトポロジ情報比較手段14、64により比較された結果に基づき、装置の故障を検出し、故障箇所を推定する。復旧処理手段16は、故障箇所推定手段15の推定した故障箇所に基づき、復旧処理を実施する。
【0063】
例えば、レイヤ3トポロジデータベース8のデータが図4のトポロジ情報テーブルの内容を含み、かつレイヤ2トポロジデータベース9のデータが図7のトポロジ情報テーブルの内容を含むとき、実施の形態1で示したように、故障箇所推定手段15は、レイヤ2制御部4の接続するインタフェースの送信機能の故障と推定する。
一方、ネットワーク61に接続されたレイヤ2制御部54に関する情報が正常であり、故障が検出されない場合を想定する。
この場合、故障箇所推定手段15は、ネットワーク11に接続するインタフェースは送信機能故障が発生しているが、ネットワーク61に接続するインタフェースは正常であることをもって、部分故障であると推定し、この結果を復旧処理手段16に伝達する。
復旧処理手段16は、部分故障であるとの推定結果を取得して、故障箇所に係わるレイヤ1制御部6および7のリンクを無効化する。
【0064】
また、レイヤ2制御部54についても故障があると検出された場合、故障箇所推定手段15は、複数のインタフェースで故障が発生したことをもって、装置の共通部故障が発生しているものと推定し、この結果を復旧処理手段16に伝達する。
復旧処理手段16は、装置の共通部故障が発生しているとの推定結果を取得して、全ポートを閉塞し、一切のパケット送受信を停止して縮退動作に入る。これにより、隣接ノードは、リングノード21の消失を検知し、経路の再構成動作を行なう。
OSPFにおいては、Next Hopの消失により、代替ルータとして新たなNext Hopを選択することが可能となり、経路迂回を行なうことで通信を継続することができる。
【0065】
このとき、ネットワーク接続装置51内の故障状態を保持したまま縮退動作となる。装置保守者は、ネットワーク接続装置51内の保守インタフェースに保守用端末を接続することで、保守インタフェース経由で装置内の故障情報を入手して、故障の解析を詳細に行なうことができるので、装置の保守性を向上させることができる。
【0066】
あるいは、復旧処理手段16は、複数のインタフェース送信機能が停止したとの情報を取得すると、装置再起動を実施する。これにより、隣接ノード22〜24は、リングノード21消失を検出し、経路再構成動作を行なう。また、リングノード21の再起動完了後には、より適切な経路への切替判定を行なう。
特にS/Wの問題で部分的な故障が発生した場合は、装置再起動により回復する場合も多いため、本装置再起動により、部分的な故障が回復することが期待できる。
【0067】
このように、本発明では、故障が検出された部位の情報をもとに、故障箇所によって復旧処理手段を選択することが可能であり、故障の内容に応じた適切な復旧処理を実施することで経路迂回が可能となり、通信の可用性を向上させることが可能となる。
【0068】
以上説明したように、本実施の形態2では、トポロジ管理が可能なRPRインタフェースを複数有するネットワーク接続装置においても、上位レイヤトポロジ情報と下位レイヤトポロジ情報を比較する故障箇所推定手段を備えるとともに復旧処理を備えることで、装置内部の故障を検出し、故障箇所を推定することが可能となり、更に故障箇所に応じた復旧処理を実施することで、ネットワークの可用性を向上させることができる効果がある。
【符号の説明】
【0069】
1,51 ネットワーク接続装置、2 レイヤ3制御部、
3,4,54 レイヤ2制御部、5,6,7,56,57 レイヤ1制御部、
8 レイヤ3トポロジデータベース、9,59 レイヤ2トポロジデータベース、
10,11,61 ネットワーク、12 上位レイヤトポロジ情報取得手段、
13,63 下位レイヤトポロジ情報取得手段、14,64 トポロジ情報比較手段、
15 故障箇所推定手段、16 復旧処理手段、20 幹線ネットワーク、
21,22,23,24 リングノード、25,26,27,28 ルータ、
30,31,32,33 支線ネットワーク。

【特許請求の範囲】
【請求項1】
階層型ネットワークに適用するネットワーク接続装置において、下位レイヤトポロジ情報を取得する下位レイヤトポロジ情報取得手段と、上位レイヤトポロジ情報を取得する上位レイヤトポロジ情報取得手段と、前記下位レイヤトポロジ情報と前記上位レイヤトポロジ情報を比較するトポロジ情報比較手段と、前記トポロジ情報比較手段のトポロジ情報比較の結果に基づいて故障箇所を推定する故障箇所推定手段とを備えるネットワーク接続装置。
【請求項2】
前記故障箇所推定手段が行った故障箇所推定結果に基づいて、復旧処理を行う復旧処理手段をさらに備えた請求項1記載のネットワーク接続装置。
【請求項3】
前記下位レイヤトポロジ情報取得手段は、レイヤ2ネットワークの隣接装置MACアドレスからなるレイヤ2トポロジ情報を取得し、
前記上位レイヤトポロジ情報取得手段は、レイヤ3ネットワークの隣接装置IPアドレスおよび隣接装置から受信した隣接装置情報からなるレイヤ3トポロジ情報を取得し、
前記トポロジ情報比較手段は、前記レイヤ2トポロジ情報から得られる装置数と、
前記レイヤ3トポロジ情報から得られる隣接装置情報に含まれる自装置情報を比較し、
前記故障箇所推定手段は、ネットワーク上に複数の隣接装置が存在し、かつ隣接装置からの隣接装置情報に自装置情報が含まれない場合は、自装置のインタフェース送信機能の故障であると推定する請求項1または請求項2記載のネットワーク接続装置。
【請求項4】
前記下位レイヤトポロジ情報取得手段は、レイヤ2ネットワークの隣接装置MACアドレスからなるレイヤ2トポロジ情報を取得し、
前記上位レイヤトポロジ情報取得手段は、レイヤ3ネットワークの隣接装置IPアドレスからなるレイヤ3トポロジ情報を取得し、
前記トポロジ情報比較手段は、前記レイヤ2トポロジ情報から得られる装置数と、
前記レイヤ3トポロジ情報から得られる隣接装置情報を比較し、
前記故障箇所推定手段は、前記レイヤ2トポロジ情報に隣接装置が複数存在するにもかかわらず、前記レイヤ3トポロジ情報に隣接装置が存在しない場合は、自装置のインタフェース受信機能の故障であると推定する請求項1または請求項2記載のネットワーク接続装置。
【請求項5】
前記故障個所推定手段が、インタフェース送信機能または受信機能の故障を推定したとき、前記復旧処理手段は、推定された故障箇所に応じて、当該のインタフェース機能を無効化する、または全ポートを閉塞する、またはネットワーク接続装置を再起動する処理の内いずれかの復旧処理を行う請求項2ないし4のいずれか1項に記載のネットワーク接続装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−169951(P2012−169951A)
【公開日】平成24年9月6日(2012.9.6)
【国際特許分類】
【出願番号】特願2011−30384(P2011−30384)
【出願日】平成23年2月16日(2011.2.16)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】