サイレント障害自律検出機能を含む通信システム
【課題】中継装置内部の障害箇所(異常発生箇所)を自律的に特定する。
【解決手段】中継装置は、装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;前記複数の監視手段から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段とを備える。
【解決手段】中継装置は、装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;前記複数の監視手段から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サイレント障害自律検出機能を含む通信システムに適用される中継装置に関する。
【背景技術】
【0002】
インターネットまたはイントラネットなどのIP(Internet Protocol)ネットワーク
を通して、クライアント・クライアント間通信及びサーバ・クライアント間通信を行わせる通信システムにおいては、伝送対象データをパケット形態で中継(転送)するネットワーク中継装置としての複数のルータがIPネットワーク上に配置される。
【0003】
通常、このような通信システムにおいては、パケット損失や転送遅延などの異常が生じたとき、該当ルータから保守運用システムに障害通知が行われる。保守運用システムの保守運用者(監視者)は、この障害通知に基づいて、特定のルータがパケット転送不可能であることを知り得る。
【0004】
しかし、異常が発生しているにも関らず、ルータ自体が劣化または故障のために異常発生を検出できず、保守運用システムに障害の通知がない場合がある。この場合、保守運用者は、例えば通信に影響が出た後に、ユーザからの異常申告があって、初めて障害を認識可能である。
【0005】
通信システムにおいて潜在化し、異常発生を自律的に直ちに検出できないこのような障害は、サイレント障害と称される。近年、このサイレント障害をIPネットワーク内で早期に検出する手法が求められている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−28305号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
図1には、上述したサイレント障害を検出するための一手法を採る通信システムが例示されている。通信システム1Aにおいては、複数のプローブ装置P1,P2,P3,P4,P5がIPネットワーク2上のルータR1,R2,R3,R4間の監視箇所にそれぞれ配置されている。
【0008】
プローブ装置P1〜P5は、伝送対象データであるパケットの到着状態を監視することにより、各ルータR1〜R4が自身で検出できない異常を検出する。そして、プローブ装置P1〜P5及び損失箇所特定装置3の連携により、保守運用システム4などの外部に異常通知が行われる。
【0009】
更に詳述すると、図2に示すように、プローブ装置P1,P2が各パケット(断片化パケット)に対して通過履歴としてプローブ装置識別子ID(P1),ID(P2)を付与する。各パケットは、複数のプローブ装置P1,P2を経由しながら、損失箇所特定装置3に到着する。損失箇所特定装置3は、到着したパケットに含まれる通過履歴に基づいて、パケットの通過経路と、パケットの損失が発生した損失発生箇所(単に、損失箇所と記載することもある)とを特定可能である。
【0010】
図2に示す例では、ルータR1,R2間に配置されたプローブ装置P1は、IPヘッダにシーケンス番号seq#N,seq#N+1,seq#N+2,seq#N+3を含むパケットを順次に受信し、通過履歴としてプローブ装置識別子ID(P1)を各パケットに付与した後に送信する。
【0011】
ルータR2,R3間に配置されたプローブ装置P2は、IPヘッダにシーケンス番号seq#N,seq#N+2,seq#N+3を含むパケットを受信するが、シーケンス番号seq#Nに続くシーケンス番号seq#N+1を含むパケットを受信していないので、シーケンス番号seq#N+2を含むパケットには、通過履歴としてプローブ装置識別子ID(P2)を付与することなく送信する。
【0012】
損失箇所特定装置3は、ルータR3を介してプローブ装置P2から送信されたパケットを受信したとき、到着(受信)パケットに付与された通過履歴のプローブ装置識別子ID(P1),ID(P2)に基づいて、パケットの通過経路を特定する。ここでは、損失箇所特定装置3は、シーケンス番号seq#N+2のパケットに通過履歴のプローブ装置識別子ID(P2)が付与されていないので、損失発生箇所をプローブ装置P1,P2間と特定(認識)可能である。
【0013】
上述したプローブ装置P1,P2及び損失箇所特定装置3による障害の検出では、各プローブ装置P1,P2が通過履歴を各パケットに付与し、損失箇所特定装置3が各パケットの最終的な通過判定を行う。このために、各パケットが途中で全て損失して、パケットの損失発生箇所を示す識別子(プローブ装置識別子)が損失箇所特定装置3に到達しない場合は、損失発生箇所を特定できない(図3参照)。
【0014】
また、シーケンス番号seq#N,seq#N+1,seq#N+2,seq#N+3による通過監視を実施しているので、次の制限(1),(2),(3)を免れない。
【0015】
(1)再送パケットには適用できない。つまり、再送パケットについては、シーケンス番号seq#N,seq#N+2が連続ではないので、プローブ装置識別子が付与されない。この結果、再送パケットの損失発生箇所が特定できない(図4参照)。
【0016】
(2)単発パケットには適用できない。つまり、複数の断片化パケットではない単発パケットについては、シーケンス番号に基づくプローブ装置識別子の付与ができない。したがって、損失発生箇所の特定もできない(図5参照)。
【0017】
(3)RTP(Real-time Transfer Protocol)プロトコルに則る通信にしか適用でき
ない。RTPプロトコルは、ビデオやオーディオ配信などのリアルタイム性が要求されるデータストリーム転送のための通信プロトコルである。
【0018】
そして、上述した障害検出手法では、各ルータ内部の障害箇所(異常発生箇所)を特定できない根本的問題が残存する。
【0019】
課題は、中継装置内部の障害箇所(異常発生箇所)を自律的に特定することを可能にする技術を提供することにある。
【課題を解決するための手段】
【0020】
上記課題を解決するために、中継装置は、装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;前記複数の監視手段から通知される前記通過情報
に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段とを備える。
【発明の効果】
【0021】
開示した中継装置によれば、装置内のサイレント障害を自律的に検出することができる。
【0022】
他の課題、特徴及び利点は、図面及び特許請求の範囲とともに取り上げられる際に、以下に記載される発明を実施するための形態を読むことにより明らかになるであろう。
【図面の簡単な説明】
【0023】
【図1】サイレント障害を検出する関連技術を説明するための図。
【図2】サイレント障害を検出する関連技術を説明するための図。
【図3】関連技術の問題点を説明するための図。
【図4】関連技術の問題点を説明するための図。
【図5】関連技術の問題点を説明するための図。
【図6】一実施の形態の通信システムの構成を示すブロック図。
【図7】一実施の形態の通信システムにおけるルータの構成を示すブロック図。
【図8】図7に示すルータにおける伝送対象パケット及びパス識別子を説明する図。
【図9】図7に示すルータにおける処理を説明するためのフローチャート。
【図10】図7に示すルータにおける処理を説明するためのフローチャート。
【図11】図7に示すルータにおける処理を説明するためのフローチャート。
【図12】図7に示すルータにおけるパステーブルを説明する図。
【図13】変形例の通信システムの構成を示すブロック図。
【発明を実施するための形態】
【0024】
以下、添付図面を参照して、さらに詳細に説明する。図面には好ましい実施形態が示されている。しかし、多くの異なる形態で実施されることが可能であり、本明細書に記載される実施形態に限定されない。
【0025】
[通信システム]
一実施の形態におけるシステム構成を示す図6を参照すると、サイレント障害自律検出機能を含む通信システム1は、インターネットまたはイントラネットなどのIPネットワーク2上に配置され、伝送対象データをパケット形態で中継(転送)するネットワーク中継装置としての複数のルータR11,R12,R13,R14を備えている。
【0026】
これらのルータR11〜R14は、入口エッジノード、中継ノード及び出口エッジノードとして機能し、例えばIPネットワーク2に接続される複数の通信端末装置5,6に対して、クライアント・クライアント間通信を行わせる。また、ルータR11〜R14は、サーバがIPネットワーク2に接続されている場合、例えば通信端末装置5にサーバ・クライアント間通信を行わせる。
【0027】
この通信システム1においては、パケット損失や転送遅延などの異常がルータ内部で生じたとき、ネットワーク回線を通して、該当ルータ(例えば、ルータR12)から保守運用システム4に障害部位通知が行われる。保守運用システム4の保守運用者(監視者)は、ルータのIPアドレス及び障害箇所を含む障害部位通知に基づいて、特定ルータがパケット転送不可能であることを認識する。
【0028】
後に詳述するが、この通信システム1においては、各ルータR11〜R14が、自身を通過する伝送対象パケットにルータ内部の通過ルートを示すパス識別子を付加し、ルータ
内の各部位においてパス識別子を監視し、各部位のパケット通過状況をパステーブルに格納する。各ルータR11〜R14は、このパステーブルの格納情報に基づいて、各部位のパケット転送の有無を判定し、異常発生時にルータ内部の障害箇所を自律的に特定する。
【0029】
[ルータの構成]
図6に示す通信システム1において、ネットワーク中継装置として機能するルータR11〜R14は、図7に示す詳細構成を採る。
【0030】
各ルータは、図7に示すように、複数(n個;n≧2)の入力(入口)インターフェース部IFI1〜IFIn、複数(m個;m≧2)の出力(出口)インターフェース部IFE1〜IFEm、スイッチ部SW、及び制御部CONTを備える。各ルータにおいて、入力インターフェース部IFI1〜IFIn、出力インターフェース部IFE1〜IFEm、及びスイッチ部SWは、制御線C1を通して制御部CONTに接続されている。
【0031】
各入力インターフェース部IFI1〜IFInは、入力パケットバッファPBI及び入力ネットワークプロセッサNPIを備える。また、各出力インターフェース部IFE1〜IFEmは、出力パケットバッファPBO及び出力ネットワークプロセッサNPOを備える。なお、図7においては、入力インターフェース部IFIn及び出力インターフェース部IFE1の詳細構成だけを示して簡潔化を図っている。
【0032】
入力インターフェース部IFI1〜IFInの各入力ネットワークプロセッサNPIは、宛先アドレス抽出部11、識別子付与部12、パケット監視部13、及び簡易ルーティングテーブルであるIP転送テーブル(FIB:Forwarding Information Base)14を
含む。入力インターフェース部IFI1〜IFInの各入力パケットバッファPBIはパケット監視部15を含む。ここで、FIB14は入力ネットワークプロセッサNPIが有する図示省略のメモリに設けられる。また、宛先アドレス抽出部11、識別子付与部12、及びパケット監視部13,15は、入力ネットワークプロセッサNPIのメモリに展開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0033】
出力インターフェース部IFE1〜IFEmの各出力ネットワークプロセッサNPOは、パケット監視部21及び識別子除去部22を含む。出力インターフェース部IFE1〜IFEmの各出力パケットバッファPBOはパケット監視部23を含む。ここで、パケット監視部21,23及び識別子除去部22は、出力ネットワークプロセッサNPOの図示省略のメモリに展開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0034】
スイッチ部SWは、スイッチ41及び複数のパケット監視部42,43,44,45,46を含む。スイッチ部SWは、クロスコネクト機能を有するスイッチファブリックのスイッチ41を介して、入力インターフェース部IFI1〜IFInと出力インターフェース部IFE1〜IFEmとを相互接続する。ここで、パケット監視部42〜46は、スイッチ部SWにおける図示省略のプロセッサのメモリに展開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0035】
制御部CONTは、ルーティング制御部51、識別子付与部52、パケット監視部53、ルーティングテーブル54、通過判定部55、及びパステーブル56を含む。また、制御部CONTの制御パケットバッファPBCはパケット監視部57を含む。ここで、ルーティングテーブル54及びパステーブル56は、制御部CONTの図示省略のメモリに設けられる。また、ルーティング制御部51、識別子付与部52、パケット監視部53,57、及び通過判定部55は、制御部CONTにおける図示省略のプロセッサのメモリに展
開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0036】
[ルータの機能]
図7に詳細構成を例示するルータのn個目の入力インターフェース部IFInに伝送対象パケット(単に、パケットと記載することもある)が到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着(受信)した伝送対象パケットのIPヘッダから宛先アドレス(IPアドレス)「a」を抽出し、識別子付与部12に通知する。
【0037】
識別子付与部12は、通知された宛先アドレス「a」に基づいて、IP転送テーブル(FIB)14の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を決定し、伝送対象パケットに出力インターフェース識別子「E1」をルータ内ヘッダとして付加する。FIB14には、制御部CONTからの指示により、宛先アドレスと出力インターフェース番号との対応関係が予め設定されている。
【0038】
また、識別子付与部12は、ルータ内でパケットの通過ルートを一意に示すパス識別子「X」を伝送対象パケットにルータ内ヘッダとして付加する。識別子付与部52は識別子付与部12と同様に機能する。このパス識別子の詳細については後述する。
【0039】
パケット監視部13は、通過するパケットのパス識別子を監視し、パケット通過情報を制御部CONTの通過判定部55に通知する。ルータ内の各部位(監視箇所)に存在する他のパケット監視部15,21,23,42〜46,53,57は、同様に通過するパケットのパス識別子を監視し、パケット通過情報を通過判定部55に通知する。
【0040】
入力パケットバッファPBIは、スイッチ部SWにパケットを転送する際に、パケットを一時的に蓄える。
【0041】
スイッチ部SWは、パケットに付加された出力インターフェース識別子「E1」に従い、スイッチ41によりパケットを出力インターフェース部IFE1にスイッチングする。なお、このスイッチング制御のためのプロセッサは図示を省略している。
【0042】
出力インターフェース部IFE1の出力パケットバッファPBOは、出力ネットワークプロセッサNPOにパケットを転送する際に、パケットを一時的に蓄える。
【0043】
識別子除去部22は、パケットに付加されている出力インターフェース識別子「E1」及びパス識別子「X」を含むルータ内ヘッダを除去する。
【0044】
制御部CONTの通過判定部55は、通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を記録する。パステーブル56は、通過判定部55からの指示により、各監視箇所のパケット通過状況を保持する。また、通過判定部55は、パステーブル56を監視(参照)し、パケット通過状況に応じて、ルータ内部の障害を検出し、保守運用システム4に通知する。
【0045】
この一実施の形態の通信システム1のルータにおいては、ルーティング制御部51、識別子付与部52、パケット監視部53、ルーティングテーブル54、及び制御パケットバッファPBCのパケット監視部57は、他のルータとルーティング(経路)情報を交換する場合に機能する。この場合、通過判定部55は、パケット監視部53,57などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を記録するとともに、パステーブル56を監視し、パケット通過状況に応じて、ルータ内部の障害を検出
し、保守運用システム4に通知する。
【0046】
[パス識別子]
上述したように、識別子付与部12は、出力インターフェース識別子とともに、ルータ内の通過(転送)ルートを一意に示すパス識別子を伝送対象パケットにルータ内ヘッダ(装置内ヘッダ)として付加する。ここで、図8を参照して、パス識別子の詳細について述べる。
【0047】
図8に示すように、ルータ内で転送される伝送対象パケットは、IPヘッダ及びデータ(パケットデータ)を含む通常のIPパケットにルータ内ヘッダの一部としてパス識別子PIDを付加した構成である。パス識別子PIDは、バージョンF1、ヘッダ長F2、ルータの入力インターフェース番号(入力物理ポート番号)F3、ルータの出力インターフェース番号(出力物理ポート番号)F4、及びパケット番号F5のフィールドを含む。
【0048】
パス識別子PIDにおいて、バージョンF1はパス識別子のバージョンを4bitで表す。ここでは、バージョンF1は、ルータ内の各監視箇所に存在するパケット監視部が通過する伝送対象パケットをルート(通過ルート)単位で監視するか、通過ルート毎にパケット単位で監視するかを表す。このバージョンF1は、例えば保守運用システム4からの指示に基づいて、制御部CONTにより識別子付与部12,52に予め通知される。
【0049】
また、パス識別子PIDにおいて、ヘッダ長F2はパス識別子全体の長さを1byteで表す。ルータの入力インターフェース番号F3は、伝送対象パケットがルータに到着した際の入力インターフェース部IFI1〜IFInのインターフェース番号を表す。ルータの出力インターフェース番号F4は、伝送対象パケットがルータから送出される際の出力インターフェース部IFE1〜IFEmのインターフェース番号を表す。
【0050】
さらに、パス識別子PIDにおいて、パケット番号F5は、ルータ内の同一ルートを通る断片化パケットを一意に示すための順序番号であり、IPヘッダから得ることが可能である。入力インターフェース番号F3、出力インターフェース番号F4及びパケット番号F5のフィールドは可変長である。
【0051】
更に詳述すると、ルータ内の各監視箇所に存在するパケット監視部が、バージョンF1に基づいて通過する伝送対象パケットを通過ルート単位で監視し、パケット通過情報を通過判定部55に通知する第1監視形態を採る場合、識別子付与部12は、ルータ内の通過ルート、つまり入力インターフェース番号と出力インターフェース番号との組を一意に示すパス識別子PIDを伝送対象パケットにルータ内ヘッダとして付加する。
【0052】
したがって、第1監視形態を採る場合、パス識別子PIDには、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)が設定されるが、パケット番号F5は設定されない。そして、パステーブル56のパス識別子欄には、入力インターフェース番号F3と出力インターフェース番号F4との組を一意に示す「51」が記録される。
【0053】
また、各パケット監視部が、バージョンF1に基づいて通過する伝送対象パケットを通過ルート毎にパケット単位で監視し、パケット通過情報を通過判定部55に通知する第2監視形態を採る場合、識別子付与部12は、ルータ内の通過ルート(入力インターフェース番号と出力インターフェース番号との組)を一意に示す情報に加え、ルータ内の同一ルートを通る断片化パケットを一意に示すための順序番号であるパケット番号を含むパス識別子PIDを伝送対象パケットにルータ内ヘッダとして付加する。
【0054】
したがって、第2監視形態を採る場合、パス識別子PIDには、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)と共に、パケット番号F5(例えば、F5=045)が設定される。そして、パステーブル56のパス識別子欄には、入力インターフェース番号F3と出力インターフェース番号F4とパケット番号F5とを示す「51045」が記録される。
【0055】
[ルータの動作]
〈第1監視形態〉
ルータ内の各監視箇所に存在するパケット監視部が、通過する伝送対象パケットのパス識別子PIDを通過ルート単位で監視し、パケット通過情報を通過判定部55に通知する第1監視形態を採る場合、ルータにおける動作例について関連図を併せ参照して説明する。
【0056】
図7に詳細構成を例示するルータのn個目の入力インターフェース部IFInにパケットが到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着(受信)した伝送対象パケットのIPヘッダから宛先アドレス(IPアドレス)「a」を抽出し、識別子付与部12に通知する(図9中の処理901,902)。
【0057】
識別子付与部12は、通知された宛先アドレス「a」に基づいて、FIB14の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を決定(抽出)し、スイッチ41におけるスイッチングのための出力インターフェース識別子「E1」を生成して、伝送対象パケットにルータ内ヘッダの一部として付加する(図9中の処理903,904,905)。
【0058】
また、識別子付与部12は、ルータ内の通過ルートPR1、つまり入力インターフェース番号と出力インターフェース番号との組を一意に示すパス識別子(PID)「X」を作成して、伝送対象パケットにルータ内ヘッダとして更に付加した後に送出する(図9中の処理906,907)。
【0059】
第1監視形態を採る場合、パス識別子「X」には、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)が設定されるが、パケット番号F5は設定されない。
【0060】
パケット監視部13は、通過するパケットを監視してパス識別子「X」を抽出し、パス識別子「X」及び通過部位情報(ここでは、NPI番号)を含むパケット通過情報を制御部CONTの通過判定部55に制御線C1を通して通知した後に、パケットを送出する(図10中の処理1001,1002,1003,1004)。
【0061】
ルータ内の各監視箇所に存在する他のパケット監視部15,21,23,42,43,45,46は、同様に通過するパケットを監視してパス識別子「X」を抽出し、パケット通過情報を通過判定部55に通知する。
【0062】
通過判定部55は、パケット監視部13などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する(図10中の処理1005)。
【0063】
通過判定部55は、伝送対象パケットがルータに到着した後、予め定めた時間内にルータから出力しないとき、異常発生と判定する。この例では、通過判定部55は、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っ
ても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0064】
続いて、通過判定部55における処理について、更に詳述する。
【0065】
通過判定部55は、パケット監視部13などからパス識別子「X」及び通過部位情報を含むパケット通過情報を受信すると、パステーブル56にエントリがあることを判定する(図11中の処理1101,1102)。
【0066】
エントリとしてのパス識別子「X」がパステーブル56に既に記録されている場合は、パケット通過状況をパステーブル56に記録し、上書更新する(図11中の処理1105)。
【0067】
エントリとしてのパス識別子「X」がパステーブル56にない場合は、パステーブル56のパス識別子欄には、新規エントリが作成(記録)される(図11中の処理1103)。
【0068】
通過判定部55は、新規エントリを作成したとき、障害判定タイマTM1をセット(起動:ON)し、パケット通過状況をパステーブル56に記録する(図11中の処理1104,1105)。
【0069】
通過判定部55は、全てのパケット通過状況をパステーブル56に記録したとき、障害判定タイマTM1をリセット(停止:OFF)して、処理を終了する(図11中の処理1106,1107)。
【0070】
通過判定部55は、上記処理1101〜1106を繰り返しながら、上記処理1104においてセットした障害判定タイマTM1が満了したか否かを判定する(図11中の処理1108)。
【0071】
通過判定部55は、障害判定タイマTM1が満了したときは、パステーブル56を参照し、パケット通過状況が記録されていない監視部位の障害と判定し、障害部位を保守運用システム4に通知する(図11中の処理1109,1110)。
【0072】
続いて、通過判定部55は、パステーブル56中の対応エントリのレコードをクリアすると共に、障害判定タイマTM1をリセットして、処理を終了する(図11中の処理1111,1112)。
【0073】
図12(A)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてX=「51」が記録される。また、パステーブル56のパス識別子「51」に対応するレコードの各監視部位(監視箇所)欄には、パケット通過状況(ON:通過)が記録される。
【0074】
ルータにおける対象の監視部位は、入力インターフェース部IFI1〜IFIn、出力インターフェース部IFE1〜IFEm、及びスイッチ部SWであるが、この例では、障害検出精度を上げるために更に細分化している。したがって、図12(A)に示すように、パステーブル56の監視部位欄には、入力ネットワークプロセッサNPI、入力パケットバッファPBI、スイッチ部SWの入力及び出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOが予め登録されている。
【0075】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場
合、スイッチ41の入力までのパケット監視部13,15,43をパケットが通過するが、スイッチ41の出力以降のパケット監視部45,23,21をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOの監視部位欄には、パケットの通過は記録されない。
【0076】
ルータが正常動作している場合、識別子除去部22において出力インターフェース識別子「E1」及びパス識別子「X」を含むルータ内ヘッダを除去された伝送対象パケットはルータから送出される。
【0077】
〈第2監視形態〉
次に、ルータ内の各監視箇所に存在するパケット監視部が、通過する伝送対象パケットのパス識別子PIDを通過ルート毎にパケット単位で監視し、パケット通過情報を通過判定部55に通知する第2監視形態を採る場合、ルータにおける動作例について関連図を併せ参照して説明する。
【0078】
図7に詳細構成を例示するルータのn個目の入力インターフェース部IFInにパケットが到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着した伝送対象パケットのIPヘッダから宛先アドレス「a」を抽出し、識別子付与部12に通知する(図9中の処理901,902)。
【0079】
識別子付与部12は、通知された宛先アドレス「a」に基づいて、FIB14の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を抽出し、スイッチ41におけるスイッチングのための出力インターフェース識別子「E1」を生成して、伝送対象パケットにルータ内ヘッダの一部として付加する(図9中の処理903,904,905)。
【0080】
また、識別子付与部12は、ルータ内の通過ルートPR1、つまり入力インターフェース番号と出力インターフェース番号との組を一意に示す情報に加え、ルータ内の同一ルートを通る断片化パケットを一意に示すための順序番号であるパケット番号を含むパス識別子(PID)「X」(「X1」,「X2」・・・)を作成して、伝送対象パケットにルータ内ヘッダとして更に付加した後に送出する(図9中の処理906,907)。なお、識別子付与部12は、パス識別子「X1」,「X2」などを作成する過程で、伝送対象パケットのIPヘッダから断片化パケットの順序番号を抽出してパケット番号とする。
【0081】
第2監視形態を採る場合、パス識別子「X1」には、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)と共に、パケット番号F5(例えば、F5=001)が設定される。次のパス識別子「X2」には、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)と共に、パケット番号F5(例えば、F5=002)が設定される。
【0082】
続いて、ルータ内の各監視箇所に存在するパケット監視部13,15,43,45,23,21は、上述した処理1001,1002,1003,1004と同様に、通過するパケットを監視してパス識別子「X1」,「X2」などを抽出し、パケット通過情報を通過判定部55に通知する。
【0083】
通過判定部55は、上述した処理1005と同様に、パケット監視部13などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する。
【0084】
また、通過判定部55は、上述した処理1101〜1112と同様に、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0085】
図12(B)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてX1=「51001」,X2=「51002」などが記録される。また、パステーブル56のパス識別子「51001」,「51002」に対応するレコードの各監視部位欄には、パケット通過状況(ON:通過)が記録される。
【0086】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場合、スイッチ41の入力までのパケット監視部13,15,43をパケットが通過するが、スイッチ41の出力以降のパケット監視部45,23,21をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOの監視部位欄には、パケットの通過は記録されない。
【0087】
ルータが正常動作している場合、識別子除去部22において出力インターフェース識別子「E1」及びパス識別子「X1」,「X2」などを含むルータ内ヘッダを除去された伝送対象パケットはルータから送出される。
【0088】
〈変形動作例〉
図6に示す一実施の形態の通信システム1においては、IPネットワーク2上のルータR11〜R14間でルーティング情報を交換する場合がある。
【0089】
図7に詳細構成を例示するルータ(特定ルータ)においては、ルーティング制御部51、識別子付与部52、パケット監視部53、ルーティングテーブル54、及び制御パケットバッファPBCのパケット監視部57は、他のルータとルーティング情報を交換する場合に機能する。
【0090】
ルーティング情報を交換する場合、特定ルータのルーティング制御部51から他のルータにルーティング情報を含む制御パケットを図7中の通過ルートPR2により発信する形態と、他のルータから特定ルータのルーティング制御部51にルーティング情報を含む制御パケットが図7中の通過ルートPR3により着信する形態とがある。これらの制御パケット発信形態及び制御パケット着信形態のいずれにおいても上述した第1監視形態及び第2監視形態を選択的に適用可能である。
【0091】
例えば、制御パケットを通過ルートPR2により発信する形態において、第1監視形態を採用する場合、ルーティング制御部51は、伝送対象パケット(制御パケット)のIPヘッダに他のルータ対応の宛先アドレス「a」及びルーティング情報を含む制御パケットを示す情報を設定し、識別子付与部52に通知する。
【0092】
識別子付与部52は、通知された宛先アドレス「a」に基づいて、ルーティングテーブル54の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を抽出し、スイッチ41におけるスイッチングのための出力インターフェース識別子「E1」を生成して、伝送対象パケットにルータ内ヘッダの一部として付加する。
【0093】
また、識別子付与部52は、通知されたルーティング情報を含む制御パケットを示す情報に基づいて、ルータ内の通過ルートとして、入力インターフェース番号に代替して制御
パケット発信を示す情報と出力インターフェース番号とを示すパス識別子「M1」を作成して、伝送対象パケットにルータ内ヘッダとして更に付加した後に送出する。
【0094】
制御パケット発信形態を採る場合、伝送対象パケットは、制御パケットバッファPBCからパケット監視部44を経て、スイッチ41に入力される。
【0095】
ルータ内の各監視箇所に存在するパケット監視部53,57,44,45,23,21は、上述した処理1001,1002,1003,1004と同様に、通過するパケットを監視してパス識別子「M1」を抽出し、パケット通過情報を通過判定部55に通知する。
【0096】
通過判定部55は、上述した処理1005と同様に、パケット監視部53などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する。
【0097】
また、通過判定部55は、上述した処理1101〜1112と同様に、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0098】
図12(C)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてM1=「01」(ここで、「0」は制御パケット発信を示す情報である)が記録される。また、パステーブル56のパス識別子「01」に対応するレコードの各監視部位欄には、パケット通過状況(ON:通過)が記録される。
【0099】
図12(C)に示すように、パステーブル56の監視部位欄には、制御部CONT、制御パケットバッファPBC、スイッチ部SWの入力及び出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOが予め登録されている。
【0100】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場合、スイッチ41の入力までのパケット監視部53,57,44をパケットが通過するが、スイッチ41の出力以降のパケット監視部45,23,21をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOの監視部位欄には、パケットの通過は記録されない。
【0101】
ルータが正常動作している場合、識別子除去部22において出力インターフェース識別子「E1」及びパス識別子「M1」を含むルータ内ヘッダを除去された伝送対象パケットはルータから送出される。
【0102】
次に、例えば、制御パケットが通過ルートPR3により着信する形態において、第1監視形態を採用する場合、ルータのn個目の入力インターフェース部IFInにパケットが到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着した伝送対象パケット(制御パケット)のIPヘッダから自己宛の宛先アドレス「aa」を抽出し、識別子付与部12に通知する。
【0103】
識別子付与部12は、通知された自己宛の宛先アドレス「aa」に基づいて、IPヘッダからルーティング情報を含む制御パケットを示す情報を参照し、ルータ内の通過ルートとして、入力インターフェース番号と、出力インターフェース番号に代替して制御パケット着信を示す情報とを示すパス識別子「M2」を作成して、伝送対象パケットにルータ内ヘッダとして付加した後に送出する。
【0104】
制御パケット着信形態を採る場合、伝送対象パケットは、入力パケットバッファPBIからパケット監視部43を経てスイッチ41に入力され、パケット監視部44に出力される。そして、伝送対象パケットは、制御パケットバッファPBC及びパケット監視部53を経て、ルーティング制御部51に入力されて処理される。
【0105】
ルータ内の各監視箇所に存在するパケット監視部13,15,43,44,57,53は、上述した処理1001,1002,1003,1004と同様に、通過するパケットを監視してパス識別子「M2」を抽出し、パケット通過情報を通過判定部55に通知する。
【0106】
通過判定部55は、上述した処理1005と同様に、パケット監視部13などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する。
【0107】
また、通過判定部55は、上述した処理1101〜1112と同様に、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0108】
図12(D)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてM2=「50」(ここで、「0」は制御パケット着信を示す情報である)が記録される。また、パステーブル56のパス識別子「50」に対応するレコードの各監視部位欄には、パケット通過状況(ON:通過)が記録される。
【0109】
図12(D)に示すように、パステーブル56の監視部位欄には、入力ネットワークプロセッサNPI、入力パケットバッファPBI、スイッチ部SWの入力及び出力、制御パケットバッファPBC、及び制御部CONTが予め登録されている。
【0110】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場合、スイッチ41の入力までのパケット監視部13,15,43をパケットが通過するが、スイッチ41の出力以降のパケット監視部44,57,53をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、制御パケットバッファPBC、及び制御部CONTの監視部位欄には、パケットの通過は記録されない。
【0111】
上記は、ルーティング情報を含むパケットを例に説明したが、自装置発または自装置宛の他のパケットについても同様に監視が可能である。
【0112】
[通信システムの変形例]
上述した一実施の形態のサイレント障害自律検出機能を含む通信システム1においては、伝送対象パケットを転送する各ルータR11,R12,R13,R14に含まれている制御部CONTの通過判定部55が、パステーブル56及びパケット監視部13などと協働してルータ内部の異常発生を検出し、保守運用システム4にルータのIPアドレス及び障害箇所を含む障害部位通知を行う。
【0113】
この結果、保守運用システム4においては、各ルータからのこの障害部位通知に基づいて、特定ルータがパケット転送不可能であることを認識可能とした。
【0114】
図13に例示する変形例の通信システム1Bにおいては、通過判定部及びパステーブルを集中配置の制御部としての制御システム7に設ける。
【0115】
この制御システム7においては、各ルータR11A〜R14Aが、自身を通過する伝送対象パケットにルータ内部の通過ルートを示すパス識別子を付加し、ルータ内の各部位においてパス識別子を監視し、各部位のパケット通過状況をルータのIPアドレスとともに制御システム7に通知する。
【0116】
パス識別子及び通過部位情報を含むパケット通過情報とルータのIPアドレスとを通知された制御システム7においては、通過判定部(図示省略)がルータ対応のパステーブル(図示省略)にパケット通過情報を格納する。通過判定部は、このパステーブルの格納情報に基づいて、各ルータの各部位のパケット転送の有無を判定し、障害発生ルータの障害箇所を特定する。そして、制御システム7は保守運用システム4にルータのIPアドレス及び障害箇所を含む障害部位通知を行う。
【0117】
この結果、保守運用システム4においては、制御システム7からのこの障害部位通知に基づいて、特定ルータがパケット転送不可能であることを認識可能である。
【0118】
この通信システム1Aのように、通過判定部及びパステーブルを含む制御システム7が集中配置の制御部としてネットワークレベルにある場合は、通信システム1に比較して、次のメリットがある。
【0119】
(1)既存ルータへの変更を抑制しながら、通信システムにサイレント障害自律検出機能を適用することが可能である。
【0120】
(2)ルータが中継する伝送対象パケットのトラフィック量の増大などに起因して、ルータが管理するパステーブルのサイズが増大した場合に、ルータ内部のメモリ増設が必要になる。この場合、IPネットワークに存在する各ルータへの変更を抑制し、外部の制御システムの新設によって対応することが可能である。
【0121】
[その他の変形例]
上述した一実施の形態及び変形例においては、識別子付与部がパス識別子を伝送対象パケットに付加し、各パケット監視部が抽出したパス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知することにより、通過判定部はパステーブルに記録したパケットの通過状況に応じて、装置内の障害箇所を検出しているが、識別子付与部を有しない中継装置においても障害箇所の特定が可能である。この場合、各パケット監視部では、パケット通過という事象のみをパステーブルに記録するように通知する。そして、通過判定部では、伝送対象パケットの通過ルート単位での通過判定は行わず、全ての通過ルートをまとめて通過判定を行う。これにより、通過ルート単位での障害箇所の特定はできないが、装置内の障害箇所の特定自体は可能である。また、パケット通過という事象を通過判定部に通知するパケット監視部を宛先アドレス抽出部の前段に物理的または論理的に配置する構成を上述した一実施の形態またはこのその他変形例と併用することにより、宛先アドレス抽出部の障害も検出できる等、より幅広い範囲での障害箇所特定が可能である。
【0122】
上述した一実施の形態及び変形例における処理はコンピュータで実行可能なプログラムとして提供され、CD−ROMやフレキシブルディスクなどの記録媒体、さらには通信回線を経て提供可能である。
【0123】
また、上述した一実施の形態及び変形例における各処理はその任意の複数または全てを選択し組合せて実施することもできる。
【0124】
[その他]
上述した一実施の形態及び変形例に関し、更に以下の付記を開示する。
【0125】
(付記1)
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;
前記複数の監視手段から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段と;
を備える中継装置。
【0126】
(付記2)
前記付加手段は、前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加し、
前記パス識別子は、装置内の各監視箇所に存在する前記監視手段が前記伝送対象パケットを通過ルート単位で監視するか、通過ルート毎にパケット単位で監視するかを示す情報を含む
付記1記載の中継装置。
【0127】
(付記3)
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
付記1または2記載の中継装置。
【0128】
(付記4)
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す情報に加え、同一通過ルートを通る断片化パケットを示すための順序番号であるパケット番号を含む前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
付記1または2記載の中継装置。
【0129】
(付記5)
前記判定手段は、予め定めた時間内に、前記パステーブルに前記装置内の全ての監視箇所の前記通過状況が記録されないときは、異常発生と判定する
付記1記載の中継装置。
【0130】
(付記6)
前記複数の監視手段による前記装置内の監視箇所は、複数の入力インターフェース部、複数の出力インターフェース部、及び前記複数の入力インターフェース部と前記複数の出力インターフェース部とを相互接続するスイッチ部を含む
付記1記載の中継装置。
【0131】
(付記7)
前記付加手段は、ルーティング情報を含む制御パケットを発信するときは、前記装置内の通過ルートとして、前記入力インターフェース番号に代替して制御パケット発信を示す情報と前記出力インターフェース番号とを示す前記パス識別子を前記伝送対象パケットに付加する
付記3または4記載の中継装置。
【0132】
(付記8)
前記付加手段は、ルーティング情報を含む制御パケットが着信したときは、前記装置内の通過ルートとして、前記入力インターフェース番号と、前記出力インターフェース番号に代替して制御パケット着信を示す情報とを示す前記パス識別子を前記伝送対象パケットに付加する
付記1記載の中継装置。
【0133】
(付記9)
前記判定手段及び前記パステーブルが、個別配置の制御部またはネットワークレベルの集中配置の制御部に設けられている
付記1記載の中継装置。
【0134】
(付記10)
前記判定手段は、検出した装置内の障害箇所を保守運用システムに通知する
付記1記載の中継装置。
【0135】
(付記11)
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加し;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報を複数の監視箇所からそれぞれ通知し;
前記複数の監視箇所から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する;
ことを中継装置が処理するサイレント障害自律検出方法。
【符号の説明】
【0136】
1 通信システム
1B 通信システム
2 IPネットワーク
4 保守運用システム
5 通信端末装置
6 通信端末装置
7 制御システム
R11 ルータ
R12 ルータ
R13 ルータ
R14 ルータ
R11A ルータ
R12A ルータ
R13A ルータ
R14A ルータ
【技術分野】
【0001】
本発明は、サイレント障害自律検出機能を含む通信システムに適用される中継装置に関する。
【背景技術】
【0002】
インターネットまたはイントラネットなどのIP(Internet Protocol)ネットワーク
を通して、クライアント・クライアント間通信及びサーバ・クライアント間通信を行わせる通信システムにおいては、伝送対象データをパケット形態で中継(転送)するネットワーク中継装置としての複数のルータがIPネットワーク上に配置される。
【0003】
通常、このような通信システムにおいては、パケット損失や転送遅延などの異常が生じたとき、該当ルータから保守運用システムに障害通知が行われる。保守運用システムの保守運用者(監視者)は、この障害通知に基づいて、特定のルータがパケット転送不可能であることを知り得る。
【0004】
しかし、異常が発生しているにも関らず、ルータ自体が劣化または故障のために異常発生を検出できず、保守運用システムに障害の通知がない場合がある。この場合、保守運用者は、例えば通信に影響が出た後に、ユーザからの異常申告があって、初めて障害を認識可能である。
【0005】
通信システムにおいて潜在化し、異常発生を自律的に直ちに検出できないこのような障害は、サイレント障害と称される。近年、このサイレント障害をIPネットワーク内で早期に検出する手法が求められている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−28305号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
図1には、上述したサイレント障害を検出するための一手法を採る通信システムが例示されている。通信システム1Aにおいては、複数のプローブ装置P1,P2,P3,P4,P5がIPネットワーク2上のルータR1,R2,R3,R4間の監視箇所にそれぞれ配置されている。
【0008】
プローブ装置P1〜P5は、伝送対象データであるパケットの到着状態を監視することにより、各ルータR1〜R4が自身で検出できない異常を検出する。そして、プローブ装置P1〜P5及び損失箇所特定装置3の連携により、保守運用システム4などの外部に異常通知が行われる。
【0009】
更に詳述すると、図2に示すように、プローブ装置P1,P2が各パケット(断片化パケット)に対して通過履歴としてプローブ装置識別子ID(P1),ID(P2)を付与する。各パケットは、複数のプローブ装置P1,P2を経由しながら、損失箇所特定装置3に到着する。損失箇所特定装置3は、到着したパケットに含まれる通過履歴に基づいて、パケットの通過経路と、パケットの損失が発生した損失発生箇所(単に、損失箇所と記載することもある)とを特定可能である。
【0010】
図2に示す例では、ルータR1,R2間に配置されたプローブ装置P1は、IPヘッダにシーケンス番号seq#N,seq#N+1,seq#N+2,seq#N+3を含むパケットを順次に受信し、通過履歴としてプローブ装置識別子ID(P1)を各パケットに付与した後に送信する。
【0011】
ルータR2,R3間に配置されたプローブ装置P2は、IPヘッダにシーケンス番号seq#N,seq#N+2,seq#N+3を含むパケットを受信するが、シーケンス番号seq#Nに続くシーケンス番号seq#N+1を含むパケットを受信していないので、シーケンス番号seq#N+2を含むパケットには、通過履歴としてプローブ装置識別子ID(P2)を付与することなく送信する。
【0012】
損失箇所特定装置3は、ルータR3を介してプローブ装置P2から送信されたパケットを受信したとき、到着(受信)パケットに付与された通過履歴のプローブ装置識別子ID(P1),ID(P2)に基づいて、パケットの通過経路を特定する。ここでは、損失箇所特定装置3は、シーケンス番号seq#N+2のパケットに通過履歴のプローブ装置識別子ID(P2)が付与されていないので、損失発生箇所をプローブ装置P1,P2間と特定(認識)可能である。
【0013】
上述したプローブ装置P1,P2及び損失箇所特定装置3による障害の検出では、各プローブ装置P1,P2が通過履歴を各パケットに付与し、損失箇所特定装置3が各パケットの最終的な通過判定を行う。このために、各パケットが途中で全て損失して、パケットの損失発生箇所を示す識別子(プローブ装置識別子)が損失箇所特定装置3に到達しない場合は、損失発生箇所を特定できない(図3参照)。
【0014】
また、シーケンス番号seq#N,seq#N+1,seq#N+2,seq#N+3による通過監視を実施しているので、次の制限(1),(2),(3)を免れない。
【0015】
(1)再送パケットには適用できない。つまり、再送パケットについては、シーケンス番号seq#N,seq#N+2が連続ではないので、プローブ装置識別子が付与されない。この結果、再送パケットの損失発生箇所が特定できない(図4参照)。
【0016】
(2)単発パケットには適用できない。つまり、複数の断片化パケットではない単発パケットについては、シーケンス番号に基づくプローブ装置識別子の付与ができない。したがって、損失発生箇所の特定もできない(図5参照)。
【0017】
(3)RTP(Real-time Transfer Protocol)プロトコルに則る通信にしか適用でき
ない。RTPプロトコルは、ビデオやオーディオ配信などのリアルタイム性が要求されるデータストリーム転送のための通信プロトコルである。
【0018】
そして、上述した障害検出手法では、各ルータ内部の障害箇所(異常発生箇所)を特定できない根本的問題が残存する。
【0019】
課題は、中継装置内部の障害箇所(異常発生箇所)を自律的に特定することを可能にする技術を提供することにある。
【課題を解決するための手段】
【0020】
上記課題を解決するために、中継装置は、装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;前記複数の監視手段から通知される前記通過情報
に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段とを備える。
【発明の効果】
【0021】
開示した中継装置によれば、装置内のサイレント障害を自律的に検出することができる。
【0022】
他の課題、特徴及び利点は、図面及び特許請求の範囲とともに取り上げられる際に、以下に記載される発明を実施するための形態を読むことにより明らかになるであろう。
【図面の簡単な説明】
【0023】
【図1】サイレント障害を検出する関連技術を説明するための図。
【図2】サイレント障害を検出する関連技術を説明するための図。
【図3】関連技術の問題点を説明するための図。
【図4】関連技術の問題点を説明するための図。
【図5】関連技術の問題点を説明するための図。
【図6】一実施の形態の通信システムの構成を示すブロック図。
【図7】一実施の形態の通信システムにおけるルータの構成を示すブロック図。
【図8】図7に示すルータにおける伝送対象パケット及びパス識別子を説明する図。
【図9】図7に示すルータにおける処理を説明するためのフローチャート。
【図10】図7に示すルータにおける処理を説明するためのフローチャート。
【図11】図7に示すルータにおける処理を説明するためのフローチャート。
【図12】図7に示すルータにおけるパステーブルを説明する図。
【図13】変形例の通信システムの構成を示すブロック図。
【発明を実施するための形態】
【0024】
以下、添付図面を参照して、さらに詳細に説明する。図面には好ましい実施形態が示されている。しかし、多くの異なる形態で実施されることが可能であり、本明細書に記載される実施形態に限定されない。
【0025】
[通信システム]
一実施の形態におけるシステム構成を示す図6を参照すると、サイレント障害自律検出機能を含む通信システム1は、インターネットまたはイントラネットなどのIPネットワーク2上に配置され、伝送対象データをパケット形態で中継(転送)するネットワーク中継装置としての複数のルータR11,R12,R13,R14を備えている。
【0026】
これらのルータR11〜R14は、入口エッジノード、中継ノード及び出口エッジノードとして機能し、例えばIPネットワーク2に接続される複数の通信端末装置5,6に対して、クライアント・クライアント間通信を行わせる。また、ルータR11〜R14は、サーバがIPネットワーク2に接続されている場合、例えば通信端末装置5にサーバ・クライアント間通信を行わせる。
【0027】
この通信システム1においては、パケット損失や転送遅延などの異常がルータ内部で生じたとき、ネットワーク回線を通して、該当ルータ(例えば、ルータR12)から保守運用システム4に障害部位通知が行われる。保守運用システム4の保守運用者(監視者)は、ルータのIPアドレス及び障害箇所を含む障害部位通知に基づいて、特定ルータがパケット転送不可能であることを認識する。
【0028】
後に詳述するが、この通信システム1においては、各ルータR11〜R14が、自身を通過する伝送対象パケットにルータ内部の通過ルートを示すパス識別子を付加し、ルータ
内の各部位においてパス識別子を監視し、各部位のパケット通過状況をパステーブルに格納する。各ルータR11〜R14は、このパステーブルの格納情報に基づいて、各部位のパケット転送の有無を判定し、異常発生時にルータ内部の障害箇所を自律的に特定する。
【0029】
[ルータの構成]
図6に示す通信システム1において、ネットワーク中継装置として機能するルータR11〜R14は、図7に示す詳細構成を採る。
【0030】
各ルータは、図7に示すように、複数(n個;n≧2)の入力(入口)インターフェース部IFI1〜IFIn、複数(m個;m≧2)の出力(出口)インターフェース部IFE1〜IFEm、スイッチ部SW、及び制御部CONTを備える。各ルータにおいて、入力インターフェース部IFI1〜IFIn、出力インターフェース部IFE1〜IFEm、及びスイッチ部SWは、制御線C1を通して制御部CONTに接続されている。
【0031】
各入力インターフェース部IFI1〜IFInは、入力パケットバッファPBI及び入力ネットワークプロセッサNPIを備える。また、各出力インターフェース部IFE1〜IFEmは、出力パケットバッファPBO及び出力ネットワークプロセッサNPOを備える。なお、図7においては、入力インターフェース部IFIn及び出力インターフェース部IFE1の詳細構成だけを示して簡潔化を図っている。
【0032】
入力インターフェース部IFI1〜IFInの各入力ネットワークプロセッサNPIは、宛先アドレス抽出部11、識別子付与部12、パケット監視部13、及び簡易ルーティングテーブルであるIP転送テーブル(FIB:Forwarding Information Base)14を
含む。入力インターフェース部IFI1〜IFInの各入力パケットバッファPBIはパケット監視部15を含む。ここで、FIB14は入力ネットワークプロセッサNPIが有する図示省略のメモリに設けられる。また、宛先アドレス抽出部11、識別子付与部12、及びパケット監視部13,15は、入力ネットワークプロセッサNPIのメモリに展開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0033】
出力インターフェース部IFE1〜IFEmの各出力ネットワークプロセッサNPOは、パケット監視部21及び識別子除去部22を含む。出力インターフェース部IFE1〜IFEmの各出力パケットバッファPBOはパケット監視部23を含む。ここで、パケット監視部21,23及び識別子除去部22は、出力ネットワークプロセッサNPOの図示省略のメモリに展開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0034】
スイッチ部SWは、スイッチ41及び複数のパケット監視部42,43,44,45,46を含む。スイッチ部SWは、クロスコネクト機能を有するスイッチファブリックのスイッチ41を介して、入力インターフェース部IFI1〜IFInと出力インターフェース部IFE1〜IFEmとを相互接続する。ここで、パケット監視部42〜46は、スイッチ部SWにおける図示省略のプロセッサのメモリに展開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0035】
制御部CONTは、ルーティング制御部51、識別子付与部52、パケット監視部53、ルーティングテーブル54、通過判定部55、及びパステーブル56を含む。また、制御部CONTの制御パケットバッファPBCはパケット監視部57を含む。ここで、ルーティングテーブル54及びパステーブル56は、制御部CONTの図示省略のメモリに設けられる。また、ルーティング制御部51、識別子付与部52、パケット監視部53,57、及び通過判定部55は、制御部CONTにおける図示省略のプロセッサのメモリに展
開されるプログラムの実行により、後に詳述する機能を果たす機能構成要素として実施可能である。
【0036】
[ルータの機能]
図7に詳細構成を例示するルータのn個目の入力インターフェース部IFInに伝送対象パケット(単に、パケットと記載することもある)が到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着(受信)した伝送対象パケットのIPヘッダから宛先アドレス(IPアドレス)「a」を抽出し、識別子付与部12に通知する。
【0037】
識別子付与部12は、通知された宛先アドレス「a」に基づいて、IP転送テーブル(FIB)14の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を決定し、伝送対象パケットに出力インターフェース識別子「E1」をルータ内ヘッダとして付加する。FIB14には、制御部CONTからの指示により、宛先アドレスと出力インターフェース番号との対応関係が予め設定されている。
【0038】
また、識別子付与部12は、ルータ内でパケットの通過ルートを一意に示すパス識別子「X」を伝送対象パケットにルータ内ヘッダとして付加する。識別子付与部52は識別子付与部12と同様に機能する。このパス識別子の詳細については後述する。
【0039】
パケット監視部13は、通過するパケットのパス識別子を監視し、パケット通過情報を制御部CONTの通過判定部55に通知する。ルータ内の各部位(監視箇所)に存在する他のパケット監視部15,21,23,42〜46,53,57は、同様に通過するパケットのパス識別子を監視し、パケット通過情報を通過判定部55に通知する。
【0040】
入力パケットバッファPBIは、スイッチ部SWにパケットを転送する際に、パケットを一時的に蓄える。
【0041】
スイッチ部SWは、パケットに付加された出力インターフェース識別子「E1」に従い、スイッチ41によりパケットを出力インターフェース部IFE1にスイッチングする。なお、このスイッチング制御のためのプロセッサは図示を省略している。
【0042】
出力インターフェース部IFE1の出力パケットバッファPBOは、出力ネットワークプロセッサNPOにパケットを転送する際に、パケットを一時的に蓄える。
【0043】
識別子除去部22は、パケットに付加されている出力インターフェース識別子「E1」及びパス識別子「X」を含むルータ内ヘッダを除去する。
【0044】
制御部CONTの通過判定部55は、通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を記録する。パステーブル56は、通過判定部55からの指示により、各監視箇所のパケット通過状況を保持する。また、通過判定部55は、パステーブル56を監視(参照)し、パケット通過状況に応じて、ルータ内部の障害を検出し、保守運用システム4に通知する。
【0045】
この一実施の形態の通信システム1のルータにおいては、ルーティング制御部51、識別子付与部52、パケット監視部53、ルーティングテーブル54、及び制御パケットバッファPBCのパケット監視部57は、他のルータとルーティング(経路)情報を交換する場合に機能する。この場合、通過判定部55は、パケット監視部53,57などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を記録するとともに、パステーブル56を監視し、パケット通過状況に応じて、ルータ内部の障害を検出
し、保守運用システム4に通知する。
【0046】
[パス識別子]
上述したように、識別子付与部12は、出力インターフェース識別子とともに、ルータ内の通過(転送)ルートを一意に示すパス識別子を伝送対象パケットにルータ内ヘッダ(装置内ヘッダ)として付加する。ここで、図8を参照して、パス識別子の詳細について述べる。
【0047】
図8に示すように、ルータ内で転送される伝送対象パケットは、IPヘッダ及びデータ(パケットデータ)を含む通常のIPパケットにルータ内ヘッダの一部としてパス識別子PIDを付加した構成である。パス識別子PIDは、バージョンF1、ヘッダ長F2、ルータの入力インターフェース番号(入力物理ポート番号)F3、ルータの出力インターフェース番号(出力物理ポート番号)F4、及びパケット番号F5のフィールドを含む。
【0048】
パス識別子PIDにおいて、バージョンF1はパス識別子のバージョンを4bitで表す。ここでは、バージョンF1は、ルータ内の各監視箇所に存在するパケット監視部が通過する伝送対象パケットをルート(通過ルート)単位で監視するか、通過ルート毎にパケット単位で監視するかを表す。このバージョンF1は、例えば保守運用システム4からの指示に基づいて、制御部CONTにより識別子付与部12,52に予め通知される。
【0049】
また、パス識別子PIDにおいて、ヘッダ長F2はパス識別子全体の長さを1byteで表す。ルータの入力インターフェース番号F3は、伝送対象パケットがルータに到着した際の入力インターフェース部IFI1〜IFInのインターフェース番号を表す。ルータの出力インターフェース番号F4は、伝送対象パケットがルータから送出される際の出力インターフェース部IFE1〜IFEmのインターフェース番号を表す。
【0050】
さらに、パス識別子PIDにおいて、パケット番号F5は、ルータ内の同一ルートを通る断片化パケットを一意に示すための順序番号であり、IPヘッダから得ることが可能である。入力インターフェース番号F3、出力インターフェース番号F4及びパケット番号F5のフィールドは可変長である。
【0051】
更に詳述すると、ルータ内の各監視箇所に存在するパケット監視部が、バージョンF1に基づいて通過する伝送対象パケットを通過ルート単位で監視し、パケット通過情報を通過判定部55に通知する第1監視形態を採る場合、識別子付与部12は、ルータ内の通過ルート、つまり入力インターフェース番号と出力インターフェース番号との組を一意に示すパス識別子PIDを伝送対象パケットにルータ内ヘッダとして付加する。
【0052】
したがって、第1監視形態を採る場合、パス識別子PIDには、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)が設定されるが、パケット番号F5は設定されない。そして、パステーブル56のパス識別子欄には、入力インターフェース番号F3と出力インターフェース番号F4との組を一意に示す「51」が記録される。
【0053】
また、各パケット監視部が、バージョンF1に基づいて通過する伝送対象パケットを通過ルート毎にパケット単位で監視し、パケット通過情報を通過判定部55に通知する第2監視形態を採る場合、識別子付与部12は、ルータ内の通過ルート(入力インターフェース番号と出力インターフェース番号との組)を一意に示す情報に加え、ルータ内の同一ルートを通る断片化パケットを一意に示すための順序番号であるパケット番号を含むパス識別子PIDを伝送対象パケットにルータ内ヘッダとして付加する。
【0054】
したがって、第2監視形態を採る場合、パス識別子PIDには、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)と共に、パケット番号F5(例えば、F5=045)が設定される。そして、パステーブル56のパス識別子欄には、入力インターフェース番号F3と出力インターフェース番号F4とパケット番号F5とを示す「51045」が記録される。
【0055】
[ルータの動作]
〈第1監視形態〉
ルータ内の各監視箇所に存在するパケット監視部が、通過する伝送対象パケットのパス識別子PIDを通過ルート単位で監視し、パケット通過情報を通過判定部55に通知する第1監視形態を採る場合、ルータにおける動作例について関連図を併せ参照して説明する。
【0056】
図7に詳細構成を例示するルータのn個目の入力インターフェース部IFInにパケットが到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着(受信)した伝送対象パケットのIPヘッダから宛先アドレス(IPアドレス)「a」を抽出し、識別子付与部12に通知する(図9中の処理901,902)。
【0057】
識別子付与部12は、通知された宛先アドレス「a」に基づいて、FIB14の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を決定(抽出)し、スイッチ41におけるスイッチングのための出力インターフェース識別子「E1」を生成して、伝送対象パケットにルータ内ヘッダの一部として付加する(図9中の処理903,904,905)。
【0058】
また、識別子付与部12は、ルータ内の通過ルートPR1、つまり入力インターフェース番号と出力インターフェース番号との組を一意に示すパス識別子(PID)「X」を作成して、伝送対象パケットにルータ内ヘッダとして更に付加した後に送出する(図9中の処理906,907)。
【0059】
第1監視形態を採る場合、パス識別子「X」には、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)が設定されるが、パケット番号F5は設定されない。
【0060】
パケット監視部13は、通過するパケットを監視してパス識別子「X」を抽出し、パス識別子「X」及び通過部位情報(ここでは、NPI番号)を含むパケット通過情報を制御部CONTの通過判定部55に制御線C1を通して通知した後に、パケットを送出する(図10中の処理1001,1002,1003,1004)。
【0061】
ルータ内の各監視箇所に存在する他のパケット監視部15,21,23,42,43,45,46は、同様に通過するパケットを監視してパス識別子「X」を抽出し、パケット通過情報を通過判定部55に通知する。
【0062】
通過判定部55は、パケット監視部13などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する(図10中の処理1005)。
【0063】
通過判定部55は、伝送対象パケットがルータに到着した後、予め定めた時間内にルータから出力しないとき、異常発生と判定する。この例では、通過判定部55は、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っ
ても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0064】
続いて、通過判定部55における処理について、更に詳述する。
【0065】
通過判定部55は、パケット監視部13などからパス識別子「X」及び通過部位情報を含むパケット通過情報を受信すると、パステーブル56にエントリがあることを判定する(図11中の処理1101,1102)。
【0066】
エントリとしてのパス識別子「X」がパステーブル56に既に記録されている場合は、パケット通過状況をパステーブル56に記録し、上書更新する(図11中の処理1105)。
【0067】
エントリとしてのパス識別子「X」がパステーブル56にない場合は、パステーブル56のパス識別子欄には、新規エントリが作成(記録)される(図11中の処理1103)。
【0068】
通過判定部55は、新規エントリを作成したとき、障害判定タイマTM1をセット(起動:ON)し、パケット通過状況をパステーブル56に記録する(図11中の処理1104,1105)。
【0069】
通過判定部55は、全てのパケット通過状況をパステーブル56に記録したとき、障害判定タイマTM1をリセット(停止:OFF)して、処理を終了する(図11中の処理1106,1107)。
【0070】
通過判定部55は、上記処理1101〜1106を繰り返しながら、上記処理1104においてセットした障害判定タイマTM1が満了したか否かを判定する(図11中の処理1108)。
【0071】
通過判定部55は、障害判定タイマTM1が満了したときは、パステーブル56を参照し、パケット通過状況が記録されていない監視部位の障害と判定し、障害部位を保守運用システム4に通知する(図11中の処理1109,1110)。
【0072】
続いて、通過判定部55は、パステーブル56中の対応エントリのレコードをクリアすると共に、障害判定タイマTM1をリセットして、処理を終了する(図11中の処理1111,1112)。
【0073】
図12(A)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてX=「51」が記録される。また、パステーブル56のパス識別子「51」に対応するレコードの各監視部位(監視箇所)欄には、パケット通過状況(ON:通過)が記録される。
【0074】
ルータにおける対象の監視部位は、入力インターフェース部IFI1〜IFIn、出力インターフェース部IFE1〜IFEm、及びスイッチ部SWであるが、この例では、障害検出精度を上げるために更に細分化している。したがって、図12(A)に示すように、パステーブル56の監視部位欄には、入力ネットワークプロセッサNPI、入力パケットバッファPBI、スイッチ部SWの入力及び出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOが予め登録されている。
【0075】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場
合、スイッチ41の入力までのパケット監視部13,15,43をパケットが通過するが、スイッチ41の出力以降のパケット監視部45,23,21をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOの監視部位欄には、パケットの通過は記録されない。
【0076】
ルータが正常動作している場合、識別子除去部22において出力インターフェース識別子「E1」及びパス識別子「X」を含むルータ内ヘッダを除去された伝送対象パケットはルータから送出される。
【0077】
〈第2監視形態〉
次に、ルータ内の各監視箇所に存在するパケット監視部が、通過する伝送対象パケットのパス識別子PIDを通過ルート毎にパケット単位で監視し、パケット通過情報を通過判定部55に通知する第2監視形態を採る場合、ルータにおける動作例について関連図を併せ参照して説明する。
【0078】
図7に詳細構成を例示するルータのn個目の入力インターフェース部IFInにパケットが到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着した伝送対象パケットのIPヘッダから宛先アドレス「a」を抽出し、識別子付与部12に通知する(図9中の処理901,902)。
【0079】
識別子付与部12は、通知された宛先アドレス「a」に基づいて、FIB14の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を抽出し、スイッチ41におけるスイッチングのための出力インターフェース識別子「E1」を生成して、伝送対象パケットにルータ内ヘッダの一部として付加する(図9中の処理903,904,905)。
【0080】
また、識別子付与部12は、ルータ内の通過ルートPR1、つまり入力インターフェース番号と出力インターフェース番号との組を一意に示す情報に加え、ルータ内の同一ルートを通る断片化パケットを一意に示すための順序番号であるパケット番号を含むパス識別子(PID)「X」(「X1」,「X2」・・・)を作成して、伝送対象パケットにルータ内ヘッダとして更に付加した後に送出する(図9中の処理906,907)。なお、識別子付与部12は、パス識別子「X1」,「X2」などを作成する過程で、伝送対象パケットのIPヘッダから断片化パケットの順序番号を抽出してパケット番号とする。
【0081】
第2監視形態を採る場合、パス識別子「X1」には、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)と共に、パケット番号F5(例えば、F5=001)が設定される。次のパス識別子「X2」には、識別子付与部12により、入力インターフェース番号F3(例えば、F3=#In=5)及び出力インターフェース番号F4(例えば、F4=#E1=1)と共に、パケット番号F5(例えば、F5=002)が設定される。
【0082】
続いて、ルータ内の各監視箇所に存在するパケット監視部13,15,43,45,23,21は、上述した処理1001,1002,1003,1004と同様に、通過するパケットを監視してパス識別子「X1」,「X2」などを抽出し、パケット通過情報を通過判定部55に通知する。
【0083】
通過判定部55は、上述した処理1005と同様に、パケット監視部13などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する。
【0084】
また、通過判定部55は、上述した処理1101〜1112と同様に、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0085】
図12(B)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてX1=「51001」,X2=「51002」などが記録される。また、パステーブル56のパス識別子「51001」,「51002」に対応するレコードの各監視部位欄には、パケット通過状況(ON:通過)が記録される。
【0086】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場合、スイッチ41の入力までのパケット監視部13,15,43をパケットが通過するが、スイッチ41の出力以降のパケット監視部45,23,21をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOの監視部位欄には、パケットの通過は記録されない。
【0087】
ルータが正常動作している場合、識別子除去部22において出力インターフェース識別子「E1」及びパス識別子「X1」,「X2」などを含むルータ内ヘッダを除去された伝送対象パケットはルータから送出される。
【0088】
〈変形動作例〉
図6に示す一実施の形態の通信システム1においては、IPネットワーク2上のルータR11〜R14間でルーティング情報を交換する場合がある。
【0089】
図7に詳細構成を例示するルータ(特定ルータ)においては、ルーティング制御部51、識別子付与部52、パケット監視部53、ルーティングテーブル54、及び制御パケットバッファPBCのパケット監視部57は、他のルータとルーティング情報を交換する場合に機能する。
【0090】
ルーティング情報を交換する場合、特定ルータのルーティング制御部51から他のルータにルーティング情報を含む制御パケットを図7中の通過ルートPR2により発信する形態と、他のルータから特定ルータのルーティング制御部51にルーティング情報を含む制御パケットが図7中の通過ルートPR3により着信する形態とがある。これらの制御パケット発信形態及び制御パケット着信形態のいずれにおいても上述した第1監視形態及び第2監視形態を選択的に適用可能である。
【0091】
例えば、制御パケットを通過ルートPR2により発信する形態において、第1監視形態を採用する場合、ルーティング制御部51は、伝送対象パケット(制御パケット)のIPヘッダに他のルータ対応の宛先アドレス「a」及びルーティング情報を含む制御パケットを示す情報を設定し、識別子付与部52に通知する。
【0092】
識別子付与部52は、通知された宛先アドレス「a」に基づいて、ルーティングテーブル54の格納情報から1個目の出力インターフェース部IFE1対応の出力インターフェース番号「#E1」を抽出し、スイッチ41におけるスイッチングのための出力インターフェース識別子「E1」を生成して、伝送対象パケットにルータ内ヘッダの一部として付加する。
【0093】
また、識別子付与部52は、通知されたルーティング情報を含む制御パケットを示す情報に基づいて、ルータ内の通過ルートとして、入力インターフェース番号に代替して制御
パケット発信を示す情報と出力インターフェース番号とを示すパス識別子「M1」を作成して、伝送対象パケットにルータ内ヘッダとして更に付加した後に送出する。
【0094】
制御パケット発信形態を採る場合、伝送対象パケットは、制御パケットバッファPBCからパケット監視部44を経て、スイッチ41に入力される。
【0095】
ルータ内の各監視箇所に存在するパケット監視部53,57,44,45,23,21は、上述した処理1001,1002,1003,1004と同様に、通過するパケットを監視してパス識別子「M1」を抽出し、パケット通過情報を通過判定部55に通知する。
【0096】
通過判定部55は、上述した処理1005と同様に、パケット監視部53などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する。
【0097】
また、通過判定部55は、上述した処理1101〜1112と同様に、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0098】
図12(C)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてM1=「01」(ここで、「0」は制御パケット発信を示す情報である)が記録される。また、パステーブル56のパス識別子「01」に対応するレコードの各監視部位欄には、パケット通過状況(ON:通過)が記録される。
【0099】
図12(C)に示すように、パステーブル56の監視部位欄には、制御部CONT、制御パケットバッファPBC、スイッチ部SWの入力及び出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOが予め登録されている。
【0100】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場合、スイッチ41の入力までのパケット監視部53,57,44をパケットが通過するが、スイッチ41の出力以降のパケット監視部45,23,21をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、出力パケットバッファPBO、及び出力ネットワークプロセッサNPOの監視部位欄には、パケットの通過は記録されない。
【0101】
ルータが正常動作している場合、識別子除去部22において出力インターフェース識別子「E1」及びパス識別子「M1」を含むルータ内ヘッダを除去された伝送対象パケットはルータから送出される。
【0102】
次に、例えば、制御パケットが通過ルートPR3により着信する形態において、第1監視形態を採用する場合、ルータのn個目の入力インターフェース部IFInにパケットが到着したとき、入力ネットワークプロセッサNPIの宛先アドレス抽出部11は、到着した伝送対象パケット(制御パケット)のIPヘッダから自己宛の宛先アドレス「aa」を抽出し、識別子付与部12に通知する。
【0103】
識別子付与部12は、通知された自己宛の宛先アドレス「aa」に基づいて、IPヘッダからルーティング情報を含む制御パケットを示す情報を参照し、ルータ内の通過ルートとして、入力インターフェース番号と、出力インターフェース番号に代替して制御パケット着信を示す情報とを示すパス識別子「M2」を作成して、伝送対象パケットにルータ内ヘッダとして付加した後に送出する。
【0104】
制御パケット着信形態を採る場合、伝送対象パケットは、入力パケットバッファPBIからパケット監視部43を経てスイッチ41に入力され、パケット監視部44に出力される。そして、伝送対象パケットは、制御パケットバッファPBC及びパケット監視部53を経て、ルーティング制御部51に入力されて処理される。
【0105】
ルータ内の各監視箇所に存在するパケット監視部13,15,43,44,57,53は、上述した処理1001,1002,1003,1004と同様に、通過するパケットを監視してパス識別子「M2」を抽出し、パケット通過情報を通過判定部55に通知する。
【0106】
通過判定部55は、上述した処理1005と同様に、パケット監視部13などから通知されたパケット通過情報を基に、パステーブル56にパケット通過状況を順次に記録し、上書更新する。
【0107】
また、通過判定部55は、上述した処理1101〜1112と同様に、パステーブル56に新規エントリを作成した後、パステーブル56を監視し、予め定めた時間待っても、全ての監視部位にパケット通過が記録されなければ、異常発生と判定し、特定した障害部位を保守運用システム4に通知する。
【0108】
図12(D)に示す例では、パステーブル56のパス識別子欄には、新規エントリとしてM2=「50」(ここで、「0」は制御パケット着信を示す情報である)が記録される。また、パステーブル56のパス識別子「50」に対応するレコードの各監視部位欄には、パケット通過状況(ON:通過)が記録される。
【0109】
図12(D)に示すように、パステーブル56の監視部位欄には、入力ネットワークプロセッサNPI、入力パケットバッファPBI、スイッチ部SWの入力及び出力、制御パケットバッファPBC、及び制御部CONTが予め登録されている。
【0110】
例えば、スイッチ部SWのスイッチ41内部の障害により、パケット損失が発生した場合、スイッチ41の入力までのパケット監視部13,15,43をパケットが通過するが、スイッチ41の出力以降のパケット監視部44,57,53をパケットが通過しないので、パステーブル56のスイッチ部SWの出力、制御パケットバッファPBC、及び制御部CONTの監視部位欄には、パケットの通過は記録されない。
【0111】
上記は、ルーティング情報を含むパケットを例に説明したが、自装置発または自装置宛の他のパケットについても同様に監視が可能である。
【0112】
[通信システムの変形例]
上述した一実施の形態のサイレント障害自律検出機能を含む通信システム1においては、伝送対象パケットを転送する各ルータR11,R12,R13,R14に含まれている制御部CONTの通過判定部55が、パステーブル56及びパケット監視部13などと協働してルータ内部の異常発生を検出し、保守運用システム4にルータのIPアドレス及び障害箇所を含む障害部位通知を行う。
【0113】
この結果、保守運用システム4においては、各ルータからのこの障害部位通知に基づいて、特定ルータがパケット転送不可能であることを認識可能とした。
【0114】
図13に例示する変形例の通信システム1Bにおいては、通過判定部及びパステーブルを集中配置の制御部としての制御システム7に設ける。
【0115】
この制御システム7においては、各ルータR11A〜R14Aが、自身を通過する伝送対象パケットにルータ内部の通過ルートを示すパス識別子を付加し、ルータ内の各部位においてパス識別子を監視し、各部位のパケット通過状況をルータのIPアドレスとともに制御システム7に通知する。
【0116】
パス識別子及び通過部位情報を含むパケット通過情報とルータのIPアドレスとを通知された制御システム7においては、通過判定部(図示省略)がルータ対応のパステーブル(図示省略)にパケット通過情報を格納する。通過判定部は、このパステーブルの格納情報に基づいて、各ルータの各部位のパケット転送の有無を判定し、障害発生ルータの障害箇所を特定する。そして、制御システム7は保守運用システム4にルータのIPアドレス及び障害箇所を含む障害部位通知を行う。
【0117】
この結果、保守運用システム4においては、制御システム7からのこの障害部位通知に基づいて、特定ルータがパケット転送不可能であることを認識可能である。
【0118】
この通信システム1Aのように、通過判定部及びパステーブルを含む制御システム7が集中配置の制御部としてネットワークレベルにある場合は、通信システム1に比較して、次のメリットがある。
【0119】
(1)既存ルータへの変更を抑制しながら、通信システムにサイレント障害自律検出機能を適用することが可能である。
【0120】
(2)ルータが中継する伝送対象パケットのトラフィック量の増大などに起因して、ルータが管理するパステーブルのサイズが増大した場合に、ルータ内部のメモリ増設が必要になる。この場合、IPネットワークに存在する各ルータへの変更を抑制し、外部の制御システムの新設によって対応することが可能である。
【0121】
[その他の変形例]
上述した一実施の形態及び変形例においては、識別子付与部がパス識別子を伝送対象パケットに付加し、各パケット監視部が抽出したパス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知することにより、通過判定部はパステーブルに記録したパケットの通過状況に応じて、装置内の障害箇所を検出しているが、識別子付与部を有しない中継装置においても障害箇所の特定が可能である。この場合、各パケット監視部では、パケット通過という事象のみをパステーブルに記録するように通知する。そして、通過判定部では、伝送対象パケットの通過ルート単位での通過判定は行わず、全ての通過ルートをまとめて通過判定を行う。これにより、通過ルート単位での障害箇所の特定はできないが、装置内の障害箇所の特定自体は可能である。また、パケット通過という事象を通過判定部に通知するパケット監視部を宛先アドレス抽出部の前段に物理的または論理的に配置する構成を上述した一実施の形態またはこのその他変形例と併用することにより、宛先アドレス抽出部の障害も検出できる等、より幅広い範囲での障害箇所特定が可能である。
【0122】
上述した一実施の形態及び変形例における処理はコンピュータで実行可能なプログラムとして提供され、CD−ROMやフレキシブルディスクなどの記録媒体、さらには通信回線を経て提供可能である。
【0123】
また、上述した一実施の形態及び変形例における各処理はその任意の複数または全てを選択し組合せて実施することもできる。
【0124】
[その他]
上述した一実施の形態及び変形例に関し、更に以下の付記を開示する。
【0125】
(付記1)
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;
前記複数の監視手段から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段と;
を備える中継装置。
【0126】
(付記2)
前記付加手段は、前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加し、
前記パス識別子は、装置内の各監視箇所に存在する前記監視手段が前記伝送対象パケットを通過ルート単位で監視するか、通過ルート毎にパケット単位で監視するかを示す情報を含む
付記1記載の中継装置。
【0127】
(付記3)
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
付記1または2記載の中継装置。
【0128】
(付記4)
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す情報に加え、同一通過ルートを通る断片化パケットを示すための順序番号であるパケット番号を含む前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
付記1または2記載の中継装置。
【0129】
(付記5)
前記判定手段は、予め定めた時間内に、前記パステーブルに前記装置内の全ての監視箇所の前記通過状況が記録されないときは、異常発生と判定する
付記1記載の中継装置。
【0130】
(付記6)
前記複数の監視手段による前記装置内の監視箇所は、複数の入力インターフェース部、複数の出力インターフェース部、及び前記複数の入力インターフェース部と前記複数の出力インターフェース部とを相互接続するスイッチ部を含む
付記1記載の中継装置。
【0131】
(付記7)
前記付加手段は、ルーティング情報を含む制御パケットを発信するときは、前記装置内の通過ルートとして、前記入力インターフェース番号に代替して制御パケット発信を示す情報と前記出力インターフェース番号とを示す前記パス識別子を前記伝送対象パケットに付加する
付記3または4記載の中継装置。
【0132】
(付記8)
前記付加手段は、ルーティング情報を含む制御パケットが着信したときは、前記装置内の通過ルートとして、前記入力インターフェース番号と、前記出力インターフェース番号に代替して制御パケット着信を示す情報とを示す前記パス識別子を前記伝送対象パケットに付加する
付記1記載の中継装置。
【0133】
(付記9)
前記判定手段及び前記パステーブルが、個別配置の制御部またはネットワークレベルの集中配置の制御部に設けられている
付記1記載の中継装置。
【0134】
(付記10)
前記判定手段は、検出した装置内の障害箇所を保守運用システムに通知する
付記1記載の中継装置。
【0135】
(付記11)
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加し;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報を複数の監視箇所からそれぞれ通知し;
前記複数の監視箇所から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する;
ことを中継装置が処理するサイレント障害自律検出方法。
【符号の説明】
【0136】
1 通信システム
1B 通信システム
2 IPネットワーク
4 保守運用システム
5 通信端末装置
6 通信端末装置
7 制御システム
R11 ルータ
R12 ルータ
R13 ルータ
R14 ルータ
R11A ルータ
R12A ルータ
R13A ルータ
R14A ルータ
【特許請求の範囲】
【請求項1】
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;
前記複数の監視手段から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段と;
を備える中継装置。
【請求項2】
前記付加手段は、前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加し、
前記パス識別子は、装置内の各監視箇所に存在する前記監視手段が前記伝送対象パケットを通過ルート単位で監視するか、通過ルート毎にパケット単位で監視するかを示す情報を含む
請求項1記載の中継装置。
【請求項3】
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
請求項1または2記載の中継装置。
【請求項4】
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す情報に加え、同一通過ルートを通る断片化パケットを示すための順序番号であるパケット番号を含む前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
請求項1または2記載の中継装置。
【請求項5】
前記判定手段は、予め定めた時間内に、前記パステーブルに前記装置内の全ての監視箇所の前記通過状況が記録されないときは、異常発生と判定する
請求項1記載の中継装置。
【請求項6】
前記監視手段は、自装置発または自装置宛の前記伝送対象パケットに含まれる前記パス識別子に基づき、前記判定手段に前記通過情報を通知する
請求項1記載の中継装置。
【請求項7】
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加し;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報を複数の監視箇所からそれぞれ通知し;
前記複数の監視箇所から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する;
ことを中継装置が処理するサイレント障害自律検出方法。
【請求項1】
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加する付加手段と;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報をそれぞれ通知する複数の監視手段と;
前記複数の監視手段から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する判定手段と;
を備える中継装置。
【請求項2】
前記付加手段は、前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加し、
前記パス識別子は、装置内の各監視箇所に存在する前記監視手段が前記伝送対象パケットを通過ルート単位で監視するか、通過ルート毎にパケット単位で監視するかを示す情報を含む
請求項1記載の中継装置。
【請求項3】
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
請求項1または2記載の中継装置。
【請求項4】
前記付加手段は、前記装置内の通過ルートとして、入力インターフェース番号と出力インターフェース番号との組を示す情報に加え、同一通過ルートを通る断片化パケットを示すための順序番号であるパケット番号を含む前記パス識別子を前記伝送対象パケットに装置内ヘッダとして付加する
請求項1または2記載の中継装置。
【請求項5】
前記判定手段は、予め定めた時間内に、前記パステーブルに前記装置内の全ての監視箇所の前記通過状況が記録されないときは、異常発生と判定する
請求項1記載の中継装置。
【請求項6】
前記監視手段は、自装置発または自装置宛の前記伝送対象パケットに含まれる前記パス識別子に基づき、前記判定手段に前記通過情報を通知する
請求項1記載の中継装置。
【請求項7】
装置内の通過ルートを一意に示すパス識別子を伝送対象パケットに付加し;
通過する前記パケットから前記パス識別子を抽出したとき、抽出した前記パス識別子と装置内の監視箇所を示す情報とを含む通過情報を複数の監視箇所からそれぞれ通知し;
前記複数の監視箇所から通知される前記通過情報に基づいて、前記パケットの通過状況をパステーブルに記録し、前記パステーブルに記録した前記通過状況に応じて、装置内の障害箇所を検出する;
ことを中継装置が処理するサイレント障害自律検出方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2013−90218(P2013−90218A)
【公開日】平成25年5月13日(2013.5.13)
【国際特許分類】
【出願番号】特願2011−230123(P2011−230123)
【出願日】平成23年10月19日(2011.10.19)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成25年5月13日(2013.5.13)
【国際特許分類】
【出願日】平成23年10月19日(2011.10.19)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]