リンクダウン保護機能を有する伝送装置及びリンクダウン検出方法
【課題】リンクダウン保護機能を有する伝送装置及びリンクダウン検出方法に関し、リンクダウン保護機能の設定を有効にした場合、サイレント障害を検出可能にし、また、サイレント障害に対する警報通知及び系切り替えを可能にする。
【解決手段】リンクダウン保護部31は、保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えるリンクダウンの検出時にリンクダウン警報を発出する。障害判定部34は、保護時間以内の短時間のリンクダウンの発生回数をカウントし、該短時間のリンクダウンの発生回数が閾値以上の場合に警報を出力する。論理和演算部35は、リンクダウン保護部31から発出される警報と、障害判定部34から出力される警報の論理和を演算し、警報通知部32は、該論理和演算結果の警報情報に基づいて警報を通知し、切替え通知部33は、該警報情報に基づいて、運用系を待機系に切り替える通知を発する。
【解決手段】リンクダウン保護部31は、保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えるリンクダウンの検出時にリンクダウン警報を発出する。障害判定部34は、保護時間以内の短時間のリンクダウンの発生回数をカウントし、該短時間のリンクダウンの発生回数が閾値以上の場合に警報を出力する。論理和演算部35は、リンクダウン保護部31から発出される警報と、障害判定部34から出力される警報の論理和を演算し、警報通知部32は、該論理和演算結果の警報情報に基づいて警報を通知し、切替え通知部33は、該警報情報に基づいて、運用系を待機系に切り替える通知を発する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、リンクダウン保護機能を有する伝送装置及びリンクダウン検出方法に関する。本発明は、リンクダウン保護機能を有する冗長構成のイーサネット(登録商標)伝送装置等の伝送装置におけるサイレント障害検出や待機系への切り替えに適用される。
【0002】
ネットワークの信頼性を高めるために、伝送装置間の主信号回線を物理的に冗長構成とすることが一般に行われる。図6に主信号回線の冗長系切り替えの例を示す。図6の(a)は回線障害発生前の状態を示し、図6の(b)は回線障害発生後の状態を示している。なお図6は、リンクダウン保護機能の無い伝送装置のネットワーク構成例を示している。
【0003】
図6に示すように、ルーター等の上位伝送装置6−1とイーサネット(登録商標)伝送装置等の下位伝送装置6−2との間の主信号回線は、伝送装置A,B,C,Dを経由して形成され、リンクアグリゲーション(LAG)やリンクプロテクション(LP)等の冗長構成が採られる。
【0004】
図6は、上位伝送装置6−1と伝送装置A,Cとの間の回線はリンクアグリゲーション(LAG)の冗長構成、伝送装置Aと伝送装置Bとの間の回線及び伝送装置Cと伝送装置Dとの間の回線はリンクプロテクション(LP)の冗長構成、伝送装置B,Dと下位伝送装置6−2との間の回線は、リンクアグリゲーション(LAG)の冗長構成が採られている構成例を示している。なお図6において、太線で運用系回線を示し、細線で待機系回線を示している。
【0005】
このようなネットワーク構成例において、例えば、伝送装置A,B間の回線に障害が発生すると、伝送装置Aと伝送装置Bとは、運用系回線の切り替えを行う。この伝送装置A,B間の回線切り替えにより、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線に瞬断が発生し、下位伝送装置6−2は、回線障害と判断して、伝送装置Bとの運用系の回線を、伝送装置Dとの待機系の回線に切り替える。
【0006】
この切り替えにより、図6(b)に示すように、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線は、伝送装置C,Dを経由した回線に切り替わる。本来、伝送装置A,B間の回線のみの障害であるので、伝送装置Aと伝送装置Bとでのみ回線切り替えを行えばよく、下位伝送装置6−2としては、伝送装置A,B間の回線切り替えに伴う瞬断が発生しても、回線切り替えを実施しないよう構成することが望ましい。
【0007】
下位伝送装置6−2で待機系の回線への切り替えが行われると、ネットワーク全体に亘って主信号回線が待機系へ切り替わり、一時的に主信号の再送等による輻輳や不要なユーザーデータのループ伝送等が起こり得る。そのため、上位側の伝送装置の間の冗長回線の切り替えによって、下位側の伝送装置での冗長切り替えを発生させない機能を備える構成が望ましい。
【0008】
この機能を実現するために、イーサネット(登録商標)伝送装置等の下位伝送装置6−2に、リンクダウン保護機能と称される機能を設けている。このリンクダウン保護機能は、上位側の伝送装置での待機系回線への切り替わりによってリンクダウン警報が発生しても、該リンクダウン警報をマスクする機能である。
【0009】
図7にリンクダウン保護機能を具備した場合の冗長系切り替えの例を示す。図7の(a)は回線障害発生前の状態を示し、図7の(b)は回線障害発生後の状態を示している。このネットワーク構成例において、例えば伝送装置A,B間の回線に障害が発生すると、伝送装置Aと伝送装置Bとは、待機系回線への切り替えを行う。
【0010】
この伝送装置A,B間の回線切り替えにより、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線に瞬断が発生するが、下位伝送装置6−2は、所定の保護時間以内のリンクダウンに対しては回線障害と判断することなく、伝送装置Bとの運用系回線の接続を維持し、伝送装置Dとの待機系回線への回線切り替えを行わない。従って、図7(b)に示すように、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線は、伝送装置A,Bを経由する回線に維持され、伝送装置A,B間でのみ回線切り替えが行われる。
【0011】
図8に本発明が適用される伝送装置のシステム構成例を示す。図8において、8−1はイーサネット(登録商標)スイッチ装置等の下位伝送装置である。下位伝送装置8−1内には、監視制御カード8−11及び複数のインタフェースカード(#1〜#N)8−12を備える。インタフェースカード(#1〜#N)8−12は、ポート#1〜#Mを具備する。
【0012】
インタフェースカード(#1〜#N)8−12のポート#1〜#Mは、主信号回線を収容し、該主信号回線は、上位側の伝送装置8−2と接続される。該主信号回線は、リンクアグリゲーション(LAG)等の冗長構成化が行われる。また、監視制御カード8−11は、各インタフェースカード(#1〜#N)8−12を監視・制御し、監視制御端末8−3と監視制御信号を送受する。本発明は、リンクダウン保護機能を備えたイーサネット(登録商標)スイッチ装置等の下位伝送装置8−1に係る。
【背景技術】
【0013】
従来のリンクダウン保護機能を備えた伝送装置について説明する。図9に従来の伝送装置の構成例を示す。図9において、1は主信号の物理レイヤを終端する物理レイヤ部、2は主信号の入力フレームエラー検出等を行う主信号処理部、3は警報処理部、31はリンクダウン保護部、32は警報通知部、33は切替え通知部、4は割込み通知部である。
【0014】
従来のリンクダウン保護機能を備えた伝送装置の動作フローを図10に示す。図10を参照して、従来のリンクダウン保護機能を備えた伝送装置の動作を説明する。物理レイヤ部1での主信号回線のリンクダウン検出信号が警報処理部3に入力され、リンクダウン発生を検出すると(10−1)、警報処理部3では、リンクダウン保護の設定の有無をチェックし(10−2)、リンクダウン保護の設定が行われている場合、リンクダウン保護タイマの動作を開始させる(10−3)。
【0015】
リンクダウン保護タイマを開始させた後、リンクダウン警報をマスクし(10−4)、リンクダウン保護時間のタイマが終了したか否かを判定する(10−5)。リンクダウン保護時間のタイマが終了していない場合は、上述の処理フロー10−4に戻って同様の処理を繰り返す。リンクダウン保護時間のタイマが終了した場合は、リンクダウンが回復したか否かを判定する(10−6)。
【0016】
リンクダウンが回復した場合は、リンクダウン警報無しとして処理する(10−7)。リンクダウンが回復していない場合は、リンクダウン警報を発出する(10−8)。リンクダウン警報の発出後、該リンクダウン警報の重要度を判定するため、リンクダウン警報の継続時間を判定する周期処理を行う(10−9)。
【0017】
リンクダウン保護機能を備えた伝送装置では、リンクダウンが発生しても、所定の保護時間以内にリンクダウンが回復した場合には、警報発生・回線切り替えの要因と見なさない。保護時間を超えて継続するリンクダウンを検出した場合、リンクダウンの警報を発生すべき状態と見なし、また、待機系回線への切り替え要因の発生と見なして待機系回線への切り替えを実施する。
【0018】
図11及び図12に従来のリンクダウン保護動作例のタイムチャートを示す。同図の(a)は実際のリンクダウンの検出出力(検出時ハイレベル)を示し、(b)はリンクダウン保護後の警報出力(警報発出時ハイレベル)を示し、(c)は周期T秒の判定処理を示し、(d)は警報通知の出力を示し、(e)は切り替えトリガの発生出力を示している。
【0019】
(a)に示す実際のリンクダウンの検出に対して、所定の保護時間τを超過して継続するリンクダウンを検出した場合、(b)に示すように保護後の警報として発出する。従って、第1のリンクダウン9−1は、保護時間τ以内に回復しているためマスクされて検出されず、第2のリンクダウン9−2は、保護時間τを超えて継続したため、保護後の警報発出9−4として出力され、第3のリンクダウン9−3は、保護時間τを超えて継続したため、保護後の警報発出9−5として出力される。
【0020】
警報の通知は、保護後の警報発出に対して所定の周期で継続時間を判定して行う。警報には、周期T秒以上警報が継続した場合に発出する重要警報(Major)と、周期T秒以内に警報が回復した場合に発出する警告警報(Warning)とがある。この感知重要度(重要警報/警告警報)の区別は、保護後の警報発出に対して、周期T秒毎の状態を判定して行う。
【0021】
図11に示す保護後の警報発出9−4は、時刻T4,T5間で立ち上がり、時刻T5の時点でローレベルに復旧し、継続時間が周期T以下であるため、警告警報(Warning)と判定する。また、保護後の警報発出9−5は、時刻T7,T8間で立ち上がり、時刻T8ではハイレベルを継続しているため、重要警報(Major)と判定する。
【0022】
従って、保護時間τが監視周期Tの2倍(τ=2T)の場合、第2のリンクダウン9−2のように、実際のリンクダウンの継続時間が2T+T/2であっても、重要警報(Major)と判定されず、警告警報(Warning)と判定される場合がある。保護時間τを超えて発生したリンクダウン9−2,9−3に対し出力される保護後の警報発出9−4,9−5により、(e)に示すように切り替えトリガが発生する。
【0023】
しかし、図12に示すように、リンクダウンの発生・回復が保護時間τ以内の短時間で繰り返し発生する場合は、保護時間τ以上に亘ってその状態が継続していても、該リンクダウンの検出はマスクされ、警報発出・切り替え要因として扱われず、実際の運用で支障を来たすこととなる。
【0024】
即ち、図12の(a)に示すように、保護時間τ以内のリンクダウンが断続的に発生し、該断続的なリンクダウンが保護時間τ以上に亘って発生しても、保護時間τを超える継続的なリンクダウンとしては検出されないため、(b)に示すように、保護後の警報は発出されない。従って、(d)及び(e)に示すように警報通知及び切り替えトリガは発生しない。
【0025】
このような短持間のリンクダウンを検出するためには、監視周期を短縮して分解能を高くすればよいが、ソフトウェア制御により多数のポートに対して短周期で監視を行う場合、ソフトウェア処理の負担が増大し、高速の処理装置を用いなければならず、実現が困難となる。
【0026】
このように、回線の障害形態や伝送装置の故障モードによっては、保護時間以内のリンクダウンが検出されないため、回線の障害や装置の故障等を検出することができず、そのために待機系に切り替わらない場合がある。待機系への自動的な切り替えが行われず、また、伝送装置で障害を検出することができないため、警報の発出もなく、異常動作が生じていることを保守者等に通知することができない、所謂サイレント障害が発生する。
【0027】
サイレント障害等に関しては、例えば下記の特許文献1等に記載されている。また、リンクダウン等の保護機能等については、例えば、下記の特許文献2,3等に記載されている。
【先行技術文献】
【特許文献】
【0028】
【特許文献1】特開2006−229477号公報、段落0005等
【特許文献2】特開2004−320683号公報、請求項3等
【特許文献3】特開2005−33665号公報、請求項2等
【発明の概要】
【発明が解決しようとする課題】
【0029】
サイレント障害が発生している状態では、主信号回線で伝送エラーを起こしているが、警報が発出されないため、待機系回線に切り替わらず、ユーザー通信に影響を与える。このようなサイレント障害が発生すると、待機系回線への切替え契機は、該障害回線を使用するユーザーからの苦情を待つしかなく、該苦情に対しても警報の発出がないため、障害要因の特定化が困難で、サービスの中断が長期化し、問題となる。
【0030】
また、待機系の伝送装置でリンクダウン保護機能を有効にしている場合、冗長構成の形態にもよるが、例えば、リンクアグリゲーション(LAG)のように、待機系の伝送装置でもユーザーデータを受信する冗長構成の形態の場合、リンクダウンの発生・回復が繰り返し発生しても、運用系の伝送装置と同様に、待機系の伝送装置で該リンクダウンが検出されず、系切り替えが行われた後に、ユーザーデータに影響を与えることとなる。
【0031】
また、待機系の伝送装置ではユーザーデータを受信せず、系切り替えが行われた後にユーザーデータの受信を開始する1+1冗長構成等の形態の場合は、待機系の伝送装置でリンクダウン保護機能を有効にしている場合、リンクダウン等の回線異常があったとしても、警報発出がマスクされ、恰も正常状態のように認識される。
【0032】
そのため、運用系の伝送装置で何らかの回線障害が検出され、待機系の伝送装置に切り替わった際に、リンクダウン保護機能により正常にリンクアップしている状態と見なされ、ユーザーデータの廃棄が発生して初めて異常が顕在化するサイレント障害となる。何れの冗長構成であっても、待機系の伝送装置でリンクダウン保護を有効にした場合は、待機系の伝送装置のサイレント障害に対する正常性の確認ができないという問題がある。
【0033】
上述の問題を防ぐには、待機系の伝送装置ではリンクダウン保護機能を無効にすればよいが、運用系から待機系に、また待機系から運用系に切り替わる度に、リンクダウン保護機能の有効化/無効化を監視制御端末8−3により再設定しなければならず、保守運用者側の作業負担が発生する。伝送装置としては、運用系及び待機系共に、リンクダウン保護機能の有効化/無効化は、同一設定であることが望ましい。
【0034】
本発明は、リンクダウン保護機能の設定を有効にした場合、サイレント障害を検出可能にし、また、サイレント障害に対する警報通知及び系切り替えを可能にすることを目的とする。
【課題を解決するための手段】
【0035】
本発明のリンクダウン保護機能を有する伝送装置は、所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したときリンクダウン警報を発出するリンクダウン保護部を備えた伝送装置において、前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定部と、前記リンクダウン保護部から発出されるリンクダウン警報と、前記障害判定部から出力される短時間のリンクダウンの発生の警報との論理和を演算する論理和演算部と、前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて警報を通知する警報通知部と、前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて、運用系を待機系に切り替える通知を発する切替え通知部と、を備えたものである。
【0036】
また、本発明のリンクダウン検出方法は、所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したとき、リンクダウン警報を発出するリンクダウン保護ステップを有する伝送装置のリンクダウン検出方法において、前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定ステップと、前記リンクダウン保護ステップにより発出されるリンクダウン警報と、前記障害判定ステップで出力される短時間のリンクダウンの発生の警報との論理和を警報情報として出力するステップと、を含むものである。
【発明の効果】
【0037】
本発明によれば、リンクダウン保護機能を有効にした場合、保護時間以内の短時間のリンクダウンが検出され、サイレント障害の検出が可能となる。これにより、従来のようにユーザーデータの廃棄によるユーザーからの苦情を待つことなく、サイレント障害の警報を発出することができ、障害要因の特定化が容易となり、サービス復旧時間の短縮化を図ることが可能となる。
【図面の簡単な説明】
【0038】
【図1】本発明の伝送装置のリンクダウン検出の処理フローを示す図である。
【図2】本発明の伝送装置の第1の実施例の構成例を示す図である。
【図3】本発明の伝送装置の第2の実施例の構成例を示す図である。
【図4】本発明の伝送装置の第3の実施例の構成例を示す図である。
【図5】本発明の実施例の待機系での適用例を示す図である。
【図6】主信号回線の冗長系切り替えの例を示す図である。
【図7】リンクダウン保護機能を具備した場合の冗長系切り替えの例を示す図である。
【図8】伝送装置のシステム構成例を示す図である。
【図9】従来の伝送装置の構成例を示す図である。
【図10】従来のリンクダウン保護機能を備えた伝送装置の動作フローを示す図である。
【図11】従来のリンクダウン保護動作例のタイムチャートである。
【図12】従来のリンクダウン保護動作例のタイムチャートである。
【発明を実施するための形態】
【0039】
図1に本発明の伝送装置のリンクダウン検出の処理フローを示す。本発明の伝送装置では、リンクダウン発生を検出すると(1−1)、リンクダウン保護機能が設定されているか否かをチェックし(1−2)、リンクダウン保護機能が設定されている場合、リンクダウン保護時間のタイマの動作を開始させる(1−3)。
【0040】
次に、リンクダウンが発生・回復常態か、更には入力フレームエラーが検出されたかを判定する(1−4)。リンクダウンが発生・回復状態であり、更には入力フレームエラー検出された場合、リンクダウン警報を発出する(1−8)。リンクダウンが発生・回復状態ではなく、又は入力フレームエラー検出されない場合は、リンクダウン保護時間のタイマが終了したか否かを判定する(1−5)。
【0041】
リンクダウン保護時間のタイマが終了していない場合は、上述の処理フロー1−4に戻って同様の処理を繰り返す。リンクダウン保護時間のタイマが終了した場合は、リンクダウンが回復したか否かを判定する(1−6)。リンクダウンが回復した場合は、リンクダウン警報無しとして処理する(1−7)。リンクダウンが回復していない場合は、リンクダウン警報を発出する(1−8)。リンクダウン警報の発出後、該リンクダウン警報の重要度を判定するため、リンクダウン警報の継続時間を判定する周期処理を行う(1−9)。
【0042】
図2に本発明の伝送装置の第1の実施例の構成例を示す。同図において、1は主信号の物理レイヤを終端する物理レイヤ部、2は主信号の入力フレームエラー検出等を行う主信号処理部、3は警報処理部、31はリンクダウン保護部、32は警報通知部、33は切替え通知部、34は障害判定部、35は論理和演算部、4は割込み通知部である。物理レイヤ部1、主信号処理部2及び警報処理部3は、インタフェースカード単位に備える。
【0043】
障害判定部34は、ソフトウェア制御による警報収集周期(例えば1秒)より短い周期(例えば1m秒)で、ハードウェア制御によりリンクダウンの監視を行い、保護時間以内に実際に発生しているリンクダウンの発生回数をカウントする機能を有し、ソフトウェア制御の周期で監視制御可能なレジスタを備える。
【0044】
主信号処理部2は、対向する伝送装置から入力される主信号のイーサネット(登録商標)フレーム(ユーザーデータ)に対して正常性のチェックを行い、該入力フレームのエラーフレーム数をカウントし、エラーフレーム数を障害判定部34に通知する。リンクダウン保護部31は、従来と同様に、リンクダウン保護時間を超えるリンクダウンを検出し、その検出出力を送出する。
【0045】
リンクダウンの発生・回復がリンクダウン保護時間以内の短時間で繰り返し発生するリンクダウンに対して、障害判定部34により以下の処理を行い、サイレント障害を検出する。
(1)障害判定部34において、物理レイヤ部1の出力信号を監視し、リンクダウン保護時間以内の実際に発生した短時間のリンクダウンの発生回数をカウントし、ソフトウェア制御の周期で監視可能なレジスタに、該短時間リンクダウンの発生回数を格納する。なお、リンクダウン保護時間の設定値は、リンクダウン保護部31から通知障害判定部34に通知する。
【0046】
(2)障害判定部34では、ソフトウェア制御により、リンクダウン保護時間以内の実際に発生した短時間リンクダウンの発生回数をレジスタから読出して収集する。
【0047】
(3)短時間リンクダウンの発生回数が、所定の閾値X以上発生したことを検出した場合、又は、短時間リンクダウンの発生回数が、該閾値X以上発生したことが所定の閾値Y以上の保護期間に亘って連続して発生したことを検出した場合、短時間リンクダウンが発生したと判定し、該判定結果を論理和演算部35に出力する。該閾値X及びYは、ネットワークシステムに応じて予め設定しておく。
【0048】
(4)論理和演算部35は、障害判定部34から送出される短時間リンクダウン発生の判定結果の出力と、リンクダウン保護部31から送出されるリンクダウン検出出力との論理和による警報情報を、障害警報通知部32及び切替え通知部33に送出する。
【0049】
障害警報通知部32は、警報情報を受けると警報の発出を行う。切替え通知部33は、該警報情報を受けると、割込み通知部4に待機系への切り替えを通知する。なお、切替え通知部33は、警報情報を検出した回線が運用系である場合に、待機系への切替え通知を行う。警報情報を検出した回線が待機系の場合は、障害警報通知部32による警報の発出のみを行う。割込み通知部4は、M個の各ポートから送出される切り替えの通知信号の論理和を演算し、該論理和出力を、図示省略の監視制御カードへインタフェースカード単位で通知する。
【0050】
図3に本発明の伝送装置の第2の実施例の構成例を示す。図3において、図2の構成要素と同一の構成要素には同一の符号を付し、重複した説明は省略する。リンクダウンの発生・回復がリンクダウン保護時間以内の短時間で繰り返し発生するリンクダウンに対して、障害判定部34により以下の処理を行い、サイレント障害を検出する。
【0051】
(1)障害判定部34において、物理レイヤ部1の出力信号を監視し、リンクダウン保護時間以内の実際に発生した短時間リンクダウンの発生回数をカウントし、ソフトウェア制御の周期監視可能なレジスタに、該短時間リンクダウンの発生回数を格納する。なお、リンクダウン保護時間の設定値は、リンクダウン保護部31から通知障害判定部34に通知する。
【0052】
(2)リンクダウンの発生・回復が短持間で繰り返すとき、それに伴って入力フレームエラーが発生する。主信号処理部2は、入力フレームエラー数をカウントし、該入力フレームエラー数を障害判定部34に通知する。
【0053】
(3)障害判定部34では、入力フレームエラー数と短時間リンクダウン発生回数とを基に、障害の判定を行う。リンクダウンの発生・回復が短時間で繰り返すとき、ユーザーデータの流量にもよるが、支障をきたすのは、ユーザーデータが廃棄される入力フレームエラー数(FCSエラー等)が多い場合であり、短時間リンクダウン発生回数<入力フレームエラー数の場合である。従って、リンクダウン保護時間以内で、短時間リンクダウン発生回数<入力フレームエラー数の関係となる障害発生回数をレジスタに格納し、これを基に障害の判定を行う。
【0054】
(4)この障害発生回数が監視周期以内に閾値Z以上となることが、閾値W以上の複数の保護期間に亘って複数回して発生したことを検出した場合、保護時間内リンクダウンが発生した判定し、該判定結果を論理和演算部35に出力する。上記閾値Z及びWは、ネットワークシステムに応じて予め設定しておく。
【0055】
(5)論理和演算部35は、障害判定部34から送出される判定結果の出力と、リンクダウン保護部31から送出されるリンクダウン検出出力との論理和による警報情報を、障害警報通知部32及び切替え通知部33に通知する。以下は、第1の実施例と同様である。
【0056】
図4は本発明の伝送装置の第3の実施例の構成例を示す。図4において、図2及び図3の構成要素と同一の構成要素には同一の符号を付し、重複した説明は省略する。イーサネット(登録商標)伝送装置等の伝送装置では、リンク上の信号の喪失を検出し、信号喪失(LOS)警報として出力する。信号喪失(LOS)警報が発生する場合は、通常、リンクダウンも発生するので、この第3の実施例では信号喪失(LOS)警報を基にリンクダウンを検出する。
【0057】
リンクダウンの発生・回復がリンクダウン保護時間以内の短時間で繰り返し発生するリンクダウンに対して、障害判定部34により以下の処理を行い、サイレント障害を検出し、ハードウェア制御による自律動作で冗長系への切り替えを行う。
【0058】
(1)障害判定部34において、物理レイヤ部1の出力信号を監視し、リンクダウン保護時間以内の実際に発生した短時間リンクダウンの発生回数をカウントし、ソフトウェア制御の周期監視可能なレジスタに、該短時間リンクダウンの発生回数を格納する。なお、リンクダウン保護時間の設定値は、リンクダウン保護部31から通知障害判定部34に通知する。
【0059】
また、主信号が入力される光モジュール(SFP:Small Form-Factor Pluggable)5の出力信号の喪失(LOS)を検出し、リンクダウン保護時間以内の実際に発生した信号喪失(LOS)数をカウントし、ソフトウェア制御の周期監視可能なレジスタに、該信号喪失(LOS)数を格納する。
【0060】
(2)リンクダウンの発生・回復が短持間で繰り返すとき、それに伴って入力フレームエラーが発生する。主信号処理部2は、入力フレームエラー数をカウントし、該入力フレームエラー数を障害判定部34に通知する。
【0061】
(3)障害判定部34では、入力フレームエラー数と短時間リンクダウン発生回数又は信号喪失警報(LOS)数とを基に、障害の判定を行う。リンクダウンの発生・回復が短時間で繰り返すとき、ユーザーデータの流量にもよるが、支障をきたすのは、ユーザーデータが廃棄される入力フレームエラー数(FCSエラー等)が多い場合であり、短時間リンクダウン発生回数<入力フレームエラー数、又は信号喪失警報(LOS)数<入力フレームエラー数の場合である。
【0062】
また、リンクダウン保護機能を有効に設定している場合、サイレント障害を厳格に検出するには、保護時間内の短時間リンクダウン発生回数は1回であるが、障害判定とする短時間リンクダウン発生回数を、システムに応じて予め定めた閾値Xを超えた場合とすることもできる。即ち、障害判定部34は、X<短時間リンクダウン発生回数<入力フレームエラー数、又はX<信号喪失警報(LOS)数<入力フレームエラー数となる障害発生回数が、所定の閾値を超えたか否かをハードウェアの制御により判定し、該判定結果を論理和演算部35に出力する。
【0063】
(4)論理和演算部35は、障害判定部34から送出される判定結果の出力と、リンクダウン保護部31から送出されるリンクダウン検出出力との論理和による警報情報を、障害警報通知部32及び切替え通知部33に通知する。以下は、第1の実施例と同様である。
【0064】
図5に本発明の実施例の待機系での適用例を示す。システムにおける冗長構成の形態により、以下の動作を行う。ユーザーデータを待機系のインタフェースカードで受信する冗長構成(リンクアグリゲーション)の場合には、第2又は第3の実施例のように、短時間リンクダウン発生回数<入力フレームエラー数の関係となる障害発生回数、又は、この関係若しくはX<信号喪失警報(LOS)数<入力フレームエラー数の関係となる障害発生回数を基に障害判定を行い、待機系のインタフェースカードでユーザーデータを受信しない冗長構成(1対1冗長構成)の場合には、第1の実施例のように、保護時間内の短時間リンクダウン発生回数を基に障害判定を行う。
【0065】
こうすることにより、冗長構成の形態によらず、待機系において、従来サイレント障害となっていたリンクダウン障害を検出することが可能となる。従って、待機系でリンクダウン保護機能が有効に設定されている場合でも、従来のサイレント障害に対して、冗長構成の形態によらず、正常性の確認を行うことが可能となる。これにより、従来ユーザーデータの廃棄に伴う苦情によって顕在化する障害に対して、事前に該障害を検出することが可能となり、ユーザー回線のサービスの中断を低減することが可能となる。
【符号の説明】
【0066】
1 物理レイヤ部
2 主信号処理部
3 警報処理部
31 リンクダウン保護部
32 警報通知部
33 切替え通知部
34 障害判定部
35 論理和演算部
4 割込み通知部
5 光モジュール
【技術分野】
【0001】
本発明は、リンクダウン保護機能を有する伝送装置及びリンクダウン検出方法に関する。本発明は、リンクダウン保護機能を有する冗長構成のイーサネット(登録商標)伝送装置等の伝送装置におけるサイレント障害検出や待機系への切り替えに適用される。
【0002】
ネットワークの信頼性を高めるために、伝送装置間の主信号回線を物理的に冗長構成とすることが一般に行われる。図6に主信号回線の冗長系切り替えの例を示す。図6の(a)は回線障害発生前の状態を示し、図6の(b)は回線障害発生後の状態を示している。なお図6は、リンクダウン保護機能の無い伝送装置のネットワーク構成例を示している。
【0003】
図6に示すように、ルーター等の上位伝送装置6−1とイーサネット(登録商標)伝送装置等の下位伝送装置6−2との間の主信号回線は、伝送装置A,B,C,Dを経由して形成され、リンクアグリゲーション(LAG)やリンクプロテクション(LP)等の冗長構成が採られる。
【0004】
図6は、上位伝送装置6−1と伝送装置A,Cとの間の回線はリンクアグリゲーション(LAG)の冗長構成、伝送装置Aと伝送装置Bとの間の回線及び伝送装置Cと伝送装置Dとの間の回線はリンクプロテクション(LP)の冗長構成、伝送装置B,Dと下位伝送装置6−2との間の回線は、リンクアグリゲーション(LAG)の冗長構成が採られている構成例を示している。なお図6において、太線で運用系回線を示し、細線で待機系回線を示している。
【0005】
このようなネットワーク構成例において、例えば、伝送装置A,B間の回線に障害が発生すると、伝送装置Aと伝送装置Bとは、運用系回線の切り替えを行う。この伝送装置A,B間の回線切り替えにより、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線に瞬断が発生し、下位伝送装置6−2は、回線障害と判断して、伝送装置Bとの運用系の回線を、伝送装置Dとの待機系の回線に切り替える。
【0006】
この切り替えにより、図6(b)に示すように、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線は、伝送装置C,Dを経由した回線に切り替わる。本来、伝送装置A,B間の回線のみの障害であるので、伝送装置Aと伝送装置Bとでのみ回線切り替えを行えばよく、下位伝送装置6−2としては、伝送装置A,B間の回線切り替えに伴う瞬断が発生しても、回線切り替えを実施しないよう構成することが望ましい。
【0007】
下位伝送装置6−2で待機系の回線への切り替えが行われると、ネットワーク全体に亘って主信号回線が待機系へ切り替わり、一時的に主信号の再送等による輻輳や不要なユーザーデータのループ伝送等が起こり得る。そのため、上位側の伝送装置の間の冗長回線の切り替えによって、下位側の伝送装置での冗長切り替えを発生させない機能を備える構成が望ましい。
【0008】
この機能を実現するために、イーサネット(登録商標)伝送装置等の下位伝送装置6−2に、リンクダウン保護機能と称される機能を設けている。このリンクダウン保護機能は、上位側の伝送装置での待機系回線への切り替わりによってリンクダウン警報が発生しても、該リンクダウン警報をマスクする機能である。
【0009】
図7にリンクダウン保護機能を具備した場合の冗長系切り替えの例を示す。図7の(a)は回線障害発生前の状態を示し、図7の(b)は回線障害発生後の状態を示している。このネットワーク構成例において、例えば伝送装置A,B間の回線に障害が発生すると、伝送装置Aと伝送装置Bとは、待機系回線への切り替えを行う。
【0010】
この伝送装置A,B間の回線切り替えにより、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線に瞬断が発生するが、下位伝送装置6−2は、所定の保護時間以内のリンクダウンに対しては回線障害と判断することなく、伝送装置Bとの運用系回線の接続を維持し、伝送装置Dとの待機系回線への回線切り替えを行わない。従って、図7(b)に示すように、上位伝送装置6−1と下位伝送装置6−2との間の主信号回線は、伝送装置A,Bを経由する回線に維持され、伝送装置A,B間でのみ回線切り替えが行われる。
【0011】
図8に本発明が適用される伝送装置のシステム構成例を示す。図8において、8−1はイーサネット(登録商標)スイッチ装置等の下位伝送装置である。下位伝送装置8−1内には、監視制御カード8−11及び複数のインタフェースカード(#1〜#N)8−12を備える。インタフェースカード(#1〜#N)8−12は、ポート#1〜#Mを具備する。
【0012】
インタフェースカード(#1〜#N)8−12のポート#1〜#Mは、主信号回線を収容し、該主信号回線は、上位側の伝送装置8−2と接続される。該主信号回線は、リンクアグリゲーション(LAG)等の冗長構成化が行われる。また、監視制御カード8−11は、各インタフェースカード(#1〜#N)8−12を監視・制御し、監視制御端末8−3と監視制御信号を送受する。本発明は、リンクダウン保護機能を備えたイーサネット(登録商標)スイッチ装置等の下位伝送装置8−1に係る。
【背景技術】
【0013】
従来のリンクダウン保護機能を備えた伝送装置について説明する。図9に従来の伝送装置の構成例を示す。図9において、1は主信号の物理レイヤを終端する物理レイヤ部、2は主信号の入力フレームエラー検出等を行う主信号処理部、3は警報処理部、31はリンクダウン保護部、32は警報通知部、33は切替え通知部、4は割込み通知部である。
【0014】
従来のリンクダウン保護機能を備えた伝送装置の動作フローを図10に示す。図10を参照して、従来のリンクダウン保護機能を備えた伝送装置の動作を説明する。物理レイヤ部1での主信号回線のリンクダウン検出信号が警報処理部3に入力され、リンクダウン発生を検出すると(10−1)、警報処理部3では、リンクダウン保護の設定の有無をチェックし(10−2)、リンクダウン保護の設定が行われている場合、リンクダウン保護タイマの動作を開始させる(10−3)。
【0015】
リンクダウン保護タイマを開始させた後、リンクダウン警報をマスクし(10−4)、リンクダウン保護時間のタイマが終了したか否かを判定する(10−5)。リンクダウン保護時間のタイマが終了していない場合は、上述の処理フロー10−4に戻って同様の処理を繰り返す。リンクダウン保護時間のタイマが終了した場合は、リンクダウンが回復したか否かを判定する(10−6)。
【0016】
リンクダウンが回復した場合は、リンクダウン警報無しとして処理する(10−7)。リンクダウンが回復していない場合は、リンクダウン警報を発出する(10−8)。リンクダウン警報の発出後、該リンクダウン警報の重要度を判定するため、リンクダウン警報の継続時間を判定する周期処理を行う(10−9)。
【0017】
リンクダウン保護機能を備えた伝送装置では、リンクダウンが発生しても、所定の保護時間以内にリンクダウンが回復した場合には、警報発生・回線切り替えの要因と見なさない。保護時間を超えて継続するリンクダウンを検出した場合、リンクダウンの警報を発生すべき状態と見なし、また、待機系回線への切り替え要因の発生と見なして待機系回線への切り替えを実施する。
【0018】
図11及び図12に従来のリンクダウン保護動作例のタイムチャートを示す。同図の(a)は実際のリンクダウンの検出出力(検出時ハイレベル)を示し、(b)はリンクダウン保護後の警報出力(警報発出時ハイレベル)を示し、(c)は周期T秒の判定処理を示し、(d)は警報通知の出力を示し、(e)は切り替えトリガの発生出力を示している。
【0019】
(a)に示す実際のリンクダウンの検出に対して、所定の保護時間τを超過して継続するリンクダウンを検出した場合、(b)に示すように保護後の警報として発出する。従って、第1のリンクダウン9−1は、保護時間τ以内に回復しているためマスクされて検出されず、第2のリンクダウン9−2は、保護時間τを超えて継続したため、保護後の警報発出9−4として出力され、第3のリンクダウン9−3は、保護時間τを超えて継続したため、保護後の警報発出9−5として出力される。
【0020】
警報の通知は、保護後の警報発出に対して所定の周期で継続時間を判定して行う。警報には、周期T秒以上警報が継続した場合に発出する重要警報(Major)と、周期T秒以内に警報が回復した場合に発出する警告警報(Warning)とがある。この感知重要度(重要警報/警告警報)の区別は、保護後の警報発出に対して、周期T秒毎の状態を判定して行う。
【0021】
図11に示す保護後の警報発出9−4は、時刻T4,T5間で立ち上がり、時刻T5の時点でローレベルに復旧し、継続時間が周期T以下であるため、警告警報(Warning)と判定する。また、保護後の警報発出9−5は、時刻T7,T8間で立ち上がり、時刻T8ではハイレベルを継続しているため、重要警報(Major)と判定する。
【0022】
従って、保護時間τが監視周期Tの2倍(τ=2T)の場合、第2のリンクダウン9−2のように、実際のリンクダウンの継続時間が2T+T/2であっても、重要警報(Major)と判定されず、警告警報(Warning)と判定される場合がある。保護時間τを超えて発生したリンクダウン9−2,9−3に対し出力される保護後の警報発出9−4,9−5により、(e)に示すように切り替えトリガが発生する。
【0023】
しかし、図12に示すように、リンクダウンの発生・回復が保護時間τ以内の短時間で繰り返し発生する場合は、保護時間τ以上に亘ってその状態が継続していても、該リンクダウンの検出はマスクされ、警報発出・切り替え要因として扱われず、実際の運用で支障を来たすこととなる。
【0024】
即ち、図12の(a)に示すように、保護時間τ以内のリンクダウンが断続的に発生し、該断続的なリンクダウンが保護時間τ以上に亘って発生しても、保護時間τを超える継続的なリンクダウンとしては検出されないため、(b)に示すように、保護後の警報は発出されない。従って、(d)及び(e)に示すように警報通知及び切り替えトリガは発生しない。
【0025】
このような短持間のリンクダウンを検出するためには、監視周期を短縮して分解能を高くすればよいが、ソフトウェア制御により多数のポートに対して短周期で監視を行う場合、ソフトウェア処理の負担が増大し、高速の処理装置を用いなければならず、実現が困難となる。
【0026】
このように、回線の障害形態や伝送装置の故障モードによっては、保護時間以内のリンクダウンが検出されないため、回線の障害や装置の故障等を検出することができず、そのために待機系に切り替わらない場合がある。待機系への自動的な切り替えが行われず、また、伝送装置で障害を検出することができないため、警報の発出もなく、異常動作が生じていることを保守者等に通知することができない、所謂サイレント障害が発生する。
【0027】
サイレント障害等に関しては、例えば下記の特許文献1等に記載されている。また、リンクダウン等の保護機能等については、例えば、下記の特許文献2,3等に記載されている。
【先行技術文献】
【特許文献】
【0028】
【特許文献1】特開2006−229477号公報、段落0005等
【特許文献2】特開2004−320683号公報、請求項3等
【特許文献3】特開2005−33665号公報、請求項2等
【発明の概要】
【発明が解決しようとする課題】
【0029】
サイレント障害が発生している状態では、主信号回線で伝送エラーを起こしているが、警報が発出されないため、待機系回線に切り替わらず、ユーザー通信に影響を与える。このようなサイレント障害が発生すると、待機系回線への切替え契機は、該障害回線を使用するユーザーからの苦情を待つしかなく、該苦情に対しても警報の発出がないため、障害要因の特定化が困難で、サービスの中断が長期化し、問題となる。
【0030】
また、待機系の伝送装置でリンクダウン保護機能を有効にしている場合、冗長構成の形態にもよるが、例えば、リンクアグリゲーション(LAG)のように、待機系の伝送装置でもユーザーデータを受信する冗長構成の形態の場合、リンクダウンの発生・回復が繰り返し発生しても、運用系の伝送装置と同様に、待機系の伝送装置で該リンクダウンが検出されず、系切り替えが行われた後に、ユーザーデータに影響を与えることとなる。
【0031】
また、待機系の伝送装置ではユーザーデータを受信せず、系切り替えが行われた後にユーザーデータの受信を開始する1+1冗長構成等の形態の場合は、待機系の伝送装置でリンクダウン保護機能を有効にしている場合、リンクダウン等の回線異常があったとしても、警報発出がマスクされ、恰も正常状態のように認識される。
【0032】
そのため、運用系の伝送装置で何らかの回線障害が検出され、待機系の伝送装置に切り替わった際に、リンクダウン保護機能により正常にリンクアップしている状態と見なされ、ユーザーデータの廃棄が発生して初めて異常が顕在化するサイレント障害となる。何れの冗長構成であっても、待機系の伝送装置でリンクダウン保護を有効にした場合は、待機系の伝送装置のサイレント障害に対する正常性の確認ができないという問題がある。
【0033】
上述の問題を防ぐには、待機系の伝送装置ではリンクダウン保護機能を無効にすればよいが、運用系から待機系に、また待機系から運用系に切り替わる度に、リンクダウン保護機能の有効化/無効化を監視制御端末8−3により再設定しなければならず、保守運用者側の作業負担が発生する。伝送装置としては、運用系及び待機系共に、リンクダウン保護機能の有効化/無効化は、同一設定であることが望ましい。
【0034】
本発明は、リンクダウン保護機能の設定を有効にした場合、サイレント障害を検出可能にし、また、サイレント障害に対する警報通知及び系切り替えを可能にすることを目的とする。
【課題を解決するための手段】
【0035】
本発明のリンクダウン保護機能を有する伝送装置は、所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したときリンクダウン警報を発出するリンクダウン保護部を備えた伝送装置において、前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定部と、前記リンクダウン保護部から発出されるリンクダウン警報と、前記障害判定部から出力される短時間のリンクダウンの発生の警報との論理和を演算する論理和演算部と、前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて警報を通知する警報通知部と、前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて、運用系を待機系に切り替える通知を発する切替え通知部と、を備えたものである。
【0036】
また、本発明のリンクダウン検出方法は、所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したとき、リンクダウン警報を発出するリンクダウン保護ステップを有する伝送装置のリンクダウン検出方法において、前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定ステップと、前記リンクダウン保護ステップにより発出されるリンクダウン警報と、前記障害判定ステップで出力される短時間のリンクダウンの発生の警報との論理和を警報情報として出力するステップと、を含むものである。
【発明の効果】
【0037】
本発明によれば、リンクダウン保護機能を有効にした場合、保護時間以内の短時間のリンクダウンが検出され、サイレント障害の検出が可能となる。これにより、従来のようにユーザーデータの廃棄によるユーザーからの苦情を待つことなく、サイレント障害の警報を発出することができ、障害要因の特定化が容易となり、サービス復旧時間の短縮化を図ることが可能となる。
【図面の簡単な説明】
【0038】
【図1】本発明の伝送装置のリンクダウン検出の処理フローを示す図である。
【図2】本発明の伝送装置の第1の実施例の構成例を示す図である。
【図3】本発明の伝送装置の第2の実施例の構成例を示す図である。
【図4】本発明の伝送装置の第3の実施例の構成例を示す図である。
【図5】本発明の実施例の待機系での適用例を示す図である。
【図6】主信号回線の冗長系切り替えの例を示す図である。
【図7】リンクダウン保護機能を具備した場合の冗長系切り替えの例を示す図である。
【図8】伝送装置のシステム構成例を示す図である。
【図9】従来の伝送装置の構成例を示す図である。
【図10】従来のリンクダウン保護機能を備えた伝送装置の動作フローを示す図である。
【図11】従来のリンクダウン保護動作例のタイムチャートである。
【図12】従来のリンクダウン保護動作例のタイムチャートである。
【発明を実施するための形態】
【0039】
図1に本発明の伝送装置のリンクダウン検出の処理フローを示す。本発明の伝送装置では、リンクダウン発生を検出すると(1−1)、リンクダウン保護機能が設定されているか否かをチェックし(1−2)、リンクダウン保護機能が設定されている場合、リンクダウン保護時間のタイマの動作を開始させる(1−3)。
【0040】
次に、リンクダウンが発生・回復常態か、更には入力フレームエラーが検出されたかを判定する(1−4)。リンクダウンが発生・回復状態であり、更には入力フレームエラー検出された場合、リンクダウン警報を発出する(1−8)。リンクダウンが発生・回復状態ではなく、又は入力フレームエラー検出されない場合は、リンクダウン保護時間のタイマが終了したか否かを判定する(1−5)。
【0041】
リンクダウン保護時間のタイマが終了していない場合は、上述の処理フロー1−4に戻って同様の処理を繰り返す。リンクダウン保護時間のタイマが終了した場合は、リンクダウンが回復したか否かを判定する(1−6)。リンクダウンが回復した場合は、リンクダウン警報無しとして処理する(1−7)。リンクダウンが回復していない場合は、リンクダウン警報を発出する(1−8)。リンクダウン警報の発出後、該リンクダウン警報の重要度を判定するため、リンクダウン警報の継続時間を判定する周期処理を行う(1−9)。
【0042】
図2に本発明の伝送装置の第1の実施例の構成例を示す。同図において、1は主信号の物理レイヤを終端する物理レイヤ部、2は主信号の入力フレームエラー検出等を行う主信号処理部、3は警報処理部、31はリンクダウン保護部、32は警報通知部、33は切替え通知部、34は障害判定部、35は論理和演算部、4は割込み通知部である。物理レイヤ部1、主信号処理部2及び警報処理部3は、インタフェースカード単位に備える。
【0043】
障害判定部34は、ソフトウェア制御による警報収集周期(例えば1秒)より短い周期(例えば1m秒)で、ハードウェア制御によりリンクダウンの監視を行い、保護時間以内に実際に発生しているリンクダウンの発生回数をカウントする機能を有し、ソフトウェア制御の周期で監視制御可能なレジスタを備える。
【0044】
主信号処理部2は、対向する伝送装置から入力される主信号のイーサネット(登録商標)フレーム(ユーザーデータ)に対して正常性のチェックを行い、該入力フレームのエラーフレーム数をカウントし、エラーフレーム数を障害判定部34に通知する。リンクダウン保護部31は、従来と同様に、リンクダウン保護時間を超えるリンクダウンを検出し、その検出出力を送出する。
【0045】
リンクダウンの発生・回復がリンクダウン保護時間以内の短時間で繰り返し発生するリンクダウンに対して、障害判定部34により以下の処理を行い、サイレント障害を検出する。
(1)障害判定部34において、物理レイヤ部1の出力信号を監視し、リンクダウン保護時間以内の実際に発生した短時間のリンクダウンの発生回数をカウントし、ソフトウェア制御の周期で監視可能なレジスタに、該短時間リンクダウンの発生回数を格納する。なお、リンクダウン保護時間の設定値は、リンクダウン保護部31から通知障害判定部34に通知する。
【0046】
(2)障害判定部34では、ソフトウェア制御により、リンクダウン保護時間以内の実際に発生した短時間リンクダウンの発生回数をレジスタから読出して収集する。
【0047】
(3)短時間リンクダウンの発生回数が、所定の閾値X以上発生したことを検出した場合、又は、短時間リンクダウンの発生回数が、該閾値X以上発生したことが所定の閾値Y以上の保護期間に亘って連続して発生したことを検出した場合、短時間リンクダウンが発生したと判定し、該判定結果を論理和演算部35に出力する。該閾値X及びYは、ネットワークシステムに応じて予め設定しておく。
【0048】
(4)論理和演算部35は、障害判定部34から送出される短時間リンクダウン発生の判定結果の出力と、リンクダウン保護部31から送出されるリンクダウン検出出力との論理和による警報情報を、障害警報通知部32及び切替え通知部33に送出する。
【0049】
障害警報通知部32は、警報情報を受けると警報の発出を行う。切替え通知部33は、該警報情報を受けると、割込み通知部4に待機系への切り替えを通知する。なお、切替え通知部33は、警報情報を検出した回線が運用系である場合に、待機系への切替え通知を行う。警報情報を検出した回線が待機系の場合は、障害警報通知部32による警報の発出のみを行う。割込み通知部4は、M個の各ポートから送出される切り替えの通知信号の論理和を演算し、該論理和出力を、図示省略の監視制御カードへインタフェースカード単位で通知する。
【0050】
図3に本発明の伝送装置の第2の実施例の構成例を示す。図3において、図2の構成要素と同一の構成要素には同一の符号を付し、重複した説明は省略する。リンクダウンの発生・回復がリンクダウン保護時間以内の短時間で繰り返し発生するリンクダウンに対して、障害判定部34により以下の処理を行い、サイレント障害を検出する。
【0051】
(1)障害判定部34において、物理レイヤ部1の出力信号を監視し、リンクダウン保護時間以内の実際に発生した短時間リンクダウンの発生回数をカウントし、ソフトウェア制御の周期監視可能なレジスタに、該短時間リンクダウンの発生回数を格納する。なお、リンクダウン保護時間の設定値は、リンクダウン保護部31から通知障害判定部34に通知する。
【0052】
(2)リンクダウンの発生・回復が短持間で繰り返すとき、それに伴って入力フレームエラーが発生する。主信号処理部2は、入力フレームエラー数をカウントし、該入力フレームエラー数を障害判定部34に通知する。
【0053】
(3)障害判定部34では、入力フレームエラー数と短時間リンクダウン発生回数とを基に、障害の判定を行う。リンクダウンの発生・回復が短時間で繰り返すとき、ユーザーデータの流量にもよるが、支障をきたすのは、ユーザーデータが廃棄される入力フレームエラー数(FCSエラー等)が多い場合であり、短時間リンクダウン発生回数<入力フレームエラー数の場合である。従って、リンクダウン保護時間以内で、短時間リンクダウン発生回数<入力フレームエラー数の関係となる障害発生回数をレジスタに格納し、これを基に障害の判定を行う。
【0054】
(4)この障害発生回数が監視周期以内に閾値Z以上となることが、閾値W以上の複数の保護期間に亘って複数回して発生したことを検出した場合、保護時間内リンクダウンが発生した判定し、該判定結果を論理和演算部35に出力する。上記閾値Z及びWは、ネットワークシステムに応じて予め設定しておく。
【0055】
(5)論理和演算部35は、障害判定部34から送出される判定結果の出力と、リンクダウン保護部31から送出されるリンクダウン検出出力との論理和による警報情報を、障害警報通知部32及び切替え通知部33に通知する。以下は、第1の実施例と同様である。
【0056】
図4は本発明の伝送装置の第3の実施例の構成例を示す。図4において、図2及び図3の構成要素と同一の構成要素には同一の符号を付し、重複した説明は省略する。イーサネット(登録商標)伝送装置等の伝送装置では、リンク上の信号の喪失を検出し、信号喪失(LOS)警報として出力する。信号喪失(LOS)警報が発生する場合は、通常、リンクダウンも発生するので、この第3の実施例では信号喪失(LOS)警報を基にリンクダウンを検出する。
【0057】
リンクダウンの発生・回復がリンクダウン保護時間以内の短時間で繰り返し発生するリンクダウンに対して、障害判定部34により以下の処理を行い、サイレント障害を検出し、ハードウェア制御による自律動作で冗長系への切り替えを行う。
【0058】
(1)障害判定部34において、物理レイヤ部1の出力信号を監視し、リンクダウン保護時間以内の実際に発生した短時間リンクダウンの発生回数をカウントし、ソフトウェア制御の周期監視可能なレジスタに、該短時間リンクダウンの発生回数を格納する。なお、リンクダウン保護時間の設定値は、リンクダウン保護部31から通知障害判定部34に通知する。
【0059】
また、主信号が入力される光モジュール(SFP:Small Form-Factor Pluggable)5の出力信号の喪失(LOS)を検出し、リンクダウン保護時間以内の実際に発生した信号喪失(LOS)数をカウントし、ソフトウェア制御の周期監視可能なレジスタに、該信号喪失(LOS)数を格納する。
【0060】
(2)リンクダウンの発生・回復が短持間で繰り返すとき、それに伴って入力フレームエラーが発生する。主信号処理部2は、入力フレームエラー数をカウントし、該入力フレームエラー数を障害判定部34に通知する。
【0061】
(3)障害判定部34では、入力フレームエラー数と短時間リンクダウン発生回数又は信号喪失警報(LOS)数とを基に、障害の判定を行う。リンクダウンの発生・回復が短時間で繰り返すとき、ユーザーデータの流量にもよるが、支障をきたすのは、ユーザーデータが廃棄される入力フレームエラー数(FCSエラー等)が多い場合であり、短時間リンクダウン発生回数<入力フレームエラー数、又は信号喪失警報(LOS)数<入力フレームエラー数の場合である。
【0062】
また、リンクダウン保護機能を有効に設定している場合、サイレント障害を厳格に検出するには、保護時間内の短時間リンクダウン発生回数は1回であるが、障害判定とする短時間リンクダウン発生回数を、システムに応じて予め定めた閾値Xを超えた場合とすることもできる。即ち、障害判定部34は、X<短時間リンクダウン発生回数<入力フレームエラー数、又はX<信号喪失警報(LOS)数<入力フレームエラー数となる障害発生回数が、所定の閾値を超えたか否かをハードウェアの制御により判定し、該判定結果を論理和演算部35に出力する。
【0063】
(4)論理和演算部35は、障害判定部34から送出される判定結果の出力と、リンクダウン保護部31から送出されるリンクダウン検出出力との論理和による警報情報を、障害警報通知部32及び切替え通知部33に通知する。以下は、第1の実施例と同様である。
【0064】
図5に本発明の実施例の待機系での適用例を示す。システムにおける冗長構成の形態により、以下の動作を行う。ユーザーデータを待機系のインタフェースカードで受信する冗長構成(リンクアグリゲーション)の場合には、第2又は第3の実施例のように、短時間リンクダウン発生回数<入力フレームエラー数の関係となる障害発生回数、又は、この関係若しくはX<信号喪失警報(LOS)数<入力フレームエラー数の関係となる障害発生回数を基に障害判定を行い、待機系のインタフェースカードでユーザーデータを受信しない冗長構成(1対1冗長構成)の場合には、第1の実施例のように、保護時間内の短時間リンクダウン発生回数を基に障害判定を行う。
【0065】
こうすることにより、冗長構成の形態によらず、待機系において、従来サイレント障害となっていたリンクダウン障害を検出することが可能となる。従って、待機系でリンクダウン保護機能が有効に設定されている場合でも、従来のサイレント障害に対して、冗長構成の形態によらず、正常性の確認を行うことが可能となる。これにより、従来ユーザーデータの廃棄に伴う苦情によって顕在化する障害に対して、事前に該障害を検出することが可能となり、ユーザー回線のサービスの中断を低減することが可能となる。
【符号の説明】
【0066】
1 物理レイヤ部
2 主信号処理部
3 警報処理部
31 リンクダウン保護部
32 警報通知部
33 切替え通知部
34 障害判定部
35 論理和演算部
4 割込み通知部
5 光モジュール
【特許請求の範囲】
【請求項1】
所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したときリンクダウン警報を発出するリンクダウン保護部を備えた伝送装置において、
前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定部と、
前記リンクダウン保護部から発出されるリンクダウン警報と、前記障害判定部から出力される短時間のリンクダウンの発生の警報との論理和を演算する論理和演算部と、
前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて警報を通知する警報通知部と、
前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて、運用系を待機系に切り替える通知を発する切替え通知部と、
を備えたことを特徴とするリンクダウン保護機能を有する伝送装置。
【請求項2】
前記障害判定部は、主信号の入力フレームエラー数と前記短時間のリンクダウンの発生回数とを比較し、保護時間以内における該入力フレームエラー数が該短時間のリンクダウンの発生回数より多くなる障害発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力することを特徴とする請求項1に記載のリンクダウン保護機能を有する伝送装置。
【請求項3】
前記障害判定部は、主信号の入力フレームエラー数又はリンク上の信号の喪失を表す信号喪失警報の数と、前記短時間のリンクダウンの発生回数とを比較し、保護時間以内における該入力フレームエラー数又は該信号喪失警報の数が該短時間のリンクダウンの発生回数より多くなる障害発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力することを特徴とする請求項1に記載のリンクダウン保護機能を有する伝送装置。
【請求項4】
前記障害判定部は、冗長構成の待機系として動作し、待機系で主信号が受信されない冗長構成の形態の場合、前記短時間のリンクダウンの発生回数が所定の閾値以上の場合に短時間のリンクダウンの発生を通知する警報を出力し、
待機系で主信号が受信される冗長構成の形態の場合、保護時間以内における前記入力フレームエラー数又は前記信号喪失警報の数が前記短時間のリンクダウンの発生回数より多くなる障害発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力することを特徴とする請求項3に記載のリンクダウン保護機能を有する伝送装置。
【請求項5】
所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したとき、リンクダウン警報を発出するリンクダウン保護ステップを有する伝送装置のリンクダウン検出方法において、
前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定ステップと、
前記リンクダウン保護ステップにより発出されるリンクダウン警報と、前記障害判定ステップで出力される短時間のリンクダウンの発生の警報との論理和を警報情報として出力するステップと、
を含むことを特徴とするリンクダウン検出方法。
【請求項1】
所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したときリンクダウン警報を発出するリンクダウン保護部を備えた伝送装置において、
前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定部と、
前記リンクダウン保護部から発出されるリンクダウン警報と、前記障害判定部から出力される短時間のリンクダウンの発生の警報との論理和を演算する論理和演算部と、
前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて警報を通知する警報通知部と、
前記論理和演算部から出力される論理和演算結果を警報情報として入力し、該警報情報に基づいて、運用系を待機系に切り替える通知を発する切替え通知部と、
を備えたことを特徴とするリンクダウン保護機能を有する伝送装置。
【請求項2】
前記障害判定部は、主信号の入力フレームエラー数と前記短時間のリンクダウンの発生回数とを比較し、保護時間以内における該入力フレームエラー数が該短時間のリンクダウンの発生回数より多くなる障害発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力することを特徴とする請求項1に記載のリンクダウン保護機能を有する伝送装置。
【請求項3】
前記障害判定部は、主信号の入力フレームエラー数又はリンク上の信号の喪失を表す信号喪失警報の数と、前記短時間のリンクダウンの発生回数とを比較し、保護時間以内における該入力フレームエラー数又は該信号喪失警報の数が該短時間のリンクダウンの発生回数より多くなる障害発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力することを特徴とする請求項1に記載のリンクダウン保護機能を有する伝送装置。
【請求項4】
前記障害判定部は、冗長構成の待機系として動作し、待機系で主信号が受信されない冗長構成の形態の場合、前記短時間のリンクダウンの発生回数が所定の閾値以上の場合に短時間のリンクダウンの発生を通知する警報を出力し、
待機系で主信号が受信される冗長構成の形態の場合、保護時間以内における前記入力フレームエラー数又は前記信号喪失警報の数が前記短時間のリンクダウンの発生回数より多くなる障害発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力することを特徴とする請求項3に記載のリンクダウン保護機能を有する伝送装置。
【請求項5】
所定の保護時間以内に回復する短時間のリンクダウンの検出をマスクし、該保護時間を超えて継続するリンクダウンを検出したとき、リンクダウン警報を発出するリンクダウン保護ステップを有する伝送装置のリンクダウン検出方法において、
前記保護時間以内に回復する短時間のリンクダウンの発生回数を、ハードウェア制御によりカウントしてレジスタに格納し、該レジスタに格納された短時間のリンクダウンの発生回数をソフトウェア制御により読出し、該短時間のリンクダウンの発生回数が所定の閾値以上の場合に、短時間のリンクダウンの発生を通知する警報を出力する障害判定ステップと、
前記リンクダウン保護ステップにより発出されるリンクダウン警報と、前記障害判定ステップで出力される短時間のリンクダウンの発生の警報との論理和を警報情報として出力するステップと、
を含むことを特徴とするリンクダウン検出方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−160378(P2011−160378A)
【公開日】平成23年8月18日(2011.8.18)
【国際特許分類】
【出願番号】特願2010−22811(P2010−22811)
【出願日】平成22年2月4日(2010.2.4)
【出願人】(000237662)富士通テレコムネットワークス株式会社 (682)
【Fターム(参考)】
【公開日】平成23年8月18日(2011.8.18)
【国際特許分類】
【出願日】平成22年2月4日(2010.2.4)
【出願人】(000237662)富士通テレコムネットワークス株式会社 (682)
【Fターム(参考)】
[ Back to top ]