説明

ローカルノード機能停止の間の無中断ネットワーク制御メッセージ生成

一時的な制御プレーン機能停止の場合にパケットネットワーク再構成および関連するトラフィック損失を防止するために提供されるキャッシング機構。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般にコンピュータネットワークに関する。本発明は、特にパケット交換および制御プレーンプロトコルに関する。
【背景技術】
【0002】
パケット交換ネットワークは、スパニングツリープロトコル(STP)、一般属性登録プロトコル(GARP)および仮想ローカルエリアネットワークに関するそのバージョン、VLAN登録プロトコル(GVRP)、リンク集約制御プロトコル(LACP)、Y.1711高速障害検出(FFD)、ならびに予約プロトコル(RSVP)更新等の制御プレーンプロトコルを含む。制御プロトコルは、例えば、ネットワークを介してどのようにレイヤ2(L2)トラフィックが流れるかのトポロジーおよび分配を制御する責任を有する。これらのプロトコルは、各参加ネットワーク構成要素上で実行中の状態機械で実現されている。一度、安定したネットワーク構成が達成されると、プロトコルは、それらがネットワークに送信したのと同じメッセージを繰り返しがちである。異なるメッセージは、通常、オペレーターかネットワークに変化を発生させる欠陥から生じる。ネットワーク構成要素によるプロトコルへの参加の失敗は、数ミリ秒から数秒の範囲のタイムアウト時間に1回のトラフィック再配置の超過を引き起こす。場合によっては、トラフィック再配置は全ネットワークに関係する。
【0003】
現在のネットワーク構成要素では、パケット制御プロトコルは、3つのカテゴリの1つに分類される。それらは(1)非防護、(2)制御プレーン機能停止の前に近隣ネットワーク構成要素との専用通信を介した防護、または(3)プロトコル機能停止の少し前もしくは後に近隣ネットワークとの対話を必要とする、標準化された緩やかな再起動技術による防護である。非防護の場合、一般に、ネットワークを介したトラフィックフローが再構成される結果になる。再構成の時間の間、全ネットワークドメインと同じ程度の大きさであり得るネットワークの部分でトラフィック損失が生じる。異常を起こしていたネットワーク構成要素が正常状態に戻ると、障害より前のトラフィックフロー分配を再確立するために第2の再構成が行われる。再度、前と同様の規模でトラフィック損失が生じる。専用の実装では、2つの不利益が存在する。第1に、それが問題のシナリオの一部だけ、即ち、(例えば、ネットワーク構成要素におけるオペレーターによるソフトウェアアップグレードの場合に)自発的に入力され、異常を起こすネットワーク構成要素がその近隣に制御プレーン障害が生じていることを通知することを可能にすることだけを対象にする。第2に、これらの能力を保有する対話ネットワーク構成要素だけに制限されており、即ち、それは他の装置ベンダによる一般の相互作用シナリオでは機能しない。標準化された緩やかな再起動の場合、プロトコルの小セットだけが対象にされる。障害の後に近隣構成要素に緩やかな再起動が適用されることを通知するための時間制約が小さい場合、予期せぬ障害に関する制約の不足の可能性が高い。近隣構成要素が制御プレーン機能停止を検出し、ネットワーク再構成を引き起こすので、時間制限の不足はトラフィック損失を生じる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
従って、一時的なパケット制御プレーン機能停止の場合に、パケットネットワーク再構成および関連するトラフィック損失を防止する機構の必要性が存在する。
【課題を解決するための手段】
【0005】
本発明の例示的な実施形態は、ローカルノード機能停止の間に無中断ネットワーク制御メッセージ生成を提供することによって、パケットネットワーク再構成および関連するトラフィック損失を防止する。
【0006】
1つの実施形態は、ローカルノード機能停止の間に無中断ネットワーク制御メッセージ生成を提供する方法である。メッセージキャッシュは、ローカルノードに関するプロトコル状態機械から多数の送信メッセージを受信し、それらをネットワークの他のノードに転送する。メッセージキャッシュはこれらのノードからのメッセージを同様に受信する。メッセージキャッシュは、送信および受信メッセージを共にバッファに記憶する。プロトコル状態機械の障害が発生すると、メッセージキャッシュは、バッファが有効状態のままである限り、ノードにメッセージを送信し、かつノードからメッセージを受信する。このメッセージは、ノードに周期的に送信されてよい。メッセージキャッシュは、バッファのメッセージおよび障害の後にノードから受信したメッセージに基づいてバッファが有効状態であるか否かを決定してよい。方法は、動作中のプロトコル状態機械の障害が発生した場合に、スタンドバイプロトコル状態機械へ切り替えることを含んでよく、ここでスタンドバイプロトコル状態機械は、第1のバッファを複製する別のバッファを含む。
【0007】
別の実施形態は、ローカルノード機能停止の間に無中断ネットワーク制御メッセージ生成を提供するこの方法を実行する命令を記憶するコンピュータ可読媒体である。
【0008】
さらに別の実施形態は、プロトコル状態機械およびメッセージキャッシュを含む、ローカルノード機能停止の間に無中断ネットワーク制御メッセージ生成を提供するシステムである。プロトコル状態機械は、メッセージを生成する。メッセージキャッシュは、プロトコル状態機械からメッセージを受信し、それらをネットワークのノードに転送する。メッセージキャッシュは、1つまたは複数のバッファに送信および受信メッセージの両方を記憶する。プロトコル状態機械の障害が発生した場合、メッセージキャッシュが有効状態のままである限り、メッセージキャッシュがノードにメッセージを送信し、かつノードからメッセージを受信する。メッセージキャッシュは、ノードに周期的メッセージを送信するタイマと、メッセージキャッシュが有効状態であるか否かを決定する状態制御装置とを含んでよい。システムは、ワーカーノードおよび防護ノードを含んでよく、各々は、ワーカーノードが異常を起こした場合に防護ノードが動作状態になることが可能であるようにプロトコル状態機械およびメッセージキャッシュを有する。防護メッセージキャッシュは、ワーカープロトコル状態機械が動作状態である際にワーカーメッセージキャッシュを複製し得る。
【0009】
本発明の教示は、以下の詳細な説明を添付の図面と共に考慮することによって容易に理解することが可能である。
【0010】
理解の容易化を目的として、図面で共通する同一の構成要素を示すために、可能な場合に同一の参照番号が使用されている。
【図面の簡単な説明】
【0011】
【図1】制御プレーンプロトコルに関する状態機械が動作状態である際に、初期設定の場合のキャッシュ構成概念の例示的な実施形態を示すブロック図である。
【図2】プロトコル状態機械が利用不可能であり、ネットワーク状態が安定である際に、制御プレーン障害の場合の図1のキャッシュ構成概念の例示的な実施形態を示すブロック図である。
【図3】プロトコル状態機械が利用不可能であり、ネットワーク状態が安定でない際に、制御プレーン障害の場合の図1のキャッシュ構成概念の例示的な実施形態を示すブロック図である。
【図4】状態機械の2つのインスタンスが存在し(ワーカーおよび防護)、ワーカー状態機械が動作状態であり、防護状態機械がスタンドバイ状態であり、各々がキャッシュと関連付けられている際に、初期設定の場合のキャッシュ構成概念の例示的な実施形態を示すブロック図である。
【図5】ワーカー状態機械が動作状態であったが故障を起こし、スタンドバイ状態の防護状態機械が(スタンドバイ状態から完全な動作に)復旧中であるが、ネットワーク状態は安定している際の中間状態の図4のキャッシュ構成概念の例示的な実施形態を示すブロック図である。
【図6】(ワーカーから防護への切替えの後に)防護状態機械が動作状態であり、ワーカー状態機械がスタンドバイ状態である際の図4のキャッシュ構成概念の例示的な実施形態を示すブロック図である。
【図7】図4のキャッシュ構成概念の例示的な実施形態に関する時系列上の選択された状態移行およびイベントを示すチャートである。
【図8】分配されたキャッシュの例示的な実施形態を示すブロック図である。
【発明を実施するための形態】
【0012】
本発明の説明は、主としてパケット交換ネットワークおよび制御プレーンプロトコルの一般情勢に関する。しかしながら、当業者および本明細書の教示によって知識を得た者は、本発明の主たる概念がコンピュータネットワークに一般的に適用可能であり、あらゆるネットワークアーキテクチャおよび設計、通信プロトコル、ネットワークソフトウェア、ネットワーク技術、ネットワークサービスおよびアプリケーション、ならびにネットワーク動作管理に広く適用し得ることを理解するであろう。従って、本発明の一般的な概念は、広く適用可能であり、いずれかの特定の実装に限定されない。
【0013】
序文−装置防護に関連するL2イーサネット(登録商標)例
L2制御プレーン、即ち、スパニングツリープロトコルおよびリンク集約制御プロトコル、一般属性登録プロトコル(GARP)およびその変形、ならびに他のプロトコルに影響を及ぼす装置防護切替えの状況の下でL2イーサネット(登録商標)サービスに関する安定なネットワーク構成を維持する必要性が存在する。プロトコルデータユニット(PDU)分配が約3秒の間、中断される場合、ローカル防護切替えがネットワークの全スパニングツリーの再構成をもたらすことが可能である。これは、ネットワークが再度、安定状態に収束するまで、数十秒のトラフィック機能停止を生じ得る。それゆえに、防護切替えの後にネットワーク構成要素が即座に以下の動作を行うことが望ましい。第1に、不安定の原因が装置防護切替えだけである場合、即ち、単一の障害(例えば、回路パック欠陥)の場合に加えて手動切替え等のオペレーターによるイベントの場合にネットワーク構成要素は安定したネットワークを維持するべきである。第2に、例えば、リモートネットワーク構成要素の障害が原因でネットワークが既に再構成に入っており、それと同時にローカル欠陥(二重障害)またはオペレーター命令に起因して防護切替えが必要である場合にネットワーク構成要素はネットワークの影響を最小化するべきである。本発明の例示的な実施形態は、このL2イーサネット(登録商標)の例に関してだけでなく、より広く、多くのプロトコルに対してあらゆるネットワークのローカル制御プレーンの一時的な利用不可能を生じるあらゆる障害(例えば、ハードウェア欠陥)に関してこれらの目標を達成する。
【0014】
ネットワーク構成要素挙動の高レベルな説明
ネットワーク構成要素挙動は、3つの状態によって説明され得る。第1の状態では、状態機械が完全に動作可能であり、全ての要求に対して反応する。第2の状態では、状態機械は利用可能でないが、キャッシュを無効状態にするネットワークでの変化が生じるか、または状態機械が動作可能になるまで、キャッシュがPDU送信を続行する。第3の状態では、例えば、ネットワークで再構成が進行中であると同時に状態機械が動作不可能状態であるために、またはプロトコル状態機械とキャッシュとが同期していないために、状態機械およびキャッシュの両方が利用可能でない。
【0015】
高レベルなキャッシュ構成概念−STP例
キャッシュ構成概念の例示的な実施形態は、安定なネットワークでスパニングツリープロトコルノードが同一PDUをそれらの近隣に繰り返して分配することの観測結果から導出される。3連続の送信周期の間、スパニングツリーノードによってPDUが受信されないか、または前のPDUとPDUの内容が異なっている場合、ネットワーク欠陥またはネットワーク変化が検出される。従って、それ以外は安定なネットワークトポロジーでは、PDUの周期的送信が維持されている限り、スパニングツリープロトコル機械の動作が不定時間の間、停止され得る。従って、キャッシュ構成概念がこの事実を使用して、構成、プロトコル状態機械、および同等物の全てが開始および同期されることの必要性なしに、PDUに関するネットワーク要求がキャッシュから満足されるようにする。従って、キャッシュ構成概念は、キャッシュを動作させる1つ(ホットスタンドバイ状態である)を除き、全てのソフトウェア構成要素の復旧速度に関する要求を救済する。キャッシュがPDU送信に関して有効状態であるとみなされ得る時間帯とキャッシュが無効状態である必要のある時間帯が存在する。安定なネットワークトポロジー内では、ある程度は、新しいサービスでさえ確立され得ることに留意されたい(例えば、転送トラフィックは新規のサービス品質(QoS)パラメータに関して修正され得て、新規の顧客(C−VLANによって区別される)はサービスプロバイダ(802.1ad)ネットワークに付加され得る等)。
【0016】
高レベルキャッシュ構成概念−一般
1つの実施形態は、パケット交換ネットワークに制御プレーンおよびメッセージキャッシュを含む。パケット交換ネットワークは、メッセージまたはメッセージのフラグメント(パケット)が、それらの宛先に、ルーティングアルゴリズムによって決定される最も適切なルートを介して送信されるネットワークである。制御プレーンは、データプレーン接続を設定、維持および終了するために使用される仮想ネットワーク機能である。それはその機能を実現するために相互運用する必要のあるネットワークノードを介して分配されるという意味で仮想である。データプレーンは、ノード間でデータを分配するために使用される仮想ネットワーク経路である。ネットワークによっては、制御および転送プレーンを同様に分解する。キャッシュという用語は、アクセスの局所性を利用するために管理されるあらゆる記憶を示す。メッセージキャッシュはメッセージを記憶する。メッセージキャッシュは、インスタンス作成され、そのメッセージは制御プレーンがネットワークに/から送信/受信するメッセージと同期状態に保持される。制御プレーンが故障を起こした場合、キャッシュは、キャッシュメッセージを送信することによってネットワークの要求を満足させる。一度、制御プレーンが復旧すると、キャッシュは再度、制御動作に従い、同期を保持する。キャッシュは、制御プレーン状態機械のインスタンスが故障を起こしていながらも、なおネットワーク全てのトラフィックを送信することを可能にする。この構成概念は、不安定なネットワーク、二重障害、および転送プレーンが制御プレーンから独立していないシステムを除くほとんどの状況で機能する。不安定なネットワークは、ネットワーク構成要素のシナリオ上での電力等、トラフィックフロー分配が安定状態を達成していないネットワークである。二重障害は、1つのネットワーク構成要素の制御プレーン機能停止に加えて別のネットワーク構成要素が欠陥またはオペレーターによる再構成を経験するシナリオである。
【0017】
本発明は、制御プレーンに影響を及ぼす障害およびソフトウェアアップグレードシナリオで著しくトラフィック損失を最小化することを含む多数の利点を有する。この利益は、説明されたようにネットワーク構成要素がキャッシュ動作をサポートする場合に局所的に達成される。ネットワーク構成要素のキャッシング特性は、既存のネットワークに付加され得る。他の装置がキャッシュ動作をサポートする必要性なしに他の装置との相互運用が可能である。
【0018】
図1は、制御プレーンプロトコルに関する状態機械102が動作状態である際の、初期設定の場合のキャッシュ構成概念100の例示的な実施形態を示す。制御プレーンプロトコルは、任意の種類のプロトコル、例えば、STP、VLAN登録プロトコル、LACP、Y.1711FFD、またはRSVP更新等であってよい。従来式のネットワークでは、プロトコル状態機械102が近隣ノード106およびネットワークの残り108と(中間ハードウェア層を介して)通信する。一方、この実施形態は、プロトコル状態機械102とネットワーク108との間に介在するメッセージキャッシュ104を含む。プロトコル状態機械102は、メッセージキャッシュ104にメッセージを送信し、メッセージキャッシュ104は、それらのメッセージをネットワーク108に送信する。メッセージキャッシュ104は、送信メッセージ110および受信メッセージ112の両方をバッファに記憶することによってプロトコル状態機械102とネットワークとの間の通信を捕捉する。メッセージキャッシュ104は、タイマ114および状態制御装置116をさらに含む。任意選択的に、サポートされている特定のプロトコルに応じて、状態機械102は、付加的な状態情報を(即ち、交換されるメッセージに加えて)状態制御装置116に搬送し得る。メッセージキャッシュ104の内容は、実装されている制御プレーンプロトコルに応じて変化し得る。メッセージキャッシュ104は、状態機械102の障害の場合にネットワーク108の要求に一時的にサービス供給するために必要なものを記憶する。
【0019】
図2は、プロトコル状態機械102が利用不可能であり、ネットワーク状態が安定である際の、制御プレーン障害の場合の図1のキャッシュ構成概念100の例示的な実施形態を示す。メッセージキャッシュ104は、一時的にネットワークにサービス供給することを継続することによって、何らかの理由でプロトコル状態機械が利用不可能である状況から防護する。例えば、プロトコル状態機械102を保持するプロセッサが再起動状態であり得る。メッセージキャッシュ104は、ネットワーク108の近隣ノード106がプロトコル状態機械102が利用不可能であることを認識しないように、バッファからメッセージを送信することを全体的に継続する。近隣ノード106への通信は、メッセージキャッシュ104に記憶されている情報に基づいて模倣される。従って、メッセージキャッシュ104は、プロトコル状態機械102が利用不可能である時間の少なくとも一部を埋める。周期的に同じメッセージ(例えば、ハローメッセージ、更新メッセージ)を近隣ノード106に送信するプロトコルは容易に模倣され得る。メッセージキャッシュ104は、送信メッセージバッファ110に記憶されているメッセージを、プロトコル状態機械102と同様のやり方で周期的に送信するためにタイマ114を使用する。結果として、近隣ノード106は、プロトコル状態機械102の変化を何ら検出しない。メッセージキャッシュ104は、近隣ノード106からメッセージを受信し、それらを受信メッセージバッファ112に記憶する。メッセージキャッシュ104は、状態制御装置116および受信メッセージを検査することによって、メッセージキャッシュ104を無効状態にし得る、ネットワーク108のあらゆるイベントまたは変化(例えば、状態変化)を検出することが可能である。状態制御装置116は、メッセージキャッシュ104が有効状態または無効状態であるかを決定する。メッセージキャッシュ104が無効状態になると、それはネットワーク108のイベントまたは変化に適切に反応することが不可能であるため、メッセージの送信を中止する。
【0020】
メッセージキャッシュ104は、プロトコル状態機械102の少なくとも一部を擬態するために単純化された構成要素である。メッセージキャッシュ104の効率的な実装は、恐らく制御プレーンプロトコルの完全な挙動を擬態しない。メッセージキャッシュ104の単純性または複雑性は、実装されている制御プレーンプロトコルに応じて変化し得る。例えば、メッセージキャッシュは、状態制御装置116のロジックを用いてプロトコル状態機械102の2以上の状態の間の移行を擬態し得る。メッセージキャッシュは、ハードウェア、ファームウェア、またはソフトウェア(例えば、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC))で実装され得る。メッセージキャッシュ104は、それが有効状態のままである限り、それは状況に応じて、プロトコル状態機械が利用不可能である短時間または全時間であり得るが、プロトコル状態機械を模倣することを継続する。プロトコルによってはミリ秒程度の更新を必要とし、一方、他のプロトコルは秒程度の更新を必要とする。この実施形態は、いかなる特定のプロトコルまたは状態制御装置ロジック116の複雑性の程度にも限定されていない。
【0021】
図3は、プロトコル状態機械102が利用不可能であり、ネットワーク状態が安定でない際の、制御プレーン障害の場合の図1のキャッシュ構成概念100の例示的な実施形態を示す。この場合、メッセージキャッシュ104が無効状態に移行する。受信メッセージ112に基づいて、状態制御装置116は、ネットワーク状態を不安定にする何らかのイベントが生じていて、それにより、実装されている特定のプロトコルに従って、メッセージキャッシュ104によるプロトコル状態機械102の擬態を停止する必要があることを決定する。メッセージキャッシュ104が一度、プロトコル状態機械102の擬態を停止すると、近隣ノード106は、あたかもメッセージキャッシュが104が存在していないかのように、プロトコル状態機械102が故障しているかまたは他の形で利用不可能であることを認識し得る。
【0022】
図4は、状態機械の2つのインスタンスが存在し(ワーカーおよび防護)、ワーカー状態機械が動作状態であり、防護状態機械がスタンドバイ状態であり、各々がキャッシュと関連付けられている際の、初期設定の場合のキャッシュ構成概念400の例示的な実施形態を示す。この実施形態は、特定の状況での制御プレーンプロトコルの特定の実現であるが、しかしながら、本発明は、いかなる特定の実装にも限定されない。この実施形態では、ネットワーク利用可能性がキャッシングメッセージによって改善されている。
【0023】
この実施形態は、ブレードサーバ(図示せず)に関連しているが、しかしながら、本発明は、いかなる特定のハードウェアにも限定されない。ブレードサーバは、サーバブレードとして知られている複数の薄いモジュール式電子回路ボードを内蔵しているサーバシャシーである。各ブレードは、カード上のサーバであり、プロセッサ、メモリ、集積ネットワーク制御装置、および入力/出力(I/O)ポートを含んでいる。ブレードサーバは、個々のブレードとしてネットワークスイッチおよびルータ等の機能の包含を徐々に可能にする。2つのそのようなブレードに関する状態機械(SM)が図4に示されている:ワーカーパケットスイッチ(PS)402に関するワーカー状態機械406と、防護PS404に関する防護状態機械408とである。ワーカー状態機械408が最初に動作状態であり、防護状態機械406が最初にスタンドバイであり、すぐに動作状態になる。プロトコル状態機械の2つのインスタンス(動作状態/スタンドバイ)は、異なるハードウェア(例えば、CPU)上に配置されているが、それでもなお同じネットワークノード内である。
【0024】
この実施形態は、ワーカー状態機械406および防護状態機械404をスパニングツリープロトコル(STP)に関して示しているが、しかしながら、本発明は、いかなる特定のプロトコルにも限定されない。スパニングツリープロトコルは、任意の橋渡しされているネットワークに対してループフリートポロジーを提供する。IEEE標準802.1DはSTPを定義する。ワーカーPS402および防護PS404は、各々、特定の独立ブリッジパーティション(IBP)(例えば、1つのイーサネット(登録商標)スイッチインスタンス)およびタイマ416、412に関するSTP状態機械406、408を含む。ネットワークブリッジ(別名ネットワークスイッチ)は、複数のネットワークセグメント(例えば、パーティション、ドメイン)を接続し、トラフィックを1つのセグメントから他へと転送する。これらの状態機械406、408は、制御プレーンに存在し、ネットワークの残り108の近隣ノード106に送信するメッセージを生成する。
【0025】
この実施形態では、ワーカーキャッシュ410がワーカー状態機械406とネットワーク108との間に介在する。図4は、ワーカー状態機械406が動作状態であり、ネットワーク108に/からメッセージを送信/受信し、ワーカーキャッシュ410にメッセージを記憶している初期状態を示す。ワーカーキャッシュ410は、送信されたメッセージ412と受信されたメッセージ414とを共に記憶する。ブリッジプロトコルデータユニット(BPDU)は、STP情報を搬送するフレームである。スイッチは、ポートそれ自体の固有MACアドレスを送信元アドレスおよびSTPマルチキャストアドレスの宛先アドレスとして使用してBPDUフレームを送信する。ウォームスタンドバイ状態であり、開始の待機をしている防護状態機械408のために、防護キャッシュ418はキャッシュ複製によってワーカーキャッシュ410と同期化されている。
【0026】
図5は、ワーカー状態機械406が動作状態であったが故障を起こし(例えば、ソフトウェア障害)、スタンドバイ状態の防護状態機械408が(スタンドバイ状態から完全な動作に)復旧中であるが、ネットワーク状態は安定している際の中間状態の図4のキャッシュ構成概念400の例示的な実施形態を示す。この中間状態は、ワーカー状態機械406が故障を起こす時間と、防護状態機械408がネットワーク108にサービス供給できる準備ができる(即ち、起動後の開始)時間との間に遅延が存在するために生じる。この中間状態の間、防護キャッシュ418が現在、動作状態のキャッシュであり、図2で説明されたように動作する。
【0027】
図6は、(ワーカーから防護への切替えの後に)防護状態機械408が動作状態であり、ワーカー状態機械がスタンドバイ状態である際の図4のキャッシュ構成概念の例示的な実施形態を示す。図4と図6とを比較すると、図6で示されるシナリオの防護状態機械408は、図4で示されるシナリオのワーカー状態機械406と同様に振舞う、即ち、動作状態の状態機械として振舞う。防護キャッシュ418は、送信されたメッセージ420と受信されたメッセージ422との両方を記憶し、従って、図4で示されたのと同じやり方で動作する。防護状態機械408が動作状態である間、防護キャッシュ418のメッセージがワーカーキャッシュ410に複製される。
【0028】
図7は、図4のワーカー状態機械406、防護状態機械408、および防護キャッシュ418に関しての時系列上の選択された状態移行およびイベントを示すチャートである。(以下の表1は、図7を表形式で説明している。)図7は、防護キャッシュ418が有効状態であり、ネットワーク108の要求に一時的にサービス供給するために使用され得る場合、および防護キャッシュ418が無効状態であり、使用され得ない場合の種々の組み合わせの状態を示す。図7は、種々のシナリオを示す。第1のシナリオはTからTであり、第2はTからTであり、第3はTからT12である。
【0029】
第1のシナリオはTで開始する。Tで、ワーカー状態機械406が動作状態であり、防護状態機械408が同期中状態である場合、防護キャッシュ418は無効状態であり、ワーカーキャッシュ410を複製する。例えば、防護PS404ブレードがネットワーク構成要素に追加されているので、防護状態機械408は最初に同期中状態である。同期がTで完了すると、防護状態機械408が同期中状態からスタンドバイ状態に移行し、防護キャッシュ418は準備完了状態かつ非動作状態である。Tで障害が発生すると、ワーカー状態機械406が動作状態から故障状態に移行し、防護状態機械408がスタンドバイ状態から開始状態(即ち、動作状態の役割を引き継ぐために準備する)に移行し、防護キャッシュ418は準備状態かつ送信状態(即ち、ネットワーク108の要求に一時的にサービスを供給する)である。Tからの時間間隔の間に、ワーカー状態機械406が故障状態から(例えば、再起動の結果として)同期中状態に移行する。正確な時間は、ネットワーク構成要素の予測される挙動に関して問題でない。それらは、実装に依存し、従って、明確に示されていない。Tで、防護状態機械408が開始状態から動作状態に移行し、防護キャッシュ418は更新状態(即ち、動作状態のプロトコル状態機械408との同期を継続することによって受動的な役割をとる)である。Tからの時間間隔の間に、ワーカー状態機械406が同期中状態からスタンドバイ状態に移行する。これが行われた後、Tで、防護状態機械408が動作状態であり、ワーカー状態機械406がスタンドバイ状態である。
【0030】
第2のシナリオはTで開始する。Tで、ワーカー状態機械406が動作状態であり、防護状態機械408が同期中状態であり、防護キャッシュ418が無効状態である。Tで、防護状態機械408が同期中状態からスタンドバイ状態に移行し、防護キャッシュ418は準備完了状態かつ非動作状態である。ネットワーク再構成がTで生じる(例えば、ネットワーク構成要素が故障する)と、ワーカー状態機械406が動作状態から再構成状態に移行し、防護キャッシュ418がTで無効状態になる。TからTの時間間隔の間、ワーカー状態機械406がネットワークの変化状態を処理する。Tで、ネットワークが安定した後、ワーカー状態機械406が再構成状態から動作状態に移行し、防護キャッシュ418が再度、準備完了状態かつ非動作状態になる。
【0031】
第3のシナリオは、Tで開始し、第2のシナリオとイベントの順序が異なっている。Tで、ワーカー状態機械406が動作状態であり、防護状態機械408が同期中状態であり、防護キャッシュ418が無効状態である。ネットワーク再構成がTからT11の時間間隔の間で生じる。T10で、ワーカー状態機械406が動作状態から再構成状態に移行する。T11で、防護状態機械408が同期中状態からスタンドバイ状態に移行する。防護キャッシュ418は、ワーカー状態機械406が再構成状態から動作状態に移行する際のT12で初めて無効状態から準備完了状態、非動作状態に移行する。
【表1】

【0032】
1つの実施形態では、独立のブリッジ部分毎に1つのキャッシュインスタンスが存在する。各独立ブリッジパーティションは、独立した動作および再構成を保障するためにそれ自体のキャッシュ実装を有する。
【0033】
1つの実施形態では、ポート毎に2つのキャッシュエントリが存在する:1つが入力PDUのためのものであり、1つが出力PDUのためのものである。各ポートは、所定のポート状態を有する。ブリッジの状態に応じて、PDUが送信され、受信され、またはその両方がされる。キャッシュは、送信または受信されたPDUを記憶するだけでなく、PDUが送信または受信する必要がないことも記憶する。ポートによっては、PDU送信/受信がネットワーク収束プロセスの間のある時点で停止する、即ち、キャッシュがネットワークの収束の後にだけ充填されることに留意されたい。
【0034】
1つの実施形態では、キャッシュがホットスタンドバイモードに保持される。
【0035】
1つの実施形態では、キャッシュは、それらがPDU生成に関して有効状態であるか否かを示すフラグを搬送する。種々の状況は、キャッシュを無効状態にし得る、例えば、進行中であるネットワーク再構成、スパニングツリーの計算を必要とするプロビジョニング、およびBPDUの変化、その他である。
【0036】
1つの実施形態では、動作状態のPS上のキャッシュは、入力および出力PDUで更新される。
【0037】
1つの実施形態では、スタンドバイ状態のPS上のキャッシュが以下の条件で即座に無効状態にされる:ネットワークに提供されたPDUがキャッシュ内容と異なる場合とPDUがキャッシュ内容と異なる場合。相違は共に、ワーキングスパニングツリー状態機械によってのみ処理され得る、ネットワークの変化を示すことに留意されたい。期限切れPDUのいかなる複製も、顧客トラフィック上への重大な影響およびスパニングツリーの収束をもたらす可能性がある。例えば、ループが生成される可能性がある。動作状態のワーカーPSの場合に、無効状態にされるのは防護(スタンドバイ状態)PS上のキャッシュであることに留意されたい。ワーカーPSが故障を起こし、防護PSがスタンドバイ状態から動作状態に移行している場合、防護PSのキャッシュが無効状態にされる。まさに復旧中のPS上でキャッシュが無効状態にされる場合、全てのポート状態を破棄状態に変更する必要があり得ることに留意されたい。
【0038】
1つの実施形態では、トポロジーが収束した場合にだけ、キャッシュが宣言された有効状態であってよい。収束プロセスの間、動作状態の状態機械が必要である。ネットワーク収束期間の終了は、プロトコル状態機械によって告げられても、または充分に長い安定したネットワーク状態から導出されてもよいことに留意されたい。これは、数秒を越えるPDUの追跡変化を必要とし得る。これは、装置防護スイッチに関してシステム(ネットワーク)が脆弱である時間を付加するが、場合によってはトラフィックに影響を及ぼすネットワーク構成が既に生じた後にだけである。切替え後かつ安定しているネットワークでは、状態機械の復旧後に状態機械から生成されたPDUはキャッシュのPDUと変わらない、即ち、この状況では、両方が有効である場合にトポロジーが収束したとみなされ得ることに留意されたい。キャッシュは動作状態であったが、状態機械から送信された最初のPDUによって非動作状態に設定される。キャッシュが無効状態にされた時間以来、状態機械からのPDUによって、キャッシュの全てのPDUが少なくとも一度は更新されている。
【0039】
1つの実施形態では、スタンドバイ状態のPSが完全に同期化されている場合にキャッシュが宣言された有効状態であり得る。
【0040】
1つの実施形態では、キャッシュからのPDU生成を引き起こすタイマが存在する。防護PS状態が動作状態に変化する場合、有効状態にフラグが立てられているキャッシュからPDUが送信される。この目的を達成するために、適切な繰り返しタイマ(および許容期間にわたる分布)が開始される。キャッシュが有効状態にフラグが立てられているならば、PDUがキャッシュから生成される状態は、動作状態から開始する。それは、異なるPDUがネットワークから受信されるか、または状態機械が完全に復旧すると終了する。これは、状態機械がネットワークにPDUを送信し始める事実によって認識可能である。状態機械は、必要な時間間隔で残りのPDUを全て送信することが可能であるので、最初のPDUがキャッシュ動作を停止するためのトリガとして使用され得る。
【0041】
図8は、分散型キャッシュの例示的な実施形態である。この例は、システムに対する単一のメッセージキャッシュとは対照的に、システム内でメッセージキャッシュがどのように分散され得るかを示す。この例では、周期的メッセージキャッシュ810が2つの入力/出力(I/O)パック802に分散されている。I/Oパックの数は、勿論、2つに制限されない。各I/Oパック802はパケット転送ハードウェア810およびボード制御装置808を含む。ローカルノード804は、パケット転送ハードウェア812および1つまたは複数の中央パケット制御プレーンプロセッサ814を含む。中央パケット制御プレーンプロセッサ814は、I/Oパック802のボード制御装置808上の周期的メッセージキャッシュ810に更新を送信する。周期的メッセージキャッシュ810は、I/Oパック802のパケット転送ハードウェア810を介して外向き周期的メッセージを送信する。このやり方で、制御プレーン状態機械が利用不可能または故障している際に、周期的メッセージキャッシュ810が制御プレーンプロトコルを擬態する。アプリケーションプロトコルは、(R)STP、GVRP、RSVP、開放型最短経路優先(OSPF)、中間システムから中間システム(IS−ISまたはISIS)、Y.1711、FFD、その他等の、一定の内容を備えた周期的外向きメッセージを有するあらゆるプロトコルを含む。当然、メッセージキャッシュは多数の異なるシステムアーキテクチャに対する多数のその他のやり方で広範に実装され得る。例えば、メッセージキャッシュは、複数のハードウェアブレード上、複数のコンピュータ処理ユニット(CPU)上、1つのCPU内の複数のスレッド上、FPGA、ASIC等に存在してよい。
【0042】
本発明の実施形態は、ネットワークシステムの1つまたは複数のコンピュータで実装され得る。各コンピュータは、プロセッサと、種々のプログラムおよびデータを記憶するメモリとを含む。メモリは、さらにプログラムをサポートするオペレーティングシステムを記憶し得る。プロセッサは、電源、クロック回路、キャッシュメモリ、および同等物ならびにメモリに記憶されているソフトウェアルーチンの実行を支援する回路等の従来式のサポート回路と協働し得る。そのようにして、ソフトウェア方法として本明細書で議論されたステップのいくつかが例えば、種々の方法ステップを実行するプロセッサと協働する回路としてハードウェア内で実装され得ることが意図されている。コンピュータは、コンピュータと通信する種々の機能的構成要素の間のインターフェースを形成する入力/出力(I/O)回路を同様に含む。本発明の実施形態は、ハードウェアまたはファームウェアに、例えば、FPGAまたはASICに同様に実装され得る。
【0043】
本発明は、コンピュータによって処理されると、コンピュータ命令が、本発明の方法および/または技術が呼び出されるかまたはそれ以外で提供されるように、コンピュータの動作を適応させる、コンピュータプログラム製品として実装され得る。本発明の方法を呼び出す命令は、固定式もしくは取り外し可能な媒体に記憶されていてもよいし、ブロードキャスト媒体もしくは他の信号担持媒体のデータストリームを介して送信されてもよいし、および/または命令に従って動作するコンピューティングデバイス内のワーキングメモリ内に記憶されていてもよい。
【0044】
前述の事項は、本発明の種々の実施形態に向けられているが、他およびさらなる本発明の実施形態が、それらの基本的な範疇から逸脱することなしに考案され得る。そのようにして、本発明の適切な範疇は、以下の特許請求の範囲により決定される。

【特許請求の範囲】
【請求項1】
ローカルノード機能停止の間の無中断ネットワーク制御メッセージ生成を提供する方法であって、
プロトコル状態機械からの複数の送信メッセージを受信するステップと、
送信メッセージをネットワークの複数のノードに転送するステップと、
ノードから複数の受信メッセージを受信するステップと、
送信メッセージおよび受信メッセージをバッファに記憶するステップと、
プロトコル状態機械の障害が発生すると、バッファが有効状態のままである限り、ノードにメッセージを送信し、ノードからメッセージを受信するステップとを含む、方法。
【請求項2】
メッセージがノードに周期的に送信される、請求項1に記載の方法。
【請求項3】
バッファの送信メッセージおよび受信メッセージと、障害の後にノードから受信されるメッセージとに基づいてバッファが有効状態であるか否かを決定するステップをさらに含む、請求項1に記載の方法。
【請求項4】
プロトコル状態機械の障害が発生すると、スタンドバイ状態のプロトコル状態機械を切り替えるステップをさらに含み、スタンドバイ状態のプロトコル状態機械が、送信メッセージおよび受信メッセージの複製を含む別のバッファを含む、請求項1に記載の方法。
【請求項5】
ローカルノード機能停止の間の無中断ネットワーク制御メッセージ生成を提供するシステムであって、
複数のメッセージを生成するプロトコル状態機械と、
プロトコル状態機械からメッセージを受信し、それらをネットワークの複数のノードに転送するメッセージキャッシュであって、少なくとも1つのバッファに、ノードに送信されたメッセージおよびノードから受信されたメッセージの両方を記憶する、メッセージキャッシュとを含み、
プロトコル状態機械の障害が発生すると、メッセージキャッシュが有効状態のままである限り、メッセージキャッシュがノードにメッセージを送信し、およびノードからメッセージを受信する、システム。
【請求項6】
メッセージキャッシュが、ノードに周期的メッセージを送信するためのタイマを含む、請求項5に記載のシステム。
【請求項7】
メッセージキャッシュが、メッセージキャッシュが有効状態であるか否かを決定する状態制御装置を含む、請求項5に記載のシステム。
【請求項8】
プロトコル状態機械がワーカープロトコル状態機械であり、メッセージキャッシュがワーカーメッセージキャッシュであり、ワーカーノードがワーカープロトコル状態機械およびワーカーメッセージキャッシュを含み、
防護プロトコル状態機械および防護メッセージキャッシュを含む防護ノードをさらに含み、
ワーカープロトコル状態機械の障害が発生すると、防護状態機械が動作状態になることが可能である、請求項7に記載のシステム。
【請求項9】
ワーカープロトコル状態機械が動作状態である間、防護メッセージキャッシュがワーカーメッセージキャッシュを複製する、請求項7に記載のシステム。
【請求項10】
ローカルノード機能停止の間の無中断ネットワーク制御メッセージ生成を提供する方法を実行する命令を記憶するコンピュータ可読媒体であって、方法が、
プロトコル状態機械からの複数の送信メッセージを受信するステップと、
送信メッセージをネットワークの複数のノードに転送するステップと、
ノードから複数の受信メッセージを受信するステップと、
送信メッセージおよび受信メッセージをバッファに記憶するステップと、
プロトコル状態機械の障害が発生すると、メッセージキャッシュが有効状態のままである限り、ノードにメッセージを送信し、ノードからメッセージを受信するステップとを含む、コンピュータ可読媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2009−539305(P2009−539305A)
【公表日】平成21年11月12日(2009.11.12)
【国際特許分類】
【出願番号】特願2009−513106(P2009−513106)
【出願日】平成18年5月30日(2006.5.30)
【国際出願番号】PCT/US2006/020681
【国際公開番号】WO2007/139542
【国際公開日】平成19年12月6日(2007.12.6)
【出願人】(596092698)アルカテル−ルーセント ユーエスエー インコーポレーテッド (965)
【Fターム(参考)】