説明

構成変更可能な配備プラットホームを使用した処理リソースの障害回復

構成変更可能な配備プラットホームを使用した処理リソースの障害回復ためのシステムと方法。プライマリサイトが、処理リソース構成を有する。このプライマリサイトの処理リソース構成の仕様が、生成される。この仕様は、ソフトウェアコマンドに応答して処理エリアネットワークを配備することが可能な構成変更可能な処理プラットホームを有する障害迂回サイトに提供される。この仕様を使用して、ソフトウェアコマンドが構成変更可能なプラットホームに生成され、仕様に対応する処理エリアネットワークを配備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、企業用のコンピューティングシステムに関し、より詳しくは、障害回復システムおよび再構成可能な仮想処理システムのための技術に関する。
【背景技術】
【0002】
図3は、従来の障害回復システムを示す。記憶設備302は第1の位置に位置し、かつ、記憶設備304は、一般的に第1の位置からリモートの第2の位置に位置する。設備302はプライマリシステムとみなすことができ、設備304は二次または障害迂回サイトとみなすことができる。各設備は、関連するデータの同一のコピーを、例えばそれらのそれぞれの記憶設備上に有する。プライマリ側のデータの任意の所望の最新情報は、例えば通信経路306経由で、また、二次側にも送信される。このように、プライマリおよび二次側設備は、同一のデータのコピーを保持することができる。
【0003】
ハリケーンなどの障害がプライマリサイトで起こった場合、コンピュータ操作は二次側サイトに障害迂回することができる。二次側サイトは、このような障害迂回要求を処理するために待機しているホストコンピュータ308を有し、かつ、必要なアプリケーション(例えばプライマリホスト310上で実行されるもの)が予め設定されている。そのホスト308を含む二次側サイトは、次いでプライマリ側によって処理されていた企業のコンピュータ操作を取り扱うことができる。プライマリサイトが回復した場合、操作は必要に応じてプライマリサイトに戻すことができる。
【0004】
図4は、例示的な、複数層のアプリケーショントポロジを示す。例えばそこからの様々な要求を受信するために、ファイアウォール402はインターネットに対するインタフェースとして働く。ファイアウォール402は、全体のシステム上の処理負荷を多数の処理ノードの中に分散することを試みるロードバランサ404と通信する。例えば、ロードバランサは、多数のウェブサーバ406aから406nの中に要求を分散することができる。各ウェブサーバ406は、次に、それが受信するタスクのいくつかの解析を実行することができ、かつ適切なアプリケーションサーバ408aから408nを起動することができる。各アプリケーションサーバ408は、次にデータベースまたはファイルサーバ410aから410nと対話することができる。各々の様々な構成要素は、単独でそれぞれの処理ノードまたはサーバノードを実行することができる。
【発明の開示】
【発明が解決しようとする課題】
【0005】
図4によって示唆されるように、最新の複数層のアプリケーショントポロジは非常に複雑になり得る。複雑化に加えて、(図4内に示されないが)様々なハブ、スイッチ、配線などが、示された処理ネットワークを生成するのに必要である。さらに、ソフトウェアの様々なバージョンが実行されている可能性がある。
【0006】
現在まで相当多量の専門技術が、障害回復への対処においてデータの複製に特別の重点を置いて開発されてきた。プロセッサ側の問題は、適切な注目を受けてこなかった。
【0007】
現在まで、障害回復のプロセッサ側の状況は、主に、二次側サイト上の処理リソースをプライマリ側サイト上の処理リソースと同一にし、スタンバイモードで待機することを要求することによって、処理されてきた。複数層のアーキテクチャの複雑さによって示唆されるように、これは複雑でかつ費用がかかる。さらに、最新のプロセッサネットワークは、様々な理由のためにしばしば変更される。このようなネットワークがプライマリ側サイトネットワークである場合、その時、この変更はまた二次側にも実行される必要があり、さもなければ、企業は、その障害回復システムが期待通りに機能しないという危険を冒すことになる。
【0008】
プロセッサ資源の配備を容易にするプラットホームが、最近構築された。例えば、Egenera社は、Egenera Bladeframeプラットホームを提供した。処理エリアネットワークがソフトウェア構成コマンドの制御の下で素早く配備され得るように、このプラットホームは適応性が高い内部アーキテクチャ(詳細後述)を有する。このようなシステムの例示的なアーキテクチャが、2002年1月4日出願、2002年10月24日公開の、米国特許出願第10/038354号、名称「仮想ネットワークにおけるアドレス解決プロトコルシステム及び方法(Address Resolution Protocol System and Method in a Virtual Network)」に記載されている。なお、引用することによりその全てを本出願に含める。
【課題を解決するための手段】
【0009】
本発明は、構成変更可能な配備プラットホームを使用した処理リソースの障害回復のためのシステム及び方法を提供する。
【0010】
本発明の一態様においては、プライマリサイトは、処理リソースのある構成を有する。本発明のこの態様においては、プライマリサイトの処理リソースのある構成についての仕様が、生成される。この仕様は、ソフトウェアコマンドに応答して処理エリアネットワークを配備することが可能な、構成変更可能な処理プラットホームを有する障害迂回サイトに与えられる。この仕様を使用して、ソフトウェアコマンドが、この仕様に対応する処理リソースを配備するために、構成変更可能なプラットホームに生成される。
【0011】
本発明の別の態様においては、障害迂回サイトの構成変更可能な処理プラットホームと互換性がある構成変更可能な処理プラットホーム上に、プライマリサイトの処理リソースは配備される。
【0012】
本発明の別の態様においては、ある仕様がプライマリサイトの処理リソースの構成を記述するために生成され、かつ、その仕様はプライマリサイトの構成変更可能な処理プラットホームに特有の構成状態を含む。
【0013】
本発明の別の態様においては、少なくとも一つの他のサイトは処理リソースを含み、かつ、ある仕様がこの少なくとも一つの他のサイトの処理リソースの構成を記述するために生成される。この少なくとも一つの他のサイトの処理リソースの構成の仕様は障害迂回サイトに提供され、かつ、この仕様のうちの少なくとも一つは構成変更可能なプラットホームにソフトウェアコマンドを生成するために使用されて、この一つの仕様に対応する処理エリアネットワークを配備する。
【0014】
本発明の別の態様においては、プライマリサイトの処理リソースは複数の独立の処理エリアネットワークを含み、かつ、この仕様はこの複数の独立の処理エリアネットワークの下位集団だけを記述する。
【0015】
本発明の別の態様においては、プライマリサイトの処理リソースは、複数の独立の処理エリアネットワークを含み、かつ、この仕様は独立の処理エリアネットワークの全てを記述する。
【0016】
本発明の別の態様においては、処理リソースを配備するコマンドを生成するための仕様を使用することは、障害迂回状況の受信に応答してなされる。
【0017】
本発明の別の態様においては、この仕様はプライマリサイトの最小構成または処理リソースを記述する。
【発明を実施するための最良の形態】
【0018】
本発明の好ましい実施態様は、処理リソースの二次的障害迂回サイトへの効率的な障害迂回を可能にするシステムおよび方法を提供する。プライマリサイトの処理リソースおよび構成は、規定された変数のセットを有する仕様で特徴づけられ、かつ、この仕様は安全な方法で格納されている。リソースを特徴づける情報のセット(すなわちリソースの「特性」)は、プライマリサイトの処理エリアネットワーク(PANs)の数、このようなPANの各々に対して割り当てられるべきノードの数、プロセッサ間のネットワーク接続、記憶装置マッピングなどのような情報を含む(詳細後述)。この障害迂回サイトは、ソフトウェアコマンドに応答して配備される(またはインスタンス化される)1つ以上の独立の処理ネットワークを可能にするソフトウェアで構成変更可能なプラットホームを使用する。例えば、ある実施態様は、上記で確認され参照によって取り込まれた米国特許出願内に記載されているプラットホームを使用することができる。この構成仕様は、構成変更可能なプラットホーム上の一組のコマンドを発行するためにアクセスされ使用されて、仕様と一致した障害迂回サイト上の処理リソースをインスタンス化する。
【0019】
上記のアプローチを使用して、障害迂回処理リソースは、障害または他の障害迂回状況に応答してすばやく配備され得る(またはインスタンス化され得る)。いくつかの実施態様では、障害迂回サイトにおける配備は、あらゆる障害迂回状況または障害に先立って実行され得る。これらの状況では、障害迂回リソースは、プライマリサイトに関連してインスタンス化されてスタンバイモードに効果的に保たれる。プライマリサイトの処理リソースに対するあらゆる変更が障害迂回サイトにすばやく、正確におよび確実に移行され得るという点で、これらの実施態様は利益になる。このようにして、障害迂回サイトがプライマリサイトの処理リソースをよりすばやく、かつ人為ミスに影響されにくい方法でミラーリングすることができる。例えば、企業は様々な職員にプライマリサイトの構成を理解させ、かつ、リソースの物理的配備のために必要な様々な配線などを含めて、リモートサイトでこのような構成を再現させる必要がない。
【0020】
(例示的なシステムアーキテクチャおよび方法)
図5は、本発明のある実施態様による例示的なシステムアーキテクチャを示す。このシステムは、プライマリサイトの処理リソース510、二次サイトの構成変更可能なプラットホーム520、記憶エリアネットワークまたは類似した記憶システム530(好ましくは障害回復機能を有する地理的に分散された記憶装置を含む)、および(企業の障害回復モデルと一致した)安全な方法でSAN530に格納されるべき構成仕様540を含む。
【0021】
プライマリサイトは、例えば図4内に示すように、1つ以上のPANを有することができる。ネットワークは、物理的に配線され、相互結線され、かつ電力を供給された様々なタイプのサーバによって、従来通り配備されてもよい。しかし、好適な実施態様は、例えば、Egenera社のBladeFrameプラットホームを含む、上記で確認され、参照によって取り込まれた米国特許出願内に記載されているような、構成変更可能なプラットホーム上でこのようなPANを実現するであろう。
【0022】
プライマリサイトのリソース510の特性は、構成仕様540で特徴づけられ、特定される(詳細後述)。仕様540は、プライマリサイトの処理リソース510を適切に記述するために必要な情報を含む。仕様は、安全な方法でSAN530に格納される。例えば、それは定期的にSANに保存され得る。代わりに、それはSAN等上のリモートにミラーリングされる配置内に格納され得る。このような仕様を格納するための実際の機構は、このアプローチが好ましくは企業の障害回復モデルと一致しているべきであること以外、主として好適な実施態様とは無関係である。
【0023】
仕様540は、プライマリサイトの処理リソースの全セットを特徴づけることができる。代わりに、この仕様はプライマリサイトのあるPANだけ、クラスタだけまたはパーティションだけを特徴づける場合がある。
【0024】
さらに、この仕様はプライマリサイトの実際の処理リソースを正確に記述するために使用され得る。代わりに、この仕様は、障害迂回操作に十分なことを期待されているリソースの、異なるが充分なセット(例えばおそらく、操作をサポートするのに必要な最小構成)を記述するために使用され得る。
【0025】
特定された実際の情報は、構成変更可能なプラットホームの機能およびプライマリリソースのプラットホームに依存する(すなわち、それが従来通りに配備されるかまたは、それが構成変更可能なプラットホームに配備されるか)。ある実施態様は、プライマリサイトの構成を特定するために所定のフォーマットで(例えば、データにタグを付けるためにXMLを使用して)、変数の所定のセットを格納する。
【0026】
仕様530は、障害迂回サイトの処理リソースをインスタンスするためにアクセスされ使用される。具体的には、適切なソフトウェアコマンドによる構成変更可能なプラットホーム520は、仕様530における記述と一致したPANをインスタンス化する。いくつかの実施態様では、このインスタンス化は、例えば仕様を構文解析し、かつ障害迂回サイトのリソースを配備する(または、インスタンス化する)ために必要なソフトウェア構成コマンドを作成することを自動化され得る。他の実施態様では、ツール(図示せず)がこの仕様を検証するために使用されるが、実際のインスタンス化はIT管理者の助けを借りて実行される。いくつかの局面では、配備が(多くの形式で通信され得る)障害または障害迂回状況に応答してなされ得る。他の局面では、配備はあらゆる障害または障害迂回状況に先立って実行され得る。
【0027】
ある好ましい実施例において、プライマリリソース510は、プラットホーム520と互換性がある(が、必ずしも同一でない)構成変更可能なプラットホーム上に配備される。これらの配置では、仕様は配備を容易にするためにより特有な情報を含む場合がある。例えば仕様は、様々なPANをエミュレートするためにプライマリ側で使用され、かつ使用される構成変更可能なプラットホームの一般タイプに特有な、ある情報を含む場合がある。このように、この情報を二次側で再現するかまたは生成する必要が無いので、障害迂回の配備は、よりすばやくなし得る。対照的に、プライマリ側で従来の配置(すなわち、物理的ネットワーキング、配線などを伴う)を使用する配置に対して、仕様は、本来はより一般的であり、エミュレーションに特有の情報またはプラットホームに特有の情報は含まないであろう。
【0028】
図6は、本発明のある実施態様による別の配置を示す。この配置では、上記したものに類似している構成変更可能なプラットホーム620を有する障害迂回サイトがさらにある。しかし、この障害迂回サイトは、様々なタイプの複数の生産サイトと連動して使用され得る。このように、障害迂回アーキテクチャが、N生産サイトを有する処理リソースのN+1配置、および障害または障害迂回状況を取り扱うために使用される1つの障害迂回サイトを効果的に作成する。
【0029】
さらに、障害迂回サイトが、障害迂回状況または障害に先立って必ずしも充分なリソースを割り当てる必要があるというわけではない。それよりも、障害迂回状況または障害に応答して、障害迂回サイトは処理リソースを、指定されたようにインスタンス化し得る。好適な構成変更可能なプラットホーム520は、例えば、プラットホーム上でタスクを実行中の優先度の低いPANを遮断し、かつ、障害迂回をサポートするためにインスタンス化すべき優先度の高いPANをインスタンス化し得るスケジューリングロジックを含む。
【0030】
代わりに、最小構成はあらゆる障害迂回状況に先立ってインスタンス化されることができ、および障害迂回に際し、スケジューリングロジックは、仕様540を参照することができ、かつ、より多くのリソースが、PAN用のより良いサーバを提供するために追加され、配備され得るどうかを決定することができる。
【0031】
(PANを配備するための例示的な構成変更可能なプラットホームの概要)
上で概説されたように、好適な実施態様は構成変更可能なプラットホーム520を、障害回復サイトのPANを配備するために利用する。好ましくは、これらのプラットホームは、前記組み込まれた米国特許出願に記載されたような、および/またはEgenera社のBladeFrameプラットホームのようなものである。さらに、好適な実施態様はまた、プライマリサイトの構成変更可能なプラットホームをも利用する。
【0032】
要するに、好適なプラットホームは、ソフトウェアコマンドに応答して独立のPANをエミュレートするために割当られ、かつ構成され得るリソースの集団を提供する。コマンドは、例えば割り当てられるべき処理ノードの数、それらのネットワーク接続、それらの記憶装置特性などを記述する。様々なネットワーキング、配線、電源などが効果的にエミュレートされ、およびしたがって(従来のアプローチの複雑なおよび遅い物理的配備と対照的に)処理ネットワークのすばやいインスタンス化を可能にする。
【0033】
図1は、本発明の好ましい実施態様に対する例示的なプラットホームを示す。下記で概説され、かつ組み込まれた特許出願内に更に詳細に記載されているように、好適なプラットホームは仮想システムが構成コマンドによって配備され得るシステム、方法およびロジックを提供する。このプラットホームは、大きなプロセッサ集団を提供し、そこからソフトウェアコマンドを介して下位集団が選択されて、所与の一組のアプリケーションまたは顧客に貢献するように配備されうる、コンピュータ(「処理エリアネットワーク」または「プロセッサクラスタ」)の仮想ネットワークが形成される。次いで、この仮想化された処理エリアネットワーク(PAN)は、図2A−C内にハイレベルで示したような、ウエブベースのサーバアプリケーションのような特定顧客向けアプリケーションを実行するために使用され得る。この仮想化は、ローカルエリアネットワーク(LAN)の仮想化または入出力記憶装置の仮想化を含み得る。このようなプラットホームを提供することによって、処理リソースは、例えば物理的にサーバを供給し、ネットワークおよび記憶装置の結線を行い各々のサーバに電源を提供するなどよりも、むしろ管理者から構成コマンドによってソフトウェア経由ですばやくかつ容易に配備され得る。
【0034】
図1に示されるように、好適なハードウェアプラットホーム100は、高速相互結線110a,b経由でスイッチ構造115a,bに接続される一組の処理ノード105aから105nを含む。このスイッチ構造115a,bは、また、外部IPネットワーク125(または他のデータ通信ネットワーク)、および記憶領域ネットワーク(SAN)130との通信経路にある少なくとも1つの制御ノード120a,bにも接続されている。例えば、リモートでタスクを実行する管理アプリケーション135は、プラットホーム100を構成して仮想PANを配備するのを助けるために、IPネットワーク125経由で制御ノードの1つ以上にアクセスし得る。
【0035】
ある実施態様においては、約24の処理ノード105aから105n、2つの制御ノード120、および2つのスイッチ構造115a,bが、単一シャーシ内に収容され、2地点間(PtP)リンクの固定された、事前配線済みの回路網と相互結線されている。各処理ノード105は、特に、ブートおよび初期化のためのなんらかのBIOSファームウェアを含む1台以上(例えば4台)のプロセッサ106jから106l、1台以上のネットワークインターフェイスカード(NICs)107、およびローカルメモリ(例えば4Gバイトを超える)を含むボードである。プロセッサ106用のローカルディスクはないが、その代わりに、一斉呼出に必要な記憶装置を含んで、全ての記憶装置は、SAN記憶装置130によって取り扱われる。
【0036】
各制御ノード120は、1台以上(例えば4台)のプロセッサ、ローカルメモリ、処理ノード105用および制御ノード106用のオペレーティングシステムソフトウェアをブートするために使用される、ブートイメージおよび初期のファイルシステムの独立のコピーを保持するローカル磁気ディスク装置、を含む単一ボードである。各制御ノードは、ファイバーチャンネルリンク122,124に接続された100メガバイト/秒のファイバーチャンネルアダプターカード128経由でSAN130と通信し、かつ、ギガビットイーサネット(登録商標)リンク121,123に接続された1つ以上のギガビットイーサネット(登録商標)NICを有する外部ネットワークインターフェース129経由で、インターネット(または他の外部ネットワーク)125と通信する。(多くの他の技術およびハードウェアが、SANおよび外部ネットワーク接続のために使用され得る。)各制御ノードは、管理アプリケーション135によってリモートでウエブベースの管理の代わりに使用され得る専用の管理ポートとして、低速イーサネット(登録商標)ポート(図示されず)を含む。
【0037】
このスイッチ構造は、NIC−CLAN1000およびclan5300スイッチ等の1つ以上の30−ポートGiganetスイッチ115から構成され、様々な処理ノードおよび制御ノードは、このような構造モジュールとの通信用に対応するNICを使用する。Giganetスイッチ構造は、非同報通信多元接続(NBMA)ネットワークのセマンティックスを有する。全てのノード間通信は、スイッチ構造経由である。各リンクは、NIC107とスイッチ構造115内のポートとの間で直列接続として形成される。各リンクは、112メガバイト/秒で動作する。
【0038】
いくつかの実施態様では、複数のキャビネットまたはシャーシは、より大きなプラットホームを形成するために互いに接続され得る。および、他の実施態様では、構成は異なる場合があり、例えば、冗長な接続、スイッチおよび制御ノードは、除去される場合がある。
【0039】
ソフトウェア管理の下で、プラットホームは複数の、同時および独立の処理エリアネットワーク(PANs)をサポートする。ソフトウェアコマンドによって、各PANは、PtP網にわたってエミュレートされる仮想ローカルエリアネットワーク経由で通信するプロセッサ106の対応するサブセットを有するように構成される。各PANは、また、対応する仮想I/Oサブシステムを有するように構成される。PANを確立するためには、物理的配備または配線は必要ない。ある好適な実施態様の下で、プロセッサノードおよび/または制御ノード上でタスクを実行するソフトウェアロジックは、交換イーサネット(登録商標)セマンティックスをエミュレートする。プロセッサノードおよび/または制御ノード上でタスクを実行する他のソフトウェアロジックは、SCSIセマンティックスに従い、かつ、各PAN用の独立のI/Oアドレス空間を提供する仮想記憶サブシステム機能を提供する。
【0040】
ある好ましい実施態様は、管理者が、仮想コンポーネント、インタフェースおよび接続を使用して、仮想的な、エミュレートされたLANを構築するのを可能にする。各仮想LANは、プラットホーム100に対して内部的かつ専用であり得るし、または、複数のプロセッサが、外部から単一IPアドレスとして見えるプロセッサクラスタに形成される場合もある。
【0041】
ある実施態様の下で、物理的、基礎的なネットワークはPtP網であるが、そのように構築された仮想ネットワークは、交換イーサネット(登録商標)ネットワークをエミュレートする。仮想ネットワークはIEEE MACアドレスを利用し、また、処理ノードはMACアドレスとIPアドレスを結び付け、関連付けるためにIETF ARP処理をサポートする。従って、所与のプロセッサノードは、ARP要求が、プラットホームの内部ノードからまたは外部ノードから来たかどうかを、ARP要求に一貫して応答する。
【0042】
図2Aは、モデル化されるか、またはエミュレートされ得る例示的なネットワーク配置を示す。第1のサブネット202は、スイッチ206経由でお互いに通信し得る処理ノードPN1、PN2およびPNkによって形成される。第2のサブネット204は、スイッチ208経由でお互いに通信する処理ノードPNkおよびPNmによって形成される。交換イーサネット(登録商標)セマンティックスの下で、サブネット上の1つのノードは、そのサブネット上の別のノードと直接通信する場合があり、例えば、PN1はメッセージをPN2に送信する場合がある。このセマンティックスによって、また、あるノードが他のノードの組と通信することも可能になり、例えば、PN1は同報通信メッセージを他のノードに送信する場合もある。PNmが異なるサブネット上にあるので、処理ノードPN1およびPN2は直接PNmと通信することはできない。PN1およびPN2にとって、PNmと通信するために、両方のサブネットについてのより完全な理解を有する上位レイヤのネットワークソフトウェアが利用される必要があるであろう。図内に示されていないが、所与のスイッチは別のスイッチ等へ「アップリンク」経由で通信することができる。以下の記述で明らかなように、このようなアップリンクの必要性はスイッチが物理的な場合には必要性が異なる。具体的には、スイッチが仮想的でありソフトウェア内でモデル化されているので、それらは、必要に応じて広く水平に拡大することができる。(対照的に、物理的スイッチは固定数の物理的ポートを有し、時には、水平スケーラビリティを提供するためにアップリンクが必要である。)
【0043】
図2Bは、図2Aのサブネット202および204をモデル化するために、ある実施態様の下で使用される例示的なソフトウェア通信経路およびロジックを示す。通信経路212は処理ノードPN1、PN2、PNkおよびPNm、特にそれらの対応するプロセッサ側のネットワーク通信ロジック210を接続し、またさらに、それらは処理ノードを制御ノードに接続する。(明確化のためにロジックの単一インスタンスとして描画されているが、PNkは対応するプロセッサロジックの複数のインスタンス、例えば1つのサブネットにつき1つを有する場合がある。)好適な実施態様の下で、管理ロジックおよび制御ノードロジックは、通信経路を確立し、管理し、かつ破棄する責任がある。個々の処理ノードは、このような経路を確立することは許されない。
【0044】
以下に詳細に説明されるように、プロセッサロジックおよび制御ノードロジックは共に、このような通信経路上の交換イーサネット(登録商標)セマンティックスをエミュレートする。例えば、制御ノードはイーサネット(登録商標)スイッチのセマンティックスのいくつか(全てが必要ではないが)をエミュレートするために制御ノード側の仮想スイッチロジック214を有し、および、プロセッサロジックは、イーサネット(登録商標)ドライバのセマンティックスのいくつか(全てが必要ではないが)をエミュレートするためのロジックを含む。
【0045】
サブネット内では、1つのプロセッサノードが、対応する仮想インタフェース212経由で、別のプロセッサノードと直接通信することがある。同様に、あるプロセッサノードが別の仮想インタフェース経由で制御ノードロジックと通信することがある。ある実施態様の下で、根元的なスイッチ構造および関連するロジック(例えば、スイッチ構造管理者ロジック、図示されず)は、2地点間回線網上でこのような仮想インタフェース(VIs)を確立し管理するための能力を提供する。さらに、これらの仮想インタフェースは、信頼性が高い、冗長な方法で確立され、本明細書内でRVIsと呼ばれる。この記述における局面では、VI対RVI間の選択が、システムリソースとしてかけた費用と、このシステムによって要求される信頼性の量に大きく依存するので、仮想インタフェース(VI)および高信頼性仮想インタフェース(RVI)という用語は、相互互換的に使用される。
【0046】
図2A−Bを結合して参照すると、ノードPN1がノードPN2と通信するはずである場合、それは仮想インタフェース2121-2によって、ごく普通に行われる。しかし、好ましい実施態様は、例えばVI2121-2が満足に動作していない場合、PN1とPN2間の通信が、スイッチエミュレーションロジック経由で発生することを可能にする。この場合、メッセージはVI2121-swith206経由でおよびVI212swith206-2経由で送信され得る。PN1がサブネット202内の他のノードへのメッセージを同報通信またはマルチキャストするべき場合には、そのメッセージを仮想インタフェース2121-swith206経由で制御ノード側ロジック214に送信することによりそうする。制御ノード側ロジック214は、次いで、関連するVIsを使用して、他の関連するノードにメッセージのクローンを作って送信することによって、同報通信またはマルチキャスト機能をエミュレートする。同じまたは類似したVIsは、制御ノード側ロジックを要求する他のメッセージを伝達するために使用されてもよい。例えば、以下に記載するように、制御ノード側ロジックはアドレス解決プロトコル(ARP)をサポートするロジックを含み、かつ、VIはARP応答および要求を制御ノードに伝達するために使用される。上記の記述はプロセッサロジックと制御ロジックとの間にただ1つのVIを示唆しているが、多くの実施態様は、複数のこのような接続を使用している。さらに、図はソフトウェア通信経路内の対称性を示唆しているが、そのアーキテクチャは実際のところ非対称通信を可能にしている。例えば、クラスタ通信サービスについては、後述するように、パケットは制御ノード経由で送られるであろう。しかし、戻り通信は、ノード間で直接である場合がある。
【0047】
図2Aのネットワークのように、ノードPN2とPNmの間には通信機構がないことに注目すべきである。さらに、通信経路が中心に(処理ノード経由ではなく)管理され作成されていることによって、このような経路は処理ノードによって作成可能ではなく、また、その規定されたサブネットの接続はプロセッサによって破られない。
【0048】
図2Cは、図2A、および、Bのサブネットを実現するための、ある実施態様の例示的な物理的接続を示す。具体的には、処理ネットワークロジック210の各インスタンスは、相互結線110のPtPリンク216経由でスイッチ構造115と通信する。同様に、制御ノードはスイッチロジック214の複数のインスタンスを有し、および、各々はスイッチ構造に対してPtP結線216上で通信する。図2Bの仮想インタフェースは、下記で更に記述されるように、これらの物理的なリンクにわたって情報を伝達するためのロジックを含む。
【0049】
このようなネットワークを作成し、構成するために、管理者は、PANのネットワークトポロジを規定し、(例えば、管理ソフトウェア135内のユーティリティ経由で)様々なノードのMACアドレス割当てを指定する。MACアドレスは、仮想的であり、仮想インタフェースを識別して、および、いかなる特定の物理的なノードにも結び付けられない。ある実施態様の下で、MACアドレスは、IEEE48ビットアドレスフォーマットに従うが、しかし、その内容は、「ローカルに処理された」ビット(1に設定)、仮想インタフェースが、最初に規定された(詳細は下記)制御ノード120のシリアル番号、および、制御ノードにおいてNVRAM内に保持される制御ノード上の持続性の逐次カウンタのカウンタ値を含む。これらのMACは、レイヤ2レベルでノードを(在来型として)識別するために使用されるであろう。例えば、ARP要求(PANの内部のノードからか、または外部ネットワーク上のノードからか)に応答する際に、これらのMACは、ARP応答内に含まれるであろう。
【0050】
制御ノード側のネットワークロジックは、LANの接続を反映する情報(例えば、どのノードが他のノードと通信するか)を含むデータ構造を保持する。制御ノードロジックは、また、規定されたMACアドレスにVI(またはRVI)マッピングを割り付けて、割り当て、制御ノード間で、および、制御ノードと処理ノード間でVIまたは(RVI)を割り付けて、割り当てる。図2Aの例では、ロジックは図2BのVIs212を割り付けて、割り当てるであろう。(いくつかの実施態様中のVIおよびRVIの命名は、使用されたスイッチ構造およびスイッチ構造管理者ロジックの結果である。)
【0051】
各プロセッサが立ち上がる時に、BIOSベースのブートロジックがノード105の各プロセッサ106を初期化し、かつ、特に制御ノードロジックに対してVI212を確立する(または発見する)。次いで、プロセッサノードは、制御ノードから、プロセッサノードのMACアドレスのような関連データリンク情報、および同じデータリンク構成内の他の機器のMAC認証を得る。その後各プロセッサは制御ノードを備えたそのIPアドレスを登録し、その際、それはノードおよびRVI(例えば登録が到着したRVI)にIPアドレスを結び付ける。このように、制御ノードはサブネット上の各ノードに対する個々の仮想MAC用のIPアドレスを結び付けることが可能であろう。上記のものに加えて、プロセッサノードはまた、他のノードへの、または制御ノードネットワークロジックへのその接続に対するRVIまたはVI関連の情報も得る。
【0052】
したがって、ブートおよび初期設定の後、様々なプロセッサノードは、それらのレイヤ2データリンク接続を理解するに違いない。後述されるように、レイヤ3(IP)接続および特にレイヤ2へのレイヤ3の結合は、アドレス解決プロトコルの結果として、プロセッサの通常処理中に決定される。
【0053】
上記に概説された以外のプラットホームが使用され得ることは、認識されるであろう。すなわち、内部のアーキテクチャおよび機能は異なり得るが、構成変更可能なプラットホームの他の配置もまた、利用され得る。例えば、好適なプラットホームは、そのサポートされたPANネットワーク機能に関するエミュレーションロジックの特定のタイプを含んでいる。このロジックはある利益を与えると信じられるが、それは本発明にとって必須のものではない。
【0054】
(構成状態)
上記のものと関連して、構成変更可能なプラットホーム上の配備されたPANsは、構成状態によって特徴づけられる。最小限の構成状態は、エミュレートされるべき処理トポロジを記述する。例えば、この状態は図4のような例示的な配置のトポロジを記述し、記憶装置特性、アプリケーション、その他についての特定情報を含むことができる。上で概説されたように、好適な実施態様の下で、プライマリサイトは、障害迂回サイトのそれに互換性がある構成変更可能なプラットホームを利用する。これらの局面では、構成状態は単なる処理トポロジより多くの情報を含み得る。この追加情報は、従来の配置のエミュレーションに特有の情報を含み得て、障害迂回サイトにおけるインスタンス化を容易にするであろう。例えば、構成状態はどのように特有のネットワーク相互結線をエミュレートするべきかに関する、プラットホームに特有の情報を含み得る。
【0055】
上で概説されたように、構成状態はプライマリサイトの全ての処理リソースを特定し得るか、さもなければ、それは特定のPANだけ、クラスタだけまたはパーティションだけを特定し得る。一つのある実施態様の下で、構成状態は以下のタイプの情報を含む。
【0056】
PANアーカイブ(PARファイル)の一部としてミラーリングされた構成状態
プライマリサイトの装置構成に特有のデータ:例えば、
1Gビットethデバイスの状態:
名称、スイッチアップリンク情報フィルタモード、MACアドレス
仮想冗長イーサネット(登録商標)デバイス(Reths)の状態
名称、1Gバイトのethペア、操作モード、プライマリeth、ソフトMACアドレス
仮想ネットワークスイッチの状態
スイッチ名称、アップリンク情報(ethまたはreth)、DHCPプロキシ情報、ルーター情報
サーバルートディスクの作成およびサーバカーネルのブートためのルートおよびブートイメージ
プライマリサイトに情報をプールするブレードに特有のデータ
全体的なブレード集団に割り当てられるブレードのリスト
プライマリサイトの管理に関するデータ;
プライマリBladeFrameおよびPAN用のSNMP設定
SNMPマネージャIPアドレス
コミュニティストリング
トラップIPポート
ユーザーセキュリティ設定
ユーザー名および役割
イベント/アラート設定
様々なイベントに対するアラートをトリガーするのに必要な重大度
アラートが送信されるべき電子メールアドレス
特定のアラートに対するSNMPトラップ使用可能化
監視プログラム設定
システム内の様々な監視プログラムに対するデフォルト閾値
電子メールゲートウェイ
障害回復状態保存設定
状態保存スケジュール、出力場所(装置またはファイル)
プライマリサイトのロジック的分割に関連するデータ(PANおよび/またはロジック的パーティションまたはロジック的PANs)
各LPANに対して
LPAN名称、記述
管理設定
LPANに特有のSNMP設定
SNMPマネージャIPアドレス
コミュニティストリング
トラップIPポート
イベント/アラート設定
様々なイベントに対するアラートをトリガーするのに必要な重大度
アラートが送信されるべき電子メールアドレス
特定のアラートに対するSNMPトラップ使用可能化
起動コマンド(このLPANが他のLPANsに対して起動し、リソースを獲得するための優先度を確立するコマンド)
リソース情報
LPANに割り当てられ、全体的な集団にアクセスするブレード
LPAN内のローカル集団に割り当てられるブレード
LPANに割り当てられるSCSIディスクID
LPANに割り当てられる仮想スイッチ
bladeframe CD−ROM使用のためのアクセス設定
サーバ構成
各サーバに対して
サーバ名、記述
必須/任意設定(LPANブート操作に影響を及ぼす)
ブート、シャットダウン、再ブートのためのタイムアウト
プライマリおよび障害迂回ブレード構成
サーバディスクIDに対するLPAN SCSIディスクIDの取付け設定
ブート設定、任意/必須属性のディスクイネーブル
仮想eth設定(MACアドレス、データレート)
サーバ仮想ethsに対するLPAN仮想スイッチの取付け設定
CD−ROM使用可能化
ブート情報
使用するブートイメージ
ブート時に使用するカーネル引数
LPAN内の他のサーバと関連するサーバのためのブートコマンド
HAアプリケーション情報
HAアプリケーションリソース
IPリソース
ファイルシステムリソース
障害迂回ポリシー
LPAN内に構成された各HAアプリケーションに対して
アプリケーション名、記述、タイプ
属性:自動起動、起動コマンド(他のアプリケーションに関する)、起動/停止スクリプト
【0057】
いくつかの実施態様の下で、構成状態は所定のルールによって指定される。例えば、この状態はXMLを使用して、タグを付けられたデータとして格納され得る。これは、仕様の構文解析および評価を容易にし、かつ指定された構成を配備するためのソフトウェアコマンドの自動生成を容易にし得る。
【0058】
高度利用可能なアプリケーションは、障害迂回アプリケーション、ロードバランスアプリケーションなどを含む。
【0059】
XMLフォーマットの問題に関して。タグは、通常オブジェクトの名称(LPAN、pServer、SNMPマネージャ、その他)を表し、XML属性は、通常特定の値に対して使用される、すなわちname=「pServer1」、それで、例えば:

【0060】
場合によっては、管理者は障害迂回サイト上でインスタンス化されるべき処理リソースの記述として、この仕様を使用し得るが、しかし、異なってはいるがなお充分な障害迂回配置を指定する情報を変更する必要があると明らかになり得る。
【0061】
好適な実施態様は、処理リソースの記述が有効な記述であることを検証するツールを含む。
【0062】
上で述べたように、ある予め形成された実施態様は、米国特許出願第10/038354号に記載されたようなアーキテクチャと連動して使用される。従って、このようなPANsかまたはロジック的PANsかどうかの構成状態は、上記の通りに保存され、かつアーカイブされる。
【0063】
ある実施態様は、物理ディスクにPANアーカイブを存続させる。これにより、システムが、(共有ディスク上で使用するのが難しいかもしれない)ファイルシステムのマウントを必要とせずに、プライマリサイトでデータを書き込んで、障害迂回サイトでそれを読み戻すことが可能になる。
【0064】
本発明の範囲が上記した実施態様に制限されることがないが、追加された請求項によって規定されること、および、これらの請求項は、記述されたものの変更および改良を包含するであろうことは、認識されるであろう。
【図面の簡単な説明】
【0065】
【図1】本発明の一実施態様を示す系統図である。
【図2A】本発明の一実施態様によって確立された通信リンクを示す図である。
【図2B】本発明の一実施態様によって確立された通信リンクを示す図である。
【図2C】本発明の一実施態様によって確立された通信リンクを示す図である。
【図3】従来の障害回復システムを示す図である。
【図4】従来の複数層のアプリケーショントポロジを示す図である。
【図5】本発明のある実施態様による処理リソースのための障害回復システムを示す図である。
【図6】本発明のある実施態様による処理リソースのための障害回復システムを示す図である。

【特許請求の範囲】
【請求項1】
プライマリサイトが処理リソースの構成を含む、障害迂回状況に応答するための処理リソースを提供する方法であって、
前記プライマリサイトの処理リソースの構成を記述する仕様を生成すること、
前記仕様を、ソフトウェアコマンドに応答して処理エリアネットワークを配備することが可能な構成変更可能な処理プラットホームを有する障害迂回サイトに提供すること、
前記構成変更可能なプラットホームにソフトウェアコマンドを生成するための前記仕様を使用して、前記仕様に対応する処理リソースを配備すること、
を備える方法。
【請求項2】
前記プライマリサイトにおける前記処理リソースは、前記障害迂回サイトにおける前記構成変更可能な処理プラットホームと互換性がある構成変更可能な処理プラットホーム上に配備されることを特徴とする請求項1に記載の方法。
【請求項3】
前記プライマリサイトにおける前記処理リソースの構成を記述するための仕様を生成することは、前記プライマリサイトの前記構成変更可能な処理プラットホームに特有の構成状態を含むことを特徴とする請求項2に記載の方法。
【請求項4】
少なくとも一つの他のサイトが処理リソースを含み、および、
仕様が前記少なくとも一つの他のサイトにおける前記処理リソースの構成を記述するために生成され、および、
前記少なくとも一つの他のサイトにおける前記処理リソースの構成の仕様は、前記障害迂回サイトに提供され、および、
前記仕様のうち少なくとも一つは、前記構成変更可能なプラットホームにソフトウェアコマンドを生成するために使用されて、前記一つの仕様に対応する処理エリアネットワークを配備する、
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記プライマリサイトにおける前記処理リソースは複数の独立の処理エリアネットワークを含み、および、前記仕様は前記複数の独立の処理エリアネットワークの下位集団だけを記述することを特徴とする請求項1に記載の方法。
【請求項6】
前記プライマリサイトにおける前記処理リソースは複数の独立の処理エリアネットワークを含み、および、前記仕様は前記独立の処理エリアネットワークの全てを記述することを特徴とする請求項1に記載の方法。
【請求項7】
処理リソースを配備するためにコマンドを生成するための前記仕様を使用する行為は、障害迂回状況の受信に応答したものであることを特徴とする請求項1に記載の方法。
【請求項8】
前記仕様は、前記プライマリサイトにおける最小構成または処理リソースを記述することを特徴とする請求項1に記載の方法。
【請求項9】
前記生成する行為は、前記プライマリサイトにおける装置構成に特有のデータを指定することを含むことを特徴とする請求項1に記載の方法。
【請求項10】
前記プライマリサイトは、プロセッサ集団を有する構成変更可能な処理プラットホームを含み、および前記生成する行為は、前記プロセッサが前記プライマリサイトにおいてどのようにプールされるかを記述した情報を指定することを含むことを特徴とする請求項1に記載の方法。
【請求項12】
前記生成する行為は、前記プライマリサイトに関連する管理情報を指定することを含む
ことを特徴とする請求項1に記載の方法。
【請求項13】
前記生成する行為は、プロセッサのロジック的分割およびロジック的処理ネットワークへの相互結線を記述するためのデータを指定することを含むことを特徴とする請求項10に記載の方法。
【請求項14】
プライマリサイトが処理リソースの構成を含む、障害迂回状況に応答するための処理リソースを提供するシステムであって、
前記プライマリサイトの処理リソースの構成を記述するコンピュータ可読の仕様と、
ソフトウェアコマンドに応答して処理エリアネットワークを配備することが可能な、構成変更可能な処理プラットホームと、
前記仕様に対応する処理リソースを配備するために前記構成変更可能なプラットホームにソフトウェアコマンドを生成するロジックと、
を備えるシステム。
【請求項15】
前記プライマリサイトにおける前記処理リソースは、前記障害迂回サイトにおける前記構成変更可能な処理プラットホームと互換性がある構成変更可能な処理プラットホーム上に配備されることを特徴とする請求項14に記載のシステム。
【請求項16】
少なくとも一つの他のサイトが処理リソースを含み、および、前記システムは前記少なくとも一つの他のサイトにおける前記処理リソースの構成を記述するための仕様を更に含み、
前記少なくとも一つの他のサイトにおける前記処理リソースの構成の前記仕様は、前記障害迂回サイトに提供され、および、
前記生成するためのロジックは、前記構成変更可能なプラットホームにソフトウェアコマンドを生成するための前記仕様のうちの少なくとも一つを使用して、前記一つの仕様に対応する処理エリアネットワークを配備する、
ことを特徴とする請求項14に記載のシステム。
【請求項17】
前記プライマリサイトにおける前記処理リソースは複数の独立の処理エリアネットワークを含み、および、前記仕様は前記複数の独立の処理エリアネットワークの下位集団だけを記述することを特徴とする請求項14に記載のシステム。
【請求項18】
前記プライマリサイトにおける前記処理リソースは複数の独立の処理エリアネットワークを含み、および、前記仕様は前記独立の処理エリアネットワークの全てを記述する
ことを特徴とする請求項14に記載のシステム。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図2C】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2007−502479(P2007−502479A)
【公表日】平成19年2月8日(2007.2.8)
【国際特許分類】
【出願番号】特願2006−532505(P2006−532505)
【出願日】平成16年4月29日(2004.4.29)
【国際出願番号】PCT/US2004/013284
【国際公開番号】WO2004/102535
【国際公開日】平成16年11月25日(2004.11.25)
【出願人】(504156131)エゲネラ,インク. (1)
【Fターム(参考)】