情報処理システムおよび情報処理システムの制御方法


【課題】 計算性能を損なうことなく、良好なセキュリティにて複数ユーザによる並列コンピュータの同時使用を実現する。
【解決手段】 複数の計算ノード11を縦ループ光ファイバ12および横ループ光ファイバ13にて接続することで二次元トーラス型で接続し、並列コンピュータC0として稼働させる情報処理システム10において、横ループ光ファイバ13に光スイッチ14を介在させ、必要に応じて、横ループ光ファイバ13、すなわち複数の計算ノード11を二つのグループに分離して、物理的に独立な複数の並列コンピュータを構成し、各並列コンピュータにて、異なるユーザが情報漏洩のない高いセキュリティにて、異なるアプリケーションプログラムを並行して実行することを可能にした。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システムおよび情報処理システムの制御方法に関し、特に、複数の計算ノードを用いた負荷分散による並列処理等の情報処理技術等に適用して有効な技術に関する。
【背景技術】
【0002】
自然界または加工物における様々な物理現象をできる限り模倣化可能な高性能コンピュータが、原子力、自動車、船舶、航空機、高層ビルなどの分野で設計やシミュレーションに適用されている。また、近年では分子設計や遺伝子解析などバイオ、化学分野での活用されており、大学や研究機関だけでなく、一般企業でも活用されている。高性能コンピュータには様々な計算用途があり、その所要計算時間も大きなバラツキがある。
【0003】
上述の高性能コンピュータの実現方法としては、科学技術分野で頻繁に使われる行列計算などの大量の繰り返し演算を高速化するため、次に示すような技術がある。
すなわち(1)個々のプロセッサ自体の性能を向上させる技術、(2)複数のプロセッサを並列接続して用い、その並列度を大きくする技術、(3)ベクトルプロセッサなどと呼ばれる特殊な演算装置を用いて並列処理を行う技術、である。
【0004】
通常、上述の(1)〜(3)の技術の中から1つまたは複数を選択し、高性能コンピュータを実現している。プロセッサの並列度が高い並列コンピュータの場合、それらの複数のプロセッサ間を接続するネットワークの性能向上が一層重要である。
【0005】
大規模な計算を必要とするアプリケーションプログラムの実行には高性能コンピュータの全体を占有し、所要時間の短縮を優先して計算する場合が多い。
一方、小規模または中規模の計算で十分なアプリケーションプログラムの実行の際には、上述の高性能コンピュータの効率的な利用の観点から、同時に異なるプログラムを実行させることが有効である。この場合、個々の計算(アプリケーションプログラム)の実行を依頼する依頼者(ユーザ)間において、各々のユーザの計算業務に関わる情報が他のユーザ等に漏洩しないようなセキュリティの配慮が必要となる。
【0006】
特に、後者の場合に、複数のユーザ間でのセキィリティ確保が大きな課題である。セキュリティ確保のために、たとえば、計算ノード間を転送される情報にユーザ識別情報等を混在させ、どのユーザの情報かを識別する手続きを追加するようなソフトウェア的な対策が考えられるが、転送情報のユーザ判別処理に起因するオーバーヘッド等によって情報転送の遅延時間が大きくなるなどの新たな課題が発生する。
【0007】
すなわち、従来の高性能コンピュータでは、各計算ノード間の情報転送の速度や転送容量の増大による性能向上を追求するあまり、計算ノード間を転送する情報に関する手続きを簡略化する傾向があり、ソフトウェア的なセキュリティ対策は、性能低下の原因となったり、構成が複雑化するため、採用が困難である。
【0008】
なお、特許文献1には、並列コンピュータにおいて、冗長な待機プロセッサからなるグループを設け、ハードウェア障害を経験したグループと交換するようにソフトウェア制御を行うことで、フォールト・トレランスを実現しようとしている。しかし、この特許文献1では、並列コンピュータを異なる複数のユーザが並行して使用する場合における上述のようなセキュリティ確保に関する技術的課題は認識されていない。
【特許文献1】特表2004−532447号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
本発明の目的は、計算性能を損なうことなく、良好なセキュリティにて複数ユーザによる並列コンピュータの同時使用を実現することが可能な情報処理技術を提供することにある。
【0010】
本発明の他の目的は、多様な計算規模の複数のアプリケーションプログラムを、個々のアプリケーションプログラム間のセキュリティを維持しつつ、並行して実行することが可能な情報処理技術を提供することにある。
【0011】
本発明の他の目的は、複数の計算ノードで構成される並列コンピュータにおける稼働率の向上を実現することにある。
本発明の他の目的は、並列コンピュータにおいて、個々の計算ノード単位の切り離しによる障害耐性の向上を実現することが可能な情報処理を提供することにある。
【課題を解決するための手段】
【0012】
本発明の第1の観点は、並列コンピュータを構成する複数の計算ノードと、
前記計算ノードを接続する情報伝送路と、
前記情報伝送路に設けられ、複数の前記計算ノードが互いに独立な複数の前記並列コンピュータを構成するように前記情報伝送路を分離する操作を行う分離スイッチと、
を含む情報処理システムを提供する。
【0013】
本発明の第2の観点は、第1の観点の情報システムにおいて、
前記分離スイッチは前記情報伝送路を物理的に分離する操作を行う情報処理システムを提供する。
【0014】
本発明の第3の観点は、第1の観点の情報処理システムにおいて、
個々の前記計算ノードは入力ポートおよび出力ポートを備え、前記分離スイッチは、前記情報伝送路を介して前記入力ポートおよび出力ポートが接続される複数の接続ポートと、任意の前記接続ポート間を接続するスイッチマトリクスを含み、
前記スイッチマトリクスは、複数の前記計算ノードの前記入力ポートおよび出力ポートがループをなすように接続し、個々の前記計算ノードの前記入力ポートおよび出力ポートのペアをスキップして前記ループから外すことにより、個々の前記計算ノードを単位として、前記並列コンピュータからの切り離しが行われるようにした情報処理システムを提供する。
【0015】
本発明の第4の観点は、グループを構成する複数の計算ノードを束ね、前記グループ内における前記計算ノード間の伝送情報の経路制御を行う第1スイッチと、
複数の前記第1スイッチを介して前記グループ単位で前記計算ノードが接続され、複数の前記グループ間における前記計算ノード間の伝送情報の経路制御を行う第2スイッチと、
前記第1スイッチと前記第2スイッチとの間に介在し、個々の前記グループの前記第2スイッチに対する接続の有無を制御する第3スイッチと、
を含む情報処理システムを提供する。
【0016】
本発明の第5の観点は、複数の計算ノードを光伝送路を介して接続することで並列コンピュータとして稼働させる情報処理システムの制御方法であって、
前記光伝送路上に光スイッチを配置する工程と、
必要に応じて前記光伝送路を前記光スイッチにて分離することで、複数の前記計算ノードを複数の互いに独立な前記並列コンピュータとして稼働させる工程と、
を含む情報処理システムの制御方法を提供する。
【0017】
本発明の第6の観点は、グループを構成する複数の計算ノードを前記グループ内における前記計算ノード間の伝送情報の経路制御を行う第1スイッチにて束ね、
複数の前記第1スイッチを、複数の前記グループ間における前記計算ノード間の伝送情報の経路制御を行う第2スイッチにて束ねることで、ファットツリーを構成する情報処理システムの制御方法であって、
前記第1スイッチと前記第2スイッチとの間の情報伝送路に第3スイッチを配置する工程と、
前記第3スイッチによって、個々の前記グループの前記第2スイッチに対する接続の有無を制御することで、前記グループを最小構成とする互いに独立な複数の並列コンピュータを構成する工程と、
を含む情報処理システムの制御方法を提供する。
【発明の効果】
【0018】
本発明によれば、計算性能を損なうことなく、良好なセキュリティにて複数ユーザによる並列コンピュータの同時使用を実現することができる。
また、多様な計算規模の複数のアプリケーションプログラムを、個々のアプリケーションプログラム間のセキュリティを維持しつつ、並行して実行することが可能となる。
【0019】
また、複数の計算ノードで構成される並列コンピュータにおける稼働率の向上を実現することができる。
また、並列コンピュータにおいて、個々の計算ノード単位の切り離しによる障害耐性の向上を実現することが可能となる。
【発明を実施するための最良の形態】
【0020】
以下、図面を参照しながら、本発明の実施の形態について詳細に説明する。
図1は、本発明の一実施の形態である情報処理システムの制御方法を実施する情報処理システムの構成の一例を示す概念図であり、図2は、その動作の一例を示す概念図、図3は、本実施の形態の情報処理システムを構成する計算ノードの構成の一例を示すブロック図である。
【0021】
図1は、複数の計算ノードのトーラス型接続におけるパーティショニングの基本概念を示している。本実施の形態では、計算ノード間を接続するの光伝送路に光スイッチを挿入することにより、物理的に分離された複数のネットワーク、即ちセキュリティを確保した複数の並列コンピュータに分割可能にする例を説明する。ただし、以下の図1〜図7では、説明を簡略化するため、複数の計算ノードの二次元のトーラス型接続を例にとって説明をする。
【0022】
図1に例示されるように、本実施の形態の情報処理システム10は、複数の計算ノード11を、縦ループ光ファイバ12および横ループ光ファイバ13にて各行および列毎に連ねて接続することで、二次元トーラスの並列コンピュータC0を構成している。
【0023】
個々の計算ノード11は、演算コア11aと、この演算コア11aを、光信号出力部21および光信号入力部22に接続するための通信インターフェイス11dを備えている。演算コア11aは、たとえば、演算処理を実行するCPU11cと、このCPU11cを制御するプログラムやデータ等の情報が格納されるメモリ11bを含んでいる。
【0024】
通信インターフェイス11dに接続される光信号出力部21には、複数の固定波長光送信器21aが設けられ、個々の固定波長光送信器21aは、縦ループ光ファイバ12および横ループ光ファイバ13に接続される。
【0025】
通信インターフェイス11dに接続される光信号入力部22には、複数の固定波長光受信器22aが設けられ、個々の固定波長光受信器22aには、縦ループ光ファイバ12および横ループ光ファイバ13が接続されている。
【0026】
そして、一つの計算ノード11から他の計算ノード11に伝達すべきメッセージは、光信号出力部21において光信号に変換されて縦ループ光ファイバ12、横ループ光ファイバ13に送出され、光信号入力部22において受信され、必要に応じて電気的な信号に変換されて演算コア11aに伝達される。
【0027】
図1に例示される二次元トーラス接続の情報処理システム10を実現する場合、個々の計算ノード11の光信号出力部21および光信号入力部22では、2出力/2入力でよい。
【0028】
本実施の形態の場合、横ループ光ファイバ13の経路の途中には、光スイッチ14(分離スイッチ)が介設されている。この光スイッチ14は、複数の接続ポート14aと、この接続ポート14a間の接続経路を設定するスイッチマトリクス14bと、スイッチマトリクス14bによる接続経路の設定動作を外部から制御するための分離制御入力部14cを備えている。
【0029】
図1の構成では、簡単のため、複数の計算ノード11を二つのグループに二等分する位置に光スイッチ14を配置した例を示しているが、二等分でなくてもよい。また、光スイッチ14の数は一つに限らず、2以上の光スイッチ14を配置し、複数の計算ノード11が、3以上のグループに分割されるようにしてもよい。
【0030】
スイッチマトリクス14bは、たとえば、微小電気機械システム(MEMS:Micro-Electro Mechanical System)等の微細加工技術を用いて構成される光ファイバの断面サイズの微小な複数の可動ミラーと、この可動ミラーを静電気等で駆動する駆動回路系、さらには、可動ミラーに対して入射/出射する光信号を収束する光学系等で構成される。このため、光スイッチ14における横ループ光ファイバ13の光路の接続状態/分離状態における光信号の伝送遅延は原理的に非常に小さい。
【0031】
個々の横ループ光ファイバ13は、この光スイッチ14にて分断され、個々の切断端部が、個々の接続ポート14aに接続されている。
そして、分離制御入力部14cがデフォルトの状態では、個々の横ループ光ファイバ13が一つのループをなすように、接続ポート14a間の接続が設定される。この状態では、全体の計算ノード11(この場合、16個)が、一つの並列コンピュータC0を構成する。
【0032】
また、分離制御入力部14cから横ループ光ファイバ13の分離指示を行うことで、図2に例示されるように、スイッチマトリクス14bでは、個々の横ループ光ファイバ13の接続端がループをなすように、分離制御入力部14c間の接続経路が設定され、これにより、横ループ光ファイバ13は、二つの分離ループ光ファイバ13aおよび分離ループ光ファイバ13bに分離される。
【0033】
そして、横ループ光ファイバ13にて行方向に接続されていた複数の計算ノード11は、分離ループ光ファイバ13aに属するグループ(この場合、8個)と、分離ループ光ファイバ13bに属するグループ(この場合、8個)に分離され、それぞれ独立な、並列コンピュータC1および並列コンピュータC2を構成する。
【0034】
この場合、図2の分離状態では、光スイッチ14にて、横ループ光ファイバ13は、二つの分離ループ光ファイバ13aおよび分離ループ光ファイバ13bに物理的に完全に分離された状態となるため、分離ループ光ファイバ13aの側の並列コンピュータC1、および分離ループ光ファイバ13bの側の並列コンピュータC2は、物理的に独立して動作可能となる。
【0035】
このため、たとえば、並列コンピュータC1を使用するユーザが実行するシミュレーションプログラムと、並列コンピュータC2を使用する他のユーザが実行する別のシミュレーションプログラムとの間における情報漏洩が確実に防止される。
【0036】
また、並列コンピュータC0を複数の並列コンピュータC1および並列コンピュータC2として稼働させる場合の情報漏洩防止等の目的で、計算ノード11で授受されるメッセージに特別な情報を埋め込んだり、メッセージから当該情報を読み取って判別する等の煩雑なソフトウェア処理は全く不要であり、当該ソフトウェア処理に起因するオーバーヘッドの発生もない。
【0037】
すなわち、オーバーヘッドを発生させることなく、かつ高いセキュリティを維持した状態で、一つの並列コンピュータC0を、複数の独立な並列コンピュータC1および並列コンピュータC2として動作させることができる。
【0038】
また、光スイッチ14を接続状態にして、一つの横ループ光ファイバ13にて行方向の全ての計算ノード11を接続し、全体の計算ノード11で構成される並列コンピュータC0として使用する場合には、光スイッチ14における光信号の伝送のオーバーヘッドも発生せず、並列コンピュータC0の高性能が損なわれることもない。
【0039】
図4は、本実施の形態の情報処理システム10の変形例を示す概念図である。この図4の例では、縦ループ光ファイバ12および横ループ光ファイバ13の本数を増やして、計算ノード11の間における光信号の伝送を空間分割多重(space−DM)とすることで、計算ノード間の通信容量を増大し、計算性能の向上を実現している。
【0040】
この場合も、光スイッチ14−1にて横ループ光ファイバ13を接続手段とすることにより、全ての計算ノード11(この場合、16個)の並列接続による並列コンピュータC0の実現にて、最大性能の並列計算を行うことができる。
【0041】
また、必要に応じて、光スイッチ14−1を分離状態に設定し、複数の横ループ光ファイバ13の分離ループ光ファイバ13aおよび分離ループ光ファイバ13bへと分離することにより、物理的に独立な並列コンピュータC1および並列コンピュータC2を実現することもできる。この分離状態の場合、特に図示しないが、多重化された横ループ光ファイバ13の各々の光ファイバの分離端部(光スイッチ14に対する接続端部)は、図2の場合と同様に、スイッチマトリクス14bにおいてループ接続される。ここで、空間分割多重された計算ノード間の複数のファイバの接続は、同時に分離状態に設定できる方が望ましい。
【0042】
上述の縦ループ光ファイバ12および横ループ光ファイバ13の多重化では、光ファイバの本数が増加する。そこで、以下の図5に、波長分割多重(WDM)の光信号を用いることで、縦ループ光ファイバ12および横ループ光ファイバ13を構成する光ファイバの本数を削減する例を示す。
【0043】
すなわち、図5は、二次元トーラス型接続のために配列された複数の計算ノード11−1を列方向に一本の縦波長多重光ファイバ15で接続し、同様に行方向も一本の横波長多重光ファイバ16で接続した場合を情報処理システム10の例を示している。
【0044】
そして、光スイッチ14−1が接続状態では、すべての計算ノード11−1の並列動作による並列コンピュータC0が構成される。また、必要に応じて、横波長多重光ファイバ16を光スイッチ14−1にて二つの分離波長多重光ファイバ16aおよび分離波長多重光ファイバ16bのループに分離することで、独立な並列コンピュータC1および並列コンピュータC2を構成できる。
【0045】
図6は、この図5の場合における計算ノード11−1の構成例を示している。上述の図3に例示された計算ノード11の構成と異なる点を以下に説明する。この場合、光信号出力部21の側には、固定波長光送信器21aから出力される多波長の複数の光信号を波長分割多重化して、縦波長多重光ファイバ15、横波長多重光ファイバ16に送出する合波器23が設けられている。
【0046】
また、光信号入力部22の側には、縦波長多重光ファイバ15、横波長多重光ファイバ16から到来する波長分割多重の光信号を波長毎に分離して固定波長光受信器22aに入力する分波器24が設けられている。
【0047】
この図5のように、縦波長多重光ファイバ15および横波長多重光ファイバ16を波長分割多重化することで、図4の構成の場合よりも、光スイッチ14−1の接続ポート14aの数を削減でき、光スイッチ14−1の構成を簡略化できる、という利点がある。
【0048】
図7は、本実施の形態の情報処理システム10のさらに他の変形例を示す概念図である。この図7の構成は、図4の構成と図5の構成の折衷案である。すなわち、複数本の横ループ光ファイバ13の経路のうち、光スイッチ14−1に接続される経路部分を選択的に波長分割多重の光信号が流れる1本の横波長多重光ファイバ13cとしたものである。
【0049】
この場合、横ループ光ファイバ13(横波長多重光ファイバ13c)に連なる計算ノード11−2の光信号出力部21および光信号入力部22も図3と図6の折衷構成となる。すなわち、横ループ光ファイバ13において、光スイッチ14−1に接続される経路の端部に位置する計算ノード11では、光信号出力部21または光信号入力部22の一方が図3の構成で、他方が図6の構成となる。
【0050】
一般的に、波長分割多重方式に用いる合波器23、分波器24等を含む光モジュールは高価なため、図7の構成では、光スイッチ14−1を挿入する計算ノード間のみを波長多重方式を採用する案である。この場合には、比較的に接続ポート14aの少ない光スイッチ14−1を使用できることが長所である。
【0051】
図8は、上述の図1の構成を、y軸方向に複数配列して構成される3次元のトーラス型接続の並列コンピュータC0におけるパーティショニングの実施の形態を示している。なお、図示を分かりやすくするため、y軸方向の接続経路の図示は省略してあるが、x軸、z軸方向と同様に、ループ状の光ファイバで接続されており、光スイッチで分割可能となっている。
【0052】
なお、図8では、並列コンピュータC0を複数の光スイッチ14にて、複数の並列コンピュータC1および並列コンピュータC2に分割された状態を示しており、光スイッチ14を接続状態に設定すれば、全体の計算ノード11が並列動作する並列コンピュータC0が構成される。
【0053】
図1の2次元トーラス型の場合と同様に、全ての計算ノード11を並列に動作させる並列コンピュータC0と、この並列コンピュータC0を、横ループ光ファイバ13(z軸方向)において、複数の光スイッチ14にて分離することで、独立な複数の並列コンピュータC1および並列コンピュータC2を実現することができる。
【0054】
図9は、複数の計算ノードのツリー型接続におけるパーティショニングの一例を示す概念図である。この図9は、複数の計算ノード11をファットツリー型で接続した構成例を示している。ここで、電気スイッチ31と電気スイッチ32の間を流れる通信容量は、計算ノード11と電気スイッチ31の間を流れる通信容量を集約した通信容量なので、大きな通信容量が必要となり、波長多重方式を適用するのが望ましい。
【0055】
すなわち、複数の計算ノード11は、所定数のグループ毎に、各々が光ファイバ34を介して電気スイッチ31(第1スイッチ)に接続され、グループ単位で、筐体30に収納されている。
【0056】
電気スイッチ31は、たとえば、パケットルーティング技術により、筐体30内に属する複数の計算ノード11をフルメッシュ接続している。
個々の筐体30毎の電気スイッチ31は、さらに、上位の電気スイッチ32(第2スイッチ)に光ファイバ35を介して接続されている。光ファイバ35は、電気スイッチ31と電気スイッチ32の間で、たとえば、波長分割多重の光信号を伝送する。
【0057】
電気スイッチ32は、電気スイッチ31の側から光ファイバ35が接続される複数のポート32aの間における、たとえば、パケットルーティング技術により、複数の筐体30(電気スイッチ31)間をフルメッシュ接続している。
【0058】
この場合、光ファイバ35の経路には、光スイッチ33(第3スイッチ)が設けられている。この光スイッチ33は、電気スイッチ31および電気スイッチ32の双方から光ファイバ35が接続される複数の接続ポート33bと、この接続ポート33b間の光伝送路の切断、および接続経路の設定を行うスイッチマトリクス33aと、このスイッチマトリクス33aの動作を外部から制御するための分離制御入力部33cを備えている。
【0059】
そして、本実施の形態の場合には、図9に例示されるように、分離制御入力部33cを操作して、光スイッチ33を介して、全ての筐体30を電気スイッチ32に接続して、全ての筐体30の全ての計算ノード11を並列に動作させる高性能の並列コンピュータC0を構成することができるとともに、必要に応じて、図10に例示されるように複数の並列コンピュータに物理的に分割して使用することもできる。
【0060】
すなわち、図10の例では、左端の一つの筐体30の計算ノード11のグループを電気スイッチ32から切り離して、独立な並列コンピュータC1を構成し、さらに、左端側から二番目と三番目の二つの筐体30を電気スイッチ32から切り離してスイッチマトリクス33a内で相互に接続することで、二つの筐体30からなる並列コンピュータC2を構成し、さらに、右端側の三つの筐体30は光スイッチ33を介して電気スイッチ32に接続されることにより、並列コンピュータC3を構成している。
【0061】
すなわち、情報処理システム10の一つの並列コンピュータC0を、光スイッチ33のスイッチマトリクス33aの設定により、図10のような多様な筐体30間の分離あるいは接続状態を設定することで、複数の互いに物理的に独立な複数の並列コンピュータC1、並列コンピュータC2および並列コンピュータC3に分割して稼働させることができる。
【0062】
すなわち、図9および図10の構成例では、複数の計算ノード11を筐体30の単位で束ねる電気スイッチ31と、さらに、全ての筐体30を束ねる電気スイッチ32との間に、光スイッチ33を挿入することにより、全体の計算ノード11を並列動作させる並列コンピュータC0と、この並列コンピュータC0を物理的に分離された複数のネットワーク、即ちセキュリティを確保した複数の並列コンピュータC1、並列コンピュータC2、並列コンピュータC3に分割して稼働させることが可能になる。ここで、上記の図9および図10で示した、電気スイッチ31および電気スイッチ32は一例であり、光パケットスイッチを用いてもかまわない。
【0063】
図11は、本実施の形態の情報処理システム10のさらに他の変形例を示す概念図であり、図12は、その構成を具現化するための情報処理システムの構成例を示すブロック図である。
【0064】
図11の構成例では、複数の計算ノード11を光ファイバ42を介して三次元トーラス型に接続するとともに、個々の計算ノード11の接続経路上に、任意の一つの計算ノード11を、他の全ての計算ノード11から切り離すための光スイッチを介在させている。
【0065】
この図11の論理的な三次元トーラス型の接続構成は、図12に例示されるように、光スイッチ41を用いた二次元的な接続で実現できる。
すなわち、個々の計算ノード11では、光信号出力部21および光信号入力部22の各々に、3次元のx,y,zの各方向における光信号の入出力を行うために、三つの固定波長光送信器21aおよび固定波長光受信器22aを備え、個々の固定波長光送信器21aおよび固定波長光受信器22aは、光ファイバ42を介して、光スイッチ41の接続ポート41bに接続されている。
【0066】
光スイッチ41は、複数の接続ポート41bの各々の入出力を、x,y,zの各軸に対応した他の任意の接続ポート41bに接続するためのスイッチマトリクス41aを備えている。このスイッチマトリクス41aにおける上述のような個々の接続ポート41b間の接続設定は、分離制御入力部41cによって外部から制御することが可能である。
【0067】
たとえば、図12の例では、全ての計算ノード11(計算ノードN1〜N6)の光信号出力部21および光信号入力部22のx,y,zの各軸の入出力が、光スイッチ41の内部のスイッチマトリクス41aの設定によって、全てループ状に接続され、図11に例示された論理的な三次元トーラス型接続が実現されている。
【0068】
そして、たとえば、一つ計算ノード11(計算ノードN5)に障害が発生したり、当該計算ノードN5が不要となった場合、当該計算ノードN5のみを三次元トーラス接続から切り離す必要がある。その場合、図13に例示されるように、計算ノードN5の光信号出力部21および光信号入力部22が接続される複数の接続ポート41bを飛び越して、両隣の計算ノードN4と、計算ノードN6の光信号出力部21および光信号入力部22が直接に接続されるように、スイッチマトリクス41aにおける接続経路の設定を行う。
【0069】
これにより、故障や不要となった計算ノードN5のみを三次元トーラス接続から切り離すことができる。
また、三次元トーラス型接続の場合、全ての伝送路を接続したままであると、伝送路の一部がループ構成になり、トラフィックが過剰になる結果、伝送路の容量を超過してリンクダウンが生じる可能性があるが、本実施の形態の場合には、光スイッチ41によって、個々のアプリケーション毎に要求される計算ノード11の接続構成に応じて適切なリンクを切断することができ、伝送路のループ構成に起因するリンクダウンを回避することができる。
【0070】
なお、図13では、一つの計算ノード11(計算ノードN5)を切り離す例を示したが、複数の計算ノード11を独立なグループに分割することもできる。
たとえば、図12において、隣合う計算ノードN2と計算ノードN3、および計算ノードN5と計算ノードN6を切り離し、対向する計算ノードN2および計算ノードN5の光信号出力部21と光信号入力部22を接続することで、三次元トーラス接続された複数の計算ノードN1、計算ノードN2、計算ノードN5、計算ノードN4からなる独立した並列コンピュータを実現することができる。
【0071】
以上説明したように、本発明の各実施の形態によれば、複数の計算ノード11からなる高性能の並列コンピュータC0を、必要に応じて光スイッチにて物理的に分離して、独立に並行して稼働可能な複数の並列コンピュータC1〜C3を構成し、個々の並列コンピュータC1〜C3を異なるユーザに異なる用途(アプリケーションプログラム)にて使用させることができるとともに、個々のユーザが実行するアプリケーションプログラム間での情報漏洩を確実に防止できる。
【0072】
したがって、高性能を必要とする大規模なアプリケーションプログラムの実行のみならず、複数のユーザによる高いセキュリティでの並行稼働も実現でき、並列コンピュータの多様な運用による稼働率の向上を実現できる。
【0073】
なお、本発明は、上述の実施の形態に例示した構成に限らず、その趣旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
たとえば、上述の各実施の形態では、情報伝送路として光ファイバを用いた例を示したが、メタルケーブルを使用してもよい。
【0074】
(付記1)
並列コンピュータを構成する複数の計算ノードと、
前記計算ノードを接続する情報伝送路と、
前記情報伝送路に設けられ、複数の前記計算ノードが互いに独立な複数の前記並列コンピュータを構成するように前記情報伝送路を分離する操作を行う分離スイッチと、
を含むことを特徴とする情報処理システム。
【0075】
(付記2)
付記1記載の情報システムにおいて、
前記分離スイッチは前記情報伝送路を物理的に分離する操作を行うことを特徴とする情報処理システム。
【0076】
(付記3)
付記1記載の情報処理システムにおいて、
前記情報伝送路はループをなす光通信路からなり、前記光通信路を流れる光信号にて複数の前記計算ノード間の通信が行われ、前記分離スイッチは、前記光通信路の複数のループへの分離および複数の前記ループの併合を行う光スイッチであることを特徴とする情報処理システム。
【0077】
(付記4)
付記1記載の情報処理システムにおいて、
前記情報伝送路は単一の光通信路からなり、前記光通信路を流れる波長分割多重光信号にて複数の前記計算ノード間の通信が行われ、前記分離スイッチは、波長分割多重光信号が流れる前記光通信路の分離および接続を行う光スイッチであることを特徴とする情報処理システム。
【0078】
(付記5)
付記1記載の情報処理システムにおいて、
前記情報伝送路は複数本の光通信路からなり、前記分離スイッチと当該分離スイッチに最も近い前記計算ノードとの間を接続する前記光伝送路は選択的に単一化され、選択的に単一化された前記光伝送路では波長分割多重光信号が流れることを特徴とする情報処理システム。
【0079】
(付記6)
付記1記載の情報処理システムにおいて、
複数の前記計算ノードは、二次元または三次元トーラスを構成するように前記情報伝送路にて接続され、前記分離スイッチにて複数の前記計算ノードは異なる複数の前記二次元または三次元トーラスに属するように分離されることを特徴とする情報処理システム。
【0080】
(付記7)
付記1記載の情報処理システムにおいて、
個々の前記計算ノードは入力ポートおよび出力ポートを備え、前記分離スイッチは、前記情報伝送路を介して前記入力ポートおよび出力ポートが接続される複数の接続ポートと、任意の前記接続ポート間を接続するスイッチマトリクスを含み、
前記スイッチマトリクスは、複数の前記計算ノードの前記入力ポートおよび出力ポートがループをなすように接続し、個々の前記計算ノードの前記入力ポートおよび出力ポートのペアをスキップして前記ループから外すことにより、個々の前記計算ノードを単位として、前記並列コンピュータからの切り離しが行われるようにしたことを特徴とする情報処理システム。
【0081】
(付記8)
グループを構成する複数の計算ノードを束ね、前記グループ内における前記計算ノード間の伝送情報の経路制御を行う第1スイッチと、
複数の前記第1スイッチを介して前記グループ単位で前記計算ノードが接続され、複数の前記グループ間における前記計算ノード間の伝送情報の経路制御を行う第2スイッチと、
前記第1スイッチと前記第2スイッチとの間に介在し、個々の前記グループの前記第2スイッチに対する接続の有無を制御する第3スイッチと、
を含むことを特徴とする情報処理システム。
【0082】
(付記9)
付記8記載の情報処理システムにおいて、
前記第1スイッチと前記第2スイッチとの間は、波長分割多重光信号が伝送される光伝送路で接続され、前記第3スイッチは、前記光伝送路に介在する光スイッチであることを特徴とする情報処理システム。
【0083】
(付記10)
付記8記載の情報処理システムにおいて、
前記第3スイッチは、前記第2スイッチから切り離された前記第2スイッチ間を接続する機能を備え、
個々の前記計算ノードは、前記グループを最小構成単位とする互いに独立な複数の並列コンピュータを構成することを特徴とする情報処理システム。
【0084】
(付記11)
複数の計算ノードを光伝送路を介して接続することで並列コンピュータとして稼働させる情報処理システムの制御方法であって、
前記光伝送路上に光スイッチを配置する工程と、
必要に応じて前記光伝送路を前記光スイッチにて分離することで、複数の前記計算ノードを複数の互いに独立な前記並列コンピュータとして稼働させる工程と、
を含むことを特徴とする情報処理システムの制御方法。
【0085】
(付記12)
付記11記載の情報処理システムの制御方法において、
前記光伝送路上を伝送される波長分割多重光信号にて、複数の前記計算ノード間における情報の授受を行うことを特徴とする情報処理システムの制御方法。
【0086】
(付記13)
グループを構成する複数の計算ノードを前記グループ内における前記計算ノード間の伝送情報の経路制御を行う第1スイッチにて束ね、
複数の前記第1スイッチを、複数の前記グループ間における前記計算ノード間の伝送情報の経路制御を行う第2スイッチにて束ねることで、ファットツリーを構成する情報処理システムの制御方法であって、
前記第1スイッチと前記第2スイッチとの間の情報伝送路に第3スイッチを配置する工程と、
前記第3スイッチによって、個々の前記グループの前記第2スイッチに対する接続の有無を制御することで、前記グループを最小構成とする互いに独立な複数の並列コンピュータを構成する工程と、
を含むことを特徴とする情報処理システムの制御方法。
【0087】
(付記14)
付記13記載の情報処理システムの制御方法において、前記第1スイッチと前記第2スイッチとの間を、波長分割多重光信号が伝送される光伝送路にて接続し、前記第3スイッチとして光スイッチを用いて前記光伝送路の分離の有無により、個々の前記グループの前記第2スイッチに対する接続の有無を制御することを特徴とする情報処理システムの制御方法。
【図面の簡単な説明】
【0088】
【図1】本発明の一実施の形態である情報処理システムの構成の一例を示す概念図である。
【図2】その動作の一例を示す概念図である。
【図3】本発明の一実施の形態である情報処理システムを構成する計算ノードの構成の一例を示すブロック図である。
【図4】本発明の一実施の形態である情報処理システムの変形例を示す概念図である。
【図5】本発明の一実施の形態である情報処理システムの他の変形例を示す概念図である。
【図6】本発明の一実施の形態である情報処理システムを構成する計算ノードの構成の変形例を示すブロック図である。
【図7】本発明の一実施の形態である情報処理システム10のさらに他の変形例を示す概念図である。
【図8】本発明の一実施の形態である情報処理システムのさらに他の変形例を示す概念図である。
【図9】本発明の一実施の形態である情報処理システムのさらに他の変形例を示す概念図である。
【図10】本発明の一実施の形態である情報処理システムのさらに他の変形例の作用の一例を示す概念図である。
【図11】本発明の一実施の形態である情報処理システムのさらに他の変形例を示す概念図である。
【図12】図11の構成を具現化するための情報処理システムの構成例を示すブロック図である。
【図13】図12の情報処理システムの作用の一例を示すブロック図である。
【符号の説明】
【0089】
10 情報処理システム
11 計算ノード
11−1 計算ノード
11−2 計算ノード
11a 演算コア
11b メモリ
11c CPU
11d 通信インターフェイス
12 縦ループ光ファイバ
13 横ループ光ファイバ
13a 分離ループ光ファイバ
13b 分離ループ光ファイバ
13c 横波長多重光ファイバ
14 光スイッチ
14−1 光スイッチ
14a 接続ポート
14b スイッチマトリクス
14c 分離制御入力部
15 縦波長多重光ファイバ
16 横波長多重光ファイバ
16a 分離波長多重光ファイバ
16b 分離波長多重光ファイバ
21 光信号出力部
21a 固定波長光送信器
22 光信号入力部
22a 固定波長光受信器
23 合波器
24 分波器
30 筐体
31 電気スイッチ
32 電気スイッチ
32a ポート
33 光スイッチ
33a スイッチマトリクス
33b 接続ポート
33c 分離制御入力部
34 光ファイバ
35 光ファイバ
41 光スイッチ
41a スイッチマトリクス
41b 接続ポート
41c 分離制御入力部
42 光ファイバ
C0 並列コンピュータ
C1 並列コンピュータ
C2 並列コンピュータ
C3 並列コンピュータ


【特許請求の範囲】
【請求項1】
並列コンピュータを構成する複数の計算ノードと、
前記計算ノードを接続する情報伝送路と、
前記情報伝送路に設けられ、複数の前記計算ノードが互いに独立な複数の前記並列コンピュータを構成するように前記情報伝送路を分離する操作を行う分離スイッチと、
を含むことを特徴とする情報処理システム。
【請求項2】
請求項1記載の情報システムにおいて、
前記分離スイッチは前記情報伝送路を物理的に分離する操作を行うことを特徴とする情報処理システム。
【請求項3】
請求項1記載の情報処理システムにおいて、
前記情報伝送路はループをなす光通信路からなり、前記光通信路を流れる光信号にて複数の前記計算ノード間の通信が行われ、前記分離スイッチは、前記光通信路の複数のループへの分離および複数の前記ループの併合を行う光スイッチであることを特徴とする情報処理システム。
【請求項4】
請求項1記載の情報処理システムにおいて、
前記情報伝送路は単一の光通信路からなり、前記光通信路を流れる波長分割多重光信号にて複数の前記計算ノード間の通信が行われ、前記分離スイッチは、波長分割多重光信号が流れる前記光通信路の分離および接続を行う光スイッチであることを特徴とする情報処理システム。
【請求項5】
請求項1記載の情報処理システムにおいて、
複数の前記計算ノードは、二次元または三次元トーラスを構成するように前記情報伝送路にて接続され、前記分離スイッチにて複数の前記計算ノードは異なる複数の前記二次元または三次元トーラスに属するように分離されることを特徴とする情報処理システム。
【請求項6】
請求項1記載の情報処理システムにおいて、
個々の前記計算ノードは入力ポートおよび出力ポートを備え、前記分離スイッチは、前記情報伝送路を介して前記入力ポートおよび出力ポートが接続される複数の接続ポートと、任意の前記接続ポート間を接続するスイッチマトリクスを含み、
前記スイッチマトリクスは、複数の前記計算ノードの前記入力ポートおよび出力ポートがループをなすように接続し、個々の前記計算ノードの前記入力ポートおよび出力ポートのペアをスキップして前記ループから外すことにより、個々の前記計算ノードを単位として、前記並列コンピュータからの切り離しが行われるようにしたことを特徴とする情報処理システム。
【請求項7】
グループを構成する複数の計算ノードを束ね、前記グループ内における前記計算ノード間の伝送情報の経路制御を行う第1スイッチと、
複数の前記第1スイッチを介して前記グループ単位で前記計算ノードが接続され、複数の前記グループ間における前記計算ノード間の伝送情報の経路制御を行う第2スイッチと、
前記第1スイッチと前記第2スイッチとの間に介在し、個々の前記グループの前記第2スイッチに対する接続の有無を制御する第3スイッチと、
を含むことを特徴とする情報処理システム。
【請求項8】
請求項7記載の情報処理システムにおいて、
前記第1スイッチと前記第2スイッチとの間は、波長分割多重光信号が伝送される光伝送路で接続され、前記第3スイッチは、前記光伝送路に介在する光スイッチであることを特徴とする情報処理システム。
【請求項9】
複数の計算ノードを光伝送路を介して接続することで並列コンピュータとして稼働させる情報処理システムの制御方法であって、
前記光伝送路上に光スイッチを配置する工程と、
必要に応じて前記光伝送路を前記光スイッチにて分離することで、複数の前記計算ノードを複数の互いに独立な前記並列コンピュータとして稼働させる工程と、
を含むことを特徴とする情報処理システムの制御方法。
【請求項10】
グループを構成する複数の計算ノードを前記グループ内における前記計算ノード間の伝送情報の経路制御を行う第1スイッチにて束ね、
複数の前記第1スイッチを、複数の前記グループ間における前記計算ノード間の伝送情報の経路制御を行う第2スイッチにて束ねることで、ファットツリーを構成する情報処理システムの制御方法であって、
前記第1スイッチと前記第2スイッチとの間の情報伝送路に第3スイッチを配置する工程と、
前記第3スイッチによって、個々の前記グループの前記第2スイッチに対する接続の有無を制御することで、前記グループを最小構成とする互いに独立な複数の並列コンピュータを構成する工程と、
を含むことを特徴とする情報処理システムの制御方法。


【図3】

【図6】

【図1】

【図2】

【図4】

【図5】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】


【公開番号】特開2006−215816(P2006−215816A)
【公開日】平成18年8月17日(2006.8.17)
【国際特許分類】
物理学 | 計算;計数 | 電気的デジタルデータ処理 | デジタル計算機一般 | 各々が少くとも算術演算ユニット,プログラム・ユニットおよびレジスタをもつ2つ以上のデジタル計算機が結合されたもの,例.数個のプログラムの同時処理を行うためのもの | プロセッサ間通信 | 相互接続ネットワークを用いるもの,例.マトリックス,シャフル,ピラミッド,スター,スノーフレーク
【出願番号】特願2005−27936(P2005−27936)
【出願日】平成17年2月3日(2005.2.3)
【出願人】(000005223)富士通株式会社
【Fターム(参考)】
マルチプロセッサ | 通信、転送方式 | 転送媒体、転送路 | 光ファイバ
マルチプロセッサ | 通信、転送方式 | 系路の接続、切替方式 | バスによるもの | ループバスによるもの
マルチプロセッサ | 通信、転送方式 | 系路の接続、切替方式 | スイッチによるもの
マルチプロセッサ | 通信、転送方式 | 系路の接続、切替方式 | スイッチによるもの | マトリックススイッチによるもの
マルチプロセッサ | 通信、転送方式 | 系路の接続、切替方式 | 接続、切替の対象 | 処理装置(CPU)
マルチプロセッサ | プログラム、命令の実行処理 | 並列処理 | アレイプロセッサ、行列配置によるもの
マルチプロセッサ | プログラム、命令の実行処理 | 並列処理 | アレイプロセッサ、行列配置によるもの | 三次元配列によるもの