説明

複合型資源管理システム

【課題】本発明は、複数のサーバとルータを組み合わせることにより、全体としての処理やトラヒックの負荷を効率的に分散することができる負荷分散システムの提供を目的とする。
【解決手段】 通信可能な状態で互いに接続された複数のサーバと、該サーバに通信可能な状態に接続されたルータとを備えるサーバ群が複数存在し、各サーバ群の間において、各サーバが互いに通信可能な状態に接続されるとともに、各ルータが互いに通信可能な状態で接続される。某サーバ群において多量の処理を行う場合、他のサーバ群において当該処理を分散して行い、某サーバ群において多量のトラヒックがある場合、他のサーバ群のルータにおいて当該トラヒックを分散して行うことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークに接続された複数のクライアントに対しサービスを提供する複数のサーバとルータの負荷を分散する俯瞰分散システムに関する。
【背景技術】
【0002】
従来、ネットワーク上のコンピュータリソースを融通し合って、仮想的に高性能のコンピュータを構成したり、柔軟に資源配分を行ったりできるようにする負荷分散システムが知られている。
【0003】
この負荷分散システムは、一般には図5に示すように、一つのルータに対して複数のサーバが接続されており、当該複数のサーバの間で負荷分散されていた。そして、大規模なシステムの場合には、このような負荷分散システムが複数群設けられるものであった。
【0004】
例えば、特許文献1には、グリッドコンピューティングシステムのミドルウェアに、データベースを特定するjobIDと、データベースを共有可能なユーザのuserIDとを対応付けて記憶するデータベース共有情報記憶手段43と、一のユーザが、他のユーザが使用するデータベースのjobIDを指定してジョブを投入した際に、データベース共有情報記憶手段43を検索し、他のユーザが使用するデータベースのjobIDに対応するuserIDに一のユーザのuserIDが含まれる場合に、一のユーザが投入したジョブの実行時に、他のユーザが使用するデータベースへの接続を設定するデータ処理装置5と、を備えたものが開示されている。
【0005】
また、特許文献2には、クライアントの端末アプリケーションが起動されてサーバ決定が依頼されると、サーバ情報ファイルから、レスポンス時間が最短で、かつCPU使用率が最も低いサーバを検索して、クライアントに通知する通信経路変換装置5を設けて、クライアントが検索されたサーバに対して発行した接続要求にもとづいて、該サーバがクライアントを接続して通信を開始可能にするものが開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2009−187415号公報
【特許文献2】特開2000−250878号公報
【特許文献3】特開2006−261805号公報
【特許文献4】特開2004−336209号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来の負荷分散システムによると、一つのサーバ群(例えばサーバ群A)において処理量が限界に達するとそれ以上は処理を制限せざるを得ない一方、他のサーバ群(例えばサーバ群B)ではリソースに余裕があるなどして、サーバの負荷分散を効率的に行えていなかった。
【0008】
また、一つのサーバ群(例えばサーバ群A)においてルータのトラヒック量が限界に達すると通信を制限せざるを得ない一方、他のサーバ群(例えばサーバ群B)では処理に余裕があるなどして、ルータの負荷分散を効率的に行えていなかった。
【0009】
すなわち、従来の負荷分散システムは、単に一つのサーバ群においてのみサーバの処理やルータのトラヒックの負荷を分散しているにすぎなかった。
【0010】
なお、特許文献3,4には、サーバに複数のルータを設けるシステムが開示されているが、あくまでも単一のサーバに対するトラヒック量の負荷を分散するものである。このためサーバごとに常に複数のルータを設けなければならず、使用していないルータが常時存在することから無駄が多く、装置構成のコスト高を招くものであった。
【0011】
本発明は、上述の問題に鑑みてなされたものであって、複数のサーバとルータを組み合わせることにより、サーバやルータの資源を効率的に管理する複合型資源管理システムの提供を目的とする。
【課題を解決するための手段】
【0012】
本発明は、上記目的を達成するために、サーバやルータの負荷を分散するための複合型資源管理システムであって、通信可能な状態で互いに接続された複数のサーバと、該サーバに通信可能な状態に接続されたルータとを備えるサーバ群が複数存在し、各サーバ群の間において、各サーバが互いに通信可能な状態に接続されるとともに、各ルータが互いに通信可能な状態で接続され、某サーバ群において多量の処理を行う場合、他のサーバ群において当該処理を分散して行い、某サーバ群において多量のトラヒックがある場合、他のサーバ群のルータにおいて当該トラヒックを分散して行うことを特徴とする。
【0013】
また、前記各サーバ群における前記サーバと前記ルータと通信可能な状態に設けられたコントロールサーバを備え、該コントロールサーバは、某サーバ群において多量の処理を行う場合、某サーバ群のサーバからリソースオーバー通知を受けたあと、他のサーバ群のサーバのリソース状況を確認して、リソースに余裕のあるサーバ群のサーバにおいて処理を分散して行わせ、某サーバ群において多量のトラヒックがある場合、某サーバ群のルータからトラヒックオーバー通知を受けたあと、他のサーバ群のルータのトラヒック状況を確認して、トラヒックに余裕のあるサーバ群においてトラヒックを分散して行わせるのが好ましい。
【0014】
また、前記ルータは、前記サーバと同様にCPU、メモリ、通信制御部、WAN制御部およびLAN制御部から構成されるのが好ましい。
【発明の効果】
【0015】
本発明によれば、個々のサーバー・ルータの使用率(CPU・MM・GPU)を総合管理し運用することにより、個々のサーバーが一つの高性能サーバーとして運用できる。また、ルータの回線制御を総合管理することにより、個々の回線が一つの高速回線と同じ処理が出来る。そして、大型サーバーを設置することなく、小型サーバーを統合することにより大型サーバーを設置したのと同様の性能を利用できる。このようにサーバーとルータを効率よく運用することにより、個々のサーバー・ルータが機能増設することなく、他サーバー・ルータの空いているリソースを利用し仮想的に性能を上げることができ、全体としての処理やトラヒックの負荷を効率的に分散することができる。この結果、一台のサーバーでは処理時間がかかっていたジョブを他のサーバーを仮想的に利用することで大幅に処理時間を短縮することができる。
【図面の簡単な説明】
【0016】
【図1】本システムの全体構成を示す概略図である。
【図2】サーバのハードウェア構成を示す概略図である。
【図3】ルータのハードウェア構成を示す概略図である。
【図4】コントロールサーバのハードウェア構成を示す概略図である。
【図5】従来の複合型資源管理システムの全体構成を示す概略図である。
【発明を実施するための形態】
【0017】
次に本発明の一実施形態に係る複合型資源管理システム(以下、本システムという)について、図面を参照しつつ説明する。
【0018】
本システムは、図1に示すように、複数のサーバ群A、Bから構成される。なお、図1では紙面の関係上、サーバ群A,Bのみ図示しているが、実際にはそれ以上のサーバ群から構成される場合が多い。
【0019】
このサーバ群Aは、通信可能な状態で互いに接続された複数のサーバと、該サーバに通信可能な状態に接続されたルータとを備える。また、各サーバ群A、Bの間において、各サーバが互いに通信可能な状態に接続されるとともに、各ルータが互いに通信可能な状態で接続されている。
【0020】
そして、某サーバ群において多量の処理を行う場合、他のサーバ群において当該処理を分散して行う。また、某サーバ群において多量のトラヒックがある場合、他のサーバ群のルータにおいて当該トラヒックを分散して行う。この動作について後に詳述することとする。
【0021】
前記サーバは、図2に示すように、LAN制御、CPU、MM,DISKおよびGPU
などから構成される。このLAN(Local Area Network)制御は、他のサーバやルータのLAN制御とのローカルアドレスを使用して通信を行う。CPU(Central Processing Unit:中央演算装置)はDISKからMMに読み込んだプログラムを実行し、各LAN制御・GPPU・DISKを制御する。MM(Main Memory:主記憶装置)は実行プログラムの格納や処理データーの格納処理を行う。DISK(Disk Drive)は、プログラムやデーターを格納保存を行う。このDISKは、装置全体を制御するオペレーティングシステムであるLinux、ホームページ・アプリケーションであってデーターベースの制御プログラムであるWEB・AP・DB制御、装置内のリソース管理や、他のサーバやルータのGCCS−Sの管理、GCCSーMとのの制御情報管理を行うGCCS−Sからなる。GPU(Graphics Processing Unit)は、画面制御や画像処理制御を行う。
【0022】
前記ルータは、図3に示すように、モデム、WAN、CPU、MM、SSD、GPU、LANなどから構成される。このモデム(Modem)は、WAN制御から送られてくるデジタルデーターを音声信号に変換して通信回線に送ったり、通信回線から送られてくる音声信号をデジタルデーターに変換しWAN制御に送る機器である。WAN(Wide Area Network)制御はモデムから送られてくるデジタルデーターを自己のデーターか判断(IPアドレス)し、自己のデーターであればCPUに従い、BUS経由でMMにデーターを送ったり。CPUに従いMMやSSDからのデーターをBUS経由で受けてデジタルデーターとしてモデムに送る。CPU(Central Processing Unit:中央演算装置)は、SDからMMに読み込んだプログラムを実行し、各WAN制御・GPU・LAN制御・SSDを制御する。MM(Main Memory:主記憶装置)は、実行プログラムの格納や処理データーの格納処理を行う。SSD(Solid State Drive)は、プログラムやデーターを格納保存を行う。このSSDは、装置全体を制御するオペレーティングシステムLinux、WAN・LANの通信制御とLANに接続されるサーバー機器などの制御制御(ローカルアドレス管理)を行う通信制御、装置内のリソース管理や、他装置のGCCS−Rの管理、GCCS−Mとの制御情報管理を行うGCCS−Rからなる。GPU(Graphics Processing Unit)は、画面制御や画像処理制御を行う。LAN(Local Area Network)制御は、他のサーバやルータのLAN制御とのローカルアドレスを使用して通信を行う。このようにルータをサーバによって構成することができる。
【0023】
また、本実施形態では、前記各サーバ群における前記サーバと前記ルータと通信可能な状態に設けられたコントロールサーバが設けられている。
【0024】
前記コントロールサーバは、某サーバ群において多量の処理を行う場合、某サーバ群のサーバからリソースオーバー通知を受けたあと、他のサーバ群のサーバのリソース状況を確認して、リソースに余裕のあるサーバ群のサーバにおいて処理を分散して行わせる機能を有する。また、某サーバ群において多量のトラヒックがある場合、某サーバ群のルータからトラヒックオーバー通知を受けたあと、他のサーバ群のルータのトラヒック状況を確認して、トラヒックに余裕のあるサーバ群においてトラヒックを分散して行わせる機能を有する。この動作については後に詳述することとする。
【0025】
前記コントロールサーバは、図4に示すように、CPU、MM、SSD、GPU、LANなどから構成される。このLAN(Local Area Network)制御は、他のサーバやLAN制御とのローカルアドレスを使用して通信を行う。また、CPU(Central Processing Unit:中央演算装置)はDISKからMMに読み込んだプログラムを実行し、各LAN制御・GPU・DISKを制御する。MM(Main Memory:主記憶装置)は実行プログラムの格納や処理データーの格納処理を行う。DISK(Disk Drive)はプログラムやデーターを格納保存を行う。このDISKは、装置全体を制御するオペレーティングシステムであるLinux、ホームページ・アプリケーションであってデーターベースの制御プログラムであるWEb・AP・DB制御、装置内のリソース管理や、他装置のGCCS−Sの管理、GCCS−Mとの制御情報管理を行うGCCS−Sからなる。GPU(Graphics Processing Unit)は画面制御や画像処理制御を行う。
【0026】
次に本システムの動作について説明する。
【0027】
図1に示すように、サーバーA群に於いてサーバーA−1はGCCS−Sオペレーティングシステムにより、サーバーA−1内のリソース(CPU・MM・GPUの使用率)を監視し、リソースの空き状況をコントロールサーバーのGCCS−Mに通知すると共に、サーバーA群内のサーバーA−2・A−3のGCCS−Sにも通知する。
【0028】
同様に、サーバーA−2のGCCS−Sオペレーティングシステムにより、リソースの空き状況をコントロールサーバーのGCCS−Mに通知すると共に、サーバーA群内のサーバーA−1・A−3のGCCS−Sにも通知する。
【0029】
サーバーA−3もGCCS−Sオペレーティングシステムにより、リソースの空き状況をコントロールサーバーのGCCS−Mに通知すると共に、サーバーA群内のサーバーA−1・A−2のGCCS−Sにも通知する。
【0030】
これにより、サーバーA群内でのリソースの空き状況をサーバーA−1・A−2・A−3間で監視し、必要時にいつでも他リソースを利用できリソースの有効活用が出来る。
【0031】
また、ルータAはGCCS−Rオペレーティングシステムにより、ルータ内のリソースを監視しコントロールサーバーのGCCS−Mにリソースの空き状況を通知するとともに、通信制御の通信回線トラヒック状況をコントロールサーバーのGCCS−Mに通知する。
【0032】
これにより、サーバーA−1・A−2・A−3は自己の回線使用率に合わせた通信回線の確保を、コントロールサーバーのGCCS−Mが制御することにより行われる。これらの機能は、サーバーB群・ルータBに於いても同様に、リソースの監視と通信回線の監視を行う。
【0033】
また、ジョブの実行に関して、サーバーA群内のサーバーA−1に於いて画像処理等で多量のデーターや処理を行う場合、サーバーA−1はGCCS−Sの機能により、大きなデーターを他サーバーに分散して処理を行う機能と、大きな処理(ジョブ)を小さな単位(タスク)に分割して、他サーバーに分散し並列処理する機能がある。
【0034】
これらの機能により、サーバーA−1に於いて大きな処理を行う場合、サーバーA−1は、コントロールサーバーのGCCS−Mに対しリソースオーバー通知を行う。コントロールサーバーGCCS−Mは、サーバーA−2・A−3のリソース状況を確認し、リソースの空いているサーバーGCCS−Sに利用通知を出すと共に、サーバーA−1のGCCS−Sに使用許可を出す。
【0035】
コントロールサーバーGCCS−Mから使用通知をもらったサーバーA−1のGCCS−Sは、使用許可の出たサーバーA−2・A−3のGCCS−Sに使用通知を出し、ジョブを分割化したタスク処理の一つをサーバーA−1・A−2のGCCS−Sに渡しタスクの実行指示を行う。タスク処理を受けたサーバーA−1・A−2のGCCS−Sはタスクの実行を行い、進捗状況をサーバーA−1のGCCS−Sに通知すると共にコントロールサーバーのGCCS−Mにも通知する。
【0036】
サーバーA−1は、GCCS−Sによりジョブの進行状況の管理とサーバーA−2・A−3に渡したタスク処理の進捗状況の管理を行う。サーバーA−1のGCCS−Sは、自己のタスクの進捗状況とサーバーA−2・A−3のGCCS−Sからタスクの進捗状況の通知を受け、すべてのタスク完了通知を受けてジョブの処理完了となり、サーバーA−2・A−3のGCCS−SとコントロールサーバーのGCCS−Mに完了通知を行う。完了通知を受けたサーバーA−2・A−3はリソースの解放となり、コントロールサーバーのGCCS−Mに新たに空きリソース状況を通知する。
【0037】
ところで、サーバーA−1の処理が、サーバーA群内の空きリソースだけでは処理能力が不足する場合には、サーバーA群の処理と同時に、サーバーB群の空きリソースも利用可能になっている。ただし、本実施形態では、利用に際してはコントロールサーバー経由での利用に限られ、直接サーバーB群のサーバーB−1・B−2・B−3に指示を出せないようになっている。
【0038】
サーバーB群を利用する際には、サーバーA−1のGCCS−Sは、コントロールサーバーのGCCS−Mに使用通知を出し、コントロールサーバーのGCCS−Mから使用許可を受けて、サーバーA−1のGCCS−Sは、コントロールサーバーのGCCS−Mにタスク処理を依頼する。
【0039】
コントロールサーバーGCCS−Mは、空きリソースの通知のあったサーバーB−1・B−2・B−3のGCCS−Sに使用通知を出し、サーバーA−1のジョブの分割化されたタスク処理の一つをサーバーB−1・B−2・B−3に渡しタスクの実行指示を行う。
【0040】
サーバーB−1・B−2・B−3のGCCS−Sはタスクの実行と進捗状況を、コントロールサーバーのGCCS−Mに通知する。コントロールサーバーのGCCS−Mは、サーバーB−1・B−2・B−3のGCCS−Sからタスクの進捗状況を受けると、サーバーA−1のGCCS−Sにタスクの進捗状況の通知を行う。
【0041】
サーバーA−1のGCCS−Sは、自己のタスクの実行完了とサーバーA−2・A−3のGCCS−SとコントロールサーバーのGCCS−Mからタスクの実行完了(サーバーB−1・B−2・B−3のタスクの実行完了)の通知を受けて、すべてのタスク実行完了としてジョブの処理完了となり、サーバーA−2・A−3のGCCS−SとコントロールサーバーのGCCS−Mにジョブの完了通知を行う。
【0042】
コントロールサーバーのGCCS−Mは、サーバーA−1のGCCS−Sから完了通知を受け、各サーバーB−1・B−2・B−3のGCCS−Sに完了通知を行う。完了通知を受けたサーバーA−2・A−3・B−1・B−2・B−3はリソースの解放となり、コントロールサーバーのGCCS−Mに新たに空きリソース状況を通知する。
【0043】
コントロールサーバーGCCS−Mは、サーバー群単位での空きリソースやタスク処理の管理制御を行い、サーバー群が増えた場合でもコントロールサーバーのGCCS−Mにてサーバー群単位での空きリソースやタスク処理の管理制御を行う。
【0044】
この機能は、ルータAとルータB間でも同じことが出来、ルータAのGCCS−Rは、通信制御の通信回線使用状況(トラヒック)をコントロールサーバーのGCCS−Mに通知する。同様にルータBのGCCS−Rは、通信制御のトラヒックをコントロールサーバーのGCCS−Mに通知する。
【0045】
ルータAのトラヒックがオーバーする場合、ルータAのGCCS−RはコントロールサーバーのGCCS−Mにトラヒックオーバー通知を行う。コントロールサーバーのGCCS−Mは、ルータBのGCCS−Rに通信回線の空きが有るか確認通知を出す。ルータBに空きがある場合、ルータBのGCCS−Rより、コントロールサーバーのGCCS−Mに対しトラヒックに空きがあることを通知する。コントロールサーバーのGCCS−Mは、ルータBのGCCS−Rに通信回線の使用通知を出す。
【0046】
このようにルーターAは、ルータBの通信回線の空きを利用し通信回線のトラヒックオーバーを回避する。
【符号の説明】
【0047】
A−1、2、3…サーバA群のサーバ
B−1、2、3…サーバB群のサーバ
M…コントロールサーバ

【特許請求の範囲】
【請求項1】
複数のサーバやルータの資源を管理するであって、
通信可能な状態で互いに接続された複数のサーバと、該サーバに通信可能な状態に接続されたルータとを備えるサーバ群が複数存在し、
各サーバ群の間において、各サーバが互いに通信可能な状態に接続されるとともに、各ルータが互いに通信可能な状態で接続され、
某サーバ群において多量の処理を行う場合、他のサーバ群において当該処理を分散して行い、
某サーバ群において多量のトラヒックがある場合、他のサーバ群のルータにおいて当該トラヒックを分散して行うことを特徴とする複合型資源管理システム。
【請求項2】
前記各サーバ群における前記サーバと前記ルータと通信可能な状態に設けられたコントロールサーバを備え、
該コントロールサーバは、某サーバ群において多量の処理を行う場合、某サーバ群のサーバからリソースオーバー通知を受けたあと、他のサーバ群のサーバのリソース状況を確認して、リソースに余裕のあるサーバ群のサーバにおいて処理を分散して行わせ、
某サーバ群において多量のトラヒックがある場合、某サーバ群のルータからトラヒックオーバー通知を受けたあと、他のサーバ群のルータのトラヒック状況を確認して、トラヒックに余裕のあるサーバ群においてトラヒックを分散して行わせる請求項1に記載の複合型資源管理システム。
【請求項3】
前記ルータは、前記サーバと同様にCPU、メモリ、通信制御部、WAN制御部およびLAN制御部から構成される請求項1または請求項2に記載の複合型資源管理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−32990(P2012−32990A)
【公開日】平成24年2月16日(2012.2.16)
【国際特許分類】
【出願番号】特願2010−171755(P2010−171755)
【出願日】平成22年7月30日(2010.7.30)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(510208686)
【出願人】(510208697)
【Fターム(参考)】