物理計算機及び冷却装置の制御方法及びサーバシステム
【課題】 システム全体の消費電力をより小さくするための冷却制御を決定する。
【解決手段】プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機の制御方法であって、前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法である。
【解決手段】プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機の制御方法であって、前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法である。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物理計算機及び冷却装置の制御方法に関し、特にCPUの稼動率に応じた物理計算機のファン及び冷却装置の出力の制御方法に関する。
【背景技術】
【0002】
プロセッサの高性能化、ブレードサーバのような高密度なIT(Information Technology)機器の出現により、ITシステムの消費電力の増加が大きな問題となっている。この問題に対して、低消費電力プロセッサ,高効率冷却方式など消費電力を削減する技術の開発が進められているが、装置単体の省電力化には限界があり、より大きな省電力効果を得るためにはITシステムと冷却装置とを含むコンピュータ室全体での取り組みが必要である。
【0003】
現在のITシステムの冷却について説明する。サーバの稼働率上昇に伴いCPUやメモリなどの部品は熱を発生する。サーバは冷却ファンを備えており、サーバ筐体内の温度を検出し、温度が一定のしきい値を超えると、気流を発生させて発熱部品を冷却する。熱はこの気流により筐体の外に排出される。この冷却ファンの制御に関して、発熱部品の温度と温度変化に基づいてファンを制御し冷却を効率化する発明が特許文献1に開示されている。また、発熱部品の温度と温度変化に基づいてファンを制御し、冷却を効率化する発明が特許文献2で開示されている。
【0004】
一方、サーバを設置するコンピュータ室には機器の発生する熱を冷却するための冷却装置が設置されており、固定のセンサの温度をもとに出力を決定し、室内の温度を一定に保つ。しかし、IT機器の発する熱の偏りや機器の配置によって、コンピュータ室の温度を均一することは難しい。この冷却装置の制御に関して、マシン室内の空気流を監視し、空気流に応じて換気を行う発明が特許文献3に開示されている。
【0005】
コンピュータ室の熱の偏りが大きい場合は、熱だまりにある機器がCPU熱暴走により動作が不安定になる、また、CPU温度制御回路が作動し、強制的に処理性能を落としたり、シャットダウンしたりすることがある。強制的なシャットダウンによる不具合の発生を回避するため、温度が一定値を超えた場合ハイバネーションにより放熱制御して障害、シャットダウンを回避する発明が特許文献4で開示されている。
【0006】
また、CPUの現在の処理内容、CPUの温度特性、外部から入力されたユーザの指示に基づいて一定時間経過後の温度を予測し、予測された温度が基準値を上回った場合には、CPUの処理を他のCPUに移動する方法が、特許文献5に開示されている。
【0007】
【特許文献1】特開2002−268775
【特許文献2】特開2008−84173
【特許文献3】特開2006−208000
【特許文献4】特開2008−158787
【特許文献5】特開2007-241376
【発明の開示】
【発明が解決しようとする課題】
【0008】
今後は、熱の偏りを無くすためコンピュータ室全体を大規模な冷却装置で均一に冷やすのではなく、局所的に温度を制御できる冷却装置が重要になる。例えば、指向性のある冷却装置、ラック背面に取り付けるラック単位の冷却装置などが既に出荷されている。また、床下からの冷風によって冷却を行う設備の場合には、床のグレーティング板(穴あきタイル)の開閉を制御して、床下からの送風箇所を変更し、温度の高い箇所を集中的に冷やすようになる。
【0009】
また、発熱部品の稼動率が上昇してから熱が発生し、その熱が温度センサに検出されるまでには遅延がある。また、温度上昇が検出されてファンや空調の出力が上がり、実際に冷却効果が出るまでにはさらに遅延がある。このため、バースト的な負荷が発生した場合は、ファンの出力が上がっても一時的には温度が上昇し、その後安定稼動可能な温度に落ち着く。しかし、CPUは自身の温度が上昇すると、リーク電流が指数関数的に増加して冷却の電力もより多く必要になる。
【0010】
この結果、冷却能力が不足してCPU熱暴走により動作が不安定になる、または、CPU温度制御回路が作動し、強制的に処理性能を落としたり、シャットダウンすることがある。ハイバネーションにより、強制シャットダウンを回避しても、処理は中断せざるを得ない。
【0011】
また、サーバの冷却ファンが回転数を上げても、サーバ背面の空気流が不足していると、熱が排出穴に運ばれずに周囲の機器に拡散し、他の機器の温度も上昇し障害を招くおそれがある。現在の冷却装置は一点で計測した温度情報を元に出力を調整しているため、あるサーバで発生した熱がその計測点に回り込むまで空調は連動しないので、このような状態になることがある。
【課題を解決するための手段】
【0012】
前記目的を達成するために、本発明の制御方法は、プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機の制御方法であって、前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法である。
【0013】
また、本発明のサーバシステムは、プロセッサとファンを有し、前記プロセッサの温度及び稼働率と前記ファンの回転数と入気温度とを計測する前記サーバ装置と、前記サーバ装置及び前記冷却装置に接続し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値を以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定する管理計算機とを有する、ことを特徴とするサーバシステムである。
【発明の効果】
【0014】
本発明によれば、CPUを事前に冷却して最適温度に保つことにより、リーク電流による電力の消費を最小にし、冷却効率を上げることができる。
【発明を実施するための最良の形態】
【0015】
以下に、本発明の実施の形態を説明する。
【実施例】
【0016】
(第1の実施例)
図面を用いて、本発明の一実施形態を説明する。
【0017】
図1は、本発明の一実施例のシステム構成を示す図である。本実施例のシステム構成は、情報処理システムあるいはストレージシステム等である。例えば、1つの管理計算機100と、1つ以上の物理計算機200と、1つ以上のストレージ装置230と、該管理計算機100、該物理計算機200、該ストレージ装置230とを設置したコンピュータ室を冷却する冷却装置151と、冷却装置151を制御する冷却装置制御部150を備えて構成されている。そして、管理計算機100、物理計算機200及び冷却装置151は、管理ネットワーク225経由で接続している。また、物理計算機200とストレージ装置230は、例えばファイバチャネルネットワーク226で接続している。ここで、冷却装置制御部150は、冷却装置151を一括に制御すべく、物理計算機のメモリにプログラムとして格納されてもよい。また、冷却装置制御部151は、管理計算機内のメモリにプログラムとして格納されていてもよい。
【0018】
図2は、本発明の一実施例における管理計算機100を示す図である。
【0019】
管理計算機100の動作の概要を説明する。詳細については、以下に図面に沿って説明を加える。管理計算機100は、物理計算機200とストレージ装置230および冷却装置制御部150を管理する。そして、複数の物理計算機200と情報の授受を行って、複数の物理計算機200の稼動状況を検出する。検出した複数の物理計算機200の稼動状況に応じて、冷却装置制御機能151を介して冷却装置151を個別に制御する。また、検出した複数の物理計算機200の稼働状況に応じて複数の物理計算機200のファン回転数や冷却装置を制御する。
【0020】
管理計算機100は、中央演算装置CPU(Central Processing Unit)101、ハードディスク装置やフラッシュメモリ等の記憶装置105、メモリ102、バス107、ネットワークインタフェース104、ディスクインタフェース103から構成される。
【0021】
メモリ102には、サーバプログラム110が格納されている。そして、サーバプログラムには、稼動情報監視部111、温度監視部112、CPU温度推定部113、ファン回転数決定部115、ファン監視・制御部116、冷却制御部117が含まれる。これらのプログラムは、当初、磁気ディスク105に格納され、必要に応じてメモリ102に転送された後、CPU101で実行される。稼動情報・電力監視部111は、物理計算機200の稼動情報および消費電力情報を収集する。温度監視部112は、物理計算機の入気温度、CPU温度、排気温度を取得する。ファン監視・制御部116は、ファン回転数の情報を取得し、ファンの回転数を変更する指示を出す。CPU温度推定部113は、物理計算機に内蔵されるCPUの一定時間後の温度を推定する。ファン回転数決定部115は、CPUの一定時間後の温度を目標値まで下げるファン回転数を決定する。冷却制御決定部114は、ラック・冷却マップ126を取得し、冷却装置151の出力を決定する。冷却制御部117は、冷却装置151の出力を制御する指示を出す。
【0022】
そして、記憶装置105に、稼動情報履歴124と、サーバ構成情報121と、熱発生プロファイル122と、ファンプロファイル123と、CPU温度プロファイル125と、冷却装置プロファイル127と、CPU温度範囲128と、CPU最適温度129と、ラック・冷却マップ126と、冷却装置プロファイル2010と、が格納される。
【0023】
図3は、本発明の一実施例における物理計算機200のハードウェア構成を示す図である。
【0024】
物理計算機200は、中央演算装置CPU201、メモリ202、ハードディスク装置やフラッシュメモリ等の記憶装置205、バス207、ネットワークインタフェース204、ディスクインタフェース203、ファン208、BMC(Baseboard Management Controller)207とから構成される。
【0025】
BMC207は、サーバ入気温度、排気温度、CPU温度の監視や、ファン回転数の監視・制御、電源制御を行う。
【0026】
メモリ202には、OS222、この物理計算機の稼動情報を収集する計測エージェントプログラム223、業務サービスプログラム224が格納される。これらのプログラムは、まず、磁気ディスク205に格納され、必要に応じてメモリ202に転送された後、CPU201で実行される。なお、これらのプログラムは、可搬型記録媒体から読み出されることにより、または、各々の装置に接続されたネットワーク経由で、他の計算機または記憶装置からダウンロードされることにより、磁気ディスク205に格納されるものであってもよい。
【0027】
また、管理計算機のサーバプログラム110の各処理は、各プログラムをCPUで実行することにより実現するが、これらは計測エージェント決定部、計測部など、各処理を行う処理部として集積回路化するなどしてハードウェアで実現することもできる。
【0028】
計測エージェント223は、計算機200上で稼動し、自身が稼動する装置のCPU使用率やメモリ使用率、ネットワークインタフェースの使用率などの稼動情報を収集し、計測カウンタとして記録するソフトウェアプログラムである。管理計算機のサーバプログラム110の稼動情報・電力監視部111は、計測エージェント223に対して、SNMP(Simple Network Management Protocol)による稼動情報収集リクエストを送信する。計測エージェント223は、この稼動情報収集リクエストを受け取り、リクエスト中のオブジェクトID(Identification)で指定された計測カウンタの値を稼動情報・電力監視部111に送信する。サーバプログラム110は、この計測カウンタの値を受け取り、稼動情報として記録することで、複数の管理対象の稼動情報を一元的に管理することができる。
【0029】
図4は、本発明の一実施例における、物理計算機200、ストレージ装置230、冷却装151置などが設置されるコンピュータ室400の機器配置を示す図である。
【0030】
コンピュータ室400には、4つのラック401a、401b、401c、401dと、冷却装置151a、151bが配置されている。各ラック401と冷却装置151a、151bは、床上に固定されている。床には、複数の吹出口431〜435が設置される。吹出口431〜435は、例えば図4(b)に示すように、モータ440が固定され、モータ回転軸441には、モータ440の回転駆動に応じて、各吹出口を開閉する開閉版442が固定されている構成である。
【0031】
ラック401aには、物理計算機200及びストレージ装置230が収納されている。ラック401b〜401cにも、同様に物理計算機200及びストレージ装置230が収納されている(図示せず)。
【0032】
冷却装置151a、151bは、コンピュータ室400の側面に取り付けら、コンピュータ室400の温度を一定に保つための冷却装置151の一要素として構成されている。この冷却装置151a、151bは冷風を床下に送り、冷風が吹出口(穴あきタイル)431から吹き出すことで、各サーバが排出する熱を除去する。この際、管理計算機100からの指示に応じて、吹出口431〜435のうちいずかの吹出口を開き、他の吹出口を閉じる制御が行われる。例えば、ラック401a、401dに収納されたサーバの稼働率が高く、ラック401b、401cに収納されたサーバがアイドル状態であるときには、冷却装置151に対する制御として、モータ440の回転駆動により、吹出口431〜435のうち吹出口433が閉じ、他の吹出口431、432、434、435が開かれる制御が実行される。
【0033】
また、ラック401b、401cに収納されたサーバの稼働率が高く、ラック401a、401dに収納されたサーバがアイドル状態のときには、冷却装置151に対する制御として、モータ440の回転駆動により、吹出口431〜435のうち吹出口431、435が閉じ、他の吹出口432、433、434が開かれる制御が実行される。
【0034】
本実施例における冷却装置は、一般的なコンピュータ室空調(CRAC: Computer Room Air Conditioner)であるがこれに限定されるものではない。冷却設備は冷却された液体の冷媒がパイプを通り、各ラックを循環することで各サーバが排出する熱を除去する液冷装置であっても良い。液冷装置では、各ラックに通じるパイプの手前にバルブがあり、バルブを開閉することで、吹出口と同様に冷却出力の調整を行う。また、冷却設備は、外の冷えた空気を取り込み、コンピュータ室冷却装置と同様に床下から冷風を送ることで各サーバが排出する熱を除去する外気冷却装置であっても良い。
【0035】
図5は、本発明の一実施例におけるサーバ構成情報121を示す図である。
【0036】
サーバ構成情報121は、コンピュータ室400内に設置されたラックと、ラックに格納される物理計算機との対応関係を示すラック・物理計算機マップ500(図5(a))と物理計算機リスト510(図5(b))とからなる。
【0037】
ラック・物理計算機マップ500(図5(a))は、ラックの識別子であるラックID501と、それぞれのラックに格納される物理計算機200の識別子である物理計算機ID502で構成される。
【0038】
物理計算機リスト510(図5(b))は、物理計算機200の持つ物理計算機ID511と、シャーシ番号512と、構成要素識別子(項目)513と、構成要素の値514からなる一つ以上のレコードで構成され、物理計算機200の処理能力を表す。物理計算機ID501には、各物理計算機の識別子が格納されている。シャーシ番号512は、当該物理計算機がブレードサーバである場合に、ブレードサーバを格納するシャーシを特定するためにある。1Uサーバなどの非モジュラータイプのサーバである場合には、”-”が記録される。ブレードサーバは、複数のサーバでファンや電源を共有しており、サーバの構成や電源On/Offを管理する管理用プロセッサを持つ場合がある。管理対象物理計算機がブレードサーバである場合には、個々のサーバではなく、この管理用プロセッサに接続してCPU温度や共有するファンの回転数を得ることができる。管理用プロセッサに接続するため必要なIPアドレスやポート番号は、図示しないがサーバ構成情報として管理されているものとする。
【0039】
サーバ構成情報121は、管理対象システムの設計者がシステム構築時に決定し、文書またはソフトウェアによって管理していることが多い。物理計算機構成情報は、このような管理されている構成情報に基づいて作成してもよいし、動的に収集した情報から作成してもよい。
【0040】
図6は、本発明の一実施例におけるラック・冷却装置マップ126を示す図である。
【0041】
ラック・冷却装置マップ126は、ラックの識別子601と、冷却装置151の識別子602と、ラックの前面に位置する吹き出し口603と、ラックの背面に位置する吹き出し口604とからなる一つ以上のレコードで構成される。各レコードは、ラックと、各ラックを冷却している冷却装置151と、ラックに対して送風・換気を行う吹き出し口の識別番号との対応を表している。
【0042】
図7は、本発明の一実施例における稼動情報710(図7(a))および電力情報720(図7(b))を示す図である。
【0043】
稼動情報710(図7(a))は、一つの物理計算機200のリソース使用状況を示す。一例として、計測日711、計測曜日712、計測時刻713、CPU稼働率714とからなる一つ以上のレコードで構成される。CPU稼働率の単位は%である。ここで示す稼動情報は、Windows(登録商標)であればWMI(Windows Management Interface)で、LinuxであればTopコマンドで取得することが可能である。
【0044】
電力情報720(図7(b))は、各物理計算機200の電力消費状況を示すものであり、計測日721、計測曜日722、計測時刻723、物理計算機の電力量724および、シャーシの電力量726からなる一つ以上のレコードで構成される。なお、物理計算機200が、ブレードサーバである場合には、複数の物理計算機の電力量とシャーシの電力量が一つのテーブルで管理されている。一方、物理計算機200がブレードサーバでない場合には、一つの物理計算機の電力量だけが管理される。
【0045】
図8は、本発明の一実施例における熱発生プロファイル122を示す図である。
【0046】
熱発生プロファイル122は、CPU稼働率801と、発熱量802とからなる一つ以上のレコードで構成される。ここで、稼働率811とは、CPUの稼働率であり、発熱量と802とは、CPUの発熱量である。つまり、各レコードは、物理計算機200のCPUの稼働率に対する、発熱量を表している。
【0047】
熱発生プロファイル122は、物理計算機200の備えるCPUの種類ごとに異なる。熱発生プロファイルの取得方法は様々な方法がある。例えば、CPUの過去の稼動率と発熱量の履歴を記録しておき、該履歴より取得することができる。また、事前にCPUによる処理を実行し、稼動率と発熱量の関係を測定することもできる。また、CPUベンダより提供された稼動率と発熱量との関係を記録することもできる。
【0048】
図9は、本発明の一実施例におけるCPU温度プロファイル125(図9(a))、CPU温度範囲128(図9(b))、CPU最適温度129(図9(c))、温度上昇とリーク電流による消費電力の関係、および温度上昇とファン消費電力との関係(図9(d))を示す図である。
【0049】
CPU温度プロファイル125(図9(a))は、CPUの発熱量901と、一定時間あたりのCPU温度変化902からなる一つ以上のレコードで構成される。つまり、各レコードは、CPUの発熱量に対する、一定時間後の温度変化量を表している。
【0050】
一般に、物体の温度変化は外部から与えられる熱量を熱容量で割った値になるが、物体の性質によって熱の伝わりやすさが異なる。すなわち、同じ熱量が与えられても、CPUの材質や構造によって最終的に到達する温度、および温度変化の速度は異なる。このため、CPU温度プロファイルはCPU種類ごとに決まるテーブルである。
【0051】
上記のように、CPU温度プロファイル125は、物理計算機200の備えるCPUの種類ごとに異なる。CPU温度プロファイルの取得方法は様々な方法がある。例えば、CPUの過去の発熱量と温度変化の履歴を記録しておき、該履歴より取得することができる。また、事前にCPUによる処理を実行し、発熱量と温度変化の関係を測定することもできる。また、CPUベンダより提供された発熱量と温度変化との関係を記録することもできる。
【0052】
CPU温度範囲128(図9(b))は、上限値911と下限値912から成り、CPUが安全に稼動する温度の範囲を示している。通常、CPUは製造ベンダによって正常に動作する温度の上限と下限が決められている。そして、多くのサーバでは、室温の上昇やファンの故障によって、CPU温度がこの範囲を超えると、サーバのハードウェア状態を監視するプログラムがサーバ外部に警告を出す。
【0053】
CPU最適温度129は、CPUのリーク電流による消費電力と、CPUを冷却するファンが消費する電力との総和を最小にする温度である。CPU最適温度129は、入気温度によって変化するため、入気温度921と、CPU最適温度922からなる一つ以上のレコードで構成される。
【0054】
CPU最適温度129について説明する。半導体の微細化によりCPUにはOFF状態であっても微量の電流(リーク電流)が流れるが、このリーク電流は温度が上昇すると指数関数的に上昇するという特性を持つ。このため、アイドル状態であっても、CPU自身の温度が上昇すると消費電力も指数関数的に上昇する。このリーク電流によるCPU消費電力を抑えるには、CPU温度を上げない方が良いが、温度を維持するには冷却用の電力が必要になる。一般に、ファン消費電力はファンの風速、消費電力に比例しており、CPU温度上昇の2乗に反比例する。したがって、図9(d)に示すように、温度を低く保つとリーク電流は抑えられるが、ファンの消費電力は増加し、温度上昇を許せばリーク電流は増加するが、ファンの消費電力は低くすることができるというトレードオフの関係となる。CPU最適温度129は、このリーク電流による消費電力とファン消費電力との総和が最小になる温度であり、管理者が測定することも可能であり、サーバベンダが公開することも考えられる。
【0055】
図10は、本発明の一実施例におけるファンプロファイル123を示す図である。
【0056】
ファンプロファイル123は、物理計算機200のファンの回転数1001と、ファンの送風によりCPUを冷却し、一定時間あたりに変化させることのできるCPUの温度変化1002からなる一つ以上のレコードで構成される。そして、ファンによるCPUの冷却効率は、入気温度により変化する。したがって、ファンにより、一定時間あたりに変化させることのできるCPUの温度変化は入気温度により異なる。本実施例のファンプロファイルでは、21℃、22℃、23℃(1003)の入気温度の場合を示しているがこれに限定されるものではない。
【0057】
また、サーバのCPUとファンとの関係は1対1とは限らない。例えば、一つの筐体に複数のサーバが格納されるブレードサーバでは、複数のサーバを共有のファンで冷却することがある。このような場合でも、ファンは、各CPUを均一に冷やすよう構成されており、前述のようなファンプロファイル123を定義することができる。
【0058】
図20は、本発明の一実施例における冷却装置プロファイル2010と、冷却制御パターン2010を示す図である。
【0059】
冷却制御プロファイル2010は、冷却装置ごとに分かれており、冷却装置の出力段階2011と、その出力段階時の各冷却対象ラックの入気温度変化2012と、消費電力2013とからなる一つ以上のレコードで構成される。
【0060】
冷却制御パターン2020は、複数の冷却装置の出力の組み合わせと消費電力を表すものであり、組み合わせ番号2021と、各冷却装置の出力2022と、その時の冷却装置全体の消費電力量2023からなる一つ以上のレコードで構成される。
【0061】
図5から図10で示した情報は、管理者が定義ファイルに記述する。ただし、これらの情報は、定義ファイルでなく、GUI(Graphical User Interface)から入力してもよいし、他のサーバからネットワークを介して取得してもよい。
【0062】
次に、本発明の一実施例における管理計算機による物理計算機と冷却装置の制御を、図を用いて説明する。
【0063】
図11は、本発明の一実施例における、管理計算機よる物理計算機と冷却装置の制御フローを示した図である。
【0064】
まず、物理計算機のサーバプログラム110の稼動情報監視部111は、サーバ構成情報121を記憶装置105から読み出す(S1101)。そして、管理する物理計算機200を把握し、稼動情報監視部111がこれら物理計算機200の稼動情報および消費電力を収集し(S1102)、サーバ稼動履歴124に格納する。
【0065】
そして、CPU温度推定部113は、格納した稼動履歴と、記憶装置に格納された熱発生プロファイル122、CPU温度プロファイル125に基づいて、各物理計算機200の一定時間経過後のCPU温度を推定する(S1103)。この推定の処理は図12を用いて説明する。
【0066】
図12は、本発明の一実施例におけるCPU温度推定フローを示す図である。本処理は、CPU温度推定部により実行される。
【0067】
CPU温度推定部113は、サーバ稼動履歴124を参照して、処理対象である物理計算機200のCPU稼働率714を取得する(S1201)。
【0068】
そして、CPU稼働率に対して発生する熱量を、熱発生プロファイル122を参照して求める(S1202)。この時、まず、サーバ構成情報121のサーバリスト510を参照して、当該物理計算機200のCPU種類を求め、CPU種類に対応するCPU温度プロファイルを用いる。
【0069】
次に、発生した熱量に対するCPU温度変化を、CPU温度プロファイル125を参照して求める(S1203)。具体的には、CPU温度推定部113は、温度監視部を用いて現在のCPUの温度とサーバ装置への入気温度を取得し、ファン監視・制御部116を用いて現在のファン回転数を取得する。そして、ファンプロファイル123を参照して、現在時刻から一定時間経過後まで現在のファン回転数を維持した場合のCPU温度変化(冷却効果)を求める(S1204)。ファン監視・制御部116は、前記BMC207に対してSSH(Secure Shell)などによって接続し、ファン回転数を取得するコマンドを実行し、ファン回転数の値を取得する。
【0070】
最後に、現在のCPU温度に発生した熱量に対するCPU温度変化を加算し、ファンによる温度変化を引いて、一定時間経過後のCPU温度とする(S1205)。
【0071】
一定時間経過後のCPU温度の推定値が算出されたら、一定時間経過後の推定温度が、設定したしきい値を超えるか否かを確認する(S1104)。設定したしきい値を超える場合(Yの場合)、温度監視部により物理計算機への入気温度を取得し、ファン回転数決定部115は取得された入気温度とファンプロファイル123を参照して、一定時間経過後のCPU温度を上限値内に抑えるために必要なファン回転数を算出する(S1105)。
【0072】
ファン回転数を決定する一例を図13に示す。つまり、図13は、本発明の一実施例におけるファン回転数決定フローを示す図である。
【0073】
CPU温度の推定値がしきい値を上回る場合、ファン回転数決定部115は、推定した一定時間経過後のCPU温度とCPU温度のしきい値との差分を求め、実現すべきCPU温度変化量とする(S1301)。
【0074】
そして、一定時間経過後のCPU温度を推定する際に取得した、物理計算機への現在の入気温度と、ファンプロファイル123とを参照して、一定時間経過後の実現すべきCPU温度変化量とするためのファン回転数を求める(S1302)。
【0075】
しきい値を超えない場合は、一定時間経過を待ち(S1108)、稼動情報・温度・回転数の監視に戻る(S1102)。ここで、しきい値は、CPU温度範囲128の上限値であってもよい。また、しきい値は、上限値より一定値引いた値であってもよい。上限値より一定値を引いた値をしきい値とすることにより、突然稼動量が上昇した場合であっても、上限値を以下で稼動することができる。
【0076】
また、本実施例においては、一定時間経過後のしきい値を超えるか否かにより、ファンの回転数を制御するか否かを決定したが、これに限られるものではない。他の実施形態として、温度監視部112により入気温度を取得し、取得した入気温度からCPUリーク電流とファン消費電力の合計を最小にする値であるCPU最適温度129を決定する。そして、CPU最適温度から一定温度減算した値より、CPU最適温度に一定温度加算した値の範囲範囲内であるか否かにより判断1104をしてもよい。
【0077】
次に、サーバプログラム110は、物理計算機200がファンの回転数を算出した回転数へ変更可能であるか確認する(S1106)。例えば、処理1105にて求めたファン回転数が、最大値を超えているかどうかを確認する。変更可能である場合には(S1106:Y)、ファン監視・制御部116は、物理計算機200に対して、ファンの回転数を変更するよう指示を出す(S1107)。そして、一定時間経過を待ち(S1108)、稼動情報・温度・回転数の監視に戻る(S1102)。
【0078】
物理計算機200のファンが、ファン回転数決定部115が決定したファンの回転数を実現できない場合には(S1106:N)、冷却制御部117は、コンピュータ室400に設置された冷却設備151a、151bの出力を変更して当該物理計算機200の入気温度を下げる(S1520)。この処理は図21を用いて説明する。
【0079】
図の21は、本発明の一実施例における冷却制御フローを説明する図である。
【0080】
冷却制御部117は、ファンプロファイル123を参照して、実現すべきCPUの温度変化量を達成する、目標入気温度を求める(S2101)。ここで、ファン回転数は実現できる最大値とする。つまり、図10の5000回転が最大値であり、CPU温度変化を-3.0℃とした場合には、目標入気温度を21℃と求める。
【0081】
そして、現在の入気温度と目標入気温度との差分を求め入気温度変化目標値とする(S2102)。
【0082】
次に、冷却制御部117は、サーバ構成情報121を参照して制御対象の物理計算機200が格納されるラックを特定する。そして、ラック・冷却マップ126を参照して、特定したラックの冷却を担当する冷却設備を特定する。特定されるラックは複数台であってもよい。そして、冷却制御部117は、この冷却装置の出力を、前記差分に応じて変更するよう指示する。
【0083】
具体的な冷却装置の出力の決定方法は、冷却装置プロファイル2010を参照して、ラック温度変化量が、入気温度変化目標値以上である出力段階を選択する。
【0084】
ただし、本実施例のように複数の冷却装置が同一ラックを冷却する場合には、どの冷却装置の出力を変更するかによってコンピュータ室全体の消費電力が異なる。そこで、管理対象ラックの入気温度を目標入気温度にするために、冷却設備151aおよび冷却設備151bが取り得る出力の組み合わせを列挙した冷却制御パターンリスト2030を作成する(S2103)。
【0085】
そして、冷却設備151aと冷却設備151bとの消費電力の和が最小となる組み合わせを選択する(S2104)。
【0086】
例えば、組み合わせには、冷却設備151aは段階1にして、冷却設備151aは段階3とするパターン、両方の出力を段階2とするパターン、冷却設備151aを段階3として、冷却設備151bを段階1とするなどのパターンがある。ここで、温度変化、つまり冷やせる温度に対する冷却装置の消費電力は、装置の特性やラックとの距離によって異なるため、各パターンの消費電力は異なる。そして、冷却設備151a、151bの出力を変更して当該物理計算機200の入気温度を下げる(S2105)。
そして、一定時間経過を待ち(S1108)、稼動情報・温度・回転数の監視に戻る(S1102)。
【0087】
本実施例の物理計算機プロファイル124は、主な発熱部品であるCPUのみに着目しているが、熱発生プロファイルはCPUだけでなく、他の部品の利用率に応じた情報であってもよい。
【0088】
また、本実施例は、IT装置がサーバである場合について説明したが、IT装置はストレージ装置、ネットワーク機器であっても良い。IT装置がストレージ装置の場合には、装置の発熱量はCPU稼働率だけではなく、装置へのデータ入出力回数を示すIOPS(Input Output Per Second)によって変化するため、コントローラのCPU稼働率やIOPSに基づいて発熱量を推定することができる。同様にIT装置がネットワーク機器の場合には、ポートの使用率に基づいて発熱量を推定することができる。
【0089】
上述したように、省電力制御サーバ110を、物理計算機200の稼動情報および消費電力情報を収集する稼動情報監視部111と、前記管理対象サーバの入気温度、CPU温度、排気温度を収集する温度監視部112と、前記管理対象サーバのファン回転数を監視し、前記ファンの回転数を変更するファン監視・制御部116と、熱発生プロファイル122およびCPU温度プロファイル125を読み込み、前記管理対象サーバが内蔵するCPUの一定時間後の温度を推定するCPU温度推定部113と、ファンプロファイル123を読み込んで前記CPUの一定時間後の温度を目標値まで下げるファン回転数を決定するファン回転数決定部115と、冷却装置プロファイル127と、ラック・冷却マップ126の入力を受け付け、冷却装置151の出力を決定する冷却制御決定部114と、冷却装置151の制御を指示する冷却制御部117とで構成することで、CPUを事前に冷却して最適温度に保ち、リーク電流による電力の消費を最小にし、冷却効率を上げることができる。また、サーバのファンと空調を連携して制御することにより、ファンの制御だけではCPUの温度を規定範囲内にできない場合であっても、事前に空調を調整して入気温度を下げておくことで、CPUの温度を規定の範囲内に収めて熱による障害の発生を回避できる。
【0090】
なお、本実施例においては、管理計算機からの指示によりサーバ装置内のBMCがファンを制御するが、これに限定されるものではなく、サーバプログラム110を物理計算機のメモリに格納し、稼動情報履歴124と、サーバ構成情報121と、熱発生プロファイル122と、ファンプロファイル123と、CPU温度プロファイル125と、冷却装置プロファイル127と、CPU温度範囲128と、CPU最適温度129と、ラック・冷却マップ126と、冷却装置プロファイル2010とを記憶装置に格納し、物理計算機内において本実施例におけるファン制御及び空調装置制御を行ってもよい。
(第2の実施例)
以下、本発明の第2の実施形態を図面に基づいて説明する。第1の実施例と、同一の構成部分については、適宜図面及び説明を省略する。
【0091】
本発明の一実施例のシステム構成は、図1と同様である。また、物理計算機は、図3と同様である。
【0092】
図14は、本発明の一実施例の管理計算機を示す図である。実施例1の管理計算機との相違点は、稼動履歴情報124を保持せず、ジョブ実行スケジュール132、サーバ・ジョブマップ131を保持していることである。既に実施例1にて説明したサーバ構成情報121、熱発生プロファイル122、ファンプロファイル123、CPU温度プロファイル125、ラック・冷却マップ126、CPU温度範囲128、CPU最適温度129については、説明を省略する。
【0093】
管理計算機の動作を簡単に説明する。なお、詳細な説明は以下、図を用いて行う。サーバプログラム110は、管理対象サーバが実行する業務のジョブ実行スケジュール(負荷変動)から一定の期間におけるCPU稼働率を求め、CPU稼働率と、CPU種類ごとに決まっている稼働率に対する発熱量とから、一定時間後のCPUの温度を推定し、CPU温度が、CPUが安定稼動する温度範囲の上限値を超えることを確認すると、前記管理対象サーバのファン回転数及び必要に応じて冷却装置の出力を制御する。
【0094】
図15は、本発明の一実施例におけるサーバ・ジョブマップ131(図15(a))と、ジョブ実行スケジュール132(図15(b))とを示す構成図である。
【0095】
サーバ・ジョブマップ131(図15(a))は、物理計算機の識別子である物理計算機ID1401と、業務の種類を示す業務種別1402からなる一つ以上のレコードで構成される。各レコードは、どの物理計算機で、どの業務を実行しているかを示す。
【0096】
ジョブ実行スケジュール132(図15(b))は、物理計算機ごとに、日1411と、曜日1412、開始時刻1413、終了時刻1414、ジョブID1415、平均CPU稼働率1416とからなる1つ以上のレコードで構成される。各レコードは、曜日と時間帯ごとの、業務によって発生するCPU稼働率の平均値を示している。サーバのCPU稼働率は、バッチジョブの実行スケジュール、業務リクエストの時間的変動、またはサーバのOn/Offスケジュールなどによって予測する。ジョブ実行スケジュール132は、バッチジョブの実行スケジュール、業務リクエストの時間的変動、またはサーバのOn/Offスケジュールと、同等の処理を実行した時のサーバ稼動履歴から求める。
【0097】
図16は、本発明の第二の実施例の制御フローを示すフローチャートである。まず、サーバプログラム110の稼動情報監視部111は、サーバ構成情報121を取得し(S1601)、管理する物理計算機200の情報を取得する。そして、管理する物理計算機のジョブ実行スケジュールの情報を取得する。
【0098】
次に、サーバプログラム110は、ジョブ実行スケジュールを確認し、物理計算機200が実行するジョブの終了時刻に達しているかを確認する(S1603)。そして、ジョブの終了時刻の場合(S1603:Y)、サーバ・ジョブマップ131を参照して、物理計算機200が次に実行するジョブを特定し、ジョブに対応するジョブ実行スケジュール132を参照して、当該物理計算機200が実行するジョブの開始・終了時刻と平均CPU稼働率を取得する(S1604)。
【0099】
そして、CPU温度推定部113は、平均CPU稼働率と、熱発生プロファイル122、CPU温度プロファイル125に基づいて、各物理計算機200の一定時間経過後のCPU温度を推定する(S1604)。温度推定の処理は第一の実施例と同一である。
【0100】
ここで、例えば、これから開始する負荷区間の平均CPU稼働率が0である場合は、ファンの回転数を落とす、または停止することで消費電力を抑えることができる。
【0101】
また、処理1606の処理も実施例1と同様である。
【0102】
本実施例では、ジョブ実行スケジュールから、実行されるジョブとそのジョブを処理するためのCPU稼働率を取得した。しかし、これに限定されるものではなく、例えば、過去に処理されたジョブやCPU稼働率などのデータを格納しておき、格納されたデータをもとにある時間のCPU稼働率を予測し、CPU稼動率を取得してもよい。
(第3の実施例)
以下、本発明の第3の実施形態を図面に基づいて説明する。第1の実施例と、同一の構成部分については、適宜図面及び説明を省略する。
【0103】
本発明の一実施例のシステム構成は、図1と同様である。また、物理計算機は、図3と同様である。
【0104】
図17は、本発明の一実施例の管理計算機を示す図である。実施例1の管理計算機との相違点は、サーバプログラムにルール判定部133を保持し、記憶装置に冷却制御ルールを保持している点である。既に実施例1にて説明したサーバ構成情報121、熱発生プロファイル122、ファンプロファイル123、稼動履歴情報124、CPU温度プロファイル125、ラック・冷却マップ126、CPU温度範囲128、CPU最適温度129については、説明を省略する。
【0105】
図18は、本発明の第3の実施例の冷却制御ルール131を示す構成図である。
【0106】
冷却制御ルール131は、ルール1010とアクション1020からなり、ルール1010は、評価項目1011と、しきい値1012からなる一つ以上のレコードで構成される。各レコードは1つの条件を表しており、評価項目の値がしきい値以上になったときに条件が成立し、全てのレコードで表現された条件が成立したときに、アクション1020で指定された制御が実行される。また、1つの項目の条件が成立したときに、アクション1020で指定された制御を実行してもよい。
【0107】
冷却制御ルールは、異常な温度上昇が開始したと判定できる条件であり、あらかじめコンピュータ室の管理者が定義するものとする。
【0108】
例えば、図18に示す冷却制御ルール131は、あるラックに格納される全物理計算機200のCPU温度が60℃を超えており、かつ、排気温度が40℃を超えており、かつ、ファン回転数が10000回転/秒を超える場合には、当該ラックに格納される物理計算機200の排気が出るラック背面に熱だまりが発生するとみなす。そして、この熱を排出するため、アクション1020を実行する。当該ラックを冷却する冷却装置151の出力を最大にし、当該ラック背面に位置する吹き出し口のグレーティング板を100%開放することを指示している。
【0109】
上記の他に、図5(b)の電力情報より、同一ラックに格納される物理計算機200の消費電力の総和が一定の値を超えたときに、当該ラックに格納される物理計算機群から発生する熱量が一定の値を超えると判断し、当該ラックを冷却する冷却装置の出力を一段階上げることも有効である。
【0110】
また、同一ラックに格納される全物理計算機200の入気温度が一定のしきい値を超えた場合に、ラック前面に熱だまりが発生しているとみなして、当該ラックを冷却する冷却装置151の出力を最大にし、当該ラック前面に位置する吹き出し口のグレーティング板を100%開放することも有効である。
【0111】
図19は、本発明の第3の実施例の制御フローを示すフローチャートである。
【0112】
まず、省電力制御サーバ110の稼動情報監視部111は、サーバ構成情報121を取得する(S1901)。
【0113】
そして、管理する物理計算機200の情報を取得し、稼動情報監視部111がこれら物理計算機200の稼動情報および消費電力を収集し、サーバ稼動履歴124に格納する。温度監視部112は現在のCPU温度、排気温度を収集する。ファン監視・制御部116はファン回転数を収集する(S1902)。
【0114】
次に、ルール判定部133は、収集した情報をもとに、各ラックに格納される物理計算機200について、冷却制御ルール131のルール1010の各項目の値をしきい値1012と比較する(S1903)。全項目の値が、しきい値1012以上であり、ルール1010が成立している場合(S1904:Y)は、ラック・冷却マップ126を参照して、当該ラックを冷却する冷却装置151、および当該ラックの背面に位置する吹き出し口を特定し、アクション1020で指定された冷却制御を実行する(S1905)。そして、一定時間経過待ち(S1906)、稼動情報等の監視に戻る(S1902)。
【0115】
本実施例によれば、管理対象機器の周辺にセンサを多数設置して温度上昇を検出する方法と比較して、センサの設置コストを省くことができる。
【図面の簡単な説明】
【0116】
【図1】本発明の第一の実施例のシステム構成を示すシステム構成図の一例である。
【図2】本発明の第一の実施例の省電力制御サーバのハードウェア構成を示す構成図の一例である。
【図3】本発明の第一の実施例の管理対象である物理計算機ハードウェア構成を示す構成図の一例である。
【図4】(a)は、本発明の第一の実施例のコンピュータ室の内部構成図、(b)は、コンピュータ室の床に設置されたモータと吹出口との関係を示す要部断面図の一例である。
【図5】本発明の第一の実施例のサーバ構成情報を示す構成図の一例である。
【図6】本発明の第一の実施例のラック・冷却マップを示す構成図の一例である。
【図7】本発明の第一の実施例における稼動情報および消費電力情報を示す構成図の一例である。
【図8】本発明の第一の実施例における熱発生プロファイルを示す構成図の一例である。
【図9】本発明の第一の実施例におけるCPU温度プロファイルを示す構成図の一例である。
【図10】本発明の第一の実施例におけるファンプロファイルを示す構成図の一例である。
【図11】本発明の第一の実施例における省電力制御フローを示すフローチャートの一例である。
【図12】本発明の第一の実施例におけるCPU温度推定フローを示すフローチャートの一例である。
【図13】本発明の第一の実施例におけるファン回転数決定フローを示すフローチャートの一例である。
【図14】本発明の第二の実施例のシステム構成を示すシステム構成図の一例である。
【図15】本発明の第二の実施例のジョブ実行スケジュール、サーバ・ジョブマップを示す構成図の一例である。
【図16】本発明の第二の実施例の省電力制御フローを示すフローチャートの一例である。
【図17】本発明の第三の実施例のシステム構成を示すシステム構成図の一例である。
【図18】本発明の第三の実施例の冷却制御ルールを示す構成図の一例である。
【図19】本発明の第三の実施例の省電力制御フローを示すフローチャートの一例である。
【図20】本発明の第一の実施例の冷却装置プロファイルの一例である。
【図21】本発明の第一の実施例の冷却装置部のフローチャートの一例である。
【符号の説明】
【0117】
110…省電力制御サーバ、111…稼動情報監視部、112…温度監視部、113…CPU温度推定部、114…冷却制御決定部、115…ファン回転数決定部、116…ファン監視・制御部、117…冷却制御部、121…サーバ構成情報、122…熱発生プロファイル、123…ファンプロファイル、124…サーバ稼動履歴、125…CPU温度プロファイル、126…ラック・冷却マップ、127…冷却プロファイル、200…物理計算機、223…計測エージェント
【技術分野】
【0001】
本発明は、物理計算機及び冷却装置の制御方法に関し、特にCPUの稼動率に応じた物理計算機のファン及び冷却装置の出力の制御方法に関する。
【背景技術】
【0002】
プロセッサの高性能化、ブレードサーバのような高密度なIT(Information Technology)機器の出現により、ITシステムの消費電力の増加が大きな問題となっている。この問題に対して、低消費電力プロセッサ,高効率冷却方式など消費電力を削減する技術の開発が進められているが、装置単体の省電力化には限界があり、より大きな省電力効果を得るためにはITシステムと冷却装置とを含むコンピュータ室全体での取り組みが必要である。
【0003】
現在のITシステムの冷却について説明する。サーバの稼働率上昇に伴いCPUやメモリなどの部品は熱を発生する。サーバは冷却ファンを備えており、サーバ筐体内の温度を検出し、温度が一定のしきい値を超えると、気流を発生させて発熱部品を冷却する。熱はこの気流により筐体の外に排出される。この冷却ファンの制御に関して、発熱部品の温度と温度変化に基づいてファンを制御し冷却を効率化する発明が特許文献1に開示されている。また、発熱部品の温度と温度変化に基づいてファンを制御し、冷却を効率化する発明が特許文献2で開示されている。
【0004】
一方、サーバを設置するコンピュータ室には機器の発生する熱を冷却するための冷却装置が設置されており、固定のセンサの温度をもとに出力を決定し、室内の温度を一定に保つ。しかし、IT機器の発する熱の偏りや機器の配置によって、コンピュータ室の温度を均一することは難しい。この冷却装置の制御に関して、マシン室内の空気流を監視し、空気流に応じて換気を行う発明が特許文献3に開示されている。
【0005】
コンピュータ室の熱の偏りが大きい場合は、熱だまりにある機器がCPU熱暴走により動作が不安定になる、また、CPU温度制御回路が作動し、強制的に処理性能を落としたり、シャットダウンしたりすることがある。強制的なシャットダウンによる不具合の発生を回避するため、温度が一定値を超えた場合ハイバネーションにより放熱制御して障害、シャットダウンを回避する発明が特許文献4で開示されている。
【0006】
また、CPUの現在の処理内容、CPUの温度特性、外部から入力されたユーザの指示に基づいて一定時間経過後の温度を予測し、予測された温度が基準値を上回った場合には、CPUの処理を他のCPUに移動する方法が、特許文献5に開示されている。
【0007】
【特許文献1】特開2002−268775
【特許文献2】特開2008−84173
【特許文献3】特開2006−208000
【特許文献4】特開2008−158787
【特許文献5】特開2007-241376
【発明の開示】
【発明が解決しようとする課題】
【0008】
今後は、熱の偏りを無くすためコンピュータ室全体を大規模な冷却装置で均一に冷やすのではなく、局所的に温度を制御できる冷却装置が重要になる。例えば、指向性のある冷却装置、ラック背面に取り付けるラック単位の冷却装置などが既に出荷されている。また、床下からの冷風によって冷却を行う設備の場合には、床のグレーティング板(穴あきタイル)の開閉を制御して、床下からの送風箇所を変更し、温度の高い箇所を集中的に冷やすようになる。
【0009】
また、発熱部品の稼動率が上昇してから熱が発生し、その熱が温度センサに検出されるまでには遅延がある。また、温度上昇が検出されてファンや空調の出力が上がり、実際に冷却効果が出るまでにはさらに遅延がある。このため、バースト的な負荷が発生した場合は、ファンの出力が上がっても一時的には温度が上昇し、その後安定稼動可能な温度に落ち着く。しかし、CPUは自身の温度が上昇すると、リーク電流が指数関数的に増加して冷却の電力もより多く必要になる。
【0010】
この結果、冷却能力が不足してCPU熱暴走により動作が不安定になる、または、CPU温度制御回路が作動し、強制的に処理性能を落としたり、シャットダウンすることがある。ハイバネーションにより、強制シャットダウンを回避しても、処理は中断せざるを得ない。
【0011】
また、サーバの冷却ファンが回転数を上げても、サーバ背面の空気流が不足していると、熱が排出穴に運ばれずに周囲の機器に拡散し、他の機器の温度も上昇し障害を招くおそれがある。現在の冷却装置は一点で計測した温度情報を元に出力を調整しているため、あるサーバで発生した熱がその計測点に回り込むまで空調は連動しないので、このような状態になることがある。
【課題を解決するための手段】
【0012】
前記目的を達成するために、本発明の制御方法は、プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機の制御方法であって、前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法である。
【0013】
また、本発明のサーバシステムは、プロセッサとファンを有し、前記プロセッサの温度及び稼働率と前記ファンの回転数と入気温度とを計測する前記サーバ装置と、前記サーバ装置及び前記冷却装置に接続し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値を以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定する管理計算機とを有する、ことを特徴とするサーバシステムである。
【発明の効果】
【0014】
本発明によれば、CPUを事前に冷却して最適温度に保つことにより、リーク電流による電力の消費を最小にし、冷却効率を上げることができる。
【発明を実施するための最良の形態】
【0015】
以下に、本発明の実施の形態を説明する。
【実施例】
【0016】
(第1の実施例)
図面を用いて、本発明の一実施形態を説明する。
【0017】
図1は、本発明の一実施例のシステム構成を示す図である。本実施例のシステム構成は、情報処理システムあるいはストレージシステム等である。例えば、1つの管理計算機100と、1つ以上の物理計算機200と、1つ以上のストレージ装置230と、該管理計算機100、該物理計算機200、該ストレージ装置230とを設置したコンピュータ室を冷却する冷却装置151と、冷却装置151を制御する冷却装置制御部150を備えて構成されている。そして、管理計算機100、物理計算機200及び冷却装置151は、管理ネットワーク225経由で接続している。また、物理計算機200とストレージ装置230は、例えばファイバチャネルネットワーク226で接続している。ここで、冷却装置制御部150は、冷却装置151を一括に制御すべく、物理計算機のメモリにプログラムとして格納されてもよい。また、冷却装置制御部151は、管理計算機内のメモリにプログラムとして格納されていてもよい。
【0018】
図2は、本発明の一実施例における管理計算機100を示す図である。
【0019】
管理計算機100の動作の概要を説明する。詳細については、以下に図面に沿って説明を加える。管理計算機100は、物理計算機200とストレージ装置230および冷却装置制御部150を管理する。そして、複数の物理計算機200と情報の授受を行って、複数の物理計算機200の稼動状況を検出する。検出した複数の物理計算機200の稼動状況に応じて、冷却装置制御機能151を介して冷却装置151を個別に制御する。また、検出した複数の物理計算機200の稼働状況に応じて複数の物理計算機200のファン回転数や冷却装置を制御する。
【0020】
管理計算機100は、中央演算装置CPU(Central Processing Unit)101、ハードディスク装置やフラッシュメモリ等の記憶装置105、メモリ102、バス107、ネットワークインタフェース104、ディスクインタフェース103から構成される。
【0021】
メモリ102には、サーバプログラム110が格納されている。そして、サーバプログラムには、稼動情報監視部111、温度監視部112、CPU温度推定部113、ファン回転数決定部115、ファン監視・制御部116、冷却制御部117が含まれる。これらのプログラムは、当初、磁気ディスク105に格納され、必要に応じてメモリ102に転送された後、CPU101で実行される。稼動情報・電力監視部111は、物理計算機200の稼動情報および消費電力情報を収集する。温度監視部112は、物理計算機の入気温度、CPU温度、排気温度を取得する。ファン監視・制御部116は、ファン回転数の情報を取得し、ファンの回転数を変更する指示を出す。CPU温度推定部113は、物理計算機に内蔵されるCPUの一定時間後の温度を推定する。ファン回転数決定部115は、CPUの一定時間後の温度を目標値まで下げるファン回転数を決定する。冷却制御決定部114は、ラック・冷却マップ126を取得し、冷却装置151の出力を決定する。冷却制御部117は、冷却装置151の出力を制御する指示を出す。
【0022】
そして、記憶装置105に、稼動情報履歴124と、サーバ構成情報121と、熱発生プロファイル122と、ファンプロファイル123と、CPU温度プロファイル125と、冷却装置プロファイル127と、CPU温度範囲128と、CPU最適温度129と、ラック・冷却マップ126と、冷却装置プロファイル2010と、が格納される。
【0023】
図3は、本発明の一実施例における物理計算機200のハードウェア構成を示す図である。
【0024】
物理計算機200は、中央演算装置CPU201、メモリ202、ハードディスク装置やフラッシュメモリ等の記憶装置205、バス207、ネットワークインタフェース204、ディスクインタフェース203、ファン208、BMC(Baseboard Management Controller)207とから構成される。
【0025】
BMC207は、サーバ入気温度、排気温度、CPU温度の監視や、ファン回転数の監視・制御、電源制御を行う。
【0026】
メモリ202には、OS222、この物理計算機の稼動情報を収集する計測エージェントプログラム223、業務サービスプログラム224が格納される。これらのプログラムは、まず、磁気ディスク205に格納され、必要に応じてメモリ202に転送された後、CPU201で実行される。なお、これらのプログラムは、可搬型記録媒体から読み出されることにより、または、各々の装置に接続されたネットワーク経由で、他の計算機または記憶装置からダウンロードされることにより、磁気ディスク205に格納されるものであってもよい。
【0027】
また、管理計算機のサーバプログラム110の各処理は、各プログラムをCPUで実行することにより実現するが、これらは計測エージェント決定部、計測部など、各処理を行う処理部として集積回路化するなどしてハードウェアで実現することもできる。
【0028】
計測エージェント223は、計算機200上で稼動し、自身が稼動する装置のCPU使用率やメモリ使用率、ネットワークインタフェースの使用率などの稼動情報を収集し、計測カウンタとして記録するソフトウェアプログラムである。管理計算機のサーバプログラム110の稼動情報・電力監視部111は、計測エージェント223に対して、SNMP(Simple Network Management Protocol)による稼動情報収集リクエストを送信する。計測エージェント223は、この稼動情報収集リクエストを受け取り、リクエスト中のオブジェクトID(Identification)で指定された計測カウンタの値を稼動情報・電力監視部111に送信する。サーバプログラム110は、この計測カウンタの値を受け取り、稼動情報として記録することで、複数の管理対象の稼動情報を一元的に管理することができる。
【0029】
図4は、本発明の一実施例における、物理計算機200、ストレージ装置230、冷却装151置などが設置されるコンピュータ室400の機器配置を示す図である。
【0030】
コンピュータ室400には、4つのラック401a、401b、401c、401dと、冷却装置151a、151bが配置されている。各ラック401と冷却装置151a、151bは、床上に固定されている。床には、複数の吹出口431〜435が設置される。吹出口431〜435は、例えば図4(b)に示すように、モータ440が固定され、モータ回転軸441には、モータ440の回転駆動に応じて、各吹出口を開閉する開閉版442が固定されている構成である。
【0031】
ラック401aには、物理計算機200及びストレージ装置230が収納されている。ラック401b〜401cにも、同様に物理計算機200及びストレージ装置230が収納されている(図示せず)。
【0032】
冷却装置151a、151bは、コンピュータ室400の側面に取り付けら、コンピュータ室400の温度を一定に保つための冷却装置151の一要素として構成されている。この冷却装置151a、151bは冷風を床下に送り、冷風が吹出口(穴あきタイル)431から吹き出すことで、各サーバが排出する熱を除去する。この際、管理計算機100からの指示に応じて、吹出口431〜435のうちいずかの吹出口を開き、他の吹出口を閉じる制御が行われる。例えば、ラック401a、401dに収納されたサーバの稼働率が高く、ラック401b、401cに収納されたサーバがアイドル状態であるときには、冷却装置151に対する制御として、モータ440の回転駆動により、吹出口431〜435のうち吹出口433が閉じ、他の吹出口431、432、434、435が開かれる制御が実行される。
【0033】
また、ラック401b、401cに収納されたサーバの稼働率が高く、ラック401a、401dに収納されたサーバがアイドル状態のときには、冷却装置151に対する制御として、モータ440の回転駆動により、吹出口431〜435のうち吹出口431、435が閉じ、他の吹出口432、433、434が開かれる制御が実行される。
【0034】
本実施例における冷却装置は、一般的なコンピュータ室空調(CRAC: Computer Room Air Conditioner)であるがこれに限定されるものではない。冷却設備は冷却された液体の冷媒がパイプを通り、各ラックを循環することで各サーバが排出する熱を除去する液冷装置であっても良い。液冷装置では、各ラックに通じるパイプの手前にバルブがあり、バルブを開閉することで、吹出口と同様に冷却出力の調整を行う。また、冷却設備は、外の冷えた空気を取り込み、コンピュータ室冷却装置と同様に床下から冷風を送ることで各サーバが排出する熱を除去する外気冷却装置であっても良い。
【0035】
図5は、本発明の一実施例におけるサーバ構成情報121を示す図である。
【0036】
サーバ構成情報121は、コンピュータ室400内に設置されたラックと、ラックに格納される物理計算機との対応関係を示すラック・物理計算機マップ500(図5(a))と物理計算機リスト510(図5(b))とからなる。
【0037】
ラック・物理計算機マップ500(図5(a))は、ラックの識別子であるラックID501と、それぞれのラックに格納される物理計算機200の識別子である物理計算機ID502で構成される。
【0038】
物理計算機リスト510(図5(b))は、物理計算機200の持つ物理計算機ID511と、シャーシ番号512と、構成要素識別子(項目)513と、構成要素の値514からなる一つ以上のレコードで構成され、物理計算機200の処理能力を表す。物理計算機ID501には、各物理計算機の識別子が格納されている。シャーシ番号512は、当該物理計算機がブレードサーバである場合に、ブレードサーバを格納するシャーシを特定するためにある。1Uサーバなどの非モジュラータイプのサーバである場合には、”-”が記録される。ブレードサーバは、複数のサーバでファンや電源を共有しており、サーバの構成や電源On/Offを管理する管理用プロセッサを持つ場合がある。管理対象物理計算機がブレードサーバである場合には、個々のサーバではなく、この管理用プロセッサに接続してCPU温度や共有するファンの回転数を得ることができる。管理用プロセッサに接続するため必要なIPアドレスやポート番号は、図示しないがサーバ構成情報として管理されているものとする。
【0039】
サーバ構成情報121は、管理対象システムの設計者がシステム構築時に決定し、文書またはソフトウェアによって管理していることが多い。物理計算機構成情報は、このような管理されている構成情報に基づいて作成してもよいし、動的に収集した情報から作成してもよい。
【0040】
図6は、本発明の一実施例におけるラック・冷却装置マップ126を示す図である。
【0041】
ラック・冷却装置マップ126は、ラックの識別子601と、冷却装置151の識別子602と、ラックの前面に位置する吹き出し口603と、ラックの背面に位置する吹き出し口604とからなる一つ以上のレコードで構成される。各レコードは、ラックと、各ラックを冷却している冷却装置151と、ラックに対して送風・換気を行う吹き出し口の識別番号との対応を表している。
【0042】
図7は、本発明の一実施例における稼動情報710(図7(a))および電力情報720(図7(b))を示す図である。
【0043】
稼動情報710(図7(a))は、一つの物理計算機200のリソース使用状況を示す。一例として、計測日711、計測曜日712、計測時刻713、CPU稼働率714とからなる一つ以上のレコードで構成される。CPU稼働率の単位は%である。ここで示す稼動情報は、Windows(登録商標)であればWMI(Windows Management Interface)で、LinuxであればTopコマンドで取得することが可能である。
【0044】
電力情報720(図7(b))は、各物理計算機200の電力消費状況を示すものであり、計測日721、計測曜日722、計測時刻723、物理計算機の電力量724および、シャーシの電力量726からなる一つ以上のレコードで構成される。なお、物理計算機200が、ブレードサーバである場合には、複数の物理計算機の電力量とシャーシの電力量が一つのテーブルで管理されている。一方、物理計算機200がブレードサーバでない場合には、一つの物理計算機の電力量だけが管理される。
【0045】
図8は、本発明の一実施例における熱発生プロファイル122を示す図である。
【0046】
熱発生プロファイル122は、CPU稼働率801と、発熱量802とからなる一つ以上のレコードで構成される。ここで、稼働率811とは、CPUの稼働率であり、発熱量と802とは、CPUの発熱量である。つまり、各レコードは、物理計算機200のCPUの稼働率に対する、発熱量を表している。
【0047】
熱発生プロファイル122は、物理計算機200の備えるCPUの種類ごとに異なる。熱発生プロファイルの取得方法は様々な方法がある。例えば、CPUの過去の稼動率と発熱量の履歴を記録しておき、該履歴より取得することができる。また、事前にCPUによる処理を実行し、稼動率と発熱量の関係を測定することもできる。また、CPUベンダより提供された稼動率と発熱量との関係を記録することもできる。
【0048】
図9は、本発明の一実施例におけるCPU温度プロファイル125(図9(a))、CPU温度範囲128(図9(b))、CPU最適温度129(図9(c))、温度上昇とリーク電流による消費電力の関係、および温度上昇とファン消費電力との関係(図9(d))を示す図である。
【0049】
CPU温度プロファイル125(図9(a))は、CPUの発熱量901と、一定時間あたりのCPU温度変化902からなる一つ以上のレコードで構成される。つまり、各レコードは、CPUの発熱量に対する、一定時間後の温度変化量を表している。
【0050】
一般に、物体の温度変化は外部から与えられる熱量を熱容量で割った値になるが、物体の性質によって熱の伝わりやすさが異なる。すなわち、同じ熱量が与えられても、CPUの材質や構造によって最終的に到達する温度、および温度変化の速度は異なる。このため、CPU温度プロファイルはCPU種類ごとに決まるテーブルである。
【0051】
上記のように、CPU温度プロファイル125は、物理計算機200の備えるCPUの種類ごとに異なる。CPU温度プロファイルの取得方法は様々な方法がある。例えば、CPUの過去の発熱量と温度変化の履歴を記録しておき、該履歴より取得することができる。また、事前にCPUによる処理を実行し、発熱量と温度変化の関係を測定することもできる。また、CPUベンダより提供された発熱量と温度変化との関係を記録することもできる。
【0052】
CPU温度範囲128(図9(b))は、上限値911と下限値912から成り、CPUが安全に稼動する温度の範囲を示している。通常、CPUは製造ベンダによって正常に動作する温度の上限と下限が決められている。そして、多くのサーバでは、室温の上昇やファンの故障によって、CPU温度がこの範囲を超えると、サーバのハードウェア状態を監視するプログラムがサーバ外部に警告を出す。
【0053】
CPU最適温度129は、CPUのリーク電流による消費電力と、CPUを冷却するファンが消費する電力との総和を最小にする温度である。CPU最適温度129は、入気温度によって変化するため、入気温度921と、CPU最適温度922からなる一つ以上のレコードで構成される。
【0054】
CPU最適温度129について説明する。半導体の微細化によりCPUにはOFF状態であっても微量の電流(リーク電流)が流れるが、このリーク電流は温度が上昇すると指数関数的に上昇するという特性を持つ。このため、アイドル状態であっても、CPU自身の温度が上昇すると消費電力も指数関数的に上昇する。このリーク電流によるCPU消費電力を抑えるには、CPU温度を上げない方が良いが、温度を維持するには冷却用の電力が必要になる。一般に、ファン消費電力はファンの風速、消費電力に比例しており、CPU温度上昇の2乗に反比例する。したがって、図9(d)に示すように、温度を低く保つとリーク電流は抑えられるが、ファンの消費電力は増加し、温度上昇を許せばリーク電流は増加するが、ファンの消費電力は低くすることができるというトレードオフの関係となる。CPU最適温度129は、このリーク電流による消費電力とファン消費電力との総和が最小になる温度であり、管理者が測定することも可能であり、サーバベンダが公開することも考えられる。
【0055】
図10は、本発明の一実施例におけるファンプロファイル123を示す図である。
【0056】
ファンプロファイル123は、物理計算機200のファンの回転数1001と、ファンの送風によりCPUを冷却し、一定時間あたりに変化させることのできるCPUの温度変化1002からなる一つ以上のレコードで構成される。そして、ファンによるCPUの冷却効率は、入気温度により変化する。したがって、ファンにより、一定時間あたりに変化させることのできるCPUの温度変化は入気温度により異なる。本実施例のファンプロファイルでは、21℃、22℃、23℃(1003)の入気温度の場合を示しているがこれに限定されるものではない。
【0057】
また、サーバのCPUとファンとの関係は1対1とは限らない。例えば、一つの筐体に複数のサーバが格納されるブレードサーバでは、複数のサーバを共有のファンで冷却することがある。このような場合でも、ファンは、各CPUを均一に冷やすよう構成されており、前述のようなファンプロファイル123を定義することができる。
【0058】
図20は、本発明の一実施例における冷却装置プロファイル2010と、冷却制御パターン2010を示す図である。
【0059】
冷却制御プロファイル2010は、冷却装置ごとに分かれており、冷却装置の出力段階2011と、その出力段階時の各冷却対象ラックの入気温度変化2012と、消費電力2013とからなる一つ以上のレコードで構成される。
【0060】
冷却制御パターン2020は、複数の冷却装置の出力の組み合わせと消費電力を表すものであり、組み合わせ番号2021と、各冷却装置の出力2022と、その時の冷却装置全体の消費電力量2023からなる一つ以上のレコードで構成される。
【0061】
図5から図10で示した情報は、管理者が定義ファイルに記述する。ただし、これらの情報は、定義ファイルでなく、GUI(Graphical User Interface)から入力してもよいし、他のサーバからネットワークを介して取得してもよい。
【0062】
次に、本発明の一実施例における管理計算機による物理計算機と冷却装置の制御を、図を用いて説明する。
【0063】
図11は、本発明の一実施例における、管理計算機よる物理計算機と冷却装置の制御フローを示した図である。
【0064】
まず、物理計算機のサーバプログラム110の稼動情報監視部111は、サーバ構成情報121を記憶装置105から読み出す(S1101)。そして、管理する物理計算機200を把握し、稼動情報監視部111がこれら物理計算機200の稼動情報および消費電力を収集し(S1102)、サーバ稼動履歴124に格納する。
【0065】
そして、CPU温度推定部113は、格納した稼動履歴と、記憶装置に格納された熱発生プロファイル122、CPU温度プロファイル125に基づいて、各物理計算機200の一定時間経過後のCPU温度を推定する(S1103)。この推定の処理は図12を用いて説明する。
【0066】
図12は、本発明の一実施例におけるCPU温度推定フローを示す図である。本処理は、CPU温度推定部により実行される。
【0067】
CPU温度推定部113は、サーバ稼動履歴124を参照して、処理対象である物理計算機200のCPU稼働率714を取得する(S1201)。
【0068】
そして、CPU稼働率に対して発生する熱量を、熱発生プロファイル122を参照して求める(S1202)。この時、まず、サーバ構成情報121のサーバリスト510を参照して、当該物理計算機200のCPU種類を求め、CPU種類に対応するCPU温度プロファイルを用いる。
【0069】
次に、発生した熱量に対するCPU温度変化を、CPU温度プロファイル125を参照して求める(S1203)。具体的には、CPU温度推定部113は、温度監視部を用いて現在のCPUの温度とサーバ装置への入気温度を取得し、ファン監視・制御部116を用いて現在のファン回転数を取得する。そして、ファンプロファイル123を参照して、現在時刻から一定時間経過後まで現在のファン回転数を維持した場合のCPU温度変化(冷却効果)を求める(S1204)。ファン監視・制御部116は、前記BMC207に対してSSH(Secure Shell)などによって接続し、ファン回転数を取得するコマンドを実行し、ファン回転数の値を取得する。
【0070】
最後に、現在のCPU温度に発生した熱量に対するCPU温度変化を加算し、ファンによる温度変化を引いて、一定時間経過後のCPU温度とする(S1205)。
【0071】
一定時間経過後のCPU温度の推定値が算出されたら、一定時間経過後の推定温度が、設定したしきい値を超えるか否かを確認する(S1104)。設定したしきい値を超える場合(Yの場合)、温度監視部により物理計算機への入気温度を取得し、ファン回転数決定部115は取得された入気温度とファンプロファイル123を参照して、一定時間経過後のCPU温度を上限値内に抑えるために必要なファン回転数を算出する(S1105)。
【0072】
ファン回転数を決定する一例を図13に示す。つまり、図13は、本発明の一実施例におけるファン回転数決定フローを示す図である。
【0073】
CPU温度の推定値がしきい値を上回る場合、ファン回転数決定部115は、推定した一定時間経過後のCPU温度とCPU温度のしきい値との差分を求め、実現すべきCPU温度変化量とする(S1301)。
【0074】
そして、一定時間経過後のCPU温度を推定する際に取得した、物理計算機への現在の入気温度と、ファンプロファイル123とを参照して、一定時間経過後の実現すべきCPU温度変化量とするためのファン回転数を求める(S1302)。
【0075】
しきい値を超えない場合は、一定時間経過を待ち(S1108)、稼動情報・温度・回転数の監視に戻る(S1102)。ここで、しきい値は、CPU温度範囲128の上限値であってもよい。また、しきい値は、上限値より一定値引いた値であってもよい。上限値より一定値を引いた値をしきい値とすることにより、突然稼動量が上昇した場合であっても、上限値を以下で稼動することができる。
【0076】
また、本実施例においては、一定時間経過後のしきい値を超えるか否かにより、ファンの回転数を制御するか否かを決定したが、これに限られるものではない。他の実施形態として、温度監視部112により入気温度を取得し、取得した入気温度からCPUリーク電流とファン消費電力の合計を最小にする値であるCPU最適温度129を決定する。そして、CPU最適温度から一定温度減算した値より、CPU最適温度に一定温度加算した値の範囲範囲内であるか否かにより判断1104をしてもよい。
【0077】
次に、サーバプログラム110は、物理計算機200がファンの回転数を算出した回転数へ変更可能であるか確認する(S1106)。例えば、処理1105にて求めたファン回転数が、最大値を超えているかどうかを確認する。変更可能である場合には(S1106:Y)、ファン監視・制御部116は、物理計算機200に対して、ファンの回転数を変更するよう指示を出す(S1107)。そして、一定時間経過を待ち(S1108)、稼動情報・温度・回転数の監視に戻る(S1102)。
【0078】
物理計算機200のファンが、ファン回転数決定部115が決定したファンの回転数を実現できない場合には(S1106:N)、冷却制御部117は、コンピュータ室400に設置された冷却設備151a、151bの出力を変更して当該物理計算機200の入気温度を下げる(S1520)。この処理は図21を用いて説明する。
【0079】
図の21は、本発明の一実施例における冷却制御フローを説明する図である。
【0080】
冷却制御部117は、ファンプロファイル123を参照して、実現すべきCPUの温度変化量を達成する、目標入気温度を求める(S2101)。ここで、ファン回転数は実現できる最大値とする。つまり、図10の5000回転が最大値であり、CPU温度変化を-3.0℃とした場合には、目標入気温度を21℃と求める。
【0081】
そして、現在の入気温度と目標入気温度との差分を求め入気温度変化目標値とする(S2102)。
【0082】
次に、冷却制御部117は、サーバ構成情報121を参照して制御対象の物理計算機200が格納されるラックを特定する。そして、ラック・冷却マップ126を参照して、特定したラックの冷却を担当する冷却設備を特定する。特定されるラックは複数台であってもよい。そして、冷却制御部117は、この冷却装置の出力を、前記差分に応じて変更するよう指示する。
【0083】
具体的な冷却装置の出力の決定方法は、冷却装置プロファイル2010を参照して、ラック温度変化量が、入気温度変化目標値以上である出力段階を選択する。
【0084】
ただし、本実施例のように複数の冷却装置が同一ラックを冷却する場合には、どの冷却装置の出力を変更するかによってコンピュータ室全体の消費電力が異なる。そこで、管理対象ラックの入気温度を目標入気温度にするために、冷却設備151aおよび冷却設備151bが取り得る出力の組み合わせを列挙した冷却制御パターンリスト2030を作成する(S2103)。
【0085】
そして、冷却設備151aと冷却設備151bとの消費電力の和が最小となる組み合わせを選択する(S2104)。
【0086】
例えば、組み合わせには、冷却設備151aは段階1にして、冷却設備151aは段階3とするパターン、両方の出力を段階2とするパターン、冷却設備151aを段階3として、冷却設備151bを段階1とするなどのパターンがある。ここで、温度変化、つまり冷やせる温度に対する冷却装置の消費電力は、装置の特性やラックとの距離によって異なるため、各パターンの消費電力は異なる。そして、冷却設備151a、151bの出力を変更して当該物理計算機200の入気温度を下げる(S2105)。
そして、一定時間経過を待ち(S1108)、稼動情報・温度・回転数の監視に戻る(S1102)。
【0087】
本実施例の物理計算機プロファイル124は、主な発熱部品であるCPUのみに着目しているが、熱発生プロファイルはCPUだけでなく、他の部品の利用率に応じた情報であってもよい。
【0088】
また、本実施例は、IT装置がサーバである場合について説明したが、IT装置はストレージ装置、ネットワーク機器であっても良い。IT装置がストレージ装置の場合には、装置の発熱量はCPU稼働率だけではなく、装置へのデータ入出力回数を示すIOPS(Input Output Per Second)によって変化するため、コントローラのCPU稼働率やIOPSに基づいて発熱量を推定することができる。同様にIT装置がネットワーク機器の場合には、ポートの使用率に基づいて発熱量を推定することができる。
【0089】
上述したように、省電力制御サーバ110を、物理計算機200の稼動情報および消費電力情報を収集する稼動情報監視部111と、前記管理対象サーバの入気温度、CPU温度、排気温度を収集する温度監視部112と、前記管理対象サーバのファン回転数を監視し、前記ファンの回転数を変更するファン監視・制御部116と、熱発生プロファイル122およびCPU温度プロファイル125を読み込み、前記管理対象サーバが内蔵するCPUの一定時間後の温度を推定するCPU温度推定部113と、ファンプロファイル123を読み込んで前記CPUの一定時間後の温度を目標値まで下げるファン回転数を決定するファン回転数決定部115と、冷却装置プロファイル127と、ラック・冷却マップ126の入力を受け付け、冷却装置151の出力を決定する冷却制御決定部114と、冷却装置151の制御を指示する冷却制御部117とで構成することで、CPUを事前に冷却して最適温度に保ち、リーク電流による電力の消費を最小にし、冷却効率を上げることができる。また、サーバのファンと空調を連携して制御することにより、ファンの制御だけではCPUの温度を規定範囲内にできない場合であっても、事前に空調を調整して入気温度を下げておくことで、CPUの温度を規定の範囲内に収めて熱による障害の発生を回避できる。
【0090】
なお、本実施例においては、管理計算機からの指示によりサーバ装置内のBMCがファンを制御するが、これに限定されるものではなく、サーバプログラム110を物理計算機のメモリに格納し、稼動情報履歴124と、サーバ構成情報121と、熱発生プロファイル122と、ファンプロファイル123と、CPU温度プロファイル125と、冷却装置プロファイル127と、CPU温度範囲128と、CPU最適温度129と、ラック・冷却マップ126と、冷却装置プロファイル2010とを記憶装置に格納し、物理計算機内において本実施例におけるファン制御及び空調装置制御を行ってもよい。
(第2の実施例)
以下、本発明の第2の実施形態を図面に基づいて説明する。第1の実施例と、同一の構成部分については、適宜図面及び説明を省略する。
【0091】
本発明の一実施例のシステム構成は、図1と同様である。また、物理計算機は、図3と同様である。
【0092】
図14は、本発明の一実施例の管理計算機を示す図である。実施例1の管理計算機との相違点は、稼動履歴情報124を保持せず、ジョブ実行スケジュール132、サーバ・ジョブマップ131を保持していることである。既に実施例1にて説明したサーバ構成情報121、熱発生プロファイル122、ファンプロファイル123、CPU温度プロファイル125、ラック・冷却マップ126、CPU温度範囲128、CPU最適温度129については、説明を省略する。
【0093】
管理計算機の動作を簡単に説明する。なお、詳細な説明は以下、図を用いて行う。サーバプログラム110は、管理対象サーバが実行する業務のジョブ実行スケジュール(負荷変動)から一定の期間におけるCPU稼働率を求め、CPU稼働率と、CPU種類ごとに決まっている稼働率に対する発熱量とから、一定時間後のCPUの温度を推定し、CPU温度が、CPUが安定稼動する温度範囲の上限値を超えることを確認すると、前記管理対象サーバのファン回転数及び必要に応じて冷却装置の出力を制御する。
【0094】
図15は、本発明の一実施例におけるサーバ・ジョブマップ131(図15(a))と、ジョブ実行スケジュール132(図15(b))とを示す構成図である。
【0095】
サーバ・ジョブマップ131(図15(a))は、物理計算機の識別子である物理計算機ID1401と、業務の種類を示す業務種別1402からなる一つ以上のレコードで構成される。各レコードは、どの物理計算機で、どの業務を実行しているかを示す。
【0096】
ジョブ実行スケジュール132(図15(b))は、物理計算機ごとに、日1411と、曜日1412、開始時刻1413、終了時刻1414、ジョブID1415、平均CPU稼働率1416とからなる1つ以上のレコードで構成される。各レコードは、曜日と時間帯ごとの、業務によって発生するCPU稼働率の平均値を示している。サーバのCPU稼働率は、バッチジョブの実行スケジュール、業務リクエストの時間的変動、またはサーバのOn/Offスケジュールなどによって予測する。ジョブ実行スケジュール132は、バッチジョブの実行スケジュール、業務リクエストの時間的変動、またはサーバのOn/Offスケジュールと、同等の処理を実行した時のサーバ稼動履歴から求める。
【0097】
図16は、本発明の第二の実施例の制御フローを示すフローチャートである。まず、サーバプログラム110の稼動情報監視部111は、サーバ構成情報121を取得し(S1601)、管理する物理計算機200の情報を取得する。そして、管理する物理計算機のジョブ実行スケジュールの情報を取得する。
【0098】
次に、サーバプログラム110は、ジョブ実行スケジュールを確認し、物理計算機200が実行するジョブの終了時刻に達しているかを確認する(S1603)。そして、ジョブの終了時刻の場合(S1603:Y)、サーバ・ジョブマップ131を参照して、物理計算機200が次に実行するジョブを特定し、ジョブに対応するジョブ実行スケジュール132を参照して、当該物理計算機200が実行するジョブの開始・終了時刻と平均CPU稼働率を取得する(S1604)。
【0099】
そして、CPU温度推定部113は、平均CPU稼働率と、熱発生プロファイル122、CPU温度プロファイル125に基づいて、各物理計算機200の一定時間経過後のCPU温度を推定する(S1604)。温度推定の処理は第一の実施例と同一である。
【0100】
ここで、例えば、これから開始する負荷区間の平均CPU稼働率が0である場合は、ファンの回転数を落とす、または停止することで消費電力を抑えることができる。
【0101】
また、処理1606の処理も実施例1と同様である。
【0102】
本実施例では、ジョブ実行スケジュールから、実行されるジョブとそのジョブを処理するためのCPU稼働率を取得した。しかし、これに限定されるものではなく、例えば、過去に処理されたジョブやCPU稼働率などのデータを格納しておき、格納されたデータをもとにある時間のCPU稼働率を予測し、CPU稼動率を取得してもよい。
(第3の実施例)
以下、本発明の第3の実施形態を図面に基づいて説明する。第1の実施例と、同一の構成部分については、適宜図面及び説明を省略する。
【0103】
本発明の一実施例のシステム構成は、図1と同様である。また、物理計算機は、図3と同様である。
【0104】
図17は、本発明の一実施例の管理計算機を示す図である。実施例1の管理計算機との相違点は、サーバプログラムにルール判定部133を保持し、記憶装置に冷却制御ルールを保持している点である。既に実施例1にて説明したサーバ構成情報121、熱発生プロファイル122、ファンプロファイル123、稼動履歴情報124、CPU温度プロファイル125、ラック・冷却マップ126、CPU温度範囲128、CPU最適温度129については、説明を省略する。
【0105】
図18は、本発明の第3の実施例の冷却制御ルール131を示す構成図である。
【0106】
冷却制御ルール131は、ルール1010とアクション1020からなり、ルール1010は、評価項目1011と、しきい値1012からなる一つ以上のレコードで構成される。各レコードは1つの条件を表しており、評価項目の値がしきい値以上になったときに条件が成立し、全てのレコードで表現された条件が成立したときに、アクション1020で指定された制御が実行される。また、1つの項目の条件が成立したときに、アクション1020で指定された制御を実行してもよい。
【0107】
冷却制御ルールは、異常な温度上昇が開始したと判定できる条件であり、あらかじめコンピュータ室の管理者が定義するものとする。
【0108】
例えば、図18に示す冷却制御ルール131は、あるラックに格納される全物理計算機200のCPU温度が60℃を超えており、かつ、排気温度が40℃を超えており、かつ、ファン回転数が10000回転/秒を超える場合には、当該ラックに格納される物理計算機200の排気が出るラック背面に熱だまりが発生するとみなす。そして、この熱を排出するため、アクション1020を実行する。当該ラックを冷却する冷却装置151の出力を最大にし、当該ラック背面に位置する吹き出し口のグレーティング板を100%開放することを指示している。
【0109】
上記の他に、図5(b)の電力情報より、同一ラックに格納される物理計算機200の消費電力の総和が一定の値を超えたときに、当該ラックに格納される物理計算機群から発生する熱量が一定の値を超えると判断し、当該ラックを冷却する冷却装置の出力を一段階上げることも有効である。
【0110】
また、同一ラックに格納される全物理計算機200の入気温度が一定のしきい値を超えた場合に、ラック前面に熱だまりが発生しているとみなして、当該ラックを冷却する冷却装置151の出力を最大にし、当該ラック前面に位置する吹き出し口のグレーティング板を100%開放することも有効である。
【0111】
図19は、本発明の第3の実施例の制御フローを示すフローチャートである。
【0112】
まず、省電力制御サーバ110の稼動情報監視部111は、サーバ構成情報121を取得する(S1901)。
【0113】
そして、管理する物理計算機200の情報を取得し、稼動情報監視部111がこれら物理計算機200の稼動情報および消費電力を収集し、サーバ稼動履歴124に格納する。温度監視部112は現在のCPU温度、排気温度を収集する。ファン監視・制御部116はファン回転数を収集する(S1902)。
【0114】
次に、ルール判定部133は、収集した情報をもとに、各ラックに格納される物理計算機200について、冷却制御ルール131のルール1010の各項目の値をしきい値1012と比較する(S1903)。全項目の値が、しきい値1012以上であり、ルール1010が成立している場合(S1904:Y)は、ラック・冷却マップ126を参照して、当該ラックを冷却する冷却装置151、および当該ラックの背面に位置する吹き出し口を特定し、アクション1020で指定された冷却制御を実行する(S1905)。そして、一定時間経過待ち(S1906)、稼動情報等の監視に戻る(S1902)。
【0115】
本実施例によれば、管理対象機器の周辺にセンサを多数設置して温度上昇を検出する方法と比較して、センサの設置コストを省くことができる。
【図面の簡単な説明】
【0116】
【図1】本発明の第一の実施例のシステム構成を示すシステム構成図の一例である。
【図2】本発明の第一の実施例の省電力制御サーバのハードウェア構成を示す構成図の一例である。
【図3】本発明の第一の実施例の管理対象である物理計算機ハードウェア構成を示す構成図の一例である。
【図4】(a)は、本発明の第一の実施例のコンピュータ室の内部構成図、(b)は、コンピュータ室の床に設置されたモータと吹出口との関係を示す要部断面図の一例である。
【図5】本発明の第一の実施例のサーバ構成情報を示す構成図の一例である。
【図6】本発明の第一の実施例のラック・冷却マップを示す構成図の一例である。
【図7】本発明の第一の実施例における稼動情報および消費電力情報を示す構成図の一例である。
【図8】本発明の第一の実施例における熱発生プロファイルを示す構成図の一例である。
【図9】本発明の第一の実施例におけるCPU温度プロファイルを示す構成図の一例である。
【図10】本発明の第一の実施例におけるファンプロファイルを示す構成図の一例である。
【図11】本発明の第一の実施例における省電力制御フローを示すフローチャートの一例である。
【図12】本発明の第一の実施例におけるCPU温度推定フローを示すフローチャートの一例である。
【図13】本発明の第一の実施例におけるファン回転数決定フローを示すフローチャートの一例である。
【図14】本発明の第二の実施例のシステム構成を示すシステム構成図の一例である。
【図15】本発明の第二の実施例のジョブ実行スケジュール、サーバ・ジョブマップを示す構成図の一例である。
【図16】本発明の第二の実施例の省電力制御フローを示すフローチャートの一例である。
【図17】本発明の第三の実施例のシステム構成を示すシステム構成図の一例である。
【図18】本発明の第三の実施例の冷却制御ルールを示す構成図の一例である。
【図19】本発明の第三の実施例の省電力制御フローを示すフローチャートの一例である。
【図20】本発明の第一の実施例の冷却装置プロファイルの一例である。
【図21】本発明の第一の実施例の冷却装置部のフローチャートの一例である。
【符号の説明】
【0117】
110…省電力制御サーバ、111…稼動情報監視部、112…温度監視部、113…CPU温度推定部、114…冷却制御決定部、115…ファン回転数決定部、116…ファン監視・制御部、117…冷却制御部、121…サーバ構成情報、122…熱発生プロファイル、123…ファンプロファイル、124…サーバ稼動履歴、125…CPU温度プロファイル、126…ラック・冷却マップ、127…冷却プロファイル、200…物理計算機、223…計測エージェント
【特許請求の範囲】
【請求項1】
プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機による制御方法であって、
前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、
前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、
前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法。
【請求項2】
請求項1に記載の制御方法であって、
前記管理計算機は稼動情報監視部と、ファン監視部と、ファン制御部と、温度推定部と、冷却制御部とを格納するメモリを有し、
前記稼動情報監視部が前記サーバより前記プロセッサの前記稼動率を取得し、
前記ファン監視部が前記ファンの前記回転数を取得し、
前記温度推定部が前記入気温度と前記プロセッサの前記温度を取得し、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出し、
前記ファン制御部が前記サーバに前記ファンが前記目標回転数に変更する指示を出し、
前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却制御部が、前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、前記目標入気温度にするための前記冷却装置の出力を決定し、前記冷却装置に前記出力に変更する指示を出す、ことを特徴とする
【請求項3】
請求項1に記載の制御方法であって、
前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却装置の出力を上げることを特徴とする制御方法。
【請求項4】
請求項3に記載の制御方法であって、
前記冷却装置の出力を上げる際、
前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、
前記目標入気温度にするための前記冷却装置の出力を決定する、ことを特徴とする制御方法。
【請求項5】
請求項4に記載の制御方法であって、
前記冷却装置が複数台ある場合、前記複数の冷却装置の出力の組み合わせを複数算出し、
前記複数の組み合わせのそれぞれに対し、前記複数の冷却装置による消費電力を算出し、
前記消費電力をもとに、前記複数の組み合わせから組み合わせを選択し、
前記選択された組み合わせにより、前記複数の冷却装置の出力を決定する、ことを特徴等する制御方法。
【請求項6】
請求項1に記載の制御方法であって、
前記推定温度を算出する際、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出する、ことを特徴とする制御方法。
【請求項7】
請求項6に記載の制御方法であって、
前記サーバ装置の前記プロセッサの種類を認識し、
前記上昇温度を算出する際、前記プロセッサの前記種類に対応する稼動率と発熱量の関係を用いて算出することを特徴とする制御方法。
【請求項8】
請求項1に記載の制御方法であって、
前記推定温度が第1の所定値以上であり、さらに前記第2の所定値以下である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記第1の所定値は、プロセッサ最適温度に第1の温度を加えた値であって、前記第2の所定値は前記プロセッサ最適温度から第2の温度を引いた値である、ことを特徴とする制御方法。
【請求項9】
請求項8に記載の制御方法であって、
前記プロセッサ最適温度は、前記プロセッサの消費電力と、前記ファンの消費電力とにより算出する、ことを特徴とする制御方法。
【請求項10】
プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機による制御方法であって、
前記サーバから前記プロセッサの温度と前記ファンの回転数と前記サーバへの入気温度を取得し、
前記サーバから前記プロセッサにて実行されるジョブに関する情報を取得し、
前記ジョブに関する情報から稼働率を取得し、
前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、
前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法。
【請求項11】
サーバシステムであって、
プロセッサとファンを有し、前記プロセッサの温度及び稼働率と前記ファンの回転数と入気温度とを計測する前記サーバ装置と
前記サーバ装置及び前記冷却装置に接続し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値を以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定する管理計算機とを有する、ことを特徴とするサーバシステム。
【請求項12】
請求項11に記載のサーバシステムであって、
さらに、冷却装置を有し、
前記管理計算機は、前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却装置の出力を上げる指示を出す、ことを特徴とするサーバシステム。
【請求項13】
請求項12に記載のサーバシステムであって、
前記管理計算機は、前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、前記目標入気温度にするための前記冷却装置の出力を決定する、ことを特徴とするサーバシステム。
【請求項14】
請求項11に記載のサーバシステムであって、
前記管理計算機が、前記推定温度を算出する際、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出する、ことを特徴とするサーバシステム。
【請求項15】
請求項14に記載のサーバシステムであって、
前記管理計算機は、前記サーバ装置の前記プロセッサの種類を認識し、前記上昇温度を算出する際、前記プロセッサの前記種類に対応する稼動率と発熱量の関係を用いて算出する、ことを特徴とするサーバシステム。
【請求項1】
プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機による制御方法であって、
前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、
前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、
前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法。
【請求項2】
請求項1に記載の制御方法であって、
前記管理計算機は稼動情報監視部と、ファン監視部と、ファン制御部と、温度推定部と、冷却制御部とを格納するメモリを有し、
前記稼動情報監視部が前記サーバより前記プロセッサの前記稼動率を取得し、
前記ファン監視部が前記ファンの前記回転数を取得し、
前記温度推定部が前記入気温度と前記プロセッサの前記温度を取得し、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出し、
前記ファン制御部が前記サーバに前記ファンが前記目標回転数に変更する指示を出し、
前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却制御部が、前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、前記目標入気温度にするための前記冷却装置の出力を決定し、前記冷却装置に前記出力に変更する指示を出す、ことを特徴とする
【請求項3】
請求項1に記載の制御方法であって、
前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却装置の出力を上げることを特徴とする制御方法。
【請求項4】
請求項3に記載の制御方法であって、
前記冷却装置の出力を上げる際、
前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、
前記目標入気温度にするための前記冷却装置の出力を決定する、ことを特徴とする制御方法。
【請求項5】
請求項4に記載の制御方法であって、
前記冷却装置が複数台ある場合、前記複数の冷却装置の出力の組み合わせを複数算出し、
前記複数の組み合わせのそれぞれに対し、前記複数の冷却装置による消費電力を算出し、
前記消費電力をもとに、前記複数の組み合わせから組み合わせを選択し、
前記選択された組み合わせにより、前記複数の冷却装置の出力を決定する、ことを特徴等する制御方法。
【請求項6】
請求項1に記載の制御方法であって、
前記推定温度を算出する際、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出する、ことを特徴とする制御方法。
【請求項7】
請求項6に記載の制御方法であって、
前記サーバ装置の前記プロセッサの種類を認識し、
前記上昇温度を算出する際、前記プロセッサの前記種類に対応する稼動率と発熱量の関係を用いて算出することを特徴とする制御方法。
【請求項8】
請求項1に記載の制御方法であって、
前記推定温度が第1の所定値以上であり、さらに前記第2の所定値以下である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記第1の所定値は、プロセッサ最適温度に第1の温度を加えた値であって、前記第2の所定値は前記プロセッサ最適温度から第2の温度を引いた値である、ことを特徴とする制御方法。
【請求項9】
請求項8に記載の制御方法であって、
前記プロセッサ最適温度は、前記プロセッサの消費電力と、前記ファンの消費電力とにより算出する、ことを特徴とする制御方法。
【請求項10】
プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機による制御方法であって、
前記サーバから前記プロセッサの温度と前記ファンの回転数と前記サーバへの入気温度を取得し、
前記サーバから前記プロセッサにて実行されるジョブに関する情報を取得し、
前記ジョブに関する情報から稼働率を取得し、
前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、
前記推定温度が第1の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法。
【請求項11】
サーバシステムであって、
プロセッサとファンを有し、前記プロセッサの温度及び稼働率と前記ファンの回転数と入気温度とを計測する前記サーバ装置と
前記サーバ装置及び前記冷却装置に接続し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第1の所定値を以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定する管理計算機とを有する、ことを特徴とするサーバシステム。
【請求項12】
請求項11に記載のサーバシステムであって、
さらに、冷却装置を有し、
前記管理計算機は、前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却装置の出力を上げる指示を出す、ことを特徴とするサーバシステム。
【請求項13】
請求項12に記載のサーバシステムであって、
前記管理計算機は、前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、前記目標入気温度にするための前記冷却装置の出力を決定する、ことを特徴とするサーバシステム。
【請求項14】
請求項11に記載のサーバシステムであって、
前記管理計算機が、前記推定温度を算出する際、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出する、ことを特徴とするサーバシステム。
【請求項15】
請求項14に記載のサーバシステムであって、
前記管理計算機は、前記サーバ装置の前記プロセッサの種類を認識し、前記上昇温度を算出する際、前記プロセッサの前記種類に対応する稼動率と発熱量の関係を用いて算出する、ことを特徴とするサーバシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【公開番号】特開2010−108324(P2010−108324A)
【公開日】平成22年5月13日(2010.5.13)
【国際特許分類】
【出願番号】特願2008−280698(P2008−280698)
【出願日】平成20年10月31日(2008.10.31)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
【公開日】平成22年5月13日(2010.5.13)
【国際特許分類】
【出願日】平成20年10月31日(2008.10.31)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
[ Back to top ]