物理計算機及び冷却装置の制御方法及びサーバシステム

【課題】システム全体の消費電力をより小さくするための冷却制御を決定する。
【解決手段】プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機の制御方法であって、前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第１の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法である。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、物理計算機及び冷却装置の制御方法に関し、特にＣＰＵの稼動率に応じた物理計算機のファン及び冷却装置の出力の制御方法に関する。
【背景技術】
【０００２】
プロセッサの高性能化、ブレードサーバのような高密度なＩＴ(ＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ)機器の出現により、ＩＴシステムの消費電力の増加が大きな問題となっている。この問題に対して、低消費電力プロセッサ，高効率冷却方式など消費電力を削減する技術の開発が進められているが、装置単体の省電力化には限界があり、より大きな省電力効果を得るためにはＩＴシステムと冷却装置とを含むコンピュータ室全体での取り組みが必要である。
【０００３】
現在のＩＴシステムの冷却について説明する。サーバの稼働率上昇に伴いＣＰＵやメモリなどの部品は熱を発生する。サーバは冷却ファンを備えており、サーバ筐体内の温度を検出し、温度が一定のしきい値を超えると、気流を発生させて発熱部品を冷却する。熱はこの気流により筐体の外に排出される。この冷却ファンの制御に関して、発熱部品の温度と温度変化に基づいてファンを制御し冷却を効率化する発明が特許文献１に開示されている。また、発熱部品の温度と温度変化に基づいてファンを制御し、冷却を効率化する発明が特許文献２で開示されている。
【０００４】
一方、サーバを設置するコンピュータ室には機器の発生する熱を冷却するための冷却装置が設置されており、固定のセンサの温度をもとに出力を決定し、室内の温度を一定に保つ。しかし、ＩＴ機器の発する熱の偏りや機器の配置によって、コンピュータ室の温度を均一することは難しい。この冷却装置の制御に関して、マシン室内の空気流を監視し、空気流に応じて換気を行う発明が特許文献３に開示されている。
【０００５】
コンピュータ室の熱の偏りが大きい場合は、熱だまりにある機器がＣＰＵ熱暴走により動作が不安定になる、また、ＣＰＵ温度制御回路が作動し、強制的に処理性能を落としたり、シャットダウンしたりすることがある。強制的なシャットダウンによる不具合の発生を回避するため、温度が一定値を超えた場合ハイバネーションにより放熱制御して障害、シャットダウンを回避する発明が特許文献４で開示されている。
【０００６】
また、CPUの現在の処理内容、CPUの温度特性、外部から入力されたユーザの指示に基づいて一定時間経過後の温度を予測し、予測された温度が基準値を上回った場合には、CPUの処理を他のCPUに移動する方法が、特許文献５に開示されている。
【０００７】
【特許文献１】特開２００２−２６８７７５
【特許文献２】特開２００８−８４１７３
【特許文献３】特開２００６−２０８０００
【特許文献４】特開２００８−１５８７８７
【特許文献５】特開２００７-２４１３７６
【発明の開示】
【発明が解決しようとする課題】
【０００８】
今後は、熱の偏りを無くすためコンピュータ室全体を大規模な冷却装置で均一に冷やすのではなく、局所的に温度を制御できる冷却装置が重要になる。例えば、指向性のある冷却装置、ラック背面に取り付けるラック単位の冷却装置などが既に出荷されている。また、床下からの冷風によって冷却を行う設備の場合には、床のグレーティング板（穴あきタイル）の開閉を制御して、床下からの送風箇所を変更し、温度の高い箇所を集中的に冷やすようになる。
【０００９】
また、発熱部品の稼動率が上昇してから熱が発生し、その熱が温度センサに検出されるまでには遅延がある。また、温度上昇が検出されてファンや空調の出力が上がり、実際に冷却効果が出るまでにはさらに遅延がある。このため、バースト的な負荷が発生した場合は、ファンの出力が上がっても一時的には温度が上昇し、その後安定稼動可能な温度に落ち着く。しかし、ＣＰＵは自身の温度が上昇すると、リーク電流が指数関数的に増加して冷却の電力もより多く必要になる。
【００１０】
この結果、冷却能力が不足してＣＰＵ熱暴走により動作が不安定になる、または、ＣＰＵ温度制御回路が作動し、強制的に処理性能を落としたり、シャットダウンすることがある。ハイバネーションにより、強制シャットダウンを回避しても、処理は中断せざるを得ない。
【００１１】
また、サーバの冷却ファンが回転数を上げても、サーバ背面の空気流が不足していると、熱が排出穴に運ばれずに周囲の機器に拡散し、他の機器の温度も上昇し障害を招くおそれがある。現在の冷却装置は一点で計測した温度情報を元に出力を調整しているため、あるサーバで発生した熱がその計測点に回り込むまで空調は連動しないので、このような状態になることがある。
【課題を解決するための手段】
【００１２】
前記目的を達成するために、本発明の制御方法は、プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機の制御方法であって、前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第１の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法である。
【００１３】
また、本発明のサーバシステムは、プロセッサとファンを有し、前記プロセッサの温度及び稼働率と前記ファンの回転数と入気温度とを計測する前記サーバ装置と、前記サーバ装置及び前記冷却装置に接続し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第１の所定値を以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定する管理計算機とを有する、ことを特徴とするサーバシステムである。
【発明の効果】
【００１４】
本発明によれば、CPUを事前に冷却して最適温度に保つことにより、リーク電流による電力の消費を最小にし、冷却効率を上げることができる。
【発明を実施するための最良の形態】
【００１５】
以下に、本発明の実施の形態を説明する。
【実施例】
【００１６】
（第１の実施例）
図面を用いて、本発明の一実施形態を説明する。
【００１７】
図１は、本発明の一実施例のシステム構成を示す図である。本実施例のシステム構成は、情報処理システムあるいはストレージシステム等である。例えば、１つの管理計算機１００と、１つ以上の物理計算機２００と、１つ以上のストレージ装置２３０と、該管理計算機１００、該物理計算機２００、該ストレージ装置２３０とを設置したコンピュータ室を冷却する冷却装置１５１と、冷却装置１５１を制御する冷却装置制御部１５０を備えて構成されている。そして、管理計算機１００、物理計算機２００及び冷却装置１５１は、管理ネットワーク２２５経由で接続している。また、物理計算機２００とストレージ装置２３０は、例えばファイバチャネルネットワーク２２６で接続している。ここで、冷却装置制御部１５０は、冷却装置１５１を一括に制御すべく、物理計算機のメモリにプログラムとして格納されてもよい。また、冷却装置制御部１５１は、管理計算機内のメモリにプログラムとして格納されていてもよい。
【００１８】
図２は、本発明の一実施例における管理計算機１００を示す図である。
【００１９】
管理計算機１００の動作の概要を説明する。詳細については、以下に図面に沿って説明を加える。管理計算機１００は、物理計算機２００とストレージ装置２３０および冷却装置制御部１５０を管理する。そして、複数の物理計算機２００と情報の授受を行って、複数の物理計算機２００の稼動状況を検出する。検出した複数の物理計算機２００の稼動状況に応じて、冷却装置制御機能１５１を介して冷却装置１５１を個別に制御する。また、検出した複数の物理計算機２００の稼働状況に応じて複数の物理計算機２００のファン回転数や冷却装置を制御する。
【００２０】
管理計算機１００は、中央演算装置ＣＰＵ(ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)１０１、ハードディスク装置やフラッシュメモリ等の記憶装置１０５、メモリ１０２、バス１０７、ネットワークインタフェース１０４、ディスクインタフェース１０３から構成される。
【００２１】
メモリ１０２には、サーバプログラム１１０が格納されている。そして、サーバプログラムには、稼動情報監視部１１１、温度監視部１１２、ＣＰＵ温度推定部１１３、ファン回転数決定部１１５、ファン監視・制御部１１６、冷却制御部１１７が含まれる。これらのプログラムは、当初、磁気ディスク１０５に格納され、必要に応じてメモリ１０２に転送された後、ＣＰＵ１０１で実行される。稼動情報・電力監視部１１１は、物理計算機２００の稼動情報および消費電力情報を収集する。温度監視部１１２は、物理計算機の入気温度、ＣＰＵ温度、排気温度を取得する。ファン監視・制御部１１６は、ファン回転数の情報を取得し、ファンの回転数を変更する指示を出す。ＣＰＵ温度推定部１１３は、物理計算機に内蔵されるＣＰＵの一定時間後の温度を推定する。ファン回転数決定部１１５は、ＣＰＵの一定時間後の温度を目標値まで下げるファン回転数を決定する。冷却制御決定部１１４は、ラック・冷却マップ１２６を取得し、冷却装置１５１の出力を決定する。冷却制御部１１７は、冷却装置１５１の出力を制御する指示を出す。
【００２２】
そして、記憶装置１０５に、稼動情報履歴１２４と、サーバ構成情報１２１と、熱発生プロファイル１２２と、ファンプロファイル１２３と、ＣＰＵ温度プロファイル１２５と、冷却装置プロファイル１２７と、ＣＰＵ温度範囲１２８と、ＣＰＵ最適温度１２９と、ラック・冷却マップ１２６と、冷却装置プロファイル２０１０と、が格納される。
【００２３】
図３は、本発明の一実施例における物理計算機２００のハードウェア構成を示す図である。
【００２４】
物理計算機２００は、中央演算装置ＣＰＵ２０１、メモリ２０２、ハードディスク装置やフラッシュメモリ等の記憶装置２０５、バス２０７、ネットワークインタフェース２０４、ディスクインタフェース２０３、ファン２０８、ＢＭＣ(ＢａｓｅｂｏａｒｄＭａｎａｇｅｍｅｎｔＣｏｎｔｒｏｌｌｅｒ)２０７とから構成される。
【００２５】
ＢＭＣ２０７は、サーバ入気温度、排気温度、ＣＰＵ温度の監視や、ファン回転数の監視・制御、電源制御を行う。
【００２６】
メモリ２０２には、ＯＳ２２２、この物理計算機の稼動情報を収集する計測エージェントプログラム２２３、業務サービスプログラム２２４が格納される。これらのプログラムは、まず、磁気ディスク２０５に格納され、必要に応じてメモリ２０２に転送された後、ＣＰＵ２０１で実行される。なお、これらのプログラムは、可搬型記録媒体から読み出されることにより、または、各々の装置に接続されたネットワーク経由で、他の計算機または記憶装置からダウンロードされることにより、磁気ディスク２０５に格納されるものであってもよい。
【００２７】
また、管理計算機のサーバプログラム１１０の各処理は、各プログラムをＣＰＵで実行することにより実現するが、これらは計測エージェント決定部、計測部など、各処理を行う処理部として集積回路化するなどしてハードウェアで実現することもできる。
【００２８】
計測エージェント２２３は、計算機２００上で稼動し、自身が稼動する装置のＣＰＵ使用率やメモリ使用率、ネットワークインタフェースの使用率などの稼動情報を収集し、計測カウンタとして記録するソフトウェアプログラムである。管理計算機のサーバプログラム１１０の稼動情報・電力監視部１１１は、計測エージェント２２３に対して、ＳＮＭＰ(ＳｉｍｐｌｅＮｅｔｗｏｒｋＭａｎａｇｅｍｅｎｔＰｒｏｔｏｃｏｌ)による稼動情報収集リクエストを送信する。計測エージェント２２３は、この稼動情報収集リクエストを受け取り、リクエスト中のオブジェクトＩＤ(Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ)で指定された計測カウンタの値を稼動情報・電力監視部１１１に送信する。サーバプログラム１１０は、この計測カウンタの値を受け取り、稼動情報として記録することで、複数の管理対象の稼動情報を一元的に管理することができる。
【００２９】
図４は、本発明の一実施例における、物理計算機２００、ストレージ装置２３０、冷却装１５１置などが設置されるコンピュータ室４００の機器配置を示す図である。
【００３０】
コンピュータ室４００には、４つのラック４０１ａ、４０１ｂ、４０１ｃ、４０１ｄと、冷却装置１５１ａ、１５１ｂが配置されている。各ラック４０１と冷却装置１５１ａ、１５１ｂは、床上に固定されている。床には、複数の吹出口４３１〜４３５が設置される。吹出口４３１〜４３５は、例えば図４（ｂ）に示すように、モータ４４０が固定され、モータ回転軸４４１には、モータ４４０の回転駆動に応じて、各吹出口を開閉する開閉版４４２が固定されている構成である。
【００３１】
ラック４０１aには、物理計算機２００及びストレージ装置２３０が収納されている。ラック４０１ｂ〜４０１ｃにも、同様に物理計算機２００及びストレージ装置２３０が収納されている（図示せず）。
【００３２】
冷却装置１５１a、１５１ｂは、コンピュータ室４００の側面に取り付けら、コンピュータ室４００の温度を一定に保つための冷却装置１５１の一要素として構成されている。この冷却装置１５１a、１５１ｂは冷風を床下に送り、冷風が吹出口（穴あきタイル）４３１から吹き出すことで、各サーバが排出する熱を除去する。この際、管理計算機１００からの指示に応じて、吹出口４３１〜４３５のうちいずかの吹出口を開き、他の吹出口を閉じる制御が行われる。例えば、ラック４０１ａ、４０１ｄに収納されたサーバの稼働率が高く、ラック４０１ｂ、４０１ｃに収納されたサーバがアイドル状態であるときには、冷却装置１５１に対する制御として、モータ４４０の回転駆動により、吹出口４３１〜４３５のうち吹出口４３３が閉じ、他の吹出口４３１、４３２、４３４、４３５が開かれる制御が実行される。
【００３３】
また、ラック４０１ｂ、４０１ｃに収納されたサーバの稼働率が高く、ラック４０１ａ、４０１ｄに収納されたサーバがアイドル状態のときには、冷却装置１５１に対する制御として、モータ４４０の回転駆動により、吹出口４３１〜４３５のうち吹出口４３１、４３５が閉じ、他の吹出口４３２、４３３、４３４が開かれる制御が実行される。
【００３４】
本実施例における冷却装置は、一般的なコンピュータ室空調（ＣＲＡＣ: ＣｏｍｐｕｔｅｒＲｏｏｍＡｉｒＣｏｎｄｉｔｉｏｎｅｒ）であるがこれに限定されるものではない。冷却設備は冷却された液体の冷媒がパイプを通り、各ラックを循環することで各サーバが排出する熱を除去する液冷装置であっても良い。液冷装置では、各ラックに通じるパイプの手前にバルブがあり、バルブを開閉することで、吹出口と同様に冷却出力の調整を行う。また、冷却設備は、外の冷えた空気を取り込み、コンピュータ室冷却装置と同様に床下から冷風を送ることで各サーバが排出する熱を除去する外気冷却装置であっても良い。
【００３５】
図５は、本発明の一実施例におけるサーバ構成情報１２１を示す図である。
【００３６】
サーバ構成情報１２１は、コンピュータ室４００内に設置されたラックと、ラックに格納される物理計算機との対応関係を示すラック・物理計算機マップ５００（図５（ａ））と物理計算機リスト５１０（図５（ｂ））とからなる。
【００３７】
ラック・物理計算機マップ５００（図５（ａ））は、ラックの識別子であるラックＩＤ５０１と、それぞれのラックに格納される物理計算機２００の識別子である物理計算機ＩＤ５０２で構成される。
【００３８】
物理計算機リスト５１０（図５（ｂ））は、物理計算機２００の持つ物理計算機ＩＤ５１１と、シャーシ番号５１２と、構成要素識別子（項目）５１３と、構成要素の値５１４からなる一つ以上のレコードで構成され、物理計算機２００の処理能力を表す。物理計算機ＩＤ５０１には、各物理計算機の識別子が格納されている。シャーシ番号５１２は、当該物理計算機がブレードサーバである場合に、ブレードサーバを格納するシャーシを特定するためにある。１Ｕサーバなどの非モジュラータイプのサーバである場合には、”-”が記録される。ブレードサーバは、複数のサーバでファンや電源を共有しており、サーバの構成や電源On/Offを管理する管理用プロセッサを持つ場合がある。管理対象物理計算機がブレードサーバである場合には、個々のサーバではなく、この管理用プロセッサに接続してＣＰＵ温度や共有するファンの回転数を得ることができる。管理用プロセッサに接続するため必要なＩＰアドレスやポート番号は、図示しないがサーバ構成情報として管理されているものとする。
【００３９】
サーバ構成情報１２１は、管理対象システムの設計者がシステム構築時に決定し、文書またはソフトウェアによって管理していることが多い。物理計算機構成情報は、このような管理されている構成情報に基づいて作成してもよいし、動的に収集した情報から作成してもよい。
【００４０】
図６は、本発明の一実施例におけるラック・冷却装置マップ１２６を示す図である。
【００４１】
ラック・冷却装置マップ１２６は、ラックの識別子６０１と、冷却装置１５１の識別子６０２と、ラックの前面に位置する吹き出し口６０３と、ラックの背面に位置する吹き出し口６０４とからなる一つ以上のレコードで構成される。各レコードは、ラックと、各ラックを冷却している冷却装置１５１と、ラックに対して送風・換気を行う吹き出し口の識別番号との対応を表している。
【００４２】
図７は、本発明の一実施例における稼動情報７１０（図７（ａ））および電力情報７２０（図７（ｂ））を示す図である。
【００４３】
稼動情報７１０（図７（ａ））は、一つの物理計算機２００のリソース使用状況を示す。一例として、計測日７１１、計測曜日７１２、計測時刻７１３、ＣＰＵ稼働率７１４とからなる一つ以上のレコードで構成される。ＣＰＵ稼働率の単位は％である。ここで示す稼動情報は、Ｗｉｎｄｏｗｓ（登録商標）であればＷＭＩ(ＷｉｎｄｏｗｓＭａｎａｇｅｍｅｎｔＩｎｔｅｒｆａｃｅ)で、ＬｉｎｕｘであればＴｏｐコマンドで取得することが可能である。
【００４４】
電力情報７２０（図７（ｂ））は、各物理計算機２００の電力消費状況を示すものであり、計測日７２１、計測曜日７２２、計測時刻７２３、物理計算機の電力量７２４および、シャーシの電力量７２６からなる一つ以上のレコードで構成される。なお、物理計算機２００が、ブレードサーバである場合には、複数の物理計算機の電力量とシャーシの電力量が一つのテーブルで管理されている。一方、物理計算機２００がブレードサーバでない場合には、一つの物理計算機の電力量だけが管理される。
【００４５】
図８は、本発明の一実施例における熱発生プロファイル１２２を示す図である。
【００４６】
熱発生プロファイル１２２は、ＣＰＵ稼働率８０１と、発熱量８０２とからなる一つ以上のレコードで構成される。ここで、稼働率８１１とは、ＣＰＵの稼働率であり、発熱量と８０２とは、ＣＰＵの発熱量である。つまり、各レコードは、物理計算機２００のＣＰＵの稼働率に対する、発熱量を表している。
【００４７】
熱発生プロファイル１２２は、物理計算機２００の備えるＣＰＵの種類ごとに異なる。熱発生プロファイルの取得方法は様々な方法がある。例えば、ＣＰＵの過去の稼動率と発熱量の履歴を記録しておき、該履歴より取得することができる。また、事前にＣＰＵによる処理を実行し、稼動率と発熱量の関係を測定することもできる。また、ＣＰＵベンダより提供された稼動率と発熱量との関係を記録することもできる。
【００４８】
図９は、本発明の一実施例におけるＣＰＵ温度プロファイル１２５（図９（ａ））、ＣＰＵ温度範囲１２８（図９（ｂ））、ＣＰＵ最適温度１２９（図９（ｃ））、温度上昇とリーク電流による消費電力の関係、および温度上昇とファン消費電力との関係（図９（ｄ））を示す図である。
【００４９】
ＣＰＵ温度プロファイル１２５（図９（ａ））は、ＣＰＵの発熱量９０１と、一定時間あたりのＣＰＵ温度変化９０２からなる一つ以上のレコードで構成される。つまり、各レコードは、ＣＰＵの発熱量に対する、一定時間後の温度変化量を表している。
【００５０】
一般に、物体の温度変化は外部から与えられる熱量を熱容量で割った値になるが、物体の性質によって熱の伝わりやすさが異なる。すなわち、同じ熱量が与えられても、ＣＰＵの材質や構造によって最終的に到達する温度、および温度変化の速度は異なる。このため、ＣＰＵ温度プロファイルはＣＰＵ種類ごとに決まるテーブルである。
【００５１】
上記のように、ＣＰＵ温度プロファイル１２５は、物理計算機２００の備えるＣＰＵの種類ごとに異なる。ＣＰＵ温度プロファイルの取得方法は様々な方法がある。例えば、ＣＰＵの過去の発熱量と温度変化の履歴を記録しておき、該履歴より取得することができる。また、事前にＣＰＵによる処理を実行し、発熱量と温度変化の関係を測定することもできる。また、ＣＰＵベンダより提供された発熱量と温度変化との関係を記録することもできる。
【００５２】
ＣＰＵ温度範囲１２８（図９（ｂ））は、上限値９１１と下限値９１２から成り、ＣＰＵが安全に稼動する温度の範囲を示している。通常、ＣＰＵは製造ベンダによって正常に動作する温度の上限と下限が決められている。そして、多くのサーバでは、室温の上昇やファンの故障によって、ＣＰＵ温度がこの範囲を超えると、サーバのハードウェア状態を監視するプログラムがサーバ外部に警告を出す。
【００５３】
ＣＰＵ最適温度１２９は、ＣＰＵのリーク電流による消費電力と、ＣＰＵを冷却するファンが消費する電力との総和を最小にする温度である。ＣＰＵ最適温度１２９は、入気温度によって変化するため、入気温度９２１と、ＣＰＵ最適温度９２２からなる一つ以上のレコードで構成される。
【００５４】
ＣＰＵ最適温度１２９について説明する。半導体の微細化によりＣＰＵにはＯＦＦ状態であっても微量の電流（リーク電流）が流れるが、このリーク電流は温度が上昇すると指数関数的に上昇するという特性を持つ。このため、アイドル状態であっても、ＣＰＵ自身の温度が上昇すると消費電力も指数関数的に上昇する。このリーク電流によるＣＰＵ消費電力を抑えるには、ＣＰＵ温度を上げない方が良いが、温度を維持するには冷却用の電力が必要になる。一般に、ファン消費電力はファンの風速、消費電力に比例しており、ＣＰＵ温度上昇の２乗に反比例する。したがって、図９（ｄ）に示すように、温度を低く保つとリーク電流は抑えられるが、ファンの消費電力は増加し、温度上昇を許せばリーク電流は増加するが、ファンの消費電力は低くすることができるというトレードオフの関係となる。CPU最適温度１２９は、このリーク電流による消費電力とファン消費電力との総和が最小になる温度であり、管理者が測定することも可能であり、サーバベンダが公開することも考えられる。
【００５５】
図１０は、本発明の一実施例におけるファンプロファイル１２３を示す図である。
【００５６】
ファンプロファイル１２３は、物理計算機２００のファンの回転数１００１と、ファンの送風によりＣＰＵを冷却し、一定時間あたりに変化させることのできるＣＰＵの温度変化１００２からなる一つ以上のレコードで構成される。そして、ファンによるＣＰＵの冷却効率は、入気温度により変化する。したがって、ファンにより、一定時間あたりに変化させることのできるＣＰＵの温度変化は入気温度により異なる。本実施例のファンプロファイルでは、２１℃、２２℃、２３℃（１００３）の入気温度の場合を示しているがこれに限定されるものではない。
【００５７】
また、サーバのＣＰＵとファンとの関係は1対１とは限らない。例えば、一つの筐体に複数のサーバが格納されるブレードサーバでは、複数のサーバを共有のファンで冷却することがある。このような場合でも、ファンは、各ＣＰＵを均一に冷やすよう構成されており、前述のようなファンプロファイル１２３を定義することができる。
【００５８】
図２０は、本発明の一実施例における冷却装置プロファイル２０１０と、冷却制御パターン２０１０を示す図である。
【００５９】
冷却制御プロファイル２０１０は、冷却装置ごとに分かれており、冷却装置の出力段階２０１１と、その出力段階時の各冷却対象ラックの入気温度変化２０１２と、消費電力２０１３とからなる一つ以上のレコードで構成される。
【００６０】
冷却制御パターン２０２０は、複数の冷却装置の出力の組み合わせと消費電力を表すものであり、組み合わせ番号２０２１と、各冷却装置の出力２０２２と、その時の冷却装置全体の消費電力量２０２３からなる一つ以上のレコードで構成される。
【００６１】
図５から図１０で示した情報は、管理者が定義ファイルに記述する。ただし、これらの情報は、定義ファイルでなく、ＧＵＩ(ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ)から入力してもよいし、他のサーバからネットワークを介して取得してもよい。
【００６２】
次に、本発明の一実施例における管理計算機による物理計算機と冷却装置の制御を、図を用いて説明する。
【００６３】
図１１は、本発明の一実施例における、管理計算機よる物理計算機と冷却装置の制御フローを示した図である。
【００６４】
まず、物理計算機のサーバプログラム１１０の稼動情報監視部１１１は、サーバ構成情報１２１を記憶装置１０５から読み出す（Ｓ１１０１）。そして、管理する物理計算機２００を把握し、稼動情報監視部１１１がこれら物理計算機２００の稼動情報および消費電力を収集し（Ｓ１１０２）、サーバ稼動履歴１２４に格納する。
【００６５】
そして、ＣＰＵ温度推定部１１３は、格納した稼動履歴と、記憶装置に格納された熱発生プロファイル１２２、ＣＰＵ温度プロファイル１２５に基づいて、各物理計算機２００の一定時間経過後のＣＰＵ温度を推定する（Ｓ１１０３）。この推定の処理は図１２を用いて説明する。
【００６６】
図１２は、本発明の一実施例におけるＣＰＵ温度推定フローを示す図である。本処理は、ＣＰＵ温度推定部により実行される。
【００６７】
ＣＰＵ温度推定部１１３は、サーバ稼動履歴１２４を参照して、処理対象である物理計算機２００のＣＰＵ稼働率７１４を取得する（Ｓ１２０１）。
【００６８】
そして、ＣＰＵ稼働率に対して発生する熱量を、熱発生プロファイル１２２を参照して求める（Ｓ１２０２）。この時、まず、サーバ構成情報１２１のサーバリスト５１０を参照して、当該物理計算機２００のＣＰＵ種類を求め、ＣＰＵ種類に対応するＣＰＵ温度プロファイルを用いる。
【００６９】
次に、発生した熱量に対するＣＰＵ温度変化を、ＣＰＵ温度プロファイル１２５を参照して求める（Ｓ１２０３）。具体的には、ＣＰＵ温度推定部１１３は、温度監視部を用いて現在のＣＰＵの温度とサーバ装置への入気温度を取得し、ファン監視・制御部１１６を用いて現在のファン回転数を取得する。そして、ファンプロファイル１２３を参照して、現在時刻から一定時間経過後まで現在のファン回転数を維持した場合のＣＰＵ温度変化（冷却効果）を求める（Ｓ１２０４）。ファン監視・制御部１１６は、前記ＢＭＣ２０７に対してＳＳＨ(ＳｅｃｕｒｅＳｈｅｌｌ)などによって接続し、ファン回転数を取得するコマンドを実行し、ファン回転数の値を取得する。
【００７０】
最後に、現在のＣＰＵ温度に発生した熱量に対するＣＰＵ温度変化を加算し、ファンによる温度変化を引いて、一定時間経過後のＣＰＵ温度とする（S１２０５）。
【００７１】
一定時間経過後のＣＰＵ温度の推定値が算出されたら、一定時間経過後の推定温度が、設定したしきい値を超えるか否かを確認する（S１１０４）。設定したしきい値を超える場合（Ｙの場合）、温度監視部により物理計算機への入気温度を取得し、ファン回転数決定部１１５は取得された入気温度とファンプロファイル１２３を参照して、一定時間経過後のＣＰＵ温度を上限値内に抑えるために必要なファン回転数を算出する（S１１０５）。
【００７２】
ファン回転数を決定する一例を図１３に示す。つまり、図１３は、本発明の一実施例におけるファン回転数決定フローを示す図である。
【００７３】
ＣＰＵ温度の推定値がしきい値を上回る場合、ファン回転数決定部１１５は、推定した一定時間経過後のＣＰＵ温度とＣＰＵ温度のしきい値との差分を求め、実現すべきＣＰＵ温度変化量とする（Ｓ１３０１）。
【００７４】
そして、一定時間経過後のＣＰＵ温度を推定する際に取得した、物理計算機への現在の入気温度と、ファンプロファイル１２３とを参照して、一定時間経過後の実現すべきＣＰＵ温度変化量とするためのファン回転数を求める（Ｓ１３０２）。
【００７５】
しきい値を超えない場合は、一定時間経過を待ち（Ｓ１１０８）、稼動情報・温度・回転数の監視に戻る（S１１０２）。ここで、しきい値は、ＣＰＵ温度範囲１２８の上限値であってもよい。また、しきい値は、上限値より一定値引いた値であってもよい。上限値より一定値を引いた値をしきい値とすることにより、突然稼動量が上昇した場合であっても、上限値を以下で稼動することができる。
【００７６】
また、本実施例においては、一定時間経過後のしきい値を超えるか否かにより、ファンの回転数を制御するか否かを決定したが、これに限られるものではない。他の実施形態として、温度監視部１１２により入気温度を取得し、取得した入気温度からCPUリーク電流とファン消費電力の合計を最小にする値であるＣＰＵ最適温度１２９を決定する。そして、ＣＰＵ最適温度から一定温度減算した値より、ＣＰＵ最適温度に一定温度加算した値の範囲範囲内であるか否かにより判断１１０４をしてもよい。
【００７７】
次に、サーバプログラム１１０は、物理計算機２００がファンの回転数を算出した回転数へ変更可能であるか確認する（S１１０６）。例えば、処理１１０５にて求めたファン回転数が、最大値を超えているかどうかを確認する。変更可能である場合には（Ｓ１１０６：Ｙ）、ファン監視・制御部１１６は、物理計算機２００に対して、ファンの回転数を変更するよう指示を出す（S１１０７）。そして、一定時間経過を待ち（S１１０８）、稼動情報・温度・回転数の監視に戻る（S１１０２）。
【００７８】
物理計算機２００のファンが、ファン回転数決定部１１５が決定したファンの回転数を実現できない場合には（Ｓ１１０６：Ｎ）、冷却制御部１１７は、コンピュータ室４００に設置された冷却設備１５１a、１５１bの出力を変更して当該物理計算機２００の入気温度を下げる（S１５２０）。この処理は図２１を用いて説明する。
【００７９】
図の２１は、本発明の一実施例における冷却制御フローを説明する図である。
【００８０】
冷却制御部１１７は、ファンプロファイル１２３を参照して、実現すべきＣＰＵの温度変化量を達成する、目標入気温度を求める（Ｓ２１０１）。ここで、ファン回転数は実現できる最大値とする。つまり、図１０の５０００回転が最大値であり、ＣＰＵ温度変化を-３．０℃とした場合には、目標入気温度を２１℃と求める。
【００８１】
そして、現在の入気温度と目標入気温度との差分を求め入気温度変化目標値とする（Ｓ２１０２）。
【００８２】
次に、冷却制御部１１７は、サーバ構成情報１２１を参照して制御対象の物理計算機２００が格納されるラックを特定する。そして、ラック・冷却マップ１２６を参照して、特定したラックの冷却を担当する冷却設備を特定する。特定されるラックは複数台であってもよい。そして、冷却制御部１１７は、この冷却装置の出力を、前記差分に応じて変更するよう指示する。
【００８３】
具体的な冷却装置の出力の決定方法は、冷却装置プロファイル２０１０を参照して、ラック温度変化量が、入気温度変化目標値以上である出力段階を選択する。
【００８４】
ただし、本実施例のように複数の冷却装置が同一ラックを冷却する場合には、どの冷却装置の出力を変更するかによってコンピュータ室全体の消費電力が異なる。そこで、管理対象ラックの入気温度を目標入気温度にするために、冷却設備１５１aおよび冷却設備１５１ｂが取り得る出力の組み合わせを列挙した冷却制御パターンリスト２０３０を作成する（S２１０３）。
【００８５】
そして、冷却設備１５１aと冷却設備１５１bとの消費電力の和が最小となる組み合わせを選択する（S２１０４）。
【００８６】
例えば、組み合わせには、冷却設備１５１aは段階１にして、冷却設備１５１aは段階３とするパターン、両方の出力を段階２とするパターン、冷却設備１５１aを段階３として、冷却設備１５１bを段階１とするなどのパターンがある。ここで、温度変化、つまり冷やせる温度に対する冷却装置の消費電力は、装置の特性やラックとの距離によって異なるため、各パターンの消費電力は異なる。そして、冷却設備１５１a、１５１bの出力を変更して当該物理計算機２００の入気温度を下げる（S２１０５）。
そして、一定時間経過を待ち（Ｓ１１０８）、稼動情報・温度・回転数の監視に戻る（Ｓ１１０２）。
【００８７】
本実施例の物理計算機プロファイル１２４は、主な発熱部品であるＣＰＵのみに着目しているが、熱発生プロファイルはＣＰＵだけでなく、他の部品の利用率に応じた情報であってもよい。
【００８８】
また、本実施例は、ＩＴ装置がサーバである場合について説明したが、ＩＴ装置はストレージ装置、ネットワーク機器であっても良い。ＩＴ装置がストレージ装置の場合には、装置の発熱量はＣＰＵ稼働率だけではなく、装置へのデータ入出力回数を示すＩＯＰＳ(ＩｎｐｕｔＯｕｔｐｕｔＰｅｒＳｅｃｏｎｄ)によって変化するため、コントローラのＣＰＵ稼働率やＩＯＰＳに基づいて発熱量を推定することができる。同様にＩＴ装置がネットワーク機器の場合には、ポートの使用率に基づいて発熱量を推定することができる。
【００８９】
上述したように、省電力制御サーバ１１０を、物理計算機２００の稼動情報および消費電力情報を収集する稼動情報監視部１１１と、前記管理対象サーバの入気温度、ＣＰＵ温度、排気温度を収集する温度監視部１１２と、前記管理対象サーバのファン回転数を監視し、前記ファンの回転数を変更するファン監視・制御部１１６と、熱発生プロファイル１２２およびＣＰＵ温度プロファイル１２５を読み込み、前記管理対象サーバが内蔵するＣＰＵの一定時間後の温度を推定するＣＰＵ温度推定部１１３と、ファンプロファイル１２３を読み込んで前記ＣＰＵの一定時間後の温度を目標値まで下げるファン回転数を決定するファン回転数決定部１１５と、冷却装置プロファイル１２７と、ラック・冷却マップ１２６の入力を受け付け、冷却装置１５１の出力を決定する冷却制御決定部１１４と、冷却装置１５１の制御を指示する冷却制御部１１７とで構成することで、ＣＰＵを事前に冷却して最適温度に保ち、リーク電流による電力の消費を最小にし、冷却効率を上げることができる。また、サーバのファンと空調を連携して制御することにより、ファンの制御だけではＣＰＵの温度を規定範囲内にできない場合であっても、事前に空調を調整して入気温度を下げておくことで、ＣＰＵの温度を規定の範囲内に収めて熱による障害の発生を回避できる。
【００９０】
なお、本実施例においては、管理計算機からの指示によりサーバ装置内のＢＭＣがファンを制御するが、これに限定されるものではなく、サーバプログラム１１０を物理計算機のメモリに格納し、稼動情報履歴１２４と、サーバ構成情報１２１と、熱発生プロファイル１２２と、ファンプロファイル１２３と、ＣＰＵ温度プロファイル１２５と、冷却装置プロファイル１２７と、ＣＰＵ温度範囲１２８と、ＣＰＵ最適温度１２９と、ラック・冷却マップ１２６と、冷却装置プロファイル２０１０とを記憶装置に格納し、物理計算機内において本実施例におけるファン制御及び空調装置制御を行ってもよい。
（第２の実施例）
以下、本発明の第２の実施形態を図面に基づいて説明する。第１の実施例と、同一の構成部分については、適宜図面及び説明を省略する。
【００９１】
本発明の一実施例のシステム構成は、図１と同様である。また、物理計算機は、図３と同様である。
【００９２】
図１４は、本発明の一実施例の管理計算機を示す図である。実施例１の管理計算機との相違点は、稼動履歴情報１２４を保持せず、ジョブ実行スケジュール１３２、サーバ・ジョブマップ１３１を保持していることである。既に実施例１にて説明したサーバ構成情報１２１、熱発生プロファイル１２２、ファンプロファイル１２３、ＣＰＵ温度プロファイル１２５、ラック・冷却マップ１２６、ＣＰＵ温度範囲１２８、ＣＰＵ最適温度１２９については、説明を省略する。
【００９３】
管理計算機の動作を簡単に説明する。なお、詳細な説明は以下、図を用いて行う。サーバプログラム１１０は、管理対象サーバが実行する業務のジョブ実行スケジュール（負荷変動）から一定の期間におけるＣＰＵ稼働率を求め、ＣＰＵ稼働率と、ＣＰＵ種類ごとに決まっている稼働率に対する発熱量とから、一定時間後のＣＰＵの温度を推定し、ＣＰＵ温度が、ＣＰＵが安定稼動する温度範囲の上限値を超えることを確認すると、前記管理対象サーバのファン回転数及び必要に応じて冷却装置の出力を制御する。
【００９４】
図１５は、本発明の一実施例におけるサーバ・ジョブマップ１３１（図１５（ａ））と、ジョブ実行スケジュール１３２（図１５（ｂ））とを示す構成図である。
【００９５】
サーバ・ジョブマップ１３１（図１５（ａ））は、物理計算機の識別子である物理計算機ＩＤ１４０１と、業務の種類を示す業務種別１４０２からなる一つ以上のレコードで構成される。各レコードは、どの物理計算機で、どの業務を実行しているかを示す。
【００９６】
ジョブ実行スケジュール１３２（図１５（ｂ））は、物理計算機ごとに、日１４１１と、曜日１４１２、開始時刻１４１３、終了時刻１４１４、ジョブＩＤ１４１５、平均ＣＰＵ稼働率１４１６とからなる1つ以上のレコードで構成される。各レコードは、曜日と時間帯ごとの、業務によって発生するＣＰＵ稼働率の平均値を示している。サーバのＣＰＵ稼働率は、バッチジョブの実行スケジュール、業務リクエストの時間的変動、またはサーバのＯｎ/Ｏｆｆスケジュールなどによって予測する。ジョブ実行スケジュール１３２は、バッチジョブの実行スケジュール、業務リクエストの時間的変動、またはサーバのOn/Offスケジュールと、同等の処理を実行した時のサーバ稼動履歴から求める。
【００９７】
図１６は、本発明の第二の実施例の制御フローを示すフローチャートである。まず、サーバプログラム１１０の稼動情報監視部１１１は、サーバ構成情報１２１を取得し（S１６０１）、管理する物理計算機２００の情報を取得する。そして、管理する物理計算機のジョブ実行スケジュールの情報を取得する。
【００９８】
次に、サーバプログラム１１０は、ジョブ実行スケジュールを確認し、物理計算機２００が実行するジョブの終了時刻に達しているかを確認する（Ｓ１６０３）。そして、ジョブの終了時刻の場合（Ｓ１６０３：Ｙ）、サーバ・ジョブマップ１３１を参照して、物理計算機２００が次に実行するジョブを特定し、ジョブに対応するジョブ実行スケジュール１３２を参照して、当該物理計算機２００が実行するジョブの開始・終了時刻と平均ＣＰＵ稼働率を取得する（S１６０４）。
【００９９】
そして、ＣＰＵ温度推定部１１３は、平均ＣＰＵ稼働率と、熱発生プロファイル１２２、ＣＰＵ温度プロファイル１２５に基づいて、各物理計算機２００の一定時間経過後のＣＰＵ温度を推定する（S１６０４）。温度推定の処理は第一の実施例と同一である。
【０１００】
ここで、例えば、これから開始する負荷区間の平均CPU稼働率が０である場合は、ファンの回転数を落とす、または停止することで消費電力を抑えることができる。
【０１０１】
また、処理１６０６の処理も実施例１と同様である。
【０１０２】
本実施例では、ジョブ実行スケジュールから、実行されるジョブとそのジョブを処理するためのCPU稼働率を取得した。しかし、これに限定されるものではなく、例えば、過去に処理されたジョブやCPU稼働率などのデータを格納しておき、格納されたデータをもとにある時間のCPU稼働率を予測し、CPU稼動率を取得してもよい。
（第３の実施例）
以下、本発明の第３の実施形態を図面に基づいて説明する。第１の実施例と、同一の構成部分については、適宜図面及び説明を省略する。
【０１０３】
本発明の一実施例のシステム構成は、図１と同様である。また、物理計算機は、図３と同様である。
【０１０４】
図１７は、本発明の一実施例の管理計算機を示す図である。実施例１の管理計算機との相違点は、サーバプログラムにルール判定部１３３を保持し、記憶装置に冷却制御ルールを保持している点である。既に実施例１にて説明したサーバ構成情報１２１、熱発生プロファイル１２２、ファンプロファイル１２３、稼動履歴情報１２４、ＣＰＵ温度プロファイル１２５、ラック・冷却マップ１２６、ＣＰＵ温度範囲１２８、ＣＰＵ最適温度１２９については、説明を省略する。
【０１０５】
図１８は、本発明の第３の実施例の冷却制御ルール１３１を示す構成図である。
【０１０６】
冷却制御ルール１３１は、ルール１０１０とアクション１０２０からなり、ルール１０１０は、評価項目１０１１と、しきい値１０１２からなる一つ以上のレコードで構成される。各レコードは１つの条件を表しており、評価項目の値がしきい値以上になったときに条件が成立し、全てのレコードで表現された条件が成立したときに、アクション１０２０で指定された制御が実行される。また、１つの項目の条件が成立したときに、アクション１０２０で指定された制御を実行してもよい。
【０１０７】
冷却制御ルールは、異常な温度上昇が開始したと判定できる条件であり、あらかじめコンピュータ室の管理者が定義するものとする。
【０１０８】
例えば、図１８に示す冷却制御ルール１３１は、あるラックに格納される全物理計算機２００のＣＰＵ温度が６０℃を超えており、かつ、排気温度が４０℃を超えており、かつ、ファン回転数が１００００回転/秒を超える場合には、当該ラックに格納される物理計算機２００の排気が出るラック背面に熱だまりが発生するとみなす。そして、この熱を排出するため、アクション１０２０を実行する。当該ラックを冷却する冷却装置１５１の出力を最大にし、当該ラック背面に位置する吹き出し口のグレーティング板を１００％開放することを指示している。
【０１０９】
上記の他に、図５（ｂ）の電力情報より、同一ラックに格納される物理計算機２００の消費電力の総和が一定の値を超えたときに、当該ラックに格納される物理計算機群から発生する熱量が一定の値を超えると判断し、当該ラックを冷却する冷却装置の出力を一段階上げることも有効である。
【０１１０】
また、同一ラックに格納される全物理計算機２００の入気温度が一定のしきい値を超えた場合に、ラック前面に熱だまりが発生しているとみなして、当該ラックを冷却する冷却装置１５１の出力を最大にし、当該ラック前面に位置する吹き出し口のグレーティング板を１００％開放することも有効である。
【０１１１】
図１９は、本発明の第３の実施例の制御フローを示すフローチャートである。
【０１１２】
まず、省電力制御サーバ１１０の稼動情報監視部１１１は、サーバ構成情報１２１を取得する（S１９０１）。
【０１１３】
そして、管理する物理計算機２００の情報を取得し、稼動情報監視部１１１がこれら物理計算機２００の稼動情報および消費電力を収集し、サーバ稼動履歴１２４に格納する。温度監視部１１２は現在のＣＰＵ温度、排気温度を収集する。ファン監視・制御部１１６はファン回転数を収集する（S１９０２）。
【０１１４】
次に、ルール判定部１３３は、収集した情報をもとに、各ラックに格納される物理計算機２００について、冷却制御ルール１３１のルール１０１０の各項目の値をしきい値１０１２と比較する（Ｓ１９０３）。全項目の値が、しきい値１０１２以上であり、ルール１０１０が成立している場合（Ｓ１９０４：Ｙ）は、ラック・冷却マップ１２６を参照して、当該ラックを冷却する冷却装置１５１、および当該ラックの背面に位置する吹き出し口を特定し、アクション１０２０で指定された冷却制御を実行する（Ｓ１９０５）。そして、一定時間経過待ち（Ｓ１９０６）、稼動情報等の監視に戻る（Ｓ１９０２）。
【０１１５】
本実施例によれば、管理対象機器の周辺にセンサを多数設置して温度上昇を検出する方法と比較して、センサの設置コストを省くことができる。
【図面の簡単な説明】
【０１１６】
【図１】本発明の第一の実施例のシステム構成を示すシステム構成図の一例である。
【図２】本発明の第一の実施例の省電力制御サーバのハードウェア構成を示す構成図の一例である。
【図３】本発明の第一の実施例の管理対象である物理計算機ハードウェア構成を示す構成図の一例である。
【図４】（ａ）は、本発明の第一の実施例のコンピュータ室の内部構成図、（ｂ）は、コンピュータ室の床に設置されたモータと吹出口との関係を示す要部断面図の一例である。
【図５】本発明の第一の実施例のサーバ構成情報を示す構成図の一例である。
【図６】本発明の第一の実施例のラック・冷却マップを示す構成図の一例である。
【図７】本発明の第一の実施例における稼動情報および消費電力情報を示す構成図の一例である。
【図８】本発明の第一の実施例における熱発生プロファイルを示す構成図の一例である。
【図９】本発明の第一の実施例におけるCPU温度プロファイルを示す構成図の一例である。
【図１０】本発明の第一の実施例におけるファンプロファイルを示す構成図の一例である。
【図１１】本発明の第一の実施例における省電力制御フローを示すフローチャートの一例である。
【図１２】本発明の第一の実施例におけるＣＰＵ温度推定フローを示すフローチャートの一例である。
【図１３】本発明の第一の実施例におけるファン回転数決定フローを示すフローチャートの一例である。
【図１４】本発明の第二の実施例のシステム構成を示すシステム構成図の一例である。
【図１５】本発明の第二の実施例のジョブ実行スケジュール、サーバ・ジョブマップを示す構成図の一例である。
【図１６】本発明の第二の実施例の省電力制御フローを示すフローチャートの一例である。
【図１７】本発明の第三の実施例のシステム構成を示すシステム構成図の一例である。
【図１８】本発明の第三の実施例の冷却制御ルールを示す構成図の一例である。
【図１９】本発明の第三の実施例の省電力制御フローを示すフローチャートの一例である。
【図２０】本発明の第一の実施例の冷却装置プロファイルの一例である。
【図２１】本発明の第一の実施例の冷却装置部のフローチャートの一例である。
【符号の説明】
【０１１７】
１１０…省電力制御サーバ、１１１…稼動情報監視部、１１２…温度監視部、１１３…CPU温度推定部、１１４…冷却制御決定部、１１５…ファン回転数決定部、１１６…ファン監視・制御部、１１７…冷却制御部、１２１…サーバ構成情報、１２２…熱発生プロファイル、１２３…ファンプロファイル、１２４…サーバ稼動履歴、１２５…CPU温度プロファイル、１２６…ラック・冷却マップ、１２７…冷却プロファイル、２００…物理計算機、２２３…計測エージェント

【特許請求の範囲】
【請求項１】
プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機による制御方法であって、
前記サーバから前記プロセッサの温度及び稼働率と前記ファンの回転数と前記サーバへの入気温度を取得し、
前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、
前記推定温度が第１の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法。
【請求項２】
請求項１に記載の制御方法であって、
前記管理計算機は稼動情報監視部と、ファン監視部と、ファン制御部と、温度推定部と、冷却制御部とを格納するメモリを有し、
前記稼動情報監視部が前記サーバより前記プロセッサの前記稼動率を取得し、
前記ファン監視部が前記ファンの前記回転数を取得し、
前記温度推定部が前記入気温度と前記プロセッサの前記温度を取得し、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出し、
前記ファン制御部が前記サーバに前記ファンが前記目標回転数に変更する指示を出し、
前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却制御部が、前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、前記目標入気温度にするための前記冷却装置の出力を決定し、前記冷却装置に前記出力に変更する指示を出す、ことを特徴とする
【請求項３】
請求項１に記載の制御方法であって、
前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却装置の出力を上げることを特徴とする制御方法。
【請求項４】
請求項３に記載の制御方法であって、
前記冷却装置の出力を上げる際、
前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、
前記目標入気温度にするための前記冷却装置の出力を決定する、ことを特徴とする制御方法。
【請求項５】
請求項４に記載の制御方法であって、
前記冷却装置が複数台ある場合、前記複数の冷却装置の出力の組み合わせを複数算出し、
前記複数の組み合わせのそれぞれに対し、前記複数の冷却装置による消費電力を算出し、
前記消費電力をもとに、前記複数の組み合わせから組み合わせを選択し、
前記選択された組み合わせにより、前記複数の冷却装置の出力を決定する、ことを特徴等する制御方法。
【請求項６】
請求項１に記載の制御方法であって、
前記推定温度を算出する際、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出する、ことを特徴とする制御方法。
【請求項７】
請求項６に記載の制御方法であって、
前記サーバ装置の前記プロセッサの種類を認識し、
前記上昇温度を算出する際、前記プロセッサの前記種類に対応する稼動率と発熱量の関係を用いて算出することを特徴とする制御方法。
【請求項８】
請求項１に記載の制御方法であって、
前記推定温度が第１の所定値以上であり、さらに前記第２の所定値以下である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記第１の所定値は、プロセッサ最適温度に第１の温度を加えた値であって、前記第２の所定値は前記プロセッサ最適温度から第２の温度を引いた値である、ことを特徴とする制御方法。
【請求項９】
請求項８に記載の制御方法であって、
前記プロセッサ最適温度は、前記プロセッサの消費電力と、前記ファンの消費電力とにより算出する、ことを特徴とする制御方法。
【請求項１０】
プロセッサとファンを有するサーバ装置と冷却装置とに接続する管理計算機による制御方法であって、
前記サーバから前記プロセッサの温度と前記ファンの回転数と前記サーバへの入気温度を取得し、
前記サーバから前記プロセッサにて実行されるジョブに関する情報を取得し、
前記ジョブに関する情報から稼働率を取得し、
前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、
前記推定温度が第１の所定値以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定し、
前記目標回転数とするように前記サーバ装置に指示する、ことを特徴とする制御方法。
【請求項１１】
サーバシステムであって、
プロセッサとファンを有し、前記プロセッサの温度及び稼働率と前記ファンの回転数と入気温度とを計測する前記サーバ装置と
前記サーバ装置及び前記冷却装置に接続し、前記プロセッサの前記温度及び前記稼働率と、前記ファンの前記回転数と、前記入気温度とから、予め定められた期間を経過した後の前記プロセッサの推定温度を算出し、前記推定温度が第１の所定値を以上である場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記ファンの目標回転数を決定する管理計算機とを有する、ことを特徴とするサーバシステム。
【請求項１２】
請求項１１に記載のサーバシステムであって、
さらに、冷却装置を有し、
前記管理計算機は、前記ファンの回転数を最大にしても、前記期間を経過した後の前記推定温度が前記所定値以下とならない場合、前記冷却装置の出力を上げる指示を出す、ことを特徴とするサーバシステム。
【請求項１３】
請求項１２に記載のサーバシステムであって、
前記管理計算機は、前記ファンの回転数を規定値とした場合に、前記期間を経過した後の前記推定温度が前記所定値以下となる前記目標入気温度を決定し、前記目標入気温度にするための前記冷却装置の出力を決定する、ことを特徴とするサーバシステム。
【請求項１４】
請求項１１に記載のサーバシステムであって、
前記管理計算機が、前記推定温度を算出する際、前記プロセッサの前記温度及び前記稼働率から前記プロセッサの上昇温度を算出し、前記ファンの前記回転数と前記入気温度から冷却温度を算出し、前記上昇温度から前記冷却温度を減算して前記推定温度を算出する、ことを特徴とするサーバシステム。
【請求項１５】
請求項１４に記載のサーバシステムであって、
前記管理計算機は、前記サーバ装置の前記プロセッサの種類を認識し、前記上昇温度を算出する際、前記プロセッサの前記種類に対応する稼動率と発熱量の関係を用いて算出する、ことを特徴とするサーバシステム。

【図１】