説明

機器監視システム

【課題】システムの可用性を高めることが可能な機器監視システムを得る。
【解決手段】各サーバが、自機器の下の階層に配設された機器に対して送信要求信号Aを所定周期で送信すると共に、自機器の下の階層に配設された機器からの動作状態情報Bを収集する情報収集部10と、自機器の1つ上の階層に配設された機器からの送信要求信号Aを受信する毎に、情報収集部10に動作状態情報Bを送信する動作状態情報送信部11と、動作状態情報Bに含まれるリソース情報に基づいて、送信要求信号Aの送信元の機器と同階層に配設された機器群および送信要求信号Aの送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に送信要求信号Aの送信を行わせる監視要求情報(D1、D2)を送信する監視要求情報送信部14と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機器監視システムに関する。
【背景技術】
【0002】
IP網などのネットワークに接続された複数の機器(例えばパソコンやサーバなど)を有して構成された機器監視システムでは、各機器が監視機能(自機器が他の機器の動作状態を監視する機能)を有しており、この監視機能を動作させたときにおける各機器の中央演算処理部(以下「演算部」)の負荷を軽減する観点から、各機器がネットワーク上に階層的に配置されているのが一般的である。例えば、所定階層(n階層)に配設された監視機能を持つ機器は、自機器の1つ下の階層(n−1階層)に配設された機器を監視し、n−1階層に配設された監視機能を持つ各機器は、自機器の1つ下の階層(n−2階層)に配設された機器を監視する。ただし、例えばn−1階層の機器の一部に異常等が発生した場合、異常等を生じた機器(以下「第1の機器」)に監視されていたn−2階層の機器の監視が困難となる。なお、異常等とは、例えば故障によって機器が停止した状態や、リソース不足によって機器が停止する蓋然性が高い状態などである。
【0003】
このような問題を解決するため下記特許文献1に示される従来技術では、第1の機器の監視機能を他の機器(以下「第2の機器」)に代行させるため、第2の機器が予めn階層の機器に登録されている。従って、n階層の機器は、第1の機器の異常等を検知した場合、第2の機器を指定することによって、n−2階層に配設された機器の監視を継続することが可能である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−183714号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に示される従来技術では、異常等が生じた場合に指定される第2の機器が固定であるため、n階層の機器に登録されている全ての第2の機器にも異常等が生じている場合、n−2階層に配設された機器の監視を行うことができず、システムの可用性(システムを継続して稼動できること)の低下を招くという課題があった。
【0006】
本発明は、上記に鑑みてなされたものであって、システムの可用性を高めることが可能な機器監視システムを得ることを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明は、動作状態を監視する機能を有する複数の機器がネットワーク上に階層的に配置されて成る機器監視システムであって、前記各機器は、自機器の下の階層に配設された機器に対して、機器の動作状態を示す動作状態情報の送信を要求する送信要求信号を、所定周期で送信すると共に、自機器の下の階層に配設された機器からの前記動作状態情報を収集する情報収集部と、自機器の1つ上の階層に配設された機器からの前記送信要求信号を受信する毎に、前記情報収集部に前記動作状態情報を送信する動作状態情報送信部と、自機器の1つ上の階層に配設された機器から送信される前記送信要求信号の受信周期と、前記動作状態情報に含まれるリソース情報とに基づいて、前記送信要求信号の送信元の機器と同階層に配設された機器群および前記送信要求信号の送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に前記送信要求信号の送信を行わせる要求情報を送信する要求情報送信部と、を備えたことを特徴とする。
【発明の効果】
【0008】
この発明によれば、異常等を生じている機器の1つ下の階層に配設された機器が異常等を検知し、周囲の機器に対して自機器の監視元の変更を要求するようにしたので、システムの可用性を高めることができる、という効果を奏する。
【図面の簡単な説明】
【0009】
【図1】図1は、本発明の実施の形態1にかかる機器監視システムの構成を示す図である。
【図2】図2は、図1に示される各サーバ内の機能ブロックを示す図である。
【図3】図3は、図2に示される各機能ブロックの詳細を示す図である。
【図4】図4は、n−1階層に配設された各サーバがn−2階層に配設された各サーバからの動作状態情報Bに基づいて優先順位情報を作成する場合の動作を模式的に示す図である。
【図5】図5は、図3に示される監視要求情報送信部の動作を示すフローチャートである。
【図6】図6は、第1の監視要求情報が出力されるときのサーバの動作を示す図である。
【図7】図7は、第2の監視要求情報が出力されるときのサーバの動作を示す図である。
【図8】図8は、本発明の実施の形態2にかかる各サーバ内の機能ブロックを示す図である。
【図9】図9は、本発明の実施の形態3にかかる各サーバ内の機能ブロックを示す図である。
【発明を実施するための形態】
【0010】
以下に、本発明にかかる機器監視システムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
【0011】
実施の形態1.
図1は、本発明の実施の形態1にかかる機器監視システム100の構成を示す図である。図1に示される機器監視システム100は、IP網などのネットワーク30に接続された機器の一例として、複数のサーバn〜n24を有して構成されている。これらのサーバは、例えばデータベースサーバ、WEBサーバ、およびメールサーバなどである。
【0012】
図1には、所定階層(n階層)に配設されたサーバnと、n階層の1つ下の階層(n−1階層)に配設されると共にサーバnに監視されるサーバn11およびサーバn12と、n−1階層の1つ下の階層(n−2階層)に配設されると共にサーバn11に監視されるサーバn21およびサーバn22と、n−2階層に配設されると共にサーバn12に監視されるサーバn23およびサーバn24とが示されている。n−1階層に配設されたサーバn11およびサーバn12は、サーバ群G1を構成し、n−2階層に配設されたサーバn21、サーバn22、サーバn23、およびサーバn24は、サーバ群G2を構成する。また、各階層に配設されるサーバ数は、図1に示される数に限定されるものではなく、例えば、サーバ群G0には1または2以上のサーバが配設され、サーバ群G1には3台以上のサーバが配設されるように構成してもよい。
【0013】
各サーバn〜n24は、自サーバの下の階層に配設された複数のサーバの動作状態を監視する監視機能(後述する情報収集部10)を有しており、例えば、サーバnは、サーバn11およびサーバn12の動作状態を監視し、サーバn11は、サーバn21およびサーバn22の動作状態を監視する。このように、機器監視システム100は、ネットワーク30に接続された各サーバn〜n24の監視機能が階層構造化されて構成されている。この構成によって、1台のサーバが監視するサーバ台数が減り、監視に伴う各サーバn〜n24の処理負荷が軽減される。ただし、所定のサーバ(例えばサーバn11)に、異常等が生じた場合、そのサーバに監視されているサーバ(例えばサーバn21、n22)の動作状態を監視することが困難となる。実施の形態1にかかる機器監視システム100は、異常等を生じているサーバ(第1のサーバ)の1つ下の階層に配設されたサーバが、第1のサーバの異常等を検知すると共に、第1のサーバと同階層に配設されたサーバ群内のサーバ(第2のサーバ)に対して監視元の変更を要求する第1の監視要求情報D1を送信し、または第1のサーバの1つ下の階層に配設されたサーバ群内のサーバ(第3のサーバ)に対して監視元の変更を要求する第2の監視要求情報D2を送信するように構成されている。
【0014】
図2は、図1に示される各サーバn〜n24内の機能ブロックを示す図である。図2に示されるサーバnは、図1に示されるサーバnに対応し、図2に示されるサーバn11およびサーバn12は、図1に示されるサーバn11およびサーバn12に対応し、図2に示されるサーバn21、サーバn22、サーバn23、およびサーバn24は、図1に示されるサーバn21、サーバn22、サーバn23、およびサーバn24に対応する。これらの各サーバn〜n24は、情報収集部10、動作状態情報送信部11、情報記憶部12、および監視要求情報送信部14を有して構成されている。
【0015】
図3は、図2に示される各機能ブロックの詳細を示す図である。図3に示される情報収集部10は、自サーバの下の階層に配設された各サーバに対して、各サーバの動作状態を示す情報(動作状態情報B)の送信を要求する送信要求信号Aを所定周期(例えば59〜61秒に1回など)毎に送信すると共に、自サーバの下の階層に配設されたサーバからの動作状態情報Bを収集する。なお、動作状態情報Bは、サーバの故障を知らせる情報やリソース情報などであり、リソース情報は、例えば、各サーバn〜n24に内蔵される演算部(図示せず)の負荷率および余剰能力などである。また、図3に示される動作状態情報Bは、自サーバの1つ下の階層に配設されたサーバから送信される動作状態情報である第1の動作状態情報B1と、自サーバの2つ下の階層に配設されたサーバから送信される動作状態情報である第2の動作状態情報B2を表し、各サーバn〜n24内の情報収集部10では、第1の動作状態情報B1および第2の動作状態情報B2が収集される。
【0016】
また、情報収集部10は、第1の監視要求情報D1を受信した場合、この第1の監視要求情報D1の送信元のサーバに対して送信要求信号Aを送信し、第2の監視要求情報D2を受信した場合、この第2の監視要求情報D2の送信元のサーバに対して送信要求信号Aを送信するように構成されている。この送信要求信号Aを受信したサーバn〜n24は、送信要求信号Aの送信のサーバn〜n24へ動作状態情報Bを送信することによって、送信要求信号Aの送信のサーバn〜n24に監視される。
【0017】
図3に示される情報記憶部12は、動作状態情報記憶部12aおよび優先順位情報記憶部12bを有して構成されている。動作状態情報記憶部12aには、情報収集部10で収集された第1の動作状態情報B1および第2の動作状態情報B2が記録される。優先順位情報記憶部12bには、優先順位情報作成部15bから出力された優先順位情報Cが記録される。
【0018】
図3に示される優先順位情報受信部15aは、自サーバの1つ上の階層に配設されたサーバから送信された第1の優先順位情報C1と、自サーバの2つ上の階層に配設されたサーバから送信された第2の優先順位情報C2とを受信する。優先順位情報受信部15aで受信された第1の優先順位情報C1および第2の優先順位情報C2は、優先順位情報Cとして優先順位情報記憶部12bに記録される。
【0019】
図3に示される優先順位情報送信部15cは、優先順位情報記憶部12bに記録された優先順位情報Cを読み出し、読み出された優先順位情報Cは、自サーバの1つ下の階層に配設されたサーバに対しては第1の優先順位情報C1として送信され、自サーバの2つ下の階層に配設されたサーバに対しては第2の優先順位情報C2として送信される。
【0020】
図3に示される優先順位情報作成部15bは、動作状態情報記憶部12aに記録された第1の動作状態情報B1および第2の動作状態情報B2内のリソース情報を読み込み、このリソース情報に含まれる負荷率および余剰能力を用いて、以下のような処理を行う。
【0021】
例えば、図1に示されるサーバn12に内蔵される図示しない演算部(A)の処理速度が100MIPSであり、サーバn23に内蔵される図示しない演算部(B)の処理速度が110MIPSであり、サーバn24に内蔵される図示しない演算部(C)の処理速度が120MIPSであると仮定し、さらに、これら各演算部(A)〜(C)の負荷率が各々70%であると仮定する。このとき、演算部(A)の余剰能力は30MIPSとなり、演算部(B)の余剰能力は33MIPSとなり、演算部(C)の余剰能力は36MIPSとなる。ここで、各サーバに内蔵される各演算部のスペックが全て同一であることは希であるため、負荷率が同じであっても、各々の余剰能力の値には差が生じることとなる。優先順位情報作成部15bは、各サーバのハードウェア(演算部)の処理速度が各々異なる場合、演算部の余剰能力の値が大きい方から順に、各サーバの順位付けを行う。上記例であれば、優先順位情報作成部15bは、余剰能力が36MIPSのサーバn24の優先順位を1番、余剰能力が33MIPSのサーバn23の優先順位を2番、余剰能力が30MIPSのサーバn12の優先順位を3番とする。順位付けの結果である優先順位は、優先順位情報Cとして優先順位情報記憶部12bに記録される。
【0022】
図3に示される動作状態情報送信部11は、自サーバの1つ上の階層に配設されたサーバからの送信要求信号Aを受信したとき、動作状態情報記憶部12aに記録された動作状態情報Bを読み出し、動作状態情報Bは、自サーバの1つ上の階層に配設されたサーバに対しては第1の動作状態情報B1として送信され、自サーバの2つ上の階層に配設されたサーバに対しては第2の動作状態情報B2として送信される。
【0023】
図3に示される監視要求情報送信部14は、異常監視部13、選出部18、監視要求情報生成部19、優先順位情報受信部15a、優先順位情報作成部15b、および優先順位情報送信部15cを有して構成されている。
【0024】
異常監視部13は、動作状態情報送信部11が送信要求信号Aを所定周期(例えば59〜61秒に1回など)毎に受信しているか否か監視する。送信要求信号Aが第1の所定周期内に受信されていないとき、異常監視部13は、この送信要求信号Aの送信元のサーバに異常等が生じたと判断してアラートを出力する。
【0025】
第1の所定周期に関して補足すると、例えば、図1に示されるサーバn11の負荷率が上昇して処理速度が著しく低下した場合、このサーバn11に監視されていたサーバn22には、所定周期が経過しても送信要求信号Aが伝送されないこととなる。従って、第1の所定周期には送信要求信号Aの送信遅延時間を加味する必要がある。例えば、所定周期が59〜61秒であり、送信要求信号Aの送信遅延時間の最大値が5秒である場合、所定周期に送信遅延時間を加算した時間(64〜66秒)が第1の所定周期となる。従って、送信要求信号Aが最後に受信されてから約66秒経過するまでに、次の送信要求信号Aが受信されない場合、異常監視部13からアラートが出力される。
【0026】
図3に示される選出部18は、異常監視部13からアラートを受信したとき、優先順位情報記憶部12bに記録された優先順位情報Cを読み出し、読み出された優先順位情報Cの中で最も優先順位が高いサーバを選出する。
【0027】
監視要求情報生成部19は、選出部18で選出されたサーバが第2のサーバである場合、第1の監視要求情報D1を生成する。例えば、第1のサーバが図1に示されるサーバn11であり、サーバn11に監視されていたサーバがサーバn22であり、第2のサーバがサーバn12である場合、サーバn22内の監視要求情報送信部14は、監視要求情報生成部19で生成された第1の監視要求情報D1をサーバn12に送信する。
【0028】
また、監視要求情報生成部19は、選出部18で選出されたサーバが第3のサーバである場合、第2の監視要求情報D2を生成する。例えば、第1のサーバが図1に示されるサーバn11であり、サーバn11に監視されていたサーバがサーバn22であり、第3のサーバがサーバn23である場合、サーバn22内の監視要求情報送信部14は、監視要求情報生成部19で生成された第2の監視要求情報D2をサーバn23に送信する。
【0029】
第2の監視要求情報D2を受信した第3のサーバの階層は、仮想的に第1のサーバと同じ階層に変更される。上記例の場合、サーバn23の階層が、n−2階層からn−1階層に変更される。第3のサーバの階層が、第1のサーバと同じ階層に変更されることによって、各サーバの監視機能の階層構造に影響を与えることなくサーバn22の監視を継続することが可能である。なお、第3のサーバの階層が変更されたことによって、第3のサーバに監視されていたサーバ(例えば図示しないn−3階層に配設されたサーバ)の監視元がなくなるようにも思われるが、例えば、第2の監視要求情報D2を受信したサーバn23が第1のサーバとみなされるため、このサーバn23の1つ下の階層(図示しないn−3階層)に配設されたサーバの内部でアラートが出力される。そして、アラートが出力されたとき、このサーバ内の監視要求情報送信部14から第1の監視要求情報D1または第2の監視要求情報D2が出力される。このような動作が、n−3階層以下の各階層に配設されたサーバで順次行われるため、各サーバの監視機能の階層構造が維持される。
【0030】
ここで、情報収集部10で第1の動作状態情報B1および第2の動作状態情報B2が収集される理由と、優先順位情報受信部15aで第1の優先順位情報C1および第2の優先順位情報C2が受信される理由を補足する。
【0031】
図4は、n−1階層に配設された各サーバn11、n12がn−2階層に配設された各サーバn21〜n24からの動作状態情報Bに基づいて優先順位情報Cを作成する場合の動作を模式的に示す図である。
【0032】
(1)図4の左側に示されるサーバn21およびサーバn22から出力された動作状態情報Bはサーバn11へ送信され、サーバn11は、これらの動作状態情報Bに含まれるリソース情報に基づいてサーバn21およびサーバn22の順位付けを行なう。このときの優先順位は、サーバn21、サーバn22の順で1番、2番である仮定する。(2)作成された優先順位情報Cは、サーバn21およびサーバn22に送信される。(3)図4の右側に示されるサーバn23およびサーバn24から出力された動作状態情報Bは、サーバn12へ送信される。サーバn12は、これらの動作状態情報Bに基づいてサーバn23およびサーバn24の順位付けを行う。このときの優先順位は、サーバn23、サーバn24の順で1番、2番である仮定する。(4)そして、作成された優先順位情報Cは、サーバn23およびサーバn24に送信される。ここで、機器監視システム100全体で見た場合、サーバn23の余剰能力がサーバn21の余剰能力より大きい場合もあるわけであるが、図4に示す動作例では、(5)サーバn11およびサーバn12からの動作状態情報Bがサーバnに送信されないため、サーバnではサーバn21〜n24の順位付けを行うことができない。仮にサーバn11およびサーバn12からの動作状態情報Bがサーバnに送信された場合でも、(6)サーバn11〜n24の順位付けの結果である優先順位情報Cがサーバn22に送信されない場合、サーバn22では、サーバn23とサーバn21との順位付けを行うことができない。そのため、サーバn23の余剰能力がサーバn21の余剰能力より大きいにもかかわらず、サーバn22内の監視要求情報送信部14は、サーバn11からの優先順位情報Cの中で最も優先順位が高いサーバとしてサーバn21を選出し、このサーバn21に対して第2の監視要求情報D2を送信する。
【0033】
実施の形態1にかかる機器監視システム100は、各サーバn〜n24が、自サーバの1つ下の階層に配設されたサーバから送信された第1の動作状態情報B1だけでなく、自サーバの2つ下の階層に配設されたサーバから送信された第2の動作状態情報B2も受信可能に構成されている。従って、図4に示されるサーバnでは、例えばサーバn23の余剰能力がサーバn21の余剰能力より大きい場合でも、これらの余剰能力を考慮して各サーバn11〜n24の順位付けを行うことができる。より具体的には、例えばサーバnは、サーバn11およびサーバn12から送信された第1の動作状態情報B1と、サーバn21、サーバn22、サーバn23、およびサーバn24から送信された第2の動作状態情報B2とに基づいて、サーバn11〜n24の順位付けを行う。そして、この優先順位は、優先順位情報C1としてサーバn11およびサーバn12へ送信されると共に、優先順位情報C2としてサーバn21、サーバn22、サーバn23、およびサーバn24に送信される。このような動作がサーバn11でも行われるため、図4に示されるサーバn22には、サーバn11からの第1の優先順位情報C1(サーバn21およびサーバn22の優先順位)だけでなく、サーバnからの第2の優先順位情報C2(サーバn23およびサーバn24の優先順位)も送信される。例えばサーバn11に異常等が発生した場合、サーバn22は、第1の優先順位情報C1および第2の優先順位情報C2の中で最も優先順位が高いサーバを選出する。すなわち、サーバn22は、第1の動作状態情報B1および第2の動作状態情報B2に含まれるリソース情報に基づいて、送信要求信号Aの送信元のサーバn11(第1の機器)と同階層に配設されたサーバ群G1および第1の機器の1つ下の階層に配設されたサーバ群G2の中から、余剰能力の値が大きいサーバまたは負荷率が小さいサーバを選出する。さらにサーバn22は、選出されたサーバに、送信要求信号Aの送信を行わせる要求情報(第1の監視要求情報D1または第2の監視要求情報D2)を送信する。
【0034】
図5は、図3に示される監視要求情報送信部14の動作を示すフローチャートである。選出部18は、異常監視部13からのアラートを待受け(ステップS1)、アラートを受信したか否かを判断する(ステップS2)。アラートを受信した場合(ステップS2,Yes)、選出部18は、優先順位情報記憶部12bに記録された優先順位情報Cを読み出し、読み出された優先順位情報Cの中で最も優先順位が高いサーバを選出する(ステップS3)。なお、アラートを受信していない場合(ステップS2,No)、選出部18は、アラートの受信待機状態となる。
【0035】
次に、選出部18で選出されたサーバが第2のサーバである場合(ステップS4,Yes)、監視要求情報生成部19は、第1の監視要求情報D1を生成する。そして、監視要求情報送信部14は、監視要求情報生成部19で生成された第1の監視要求情報D1を第2のサーバへ送信する(ステップS5)。選出部18で選出されたサーバが第2のサーバでない場合(ステップS4,No)、すなわち選出されたサーバが第3のサーバである場合、監視要求情報生成部19は、第2の監視要求情報D2を生成する。そして、監視要求情報送信部14は、監視要求情報生成部19で生成された第2の監視要求情報D2を第3のサーバへ送信する(ステップS6)。
【0036】
次に、図6および図7を用いて、第1の監視要求情報D1または第2の監視要求情報D2が出力されるときの各サーバの動作を具体的に説明する。
【0037】
図6は、第1の監視要求情報D1が出力されるときのサーバの動作を示す図であり、図6には、サーバnに監視されるサーバn11およびサーバn12と、n−2階層に配設されたサーバn22とが示されている。(1)サーバn22は、サーバn11からの送信要求信号Aを受信しているが、(2)サーバn11からの送信要求信号Aが最後に受信されてから第1の所定周期経過するまでに次の送信要求信号Aが受信されない場合、サーバn11に異常等が発生したと判定し、サーバn22に記録された優先順位情報Cの中で最も優先順位が高いサーバn12に、第1の監視要求情報D1を送信する。(3)第1の監視要求情報D1を受信したサーバn12は、第1の監視要求情報D1の送信元であるサーバn22に対して送信要求信号Aを送信する。(4)サーバn22にはサーバn12からの送信要求信号Aが所定周期で伝送されるため、サーバn22は、この送信要求信号Aが送信される度に動作状態情報Bを出力し、サーバn22からの動作状態情報Bは、サーバn12に収集される。このように、実施の形態1にかかる機器監視システム100は、サーバn11に異常等が生じ、かつ、最も優先順位が高いサーバがサーバn11と同階層のサーバn12である場合でも、各サーバの監視機能の階層構造に影響を与えることなく、サーバn22の監視を継続することが可能である。
【0038】
図7は、第2の監視要求情報D2が出力されるときの各サーバの動作を示す図である。図7(a)には、n階層のサーバnに監視されるサーバn11およびサーバn12と、n−2階層に配設されたサーバn22およびサーバn23とが示されている。また図7(b)には、図7(a)に示されるサーバn23がn−2階層からn−1階層に変更された状態が示されている。図7(a)において、(1)サーバn22は、サーバn11からの送信要求信号Aを受信しているが、(2)サーバn11からの送信要求信号Aが最後に受信されてから第1の所定周期経過するまでに次の送信要求信号Aが受信されない場合、サーバn11に異常等が発生したと判定し、サーバn22に記録された優先順位情報Cの中で最も優先順位が高いサーバn23に第2の監視要求情報D2を送信すると共に、サーバnにも第2の監視要求情報D2を出力する。第2の監視要求情報D2がサーバnにも送信される理由は、サーバnが、階層が変更された後のサーバn23(サーバn23a)の監視を継続して行うためである。次に図7(b)において、(3)第2の監視要求情報D2を受信したサーバn23の階層は、仮想的にサーバn11の階層と同じ階層に変更される。(4)階層が変更されたサーバn23aには、サーバnからの送信要求信号Aが所定周期で伝送されるため、(5)サーバn23aは、この送信要求信号Aが送信される度に動作状態情報Bを出力し、サーバn23aからの動作状態情報Bは、サーバn内の情報収集部10に収集される。(6)また、階層が変更されたサーバn23aは、第2の監視要求情報D2の送信元であるサーバn22に対して送信要求信号Aを送信する。(7)サーバn22にはサーバn23aからの送信要求信号Aが所定周期で伝送されるため、サーバn22は、この送信要求信号Aが送信される度に動作状態情報Bを出力し、サーバn22からの動作状態情報Bは、サーバn23aに収集される。このように、実施の形態1にかかる機器監視システム100は、サーバn11に異常等が生じ、かつ、最も優先順位が高いサーバがサーバn11の1つ下の階層に配設されたサーバ群G2内のサーバn23である場合でも、各サーバの監視機能の階層構造に影響を与えることなく、サーバn22の監視を継続することが可能である。
【0039】
なお、上記説明では、優先順位情報作成部15bにおける順位付けは、余剰能力の値を比較することで行われているが、これに限定されるものではなく、例えば各サーバのハードウェア能力が各々同等である場合、各ハードウェアの負荷率の値を比較することによって順位付けを行うように構成してもよい。
【0040】
また、上記説明では、異常監視部13からのアラートが選出部18に入力される構成例を示したが、異常監視部13を用いずに、選出部18が、動作状態情報送信部11を直接監視し、かつ、送信要求信号Aが第1の所定周期内に受信されないことを検出したとき、優先順位情報Cの中で最も優先順位が高いサーバを選出するように構成してもよい。
【0041】
以上に説明したように、本発明の実施の形態1にかかる機器監視システム100は、各機器(各サーバn〜n24)が、自機器(サーバn11)の下の階層に配設された機器(サーバn22)に対して、機器(サーバn22)の動作状態を示す動作状態情報Bの送信を要求する送信要求信号Aを所定周期で送信すると共に、自機器(サーバn)の下の階層(n−1階層、n−2階層)に配設された機器からの動作状態情報Bを収集する情報収集部10と、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの送信要求信号Aを受信する毎に、情報収集部10に動作状態情報Bを送信する動作状態情報送信部11と、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの送信要求信号Aの受信周期と、動作状態情報Bに含まれるリソース情報とに基づいて、送信要求信号Aの送信元の機器(サーバn11)と同階層に配設された機器群(サーバ群G1)および送信要求信号Aの送信元の機器(サーバn11)の1つ下の階層に配設された機器群(サーバ群G2)の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に送信要求信号Aの送信を行わせる要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を送信する要求情報送信部(監視要求情報送信部14)と、を備えるようにしたので、高速に電流零を検出でき、復帰時間を高速化することができる。上記特許文献1に示される従来技術は、例えば図1に示されるサーバn11に異常等が生じた場合、サーバnがサーバn12を指定するように構成されているため、この指定動作によりサーバnの処理負荷が増加することとなる。さらに、この従来技術では、サーバn11に異常等が生じた場合に指定されるサーバ(例えば図1に示されるn12)が、固定であるため、サーバn12にも異常等が生じている場合、サーバn21、サーバn22の監視を行うことができず、システムの可用性の低下を招くという問題があった。さらに、従来技術の中には、異常等が発生したサーバの機能を代行するための待機サーバを備えるものも存在するが、このように構成した場合、システムのコスト増加を招くという問題があった。実施の形態1にかかる機器監視システム100は、異常等を生じている第1のサーバ(例えば図1に示されるサーバn11)の1つ下の階層に配設されたサーバ(例えばサーバn22)が、サーバn11の異常等を検知すると共に、第2のサーバ(例えばサーバn12)に第1の監視要求情報D1を送信し、または第3のサーバ(例えばサーバn23)に第2の監視要求情報D2を送信するように構成されている。そのため、第1のサーバを監視しているサーバ(例えばサーバn)の処理負荷が増加することがない。また、異常等が生じた場合に指定されるサーバの設定が不要なため、監視を継続することができる。また、待機サーバも不要である。従って、本発明の実施の形態1にかかる機器監視システム100は、システムの可用性の低下やシステムのコスト増加を招くことなく、各サーバの監視機能の階層構造に影響を与えずにサーバの監視を継続することが可能である。
【0042】
また、実施の形態1にかかる監視要求情報送信部14は、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの送信要求信号Aの受信周期と、自機器の1つ下の階層に配設された機器からの第1の動作状態情報B1に含まれるリソース情報と、自機器の2つ下の階層に配設された機器からの第2の動作状態情報B2に含まれるリソース情報とに基づいて、送信要求信号Aの送信元の機器(サーバn11)と同階層に配設された機器群(サーバ群G1)および送信要求信号Aの送信元の機器(サーバn11)の1つ下の階層に配設された機器群(サーバ群G2)の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に送信要求信号Aの送信を行わせる要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を送信する要求情報送信部(監視要求情報送信部14)と、を備えるようにしたので、自サーバの1つ下の階層に配設されたサーバの余剰能力と、自サーバの2つ下の階層に配設されたサーバの余剰能力とを考慮して、各サーバn11〜n24の順位付けを行うことができる。
【0043】
実施の形態2.
実施の形態1にかかる機器監視システム100は、各サーバが送信要求信号Aを所定周期毎(例えば60秒に1回など)に受信しているかを監視して、送信要求信号Aを所定周期で受信していない場合、アラートを出力するように構成されているが、実施の形態2にかかる機器監視システム100は、送信要求信号Aの受信周期にかかわらず、任意のタイミングで所定のサーバに異常等が発生しているかを検知するように構成されている。以下、実施の形態1と同一部分には同一符号を付してその説明を省略し、ここでは異なる部分についてのみ述べる。
【0044】
図8は、本発明の実施の形態2にかかる各サーバ内の機能ブロックを示す図である。図8に示されるサーバn〜n24は、情報収集部10、動作状態情報送信部11、情報記憶部12、および監視要求情報送信部14aを有して構成されている。実施の形態1のサーバn〜n24と異なる点は、監視要求情報送信部14aに監視確認情報送信部16が含まれる点である。この監視確認情報送信部16は、送信要求信号Aを受信するサーバ(例えばサーバn22が、送信要求信号Aの送信元のサーバ(例えばサーバn11)によって監視されていることを確認する監視確認情報Eを送信すると共に、監視確認情報Eを送信してから第2の所定周期が経過するまでに、サーバn11から応答信号F(サーバn11がサーバn22を監視していることを示す信号)が到達しない場合、選出部18へアラートを出力するように構成されている。なお、第2の所定周期に関して補足すると、例えば、図1に示されるサーバn11の負荷率が上昇して処理速度が著しく低下した場合、このサーバn11に監視されていたサーバn22には、所定周期が経過しても送信要求信号Aが伝送されないこととなる。従って、第2の所定周期は、送信要求信号Aの送信遅延時間の最大値(例えば5秒)となる。
【0045】
以下動作を説明する。サーバn22内の監視確認情報送信部16は、サーバn11内の情報収集部10へ監視確認情報Eを送信する。この監視確認情報Eを受信したサーバn11内の情報収集部10は、サーバn22を監視している場合(送信要求信号Aを所定周期毎に出力可能な状態にある場合)、応答信号Fを出力する。サーバn11内の情報収集部10から出力された応答信号Fは、サーバn22内の監視確認情報送信部16に取り込まれる。
【0046】
サーバn22内の監視確認情報送信部16は、監視確認情報Eを送信したにもかかわらず、この監視確認情報Eを送信してから第2の所定周期が経過するまでに、サーバn11からの応答信号Fが到達しない場合、サーバn11に異常等が生じたと判断してアラートを出力する。サーバn22内の監視確認情報送信部16から出力されたアラートは、選出部18に取り込まれる。なお、異常監視部13、選出部18、優先順位情報受信部15a、優先順位情報作成部15b、および優先順位情報送信部15cの動作は、実施の形態1と同様であるため、以下説明を省略する。
【0047】
実施の形態1にかかる機器監視システム100は、送信要求信号Aが最後に受信されてから第1の所定時間(例えば64〜66秒)が経過するまでに、次の送信要求信号Aが受信されない場合、アラートを出力するように構成されている。ただし、送信要求信号Aが最後に受信されてから、例えば20秒経過した時点でサーバn11に異常等が発生している可能性もある。実施の形態2にかかる機器監視システム100は、任意のタイミングでサーバn11に異常等が発生しているか否かを検知することができるように構成されている。例えば送信要求信号Aが最後に受信されてから20秒経過した時点でサーバn11に異常等が発生したと仮定する。さらに、送信要求信号Aが最後に受信されてから30秒経過したときに監視確認情報Eが送信されたと仮定する。この場合、監視確認情報Eが送信されてから第2の所定時間(例えば5秒)が経過するまでにサーバn11からの応答信号Fが到達しない場合、監視確認情報送信部16からのアラートが出力される。すなわち、送信要求信号Aが最後に受信されてから約35秒後に、監視確認情報送信部16からアラートが出力される。
【0048】
以上に説明したように、実施の形態2にかかる機器監視システム100は、要求情報送信部(監視要求情報送信部14a)が、送信要求信号Aを受信する機器(サーバn22)が送信要求信号Aの送信元の機器(サーバn11)によって監視されていることを確認する監視確認情報Eを送信する監視確認情報送信部16を備え、情報収集部10が、自機器(サーバn11)の1つ下の階層に配設された機器(サーバn22)から送信された監視確認情報Eを受信したとき、自機器(サーバn11)の1つ下の階層に配設された機器(サーバn22)を監視していることを示す応答信号Fの出力を行い、監視要求情報送信部14aが、監視確認情報Eを送信してから第2の所定時間が経過するまでに、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの応答信号Fが到達しない場合、送信要求信号Aの送信を行うようにしたので、実施の形態1にかかる機器監視システム100よりも早く第1の監視要求情報D1または第2の監視要求情報D2を出力することも可能である。従って、例えばサーバn11が故障などで停止した場合でも、サーバn11が停止してから僅かの時間で、サーバn11に監視されていたサーバ(例えばサーバn22)の監視を再開することが可能となる。その結果、機器監視システム100の予期せぬ停止を予防することができると共に、システムの可用性をより一層高めることが可能である。
【0049】
実施の形態3.
実施の形態1にかかる機器監視システム100は、各サーバが送信要求信号Aを所定周期毎(例えば60秒に1回など)に受信しているかを監視して、送信要求信号Aを所定周期で受信していない場合、アラートを出力するように構成されているが、実施の形態3にかかる機器監視システム100は、所定階層には配設されたサーバ(以下「非監視サーバ」)の余剰能力が所定値以下となったとき、非監視サーバを監視しているサーバ(以下「監視サーバ」)が、非監視サーバに対して送信要求信号Aの出力を停止させるように構成されている。以下、実施の形態1と同一部分には同一符号を付してその説明を省略し、ここでは異なる部分についてのみ述べる。
【0050】
図9は、本発明の実施の形態3にかかる各サーバ内の機能ブロックを示す図である。図9に示されるサーバn〜n24は、情報収集部10、動作状態情報送信部11、情報記憶部12、監視要求情報送信部14、および停止指示部17を有して構成されている。実施の形態1のサーバn〜n24と異なる点は、停止指示部17を備える点である。停止指示部17は、動作状態情報記憶部12aに記録された動作状態情報の中から非監視サーバの余剰能力を読み出し、その余剰能力が所定値以下となったとき、送信要求信号Aの送信の停止を指示する停止指示信号Gを、非監視サーバに対して出力する。
【0051】
以下動作を説明する。例えばサーバn内の停止指示部17は、動作状態情報記憶部12aに記録された動作状態情報の中から、非監視サーバ(例えばサーバn11)の余剰能力を読み出し、その余剰能力が所定値(例えば30MIPS)以下となったとき、サーバn11に対して停止指示信号Gを出力する。サーバn11内の情報収集部10は、この停止指示信号Gを受信したとき、次に送信する予定の送信要求信号Aの出力を停止する。なお、動作状態情報送信部11、情報記憶部12、および監視要求情報送信部14の動作は、実施の形態1にかかる機器監視システム100と同様であるため、以下説明を省略する。
【0052】
実施の形態1にかかる機器監視システム100を対比して説明すると以下の通りである。実施の形態1にかかる機器監視システム100は、動作状態情報送信部11において送信要求信号Aが最後に受信されてから第1の所定時間が経過するまでに、次の送信要求信号Aが受信されない場合、アラートを出力するように構成されている。ただし、実施の形態1にかかる機器監視システム100では、例えばサーバn11の余剰能力が、上述した所定値よりも低い値(例えば20MIPS)にまで低下した場合でも、サーバn22の監視を継続している(送信要求信号Aの出力が所定周期毎に出力される)。従って、サーバn11の負荷率が高い値のままとなる。実施の形態3にかかる機器監視システム100は、サーバn22を監視しているサーバn11の余剰能力が30MIPS以下となったとき、サーバn11の監視対象であったサーバn22を他のサーバに監視させるように構成されている。具体的に説明すると、サーバnからの停止指示信号Gを受信したサーバn11が送信要求信号Aの送信を停止するため、サーバn11に監視されていたサーバn22は、所定周期毎に送信要求信号Aが送信されていないことを検知し、第1の監視要求情報D1または第2の監視要求情報D2を出力する。そのため、サーバn22は、図6で説明したように、第1の監視要求情報D1を受信したサーバn12によって監視され、または図7(b)で説明したように、第2の監視要求情報D2を受信したサーバn23aによって監視される。換言すると、サーバn22は、余剰能力に余裕があるサーバに監視されることとなる。その結果、サーバn11が監視するサーバ台数が減り、監視に伴うサーバn11の処理負荷が軽減される。さらに、余剰能力に余裕があるサーバを有効利用することができ、機器監視システム100内の各サーバの負荷が平準化される。
【0053】
なお、実施の形態3にかかる停止指示部17は、実施の形態2にかかる機器監視システム100に組み込むことも可能である。このように構成した場合、実施の形態1にかかる機器監視システム100よりも早く第1の監視要求情報D1または第2の監視要求情報D2を出力することができると共に、各サーバの負荷を平準化することも可能である。
【0054】
以上に説明したように、実施の形態3にかかる機器監視システム100は、各機器(各サーバn〜n24)が、自機器(サーバn)の1つ下の階層に配設された機器(サーバn11)の余剰能力が所定値以下となったとき、この機器(サーバn11)に対して、送信要求信号Aの送信停止を指示する停止指示信号Gを出力する停止指示部17を備え、情報収集部10が、自機器(サーバn11)の1つ上の階層に配設された機器(サーバn)から停止指示信号Gを受信した場合、次に送信される予定の送信要求信号Aを停止するようにしたので、例えばサーバn11が完全に停止する前に、サーバn11の監視をサーバn23などに行わせることが可能である。その結果、各サーバの負荷の平準化を図ることができると共に、システムの可用性をより一層高めることが可能である。
【0055】
なお、実施の形態3にかかる機器監視システム100は、以下のように構成してもよい。例えば、図9に示される情報収集部10は、自機器(サーバn11)の1つ上の階層に配設された機器(サーバn)から停止指示信号Gを受信した場合、自機器(サーバn11)の1つ下の階層に配設された機器(サーバn22)に対して、要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を強制的に送信させる信号を出力し、要求情報送信部(監視要求情報送信部14)は、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)から要求情報を強制的に送信させる信号を受信したとき、要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を送信するように構成してもよい。このように構成した場合の効果を説明すると、サーバnからの停止指示信号Gを受信したサーバn11は、次に送信される予定の送信要求信号Aを停止するが、この送信要求信号Aは、送信要求信号Aが前回送信されてから約60秒後に送信されるものである。従って、サーバn11が停止指示信号Gを受信したタイミングが、送信要求信号Aが前回送信された直後である場合、サーバn11に監視されていたサーバn22において、次に送信される予定の送信要求信号Aが停止したことを検知するまでに、数十秒程度のタイムラグが生じる場合もある。そこで、サーバn11がサーバnからの停止指示信号Gを受信した際、サーバn22に対して要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を強制的に送信させる信号を出力し、かつ、この信号を受信したサーバn22が要求情報を送信するように構成すれば、上述したタイムラグを抑制することが可能である。その結果、監視に伴うサーバn11の処理負荷をより早く軽減することが可能となる。
【0056】
なお、実施の形態1〜3にかかる機器監視システム100は、本発明の内容の一例を示すものであり、更なる別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、一部を省略する等、変更して構成することも可能であることは無論である。
【産業上の利用可能性】
【0057】
以上のように、本発明は、空気調和機に適用可能であり、特に、号機設定が一致する空気調和機と号機設定が一致しない空気調和機とが共存する場合において、号機設定違いの報知の煩わしさからユーザを解放することが可能な発明として有用である。
【符号の説明】
【0058】
n、n11、n12、n21、n22、n23、n23a、n24、n24a サーバ(機器)
10 情報収集部
11 動作状態情報送信部
12 情報記憶部
12a 動作状態情報記憶部
12b 優先順位情報記憶部
13 異常監視部
14、14a 監視要求情報送信部(要求情報送信部)
15a 優先順位情報受信部
15b 優先順位情報作成部
15c 優先順位情報送信部
16 監視確認情報送信部
17 停止指示部
18 選出部
19 監視要求情報生成部
30 ネットワーク
100 機器監視システム
A 送信要求信号
B 動作状態情報
B1 第1の動作状態情報
B2 第2の動作状態情報
C 優先順位情報
C1 第1の優先順位情報
C2 第2の優先順位情報
D1 第1の監視要求情報
D2 第2の監視要求情報
E 監視確認情報
F 応答信号
G 停止指示信号
G0、G1、G2 サーバ群

【特許請求の範囲】
【請求項1】
動作状態を監視する機能を有する複数の機器がネットワーク上に階層的に配置されて成る機器監視システムであって、
前記各機器は、
自機器の下の階層に配設された機器に対して、機器の動作状態を示す動作状態情報の送信を要求する送信要求信号を、所定周期で送信すると共に、自機器の下の階層に配設された機器からの前記動作状態情報を収集する情報収集部と、
自機器の1つ上の階層に配設された機器からの前記送信要求信号を受信する毎に、前記情報収集部に前記動作状態情報を送信する動作状態情報送信部と、
自機器の1つ上の階層に配設された機器から送信される前記送信要求信号の受信周期と、前記動作状態情報に含まれるリソース情報とに基づいて、前記送信要求信号の送信元の機器と同階層に配設された機器群および前記送信要求信号の送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に前記送信要求信号の送信を行わせる要求情報を送信する要求情報送信部と、
を備えたことを特徴とする機器監視システム。
【請求項2】
動作状態を監視する機能を有する複数の機器がネットワーク上に階層的に配置されて成る機器監視システムであって、
前記各機器は、
自機器の下の階層に配設された機器に対して、機器の動作状態を示す動作状態情報の送信を要求する送信要求信号を、所定周期で送信すると共に、自機器の下の階層に配設された機器からの前記動作状態情報を収集する情報収集部と、
自機器の1つ上の階層に配設された機器からの前記送信要求信号を受信する毎に、前記情報収集部に前記動作状態情報を送信する動作状態情報送信部と、
自機器の1つ上の階層に配設された機器から送信される前記送信要求信号の受信周期と、自機器の1つ下の階層に配設された機器からの前記動作状態情報に含まれるリソース情報と、自機器の2つ下の階層に配設された機器からの前記動作状態情報に含まれるリソース情報とに基づいて、前記送信要求信号の送信元の機器と同階層に配設された機器群および前記送信要求信号の送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に前記送信要求信号の送信を行わせる要求情報を送信する要求情報送信部と、
を備えたことを特徴とする機器監視システム。
【請求項3】
前記要求情報送信部は、
前記送信要求信号を受信する機器が、前記送信要求信号の送信元の機器によって監視されていることを確認する監視確認情報を送信する監視確認情報送信部を備え、
前記情報収集部は、
自機器の1つ下の階層に配設された機器から送信された前記監視確認情報を受信したとき、自機器の1つ下の階層に配設された機器を監視していることを示す応答信号の出力を行い、
前記監視要求情報送信部は、
前記監視確認情報を送信してから第2の所定時間が経過するまでに、自機器の1つ上の階層に配設された機器からの前記応答信号が到達しない場合、前記要求情報の送信を行うことを特徴とする請求項1または2に記載の機器監視システム。
【請求項4】
前記各機器は、
自機器の1つ下の階層に配設された機器の余剰能力が所定値以下となったとき、この機器に対して、前記送信要求信号の送信停止を指示する停止指示信号を出力する停止指示部を備え、
前記情報収集部は、
自機器の1つ上の階層に配設された機器から前記停止指示信号を受信した場合、次に送信される予定の前記送信要求信号を停止することを特徴とする請求項1〜3の何れか1つに記載の機器監視システム。
【請求項5】
前記情報収集部は、
自機器の1つ上の階層に配設された機器から前記停止指示信号を受信した場合、自機器の1つ下の階層に配設された機器に対して、前記要求情報を強制的に送信させる信号を出力し、
前記要求情報送信部は、
自機器の1つ上の階層に配設された機器から前記要求情報を強制的に送信させる信号を受信したとき、前記要求情報を送信することを特徴とする請求項4に記載の機器監視システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−249115(P2012−249115A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2011−119866(P2011−119866)
【出願日】平成23年5月30日(2011.5.30)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】