情報処理装置及び管理装置及びプログラム
【課題】通信経路における障害によりパケットが送信先に届かない場合にも、パケットが送信先に届いていないことを早期に検出できるシステムを実現する。
【解決手段】サーバ装置1は、障害が発生した際に障害の発生を通知する障害発生通報パケットをコールセンタ装置6に送信するとともに、障害発生通報パケットの送信回数を計数し、コールセンタ装置6は、障害発生通報パケットを受信する度に障害発生通報パケットの受信回数を計数する。サーバ装置1は、所定の周期で、障害発生通報パケットの送信回数をコールセンタ装置6に通知し、コールセンタ装置6は、計数している受信回数と、サーバ装置1から通知された送信回数とを比較し、受信回数が送信回数よりも少ない場合に、通信経路における障害により障害発生通報パケットがコールセンタ装置6に届いていないと判断することができる。
【解決手段】サーバ装置1は、障害が発生した際に障害の発生を通知する障害発生通報パケットをコールセンタ装置6に送信するとともに、障害発生通報パケットの送信回数を計数し、コールセンタ装置6は、障害発生通報パケットを受信する度に障害発生通報パケットの受信回数を計数する。サーバ装置1は、所定の周期で、障害発生通報パケットの送信回数をコールセンタ装置6に通知し、コールセンタ装置6は、計数している受信回数と、サーバ装置1から通知された送信回数とを比較し、受信回数が送信回数よりも少ない場合に、通信経路における障害により障害発生通報パケットがコールセンタ装置6に届いていないと判断することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サーバ装置等において障害が発生した際に、コールセンタ等の通知先に障害の発生を通知する技術に関する。
【背景技術】
【0002】
図18を参照して従来の障害通報方式を説明する。
【0003】
図18において、100は監視対象となるサーバ装置である。
2は、サーバ装置100の障害発生を監視する監視部である。
21は、障害を検出する障害検出部である。
22は、障害の発生を通報する障害発生通報パケットを生成する通報通知作成部である。
23は、障害発生通報パケットを送信する通報通知送信部である。
30〜3mは、サーバ装置100の構成要素群である。
40〜4mは、障害検出用信号群である。
5は、通信回線である。
50は、サーバ側ルータである。
600は、障害発生通報パケットを受けるコールセンタ装置である。
60は、センタ側ルータである。
61は、コールセンタ装置600の全体の制御を行う制御部である。
62は、障害発生通報パケットを受信する通報通知受信部である。
63は、障害発生通報パケットを解析して後述する通知メッセージ66を生成する通知作成部である。
64は、通知メッセージ66を蓄積する通知蓄積部である。
65は、通知メッセージ66を出力する通知出力部である。
66は、サーバ装置100における障害内容を通知する通知メッセージであり、例えば、電子メールである。
7は、サーバ装置100の保守を行う保守センタである。
71は、保守員である。
9は、通信回線である。
【0004】
次に動作について説明する。
ここでは、サーバ装置100の構成要素30で障害が発生した場合を例に説明する。
構成要素30で障害が発生すると、サーバ装置100では、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成し、通報通知送信部23経由でコールセンタ装置600に向けて送信する。
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置600に届く。
コールセンタ装置600では、通報通知受信部62で障害発生通報パケットを受信し、解析し、障害が発生したサーバ装置100の設置場所に近い保守センタ7に障害内容を通知する通知メッセージ66を通知生成部63で生成する。
通知メッセージ66は、人がわかる形式のメッセージであり、例えば、電子メールである。
コールセンタ装置600では、通知メッセージ66を通知蓄積部64に蓄積した後、通知出力部65が保守センタに送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置100の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置100の故障部品を交換する。
こうして、サーバ装置100は正常状態に復帰することができる。
【0005】
また、例えば、特許文献1では、障害通報(A)を受け付けたとき、通報履歴DBを調べ、所定時間内の過去に同一顧客から障害通報(B)があれば、障害通報(A、B)の組み合わせが、関連通報DBに存在するかを調べ、関連通報DBに、この組み合わせが登録されていれば、障害通報(A)を障害通報(B)の関連通報とし、通知を省略もしくは参考情報として通知する方式が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−80035号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
図18を参照して説明した従来の障害通報方式、更には、特許文献1の方式においても、例えばサーバ側ルータ50が故障している場合には、サーバ装置100の構成要素30で障害が発生した時に、サーバ装置100が障害発生通報パケットを生成し、送信しても、サーバ側ルータ50が故障しているために、障害発生通報パケットがコールセンタ装置600に届かず、保守センタ7への障害発生通知は行われない。
従って、例えば、サーバ装置100の管理者がサーバ障害に気づき、保守センタなどに人手で通報するまでサーバの障害状態が継続し、システムの信頼性を下げてしまうという課題がある。
【0008】
この発明は、上記のような課題を解決することを主な目的の一つとしており、通信経路における障害により通知が通知先に届かない場合にも、通知が通知先に届いていないことを早期に検出できるシステムを実現することを主な目的とする。
【課題を解決するための手段】
【0009】
本発明に係る情報処理装置は、
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、情報処理装置が、イベント通知を管理装置に送信する度にイベント通知の送信回数を計数し、計数したイベント通知の送信回数を管理装置に通知するため、管理装置で計数されたイベント通知の受信回数と、情報処理装置から通知されたイベント通知の送信回数とを比較することにより、管理装置にイベント通知が届いていないことを早期に検出できる。
【図面の簡単な説明】
【0011】
【図1】実施の形態1及び2に係るシステム構成例を示す図。
【図2】実施の形態1に係るサーバ装置の構成例を示す図。
【図3】実施の形態1に係るコールセンタ装置の構成例を示す図。
【図4】実施の形態1に係る障害発生通報パケットの構成例を示す図。
【図5】実施の形態1に係る障害発生回数通知パケットの構成例を示す図。
【図6】実施の形態2に係るコールセンタ装置の構成例を示す図。
【図7】実施の形態3に係るコールセンタ装置の構成例を示す図。
【図8】実施の形態1に係るサーバ装置の障害発生通報処理の手順例を示すフローチャート図。
【図9】実施の形態1に係るサーバ装置の障害発生回数通知処理の手順例を示すフローチャート図。
【図10】実施の形態1に係るコールセンタ装置の通報関連処理の手順例を示すフローチャート図。
【図11】実施の形態1に係るコールセンタ装置の障害発生通報処理の手順例を示すフローチャート図。
【図12】実施の形態1に係るコールセンタ装置の障害発生回数通知処理の手順例を示すフローチャート図。
【図13】実施の形態2及び3に係るコールセンタ装置の通報関連処理の手順例を示すフローチャート図。
【図14】実施の形態3に係るコールセンタ装置の障害発生通報処理の手順例を示すフローチャート図。
【図15】実施の形態3に係るコールセンタ装置の障害発生回数通知処理の手順例を示すフローチャート図。
【図16】実施の形態3に係るコールセンタ装置の経路障害確認処理の手順例を示すフローチャート図。
【図17】実施の形態1〜3に係るサーバ装置1及びコールセンタ装置6のハードウェア構成例を示す図。
【図18】従来技術のシステム構成例を示す図。
【発明を実施するための形態】
【0012】
実施の形態1.
図1は、本実施の形態に係るシステム構成例を示す。
【0013】
図1では、サーバ装置1がサーバ側ルータ50、通信回線5及びセンタ側ルータ60を介してコールセンタ装置6に接続されている。
そして、コールセンタ装置6は通信回線9を介して保守センタ7内の保守センタ装置70に接続されている。
図18を参照して説明したように、サーバ装置1の構成要素において障害が発生すると、サーバ装置1から障害発生通報パケットがサーバ側ルータ50、通信回線5、及びセンタ側ルータ60を経由してコールセンタ装置6に送信される。
コールセンタ装置6では、障害発生通報パケットを解析し、障害内容を通知する通知メッセージ66を生成し、保守センタ装置70に送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置1の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
なお、サーバ装置1は情報処理装置の例であり、コールセンタ装置6は管理装置の例である。
【0014】
図2は、本実施の形態に係るサーバ装置1の構成例を示す。
図2において、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27以外は、図18に示した要素と同じである。
但し、通報通知作成部22及び通報通知送信部23は、図18とは異なる機能を有する。
以下では、通報通知作成部22、通報通知送信部23、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27について説明し、他の要素の説明は省略する。
【0015】
本実施の形態では、通報通知作成部22は、障害検出部21による障害検出というイベント(障害検出イベント)が発生した際に、障害の発生(障害検出イベントの発生)を通知する障害発生通報パケット(イベント通知)を生成するとともに、所定の間隔で、後述する障害通報送信カウンタ24により計数された障害発生通報パケット(イベント通知)の送信回数を通知する障害発生回数通知パケット(送信回数通知)を生成する。
通報通知作成部22は、イベント通知生成部及び送信回数通知生成部の例である。
【0016】
通報通知送信部23は、通報通知作成部22により生成された障害発生通報パケット及び障害発生回数通知パケットをコールセンタ装置6に対して送信する。
通報通知送信部23は、イベント通知送信部及び送信回数通知送信部の例である。
【0017】
障害通報送信カウンタ24は、通報通知送信部23により障害発生通報パケット(イベント通知)が送信される度に、障害発生通報パケットの送信回数を計数する。
障害通報送信カウンタ24は、イベント通知送信回数計数部の例である。
【0018】
送信間隔設定部25は、通報通知作成部22が障害発生回数通知パケットを生成し、通報通知送信部23が障害発生回数通知パケットを送信する間隔(周期)を後述の送信間隔計測タイマ26に設定する。
【0019】
送信間隔計測タイマ26は、送信間隔設定部25により設定された間隔(周期)にて、要求信号27を通報通知作成部22に出力するタイマである。
【0020】
図3は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図3において、通報確認部8内の要素以外は、図18に示した要素と同じである。
但し、通報通知受信部62、通知生成部63及び通知出力部65は、図18とは異なる機能を有する。
以下では、通報通知受信部62、通知生成部63、通知出力部65及び通報確認部8内の要素について説明し、他の要素の説明は省略する。
【0021】
通報通知受信部62は、サーバ装置1から送信された障害発生通報パケット(イベント通知)を受信するとともに、サーバ装置1から所定の間隔で送信される障害発生回数通知パケットを受信する。
障害発生回数通知パケットは、前述したように、サーバ装置1で計数された障害発生通報パケットの送信回数が通知されるパケットである。
通報通知受信部62は、イベント通知受信部及び送信回数通知受信部の例である。
【0022】
通報通知解析部80は、通報通知受信部62により受信されたパケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判別する。
そして、障害発生通報パケットである場合は、通報通知解析部80は障害発生通報パケットを通知生成部63に転送するとともに、障害通報受信カウンタ81に障害発生通報パケットを受信したことを通知する。
また、障害発生回数通知パケットである場合は、通報通知解析部80は障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を障害通報送信回数受信部82に出力する。
【0023】
障害通報受信カウンタ81は、通報通知解析部80から障害発生通報パケットを受信した旨の通知を受ける度に、障害発生通報パケットの受信回数を計数する。
障害通報受信カウンタ81は、イベント通知受信回数計数部の例である。
【0024】
障害通報送信回数受信部82は、通報通知解析部80から障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を入力し、比較部83に出力する。
【0025】
比較部83は、障害通報送信回数受信部82から障害発生回数通知パケット内の数値を入力した際(つまり、通報通知受信部62が障害発生回数通知パケットを受信した際)に、障害通報送信回数受信部82から入力した数値(サーバ装置1で計数した障害発生通報パケットの送信回数)と障害通報受信カウンタ81で計数されている受信回数とを比較する。
そして、比較部83は、比較の結果、送信回数と受信回数が一致しない場合に、通知生成部63に対して、通信経路における異常の発生の可能性を警告する警告メッセージの生成を指示する。
【0026】
通知生成部63は、通報通知解析部80から障害発生通報パケットを入力した場合に、図18の場合と同様に障害内容を通知する通知メッセージ66を生成するとともに、比較部83から警告メッセージの生成指示を入力した場合に、警告メッセージを生成する。
比較部83は、警告メッセージ生成部の例である。
【0027】
通知出力部65は、通知生成部63により生成された通知メッセージ66を保守センタ装置70に対して送信するとともに、通知生成部63により警告メッセージが生成された場合に、警告メッセージを保守センタ装置70に送信する。
通知出力部65は、警告メッセージ出力部の例である。
【0028】
図4は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生通報パケットの構成例を示す。
障害発生通報パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害通報であることを示すコマンドコードが設定されるコマンド部、障害発生箇所(種類)を示すコードがセットされるデータ部から構成される。
【0029】
図5は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生回数通知パケットの構成例を示す。
障害発生回数通知パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害発生回数通知であることを示すコマンドコードが設定されるコマンド部、サーバ監視部2からコールセンタ装置6に向けて送信された障害発生通報パケットの送信回数がセットされるデータ部から構成される。
【0030】
次に、図8〜12を参照して動作について説明する。
図8は、サーバ装置1がコールセンタ装置6に障害が発生したことを通知する障害発生通報処理の手順例を示す。
図9は、サーバ装置1がコールセンタ装置に障害発生通報パケットの送信回数を通知する障害回数通知処理の手順例を示す。
図10は、コールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図11は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図10のST210の詳細を示す。
図12は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図10のST220の詳細を示す。
なお、以下では、サーバ装置1の構成要素30で障害が発生した場合を例に説明を進める。
【0031】
サーバ装置1の構成要素30で障害が発生すると(図8のST101でYES)、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成する(ST102)(イベント通知生成処理)。
次に、通報通知送信部23が障害発生通報パケットをコールセンタ装置6に向けて送信する(ST103)(イベント通知送信処理)。
また、この時、障害通報送信カウンタ24の値がインクリメント(+1)される(ST104)(イベント通知送信回数計数処理)。
【0032】
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生通報パケットを受信し(図10のST201でYES)(イベント通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203)。
ここでは、受信パケットは障害発生通報パケットであるため、障害発生通報処理(ST210)が行われる。
【0033】
障害発生通報処理(ST210)では、通報通知解析部80から障害通報受信カウンタ81に障害発生通報パケットが受信された旨が通知され、また、通報通知解析部80から通知生成部63に障害発生通報パケットが転送される。
そして、通報通知解析部80から障害発生通報パケットが受信された旨が通知されると、障害通報受信カウンタ81はカウンタ値をインクリメント(+1)する(図11のST211)(イベント通知受信回数計数処理)。
また、通知生成部63は、障害発生通報パケットの少なくとも発信元アドレスとデータ部を用いて通知メッセージ66を生成する(ST212)。
次に、通知蓄積部64が、通知生成部63により生成された通知メッセージ66を蓄積するとともに(図11のST213)、通知出力部65が保守センタ7の保守センタ装置70に通知メッセージ66を送信する(ST214)。
【0034】
通知メッセージ66を受けた保守センタ7では、通知の内容からサーバ装置1の構成要素30の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
こうして、サーバ装置1は正常状態に復帰することができる。
【0035】
また、サーバ装置1で障害が発生していない間は、送信間隔設定部25からセットされた時間の間、送信間隔計測タイマ26が時間の計測を継続する。
設定された時間が経過し、障害発生回数の通知タイミングになると(図9のST111でYES)、送信間隔計測タイマ26は要求信号27を有意にする。
要求信号27が有意になると、通報通知作成部22で要求信号27が有意になったことを検出し、通報通知作成部22が障害発生回数通知パケットを生成する(ST112)(送信回数通知生成処理)。
具体的には、通報通知作成部22は、障害通報送信カウンタ24のカウンタ値を読み出し、カウンタ値をセットした障害発生回数通知パケットを生成する。
次に、通報通知送信部23が障害発生回数通知パケットをコールセンタ装置6に向けて送信する(ST113)(送信回数通知送信処理)。
【0036】
障害発生回数通知パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生回数通知パケットを受信し(図10のST201でYES)(送信回数通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203及びS204)。
ここでは、受信パケットは障害発生回数通知パケットであるため、障害発生回数通知処理(ST220)が行われる。
【0037】
障害発生回数通知処理(ST220)では、通報通知解析部80から障害通報受信カウンタ81に障害発生回数通知パケットを受信した旨が通知され、また、通報通知解析部80から障害通報送信回数受信部82に障害発生回数通知パケットのデータ部に設定されている数値(障害発生回数)が出力される。
障害通報受信カウンタ81は、現在のカウンタ値を比較部83に出力し、また、障害通報送信回数受信部82は障害発生回数通知パケットのデータ部の数値(障害発生回数)を比較部83に出力する。
なお、障害発生回数通知パケットが受信された場合は、障害通報受信カウンタ81の値は変化しない。
【0038】
比較部83では、障害通報送信回数受信部82から出力された障害発生回数通知パケットのデータ部の数値(障害発生回数)と、障害通報受信カウンタ81から出力されたカウンタ値を比較する(図12のST221)(比較処理)。
比較の結果、両者の値が一致している場合(ST222でYES)には、サーバ監視部2からの障害発生通報パケットは全て正常に処理されたことになるため新たな処理は何も行われない。
一方、両者の値が一致しない場合(ST222でNO)は、比較部83は通知生成部63に通信経路に異常が発生している可能性又は異常が発生していた可能性を警告する通知メッセージを生成するよう指示し、通知生成部63は、このような通知メッセージ(警告メッセージ)を生成する(ST223)(警告メッセージ生成処理)。
次に、通知蓄積部64が、通知生成部63により生成された警告メッセージを蓄積するとともに(ST224)、通知出力部65が保守センタ7の保守センタ装置70に警告メッセージを送信する(ST225)(警告メッセージ送信処理)。
そして、次回の比較に備え、障害通報送信回数受信部82の値が障害通報受信カウンタ81にセットされる(ST226)。
【0039】
もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
障害通報回数通知パケットを受信したコールセンタ装置6では、それまでに受信した障害発生通報の回数をカウントしていた障害通報受信カウンタ81の内容Nと、障害通報回数通知パケットから取り出された数値N+1とが比較部83で比較される。
この場合は、その出力が不一致を示す状態になるため、障害発生通報の通信経路(サーバ側ルータ50、通信回線5、センタ側ルータ60)上で障害が発生している可能性を警告する警告メッセージが保守センタ装置70に送信される。
そして、次回の比較に備え、障害通報回数通知パケットから取り出された数値N+1が障害通報受信カウンタ81にセットされる。
【0040】
警告メッセージを受けた保守センタ7では、通知の内容から通信経路に異常が発生している可能性をサーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバ装置1が正常状態に復旧する。
このように、障害発生通報経路に異常がある場合でも、サーバ装置1での障害発生を確実に通報できるようになり、復旧までの時間の長時間化を防ぐことができるので、信頼性の高いシステムを構築することができる。
【0041】
なお、以上の説明では、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである例を説明したが、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路を別の経路としてもよい。
【0042】
実施の形態2.
実施の形態1に係るシステムでは、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである場合には、通信経路が障害から回復しないと、障害発生回数通知パケットはコールセンタ装置6に届かない。
このため、通信経路の回復に長時間を要する場合には、コールセンタ装置6において、不達になっている障害発生通報パケットの存在を確認するまでに長時間を要することになる。
本実施の形態では、このような事態に対処し、不達になっている障害発生通報パケットの存在を早期に確認できるコールセンタ装置6を説明する。
【0043】
図6は、本実施の形態に係るコールセンタ装置6の構成例を示す。
コールセンタ装置6以外の要素は、実施の形態1に示したものと同様であるため、コールセンタ装置6以外の要素の説明は省略する。
【0044】
図6では、図3の構成と比較して、通知受信間隔計測タイマ84と受信間隔設定部85が追加されている。
受信間隔設定部85は、送信間隔設定部25よりも長い時間間隔を設定する。
通知受信間隔計測タイマ84は、障害発生回数通知パケットを受信した時に受信間隔設定部85に設定されている値をセットし、その後時間の経過とともにセット値をカウントダウンしていく。
つまり、通知受信間隔計測タイマ84は、通報通知受信部62が障害発生回数通知パケットを受信してからの経過時間を計測し、経過時間が受信間隔設定部85により設定された値を超過した場合に、経過時間が受信間隔設定部85の設定値を超過したことを通知生成部63に通知する。
通知受信間隔計測タイマ84は、経過時間計測部の例である。
そして、本実施の形態では、通知生成部63は、通知受信間隔計測タイマ84から経過時間が受信間隔設定部85の設定値を超過したことを通知された場合に、警告メッセージを生成する。
【0045】
次に動作について説明する。
なお、サーバ装置1における動作は、図8及び図9に示す通りである。
つまり、サーバ装置1で障害が発生していない間は、送信間隔設定部25に設定された時間の間隔で、障害発生回数通知パケットがサーバ監視部2から、サーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に送信される。
【0046】
本実施の形態に係るコールセンタ装置6の動作は、図13に示す通りである。
図13では、図10と比較して、S205及びST230が追加されており、他の処理は図10と同様である。
以下では、S205及びST230について説明する。
なお、図13では、ST300、ST400、ST500も記述されているが、ST300、ST400、ST500は実施の形態3で説明する。
【0047】
本実施の形態では、通報通知解析部80が、通報通知受信部62により受信されたパケットが障害発生回数通知パケットであると判断すると、受信間隔設定部85に設定されている値が通知受信間隔計測タイマ84にセットされ、通知受信間隔計測タイマ84はセット値のカウントダウンを開始する。
つまり、通知受信間隔計測タイマ84は、障害発生回数通知パケットの受信時刻からの経過時間を計測する。
そして、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、サーバ装置1の送信間隔設定部25に設定された時間間隔でサーバ監視部2が障害発生回数通知パケットを送信する。
このため、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、通報通知受信部62が障害発生回数通知パケットを受信し、通報通知解析部80が障害発生回数通知パケットが受信された旨を確認する。
通報通知解析部80が障害発生回数通知パケットの受信を確認すると、通知受信間隔計測タイマ84には受信間隔設定部85に設定されていた時間が再度セットされ、その後カウントダウンが再度開始される。
結局、通信経路が正常であれば、通知受信間隔の再設定→カウントダウン→通知受信間隔の再設定→カウントダウンが繰り返され、通知受信間隔計測タイマ84がゼロになることはない。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマ84のカウントダウンが進み、通知受信間隔計測タイマ84の値がゼロになる。
図13に従って説明すると、通知受信間隔計測タイマ84は、単位時間ごとに(ST205)に障害経路確認処理(ST230)を行って、カウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を1秒とし、受信間隔設定部85が通知受信間隔計測タイマ84に設定する受信間隔を1000秒とする例で障害経路確認処理(ST230)を説明する。
【0048】
ST205により1秒ごとに経路障害確認処理(ST230)が開始され、通知受信間隔計測タイマ84はカウンタ値をデクリメントし、カウンタ値がゼロになっていなければ、経路障害確認処理(ST230)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)、通知受信間隔計測タイマ84が通知生成部63にカウンタ値がゼロになった旨を通知する。
通知生成部63は、通知受信間隔計測タイマ84からの通知を受けて、通信経路の異常の可能性を警告する警告メッセージを生成し、通知出力部65での蓄積の後、通知出力部65が警告メッセージを保守センタ装置70に送信する。
【0049】
警告メッセージを受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに障害発生通報パケットとして通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。
【0050】
このように、障害発生通報経路に異常がある場合でも、サーバ装置で障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になり、信頼性の高いシステムを構築することができる。
【0051】
実施の形態3.
本実施の形態では、複数のサーバ装置1と複数の保守センタ7に対応させたコールセンタ装置6を説明する。
【0052】
図7は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図示は省略しているが本実施の形態に係るコールセンタ装置6は複数のサーバ装置1にネットワーク接続されている。
また、本実施の形態に係るコールセンタ装置6は、複数の保守センタ7とネットワーク接続されている。
【0053】
図7は、図6に示した通報確認部8をソフトウェアとして実現している例を示す。
つまり、サーバ群監視情報記憶部800において、サーバ装置ごとの記憶ブロックを設け、各記憶ブロックに図6に示した通報確認部8を実現するためのデータを格納している。
サーバ1対応情報ブロック810は、サーバ番号1のサーバ装置1に対する記憶ブロックであり、サーバn対応情報ブロック8n0は、サーバ番号nのサーバ装置1に対する記憶ブロックである。
以下では、サーバ1対応情報ブロック810を例にして、記憶ブロック内の構成を説明する。
【0054】
障害通報受信カウンタ811は、図6に示した障害通報受信カウンタ81と同様に動作し、障害発生通報パケットの受信回数を計数する。
障害通報送信回数受信部812は、図6に示した障害通報送信回数受信部82と同様に動作し、通報通知解析部80から障害発生回数通知パケットのデータ部の数値(障害発生回数)を記憶する。
通知受信間隔計測タイマ814は、図6に示した通知受信間隔計測タイマ84と同様に動作し、障害発生回数通知パケットを受信してからの経過時間を計測する。
受信間隔設定部815は、図6に示した受信間隔設定部85と同様に動作し、通知受信間隔計測タイマ814の計測時間をセットする。
アドレス設定部816は、サーバ番号1のサーバ装置1の通信アドレスを格納している。
サーバ1近隣保守センタアドレス817は、サーバ番号1のサーバ装置1の近隣に設置されている保守センタ7の保守センタ装置70の通信アドレスを格納している。
サーバ1有効フラグ818は、サーバ1対応情報ブロック810が登録済で有効であることを示す。
【0055】
なお、本実施の形態では、図6に示した比較部83の動作は制御部61が行うものとする。
つまり、本実施の形態では、例えばサーバ番号1のサーバ装置1の場合では、制御部61が障害通報受信カウンタ811のカウンタ値と障害通報送信回数受信部812の値とを比較する。
なお、コールセンタ装置6の他の要素は図6と同じであり、説明を省略する。
【0056】
次に動作について説明する。
各サーバ装置1における障害発生時の通報および正常時の障害発生回数通知については実施の形態1と同様に行われる。
ここでは、図13〜図16を参照して、通報および通知を受信したコールセンタ装置6での動作を中心に述べる。
なお、図13は、本実施の形態に係るコールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図14は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図13のST300の詳細を示す。
図15は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図13のST400の詳細を示す。
図16は、本実施の形態に係るコールセンタ装置6の経路障害確認処理の手順例であり、全てのサーバ装置において通信経路故障による通知の受信タイムアウトが発生していないかを周期的にチェックする動作を示す。
図16は、図13のST500の詳細を示す。
【0057】
サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生通報パケットであることを確認する(ST203でYES)。
このため、障害発生通報処理(ST300)(図14)が行われる。
【0058】
障害発生通報処理(ST300)では、制御部61が、障害発生通報パケットの送信元アドレスを読み出す(図14のST301)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST302、ST303)、読み出したアドレス設定部のアドレスと障害発生通信パケットの送信元アドレスとの比較を行う(ST304)。
一致しない場合(ST304でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST309、ST310、ST303)、障害発生通報パケットの送信元アドレスとの比較を行う(ST304)。
【0059】
一方、ST304でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、障害通報受信カウンタ811の内容をインクリメント(+1)するとともに、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に通知メッセージ66の送信先として通知する(ST305)。
また、制御部61は、障害発生通報パケットのデータ部の障害発生個所を示すコードを通知生成部63に通知する(ST306)。
また、制御部61は、通知生成部63が通知メッセージ66を生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST307)。
次に、通知生成部63が通知メッセージ66を生成し、通知蓄積部64に蓄積された後に、通知出力部65が通知メッセージ66を送信する(ST308)。
通知メッセージ66の送信先は、ST305で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
【0060】
この後、障害発生の通知を受けた保守センタ7から保守員がサーバ装置1の設置場所に派遣され、障害発生箇所の交換が行われてシステムは正常に復帰する。
【0061】
もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
【0062】
障害通報回数通知パケットを受信したコールセンタ装置6では、サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生回数通知パケットであることを確認する(ST203でNO、ST204でYES)。
このため、障害発生回数通知処理(ST400)(図15)が行われる。
【0063】
障害発生回数通知処理(ST400)では、制御部61が、障害発生回数通知パケットの送信元アドレスを読み出す(図15のST401)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST402、ST403)、読み出したアドレス設定部のアドレスと障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
一致しない場合(ST404でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST414、ST415、ST403)、障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
【0064】
一方、ST404でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、次に、受信間隔設定部815に格納されている受信間隔の値を通知受信間隔計測タイマ814にセットして、通知受信間隔計測タイマ814のカウントダウンとを開始させる(ST405)。
次に、制御部61は、障害発生回数通知パケットのデータ部に格納されている障害発生回数を読み出し、読み出した障害発生回数を障害通報送信回数受信部812に格納する(ST406)。
そして、制御部61は、障害通報受信カウンタ811からカウンタ値を読み出すとともに(ST407)、障害通報送信回数受信部812から障害発生回数を読み出して、両者を比較する(ST408)。
障害通報受信カウンタ811の内容と、障害通報送信回数受信部812の内容が等しければ(ST408でYES)、制御部61は処理を終了する。
一方、障害通報受信カウンタ811の値がN、障害通報送信回数受信部812の値がN+1である場合には、不一致であり(ST408でNO)、制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に警告メッセージの送信先として通知する(ST409)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST410)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST411)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST412)。
警告メッセージの送信先は、ST409で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
そして、次回の比較に備え、障害通報送信回数受信部812の値N+1を障害通報受信カウンタ811にセットする(ST413)。
【0065】
その後、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常があり、サーバ番号1のサーバ装置1で障害が発生している可能性がある旨を当該サーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバが正常状態に復旧する。
また、サーバ側ルータ50も交換されて、システムが正常状態に戻る。
【0066】
また、サーバ装置1で障害が発生しなかった場合でも、コールセンタ装置6のサーバ群監視情報記憶部800内に記憶された各サーバに対応する記憶ブロック中の通知受信間隔計測タイマの内容が一定間隔でカウントダウンされる。
あるサーバ装置1から障害発生回数通知パケットを受信すると、通報通知解析部80で解析されて、対応する記憶ブロック中の受信間隔設定部の内容が通知受信間隔計測タイマにセットされる。
通信経路に障害がない場合には、こうして各サーバ装置に対応した通知受信間隔計測タイマがカウントダウン→受信間隔設定部の内容の再セット→カウントダウン→受信間隔設定部の内容の再セットを繰り返す。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマのカウントダウンが進み、その値がゼロになる。
図13に従って説明すると、制御部61は、単位時間ごとに(ST205)に障害経路確認処理(ST500)を行って、通知受信間隔計測タイマのカウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を全サーバ装置で共通に1秒とし、受信間隔設定部が通知受信間隔計測タイマに設定する受信間隔を全サーバ装置で共通に1000秒とする例で障害経路確認処理(ST500)を説明する。
【0067】
ST205により1秒ごとに経路障害確認処理(ST500)が開始される。
経路障害確認処理(ST500)では、制御部61が、サーバ群監視情報記憶部800の記憶ブロックの配置順にサーバ1有効フラグ818・・・8n8を読み出し(図16のST501、ST502)、フラグ有効になっている記憶ブロックの通知受信間隔計測タイマ814・・・8n4のカウンタ値をデクリメント(−1)させ(ST503)、カウンタ値がゼロになっていなければ(ST504でNO)、次の記憶ブロックの有効フラグを確認する(ST509、ST510、ST502)。
全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)(ST504でYES)、制御部61は、S505に処理を進める。
ここでは、サーバ1対応情報ブロック810の通知受信間隔計測タイマ814のカウンタ値がゼロになった場合、すなわち、サーバ番号1のサーバ装置1からの障害発生回数通知パケットを1000秒以上受信していない場合を例にして説明する。
制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ装置1の近隣にある保守センタ7のアドレスを通知生成部63に警告メッセージの送信先として通知する(ST505)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST506)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST507)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST508)。
警告メッセージの送信先は、ST505で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
通知生成部63による警告メッセージの送信及び通知出力部65による警告メッセージの送信に並行して、制御部61はST509以降の処理を進め、全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
【0068】
通知出力部65により警告メッセージが送信されると、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。
【0069】
以上のように、複数のサーバ装置についてサーバ装置もしくは障害発生通報経路に異常が発生した場合でも、障害の発生を検出できるとともに、場合によってはサーバ装置での障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になるため、信頼性の高いシステムを構築することができる。
【0070】
以上、実施の形態1〜3では、
サーバ装置の障害発生を監視するサーバ監視部に障害通報送信カウンタを設け、障害通報を受信するコールセンタ装置にはサーバ装置毎に障害通報受信カウンタを設け、サーバ装置で障害が発生したことを検出した監視部は障害発生を通報する度に障害通報送信カウンタを+1し、コールセンタ装置側では障害通報を受信する度に障害通報受信カウンタを+1し、
サーバ監視部は定期的に障害通報送信カウンタの内容をコールセンタ装置に送信するようにし、コールセンタ装置で、サーバ監視部から送信されてきた障害通報送信カウンタの内容と障害通報受信カウンタの内容を比較し、
コールセンタ装置で両者が一致しないことを検出した場合には、監視対象のサーバ装置とコールセンタ装置間の通信経路に障害が発生したか、設定に誤りがあることを検出でき、保守センタに通知できるので、通信経路断などの障害が発生したことを素早く検出でき、対処することができるようになり、システムの信頼性を上げることができるシステムを説明した。
【0071】
なお、以上の説明では、サーバ装置1における障害の発生をコールセンタ装置6に通知する例を説明したが、通知する内容は障害の発生に限らない。
サーバ装置1における所定のイベントの発生を通知するイベント通知をコールセンタ装置6に送信するシステム構成において、サーバ装置1でイベント通知の送信回数を計数し、コールセンタ装置6でイベント通知の受信回数を計数し、所定の間隔でサーバ装置1がイベント通知の送信回数を通知するようにしてもよい。
また、イベント通知を送受信する装置は、サーバ装置1とコールセンタ装置6に限定されない。
【0072】
最後に、実施の形態1〜3に示したサーバ装置1及びコールセンタ装置6のハードウェア構成例について説明する。
図17は、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6のハードウェア資源の一例を示す図である。
なお、図17の構成は、あくまでもサーバ装置1及びコールセンタ装置6のハードウェア構成の一例を示すものであり、サーバ装置1及びコールセンタ装置6のハードウェア構成は図17に記載の構成に限らず、他の構成であってもよい。
【0073】
図17において、サーバ装置1及びコールセンタ装置6は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、SSD(Solid State Drive)、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
実施の形態1〜3で説明した通知蓄積部64又はサーバ群監視情報記憶部800は、RAM914、磁気ディスク装置920等により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは出力装置の一例である。
【0074】
通信ボード915は、図1に示すように、ネットワークに接続されている。
例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)、SAN(ストレージエリアネットワーク)などに接続されていても構わない。
【0075】
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
【0076】
また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
【0077】
また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
サーバ装置1及びコールセンタ装置6の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
【0078】
上記プログラム群923には、実施の形態1〜3の説明において「〜部」(通知蓄積部64及びサーバ群監視情報記憶部800以外、以下同様)として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
【0079】
ファイル群924には、実施の形態1〜3の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の読み出し」、「〜の更新」、「〜の設定」、「〜の登録」、「〜の選択」、「〜の入力」、「〜の出力」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。
ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出される。
そして、読み出された情報やデータや信号値や変数値やパラメータは、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1〜3で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示す。
データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。
また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
【0080】
また、実施の形態1〜3の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。
すなわち、実施の形態1〜3で説明したフローチャートに示すステップ、手順、処理により、本発明を方法の発明として把握することができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。
或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。
プログラムはCPU911により読み出され、CPU911により実行される。
すなわち、プログラムは、実施の形態1〜3の「〜部」としてコンピュータを機能させるものである。あるいは、実施の形態1〜3の「〜部」の手順や方法をコンピュータに実行させるものである。
【0081】
このように、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータである。
そして、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
【符号の説明】
【0082】
1 サーバ装置、2 サーバ監視部、5 通信回線、6 コールセンタ装置、7 保守センタ、8 通報確認部、9 通信回線、21 障害検出部、22 通報通知作成部、23 通報通知送信部、24 障害通報送信カウンタ、25 送信間隔設定部、26 送信間隔計測タイマ、27 要求信号、50 サーバ側ルータ、60 センタ側ルータ、61 制御部、62 通報通知受信部、63 通知生成部、64 通知蓄積部、65 通知出力部、66 通知メッセージ、70 保守センタ装置、71 保守員、80 通報通知解析部、81 障害通報受信カウンタ、82 障害通報送信回数受信部、83 比較部、84 通知受信間隔計測タイマ、85 受信間隔設定部、800 サーバ群監視情報記憶部、810 サーバ1対応情報ブロック、811 障害通報受信カウンタ、812 障害通報送信回数受信部、814 通知受信間隔計測タイマ、815 受信間隔設定部、816 アドレス設定部、817 サーバ1近隣保守センタアドレス、818 サーバ1有効フラグ。
【技術分野】
【0001】
本発明は、サーバ装置等において障害が発生した際に、コールセンタ等の通知先に障害の発生を通知する技術に関する。
【背景技術】
【0002】
図18を参照して従来の障害通報方式を説明する。
【0003】
図18において、100は監視対象となるサーバ装置である。
2は、サーバ装置100の障害発生を監視する監視部である。
21は、障害を検出する障害検出部である。
22は、障害の発生を通報する障害発生通報パケットを生成する通報通知作成部である。
23は、障害発生通報パケットを送信する通報通知送信部である。
30〜3mは、サーバ装置100の構成要素群である。
40〜4mは、障害検出用信号群である。
5は、通信回線である。
50は、サーバ側ルータである。
600は、障害発生通報パケットを受けるコールセンタ装置である。
60は、センタ側ルータである。
61は、コールセンタ装置600の全体の制御を行う制御部である。
62は、障害発生通報パケットを受信する通報通知受信部である。
63は、障害発生通報パケットを解析して後述する通知メッセージ66を生成する通知作成部である。
64は、通知メッセージ66を蓄積する通知蓄積部である。
65は、通知メッセージ66を出力する通知出力部である。
66は、サーバ装置100における障害内容を通知する通知メッセージであり、例えば、電子メールである。
7は、サーバ装置100の保守を行う保守センタである。
71は、保守員である。
9は、通信回線である。
【0004】
次に動作について説明する。
ここでは、サーバ装置100の構成要素30で障害が発生した場合を例に説明する。
構成要素30で障害が発生すると、サーバ装置100では、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成し、通報通知送信部23経由でコールセンタ装置600に向けて送信する。
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置600に届く。
コールセンタ装置600では、通報通知受信部62で障害発生通報パケットを受信し、解析し、障害が発生したサーバ装置100の設置場所に近い保守センタ7に障害内容を通知する通知メッセージ66を通知生成部63で生成する。
通知メッセージ66は、人がわかる形式のメッセージであり、例えば、電子メールである。
コールセンタ装置600では、通知メッセージ66を通知蓄積部64に蓄積した後、通知出力部65が保守センタに送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置100の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置100の故障部品を交換する。
こうして、サーバ装置100は正常状態に復帰することができる。
【0005】
また、例えば、特許文献1では、障害通報(A)を受け付けたとき、通報履歴DBを調べ、所定時間内の過去に同一顧客から障害通報(B)があれば、障害通報(A、B)の組み合わせが、関連通報DBに存在するかを調べ、関連通報DBに、この組み合わせが登録されていれば、障害通報(A)を障害通報(B)の関連通報とし、通知を省略もしくは参考情報として通知する方式が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−80035号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
図18を参照して説明した従来の障害通報方式、更には、特許文献1の方式においても、例えばサーバ側ルータ50が故障している場合には、サーバ装置100の構成要素30で障害が発生した時に、サーバ装置100が障害発生通報パケットを生成し、送信しても、サーバ側ルータ50が故障しているために、障害発生通報パケットがコールセンタ装置600に届かず、保守センタ7への障害発生通知は行われない。
従って、例えば、サーバ装置100の管理者がサーバ障害に気づき、保守センタなどに人手で通報するまでサーバの障害状態が継続し、システムの信頼性を下げてしまうという課題がある。
【0008】
この発明は、上記のような課題を解決することを主な目的の一つとしており、通信経路における障害により通知が通知先に届かない場合にも、通知が通知先に届いていないことを早期に検出できるシステムを実現することを主な目的とする。
【課題を解決するための手段】
【0009】
本発明に係る情報処理装置は、
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、情報処理装置が、イベント通知を管理装置に送信する度にイベント通知の送信回数を計数し、計数したイベント通知の送信回数を管理装置に通知するため、管理装置で計数されたイベント通知の受信回数と、情報処理装置から通知されたイベント通知の送信回数とを比較することにより、管理装置にイベント通知が届いていないことを早期に検出できる。
【図面の簡単な説明】
【0011】
【図1】実施の形態1及び2に係るシステム構成例を示す図。
【図2】実施の形態1に係るサーバ装置の構成例を示す図。
【図3】実施の形態1に係るコールセンタ装置の構成例を示す図。
【図4】実施の形態1に係る障害発生通報パケットの構成例を示す図。
【図5】実施の形態1に係る障害発生回数通知パケットの構成例を示す図。
【図6】実施の形態2に係るコールセンタ装置の構成例を示す図。
【図7】実施の形態3に係るコールセンタ装置の構成例を示す図。
【図8】実施の形態1に係るサーバ装置の障害発生通報処理の手順例を示すフローチャート図。
【図9】実施の形態1に係るサーバ装置の障害発生回数通知処理の手順例を示すフローチャート図。
【図10】実施の形態1に係るコールセンタ装置の通報関連処理の手順例を示すフローチャート図。
【図11】実施の形態1に係るコールセンタ装置の障害発生通報処理の手順例を示すフローチャート図。
【図12】実施の形態1に係るコールセンタ装置の障害発生回数通知処理の手順例を示すフローチャート図。
【図13】実施の形態2及び3に係るコールセンタ装置の通報関連処理の手順例を示すフローチャート図。
【図14】実施の形態3に係るコールセンタ装置の障害発生通報処理の手順例を示すフローチャート図。
【図15】実施の形態3に係るコールセンタ装置の障害発生回数通知処理の手順例を示すフローチャート図。
【図16】実施の形態3に係るコールセンタ装置の経路障害確認処理の手順例を示すフローチャート図。
【図17】実施の形態1〜3に係るサーバ装置1及びコールセンタ装置6のハードウェア構成例を示す図。
【図18】従来技術のシステム構成例を示す図。
【発明を実施するための形態】
【0012】
実施の形態1.
図1は、本実施の形態に係るシステム構成例を示す。
【0013】
図1では、サーバ装置1がサーバ側ルータ50、通信回線5及びセンタ側ルータ60を介してコールセンタ装置6に接続されている。
そして、コールセンタ装置6は通信回線9を介して保守センタ7内の保守センタ装置70に接続されている。
図18を参照して説明したように、サーバ装置1の構成要素において障害が発生すると、サーバ装置1から障害発生通報パケットがサーバ側ルータ50、通信回線5、及びセンタ側ルータ60を経由してコールセンタ装置6に送信される。
コールセンタ装置6では、障害発生通報パケットを解析し、障害内容を通知する通知メッセージ66を生成し、保守センタ装置70に送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置1の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
なお、サーバ装置1は情報処理装置の例であり、コールセンタ装置6は管理装置の例である。
【0014】
図2は、本実施の形態に係るサーバ装置1の構成例を示す。
図2において、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27以外は、図18に示した要素と同じである。
但し、通報通知作成部22及び通報通知送信部23は、図18とは異なる機能を有する。
以下では、通報通知作成部22、通報通知送信部23、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27について説明し、他の要素の説明は省略する。
【0015】
本実施の形態では、通報通知作成部22は、障害検出部21による障害検出というイベント(障害検出イベント)が発生した際に、障害の発生(障害検出イベントの発生)を通知する障害発生通報パケット(イベント通知)を生成するとともに、所定の間隔で、後述する障害通報送信カウンタ24により計数された障害発生通報パケット(イベント通知)の送信回数を通知する障害発生回数通知パケット(送信回数通知)を生成する。
通報通知作成部22は、イベント通知生成部及び送信回数通知生成部の例である。
【0016】
通報通知送信部23は、通報通知作成部22により生成された障害発生通報パケット及び障害発生回数通知パケットをコールセンタ装置6に対して送信する。
通報通知送信部23は、イベント通知送信部及び送信回数通知送信部の例である。
【0017】
障害通報送信カウンタ24は、通報通知送信部23により障害発生通報パケット(イベント通知)が送信される度に、障害発生通報パケットの送信回数を計数する。
障害通報送信カウンタ24は、イベント通知送信回数計数部の例である。
【0018】
送信間隔設定部25は、通報通知作成部22が障害発生回数通知パケットを生成し、通報通知送信部23が障害発生回数通知パケットを送信する間隔(周期)を後述の送信間隔計測タイマ26に設定する。
【0019】
送信間隔計測タイマ26は、送信間隔設定部25により設定された間隔(周期)にて、要求信号27を通報通知作成部22に出力するタイマである。
【0020】
図3は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図3において、通報確認部8内の要素以外は、図18に示した要素と同じである。
但し、通報通知受信部62、通知生成部63及び通知出力部65は、図18とは異なる機能を有する。
以下では、通報通知受信部62、通知生成部63、通知出力部65及び通報確認部8内の要素について説明し、他の要素の説明は省略する。
【0021】
通報通知受信部62は、サーバ装置1から送信された障害発生通報パケット(イベント通知)を受信するとともに、サーバ装置1から所定の間隔で送信される障害発生回数通知パケットを受信する。
障害発生回数通知パケットは、前述したように、サーバ装置1で計数された障害発生通報パケットの送信回数が通知されるパケットである。
通報通知受信部62は、イベント通知受信部及び送信回数通知受信部の例である。
【0022】
通報通知解析部80は、通報通知受信部62により受信されたパケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判別する。
そして、障害発生通報パケットである場合は、通報通知解析部80は障害発生通報パケットを通知生成部63に転送するとともに、障害通報受信カウンタ81に障害発生通報パケットを受信したことを通知する。
また、障害発生回数通知パケットである場合は、通報通知解析部80は障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を障害通報送信回数受信部82に出力する。
【0023】
障害通報受信カウンタ81は、通報通知解析部80から障害発生通報パケットを受信した旨の通知を受ける度に、障害発生通報パケットの受信回数を計数する。
障害通報受信カウンタ81は、イベント通知受信回数計数部の例である。
【0024】
障害通報送信回数受信部82は、通報通知解析部80から障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を入力し、比較部83に出力する。
【0025】
比較部83は、障害通報送信回数受信部82から障害発生回数通知パケット内の数値を入力した際(つまり、通報通知受信部62が障害発生回数通知パケットを受信した際)に、障害通報送信回数受信部82から入力した数値(サーバ装置1で計数した障害発生通報パケットの送信回数)と障害通報受信カウンタ81で計数されている受信回数とを比較する。
そして、比較部83は、比較の結果、送信回数と受信回数が一致しない場合に、通知生成部63に対して、通信経路における異常の発生の可能性を警告する警告メッセージの生成を指示する。
【0026】
通知生成部63は、通報通知解析部80から障害発生通報パケットを入力した場合に、図18の場合と同様に障害内容を通知する通知メッセージ66を生成するとともに、比較部83から警告メッセージの生成指示を入力した場合に、警告メッセージを生成する。
比較部83は、警告メッセージ生成部の例である。
【0027】
通知出力部65は、通知生成部63により生成された通知メッセージ66を保守センタ装置70に対して送信するとともに、通知生成部63により警告メッセージが生成された場合に、警告メッセージを保守センタ装置70に送信する。
通知出力部65は、警告メッセージ出力部の例である。
【0028】
図4は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生通報パケットの構成例を示す。
障害発生通報パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害通報であることを示すコマンドコードが設定されるコマンド部、障害発生箇所(種類)を示すコードがセットされるデータ部から構成される。
【0029】
図5は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生回数通知パケットの構成例を示す。
障害発生回数通知パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害発生回数通知であることを示すコマンドコードが設定されるコマンド部、サーバ監視部2からコールセンタ装置6に向けて送信された障害発生通報パケットの送信回数がセットされるデータ部から構成される。
【0030】
次に、図8〜12を参照して動作について説明する。
図8は、サーバ装置1がコールセンタ装置6に障害が発生したことを通知する障害発生通報処理の手順例を示す。
図9は、サーバ装置1がコールセンタ装置に障害発生通報パケットの送信回数を通知する障害回数通知処理の手順例を示す。
図10は、コールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図11は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図10のST210の詳細を示す。
図12は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図10のST220の詳細を示す。
なお、以下では、サーバ装置1の構成要素30で障害が発生した場合を例に説明を進める。
【0031】
サーバ装置1の構成要素30で障害が発生すると(図8のST101でYES)、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成する(ST102)(イベント通知生成処理)。
次に、通報通知送信部23が障害発生通報パケットをコールセンタ装置6に向けて送信する(ST103)(イベント通知送信処理)。
また、この時、障害通報送信カウンタ24の値がインクリメント(+1)される(ST104)(イベント通知送信回数計数処理)。
【0032】
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生通報パケットを受信し(図10のST201でYES)(イベント通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203)。
ここでは、受信パケットは障害発生通報パケットであるため、障害発生通報処理(ST210)が行われる。
【0033】
障害発生通報処理(ST210)では、通報通知解析部80から障害通報受信カウンタ81に障害発生通報パケットが受信された旨が通知され、また、通報通知解析部80から通知生成部63に障害発生通報パケットが転送される。
そして、通報通知解析部80から障害発生通報パケットが受信された旨が通知されると、障害通報受信カウンタ81はカウンタ値をインクリメント(+1)する(図11のST211)(イベント通知受信回数計数処理)。
また、通知生成部63は、障害発生通報パケットの少なくとも発信元アドレスとデータ部を用いて通知メッセージ66を生成する(ST212)。
次に、通知蓄積部64が、通知生成部63により生成された通知メッセージ66を蓄積するとともに(図11のST213)、通知出力部65が保守センタ7の保守センタ装置70に通知メッセージ66を送信する(ST214)。
【0034】
通知メッセージ66を受けた保守センタ7では、通知の内容からサーバ装置1の構成要素30の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
こうして、サーバ装置1は正常状態に復帰することができる。
【0035】
また、サーバ装置1で障害が発生していない間は、送信間隔設定部25からセットされた時間の間、送信間隔計測タイマ26が時間の計測を継続する。
設定された時間が経過し、障害発生回数の通知タイミングになると(図9のST111でYES)、送信間隔計測タイマ26は要求信号27を有意にする。
要求信号27が有意になると、通報通知作成部22で要求信号27が有意になったことを検出し、通報通知作成部22が障害発生回数通知パケットを生成する(ST112)(送信回数通知生成処理)。
具体的には、通報通知作成部22は、障害通報送信カウンタ24のカウンタ値を読み出し、カウンタ値をセットした障害発生回数通知パケットを生成する。
次に、通報通知送信部23が障害発生回数通知パケットをコールセンタ装置6に向けて送信する(ST113)(送信回数通知送信処理)。
【0036】
障害発生回数通知パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生回数通知パケットを受信し(図10のST201でYES)(送信回数通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203及びS204)。
ここでは、受信パケットは障害発生回数通知パケットであるため、障害発生回数通知処理(ST220)が行われる。
【0037】
障害発生回数通知処理(ST220)では、通報通知解析部80から障害通報受信カウンタ81に障害発生回数通知パケットを受信した旨が通知され、また、通報通知解析部80から障害通報送信回数受信部82に障害発生回数通知パケットのデータ部に設定されている数値(障害発生回数)が出力される。
障害通報受信カウンタ81は、現在のカウンタ値を比較部83に出力し、また、障害通報送信回数受信部82は障害発生回数通知パケットのデータ部の数値(障害発生回数)を比較部83に出力する。
なお、障害発生回数通知パケットが受信された場合は、障害通報受信カウンタ81の値は変化しない。
【0038】
比較部83では、障害通報送信回数受信部82から出力された障害発生回数通知パケットのデータ部の数値(障害発生回数)と、障害通報受信カウンタ81から出力されたカウンタ値を比較する(図12のST221)(比較処理)。
比較の結果、両者の値が一致している場合(ST222でYES)には、サーバ監視部2からの障害発生通報パケットは全て正常に処理されたことになるため新たな処理は何も行われない。
一方、両者の値が一致しない場合(ST222でNO)は、比較部83は通知生成部63に通信経路に異常が発生している可能性又は異常が発生していた可能性を警告する通知メッセージを生成するよう指示し、通知生成部63は、このような通知メッセージ(警告メッセージ)を生成する(ST223)(警告メッセージ生成処理)。
次に、通知蓄積部64が、通知生成部63により生成された警告メッセージを蓄積するとともに(ST224)、通知出力部65が保守センタ7の保守センタ装置70に警告メッセージを送信する(ST225)(警告メッセージ送信処理)。
そして、次回の比較に備え、障害通報送信回数受信部82の値が障害通報受信カウンタ81にセットされる(ST226)。
【0039】
もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
障害通報回数通知パケットを受信したコールセンタ装置6では、それまでに受信した障害発生通報の回数をカウントしていた障害通報受信カウンタ81の内容Nと、障害通報回数通知パケットから取り出された数値N+1とが比較部83で比較される。
この場合は、その出力が不一致を示す状態になるため、障害発生通報の通信経路(サーバ側ルータ50、通信回線5、センタ側ルータ60)上で障害が発生している可能性を警告する警告メッセージが保守センタ装置70に送信される。
そして、次回の比較に備え、障害通報回数通知パケットから取り出された数値N+1が障害通報受信カウンタ81にセットされる。
【0040】
警告メッセージを受けた保守センタ7では、通知の内容から通信経路に異常が発生している可能性をサーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバ装置1が正常状態に復旧する。
このように、障害発生通報経路に異常がある場合でも、サーバ装置1での障害発生を確実に通報できるようになり、復旧までの時間の長時間化を防ぐことができるので、信頼性の高いシステムを構築することができる。
【0041】
なお、以上の説明では、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである例を説明したが、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路を別の経路としてもよい。
【0042】
実施の形態2.
実施の形態1に係るシステムでは、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである場合には、通信経路が障害から回復しないと、障害発生回数通知パケットはコールセンタ装置6に届かない。
このため、通信経路の回復に長時間を要する場合には、コールセンタ装置6において、不達になっている障害発生通報パケットの存在を確認するまでに長時間を要することになる。
本実施の形態では、このような事態に対処し、不達になっている障害発生通報パケットの存在を早期に確認できるコールセンタ装置6を説明する。
【0043】
図6は、本実施の形態に係るコールセンタ装置6の構成例を示す。
コールセンタ装置6以外の要素は、実施の形態1に示したものと同様であるため、コールセンタ装置6以外の要素の説明は省略する。
【0044】
図6では、図3の構成と比較して、通知受信間隔計測タイマ84と受信間隔設定部85が追加されている。
受信間隔設定部85は、送信間隔設定部25よりも長い時間間隔を設定する。
通知受信間隔計測タイマ84は、障害発生回数通知パケットを受信した時に受信間隔設定部85に設定されている値をセットし、その後時間の経過とともにセット値をカウントダウンしていく。
つまり、通知受信間隔計測タイマ84は、通報通知受信部62が障害発生回数通知パケットを受信してからの経過時間を計測し、経過時間が受信間隔設定部85により設定された値を超過した場合に、経過時間が受信間隔設定部85の設定値を超過したことを通知生成部63に通知する。
通知受信間隔計測タイマ84は、経過時間計測部の例である。
そして、本実施の形態では、通知生成部63は、通知受信間隔計測タイマ84から経過時間が受信間隔設定部85の設定値を超過したことを通知された場合に、警告メッセージを生成する。
【0045】
次に動作について説明する。
なお、サーバ装置1における動作は、図8及び図9に示す通りである。
つまり、サーバ装置1で障害が発生していない間は、送信間隔設定部25に設定された時間の間隔で、障害発生回数通知パケットがサーバ監視部2から、サーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に送信される。
【0046】
本実施の形態に係るコールセンタ装置6の動作は、図13に示す通りである。
図13では、図10と比較して、S205及びST230が追加されており、他の処理は図10と同様である。
以下では、S205及びST230について説明する。
なお、図13では、ST300、ST400、ST500も記述されているが、ST300、ST400、ST500は実施の形態3で説明する。
【0047】
本実施の形態では、通報通知解析部80が、通報通知受信部62により受信されたパケットが障害発生回数通知パケットであると判断すると、受信間隔設定部85に設定されている値が通知受信間隔計測タイマ84にセットされ、通知受信間隔計測タイマ84はセット値のカウントダウンを開始する。
つまり、通知受信間隔計測タイマ84は、障害発生回数通知パケットの受信時刻からの経過時間を計測する。
そして、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、サーバ装置1の送信間隔設定部25に設定された時間間隔でサーバ監視部2が障害発生回数通知パケットを送信する。
このため、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、通報通知受信部62が障害発生回数通知パケットを受信し、通報通知解析部80が障害発生回数通知パケットが受信された旨を確認する。
通報通知解析部80が障害発生回数通知パケットの受信を確認すると、通知受信間隔計測タイマ84には受信間隔設定部85に設定されていた時間が再度セットされ、その後カウントダウンが再度開始される。
結局、通信経路が正常であれば、通知受信間隔の再設定→カウントダウン→通知受信間隔の再設定→カウントダウンが繰り返され、通知受信間隔計測タイマ84がゼロになることはない。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマ84のカウントダウンが進み、通知受信間隔計測タイマ84の値がゼロになる。
図13に従って説明すると、通知受信間隔計測タイマ84は、単位時間ごとに(ST205)に障害経路確認処理(ST230)を行って、カウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を1秒とし、受信間隔設定部85が通知受信間隔計測タイマ84に設定する受信間隔を1000秒とする例で障害経路確認処理(ST230)を説明する。
【0048】
ST205により1秒ごとに経路障害確認処理(ST230)が開始され、通知受信間隔計測タイマ84はカウンタ値をデクリメントし、カウンタ値がゼロになっていなければ、経路障害確認処理(ST230)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)、通知受信間隔計測タイマ84が通知生成部63にカウンタ値がゼロになった旨を通知する。
通知生成部63は、通知受信間隔計測タイマ84からの通知を受けて、通信経路の異常の可能性を警告する警告メッセージを生成し、通知出力部65での蓄積の後、通知出力部65が警告メッセージを保守センタ装置70に送信する。
【0049】
警告メッセージを受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに障害発生通報パケットとして通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。
【0050】
このように、障害発生通報経路に異常がある場合でも、サーバ装置で障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になり、信頼性の高いシステムを構築することができる。
【0051】
実施の形態3.
本実施の形態では、複数のサーバ装置1と複数の保守センタ7に対応させたコールセンタ装置6を説明する。
【0052】
図7は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図示は省略しているが本実施の形態に係るコールセンタ装置6は複数のサーバ装置1にネットワーク接続されている。
また、本実施の形態に係るコールセンタ装置6は、複数の保守センタ7とネットワーク接続されている。
【0053】
図7は、図6に示した通報確認部8をソフトウェアとして実現している例を示す。
つまり、サーバ群監視情報記憶部800において、サーバ装置ごとの記憶ブロックを設け、各記憶ブロックに図6に示した通報確認部8を実現するためのデータを格納している。
サーバ1対応情報ブロック810は、サーバ番号1のサーバ装置1に対する記憶ブロックであり、サーバn対応情報ブロック8n0は、サーバ番号nのサーバ装置1に対する記憶ブロックである。
以下では、サーバ1対応情報ブロック810を例にして、記憶ブロック内の構成を説明する。
【0054】
障害通報受信カウンタ811は、図6に示した障害通報受信カウンタ81と同様に動作し、障害発生通報パケットの受信回数を計数する。
障害通報送信回数受信部812は、図6に示した障害通報送信回数受信部82と同様に動作し、通報通知解析部80から障害発生回数通知パケットのデータ部の数値(障害発生回数)を記憶する。
通知受信間隔計測タイマ814は、図6に示した通知受信間隔計測タイマ84と同様に動作し、障害発生回数通知パケットを受信してからの経過時間を計測する。
受信間隔設定部815は、図6に示した受信間隔設定部85と同様に動作し、通知受信間隔計測タイマ814の計測時間をセットする。
アドレス設定部816は、サーバ番号1のサーバ装置1の通信アドレスを格納している。
サーバ1近隣保守センタアドレス817は、サーバ番号1のサーバ装置1の近隣に設置されている保守センタ7の保守センタ装置70の通信アドレスを格納している。
サーバ1有効フラグ818は、サーバ1対応情報ブロック810が登録済で有効であることを示す。
【0055】
なお、本実施の形態では、図6に示した比較部83の動作は制御部61が行うものとする。
つまり、本実施の形態では、例えばサーバ番号1のサーバ装置1の場合では、制御部61が障害通報受信カウンタ811のカウンタ値と障害通報送信回数受信部812の値とを比較する。
なお、コールセンタ装置6の他の要素は図6と同じであり、説明を省略する。
【0056】
次に動作について説明する。
各サーバ装置1における障害発生時の通報および正常時の障害発生回数通知については実施の形態1と同様に行われる。
ここでは、図13〜図16を参照して、通報および通知を受信したコールセンタ装置6での動作を中心に述べる。
なお、図13は、本実施の形態に係るコールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図14は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図13のST300の詳細を示す。
図15は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図13のST400の詳細を示す。
図16は、本実施の形態に係るコールセンタ装置6の経路障害確認処理の手順例であり、全てのサーバ装置において通信経路故障による通知の受信タイムアウトが発生していないかを周期的にチェックする動作を示す。
図16は、図13のST500の詳細を示す。
【0057】
サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生通報パケットであることを確認する(ST203でYES)。
このため、障害発生通報処理(ST300)(図14)が行われる。
【0058】
障害発生通報処理(ST300)では、制御部61が、障害発生通報パケットの送信元アドレスを読み出す(図14のST301)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST302、ST303)、読み出したアドレス設定部のアドレスと障害発生通信パケットの送信元アドレスとの比較を行う(ST304)。
一致しない場合(ST304でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST309、ST310、ST303)、障害発生通報パケットの送信元アドレスとの比較を行う(ST304)。
【0059】
一方、ST304でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、障害通報受信カウンタ811の内容をインクリメント(+1)するとともに、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に通知メッセージ66の送信先として通知する(ST305)。
また、制御部61は、障害発生通報パケットのデータ部の障害発生個所を示すコードを通知生成部63に通知する(ST306)。
また、制御部61は、通知生成部63が通知メッセージ66を生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST307)。
次に、通知生成部63が通知メッセージ66を生成し、通知蓄積部64に蓄積された後に、通知出力部65が通知メッセージ66を送信する(ST308)。
通知メッセージ66の送信先は、ST305で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
【0060】
この後、障害発生の通知を受けた保守センタ7から保守員がサーバ装置1の設置場所に派遣され、障害発生箇所の交換が行われてシステムは正常に復帰する。
【0061】
もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
【0062】
障害通報回数通知パケットを受信したコールセンタ装置6では、サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生回数通知パケットであることを確認する(ST203でNO、ST204でYES)。
このため、障害発生回数通知処理(ST400)(図15)が行われる。
【0063】
障害発生回数通知処理(ST400)では、制御部61が、障害発生回数通知パケットの送信元アドレスを読み出す(図15のST401)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST402、ST403)、読み出したアドレス設定部のアドレスと障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
一致しない場合(ST404でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST414、ST415、ST403)、障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
【0064】
一方、ST404でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、次に、受信間隔設定部815に格納されている受信間隔の値を通知受信間隔計測タイマ814にセットして、通知受信間隔計測タイマ814のカウントダウンとを開始させる(ST405)。
次に、制御部61は、障害発生回数通知パケットのデータ部に格納されている障害発生回数を読み出し、読み出した障害発生回数を障害通報送信回数受信部812に格納する(ST406)。
そして、制御部61は、障害通報受信カウンタ811からカウンタ値を読み出すとともに(ST407)、障害通報送信回数受信部812から障害発生回数を読み出して、両者を比較する(ST408)。
障害通報受信カウンタ811の内容と、障害通報送信回数受信部812の内容が等しければ(ST408でYES)、制御部61は処理を終了する。
一方、障害通報受信カウンタ811の値がN、障害通報送信回数受信部812の値がN+1である場合には、不一致であり(ST408でNO)、制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に警告メッセージの送信先として通知する(ST409)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST410)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST411)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST412)。
警告メッセージの送信先は、ST409で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
そして、次回の比較に備え、障害通報送信回数受信部812の値N+1を障害通報受信カウンタ811にセットする(ST413)。
【0065】
その後、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常があり、サーバ番号1のサーバ装置1で障害が発生している可能性がある旨を当該サーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバが正常状態に復旧する。
また、サーバ側ルータ50も交換されて、システムが正常状態に戻る。
【0066】
また、サーバ装置1で障害が発生しなかった場合でも、コールセンタ装置6のサーバ群監視情報記憶部800内に記憶された各サーバに対応する記憶ブロック中の通知受信間隔計測タイマの内容が一定間隔でカウントダウンされる。
あるサーバ装置1から障害発生回数通知パケットを受信すると、通報通知解析部80で解析されて、対応する記憶ブロック中の受信間隔設定部の内容が通知受信間隔計測タイマにセットされる。
通信経路に障害がない場合には、こうして各サーバ装置に対応した通知受信間隔計測タイマがカウントダウン→受信間隔設定部の内容の再セット→カウントダウン→受信間隔設定部の内容の再セットを繰り返す。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマのカウントダウンが進み、その値がゼロになる。
図13に従って説明すると、制御部61は、単位時間ごとに(ST205)に障害経路確認処理(ST500)を行って、通知受信間隔計測タイマのカウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を全サーバ装置で共通に1秒とし、受信間隔設定部が通知受信間隔計測タイマに設定する受信間隔を全サーバ装置で共通に1000秒とする例で障害経路確認処理(ST500)を説明する。
【0067】
ST205により1秒ごとに経路障害確認処理(ST500)が開始される。
経路障害確認処理(ST500)では、制御部61が、サーバ群監視情報記憶部800の記憶ブロックの配置順にサーバ1有効フラグ818・・・8n8を読み出し(図16のST501、ST502)、フラグ有効になっている記憶ブロックの通知受信間隔計測タイマ814・・・8n4のカウンタ値をデクリメント(−1)させ(ST503)、カウンタ値がゼロになっていなければ(ST504でNO)、次の記憶ブロックの有効フラグを確認する(ST509、ST510、ST502)。
全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)(ST504でYES)、制御部61は、S505に処理を進める。
ここでは、サーバ1対応情報ブロック810の通知受信間隔計測タイマ814のカウンタ値がゼロになった場合、すなわち、サーバ番号1のサーバ装置1からの障害発生回数通知パケットを1000秒以上受信していない場合を例にして説明する。
制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ装置1の近隣にある保守センタ7のアドレスを通知生成部63に警告メッセージの送信先として通知する(ST505)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST506)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST507)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST508)。
警告メッセージの送信先は、ST505で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
通知生成部63による警告メッセージの送信及び通知出力部65による警告メッセージの送信に並行して、制御部61はST509以降の処理を進め、全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
【0068】
通知出力部65により警告メッセージが送信されると、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。
【0069】
以上のように、複数のサーバ装置についてサーバ装置もしくは障害発生通報経路に異常が発生した場合でも、障害の発生を検出できるとともに、場合によってはサーバ装置での障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になるため、信頼性の高いシステムを構築することができる。
【0070】
以上、実施の形態1〜3では、
サーバ装置の障害発生を監視するサーバ監視部に障害通報送信カウンタを設け、障害通報を受信するコールセンタ装置にはサーバ装置毎に障害通報受信カウンタを設け、サーバ装置で障害が発生したことを検出した監視部は障害発生を通報する度に障害通報送信カウンタを+1し、コールセンタ装置側では障害通報を受信する度に障害通報受信カウンタを+1し、
サーバ監視部は定期的に障害通報送信カウンタの内容をコールセンタ装置に送信するようにし、コールセンタ装置で、サーバ監視部から送信されてきた障害通報送信カウンタの内容と障害通報受信カウンタの内容を比較し、
コールセンタ装置で両者が一致しないことを検出した場合には、監視対象のサーバ装置とコールセンタ装置間の通信経路に障害が発生したか、設定に誤りがあることを検出でき、保守センタに通知できるので、通信経路断などの障害が発生したことを素早く検出でき、対処することができるようになり、システムの信頼性を上げることができるシステムを説明した。
【0071】
なお、以上の説明では、サーバ装置1における障害の発生をコールセンタ装置6に通知する例を説明したが、通知する内容は障害の発生に限らない。
サーバ装置1における所定のイベントの発生を通知するイベント通知をコールセンタ装置6に送信するシステム構成において、サーバ装置1でイベント通知の送信回数を計数し、コールセンタ装置6でイベント通知の受信回数を計数し、所定の間隔でサーバ装置1がイベント通知の送信回数を通知するようにしてもよい。
また、イベント通知を送受信する装置は、サーバ装置1とコールセンタ装置6に限定されない。
【0072】
最後に、実施の形態1〜3に示したサーバ装置1及びコールセンタ装置6のハードウェア構成例について説明する。
図17は、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6のハードウェア資源の一例を示す図である。
なお、図17の構成は、あくまでもサーバ装置1及びコールセンタ装置6のハードウェア構成の一例を示すものであり、サーバ装置1及びコールセンタ装置6のハードウェア構成は図17に記載の構成に限らず、他の構成であってもよい。
【0073】
図17において、サーバ装置1及びコールセンタ装置6は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、SSD(Solid State Drive)、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
実施の形態1〜3で説明した通知蓄積部64又はサーバ群監視情報記憶部800は、RAM914、磁気ディスク装置920等により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは出力装置の一例である。
【0074】
通信ボード915は、図1に示すように、ネットワークに接続されている。
例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)、SAN(ストレージエリアネットワーク)などに接続されていても構わない。
【0075】
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
【0076】
また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
【0077】
また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
サーバ装置1及びコールセンタ装置6の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
【0078】
上記プログラム群923には、実施の形態1〜3の説明において「〜部」(通知蓄積部64及びサーバ群監視情報記憶部800以外、以下同様)として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
【0079】
ファイル群924には、実施の形態1〜3の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の読み出し」、「〜の更新」、「〜の設定」、「〜の登録」、「〜の選択」、「〜の入力」、「〜の出力」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。
ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出される。
そして、読み出された情報やデータや信号値や変数値やパラメータは、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1〜3で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示す。
データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。
また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
【0080】
また、実施の形態1〜3の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。
すなわち、実施の形態1〜3で説明したフローチャートに示すステップ、手順、処理により、本発明を方法の発明として把握することができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。
或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。
プログラムはCPU911により読み出され、CPU911により実行される。
すなわち、プログラムは、実施の形態1〜3の「〜部」としてコンピュータを機能させるものである。あるいは、実施の形態1〜3の「〜部」の手順や方法をコンピュータに実行させるものである。
【0081】
このように、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータである。
そして、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
【符号の説明】
【0082】
1 サーバ装置、2 サーバ監視部、5 通信回線、6 コールセンタ装置、7 保守センタ、8 通報確認部、9 通信回線、21 障害検出部、22 通報通知作成部、23 通報通知送信部、24 障害通報送信カウンタ、25 送信間隔設定部、26 送信間隔計測タイマ、27 要求信号、50 サーバ側ルータ、60 センタ側ルータ、61 制御部、62 通報通知受信部、63 通知生成部、64 通知蓄積部、65 通知出力部、66 通知メッセージ、70 保守センタ装置、71 保守員、80 通報通知解析部、81 障害通報受信カウンタ、82 障害通報送信回数受信部、83 比較部、84 通知受信間隔計測タイマ、85 受信間隔設定部、800 サーバ群監視情報記憶部、810 サーバ1対応情報ブロック、811 障害通報受信カウンタ、812 障害通報送信回数受信部、814 通知受信間隔計測タイマ、815 受信間隔設定部、816 アドレス設定部、817 サーバ1近隣保守センタアドレス、818 サーバ1有効フラグ。
【特許請求の範囲】
【請求項1】
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする情報処理装置。
【請求項2】
前記情報処理装置は、
所定の監視対象物における障害を検出し、障害検出イベントを発生させる障害検出部を有し、
前記イベント通知生成部は、
前記障害検出部により障害検出イベントが発生した場合に、障害検出イベントを通知するイベント通知を生成することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
情報処理装置から、前記情報処理装置における所定のイベントの発生を通知するイベント通知を受信するイベント通知受信部と、
前記イベント通知受信部によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数部と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信部と、
前記送信回数通知受信部により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数部により計数されているイベント通知の受信回数とを比較する比較部と、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成部と、
前記警告メッセージ生成部により生成された警告メッセージを出力する警告メッセージ出力部とを有することを特徴とする管理装置。
【請求項4】
前記管理装置は、更に、
前記送信回数通知受信部が前記情報処理装置から送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した場合に、経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された場合に、警告メッセージを生成することを特徴とする請求項3に記載の管理装置。
【請求項5】
前記警告メッセージ生成部は、
前記情報処理装置との通信経路における異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3又は4に記載の管理装置。
【請求項6】
前記警告メッセージ出力部は、
前記情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力することを特徴とする請求項3〜5のいずれかに記載の管理装置。
【請求項7】
前記管理装置は、
複数の情報処理装置に接続され、
前記イベント通知受信部は、
情報処理装置ごとに、イベント通知を受信し、
前記イベント通知受信回数計数部は、
情報処理装置ごとに、イベント通知の受信回数を計数し、
前記送信回数通知受信部は、
情報処理装置ごとに、送信回数通知を受信し、
前記比較部は、
情報処理装置ごとに、イベント通知の送信回数とイベント通知の受信回数とを比較し、
前記警告メッセージ生成部は、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない情報処理装置がある場合に、当該情報処理装置について異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3〜6にいずれかに記載の管理装置。
【請求項8】
前記管理装置は、更に、
情報処理装置ごとに、前記送信回数通知受信部が送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した情報処理装置がある場合に、当該情報処理装置について経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された情報処理装置について、警告メッセージを生成することを特徴とする請求項7に記載の管理装置。
【請求項9】
前記管理装置は、更に、
前記警告メッセージ生成部により警告メッセージが生成された情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力する警告メッセージ出力部を有することを特徴とする請求項7又は8に記載の管理装置。
【請求項10】
前記イベント通知受信部は、
情報処理装置で発生した障害検出イベントを通知するイベント通知を受信することを特徴とする請求項3〜9のいずれかに記載の管理装置。
【請求項11】
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成処理と、
前記イベント通知生成処理により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信処理と、
前記イベント通知送信処理によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数処理と、
所定の間隔で、前記イベント通知送信回数計数処理により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成処理と、
前記送信回数通知生成処理により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信処理とをコンピュータに実行させることを特徴とするプログラム。
【請求項12】
情報処理装置から、前記情報処理装置における所定のイベントの発生を通知するイベント通知を受信するイベント通知受信処理と、
前記イベント通知受信処理によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数処理と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信処理と、
前記送信回数通知受信処理により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数処理により計数されているイベント通知の受信回数とを比較する比較処理と、
前記比較処理による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成処理と、
前記警告メッセージ生成処理により生成された警告メッセージを出力する警告メッセージ出力処理とをコンピュータに実行させることを特徴とするプログラム。
【請求項1】
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする情報処理装置。
【請求項2】
前記情報処理装置は、
所定の監視対象物における障害を検出し、障害検出イベントを発生させる障害検出部を有し、
前記イベント通知生成部は、
前記障害検出部により障害検出イベントが発生した場合に、障害検出イベントを通知するイベント通知を生成することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
情報処理装置から、前記情報処理装置における所定のイベントの発生を通知するイベント通知を受信するイベント通知受信部と、
前記イベント通知受信部によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数部と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信部と、
前記送信回数通知受信部により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数部により計数されているイベント通知の受信回数とを比較する比較部と、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成部と、
前記警告メッセージ生成部により生成された警告メッセージを出力する警告メッセージ出力部とを有することを特徴とする管理装置。
【請求項4】
前記管理装置は、更に、
前記送信回数通知受信部が前記情報処理装置から送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した場合に、経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された場合に、警告メッセージを生成することを特徴とする請求項3に記載の管理装置。
【請求項5】
前記警告メッセージ生成部は、
前記情報処理装置との通信経路における異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3又は4に記載の管理装置。
【請求項6】
前記警告メッセージ出力部は、
前記情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力することを特徴とする請求項3〜5のいずれかに記載の管理装置。
【請求項7】
前記管理装置は、
複数の情報処理装置に接続され、
前記イベント通知受信部は、
情報処理装置ごとに、イベント通知を受信し、
前記イベント通知受信回数計数部は、
情報処理装置ごとに、イベント通知の受信回数を計数し、
前記送信回数通知受信部は、
情報処理装置ごとに、送信回数通知を受信し、
前記比較部は、
情報処理装置ごとに、イベント通知の送信回数とイベント通知の受信回数とを比較し、
前記警告メッセージ生成部は、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない情報処理装置がある場合に、当該情報処理装置について異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3〜6にいずれかに記載の管理装置。
【請求項8】
前記管理装置は、更に、
情報処理装置ごとに、前記送信回数通知受信部が送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した情報処理装置がある場合に、当該情報処理装置について経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された情報処理装置について、警告メッセージを生成することを特徴とする請求項7に記載の管理装置。
【請求項9】
前記管理装置は、更に、
前記警告メッセージ生成部により警告メッセージが生成された情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力する警告メッセージ出力部を有することを特徴とする請求項7又は8に記載の管理装置。
【請求項10】
前記イベント通知受信部は、
情報処理装置で発生した障害検出イベントを通知するイベント通知を受信することを特徴とする請求項3〜9のいずれかに記載の管理装置。
【請求項11】
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成処理と、
前記イベント通知生成処理により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信処理と、
前記イベント通知送信処理によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数処理と、
所定の間隔で、前記イベント通知送信回数計数処理により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成処理と、
前記送信回数通知生成処理により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信処理とをコンピュータに実行させることを特徴とするプログラム。
【請求項12】
情報処理装置から、前記情報処理装置における所定のイベントの発生を通知するイベント通知を受信するイベント通知受信処理と、
前記イベント通知受信処理によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数処理と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信処理と、
前記送信回数通知受信処理により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数処理により計数されているイベント通知の受信回数とを比較する比較処理と、
前記比較処理による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成処理と、
前記警告メッセージ生成処理により生成された警告メッセージを出力する警告メッセージ出力処理とをコンピュータに実行させることを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【公開番号】特開2012−68729(P2012−68729A)
【公開日】平成24年4月5日(2012.4.5)
【国際特許分類】
【出願番号】特願2010−210929(P2010−210929)
【出願日】平成22年9月21日(2010.9.21)
【出願人】(501158538)三菱電機インフォメーションテクノロジー株式会社 (28)
【Fターム(参考)】
【公開日】平成24年4月5日(2012.4.5)
【国際特許分類】
【出願日】平成22年9月21日(2010.9.21)
【出願人】(501158538)三菱電機インフォメーションテクノロジー株式会社 (28)
【Fターム(参考)】
[ Back to top ]