説明

障害発生通知システム及び障害発生通知方法

【課題】複数テナント毎の障害メッセージの効率的な通知を可能にする。
【解決手段】APサービスを複数テナントに対して提供するWeb/APサーバ101と、テナントのシステム障害を監視する監視サーバ102とを備えるコンピュータシステムの障害発生通知システムであって、障害情報蓄積部104他がマルチテナント対応障害発生通知制御システム112に障害メッセージを送信し、これを受信した障害メッセージ管理部107が、受信した障害メッセージと同一テナントの同一障害メッセージが障害メッセージ保持部109に保持されていないと判定したときのみ、受信障害メッセージを障害メッセージ保持部109に保持すると共に受信障害メッセージを障害メッセージ出力部110を用いて監視サーバ102に送信するシステム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークを構成するコンピュータ機器であるノードを複数接続したコンピュータシステムにおける障害発生通知システム及び障害発生通知方法に係り、特にノードに高負荷がかかった場合でもテナント毎に障害メッセージの通知を可能にすることができる障害発生通知システム及び障害発生通知方法に関する。
【背景技術】
【0002】
一般にコンピュータシステムは、ネットワークを構成する複数のノードを接続して構成され、各々のノードにおいて障害が発生した場合、当該障害によるメッセージを監視サーバに送信し、該監視サーバが各ノードにおける障害状況を監視するように構成されている。従来技術による前記障害発生を監視サーバに通知する障害発生通知技術が記載された文献としては下記特許文献が挙げられ、この特許文献には、ノード単位で一定時間内に発生した同一障害メッセージを一定時間内マージし、一定時間経過後、前記マージした障害メッセージを監視サーバへ通知することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003−6004号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
前述の特許文献に記載の障害発生通知技術は、多数の同一メッセージをマージすることによって、ネットワーク上のトラフィク量を軽減することができるものの、ノードに高負荷がかかった場合、障害メッセージの通知が困難であるという不具合があった。また、コンピュータシステムが1台のサーバに1つのソフトウェアを入れ、多くのユーザが共有する形態であるマルチテナントの場合、システムの障害メッセージをテナント毎に通知することが困難であるという不具合もあった。なお、前記テナントとは、仮想化ソフトウェアを用いて同一のコンピュータ上に生成した仮想マシンである。
【0005】
本発明の目的は、前述の従来技術による不具合を除去することであり、ノードに高負荷がかかった場合でもテナント毎の障害メッセージの通知を可能にすることができる障害発生通知システム及び障害発生通知方法を提供することである。
【課題を解決するための手段】
【0006】
前記目的を達成するために本発明は、アプリケーションサービスを複数のテナントに対して提供すると共に前記テナントに発生した障害メッセージの通知を制御するマルチテナント対応障害発生通知制御システムを含むウェブアプリケーションサーバと、前記アプリケーションサービスのシステム障害を監視する監視サーバと、該ウェブアプリケーションサーバと監視サーバの通信ネットワークとを備えるコンピュータシステムの障害発生通知システムであって、
前記ウェブアプリケーションサーバは、複数のテナント毎に指定された障害メッセージを蓄積する複数の障害情報蓄積部を有し、
前記マルチテナント対応障害発生通知制御システムは、前記障害情報蓄積部からの障害メッセージを監視サーバに出力するか否かを判定する処理制御部と、該障害メッセージを保持する障害メッセージ保持部と、該障害メッセージ保持部の障害メッセージの保持期間を設定する障害メッセージ保持期間設定ファイル部と、前記障害メッセージ保持部への障害メッセージの保持と検索と削除とを管理する障害メッセージ管理部と、該障害メッセージを監視サーバへ出力する障害メッセージ出力部とを有し、
前記障害情報蓄積部が、前記蓄積した障害メッセージを前記マルチテナント対応障害発生通知制御システムの処理制御部に送信する機能を有し、
前記処理制御部が、前記障害情報蓄積部から受信した障害メッセージを前記障害メッセージ管理部に送信する機能を有し、
前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定し、保持していないと判定したときのみ、前記受信した障害メッセージを前記障害メッセージ保持部に保持すると共に、前記保持した障害メッセージを前記障害メッセージ出力部により監視サーバに送信する機能を有することを第1の特徴とする。
【0007】
また、本発明は、第1の特徴の障害発生通知システムにおいて、前記ウェブアプリケーションサーバが、複数のテナント毎に指定された障害メッセージをテナント識別子と共に蓄積する複数の障害情報蓄積部を有し、前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一の障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定するとき、前記テナント識別子及び障害メッセージが同一か否かを判定することを第2の特徴とする。
【0008】
また、本発明は、第1又は第2の特徴の障害発生通知システムにおいて、前記障害メッセージ管理部が、前記障害メッセージ保持期間設定ファイル部に設定した障害メッセージの保持期間を抽出し、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えると判定したとき、前記判定した障害メッセージを前記障害メッセージ保持部から削除する機能を有することを第3の特徴とする。
【0009】
また、本発明は、第3の特徴の障害発生通知システムにおいて、前記マルチテナント対応障害発生通知制御システムが、日時刻を計数するシステムタイマーを有し、前記障害メッセージ管理部が、前記障害メッセージが発生した日時刻と前記システムタイマーの日時刻とを比較することによって、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えるか否かを判定することを第4の特徴とする。
【0010】
更に、本発明は、アプリケーションサービスを複数のテナントに対して提供すると共に前記テナントに発生した障害メッセージの通知を制御するマルチテナント対応障害発生通知制御システムを含むウェブアプリケーションサーバと、前記アプリケーションサービスのシステム障害を監視する監視サーバと、該ウェブアプリケーションサーバと監視サーバの通信ネットワークとを備えるコンピュータシステムの障害発生通知方法であって、
前記ウェブアプリケーションサーバは、複数のテナント毎に指定された障害メッセージを蓄積する複数の障害情報蓄積部を有し、
前記マルチテナント対応障害発生通知制御システムは、前記障害情報蓄積部からの障害メッセージを監視サーバに出力するか否かを判定する処理制御部と、該障害メッセージを保持する障害メッセージ保持部と、該障害メッセージ保持部の障害メッセージの保持期間を設定する障害メッセージ保持期間設定ファイル部と、前記障害メッセージ保持部への該障害メッセージの保持と検索と削除とを管理する障害メッセージ管理部と、該障害メッセージを監視サーバへ出力する障害メッセージ出力部とを有し、
前記障害情報蓄積部が、前記蓄積した障害メッセージを前記マルチテナント対応障害発生通知制御システムの処理制御部に送信する機能を有し、
前記処理制御部が、前記障害情報蓄積部から受信した障害メッセージを前記障害メッセージ管理部に送信する機能を有し、
前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定し、保持していないと判定したときのみ、前記受信した障害メッセージを前記障害メッセージ保持部に保持すると共に、前記保持した障害メッセージを前記障害メッセージ出力部により監視サーバに送信することを第5の特徴とする。
【0011】
また、本発明は、第5の特徴の障害発生通知方法において、前記ウェブアプリケーションサーバが、複数のテナント毎に指定された障害メッセージをテナント識別子と共に蓄積する複数の障害情報蓄積部を有し、前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一の障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定するとき、前記テナント識別子及び障害メッセージが同一か否かを判定することを第6の特徴とする。
【0012】
また、本発明は、第5又は第6の特徴の障害発生通知方法において、前記障害メッセージ管理部が、前記障害メッセージ保持期間設定ファイル部に設定した障害メッセージの保持期間を抽出し、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えると判定したとき、前記判定した障害メッセージを前記障害メッセージ保持部から削除することを第7の特徴とする。
【0013】
また、本発明は、第7の特徴の障害発生通知方法において、前記マルチテナント対応障害発生通知制御システムが、日時刻を計数するシステムタイマーを有し、前記障害メッセージ管理部が、前記障害メッセージが発生した日時刻と前記システムタイマーの日時刻とを比較することによって、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えるか否かを判定することを第8の特徴とする。
【発明の効果】
【0014】
本発明による障害発生通知システム及び方法は、アプリケーションサービスを複数テナントに対して提供するウェブアプリケーションサーバと、テナントのシステム障害を監視する監視サーバとを備えるコンピュータシステムにおいて、障害情報蓄積部がマルチテナント対応障害発生通知制御システムに障害メッセージを送信し、これを受信した障害メッセージ管理部が、受信した障害メッセージと同一テナントの同一障害メッセージが障害メッセージ保持部に保持されていないと判定したときのみ、受信障害メッセージを障害メッセージ保持部に保持すると共に受信障害メッセージを障害メッセージ出力部により監視サーバに送信することによって、同一のテナントに生じた同一障害による障害メッセージの監視サーバへの通知を制御し、テナント毎の障害メッセージを通知することができる。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施形態による障害発生通知システムの全体構成を示す図。
【図2】本実施形態による障害発生通知機能の処理手順を示す図。
【図3】本実施形態による蓄積障害メッセージ削除機能の処理手順を示す図。
【図4】本実施形態による障害メッセージ保持期間設定ファイルの説明図。
【図5】本実施形態による障害メッセージ保持部の説明図。
【発明を実施するための形態】
【0016】
以下、本発明による障害発生通知システム及び障害発生通知方法の一実施形態を図面を参照して詳細に説明する。
[構成]
本実施形態による障害発生通知方法を実現する障害発生通知システムの全体構成は、図1に示す如く、ウェブ(Web)上においてアプリケーションサービスを提供するWeb/APサーバ101と、アプリケーションサービス及びシステム障害を監視する監視サーバ102と、該Web/APサーバ101と監視サーバ102の通信経路であるLAN(通信ネットワーク)103とから構成される。なお、ウェブ(Web)とは、インターネット上で提供されるハイパーテキストシステムである「ワールド ワイド ウェブ(World Wide Web)」を意味し、アプリケーション(AP)とは、コンピュータの利用者がコンピュータ上で実行したい作業を実施する機能を直接的に有するソフトウェアである「アプリケーション ソフトウェア(Application software)」を意味し、本実施形態においては、Web及びAPと記載する。
【0017】
前記Web/APサーバ101は、Web/APサーバ101上で稼働する予め指定されたテナントにおいてシステム障害が発生した場合、当該テナントからの障害メッセージを蓄積する障害情報蓄積部104と、Web/APサーバ上で稼働する他のテナントにおいてシステム障害が発生した場合、当該テナントからの障害メッセージを蓄積する障害情報蓄積部105と、これら障害情報蓄積部104及び105からの障害メッセージを基に障害メッセージを監視サーバ102に通知するマルチテナント対応障害発生通知制御システム112とから構成される。
【0018】
該マルチテナント対応障害発生通知制御システム112は、前記障害情報蓄積部104及び105からの障害メッセージを監視サーバ102に出力するか否かを後述の処理による指示によって行う処理制御部106と、障害メッセージを保持する障害メッセージ保持部109と、該障害メッセージ保持部109への障害メッセージの保持期間を設定する障害メッセージ保持期間設定ファイル部108と、前記障害メッセージ保持部109への障害メッセージの保持と検索と削除とを管理する障害メッセージ管理部107と、障害メッセージを監視サーバ102へ出力する障害メッセージ出力部110とを備える。前記監視サーバ102は、Web/APサーバ101からの障害メッセージを受け付ける障害メッセージ受付部111と、受信した障害メッセージを基にWeb/APサーバ101の障害を監視する監視部(図示せず)とを備える。なお、本実施形態においてはWeb/APサーバ101等の内部構成をコンピュータのハードウェア的に説明したが、一般のコンピュータにおけるCPU(Central Processing Unit)、メモリ、磁気ディスク装置等の記憶装置、入出力インタフェース部、システムタイマー等のハードウェアを制御するソフトウェアとして構成しても良い。なお、図1中の実線で示す矢印は制御方向を表し、破線で示す矢印はデータの流れ方向を表している。
【0019】
前記障害メッセージ保持期間設定ファイル部108に設定される保持期間は、管理者の任意の設定により定められるものであって、例えば図4に示す如く、メッセージ保持期間が10日の如く設定されるものであり、前記障害メッセージ保持部109に保持する障害メッセージは、図5に示す如く、障害が発生したテナントの障害情報蓄積部ID(識別子)と、該障害が発生した年月日時刻と、障害内容を示すメッセージの各情報とから成り、図示の例では、障害情報蓄積部IDが「A」の障害が「2009/07/14 00:00:00」に発生し、メッセージが「XX処理が異常終了しました」であることを示している。
【0020】
[動作]
前述のように構成したマルチテナント対応障害発生通知システムの全体動作は、図2に示すフローの如く、Web/APサーバ101の障害情報蓄積部104又は105からの障害メッセージを処理制御部106が定期的に受信するステップS201と、処理制御部106が受信した障害メッセージを障害メッセージ管理部107に問合せを行うステップS202と、障害メッセージ管理部107が問合せされた障害メッセージと障害情報蓄積部104又は105のIDとの組合せをキーとして、障害メッセージ保持部109を検索するステップS203と、障害メッセージ管理部107が検索結果がゼロか否かを判定し、ゼロで無いと判定したときに後述のステップS209に移行するステップS204と、該ステップS204において検索結果がゼロと判定したとき、通知された障害メッセージと障害情報蓄積部IDと障害発生日時とを障害メッセージ保持部109に書き込むステップS205と、該ステップS205又はステップS204に続き、障害メッセージ管理部107が検索結果が如何なる場合も検索した結果を処理制御部106に返すステップS206とを実行する。
【0021】
次いで、本システムは、処理制御部106が検索結果がゼロか否かを判定し、ゼロと判定したときに後述のステップS209に移行するステップS207と、該ステップS207において検索結果がゼロでないと判定したとき、通知された障害メッセージを破棄(消去)するステップS208と、前記ステップS207における検索結果がゼロと判定したとき、障害メッセージを障害メッセージ出力部110へ通知するステップS209と、この通知を受けた障害メッセージ出力部110が、通知された障害メッセージを監視サーバ102へLAN103を経由して通知するステップS210と、該監視サーバ102の障害メッセージ受付部111が前記通知された障害メッセージを受け付けて処理を終了するステップS211とを実行する。
【0022】
これら一連の処理によって本実施形態によるマルチテナント対応障害発生通知システムは、受信した障害情報蓄積部と同一ID及び同一障害内容の障害メッセージが障害メッセージ保持部109に既に保持されているか否かをステップS204及びステップS207により判定し、保持されていないと判定したとき、障害メッセージ保持部109に当該障害メッセージを保持し且つ監視サーバ102に通知することによって、同一テナントに生じた同一障害の最初の障害メッセージのみを監視サーバ102に通知することができる。
【0023】
次に、本実施形態による応障害発生通知システムの障害メッセージ保持部削除機能の動作を説明する。
本機能は、図3に示す如く、障害メッセージ管理部107が、障害メッセージ保持期間設定ファイル部108から保持期間を取得するステップS301と、コンピュータシステムの現在日時から取得した保持期間以前の障害メッセージを障害メッセージ保持部109から検索するステップS302と、該ステップS302による検索結果が1件以上か否かを判定し、1件未満と判定したときに前記ステップS302に戻るステップS303と、該ステップS303により1件以上と判定したとき、存在した障害メッセージを障害メッセージ保持部109から削除するステップS304とを実行することによって、同一の障害メッセージが所定の期間(保持期間)を経過した後の別障害による障害メッセージを監視サーバ102に送信することができる。
【0024】
なお、前述の実施形態においては、テナント毎に障害メッセージを蓄積する障害情報蓄積部を複数設ける例を説明したが、本発明はこれに限られるものではなく、単体の障害情報蓄積部にテナント識別子と障害メッセージとの組合せを複数蓄積するように構成しても良い。
【0025】
以上説明した如く、本実施形態によれば、所定期間(保持期間)内に発生する同一障害メッセージの制御をテナント単位に行うことができ、障害発生を通知するシステムの利便性を高めることができる。
即ち、本実施形態によれば、物理的に異なるリソースを論理的に一つに見せる仮想マシン環境において、Web/APサーバが所定期間内に発生する同一障害メッセージをテナント単位に纏め、監視サーバに初期発生した障害メッセージのみを通知し、2回目以降発生した障害メッセージを通知しないことにより、テナント単位の障害切り分け時間の短縮とノード高負荷時にも通知できる確率を上げ、ネットワークや監視サーバへの負荷を軽減することができる。
【符号の説明】
【0026】
101:Web/APサーバ、102:監視サーバ、104:障害情報蓄積部、105:障害情報蓄積部、106:処理制御部、107:障害メッセージ管理部、108:障害メッセージ保持期間設定ファイル、109:障害メッセージ保持部、110:障害メッセージ出力部、111:障害メッセージ受付部、112:マルチテナント対応障害発生通知制御システム。

【特許請求の範囲】
【請求項1】
アプリケーションサービスを複数のテナントに対して提供すると共に前記テナントに発生した障害メッセージの通知を制御するマルチテナント対応障害発生通知制御システムを含むウェブアプリケーションサーバと、前記アプリケーションサービスのシステム障害を監視する監視サーバと、該ウェブアプリケーションサーバと監視サーバの通信ネットワークとを備えるコンピュータシステムの障害発生通知システムであって、
前記ウェブアプリケーションサーバは、複数のテナント毎に指定された障害メッセージを蓄積する複数の障害情報蓄積部を有し、
前記マルチテナント対応障害発生通知制御システムは、前記障害情報蓄積部からの障害メッセージを監視サーバに出力するか否かを判定する処理制御部と、障害メッセージを保持する障害メッセージ保持部と、該障害メッセージ保持部の障害メッセージの保持期間を設定する障害メッセージ保持期間設定ファイル部と、前記障害メッセージ保持部への障害メッセージの保持と検索と削除とを管理する障害メッセージ管理部と、該障害メッセージを監視サーバへ出力する障害メッセージ出力部とを有し、
前記障害情報蓄積部が、前記蓄積した障害メッセージを前記マルチテナント対応障害発生通知制御システムの処理制御部に送信する機能を有し、
前記処理制御部が、前記障害情報蓄積部から受信した障害メッセージを前記障害メッセージ管理部に送信する機能を有し、
前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定し、保持していないと判定したときのみ、前記受信した障害メッセージを前記障害メッセージ保持部に保持すると共に、前記保持した障害メッセージを前記障害メッセージ出力部により監視サーバに送信する機能を有する障害発生通知システム。
【請求項2】
前記ウェブアプリケーションサーバが、複数のテナント毎に指定された障害メッセージをテナント識別子と共に蓄積する複数の障害情報蓄積部を有し、
前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一の障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定するとき、前記テナント識別子及び障害メッセージが同一か否かを判定する請求項1記載の障害発生通知システム。
【請求項3】
前記障害メッセージ管理部が、前記障害メッセージ保持期間設定ファイル部に設定した障害メッセージの保持期間を抽出し、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えると判定したとき、前記判定した障害メッセージを前記障害メッセージ保持部から削除する機能を有する請求項1又は2記載の障害発生通知システム。
【請求項4】
前記マルチテナント対応障害発生通知制御システムが、日時刻を計数するシステムタイマーを有し、
前記障害メッセージ管理部が、前記障害メッセージが発生した日時刻と前記システムタイマーの日時刻とを比較することによって、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えるか否かを判定する請求項3記載の障害発生通知システム。
【請求項5】
アプリケーションサービスを複数のテナントに対して提供すると共に前記テナントに発生した障害メッセージの通知を制御するマルチテナント対応障害発生通知制御システムを含むウェブアプリケーションサーバと、前記アプリケーションサービスのシステム障害を監視する監視サーバと、該ウェブアプリケーションサーバと監視サーバの通信ネットワークとを備えるコンピュータシステムの障害発生通知方法であって、
前記ウェブアプリケーションサーバは、複数のテナント毎に指定された障害メッセージを蓄積する複数の障害情報蓄積部を有し、
前記マルチテナント対応障害発生通知制御システムは、前記障害情報蓄積部からの障害メッセージを監視サーバに出力するか否かを判定する処理制御部と、障害メッセージを保持する障害メッセージ保持部と、該障害メッセージ保持部の障害メッセージの保持期間を設定する障害メッセージ保持期間設定ファイル部と、前記障害メッセージ保持部への障害メッセージの保持と検索と削除とを管理する障害メッセージ管理部と、該障害メッセージを監視サーバへ出力する障害メッセージ出力部とを有し、
前記障害情報蓄積部が、前記蓄積した障害メッセージを前記マルチテナント対応障害発生通知制御システムの処理制御部に送信する機能を有し、
前記処理制御部が、前記障害情報蓄積部から受信した障害メッセージを前記障害メッセージ管理部に送信する機能を有し、
前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定し、保持していないと判定したときのみ、前記受信した障害メッセージを前記障害メッセージ保持部に保持すると共に、前記保持した障害メッセージを前記障害メッセージ出力部により監視サーバに送信する障害発生通知方法。
【請求項6】
前記ウェブアプリケーションサーバが、複数のテナント毎に指定された障害メッセージをテナント識別子と共に蓄積する複数の障害情報蓄積部を有し、
前記障害メッセージ管理部が、前記処理制御部から受信した障害メッセージと同一テナントの同一の障害メッセージが前記障害メッセージ保持部に保持されているか否かを判定するとき、前記テナント識別子及び障害メッセージが同一か否かを判定する請求項5記載の障害発生通知方法。
【請求項7】
前記障害メッセージ管理部が、前記障害メッセージ保持期間設定ファイル部に設定した障害メッセージの保持期間を抽出し、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えると判定したとき、前記判定した障害メッセージを前記障害メッセージ保持部から削除する請求項5又は6記載の障害発生通知方法。
【請求項8】
前記マルチテナント対応障害発生通知制御システムが、日時刻を計数するシステムタイマーを有し、
前記障害メッセージ管理部が、前記障害メッセージが発生した日時刻と前記システムタイマーの日時刻とを比較することによって、前記障害メッセージ保持部に保持した障害メッセージの保持期間が前記抽出した保持期間を超えるか否かを判定する請求項7記載の障害発生通知方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2011−118613(P2011−118613A)
【公開日】平成23年6月16日(2011.6.16)
【国際特許分類】
【出願番号】特願2009−274742(P2009−274742)
【出願日】平成21年12月2日(2009.12.2)
【出願人】(000152985)株式会社日立情報システムズ (409)
【Fターム(参考)】