監視装置、監視方法、プログラム及び監視システム
【課題】端末装置の障害解析に有用な情報を取得することができる監視装置、監視方法、プログラム及び監視システムを提供する。
【解決手段】サーバ装置と通信する端末装置を監視する監視装置において、前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部31dとを備える。
【解決手段】サーバ装置と通信する端末装置を監視する監視装置において、前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部31dとを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クライアントサーバシステムを監視する監視装置、監視方法、プログラム及び監視システムに関する。
【背景技術】
【0002】
監視装置が監視対象から情報を収集することにより監視対象を監視する技術がある(例えば、特許文献1)。監視装置は、監視対象が複数の端末装置である場合、ブロードキャスト方式で一律かつ一斉に端末装置から監視情報を収集している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−252614号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、ブロードキャスト方式で端末装置から監視情報を収集する場合のように、障害が発生した端末装置と障害が発生していない端末装置とから同じ監視情報を収集しても、収集した監視情報は障害の解析材料として役立ち難い。また、サーバ装置に対する監視情報に基づかなければ、検出されない端末装置の障害がある。
【0005】
本発明は斯かる事情に鑑みてなされたものである。その目的は、端末装置の障害解析に有用な情報を取得することができる監視装置、監視方法、プログラム及び監視システムを提供することである。
【課題を解決するための手段】
【0006】
本願による開示の一観点は、サーバ装置と通信する端末装置を監視する監視装置において、前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部とを備える。
【発明の効果】
【0007】
本願による開示の一観点によれば、端末装置の障害解析に有用な情報を取得することができる。
【図面の簡単な説明】
【0008】
【図1】監視システムの構成例を示す模式図である。
【図2】監視システムのハードウェア構成例を示すブロック図である。
【図3】監視装置の機能構成例を示す機能ブロック図である。
【図4】監視画面のレイアウト例を示す説明図である。
【図5】監視詳細画面のレイアウト例を示す説明図である。
【図6】障害端末に対する監視処理の一例の手順を示すフローチャートである。
【図7】障害端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図8】障害端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図9】利用端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図10】未使用端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図11】監視システムの構成例を示す模式図である。
【図12】監視システムのハードウェア構成例を示すブロック図である。
【図13】サーバ監視装置及び端末監視装置の機能構成例を示す機能ブロック図である。
【発明を実施するための形態】
【0009】
以下、実施の形態をその図面に基づいて説明する。
なお、本発明は、以下の実施の形態に限定されるものではない。
【0010】
実施の形態1
図1は、監視システム100の構成例を示す模式図である。監視システム100は、端末装置1、サーバ装置2及び監視装置3を含む。端末装置1、サーバ装置2及び監視装置3は、LAN(Local Area Network)、インターネット等のネットワークNを介して接続されている。図1では、3台の端末装置1がネットワークNに接続された例を示している。ネットワークNに接続される端末装置1の台数は3台に限られず、これより多くても少なくてもよいことは勿論である。
【0011】
端末装置1は、例えばPC(パーソナルコンピュータ)、ノートPC、PDA(Personal Digital Assistant)、製造装置、測定装置、券売機等に接続されたコンピュータ等の端末である。端末装置1には、業務アプリケーション(以下、アプリケーションと呼ぶ)がインストールされている。ユーザは端末装置1からサーバ装置2にログインする。
サーバ装置2は、PC、ワークステーション等のDB(データベース)サーバであり、端末装置1が利用する各種のテーブルを有する。端末装置1のアプリケーションは、ユーザの操作に基づき、各種のSQL(Structured Query Language)文を生成し、サーバ装置2に送信する。サーバ装置2は、端末装置1から受け付けたSQL文を実行し、各種テーブルに対して操作をする。サーバ装置2は、検索したレコード、テーブルに対する操作結果等を端末装置1に送信する。
【0012】
監視装置3は、例えばPC、ワークステーション等であり、端末装置1及びサーバ装置2の稼働状況を監視する。また、監視装置3は、端末装置1のアプリケーションによる処理内容、処理結果及びサーバ装置2が実行するDB操作も監視する。
【0013】
図2は、監視システム100のハードウェア構成例を示すブロック図である。
端末装置1は、制御部11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、HDD(Hard Disk Drive)14、操作部15、通信部16及び計時部17を含む。端末装置1のハードウェア各部は、バス1bを介して相互に接続されている。制御部11は、CPU(Central Processing Unit)又はMPU(Micro Processor Unit)であり、端末装置1のハードウェア各部を制御する。制御部11は、HDD14に記録されたアプリケーションのプログラム1PをRAM13にロードし、プログラム1Pを実行する。
【0014】
ROM12は、端末装置1の起動時に制御部11が実行するBIOS(Basic Input/Output System)等を記録している。RAM13は、SRAM(Static RAM)、フラッシュメモリ等であり、制御部11によるプログラム1Pの実行時に発生する各種のデータを一時的に記録する。
HDD14は、大容量の記録部であり、プログラム1Pが記録されている。また、HDD14には、図示しないエージェントがインストールされている。エージェントは、監視装置3から要求された情報を端末装置1から収集し、収集した情報を監視装置3に送信するプログラムである。エージェントは、端末装置1の起動時に実行を開始し、常駐するプログラムである。
操作部15は、ユーザが端末装置1を操作するためのキーボード、マウス、ディスプレイ等を含む。通信部16は、ネットワークNに接続するためのネットワークインタフェースであり、例えばモデム、LANカード等である。計時部17は、日時を計時し、計時した日時を制御部11に出力する。
【0015】
サーバ装置2は、制御部21、ROM22、RAM23、HDD24、操作部25、通信部26及び計時部27を含む。サーバ装置2のハードウェア各部は、バス2bを介して相互に接続されている。制御部21は、CPU又はMPUであり、サーバ装置2のハードウェア各部を制御する。制御部21は、HDD24に記録されたプログラム2PをRAM23にロードし、プログラム2Pを実行する。プログラム2Pは、例えば各種テーブル群からなるDBを操作するプログラム2Pである。
【0016】
ROM22は、サーバ装置2の起動時に制御部21が実行するBIOS等を記録している。RAM23は、SRAM、フラッシュメモリ等であり、制御部21によるプログラム2Pの実行時に発生する各種のデータを一時的に記録する。
HDD24は、大容量の記録部であり、端末装置1のアプリケーション1Pが利用する図示しないDBを記録している。また、HDD24は、図示しないジャーナルファイルを記録する。ジャーナルファイルは、DBのトランザクションログに該当する。監視装置3は、ジャーナルファイルを参照することにより、サーバ装置2が実行したトランザクションの履歴を取得することができる。
HDD24は、例えば利用者テーブル1T及び端末テーブル2Tを記録している。利用者テーブル1Tは、サーバ装置2に対する端末装置1のログイン情報を管理するテーブルである。端末テーブル2Tは、当該業務システムを利用することができる端末装置1を管理するテーブルである。
操作部25は、ユーザがサーバ装置2を操作するためのキーボード、マウス、ディスプレイ等を含む。通信部26は、ネットワークNに接続するためのネットワークインタフェースである。計時部27は、日時を計時し、計時した日時を制御部21に出力する。
【0017】
監視装置3は、制御部31、ROM32、RAM33、HDD34、ディスクドライブ35、操作部36、通信部37、表示部38及び計時部39を含む。監視装置3のハードウェア各部は、バス3bを介して相互に接続されている。
制御部31は、監視装置3のハードウェア各部を制御する。制御部31は、HDD34に記録されたプログラム3P、4PをRAM33にロードし、プログラム3P、4Pを実行する。
【0018】
ROM32は、監視装置3の起動時に制御部31が実行するBIOS等を記録している。RAM33は、例えばSRAM、DRAM(Dynamic RAM)等であり、制御部31が実行する処理の過程で必要な作業変数、データ等を一時的に記録する。なお、RAM33は主記憶装置の一例であり、RAM33の代わりにフラッシュメモリ、メモリカード等が用いられてもよい。
【0019】
HDD34は、制御部31が実行するプログラム3P、4Pを記録している。プログラム3Pはサーバ装置2の監視に係り、プログラム4Pは端末装置1の監視に係る。そのため、プログラム3P及び4Pを夫々異なるコンピュータにインストールすることにより、監視装置3は、サーバ装置2を監視する装置と端末装置1を監視する装置とに分けられてもよい。
なお、HDD34は、監視装置3の内部に取り付けられるものであっても、監視装置3の外部に置かれるものであってもよい。また、HDD34は補助記憶装置の一例であり、大容量の情報の記録が可能なフラッシュメモリ、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc、登録商標)等の光ディスク1aで代替してもよい。
【0020】
ディスクドライブ35は、外部の記録媒体であるCD、DVD、BD等の光ディスク1aから情報を読み込み、光ディスク1aに情報を記録する。
【0021】
操作部36は、ユーザが各種の入力を行うキーボード、マウス、電源スイッチ、ディスクドライブ35から光ディスク1aを排出するための操作ボタン等の入力デバイスを含む。操作部36は、ユーザによる操作に基づいて入力信号を生成する。生成された入力信号は、バス3bを介して制御部31に送信される。
【0022】
通信部37は、ネットワークNに接続するためのネットワークインタフェースである。通信部37は、例えば有線又は無線通信のモデム又はLANカード等である。なお、通信部37は、電話回線と接続することができてもよい。
【0023】
表示部38は、例えば液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の画面を有し、制御部31からの指示に従って、プログラム3P、4Pに係る各種情報を表示する。
なお、プログラム3P、4Pの実行結果を出力する出力手段は、表示部38だけに限らない。例えば、出力手段は監視装置3に接続されたプリンタでもよい。あるいは、プログラム3P、4Pの実行結果は、通信部37を介して、外部の装置に出力されてもよい。
計時部39は、日時を計時し、計時した日時を制御部31に出力する。
【0024】
次に、監視装置3の機能について説明する。
監視装置3は、サーバ装置2から障害端末情報を検出する。障害端末情報は、端末装置1、ネットワークN等に何らかの障害が発生し、その障害の影響がサーバ装置2の処理に及ぶことにより、サーバ装置2が出力するジャーナルファイルから取得される情報である。監視装置3は、検出した障害端末情報に係る端末装置1に対して監視頻度、監視項目等を選択し、監視を実施する。また、監視装置3は、サーバ装置2のHDD24に記録された利用者テーブル1T及び端末テーブル2Tを利用し、障害端末情報と関係しない端末装置1の監視も実施する。
【0025】
図3は、監視装置3の機能構成例を示す機能ブロック図である。図3の各機能部は、制御部31がHDD34に記録されたプログラム3P、4Pに基づいて動作することにより実行される。なお、サーバ装置送受信部31g、端末装置送受信部31hは、制御部31が通信部37と協働して実現する機能である。
サーバ装置送受信部31gは、サーバ装置2と各種データの送受信をする。端末装置送受信部31hは、端末装置1と各種データの送受信を行う。
【0026】
検出部31aは、サーバ装置送受信部31gを介して、サーバ装置2から各種の監視情報を取得する。例えば、検出部31aは、サーバ装置2から利用者テーブル1T及び端末テーブル2Tに記録されたレコードを取得する。利用者テーブル1Tは、サーバ装置2にログインしているユーザ名及び端末装置1のIP(Internet Protocol)アドレスの一覧を記録するテーブルである。端末テーブル2Tは、監視装置3が監視対象としている業務システムを利用することができる端末装置1のIPアドレス1の一覧を記録するテーブルである。
【0027】
検出部31aは、DBに未処理レコードを発生させた命令をサーバ装置2に送信した端末装置1のIPアドレスを取得する。未処理レコードとは、サーバ装置2においてトランザクション処理が正常に終了していないレコードのことである。
【0028】
例えば、所定のレコード10件を所定のテーブルに新規挿入した後、当該テーブルのあるフィールドに格納されたフラグを業務ロジックに従って更新するトランザクション処理命令が、端末装置1からサーバ装置2へ送信されたとする。かかる場合、サーバ装置2は所定のレコードの新規挿入には成功したものの、フラグの更新指示を5件のレコードについてのみ受信したとする。そうしたとき、10件の新規レコードのうち、5件のレコードについてはフラグ更新処理が完了するが、残り5件のレコードについてはフラグ更新が実行されない。この残りの5件のレコードは、未処理レコードとしてテーブルに残る。また、ジャーナルファイルには、10件のレコードが正常に新規挿入されたことと、5件のレコードがフラグ更新されたことが記録される。
【0029】
検出部31aは、サーバ装置2のジャーナルファイルを監視し、未処理レコードを発見した場合、未処理レコードに関するトランザクション処理命令を送信した端末装置1のIPアドレスを取得する。なお、検出部31aは、未処理レコードを特定する情報及びそのトランザクションの内容を取得してもよい。
【0030】
未処理レコードが発生する原因として、端末装置1のハードウェアの不具合、端末装置1にインストールされたプログラム1Pの不具合、ネットワークNの混雑等が考えられる。そこで、監視装置3は、未処理レコードを発生させた端末装置1の監視項目を増やし、監視時間間隔を短くすることで、障害解消のための情報をより多く収集する。他方、監視装置3は、障害が発生していない端末装置1に対しては、監視項目を減らし、監視時間間隔を長く設定する。これにより、ネットワークN全体のトラフィック量を低減することができる。
【0031】
検出部31aがサーバ装置2を監視する項目には、未処理レコードの他に、長時間検索と排他とがある。長時間検索とは、サーバ装置2が長時間、検索処理を実行している状態のことである。排他とは、例えばテーブル又はレコードのロック処理が行われた後、ロック解除が行われていない状態のことである。
【0032】
長時間検索の原因として、端末装置1にインストールされたプログラム1Pの不具合の他に、検索装置1からサーバ装置2に送信されるSQL文が複雑である場合がある。例えば、where句が入れ子になっており、DBの検索エンジンに多大な負荷がかかる場合、長時間検索に陥る可能性がある。あるいは、from句が副問合せを持ち、ビューをテーブル名の代わりに用いる場合も、DBの検索エンジンに多大な負荷がかかる。
検出部31aは、サーバ装置2が有するDBのパフォーマンス解析機能を利用し、長時間検索を監視する。そして、検出部31aは、長時間検索を発見した場合、その検索命令をサーバ装置2に送信した端末装置1のIPアドレス及び長時間検索の対象テーブル名を取得する。また、検出部31aは、長時間検索に係るSQL文、DBコマンド等を取得する。
【0033】
排他が生じる原因として、未処理レコードの発生原因と同じ原因が考えられる。通常、端末装置1はサーバ装置2にトランザクションを実行させる場合、サーバ装置2が有するテーブル又はレコードにロックをかけ、他の端末装置1が同じテーブル又はレコードにアクセスできないようにする。これは、データの整合性が失われないようにするためである。トランザクションが終了した場合、端末装置1は、サーバ装置2にcommit又はroolbackのコマンドを送信した後、サーバ装置2にロック解除の命令を送信する。しかし、端末装置1、ネットワークN等に何らかの障害が発生し、サーバ装置2がロック解除の命令を受信しない場合、サーバ装置2は排他の状態を維持する。
検出部31aは、例えばDB管理プログラムから排他の状態であることを検出した場合、排他命令をサーバ装置2に送信した端末装置1のIPアドレス、排他の対象テーブル名、排他の対象レコードを特定する情報等を取得する。
【0034】
上述の未処理レコード、長時間検索又は排他に関する情報と、これらに関する端末装置1のIPアドレスと、障害発生時刻とが、障害端末情報である。例えば、端末装置1にインストールされたプログラム1Pの不具合に起因する障害端末情報は、端末装置1を監視しても得られない情報である。
【0035】
なお、検出部31aがサーバ装置2から障害端末情報を検出するために、検出部31aは常にサーバ装置2を監視する。しかし、サーバ装置2が障害端末情報を検出した場合、サーバ装置2が監視装置3に所定の信号又は電文等を送信してもよい。監視装置3は、所定の信号又は電文等の受信をトリガーにして、サーバ装置2から障害端末情報を取得してもよい。
また、端末テーブル2Tは、監視装置3のHDD34に記録されていてもよい。かかる場合、検出部31aは、サーバ装置2から端末テーブル2Tのレコードを取得する必要はなく、HDD34から端末テーブル2Tのレコードを取得する。
【0036】
検出部31aは、障害端末情報の他に、サーバ装置2のOS(Operating System)からHDD24の使用率又は未使用率を所定時間間隔で取得する。また、検出部31aは、サーバ装置2のOSからサーバ装置2のRAM23の使用率又は未使用率を所定時間間隔で取得する。なお、HDD24、RAM23等の記録手段に対する監視情報は、記憶容量の率ではなく、使用されている記憶容量の値でもよい。
【0037】
特定部31bは、検出部31aが取得した障害端末情報、利用者テーブル1T及び端末テーブル2Tのレコードに基づいて、障害端末、利用端末(他の端末装置)及び未使用端末(更に他の端末装置)を特定する。
障害端末は、障害端末情報に示されたIPアドレスに対応する端末装置1である。
利用端末は、利用者テーブル1TのIPアドレスから障害端末のIPアドレスを除いた、残りのIPアドレスに対応する端末装置1である。
未使用端末は、端末テーブル2TのIPアドレスから利用者テーブル1TのIPアドレスを除いた、更に残りのIPアドレスに対応する端末装置1である。なお、未使用端末は、端末テーブル2TのIPアドレスから障害端末及び利用端末のIPアドレスを除いた、更に残りのIPアドレスに対応する端末装置1としてもよい。
【0038】
一覧生成部31cは、障害端末一覧、利用端末一覧及び未使用端末一覧を生成し、RAM33に記録する。
障害端末一覧は、特定部31bが特定した障害端末のIPアドレスと障害発生時刻とを記録したファイルである。
利用端末一覧は、特定部31bが特定した利用端末のIPアドレスを記録したファイルである。つまり、利用端末一覧は、サーバ装置2にログインしており、障害が発生していない端末装置1のリストである。なお、利用端末一覧には、ログイン中のユーザ名が記録されてもよい。
未使用端末一覧は、特定部31bが特定した未使用端末のIPアドレスを記録したファイルである。つまり、未使用端末一覧は、監視対象としている業務システムを利用することができる端末装置1のうち、サーバ装置2にログインしていない端末装置1のリストである。なお、未使用端末一覧は、端末テーブル2TのIPアドレスから障害端末及び利用端末のIPアドレスを除いた、残りのIPアドレスを記録したファイルでもよい。
【0039】
要求部31dは、特定部31bが障害端末を特定した場合、即座に該当する障害端末のエージェントに対して、監視情報の収集及び送信を要求する。この監視情報は、例えばHDD14の使用率、RAM13の使用率、アプリケーションの起動状況及びアプリケーションが出力したログ(以下では、アプリケーションログという)の内容である。
【0040】
要求部31dは、一覧生成部31cが生成した障害端末一覧、利用端末一覧及び未使用端末一覧に基づいて、端末装置1のエージェントに対して監視情報の収集及び送信を要求する。その際、監視情報を要求する時間間隔を端末装置1毎に選択する。例えば、この時間間隔は、障害端末に対しては5分間隔、利用端末に対しては30分間隔から60分間隔、未使用端末に対しては3時間間隔から4時間間隔である。
【0041】
また、要求部31dは、一覧生成部31cが生成した障害端末一覧、利用端末一覧及び未使用端末一覧に基づいて、端末装置1に対して要求する監視情報の内容を選択する。
例えば、要求部31dが障害端末のエージェントに対して要求する監視情報は、HDD14の使用率、RAM13の使用率、アプリケーションの起動状況及びアプリケーションログの内容である。ここでは、HDD14の容量に関する情報は、HDD14の使用率若しくは未使用率のいずれか一方又は両方と、HDD14の記憶容量とを含んでもよい。同様に、RAM13の容量に関する情報は、RAM13の使用率若しくは未使用率のいずれか一方又は両方と、RAM13の記憶容量とを含んでもよい。
端末装置1のエージェントは、OSからHDD14の容量、RAM13の容量に関する情報を取得する。端末装置1のエージェントは、アプリケーションログからアプリケーションの処理内容及び処理結果を取得する。
【0042】
例えば、要求部31dが利用端末のエージェントに対して要求する監視情報は、HDD14の使用率、RAM13の使用率及びアプリケーションの起動状況である。
例えば、要求部31dが未使用端末のエージェントに対して要求する監視情報は、HDD14の使用率及びRAM13の使用率である。
障害端末、利用端末又は未使用端末のエージェントは、要求されたこれらの監視情報を収集し、監視装置3に送信する。
【0043】
取得部31eは、端末装置送受信部31hを介して、端末装置1のエージェントから、要求部31が要求した各種の監視情報を取得する。取得部31eは、取得した監視情報をRAM33又はHDD34に記録する。
画面表示部31fは、取得部31eが取得した各種の監視情報を表示部38に表示する。
【0044】
図3では、サーバ装置送受信部31gと端末装置送受信部31hとは、別の機能部として示している。しかし、サーバ装置送受信部31gと端末装置送受信部31hとは一つの送受信部にまとめられてもよい。
【0045】
次に、監視装置3の動作について説明する。
以下、障害端末、利用端末及び未使用端末の順に、これらの端末装置1を監視する監視装置3の動作について説明する。
監視装置3は、障害端末が発生した場合、障害端末のIPアドレス、障害内容及び障害発生時刻を取得する。障害内容は、未処理レコード、長時間検索又は排他である。監視装置3は、取得したIPアドレスの障害端末のエージェントに対して、HDD14の使用率、RAM13の使用率、アプリケーションの起動状況及びアプリケーションログの収集を要求する。障害端末のエージェントは、監視装置3から要求された監視情報を収集し、収集した監視情報を監視装置3に送信する。
【0046】
監視装置3は、障害端末のエージェントから、収集された監視情報を受信し、受信した監視情報をRAM33又はHDD34に記録する。
監視装置3は、表示部38に障害端末のIPアドレスと障害内容とを示す監視画面を表示する。
【0047】
図4は、監視画面のレイアウト例を示す説明図である。監視画面は、日付、時間、管理名称、監視対象、IPアドレス及び内容の各項目を含む。日付及び時間は、監視装置3が監視情報を取得した日時である。管理名称は、端末監視又はDB監視である。監視対象は、端末装置1又はサーバ装置2の名称である。IPアドレスは、監視対象である端末装置1又はサーバ装置2のIPアドレスである。内容は、障害端末の場合、未処理レコード、長時間検索又は排他である。図4の例では、2行目のA端末について長時間検索が表示されている。なお、利用端末の場合、内容はログイン中の利用者名である。未使用端末の場合、内容は「利用可能な端末です。」というメッセージである。
監視画面のIPアドレスのいずれかの値がクリックされた場合、監視装置3はクリックされたIPアドレスに対応する端末装置1のエージェントから受信した監視情報を表示部38に表示する。端末装置1のエージェントから受信した監視情報は、監視詳細画面として表示される。
【0048】
図5は、監視詳細画面のレイアウト例を示す説明図である。監視詳細画面は、監視名及び内容の各項目を含む。監視名は、HDD14の容量に関するDISK使用率、RAM13の容量に関するメモリ使用率、アプリケーションの起動状況に関するダウンプログラム及びアプリケーションログである。内容は、監視名に対応する具体的な監視情報である。例えば、DISK使用率に対応する内容は、HDD14の各ハードディスクドライブの使用率である。メモリ使用率に対応する内容は、RAM13の使用率である。ダウンプログラムに対応する内容は、ダウンしたアプリケーションのプログラム名である。アプリケーションログに対応する内容は、アプリケーションが出力したログの内容である。例えば、障害が長時間検索である場合、アプリケーションログの内容は端末装置1からサーバ装置2に送信されたSQL文が含まれる。
【0049】
監視装置3は、障害端末一覧に障害端末のIPアドレスと障害発生時刻とを記録する。新たに障害端末情報を受信し、受信した障害端末情報に含まれるIPアドレスが既に障害端末一覧に記録されている場合、監視装置3は障害端末一覧に記録された障害発生時刻を更新する。
【0050】
監視装置3は、障害端末のエージェントに対して、アプリケーションログの収集レベルに高めるように指令する。高められた収集レベルのアプリケーションログの内容は、例えばアプリケーションによる個々の業務処理に対する成功又は失敗の記録を含む。また、高められた収集レベルのアプリケーションログの内容は、例えばユーザが行ったアプリケーションに対する操作内容、サーバ装置2に送信したSQL文、サーバ装置2に送信したDBコマンド等を含む。あるいは、より詳細なアプリケーションログの内容は、障害端末における全実行履歴(トレース)であってもよい。
【0051】
なお、監視装置3は、障害内容である未処理レコード、長時間検索又は排他の違いによって、障害端末のエージェントに対して要求するアプリケーションログの収集内容を変えてもよい。例えば、監視装置3は、障害が未処理レコードである場合、アプリケーションによる個々の処理に対する失敗の記録の収集及び送信を障害端末のエージェントに要求する。監視装置3は、障害が長時間検索である場合、障害端末がサーバ装置2に送信したSQL文の収集及び返信を障害端末のエージェントに要求する。監視装置3は、障害が排他である場合、サーバ装置2に送信したDBコマンドの収集及び返信を障害端末のエージェントに要求する。
【0052】
障害端末のエージェントは、2回目以降の監視情報を監視装置3に送信する場合、前回送信済みのアプリケーションログからの増加分、すなわち差分のみを監視装置3に送信する。これにより、ネットワークNの無用な混雑を増大させないようにすることができる。
【0053】
図6は、障害端末に対する監視処理の一例の手順を示すフローチャートである。
制御部31は、サーバ装置2から障害端末情報を取得したか否か判定する(ステップS101)。制御部31は、サーバ装置2から障害端末情報を取得していないと判定した場合(ステップS101:NO)、処理を終了する。制御部31は、サーバ装置2から障害端末情報を取得したと判定した場合(ステップS101:YES)、IPアドレスに基づいて障害端末を特定する(ステップS102)。制御部31は、特定した障害端末に監視情報の収集及び送信を要求する(ステップS103)。
【0054】
障害端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS104)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS105)。
【0055】
制御部31は、監視情報を受信し、障害端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示する(ステップS106)。ステップS106において、制御部31は監視情報をRAM33又はHDD34に記録する処理も実行する。RAM33又はHDD34に記録された監視情報は、ユーザからの要求に応じて、表示部38に表示される。制御部31は、受信した監視情報を障害端末一覧に記録又は更新する(ステップS107)。
【0056】
制御部31は、障害端末にアプリケーションログの収集レベルを高める指令を送信する(ステップS108)。制御部11は、監視装置3からの指令を受け付け、アプリケーションログの収集レベルを高め(ステップS109)、処理を終了する。
【0057】
監視装置3は、例えば5分以内に再び障害端末情報をサーバ装置2から取得した場合、図6に示した監視処理を再び実行する。一方、監視装置3は、5分以内に再び障害端末情報をサーバ装置2から受信しない場合、次の割り込み処理を例えば5分間隔で予め設定された所定時間継続して実行する。
【0058】
監視装置3は、障害端末のエージェントに対し、上述の監視情報の収集及び送信を要求する。監視装置3は、受信した監視情報をRAM33又はHDD34に記録する。この記録は、アプリケーションログに関しては、差分の追加記録である。監視装置3は、RAM33又はHDD34に記録した監視情報を表示部38に表示する。
監視装置3は、計時部39の計時に基づいて、現在時刻が障害端末一覧に記録された障害発生時刻から予め設定された所定時間以内の時刻である場合、次の割り込み処理まで待機する。
一方、監視装置3は、計時部39の計時に基づいて、現在時刻が障害端末一覧に記録された障害発生時刻から予め設定された所定時間以上経過した時刻である場合、当該障害端末の情報を障害端末一覧から削除する。監視装置3は、障害端末のエージェントに対して、監視情報の収集を通常モードに変更する指令を送信する。通常モードの監視情報とは、HDD14の使用率、RAM13の使用率及びアプリケーションの起動状況であり、アプリケーションログは通常モードの監視情報に含まれない。障害端末のエージェントは、監視装置3から上記指令を受信した場合、監視情報の収集を通常モードに変更する。以後、監視装置3にとって、当該障害端末は利用端末に変わる。
【0059】
図7及び図8は、障害端末に対する割り込み処理の一例の手順を示すフローチャートである。
制御部31は、計時部39の計時に基づいて、割り込み処理を開始する(ステップS201)。制御部31は、RAM33上の障害端末一覧を参照し、障害端末があるか否か判定する(ステップS202)。制御部31は、RAM33上の障害端末一覧を参照し、障害端末がない判定と判定した場合(ステップS202:NO)、処理を終了する。制御部31は、RAM33上の障害端末一覧を参照し、障害端末があると判定した場合(ステップS202:YES)、障害端末に監視情報の収集及び送信を要求する(ステップS203)。ステップS203では、障害端末が少なくとも1台ある場合、制御部31は障害端末に監視情報の収集及び送信を要求する。障害端末が複数ある場合、制御部31はステップS203以後のステップ処理を障害端末の数だけ同様に実施する。
【0060】
障害端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS204)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS205)。
【0061】
制御部31は、監視情報をRAM33又はHDD34に記録する(ステップS206)。制御部31は、RAM33上の障害端末一覧を参照し、計時部39の計時に基づいて障害発生時刻は所定時間より前か否か判定する(ステップS207)。制御部31は、RAM33上の障害端末一覧を参照し、計時部39の計時に基づいて障害発生時刻が所定時間より前でないと判定した場合(ステップS207:NO)、処理を終了する。制御部31は、RAM33上の障害端末一覧を参照し、計時部39の計時に基づいて障害発生時刻が所定時間より前であると判定した場合(ステップS207:YES)、当該障害端末に関する情報を障害端末一覧から削除する(ステップS208)。
【0062】
制御部31は、監視情報の収集を通常モードに変更する指令を障害端末に送信する(ステップS209)。制御部11は、監視装置3からの指令を受け付け、監視情報の収集レベルを通常モードに変更し(ステップS210)、処理を終了する。
【0063】
次に、利用端末を監視する監視装置3の動作について説明する。
監視装置3は、利用端末のエージェントに対して以下の割り込み処理を例えば30分間隔で実行する。この監視時間間隔は、障害端末の監視時間間隔よりも長い時間に設定する。
監視装置3は、利用端末一覧の更新をする。すなわち、監視装置3は、サーバ装置2から最新の利用者テーブル1Tの情報を取得し、取得した利用者テーブルの端末装置1からRAM33に記録されている最新の障害端末一覧の端末装置1を除く。端末装置3は、更新した利用端末一覧に基づいて、利用端末の監視処理を実行する。
【0064】
監視装置3は、利用端末のエージェントに対し、監視情報の収集及び送信を要求する。利用端末のエージェントに対して要求する監視情報は、例えばHDD14の使用率、RAM13の使用率及びアプリケーションの起動状況である。監視装置3は、受信した監視情報をRAM33又はHDD34に記録する。
【0065】
監視装置3は、取得した監視情報に基づいて、利用端末の障害を判定する。当該判定は例えば、HDD14の使用率が予め設定した値を超えていないか、RAM13の使用率が予め設定した値を超えていないか、又は停止しているアプリケーションがないかということである。監視装置3は、利用端末に障害がないと判定した場合、次の割り込み処理まで待機する。
一方、監視装置3は、利用端末に障害があると判定した場合、障害が発生した利用端末のIPアドレスと障害内容とを表示部38に表示し、ユーザに注意を喚起する。
【0066】
図9は、利用端末に対する割り込み処理の一例の手順を示すフローチャートである。
制御部31は、計時部39の計時に基づいて、割り込み処理を開始する(ステップS301)。制御部31は、RAM33上の利用端末一覧を更新する(ステップS302)。ステップS302において、制御部31は利用端末を特定していることになる。制御部31は、利用端末一覧を参照し、夫々の利用端末について以下のステップ処理を実行する。
【0067】
制御部31は、RAM33上の利用端末一覧を参照し、利用端末に監視情報の収集及び送信を要求する(ステップS303)。利用端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS304)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS305)。
【0068】
制御部31は、監視情報をRAM33又はHDD34に記録する(ステップS306)。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、利用端末に障害があるか否か判定する(ステップS307)。ステップS307において、HDD14の使用率が所定値以上である場合、RAM13の使用率が所定値以上である場合又は停止しているアプリケーションがある場合、制御部31は利用端末に障害があると判定する。
【0069】
制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、利用端末に障害がないと判定した場合(ステップS307:NO)、処理を終了する。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、利用端末に障害があると判定した場合(ステップS307:YES)、当該利用端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示し(ステップS308)、処理を終了する。
【0070】
次に、未使用端末を監視する監視装置3の動作について説明する。
監視装置3は、未使用端末のエージェントに対して以下の割り込み処理を例えば3時間間隔で実行する。この監視時間間隔は、利用端末の監視時間間隔よりもさらに長い時間に設定する。
監視装置3は、未使用端末一覧の更新をする。すなわち、監視装置3は、サーバ装置2から最新の利用者テーブル1T及び端末テーブル2Tの情報を取得し、業務システムを利用することが可能な端末装置1からサーバ装置2にログインしている端末装置1を除く。端末装置3は、更新した未使用端末一覧に基づいて、未使用端末の監視処理を実行する。
【0071】
監視装置3は、未使用端末のエージェントに対し、監視情報の収集及び送信を要求する。利用端末のエージェントに対して要求する監視情報は、例えばHDD14の使用率及びRAM13の使用率である。未使用端末の監視情報には、アプリケーションの起動状況は含まれない。これにより、ネットワークNを移動するデータ量を低減することができる。また、未使用端末はサーバ装置2のDBを利用していないので、業務に関するアプリケーションの起動状況を監視しなくても、業務システムにとって格段の不利益は生じない。
監視装置3は、未使用端末から監視情報を受信し、受信した監視情報をRAM33又はHDD34に記録する。
【0072】
監視装置3は、取得した監視情報に基づいて、未使用端末の障害を判定する。当該判定は例えば、HDD14の使用率が予め設定した値を超えていないか、又はRAM13の使用率が予め設定した値を超えていないかということである。監視装置3は、未使用端末に障害がないと判定した場合、次の割り込み処理まで待機する。
一方、監視装置3は、未使用端末に障害があると判定した場合、障害が発生した未使用端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示し、ユーザに注意を喚起する。
【0073】
図10は、未使用端末に対する割り込み処理の一例の手順を示すフローチャートである。
制御部31は、計時部39の計時に基づいて、割り込み処理を開始する(ステップS401)。制御部31は、利用者テーブル1T及び端末テーブル2Tのレコードに基づいて、RAM33上の未使用端末一覧を更新する(ステップS402)。ステップS402において、制御部31は未使用端末を特定していることになる。制御部31は、未使用端末一覧を参照し、夫々の未使用端末について以下のステップ処理を実行する。
【0074】
制御部31は、RAM33上の未使用端末一覧を参照し、未使用端末に監視情報の収集及び送信を要求する(ステップS403)。未使用端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS404)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS405)。
【0075】
制御部31は、監視情報をRAM33又はHDD34に記録する(ステップS406)。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、未使用端末に障害があるか否か判定する(ステップS407)。ステップS407において、HDD14の使用率が所定値以上である場合、又はRAM13の利用率が所定値以上である場合、制御部31は未使用端末に障害があると判定する。
【0076】
制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、未使用端末に障害がないと判定した場合(ステップS407:NO)、処理を終了する。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、未使用端末に障害があると判定した場合(ステップS407:YES)、当該未使用端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示し(ステップS408)、処理を終了する。
【0077】
監視装置3によれば、ブロードキャスト方式で一律かつ一斉に全ての端末装置1から監視情報を収集する場合に比べて、端末装置1の障害解析に有用な情報を障害端末から集中的に取得することができる。
サーバ装置2に未処理レコードを発生させる命令、サーバ装置2の状態を長時間検索又は排他の状態にする命令を、サーバ装置2に送信した端末装置1には、何らかの障害が発生した可能性がある。監視装置3によれば、そのような障害の発生の有無、及びサーバ装置2へのログインの有無により、端末装置1を障害端末、利用端末及び未使用端末に分ける。そして、監視装置3は、障害端末、利用端末及び未使用端末の間で、監視内容及び監視間隔を変更する。これにより、監視装置3は各端末毎に効率よく監視情報を収集することができる。
【0078】
一方、監視装置3は、ネットワークNの負荷を低減することができる。障害端末が発生する確率は、業務システム毎に概ね一定である。そのため、ブロードキャスト方式で一律かつ一斉に全ての端末装置1から監視情報を収集する場合に比べて、端末装置1の障害状況及びネットワークNへの接続状況に応じて監視内容及び監視間隔を分散させる方が、ネットワークの負荷分散に資する。
【0079】
利用者テーブル1T及び端末テーブル2Tにおいて、端末装置1を特定する識別情報としてIPアドレスを挙げた。しかし、端末装置1を特定する識別情報は、IPアドレスに限らない。例えば、端末装置1を特定する識別情報は、端末装置1の通信部16に割り当てられるMACアドレス(Media Access Control address)であってもよい。
【0080】
実施の形態2
実施の形態2は、監視装置3をサーバ監視装置と端末監視装置とに分けた形態に関する。
図11は、監視システム200の構成例を示す模式図である。監視システム200は、端末装置1、サーバ装置2、サーバ監視装置4及び端末監視装置5を含む。ネットワークNに接続されたサーバ監視装置4及び端末監視装置5は、夫々サーバ装置2及び端末装置1を監視する。
【0081】
図12は、監視システム200のハードウェア構成例を示すブロック図である。図12の端末装置1及びサーバ装置2のハードウェア構成は、夫々図2の端末装置1及びサーバ装置2のハードウェア構成と同じであるため、省略されている。サーバ監視装置4及び端末監視装置5のハードウェア構成は、図2の監視装置3のハードウェア構成と同じである。ただし、サーバ監視装置4の通信部47は、サーバ装置2の通信部26と通信する。また、端末監視装置5の通信部57は、端末装置1の通信部16と通信する。また、サーバ監視装置4の通信部47は、端末監視装置5の通信部57とも通信する。
【0082】
サーバ監視装置4のHDD44は、制御部41が実行するプログラム30Pを記録している。プログラム30Pは、監視装置3のHDD34にインストールされているプログラム3Pに類似する。プログラム30Pは、サーバ装置2を監視する機能と、検出したサーバ装置2における障害端末情報を端末監視装置5に送信する機能とを有している。また、プログラム30Pは、サーバ装置2のHDD24から利用者テーブル1T及び端末テーブル2Tのレコードを取得し、取得した当該レコードを端末監視装置5に送信する機能を有している。
【0083】
端末監視装置5のHDD54は、制御部51が実行するプログラム40Pを記録している。プログラム40Pは、監視装置3のHDD34にインストールされているプログラム4Pに類似する。プログラム40Pは、サーバ監視装置4から障害端末情報と、利用者テーブル1T及び端末テーブル2Tのレコードとを受信する機能を有している。また、プログラム40Pは、受信した障害端末情報と、利用者テーブル1T及び端末テーブル2Tのレコードとに基づいて、端末装置1を監視する機能を有している。
【0084】
図13は、サーバ監視装置4及び端末監視装置5の機能構成例を示す機能ブロック図である。サーバ監視装置4は、サーバ監視部41aを有する。サーバ監視部41aは、検出部31a、サーバ装置送受信部31g及び送信部41bを含む。図13の検出部31a及びサーバ装置送受信部31gは、夫々図3の検出部31a及びサーバ装置送受信部31gと同じである。送信部41bは、検出部31aが検出した障害端末情報並びに利用者テーブル1T及び端末テーブル2Tのレコードを端末監視装置5に送信する機能を有する。
【0085】
端末監視装置5は、端末監視部51aを有する。端末監視部51aは、受信部51b、特定部31b、一覧生成部31c、要求部31d、取得部31e、画面表示部31f及び端末装置送受信部31hを含む。受信部51bは、サーバ監視装置4から障害端末情報並びに利用者テーブル1T及び端末テーブル2Tのレコードを受信する機能を有する。図13の特定部31b、一覧生成部31c、要求部31d、取得部31e、画面表示部31f及び端末装置送受信部31hは、夫々図3の特定部31b、一覧生成部31c、要求部31d、取得部31e、画面表示部31f及び端末装置送受信部31hと同じである。
【0086】
図13の例では、サーバ監視部41aから端末監視部51aに情報が送信される。しかし、サーバ監視部41a及び端末監視部51aの間で双方向に情報が送信されてもよい。かかる場合、送信部41b及び受信部51bは送受信部として機能する。
【0087】
サーバ監視装置4及び端末監視装置5の全体の動作は、監視装置3の動作と同じである。サーバ監視装置4は、サーバ装置2を監視し、障害端末情報を取得した場合、取得した障害端末情報を端末監視装置5に送信する。端末監視装置5は、サーバ監視装置4から障害端末情報を受信し、障害端末を特定する。端末監視装置5は、特定した障害端末のエージェントに監視情報の送信を要求する。その後、端末監視装置5は、定期的に障害端末のエージェントに監視情報の送信を要求する。また、端末監視装置5は障害端末一覧を作成する。
【0088】
サーバ監視装置4は、サーバ装置2から利用者テーブル1T及び端末テーブル2Tのレコードを取得し、取得したこれらのレコードを端末監視装置5に送信する。端末監視装置5は、サーバ監視装置4から利用者テーブル1T及び端末テーブル2Tのレコードを取得し、利用端末一覧及び未使用端末一覧を作成する。端末監視装置5は、利用端末一覧に基づいて利用端末のエージェントに対して定期的に監視情報の収集及び送信を要求する。ただし、その監視時間間隔は、障害端末のエージェントに対する監視時間間隔より長い。また、その監視情報の情報量は、障害端末のエージェントに対する監視情報より少ない。例えば、端末監視装置5が利用端末のエージェントに要求する監視情報は、アプリケーションの起動状況を含み、アプリケーションログを含まない。
【0089】
端末監視装置5は、未使用端末一覧に基づいて未使用端末のエージェントに対して定期的に監視情報の収集及び送信を要求する。ただし、その監視時間間隔は、利用端末のエージェントに対する監視時間間隔より長い。また、その監視情報の情報量は、利用端末のエージェントに対する監視情報より少ない。例えば、端末監視装置5が未使用端末のエージェントに要求する監視情報は、HDD14の使用率及びRAM13の使用率を含み、アプリケーションの起動状況を含まない。
【0090】
サーバ監視装置4及び端末監視装置5によれば、サーバ装置2の監視及び端末装置1の監視の役割が異なるコンピュータにより分担される。そのため、1台のコンピュータがサーバ装置2の監視及び端末装置1の監視を行う場合よりも負荷分散が実現される。端末装置1の台数又はサーバ装置2の台数が増大した場合、端末装置1及びサーバ装置2の監視を1台のコンピュータが行うよりも、複数のコンピュータで監視の役割分担を行う方が、監視処理が滞るリスクを低減することができる。また、複数のコンピュータで監視の役割分担を行う方が、個々のコンピュータの処理能力は上昇する。さらに、監視装置3をサーバ監視装置4及び端末監視装置5に分けたとしても、システムを監視する能力に差は生じず、ネットワークNを移動する情報のトラフィックはほとんど変わらない。
また、複数の業務システムを一元管理する管理センターが創設される場合、サーバ装置2と端末装置1との監視機能を容易に分離できる形態の方が、システム変更に対して柔軟な対応が可能となる。
【0091】
監視装置3を動作させるためのプログラム3P、4Pは、ディスクドライブ35に光ディスク1aを読み取らせてHDD34に記録してもよい。サーバ監視装置4、端末監視装置5を夫々動作させるためのプログラム30P、40Pについても同様に、光ディスク1aからHDD44、54に記録してもよい。
プログラム3P、4P、30P、40Pは、ネットワークNを介して接続される他の情報処理装置又は記録装置(図示せず)からダウンロードすることも可能である。あるいは、プログラム3P、4P、30P、40Pを記録したフラッシュメモリ等の半導体メモリ1cが監視装置3、サーバ監視装置4、端末監視装置5内に夫々実装されてもよい。
【0092】
実施の形態2は以上の如きであり、その他は実施の形態1と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。
【0093】
以上の実施の形態に関し、さらに以下の付記を開示する。
【0094】
(付記1)
サーバ装置と通信する端末装置を監視する監視装置において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部と
を備える監視装置。
【0095】
(付記2)
前記受信部は前記サーバ装置にログインしている端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログインしている複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置を除いた他の端末装置に対して、該他の端末装置が実行するアプリケーションの起動状態を要求する
付記1に記載の監視装置。
【0096】
(付記3)
前記受信部は前記サーバ装置にログイン可能な端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログイン可能な複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置及び前記他の端末装置を除いた更に他の端末装置に対して、該更に他の端末装置が有する記録部の容量に関する使用率又は未使用率を要求する
付記2に記載の監視装置。
【0097】
(付記4)
前記要求部は、前記第一の命令又は前記第二の命令を送信した端末装置、他の端末装置及び更に他の端末装置に対して、夫々前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を異なる時間間隔で要求する
付記3に記載の監視装置。
【0098】
(付記5)
前記要求部が要求した前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を取得する取得部
を備える付記3又は付記4に記載の監視装置。
【0099】
(付記6)
前記サーバ装置はデータベースを操作し、
前記サーバ装置を前記第一の命令又は前記第二の命令は、前記データベースを操作する命令を含む
付記1から付記5までのいずれか一つに記載の監視装置。
【0100】
(付記7)
前記データベースを操作する命令は、トランザクション、検索又は排他に関する命令を含む
付記6に記載の監視装置。
【0101】
(付記8)
前記アプリケーションの処理内容は、前記サーバ装置に送信されたSQL文、該アプリケーションに対する操作又は該アプリケーションの実行履歴を含み、
前記アプリケーションの処理結果は、該アプリケーションにより実行された処理に対する成功又は失敗の記録を含む
付記1から付記7までのいずれか一つに記載の監視装置。
【0102】
(付記9)
前記端末装置の識別情報は該端末装置のIPアドレスを含む
付記1から付記8までのいずれか一つに記載の監視装置。
【0103】
(付記10)
サーバ装置と通信する端末装置を監視する監視方法において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信し、
受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
監視方法。
【0104】
(付記11)
サーバ装置と通信する端末装置を監視する処理をコンピュータに実行させるプログラムにおいて、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報に基づいて、該端末装置を特定し、
特定した前記端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
処理をコンピュータに実行させるプログラム。
【0105】
(付記12)
端末装置を監視する端末監視装置及び該端末装置と通信するサーバ装置を監視するサーバ監視装置を含む監視システムにおいて、
前記サーバ監視装置は、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記端末装置の識別情報を前記端末監視装置に送信する送信部と
を有し、
前記端末監視装置は、
前記サーバ監視装置の送信部が送信した前記識別情報を受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行するアプリケーションの処理内容又は処理結果を要求する要求部と
を有する
監視システム。
【0106】
(付記13)
端末装置と通信するサーバ装置を監視するサーバ監視装置において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記端末装置の識別情報を外部の装置に送信する送信部と
を備えるサーバ監視装置。
【符号の説明】
【0107】
1 端末装置
13 RAM
14 HDD
2 サーバ装置
24 HDD
3 監視装置
31 制御部
31a 検出部
31b 特定部
31d 要求部
31e 取得部
31g サーバ装置送受信部
31h 端末装置送受信部
37 通信部
4 サーバ監視装置
41 制御部
41b 送信部
47 通信部
5 端末監視装置
51 制御部
51b 受信部
57 通信部
200 監視システム
4P プログラム
40P プログラム
【技術分野】
【0001】
本発明は、クライアントサーバシステムを監視する監視装置、監視方法、プログラム及び監視システムに関する。
【背景技術】
【0002】
監視装置が監視対象から情報を収集することにより監視対象を監視する技術がある(例えば、特許文献1)。監視装置は、監視対象が複数の端末装置である場合、ブロードキャスト方式で一律かつ一斉に端末装置から監視情報を収集している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−252614号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、ブロードキャスト方式で端末装置から監視情報を収集する場合のように、障害が発生した端末装置と障害が発生していない端末装置とから同じ監視情報を収集しても、収集した監視情報は障害の解析材料として役立ち難い。また、サーバ装置に対する監視情報に基づかなければ、検出されない端末装置の障害がある。
【0005】
本発明は斯かる事情に鑑みてなされたものである。その目的は、端末装置の障害解析に有用な情報を取得することができる監視装置、監視方法、プログラム及び監視システムを提供することである。
【課題を解決するための手段】
【0006】
本願による開示の一観点は、サーバ装置と通信する端末装置を監視する監視装置において、前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部とを備える。
【発明の効果】
【0007】
本願による開示の一観点によれば、端末装置の障害解析に有用な情報を取得することができる。
【図面の簡単な説明】
【0008】
【図1】監視システムの構成例を示す模式図である。
【図2】監視システムのハードウェア構成例を示すブロック図である。
【図3】監視装置の機能構成例を示す機能ブロック図である。
【図4】監視画面のレイアウト例を示す説明図である。
【図5】監視詳細画面のレイアウト例を示す説明図である。
【図6】障害端末に対する監視処理の一例の手順を示すフローチャートである。
【図7】障害端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図8】障害端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図9】利用端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図10】未使用端末に対する割り込み処理の一例の手順を示すフローチャートである。
【図11】監視システムの構成例を示す模式図である。
【図12】監視システムのハードウェア構成例を示すブロック図である。
【図13】サーバ監視装置及び端末監視装置の機能構成例を示す機能ブロック図である。
【発明を実施するための形態】
【0009】
以下、実施の形態をその図面に基づいて説明する。
なお、本発明は、以下の実施の形態に限定されるものではない。
【0010】
実施の形態1
図1は、監視システム100の構成例を示す模式図である。監視システム100は、端末装置1、サーバ装置2及び監視装置3を含む。端末装置1、サーバ装置2及び監視装置3は、LAN(Local Area Network)、インターネット等のネットワークNを介して接続されている。図1では、3台の端末装置1がネットワークNに接続された例を示している。ネットワークNに接続される端末装置1の台数は3台に限られず、これより多くても少なくてもよいことは勿論である。
【0011】
端末装置1は、例えばPC(パーソナルコンピュータ)、ノートPC、PDA(Personal Digital Assistant)、製造装置、測定装置、券売機等に接続されたコンピュータ等の端末である。端末装置1には、業務アプリケーション(以下、アプリケーションと呼ぶ)がインストールされている。ユーザは端末装置1からサーバ装置2にログインする。
サーバ装置2は、PC、ワークステーション等のDB(データベース)サーバであり、端末装置1が利用する各種のテーブルを有する。端末装置1のアプリケーションは、ユーザの操作に基づき、各種のSQL(Structured Query Language)文を生成し、サーバ装置2に送信する。サーバ装置2は、端末装置1から受け付けたSQL文を実行し、各種テーブルに対して操作をする。サーバ装置2は、検索したレコード、テーブルに対する操作結果等を端末装置1に送信する。
【0012】
監視装置3は、例えばPC、ワークステーション等であり、端末装置1及びサーバ装置2の稼働状況を監視する。また、監視装置3は、端末装置1のアプリケーションによる処理内容、処理結果及びサーバ装置2が実行するDB操作も監視する。
【0013】
図2は、監視システム100のハードウェア構成例を示すブロック図である。
端末装置1は、制御部11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、HDD(Hard Disk Drive)14、操作部15、通信部16及び計時部17を含む。端末装置1のハードウェア各部は、バス1bを介して相互に接続されている。制御部11は、CPU(Central Processing Unit)又はMPU(Micro Processor Unit)であり、端末装置1のハードウェア各部を制御する。制御部11は、HDD14に記録されたアプリケーションのプログラム1PをRAM13にロードし、プログラム1Pを実行する。
【0014】
ROM12は、端末装置1の起動時に制御部11が実行するBIOS(Basic Input/Output System)等を記録している。RAM13は、SRAM(Static RAM)、フラッシュメモリ等であり、制御部11によるプログラム1Pの実行時に発生する各種のデータを一時的に記録する。
HDD14は、大容量の記録部であり、プログラム1Pが記録されている。また、HDD14には、図示しないエージェントがインストールされている。エージェントは、監視装置3から要求された情報を端末装置1から収集し、収集した情報を監視装置3に送信するプログラムである。エージェントは、端末装置1の起動時に実行を開始し、常駐するプログラムである。
操作部15は、ユーザが端末装置1を操作するためのキーボード、マウス、ディスプレイ等を含む。通信部16は、ネットワークNに接続するためのネットワークインタフェースであり、例えばモデム、LANカード等である。計時部17は、日時を計時し、計時した日時を制御部11に出力する。
【0015】
サーバ装置2は、制御部21、ROM22、RAM23、HDD24、操作部25、通信部26及び計時部27を含む。サーバ装置2のハードウェア各部は、バス2bを介して相互に接続されている。制御部21は、CPU又はMPUであり、サーバ装置2のハードウェア各部を制御する。制御部21は、HDD24に記録されたプログラム2PをRAM23にロードし、プログラム2Pを実行する。プログラム2Pは、例えば各種テーブル群からなるDBを操作するプログラム2Pである。
【0016】
ROM22は、サーバ装置2の起動時に制御部21が実行するBIOS等を記録している。RAM23は、SRAM、フラッシュメモリ等であり、制御部21によるプログラム2Pの実行時に発生する各種のデータを一時的に記録する。
HDD24は、大容量の記録部であり、端末装置1のアプリケーション1Pが利用する図示しないDBを記録している。また、HDD24は、図示しないジャーナルファイルを記録する。ジャーナルファイルは、DBのトランザクションログに該当する。監視装置3は、ジャーナルファイルを参照することにより、サーバ装置2が実行したトランザクションの履歴を取得することができる。
HDD24は、例えば利用者テーブル1T及び端末テーブル2Tを記録している。利用者テーブル1Tは、サーバ装置2に対する端末装置1のログイン情報を管理するテーブルである。端末テーブル2Tは、当該業務システムを利用することができる端末装置1を管理するテーブルである。
操作部25は、ユーザがサーバ装置2を操作するためのキーボード、マウス、ディスプレイ等を含む。通信部26は、ネットワークNに接続するためのネットワークインタフェースである。計時部27は、日時を計時し、計時した日時を制御部21に出力する。
【0017】
監視装置3は、制御部31、ROM32、RAM33、HDD34、ディスクドライブ35、操作部36、通信部37、表示部38及び計時部39を含む。監視装置3のハードウェア各部は、バス3bを介して相互に接続されている。
制御部31は、監視装置3のハードウェア各部を制御する。制御部31は、HDD34に記録されたプログラム3P、4PをRAM33にロードし、プログラム3P、4Pを実行する。
【0018】
ROM32は、監視装置3の起動時に制御部31が実行するBIOS等を記録している。RAM33は、例えばSRAM、DRAM(Dynamic RAM)等であり、制御部31が実行する処理の過程で必要な作業変数、データ等を一時的に記録する。なお、RAM33は主記憶装置の一例であり、RAM33の代わりにフラッシュメモリ、メモリカード等が用いられてもよい。
【0019】
HDD34は、制御部31が実行するプログラム3P、4Pを記録している。プログラム3Pはサーバ装置2の監視に係り、プログラム4Pは端末装置1の監視に係る。そのため、プログラム3P及び4Pを夫々異なるコンピュータにインストールすることにより、監視装置3は、サーバ装置2を監視する装置と端末装置1を監視する装置とに分けられてもよい。
なお、HDD34は、監視装置3の内部に取り付けられるものであっても、監視装置3の外部に置かれるものであってもよい。また、HDD34は補助記憶装置の一例であり、大容量の情報の記録が可能なフラッシュメモリ、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc、登録商標)等の光ディスク1aで代替してもよい。
【0020】
ディスクドライブ35は、外部の記録媒体であるCD、DVD、BD等の光ディスク1aから情報を読み込み、光ディスク1aに情報を記録する。
【0021】
操作部36は、ユーザが各種の入力を行うキーボード、マウス、電源スイッチ、ディスクドライブ35から光ディスク1aを排出するための操作ボタン等の入力デバイスを含む。操作部36は、ユーザによる操作に基づいて入力信号を生成する。生成された入力信号は、バス3bを介して制御部31に送信される。
【0022】
通信部37は、ネットワークNに接続するためのネットワークインタフェースである。通信部37は、例えば有線又は無線通信のモデム又はLANカード等である。なお、通信部37は、電話回線と接続することができてもよい。
【0023】
表示部38は、例えば液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の画面を有し、制御部31からの指示に従って、プログラム3P、4Pに係る各種情報を表示する。
なお、プログラム3P、4Pの実行結果を出力する出力手段は、表示部38だけに限らない。例えば、出力手段は監視装置3に接続されたプリンタでもよい。あるいは、プログラム3P、4Pの実行結果は、通信部37を介して、外部の装置に出力されてもよい。
計時部39は、日時を計時し、計時した日時を制御部31に出力する。
【0024】
次に、監視装置3の機能について説明する。
監視装置3は、サーバ装置2から障害端末情報を検出する。障害端末情報は、端末装置1、ネットワークN等に何らかの障害が発生し、その障害の影響がサーバ装置2の処理に及ぶことにより、サーバ装置2が出力するジャーナルファイルから取得される情報である。監視装置3は、検出した障害端末情報に係る端末装置1に対して監視頻度、監視項目等を選択し、監視を実施する。また、監視装置3は、サーバ装置2のHDD24に記録された利用者テーブル1T及び端末テーブル2Tを利用し、障害端末情報と関係しない端末装置1の監視も実施する。
【0025】
図3は、監視装置3の機能構成例を示す機能ブロック図である。図3の各機能部は、制御部31がHDD34に記録されたプログラム3P、4Pに基づいて動作することにより実行される。なお、サーバ装置送受信部31g、端末装置送受信部31hは、制御部31が通信部37と協働して実現する機能である。
サーバ装置送受信部31gは、サーバ装置2と各種データの送受信をする。端末装置送受信部31hは、端末装置1と各種データの送受信を行う。
【0026】
検出部31aは、サーバ装置送受信部31gを介して、サーバ装置2から各種の監視情報を取得する。例えば、検出部31aは、サーバ装置2から利用者テーブル1T及び端末テーブル2Tに記録されたレコードを取得する。利用者テーブル1Tは、サーバ装置2にログインしているユーザ名及び端末装置1のIP(Internet Protocol)アドレスの一覧を記録するテーブルである。端末テーブル2Tは、監視装置3が監視対象としている業務システムを利用することができる端末装置1のIPアドレス1の一覧を記録するテーブルである。
【0027】
検出部31aは、DBに未処理レコードを発生させた命令をサーバ装置2に送信した端末装置1のIPアドレスを取得する。未処理レコードとは、サーバ装置2においてトランザクション処理が正常に終了していないレコードのことである。
【0028】
例えば、所定のレコード10件を所定のテーブルに新規挿入した後、当該テーブルのあるフィールドに格納されたフラグを業務ロジックに従って更新するトランザクション処理命令が、端末装置1からサーバ装置2へ送信されたとする。かかる場合、サーバ装置2は所定のレコードの新規挿入には成功したものの、フラグの更新指示を5件のレコードについてのみ受信したとする。そうしたとき、10件の新規レコードのうち、5件のレコードについてはフラグ更新処理が完了するが、残り5件のレコードについてはフラグ更新が実行されない。この残りの5件のレコードは、未処理レコードとしてテーブルに残る。また、ジャーナルファイルには、10件のレコードが正常に新規挿入されたことと、5件のレコードがフラグ更新されたことが記録される。
【0029】
検出部31aは、サーバ装置2のジャーナルファイルを監視し、未処理レコードを発見した場合、未処理レコードに関するトランザクション処理命令を送信した端末装置1のIPアドレスを取得する。なお、検出部31aは、未処理レコードを特定する情報及びそのトランザクションの内容を取得してもよい。
【0030】
未処理レコードが発生する原因として、端末装置1のハードウェアの不具合、端末装置1にインストールされたプログラム1Pの不具合、ネットワークNの混雑等が考えられる。そこで、監視装置3は、未処理レコードを発生させた端末装置1の監視項目を増やし、監視時間間隔を短くすることで、障害解消のための情報をより多く収集する。他方、監視装置3は、障害が発生していない端末装置1に対しては、監視項目を減らし、監視時間間隔を長く設定する。これにより、ネットワークN全体のトラフィック量を低減することができる。
【0031】
検出部31aがサーバ装置2を監視する項目には、未処理レコードの他に、長時間検索と排他とがある。長時間検索とは、サーバ装置2が長時間、検索処理を実行している状態のことである。排他とは、例えばテーブル又はレコードのロック処理が行われた後、ロック解除が行われていない状態のことである。
【0032】
長時間検索の原因として、端末装置1にインストールされたプログラム1Pの不具合の他に、検索装置1からサーバ装置2に送信されるSQL文が複雑である場合がある。例えば、where句が入れ子になっており、DBの検索エンジンに多大な負荷がかかる場合、長時間検索に陥る可能性がある。あるいは、from句が副問合せを持ち、ビューをテーブル名の代わりに用いる場合も、DBの検索エンジンに多大な負荷がかかる。
検出部31aは、サーバ装置2が有するDBのパフォーマンス解析機能を利用し、長時間検索を監視する。そして、検出部31aは、長時間検索を発見した場合、その検索命令をサーバ装置2に送信した端末装置1のIPアドレス及び長時間検索の対象テーブル名を取得する。また、検出部31aは、長時間検索に係るSQL文、DBコマンド等を取得する。
【0033】
排他が生じる原因として、未処理レコードの発生原因と同じ原因が考えられる。通常、端末装置1はサーバ装置2にトランザクションを実行させる場合、サーバ装置2が有するテーブル又はレコードにロックをかけ、他の端末装置1が同じテーブル又はレコードにアクセスできないようにする。これは、データの整合性が失われないようにするためである。トランザクションが終了した場合、端末装置1は、サーバ装置2にcommit又はroolbackのコマンドを送信した後、サーバ装置2にロック解除の命令を送信する。しかし、端末装置1、ネットワークN等に何らかの障害が発生し、サーバ装置2がロック解除の命令を受信しない場合、サーバ装置2は排他の状態を維持する。
検出部31aは、例えばDB管理プログラムから排他の状態であることを検出した場合、排他命令をサーバ装置2に送信した端末装置1のIPアドレス、排他の対象テーブル名、排他の対象レコードを特定する情報等を取得する。
【0034】
上述の未処理レコード、長時間検索又は排他に関する情報と、これらに関する端末装置1のIPアドレスと、障害発生時刻とが、障害端末情報である。例えば、端末装置1にインストールされたプログラム1Pの不具合に起因する障害端末情報は、端末装置1を監視しても得られない情報である。
【0035】
なお、検出部31aがサーバ装置2から障害端末情報を検出するために、検出部31aは常にサーバ装置2を監視する。しかし、サーバ装置2が障害端末情報を検出した場合、サーバ装置2が監視装置3に所定の信号又は電文等を送信してもよい。監視装置3は、所定の信号又は電文等の受信をトリガーにして、サーバ装置2から障害端末情報を取得してもよい。
また、端末テーブル2Tは、監視装置3のHDD34に記録されていてもよい。かかる場合、検出部31aは、サーバ装置2から端末テーブル2Tのレコードを取得する必要はなく、HDD34から端末テーブル2Tのレコードを取得する。
【0036】
検出部31aは、障害端末情報の他に、サーバ装置2のOS(Operating System)からHDD24の使用率又は未使用率を所定時間間隔で取得する。また、検出部31aは、サーバ装置2のOSからサーバ装置2のRAM23の使用率又は未使用率を所定時間間隔で取得する。なお、HDD24、RAM23等の記録手段に対する監視情報は、記憶容量の率ではなく、使用されている記憶容量の値でもよい。
【0037】
特定部31bは、検出部31aが取得した障害端末情報、利用者テーブル1T及び端末テーブル2Tのレコードに基づいて、障害端末、利用端末(他の端末装置)及び未使用端末(更に他の端末装置)を特定する。
障害端末は、障害端末情報に示されたIPアドレスに対応する端末装置1である。
利用端末は、利用者テーブル1TのIPアドレスから障害端末のIPアドレスを除いた、残りのIPアドレスに対応する端末装置1である。
未使用端末は、端末テーブル2TのIPアドレスから利用者テーブル1TのIPアドレスを除いた、更に残りのIPアドレスに対応する端末装置1である。なお、未使用端末は、端末テーブル2TのIPアドレスから障害端末及び利用端末のIPアドレスを除いた、更に残りのIPアドレスに対応する端末装置1としてもよい。
【0038】
一覧生成部31cは、障害端末一覧、利用端末一覧及び未使用端末一覧を生成し、RAM33に記録する。
障害端末一覧は、特定部31bが特定した障害端末のIPアドレスと障害発生時刻とを記録したファイルである。
利用端末一覧は、特定部31bが特定した利用端末のIPアドレスを記録したファイルである。つまり、利用端末一覧は、サーバ装置2にログインしており、障害が発生していない端末装置1のリストである。なお、利用端末一覧には、ログイン中のユーザ名が記録されてもよい。
未使用端末一覧は、特定部31bが特定した未使用端末のIPアドレスを記録したファイルである。つまり、未使用端末一覧は、監視対象としている業務システムを利用することができる端末装置1のうち、サーバ装置2にログインしていない端末装置1のリストである。なお、未使用端末一覧は、端末テーブル2TのIPアドレスから障害端末及び利用端末のIPアドレスを除いた、残りのIPアドレスを記録したファイルでもよい。
【0039】
要求部31dは、特定部31bが障害端末を特定した場合、即座に該当する障害端末のエージェントに対して、監視情報の収集及び送信を要求する。この監視情報は、例えばHDD14の使用率、RAM13の使用率、アプリケーションの起動状況及びアプリケーションが出力したログ(以下では、アプリケーションログという)の内容である。
【0040】
要求部31dは、一覧生成部31cが生成した障害端末一覧、利用端末一覧及び未使用端末一覧に基づいて、端末装置1のエージェントに対して監視情報の収集及び送信を要求する。その際、監視情報を要求する時間間隔を端末装置1毎に選択する。例えば、この時間間隔は、障害端末に対しては5分間隔、利用端末に対しては30分間隔から60分間隔、未使用端末に対しては3時間間隔から4時間間隔である。
【0041】
また、要求部31dは、一覧生成部31cが生成した障害端末一覧、利用端末一覧及び未使用端末一覧に基づいて、端末装置1に対して要求する監視情報の内容を選択する。
例えば、要求部31dが障害端末のエージェントに対して要求する監視情報は、HDD14の使用率、RAM13の使用率、アプリケーションの起動状況及びアプリケーションログの内容である。ここでは、HDD14の容量に関する情報は、HDD14の使用率若しくは未使用率のいずれか一方又は両方と、HDD14の記憶容量とを含んでもよい。同様に、RAM13の容量に関する情報は、RAM13の使用率若しくは未使用率のいずれか一方又は両方と、RAM13の記憶容量とを含んでもよい。
端末装置1のエージェントは、OSからHDD14の容量、RAM13の容量に関する情報を取得する。端末装置1のエージェントは、アプリケーションログからアプリケーションの処理内容及び処理結果を取得する。
【0042】
例えば、要求部31dが利用端末のエージェントに対して要求する監視情報は、HDD14の使用率、RAM13の使用率及びアプリケーションの起動状況である。
例えば、要求部31dが未使用端末のエージェントに対して要求する監視情報は、HDD14の使用率及びRAM13の使用率である。
障害端末、利用端末又は未使用端末のエージェントは、要求されたこれらの監視情報を収集し、監視装置3に送信する。
【0043】
取得部31eは、端末装置送受信部31hを介して、端末装置1のエージェントから、要求部31が要求した各種の監視情報を取得する。取得部31eは、取得した監視情報をRAM33又はHDD34に記録する。
画面表示部31fは、取得部31eが取得した各種の監視情報を表示部38に表示する。
【0044】
図3では、サーバ装置送受信部31gと端末装置送受信部31hとは、別の機能部として示している。しかし、サーバ装置送受信部31gと端末装置送受信部31hとは一つの送受信部にまとめられてもよい。
【0045】
次に、監視装置3の動作について説明する。
以下、障害端末、利用端末及び未使用端末の順に、これらの端末装置1を監視する監視装置3の動作について説明する。
監視装置3は、障害端末が発生した場合、障害端末のIPアドレス、障害内容及び障害発生時刻を取得する。障害内容は、未処理レコード、長時間検索又は排他である。監視装置3は、取得したIPアドレスの障害端末のエージェントに対して、HDD14の使用率、RAM13の使用率、アプリケーションの起動状況及びアプリケーションログの収集を要求する。障害端末のエージェントは、監視装置3から要求された監視情報を収集し、収集した監視情報を監視装置3に送信する。
【0046】
監視装置3は、障害端末のエージェントから、収集された監視情報を受信し、受信した監視情報をRAM33又はHDD34に記録する。
監視装置3は、表示部38に障害端末のIPアドレスと障害内容とを示す監視画面を表示する。
【0047】
図4は、監視画面のレイアウト例を示す説明図である。監視画面は、日付、時間、管理名称、監視対象、IPアドレス及び内容の各項目を含む。日付及び時間は、監視装置3が監視情報を取得した日時である。管理名称は、端末監視又はDB監視である。監視対象は、端末装置1又はサーバ装置2の名称である。IPアドレスは、監視対象である端末装置1又はサーバ装置2のIPアドレスである。内容は、障害端末の場合、未処理レコード、長時間検索又は排他である。図4の例では、2行目のA端末について長時間検索が表示されている。なお、利用端末の場合、内容はログイン中の利用者名である。未使用端末の場合、内容は「利用可能な端末です。」というメッセージである。
監視画面のIPアドレスのいずれかの値がクリックされた場合、監視装置3はクリックされたIPアドレスに対応する端末装置1のエージェントから受信した監視情報を表示部38に表示する。端末装置1のエージェントから受信した監視情報は、監視詳細画面として表示される。
【0048】
図5は、監視詳細画面のレイアウト例を示す説明図である。監視詳細画面は、監視名及び内容の各項目を含む。監視名は、HDD14の容量に関するDISK使用率、RAM13の容量に関するメモリ使用率、アプリケーションの起動状況に関するダウンプログラム及びアプリケーションログである。内容は、監視名に対応する具体的な監視情報である。例えば、DISK使用率に対応する内容は、HDD14の各ハードディスクドライブの使用率である。メモリ使用率に対応する内容は、RAM13の使用率である。ダウンプログラムに対応する内容は、ダウンしたアプリケーションのプログラム名である。アプリケーションログに対応する内容は、アプリケーションが出力したログの内容である。例えば、障害が長時間検索である場合、アプリケーションログの内容は端末装置1からサーバ装置2に送信されたSQL文が含まれる。
【0049】
監視装置3は、障害端末一覧に障害端末のIPアドレスと障害発生時刻とを記録する。新たに障害端末情報を受信し、受信した障害端末情報に含まれるIPアドレスが既に障害端末一覧に記録されている場合、監視装置3は障害端末一覧に記録された障害発生時刻を更新する。
【0050】
監視装置3は、障害端末のエージェントに対して、アプリケーションログの収集レベルに高めるように指令する。高められた収集レベルのアプリケーションログの内容は、例えばアプリケーションによる個々の業務処理に対する成功又は失敗の記録を含む。また、高められた収集レベルのアプリケーションログの内容は、例えばユーザが行ったアプリケーションに対する操作内容、サーバ装置2に送信したSQL文、サーバ装置2に送信したDBコマンド等を含む。あるいは、より詳細なアプリケーションログの内容は、障害端末における全実行履歴(トレース)であってもよい。
【0051】
なお、監視装置3は、障害内容である未処理レコード、長時間検索又は排他の違いによって、障害端末のエージェントに対して要求するアプリケーションログの収集内容を変えてもよい。例えば、監視装置3は、障害が未処理レコードである場合、アプリケーションによる個々の処理に対する失敗の記録の収集及び送信を障害端末のエージェントに要求する。監視装置3は、障害が長時間検索である場合、障害端末がサーバ装置2に送信したSQL文の収集及び返信を障害端末のエージェントに要求する。監視装置3は、障害が排他である場合、サーバ装置2に送信したDBコマンドの収集及び返信を障害端末のエージェントに要求する。
【0052】
障害端末のエージェントは、2回目以降の監視情報を監視装置3に送信する場合、前回送信済みのアプリケーションログからの増加分、すなわち差分のみを監視装置3に送信する。これにより、ネットワークNの無用な混雑を増大させないようにすることができる。
【0053】
図6は、障害端末に対する監視処理の一例の手順を示すフローチャートである。
制御部31は、サーバ装置2から障害端末情報を取得したか否か判定する(ステップS101)。制御部31は、サーバ装置2から障害端末情報を取得していないと判定した場合(ステップS101:NO)、処理を終了する。制御部31は、サーバ装置2から障害端末情報を取得したと判定した場合(ステップS101:YES)、IPアドレスに基づいて障害端末を特定する(ステップS102)。制御部31は、特定した障害端末に監視情報の収集及び送信を要求する(ステップS103)。
【0054】
障害端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS104)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS105)。
【0055】
制御部31は、監視情報を受信し、障害端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示する(ステップS106)。ステップS106において、制御部31は監視情報をRAM33又はHDD34に記録する処理も実行する。RAM33又はHDD34に記録された監視情報は、ユーザからの要求に応じて、表示部38に表示される。制御部31は、受信した監視情報を障害端末一覧に記録又は更新する(ステップS107)。
【0056】
制御部31は、障害端末にアプリケーションログの収集レベルを高める指令を送信する(ステップS108)。制御部11は、監視装置3からの指令を受け付け、アプリケーションログの収集レベルを高め(ステップS109)、処理を終了する。
【0057】
監視装置3は、例えば5分以内に再び障害端末情報をサーバ装置2から取得した場合、図6に示した監視処理を再び実行する。一方、監視装置3は、5分以内に再び障害端末情報をサーバ装置2から受信しない場合、次の割り込み処理を例えば5分間隔で予め設定された所定時間継続して実行する。
【0058】
監視装置3は、障害端末のエージェントに対し、上述の監視情報の収集及び送信を要求する。監視装置3は、受信した監視情報をRAM33又はHDD34に記録する。この記録は、アプリケーションログに関しては、差分の追加記録である。監視装置3は、RAM33又はHDD34に記録した監視情報を表示部38に表示する。
監視装置3は、計時部39の計時に基づいて、現在時刻が障害端末一覧に記録された障害発生時刻から予め設定された所定時間以内の時刻である場合、次の割り込み処理まで待機する。
一方、監視装置3は、計時部39の計時に基づいて、現在時刻が障害端末一覧に記録された障害発生時刻から予め設定された所定時間以上経過した時刻である場合、当該障害端末の情報を障害端末一覧から削除する。監視装置3は、障害端末のエージェントに対して、監視情報の収集を通常モードに変更する指令を送信する。通常モードの監視情報とは、HDD14の使用率、RAM13の使用率及びアプリケーションの起動状況であり、アプリケーションログは通常モードの監視情報に含まれない。障害端末のエージェントは、監視装置3から上記指令を受信した場合、監視情報の収集を通常モードに変更する。以後、監視装置3にとって、当該障害端末は利用端末に変わる。
【0059】
図7及び図8は、障害端末に対する割り込み処理の一例の手順を示すフローチャートである。
制御部31は、計時部39の計時に基づいて、割り込み処理を開始する(ステップS201)。制御部31は、RAM33上の障害端末一覧を参照し、障害端末があるか否か判定する(ステップS202)。制御部31は、RAM33上の障害端末一覧を参照し、障害端末がない判定と判定した場合(ステップS202:NO)、処理を終了する。制御部31は、RAM33上の障害端末一覧を参照し、障害端末があると判定した場合(ステップS202:YES)、障害端末に監視情報の収集及び送信を要求する(ステップS203)。ステップS203では、障害端末が少なくとも1台ある場合、制御部31は障害端末に監視情報の収集及び送信を要求する。障害端末が複数ある場合、制御部31はステップS203以後のステップ処理を障害端末の数だけ同様に実施する。
【0060】
障害端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS204)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS205)。
【0061】
制御部31は、監視情報をRAM33又はHDD34に記録する(ステップS206)。制御部31は、RAM33上の障害端末一覧を参照し、計時部39の計時に基づいて障害発生時刻は所定時間より前か否か判定する(ステップS207)。制御部31は、RAM33上の障害端末一覧を参照し、計時部39の計時に基づいて障害発生時刻が所定時間より前でないと判定した場合(ステップS207:NO)、処理を終了する。制御部31は、RAM33上の障害端末一覧を参照し、計時部39の計時に基づいて障害発生時刻が所定時間より前であると判定した場合(ステップS207:YES)、当該障害端末に関する情報を障害端末一覧から削除する(ステップS208)。
【0062】
制御部31は、監視情報の収集を通常モードに変更する指令を障害端末に送信する(ステップS209)。制御部11は、監視装置3からの指令を受け付け、監視情報の収集レベルを通常モードに変更し(ステップS210)、処理を終了する。
【0063】
次に、利用端末を監視する監視装置3の動作について説明する。
監視装置3は、利用端末のエージェントに対して以下の割り込み処理を例えば30分間隔で実行する。この監視時間間隔は、障害端末の監視時間間隔よりも長い時間に設定する。
監視装置3は、利用端末一覧の更新をする。すなわち、監視装置3は、サーバ装置2から最新の利用者テーブル1Tの情報を取得し、取得した利用者テーブルの端末装置1からRAM33に記録されている最新の障害端末一覧の端末装置1を除く。端末装置3は、更新した利用端末一覧に基づいて、利用端末の監視処理を実行する。
【0064】
監視装置3は、利用端末のエージェントに対し、監視情報の収集及び送信を要求する。利用端末のエージェントに対して要求する監視情報は、例えばHDD14の使用率、RAM13の使用率及びアプリケーションの起動状況である。監視装置3は、受信した監視情報をRAM33又はHDD34に記録する。
【0065】
監視装置3は、取得した監視情報に基づいて、利用端末の障害を判定する。当該判定は例えば、HDD14の使用率が予め設定した値を超えていないか、RAM13の使用率が予め設定した値を超えていないか、又は停止しているアプリケーションがないかということである。監視装置3は、利用端末に障害がないと判定した場合、次の割り込み処理まで待機する。
一方、監視装置3は、利用端末に障害があると判定した場合、障害が発生した利用端末のIPアドレスと障害内容とを表示部38に表示し、ユーザに注意を喚起する。
【0066】
図9は、利用端末に対する割り込み処理の一例の手順を示すフローチャートである。
制御部31は、計時部39の計時に基づいて、割り込み処理を開始する(ステップS301)。制御部31は、RAM33上の利用端末一覧を更新する(ステップS302)。ステップS302において、制御部31は利用端末を特定していることになる。制御部31は、利用端末一覧を参照し、夫々の利用端末について以下のステップ処理を実行する。
【0067】
制御部31は、RAM33上の利用端末一覧を参照し、利用端末に監視情報の収集及び送信を要求する(ステップS303)。利用端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS304)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS305)。
【0068】
制御部31は、監視情報をRAM33又はHDD34に記録する(ステップS306)。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、利用端末に障害があるか否か判定する(ステップS307)。ステップS307において、HDD14の使用率が所定値以上である場合、RAM13の使用率が所定値以上である場合又は停止しているアプリケーションがある場合、制御部31は利用端末に障害があると判定する。
【0069】
制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、利用端末に障害がないと判定した場合(ステップS307:NO)、処理を終了する。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、利用端末に障害があると判定した場合(ステップS307:YES)、当該利用端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示し(ステップS308)、処理を終了する。
【0070】
次に、未使用端末を監視する監視装置3の動作について説明する。
監視装置3は、未使用端末のエージェントに対して以下の割り込み処理を例えば3時間間隔で実行する。この監視時間間隔は、利用端末の監視時間間隔よりもさらに長い時間に設定する。
監視装置3は、未使用端末一覧の更新をする。すなわち、監視装置3は、サーバ装置2から最新の利用者テーブル1T及び端末テーブル2Tの情報を取得し、業務システムを利用することが可能な端末装置1からサーバ装置2にログインしている端末装置1を除く。端末装置3は、更新した未使用端末一覧に基づいて、未使用端末の監視処理を実行する。
【0071】
監視装置3は、未使用端末のエージェントに対し、監視情報の収集及び送信を要求する。利用端末のエージェントに対して要求する監視情報は、例えばHDD14の使用率及びRAM13の使用率である。未使用端末の監視情報には、アプリケーションの起動状況は含まれない。これにより、ネットワークNを移動するデータ量を低減することができる。また、未使用端末はサーバ装置2のDBを利用していないので、業務に関するアプリケーションの起動状況を監視しなくても、業務システムにとって格段の不利益は生じない。
監視装置3は、未使用端末から監視情報を受信し、受信した監視情報をRAM33又はHDD34に記録する。
【0072】
監視装置3は、取得した監視情報に基づいて、未使用端末の障害を判定する。当該判定は例えば、HDD14の使用率が予め設定した値を超えていないか、又はRAM13の使用率が予め設定した値を超えていないかということである。監視装置3は、未使用端末に障害がないと判定した場合、次の割り込み処理まで待機する。
一方、監視装置3は、未使用端末に障害があると判定した場合、障害が発生した未使用端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示し、ユーザに注意を喚起する。
【0073】
図10は、未使用端末に対する割り込み処理の一例の手順を示すフローチャートである。
制御部31は、計時部39の計時に基づいて、割り込み処理を開始する(ステップS401)。制御部31は、利用者テーブル1T及び端末テーブル2Tのレコードに基づいて、RAM33上の未使用端末一覧を更新する(ステップS402)。ステップS402において、制御部31は未使用端末を特定していることになる。制御部31は、未使用端末一覧を参照し、夫々の未使用端末について以下のステップ処理を実行する。
【0074】
制御部31は、RAM33上の未使用端末一覧を参照し、未使用端末に監視情報の収集及び送信を要求する(ステップS403)。未使用端末の制御部11は、監視装置3から要求を受信し、要求された監視情報を収集する(ステップS404)。制御部11は、収集した監視情報を監視装置3に送信する(ステップS405)。
【0075】
制御部31は、監視情報をRAM33又はHDD34に記録する(ステップS406)。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、未使用端末に障害があるか否か判定する(ステップS407)。ステップS407において、HDD14の使用率が所定値以上である場合、又はRAM13の利用率が所定値以上である場合、制御部31は未使用端末に障害があると判定する。
【0076】
制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、未使用端末に障害がないと判定した場合(ステップS407:NO)、処理を終了する。制御部31は、RAM33又はHDD34に記録した監視情報に基づいて、未使用端末に障害があると判定した場合(ステップS407:YES)、当該未使用端末のIPアドレス、障害内容及び障害発生時刻を表示部38に表示し(ステップS408)、処理を終了する。
【0077】
監視装置3によれば、ブロードキャスト方式で一律かつ一斉に全ての端末装置1から監視情報を収集する場合に比べて、端末装置1の障害解析に有用な情報を障害端末から集中的に取得することができる。
サーバ装置2に未処理レコードを発生させる命令、サーバ装置2の状態を長時間検索又は排他の状態にする命令を、サーバ装置2に送信した端末装置1には、何らかの障害が発生した可能性がある。監視装置3によれば、そのような障害の発生の有無、及びサーバ装置2へのログインの有無により、端末装置1を障害端末、利用端末及び未使用端末に分ける。そして、監視装置3は、障害端末、利用端末及び未使用端末の間で、監視内容及び監視間隔を変更する。これにより、監視装置3は各端末毎に効率よく監視情報を収集することができる。
【0078】
一方、監視装置3は、ネットワークNの負荷を低減することができる。障害端末が発生する確率は、業務システム毎に概ね一定である。そのため、ブロードキャスト方式で一律かつ一斉に全ての端末装置1から監視情報を収集する場合に比べて、端末装置1の障害状況及びネットワークNへの接続状況に応じて監視内容及び監視間隔を分散させる方が、ネットワークの負荷分散に資する。
【0079】
利用者テーブル1T及び端末テーブル2Tにおいて、端末装置1を特定する識別情報としてIPアドレスを挙げた。しかし、端末装置1を特定する識別情報は、IPアドレスに限らない。例えば、端末装置1を特定する識別情報は、端末装置1の通信部16に割り当てられるMACアドレス(Media Access Control address)であってもよい。
【0080】
実施の形態2
実施の形態2は、監視装置3をサーバ監視装置と端末監視装置とに分けた形態に関する。
図11は、監視システム200の構成例を示す模式図である。監視システム200は、端末装置1、サーバ装置2、サーバ監視装置4及び端末監視装置5を含む。ネットワークNに接続されたサーバ監視装置4及び端末監視装置5は、夫々サーバ装置2及び端末装置1を監視する。
【0081】
図12は、監視システム200のハードウェア構成例を示すブロック図である。図12の端末装置1及びサーバ装置2のハードウェア構成は、夫々図2の端末装置1及びサーバ装置2のハードウェア構成と同じであるため、省略されている。サーバ監視装置4及び端末監視装置5のハードウェア構成は、図2の監視装置3のハードウェア構成と同じである。ただし、サーバ監視装置4の通信部47は、サーバ装置2の通信部26と通信する。また、端末監視装置5の通信部57は、端末装置1の通信部16と通信する。また、サーバ監視装置4の通信部47は、端末監視装置5の通信部57とも通信する。
【0082】
サーバ監視装置4のHDD44は、制御部41が実行するプログラム30Pを記録している。プログラム30Pは、監視装置3のHDD34にインストールされているプログラム3Pに類似する。プログラム30Pは、サーバ装置2を監視する機能と、検出したサーバ装置2における障害端末情報を端末監視装置5に送信する機能とを有している。また、プログラム30Pは、サーバ装置2のHDD24から利用者テーブル1T及び端末テーブル2Tのレコードを取得し、取得した当該レコードを端末監視装置5に送信する機能を有している。
【0083】
端末監視装置5のHDD54は、制御部51が実行するプログラム40Pを記録している。プログラム40Pは、監視装置3のHDD34にインストールされているプログラム4Pに類似する。プログラム40Pは、サーバ監視装置4から障害端末情報と、利用者テーブル1T及び端末テーブル2Tのレコードとを受信する機能を有している。また、プログラム40Pは、受信した障害端末情報と、利用者テーブル1T及び端末テーブル2Tのレコードとに基づいて、端末装置1を監視する機能を有している。
【0084】
図13は、サーバ監視装置4及び端末監視装置5の機能構成例を示す機能ブロック図である。サーバ監視装置4は、サーバ監視部41aを有する。サーバ監視部41aは、検出部31a、サーバ装置送受信部31g及び送信部41bを含む。図13の検出部31a及びサーバ装置送受信部31gは、夫々図3の検出部31a及びサーバ装置送受信部31gと同じである。送信部41bは、検出部31aが検出した障害端末情報並びに利用者テーブル1T及び端末テーブル2Tのレコードを端末監視装置5に送信する機能を有する。
【0085】
端末監視装置5は、端末監視部51aを有する。端末監視部51aは、受信部51b、特定部31b、一覧生成部31c、要求部31d、取得部31e、画面表示部31f及び端末装置送受信部31hを含む。受信部51bは、サーバ監視装置4から障害端末情報並びに利用者テーブル1T及び端末テーブル2Tのレコードを受信する機能を有する。図13の特定部31b、一覧生成部31c、要求部31d、取得部31e、画面表示部31f及び端末装置送受信部31hは、夫々図3の特定部31b、一覧生成部31c、要求部31d、取得部31e、画面表示部31f及び端末装置送受信部31hと同じである。
【0086】
図13の例では、サーバ監視部41aから端末監視部51aに情報が送信される。しかし、サーバ監視部41a及び端末監視部51aの間で双方向に情報が送信されてもよい。かかる場合、送信部41b及び受信部51bは送受信部として機能する。
【0087】
サーバ監視装置4及び端末監視装置5の全体の動作は、監視装置3の動作と同じである。サーバ監視装置4は、サーバ装置2を監視し、障害端末情報を取得した場合、取得した障害端末情報を端末監視装置5に送信する。端末監視装置5は、サーバ監視装置4から障害端末情報を受信し、障害端末を特定する。端末監視装置5は、特定した障害端末のエージェントに監視情報の送信を要求する。その後、端末監視装置5は、定期的に障害端末のエージェントに監視情報の送信を要求する。また、端末監視装置5は障害端末一覧を作成する。
【0088】
サーバ監視装置4は、サーバ装置2から利用者テーブル1T及び端末テーブル2Tのレコードを取得し、取得したこれらのレコードを端末監視装置5に送信する。端末監視装置5は、サーバ監視装置4から利用者テーブル1T及び端末テーブル2Tのレコードを取得し、利用端末一覧及び未使用端末一覧を作成する。端末監視装置5は、利用端末一覧に基づいて利用端末のエージェントに対して定期的に監視情報の収集及び送信を要求する。ただし、その監視時間間隔は、障害端末のエージェントに対する監視時間間隔より長い。また、その監視情報の情報量は、障害端末のエージェントに対する監視情報より少ない。例えば、端末監視装置5が利用端末のエージェントに要求する監視情報は、アプリケーションの起動状況を含み、アプリケーションログを含まない。
【0089】
端末監視装置5は、未使用端末一覧に基づいて未使用端末のエージェントに対して定期的に監視情報の収集及び送信を要求する。ただし、その監視時間間隔は、利用端末のエージェントに対する監視時間間隔より長い。また、その監視情報の情報量は、利用端末のエージェントに対する監視情報より少ない。例えば、端末監視装置5が未使用端末のエージェントに要求する監視情報は、HDD14の使用率及びRAM13の使用率を含み、アプリケーションの起動状況を含まない。
【0090】
サーバ監視装置4及び端末監視装置5によれば、サーバ装置2の監視及び端末装置1の監視の役割が異なるコンピュータにより分担される。そのため、1台のコンピュータがサーバ装置2の監視及び端末装置1の監視を行う場合よりも負荷分散が実現される。端末装置1の台数又はサーバ装置2の台数が増大した場合、端末装置1及びサーバ装置2の監視を1台のコンピュータが行うよりも、複数のコンピュータで監視の役割分担を行う方が、監視処理が滞るリスクを低減することができる。また、複数のコンピュータで監視の役割分担を行う方が、個々のコンピュータの処理能力は上昇する。さらに、監視装置3をサーバ監視装置4及び端末監視装置5に分けたとしても、システムを監視する能力に差は生じず、ネットワークNを移動する情報のトラフィックはほとんど変わらない。
また、複数の業務システムを一元管理する管理センターが創設される場合、サーバ装置2と端末装置1との監視機能を容易に分離できる形態の方が、システム変更に対して柔軟な対応が可能となる。
【0091】
監視装置3を動作させるためのプログラム3P、4Pは、ディスクドライブ35に光ディスク1aを読み取らせてHDD34に記録してもよい。サーバ監視装置4、端末監視装置5を夫々動作させるためのプログラム30P、40Pについても同様に、光ディスク1aからHDD44、54に記録してもよい。
プログラム3P、4P、30P、40Pは、ネットワークNを介して接続される他の情報処理装置又は記録装置(図示せず)からダウンロードすることも可能である。あるいは、プログラム3P、4P、30P、40Pを記録したフラッシュメモリ等の半導体メモリ1cが監視装置3、サーバ監視装置4、端末監視装置5内に夫々実装されてもよい。
【0092】
実施の形態2は以上の如きであり、その他は実施の形態1と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。
【0093】
以上の実施の形態に関し、さらに以下の付記を開示する。
【0094】
(付記1)
サーバ装置と通信する端末装置を監視する監視装置において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部と
を備える監視装置。
【0095】
(付記2)
前記受信部は前記サーバ装置にログインしている端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログインしている複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置を除いた他の端末装置に対して、該他の端末装置が実行するアプリケーションの起動状態を要求する
付記1に記載の監視装置。
【0096】
(付記3)
前記受信部は前記サーバ装置にログイン可能な端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログイン可能な複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置及び前記他の端末装置を除いた更に他の端末装置に対して、該更に他の端末装置が有する記録部の容量に関する使用率又は未使用率を要求する
付記2に記載の監視装置。
【0097】
(付記4)
前記要求部は、前記第一の命令又は前記第二の命令を送信した端末装置、他の端末装置及び更に他の端末装置に対して、夫々前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を異なる時間間隔で要求する
付記3に記載の監視装置。
【0098】
(付記5)
前記要求部が要求した前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を取得する取得部
を備える付記3又は付記4に記載の監視装置。
【0099】
(付記6)
前記サーバ装置はデータベースを操作し、
前記サーバ装置を前記第一の命令又は前記第二の命令は、前記データベースを操作する命令を含む
付記1から付記5までのいずれか一つに記載の監視装置。
【0100】
(付記7)
前記データベースを操作する命令は、トランザクション、検索又は排他に関する命令を含む
付記6に記載の監視装置。
【0101】
(付記8)
前記アプリケーションの処理内容は、前記サーバ装置に送信されたSQL文、該アプリケーションに対する操作又は該アプリケーションの実行履歴を含み、
前記アプリケーションの処理結果は、該アプリケーションにより実行された処理に対する成功又は失敗の記録を含む
付記1から付記7までのいずれか一つに記載の監視装置。
【0102】
(付記9)
前記端末装置の識別情報は該端末装置のIPアドレスを含む
付記1から付記8までのいずれか一つに記載の監視装置。
【0103】
(付記10)
サーバ装置と通信する端末装置を監視する監視方法において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信し、
受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
監視方法。
【0104】
(付記11)
サーバ装置と通信する端末装置を監視する処理をコンピュータに実行させるプログラムにおいて、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報に基づいて、該端末装置を特定し、
特定した前記端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
処理をコンピュータに実行させるプログラム。
【0105】
(付記12)
端末装置を監視する端末監視装置及び該端末装置と通信するサーバ装置を監視するサーバ監視装置を含む監視システムにおいて、
前記サーバ監視装置は、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記端末装置の識別情報を前記端末監視装置に送信する送信部と
を有し、
前記端末監視装置は、
前記サーバ監視装置の送信部が送信した前記識別情報を受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行するアプリケーションの処理内容又は処理結果を要求する要求部と
を有する
監視システム。
【0106】
(付記13)
端末装置と通信するサーバ装置を監視するサーバ監視装置において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記端末装置の識別情報を外部の装置に送信する送信部と
を備えるサーバ監視装置。
【符号の説明】
【0107】
1 端末装置
13 RAM
14 HDD
2 サーバ装置
24 HDD
3 監視装置
31 制御部
31a 検出部
31b 特定部
31d 要求部
31e 取得部
31g サーバ装置送受信部
31h 端末装置送受信部
37 通信部
4 サーバ監視装置
41 制御部
41b 送信部
47 通信部
5 端末監視装置
51 制御部
51b 受信部
57 通信部
200 監視システム
4P プログラム
40P プログラム
【特許請求の範囲】
【請求項1】
サーバ装置と通信する端末装置を監視する監視装置において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部と
を備える監視装置。
【請求項2】
前記受信部は前記サーバ装置にログインしている端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログインしている複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置を除いた他の端末装置に対して、該他の端末装置が実行するアプリケーションの起動状態を要求する
請求項1に記載の監視装置。
【請求項3】
前記受信部は前記サーバ装置にログイン可能な端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログイン可能な複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置及び前記他の端末装置を除いた更に他の端末装置に対して、該更に他の端末装置が有する記録部の容量に関する使用率又は未使用率を要求する
請求項2に記載の監視装置。
【請求項4】
前記要求部は、前記第一の命令又は前記第二の命令を送信した端末装置、他の端末装置及び更に他の端末装置に対して、夫々前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を異なる時間間隔で要求する
請求項3に記載の監視装置。
【請求項5】
前記要求部が要求した前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を取得する取得部
を備える請求項3又は請求項4に記載の監視装置。
【請求項6】
サーバ装置と通信する端末装置を監視する監視方法において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信し、
受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
監視方法。
【請求項7】
サーバ装置と通信する端末装置を監視する処理をコンピュータに実行させるプログラムにおいて、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報に基づいて、該端末装置を特定し、
特定した前記端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
処理をコンピュータに実行させるプログラム。
【請求項8】
端末装置を監視する端末監視装置及び該端末装置と通信するサーバ装置を監視するサーバ監視装置を含む監視システムにおいて、
前記サーバ監視装置は、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記端末装置の識別情報を前記端末監視装置に送信する送信部と
を有し、
前記端末監視装置は、
前記サーバ監視装置の送信部が送信した前記識別情報を受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行するアプリケーションの処理内容又は処理結果を要求する要求部と
を有する
監視システム。
【請求項1】
サーバ装置と通信する端末装置を監視する監視装置において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する要求部と
を備える監視装置。
【請求項2】
前記受信部は前記サーバ装置にログインしている端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログインしている複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置を除いた他の端末装置に対して、該他の端末装置が実行するアプリケーションの起動状態を要求する
請求項1に記載の監視装置。
【請求項3】
前記受信部は前記サーバ装置にログイン可能な端末装置の識別情報を受信し、
前記要求部は、前記サーバ装置にログイン可能な複数の端末装置から該サーバ装置に前記第一の命令又は前記第二の命令を送信した端末装置及び前記他の端末装置を除いた更に他の端末装置に対して、該更に他の端末装置が有する記録部の容量に関する使用率又は未使用率を要求する
請求項2に記載の監視装置。
【請求項4】
前記要求部は、前記第一の命令又は前記第二の命令を送信した端末装置、他の端末装置及び更に他の端末装置に対して、夫々前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を異なる時間間隔で要求する
請求項3に記載の監視装置。
【請求項5】
前記要求部が要求した前記処理内容又は処理結果、起動状態、及び使用率又は未使用率を取得する取得部
を備える請求項3又は請求項4に記載の監視装置。
【請求項6】
サーバ装置と通信する端末装置を監視する監視方法において、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信し、
受信した前記識別情報に対応する端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
監視方法。
【請求項7】
サーバ装置と通信する端末装置を監視する処理をコンピュータに実行させるプログラムにおいて、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報に基づいて、該端末装置を特定し、
特定した前記端末装置に対して、該端末装置が実行したアプリケーションの処理内容又は処理結果を要求する
処理をコンピュータに実行させるプログラム。
【請求項8】
端末装置を監視する端末監視装置及び該端末装置と通信するサーバ装置を監視するサーバ監視装置を含む監視システムにおいて、
前記サーバ監視装置は、
前記サーバ装置を所定時間以上処理中若しくは待機中の状態にさせる第一の命令、又は該サーバ装置が処理すべきデータを未処理状態にさせる第二の命令を該サーバ装置へ送信した端末装置の識別情報を、該サーバ装置から受信する受信部と、
該受信部が受信した前記端末装置の識別情報を前記端末監視装置に送信する送信部と
を有し、
前記端末監視装置は、
前記サーバ監視装置の送信部が送信した前記識別情報を受信する受信部と、
該受信部が受信した前記識別情報に対応する端末装置に対して、該端末装置が実行するアプリケーションの処理内容又は処理結果を要求する要求部と
を有する
監視システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2012−186730(P2012−186730A)
【公開日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願番号】特願2011−49466(P2011−49466)
【出願日】平成23年3月7日(2011.3.7)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願日】平成23年3月7日(2011.3.7)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]