サーバ異常判定プログラム、サーバ異常判定装置、およびサーバ異常判定方法

【課題】障害の原因となっているサーバを特定すること。
【解決手段】サーバ異常判定装置は、サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶し、前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、異常のあるサーバを特定するサーバ異常判定プログラム、サーバ異常判定装置、およびサーバ異常判定方法に関する。
【背景技術】
【０００２】
インターネット上でピア・ツー・ピアで通信を行うサービスでは、音声や映像、テキスト等のメディア情報をインターネットプロトコル（IP）パケットを使ってリアルタイムに伝送するための技術が必要である。これに加えて、インターネット上でピア・ツー・ピアのセッション（呼）の確立・変更・切断（終了）を制御するためのシグナリング技術が重要である。ピア・ツー・ピア通信のサービスとしては、IP電話やテレビ電話、インスタントメッセンジャー等がある。
【０００３】
特に、近年普及の著しいIP電話は、音声信号をIPパケットでリアルタイム伝送するためのVoice Over IP（VoIP）技術と、シグナリング技術とを組み合わせて実現されている。
IP電話で利用可能なシグナリングプロトコルには、国際電気通信連合電気通信標準化セクタ：International Telecommunication Union-Telecommunication sector（ITU-T）が１９９７年に勧告したH.323方式が実現されている。また、Internet Engineering Task Force（IETF）にて標準化され２００２年に発行されたRequest for Comments （RFC）3261でスタンダードトラックとして規定された、Session Initiation Protocol（SIP）が実現されている。特に、SIPは、メッセージがテキストで記述される。また、SIPは、WebのためのHyper Text Transfer Protocol（HTTP）や電子メールのためのSimple Message Transfer Protocol（SMTP）を模範に設計された。このため、SIPは、シンプルで拡張性が高くインターネットと親和性が高く、IP電話で用いられるシグナリングプロトコルの標準となりつつある。
【０００４】
SIPは、アプリケーション層で、端末間において、セッション（呼）の確立・変更・切断（終了）を制御するためのシグナリングプロトコルである。
インターネット上に配置されるSIPサーバと呼ばれる中継用のサーバを介して端末間で、メソッド（SIPリクエストメッセージ）とレスポンス（SIPレスポンスメッセージ）が所定の手順に従って交換される。これにより、セッションの確立・変更・切断（終了）が制御される。
【０００５】
電話サービス全般において、ネットワーク障害発生時の対応とすばやいサービスの回復は、顧客満足度及びサービスへの信頼性を確保するための要である。障害発生時においては、想定される顧客問合せへの適切な対応のため、また、影響の拡大抑止とサービス復旧のために、迅速にネットワーク品質と影響範囲（影響ユーザ）を把握することが求められている。
【０００６】
複数のサーバを経由してデータを交換するシステムでは、データ伝達の遅延やエラーといった障害が発生した場合にその原因がどの中間サーバまたは周辺機器にあるかを調査するのに多大な時間と労力を要する。特にSIPサーバのメッセージ交換のように、データが経由するサーバの組み合わせが無数に存在する場合は、障害箇所の特定が容易ではない。
【０００７】
従来は、データの伝達に要するレスポンス時間などの統計値を、各サーバ毎に計算して保持する。複数のサーバを経由してデータが到達する場合に、ある端点のサーバへの到達に遅延が生じている場合、その原因となるサーバまたは機器を特定する必要がある。この時、サーバ毎の平均レスポンス時間の集計値で異常を発見する方法が一般的である
【先行技術文献】
【特許文献】
【０００８】
【特許文献１】特開２００９−２３８０６９号公報
【発明の概要】
【発明が解決しようとする課題】
【０００９】
しかしながら、経路固有の問題がある場合、例えばサーバSを経由するある特定の経路R1ではデータの伝達時間が長く、サーバSを経由する他の全ての経路R2〜Rnを通るデータの伝達時間は正常で短い場合がある。この場合は、サーバSでデータの伝達時間を集計し、平均を算出すると、経路R2〜Rnの短い処理時間によって経路R1の長い処理時間が埋もれてしまい、サーバS(の経路R1)で発生している障害が発見できないという問題があった。
【００１０】
同様に、エラー発生率といった観点で集計した場合も、他の経路の低発生率のエラーにより、ある経路の高発生率のエラーが発見できないという問題があった。
このような状況において、異常個所を見つけるには、メッセージが伝播してきたサーバを一つ一つ追いかけてメッセージのサーバ経路を見つけ出し、遅延の有無を見つけるという効率の悪い作業を行わなければならないという問題があった。これまでもメッセージから経路情報を取り出す方法は使われてきたが、サーバ経路の組合せは膨大な数になるため、経路ごとに統計情報を残すことは実質的に不可能であった。
【００１１】
本発明の課題は、障害の原因となっているサーバを容易に特定することが可能な装置を提供することである。
【課題を解決するための手段】
【００１２】
実施の形態のサーバ異常判定装置は、記憶部と、異常判定部と、を備える。
記憶部は、サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報を記憶する。
【００１３】
異常判定部は、前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する。
【発明の効果】
【００１４】
実施の形態の装置によれば、障害の原因となっているサーバを容易に特定することが可能となる。
【図面の簡単な説明】
【００１５】
【図１】実施の形態に係るネットワーク構成図である。
【図２】実施の形態係る異常診断装置の構成図である。
【図３】実施の形態に係るサーバテーブルの例である。
【図４】実施の形態に係る部分経路ＩＤテーブルの例である。
【図５】実施の形態に係る経路ＩＤテーブルの例である。
【図６】実施の形態に係る学習値テーブルの例である。
【図７】実施の形態に係る保存経路テーブルの例である。
【図８】メッセージデータの流れを示す図である。
【図９】実施の形態の経路情報集計処理のフローチャートである。
【図１０Ａ】メッセージデータの例である。
【図１０Ｂ】メッセージデータの例である。
【図１０Ｃ】メッセージデータの例である。
【図１０Ｄ】メッセージデータの例である。
【図１１】ステップＳ３０８の詳細なフローチャートである。
【図１２】部分経路の短縮処理のフローチャートである。
【図１３】部分経路の短縮処理の具体例におけるネットワーク構成図である。
【図１４】部分経路の伸長処理のフローチャートである。
【図１５】部分経路の伸長処理の具体例におけるネットワーク構成図である。
【図１６】部分経路の有効化処理のフローチャートである。
【図１７】サーバ異常判定処理のフローチャートである。
【発明を実施するための形態】
【００１６】
以下、図面を参照しながら本発明の実施の形態を説明する。
図１は、本実施の形態に係るネットワーク構成図である。
ネットワークは、異常診断装置１０１、サーバ１０２−ｍ（ｍ＝１〜１１）、およびキャプチャ装置１０３−ｍを備える。
【００１７】
サーバ１０２−１は、端末１０４−１、サーバ１０２−３、１０２−４、キャプチャ装置１０３−１に接続している。
サーバ１０２−２は、端末１０４−２、サーバ１０２−３、１０２−４、キャプチャ装置１０３−２に接続している。
【００１８】
サーバ１０２−３は、サーバ１０２−１、１０２−２、１０２−５、１０２−６、キャプチャ装置１０３−３に接続している。
サーバ１０２−４は、サーバ１０２−１、１０２−２、１０２−５、１０２−６、キャプチャ装置１０３−４に接続している。
【００１９】
サーバ１０２−５は、サーバ１０２−３、１０２−４、１０２−７、１０２−８、キャプチャ装置１０３−５に接続している。
サーバ１０２−６は、サーバ１０２−３、１０２−４、１０２−８、１０２−９、キャプチャ装置１０３−６に接続している。
【００２０】
サーバ１０２−７は、サーバ１０２−５、１０２−１０、キャプチャ装置１０３−７に接続している。
サーバ１０２−８は、サーバ１０２−５、１０２−６、１０２−１０、１０２−１１、キャプチャ装置１０３−８に接続している。
【００２１】
サーバ１０２−９は、サーバ１０２−６、１０２−１１、キャプチャ装置１０３−９に接続している。
サーバ１０２−１０は、端末１０４−３、１０４−４、サーバ１０２−３、１０２−４、キャプチャ装置１０３−１０に接続している。
【００２２】
サーバ１０２−１１は、端末１０４−５、サーバ１０２−８、１０２−９、キャプチャ装置１０３−１１に接続している。
サーバ１０２は、メッセージデータを隣接するサーバ１０２または端末１０４に転送する。
また、サーバ１０２−１〜１０２−１１は、それぞれサーバS1〜S11と表すこともある。
【００２３】
キャプチャ装置１０３−ｍは、サーバ１０２−ｍに接続しており、サーバ１０２−ｍが送信するメッセージデータをキャプチャする。また、キャプチャ装置１０３−ｍは、異常診断装置１０１に接続しており、キャプチャしたメッセージデータを異常診断装置１０１に送信する。
【００２４】
異常診断装置１０１は、メッセージデータを収集し、メッセージデータに対して紐付け処理を行う。そして、紐付け結果からメッセージデータの経路を生成し、サーバ毎の経路情報の統計情報を生成し、経路毎のサーバ異常を発見する。
端末１０４は、例えばＩＰ電話である。
【００２５】
図２は、実施の形態に係る異常診断装置の構成図である。
異常診断装置１０１は、処理部１１０、メモリ１１７、および記憶部１１８を備える。
処理部１１０は、経路の生成やサーバの異常診断を行う。
【００２６】
メモリ１１７は、処理部１１０での処理で用いられるデータが格納される。
処理部１１０は、メッセージデータ収集部１１１、紐付け部１１２、経路情報生成部１１３、保存経路選択部１１４、統計情報管理部１１５、および異常診断部１１６を備える。
【００２７】
メッセージデータ収集部１１１は、キャプチャ装置１０３から送信された複数のメッセージデータを受信し、紐付け部１１２に送信する。
紐付け部１１２は、複数のメッセージデータを共通する属性（例えば、Call-ID）に基づいて紐付けする。尚、紐付けされたメッセージデータの集合は、トランザクションと呼ぶ。一連の通信における複数のメッセージデータは共通する属性を有するため、これらメッセージデータは紐付けされる。
【００２８】
経路情報生成部１１３は、メッセージデータから経路を生成する。
保存経路選択部１１４は、生成された経路を保存するか判定する。
統計情報管理部１１５は、保存対象経路やサーバの各種情報を記憶部１１８に保存する。
【００２９】
異常診断部１１６は、サーバ及び経路に異常があるか判定する。
記憶部１１８は、サーバテーブル２０１、部分経路ＩＤテーブル２０２、経路ＩＤテーブル２０３、学習値テーブル２０４、および保存経路テーブル２０５を有する。
【００３０】
図３は、実施の形態に係るサーバテーブルの例である。
サーバテーブル２０１は、項目として、サーバＩＤおよびＩＰアドレスを有する。
サーバＩＤはサーバに割り当てられたＩＤであり、ＩＰアドレスはサーバのＩＰアドレスである。サーバテーブルには、サーバＩＤおよびＩＰアドレスが対応付けられて記述されている。
【００３１】
例えば、サーバ１０２−５のサーバＩＤはS5であり、ＩＰアドレスは192.168.1.2である。
尚、本実施の形態では、サーバ１０２−１〜１０２−１１に対して、それぞれサーバＩＤとしてS1〜S11が割り当てられている。
【００３２】
また、図３では、サーバテーブルの一部（３つのサーバＩＤとＩＰアドレスの組）のみを表示している。
図４は、実施の形態に係る部分経路ＩＤテーブルの例である。
【００３３】
部分経路ＩＤテーブル２０２は、項目として、部分経路ＩＤおよび部分経路を有する。
部分経路ＩＤは、部分経路ごとに割り当てられたＩＤである。
部分経路は、経路の一部を示す。部分経路には、所定数のサーバＩＤが並べて記述される。実施の形態において、部分経路の長さ（部分経路長）は、３としている。すなわち、各部分経路に記述されるサーバＩＤの数は、３となる。例えば、S3-S5-S7は、サーバS3からサーバS5を経由してサーバS7への経路を示す。
【００３４】
図５は、実施の形態に係る経路ＩＤテーブルの例である。
経路ＩＤテーブル２０３は、項目として、経路ＩＤおよび経路を有する。
経路ＩＤは、経路ごとに割り当てられたＩＤである。
【００３５】
経路は、ネットワーク上の経路を示す。経路には、所定数のサーバＩＤが並べて記述される。実施の形態において、部分経路長が３の部分経路の前後にそれぞれ１個のサーバを足したものを経路としている。すなわち、各経路に記述されるサーバＩＤの数は、５となる。例えば、S2-S4-S5-S8-S10は、サーバS2からサーバS4、S5、S8を経由してサーバS10への経路を示す。
【００３６】
図６は、実施の形態に係る学習値テーブルの例である。
学習値テーブル２０４は、項目として、サーバＩＤ、部分経路ＩＤ、サーバレスポンス平均、全体レスポンス平均、頻度、TimeWin、および有効フラグを有する。
【００３７】
サーバＩＤには、対象のサーバＩＤが記述される。
部分経路ＩＤには、対象の部分経路ＩＤが記載される。
サーバレスポンス平均には、対象のサーバの部分経路におけるTimeWin前から現在までの平均レスポンス値が記述される。尚、レスポンス値とは、サーバがリクエストメッセージを送信してから応答メッセージを受信するまでの時間であり、平均レスポンス値はレスポンス値の平均である。後述のように図６において、TimeWinはTwin3（３分）であるので、サーバレスポンス平均には、３分前から現在までのレスポンス値の平均が記述される。
【００３８】
全体レスポンス平均には、対象のサーバの部分経路における全体レスポンス平均が記述される。
尚、サーバレスポンス平均および全体レスポンス平均の詳細については後述する。
【００３９】
頻度には、TimeWinの時間幅の中に現れたデータの回数が記述される。
TimeWinは、タイムウィンドウを示し、TimeWinには例えば３分、３０秒など所定の時間が記述される。尚、図６のTwin3は、３分であることを示す。有効フラグは、学習値テーブルの値を用いるか否かを示すフラグであり、１または０が記述される。１は有効（真）を示し、０は無効（偽）を示す。
【００４０】
図７は、実施の形態に係る保存経路テーブルの例である。
保存経路テーブル２０５は、項目として、サーバＩＤ、経路ＩＤ、サーバレスポンス平均（現在）、サーバレスポンス平均（過去１）、およびサーバレスポンス平均（過去２）、全体レスポンス平均、頻度、およびTimeWinを有する。
【００４１】
経路ＩＤには、対象の経路ＩＤが記述される。
サーバレスポンス平均（現在）は、図６のサーバレスポンス平均に対応する。
サーバレスポンス平均（過去１）は、対象のサーバの部分経路における2*TimeWin前からTimeWin前までの平均レスポンス値が記述される。例えば、図７においては、６分前から３分前までの平均レスポンス値が記述される。
【００４２】
サーバレスポンス平均（過去２）は、対象のサーバの部分経路における3*TimeWin前から2*TimeWin前までの平均レスポンス値が記述される。例えば、図７においては、９分前から６分前までの平均レスポンス値が記述される。
【００４３】
サーバＩＤ、サーバレスポンス平均、全体レスポンス平均、頻度、およびTimeWinは、上述の説明と同様であるので説明は省略する。
ここで、実施の形態で用いられるサーバレスポンス平均および全体レスポンス平均について説明する。
【００４４】
図８は、メッセージデータの流れを示す図である。
図８において、INVITEメッセージがサーバS1からサーバS3、S5、S7を経由してサーバS10に転送されている。また、RINGINGメッセージがサーバS10からサーバS7、S5、S3を経由してサーバS1に転送されている。
・サーバレスポンス平均
サーバＸの部分経路Ｙにおけるサーバレスポンス平均は、部分経路Ｙを含む全経路において、サーバＸのレスポンス値を平均したものとなる。
【００４５】
尚、レスポンス値とは、INVITEメッセージを送信してからRingingメッセージを受信するまでの時間である。例えば、図８に示す経路におけるサーバS5のレスポンス値は、INVITEメッセージをサーバS7に送信してから、サーバS7からRINGINGメッセージを受信するまでの時間である。
【００４６】
サーバS5を通る経路は、図８に示した経路S1-S3-S5-S7-S10だけでなく、図１に示すようにS2-S3-S5-S8-S10やS1-S4-S5-S7-S10など複数存在する。
例えば、サーバS5の部分経路S3-S5-S7におけるサーバレスポンス平均を求める。図１において、部分経路S3-S5-S7を含む経路は、S1-S3-S5-S7-S10とS2-S3-S5-S7-S10である。従って、サーバS5の部分経路S3-S5-S7におけるサーバレスポンス平均は、経路S1-S3-S5-S7-S10とS2-S3-S5-S7-S10のトランザクションにおいて、サーバS5のレスポンス値の平均となる。
・全体レスポンス平均
サーバＸの部分経路Ｙにおける全体レスポンス平均は、部分経路Ｙを含む全経路において、始端Ｚでのレスポンス値の平均となる。始端は、INVITEメッセージを送信する始点のサーバである。例えば、図８において、始端ＺはサーバS1である。
【００４７】
例えば、サーバS5の部分経路S3-S5-S7における全体レスポンス平均を求める。図１において、部分経路S3-S5-S7を含む経路は、S1-S3-S5-S7-S10とS2-S3-S5-S7-S10である。始端Ｚは、サーバS1およびS2となる。従って、サーバS5の部分経路S3-S5-S7における全体レスポンス平均は、経路S1-S3-S5-S7-S10とS2-S3-S5-S7-S10のトランザクションにおいて、サーバS1およびS2のレスポンス値の平均となる。
【００４８】
図９は、実施の形態の経路情報集計処理のフローチャートである。
ステップＳ３０１において、メッセージデータ収集部は、メッセージデータを収集する。
【００４９】
図１０Ａ〜１０Ｄは、メッセージデータの例である。
メッセージデータは、例えば、SIPで用いられるリクエストメッセージや応答メッセージである。
【００５０】
Request-Lineには、リクエストの種類や宛先、SIPのバージョンが記述される。
Status-Lineには、SIPのバージョンやStatus-Code、Reason-Phraseが記述される
Fromには送信元、Toには宛先が記述される。
【００５１】
Call-IDには、一連の通信(呼)で発生するリクエストおよびレスポンスを他の呼のリクエストおよびレスポンスと識別するためのＩＤが記述される。
Dateには、メッセージデータの送信日時が記述される。
X-MMMには、特定のキャリアで用いられる属性を表すＩＤである。
【００５２】
図９に戻り、ステップＳ３０２において、紐付け部は、収集したメッセージデータを紐付け処理する。すなわち、メッセージデータを属性値に基づいて関連付ける。
ここで、紐付け処理の例として図１０Ａ〜１０Ｄのメッセージデータ４０１〜４０４に対する紐付け処理について説明する。
【００５３】
紐付け処理部１１２は、メッセージデータのCall-IDに基づいてメッセージデータを分類する。
メッセージデータ４０１とメッセージデータ４０４のCall-IDは、同じである。従って、メッセージデータ４０１とメッセージデータ４０４は、紐付けされる。ここで、紐付けされたメッセージデータ４０１とメッセージデータ４０４は、グループ１とする。
【００５４】
また、メッセージデータ４０２とメッセージデータ４０３のCall-IDは、同じである。従って、メッセージデータ４０２とメッセージデータ４０３は、紐付けされる。ここで、紐付けされたメッセージデータ４０２とメッセージデータ４０３は、グループ２とする
紐付け処理部１１２は、メッセージデータのX-MMMに基づいてグループを分類する。
【００５５】
グループ１に属するメッセージデータ４０１のX-MMMとグループ２に属するメッセージデータ４０２のX-MMMは、同じである。従って、グループ１とグループ２が紐付けされる。
【００５６】
以上の処理により、メッセージデータ４０１、メッセージデータ４０２、メッセージデータ４０３、およびメッセージデータ４０４が紐付けされる。
上述の例では、Call-IDおよびX-MMMに基づいて、紐付けを行っているが、これに限るものではなく、他の属性に基づいて紐付けを行っても良い。
【００５７】
図９に戻り、ステップＳ３０３において、経路情報生成部１１３は、トランザクションからメッセージデータの経路（経由したサーバの順序）を算出する。
メッセージデータの経路は、メッセージデータの内、特定のリクエストメッセージ（例えばINVITEメッセージ）を抜き出し、抜き出したメッセージ間を送信元アドレスと宛先アドレスで結びつけることにより経路を生成する。例えば、第１のメッセージデータの宛先アドレスと第２のメッセージデータの送信元アドレスが同じであれば、第１および第２のメッセージは結び付けられ、第１のメッセージデータの宛先アドレスから第２のメッセージデータの宛先アドレスへの経路が生成される。また、経路情報生成部１１３は、生成した経路におけるサーバのレスポンスおよび全体レスポンスを算出する。
【００５８】
ステップＳ３０４において、保存経路選択部１１４は、生成した経路が保存対象経路であるか判定し、保存対象経路である場合ステップＳ３０５に制御は進み、保存対象経路で無い場合ステップＳ３０８に制御は進む。
【００５９】
保存対象経路であるかの判定は、以下のように行う。
（１）生成した経路の経由するサーバを順に一つ選択する。例えば、生成した経路がS2-S4-S5-S7-S10である場合、サーバS2、S4、S5、S7、S10の順に処理対象として選択する。
（２）対象サーバのサーバＩＤと生成した経路の経路ＩＤの組が保存経路テーブルに格納されているかチェックし、格納されている場合は、保存対象と判定する。尚、保存対象と判定された経路は保存対象経路と呼ぶ。
（３）未選択のサーバがあるかチェックし、未選択のサーバがある場合は（１）に戻る。
【００６０】
ステップＳ３０５において、保存経路選択部１１４は、保存対象経路が保存対象から外れるかチェックする。
例えば、保存経路選択部１１４は、対象の経路が保存対象となってから所定の時間が経過した場合や、異常な値をとらなくなってからの経過時間により、保存対象から外れると判定する。
【００６１】
また、例えば、保存経路選択部１１４は、直近の所定回（例えば、３回）のタイムウィンドウ分の全てのサーバレスポンス平均（図７におけるサーバレスポンス平均（現在）、サーバレスポンス平均（過去１）、およびサーバレスポンス平均（過去２））が閾値よりも小さい場合は、経路情報の保存対象から外れると判定する。
【００６２】
保存対象経路が保存対象から外れる場合、制御はステップＳ３０６に進み、保存対象経路が保存対象から外れない場合、制御はステップＳ３０７に進む。
ステップＳ３０６において、統計情報管理部１１５は、対象の経路を保存経路テーブルから削除する。
【００６３】
ステップＳ３０７において、統計情報管理部１１５は、経路ごとの統計値としてトランザクションの各種データ、サーバレスポンス平均、全体レスポンス平均などの情報を学習値テーブル２０４および保存経路テーブル２０５に格納する。尚、統計情報管理部１１５は、生成した経路におけるサーバレスポンスおよび全体レスポンスを新たに追加したときのサーバレスポンス平均および全体レスポンス平均を算出する。
【００６４】
ステップＳ３０８において、保存経路選択部１１４は、生成した経路が新規の保存対象経路となるか判定する。新規の保存対象経路となる場合はステップＳ３０９に制御は進み、新規の保存対象経路とならない場合は処理を終了する。尚、生成した経路が新規の保存対象経路となるかの判定処理の詳細は後述する。
【００６５】
ステップＳ３０９において、統計情報管理部１１５は、保存対象経路の情報を格納するための領域を記憶部１１８に確保し、保存対象経路に対応する経路ＩＤやサーバレスポンス平均、全体レスポンス平均などの情報を学習値テーブル２０４および保存経路テーブル２０５に格納する。尚、統計情報管理部１１５は、生成した経路におけるサーバレスポンスおよび全体レスポンスを新たに追加したときのサーバレスポンス平均および全体レスポンス平均を算出する。
【００６６】
図１１は、ステップＳ３０８の詳細なフローチャートである。
ステップＳ５０１において、保存経路選択部１１４は、生成した経路中のサーバのうち、未選択のサーバを順に一つ選択する。ここでは、生成した経路はS2-S4-S5-S7-S10とする。その場合、最初にサーバS2、以下、順にサーバS4、S5、S7、S10が処理対象として選択される。
【００６７】
ステップＳ５０２において、保存経路選択部１１４は、選択したサーバの部分経路を生成する。ここでは、対象サーバに前後１つずつサーバを加えた経路を部分経路とする。例えば、対象サーバがS5のとき、部分経路はS4-S5-S7となる。
【００６８】
ステップＳ５０３において、保存経路選択部１１４は、部分経路ＩＤテーブル２０２を参照し、生成した部分経路に対応する部分経路ＩＤを抽出する。
ステップＳ５０４において、保存経路選択部１１４は、学習値テーブル２０４を参照し、選択したサーバのサーバＩＤおよび生成した部分経路の部分経路ＩＤの組に対応するサーバレスポンス平均および全体レスポンス平均を抽出する。尚、学習値テーブル２０４のサーバレスポンス平均および全体レスポンス平均を学習値と呼ぶ。
【００６９】
ステップＳ５０５において、保存経路選択部１１４は、選択したサーバのサーバレスポンスが閾値より大きいか判定する。選択したサーバのサーバレスポンスが閾値より大きい場合、制御はステップＳ５０６に進み、閾値以下である場合、制御はステップＳ５０７に進む。尚、閾値は、ステップＳ５０４で抽出したサーバレスポンス平均のＮ（正の実数）倍とする。
【００７０】
ステップＳ５０６において、保存経路選択部１１４は、ステップＳ３０３で生成した経路を保存対象とする。
ステップＳ５０７において、保存経路選択部１１４は、未選択サーバが存在するか判定する。未選択サーバが存在する場合、制御はステップＳ５０１に戻り、未選択サーバが存在しない場合、処理を終了する。
【００７１】
次に生成した経路が新規の保存対象経路となるかの判定処理の具体例について説明する。
ここでは、ネットワーク構成は図１と同様とする。
サーバS5の部分経路S3-S5-S7におけるサーバレスポンス平均は7msとする。
サーバS5の部分経路S3-S5-S8におけるサーバレスポンス平均は3msとする。
サーバS5の部分経路S4-S5-S7におけるサーバレスポンス平均は4msとする。
サーバS5の部分経路S4-S5-S8におけるサーバレスポンス平均は9msとする。
【００７２】
新規の保存対象経路となるかの判定対象の経路は、S2-S4-S5-S7-S10とする。経路S2-S4-S5-S7-S10において、サーバS5のレスポンス値は9msだったとする。
また、Ｎは２とする。
【００７３】
例えば、サーバS5に関して、経路S2-S4-S5-S7-S10の部分経路はS4-S5-S7である。サーバS5の部分経路S4-S5-S7におけるサーバレスポンス平均は4msであり、新規の保存対象経路となるかの判定対象の経路S2-S4-S5-S7-S10におけるサーバS5のレスポンス値である9msは8ms（4msの２倍）より大きいので、経路S2-S4-S5-S7-S10は、新規の保存対象経路と判定される。
【００７４】
次にメモリ使用量の削減に関して説明する。
上述のようにサーバのレスポンス値等の統計値を部分経路毎に分類して集計することにより、どの経路を保存するかの判定の精度を高めることができる。一方で、経路情報の統計を処理する場合と同様に、部分経路を処理する場合にもサーバの組み合わせによる、取り扱う部分経路数増加の問題が発生する。
【００７５】
この問題に対応するため、メモリ使用量に余裕がない場合は部分経路長の縮小、または分岐した経路の統合により、メモリ使用量を削減する。
図１２は、メモリ領域が足りなくなってきた場合の部分経路の短縮処理のフローチャートである。
【００７６】
図１３は、部分経路の短縮処理の具体例におけるネットワーク構成図である。
部分経路の短縮処理の具体例について、適宜、図１３のネットワーク構成図を用いて説明する。
【００７７】
ノード７００は、ノード７０１、７０２、７０３に接続している。
ノード７０１は、ノード７１１、７１２に接続している。
ノード７０２は、ノード７２１、７２２に接続している。
ノード７０３は、ノード７３１、７３２に接続している。
【００７８】
尚、ノード７００はn0、ノード７０１はn1、ノード７０２はn2、ノード７０３はn3、ノード７１１はn11、ノード７１２はn12、ノード７２１はn21、ノード７２２はn22、ノード７３１はn31、ノード７３２はn32と表すこともある。
【００７９】
部分経路n0-n1-n11における、n0のレスポンス値は、50msである。
部分経路n0-n1-n12における、n0のレスポンス値は、40msである。
部分経路n0-n2-n21における、n0のレスポンス値は、60msである。
部分経路n0-n2-n22における、n0のレスポンス値は、45msである。
部分経路n0-n3-n31における、n0のレスポンス値は、30msである。
部分経路n0-n3-n32における、n0のレスポンス値は、50msである。
【００８０】
ステップＳ６０１において、統計情報管理部１１５は、メモリの全体容量および空き容量（残量）を確認する。
ステップＳ６０２において、統計情報管理部１１５は、メモリの空き容量が所定の割合未満であるかチェックする。メモリの空き容量が所定の割合未満である場合、制御はステップＳ６０３に進み、メモリの空き容量が所定の割合以上の場合、処理は終了する。
【００８１】
ステップＳ６０３において、統計情報管理部１１５は、縮小できる部分経路が存在するかチェックする。縮小できる部分経路が存在する場合、制御はステップＳ６０４に進み、縮小できる部分経路が存在しない場合、処理を終了する。縮小できる部分経路が存在するかは、例えば、ネットワークの構成図を保持し、ネットワーク内のノードで端点でないノード（例えば、図１３のn1）があるかによって判定する。
【００８２】
ステップＳ６０４において、統計情報管理部１１５は、未処理の部分経路があるかチェックする。未処理の部分経路がある場合、制御はステップＳ６０５に進み、未処理の部分経路が無い場合、制御はステップＳ６０７に進む。
【００８３】
ステップＳ６０５において、統計情報管理部１１５は、未処理の部分経路を一つ選択する。図１３において、部分経路は、n0-n1-n11、n0-n1-n12、n0-n2-n21、n0-n2-n22、 n0-n3-n31、n0-n3-n32である。従って、これらの部分経路のうち、未処理の部分経路を一つ選択する。
【００８４】
ステップＳ６０６において、統計情報管理部１１５は、末端の一個手前のノードから分岐する経路毎に、ルートノードでのレスポンス値の差を一個手前のノードの属性値として記録する。
【００８５】
部分経路n0-n1-n11、n0-n1-n12において、末端（n11,n12）の一個手前のノード（n1）の属性値として、部分経路毎のルートノード（n0）のレスポンス値の差を記録する。n1の場合は部分経路n0-n1-n11でのルートノード（n0）のレスポンス値は50ms、部分経路n0-n1-n12でのルートノード（n0）のレスポンス値は40msである。したがって、その差50ms-40ms=10msをn1の属性値（レスポンス差）として記録する。
【００８６】
同様に、n2の属性値（レスポンス差）は15ms、n3の属性値（レスポンス差）は20msという値を記録する。
ステップＳ６０７において、統計情報管理部１１５は、未処理のノードがあるかチェックする。未処理のノードがある場合、制御はステップＳ６０８に進み、未処理の部分経路が無い場合、制御はステップＳ６０１に戻る。
【００８７】
ステップＳ６０８において、統計情報管理部１１５は、ノードの属性値として記録した
レスポンス差が小さい順にノードを一つ選択する。
図１３の具体例において、n1、n2、n3のレスポンス差は、それぞれ10ms、15ms、20msである。したがって、n1、n2、n3の順に選択される。
【００８８】
ステップＳ６０９において、統計情報管理部１１５は、選択したノードの末端のノードを縮小対象として、部分経路を縮める。
選択したノードがn1の場合、末端のノードはn11、n12である。従って、部分経路からn11、n12を削除する。
【００８９】
ステップＳ６１０において、統計情報管理部１１５は、メモリの空き容量が規定値を上回るかチェックする。メモリの空き容量が規定値を上回る場合、処理を終了し、メモリの空き容量が規定値を上回らない場合、ステップＳ６０７に制御は戻る。
【００９０】
次に部分経路の伸長について説明する。
通過経路数の減少(これまで通過していた経路を通らなくなった事)によりメモリ使用量に余裕ができた場合には、部分経路を伸長することで、どの経路を保存すべきかの判定精度を高める。
【００９１】
図１４は、メモリに余裕がある場合の部分経路の伸長処理のフローチャートである。
図１５は、部分経路の伸長処理の具体例におけるネットワーク構成図である。
部分経路の伸長処理の具体例について、適宜、図１５のネットワーク構成図を用いて説明する。
【００９２】
ノード９００は、ノード９０１、９０２、９０３、９０４に接続している。
ノード９０１は、ノード９１１、９１２に接続している。
尚、ノード９００はn0、ノード９０１はn1、ノード９０２はn2、ノード９０３はn3、ノード９０４はn4、ノード９１１はn11、ノード９１２はn12と表すこともある。
【００９３】
部分経路n0-n2における、n0のレスポンス値は、35msである。
部分経路n0-n3における、n0のレスポンス値は、55msである。
部分経路n0-n4における、n0のレスポンス値は、40msである。
【００９４】
ステップＳ８０１において、統計情報管理部１１５は、メモリの全体容量および空き容量（残量）を確認する。
ステップＳ８０２において、統計情報管理部１１５は、メモリの空き容量が規定値を上回るかチェックする。メモリの空き容量が規定値を上回る場合、ステップＳ８０３に制御は進み、メモリの空き容量が規定値を上回らない場合、処理は終了する。
【００９５】
ステップＳ８０３において、統計情報管理部１１５は、未処理の部分経路があるかチェックする。未処理の部分経路がある場合、制御はステップＳ８０４に進み、未処理の部分経路が無い場合、処理は終了する。
【００９６】
ステップＳ８０４において、統計情報管理部１１５は、最長の部分経路より短い未処理の部分経路について、末端ノードに対するルートノードのレスポンス値の長い順に一つ選択する。
【００９７】
図１３において、最長の部分経路はn0-n1-n11、n0-n1-n12であり、最長の部分経路より短い部分経路は、n0-n2、n0-n3、n0-n3である。部分経路n0-n2、n0-n3、n0-n4のルートノード（n0）のレスポンス値は、それぞれ35ms、55ms、40msである。したがって、n0-n3、n0-n4、n0-n2の順に選択される。
【００９８】
ステップＳ８０５において、統計情報管理部１１５は、選択された部分経路を経路伸長対象として、部分経路を伸ばす（ノードを追加する）処理を行う。
例えば、部分経路n0-n3において、ノードn31、32を追加して、部分経路をn0-n3-n31、n0-n3-n32とする。
【００９９】
ステップＳ８０６において、統計情報管理部１１５は、伸長処理で使用したメモリ容量をメモリ残量から差し引く。
次に部分経路の有効化について説明する。
【０１００】
上述のように、部分経路を長くした場合、その直後からしばらくの間は伸長した部分経路を通るメッセージが少ないため、学習値としての信頼度が低くなる。従って、伸長した直後の部分経路を経路保存対象かどうかの判断に使うのは望ましくない。したがって、伸長した直後は、学習値テーブル２０４の有効フラグを偽（０）にしておくことにより、伸長した部分経路を無効にしておく。そして、以下のような手順により、伸張した部分経路を経路保存対象の判断材料として有効化する。
【０１０１】
図１６は、部分経路の有効化処理のフローチャートである。
最初、学習値テーブル２０４の伸長した部分経路の有効フラグは、偽（０）となっているものとする。
【０１０２】
ステップＳ１００１において、統計情報管理部１１５は、有効可判定中の部分経路が存在するかチェックする。存在する場合、ステップＳ１００２に制御は進み、存在しない場合、処理を終了する。有効可判定中の部分経路が存在するかの判定は、例えば、ステップＳ８０５において、統計情報管理部１１５が、経路を伸張したことを示すフラグを記録しておき、当該フラグの有無で有効可判定中の部分経路が存在するか判定するようにする。
【０１０３】
ステップＳ１００２において、統計情報管理部１１５は、判定対象の経路の規定時間あたりのルートノードを通るトランザクション数が規定の数を超えるかチェックする。規定の数を超えた場合、制御はステップＳ１００４に進み、超えていない場合は処理を終了する。
【０１０４】
ステップＳ１００３において、統計情報管理部１１５は、判定対象の経路が伸長されてから規定時間を経過しているかチェックする。規定時間を経過している場合、制御はステップＳ１００４に進み、経過していない場合は処理を終了する。
【０１０５】
ステップＳ１００４において、統計情報管理部１１５は、学習値テーブル２０４の「有効化フラグ」を真（例えば、１）に設定する。これにより、有効になった部分経路は、図９のステップＳ３０４の保存対象経路であるかの判定で用いられる。
【０１０６】
実施の形態の異常診断装置によれば、メモリに余裕が生じたときに、部分経路を伸長することで、どの経路を保存すべきかの判定精度を高めることが出来る。
次にサーバ異常があるかの判定処理について説明する。
【０１０７】
図１７は、サーバ異常判定処理のフローチャートである。
ステップＳ１１０１において、異常診断部１１６は、保存経路テーブル２０５の内、未処理のサーバがあるかチェックする。未処理のサーバがある場合、制御はステップＳ１１０２に進み、未処理のサーバが無い場合、制御はステップＳ１１０９に進む。
【０１０８】
ステップＳ１１０２において、異常診断部１１６は、保存経路テーブル２０５の内、未処理のサーバ（サーバＩＤ）を一つ選択する。
ステップＳ１１０３において、異常診断部１１６は、選択したサーバの所定の期間におけるサーバレスポンス平均が閾値を超えているかチェックする。閾値を超えている場合、ステップＳ１１０４に制御は進み、閾値を超えていない場合、ステップＳ１１０５に制御は進む。
【０１０９】
具体的には、図７の保存経路テーブル２０５において、サーバS5が選択された場合、S5のサーバレスポンス平均は、保存経路テーブル２０５に記録されているサーバS5の全ての経路の加重平均から求める。
【０１１０】
図７において、S5の経路ID1におけるサーバレスポンス平均は8ms、頻度は26である。また、S5の経路ID2におけるサーバレスポンス平均は5ms、頻度は20である。
従って、S5のサーバレスポンス平均は、これらの加重平均であるので、S5のサーバレスポンス平均=(8*26+5*20)/(26+20)=6.7msとなる。
【０１１１】
ステップＳ１１０４において、異常診断部１１６は、選択したサーバに異常がある旨を記憶部１１８に記録する。
ステップＳ１１０５において、異常診断部１１６は、選択したサーバを含む保存経路テーブル２０５内の全経路に関して、未処理の経路があるかチェックする。未処理の経路がある場合、ステップＳ１１０６に制御は進み、未処理の経路が無い場合ステップＳ１１０１に制御は戻る。
【０１１２】
ステップＳ１１０６において、異常診断部１１６は、未処理の経路を１つ選択する。
ステップＳ１１０７において、異常診断部１１６は、選択したサーバ及び経路の組のサーバレスポンス平均が閾値を超えているかチェックする。閾値を超えている場合、制御はステップＳ１１０８に進み、閾値を超えていない場合、制御はステップＳ１１０５に戻る。
【０１１３】
ステップＳ１１０８において、異常診断部１１６は、選択したサーバおよび経路に異常がある旨を記憶部１１８に記録する。
ステップＳ１１０９において、異常診断部１１６は、ステップＳ１１０４で記録したサーバ、ステップＳ１１０８で記録したサーバおよび経路をユーザに通知する。
【０１１４】
本実施の形態の異常診断装置によれば、障害の要因であるサーバおよび経路を容易に特定することが可能となる。特に、特定の経路で発生するサーバの異常を発見することが容易になる。
【０１１５】
以上の実施の形態に関し、さらに以下の付記を開示する。
（付記１）
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部を有するコンピュータに、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する処理と、
を実行させるサーバ異常判定プログラム。
（付記２）
複数のメッセージデータを所定の属性に基づいて関連付ける紐付ける処理と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する処理と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する処理と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する処理と、
をさらに実行させる付記１記載のサーバ異常判定プログラム。
（付記３）
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するか否かを決定する処理をさらに実行することを特徴とする付記２記載のサーバ異常判定プログラム。
（付記４）
生成した前記経路情報が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するかを決定する処理をさらに実行することを特徴とする付記２または３記載のサーバ異常判定プログラム。
（付記５）
コンピュータに
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報を記憶する工程と、
前記サーバレスポンス平均が閾値を超えているか判定し、超えていれば前記サーバを特定する情報と前記経路情報とを記録する工程と、
を実行させるサーバ異常判定方法。
（付記６）
複数のメッセージデータを所定の属性に基づいて関連付ける工程と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する工程と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する工程と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する工程と、
をさらに実行させることを特徴とする付記５記載のサーバ異常判定方法。
（付記７）
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するかを決定する工程をさらに実行させることを特徴とする付記６記載のサーバ異常判定方法。
（付記８）
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するか否かを決定する工程をさらに実行させることを特徴とする付記６記載のサーバ異常判定方法。
（付記９）
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部と、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する異常判定部と、
を備えるサーバ異常判定装置
（付記１０）
複数のメッセージデータを所定の属性に基づいて関連付ける紐付け処理部と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する経路情報生成部と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する保存経路選択部と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する統計情報管理部と、
をさらに備える付記９記載のサーバ異常診断装置。
（付記１１）
前記保存経路選択部は、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するかを決定することを特徴とする付記１０記載のサーバ異常判定装置。
（付記１２）
前記保存経路選択部は、生成した前記経路情報が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するかを決定することを特徴とする付記１０記載のサーバ異常判定装置。
【符号の説明】
【０１１６】
１０１異常診断装置
１０２サーバ
１０３キャプチャ装置
１０４端末
１１１メッセージデータ収集部
１１２紐付け部
１１３経路情報生成部
１１４保存経路選択部
１１５統計情報管理部
１１６異常診断部
１１７記憶部
２０１サーバテーブル
２０２部分経路ＩＤテーブル
２０３経路ＩＤテーブル
２０４学習値テーブル
２０５保存経路テーブル
４０１〜４０４メッセージデータ

【特許請求の範囲】
【請求項１】
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部を有するコンピュータに、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する処理と、
を実行させるサーバ異常判定プログラム。
【請求項２】
複数のメッセージデータを所定の属性に基づいて関連付ける紐付ける処理と、
関連付けられた前記複数のメッセージデータから関連付けられた前記複数のメッセージデータが通過した経路を示す前記経路情報を生成し、関連付けられた前記複数のメッセージデータが通過した経路内のサーバのレスポンス値を算出する処理と、
生成した前記経路情報が前記記憶部に記憶されているかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象であるか判定する処理と、
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象である場合、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録する処理と、
をさらに実行させる請求項１記載のサーバ異常判定プログラム。
【請求項３】
関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値が保存対象でないと判定された場合、前記経路情報から前記経路の一部である部分経路を示す部分経路情報を生成し、前記部分経路内のサーバのレスポンス値が閾値より大きいかに基づき、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を保存するか否かを決定する処理をさらに実行することを特徴とする請求項２記載のサーバ異常判定プログラム。
【請求項４】
生成した前記経路情報が保存対象であると判定された場合、生成した前記経路に対応する所定の期間の前記サーバレスポンス平均が閾値より小さいかに基づいて、関連付けられた前記複数のメッセージデータが通過した経路内のサーバの前記レスポンス値を含めたサーバレスポンス平均を記録するかを決定する処理をさらに実行することを特徴とする請求項２または３記載のサーバ異常判定プログラム。
【請求項５】
コンピュータに
サーバを特定する情報、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する工程と、
前記サーバレスポンス平均が閾値を超えているか判定し、超えていれば前記サーバを特定する情報と前記経路情報とを記録する工程と、
を実行させるサーバ異常判定方法。
【請求項６】
サーバを特定する情報と、トランザクションのメッセージデータについて前記サーバを含む経路を示す経路情報と、前記サーバにおいて前記トランザクションのリクエストメッセージを送信してから応答メッセージを受信するまでの時間であるレスポンス値の平均であるサーバレスポンス平均が対応付けられた情報と、を記憶する記憶部と、
前記サーバレスポンス平均が閾値を超えている場合、前記経路に異常が発生していると判断し、前記サーバを特定する情報と前記経路情報とを記録する異常判定部と、
を備えるサーバ異常判定装置。

【図１】