監視システム、監視装置、監視プログラム及び端末
【課題】ネットワーク内のネットワーク機器の実際の処理性能や品質劣化などの状況を特定化することができる。
【解決手段】本発明の監視システムは、1又は複数の端末はそれぞれ、通信先までの経路上に存在する各ネットワーク機器との間の遅延時間を複数回計測する遅延時間計測手段と、遅延時間計測手段により計測された経路上の各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段とを備え、監視装置は、各端末から遅延情報を収集する情報収集手段と、情報収集手段により収集された遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段とを備える。
【解決手段】本発明の監視システムは、1又は複数の端末はそれぞれ、通信先までの経路上に存在する各ネットワーク機器との間の遅延時間を複数回計測する遅延時間計測手段と、遅延時間計測手段により計測された経路上の各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段とを備え、監視装置は、各端末から遅延情報を収集する情報収集手段と、情報収集手段により収集された遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段とを備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、監視システム、監視装置、監視プログラム及び端末に関し、例えば、ネットワークを構成するネットワーク機器の処理能力を監視するシステムに適用し得るものである。
【背景技術】
【0002】
例えば映像、音声、データ等を提供するネットワークサービスにおいては、低遅延で品質劣化のないことが望まれる。
【0003】
従来、データ転送の遅延を最小化する技術として特許文献1に記載される技術がある。特許文献1には、ネットワーク内でのキュー遅延を最小化するために、通信端末間の往復遅延時間あるいは片道遅延時間の値を計測し、少なくとも計測した受信帯域を用いて往復遅延時間あるいは片道遅延時間の値を補正し、その補正した値を用いて送信帯域を決定する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−77442号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した従来技術は、ネットワーク内の遅延キューの最小化を行う技術であり、ネットワーク内の各装置の実際の処理性能や品質劣化(例えばサイレント故障)等といった状況を特定化することは困難であった。
【0006】
例えば、クライアント−サーバ間に存在する複数のネットワーク機器の活性情報(例えばSNMP(Simple Network Management Protocol)で取得できる情報)ではなく、サイレント故障の源とも言うべき、ネットワーク機器の実際の処理能力情報を取得することができない。
【0007】
また例えば、サイレント故障は、定常的に現れるものではないため、ネットワーク機器の実際の劣化状況を検知して特定化することは難しい。
【0008】
そのため、ネットワーク内のネットワーク機器の実際の処理性能や品質劣化などの状況を特定化することができる監視システム、監視装置、監視プログラム及び端末が求められている。
【課題を解決するための手段】
【0009】
かかる課題を解決するために、第1の本発明の監視システムは、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視システムにおいて、(A)1又は複数の端末はそれぞれ、(1)通信先までの経路上に存在する各ネットワーク機器との間の遅延時間を複数回計測する遅延時間計測手段と、(2)遅延時間計測手段により計測された経路上の各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段とを備え、(B)監視装置は、(1)各端末から遅延情報を収集する情報収集手段と、(2)情報収集手段により収集された遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、(3)最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段とを備えることを特徴とする。
【0010】
第2の本発明の監視装置は、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置において、(1)1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段と、(2)情報収集手段により収集された上記遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、(3)最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段とを備えることを特徴とする。
【0011】
第3の本発明の監視プログラムは、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視プログラムにおいて、コンピュータを、(1)1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段、(2)情報収集手段により収集された遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段、(3)最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段として機能させることを特徴とする。
【0012】
第4の本発明の端末は、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置に監視される端末において、(1)通信先までの経路上に存在する各ネットワーク機器との間の遅延時間を複数開計測する遅延時間計測手段と、(2)遅延時間計測手段により計測された経路上の各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段とを備えることを特徴とする。
【発明の効果】
【0013】
本発明によれば、ネットワーク内のネットワーク機器の実際の処理性能や品質劣化などの状況を特定化することができる。
【図面の簡単な説明】
【0014】
【図1】第1の実施形態の監視システムの全体構成を示す全体構成図である。
【図2】第1の実施形態のクライアントの内部構成を示す内部構成図である。
【図3】tracerouteの処理動作を説明する説明図である。
【図4】第1の実施形態の監視装置の内部構成を示す内部構成図である。
【図5】tracerouteにより得られる結果の構成パラメータを説明する説明図である。
【図6】クライアントが外国のサーバ宛にtracerouteを繰り返し行なったときの結果例を示す図である。
【図7】最小遅延時間算出部が求めたRTTminの値を示す図である。
【図8】第2の実施形態の監視装置の内部構成を示す内部構成図である。
【図9】第2の実施形態の監視装置における処理動作を示すフローチャートである。
【図10】第2の実施形態のRTTmin差分値を説明する説明図である。
【図11】第2の実施形態の各周期のRTTmin差分値の平均値を示す図である。
【発明を実施するための形態】
【0015】
(A)第1の実施形態
以下では、本発明の監視システム、監視装置、監視プログラム及び端末の第1の実施形態について、図面を参照しながら説明する。
【0016】
(A−1)第1の実施形態の構成
(A−1−1)全体構成
図1は、第1の実施形態の監視システムの全体構成を示す全体構成図である。図1において、第1の実施形態の監視システム9は、監視装置1、クライアント2、サーバ3、ノード4−1〜ノード4−N(Nは正の整数)を少なくとも有して構成される。
【0017】
監視装置1は、監視するクライアントからネットワーク情報を収集し、その収集したネットワーク情報を用いてネットワークを構成するノード4−k(1≦k≦N)の実際の処理性能等の状況を求めるものである。
【0018】
クライアント2は、サーバ3との間でデータ通信を行うものであって、監視装置1に監視される端末装置である。クライアント2は、所定期間、サーバ3との間のネットワークを構成するノード4−kからネットワーク情報を繰り返し取得し、その取得したネットワーク情報を監視装置1に与えるものである。
【0019】
ここで、ネットワーク情報とは、クライアント2と各ノード4−kとの間の遅延時間を含む情報である。クライアント2と各ノード4−kとの間の遅延時間は、往復遅延時間であってもよいし、又は片道遅延時間であってもよい。この実施形態では、往復遅延時間(RTT:Round Trip Time)を想定して説明する。
【0020】
サーバ3は、クライアント2に対して情報提供を行うサーバである。サーバ3が提供する情報は、特に限定されるものではない。例えば、提供する情報は、映像、音声、データ等の情報を適用することができる。
【0021】
ノード4−1〜ノード4−N(ノード4−k)は、サーバ3とクライアント2との間のネットワークノードである。ノード4−kは、例えば、ルータ、スイッチ装置などが該当する。図1の例では、クライアント2とサーバ3との間にノード4−1〜4−Nが介在している場合を示す。
【0022】
(A−1−2)クライアントの内部構成
図2は、クライアント2の内部構成を示す内部構成図である。図2において、クライアント2は、制御部21、通信部22を少なくとも有する。
【0023】
制御部21は、クライアント2の機能を司る処理部又は装置である。制御部21は、サーバ3との間のネットワークを構成するノード4−kの処理状況を管理する機器状況管理機能を有する。
【0024】
ここで、機器状況管理機能は、当該クライアント2と、サーバ3までの経路上に存在する各ノード4−kとの間の遅延時間を計測し、その遅延時間に基づく当該ノード4−kの処理状況に関する情報を取得する。機器状況管理機能は、当該クライアント2と各ノード4−kとの間の遅延時間を求めることができれば種々の方法を適用することができる。この実施形態では、機器状況管理機能の一例として、例えば、tracerouteを用いる場合を例示する。
【0025】
図2に示すように、制御部21は、パケット生成部211、生存時間制御部212、遅延時間計測部213、情報通知部214を有する。
【0026】
パケット生成部211は、宛先をサーバ3とするパケット(例えばIPパケット)を生成するものである。パケット生成部211は、例えばtracerouteコマンドに基づくパケットを生成する。
【0027】
生存時間制御部212は、パケット生成部211が生成するパケットの生存時間(TTL:Time To Live)の値を制御するものである。生存時間制御部212は、TTLを「1」から順に1ずつ増やすように制御する。
【0028】
遅延時間計測部213は、パケット生成部211により生成されたパケットの送信時刻と、そのパケットに対して返信されたパケットの受信時刻とに基づいて、当該クライアント2とサーバ3との間の経路上の往復遅延時間(RTT情報)を各ノード4−k毎に計測するものである。
【0029】
図3は、クライアント2とサーバとの間の経路上の往復遅延時間を計測する方法を説明する説明図である。
【0030】
図3(A)に示すように、まず、生存時間制御部212により「TTL=1」が設定されたパケットが送信される。TTL=1のパケットがノード4−1に与えられると、ノード4−1は受信パケットのTTLを1だけ減算する。その結果、TTLは「0」となるので、ノード4−1は、パケットを破棄し、ICMP(Internet Control Management Protocol)のTime Exceededエラー(Type=11)をクライアント2に返信する。クライアント2において、Time Exceededエラーを受信すると、遅延時間計測部213が、パケットの送信時刻とTime Exceededエラーの受信時刻とに基づいて往復遅延時間を求める。また、遅延時間計測部213は、Time Exceededエラーに含まれている送信元アドレス(ノード4−kのアドレス情報)に基づいて、ノード4−k毎の往復遅延時間を求める。
【0031】
情報通知部214は、遅延時間計測部213により求められたノード4−k毎の往復遅延時間を、通信部22を介して監視装置1に通知(アップロード)するものである。
【0032】
通信部22は、ネットワークとの間で情報の送受信を行うものである。通信プロトコルは特に限定されるものではないが、この実施形態では、インターネットプロトコル(IP)を想定する。
【0033】
(A−1−3)監視装置の内部構成
図4は、監視装置1の内部構成を示す内部構成図である。図4において、監視装置1は、機器性能推定部11、通信部12、情報データベース(DB)13を少なくとも有する。
【0034】
通信部12は、ネットワークとの間で情報の送受信を行うものである。
【0035】
機器性能推定部11は、監視対象とするクライアント2とサーバ3との間のネットワークを構成する各ノード4−kの処理性能を推定するものである。機器性能推定部11は、クライアント2が所定期間tracerouteを繰り返し行い得られたRTT情報をネットワーク情報として取得し、その各ノード4−kのRTT情報に基づいて各ノード4−kの性能を推定する。
【0036】
機器性能推定部11は、図4に示すように、情報収集部111、統計情報処理部110、DB管理部113を少なくとも有する。
【0037】
情報収集部111は、通信部12を介して、クライアント2が取得した各ノード4−kとの間のRTT情報をクライアント2から収集するものである。また、情報収集部111は、取得したRTT情報をDB管理部113に与えるものである。
【0038】
DB管理部113は、情報DB13に格納される格納情報の管理を行うものである。DB管理部113は、情報収集部111から受け取ったRTT情報を、情報DB13に格納するものである。
【0039】
このとき、DB管理部113は、あるクライアント2からサーバ3までの経路上の各ノード4−kについて、当該クライアント2と各ノード4−kとの間の往復遅延時間(RTT情報)を情報DB13に格納する。すなわち、当該クライアント2からサーバ3までの経路上のホップ毎のRTT情報を格納するように管理する。
【0040】
また、DB管理部113は、情報DB13に格納される格納情報を最小遅延時間算出部112に与えたり、最小遅延時間算出部112が求めた各ノード4−kの最小遅延時間RTTminをホップ毎に情報DB13に格納したりする。
【0041】
統計情報処理部110は、情報DB13に格納される情報を用いて所定の統計処理を行うものである。第1の実施形態の統計情報処理部110の機能としては、最小遅延時間算出部112を有する。
【0042】
なお、統計情報処理部110は、各経路を構成する各ホップのRTTの値を用いて所定の統計処理(例えば平均化、分析等)を行ったり、最小遅延時間算出部112が求めた各経路の各ホップの最小遅延時間を用いてグラフ化等を行ったりするものである。
【0043】
最小遅延時間算出部112は、クライアント2からサーバ3までの経路上の当該クライアント2と各ノード4−kとの間のRTT情報(各ホップのRTT情報)に基づいて、当該ホップの最小遅延時間RTTminを算出するものである。
【0044】
最小遅延時間RTTminの算出方法としては、種々の方法を広く適用することができる。
【0045】
例えば、あるクライアント2からサーバ3までの経路上での当該クライアント2と各ノード4−kとの間のRTTminを求める場合を例示して説明する。情報DB13には、この経路上のクライアント2から各ホップのRTT情報が格納されている。クライアント2は繰り返しtracerouteを行うので、各ホップについて複数のRTT情報が情報DB13に格納されている。最小遅延時間算出部112は、各ホップの複数のRTT情報をDB管理部113から受け取り、その複数のRTT情報の中から最小遅延時間RTTminを求める。
【0046】
情報DB13は、監視対象のクライアント2が繰り返し取得した各ノード4−kのRTT情報や、機器性能推定部11により求められた情報(例えば、各ノード4−kの最小遅延時間RTTminなど)を格納するものである。
【0047】
(A−2)第1の実施形態の動作
次に、第1の実施形態の監視システム9における処理の動作について図面を参照しながら説明する。
【0048】
図3において、クライアント2は、サーバ3との間の経路上に存在する複数のノード4−1〜ノード4−Nとの間のRTT情報を、tracerouteを用いて計測する。
【0049】
このとき、クライアント2によるtracerouteを用いた計測開始については、種々の方法を適用することができる。例えば、監視装置1がクライアント2に対して計測開始指示を通知し、クライアント2がその計測開始指示の受信をトリガとして計測開始するようにしてもよいし、予め設定された時刻にクライアント2が計測開始するようにしてもよい。
【0050】
クライアント2において、パケット生成部211は、サーバ3を宛先とするIPパケットを生成する。このとき、生存時間制御部212は、まず、TTL=1を設定する。TTL=1が設定されたIPパケットは、通信部22を介してネットワークに送信される(図3(A))。
【0051】
クライアント2から送信されたIPパケットは、ノード4−1に受信される。ノード4−1において、パケットを受信すると、TTLを1だけ減算するのでTTL=0となる。そのため、ノード4−1は、当該パケットを破棄し、当該パケットの送信元であるクライアント2に対してICMP Time Exceededエラー(Type=11)を返信する(図3(A))。
【0052】
クライアント2では、遅延時間計測部213が、パケットの送信時刻と、ICMP Time Exceededエラー(Type=11)の受信時刻とに基づき、送信時刻と受信時刻の差から得られる時間を、クライアント2とノード4−1との間のRTTの値として計測する。
【0053】
次に、クライアント2では、生存時間制御部212がパケットに対してTTL=2を設定して、ネットワークに送信する。パケットは、ノード4−1を経由して、次のノード4−2に与えられる。ノード4−2において、TTL=0となるので、ノード4−2は、当該パケットを破棄し、ICMP Time Exceededエラー(Type=11)を返信する(図3(B))。
【0054】
クライアント2では、遅延時間計測部213が、パケットの送信時刻と、ICMP Time Exceededエラー(Type=11)の受信時刻とに基づき、クライアント2とノード4−2との間のRTTの値を計測する。
【0055】
この動作を繰り返し行うことにより、クライアント2からサーバ3までの経路上において、クライアント2と各ノード4−kとの間のRTTの値を計測することができる(図3(C)、(D))。クライアント2において、情報通知部214は、遅延時間計測部213が計測したRTT情報を監視装置1に通知する。
【0056】
また、クライアント2は、1度だけでなく、複数回(例えば、10回)tracerouteを用いたRTT情報の計測を行う。例えば、1度のtracerouteの時間を予め設定しておき、その時間内で繰り返すようにしてもよいし、1度のtracerouteで予め設定した回数を行うようにしてもよい。
【0057】
なお、この繰り返し回数は、特に限定されるものではないが、最小遅延時間RTTminを知る上で、回数が多い場合には、その分RTT情報の数が多くなり、より小さい値を獲得し得る。一方、回数が少ない場合には、より小さい値のRTTminが得られない場合がある。
【0058】
また、クライアント2とサーバ3との間の経路上のノードによっては、ICMPに対応していないものや、セキュリティ上のためICMPパケットをフィルタリングしている場合もある。この場合、クライアント2における応答パケットのタイマが経過しても、応答パケットの受信がないとき、クライアント2は、RTTの値を結果として出力しない。
【0059】
図5は、tracerouteを用いて計測した往復遅延時間(RTT)の内容構成を説明する説明図である。
【0060】
図5(A)において、tracerouteを用いて計測したノード4−1との間のRTTの値は、(a)ノード4−1への到達時間、(b)ノード内キュー待ち時間、(c)ノード内部処理時間、(d)応答パケットの到着時間から構成される(図5(B))。このうち、(b)ノード内キュー待ち時間及び(c)ノード内部処理時間は、輻輳時に通常時よりも大きな値となり得るものである。
【0061】
また、図5(A)において、ノード4−2との間のRTTの値は、ルータ4−1での構成パラメータ(a)〜(d)に加えて、(e)ノード4−1からノード4−2までの到達時間、(b)ノード4−2内のキュー待ち時間、(c)ノード4−2内部処理時間、(d)応答パケットの到着時間から構成される(図5(C))。
【0062】
監視装置1では、クライアント2から各ノード4−kとの間のRTTの値を収集し、情報DB13に格納する。
【0063】
監視装置1において、最小遅延時間算出部112は、情報DB13に格納されている、クライアント2とサーバ3との経路上のノード4−kのRTTの値を用いて、最小遅延時間RTTminを算出する。
【0064】
図6は、クライアント2が外国(例えば米国)のサーバ3宛にtracerouteを繰り返し行なったときの結果例を示す。図6において、51には、クライアント2からのホップ数(例えば「Hop 1」等)、ノード4−kの名称やアドレス情報が記載されている。52には、クライアント2が計測した第1回から第10回までのRTTの計測値(ms:マイクロ秒)が記載されている。
【0065】
最小遅延時間算出部112は、図6に例示するような、traceroute結果を受け取る。例えば、最小遅延時間算出部112は、図6の第1行目の「Hop 1」について、第1回から第10回までのRTTの値の中から、最小値である第1回目のRTT値「19(ms)」を最小遅延時間RTTminの値とする。他のホップについても、最小遅延時間算出部112は、同様にして最小遅延時間RTTminを求める。
【0066】
図7は、最小遅延時間算出部112が求めたRTTminの値を示す図である。図7(A)は、最小遅延時間算出部112が求めた各ホップ(Hop)のRTTminの値を示す。また、図7(B)は、図7(A)に基づき、横軸をホップ数、縦軸をRTTminの値としてグラフ化したものである。
【0067】
図7(A)及び図7(B)から、「Hop 8」から「Hop 9」にかけて、RTTminが急激に上がっていることがわかる。これは、この例においては、クライアント2が米国のサーバ3に向けて計測したものである。そのため、「Hop 8」と「Hop 9」との間で海外(例えば米国)に遷移し、「Hop 9」のノード4−kが海外のノードであることが推定できる。
【0068】
なお、最小遅延時間RTTminは、今回のtraceroute結果の中から決定するようにしてもよい。
【0069】
また、クライアント2により新たなtraceroute結果を受けた場合、RTTminより更に小さいRTT値があったときには、今回の更に小さいRTT値をRTTminとして更新するようにしてもよい。
【0070】
さらに、今回のtraceroute結果の中のRTTの最小値が、RTTminより大きい場合には、そのRTTminの更新をせずに、前回までのRTTminをそのまま維持するようにしてもよい。
【0071】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、RTTのうち最小のRTTの値(RTTmin)は、ICMPパケットがノードのキュー待ちの遅延の影響をほとんど受けずに転送された場合のRTT値と想定することができる。
【0072】
(B)第2の実施形態
次に、本発明の監視システム、監視装置、監視プログラム及び端末の第2の実施形態を、図面を参照しながら説明する。
【0073】
第2の実施形態は、第1の実施形態で算出した監視対象のクライアント2とサーバ3との間の経路上の各ホップの最小遅延時間RTTminを用いて、各ノード4−kの実際の処理性能を推定する点で、第1の実施形態と異なる。
【0074】
(B−1)第2の実施形態の構成
図8は、第2の実施形態の監視装置1の内部構成を示す内部構成図である。図8において、第2の実施形態の監視装置1は、機器性能推定部21、通信部12、情報DB13を少なくとも有する。なお、通信部12及び情報DB13は、第1の実施形態と同じものであるので、ここでの詳細な説明は省略する。
【0075】
機器性能推定部21は、第1の実施形態の機能に加えて、監視対象のクライアント2とサーバ3との間の経路上の各ホップの最小遅延時間RTTminを基本情報とし、定期的にクライアント2から収集された各ホップのRTT情報と当該ホップのRTTminとに基づいて、各ノード4−kの処理性能を推定するものである。
【0076】
例えば、tracerouteによりクライアント2が送信したICMPパケットも、ユーザパケットと同一の経路をたどる。そのため、経路上に輻輳が生じた場合、ICMPパケットも、ノード4−kのユーザパケットと同一のキュー待ち合わせ遅延を受ける。その結果が、tracerouteの結果に反映されると考えられる。
【0077】
また、tracerouteで計測したRTTの値から、RTTminの値を引いた差分は、ノード4−kの内部処理時間とみなすことができる。そのため、上記差分値を用いることで、各ノード4−kの内部処理の実際の性能や輻輳状況を把握することができる。
【0078】
図8に示すように、機器性能推定部21は、情報収集部111、DB管理部113、統計処理部110、統計ライブラリ210、教師データ部214を少なくとも有する。
【0079】
情報収集部111は、第1の実施形態と同様に、クライアント2からRTT情報を収集し、その収集したクライアント2からのRTT情報を、統計情報処理部110に与えるものである。
【0080】
教師データ部214は、情報DB13に格納される、監視対象のクライアント2とサーバ3との間の各ホップの最小遅延時間RTTminをテーブル化し、そのデータを教師データ(レファレンスデータ)として統計ライブラリ210に与えるものである。
【0081】
統計ライブラリ210は、教師データ部214からの教師データを用いて、情報収集部111がクライアント2から収集したホップのRTT情報と、当該ホップの最小遅延時間RTTminとの比較により、各ノード4−kの実際の処理性能や故障(サイレント故障)等を分析するものである。統計ライブラリ210の機能としては、差分算出部211、分析部212を有する。
【0082】
差分算出部211は、情報収集部111から監視対象とするクライアント2とサーバとの間の経路上のホップのRTT情報と、教師データ部214によりテーブル化されたデータを用いて当該ホップのRTTminとの差分をとり、RTTmin差分値を算出するものである。また、差分算出部211は、算出した各ホップのRTTmin差分値を情報DB13に格納する。
【0083】
分析部212は、差分算出部211により算出された各ホップのRTTmin差分値に基づいて、所定の分析処理を行うものである。分析処理としては、各ホップのRTTmin差分値を用いて行うものであれば種々の分析方法を広く適用することができる。
【0084】
例えば、ノード4−kの性能劣化などを分析する危険度分析や、特定Webサイトへのアクセスにおける平均Webページ転送時間や転送ページ数の測定結果と比較して、これらとノード4−kの内部処理との間に相関関係があるか否かを分析する相関分析などを適用することができる。
【0085】
DB管理部113は、情報DB13に格納される格納情報の管理を行うものである。
【0086】
統計情報処理部110は、第1の実施形態と同様に、最小遅延時間算出部112を有するものである。また、統計情報処理部110は、求めた最小遅延時間RTTminをDB管理部113に与えて情報DB13に格納させる。
【0087】
(B−2)第2の実施形態の動作
次に、第2の実施形態の監視システム9における処理の動作について、図面を参照しながら説明する。
【0088】
図9は、第2の実施形態の監視装置1における処理動作を示すフローチャートである。
【0089】
まず、監視装置1では、情報収集部111がクライアント2からRTT情報を収集する。統計情報処理部110の最小遅延時間算出部112は、クライアント2から収集したサーバ3までの経路上の各ホップのRTT情報に基づいて、各ホップの最小遅延時間RTTminを算出する(ステップS101)。
【0090】
この最小遅延時間RTTminの算出方法は、第1の実施形態で説明した方法を適用するこができる。すなわち、クライアント2が測定対象のサーバ3に対してtracerouteを繰り返し行う。監視装置1は、クライアント2から収集したtraceroute結果から各ホップのRTTから最小値を求める。
【0091】
この各ホップのRTTminは、ICMPパケットがキュー待ちの遅延の影響をほとんど受けずに転送された場合のRTT値と仮定する。
【0092】
教師データ部214は、図7(A)に示すように、クライアント2とサーバ3との間の経路上の各ホップの最小遅延時間RTTminの値をテーブル化して保持する。
【0093】
次に、クライアント2は、tracerouteによりサーバ3までの各ホップのRTT情報を定期的に取得する。監視装置1の情報収集部111は、クライアント2が定期的に取得した各ホップのRTT情報を収集する(ステップS102)。
【0094】
差分算出部211は、クライアント2から収集した経路上の各ホップのRTTの値と、教師データから当該ホップのRTTminの値との差分をとり、当該ホップのRTTmin差分値を算出する(ステップS103)。
【0095】
このとき、クライアント2は、所定周期毎に、経路上の各ホップのRTT情報を取得し、監視装置1の差分算出部211は、各周期毎に、各ホップのRTTmin差分値を算出する。また、差分算出部211が算出したRTTmin差分値は、各周期毎に、情報DB13に格納される。これにより、各経路の各ホップのRTTmin差分値が周期毎に情報DB13に格納される。
【0096】
図10は、RTTmin差分値を説明する説明図である。図10は、第1の実施形態と同様に、海外(例えば米国)のサーバ3へのアクセスを例示するものであり、図6及び図7に対応するRTTmin差分値の一例である。
【0097】
例えば、図10における「Hop 1」の最小遅延時間RTTminは、図7(A)に示すように「19(ms)」であるとする。その後、クライアント2から収集した各ホップの第1回から第10回までのRTTの値が図6に示すものであるとする。差分算出部211は、図6に例示するRTT情報を受け取ると、各回のRTTの値と最小遅延時間RTTminの値「19(ms)」との差分をとる。その結果、図10に示すように、「Hop 1」のRTTmin差分値が得られる。このRTTmin差分値は、キューイング遅延により発生した増加時間と考えられる。
【0098】
次に、分析部212は、差分算出部211により算出されたRTTmin差分値を用いて、各ノード4−kの実際の処理性能などの分析処理を行う(ステップS104)。
【0099】
図11は、各周期のRTTmin差分値の平均値を示した図である。図11では、例えば1時間毎に、tracerouteにより収集した各ホップのRTTの値の平均値を例示する。図11は、各ノード4−kの内部処理時間を示すものである。
【0100】
図11に示すように、RTTmin差分値は、「Hop 7」から「Hop 8」で輻輳ないしノードの性能劣化が見られる。このことから、「Hop7」から「Hop 8」で海外ノードへ遷移したことがわかる。
【0101】
つまり、第1の実施形態では、RTTminのグラフから、「Hop 8」から「Hop 9」で海外ノードへ遷移したとの推定であったが、第2の実施形態によれば、実際のノード4−kの性能を知ることができるので、「Hop7」から「Hop 8」で海外ノードへ遷移したということがわかる。
【0102】
分析部212は、各ノード4−kの内部処理時間の分析により性能劣化ないし輻輳状況を把握することができる。図11において、「Hop 5」から「Hop 6」、「Hop 7」から「Hop 8」、「Hop 10」から「Hop 11」で輻輳ないしノードの性能劣化が生じていると把握できる。
【0103】
なお、上記の例では、各周期のRTTmin差分値を平均化した場合を例示したが、複数の周期にわたるRTTmin差分値を用いて分析処理を行うようにしてもよい。
【0104】
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、第1の実施形態の効果に加えて、監視対象の経路上の各ホップのRTTmin差分値を算出することにより、その各ホップでのノードの性能劣化や輻輳を推定することができる。また、第2の実施形態によれば、各ホップのRTTmin差分値を用いることにより、危険度分析や相関分析などの分析処理を行うで、ノードの性能や輻輳状況を認識することができる。
【0105】
(C)他の実施形態
上述した第1及び第2の実施形態で説明したクライアント、監視装置の機能は、いわゆるソフトウェア処理により実現される。例えば、クライアント、監視装置のハードウェア構成として、CPU、ROM、RAM、EEPROMなどから構成されており、CPUが、処理プログラムをROMから読み出して実行することで、各種機能が実現される。
【0106】
上述した第1及び第2の実施形態において、監視装置は1台の物理的な装置のように説明したが、監視装置の各種機能が実現可能であれば、それぞれの処理を実行する複数のサーバが分散配置されている場合も適用することができる。
【符号の説明】
【0107】
1…監視装置、
11、21…機器性能推定部、12…通信部、13…情報DB、110…統計情報処理部、111…情報収集部、112…最小遅延時間算出部、211…差分算出部、212…分析部、113…DB管理部、210…統計ライブラリ、214…教師データ部、
2…クライアント、3…サーバ、4−1〜4−N…ノード、9…監視システム。
【技術分野】
【0001】
本発明は、監視システム、監視装置、監視プログラム及び端末に関し、例えば、ネットワークを構成するネットワーク機器の処理能力を監視するシステムに適用し得るものである。
【背景技術】
【0002】
例えば映像、音声、データ等を提供するネットワークサービスにおいては、低遅延で品質劣化のないことが望まれる。
【0003】
従来、データ転送の遅延を最小化する技術として特許文献1に記載される技術がある。特許文献1には、ネットワーク内でのキュー遅延を最小化するために、通信端末間の往復遅延時間あるいは片道遅延時間の値を計測し、少なくとも計測した受信帯域を用いて往復遅延時間あるいは片道遅延時間の値を補正し、その補正した値を用いて送信帯域を決定する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−77442号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した従来技術は、ネットワーク内の遅延キューの最小化を行う技術であり、ネットワーク内の各装置の実際の処理性能や品質劣化(例えばサイレント故障)等といった状況を特定化することは困難であった。
【0006】
例えば、クライアント−サーバ間に存在する複数のネットワーク機器の活性情報(例えばSNMP(Simple Network Management Protocol)で取得できる情報)ではなく、サイレント故障の源とも言うべき、ネットワーク機器の実際の処理能力情報を取得することができない。
【0007】
また例えば、サイレント故障は、定常的に現れるものではないため、ネットワーク機器の実際の劣化状況を検知して特定化することは難しい。
【0008】
そのため、ネットワーク内のネットワーク機器の実際の処理性能や品質劣化などの状況を特定化することができる監視システム、監視装置、監視プログラム及び端末が求められている。
【課題を解決するための手段】
【0009】
かかる課題を解決するために、第1の本発明の監視システムは、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視システムにおいて、(A)1又は複数の端末はそれぞれ、(1)通信先までの経路上に存在する各ネットワーク機器との間の遅延時間を複数回計測する遅延時間計測手段と、(2)遅延時間計測手段により計測された経路上の各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段とを備え、(B)監視装置は、(1)各端末から遅延情報を収集する情報収集手段と、(2)情報収集手段により収集された遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、(3)最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段とを備えることを特徴とする。
【0010】
第2の本発明の監視装置は、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置において、(1)1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段と、(2)情報収集手段により収集された上記遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、(3)最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段とを備えることを特徴とする。
【0011】
第3の本発明の監視プログラムは、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視プログラムにおいて、コンピュータを、(1)1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段、(2)情報収集手段により収集された遅延情報に基づき、各経路の各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段、(3)最小遅延時間算出手段により算出された各経路の各ホップの最小遅延時間を用いて、各経路上の各ネットワーク機器の処理性能を推定する機器性能推定手段として機能させることを特徴とする。
【0012】
第4の本発明の端末は、ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置に監視される端末において、(1)通信先までの経路上に存在する各ネットワーク機器との間の遅延時間を複数開計測する遅延時間計測手段と、(2)遅延時間計測手段により計測された経路上の各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段とを備えることを特徴とする。
【発明の効果】
【0013】
本発明によれば、ネットワーク内のネットワーク機器の実際の処理性能や品質劣化などの状況を特定化することができる。
【図面の簡単な説明】
【0014】
【図1】第1の実施形態の監視システムの全体構成を示す全体構成図である。
【図2】第1の実施形態のクライアントの内部構成を示す内部構成図である。
【図3】tracerouteの処理動作を説明する説明図である。
【図4】第1の実施形態の監視装置の内部構成を示す内部構成図である。
【図5】tracerouteにより得られる結果の構成パラメータを説明する説明図である。
【図6】クライアントが外国のサーバ宛にtracerouteを繰り返し行なったときの結果例を示す図である。
【図7】最小遅延時間算出部が求めたRTTminの値を示す図である。
【図8】第2の実施形態の監視装置の内部構成を示す内部構成図である。
【図9】第2の実施形態の監視装置における処理動作を示すフローチャートである。
【図10】第2の実施形態のRTTmin差分値を説明する説明図である。
【図11】第2の実施形態の各周期のRTTmin差分値の平均値を示す図である。
【発明を実施するための形態】
【0015】
(A)第1の実施形態
以下では、本発明の監視システム、監視装置、監視プログラム及び端末の第1の実施形態について、図面を参照しながら説明する。
【0016】
(A−1)第1の実施形態の構成
(A−1−1)全体構成
図1は、第1の実施形態の監視システムの全体構成を示す全体構成図である。図1において、第1の実施形態の監視システム9は、監視装置1、クライアント2、サーバ3、ノード4−1〜ノード4−N(Nは正の整数)を少なくとも有して構成される。
【0017】
監視装置1は、監視するクライアントからネットワーク情報を収集し、その収集したネットワーク情報を用いてネットワークを構成するノード4−k(1≦k≦N)の実際の処理性能等の状況を求めるものである。
【0018】
クライアント2は、サーバ3との間でデータ通信を行うものであって、監視装置1に監視される端末装置である。クライアント2は、所定期間、サーバ3との間のネットワークを構成するノード4−kからネットワーク情報を繰り返し取得し、その取得したネットワーク情報を監視装置1に与えるものである。
【0019】
ここで、ネットワーク情報とは、クライアント2と各ノード4−kとの間の遅延時間を含む情報である。クライアント2と各ノード4−kとの間の遅延時間は、往復遅延時間であってもよいし、又は片道遅延時間であってもよい。この実施形態では、往復遅延時間(RTT:Round Trip Time)を想定して説明する。
【0020】
サーバ3は、クライアント2に対して情報提供を行うサーバである。サーバ3が提供する情報は、特に限定されるものではない。例えば、提供する情報は、映像、音声、データ等の情報を適用することができる。
【0021】
ノード4−1〜ノード4−N(ノード4−k)は、サーバ3とクライアント2との間のネットワークノードである。ノード4−kは、例えば、ルータ、スイッチ装置などが該当する。図1の例では、クライアント2とサーバ3との間にノード4−1〜4−Nが介在している場合を示す。
【0022】
(A−1−2)クライアントの内部構成
図2は、クライアント2の内部構成を示す内部構成図である。図2において、クライアント2は、制御部21、通信部22を少なくとも有する。
【0023】
制御部21は、クライアント2の機能を司る処理部又は装置である。制御部21は、サーバ3との間のネットワークを構成するノード4−kの処理状況を管理する機器状況管理機能を有する。
【0024】
ここで、機器状況管理機能は、当該クライアント2と、サーバ3までの経路上に存在する各ノード4−kとの間の遅延時間を計測し、その遅延時間に基づく当該ノード4−kの処理状況に関する情報を取得する。機器状況管理機能は、当該クライアント2と各ノード4−kとの間の遅延時間を求めることができれば種々の方法を適用することができる。この実施形態では、機器状況管理機能の一例として、例えば、tracerouteを用いる場合を例示する。
【0025】
図2に示すように、制御部21は、パケット生成部211、生存時間制御部212、遅延時間計測部213、情報通知部214を有する。
【0026】
パケット生成部211は、宛先をサーバ3とするパケット(例えばIPパケット)を生成するものである。パケット生成部211は、例えばtracerouteコマンドに基づくパケットを生成する。
【0027】
生存時間制御部212は、パケット生成部211が生成するパケットの生存時間(TTL:Time To Live)の値を制御するものである。生存時間制御部212は、TTLを「1」から順に1ずつ増やすように制御する。
【0028】
遅延時間計測部213は、パケット生成部211により生成されたパケットの送信時刻と、そのパケットに対して返信されたパケットの受信時刻とに基づいて、当該クライアント2とサーバ3との間の経路上の往復遅延時間(RTT情報)を各ノード4−k毎に計測するものである。
【0029】
図3は、クライアント2とサーバとの間の経路上の往復遅延時間を計測する方法を説明する説明図である。
【0030】
図3(A)に示すように、まず、生存時間制御部212により「TTL=1」が設定されたパケットが送信される。TTL=1のパケットがノード4−1に与えられると、ノード4−1は受信パケットのTTLを1だけ減算する。その結果、TTLは「0」となるので、ノード4−1は、パケットを破棄し、ICMP(Internet Control Management Protocol)のTime Exceededエラー(Type=11)をクライアント2に返信する。クライアント2において、Time Exceededエラーを受信すると、遅延時間計測部213が、パケットの送信時刻とTime Exceededエラーの受信時刻とに基づいて往復遅延時間を求める。また、遅延時間計測部213は、Time Exceededエラーに含まれている送信元アドレス(ノード4−kのアドレス情報)に基づいて、ノード4−k毎の往復遅延時間を求める。
【0031】
情報通知部214は、遅延時間計測部213により求められたノード4−k毎の往復遅延時間を、通信部22を介して監視装置1に通知(アップロード)するものである。
【0032】
通信部22は、ネットワークとの間で情報の送受信を行うものである。通信プロトコルは特に限定されるものではないが、この実施形態では、インターネットプロトコル(IP)を想定する。
【0033】
(A−1−3)監視装置の内部構成
図4は、監視装置1の内部構成を示す内部構成図である。図4において、監視装置1は、機器性能推定部11、通信部12、情報データベース(DB)13を少なくとも有する。
【0034】
通信部12は、ネットワークとの間で情報の送受信を行うものである。
【0035】
機器性能推定部11は、監視対象とするクライアント2とサーバ3との間のネットワークを構成する各ノード4−kの処理性能を推定するものである。機器性能推定部11は、クライアント2が所定期間tracerouteを繰り返し行い得られたRTT情報をネットワーク情報として取得し、その各ノード4−kのRTT情報に基づいて各ノード4−kの性能を推定する。
【0036】
機器性能推定部11は、図4に示すように、情報収集部111、統計情報処理部110、DB管理部113を少なくとも有する。
【0037】
情報収集部111は、通信部12を介して、クライアント2が取得した各ノード4−kとの間のRTT情報をクライアント2から収集するものである。また、情報収集部111は、取得したRTT情報をDB管理部113に与えるものである。
【0038】
DB管理部113は、情報DB13に格納される格納情報の管理を行うものである。DB管理部113は、情報収集部111から受け取ったRTT情報を、情報DB13に格納するものである。
【0039】
このとき、DB管理部113は、あるクライアント2からサーバ3までの経路上の各ノード4−kについて、当該クライアント2と各ノード4−kとの間の往復遅延時間(RTT情報)を情報DB13に格納する。すなわち、当該クライアント2からサーバ3までの経路上のホップ毎のRTT情報を格納するように管理する。
【0040】
また、DB管理部113は、情報DB13に格納される格納情報を最小遅延時間算出部112に与えたり、最小遅延時間算出部112が求めた各ノード4−kの最小遅延時間RTTminをホップ毎に情報DB13に格納したりする。
【0041】
統計情報処理部110は、情報DB13に格納される情報を用いて所定の統計処理を行うものである。第1の実施形態の統計情報処理部110の機能としては、最小遅延時間算出部112を有する。
【0042】
なお、統計情報処理部110は、各経路を構成する各ホップのRTTの値を用いて所定の統計処理(例えば平均化、分析等)を行ったり、最小遅延時間算出部112が求めた各経路の各ホップの最小遅延時間を用いてグラフ化等を行ったりするものである。
【0043】
最小遅延時間算出部112は、クライアント2からサーバ3までの経路上の当該クライアント2と各ノード4−kとの間のRTT情報(各ホップのRTT情報)に基づいて、当該ホップの最小遅延時間RTTminを算出するものである。
【0044】
最小遅延時間RTTminの算出方法としては、種々の方法を広く適用することができる。
【0045】
例えば、あるクライアント2からサーバ3までの経路上での当該クライアント2と各ノード4−kとの間のRTTminを求める場合を例示して説明する。情報DB13には、この経路上のクライアント2から各ホップのRTT情報が格納されている。クライアント2は繰り返しtracerouteを行うので、各ホップについて複数のRTT情報が情報DB13に格納されている。最小遅延時間算出部112は、各ホップの複数のRTT情報をDB管理部113から受け取り、その複数のRTT情報の中から最小遅延時間RTTminを求める。
【0046】
情報DB13は、監視対象のクライアント2が繰り返し取得した各ノード4−kのRTT情報や、機器性能推定部11により求められた情報(例えば、各ノード4−kの最小遅延時間RTTminなど)を格納するものである。
【0047】
(A−2)第1の実施形態の動作
次に、第1の実施形態の監視システム9における処理の動作について図面を参照しながら説明する。
【0048】
図3において、クライアント2は、サーバ3との間の経路上に存在する複数のノード4−1〜ノード4−Nとの間のRTT情報を、tracerouteを用いて計測する。
【0049】
このとき、クライアント2によるtracerouteを用いた計測開始については、種々の方法を適用することができる。例えば、監視装置1がクライアント2に対して計測開始指示を通知し、クライアント2がその計測開始指示の受信をトリガとして計測開始するようにしてもよいし、予め設定された時刻にクライアント2が計測開始するようにしてもよい。
【0050】
クライアント2において、パケット生成部211は、サーバ3を宛先とするIPパケットを生成する。このとき、生存時間制御部212は、まず、TTL=1を設定する。TTL=1が設定されたIPパケットは、通信部22を介してネットワークに送信される(図3(A))。
【0051】
クライアント2から送信されたIPパケットは、ノード4−1に受信される。ノード4−1において、パケットを受信すると、TTLを1だけ減算するのでTTL=0となる。そのため、ノード4−1は、当該パケットを破棄し、当該パケットの送信元であるクライアント2に対してICMP Time Exceededエラー(Type=11)を返信する(図3(A))。
【0052】
クライアント2では、遅延時間計測部213が、パケットの送信時刻と、ICMP Time Exceededエラー(Type=11)の受信時刻とに基づき、送信時刻と受信時刻の差から得られる時間を、クライアント2とノード4−1との間のRTTの値として計測する。
【0053】
次に、クライアント2では、生存時間制御部212がパケットに対してTTL=2を設定して、ネットワークに送信する。パケットは、ノード4−1を経由して、次のノード4−2に与えられる。ノード4−2において、TTL=0となるので、ノード4−2は、当該パケットを破棄し、ICMP Time Exceededエラー(Type=11)を返信する(図3(B))。
【0054】
クライアント2では、遅延時間計測部213が、パケットの送信時刻と、ICMP Time Exceededエラー(Type=11)の受信時刻とに基づき、クライアント2とノード4−2との間のRTTの値を計測する。
【0055】
この動作を繰り返し行うことにより、クライアント2からサーバ3までの経路上において、クライアント2と各ノード4−kとの間のRTTの値を計測することができる(図3(C)、(D))。クライアント2において、情報通知部214は、遅延時間計測部213が計測したRTT情報を監視装置1に通知する。
【0056】
また、クライアント2は、1度だけでなく、複数回(例えば、10回)tracerouteを用いたRTT情報の計測を行う。例えば、1度のtracerouteの時間を予め設定しておき、その時間内で繰り返すようにしてもよいし、1度のtracerouteで予め設定した回数を行うようにしてもよい。
【0057】
なお、この繰り返し回数は、特に限定されるものではないが、最小遅延時間RTTminを知る上で、回数が多い場合には、その分RTT情報の数が多くなり、より小さい値を獲得し得る。一方、回数が少ない場合には、より小さい値のRTTminが得られない場合がある。
【0058】
また、クライアント2とサーバ3との間の経路上のノードによっては、ICMPに対応していないものや、セキュリティ上のためICMPパケットをフィルタリングしている場合もある。この場合、クライアント2における応答パケットのタイマが経過しても、応答パケットの受信がないとき、クライアント2は、RTTの値を結果として出力しない。
【0059】
図5は、tracerouteを用いて計測した往復遅延時間(RTT)の内容構成を説明する説明図である。
【0060】
図5(A)において、tracerouteを用いて計測したノード4−1との間のRTTの値は、(a)ノード4−1への到達時間、(b)ノード内キュー待ち時間、(c)ノード内部処理時間、(d)応答パケットの到着時間から構成される(図5(B))。このうち、(b)ノード内キュー待ち時間及び(c)ノード内部処理時間は、輻輳時に通常時よりも大きな値となり得るものである。
【0061】
また、図5(A)において、ノード4−2との間のRTTの値は、ルータ4−1での構成パラメータ(a)〜(d)に加えて、(e)ノード4−1からノード4−2までの到達時間、(b)ノード4−2内のキュー待ち時間、(c)ノード4−2内部処理時間、(d)応答パケットの到着時間から構成される(図5(C))。
【0062】
監視装置1では、クライアント2から各ノード4−kとの間のRTTの値を収集し、情報DB13に格納する。
【0063】
監視装置1において、最小遅延時間算出部112は、情報DB13に格納されている、クライアント2とサーバ3との経路上のノード4−kのRTTの値を用いて、最小遅延時間RTTminを算出する。
【0064】
図6は、クライアント2が外国(例えば米国)のサーバ3宛にtracerouteを繰り返し行なったときの結果例を示す。図6において、51には、クライアント2からのホップ数(例えば「Hop 1」等)、ノード4−kの名称やアドレス情報が記載されている。52には、クライアント2が計測した第1回から第10回までのRTTの計測値(ms:マイクロ秒)が記載されている。
【0065】
最小遅延時間算出部112は、図6に例示するような、traceroute結果を受け取る。例えば、最小遅延時間算出部112は、図6の第1行目の「Hop 1」について、第1回から第10回までのRTTの値の中から、最小値である第1回目のRTT値「19(ms)」を最小遅延時間RTTminの値とする。他のホップについても、最小遅延時間算出部112は、同様にして最小遅延時間RTTminを求める。
【0066】
図7は、最小遅延時間算出部112が求めたRTTminの値を示す図である。図7(A)は、最小遅延時間算出部112が求めた各ホップ(Hop)のRTTminの値を示す。また、図7(B)は、図7(A)に基づき、横軸をホップ数、縦軸をRTTminの値としてグラフ化したものである。
【0067】
図7(A)及び図7(B)から、「Hop 8」から「Hop 9」にかけて、RTTminが急激に上がっていることがわかる。これは、この例においては、クライアント2が米国のサーバ3に向けて計測したものである。そのため、「Hop 8」と「Hop 9」との間で海外(例えば米国)に遷移し、「Hop 9」のノード4−kが海外のノードであることが推定できる。
【0068】
なお、最小遅延時間RTTminは、今回のtraceroute結果の中から決定するようにしてもよい。
【0069】
また、クライアント2により新たなtraceroute結果を受けた場合、RTTminより更に小さいRTT値があったときには、今回の更に小さいRTT値をRTTminとして更新するようにしてもよい。
【0070】
さらに、今回のtraceroute結果の中のRTTの最小値が、RTTminより大きい場合には、そのRTTminの更新をせずに、前回までのRTTminをそのまま維持するようにしてもよい。
【0071】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、RTTのうち最小のRTTの値(RTTmin)は、ICMPパケットがノードのキュー待ちの遅延の影響をほとんど受けずに転送された場合のRTT値と想定することができる。
【0072】
(B)第2の実施形態
次に、本発明の監視システム、監視装置、監視プログラム及び端末の第2の実施形態を、図面を参照しながら説明する。
【0073】
第2の実施形態は、第1の実施形態で算出した監視対象のクライアント2とサーバ3との間の経路上の各ホップの最小遅延時間RTTminを用いて、各ノード4−kの実際の処理性能を推定する点で、第1の実施形態と異なる。
【0074】
(B−1)第2の実施形態の構成
図8は、第2の実施形態の監視装置1の内部構成を示す内部構成図である。図8において、第2の実施形態の監視装置1は、機器性能推定部21、通信部12、情報DB13を少なくとも有する。なお、通信部12及び情報DB13は、第1の実施形態と同じものであるので、ここでの詳細な説明は省略する。
【0075】
機器性能推定部21は、第1の実施形態の機能に加えて、監視対象のクライアント2とサーバ3との間の経路上の各ホップの最小遅延時間RTTminを基本情報とし、定期的にクライアント2から収集された各ホップのRTT情報と当該ホップのRTTminとに基づいて、各ノード4−kの処理性能を推定するものである。
【0076】
例えば、tracerouteによりクライアント2が送信したICMPパケットも、ユーザパケットと同一の経路をたどる。そのため、経路上に輻輳が生じた場合、ICMPパケットも、ノード4−kのユーザパケットと同一のキュー待ち合わせ遅延を受ける。その結果が、tracerouteの結果に反映されると考えられる。
【0077】
また、tracerouteで計測したRTTの値から、RTTminの値を引いた差分は、ノード4−kの内部処理時間とみなすことができる。そのため、上記差分値を用いることで、各ノード4−kの内部処理の実際の性能や輻輳状況を把握することができる。
【0078】
図8に示すように、機器性能推定部21は、情報収集部111、DB管理部113、統計処理部110、統計ライブラリ210、教師データ部214を少なくとも有する。
【0079】
情報収集部111は、第1の実施形態と同様に、クライアント2からRTT情報を収集し、その収集したクライアント2からのRTT情報を、統計情報処理部110に与えるものである。
【0080】
教師データ部214は、情報DB13に格納される、監視対象のクライアント2とサーバ3との間の各ホップの最小遅延時間RTTminをテーブル化し、そのデータを教師データ(レファレンスデータ)として統計ライブラリ210に与えるものである。
【0081】
統計ライブラリ210は、教師データ部214からの教師データを用いて、情報収集部111がクライアント2から収集したホップのRTT情報と、当該ホップの最小遅延時間RTTminとの比較により、各ノード4−kの実際の処理性能や故障(サイレント故障)等を分析するものである。統計ライブラリ210の機能としては、差分算出部211、分析部212を有する。
【0082】
差分算出部211は、情報収集部111から監視対象とするクライアント2とサーバとの間の経路上のホップのRTT情報と、教師データ部214によりテーブル化されたデータを用いて当該ホップのRTTminとの差分をとり、RTTmin差分値を算出するものである。また、差分算出部211は、算出した各ホップのRTTmin差分値を情報DB13に格納する。
【0083】
分析部212は、差分算出部211により算出された各ホップのRTTmin差分値に基づいて、所定の分析処理を行うものである。分析処理としては、各ホップのRTTmin差分値を用いて行うものであれば種々の分析方法を広く適用することができる。
【0084】
例えば、ノード4−kの性能劣化などを分析する危険度分析や、特定Webサイトへのアクセスにおける平均Webページ転送時間や転送ページ数の測定結果と比較して、これらとノード4−kの内部処理との間に相関関係があるか否かを分析する相関分析などを適用することができる。
【0085】
DB管理部113は、情報DB13に格納される格納情報の管理を行うものである。
【0086】
統計情報処理部110は、第1の実施形態と同様に、最小遅延時間算出部112を有するものである。また、統計情報処理部110は、求めた最小遅延時間RTTminをDB管理部113に与えて情報DB13に格納させる。
【0087】
(B−2)第2の実施形態の動作
次に、第2の実施形態の監視システム9における処理の動作について、図面を参照しながら説明する。
【0088】
図9は、第2の実施形態の監視装置1における処理動作を示すフローチャートである。
【0089】
まず、監視装置1では、情報収集部111がクライアント2からRTT情報を収集する。統計情報処理部110の最小遅延時間算出部112は、クライアント2から収集したサーバ3までの経路上の各ホップのRTT情報に基づいて、各ホップの最小遅延時間RTTminを算出する(ステップS101)。
【0090】
この最小遅延時間RTTminの算出方法は、第1の実施形態で説明した方法を適用するこができる。すなわち、クライアント2が測定対象のサーバ3に対してtracerouteを繰り返し行う。監視装置1は、クライアント2から収集したtraceroute結果から各ホップのRTTから最小値を求める。
【0091】
この各ホップのRTTminは、ICMPパケットがキュー待ちの遅延の影響をほとんど受けずに転送された場合のRTT値と仮定する。
【0092】
教師データ部214は、図7(A)に示すように、クライアント2とサーバ3との間の経路上の各ホップの最小遅延時間RTTminの値をテーブル化して保持する。
【0093】
次に、クライアント2は、tracerouteによりサーバ3までの各ホップのRTT情報を定期的に取得する。監視装置1の情報収集部111は、クライアント2が定期的に取得した各ホップのRTT情報を収集する(ステップS102)。
【0094】
差分算出部211は、クライアント2から収集した経路上の各ホップのRTTの値と、教師データから当該ホップのRTTminの値との差分をとり、当該ホップのRTTmin差分値を算出する(ステップS103)。
【0095】
このとき、クライアント2は、所定周期毎に、経路上の各ホップのRTT情報を取得し、監視装置1の差分算出部211は、各周期毎に、各ホップのRTTmin差分値を算出する。また、差分算出部211が算出したRTTmin差分値は、各周期毎に、情報DB13に格納される。これにより、各経路の各ホップのRTTmin差分値が周期毎に情報DB13に格納される。
【0096】
図10は、RTTmin差分値を説明する説明図である。図10は、第1の実施形態と同様に、海外(例えば米国)のサーバ3へのアクセスを例示するものであり、図6及び図7に対応するRTTmin差分値の一例である。
【0097】
例えば、図10における「Hop 1」の最小遅延時間RTTminは、図7(A)に示すように「19(ms)」であるとする。その後、クライアント2から収集した各ホップの第1回から第10回までのRTTの値が図6に示すものであるとする。差分算出部211は、図6に例示するRTT情報を受け取ると、各回のRTTの値と最小遅延時間RTTminの値「19(ms)」との差分をとる。その結果、図10に示すように、「Hop 1」のRTTmin差分値が得られる。このRTTmin差分値は、キューイング遅延により発生した増加時間と考えられる。
【0098】
次に、分析部212は、差分算出部211により算出されたRTTmin差分値を用いて、各ノード4−kの実際の処理性能などの分析処理を行う(ステップS104)。
【0099】
図11は、各周期のRTTmin差分値の平均値を示した図である。図11では、例えば1時間毎に、tracerouteにより収集した各ホップのRTTの値の平均値を例示する。図11は、各ノード4−kの内部処理時間を示すものである。
【0100】
図11に示すように、RTTmin差分値は、「Hop 7」から「Hop 8」で輻輳ないしノードの性能劣化が見られる。このことから、「Hop7」から「Hop 8」で海外ノードへ遷移したことがわかる。
【0101】
つまり、第1の実施形態では、RTTminのグラフから、「Hop 8」から「Hop 9」で海外ノードへ遷移したとの推定であったが、第2の実施形態によれば、実際のノード4−kの性能を知ることができるので、「Hop7」から「Hop 8」で海外ノードへ遷移したということがわかる。
【0102】
分析部212は、各ノード4−kの内部処理時間の分析により性能劣化ないし輻輳状況を把握することができる。図11において、「Hop 5」から「Hop 6」、「Hop 7」から「Hop 8」、「Hop 10」から「Hop 11」で輻輳ないしノードの性能劣化が生じていると把握できる。
【0103】
なお、上記の例では、各周期のRTTmin差分値を平均化した場合を例示したが、複数の周期にわたるRTTmin差分値を用いて分析処理を行うようにしてもよい。
【0104】
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、第1の実施形態の効果に加えて、監視対象の経路上の各ホップのRTTmin差分値を算出することにより、その各ホップでのノードの性能劣化や輻輳を推定することができる。また、第2の実施形態によれば、各ホップのRTTmin差分値を用いることにより、危険度分析や相関分析などの分析処理を行うで、ノードの性能や輻輳状況を認識することができる。
【0105】
(C)他の実施形態
上述した第1及び第2の実施形態で説明したクライアント、監視装置の機能は、いわゆるソフトウェア処理により実現される。例えば、クライアント、監視装置のハードウェア構成として、CPU、ROM、RAM、EEPROMなどから構成されており、CPUが、処理プログラムをROMから読み出して実行することで、各種機能が実現される。
【0106】
上述した第1及び第2の実施形態において、監視装置は1台の物理的な装置のように説明したが、監視装置の各種機能が実現可能であれば、それぞれの処理を実行する複数のサーバが分散配置されている場合も適用することができる。
【符号の説明】
【0107】
1…監視装置、
11、21…機器性能推定部、12…通信部、13…情報DB、110…統計情報処理部、111…情報収集部、112…最小遅延時間算出部、211…差分算出部、212…分析部、113…DB管理部、210…統計ライブラリ、214…教師データ部、
2…クライアント、3…サーバ、4−1〜4−N…ノード、9…監視システム。
【特許請求の範囲】
【請求項1】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視システムにおいて、
1又は複数の端末はそれぞれ、
通信先までの経路上に存在する上記各ネットワーク機器との間の遅延時間を複数回計測する遅延時間計測手段と、
上記遅延時間計測手段により計測された上記経路上の上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段と
を備え、
上記監視装置は、
上記各端末から上記遅延情報を収集する情報収集手段と、
上記情報収集手段により収集された上記遅延情報に基づき、上記各経路の上記各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、
上記最小遅延時間算出手段により算出された上記各経路の各ホップの最小遅延時間を用いて、上記各経路上の上記各ネットワーク機器の処理性能を推定する機器性能推定手段と
を備える
ことを特徴とする監視システム。
【請求項2】
上記機器性能推定手段が、上記各経路の各ホップの最小遅延時間を、上記各ネットワーク機器の内部処理時間が最小となる時間とみなし、上記各経路の各ホップの実際の遅延時間と、それに対応する上記各ホップの最小遅延時間との比較により、上記各経路上の上記各ネットワーク機器の処理性能を推定するものであることを特徴とする請求項1に記載の監視システム。
【請求項3】
上記監視装置は、上記最小遅延時間算出手段により算出された上記経路の各ホップの最小遅延時間を格納する情報格納手段を有し、
上記機器性能推定手段が、
上記各端末から上記経路上の上記各ネットワーク機器との間の遅延時間と、上記情報格納手段に格納される当該経路の各ホップの上記最小遅延時間との差分を求める差分算出部と、
上記差分算出部により求められた当該経路の各ホップの差分値を用いて、当該経路上の上記各ネットワーク機器の処理性能を分析する分析部と
を有する
ことを特徴とする請求項1又は2に記載の監視システム。
【請求項4】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置において、
1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段と、
上記情報収集手段により収集された上記遅延情報に基づき、上記各経路の上記各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、
上記最小遅延時間算出手段により算出された上記各経路の各ホップの最小遅延時間を用いて、上記各経路上の上記各ネットワーク機器の処理性能を推定する機器性能推定手段と
を備えることを特徴とする監視装置。
【請求項5】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視プログラムにおいて、
コンピュータを、
1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段、
上記情報収集手段により収集された上記遅延情報に基づき、上記各経路の上記各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段、
上記最小遅延時間算出手段により算出された上記各経路の各ホップの最小遅延時間を用いて、上記各経路上の上記各ネットワーク機器の処理性能を推定する機器性能推定手段
として機能させることを特徴とする監視プログラム。
【請求項6】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置に監視される端末において、
通信先までの経路上に存在する上記各ネットワーク機器との間の遅延時間を複数開計測する遅延時間計測手段と、
上記遅延時間計測手段により計測された上記経路上の上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を上記監視装置に通知する情報通知手段と
を備えることを特徴とする端末。
【請求項1】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視システムにおいて、
1又は複数の端末はそれぞれ、
通信先までの経路上に存在する上記各ネットワーク機器との間の遅延時間を複数回計測する遅延時間計測手段と、
上記遅延時間計測手段により計測された上記経路上の上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を監視装置に通知する情報通知手段と
を備え、
上記監視装置は、
上記各端末から上記遅延情報を収集する情報収集手段と、
上記情報収集手段により収集された上記遅延情報に基づき、上記各経路の上記各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、
上記最小遅延時間算出手段により算出された上記各経路の各ホップの最小遅延時間を用いて、上記各経路上の上記各ネットワーク機器の処理性能を推定する機器性能推定手段と
を備える
ことを特徴とする監視システム。
【請求項2】
上記機器性能推定手段が、上記各経路の各ホップの最小遅延時間を、上記各ネットワーク機器の内部処理時間が最小となる時間とみなし、上記各経路の各ホップの実際の遅延時間と、それに対応する上記各ホップの最小遅延時間との比較により、上記各経路上の上記各ネットワーク機器の処理性能を推定するものであることを特徴とする請求項1に記載の監視システム。
【請求項3】
上記監視装置は、上記最小遅延時間算出手段により算出された上記経路の各ホップの最小遅延時間を格納する情報格納手段を有し、
上記機器性能推定手段が、
上記各端末から上記経路上の上記各ネットワーク機器との間の遅延時間と、上記情報格納手段に格納される当該経路の各ホップの上記最小遅延時間との差分を求める差分算出部と、
上記差分算出部により求められた当該経路の各ホップの差分値を用いて、当該経路上の上記各ネットワーク機器の処理性能を分析する分析部と
を有する
ことを特徴とする請求項1又は2に記載の監視システム。
【請求項4】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置において、
1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段と、
上記情報収集手段により収集された上記遅延情報に基づき、上記各経路の上記各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段と、
上記最小遅延時間算出手段により算出された上記各経路の各ホップの最小遅延時間を用いて、上記各経路上の上記各ネットワーク機器の処理性能を推定する機器性能推定手段と
を備えることを特徴とする監視装置。
【請求項5】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視プログラムにおいて、
コンピュータを、
1又は複数の端末のそれぞれが計測した、通信先までの経路上に存在する上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を収集する情報収集手段、
上記情報収集手段により収集された上記遅延情報に基づき、上記各経路の上記各ネットワーク機器との間の最小遅延時間をホップ毎に算出する最小遅延時間算出手段、
上記最小遅延時間算出手段により算出された上記各経路の各ホップの最小遅延時間を用いて、上記各経路上の上記各ネットワーク機器の処理性能を推定する機器性能推定手段
として機能させることを特徴とする監視プログラム。
【請求項6】
ネットワークを構成する1又は複数のネットワーク機器の状況を監視する監視装置に監視される端末において、
通信先までの経路上に存在する上記各ネットワーク機器との間の遅延時間を複数開計測する遅延時間計測手段と、
上記遅延時間計測手段により計測された上記経路上の上記各ネットワーク機器との間の複数の遅延時間を有する遅延情報を上記監視装置に通知する情報通知手段と
を備えることを特徴とする端末。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2012−39565(P2012−39565A)
【公開日】平成24年2月23日(2012.2.23)
【国際特許分類】
【出願番号】特願2010−180407(P2010−180407)
【出願日】平成22年8月11日(2010.8.11)
【出願人】(308033722)株式会社OKIネットワークス (165)
【Fターム(参考)】
【公開日】平成24年2月23日(2012.2.23)
【国際特許分類】
【出願日】平成22年8月11日(2010.8.11)
【出願人】(308033722)株式会社OKIネットワークス (165)
【Fターム(参考)】
[ Back to top ]