説明

通信装置、通信システムおよび状態監視方法

【課題】サーバ装置の監視を効率よく行うこと。
【解決手段】サーバ装置110は、監視端末121,122および中央監視端末123から送信される要求信号に応じて自装置の状態を示す状態情報を監視端末121,122および中央監視端末123へ送信する。リソース管理部113は、自装置の負荷状態を示す負荷情報を取得する。制御部114は、リソース管理部113によって取得された負荷情報に基づいて要求信号の送信方式を決定する。制御部114は、決定した送信方式を監視端末121,122および中央監視端末123へ通知する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信を行う通信装置、通信システムおよび状態監視方法に関する。
【背景技術】
【0002】
近年、LTE(Long Term Evolution)の無線基地局のO&M(Operation and Maintenance:保守監視)機構のように、通信装置の遠隔監視が検討されている。遠隔監視システムには、たとえばシンクライアント(Thin client)方式が採用される。シンクライアント方式では、監視端末であるクライアントに最小限の処理をさせ、監視対象であるサーバにより多くの処理を集中させるため、監視端末のソフトウェアがメンテナンスフリーになり保守性が向上する。
【0003】
また、近年の無線通信の高速化に伴って、一つの無線基地局でカバーできる範囲が小さくなってきているため、無線基地局の設置台数が増大している。このため、無線基地局を監視する監視端末の数も増大する。このため、無線基地局を監視する監視端末の数も増大する。これに対して、遠隔監視システムにシンクライアント方式を採用することで、多くの無線基地局を低コストで監視することが検討されている。
【0004】
遠隔監視システムにシンクライアント方式を採用する場合は、クライアントである監視端末の主導によるアクセスとなるため、監視対象のサーバ装置の状態をリアルタイムに監視することができない。また、サーバ装置の状態を監視するためにログインする監視端末の数に比例して、サーバ装置で動作するCGI(Common Gateway Interface)や処理プロセスにより、サーバ装置のメモリやCPU(Central Processing Unit)の使用率が大きくなる。
【0005】
これに対して、監視対象のサーバ装置の状態を監視する方式として、ポーリング(Polling)方式、ロングポーリング(Long Polling)方式、チャンク(Chunk)方式などがある。ポーリング方式においては、クライアントである監視端末が、監視対象のサーバ装置に障害イベントの有無を定期的に問い合わせる(ポーリング)。
【0006】
ロングポーリング方式においては、クライアントである監視端末が、障害イベントの問い合わせ(ポーリング)を、サーバ装置が通知するタイミングまで待機する。チャンク方式においては、監視端末からサーバ装置へのリクエスト信号で確立されるコネクションを維持しながら、サーバ装置が監視端末へ障害イベントを通知する。
【0007】
また、サーバ装置が監視端末の状態情報を入手し、監視端末の処理負荷に応じてレスポンスを送信する周期をスケジューリングする方法が知られている(たとえば、下記特許文献1参照。)。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2006−155505号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、サーバ装置の監視における適切な方式は、サーバ装置の監視を行う監視端末の数や監視端末の優先度などによって異なる。このため、上述した従来技術では、監視端末によるサーバ装置の監視を効率よく行うことができないという問題がある。
【0010】
たとえば、ポーリング方式においては、監視端末による要求信号の送信(ポーリング)の間隔が長いと、障害イベントが発生してからイベント情報が監視端末へ送信されるまでのタイムラグが長くなりリアルタイム性が損なわれる。また、要求信号の送信の間隔が短いと、障害イベントの有無に関係なくサーバ装置やネットワークの負荷が大きくなる。
【0011】
また、ロングポーリング方式やチャンク方式においては、サーバ装置やネットワークの負荷が大きくなりやすいため、一時的に多数の監視端末がサーバ装置の監視を行うと、サーバ装置が通信不能になることがある。この場合は、たとえば、監視端末においてサーバ装置がダウンしたと判断される場合もある。
【0012】
開示の通信装置、通信システムおよび状態監視方法は、上述した問題点を解消するものであり、通信装置の監視を効率よく行うことを目的とする。
【課題を解決するための手段】
【0013】
上述した課題を解決し、目的を達成するため、開示技術は、監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置において、自装置の負荷状態を示す負荷情報を取得し、取得された負荷情報に基づいて前記要求信号の送信方式を決定し、決定された送信方式を前記監視端末へ通知する。
【発明の効果】
【0014】
開示の通信装置、通信システムおよび状態監視方法によれば、通信装置の監視を効率よく行うことができる。
【図面の簡単な説明】
【0015】
【図1】実施の形態にかかる通信システムを示す図である。
【図2】送信方式の決定テーブルの一例を示す図である。
【図3】制御部の動作の一例を示すフローチャートである。
【図4】輻輳状態における送信方式の通知処理の一例を示すフローチャートである。
【図5】非輻輳状態における送信方式の通知処理の一例を示すフローチャートである。
【図6】ポーリング方式による監視動作を示すシーケンス図である。
【図7】ロングポーリング方式による監視動作を示すシーケンス図である。
【図8】チャンク方式による監視動作を示すシーケンス図である。
【図9】通信システムの動作の一例を示すシーケンス図である。
【発明を実施するための形態】
【0016】
以下に図面を参照して、開示技術の好適な実施の形態を詳細に説明する。開示技術は、監視端末がサーバ装置へ状態情報を要求する要求信号の送信方式をサーバ装置の負荷状態に応じて決定し、決定した送信方式をサーバ装置から監視端末へ通知することで、監視端末によるサーバ装置の監視を効率よく行う。
【0017】
(実施の形態)
図1は、実施の形態にかかる通信システムを示す図である。図1に示すように、実施の形態にかかる通信システム100は、サーバ装置110と、監視端末121,122と、中央監視端末123と、予備サーバ130と、を含んでいる。通信システム100においては、サーバ装置110を監視対象とし、クライアントである監視端末121,122および中央監視端末123によってサーバ装置110の状態を監視する。
【0018】
サーバ装置110(通信装置)は、たとえば、移動局との間で無線通信を行う無線基地局である。無線基地局は、たとえばLTEのeNB(evolved Node−B)である。サーバ装置110は、自装置をサーバ、監視端末121,122および中央監視端末123をクライアントとして、たとえばWebサーバ−クライアント方式によるHTTP(HyperText Transfer Protocol)通信を行う。
【0019】
サーバ装置110は、監視端末121,122および中央監視端末123から送信された要求信号に応じて、自装置の状態を示す状態情報を監視端末121,122および中央監視端末123へ送信する。具体的には、サーバ装置110は、装置状態管理部111と、ユーザ管理部112と、リソース管理部113と、制御部114と、通信インターフェース115と、を備えている。
【0020】
装置状態管理部111は、サーバ装置110(自装置)の状態を示す状態情報を取得する。ここでは、サーバ装置110の状態を示す状態情報として、サーバ装置110の障害に関する情報を一例として説明する。具体的には、装置状態管理部111は、障害の発生や障害からの復旧などの障害イベントが発生すると、発生した障害イベントを示すイベント情報を制御部114へ出力する。
【0021】
ユーザ管理部112は、サーバ装置110がサービスを提供しているユーザに関する情報(たとえばユーザの数)を管理する。たとえば、ユーザ管理部112は、サーバ装置110にログインしている監視端末(たとえば監視端末121,122および中央監視端末123)の情報を管理する。また、ユーザ管理部112は、サーバ装置110にログインしている監視端末の優先度の情報を管理する。たとえばユーザ管理部112は、監視端末のサーバ装置110へのログイン時に、監視端末の種別に応じて優先度を設定する。たとえば、中央監視端末123は、監視端末121,122より高い優先度が設定される。
【0022】
リソース管理部113は、サーバ装置110の負荷状態を示す負荷情報を取得する負荷取得部である。負荷情報は、たとえば、ソフトウェアによる処理がサーバ装置110のCPUを占有している時間の割合を示すCPU使用率や、サーバ装置110において処理待ちになっているイベントの数を示すイベント滞留Q(キュー)数などである。また、負荷情報は、サーバ装置110のメモリ使用率や通信量などであってもよい。リソース管理部113は、取得した負荷情報を制御部114へ出力する。
【0023】
制御部114は、リソース管理部113から出力された負荷情報に基づいて、監視端末121,122および中央監視端末123による要求信号の送信方式を決定(スケジューリング)する決定部である。送信方式には、たとえば、次要求起動時間、要求回数、コネクション状態などがパラメータとして含まれる。
【0024】
次要求起動時間は、監視端末121,122および中央監視端末123がサーバ装置110へ要求信号を送信する間隔を示すパラメータである。要求回数は、監視端末121,122および中央監視端末123がサーバ装置110へ要求信号を送信する回数を示すパラメータである。コネクション状態は、要求信号を送信するためのコネクションを、要求信号の送信ごとに切断するか否かを示すパラメータである。
【0025】
たとえば、サーバ装置110のメモリ(記憶部)には、負荷情報と送信方式を対応付ける決定テーブル(たとえば図2参照)が記憶されている。制御部114は、サーバ装置110のメモリに記憶された決定テーブルと、リソース管理部113から出力された負荷情報と、に基づいて送信方式を決定する。または、サーバ装置110のメモリ(記憶部)には、負荷情報から送信方式の各パラメータを算出する算出式が記憶されていてもよい。この場合は、制御部114は、サーバ装置110のメモリに記憶された算出式と、リソース管理部113から出力された負荷情報と、に基づいて送信方式を決定する。
【0026】
また、制御部114は、決定した送信方式を監視端末121,122および中央監視端末123へ通知する通知部である。具体的には、制御部114は、決定した送信方式を示すクリエイタパケットを、通信インターフェース115を介して監視端末121,122および中央監視端末123へ送信する。
【0027】
また、制御部114は、通知した送信方式によって監視端末121,122および中央監視端末123から送信された要求信号を、通信インターフェース115を介して受信する受信部である。たとえば、制御部114は、HTTPリクエストとして送信された要求信号を受信する。また、制御部114は、受信した要求信号に応じて、装置状態管理部111から出力されたイベント情報を、通信インターフェース115を介して監視端末121,122および中央監視端末123へ送信する送信部である。たとえば、制御部114は、HTTPレスポンスとしてイベント情報を送信する。
【0028】
制御部114は、たとえば、受信した要求信号に対して送信するイベント情報とともに、以降の要求信号の送信方式を示すクリエイタパケットを送信する。または、制御部114は、イベント情報とは別にクリエイタパケットを任意のタイミングで送信してもよい。制御部114は、クリエイタパケットを監視端末121,122および中央監視端末123へ送信することで、監視端末121,122および中央監視端末123に対して、制御部114が決定した送信方法によって要求信号を送信させることができる。
【0029】
また、制御部114は、負荷情報が示す負荷量が閾値を超えた場合(輻輳状態)に、予備サーバ130を介してイベント情報を中央監視端末123へ送信することで、イベント情報を予備サーバ130に記憶させる。これにより、サーバ装置110が輻輳状態であっても、中央監視端末123に対してはイベント情報を送信し、中央監視端末123によるサーバ装置110の監視のリアルタイム性を維持することができる。
【0030】
また、制御部114は、負荷情報が示す負荷量が閾値を超えた場合に、非常ビット(ON)と予備サーバ130のアドレスとを含むクリエイタパケットを監視端末121,122へ送信する。非常ビット(ON)は、サーバ装置110が輻輳状態でありイベント情報の要求先をサーバ装置110から予備サーバ130へ切り替えることを示す情報である。
【0031】
これにより、サーバ装置110が輻輳状態の場合に、監視端末121,122からの要求信号に対するイベント情報の送信を予備サーバ130に代行させ、サーバ装置110の負荷を軽減することができる。
【0032】
通信インターフェース115は、ネットワーク10を介して、監視端末121,122、中央監視端末123および予備サーバ130との間で通信を行うインターフェースである。たとえば、ネットワーク10は有線のネットワークであり、通信インターフェース115は有線による通信を行う。
【0033】
監視端末121,122および中央監視端末123のそれぞれは、サーバ装置110によって通知された送信方式によってサーバ装置110へ要求信号を送信する監視端末である。また、監視端末121,122および中央監視端末123のそれぞれは、送信した要求信号に応じてサーバ装置110によって送信されたイベント情報を受信する。監視端末121,122のそれぞれは、受信したイベント情報をユーザへ出力する。
【0034】
また、監視端末121,122のそれぞれは、サーバ装置110から非常ビット(ON)および予備サーバ130のアドレスを含むクリエイタパケットを受信すると、サーバ装置110が輻輳状態である旨をユーザへ表示する。また、監視端末121,122のそれぞれは、クリエイタパケットに含まれる次要求起動時間が0[ms]より長い場合は、次要求起動時間が経過するまでサーバ装置110に対する要求信号の送信を行わない。
【0035】
また、監視端末121,122のそれぞれは、サーバ装置110に対する要求信号の送信を行わない期間において、サーバ装置110のイベント情報を要求する要求信号を予備サーバ130へ送信してもよい。具体的には、監視端末121,122のそれぞれは、クリエイタパケットに含まれる予備サーバ130のアドレスを用いて要求信号を予備サーバ130へ送信する。これにより、輻輳状態のサーバ装置110に負荷をかけずに、サーバ装置110のイベント情報を予備サーバ130から受信することができる。
【0036】
予備サーバ130は、中央監視端末123を宛先とするイベント情報をサーバ装置110から受信すると、受信したイベント情報を中央監視端末123へ転送するとともに、受信したイベント情報を記憶する。また、予備サーバ130は、サーバ装置110のイベント情報を要求する要求信号を監視端末121,122から受信すると、記憶しておいたイベント情報を監視端末121,122へ送信する。これにより、予備サーバ130は、サーバ装置110が輻輳状態の場合に、監視端末121,122からの要求信号に対するイベント情報の送信を代行することができる。
【0037】
図2は、送信方式の決定テーブルの一例を示す図である。サーバ装置110は、たとえば決定テーブル200を自装置のメモリ(記憶部)に記憶している。決定テーブル200においては、サーバ装置110の負荷状態を示すCPU使用率とイベント滞留Q数の組み合わせごとに、要求信号の送信方式が対応付けられている。
【0038】
ここでは、CPU使用率は、「高」「中」「低」の3つの範囲に分けられている。たとえば、制御部114は、CPU使用率が第一閾値より低ければCPU使用率を「低」と判断する。また、制御部114は、CPU使用率が第二閾値(>第一閾値)より高ければCPU使用率を「高」と判断する。また、制御部114は、CPU使用率が第一閾値以上かつ第二閾値以下の範囲であればCPU使用率を「中」と判断する。
【0039】
また、イベント滞留Q数は、「多」「中」「少」の各範囲に分けられている。たとえば、制御部114は、イベント滞留Q数が第三閾値より低ければイベント滞留Q数を「少」と判断する。また、制御部114は、イベント滞留Q数が第四閾値(>第三閾値)より高ければイベント滞留Q数を「多」と判断する。また、制御部114は、イベント滞留Q数が第三閾値以上かつ第四閾値以下の範囲であればイベント滞留Q数を「中」と判断する。
【0040】
たとえば、決定テーブル200において、CPU使用率「高」とイベント滞留Q数「多」の組み合わせには送信方式1が対応付けられている。送信方式1は、次回要求起動時間Tが30[s]、要求回数RNが10、コネクション状態CSが「切断」である方式である。したがって、送信方式1はポーリング方式になる。また、送信方式1には、非常ビットと、予備サーバ130のアドレスを示すDB−IPと、が対応付けられている。
【0041】
また、決定テーブル200において、CPU使用率「高」とイベント滞留Q数「少」の組み合わせには送信方式3が対応付けられている。送信方式3は、次回要求起動時間Tが30[s]、要求回数RNが1、コネクション状態CSが「切断」である方式である。したがって、送信方式3はポーリング方式になる。また、送信方式3には、非常ビットと、予備サーバ130のアドレスを示すDB−IPと、が対応付けられている。
【0042】
また、決定テーブル200において、CPU使用率「低」とイベント滞留Q数「多」の組み合わせには送信方式7が対応付けられている。送信方式7は、次回要求起動時間Tが0[ms]、要求回数RNが10、コネクション状態CSが「継続」である方式である。したがって、送信方式7はチャンク方式になる。
【0043】
また、決定テーブル200において、CPU使用率「低」とイベント滞留Q数「少」の組み合わせには送信方式9が対応付けられている。送信方式9は、次回要求起動時間Tが0[ms]、要求回数RNが1、コネクション状態CSが「切断」である方式である。したがって、送信方式9はロングポーリング方式になる。
【0044】
制御部114は、CPU使用率とイベント滞留Q数をリソース管理部113から取得し、取得したCPU使用率とイベント滞留Q数の組み合わせに対応する送信方式を決定テーブル200から選択する。これにより、サーバ装置110の負荷情報に基づいて送信方式を決定することができる。制御部114は、決定した送信方式を示すクリエイタパケットを監視端末121,122および中央監視端末123へ送信する。
【0045】
また、制御部114は、送信方式を決定する対象の監視端末の種別およびサーバ装置110の負荷情報に基づいて送信方式を決定してもよい。たとえば、サーバ装置110は、送信方式を決定する対象の監視端末の種別ごとに異なる決定テーブル200をメモリに記憶する。そして、制御部114は、取得したCPU使用率とイベント滞留Q数の組み合わせに対応する送信方式を、送信方式を決定する対象の監視端末の種別に対応する決定テーブル200から選択する。これにより、送信方式を決定する対象の監視端末の種別およびサーバ装置110の負荷情報に基づいて送信方式を決定することができる。
【0046】
また、制御部114は、送信方式を決定する対象の監視端末の種別が特定の種別である場合(たとえば中央監視端末123)は、決定テーブル200によらず、あらかじめ記憶しておいた特定の送信方式を選択するようにしてもよい。たとえば、中央監視端末123についてはロングポーリング方式またはチャンク方式を選択することで、中央監視端末123によるサーバ装置110の監視のリアルタイム性を向上させることができる。
【0047】
このように、決定テーブル200においては、大きな負荷量を示す負荷情報ほど、サーバ装置110の負荷量が小さい送信方式が対応付けられている。これにより、制御部114は、サーバ装置110の負荷量が大きいほど、サーバ装置110の負荷量が小さい送信方式を選択することができる。このため、サーバ装置110の負荷量が大きい場合にサーバ装置110の負荷を低減することができる。
【0048】
一方、決定テーブル200においては、小さな負荷量を示す負荷情報ほど、監視のリアルタイム性(即時性)が高い送信方式が対応付けられている。これにより、制御部114は、サーバ装置110の負荷量が小さいほど、監視のリアルタイム性が高い送信方式を選択することができる。このため、サーバ装置110の負荷量が小さい場合に監視のリアルタイム性を向上させることができる。
【0049】
ただし、決定テーブル200における負荷情報と送信方式の関係はこれに限らず、各方式の特性やサーバ装置110の適用先に応じて柔軟に設定することができる。なお、ここではCPU使用率とイベント滞留Q数の組み合わせに基づいて送信方式を決定する方法について説明したが、送信方式を決定する方法についてはこれに限らない。たとえば、CPU使用率またはイベント滞留Q数に基づいて送信方式を決定してもよい。また、CPU使用率やイベント滞留Q数の他に、サーバ装置110のメモリ使用率や通信量などに基づいて送信方式を決定してもよい。
【0050】
図3は、制御部の動作の一例を示すフローチャートである。サーバ装置110の制御部114は、たとえば以下の各ステップを実行する。まず、装置状態管理部111からの出力に基づいて障害イベントが発生したか否かを判断し(ステップS301)、障害イベントが発生するまで待つ(ステップS301:Noのループ)。障害イベントが発生すると(ステップS301:Yes)、自装置のCPU使用率およびイベント滞留Q数をリソース管理部113から取得する(ステップS302)。
【0051】
つぎに、ステップS302によって取得されたCPU使用率が「高」であるか否かを判断する(ステップS303)。取得されたCPU使用率が「高」である場合(ステップS303:Yes)は、輻輳状態における送信方式の通知処理(たとえば図4参照)を実行し(ステップS304)、一連の動作を終了する。取得されたCPU使用率が「中」または「低」である場合(ステップS303:No)は、非輻輳状態における送信方式の通知処理(たとえば図5参照)を実行し(ステップS305)、一連の動作を終了する。
【0052】
図4は、輻輳状態における送信方式の通知処理の一例を示すフローチャートである。サーバ装置110の制御部114は、図3のステップS304に示した輻輳状態における送信方式の通知処理として、サーバ装置110にログインしている監視端末ごとに、たとえば以下の各ステップを実行する。なお、サーバ装置110にログインしている監視端末は、ここでは監視端末121,122および中央監視端末123であるとする。
【0053】
まず、対象の監視端末が中央監視端末123であるか否かを判断する(ステップS401)。対象の監視端末が中央監視端末123である場合(ステップS401:Yes)は、図3のステップS302によって取得されたイベント滞留Q数が「多」であるか否かを判断する(ステップS402)。イベント滞留Q数が「多」である場合(ステップS402:Yes)は、決定テーブル200から送信方式7を選択し(ステップS403)、ステップS407へ移行する。
【0054】
ステップS402において、イベント滞留Q数が「多」でない場合(ステップS402:No)は、イベント滞留Q数が「中」であるか否かを判断する(ステップS404)。イベント滞留Q数が「中」である場合(ステップS404:Yes)は、決定テーブル200から送信方式8を選択し(ステップS405)、ステップS407へ移行する。
【0055】
ステップS404において、イベント滞留Q数が「少」である場合(ステップS404:No)は、決定テーブル200から送信方式9を選択する(ステップS406)。つぎに、イベント情報と、ステップS403,S405,S406のいずれかによって選択された送信方式を示すクリエイタパケットと、を予備サーバ130へ送信し(ステップS407)、一連の動作を終了する。ステップS407によって送信されるイベント情報は、図3のステップS301において発生した障害イベントを示すイベント情報である。
【0056】
ステップS401において、対象の監視端末が監視端末121,122のいずれかである場合(ステップS401:No)は、サーバ装置110のメモリに記憶されている非常ビットがONか否かを判断する(ステップS408)。非常ビットがONである場合(ステップS408:Yes)は、一連の動作を終了する。これにより、サーバ装置110の輻輳状態が継続している場合は、監視端末121,122に対する応答を行わずにサーバ装置110の負荷を軽減することができる。
【0057】
ステップS408において非常ビットがOFFである場合(ステップS408:No)は、非常ビットをONにする(ステップS409)。つぎに、図3のステップS302によって取得されたイベント滞留Q数が「多」であるか否かを判断する(ステップS410)。イベント滞留Q数が「多」である場合(ステップS410:Yes)は、決定テーブル200から送信方式1を選択し(ステップS411)、ステップS415へ移行する。
【0058】
ステップS410において、イベント滞留Q数が「多」でない場合(ステップS410:No)は、イベント滞留Q数が「中」であるか否かを判断する(ステップS412)。イベント滞留Q数が「中」である場合(ステップS412:Yes)は、決定テーブル200から送信方式2を選択し(ステップS413)、ステップS415へ移行する。
【0059】
ステップS412において、イベント滞留Q数が「少」である場合(ステップS412:No)は、決定テーブル200から送信方式3を選択し(ステップS414)、ステップS415へ移行する。つぎに、ステップS411,S413,S414のいずれかによって選択された送信方式を示すクリエイタパケットを対象の監視端末へ送信し(ステップS415)、一連の動作を終了する。
【0060】
ステップS415によって送信されるクリエイタパケットには、ステップS409によってONにされた非常ビットおよび予備サーバ130のアドレスが含まれる(たとえば図2参照)。これにより、監視端末121,122に対して、サーバ装置110のイベント情報の要求先をサーバ装置110から予備サーバ130に切り替えさせることができる。
【0061】
図5は、非輻輳状態における送信方式の通知処理の一例を示すフローチャートである。サーバ装置110の制御部114は、図3のステップS305に示した非輻輳状態における送信方式の通知処理として、サーバ装置110にログインしている監視端末ごとに、たとえば以下の各ステップを実行する。なお、サーバ装置110にログインしている監視端末は、たとえば監視端末121,122および中央監視端末123である。
【0062】
図5に示すステップS501〜S506は、図4に示したステップS401〜S406と同様であるため説明を省略する。ステップS503,S505,S506のいずれかのつぎに、イベント情報とクリエイタパケットを中央監視端末123へ送信し(ステップS507)、一連の動作を終了する。ステップS507によって送信されるイベント情報は、図3のステップS301において発生した障害イベントを示すイベント情報である。ステップS507によって送信されるクリエイタパケットは、ステップS503,S505,S506のいずれかによって選択された送信方式を示すクリエイタパケットである。
【0063】
ステップS501において対象の監視端末が監視端末121,122のいずれかである場合(ステップS501:No)は、サーバ装置110のメモリに記憶されている非常ビットがONであるか否かを判断する(ステップS508)。非常ビットがOFFである場合(ステップS508:No)はステップS510へ移行する。非常ビットがONである場合(ステップS508:Yes)は非常ビットをOFFにする(ステップS509)。
【0064】
図5に示すステップS510〜S514は、図4に示したステップS410〜S414と同様であるため説明を省略する。ただし、ステップS511において、図3のステップS302により取得されたCPU使用率が「中」である場合は決定テーブル200から送信方式4を選択し、CPU使用率が「低」である場合は送信方式7を選択する。
【0065】
また、ステップS513において、図3のステップS302により取得されたCPU使用率が「中」である場合は決定テーブル200から送信方式5を選択し、CPU使用率が「低」である場合は送信方式8を選択する。また、ステップS514において、図3のステップS302により取得されたCPU使用率が「中」である場合は決定テーブル200から送信方式6を選択し、CPU使用率が「低」である場合は送信方式9を選択する。
【0066】
ステップS511,S513,S514のいずれかのつぎに、イベント情報とクリエイタパケットを対象の監視端末へ送信し(ステップS515)、一連の動作を終了する。ステップS515によって送信されるイベント情報は、図3のステップS301において発生した障害イベントを示すイベント情報である。ステップS515によって送信されるクリエイタパケットは、ステップS511,S513,S514のいずれかによって選択された送信方式を示すクリエイタパケットである。
【0067】
図3〜図5に示した動作を繰り返し実行することで、サーバ装置110は、障害イベントが発生するごとに、発生した障害イベントを示すイベント情報を各監視端末へ送信することができる。また、サーバ装置110は、イベント情報の送信とともに、自装置の負荷状態に基づいて決定した送信方式を各監視端末へ通知することができる。
【0068】
また、サーバ装置110は、自装置が輻輳状態である場合には、監視端末121,122からの要求信号に対する応答を予備サーバ130に代行させることができる。ただし、サーバ装置110は、中央監視端末123からの要求信号に対する応答は継続することで、中央監視端末123による監視のリアルタイム性を維持することができる。
【0069】
図6は、ポーリング方式による監視動作を示すシーケンス図である。ここでは、監視端末121による監視動作について説明するが、監視端末122や中央監視端末123による監視動作についても同様である。ポーリング方式においては、まず、監視端末121が、要求信号をサーバ装置110へ送信する(ステップS601)。これにより、監視端末121とサーバ装置110との間にコネクションが確立される。
【0070】
このとき、サーバ装置110の装置状態管理部111から制御部114へイベント情報1が出力されているとする。サーバ装置110の制御部114は、ステップS601によって送信された要求信号に応じて、装置状態管理部111から出力されたイベント情報1を監視端末121へ送信する(ステップS602)。これにより、監視端末121とサーバ装置110との間に確立されたコネクションが切断される。
【0071】
つぎに、監視端末121は、ステップS601によって要求信号を送信してから次回要求起動時間Tの経過後に、要求信号をサーバ装置110へ送信する(ステップS603)。これにより、監視端末121とサーバ装置110との間にコネクションが確立される。
【0072】
このとき、サーバ装置110の装置状態管理部111から制御部114へイベント情報2が出力されているとする。サーバ装置110の制御部114は、ステップS603によって送信された要求信号に応じて、装置状態管理部111から出力されたイベント情報2を監視端末121へ送信する(ステップS604)。これにより、監視端末121とサーバ装置110との間に確立されたコネクションが切断される。
【0073】
このように、ポーリング方式においては、所定のインターバルごとに監視端末121からサーバ装置110へ要求信号を発行し、監視端末121から要求信号が発行されるごとにサーバ装置110から監視端末121へイベント情報1を送信する。たとえば、サーバ装置110が送信するクリエイタパケットにおいて、次回要求起動時間Tを0[ms]より大きくしてコネクション状態CSを「切断」とすると、ポーリング方式となる。
【0074】
ポーリング方式においては、監視端末による要求信号の送信(ポーリング)の間隔が長いと、障害イベントが発生してからイベント情報が監視端末へ送信されるまでのタイムラグが長くなり、リアルタイム性が損なわれる。また、ポーリング方式において、監視端末による要求信号の送信の間隔が短いと、障害イベントの有無に関係なく負荷サーバ装置やネットワークの負荷が大きくなる。
【0075】
図7は、ロングポーリング方式による監視動作を示すシーケンス図である。ここでは、監視端末121による監視動作について説明するが、監視端末122や中央監視端末123による監視動作についても同様である。ロングポーリング方式においては、まず、監視端末121が、要求信号をサーバ装置110へ送信する(ステップS701)。これにより、監視端末121とサーバ装置110との間にコネクションが確立される。
【0076】
サーバ装置110の制御部114は、装置状態管理部111からイベント情報1が出力されるのを待って、ステップS701によって送信された要求信号に応じて監視端末121へイベント情報1を送信する(ステップS702)。これにより、監視端末121とサーバ装置110との間に確立されたコネクションが切断される。
【0077】
つぎに、監視端末121は、ステップS702によってイベント情報1を受信すると、要求信号をサーバ装置110へ送信(即時要求)する(ステップS703)。これにより、監視端末121とサーバ装置110との間にコネクションが確立される。
【0078】
つぎに、サーバ装置110の制御部114は、装置状態管理部111からイベント情報2が出力されるのを待って、ステップS703によって送信された要求信号に応じて監視端末121へイベント情報2を送信する(ステップS704)。これにより、監視端末121とサーバ装置110との間に確立されたコネクションが切断される。
【0079】
このように、ロングポーリング方式においては、イベント情報の送信のためのコネクションを確立しておき、イベントが発生したときに、確立しておいたコネクションを用いてイベント情報を送信する。イベント情報を送信すると、コネクションが一旦切断され、監視端末121からサーバ装置110へ要求信号が再度発行される。たとえば、サーバ装置110が送信するクリエイタパケットにおいて、次回要求起動時間Tを0としてコネクション状態CSを「切断」とすると、ロングポーリング方式となる。
【0080】
ロングポーリング方式においては、障害イベントが輻輳すると、イベント情報の送信のためのコネクションの接続および切断が頻繁に発生するため、サーバ装置の負荷が大きくなる。また、ロングポーリング方式においては、単位時間あたりの障害イベントに対してのスケーラビリティ(拡張性)が低い。
【0081】
図8は、チャンク方式による監視動作を示すシーケンス図である。ここでは、監視端末121による監視動作について説明するが、監視端末122や中央監視端末123による監視動作についても同様である。チャンク方式においては、まず、監視端末121が、要求信号をサーバ装置110へ送信する(ステップS801)。これにより、監視端末121とサーバ装置110との間にコネクションが確立される。
【0082】
つぎに、サーバ装置110の制御部114は、装置状態管理部111からイベント情報1が出力されるのを待って、ステップS801によって確立されたコネクションによって監視端末121へイベント情報1を送信する(ステップS802)。制御部114は、イベント情報1を送信しても、監視端末121との間のコネクションを継続する。
【0083】
つぎに、サーバ装置110の制御部114は、装置状態管理部111からイベント情報2が出力されるのを待って、ステップS801によって確立されたコネクションによって監視端末121へイベント情報2を送信する(ステップS803)。制御部114は、イベント情報2を送信しても、監視端末121との間のコネクションを継続する。
【0084】
つぎに、サーバ装置110の制御部114は、装置状態管理部111からイベント情報3が出力されるのを待って、ステップS801によって確立されたコネクションによって監視端末121へイベント情報3を送信する(ステップS804)。制御部114は、イベント情報3を送信しても、監視端末121との間のコネクションを継続する。
【0085】
このように、チャンク方式においては、イベント情報の送信のためのコネクションを確立しておき、イベントが発生したときに、確立しておいたコネクションを用いてイベント情報を送信する。また、イベント情報を送信してもコネクションを継続し、監視端末121からサーバ装置110への要求信号の再度の発行は行わない。たとえば、サーバ装置110が送信するクリエイタパケットにおいて、次回要求起動時間Tを0としてコネクション状態CSを「継続」とすると、チャンク方式となる。
【0086】
チャンク方式においては、イベント情報を送信するためのコネクションが確立されたままになるため、障害イベントが発生していない場合は無駄な処理が発生する。また、イベント情報を送信するためのコネクションが切断されると、サーバ装置において障害イベントが発生しても監視端末にイベント情報を送信することができない。
【0087】
図9は、通信システムの動作の一例を示すシーケンス図である。ここでは、期間T1においてはサーバ装置110が低負荷状態(たとえばCPU使用率が「低」かつイベント滞留Q数が「少」)である。また、期間T1の後の期間T2においてはサーバ装置110が高負荷状態(たとえばCPU使用率が「高」かつイベント滞留Q数が「多」)である。
【0088】
また、期間T1においては、初期状態として、ロングポーリング方式による監視動作(たとえば図7参照)が行われているとする。まず、監視端末121,122および中央監視端末123が、サーバ装置110の状態情報を要求する要求信号(Request)をサーバ装置110へ送信する(ステップS901〜S903)。つぎに、サーバ装置110において障害イベントE1が発生したとする。
【0089】
つぎに、サーバ装置110が、ステップS901において中央監視端末123からの要求信号を受信しているため、応答信号(Response)およびクリエイタパケット(Creator)を中央監視端末123へ送信する(ステップS904)。ステップS904によって送信される応答信号には、障害イベントE1を示すイベント情報が含まれている。また、期間T1においてはサーバ装置110が低負荷状態であるため、ステップS904によって送信されるクリエイタパケットには、次要求起動時間(T:0[ms])と要求回数(RN:1)とが含まれている。
【0090】
つぎに、中央監視端末123が、ステップS904によって送信されたクリエイタパケットに基づいて、待機時間なしで要求信号を1回、サーバ装置110へ送信(即時要求)する(ステップS905)。また、中央監視端末123は、ステップS904によって送信されたイベント情報の処理(たとえばユーザへの表示)を行う。
【0091】
つぎに、サーバ装置110が、ステップS902において監視端末121からの要求信号を受信しているため、応答信号およびクリエイタパケットを監視端末121へ送信する(ステップS906)。ステップS906によって送信される応答信号には、障害イベントE1を示すイベント情報が含まれている。また、期間T1においてはサーバ装置110が低負荷状態であるため、ステップS906によって送信されるクリエイタパケットには、次要求起動時間(T:0[ms])と要求回数(RN:1)とが含まれている。
【0092】
つぎに、監視端末121が、ステップS906によって受信したクリエイタパケットに基づいて、待機時間なしで要求信号を1回、サーバ装置110へ送信(即時要求)する(ステップS907)。また、監視端末121は、ステップS906によって送信されたイベント情報の処理(たとえばユーザへの表示)を行う。
【0093】
つぎに、サーバ装置110が、ステップS903において監視端末122からの要求信号を受信しているため、応答信号およびクリエイタパケットを監視端末122へ送信する(ステップS908)。ステップS908によって送信される応答信号には、障害イベントE1を示すイベント情報が含まれている。また、期間T1においてはサーバ装置110が低負荷状態であるため、ステップS908によって送信されるクリエイタパケットには、次要求起動時間(T:0[ms])と要求回数(RN:1)とが含まれている。
【0094】
つぎに、監視端末122が、ステップS908によって受信したクリエイタパケットに基づいて、待機時間なしで要求信号を1回、サーバ装置110へ送信(即時要求)する(ステップS909)。また、監視端末122は、ステップS908によって送信されたイベント情報の処理(たとえばユーザへの表示)を行う。
【0095】
つぎに、サーバ装置110において新たな障害イベントE2が発生したとする。つぎに、サーバ装置110が、ステップS905において中央監視端末123からの要求信号を受信しているため、応答信号およびクリエイタパケットを送信する(ステップS910)。ステップS910によって送信される応答信号には、障害イベントE2を示すイベント情報が含まれている。ステップS910によって送信されるクリエイタパケットには、次要求起動時間(T:0[ms])と要求回数(RN:1)とが含まれている。また、期間T2においてはサーバ装置110が高負荷状態であり、かつイベント情報の要求元が中央監視端末123であるため、ステップS910において応答信号およびクリエイタパケットは予備サーバ130へ送信される。
【0096】
つぎに、予備サーバ130が、ステップS910によって送信された応答信号およびクリエイタパケットを中央監視端末123へ転送する(ステップS911)。また、予備サーバ130は、ステップS910によって送信された応答信号に含まれるイベント情報を記憶しておく。つぎに、中央監視端末123が、ステップS911によって送信されたクリエイタパケットに基づいて、待機時間なしで要求信号を1回、サーバ装置110へ送信する(ステップS912)。また、中央監視端末123は、ステップS911によって送信されたイベント情報の処理(たとえばユーザへの表示)を行う。
【0097】
つぎに、サーバ装置110が、ステップS907において監視端末121からの要求信号を受信しているため、応答信号およびクリエイタパケットを監視端末121へ送信する(ステップS913)。ステップS913によって送信される応答信号には、障害イベントE2を示すイベント情報が含まれている。
【0098】
また、サーバ装置110が高負荷状態であるため、ステップS913によって送信されるクリエイタパケットには、次要求起動時間(T:30[s])、要求回数(RN:1)、非常ビット(ON)および予備サーバ130のアドレス(DB−IP)が含まれている。監視端末121は、ステップS913によって送信されたクリエイタパケット(T:30[s])に基づいて30[s]のタイマを設定する。
【0099】
つぎに、サーバ装置110が、ステップS909において監視端末122からの要求信号を受信しているため、応答信号およびクリエイタパケットを監視端末122へ送信する(ステップS914)。ステップS914によって送信される応答信号には、障害イベントE2を示すイベント情報が含まれている。
【0100】
また、サーバ装置110が高負荷状態であるため、ステップS914によって送信されるクリエイタパケットには、次要求起動時間(T:30[s])、要求回数(RN:1)、非常ビット(ON)および予備サーバ130のアドレス(DB−IP)が含まれている。監視端末122は、ステップS914によって送信されたクリエイタパケット(T:30[s])に基づいて30[s]のタイマを設定する。
【0101】
つぎに、サーバ装置110において新たな障害イベントE3が発生したとする。つぎに、サーバ装置110が、ステップS912において中央監視端末123からの要求信号を受信しているため、応答信号およびクリエイタパケットを送信する(ステップS915)。ステップS915によって送信される応答信号には、障害イベントE3を示すイベント情報が含まれている。ステップS915によって送信されるクリエイタパケットには、次要求起動時間(T:0[ms])と要求回数(RN:1)とが含まれている。また、期間T2においてはサーバ装置110が高負荷状態であり、かつイベント情報の要求元が中央監視端末123であるため、ステップS915においてクリエイタパケットは予備サーバ130へ送信される。
【0102】
つぎに、予備サーバ130が、ステップS915によって送信された応答信号およびクリエイタパケットを中央監視端末123へ転送する(ステップS916)。また、予備サーバ130は、ステップS915によって送信された応答信号に含まれるイベント情報を記憶しておく。つぎに、中央監視端末123が、ステップS916によって送信されたクリエイタパケットに基づいて、待機時間なしで要求信号を1回、サーバ装置110へ送信する(ステップS917)。また、中央監視端末123は、ステップS916によって送信されたイベント情報の処理(たとえばユーザへの表示)を行う。
【0103】
つぎに、監視端末121が、ステップS913によって受信したクリエイタパケットに非常ビット(ON)が含まれているため、クリエイタパケットに含まれるアドレスに基づいて予備サーバ130へ要求信号を送信する(ステップS918)。つぎに、予備サーバ130が、ステップS918によって送信された要求信号に応じて応答信号を監視端末121へ送信する(ステップS919)。ステップS919によって送信される応答信号には、サーバ装置110から受信して記憶しているイベント情報が含まれる。サーバ装置110から受信して記憶しているイベント情報には、たとえば障害イベントE2,E3を示すイベント情報が含まれる。
【0104】
つぎに、ステップS913において監視端末121が設定した30[s]のタイマが満了したとする。監視端末121は、ステップS913によって送信されたクリエイタパケットに基づいて、要求信号を1回、サーバ装置110へ送信する(ステップS920)。つぎに、ステップS914において監視端末122が設定した30[s]のタイマが満了したとする。監視端末122は、ステップS914によって送信されたクリエイタパケットに基づいて、要求信号を1回、サーバ装置110へ送信する(ステップS921)。
【0105】
このように、実施の形態にかかる通信システム100においては、監視端末121,122および中央監視端末123がサーバ装置110へ状態情報を要求する要求信号の送信方式をサーバ装置110の負荷状態に応じて決定する。そして、決定した送信方式をサーバ装置110から各監視端末へ通知することで、各監視端末によるサーバ装置110の監視を効率よく行うことができる。
【0106】
具体的には、サーバ装置110の負荷が比較的大きい場合は、たとえば次回要求起動時間Tを比較的長く設定したポーリング方式を用いることで、監視によるサーバ装置110の負荷を軽減することができる。これにより、たとえばサーバ装置110が通信不能と判断されたりして、正確な監視ができなくなることを回避することができる。
【0107】
また、サーバ装置110の負荷が比較的小さい場合は、たとえばロングポーリング方式やチャンク方式を用いることで、監視のリアルタイム性を向上させることができる。また、サーバ装置110の負荷が比較的小さい場合は、次回要求起動時間Tを比較的短く設定したポーリング方式を用いてもよい。この場合も、障害イベントが発生してからイベント情報が監視端末へ送信されるまでのタイムラグが短くなり、監視のリアルタイム性を向上させることができる。
【0108】
たとえば、サーバ装置110を無線基地局に適用すれば、無線基地局の負荷の増大を抑えつつ、無線基地局の状態を遠隔監視することができる。これにより、無線基地局による移動局の呼などの処理に与える影響を抑えつつ、無線基地局の状態を遠隔監視して保守を行うことができる。
【0109】
以上説明したように、通信装置、通信システムおよび状態監視方法によれば、通信装置の監視を効率よく行うことができる。上述した実施の形態に関し、さらに以下の付記を開示する。
【0110】
(付記1)監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置において、
自装置の負荷状態を示す負荷情報を取得する負荷取得部と、
前記負荷取得部によって取得された負荷情報に基づいて前記要求信号の送信方式を決定する決定部と、
前記決定部によって決定された送信方式を前記監視端末へ通知する通知部と、
を備えることを特徴とする通信装置。
【0111】
(付記2)前記通知部によって通知された送信方式によって前記監視端末から送信された前記要求信号を受信する受信部と、
前記受信部によって受信された要求信号に応じて前記状態情報を前記監視端末へ送信する送信部と、
を備えることを特徴とする付記1に記載の通信装置。
【0112】
(付記3)前記決定部は、前記監視端末の種別および前記負荷情報に基づいて前記送信方式を決定することを特徴とする付記1または2に記載の通信装置。
【0113】
(付記4)前記送信部は、前記負荷情報が示す負荷量が閾値を超えた場合に前記状態情報を他の通信装置へ送信し、
前記通知部は、前記負荷量が閾値を超えた場合に、前記状態情報の要求先を前記他の通信装置に切り替える旨の情報と、前記他の通信装置のアドレスと、を前記監視端末へ通知することを特徴とする付記2に記載の通信装置。
【0114】
(付記5)前記負荷情報と前記送信方式とを対応付けるテーブルを記憶する記憶部を備え、
前記決定部は、前記記憶部によって記憶されたテーブルと前記負荷情報とに基づいて前記送信方式を決定することを特徴とする付記1〜4のいずれか一つに記載の通信装置。
【0115】
(付記6)前記テーブルは、大きな負荷量を示す負荷情報ほど、自装置の負荷が小さい送信方式を対応付けていることを特徴とする付記5に記載の通信装置。
【0116】
(付記7)前記決定部は、自装置へ前記要求信号を送信する間隔を含む前記送信方式を決定することを特徴とする付記1〜6のいずれか一つに記載の通信装置。
【0117】
(付記8)前記決定部は、自装置へ前記要求信号を送信するためのコネクションを、前記要求信号の送信ごとに切断するか否かを含む前記送信方式を決定することを特徴とする付記1〜7のいずれか一つに記載の通信装置。
【0118】
(付記9)前記決定部は、自装置へ前記要求信号を送信する回数を含む前記送信方式を決定することを特徴とする付記1〜8のいずれか一つに記載の通信装置。
【0119】
(付記10)監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置であって、自装置の負荷状態に基づいて前記要求信号の送信方式を決定し、決定した送信方式を前記監視端末へ通知する通信装置と、
前記通信装置によって通知された送信方式によって前記通信装置へ前記要求信号を送信し、送信した要求信号に応じて前記通信装置から送信された前記状態情報を受信する監視端末と、
を含むことを特徴とする通信システム。
【0120】
(付記11)監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置が、自装置の負荷状態に基づいて前記要求信号の送信方式を決定する決定工程と、
前記通信装置が、前記決定工程によって決定された送信方式を前記監視端末へ通知する通知工程と、
前記監視端末が、前記通知工程によって通知された送信方式によって前記通信装置へ前記要求信号を送信する第一送信工程と、
前記通信装置が、前記第一送信工程によって送信された要求信号に応じて前記監視端末へ前記状態情報を送信する第二送信工程と、
を含むことを特徴とする状態監視方法。
【符号の説明】
【0121】
10 ネットワーク
100 通信システム
110 サーバ装置
121,122 監視端末
123 中央監視端末
130 予備サーバ
200 決定テーブル
E1〜E3 障害イベント

【特許請求の範囲】
【請求項1】
監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置において、
自装置の負荷状態を示す負荷情報を取得する負荷取得部と、
前記負荷取得部によって取得された負荷情報に基づいて前記要求信号の送信方式を決定する決定部と、
前記決定部によって決定された送信方式を前記監視端末へ通知する通知部と、
を備えることを特徴とする通信装置。
【請求項2】
前記通知部によって通知された送信方式によって前記監視端末から送信された前記要求信号を受信する受信部と、
前記受信部によって受信された要求信号に応じて前記状態情報を前記監視端末へ送信する送信部と、
を備えることを特徴とする請求項1に記載の通信装置。
【請求項3】
前記決定部は、前記監視端末の種別および前記負荷情報に基づいて前記送信方式を決定することを特徴とする請求項1または2に記載の通信装置。
【請求項4】
前記送信部は、前記負荷情報が示す負荷量が閾値を超えた場合に前記状態情報を他の通信装置へ送信し、
前記通知部は、前記負荷量が閾値を超えた場合に、前記状態情報の要求先を前記他の通信装置に切り替える旨の情報と、前記他の通信装置のアドレスと、を前記監視端末へ通知することを特徴とする請求項2に記載の通信装置。
【請求項5】
監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置であって、自装置の負荷状態に基づいて前記要求信号の送信方式を決定し、決定した送信方式を前記監視端末へ通知する通信装置と、
前記通信装置によって通知された送信方式によって前記通信装置へ前記要求信号を送信し、送信した要求信号に応じて前記通信装置から送信された前記状態情報を受信する監視端末と、
を含むことを特徴とする通信システム。
【請求項6】
監視端末から送信される要求信号に応じて自装置の状態を示す状態情報を前記監視端末へ送信する通信装置が、自装置の負荷状態に基づいて前記要求信号の送信方式を決定する決定工程と、
前記通信装置が、前記決定工程によって決定された送信方式を前記監視端末へ通知する通知工程と、
前記監視端末が、前記通知工程によって通知された送信方式によって前記通信装置へ前記要求信号を送信する第一送信工程と、
前記通信装置が、前記第一送信工程によって送信された要求信号に応じて前記監視端末へ前記状態情報を送信する第二送信工程と、
を含むことを特徴とする状態監視方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−211253(P2011−211253A)
【公開日】平成23年10月20日(2011.10.20)
【国際特許分類】
【出願番号】特願2010−73753(P2010−73753)
【出願日】平成22年3月26日(2010.3.26)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】