説明

データ管理システム、管理サーバ、データ管理方法およびデータ管理用プログラム

【課題】管理サーバの負荷を軽減しつつ、ネットワークトラフィックの増大を招かず、データ保存を効率よく行うことができる。
【解決手段】複数の収集用管理サーバ2−1〜2−Nが複数のノード3−1〜3−Nからデータを定期的に収集する。主管理サーバ1は、複数の収集用管理サーバによって収集されたデータをデータ記憶部1Eに記憶するデータ記憶処理部1Aと、全ての管理サーバの情報および複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部1Fに記憶する構成情報記憶処理部1Bと、複数の収集用管理サーバと構成情報を共有するための処理を実行する構成情報共有処理部1Cと、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して所定ノードのデータをデータ記憶部1Eから取得し、取得したデータを外部端末に送信するデータ提供部1Dとを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、大規模コンピュータシステムにおける複数の対象ノードからデータを収集するデータ管理システム、管理サーバ、データ管理方法およびデータ管理用プログラムに関する。
【背景技術】
【0002】
大規模コンピュータシステムにおいて、対象ノードからの時系列リアルタイムデータ(性能値、障害情報、ログ等)を効率的に収集し、収集したデータを保存したり参照したりすることが行われている。
【0003】
ここで、大規模コンピュータシステム内に大量に存在する対象ノードからのデータ収集やデータ保存を担当する管理サーバを、システム対して一台設置して運用した場合、頻繁に管理サーバが過負荷状態になり、データ収集漏れ等の不具合が発生することが考えられる。
【0004】
管理サーバの過負荷状態を回避するための方法として、データ収集間隔を大きくする方法が考えられる。しかし、この方法では、データの粒度が大きくなり、リアルタイム性が損なわれるデメリットが発生する可能性がある。また、管理サーバの過負荷状態を回避するための方法として、複数の管理サーバで作業を分担する方法が考えられる。しかし、後者については、複数の管理サーバにまたがってデータが管理されるため、情報を一括で参照、処理することができないというデメリットがあった。
【0005】
上記のデメリット(問題点)を解決する方法の一つとして、下記の特許文献1に提案されている方法が挙げられる。当該特許文献1には、ネットワークに接続された複数のノードをグループに分けてネットワークグループを構成し、ネットワークグループ毎にネットワーク監視サーバを設置し、各ネットワークグループのネットワーク監視サーバが、他のネットワーク監視サーバの持っている管理情報を取得し共有することにより、ネットワークの監視を行うネットワーク分散管理システムが記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2001−144761号公報(段落0017,0020等)
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述したように、特許文献1には、管理サーバを複数台用意し、複数台の管理サーバにおいて管理情報を共有することで、管理サーバの負荷を低減し、大規模なコンピュータシステムを監視可能である旨記載されている。しかし、複数台の管理サーバですべての情報を共有する構成であると、大量のログや性能値(性能データ)などのトレンドデータを扱う場合、共有する情報の量が大量となり、ネットワークトラフィックの増大が発生することが考えられる。また、性能値、障害情報、ログ等のようなリアルタイムデータを蓄積することを考えた場合、データが冗長であるため、システム全体として、データの保存効率が非常に悪いという問題もある。
【0008】
本発明は、上記のような課題を解決するためになされたものであり、管理サーバの負荷を軽減しつつ、大量のデータを管理する場合でもネットワークトラフィックの増大を招かず、データ保存を効率よく行うことができるデータ管理システム、管理サーバ、データ管理方法およびデータ管理用プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
以上の目的を達成するため、本発明によるデータ管理システムは、管理対象システム内の複数のノードからデータを定期的に収集する複数の収集用管理サーバと、当該複数の収集用管理サーバを管理する主管理サーバとを備え、当該主管理サーバは、複数の収集用管理サーバによって複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理部と、全ての管理サーバの情報および複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理部と、複数の収集用管理サーバと構成情報を共有するための処理を実行する構成情報共有処理部と、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して所定ノードのデータをデータ記憶部から取得し、取得したデータを外部端末に送信するデータ提供部とを含むことを特徴とする。
【0010】
本発明による管理サーバは、複数の収集用管理サーバによって管理対象システム内の複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理部と、全ての管理サーバの情報および複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理部と、複数の収集用管理サーバと構成情報を共有するための処理を実行する構成情報共有処理部と、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して所定ノードのデータをデータ記憶部から取得し、取得したデータを外部端末に送信するデータ提供部とを含むことを特徴とする。
【0011】
本発明によるデータ管理方法は、主管理サーバが、複数の収集用管理サーバによって管理対象システム内の複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理ステップと、全ての管理サーバの情報および複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理ステップと、複数の収集用管理サーバと構成情報を共有するための処理を実行する構成情報共有処理ステップと、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して所定ノードのデータをデータ記憶部から取得し、取得したデータを外部端末に送信するデータ提供ステップとを実行することを特徴とする。
【0012】
本発明によるデータ管理用プログラムは、コンピュータに、複数の収集用管理サーバによって管理対象システム内の複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理と、全ての管理サーバの情報および複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理と、複数の収集用管理サーバと構成情報を共有するための処理を実行する構成情報共有処理と、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して所定ノードのデータをデータ記憶部から取得し、取得したデータを外部端末に送信するためのデータ提供処理とを実行させることを特徴とする。
【発明の効果】
【0013】
以上のように、本発明では、管理サーバの負荷を軽減しつつ、大量のデータを管理する場合でもネットワークトラフィックの増大を招かず、さらにデータ保存を効率よく行うことができる。
【図面の簡単な説明】
【0014】
【図1】実施の形態1によるデータ管理システムのネットワーク構成を示す説明図である。
【図2】実施の形態1における管理クライアントと各管理サーバとの論理的な接続状況を階層的に表した説明図である。
【図3】データ管理サーバの構成を示すブロック図である。
【図4】実施の形態1における構成情報リポジトリ内のテーブルの例を示す説明図である。
【図5】データリポジトリ内のテーブルの例を示す説明図である。
【図6】データ管理システムにおける新規の管理サーバを追加するときの動作を示すシーケンス図である。
【図7】データ管理システムにおける管理対象ノードの追加、データ収集およびデータ取得を行うときの動作を示すシーケンス図である。
【図8】データ管理システムにおける障害が発生した管理サーバの分担を変更するときの動作を示すシーケンス図である。
【図9】実施の形態2における管理クライアントと各管理サーバとの論理的な接続状況を表した説明図である。
【図10】実施の形態2における構成情報リポジトリ内のデータテーブルの例を示す説明図である。
【図11】本発明によるデータ管理システムの主要部を示すブロック図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施形態を図面を参照して説明する。
【0016】
実施の形態1.
図1は、本発明によるデータ管理システムのネットワーク構成を示す説明図である。また、図2は、実施の形態1における管理クライアントと各管理サーバとの論理的な接続状況を階層的に表した説明図である。図1および図2に示すデータ管理システムに示す例では、1台の管理クライアント11と、1台の管理サーバ(A)21と、複数台(図1および図2に示す例では3台)のデータ収集用の管理サーバ(B1,B2,B3)31,32,33とが、通信ネットワークで接続されている。
【0017】
管理クライアント11は、管理対象ノード群41,42,43を含む大規模コンピュータシステムを管理する利用者(オペレータ、管理者)が管理対象ノード群41,42,43からのリアルタイムデータの取得、保存、参照等するためのコンピュータ等の端末である。管理サーバ(A)21は、管理クライアント11からの命令(要求、指示)の受け付けや、各管理サーバ(B1,B2,B3)31,32,33との間の各種情報のやり取り、リアルタイムデータの保存(記憶)などを行うマスタ管理サーバである。図1および図2に示すように、管理サーバ(A)21は、構成情報リポジトリ211と、データリポジトリ212とを備えている。
【0018】
各管理サーバ(B1,B2,B3)31,32,33は、それぞれ、大規模コンピュータシステムにおける管理対象ノード群41,42,43からのリアルタイムデータを収集するデータ収集用の管理サーバである。図1および図2に示すように、各管理サーバ(B1,B2,B3)31,32,33は、それぞれ、少なくとも構成情報リポジトリ311,321,331を備えている。なお、図1および図2に示すように、管理サーバ(B1)31は、管理対象ノード群41のデータ収集を担当し、管理サーバ(B2)32は、管理対象ノード群42のデータ収集を担当し、管理サーバ(B3)33は、管理対象ノード群43のデータ収集を担当する。また、図1および図2に示すように、管理対象ノード群41は対象ノードb1−1・・・b1−Nを含み、管理対象ノード群42は対象ノードb2−1・・・b2−Nを含み、管理対象ノード群43は対象ノードb3−1・・・b3−Nを含んでいる。
【0019】
次に、管理サーバ内部の構成について詳細に説明する。図3は、データ管理サーバの構成を示すブロック図である。なお、この実施の形態では、管理サーバ(A)21および管理サーバ(B1,B2,B3)31,32,33は、それぞれ、同一構成のサーバであるものとする。すなわち、管理サーバ(A)21および管理サーバ(B1,B2,B3)31,32,33は、それぞれ、同じハードウェアおよびソフトウェアを備えているものとする。ただし、図1および図2に示したように、管理サーバ(B1,B2,B3)31,32,33は、少なくとも構成情報リポジトリ311,321,331を備えていればよく、データリポジトリを備えていなくてもよい。後述するように、管理サーバ(B1,B2,B3)31,32,33は、管理対象ノード群41,42,43から収集したリアルタイムデータを管理サーバ(A)21に送信し、管理サーバ(A)21内のデータリポジトリ212に保存するからである。
【0020】
図3に示す構成において、管理サーバ(A)21および管理サーバ(B1,B2,B3)31,32,33は、それぞれ、大規模コンピュータシステムのデータ管理に関する各種データ処理を実行するデータ処理部510と、大規模コンピュータシステムのデータ管理に必要なデータを保存するデータ保存部520と、外部(管理クライアント11)からの命令(要求)を受け付けるインタフェース部530とを備えている。
【0021】
データ保存部520は、管理サーバ(A,B1,B2,B3)21,31,32,33と管理対象ノードの情報を保存する構成情報リポジトリ521と、管理サーバ(B1,B2,B3)31,32,33が管理対象ノード群41,42,43から取得したリアルタイムデータ(以下、単にデータという場合がある)を保存するデータリポジトリ522とを有している。
【0022】
ここで、構成情報リポジトリ521は、図4に示すように、システム内に設置されている管理サーバ情報を保存するための管理サーバテーブル1000と、管理サーバ(B1,B2,B3)31,32,33が管理対象とするノード情報を保存するための管理対象ノードテーブル2000とを含む。具体的には、図4に示すように、管理サーバテーブル1000には、データ保存用の管理サーバ(A)21やデータ収集用の管理サーバ(B1,B2,B3)31,32,33を示す情報が格納(登録)され、管理対象ノードテーブル2000には、各々の管理対象ノードb1−1,b1−N,・・・毎に、これらの管理対象ノードからデータを収集する管理サーバの情報および収集したデータを保存する管理サーバの情報を対応付けて格納(登録)されている。なお、管理サーバテーブル1000および管理対象ノードテーブル2000に格納される情報を構成情報(又は構成情報リスト)という。
【0023】
また、データリポジトリ522は、図5に示すように、管理サーバ(B1,B2,B3)31,32,33が管理対象ノード41,42,43から取得したリアルタイムデータを保存するためのデータテーブル3000を含む。具体的には、図5に示すように、データテーブル3000には、データを収集(取得)した時刻の情報と、データを収集した対象ノードの情報と、データ種類(CPU使用率、メモリ使用量、ディスク空き容量など)、およびデータの内容がセットでリアルタイムデータとして格納(登録)されている。
【0024】
インタフェース部530は、管理サーバや管理対象ノードの追加・削除等に伴う構成情報の設定変更、情報参照などの処理の命令を管理クライアント11から受け付けるための構成情報操作インタフェース部531と、管理対象ノードから取得したデータの保存・参照の命令を管理クライアント11から受け付けるためのデータ入出力インタフェース部532とを有している。
【0025】
データ処理部510は、インタフェース部530(構成情報操作インタフェース部531)やデータ処理部510内部からの構成情報の設定変更、情報参照などの処理の命令(要求、依頼)を受けて、該当する処理を実行する構成情報操作部511と、インタフェース部530(データ入出力インタフェース部532)やデータ処理部510内部からのデータの保存・参照の命令(要求、依頼)を受けて、該当する処理を実行するデータ入出力部512と、各管理サーバ(B1,B2,B3)31,32,33が担当する管理対象ノード群41,42,43から定期的なデータ収集を実行するデータ収集部513と、収集されるべきデータがデータリポジトリ522に格納されているか否かを監視するリポジトリデータ監視部514とを有している。
【0026】
なお、データ処理部510と、インタフェース部530におけるハードウェア以外の部分とは、例えば、プログラムに従って処理を実行するCPUで実現される。
【0027】
次に、実施の形態1によるデータ管理システムの動作について説明する。
【0028】
まず、前提として、利用者が管理クライアント11を介して複数の管理サーバの中から任意の管理サーバをマスタ管理サーバとして選択する。このように選択されたマスタ管理サーバ(図1および図2に示す例では管理サーバ(A)21)が、データ保存用の管理サーバとなり、後述するように、複数のデータ収集用の管理サーバが収集したデータを保存することになる。また、利用者は管理クライアント11を介してコンピュータシステムに存在する各対象ノードを管理する管理サーバ(各管理サーバの対象ノードの分担)を負荷が偏らないように自動的に割り振ることが好ましい。ただし、利用者が各対象ノードを管理する管理サーバを選択して割り振るようにしてもよい。
【0029】
(1)まず、データ管理システムに新規の管理サーバを追加する手順について説明する。図6は、データ管理システムにおける新規の管理サーバを追加するときの動作を示すシーケンス図である。図6に示す例では、管理サーバ(B1)31がシステムに追加されるものとする。
【0030】
図6に示すように、管理クライアント11は、利用者の操作に応じて、管理サーバ(A)21に接続(アクセス)する。そして、管理クライアント11は、利用者の操作に応じて、管理サーバ(A)21に対して、構成情報内に管理サーバ(B1)31の情報を追加するように命令する(ステップS1)。管理サーバ(A)21の構成情報操作インタフェース部531は、管理クライアント11からの管理サーバ(B1)31の追加の命令を受けると、構成情報操作部511に対して当該命令を送る。構成情報操作部511は、構成情報リポジトリ521の管理サーバテーブル1000に管理サーバ(B1)31の情報(図4参照)を追加する(ステップS2)。また、管理サーバ(A)21の構成情報操作インタフェース部531は、管理サーバ(B1)31のインタフェース部との通信を確保する(ステップS3)。
【0031】
管理サーバ(A)21の構成情報操作部511と管理サーバ(B1)31の構成情報操作部は、各々の構成情報操作インタフェース部を通じて、管理サーバ(A)21の構成情報リポジトリ521の構成情報と管理サーバ(B1)31の構成情報リポジトリの構成情報(管理サーバの情報)をマージする(つまり、構成情報の統合あるいは融合を行う)(ステップS4,ステップS5)。具体的には、管理サーバ(A)21の構成情報操作部511は、構成情報操作インタフェース部531および通信ネットワークを通じて、構成情報リポジトリ521の構成情報(管理サーバテーブル1000の管理サーバの情報)を管理サーバ(B1)31に送信し、管理サーバ(B1)31の構成情報操作部は、構成情報操作インタフェース部を通じて構成情報を受信すると、受信した構成情報を構成情報リポジトリの管理サーバテーブルに格納する。このような処理を「構成情報の統合処理」という。
【0032】
(2)次に、データ管理システムに管理対象とするノードを追加する手順について説明する。図7は、データ管理システムにおける管理対象ノードの追加、データ収集およびデータ取得を行うときの動作を示すシーケンス図である。
【0033】
図7に示すように、管理クライアント11は、利用者の操作に応じて、管理サーバ(A)21に対して、データ収集を依頼する管理サーバと、データ保存を依頼する管理サーバを指定することにより、管理対象ノードの情報を登録するように命令する(ステップS11)。図1、図2および図7に示す例では、データ収集は管理サーバ(B1)31、データ保存は管理サーバ(A)21が実施するものとする。管理サーバ(A)21の構成情報操作インタフェース部531は、管理クライアント11からの管理対象ノードの情報の登録に関する命令を受けると、構成情報操作部511に対して当該命令を送る。構成情報操作部511は、構成情報リポジトリ521の管理対象ノードテーブル2000に管理対象ノードの情報(図4参照)を追加する(ステップS12)。また、管理サーバ(A)21の構成情報操作インタフェース部531は、管理サーバ(B1)31のインタフェース部との通信を確保する(ステップS13)。なお、図6に示したデータ管理システムに新規の管理サーバを追加する処理に引き続いて、図7に示すデータ管理システムに管理対象とするノードを追加する処理を実行する場合は、既に管理サーバ(A)21と管理サーバ(B1)31との間の通信が確保(確立)されているため、あらためて両サーバの間の通信を確保する必要はない。
【0034】
管理サーバ(A)21の構成情報操作部511と管理サーバ(B1)31の構成情報操作部は、各々の構成情報操作インタフェース部を通じて、管理サーバ(A)21の構成情報リポジトリ521の構成情報と管理サーバ(B1)31の構成情報リポジトリの構成情報(管理対象ノードの情報)をマージする(ステップS14,ステップS15)。具体的には、管理サーバ(A)21の構成情報操作部511は、構成情報操作インタフェース部531および通信ネットワークを通じて、構成情報リポジトリ521の構成情報(管理対象ノードテーブル2000の管理対象ノードの情報)を管理サーバ(B1)31に送信し、管理サーバ(B1)31の構成情報操作部は、構成情報操作インタフェース部を通じて構成情報を受信すると、受信した構成情報を構成情報リポジトリの管理対象ノードテーブルに格納する。このような処理を「構成情報の統合処理」という。図6のステップS1〜S5や図7のステップS11〜S15に示す一連の処理が行われることにより、構成情報リポジトリ内の構成情報が、管理サーバ(A)21と管理サーバ(B1)31との間で共有(同期)されることになる。
【0035】
なお、管理サーバ(A)21は、管理サーバ(B1)31以外の管理サーバ(B2,B3)32,33との間においても構成情報リポジトリの構成情報を共有(同期)するために、構成情報の統合処理(ステップS4,5およびステップS14,15)を実行する。ただし、少なくとも、マスタ管理サーバである管理サーバ(A)21がシステム内のすべての管理サーバ(B1,B2,B3)31,32,33の構成情報を保持していれば、管理クライアント11から管理サーバ(A)21を通じてデータ管理を行うことができる。このため、管理サーバ(A)21は、管理サーバ(B1)31以外の管理サーバ(B2,B3)32,33との間でおいて構成情報の統合処理(ステップS4,5およびステップS14,15)を実行せずに、すべての管理サーバ間における構成情報の共有を図らないようにしてもよい。この場合、管理サーバ間でやり取りされる情報量を減らすことができ、ネットワークトラフィックの軽減を図ることができる。
【0036】
管理サーバ(B1,B2,B3)31,32,33のデータ収集部は、構成情報操作部を通じて構成情報リポジトリ内の管理対象ノードの情報を取得し、取得した管理対象ノードの情報を参照して、定期的に管理対象ノードからリアルタイムデータを取得する(すなわち、データ収集の処理を行う)(ステップS16)。このとき、新たに管理対象として追加されたノードが存在する場合は、構成情報の統合処理が実行されたことによって構成情報が更新された後に、ステップS16のデータ収集の処理が開始される。管理サーバ(B1,B2,B3)31,32,33のデータ収集部は、管理対象ノード群41,42,43のすべてのノードから収集したデータを、データ入出力部やデータ入出力インタフェース部を通じて、データ保存先として指定された管理サーバ(A)21に送信し、管理サーバ(A)21に収集データの保存を命令(要求)する(ステップS17)。管理サーバ(A)21のデータ入出力部512は、管理サーバ(B1,B2,B3)31,32,33から送信されたデータをデータ入出力インタフェース部532を通じて受信すると、受信したデータをデータリポジトリ522に保存(格納・登録)する(ステップS18)。
【0037】
管理クライアント11は、利用者の操作に応じて、任意の管理対象ノードについてのデータを取得(参照)する場合、マスタ管理サーバである管理サーバ(A)21に対して取得したい管理対象ノードのデータを要求する(ステップS19)。なお、管理クライアント11は、マスタ管理サーバである管理サーバ(A)21以外の管理サーバ(例えば、管理サーバ(B2)32)に接続(アクセス)し、当該管理サーバに対して取得したい管理対象ノードのデータを要求してもよい。この場合、管理クライアント11からデータの要求がされた管理サーバは、構成情報リポジトリ内の構成情報を参照することによりマスタ管理サーバを認識(特定)することができ、マスタ管理サーバに対してデータの要求を転送するようにすればよいからである。
【0038】
管理サーバ(A)21のデータ入出力部512は、データ入出力インタフェース部532を通じて管理クライアント11からの要求(命令)を受けると、構成情報リポジトリ521の構成情報を参照し、要求された管理対象ノードのデータをデータリポジトリ522から取得する。そして、データ入出力部512は、取得したデータをデータ入出力インタフェース部532を通じて管理クライアント11に送信する(ステップS20)。このように動作することにより、管理クライアント11は、データが実際に収集・保存されている管理サーバを意識することなく、システム内の管理対象ノードについてのデータを一括で扱うことが可能となる。
【0039】
(3)次に、データ収集用の管理サーバの障害時に他のデータ収集用の管理サーバへデータ収集処理の分担を引き継ぐ動作について説明する。図8は、データ管理システムにおける障害が発生した管理サーバの分担を変更するときの動作を示すシーケンス図である。
【0040】
まず、説明の前提として、図1および図2に示すように、データ管理システムには、1台の管理クライアント11、1台のマスタ管理サーバである管理サーバ(A)21、3台の収集用の管理サーバ(B1,B2,B3)31,32,33が備えられ、それぞれの収集用の管理サーバ(B1,B2,B3)31,32,33によってデータ収集されている収集対象ノード群41,42,43が通信ネットワーク上に存在するものとする。
【0041】
図8に示すように、管理サーバ(A)21のリポジトリデータ監視部514は、一定間隔で構成情報操作部511にアクセスし、データリポジトリ522にデータを保存している管理サーバの一覧(図4参照)を取得する(ステップS21)。図1および図2に示す例では、管理サーバ(B1,B2,B3)31,32,33が該当する。管理サーバの一覧を取得した後、リポジトリデータ監視部514は、データ入出力部512にアクセスし、管理サーバの一覧に含まれる管理サーバが収集したデータがデータリポジトリ522内に存在するか否かを確認する(ステップS22)。
【0042】
ある管理サーバについて、確認タイミングからさかのぼって一定期間のデータが存在しない場合は(ステップS23のYes)、管理サーバの収集機能(データ収集部513の機能)の異常、管理サーバ自身の異常、管理サーバのネットワークにおける異常などが発生したとして、管理サーバが異常状態に陥ったと判断する。
【0043】
リポジトリデータ監視部514は、構成情報操作部511にアクセスし、異常状態と判断した管理サーバがデータ収集を担当している対象ノードについて、他の管理サーバがデータ収集を担当するように構成情報を変更する(ステップS24)。すなわち、構成情報リポジトリ521内の構成情報において、異常状態の管理サーバにおける対象ノードの分担を他の管理サーバの分担に変更する。例えば、管理サーバ(B1)31に異常が発生した場合、管理サーバ(B1)31がデータ収集を担当している管理対象ノード群41の対象ノードb1−1・・・b1−Nであるので、これらの対象ノードb1−1・・・b1−Nの担当を他の管理サーバ(B2)32または(B3)33に書き換える。この際、対象ノードの分担については、構成情報リポジトリ521の内容(データ収集用の管理サーバに割り当てられた対象ノードの分担)を確認し、負荷が偏らないように自動的に制御される。
【0044】
そして、管理サーバ(A)21の構成情報操作インタフェース部531は、異常状態と判断した管理サーバ(B1)31以外の管理サーバ(B2,B2)32,33のインタフェース部との通信を確保する(ステップS25)。その後、管理サーバ(A)21の構成情報操作部511と管理サーバ(B1,B2,B3)31,32,33の構成情報操作部は、各々の構成情報操作インタフェース部を通じて、管理サーバ(A)21の構成情報リポジトリ521の構成情報と管理サーバ(B1,B2,B3)31,32,33の構成情報リポジトリの構成情報(管理サーバの情報および管理対象ノードの情報)をマージする(つまり、構成情報の統合あるいは融合を行う)(ステップS26,ステップS27)。具体的には、管理サーバ(A)21の構成情報操作部511は、構成情報操作インタフェース部531および通信ネットワークを通じて、構成情報リポジトリ521の構成情報を管理サーバ(B1,B2,B3)31,32,33に送信し、管理サーバ(B1,B2,B3)31,32,33の構成情報操作部は、構成情報操作インタフェース部を通じて構成情報を受信すると、受信した構成情報を構成情報リポジトリに格納する。新たに対象ノードが追加された管理サーバは、新たな対象ノードにアクセスし、データ収集を開始する。
【0045】
このように動作することにより、収集用の管理サーバ自身や管理サーバの周辺に障害が発生した場合も、他の管理サーバに処理が自動的に引き継がれ、データの欠損をできるだけ回避できるとともに、管理サーバが切り替えられた場合も、データが保存される管理サーバには変更がないため、データを利用する側は、データが保存されている管理サーバを意識することなく、利用することができる。
【0046】
以上に説明したように、この実施の形態では、複数の管理サーバで負荷を分担するように構成しているため、一台の管理サーバに過剰な負荷をかけることなく、大規模なシステムの全てのノードデータを収集できる。また、管理サーバ間で構成情報については共有しているが、リアルタイムデータについては共有しない構成であるので、大量のログや性能値(性能データ)などのリアルタイムデータを扱った場合でも、ネットワークトラフィックの増大を招くことはなく、データの保存効率も優れている。
【0047】
また、この実施の形態では、システム内の全ての管理サーバ間で構成情報が共有されているため、管理クライアント11と直接接続している管理サーバがデータを保存している管理サーバを自動的に判断できるので、管理クライアント11は、複数の管理サーバが収集したデータを利用する際に、データ収集・保存を担当している管理サーバを意識する必要がない。
【0048】
なお、1台の管理サーバにデータ保存の役割を担当させていたが、複数台の管理サーバにデータ保存の役割を担当させるようにしてもよい。この場合、管理クライアント11と直接接続(アクセス)している管理サーバがデータを保存している複数の管理サーバの中から所定の管理サーバを自動的に選択し、選択した管理サーバ(マスタ管理サーバの一つ)に対してデータ転送を要求する。このような構成においても、システム内の全ての管理サーバ間で構成情報が共有されているので、管理クライアント11は、複数の管理サーバが収集したデータを利用する際に、データ収集・保存を担当している管理サーバを意識する必要がない。
【0049】
また、この実施の形態では、データの保存を担当している管理サーバ(A)21が収集用の管理サーバの異常を検知し、自動的に他のデータ収集用管理サーバに処理(対象ノード)を割り振るため、データ収集用の管理サーバ自身や管理サーバの周辺に障害が発生した場合も、データの欠損を最小限に食い止めることができる。
【0050】
さらに、この実施の形態では、データ収集用の管理サーバや管理サーバの周辺に障害が発生した場合も、対象ノードについてのデータ保存先が変更されないため、データ収集用の管理サーバや管理サーバの周辺に障害が発生した場合でも、データ利用者は、そのことを意識する必要がない。
【0051】
実施の形態2.
本発明の実施の形態2の構成について図9および図10を参照して説明する。図9は、実施の形態2における管理クライアントと各管理サーバとの論理的な接続状況を表した説明図である。また、図10は、実施の形態2における構成情報リポジトリ内のテーブルの例を示す説明図である。
【0052】
図9を参照すると、この実施の形態2では、利用者のインタフェースである管理クライアント11と、管理クライアント11に要求されたデータを提供する管理サーバ(A1)121と、収集データの保存を担当する管理サーバ(B1〜B3)131〜133と、管理対象ノードからのデータ収集を担当する管理サーバ(C11,C21,C21,C22,C31,C32)141,142,143,144,145,146とを備えている。すなわち、上記の実施の形態1では、図2に示すように、管理サーバの階層構造がデータ保存用の管理サーバとデータ収集用の管理サーバの2層(2段)であったが、この実施の形態2では、図9に示すように、管理クライアント11に要求されたデータを提供する管理サーバと、データ保存用の管理サーバと、データ収集用の管理サーバの3層(3段)の階層構造となっている。なお、管理サーバ(C11〜C32)141〜146は、それぞれ、管理対象ノード群151〜156に含まれる対象ノードのデータ収集を担当する。
【0053】
この実施の形態2における構成情報リポジトリの内容を図10に示す。この実施の形態2では、収集データの保存を担当する管理サーバ、管理対象ノードからのデータ収集を担当する管理サーバの数をそれぞれ3台、6台としているが、環境、用途、運用形態によって、増減することもありうる。なお、管理サーバ(A1)121、管理サーバ(B1〜B3)131〜131、および管理サーバ(C11〜C32)141〜146の構成は、図3に示した構成と同様である。ただし、管理サーバ(A1)121および管理サーバ(C11〜C32)141〜146では、データリポジトリを設けずに、構成情報リポジトリのみ設けるようにしてもよい。
【0054】
次に、この実施の形態2におけるデータ管理システムの動作について説明する。この実施の形態2では、管理対象ノード群151〜156から、管理サーバ(C11〜C32)141〜146によってデータが収集される。収集されたデータは、管理サーバ(B1〜B3)131〜133のデータリポジトリに保存される。管理サーバ(A1)121は、管理クライアント11の要求に応じて、必要なデータを管理サーバ(B1〜B3)131〜133から取得(入手)し、取得したデータを管理クライアント11に返却する。その他の動作については、上記の実施の形態1と同様である。
【0055】
以上のように、この実施の形態2によれば、データの収集、データ保存・参照、データ提供の負荷を管理サーバ間で分散させることができるため、管理対象ノードが大量に存在するような大規模なシステムにおいても、利用者は管理クライアントを用いてシステム全体の情報を一括で参照することが可能となる。また、データ収集用の管理サーバに障害が発生した場合も、上記の実施の形態1と同様に、自動的に他のデータ収集用の管理サーバに収集処理が切り替わるにもかかわらず、データの保存先が変更されないことにより、管理クライアント11や管理サーバ(A1)121からみた場合に、その障害の影響を意識する必要がない。
【0056】
次に、本発明による保守システムの主要部を説明する。図11は、本発明によるデータ管理システムの主要部を示すブロック図である。図11に示すデータ管理システムでは、管理対象システム内の複数のノード3−1〜3−Nからデータを定期的に収集する複数の収集用管理サーバ2−1〜2−Nと、当該複数の収集用管理サーバ2−1〜2−Nを管理する主管理サーバ1とを備え、当該主管理サーバ1は、複数の収集用管理サーバ2−1〜2−Nによって複数のノード3−1〜3−Nから収集されたデータをデータ記憶部1Eに記憶するデータ記憶処理部1Aと、全ての管理サーバ1,2−1〜2−Nの情報および複数の収集用管理サーバ2−1〜2−Nが管轄しているノード3−1〜3−Nの情報を構成情報として構成情報記憶部1Fに記憶する構成情報記憶処理部1Bと、複数の収集用管理サーバ2−1〜2−Nと構成情報を共有するための処理を実行する構成情報共有処理部1Cと、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して所定ノードのデータをデータ記憶部1Eから取得し、取得したデータを外部端末に送信するデータ提供部1Dとを含む構成とされている。
【0057】
なお、上記の実施の形態1では、管理クライアント11からデータ保存用の管理サーバ(A)21(マスタ管理サーバ)を指定するように構成されていたが、そのような構成に限られず、データ保存用の管理サーバ(A)21はあらかじめ定められていてもよい。また、上記の実施の形態2では、管理クライアント11からデータ提供用の管理サーバ(A1)121およびデータ保存用の管理サーバ(B1〜B3)131〜133を指定することを想定しているが、そのような構成に限られず、それらの管理サーバはあらかじめ定められていてもよい。また、上記の各実施の形態において、管理クライアント11からデータ収集用の管理サーバを指定するように構成されていたが、データ収集用の管理サーバもあらかじめ定められていてもよい。
【0058】
また、図6および図7を用いて、管理サーバや管理対象ノードを追加する処理について説明したが、管理サーバや管理対象ノードを削除する処理も、上記の実施の形態で説明した処理(図6〜図9の処理)と同様の処理又は類似の処理を用いて行うことが可能である。すなわち、図6のステップS1において管理サーバの削除命令を行うと、管理サーバ(A)21は、命令された管理サーバの情報を構成情報リポジトリから削除し、また、削除された管理サーバが担当している対象ノードを他の管理サーバの担当に変更し、さらに、他のすべてのデータ収集用の管理サーバと当該構成情報を共有する。
【0059】
また、各管理サーバは、それぞれデータ保存部を備えていたが、データ保存部は管理サーバとは別の記憶装置(ストレージ装置)であってもよい。
【0060】
また、データ収集用の管理サーバが自身の管理している対象ノードの情報を自身のデータリポジトリに保存するように構成してもよい。また、データ保存用の管理サーバ(マスタ管理サーバ)が所定の対象ノードのデータ収集を行うように構成してもよい。
【0061】
また、データ管理システムを構成する管理サーバの数や階層構造などは、環境、用途、運用形態によって適宜変更され得る。
【産業上の利用可能性】
【0062】
本発明は、大規模システムにおける対象ノードからのリアルタイムデータを効率的に収集し、収集したデータを保存・参照するためのデータ管理システムに適用される。
【符号の説明】
【0063】
11 管理クライアント
21 管理サーバ(A)
31〜33 管理サーバ(B1〜B3)
41〜43 管理対象ノード群
121 管理サーバ(A1)
131〜133 管理サーバ(B1〜B3)
141〜146 管理サーバ(C11〜C32)
151〜156 管理対象ノード群
510 データ処理部
511 構成情報操作部
512 データ入出力部
513 データ収集部
514 リポジトリデータ監視部
520 データ保存部
521 構成情報リポジトリ
522 データリポジトリ
530 インタフェース部
531 構成情報操作インタフェース部
532 データ入出力インタフェース部

【特許請求の範囲】
【請求項1】
管理対象システム内の複数のノードからデータを定期的に収集する複数の収集用管理サーバと、
当該複数の収集用管理サーバを管理する主管理サーバとを備え、
当該主管理サーバは、
前記複数の収集用管理サーバによって前記複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理部と、
全ての管理サーバの情報および前記複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理部と、
前記複数の収集用管理サーバと前記構成情報を共有するための処理を実行する構成情報共有処理部と、
外部端末からの所定ノードのデータ取得要求を受けた場合に、前記構成情報を参照して前記所定ノードのデータを前記データ記憶部から取得し、取得したデータを前記外部端末に送信するデータ提供部とを含む
ことを特徴とするデータ管理システム。
【請求項2】
構成情報共有処理部は、外部端末から構成情報の変更要求を受けた場合、変更要求に応じた構成情報の変更処理を行うとともに、変更処理した構成情報を複数の収集用管理サーバに送信する
請求項1記載のデータ管理システム。
【請求項3】
複数の収集用管理サーバは、外部端末からの所定ノードのデータ取得要求を受けた場合に、当該データ取得要求を主管理サーバに転送するデータ取得要求転送部を含み、
データ提供部は、前記複数の収集用管理サーバのいずれかから転送された前記データ取得要求を受けた場合に、前記構成情報を参照して前記所定ノードのデータをデータ記憶部から取得し、取得したデータを前記外部端末に送信する
請求項1または請求項2記載のデータ管理システム。
【請求項4】
主管理サーバは、定期的に、複数の収集用管理サーバの各々が所定期間データの収集を実行していないか否かを判定するデータ収集判定部を含み、
構成情報共有処理部は、前記データ収集判定部によって特定の収集用管理サーバが前記所定期間データの収集を実行していないと判定された場合には、前記特定の収集用管理サーバが管轄しているノードを他の収集用管理サーバの管轄に変更し、変更した構成情報を前記複数の収集用管理サーバに送信する
請求項1から請求項3のうちのいずれかに記載のデータ管理システム。
【請求項5】
主管理サーバは、データ記憶処理部を含まず、
複数の収集用管理サーバによって複数のノードから収集されたデータをデータ記憶部に記憶する一または複数のデータ記憶用管理サーバを備え、
データ提供部は、外部端末からの所定ノードのデータ取得要求を受けた場合に、構成情報を参照して前記所定ノードのデータを前記データ記憶用管理サーバの前記データ記憶部から取得し、取得したデータを前記外部端末に送信する
請求項1から請求項4のうちのいずれかに記載のデータ管理システム。
【請求項6】
複数の収集用管理サーバによって管理対象システム内の複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理部と、
全ての管理サーバの情報および前記複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理部と、
前記複数の収集用管理サーバと前記構成情報を共有するための処理を実行する構成情報共有処理部と、
外部端末からの所定ノードのデータ取得要求を受けた場合に、前記構成情報を参照して前記所定ノードのデータを前記データ記憶部から取得し、取得したデータを前記外部端末に送信するデータ提供部とを含む
ことを特徴とする管理サーバ。
【請求項7】
主管理サーバが、複数の収集用管理サーバによって管理対象システム内の複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理ステップと、
全ての管理サーバの情報および前記複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理ステップと、
前記複数の収集用管理サーバと前記構成情報を共有するための処理を実行する構成情報共有処理ステップと、
外部端末からの所定ノードのデータ取得要求を受けた場合に、前記構成情報を参照して前記所定ノードのデータを前記データ記憶部から取得し、取得したデータを前記外部端末に送信するデータ提供ステップとを実行する
ことを特徴とするデータ管理方法。
【請求項8】
構成情報共有処理ステップにおいて、外部端末から構成情報の変更要求を受けた場合、変更要求に応じた構成情報の変更処理を行うとともに、変更処理した構成情報を複数の収集用管理サーバに送信する
請求項7記載のデータ管理方法。
【請求項9】
コンピュータに、
複数の収集用管理サーバによって管理対象システム内の複数のノードから収集されたデータをデータ記憶部に記憶するデータ記憶処理と、
全ての管理サーバの情報および前記複数の収集用管理サーバが管轄しているノードの情報を構成情報として構成情報記憶部に記憶する構成情報記憶処理と、
前記複数の収集用管理サーバと前記構成情報を共有するための処理を実行する構成情報共有処理と、
外部端末からの所定ノードのデータ取得要求を受けた場合に、前記構成情報を参照して前記所定ノードのデータを前記データ記憶部から取得し、取得したデータを前記外部端末に送信するためのデータ提供処理と
を実行させるためのデータ管理用プログラム。
【請求項10】
コンピュータに、
構成情報共有処理で、外部端末から構成情報の変更要求を受けた場合、変更要求に応じた構成情報の変更処理を行うとともに、変更処理した構成情報を複数の収集用管理サーバに送信するための処理を実行させる請求項9記載のデータ管理用プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2011−197775(P2011−197775A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−61119(P2010−61119)
【出願日】平成22年3月17日(2010.3.17)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】