説明

探索装置、探索方法および探索プログラム

【課題】システムにおいて発生した異常の起点の候補を効率的に探索すること。
【解決手段】探索装置1は、第1の管理範囲で発生した異常について起点候補を探索する際に、探索先が第2の管理範囲に及ぶ場合には探索装置2にクエリを送信して第2の管理範囲内での異常起点の探索を依頼する。探索装置2は、クエリを受信して第2の管理範囲内で異常の起点候補を探索し、異常の起点候補をダミーの構成要素に置き換えて応答する。このため、探索装置1は、第2の管理範囲における構成要素の接続関係を把握することなく異常の起点候補を探索できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、システムにおいて発生した異常の起点の候補を探索する探索装置、探索方法および探索プログラムに関する。
【背景技術】
【0002】
互いに接続された複数の構成要素を含むネットワークシステムでは、構成要素に異常が発生すると、他の構成要素に異常が波及することがある。従って、ある構成要素についての異常が検出されたとしても、その異常の原因の根源(起点)は、その構成要素でなく別の構成要素であり得る。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平2−244338号公報
【特許文献2】特開平6−324904号公報
【特許文献3】特開2001−222442号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、ネットワーク内の全ての構成要素の情報と、それらの因果関係の情報の全てが一元的に管理されていない場合に、異常の根源(起点)の探求を行うことは難しく、ネットワークの規模が大きくなるほどその問題は顕著となる。
【0005】
1つの側面では、本発明は、システムに発生した異常の起点の候補を効率的に探索する探索装置、探索方法および探索プログラムを提供することを目的とする。
【0006】
また、他の側面では、複数のシステムが存在する場合に、いずれのシステム側に異常の根源(起点)が存在するのかを評価可能とすることを目的とする。
【課題を解決するための手段】
【0007】
第1の案では、探索装置、探索方法および探索プログラムは、ネットワークの構成要素のうち、第1の管理範囲に属する構成要素に発生した異常について、前記異常が発生した構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する。開示の装置、方法、プログラムは、辿った先の構成要素が第2の管理範囲に属する構成要素である場合に、前記第2の管理範囲における異常の起点候補を探索する装置に対して前記異常の起点候補の探索を依頼するクエリを発行し、探索結果とクエリに対する応答とに基づいて、異常の起点候補を評価する。
【0008】
また、第2の案では、探索装置、探索方法および探索プログラムは、第1の管理範囲に属する構成要素における異常の起点候補を探索する装置から、第2の管理範囲に属する異常の起点候補の探索を依頼するクエリを受信した場合に、クエリに基づいて第2の管理範囲に属する構成要素の接続関係を辿って前記異常の起点候補を探索し、探索結果に基づいて前記異常の起点候補を評価する。開示の装置、方法、プログラムは、探索した異常の起点候補である構成要素をダミーの構成要素に置き換えて、ダミーの構成要素と評価結果とをクエリに対する応答として返す。
【発明の効果】
【0009】
システムにおいて発生した異常の起点の候補を効率的に探索することができる。
【図面の簡単な説明】
【0010】
【図1】図1は、実施例1にかかる探索装置を含むシステムの構成例である。
【図2】図2は、実施例2にかかる探索装置13の構成図である。
【図3】図3は、探索装置間の接続についての説明図である。
【図4】図4は、複数のドメインにまたがるネットワークシステムの説明図である。
【図5】図5は、ドメインの仮想的な構成要素への置き換えについての説明図である。
【図6】図6は、異常の起点候補の評価に関する処理を説明するフローチャートである。
【図7】図7は、異常起点調査処理について説明するフローチャートである。
【図8】図8は、クエリを受信した探索装置の処理動作を説明するフローチャートである。
【図9】図9は、データの具体例の説明図である。
【図10】図10は、異常の起点候補の評価結果を表示する画面例についての説明図である。
【図11】図11は、異常の起点候補の探索の具体例についての説明図である。(その1)
【図12】図12は、異常の起点候補の探索の具体例についての説明図である。(その2)
【図13】図13は、異常の起点候補の探索の具体例についての説明図である。(その3)
【図14】図14は、異常の起点候補の探索の具体例についての説明図である。(その4)
【図15】図15は、コンピュータを探索装置として動作させる場合の説明図である。
【図16】図16は、3つの管理範囲を有するネットワークシステムについての説明図である。
【発明を実施するための形態】
【0011】
以下に、本願の開示する探索装置、探索方法および探索プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
【実施例1】
【0012】
・実施例1の構成
図1は、実施例1にかかる探索装置を含むシステムの構成例である。図1に例示したシステムでは、構成要素C11〜C19がネットワークに含まれる。この例では、構成要素C11〜C19のうち、構成要素C11〜C15は第1の管理範囲10に属し、構成要素C16〜C19は第2の管理範囲20に属するものとする。なお、図示している構成要素以外の構成要素が更にネットワークに含まれてもよく、構成要素が1つの管理範囲に属すようにしたり、3以上の管理範囲に分けてもよい。
【0013】
探索装置1は、第1の管理範囲10に属する構成要素C11〜C15に発生した異常について、異常の起点となった構成要素の候補を異常の起点候補として探索し、評価する。
【0014】
探索装置1は、探索部3、クエリ発行部4、評価部5を有する。探索部3は、第1の管理範囲10に属する構成要素C11〜C15に発生した異常について、探索装置1が管理している構成要素間の接続情報に基づいて、異常が発生した構成要素の接続関係を辿ることで異常の起点候補を探索する。クエリ発行部4は、探索部3が辿った先の構成要素が第2の管理範囲20に属する構成要素である場合に、探索装置2に対して異常の起点候補の探索を依頼するクエリを発行する。評価部5は、探索部3による探索結果とクエリ発行部4が発行したクエリに対する応答とに基づいて、異常の起点候補を評価する。
【0015】
探索装置2は、探索部6、評価部7、クエリ処理部8を有する。クエリ処理部8は、探索装置1からクエリを受信する。探索部6は、装置2が管理している構成要素間接続情報と、受信したクエリとに基づいて第2の管理範囲20に属する構成要素C16〜19の接続関係を辿って異常の起点候補を探索する。
【0016】
そして、評価部7は、探索部6による探索結果に基づいて異常の起点候補を評価し、評価結果をクエリに対する応答として探索装置1に送信する。
【0017】
・実施例1のまとめ
上述したように、探索装置1は、第1の管理範囲で発生した異常について起点候補を探索する際に、探索先が第2の管理範囲に及ぶ場合には探索装置2にクエリを送信して第2の管理範囲内での異常起点の探索を依頼する。
【0018】
探索装置2は、クエリを受信して第2の管理範囲内で異常の起点候補を探索し、応答する。これによれば、探索装置1は、第2の管理範囲における構成要素及び構成要素間の接続関係についての詳細情報を管理していなくとも、異常の起点の探求を効率的に行うことができる。
【0019】
なお、上述した実施例において、探索装置2のダミー処理部9が、探索部6が探索した異常の起点候補である構成要素をダミーの構成要素(第2の管理範囲における構成要素の固有の識別情報や、持続的な(persistent)な識別情報でない情報)に置き換え、ダミーの構成要素の情報と、そのダミーの構成要素についての評価結果をクエリ処理部8から応答として探索装置1に返すこともできる。なお、ダミーの構成要素の情報として、例えば、非持続的な(non-persistent)な、識別情報を用いることができる。ダミーの構成要素の情報は、非持続的な識別情報であるため、異常の起点を探索する処理を行った後に、更に別の異常の起点を探索する処理を行う際に、識別情報を変更してしまうこともできる。識別情報の変更の契機は、クエリにクエリ識別情報が含まれる場合、クエリ識別情報が変化したこと、所定時間経過したこと等とすることができる。
【0020】
これによれば、探索装置1は、第2の管理範囲における構成要素、構成要素間の接続関係を把握しなくとも異常の起点候補を探索できる。言い換えれば、第2の管理範囲における構成要素、構成要素間の接続関係を第1の装置である探索装置1に対して秘匿しつつ探索装置1に異常の起点候補を探索させることができる。なお、探索装置1は、第1の管理範囲のエッジ部分の構成要素C14に対応させて関連性識別子r01、構成要素C15に対応させて関連性識別子r02を記憶しておき(CMDBに登録することで記憶してもよい)、第2の装置である探索装置2は、r01に対応させて第2の管理範囲のエッジ部分の構成要素C16、C17を対応させて記憶し、また、r02に対応させて第2の管理範囲のエッジ部分の構成要素C16を対応させて記憶しておくことで、探求先が第1の管理範囲内の構成要素C14から第2の管理範囲側に及ぶ場合、クエリに識別情報r01を含めることで、C15とC16の間、C15とC17との間に接続関係があることを第1の装置及び第2の装置の双方ともが認識していなくとも、探求すべきパスを特定することができる。すなわち、クエリにr01が含まれる場合、探索装置2は、構成要素C16、C17を経由する経路を辿って、異常の起点候補の探索を行うことができる。
【実施例2】
【0021】
・実施例2の構成
図2は、実施例2にかかる探索装置13の構成図である。図2に示した探索装置13は、ユーザインタフェース31、関連探索部32、境界判定部33、クエリ発行部34、クエリ処理部35、仮想構成管理部36、評価部37を有する。また、探索装置13は、CMDB(Configuration Management Database)11、障害DB(Database)12およびCI(Configuration Item)−VCI(Virtual Configuration Item)対応表14を参照可能である。なお、これらの、DB、対応表は記憶装置に記憶される。更に、探索装置13は、図3に示したように他の探索装置23と接続されている。
【0022】
図3は、探索装置間の接続についての説明図であり、図4は、複数のドメインにまたがるネットワークシステムの説明図である。図4に示したネットワークシステムは、ネットワークnw11に物理マシンであるサーバpm11,12が接続している。サーバpm11は仮想マシンプログラムを実行することで、仮想マシンVM11,12として動作する。アプリケーションApp11は仮想マシンVM11上で動作する。同様に、アプリケーションApp12は仮想マシンVM2上で動作する。
【0023】
また、サーバpm12は仮想マシンプログラムを実行することで、仮想マシンVM13〜15として動作する。アプリケーションApp13は仮想マシンVM13上で動作する。そして、アプリケーションApp14は仮想マシンVM14上で動作し、アプリケーションApp15は仮想マシンVM15上で動作する。同様に、ネットワークnw12に接続されたサーバpm13は仮想マシンプログラムを実行することで、仮想マシンVM16として動作する。アプリケーションApp16は仮想マシンVM16上で動作する。
【0024】
また、アプリケーションApp13はアプリケーションApp15を利用しており、アプリケーションApp14はアプリケーションApp16を利用している。さらにアプリケーションApp12は、アプリケーションApp14を利用してサービスSv11を提供する。
【0025】
このネットワークシステムでは、ネットワークnw11,12、サーバpm11〜13、仮想マシンVM11〜16、アプリケーションApp11〜16、サービスSv11が構成要素(CI:Configuration Item)として用いられている。また、構成要素間の接続関係が関連(relation)の例として用いられている。関連は、構成要素間の利用関係の方向を情報として含む。具体的には、利用される側の構成要素をソース、利用する側の構成要素をターゲットとし、例えば、ソースからターゲットに向けた方向を定める。構成情報に、システムの構成要素と関連についての情報を含めることができる。
【0026】
図4に示したネットワークシステムの構成は、物理マシンであるサーバpm11〜13が仮想マシンプログラムを実行することで仮想マシンVM11〜16として動作し、仮想マシン上でApp11〜16が動作し、サービスSv11が提供されるクラウド環境である。
【0027】
この例では、クラウド環境の利用者は、仮想マシンVM11〜16、アプリケーションApp11〜16及びサービスSV1を構成要素として認識しておらず、ネットワークnw11,12やサーバpm11〜13などの物理的な構成要素について知らないものとする。また、クラウド環境の提供者もネットワークnw11,12やサーバpm11〜13などの物理的な構成要素について情報を開示していないものとする。
【0028】
この図4に示したネットワークシステムで異常が発生した場合、異常の起点がネットワークnw11,12やサーバpm11〜13などの物理的な構成要素であるならば、提供者側が管理している(管理責任がある)ことになる。一方、異常の起点がアプリケーションApp11〜16、サービスSv11などの構成要素であるならば、利用者側が管理している(管理責任がある)ことになる。
【0029】
このように、クラウド環境の利用者側は、アプリケーションApp11〜16、サービスSv11の管理について責任があり、それらの詳細な構成情報を持ち、クラウド環境の提供者側はネットワークnw11,12やサーバpm11〜13の管理に責任があり、それらの詳細な構成情報を持つ。ネットワークの構成要素について管理する範囲をドメインという。図4に示した例では、第1ドメインが利用者側の管理範囲であり、第2ドメインが提供者側の管理範囲である。なお、ドメインの定義は、この例に限らず、システムの利用形態に応じて様々な変更が可能である。
【0030】
第2ドメイン側の構成情報は第1ドメイン側に秘匿され、第1ドメイン側の構成情報は第2ドメイン側に秘匿されるようにしてもよい。そして、図3に示したように、第1ドメイン側システムに探索装置13、第2ドメイン側システムに探索装置23をそれぞれ設け、ドメインごとに異常の起点候補の評価、探索を行う。
【0031】
第1ドメイン側のシステムに設けた探索装置13は、CMDB11、障害DB12、CI−VCI対応表14を格納する各記憶装置と接続されており、格納された各種データにアクセスすることができる。CMDB11は第1ドメインの構成情報を保持するデータベースであり、障害DB12は、第1ドメインに属する構成要素に発生した各種の異常に関する情報を障害情報として格納するデータベースである。CI−VCI対応表14は、第2ドメイン側から異常の起点候補の探索を求められた場合に第2ドメインに応答するダミーの構成要素と第1ドメインの実際の構成要素との対応関係を示す表である。第2ドメイン側からダミーの構成要素を指定した問い合わせがあった際に、CI−VCIの対応表14を用いることで、そのダミーの構成要素に対応する実際の構成要素を特定することができるため、特定した実際の構成要素が異常状態を脱したかどうか調査し、その調査結果を第2ドメイン側に送信することもできる。好ましくは、ダミーの構成要素は、クエリの識別情報と対応づけてCI−VCIの対応表に登録され、異なるクエリに対する応答の際に、同じ構成要素について、ダミー情報を用いることもできる。
【0032】
第2ドメイン側のシステムに設けた探索装置23は、CMDB21、障害DB22、CI−VCI対応表24を記憶する各記憶装置と接続されており、格納された各種データにアクセスすることができる。CMDB21は第2ドメインの構成情報を保持するデータベースであり、障害DB22は、第2ドメインに属する構成要素に発生した各種異常を障害情報として格納するデータベースである。CI−VCI対応表24は、第1ドメイン側から異常の起点候補の探索を求められた場合に第1ドメインに応答するダミーの構成要素と第2ドメインの実際の構成要素との対応関係を示す表である。第1ドメイン側からダミーの構成要素を指定した問い合わせがあった際に、CI−VCIの対応表24を用いることで、そのダミーの構成要素に対応する実際の構成要素を特定することができるため、特定した実際の構成要素が異常状態を脱したかどうか調査し、その調査結果を第1ドメイン側に送信することもできる。好ましくは、ダミーの構成要素は、クエリの識別情報と対応づけてCI−VCIの対応表に登録され、異なるクエリに対する応答の際に、同じ構成要素について、ダミー情報を用いることもできる。
【0033】
また、探索装置13と探索装置23とはネットワークを介して接続され、互いにクエリの送信と応答を行うことができる。探索装置13と探索装置23とは同一の構成を有することもできる。そこで、ここでは同一の構成を有するものとして、図2に示した探索装置13の構成について説明を行い、探索装置23についての説明は省略する。
【0034】
図2に示したユーザインタフェース31は、探索装置13のユーザから異常の起点候補の評価の開始を指示する入力を受け付け、異常の起点候補の評価結果を出力する入出力処理部である。
【0035】
関連探索部32は、CMDB11および障害DB12を参照し、異常の起点候補を探索する。具体的には、関連探索部32は、障害DB12から異常が発生した構成要素を選択する。そして、選択した構成要素についてCMDB11を参照し、構成要素を設定された関連を逆方向に辿る。言い換えれば、関連探索部32は、選択した構成要素をターゲットとする関連をソース側に辿る。関連探索部32は、関連を辿った経路上に存在する構成要素のうち、異常が発生している最も上流の構成要素を異常の起点候補とする。
【0036】
境界判定部33は、関連探索部32が辿った関連が、第1ドメインと第2ドメインの境界をまたぐ関連であるかを判定する。具体的には、第2ドメインは、図5に示したように一つの仮想的な構成要素、ダミーCI(Dc11)としてCMDB11に登録されている。境界判定部33は、関連探索部32が辿った関連のソースがダミーCI(Dc11)である場合に、第1ドメインと第2ドメインの境界をまたぐ関連であると判定する。
【0037】
クエリ発行部34は、境界判定部33による判定の結果、関連探索部32が辿った関連が境界をまたぐ関連である場合に、探索装置23に対してクエリを発行する。なお、その際、仮想マシンVM11を辿った先がDc11である場合、VM11とDc11との関連を示す識別情報を含めることが望ましい。
【0038】
クエリ処理部35は、探索装置23からクエリに対する応答を受信し、評価部37に渡す。
【0039】
評価部37は、関連探索部32による異常の起点候補の探索結果と、クエリ処理部35が取得したクエリ応答の内容に基づいて異常の起点候補を評価する。具体的には、評価部37は、異常の起点候補として挙げられた構成要素の評点を求めて集計する。
例えば、評点の求め方として、
構成要素の評点=自分の異常数 + 関連の下流の構成要素の評点 (式1)
を利用してもよい。すなわち、異常が発生している構成要素で最も上流にあるものを起点候補とし、起点候補とその評点を集めて評価結果としても良い。そして、評点の高い構成要素ほど異常の起点である可能性が高いと評価する。評価部37は、ユーザインタフェース31を介して評価結果を出力する。
【0040】
また、クエリ処理部35は、探索装置23からクエリを受信した場合には、関連探索部32に対して異常の起点候補の探索を要求する。クエリ処理部35は、探索装置23からのクエリに基づいて関連探索部32が探索した異常の起点候補について、評価部37から評価を取得する。クエリ処理部35は、関連探索部32が探索した異常の起点候補をダミーの構成要素に置き換えて、ダミーの構成要素と評価結果を探索装置23からのクエリに対する応答として返す。
【0041】
仮想構成管理部36は、第1ドメインの実際の構成要素とダミーの構成要素との関係を管理する処理部である。例えば、仮想構成管理部36は、探索装置23から受信したクエリの識別情報と、置き換え対象となる第1ドメインの構成要素に基づいてCI−VCI対応表14を参照する。
【0042】
クエリの識別情報と、置き換え対象となる第1ドメインの構成要素との組み合わせに対応するダミーの構成要素が登録されていれば、仮想構成管理部36は、対応するダミーの構成要素をクエリ処理部35に通知する。また、クエリの識別情報と、置き換え対象となる第1ドメインの構成要素との組み合わせに対応するダミーの構成要素が登録されていなければ、仮想構成管理部36は、ダミーの構成要素を新規に登録する。具体的には、仮想構成管理部36は、クエリの識別情報と、置き換え対象となる第1ドメインの構成要素との組み合わせに新しくダミーの構成要素を対応させ、CI−VCI対応表14に登録するとともに、クエリ処理部35に通知する。なお、クエリ識別情報ごとにダミーの構成要素を登録し、ダミーの構成要素が登録されているか否かは、クエリの識別情報に対応する対応表を参照して判断することもできる。これによれば、クエリ識別情報ごとに、異なる対応関係を適用した対応表を適用することができるため、クエリに対する応答の累積により、構成要素間の関連性が開示されていくことを回避することができる。
【0043】
このように、探索装置13は、探索装置23からのクエリに対してはダミーの構成要素を返すことで第1ドメインの構成を仮想化する。このため、探索装置13は、第1ドメインの実際の構成を秘匿して仮想的な構成で異常の起点候補を探索装置23に通知することができる。
【0044】
同様に、探索装置23も探索装置13に対して第2ドメインの実際の構成を秘匿し、仮想的な構成でクエリに対する応答を行う。
【0045】
したがって、第1ドメインと第2ドメインの構成を互いに知らせることなく、発生した異常の起点がどちら側にあるか、すなわち第1ドメインと第2ドメインのどちらに責任があるかを調査することもできる。
【0046】
・処理動作の説明
図6は、異常の起点候補の評価に関する処理を説明するフローチャートである。図6に示したように、まず、ネットワークの状態を監視する装置が自ドメインの異常を検知する(S101)。異常を検知する装置は、探索装置であってもよいし、他の監視装置であっても良い。異常を検知した装置は、検知結果を自ドメインの障害DBに登録する。
【0047】
つぎに、探索装置が自ドメインの障害DBを参照し、異常起点調査処理(S102)を行って、結果を集計し(S103)、出力する(S104)。
【0048】
なお、異常検知(S101)は、随時行うことが望ましい。また、異常起点調査処理(S102)は、ユーザが指定したタイミングで行なっても良いし、定期的に実行しても良い。また、異常の検知と連動して実行することとしても良い。
【0049】
図7は、異常起点調査処理(S102)について説明するフローチャートである。以降の処理は、探索装置13が実行する場合を例として説明する。異常起点調査処理を開始した探索装置13の関連探索部32は、障害DB12を参照し、異常を示した構成要素(CI)を一つ選択する(S201)。このとき、関連探索部32は、異常を発生した構成要素の種別によって選択の優先順位をつける。具体的には、種別がサービスの構成要素に異常が発生していれば優先的に選択し、次に種別がアプリケーションの構成要素を優先的に選択し、同様に、仮想マシン、物理マシン、スイッチ、ルータの順に選択する。このように、構成要素の種別に基づいて選択を行なう事で、ネットワークシステム上で下流側に位置する可能性の高い構成要素から順に選択を行なうことができる。
【0050】
関連探索部32は、選択した構成要素から関連を逆方向に辿る(S202)。すなわち、異常を示した構成要素が異常を示すこととなった原因となる構成要素を探索する。境界判定部33は、辿った先の構成要素が自ドメイン内の構成要素であるかを判定する(S203)。辿った先の構成要素が自ドメイン内の構成要素で無い場合(S203,No)、クエリ発行部34がクエリを発行し(S204)、発行したクエリに対する応答をクエリ処理部35が受信する(S205)。
【0051】
辿った先の構成要素が自ドメイン内の構成要素である場合(S203,Yes)、関連探索部32は、さらに関連を辿るかを判定する(S206)。さらに関連を辿るかどうかは、一例として選択した構成要素から辿った関連の数で決めればよい。辿った関連の数をホップ数といい、辿るべき関連の数の最大値を最大ホップ数という。例えば、最大ホップ数を3と定めた場合、選択した構成要素から3つまで関連を辿る。選択した構成要素をターゲットとする複数の関連がある場合や、辿った先の構成要素をターゲットとする関連が複数ある場合、それぞれの経路を辿る。また、エラーの種類や構成要素の種類に応じて重み付けを行なって関連を辿っても良い。
【0052】
さらに関連を辿る場合(S206,Yes)、関連探索部32は、ステップS202に戻り、辿った先の構成要素からさらに関連を辿る。そして、関連を辿らない場合(S206,No)、関連探索部32は、障害DB12に登録された全ての異常について調査を行なったかを判定する(S207)。この時、関連探索部32は、他の構成要素から関連を辿ることで到達した構成要素の異常は調査済みとすることができる。
【0053】
調査を行なっていない異常が残っている場合(S207,No)、関連探索部32は、ステップS201に戻り、異常を示した構成要素をひとつ選択する。そして、障害DB12に登録された全ての異常について調査を行なった場合(S207,Yes)に、探索装置13は、異常起点調査処理を終了する。
【0054】
図8は、クエリを受信した探索装置の処理動作を説明するフローチャートである。図8では、探索装置13が他の探索装置からクエリを受信した場合を例に説明する。クエリ処理部35は、クエリを受信する(S301)と、受信したクエリに基づいて関連探索部32に異常の起点候補の探索を要求する。関連探索部32は、クエリに示された識別情報(図9の関連r01参照)と異常に基づいて異常起点調査を行なう(S302)。評価部37は、関連探索部32による探索結果を集計し、評価する(S303)。クエリ処理部35は、関連探索部32による探索の結果として得られた起点候補を仮想構成管理部36に渡す。仮想構成管理部36は、起点候補についてダミーの構成要素の識別情報である仮想IDを取得し、クエリ処理部35に返す(S304)。
【0055】
クエリ処理部35は、仮想構成管理部36から得られた仮想IDと評価部37による評価結果とを対応付け、クエリ応答としてクエリの送信元の探索装置に送信し(S305)、処理を終了する。なお、異常起点調査(S302)の詳細は、図7に示した処理と同様である。
【0056】
・各種データの例
図9は、データの具体例の説明図である。図9に示したクエリD1は、クエリID、異常内容、時刻範囲、関連の項目を有する。図9の例では、クエリIDは100、異常内容は応答時間停止、時刻範囲は2009/12/01 12:00:00〜2009/12/01 18:00:00、関連識別情報はr01である。なお、送信元のドメインは、関連識別情報(r01)に基づいて、送信元のドメインの対応する構成要素を特定でき、送信先のドメインは、関連(r01)に基づいて、送信先ドメインの対応する構成要素を特定することができる。
【0057】
すなわち、関連の項目は、クエリの送信元のドメインと送信先のドメインをまたぐ関連であり、クエリを受信した異常起点調査は、この関連のソースとなる構成要素から異常の起点候補を探索する。このように、クエリには送信元のドメインの構成を示す必要はなく、ドメインをまたぐ関連と異常に関する情報を含めばよい。このため、クエリを送信することで送信元のドメインの構成を送信先のドメインに対して秘匿しつつ異常の起点候補を探索することができる。
【0058】
クエリ応答D2は、VCIと評点の項目を有する。VCIは、ダミーの構成要素のIDを示す項目であり、評点はダミーの構成要素の評価結果である。
【0059】
外部CI情報D3は、構成情報DBに登録される他のドメインの構成情報の具体例である。CI名としてはクラウドノードとして登録され、位置は自ドメインに対して外部のドメインであることを示している。
【0060】
CI−VCI対応表D4は、CI−VCI対応表の一例であり、クエリIDに対して実際の構成要素であるCIのIDと仮想の構成要素であるVCIのIDとを対応づけて保持している。図9の例では、クエリID100に対してCIであるSW2とVCIであるV001とを対応づけて保持している。また、クエリID100に対してCIであるPM2とVCIであるV002とを対応づけて保持している。さらに、クエリID101に対しては、CIであるSW2とVCIであるV003とを対応づけて保持している。
【0061】
CI−VCI対応表は、IDが同一のクエリに対しては、同一の対応関係を使用する。一方で、クエリのIDが異なる場合には、異なる対応関係を使用して、同一のCI(図9の例ではSW2)に対して異なるVCIを対応させる。このため、クエリのIDごとに仮想の構成が一意に定まるので、仮想の構成で異常の起点候補を正確に評価するとともに、複数のクエリによって実際の構成の推定を難しくすることができる。
【0062】
評点表D5は、評価部による評価結果の具体例であり、CIのIDに評点を対応づけた構成を有する。評点表D5では、V001の評点が9、V002の評点が3、SW2の評点が1である。したがって、評点表D5では、評点が最も高いV001が異常の起点であることが推定される。このV001は、他のドメインからのクエリ応答として得られた仮想の構成要素であるので、V001が異常の起点であるならば、自ドメイン側を起点とした異常の発生ではないことが推定される。
【0063】
図10は、異常の起点候補の評価結果を表示する画面例についての説明図である。図10に示した画面例D6,7は、「異常の起点である可能性が高いCIは以下の通りです。」というメッセージとともに、CIのIDと責任元の情報を表示している。一例として、評点が上位2つの構成要素を異常の起点である可能性が高い構成要素とすればよい。
【0064】
画面例D6は、App2とApp1を異常の起点である可能性が高いCIとして表示し、App2とApp1がともに自ドメインの管理範囲内であることを示している。画面例D7は、V001とV002を異常の起点である可能性が高いCIとして表示し、V001とV002がともに自ドメインの管理範囲外であることを示している。
【0065】
・異常の起点候補探索の具体例
図11〜14は、異常の起点候補の探索の例についての説明図である。図11に示したネットワークシステムでは、システム41とシステム42とが接続されている。システム41は、ルータRT1、スイッチSW1、物理マシンPM1、アプリケーションApp1、サービスSVC1を有する。システム42は、ルータRT2、スイッチSW2、物理マシンPM2,3、仮想マシンVM1〜3、アプリケーションApp2〜4を有する。
【0066】
ルータRT1とルータRT2とが接続され、システム41,42との間の通信が可能な状態となっている。スイッチSW1,2は、同一システム内の物理マシンとルータとを接続する。アプリケーションApp1は、物理マシンPM1上で動作する。
【0067】
仮想マシンVM1,2は、物理マシンPM2上で動作する。同様に、仮想マシンVM3は、物理マシンPM3上で動作する。そして、アプリケーションApp2〜4は、それぞれ物理マシンPM1〜3上で動作する。
【0068】
サービスSVC1は、アプリケーションApp1〜4を利用して提供されるサービスである。
【0069】
図11に示したネットワークシステムでは、ルータRT1、スイッチSW1、物理マシンPM1、アプリケーションApp1〜4、仮想マシンVM1〜3、サービスSVC1が第1の管理範囲10に含まれる。また、ルータRT2、スイッチSW2、物理マシンPM2〜3が第2の管理範囲20に含まれる。第1の管理範囲10の構成情報はCMDB11が保持し、第1の管理範囲10内で発生した異常に関する情報は障害DB12が保持する。同様に、第2の管理範囲20の構成情報はCMDB21が保持し、第2の管理範囲20内で発生した異常に関する情報は障害DB22が保持する。管理範囲の態様は、これに限らず、更に多くの管理範囲を形成してもよい。その際、障害DBは、複数の管理範囲のそれぞれに設けてよい。
【0070】
図12は、第1の管理範囲10のアプリケーションApp2でアプリケーションの応答時間が悪化するエラーE1が発生した場合の説明図である。
【0071】
アプリケーションの応答時間悪化の原因としては、例えば、Java(登録商標)アプリケーションにおいてオブジェクトの解放漏れがあるため、巨大GC(Garbage Collection)が時々発生し、アプリケーションの応答時間が数十秒になった場合などがある。
【0072】
App2にエラーE1が発生すると、アプリケーションApp2に依存するアプリケーションApp1やサービスSVC1の応答時間も悪化し、エラーE1が発生する。これらの応答時間の悪化は、運用管理ソフトウェアにより、第1の管理範囲10の管理者が予め定めた応答時間閾値を超えることで、異常として検出される。応答時間閾値は、一例として3秒などである。
【0073】
図12に示した例では、第1の管理範囲10に発生したサービスSVC1、アプリケーションApp1,2のエラーE1が障害DB12に登録される。この3つのエラーから探索装置13が異常の起点候補を評価する場合について説明する。
【0074】
探索装置13は、まず、サービスSVC1、アプリケーションApp1,2のうち、構成要素の種別に基づいてサービスSVC1を選択する。探索装置13は、選択したサービスSVC1を探索の開始点として関連を辿りながら、辿った経路上に存在する構成要素のうち、異常が発生している構成要素について、例えば式1で示したような計算方法で評点を算出する。
【0075】
探索の開始点であるサービスSVC1は、自分自身の異常数が1で、関連の下流に位置する構成要素は存在しないため、式1に従って評点を求めると1+0=1となる。サービスSVC1から辿ることの出来る構成要素は、アプリケーションApp1〜4である。
【0076】
アプリケーションApp1は、自分自身の異常数が1で、サービスSVC1が下流の構成要素として存在するため、求めたSVC1の評点1を加算して(1+1)、合計評点2を得る。アプリケーションApp1から辿ることの出来る構成要素は、物理マシンPM1とアプリケーションApp2である。物理マシンPM1から辿ることのできる経路上には、スイッチSW1とルータRT1が存在するが、物理マシンPM1、スイッチSW1、ルータRT1には異常が発生していないため、評点は求めない。
【0077】
アプリケーションApp2は、自分自身の異常数が1で、サービスSVC1とアプリケーションApp1が下流の構成要素として存在する。このため、アプリケーションApp2の評点は、自身の異常数1に、サービスSVC1の評点1とアプリケーションApp1の評点2を加算して(1+1+2)、合計評点4を得る。アプリケーションApp2から辿ることの出来る構成要素は、仮想マシンVM1である。
【0078】
仮想マシンVM1は、異常が発生していないので評点は求めない。仮想マシンVM1からさらに関連を辿ると、第2の管理範囲20に至る。ここで、第2の管理範囲20は、図13に示したように探索装置13からは1つの構成要素、クラウドノードVC1として認識されている。探索装置13は、辿った先がクラウドノードVC1であることから、第2の管理範囲20の異常の起点候補を探索する探索装置23に対してクエリQ11を発行する。このクエリQ11は、仮想マシンVM1とクラウドノードVC1との間に設定された関連の情報と、探索の開始点の異常の情報を含む。また、クエリQ11に含まれる関連までのホップ数や、最大ホップを含んでも良い。
【0079】
探索装置23は、クエリを受けて第2の管理範囲20内での異常の起点候補の探索を行なう。具体的には、クエリQ11に指定された仮想マシンVM1との関連を開始点として関連を辿って異常の起点候補を探索する。図12に示した例では、仮想マシンVM1と物理マシンPM2との関連がクエリQ11によって指定されているので、物理マシンPM2から関連を辿ることとなる。しかし、第2の管理範囲20内では異常が発生していないため、探索装置23は、クエリQ11に対して起点候補無しの旨の応答を行う。
【0080】
アプリケーションApp3〜4は、サービスSVC1から辿ることが出来るが、異常が発生していないため評点は求めない。アプリケーションApp3から辿ることの出来る構成要素は、仮想マシンVM2であり、仮想マシンVM2からさらに関連を辿ると、第2の管理範囲20に対応するクラウドノードVC1に至る。同様に、アプリケーションApp4から辿ることの出来る構成要素は、仮想マシンVM3であり、仮想マシンVM3からさらに関連を辿ると、クラウドノードVC1に至る。
【0081】
探索装置13は、仮想マシンVM2,3から関連を辿ってクラウドノードVC1に到達した場合にも探索装置23に対してクエリQ11,12を発行する。このクエリQ11,12は、仮想マシンVM2,3とクラウドノードVC1との間に設定された関連の情報と、探索の開始点の異常の情報を含む。探索装置23は、クエリQ11,12を受けて第2の管理範囲20内での異常の起点候補の探索を行い、第2の管理範囲20内では異常が発生していないため、起点候補無しの旨の応答を行う。
【0082】
このように、図12に示した例において、サービスSVC1を開始点として探索を行なうと、アプリケーションApp2が最も上流で異常が発生している構成要素であるので、アプリケーションApp2(評点4)が異常の起点候補となる。
【0083】
また、サービスSVC1を開始点として探索を行なう過程で、他に異常が発生した構成要素であるアプリケーションApp1,2の評価を行なったので、アプリケーションApp1,2を開始点とする探索は不要となる。このため、図12に示した例では、探索装置13はアプリケーションApp2(評点4)を異常の起点候補とする。
【0084】
図12に示した例では、異常の起点候補は1つとなったが、異常の起点候補が複数となった場合には、探索装置13は複数の起点候補を評点とともに出力する。例えば、複数の異常が同時に発生した場合や、実際の起点が1つであっても探索で候補を絞りきれない場合には複数の起点候補が出力されることとなる。なお、評点の算出は、異常の起点としての確からしさを数値化する他の手法を用いてもよい。また、異常が発生していない構成要素についても異常の起点候補として評点を与える手法を用いても良い。
【0085】
図14は、第2の管理範囲20のスイッチSW2で輻輳に起因する応答時間悪化のエラーE1が発生した場合の説明図である。
【0086】
スイッチSW2のようなL2(Layer2)スイッチが輻輳を起こすと、アプリケーションApp2,3など上位のアプリケーションでIPパケットが一部廃棄される。下位の仮想マシンVM1,2のTCP層は、暫く待って(例えば3秒後、更に破棄されたらその6秒後など)、IPパケットの再送(エラーE2)を行う。これにより、アプリケーションApp1,2の応答時間も3秒、6秒といった長さになる。そして、アプリケーションApp2に依存するアプリケーションApp1やサービスSVC1の応答時間も悪化する(エラーE1)。
【0087】
これらの応答時間の悪化は、運用管理ソフトウェアにより、管理者が予め定めた応答時間閾値(一例として3秒など)を超えることで、異常として検出される。また、スイッチSW2、仮想マシンVM1,2では、運用管理ソフトウェアの計測するTCP再送回数やパケット廃棄率が上昇することにより、異常として検出される。
【0088】
図14に示した例では、第1の管理範囲10に発生したサービスSVC1、アプリケーションApp1〜3のエラーE1と仮想マシンVM1,2のエラーE2が障害DB12に登録される。また、第2の管理範囲20に発生したスイッチSW2のエラーE1が障害DB22に登録される。これら7つのエラーから探索装置13,23が異常の起点候補を評価する場合について説明する。
【0089】
探索装置13は、まず、第1の管理範囲10で異常が発生したサービスSVC1、アプリケーションApp1〜3、仮想マシンVM1〜2のうち、構成要素の種別に基づいてサービスSVC1を選択する。探索装置13は、選択したサービスSVC1を探索の開始点として関連を辿りながら、辿った経路上に存在する構成要素のうち、異常が発生している構成要素について、例えば式1で示したような計算方法で評点を算出する。
【0090】
図12の例と同様に、サービスSVC1の評点は1、アプリケーションApp1の評点は2、アプリケーションApp2の評点は4となる。アプリケーションApp1から辿ることの出来る構成要素のうち、物理マシンPM1、スイッチSW1、ルータRT1には異常が発生していないため、評点は求めないことについても図12の例と同様である。
【0091】
図14に示した例では、アプリケーションApp2から辿ることの出来る仮想マシンVM1は、自分自身の異常数1にアプリケーションApp2の評点が4を加算して(1+4)合計評点5を得る。
【0092】
アプリケーションApp3は、自分自身の異常数が1で、サービスSVC1が下流の構成要素として存在する。このため、アプリケーションApp2の評点は、自身の異常数1に、サービスSVC1の評点1を加算して(1+1)、合計評点2を得る。アプリケーションApp3から辿ることの出来る構成要素は、仮想マシンVM2である。
【0093】
仮想マシンVM2は、自分自身の異常数1にアプリケーションApp2の評点4を加算して(1+2)合計評点3を得る。
【0094】
仮想マシンVM1からさらに関連を辿ると、第2の管理範囲20に至る。ここで、第2の管理範囲20は、図12に示したように探索装置13からは1つの構成要素、クラウドノードVC1として認識されている。探索装置13は、辿った先がクラウドノードVC1であることから、第2の管理範囲20の異常の起点候補を探索する探索装置23に対してクエリQ21を発行する。このクエリQ21は、仮想マシンVM1とクラウドノードVC1との間に設定された関連の情報と、探索の開始点の異常の情報を含む。また、クエリに含まれる関連までのホップ数や、最大ホップを含んでも良い。
【0095】
同様に、仮想マシンVM2からさらに関連を辿ると、第2の管理範囲20に対応するクラウドノードVC1に至る。探索装置13は、仮想マシンVM2から関連を辿ってクラウドノードVC1に到達した場合に探索装置23に対してクエリQ22を発行する。このクエリQ22は、仮想マシンVM2とクラウドノードVC1との間に設定された関連の情報と、探索の開始点の異常の情報を含む。
【0096】
アプリケーションApp4は、サービスSVC1から辿ることが出来るが、異常が発生していないため評点は求めない。アプリケーションApp4から辿ることの出来る構成要素は、仮想マシンVM3であり、仮想マシンVM3からさらに関連を辿ると、クラウドノードVC1に至る。探索装置13は、仮想マシンVM3から関連を辿ってクラウドノードVC1に到達した場合に探索装置23に対してクエリQ23を発行する。このクエリQ23は、仮想マシンVM3とクラウドノードVC1との間に設定された関連の情報と、探索の開始点の異常の情報を含む。
【0097】
探索装置13が発行するクエリQ21〜23は、開始点が同じ異常探索処理の中で発行されるクエリとして、クエリの識別情報は、同じ識別情報(例えば、クエリID100)を使用することができる。
【0098】
探索装置23は、クエリQ21〜23を受けて第2の管理範囲20内での異常の起点候補の探索を行なう。具体的には、クエリQ21〜23に指定された仮想マシンVM1〜VM3との関連をそれぞれ開始点として関連を辿って異常の起点候補を探索する。クエリQ21は、仮想マシンVM1と物理マシンPM2との関連を指定している。クエリQ22は、仮想マシンVM2と物理マシンPM2との関連を指定している。クエリQ23は、仮想マシンVM3と物理マシンPM3との関連を指定している。
【0099】
好ましくは、第1の管理範囲側では、仮想マシンVM1〜3が第2の管理範囲のどの構成要素と接続されているか管理しておらず、VM1〜3と第2の管理範囲の何らかの構成要素との接続関係の識別情報(例えばr01〜03)との関係をCMDBに記憶しておき、クエリQ21〜23には、この識別情報r01〜03を含める。第2の管理範囲側では、物理マシンPM2〜3が第1の管理範囲のどの構成要素と接続されているか管理しておらず、物理マシンPM2と第1の管理範囲の何らかの構成要素との接続関係の識別情報(例えばr01〜03)との関係をCMDBに記憶しているため、クエリに含まれる識別情報r01〜03に基づいて、物理マシンPM2〜3を特定して、異常の起点の探索を行うことができる。
【0100】
探索装置23がクエリQ21に基づいて探索を開始し、関連をたどると、物理マシンPM2、スイッチSW2、ルータRT2に至る。探索装置23は、スイッチSW2についてエラーE2が障害DB22に登録されていることから、仮想マシンVM1を開始点に発行されたクエリQ21について評点1を付し、スイッチSW2をダミーの構成要素VC001に置き換えてクエリQ21に対して応答する。
【0101】
探索装置23がクエリQ22に基づいて探索を開始し、関連をたどると、物理マシンPM2、スイッチSW2、ルータRT2に至る。探索装置23は、スイッチSW2についてエラーE2が障害DB22に登録されていることから、仮想マシンVM2を開始点に発行されたクエリQ22について評点1を付し、スイッチSW2をダミーの構成要素VC001に置き換えてクエリQ22に対して応答する。
【0102】
探索装置23がクエリQ23に基づいて探索を開始し、関連をたどると、物理マシンPM3、スイッチSW2、ルータRT2に至る。探索装置23は、スイッチSW2についてエラーE2が障害DB22に登録されていることから、仮想マシンVM3を開始点に発行されたクエリQ23について評点1を付し、スイッチSW2をダミーの構成要素VC001に置き換えてクエリQ23に対して応答する。
【0103】
探索装置23は、クエリQ21〜23に対する応答から、仮想マシンVM〜3の上流に構成要素VC001が存在し、構成要素VC001の第2の管理範囲内での評点が1であることを認識する。そこで、探索装置23は、構成要素VC001の第2の管理範囲内での評点1に、下流側の評点を加算して構成要素VC001とする。
【0104】
従って、構成要素VC001の第2の管理範囲内での評点1に、仮想マシンVM1の評点5、仮想マシンVM2の評点3、仮想マシンVM3の下流に位置するサービスSVC1の評点1を加算し(1+5+3+1)、構成要素VC001の合計評点は10となる。
【0105】
このように、図14に示した例において、サービスSVC1を開始点として探索を行なうと、ダミー構成要素VC001が最も上流で異常が発生している構成要素であるので、ダミー構成要素VC001(評点10)が異常の起点候補となる。
【0106】
また、サービスSVC1を開始点として探索を行なう過程で、他に異常が発生した構成要素であるアプリケーションApp1〜3、仮想マシンVM1〜2の評価を行なったので、アプリケーションApp1〜3、仮想マシンVM1〜2を開始点とする探索は不要となる。このため、図14に示した例では、探索装置13はダミー構成要素VC001(評点10)を異常の起点候補とする。
【0107】
この結果は、ダミー構成要素VC001が異常の起点である可能性が高いこと、すなわち異常の責任が第2の管理範囲側にある可能性が高いことを示している。
【0108】
図14に示した例では、異常の起点候補は1つとなったが、異常の起点候補が複数となった場合には、探索装置13は複数の起点候補を評点とともに出力する。例えば、複数の異常が同時に発生した場合や、実際の起点が1つであっても探索で候補を絞りきれない場合には複数の起点候補が出力されることとなる。なお、評点の算出は、異常の起点としての確からしさを数値化する他の手法を用いてもよい。また、異常が発生していない構成要素についても異常の起点候補として評点を与える手法を用いても良い。
【0109】
・プログラムによる実施
図15は、コンピュータを探索装置として動作させる場合の説明図である。図15に示したコンピュータ50は、バス51にCPU(Central Processing Unit)52、ROM(Read Only Memory)53、RAM(Random Access Memory)54、NIC(Network Interface Card)55、HDD(Hard Disk Drive)56を接続した構成を有する。
【0110】
ROM53は、関連探索プログラム61、評価プログラム62、仮想構成管理プログラム63、クエリ処理プログラム64、境界判定プログラム65、クエリ発行プログラム66を保持する。タンジブル(tangible)な記録媒体の例としてROM53を例に挙げた、HDDや、RAM、CDROM等の他のタンジブルなコンピュータ読み取り可能な記録媒体に各種プログラムを格納しておき、コンピュータに読み取らせることとしてもよい。なお、タンジブルな記憶媒体を遠隔地に配置し、コンピュータが、そのタンジブルな記憶媒体にアクセスすることでプログラムを取得して利用してもよい、また、その際、取得したプログラムをそのコンピュータ自身のタンジブルな記録媒体に格納して用いてもよい。
【0111】
CPU52は、関連探索プログラム61を読み出して実行することで、関連探索部32と同様の動作を関連探索プロセス71として実現する。また、CPU52は、評価プログラム62を読み出して実行することで、評価部37と同様の動作を評価プロセス72として実現する。CPU52は、仮想構成管理プログラム63を読み出して実行することで、仮想構成管理部36と同様の動作を仮想構成管理プロセス73として実現する。CPU52は、クエリ処理プログラム64を読み出して実行することで、クエリ処理部35と同様の動作をクエリ処理プロセス74として実現する。CPU52は、境界判定プログラム65を読み出して実行することで、境界判定部33と同様の動作を境界判定プロセス75として実現する。CPU52は、クエリ発行プログラム66を読み出して実行することで、クエリ発行部34と同様の動作をクエリ発行プロセス76として実現する。
【0112】
このようにROM53に保持した各種プログラムは、探索プログラムの一部として機能し、コンピュータ50は、ROM53から各種プログラムを読み出して実行することで探索方法を実行する探索装置として動作する。
【0113】
・3以上のドメインを有する構成
これまでの説明では第1の管理範囲と第2の管理範囲を有するネットワークシステムを例示して説明を行なったが、3以上の管理範囲を有するネットワークシステムにおいても開示の技術は適用可能である。
【0114】
図16は、3つの管理範囲を有するネットワークシステムについての説明図である。図16に示した構成では、第2の管理範囲に対応する第2ドメイン側システム20aは、第1の管理範囲に対応する第1ドメイン側システム10aと第3の管理範囲に対応する第3ドメイン側システム10bに接続されている。
【0115】
第2ドメイン側システム20aは、探索装置23a、CMDB21、障害DB22、CI−VCI対応表24a,24bを有する。また、探索装置23aは、第1ドメイン側システム10aと第3ドメイン側システム10bがそれぞれ有する探索装置と接続されている。
【0116】
CMDB21は、第2のドメインにおける構成要素の接続情報を保持する。障害DB22は、第2ドメイン内で発生した障害の情報を保持する。CI−VCI対応表24aは、第1ドメイン側システム10aからのクエリに応答する際に使用するダミーの構成要素と実際の構成要素との対応関係を保持する。CI−VCI対応表24bは、第3ドメイン側システム10bからのクエリに応答する際に使用するダミーの構成要素と実際の構成要素との対応関係を保持する。
【0117】
このように、ドメインごとにCI−VCI対応表を個別に管理すると、同じクエリIDであっても同じ構成要素に対して異なるVCIを設定することも可能となり、第2のドメインの構成が露呈することを抑制することができる。
【0118】
なお、CI−VCI対応表が単一であっても、ドメイン毎に使用を許容するクエリIDの候補を別個として、クエリ応答の重ね合わせによる構成情報の推測を回避することができる。クエリIDを各ドメインで共用する場合、異なるドメインからの同じクエリIDを付したクエリの送信により、共通する構成要素について、共通したダミーの構成要素情報が応答として送信されてしまう。すると、異なるドメイン間で応答を重ね合わせることで、第2のドメインの構成が露呈していくこととなるが、ドメイン毎に使用を許容するクエリIDの候補を別個とすると、そのような事態を回避することができる。
【0119】
・実施例2のまとめ
上述してきたように、本実施例2にかかる探索装置、探索方法および探索プログラムは、システムに発生した異常の起点の候補を評価することができる。
【0120】
また、本実施例2にかかる探索装置は、他の探索装置からのクエリに対してはダミーの構成要素を返すことで自ドメインの構成を仮想化する。このため、探索装置は、自ドメインの実際の構成を秘匿して仮想的な構成で異常の起点候補を他の探索装置に通知することができる。したがって、各ドメインの構成を互いに知らせることなく異常の起点である構成要素を推定し、発生した異常の起点がどのドメインにあるかを調査することができる。
【0121】
なお、実施例に開示の装置、方法およびプログラムはあくまで一例であり、構成および動作を適宜変更して実施することができる。例えば、実施例2に開示した装置は、各処理部をネットワークシステム上に分散して配置し、探索システムとして実施することができる。
【符号の説明】
【0122】
1,2,13,23,23a 探索装置
3,6 探索部
4 クエリ発行部
5,7 評価部
8 クエリ処理部
9 ダミー処理部
10a 第1ドメイン側システム
10b 第3ドメイン側システム
10,20 管理範囲
11,21 CMDB
12,22 障害DB
14,24,24a,24b CI−VCI対応表
20a 第2ドメイン側システム
31 ユーザインタフェース
32 関連探索部
33 境界判定部
34 クエリ発行部
35 クエリ処理部
36 仮想構成管理部
37 評価部
41,42 システム
50 コンピュータ
51 バス
52 CPU
53 ROM
54 RAM
55 NIC
56 HDD
61 関連探索プログラム
62 評価プログラム
63 仮想構成管理プログラム
64 クエリ処理プログラム
65 境界判定プログラム
66 クエリ発行プログラム
71 関連探索プロセス
72 評価プロセス
73 仮想構成管理プロセス
74 クエリ処理プロセス
75 境界判定プロセス
76 クエリ発行プロセス
App1〜4,11〜16 アプリケーション
C11〜16 構成要素
nw11,12 ネットワーク
PM1〜3 物理マシン
pm11〜13 サーバ
RT1,2 ルータ
Sv11,SVC1 サービス
SW1,2 スイッチ
VC1 クラウドノード
VM1〜3,VM11〜16 仮想マシン

【特許請求の範囲】
【請求項1】
ネットワークの構成要素のうち、第1の管理範囲に属する構成要素に発生した異常について、前記異常が発生した構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する探索部と、
前記探索部が辿った先の構成要素が第2の管理範囲に属する構成要素である場合に、前記第2の管理範囲における異常の起点候補を探索する装置に対して前記異常の起点候補の探索を依頼するクエリを発行するクエリ発行部と、
前記探索部による探索結果と前記クエリに対する応答とに基づいて、前記異常の起点候補を評価する評価部と
を備えたことを特徴とする探索装置。
【請求項2】
ネットワークの構成要素のうち第1の管理範囲に属する構成要素における異常の起点候補を探索する装置から、第2の管理範囲に属する異常の起点候補の探索を依頼するクエリを受信するクエリ処理部と、
前記クエリに基づいて前記第2の管理範囲に属する構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する探索部と、
前記探索部による探索結果に基づいて前記異常の起点候補を評価する評価部と、
前記探索部が探索した前記異常の起点候補である構成要素をダミーの構成要素に置き換えるダミー処理部と
を備え、
前記クエリ処理部は、前記ダミーの構成要素と前記評価部による評価結果とを前記クエリに対する応答として返すことを特徴とする探索装置。
【請求項3】
前記クエリは、同一の異常について同一の識別情報を有し、前記ダミー処理部は、同一の識別情報を有するクエリに対して、前記異常の起点候補である構成要素を同一のダミーの構成要素に置き換えることを特徴とする請求項2に記載の探索装置。
【請求項4】
前記ダミー処理部は、前記第1の管理範囲からのクエリに応答する際に使用する異常の起点候補である構成要素とダミーの構成要素との対応関係と、第3の管理範囲からのクエリに応答する際に使用する異常の起点候補である構成要素とダミーの構成要素との対応関係とを個別に管理することを特徴とする請求項2または3に記載の探索装置。
【請求項5】
ネットワークの構成要素のうち、第1の管理範囲に属する構成要素に発生した異常について、前記異常が発生した構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する探索ステップと、
前記探索ステップが辿った先の構成要素が第2の管理範囲に属する構成要素である場合に、前記第2の管理範囲における異常の起点候補を探索する装置に対して前記異常の起点候補の探索を依頼するクエリを発行するクエリ発行ステップと、
前記探索ステップによる探索結果と前記クエリに対する応答とに基づいて、前記異常の起点候補を評価する評価ステップと
を含んだことを特徴とする探索方法。
【請求項6】
ネットワークの構成要素のうち第1の管理範囲に属する構成要素における異常の起点候補を探索する装置から、第2の管理範囲に属する異常の起点候補の探索を依頼するクエリを受信するステップと、
前記クエリに基づいて前記第2の管理範囲に属する構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する探索ステップと、
前記探索ステップによる探索結果に基づいて前記異常の起点候補を評価する評価ステップと、
前記探索ステップが探索した前記異常の起点候補である構成要素をダミーの構成要素に置き換えるステップと、
前記ダミーの構成要素と前記評価ステップによる評価結果とを前記クエリに対して応答として返すステップと、
を含んだことを特徴とする探索方法。
【請求項7】
ネットワークの構成要素のうち、第1の管理範囲に属する構成要素に発生した異常について、前記異常が発生した構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する探索手順と、
前記探索手順が辿った先の構成要素が第2の管理範囲に属する構成要素である場合に、前記第2の管理範囲における異常の起点候補を探索する装置に対して前記異常の起点候補の探索を依頼するクエリを発行するクエリ発行手順と、
前記探索手順による探索結果と前記クエリに対する応答とに基づいて、前記異常の起点候補を評価する評価手順と
をコンピュータに実行させることを特徴とする探索プログラム。
【請求項8】
ネットワークの構成要素のうち第1の管理範囲に属する構成要素における異常の起点候補を探索する装置から、第2の管理範囲に属する異常の起点候補の探索を依頼するクエリを受信する手順と、
前記クエリに基づいて前記第2の管理範囲に属する構成要素の接続関係を辿って前記異常の起点となった構成要素の候補を前記異常の起点候補として探索する探索手順と、
前記探索手順による探索結果に基づいて前記異常の起点候補を評価する評価手順と、
前記探索手順が探索した前記異常の起点候補である構成要素をダミーの構成要素に置き換える手順と、
前記ダミーの構成要素と前記評価手順による評価結果とを前記クエリに対する応答として返す手順と、
をコンピュータに実行させることを特徴とする探索プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate