説明

機器障害予測方法及び機器障害予測装置

【課題】機器の障害発生の予測のためには相関関係の算出等が必要であるため、装置が複雑になる。また、ある現象が障害と関係がある事前現象であるかどうかは障害解析の過去データから障害発生後の障害解析時にしか得られない。
【解決手段】障害事前情報データベース21には、機器2で障害が起きた場合、障害発生時のログから障害が発生する前に障害の契機となる現象があれば、その障害の契機となる現象(障害事前情報)が管理者端末1により登録される。この障害事前情報は、予め分かっているものについてはすべて障害事前情報データベース21に予め登録され、その後分かった場合は、障害事前情報データベース21に随時登録される。本実施例では、障害事前現象をデータベース化することで事前に障害を予測できる可能性が高くなる。障害予測通知部22は障害予測を管理者あるいはユーザに通知する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は機器障害予測方法及び機器障害予測装置に係り、特に障害を監視する必要がある分野において、機器に発生する障害を予測する機器障害予測方法及び機器障害予測装置に関する。
【背景技術】
【0002】
機器の障害の発生を予測し、情報処理システムの性能を監視する性能監視装置が知られている(例えば、特許文献1参照)。図4はこの特許文献1に記載の性能監視システムの一例の構成図を示す。同図において、性能監視装置10は蓄積サーバ101と分析サーバ102とから構成される。性能監視装置10は、Webサーバ11、AP(アプリケーション)サーバ12、DB(データベース)サーバ13から構成される情報処理システムとローカルエリアネットワーク(LAN)等の通信回線で接続され、この通信回線を介して各サーバの状態を監視する。
【0003】
蓄積サーバ101は上記の各サーバ11〜13間を接続する通信回線で通信されるトランザクションのスループット、処理名等を示すトランザクションデータなどを監視データとして内部に蓄積する。分析サーバ102は、蓄積サーバ101に蓄積された監視データに基づいて、情報処理システムに現在発生している障害を検知したり、あるいは情報処理システムに将来発生する可能性のある障害を予測する。
【0004】
この性能監視装置では、複数の情報処理装置(サーバ11〜13)の稼動状況及び複数の情報処理装置間を接続する各通信回線のデータ通信状況を監視する監視手段(蓄積サーバ101)と、上記監視データに基づいて、情報処理システムに現在発生している障害を検知、又は情報処理システムに将来障害が発生する可能性を予測する障害検知/予測手段(分析サーバ102)とを有する構成である。
【0005】
ここで、上記の障害検知/予測手段は、算出された複数種類の監視データの間の相関関係と、監視手段によって現在までに得られた複数種類の監視データの推移とに基づいて、情報処理装置に将来障害が発生する可能性があることを予測する。また、上記の障害検知/予測手段は、複数種類の監視データに基づいて算出された、情報処理システムの正常稼動時及び異常稼動時の少なくともいずれか一方の相関関係を用いて、情報処理システムに現在発生している障害を検知、又は情報処理システムに将来障害が発生する可能性を予測する。
【0006】
【特許文献1】特開2005−327261号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、機器障害予測装置の関連発明である上記の特許文献1記載の性能監視装置は、情報処理装置に将来障害が発生する可能性があることを予測するために、算出された複数種類の監視データの間の相関関係と、監視手段によって現在までに得られた複数種類の監視データの推移とに基づいて、あるいは、複数種類の監視データに基づいて算出された、情報処理システムの正常稼動時及び異常稼動時の少なくともいずれか一方の相関関係を用いて予測するため、計算量が膨大となり、また装置が複雑となる。
【0008】
装置を簡略化するには、相関関係の算出は行わず、また将来発生する可能性のあるすべての障害の予測を行わず、障害の契機となる現象(事前現象)が発生したことを検出することができればよい。しかしながら、ある現象が障害と関係がある事前現象であるかどうかは障害解析の過去データから障害発生後の障害解析時にしか得られない。
【0009】
本発明は以上の点に鑑みなされたもので、障害の契機となる事前現象を予めデータベースに登録しておくことで、機器の現在の現象が登録された事前現象であるか否かに応じて次に発生する障害を予測することが可能な機器障害予測方法及び機器障害予測装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記の目的を達成するため、第1の発明は、機器により構成されるシステムの変化を検出する第1のステップと、検出した変化が、障害の発生契機としてその直前に発生する障害事前現象と同じ現象によるものであるかどうか判定する第2のステップと、第2のステップにより障害事前現象と同じ現象によるものであるとの判定結果が得られたときは、その旨を通知する第3のステップとを含むことを特徴とする。
【0011】
また、上記の目的を達成するため、第2の発明は、機器により構成されるシステムの変化を検出する検出手段と、検出した変化が、障害の発生契機としてその直前に発生する障害事前現象と同じ現象によるものであるかどうか判定する判定手段と、判定手段により障害事前現象と同じ現象によるものであるとの判定結果が得られたときは、その旨を通知する通知手段とを有することを特徴とする。
【発明の効果】
【0012】
本発明によれば、機器の障害の発生契機としてその直前に発生する障害事前現象である障害事前現象情報に基づき、機器の障害発生を障害が発生する前に予測して管理者に認識させることができる。
【発明を実施するための最良の形態】
【0013】
次に、本発明を実施するための最良の形態について図面と共に説明する。図1は本発明になる機器障害予測装置の一実施例のブロック図を示す。同図において、管理者端末1が機器2に接続されている。機器2は、機器本来の動作に必要な各部分(図示せず)に加えて、障害事前情報データベース21と障害予測通知部22とを有している。これら障害事前情報データベース21と障害予測通知部22とは機器障害予測装置を構成している。
【0014】
管理者端末1は障害事前情報データベース21へ障害の契機となる現象を登録するためにある。管理者端末1を操作する管理者は、機器2を使用するユーザである場合もあり、また、ユーザとは別である場合もあり得る。障害事前情報データベース21には、機器2で障害が起きた場合、障害発生時のログから障害が発生する前に障害の契機となる現象があれば、その障害の契機となる現象(障害事前情報)が管理者端末1により登録(保存)される。この障害事前情報は、予め分かっているものについてはすべて障害事前情報データベース21に予め登録され、その後分かった場合は、障害事前情報データベース21に随時登録される。本実施例では、障害事前現象をデータベース化することで事前に障害を予測できる可能性が高くなる。
【0015】
障害事前情報データベース21は記憶機能だけでなく、判断機能も有しており、登録されている障害事前情報の中のどれか一つの障害事前情報と同じ現象が機器2に発生した場合、その現象に対応した障害事前情報に基づき、次に予測される障害情報を予測して障害予測通知部22に通知する。障害予測通知部22は、発光ダイオード(LED)などによる視覚的通知、あるいはアラーム音による聴覚的通知により、更には画像表示により障害予測を管理者あるいはユーザに通知する。
【0016】
機器2としては、例えばPICMG(PCI Industrial Computer Manufacturers Group)が策定した次世代の通信機器向け標準規格(AdvancedTCA:Advanced Telecom Computing Architecture)によるATCAスイッチなどがあり、また、障害の例としてはポートリンクダウン(Port Link Down)があり、障害事前情報の例としてはポートリンクアップ/ダウンがある。すなわち、ATCAスイッチにおいては、ポートリンクアップ/ダウンを起こした場合、その後ポートリンクダウンになってしまうことがある。
【0017】
ここで、管理者端末1と機器2とからなるシステムには、例えば図2(A)に示すように、複数台(ここでは一例として3台)の機器A、B、Cを1台の管理装置4で統括的に管理するシステムや、図2(B)に示すように、1台の機器と1台の管理装置とが一体となった単一機器システム5がある。これらのシステムのうち図2(A)に示したシステムでは、機器A、B、Cを統括管理する管理装置4に、また同図(B)に示した単一機器システム5の機器に、前述した事前情報データベース21と障害予測通知部22とからなる機器障害予測装置を有している。
【0018】
次に、図1の実施例の動作について、図3の本発明の機器障害予測方法の一実施例のフローチャートを併せ参照して説明する。管理者端末1から障害事前情報データベース21へ障害の契機となる現象を示す障害事前情報を予め登録する(ステップS1)。続いて、管理装置が図2(A)又は(B)に示したシステムの変化を検出する(ステップS2)。なお、管理装置は図1では図示を省略してある。このシステムの変化は、システムを構成する一台又は複数台の機器が、機器本来の動作以外の何らかの現象を発生したことにより生じる。
【0019】
続いて、上記の検出された変化が、障害事前情報データベース21に登録された障害事前情報と同じ現象であるかどうか、障害事前情報データベース21が判定し(ステップS3)、上記の検出された変化が、登録された障害事前情報と同じ現象である場合は、その旨を障害予測通知部22に通知する。これにより、障害予測通知部22は障害発生の契機となる現象が発生したことを、すなわち、予測される障害を管理者に報知する(ステップS4)。
【0020】
ここで、障害事前情報データベース21に登録された障害事前情報が複数あり、そのうちのどの障害事前情報と一致するかを区別して報知する場合は、光の点滅周期、音の断続する長短のパターン、あるいは画面に表示されるメッセージなどで区別する。これらの方法は、公知であるので、その詳細な説明は省略する。これにより、管理者は障害が起きる可能性を認識することが可能となり、その予測される障害がシステムの動作に影響を与えるようなものであれば、該当する機器の交換などを行う。
【0021】
一方、ステップS2で検出された変化が、障害事前情報データベース21に登録された障害事前情報の中には存在しない現象であるとステップS3で判定された場合は、その現象(システムの変化)が障害発生の契機となる現象ではないと判断して、障害事前情報データベース21から障害予測通知部22へは何の通知も行われない(ステップS5)。これにより、障害予測通知部22は何の通知も行わない。
【0022】
このように、本実施例によれば、障害の契機となる現象を示す障害事前情報を予め障害事前情報データベース21に登録しておき、システム変化を伴う現象が生じる毎に、その現象が障害事前情報データベース21に登録されているかどうかを判定するようにしたため、発生した現象が障害事前情報データベース21に登録されていると判定したときは、その現象を契機として発生する障害を、その障害が発生する前に予測して管理者に通知することができる。また、本実施例によれば、相関関係の算出を行って将来発生する可能性のあるすべての障害の予測を行う必要がないため、機器の構成を簡略化することができる。
【0023】
なお、本発明は上記の実施例に限定されるものではなく、例えば、管理者端末1が障害事前情報データベース21に障害事前情報を登録する場合だけでなく、障害が発生した際、自動的にログから障害発生契機を障害事前情報データベース21に登録する方法も考えられる。
【図面の簡単な説明】
【0024】
【図1】本発明の機器障害予測装置の一実施例のブロック図である。
【図2】本発明の機器障害予測装置が適用されるシステムの各例のブロック図である。
【図3】本発明の機器障害予測方法の一実施例のフローチャートである。
【図4】特許文献1に記載の性能監視システムの一例の構成図である。
【符号の説明】
【0025】
1 管理者端末
2 機器
21 障害事前情報データベース
22 障害予測通知部

【特許請求の範囲】
【請求項1】
機器により構成されるシステムの変化を検出する第1のステップと、
前記検出した変化が、障害の発生契機としてその直前に発生する障害事前現象と同じ現象によるものであるかどうか判定する第2のステップと、
前記第2のステップにより前記障害事前現象と同じ現象によるものであるとの判定結果が得られたときは、その旨を通知する第3のステップと
を含むことを特徴とする機器障害予測方法。
【請求項2】
一台又は複数台の機器からなるシステムを管理する管理者により前記機器の障害の発生を予測する方法であって、
前記機器の障害発生時に、その障害の発生契機としてその障害発生直前に発生する現象を障害事前情報としてデータベースに登録する第1のステップと、
前記システムの変化を検出する第2のステップと、
前記検出した変化が、前記データベースに登録されている前記障害事前情報と同じ現象によるものであるかどうか判定する第3のステップと、
前記第3のステップにより前記障害事前情報と同じ現象によるものであるとの判定結果が得られたときのみ、その旨を前記管理者に通知する第4のステップと
を含むことを特徴とする機器障害予測方法。
【請求項3】
前記機器に障害が発生したときは、その障害の発生契機としてその障害発生直前に発生する現象を、随時前記データベースに登録する第5のステップを更に含むことを特徴とする請求項2記載の機器障害予測方法。
【請求項4】
前記機器に障害が発生したときは、その障害が起こった際に、自動的にログから障害発生契機の現象を前記障害事前情報として前記データベースに登録するステップを更に含むことを特徴とする請求項2記載の機器障害予測方法。
【請求項5】
前記データベースには、前記障害事前情報が複数登録されており、前記第4のステップは、光、音又は画像により、複数の前記障害事前情報のうちどの障害事前情報と同じ現象であるかを示す前記判定結果を区別して通知することを特徴とする請求項2乃至4のうちいずれか一項記載の機器障害予測方法。
【請求項6】
機器により構成されるシステムの変化を検出する検出手段と、
前記検出した変化が、障害の発生契機としてその直前に発生する障害事前現象と同じ現象によるものであるかどうか判定する判定手段と、
前記判定手段により前記障害事前現象と同じ現象によるものであるとの判定結果が得られたときは、その旨を通知する通知手段と
を有することを特徴とする機器障害予測装置。
【請求項7】
一台又は複数台の機器からなるシステムを管理する管理者により前記機器の障害の発生を予測する装置であって、
前記機器の障害の発生契機としてその障害発生直前に発生する現象が、障害事前情報として登録されているデータベースと、
前記障害事前情報を予め前記データベースに登録する登録手段と、
前記システムの変化を検出する検出手段と、
前記検出した変化が、前記データベースに登録されている前記障害事前情報と同じ現象によるものであるかどうか判定する判定手段と、
前記判定手段により前記障害事前情報と同じ現象によるものであるとの判定結果が得られたときのみ、その旨を前記管理者に通知する通知手段と
を有することを特徴とする機器障害予測装置。
【請求項8】
前記機器に障害が発生したときは、その障害の発生契機としてその障害発生直前に発生する現象を、随時前記データベースに登録する手段を更に有することを特徴とする請求項7記載の機器障害予測装置。
【請求項9】
前記機器に障害が発生したときは、その障害が起こった際に、自動的にログから障害発生契機の現象を前記障害事前情報として前記データベースに登録する手段を更に有することを特徴とする請求項7記載の機器障害予測装置。
【請求項10】
前記データベースには、前記障害事前情報が複数登録されており、前記通知手段は、光、音又は画像により、複数の前記障害事前情報のうちどの障害事前情報と同じ現象であるかを示す前記判定結果を区別して通知することを特徴とする請求項7乃至9のうちいずれか一項記載の機器障害予測装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2008−293441(P2008−293441A)
【公開日】平成20年12月4日(2008.12.4)
【国際特許分類】
【出願番号】特願2007−140876(P2007−140876)
【出願日】平成19年5月28日(2007.5.28)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】