説明

障害予測管理方法及び該障害予測管理方法を適用したコンピュータシステム

【課題】バックアップコンピュータシステムの障害予測管理方法の提供。
【解決手段】磁気ディスク22に記憶したデータを磁気テープ装置23にバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置13の障害予測管理方法であって、動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第1工程と、該第1工程により累計したエラー発生部位毎のエラーコードの累計数が、エラー発生部位毎に設定した第1の閾値を超えるか否かを判定し、該第1の閾値を超えたと判定したとき、前記累計したエラー発生部位にエラーが発生する可能性があることを通知する第2工程とを実行することによって、障害発生が発生する可能性のある部位を自動的に予測するもの。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータデータを磁気テープにバックアップを行うバックアップ装置における障害予測管理方法及び該障害予測管理方法を適用したコンピュータシステムに関し、特にバックアップ障害が発生する部位を自動的に予め予測することができる障害予測管理方法及び該障害予測管理方法を適用したコンピュータシステムに関する。
【背景技術】
【0002】
近年のコンピュータシステムは、大量のデータが災害発生時等に消失するのを防止するため、コンピュータシステムから遠隔地のバックアップ装置にデータバックアッブを行うバックアップシステムが構築されており、この記録媒体としてはビット単価が安価であり且つ可搬性のある磁気テープカートリッジ(以下、磁気テープと呼ぶ)が採用されている。
【0003】
前記磁気テープを使用したバックアップ装置は、記録媒体に磁気テープを用いているために磁気ディスク装置と比較して障害発生率が高く、障害発生を予め予測する機能が求められており、この障害発生を予測する技術が記載された文献としては下記特許文献1が挙げられ、この特許文献1には、特定の磁気テープに対するバックアップ回数が閾値を超えたときや、特定の磁気テープに対するエラーレートの発生回数が閾値を超えたときに、磁気テープが原因による障害かドライブが原因による障害かを人手により切り分け、障害が発生する可能性がある磁気テープやドライブを保守員に通知する技術が記載されている。
【特許文献1】特開2007−114908号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
前記特許文献1に記載された技術は、磁気テープの使用回数を基に障害発生を予測することができるものの、実際の磁気テープバックアップ装置においては磁気テープ劣化等による障害に限らず、回路機構の部位が原因となる障害も多々あり、これら回路機構が原因となる障害発生を予測することが困難であると共に、人手によって磁気テープによる障害かドライブ系の障害かを切り分けなければならず、自動的に障害が発生する可能性のある部位(回路機構)を効率的に予測することが困難であると言う不具合があった。
【0005】
本発明の目的は、磁気テープを用いたバックアップ装置の障害発生が発生する可能性のある部位を自動的に予測することができる障害予測管理方法及び該障害予測管理方法を適用したコンピュータシステムを提供することである。
【課題を解決するための手段】
【0006】
前記目的を達成するために本発明は、磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置と、該バックアップ装置と接続された製造元サーバと、該製造元サーバに接続される管理コンピュータとを備え、前記管理コンピュータが、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを有するコンピュータシステムの障害予測管理方法であって、
前記管理コンピュータが、
前記累計手段により動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第1工程と、
前記比較手段により前記第1工程により累計したエラー発生部位毎のエラーコードの累計数が記憶手段に記憶した第1の閾値を超えるか否かを比較する第2工程と、
該第2工程によってエラーコードの累計数が第1の閾値を超えると判定したとき、前記通知手段により前記第1の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する第3工程とを実行することを第1の特徴とする。
【0007】
また本発明は、前記第1の特徴の障害予測管理方法において、前記動作ログ情報が、エラーコードが発生した年月日情報を含み、前記記憶手段が、同一エラー発生部位のエラーコードが連続した年月日で発生する回数を許容する連続発生日数を第2の閾値として記憶し、前記比較手段が、第2工程において、第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードの連続発生日数が第2の閾値を超えたとき、前記通知手段が前記第3工程において、前記第2の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知することを第2の特徴とする。
【0008】
また本発明は、前記第1の特徴の障害予測管理方法において、前記動作ログ情報が、エラーコードが発生した年月日情報を含み、前記記憶手段が、同一エラー発生部位のエラーコードが同一年月日内で発生することを許容するエラーコード発生回数を第3の閾値として記憶し、前記比較手段が、第2工程において、前記第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードのエラーコード発生回数が第3の閾値を超えたとき、前記通知手段が前記第3工程において、前記第3の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知することを第3の特徴とする。
【0009】
また本発明は、前記第1〜第3何れかの特徴の障害予測管理方法において、前記バックアップ装置が、前記動作ログ情報を前記製造元サーバに送信する送信手段を備えてバックアップ装置の製造元の製造元サーバに接続され、前記製造元サーバのコンピュータが、前記第1工程から第3工程を実行することを第4の特徴とする。
【0010】
更に本発明は、磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置と、該バックアップ装置と接続された製造元サーバと、該製造元サーバに接続される管理コンピュータとを備え、前記業務サーバが、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを有するコンピュータシステムの障害予測管理方法であって、
前記業務サーバが、
前記累計手段が、動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第1工程と、
前記比較手段が、前記第1工程により累計したエラー発生部位毎のエラーコードの累計数が記憶手段に記憶した第1の閾値を超えるか否かを比較する第2工程と、
該第2工程によってエラーコードの累計数が第1の閾値を超えると判定したとき、前記通知手段が、前記第1の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する第3工程とを実行することを第5の特徴とする。
【0011】
更に本発明は、磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置と、該バックアップ装置と接続された製造元サーバと、該製造元サーバに接続される管理コンピュータとを備えるコンピュータシステムであって、
前記バックアップ装置が、前記データのバックアップ中に取得した動作ログ情報を前記製造元サーバに転送する第1転送手段を有し、
前記製造元サーバが、前記転送により受信した動作ログ情報を管理コンピュータに転送する第2転送手段を有し、
該管理コンピュータが、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と、該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを有し、
前記バックアップ装置が、第1転送手段により動作ログ情報を前記製造元サーバに転送する第1工程と、
前記製造元サーバが、第2転送手段により動作ログ情報を管理コンピュータに転送する第2工程と、
該管理コンピュータが、
前記累計手段により、動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第3工程と、
前記比較手段により、前記第3工程により累計したエラー発生部位毎のエラーコードの累計数が、第1の閾値を超えるか否かを判定する第4工程と、
前記通知手段が、累計したエラーコード数が第1の閾値を超えたと判定したとき、前記第1の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する第5工程とを実行することを第6の特徴とする。
【0012】
また本発明は、前記第6の特徴のコンピュータシステムにおいて、前記管理コンピュータの記憶手段が、同一エラー発生部位のエラーコードが連続した年月日で発生する回数を許容する連続発生日数を第2の閾値として記憶し、前記管理コンピュータの比較手段が、第2工程において、第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードの連続発生日数が第2の閾値を超えたとき、前記第3工程において、前記通知手段が、前記第2の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知することを第7の特徴とする。
【0013】
また本発明は、前記第6の特徴のコンピュータシステムにおいて、前記動作ログ情報が、エラーコードが発生した年月日情報を含み、前記管理コンピュータの記憶手段が、同一エラー発生部位のエラーコードが同一年月日内で発生することを許容するエラーコード発生回数を第3の閾値として記憶し、前記管理コンピュータの比較手段が、第2工程において、前記第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードのエラーコード発生回数が第3の閾値を超えたとき、前記第3工程において、前記通知手段が、前記第3の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知することを第8の特徴とする。
【0014】
また本発明は、前記第6の特徴のコンピュータシステムにおいて、前記バックアップ装置が、前記動作ログ情報を前記製造元サーバに送信する送信手段を備えてバックアップ装置の製造元の製造元サーバに接続され、前記製造元サーバの管理コンピュータが、前記累計手段と記憶手段と比較手段通知手段とを備え、前記第1工程から第3工程を実行することを第9の特徴とする。
【0015】
また本発明は、前記第6の特徴のコンピュータシステムにおいて、前記バックアップ装置が、前記累計手段と記憶手段と比較手段通知手段とを備えてバックアップ装置の製造元の製造元サーバに接続され、前記第1工程と第2工程とを実行し、前記累計したエラー発生部位にエラーが発生する可能性があることを製造元サーバに通知することを第10の特徴とする。
【発明の効果】
【0016】
本発明による障害予測管理方法及び該障害予測管理方法を適用したコンピュータシステムは、磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置の障害予測管理方法において、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第1工程と、該第1工程により累計したエラー発生部位毎のエラーコードの累計数が、エラー発生部位毎に設定した第1の閾値を超えるか否かを判定し、該第1の閾値を超えたと判定したとき、前記累計したエラー発生部位にエラーが発生する可能性があることを通知する第2工程とを実行することによって、磁気テープを用いたバックアップ装置の障害が発生する可能性のある部位を自動的に予測することができる。
【発明を実施するための最良の形態】
【0017】
以下、本発明による障害予測管理方法及び該障害予測管理方法を適用したコンピュータシステムを図面を参照して詳細に説明する。図1は、本発明の一実施形態による障害予測管理方法を適用したコンピュータシステムを示す図、図2は、本実施形態によるデータバックアップ手順を説明するための図、図3は本実施形態による障害の予測を行う手順を示す図、図4は本実施形態による障害予測の一例を説明するための図、図5は、本実施形態に使用されるエラーコード群を示す図である。
【0018】
[構成]
本実施形態による障害予測管理方法を適用したコンピュータシステムは、図1に示す如く、各種業務を行う顧客に設置される顧客先サーバ12と、該顧客先サーバ12の記憶装置に記憶したデータのバックアップを行うバックアップ装置13と、前記顧客先サーバ12と公衆通信回線11を介して接続されるバックアップ装置13のメーカ側の製造元サーバ10と、該製造元サーバ10と接続される管理用の管理コンピュータ14とから構成され、通常の業務形態においては、バックアップ装置13が顧客先サーバ12に記憶されたデータのバックアップを行う様に動作する。
【0019】
前記バックアップ装置13は、本例においては、顧客先サーバ12のデータの一次保管先である正磁気ディスク装置21と、該正磁気ディスク装置21に保管したデータの二次保管先である副磁気ディスク装置22と、該副磁気ディスク装置22に記憶したデータのバックアップを行う磁気テープ装置23と、前記正副磁気ディスク装置間及び副磁気ディスク装置と磁気テープ装置間のデータバックアップを制御し、該バックアップ時の後述する動作ログを取得する制御部20とから構成される。このバックアップ装置13が、正副の磁気ディスク装置21及び22と磁気テープ装置23とから構成される理由は、顧客先サーバ12のデータを正磁気ディスク装置21にデータ転送を行い得る時刻間帯(夜間等の非営業時間)に制限があることや、磁気テープ装置23にデータ転送に要する所要時間が比較的長時間を要することに基づき、例えば顧客の非営業時間帯に顧客先サーバ12から正磁気ディスク装置21に高速にデータ転送を行い、前記顧客サーバからのデータ保管と時間的に非同期に磁気テープ装置23に副磁気ディスク装置22からのデータバックアップを行うためである。
【0020】
前記バックアップ装置13の制御部20は、データバックアップ動作過程において各種動作ログ情報を取得して保管する機能を有する。この動作ログ情報としては、データバックアップに要する多種のものがあり、エラーに関する動作ログ情報は、エラー発生部位とエラー内容毎に応じたエラーコードとエラー発生の年月日情報が含まれる。
【0021】
具体的に説明すると、エラーコードは、図5に示す如く、「上位装置インタフェース部」に関するエラーコードとして「0500h〜06FFh」、「データバッファ管理部」に関するエラーコードとして「0900h〜09FFh」、「フロントパネルインタフェース部」に関するエラーコードとして「1200h〜12FFh」・・・「Read/write 制御部」に関するエラーコードとして「4700h〜47FFh」、「論理フォーマット部」に関するエラーコードとして「4800h〜4FFFh」、「不揮発性データ管理部」に関するエラーコードとして「8400h〜84FFh」・・・「メカニカルインタフェース機構部」に関するエラーコードとして「D000h〜D8FFh」の如く、16進法で「4700h〜47FFh」で表される256通りにエラー内容に対応して付与され、且つエラー発生部位毎に表左端に示すエラー区分番号(1〜24)が付与されている。
【0022】
[動作]
さて、前述の様に構成されたコンピュータシステムにおけるデータバックアップ手順は、図2に示す如く、制御部20が、バックアップ装置13の正磁気ディスク装置21に保管した顧客データを副磁気ディスク装置22にバックアップする手順a(ステップS01)と、該副磁気ディスク装置22にバックアップした顧客データを磁気テープ装置23にバックアップする手順b(ステップS02)と、前記手順a及びbを実行した際の動作ログ情報を顧客先サーバ12に転送する手順c(ステップS03)と、顧客先サーバ12が、前記転送された動作ログ情報を公衆通信回線11を介して製造元サーバ10に転送する手順d(ステップS03)と、該製造元サーバ10が、前記転送された動作ログ情報を管理コンピュータ14に送出する手順d(ステップS04)と、管理コンピュータ14が、受信した動作ログ情報の編集処理及び該編集処理結果をディスプレイに表示する手順e(ステップS05)とを実行する。
【0023】
この管理コンピュータ14による手順eの詳細は、図3に示す如く、前述した動作ログ情報に含まれるエラーコードと該エラーの発生日時情報を取得するステップS10と、該ステップS10により取得したエラーコードを含むエラー区分番号を判定するステップS11と、該ステップS11により判定したエラー区分番号のカウント値を「+1」カウントアップするステップS12と、該ステップS12によりカウントアップされたエラー区分番号のカウント値が、第1の閾値(例えば、「Read/Write制御エラー」のエラー区分番号のカウント値が10回)を超えたか否かを判定し、超えていないと判定したときに前記ステップS10に戻るステップS13と、該ステップS13において第1の閾値を超えていると判定したとき、エラー区分番号のカウント値が、連続した所定の日数連続して発生したか否かを連続日閾値(例えば「10日」連続)と比較して判定するステップS14と、該ステップS14において連続日閾値を超えると判定したとき、図2のステップS05のビジュアル出力を行うステップS15と、前記ステップS14において連続日閾値を超えないと判定したとき、同一日において第2の閾値(例えば、「Read/Write制御エラー」のエラー区分番号のカウント値が10回)を超えたか否かを判定し、超えると判定したときに前記ステップS15に移行し、超えないと判定したときに前記ステップS10に戻るステップS17とを実行する。
【0024】
前記ステップS05における編集処理は、図4に示す如く、「Read/Write制御エラー」を例にとった場合、該「Read/Write制御エラー」に含まれるエラーコードが連続して10日間発生したとき(パターン1)と、該「Read/Write制御エラー」に含まれるエラーコードが同一日に10回以上発生したとき(パターン2)、ログ情報のビジュアル出力を図4の例に示した如く行うものであって、前記第1及び第2の閾値は、任意に設定される。
【0025】
さて、本実施形態によるデータバックアップ手順は、図2に戻り、ステップS05に続いて、バックアップ装置製造元の管理者15が前記ログ情報のビジュアル出力を基に障害発生の予想を行い、顧客に報告する手順f(ステップS06)と、必要に応じて予想される障害の予防処置を保守員16に指示して行うステップS07とを実行し、同一の部位に発生したエラー回数の累計及び同一日の累計が閾値を超えたときに障害が発生する可能性があると判定するため、障害が発生する部位を管理者に自動的に通知する様に動作する。
【0026】
尚、前記実施形態においてはエラー発生部位として「Read/Write制御部」を例にとって説明したが、他の部位においても同様に障害の発生を予測する。
また、前記実施形態においては、管理コンピュータ14が動作ログ情報に含まれるエラーコードを基に障害の予測を行う例を説明したが、本発明はこれに限られるものではなく、バックアップ装置側で前述した障害予測を行うための動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段/累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段/累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段/該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを設け、これら手段が障害予測を行い、この予測した情報を製造元や顧客に報告する様に構成しても良い。
【図面の簡単な説明】
【0027】
【図1】本発明の一実施形態による障害予測管理方法を適用したコンピュータシステムを示す図。
【図2】本実施形態によるデータバックアップ手順を説明するための図。
【図3】本実施形態による障害の予測を行う手順を示す図。
【図4】本実施形態による障害予測の一例を説明するための図。
【図5】本実施形態に使用されるエラーコード群を示す図。
【符号の説明】
【0028】
10:製造元サーバ、11:公衆通信回線、12:顧客先サーバ、13:バックアップ装置、14:管理コンピュータ、21:正磁気ディスク装置、22:副磁気ディスク装置、23:磁気テープ装置。

【特許請求の範囲】
【請求項1】
磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置と、該バックアップ装置と接続された製造元サーバと、該製造元サーバに接続される管理コンピュータとを備え、前記管理コンピュータが、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを有するコンピュータシステムの障害予測管理方法であって、
前記管理コンピュータが、
前記累計手段により動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第1工程と、
前記比較手段により前記第1工程により累計したエラー発生部位毎のエラーコードの累計数が記憶手段に記憶した第1の閾値を超えるか否かを比較する第2工程と、
該第2工程によってエラーコードの累計数が第1の閾値を超えると判定したとき、前記通知手段により前記第1の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する第3工程とを実行する障害予測管理方法。
【請求項2】
前記動作ログ情報が、エラーコードが発生した年月日情報を含み、
前記記憶手段が、同一エラー発生部位のエラーコードが連続した年月日で発生する回数を許容する連続発生日数を第2の閾値として記憶し、
前記比較手段が、第2工程において、第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードの連続発生日数が第2の閾値を超えたとき、前記通知手段が前記第3工程において、前記第2の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する請求項1記載の障害予測管理方法。
【請求項3】
前記動作ログ情報が、エラーコードが発生した年月日情報を含み、
前記記憶手段が、同一エラー発生部位のエラーコードが同一年月日内で発生することを許容するエラーコード発生回数を第3の閾値として記憶し、
前記比較手段が、第2工程において、前記第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードのエラーコード発生回数が第3の閾値を超えたとき、前記通知手段が前記第3工程において、前記第3の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する請求項1記載の障害予測管理方法。
【請求項4】
前記バックアップ装置が、前記動作ログ情報を前記製造元サーバに送信する送信手段を備えてバックアップ装置の製造元の製造元サーバに接続され、前記製造元サーバのコンピュータが、前記第1工程から第3工程を実行する請求項1から3何れかに記載の障害予測管理方法。
【請求項5】
磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置と、該バックアップ装置と接続された製造元サーバと、該製造元サーバに接続される管理コンピュータとを備え、前記業務サーバが、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを有するコンピュータシステムの障害予測管理方法であって、
前記業務サーバが、
前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、
前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、
前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と、
該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを備え、
前記累計手段が、動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第1工程と、
前記比較手段が、前記第1工程により累計したエラー発生部位毎のエラーコードの累計数が記憶手段に記憶した第1の閾値を超えるか否かを比較する第2工程と、
該第2工程によってエラーコードの累計数が第1の閾値を超えると判定したとき、前記通知手段が、前記第1の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する第3工程とを実行する障害予測管理方法。
【請求項6】
磁気ディスクに記憶したデータを磁気テープにバックアップすると共に該バックアップ中のエラー発生部位及びエラー内容に対応したエラーコードを含む動作ログ情報を取得するバックアップ装置と、該バックアップ装置と接続された製造元サーバと、該製造元サーバに接続される管理コンピュータとを備えるコンピュータシステムであって、
前記バックアップ装置が、前記データのバックアップ中に取得した動作ログ情報を前記製造元サーバに転送する第1転送手段を有し、
前記製造元サーバが、前記転送により受信した動作ログ情報を管理コンピュータに転送する第2転送手段を有し、
該管理コンピュータが、前記動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する累計手段と、前記累計手段により累計したエラーコード数と比較するためのエラー発生部位毎の第1の閾値を記憶する記憶手段と、前記累計手段により累計したエラーコード数と記憶手段に記憶した第1の閾値とを比較する比較手段と、該比較手段による比較結果に応じて障害予測情報を通知する通知手段とを有し、
前記バックアップ装置が、第1転送手段により動作ログ情報を前記製造元サーバに転送する第1工程と、
前記製造元サーバが、第2転送手段により動作ログ情報を管理コンピュータに転送する第2工程と、
該管理コンピュータが、
前記累計手段により、動作ログ情報に含まれるエラーコードをエラー発生部位毎に累計する第3工程と、
前記比較手段により、前記第3工程により累計したエラー発生部位毎のエラーコードの累計数が、第1の閾値を超えるか否かを判定する第4工程と、
前記通知手段が、累計したエラーコード数が第1の閾値を超えたと判定したとき、前記第1閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する第5工程とを実行するコンピュータシステム。
【請求項7】
前記管理コンピュータの記憶手段が、同一エラー発生部位のエラーコードが連続した年月日で発生する回数を許容する連続発生日数を第2の閾値として記憶し、
前記管理コンピュータの比較手段が、第2工程において、第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードの連続発生日数が第2の閾値を超えたとき、前記第3工程において、前記通知手段が、前記第2の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する請求項6記載のコンピュータシステム。
【請求項8】
前記動作ログ情報が、エラーコードが発生した年月日情報を含み、
前記管理コンピュータの記憶手段が、同一エラー発生部位のエラーコードが同一年月日内で発生することを許容するエラーコード発生回数を第3の閾値として記憶し、
前記管理コンピュータの比較手段が、第2工程において、前記第1工程により累計したエラー発生部位毎のエラーコード累計数が第1の閾値を超え、且つ前記第1の閾値を超えたエラーコードのエラーコード発生回数が第3の閾値を超えたとき、前記第3工程において、前記通知手段が、前記第3の閾値を超えたエラー発生部位にエラーが発生する可能性があることを通知する請求項6記載のコンピュータシステム。
【請求項9】
前記バックアップ装置が、前記動作ログ情報を前記製造元サーバに送信する送信手段を備えてバックアップ装置の製造元の製造元サーバに接続され、前記製造元サーバの管理コンピュータが、前記累計手段と記憶手段と比較手段通知手段とを備え、前記第1工程から第3工程を実行する請求項6記載のコンピュータシステム。
【請求項10】
前記バックアップ装置が、前記累計手段と記憶手段と比較手段通知手段とを備えてバックアップ装置の製造元の製造元サーバに接続され、前記第1工程と第2工程とを実行し、前記累計したエラー発生部位にエラーが発生する可能性があることを製造元サーバに通知する請求項6記載のコンピュータシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−102548(P2010−102548A)
【公開日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願番号】特願2008−274065(P2008−274065)
【出願日】平成20年10月24日(2008.10.24)
【出願人】(000233033)日立コンピュータ機器株式会社 (253)
【Fターム(参考)】