説明

計算機の診断装置及び診断方法

【課題】 この発明は、計算機が通常動作の状態でも、エラー検出機能の検出結果からエラー検出機能を診断する、計算機の診断装置を提供する。
【解決手段】 この発明の計算機の診断装置は、診断用データを格納した診断用メモリ31と、この診断用メモリ31からCPU(中央演算処理装置)10が読み出したデータを基準データと比較し、その結果をメモリアクセスエラー情報格納部21に記憶するメモリアクセスエラー検出部20と、このメモリアクセスエラー情報格納部21を確認した後に消すメモリアクセスエラー検出部診断処理11と、を備えるものである。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、計算機において、メモリアクセスエラーを検出するエラー検出機能の診断装置及び診断方法に関する。
【背景技術】
【0002】
計算機において、メモリアクセスエラーを検出するエラー検出機能は、計算機の健全性をチェックする機能の1つであり、エラーを検出すると、計算機の継続運転が出来ないとして、計算機の動作状態を運転から停止に変更する条件を与える役割となる。
従来、計算機のエラー検出機能の診断方法は、計算機に外部ツールを接続して、エラー検出機能が動作する疑似的なエラーを発生させ、エラー検出機能の検出結果に対する計算機の動作結果(運転→停止)からエラー検出機能を診断していた。
【0003】
外部ツールを接続する診断方法には、計算機のバススロットにバス監視装置を接続して、オペレータの指示内容に基づいて、パリティエラー等の疑似的なエラーを発生させて、実稼働状態において、発生し難いバス異常状態を作り出し、不具合に対する限界試験を行う診断方法がある(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平10−307763号公報(第7―8頁、第43−46段落)
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、計算機のエラー検出機能の診断方法は、疑似的なエラーを発生させ、エラー検出機能の検出結果に対する計算機の動作結果からエラー検出機能を診断していたため、計算機の動作状態を停止させる必要があり、通常動作の状態でない定期点検のタイミングでしか、診断が出来なかった。
【0006】
この発明は、計算機が通常動作の状態でも、エラー検出機能の検出結果からエラー検出機能を診断する、計算機の診断装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
この発明の計算機の診断装置は、診断用データを格納した記憶装置と、この記憶装置から中央演算処理装置が読み出したデータを基準データと比較し、その結果を記憶する検出部と、この検出部の記憶を確認した後に消す診断部と、を備えるものである。
【発明の効果】
【0008】
この発明の計算機の診断装置は、診断用データを格納した記憶装置と、この記憶装置から中央演算処理装置が読み出したデータを基準データと比較し、その結果を記憶する検出部と、この検出部の記憶を確認した後に消す診断部と、を備えるもので、計算機が通常動作の状態でも、エラー検出機能の検出結果からエラー検出機能を診断する、計算機の診断装置を提供できる。
【図面の簡単な説明】
【0009】
【図1】この発明の実施の形態1による計算機の診断装置の構成図。
【図2】この発明の実施の形態1によるパリティエラー発生情報の説明図。
【図3】この発明の実施の形態1によるメモリアクセスエラー検出部診断処理のフローチャート。
【図4】この発明の実施の形態2による計算機の診断装置の構成図。
【図5】この発明の実施の形態2によるメモリアクセスエラー発生情報の説明図。
【図6】この発明の実施の形態2によるメモリアクセスエラー検出部診断処理のフローチャート。
【図7】この発明の実施の形態3による計算機の診断装置の構成図。
【図8】この発明の実施の形態3によるメモリアクセスエラー発生要求フラグの説明図。
【発明を実施するための形態】
【0010】
実施の形態1.
図1は、実施の形態1による計算機の診断装置の構成図である。図2は、実施の形態1によるパリティエラー発生情報の説明図である。図3は、実施の形態1によるメモリアクセスエラー検出部診断処理のフローチャートである。
図1において、1は計算機、10は計算機1のCPU(中央演算処理装置)、11はCPU10で動作するメモリアクセスエラー検出部診断処理、20は計算機1のメモリアクセスエラーを検出するメモリアクセスエラー検出部、21はメモリアクセスエラー検出部20が検出したエラー情報を格納するメモリアクセスエラー情報格納部、30は計算機1のメモリ、31はパリティエラーを発生させる診断用データを格納する診断用メモリである。
図2において、211はメモリアクセスエラー情報格納部21に設定されるパリティエラー発生情報である。
【0011】
計算機が通常動作の状態で、メモリアクセスエラーが検出された場合の動作について、図1をもとに説明する。
予め、メモリアクセスエラー情報格納部21を、0にリセットしておく。
CPU10が、メモリ30をアクセスした時に、メモリアクセスエラーが発生すると、メモリアクセスエラー検出部20がエラーを検出して、図2のパリティエラー発生情報を「パリティエラー発生あり」としてメモリアクセスエラー情報格納部21に1を設定する。
次に、計算機1の継続運転を判断する機能(図示しない)が、メモリアクセスエラー情報格納部21を確認して、1ならば計算機1の動作状態を運転から停止に変更する。
【0012】
実施の形態1の計算機の診断装置の動作について、図1をもとに説明する。
予め、診断用メモリ31にパリティエラーを発生させる診断用データを設定しておくと共に、メモリアクセスエラー情報格納部21を、0にリセットしておく。
メモリアクセスエラー検出部診断処理11は、定期のタイミングに、診断用メモリ31にアクセスし、メモリアクセスエラー情報格納部21を確認して、メモリアクセスエラー検出部20を診断する。
【0013】
次に、メモリアクセスエラー検出部診断処理の動作について、図3をもとに説明する。
ステップS101では、定期のタイミングに、診断用メモリにアクセスする。
このステップを実行すると、メモリアクセスエラー検出部が、「正常」であればパリティエラーを検出して、図2のパリティエラー発生情報を「パリティエラー発生あり」としてメモリアクセスエラー情報格納部に1を設定するが、「異常」であれば何もしない。
【0014】
ステップS102では、メモリアクセスエラー情報格納部を確認する。
「パリティエラー発生あり」ならば、ステップS103を実行する。
「パリティエラー発生なし」ならば、ステップS105を実行する。
【0015】
ステップS103では、診断結果を「正常」と判定する。
【0016】
ステップS104では、メモリアクセスエラー情報格納部を、0にリセットする。
【0017】
ステップS105では、診断結果を「異常」と判定する。
【0018】
ステップS106では、異常通知を行う。
【0019】
前記のように実施の形態1によれば、定期のタイミングで、メモリアクセスエラー検出部診断処理が診断用メモリをアクセスし、メモリアクセスエラー情報格納部のパリティエラー発生情報からメモリアクセスエラー検出部を診断した後、直ぐにメモリアクセスエラー情報格納部のパリティエラー発生情報をリセットすることで、計算機の継続運転を判断する機能(図示しない)がメモリアクセスエラー情報格納部を確認する前にリセットされているので計算機の動作状態を停止させることがなく、計算機が通常動作の状態でも、定期のタイミングに、エラー検出機能の検出結果からエラー検出機能を診断する、計算機の診断装置を提供できる。
また、前記のように実施の形態1によれば、計算機が通常動作の状態で定期のタイミングに、エラー検出機能の健全性を確認するため、常に計算機の信頼性を保つことができる。
【0020】
実施の形態2.
図4は、実施の形態2による計算機の診断装置の構成図である。図5は、実施の形態2によるメモリアクセスエラー発生情報の説明図である。図6は、実施の形態2によるメモリアクセスエラー検出部診断処理のフローチャートである。
実施の形態1では、単発のエラーに対するメモリアクセスエラー検出部を診断するものである。
実施の形態2では、複数のエラーに対するメモリアクセスエラー検出部を診断するものである。
図4において、実施の形態1と同様の説明は省略して、22はメモリアクセスエラー検出部20が検出した複数のエラー情報を格納するメモリアクセスエラー情報格納部(複数)、32は複数のエラーを発生させる診断用データを格納する診断用メモリ(複数)である。
図5において、221はメモリアクセスエラー情報格納部(複数)22に設定される複数のメモリアクセスエラー発生情報である。
【0021】
実施の形態2の計算機の診断装置の動作について、図4をもとに説明する。
予め、診断用メモリ(複数)32に複数のエラーを発生させる診断用データを設定しておくと共に、メモリアクセスエラー情報格納部(複数)22において、全ての Bitを、0にリセットしておく。
なお、複数のエラーとは、例えば、パリティエラーやタイムアウトエラーなどのメモリアクセスエラーであるが、本発明の実施形態に限定されず、この発明の範囲内で種々のパターンがあることは言うまでもない。
メモリアクセスエラー検出部診断処理11は、定期のタイミングに、診断用メモリ(複数)32にアクセスし、メモリアクセスエラー情報格納部(複数)22を確認して、メモリアクセスエラー検出部20を診断する。
【0022】
次に、メモリアクセスエラー検出部診断処理の動作について、図6をもとに説明する。
ステップS111では、定期のタイミングに、診断用メモリ(複数)にアクセスする。
このステップを実行すると、メモリアクセスエラー検出部が、「正常」であれば複数のメモリアクセスエラーを検出して、図5のメモリアクセスエラー発生情報を「パリティエラー発生あり及びタイムアウトエラー発生あり」として、メモリアクセスエラー情報格納部(複数)の該当 Bitに1を設定するが、「異常」であれば何もしない。
【0023】
ステップS112では、メモリアクセスエラー情報格納部(複数)を確認する。
「パリティエラー発生あり及びタイムアウトエラー発生あり」ならば、ステップS113を実行する。
「パリティエラー発生なし」又は「タイムアウトエラー発生なし」ならば、ステップS115を実行する。
なお、本実施の形態では、パリティエラー及びタイムアウトエラーの同時発生から診断結果を判定しているが、予め、診断用メモリ(複数)に設定したエラーを発生させる診断用データのパターンから、診断結果を判定することは言うまでもない。
【0024】
ステップS113では、診断結果を「正常」と判定する。
【0025】
ステップS114では、メモリアクセスエラー情報格納部(複数)において、全ての Bitを、0にリセットする。
【0026】
ステップS115では、診断結果を「異常」と判定する。
【0027】
ステップS116では、異常通知を行う。
【0028】
前記のように実施の形態2によれば、定期のタイミングで、メモリアクセスエラー検出部診断処理が診断用メモリ(複数)をアクセスし、メモリアクセスエラー情報格納部(複数)の複数のエラー発生情報からメモリアクセスエラー検出部を診断した後、直ぐにメモリアクセスエラー情報格納部(複数)の複数のエラー発生情報をリセットすることで、計算機の継続運転を判断する機能(図示しない)がメモリアクセスエラー情報格納部(複数)を確認する前にリセットされているので計算機の動作状態を停止させることがなく、計算機が通常動作の状態でも、定期のタイミングに、エラー検出機能の検出結果から、複数のエラーに対するエラー検出機能を診断する、計算機の診断装置を提供できる。
【0029】
実施の形態3.
図7は、実施の形態3による計算機の診断装置の構成図である。図8は、実施の形態3によるメモリアクセスエラー発生要求フラグの説明図である。
実施の形態2では、予め、診断用メモリ(複数)に診断用データを格納しておき、定期のタイミングに、メモリアクセスエラー検出部を診断するものである。
実施の形態3では、保守ツールからの入力により、診断用メモリ(複数)に格納された診断用データを変更すると共に、任意のタイミングにメモリアクセスエラー検出部を診断するものである。
【0030】
図7において、実施の形態2と同様の説明は省略して、2は診断用メモリ(複数)32に格納された診断用データの変更要求及びメモリアクセスエラー検出部診断処理11の診断要求を入力する保守ツール、12は保守ツール2の要求を受け付け、診断用メモリ(複数)32に格納された診断用データを変更し、メモリアクセスエラー検出部診断処理11を実行するメモリアクセスエラー発生要求受付処理である。
図8において、311は保守ツール2からの入力で、複数のエラー発生要求を設定するメモリアクセスエラー発生要求フラグである。
なお、保守ツール2は、計算機1のメモリアクセスエラー発生要求受付処理12と接続するツールで、計算機1と接続する外部装置(図示しない)との間にある入出力とは、別の入出力となるため、計算機1が通常動作の状態でも、オペレータの指示が入力できる。
【0031】
実施の形態3の計算機の診断装置の動作について、図7をもとに説明する。
予め、メモリアクセスエラー情報格納部(複数)22において、全ての Bitを、0にリセットしておく。
保守ツール2からの入力により、図8のメモリアクセスエラー発生要求フラグ311に複数のエラー発生要求を設定すると、メモリアクセスエラー発生要求受付処理12が保守ツール2の入力を受け付け、診断用メモリ(複数)32に複数のエラーを発生させる診断用データを設定する。
次に、保守ツール2からの入力により、メモリアクセスエラー検出部診断処理11の診断要求を入力すると、メモリアクセスエラー発生要求受付処理12が保守ツール2の入力を受け付け、メモリアクセスエラー検出部診断処理11を実行する。
メモリアクセスエラー検出部診断処理11の動作については、実施の形態2と同様なので、説明を省略する。
【0032】
前記のように実施の形態3によれば、保守ツールからの入力により、診断用メモリ(複数)に格納された診断用データを変更すると共に、任意のタイミングにメモリアクセスエラー検出部診断処理を実行することで、計算機が通常動作の状態でも、任意のタイミングに、エラー検出機能の検出結果から、複数のエラーに対するエラー検出機能を診断する、計算機の診断装置を提供できる。
【符号の説明】
【0033】
1...計算機、
10...CPU、
11...メモリアクセスエラー検出部診断処理、
20...メモリアクセスエラー検出部、
21...メモリアクセスエラー情報格納部、
30...メモリ、
31...診断用メモリ

【特許請求の範囲】
【請求項1】
診断用データを格納した記憶装置と、
前記記憶装置から中央演算処理装置が読み出したデータを基準データと比較し、その結果を記憶する検出部と、
前記検出部の記憶を確認した後に消す診断部と、を備えた計算機の診断装置。
【請求項2】
前記記憶装置に格納された診断用データの変更要求及び前記検出部の診断要求を入力する保守ツールを更に備えることを特徴とする請求項1記載の計算機の診断装置。
【請求項3】
診断用データを記憶装置に設定する準備ステップと、
前記記憶装置から中央演算処理装置が読み出すデータを基準データと比較し、その結果を記憶する検出ステップと、
前記検出ステップの記憶を確認した後に消す診断ステップと、を備える計算機の診断方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate