説明

システム監視回路を備えた計算機

【課題】システムの障害発生時に、障害の発生原因の特定に寄与する情報を収集し、迅速な障害解析を行う。
【解決手段】CPU101、複数のI/Oバス108を有する入出力制御回路107、およびこれらに動作用の電力を供給する電源装置113、前記CPU、メモリ制御回路及び入出力制御回路を接続するバス102,106等を備えた計算機において、前記システム監視回路は、前記入出力制御回路が前記電源の開閉を制御する信号として出力する電源制御信号112および前記電源装置が該装置の状態を表す信号として出力する電源状態信号117を監視し、前記電源状態信号が電源制御信号に適合したレベルにないとき入出力制御回路あるいは電源装置に異常があると判断し、また、前記I/Oバス上の信号を監視し、I/Oバス上に所定期間に渡って信号が検出されないとき前記I/Oバスに異常があると判断する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、システム監視回路を備えた計算機に係り、特に障害の発生原因を特定する情報を迅速に収集することのできる計算機に関する。
【背景技術】
【0002】
計算機において、バスマスタによる転送が可能な共通バスの使用状態を、監視回路により監視し、一定時間以上、共通バスが使用されていない場合にハングアップが発生したとして障害検出を行い、さらにハングアップ発生要因となったデバイスの情報を表示し、記録した後、計算機の強制再起動を行う技術が知られている。
【0003】
この技術は、監視対象を共通バスに限定しているため、バスロックによるハングアップしか検出することができない。また、障害発生時にハングアップ発生要因となったデバイスの情報を記録する手段を備えているが、記録された情報を入手するためには直接計算機を操作しなければならない。
【特許文献1】特開2003−345673号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
計算機を実運用するに際しては、計算機の電源が遮断状態となる、電源がリセットされる、あるいは電源供給以外の機能が停止する等の障害が発生することがある。
【0005】
これらの障害が発生した場合、障害を再現し、さらに障害発生の原因を特定する等の障害解析には長時間を要する。
【0006】
高度の信頼性を要求される計算機においては、前記障害発生の原因を早期に解析して問題を解決することは非常に重要であり、このためには、障害発生時における装置情報を収集し、記録しておくことが重要である。
【0007】
本発明は、これらの問題点に鑑みてなされたもので、障害発生時に障害の発生原因の特定に寄与する情報を収集し迅速な障害解析のできるシステム監視回路を備えた計算機を提供するものである。
【課題を解決するための手段】
【0008】
本発明は上記課題を解決するため、次のような手段を採用した。
【0009】
CPU、該CPUと接続されCPUが使用するデータを記憶したメモリを制御するメモリ制御回路、複数のI/Oバスを有する入出力制御回路、およびこれらに動作用の電力を供給する電源装置、前記CPU、メモリ制御回路及び入出力制御回路を接続するバス、並びに前記複数のI/Oバスの状態を監視するシステム監視回路を備えた計算機において、
前記システム監視回路は、前記入出力制御回路が前記電源の開閉を制御する信号として出力する電源制御信号および前記電源装置が該装置の状態を表す信号として出力する電源状態信号を監視し、前記電源状態信号が電源制御信号に適合したレベルにないとき入出力制御回路あるいは電源装置に異常があると判断し、また、前記I/Oバス上の信号を監視し、I/Oバス上に所定期間に渡って信号が検出されないとき前記I/Oバスに異常があると判断する。
【発明の効果】
【0010】
本発明は、以上の構成を備えるため、システムの障害発生時に、障害の発生原因の特定に寄与する情報を収集し、迅速な障害解析を行うことができる。
【発明を実施するための最良の形態】
【0011】
以下、最良の実施形態を添付図面を参照しながら説明する。図1は、本実施形態にかかるシステム監視回路を備えた計算機を説明する図である。
【0012】
図1に示すように、システム監視回路111を備えた計算機100は、CPU101、CPUバス102,メモリ制御回路103、メモリデバイス105、入出力制御回路107、I/Oバス108、電源装置113を備える。なお、電源装置113はCPU101、メモリ制御回路103、メモリデバイス105、入出力制御回路107に動作用の電源を供給する主電源と該主電源とは独立して電源を供給するサブ電源を有している。
【0013】
CPU101およびメモリデバイス105は、それぞれCPUバス102、メモリバス104を介してメモリ制御回路103と接続されている。また、メモリ制御回路103と入出力制御回路107はシステムバス106を介して接続されている。また、複数のデバイス109およびBIOSは、I/Oバス108に接続されている。計算機100を起動する際には、CPU101はBIOS110に記録された手順にしたがって計算機100に接続されている各種デバイスおよび回路を初期化する。
【0014】
システム監視回路111にはI/Oバス108、入出力制御回路107および電源装置113が接続される。これにより、システム監視回路111はI/Oバス108の使用状況、入出力制御回路107が前記電源の開閉を制御する信号として出力する電源制御信号112および前記電源装置113が該装置の状態を表す信号として出力する電源状態信号117を監視することができる。
【0015】
また、システム監視回路111は、例えば記憶媒体が取り外し可能な記憶装置115と接続される。また、記憶装置115はシステム監視回路を介して外部の装置と接続可能な外部接続端子114と接続されている。
【0016】
システム監視回路111および取り外し可能な記憶装置115は、前記電源装置113とは独立したサブ電源装置と接続され、該サブ電源装置を介して、前記主電源の障害発生時においても停電することなく前記システム監視回路111および取り外し可能な記憶装置115に給電することができる。サブ電源装置は、例えば、直流5Vの電源であり、この電源を供給することにより、システム監視回路111および記憶装置115は電源装置全体が故障などにより電源供給不能とならない限り、計算機100の動作状態に依存することなく動作可能となる。
【0017】
計算機100が正常に動作している場合には、入出力制御回路107からシステム監視回路111に、例えば電源をオンにするための電源制御信号112が送信され、また、電源装置113からシステム監視回路111に、例えば電源装置113が正常(出力が所定レベル)であることを表す電源状態信号117が送信されている。
【0018】
システム監視回路111は、電源制御信号112および電源状態信号113を監視し、例えば、前記電源状態信号112が主電源をオンにするためための電源制御信号を出力しているにもかかわらず、電源状態信号117が電源出力が正常レベルであることを表す信号でないとき、システム監視回路111と電源装置113を結ぶラインあるいは電源装置113に異常があると判断する。このように、電源状態信号が電源制御信号に適合した値にないとき入出力制御回路あるいは電源装置に異常があると判断することができる。
【0019】
また、電源制御信号112および電源状態信号の何れかの信号が途絶えた場合、途絶えた装置(入出力制御回路107あるいは電源装置113)に障害があったと判断することができる。また、障害発生を検知したとき、障害発生部位、障害発生日時等の障害情報を記憶装置115に記録する。
【0020】
システム監視回路111は接続されたI/Oバス108(本実施形態では3本)の監視を行う。バスマスタによる転送が可能なI/Oバスの場合、デバイス109から入出力制御回路107に対してバスマスタ転送の許可を求める信号が送られる。また、バスマスタ転送を許可する場合には入出力制御回路107からデバイス109に対して、使用許可の信号が送られる。したがって、これらの信号を監視することで、現在バスを使用しているデバイス109の特定を行うことができる。また、I/Oバス108の使用状況を監視し、信号途絶などの障害が発生したときには障害発生パス名、発生日時、直前まで当該バスを使用していたデバイスID等の障害情報を記憶装置115に記録する。
【0021】
また、外部接続端子114に外部端末を接続することにより、システム監視回路111に接続された記憶装置115に記録された情報を読み出すことができる。また、システム監視回路111に接続されたI/Oバス108の中で障害発生後使用可能なものを経由して、入出力制御回路107や使用可能なバスに接続されたデバイス109の持つレジスタの内容を読み出すことができる。さらに、システム監視回路111で監視は行わないが、使用可能であればシステムバス106やメモリバス104、CPUバス102を経由することでそれらに接続されているCPUやメモリデバイス、メモリ制御回路の持つ情報を収集することも可能である。
【0022】
図2は、障害発生時の処理を説明する図である。システム監視回路111に接続されているI/Oバス108の信号、電源制御信号112および電源状態信号117が正常である場合、システム監視回路111はシステム監視回路内の図示しないバッファ領域に対して、最新のI/Oバス108の信号、電源制御信号112および電源状態信号117を出力し、該信号の状態を記録し続ける(ステップS200,201)。
【0023】
入出力制御回路107あるいは電源装置113に障害が発生し、電源状態信号が電源制御信号に適合したレベルにないとき、前記バッファ領域に記録された障害発生直前におけるデータを記憶装置115に転送して記憶する(ステップS202、204,205)。また、I/Oバス108の信号の異常を検知すると、前記バッファ領域に記録された障害発生直前におけるデータを記憶装置115に転送して記憶する(ステップS203,204,205)。
【0024】
以上説明したように、本実施形態によれば、システム監視回路111は、システム監視回路111に接続されているI/Oバス108の信号、電源制御信号112および電源状態信号117が正常である場合、最新のI/Oバス108の信号、電源制御信号112および電源状態信号117をバッファメモリに記録し続け、前記I/Oバス108の信号の異常、あるいは電源状態信号が電源制御信号に適合した値にないことを検知すると前記バッファメモリの内容を記憶装置115に転送して記憶する。このため、記憶装置115の記憶内容を解析することにより、障害発生時における障害発生箇所の特定、障害解析等を迅速に行うことができる。また、前記記憶装置115は記憶装置に記憶された情報を前記I/Oバスとは独立して出力するための外部接続端子114を備えるため、外部からの接続により計算機内の情報を収集することができる。
【図面の簡単な説明】
【0025】
【図1】実施形態にかかるシステム監視回路を備えた計算機を説明する図である。
【図2】障害発生時の処理を説明する図である。
【符号の説明】
【0026】
100 計算機
101 CPU
102 CPUバス
103 メモリ制御回路
104 メモリバス
105 メモリデバイス
106 システムバス
107 入出力制御回路
108 I/Oバス
109 デバイス
110 BIOS
lll システム監視回路
112 電源制御信号
113 電源装置
114 外部接続端子
115 記憶装置
116 サブ電源装置
117 電源状態信号

【特許請求の範囲】
【請求項1】
CPU、該CPUと接続されCPUが使用するデータを記憶したメモリを制御するメモリ制御回路、複数のI/Oバスを有する入出力制御回路、およびこれらに動作用の電力を供給する電源装置、前記CPU、メモリ制御回路及び入出力制御回路を接続するバス、並びに前記複数のI/Oバスの状態を監視するシステム監視回路を備えた計算機において、
前記システム監視回路は、前記入出力制御回路が前記電源の開閉を制御する信号として出力する電源制御信号および前記電源装置が該装置の状態を表す信号として出力する電源状態信号を監視し、前記電源状態信号が電源制御信号に適合したレベルにないとき入出力制御回路あるいは電源装置に異常があると判断し、
また、前記I/Oバス上の信号を監視し、I/Oバス上に所定期間に渡って信号が検出されないとき前記I/Oバスに異常があると判断することを特徴とするシステム監視回路を備えた計算機。
【請求項2】
請求項1記載の計算機において、
前記システム監視回路は、取り外し可能な記憶装置を備え、前記電源状態信号が電源制御信号に適合したレベルにないとき、およびI/Oバスに異常があると判断したとき異常発生箇所のデータを前記記憶装置に記憶させることを特徴とするシステム監視回路を備えた計算機。
【請求項3】
請求項2記載の計算機において、
前記システム監視回路および取り外し可能な記憶装置は前記電源装置とは独立したサブ電源装置を備え、該電源装置を介して、前記電源の異常時にも給電可能であることを特徴とするシステム監視回路を備えた計算機。
【請求項4】
CPU、該CPUと接続されCPUが使用するデータを記憶したメモリを制御するメモリ制御回路、複数のI/Oバスを有する入出力制御回路、およびこれらに動作用の電力を供給する電源装置、前記CPU、メモリ制御回路及び入出力制御回路を接続するバス、並びに前記複数のI/Oバスの状態を監視するシステム監視回路を備えた計算機において、
前記システム監視回路は取り外し可能な記憶装置並びに前記システム監視回路および記憶装置に前記電源装置とは独立して電源を供給するサブ電源装置を備え、
前記システム監視回路は、前記入出力制御回路が前記電源の開閉を制御する信号として出力する電源制御信号および前記電源装置が該装置の状態を表す信号として出力する電源状態信号を監視し、前記電源状態信号が電源制御信号に適合したレベルにないとき入出力制御回路あるいは電源装置に異常があると判断し、
また、前記I/Oバス上の信号を監視し、I/Oバス上に所定期間に渡って信号が検出されないとき前記I/Oバスに異常があると判断して、異常を表す情報を前記取り外し可能な記憶装置に記憶するとともに、前記記憶装置は記憶装置に記憶された情報を前記I/Oバスとは独立して前記システム監視回路を介して出力するための外部接続端子を備えたことを特徴とするシステム監視回路を備えた計算機。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2009−199336(P2009−199336A)
【公開日】平成21年9月3日(2009.9.3)
【国際特許分類】
【出願番号】特願2008−40271(P2008−40271)
【出願日】平成20年2月21日(2008.2.21)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】