説明

障害情報格納システム、サービスプロセッサ、障害情報格納方法、及びプログラム

【課題】 障害発生時に、被擬ボードまたはボード上の被擬構成品上の不揮発性メモリに、障害情報を格納し、修理の際に障害の解析に有効な情報を提供することにある。
【解決手段】 複数のボードとサービスプロセッサとからなる計算機システムの障害情報格納システムにおいて、ボードは、障害のロギングデータを格納するボード障害ログ情報格納部と、障害情報を格納するための不揮発性メモリを備え、サービスプロセッサは、障害内容から障害の種別を識別する障害種別識別処理部と、障害種別から被擬ボードを特定する障害被擬対象特定処理部と、被擬ボードに対応する障害のロギングデータを被擬ボード内の不揮発メモリに格納する障害情報被擬対象格納処理部を備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、障害情報格納システム、サービスプロセッサ、障害情報格納方法、及びプログラムに関し、特に、複数のハードウェアボードから構成される計算機システムの障害情報格納システム、サービスプロセッサ、障害情報格納方法、及びプログラムに関する。
【背景技術】
【0002】
特開平7−098668号公報には、従来の計算機システムの障害情報格納方法が開示されている。
【0003】
この従来の計算機システムの障害情報格納方法は、運用中に障害が発生すると、サービスプロセッサが、その障害が発生した箇所を含む論理カード内のレジスタの情報を障害情報として読み出し、その障害情報を当該論理カード内の不揮発メモリに格納することで、部品を修理する際に、部品内の障害箇所を特定するために必要な情報を提供するというものである。
【0004】
【特許文献1】特開平7−098668号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、この特開平7−098668号公報に記載されている計算機システムの障害情報格納方法には、以下の3つの問題点があった。
【0006】
第1の問題点は、この計算機システムの障害情報格納方法では、受信側の論理カード上で障害を検出したにもかかわらず、障害が発生した要因が受信側カードにはなく、送信側のカードにあるような場合には、障害を検出した受信側の論理カードのレジスタの内容のみを障害情報として取得するだけであり、障害が発生した要因がある送信側の論理カード内の障害情報が欠落してしまい、修理の際の情報として役に立たないという点である。
【0007】
第2の問題点は、この計算機システムの障害情報格納方法では、障害が発生した要因が1つの論理カードに特定できず、障害が発生した疑いのあるカードである被擬カードが複数となってしまう場合には、障害を検出した受信側の論理カードのレジスタの内容のみを障害情報として取得するだけであり、その他の被擬論理カード内の障害情報が欠落してしまい、修理の際の情報として役に立たないという点である。
【0008】
第3の問題点は、この計算機システムの障害情報格納方法では、論路カードがメモリモジュールで構成されている等、論理カード上に構成品が搭載されている場合には、障害を検出した論理メモリカード内のレジスタの内容のみを障害情報として取得するだけであり、障害が発生した要因がメモリカード内のどのメモリモジュールにあるかを示す障害情報が欠落してしまい、修理の際に、障害箇所を解析するための分解能の高い障害情報を提供できないという点である。
【0009】
本発明の目的は、障害が発生したときに、障害を検出したカード自体ではなく、障害の要因となったカードまたは障害の要因になる疑いのある全ての被擬カード上の不揮発性メモリに、障害情報を格納し、カードの修理の際に、障害が発生した部品を特定するのに有効な情報を与えることができる障害情報格納システム、障害情報格納装置、障害情報格納方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0010】
本発明の第1の障害情報格納システムは、計算機システムを構成する複数のボードと前記計算機システムで発生した障害を処理するサービスプロセッサとから構成される障害情報格納システムであって、
前記複数のボードのそれぞれは、障害の解析に必要なデータである障害のロギングデータを格納するボード障害ログ情報格納部と、障害情報を格納するための不揮発性メモリとを備え、
前記サービスプロセッサは、前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理部と、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理部とを備えることを特徴とする。
【0011】
本発明の第1のサービスプロセッサは、計算機システムを構成する複数のボードの内、障害が発生した前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理部と、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理部とを備えることを特徴とする。
【0012】
本発明の第2のサービスプロセッサは、第1のサービスプロセッサにおいて、前記障害被擬対象特定処理部は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする。
【0013】
本発明の第1の障害情報格納方法は、計算機システムを構成する複数のボードの内、障害が発生した前記ボードから障害内容を読み出す障害内容読出処理ステップと、前記障害内容の障害種別を識別する障害種別識別処理ステップと、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理ステップと、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理ステップと、を含むことを特徴とする。
【0014】
本発明の第2の障害情報格納方法は、第1の障害情報格納方法において、前記障害被擬対象特定処理ステップは、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする。
【0015】
本発明の第1のプログラムは、計算機システムを構成する複数のボードの内、障害が発生した前記ボードから障害内容を読み出す障害内容読出処理と、前記障害内容の障害種別を識別する障害種別識別処理と、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理と、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理とをコンピュータに行わせることを特徴とする。
【0016】
本発明の第2のプログラムは、第1のプログラムにおいて、前記障害被擬対象特定処理は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする。
本発明の第2の障害情報格納システムは、構成品が搭載されたボードを含む複数のボードを有する計算機システムと、前記計算機システムで発生した障害を処理するサービスプロセッサとから構成される障害情報格納システムであって、
前記複数のボードのうち、前記構成品が搭載されているボードのそれぞれは、障害の解析に必要なデータである障害のロギングデータを格納するボード障害ログ情報格納部と、障害情報を格納するための第1の不揮発性メモリと、前記構成品に関する障害情報を格納する前記構成品内の第2の不揮発性メモリとを備え、
前記サービスプロセッサは、前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理部と、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記第1の不揮発メモリ、及び前記被擬構成品内の第2の不揮発メモリに格納する障害情報被擬対象格納処理部と、を備えることを特徴とする。
【0017】
本発明の第3のサービスプロセッサは、構成品が搭載されたボードを含む複数のボードを有する計算機システムにおいて、
障害が発生した前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理部と、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリ、及び前記被擬構成品内の不揮発メモリに格納する障害情報被擬対象格納処理部と、を備えることを特徴とする。
【0018】
本発明の第4のサービスプロセッサは、第3のサービスプロセッサにおいて、前記障害被擬対象特定処理部は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする。
【0019】
本発明の第3の障害情報格納方法は、構成品が搭載されたボードを含む複数のボードを有する計算機システムにおいて、
障害が発生した前記ボードから障害内容を読み出す障害内容読出処理ステップと、前記障害内容の障害種別を識別する障害種別識別処理ステップと、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理ステップと、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリ、及び前記被擬構成品内の不揮発メモリに格納する障害情報被擬対象格納処理ステップと、を含むことを特徴とする。
【0020】
本発明の第4障害情報格納方法は、第3の障害情報格納方法において、前記障害被擬対象特定処理ステップは、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする。
本発明の第3のプログラムは、構成品が搭載されたボードを含む複数のボードを有する計算機システムにおいて、
障害が発生した前記ボードから障害内容を読み出す障害内容読出処理と、前記障害内容の障害種別を識別する障害種別識別処理と、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理と、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリ、及び前記被擬構成品内の不揮発メモリに格納する障害情報被擬対象格納処理と、コンピュータに行わせることを特徴とする。
【0021】
本発明の第4のプログラムは、第3のプログラムにおいて、前記障害被擬対象特定処理は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする。
【発明の効果】
【0022】
本発明は、障害が発生した要因になる疑いのある全ての被擬カードまたは被擬構成品内に格納された障害情報を、カードを修理する際に障害が発生した箇所を特定するのに有効な情報として、提供できる効果がある。
【0023】
その理由は、障害が発生したときに、障害を検出したカード上のエラーレジスタを読み出し、障害種別を識別し、この障害種別から障害被擬テーブルから障害の要因となる全ての被擬カードを特定し、この被擬カードに対応する障害情報をそれぞれの被擬カード内の不揮発メモリに格納し、カードを修理する際に障害が発生した部品の特定に有効な情報を提示することができるようにしたからである。
【発明を実施するための最良の形態】
【0024】
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。
【0025】
まず、本発明の第1の実施の形態について詳細に説明する。
【0026】
図1を参照すると、本発明の障害情報格納システムの第1の実施の形態の全体構成図が示されている。
【0027】
本発明の障害情報格納システムは、計算機システムを構成するボードからの障害内容を識別し、ボードへの障害情報の格納を制御する等の診断動作を行うサービスプロセッサ100と、計算機システムを構成する複数のボード200、ボード300、ボード500とから構成されており、相互にバス接続されている。
【0028】
サービスプロセッサ100は、診断プログラムで動作し、ボード内で障害を検出したことを通知する障害検出通知を受信する障害検出受信処理部102と、この障害検出通知信号を受信した後、ボード内のパリティエラー等の全ての障害が示されているエラーレジスタの内容を読み出す障害内容読出処理部103と、このエラーレジスタの内容から障害の種別を識別する障害種別識別処理部104と、この障害種別を識別する障害種別識別番号とこの障害の被擬対象となる被擬対象ボードとが、関連付けられた障害被疑対象テーブル105と、障害種別識別番号からこの障害被擬対象テーブル105を参照し、障害が発生した疑いのあるボードである被擬対象ボードを特定する障害被擬対象特定処理部106と、ボード内で障害が発生したときに、障害の要因を解析するための情報をロギングデータとしてボード内に格納した、全てのボード内のボード障害ログ情報の中から、障害被擬対象ボード分のボード障害ログ情報のみを選択する障害ログ被擬対象選択処理部108と、この障害ログ情報をサービスプロセッサ100内に格納するシステム障害ログ情報格納部107と、一方 この障害ログ情報を当該被擬ボード内の不揮発メモリである障害情報格納部へ格納する障害情報被擬対象格納処理部109と、診断動作を有効にする診断モードビットを制御する診断モード制御処理部110と、診断動作を作動させる診断クロックの停止、起動を制御する診断用クロック制御処理部111と、診断動作の全体を制御するプロセッサ、主記憶メモリ、診断プログラム等からなる診断制御処理部101から構成されている。
【0029】
ボード200は、システムで障害が発生したときに、障害を検知したことをサービスプロセッサ100に通知する障害検出通知処理部202と、ボード内のパリティエラー、メモリECCエラー、インターフェイスタイムアウトエラー等の全ての障害の内容を示すエラーレジスタ203と、ボード内に障害が発生したときに、障害の要因を追求するために必要な情報、例えばパリティビットを含む演算用レジスタ、ECC付きのメモリ、構成制御レジスタ、制御用のフリップフロップ等をロギングデータとして格納するボード障害ログ情報格納部204と、ボードをシステムから取り外してもデータが消えない不揮発性のメモリで構成され、サービスプロセッサ100からの被擬対象の障害情報を受信し、格納するための障害情報格納部205と、診断動作を有効にする診断モードビットを制御する診断モード制御処理部208と、診断動作を作動させる診断クロックの停止、起動を制御する診断用クロック制御処理部209と、診断動作を制御する診断制御処理部201から構成されている。
【0030】
ボード300、ボード400もボード200と同様な構成となっている。
【0031】
図2を参照すると、障害被擬テーブル105の1例が示されている。
【0032】
障害種別識別番号501に対して、この障害の種別の障害の要因となる可能性のある複数の被擬対象ボードが被擬対象A502と、被擬対象B503等として、示されている。
【0033】
ここで、図2の1例として、障害種別識別番号が0002に関連付けられて、被擬対象ボードがボード300と記載されているケースについて、図3を用いて説明する。
【0034】
図3は、回路がボード200とボード300に跨る場合の障害の対応について説明する図面である。
【0035】
ボード300には、Nビットの演算処理部の本体と、パリティビットの修正処理部とが実装されている。
【0036】
一方、ボード200には、ボード300からのデータとパリティビットを入力としてパリティエラーを検出するパリティエラー検出処理部が二重化されて実装されている。
【0037】
このような回路例で、ボード200でパリティエラーが発生し、二重化されたパリティエラー検出処理部の両方のパリティエラー検出処理部でパリティエラーが検出された場合には、ボード内のパリティエラー処理部は正常に動作し、障害はNビットの演算処理部を含むボード300内で発生した疑いが大きく、パリティエラーはボード200で検出したにもかかわらず、被擬ボードとしてはボード300であると想定している。
【0038】
また、図2の1例として、障害種別識別番号が0003に関連付けられて、被擬対象ボードがボード200とボード300とが記載されているケースについて、図4を用いて説明する。
【0039】
図4は、回路がボード200とボード300に跨る他の場合の障害の対応について説明する図面である。
【0040】
ボード300には、Nビットの演算処理部の本体と、パリティビットの修正処理部とが実装されている。
【0041】
一方、ボード200にも、Nビットのシフト処理部の本体と、パリティビットの修正処理部とが実装されている。
【0042】
このような回路例で、ボード200でパリティエラーが検出された場合には、ボード300とボード200は共に、大きな回路規模であるNビットの演算処理部、シフト処理部を含み、障害の発生した疑いはボード300、ボード200の両方にあり、被擬対象ボードはボード200とボード300であると想定している。
【0043】
次に、本発明の第1の実施の形態についての動作を図7の処理フローチャートで説明する。
【0044】
障害が発生したときの処理の事前準備として、ボード200では、通常動作が行われているときに、障害が発生したときに障害の解析に役に立つ情報として、例えば、演算回路の障害であれば演算で使用されるオペランドレジスタとパリティビット、メモリの障害であればメモリのデータとECCチェックビット、プログラム処理中も障害であればプログラムの実行命令履歴等のロギングデータをボード内障害ログ情報格納部204へ格納する(ステップS601)。
【0045】
また、サービスプロセッサ100では、障害種別を識別する障害種別識別番号とこの障害の被擬対象となる被擬対象ボードとが関連付けられた障害被疑対象テーブル105を予め設定する(ステップS605)。
【0046】
システムにてある障害が発生し(ステップS603)、ボード200の障害検出通知処理部202で障害が検出されると、サービスプロセッサ100へ通知される(ステップS604)。
【0047】
サービスプロセッサ100は、障害検出受信処理部102の制御により、ボード200からの障害が検出された通知を受信する(ステップS606)。
【0048】
サービスプロセッサ100は、診断モード制御処理部110で、診断動作を有効にする診断モードビットをONにし、また、診断用クロック制御処理部111で、診断動作を作動させる診断クロックの起動を行う(ステップS607)。
【0049】
次に、サービスプロセッサ100は、障害内容読出処理部103の制御により、ボード200内のパリティエラー、メモリECCエラー、インターフェイスタイムアウトエラー等の全ての障害の内容を示すエラーレジスタ203から障害内容を読み出す(ステップS608)。
【0050】
サービスプロセッサ100は、障害種別識別処理部104の制御により、読み出されたエラーレジスタの内容から障害の種別を識別して、障害種別識別番号を得る(ステップS609)。
【0051】
サービスプロセッサ100は、障害被擬対象特定処理部106の制御により、この障害種別識別番号をキーにして、障害被擬対象テーブル105を参照し、障害が発生した疑いのある被擬対象ボードを特定する(ステップS610、ステップS611)。
【0052】
次に、サービスプロセッサ100は、障害ログ被擬対象選択処理部108の制御により、被擬対象ボードに対応するボード内のボード障害ログ情報格納部から障害のロギングデータを読み出す(ステップS612)。
【0053】
また、サービスプロセッサ100は、障害情報被擬格納処理部109の制御により、この選択された障害のロギングデータを当該被擬ボードに対応するボード内の不揮発性メモリで構成された障害情報格納部に格納する(ステップS614)。
【0054】
サービスプロセッサ100は、この選択された障害のロギングデータをサービスプロセッサ100内のシステム障害ログ情報格納部107に格納する(ステップS613)。
【0055】
例えば、図2の障害被疑対象テーブルと、図3の障害事例とを参照して、動作の1例について説明する。
【0056】
図3では、ボード300には、Nビットの演算処理部の本体と、パリティビットの修正処理部とが実装されており、一方、ボード200には、ボード300からのデータとパリティビットを入力としてパリティエラーを検出するパリティエラー検出処理部が二重化されて実装されている。
【0057】
このような回路例で、ボード200でパリティエラーが検出された場合には、ボード内のパリティエラー処理部は正常に動作し、障害はNビットの演算処理部を含むボード300内で発生した疑いが大きく、被擬ボードとしてはボード300である。
【0058】
この場合には、ボード200で障害が検出されて、障害情報の識別番号が0002と識別され、その被疑対象はボード300でるので、ボード300の障害のロギングデータが選択され、ボード300の障害情報格納部に格納することができる。
【0059】
また、図2の障害被疑対象テーブルと、図4の障害事例とを参照して、その他の動作例について説明する。
【0060】
図4のボード300には、Nビットの演算処理部の本体と、パリティビットの修正処理部の回路が実装されており、一方、ボード200には、Nビットのシフト処理部の本体と、パリティビットの修正処理部の回路が実装されている。
【0061】
このような回路例で、ボード200でパリティエラーが検出された場合には、障害の発生した疑いはボード300、ボード200の両方にあり、被擬対象ボードはボード200とボード300と想定している。
【0062】
このような場合には、ボード200上の障害情報格納部205、ボード300上の障害情報格納部305へ障害情報が格納される。
【0063】
このように、障害が発生した要因が1つの論理カードに特定できず、障害が発生した疑いのあるカードである被擬カードが複数となってしまう場合には、障害を検出した受信側ボードの障害情報ではなく、その他の被擬ボード内の障害情報を不揮発性メモリに格納することにより、修理にときに有効な情報を提供できる。
【0064】
以上説明したように、本発明の第1の実施の形態の第1の効果は、障害内容を含むレジスタを持つボードが障害発生の要因でない場合に対しても、被疑対象となるボード障害情報を格納することができ、修理するときに障害箇所を解析するのに有効な情報を提供できる点である。
【0065】
また、本発明の第1の実施の形態の第2の効果は、障害内容が複数のボードに跨る場合にも、被疑対象となるボード全てに障害情報を格納することができ、修理するときに障害箇所を解析するのに有効な情報を提供できる点である。
【0066】
次に、本発明の第2の実施の形態について詳細に説明する。
【0067】
図5を参照すると、本発明の障害情報格納システムの第2の実施の形態の全体図が示されている。
【0068】
第1の実施の形態では、障害の対象としてボードのみを取り扱っているが、本発明の障害情報格納システムでは、障害の対象として、ボード上に搭載された構成品を扱っている点で異なる。
【0069】
ボード400とボード200との差異は、共通であるボード内の障害情報格納部405に加えて、ボード内の4つの構成品(以下、メモリモジュールとする。)内に、それぞれ障害情報格納部411、障害情報格納部421、障害情報格納部431、障害情報格納部441が追加されている点である。
【0070】
また、サービスプロセッサ100の差異は、障害被擬対象テーブル105に被擬対象として被擬対象ボードに加えて、被擬対象構成品が追加される点と、障害情報被擬対象格納処理部109が被擬対象構成品内の障害情報格納部に、障害のロギングデータを格納する機能を有する点である。
【0071】
その他の構成、機能は第1の実施の形態と同様である。
【0072】
図5では、ボードがメモリボードで、構成品がメモリモジュールのケースを示している。
【0073】
図5のメモリボード上には、メモリモジュール410、メモリモジュール420、メモリモジュール430、メモリモジュール440が実装されており、メモリモジュール410上には障害情報格納部411が、メモリモジュール420上には障害情報格納部421が、メモリモジュール430上には障害情報格納部431が、メモリモジュール440上には障害情報格納部441が実装されている。
【0074】
ここで、図2の1例として、障害種別識別番号が0004に関連付けられて、被擬対象ボードがボード400と、メモリモジュール440と記載されているケースについて、図6を用いて説明する。
【0075】
図6には、メモリボードであるボード400とこのボード上にこのメモリボードの構成品である4つのメモリモジュール410、メモリモジュール420、メモリモジュール430、メモリモジュール440が搭載されている場合の障害の対応が示されている。
【0076】
このケースでは、ボード400に搭載されている4つのメモリモジュールの中で、メモリモジュール440でのみメモリ障害が発生した場合を想定している。
【0077】
次に、図2と図5を用いて、本発明の第2の実施の形態についての動作について説明する。
【0078】
図2の1例では、障害情報の識別番号が0004であり、被疑対象はメモリボードであるボード400、4つのメモリモジュールの中のメモリモジュール440であると想定されている。
【0079】
このような場合には、障害情報被擬対象格納処理部109の制御により、ボード400
のボード障害ログ情報格納部404内の障害ログが、ボード400内の障害情報格納部405と、メモリモジュール440上の障害情報格納部441に格納される。
【0080】
このようにして、本発明の第2の実施の形態においては、障害が発生した要因になる疑いのある被擬ボードまたは被擬構成品内に障害情報を格納し、メモリカードを修理するときに、障害が発生した箇所を特定するのに有効な情報を提供することができる。
【0081】
尚 構成品はメモリモジュールに限らず、追加のプロセッサ、オプション機能を有する孫ボード等でも良い。
【図面の簡単な説明】
【0082】
【図1】本発明の第1の実施の形態を示す障害情報格納システムの全体の構成図である。
【図2】本発明の第1の実施の形態における障害被擬対象テーブル105の1例である。
【図3】本発明の第1の実施の形態における2枚のボードに跨る障害の1例である。
【図4】本発明の第1の実施の形態における2枚のボードに跨る障害の他の例である。
【図5】本発明の第2の実施の形態を示す障害情報格納システムの全体の構成図である。
【図6】本発明の第2の実施の形態におけるボードがメモリモジュールで構成されている1例である。
【図7】本発明の第1の実施の形態を示す障害情報格納システムのフローチャートである。
【符号の説明】
【0083】
100 サービスプロセッサ
101 診断制御処理部
102 障害検出受信処理部
103 障害内容読出処理部
104 障害種別識別処理部
105 障害被擬対象テーブル
106 障害被擬対象特定処理部
107 システム障害ログ情報格納部
108 障害ログ被擬対象選択処理部
109 障害情報被擬対象格納処理部
110 診断モード制御処理部
111 診断用クロック制御処理部
200 ボード
201 診断制御処理部
202 障害検出通知処理部
203 エラーレジスタ
204 ボード障害ログ情報格納部
205 障害情報格納部
208 診断モード制御処理部
209 診断用クロック制御処理部
305 障害情報格納部
400 ボード
410 メモリモジュール
411 障害情報格納部
420 メモリモジュール
421 障害情報格納部
430 メモリモジュール
431 障害情報格納部
440 メモリモジュール
441 障害情報格納部
501 障害種別識別番号
502 被擬対象A
503 被擬対象B

【特許請求の範囲】
【請求項1】
計算機システムを構成する複数のボードと前記計算機システムで発生した障害を処理するサービスプロセッサとから構成される障害情報格納システムであって、
前記複数のボードのそれぞれは、障害の解析に必要なデータである障害のロギングデータを格納するボード障害ログ情報格納部と、障害情報を格納するための不揮発性メモリとを備え、
前記サービスプロセッサは、前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理部と、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理部とを備えることを特徴とする障害情報格納システム。
【請求項2】
計算機システムを構成する複数のボードの内、障害が発生した前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理部と、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理部とを備えることを特徴とするサービスプロセッサ。
【請求項3】
前記障害被擬対象特定処理部は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする請求項2記載のサービスプロセッサ。
【請求項4】
計算機システムを構成する複数のボードの内、障害が発生した前記ボードから障害内容を読み出す障害内容読出処理ステップと、前記障害内容の障害種別を識別する障害種別識別処理ステップと、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理ステップと、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理ステップと、を含むことを特徴とする障害情報格納方法。
【請求項5】
前記障害被擬対象特定処理ステップは、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする請求項4記載の障害情報格納方法。
【請求項6】
計算機システムを構成する複数のボードの内、障害が発生した前記ボードから障害内容を読み出す障害内容読出処理と、前記障害内容の障害種別を識別する障害種別識別処理と、前記障害種別に基づいて障害が発生した疑いのあるボードを被擬ボードとして特定する障害被擬対象特定処理と、前記被擬ボードに対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリに格納する障害情報被擬対象格納処理とをコンピュータに行わせることを特徴とするプログラム。
【請求項7】
前記障害被擬対象特定処理は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする請求項6記載のプログラム。
【請求項8】
構成品が搭載されたボードを含む複数のボードを有する計算機システムと、前記計算機システムで発生した障害を処理するサービスプロセッサとから構成される障害情報格納システムであって、
前記複数のボードのうち、前記構成品が搭載されているボードのそれぞれは、障害の解析に必要なデータである障害のロギングデータを格納するボード障害ログ情報格納部と、障害情報を格納するための第1の不揮発性メモリと、前記構成品に関する障害情報を格納する前記構成品内の第2の不揮発性メモリとを備え、
前記サービスプロセッサは、前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理部と、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記第1の不揮発メモリ、及び前記被擬構成品内の第2の不揮発メモリに格納する障害情報被擬対象格納処理部と、を備えることを特徴とする障害情報格納システム。
【請求項9】
構成品が搭載されたボードを含む複数のボードを有する計算機システムにおいて、
障害が発生した前記ボードから障害内容を読み出す障害内容読出処理部と、前記障害内容の障害種別を識別する障害種別識別処理部と、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理部と、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリ、及び前記被擬構成品内の不揮発メモリに格納する障害情報被擬対象格納処理部と、を備えることを特徴とするサービスプロセッサ。
【請求項10】
前記障害被擬対象特定処理部は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする請求項9記載のサービスプロセッサ。
【請求項11】
構成品が搭載されたボードを含む複数のボードを有する計算機システムにおいて、
障害が発生した前記ボードから障害内容を読み出す障害内容読出処理ステップと、前記障害内容の障害種別を識別する障害種別識別処理ステップと、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理ステップと、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリ、及び前記被擬構成品内の不揮発メモリに格納する障害情報被擬対象格納処理ステップと、を含むことを特徴とする障害情報格納方法。
【請求項12】
前記障害被擬対象特定処理ステップは、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする請求項11記載の障害情報格納方法。
【請求項13】
構成品が搭載されたボードを含む複数のボードを有する計算機システムにおいて、
障害が発生した前記ボードから障害内容を読み出す障害内容読出処理と、前記障害内容の障害種別を識別する障害種別識別処理と、前記障害種別に基づいて障害が発生した疑いのある構成品を被擬構成品として特定する障害被擬対象特定処理と、前記被擬構成品に対応する前記障害のロギングデータを前記ボード障害ログ情報格納部から読み出して前記被擬ボード内の前記不揮発メモリ、及び前記被擬構成品内の不揮発メモリに格納する障害情報被擬対象格納処理と、コンピュータに行わせることを特徴とするプログラム。
【請求項14】
前記障害被擬対象特定処理は、前記障害種別を識別する障害種別識別番号と、前記被擬ボードとが関連付けられた障害被疑対象テーブルを含むことを特徴とする請求項13記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate