マルチプロセッサシステム及びその障害検出方法

【課題】マルチプロセッサシステムにおいて、各プロセッサの障害検出の処理負荷を小さくする。
【解決手段】共有メモリ１３内に各プロセッサ１１−１〜１１−ｎからアクセスされてプロセッサ識別子を書き込まれる順序明示領域１４を備え、各プロセッサは、自プロセッサ識別子と自プロセッサとは異なる所定のプロセッサ識別子を保持し、プロセッサ毎に所定アクセス周期で前記順序明示領域の内容を読み出し、該プロセッサ識別子が自プロセッサ識別子であるとき自プロセッサの保持する所定のプロセッサ識別子を前記順序明示領域に書き込み、読み出したプロセッサ識別子が自プロセッサ識別子でないとき自プロセッサの所定アクセス周期を待機期間に加算し、待機期間が所定値を超えたとき前記前記順序明示領域から読み出したプロセッサ識別子に対応するプロセッサの障害を検出して運転管理装置１５に通知する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、プロセッサを複数相互に接続したマルチプロセッサシステム及びその障害検出方法に関する。
【背景技術】
【０００２】
近年、コアすなわちプロセッサを複数相互に接続し、複数のコアで分散処理を行うマルチプロセッサシステムが開発されている。
【０００３】
図１は従来のプロセッサ障害検出システムの一例の構成図を示す。図１において、コア１はプロセッサでありハードウェア及びソフトウェアを有し独自の処理を実行する。コア１は所定時間Ｔ１毎にメモリ２に正常値を書き込む。監視部３は所定時間Ｔ２（Ｔ１＜Ｔ２）毎にメモリ２の値を読み出した後に異常値を書き込む。
【０００４】
監視部３はメモリ２から読み出した値が正常値であればコア１に障害はないと判定し、読み出した値が異常値であればコア１に障害発生と判定する。監視部３はコア１の障害発生と判定した場合には運転管理部４に障害検出を通知する。運転管理部４はコア１の障害検出を通知されると、コア１にリセット信号を供給してコア１を初期化することによりコア１を復旧させる。
【０００５】
ところで、複数のプロセッサは所定の時間間隔で共有メモリのカウンタにアクセスし、自プロセッサのカウンタをクリア、他プロセッサのカウンタ値を＋１進め、カウンタ値が一定値以上になったプロセッサは障害発生と判定する提案がなされている（例えば特許文献１参照）。
【先行技術文献】
【特許文献】
【０００６】
【特許文献１】特開平１−２００４４１号公報
【発明の概要】
【発明が解決しようとする課題】
【０００７】
複数のコアを相互に接続したマルチプロセッサシステムに従来のプロセッサ障害検出システムを適用した場合には、各コアに対して少なくともメモリと監視部を設けなければならず、コア数が増加すると回路規模が増大する。また、監視部に障害が発生した場合には、当該監視部が監視しているコアの障害を検出することができないという問題があった。
【０００８】
また、特許文献１のような監視方法では、コア数の増加による回路規模の増大はないものの、共有メモリ内にプロセッサ数分のカウンタ領域を確保する必要があり、各プロセッサは自プロセッサ以外の複数プロセッサの障害検出を行うために、プロセッサ数が増加すると各プロセッサが障害検出を行う処理負荷が増大するという問題があった。
【０００９】
開示のマルチプロセッサシステムは、各プロセッサの障害検出の処理負荷を小さくすることを目的とする。
【課題を解決するための手段】
【００１０】
開示の一実施形態によるマルチプロセッサシステムは、複数のプロセッサを相互に接続するマルチプロセッサシステムにおいて、
各プロセッサからアクセスされてプロセッサ識別子を書き込まれる順序明示領域を有する共通保持手段と、
各プロセッサは、
自プロセッサ識別子と自プロセッサとは異なる所定のプロセッサ識別子を保持する保持手段と、
プロセッサ毎に所定アクセス周期で前記順序明示領域の内容を読み出す読み出し手段と、
前記読み出し手段で前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子であるとき自プロセッサの前記保持手段に保持する所定のプロセッサ識別子を前記順序明示領域に書き込む書き込み手段と、
前記読み出し手段で前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子でないとき自プロセッサの所定アクセス周期を待機期間に加算する加算手段と、
前記待機期間が所定値を超えたとき前記前記順序明示領域から読み出したプロセッサ識別子に対応するプロセッサの障害を検出する検出手段と、を有する。
【発明の効果】
【００１１】
本実施形態によれば、各プロセッサの障害検出の処理負荷を小さくすることができる。
【図面の簡単な説明】
【００１２】
【図１】従来のプロセッサ障害検出システムの一例の構成図である。
【図２】マルチプロセッサシステムの一実施形態の構成図である。
【図３】無線基地局装置の構成図である。
【図４】マルチプロセッサシステムの一実施形態の各部の詳細構成図である。
【図５】相互監視情報の一実施形態のデータ構成図である。
【図６】グループ管理情報の一実施形態のデータ構成図である。
【図７】グループ管理情報のチェーン構造を示す図である。
【図８】グループ管理情報のチェーン構造（複数グループ）を示す図である。
【図９】相互監視情報設定処理の一実施形態のフローチャートである。
【図１０】監視処理の一実施形態のフローチャートである。
【図１１】障害検出時処理の一実施形態のフローチャートである。
【図１２】障害復旧時処理の一実施形態のフローチャートである。
【発明を実施するための形態】
【００１３】
以下、図面に基づいて実施形態を説明する。
【００１４】
＜マルチプロセッサシステムの構成＞
図２はマルチプロセッサシステムの一実施形態の構成図を示す。図２において、コア１１−１〜１１−ｎそれぞれはプロセッサでありハードウェア及びソフトウェアを有し、それぞれ独自の処理を実行する。コア１１−１〜１１−ｎは内部バス１２に接続されており、内部バス１２には共有メモリ１３と運転管理装置１５が接続されている。共有メモリ１３内には順序明示領域１４が設けられている。
【００１５】
コア１１−１〜１１−ｎそれぞれは内部バス１２を介して共有メモリ１３内の順序明示領域１４をアクセスして、自コア以外のコア１１−１〜１１−ｎの障害を検出する。また、コア１１−１〜１１−ｎのいずれかの障害を検出したコアは、内部バス１２を介して運転管理装置１５に対して障害検出通知を行う。障害検出通知を受けた運転管理装置１５は障害の発生したコアの復旧処理を行う。
【００１６】
なお、運転管理装置１５はコア１１−１〜１１−ｎのいずれかに設けられる構成であっても良い。
【００１７】
図２に示すマルチプロセッサシステムは、例えば図３に示す無線基地局装置に適用される。図３は、ＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）システム等の移動体通信システムにおける無線基地局装置（ｅＮＢ）の構成図を示す。無線基地局装置は、上位交換機との接続及びベースバンド処理を行う無線装置制御部（ＢＢＵ：ＢａｓｅＢａｎｄＵｎｉｔ）２１と、移動端末との無線接続を行う無線装置（ＲＲＨ：ＲｅｍｏｔｅＲａｄｉｏＨｅａｄ）２２を有している。無線装置制御部２１はハイウェイ部２３、制御管理部２４、ベースバンド処理部２５を有している。ハイウェイ部２３はネットワークを介して上位交換機であるＳ−ＧＷ（Ｓｅｒｖｉｎｇ−Ｇａｔｅｗａｙ）やＭＭＥ（ＭｏｂｉｌｉｔｙＭａｎａｇｅｍｅｎｔＥｎｔｉｔｙ）に接続されると共に保守装置に接続されており、また、無線装置制御部２１内の制御管理部２４，ベースバンド処理部（ＢＢ部）２５と接続されている。ハイウェイ部２３はＳ−ＧＷ，ＭＭＥ，保守装置との間で情報の送受信を行う。
【００１８】
制御管理部２４は、無線装置制御部２１及び無線装置２２内の各部を接続されており、呼制御や無線基地局装置内の各部の制御を行う。また、制御管理部２４は無線基地局装置内の各部の動作情報を管理する。ベースバンド処理部２５は上りリンク及び下りリンクのベースバンド処理を行う。無線装置２２はアンテナ制御部２６を有している。アンテナ制御部２６はアンテナ２７を用いて無線信号の送受信を行う。
【００１９】
なお、無線装置制御部２１内の制御管理部２４は複数のコアを有し、ハイウェイ部２３、ベースバンド処理部２５それぞれも一又は複数のコアを有し、各コアで分散処理を行っている。この無線装置制御部２１内の各コアが図２のコア１１−１〜１１−ｎに対応する。
【００２０】
＜マルチプロセッサシステムの各部の詳細構成＞
図４はマルチプロセッサシステムの一実施形態の各部の詳細構成図を示す。図４において、コア１１−１は監視処理部３１と再開処理部３５を有している。監視処理部３１は相互監視情報格納部３２に相互監視情報を設定されている。監視処理部３１内の相互監視部３３は相互監視情報格納部３２の相互監視情報を用いて共有メモリ１３の順序明示領域１４の内容を読み出し、読み出した内容が自コア識別子であれば相互監視情報の次コア識別子を共有メモリ１３の順序明示領域１４に書き込んで、他のコア１１−２〜１１−ｎの障害を監視する。相互監視部３３は他のコア１１−２〜１１−ｎの障害を検出すると、障害を検出したコアの識別子（障害コア識別子）を障害通知送信部３４に通知する。
【００２１】
障害通知送信部３４は上記障害コア識別子を含む障害メッセージを運転管理装置１５に送信する。運転管理装置１５内の障害管理部４３は障害通知受信部４４にて障害通知送信部３４から送信された障害メッセージを受信する。障害通知受信部４４は障害メッセージから障害コア識別子を取得して障害管理部４３内の復旧処理部４５に通知すると共に、グループ管理情報変更部４６に通知する。
【００２２】
復旧処理部４５は障害コア識別子が指示するコアの再開処理部３５に対し例えばリセットコマンドを送信して当該コアに復旧処理を指示する。なお、図４においては便宜上、障害コア識別子がコア１１−１を指示するものとして作図しているが、実際には運転管理装置１５に障害メッセージを送信したコアの識別子と、運転管理装置１５からリセットコマンドを送信するコアの識別子とは異なっている。
【００２３】
ところで、再開処理部３５は自コアのリセットを実行して障害復旧が完了すると監視処理部３１にその旨を通知し、監視処理部３１の障害通知送信部３４は自コアの識別子を含む障害復旧メッセージを生成して運転管理装置１５に送信する。
【００２４】
一方、グループ管理情報変更部４６はグループ管理情報格納部４１に格納されている複数のコア識別子から障害コア識別子を削除する。これにより、グループ管理情報格納部４１は更新されたグループ管理情報を相互監視情報計算部４２に供給する。ところで、運転管理装置１５は例えば上位装置等のグループ管理情報設定部５０から予めグループ管理情報格納部４１にグループ管理情報を設定されている。
【００２５】
相互監視情報計算部４２は更新されたグループ管理情報からコア１１−１〜１１−ｎそれぞれで異なる相互監視情報を計算し、相互監視情報を含む相互監視情報メッセージを対応するコア１１−１〜１１−ｎそれぞれに送信する。相互監視情報は各コアの相互監視情報格納部３２に格納される。
【００２６】
＜相互監視情報＞
図５に相互監視情報の一実施形態のデータ構成図を示す。相互監視情報格納部３２に格納される相互監視情報は、自コア識別子と次コア識別子とグループ識別子と順序明示領域アドレスを有する。自コア識別子はコア毎に割り当てられる識別子である。次コア識別子は自コアの次に監視処理を行うコアの識別子であり、自コアが順序明示領域１４に書き込む内容である。グループ識別子は自コアが所属する監視グループの識別子である。順序明示領域アドレスは共有メモリ１３における順序明示領域１４のアドレスである。
【００２７】
図６にグループ管理情報の一実施形態のデータ構成図を示す。グループ管理情報格納部４１に格納されるグループ管理情報は、グループを構成する複数のコアそれぞれについて、コア識別子とグループ識別子と順序明示領域アドレスを有する。
【００２８】
図６に示すグループ管理情報は１グループ分を表しており、図７に示すように、各コアが自コア識別子と次コア識別子を用いてリング状に連鎖する形態をとっている。これは、運転管理装置１５の相互監視情報計算部４２がコア毎の相互監視情報を計算して各コアに割り当てているからである。
【００２９】
図７において、コア１１ー１の相互監視情報は次コア識別子「１」でコア１１ー２に連鎖することを示し、コア１１ー２の相互監視情報は次コア識別子「２」でコア１１ー３に連鎖することを示し、コア１１ー３の相互監視情報は次コア識別子「０」でコア１１ー１に連鎖することを示しており、コア１１−１，１１−２，１１−３がリング状に連鎖している。
【００３０】
図８（Ａ）に示すグループ管理情報は２グループ分を表している。すなわち、コア識別子「０」，「１」，「３」それぞれのコア１１−１，１１−２，１１−４が第１グループを形成し、コア識別子「２」，「４」それぞれのコア１１−３，１１−５が第２グループを形成している。第１グループは共有メモリ１３のアドレス「０ｘ８０００３０００」を順序明示領域１４として使用し、第２グループは共有メモリ１３のアドレス「０ｘ８０００３００１」を順序明示領域１４として使用する。なお、「０ｘ」は１６進表示を示している。
【００３１】
これにより、第１グループは図８（Ｂ）に示すように、コア１１−１，１１−２，１１−４がリング状に連鎖している。また、第２グループは図８（Ｃ）に示すように、コア１１−３，１１−５がリング状に連鎖している。
【００３２】
ここで、図３に示す無線基地局装置においては、例えば制御管理部２４を構成する複数のコアを第１グループとし、ベースバンド処理部２５を構成する複数のコアを第２グループとし、ハイウェイ部２３を構成する複数のコアを第３グループとすることが考えられる。
【００３３】
＜相互監視情報設定処理のフローチャート＞
図９は運転管理装置１５の相互監視情報計算部４２が運用開始時に実行する相互監視情報設定処理の一実施形態のフローチャートを示す。
【００３４】
図９において、相互監視情報計算部４２はステップＳ１でグループ管理情報格納部４１に既に格納されているグループ管理情報に複数のグループ識別子が設定されているかどうかによりグループ設定の有無を判別する。グループ識別子が１種類でグループ設定がなければ、相互監視情報計算部４２はステップＳ２でグループ管理情報の全コアを１つのグループで管理するための相互監視情報（図７を参照）をコア毎に計算し、コア毎に上記相互監視情報を設定する。
【００３５】
また、グループ識別子が複数種類でグループ設定がされていれば、相互監視情報計算部４２はステップＳ３でグループ管理情報の全コアを複数グループで管理するための相互監視情報（図８を参照）をコア毎に計算し、コア毎に上記相互監視情報を設定する。上記ステップＳ２又はＳ３を実行した後、ステップＳ４で監視処理を実行する。
【００３６】
＜監視処理のフローチャート＞
図１０は各コアの相互監視部３３が実行する監視処理の一実施形態のフローチャートを示す。各コアの相互監視部３３はアクセス周期毎に図１０の処理を実行する。なお、コア１１−ｘ（ｘは１からｎまでの整数）はアクセス周期Ｔｘ毎に共通メモリ１３の順序明示領域１４をリードアクセスする。グループ期間Ｔｔはコア１１−ｘが属するグループの全コアのアクセス周期の総和であり、３コアのアクセス周期がＴ１，Ｔ２，Ｔ３の場合は、Ｔｔ＝Ｔ１＋Ｔ２＋Ｔ３となる。また、待機期間Ｔｗは順序明示領域１４の内容が自コア識別子と一致しない期間を表す。
【００３７】
図１０において、コア１１−ｘの相互監視部３３はステップＳ１１で共有メモリ１３の順序明示領域１４の内容を読み出し、順序明示領域１４の内容が自コア識別子と一致するか否かを判別する。順序明示領域１４の内容が自コア識別子と一致した場合には、相互監視部３３はステップＳ１２で相互監視情報格納部３２の次コア識別子を順序明示領域１４に書き込み、ステップＳ１３で待機期間Ｔｗに０をセットする。その後、相互監視部３３はステップＳ１４で待機期間Ｔｗに自コアのアクセス周期Ｔｘを加算し、ステップＳ１５でアクセス周期Ｔｘだけ待機した後ステップＳ１１に進む。
【００３８】
一方、ステップＳ１１で順序明示領域１４の内容が自コア識別子と不一致の場合には、相互監視部３３はステップＳ１６で今回読み出した順序明示領域１４の内容が前回読み出した順序明示領域１４の内容と同一であるか否かを判別する。今回読み出した順序明示領域１４の内容が前回読み出した順序明示領域１４の内容から変化している場合には、相互監視部３３はステップＳ１３で待機期間Ｔｗに０をセットする。その後、相互監視部３３はステップＳ１４で待機期間Ｔｗに自コアのアクセス周期Ｔｘを加算し、ステップＳ１５でアクセス周期Ｔｘだけ待機した後ステップＳ１１に進む。
【００３９】
また、ステップＳ１６で今回読み出した順序明示領域１４の内容が前回読み出した順序明示領域１４の内容と同一の場合には、相互監視部３３はステップＳ１７で待機期間Ｔｗがグループ期間Ｔｔ超えているか否かを判別する。待機期間Ｔｗがグループ期間Ｔｔ以下であれば、相互監視部３３はステップＳ１４で待機期間Ｔｗに自コアのアクセス周期Ｔｘを加算し、ステップＳ１５でアクセス周期Ｔｘだけ待機した後ステップＳ１１に進む。
【００４０】
また、ステップＳ１７で待機期間Ｔｗがグループ期間Ｔｔを超えていれば、相互監視部３３は今回読み出した順序明示領域１４の内容であるコア識別子を障害コア識別子としてステップＳ１８で障害通知送信部３４に通知し、障害通知送信部３４に上記障害コア識別子を含む障害メッセージを運転管理装置１５に送信させる。
【００４１】
＜障害検出時処理のフローチャート＞
図１１は障害検出時処理の一実施形態のフローチャートを示す。この処理は障害検出時に運転管理装置１５で実行される。この他にも、グループ管理情報設定部５０により実行することも可能である。
【００４２】
図１１において、運転管理装置１５の障害管理部４３はステップＳ２１で任意のコアからの障害メッセージを受信し、障害メッセージから障害コア識別子を取り出してグループ管理情報変更部４６に通知する。ステップＳ２２でグループ管理情報変更部４６はグループ管理情報格納部４１に既に格納されているグループ管理情報から障害コア識別子を除外する（グループ管理情報変更）。この他にも、グループ管理情報設定部５０が障害コア識別子を除外することも可能である。
【００４３】
次に、相互監視情報計算部４２はステップＳ２３でグループ管理情報の全コアを一又は複数のグループで管理するための相互監視情報をコア毎に計算し、コア毎に上記相互監視情報を設定する。
【００４４】
＜障害復旧処理のフローチャート＞
図１２は障害復旧時処理の一実施形態のフローチャートを示す。この処理は障害復旧時に運転管理装置１５で実行される。この他にも、グループ管理情報設定部５０により実行することも可能である。
【００４５】
図１２において、運転管理装置１５の障害管理部４３はステップＳ３１で障害が復旧したコアからの障害復旧メッセージ（障害が復旧したコアのコア識別子を含む）を受信し、障害復旧メッセージから上記コア識別子を取り出してグループ管理情報変更部４６に通知する。
【００４６】
ステップＳ３２でグループ管理情報変更部４６はグループ管理情報格納部４１に格納されているグループ管理情報に上記コア識別子を追加する（グループ管理情報変更）。この他にも、グループ管理情報設定部５０が障害から復旧したコアのコア識別子を追加することも可能である。
【００４７】
次に、相互監視情報計算部４２はステップＳ３３でグループ管理情報の全コアを一又は複数のグループで管理するための相互監視情報をコア毎に計算し、コア毎に上記相互監視情報を設定する。
【００４８】
上記実施形態では、グループを構成する複数のコアの相互監視情報がリング状に連鎖する形態とし、各コアが共有メモリ１３の順序明示領域１４の内容を読み出して自コア識別子と一致するとき次コア識別子を順序明示領域１４に書き込むため、いずれかのコアで障害が発生して順序明示領域１４の内容が書き換えられなくなると、待機期間Ｔｗがグループ期間Ｔｔを超え、順序明示領域１４に残されているコア識別子のコアで障害が発生したことを検出することができる。この場合、各コアはリング状に連鎖における自コア以外の全コアの障害を全て検出することができ、各コアの処理負荷はコア数が増加しても何ら増加することはない。
【００４９】
また、障害が発生したコアを除外した後、複数のコアがリング状に連鎖するように各コアの相互監視情報を計算するため、障害のコアを除外した残りの複数のコアにおいて障害検出を行うことができる。すなわち、複数のコアで障害が発生した場合にも、これを検出することが可能となる。
【００５０】
更に、障害復旧したコアを追加した後、複数のコアがリング状に連鎖するように各コアの相互監視情報を計算するため、障害復旧したコアを含む複数のコアにおいて障害検出を行うことができる。
【００５１】
また、リング状に連鎖するコア数が増加するとグループ期間Ｔｔが大きくなり障害検出に要する時間が長くなる。このような場合には、グループを分離することで各グループを構成するコア数を減少することができグループ期間Ｔｔを小さくして障害検出に要する時間を短縮できる。
（付記１）
複数のプロセッサを相互に接続するマルチプロセッサシステムにおいて、
各プロセッサからアクセスされてプロセッサ識別子を書き込まれる順序明示領域を有する共通保持手段と、
各プロセッサは、
自プロセッサ識別子と自プロセッサとは異なる所定のプロセッサ識別子を保持する保持手段と、
プロセッサ毎に所定アクセス周期で前記順序明示領域の内容を読み出す読み出し手段と、
前記読み出し手段で前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子であるとき自プロセッサの前記保持手段に保持する所定のプロセッサ識別子を前記順序明示領域に書き込む書き込み手段と、
前記読み出し手段で前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子でないとき自プロセッサの所定アクセス周期を待機期間に加算する加算手段と、
前記待機期間が所定値を超えたとき前記前記順序明示領域から読み出したプロセッサ識別子に対応するプロセッサの障害を検出する検出手段と、
を有することを特徴とするマルチプロセッサシステム。
（付記２）
付記１記載のマルチプロセッサシステムにおいて、
前記複数のプロセッサがリング状に連鎖するよう前記複数のプロセッサそれぞれに設定する自プロセッサ識別子と所定のプロセッサ識別子を割り当てる割り当て手段を持つ運転管理装置を
有することを特徴とするマルチプロセッサシステム。
（付記３）
付記２記載のマルチプロセッサシステムにおいて、
各プロセッサは、
障害を検出されたプロセッサのプロセッサ識別子を送信する送信手段を有し、
前記運転管理装置は、
前記送信手段から送信された前記障害を検出されたプロセッサのプロセッサ識別子を前記リング状に連鎖する複数のプロセッサのプロセッサ識別子から除外して前記割り当て手段に供給する変更手段を
有することを特徴とするマルチプロセッサシステム。
（付記４）
付記３記載のマルチプロセッサシステムにおいて、
前記送信手段は、障害復旧を検出したプロセッサのプロセッサ識別子を送信し、
前記変更手段は、前記送信手段から送信された前記障害復旧を検出されたプロセッサのプロセッサ識別子を前記リング状に連鎖する複数のプロセッサのプロセッサ識別子に追加して前記割り当て手段に供給する
ことを特徴とするマルチプロセッサシステム。
（付記５）
付記２乃至４のいずれか１項記載のマルチプロセッサシステムにおいて、
前記割り当て手段は、前記複数のプロセッサが複数のグループそれぞれでリング状に連鎖するよう前記複数のプロセッサそれぞれに設定する次プロセッサ識別子を割り当てる
ことを特徴とするマルチプロセッサシステム。
（付記６）
複数のプロセッサを相互に接続するマルチプロセッサシステムの障害検出方法において、
各プロセッサからアクセスされてプロセッサ識別子を書き込まれる順序明示領域を有する共通保持手段を設け、
各プロセッサは、自プロセッサ識別子と自プロセッサとは異なる所定のプロセッサ識別子を保持しており、
プロセッサ毎に所定アクセス周期で前記順序明示領域の内容を読み出し、
前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子であるとき自プロセッサに保持する所定のプロセッサ識別子を前記順序明示領域に書き込み、
前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子でないとき自プロセッサの所定アクセス周期を待機期間に加算し、
前記待機期間が所定値を超えたとき前記前記順序明示領域から読み出したプロセッサ識別子に対応するプロセッサの障害を検出する、
ことを特徴とする障害検出方法。
（付記７）
付記６記載の障害検出方法において、
前記複数のプロセッサそれぞれに保持する自プロセッサ識別子と所定のプロセッサ識別子は、前記複数のプロセッサがリング状に連鎖するよう割り当てる
ことを特徴とする障害検出方法。
（付記８）
付記７記載の障害検出方法において、
前記障害を検出されたプロセッサのプロセッサ識別子を前記リング状に連鎖する複数のプロセッサのプロセッサ識別子から除外して前記複数のプロセッサがリング状に連鎖するよう割り当てる
ことを特徴とする障害検出方法。
（付記９）
付記８記載の障害検出方法において、
障害復旧を検出したプロセッサのプロセッサ識別子を前記リング状に連鎖する複数のプロセッサのプロセッサ識別子に追加して前記複数のプロセッサがリング状に連鎖するよう割り当てる
ことを特徴とする障害検出方法。
（付記１０）
付記７乃至９のいずれか１項記載の障害検出方法において、
前記複数のプロセッサが複数のグループそれぞれでリング状に連鎖するよう前記複数のプロセッサそれぞれに設定する所定のプロセッサ識別子を割り当てる
ことを特徴とする障害検出方法。
【符号の説明】
【００５２】
１１−１〜１１−ｎコア
１２内部バス
１３共有メモリ
１４順序明示領域
１５運転管理装置
２１無線装置制御部
２２無線装置
２３ハイウェイ部
２４制御管理部
２５ベースバンド処理部
２６アンテナ制御部
３１監視処理部
３２相互監視情報格納部
３３相互監視部
３４障害通知送信部
３５再開処理部
４１グループ管理情報格納部
４２相互監視情報計算部
４３障害管理部
４４障害通知受信部
４５復旧処理部
４６グループ管理情報変更部
５０グループ管理情報設定部

【特許請求の範囲】
【請求項１】
複数のプロセッサを相互に接続するマルチプロセッサシステムにおいて、
各プロセッサからアクセスされてプロセッサ識別子を書き込まれる順序明示領域を有する共通保持手段と、
各プロセッサは、
自プロセッサ識別子と自プロセッサとは異なる所定のプロセッサ識別子を保持する保持手段と、
プロセッサ毎に所定アクセス周期で前記順序明示領域の内容を読み出す読み出し手段と、
前記読み出し手段で前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子であるとき自プロセッサの前記保持手段に保持する所定のプロセッサ識別子を前記順序明示領域に書き込む書き込み手段と、
前記読み出し手段で前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子でないとき自プロセッサの所定アクセス周期を待機期間に加算する加算手段と、
前記待機期間が所定値を超えたとき前記前記順序明示領域から読み出したプロセッサ識別子に対応するプロセッサの障害を検出する検出手段と、
を有することを特徴とするマルチプロセッサシステム。
【請求項２】
請求項１記載のマルチプロセッサシステムにおいて、
前記複数のプロセッサがリング状に連鎖するよう前記複数のプロセッサそれぞれに設定する自プロセッサ識別子と所定のプロセッサ識別子を割り当てる割り当て手段を持つ運転管理装置を
有することを特徴とするマルチプロセッサシステム。
【請求項３】
請求項２記載のマルチプロセッサシステムにおいて、
各プロセッサは、
障害を検出したプロセッサのプロセッサ識別子を送信する送信手段を有し、
前記運転管理装置は、
前記送信手段から送信された前記障害を検出されたプロセッサのプロセッサ識別子を前記リング状に連鎖する複数のプロセッサのプロセッサ識別子から除外して前記割り当て手段に供給する変更手段を
有することを特徴とするマルチプロセッサシステム。
【請求項４】
請求項３記載のマルチプロセッサシステムにおいて、
前記送信手段は、障害復旧を検出したプロセッサのプロセッサ識別子を送信し、
前記変更手段は、前記送信手段から送信された前記障害復旧を検出されたプロセッサのプロセッサ識別子を前記リング状に連鎖する複数のプロセッサのプロセッサ識別子に追加して前記割り当て手段に供給する
ことを特徴とするマルチプロセッサシステム。
【請求項５】
請求項２乃至４のいずれか１項記載のマルチプロセッサシステムにおいて、
前記割り当て手段は、前記複数のプロセッサが複数のグループそれぞれでリング状に連鎖するよう前記複数のプロセッサそれぞれに設定する所定のプロセッサ識別子を割り当てる
ことを特徴とするマルチプロセッサシステム。
【請求項６】
複数のプロセッサを相互に接続するマルチプロセッサシステムの障害検出方法において、
各プロセッサからアクセスされてプロセッサ識別子を書き込まれる順序明示領域を有する共通保持手段を設け、
各プロセッサは、自プロセッサ識別子と自プロセッサとは異なる所定のプロセッサ識別子を保持しており、
プロセッサ毎に所定アクセス周期で前記順序明示領域の内容を読み出し、
前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子であるとき自プロセッサに保持する所定のプロセッサ識別子を前記順序明示領域に書き込み、
前記順序明示領域から読み出したプロセッサ識別子が前記自プロセッサ識別子でないとき自プロセッサの所定アクセス周期を待機期間に加算し、
前記待機期間が所定値を超えたとき前記前記順序明示領域から読み出したプロセッサ識別子に対応するプロセッサの障害を検出する、
ことを特徴とする障害検出方法。
【請求項７】
請求項６記載の障害検出方法において、
前記複数のプロセッサそれぞれに保持する自プロセッサ識別子と所定のプロセッサ識別子は、前記複数のプロセッサがリング状に連鎖するよう割り当てる
ことを特徴とする障害検出方法。

【図１】