説明

監視構成

実体に障害があるとみなされるかどうかを決定するために、システム中の実体に関するデータをフィルタし、そのフィルタされたデータを調整することに基づく、階層的障害処理システム及び方法。すべての実体に対する結果は、システムに障害があるとみなされるかどうかの全体的な判断を行うシステム障害調整手段(17)において、調整される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、請求項1のプリアンブルに定義されるような、いくつかの相互動作部品を含むアセンブリの機能を監視するための構成に関する。また、本発明は、請求項23のプリアンブルに定義されるような、アセンブリの機能を監視するための方法にも関する。
【背景技術】
【0002】
一般に、生産ラインやコンピュータシステムなどの大きなシステムでは、システムにおける障害を識別するために、監視システムが提供される。いくつかの検出器が使用され、各検出器は、データを監視ユニットに提供する。1つの検出器からのデータが障害のあるユニットを示す場合は、警報が発行される。
【0003】
従って、警報は、小さな障害でも、大きな障害でも発行されることがあり、即ち、しばしばシステムが機能している状況でさえ、オペレータがいくつかの警報を処理する必要がある。また、エラーは、システムへと伝播しがちであり、その結果、同じ障害がいくつかの警報を引き起こす可能性があり、非常にわかりにくくなり得る。例えば、低い供給電圧は、伝送リンク上でのビットエラー、フェーズロックループのロックにおける問題、無線伝送の歪み、及び、その他の障害を招くおそれがあり、それらはすべて同じ問題から生じる。
【発明の開示】
【発明が解決しようとする課題】
【0004】
本発明の目的は、監視システムにおける効率的で安全な障害管理を提供することであり、その監視システムは、誤警報のリスクを最小限に抑えながら、障害を発見する可能性が高くなるはずである。
【課題を解決するための手段】
【0005】
本目的は、いくつかの相互動作部品を含むアセンブリの機能を監視するための監視システムであって、システムの実体の物理的特性を検出し、物理的特性に関する測定データを提供するための、少なくとも1つの第1の検出器と、前記実体の状況を決定するための、少なくとも1つの第1の決定手段とを備え、少なくとも1つの第1の検出器から測定データを受け取り、前記測定データをフィルタし、前記フィルタされた測定データに応じて前記実体に障害があるかどうかを示す信号を出力するように構成されるフィルタ手段を備えることを特徴とし、決定手段は、少なくとも1つの第1及び第2のフィルタ手段から前記出力信号を受け取り、前記出力信号を調整し、前記調整に基づいて前記実体に対して障害報告が生成されるべきかどうかを決定するように構成されることを特徴とする、本発明の監視システムによって実現される。
【0006】
また、本目的は、いくつかの相互動作部品を含むアセンブリの機能を監視するための方法であって、監視されるべきシステムの少なくとも1つの実体を定義するステップと、実体の少なくとも1つの物理的特性を、少なくとも1つの測定値として検出するステップと、少なくとも1つの測定値をフィルタするステップと、フィルタされた値に基づいて、実体に障害があるかどうかを決定するステップとを含む方法によっても実現される。
【0007】
従って、本発明によれば、実体に障害があるとみなされるべきかどうかを、1つ又は複数の検出器からのデータを処理することに基づいて、信頼性の高い方法で決定することができる。
【0008】
フィルタ手段は好ましくは、少なくとも1つのしきい値との比較に基づいて測定データをフィルタするように構成される。
【0009】
監視システムは、前記実体の状況に応じて障害を修正するためにアクションをとるための、少なくとも1つの第1のアクション手段を備えてもよい。監視システムは好ましくは、少なくとも2つの実体障害決定手段から、少なくとも2つの実体障害決定手段によって監視される少なくとも2つの実体の状況に関する報告を受け取り、前記報告に基づいてシステムに対する障害状況を決定するように構成されるシステム障害決定手段を備える。このようにして、異なる検出器からの観測結果をフィルタすること、監視対象実体に欠陥があるかどうかを決定するために多数の検出器からの観測結果を使用すること、最後にシステム内の警報を調整して、全体システムに、各状況で適切なアクションをとらせ、外部システム及び/又はオペレータへの正しい警報を生成させることを含む、障害処理用の階層システムが実現される。
【0010】
このようにして、システムの異なる部分からの障害報告が調整され、その結果、システム中の障害報告又は警報の数が低減される。特に、同じ障害の結果生じる障害報告又は警報の数が低減される。単一の障害が、システムのいくつかの部分の性能に影響を与え得る場合でも、警報の殺到を引き起こさなくなる。先行技術では、障害がシステム中で伝播することになり、ハードウェア障害が、他のハードウェア及び/又はソフトウェアでの障害検出を招くおそれがあり、その逆も同様である。
【0011】
システムの全体的な状況を決定するために、システム障害決定手段は、すべての全体的な実体状態Xを定期的にチェックし、これらのチェックに基づいてシステムの障害状況を決定するように構成されてもよく、ただし、Xは、実体に障害があるかどうかを示し、Xの絶対値は、状態の信頼性を示す。あるいは、システム障害決定手段は、例えば少なくとも1つの実体に対して障害が発せられたか、又は止められたときに、各障害調整手段に、実体又はそれによって監視される実体の状況に関する報告を要求するように構成されてもよい。
【0012】
フィルタ手段は、アナログ及びデジタル測定データをどちらも受け取りフィルタするように構成されるフィルタを備えてもよい。好ましい一実施形態では、監視システムは、電気通信システムを監視するように構成される。
【0013】
前記フィルタ手段の機能を制御するパラメータは、製造時にシステムに記憶され、ソフトウェアアプリケーションパッケージの一部として提供され、かつ/又は特定のサイトに対して作成される構成データに含まれる。
【0014】
システム障害調整器は、システム中のいくつかの又はすべての障害フィルタのダンプが永続メモリに記憶されるよう命令するように構成されてもよく、前記ダンプは、障害フィルタに対する状態変数を含む。そのダンプはまた、各障害フィルタに入力される検出器データの最後の数分を含むトレースバックバッファを含むことも可能である。このダンプは、修理担当者が使用して、何が誤りかを突き止めることができる。
【0015】
以下では、本発明の実施形態を、添付の図面を参照して、より詳細に説明する。
【発明を実施するための最良の形態】
【0016】
図1は、本発明の障害管理方法が実施される電気通信システムの論理概要図である。図1に示されている例示のシステムは、無線基地局であり、地上伝送リンクを扱うための伝送制御サブシステム3、運転保守(O&M)サブシステム5、第3のサブシステム7及び第4のサブシステム9を含めた、いくつかのサブシステムに分かれている。この例では、第3のサブシステムは、無線送信機及び受信機を制御するための無線制御サブシステムであり、第4のサブシステムは、処理プラットフォーム、例えばプロセッサ相互通信を扱うための、プラットフォームサブシステムである。このシステムは、ここに図示されたサブシステムに加えて、又はその代わりに、他のサブシステムを含むことも可能であることが当業者には理解されよう。各サブシステムは、いくつかのブロックを含み、それぞれが、同じサブシステム中の他のブロック及び/又は他のサブシステム中のブロックと通信する。
【0017】
各サブシステムは、いくつかのハードウェア及び/又はソフトウェアユニットを含む。
【0018】
本発明によれば、監視されるべきいくつかの実体が定義される。各実体は、特定のサブシステムによって監視される。1つのサブシステムが、1つ又は複数の実体を担当することができる。適切とわかったときは、サブシステムを複数の実体に分割してもよい。実体の例としては、物理的伝送リンク、無線送受信機、及び処理システムがある。無線送信機実体では、例えば次の因子(など)、即ち周波数シンセサイザ、無線機の異なる部分での供給電圧、電流消費、温度、歪み、利得ループを、監視する必要が生じる。その他の実体としては、システムに影響を与える外部因子、例えば周囲温度、入力電力供給の品質又は伝送リンクの品質でもよい。そのような外部実体に欠陥がある場合、周囲環境がシステムの運転にマイナスの影響を与え得る。
【0019】
実体の物理的特性は、検出器11によって監視される。各検出器からの測定値が、関連サブシステム中のフィルタ手段13に生データとして供給される。以下でより詳細に述べるように、フィルタ手段13は、そのデータをフィルタする。フィルタ手段13が、実体に欠陥又は問題があることを検出器から受け取ったデータが示すのを知った場合、これを障害調整ユニットに報告する。特定の実体に使用される検出器/障害フィルタが2つ以上存在する場合、サブシステムは好ましくは、この実体に対するすべての障害フィルタからの障害報告を調整してこの実体に障害があるとみなされるべきかどうかを決定するための実体障害調整ユニット15を含む。このケースでは、実体障害調整ユニット15は、それによって調整される実体での障害を、O&Mサブシステム5中に配置されるシステム障害調整ユニット17に報告する。あるいは、1つのサブシステム中のすべての障害フィルタの調整が、サブシステムレベルでのサブシステム障害調整ユニット(図示せず)によって実行されてもよい。好ましい一実施形態では、1つのフィルタ手段は、1つの検出器からの入力データしか受け取らず、一方、同じ検出器からのデータは、いくつかのフィルタへの入力データとして使用することができる。しかし、2つ以上の検出器からのデータを処理することが可能な多次元フィルタ手段を使用することも可能である。そのような多次元フィルタ手段は、当技術分野で知られている。
【0020】
システム障害調整ユニット17は、システム中のすべてのサブシステム3、5、7、9から受け取られたデータに基づいて、システムに障害があるとみなされるべきかどうかを決定する。2つ以上の実体が、障害があると報告された場合は、どの障害が1次障害で、どの障害が2次障害又は付随障害であるかも決定する。また、システム障害調整ユニット17は、どのような点でシステムに障害があるのか、例えばハードウェア障害であるのか、ソフトウェア障害であるのか又は環境障害であるのかも決定する。ハードウェア障害のケースでは、ハードウェアユニットが欠陥の可能性が高く、それを交換する必要がある。ソフトウェア障害のケースでは、システムが再起動されるべきであり、かつ/又は現在のソフトウェアバージョンに欠陥があるとみなされるべきである。ソフトウェアバージョンに欠陥があるとみなされる場合、異なるソフトウェアバージョンの使用を試すべきである。可能な環境障害は、電力供給の不足、過剰な熱、及び着信伝送リンクの不良を含む。
【0021】
また、システム障害調整ユニット17は、とるべき適切なアクション、例えばトラフィックをオフにし、かつ/又は警報を発行することも決定する。システムに障害があるとみなされるべきである場合、システム障害調整ユニット17は、警報処理ユニット19によって発行されるべき警報を開始してもよい。システム障害調整器は、1つ又は複数の実体に対して、他の実体の状況に応じて、障害報告を抑制する(即ち、警報を発行しない)ことを選択してもよい。
【0022】
フィルタ手段13とサブシステム障害調整ユニット15の間、又は、サブシステム障害調整ユニットがない場合、フィルタ手段13とシステム障害調整ユニット15の間に配置され得るアクション手段14によってサブシステムレベルでアクションがとられてもよい。このケースでは、好ましくは、フィルタ手段の代わりにアクション手段14がサブシステム障害調整ユニット15に障害を報告する。あるいは、フィルタ手段13は、サブシステム障害調整ユニット15に、直接接続されてもよい。アクション手段14を使用して、例えば損傷及び/又は規制違反を防ぐために、無線送信機を即座に切り換えてもよい。
【0023】
第3の構成は、この例では、伝送制御サブシステム3中に図示された構成である。この場合、フィルタユニット13が、2つの検出器11から測定データを受け取る。フィルタユニット13は、フィルタされた測定データをサブシステム障害調整ユニット15に報告し、そのサブシステム障害調整ユニットは、調整の結果をアクションユニット14に転送する。また、アクションユニットは、その結果をシステム障害調整ユニット17に転送する。
【0024】
特定の実体に障害があるとみなすかどうかの判断は、図4に関連して記述するように、1つ又は複数の検出器からの生データに基づいて、サブシステムによって行われる。その判断は、誤警報のリスクを最小限に抑えるように行われるべきである。判断を2つ以上の検出器からのデータに基づかせることで、誤警報のリスクを低減させながら、検出の確率が増大する。
【0025】
抽象レベルで監視対象実体を監視するために、各監視対象実体ごとに、「障害管理対象オブジェクト」FMOが定義される。検出器からの出力は、A/D変換器に関係する、温度などのアナログ特性の周期的測定に基づくことも、又はデジタルハードウェア、例えばフェーズロックループ用の「ロック検出器」からの個々のステータスビットの定期チェック(「ポーリング」)に基づくこともできる。また、検出器からの出力は、ビットエラーなど、検出された事故のロギングに基づくことも、又は不正なチェックサムをもつ受取りデータブロックに基づくこともできる。
【0026】
1つの実体に対する障害調整器は一般に、2つ以上のフィルタからの障害報告を使用する。
【0027】
図2は、本発明の障害処理階層の論理表現である。第1、第2、及び第3の実体21、22、23が示されており、それぞれが1つ又は複数の検出器によって監視される。第1の実体21は、実体21のアナログ値を検出するように構成されるアナログ検出器24によって監視され、デジタル検出器25は実体21のデジタル値を検出するように構成される。第2の実体22は、デジタル検出器25及び計数手段26によって監視される。計数手段は、カウンタ27と、読取り及びリセットユニット28とを含む。カウンタは、特定の状態又はアクティビティの存在数を計数する。読取及びリセットユニット28は、一定間隔でカウンタ値を読み取り、カウンタ27をリセットする。第3の実体23は、アナログ検出器24によって監視される。各アナログ検出器24からの出力、ならびに計数手段26の読取及びリセットユニット28からの出力は、アナログ障害フィルタ29に入力される。各デジタル検出器25からの出力は、デジタル障害フィルタ31に入力される。アナログ及びデジタル障害フィルタの構造及び機能については、以下でより詳しく説明する。
【0028】
無線基地局では、1つのそのような監視対象実体としては、無線送信機でもよい。そのような無線送信機を監視するために、アナログ検出器とデジタル検出器の両方を使用してもよい。アナログ検出器を使用して、電力増幅器バイアス電流の消費を測定してもよい。また、検出器を使用して、ピーククリッピングを測定してもよい。このケースでは、無線送信機のD/A変換器への入力信号がクリップされるたびに、ピーククリップカウンタに対してイベントが生成される。このピーククリップカウンタは、定期的(例えば、10秒ごと)に読み取られ、その値が、アナログ障害フィルタに供給される。ピーククリップカウンタから値が読み取られるたびに、そのカウンタがリセットされる。
【0029】
各障害フィルタ29、31は、実体に障害があるとみなされるべきかどうかを示す出力信号を生成するために、それぞれの検出器24、25、26から受け取られるデータを処理するように構成される。同じ実体からデータを受け取るすべての障害フィルタからの出力信号は、実体障害調整ユニット33に供給される。第3の実体23でのケースのように、実体に対してただ1つの検出器しか存在しない場合、実体障害調整ユニットを省略することもできる。また、図2では、第3の実体23は、実体障害調整ユニット33を有するようにも示されている。
【0030】
すべての実体障害調整ユニット33からの出力信号が、システム障害調整ユニット35に供給され、そのシステム障害調整ユニットは、システムレベルでの障害調整を担当する。実体障害調整ユニット33の存在しない実体が存在する場合、この実体からデータを受け取る1つ又は複数のフィルタからの出力は、システム障害調整ユニット35に、直接供給される。システム障害調整ユニット35に供給される信号は、各実体ごとに、この実体に対して警報が発せられるべきか、それとも止められるべきかを示すべきである。
【0031】
システム障害調整ユニット35が、すべての投票ユニット及び/又は障害フィルタから受け取られる情報に基づいて、システムに障害があるとみなされるべきであると決定する場合、外部警報を出すことになる。また、システム障害調整器は、すべての投票ユニット及び/又は障害フィルタから受け取られる情報に基づいて、発せられた警報を止めることもできる。システム障害調整ユニット35は、投票ユニット及び/又は障害フィルタからのそのような情報を、一定間隔で自動的に、あるいは実体に対して障害が発せられるとき、又は止められるときに、受け取ることができる。或いは、システム障害調整ユニットは、必要なときに、投票ユニット及び/又は障害フィルタにそのような情報を要求することもできる。図3に、本発明の障害処理方法の主なステップを示す。ここに概略が示されている各ステップについて、以下に詳述する。第1のステップS1は、生データ、即ち、特定の監視対象実体を特徴づける物理的パラメータ、例えばユニットの両端間の電圧の収集である。
【0032】
ステップS2では、ステップS1で収集された生データがフィルタされて、特定の監視対象実体に対して警報が発行されるべきかどうかを示すブール値が生成される。1つ又は複数の検出器からのデータが一緒に考慮される。
【0033】
ステップS3は、同じ供給源を有する多数の障害が検出された場合、1つの障害だけが報告されるようにするために、障害管理対象オブジェクト中、又はサブシステム中で内部的に実行される、障害調整ステップである。
【0034】
ステップS4では、障害のためにとられるべき可能な修正アクションが、調整サブシステム中で決定される。そのような修正アクションの例としては、システムを通過するトラフィックの阻止や、オペレータへの警報の発行がある。
【0035】
ステップS5は、ステップS3で使用される調整ブロックが、実体に障害があるとみなされるべきであるかどうかを、調整サブシステムに報告するステップである。図1に示されているシステムでは、これはO&Mサブシステムである。
【0036】
ステップS6は、中央障害調整を処理する。報告された障害は、中央障害調整ユニットで扱われ、警報評価器機能のためにフィルタされる。
【0037】
オペレータに対する障害報告又は警報は、いくつかの異なる方法で調整することができる。好ましい一実施形態では、警報が「ソフトウェアに障害がある」こと、又は「ハードウェアに障害がある」ことだけを示すことになる。警報をより詳細にするために、障害のあるハードウェア又はソフトウェアを含む、サブシステム又はブロックを示すことができる。また、もちろん、障害のある実体をそれぞれ指摘することも可能である。フィルタせずに調整サブシステムに直接報告されるべき、1つ又は複数のきわめて重要なエラーを定義することもできる。好ましくは、これは、連続運転を不可能にするソフトウェアシステムでのクラッシュなど、破局的なエラーのために予約される。
【0038】
好ましい一実施形態では、各障害フィルタは、生データとしてのパラメータ値を、1つの検出器から入力信号として受け取り、それをフィルタする。各障害フィルタを、2つ以上の検出器から値を受け取るようにさせることが可能である。そのフィルタは、ローパスフィルタリング、しきい値、ヒステリシスなどを制御するいくつかのパラメータを有する。そのフィルタからの出力は、この特定の検出器が、監視対象実体に対して警報が発せられるべきか、それとも止められるべきかを示すかどうかを示す、ブール値である。
【0039】
異なる監視対象実体に属する障害フィルタ、例えば温度及び電力供給電圧に対する障害フィルタへの入力として、同じ検出器を使用することもできる。また、同じ検出器は、例えば異なるしきい値レベル又は平滑化ローパスフィルタをもつ、同じ監視対象実体に対して、2つ以上の障害フィルタに入力を提供することもできる。
【0040】
障害フィルタ調整は、いくつかの異なる方法で実行することができる。調整の最も単純な形態は、この実体に対する検出器のうち1つでも障害を示す場合、監視対象実体に対して警報を発行することである。実体に対する障害フィルタが障害を示さない場合、発行された警報がクリアされてもよい。
【0041】
また、多数決を使用することもできる。このケースでは、特定の監視対象実体に対する障害フィルタの過半数が障害を示す場合、監視対象実体に対して警報が発行される。監視対象実体に対する過半数が、障害が見つからないことを示す場合、警報はクリアすることができる。
【0042】
障害フィルタ調整に対する第3の代替方法は、特定の監視対象実体にとってどれだけ重要であるかに応じて、各障害フィルタに重みを与えるようにすることである。この障害調整は、例えば障害を示す各障害フィルタごとに、その重みに対応する値を合計値から減算することによって行うことができる。障害なしを示す各障害フィルタごとに、その重みに対応する値が合計値に加算される。合計値が負の場合、警報が発行されるべきであり、そうでない場合は、発行された警報があれば、クリアされてもよい。
【0043】
この第3の代替方法の更なる発展形態では、各障害フィルタは3つ以上の異なる出力値、例えば、−1、0、及び+1を扱うことができる。ただし、−1は問題あり、0は未定状態、+1は問題なしを示す。このケースでは、2つのしきい値が必要とされる。測定されたパラメータが第1のしきい値未満の場合、問題なしであり、第2のしきい値を超えた場合、問題ありである。測定されたパラメータがしきい値の間の場合、状態が未定となる。また、未定状態は、測定間隔中に観測結果がない場合に使用することもできる。
【0044】
3レベル以上を使用すると、すべての計算が容易に合うという点で、実体に対する障害調整が容易になる。いくつかの検出器によって実体が監視され、少なくとも1つの障害フィルタI=1…kによって各検出器が定期的に読み取られ、定期的に読み取られる障害フィルタをその観測結果が通過し、各障害フィルタに「重み」kiが割り当てられると仮定すると、所与の時点での実体に対する全体的な実体状態Xは、次のようになる。
【0045】
【数1】

【0046】
X(t)<0の場合、これは、実体に障害があるとみなされるべきであることを示す。X(t)>0の場合、これは、実体が問題なしであることを示す。利用可能な観測結果がない場合、すべてのyが0になり、従って、Xがゼロになり、状態が未定になる。Xの絶対値は、状態の信頼性を示す。
【0047】
合計する代わりに、別の方法、例えば「最大絶対値」、又は最確状態の発見を使用することができる。1つのそのような方法については、以下の3つのステップで説明することができる。
【0048】
【数2】

【0049】
尚、同じ検出器が、2つ以上のフィルタに入力データを提供してもよいことに留意されたい。
【0050】
以上、異なる障害フィルタからの結果をどのように調整するかについての、いくつかの例について説明した。当業者には理解されるであろうように、いくつかの他の調整方法も認識可能である。
【0051】
単純な実施形態では、各サブシステムは単に、その実体がそれぞれ、問題なしとみなされるかどうか、それとも障害があるとみなされるかどうかを、即ち、実体に対して障害が生じたかどうかを、システム障害調整ユニット17に報告する。実体の状態が変わるたびに報告が送られ、システム障害調整器はすべての監視対象実体の既知の最新状態のリストを有する。また、実体に対して障害が発せられるとき、又は止められるとき、この実体を担当するサブシステムが、システム障害調整器17に信号を送る。システム障害調整器は、この信号を受け取ると、すべての実体の全体的な実体状態Xに関する情報を要求し、従って、合計評価を行うことも可能になる。
【0052】
また、システム障害調整器17は、すべての全体的な実体状態Xを定期的にチェックし、従って、合計評価を行うことも可能になる。
【0053】
合計評価は、いくつかの異なる代替方法に従って行ってもよい。例えば、1つの実体が問題ありを示す場合、外部警報が発せられる。各実体ごとの警報の参照リストによって、警報タイプが示される。2つ以上の実体が問題ありを示す場合、最も信頼性の高い障害指示を有する実体に応じて警報が生成される。上記の例では、これは、Xに対する負の最大値を有することを意味する。
【0054】
障害フィルタは、デジタルの観測結果もアナログの観測結果も扱うように構成されてもよい。デジタルフィルタは、検出器から入力信号を受け取り、その場合、各観測結果は、例えば状況ビットのチェックからの0又は1だけである。アナログフィルタは、浮動小数点又は整数値、例えばA/D変換器からの出力又は測定期間にわたるエラー指示の合計でもよいデータを受け取る。
【0055】
各障害フィルタごとに最適設定を見つけることは、複雑であり得る。しばしば、正しくない設定の結果、障害の検出されない鈍感なシステムとなるか、又は誤警報が生じる。好ましくは、各障害フィルタごとのパラメータが、データファイルに記憶される。フィルタパラメータをソフトウェアアプリケーションに含めることも可能であるが、そうすると、それらを変更するのが非常に困難になる。その代わりに、フィルタパラメータは、データファイルに保存され、それらのデータファイルは、容易に改変することができる。
【0056】
障害フィルタのいくつかは、非常にハードウェア依存性があり、生産時に、製造されるハードウェアユニットに記憶されるものがある。こうしたハードウェア依存フィルタには、主としてハードウェアのバージョンに依存する(即ち、ハードウェアの設計が変更されるときにのみ変更される)ものがある。生産時に個々のユニットごとに調整されなければならないものもある(例えば、無線構成要素に依存するしきい値設定)。
【0057】
障害フィルタのいくつかは、ソフトウェアアプリケーション又は環境、例えば入力伝送線の品質により依存し、それゆえ、ソフトウェアアプリケーションの一部として提供されるものがある。必要ならば、そのユニットで提供される1組の障害フィルタパラメータの代わりに、アプリケーションで提供される新しい1組のパラメータを使用することができる。このようにして、十分うまく働かない障害フィルタを調整することができる。また、エンドユーザが、インストールごとに、個々にフィルタパラメータを調整するのを可能にすることも可能である。従って、パラメータは、生産時にユニットに記憶させるか、提供されるソフトウェアアプリケーションの一部であるデータファイルに記憶させるか、又は、例えばインストール時にエンドユーザによって作成されるデータファイルに記憶させることができる。これら3つの組み合わせが可能である。同じ障害フィルタに対するパラメータがこれらのファイルの2つ以上で利用可能な場合、それらの間の優先順位が設定されるべきである。例えば、ソフトウェアアプリケーションは、まずインストール構成ファイル中でフィルタを見つけようと試みるべきである。そこで入手可能でない場合、そのアプリケーションの一部であるファイルを使用すべきであり、それらもそこで見つけられない場合、そのユニットに記憶されたデータファイル(生産データ)を使用すべきである。もちろん、異なる優先順位を使用することができ、例えば生産データをソフトウェアパッケージデータの前に使用することができる。
【0058】
システム中のすべての監視対象実体の変更された状況のすべての報告が、中央ユニット、障害調整器に報告される。この障害調整器は、受け取られた情報により(警報を発するか、又は警報を止めるために)とられるべき適切なアクションを決定することを担当する。
【0059】
障害調整器が、システムが適切に働いていないか、又はそれに欠陥があることを発見した場合、システム中のいくつか又はすべての障害フィルタの全ダンプを命令する。そのダンプは、すべての障害フィルタに対する状態変数、例えばフィルタ状態、フィルタ用のデータバッファ、フィルタ出力及び判断、ならびに各障害フィルタに対する検出器データ入力の最後の数分を含むトレースバックバッファを含む。ダンプは、永続メモリに記憶され、従って、ユニットの電源オフを生き延びることになる。ダンプは、修理するためにそのユニットが送られる場合、修理工場で取り出すことができ、トラブルシューティングのために使用することも、また過剰な温度や低い供給電圧などの外部因子によって報告された問題が生じたかどうかを判定するために使用することもできる。
【0060】
状態変数に加えて、ダンプは、以下のような、他のタイプの情報も提供することができる(この例は、無線基地局に適合されている)。
【0061】
障害が発生したとき、機材がどのように使用されたか
例えば、アイドル、セルフテスト−命令されたテスト、トラフィック
以下のような、障害が発生したときの機材に対するパラメータ設定
選択された送信機周波数
選択された受信機周波数
選択された送信機に対する出力電力
トラフィックシナリオ(ユニットがトラフィックに使用されたときに、障害が発生した場合)
そのセル及び共通トラフィックチャネルに対するパラメータの構成
パラメータ設定を含む、(単一モバイル端末に対する)アクティブな「専用トラフィックチャネル」数
アナログ観測結果を処理するためのフィルタ51の一例が、図4に示されている。このフィルタは、アナログ観測結果を処理し、これらの観測結果が障害問題を示すかどうかを決定するように構成される。そのようなフィルタは、本文書では、アナログ障害フィルタと呼ぶことにする。フィルタにアナログ値が挿入されるたびに、そのフィルタは、障害が発せられるべきか、それとも止められるべきかを評価する。検出器からのアナログ値は、最後のN個のサンプルの中央値を評価し、その中央値を次のフィルタステップに渡すメジアンフィルタ53に入力される。メジアンフィルタ53に関連するバッファに保持されるべきサンプル数は、パラメータとして設定することができる。最後のN個のサンプルは、内部データとしてメジアンフィルタに保持される。
【0062】
中央値は、含まれるのが好ましいステップリミッタ54に渡され、そのステップリミッタ54から出力信号を受け取るように構成されるローパスフィルタ55に大量のステップが入るのが回避される。ステップリミッタ54は、メジアンフィルタ53からの新しい入力サンプルをそれぞれ前のサンプルと比較して、その差が大きすぎる場合、ステップリミッタは新しいサンプルを減らし、そのステップを許容される限界内に維持する。ステップリミッタは、2つのパラメータ、即ち、最大増大ステップ(即ち、新しいサンプルに対する最大差、又は許容増大)、及び最大減少ステップ(即ち、新しいサンプルに対する最大許容減少)を有する。
【0063】
ローパスフィルタ55は、ステップリミッタ54から受け取られる値をフィルタする。ローパスフィルタは、どんな種類の標準ローパスフィルタでもよく、例えばバターワースフィルタでもよい。ローパスフィルタに対するパラメータは、単純なフィルタでは、単にQ値とすることができる。より複雑なフィルタでは、すべてのフィルタ次数及び係数を、調整することができる。ローパスフィルタ中の内部データは、フィルタされた値である。フィルタされた中央値は、限界チェッカ57に出力される。限界チェッカは、ローパスフィルタから受け取られるフィルタされた値を、上位及び下位しきい値に対してチェックし、その場合、ヒステリシスが得られる。上位及び下位しきい値を使用してそれぞれ障害が発せられるべきか、それとも止められるべきかを決定する。別個のパラメータを使用してその機能を逆転してもよく、従って、値が下位しきい値を下回る場合に、障害が示されてもよい。アナログフィルタからの出力は、警報が発せられるべきか、それとも止められるべきかを示すブール値である。
【0064】
より単純なアナログフィルタでは、ただ1つのしきい値しか使用しない。
【0065】
別の例示的なフィルタ61が、図5Aに示されている。このフィルタは、デジタル観測結果を処理し、これらの観測結果が障害又は問題を示すかどうかを決定するように構成される。本文書では、これをデジタル障害フィルタと呼ぶことにする。スライディングウィンドウ63は、2進値の最新のサンプルを記憶し、各サンプルごとに、障害を示すかどうかを決定する。スライディングウィンドウ63に接続される限界チェッカ65は、障害を示すサンプルの数が、上位しきい値を超過するかどうかをチェックし、また、サンプルの数が、下位しきい値を下回るかどうかもチェックする。障害を示すサンプルの数が、上位しきい値を超過する場合、限界チェッカは警報を出す。障害を示すサンプルの数が、下位しきい値を下回る場合、警報が発せられていた場合は、それを止めることができる。このようにして、ヒステリシスを得ることができる。フィルタからの出力は、しきい値とのデータの比較に応じて、障害が発せられるべきか、それとも止められるべきかを示すブール値である。図5Bは、第1及び第2のスライディングウィンドウ73、74、ならびに第1及び第2のスライディングウィンドウからそれぞれデータを受け取る第1及び第2の限界チェッカ75、76を使用する、デジタルフィルタ71を示す。
【0066】
各フィルタごとに異なるサイズのスライディングウィンドウ73、74を設定し、かつ、限界チェッカ75、76において異なるしきい値を設定することにより、2つの監視機能を組み合わせることができ、その結果、短期間の高い障害頻度が報告され、一方、より低い障害頻度は、より長期間続いた場合にのみ、報告されるようになる。限界チェッカはどちらも、第1及び第2の投票ユニット77、78に接続される。限界チェッカ75、76の一方が、その上位しきい値が超過されたことを決定した場合、第1の投票ユニット77に発生信号を送る。限界チェッカ75、76の一方が、その下位しきい値が超過されたことを決定した場合、第2の投票ユニット78に停止信号を送る。第1及び第2の投票ユニット77、78は、第1及び第2の投票ユニットからの出力を調整する第3の投票ユニット79に接続される。
【0067】
第1の投票ユニット77は好ましくは、2つのスライディングウィンドウのいずれかの内容がしきい値を上回った場合、即ち、2つの限界チェッカのうちの一方がそのしきい値が超過されたことを決定した場合、障害を示すように構成される。あるいは、スライディングウィンドウの内容がどちらも、そのしきい値を上回らなければならない。第2の投票ユニット78は、2つのスライディングウィンドウのうちの1つがしきい値を下回る場合、停止障害指示を出力するように構成されてもよく、あるいはスライディングウィンドウがどちらも、しきい値を下回ってもよい。好ましくは、第3の投票ユニット79は、第2の投票ユニット78からの出力がどうであったかに関係なく、第1の投票ユニット77の出力が障害を示した場合に、障害を発するように構成される。第3の投票ユニット79からの出力は、障害が発せられるべきかどうかを示すブール値である。
【0068】
また、アナログフィルタを、同様に組み合わせることもできる。もちろん、3つ以上のフィルタを、同様に一緒に使用することもできる。以上、本発明を、いくつかのサブシステムを含む電気通信システムに適用されるものとして説明してきた。しかし、生産ラインなど、どんなシステムの監視も、本発明による階層的方法で構成することができることを理解されたい。
【図面の簡単な説明】
【0069】
【図1】本発明の障害管理方法が実施される電気通信システムの概要図である。
【図2】本発明による障害処理階層の論理表現である。
【図3】本発明による障害処理方法の主なステップの流れ図である。
【図4】本発明で使用され得る、アナログ観測結果を処理するためのフィルタの図である。
【図5A】、
【図5B】本発明で使用され得る、ブール観測結果を処理するためのフィルタの図である。

【特許請求の範囲】
【請求項1】
いくつかの相互動作部品を含むアセンブリの機能を監視するための監視システムであって、
前記システムの実体の物理的特性を検出し、前記物理的特性に関する測定データを提供するための、少なくとも1つの第1の検出器(11)と、
前記実体の状況を決定するための、少なくとも1つの第1の決定手段(15、17)とを備え、
前記少なくとも1つの第1の検出器(11)から測定データを受け取り、前記測定データをフィルタし、前記フィルタされた測定データに応じて前記実体に障害があるかどうかを示す信号を出力するように構成されるフィルタ手段(13)を備えることを特徴とし、
前記決定手段(15、17)は、少なくとも1つの第1及び第2のフィルタ手段(13)から前記出力信号を受け取り、前記出力信号を調整し、前記調整に基づいて前記実体に対して障害報告が生成されるべきかどうかを決定するように構成されることを特徴とする監視システム。
【請求項2】
前記フィルタ手段(13)は、少なくとも1つのしきい値との比較に基づいて前記測定データをフィルタするように構成されることを特徴とする請求項1に記載の監視システム。
【請求項3】
前記実体の状況に応じて前記障害を修正するためにアクションをとるための、少なくとも1つの第1のアクション手段(14)を更に備えることを特徴とする請求項1又は2に記載の監視システム。
【請求項4】
少なくとも2つの実体障害決定手段(15)から、前記少なくとも2つの実体障害決定手段によって監視される少なくとも2つの実体の状況に関する報告を受け取り、前記報告に基づいて前記システムに対する障害状況を決定するように構成されるシステム障害決定手段(17)を備えることを特徴とする請求項1乃至3のいずれか一項に記載の監視システム。
【請求項5】
前記システム障害決定手段(17)は、すべての全体的な実体状態Xを定期的にチェックし、これらのチェックに基づいて前記システムの前記障害状況を決定するように構成され、ただし、Xは前記実体に障害があるかどうかを示し、Xの絶対値は前記状態の信頼性を示すことを特徴とする請求項4に記載の監視システム。
【請求項6】
前記システム障害決定手段(17)は、各障害調整手段(15)から前記実体又はそれによって監視される実体の状況に関する報告を要求するように構成されることを特徴とする請求項4に記載の監視システム。
【請求項7】
前記システム障害決定手段(17)は、少なくとも1つの実体に対して障害が発せられたか、又は止められたときに前記報告を要求するように構成されることを特徴とする請求項6に記載の監視システム。
【請求項8】
前記フィルタ手段(13、51)は、アナログ測定データを受け取りフィルタするように構成される、少なくとも1つのフィルタを備えることを特徴とする請求項1乃至7のいずれか一項に記載の監視システム。
【請求項9】
前記フィルタ手段(13、51)は、検出器からアナログ値を受け取り、いくつかのそのようなアナログ値の中央値を計算し、前記中央値を、前記中央値をフィルタし、前記フィルタされた中央値を、少なくとも1つのしきい値に対して、ローパスフィルタ(55)から受け取られた前記フィルタされた値をチェックして、障害が発せられるべきか、それとも止められるべきかをそれぞれ決定するように構成される限界チェッカ(57)に出力するように構成される前記ローパスフィルタに渡すように構成されるメジアンフィルタ(53)を備えることを特徴とする請求項8に記載の監視システム。
【請求項10】
前記メジアンフィルタから前記中央値を受け取り、前記中央値と前の中央値の差を決定し、前記差が最大増大ステップ又は最大減少ステップよりも大きい場合、前記中央値を、許容される限界内に前記ステップを保つための値に調整するように構成されるステップリミッタ(54)を更に備えることを特徴とする請求項9に記載の監視システム。
【請求項11】
前記ローパスフィルタ(55)は、前記中央値をフィルタするように構成されることを特徴とする請求項9又は10に記載の監視システム。
【請求項12】
前記限界チェッカ(57)は、ヒステリシスが得られるように、上位及び下位しきい値に対して前記フィルタされた値をチェックするように構成されることを特徴とする請求項9乃至11のいずれか一項に記載の監視システム。
【請求項13】
前記フィルタ手段(13、61)は、デジタル測定データを受け取りフィルタするように構成される、少なくとも1つのフィルタを備えることを特徴とする請求項1乃至12のいずれか一項に記載の監視システム。
【請求項14】
前記フィルタ手段(13、61)は、2進値の形のデータをフィルタするように構成され、前記2進値の最新のサンプルを記憶し、各サンプルごとに、それが障害を示すかどうかを決定するように構成される少なくとも1つのバッファ(63)と、前記バッファ(63)に接続され、障害を示すサンプルの数を少なくとも1つのしきい値と比較して警報が発せられるべきか、止められるべきかを決定するように構成される限界チェッカ(65)とを備えることを特徴とする請求項13に記載の監視システム。
【請求項15】
前記限界チェッカは、障害を示すサンプルの数を上位及び下位しきい値と比較してヒステリシスを得るように構成されることを特徴とする請求項14に記載の監視システム。
【請求項16】
前記フィルタ手段は、少なくとも2つのバッファ(73、74)と、前記バッファ(73、74)のうちの1つにそれぞれ接続される少なくとも2つの限界チェッカ(75、76)と、すべての限界チェッカからの出力に基づいて、障害が発せられるべきか、止められるべきかを決定するように構成される投票手段(77、78、79)とを備えることを特徴とする請求項8乃至15のいずれか一項に記載の監視システム。
【請求項17】
前記フィルタ手段(71)は、少なくとも2つの異なる複数組のフィルタ定数に基づいて受け取られた測定データをフィルタし、少なくとも2つの異なる論理値を生成するための手段と、前記フィルタ手段(71)からの論理出力信号を決定するための手段(77、78、79)とを備えることを特徴とする請求項1乃至16のいずれか一項に記載の監視システム。
【請求項18】
電気通信システムを監視するように構成されることを特徴とする請求項1乃至17のいずれか一項に記載の監視システム。
【請求項19】
前記フィルタ手段の機能を制御するパラメータは、製造中に前記システムに記憶されることを特徴とする請求項1乃至18のいずれか一項に記載の監視システム。
【請求項20】
前記フィルタ手段の機能を制御するパラメータは、ソフトウェアアプリケーションパッケージに含まれることを特徴とする請求項1乃至19のいずれか一項に記載の監視システム。
【請求項21】
前記フィルタ手段の機能を制御するパラメータは、特定のサイトに対して作成される構成データに含まれることを特徴とする請求項1乃至20のいずれか一項に記載の監視システム。
【請求項22】
前記システム障害調整器(17)は、前記システム中のいくつかの、又はすべての障害フィルタのダンプが永続メモリに記憶されるよう命令するように構成され、前記ダンプは障害フィルタに対する状態変数を含むことを特徴とする請求項1乃至21のいずれか一項に記載の監視システム。
【請求項23】
前記ダンプは、各障害フィルタに入力される検出器データの最後の数分を含むトレースバックバッファを更に備えることを特徴とする請求項22に記載の監視システム。
【請求項24】
いくつかの相互動作部品を含むアセンブリの機能を監視するための方法であって、
監視されるべきシステムの少なくとも1つの実体を定義するステップと、
前記実体の少なくとも1つの物理的特性を、少なくとも1つの測定値として検出するステップと、
前記少なくとも1つの測定値をフィルタするステップと、
前記フィルタされた値に基づいて前記実体に障害があるかどうかを決定するステップとを含むことを特徴とする方法。
【請求項25】
前記フィルタは、前記実体に障害があるとみなされることを前記測定値が示すかどうかの論理指示を出力するように構成されることを特徴とする請求項24に記載の方法。
【請求項26】
前記実体の物理的特性にそれぞれ対応するいくつかの測定値の前記フィルタリングの結果、いくつかのフィルタから出力されるいくつかのフィルタされた値に基づいて、前記実体に障害があるかどうかを決定するステップを更に含むことを特徴とする請求項24又は25に記載の方法。
【請求項27】
実体に障害があるかどうかの判断は、いくつかのフィルタからの出力の重み付き合計に基づいて決定されることを特徴とする請求項26に記載の方法。
【請求項28】
前記アセンブリ全体に対する障害状況は、前記アセンブリ中のいくつかの実体に関する判断に基づいて決定されることを特徴とする請求項24乃至27のいずれか一項に記載の方法。
【請求項29】
前記少なくとも1つの測定値をフィルタするステップは、少なくとも2つの異なる複数組のフィルタ定数に基づいて前記値をフィルタし、少なくとも2つの異なる論理値を生成するステップと、前記フィルタ手段(71)からの論理出力信号を決定するための手段(77、78、79)とを含むことを特徴とする請求項24乃至28のいずれか一項に記載の方法。
【請求項30】
前記システム中のいくつかの又はすべての障害フィルタのダンプが永続メモリに記憶されるよう命令するステップをさらに含み、前記ダンプは、障害フィルタに対する状態変数を含むことを特徴とする請求項23乃至29のいずれか一項に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5A】
image rotate

【図5B】
image rotate


【公表番号】特表2008−506180(P2008−506180A)
【公表日】平成20年2月28日(2008.2.28)
【国際特許分類】
【出願番号】特願2007−520257(P2007−520257)
【出願日】平成17年6月21日(2005.6.21)
【国際出願番号】PCT/SE2005/000963
【国際公開番号】WO2006/006907
【国際公開日】平成18年1月19日(2006.1.19)
【出願人】(503019280)アンドリュー・コーポレイション (5)
【氏名又は名称原語表記】ANDREW CORPORATION
【Fターム(参考)】