説明

自動障害修復のための通信ネットワーク管理システム

本発明は、ネットワーク要素N、N、N、Nによって供給される情報Aから診断Dを判定することができる診断モジュールMDを含む通信ネットワークNの管理のためのシステムNMSであって、前記診断がネットワーク内の障害を識別するシステムに関する。管理システムはまた、少なくとも前記診断から1つまたは複数の修正行為を判定し、障害を修正するために修正行為に対応する1つまたは複数のコマンドCを1つまたは複数のネットワーク要素に送信することが意図された修復モジュールMRも含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は通信ネットワークに関し、限定されるわけではないが、特にはパケット志向の通信ネットワークに適用可能である。本発明は、より詳細には通信ネットワークの管理に関する。
【背景技術】
【0002】
ネットワーク管理システム(NMS)は、ネットワーク機器からの警報を収集し、特にはコリレーション方法を使用してこれらの警報の要約を作成し、この要約またはこれらの警報をオペレータに対して表示して、この機器のうちの1つまたは複数のアイテムに障害がある場合にオペレータが修正行為を実行できるようにするために、通信ネットワークに関連付けられることができることが知られている。「障害」の概念は、ハードウェアまたはソフトウェアの機能異常のうちのあらゆる種類のものを表す非常に広い意味で理解されなければならない。したがって、ネットワーク要素の誤った構成は障害であるとみなされることが可能であり(ソフトウェア)、同様に、テーブルをルーティングするIPルータにおけるエラー、または偶然閉じられてしまったポートも、障害であるとみなされることが可能である。
【0003】
ネットワーク管理システムは、ネットワーク機器を構成するために使用されることも可能である。オペレータはマンマシンインタフェースを使用して新しいパラメータを入力することができ、ネットワーク管理システムはこれらの新しいパラメータを機器に適用する。このようにして、オペレータは警報の表示に対する反応の中で、ネットワーク障害を修正することができる。
【0004】
そのような集中化された分析は、通信システムの中の多くの要素から大量のデータおよび警報を収集することに依存している。これらの要素はIP(インターネットプロトコル)通信ネットワークのフレームワークにおけるルータなどの機器であってよいが、いわゆるNGN(次世代ネットワーク)における音声および光学スイッチ、PABX(構内交換機)およびメディアゲートウェイ等に関連するものであることも可能である。ネットワーク要素はまた、例えばカードなど、そうした機器の一部を形成してもよい。
【0005】
ネットワークの要素の間の多くの相互作用のために、単一の障害が非常に多くの数の警報を生成する可能性がある。したがって、機器のアイテム中のカード上の障害は、このカード上のポートの1つに接続された他の機器中のすべてのカードからの警報と、障害が起こった機器のカードによる警報とを生成することもある。
【0006】
したがってオペレータにとっては、多数の生成された警報の中でどれが本当の障害であるのかを判定することは困難なので、行われるべき修正行為を判定することはさらに困難である。
【0007】
最もありそうな原因を判定するために、この多数の警報を使用する診断システムによって、進歩がなされた。
【0008】
これらの診断システムは例えば、Ilog社によって売り出されているIlogRules(商標)製品に基づく規則などの、規則の組に基づいている。これらの診断システムはまた、ニューラルネットワーク、ベイシアンネットワーク、エキスパートシステム、または特には人工知能などのその他の技術に基づいていてもよい。
【0009】
言及に値するいくつかの製品は、Agilent社の「Fault Detective for Data Communications(FDDC)」、Hewlett−Packardの「Network Node Manager」および「Network Node Manager Extended Topology」製品、ならびにCisco社の「Output Interpreter」および「Troubleshooting Assistant(TAC)」製品である。
【0010】
それでもやはり、オペレータは行われるべき修正行為を判定し、その行為を起こすために、これらのツールを用いて各障害に対して処置を施さなければならない。その後、オペレータはネットワーク管理システムを使用してネットワークを再構成するか、または機器のアイテムのうちの1つまたは複数に手動で接続し、適切なCLI(コマンド行インタフェース)コマンドを送信する必要がある。
【0011】
この作業は現状技術の診断システムによって補助されるが、依然として難しいものであり、したがって費用がかかり、エラーを起こしやすい。
【0012】
実際、再構成と機器フェーズへの手動接続とは時間がかかり、退屈なものである。これらの作業はCLIコマンドのパラメータの中で間違いを起こしやすいので、別のネットワーク障害を引き起こしやすい。
【0013】
オペレータは最適な行為を求める場合、ネットワークの性能情報およびその他のパラメータを考慮に入れなければならないので、修正行為のフェーズを判定することはオペレータにとって実に難しいことである。
【0014】
これらの作業は、増加したネットワークの複雑性、利用可能な機器タイプの数およびそれらの複雑性のために、さらに一層難しく、費用がかかるようになる。
【0015】
診断の判定によって通信ネットワーク機器の構成を自動化する解決法が利用可能である。そのような解決法は、例えばインテリジェントエージェントおよびマルチエージェント技術の実用アプリケーションについての国際会議紀要において1996年4月22日に発表されたMercedes Garijo、Andres Cancer、Julio J.Sanchezの「A Multiagent System for Cooperative Network−Fault Management」で説明されており、北京で開催されたIEEE国際会議「システム、人間およびサイバネティクス」で1996年10月に発表されたJiann−Liang Chen、Pei−Hwa Huangの「A Fuzzy Expert System for Network Fault Management」でも説明されている。
【0016】
しかしながらこれらのシステムは、検出された問題点を修正行為が実際に修正したことを確認するいかなる方法も含んでいない。さらに、これらのシステムを用いることで、これらの修正行為が状況を悪化させていないということが確信されることは不可能である。これらの文献の中で、この問題は言及さえされていない。
【発明の開示】
【発明が解決しようとする課題】
【0017】
本発明の目的は、検出された問題が修正されることを保証するか、または少なくとも遠距離通信ネットワークの全般的な状況が改善されることを保証しながら、管理された通信ネットワークにおいて障害の修正を自動化することである。
【課題を解決するための手段】
【0018】
このことを達成するために、本発明の第1の目的は、通信ネットワークの中の要素によって提供される情報を利用して診断を判定することができる診断モジュールを含む通信ネットワークの管理のためのシステムである。この診断は、通信ネットワーク内の障害を識別する。この管理システムは、
−診断モジュールから受信された診断に基づいて、1つまたは複数の修正行為を判定し、
−障害を修正するために、修正行為に対応する1つまたは複数のコマンドを通信ネットワークの中の1つまたは複数の要素に送信し、
−診断モジュールによる新たな診断の判定を開始するために、診断要求を診断モジュールに送信するように設計された修復モジュールもまた含むことを特徴とする。
【0019】
本発明の実施形態によって、管理システムは以下の特徴を1つずつ、または組み合わせて有してもよい。
−イテレーションカウンタ(iteration counter)は新たな診断が開始される度に増やされ、管理システムはイテレーションカウンタが所定の閾値に達するとき、診断および修復モジュールを停止する。
−コマンドは、一般言語で公式化されたコマンドを、通信ネットワーク中の異なる機器に特有のコマンド言語を伴う特有のコマンドコンプライアント(compliant)に変換することができる仲介モジュールを通じて送信される。
−修復モジュールは、障害を修正するために修正行為が十分に判定されることが不可能な場合に、通信ネットワークの動作においてこの障害の影響を取り除くか、または制限するために、トラフィック最適化モジュールと通信するように配置される。
−診断モジュールは、診断を判定するためにベイシアンネットワークを使用する。
−診断は少なくとも障害の説明、障害の位置を含み、場合によっては診断に関連した起こりうる事態の予想を含む。
−診断モジュールは、診断を含むSNMPプロトコルを備えたメッセージコンプライアントを修復モジュールに送信する。
−修復モジュールは修復規則のベースを有する。
−規則はイテレーションカウンタに依存してもよい。
−修復モジュールは、各イテレーションで判定された診断履歴と修正行為履歴とを有し、診断が、閾値が到達されるときに所与のイテレーションの間のものと同様に適切ではない場合、通信ネットワークをこの所与のイテレーションの間の状態に戻すことができる。
【0020】
本発明の第2の目的は、通信ネットワークの要素によって提供される情報に基づき診断を判定するための第1ステップを含む通信ネットワークの管理のための方法である。この方法は、診断が障害を識別する場合、障害を修正するために、少なくとも診断に基づいて1つまたは複数の修正行為を判定し、通信ネットワークの1つまたは複数の要素に、これまたはこれらの修正行為に対応する1つまたは複数のコマンド(C)を送信する第2ステップも含み、処理サイクルを形成するために、第2ステップの終了時に第1ステップが自動的に開始されることを特徴とする。
【0021】
本発明の実施形態によって、管理方法は以下の特徴を1つずつか、または組み合わせて含んでもよい。
−イテレーションカウンタは新たな診断が起こされる度に増やされ、このイテレーションカウンタが所定の閾値に達するとき、処理サイクルは中断される。
−コマンドは、一般言語で公式化されたコマンドを、通信ネットワーク中の異なる機器に特有のコマンド言語を伴う特有のコマンドコンプライアントに変換することができる仲介モジュールを通じて送信される。
−コマンドは、障害を十分に修正するために修正行為が判定されることが不可能な場合、通信ネットワークの動作においてこの障害の影響を取り除くか、または制限するために、トラフィック最適化モジュールに送信されてもよい。
−第1ステップは、診断を判定するためにベイシアンネットワークを使用する。
−診断は少なくとも障害の説明、障害の位置を含み、場合によっては診断に関連して起こりうる事態の予想を含む。
−各イテレーションで判定された診断履歴および修正行為履歴が構築され、診断が、閾値が到達されるときにこの前のイテレーションの間のものと同様に適切ではない場合、この前のイテレーションの間の通信ネットワークの状態が回復される。
【0022】
したがって本発明により、修復モジュールは障害の影響を制限するために、および特には通信ネットワーク上のSLA(サービスレベル契約)設定へのそれらの影響を制限するために、通信障害を自動的に修復すること、および/または修正行為を行うことが可能であるか、またはオペレータによる動作確認の後で、これらの修復を半自動化することが可能である。
【0023】
修正の後、診断モジュールは、この修復が新たな障害を生成していないことを保証するため、およびもし障害を生成していれば、それらを順次修正するために、新たな診断を行うことを求められる。したがって、診断された障害を修復することに集中しなければならない処理サイクルが実施されてもよい。
【0024】
閾値は極端に長い修復ループを防ぐために、ループ内のイテレーションの数に対して固定されてもよい。
【0025】
本発明ならびにその特徴および利点は、添付の図面を参照して以下の説明を読んだ後により明らかとなろう。
【0026】
これらの添付の図面は、本発明を制限することなく、本発明の説明を完全なものにするだけではなく、一部の場合では本発明を定義することにも寄与する。
【発明を実施するための最良の形態】
【0027】
本発明によって、ネットワーク管理システムは2つの主要なモジュールを含み、すなわち第1に診断モジュールMDと第2に修復モジュールMRとを含む。
【0028】
診断モジュールへの入力は、カスタマの苦情CCと、ネットワークからの情報Aとから構成される。カスタマの苦情は、ネットワーク性能の低下、またはネットワークで使用されるサービスの低下によって誘発されてもよい。そうした苦情を受信すると、診断システムMDは、この苦情につながる技術的な原因を判定するために、診断検索を起動することができる。次いで、診断システムMDはネットワーク要素からの情報出力を利用することができる。
【0029】
診断検索はまた、通信ネットワーク中の個々の要素(すなわち、存在するカスタマの苦情とは関係なく)からの情報出力によって起動されてもよい。
【0030】
ネットワーク要素からの情報出力は、2つの主要な種類のものであってよい。
・警報、すなわちネットワーク要素によってネットワーク管理システムに送信される非同期の通知。要素によって異常が検出される場合、測定された値が所定の閾値に達する場合、またはより一般的には、その構成のための任意の種類のイベントが、オカレンスが警報を起動すべきであるというものである場合、これらの警報が送信される。したがって、これらの警報は、ソフトウェア、ハードウェアのどちらでも障害を示してもよい。
・警報は、ネットワーク管理システムNMSに通知されていないが、NMSが管理情報ベース(MIB)の中で見つけ出さなければならない構成または性能のデータに関連していてもよい。
・警報は、能動性テスト、能動性測定または受動性測定、および特にはエンドツーエンドの測定を設定するために必要とされてもよい。
【0031】
特に警報の受信において、診断モジュールMDはこれらの警報が障害か、または起こりうる障害を表しているということを判定してもよい。次いで診断モジュールは、そのような判定の後に診断の判定、すなわち障害の検索を起動する。
【0032】
上述のように、障害が起こった場合、障害のあったネットワーク要素からだけではなく、「隣接する」ネットワーク要素からも発せられた警報を誘発してもよい。診断の判定は、複数のネットワーク要素から発せられたこの1組の警報に基づき、障害のあったネットワーク要素を識別すること(トラブルシューティング)と、障害の種類(障害名)を識別することから構成される。一般に、診断は確定的であることは不可能であり、その後診断モジュールMDは最も見込みのある診断Dを提供し、それに確率値を関連付ける。診断モジュールMDはまた、各々が確率値に関連付けられ、各々が通信ネットワークN内の障害を識別する複数の診断のリストも提供することができる。
【0033】
診断モジュールは、現状技術で知られているモジュールであってもよい。上述のようにニューラルネットワーク、エキスパートシステム、規則ベースのシステム等の様々な技術が使用されてもよい。上述の商品は使用されてもよい。
【0034】
診断モジュールMDは、好ましくは2つの基準を遵守する。
・診断モジュールMDは「予防的(proactive)」でなければならず、すなわち診断検索は通信ネットワークからの警報Aの受信以外によって起動されてもよい。特に、診断モジュールMDは、カスタマの苦情CCか、または修復モジュールMRによって送信される診断要求(CD)のいずれかであってもよい外部のイベントによってこの検索を起動することが可能でなければならず、このことは後に説明される。
・診断モジュールMDは最も見込みのある診断を提供することが可能でなければならず、可能な場合には、それについての確率を添付することができなければならない。
【0035】
この診断モジュールは好ましくはベイシアンネットワークを使用し、これはAlcatel社によって製作された「5530−Network Analizer」に類似している。したがって、このモジュールの実装の動作は、「5530」製品の技術文書の中で説明されている。ベイシアンネットワークの技術、および診断の判定のためのその応用は、例えばF.Jensenによる著書「An introduction to Bayesian Networks」、UCL Press、1996、または2004年3月の第3回ネットワーキングについての国際会議でのGerard Delegue、Stephane Betge−Brezetz、Emmanuel Marilly and Olivier Martinotによる論文「IP VPN Network Diagnosis:Technologies and Perspectives」の中で説明されている。
【0036】
ベイシアンネットワークの原理は、証明および背景情報のさらなる要素を考慮に入れて仮定を精錬するための規則を定義する確率の理論を使用するので、したがって、仮定が真である確率の程度を表す数字につながる。
【0037】
したがってベイシアンダイアグラムは、確率、および例えば他のものよりも時間を多く必要とするテストを定義するために使用されるコストに関連して行われるすべてのテスト行為を定義する。
【0038】
図3は、極めて簡略化されたベイシアンダイアグラムの例を示す。この図は、「損失パケット」エンティティが複数のその他のエンティティ、「高CPU利用」率、「インターフェースインステータス」(インタフェース入力ステータス)、「インタフェースアウトステータス」(インタフェース出力ステータス)に依存していることを示す。
【0039】
したがって、このモデルによって、システムは最初に一連の原因を表し、それによってテストが実行されるべきものを示し、次に各々の見込みのある診断に対して確率値を算定し、最も見込みのある診断を判定することができる。
【0040】
実際には、ベイシアンダイアグラムは明らかにもっと複雑であり、複数の階層レベルを含んでいるかもしれない。さらに、ネットワーク要素を形作るために、多くのダイアグラムが必要である。
【0041】
診断Dは一旦判定されると、1つまたは複数のメッセージの形態で修復モジュールMRに送信される。例えば、これらのメッセージは、バージョン1のためのRFC1157およびバージョン2のためのRFC1592の中でIETF(インターネット技術特別調査委員会)によって定義されるSNMP(シンプルネットワーク管理プロトコル)プロトコルを伴うコンプライアントであってもよい。
【0042】
診断Dは単一のSNMPメッセージ(または「トラップ」)か、または複数のメッセージであってもよい。複数のメッセージが使用される場合、修復モジュールMRが同一の診断Dに関連するものを簡単に判定できるように、複数のメッセージは明確に識別されなければならない。1つの実施形態によって、第1メッセージは診断についての一般的な情報を含む一方で、次に続くメッセージは詳細な情報を含む。例えば、診断がLSP(ラベルスイッチングポイント)に関連している場合、第1メッセージはLSPそのものについての診断情報を含んでよい一方で、その後のメッセージはLSPが通過する機器(またはルータ)についての情報を含む。
【0043】
この判定は、後に説明されるチケットを使用して行われてよく、すなわち同一の診断Dを運搬するすべてのSNMPメッセージは同一のチケットを有することになる。
【0044】
しかしながらその他の実施形態が可能であり、特に2つのモジュールは、OMG(オープン管理グループ)によって定義されたようなCORBA(共通オブジェクトリクエストブローカアーキテクチャ)型のソフトウェアバスか、またはMicrosoft社によるCOM/DCOMを通じて通信してもよい。
【0045】
このメッセージDは、好ましくは以下の情報を含む。
・診断された障害のタイトル。例えば「インタフェースのダウン」「BGP(ボーダゲートウェイプロトコル)構成の不良」等。
・障害の位置、すなわち関連するネットワーク要素、カード、インタフェース、仮想プライベートネットワーク(VPN)等の識別子。
・確立された診断が考慮されなければならない信頼度を判定する確率値。
・チケット、すなわち所与の問題に対する正しい診断のための検索セッションを識別する数。上述のように、同一の診断が複数のメッセージによって運搬される場合、これらのメッセージの各々は、特に情報量が非常に多いことから同一のチケットを有することになる。
・所与のチケットに対する診断検索のオカレンスの数を識別するイテレーション数。複数のイテレーションが問題への解決法に達することを必要としてもよいように、問題は診断モジュールMDと修復モジュールMRとの間でループを作ることができることが後に明らかにされる。
【0046】
以下の表は、SNMPプロトコルに基づく実装の場合の「SNMPトラップ」の例を示す。
【表1】

【0047】
これらのOIDファイル(SNMPオブジェクト識別子)は、Alcatel識別子に対応する左の部分(1.3.6.1.4.1.637.)、アプリケーション(すなわち診断モジュールMD)に対応する次の部分(4.)、および「SNMPトラップ」中のフィールドに特有の属性に対応する最後の部分の3つの部分から構成されている。
【0048】
診断Dを含むメッセージを受信すると、修復モジュールDは1つまたは複数の修正行為を判定しようとする。
【0049】
図2は修復モジュールMRの1つの可能な機能構造を示す。この構造は機能的なものなので、異なる実施形態が可能である。この実施形態によって、修復モジュールMRは主モジュールMP、マンマシンインタフェースIHM、データベースBおよび構成モジュールMCを含む。
【0050】
診断Dは主モジュールMPによって受信され、その目的は修正行為を判定し、これらの修正行為に対応したコマンドを仲介モジュールMEDに送信するか、または図示されていないネットワーク要素に直接送信することである。
【0051】
したがって、判定は診断D、および診断Dに含まれている先に明らかにされた情報から行われる。しかしながら判定は、以下のようなその他の情報に依存するものであってもよい。
−内部論理、すなわち少なくとも1つの診断に基づいて修正行為を判定するための方針の特定の言語での公式定義。この内部論理はデータベースBの中に記憶される。
−特にIHMインタフェースおよび構成モジュールMCを使用してユーザによって判定され、データベースBの中に(または場合によっては他の独立のデータベースの中に)記憶されるパラメータ。
−特に主モジュールMPによる提案に応じて、診断の生成の間にIHMインタフェースを通じてユーザによって送信される情報。
【0052】
本発明の1つの好ましい実施形態によって、内部論理は1組の規則の形態で公式に定義される。
【0053】
これらの規則は、診断モジュールMDから受信されてもよい診断Dを修正行為に関連させるために使用される。これらの規則は、構成モジュールMCおよびIHMインタフェースを通じてベースBに入力されてもよい。
【0054】
これらの規則は典型的には以下の形式すなわち、
IF premises THEN actions
で表現されてよく、ここでの「premises」は、行為が起動されるために満たされなければならない条件のリストである。このリストは、(AND論理オペレータによって)共同で互いに関連付けられているか、または(OR論理オペレータによって)分離的に互いに関連付けられた複数の条件を含んでもよい。
【0055】
例えば、そのような規則は以下のように記述されてもよい。
○If(Router=Alcatel/192.128.12.52、Interface=FastEthernet1/0)&&((Iteration=1)<3)&&(Failure=INTERFACE_DOWN)Then(Execute Corrective Action2).
○If(Router=Alcatel/192.128.12.52、Interface=FastEthernet1/0)&&((Iteration=1)<3)&&(Failure=BGP_MISCONFIGURATION)Then(Execute Corrective Action3).
○(Corrective Action2)=Put(Router=Cisco/192.128.12.52、Interface=FastEthernet1/0)Interface Up.
○(Corrective Action3)=Configure(Router=Alcatel/192.128.12.52、 Interface=FastEthernet1/0)With BGP_Configuration_Script_1
【0056】
修正行為が直接に、場合によっては仲介モジュールMEDを通じて、通信ネットワークの要素に送信されることが可能であるのかどうか、またはそれらの有効性をオペレータが確認しなければならないのかどうかを明示するために、指標はこれらの規則の公式定義に関連しているか、またはパラメータの中でこれらの規則に関連していてもよい。オペレータが有効性を確認しなければならない場合、修正行為はスクリーン上に表示されるために、マンマシンインタフェースIHMに送信される。これらの指標はマンマシンインタフェースIHMを通じてオペレータにアクセスすることができる構成モジュールMCを使用して、ベースBの中に記憶されてもよい。
【0057】
これらの修正行為の他に、特に診断モジュールMDによって送信された診断Dに関する情報など、オペレータの決断を助けるためのその他の情報が表示されてもよい。
【0058】
次にオペレータは、修復モジュールMRがコマンドCをネットワーク要素に送信する前に、修復モジュールからの提案の有効性を確認することができる。
【0059】
複数の修正行為が可能な状況では、IHMインタフェースはそれらをスクリーン上に表示することが可能であり、続いてユーザは最も適切と思われるものは何でも選択することができる。次いで、修復モジュールMRはオペレータによって選択された修正行為に対応するコマンドCを、通信ネットワーク中の要素に送信する。
【0060】
規則に基づいた好ましい実施形態以外の実施形態もまた可能である。
【0061】
例えば、ベイシアンネットワークまたはニューラルネットワークが使用されることが可能である。ニューラルネットワークを使用することの利点はその学習能力、および不確かな状況の中で機能する能力である。例えば、ニューラルネットワークは、たとえ一定量の情報が失われている場合であっても、最も見込みのある修正行為を最も起こりうる障害に適用することができてもよい。しかしながらその問題点は、本願出願時に、通信ネットワークのオペレータがそうした技術を理解することの難しさである。
【0062】
上述のように、コマンドCは仲介モジュールMEDを通じて通信ネットワークN中の要素に送信されてもよい。この仲介モジュールの目的は、修復モジュールMRによって一般言語で公式化されたコマンドCを、通信ネットワーク中の様々な機器に特有のコマンド言語を伴う特有のコマンドC、Cのコンプライアントに変換することである。
【0063】
ゆえに図1の機器NとNとは、この通信ネットワークNを不図示の別のネットワークに接続するために、例えばIPルータとメディアゲートウェイなどの異なる種類の機器であってもよい。機器はまた、同様の種類であるが異なる供給業者によって作られた機器であってもよい。いずれの場合でも、それらを構成するために使用されるコマンドは、その機器によって理解されるコマンド言語に適したものでなければならない。したがって、単一の一般コマンドC(例えば「インタフェースをオープンしなさい」等)は2種類の機器NとNとのための異なった特有のコマンドにつながり、これらの特有のコマンドの各々は機器に特有の言語、特にそれらのCLI(コマンドラインインタフェース)インタフェースに準拠している。
【0064】
この仲介モジュールMEDを製作するために、異なる製品および技術が使用されてもよい。
【0065】
特に、方針規則に基づく管理構造(「方針に基づく管理」のためのPBM)が使用されてもよい。そのような構造は、例えば特許出願EP1335524号「Deployment of rules by a service management device as a function of information on network equipment」、および特許出願EP1387526号「Rule−based network management system comprising an inference motor」で説明されている。
【0066】
したがって、修正行為の判定によって、本発明による修復モジュールMRは通信ネットワークの修復を自動化することができ、またはオペレータの行為が求められる場合には半自動化することができる。
【0067】
しかしながら、通信ネットワークの複雑な点は、修正行為の影響を完全に制御することは実質的に不可能であるということである。第1に(例えば診断が間違っていたため、または同じく修正行為が完全には適切ではなかったために)修復は問題を解決するのに効果的ではないことが判明する場合があり、第2に障害の実際の修復が新たな障害を生み出し得るという可能性もある。例えば第1の障害を修復する中で、以前は隔離されていたネットワーク要素へのトラフィックの伝達が可能にされ、そうなることで、これらのネットワーク要素の中で障害が識別されるかもしれない。
【0068】
したがって出願人は、通信ネットワークへの不適当または望ましくない影響を最小化するというさらなる技術的問題を考慮した。このために、通信ネットワーク中の要素へのコマンドCの送信の後、診断モジュールが新たな診断を判定できるように、診断要求CDは診断モジュールMDに送信される。
【0069】
この診断要求CDは、この新たな診断(および任意のその後の診断)が同じチケットによって判定されたセッション内の第1診断に関連付けられるように、チケットの値を含んでもよい。
【0070】
この診断モジュールMDへのループバックによって、診断モジュールは障害の修正を確認し、新たな障害が起こり得るかどうかを検出することができる。次いで、診断モジュールは修復モジュールMRその他を通じて、新たな修復作業を起動することができる。したがって、本発明のこの好ましい実施形態は、管理された通信ネットワーク上で行われる行為を制御するためのループを作るために使用されることが可能である。
【0071】
しかしながらこの実施形態は、無限ループを作り出すというさらなる問題を生じさせるかもしれず、すなわち各修復は新たな障害を循環的に生み出すことになる。
【0072】
これらの無限ループを防ぐために、イテレーションカウンタが使用されることが可能である。例えば、このイテレーションカウンタは新たな診断が起こされる度に増やされる。このイテレーションカウンタが所与の事前に定義された閾値に達するとき、ループは停止され、システムはIHMインタフェースを通じてオペレータに解決法が見つからなかったことを通知することができる。
【0073】
同様に当業者のために、カウンタはこの閾値で初期化され、新たな診断が起こされる度に減らされてもよい。そのときの停止基準は、このイテレーションカウンタが0を通過することである。
【0074】
本発明の1つの実施形態によって、このイテレーションカウンタは修復モジュールの内部論理に影響を及ぼすことができる。例えば、この内部論理が1組の規則の形態で実施されるという状況では、これらの規則はイテレーションカウンタの値に依存してもよい。
【0075】
オペレータは自分が定める制約の機能として、これらの従属関係を設定することができる。例えば、オペレータは重要ではないLSP上で(特に、後に説明されるように、結果として生じるコストがトラフィック最適化モジュールを起動するコストよりも低いために)、高いイテレーション閾値と関連することができる。大きなペナルティを伴うLSAの存在する非常に重要なLSPのために、イテレーション閾値は非常に低いものであることが可能であり、オペレータの主な目的は、トラフィック最適化モジュールが起動されなければならない場合でも、サービスを維持することである。
【0076】
最終的に、診断が通信ネットワーク上で所与の時点の問題よりもより深刻な問題に関連する場合、このネットワーク構成に戻すためにバックトラッキング機構が使用されることが可能である。修復モジュールはこの目的のために、修正行為および/または送信されたコマンドおよび受信された診断の履歴を含む。閾値が到達されたときの新たな診断が、前のイテレーションの間のものよりも悪い場合、次いで修復モジュールはこのイテレーションに対応する状態にネットワークを戻すために、この履歴を使用することができる。次いで必要なものは、この前の状況を回復するために逆コマンドを送信することがすべてである。
【0077】
障害が真に解決されない場合、この実施形態はネットワークの状態を改善するための妥協案を可能にする。
【0078】
そのようなバックトラッキングの後、問題が解決されなかったこととネットワークの状況とをオペレータに通知するために、マンマシンインタフェースIHMを通じてオペレータにメッセージが送信される。
【0079】
その他の実施形態によって、診断モジュールが問題を解決できない場合、トラフィックエンジニアリングTE最適化モジュールが使用されてもよい。このトラフィック最適化モジュールの目的は、真に問題を解決するのではなく、問題を回避するためにトラフィックを向け直すことである。ゆえに、問題がルータ内で解決されることが不可能な場合(例えばハードウェアの問題)、TEモジュールは他のルータ上のルーティングテーブル、このルータを通過するLSPなどを変更して、このルータにこれ以上トラフィックが送信されないようにすることができる。ゆえに、ネットワーク動作は問題となっている機器が動作不能のままであっても、完全に動作可能となってもよい。
【0080】
要約すると、障害を識別する診断は、障害が修復されるか、または障害は修復されずオペレータに知らされるか、または障害は修復されないがトラフィック最適化ツールが起動されるか、または修復モジュールMRがバックトラッキング機能を使用してネットワークを「より」悪くない状態にしてオペレータに通知するかの4つの結論のうちの1つを有することができる。
【0081】
図3は、本発明による方法におけるステップの実施を概略的に示す。
【0082】
第1の「Diag」ステップは、診断の判定を起動することから構成されている。このステップは、特に通信ネットワーク内の警報またはカスタマの苦情の受信後に起動される。
【0083】
次いで、システムは診断が障害を識別するかどうかを判定する(枠「P?」)。障害がなければ方法は停止する(枠「F1」)。
【0084】
障害がある場合、方法はいくつかの停止基準を判定することから構成される(「停止?」)。目的は、イテレーションの数が所定の閾値に到達したかどうか、または診断が、前のイテレーションの間に予め作成されていた診断に対応しているかどうかを判定することである。これらの停止基準が満たされる場合、システムは停止する(枠「F2」)。
【0085】
停止基準が満たされない場合、方法は修正行為を判定することと、これらの修正行為に関連するコマンドを通信ネットワークに送信することから構成される「Rep」ステップを使用する。
【0086】
本発明の1つの好ましい実施形態で、続いて新たな「Diag」診断ステップが起動され、その後方法は上述の異なるステップおよびテストを通過する。
【0087】
次いで方法は、「P?」テストの間の障害の解決、または「停止?」テストの間の停止基準の充足によって終了されることが可能な処理サイクルを形成する。
【0088】
本発明および異なるステップの連鎖は、以下の3つの特定の例を読んだ後により明らかとなろう。
【0089】
これらの例の各々で、診断モジュールは通信ネットワークからの警報の受信、またはカスタマの苦情によって動作に入る。
【0090】
第1の例で、カスタマの苦情CC、または通信ネットワークから受信された警報Aは、このネットワーク内の問題を示している。第1の診断は、ルータYのインタフェースXがダウンしていることを明らかにする。診断モジュールMDは、チケット値およびイテレーション値1とともに、この診断を修復モジュールに送信する。
【0091】
次いで、修復モジュールMRはこの診断に関連した修正行為を判定する。この実施例の中で、修正行為はインタフェースXをサービス(「アップ」)に戻すことである。この修正行為に関連する一般コマンドは、ルータYに特有の言語での適切なコマンドを判定する仲介モジュールMEDに送信される。
【0092】
修復モジュールMRは診断要求CDを診断モジュールMDに送信し、同じチケット値を特定する。
【0093】
診断モジュールMDは通信ネットワークの診断を繰り返し、ルータYのインタフェースXが現在アップしており、ネットワークが通常に動作していることを判定する。次いで診断モジュールMDは、ネットワークが通常に動作していることを通知するために、診断Dを修復モジュールに送信することができる。次いで問題は解決されたので、修復モジュールMRはいかなる行為も起動することはなく、本発明による方法は終了する。
【0094】
第2の例で、診断モジュールはまた、ルータYのインタフェースXがダウンしていることを判定する。第1の例と同様に、診断Dはチケットとともに修復モジュールに送信され、修復モジュールMRは修正行為を判定する。この修正行為に関連する一般コマンドは、このコマンドをルータYの特定の言語を伴うコマンドコンプライアントに変換する仲介モジュールMEDに送信される。
【0095】
修復モジュールMRは、同じチケットとともに、診断要求CDを診断モジュールMDに送信する。診断モジュールMDは新たな診断判定を開始する。新たな診断Dは、ルータYのインタフェースXが依然としてダウンしていることを判定する。この診断Dは、同じチケット値、および2に等しいイテレーション値とともに、修復モジュールMRに送信される。
【0096】
修復モジュールMRは、イテレーションは2に等しいが、問題は同じままであるということを認めてもよい。次いで修復モジュールMRは、トラフィック最適化モジュールTE(トラフィックエンジニアリング)にコマンドを送信することを決定してもよい。
【0097】
次いで、このトラフィックエンジニアリングモジュールTEは、通信ネットワークの中の既存の経路を変更して、それらがルータYのインタフェースXを回避するようにすることが可能である。このように、問題となっているインタフェースがダウンしていても、通信ネットワークは通常通りに動作することが可能である。
【0098】
第3の例で、診断モジュールMDはまた、ルータYのインタフェースXがダウンしていることを判定する。診断Dはチケット数および1に等しいイテレーション値とともに、修復モジュールに送信される。
【0099】
上述のように、修復モジュールは、インタフェースXがサービス(「アップ」)になるように、一般コマンドが、それをルータYに特有の言語を伴うコマンドコンプライアントに変換する仲介モジュールMEDに送信されることを判定する。
【0100】
修復モジュールMRは、同じチケット数とともに、診断要求CDを診断モジュールMDに送信する。
【0101】
次いで、診断モジュールは新たな診断判定を起動し、例えばBGP(ボーダゲートウェイプロトコル)の構成不良などの新たな問題が見つけ出される。この診断Dは、2に等しいイテレーション数、および同じチケット値とともに、修理モジュールに送信される。
【0102】
次いで修復モジュールMRは、この場合BGPプロトコルを再構成することであってもよい適切な修正行為を判定する。次いで一般コマンドは、このコマンドを特定のコマンドに変換する仲介モジュールMEDに送信される。
【0103】
再び修復モジュールMRは診断モジュールMDに診断要求CDを送信し、同じチケット数を特定する。新たな診断Dは、ルータYの同じインタフェースXがダウンしていることを示す。この診断Dは3に等しいイテレーション値、および依然として同じチケット値とともに、修復モジュールMRに送信される。
【0104】
修復モジュールは、イテレーション値が3に等しく、診断がイテレーションが1のときと同じであることを認めてもよい。次いで修復モジュールは、問題が解決できないことを判定し、この不可能性および診断についての情報を表すメッセージを表示するマンマシンインタフェースIHMにコマンドを送信することができる。
【0105】
これらの実施例は本発明の異なる動作方式を示しており、特には、例えばオペレータに通知する、トラフィック最適化モジュールを起動する、修復コマンドを起動する等のために、規則ベースBを構成することによって、本発明による修復モジュールMRを違った風に動作させることができるということを示している。
【図面の簡単な説明】
【0106】
【図1】本発明による管理システムを概略的に示す図である。
【図2】本発明の1つの実施形態による修復モジュールの内部構造を示す図である。
【図3】本発明による方法のステップの連鎖を示す図である。

【特許請求の範囲】
【請求項1】
通信ネットワーク(N)の要素(N、N、N、N)によって提供される情報(A)に基づき診断(D)を判定することができる診断モジュール(MD)を含む前記通信ネットワークのための管理システム(NMS)であって、前記診断が前記通信ネットワーク内の障害を識別し、前記システムが、前記診断モジュール(MD)から受信された少なくとも前記診断に基づき1つまたは複数の修正行為を判定し、前記障害を修正するために前記修正行為に対応する1つまたは複数のコマンド(C)を前記通信ネットワークの1つまたは複数の要素に送信し、前記診断モジュールによる新たな診断の判定を起動するために診断要求(CD)を診断モジュール(MD)に送信するように設計された修復モジュール(MR)も含むことを特徴とする、管理システム。
【請求項2】
イテレーションカウンタが新たな診断が起動される度に増やされ、前記イテレーションカウンタが所定の閾値に到達する場合、前記管理システムが診断モジュールと修復モジュールとを停止する、請求項1に記載の管理システム。
【請求項3】
コマンドが、一般言語で公式化された前記コマンドを、前記通信ネットワーク中の異なる機器に特有のコマンド言語を伴う特有のコマンド(C、C)コンプライアントに変換することができる仲介モジュール(MED)を通じて送信される、請求項1または2のいずれか一項に記載の管理システム。
【請求項4】
修復モジュール(MR)が、各イテレーションで判定された診断履歴と修正行為履歴とを有し、診断が、前記閾値が到達されるときに所与のイテレーションの間のものと同様に適切ではない場合、通信ネットワークを前記所与のイテレーションの間の状態に戻すことができる、請求項2または3の一項に記載の管理システム。
【請求項5】
前記修復モジュールが、前記障害を修正するために修正行為が十分に判定されることが不可能な場合に、前記通信ネットワークの動作において前記障害の影響を取り除くか、または制限するために、トラフィック最適化モジュール(TE)と通信するようにも設計される、請求項1から4のいずれか一項に記載の管理システム。
【請求項6】
前記診断モジュール(MD)が、前記診断を判定するためにベイシアンネットワークを使用する、請求項1から5のいずれか一項に記載の管理システム。
【請求項7】
前記診断(D)が少なくとも前記障害の説明、前記障害の位置を含み、場合によっては前記診断に関連して起こりうる事態の予想を含む、請求項1から6のいずれか一項に記載の管理システム。
【請求項8】
前記診断モジュールが、SNMPプロトコルを伴うメッセージコンプライアントを使用して、前記診断を前記修復モジュールに通信する、請求項1から7のいずれか一項に記載の管理システム。
【請求項9】
前記修復モジュールが修復規則ベースを有する、請求項1から8の一項に記載の管理システム。
【請求項10】
前記規則が前記イテレーションカウンタに依存してもよい、請求項9および2に記載の管理システム。
【請求項11】
通信ネットワーク(N)の要素(N、N、N、N)によって提供される情報(A)に基づき診断(D)を判定するための第1ステップを含む前記通信ネットワークの管理方法であって、前記診断が障害を識別する場合、少なくとも前記診断に基づいて1つまたは複数の修正行為を判定し、前記障害を修正するためにこの(これらの)修正行為に対応する1つまたは複数のコマンド(C)を前記通信ネットワークの1つまたは複数の要素に送信するための第2ステップも含むことと、処理サイクルを形成するために、前記第1ステップが前記第2ステップの終了時に自動的に起動されることとを特徴とする、管理方法。
【請求項12】
イテレーションカウンタが新たな診断が起動される度に増やされ、前記イテレーションカウンタが所定の閾値に到達する場合、前記処理サイクルが停止する、請求項11に記載の方法。
【請求項13】
各イテレーションで判定された診断履歴と修正行為履歴とが形成され、通信ネットワークは、診断が、前記閾値が到達されるときに以前のイテレーションの間のものと同様に適切ではない場合、以前のイテレーションの間の状態に戻される、請求項12に記載の方法。
【請求項14】
コマンドが、一般言語で公式化された前記コマンドを、前記通信ネットワーク中の異なる機器に特有のコマンド言語を伴う特有のコマンドコンプライアントに変換することができる仲介モジュール(MED)を通じて送信される、請求項11から13の一項に記載の方法。
【請求項15】
コマンドが、前記障害を修正するために修正行為が十分に判定されることが不可能な場合、前記通信ネットワークの動作において前記障害の影響を取り除くか、または制限するために、トラフィック最適化モジュール(TE)に送信されてもよい、請求項11から14の一項に記載の方法。
【請求項16】
前記第1ステップは前記診断を判定するためにベイシアンネットワークを使用する請求項11から15の一項に記載の方法。
【請求項17】
前記診断(D)が少なくとも前記障害の説明、前記障害の位置を含み、場合によっては前記診断に関連する起こりうる事態の予想を含む、請求項11から16の一項に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公表番号】特表2008−508760(P2008−508760A)
【公表日】平成20年3月21日(2008.3.21)
【国際特許分類】
【出願番号】特願2007−523126(P2007−523126)
【出願日】平成17年7月1日(2005.7.1)
【国際出願番号】PCT/FR2005/050530
【国際公開番号】WO2006/021702
【国際公開日】平成18年3月2日(2006.3.2)
【出願人】(506417289)
【Fターム(参考)】