遠隔通信システムにおけるサービス影響の分析およびアラートの処理
サービス品質(QoS)アラートの優先順位付け、およびサービスに対するこうしたアラートの影響の分析のためのシステムは、サービスが1つまたは複数のサービスコンポーネントおよびサブコンポーネントに分割されるサービスモデルを使用する。サービスの異なる相によって動かされるサービス依存関係モデルの作成は、サービス全体の1コンポーネントに過ぎない最下位のネットワークコンポーネントでのアラートが、サービス全体にどのように影響を与えるかを理解できるようになる上で重要である。アラートには「ハンドル」および重大度レベルが割り当てられる。ハンドルを含む各コンポーネントに対するコンポーネント状況インジケータを作成するために、アラートに適用される規則が定義される。各CSIがサービスモデル依存関係グラフのトップに向かって上方に伝搬されるにつれて、各CSIは事前に定義された規則に従って修正される。CSIがトップのサービスコンポーネントに伝搬される際に、サービス影響インデックスが作成される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遠隔通信システムにおけるアラームを含むアラート(alert)のサービス品質の処理および分析に関する。より具体的に言えば、本発明は、無線遠隔通信システムにおけるアラートのサービス品質(QoS)の優先順位付けおよびこうしたアラートの影響分析のための方法に関する。この方法は、アラート、特に最高優先順位のアラームの根本原因の分析も提供する。
【背景技術】
【0002】
TDMA、CDMA、またはGSMに基づくセルラシステム、あるいはGPRSに基づく2.5Gネットワークなどの遠隔通信システムにおいて、サービスプロバイダはこれまでにも増して高いサービス品質を提供するための競争にさらされている。多くの異なる遠隔通信サービス、特に多くの新しい無線サービスが登場するにつれて、サービス保証の問題はますます困難になりつつある。現在のネットワークオペレーションセンタ(NOC)では、何百何千もの様々な形の様々なアラート、警告、およびアラームを受信することは珍しくない。トラブルシューティングおよび問題解決を担当するNOCの職員は、通常、高度な訓練を受けたある特定の技術分野を専門とする技術者である。従来から、NOCグループは、アプリケーションおよび内部IPネットワークを管理する情報技術(IT)組織とは別のものである。あるドメイン内で発生した問題は、通常、他のドメインからの影響を考慮して処理されることはない。特に、QoS問題の優先順位付けまたは根本原因の分析に適した方法または手順はない。
【0003】
現在のサービス管理は、隔離されたネットワーク管理システムおよび情報技術(IT)ベースの管理環境からなる。ネットワーク管理タスクは、大量の性能データの収集、週間または月間レポートの生成、および大量のイベントおよびアラームのログ記録からなる。主にデータは、いくつかの互いに素の要素管理システム(EMS)によって、または場合によっては個々のネットワーク要素(NE)によって生成される。サービスおよびアプリケーションの領域では、サーバおよびLAN関係のアラームおよびイベントを監視およびログ記録する場合、Hewlett−Packard社のOpenview、Computer Associates社のUnicenter、またはIBM社のTivoliなどの、従来のIT管理プラットフォームが一般的である。しかしながら、これらのITベースの管理プラットフォームと他のEMSとの間には、何の相関関係もない。隔離されたそれぞれのドメインに対して、特定のドメイン(アプリケーション、コア、アクセス)を担当する職員によって、真のサービス管理が実行される。通常、異なるドメインは、異なる組織によって処理され、これらの組織は互いにほとんど対話することなく独立して運営される。サービス品質についての統合および相関された見解はなく、サービス保証または長期計画に対して一貫した努力が払われることはない。
【0004】
2G、2.5、または3Gのセルラ技術、あるいは802.11 WiFiベースシステムなどの無線LAN(WLAN)技術といった無線技術への依存度が高まるにつれて、サービスの問題はますます複雑さを増していく。ボトムアップサービス保証システムは、様々なネットワーク要素またはサブシステムからデータを収集することに焦点を置いており、顧客の満足を満たすように顧客が望む様々なサービスが実際に提供されているかどうかには焦点が置かれていない。
【0005】
影響分析の全体的な目標は、ある事前に定義されたサービスレベル基準に対してサービス品質の低下を定量化することである。その後、こうした影響分析の結果を使用して、サービスおよびネットワークアラーム、サービスQoSアラート、ならびにネットワーク性能しきい値超過(crossing)アラートまたは問題のあるチケット生成に関した他の性能影響イベントの、優先順位付けをサポートすることができる。加えて、ネットワークおよびサービスリソース拡張の優先順位付けをサポートするため、またはマーケティングおよび契約目的でのサービスレベル合意の調整のために、この結果を使用することもできる。
【発明の開示】
【発明が解決しようとする課題】
【0006】
無線サービスが激増するにつれて、またそれぞれのライフサイクルが短くなるにつれて、適切な技術を備えたNOCオペレータを訓練して様々なタイプのサービス関連QoS問題を処理できるようにすることは、ますます困難になってきている。NOC職員のQoSアラームの優先順位付けを支援するためには、アラートに関する関連情報を収集および抽出し、顧客に対する影響、サービス品質、ならびにマーケティングおよびプランニングなどの他の基準に対してそれらを優先順位付けするためのツールがあることが望ましい。
【0007】
サービスのそれぞれのコンポーネント(構成要素)について、関連付けられたキー性能インジケータ(KPI)のセットがある。サービスモデルが40のコンポーネントを有し、それぞれが30のKPIを有すると想定すると、サービスには合計で1200のKPIが存在することになる。同時に20のサービスが活動状態にある場合、潜在的に20,000を超えるKPIを扱う可能性がある。所与の時点でKPIの1%がしきい値を超過し、所与の時点で200を超えるQoSアラートを生成すると想定してみる。KPIの量およびそれらのアラートに加えて、特定のKPIに特有のアルゴリズムを作成することも困難である。したがって影響分析アルゴリズムは、スケーラビリティおよび複雑さの問題に同時に対処しなければならない。
【0008】
さらに、何らかの定量的な影響インデックスに対して、QoSアラームの系統的な優先順位付けを可能にする方法およびシステムを有することが望ましい。
【0009】
加えて、アラートの影響を優先順位付けおよび分析するためのサービスの依存関係モデルを使用するシステムおよび方法を有することが望ましい。
【0010】
大規模ネットワークに関する影響分析を提供することが可能であり、スケーラビリティの問題に悩まされることのない、方法およびシステムを有することも望ましい。
【0011】
最終的に、アラートの優先順位付けおよびサービス影響の分析システムによって識別された、サービス影響アラートの根本原因分析において、ネットワークオペレータを支援することのできる方法およびシステムを有することが望ましい。
【0012】
本発明は、このような状況に鑑みてなされたもので、その目的とするところは、遠隔通信システムにおけるサービス影響の分析およびアラートの処理のための方法及びシステムを提供することにある。
【課題を解決するための手段】
【0013】
本発明は、遠隔通信ネットワーク、特に無線ネットワークにおいて、アラームを優先順位付けするための方法およびシステムを提供する。QoSアラートまたはアラームが受信され、優先順位インデックスを生成するためにアルゴリズムが使用される。アラートとは、特定の物理コンポーネントの障害によって引き起こされるハード障害アラーム、および所定のしきい値を超過する1つまたは複数の性能または他のインジケータの結果として発行されるアラートの、両方を指す。優先順位付けは、QoSアラートによって影響を受けるサービス、各サービスが影響を受ける範囲、およびサービスの顧客への影響を識別する。
【0014】
本発明の方法およびシステムは、影響を受けるサービスを識別すること、キー品質インジケータ、サービス影響インデックス(SII)、および低下の重大度(割込み合計、割込みの持続時間、性能低下、およびデータ転送正確度)に基づいてサービス品質影響を判定することにより、これらの問題に対処する。システムは、影響を受ける加入者数(特別顧客および正規顧客の割合)も判定する。システムおよび方法は、この情報を利用してそれらに重み付けするための規則セットを適用し、最終的な優先順位インデックスを作成する。
【0015】
サービスモデルは最初に、サービスレベルおよびネットワークレベルのコンポーネントの依存関係を捕らえる、グラフ構造で構築される。このサービス依存関係モデルは、QoSキー性能インジケータ(KPI)の相関関係に関する基本フレームワークを提供する。コンポーネント状況インジケータ(CSI)を作成するために、各コンポーネントのうちのアラートが出されたKPIに規則セットが適用される。CSIは、アラートの原因に関する情報を指定する1つまたは複数のハンドルを含む。CSIがサービスコンポーネントに向かって伝搬される際に、追加のCSI情報を使用して現在のCSIが修正される。CSIは最終的に、サービス影響インデックス(SII)に関して影響を取り込む、重みセットにマッピングされることになる。その後SIIは、影響を受けたサービスの数、加入者の数、QoSクラス、およびアラートの持続時間を含む、他のパラメータで重み付けされる。最終的な優先順位付けは、各CSIに関して影響インデックス全体をソートすることによって達成される。ネットワークオペレータは、CSIのハンドルに含まれる情報を使用して根本原因を分析することが可能であり、これがアラートの原因となる問題の診断および矯正に役立つ。
【発明を実施するための最良の形態】
【0016】
優先順位付けのシステムおよび方法を説明するために、第1に、サービスを記述するためのサービスモデルについて説明する。サービスとは、ネットワークオペレータによって彼らの顧客に販売される製品のことである。エンドツーエンドサービスとは、エンドユーザ顧客が体験する、完全なラウンドトリップの対話またはセッションのことである。
【0017】
サービスは、サブサービスまたはドメインの組み合わせとみなすことができる。サービスは、様々なベアラサービスおよび情報サービス、ならびに顧客またはサービス特有のリンクを含むことができる。電子メール、ショートメッセージングサービス(SMS)、またはマルチメディアメッセージングサービス(MMS)などの格納(または送達)および転送サービスの場合、1つのラウンドトリップのエンドツーエンド対話の代わりに、送達および転送という2つの別々の対話が存在する。エンドツーエンドサービスを提供するために様々なサブサービスが対話可能である。階層化方式には、基礎となるネットワーク、ベアラサービス、1つまたは複数の情報サービス、ならびにサービス間およびサービス内ベアラが含まれる。
【0018】
サービスモデルは、サービスインベントリに関する共通のリポジトリおよびリファレンス、サービスおよびサブサービス、ならびにそれらのコンポーネントを、オペレータに提供するために使用される。サービスモデルは、サービスレベル合意(SLA)、キー性能インジケータ(KPI)、キー品質インジケータ(KQI)、および全体サービスインデックス(SI)を定義およびカスタマイズするための手段を提供する。
【0019】
キー性能インジケータ(KPI)は、無線GSMベースのセルラシステムで利用可能なタイムスロットの数などの、ネットワークコンポーネントからの下位パラメータである。
【0020】
キー品質インジケータ(KQI)は、たとえば、ある期間にわたって使用不可なGSMシステムにおける基地局の割合などの、サービス品質を示すパラメータである。KQIは1つまたは複数のKPIに基づくものである。
【0021】
サービスインデックス(SI)は、サービスの全体性能を示すように全体のサービス品質を要約するものである。SI、KQI、およびKPIが、品質インジケータの階層を形成する。SIは、KQIの重み付け合計によって算出される。
【0022】
サービスモデルの基本構築ブロックがサービスコンポーネントである。サービスコンポーネントとは、サービス品質に影響を与える論理エンティティのことである。サービスのモデル化は、サービスの相(phase)(たとえば、認証相またはデータ転送相)あるいはサービスのトポロジに基づく分解によって実行可能である。サービスは、顧客向き(customer−facing)またはサービスおよびネットワークの層などの、いくつかのカテゴリに分解することができる。非周期多重接続有向グラフである依存関係グラフでは、コンポーネントは互いに関連付けられている。依存関係グラフにおいて、コンポーネントAとBの間の各有向縁部は、AとBの間の依存関係を表す。Aの性能はBの性能に依存し、すなわちBの性能はAの性能に影響を与える。
【0023】
顧客向きコンポーネントとは、サービス品質要件が内部および外部の両方で顧客とのサービスレベル合意(SLA)の一部である、サービスコンポーネントである。各顧客向きコンポーネントは監視および保証可能であり、それぞれが関連付けられたSLAを潜在的に有する。サービスの一例がVOIPであり、ここでは顧客向きコンポーネントは「呼び出しセットアップ」および「データ転送」である。この場合、呼び出しセットアップは、データ転送用と同じかまたは異なるサービスコンポーネントを使用することができる。顧客向きサービスコンポーネントは、サービスコンポーネントを顧客への転送/ベアラネットワークと組み合わせるものであり、たとえば電子メール/WAP/GPRSサービスは、WAPおよび電子メールサービスコンポーネント、DNS、DHCP、および他のセットアップサービスコンポーネント、顧客へのGPRSベアラネットワーク、サービスベアラ間ネットワーク、ならびに、顧客ハンドセットまたは移動局上のWAPおよび電子メールクライアントアプリケーションを組み合わせる。この組み合わせは、顧客向きコンポーネントとサポートしているサービスおよびネットワークコンポーネントとの間に依存関係を作成することによって実施される。言い換えれば、電子メール/WAP/GPRSサービスは、電子メールサービスコンポーネント、GPRSベアラコンポーネント、DHCPサービスコンポーネントなどに依存する。図1は、サービスモデル依存関係グラフの一例を示す。電子メールなどのサービスコンポーネント100は、サービスの4つのサブコンポーネントである、ネットワーク接続110、アプリケーションコンポーネント120、認証コンポーネント130、およびDNSコンポーネント140に直接依存する。ネットワーク接続110は、DSLまたはケーブルモデム接続などの、サービスユーザと電子メールサーバとの間の接続である。アプリケーションコンポーネント120は、サーバから電子メールを取り出すためのポストオフィスプロトコル3(POP3)アプリケーションである。アプリケーションコンポーネント120は、1つまたは複数のサーバクラスタ150ならびにそれらのそれぞれのホスト152および154に依存する。認証コンポーネント130は、ユーザ認証の責務を負うコンポーネントである。DNSコンポーネント140は、ホスト名をホストのIPアドレスにマッピングする責務を負うコンポーネントである。
【0024】
1つまたは複数のKQI/KPIが、依存関係グラフ内の各コンポーネントに関連付けられる。たとえば図1では、認証コンポーネント130は、失敗した要求および平均応答時間に基づくKQI/KPIを有する。アプリケーションコンポーネント120は、セッションメッセージに基づくKQI/KPI、すなわちクライアントセッション数および成功したトランザクションの数を有する。DNSコンポーネント140は可用性および応答時間に基づくKPIを有する。サーバクラスタ150はロードバランスおよび稼働ホスト数に基づくKPIを有する。ホスト152および154はCPU使用率およびメモリ使用率に基づくKPIを有する。
【0025】
すべてのサブサービスコンポーネントおよびネットワークベアラコンポーネントが顧客向きサービスの依存性グラフに含まれることを保証するために、サービスに関する完全な通信フローを展開しなければならない。このフローに関するすべてのコンポーネントおよびプロセスは、依存関係グラフ内に反映させることができる。
【0026】
サービスコンポーネントは、顧客向きコンポーネントを直接サポートする論理コンポーネントである。たとえば、WAPを介した電子メールサービスは、GPRSサービス、WAPアクセスサービス、ならびにPOP3およびSMTPの両方の電子メールサービスコンポーネントを必要とする。サービスコンポーネントは、特定のサービスタイプに特有のコンポーネントの集まりを表し、様々なアプリケーションコンポーネント、ならびにそれらアプリケーション間で任意の必要な通信をサポートするのに必要なネットワークを組み合わせる。たとえば電子メールサービスは、POP3サーバアプリケーションコンポーネント、POP3プロキシアプリケーションコンポーネント、SMTPアプリケーションコンポーネント、およびこれらのアプリケーションクラスタを接続するためのIP LANに依存する。アプリケーションコンポーネントは、1つの特定なアプリケーションをサポートするために配置されたすべてのリソースを表し、1つまたは複数のサーバクラスタおよびクラスタ間での通信のための任意の必要なネットワークベアラサポートコンポーネントに依存する。たとえば、POP3サーバアプリケーションコンポーネントは、2つの別々のロードバランシングされたPOP3サーバクラスタを含むことができる。
【0027】
サーバクラスタコンポーネントは、クライアントから見ると単一のサーバを表し、単一のサーバまたはロードバランシングされたクラスタのいずれかに対するバックエンドであることが可能である。サーバクラスタは、いくつかのソフトウェアおよびホストコンポーネント、ならびにクラスタ間通信に必要な任意の必須ネットワークベアラコンポーネントに依存する。図2は、ロードバランシングされたサーバクラスタのサービスモデルの一例を示す図である。図1とは対照的に、図2(ならびにその後の図)では、下位要素が上位要素に与える影響を示すために、矢印は最下位要素から上に向かっている。サーバクラスタ200は、ロードバランサ210、複数のサーバ220および230、ならびにサーバと通信するためのIP LAN240という、4つのコンポーネントに依存する。図2では、インタフェース1〜6はロードバランサおよびサーバホスト上のIP LANインタフェースである。ロードバランサは2つのインタフェース1および4を有し、サーバはインタフェース2、5、および3、6を有する。これら以外に、インタフェース2および3のみがそれぞれインタフェース1および4に接続されると想定される。したがって、サーバ1の性能はインタフェース2および5の性能による影響を受け、サーバ2の性能はインタフェース3および6の性能による影響を受けるが、サーバクラスタの性能に影響を与えるのはインタフェース2および3の性能のみである。
【0028】
各コンポーネントタイプについて説明し、QoSアラートのトリガおよび伝搬に関する規則を示す。サーバクラスタサービスコンポーネントは、クライアントから見た単一のエントリ点を表し、ここで単一のサーバ、またはロードバランシングされたサーバクラスタ内の複数のサーバのいずれかによって、クライアント要求を処理することができる。サーバクラスタの一例がSMTPサーバクラスタであり、これはDNSラウンドロビン機構を使用して、いくつかのSMTPホスト間で着信するSMTPメッセージのバランスをとる。クラスタは、ロードバランシングソフトウェアを備えていない単一のホスト、またはロードバランシングソフトウェアを備えた複数のホストからなる。「ロードバランシング」という用語は、高水準のコンテキストで使用され、ソフトウェアを使用して複数のサーバ間で負荷のバランスをとるシステムのことを表すものであり、たとえば、ホストのオペレーティングシステムが複数のプロセッサ間でCPU負荷のバランスをとる、マルチプロセッサコンピュータホストを指すものではない。
【0029】
サーバクラスタは、性能アラート、負荷関係性能アラート、可用度アラート、およびバランシング誤りアラートを有することができる。性能および負荷アラートは、ソフトウェアサブコンポーネントにおける低性能または高負荷によってトリガされる。バランシング誤りアラートは、子サーバソフトウェアコンポーネントのうちの1つまたは複数が、他の子コンポーネントとは大きく異なる負荷レベルを経験している場合に、トリガされる。
【0030】
サーバクラスタコンポーネントはクラスタ全体を表し、マルチホストクラスタのロードバランシング機構と間違えられることはない。上記の例では、クラスタのDNSロードバランシング機構は、サービスモデルの別のロードバランシングコンポーネントとしてモデル化されることになり、これが親サーバクラスタコンポーネントに影響を与える。
【0031】
ネットワークベアラコンポーネントは、多種多彩な他のコンポーネントをサポートする移送関係のコンポーネントである。このコンポーネントは、全体ネットワークグループコンポーネント(いくつかのネットワークベアラコンポーネント間で共用される)、ならびに、特にベアラコンポーネントに影響を与えると思われる、特定のネットワークインタフェースおよびネットワークノードコンポーネントに依存する。たとえば、ホスト間の通信に共用IP LANを使用するサーバクラスタを表すベアラコンポーネントは、ネットワークベアラコンポーネントに依存することになり、次にこれが(1)IP LANネットワークグループコンポーネントおよび(2)個々のサーバホストインタフェースに依存することになる。次にIP LANは、ルータ、スイッチ、インタフェース、および他のネットワーク要素の集まりに依存することになり、このLANコンポーネントは、同じLANを共用する他のネットワークベアラコンポーネントに影響を与えることになる。図3は、ネットワークコンポーネントのサービスモデルの一例を示す図である。サービス対ネットワーク(Service-to-Network)300は、サービス−ネットワークインタフェース310および全体ネットワーク320に依存する。全体ネットワーク320は、複数のサブネットワーク330および340に依存する。
【0032】
マルチメディアメッセージングサービス(MMS)は、本発明のモデル化方法の一例として提示されている。MMSは、人から人への移動メッセージングのためのエンドツーエンドの格納および転送サービスである。イメージ、オーディオ、ビデオ、データ、およびテキストを含む豊富なマルチメディアコンテンツを提供するが、それでもなお簡単に使えるように設計されている。MMSはショートメッセージングサービス(SMS)に関する。しかしながら、MMSを使用した場合、SMSの場合のようにメッセージの最終送達はユーザに到達しない。むしろユーザは、メッセージの通知を受け、メッセージをダウンロードするオプションが与えられる。その結果、メッセージの送達は即時でない可能性がある。サービスは2段階である。第1に、一時記憶のために送信者(MM移動体)からMMSCにmmが送信され、その後、これがMMSCから、MM移動体、レガシー移動体、または電子メールクライアントである、宛先に送信される。
【0033】
MMSは3つのサブサービスMM−MM、MM−LM、およびMM−電子メールに分割される。各サブサービスについて、セットアップおよびデータ転送という2つの相が定義される。これらの相は、顧客のサービス知覚に直接関係するために定義される。顧客の知覚は、下位サービスまたはネットワークコンポーネントアラートの結果として生じる影響から導出される、サービス影響インデックス(SII)(サービスインデックスとも呼ばれる)の形で測定される。
【0034】
無線サービスは、移動体対移動体(MM−MM)、移動体対レガシー移動体(MM−LM)、電子メールベース、コンテンツ開始、およびプリペイドの、複数のサブサービスを含むことができる。移動体対移動体サブサービスが、本発明の一例として提示される。
【0035】
移動体対移動体サブサービスは、1)セットアップ相コンポーネント、および2)データ転送相コンポーネントの、2相コンポーネントに分解することができる。この分解の理由は、サービスのこれら2つの相がユーザによって知覚された場合にまったく異なる品質要件を有するためである。相がどのように他のコンポーネントに依存するかを理解するためには、サービスの明確な定義がなければならない。副相(sub−phase)1はハンドセット1(HS1)の認証である。副相2はHS1 WAP(無線アクセスプロトコル)の認証であり、副相3はHS1 マルチメディアメッセージングサービス(MMS)の認証である。副相4はHS1からMMSへのデータの転送である。副相5はハンドセット2(HS2)の通知/肯定応答である。副相6は送信するようにとのHS2の要求である。副相7はHS2の認証である。副相8はHS2へのデータの送信であり、副相9はHS1への通知である。
【0036】
影響分析の場合、これらの副相はセットアップ相およびデータ転送相のコンポーネントにグループ化される。これらの相および関連するネットワークコンポーネントがそれぞれたどったパスに基づいて、サービス依存モデルが作成される。サービス定義を理解することによって、サービスモデルを構築するための体系的な方法が可能になる。前述のように、MMSは4つのサブサービス(プリペイドを可能な5番目とする)に分割される。これらのコンポーネントの依存関係は、図4に示されている。MMSサービス400は、MM−MMサブサービス410、MM−LMサブサービス420、電子メールサブサービス430、およびサブサービスコンテンツ440を有する。この最初の3つのコンポーネントは、それぞれ、セットアップ相450およびデータ転送相460という2つの別々の相に分割することができる。これらの相は、顧客のサービス知覚に直接関係するために定義される。顧客の知覚は、下位サービスまたはネットワークコンポーネントアラートの結果として生じる影響から導出される、サービス影響インデックスの形で、または単にサービスインデックスと呼ばれる形で測定される。
【0037】
図5は、MMS汎用パケット無線サービス(GPRS)コンポーネント500を示す。これには2つの「子」コンポーネントがある。1つは、ゲートウェイGPRSサービスノード(GGSN)のアクセスポイント名(APN)インタフェースコンポーネント510である。もう1つが全体GPRSネットワークコンポーネント520であり、これはさらに、GPRSコア530、インターネットプロトコル(IP)ワイドエリアネットワーク(WAN)すなわちIP WAN 540、および無線アクセスネットワーク(RAN)550という、3つのサブコンポーネントに分解される。このモデルでは、GPRSネットワークの3つのコンポーネントは、ハンドセットとMMSサービスとの間の接続に関する一般性能情報のみを提供し、仮想接続固有の情報は提供しないものと想定される。固有の性能情報は、インタフェース固有のコンポーネントからのものであると想定される。
【0038】
図6〜9は、図5に示されたGPRSネットワークを含む、MMSサービスのサービス依存関係モデルを示す図である。このモデルは、前述の3つのカテゴリ、すなわちサービス、サーバ/クラスタ、およびネットワークのコンポーネントを使用する。図を簡略化するために、最下位のネットワークコンポーネントはHI(ホストおよびインタフェース)のグループにまとめられる。さらに、ここでは単一のサーバのみが示されているが、この概念はサービスクラスタにも適用可能である。加えて、地理的に異なる場所にあるが、クラスタは形成していない(すなわち、負荷共有のない)サーバが存在する場合、それらのサーバは、異なるネットワークコンポーネントによってサポート可能であるため、異なるサービスコンポーネント(以下の図には示されていない)とみなされる。
【0039】
4つのサブサービスに対応するサービスモデルが図6〜9に示されている。図6は、依存関係グラフ形式のMM−MMサービスモデル600の基本コンポーネントを示す図である。MM−MMサービス610のセットアップ部分は、SMSおよび信号方式システム7(SS7)ネットワーク630、認証サーバ(AuS)640、無線アクセスプロトコル(WAP)サーバ用認証642、リモート認証ダイヤルインユーザサービス(RADIUS)サーバ644、メッセージングアプリケーションルータ/マルチメディアメッセージサービスセンタ(MAR/MMSC)648(およびそのコンポーネントを介してIP WAN540へ)、ならびに加入者データ機能(SDF)サーバ650に依存する。このコンテキストでは、SMS性能それ自体が、サービス提供GPRSサポートノード(SGSN)とショートメッセージサービスセンタ(SMSC)インタフェースの間の信号方式インタフェース631、SMSC−SS7インタフェース632、GSM性能のSMS固有コンポーネント(GSM−SMS固有)633、SMS−SS7ネットワークの全体性能634、およびSGSN性能のSMS固有コンポーネント(SGSN SMS−s)635に依存する。SMS−SS7ネットワーク630は、RAN 550にも依存する。MM−MMセットアップコンポーネント610およびMM−MMデータ転送コンポーネント620は、どちらも、IPローカルエリアネットワーク(IP LAN)の全体性能652、マルチメディアメッセージサービスセンタ(MMSC)ネットワーク654、WAPネットワーク656、ならびに図5に記載されたGPRSネットワーク500に依存する。図6では、HIは図2に示されたホストクラスタおよびインタフェースを表す。
【0040】
図7は、依存関係グラフ形式のMM−LMサービスモデル700の基本コンポーネントを示す図である。MM−LMセットアップ相710およびMM−LMデータ転送相720に関するコンポーネントは、端末ゲートウェイサーバ(TGW)730への追加のそれぞれの依存関係を除き、すべて図6と同じである。
【0041】
図8は、依存関係グラフ形式のMM電子メールサービスモデル800の基本コンポーネントを示す図である。MM電子メールセットアップ相810およびMM電子メールデータ転送相820に関するコンポーネントは、メッセージ転送エージェント(MTA)830への追加のそれぞれの依存関係を除き、すべて図6と同じである。
【0042】
図9は、依存関係グラフ形式のMMSコンテンツサービス900の基本コンポーネントを示す図である。MMSコンテンツサービス900は、MMSコンテンツサービス相910およびMMSコンテンツデータ転送相920に加えて、登録相930を含む。MMSコンテンツセットアップ相910に関するすべてのコンポーネントは、図6と同じである。MMSコンテンツデータ転送920に関するコンポーネントは、情報コンテンツサーバ(ICS)サーバ940への追加の依存関係を除き、すべて図6と同じである。登録相930は、SMS−SS7 640、SDF 650、およびIP WAN 540という前述の3つのコンポーネント、ならびにICSサーバ940に依存する。加えて登録相930は、対話型音声応答(IVR)サーバ932、GSMサーバ934、およびICS対SDFサーバAPI(ICS−API)936に依存する。
【0043】
影響を受けるサービスの識別は、サービスがどのように実施されるかおよびサービスのコンポーネントに依存する。また、サービスコンポーネントのトポロジおよび構造にもかなり依存する。表面上は、サービスのサブコンポーネント(ルータまたはサーバなど)に関連付けられた任意のQoSアラートが、その性能が低下しているルータまたはサーバを使用するサービスが影響を受けていることを示唆するというように、結論付けようとしている場合がある。実際には、分析がさらに大きく関わっている。不確実さは、主に、IPネットワークの自己修復または障害隠蔽機能、およびサービスの実施に組み込まれた多くの耐障害性機構の結果である。
【0044】
簡単な例を挙げると、ルータインタフェースの障害は、ルーティングアルゴリズムによって自動的に迂回することが可能であり、その後、ルータインタフェース障害はそれ自体を容量の中のほんのわずかとして表すことが可能であり、これはトラフィック負荷に応じてエンドサービスに影響を与える場合や与えない場合がある。サービスの影響に対するQoSアラートの直接の関係の矛盾を示す他の例が、サーバのロードバランシングにある。このシナリオでは、それぞれがアプリケーションのコピーを実行中の複数のサーバ間で、アプリケーションがロードバランシングされる。サービスに対する要求は、DNSラウンドロビンまたはトラフィックベース割り振りなどの、あるロードバランシングアルゴリズムに従って、複数のサーバによって処理される。サーバの1つがハード障害を示す場合、そのサーバは使用不可となり、通常は重大なアラームである。しかしながら、他のサーバは依然として適切に機能しているため、(たとえばトラフィックベースの)ロードバランシングアルゴリズムに応じて、ここですべての要求を残りの健全なサーバに向けて送ることができる。このシナリオでは、負荷が軽い場合、ここでもサービスの影響が重大でない可能性がある。
【0045】
ソフトウェアサービスコンポーネントは、単一のアプリケーションまたはコンピュータホスト上で実行中の1片のアプリケーションを表す。サービスモデルでは、ソフトウェアコンポーネントはハードウェアホストおよび1つまたはいくつかのインタフェースに依存し、サーバクラスタコンポーネントに影響を与える。サーバソフトウェアコンポーネントの一例が、SMTPサーバアプリケーションプログラムである。ソフトウェアコンポーネントの他の例が、ソフトウェアベースのロードバランサアプリケーションである。
【0046】
性能アラート、負荷関係性能アラート、および可用度アラートという、いくつかの異なるタイプのアラートが、ソフトウェアコンポーネントから送出される。性能および負荷アラートはQoS性能アラートであり、負荷関係KPI(たとえば、ホストCPU負荷、インタフェース使用率、およびクライアントトランザクション回数など)のしきい値超過によってトリガされる。これらのKPIが中央値しきい値を超過した場合、サービスモデル内の影響を受けるサービスコンポーネントに性能アラートが送出され、同時に発生するすべての関係KPIしきい値超過を1つにまとめて、伝搬されるアラートにこれらを含める。
【0047】
IP LANサービスコンポーネント652は、いくつかのサーバおよびクラスタにIP接続を提供するために共通インフラストラクチャとして使用されるIPノードの集まりを表す。エンドツーエンド、プローブ、またはEMSベースのデータを使用して、これらネットワークの性能が判定される。個々のノード/インタフェース使用率データを使用して、今後の性能/可用度問題を示すネットワーク使用率が判定される。他のコンポーネントタイプの場合と同様に、関係する同時KPIしきい値超過が報告され、単一のアラートとして伝搬される。
【0048】
サービスモデルでは、サーバクラスタコンポーネントはIP LANコンポーネントに依存して、サーバとロードバランサとの間に接続を提供する。LANの性能、使用率、および可用度が、親サーバクラスタに影響を与える。
【0049】
図10は、2つのサブコンポーネントXおよびYで構成されるコンポーネントAに対する本発明の高水準アーキテクチャを示す。KPIアラートは、各KPIアラートを単独で分析するのではなく、X_KPI:{x1,x2,...xm}1010およびY_KPI:{y1,y2,...yn}1020などのコンポーネントごとのカテゴリにグループ化される。すべてのKPIアラートは、第1にコンポーネントごとにグループ化される。あるコンポーネント内のKPIアラートは、可用度および性能という2つの広範なカテゴリにさらにグループ化され、それぞれが規則エンジン1032および1042を使用するために、可用度インジケータ1034および1044ならびに性能インジケータ1036および1046を作成する。可用度および性能に加えて、たとえば使用率/負荷またはセキュリティなどの他の広範なカテゴリも実施できる可能性がある。規則エンジン1032および1034は、1つまたは複数の高水準プログラミング言語で作成された規則プログラムが実行可能な、汎用プロセッサである。
【0050】
可用度カテゴリは、コンポーネントの可用度レベルのインジケーションである。3つのレベルが定義される。レベル3では、ハードウェア障害状態などの場合、コンポーネントは完全にダウンする。レベル2では、コンポーネントは部分的にダウン、すなわちコンポーネントの一部がダウンする。レベル1では、ある統計的なダウンタイム属性がしきい値を超え、すべてのキー性能インジケータは低い値を示すが、これはコンポーネントが依然として稼働(up)しており、すべての性能測定値で非常に低い性能が示されていることを意味する。重大度に関しては、レベル3は最も重大であり、レベル1は最も重大でない。
【0051】
性能カテゴリは、コンポーネントの全体性能のインジケーションである。3つのレベルが定義される。レベル1では、性能はわずかに低下している。レベル2では性能は低下し、レベル3では性能はかなり低下している。
【0052】
加えて、アラートを識別するハンドルおよびアラートを記述するテキストのオプションフィールドが定義される。これらのハンドルは、技術者がアラートの原因により効率良く対処できることになる、特定のコンポーネントからのKPI情報である。
【0053】
コンポーネントアラートグループは、ハンドルと共に、コンポーネント状況インジケータ(CSL_alertグループ)を形成する。その後、CSIインジケータ1038および1048は規則処理要素1052と組み合わされて、コンポーネントAに関するCSIインジケータ1054を展開し、コンポーネントAはコンポーネントXおよびYに依存する。コンポーネントXは、レベル2の重大度の問題によって現在ダウンしているため、CSI可用度インジケータを転送する。コンポーネントYは、現在使用可能であるが性能はかなり低下している、すなわちレベル=3であるため、CSI性能インジケータを転送する。コンポーネントAは、コンポーネントxおよびyから受け取ったそれらに基づいて、可用度および性能のインジケータを転送する。CSI_alertグループの追加の例を以下に示す。
【0054】
CSI_Perf:[MMSC_Cluster:P=(レベル3);PH=010,059;“首尾良く送達されたメッセージの%<98%”]
CSI_Avail:[IP LAN:A=(レベル2=使用不可);ハンドル=12、“ルータxがダウン”]
CSI_alertグループが次の上位またはアップストリームレベルで親コンポーネントに伝搬する場合、親コンポーネントは2つのタスクを実行する。第1に、親コンポーネントは、そのダウンストリームにある「子」コンポーネントからのすべてのCSIおよびそのレベルで処理された任意のアラートを考慮に入れて、それ自体に関する可用度インジケータおよび性能インジケータを割り当てる。第2に、親コンポーネントは、その子の可用度および性能の両方のCSIの重要度レベルを修正するかどうかを判定する。
【0055】
CSIの可用度および性能インジケータの判定に使用される規則は、ユーザによる変更が可能である。表1は、影響を与える規則の一例である。
【0056】
【表1】
【0057】
規則は静的または動的とすることができる。静的規則は経時的に変化しない。動的規則は、加入者数、ある時点でのサービスの値、または地理によって、経時的に変化する可能性がある。規則は一般に、一貫性を持たせるために中央のネットワークオペレータによって作成されるが、規則が作成されているコンポーネントについて最も詳しい者の専門知識を考慮に入れるものとする。これによって、影響の分析において、またアラートの処理においても、コンポーネントに関する技術的な専門知識を使用することができる。
【0058】
各CSIグループには持続期間が割り当てられる。この持続期間は、含まれるすべてのハンドルの最大持続期間となるように定義される。たとえば、特定のCSI性能アラートグループが、ハンドルH1(持続期間1時間)、H2(持続期間30分)、およびH3(持続期間2時間)を含むものと想定する。このグループ内で最大持続期間を有するハンドルはH3である。したがって、全体CSI性能インジケータの持続期間は2時間である。個々のハンドルの持続期間は、ハンドルが現時点まで連続して活動状態であった時間の長さである。たとえば、システムが15分間隔でパケット損失情報を集め、そのパケット損失測定値が過去2回のサンプリング間隔で性能アラートしきい値を超えた場合、パケット損失アラートハンドルの持続期間は30分である。
【0059】
図11は、本発明に従ったサービス影響分析のための高水準流れ図である。ステップ1110で、複数のCSIアラート(X1...Xn)が集められ、CSIアラートが性能または可用度に影響を与えるかどうかを判定する意思決定論理に転送される。ステップ1120で、CSIアラートが性能または可用度に影響を与える場合、影響規則の適用を通じてアラートがサービスに影響を与えるかどうかを判定する追加の意思決定論理に転送される。アラートがサービスに影響を与えない場合、ステップ1140でアラートインベントリデータベースに転送および格納される。アラートインベントリは、アラートのパターンなどを探すために後で分析することができる。アラートがサービスに影響を与える場合、ステップ1130で影響を受けるサービスを識別するために使用される。ステップ1150で、影響を受けるそれぞれのサービスについて、影響を受ける顧客の数、影響を受ける特別顧客の数、影響を受ける特別サービスの数、サービス影響インデックス(SII)の程度、およびアラートの持続期間、というパラメータのうちの1つまたは複数を推定することによって、影響を受けるサービス上の影響が判定される。ステップ1160で、ステップ1150で集められた情報に基づいてサービス影響インデックスを生成するために規則が適用され、複数のSII(I(x1)...I(xn))を生成し、その後ステップ1170で、影響の量に基づいて優先順位リストに優先順位付けされる。この優先順位リストを使用して、ネットワークオペレータはサービスに最大の影響を与える問題にどのアラートが関係しているかを即時に識別することができる。
【0060】
本発明の代替実施形態では、中間規則を定義しないことによって実施を簡略化することができる。これは、下位レベルのコンポーネントについてアラート「CSI_Avail」および「CSI_Perf」がいったん定義されると、サービスモデルの中間コンポーネントによって修正されることがないことを意味する。
【0061】
CSIアラートがサービスに影響を与えるものと判定されると、サービスの品質低下に関する影響を定量化しなければならない。サービス影響インデックス(SII)は、事前に定義されたKQIセットの重み付け合計として定義することができる。図12は、この判定のためのプロセス流れを示す図である。ステップ1210で、影響を受けるそれぞれのサービスのそれぞれのコンポーネントへのKQI影響が判定される。ステップ1220で、それぞれのコンポーネントへのKQI影響の合計が算出される。ステップ1230で、影響を受けるユーザの数、アラートの持続期間、特別サービスへの影響などの情報に基づいた重み付け要素を使用して、KQI影響の合計に重み付けする。これらの重み付けおよび合計されたKQI影響が、その後、前述のように優先順位付け可能なサービス影響インデックスになる。
【0062】
本発明の方法の主要な要素について以下に要約して記載する。サービスの異なる相によって動かされるサービス依存関係モデルの作成は、サービス全体の1コンポーネントに過ぎない最下位のネットワークコンポーネントでのアラートが、サービス全体にどのように影響を与えるかを理解できるようになる上で重要である。アラートには「ハンドル」および重大度レベルが割り当てられる。各コンポーネントに対するコンポーネント状況インジケータを作成するためにアラートに適用される規則が定義される。各CSIがサービスモデル依存関係グラフのトップに向かって上方に伝搬されるにつれて、各CSIは事前に定義された規則に従って修正される。
【0063】
CSIがトップのサービスコンポーネントに伝搬される際に、サービス影響インデックスが作成される。影響を受けるそれぞれのサービスについて、アラートの持続期間、加入者の数、サービスの数、影響を受けるサービスのQoSクラス、またはユーザによって定義される他の要素に従って、重み(乗数)が定義される。重みは、SIIを乗算して全体の影響インデックスを得るために使用され、このインデックスがソートされて優先順位リストが得られる。
【0064】
優先順位付け用の主要な重みは以下の通りである。サービスインデックスは(セットアップおよびデータ転送からの)KQIの影響レベルから算出される。SIは各サブサービスについて別々に算出しなければならず、結果をすべて加算してサービス影響インデックスが形成される。
【0065】
加入者インデックスの数は、加入者数の重要性を表す数である。未処理の(outstanding)アラートの持続期間は、サンプリング期間に関して定義される。問題が矯正されると、アラートは除去されると予測される。長い未処理のアラートには、アラートを新しくするより多くの重みが与えられる。1〜3のインデックスは持続期間の重みを表すために使用される。サービスの数はCSIごとに識別され、合計影響は影響を受けるすべてのサービスに依存する。すべての重みが算出された後、特定のCSIについての単一のインデックスが得られる。表2および3は、複数のサービスにわたる個々のサービス影響インデックスの重み付け合計に基づいた、合計影響インデックスの計算を示す。
【0066】
【表2】
【0067】
【表3】
【0068】
前述の方法を拡張して、ネットワークオペレータがアラート優先順位付けおよびサービス影響分析中に生成された情報を根本原因分析のために使用できるようにすることが可能である。根本原因分析(RCA)は、1つまたは複数のアラートの根本原因を識別する問題に対処する。この問題は、前述のサービス影響分析およびアラート優先順位付けの逆である。サービス影響分析およびアラーム優先順位付けでは、サービスモデル依存関係グラフの各レベルで生成されたCSIが、次のレベルで追加のCSIを作成するために使用され、トップレベルでサービス影響インデックスを生成するために使用される。障害のサービス影響およびサービスの低下が識別され、アラートが優先順位付けされると、ネットワークオペレータによる根本原因の診断およびサービスの復元によって、問題修復の問題に対処することができる。この方法はRCAを支援し、追加の診断テストの必要性を最小限にする。パスに沿ってサービスモデル依存関係グラフ内を上方に、サービス影響分析およびそれに続くアラート優先順位付けをドリルダウンしていくこと、および1つまたは複数のCSIに含まれるアラートに関連付けられたハンドルを参照することによって、ネットワークオペレータは、サービスモデル依存関係グラフの最も可能性の高い最下位層での、ネットワーク障害またはサービス低下の最も可能性の高い原因を識別することができる。
【0069】
サービスモデル依存関係グラフのコンポーネントへのデータ入力は、(1)そのコンポーネントに関するアラートシステムからのアラート、(2)ダウンストリームの「子」コンポーネントからのCSI、および(3)プローブ、EMS、またはNMS)などのデータ収集エージェントから収集された性能データからなる。前述のように、上記入力はすべて、各コンポーネントについて規則セットを使用して処理される。この規則は、そのレベルでのCSIを発行するかどうかを判定し、これはその後アップストリームレベルまたは「親」コンポーネントによって使用可能である。規則エンジンがそのCSIを発行すべきであると判定する場合は、ある規則に合致したためである。規則に合致しない場合、アラートは抑制され、これは検査を受けたアラートがサービス問題を引き起こさないことを意味する。このアラートのコンポーネントレベルのフィルタリングにより、さらにアップストリームでの不必要な処理がなくなる。したがって、コンポーネント内での規則の実行は、潜在的な性能問題のローカル診断である。規則実行の結果により、サービスおよびシステムレベルの根本原因診断に使用可能な、価値ある情報が提供される。ネットワークオペレータは、CSIのハンドルコンポーネントおよびハンドル伝搬を介して、この情報を根本原因分析に使用することができる。
【0070】
図13を参照すると、コンポーネント4−1 1310内の規則が満たされたために、コンポーネント4−1 1310のアラート1は、コンポーネント4−1で搬送されるCSI_4−1(h1)のハンドルh1になる。この時点で、以下の表4で説明するように、CSI_4−1に関する情報がCSIテーブルに記録される。CSIテーブルは、CSI ID、ハンドル、タイムスタンプ、および合致した規則を識別する。CSI_4−1は、性能データおよびCSI_4−1を、コンポーネント3−1 1340へとアップストリームに伝搬し、ここでは異なる規則セットが、アラート2によって提供されるようなアラート情報を使用して、いずれかの規則が合致したかどうかを判定する。他の規則条件のうちの1つが満たされる場合、表4などのCSIテーブルに格納された関連情報と共にCSI_3−1が発行される。アラート2は、CSI_3−1内のハンドル2(h2)となる。
【0071】
コンポーネント4−2 1320、コンポーネント4−3 1330、コンポーネント3−3 1360、またはコンポーネント2−2 1380などのいくつかのコンポーネントでは、規則によってCSIを伝搬させるアラートがない可能性がある。同様の規則処理は、規則およびアラート3に基づいてハンドルh3を伴うCSI_3−2(h3)が生成されるコンポーネント3−2 1350と、規則セットならびに「子」コンポーネント3−1および3−2からのCSIに基づいてCSI_2−1(h1、h2、h3)が生成されるコンポーネント2−1 1370などの、他のコンポーネントでも発生する。h1およびh2などのハンドルが新しいCSIの生成と並行して伝搬される場合、逆のパスに関する情報がハンドルに追加されることになるため、CSIは以下のように表される。
【0072】
CSI_2−1=(.....h1(パス=2−1、3−1、4−1)、h2(パス=2−1、3−1)、h3(パス=2−1、3−2)
ハンドルのパスIDはコンポーネントIDを与え、これと並行してハンドルが伝搬される。別のテーブルが、ハンドルおよびその対応するアラート、しきい値、違反回数などに関する情報を格納する。ハンドルテーブルは、他のドリルダウンアクションが所望される場合、CSIの性質に関する他の情報を提供する。コンポーネント2−1 1370からのCSIを使用して、コンポーネント1−1 1390で、トップレベルCSIおよびサービス影響分析を展開することができる。
【0073】
【表4】
【0074】
根本原因分析時に、トップレベルへと進むハンドルは、根本原因の分析に関するすべての関連する相関情報を容易に取り出すための情報を担持する。この情報は、多くの根本原因分析が含まれるため、ネットワークオペレータまたはトラブルシュータにとって特に有用である。
【0075】
前述の方法は、一部の規則の適用およびCSIアラートの生成を中央オフィスに実行させることにより、サービスレベル管理機能の一部としてネットワークオペレーションセンタで、サービスビューロとして、または配布物で、実施可能である。規則は、多くの異なるプログラミング言語で1つまたは複数のプロセッサを汎用コンピュータ上で実行するために実施可能である。オフィスまたはオフィスの近くに配置されたコンポーネントに関する規則を実行するネットワークオペレーションセンタおよび中央オフィスプロセッサは、異なるプログラミング言語で作成された異なる規則セットを実行することができる。重要な要素は、CSIのフォーマット、およびCSIのフォーマットを介してダウンストリームプロセッサがアップストリームプロセッサと通信する機能である。また、アラートまたはCSIのいずれかを、サービスモデル依存関係グラフのダウンストリームレベルからアップストリームレベルへと渡すためには、コンポーネント間に通信パスが必要であり、こうしたパスは直接物理接続、またはインターネットなどのネットワーク接続を介した仮想接続である。
【0076】
前述の記述は、本発明を例示および説明するためにのみ提示したものである。本発明を網羅すること、または本発明を開示された任意の精密な形式に限定することは意図していない。上記の教示に鑑みて、多くの修正形態および変形形態が可能である。記載された明細書は、当業者が様々な応用例で、および企図された特定の用途に好適な様々な修正形態で、本発明を最も適切に使用できるように、本発明の原理およびその実際の応用例を最も良く説明するために選択および説明された。
【図面の簡単な説明】
【0077】
【図1】サービスモデル依存関係グラフの一例を示す図である。
【図2】ロードバランシングされたサーバクラスタのサービスモデルの一例を示す図である。
【図3】ネットワークコンポーネントのサービスモデルの一例を示す図である。
【図4】MMSサービスに関する高水準サービスモデル依存関係グラフを示す図である。
【図5】MMSサービスのMMS汎用パケット無線サービス(GPRS)コンポーネントに関するサービスモデル依存関係グラフを示す図である。
【図6】MMSのMM−MM部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図7】MMSサービスのMM−LM部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図8】MMSサービスのMM−Eメール部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図9】MMSサービスのMMSコンテンツ部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図10】本発明のアラート優先順位付けシステムの高水準アーキテクチャを示す図である。
【図11】本発明のアラート優先順位付けおよびサービス影響分析方法のプロセス流れを示す図である。
【図12】本発明のサービス影響分析方法のプロセス流れを示す図である。
【図13】サービスモデル依存関係グラフにおける様々なコンポーネントレベルでのコンポーネント状況インジケータ(CSI)の生成を介したハンドルの伝搬のグラフを示す図である。
【技術分野】
【0001】
本発明は、遠隔通信システムにおけるアラームを含むアラート(alert)のサービス品質の処理および分析に関する。より具体的に言えば、本発明は、無線遠隔通信システムにおけるアラートのサービス品質(QoS)の優先順位付けおよびこうしたアラートの影響分析のための方法に関する。この方法は、アラート、特に最高優先順位のアラームの根本原因の分析も提供する。
【背景技術】
【0002】
TDMA、CDMA、またはGSMに基づくセルラシステム、あるいはGPRSに基づく2.5Gネットワークなどの遠隔通信システムにおいて、サービスプロバイダはこれまでにも増して高いサービス品質を提供するための競争にさらされている。多くの異なる遠隔通信サービス、特に多くの新しい無線サービスが登場するにつれて、サービス保証の問題はますます困難になりつつある。現在のネットワークオペレーションセンタ(NOC)では、何百何千もの様々な形の様々なアラート、警告、およびアラームを受信することは珍しくない。トラブルシューティングおよび問題解決を担当するNOCの職員は、通常、高度な訓練を受けたある特定の技術分野を専門とする技術者である。従来から、NOCグループは、アプリケーションおよび内部IPネットワークを管理する情報技術(IT)組織とは別のものである。あるドメイン内で発生した問題は、通常、他のドメインからの影響を考慮して処理されることはない。特に、QoS問題の優先順位付けまたは根本原因の分析に適した方法または手順はない。
【0003】
現在のサービス管理は、隔離されたネットワーク管理システムおよび情報技術(IT)ベースの管理環境からなる。ネットワーク管理タスクは、大量の性能データの収集、週間または月間レポートの生成、および大量のイベントおよびアラームのログ記録からなる。主にデータは、いくつかの互いに素の要素管理システム(EMS)によって、または場合によっては個々のネットワーク要素(NE)によって生成される。サービスおよびアプリケーションの領域では、サーバおよびLAN関係のアラームおよびイベントを監視およびログ記録する場合、Hewlett−Packard社のOpenview、Computer Associates社のUnicenter、またはIBM社のTivoliなどの、従来のIT管理プラットフォームが一般的である。しかしながら、これらのITベースの管理プラットフォームと他のEMSとの間には、何の相関関係もない。隔離されたそれぞれのドメインに対して、特定のドメイン(アプリケーション、コア、アクセス)を担当する職員によって、真のサービス管理が実行される。通常、異なるドメインは、異なる組織によって処理され、これらの組織は互いにほとんど対話することなく独立して運営される。サービス品質についての統合および相関された見解はなく、サービス保証または長期計画に対して一貫した努力が払われることはない。
【0004】
2G、2.5、または3Gのセルラ技術、あるいは802.11 WiFiベースシステムなどの無線LAN(WLAN)技術といった無線技術への依存度が高まるにつれて、サービスの問題はますます複雑さを増していく。ボトムアップサービス保証システムは、様々なネットワーク要素またはサブシステムからデータを収集することに焦点を置いており、顧客の満足を満たすように顧客が望む様々なサービスが実際に提供されているかどうかには焦点が置かれていない。
【0005】
影響分析の全体的な目標は、ある事前に定義されたサービスレベル基準に対してサービス品質の低下を定量化することである。その後、こうした影響分析の結果を使用して、サービスおよびネットワークアラーム、サービスQoSアラート、ならびにネットワーク性能しきい値超過(crossing)アラートまたは問題のあるチケット生成に関した他の性能影響イベントの、優先順位付けをサポートすることができる。加えて、ネットワークおよびサービスリソース拡張の優先順位付けをサポートするため、またはマーケティングおよび契約目的でのサービスレベル合意の調整のために、この結果を使用することもできる。
【発明の開示】
【発明が解決しようとする課題】
【0006】
無線サービスが激増するにつれて、またそれぞれのライフサイクルが短くなるにつれて、適切な技術を備えたNOCオペレータを訓練して様々なタイプのサービス関連QoS問題を処理できるようにすることは、ますます困難になってきている。NOC職員のQoSアラームの優先順位付けを支援するためには、アラートに関する関連情報を収集および抽出し、顧客に対する影響、サービス品質、ならびにマーケティングおよびプランニングなどの他の基準に対してそれらを優先順位付けするためのツールがあることが望ましい。
【0007】
サービスのそれぞれのコンポーネント(構成要素)について、関連付けられたキー性能インジケータ(KPI)のセットがある。サービスモデルが40のコンポーネントを有し、それぞれが30のKPIを有すると想定すると、サービスには合計で1200のKPIが存在することになる。同時に20のサービスが活動状態にある場合、潜在的に20,000を超えるKPIを扱う可能性がある。所与の時点でKPIの1%がしきい値を超過し、所与の時点で200を超えるQoSアラートを生成すると想定してみる。KPIの量およびそれらのアラートに加えて、特定のKPIに特有のアルゴリズムを作成することも困難である。したがって影響分析アルゴリズムは、スケーラビリティおよび複雑さの問題に同時に対処しなければならない。
【0008】
さらに、何らかの定量的な影響インデックスに対して、QoSアラームの系統的な優先順位付けを可能にする方法およびシステムを有することが望ましい。
【0009】
加えて、アラートの影響を優先順位付けおよび分析するためのサービスの依存関係モデルを使用するシステムおよび方法を有することが望ましい。
【0010】
大規模ネットワークに関する影響分析を提供することが可能であり、スケーラビリティの問題に悩まされることのない、方法およびシステムを有することも望ましい。
【0011】
最終的に、アラートの優先順位付けおよびサービス影響の分析システムによって識別された、サービス影響アラートの根本原因分析において、ネットワークオペレータを支援することのできる方法およびシステムを有することが望ましい。
【0012】
本発明は、このような状況に鑑みてなされたもので、その目的とするところは、遠隔通信システムにおけるサービス影響の分析およびアラートの処理のための方法及びシステムを提供することにある。
【課題を解決するための手段】
【0013】
本発明は、遠隔通信ネットワーク、特に無線ネットワークにおいて、アラームを優先順位付けするための方法およびシステムを提供する。QoSアラートまたはアラームが受信され、優先順位インデックスを生成するためにアルゴリズムが使用される。アラートとは、特定の物理コンポーネントの障害によって引き起こされるハード障害アラーム、および所定のしきい値を超過する1つまたは複数の性能または他のインジケータの結果として発行されるアラートの、両方を指す。優先順位付けは、QoSアラートによって影響を受けるサービス、各サービスが影響を受ける範囲、およびサービスの顧客への影響を識別する。
【0014】
本発明の方法およびシステムは、影響を受けるサービスを識別すること、キー品質インジケータ、サービス影響インデックス(SII)、および低下の重大度(割込み合計、割込みの持続時間、性能低下、およびデータ転送正確度)に基づいてサービス品質影響を判定することにより、これらの問題に対処する。システムは、影響を受ける加入者数(特別顧客および正規顧客の割合)も判定する。システムおよび方法は、この情報を利用してそれらに重み付けするための規則セットを適用し、最終的な優先順位インデックスを作成する。
【0015】
サービスモデルは最初に、サービスレベルおよびネットワークレベルのコンポーネントの依存関係を捕らえる、グラフ構造で構築される。このサービス依存関係モデルは、QoSキー性能インジケータ(KPI)の相関関係に関する基本フレームワークを提供する。コンポーネント状況インジケータ(CSI)を作成するために、各コンポーネントのうちのアラートが出されたKPIに規則セットが適用される。CSIは、アラートの原因に関する情報を指定する1つまたは複数のハンドルを含む。CSIがサービスコンポーネントに向かって伝搬される際に、追加のCSI情報を使用して現在のCSIが修正される。CSIは最終的に、サービス影響インデックス(SII)に関して影響を取り込む、重みセットにマッピングされることになる。その後SIIは、影響を受けたサービスの数、加入者の数、QoSクラス、およびアラートの持続時間を含む、他のパラメータで重み付けされる。最終的な優先順位付けは、各CSIに関して影響インデックス全体をソートすることによって達成される。ネットワークオペレータは、CSIのハンドルに含まれる情報を使用して根本原因を分析することが可能であり、これがアラートの原因となる問題の診断および矯正に役立つ。
【発明を実施するための最良の形態】
【0016】
優先順位付けのシステムおよび方法を説明するために、第1に、サービスを記述するためのサービスモデルについて説明する。サービスとは、ネットワークオペレータによって彼らの顧客に販売される製品のことである。エンドツーエンドサービスとは、エンドユーザ顧客が体験する、完全なラウンドトリップの対話またはセッションのことである。
【0017】
サービスは、サブサービスまたはドメインの組み合わせとみなすことができる。サービスは、様々なベアラサービスおよび情報サービス、ならびに顧客またはサービス特有のリンクを含むことができる。電子メール、ショートメッセージングサービス(SMS)、またはマルチメディアメッセージングサービス(MMS)などの格納(または送達)および転送サービスの場合、1つのラウンドトリップのエンドツーエンド対話の代わりに、送達および転送という2つの別々の対話が存在する。エンドツーエンドサービスを提供するために様々なサブサービスが対話可能である。階層化方式には、基礎となるネットワーク、ベアラサービス、1つまたは複数の情報サービス、ならびにサービス間およびサービス内ベアラが含まれる。
【0018】
サービスモデルは、サービスインベントリに関する共通のリポジトリおよびリファレンス、サービスおよびサブサービス、ならびにそれらのコンポーネントを、オペレータに提供するために使用される。サービスモデルは、サービスレベル合意(SLA)、キー性能インジケータ(KPI)、キー品質インジケータ(KQI)、および全体サービスインデックス(SI)を定義およびカスタマイズするための手段を提供する。
【0019】
キー性能インジケータ(KPI)は、無線GSMベースのセルラシステムで利用可能なタイムスロットの数などの、ネットワークコンポーネントからの下位パラメータである。
【0020】
キー品質インジケータ(KQI)は、たとえば、ある期間にわたって使用不可なGSMシステムにおける基地局の割合などの、サービス品質を示すパラメータである。KQIは1つまたは複数のKPIに基づくものである。
【0021】
サービスインデックス(SI)は、サービスの全体性能を示すように全体のサービス品質を要約するものである。SI、KQI、およびKPIが、品質インジケータの階層を形成する。SIは、KQIの重み付け合計によって算出される。
【0022】
サービスモデルの基本構築ブロックがサービスコンポーネントである。サービスコンポーネントとは、サービス品質に影響を与える論理エンティティのことである。サービスのモデル化は、サービスの相(phase)(たとえば、認証相またはデータ転送相)あるいはサービスのトポロジに基づく分解によって実行可能である。サービスは、顧客向き(customer−facing)またはサービスおよびネットワークの層などの、いくつかのカテゴリに分解することができる。非周期多重接続有向グラフである依存関係グラフでは、コンポーネントは互いに関連付けられている。依存関係グラフにおいて、コンポーネントAとBの間の各有向縁部は、AとBの間の依存関係を表す。Aの性能はBの性能に依存し、すなわちBの性能はAの性能に影響を与える。
【0023】
顧客向きコンポーネントとは、サービス品質要件が内部および外部の両方で顧客とのサービスレベル合意(SLA)の一部である、サービスコンポーネントである。各顧客向きコンポーネントは監視および保証可能であり、それぞれが関連付けられたSLAを潜在的に有する。サービスの一例がVOIPであり、ここでは顧客向きコンポーネントは「呼び出しセットアップ」および「データ転送」である。この場合、呼び出しセットアップは、データ転送用と同じかまたは異なるサービスコンポーネントを使用することができる。顧客向きサービスコンポーネントは、サービスコンポーネントを顧客への転送/ベアラネットワークと組み合わせるものであり、たとえば電子メール/WAP/GPRSサービスは、WAPおよび電子メールサービスコンポーネント、DNS、DHCP、および他のセットアップサービスコンポーネント、顧客へのGPRSベアラネットワーク、サービスベアラ間ネットワーク、ならびに、顧客ハンドセットまたは移動局上のWAPおよび電子メールクライアントアプリケーションを組み合わせる。この組み合わせは、顧客向きコンポーネントとサポートしているサービスおよびネットワークコンポーネントとの間に依存関係を作成することによって実施される。言い換えれば、電子メール/WAP/GPRSサービスは、電子メールサービスコンポーネント、GPRSベアラコンポーネント、DHCPサービスコンポーネントなどに依存する。図1は、サービスモデル依存関係グラフの一例を示す。電子メールなどのサービスコンポーネント100は、サービスの4つのサブコンポーネントである、ネットワーク接続110、アプリケーションコンポーネント120、認証コンポーネント130、およびDNSコンポーネント140に直接依存する。ネットワーク接続110は、DSLまたはケーブルモデム接続などの、サービスユーザと電子メールサーバとの間の接続である。アプリケーションコンポーネント120は、サーバから電子メールを取り出すためのポストオフィスプロトコル3(POP3)アプリケーションである。アプリケーションコンポーネント120は、1つまたは複数のサーバクラスタ150ならびにそれらのそれぞれのホスト152および154に依存する。認証コンポーネント130は、ユーザ認証の責務を負うコンポーネントである。DNSコンポーネント140は、ホスト名をホストのIPアドレスにマッピングする責務を負うコンポーネントである。
【0024】
1つまたは複数のKQI/KPIが、依存関係グラフ内の各コンポーネントに関連付けられる。たとえば図1では、認証コンポーネント130は、失敗した要求および平均応答時間に基づくKQI/KPIを有する。アプリケーションコンポーネント120は、セッションメッセージに基づくKQI/KPI、すなわちクライアントセッション数および成功したトランザクションの数を有する。DNSコンポーネント140は可用性および応答時間に基づくKPIを有する。サーバクラスタ150はロードバランスおよび稼働ホスト数に基づくKPIを有する。ホスト152および154はCPU使用率およびメモリ使用率に基づくKPIを有する。
【0025】
すべてのサブサービスコンポーネントおよびネットワークベアラコンポーネントが顧客向きサービスの依存性グラフに含まれることを保証するために、サービスに関する完全な通信フローを展開しなければならない。このフローに関するすべてのコンポーネントおよびプロセスは、依存関係グラフ内に反映させることができる。
【0026】
サービスコンポーネントは、顧客向きコンポーネントを直接サポートする論理コンポーネントである。たとえば、WAPを介した電子メールサービスは、GPRSサービス、WAPアクセスサービス、ならびにPOP3およびSMTPの両方の電子メールサービスコンポーネントを必要とする。サービスコンポーネントは、特定のサービスタイプに特有のコンポーネントの集まりを表し、様々なアプリケーションコンポーネント、ならびにそれらアプリケーション間で任意の必要な通信をサポートするのに必要なネットワークを組み合わせる。たとえば電子メールサービスは、POP3サーバアプリケーションコンポーネント、POP3プロキシアプリケーションコンポーネント、SMTPアプリケーションコンポーネント、およびこれらのアプリケーションクラスタを接続するためのIP LANに依存する。アプリケーションコンポーネントは、1つの特定なアプリケーションをサポートするために配置されたすべてのリソースを表し、1つまたは複数のサーバクラスタおよびクラスタ間での通信のための任意の必要なネットワークベアラサポートコンポーネントに依存する。たとえば、POP3サーバアプリケーションコンポーネントは、2つの別々のロードバランシングされたPOP3サーバクラスタを含むことができる。
【0027】
サーバクラスタコンポーネントは、クライアントから見ると単一のサーバを表し、単一のサーバまたはロードバランシングされたクラスタのいずれかに対するバックエンドであることが可能である。サーバクラスタは、いくつかのソフトウェアおよびホストコンポーネント、ならびにクラスタ間通信に必要な任意の必須ネットワークベアラコンポーネントに依存する。図2は、ロードバランシングされたサーバクラスタのサービスモデルの一例を示す図である。図1とは対照的に、図2(ならびにその後の図)では、下位要素が上位要素に与える影響を示すために、矢印は最下位要素から上に向かっている。サーバクラスタ200は、ロードバランサ210、複数のサーバ220および230、ならびにサーバと通信するためのIP LAN240という、4つのコンポーネントに依存する。図2では、インタフェース1〜6はロードバランサおよびサーバホスト上のIP LANインタフェースである。ロードバランサは2つのインタフェース1および4を有し、サーバはインタフェース2、5、および3、6を有する。これら以外に、インタフェース2および3のみがそれぞれインタフェース1および4に接続されると想定される。したがって、サーバ1の性能はインタフェース2および5の性能による影響を受け、サーバ2の性能はインタフェース3および6の性能による影響を受けるが、サーバクラスタの性能に影響を与えるのはインタフェース2および3の性能のみである。
【0028】
各コンポーネントタイプについて説明し、QoSアラートのトリガおよび伝搬に関する規則を示す。サーバクラスタサービスコンポーネントは、クライアントから見た単一のエントリ点を表し、ここで単一のサーバ、またはロードバランシングされたサーバクラスタ内の複数のサーバのいずれかによって、クライアント要求を処理することができる。サーバクラスタの一例がSMTPサーバクラスタであり、これはDNSラウンドロビン機構を使用して、いくつかのSMTPホスト間で着信するSMTPメッセージのバランスをとる。クラスタは、ロードバランシングソフトウェアを備えていない単一のホスト、またはロードバランシングソフトウェアを備えた複数のホストからなる。「ロードバランシング」という用語は、高水準のコンテキストで使用され、ソフトウェアを使用して複数のサーバ間で負荷のバランスをとるシステムのことを表すものであり、たとえば、ホストのオペレーティングシステムが複数のプロセッサ間でCPU負荷のバランスをとる、マルチプロセッサコンピュータホストを指すものではない。
【0029】
サーバクラスタは、性能アラート、負荷関係性能アラート、可用度アラート、およびバランシング誤りアラートを有することができる。性能および負荷アラートは、ソフトウェアサブコンポーネントにおける低性能または高負荷によってトリガされる。バランシング誤りアラートは、子サーバソフトウェアコンポーネントのうちの1つまたは複数が、他の子コンポーネントとは大きく異なる負荷レベルを経験している場合に、トリガされる。
【0030】
サーバクラスタコンポーネントはクラスタ全体を表し、マルチホストクラスタのロードバランシング機構と間違えられることはない。上記の例では、クラスタのDNSロードバランシング機構は、サービスモデルの別のロードバランシングコンポーネントとしてモデル化されることになり、これが親サーバクラスタコンポーネントに影響を与える。
【0031】
ネットワークベアラコンポーネントは、多種多彩な他のコンポーネントをサポートする移送関係のコンポーネントである。このコンポーネントは、全体ネットワークグループコンポーネント(いくつかのネットワークベアラコンポーネント間で共用される)、ならびに、特にベアラコンポーネントに影響を与えると思われる、特定のネットワークインタフェースおよびネットワークノードコンポーネントに依存する。たとえば、ホスト間の通信に共用IP LANを使用するサーバクラスタを表すベアラコンポーネントは、ネットワークベアラコンポーネントに依存することになり、次にこれが(1)IP LANネットワークグループコンポーネントおよび(2)個々のサーバホストインタフェースに依存することになる。次にIP LANは、ルータ、スイッチ、インタフェース、および他のネットワーク要素の集まりに依存することになり、このLANコンポーネントは、同じLANを共用する他のネットワークベアラコンポーネントに影響を与えることになる。図3は、ネットワークコンポーネントのサービスモデルの一例を示す図である。サービス対ネットワーク(Service-to-Network)300は、サービス−ネットワークインタフェース310および全体ネットワーク320に依存する。全体ネットワーク320は、複数のサブネットワーク330および340に依存する。
【0032】
マルチメディアメッセージングサービス(MMS)は、本発明のモデル化方法の一例として提示されている。MMSは、人から人への移動メッセージングのためのエンドツーエンドの格納および転送サービスである。イメージ、オーディオ、ビデオ、データ、およびテキストを含む豊富なマルチメディアコンテンツを提供するが、それでもなお簡単に使えるように設計されている。MMSはショートメッセージングサービス(SMS)に関する。しかしながら、MMSを使用した場合、SMSの場合のようにメッセージの最終送達はユーザに到達しない。むしろユーザは、メッセージの通知を受け、メッセージをダウンロードするオプションが与えられる。その結果、メッセージの送達は即時でない可能性がある。サービスは2段階である。第1に、一時記憶のために送信者(MM移動体)からMMSCにmmが送信され、その後、これがMMSCから、MM移動体、レガシー移動体、または電子メールクライアントである、宛先に送信される。
【0033】
MMSは3つのサブサービスMM−MM、MM−LM、およびMM−電子メールに分割される。各サブサービスについて、セットアップおよびデータ転送という2つの相が定義される。これらの相は、顧客のサービス知覚に直接関係するために定義される。顧客の知覚は、下位サービスまたはネットワークコンポーネントアラートの結果として生じる影響から導出される、サービス影響インデックス(SII)(サービスインデックスとも呼ばれる)の形で測定される。
【0034】
無線サービスは、移動体対移動体(MM−MM)、移動体対レガシー移動体(MM−LM)、電子メールベース、コンテンツ開始、およびプリペイドの、複数のサブサービスを含むことができる。移動体対移動体サブサービスが、本発明の一例として提示される。
【0035】
移動体対移動体サブサービスは、1)セットアップ相コンポーネント、および2)データ転送相コンポーネントの、2相コンポーネントに分解することができる。この分解の理由は、サービスのこれら2つの相がユーザによって知覚された場合にまったく異なる品質要件を有するためである。相がどのように他のコンポーネントに依存するかを理解するためには、サービスの明確な定義がなければならない。副相(sub−phase)1はハンドセット1(HS1)の認証である。副相2はHS1 WAP(無線アクセスプロトコル)の認証であり、副相3はHS1 マルチメディアメッセージングサービス(MMS)の認証である。副相4はHS1からMMSへのデータの転送である。副相5はハンドセット2(HS2)の通知/肯定応答である。副相6は送信するようにとのHS2の要求である。副相7はHS2の認証である。副相8はHS2へのデータの送信であり、副相9はHS1への通知である。
【0036】
影響分析の場合、これらの副相はセットアップ相およびデータ転送相のコンポーネントにグループ化される。これらの相および関連するネットワークコンポーネントがそれぞれたどったパスに基づいて、サービス依存モデルが作成される。サービス定義を理解することによって、サービスモデルを構築するための体系的な方法が可能になる。前述のように、MMSは4つのサブサービス(プリペイドを可能な5番目とする)に分割される。これらのコンポーネントの依存関係は、図4に示されている。MMSサービス400は、MM−MMサブサービス410、MM−LMサブサービス420、電子メールサブサービス430、およびサブサービスコンテンツ440を有する。この最初の3つのコンポーネントは、それぞれ、セットアップ相450およびデータ転送相460という2つの別々の相に分割することができる。これらの相は、顧客のサービス知覚に直接関係するために定義される。顧客の知覚は、下位サービスまたはネットワークコンポーネントアラートの結果として生じる影響から導出される、サービス影響インデックスの形で、または単にサービスインデックスと呼ばれる形で測定される。
【0037】
図5は、MMS汎用パケット無線サービス(GPRS)コンポーネント500を示す。これには2つの「子」コンポーネントがある。1つは、ゲートウェイGPRSサービスノード(GGSN)のアクセスポイント名(APN)インタフェースコンポーネント510である。もう1つが全体GPRSネットワークコンポーネント520であり、これはさらに、GPRSコア530、インターネットプロトコル(IP)ワイドエリアネットワーク(WAN)すなわちIP WAN 540、および無線アクセスネットワーク(RAN)550という、3つのサブコンポーネントに分解される。このモデルでは、GPRSネットワークの3つのコンポーネントは、ハンドセットとMMSサービスとの間の接続に関する一般性能情報のみを提供し、仮想接続固有の情報は提供しないものと想定される。固有の性能情報は、インタフェース固有のコンポーネントからのものであると想定される。
【0038】
図6〜9は、図5に示されたGPRSネットワークを含む、MMSサービスのサービス依存関係モデルを示す図である。このモデルは、前述の3つのカテゴリ、すなわちサービス、サーバ/クラスタ、およびネットワークのコンポーネントを使用する。図を簡略化するために、最下位のネットワークコンポーネントはHI(ホストおよびインタフェース)のグループにまとめられる。さらに、ここでは単一のサーバのみが示されているが、この概念はサービスクラスタにも適用可能である。加えて、地理的に異なる場所にあるが、クラスタは形成していない(すなわち、負荷共有のない)サーバが存在する場合、それらのサーバは、異なるネットワークコンポーネントによってサポート可能であるため、異なるサービスコンポーネント(以下の図には示されていない)とみなされる。
【0039】
4つのサブサービスに対応するサービスモデルが図6〜9に示されている。図6は、依存関係グラフ形式のMM−MMサービスモデル600の基本コンポーネントを示す図である。MM−MMサービス610のセットアップ部分は、SMSおよび信号方式システム7(SS7)ネットワーク630、認証サーバ(AuS)640、無線アクセスプロトコル(WAP)サーバ用認証642、リモート認証ダイヤルインユーザサービス(RADIUS)サーバ644、メッセージングアプリケーションルータ/マルチメディアメッセージサービスセンタ(MAR/MMSC)648(およびそのコンポーネントを介してIP WAN540へ)、ならびに加入者データ機能(SDF)サーバ650に依存する。このコンテキストでは、SMS性能それ自体が、サービス提供GPRSサポートノード(SGSN)とショートメッセージサービスセンタ(SMSC)インタフェースの間の信号方式インタフェース631、SMSC−SS7インタフェース632、GSM性能のSMS固有コンポーネント(GSM−SMS固有)633、SMS−SS7ネットワークの全体性能634、およびSGSN性能のSMS固有コンポーネント(SGSN SMS−s)635に依存する。SMS−SS7ネットワーク630は、RAN 550にも依存する。MM−MMセットアップコンポーネント610およびMM−MMデータ転送コンポーネント620は、どちらも、IPローカルエリアネットワーク(IP LAN)の全体性能652、マルチメディアメッセージサービスセンタ(MMSC)ネットワーク654、WAPネットワーク656、ならびに図5に記載されたGPRSネットワーク500に依存する。図6では、HIは図2に示されたホストクラスタおよびインタフェースを表す。
【0040】
図7は、依存関係グラフ形式のMM−LMサービスモデル700の基本コンポーネントを示す図である。MM−LMセットアップ相710およびMM−LMデータ転送相720に関するコンポーネントは、端末ゲートウェイサーバ(TGW)730への追加のそれぞれの依存関係を除き、すべて図6と同じである。
【0041】
図8は、依存関係グラフ形式のMM電子メールサービスモデル800の基本コンポーネントを示す図である。MM電子メールセットアップ相810およびMM電子メールデータ転送相820に関するコンポーネントは、メッセージ転送エージェント(MTA)830への追加のそれぞれの依存関係を除き、すべて図6と同じである。
【0042】
図9は、依存関係グラフ形式のMMSコンテンツサービス900の基本コンポーネントを示す図である。MMSコンテンツサービス900は、MMSコンテンツサービス相910およびMMSコンテンツデータ転送相920に加えて、登録相930を含む。MMSコンテンツセットアップ相910に関するすべてのコンポーネントは、図6と同じである。MMSコンテンツデータ転送920に関するコンポーネントは、情報コンテンツサーバ(ICS)サーバ940への追加の依存関係を除き、すべて図6と同じである。登録相930は、SMS−SS7 640、SDF 650、およびIP WAN 540という前述の3つのコンポーネント、ならびにICSサーバ940に依存する。加えて登録相930は、対話型音声応答(IVR)サーバ932、GSMサーバ934、およびICS対SDFサーバAPI(ICS−API)936に依存する。
【0043】
影響を受けるサービスの識別は、サービスがどのように実施されるかおよびサービスのコンポーネントに依存する。また、サービスコンポーネントのトポロジおよび構造にもかなり依存する。表面上は、サービスのサブコンポーネント(ルータまたはサーバなど)に関連付けられた任意のQoSアラートが、その性能が低下しているルータまたはサーバを使用するサービスが影響を受けていることを示唆するというように、結論付けようとしている場合がある。実際には、分析がさらに大きく関わっている。不確実さは、主に、IPネットワークの自己修復または障害隠蔽機能、およびサービスの実施に組み込まれた多くの耐障害性機構の結果である。
【0044】
簡単な例を挙げると、ルータインタフェースの障害は、ルーティングアルゴリズムによって自動的に迂回することが可能であり、その後、ルータインタフェース障害はそれ自体を容量の中のほんのわずかとして表すことが可能であり、これはトラフィック負荷に応じてエンドサービスに影響を与える場合や与えない場合がある。サービスの影響に対するQoSアラートの直接の関係の矛盾を示す他の例が、サーバのロードバランシングにある。このシナリオでは、それぞれがアプリケーションのコピーを実行中の複数のサーバ間で、アプリケーションがロードバランシングされる。サービスに対する要求は、DNSラウンドロビンまたはトラフィックベース割り振りなどの、あるロードバランシングアルゴリズムに従って、複数のサーバによって処理される。サーバの1つがハード障害を示す場合、そのサーバは使用不可となり、通常は重大なアラームである。しかしながら、他のサーバは依然として適切に機能しているため、(たとえばトラフィックベースの)ロードバランシングアルゴリズムに応じて、ここですべての要求を残りの健全なサーバに向けて送ることができる。このシナリオでは、負荷が軽い場合、ここでもサービスの影響が重大でない可能性がある。
【0045】
ソフトウェアサービスコンポーネントは、単一のアプリケーションまたはコンピュータホスト上で実行中の1片のアプリケーションを表す。サービスモデルでは、ソフトウェアコンポーネントはハードウェアホストおよび1つまたはいくつかのインタフェースに依存し、サーバクラスタコンポーネントに影響を与える。サーバソフトウェアコンポーネントの一例が、SMTPサーバアプリケーションプログラムである。ソフトウェアコンポーネントの他の例が、ソフトウェアベースのロードバランサアプリケーションである。
【0046】
性能アラート、負荷関係性能アラート、および可用度アラートという、いくつかの異なるタイプのアラートが、ソフトウェアコンポーネントから送出される。性能および負荷アラートはQoS性能アラートであり、負荷関係KPI(たとえば、ホストCPU負荷、インタフェース使用率、およびクライアントトランザクション回数など)のしきい値超過によってトリガされる。これらのKPIが中央値しきい値を超過した場合、サービスモデル内の影響を受けるサービスコンポーネントに性能アラートが送出され、同時に発生するすべての関係KPIしきい値超過を1つにまとめて、伝搬されるアラートにこれらを含める。
【0047】
IP LANサービスコンポーネント652は、いくつかのサーバおよびクラスタにIP接続を提供するために共通インフラストラクチャとして使用されるIPノードの集まりを表す。エンドツーエンド、プローブ、またはEMSベースのデータを使用して、これらネットワークの性能が判定される。個々のノード/インタフェース使用率データを使用して、今後の性能/可用度問題を示すネットワーク使用率が判定される。他のコンポーネントタイプの場合と同様に、関係する同時KPIしきい値超過が報告され、単一のアラートとして伝搬される。
【0048】
サービスモデルでは、サーバクラスタコンポーネントはIP LANコンポーネントに依存して、サーバとロードバランサとの間に接続を提供する。LANの性能、使用率、および可用度が、親サーバクラスタに影響を与える。
【0049】
図10は、2つのサブコンポーネントXおよびYで構成されるコンポーネントAに対する本発明の高水準アーキテクチャを示す。KPIアラートは、各KPIアラートを単独で分析するのではなく、X_KPI:{x1,x2,...xm}1010およびY_KPI:{y1,y2,...yn}1020などのコンポーネントごとのカテゴリにグループ化される。すべてのKPIアラートは、第1にコンポーネントごとにグループ化される。あるコンポーネント内のKPIアラートは、可用度および性能という2つの広範なカテゴリにさらにグループ化され、それぞれが規則エンジン1032および1042を使用するために、可用度インジケータ1034および1044ならびに性能インジケータ1036および1046を作成する。可用度および性能に加えて、たとえば使用率/負荷またはセキュリティなどの他の広範なカテゴリも実施できる可能性がある。規則エンジン1032および1034は、1つまたは複数の高水準プログラミング言語で作成された規則プログラムが実行可能な、汎用プロセッサである。
【0050】
可用度カテゴリは、コンポーネントの可用度レベルのインジケーションである。3つのレベルが定義される。レベル3では、ハードウェア障害状態などの場合、コンポーネントは完全にダウンする。レベル2では、コンポーネントは部分的にダウン、すなわちコンポーネントの一部がダウンする。レベル1では、ある統計的なダウンタイム属性がしきい値を超え、すべてのキー性能インジケータは低い値を示すが、これはコンポーネントが依然として稼働(up)しており、すべての性能測定値で非常に低い性能が示されていることを意味する。重大度に関しては、レベル3は最も重大であり、レベル1は最も重大でない。
【0051】
性能カテゴリは、コンポーネントの全体性能のインジケーションである。3つのレベルが定義される。レベル1では、性能はわずかに低下している。レベル2では性能は低下し、レベル3では性能はかなり低下している。
【0052】
加えて、アラートを識別するハンドルおよびアラートを記述するテキストのオプションフィールドが定義される。これらのハンドルは、技術者がアラートの原因により効率良く対処できることになる、特定のコンポーネントからのKPI情報である。
【0053】
コンポーネントアラートグループは、ハンドルと共に、コンポーネント状況インジケータ(CSL_alertグループ)を形成する。その後、CSIインジケータ1038および1048は規則処理要素1052と組み合わされて、コンポーネントAに関するCSIインジケータ1054を展開し、コンポーネントAはコンポーネントXおよびYに依存する。コンポーネントXは、レベル2の重大度の問題によって現在ダウンしているため、CSI可用度インジケータを転送する。コンポーネントYは、現在使用可能であるが性能はかなり低下している、すなわちレベル=3であるため、CSI性能インジケータを転送する。コンポーネントAは、コンポーネントxおよびyから受け取ったそれらに基づいて、可用度および性能のインジケータを転送する。CSI_alertグループの追加の例を以下に示す。
【0054】
CSI_Perf:[MMSC_Cluster:P=(レベル3);PH=010,059;“首尾良く送達されたメッセージの%<98%”]
CSI_Avail:[IP LAN:A=(レベル2=使用不可);ハンドル=12、“ルータxがダウン”]
CSI_alertグループが次の上位またはアップストリームレベルで親コンポーネントに伝搬する場合、親コンポーネントは2つのタスクを実行する。第1に、親コンポーネントは、そのダウンストリームにある「子」コンポーネントからのすべてのCSIおよびそのレベルで処理された任意のアラートを考慮に入れて、それ自体に関する可用度インジケータおよび性能インジケータを割り当てる。第2に、親コンポーネントは、その子の可用度および性能の両方のCSIの重要度レベルを修正するかどうかを判定する。
【0055】
CSIの可用度および性能インジケータの判定に使用される規則は、ユーザによる変更が可能である。表1は、影響を与える規則の一例である。
【0056】
【表1】
【0057】
規則は静的または動的とすることができる。静的規則は経時的に変化しない。動的規則は、加入者数、ある時点でのサービスの値、または地理によって、経時的に変化する可能性がある。規則は一般に、一貫性を持たせるために中央のネットワークオペレータによって作成されるが、規則が作成されているコンポーネントについて最も詳しい者の専門知識を考慮に入れるものとする。これによって、影響の分析において、またアラートの処理においても、コンポーネントに関する技術的な専門知識を使用することができる。
【0058】
各CSIグループには持続期間が割り当てられる。この持続期間は、含まれるすべてのハンドルの最大持続期間となるように定義される。たとえば、特定のCSI性能アラートグループが、ハンドルH1(持続期間1時間)、H2(持続期間30分)、およびH3(持続期間2時間)を含むものと想定する。このグループ内で最大持続期間を有するハンドルはH3である。したがって、全体CSI性能インジケータの持続期間は2時間である。個々のハンドルの持続期間は、ハンドルが現時点まで連続して活動状態であった時間の長さである。たとえば、システムが15分間隔でパケット損失情報を集め、そのパケット損失測定値が過去2回のサンプリング間隔で性能アラートしきい値を超えた場合、パケット損失アラートハンドルの持続期間は30分である。
【0059】
図11は、本発明に従ったサービス影響分析のための高水準流れ図である。ステップ1110で、複数のCSIアラート(X1...Xn)が集められ、CSIアラートが性能または可用度に影響を与えるかどうかを判定する意思決定論理に転送される。ステップ1120で、CSIアラートが性能または可用度に影響を与える場合、影響規則の適用を通じてアラートがサービスに影響を与えるかどうかを判定する追加の意思決定論理に転送される。アラートがサービスに影響を与えない場合、ステップ1140でアラートインベントリデータベースに転送および格納される。アラートインベントリは、アラートのパターンなどを探すために後で分析することができる。アラートがサービスに影響を与える場合、ステップ1130で影響を受けるサービスを識別するために使用される。ステップ1150で、影響を受けるそれぞれのサービスについて、影響を受ける顧客の数、影響を受ける特別顧客の数、影響を受ける特別サービスの数、サービス影響インデックス(SII)の程度、およびアラートの持続期間、というパラメータのうちの1つまたは複数を推定することによって、影響を受けるサービス上の影響が判定される。ステップ1160で、ステップ1150で集められた情報に基づいてサービス影響インデックスを生成するために規則が適用され、複数のSII(I(x1)...I(xn))を生成し、その後ステップ1170で、影響の量に基づいて優先順位リストに優先順位付けされる。この優先順位リストを使用して、ネットワークオペレータはサービスに最大の影響を与える問題にどのアラートが関係しているかを即時に識別することができる。
【0060】
本発明の代替実施形態では、中間規則を定義しないことによって実施を簡略化することができる。これは、下位レベルのコンポーネントについてアラート「CSI_Avail」および「CSI_Perf」がいったん定義されると、サービスモデルの中間コンポーネントによって修正されることがないことを意味する。
【0061】
CSIアラートがサービスに影響を与えるものと判定されると、サービスの品質低下に関する影響を定量化しなければならない。サービス影響インデックス(SII)は、事前に定義されたKQIセットの重み付け合計として定義することができる。図12は、この判定のためのプロセス流れを示す図である。ステップ1210で、影響を受けるそれぞれのサービスのそれぞれのコンポーネントへのKQI影響が判定される。ステップ1220で、それぞれのコンポーネントへのKQI影響の合計が算出される。ステップ1230で、影響を受けるユーザの数、アラートの持続期間、特別サービスへの影響などの情報に基づいた重み付け要素を使用して、KQI影響の合計に重み付けする。これらの重み付けおよび合計されたKQI影響が、その後、前述のように優先順位付け可能なサービス影響インデックスになる。
【0062】
本発明の方法の主要な要素について以下に要約して記載する。サービスの異なる相によって動かされるサービス依存関係モデルの作成は、サービス全体の1コンポーネントに過ぎない最下位のネットワークコンポーネントでのアラートが、サービス全体にどのように影響を与えるかを理解できるようになる上で重要である。アラートには「ハンドル」および重大度レベルが割り当てられる。各コンポーネントに対するコンポーネント状況インジケータを作成するためにアラートに適用される規則が定義される。各CSIがサービスモデル依存関係グラフのトップに向かって上方に伝搬されるにつれて、各CSIは事前に定義された規則に従って修正される。
【0063】
CSIがトップのサービスコンポーネントに伝搬される際に、サービス影響インデックスが作成される。影響を受けるそれぞれのサービスについて、アラートの持続期間、加入者の数、サービスの数、影響を受けるサービスのQoSクラス、またはユーザによって定義される他の要素に従って、重み(乗数)が定義される。重みは、SIIを乗算して全体の影響インデックスを得るために使用され、このインデックスがソートされて優先順位リストが得られる。
【0064】
優先順位付け用の主要な重みは以下の通りである。サービスインデックスは(セットアップおよびデータ転送からの)KQIの影響レベルから算出される。SIは各サブサービスについて別々に算出しなければならず、結果をすべて加算してサービス影響インデックスが形成される。
【0065】
加入者インデックスの数は、加入者数の重要性を表す数である。未処理の(outstanding)アラートの持続期間は、サンプリング期間に関して定義される。問題が矯正されると、アラートは除去されると予測される。長い未処理のアラートには、アラートを新しくするより多くの重みが与えられる。1〜3のインデックスは持続期間の重みを表すために使用される。サービスの数はCSIごとに識別され、合計影響は影響を受けるすべてのサービスに依存する。すべての重みが算出された後、特定のCSIについての単一のインデックスが得られる。表2および3は、複数のサービスにわたる個々のサービス影響インデックスの重み付け合計に基づいた、合計影響インデックスの計算を示す。
【0066】
【表2】
【0067】
【表3】
【0068】
前述の方法を拡張して、ネットワークオペレータがアラート優先順位付けおよびサービス影響分析中に生成された情報を根本原因分析のために使用できるようにすることが可能である。根本原因分析(RCA)は、1つまたは複数のアラートの根本原因を識別する問題に対処する。この問題は、前述のサービス影響分析およびアラート優先順位付けの逆である。サービス影響分析およびアラーム優先順位付けでは、サービスモデル依存関係グラフの各レベルで生成されたCSIが、次のレベルで追加のCSIを作成するために使用され、トップレベルでサービス影響インデックスを生成するために使用される。障害のサービス影響およびサービスの低下が識別され、アラートが優先順位付けされると、ネットワークオペレータによる根本原因の診断およびサービスの復元によって、問題修復の問題に対処することができる。この方法はRCAを支援し、追加の診断テストの必要性を最小限にする。パスに沿ってサービスモデル依存関係グラフ内を上方に、サービス影響分析およびそれに続くアラート優先順位付けをドリルダウンしていくこと、および1つまたは複数のCSIに含まれるアラートに関連付けられたハンドルを参照することによって、ネットワークオペレータは、サービスモデル依存関係グラフの最も可能性の高い最下位層での、ネットワーク障害またはサービス低下の最も可能性の高い原因を識別することができる。
【0069】
サービスモデル依存関係グラフのコンポーネントへのデータ入力は、(1)そのコンポーネントに関するアラートシステムからのアラート、(2)ダウンストリームの「子」コンポーネントからのCSI、および(3)プローブ、EMS、またはNMS)などのデータ収集エージェントから収集された性能データからなる。前述のように、上記入力はすべて、各コンポーネントについて規則セットを使用して処理される。この規則は、そのレベルでのCSIを発行するかどうかを判定し、これはその後アップストリームレベルまたは「親」コンポーネントによって使用可能である。規則エンジンがそのCSIを発行すべきであると判定する場合は、ある規則に合致したためである。規則に合致しない場合、アラートは抑制され、これは検査を受けたアラートがサービス問題を引き起こさないことを意味する。このアラートのコンポーネントレベルのフィルタリングにより、さらにアップストリームでの不必要な処理がなくなる。したがって、コンポーネント内での規則の実行は、潜在的な性能問題のローカル診断である。規則実行の結果により、サービスおよびシステムレベルの根本原因診断に使用可能な、価値ある情報が提供される。ネットワークオペレータは、CSIのハンドルコンポーネントおよびハンドル伝搬を介して、この情報を根本原因分析に使用することができる。
【0070】
図13を参照すると、コンポーネント4−1 1310内の規則が満たされたために、コンポーネント4−1 1310のアラート1は、コンポーネント4−1で搬送されるCSI_4−1(h1)のハンドルh1になる。この時点で、以下の表4で説明するように、CSI_4−1に関する情報がCSIテーブルに記録される。CSIテーブルは、CSI ID、ハンドル、タイムスタンプ、および合致した規則を識別する。CSI_4−1は、性能データおよびCSI_4−1を、コンポーネント3−1 1340へとアップストリームに伝搬し、ここでは異なる規則セットが、アラート2によって提供されるようなアラート情報を使用して、いずれかの規則が合致したかどうかを判定する。他の規則条件のうちの1つが満たされる場合、表4などのCSIテーブルに格納された関連情報と共にCSI_3−1が発行される。アラート2は、CSI_3−1内のハンドル2(h2)となる。
【0071】
コンポーネント4−2 1320、コンポーネント4−3 1330、コンポーネント3−3 1360、またはコンポーネント2−2 1380などのいくつかのコンポーネントでは、規則によってCSIを伝搬させるアラートがない可能性がある。同様の規則処理は、規則およびアラート3に基づいてハンドルh3を伴うCSI_3−2(h3)が生成されるコンポーネント3−2 1350と、規則セットならびに「子」コンポーネント3−1および3−2からのCSIに基づいてCSI_2−1(h1、h2、h3)が生成されるコンポーネント2−1 1370などの、他のコンポーネントでも発生する。h1およびh2などのハンドルが新しいCSIの生成と並行して伝搬される場合、逆のパスに関する情報がハンドルに追加されることになるため、CSIは以下のように表される。
【0072】
CSI_2−1=(.....h1(パス=2−1、3−1、4−1)、h2(パス=2−1、3−1)、h3(パス=2−1、3−2)
ハンドルのパスIDはコンポーネントIDを与え、これと並行してハンドルが伝搬される。別のテーブルが、ハンドルおよびその対応するアラート、しきい値、違反回数などに関する情報を格納する。ハンドルテーブルは、他のドリルダウンアクションが所望される場合、CSIの性質に関する他の情報を提供する。コンポーネント2−1 1370からのCSIを使用して、コンポーネント1−1 1390で、トップレベルCSIおよびサービス影響分析を展開することができる。
【0073】
【表4】
【0074】
根本原因分析時に、トップレベルへと進むハンドルは、根本原因の分析に関するすべての関連する相関情報を容易に取り出すための情報を担持する。この情報は、多くの根本原因分析が含まれるため、ネットワークオペレータまたはトラブルシュータにとって特に有用である。
【0075】
前述の方法は、一部の規則の適用およびCSIアラートの生成を中央オフィスに実行させることにより、サービスレベル管理機能の一部としてネットワークオペレーションセンタで、サービスビューロとして、または配布物で、実施可能である。規則は、多くの異なるプログラミング言語で1つまたは複数のプロセッサを汎用コンピュータ上で実行するために実施可能である。オフィスまたはオフィスの近くに配置されたコンポーネントに関する規則を実行するネットワークオペレーションセンタおよび中央オフィスプロセッサは、異なるプログラミング言語で作成された異なる規則セットを実行することができる。重要な要素は、CSIのフォーマット、およびCSIのフォーマットを介してダウンストリームプロセッサがアップストリームプロセッサと通信する機能である。また、アラートまたはCSIのいずれかを、サービスモデル依存関係グラフのダウンストリームレベルからアップストリームレベルへと渡すためには、コンポーネント間に通信パスが必要であり、こうしたパスは直接物理接続、またはインターネットなどのネットワーク接続を介した仮想接続である。
【0076】
前述の記述は、本発明を例示および説明するためにのみ提示したものである。本発明を網羅すること、または本発明を開示された任意の精密な形式に限定することは意図していない。上記の教示に鑑みて、多くの修正形態および変形形態が可能である。記載された明細書は、当業者が様々な応用例で、および企図された特定の用途に好適な様々な修正形態で、本発明を最も適切に使用できるように、本発明の原理およびその実際の応用例を最も良く説明するために選択および説明された。
【図面の簡単な説明】
【0077】
【図1】サービスモデル依存関係グラフの一例を示す図である。
【図2】ロードバランシングされたサーバクラスタのサービスモデルの一例を示す図である。
【図3】ネットワークコンポーネントのサービスモデルの一例を示す図である。
【図4】MMSサービスに関する高水準サービスモデル依存関係グラフを示す図である。
【図5】MMSサービスのMMS汎用パケット無線サービス(GPRS)コンポーネントに関するサービスモデル依存関係グラフを示す図である。
【図6】MMSのMM−MM部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図7】MMSサービスのMM−LM部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図8】MMSサービスのMM−Eメール部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図9】MMSサービスのMMSコンテンツ部分を含む基本コンポーネントの依存関係グラフを示す図である。
【図10】本発明のアラート優先順位付けシステムの高水準アーキテクチャを示す図である。
【図11】本発明のアラート優先順位付けおよびサービス影響分析方法のプロセス流れを示す図である。
【図12】本発明のサービス影響分析方法のプロセス流れを示す図である。
【図13】サービスモデル依存関係グラフにおける様々なコンポーネントレベルでのコンポーネント状況インジケータ(CSI)の生成を介したハンドルの伝搬のグラフを示す図である。
【特許請求の範囲】
【請求項1】
アップストリームおよびダウンストリームのコンポーネントを示すネストされたレベルセットに複数のコンポーネントを有するサービスモデル依存関係グラフによって表される遠隔通信ネットワークにおいて、アラートを処理するための方法であって
コンポーネントに関する1つまたは複数のアラートを受信するステップと、
受信された各アラートに関して、前記アラートに関する情報を含むハンドルを生成するステップと、
ダウンストリームコンポーネントのコンポーネント状況インジケータを利用する事前に定義された規則のセットと、前記コンポーネントで受信されたアラートから生成された前記ハンドルからの情報とに基づいて、前記コンポーネントに関するコンポーネント状況インジケータを生成するステップと、
前記規則評価の結果と、前記規則評価に使用されるハンドルと、前記ダウンストリームコンポーネントの前記コンポーネント状況インジケータとを、前記コンポーネントに関する前記コンポーネント状況インジケータに関連付けるステップと
を備えることを特徴とするアラートを処理するための方法。
【請求項2】
前記コンポーネント状況インジケータに、前記サービスモデル依存関係グラフを介して各ハンドルが通るパスを関連付けるステップをさらに備えることを特徴とする請求項1に記載の方法。
【請求項3】
前記ハンドルは、アラートのタイプ、アラートの時間、およびアラートの持続期間に関する情報を含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記サービスモデル依存関係グラフのトップレベルでサービス影響インデックスを生成するステップであって、前記サービス影響インデックスはサービスの品質に対するダウンストリームアラートの影響のインジケータである、生成するステップをさらに備えることを特徴とする請求項1に記載の方法。
【請求項5】
複数のサービスに関する前記サービス影響インデックスを合計することによって、合計影響インデックスを生成するステップをさらに備えることを特徴とする請求項4に記載の方法。
【請求項6】
前記合計影響インデックスは、所定の重み付け要素と掛け合わされた各サービスに関する前記サービス影響インデックスを合計することによって算出されることを特徴とする請求項5に記載の方法。
【請求項7】
サービス影響コンポーネント状況インジケータに関して根本原因分析を実行するステップをさらに備えることを特徴とする請求項2に記載の方法。
【請求項8】
サービス影響コンポーネント状況インジケータに関して根本原因分析を実行するステップは、
前記サービスモデル依存関係グラフを介して前記サービス影響ハンドルが通る前記パスを取り出すステップと、
前記サービス影響ハンドルが通る各コンポーネントで、前記コンポーネント状況インジケータに関連付けられた前記情報と、前記コンポーネントに関する前記関連付けられたハンドルとを取り出すステップと
を備えることを特徴とする請求項7に記載の方法。
【請求項9】
前記サービス影響インデックスに基づいて前記アラートの前記影響を優先順位付けするステップをさらに備えることを特徴とする請求項4に記載の方法。
【請求項10】
前記合計影響インデックスに基づいて前記アラートの前記影響を優先順位付けするステップをさらに備えることを特徴とする請求項5に記載の方法。
【請求項11】
1つまたは複数のコンポーネントに関するコンポーネント状況インジケータを生成するステップは、前記コンポーネントを収容する中央オフィス内で実行されることを特徴とする請求項1に記載の方法。
【請求項12】
コンポーネント状況インジケータを生成するステップは、中央ネットワークオペレーションセンタ内で実行されることを特徴とする請求項1に記載の方法。
【請求項13】
合計影響インデックスを生成し前記アラートの影響を優先順位付けするステップは、中央ネットワークオペレーションセンタ内で実行されることを特徴とする請求項10に記載の方法。
【請求項14】
サービスに影響を与えないアラートをアラートインベントリ内に格納するステップをさらに備えることを特徴とする請求項1に記載の方法。
【請求項15】
アップストリームおよびダウンストリームのレベルセットに複数のコンポーネントを有するサービスモデル依存関係グラフとしてモデル化される遠隔通信ネットワークにおいてアラートを処理するためのシステムであって、
前記ネットワークのコンポーネントでアラートを受信するための手段と、
各アラートに応答して、前記アラートに関する情報を提供するハンドルを生成するための手段と、
1つまたは複数のダウンストリームコンポーネントのコンポーネント状況インジケータと、各コンポーネントに関するコンポーネント状況インジケータを生成するためにアラートに応答して生成される前記ハンドルとを利用する、規則エンジンと、
前記規則評価の結果と、前記規則評価に使用される前記ハンドルと、前記ダウンストリームコンポーネントの前記コンポーネント状況インジケータとを、各コンポーネントに関する前記コンポーネント状況インジケータに関連付けるための手段と
を備えたことを特徴とするシステム。
【請求項16】
前記規則エンジンは前記コンポーネントに常駐することを特徴とする請求項15に記載のシステム。
【請求項17】
各コンポーネントと通信するネットワークオペレーションセンタをさらに備え、前記規則エンジンは、各コンポーネントに関する前記コンポーネント状況インジケータを生成するために前記規則評価を実行することを特徴とする請求項15に記載のシステム。
【請求項18】
前記ネットワークオペレーションセンタは、根本原因分析を実行するために前記ハンドル内の前記アラート情報を使用するための手段をさらに含むことを特徴とする請求項17に記載のシステム。
【請求項19】
前記ネットワークオペレーションセンタは、前記サービスモデル依存関係グラフのトップレベルに達するアラートのサービス品質影響を示すサービス影響インデックスを生成するための手段をさらに含むことを特徴とする請求項17に記載のシステム。
【請求項20】
前記ネットワークオペレーションセンタは、複数のサービスにわたって前記サービス品質への影響を示す合計影響インデックスを生成するための手段をさらに含むことを特徴とする請求項19に記載のシステム。
【請求項1】
アップストリームおよびダウンストリームのコンポーネントを示すネストされたレベルセットに複数のコンポーネントを有するサービスモデル依存関係グラフによって表される遠隔通信ネットワークにおいて、アラートを処理するための方法であって
コンポーネントに関する1つまたは複数のアラートを受信するステップと、
受信された各アラートに関して、前記アラートに関する情報を含むハンドルを生成するステップと、
ダウンストリームコンポーネントのコンポーネント状況インジケータを利用する事前に定義された規則のセットと、前記コンポーネントで受信されたアラートから生成された前記ハンドルからの情報とに基づいて、前記コンポーネントに関するコンポーネント状況インジケータを生成するステップと、
前記規則評価の結果と、前記規則評価に使用されるハンドルと、前記ダウンストリームコンポーネントの前記コンポーネント状況インジケータとを、前記コンポーネントに関する前記コンポーネント状況インジケータに関連付けるステップと
を備えることを特徴とするアラートを処理するための方法。
【請求項2】
前記コンポーネント状況インジケータに、前記サービスモデル依存関係グラフを介して各ハンドルが通るパスを関連付けるステップをさらに備えることを特徴とする請求項1に記載の方法。
【請求項3】
前記ハンドルは、アラートのタイプ、アラートの時間、およびアラートの持続期間に関する情報を含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記サービスモデル依存関係グラフのトップレベルでサービス影響インデックスを生成するステップであって、前記サービス影響インデックスはサービスの品質に対するダウンストリームアラートの影響のインジケータである、生成するステップをさらに備えることを特徴とする請求項1に記載の方法。
【請求項5】
複数のサービスに関する前記サービス影響インデックスを合計することによって、合計影響インデックスを生成するステップをさらに備えることを特徴とする請求項4に記載の方法。
【請求項6】
前記合計影響インデックスは、所定の重み付け要素と掛け合わされた各サービスに関する前記サービス影響インデックスを合計することによって算出されることを特徴とする請求項5に記載の方法。
【請求項7】
サービス影響コンポーネント状況インジケータに関して根本原因分析を実行するステップをさらに備えることを特徴とする請求項2に記載の方法。
【請求項8】
サービス影響コンポーネント状況インジケータに関して根本原因分析を実行するステップは、
前記サービスモデル依存関係グラフを介して前記サービス影響ハンドルが通る前記パスを取り出すステップと、
前記サービス影響ハンドルが通る各コンポーネントで、前記コンポーネント状況インジケータに関連付けられた前記情報と、前記コンポーネントに関する前記関連付けられたハンドルとを取り出すステップと
を備えることを特徴とする請求項7に記載の方法。
【請求項9】
前記サービス影響インデックスに基づいて前記アラートの前記影響を優先順位付けするステップをさらに備えることを特徴とする請求項4に記載の方法。
【請求項10】
前記合計影響インデックスに基づいて前記アラートの前記影響を優先順位付けするステップをさらに備えることを特徴とする請求項5に記載の方法。
【請求項11】
1つまたは複数のコンポーネントに関するコンポーネント状況インジケータを生成するステップは、前記コンポーネントを収容する中央オフィス内で実行されることを特徴とする請求項1に記載の方法。
【請求項12】
コンポーネント状況インジケータを生成するステップは、中央ネットワークオペレーションセンタ内で実行されることを特徴とする請求項1に記載の方法。
【請求項13】
合計影響インデックスを生成し前記アラートの影響を優先順位付けするステップは、中央ネットワークオペレーションセンタ内で実行されることを特徴とする請求項10に記載の方法。
【請求項14】
サービスに影響を与えないアラートをアラートインベントリ内に格納するステップをさらに備えることを特徴とする請求項1に記載の方法。
【請求項15】
アップストリームおよびダウンストリームのレベルセットに複数のコンポーネントを有するサービスモデル依存関係グラフとしてモデル化される遠隔通信ネットワークにおいてアラートを処理するためのシステムであって、
前記ネットワークのコンポーネントでアラートを受信するための手段と、
各アラートに応答して、前記アラートに関する情報を提供するハンドルを生成するための手段と、
1つまたは複数のダウンストリームコンポーネントのコンポーネント状況インジケータと、各コンポーネントに関するコンポーネント状況インジケータを生成するためにアラートに応答して生成される前記ハンドルとを利用する、規則エンジンと、
前記規則評価の結果と、前記規則評価に使用される前記ハンドルと、前記ダウンストリームコンポーネントの前記コンポーネント状況インジケータとを、各コンポーネントに関する前記コンポーネント状況インジケータに関連付けるための手段と
を備えたことを特徴とするシステム。
【請求項16】
前記規則エンジンは前記コンポーネントに常駐することを特徴とする請求項15に記載のシステム。
【請求項17】
各コンポーネントと通信するネットワークオペレーションセンタをさらに備え、前記規則エンジンは、各コンポーネントに関する前記コンポーネント状況インジケータを生成するために前記規則評価を実行することを特徴とする請求項15に記載のシステム。
【請求項18】
前記ネットワークオペレーションセンタは、根本原因分析を実行するために前記ハンドル内の前記アラート情報を使用するための手段をさらに含むことを特徴とする請求項17に記載のシステム。
【請求項19】
前記ネットワークオペレーションセンタは、前記サービスモデル依存関係グラフのトップレベルに達するアラートのサービス品質影響を示すサービス影響インデックスを生成するための手段をさらに含むことを特徴とする請求項17に記載のシステム。
【請求項20】
前記ネットワークオペレーションセンタは、複数のサービスにわたって前記サービス品質への影響を示す合計影響インデックスを生成するための手段をさらに含むことを特徴とする請求項19に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公表番号】特表2007−522770(P2007−522770A)
【公表日】平成19年8月9日(2007.8.9)
【国際特許分類】
【出願番号】特願2006−553267(P2006−553267)
【出願日】平成17年2月11日(2005.2.11)
【国際出願番号】PCT/US2005/004385
【国際公開番号】WO2005/079292
【国際公開日】平成17年9月1日(2005.9.1)
【出願人】(399047921)テルコーディア テクノロジーズ インコーポレイテッド (61)
【Fターム(参考)】
【公表日】平成19年8月9日(2007.8.9)
【国際特許分類】
【出願日】平成17年2月11日(2005.2.11)
【国際出願番号】PCT/US2005/004385
【国際公開番号】WO2005/079292
【国際公開日】平成17年9月1日(2005.9.1)
【出願人】(399047921)テルコーディア テクノロジーズ インコーポレイテッド (61)
【Fターム(参考)】
[ Back to top ]