説明

ネットワーク信頼性評価装置及び方法

【課題】 サービスの種類やサービス利用状況に大きく依存する、故障によるユーザへの影響の増大傾向が変化する経過時間を精度よく算出する。
【解決手段】 本発明は、ネットワーク装置の故障発生後の故障に関連する最初のユーザの申告発生から、その後のユーザ申告が発生するまでの時間(経過時間)及び経過時間毎のユーザ申告の累積件数に基づいて、発生している故障を対象として、評価時点の故障の経過時間と故障に関するユーザ申告件数の関係を故障部位毎に算出し、現時点のユーザ申告件数の累積傾向を把握する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク信頼性評価装置及び方法に係り、特に、故障に関するユーザからの問い合わせ(以下、ユーザ申告とする)の情報を用いて、故障が継続した場合におけるユーザへの影響の増大傾向を推定するためのネットワーク信頼性評価装置及び方法に関する。
【背景技術】
【0002】
IPネットワーク技術の発展に伴い、ネットワークを構成する装置(以下、ネットワーク装置とする)の高機能化・高性能化が進んでおり、故障の要因となる部位の種類が増大している。特に、機能拡充の著しいネットワーク装置の故障においては、同一装置においても、複数の部位が故障して複数のサービスに影響を及ぼすケースがある。図1にその一例を示す。同図では、"装置1"内においてサービスXを提供する部位B、サービスYを提供する部位Cが故障していることを示している。
【0003】
通常、複数の部位が故障している場合、故障の影響を受けるユーザ数(以下、影響ユーザ数とする)を故障部位毎に比較し、影響ユーザ数の大きい順に故障部位の回復を試みるが、実際の故障によるユーザへの影響は、影響ユーザ数だけでなく、故障によって影響を受けるサービス(以下、影響サービス)やユーザのサービス利用状況に大きく依存している。すなわち、影響ユーザ数だけで、故障によるユーザへの影響を故障部位毎に評価・推定することは難しい。
【0004】
また、故障によるユーザへの影響は故障の継続時間に応じて増大していくが、その増大傾向は故障の発生時間帯によって異なる。例えば、利用頻度が低い時間帯に発生した故障の場合、発生直後では、ユーザが故障に気づく可能性が低いため、ユーザへの影響は緩やかに増大していくが、利用頻度の高い時間帯まで故障が継続した場合、ある時点を境に急激に増大する。
【0005】
故障によるユーザへの影響の評価・推定技術として、
(1)影響ユーザ数と故障の継続時間に基づいて、該当故障によるユーザへの影響を評価する手法(例えば、非特許文献1参照);
(2)故障によるユーザへの影響の増大傾向が、故障の継続時間に応じて変化していると考え、故障発生後の経過時間に伴い増加するユーザ申告の累積件数に基づいて、評価する手法(例えば、非特許文献2参照);
が挙げられる。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】松川達哉,船越裕介,"信頼性管理のためのネットワーク不稼働率分析評価手法の検討",信学技報、CQ2008-8.
【非特許文献2】越地弘順,松川達哉、船越裕介,"ユーザ影響特性を考慮した信頼性評価法の一検討",2010年信学ソ大,B-11-13.
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記の(1)の技術では、過去に発生した故障の情報に基づいて、故障が回復した時点のユーザへの影響のみを評価しているため、故障回復までのユーザへの影響の変動傾向は把握できていない。すなわち、サービス利用状況によって変化する、故障によるユーザへの影響の変動や、故障がさらに継続した場合のユーザへの影響の増大傾向については推定できない。また、故障を装置単位で分類しており、影響サービスの種類を考慮していない。
【0008】
上記の(2)の技術では、故障発生後の経過時間によって増大するユーザへの影響をユーザ申告の累積件数に基づいて評価している。当該技術では、ネットワークの運用管理者の任意でユーザ申告発生率の閾値を設定し、この閾値を超過している時間を算出することによって故障によるユーザへの影響の増大傾向が変化した時間を算出し、ユーザへの影響が著しく増大する時間の範囲を算出している。
【0009】
故障によるユーザへの影響は故障の部位によって異なる。つまり、故障部位毎に申告件数や申告の発生傾向も異なるため、ユーザへの影響が著しく増大する時間の範囲を算出するためには、故障部位毎に申告発生率の閾値を設定しなければならない。閾値の設定は、ネットワーク運用管理者の過去の経験に基づいて行われるため、ネットワーク運用管理者の各種故障に関する対応の経験が浅い場合、非常に難しい。つまり、設定したユーザ申告発生率の閾値の設定が適切でない場合は、故障によるユーザへの影響の増大傾向が変化した時間が検出されない、もしくは、誤って検出されるという問題がある。
【0010】
本発明は、上記の点に鑑みなされたもので、サービスの種類やサービス利用状況に大きく依存する、故障によるユーザへの影響の増大傾向が変化する経過時間を、故障の部位に依存せずに精度よく算出することが可能なネットワーク信頼性評価装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
上記の課題を解決するため、本発明は、ネットワーク信頼性評価装置であって、
ユーザからネットワーク装置の故障部位毎に、故障に関連するユーザ申告の発生日時情報及び故障部位に関する情報を申告情報として取得して記憶手段に格納する受信手段と、
前記記憶手段から前記申告情報を読み出して、初めて申告した日時(初申告日時)を基点とし、その後の申告発生までの経過時間を求め、故障部位毎に、該経過時間毎の申告累積件数を算出する累積件数算出手段と、
サービスの種類やサービス利用状況に応じて変化するユーザから申告件数の累積傾向を、前記経過時間毎の申告累積件数を用いて、故障部位毎に算出する累積傾向算出手段と、を有する。
【0012】
また、本発明は、前記申告情報の前記発生日時情報に基づいて、該申告情報を受信した時間間隔である申告発生間隔を算出し、該申告発生間隔の増減値を算出し、該申告発生間隔の増減値が所定の値以上の経過時間を算出し、該経過時間が算出された場合は、前記申告累積件数に基づいて、現時点における申告の累積傾向を算出する累積傾向算出手段を更に有する。
【0013】
また、本発明は、前記累積傾向算出手段で算出された前記現時点における申告件数の累積傾向の変化する経過時間に基づいて、故障部位毎に、現時点における申告件数の累積傾向に補正処理を行う累積傾向補正手段を更に有する。
【0014】
また、本発明は、前記累積傾向補正手段で算出された現時点の申告件数の累積傾向を故障部位毎に比較し、累積傾向の大きい順に故障部位を抽出し、該故障部位に関する情報を表示手段に出力する故障部位抽出手段を更に有する。
【発明の効果】
【0015】
上記のように本発明は、故障に関するユーザ申告の情報を用いて、故障が継続した場合におけるユーザへの影響の増大傾向を推定する際に、ユーザへの影響の増大傾向が変化する経過時間を、統計的手法を用いることによって、故障部位に依存することなく、精度良く算出する。さらに、複数の部位が故障する場合において、ユーザへの影響の増大傾向を故障部位毎に比較評価することにより、優先的に回復すべき故障部位を抽出するシステムを提供する。これにより、サービスの種類やサービス利用状況に大きく依存する、故障によるユーザの影響の増大傾向が変化する経過時間を精度よく算出することができる。
【0016】
さらに、同一装置において、複数の部位が故障して複数のサービスに影響を与えるネットワーク装置を故障事例の対象として、優先的に回復すべき故障部位を抽出することができ、抽出した順番に従って故障部位を回復させることにより、ユーザへの影響を最小限に抑えることができる。
【図面の簡単な説明】
【0017】
【図1】同一装置における複数部位故障の一例である。
【図2】本発明の一実施の形態におけるネットワーク信頼性評価装置の構成図である。
【図3】本発明の一実施の形態における評価手順のフローチャートである。
【図4】本発明の一実施の形態における故障に関連するユーザ申告の発生日時情報の一例である。
【図5】本発明に一実施の形態における故障情報の一例である。
【図6】本発明の一実施の形態における装置に入力された経過時間と経過時間毎の累積件数の一例である。
【図7】本発明の一実施の形態における経過時間と申告累積件数の線形近似イメージである。
【図8】本発明の一実施の形態における補正処理手順のフローチャートである。
【図9】本発明の一実施の形態における申告発生間隔算出時のサンプル数を3とした場合の申告発生区間である。
【図10】本発明の一実施の形態における補正処理後の経過時間と申告累積件数の線形近似イメージである。
【発明を実施するための形態】
【0018】
以下図面と共に、本発明の実施の形態を説明する。
【0019】
図2は、本発明の一実施の形態におけるネットワーク信頼性評価装置の構成を示す。
【0020】
同図に示す装置は、受信部10、経過時間算出部21、経過時間毎累計件数算出部22、累積傾向算出部30、申告発生間隔算出部40、申告発生間隔増減算出部50、累積傾向変化経過時間算出部60、累積傾向再算出部70、故障部位抽出部80、ネットワーク故障情報DB91,ユーザ申告情報DB92,複数の記憶部101〜105から構成される。また、当該装置には、サンプル数、危険率を入力する入力装置1、表示装置2が接続されている。
【0021】
上記の構成における動作を以下に示す。
【0022】
以下の手順は、同一機種において、複数の部位の故障が発生した場合、ユーザへの故障影響を最小限に抑えるために、優先的に回復すべき故障部位の抽出を行うことを目的として実施する。
【0023】
図3は、本発明の一実施の形態における評価手順のフローチャートである。
【0024】
ステップ100) 受信部10は、故障部位ごとに図4に示すような故障に関連するユーザ申告の発生日時情報と、図5に示すような故障発生日時や故障による影響エリア、影響サービス、影響ユーザ数等の故障情報を故障部位毎に取得して、それぞれ、ユーザ申告情報DB92,ネットワーク故障情報DB91に格納する。本明細書における「申告」とは、故障の影響を受けているユーザが故障対応窓口に問い合わせることを指す。本発明では、故障対応窓口において、ユーザからの当該問い合わせを受理することにより取得した対応履歴情報を外部のデータベースに入力していることを前提とし、受信部10において、当該データベースから発生日時情報、故障情報を読み込むものとする。
【0025】
ステップ200) 経過時間算出部21は、ユーザ申告情報DB92を参照して、部位毎に、発生日時情報の申告発生時刻から現在時刻までの経過時間tn(n=1,2,3,…)を求める。次に、経過時間毎累積件数算出部22は、部位毎、経過時間tn毎の申告累積件数を算出し、故障部位毎に記憶部102に格納する。この例を図6に示す。
【0026】
ステップ300) 累積傾向算出部30は、ステップ200で求められ、記憶部102に格納されている初申告受付(図6の"2010/4/4 9:01")から現時点までの経過時間毎の申告累積件数を読み出して、現時点における申告の累積傾向を算出する。これは、経過時間と申告累積件数の関係を線形近似によって近似式を導出したときの傾きである。近似式は図7に示すように経過時間毎の申告累積件数を散布図にプロットしたときの各点からの残差の二乗和が最小となるような直線(最小二乗法による線形近似)の傾きと切片を算出して導出し、記憶部102に格納されている情報も含めて記憶部103に格納する。
【0027】
ステップ400) 以下では、上記のステップ300で算出された傾きについての補正処理について説明する。
【0028】
経過時間毎の申告累積件数は、影響サービスの種類や故障の発生時間帯等の様々な要因に影響を受けているため、必ずしも一定の間隔で増加するわけではない。例えば、利用頻度の低い時間帯に発生した故障場合、故障発生の直後では、ユーザが障害に気づく可能性が低いため、申告件数の累積傾向は緩やかであるが、利用頻度の高い時間帯まで故障が継続した場合は、ある時点を境に急激に増加し始める。このように申告件数の累積傾向は故障発生後の経過時間に応じて変化する。現時点における申告件数の累積傾向を精度よく算出するためには、この申告件数の累積傾向の変化を考慮する必要があるため、従って、以下に示す補正処理を行う。
【0029】
図8は、本発明の一実施の形態における補正処理手順のフローチャートである。
【0030】
ステップ420) 入力装置1から、記憶部103に格納されている申告発生毎の経過時間tnに基づいて申告発生間隔Δtm(m=1,2,3,…)を算出するためのサンプル数kをネットワーク運用管理者が任意に入力し、記憶部104に格納する。そして、申告発生間隔算出部40において、式(1)に示すとおりに申告発生間隔Δtmを算出する。
【0031】
Δt=tn+1−tn-k (1)
しかしながら、申告発生間隔Δtは、サンプル数kを最小の2として算出した場合、バラつきが大きくなってしまうため、サンプル数kを3以上として算出する。図9にサンプル数kを3とした場合の申告発生間隔を示す。
【0032】
また、以下のステップ430〜ステップ480で検定を行うため、算出した申告発生間隔のデータ数が4つ以上になる必要がある。従って、入力するサンプル数kは3以上、かつ、現時点における申告累積件数にマイナス3の値以下となる。
【0033】
ステップ430) 申告発生間隔増減算出部50は、式(2)に示すように算出した申告発生間隔Δtmに基づいて申告発生間隔の増減E(i=,1,2,3,…)を算出する。
【0034】
i=Δtm+1−Δtm (2)
ステップ440) 累積傾向変化経過時間算出部60は、申告件数の累積傾向が変化している経過時間を算出するために、申告発生間隔の増減Eが著しく変化している経過時間を算出する。申告発生間隔Δtmに変化があった場合、申告発生間隔の増減Eが著しく増大、もしくは減少するため、これを申告発生間隔の増減Eが正規分布に従うと仮定して外れ値検定することにより、申告発生間隔Δtmが変化した経過時間(申告発生間隔Δtmを算出したサンプルの中で最小の経過時間)を算出し、これが申告件数の累積傾向の変化した経過時間Tdl(l=1,2,3,…)となる。式(3)に示すように、算出された申告発生間隔の増減Eの検定測定量Tiを算出する。
【0035】
【数1】

但し、inowはステップ420で算出された申告発生間隔の増減Eの数であり、
【0036】
【数2】

は申告発生間隔の増減Eの平均値である。
【0037】
ステップ450) ネットワーク運用管理者が入力装置1より任意の危険率αを入力する。一般的に危険率はα=0.025(危険率2.5%)である。累積傾向変化経過時間算出部60は、入力された危険率αとステップ420で算出された申告発生間隔の増減Eの数inowに基づいて、統計的判定に必要な優位点Tinow(α)を算出する。これは、自由度inow−2、危険率αのt値である。
【0038】
ステップ460) 累積傾向変化経過時間算出部60は、|T|≧Tinow(α)となる申告発生間隔の増減Eを算出し、申告件数の累積傾向が変化した経過時間Tdlを算出する。
【0039】
ステップ470) 経過時間が算出されたかを判定し、算出された場合はステップ480に移行し、算出されない場合は当該処理を終了する。
【0040】
ステップ480) 累積傾向再算出部70は、ステップ460で算出された経過時間(算出されたTdlの最大値)から記憶部103に格納されている現時点までの経過時間毎の申告累積件数に基づいて、現時点における申告の累積傾向を算出し直す。これは、経過時間と申告累積件数の関係を線形で近似した際の傾きである。近似式は図10に示すように経過時間Tdlmaxから現時点までの経過時間毎の申告累積件数を散布図にプロットしたときの各点からの残差の二乗和が最小となるような直線の傾きと切片を算出して導出し、記憶部105に格納する。
【0041】
なお、申告発生間隔の変化が検出されない場合(Eiの値が所定の値以下の場合)、上述の補正処理は行わない。
【0042】
ステップ500) 故障部位抽出部80は、ステップ200で算出された傾きと、ステップ400で補正された傾きを故障部位毎に比較評価し、傾きの大きい順に故障部位を抽出し、故障部位に関する故障情報、故障発生から現時点までの経過時間、現時点のユーザ申告の累積件数等の故障情報を表示部2に表示する。抽出された順番が早い故障部位から優先的に対処することでユーザへの故障影響を最小限に抑える。
【0043】
なお、上記の図2に示すネットワーク信頼性評価装置の構成要素の動作をプログラムとして構築し、ネットワーク信頼性評価装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0044】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0045】
1 入力装置
2 表示部
10 受信部
21 経過時間算出部
22 経過時間毎累積件数算出部
30 累積傾向算出部
40 申告発生間隔算出部
50 申告発生間隔増減算出部
60 累積傾向変化経過時間算出部
70 累積傾向再算出部
80 故障部位抽出部
91 ネットワーク故障情報DB
92 ユーザ申告情報DB
101〜105 記憶部

【特許請求の範囲】
【請求項1】
ネットワーク信頼性評価装置であって、
ユーザからネットワーク装置の故障部位毎に、故障に関連するユーザ申告の発生日時情報及び故障部位に関する情報を申告情報として取得して記憶手段に格納する受信手段と、
前記記憶手段から前記申告情報を読み出して、初めて申告された日時(初申告日時)を基点とし、その後の申告発生までの経過時間を求め、故障部位毎に、該経過時間毎の申告累積件数を算出する累積件数算出手段と、
サービスの種類やサービス利用状況に応じて変化するユーザからの申告される故障件数の累積傾向を、前記経過時間毎の申告累積件数を用いて、故障部位毎に算出する累積傾向算出手段と、
を有することを特徴とするネットワーク信頼性評価装置。
【請求項2】
前記申告情報の前記発生日時情報に基づいて、該申告情報を受信した時間間隔である申告発生間隔を算出し、該申告発生間隔の増減値を算出し、該申告発生間隔の増減値が所定の値以上の経過時間を算出し、該経過時間が算出された場合は、前記申告累積件数に基づいて、現時点における申告の累積傾向を算出する累積傾向算出手段を更に有する
請求項1記載のネットワーク信頼性評価装置。
【請求項3】
前記累積傾向算出手段で算出された前記現時点における申告の累積傾向の変化する経過時間に基づいて、故障部位毎に、現時点における申告件数の累積傾向に補正処理を行う累積傾向補正手段を更に有する
請求項1または2に記載のネットワーク信頼性評価装置。
【請求項4】
前記累積傾向補正手段で算出された現時点の申告件数の累積傾向を故障部位毎に比較し、累積傾向の大きい順に故障部位を抽出し、該故障部位に関する情報を表示手段に出力する故障部位抽出手段を更に有する
請求項1乃至3のいずれか1項に記載のネットワーク信頼性評価装置。
【請求項5】
ネットワーク信頼性評価方法であって、
受信手段が、ユーザからネットワーク装置の故障部位毎に、故障に関連するユーザ申告の発生日時情報及び故障部位に関する情報を申告情報として取得して記憶手段に格納する受信ステップと、
累積件数算出手段が、前記記憶手段から前記申告情報を読み出して、初めて申告された日時(初申告日時)を基点とし、その後の申告発生までの経過時間を求め、故障部位毎に、該経過時間毎の申告累積件数を算出する累積件数算出ステップと、
累積傾向算出手段が、サービスの種類やサービス利用状況に応じて変化するユーザからの申告される故障件数の累積傾向を、前記経過時間毎の申告累積件数を用いて、故障部位毎に算出する累積傾向算出ステップと、
を行うことを特徴とするネットワーク信頼性評価方法。
【請求項6】
累積傾向算出手段が、前記申告情報の前記発生日時情報に基づいて、該申告情報を受信した時間間隔である申告発生間隔を算出し、該申告発生間隔の増減値を算出し、該申告発生間隔の増減値が所定の値以上の経過時間を算出し、該経過時間が算出された場合は、前記申告累積件数に基づいて、現時点における申告の累積傾向を算出する累積傾向算出ステップを更に行う
請求項5記載のネットワーク信頼性評価方法。
【請求項7】
累積傾向補正手段が、前記累積傾向算出ステップで算出された前記現時点における申告の累積傾向の変化する経過時間に基づいて、故障部位毎に、現時点における申告件数の累積傾向に補正処理を行う累積傾向補正ステップを更に行う
請求項5または6に記載のネットワーク信頼性評価方法。
【請求項8】
故障部位抽出手段が、前記累積傾向補正ステップで算出された現時点の申告件数の累積傾向を故障部位毎に比較し、累積傾向の大きい順に故障部位を抽出し、該故障部位に関する情報を表示手段に出力する故障部位抽出ステップを更に行う
請求項5乃至7のいずれか1項に記載のネットワーク信頼性評価方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−253442(P2012−253442A)
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願番号】特願2011−122591(P2011−122591)
【出願日】平成23年5月31日(2011.5.31)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】