説明

伝送装置及び伝送装置の故障判別方法

【課題】メモリの異常が発生した場合に、メモリの異常がソフトエラーに起因するものであるか否かを正確に判別することができる伝送装置及び伝送装置の故障判別方法を提供する。
【解決手段】ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法であって、前記伝送装置は、前記データをメモリに記憶する。伝送装置は、前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出する。また、伝送装置は、前記データが読み書きされる際に、メモリの使用量を計測し、前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量に基づいて判別する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークを介して受信したデータを伝送する技術に関する。
【背景技術】
【0002】
コンピュータで扱われるデータ量の増大により、メモリに対する書き込み処理や読み出し処理等の処理の高速化が進められている。例えば、ネットワークを介してデータの伝送を行う伝送装置では、近年のデータ伝送量の急激な増大に伴い、メモリに対して正確な処理を高速で実行することが求められている。
【0003】
伝送装置は、伝送されるデータに含まれる送信先情報に基づいて、データを送信先ノードに伝送する。また、伝送装置は、データを送信先ノードに伝送するまでの間、ネットワークを介して受信したデータをメモリに一時的に記憶する。そして、伝送装置は、データをメモリから順次読み出し、読み出したデータを、送信先情報に対応する送信先ノードに伝送する。
【0004】
メモリに記憶される情報は、各メモリセルのキャパシタの電荷の形で記憶されるが、宇宙線等の放射線がキャパシタに照射された場合に、電荷が失われデータが書き換わってしまうことがあり、この現象はソフトエラーと呼ばれている。メモリに記憶されたデータが読み出される際に、物理的な故障やソフトエラー等のメモリの異常に起因して、データの異常が発生する場合がある。このメモリの異常によって発生したデータの異常を修正する技術として、ECC(Error Correcting Code)回路を用いたものが知られている。ECC回路を有する伝送装置は、ネットワークを介して受信したデータに対してECCを付加し、ECCを付加したデータをメモリに書き込む。そして、伝送装置は、メモリから読み出したデータの異常をチェックし、データの異常が検出された場合に、検出された異常を修正し、修正したデータを伝送する。
しかしながら、ECC回路の規模は大きいため、データ伝送量の増大に伴って大容量のメモリが設けられた伝送装置の全てのメモリに対してECC回路を設けることは、伝送装置の製造コストが増大するので困難であった。
【0005】
従来、ECC回路を持たない伝送装置について、このようなメモリの異常が発生した場合には、メモリユニットの交換処理が行われる。そして、異常が発生したメモリユニットを用いてログ解析や異常の再現試験等が行われることにより、メモリユニットの異常原因が調査されていた。
しかしながら、メモリユニットの交換処理は、メモリユニットの交換や異常の再現試験等を行う人員及び時間が必要になるため、煩雑な処理となっていた。また、メモリの異常がソフトエラーに起因する場合には、再現試験においてメモリの異常が再現しないことがあるため、異常原因の調査に多くの時間を要していた。さらに、メモリユニットの交換処理中にはネットワークが停止されることから、ネットワークシステムの稼働率が低下するおそれがあった。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−201786号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
ところで、メモリの異常がメモリの物理的な故障に起因する場合には、メモリに対するデータの読み書きが困難であることから、メモリユニットの交換処理を行う必要がある。その一方で、メモリの異常がソフトエラーに起因する場合には、伝送データをメモリに再度記憶させて伝送データの内容を更新することにより、メモリの異常が解消されることが多い。すなわち、メモリの異常がソフトエラーに起因する場合には、メモリユニットの交換処理を行う必要がない。
よって、メモリの異常が発生した場合に、この異常がメモリの物理的な故障に起因するものであるか又はソフトエラーに起因するものであるかを正確に判別することができれば、全てのメモリユニットについて交換処理を必要とせずに、上述した異常原因の調査の負担、ネットワークの稼働率の低下を軽減できる。しかしながら、従来は、メモリの異常がソフトエラーに起因するものであった場合でも、メモリユニットを常に交換する必要があった。
【0008】
よって、発明の1つの側面では、メモリの異常が発生した場合に、メモリの異常がソフトエラーに起因するものであるか否かを正確に判別することができる伝送装置及び伝送装置の故障判別方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
第1の観点では、ネットワークを介して受信したデータを伝送する伝送装置が提供される。
この伝送装置は、
前記データを一時的に記憶するメモリと、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出する検出部と、
前記データが前記メモリに読み書きされる際に、前記メモリの使用量を計測する計測部と、
前記異常が前記検出部によって検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに前記計測部によって計測された、前記使用量の累積値を示す累積使用量に基づいて判別する判別部と、を備える。
【0010】
第2の観点では、ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法が提供される。
この故障判別方法は、
前記データを一時的にメモリに記憶し、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出し、
前記データが前記メモリに読み書きされる際に、前記メモリの使用量を計測し、
前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量に基づいて判別する。
【発明の効果】
【0011】
開示の伝送装置及び伝送装置の故障判別方法によれば、メモリの異常が発生した場合に、メモリの異常がソフトエラーに起因するものであるか否かを正確に判別することができる。
【図面の簡単な説明】
【0012】
【図1】実施形態の伝送装置の構成を示すブロック図。
【図2】実施形態の伝送装置の機能ブロック図。
【図3】実施形態の制御部及びRAM管理部の機能ブロック図。
【図4】実施形態のRAM使用量の計測処理を示すフローチャート。
【図5】実施形態の伝送装置の故障判別方法を示すフローチャート。
【発明を実施するための形態】
【0013】
以下、本実施形態の伝送装置及び伝送装置の故障判別方法について説明する。本実施形態に係る伝送装置は、例えばルータやスイッチ等のように、有線又は無線のネットワークの伝送路上に設けられ、ネットワーク上のあるノードから受信したパケットを他のノードに伝送する装置である。なお、パケットは、データの一例である。
【0014】
[伝送装置の構成]
先ず、本実施形態の伝送装置10の構成について説明する。図1は、伝送装置の構成を示すブロック図である。この伝送装置10には、CPU(Central Processing Unit)11、チップセット12、RAM(Random Access Memory)13、BIOS−ROM14、電源供給部15、HDD(Hard Disk Drive)16、通信インタフェース17、多重化回路18、スイッチング回路19及び出力デバイス20を含む。チップセット12は、伝送装置10内の各部とデータバス及び制御バスによって接続されている。
CPU11は、伝送装置10の用途に応じて設けられる各種のプログラムを実行する。また、CPU11は、電源が伝送装置10に投入されたときに、各種のプログラムを実行する。CPU11は、HDD16あるいはROM(Read Only Memory)に記憶されたプログラムを呼び出して起動することにより、後述する制御部21、RAM管理部23をソフトウェアモジュールとして生成する。従って、CPU11がプログラムを実行するとき、CPU11は、制御部21、RAM管理部23の機能を実質的に担う。
チップセット12は、CPU11と他の各部とのインタフェースのための制御回路、各部を制御するためのレジスタを含む。チップセット12は、例えば汎用インタフェースであるGPI(General Purpose Interface)に対応してよい。なお、チップセット12は、複数のチップセットを含むように構成されてもよい。例えば、チップセット12は、CPU11が接続された第1チップセットと、RAM13が接続された第2チップセットとを含み、各チップセットの間で制御信号等が通信可能に構成されてもよい。
RAM13は、CPU11のメインメモリである。RAM13は、CPU11が実行するプログラムやCPU11が参照するデータを一時的に記憶するための揮発性記憶装置である。RAM13は、パケット等のデータを記憶するメモリの一例である。
BIOS−ROM14は、BIOS(Basic Input/Output System)を記憶する。BIOSは、ハードウェアとの基本的な入出力処理を行うための基本入出力システム(プログラム)である
電源供給部15は、伝送装置10の各部への電源を供給する。
HDD16は不揮発性記憶装置であり、オペレーティングシステム(OS)やOS上で実行されるプログラムを記憶する。
通信インタフェース17は、ネットワークを介して接続された他のノードとの間でパケットを送受信するためのインタフェースである。通信インタフェース17は、ネットワークを介してパケットを受信するための複数の入力ポートと、ネットワークを介してパケットを送信するための複数の出力ポートとを有している。
多重化回路18は、ネットワークから通信インタフェース17の各入力ポートを介して受信したパケットを多重化するための回路である。多重化回路18は、後述する多重化部21の機能を実質的に担う。
スイッチング回路19は、パケットに記録された出力ポートの情報に基づいて、通信インタフェース17の各出力ポートのうち対応する出力ポートにパケットを出力するための回路である。スイッチング回路19は、後述するスイッチング部26の機能を実質的に担う。
出力デバイス20は、例えば、ブザーやLED(Light Emitting Diode)ランプ等の、伝送装置10の1又は複数の出力デバイスを総称して表記するものである。
【0015】
次に、図2を参照して、実施形態の伝送装置10の機能につき説明する。図2は、実施形態の伝送装置10の機能ブロック図である。図2に示すように、伝送装置10は、制御部21、多重化部22、RAM管理部23、出力ポートテーブル24、パケットバッファ25、スイッチング部26を含む。
なお、図2では、パケットのデータフロー(全体として図2の紙面上左から右の方向に太線で示す。)を表示してある。また、図2では、パケットが伝送装置10の各出力ポートから出力される場合について示しているが、別の出力先、例えば、通信装置10に装着される通信用カード又は当該通信用カード内に設定されている出力ポートである場合も同様の構成をとることが可能である。
【0016】
制御部21は、HDD16に記憶されたプログラムを実行することにより、伝送装置10全体の制御を行う。多重化部22、RAM管理部23及びスイッチング部26それぞれの処理は、制御部21によって制御される。
多重化部22は、通信インタフェース17の各入力ポートを介してネットワークから受信したパケットを多重化する。
【0017】
RAM管理部23は、RAM13の記憶領域に設けられた出力ポートテーブル24を参照して、各パケットに含まれる宛先アドレスに対応する出力ポートを特定し、その特定した出力ポートの情報を各パケットに記録する。
また、RAM管理部23は、パケットを、RAM13の記憶領域に設けられたパケットバッファ25に記憶する。また、RAM管理部23は、制御部21からのパケット読み出し要求に応じて、パケットバッファ25内のパケットを読み出し、読み出したパケットをスイッチング部26へ送出する。なお、パケットバッファ25に記憶されているパケットは、RAM管理部23によって定期的に読み出されてもよい。
【0018】
スイッチング部26は、RAM管理部23から送出されるパケットに記録された出力ポートの情報に基づいて、通信インタフェース17の各出力ポートのうち対応する出力ポートにパケットを出力する。
【0019】
次に、図3を参照して、制御部21及びRAM管理部23について詳細に説明する。図3は、制御部21及びRAM管理部23の機能ブロック図である。図3に示すように、RAM管理部23は、アクセス制御部100、検出部101、計測部102を含む。また、制御部21は、判別部111と累積部112とを含む。
なお、図3では、RAM管理部23におけるパケットのデータフロー(入力パケットPK_INから出力パケットPK_OUTに至るフロー)を太線で示してある。
【0020】
アクセス制御部100は、入力パケットPK_INをパケットバッファ25に記憶する。また、アクセス制御部100は、制御部21からのパケット読み出し要求に応じて、パケットバッファ25に記憶されたパケットを読み出す。読み出されたパケットは、出力パケットPK_OUTとしてスイッチング部26に出力される。さらに、アクセス制御部100は、パケットバッファ25に記憶されたパケットが読み出されると、パケットバッファ25に記憶されたパケットのデータ量を表す情報と、読み出されたパケットのデータ量を表す情報とを、計測部102に送信する。
また、アクセス制御部100は、制御部21からRAM制御信号を受信すると、RAM制御信号の内容に応じて、RAM13に記憶されているデータの読み書きを行う。RAM制御信号によって読み書きされるデータは、パケットと異なるデータであって、例えば、出力ポートテーブル23や、MAC(Media Access Control)アドレスの一覧を示すテーブル情報等のデータである。アクセス制御部100は、RAM制御信号に応じてRAM13に記憶されたデータを読み出すと、読み出されたデータのデータ量を表す情報を計測部102に送信する。
【0021】
検出部101は、入力パケットPK_INに対して、誤り検出用のパリティビットを付加する。これにより、パリティビットが付加されたパケットがパケットバッファ25に記憶される。また、検出部101は、パケットバッファ25に記憶されたパケットがアクセス制御部100によって読み出されると、出力パケットPK_OUTに付与されているパリティビットを用いて、RAM13の異常の有無を検出する。検出部101は、パリティビットを用いて、出力パケットPK_OUTの内容に誤りが存在することを検出すると、異常検出信号を制御部21の判別部111に送信する。なお、パリティビットは誤り検出符号の一例であり、他の誤り検出符号を用いてもよい。
計測部102は、アクセス制御部100から受信した情報に基づき、RAM13に記憶されたデータのデータ量を、RAM13の使用量として計測する。また、計測部102は、例えばアップダウンカウンタ等の計数回路を用いてデータ量を計測してもよい。
【0022】
判別部111は、RAM13の異常が検出部101によって検出されると、RAM13の異常がソフトエラーに起因するものであるか否かを、RAM13の使用量の累積値を示す累積使用量に基づいて判別する。
累積部112は、所定時間(例えば1秒)が経過する毎に、RAM13の使用量を計測部102から取得する。累積部112は、RAM13の使用量を取得する毎に、取得した使用量を累積することにより、RAM13の累積使用量をもとめる。
判別部111は、所定時間(例えば1時間)が経過する毎に、累積部112から累積使用量を取得する。なお、累積使用量は、累積部112によってもとめられる毎に、累積部112から判別部111に送信されるようにしてもよい。
【0023】
[RAM使用量の計測]
次に、図4を参照して、RAM管理部23にて行われる、RAM使用量の計測処理について説明する。図4は、RAM使用量の計測処理を示すフローチャートである。
先ず、RAM管理部23は、多重化部22からパケットを受信すると、(S101:YES)、受信したパケットに出力ポートの情報を記録する。また、RAM管理部23の検出部101は、受信したパケットにパリティビットを付加する。そして、RAM管理部23のアクセス制御部100は、パリティビットが付加されたパケットを、パケットバッファ25にFIFO(First In First Out)方式で記憶する(S102)。また、アクセス制御部100は、S101においてパケットを受信していない場合に(S101:NO)、S103の処理に移行する。
なお、パケットバッファ25に対するパケットの書き込み方式は、FIFO方式に限定されることはない。
【0024】
アクセス制御部100は、パケット読み出し要求を制御部21から受信すると(S103:YES)、パケットバッファ25に記憶されたパケットのうちパケット読み出し要求に応じた数のパケットを読み出す(S104)。そして、アクセス制御部100は、パケットバッファ25に記憶されたパケットが読み出されると、パケットバッファ25に記憶されたパケットのデータ量を表す情報と、読み出されたパケットのデータ量を表す情報とを、計測部102に送信する。すなわち、パケットの読み出し処理が行われる前後における各パケットのデータ量を表す情報が、計測部102に送信される。
また、アクセス制御部100は、計測部102に情報を送信した後に、読み出されたパケットをパケットバッファ25から消去する。
なお、アクセス制御部100は、パケット書き込み要求を制御部21から受信した場合に、パケットバッファ25に書き込まれるパケットのデータ量を表す情報を計測部102に送信してもよい。
【0025】
そして、計測部102は、アクセス制御部100から受信した情報に基づき、RAM13の使用量を計測する(S105)。計測部102は、RAM13に記憶されたパケットのデータ量と、読み出された伝送データのデータ量との差を、RAM13の使用量として計測する。この差は、読み出されたパケットの消去後にパケットバッファ25に残存するパケットのデータ量を表している。
ここで、RAM13の使用量を計測する方法の一例について説明する。例えば、パケットバッファ25の先頭アドレスから順に、パケットの書き込み及び読み出しが行われる場合には、先ず、パケットの書き込みアドレスの値とパケットの読み出しアドレスの値との差分をもとめる。そして、アドレスに対応するバッファのデータ容量に当該差分の値を掛ける。これにより、RAM13の使用量がもとめられる。なお、アドレスに対応するパケットのデータ量に当該差分の値を掛けることにより、RAM13の使用量がもとめられてもよい。
なお、上述した計測方法は一例であり、この計測方法に限定されるものではない。
また、計測部102は、パケットがパケットバッファ25に新たに記憶された場合に、新たに記憶されたパケットのデータ量をRAM13の使用量として計測してもよい。
【0026】
次に、検出部101は、S104にて読み出されたパケットのパリティビットを用いてパケットのデータの誤りを検出することにより、RAM13の異常の有無を検出する。そして、検出部101は、RAM13の異常を検出すると(S106:YES)、異常検出信号を判別部111に送信する(S107)。
なお、アクセス制御部100がパケット読み出し要求を受信していない場合には(S103:NO)、S108の処理が行われる。また、検出部101がRAM13の異常を検出しなかった場合には(S106:NO)、S108の処理が行われる。
【0027】
次に、アクセス制御部100は、RAM制御信号を制御部21から受信すると(S108:YES)、RAM制御信号の内容に応じて、RAM13に記憶されているデータの読み書きを行う(S109)。ここで、アクセス制御部100は、RAM13に記憶されたデータをRAM制御信号に応じて読み出した場合に、読み出されたデータのデータ量を表す情報を計測部102に送信する。
一方、計測部102は、アクセス制御部100から受信した情報に基づき、RAM13の使用量を計測する(S110)。例えば、アクセス制御部100が、所定の読み出しアドレスに対応するデータをRAM13から読み出した場合には、当該データのデータ量がRAM13の使用量となる。また、アクセス制御部100がRAM13の全ての記憶領域に対して読み出し処理を行った場合には、RAM13の全記憶容量がRAM13の使用量となる。
なお、計測部102は、RAM制御信号に応じて、新たなデータをRAM13に記憶した場合に、新たなデータのデータ量をRAM13の使用量として計測してもよい。
なお、アクセス制御部100がRAM制御信号を受信していない場合には(S108:NO)、S101の処理が行われる。
【0028】
[伝送装置の故障判別方法]
次に、図5を参照して、制御部21にて行われる、伝送装置10の故障判別方法について説明する。図5は、伝送装置の故障判別方法を示すフローチャートである。
先ず、制御部21の判別部111は、故障判別用の閾値を設定する(S201)。ここで、故障判別用の閾値は、検出部101によって検出された異常が、ソフトエラー又は物理的な故障の何れに起因するものであるかを判別するための情報である。
この閾値の設定方法の一例を説明する。例えばRAM等の記憶装置の故障率は、一般に100FIT(Failure In Time)/Mbitと表される。これは、記憶装置が10億(1E9)時間動作した場合に、1Mbit当たり100回の異常が発生することを表している。また、この故障率を100で割った値(=1E7)が、1回の異常が発生するまでの記憶装置の動作時間となる。そして、記憶装置の故障率を累積使用量として表すと、1E6(bit)×1E7(時間)=1E13(bit)となる。すなわち、累積使用量が1E13(bit)になったときに1回の異常が発生することになる。本実施形態では、一般的な記憶装置の故障率に基づき算出される累積使用量の2倍、すなわち2E13(bit)を故障判別用の閾値として設定する。
【0029】
次に、累積部112は、所定時間(例えば1秒)が経過すると(S202:YES)、RAM13の使用量を計測部102から取得する(S203)。そして、累積部112は、取得した使用量を既に取得した使用量に累積し(S204)、S202の処理を行う。すなわち、累積部112が、S202〜S204の処理を繰り返し行うことにより、RAM13の累積使用量がもとめられる。
【0030】
次に、判別部111は、S202にて所定時間が経過していない場合に(S202:NO)、検出部101から異常検出信号を受信すると(S205:YES)、RAM13の異常がソフトエラーに起因するか否かを判別するための故障判別処理を行う(S206)。なお、判別部111が異常検出信号を受信していない場合には(S205:NO)、S202の処理が行われる。
【0031】
ここで、故障判別処理について具体的に説明する。先ず、判別部111は、累積部112から累積使用量を取得する。次に、判別部111は、累積使用量と、検出部101によって検出された異常の回数との比を算出する。これにより、1回の異常当たりの累積使用量がもとめられる。そして、判別部111は、1回の異常当たりの累積使用量と、S206にて設定した閾値との大小比較を行う。
例えば、RAM13の記憶容量が4.6Gbitであって、RAM13の1時間当たりの平均使用率が30%である場合には、累積部112によってもとめられるRAM13の1時間当たりの累積使用量は、1.4E9(bit)となる。また、この累積使用量の状態が2年間継続したときにRAM13の1回目の異常が検出されると、異常が検出されるまでの累積使用量は、1.4E9(bit)×24(時間)×365(日)×2(年)≒2.4E13(bit)となる。
そして、累積使用量が閾値よりも小さい場合には、判別部111は、物理的な故障がRAM13に発生したと判別する。一方、累積使用量が閾値以上である場合には、判別部111は、ソフトエラーがRAM13に発生したと判別する。
従って、上記の例において、判別部111は、ソフトエラーがRAM13に発生したと判別する。
なお、上記の例において、検出された異常が2回目であった場合には、1回の異常当たりの累積使用量は、2.4E13/2=1.2E13(bit)となる。この場合、累積使用量が閾値よりも小さくなるため、判別部111は、物理的な故障がRAM13に発生したと判別する。
【0032】
そして、判別部111が、RAM13の異常がソフトエラーに起因するものであると判別すると(S207:YES)、S202の処理が行われる。
一方、判別部111は、RAM13の異常が物理的な故障に起因するものであると判別すると(S207:NO)、異常情報を出力するように出力デバイス20を制御する(S208)。
【0033】
これにより、RAM13の異常がメモリの物理的な故障に起因するものであるか又はソフトエラーに起因するものであるかを、RAM13の累積使用量に基づいて正確に判別することができる。
【0034】
なお、上記のフローでは、一つのRAM13の累積使用量を用いて異常原因の判別を行っているが、例えば、記憶容量の小さい複数の記憶装置の累積使用量を合計した値を用いて異常原因の判別を行ってもよい。例えば、RAMの記憶容量が36Mbitであって、RAMの1時間当たりの平均使用率が20%である場合には、累積部112によってもとめられる1時間当たりのRAMの累積使用量は7.2E6(bit)となる。また、この記憶装置が1000台運用されている場合に、1E9時間当たりに発生する異常の回数は、100(FIT/Mbit)×7.2(Mbit)×1000(台)=7.2E5回となる。つまり、1回の異常が、1E9/7.2E5≒1.4E3時間経過したときに発生する。これにより、1回の異常が検出されるまでの累積使用量は、1E6(bit)×1.4E3(時間)=1.4E9(bit)となる。そして、1回の異常が検出されるまでの累積使用量と閾値とを用いて、異常原因の判別を行うことが可能になる。
【0035】
以上説明したように、本実施形態によれば、RAM13の異常がメモリの物理的な故障に起因するものであるか又はソフトエラーに起因するものであるかを、RAM13の累積使用量に基づいて正確に判別することができる。このため、RAM13の異常がソフトエラーに起因するものである場合には、メモリユニットの交換処理を不要にすることが可能になる。従って、メモリユニットの交換処理が行われる頻度を低減することができるので、メモリユニットの異常原因の調査の負担やネットワークの稼働率の低下を軽減できる。また、RAM13の異常が物理的な故障に起因するものである場合には、メモリユニットの交換処理を早期に行うことができるので、RAM13の物理的な故障によってネットワークに通信異常が発生することを事前に防ぐことができる。
【0036】
また、本実施形態によれば、RAM13に記憶されたパケットが読み出されると、RAM13に記憶されたパケットのデータ量と読み出されたパケットのデータ量との差が、使用量として計測される。これにより、RAM13に残存するパケットのデータ量をRAM13の使用量として正確に計測することができる。
【0037】
さらに、本実施形態によれば、検出された異常がソフトエラーに起因するものであるか否かは、累積使用量と、検出された異常の回数とに基づいて判別される。これにより、1回の異常当たりの累積使用量に基づいて異常原因を判別することができる。従って、異常がソフトエラーに起因するものであるか否かを、より正確に判別することができる。
【0038】
以上、本発明の実施形態について詳細に説明したが、本発明の伝送装置、伝送装置の故障判別方法は上記実施形態に限定されず、本発明の主旨を逸脱しない範囲において、種々の改良や変更をしてもよいのは勿論である。
【0039】
例えば、累積部112によってもとめられた累積使用量が、他の装置によって読み出し可能に構成されてもよい。
【0040】
以上の各実施形態に関し、さらに以下の付記を開示する。
【0041】
(付記1)
ネットワークを介して受信したデータを伝送する伝送装置であって、
前記データを一時的に記憶するメモリと、
前記メモリに記憶された伝送データが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出する検出部と、
前記データが前記メモリに読み書きされる際に、前記メモリの使用量を計測する計測部と、
前記異常が前記検出部によって検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに前記計測部によって計測された、前記使用量の累積値を示す累積使用量に基づいて判別する判別部と、を備える、
伝送装置。
【0042】
(付記2)
前記計測部は、前記メモリに記憶されたデータが読み出されると、前記メモリに記憶されたデータのデータ量と読み出されたデータのデータ量との差を、前記使用量として計測する、付記1に記載の伝送装置。
【0043】
(付記3)
前記判別部は、前記異常がソフトエラーに起因するものであるか否かを、前記累積使用量と、前記検出部によって検出された前記異常の回数とに基づいて判別する、付記1または2に記載の伝送装置。
【0044】
(付記4)
前記判別部は、前記異常がソフトエラーに起因するものであるか否かを、前記累積使用量と前記検出部によって検出された前記異常の回数との比から算出した1回の異常当たりの累積使用量と、前記メモリの故障率に基づいて算出した1回の異常当たりの累積使用量との大小比較によって判別する、付記1〜3の何れか1つに記載の伝送装置。
【0045】
(付記5)
ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法であって、
前記データを一時的にメモリに記憶し、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出し、
前記データが前記メモリに読み書きされる際に、前記メモリの使用量を計測し、
前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量に基づいて判別する、
伝送装置の故障判別方法。
【0046】
(付記6)
ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法であって、
前記データを一時的にメモリに記憶し、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出し、
前記メモリに記憶されたデータが読み出されると、前記メモリに記憶されたデータのデータ量と読み出されたデータのデータ量との差を、前記使用量として計測し、
前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量に基づいて判別する、
伝送装置の故障判別方法。
【0047】
(付記7)
ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法であって、
前記データを一時的にメモリに記憶し、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出し、
前記データが前記メモリに読み書きされる際に、メモリの使用量を計測し、
前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量と、前記検出部によって検出された前記異常の回数とに基づいて判別する、
伝送装置の故障判別方法。
【0048】
(付記8)
ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法をコンピュータに実行させるプログラムであって、
前記データを一時的にメモリに記憶し、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出し、
前記データが前記メモリに読み書きされる際に、メモリの使用量を計測し、
前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量に基づいて判別する、
処理をコンピュータに実行させるプログラム。
【符号の説明】
【0049】
10…伝送装置
13…RAM
25…パケットバッファ
100…アクセス制御部
101…検出部
102…計測部
111…判別部
112…累積部

【特許請求の範囲】
【請求項1】
ネットワークを介して受信したデータを伝送する伝送装置であって、
前記データを一時的に記憶するメモリと、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出する検出部と、
前記データが前記メモリに読み書きされる際に、前記メモリの使用量を計測する計測部と、
前記異常が前記検出部によって検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに前記計測部によって計測された、前記使用量の累積値を示す累積使用量に基づいて判別する判別部と、を備える、
伝送装置。
【請求項2】
前記計測部は、前記メモリに記憶されたデータが読み出されると、前記メモリに記憶されたデータのデータ量と読み出されたデータのデータ量との差を、前記使用量として計測する、請求項1に記載の伝送装置。
【請求項3】
前記判別部は、前記異常がソフトエラーに起因するものであるか否かを、前記累積使用量と、前記検出部によって検出された前記異常の回数とに基づいて判別する、請求項1又は2に記載の伝送装置。
【請求項4】
前記判別部は、前記異常がソフトエラーに起因するものであるか否かを、前記累積使用量と前記検出部によって検出された前記異常の回数との比から算出した1回の異常当たりの累積使用量と、前記メモリの故障率に基づいて算出した1回の異常当たりの累積使用量との大小比較によって判別する、請求項1〜3の何れか1項に記載の伝送装置。
【請求項5】
ネットワークを介して受信したデータを伝送する伝送装置の故障判別方法であって、
前記データを一時的にメモリに記憶し、
前記メモリに記憶されたデータが読み出されるときに、読み出されたデータに基づいて前記メモリの異常の有無を検出し、
前記データが前記メモリに読み書きされる際に、前記メモリの使用量を計測し、
前記異常が検出されると、前記異常がソフトエラーに起因するものであるか否かを、前記異常が検出されるまでに計測された、前記使用量の累積値を示す累積使用量に基づいて判別する、
伝送装置の故障判別方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−249154(P2012−249154A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2011−120377(P2011−120377)
【出願日】平成23年5月30日(2011.5.30)
【出願人】(000005223)富士通株式会社 (25,993)
【出願人】(000237662)富士通テレコムネットワークス株式会社 (682)
【Fターム(参考)】