説明

データ誤り訂正装置、データ誤り訂正方法

【課題】 伝送路二重化システムにおいて、エラー検出時のパス切り替えによる遅延を解消し、制御の連続性を確保し、信頼性確保、性能向上を図ることができるデータ誤り訂正装置などを提供する。
【解決手段】 各系統の伝送路より伝送されるデータを所定の単位ごとに区分けして当該データの誤りを検出するデータ受信誤り検出部201、211と、前記データ間の同期を行う二系統同期化部220と、一方の系統の前記単位ごとに区分けしたデータのうち誤りを含むものを廃棄し、他方の系統の正常なデータを選択する誤り訂正部230を有し、伝送路二重化システムにて伝送されるデータの誤りを訂正する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のLSI(Large Scale Integration)が二重化された伝送路で接続された伝送路二重化システムに用いられるデータ誤り訂正装置などに関する発明である。
【背景技術】
【0002】
科学技術計算の分野において年々高まる計算性能の向上要求に対応するため、高性能なLSIが開発されている。一方、そのように高性能を実現するが故にLSI間のインタフェースも増大している。このため、LSIの入出力インタフェースはシリアル化されている。しかし、従来のようなパラレルデータのLSI間の受け渡しに比べ、シリアルデータでの受け渡しは、そのエラーレートが高くなる傾向にある。このため、少ないハードウェアリソース量でエラー訂正を行い、運用し続ける事が必要となる。
【0003】
この様な場合、第一の問題として、二重化されている片系統は半スタンバイ状態であるため、通常系のエラー検出時に切り替えによる遅延が発生し制御の連続性が保てず、性能低下が発生していた。
【0004】
第二の問題として、障害により一旦切り替えられた系は、再復旧できないため、障害が二回発生すると、計画停止により保守を行うか、インタフェースを閉塞せざるを得ない状況にあった。
【0005】
第三の問題として、この種の信頼性確保手段として、再送方式があるが、障害が発生した場合、再送が伴うため、前記同様、制御の連続性を保つことができず、性能低下が発生していた。
【0006】
上記問題点に関する具体的事情を、図5を参照して説明する。図5は従来の伝送路二重化システムに使用されるデータ誤り訂正装置の構成を図示したブロック図である。図5を参照すると、データ転送の始点となる第一のLSI100と、第一のLSI100からの2つのデータ転送経路と、データ転送経路からデータが転送され、データの終点となる第二のLSI200とで構成される。
【0007】
第一LSI100は、一つのデータの処理内容を指示する内部論理部101と、一つのデータを内部論理部101からの指示により二重化して2つのデータ転送経路にデータを送出するデータ二重化送信部102とで構成される。
【0008】
第二のLSI200は、データ二重化送信部102から転送されたそれぞれのデータの受信処理を行い、受信した各々のデータの誤り検出を行い、そのエラー情報と共に先着判定部250へデータを送出するデータ受信誤り検出部201、211と、データ受信誤り検出部201、211から送出されたデータのうち先着したデータを先着データとして扱う先着判定部250と、先着データを受信する受信データレジスタ260と、受信データレジスタ260より送出されたデータのエラー判定を行い、その判定結果に応じてパスを切り替えるエラー判定パス切り替え部270と、エラー判定パス切り替え部270より送出されたデータの処理内容を指示する内部論理部280から構成される。
【0009】
従来の伝送路二重化システムでは図5に示す様に、二重化された片系統はスタンバイ状態にあり、運用系に障害が発生した場合、エラー判定パス切り替え部270において、切り替え動作を行うため、運用系経路が後着であった場合は、先着したスタンバイ側のデータを使用する必要がある。そのため、先着判定部250において先着データを確保しておくためのバッファが必要となり、回路規模が大きくなる問題が有った。
【0010】
更に、エラー判定パス切り替え部270において、切り替え動作による時間を有し、遅延が発生し、制御の連続性を保つ事ができず、性能低下の原因になっていた。また、一旦切り替わった経路は自動復旧する事ができないため、2つのLSI間を二重化伝送路で結んでいる構成において切り替えが生じた場合、障害が発生した系のみを保守することができない。このため、切り替えが生じた以降は、二重化機能が停止し信頼性が低下する問題があった。また、機能停止による信頼性低下を解消するため再送方式とした場合でも、再送によるリクエスト遅延が発生する問題があった。
【0011】
特許文献1の「無瞬断パス切り替えシステム及び制御方法」は、パス切り替え処理において、パス警報を検出してからパス切り替え用のセレクタが適正に動作するまでの間、バッファメモリに伝送フレームを格納している。そのため一定時間の遅延が発生することになるが、これでは上記「制御の連続性」を保つことは困難である。
【0012】
特許文献2の「デジタル信号伝送装置」は、BIP−8方式を用いており、対象となるフレームのエラー判定を行うためには、次フレームと比較して符号誤りを検出する。そのため、次フレームが伝送されるまでエラー判定を行うことができない状態にある。また、パス切り替えのために一旦フレームメモリにデータをためる必要があるため、位相同期を行うことの遅延に加え、1フレーム分の遅延が生じてしまい、上記「制御の連続性」を保つことは困難である。
【特許文献1】特開2000−332771号公報
【特許文献2】特開平07−177116号公報
【発明の開示】
【発明が解決しようとする課題】
【0013】
上記事情を鑑みて本発明は伝送路二重化システムにおいて、エラー検出時のパス切り替えによる遅延を解消し、制御の連続性を確保し、信頼性確保、性能向上を図ることができるデータ誤り訂正装置などを提供することを目的とする。
【課題を解決するための手段】
【0014】
上記目的を達成する本発明の態様は、各系統の伝送路より伝送されるデータを所定の単位ごとに区分けして当該データの誤りを検出するデータ受信誤り検出手段と、前記データ間の同期を行う二系統同期化手段と、一方の系統の前記単位ごとに区分けしたデータのうち誤りを含むものを廃棄し、他方の系統の正常なデータを選択する誤り訂正手段を有し、伝送路二重化システムにて伝送されるデータの誤りを訂正するデータ誤り訂正装置に関するものである。
【0015】
もし、前記データのうち前記同期の起点となる特殊コードが誤りであった場合、正常な特殊コードが検出されるまで当該データの伝送路を閉塞する。
【0016】
前記データ受信誤り検出手段はCRC検出を行うと良い。また、前記各系統の伝送路にクロスバスイッチを介して接続すると良い。
【0017】
本発明の他の態様は、各系統の伝送路より伝送されるデータを所定の単位ごとに区分けして当該データの誤りを検出するデータ受信誤り検出工程と、前記データ間の同期を行う二系統同期化工程と、一方の系統の前記単位ごとに区分けしたデータのうち誤りを含むものを廃棄し、他方の系統の正常なデータを選択する誤り訂正工程を有し、伝送路二重化システムにて伝送されるデータの誤りを訂正するデータ誤り訂正方法に関するものである。
【0018】
もし、前記データ受信誤り検出工程にて、前記データのうち前記同期の起点となる特殊コードの誤りを検出した場合、前記二系統同期化工程にて、正常な特殊コードが検出されるまで当該データの伝送路を閉塞する。
【0019】
前記データ受信誤り検出工程にて、CRC検出を行うと良い。
【発明の効果】
【0020】
本発明のデータ誤り訂正装置は、各々の系統において同期化を行う前にエラーを検出するため、同期化の待ち合わせの時点でエラー判定が確定しており、同期化直後の伝送路の切り替えが可能となる。そのため、発生する遅延は同期化による待ち合わせの時間のみで済み、伝送路二重化システムにおいて、エラー検出時のパス切り替えによる遅延を解消し、制御の連続性を確保し、信頼性確保、性能向上を図ることができる。
【発明を実施するための最良の形態】
【0021】
以下本発明のデータ誤り訂正装置を実施するための最良の形態について説明する。説明する際には、本明細書と同時に提出する図面を適宜参酌することにする。
【0022】
〈構成〉
図1は本形態のデータ誤り訂正装置を搭載した伝送路二重化システムの構成を図示したブロック図である。図1を参照すると、データ転送の始点となる第一のLSI100と、第一のLSI100からのデータ転送経路となる2つのデータ転送経路AとBと、データ転送経路AとBからデータが転送され、データの終点となる第二のLSI200とで構成される。なお、データ転送経路Aを介してデータが転送される系統を「A系統」と呼び、データ転送経路Bを介してデータが転送される系統を「B系統」と呼ぶことにする。
【0023】
第一LSI100は、一つのデータの処理内容を指示する内部論理部101と、一つのデータを内部論理部101からの指示により二重化して2つのデータ転送経路AとBにデータを送出するデータ二重化送信部102とで構成される。
【0024】
第二のLSI200は、データ二重化送信部102から転送されたA系統、B系統のそれぞれのデータの受信処理を行い、受信した各々のデータの誤り検出を行い、そのエラー情報と共に二系統同期化部220へデータを送出するデータ受信誤り検出部201、211と、各々のデータ受信誤り検出部201、211で検出したエラー情報とデータを受け取り、二重化されたA系統とB系統の同期を行う二系統同期化部220と、同期化されたA系統とB系統のデータとエラー情報を受け取り、そのA系統とB系統のデータについて、エラー情報を元に誤り判定と、その誤り判定からデータの訂正を行い、内部論理部240へ正常なデータを送出する誤り訂正部230と、送出されたデータの処理内容を指示する内部論理部240から構成される。
【0025】
A系統とB系統の同期化を行う二系統同期化部220は、データ受信誤り検出部201、211からデータとエラー情報を受け取り、二系統同期化制御部221からの指示により待ち合わせを行う同期化部202、212と、A系統とB系統の同期化部202、212で、シリアル転送の特殊コードを検出し、その特殊コードを起点として同期化のための待ち合わせ指示を行う二系統同期化制御部221から構成される。
【0026】
同期化部202、212で行われるデータの待ち合わせとは、データ受信誤り検出部201、211で検出されたエラー情報がシリアル転送の特殊コードであった場合は、同期化時間満了まで待ち合わせ、同期化時間が満了した場合は、一旦データの待ち合わせを停止し、誤り訂正部230にエラー情報を送出し続け、同期化機能を閉塞し、再び、データ受信誤り検出部201、211から正常な特殊コードが到着すると再び待ち合わせを行うことである。同期化部202、212はこのような復旧機能を備えている。
【0027】
二系統同期化部220で同期されたA系統とB系統のデータからエラー訂正を行う誤り訂正部230は、同期化部202、212からデータを受信し、他系のデータとを比較するためのデータ受信レジスタ203、213と、該データのエラー情報を格納するエラーレジスタ204、214と、そのエラー情報から誤りデータを判定し、もし、A系統とB系統の何れかにエラー情報が点灯していたならば、エラーが点灯していない系統のデータを内部論理部240に選択出力する誤り判定・訂正制御部231から構成される。この誤り訂正部230では、データ受信誤り検出部201、211でエラー検出できないケースの故障に備えて、エラーレジスタ204、214にエラー情報が無かった場合であっても、データ受信レジスタ203、213に格納されたデータの比較を行い、一致していればA系統のデータを内部論理部240に出力し、不一致の場合は訂正不能エラーとしてデータ転送を閉塞する事により、内部論理部240への誤データ送出を防止する機能も備えている。
【0028】
〈動作〉
次に本形態のデータ誤り訂正装置の動作について図2、3を参照して説明する。図2、3は、第一のLSI100のデータ二重化送信部102で二重化された送信データが、第二のLSI200において、転送途中の障害を検出し、エラー訂正する流れを示した図である。データ受信誤り検出部201、211におけるエラー検出はシリアル転送からパラレル転送に変換される際のエラー検出もあるが、ここでは特に、CRC(Cyclic Redundancy Check)検出を採用した場合を例に説明する。
【0029】
第一のLSI100のデータ二重化送信部102から、図に示すようなデータ転送が行われたとき、第二のLSI200のA系統、B系統のデータ受信誤り検出部201、211では、各々の系統で独立して受信データのエラー検出を行う。ここでCRC検出も行うが、CRC検出の単位は、二系統同期化部220や、誤り訂正部230の検出時間に関わるため、ここでは5ワード単位にCRCを付加するインタフェース仕様としている。CRC検出は、第一のLSI100のデータ二重化送信部102において、シリアルデータ上の特殊コードであるKコード(以下、「Kコード」と呼ぶ)を起点に5ワード毎にCRCコード(図2の「CR」に相当)を付加する。そして、第二のLSI200のデータ受信誤り検出部201、211において、Kコード受信後に5ワード単位にCRCチェックを行う。データ受信誤り検出部201、211でエラーを検出したならば、図2の「(1)エラー検出」に示すとおり、エラーを検出したワードに対し、エラーフラグ「×」を付加し、各々、二系統同期化部200に送出する。なお、図2において「D?」と印されているコードがエラー検出で検出されるエラー対象である。
【0030】
次に、データ受信誤り検出部201、211で付加されたエラーフラグと受信データは、二系統同期化部220により、A系統、B系統のデータ間の同期が行われる。データ受信誤り検出部201、211から送られたデータはエラーフラグと共に同期化部202、212に送られ、該同期化部202、212は、二系統同期化制御部220の指示により他系データとの待ち合わせを行う。二系統同期化制御部220は、データ受信誤り検出部201、211から送られたデータから、Kコードを識別し、A系統、B系統において、このKコードの整列判定を行う。Kコードを整列したならば、図2の「(2)同期化」に示すとおり、誤り訂正部230にA系統とB系統の同期したデータを送出する。
【0031】
この二系統同期化制御部220において、例えば、同期化の起点となるKコードが片系統でエラーを検出し、正常なKコードと認識できない(図3において「K?」と印されたコードに相当)場合は、ある一定時間の同期化時間を設ける。該同期化時間を待っても、Kコードが認識できない場合は、同期化待ち合わせを解除し、誤り訂正部230にデータを送出する。その際、同期化が失敗した系は常にエラー状態と判断し、全てのデータにおいてエラーフラグ「×」を付加し、誤り訂正部230にデータを送出する。該二系統同期化制御部221は同期化が失敗した系統において、同期化部202、212のパスを一旦閉塞する。同期化部202、212は一旦閉塞された後、次に正常なKコードを受信したならば、同期化のパスの自動復旧を行い、再び同期化を開始する(図3の「(2)同期化」参照)。
【0032】
二系統同期化部220から同期化されたデータは、誤り訂正部230のデータ受信レジスタ203、213に格納され、データに付加されたエラーフラグはエラーフラグレジスタ204、214に格納される。エラーフラグレジスタ204、214に格納されたエラー情報は誤り判定・訂正制御部231に渡され、該誤り判定・訂正制御部231において、各々の系統のデータのエラー判定を行う。この時、エラー判定を行う単位は、インタフェース仕様で定義されたCRC検出が5ワード単位であるため、エラー判定はCRCコードを含めた6ワード(データコード5ワード+CRCコード1ワード)単位で実施される。
【0033】
この6ワードの何れかのデータにエラーフラグが点灯していた場合、該6ワードのデータはエラーデータと判断する。この時、エラーデータは6ワードで判断するため、同期化部202、212から送られるデータを格納するデータ受信レジスタ203、213とエラーフラグレジスタ204、214は6ワード分のレジスタとなる。誤り判定・訂正制御部231においてエラーデータと判断した系のデータは無効化し、該誤り判定・訂正制御部231において廃棄され、図2の「(3)訂正」に示されるとおり、正常系のデータ(ここではB系統のデータ)を選択し、エラー訂正を行う。そして「(4)の選択出力」に示されるとおり、内部論理部240に正常データの出力を行う。
【0034】
以上の動作を行うことにより以下の効果を奏する。つまり、各々の系統において同期化を行う前にエラー判定を行うため、同期化の待ち合わせの時点でエラー判定が確定しており、同期化直後のパス切り替えが可能となる。そのため、発生する遅延は同期化による待ち合わせの時間のみで済む。また、各々のデータ転送経路で発生した障害を見つけ、その障害情報を元にパイプライン式にエラーを訂正する事により、エラー検出後の再送方式の様な、再送によるリクエスト遅延を無くすことができる。また、パス切り替えの二重化の様に障害発生時に必要であった切り替え動作を無くすことができるので、制御の連続性を確保し且つ、信頼性確保、性能向上を図ることができる。
【0035】
なお、上述した形態は本発明を実施するための最良のものであるが、これに限定する趣旨ではない。従って、本発明の要旨を変更しない範囲においてその実施形式を種々変形することが可能である。
【0036】
その一例を、図4を参照しつつ説明する。図4は他の形態のデータ誤り訂正装置を搭載した伝送路二重化システムの構成を図示したブロック図である。図1に図示したものとの相違点は、第一のLSI100と第二のLSI200をA系統とB系統にそれぞれ、クロスバSW(スイッチ)300、310を介して接続した点である。第二のLSI200の同期化部220で制御される同期化待ち合わせ時間を、クロスバSW300、310によるA系統とB系統の時間差を考慮して設定する事により、クロスバSW300、310を介した構成においても、エラー訂正する事が可能となる。
【図面の簡単な説明】
【0037】
【図1】本形態のデータ誤り訂正装置を搭載した伝送路二重化システムの構成を図示したブロック図である。
【図2】第一のLSI100のデータ二重化送信部102で二重化された送信データが、第二のLSI200において、転送途中の障害を検出し、エラー訂正する流れを示した図である。
【図3】第一のLSI100のデータ二重化送信部102で二重化された送信データが、第二のLSI200において、転送途中の障害を検出し、エラー訂正する流れを示した図である。
【図4】他の形態のデータ誤り訂正装置を搭載した伝送路二重化システムの構成を図示したブロック図である。
【図5】従来の伝送路二重化システムに使用されるデータ誤り訂正装置の構成を図示したブロック図である。
【符号の説明】
【0038】
100 第一のLSI
101 内部論理部
102 データ二重化送信部
200 第二のLSI
201、211 データ受信誤り検出部
220 二系統同期化部
202、212 同期化部
221 二系統同期化制御部
230 誤り訂正部
203、213 データ受信レジスタ
204、214 エラーレジスタ
231 誤り判定・訂正制御部
240 内部論理部

【特許請求の範囲】
【請求項1】
各系統の伝送路より伝送されるデータを所定の単位ごとに区分けして当該データの誤りを検出するデータ受信誤り検出手段と、
前記データ間の同期を行う二系統同期化手段と、
一方の系統の前記単位ごとに区分けしたデータのうち誤りを含むものを廃棄し、他方の系統の正常なデータを選択する誤り訂正手段を有し、
伝送路二重化システムにて伝送されるデータの誤りを訂正するデータ誤り訂正装置。
【請求項2】
前記データのうち前記同期の起点となる特殊コードが誤りであった場合、正常な特殊コードが検出されるまで当該データの伝送路を閉塞することを特徴とする請求項1に記載のデータ誤り訂正装置。
【請求項3】
前記データ受信誤り検出手段はCRC検出を行うことを特徴とする請求項1または2に記載のデータ誤り訂正装置。
【請求項4】
前記各系統の伝送路にクロスバスイッチを介して接続することを特徴とする請求項1から3の何れかに記載のデータ誤り訂正装置。
【請求項5】
各系統の伝送路より伝送されるデータを所定の単位ごとに区分けして当該データの誤りを検出するデータ受信誤り検出工程と、
前記データ間の同期を行う二系統同期化工程と、
一方の系統の前記単位ごとに区分けしたデータのうち誤りを含むものを廃棄し、他方の系統の正常なデータを選択する誤り訂正工程を有し、
伝送路二重化システムにて伝送されるデータの誤りを訂正するデータ誤り訂正方法。
【請求項6】
前記データ受信誤り検出工程にて、前記データのうち前記同期の起点となる特殊コードの誤りを検出した場合、前記二系統同期化工程にて、正常な特殊コードが検出されるまで当該データの伝送路を閉塞することを特徴とする請求項5に記載のデータ誤り訂正方法。
【請求項7】
前記データ受信誤り検出工程にて、CRC検出を行うことを特徴とする請求項5または6に記載のデータ誤り訂正方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2007−97088(P2007−97088A)
【公開日】平成19年4月12日(2007.4.12)
【国際特許分類】
【出願番号】特願2005−286968(P2005−286968)
【出願日】平成17年9月30日(2005.9.30)
【出願人】(000168285)エヌイーシーコンピュータテクノ株式会社 (572)
【Fターム(参考)】