説明

仮想テープ装置

【課題】 上位制御装置であるホストコンピュータ上の試験用プログラムと監視端末の試験プログラムとを稼働させることによって、この試験運用環境下における仮想テープ装置の機能動作を検証する技術を提供する。
【解決手段】
複数のデータ処理ユニットを備えた仮想テープ装置に関し、各データ処理ユニットは、監視端末からコマンドの指示を受けて自己に故障を擬似的に発生させる手段と、発生させた擬似故障の処理結果を予め設定された期待値と照合する手段と、判定結果の報告を監視端末に発信する手段とを有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機能毎に役割分担させた複数のデータ処理ユニットを備えた仮想テープ装置の擬似故障試験技術に関する。
【背景技術】
【0002】
仮想テープ装置やディスクアレイ装置等のストレージ装置は、一般に、図14に示すように、複数のストレージユニットへの情報格納を制御するデータ処理ユニット(データコントローラ) 、ホストコンピュータと接続するチャネルインターフェースユニット、および操作者が運転を指示操作し、その運転状況を表示する監視端末から構成されている。
【0003】
従来、仮想テープ装置の動作試験として、監視端末からの操作者の指示で、予め設定された擬似故障の内容と発生順序にしたがって、ホストコンピュータとのインターフェース部に擬似故障を発生させることによって、システムの信頼性を検証することが行われている(特許文献1参照)。
【0004】
しかしながら、上記従来技術では、ホストコンピュータとのチャネル接続経路について障害を起こさせて検証することは可能であるが、装置内部の各処理ユニット部を対象とする障害の検証を行うことはできていない。また、発生させる擬似故障条件も、故障状態の連続や間欠の繰り返しとした固定条件のため、実際に起こり得る障害例に相当する複合的な発生条件で再現させて、その動作処理が設計仕様に合致するか否かを検証することはできなかった。
【0005】
とくに、冗長構成による交替制御を行う仮想テープ装置の機能試験では、より高い信頼性が求められているが、複数の制御ユニットが階層的に構成されているため、各制御ユニットに擬似故障を発生させたときのエラー検出処理やリカバリ処理の検証は難しく、操作者にとって煩雑な作業となっている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−122396号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述した問題を解決するため、本発明では、仮想テープ装置内で階層的に構成された複数のデータ処理ユニット全てに擬似的に故障を発生させて診断する擬似故障発生処理部を組み入れ、外部からの指示によって障害を発生させて状態を監視する技術を提供する。
【課題を解決するための手段】
【0008】
本発明の一態様は、ホストコンピュータ及び監視端末と専用回線で接続され、複数のデータ処理ユニットを備えた仮想テープ装置であって、前記各データ処理ユニットは、前記監視端末からのコマンド指示を受けて自己に故障を擬似的に発生させる擬似故障発生手段と、前記擬似故障発生手段によって発生させた擬似故障の処理結果を予め設定された処理結果の期待値と照合する結果判定手段と、前記判定結果の報告を前記監視装置に発信する判定結果発信手段と、を有することを特徴とする仮想テープ装置に関する。
【発明の効果】
【0009】
本発明によれば、仮想テープ装置の複数のデータ処理ユニット全てに擬似故障発生手段を設け、監視端末からのコマンド指示を受けて擬似故障を発生させ、その処理結果を期待値と付き合わせて判定する構成とすることによって、仮想テープ装置の運転中に任意のユニットにおいて擬似故障の発生させることが可能となる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施の形態になる仮想テープシステムの一基本構成を示す図である。
【図2】本発明の実施の形態になる仮想テープ装置における各データ処理ユニットの制御経路の構成例を示す図である。
【図3】本発明の実施の形態になる仮想テープ装置における擬似故障発生制御経路および試験制御経路の接続構成例を示す図である。
【図4】本発明の実施の形態になるデータ処理ユニットの機能ブロック図である。
【図5】本発明の実施の形態になる擬似故障発生用付加回路の例を示す図である。
【図6】本発明の実施の形態になる論理ボリュームのデータ構造を示す図である。
【図7】本発明の実施の形態になる物理ボリュームのデータ構造を示す図である。
【図8】本発明の実施の形態になる擬似試験故障テーブルのデータ構造を示す図である。
【図9】本発明の実施の形態になる試験結果の期待値テーブルのデータ構造を示す図である。
【図10】本発明の実施の形態になるLV/PVファイル、特殊LV/特殊PVファイル、および処理情報の流れを示す図である。
【図11】本発明の実施の形態になる特殊LVによる擬似故障発生処理の流れを示す図である。
【図12】本発明の実施の形態になる擬似故障試験を制御する監視端末の操作フローを示す図である。
【図13】本発明の実施の形態になる各データ処理ユニットにおける擬似故障処理部の動作フローを示す図である。
【図14】一般的なストレージシステムの制御構成を示す図である。
【発明を実施するための形態】
【0011】
以下、図面にもとづいて本発明の実施形態を説明する。
【0012】
図1は、本発明の実施の形態になる仮想テープシステムの一基本構成を示す。仮想テープシステムは、高度の信頼性確保が必要な場合に、システムを構成する制御ユニットを二重化して冗長性を持たせているが、図1では、冗長化された仮想テープ装置の内、一系統の処理に注目して擬似故障試験を処理する例を説明する。
【0013】
仮想テープシステムは、ホストコンピュータ3と、上位にあるホストコンピュータ3とFC(Fiber Channel )ケーブル22及びLAN(Local Area Network)23を介して接続し、データアクセス要求に応じてLTO(Linear Tape Open)ライブラリ4の磁気テープに記憶するデータファイルを論理ボリューム(仮想テープ)に変換してTVC(Tape Volume Cache :テープボリュームキャッシュ)10に格納する仮想テープ装置1と、TVC10のデータを磁気テープに複写して保存するLTOライブラリ4を有する。
【0014】
ここで、監視端末2は、仮想テープ装置1内の全構成ユニットと試験制御経路を介して接続し、試験条件手順/結果判定情報を含む試験制御プログラム(TP2)が搭載され、試験動作の指示発信と状態を参照する機能を有する。
【0015】
また、以下に、各データ処理ユニットについて述べる。
【0016】
ICP(Integrated Channel Processor:統合チャネルプロセッサ)14は、ホストコンピュータ3とFCケーブル22を介して接続され、TVC10上の論理ボリュームのデータ送受信を制御する。これによって仮想テープドライブとしての機能が実現される。
【0017】
VLP(Virtual Library Processor :仮想ライブラリプロセッサ)15は、ホストコンピュータ3からのマウント要求を受け、仮想テープドライブに論理ボリュームをマウントする。また、論理ボリュームと物理テープとを関連付ける情報を作成管理し、論理ボリュームを物理テープへ書き込む処理の制御するなどの役割を受け持つ。
【0018】
IDP(Integrated Device Processor :統合デバイスプロセッサ)16は、VLP15からの指示を受け、TVC10上の論理ボリュームのデータをLTOライブラリ4の物理ドライブにストアし、またLTOライブラリ4の物理テープから論理ボリュームのデータを読み出してTVC10上にリストアする。
【0019】
TVC(Tape Volume Cache )10は、RAID(Redundant Arrays of Inexpensive )装置で構成され、論理ボリュームのデータが置かれる。
【0020】
LTOライブラリ(バックエンドテープライブラリ)4は、論理ボリュームのデータを、物理ボリュームにまとめてLTOにバックアップする。
【0021】
PLP(Physical Library Processor:物理ライブラリプロセッサ)17は、VLP15からの指示を受け、LTOライブラリ4のロボットを制御する。
【0022】
PCU(Power Control Unit:電源制御ユニット)18は、各データ処理ユニットへのAC電源の供給を接続/遮断して、仮想テープ装置1全体の電源の投入/切断を制御する。
【0023】
なお、HUB(ハブ)12は、全データ処理ユニット間の制御データ通信用のLANを中継する中継用HUBである。また、FC−SW(Fibre Channel Switch:チャネルスイッチ)11は、仮想テープ装置1で処理する論理ボリュームのデータ通信経路(Fibre-Channel) の中継ユニットである。さらに、通信中継器13は、監視端末2と全データ処理ユニット間で、試験動作を制御する通信経路を分配あるいは中継するユニットである。
【0024】
図2は、本発明の実施の形態になる仮想テープ装置における各データ処理ユニットの制御経路の構成例を示す。なお、図2において、点線は、監視端末2からのコマンド指示を各データ処理ユニットに流す試験制御経路を表し、実線は、ホストコンピュータ3からのコマンド指示を各データ処理ユニットに受け渡す制御通信経路を表し、さらに、二重線は、ホストコンピュータ3からのデータファイルをチャネル32を介して仮想テープ装置1の各データ処理ユニットに送信するデータ伝送経路を表している。
【0025】
仮想テープ装置1を構成する主要なデータ処理ユニット(単に、ユニットともいう)には、後述する擬似故障処理部(EP)として擬似故障試験用の仕組みが設けてあり、各データ処理ユニットは、機能毎階層的に互いに通信可能な通信経路で接続されていて、監視端末2から全ユニットの状態を参照可能としている。
【0026】
機能試験プログラム(TP1)100は、ホストコンピュータ3側のVTCP(Virtual Tape Control Program :仮想テープ制御プログラム) 31内に搭載され、仮想テープ装置1に対して、試験用の特殊論理ボリュームを含む論理ボリュームのマウント処理制御と試験データの処理を制御するものである。
【0027】
一方、試験制御プログラム(TP2)200は、監視端末2側に搭載され、試験対象の各データ処理ユニットに対する擬似故障動作/結果判定/復旧処理を制御するプログラムである。試験制御プログラム200は、管理者の操作で起動し、ホストコンピュータ3上の機能試験プログラム100の実行と連動させた一連の擬似故障発生コマンドの発行により、試験モードや条件を変えながら自動的な繰り返し処理を行う。
【0028】
また、監視端末の試験制御プログラム200は、各データ処理ユニットで行う擬似故障処理の指示コマンドを組み合わせ、処理結果情報の判定パラメータへの実行手順をプログラム(スクリプト)として組み込んで実行させる。
【0029】
図3は、本発明の実施の形態になる仮想テープ装置における擬似故障発生制御経路および試験制御経路の接続構成例を示す。図3では、各データ処理ユニット内に、監視端末2からの指示コマンドを受けて、各データ処理ユニットでの擬似故障の発生、擬似故障処理結果の判定、および判定結果を監視端末2に対して発信を行う擬似故障処理部(EP)300が設定された場合の制御経路を示している。
【0030】
なお、図中、点線は、監視端末2からのコマンド指示の試験制御経路を表し、実線は、ホストコンピュータ3からの制御通信経路を表し、太い実践は、ホストコンピュータ3からのデータファイルのデータ伝送経路を表し、さらに、二重線は、PCU18からのAC電源供給路を表している。
【0031】
監視端末2は、試験制御経路を介して各ユニット内の擬似故障処理部(EP)300に擬似故障発生コマンドを発信することによって、擬似似故障モードの起動を行うとともに、その進行を監視し、擬似似故障試験の結果を観測して判定する。
【0032】
また、管理端末2内には、管理者の操作によって起動可能な擬似故障/結果判定/復旧に関する処理を制御する試験制御プログラム200が組み込まれている。試験制御プログラム200は、管理者の操作で起動し、ホストコンピュータ3上の機能試験プログラム100の実行と連動した擬似故障発生コマンドによって、試験モードや条件を変えながら自動的な繰り返し処理を可能としている。
【0033】
また、監視端末2には、各データ処理ユニットの擬似故障処理部300への指示コマンドを擬似故障の種類などで組み合わせ、その処理結果を判定するパラメータに対する実行手順をプログラム(スクリプト)として組み込んでいる。したがって、ホストコンピュータ3上の機能試験プログラム100を使用しなくても、仮想テープ装置1単体でも自動的に擬似故障発生試験が可能である。
【0034】
さらに、仮想テープ装置1の各データ処理ユニットに設定された擬似故障処理部300は、監視端末2からの試験コマンドにしたがい、または試験コードを含む論理ボリュームの情報を受け、その試験コード番号を認識し、擬似故障を発生させて試験を実行する。
【0035】
図4は、本発明の実施の形態になるデータ処理ユニットの機能ブロック図を示す。
【0036】
仮想テープ装置1を構成する各データ処理ユニットにおいては、監視端末2からユニット間通信処理部43が受信する試験コマンドを擬似故障処理部300がデコードし、指定された擬似故障内容に応じて擬似故障を発生させる処理を起動・実行するとともに、処理状態と結果情報を処理状態記録メモリ502保持し、その情報は監視端末2から通信経路を介して参照可能としている。
【0037】
また、この擬似故障処理部300は、論理ボリューム番号処理部52を介して、論理ボリュームデータ処理部44が上位にあるデータ処理ユニットより受け取る論理ボリュームの中のボリューム番号を監視していて、ボリューム番号として試験コード番号の受信を認識したら擬似故障を発生させる処理を起動する。
【0038】
各擬似故障は、擬似故障処理部300が擬似故障発生処理プログラム500により制御可能な擬似故障発生専用に備えているハードウェア回路機構(擬似故障発生回路53、擬似故障対象回路部46、および専用付加素子部55)を作動させて、試験の対象として設定されているハードウェア/制御ファームウェアの機能を部分的に一時停止/異常状態の印加/回復動作をさせることにより発生させる。
【0039】
なお、ハードウェアの機能としては、CPU部(Central Processing Unit )のバスエラー、メモリデータ異常、I/O系の停止、LAN/FibreChannel部の通信停止、電源遮断などがある。また、ファームウェアとしては、データ処理動作の中断/停止、処理データの誤り発生、データ処理コマンド処理遅延/拒否/無応答、制御ユニット間の通信動作遮断などがある。
【0040】
以下、さらに各データ処理ユニットの役割りについて説明する。
【0041】
データ処理ユニット制御部41は、当該ユニットが分担するデータ処理機能の動作全体を制御するもので、データ処理制御プログラム400によって、データ処理ユニット制御部全体の動作を制御している。
【0042】
制御データ処理部42は、他のユニット間で交信して得られた情報/コマンドの処理と他ユニットへ報告する情報を制御し、ユニット間通信処理部43は、他のユニット間および監視端末2との制御データ通信経路を介して制御データ/制御コマンド/状態情報を交信する。
【0043】
データ伝送路は、論理ボリュームデータを各ユニット間で伝送する経路であり、データ伝送処理部45は、このデータ伝送路を介して論理ボリュームデータの受け取り、送出を行う。さらに、論理ボリュームデータ処理部44は、論理ボリュームデータを上位のデータ処理ユニットから受け取って一時的に格納し、仮想テープ装置1の機能に対して、当該ユニットが分担しているデータ処理後に、他ユニットに渡す処理を実行する。データ処理ユニット制御部41とデータ処理制御プロクラムの制御下で動作する。
【0044】
ボリューム番号監視処理部52は、論理ボリュームデータ処理部44が受け取った論理ボリュームデータを監視して、ボリューム番号部を抽出して解析し、通常のボリューム番号の代りに試験コード番号が存在して擬似故障発生コードと認識した場合は、そのコード情報を擬似故障発生/診断制御部51へ通知する。
【0045】
そして、擬似故障発生/診断制御部51は、試験モードの時、擬似故障の発生および動作結果情報の収集処理全体を制御する。制御データ経路を介して受信する監視端末2からの擬似故障発生の指示コマンド、あるいは論理ボリュームのデータ伝送経路から受け取る特殊論理ボリューム(後述)により指定される擬似故障発生コードに応じて、データ処理ユニット内で擬似故障を発生させる部位を指定し、擬似故障発生動作処理部52に指示して当該箇所に故障を発生させる動作を制御する。
【0046】
また、指定される擬似故障の発生条件が、論理ボリュームのデータ処理に対して論理的動作で引き起こすモードの場合は、データ処理ユニット制御部41に通知して、データ処理制御プロクラム400の配下で特定の試験動作処理を実行させる。
【0047】
さらに、故障発生による事象の経過と、エラー処理結果状況の推移を監視して情報を収集する。また、監視端末2で試験制御プログラム(TP2)200が実行中の状態情報参照指示コマンドにより、記録している動作状態情報を監視端末2へ転送する。これにより監視端末2は当該制御ユニットの試験動作状態を把握することが可能となる。
【0048】
擬似故障設定情報501は、擬似故障発生コードやパラメータで指定される故障モードに対応して、擬似故障を発生させる対象箇所と故障動作発生条件指定に関する設定情報の定義表である。擬似故障発生制御プログラム500により、擬似故障発生/診断処理部51に対し所定の設定がなされるが、監視端末2から擬似故障設定情報501参照して当該設定情報を書き替えることによって、試験の進行に応じた故障発生条件の変更を可能としている。
【0049】
また、処理状態情報記録メモリ502は、発生させた擬似故障による動作の経過状態およびエラー処理結果情報を記録して保存するためのメモリである。記録された情報は、擬似故障発生/診断制御部51と制御データ処理部42を通じて監視端末2から参照可能となる。
【0050】
応用例として、実運用時に、実際に故障が発生して被疑箇所の特定が難しい場合、エラー処理検証試験時に処理状態情報記録メモリ502に蓄積してあった情報を監視端末2から参照し、監視端末2に保管している類似状況(エラーコード、ステータスコードなど)と比較することで故障部位を推定する処置が期待できる。さらに、故障が特定できた場合の状況情報を監視端末2から処理状態情報記録メモリ502に追記していくことで、次の故障発生時の判定の精度を高める効果が期待できる。
【0051】
さらに、擬似故障発生動作処理部52は、擬似故障発生/診断制御部51の処理と擬似故障発生制御プログラム500の指示により、当該ユニット内の指定部位に対して指定された条件で擬似故障を発生させて故障の状態を維持し、または故障状態を解除して正常な状態に復帰させる動作を実行する。
【0052】
また、擬似故障発生時にデータ異常を他のデータ処理ユニットに波及させるため、途中のデータ誤り検出機能を試験中に一時的に無効状態に切り替える処理も実行可能としている。故障発生後の動作およびエラー処理状況推移に応じて情報を採取し、擬似故障発生/診断制御部51に通知して処理状態情報記録メモリ502に格納する。試験を実施する毎に、その処理結果を収集し記録して行く。
【0053】
なお、電源制御部54は、各ユニットの電源ユニット45を外部信号により投入/切断する制御を行う。2台の電源へのリモート制御接続線を介して、それぞれ独立して投入/切断させることが可能で、1電源故障あるいは2電源同時故障を発生させる。電源ユニット45は、各ユニット内回路に電源を供給するもので、この例では、故障に備えて二重化構成としてあり、片方で電源供給して運転可能となっている。また、電源ユニット45に備わっているリモート制御接続機能により、外部からの制御信号でのON/OFFが可能な構成となっている。さらに、完全に電源停止状態からの起動では、外部からの電源制御線(図示せず)を介して電源ONとする仕組みとしている。
【0054】
図5は、本発明の実施の形態になる擬似故障発生用付加回路の例を示す。
【0055】
擬似故障対象回路部46は、データ処理ユニット内で想定している一連の試験を実行するために擬似故障を発生させる対象部位となるハードウェア回路群である。この擬似故障対象回路部46のそれぞれに対して、擬似故障動作を発生させるために専用付加素子部(付加回路)55が設けられている。擬似故障発生動作処理部52からの指示信号により、付加回路をスイッチ接続し対象回路に干渉することで擬似故障を発生させ、スイッチ切断により回路干渉を解除することで擬似故障の回復がなされる。
【0056】
専用付加素子部(付加回路)55は、対象部位の信号処理回路に擬似故障を電気的に印加(ON/OFF/信号反転/遅延) するための専用付加素子群である。
【0057】
擬似故障による試験対象となる擬似故障対象回路部46は、擬似故障発生回路53の制御信号により強制介在を可能とする付加素子を組み込んで構成されている。本発明では、外部からの回路構成プログラムを書き換えることによって、付加素子において付加する信号線の位置を切替え、動作条件を可変できるように、対象回路ブロックは、付加素子を含めてプログラマブル・ロジックアレイ素子(FPGA:Field Programmable Gate Array )で構成するのが好適である。
【0058】
構成例としては、8ビット・レジスタ間のバスデータ伝送部分で、レジスタあるいは伝送路の1ビット故障を想定して擬似故障を発生させる構成が考えられる。8ビットデータバス構成で信号伝送している回路において、付加した擬似故障印加回路素子により、バスのうち1ビット線に対して通常の接続系統をOFFにして‘0’固定線をONにすることでバスエラーを発生させるものである。または、インバータ接続線をONにすることで論理反転を起こさせ、1ビットデータ化け状態を発生させることでもよい。
【0059】
図6は、本発明の実施の形態になる論理ボリュームのデータ構造を示す図である。図では、仮想テープ装置1におけるホストコンピータ3から発行される動作コマンド処理と論理ボリュームマウント処理とが同期して特定のデータ処理ユニットで擬似故障を発生させるための論理ボリュームのデータ構造を示している。
【0060】
ホストコンピュータ3にある機能試験プログラム100から仮想テープ装置1内の任意の構成ユニットに擬似故障発生を指示する手段として、仮想テープ装置1に記憶する論理ボリュームの形式を利用するものである。
【0061】
なお、論理ボリューム(LV:Logical Volume) は、仮想テープに書込み/読み出しするデータファイルの処理単位であり、磁気テープ1巻に相当する。
【0062】
ホストコンピュータ3からアクセスして仮想テープ装置1のテープボリュームキャッシュ10に格納する論理ボリュームでは、LVを識別するボリューム番号について擬似故障を発生させる特別なコードに置き替えた特殊論理ボリュームを定義する。
【0063】
図6(a)は、通常の論理ボリューム(単にLVと表す)の形式を示しており、英数字6桁で構成される「ボリューム番号」、テープ内容を表す「ID」、および「ユーザデータグループ」の項目を有する。また、図6(b)は、試験用の特殊論理ボリューム(特殊LVと表す)の形式を示しており、「試験コード番号」、内容を示す「パラメータ」、および「ダミーデータ」の項目からなる。
【0064】
通常、データボリュームファイルを管理するボリューム番号部には、ユーザ運用データでは割り当てない番号に置き替えて試験用の識別コードを定義する。
【0065】
また、通常ボリュームのデータ属性を示すID部は、擬似故障の内容を指定するパラメータに置き換えてある。さらに、ユーザデータ部にはダミーデータを置く。
【0066】
図7は、本発明の実施の形態になる物理ボリュームのデータ構造を示す。
【0067】
接続されるLTOライブラリ(バックエンドライブラリ) 4にバックアップとして保管するため、データボリュームキャッシュ10にある複数の論理ボリュームをまとめて1本のテープ媒体に複写する。特殊論理ボリュームを含んで複写された物理ボリューム(PV:Physical Volume )においては、図6の論理ボリュームと同様に、ボリュームを識別するボリューム番号を擬似故障を発生させる特別なコードに置き替えた特殊物理ボリュームとして定義する。
【0068】
図7(a)は、通常の物理ボリューム(単にPVと表す)の形式を示し、「ボリューム番号」、「ID」、および物理ボリュームの実データ「LV1」・・・「LV5」の項目からなる。また、図7(b)は、試験用の特殊物理ボリューム(特殊PVと表す)の形式を示し、「ボリューム番号」、「ID」、および物理ボリュームの実データ「特殊LV1」、「LV1」・・・「特殊LV2」、「LV3」の項目からなる。
【0069】
なお、物理ボリュームを構成する論理ボリュームグループに試験用の特殊論理ボリュームを含めて生成したものを特殊物理ボリュームとしている。また、特殊LVと同様に、ボリューム番号とIDを試験コードとパラメータに置き換えてある。さらに、物理ボリューム番号を擬似故障試験の指示コードに置き換えた特殊PVは、その擬似試験コード番号部で擬似故障の起動を指示し、続いて付加されているパラメータ部で擬似故障の各種動作の実行モードや条件を指定して制御するものとなっている。
【0070】
図8は、本発明の実施の形態になる擬似試験故障テーブルのデータ構造を示す。
【0071】
実施例の擬似試験故障テーブルでは、特殊LVによって擬似故障を指定する例を示している。擬似試験故障テーブルは、「試験コード番号」、試験内容を示す「パラメータ」、および「擬似故障発生モード」の項目からなる複数のレコードで構成される。
【0072】
擬似故障発生の対象としては、指定されたユニット内の1 箇所の故障を指定する「単独」、指定されたユニット内で2 箇所の同時故障を指定「二重故障」、他ユニットと連動して故障を発生「連携故障」などがある。
【0073】
また、擬似故障発生モードとしては、瞬時故障を1回発生後、故障状態を解除する「単発発生」、故障を発生させて固定状態にする「連続発生」、特定の間隔で故障発生/ 解除を繰り返す「間欠発生」などがある。
【0074】
さらに、擬似故障の時間条件としては、発生遅延時間、発生持続時間、発生時間間隔、繰り返し回数等の指定がある。
【0075】
図8を説明すると、「試験コード番号」は、8桁の英数字で認識される。
【0076】
「パラメータ」例において、UUは、対象となるユニットの番号、VVは、同時に処理対象となるユニットの番号である。
【0077】
また、XXは、故障発生モードとして、00:解除、01:固定発生、02:瞬時故障、および03:間欠モードが用意されている。さらに、YYは、故障発生回数、ZZZZは、遅延時間、持続時間、間欠発生間隔となっている。
【0078】
図9は、本発明の実施の形態になる試験結果の期待値テーブルのデータ構造を示す図である。期待値テーブルは、対象ユニットで実行する試験コードとパラメータ毎に、それぞれ試験を実行した時の処理結果として期待する状態(ステータス)コードと報告されるエラーコードとの対応を示すテーブルとなっている。
【0079】
図に示すように、結果判定では、擬似故障を処理した結果として、擬似故障を起こさせたデータ処理ユニットから取得した状態コードが対応するエラーコードに合致しているか否かで判定される。
【0080】
図10は、本発明の実施の形態になるLV/PVファイル、特殊LV/特殊PVファイル、および処理情報の流れを示す。
【0081】
本実施例では、擬似故障による機能試験は、操作者が監視端末2から試験項目を指定して起動する。試験実行は、監視端末2の試験制御プログラム200の制御下で自動的に実行され、その進行状況は監視端末2に表示される。試験進行結果と試験制御プログラム200内の期待値表と比較して、仮想テープ装置1の応答結果を判定する。
【0082】
なお、図中、LVは論理ボリューム、特殊LVは試験コードを含む論理ボリューム、LV情報は論理ボリュームのマウント情報、特殊LV情報は特殊LVのマウント情報,PVは物理ボリューム、特殊PVは試験コードと特殊LVを含む物理ボリューム、PV情報は物理ボリュームのロード情報、および特殊PVは特殊PVのロード情報を表している。
【0083】
以下に、試験の処理手順を示す。
(1)監視端末2にある試験制御プログラム200および上位制御装置(ホストコンピュータ3)にある仮想テープ装置1の機能試験プログラム100を起動する。
(2)試験対象のデータ処理ユニットの擬似故障処理部(EP)300の擬似故障発生制御プログラム500に対して、試験実行に必要なデータ表とエラー処理結果の対応情報を、監視端末2から転送する。
(3)監視端末2の操作により、実行する試験に応じて試験実行事項に該当する試験コード番号をボリューム番号とする特殊LV群の情報を生成し、この情報をホストコンピュータ3側の機能試験プログラム100に転送して、ホストコンピュータ3側で当該特殊LV群を生成して格納しておく。
(4)監視端末2に組み込んである試験制御プログラム(試験実行スクリプト)200に従い、所定の手順/条件にしたがって擬似故障試験モードを起動し、対象の各ユニットに対し擬似故障を発生させ、監視端末2で機能試験の進行を監視する。
(5)論理ボリュームの通常データ処理と同期させて擬似故障を発生させる手段を併用し、診断を行う場合には、監視端末2の試験制御プログラム200と連携したホストコンピュータ3の機能試験フログラム100の制御により、擬似故障を発生させる試験コードを備えた特殊LVと通常のLVとを混在させた論理ボリューム群を順次マウント処理動作させて、試験を進行させる。
【0084】
監視端末2から試験内容にしたがい、ホストコンピュータ3の機能試験プログラム100の介在によって、通常LVと試験事項に対応する特殊LV群とを任意に組み合わせてシーケンシャルに整列させ、順次マウント処理を実行する。
【0085】
なお、論理ボリュームの処理経路にない部分の対象ユニット(例えば、HUB12やPCU18など)の試験は、監視端末2の試験制御プログラム200からの試験コマンドの指示により実行される。
(6)仮想テープ装置内における特殊LV情報の受け取りにおいて、構成例にある仮想テープ装置1側では、VLP15がLVのマウント要求(LV情報または特殊LV情報)を受け取る。
【0086】
各データ処理ユニットは、論理ボリュームのマウント処理を実行する際、擬似故障試験の実行モードにある場合は、マウント指定のLVのボリューム番号を参照し、その情報を自己ユニットの擬似故障処理部300に引き渡す。擬似故障処理部300は、マウント指定のLVのボリューム番号を参照して試験コードを認識した場合は、そのコードと付加パラメータから、試験対象が自己ユニットか他ユニットかをデータ処理ユニット番号によって判別する。そして、自己対象である場合は、擬似故障の発生動作と診断処理を実行する。また、他ユニットが対象となっている場合には、通常LVの処理に準じて,その処理を引き渡す。
【0087】
以降、通常LVの処理と同様に、ICP14/TVC10/IDP16/PLP17とデータ処理を受け渡して行く過程で、各ユニットは特殊LVの試験コードを識別して、当該ユニットで試験を実行するか、次段階処理担当のユニットに特殊LV情報を引き渡すことを繰り返して、擬似故障を発生させるべき部位の擬似故障処理部300へ試験指令を伝達する。
(7)試験対象がLTOライブラリである場合、監視端末2の指示により、LV群のうち特殊LVが含まれていれば特殊PVを生成し、LTOドライブ42に特殊LV情報を引き渡して、LTOドライブ42側の擬似故障処理部300で試験を実行する。
【0088】
LTOライブラリ4は、LTO媒体にPVを書き込むLTOドライブ42と、LTO媒体の格納棚(セル) とLTOドライブ20間で媒体を運搬し格納操作するロボット(Robot) 21を有する。
【0089】
なお、PVのロード指示に際して、それが特殊PVと認識した場合には、ロボット21による媒体運搬過程またはLTOドライブ20へのロード/アンロード過程で擬似故障を発生させて試験を行う。
【0090】
また、LTOドライブ20にロード後に、PVに特殊LVが含まれることを認識した場合には、PVのリード/ライト処理の過程で指定されたタイミングで擬似故障を発生させて、LTOドライブ20を含めた試験を行う。
(8)監視端末2に組み込んである試験制御プログラム(試験実行スクリプト)200にしたがい、設定されたシーケンスにより、前述したように、監視端末2は、対象の各ユニットに対しコマンドを発行して擬似故障を発生させる。対象の各ユニットは、そのときに実行される処理結果情報を自メモリに記録し、エラー処理状態(エラーコード)と結果情報(ステータス情報)を監視端末2からの情報参照コマンドに応じて監視端末2に転送する。
(9)擬似故障によるエラー処理後、次の機能試験を実行するため、監視端末2の制御処理の指示により、エラークリアまたは電源切断/投入(対象の一部または装置全体)による初期化を自動的に実行して復旧させ、以降の機能試験を順次繰り返す。
(10)自動的に繰り返される機能試験の結果情報は、監視端末2の制御により試験事項実行毎に全て収集して監視端末2内に記録し、試験結果として表示/報告される。またその報告/収集した情報は、監視端末2の制御プログラムにより、設計仕様に基づいて設定するエラーリカバリ処理動作の期待値テーブル(エラーリカバリ動作処理の状態コードおよびエラーコード対応テーブル)の内容と照合して、機能試験実行結果の合否を判定し表示する。
(11)予め設定されているか、試験実行中に組み換え可能な試験実行スクリプトによって設定される試験事項の手順に基づき、同一設定あるいは試験条件を変化させながら、自動的に試験を繰り返す。
(12)監視端末2の状況表示を観測し、内容により必要に応じて試験者が介入して試験の内容を変更しつつ、試験を繰り返す。
(13)これらの擬似故障処理部300による機能試験実行時の動作状態推移とエラーリカバリ処理動作実行情報は、監視端末2内に記録して保存する。そして、これらの情報は故障発生時に事例情報として参照する。
【0091】
図11は、本発明の実施の形態になる特殊LVによる擬似故障発生処理の流れを示す。図中、細い点線は、試験コマンドが伝送される経路である試験制御経路を表し、太い点線は、LV/PV情報の流れを表し、さらに太い矢印は、LV/PVデータ処理の流れを表している。
【0092】
本実施例では、特殊論理ボリューム(LV)の投入による擬似故障発生処理例として、ICP14内の論理ボリュームデータのデータ圧縮回路を対象にして処理データ異常となる故障を発生させる場合の試験実行制御の流れを示している。
【0093】
その試験実行制御の流れは以下の通りである。
(1)VLP15は、ホストコンピュータ3からのマウント要求を受け、特殊LVを含むLV情報を取得し、(2)同時に、ICP14は、ホストコンピュータ3のチャネル32を介し、特殊論理ボリュームデータを受け取り、(3)ICP14の中のLV番号が試験用の特殊LVの試験コードとなっているかを判定し、(4)試験コードである場合には、それに付随するパラメータから処理内容を解析し、試験コード指示による対象箇所への擬似故障発生動作(例:データ圧縮回路のデータ異常)が行われる。
【0094】
ICP14における擬似故障処理部300は、(5)ホストコンピュータ3に対し、エラー処理報告を発信し、および(6)監視端末2に対し、試験動作状態情報とエラー処理結果情報の送出する。そして、VLP15における擬似故障処理部300は、(7)監視端末2に対し、リカバリ処理結果情報を送出する。
【0095】
図12は、本発明の実施の形態になる擬似故障試験を制御する監視端末の操作フローを示す。以下の各処理ステップは、監視端末2の試験制御プログラム200によって実行される。
S11:監視端末2は、仮想テープ装置1内の各データ処理ユニットにおいてメモリに蓄積された擬似故障処理の状態情報を採取し、監視端末2の画面に更新表示する。
S12:表示された画面において単発、連続、間欠発生などの擬似故障試験の種類を選択し、試験を起動操作する。
S13:擬似試験の設定データ及び処理結果の対応情報を対象ユニットに転送する。
S14:ホストコンピュータ3の機能試験プログラム(TP1)100と連携させるか否かを判定する。TP1と連携しないのであれば、S16に進む。
S15:TP1と連携させる場合には、特殊LVを生成し、機能試験プログラム100を実行する。
S16:擬似故障の対象ユニットへ試験モード切替コマンドを発信する。
S17:擬似故障試験スクリプトを実行し、対象ユニットに擬似故障発生コマンドを発信する。
S18:対象ユニットの動作状態を監視する。
S19:対象ユニットが特殊LVによって動作中か否かを判定する。動作中でなければ、S21に進む。
S20:対象ユニットが特殊LVによって動作中であれば、特殊LVが指定する試験動作と連動させる。
S21:対象ユニットにおける擬似故障処理動作の実行状態を監視する。
S22:他ユニットへの連動要求があるか否かを判定する。他ユニットとの連動がなければS24に進む。
S23:他ユニットとの連動があるなら、連動ユニットへ擬似故障発生コマンドを発信する。
S24:エラー処理が終了したか否かを判定する。終了でないなら、S18に戻り、以降の処理を繰り返す。
S25:エラー処理が終了であれば、対象ユニットの状態情報を採取し、試験処理状態情報を表示する。
S26:擬似故障試験/診断処理が終了か否かを判定する。対象ユニットの試験が未だあるのであれば、S17に戻り、以降の処理を繰り返す。
S27:全対象ユニットが終了であれば、擬似試験実行結果を判定し、判定結果を表示する。
S28:繰り返し指定があるかを判定する。繰返し指定のある場合には、S14に戻り、以降の処理を繰り返す。
【0096】
図13は、本発明の実施の形態になる各データ処理ユニットにおける擬似故障処理部の動作フローを示す。
S31:データ処理ユニットにおける擬似故障処理部300は、ホストコンピュータ3からのLVデータまたは監視端末2からの処理コマンド(制御データ)を受信し、データ処理動作を実行する。
S32:監視端末2から受信した制御データを解析する。
S33:制御データは、擬似試験モードの切換えコマンド否かを判定する。切換えコマンドでなければ、S31に戻り、通常のLVの処理を行う。
S34:制御データが試験モードへの切換えコマンドであれば、擬似試験実行モードに移行する。
S35:LVデータを受信したか否かを判定する。LVデータを受信していなければ、S38に進む。
S36:LVデータを受信していれば、次にLV番号が試験コードか否かを判定する。LV番号が試験コードであれば、S42に進む。
S37:LV番号が試験コードでないならば、LVデータ処理動作を実行する。
S38:制御データを受信し、該制御データを解析する。
S39:制御データは、擬似試験終了コマンドか否かを判定する。
S40:終了コマンドであれば、擬似試験モードを終了する。
S41:制御データが終了コマンドでないならば、次に擬似故障発生コマンドか否かを判定する。擬似故障発生コマンドでないならば、S35に戻り、以降の処理を繰り返す。
S42:擬似故障発生コマンドであれば、試験コマンドを解析する。
S43:擬似故障発生動作の対象場所及び動作モードを指定する。
S44:電源切断試験か否かを判定する。
S45:冗長化電源を含む全電源か否かを判定する。全電源であれば、全電源の遮断処理を行う。
S46:全電源を切断する。
S47:全電源が対象でなければ、試験対象とするユニットを選択して擬似故障状態を起動する。
S48:擬似故障は、他ユニットと連動する動作かをパラメータに基づいて判定する。他ユニットとの連動がないなら、S50に進む。
S49:他ユニットとの連動があるならば、連動要求情報を制御データ処理部から該当する対象のユニットへ発信する。
S50:他ユニットにおける擬似故障の動作状態及び処理結果を採取する。
S51:擬似故障は終了かを判定する。他ユニットの連動処理が残っているなら、S50の処理を繰り返す。
S52:他ユニットの連動処理が終わっていれば、擬似故障の復帰処理を実行する。
S53:対象ユニットの擬似故障処理部300は、擬似故障試験結果をメモリ に記録し、処理結果及び状態を監視端末2に報告する。
【0097】
以上の述べてきたように、本実施例では、論理ボリュームの処理と同期して擬似故障を発生させることが可能となる。通常LVとこの特殊LVを複数混在させ、マウントを処理を繰り返して行うことにより、実データ処理運転の最中に、特定のタイミングで間欠的な、あるいは任意の複数箇所において、同時に擬似故障を発生ることができ、実際の動作に近い状態での動作診断が実現される。
【産業上の利用可能性】
【0098】
本発明は、冗長構成になる仮想テープ装置等の機能試験の分野に適用される。
【符号の説明】
【0099】
1 仮想テープ装置
2 監視端末
3 ホストコンピュータ
4 LTOライブラリ
10 TVC(テープボリュームキャッシュ)
11 FC−SW(チャネルスイッチ)
12 HUB(ハブ)
13 通信中継器
14 ICP(統合チャネルプロセッサ))
15 VLP(仮想ライブラリプロセッサ)
16 IDP(統合デバイスプロセッサ)
17 PLP(物理ライブラリプロセッサ)
18 PCU(電源制御ユニット)
20 LTOドライバ
21 ロボット
22 FCケーブル
23 LANケーブル
31 VTCP(仮想テープ制御プログラム)
32 チャネル
100 機能試験プログラム(TP1)
200 試験制御プログラム(TP2)
300 擬似試験処理部(EP)

【特許請求の範囲】
【請求項1】
ホストコンピュータ及び監視端末と専用回線で接続され、複数のデータ処理ユニットを備えた仮想テープ装置であって、
前記各データ処理ユニットは、
前記監視端末からの指示を受けて自己に故障を擬似的に発生させる擬似故障発生手段と、
前記擬似故障発生手段によって発生させた擬似故障の処理結果を予め設定された処理結果の期待値と照合する結果判定手段と、
前記判定結果を前記監視装置に発信する判定結果発信手段と、
を有することを特徴とする仮想テープ装置。
【請求項2】
前記各データ処理ユニットの結果判定手段で照合される前記期待値は、前記監視端末からの試験コマンドにより変更可能としたことを特徴とする請求項1に記載の仮想テープ装置。
【請求項3】
前記各データ処理ユニットは、前記ホストコンピュータより受信した論理ボリュームのデータから所定の形式で設定された前記試験用コードを含む特殊ボリューム番号を抽出して該試験用コードを認識することを特徴とする請求項1または2に記載の仮想テープ装置。
【請求項4】
前記各データ処理ユニットは、さらに、
前記監視端末からのコマンド指示により擬似故障試験モードに切替える手段を備え、
前記受信した論理ボリュームのデータから前記試験用コードを認識した場合に、前記試験用コードに基づいて、自己ユニットに故障を擬似的に発生させることを特徴とする請求項3に記載の仮想テープ装置。
【請求項5】
前記各データ処理ユニットは、前記擬似故障の試験実行時における動作状態および判定結果情報を保存するメモリを備え、所定の条件で前記擬似故障を発生させたときの処理の状態を表す状態情報を保存することを特徴とする請求項1乃至4に記載の仮想テープ装置。
【請求項6】
前記監視端末において、前記専用回線を介して故障発生時に採取されるエラー処理情報と試験時に前記各データ処理ユニットのメモリに蓄積された前記エラー処理情報との照合によって、該当する故障部位が特定され、該故障部位が前記監視端末に表示されることを特徴とする請求項5に記載の仮想テープ装置。

【図1】
image rotate

【図2】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図3】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate