説明

論理ボリューム分割コピー方法およびシステム

【課題】複数のトラフィックが同一の広域ネットワークを介して通信を行うデータ転送システムにおいて、転送中断が生じた場合の転送効率の低下を防止する。
【解決手段】データ転送を行う際、まず広域ネットワークの空き帯域に合わせたデータ転送速度を算出し、そのデータ転送速度と転送中断の履歴に基づいて中断が発生しにくいデータの転送単位を算出し、該データ転送速度と該データ転送単位に分割したデータによるデータ転送を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークに接続された、複数のストレージ装置および情報処理装置が前記ネットワークを介して通信するストレージシステムに関し、特に前記ネットワークを介したストレージ装置間の通信を制御するデータ転送システムに関する。
【背景技術】
【0002】
企業、および組織の基幹業務へ情報技術が浸透するのに伴い、企業、および組織が保有する電子データの量と重要性が増している。また、米国を中心に法規制により電子メールのアーカイブ保存が企業に義務付けられるなど、データを安全な保存に関するニーズが高まっている。このような企業、および組織が、地震、停電、およびテロリズムによる災害などの大規模災害が発生した場合にも、保有するデータを保護でき、かつ迅速に修復できるためには、データの正確なコピーを保持することが必要である。
【0003】
通常、このようなデータのコピーは、災害の被害を局所化するため、地理的に離れた(たとえば数百マイル)拠点間で行う。各拠点には、ホストとデータの記憶システム(たとえばストレージ装置)が設置され、拠点間は専用線、広域イーサネット(登録商標)、あるいはインターネットなどの広域ネットワーク(WAN)で接続される。データの原本を記憶するストレージ装置をメインストレージ装置という。一方、データの複製を記憶するストレージ装置をリモートストレージ装置という。このように、地理的に離れた拠点間でデータを複製することをリモートコピーという。
【0004】
このリモートコピーの種類には、オンラインバックアップとオフラインバックアップがある。オンラインバックアップの例として、証券や銀行の取引情報を管理するデータベースの更新をリアルタイムにリモートコピーする例がある。この例は、情報の欠落やリモートコピーの中断により致命的な問題を招きうる。一方、オフラインバックアップの例として、法規制のための企業のメールアーカイブやシステム運用ログデータのリモートコピー等がある。この例は、一定期間蓄積したアーカイブデータをバッチ転送する。このため、情報の欠落やリモートコピーの中断が発生しても、再度送りなおすことができ、致命的な問題とはならない。
【0005】
このため、1つのWANを用いてオンラインバックアップとオフラインバックアップを実行する場合、証券取引のある昼間は主にオンラインバックアップがWANを使用し、取引の行われない夜間にオフラインバックアップが行われるなど、優先度の高いトラフィックと優先度の低いトラフィックがそれぞれ独立した時間帯に流れることが多かったと考えられる。以下、オンラインバックアップを優先トラフィック、オフラインバックアップを非優先トラフィックと呼ぶ。
【0006】
しかし近年は、インターネットによる取引、ショッピングやチケット販売などの広まりにより、データベースの更新頻度が昼間に集中しない例がある。例えば、夜間に人気チケットの販売が開始されれば、チケット予約者データベースにアクセスが集中し、瞬間的な優先トラフィックの増大が発生し、バッチ実行していた非優先トラフィックを中断せざるを得ない場合がある。この場合、非優先トラフィックの再開はシステム管理者が停止原因を確認した上で手動再開する例や、最悪の場合ではバックアップデータの整合性が保証できず、全アーカイブを再コピーすることになり、優先トラフィックが実際はほとんど使用されていない夜間のWANの空き帯域を有効に使えない場合が有る。
【0007】
この問題を解決するために、瞬間的な優先トラフィック増大が発生する場合でのWANの空き帯域を非優先トラフィックが有効利用でき、非優先トラフィックが中断した際の再コピー時間を短縮する技術が重要になる。
【0008】
コピー中断時の再コピー時間を短縮する技術は、例えば特許文献1に記載されている。当該技術は、リモートコピー対象のデータが格納されたボリュームを、より小さいサイズに分割した上でリモートコピーを実施する。
【特許文献1】特開2004−185644号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
上記従来技術では、管理者が任意のサイズにボリュームを分割でき、非優先トラフィックが中断した際に再コピーする領域が分割した領域に限定され、再コピーの時間を短縮できる。
【0010】
ただし、ボリュームをどのようなサイズに分割すればよいか、非優先トラフィックはどの程度の帯域を使用できるのかなど状況は刻々と変化している。そのため、管理者が適切な分割サイズあるいはコピー速度を判断することは難しい。例えば分割サイズが大きすぎた場合、中断の際の再コピー時間は短縮されない。また、コピー速度が速すぎた場合、優先トラフィックを妨害したり、コピー中断を誘発しうる。この問題を解決するために、コピーを実施する時点の状況に応じたコピー速度および分割サイズを算出する技術が課題となった。
【課題を解決するための手段】
【0011】
データ転送を行う際、まずWANの空き帯域に合わせたデータ転送速度を算出し、そのデータ転送速度と転送中断の履歴に基づいて中断が発生しにくいデータの転送単位を算出し、該データ転送速度と該データ転送単位に分割したデータによるデータ転送を行う。
【発明の効果】
【0012】
複数のトラフィックが同一のWANを介して通信を行うデータ転送システムにおいて、転送中断が生じた場合の転送効率の低下を防止する。
【発明を実施するための最良の形態】
【0013】
以下、本願発明の実施形態について図面を用いて説明する。以下の図中、同一の部分には同一の符号を付加する。ただし、本願発明が実施形態に制限されることは無く、本願発明の思想に合致するあらゆる応用例が本願発明に該当する。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。
【実施形態1】
【0014】
第1の実施形態は、WANの空き帯域を利用したアーカイブボリュームのリモートコピーに本発明を適用した計算機システムに関する。
【0015】
図1は、第1の実施形態である計算機システムの構成例を示した図である。計算機システムは、ストレージ管理装置1、メインストレージ装置2、リモートストレージ装置3、WAN4およびローカルエリアネットワーク(以下、LANという)5から構成される。
【0016】
ストレージ管理装置1は、メモリ201、内部バス202、CPU203、ハードディスク204、ポインティング装置205、文字入力装置206、ユーザが情報を入力するグラフィカルユーザインタフェース(以下、GUIと略す)を表示するディスプレイ装置207およびネットワークに接続するためのポート208から構成される。
【0017】
メモリ201は、CPU203が実行するコピータスク管理プログラム101、コピー中断再開プログラム102、GUI制御プログラム103、ボリューム分割管理プログラム104を格納する。また、メモリ201は、コピータスク管理情報テーブル105、中断間隔制御情報テーブル106、コピー速度決定テーブル107、業務時間テーブル108、コピーソフト中断履歴テーブル109、WAN情報テーブル115およびコピー実行管理テーブル116を格納する。
【0018】
内部バス202は、メモリ201、CPU203、ハードディスク204、ポインティング装置205、文字入力装置206、ディスプレイ装置207およびポート208を接続する。
【0019】
CPU203は、メモリ201上の各種プログラムに基づいて各種処理を実行する。ハードディスク204は、ストレージ管理装置1のオペレーティングシステム等を格納する記憶装置である。ポインティング装置205および文字入力装置キーボード206は、ユーザがディスプレイ207に表示されるGUIを操作する為の入力装置である。
【0020】
ディスプレイ装置207は、CPU203がGUI制御プログラム103を実行した際に、ユーザが操作するGUI(図3参照)が表示される出力装置である。
【0021】
ポート208は、ネットワーク5を介してメインストレージ1を接続するネットワークインタフェースである。
【0022】
メインストレージ装置2は、ストレージ管理装置1が接続される管理ポート209、内部バス210、WANが接続される外部インタフェース211、ボリュームから読み込むあるいはボリュームへ書き込むデータを一時的に保持するキャッシュ216、ボリュームが接続される内部インタフェース217およびコピー元ボリューム221から構成される。
【0023】
管理ポート209は、LAN5を介してストレージ管理装置5と接続される。内部バス210は、管理ポート209、外部インタフェース211、キャッシュ216および内部インタフェース217を接続する。
【0024】
外部インタフェース210は、メモリ212、CPU214およびポート215から構成される。メモリ212は、CPU214が実行する帯域監視プログラム110を格納する。ポート215は、WAN4を介してリモートストレージを接続する。
【0025】
キャッシュ216は、コピーソフト112がコピー元ボリューム221から読み出したデータを、外部インタフェース211がWAN5を介してリモートストレージ3のキャッシュ225へ転送し終えるまで一時的に格納する。
【0026】
内部インタフェース217は、メモリ218、CPU219およびポート220から構成される。メモリ218は、CPU219が実行するコピーソフト112およびボリューム分割プログラム113を格納する。ポート220は、内部バスを介してコピー元ボリューム221を接続する。
【0027】
コピー元ボリューム221は、コピー対象となるアーカイブやログなどのデータの原本を格納する。リモートストレージ装置3は、外部インタフェース223、キャッシュ225、内部バス226、内部インタフェース227およびコピー先ボリューム231から構成される。
【0028】
外部インタフェース223は、ポート224を備える。ポート224は、ネットワーク4を介してメインストレージ1を接続する。キャッシュ225は、メインストレージ装置2がWAN4を介して転送したデータ、ディスク書込みプログラム114がコピー先ボリューム231に書込み終えるまで一時的に格納する。
【0029】
内部バス226は、外部インタフェース223、キャッシュ225および内部インタフェース227を接続する。内部インタフェース227は、メモリ228、CPU229およびポート230から構成される。メモリ228は、CPU229が実行するディスク書込みプログラム114を格納する。ポート230は、内部バスを介してコピー先ボリューム231を接続する。コピー先ボリューム231は、コピー対象となるアーカイブやログなどのデータの複製を格納する。
【0030】
WAN4は、遠隔した拠点間を結ぶ通信ネットワークである。WAN4には、ボリュームのコピーによるトラフィックのほかに、より重要な業務の為の優先トラフィックが、時間帯によって使用帯域を変動させながら流れているものとする。
【0031】
LAN4は、拠点内の機器を結ぶ通信ネットワークである。LAN4には、ストレージ管理装置1のほかに、様々なホスト計算機が接続される。
【0032】
次に、ストレージ管理装置1のメモリ201に格納される各種テーブルのデータ構造について説明する。メモリ201に格納されるコピータスク管理情報テーブル105、中断間隔制御情報テーブル106、コピー速度決定テーブル107、業務時間テーブル108、コピーソフト中断履歴テーブル109、WAN情報テーブル115およびコピー実行管理テーブル116は配列構造を成し、1つ以上のレコードを格納可能である。ただし、データ構造が配列構造に限定されることはなく、他の構造をとっても良い。
【0033】
図2(1)は、コピータスク管理情報テーブル105のデータ構造例を示す図である。コピータスク管理情報テーブル105の各レコードは、コピータスクの識別子であるコピータスクIDが登録されるエントリT213、コピー元ボリュームの識別子であるコピー元ボリューム名が登録されるエントリT214、コピー先ボリュームの識別子であるコピー先ボリューム名が登録されるエントリT215、各ボリュームの容量が登録されるエントリT216、各コピータスクを実行する優先度が登録されるエントリT217、各コピータスクのコピー開始指定時刻Tsが登録されるエントリT218、現在時刻Tnが登録されるエントリT219、各コピータスクのコピー終了指定時刻Teが登録されるエントリT220、重要業務の状況が切替わり、優先トラフィックの使用帯域が変動するまでの時間が登録されるエントリT221、コピーの状態が登録されるエントリT222およびコピーの進捗率が登録されるエントリT223を有する。
【0034】
例えばレコードT224は、コピータスクIDが「P1」であるコピータスクは、コピー元ボリューム「A」からコピー先ボリューム「Q」へのコピーを指定したタスクであり、ボリュームの容量は「160GB」、コピータスクの優先度が「1」、ユーザが指定したコピー開始指定時刻が「1月29日1時」、現在時刻が「1月29日17時15分」、ユーザが指定したコピー終了指定時間が「1月29日23時」、次に優先トラフィックの使用帯域が変動するまでの時間が「45分」、コピーの実行状態は「実行」でコピーを実施中であり、コピーの進捗率は「50%」であることを表す。
【0035】
図2(2)は、コピー実行管理テーブル116のデータ構造例を示す図である。コピー実行管理テーブル116の各レコードは、コピーソフト112が実行しているコピーの識別子であるコピー実行IDが登録されるエントリT228、同コピーのコピータスクIDが登録されるエントリT229、同コピーのコピー元ボリュームの分割領域の先頭LBA(論理ブロックアドレスの略)が登録されるエントリT230、最後のLBAが登録されるエントリT231、分割領域の容量が登録されるエントリT232、コピー開始時刻が登録されるT233、コピー実行の状態が登録されるT234およびコピー実行の進捗率が登録されるT235を有する。例えばレコードT236は、コピー実行IDが「R1」、対応するコピータスクIDが「P1」、コピーソフト112が実行している分割領域のLBAの範囲が「0」〜「6」、分割領域の容量が「0.5GB」、コピー実行の開始時刻が「1月29日19時」、状態はコピーが「実行」中であり、コピーの進捗率は「55%」であることを表す。
【0036】
図2(3)は、中断間隔制御情報テーブル106のデータ構造例を示す図である。中断間隔制御情報テーブル106のレコードは、図5の分割サイズ算出処理で利用されるコピーソフト中断間隔の上限値Tmaxが登録されるエントリT210および同下限値Tminが登録されるエントリT211を有する。例えばレコードT212は、図5の分割サイズ算出処理で利用されるTmaxが「60分」、Tminが「10分」であることを示す。
【0037】
図2(4)はWAN情報テーブル115のデータ構造例を示す図である。WAN情報テーブル115のレコードは、WAN4の制限帯域が登録されるT225およびWAN4を安全に使用するための帯域使用率の上限の推奨値が登録されるT226を有する。例えば、レコードT227は、WAN4の制限帯域が「100Mbps」、WAN5を安全に使用するための帯域使用率の上限の推奨値が「90%」であることを表す。
【0038】
図2(5)は、コピー速度決定テーブル107のデータ構造例を示す図である。コピー速度決定テーブル107の各レコードは、WAN4の空き帯域をいくつかの範囲に分類した値域が登録されるエントリT201、同各値域に対応したコピー速度が登録されるエントリT202を有する。例えばレコードT203は、ネットワーク4の空き帯域が「0〜20Mbps」の範囲内の値であった場合、コピーを実行する際のコピー速度が「0Mbps」と決定されることを表す。
【0039】
図2(6)は、業務時間テーブル108のデータ構造例を示す図である。業務時間テーブル108の各レコードは、業務状況が一定な時間帯が登録されるエントリT204、同時間帯に優先トラフィックが使用するWAN4の帯域を登録するエントリT205を有する。例えばレコードT206は、業務状況が「6〜12時」の時間帯においてほぼ一定であり、その業務状況において優先トラフィックが使用するWAN4の帯域が「50Mbps」であることを表す。
【0040】
図2(7)は、コピーソフト中断履歴テーブル109のデータ構造例を示す図である。コピーソフト中断履歴テーブル109の各レコードは、コピーソフト112の中断が発生した日時が登録されるエントリT207、前回のコピーソフト112の中断が発生した日時との時間間隔が登録されるエントリT208を有する。例えばレコードT209は、コピーソフト112の中断が「6月1日12時57分」に発生し、前回の中断が発生した日時との時間間隔が「2分」であったことを表す。
【0041】
次に、第1の実施形態で用いられるGUIについて説明する。これらのGUIは、ストレージ管理装置1のCPU203がGUI制御プログラム103を実行することによってディスプレイ207に表示される。システム管理者等のユーザは、文字入力装置206およびポインティング装置205を用いて、表示されたGUI上で各パラメータを設定する。
【0042】
なお、ディスプレイ207、文字入力装置206およびポインティング装置205は、ストレージ管理装置1とは別の計算機が有していてもよい。例えば、ストレージ管理装置1とLAN5あるいはシリアルケーブルを介して接続されるコンソール用端末がディスプレイ等を有していてもよい。この場合、CPU203は、GUI制御プログラム103を実行して画面データをコンソール用端末へ送信し、コンソール用端末がディスプレイ等にGUIを表示する。さらに、コンソール用端末は、ユーザが文字入力装置とポインティング装置とを用いて設定した各パラメータをストレージ管理装置1へ送信する。
【0043】
また、ストレージ管理装置1は、第1の実施形態で説明するGUIのかわりに、そのGUIと同等の機能を有するコマンドラインインタフェースを備えてもよい。
【0044】
図3(1)は、ユーザが、第1の実施形態におけるコピーの実行に必要な情報を入力するために使用するコピー情報入力画面G101の表示例を示す図である。コピー情報入力画面G101は、コピータスクIDが入力されるG102、コピー元ボリューム名が入力されるG103、コピー先ボリューム名が入力されるG104、コピーの優先度が指定されるG105、コピー開始指定時刻が入力されるG106、コピー終了指定時刻が入力されるG107、これらの領域で指定された情報をコピータスク管理テーブル105へ登録する際に指定されるボタンG109および登録を取り消す際に指定されるボタンG110を有する。ユーザが、全ての領域を入力し終え、ボタンG110をポインティング装置205で押した後、各入力情報から構成されるレコードをコピータスク管理テーブル105に追加する。
【0045】
図3(2)は、ユーザがコピーの中断間隔を制御する情報を入力するために使用する中断間隔制御情報入力画面G201の表示例を示す図である。中断間隔制御情報入力画面G201は、中断間隔の下限値および上限値を自動で指定するためのラジオボタンG202を有する。また、中断間隔制御情報入力画面G201は、中断間隔の下限値および上限値を手動で指定するためのラジオボタンG203、ラジオボタンG203を選択した場合に中断間隔の下限値が入力されるG204および同中断間隔の上限値が入力されるG205を有する。さらに、これらの領域で入力された情報を中断間隔制御情報テーブル106へ登録する際に指定されるOKボタンG206および登録を取り消す際に指定されるキャンセルボタンG207を有する。GUI制御プログラム105は、ユーザが全ての領域を入力し終え、OKボタンG206をポインティング装置205で指定すると、各入力情報を中断間隔制御テーブル106の対応するエントリにそれぞれ上書きする。なお、コピーの開始は、図4で説明するコピータスク定期監視処理によって行われる。
【0046】
次に、第1の実施形態におけるコピータスク定期監視処理(図4)、分割サイズ算出処理(図5)およびコピーソフト中断再開処理(図6)の各種の処理を実行するプログラムの動作について説明する。
【0047】
図4は、コピータスク定期監視処理の動作を示すフローチャートである。本処理は、CPU203がコピータスク管理プログラム101を実行することによって、開始される。本処理は、1分に1度、定期的に起動する。なお、本処理の起動する間隔は1分に限らず、起動する間隔は定期的でなく変動してもよい。本処理では、起動するとまず、コピータスク管理情報テーブル105の全レコードにおいて、エントリT219の現在時刻Tnの値を更新する(S501)。
【0048】
次に、コピータスク管理プログラム101はコピー実行管理テーブル116を検索し、進捗率が「100%」であるレコードがあれば、その「状態」エントリの値を「完了」とし、コピータスクIDおよび容量を取得する。そのコピータスクIDでコピータスク管理テーブル105を検索し、マッチしたレコードの「進捗率」エントリの値を該容量に対応する割合だけ増やす。その結果、当該レコードの進捗率が100%となった場合は「コピー状態」エントリの値を「完了」とし、進捗率が100%未満となった場合は「コピー状態」エントリの値を「実行待ち」とする(S502a)。
【0049】
次に、コピータスク管理テーブル105を検索し、「コピー状態」エントリの値が「実行待ち」であるレコードの有無を確認する(S502b)。S502bの処理の結果、該レコードが無い場合S503の処理に進む。S503では、コピータスク管理テーブル105を検索し、現在時刻Tnが終了指定時刻Teを過ぎたが、「コピー状態」エントリの値が「完了」でないコピータスクの有無をチェックする(S503)。
【0050】
その結果、該コピータスクが有る(S503:Yes)場合は本処理を終了し、該コピータスクが無い(S503:No)場合、S505の処理に進む(S504)。S505では、コピータスク管理テーブル105を検索して、現在時刻Tnが開始指定時刻Tsを過ぎ、かつ「コピー状態」エントリの値が「待機」であるコピータスクの有無をチェックする(S505)。その結果、該コピータスクが無い場合は本処理を終了し、有る場合、該コピータスクに対してS507以下の処理を実行する(S506)。
【0051】
一方、S502bの処理の結果、該レコードが1つ以上有る場合、S502cの処理に進む(S502b)。そして、該レコードが2つ以上有る場合、「優先度」エントリの値が最小であるコピータスクを選択し、該コピータスクに対してS507以下の処理を実行する(S502c)。
【0052】
次に、S507において、図5で説明する分割サイズ算出処理(ボリューム分割管理プログラム104)により、コピータスク管理テーブル105における該コピータスクのレコードの情報に基づき、コピー速度Vおよび分割サイズSを算出する(S507)。そして、論理ボリュームLU(以下、ボリュームという)分割プログラム113を動作させ、コピー元ボリュームから該分割サイズSの分割領域(コピー実行ボリュームVn)の先頭LBAおよび最後のLBAを取得する(S508)。さらに、コピー実行管理テーブル116に、自動生成したコピー実行ID、当該コピータスクID、コピー実行ボリュームVnの先頭LBA、同最後のLBA、同容量、コピー開始時刻(現在時刻Tn)、状態(実行)および進捗率(0%)から成るレコードを追加した上で、コピー実行ボリュームVnのコピーをコピーソフト112に開始させる(S509)。最後に、コピータスク管理テーブル105における該コピータスクのレコードにおいて、「コピー状態」エントリの値を「実行」とし、本処理を終了する(S510)。
【0053】
図5は、コピーを実行する対象とすべきボリュームのサイズを算出する分割サイズ算出処理の動作を示すフローチャートである。本処理は、CPU203がボリューム分割管理プログラム104を実行することによって開始される。
【0054】
本処理では、開始するとまず、WAN情報テーブル115から制限帯域Wbを読み出す(S301a)。次に、帯域監視プログラム110へ使用帯域要求を送信し、WAN4の現時点で実際に使用されている使用帯域Wnを問い合わせる(S301b)。帯域監視プログラム110から使用帯域応答を受信して使用帯域Wnの値が分かると、制限帯域Wbから使用帯域Wnを差し引いた値を空き帯域Bとする(S301c)。
【0055】
次に、コピー速度決定テーブル107から、その空き帯域Bが該当するレコードを特定し、該レコードからコピー速度Vを取得する(S302)。ここで、コピー速度Vが0より大きい場合はS304aの処理に進み、コピー速度Vが0である場合はS301bの処理から再開する(S303)。
【0056】
次に、現在時刻Tnを取得し(S304a)、それをキーとして業務時間テーブル107を参照し、現在時刻Tnが該当する時間帯の終了時間Tfを取得する(S304b)。例えば、図2(1)のエントリ219から現在時刻Tnとして「1月29日17時15分」を取得し、その時刻が含まれる図2(6)の「時間帯」エントリの値「12時〜18時」を特定し、Tfとして「18時」を取得する。そして、TfからTnを差し引いた値を、業務切替までの残時間である使用帯域変動時間Tとする(S304c)。例えば、現在時刻Tnが「17時15分」であって、現在時刻Tnが該当する時間帯の終了時間Tfが「18時」のときのTの値は「45分」となる。
【0057】
次に、現在時刻Tnが該当する時間帯のコピーソフト中断履歴テーブル104のレコードを参照し、中断時間間隔エントリにおける最小値T'とする。なお、T’が空値で有った場合は、T'に上記使用帯域変動時間Tの値を代入する(S305)。次に、中断間隔制御テーブル106からコピーソフト中断間隔下限値(Tmin)を取得し、T'がTminを下回っている場合、T’にTminの値を代入する(S306a)。次に、中断間隔制御テーブル106からコピーソフト中断間隔上限値(Tmax)を取得し、T'がTmaxよりも大きい場合、T'にTmaxの値を代入する(306b)。
【0058】
以下、S305〜S306bまでの処理の具体例を説明する。図2(7)のコピーソフト中断履歴テーブル109から中断時間間隔エントリにおける最小値T‘を取得すると、T’は「2分」となる。これは、図2(3)の中断間隔制御情報テーブルにおいて、コピーソフト中断間隔下限値(Tmin)「10分」を下回っているため、T'にTminの値が代入されて、T'の値は「10分」となる。このS305〜S306bの処理により、S307の処理において、非常に小さい分割サイズや非常に大きい分割サイズが算出されることを防ぐ効果がある。最後に、コピー速度Vと使用帯域変動時間Tの積の値と、コピー速度Vと中断時間間隔の最小値T'の積の値とを比較し、小さいほうの値を分割サイズSとして、本処理を終了する(S307)。図4のS507では、本処理で算出したコピー速度Vおよび分割サイズSが利用される。
【0059】
図6は、コピーソフト中断再開処理の動作を示すフローチャートである。本処理は、CPU203がコピーソフト中断再開プログラム102を実行することによって、開始される。本処理は、1分に1度、定期的に起動する。なお、本処理の起動する間隔は1分に限らず、起動する間隔は定期的でなく変動してもよい。
【0060】
本処理では、起動するとまず、コピータスク管理情報テーブル105の全レコードにおいて、エントリT219の現在時刻Tnの値を更新する(S601)。次に、WAN情報テーブル115から、制限帯域Wbと推奨帯域使用率Pを読み出す(S602)。次に、帯域監視プログラム110へ使用帯域要求を送信し、WAN4の現時点で実際に使用されている使用帯域Wnを問い合わせる(S603a)。帯域監視プログラム110から使用帯域応答を受信して使用帯域Wnの値が分かると、使用帯域Wnを制限帯域Wbで割った値のパーセント表示値を帯域使用率P'とする(S603b)。そして、推奨帯域使用率Pと帯域使用率P'とを比較し、P'がPより小さい場合S605の処理へ進み、P'がP以上の場合、S611の処理へ進む(S604)。
【0061】
次に、S604においてP'がPより大きく、帯域使用率Pが推奨帯域使用率P'を超えている場合のS605〜S610の処理を説明する。まず、コピータスク管理テーブル105を検索し、「コピー状態」エントリの値が「実行」であるコピータスク群を特定する(S605)。その特定したコピータスク群のうち、「優先度」エントリの値が最大(優先度は最小となる)のコピータスクの中断をコピーソフト112に指示し、コピーを停止する(S606)。そして、コピーを中断した該コピータスクの「コピー状態」エントリの値を「中断」とする(S607)。次に、コピーソフト中断履歴テーブル109から、現在時刻Tnが該当する時間帯のコピーソフト中断履歴テーブルから、最も現在時刻Tnに近い中断時刻Tn'を取り出す(S608)。そのTn'とTnが同一日の時刻の場合は中断時間間隔TwをTnからTn'を差し引いた値とし、Tn'とTnがそれぞれ別の日の時刻の場合は、中断時間間隔Twは空値とする(S609)。そして、現在時刻Tnと中断時間間隔Twから成るレコードをコピーソフト中断履歴テーブル109に追加し、本処理を終了する(S610)。
【0062】
次に、S604においてP'がP以上であり、帯域使用率Pが推奨帯域使用率P'を超えていない場合のS611〜S615の処理を説明する。まず、制限帯域Wbから使用帯域Wnを差し引いた値を空き帯域Bとする(S611)。次に、コピー速度決定テーブル107から、その空き帯域Bが該当するレコードを特定し、該レコードからコピー速度Vを取得する(S612)。ここで、コピー速度Vが0より大きい場合は(S612:YES)S614の処理に進み、コピー速度Vが0である場合は本処理を終了する(S613)。S614の処理では、コピータスク管理テーブル105における「コピー状態」エントリが「中断」であるコピータスク群のうち、「優先度」エントリの値が最小(優先度最大)のコピータスクを特定する。なお、コピータスク管理テーブル105に「コピー状態」エントリが「中断」であるコピータスクが存在しない場合、本処理を終了する(S614)。最後に、特定したコピータスクのコピーを、コピー速度Vにてコピーソフトに再開させ、該コピータスクの「コピー状態」エントリの値を「実行」とし、本処理を終了する(S615)。
【0063】
以上で本発明の第1の実施形態を説明した。第1の実施形態は、WANの空き帯域を用いたアーカイブボリュームのリモートコピーにおいて、空き帯域に応じたコピー速度でコピーをするため、コピー速度と空き帯域の不一致を防止できる。また、コピー速度が大きすぎて優先トラフィックを妨害してしまうことを防止できる。
【0064】
さらに、コピーを行う際、WANの空き帯域に合わせたコピー速度とコピー中断の履歴に基づいて中断が発生しにくいデータのコピーサイズを算出し、該コピー速度と該コピーサイズに分割したボリュームよるコピーを行うため、複数のトラフィックが同一のWANを介して通信を行う計算機システムにおいて、コピー中断のリスクおよびコピー中断が生じた場合の転送効率の低下を防止することができる。
【実施形態2】
【0065】
第2の実施形態は、WANの空き帯域を利用したアーカイブボリュームのリモートコピーにストレージ装置を利用したリモートコピーに本発明を適用した計算機システムに関し、コピーソフトにおけるコピー速度が可変で無く固定されていて、複数のボリュームからなるボリューム群がコピー対象となる計算機システムに関する。
【0066】
図7は、第2の実施形態である計算機システムの構成例を示した図である。ただし、第1の実施形態における図1との構成の違いは、メインストレージ装置2におけるコピー元ボリューム群281、282、リモートストレージ想定3におけるコピー先ボリューム群283、284およびストレージ管理装置1におけるコピー多重度制御情報テーブル117のみであるため、ここでは図1との構成の違いであるこれらについてのみ説明する。
【0067】
ストレージ管理装置1におけるコピー多重度制御情報テーブル117は、メモリ201に格納され、コピーの多重実行に関する情報が記録される。メインストレージ装置2のコピー元ボリューム群281、282は、内部バスを介してポート220に接続され、コピー対象となるアーカイブやログなどのデータの原本を格納する。リモートストレージ装置3のコピー先ボリューム群283、284は、内部バスを介してポート230に接続され、コピー対象となるアーカイブやログなどのデータの複製を格納する。
【0068】
次に、ストレージ管理装置1のメモリ201に格納される各種テーブルのデータ構造について説明する。なお、ここでも第1の実施形態との違いであるコピー多重度制御情報テーブル117についてのみ説明する。
【0069】
コピー多重度制御情報テーブル117は配列構造を成し、1つ以上のレコードを格納可能である。ただし、データ構造が配列構造に限定されることはない。
【0070】
図8(1)は、コピー多重度制御情報テーブル117のデータ構造例を示す図である。コピー多重度制御情報テーブル117の各レコードは、コピーソフトの可変でないコピー速度である固定コピー速度V'が登録されるエントリT301、WANの空き帯域等を考慮して算出されるコピーソフトの並列実行数である最適ペア多重度が登録されるエントリT302および実行中のコピーソフトの並列実行数である実行ペア多重度が登録されるエントリT303から成る。例えばレコードT304は、コピーソフトの固定コピー速度が「20Mbps」であり、WANの空き帯域等を考慮した最適ペア多重度は「3」であり、実際に上記20Mbpsのコピー速度のコピーソフトの実行が、実行ペア多重度「3」プロセス並行(計20×3=60Mbps)して実施されていることを表す。
【0071】
次に、第2の実施形態で用いられるGUIについて説明する。なお、ここでも第1の実施形態と異なるコピー情報入力画面G301のみ説明する。
【0072】
図9は、ユーザが、第2の実施形態におけるコピーの実行に必要な情報を入力するために使用するコピー情報入力画面G301の表示例を示す図である。なお、コピー情報入力画面G101との差分のみ説明する。コピー情報入力画面G301は、コピー情報入力画面G101の各領域のうち、コピー元ボリューム名が入力されるG103をコピー元ボリューム群の各ボリューム名が入力されるG302に置き換え、コピー先ボリューム名が入力されるG104をコピー元ボリューム群の各ボリューム名が入力されるG303に置き換え、さらにコピーソフトの固定コピー速度が入力されるG304が追加した構成となっている。なお、G302およびG303の各領域にはボリューム名が列挙される。このコピー情報入力画面の入力処理が終わった後、図10で説明するコピータスク定期監視処理によってコピーが開始される。
【0073】
次に、第2の実施形態におけるコピータスク定期監視処理(図10)および分割サイズ算出処理(図11)について説明する。なお、ここでも第1の実施形態との違いである図10および図11についてのみ説明し、コピーソフト中断再開処理(図6)については、第1の実施形態と同様のため、説明を割愛する。また、図10および図11においても、図4および図5と異なる点のみ説明することとする。
【0074】
図10は、第2の実施形態におけるコピータスク定期監視処理の動作を示すフローチャートである。第1の実施形態における同処理を表す図4と異なる点はS801〜S803であるため、これらについてのみ以下説明する。
【0075】
まず、S801においては、図11で説明する最適ペア多重度/分割サイズ算出処理(ボリューム分割管理プログラム104)により、図8(1)のコピータスク管理テーブル105の情報に基づき、最適ペア多重度Nおよび分割サイズSを算出する(S801)。次に、ボリューム分割プログラム112を動作させ、コピー元ボリュームから該分割サイズSの分割領域を最大でN個(コピー実行ボリューム群Vg)分割し、それぞれの分割領域の先頭LBAおよび最後のLBAを取得する(S802)。
【0076】
さらに、Vgの各分割領域それぞれについて、コピー実行管理テーブル116に、自動生成したコピー実行ID、当該コピータスクID、分割領域の先頭LBA、同最後のLBA、同容量、コピー開始時刻(現在時刻Tn)、状態(実行)および進捗率(0%)から成るレコードを追加した上で、Vgの各コピーをコピーソフト112に開始させる。ここで、コピー多重度制御情報テーブル117の「最適ペア多重度」および「実行ペア多重度」のそれぞれのエントリに、最適ペア多重度Nと、実際にコピーを開始した実行ペア多重度の値を記録する(S803)。本処理の説明は以上であり、図10のその他の処理については図4の説明と同様である。
【0077】
図11は、第2の実施形態における最適ペア多重度/分割サイズ算出処理の動作を示すフローチャートである。第1の実施形態における分割サイズ算出処理を表す図5と異なる点はS901、S902、S903であるため、第1の実施形態と同様な点についての説明を省略し、これらについてのみ以下説明する。
【0078】
S901では、S301a〜S302の処理で算出されたコピー速度Vを、コピー多重度制御情報テーブル117から読み出した固定コピー速度V'で割った値(少数以下は切捨てる)を、最適ペア多重度Nとする(S901)。その最適ぺア多重度Nが1以上であればS304aの処理に進み、最適ペア多重度Nが1未満であればS301bから処理を再開する。
【0079】
最後に、S903では、S304〜S306bで算出された各値に基づき、最後に、固定コピー速度V'と使用帯域変動時間Tの積の値と、固定コピー速度V'と中断時間間隔の最小値T'の積の値とを比較し、小さいほうの値を分割サイズSとして、本処理を終了する(S903)。図10のS801以降では、本処理で算出した最適ペア多重度Nおよび分割サイズSが利用される。本処理の説明は以上であり、図11のその他の処理については図5の処理と同様であるので省略する。
【0080】
以上で本発明の第2の実施形態を説明した。第2の実施形態は、WANの空き帯域を利用したアーカイブボリュームのリモートコピーにおいて、コピーソフトにおけるコピー速度が可変で無く固定されていて、複数のボリュームからなるボリューム群がコピー対象となる場合に、本発明を適用した例を説明した。本例により、コピー速度が固定されたコピーソフトを利用する場合または複数のボリューム群をコピー対象とする場合についても、本発明が適用でき、第1の実施形態と同様の効果が得られる。
【実施形態3】
【0081】
第3の実施形態は、WANの空き帯域を利用したアーカイブボリュームのリモートコピーにストレージ装置を利用したリモートコピーに本発明を適用した計算機システムに関し、ストレージ装置および各種計算機が複数台混在した環境に本発明を適用した計算機システムに関する。
【0082】
第3の実施形態は、第1および第2の実施形態に対して、計算機の数および空き帯域Bの取得方法のみが異なる。このため、以下,構成の違いおよび空き帯域Bの取得方法についてのみ説明する。それ以外については、第1および第2の実施形態と同様であるので、説明を省略する。
【0083】
図12は、第3の実施形態である計算機システムの構成例を示した図である。計算機システムは、コピー元ボリュームが格納されたストレージ装置が配置されたメインサイト11、コピー先ボリュームが格納されたストレージ装置が配置されたリモートサイト13および両サイトを接続するWAN4から構成される。
【0084】
メインサイト11は、ストレージ管理装置501〜503、メインストレージ514〜516、ホスト506〜509、空き帯域の分配を制御する統合管理装置504、LAN505、ストレージとホストが通信する為の専用ネットワークであるストレージエリアネットワーク(以下、SANと略す)511、WANの空き帯域を監視する帯域監視装置512、ストレージデータを効率よく遠隔地に送信する専用装置であるエクステンダ511、スイッチ513から構成される。リモートサイト13は、メインサイト11と同様な構成である。WAN4は,遠隔下拠点間を結ぶ通信ネットワークであり、メインサイトとリモートサイト間の複数のトラフィックが流れているものとする。
【0085】
次に、統合管理装置504が備える空き帯域分配要求キュー602のデータ構造について説明する。空き帯域分配要求キュー602は配列構造を成し、1つ以上のレコードを格納可能である。ただし、データ構造が配列構造に限定されることはない。
【0086】
図13は、空き帯域分配要求キュー602のデータ構造例を示す図である。コピータスク管理情報テーブル105の各レコードは、空き帯域分配要求の実行順序が登録されるエントリT601および要求元のストレージ管理装置名が登録されるエントリT602を有する。例えばレコードT603は、空き帯域が生じたとき「1」番目に空き帯域が分配される要求元が「ストレージ管理装置3」であることを表す。
【0087】
次に第3の実施形態における空き帯域要求受信処理(図14(1))、空き帯域情報送信処理(図14(2))の動作について説明する。
【0088】
図14(1)は、空き帯域要求受信処理の動作を示すフローチャートである。本処理は、統合管理装置が空き帯域分配プログラム603を実行することによって、開始される。本処理は1度起動された後は常時起動しているものとする。本処理では、ストレージ管理装置からの空き帯域分配要求を受信すると、空き帯域分配要求キュー602の最後尾に格納する(S1001)。その後、常に起動したまま、ストレージ管理装置からの空き帯域分配要求を待ち受ける。本処理の動作は以上である。
【0089】
図14(2)は、空き帯域情報送信処理の動作を示すフローチャートである。本処理は、統合管理装置504が空き帯域分配プログラム603を実行することによって開始される。
【0090】
本処理は、1分に1度、定期的に起動する。なお、本処理の起動する間隔は1分に限らず、起動する間隔は定期的でなく変動してもよい。
【0091】
本処理では、起動するとまず、帯域監視装置512から空き帯域Bを取得し、その上で空き帯域分配要求キュー602の先頭のレコードを読み出す(S1002)。次に、空き帯域分配プログラム603は読み出したレコードの「要求元」エントリの値が示すストレージ管理装置へ空き帯域がBで有るという情報を送信する(S1003)。最後に、空き帯域分配要求キュー602の先頭のレコードを削除し、本処理を終了する(S1004)。
【0092】
以上、本発明の第3の実施形態を説明した。第3の実施形態では、ストレージ装置および各種計算機が複数台混在する環境において、本発明を適用した例を説明した。本実施形態により、複数ストレージ装置で空き帯域を有効利用することができ、ストレージ装置および各種計算機が複数台混在する環境においても、第1の実施形態および第2の実施形態と同様の効果が得られる。
【産業上の利用可能性】
【0093】
本発明は、災害に備えてWANを介してデータを遠隔地に転送するリモートコピーに利用でき、WANの利用効率を高めて通信コストの増大を防ぐ効果を期待できる。
【図面の簡単な説明】
【0094】
【図1】第1の実施形態におけるシステム構成例を示す図である。
【図2】コピータスク管理テーブル、コピー実行管理テーブル、中断間隔制御テーブル、WAN情報テーブル、コピー速度決定テーブル、業務時間テーブル、コピーソフト中断履歴テーブルのデータ構造例を示す図である。
【図3】コピー情報入力画面、中断間隔制御情報入力画面の表示例を示す図である。
【図4】第1の実施形態における、コピータスク定期監視処理の動作を示すフローチャートである。
【図5】第1の実施形態における、分割サイズ算出処理の動作を示すフローチャートである。
【図6】第1の実施形態における、コピーソフト中断再開処理の動作を示すフローチャートである。
【図7】第2の実施形態におけるシステム構成例を示す図である。
【図8】コピー多重度制御情報テーブル、コピータスク管理テーブル、コピー実行管理テーブルのデータ構造例を示す図である。
【図9】第2の実施形態における、コピー情報入力画面の表示例を示す図である。
【図10】第2の実施形態における、コピータスク定期監視処理の動作を示すフローチャートである。
【図11】第2の実施形態における、最適ペア多重度・分割サイズ算出処理の動作を示すフローチャートである。
【図12】第3の実施形態におけるシステム構成例を示す図である。
【図13】空き帯域分配要求キューのデータ構造例を示す図である。
【図14】第3の実施形態における、空き帯域要求受信処理、空き帯域情報送信処理の動作を示すフローチャートである。
【符号の説明】
【0095】
1…ストレージ管理装置
2…メインストレージ装置
3…リモートストレージ装置
4…WAN
5…LAN
101…コピータスク管理プログラム
102…コピー中断再開プログラム
104…ボリューム分割管理プログラム
110…帯域監視プログラム
112…コピーソフト
113…ボリューム分割プログラム

【特許請求の範囲】
【請求項1】
複数のストレージ装置であって、一のストレージ装置をデータの原本を記憶するメインストレージ装置として有し、他の一のストレージ装置を前記データの複製を記憶するリモートストレージ装置として有する前記複数のストレージ装置と、
1つ以上のホスト計算機と、
前記複数のストレージ装置と前記ホスト計算機とを接続する広域ネットワークと、
前記メインストレージ装置及び前記リモートストレージ装置に接続され、前記メインストレージ装置から前記ネットワークを介して前記リモートストレージ装置へのデータ転送を管理するストレージ管理装置と、
を備えるデータ転送システムであって、
前記ストレージ管理装置は、
帯域監視プログラムと、広域ネットワーク情報テーブルと、前記メインストレージ装置とリモートストレージ装置間のデータ転送速度決定テーブルと、業務時間テーブルと、データ転送中断履歴テーブルと、をメモリに記憶し、
前記広域ネットワーク情報テーブルに登録された前記広域ネットワークの制限帯域を読み出し、
前記帯域監視プログラムに対し使用帯域要求を送信して前記データ転送における使用帯域を問い合わせ、
前記制限帯域から前記使用帯域を差し引いて空き帯域を求め、
前記データ転送速度決定テーブルを参照して、前記空き帯域に対応する前記データ転送の速度を取得し、
前記データ転送速度が0以上の場合、現在時刻を取得し、業務時間と前記データ転送における優先トラフィックの使用帯域との関係を定めた前記業務時間テーブルにおける前記現在時刻が該当する時間帯の終了時間と現在時刻との差と、前記データ転送中断履歴テーブルに記憶された中における前記データ転送の際の障害発生間隔のうちの最小時間間隔と、を比較し、
この比較の結果、小さい方の値に前記決定したデータ転送速度を乗じて求めたデータ転送量で前記メインストレージ装置の論理ボリュームを分割し、
前記データ単位量で、前記メインストレージ装置から前記リモートストレージ装置に、前記メインストレージの論理ボリュームのデータを非優先トラフィックとして転送する、ことを特徴とするデータ転送システム。
【請求項2】
請求項1に記載のデータ転送システムであって
前記ストレージ管理装置は、データ転送中にネットワークの空き帯域が存在しているか否か測定し、
前記空き帯域が存在しない又は十分でない場合、実行しているデータ転送を中断し、前記空き帯域が十分に存在する場合、中断したデータ転送を再開する、ことを特徴とするデータ転送システム。
【請求項3】
請求項2に記載のデータシステムであって、
前記ストレージ管理装置は、データ転送を中断した場合、中断した時刻を前記データ転送中断履歴テーブルに記録する、ことを特徴とするデータ転送システム。
【請求項4】
請求項1に記載のデータ転送システムであって、
データ転送速度が固定であり、前記固定データ転送速度が前記該空き帯域量に対応するデータ転送速度よりも小さい場合、前記ストレージ管理装置は、前記固定データ転送速度により複数のデータ転送を実行する、ことを特徴とするデータ転送システム。
【請求項5】
請求項1に記載のデータ転送システムであって、
前記空き帯域を測定する統合管理装置を有し、前記統合管理装置はネットワークの空き帯域が存在しているか否か測定し、空き帯域が存在している場合、前記空き帯域量を要求する前記ストレージ管理装置へ通知する、ことを特徴とするデータ転送システム。
【請求項6】
広域ネットワークに接続された、メインストレージ装置とリモートストレージ装置間で非優先トラフィックに関するデータ転送をストレージ管理装置が管理するデータ転送方法において、
前記ストレージ管理装置は、
前記広域ネットワークの制限帯域から前記データ転送における使用帯域を差し引いて空き帯域を求めるステップと、
この空帯域に対する前記データ転送の速度を取得するステップと、
前記データ転送速度が0以上の場合、現在時刻を取得し、業務時間と前記データ転送における優先トラフィックの使用帯域との関係を定めたレコードにおける前記現在時刻が該当する時間帯の終了時間と現在時刻との差と、前記データ転送中断履歴テーブルに記憶された中における前記データ転送の際の障害発生間隔のうちの最小時間間隔と、を比較するステップと、
この比較の結果、小さいほうの値に前記決定したデータ転送速度を乗じて求めたデータ転送量で前記メインストレージ装置の論理ボリュームを分割するステップと、
前記データ単位量で、前記メインストレージ装置から前記リモートストレージ装置に、前記メインストレージの論理ボリュームのデータを非優先トラフィックとして転送するステップと、
を備えるデータ転送方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate