説明

ストレージシステム及びその制御方法

【課題】上位装置に対する記憶領域の提供が、既述のAOU技術によって実現されるストレージシステムにおいて、プールに割り当てられた記憶資源に対する必要電力を低減させ、かつ、この記憶資源の寿命低下を避けるようにした、ストレージシステムを提供する。
【解決手段】仮想ボリューム16Aにプール18に属するものとして定義された記憶デバイスを割り当てる。この割り当てはコントローラがホスト200Aからのアクセスに応じて行われる。記憶デバイスは仮想ボリューム16Aに割り当てられる前はその電源がオフされ、この割り当て時にその電源がオンされる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ハードディスクドライブ(以下、HDD、と称する)等の記憶デバイスに対するデータの記憶制御を行うストレージシステム及びその制御方法に関するものである。本発明は、特に、記憶デバイスの電源制御に関するものである。
【背景技術】
【0002】
ストレージシステムと、このストレージシステムにネットワークなどの通信経路を介して接続するサーバやホストコンピュータなどの上位装置とを備えた、コンピュータシステムで扱われるデータ量の増加に伴い、ストレージシステムが備える記憶領域が大容量化されてきている。ストレージシステムは、上位装置がアクセス可能な論理ボリュームを定義し、この論理ボリュームに割り当てられた物理的記憶領域に上位装置がアクセスすることによって、記憶デバイスに対するデータの入出力が可能となる。
【0003】
最近では、上位装置が取り扱うデータ量が大幅に増えていることから、ボリュームの記憶容量であるボリュームサイズを大幅に増やさなくてはならなくなっている。最初から大きなサイズの記憶領域を上位装置に割り当てておけば、上位装置にとって記憶容量の不足は起こらず、途中で上位装置に割り当てられている記憶領域のサイズを拡大する必要もない。しかしながら、上位装置である計算機がそれほど大量のデータを使わない場合には、計算機に割り当てられた記憶領域に未使用の領域が発生して、この未使用の記憶領域がこの上位装置に対して固定化されるために、記憶領域の利用に関して無駄が発生する。
【0004】
そこで、計算機のオンライン中に、一元的に管理された記憶領域から動的に適切な容量の記憶領域を割り当てることによって論理ボリュームの記憶容量を拡張することを目的として、ホストから記憶装置の論理ボリュームへアクセスされるリードもしくはライトI/Oの論理ブロックアドレスを監視し、取得された論理ブロックアドレスを元に、論理ボリュームの記憶領域を動的に伸長し、また、ホストの命令部からボリュームサーバへ論理ボリュームの容量拡張の指示により論理ボリュームの記憶領域を拡張する、ストレージシステムが提案されている(特開2003−15915号公報)。
【0005】
なお、本発明に関連する従来技術としての特開2005−4349号公報は、あるストレージ装置の記憶領域が不足した場合、物理ディスクを増設せずに、他のストレージ装置が保有している記憶資源を有効に活用する仕組みを提供することを目的として、情報処理装置から送信されるデータの書き込み要求を受信すると、第一のストレージ装置は第一の記憶領域に書き込みができるかどうかを判断し、書き込みができないと判断した場合、第一のストレージ装置は、第二のストレージ装置に対してデータを記憶するための第二の記憶領域を確保できるかどうかを判断するための情報を要求し、これに応じて、第二のストレージ装置は第二の記憶領域が確保できるかどうかを判断するための情報を第一のストレージ装置に送信し、第一のストレージ装置は、前記情報に基づいて第二の記憶領域が確保できるかどうかを判断し、確保できると判断した場合には、前記データを第二のストレージ装置に送信して第二の記憶領域に記憶する、ストレージシステムを開示している。
【特許文献1】特開2003−15915号公報
【特許文献2】特開2005−4349号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
出願人はストレージシステムにおいて記憶資源を有効に活用するために、Allocation on Use(AOU)という技術を開発している。このAOU技術は、ストレージシステムが、それ自身は記憶領域を持たない仮想ボリュームを上位装置に提供し、この仮想ボリュームにプールと呼ばれる、記憶デバイスの集合を対応させている。上位装置が仮想ボリュームにアクセスすると、ストレージシステムは上位装置によってアクセスされた仮想ボリュームの領域に、プールに属する記憶デバイスについての記憶領域を割り当てる。この割り当ては、上位装置が仮想ボリュームにアクセスすることに応じて実行される。一つのプールには複数の仮想ボリュームが対応可能であるために、ストレージシステムはプールの記憶領域を有効活用することができる。ストレージシステムはあらかじめ大きな、見かけの容量を持つ仮想ボリュームを用意しておき、プール内の記憶デバイス利用状況に応じて、プールに新たな記憶デバイスを追加する。
【0007】
AOU技術においては、プールに属するハードディスクドライブ(以下、[HDD]ということもある。)の電源オンが、仮想ボリュームに割り当て前から割り当て後まで継続されていると、電力が浪費されるとともにハードディスクドライブの寿命が低下するという課題がある。そこで、本発明は、上位装置に対する記憶領域の提供が、既述のAOU技術によって実現されるストレージシステムにおいて、プールに割り当てられた記憶資源に対する必要電力を低減させ、かつ、この記憶資源の寿命低下を避けるようにした、ストレージシステムを提供することにある。本発明の他の目的は、さらに、上位装置が記憶資源にアクセスする際のアクセス速度を向上可能なストレージシステムを提供することにある。
【課題を解決するための手段】
【0008】
前記目的を達成するために、本発明は、仮想ボリュームに割り当てられていない記憶デバイスを準備状態に置き、記憶デバイスが仮想ボリュームに割り当てられる際に記憶デバイスを準備状態から動作状態にして、電力消費を抑えたストレージシステムを提供することを特徴とするものである。仮想ボリュームに記憶デバイスが割り当てられる前に準備状態から動作状態にしておくことが好ましい。さらに仮想ボリュームに割り当てる際の優先度が高い記憶デバイスから、仮想ボリュームに割り当て前に記憶デバイスを準備状態から動作状態にしておくことが好ましい。さらに、仮想ボリュームに未割り当ての記憶デバイスの何パーセントかを事前に準備状態から動作状態にしておくことが好ましい。記憶デバイスの準備状態とは、例えば、記憶デバイスの駆動回路の電源がオフの状態、あるいは記憶デバイスの電源がオンではあるが、記憶デバイスが省電力モードにある状態をいう。
【発明の効果】
【0009】
以上説明したように、本発明によれば、上位装置に対する記憶領域の提供が、既述のAOU技術によって実現されるストレージシステムにおいて、プールに割り当てられた記憶資源に対する必要電力を低減させ、かつ、この記憶資源の寿命低下を避けることができる。さらに本発明によれば、上位装置が記憶資源にアクセスする際のアクセス速度を向上することができる。
【発明を実施するための最良の形態】
【0010】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、以後説明される図面においては、同一部には同一符号を付し、その繰り返しの説明は省略又は簡略化されることがある。図1は、本発明が適用されるストレージシステム(「ストレージ装置」ということもある。)600を含んだ、記憶制御システムを示すハードウエアブロック図である。ストレージシステム600は複数の記憶デバイス300と、情報処理装置200からの入出力要求に応答して記憶デバイス300への入出力制御を行う記憶デバイス制御装置(コントローラ)100と、を備えて構成されている。
【0011】
情報処理装置200は上位装置に相当し、CPUやメモリ等を備えたサーバやホストコンピュータ(ホスト)や、ストレージ装置の管理用コンピュータからなり、例えば、ワークステーション、メインフレームコンピュータ、パーソナルコンピュータ等で構成される。情報処理装置200は複数台のコンピュータをネットワーク接続して構成することもできる。情報処理装置200はオペレーティングシステム上で動作するアプリケーションプログラムを実装している。アプリケーションプログラムとしては、例えば、銀行の自動預金預け払いシステムや航空機の座席予約システム等がある。また、サーバとしては、アプリケーションを実行する、更新系サーバや、更新系サーバのバックエンドでバックアップなどを実行するバックアップサーバがある。
【0012】
情報処理装置1乃至3(200)はLAN(Local Area Network)400を介してストレージ装置600と接続されている。LAN400は、例えば、イーサネット(登録商標)やFDDI等の通信網であり、情報処理装置1乃至3(200)とストレージシステム600との間の通信はTCP/IPプロトコルによって行われる。情報処理装置1乃至3(200)からはストレージシステム600に対してファイル名指定によるデータアクセス要求(ファイル単位でのデータ入出力要求。以下、ファイルアクセス要求と称する。)が後述のチャネル制御部CHN1乃至CHN4(110)に送信される。
【0013】
LAN400にはバックアップデバイス910が接続されている。バックアップデバイス910は、例えば、MO、CD−R、DVD−RAM等のディスク系デバイス、DATテープ、カセットテープ、オープンテープ、カートリッジテープ等のテープ系デバイスで
ある。バックアップデバイス910はLAN400を介して記憶デバイス制御装置100との間で通信を行うことにより記憶デバイス300に記憶されているデータのバックアップデータを記憶する。また、バックアップデバイス910は情報処理装置1(200)と接続し、情報処理装置1(200)を介して記憶デバイス300に記憶されているデータのバックアップを取得する。
【0014】
記憶デバイス制御装置100はチャネル制御部CHN1乃至4(110)を備える。記憶デバイス制御装置100は、チャネル制御部CHN1乃至4(110)とLAN400とを介して、情報処理装置1乃至3(200)と、バックアップデバイス910と、記憶デバイス300との間のライトアクセス又はリードアクセスを媒介する。チャネル制御部CHN1乃至4(110)は情報処理装置1乃至3(200)からのファイルアクセス要求を個々に受け付ける。すなわち、チャネル制御部CHN1乃至4(110)には個々にLAN400上のネットワークアドレス(例えば、IPアドレス)が割り当てられていて、それぞれが個別にNASとして振る舞い、個々のNASがあたかも独立したNASが存在するかのようにNASとしてのサービスを情報処理装置1乃至3(200)に提供することができる。このように1台のストレージシステム600に個別にNASとしてのサービスを提供するチャネル制御部CHN1乃至4(110)を備えるように構成したことで、従来、独立したコンピュータで個々に運用されていたNASサーバが一台のストレージシステム600に集約される。そして、これによりストレージシステム600の統括的な管理が可能となり、各種設定・制御や障害管理、バージョン管理といった保守業務の効率化が図られる。
【0015】
情報処理装置3乃至4(200)はSAN500を介して記憶デバイス制御装置100と接続されている。SAN500は、記憶デバイス300が提供する記憶領域におけるデータの管理単位であるブロックを単位として情報処理装置3乃至4(200)との間でデータの授受を行うためのネットワークである。SAN500を介して行われる情報処理装置3乃至4(200)と記憶デバイス制御装置100との間の通信は一般にSCSIプロトコルに従って行われる。情報処理装置3乃至4(200)からは、ストレージシステム600に対して、ファイバチャネルプロトコルに従ってブロック単位のデータアクセス要求(以下、ブロックアクセス要求と称する。)が送信される。
【0016】
SAN500にはSAN対応のバックアップデバイス900が接続されている。SAN対応バックアップデバイス900は、SAN500を介して記憶デバイス制御装置100との間で通信を行うことにより、記憶デバイス300に記憶されているデータのバックアップデータを記憶する。
【0017】
記憶デバイス制御装置100はチャネル制御装置CHN1乃至4(110)に加えて、更にチャネル制御部CHF1乃至2,CHN2乃至3(110)を備える。記憶デバイス制御装置100はチャネル制御部CHF1乃至2(110)とSAN500とを介して、情報処理装置3乃至4(200)及びSAN対応バックアップデバイス900との間の通信を行う。チャネル制御部は、上位装置からのアクセスコマンドを処理する。
【0018】
情報処理装置5(200)は、更に、LAN400やSAN500等のネットワークを介さずに記憶デバイス制御装置100と接続されている。この情報処理装置5(200)の例は、例えばメインフレームコンピュータである。情報処理装置5(200)と記憶デバイス制御装置100との間の通信は、例えばFICON(Fiber Connection)(登録商標)やESCON(Enterprise System Connection)(登録商標)、ACONARC(Advanced Connection Architecture)(登録商標)、FIBARC(Fiber Connection Architecture)(登録商標)などの通信プロトコルに従って行われる。情報処理装置5(200)からはストレージシステム600に対して、これらの通信プロトコルに従ってブロックアクセス要求が送信される。記憶デバイス制御装置100は、チャネル制御部CHA1乃至2(110)を通じて情報処理装置5(200)との間で通信を行う。
【0019】
SAN500には、他のストレージシステム610が接続されている。ストレージシステム610は、記憶デバイス制御装置100にストレージシステムが有する記憶資源を提供するという機能を、情報処理装置及びストレージ装置600に提供する。ストレージ装置の情報処理装置に対する見かけ上の記憶領域が、ストレージ装置610によって拡張されたことになる。なお、ストレージシステム610はSAN500以外にもATMなどの通信回線によりストレージシステム600に接続していることもある。また、ストレージシステム610をストレージシステム600に直接接続することもできる。
【0020】
このように、ストレージシステム600内にチャネル制御部CHN1乃至4(110)、チャネル制御部CHF1乃至2(110)、チャネル制御部CHN1乃至2(110)を混在させて装着させることにより、異種ネットワークに接続できるストレージシステム
を実現できる。即ち、このストレージシステム600はチャネル制御部CHN1乃至4(110)を用いてLAN400に接続し、かつチャネル制御部CHA1乃至2(110)を用いてSAN500に接続するという、SAN−NAS統合ストレージシステムである。
接続部150は、各々のチャネル制御部110、共有メモリ120、キャッシュメモリ130、及び各々のディスク制御部140を相互に接続する。記憶デバイスとしては、主として、ハードディスクドライブであるために、記憶デバイス制御部を便宜上ディスク制御部とした。これらのチャネル制御部110、共有メモリ120、キャッシュメモリ130、及びディスク制御部140相互間のコマンド又はデータの送受信は接続部150を介して行われる。接続部150は例えば高速スイッチングによりデータ伝送を行う超高速クロスバスイッチ等の高速バスで構成される。これにより、チャネル制御部110相互間の通信パフォーマンスが大幅に向上するとともに、高速なファイル共有機能や高速フェイルオーバー等が可能になる。
【0021】
共有メモリ120、及びキャッシュメモリ130はチャネル制御部110、及びディスク制御部140が共用するメモリ装置である。共有メモリ120は主として制御情報やコマンド等を記憶するために利用され、キャッシュメモリ130は主としてデータを記憶するために利用される。例えば、あるチャネル制御部110が情報処理装置200から受け取ったデータ入出力コマンドが書き込みコマンドであった場合に、当該チャネル制御部110はその書き込みコマンドを共有メモリ120に書き込むとともに、情報処理装置200から受け取ったライトデータをキャッシュメモリ130に書き込む。一方、ディスク制御部140は共有メモリ120を監視しており、共有メモリ120に書き込みコマンドが書き込まれたと判定すると、当該書き込みコマンドに従ってキャッシュメモリ130からライトデータを読み出して、これを記憶デバイス300に書き込む。
【0022】
一方、あるチャネル制御部110が情報処理装置200から受け取ったデータ入出力コマンドが読み出しコマンドであった場合に、当該チャネル制御部110はその読み出しコマンドを共有メモリ120に書き込むとともに、読み出し対象となるデータがキャッシュメモリ130に存在しているか否かをチェックする。ここで、読み出し対象となるデータがキャッシュメモリ130に存在している場合には、チャネル制御部110はそのデータをキャッシュメモリ130から読み取って情報処理装置200に送信する。読み出し対象となるデータがキャッシュメモリ130に存在していない場合には、共有メモリ120に読み出しコマンドが書き込まれたことを検出したディスク制御部140は読み出し対象となるデータを記憶デバイス300から読み出してこれをキャッシュメモリ130に書き込むとともに、その旨を共有メモリ120に書き込む。チャネル制御部110は共有メモリ120を監視することにより、読み出し対象となるデータがキャッシュメモリ130に書き込まれたことを検出すると、そのデータをキャッシュメモリ130から読み出して情報処理装置200に送信する。
【0023】
ディスク制御部140はチャネル制御部110から送信された論理アドレス指定による記憶デバイス300へのデータアクセス要求を、物理アドレス指定によるデータアクセス要求に変換し、チャネル制御部110から出力されるI/O要求に応答して記憶デバイス300へのデータの書き込み又は読み取りを行う。記憶デバイス300がRAID構成されている場合には、ディスク制御部140はRAID構成に従ったデータのアクセスを行う。この他にも、ディスク制御部140は記憶デバイス300に記憶されたデータの複製管理、バックアップ制御、災害発生時のデータ消失防止(ディザスタリカバリ)等を目的としてレプリケーション制御又はリモートコピー制御等を行う。すなわち、ディスク制御部は、記憶デバイスであるHDDの制御、RAIDグループの制御を行う。複数のHDDの記憶領域によってRAIDグループが構成されている。
【0024】
記憶デバイス300は単一又は複数のディスクドライブ(物理ボリューム)を備えており、情報処理装置200からアクセス可能な記憶領域を提供する。記憶デバイス300が提供する記憶領域には単一又は複数の物理ボリュームの記憶空間を合わせた論理ボリュームが設定されている。記憶デバイス300に設定される論理ボリュームには、情報処理装置200からアクセス可能なユーザ論理ボリュームや、チャネル制御部110の制御のために使用されるシステム論理ボリュームがある。システム論理ボリュームにはチャネル制御部110で実行されるオペレーティングシステムも格納されている。また、記憶デバイス300が、上位装置に提供する論理ボリュームには、各々のチャネル制御部110がアクセス可能な論理ボリュームが割り当てられている。もとより、複数のチャネル制御部110が同一の論理ボリュームを共有することもできる。
【0025】
尚、記憶デバイス300として、例えば、ハードディスク装置や半導体メモリ(フラッシュメモリ等)を用いることができる。記憶デバイス300のストレージ構成として、例えば、複数の記憶デバイス300によりRAID方式のディスクアレイを構成してもよい。また、記憶デバイス300と記憶デバイス制御装置100は直接接続してもよく、ネットワークを介して接続してもよい。更に、記憶デバイス300は記憶デバイス制御装置100と一体に構成してもよい。
【0026】
管理端末160はストレージシステム600を保守・管理するためのコンピュータ装置であり、内部LAN151を通じて各々のチャネル制御部110とディスク制御部140に接続している。オペレータは管理端末160を操作することで記憶デバイス300のディスクドライブの設定、論理ボリュームの設定、チャネル制御部110やディスク制御部140で実行されるマイクロプログラムのインストール等を行うことが可能である。この種の制御は、管理端末に基づくもののほか、上位装置(ホスト)上で動作するプログラムがネットワークを経由するものに基づいても良い。
【0027】
図2は図1に示す記憶制御システムの機能ブロック図である。図2は、既述のAOUの処理動作を示している。この処理動作を、以後AOU処理と呼ぶ。チャネル制御部110は、マイクロプロセッサCT1とローカルメモリLM1を備え、チャネルコマンド制御プログラムはローカルメモリLM1に記憶されている。マイクロプロセッサCT1はローカルメモリLM1を参照してチャネルコマンド制御プログラムを実行する。
【0028】
チャネルコマンド制御プログラムは、ホストにLUを提供する。チャネル制御プログラムはホストからLUに対して送られるアクセスコマンドを処理し、LDEVへのアクセスへと変換する。チャネルコマンド制御プログラムはホストからのアクセスに依らず、 LDEVに対してアクセスすることもある。LDEVとは、RAIDグループの一部分を論理的に切り出した論理ボリュームである。但し、仮想LDEVはホストのアクセスを受けるが、実記憶領域を備えていない。ホストはLDEVではなく、LUにアクセスする。LUとは、ホストがアクセスする記憶領域の単位である。一部のLUは仮想LDEVに割り当てられている。以後仮想LDEVに割り当てられているLUを実ボリュームに割り当てられているLUと区別するために、便宜上「仮想LU」という。
【0029】
ディスク制御部140は、マイクロプロセッサCT2とローカルメモリLM2とを備えている。ローカルメモリLM2には、RAID制御プログラムとHDD制御プログラムが記憶されている。マイクロプロセッサCT2はローカルメモリLM2を参照して、RAID制御プログラムとHDD制御プログラムを実行する。RAID制御プログラムは、複数のHDDからRAIDグループを構成し、上位のチャネルコマンド制御プログラムにLDEVを提供する。HDD制御プログラムは、上位のRAID制御プログラムの要求に応じてHDDに対してデータの読み書きを実行する。ホスト200AはLU10を介してLDEV12Aにアクセスする。
【0030】
ホスト200Bに対する記憶領域はAOU技術によって構成されている。ホスト200Bは仮想LU14を介して仮想LDEV16にアクセスする。仮想LDEV16にはプール18が割り当てられており、このプールにはLDEV12B,12Cが割り当てられている。仮想LUと仮想LDEVとが仮想ボリュームに相当する。プールとは、仮想LDEVに割り当てられるLDEVの集合をいう。なお、チャネルI/F,I/Oパスとは、ホストがストレージサブシステムにアクセスするインターフェースであり、ファイバチャネル、iSCSIなどをいう。ディスク制御部140は、前記RAID制御プログラム、HDD制御プログラムに基づいて、プール18内の記憶領域をホスト200Bからのデータ書き込みアクセスに基づいて仮想LDEVに割り当てる。また、HDD制御プログラムは、プール18に割り当てられたLDEVを提供するHDDの電源の制御を実現する。
【0031】
図3は仮想ボリュームとプールとの関係を示すブロック図である。ホストは仮想ボリューム16に対してアクセスする。アクセスされた仮想ボリュームの領域はプール18内の記憶領域に対応している。このプール内の記憶領域の仮想ボリュームに対する割り当ては、ホストからのアクセスに応じてチャネル制御部110によって動的に生成される。仮想ボリュームの領域のうち使用されていない領域の分は物理記憶装置を消費しないので、ストレージシステムはホストに対してあらかじめ十分大きな容量の仮想ボリュームを用意しておき、プール18内の記憶領域の仮想ボリュームに対する割り当て状況を見て、徐々に新たな記憶領域18Aをプール18に追加するという運用が可能になる。
【0032】
図4は本発明の特徴をより端的に示す機能ブロック図である。ストレージシステム600には、各ホストがアクセスする、仮想ボリューム17A,17B・・・17Nが存在し、各仮想ボリュームにホスト200A,200B・・・200Nが対応している。各仮想ボリュームにプールA,B・・・Nがそれぞれ対応している。仮想ボリューム16Aの、ホスト200Aにとっての見かけ上の容量のうち、実際に記憶領域がプールAから割り当てられている部分は17Aで示されている。他の仮想ボリュームについても同様である。
【0033】
符号301は、プールAに割り当てられている複数のHDDの集合を示している。符号302で括られたHDDの集合は、仮想ボリューム16Aに既に割り当てられたハードディスクドライブの集合であり、仮想ボリューム16Aの実記憶領域17Aを提供している。
符号303で括られたHDDの集合は、仮想ボリューム16Aに未割り当てのHDDの集合を示す。複数のHDD302の各電源スイッチはオンされており、複数のHDDの各電源スイッチはオフされている。
【0034】
符号10はプール制御機能を示し、符号20は電源制御機能を示す。これら機能は、HDD制御プログラム(図2)によって実現される。プール制御機能とは、各プールに属するHDDのAOUボリューム16A・・・16Nへの割り当ての制御を実現し、プール内のHDDの電源のオン又はオフの割合を決定する機能である。
【0035】
電源制御機能とは、各HDDの電源の実際のオン/オフを制御する機能である。仮想ボリュームに未割り当てのHDDの電源はオフ状態になっているために、ストレージシステムの消費電力を低減することが可能となっている。HDD制御プログラムは、HDDを仮想ボリュームに割り当てる際に、HDDの電源をオンする。符号19は、仮想ボリュームに割り当てられている記憶領域以上のデータがホストから仮想ボリュームに書き込み要求された時などで、当該データを一時的に格納しておく一時記憶領域(Temp領域)を示している。このTemp領域には各仮想ボリュームについての記憶領域(19A,19B・・・・19N)が確保されている。なお、電源をオフする代わりにHDDの電源を省電力モードにするものであっても良い。この場合は、HDDを仮想ボリュームに割り当てる際に、HDDの電源を省電力モードから通常モードに切り替える。以後の説明では、HDDの電源をオフすることを例とするが、これに限定するものではない。
【0036】
ストレージシステムは、プールに属するHDDの電源を制御するために必要な制御テーブルを備えている。図5はディスク管理テーブルであり、同一プールに属するHDDについて、HDDの種別、性能(容量と回転数)、記憶可能容量、HDDが搭載されているストレージ装置の区別、アクセス頻度、仮想ボリュームへの割り当て(AOU割り当てのことである。)の有無、各HDD電源状態に関する情報が図5の制御テーブルに登録されている。
【0037】
この制御テーブルの初期設定は、管理装置によって行われる。管理装置の一例がストレージシステムに設けられている管理端末160である。管理装置の他の例として、LANによってストレージシステムに接続された管理サーバである。図5の制御テーブルへの、AOU割り当ての要否、及び電源のオン・オフの要否は、チャネル制御部110がホストからのアクセスに応じて判定し、この判定結果をディスク制御テーブルに更新記録する。ディスク制御部140はこの制御テーブルに基づいて、HDDのAOU割り当て、HDDの電源制御を実行する。なお、この更新記録を管理装置の機能によって実現しても良い。ディスク管理テーブルは共有メモリに記録される。ディスク制御部は、HDDの残り容量をディスク管理テーブルに記録する。
【0038】
図6は、プールに属するHDDの電源制御を実行するためのプール管理テーブルを示したものである。この管理テーブルは各プールについて全記憶容量を有している。全記憶容量はプールに割り当てられた複数の記憶デバイスの記憶容量の合計である。この全記憶容量はプールに新たな記憶デバイスを割り当てることによって増加される。プール管理テーブルは、全記憶容量のうちAOU割り当てがされていないHDDの合計記憶容量、AOU未割り当てであるが、電源がオンになっているHDDの全記憶容量、電源がオンになっているHDDの電源オフのHDDに対する比率、AOU未割り当てのHDDに対する、電源をオンすべき、AOU未割り当てのHDDの比率、HDDの電源をオフからオンにする際の、電源オフのHDDに対する電源オンにすべきHDDの比率に関する情報を含んでいる。比率とはHDDの数ではなく、HDDの記憶容量を基準にしたときの比率である。この制御テーブルは共有メモリに記録されている。ディスク制御部はこの制御テーブルを参照して、記憶デバイスの電源制御を実行する。
【0039】
図7は、プール管理テーブルに含まれる制御情報の説明図であり、(1)はAOU未割当のHDDを示し、(2)は未割当の記憶デバイスのうち電源オンのHDDの領域を示したものである。現在電源オンのHDDの比率は、((2)/(1))×100(%)で示され、HDDの電源をオンに変換する割合とは、AOU未割当の電源オンのHDDが閾値を下回った場合に、電源をオフから電源をオンにすべき制御を行なう基準と成るものである。図7において、一つの矩形ブロックが一つのHDDに対応している。図8に示すように、HDDとしては、ファイバチャネルやSATAを通信プロトコルとするHDDを使用できる。性能が高いHDD(FCドライブ)から優先的にAOU割り当てがされる。すなわち、高性能なHDDから優先的に電源がオンされる。
【0040】
AOUが未割り当てのHDDでも、AOU割り当て前に電源をオンするのは、ホストからAOUボリューム(仮想ボリューム)へのアクセス速度を向上させるためである。図9に示すように、記憶デバイスの電源オン・オフは筐体毎に制御されても良い。筐体とは複数の記憶デバイスを収容する構造体である。筐体1乃至筐体3はそれぞれ複数の記憶デバイスを備え、筐体1乃至筐体3のそれぞれについて記憶デバイスの電源が制御される。仮想ボリュームへ割り当ては記憶デバイス毎に行われる。筐体毎に性能の異なる記憶デバイスが当該筐体に収容されている。性能の高い、すなわち、アクセスされる際の性能が高い記憶デバイスから電源がオン、すなわち、仮想ボリュームに優先的に割り当てられる。また、過去の使用頻度が低い記憶デバイスから電源をオンする等、運用形態に基づく優先度付けも考えられる。
【0041】
次に、HDDの電源制御の動作例について説明する。第1の例に係わるフローチャートを図10に示す。チャネル制御部がホストから書き込み命令を受領する(1000)と、チャネル制御部は書き込み命令を解析し、ライトデータをTemp領域に一次記憶し、ホストに書き込み成功を返す(1002)。次いで、チャネル制御部は、AOU処理を実行する。AOU処理とは、上位装置からの書き込みアクセスがストレージシステムにあると、チャネル制御部は、上位装置からのアクセスがあった仮想ボリュームの領域に実記憶領域を割り当てられているか否かを判定し、仮想ボリュームに実記憶領域が割り当てられていない場合には、これを割り当てる。
【0042】
チャネル制御部は、この判定のために、Temp領域に格納されたデータ容量と電源がオンされているHDDの未割り当て記憶領域の合計容量とを比較して(1004)、この合計容量は、チャネル制御部がディスク管理テーブル(図5)を参照することによって分かるが、Temp領域の容量が未割り当ての記憶領域の合計容量を超える場合には、チャネル制御部は電源オフ状態のHDDの電源を新たにオンすべくディスク管理テーブルの内容を更新する。
【0043】
ディスク制御部は、この制御テーブルを参照して、優先度にしたがって、すなわち、図5のテーブルの上から順番に電源をオンにすべきHDDを定めて、このHDDの電源をオフからオンにする(1006)。これにより、新たに電源オンになったHDDは、上位装置に対して新たな記憶領域を提供する。チャネル制御部はこの制御テーブルを参照しつつ、再度上記判定ステップ(1004)を実行する。
【0044】
上記判定ステップにおいて、Temp領域の容量が未割り当ての記憶領域の合計容量以下の場合には、電源オンの記憶デバイスの未割り当て領域を仮想ボリュームに割り当てて、この領域にTemp領域の格納データを格納するとともに、Temp領域の格納データを消去する(1008)。
【0045】
図11は第2の処理例を示すものであり、第1の処理例と異なる部分は、上位装置からストレージシステムに書き込み要求されたデータ容量が、電源オンの記憶デバイスの未割り当て領域を超える場合に、書き込み要求されたデータをTemp領域に格納する点である。ステップ1100では、チャネル制御部はホストからのライト処理命令を受領する。
ステップ1102の処理において、書き込み要求された容量が電源オンのHDDの未割り当て総容量を超える場合に、Temp領域に記憶データを一時記憶する(1104)。次いで、HDDの電源がオンされる(1106)。
【0046】
ステップ1108において、ディスク制御部は、Temp領域に格納されたデータ量と電源がオンされたHDDのAOU未割り当ての記憶領域の総容量とを比較し、前者が後者の容量を超える場合には、ディスク制御部はステップ1108の処理を再実行する。ステップ1108において、前者の容量が後者の容量以下の場合には、ディスク制御部は、新たに電源オンしたHDDを新たに仮想ボリュームに割り当てて、Temp領域の格納データを電源オンしたHDDに移動する(1112)。次いで、ディスク制御部はTemp領域のデータを消去する。
【0047】
図12はHDDの電源オン動作の遷移を示すブロック図である。(1)で上位装置(ホスト)にて電源オンに係わる記憶領域以上の書き込みが発生すると、(2)にて、ストレージシステムはTemp領域に書き込みデータを格納して、ホストに書き込み完了を通知する。次いで、ストレージシステムは、(3)で示すように、ある割合、例えば10%分のHDDの電源をオンする。この割合を達成するように、記憶デバイス単位で、ディスク制御部はHDDの電源をオンする。(4)に示すように、電源オンしたHDDの未割り当て領域の容量とTemp領域の格納容量とを比較して、前者が不足していれば、さらに10%相当の記憶容量を提供するに足るHDDの電源がオンされる。(5)において、電源オンされたHDDの記憶領域を仮想ボリュームに割り当てて、この領域にTemp領域からデータを移動する。
【0048】
図13はHDDの電源オン動作の遷移を示す第2の例に係わるブロックである。(3)において、HDDの電源オンが筐体単位で行われる点が、第1の例と異なる。HDDが仮想ボリュームに割り当てられる前に電源オンされる割合は、適宜選択されるものであるって限定されるべきものではない。図14は第3の例に係わるブロック図である。この処理例は、図10及び図11の処理の終了の後、電源オンにすべきHDDの割合(閾値)と現在電源オンになっているHDDの割合を、ディスク制御部がプール管理テーブルに基づいてチェックして、現在電源オンになっているHDDの割合が閾値に達していなければ、新たに他の記憶デバイスの電源をオンする(図12の(1)から(2))。このために、ディスク制御部は、図10又は図11の処理の終了後、電源オンであるHDDのAOU未割り当て領域の容量又は割合をプール管理テーブルに基づいて算出し、これを同テーブルに定まっている閾値と比較し、閾値以下或いは閾値未満である場合には、この閾値に達するのに必要な記憶容量を算出し、この記憶容量相当分のHDDの電源をオンにする。
【0049】
図15は記憶デバイスの電源制御の他の処理例を示すブロック図である。AOUボリューム16の実記憶容量は固定ではなく変化するため、AOUボリュームのデータを正規化用に割り当てられたディスク16にコピーして、AOUボリュームに割り当てられた記憶領域をこの割り当てから解放することが行われる。図15では、仮想ボリューム16に割り当てられたプール18に属する複数の記憶領域(複数のハードディスクドライブ)のデータが正規化用ボリューム16にマイグレートされた状態を示している。
【0050】
正規化ボリュームにデータがマイグレート後、マイグレートもとのAOU割り当てが解放されたHDDの電源はオンからオフにされる。このHDDの記憶領域は、AOUボリュームに新たに割り当てられる。図16は正規化処理を実現するためのディスク管理テーブルである。ディスク属性は、HDDが仮想ボリュームに割り当てられたものか、正規化ボリュームに割り当てられた(Fixed)かを示すものである。正規化ボリュームに割り当てられたHDDのAOU割当フラグはオフとなる。一旦仮想ボリュームに割り当てられ電源がオンされたハードディスクドライブは、正規化処理などの後、このHDDのAOU割当に対して解放され、電源がオフされる。この処理により電源がオフされたHDDはプールへの割当から解放されても良い。なお、プールに新たなHDDを割り当てることによって、プールの総記憶容量を増加することができる。なお、既述の実施形態において、Temp領域はキャッシュメモリによって提供される。
【図面の簡単な説明】
【0051】
【図1】本発明が適用されるストレージシステムを含んだ、記憶制御システムを示すハードウエアブロック図である。
【図2】図1に示す記憶制御システムの機能ブロック図である。
【図3】仮想ボリュームとプールとの関係を示すブロック図である。
【図4】記憶デバイスの電源制御を示す機能ブロック図である。
【図5】コントローラが記憶デバイスの制御を実行するための管理テーブルである。
【図6】プールに属するHDDの電源制御を実行するためのプール管理テーブルである。
【図7】プール管理テーブルに含まれる制御情報の説明図である。
【図8】プールに属する記憶デバイスの種類と、記憶デバイスの電源オン又はオフ状態を示す、プールのブロック図である。
【図9】記憶デバイスの電源オン・オフが筐体単位で行われることを示す、プールのブロック図である。
【図10】記憶デバイスの電源制御動作を示す、フローチャートである。
【図11】記憶デバイスの電源制御動作の第2の例を示す、フローチャートである。
【図12】記憶デバイスの電源制御動作の遷移を示す、プールのブロック図である。
【図13】記憶デバイスの電源制御動作の遷移の第2の例を示す、プールのブロック図である。
【図14】その第3の例を示す、プールのブロック図である。
【図15】プール内の記憶デバイスに格納されたデータを正規化ボリュームに移動することを示す、機能ブロック図である。
【図16】正規化処理を実現するためのディスク管理テーブルである。
【符号の説明】
【0052】
16 仮想ボリューム、18 プール、100 コントローラ、110 チャネル制御部、140 ディスク制御部、200 上位装置、300 ハードディスクドライブ、600 ストレージシステム

【特許請求の範囲】
【請求項1】
複数の記憶デバイスと、通信経路を介して接続される上位装置からの要求に応じて、前記記憶デバイスに対するデータを入出力制御を行うコントローラと、を備えるストレージシステムにおいて、
前記上位装置がアクセスする仮想ボリュームと、
前記仮想ボリュームに割り当てられた、前記複数の記憶デバイスからなるプールと、
を備え、
前記コントローラは、前記仮想ボリュームに対する前記ホストからのアクセスに応じて、前記プール内の記憶デバイスを当該仮想ボリュームに割り当てるとともに、前記仮想ボリュームに割り当てられていない、前記プール内の前記記憶デバイスを準備状態にし、前記仮想ボリュームに割り当てられている前記記憶デバイスを動作状態にする、ストレージシステム。
【請求項2】
前記コントローラは、前記仮想ボリュームに割り当てらてれる前記記憶デバイスの電源をオンし、前記準備状態の記憶デバイスの電源をオフする、請求項1記載のストレージシステム。
【請求項3】
前記コントローラは、前記仮想ボリュームへの割り当て前に、複数の前記記憶デバイスのうち、一部の記憶デバイスの電源をオンする請求項2記載のストレージシステム。
【請求項4】
前記記憶デバイスの前記仮想ボリュームへの割り当て、及び、当該記憶デバイスの電源のオン又はオフを制御するための制御テーブルを備え、前記コントローラは当該制御テーブルに基づいて前記記憶デバイスの電源制御を実行する、請求項2記載のストレージシステム。
【請求項5】
前記制御テーブルは、前記仮想ボリュームに割り当て前に電源がオンされる前記記憶デバイスの割合に関する情報を備え、前記コントローラはこの情報に基づいて前記記憶デバイスの電源をオンする、請求項4記載のストレージシステム。
【請求項6】
前記コントローラは、前記上位装置から前記記憶デバイスに書き込み要求があったデータ総量と、電源オンであるが、前記仮想ボリュームへの割当がされていない記憶デバイスの記憶容量とを比較して、後者の容量が前者の容量以下の場合は、前記プールに属する他の記憶デバイスの電源をオンして、当該記憶デバイスを前記仮想ボリュームに割り当てる請求項2記載のストレージシステム。
【請求項7】
前記プールには種類が異なる複数の記憶デバイスが割り当てられ、前記コントローラは、性能が高い記憶デバイスを優先的して、その電源をオンする請求項2記載のストレージシステム。
【請求項8】
前記プールには過去の使用頻度が異なる複数の記憶デバイスが割り当てられ、前記コントローラは、使用頻度が低い記憶デバイスを優先して、その電源をオンする請求項2記載のストレージシステム。
【請求項9】
前記コントローラは、前記上位装置からの書き込みデータを一時記憶領域に保存し、この一時記憶領域に保存された書き込みデータを、前記電源がオンされた記憶デバイスに格納する、請求項2記載のストレージシステム。
【請求項10】
前記コントローラは、前記仮想ボリュームに割り当てられ、前記上位装置からの書き込みデータが格納された記憶デバイスの当該データを正規化ボリュームに移動した後、当該記憶デバイスを前記仮想ボリュームへの割当から解放するとともに、当該記憶デバイスの電源をオンからオフにする、ストレージシステム。
【請求項11】
複数の記憶デバイスと、通信経路を介して接続される上位装置からの要求に応じて、前記記憶デバイスにデータを入出力する制御を行うコントローラと、を備えるストレージシステムにおいて、
前記上位装置がアクセスする仮想ボリュームと、
前記仮想ボリュームに割り当てられた、前記領域記憶デバイスによって提供される複数の記憶領域を含むプールと、
を備え、
前記コントローラは、前記仮想ボリュームに対する前記ホストからのアクセスに応じて、前記プール内の記憶領域を当該仮想ボリュームに割り当てる際に、この記憶領域に対応する前記記憶デバイスの電源をオフからオンにする、ストレージシステム。
【請求項12】
複数の記憶デバイスと、コントローラとを有するストレージシステムにおいて、前記コントローラが通信経路を介して接続される上位装置からの要求に応じて、前記記憶デバイスに対するデータの入出力する制御を行う、ストレージシステムの制御方法であって、
前記ストレージシステムは、
上位装置がアクセスする仮想ボリュームと、
前記仮想ボリュームに割り当てられた、前記複数の記憶デバイスからなるプールと、
を備え、
前記コントローラは、前記仮想ボリュームに対する前記ホストからのアクセスに応じて、前記プール内の記憶デバイスを当該仮想ボリュームに割り当てるとともに、前記仮想ボリュームに割り当てられていない、前記プール内前記記憶デバイスを準備状態にし、前記仮想ボリュームに割り当てられている前記記憶デバイスを動作状態にする、ストレージシステムの制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2007−293442(P2007−293442A)
【公開日】平成19年11月8日(2007.11.8)
【国際特許分類】
【出願番号】特願2006−118255(P2006−118255)
【出願日】平成18年4月21日(2006.4.21)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】