HDD大容量化による「RAIDの限界」を解決するイレージャーコーディング:なぜ、もう「RAIDではダメ」なのか
HDDの大容量化に伴い、RAIDの限界が問題化してきた。RAIDの欠点とは何か。そしてRAIDに代わる技術「イレージャーコーディング」とは何か。そのメリットを詳しく解説する。
RAID(Redundant Array of Inexpensive Disks)は1980年代後半に発明されて以来、共有ストレージアレイや大規模組織におけるサーバのデータ保護の王道とされてきた。
Computer Weekly日本語版 6月17日号無料ダウンロード
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 6月17日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
ただし、HDDのキャパシティーが数Tバイト規模にまで拡大すると、RAIDによる保護システムはオーバーヘッドが大きくなりすぎ、限界が見えてきた。例えば一部の環境では、RAIDの再構築に時間がかかりすぎるようになったために、データ保護の手段としてRAIDを採用するのは現実的ではなくなったケースが見受けられる。
そこでサプライヤーが最近注目しているのが、イレージャーコーディングだ。大規模システムにこれを展開することで、RAIDで発生していた不具合と理想とのギャップを埋めることができると期待されている。
なぜRAID?
メインフレームの時代、運用していたHDD(特に米IBM製)には、ハードウェアやOSレベルのデータ保護機構は何も組み込まれていなかった。従って、障害が発生したドライブを復旧させる際は、トラックごとにファイルを1つずつ手作業で修復していた。こうした中で、特にミニコンや分散処理システムにおいて、データの復旧が困難または不可能なほどの障害がドライブに発生することへの対策として編み出されたテクノロジーがRAIDだった。
RAIDには、データ保護のためにデータの自己複製やパリティ情報を使ったデータ再構築など、多様な技術が採用された。
基礎レベルのRAID 1は、単純にドライブを2つ使い、一方のデータを全てもう一方のドライブに複製する。このとき、使用する予定容量の2倍のキャパシティーを持つ装置を使い、別のドライブにデータを書き込むだけでなく、そのドライブ内にもデータのコピーを格納するのでオーバーヘッドは発生しない。
この技法は、キャパシティー効率からみると高価だった。そこで装置の容量を2倍にしなくても済むような、新たなデータ保護のアルゴリズムが開発された。大容量の装置を使うのではなく利用コストを「計算」し、データを格納している各ブロックに対して、いわゆるパリティデータを付けるようになった。
近年よく使われているのは、2台またはそれ以上のディスクとパリティディスクを使用するRAID 5(注)またはRAID 6の構成だ。RAID 6はパリティディスクを2台使う。
注:実際は、データとパリティは入出力(I/O)性能の向上を狙って、ディスク全体に分散して配置されている。
一般的なRAID 5の構成(またはグループ)は、データディスク3台とパリティディスク1台の組み合わせだ(「3+1」と表記される)。この構成の場合、33%のオーバーヘッドまたは75%の利用可能スペースを含むが、算出方法によってどちらかの表記となる。
どのドライブに障害が発生しても、欠損したデータは残りのデータとパリティ情報から計算で割り出す。 パリティデータは、データが初めてディスクに書き込まれた際に、全データを使用したバイナリのXOR演算で算出される。データの復旧は、単純にパリティデータと利用可能なデータを使ってXOR逆演算を実行し、失われた情報を復旧させる。
ただし残念なことに、RAIDには短所も少なくなかった。HDDのキャパシティーがここ数年で著しく増大したために、破損したディスクの復旧に要する時間もその分長くなり、データの再構築に数日あるいは数週間かかる例もみられるようになった。復旧までの時間を見積もる際は注意が必要だ。既存システムの中でホストI/Oが占めるワークロードの量によって、所要時間は変わるからだ。
またデータの再構築中は、同じグループの2台目のディスクには障害を防止するデータ保護が行われない。両方のディスクに障害が発生することを“ディスクの二重障害”といい、データの再建が完了する前にこの障害が発生すると、データは失われる。
こうした事態への対策として、サプライヤーはパリティディスクの台数を増やす方向で改良を進めた。それがRAID 6で、各グループにパリティディスクを2台ずつ配置する。ただしデータ保護のメカニズムによるオーバーヘッドも増大している。
オーバーヘッド問題に対する1つの回答として、サプライヤーはRAIDグループ内に配備できるディスクの数を増やした。論理上は、RAIDグループ内に配備できるデータディスクおよびパリティディスクともに、台数の制限はない。そこで最大28+2、つまりデータディスク28台にパリティディスク2台の構成が可能なアレイを展開するサプライヤーも現れた。しかも発売価格は、従来モデルにわずか7%上乗せしただけだ。
ただし、ディスクのキャパシティーを増やしたことによって、RAIDに新たな問題が浮上した。
続きはComputer Weekly日本語版 6月17日号にて
本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。
■Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 6月3日号:Windows XPサポート終了後のPCに市場
Computer Weekly日本語版 5月20日号:Windowsから脱却するときが来た?
Computer Weekly日本語版 5月7日号:Nano Server投入に見るMSの思惑
Copyright © ITmedia, Inc. All Rights Reserved.