HDDの大容量化に伴い、RAIDの限界が問題化してきた。RAIDの欠点とは何か。そしてRAIDに代わる技術「イレージャーコーディング」とは何か。そのメリットを詳しく解説する。
RAID(Redundant Array of Inexpensive Disks)は1980年代後半に発明されて以来、共有ストレージアレイや大規模組織におけるサーバのデータ保護の王道とされてきた。
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 6月17日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
ただし、HDDのキャパシティーが数Tバイト規模にまで拡大すると、RAIDによる保護システムはオーバーヘッドが大きくなりすぎ、限界が見えてきた。例えば一部の環境では、RAIDの再構築に時間がかかりすぎるようになったために、データ保護の手段としてRAIDを採用するのは現実的ではなくなったケースが見受けられる。
そこでサプライヤーが最近注目しているのが、イレージャーコーディングだ。大規模システムにこれを展開することで、RAIDで発生していた不具合と理想とのギャップを埋めることができると期待されている。
メインフレームの時代、運用していたHDD(特に米IBM製)には、ハードウェアやOSレベルのデータ保護機構は何も組み込まれていなかった。従って、障害が発生したドライブを復旧させる際は、トラックごとにファイルを1つずつ手作業で修復していた。こうした中で、特にミニコンや分散処理システムにおいて、データの復旧が困難または不可能なほどの障害がドライブに発生することへの対策として編み出されたテクノロジーがRAIDだった。
RAIDには、データ保護のためにデータの自己複製やパリティ情報を使ったデータ再構築など、多様な技術が採用された。
基礎レベルのRAID 1は、単純にドライブを2つ使い、一方のデータを全てもう一方のドライブに複製する。このとき、使用する予定容量の2倍のキャパシティーを持つ装置を使い、別のドライブにデータを書き込むだけでなく、そのドライブ内にもデータのコピーを格納するのでオーバーヘッドは発生しない。
この技法は、キャパシティー効率からみると高価だった。そこで装置の容量を2倍にしなくても済むような、新たなデータ保護のアルゴリズムが開発された。大容量の装置を使うのではなく利用コストを「計算」し、データを格納している各ブロックに対して、いわゆるパリティデータを付けるようになった。
近年よく使われているのは、2台またはそれ以上のディスクとパリティディスクを使用するRAID 5(注)またはRAID 6の構成だ。RAID 6はパリティディスクを2台使う。
注:実際は、データとパリティは入出力(I/O)性能の向上を狙って、ディスク全体に分散して配置されている。
一般的なRAID 5の構成(またはグループ)は、データディスク3台とパリティディスク1台の組み合わせだ(「3+1」と表記される)。この構成の場合、33%のオーバーヘッドまたは75%の利用可能スペースを含むが、算出方法によってどちらかの表記となる。
どのドライブに障害が発生しても、欠損したデータは残りのデータとパリティ情報から計算で割り出す。 パリティデータは、データが初めてディスクに書き込まれた際に、全データを使用したバイナリのXOR演算で算出される。データの復旧は、単純にパリティデータと利用可能なデータを使ってXOR逆演算を実行し、失われた情報を復旧させる。
ただし残念なことに、RAIDには短所も少なくなかった。HDDのキャパシティーがここ数年で著しく増大したために、破損したディスクの復旧に要する時間もその分長くなり、データの再構築に数日あるいは数週間かかる例もみられるようになった。復旧までの時間を見積もる際は注意が必要だ。既存システムの中でホストI/Oが占めるワークロードの量によって、所要時間は変わるからだ。
またデータの再構築中は、同じグループの2台目のディスクには障害を防止するデータ保護が行われない。両方のディスクに障害が発生することを“ディスクの二重障害”といい、データの再建が完了する前にこの障害が発生すると、データは失われる。
こうした事態への対策として、サプライヤーはパリティディスクの台数を増やす方向で改良を進めた。それがRAID 6で、各グループにパリティディスクを2台ずつ配置する。ただしデータ保護のメカニズムによるオーバーヘッドも増大している。
オーバーヘッド問題に対する1つの回答として、サプライヤーはRAIDグループ内に配備できるディスクの数を増やした。論理上は、RAIDグループ内に配備できるデータディスクおよびパリティディスクともに、台数の制限はない。そこで最大28+2、つまりデータディスク28台にパリティディスク2台の構成が可能なアレイを展開するサプライヤーも現れた。しかも発売価格は、従来モデルにわずか7%上乗せしただけだ。
ただし、ディスクのキャパシティーを増やしたことによって、RAIDに新たな問題が浮上した。
本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。
■Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 6月3日号:Windows XPサポート終了後のPCに市場
Computer Weekly日本語版 5月20日号:Windowsから脱却するときが来た?
Computer Weekly日本語版 5月7日号:Nano Server投入に見るMSの思惑
Copyright © ITmedia, Inc. All Rights Reserved.
カラオケ業界が直面するデータ増に対応すべく多くのストレージを試し続けた結果、4社27台の製品のメンテナンスに悩まされていたエクシング。この問題を解消すべく、同社は大容量かつコスト削減効果に優れた、新たなストレージを導入した。
メインフレームにおけるデータソート処理は、システム効率に大きく影響する。そこで、z/OSシステムおよびIBM Zメインフレーム上で稼働する、高パフォーマンスのソート/コピー/結合ソリューションを紹介する。
ECと通販システムを統合したパッケージの開発と導入を事業の柱とするエルテックスでは、事業の成長に伴いデータの容量を拡大する必要に迫られていた。そこでストレージを刷新してコスト削減や可用性の向上などさまざまな成果を得たという。
CPUやGPUの性能向上に伴い、データセンターでは今、発熱量の増加にどう対応するかが課題となっている。特に高密度なサーバ環境では、従来のファンやヒートシンクに頼るだけでは熱管理が難しい。こうした中、企業が採用すべき手段とは?
中堅・中小企業の中には、IT担当者が社内に1~3人しかいないという企業も少なくない。そのような状況でも幅広い業務に対応しなければならないIT担当者の負担を減らす上では、ファイルサーバをアウトソーシングすることも有効だ。
クラウド全盛期になぜ「テープ」が再注目? データ管理の最前線を探る (2025/4/24)
データの多様化と肥大化が加速 ファイルサーバ運用は限界? 見直しのポイント (2025/4/8)
Hyper-Vは「次の仮想化基盤」になり得るのか 有識者の本音を聞く (2025/3/14)
「生成AI」の自社運用に“ちょうどよいサーバ”の賢い選び方 (2025/3/12)
クラウドストレージは便利だけど検索性が課題? 東急建設の解決策は (2025/2/25)
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...