RAIDの課題とイレージャーコーディングの登場:イレージャーコーディングの正しい使い方【前編】
HDDの大容量化によって欠点が露呈したRAIDに代わって注目されたのがイレージャーコーディングだ。多くの面でメリットがある技術だが欠点もある。イレージャーコーディングはどう使うのが正解なのか。
RAIDはデータ保護の基本だ。だが、RAIDが生まれたのはSANやNASといったハードウェアアレイ製品の時代だ。現在はクラウドやオブジェクトストレージなどの技術が優勢の時代であり、主な保護手段はRAIDではなくイレージャーコーディングに移ってきた。
イレージャーコーディングでは、RAIDに伴う再構築時間の短縮が見込まれる。では、イレージャーコーディングがRAIDに取って代わる可能性はあるのだろうか。本稿ではイレージャーコーディングの長所と短所を確認する。
関連記事
- RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは?
- 大容量データ保護の福音イレージャーコーディングで「RAIDは不要になる」
- HDD大容量化による「RAIDの限界」を解決するイレージャーコーディング
- フラッシュストレージ時代のRAID――基礎から各社の独自技術まで
- 失敗から成功まで、HDFSでRAIDを利用するFacebookの挑戦
RAIDの概要
RAIDは複数のドライブを仮想化し、1つの論理ドライブを形成する。1つ以上のドライブに障害が発生した場合は、そのドライブを交換してアレイを再構築することでデータを回復できる。これにより、堅牢(けんろう)なデータ保護が比較的低コストで実現する。
だが、データ量の増加とクラウドやオブジェクトストレージなどの進化が従来のRAID技術にプレッシャーを与えている。
大きなRAIDボリュームの回復は時間がかかり過ぎ、実用的ではない可能性がある。業界の専門家によると、8TBを超えるボリュームの再構築は受け入れられないほど遅くなるという。
従来のRAIDバックアップでは、ハイパースケールやハイパーコンバージドの分散型ストレージを完全には処理できない。分散ストレージを利用するのは、物理的に分かれた場所にある複数のアレイにまたがってデータを保持するクラウドプロバイダーなどのオブジェクトストレージサプライヤーだ。さらにRAIDコントローラーが複雑さを増加させる。
イレージャーコーディング入門
巨大なデータセットやオブジェクトストレージ、ソフトウェア定義ストレージなどの応用事例での答えとなるのがイレージャーコーディングだ。
イレージャーコーディングはパリティーに基づく。つまりデータをフラグメントに分割してエンコードする。そのため保存場所を問わない。この特徴はクラウドストレージに適している。使用するストレージ容量もRAIDよりも少なく、ストレージシステムの2カ所以上に障害が生じてもデータを回復できる。
イレージャーコーディングは前方誤り訂正を使う。この技術はGSMなどの無線伝送にも使われている。イレージャーコーディングは、MP3ファイルや音楽CDの作成に使われている非可逆圧縮形式であるという見方もある。これは、データの一部を16個のパーツに分割した場合、10個のパーツだけで元のデータを復元できるというものだ。
これにより、イレージャーコーディングはRAIDよりも経済的になる。Freeform Dynamicsでアナリストを務めるブライアン・ベッツ氏の指摘によると、最もシンプルな形式のイレージャーコーディングは、各データに「ハーフコード」を使用するという。従って、ストレージの追加要件は50%になる。
データの各部はどこにあっても構わないため、システムの堅牢性が大きく向上する可能性がある。イレージャーコーディングによって保護されるストレージボリュームは、RAIDによって保護されるストレージボリュームよりもハードウェア障害のリスクが大幅に少なくなる。
ストレージシステムのセットアップ方法によっては、復旧時間も短縮される。イレージャーコーディングを使うシステムは、実際には再構築の必要がない。データを再構築するのに十分な数のシンボルがあれば、障害が起きてもユーザーは気付かない可能性がある。新しいドライブへのパリティーの再構築をバックグラウンドで行うことも可能だ。
後編(Computer Weekly日本語版 12月2日号掲載予定)では、イレージャーコーディングでは対処不可能なケースと効果的な用途を解説する。
Copyright © ITmedia, Inc. All Rights Reserved.