RAIDの課題とイレージャーコーディングの登場：イレージャーコーディングの正しい使い方【前編】

HDDの大容量化によって欠点が露呈したRAIDに代わって注目されたのがイレージャーコーディングだ。多くの面でメリットがある技術だが欠点もある。イレージャーコーディングはどう使うのが正解なのか。

[Stephen Pritchard，Computer Weekly] PC用表示関連情報

LINE

Hatena

　RAIDはデータ保護の基本だ。だが、RAIDが生まれたのはSANやNASといったハードウェアアレイ製品の時代だ。現在はクラウドやオブジェクトストレージなどの技術が優勢の時代であり、主な保護手段はRAIDではなくイレージャーコーディングに移ってきた。

　イレージャーコーディングでは、RAIDに伴う再構築時間の短縮が見込まれる。では、イレージャーコーディングがRAIDに取って代わる可能性はあるのだろうか。本稿ではイレージャーコーディングの長所と短所を確認する。

RAIDの概要

　RAIDは複数のドライブを仮想化し、1つの論理ドライブを形成する。1つ以上のドライブに障害が発生した場合は、そのドライブを交換してアレイを再構築することでデータを回復できる。これにより、堅牢（けんろう）なデータ保護が比較的低コストで実現する。

　だが、データ量の増加とクラウドやオブジェクトストレージなどの進化が従来のRAID技術にプレッシャーを与えている。

　大きなRAIDボリュームの回復は時間がかかり過ぎ、実用的ではない可能性がある。業界の専門家によると、8TBを超えるボリュームの再構築は受け入れられないほど遅くなるという。

　従来のRAIDバックアップでは、ハイパースケールやハイパーコンバージドの分散型ストレージを完全には処理できない。分散ストレージを利用するのは、物理的に分かれた場所にある複数のアレイにまたがってデータを保持するクラウドプロバイダーなどのオブジェクトストレージサプライヤーだ。さらにRAIDコントローラーが複雑さを増加させる。

イレージャーコーディング入門

　巨大なデータセットやオブジェクトストレージ、ソフトウェア定義ストレージなどの応用事例での答えとなるのがイレージャーコーディングだ。

　イレージャーコーディングはパリティーに基づく。つまりデータをフラグメントに分割してエンコードする。そのため保存場所を問わない。この特徴はクラウドストレージに適している。使用するストレージ容量もRAIDよりも少なく、ストレージシステムの2カ所以上に障害が生じてもデータを回復できる。

　イレージャーコーディングは前方誤り訂正を使う。この技術はGSMなどの無線伝送にも使われている。イレージャーコーディングは、MP3ファイルや音楽CDの作成に使われている非可逆圧縮形式であるという見方もある。これは、データの一部を16個のパーツに分割した場合、10個のパーツだけで元のデータを復元できるというものだ。

　これにより、イレージャーコーディングはRAIDよりも経済的になる。Freeform Dynamicsでアナリストを務めるブライアン・ベッツ氏の指摘によると、最もシンプルな形式のイレージャーコーディングは、各データに「ハーフコード」を使用するという。従って、ストレージの追加要件は50％になる。

　データの各部はどこにあっても構わないため、システムの堅牢性が大きく向上する可能性がある。イレージャーコーディングによって保護されるストレージボリュームは、RAIDによって保護されるストレージボリュームよりもハードウェア障害のリスクが大幅に少なくなる。

　ストレージシステムのセットアップ方法によっては、復旧時間も短縮される。イレージャーコーディングを使うシステムは、実際には再構築の必要がない。データを再構築するのに十分な数のシンボルがあれば、障害が起きてもユーザーは気付かない可能性がある。新しいドライブへのパリティーの再構築をバックグラウンドで行うことも可能だ。

後編（Computer Weekly日本語版　12月2日号掲載予定）では、イレージャーコーディングでは対処不可能なケースと効果的な用途を解説する。

RAIDの課題とイレージャーコーディングの登場：イレージャーコーディングの正しい使い方【前編】

関連記事

RAIDの概要

イレージャーコーディング入門

関連記事