2017年04月27日 08時00分 UPDATE
特集/連載

フラッシュでも「RAIDの限界」が見えてきたRAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは?

大容量HDDの出現により、「RAIDの限界」が取り沙汰され、イレージャーコーディングという代替策が登場した。フラッシュ時代にもこれは有効なのだろうか。

[Chris Evans,Computer Weekly]
Computer Weekly

 どんなに信頼性が高くても、フラッシュ媒体が劣化するのは事実だ。そしてドライブ(コントローラーにせよNANDにせよ)は、障害が発生する恐れがある。こうしたドライブは初めから寿命が決まっているからだ。NANDの場合、特定セルの耐久レベルが限界に達すると、媒体に障害が発生するか、正しくない結果を返すようになるリスクがある。

Computer Weekly日本語版 4月19日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 4月19日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 そのため、安価なディスクを使ったRAIDやイレージャーコーディングといったリカバリー技法を使用して、メディア障害時のデータ保護策を講じる必要が生じる。

 RAIDは、データの冗長性を使用して装置の障害からデータを保護する。

 RAIDの標準的な構成としては、RAID 5とRAID 6がある。後者は、再構築時間が重要となる大容量の装置で高いレジリエンス(耐障害性)を提供するために使用する。RAID 5とRAID 6は、データとパリティ(リカバリー用の情報)を媒体全体に分散して配置する。

 データ保護にRAIDを使用する際に大きな問題となるのは、拡張性だ。大規模なRAIDグループを構成している場合、パリティスペースのオーバーヘッドが減る一方で、障害による再構築の回数は増える。

 HDDの容量とRAIDグループが増加すると、リカバリー時間が著しく長引くことが分かっている。その結果、リカバリーが終了するまでの間に、同一RAIDグループの別の装置で障害が連続して発生した場合、データは無防備になる。そこで、RAID 6を保護スキームとして使用する。

 RAIDの再構築はまた、パフォーマンスにも影響を与える。RAIDグループ内の全てのデバイスが、失われたデータの再構成作業に関与するため、入出力(I/O)パフォーマンスが低下したり、データの再構築に要する時間が長引いたりする恐れがある。

イレージャーコーディング

 イレージャーコーディングは数学的関数を使用する技法で、一連のデータをあらかじめ冗長性を含む形式に変換する。こうすることで、冗長部分のサブセットから元のデータを再構築することができる。

 通常、この技法は2つの数値で表現される。1つは元のデータを細分化した断片の数、もう1つは冗長性の情報を含むために作成した断片の数だ。例えばイレージャーコーディングのスキームで、元のデータの断片が10個あり、これを16個の断片に変換すると、その16個の断片のうち10個を使えば元のデータを復元できる。

 このスキームは一見、有用ではなさそうだが、地理的に分散した複数のデータセンターにまたがって配置されているデータを復元する場合、イレージャーコーディングは明らかに効果を発揮する。

 例えば、データを16個の断片に分割し、その断片が4つずつ、4カ所のデータセンターに分かれて配置されているとする。イレージャーコーディングでは、元のデータの完全なレプリカを作成する必要はないので、たとえどこか1カ所のデータセンターが失われたとしても、その状態から元データを復元することができる。さらに、データが更新されるたびに10個の断片からデータを読み取るので、データを読み取る目的で従来のレプリケーション操作を実行する必要もない。

RAID vs. イレージャーコーディング

 RAIDとイレージャーコーディングには、それぞれ長所と短所があるため、最適な選択はワークロードの種類によって変わる。

 RAIDは通常、単一のストレージアレイまたはサーバで障害が発生した媒体を回復する方法として展開されているが、ネットワークRAIDの実装も存在する。

 先述の通り、RAIDは拡張性に懸案事項がある。特にRAID 5には、回復不能な読み取りエラーに対する脆弱(ぜいじゃく)性がある。このシナリオでは、データの再構築が実行され、そこで使用した残りのデータまたはパリティのコンポーネントでドライブ読み取りエラーが発生すると、失ったデータを復元することはできなくなる。RAID 6では、パリティに割り当てられる装置を増やしてパフォーマンスを少し犠牲にすることで、この問題の影響を軽減している。

 一方イレージャーコーディングでは、複数のデータセンターに分散しているデータの保護を効率良く実現できる。

 ただし、イレージャーコーディングはアプリケーションの読み取りと書き込みの両方で、パフォーマンスに影響する。これには次の2つの理由がある。1つは、(イレージャーコーディングに)単純な保護スキーム以外の役割もあるため、数学的処理が演算として複雑であること。もう1つは、WAN全体に分散している複数のシステムからデータを読み取る必要が生じる場合があることだ。

 従ってイレージャーコーディングは、費用効率の面で優れたレジリエンスを実現する技法だといえる。この技法が適用されている例は、今のところオブジェクトストレージなどのシステムだけに限定されている。

データ保護とフラッシュ

 フラッシュと媒体保護の仕組みを同時に使用する場合は、特別な配慮が必要になる。

続きはComputer Weekly日本語版 4月19日号にて

本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。


Computer Weekly日本語版 最近のバックナンバー

Computer Weekly日本語版 4月5日号 ファイアウォール 管理の悩み

Computer Weekly日本語版 3月22日号 ムーアの法則との決別

Computer Weekly日本語版 3月8日号 PC&Windows時代の終わり


この記事が気に入ったらTechTargetジャパンに「いいね!」しよう

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news105.jpg

ソニーマーケティング、顧客満足度の向上につなげるカスタマーサービスのノウハウを外販
ソニーマーケティングは、企業と顧客との円滑なコミュニケーションをサポートし、顧客満...

news122.jpg

BIからAI(拡張知能)への進化、QlikのCTOが語る
さまざまな洞察を得るため、最適化されたビジュアルを提供するツールへ進化するセルフサ...

news024.jpg

Adobe Systems、テレビ広告運用プラットフォーム「Adobe Advertising Cloud TV」を発表
Adobe Systemsは、データに基づき自動的にテレビ広告のプランニングとバイイングができる...