SSDでRAIDを組む意味はあるのか？：HDDと同じ設計では不可

RAIDは重要な技術であり続けた。だが、SSDでもRAIDは有効なのか。使うべきなのか。結論としては有効だが、HDDと同じ設計で使ってはならない。

≫ 2021年02月26日 08時00分公開

[Stephen Pritchard，Computer Weekly]

　米カリフォルニア大学バークリー校の研究者は、PC用の低コストなHDDで重要なデータを保護する方法を考案した。複数のドライブを組み合わせてHDDの速度と信頼性の制限を克服し、メインフレームの非常に高価なドライブのパフォーマンスに近づけた。

　それから30年、サーバ、バックアップ、アーカイブ、さらにはクラウドコンピューティングのほぼ全てにRAIDベースのストレージが提供されている。だが、フラッシュのコストが下がり容量が増えている今でもRAIDは必要なのだろうか。

　SSDに合わせてより複雑なRAIDレベルを開発しているサプライヤーが増える一方、クラウドプロバイダーやハイブリッドおよびオブジェクトストレージではイレージャーコーディングなどの代替方法が定着している。

RAIDのレベル

　RAIDでデータを保護する方法は主に2つある。一つは物理ドライブ全体をミラーリングする方法。もう一つは複数のドライブにパリティーデータを格納して、これを使って障害が起きたドライブを再構築する方法だ。RAIDを構築する際は、ミラーデータやパリティーデータのパフォーマンス、回復力、容量のオーバーヘッドのバランスを取る必要がある。

　最もシンプルなのがRAID 1（ミラーリング）で、全てのデータを2つか3つのドライブに同時にコピーする。容量のオーバーヘッド、つまりミラーに必要なストレージの容量は、使用可能なストレージの100％増または200％増になる。

　パフォーマンスが最も高いのはRAID 1だ。重要なのは、パリティーによるデータの再作成を不要にして再構築時間を最短にしていることだ。RAIDの他のレベルは、パフォーマンスを大きく損なわずに容量のオーバーヘッドを減らすことでコストを削減する狙いがある。

　RAID 4はブロックレベルのストライピングを使用し、1つのパリティー専用ドライブにパリティーデータを格納する。RAID 5はストライピングと分散パリティーによってパリティー専用ドライブを不要にした。RAID 6はデュアル分散パリティーを使ってデータの保護を強化する。RAID 10はミラーリングとストライピングを組み合わせる。

　RAID 2と3は、現在の企業システムではほとんど使われていない。多くのサプライヤーはRAID 5やRAID 6よりも容量のオーバーヘッドをさらに減らすことを目標にして独自のRAIDを用意するようになっている。

フラッシュストレージにもRAIDは有効か

　パフォーマンスの点だけで見ると、フラッシュストレージではRAIDは選択肢にならない。一般的なほとんどのシナリオでフラッシュストレージのパフォーマンスはRAIDをはるかに上回る。

　だが、フラッシュはHDDよりもはるかに高額だ。フラッシュは1ドライブ当たりの容量が少なく、より大きなアレイが必要になる。

　これがフラッシュベースのRAID 1やRAID 10の利用を妨げることにはならないが、その利用はデータの損失がほぼ許容されず、復元時間を短くする必要のある用途に限定されるだろう。

　IDCのエリック・バーゲナー氏（エンタープライズインフラプラクティス部門リサーチ担当バイスプレジデント）は次のように話す。「RAID 1が最高のパフォーマンスを発揮するのはローカルで使い、2つのドライブのみに書き込む場合あるいは3つのミラーを運用していて3つのドライブに書き込む場合だ。これにより、復元モードでの影響が最小限に抑えられる。1つの機器から読み取るだけで復元でき、データを『再構築』する演算処理は必要ない。だが、最も高額になる」

RAID 5と6：フラッシュの実用的なオプション

　HDDが現在よりも高額で容量も少なかった時代、ストレージサプライヤーが努力を積み重ねてRAIDが成熟した。こうした取り組みはフラッシュストレージにもしっかりと生きてくる。

　「冗長性を得るためのコストの高さがRAID 4、5、6やイレージャーコーディングを考案する一因となった。これにより容量のオーバーヘッドが大幅に低くなる。だが復元モードでは複数のドライブからデータを読み取らなければならない。そのデータに対して1つ以上のパリティーストライプを使って演算処理する必要がある」（バーゲナー氏）

　フラッシュストレージのパフォーマンスの高さが、復元時のこうした問題点を克服する。問題が残るのは、高額なフラッシュストレージの中でパリティーデータが占める割合が大きいことだ。RAID 6の標準レイアウト（データ4bit、パリティー2bit）では、ストレージの3分の1がオーバーヘッドになる。

　メインストリームのシステムで容量のニーズが比較的低い（20TB程度）場合は、恐らくRAID 6で十分だ。大半のITアーキテクトは、RAID 6の回復力の高さはRAID 5よりも高コストで容量が犠牲になるという欠点に見合う価値があると考える。遅延が許されない用途や高可用性が求められる場合はRAID 10も選択肢になる。

オールフラッシュアレイとクラウド向けのデータ保護

　サプライヤーはフラッシュストレージに適した、容量のオーバーヘッドを抑えた新しいデータ保護方式を開発している。新方式のシステムは、パリティーデータを多くのボリュームに分散する。

　これまでRAID 6を提供してきたオールフラッシュアレイベンダーの多くが、新しい技術を用いてこうした課題に取り組んでいる。

　Silk（旧称Kaminario）はオールフラッシュアレイに22＋2フォーマットを採用する。これによりオーバーヘッドは削減されるが、アレイを24個以上のドライブで構成する必要がある。

　VAST Dataは「Intel Optane SSD」とQLC（クアッドレベルセル）のSSDを組み合わせて、150＋4という非常に経済的な設計を採用する。これは2％程度のオーバーヘッドで動作する。だが最小システム容量は1PBだ。

イレージャーコーディング

　イレージャーコーディングは、大規模クラウドプラットフォームが後押ししてきた。だが、ハイブリッドやオンプレミスのオブジェクトストレージでも一般的になりつつある。イレージャーコーディングは必要な保護レベルと物理的な冗長性を細かく制御できるため、さらに一般的になる可能性がある。

　イレージャーコーディングの問題点はパフォーマンスだ。だがオールフラッシュストレージがそのギャップを狭める。

データの減衰：アーキテクチャの違い

　フラッシュシステムには技術上の重要な特性があり、それがRAID方式の設計に影響する。

　フラッシュストレージは使うほど劣化する。QLCなど、新しくて安価なフラッシュは前世代のフラッシュよりも寿命が短い。そのため書き込み回数を減らし、システムの寿命を延ばす手法を生み出さなければならない。

　こうした問題はHDDでは起こらない。そのため、従来のワークロードをフラッシュアレイに「リフト＆シフト」して、同じレベルの保護を提供できると考えてはいけない。

　「フラッシュベースのデータ保護アルゴリズムを設計するに当たっては、新たな条件が幾つかある。遅延時間が大幅に短くなりスループットは高くなるが、耐久性ははるかに低下する。従って書き込み回数を最小限に抑える手法への関心が高くなる」（バーゲナー氏）

TechTargetジャパントップサーバ＆ストレージ