RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは？：フラッシュでも「RAIDの限界」が見えてきた

大容量HDDの出現により、「RAIDの限界」が取り沙汰され、イレージャーコーディングという代替策が登場した。フラッシュ時代にもこれは有効なのだろうか。

≫ 2017年04月27日 08時00分公開

[Chris Evans，Computer Weekly]

　どんなに信頼性が高くても、フラッシュ媒体が劣化するのは事実だ。そしてドライブ（コントローラーにせよNANDにせよ）は、障害が発生する恐れがある。こうしたドライブは初めから寿命が決まっているからだ。NANDの場合、特定セルの耐久レベルが限界に達すると、媒体に障害が発生するか、正しくない結果を返すようになるリスクがある。

　そのため、安価なディスクを使ったRAIDやイレージャーコーディングといったリカバリー技法を使用して、メディア障害時のデータ保護策を講じる必要が生じる。

　RAIDの標準的な構成としては、RAID 5とRAID 6がある。後者は、再構築時間が重要となる大容量の装置で高いレジリエンス（耐障害性）を提供するために使用する。RAID 5とRAID 6は、データとパリティ（リカバリー用の情報）を媒体全体に分散して配置する。

　データ保護にRAIDを使用する際に大きな問題となるのは、拡張性だ。大規模なRAIDグループを構成している場合、パリティスペースのオーバーヘッドが減る一方で、障害による再構築の回数は増える。

　HDDの容量とRAIDグループが増加すると、リカバリー時間が著しく長引くことが分かっている。その結果、リカバリーが終了するまでの間に、同一RAIDグループの別の装置で障害が連続して発生した場合、データは無防備になる。そこで、RAID 6を保護スキームとして使用する。

　RAIDの再構築はまた、パフォーマンスにも影響を与える。RAIDグループ内の全てのデバイスが、失われたデータの再構成作業に関与するため、入出力（I/O）パフォーマンスが低下したり、データの再構築に要する時間が長引いたりする恐れがある。

イレージャーコーディング

　イレージャーコーディングは数学的関数を使用する技法で、一連のデータをあらかじめ冗長性を含む形式に変換する。こうすることで、冗長部分のサブセットから元のデータを再構築することができる。

　RAIDとイレージャーコーディングには、それぞれ長所と短所があるため、最適な選択はワークロードの種類によって変わる。

　RAIDは通常、単一のストレージアレイまたはサーバで障害が発生した媒体を回復する方法として展開されているが、ネットワークRAIDの実装も存在する。

　先述の通り、RAIDは拡張性に懸案事項がある。特にRAID 5には、回復不能な読み取りエラーに対する脆弱（ぜいじゃく）性がある。

続きを読むには、［続きを読む］ボタンを押して
会員登録あるいはログインしてください。

RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは？

大容量データ保護の福音イレージャーコーディングで「RAIDは不要になる」

HDD大容量化による「RAIDの限界」を解決するイレージャーコーディング

フラッシュストレージ時代のRAID――基礎から各社の独自技術まで

失敗から成功まで、HDFSでRAIDを利用するFacebookの挑戦

TechTargetジャパントップサーバ＆ストレージ