RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは?:フラッシュでも「RAIDの限界」が見えてきた
大容量HDDの出現により、「RAIDの限界」が取り沙汰され、イレージャーコーディングという代替策が登場した。フラッシュ時代にもこれは有効なのだろうか。
どんなに信頼性が高くても、フラッシュ媒体が劣化するのは事実だ。そしてドライブ(コントローラーにせよNANDにせよ)は、障害が発生する恐れがある。こうしたドライブは初めから寿命が決まっているからだ。NANDの場合、特定セルの耐久レベルが限界に達すると、媒体に障害が発生するか、正しくない結果を返すようになるリスクがある。
そのため、安価なディスクを使ったRAIDやイレージャーコーディングといったリカバリー技法を使用して、メディア障害時のデータ保護策を講じる必要が生じる。
RAIDの標準的な構成としては、RAID 5とRAID 6がある。後者は、再構築時間が重要となる大容量の装置で高いレジリエンス(耐障害性)を提供するために使用する。RAID 5とRAID 6は、データとパリティ(リカバリー用の情報)を媒体全体に分散して配置する。
データ保護にRAIDを使用する際に大きな問題となるのは、拡張性だ。大規模なRAIDグループを構成している場合、パリティスペースのオーバーヘッドが減る一方で、障害による再構築の回数は増える。
HDDの容量とRAIDグループが増加すると、リカバリー時間が著しく長引くことが分かっている。その結果、リカバリーが終了するまでの間に、同一RAIDグループの別の装置で障害が連続して発生した場合、データは無防備になる。そこで、RAID 6を保護スキームとして使用する。
RAIDの再構築はまた、パフォーマンスにも影響を与える。RAIDグループ内の全てのデバイスが、失われたデータの再構成作業に関与するため、入出力(I/O)パフォーマンスが低下したり、データの再構築に要する時間が長引いたりする恐れがある。
イレージャーコーディング
イレージャーコーディングは数学的関数を使用する技法で、一連のデータをあらかじめ冗長性を含む形式に変換する。こうすることで、冗長部分のサブセットから元のデータを再構築することができる。
RAIDとイレージャーコーディングには、それぞれ長所と短所があるため、最適な選択はワークロードの種類によって変わる。
RAIDは通常、単一のストレージアレイまたはサーバで障害が発生した媒体を回復する方法として展開されているが、ネットワークRAIDの実装も存在する。
先述の通り、RAIDは拡張性に懸案事項がある。特にRAID 5には、回復不能な読み取りエラーに対する脆弱(ぜいじゃく)性がある。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
関連記事
RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは?
大容量データ保護の福音イレージャーコーディングで「RAIDは不要になる」
HDD大容量化による「RAIDの限界」を解決するイレージャーコーディング
フラッシュストレージ時代のRAID――基礎から各社の独自技術まで
失敗から成功まで、HDFSでRAIDを利用するFacebookの挑戦
Copyright © ITmedia, Inc. All Rights Reserved.