大容量HDDの出現により、「RAIDの限界」が取り沙汰され、イレージャーコーディングという代替策が登場した。フラッシュ時代にもこれは有効なのだろうか。
どんなに信頼性が高くても、フラッシュ媒体が劣化するのは事実だ。そしてドライブ(コントローラーにせよNANDにせよ)は、障害が発生する恐れがある。こうしたドライブは初めから寿命が決まっているからだ。NANDの場合、特定セルの耐久レベルが限界に達すると、媒体に障害が発生するか、正しくない結果を返すようになるリスクがある。
そのため、安価なディスクを使ったRAIDやイレージャーコーディングといったリカバリー技法を使用して、メディア障害時のデータ保護策を講じる必要が生じる。
RAIDの標準的な構成としては、RAID 5とRAID 6がある。後者は、再構築時間が重要となる大容量の装置で高いレジリエンス(耐障害性)を提供するために使用する。RAID 5とRAID 6は、データとパリティ(リカバリー用の情報)を媒体全体に分散して配置する。
データ保護にRAIDを使用する際に大きな問題となるのは、拡張性だ。大規模なRAIDグループを構成している場合、パリティスペースのオーバーヘッドが減る一方で、障害による再構築の回数は増える。
HDDの容量とRAIDグループが増加すると、リカバリー時間が著しく長引くことが分かっている。その結果、リカバリーが終了するまでの間に、同一RAIDグループの別の装置で障害が連続して発生した場合、データは無防備になる。そこで、RAID 6を保護スキームとして使用する。
RAIDの再構築はまた、パフォーマンスにも影響を与える。RAIDグループ内の全てのデバイスが、失われたデータの再構成作業に関与するため、入出力(I/O)パフォーマンスが低下したり、データの再構築に要する時間が長引いたりする恐れがある。
イレージャーコーディングは数学的関数を使用する技法で、一連のデータをあらかじめ冗長性を含む形式に変換する。こうすることで、冗長部分のサブセットから元のデータを再構築することができる。
RAIDとイレージャーコーディングには、それぞれ長所と短所があるため、最適な選択はワークロードの種類によって変わる。
RAIDは通常、単一のストレージアレイまたはサーバで障害が発生した媒体を回復する方法として展開されているが、ネットワークRAIDの実装も存在する。
先述の通り、RAIDは拡張性に懸案事項がある。特にRAID 5には、回復不能な読み取りエラーに対する脆弱(ぜいじゃく)性がある。
続きを読むには、[続きを読む]ボタンを押して
会員登録あるいはログインしてください。
RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは?
大容量データ保護の福音イレージャーコーディングで「RAIDは不要になる」
HDD大容量化による「RAIDの限界」を解決するイレージャーコーディング
フラッシュストレージ時代のRAID――基礎から各社の独自技術まで
失敗から成功まで、HDFSでRAIDを利用するFacebookの挑戦
Copyright © ITmedia, Inc. All Rights Reserved.
「TikTok禁止」は結局、誰得? どうするトランプ氏――2025年のSNS大予測(TikTok編)
米国での存続を巡る議論が続く一方で、アプリ内ショッピングやAI機能の拡大など、TikTok...
ネットの口コミを参考に8割超が商品を購入 最も参考にした口コミの掲載先は?
ホットリンクは、口コミ投稿の経験や購買への影響を調査した結果を発表した。
「生成AIの普及でSEOはオワコン」説は本当か?
生成AIの普及によりSEOが「オワコン」化するという言説を頻繁に耳にするようになりました...