大容量HDDの出現により、「RAIDの限界」が取り沙汰され、イレージャーコーディングという代替策が登場した。フラッシュ時代にもこれは有効なのだろうか。
どんなに信頼性が高くても、フラッシュ媒体が劣化するのは事実だ。そしてドライブ(コントローラーにせよNANDにせよ)は、障害が発生する恐れがある。こうしたドライブは初めから寿命が決まっているからだ。NANDの場合、特定セルの耐久レベルが限界に達すると、媒体に障害が発生するか、正しくない結果を返すようになるリスクがある。
そのため、安価なディスクを使ったRAIDやイレージャーコーディングといったリカバリー技法を使用して、メディア障害時のデータ保護策を講じる必要が生じる。
RAIDの標準的な構成としては、RAID 5とRAID 6がある。後者は、再構築時間が重要となる大容量の装置で高いレジリエンス(耐障害性)を提供するために使用する。RAID 5とRAID 6は、データとパリティ(リカバリー用の情報)を媒体全体に分散して配置する。
データ保護にRAIDを使用する際に大きな問題となるのは、拡張性だ。大規模なRAIDグループを構成している場合、パリティスペースのオーバーヘッドが減る一方で、障害による再構築の回数は増える。
HDDの容量とRAIDグループが増加すると、リカバリー時間が著しく長引くことが分かっている。その結果、リカバリーが終了するまでの間に、同一RAIDグループの別の装置で障害が連続して発生した場合、データは無防備になる。そこで、RAID 6を保護スキームとして使用する。
RAIDの再構築はまた、パフォーマンスにも影響を与える。RAIDグループ内の全てのデバイスが、失われたデータの再構成作業に関与するため、入出力(I/O)パフォーマンスが低下したり、データの再構築に要する時間が長引いたりする恐れがある。
イレージャーコーディングは数学的関数を使用する技法で、一連のデータをあらかじめ冗長性を含む形式に変換する。こうすることで、冗長部分のサブセットから元のデータを再構築することができる。
RAIDとイレージャーコーディングには、それぞれ長所と短所があるため、最適な選択はワークロードの種類によって変わる。
RAIDは通常、単一のストレージアレイまたはサーバで障害が発生した媒体を回復する方法として展開されているが、ネットワークRAIDの実装も存在する。
先述の通り、RAIDは拡張性に懸案事項がある。特にRAID 5には、回復不能な読み取りエラーに対する脆弱(ぜいじゃく)性がある。
続きを読むには、[続きを読む]ボタンを押して
会員登録あるいはログインしてください。
RAID vs. イレージャーコーディング──フラッシュに最適な保護技術とは?
大容量データ保護の福音イレージャーコーディングで「RAIDは不要になる」
HDD大容量化による「RAIDの限界」を解決するイレージャーコーディング
フラッシュストレージ時代のRAID――基礎から各社の独自技術まで
失敗から成功まで、HDFSでRAIDを利用するFacebookの挑戦
Copyright © ITmedia, Inc. All Rights Reserved.
AIの進化が加速する「プラットフォームビジネス」とは?
マーケットプレイス構築を支援するMiraklが日本で初のイベントを開催し、新たな成長戦略...
「マーケティングオートメーション」 国内売れ筋TOP10(2024年12月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
2024年の消費者購買行動変化 「日本酒」に注目してみると……
2023年と比較して2024年の消費者の購買行動にはどのような変化があったのか。カタリナマ...