ストレージの冗長性を確保する「RAID 1」と「RAID 5」は、どちらか一方が全てにおいて優れているわけではない。幾つかの観点で比較することで、どちらがより適しているのかを判断できるようになる。
HDDやSSDのデータ保存の信頼性を確保したり、読み書きのパフォーマンスを高めたりするために、さまざまな組織が「RAID」(Redundant Array of Inexpensive Disks)を利用している。RAIDは簡単に言えば「ストレージの冗長性を確保するための技術」だが、その種類は幾つもあり、適切なパフォーマンスの要件や予算によって適切なRAIDは変わる。本稿では代表的な「RAID 1」と「RAID 5」について学んでおこう。
RAIDは「Redundant Array of Independent Disks」の略である通り、複数のHDDを組み合わせて冗長性を確保するために生まれた技術だ。そのうち種類の一つであるRAID 1とRAID 5は、冗長性確保のための選択肢として広く選ばれている。データ保護において、冗長性を確保することは非常に重要であり、データのコピーが多ければ多いほど、データ損失のリスクは低くなる。コピーの多さはRAIDの種類を分ける一つの要素になる。
RAID 1は「ミラーリング」とも呼ばれる。全てのデータを複数のHDDにコピーして保存する方式であるため、1台が故障しても別の1台に完全なコピーが残っている状態になる。
RAID 5は「分散パリティ」とも呼ばれる。データを複数のHDDに分散して保存し、各HDDには主データとともに「パリティ」(2進数の誤り検出符号)情報も格納する。1台のHDDが故障した場合でも、パリティ情報があればストレージアレイは正常に機能し続けられる。故障したHDDの交換時には、パリティ情報を使用して、新しいHDDにデータが自動で書き込まれる。
ストレージやバックアップの管理者は、RAID 1とRAID 5のいずれかを選択する際、以下の要素を考慮しなければならない。
RAID 1とRAID 5のどちらかが客観的に優れているわけではない。組織が重視する要素に応じて、適した選択肢は異なる可能性がある。
RAID 1とRAID 5は、いずれも1台のHDDが故障してもシステムが稼働し続けられるRAIDの種類だ。冗長性においては同等と言える。RAID 1では、ミラーリングされたコピーが、故障したHDDの代わりとなる。RAID 5ではアレイ(複数のHDDの組み合わせ)内のHDDに分散するパリティ情報を使用し、故障したHDDのデータを復元する。
RAID 1は、最低2台のHDDが必要だ。1台のHDDが全データを保持し、もう1台がそのデータの完全なコピーを保持する。RAID 1のアレイにHDDを追加した場合、追加のHDDはそれぞれミラーリングの追加分として機能する。RAID 1のアレイに3台のHDDがあれば、データのコピーは3つ存在することになる。
RAID 5は最低3台のHDDが必要だが、より多くのディスクをサポートできる。RAID 5は、データを「ストライピング」と呼ばれる方法で複数のHDDに分散させて書き込み、各HDDにはデータの一部とパリティ情報が格納される。パリティ情報は、HDDのいずれかが故障した場合に、失われたデータを再構築するために必要になる。
RAID 1とRAID 5は冗長性を確保できる半面、相応のストレージ容量を消費する。
RAID 1は、データを2台のHDD間でミラーリング(複製)する。HDD1台分のデータを保持するために2台分の容量が必要になる。使用可能な総ストレージ容量の50%は実データの保存に使用され、残りの50%は冗長性を確保するために使われる。
RAID 5は、ストレージの冗長性を提供するためにパリティ情報を使用し、このパリティはアレイ内の全HDDに分散する。HDD1台分の容量がパリティ情報の保存に使用されるため、3台のディスクでは全体の約33%が冗長性に、残りの66%が実データの保存に使われる。HDDが5台の場合、冗長性のために消費される容量は依然として1台分のディスク容量に限定される。このため、全体の20%が冗長性に使われ、80%容量がデータ保存に利用可能となる。
RAID 1は基本的に2台のHDDでデータをミラーリングする。パフォーマンスは使用している単一のHDDとほぼ同等だ。つまり、RAID 1アレイの構造は、データの読み書き速度を向上させるわけではないが、パフォーマンスを低下させることもない。
RAID 5は、データをアレイ内の複数のHDDに分散して格納する。この仕組みによって読み取り性能が向上するのが一般的だ。データは各ディスクに均等に分散されるため、複数のHDDから同時にデータを読み出せる。この結果、アレイ全体としての読み取り速度は、単一のHDDの場合よりも速くなる。ただしパリティの計算が必要なため、書き込みパフォーマンスは通常、読み取りよりも遅くなる。それでも、RAID 5アレイの書き込みパフォーマンスは、RAID 1アレイを上回る可能性が高い。
前述のように、RAID 1とRAID 5はどちらもアレイ内の1台のディスクが故障しても機能し続けることができる。RAID 1で故障してでもパフォーマンスにはほとんど影響しないが、RAID 5ではデータ読み取りに利用できるHDDが少なくなるため、パフォーマンスに大きな影響を及ぼす可能性がある。故障したHDDの交換時には、残りのHDDがその負荷を吸収し、失われたデータをパリティ情報を用いて再構築(リビルド)する必要がある。このリビルドのプロセス中はパフォーマンスが低下する可能性がある。
RAID 1の実装と管理、保守は比較的簡単だ。それに対してRAID 5はアレイにより多くのHDDを使用することになるため、RAID 1よりも複雑になる。とはいえ、どちらも過度に複雑なものではない。
米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
ソニーとディズニーが奇跡のコラボ NBAの試合に3Dアニメをリアルタイムで融合
ドナルドダック、グーフィー、その他の人気キャラがプロバスケットボールの試合の初のア...
ChatGPTだけじゃない! 生成AIの「検索量ランキング」、世界18カ国の傾向は?
ChatGPTの圧倒的な人気が際立つ一方で、GeminiやPerplexity、Copilotも注目を集めている...
マーテク市場をけん引する3つの革新技術とは? 「マーケティングテクノロジーカオスマップJAPAN 2024-2025」
アンダーワークスは「マーケティングテクノロジーカオスマップJAPAN 2024-2025」を発表し...