データの95%はアーカイブ可能、ユーザーの不満を生まない4つのルール:過去90日間アクセスの無いデータが対象に
データをアーカイブするシステムの設計を見直す場合、徐々に量を増やしながら、プライマリーストレージからアーカイブに絶えずデータが移動するようにすれば、誰もが満足するだろう。そのためには4つのルールに従うのがお勧めだ。
大半のデータセンターでは、保存しているデータの80%以上が1年以上アクセスされていない。もっと短期間では、95%のデータが過去90日間一度もアクセスされていないという。つまり大多数のデータが、アクティブデータ用の高価な高速フラッシュアレイをただ占有しているだけなのだ。この現実を無視することはできない。
問題は、ほとんどのITプロフェッショナルがこの95%のデータをセカンダリーストレージ層に移行するといった積極的な手段を取るのをためらっていることだ。だが設計が適切であれば、ほとんど不満を生むことなく、データをセカンダリーストレージに移行できる。そのためには戦略を立てる際に従うべき4つの基本ルールがある。
併せて読みたいお薦め記事
アーカイブとバックアップの違いとは
アーカイブを検討する理由
テープストレージが今も必要な理由
ルール1:アーカイブの応答速度をプライマリーと同程度にする
データアーカイブ戦略には大容量のHDDを採用し、圧縮と重複排除を利用して、ストレージ層のコストを可能な限り排除する。このようなテクノロジーは全てデータへのアクセスパフォーマンスに影響すると考えられる。だが大抵の場合、アクティブアーカイブの設計が適切であれば、アクセス速度はプライマリーストレージと変わらない。
その理由はアクセス頻度にある。プライマリーストレージは1秒当たり数十万とまではいかなくても数百回のアクセス要求に応答している。これに対し、アーカイブが応答するのは1時間当たり通常1〜2件程度だ。アーカイブは通常、受け取った書き込みトラフィックの処理に追われている。古いデータへのアクセスはこれに比べてはるかに少ない。ディスクベースのアーカイブストレージは応答すべきI/Oが少なければ、プライマリーストレージとほぼ同じ速度で個別の要求に応答できる。ただしアーカイブはプライマリーストレージと同じ速度で応答する必要はない。ユーザーが違いに気付かない程度の速度で応答すれば問題ない。
ルール2:全てを初日にアーカイブしない
アーカイブソフトウェアのベンダー、中でも特にハードウェアベンダーは、自社のROI(費用対効果)を自慢し、データアーカイブ戦略に投資すれば導入後30秒で採算が取れると言う。問題は、この迅速なROIを実現するには、顧客は100TBのアーカイブまたはセカンダリーストレージを購入し、アーカイブプラットフォームを立ち上げたら即座にデータの80〜90%を移行しなければならないところにある。実力のあるITプロフェッショナルなら、このような方法は取らない。即座に移行する必要などない。全てのデータを保持しているプライマリーストレージは既に購入したものだ。慌ててアーカイブしてそのストレージアレイの半分を空け、その分を返品して払い戻しを求めてもそれに応じるベンダーはほとんどないだろう。
Copyright © ITmedia, Inc. All Rights Reserved.