データをアーカイブするシステムの設計を見直す場合、徐々に量を増やしながら、プライマリーストレージからアーカイブに絶えずデータが移動するようにすれば、誰もが満足するだろう。そのためには4つのルールに従うのがお勧めだ。
大半のデータセンターでは、保存しているデータの80%以上が1年以上アクセスされていない。もっと短期間では、95%のデータが過去90日間一度もアクセスされていないという。つまり大多数のデータが、アクティブデータ用の高価な高速フラッシュアレイをただ占有しているだけなのだ。この現実を無視することはできない。
問題は、ほとんどのITプロフェッショナルがこの95%のデータをセカンダリーストレージ層に移行するといった積極的な手段を取るのをためらっていることだ。だが設計が適切であれば、ほとんど不満を生むことなく、データをセカンダリーストレージに移行できる。そのためには戦略を立てる際に従うべき4つの基本ルールがある。
データアーカイブ戦略には大容量のHDDを採用し、圧縮と重複排除を利用して、ストレージ層のコストを可能な限り排除する。このようなテクノロジーは全てデータへのアクセスパフォーマンスに影響すると考えられる。だが大抵の場合、アクティブアーカイブの設計が適切であれば、アクセス速度はプライマリーストレージと変わらない。
その理由はアクセス頻度にある。プライマリーストレージは1秒当たり数十万とまではいかなくても数百回のアクセス要求に応答している。これに対し、アーカイブが応答するのは1時間当たり通常1〜2件程度だ。アーカイブは通常、受け取った書き込みトラフィックの処理に追われている。古いデータへのアクセスはこれに比べてはるかに少ない。ディスクベースのアーカイブストレージは応答すべきI/Oが少なければ、プライマリーストレージとほぼ同じ速度で個別の要求に応答できる。ただしアーカイブはプライマリーストレージと同じ速度で応答する必要はない。ユーザーが違いに気付かない程度の速度で応答すれば問題ない。
アーカイブソフトウェアのベンダー、中でも特にハードウェアベンダーは、自社のROI(費用対効果)を自慢し、データアーカイブ戦略に投資すれば導入後30秒で採算が取れると言う。問題は、この迅速なROIを実現するには、顧客は100TBのアーカイブまたはセカンダリーストレージを購入し、アーカイブプラットフォームを立ち上げたら即座にデータの80〜90%を移行しなければならないところにある。実力のあるITプロフェッショナルなら、このような方法は取らない。即座に移行する必要などない。全てのデータを保持しているプライマリーストレージは既に購入したものだ。慌ててアーカイブしてそのストレージアレイの半分を空け、その分を返品して払い戻しを求めてもそれに応じるベンダーはほとんどないだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
2025年のマーケターが「生成AIでテレビCMを作る」よりも優先すべきことは?
AIが生成した広告に対する反発が続いた1年を経て、マーケターはパフォーマンス重視で非難...
CMOはなぜ短命? なぜ軽視される? いま向き合うべき3つの厳しい現実
プロダクト分析ツールを提供するAmplitudeのCMOが、2025年のマーケティングリーダーに課...
トラフィック1300%増、生成AIがEコマースを変える
アドビは、2024年のホリデーシーズンのオンラインショッピングデータを公開した。