データの95%はアーカイブ可能、ユーザーの不満を生まない4つのルール過去90日間アクセスの無いデータが対象に

データをアーカイブするシステムの設計を見直す場合、徐々に量を増やしながら、プライマリーストレージからアーカイブに絶えずデータが移動するようにすれば、誰もが満足するだろう。そのためには4つのルールに従うのがお勧めだ。

2018年03月28日 09時00分 公開
[George CrumpTechTarget]

 大半のデータセンターでは、保存しているデータの80%以上が1年以上アクセスされていない。もっと短期間では、95%のデータが過去90日間一度もアクセスされていないという。つまり大多数のデータが、アクティブデータ用の高価な高速フラッシュアレイをただ占有しているだけなのだ。この現実を無視することはできない。

 問題は、ほとんどのITプロフェッショナルがこの95%のデータをセカンダリーストレージ層に移行するといった積極的な手段を取るのをためらっていることだ。だが設計が適切であれば、ほとんど不満を生むことなく、データをセカンダリーストレージに移行できる。そのためには戦略を立てる際に従うべき4つの基本ルールがある。

ルール1:アーカイブの応答速度をプライマリーと同程度にする

 データアーカイブ戦略には大容量のHDDを採用し、圧縮と重複排除を利用して、ストレージ層のコストを可能な限り排除する。このようなテクノロジーは全てデータへのアクセスパフォーマンスに影響すると考えられる。だが大抵の場合、アクティブアーカイブの設計が適切であれば、アクセス速度はプライマリーストレージと変わらない。

 その理由はアクセス頻度にある。プライマリーストレージは1秒当たり数十万とまではいかなくても数百回のアクセス要求に応答している。これに対し、アーカイブが応答するのは1時間当たり通常1〜2件程度だ。アーカイブは通常、受け取った書き込みトラフィックの処理に追われている。古いデータへのアクセスはこれに比べてはるかに少ない。ディスクベースのアーカイブストレージは応答すべきI/Oが少なければ、プライマリーストレージとほぼ同じ速度で個別の要求に応答できる。ただしアーカイブはプライマリーストレージと同じ速度で応答する必要はない。ユーザーが違いに気付かない程度の速度で応答すれば問題ない。

ルール2:全てを初日にアーカイブしない

 アーカイブソフトウェアのベンダー、中でも特にハードウェアベンダーは、自社のROI(費用対効果)を自慢し、データアーカイブ戦略に投資すれば導入後30秒で採算が取れると言う。問題は、この迅速なROIを実現するには、顧客は100TBのアーカイブまたはセカンダリーストレージを購入し、アーカイブプラットフォームを立ち上げたら即座にデータの80〜90%を移行しなければならないところにある。実力のあるITプロフェッショナルなら、このような方法は取らない。即座に移行する必要などない。全てのデータを保持しているプライマリーストレージは既に購入したものだ。慌ててアーカイブしてそのストレージアレイの半分を空け、その分を返品して払い戻しを求めてもそれに応じるベンダーはほとんどないだろう。

ITmedia マーケティング新着記事

news171.png

2024年のGW予算は横ばい 賃上げよりも物価高と円安の影響が勝る?――インテージ調査
インテージが全国の15歳から79歳の男女を対象に実施したゴールデンウイークに関する調査...

news148.jpg

CNN幹部が語る、メディアビジネスにとってのAIのリスクと機会
生成AIがコンテンツを量産し、真偽の明らかでない情報があふれかえる中、メディアの価値...

news016.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2024年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。