2018年02月12日 05時00分 公開
特集/連載

捨てられないコールドデータをどう保存するか徹底比較:HDD、テープ、SSD、光ディスク コスト効率の高いコールドストレージは? (1/2)

コスト効率に優れたコールドストレージ製品、サービス、メディアへの需要が急速に高まっている。それには多くの理由がある。非構造化データが飛躍的に増加していることも理由の1つだ。関連技術を比較する。

[Marc Staimer,TechTarget]
コールドストレージメディア比較 コールドストレージメディア比較(本稿では日本語版を提供)《クリックで拡大》

 データがコールドストレージに移されるのは、アクセス頻度が少なくなった場合や、全くアクセスされなくなった場合だ。コンプライアンスに準拠するためや、将来的に必要な場合に備えてデータを保管しておく。また、削除したデータが後になって必要になることをIT部門が懸念している場合もある。そのような理由で残されるデータ用にコールドストレージが存在する。この種のストレージは、一般に、プライマリーストレージやセカンダリーストレージよりも大幅に低コストで、その分パフォーマンスも低くてよい。

 コールドデータは、コールドストレージと一緒に扱われることが多い。だが実際には、コールドデータはどのストレージメディアやストレージシステムにも存在する可能性がある。一方、コールドストレージは、コールドデータの保管専用に設計されたシステムだ。コールドストレージはデータアクセスの頻度やパフォーマンスから、メディアの有効期間、データの回復性や耐久性まで、あらゆる要素が大きく異なっている。ユーザーが突如データを必要とすると、コールドデータの使用頻度が再び高まり、「ホット」になることもある。このように状況が変わるとシステム自体の利用が複雑化し、予想外のコストが増えることがある。

コールドストレージが注目される理由

 最近、コールドストレージの注目度が上がっている。これには幾つか理由がある。その理由を以下に示す。

データの急激な増加

 信じられないことに、IDCのアナリストは、1年間に生み出されるデータ量が2020年までに44Z(ゼタ)Bを超えると予測している。しかも、そこから加速度的に増加が続くという。その大部分はアクティブなデータではない。つまり、頻繁にはアクセスされないデータだ。そのようなデータの約80%以上が非構造化データであり、多くはセキュリティビデオやログファイルのようなものから機械的に生成される。

プライマリーストレージの消費

 ストレージはデータセンターで消費される唯一のテクノロジーだ。大半のデータはそのライフサイクルの間、最初に配置されたストレージ上にとどまる。そうしたデータのライフサイクルには実質的に終わりがない。プライマリーストレージが刷新される場合でさえ、コールドデータは新しいシステムに移される。そして、高額なプライマリーストレージやNANDフラッシュSSDメディアを消費し続けることになる。

 アクティブデータのためにこうした資産を使用することは、全く問題がない。だが、めったにアクセスすることがないコールドデータのために使うのは合理的ではない。コールドデータがプライマリーストレージを消費すると、アクティブデータ用にプライマリーストレージを追加購入して実装しなければならなくなる。コールドデータには高いパフォーマンスも、低遅延であることも、プライマリーストレージシステムの機能も必要ない。

 残念ながら、プライマリーストレージに保存されているデータの大半は、コールドデータやアクセス頻度の少ないデータが占める。データセンターストレージの75〜90%は、こうしたデータによって消費されている。時間と共にデータを追跡するヒートマップでは、データが作成された直後の72時間が最もアクセス頻度が高いことを示している。その後は急速にアクセス頻度が下がり、30日後にはほとんど使用されなくなる。そして90日後には事実上コールドデータになる。

「いつか使うかもしれない」症候群

 IT部門はデータを捨てたがらない。その根底には、廃棄したデータが突然必要になることに対する不安がある。これは、良くも悪くも全てのデータには価値があるという認識と密接に関係している。

規制順守

 データ関連のコンプライアンスを求める新しい標準や規制が増加する傾向にある。具体的には、EU一般データ保護規則(GDPR)、金融機関を対象としたニューヨーク州の銀行とサイバーセキュリティの規制、医療保険の相互運用性と説明責任に関する法令(HIPAA)、経済的および臨床的健全性のための医療情報技術に関する法律(HITECH法)、バーゼルI、バーゼルII、バーゼルIII、サーベンス・オクスリー法(SOX法)、労働安全衛生法などがある。こうした規制の多くは、特定の種類のデータを数十年から数百年にもわたって保持することを義務付けている。

非構造化データ分析

 全ての新規データのうち、非構造化データが80%にも上る。そのため、実用的な洞察を得るためにこうしたデータをマイニングする方法を探すのは当然のことだ。IDCによると、こうした状況が非構造化データ分析の爆発的増加へとつながり、こうした製品からもたらされる収益が2015年に1250億ドルを超えるまでに成長したいう。将来の分析に備えてこのような非構造化データを保管する際には、その方法のコスト効率が優れていなければならない。

コスト効率

 コールドストレージが実際に使用されているのは、コールドデータの保管コストがその価値の低さに見合っているためだ。利用可能なコールドストレージシステムやメディアのオプションは複数ある。また、クラウドサービスのオプションも多数存在する。各オプションは長短併せ持つが、どれもコールドストレージのコストを押し下げている。それにより、非常に手頃なコストでコールドストレージが可能になる。

コールドストレージシステム

       1|2 次のページへ

この記事を読んだ人にお薦めの関連記事

注目テーマ

ITmedia マーケティング新着記事

news056.jpg

20代女性が田舎に魅力を感じる背景に「SNS映え」と「インフルエンサー」――マージェリック調べ
マージェリックが実施した田舎に関する意識調査によると「田舎に魅力を感じる」という回...

news042.jpg

楽天の人工知能「Rakuten AIris」がマーケティング効率化にすごく有効である理由
楽天が、長年の事業展開で蓄積してきたビッグデータ資産を活用するために開発したAIエー...

news051.jpg

「SATORI」が機能アップデート、シナリオ機能を強化
SATORIはマーケティングオートメーションツール「SATORI」の機能アップデートを発表した。