コスト効率に優れたコールドストレージ製品、サービス、メディアへの需要が急速に高まっている。それには多くの理由がある。非構造化データが飛躍的に増加していることも理由の1つだ。関連技術を比較する。
データがコールドストレージに移されるのは、アクセス頻度が少なくなった場合や、全くアクセスされなくなった場合だ。コンプライアンスに準拠するためや、将来的に必要な場合に備えてデータを保管しておく。また、削除したデータが後になって必要になることをIT部門が懸念している場合もある。そのような理由で残されるデータ用にコールドストレージが存在する。この種のストレージは、一般に、プライマリーストレージやセカンダリーストレージよりも大幅に低コストで、その分パフォーマンスも低くてよい。
コールドデータは、コールドストレージと一緒に扱われることが多い。だが実際には、コールドデータはどのストレージメディアやストレージシステムにも存在する可能性がある。一方、コールドストレージは、コールドデータの保管専用に設計されたシステムだ。コールドストレージはデータアクセスの頻度やパフォーマンスから、メディアの有効期間、データの回復性や耐久性まで、あらゆる要素が大きく異なっている。ユーザーが突如データを必要とすると、コールドデータの使用頻度が再び高まり、「ホット」になることもある。このように状況が変わるとシステム自体の利用が複雑化し、予想外のコストが増えることがある。
最近、コールドストレージの注目度が上がっている。これには幾つか理由がある。その理由を以下に示す。
信じられないことに、IDCのアナリストは、1年間に生み出されるデータ量が2020年までに44Z(ゼタ)Bを超えると予測している。しかも、そこから加速度的に増加が続くという。その大部分はアクティブなデータではない。つまり、頻繁にはアクセスされないデータだ。そのようなデータの約80%以上が非構造化データであり、多くはセキュリティビデオやログファイルのようなものから機械的に生成される。
ストレージはデータセンターで消費される唯一のテクノロジーだ。大半のデータはそのライフサイクルの間、最初に配置されたストレージ上にとどまる。そうしたデータのライフサイクルには実質的に終わりがない。プライマリーストレージが刷新される場合でさえ、コールドデータは新しいシステムに移される。そして、高額なプライマリーストレージやNANDフラッシュSSDメディアを消費し続けることになる。
アクティブデータのためにこうした資産を使用することは、全く問題がない。だが、めったにアクセスすることがないコールドデータのために使うのは合理的ではない。コールドデータがプライマリーストレージを消費すると、アクティブデータ用にプライマリーストレージを追加購入して実装しなければならなくなる。コールドデータには高いパフォーマンスも、低遅延であることも、プライマリーストレージシステムの機能も必要ない。
残念ながら、プライマリーストレージに保存されているデータの大半は、コールドデータやアクセス頻度の少ないデータが占める。データセンターストレージの75〜90%は、こうしたデータによって消費されている。時間と共にデータを追跡するヒートマップでは、データが作成された直後の72時間が最もアクセス頻度が高いことを示している。その後は急速にアクセス頻度が下がり、30日後にはほとんど使用されなくなる。そして90日後には事実上コールドデータになる。
IT部門はデータを捨てたがらない。その根底には、廃棄したデータが突然必要になることに対する不安がある。これは、良くも悪くも全てのデータには価値があるという認識と密接に関係している。
データ関連のコンプライアンスを求める新しい標準や規制が増加する傾向にある。具体的には、EU一般データ保護規則(GDPR)、金融機関を対象としたニューヨーク州の銀行とサイバーセキュリティの規制、医療保険の相互運用性と説明責任に関する法令(HIPAA)、経済的および臨床的健全性のための医療情報技術に関する法律(HITECH法)、バーゼルI、バーゼルII、バーゼルIII、サーベンス・オクスリー法(SOX法)、労働安全衛生法などがある。こうした規制の多くは、特定の種類のデータを数十年から数百年にもわたって保持することを義務付けている。
全ての新規データのうち、非構造化データが80%にも上る。そのため、実用的な洞察を得るためにこうしたデータをマイニングする方法を探すのは当然のことだ。IDCによると、こうした状況が非構造化データ分析の爆発的増加へとつながり、こうした製品からもたらされる収益が2015年に1250億ドルを超えるまでに成長したいう。将来の分析に備えてこのような非構造化データを保管する際には、その方法のコスト効率が優れていなければならない。
コールドストレージが実際に使用されているのは、コールドデータの保管コストがその価値の低さに見合っているためだ。利用可能なコールドストレージシステムやメディアのオプションは複数ある。また、クラウドサービスのオプションも多数存在する。各オプションは長短併せ持つが、どれもコールドストレージのコストを押し下げている。それにより、非常に手頃なコストでコールドストレージが可能になる。
2024夏アニメの人気維持率 「負けヒロインが多すぎる!」の特異な動き
ブシロードのグループ会社であるゲームビズは「アニメビジネスインサイト『データで見る2...
約8割の人が経験する「見づらいホームページ」 最も多い理由は?
NEXERはくまwebと共同で「見づらいホームページ」に関するアンケートを実施した。
スマホ時間の奪い合い「利用者増えても、利用時間は減少」 唯一の勝者は?
データマーケティング支援のGlossomは、「スマートフォンでのメディアとコマースの利用に...