企業のストレージには、重要なデータから必要性の疑わしいデータまで、さまざまなデータが混在しがちだ。データ量が増えるにつれてデータを保管し続けることの負担は増大する。どうすればいいのか。
ストレージのデータ量と二酸化炭素(CO2)排出量が増大する問題に対して、企業はどのような対策を取るべきなのか。ストレージベンダーNetAppのチーフテクノロジーエバンジェリストを務めるマット・ワッツ氏の話を基に、データ保管の方法を紹介する。
前編「『使わないけど消せないデータ』を保存する“あのストレージ”とは?」は、データの使用頻度に応じて使用するストレージを使い分けるべきだ、という点を取り上げた。頻繁に使用するデータは主要ストレージであるSSDやHDDに保管し、コールドデータ(使用頻度の低いデータ)や全く使用しないデータは、CO2を排出しにくいストレージに保管する、といった形だ。こうして使用頻度に応じて保管するストレージを使い分ける手法は、一般的には「データ階層化」と呼ばれる。
本稿は、データ階層化をより賢く運用するためのポイントに加え、「データを所有しているのは誰なのか」など、より詳細に踏み込んで考えるべきポイントを紹介する。
データの使用頻度に応じてストレージを使い分ける際、自動化が欠かせないとワッツ氏は話す。データ階層化が自動でできるストレージ管理ソフトウェアを使用するとよい。IT部門が手作業で全部門のデータの使用頻度を確認し、必要に応じて別のストレージに移し替えるとなれば相当の労力が掛かってしまうためだ。そもそも使用頻度の高いデータと比べて、コールドデータや全く使用しないデータの重要度は総じて低い。同氏は「そうしたデータの運用に必要以上の手間を掛けてはいけない」と指摘する。
一方で「どのようなデータを移動させるのか」という基準は、企業が独自の判断で設定して問題ないという。例えばコールドデータの大まかな意味は「使用頻度の低いデータ」だが、使用していない期間の基準は2カ月であっても、3カ月であっても、1年であってもよい。「どの時点でコールドデータだとみなすのかというポリシーを設定することと、コールドデータ用の何らかの運用を用意しておくことが重要だ」とワッツ氏は話す。
使用頻度に応じてデータを分類することでCO2削減やコスト削減はしやすくなるが、それでもデータ量は増え続ける。ワッツ氏は、長期的に見ると「データ所有者」の問題にも踏み込む必要があると指摘する。データ所有者の問題とはつまり、「誰がそのデータを生成したのか」「そのデータを保管する責任は誰にあるのか」ということだ。
企業がさまざまなデータを長期にわたって保管し続ける場合、この問題は大きくなる。企業が保有するデータの中には業務の役に立たず、保管する必要性の低いデータが含まれている可能性があり、それが無駄な負担として企業にのしかかってくるからだ。データ量が増大するにつれて負担は大きくなり、企業は使途不明のデータを保管し続けることに寛容ではいられなくなる。
「どこかの時点で、そのデータを保管し続けるのか、長期保管用としてアーカイブするのか、あるいは消去するのかといった判断を下さなければならない」とワッツ氏は指摘する。その時点において問題になるのが、誰が責任を持ってその判断を下すのかという点だ。この問題があることから、生成から保管、消去を含めたデータのライフサイクルを適切に管理するには、データ所有者の要素もひも付けておく必要がある。
データ保管においてもう一つ重要なのは、異なるベンダーのオンプレミスストレージやクラウドストレージなど、各種ストレージのデータ保管を一元的に管理することだとワッツ氏は言う。その背景にあるのは、クラウドサービスの利用が広がる一方、オンプレミスではオールフラッシュストレージへの投資傾向が強まっているといったように、企業がさまざまなストレージを採用しつつあることだ。
これは適材適所でデータやシステムを運用しようとする場合に避けがたい動きだと言える。例えば主要クラウドサービスを使うことでCO2削減につながる可能性があることは前編で触れた通りだが、コストやレイテンシ(遅延)、セキュリティなどの要件によってデータをクラウドサービスに置けない場合もある。そのため企業は、個々のデータやシステムに応じてオンプレミスのストレージとクラウドストレージを使い分ける必要がある。コストや各種システム要件に加えて、CO2排出抑制など新たな観点が加わる中では、データを目的に応じて適材適所で保管することが一段と重要になる。
Copyright © ITmedia, Inc. All Rights Reserved.
クラウド全盛期になぜ「テープ」が再注目? データ管理の最前線を探る (2025/4/24)
データの多様化と肥大化が加速 ファイルサーバ運用は限界? 見直しのポイント (2025/4/8)
Hyper-Vは「次の仮想化基盤」になり得るのか 有識者の本音を聞く (2025/3/14)
「生成AI」の自社運用に“ちょうどよいサーバ”の賢い選び方 (2025/3/12)
クラウドストレージは便利だけど検索性が課題? 東急建設の解決策は (2025/2/25)
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...