圧縮すればいいわけではない? データ削減のはずが「ボトルネック」を招く理由:ストレージの無駄遣いを防ぐ5つの戦略【後編】
データの圧縮や重複排除はストレージ容量の節約に効果的だが、処理方式によってはシステムの書き込み速度を劇的に低下させるリスクがある。不要なデータを整理しつつ、性能を損なわずに効率化するにはどうすべきか。
企業のデータが膨れ上がる中、ストレージシステムの効率化は、費用削減と性能維持の両面で喫緊の課題になっている。オンプレミスストレージとクラウドサービスが混在する複雑なシステム構成において、単にハードウェアを増強するだけでは、根本的な解決にはつながらない。
無駄なデータを削減し、「真のストレージ効率化」を実現するには、データの生成から廃棄までを管理する「データライフサイクル管理」(DLM)の視点が不可欠だ。以下で、現代のインフラにおいてストレージ効率を最大化するための実践的な5つの指針のうち、3〜5つ目を解説する。
3.DLM戦略の見直し
併せて読みたいお薦め記事
連載:ストレージの無駄遣いを防ぐ5つの戦略
ストレージ活用のヒント
既にDLM戦略を導入している企業は、現在のニーズに合わせて見直る。まだ導入していない企業は、DLMの取り組みを開始することを最優先事項にすべきだ。
DLMは、データを整理し、管理するための手順を定義する。企業がデータを適切に管理できるようになれば、データの効率的な保存や、ビジネス要件の変化に適用したデータ戦略を実行しやすくなる。
一般的に、DLMの取り組みではデータのライフサイクルにおいて以下のステップを実行する。
- 機密性、重要性、アクセス頻度、パフォーマンス要件といったカテゴリーごとに、現在のビジネス要件に基づいてデータを分類する。
- ビジネスやアプリケーションの要件に基づき、データをクレンジングして整形する。
- このプロセスの一環として、冗長(Redundant)なデータ、陳腐化(Obsolete)したデータ、不要(Trivial)なデータ(まとめて「ROTデータ」と呼ぶ)を特定し、タグ付けする。
- DLM戦略を明文化した正式なポリシーを策定する。
- このポリシーでコンプライアンス(法令順守)、セキュリティ、アクセス制御、災害復旧(DR)、データ損失防止(DLP)、データ保持、アーカイブ、データ削除といった課題に対処する。
- ポリシーを自動的に適用するプロセスや、データのバックアップとスナップショットを取得するプロセスを導入する。
効果的なDLM戦略を導入することで、ITチームは必要なストレージの種類、データの可用性とセキュリティを確保するための効果的な方法を、より適切に計画できるようになる。
4.データ削減技術の採用
ストレージ使用率を向上させるために役立つのがデータ削減技術だ。データ削減技術の採用は通常、企業のDLMの取り組みに組み込まれる。一般的なデータ削減技術として、圧縮、重複排除、シンプロビジョニングの3つがある。
圧縮
圧縮は、データの表現に使用するビット数を減らし、ファイルサイズを小さくする技術だ。圧縮されたデータは、元データと比べて必要なストレージ容量とネットワーク帯域幅(通信路容量)が少なくなり、ファイル転送も高速化する。
圧縮には主に「可逆圧縮」と「非可逆圧縮」の2種類がある。可逆圧縮はファイルを圧縮前の状態に復元できる方式で、わずかなデータの変化が動作エラーにつながり得る実行ファイルなどのファイルに重要だ。非可逆圧縮は重要でないビットを削除して圧縮率を高める方式で、一般的に音声ファイルや動画ファイルに使われる。
重複排除
重複排除は、冗長なデータのコピーを、ブロックレベルまたはファイルレベルで排除する技術だ。重複排除は必要なストレージ容量を削減する他、データ送信前に処理を適用する方式であれば、ネットワーク帯域幅の削減やデータ転送の高速化にもつながる。
重複排除には主にインライン方式とポストプロセス方式の2種類がある。インライン方式の重複排除は、データがストレージに書き込まれる際に冗長データを削除する。この方式はポストプロセス方式よりも必要なストレージが少なくて済むが、ボトルネックを引き起こす可能性がある。ポストプロセス方式の重複排除は、データがストレージに書き込まれた後に冗長データを削除する。インライン方式よりも多くのストレージ容量を必要とするが、ボトルネックを解消し、特定のデータを重複排除する際の自由度が高まる。
シンプロビジョニング
シンプロビジョニングは、データ容量を事前に全量割り当てるのではなく、必要に応じて動的に割り当てるストレージ管理技術だ。システムは複数のディスクからストレージを確保し、そのプールから割り当てる。シンプロビジョニングは、企業がストレージをより有効に活用し、過剰なプロビジョニングを回避すると同時に、新しいアプリケーションの導入を容易にするのに役立つ。特に、複数の仮想マシン(VM)が状況に応じて要求するストレージ量が変化する場合に有効だ。
現代のストレージ製品には、圧縮、重複排除、シンプロビジョニングが普及している。企業は、ストレージベンダーがこれらの用語をどのように定義し、容量削減効果をどのように測定し、これらのデータ削減機能をどのように実装しているかを理解するために、製品を慎重に評価する必要がある。
5.継続的な監視と保守
ストレージ効率の維持と向上は、継続的な再評価と改善を要する継続的なプロセスだ。以下の作業を実施するとよい。
- KPI(主要業績評価指標)とアラート機能を使用してストレージシステムを継続的に監視し、ボトルネックや異常、容量の削減率を特定する。この情報は、将来の要件を予測するのに役立つ。
- ストレージの効率的な利用を維持するために、定期的な保守とアップグレードを実行する。ROTデータを定期的に特定し、クリーンアップする。
- AI技術などの高度な技術を使用してストレージシステムを管理し、最適化する。
- 例えば予測分析を使用して、潜在的なセキュリティや性能の問題を早期に特定するといった活用法が考えられる。
- ストレージの管理や監視に加え、階層化やDLM戦略の実行プロセスを自動化する。これによってストレージの最適化やROTデータの削除が自律的に実行されるようになり、業務を止めることなく、変化するビジネス要件に適応できる。
- 管理者が技術を理解してベストプラクティスを適用し、業務遂行のために利用可能なツールを使えるようになるために、必要な教育とトレーニングを提供する。
Copyright © ITmedia, Inc. All Rights Reserved.