ファイル共有などに使うプライマリストレージは、バックアップデータに比べて重複率が低く重複排除のメリットが少なかった。だが、最近はプライマリストレージでの重複排除が現実的になってきた。なぜか?
ストレージコストを削減したいと考える多くの組織にとって、検討すべき重要課題はディスクスペースの削減だ。データ重複排除はこの目標を念頭に、データバックアップなどの二次的なシステムに広く採用されてきた。しかし、プライマリストレージの重複排除はまだそのレベルの普及に至っていない。
データ重複排除とは、ひとまとまりのデータの中で重複する部分を見つけて削除するプロセスをいう。圧縮の場合は余分なデータを削除してファイルのサイズを縮小するが、対象となるファイルの数を減らすことはしない。これに対してデータ重複排除はさらに幅広い観点から、より広範なデータセットで横断的にファイルあるいはファイル内のブロックを照らし合わせ、余分なものを排除する。
本稿は、PDFコンテンツ「製品導入ガイド」シリーズ第2弾、「予算内でストレージを最大限に活用する方法」の抄訳です。TechTarget会員であれば、無償でダウンロードできます。
データ重複排除のハードウェア設定では、同じデータのコピーを保存するのではなく、アレイにメタデータとポインタを記録して、データのどのインスタンスが、既存の特定のインスタンスのどこにあるかを指し示す。
同じ静的データを繰り返し保存するバックアップのようなインスタンスの場合、重複排除によって物理的なストレージ消費は10対1〜20対1という高い割合で削減できる(ディスクスペースはそれぞれ90%、95%の節減になる)。
物理ストレージの削減が大きな意味を持つのは明らかだ。もしプライマリストレージを90%削減できれば、大量のストレージアレイを導入している組織にとって膨大なコストの削減になる。
だが残念ながら、現実はそれほど単純ではない。データ重複排除の利用ケースはバックアップには適しているが、プライマリストレージでは必ずしもうまくいくとは限らない。
規模の大きいバックアップストリームと比べると、実際に動いているプライマリストレージのデータセットは規模がはるかに小さく、重複もずっと少ない。結果として、そのアルゴリズムで処理するデータの種類によっては、プライマリストレージの重複排除率は2対1という低さになることもある。
だが、ある技術の企業導入が進むにつれて、プライマリストレージ重複排除のメリットが再浮上してきた。さらに、重複排除でコストが削減できれば、高コストのためにそれまで現実的ではなかったSSDの利用さえ、現実的になるかもしれない。
ライマリストレージ重複排除を活用できる条件とは何か? さらに、本PDFでは米Forresterのアナリストによるストレージの最新トレンド解説やVDI環境におけるプロビジョニング方法を紹介。
予算内でストレージを最大限に活用する方法のダウンロードページへ |
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
博報堂が提唱 AIエージェントとの対話を起点とした新たな購買行動モデル「DREAM」とは?
博報堂買物研究所が2025年の購買体験を予測する「買物フォーキャスト2025」を発表し、AI...
B2B企業の約6割が2025年度のWeb広告予算を「増やす予定」と回答
キーワードマーケティングは、2025年度のマーケティング予算策定に関与しているB2B企業の...
生成AIの利用、学生は全体の3倍以上 使い道は?
インテージは、生成AIの利用実態を明らかにするための複合的調査を実施し、結果を公表した。