ファイル共有などに使うプライマリストレージは、バックアップデータに比べて重複率が低く重複排除のメリットが少なかった。だが、最近はプライマリストレージでの重複排除が現実的になってきた。なぜか?
ストレージコストを削減したいと考える多くの組織にとって、検討すべき重要課題はディスクスペースの削減だ。データ重複排除はこの目標を念頭に、データバックアップなどの二次的なシステムに広く採用されてきた。しかし、プライマリストレージの重複排除はまだそのレベルの普及に至っていない。
データ重複排除とは、ひとまとまりのデータの中で重複する部分を見つけて削除するプロセスをいう。圧縮の場合は余分なデータを削除してファイルのサイズを縮小するが、対象となるファイルの数を減らすことはしない。これに対してデータ重複排除はさらに幅広い観点から、より広範なデータセットで横断的にファイルあるいはファイル内のブロックを照らし合わせ、余分なものを排除する。
本稿は、PDFコンテンツ「製品導入ガイド」シリーズ第2弾、「予算内でストレージを最大限に活用する方法」の抄訳です。TechTarget会員であれば、無償でダウンロードできます。
データ重複排除のハードウェア設定では、同じデータのコピーを保存するのではなく、アレイにメタデータとポインタを記録して、データのどのインスタンスが、既存の特定のインスタンスのどこにあるかを指し示す。
同じ静的データを繰り返し保存するバックアップのようなインスタンスの場合、重複排除によって物理的なストレージ消費は10対1〜20対1という高い割合で削減できる(ディスクスペースはそれぞれ90%、95%の節減になる)。
物理ストレージの削減が大きな意味を持つのは明らかだ。もしプライマリストレージを90%削減できれば、大量のストレージアレイを導入している組織にとって膨大なコストの削減になる。
だが残念ながら、現実はそれほど単純ではない。データ重複排除の利用ケースはバックアップには適しているが、プライマリストレージでは必ずしもうまくいくとは限らない。
規模の大きいバックアップストリームと比べると、実際に動いているプライマリストレージのデータセットは規模がはるかに小さく、重複もずっと少ない。結果として、そのアルゴリズムで処理するデータの種類によっては、プライマリストレージの重複排除率は2対1という低さになることもある。
だが、ある技術の企業導入が進むにつれて、プライマリストレージ重複排除のメリットが再浮上してきた。さらに、重複排除でコストが削減できれば、高コストのためにそれまで現実的ではなかったSSDの利用さえ、現実的になるかもしれない。
ライマリストレージ重複排除を活用できる条件とは何か? さらに、本PDFでは米Forresterのアナリストによるストレージの最新トレンド解説やVDI環境におけるプロビジョニング方法を紹介。
予算内でストレージを最大限に活用する方法のダウンロードページへ |
Copyright © ITmedia, Inc. All Rights Reserved.
AI導入の効果は効率化だけじゃない もう一つの大事な視点とは?
生成AIの導入で期待できる効果は効率化だけではありません。マーケティング革新を実現す...
ハロウィーンの口コミ数はエイプリルフールやバレンタインを超える マーケ視点で押さえておくべきことは?
ホットリンクは、SNSの投稿データから、ハロウィーンに関する口コミを調査した。
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...