プライマリストレージの重複排除が「使えるようになった」理由：バックアップ以外にも有効

ファイル共有などに使うプライマリストレージは、バックアップデータに比べて重複率が低く重複排除のメリットが少なかった。だが、最近はプライマリストレージでの重複排除が現実的になってきた。なぜか？

≫ 2013年05月27日 08時00分公開

[Chris Evans，Computer Weekly]

　ストレージコストを削減したいと考える多くの組織にとって、検討すべき重要課題はディスクスペースの削減だ。データ重複排除はこの目標を念頭に、データバックアップなどの二次的なシステムに広く採用されてきた。しかし、プライマリストレージの重複排除はまだそのレベルの普及に至っていない。

　データ重複排除とは、ひとまとまりのデータの中で重複する部分を見つけて削除するプロセスをいう。圧縮の場合は余分なデータを削除してファイルのサイズを縮小するが、対象となるファイルの数を減らすことはしない。これに対してデータ重複排除はさらに幅広い観点から、より広範なデータセットで横断的にファイルあるいはファイル内のブロックを照らし合わせ、余分なものを排除する。

「予算内でストレージを最大限に活用する方法」無償ダウンロード

本稿は、PDFコンテンツ「製品導入ガイド」シリーズ第2弾、「予算内でストレージを最大限に活用する方法」の抄訳です。TechTarget会員であれば、無償でダウンロードできます。

予算内でストレージを最大限に活用する方法

　データ重複排除のハードウェア設定では、同じデータのコピーを保存するのではなく、アレイにメタデータとポインタを記録して、データのどのインスタンスが、既存の特定のインスタンスのどこにあるかを指し示す。

　同じ静的データを繰り返し保存するバックアップのようなインスタンスの場合、重複排除によって物理的なストレージ消費は10対1～20対1という高い割合で削減できる（ディスクスペースはそれぞれ90％、95％の節減になる）。

　物理ストレージの削減が大きな意味を持つのは明らかだ。もしプライマリストレージを90％削減できれば、大量のストレージアレイを導入している組織にとって膨大なコストの削減になる。

　だが残念ながら、現実はそれほど単純ではない。データ重複排除の利用ケースはバックアップには適しているが、プライマリストレージでは必ずしもうまくいくとは限らない。

　規模の大きいバックアップストリームと比べると、実際に動いているプライマリストレージのデータセットは規模がはるかに小さく、重複もずっと少ない。結果として、そのアルゴリズムで処理するデータの種類によっては、プライマリストレージの重複排除率は2対1という低さになることもある。

　だが、ある技術の企業導入が進むにつれて、プライマリストレージ重複排除のメリットが再浮上してきた。さらに、重複排除でコストが削減できれば、高コストのためにそれまで現実的ではなかったSSDの利用さえ、現実的になるかもしれない。

続きは「予算内でストレージを最大限に活用する方法」にて

予算内でストレージを最大限に活用する方法

ライマリストレージ重複排除を活用できる条件とは何か？　さらに、本PDFでは米Forresterのアナリストによるストレージの最新トレンド解説やVDI環境におけるプロビジョニング方法を紹介。

予算内でストレージを最大限に活用する方法のダウンロードページへ

TechTargetジャパントップサーバ＆ストレージ