2013年05月27日 08時00分 UPDATE
特集/連載

バックアップ以外にも有効プライマリストレージの重複排除が「使えるようになった」理由

ファイル共有などに使うプライマリストレージは、バックアップデータに比べて重複率が低く重複排除のメリットが少なかった。だが、最近はプライマリストレージでの重複排除が現実的になってきた。なぜか?

[Chris Evans,Computer Weekly]
Computer Weekly

 ストレージコストを削減したいと考える多くの組織にとって、検討すべき重要課題はディスクスペースの削減だ。データ重複排除はこの目標を念頭に、データバックアップなどの二次的なシステムに広く採用されてきた。しかし、プライマリストレージの重複排除はまだそのレベルの普及に至っていない。

 データ重複排除とは、ひとまとまりのデータの中で重複する部分を見つけて削除するプロセスをいう。圧縮の場合は余分なデータを削除してファイルのサイズを縮小するが、対象となるファイルの数を減らすことはしない。これに対してデータ重複排除はさらに幅広い観点から、より広範なデータセットで横断的にファイルあるいはファイル内のブロックを照らし合わせ、余分なものを排除する。

「予算内でストレージを最大限に活用する方法」無償ダウンロード

本稿は、PDFコンテンツ「製品導入ガイド」シリーズ第2弾、「予算内でストレージを最大限に活用する方法」の抄訳です。TechTarget会員であれば、無償でダウンロードできます。


 データ重複排除のハードウェア設定では、同じデータのコピーを保存するのではなく、アレイにメタデータとポインタを記録して、データのどのインスタンスが、既存の特定のインスタンスのどこにあるかを指し示す。

 同じ静的データを繰り返し保存するバックアップのようなインスタンスの場合、重複排除によって物理的なストレージ消費は10対1〜20対1という高い割合で削減できる(ディスクスペースはそれぞれ90%、95%の節減になる)。

 物理ストレージの削減が大きな意味を持つのは明らかだ。もしプライマリストレージを90%削減できれば、大量のストレージアレイを導入している組織にとって膨大なコストの削減になる。

 だが残念ながら、現実はそれほど単純ではない。データ重複排除の利用ケースはバックアップには適しているが、プライマリストレージでは必ずしもうまくいくとは限らない。

 規模の大きいバックアップストリームと比べると、実際に動いているプライマリストレージのデータセットは規模がはるかに小さく、重複もずっと少ない。結果として、そのアルゴリズムで処理するデータの種類によっては、プライマリストレージの重複排除率は2対1という低さになることもある。

 だが、ある技術の企業導入が進むにつれて、プライマリストレージ重複排除のメリットが再浮上してきた。さらに、重複排除でコストが削減できれば、高コストのためにそれまで現実的ではなかったSSDの利用さえ、現実的になるかもしれない。

続きは「予算内でストレージを最大限に活用する方法」にて

ライマリストレージ重複排除を活用できる条件とは何か? さらに、本PDFでは米Forresterのアナリストによるストレージの最新トレンド解説やVDI環境におけるプロビジョニング方法を紹介。

予算内でストレージを最大限に活用する方法のダウンロードページへ

この記事が気に入ったらTechTargetジャパンに「いいね!」しよう

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news027.jpg

インターネット広告PMP取引市場規模、2021年には約3倍に――サイバーエージェント子会社が予測
サイバーエージェント子会社のAJAは国内PMPの市場動向調査を実施。その結果を発表した。

news025.jpg

電通ダイレクトフォース、コマース機能付きインタラクティブ動画を制作できる「EICHI ビデオコマース」を提供
電通ダイレクトフォースは、コマース機能を実装したインタラクティブ動画を制作・配信で...

news019.jpg

電通など3社、Instagram動画広告の制作・配信ソリューションを提供
電通デジタルと電通、TWIN PLANETの3社は、「Instagram」の動画広告を制作・配信するソリ...