2013年05月27日 08時00分 UPDATE
特集/連載

バックアップ以外にも有効プライマリストレージの重複排除が「使えるようになった」理由

ファイル共有などに使うプライマリストレージは、バックアップデータに比べて重複率が低く重複排除のメリットが少なかった。だが、最近はプライマリストレージでの重複排除が現実的になってきた。なぜか?

[Chris Evans,Computer Weekly]
Computer Weekly

 ストレージコストを削減したいと考える多くの組織にとって、検討すべき重要課題はディスクスペースの削減だ。データ重複排除はこの目標を念頭に、データバックアップなどの二次的なシステムに広く採用されてきた。しかし、プライマリストレージの重複排除はまだそのレベルの普及に至っていない。

 データ重複排除とは、ひとまとまりのデータの中で重複する部分を見つけて削除するプロセスをいう。圧縮の場合は余分なデータを削除してファイルのサイズを縮小するが、対象となるファイルの数を減らすことはしない。これに対してデータ重複排除はさらに幅広い観点から、より広範なデータセットで横断的にファイルあるいはファイル内のブロックを照らし合わせ、余分なものを排除する。

「予算内でストレージを最大限に活用する方法」無償ダウンロード

本稿は、PDFコンテンツ「製品導入ガイド」シリーズ第2弾、「予算内でストレージを最大限に活用する方法」の抄訳です。TechTarget会員であれば、無償でダウンロードできます。


 データ重複排除のハードウェア設定では、同じデータのコピーを保存するのではなく、アレイにメタデータとポインタを記録して、データのどのインスタンスが、既存の特定のインスタンスのどこにあるかを指し示す。

 同じ静的データを繰り返し保存するバックアップのようなインスタンスの場合、重複排除によって物理的なストレージ消費は10対1〜20対1という高い割合で削減できる(ディスクスペースはそれぞれ90%、95%の節減になる)。

 物理ストレージの削減が大きな意味を持つのは明らかだ。もしプライマリストレージを90%削減できれば、大量のストレージアレイを導入している組織にとって膨大なコストの削減になる。

 だが残念ながら、現実はそれほど単純ではない。データ重複排除の利用ケースはバックアップには適しているが、プライマリストレージでは必ずしもうまくいくとは限らない。

 規模の大きいバックアップストリームと比べると、実際に動いているプライマリストレージのデータセットは規模がはるかに小さく、重複もずっと少ない。結果として、そのアルゴリズムで処理するデータの種類によっては、プライマリストレージの重複排除率は2対1という低さになることもある。

 だが、ある技術の企業導入が進むにつれて、プライマリストレージ重複排除のメリットが再浮上してきた。さらに、重複排除でコストが削減できれば、高コストのためにそれまで現実的ではなかったSSDの利用さえ、現実的になるかもしれない。

続きは「予算内でストレージを最大限に活用する方法」にて

ライマリストレージ重複排除を活用できる条件とは何か? さらに、本PDFでは米Forresterのアナリストによるストレージの最新トレンド解説やVDI環境におけるプロビジョニング方法を紹介。

予算内でストレージを最大限に活用する方法のダウンロードページへ

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news026.jpg

2016「今年の○○」、“ほぼほぼ”納得のいく調査データまとめ
「2016年の○○」「今年の××」といったまとめ系調査が数多くリリースされる季節になり...

news106.jpg

コムニコ、企業やブランドのSNSアカウントに特化した投稿検索・分析ツールを提供
コムニコは、企業やブランドのSNSアカウントに特化した投稿検索・分析ツール「POST365」...

news025.jpg

博報堂とCCCマーケティング、Tカード会員1200万人分の実購買データに基づくリサーチパネル活用で協業
CCCマーケティング、博報堂、博報堂子会社の東京サーベイ・リサーチは業務提携を行い、T...