2012年07月05日 09時00分 UPDATE
特集/連載

ホワイトペーパーレビュー重複排除の仕組みや導入効果が分かる3つのホワイトペーパー

データ量の増加に伴い、バックアップの処理遅延やストレージ容量、ネットワークへの負荷などが問題視されている。その解決策として注目されている重複排除技術に関する3つのコンテンツを紹介する。

[翁長 潤,TechTargetジャパン]

 これまでのバックアップは、定期的なフルバックアップと差分バックアップを併用する運用が一般的だった。しかし、データ増加に追い付かずに処理時間の遅延やストレージ容量、ネットワーク帯域の圧迫などが発生し、リソースの浪費やコストの増大などが問題視されている。この問題を解決する技術として注目されているのが「重複排除」だ。重複排除技術は文字通り、対象データを細分化して重複部分を取り除く技術である。重複技術を搭載した製品は多数登場しているが、製品によって重複排除の仕組みやアプローチが異なる。本稿では、重複排除技術の仕組みや導入効果が分かる3つのコンテンツを紹介する(関連記事:注目度の高い「データ重複排除」技術、その導入状況とは?)。

重複排除の種類や違いを分かりやすく解説

photo 提供:EMCジャパン(23分)

 このWebキャストではブロックレベルの重複排除の仕組みについて、一般的なファイル圧縮やファイルレベルの重複排除と比較しながら解説している。

 また、固定長分割方式と可変長分割方式のデータ圧縮効果を紹介。Webキャストによると、可変長分割方式を採用した方がデータ圧縮の効果が高いという。さらに、重複排除率が高くなる4つの条件を紹介している。

  1. フルバックアップの世代数が多い
  2. データの保存期間が長いデータを長期保存する
  3. 業務文書やプレゼンテーション、仮想サーバのイメージデータ
  4. データ更新率が低い

 加えて、重複排除処理のタイミング(インライン、ポストプロセス)や処理の実行環境(データソース、ターゲット)などの違いを解説し、効果的な重複排除バックアップを実施するには「既存のバックアップ環境の状況を把握すること」が前提にあるとしている。重複排除技術の基礎を理解したい方にお勧めのコンテンツだ。

シミュレーションによって導入効果を紹介

photo 提供:シマンテック(9分)

 重複排除バックアップの導入によって、ストレージ容量の大幅な節約、運用の効率化、コスト削減などの効果が期待できる。実際にどれくらい効果があるのか? このWebキャストでは、シマンテックのバックアップソフトウェア「Backup Exec 2010」の重複排除オプションを用いた2つの具体的なシナリオのシミュレーションによるコスト削減効果を紹介している。

シナリオ1

通常のバックアップと重複排除バックアップとのストレージ占有量の比較

バックアップ対象データの内、重複ブロックが5%ある

当初のバックアップ対象データは2Tバイト。年間データ増加率は約68%

日次の差分バックアップ、週次のフルバックアップ


 上記の条件で通常のバックアップと重複排除バックアップとのストレージ占有量を半年間の運用結果を比較すると、データ削減率は96%になるという。

シナリオ2

通常のバックアップと重複排除バックアップとのデータ転送量の比較

5つの拠点でバックアップ対象データの内、重複ブロックが5%ある

当初のバックアップ対象データは0.4Tバイト。年間データ増加率は約68%

日次の差分バックアップ、週次のフルバックアップ


 また、上記の条件で通常のバックアップと重複排除バックアップとの半年間のデータ転送量を比較すると、約62Tバイトの削減効果が出るという。重複排除バックアップの導入効果を試算する指標の1つになるだろう。

イメージバックアップにおける重複排除効果

photo 提供:アクロニス・ジャパン(16ページ)

 現在、システム障害発生時には迅速な復旧が求められている。リモートサイトのバックアップ環境でも重複排除技術の導入メリットは大きい。このホワイトペーパーでは、重複排除技術を活用したイメージバックアップの導入効果を紹介している。

 一般にイメージバックアップから作成される大部分のデータは重複しており、例えば、100台のWindowsサーバをバックアップする場合はOSに含まれる約2Gバイトのファイルがほぼ同一であるという。そのため、全てのサーバで最初のバックアップを実行すると、同一のファイルを100台分重複して保存することになる。

 また、全てのサーバに対して3回の完全バックアップを保持するポリシーを設定している場合、OSのバックアップだけでも必要なストレージ容量は約600Gバイトになる。そのうち、実際に必要な容量は2Gバイトだけであり、重複排除技術を活用すれば、残りの598Gバイト分のストレージを節約できる。

 今回紹介したホワイトペーパー以外にも、ホワイトペーパーダウンロードセンターでは、重複排除技術や搭載製品に関する技術文書や製品資料、事例紹介などを掲載している。ぜひダウンロードしてご活用いただきたい。

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news015.jpg

インターネットは信用できるのだろうか?
パーソナルデータのマーケティングへの利用を消費者はどう感じているか、ソーシャルログ...

news071.jpg

フィードフォース、セルフサービスでデータフィードの作成・管理が可能なプラットフォームを提供
フィードフォースは、データフィードの作成・管理・最適化を広告担当者自身で行うことの...

news081.jpg

Facebook広告にオフラインでの行動データを活用、アクシオムがデータ提供
フェイスブックジャパンとアクシオムジャパンは、アクシオムが提供するオフラインでの消...