データ量の増加に伴い、バックアップの処理遅延やストレージ容量、ネットワークへの負荷などが問題視されている。その解決策として注目されている重複排除技術に関する3つのコンテンツを紹介する。
これまでのバックアップは、定期的なフルバックアップと差分バックアップを併用する運用が一般的だった。しかし、データ増加に追い付かずに処理時間の遅延やストレージ容量、ネットワーク帯域の圧迫などが発生し、リソースの浪費やコストの増大などが問題視されている。この問題を解決する技術として注目されているのが「重複排除」だ。重複排除技術は文字通り、対象データを細分化して重複部分を取り除く技術である。重複技術を搭載した製品は多数登場しているが、製品によって重複排除の仕組みやアプローチが異なる。本稿では、重複排除技術の仕組みや導入効果が分かる3つのコンテンツを紹介する(関連記事:注目度の高い「データ重複排除」技術、その導入状況とは?)。
このWebキャストではブロックレベルの重複排除の仕組みについて、一般的なファイル圧縮やファイルレベルの重複排除と比較しながら解説している。
また、固定長分割方式と可変長分割方式のデータ圧縮効果を紹介。Webキャストによると、可変長分割方式を採用した方がデータ圧縮の効果が高いという。さらに、重複排除率が高くなる4つの条件を紹介している。
加えて、重複排除処理のタイミング(インライン、ポストプロセス)や処理の実行環境(データソース、ターゲット)などの違いを解説し、効果的な重複排除バックアップを実施するには「既存のバックアップ環境の状況を把握すること」が前提にあるとしている。重複排除技術の基礎を理解したい方にお勧めのコンテンツだ。
重複排除バックアップの導入によって、ストレージ容量の大幅な節約、運用の効率化、コスト削減などの効果が期待できる。実際にどれくらい効果があるのか? このWebキャストでは、シマンテックのバックアップソフトウェア「Backup Exec 2010」の重複排除オプションを用いた2つの具体的なシナリオのシミュレーションによるコスト削減効果を紹介している。
バックアップ対象データの内、重複ブロックが5%ある
当初のバックアップ対象データは2Tバイト。年間データ増加率は約68%
日次の差分バックアップ、週次のフルバックアップ
上記の条件で通常のバックアップと重複排除バックアップとのストレージ占有量を半年間の運用結果を比較すると、データ削減率は96%になるという。
5つの拠点でバックアップ対象データの内、重複ブロックが5%ある
当初のバックアップ対象データは0.4Tバイト。年間データ増加率は約68%
日次の差分バックアップ、週次のフルバックアップ
また、上記の条件で通常のバックアップと重複排除バックアップとの半年間のデータ転送量を比較すると、約62Tバイトの削減効果が出るという。重複排除バックアップの導入効果を試算する指標の1つになるだろう。
現在、システム障害発生時には迅速な復旧が求められている。リモートサイトのバックアップ環境でも重複排除技術の導入メリットは大きい。このホワイトペーパーでは、重複排除技術を活用したイメージバックアップの導入効果を紹介している。
一般にイメージバックアップから作成される大部分のデータは重複しており、例えば、100台のWindowsサーバをバックアップする場合はOSに含まれる約2Gバイトのファイルがほぼ同一であるという。そのため、全てのサーバで最初のバックアップを実行すると、同一のファイルを100台分重複して保存することになる。
また、全てのサーバに対して3回の完全バックアップを保持するポリシーを設定している場合、OSのバックアップだけでも必要なストレージ容量は約600Gバイトになる。そのうち、実際に必要な容量は2Gバイトだけであり、重複排除技術を活用すれば、残りの598Gバイト分のストレージを節約できる。
今回紹介したホワイトペーパー以外にも、ホワイトペーパーダウンロードセンターでは、重複排除技術や搭載製品に関する技術文書や製品資料、事例紹介などを掲載している。ぜひダウンロードしてご活用いただきたい。
Copyright © ITmedia, Inc. All Rights Reserved.
HDDの容量が30TB超になると同時に、ストレージ技術はさまざまな進化を続けている。そうした中でもインタフェースに「SATA」(Serial ATA)を採用したHDDが変わらずに使われ続けている。なぜなのか。
カラオケ業界が直面するデータ増に対応すべく多くのストレージを試し続けた結果、4社27台の製品のメンテナンスに悩まされていたエクシング。この問題を解消すべく、同社は大容量かつコスト削減効果に優れた、新たなストレージを導入した。
メインフレームにおけるデータソート処理は、システム効率に大きく影響する。そこで、z/OSシステムおよびIBM Zメインフレーム上で稼働する、高パフォーマンスのソート/コピー/結合ソリューションを紹介する。
ECと通販システムを統合したパッケージの開発と導入を事業の柱とするエルテックスでは、事業の成長に伴いデータの容量を拡大する必要に迫られていた。そこでストレージを刷新してコスト削減や可用性の向上などさまざまな成果を得たという。
長年にわたり強力かつ安全な基盤であり続けてきたメインフレームシステム。しかし今では、クラウド戦略におけるボトルネックとなりつつある。ボトルネックの解消に向け、メインフレームを段階的にモダナイズするアプローチを解説する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...