検索
特集/連載

基礎から分かるバックアップ、「重複排除」「レプリケーション」「DR」を解説製品選定前に読んでおきたい基礎技術 バックアップ編【第3回】(1/2 ページ)

バックアップツールを用いれば、重複排除やレプリケーション、災害対策(DR)が可能だ。今後は、バックアップデータをビジネスに活用するためのデータの可視化が注目を集める。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 これまでの連載では、バックアップの必要性、種類、手法、機能について説明してきた。今回はツールを使った便利なバックアップの機能について紹介する。

これまでの連載

連載インデックス:製品選定前に読んでおきたい基礎技術 バックアップ編


1.バックアップ機能の要、重複排除

 バックアップツールを使ったバックアップで、ぜひ使いたいのが重複排除の機能だ。重複排除とは、バックアップデータ内の重複する部分を排除し、バックアップ容量を少なくする技術を指す。ストレージデバイス内に格納されているデータオブジェクト(ブロック、ファイル、チャンクと言った単位)のうち、重複して存在しているものを排除し、ユニークなデータオブジェクトのみを参照する技術だ(図1)。これにより、ストレージデバイスの使用容量を大きく削減できる。

図1
図1 重複排除の仕組み

 第1回でお伝えした通り、バックアップは多くの資源を使う。バックアップ容量が増えれば増えるほど資源を消費することとなり、コストに直結する。従ってバックアップ容量をいかに少なくするかは、バックアップにとって非常に重要なこととなる。バックアップデータは一般的に世代管理をすることがほとんどであり、冗長データが非常に多く存在する。重複排除をすると、環境によっては実データの10分の1程度まで容量を削減できる場合もある(図2)。

図2
図2 重複排除によってバックアップ容量を大幅に削減可能

 バックアップツールを用いた重複排除は、大きく2つの手法に分かれる。クライアント側、バックアップサーバ側のどちらで重複排除するかの違いだ(図3)。

図3
図3 重複排除の場所は大きく2種類(上がクライアント側、下がバックアップサーバ側)

 クライアント側で重複排除をする場合は、バックアップツールに付属するエージェントを導入するケースが多い。これによって転送するデータ容量が少なくなるメリットがある。バックアップ対象が多く、バックアップデータが多い環境であれば、ネットワーク帯域の考慮は必須だ。大規模環境で重複排除を行う場合は、こちらを選択する方がよいだろう。

 一方、バックアップサーバ側で重複排除を実行する場合は、クライアント側に掛かる負荷を少なくすることができる。しかしネットワーク帯域を削減することはできないので注意が必要だ。

 上記で説明したように、重複排除はバックアップツールの機能として提供されているが、最近は高機能なストレージ機器にも実装されるようになっている。本稿ではストレージ機器に関しては触れないが、参考までに「フラッシュデバイスはどういう仕組みで動くのか? 特徴的な2つの動作を解説」を参照いただきたい。

2.レプリケーションと災害対策(DR)

 次に、レプリケーションと災害対策(DR)について説明する。レプリケーションとはレプリカを作るという意味であり、バックアップデータの完全複製(コピー)を指す。非常にシンプルな機能であり、バックアップツールだけでなく、ストレージソフトウェアやデータベースソフトウェアなどもレプリケーション機能を提供している。

Copyright © ITmedia, Inc. All Rights Reserved.

       | 次のページへ
ページトップに戻る