「SSDのデータ削減」を知らないのは非常識? Dell、HPE製品に学ぶその仕組みストレージコストの賢い圧縮方法【第4回】

SSDの普及とともに、企業のデータセンターにおける利用が広がってきたストレージのデータ削減。どのような仕組みでメリットが得られるのか。主要ストレージ製品で紹介する。

2023年06月05日 05時00分 公開
[Robert SheldonTechTarget]

 SSDのデータ削減は、企業向けのストレージにおいては、もはや常識と言っていい機能だ。ただしその仕組みは、ストレージ製品によって異なる場合がある。どのようにしてデータ削減のメリットが得られるのか。主要ストレージ製品を例に見てみよう。

もう常識の「SSDのデータ削減」はこう機能する

Dell Unityシリーズ

 Dell Technologiesの「Dell Unity」シリーズには、データ圧縮と重複排除によるデータ削減機能を有するオールフラッシュストレージ(SSDのみで構成するストレージアレイ)がある。そのデータ削減機能においては、まずデータを8KBのブロック(格納するデータの単位)に分割し、重複排除のアルゴリズムを介して、ブロックごとに重複するデータのパターンを探す。

 重複のパターンがある場合は、該当するブロックを排除してSSDに書き込む。重複のパターンが見つからない場合、データを別のアルゴリズムに渡し、各ブロックのフィンガープリント(データの識別情報)を作成して重複するデータを特定する。その後、データを圧縮のアルゴリズムに渡し、適用可能な部分にのみ圧縮を適用する。

 これらのデータ削減機能は、ストレージに書き込む前に処理を実行するインラインの方式となる。

HPE 3PAR StoreServシリーズ

 HPE(Hewlett Packard Enterprise)の「HPE 3PAR StoreServ」シリーズにも、インライン方式の重複排除とデータ圧縮の機能を備えるオールフラッシュストレージがある。以下のデータ削減機能を持っていることが特徴だ。

  • シンプロビジョニング(Thin Provisioning)
    • 使用する容量を仮想的に割り当て
  • シンコンバージョン(Thin Conversion)
    • データ移行時にデータを圧縮
  • シンパーシステンス(Thin Persistence)
    • 空いた容量を再利用

 圧縮したデータを完全に元の状態に復元する「可逆圧縮」のアルゴリズムは、NAND型フラッシュメモリの固有のブロックサイズで動作できる。圧縮できないデータを特定した場合は、そのデータにも圧縮のプロセスを適用するのではなく、そのままの形式でストレージに格納することでCPUの無駄なリソース消費を回避する。


 第5回は、Pure StorageとVast Dataの製品を紹介する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

ITmedia マーケティング新着記事

news061.jpg

マーケターの87%は自分の仕事が生成AIなどのテクノロジーに取って代わられることを懸念――Gartner調査
Gartnerがマーケティング人材に関する調査を実施。環境的不確実性と技術的複雑性の中で、...

news058.jpg

Z世代が旅に求める「令和的非日常」とは?
JTBコミュニケーションデザインと伊藤忠ファッションシステムが、Z世代の旅に関する意識...

news094.jpg

電通が「AI×クリエイティブ」の強みを生かしたビジネスコンサルティングサービスを提供開始
電通は「AI×クリエイティブ」で企業の事業やサービスの開発を支援する新サービス「AIQQQ...