次世代ストレージ階層化は使用頻度ではなくファイルサイズ基準今までのストレージ階層化は失敗?

Panasasがファイルサイズに基づくストレージ階層化を打ち出した。小さいサイズをSSD、大きいファイルをHDDに配置する方がパフォーマンスがいいという。使用頻度による階層化は過去のものになるのだろうか。

2020年10月09日 08時00分 公開
[Antony AdsheadComputer Weekly]

 階層型ストレージとは、メディアのコスト、つまりメディアのパフォーマンスに合わせてデータを配置することを意味する。従って、最も重要なデータは超高速のSSDに移動される。だが、本当にそれでよいのだろうか。

 PanasasはスケールアウトNASにファイルサイズに基づく階層化を追加したという。

 Panasasの「Dynamic Data Acceleration」はこの動きの一つで、小さなファイルにはSSDの速度、大きなファイルにはHDDの大量スループットを利用することで、ハイパフォーマンスコンピューティング(HPC)やAI(人工知能)など、多種多様なワークロードに適したストレージを顧客に提供することを狙いとする。

 Dynamic Data Accelerationは、さまざまなメディアにデータを階層化する。ただし、階層化を行うのは用途の特性によってではない。Panasasによると、ファイルサイズによる階層化はファイルシステムのライバルである「BeeGFS」「Lustre」「IBM Spectrum Scale」(旧称GPFS)に比べてGBps当たりのパフォーマンスが2倍優れているという。

 この主張は直感にやや反するように思える。高いパフォーマンスを最も必要とするデータは最もパフォーマンスの高いストレージに格納したいと考えるためだ。

 だがPanasasは、高いパフォーマンスを実現するにはファイルサイズによる階層化が適切な方法だと確信している。

 Dynamic Data Accelerationでは、全てのメタデータを超高速のNVDIMM(不揮発性DIMM)に配置する。小さなファイルは遅延が少なく、帯域幅が広いSSDのファイルシステムにルーティングされ、大きなファイルは低コストで大容量のHDDにルーティングされる。「当社のアプローチはデータの使用状況によって階層化する方法よりも優れていると考えている」と話すのは、Panasasでシニアソフトウェアアーキテクトを務めるカーティス・アンダーソン氏だ。

 ファイルサイズは、HPCやAIのワークロード用のストレージに求められる重要な変数だというのが中心となる考え方だ。ファイルサイズが小さければ入出力(I/O)が重要になるため、SSDを利用してIOPSを高める必要がある。ファイルサイズが大きくなると、複数のHDDでPanasasの並列ファイルシステム「PanFS」が提供するシーケンシャルアクセスに委ねられる。

 「使用状況を基にデータを階層化する従来の方式は複雑になる可能性がある。階層と、階層間のデータを顧客が管理する必要があるためだ。結局は、ホットデータ(使用頻度の高いデータ)をパフォーマンスが高いメディアに配置し、コールドデータ(使用頻度の低いデータ)を低速のメディアに配置することになる。特定のアプリケーションを1週間使用しなければ、結果としてパフォーマンスの一貫性が低下することになる」とアンダーソン氏は話す。

 「サイズを基に階層化して結果としてHDDに配置されれば、HDDは常に高いパフォーマンスを提供する。それはHDDがそれぞれ180MBps実現し、できる限り効率良く使われるように設計されているからだ。各HDDがパフォーマンスに貢献し、コールド層に分離されることはない」と同氏は補足する。

 PanasasのSSDは500MBpsを実現する。だが、帯域幅ではなくIOPSを実現することを目標としている。

 使用状況に基づく階層化には、ホットデータストレージ層のサイズを常に作業セットと同じ大きさにしなければならないという問題点があるとPanasasは指摘する。同じ大きさにできなければ、コールド層のデータを待機させなければならない恐れがある。

 Dynamic Data Accelerationは、Panasasの「ActiveStor Ultra」スケールアウトNASノードで実行されるPanFSに搭載される。このノードには、4T~16TBの間でサイズを指定できる6台のHDD、顧客がサイズを変えられるSSD、NVMe層、NVDIMMストレージが搭載される。新しい階層化機能以外にも、ストレージメディアに関して以前よりも多くの選択肢が導入されている。

 対象となる重要なユースケースはHPCやAIなど、多数の変化するワークロードが想定されるケースだ。サイズによる階層化によって、こうしたワークロード全体で予測可能なパフォーマンスが得られるというのが同社の考えだ。

Copyright © ITmedia, Inc. All Rights Reserved.

譁ー逹€繝帙Ρ繧、繝医�繝シ繝代�

製品資料 エヌアイシー・パートナーズ株式会社

コンテナ基盤を最短4時間で構築、AI時代に最適な次世代データ基盤の実力とは?

AIなどによるデータドリブンなアプローチが主流となり、データ基盤にはコンテナネイティブな環境への対応が求められている。こうした中、コンテナ基盤を最短4時間で構築でき、大幅なコスト削減も期待できる、次世代データ基盤が登場した。

プレミアムコンテンツ アイティメディア株式会社

大容量SSDが“100TB超え”でHDDを置き去りにした日

SSDは高速なだけでなく、大容量化でもHDDを凌駕(りょうが)し始めている。100TB超のSSDが登場する今、ストレージ選定の常識はどう変わるのか。

製品資料 株式会社ネットワールド

すぐ役立つ&初めてでも安心 「NetAppの教科書」決定版

データ環境の急変は、企業のストレージ課題を複雑化させている。性能や拡張性、データ保護、分散環境の一元管理、コスト最適化など、自社の課題に合わせた製品・サービスをどう見つければよいのか。それに役立つ製品ガイドを紹介したい。

技術文書・技術解説 エフサステクノロジーズ株式会社

フラッシュアレイ選びのヒント:最小限のダウンタイムでデータ移行できる製品は

フラッシュアレイ導入を検討する際、既存のリモートストレージデバイスからのデータインポートは気になる点の1つだ。そこで本資料では、最小限のダウンタイムでデータ移行できるフラッシュアレイ/ハイブリッドアレイ製品を紹介する。

製品資料 エフサステクノロジーズ株式会社

初級解説:中小規模向け「フルSSD」&「ハイブリッドストレージ」の実力

近年、企業に蓄積されるデータが爆発的に増加しており、新たなストレージシステムへのニーズが高まっている。そこで、中小規模のニーズをカバーする、フルSSDおよびSSD/HDDハイブリッドのシンプルなブロックストレージを紹介する。

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...