次世代ストレージ階層化は使用頻度ではなくファイルサイズ基準今までのストレージ階層化は失敗?

Panasasがファイルサイズに基づくストレージ階層化を打ち出した。小さいサイズをSSD、大きいファイルをHDDに配置する方がパフォーマンスがいいという。使用頻度による階層化は過去のものになるのだろうか。

2020年10月09日 08時00分 公開
[Antony AdsheadComputer Weekly]

 階層型ストレージとは、メディアのコスト、つまりメディアのパフォーマンスに合わせてデータを配置することを意味する。従って、最も重要なデータは超高速のSSDに移動される。だが、本当にそれでよいのだろうか。

 PanasasはスケールアウトNASにファイルサイズに基づく階層化を追加したという。

 Panasasの「Dynamic Data Acceleration」はこの動きの一つで、小さなファイルにはSSDの速度、大きなファイルにはHDDの大量スループットを利用することで、ハイパフォーマンスコンピューティング(HPC)やAI(人工知能)など、多種多様なワークロードに適したストレージを顧客に提供することを狙いとする。

 Dynamic Data Accelerationは、さまざまなメディアにデータを階層化する。ただし、階層化を行うのは用途の特性によってではない。Panasasによると、ファイルサイズによる階層化はファイルシステムのライバルである「BeeGFS」「Lustre」「IBM Spectrum Scale」(旧称GPFS)に比べてGBps当たりのパフォーマンスが2倍優れているという。

 この主張は直感にやや反するように思える。高いパフォーマンスを最も必要とするデータは最もパフォーマンスの高いストレージに格納したいと考えるためだ。

 だがPanasasは、高いパフォーマンスを実現するにはファイルサイズによる階層化が適切な方法だと確信している。

 Dynamic Data Accelerationでは、全てのメタデータを超高速のNVDIMM(不揮発性DIMM)に配置する。小さなファイルは遅延が少なく、帯域幅が広いSSDのファイルシステムにルーティングされ、大きなファイルは低コストで大容量のHDDにルーティングされる。「当社のアプローチはデータの使用状況によって階層化する方法よりも優れていると考えている」と話すのは、Panasasでシニアソフトウェアアーキテクトを務めるカーティス・アンダーソン氏だ。

 ファイルサイズは、HPCやAIのワークロード用のストレージに求められる重要な変数だというのが中心となる考え方だ。ファイルサイズが小さければ入出力(I/O)が重要になるため、SSDを利用してIOPSを高める必要がある。ファイルサイズが大きくなると、複数のHDDでPanasasの並列ファイルシステム「PanFS」が提供するシーケンシャルアクセスに委ねられる。

 「使用状況を基にデータを階層化する従来の方式は複雑になる可能性がある。階層と、階層間のデータを顧客が管理する必要があるためだ。結局は、ホットデータ(使用頻度の高いデータ)をパフォーマンスが高いメディアに配置し、コールドデータ(使用頻度の低いデータ)を低速のメディアに配置することになる。特定のアプリケーションを1週間使用しなければ、結果としてパフォーマンスの一貫性が低下することになる」とアンダーソン氏は話す。

 「サイズを基に階層化して結果としてHDDに配置されれば、HDDは常に高いパフォーマンスを提供する。それはHDDがそれぞれ180MBps実現し、できる限り効率良く使われるように設計されているからだ。各HDDがパフォーマンスに貢献し、コールド層に分離されることはない」と同氏は補足する。

 PanasasのSSDは500MBpsを実現する。だが、帯域幅ではなくIOPSを実現することを目標としている。

 使用状況に基づく階層化には、ホットデータストレージ層のサイズを常に作業セットと同じ大きさにしなければならないという問題点があるとPanasasは指摘する。同じ大きさにできなければ、コールド層のデータを待機させなければならない恐れがある。

 Dynamic Data Accelerationは、Panasasの「ActiveStor Ultra」スケールアウトNASノードで実行されるPanFSに搭載される。このノードには、4T〜16TBの間でサイズを指定できる6台のHDD、顧客がサイズを変えられるSSD、NVMe層、NVDIMMストレージが搭載される。新しい階層化機能以外にも、ストレージメディアに関して以前よりも多くの選択肢が導入されている。

 対象となる重要なユースケースはHPCやAIなど、多数の変化するワークロードが想定されるケースだ。サイズによる階層化によって、こうしたワークロード全体で予測可能なパフォーマンスが得られるというのが同社の考えだ。

ITmedia マーケティング新着記事

news149.jpg

最も利用率の高いショート動画サービスはTikTokではない?
ADKマーケティング・ソリューションズは、ショート動画に関する調査結果を発表しました。

news131.jpg

古くて新しいMMM(マーケティングミックスモデリング)が今注目される理由
大手コスメブランドのEstee Lauder Companiesはブランドマーケティングとパフォーマンス...

news087.png

Yahoo!広告 検索広告、生成AIがタイトルや説明文を提案してくれる機能を無料で提供
LINEヤフーは「Yahoo!広告 検索広告」において、ユーザーが誘導先サイトのURLを入力する...