次世代ストレージ階層化は使用頻度ではなくファイルサイズ基準今までのストレージ階層化は失敗?

Panasasがファイルサイズに基づくストレージ階層化を打ち出した。小さいサイズをSSD、大きいファイルをHDDに配置する方がパフォーマンスがいいという。使用頻度による階層化は過去のものになるのだろうか。

2020年10月09日 08時00分 公開
[Antony AdsheadComputer Weekly]

 階層型ストレージとは、メディアのコスト、つまりメディアのパフォーマンスに合わせてデータを配置することを意味する。従って、最も重要なデータは超高速のSSDに移動される。だが、本当にそれでよいのだろうか。

 PanasasはスケールアウトNASにファイルサイズに基づく階層化を追加したという。

 Panasasの「Dynamic Data Acceleration」はこの動きの一つで、小さなファイルにはSSDの速度、大きなファイルにはHDDの大量スループットを利用することで、ハイパフォーマンスコンピューティング(HPC)やAI(人工知能)など、多種多様なワークロードに適したストレージを顧客に提供することを狙いとする。

 Dynamic Data Accelerationは、さまざまなメディアにデータを階層化する。ただし、階層化を行うのは用途の特性によってではない。Panasasによると、ファイルサイズによる階層化はファイルシステムのライバルである「BeeGFS」「Lustre」「IBM Spectrum Scale」(旧称GPFS)に比べてGBps当たりのパフォーマンスが2倍優れているという。

会員登録(無料)が必要です

 この主張は直感にやや反するように思える。高いパフォーマンスを最も必要とするデータは最もパフォーマンスの高いストレージに格納したいと考えるためだ。

 だがPanasasは、高いパフォーマンスを実現するにはファイルサイズによる階層化が適切な方法だと確信している。

 Dynamic Data Accelerationでは、全てのメタデータを超高速のNVDIMM(不揮発性DIMM)に配置する。小さなファイルは遅延が少なく、帯域幅が広いSSDのファイルシステムにルーティングされ、大きなファイルは低コストで大容量のHDDにルーティングされる。「当社のアプローチはデータの使用状況によって階層化する方法よりも優れていると考えている」と話すのは、Panasasでシニアソフトウェアアーキテクトを務めるカーティス・アンダーソン氏だ。

 ファイルサイズは、HPCやAIのワークロード用のストレージに求められる重要な変数だというのが中心となる考え方だ。ファイルサイズが小さければ入出力(I/O)が重要になるため、SSDを利用してIOPSを高める必要がある。ファイルサイズが大きくなると、複数のHDDでPanasasの並列ファイルシステム「PanFS」が提供するシーケンシャルアクセスに委ねられる。

 「使用状況を基にデータを階層化する従来の方式は複雑になる可能性がある。階層と、階層間のデータを顧客が管理する必要があるためだ。結局は、ホットデータ(使用頻度の高いデータ)をパフォーマンスが高いメディアに配置し、コールドデータ(使用頻度の低いデータ)を低速のメディアに配置することになる。特定のアプリケーションを1週間使用しなければ、結果としてパフォーマンスの一貫性が低下することになる」とアンダーソン氏は話す。

 「サイズを基に階層化して結果としてHDDに配置されれば、HDDは常に高いパフォーマンスを提供する。それはHDDがそれぞれ180MBps実現し、できる限り効率良く使われるように設計されているからだ。各HDDがパフォーマンスに貢献し、コールド層に分離されることはない」と同氏は補足する。

 PanasasのSSDは500MBpsを実現する。だが、帯域幅ではなくIOPSを実現することを目標としている。

 使用状況に基づく階層化には、ホットデータストレージ層のサイズを常に作業セットと同じ大きさにしなければならないという問題点があるとPanasasは指摘する。同じ大きさにできなければ、コールド層のデータを待機させなければならない恐れがある。

 Dynamic Data Accelerationは、Panasasの「ActiveStor Ultra」スケールアウトNASノードで実行されるPanFSに搭載される。このノードには、4T~16TBの間でサイズを指定できる6台のHDD、顧客がサイズを変えられるSSD、NVMe層、NVDIMMストレージが搭載される。新しい階層化機能以外にも、ストレージメディアに関して以前よりも多くの選択肢が導入されている。

 対象となる重要なユースケースはHPCやAIなど、多数の変化するワークロードが想定されるケースだ。サイズによる階層化によって、こうしたワークロード全体で予測可能なパフォーマンスが得られるというのが同社の考えだ。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

製品資料 日立ヴァンタラ株式会社

生成AIのビジネス活用に向けて、基盤をオンプレミスに構築すべき理由

ビジネスの現場における生成AI需要の高まりに伴い、AIデータセンター市場も活性化している。生成AI基盤をクラウドに構築するケースとの比較を通じて、オンプレミスデータセンターを利用するメリットおよびその構築の勘所を解説する。

プレミアムコンテンツ アイティメディア株式会社

Intel沈没、“半導体の巨人”に何が起きているのか?

生成AIブームで盛り上がる半導体業界で、Intelの不振が目立っている。業績不振が続き、大規模な人員削減が進められている。同社に何が起きているのか。

技術文書・技術解説 アイティメディア広告企画

AI時代に高まるストレージの重要性――選ぶべきはSSDか? HDDか?

生成AIをはじめとしたAI技術の進化と活用拡大で、SSDやHDDといったストレージの重要性はますます高まっている。そんなAI時代のストレージには、SSD、HDDどちらを選べばよいのだろうか。

技術文書・技術解説 アイティメディア広告企画

最新インフラの導入/運用でAIプロジェクトを成功させるための勘所

企業がAIプロジェクトを進める際、その成功にはさまざまな要因が絡んでくる。インフラの導入/運用、予算や人材の配分、計画立案などだ。では、どうすればAIプロジェクトを破綻なく成功させることができるのか、その勘所とは。

製品資料 日本アイ・ビー・エム株式会社

「2025年の崖」の先へ、2027年のチェックポイントを通過するためのAI活用法とは

「2025年の崖」として不安視されたレガシーシステムや人材不足の問題は、2025年を迎えた今、解消に向かいつつあるという。その理由とともに、次のチェックポイントとなるだろう2027年に向けて取り組みたいAI活用のポイントを解説する。

アイティメディアからのお知らせ

From Informa TechTarget

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...