Panasasがファイルサイズに基づくストレージ階層化を打ち出した。小さいサイズをSSD、大きいファイルをHDDに配置する方がパフォーマンスがいいという。使用頻度による階層化は過去のものになるのだろうか。
階層型ストレージとは、メディアのコスト、つまりメディアのパフォーマンスに合わせてデータを配置することを意味する。従って、最も重要なデータは超高速のSSDに移動される。だが、本当にそれでよいのだろうか。
PanasasはスケールアウトNASにファイルサイズに基づく階層化を追加したという。
Panasasの「Dynamic Data Acceleration」はこの動きの一つで、小さなファイルにはSSDの速度、大きなファイルにはHDDの大量スループットを利用することで、ハイパフォーマンスコンピューティング(HPC)やAI(人工知能)など、多種多様なワークロードに適したストレージを顧客に提供することを狙いとする。
Dynamic Data Accelerationは、さまざまなメディアにデータを階層化する。ただし、階層化を行うのは用途の特性によってではない。Panasasによると、ファイルサイズによる階層化はファイルシステムのライバルである「BeeGFS」「Lustre」「IBM Spectrum Scale」(旧称GPFS)に比べてGBps当たりのパフォーマンスが2倍優れているという。
この主張は直感にやや反するように思える。高いパフォーマンスを最も必要とするデータは最もパフォーマンスの高いストレージに格納したいと考えるためだ。
だがPanasasは、高いパフォーマンスを実現するにはファイルサイズによる階層化が適切な方法だと確信している。
Dynamic Data Accelerationでは、全てのメタデータを超高速のNVDIMM(不揮発性DIMM)に配置する。小さなファイルは遅延が少なく、帯域幅が広いSSDのファイルシステムにルーティングされ、大きなファイルは低コストで大容量のHDDにルーティングされる。「当社のアプローチはデータの使用状況によって階層化する方法よりも優れていると考えている」と話すのは、Panasasでシニアソフトウェアアーキテクトを務めるカーティス・アンダーソン氏だ。
ファイルサイズは、HPCやAIのワークロード用のストレージに求められる重要な変数だというのが中心となる考え方だ。ファイルサイズが小さければ入出力(I/O)が重要になるため、SSDを利用してIOPSを高める必要がある。ファイルサイズが大きくなると、複数のHDDでPanasasの並列ファイルシステム「PanFS」が提供するシーケンシャルアクセスに委ねられる。
「使用状況を基にデータを階層化する従来の方式は複雑になる可能性がある。階層と、階層間のデータを顧客が管理する必要があるためだ。結局は、ホットデータ(使用頻度の高いデータ)をパフォーマンスが高いメディアに配置し、コールドデータ(使用頻度の低いデータ)を低速のメディアに配置することになる。特定のアプリケーションを1週間使用しなければ、結果としてパフォーマンスの一貫性が低下することになる」とアンダーソン氏は話す。
「サイズを基に階層化して結果としてHDDに配置されれば、HDDは常に高いパフォーマンスを提供する。それはHDDがそれぞれ180MBps実現し、できる限り効率良く使われるように設計されているからだ。各HDDがパフォーマンスに貢献し、コールド層に分離されることはない」と同氏は補足する。
PanasasのSSDは500MBpsを実現する。だが、帯域幅ではなくIOPSを実現することを目標としている。
使用状況に基づく階層化には、ホットデータストレージ層のサイズを常に作業セットと同じ大きさにしなければならないという問題点があるとPanasasは指摘する。同じ大きさにできなければ、コールド層のデータを待機させなければならない恐れがある。
Dynamic Data Accelerationは、Panasasの「ActiveStor Ultra」スケールアウトNASノードで実行されるPanFSに搭載される。このノードには、4T~16TBの間でサイズを指定できる6台のHDD、顧客がサイズを変えられるSSD、NVMe層、NVDIMMストレージが搭載される。新しい階層化機能以外にも、ストレージメディアに関して以前よりも多くの選択肢が導入されている。
対象となる重要なユースケースはHPCやAIなど、多数の変化するワークロードが想定されるケースだ。サイズによる階層化によって、こうしたワークロード全体で予測可能なパフォーマンスが得られるというのが同社の考えだ。
Copyright © ITmedia, Inc. All Rights Reserved.
ビジネスの現場における生成AI需要の高まりに伴い、AIデータセンター市場も活性化している。生成AI基盤をクラウドに構築するケースとの比較を通じて、オンプレミスデータセンターを利用するメリットおよびその構築の勘所を解説する。
生成AIブームで盛り上がる半導体業界で、Intelの不振が目立っている。業績不振が続き、大規模な人員削減が進められている。同社に何が起きているのか。
生成AIをはじめとしたAI技術の進化と活用拡大で、SSDやHDDといったストレージの重要性はますます高まっている。そんなAI時代のストレージには、SSD、HDDどちらを選べばよいのだろうか。
企業がAIプロジェクトを進める際、その成功にはさまざまな要因が絡んでくる。インフラの導入/運用、予算や人材の配分、計画立案などだ。では、どうすればAIプロジェクトを破綻なく成功させることができるのか、その勘所とは。
「2025年の崖」として不安視されたレガシーシステムや人材不足の問題は、2025年を迎えた今、解消に向かいつつあるという。その理由とともに、次のチェックポイントとなるだろう2027年に向けて取り組みたいAI活用のポイントを解説する。
「次世代IAサーバ」はどこまで進化したのか? (2025/7/9)
製造や医療で注目の「エッジAI」、産業用コンピュータにいま必要な技術とは (2025/5/23)
クラウド全盛期になぜ「テープ」が再注目? データ管理の最前線を探る (2025/4/24)
データの多様化と肥大化が加速 ファイルサーバ運用は限界? 見直しのポイント (2025/4/8)
Hyper-Vは「次の仮想化基盤」になり得るのか 有識者の本音を聞く (2025/3/14)
なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...