検索
ニュース

「データ爆発」に挑むJAXA 容量2倍、30%圧縮のストレージ刷新術宇宙開発で増え続けるデータ

「データは増え続けるが予算と設置場所には限りがある」問題は、IT部門の悩みの種だ。この“あるある”な課題に対し、性能を維持しつつ容量を倍増させ、データ量を3割削減したJAXAのストレージ刷新事例を紹介する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

関連キーワード

データ | Dell(デル) | ストレージ


 「ファイルサーバの空き容量が足りない」「特定のフォルダにアクセスが集中して遅い」――。これらはIT担当者を悩ませる日常的な課題だ。DX(デジタルトランスフォーメーション)やAI(人工知能)技術活用の推進が求められる中、企業が抱えるデータは増え続けている。一方で、それを保管するための潤沢なストレージに予算を割ける企業は限られている。

 日本の宇宙開発を担う国立研究開発法人宇宙航空研究開発機構(JAXA)の宇宙科学研究所(ISAS)も、同様のジレンマに直面していた。科学衛星や探査機の高性能化に伴って受信データが高解像度化しており、1日当たり数GB単位で蓄積される。従来のシステムでは、長期保存や外部公開時のアクセス集中によるレスポンス低下が懸念される状況だった。

 この課題に対し、ISASはITインフラの刷新を決断した。それによって従来の処理性能を維持しながらストレージ容量を2倍以上に拡張し、実データ容量を約30%削減することに成功した。限られた予算と設置スペースの中で、単なる容量拡張にとどまらず、突発的なアクセス集中をさばき、費用対効果を最大化できるストレージシステムをいかにして構築したのか。

「ただ足すだけ」では解決しない ボトルネックをどう特定した?

 システム刷新に先立ち、ISASはDell Technologiesと共同で既存ストレージの利用実態を調査した。その結果、突発的な高負荷のほとんどが、特定のデータに対する「読み取り(リード)処理」に集中していることが明らかになった。

 この分析結果に基づき、ISASは単に高性能なストレージを並べるのではなく、役割の異なるノード(サーバ)を組み合わせる「階層化構成」を選択した。採用したのは、スケールアウト型NAS「Dell PowerScale」シリーズだ。スケールアウト型NASとは、データ量の増加に合わせて容量と処理能力を拡張できるNASだ。具体的には、以下の2種を組み合わせている。

  • Dell PowerScale A3000シリーズ
    • 大容量データを保存するアーカイブ用ノード。
  • Dell PowerScale P100
    • 読み取り処理を高速化するアクセラレータノード。

 Dell PowerScale P100は、一度読み込まれたデータをキャッシュ(一時保存領域)に蓄積する役割を担う。全てのデータに対して高価な高性能ストレージを用意するのではなく、「よく読まれるデータ」だけをDell PowerScale P100のキャッシュに載せるという構成だ。これによって、特定データへのアクセスが集中してもレスポンス速度を維持しながら、ストレージ本体への負荷を大幅に軽減できるようになった。性能と費用のバランスを最適化した構成となっている。

 データ容量の削減には、Dell PowerScaleが搭載する重複排除・圧縮機能「SmartDedupe」を活用している。実データ容量に対して約30%の削減効果を上げており、増え続ける宇宙データの効率的な管理と費用の抑制を同時に実現した。

 運用面では、クオータ管理機能「SmartQuotas」を用いて各研究プロジェクトに適切な容量を割り当て、パフォーマンス監視ツール「PowerScale InsightIQ」で稼働状況を監視する体制を整えた。複数ノードが同時にダウンしても稼働を継続できるデータ保護機能によって、インフラとしての信頼性も高めている。

 ISASの中平聡志氏(科学衛星運用・データ利用ユニット 主任研究開発員)は、全体的な費用を抑えつつニーズに合致した仕組みが実現できたと評価する。今後はこのシステムを科学衛星データのアーカイブや公開に活用する他、生成AIの利用も視野に入れている。膨大な観測データをAIモデルが学習、分析することで、これまで想像もしなかった研究成果が生まれることが期待される。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る