2019年08月26日 08時00分 公開
特集/連載

AIとストレージ【後編】AI用ストレージに必要なのは単なる「速さ」ではない

AI用のストレージ要件はフェーズやユースケースによって変化する。要求される速度にも種類があり、場合によっては速度が重要ではないこともある。学習時と推論時でも要件は大きく異なる。

[Stephen Pritchard,Computer Weekly]

 前編(Computer Weekly日本語版 8月7日号掲載)では、AIを構築するに当たって求められるストレージの要件を検討した。AIシステムでは何を保存する必要があり、どのようなアクセスが発生するのか。

 後編では、AIシステムのフェーズごとに異なるストレージのI/O特性、NVMeやクラウド利用の可能性について解説する。

最適なメディア、NVMe

 PA Consulting Groupのマコーレー氏は次のように語っている。「SSDを適切に利用することが、とてつもなく大きなメリットをもたらす。つまり、どのファイルシステムを使うか、そのファイルシステムをどのように最適化するか、そして(市販の)ストレージハードウェアを最大限に活用するためにアクセラレーターが必要かどうかになる。アクセラレーターはデータ管理とファイルシステムに多くの力を注ぐ」

 現在はフラッシュストレージが一般的になっている。さらに、GPUの近くに格納するデータへの高速アクセスが必要なアプリケーションに最適なメディアとして、NVMeフラッシュも浮上している。HDDも依然存在するが、低層の大容量ストレージに追いやられることが増えている。

 AIシステムにはIOPSパフォーマンスの高いストレージが必要だと誤解されることが多いが、実際に重要なのはランダムI/Oの処理能力だ。

AIの各フェーズとI/Oのニーズ

 AIのストレージとI/Oの要件は、ライフサイクルの中で変化する。

 一般的なAIシステムはトレーニングが必要で、そのフェーズではI/O処理が特に多くなる。ここで役立つのはフラッシュやNVMeだ。だが「推論」フェーズでは演算リソースの利用が多くなるだろう。

 ディープラーニングシステムには動作しながら自身を再トレーニングする機能があるため、データへの継続的なアクセスが必要になる。ここで多くの企業が勘違いする。




続きを読むには、[続きを読む]ボタンを押して
会員登録あるいはログインしてください。






ITmedia マーケティング新着記事

news108.jpg

外出自粛でテレビ視聴時間の伸び率が最も大きいのは20〜24歳――スイッチ・メディア・ラボ調査
新型コロナウイルス感染拡大による生活の変化はテレビの視聴時間にどう影響したのでしょ...

news007.jpg

データに基づく意思決定ができる企業の組織と文化
アナリティクスとデータ活用の将来を左右する主要トレンドを分析したTableau Softwareの...

news149.jpg

コロナ禍の生活自由度、普段の暮らしを100点とすると54.3点――博報堂生活総合研究所調査
「第1回 新型コロナウイルスに関する生活者調査」(2020年4月)の結果です。