Meta Platformsが開発したスーパーコンピュータ「AI Research SuperCluster」(RSC)は、同社のこれまでのシステムとどう違うのか。どのようなハードウェアで構成されているのか。
Meta Platforms(旧Facebook)は人工知能(AI)システム向けスーパーコンピュータ「AI Research SuperCluster」(RSC)を開発し、自社のサービス強化に取り組んでいる。
これまでMetaが使用していたシステムは、従来型のGPU(画像処理装置)クラスタを採用していた。GPUクラスタは、GPUを搭載したコンピュータ群から成るクラスタだ。「RSCによって、同社は大規模な次世代GPUクラスタを手に入れることになる」と、調査会社Gartnerでアナリストを務めるチラーグ・デケイト氏は指摘する。
「重要なのは、RSCが優れたGPU技術を組み合わせて使用していることだ」とデケイト氏は指摘する。RSCによって、Metaは「多様な使い方が可能なサービスやシステムの構築が可能になる」と同氏は考える。
2022年1月時点で、RSCはGPU搭載サーバ「NVIDIA DGX A100」760台から成り、計6080基のGPUを内包する。これらのGPUは、スイッチ「NVIDIA Quantum-2 InfiniBand」を使用して、通信速度200Gbpsのネットワーク経由で通信する。
RSCのストレージの構成および容量は以下の通りだ。
RSCは、Metaが使用している旧世代のデータセンターと比較して、さまざまな処理を高速に実行できるようになったという。Metaが実施したテストでは、
といった処理の実行速度を向上できた。
2022年1月時点のMetaでは、何十億個ものパラメーターを含む機械学習モデルのトレーニングに9週間かかっている。一方RSCでは、そのAIモデルのトレーニングが3週間で完了するとMetaは説明する。
運用環境ではテストされていないものの、公表時点でのRSCのコア数や通信速度などのスペックは、世界最速クラスのスーパーコンピュータに比肩する。「2022年中に計画通り完成した暁には、RSCは『世界最速のAIスーパーコンピュータ』になる」とMetaは主張する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
高齢男性はレジ待ちが苦手、女性は待たないためにアプリを活用――アイリッジ調査
実店舗を持つ企業が「アプリでどのようなユーザー体験を提供すべきか」を考えるヒントが...
IASがブランドセーフティーの計測を拡張 誤報に関するレポートを追加
IASは、ブランドセーフティーと適合性の計測ソリューションを拡張し、誤報とともに広告が...
【Googleが公式見解を発表】中古ドメインを絶対に使ってはいけない理由とは?
Googleが中古ドメインの不正利用を禁止を公式に発表しました。その理由や今後の対応につ...