AIワークロードを動かすためのネットワークをどのように再設計すべきかについて、企業は頭を悩ませている。AIインフラのネットワーク運用のヒントを、Gartnerの提言を基に解説する。
CPUベースの汎用(はんよう)コンピューティング環境では、リーフ/スパイン型のネットワークトポロジー(構成)が広く採用されてきた。しかし、この構成は必ずしもAIワークロードに最適とは言えない。
既存のデータセンターネットワークでAIワークロードを稼働させると、いわゆる「うるさい隣人」(ノイジーネイバー)問題が生じるリスクがある。これにより、AIワークロードと既存ワークロードの双方で処理遅延やジョブ完了の遅れが生じ、データセンター全体の処理効率やサービス品質が大きく損なわれかねない。こうしたリスクを回避し、GPUの利用に最適化されたネットワーク技術を選ぶには、どのようなポイントに着目すればいいのか。
一般的に、AIインフラの構築において、ネットワークスイッチが占めるコストは全体の15%以下だ。そのため、既存スイッチを流用して短期的にコストを抑えるよりも、GPU向けに最適化された専用スイッチに投資する方が長期的な費用対効果は高くなる。
こうした背景から、調査会社Gartnerは以下のように提言する。
特にイーサネットを導入する場合には、以下の要件を満たす専用スイッチを採用すべきだという。
AIワークロード向けネットワークでは、データフローを特定経路に固定する「静的ピニング」により、通信速度や応答時間を安定させることができる。一方で、その運用には高度な監視体制が欠かせず、管理層に以下のような機能が必要となる。
米国Informa TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...