AI処理の“爆速化”に欠かせない「ネットワークの重要技術」はこれだAIに必要なネットワーク【後編】

データセンターネットワークの性能はAIの処理能力に影響を直接与える。AIの処理能力を高速化するためのネットワークの設計のポイントや技術を紹介する。

2024年08月01日 07時00分 公開
[Andrew FroehlichTechTarget]

 人工知能(AI)技術を活用する企業が増加傾向にある。AIワークロード(AI技術を組み込んだシステム)を処理するデータセンターでは、AI技術を活用するための効率的なアーキテクチャが求められている。

 データセンターには従来、膨大なデータを処理するためのインフラがあるが、AIワークロードを効率的に処理するには、従来とは異なるネットワークの設計が必要になる。AIワークロードを効率的に処理するネットワークを設計するためのポイントを紹介する。

AI処理に欠かせない「ネットワークの重要技術」はこれだ

 サーバ同士を接続するインターコネクト技術として「InfiniBand」がある。InfiniBandはイーサネットケーブルでは利用できず、専用のケーブルを必要とするため、イーサネットに比べてコストは高くなりやすい。しかし、速度やレイテンシ、信頼性(データの紛失や順序の乱れが起こらないこと)についてはイーサネットより総じて優れている。

 イーサネットでは「RDMA over Converged Ethernet」(RoCE)といった技術を利用する方法がある。RoCEは、メモリ間でのデータの直接転送を可能にする技術だ。

 ネットワーク処理機能を搭載したNIC(ネットワークカード)である「スマートNIC」(SmartNIC)も重要だ。スマートNICはCPU(中央演算処理装置)やGPU(グラフィックス処理装置)のデータ転送処理をオフロードし、転送速度を向上させる。

 GPUの処理をオフロードする装置としては「DPU」(データ処理装置)を採用する方法もある。スマートNICとDPUは別物だが、近年のスマートNICにはDPUが組み込まれているものもある。

Closトポロジーの構築

 Closトポロジーとはスケーラブル(拡張可能)なネットワークを目的として、ノード(サーバやスイッチ)同士のパス(通信経路)を複数確保しつつ、スイッチを複数の階層(ステージ)で構成するアーキテクチャを採用したネットワークの接続形態だ。

 Closトポロジーネットワークは、一般的に全てのポートで仕様通りの帯域幅が使える「ノンブロッキングスイッチ」で構成する。この設計にすることで、GPU間のデータ転送がより効率的になる。

ネットワーク管理ツールによる自動化

 データセンターネットワークの運用においてはヒューマンエラーの排除が重要だ。そこで役に立つのがネットワークの設定や管理、運用プロセスを自動化するオーケストレーションツールの活用だ。

 近年のネットワークオーケストレーションツールはAI技術が組み込まれており、次のようなことが可能になっている。

  • ネットワークのプロビジョニング(利用可能な状態にすること)や設定作業の自動化
  • プロビジョニングや設定変更に伴うネットワークの影響の事前予測
  • ネットワーク内のパフォーマンスやコンポーネントの健全性の継続的な監視と検証

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ITmedia マーケティング新着記事

news103.jpg

なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...

news160.jpg

業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...

news210.png

SEOを強化するサイトの9割超が表示速度を重視 で、対策にいくら投資している?
Reproが「Webサイトの表示速度改善についての実態調査 2024」レポートを公開。表示速度改...