AI処理の“爆速化”に欠かせない「ネットワークの重要技術」はこれだAIに必要なネットワーク【後編】

データセンターネットワークの性能はAIの処理能力に影響を直接与える。AIの処理能力を高速化するためのネットワークの設計のポイントや技術を紹介する。

2024年08月01日 07時00分 公開
[Andrew FroehlichTechTarget]

 人工知能(AI)技術を活用する企業が増加傾向にある。AIワークロード(AI技術を組み込んだシステム)を処理するデータセンターでは、AI技術を活用するための効率的なアーキテクチャが求められている。

 データセンターには従来、膨大なデータを処理するためのインフラがあるが、AIワークロードを効率的に処理するには、従来とは異なるネットワークの設計が必要になる。AIワークロードを効率的に処理するネットワークを設計するためのポイントを紹介する。

AI処理に欠かせない「ネットワークの重要技術」はこれだ

 サーバ同士を接続するインターコネクト技術として「InfiniBand」がある。InfiniBandはイーサネットケーブルでは利用できず、専用のケーブルを必要とするため、イーサネットに比べてコストは高くなりやすい。しかし、速度やレイテンシ、信頼性(データの紛失や順序の乱れが起こらないこと)についてはイーサネットより総じて優れている。

 イーサネットでは「RDMA over Converged Ethernet」(RoCE)といった技術を利用する方法がある。RoCEは、メモリ間でのデータの直接転送を可能にする技術だ。

 ネットワーク処理機能を搭載したNIC(ネットワークカード)である「スマートNIC」(SmartNIC)も重要だ。スマートNICはCPU(中央演算処理装置)やGPU(グラフィックス処理装置)のデータ転送処理をオフロードし、転送速度を向上させる。

 GPUの処理をオフロードする装置としては「DPU」(データ処理装置)を採用する方法もある。スマートNICとDPUは別物だが、近年のスマートNICにはDPUが組み込まれているものもある。

Closトポロジーの構築

 Closトポロジーとはスケーラブル(拡張可能)なネットワークを目的として、ノード(サーバやスイッチ)同士のパス(通信経路)を複数確保しつつ、スイッチを複数の階層(ステージ)で構成するアーキテクチャを採用したネットワークの接続形態だ。

 Closトポロジーネットワークは、一般的に全てのポートで仕様通りの帯域幅が使える「ノンブロッキングスイッチ」で構成する。この設計にすることで、GPU間のデータ転送がより効率的になる。

ネットワーク管理ツールによる自動化

 データセンターネットワークの運用においてはヒューマンエラーの排除が重要だ。そこで役に立つのがネットワークの設定や管理、運用プロセスを自動化するオーケストレーションツールの活用だ。

 近年のネットワークオーケストレーションツールはAI技術が組み込まれており、次のようなことが可能になっている。

  • ネットワークのプロビジョニング(利用可能な状態にすること)や設定作業の自動化
  • プロビジョニングや設定変更に伴うネットワークの影響の事前予測
  • ネットワーク内のパフォーマンスやコンポーネントの健全性の継続的な監視と検証

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ITmedia マーケティング新着記事

news175.jpg

日清食品がカップ麺の1〜5位を独占 2024年、最も手に取られた新商品は?
カタリナマーケティングジャパンは、カタリナネットワーク内小売店における年間売り上げ...

news070.jpg

「イカゲーム」人気にドミノ・ピザも便乗 NetflixとCM共同制作の狙いは?
ケイト・トランブル氏がDomino’sのCMO(最高マーケティング責任者)に正式に就任して初...

news082.jpg

2024年記憶に残った「生成AI活用事例」は? 課長以上に聞くマーケトレンド
アイブリッジは、マーケティング業務に携わっている従業員数100人以上の企業在籍の課長以...