データセンターネットワークの性能はAIの処理能力に影響を直接与える。AIの処理能力を高速化するためのネットワークの設計のポイントや技術を紹介する。
人工知能(AI)技術を活用する企業が増加傾向にある。AIワークロード(AI技術を組み込んだシステム)を処理するデータセンターでは、AI技術を活用するための効率的なアーキテクチャが求められている。
データセンターには従来、膨大なデータを処理するためのインフラがあるが、AIワークロードを効率的に処理するには、従来とは異なるネットワークの設計が必要になる。AIワークロードを効率的に処理するネットワークを設計するためのポイントを紹介する。
サーバ同士を接続するインターコネクト技術として「InfiniBand」がある。InfiniBandはイーサネットケーブルでは利用できず、専用のケーブルを必要とするため、イーサネットに比べてコストは高くなりやすい。しかし、速度やレイテンシ、信頼性(データの紛失や順序の乱れが起こらないこと)についてはイーサネットより総じて優れている。
イーサネットでは「RDMA over Converged Ethernet」(RoCE)といった技術を利用する方法がある。RoCEは、メモリ間でのデータの直接転送を可能にする技術だ。
ネットワーク処理機能を搭載したNIC(ネットワークカード)である「スマートNIC」(SmartNIC)も重要だ。スマートNICはCPU(中央演算処理装置)やGPU(グラフィックス処理装置)のデータ転送処理をオフロードし、転送速度を向上させる。
GPUの処理をオフロードする装置としては「DPU」(データ処理装置)を採用する方法もある。スマートNICとDPUは別物だが、近年のスマートNICにはDPUが組み込まれているものもある。
Closトポロジーとはスケーラブル(拡張可能)なネットワークを目的として、ノード(サーバやスイッチ)同士のパス(通信経路)を複数確保しつつ、スイッチを複数の階層(ステージ)で構成するアーキテクチャを採用したネットワークの接続形態だ。
Closトポロジーネットワークは、一般的に全てのポートで仕様通りの帯域幅が使える「ノンブロッキングスイッチ」で構成する。この設計にすることで、GPU間のデータ転送がより効率的になる。
データセンターネットワークの運用においてはヒューマンエラーの排除が重要だ。そこで役に立つのがネットワークの設定や管理、運用プロセスを自動化するオーケストレーションツールの活用だ。
近年のネットワークオーケストレーションツールはAI技術が組み込まれており、次のようなことが可能になっている。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...
SEOを強化するサイトの9割超が表示速度を重視 で、対策にいくら投資している?
Reproが「Webサイトの表示速度改善についての実態調査 2024」レポートを公開。表示速度改...