データセンターネットワークの性能はAIの処理能力に影響を直接与える。AIの処理能力を高速化するためのネットワークの設計のポイントや技術を紹介する。
人工知能(AI)技術を活用する企業が増加傾向にある。AIワークロード(AI技術を組み込んだシステム)を処理するデータセンターでは、AI技術を活用するための効率的なアーキテクチャが求められている。
データセンターには従来、膨大なデータを処理するためのインフラがあるが、AIワークロードを効率的に処理するには、従来とは異なるネットワークの設計が必要になる。AIワークロードを効率的に処理するネットワークを設計するためのポイントを紹介する。
サーバ同士を接続するインターコネクト技術として「InfiniBand」がある。InfiniBandはイーサネットケーブルでは利用できず、専用のケーブルを必要とするため、イーサネットに比べてコストは高くなりやすい。しかし、速度やレイテンシ、信頼性(データの紛失や順序の乱れが起こらないこと)についてはイーサネットより総じて優れている。
イーサネットでは「RDMA over Converged Ethernet」(RoCE)といった技術を利用する方法がある。RoCEは、メモリ間でのデータの直接転送を可能にする技術だ。
ネットワーク処理機能を搭載したNIC(ネットワークカード)である「スマートNIC」(SmartNIC)も重要だ。スマートNICはCPU(中央演算処理装置)やGPU(グラフィックス処理装置)のデータ転送処理をオフロードし、転送速度を向上させる。
GPUの処理をオフロードする装置としては「DPU」(データ処理装置)を採用する方法もある。スマートNICとDPUは別物だが、近年のスマートNICにはDPUが組み込まれているものもある。
Closトポロジーとはスケーラブル(拡張可能)なネットワークを目的として、ノード(サーバやスイッチ)同士のパス(通信経路)を複数確保しつつ、スイッチを複数の階層(ステージ)で構成するアーキテクチャを採用したネットワークの接続形態だ。
Closトポロジーネットワークは、一般的に全てのポートで仕様通りの帯域幅が使える「ノンブロッキングスイッチ」で構成する。この設計にすることで、GPU間のデータ転送がより効率的になる。
データセンターネットワークの運用においてはヒューマンエラーの排除が重要だ。そこで役に立つのがネットワークの設定や管理、運用プロセスを自動化するオーケストレーションツールの活用だ。
近年のネットワークオーケストレーションツールはAI技術が組み込まれており、次のようなことが可能になっている。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...
「マーケティングオートメーション」 国内売れ筋TOP10(2025年4月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。