AI処理の“爆速化”に欠かせない「ネットワークの重要技術」はこれだ:AIに必要なネットワーク【後編】
データセンターネットワークの性能はAIの処理能力に影響を直接与える。AIの処理能力を高速化するためのネットワークの設計のポイントや技術を紹介する。
人工知能(AI)技術を活用する企業が増加傾向にある。AIワークロード(AI技術を組み込んだシステム)を処理するデータセンターでは、AI技術を活用するための効率的なアーキテクチャが求められている。
データセンターには従来、膨大なデータを処理するためのインフラがあるが、AIワークロードを効率的に処理するには、従来とは異なるネットワークの設計が必要になる。AIワークロードを効率的に処理するネットワークを設計するためのポイントを紹介する。
AI処理に欠かせない「ネットワークの重要技術」はこれだ
併せて読みたいお薦め記事
連載:AIに必要なネットワーク
進化するデータセンターネットワーク
サーバ同士を接続するインターコネクト技術として「InfiniBand」がある。InfiniBandはイーサネットケーブルでは利用できず、専用のケーブルを必要とするため、イーサネットに比べてコストは高くなりやすい。しかし、速度やレイテンシ、信頼性(データの紛失や順序の乱れが起こらないこと)についてはイーサネットより総じて優れている。
イーサネットでは「RDMA over Converged Ethernet」(RoCE)といった技術を利用する方法がある。RoCEは、メモリ間でのデータの直接転送を可能にする技術だ。
ネットワーク処理機能を搭載したNIC(ネットワークカード)である「スマートNIC」(SmartNIC)も重要だ。スマートNICはCPU(中央演算処理装置)やGPU(グラフィックス処理装置)のデータ転送処理をオフロードし、転送速度を向上させる。
GPUの処理をオフロードする装置としては「DPU」(データ処理装置)を採用する方法もある。スマートNICとDPUは別物だが、近年のスマートNICにはDPUが組み込まれているものもある。
Closトポロジーの構築
Closトポロジーとはスケーラブル(拡張可能)なネットワークを目的として、ノード(サーバやスイッチ)同士のパス(通信経路)を複数確保しつつ、スイッチを複数の階層(ステージ)で構成するアーキテクチャを採用したネットワークの接続形態だ。
Closトポロジーネットワークは、一般的に全てのポートで仕様通りの帯域幅が使える「ノンブロッキングスイッチ」で構成する。この設計にすることで、GPU間のデータ転送がより効率的になる。
ネットワーク管理ツールによる自動化
データセンターネットワークの運用においてはヒューマンエラーの排除が重要だ。そこで役に立つのがネットワークの設定や管理、運用プロセスを自動化するオーケストレーションツールの活用だ。
近年のネットワークオーケストレーションツールはAI技術が組み込まれており、次のようなことが可能になっている。
- ネットワークのプロビジョニング(利用可能な状態にすること)や設定作業の自動化
- プロビジョニングや設定変更に伴うネットワークの影響の事前予測
- ネットワーク内のパフォーマンスやコンポーネントの健全性の継続的な監視と検証
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.