AI技術の進化によってハードウェアが発する熱はかつてないレベルに達しており、従来の空冷データセンターの設計は時代遅れになりつつある。Schneider Electricが指摘する、インフラに待ち受ける過酷な現実とは。
AI技術の急速な普及と大規模言語モデルの進化に伴い、それを支えるGPU(グラフィックス処理装置)などのハードウェアが求める電力と冷却の要件は劇的に変化している。従来の空冷システムをはるかに超える熱密度に対処するため、チップを直接液体で冷やす「液冷システム」や、800ボルトの高電圧直流給電方式への移行が不可避となり、データセンターは「AIファクトリー」と化してきている。
この劇的なインフラの変革は、データセンター設備を提供するSchneider Electricが2026年5月に開催したイベントでも、大きな議題になった。これまでパブリッククラウドの自由度とオンプレミスインフラの安全性を賢く使い分け、理想的なバランスを保ってきた企業のIT戦略に大きな影響を及ぼしている。次世代チップが要求する膨大な初期投資や運用の複雑さは、企業のデータセンター運用をどう変えているのか。AI時代の到来がオンプレミスインフラに突き付ける現実的な課題を検証し、企業が目指すべきこれからのハイブリッド運用の在り方を考察する。
企業はこれまで、ハイブリッドクラウドを採用することで、快適な均衡状態を保ってきた。重要度が低く変動しやすい処理はパブリッククラウドに移行する一方で、機密性の高い基幹システムや独自のデータセット、予測可能な処理負荷は、企業内の伝統的な空冷式のオンプレミスサーバルームにとどめていた。
しかし、AI技術の台頭がこのモデルを揺るがしている。標準的なCPUでの処理から高速なGPUクラスタへと移行するにつれ、最新のAIハードウェアが求める物理要件は、旧来のオンプレミス設計では満たすことができなくなっているのだ。
次世代の半導体がチップ直接冷却を必須とし、かつてない電力密度を要求する中、これは企業が保有するオンプレミスデータセンターの終焉を意味するのだろうか。
これまで見てきたように、インフラが直面している転換点の根本的な原因は、AIハードウェアが発する膨大な熱にある。IT業界の一部では、液冷インフラの構築に必要な複雑さや初期投資を考慮すると、企業にとってオンプレミスでのAI運用は現実的ではないと考えられている。
過去には、企業が高品質なデータセンターを建設し、電源や冷却のインフラを整備すれば、建物の基本構造を変えることなく15年間にわたって数回のITハードウェアの更新に耐えることができた。
AIハードウェアは、その成功パターンを破壊した。チップ設計の進化が加速したことで、新しい世代のAIプロセッサが登場するたびに、物理的な寸法や電力プロファイル、冷却液の流量要件が変化する。その結果、わずか1年前に構築されたインフラとは根本的に互換性がなくなる事態が生じているのだ。
Cloudflareのアカウントエグゼクティブであるクリス・バーネット氏は、「かつてのデータセンターでは一度インフラを構築すれば数回の機器更新に耐えられたが、次世代を見越して電源や冷却システムの能力をあらかじめ2倍にして構築する企業はめったにない」と振り返る。
企業にとって、商業的なリスクは深刻だ。200キロワットのラックを処理できるオンプレミスデータセンターを構築するには、特殊な先行設備投資として数億円規模の費用がかかる。もし、次世代の半導体が全く異なる流体力学やより高い電圧を要求して、その特注の施設設計が1回のITライフサイクルで時代遅れになってしまえば、投資に対する見返りは消え去ってしまう。
これらを考慮すると、大手クラウドベンダーやマルチテナント型のコロケーション事業者に運用を委託するという選択肢が、極めて合理的な判断になる。
一方で、企業内データセンターの終わりを宣言するのは時期尚早だと主張する声もある。この視点に立てば、企業におけるAI技術の未来は、特殊な巨大インフラで実行すべきモデルの学習だけにあるのではない。むしろ、一般的な企業にとっての真の価値は、独自の企業データを用いて、小規模で安全性の高い、特定分野に特化したAIモデルを微調整(ファインチューニング)することにあるからだ。
Schneider ElectricでAIおよびデータセンター部門のチーフアドボケイトを務めるスティーブン・カルリーニ氏は、「企業はチップ直接液冷を手の届かない技術のままで終わらせず、自社に導入するようになる」と予測する。
同氏によると、チップ直接冷却の技術が成熟するにつれて、市場ではインフラの標準化が進むという。インフラ提供企業は、企業の既存のスペースにそのまま収まるように設計された、自己完結型の「プラグ&プレイ」対応のモジュール式液冷エンクロージャーを提供するようになるだろうと予測している。
カルリーニ氏は、初期の機械的な障壁さえ乗り越えれば、液冷システムが本来持っている熱力学的な効率の良さが企業に有利に働くと強調する。「液冷の効率性と稼働可能な温度を考慮すれば、水の使用量ははるかに少なくなる」(同氏)
高い流体温度で稼働させることで、これらのシステムは巨大で複雑な外部の冷凍機を必要としなくなる。これによって、拠点内に構築する高密度な計算システムが、旧来の空冷システムよりも運用面で効率的になる可能性を秘めている。
同時に、AIのライフサイクル段階に合わせてインフラを使い分けるハイブリッド型の手法の可能性も存在する。
数千個のGPUを密に連結し、P(ペタ)B級のデータを数週間から数カ月かけて読み込ませるような、多大なリソースを要する学習フェーズにおいては、一般的な企業が自社データセンターで対応することは極めて困難だ。この作業は、800VDCの配電機能と大容量の液冷ループを標準で備えた、ハイパースケールインフラやコロケーション施設に委託されることになる。
しかし、モデルの学習が完了すれば、運用の中心は推論処理へと完全に移行する。推論処理は、必要な計算密度が抑えられる。その一方で、ネットワークの遅延を最小限にとどめ、厳格化するデータ保護規制(データ主権)を順守するためには、企業の業務データが保管されているシステムに近い場所に設置することが適している。
ここで、カルリーニ氏が言及したようなオンプレミスインフラ向けの液冷システムが適した居場所を見つけることになる。このシナリオでは、企業のデータセンターは、小型で高効率な液冷対応の推論ゾーンを構築できるように改修される。
チップ直接冷却方式の登場は、データセンターの従来のセオリーを崩壊させた。旧来の企業のサーバルームでは、現代の高速な半導体がもたらす物理的な制約に適応できない。
従来の空冷式の構成にAIの処理を無理に押し込もうとする企業は、熱による性能低下やエネルギーの浪費、高騰する費用という問題に直面する可能性がある。しかし同時に、オンプレミスに巨大なデータセンターの模造品を構築しようとする者も、次世代のチップが登場すればすぐに陳腐化してしまうインフラに多額の資金を固定化するリスクを負うことになる。
今後の進むべき道は、アプリケーションの用途を起点とした、厳格なインフラ戦略を必要としている。企業は、高密度な学習処理のニーズと、拠点内で行う推論処理とを明確に区別し、AIアプリケーションのパイプラインを個別に精査しなければならない。
外部の専門施設とオンプレミスインフラを組み合わせたハイブリッド型のモデルを採用することで、負荷の大きい処理は専門のコロケーション事業者の規模を活用できる。同時に、安全な推論処理を実行するために、循環型の液冷システムを導入する準備を社内で整えることができる。
Copyright © ITmedia, Inc. All Rights Reserved.
瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...