検索
特集/連載

NVIDIAのCEOが説く「AI工場」とは? 従来型データセンターとの決定的な違い2028年までに7割が導入

2028年までに米企業の7割が導入を計画する「AI工場」は、知能を生成し利益を生む新たな拠点だ。本記事では、情シスが直面する電力・人材・コストの課題を整理。データセンターを単なるコストセンターに終わらせず、ROIを最大化するためのインフラ戦略とガバナンスのポイントを解き明かす。

Share
Tweet
LINE
Hatena

 企業はAIによる価値創出を求める強い圧力にさらされている。AIの取り組みは実験段階から、規模の拡大と投資対効果(ROI)の厳格な測定を重視するフェーズへと移行しつつある。大規模な展開を実現するために必要なのは「AI工場(AIファクトリー)」というモデルなのだろうか。多くの企業がその可能性に賭けている。

 デロイトが年商5億ドル以上の米国企業リーダー515人を対象に実施した調査では、70%が2028年までにAI工場を大規模に稼働させる計画であることが判明した。

 企業のAI戦略を担当するCIO(最高情報責任者)などのITリーダーがAI工場を採用する場合、その仕組みを理解する必要がある。AI工場は従来のデータセンターと何が違うのか。構築にはどのようなアーキテクチャが必要なのか。そして、どのようにデプロイすべきなのか。

 さらにCIOは、組織の準備状況、既存のハイブリッドクラウドやマルチクラウド戦略との適合性、総所有コスト(TCO)、リスク管理についても判断しなければならない。データセンターを単なるコストセンターに終わらせず、ROIを最大化するためのインフラ戦略とガバナンスのポイントを解き明かす。

AI工場とは何か

 デロイトの調査によると、AI工場とは「AIに最適化されたソフトウェアおよびサービスと、専用設計された高性能インフラ(計算能力、ネットワーク、ストレージ)を組み合わせたプラットフォーム」を指す。

 NVIDIAのジェンスン・フアンCEOは、同社のイベント「GTC 2024」の基調講演でAI工場について言及した。フアン氏は「AI工場の存在意義は、収益を生み出すこと、すなわちインテリジェンス(知能)を生成することにある」と語った。

 同氏は講演後に行われたTechCrunchのインタビューで、従来のデータセンターとAI工場の違いを明確にした。「これまでのデータセンターはコストセンターで、設備投資(Capex)の対象だった。つまり、コストと見なされていた。しかし、工場は別物だ。収益を生み出す存在なのである」。

 AIに最適化されたこれらの工場は、従来のデータセンターよりもはるかに多くの電力を必要とする。RANDによると、AI用データセンターの電力需要は2027年までに世界で68GWに達すると予測されている。2022年時点の世界の全データセンター容量が88GWであったことを考えると、その規模は極めて大きい。AIのインフラ需要を満たすための競争は激化しており、マッキンゼーはデータセンターへの世界的な支出が2030年までに7兆ドルに達する可能性があると予測している。

AI工場のアーキテクチャ

 AI工場のアーキテクチャ層には以下が含まれる。

  • エネルギー

 AI工場は電力なしでは稼働できない。デロイトが調査したリーダーの約半数(48%)は、電力確保のために公共網、自家発電、サードパーティーの発電を組み合わせた混合アプローチを採用する予定だ。

  • ハードウェア

 IBMによれば、増大し複雑化するワークロードを管理するため、AI工場にはASIC、GPU、NPU、TPU、ウエハースケールエンジンなどのハードウェアが必要になる。

  • インフラ

 企業のAIインフラの規模は多様だ。デロイトによると、数個のGPUクラスタで構成されるものから、キャンパス全体を占めるものまである。ハードウェアを収容し、電力供給や冷却を行う物理的な建物に加え、ストレージやオーケストレーションのためのシステムも必要となる。

  • データとAIモデル

 NVIDIAによれば、データとAIモデルはAI工場を動かす燃料である。データの所在、アクセス制御、セキュリティの確保について、CIOは明確に答えられなければならない。

  • アプリケーション

AI工場は企業向けアプリケーションを稼働させる。NVIDIAによると、アプリケーションが新しいデータを収集するとそれが工場にフィードバックされ、AIの継続的な学習と改善に役立てられる。

AI工場のデプロイモデル

 AI工場の導入方法は複数ある。CIOは業界、コンプライアンス要件、ワークロード、予算に基づき最適なアプローチを決定する。

  • オンプレミス

 NVIDIAのAI Factory Purchasing Guideによると、自社のデータセンターやプライベートクラウドなどの既存環境にハードウェア、ソフトウェア、インフラを調達・導入するためのリソースを持つ企業は、オンプレミスでAI工場を自社構築できる。規制の厳しい業界の企業は、データプライバシーや法規制への準拠を確保するために、このデプロイモデルを選択する場合がある。

  • クラウド

 クラウドサービスプロバイダーからAI工場を借りる形態だ。ハードウェアの管理はベンダーが行い、企業は従量課金制で利用する。柔軟性と拡張性に優れるが、技術スタックの制御には制限があり、ベンダーロックインやデータプライバシーの懸念が生じるリスクがある。

  • ハイブリッド

 クラウドとオンプレミスの両方のリソースを活用する。ニーズに応じてAIワークロードを分散させることが可能だ。

AI工場の計画立案

 AI工場の導入を計画するCIOは、価値を確実に引き出すために幾つかの戦略的検討事項を整理する必要がある。

  • 自社にAI工場は必要か

 NVIDIAは、全ての企業にAI工場が必要になると主張している。しかし、CIOは現在のニーズとAI導入の成熟度を考慮しなければならない。USTのチーフAIアーキテクトであるアドナン・マスード氏は「必要だから構築するのか、それともベンダーに勧められたから構築するのか」と問い直すよう促している。

 検討すべき指標の1つは利用規模だ。プロティビティのマネージングディレクターであるパトリック・アンダーソン氏は「AIファーストの企業を目指すなら、膨大な処理量が必要になる。スピードを求めるなら工場モデルが適している」と指摘する。

 AIのパイロット運用から本番稼働へと進む多くの大企業にとって、トークン消費量の増大や、ライフサイクル全体を管理する必要性は、AI工場を採用する説得力のある理由になるだろう。

 ただし、AI工場は大企業だけのものではない。Red HatのCIOであるマルコ・ビル氏は、中小規模の組織も「工場は大企業のものだと気後れする必要はない」と主張する。AI工場の規模は、組織のニーズに合わせて調整可能だからだ。

  • 組織としての準備は整っているか

 導入前に、まずはデータの準備状況を評価すべきだ。ビル氏は「データが管理されていなければ、誤った信号が送られ、大規模な展開をしても品質が保てなくなる」と警告する。

 人材の確保も課題だ。デロイトの調査では、AIインフラのためのデータエンジニア、セキュリティ専門家、MLOpsエンジニア、データサイエンティストなど、多様な役割が必要だとされている。

 マスード氏は「人材が最大のボトルネックだ。スキルを持つ人材がいればプラットフォームをフル活用できるが、いなければ宝の持ち腐れになる」と述べる。また、ビル氏は文化的な変革の重要性も強調している。「先進的な人もいれば保守的な人もいる。この溝を埋め、従業員の意欲を高める必要がある」。

  • インフラ戦略をどうするか

 ハードウェアの調達期間も重要な考慮事項だ。マスード氏は「予算があってもGPUがすぐに届くとは限らない。単に購入するだけでなく、最初の3カ月から6カ月でどのようなワークロードを動かすかを想定しておく必要がある」と助言する。

 また、アンダーソン氏は、クラウド事業者だけでなく、コンサルティング会社やハードウェアベンダーなど、多様な提供元からAI工場が登場していると指摘する。それぞれの契約の役割や責任、リスクの範囲を慎重に交渉する必要がある。

  • コストの検討事項

 AI工場の目的は収益を上げることだが、CIOはインフラ構築と運用のコストを正確に把握しなければならない。ビル氏は、これを初期のクラウド導入になぞらえる。「クラウドに移った後で『意外に高い』と気付き、支出を管理するソリューションが必要になった。この分野でも同じことが起きるだろう」。

 ハードウェア、電力、人材、そして利用量に基づき、コストを追跡しなければならない。マスード氏は、トークン当たりのコストやGPUの使用率、各事業部門へのチャージバックなどを監視すべきだと指摘している。

  • リスク管理とサステナビリティ

 データのセキュリティ、規制順守、運用の失敗といったリスクは、AI工場でも同様に存在する。マスード氏は、ガバナンスを単なる文書ではなく、実効性のある運用インフラとして機能させるべきだと強調する。

 また、ビル氏は変化の速さに対応できる柔軟性も必要だと指摘する。デプロイに1〜2年もかかっていては、技術が陳腐化してしまうからだ。

 さらに、資源の希少性も無視できない。電力や水の需要が増大する中で、CIOはエネルギーコストの変動や、サプライヤーの持続可能性についても考慮しなければならない。「もし電力コストが3倍になり、ベンダーが倒産したらどうなるか。そのリスクまで想定しておく必要がある」とアンダーソン氏は結んだ。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る