LLM「Gemini」がオンプレミス環境で利用できるようになる計画をGoogleが明らかにした。発表からは、生成AI活用のステージが次の段階へ移りつつある状況が垣間見える。
Googleは2025年3月、大規模言語モデル(LLM)「Gemini」シリーズの最新バージョン「Gemini 2.5 Pro」の試験運用版を提供開始した。公開直後からその性能の高さが業界で注目を集めたが、Googleはさらなる一手を打った。
2025年4月、Googleはフルマネージドアプライアンス製品「Google Distributed Cloud」(GDC)を通じて、オンプレミスでGeminiを利用できる計画を発表した。同年第3四半期(2025年7~9月)にはプレビュー版を公開する見込みだ。今回の発表からは、Googleの中長期的な戦略だけでなく、AI市場の新潮流が垣間見える。
GDCは、Googleのクラウドサービス群「Google Cloud」の技術をオンプレミスで利用できる、ハードウェアとソフトウェアが一体となったアプライアンス製品だ。ユーザーは小規模サーバから大規模なラック展開まで柔軟にハードウェア構成を採用することが可能だ。ハードウェアはGoogleからリースで調達でき、その場合は保守作業も全てGoogleが担う。
GDCからGeminiを利用できるようになることで、厳格なセキュリティ体制が求められる環境、例えばデータを本番環境から隔離する「エアギャップ」を設ける環境でもAIモデルを活用できるようになる。GoogleはGDCにおいて、NVIDIAのGPU(グラフィックス処理装置)アーキテクチャ「Blackwell」を採用することも明らかにしている。
2025年4月時点で、GDCに導入されるGeminiのバージョンは公表されていないが、Googleの発表では「最も高性能なモデル」と説明されており、Gemini 2.5 Pro以降の最新モデルが対象となる見込みだ。
OpenAIやAnthropicなどの主要AIベンダーは、オンプレミスでの最新モデルの提供はしていない。そのため今回のGoogleの発表に対する驚きの声も聞かれる。Microsoftの「Azure OpenAI Service」のようにAPI(アプリケーションプログラミングインタフェース)経由でAIモデルを利用するサービスは存在するものの、あくまでクラウド経由での提供にとどまる。
これまでも、セキュリティ、プライバシー、長期的なコスト面の懸念から、クラウドベースのAI導入を敬遠する企業は一定数存在した。今回のGoogleの発表は、「最先端の商用モデルを活用したいが、セキュリティや法的リスクの懸念を心配する」企業に新たな選択肢を提供するものだ。
「今回のGoogleの動きは、VMwareを買収したBroadcomがプライベートクラウド重視へと舵を切った流れに通じる」。こう指摘するのは、調査会社Forrester Researchのプリンシパルアナリストを務めるデビン・ディッカーソン氏だ。
パブリッククラウドではなく、オンプレミスやプライベートクラウドが注目される背景には、Broadcomの戦略に追随するベンダーが増えている状況がある。新しい技術は、まずはパブリッククラウドで広く試されるが、成熟するにつれてオンプレミスやプライベートクラウドでの導入ニーズが拡大する傾向にある。
オンプレミスAIを推進する企業の一つが、コンテナ管理ツールベンダーのDockerだ。同社は2025年4月、コンテナ化ツール「Docker Desktop」のバージョン「4.40」に、AIモデルのローカル実行機能「Docker Model Runner」を実装。「Gemma 3」や「Llama 3」などの小規模言語モデル(SLM)をコンテナに格納してオンプレミスにデプロイ(配備)できるようにした。
Dockerは今後、GoogleやQualcomm Technologiesとの協業を深め、以下のようなツールやサービスとの連携を進めていく計画だ。
Dockerでプロダクトマーケティング部門のバイスプレジデントを務めるニキル・クアル氏は、企業がオンプレミス運用を選ぶ理由を次のように分析する。「クラウドサービス経由でAIモデルを利用する場合と、ローカルでAIモデルを動かす場合では、コスト面で大きな差が出る」。クラウドサービス経由だと、利用料金が課される他、データ転送に遅延が生じる。既存の社内インフラを活用すれば、それらの追加負担は発生しない。
しかし、大半の企業にとってAIワークロードのオンプレミスへの全面移行は現実的ではない。現実には、生成AI活用時に可能なデータはクラウドへ移行して自社データセンターの負担を削減しつつ、一部の機密データや特定業務は手元に残す、といったハイブリッドな対応が求められている。
オンプレミスでGeminiを動かせるようになれば、企業はより多様なデータをAIモデルトレーニングに活用できるようになる。その結果、企業による生成AI開発は一段と進むと見込まれる。
重要なのは、AIモデルが企業の保有するデータやシステムに接続できることだ。「生成AIを導入する企業にとって、どのAIモデルを選ぶかより、どのデータにアクセスできるかの方がはるかに重要だ」とディッカーソン氏は話す。企業独自のコンテキスト(背景情報)に根差したデータを生かせるか否かが、今後の企業におけるAI活用の成否を左右することになる。
オンプレミスでのAI活用が進むことで、企業がデータやセキュリティに沿った形でAIを活用できる土台が整いつつある。その一方で、企業が次に見据えるべきテーマは、単一のモデル活用にとどまらない。「どのデータにアクセスするか」「複数のAIエージェントがどのように協力するか」といった次のテーマが浮かび上がってくる。
Googleは、GDC向けに検索AIエージェント「Agentspace」の提供を発表しており、ユーザーはオンプレミスで「RAG」(検索拡張生成)を利用できる。RAGは学習データ以外に外部のデータベースから情報を検索、取得し、LLMが事前学習していない情報も回答できるように補う手法で、社内データに基づいた高度な応答を実現する。
Googleは複数の企業と協力し、通信プロトコル「Agent2Agent」(A2A)の標準化をオープンソースプロジェクトとして推進していることも発表している。この取り組みは、各社が開発するエージェント間の相互運用性を高めることを目指すものだ。
同様に、業界では次のような標準化や相互接続に向けた動きが活発化している。
ITコンサルティング企業Pythianでエンタープライズデータ&アプリケーションオペレーション部門バイスプレジデントを務めるカシア・ワカレシー氏は、次世代AI活用の焦点を「AIエージェント間の連携強化」に置く。「複数の生成AIツールが異なる回答を返したときに、どの答えを信頼すべきかは未解決の課題だ」とワカレシー氏は指摘する。
実際にPythianは、Atlassian製のRAGツール「Rovo」とGeminiを併用している。営業に関する質問をしたら、顧客管理システム「Salesforce」から最新データを取得し、それをSlackに自動投稿する、という仕組みだ。同じ問いに対する回答がツール間で異なったり、古い情報が混じっていたりするケースは少なくないが、その整合性を人手で確認するのは現実的ではない。「複数エージェントが協調し、企業が利用するアプリケーションを横断して情報収集から分析、応答までを一気通貫で担う。そのような仕組みが求められている」とワカレシー氏は語る。
<翻訳・編集協力:雨輝(リーフレイン)>
Copyright © ITmedia, Inc. All Rights Reserved.
生成AIの開発には、高性能なGPUが不可欠だ。しかし、GPUサーバをオンプレミスで運用するには、高額な初期費用や設置場所の確保などの課題がネックになる。そこで注目したいのが、サブスクリプション形式で利用できるGPUクラウドサービスだ。
製造業の設計現場では、設計プロセスの複雑化などの課題が山積している。こうした中、注目を集めているのが生成AIの活用だ。本資料では、生成AIがもたらす設計業務の未来について、詳しく解説する。
小売業では、売り上げと利益を向上させる価格設定が重要だが、迅速かつ適切な設定は労力もかかり困難を極める。膨大な商品の需要バランスを見極め、最適な価格調整を自動的に算出することがAI活用にて実現可能だ。その次世代の方法とは。
リアルタイムで価格を変動させる「ダイナミックプライシング」。小売業界においてその重要性が高まっているが、導入をためらう企業は少なくない。その理由を確認しながら、課題解決策となるAI技術を活用したアプローチを紹介する。
生成AIのビジネスにおける活用を検討する際には、実際に自社のどのような業務領域に、どのような形で導入するかを考慮する必要がある。本資料では、生産性向上につながる生成AI戦略について詳しく解説する。
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...