「Gemini 2.0」登場で現実的になった“AIエージェント時代”の始まり:Googleの新LLMのすごさとは【後編】
自律的にタスクを実行する「AIエージェント」への期待が高まっている。Googleが2024年末に発表した新モデル「Gemini 2.0」は、その可能性をさらに広げつつあるという。
生成AI(AI:人工知能)市場における次のトレンドとして注目を集めているのが「AIエージェント」だ。AIエージェントとは、自律的にタスクを実行できるAIシステムを指し、従来のAIツールとは一線を画す存在とされている。
Googleは2024年12月、次世代の大規模言語モデル(LLM)「Gemini 2.0」を発表した。同AIモデルは、AIエージェントの進化を加速させる可能性があるという。どういうことなのか。
“AIエージェント時代”を見据えた「Gemini 2.0」の強さとは
併せて読みたいお薦め記事
Googleの新LLMのすごさとは
AIを使いこなすための知識
Webベースの開発者ツール「Google AI Studio」およびGeminiを利用するためのAPI(アプリケーションプログラミングインタフェース)「Gemini API」のユーザーが、「Gemini 2.0 Flash」の試験運用版を利用できる。
2025年には、AIエージェントのプロトタイプからもGemini 2.0 Flashを利用できるようになる見込みだ。AIエージェントには以下が含まれる。
- マルチモーダルエージェント「Project Astra」
- ブラウザ用AIエージェント「Project Mariner」
- 機械学習プラットフォーム「Google Colab」のデータサイエンスエージェント
- コーディングエージェント「Jules」
Googleでグループプロダクトマネジャーを務めるシュレスタ・バス・マリク氏は次のように説明する。「Gemini 2.0 Flashは、ソースコードを『複数のツールを連携させ、複雑なタスクを実行するための言語』として学習している。そのため、特にプログラム関連のタスクにおいて非常に強力だ」
Gemini 2.0は、検索ツールやコード実行ツールといったツールの利用を前提に設計・開発されており、「エージェント機能をネイティブに備えている」という。エージェント機能とは、使用するツールやタイミングの判断を含め、複数段階にわたるワークフローを自律的に実行できる能力を指している。
このように自律的にタスクを遂行するAIエージェントは、生成AI市場における次の大きなトレンドとして位置付けられている。2024年、Amazon Web Services(AWS)やMicrosoft、Atlassian、SalesforceなどのベンダーがAIエージェントの開発に着手している。ただし、全てのAIエージェントが同じ設計思想に基づいているわけではない。
「昨今のAI市場では、十分な性能を備えていないAIシステムをAIエージェントとして過剰に宣伝する『エージェントウォッシング』が横行している」とマリク氏は話す。一方で同氏は、「Geminiはマルチモーダル性、優れたコンテキスト処理能力、複数段階にわたるワークフローの実行機能を備えており、AIエージェントをけん引する存在だ」と評価する。
AIワークフローがますます複雑化する中で、AIエージェントに対する企業の信頼を獲得するには時間を要すると見込まれる。LLMの応答の正確性や品質への懸念は依然として根強い。さらに、AIエージェント同士の連携により、新たなサイバーセキュリティのリスクも浮上している。
「重要なのは、AIエージェントが全てのアクションを自動で実行するのではなく、人間が確認してから実行に移すことだ」。こう話すのは、Web開発ツールベンダーPantheon Systemsの最高技術責任者(CTO)デービッド・ストロース氏だ。
「私の判断基準はシンプルで、『この仕事を新人に任せられるかどうか』という問いに尽きる。新人にタスクを任せるためには、そのタスクが明確な制約や手順のもと実行される必要がある。AIエージェントの場合も同様で、十分な制約や指針が設定されていれば、信頼してタスクを任せることができる」
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.