検索
特集/連載

ZoomはAIエージェントでどう進化するか 明かされた4つのポイントCTOが語る

ZoomのAIアシスタント機能「AI Companion」がAIエージェントとして進化を遂げつつある。同社のシュエドン・フアンCTOがその4つの特性について語った。

Share
Tweet
LINE
Hatena

関連キーワード

人工知能 | ビデオ会議 | チャットbot


 ZoomのAIアシスタント機能が、会議の文脈を理解し、自律的にタスクを実行するAIエージェントへと進化しようとしている。

 Zoom Communicationsのシュエドン・フアンCTO(最高技術責任者)は、Computer Weeklyの取材に応じ、ZoomのAIアシスタント機能の最新版「AI Companion 3.0」について説明した。この機能の基盤となっているのは、4つの特性を備えた「エージェンティックAIアーキテクチャ」だ。なお、ここで言うエージェンティックAIとは、複数のAIエージェントやAIモデルを連携させて自律的にタスクを進めるAIのことだ。

Zoomの“進化”の鍵を握る、4つの特性とは

 1つ目の特性は「持続する長期記憶」だ。多くのチャットbotが数回のやりとりで文脈を忘れてしまうのに対し、AIエージェントは過去の会話や会議、意思決定を記憶し続け、より大きな文脈を理解する必要がある。フアン氏は「人間に長期記憶があるように、AIにも長期的に情報を保持する力が必要だ」と説明。Zoomはビジネスの会話が交わされる基盤であるため、こうした機能を提供するのに適していると付け加える。

 2つ目は「深い推論能力」だ。AIエージェントが会話をきっかけに実際のアクションまでつなげるには、達成すべき重要なタスクを特定するための推論力が欠かせないという。

 推論力があれば、AIエージェントは会話の意図を理解し、必要なタスクを完遂できる。例えば、会話を聞いたAIが、ある決定のためにはフォローアップのメール送信やプロジェクト計画の更新、次回会議のスケジュール調整などが必要であると判断できれば、指示されなくてもそれらの行動を起こせるようになる。

 3つ目の特性は、複数のツールや専門的なエージェントを統合し、複雑な目標を達成するための「指揮者」としての役割だ。

 単独のツールで全てのタスクを完結できない場合は、AIが複数の機能を組み合わせて処理する必要がある。例えば、四半期計画会議のフォローアップを依頼されたケースを考えてみよう。指揮者の役割を持ったAIエージェントは、会議の文字起こしの参照、アクション項目の抽出、要約の作成、カレンダーと連携したフォローアップ会議の設定、関係者へのメール通知――といった一連の作業を自動で実行する。

 4つ目は「積極性と自律性」だ。これは、命令されてから動くのではなく、ユーザーのニーズを予測し、先回りして行動するということだ。フアン氏は現在の主流なAIモデルの一つとして「ChatGPT」を例に挙げ、AIエージェントとの違いをこう説明する。

 「ChatGPTはいまのところ、受け身です。ユーザーに代わってタスクを実行することはありませんし、Zoom会議で何が話されたかも把握していません」

 一方、同社のAIエージェントは会議の内容を把握し、次のステップを提案したり、実行を始めたりするという。

AIエージェント機能を支える「分散型アーキテクチャ」

 ZoomのAIエージェントを支えるのは、「フェデレーテッド(分散型)アーキテクチャ」だ。Zoomは、OpenAIやAnthropicなどが提供する大規模言語モデル(LLM)に加え、要約や翻訳といった特定の用途に特化した独自の小型言語モデル(SLM)を組み合わせて使っている。

 分散型アーキテクチャの利点は、単に複数のAIモデルを使うことではなく、「推論スケーリング」と呼ばれる手法によって、AIモデル同士が連携して処理を分担する点にある。

 例えば、会議の要約では、まずZoom独自のSLMが最初の要約を低コストで生成する。その後、「GPT-4」などの高性能なLLMにその要約を渡して文体や構成を洗練させる。このプロセスであれば、高価なLLMは必要な場面でだけ使えばよくなり、処理全体の効率が上がる。

 このように、複数のAIモデルをコミッティー(委員会)のように組み合わせて使うことは、出力の安全性やリスクの検出にも貢献するとフアン氏は話す。「分散型の力によって、1つのモデルよりも多様な視点でリスクに対応できる」という。

 Zoomはさらに、ユーザーが自身の業務に合ったAIエージェントを構築できるよう「Custom AI Companion」という機能も提供している。これはローコード開発ツールと、各種ツールのライブラリ、テンプレートを通じて、企業独自のAIエージェントを構築、導入できるというものだ。構築したAIエージェントは、Google主導のオープンプロトコル「Agent2Agent」(A2A)を使って、ServiceNowなどのアプリケーションとも連携できる。

NVIDIA との連携でさらなる進化へ

 Zoomは2025年10月、NVIDIAとの協業を発表し、エージェンティックAIのさらなる強化を図っている。

 具体的には、NVIDIAの推論モデル「Nemotron」をZoomの分散型アーキテクチャに組み込むことや、NVIDIAのグラフィックスプロセッサやAIソフトウェアスタックを活用してAI Companionのコア機能を最適化すること、Nemotronをベースにした490億パラメータの新しいLLMを構築することなどを計画している。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る