デモ止まりはもう終わり　IBMが明かすAIエージェント実運用のロードマップ：LLMの賢さだけでは勝てない

IBMのデータサイエンティストによると、AIエージェントをデモ段階から実用規模へと拡張する際に、開発者は「3つのわな」にはまるという。同氏はその解決に向けたシステム設計のポイントを紹介する。

≫ 2026年06月25日 20時08分公開

[TechTargetジャパン]

　AIエージェントは、デモを作るだけなら容易になった。ユーザーの依頼を受け、計画を立て、外部ツールを呼び出し、結果を返す。こうした一連の処理は、現在では比較的短期間で実装できる。

　IBMのシニアデータサイエンティストのサマンサ・アンソニー氏によると、デモでうまく動いたAIエージェントを、そのまま実業務に広げようとすると問題が表面化するという。単に利用者数やリクエスト数が増えるだけなら、従来のソフトウェアと同じようにインフラを増強すれば対応できる。問題は、AIエージェントに「より多くの業務を任せる」「対応範囲を広げる」「より複雑な判断をさせる」という能力拡張を求めたときに起きる。

　本稿は、AIエージェントを実運用で拡張する際に陥りやすいわな3選と、システムの拡張に必要となる設計の考え方を整理する。

AIエージェントの拡張であのわなにはまらないために

併せて読みたいお薦め記事

AIエージェントの関連記事

　「従来のソフトウェアシステムにおける拡張は、比較的分かりやすい」。アンソニー氏はこう指摘する。ユーザー数が増える、リクエスト数が増える、扱うデータ量が増える。こうした場合、サーバを増やす、コンテナを追加する、CPUやメモリを強化するといった方法で処理能力を高める。水平・垂直にインフラを拡張しても、基本的には「同じ処理を、より多く実行する」だけであり、システムの挙動そのものは大きく変わらない。

　一方、AIエージェントの拡張では、インフラ拡張とは別の側面を考える必要がある。リクエスト数を増やすだけでなく、AIエージェントに任せるタスクの種類を増やし、対応範囲を広げ、より複雑な業務を自律的に処理させるという能力の拡張だ。

　ここに、従来型のソフトウェアシステム拡張との決定的な違いがある。違いがある。AIエージェントは、単に処理量が増えるだけではない。できることを増やすほど、判断しなければならない選択肢も増える。参照すべき文脈が増え、使えるツールが増え、どの手順で進めるべきかを判断する負荷が高まる。結果として、システム全体の複雑性は単純な足し算では済まず、機能を増やすほど急激に膨らんでいく。

単一エージェントを拡張する「3つのわな」

　多くのAIエージェントは、狭いタスクであれば問題なく実行する。依頼内容を分解して計画を立て、必要なツールを使って実行し、途中で得た情報をメモリに保存し、最後に結果を振り返る。このループは、対象業務が限定されていれば効果的であるとアンソニー氏は説明する。

　しかし、ツールや知識を増やし、AIエージェントの責任範囲を広げると、単一エージェントの限界が見えてくるという。代表的なわなは以下3つだ。

1．コストとレイテンシの非線形な増加

　AIエージェントが扱うツールや文脈が増えると、計画、実行、記憶、内省の全ての段階が重くなる。計画時には、より多くの選択肢から最適な手順を選ばなければならない。実行時には、どのツールをいつ使うかの判断が難しくなる。メモリに蓄積された情報が増えれば、毎回の判断で参照する文脈も肥大化する。内省の段階でも、重要な情報がノイズに埋もれやすくなる。

　その結果、以前は数秒で終わっていた処理が遅くなり、トークンの使用量も増える。問題は、機能を増やした分だけコストが増えるという単純な話ではない。意思決定そのものが重くなり、1件の成功に必要なコストが急増する点にある。

2．エラーの波及

　あるユーザーが、「ワシントンへの旅行を予約して」と依頼したとする。AIエージェントが「ワシントン」を「ワシントンD.C.」と解釈して航空券、ホテル、交通手段の手配を進めたが、ユーザーが意図していたのは「ワシントン州」だったとする。

　この場合、AIエージェントの最初の誤解は小さなミスに見える。だが、誤った前提を基に計画が立てられ、ツールが実行され、結果がメモリに保存される。つまり、最初の誤解が後続の処理全体を汚染する。ユーザーが途中で確認するチェックポイントがなければ、AIエージェントは誤った文脈のまま自律的に処理を進めてしまう。

　AIエージェントの失敗が危険なのは、ミスがその場で止まらないことだ。失敗は単発のエラーではなく、時間をかけて計画、実行、記憶へと広がる。

3．中央集権化の限界

　1つのAIエージェントに全ての判断、全てのツール、全てのメモリ、全ての責任を持たせると、対応範囲が広がるほどシステムは脆弱になる。

　企業に例えれば、開発、人事、マーケティング、サポートの全ての意思決定を1人のリーダーに集中させるようなものだ。組織が小さいうちは成立可能だ。しかし規模が大きくなると、判断は遅くなり、文脈の切り替えは増え、ミスが起きやすくなる。

　AIエージェントも同じだ。単一エージェントに責任を集中させると、文脈はノイズだらけになり、状態管理は難しくなり、失敗は連鎖しやすくなる。これはモデルの能力不足ではない。責任の分配をどう設計するかという、システム設計の問題である。

解決策は責任を分散すること

　AIエージェントを実運用で拡張するには、単一のエージェントに全てを任せる発想から離れる必要がある。必要なのは、システムを複数のコンポーネントやエージェントに分解し、それぞれの責任範囲を限定することだ。

　各AIエージェントのスコープを狭めれば、扱う文脈は少なくなり、判断も単純になる。結果として、個々の意思決定は安価で、速く、予測しやすくなる。失敗が起きても、その影響範囲を限定しやすい。

　これが、マルチエージェントシステムが必要とされる本質的な理由である。流行として複数のAIエージェントを並べるのではない。単一エージェントに集中していた責任を分散し、判断の大きさを制御し、失敗の連鎖を防ぐために分解するのだ。

　ただし、マルチエージェント化すれば自動的に問題が解決するわけではない。責任を分けた瞬間、今度はAIエージェント同士をどう連携させるかという新しい課題が生まれる。どのAIエージェントにどの仕事を任せるのか。情報をどの粒度で渡すのか。どこで確認し、どこで処理を止めるのか。拡張の成否は、この調整設計に左右される。

能力拡張には「水平」と「垂直」がある

　AIエージェントシステムに新しい機能を追加する方法は、大きく2つある。水平方向の拡張と、垂直方向の拡張である。

　水平方向の拡張は、新しい役割を持つ独立したAIエージェントを追加する方法だ。例えば、調査支援システムにファクトチェック専門のAIエージェントを追加するケースがある。ファクトチェックは、独立したロジックやポリシーを持ち、システム内の複数の場面で再利用できる。こうした機能は、専用エージェントとして切り出すことで責任範囲が明確になる。

　ただし、水平方向に拡張すると、AIエージェント間の調整コストが増える。情報の受け渡し、処理順序の管理、依存関係の整理が必要になり、通信や連携のオーバーヘッドも大きくなる。役割を分ければ分けるほど、今度は調整層の設計が難しくなる。

　一方、垂直方向の拡張は、既存のAIエージェントの中に新しいツールやサブ機能を組み込む方法だ。例えば、文書検索エージェントの中に、検索結果のランキングやフィルタリング機能を持たせるケースがある。ランキングやフィルタリングは、検索処理と密接に結び付いており、同じ文脈を共有した方が判断しやすい。無理に別エージェントへ切り出すと、かえって処理が分断される。

　ただし、垂直方向に拡張すると、個々のAIエージェント内部の複雑性が増す。扱う文脈が膨らみ、判断コストやレイテンシが増大する。調整コストは抑えられるが、その分、1つのAIエージェントに複雑さが集中する。

　設計の判断基準は明確だ。機能が独立しており、複数の場面で再利用できるなら、新しいAIエージェントとして分割する。一方、既存の処理と密接に結び付いており、共通の文脈に強く依存するなら、既存のAIエージェントに埋め込む方がよい。

　重要なのは、複雑性が消える訳ではないという点だ。水平方向に拡張すれば、複雑性は調整層に移る。垂直方向に拡張すれば、複雑性は個々のAIエージェント内部に蓄積する。設計者は、どこに複雑性を置くのかを意図的に選ばなければならない。

勝つのは「最も賢いモデル」を使うチームではない

　AIエージェントの拡張は、能力を高める一方で、コスト、レイテンシ、エラー、調整の難易度も同時に増幅する。AIエージェントにできることを増やすほど、システムは便利になるが、同時に問題が発生しやすくもなる。

　これからのAIエージェント開発で重要になるのは、単に高性能な大規模言語モデル（LLM）を選ぶことではない。どの判断をどこに持たせるのか。どこまで自律的な実行を許すのか。どの段階で人間の確認を挟むのか。メモリをどの単位で管理するのか。失敗したときにどこで止めるのか。こうしたアーキテクチャ上の意思決定が、実運用での成否を分ける。

　成功するチームは、AIエージェントの能力を無制限に広げようとはしない。意思決定の範囲を適切に限定し、コストを意図的に管理し、エラーが起きてもシステム全体が崩れない構造を設計する。

　AIエージェントは、デモで動くだけでは不十分である。業務で使えるシステムに育てるには、モデルの賢さだけでなく、責任の分配、文脈の管理、失敗の封じ込め、調整コストの制御が欠かせない。今後、AIエージェント活用で成果を出すのは、最も強力なモデルを使うチームではなく、判断を小さく保ち、コストを意図的に扱い、知能が崩壊せず積み上がる設計を作れるチームである。

本稿は、IBM Technologyが2026年6月9日に公開した動画「Building AI Agent Systems and Scaling Challenges in Agentic AI」を基に作成しました。