AIエージェントを導入してもPoC(実証実験)でとん挫する企業は後を絶たない。成功の鍵は、AIそのものよりも「業務プロセスの標準化」と「マルチエージェントによる連携」にある。本番環境で成果を出すための勘所を明かす。
エージェンティックAIの導入は劇的な効率化が見込めるが、多くの企業はいまだに実務でどう機能させるか模索している段階だ。
CIOにとって、その成否は重要だ。エージェンティックAIを配置できれば、圧倒的な生産性向上を実現できる。一方で失敗すれば、プロジェクトはパイロット運用のまま停滞する。こうした緊張感から、本番環境への導入に向けた実務的な指針を求める声が高まっている。
Info-Tech Research Groupで応用AI担当プリンシパル・リサーチ・ディレクターを務めるマーティン・ブフィ氏は、企業のAI活用を本番環境で動作するエージェント駆動型ワークフローへと昇華させる支援を担っている。以下のインタビューでは、請求書処理やITサービスマネジメント(ITSM)といった初期の成功事例や、企業が苦戦しているポイントを解説するほか、実験の域を超えて規模を拡大するために、なぜマルチエージェントアーキテクチャや強固なガバナンス、コード主導の開発アプローチが必要なのかを明らかにする。
AI専門家のマーティン・ブフィ氏は、エージェンティックAI(自律型AIエージェント)の導入に向けたベストプラクティスとして以下を推奨している。
自動化を試みる前に、業務プロセスを標準化し、明確に定義しなければならない。
実環境での実装は、逐次または並列で動作する複数のエージェントを連携させるシステムに依存する。
ガードレール、アクセス制御、オブザーバビリティー(可観測性)、継続的な評価が必要だ。
ワークフローの全てのステップで、最も強力で高価なモデルが必要なわけではない。
既製品のエージェントがそのまま動作することはまれで、コードによる開発が必要になる。
CIOは、事前に明確なビジネス指標を定義しなければならない。
エージェンティックAIを一時的なプロジェクトではなく、継続的なライフサイクルとして扱う専用チームの構築が増えている。
ブフィ 私の専門はAIです。2013年からこの分野に携わり、ロボットシステムに始まり、フィンテック、ヘルスケア、製造業へと歩んできました。Info-Techに加わったのは、応用AIの知見と戦略面を融合させるためです。クライアントのユースケースを「エージェント化」し、エンドツーエンドのワークフローに対応した企業グレードのエージェントを構築しています。チームが実業務で運用できるプロトタイプの開発が主な任務です。
ブフィ 世間では汎用(はんよう)的なタスクをこなす新しいフレームワークが話題ですが、私はエンタープライズ向けのアプリケーションに注力しています。企業では、エージェントに厳格なガードレールと評価の仕組みが求められます。プロトタイプを作る際は、全社的な採用を見据え、ユースケースを特定しなければなりません。その上で、企業がバックエンドシステムに接続し、自律的に動作できるようなエージェントの構築方法を検討します。
多くの業務は、人事のオンボーディング(新入社員研修)、財務、コンプライアンス、在庫分析、レポート作成などが中心です。これらは複雑なワークフローですが、エージェントが構造化された反復タスクを担うことができます。
私たちは、一見地味なバックエンド業務に焦点を当てています。複数のシステムからデータを引き出し、文脈を理解して判断を下す、多段で長いプロセスです。これらを完結させるため、プロセス固有のカスタムエージェントを構築し、多くの場合、マルチエージェントアーキテクチャによってワークフロー全体をオーケストレート(連携管理)します。
そこへ安全性のためのガードレールと、継続的なテストや改善するための評価フレームワークを重ねます。構築は全行程の半分にすぎません。残りの半分はメンテナンスで、ここで多くのAIプロジェクトが挫折してしまうからです。
ブフィ トップクラスのユースケースは請求書管理、もう1つはITSMです。組織には社内から大量のチケット(問い合わせ)が届きます。エージェントはこれらを分類し、優先順位を付けるのに役立ちます。また、システムの稼働状況やネットワーク、アプリケーションの可用性を確認することで、一般的な問題を自ら解決することも可能です。
他にも、財務プロポーザルのレビューや民間ローンのリスク評価といった財務分析分野もあります。これらは通常、最終報告書を作成するために複数のチームが協力する必要があります。これまで2、3カ月かかっていたワークフローが、約1週間で完了した例もあります。エージェントが重労働の大部分をこなし、人間はレビューと承認に専念する形です。
今日のエージェントは特定の部門内で垂直に動くのではなく、業界を問わず水平に展開されています。金融、製造、ヘルスケアのどこであっても、人事、ITSM、請求書処理といった共通のワークフローがあるからです。
ブフィ 最大の課題の1つは、ワークフローそのものから着手することです。多くの組織ではプロセスが標準化されていません。ITサービスデスクの業務でさえ、担当者ごとにやり方が異なる場合があります。明確に定義された一貫性のあるプロセスフローがなければ、その業務を自動化したり、エージェント化したりするのは極めて困難です。
第二の課題は、標準化されたワークフローからマルチエージェントシステムへと移行することです。多くの人は、1つのエージェントに全てのタスクをやらせようとします。しかし私たちの経験上、単独のエージェントで解決できたユースケースは一度もありません。常にマルチエージェントアーキテクチャになります。
これにより、エージェント間の連携(オーケストレーション)という新たな複雑さが生じます。ワークフローに応じて、逐次実行、並列実行、あるいはステップ間の論理ゲートとして機能するパターンなどが必要になります。適切なアプローチはワークフローの構造と力学によって決まり、この連携設計こそがシステムを機能させる鍵となります。
ブフィ 1つはモデルとコストの最適化です。全てのステップで最先端のモデルが必要なわけではありません。チームは性能と効率のバランスを取り、ワークフロー全体でFinOps(クラウド家計簿的なコスト管理)を実践する必要があります。
もう1つはガードレールです。入出力の制御だけでなく、エージェントがツールやシステムと安全に対話し、勝手にデータを消したり、意味不明な内容や不適切なコンテンツを生成したりしないよう、エージェントレベルの安全策が必要です。
また、評価もですが、欠落していることが多いです。多くのCIOが「AIを導入した」と言いますが、「評価の仕組みはどうなっていますか」と聞くと、たいていは「まだありません」という答えが返ってきます。これは危険な兆候です。評価がなければ、回帰テストも、問題の検知も、エージェントが時間とともに改善されているかどうかの測定もできないからです。
最後に、「簡単にエージェントが作れる」というツールの約束と、本番レベルのシステムを構築する現実とのギャップです。実際、多くのエンタープライズワークフローでは、ローコードプラットフォームが示唆するよりも、コード主導のエンジニアリング重視のアプローチが必要になります。「ワンクリック」でワークフロー全体を自動化するエージェントなど、本番環境では一度も見かけたことがありません。
ブフィ 高度なカスタマイズが必要です。ワークフローの扱いは組織ごとに異なります。ERPシステム、データ形式、プロセスがバラバラなので、そのまま使える「既製品」のエージェントは存在しません。人事やITSM向けの汎用エージェントを作ることはできますが、それでも特定の組織のやり方に合わせて調整する必要があります。
信頼性の確保も課題です。言語モデルは本質的に非決定論的で、同じ質問をしても異なる答えが返ってくることがあります。企業環境では、これは許容されません。そのため、カスタマイズの主要な目標は、エージェントをより決定論的にすることです。明確なルールと定義された処理方法を与えることで、ハルシネーション(もっともらしい嘘)を減らし、ばらつきを抑えます。
Pythonなどのプログラム言語を使用すれば、ツール、ワークフロー、ガードレール、評価、デプロイまで、エージェントのライフサイクル全体を構築し、各ステップを組織のニーズに合わせてカスタマイズできます。
ブフィ 考慮すべき点は多岐にわたります。まずはガードレールです。これは悪意のある利用者に対する第一の防衛線であると同時に、エージェントの動作を統制する手段でもあります。
次に、効率性とFinOpsについてのガバナンスです。1つのワークフローで複数のエージェントを動かす場合、ツールを使いすぎていないか、不必要な失敗を繰り返していないかを確認する必要があります。動作の最適化もガバナンスの一部です。さらに、品質の確保も欠かせません。リアルタイムでも事後評価でも、エージェントが正しい出力を生成しているかを確認する必要があります。
これは評価と直結しています。評価なくしてガバナンスは成立しません。時間とともに性能をテストし、監視し、改善していくための手段だからです。アクセス管理も重要です。エージェントに無制限の権限を与えるのではなく、範囲を限定します。例えば、SQLデータベースへのクエリ(参照)は許可しても、削除は許可しないといった具合です。また、アクションを監視し、必要に応じてロールバックできるよう、制御された環境で実行させます。
最後は、これらを統合するオブザーバビリティー(可観測性)です。思考プロセス、ツールの使用状況、エージェント間の引き継ぎについて完全な追跡可能性を確保し、エージェントが「何を、なぜ行ったのか」を理解できるようにします。
ブフィ 採用の決め手は「買うか作るか」の判断に集約されます。多くの組織はエージェントを採用したいと考えていますが、ゼロから(やり直す構築する技術チームを持っていません。そのため「買う」アプローチを選択し、Microsoftなどの特定ベンダーに合わせ、Copilotのようなツールに頼ることになります。
しかし、より複雑なワークフローでは、Copilotには限界があります。それは主に「支援」のためのユースケース向けに構築されており、そこから先へは進めません。ある時点で、組織はそのワークフローがコード主導のアプローチを正当化するほど複雑かどうかを判断しなければならなくなります。
その一歩を踏み出す場合、Azure AI FoundryやOpenAIなどのプラットフォームを活用し、エージェントの構築と展開の方法を根本から考え直すことになります。これは多くの場合、かつてのRPA(ロボットによる業務自動化)のように、エージェントによる自動化に特化した専用チームの設立や、スキルアップの取り組みへとつながります。
現在、採用の在り方が変化しています。実験をいつまでも続けることはできません。初期のアプローチで結果が出なければ、別の選択肢を探し始めます。正しく行えば投資対効果(ROI)は絶大ですが、そこに至るのは依然として難しく、それが現在の市場で多くの失敗を生んでいる原因です。
ブフィ 第一は、ワークフローの標準化です。驚くほど多くの組織が、明確に定義されたプロセスを持っていません。私が明日その仕事に就いたとしても、プロセスフローに従えばすぐに業務を開始できる状態でなければなりません。
第二に、ビジネス価値を理解することです。なぜ自動化するのか、なぜAIを使うのかを明確に定義しないまま進めようとするCIOがあまりに多い印象です。チケットの件数、プロセスの非効率性、現在のパフォーマンスといった基礎データがなければ、影響を測定することはできません。そして、比較対象がなければ、エージェント導入後の改善を証明するのは困難です。
第三に、KPIを事前に定義することです。エージェントによってどの指標を改善したいのか特定できていない組織が多く見受けられます。明確な課題から出発し、非効率性を数値で把握し、動かそうとしているKPIを確立する必要があります。
ブフィ フレームワークは成熟し続け、何が機能し、何が機能しないのかについての事例研究が増えるでしょう。小規模なワークフローについては、現場主導の開発も続くはずです。しかし、エンタープライズITのリーダーたちは、より複雑で長期間稼働するシステムを構築・管理するために専用のチームが必要だと気付くでしょう。
人間がプロセスから外れることはありません。ユースケースの責任者が置き換えられるのではなく、エージェントを促進し管理する役割へとシフトしていきます。同時に、新しいユースケースを開発し、フルライフサイクルで維持するエージェント専門チームが組織内に構築されるでしょう。AIプロジェクトは、構築して終わりではありません。そこが始まりなのです。
技術チームのスキルアップを図り、ユースケースを自動化し、継続的に管理・改善していく企業が増えています。これは、エージェントチームとビジネス部門の専門家が密接に連携するコラボレーションモデルです。このパートナーシップを解消する方法はありません。それは共有責任なのです。
Copyright © ITmedia, Inc. All Rights Reserved.
AI導入の“レッドフラグ”を見逃すな 倫理の一線を越える前に情シスが確認すべきチェックリスト
Oracleの人員削減が示すAIの代償 IT部門を襲うインフラ費高騰の死角
SAP ERP「自律型AI」導入はなぜ難しい? 成功と失敗の境界線
エージェンティックAIが企業構造を変える? IDCの2026年IT業界予測
瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...