3カ月で1年分の予算が消滅? AI導入で情シスが陥る「トークン破産」を防ぐにはAI運用費が人件費を超える逆転現象も?

LLMの利用拡大に伴い、AIのトークン消費によるコスト増大が企業の新たな課題となっている。Pegasystemsは、AIの利用量ではなくビジネス成果に応じて料金を設定する新たな課金モデルを紹介する。

2026年06月16日 05時00分 公開
[Bill GoodwinTechTarget]

 大規模言語モデル(LLM)の利用コスト増大が、企業に再考を促している。AIモデルの高度化に伴い、クエリ当たりの「トークン」費用が大幅に増加した。一部では、驚くほど高額な請求が発生する事態も起きている。

 AI活用には固有の変動性があり、タスクごとのコスト予測はもはや困難だ。CRM(顧客関係管理)ベンダーPegasystemsの最高技術責任者(CTO)、ドン・シューマン氏は「同じプロンプトでも、ある日は即座に回答が返ってくるが、別の日は5分かかり、月間のトークン予算の10%を消費することもある」と指摘する。

 多くの企業は、組織にもたらすメリットを十分に検証しないまま、従業員にAI活用の最大化を促してきた。こうした「トークン利用の最大化」(トークンマクシング)は、企業に予想外の請求書を突き付けている。

 2026年5月には、UberのCTOプラビーン・ネッパリ・ナガ氏が、同社で利用している「Claude Code」の2026年分の予算を、年初からわずか3カ月で使い果たしたことを明らかにした。

AIトークンのコスト増を避けるための勘所は

 AIデータセンターへの投資圧力やエネルギーコストの上昇を受け、AIサプライヤーはここ数カ月で値上げに踏み切っている。これを受け、企業はAIへの支出が本当に見合うものなのかを問い始めている。

 シューマン氏によると、人間をAIに置き換えたものの、結果としてAIの運用コストが、置き換えた人件費を上回ってしまったケースもあるという。

 サンフランシスコ連邦準備銀行の総裁兼CEO、メアリー・デーリー氏は最近、ブルームバーグのインタビューでこう要約した。

 「生産性の向上は、データ以外のあらゆる場所で見られる」

 「モデルがより洗練されたことが原因だ」とシューマン氏は本誌Computer Weeklyに語る。

 「モデルは自己推論を行い、必要に応じて他のエージェントを呼び出して別の処理を実行する。その処理が進む間も、トークン消費は増え続けているのだ」

AIコストの現実に目覚める企業

 同氏は、AIのコストがモデルの計算回数に比例して直線的に増えるわけではないことに、企業が気付き始めていると主張する。

 「プロセスの各ステップが積み重なることで、コストは増大していく」

 AIを使ってビジネスプロセスを実行する場合、最初のステップに500トークンかかるとする。次のステップでは最初の文脈を引き継ぐ必要があるため1000トークン、3番目のステップでは1500トークンというように、必要なトークン数は増えていく。

 計算が複雑になり、より多くのコンテキストが必要になると、コストが増すだけでなく、AIが「ハルシネーション」(もっともらしい誤情報)を起こしたり、予測不能な動作をしたりするリスクも高まる。

 「大切なのは、反復可能なプロセスを正しく定義し、設計し、ベストプラクティスに沿っていることを確認することだ。そのためには、それほど多くのAIは必要ない」(シューマン氏)

 Pegasystemsが提案するAIコスト抑制の答えは、AIをより戦略的に活用することだ。同社はFortune 500企業向けに、ビジネスプロセスの自動化や顧客関係管理を支援するローコードプラットフォームを提供している。

 同社は、AIトークンの使用量ではなく、ビジネス上の成果(アウトカム)に応じて料金を設定する新たな課金モデルを発表した。シューマン氏は、企業が必要とする大量かつミッションクリティカルな業務プロセスの少なくとも60〜70%は、ルールベースのアプローチで自動化できると主張する。

ワークフローの設計

 Pegasystemsのソフトウェア「Pega Blueprint」は、AIを活用して企業向けの自動化ワークフローの設計を支援する。

 AIは設計段階で大部分の作業を担うため、プロセスが実行されるたびにAIエージェントがワークフロー全体をゼロから考え直す必要はない。

 一方で、ワークフローの中からAIエージェントを呼び出し、文書の要約や人間への入力依頼といった特定のタスクを実行させることは可能だ。これにより、企業はAIの推論機能をコントロールした形で利用できる。

 同社は、自動化ワークフローをオープンソースの「Model Context Protocol」(MCP)に対応させた。これにより、企業は「Anthropic Claude」「Google Gemini」「OpenAI」「Amazon Bedrock AgentCore」など他社プラットフォーム上で構築したAIエージェントから、Pegaが提供する業務プロセスやワークフローを利用できるようになる。

 シューマン氏によれば、MCPへの対応は「比較的容易な取り組み」だったという。同社は、組織がどのようなソフトウェア経由でワークフローにアクセスするかについて中立的な立場を取る。例えば、フロントエンドとしてPegaを使わなくても、「Salesforce」など他社製ソフトウェアからPegaのワークフローを利用できる。

 しかし、企業にとってこの変化は大きな意味を持つと同氏は言う。既存のAIエージェントをそのまま活用しながら、Pegaが定義したワークフローに沿って業務を実行させられるようになるためだ。

 「Pega MCPに接続すれば、AIエージェントは過剰な推論をすることなくルールに従う。適切なワークフローや必要なスキルを見つけるために、比較的単純な呼び出しを行うだけで済む」とシューマン氏は述べる。

AIは「並外れたもの」を生み出せない

 自動化が進んでも、AIが人間の創造性に取って代わることはないとシューマン氏は断言する。同氏によると、人間とは異なり、AIは並外れたものを生み出したり、真の創造性を示したりはしない。「AIは、これまで学習してきた膨大な情報の平均を出しているに過ぎない」

 同氏はそう指摘した上で、「私たちがやりたいのは、アイデアが生まれてから、それが従業員の働き方や顧客との関わり方に意味のある変化をもたらすまでの時間を、できる限り短縮することだ」と語る。

 その結果、人間は戦略やアイデア、創造性により多くの時間を割けるようになる。シューマン氏によれば、世の中は「ChatGPT」や「Claude」の次期バージョンに注目し過ぎている。しかし、昨年のバージョンでも十分な性能を備えていたはずだという。

 「難しいのは、AIの持つ可能性を人々にとって現実の価値へと変えることだ。それこそが、最も興味深い仕事だと私は考えている」

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓

瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...