見えない文字は推論する SAP Concurが「Gemini」で挑む“手入力ゼロ”への道AIエージェントが不足データを補完

経費精算における「読めない領収書の手入力」は依然として面倒な作業だ。従来の読み取り技術が抱えるこの限界を、SAP Concurは「Gemini」を活用して突破したという。不足する情報をどのように補っているのか。

2026年05月12日 05時00分 公開
[TechTargetジャパン]

関連キーワード

人工知能 | Google | OCR | 財務経理


 経費精算業務において、不鮮明な領収書の処理は依然として手作業が生じる課題だ。ポケットの中で丸まった領収書、汚れや日焼けによって印字がかすれた領収書などは、従来の光学式文字認識(OCR)技術では店舗の住所や明確な日付といった必須データが読み取れず、システムの処理が中断していた。その結果、従業員は手作業で不足情報を入力する手間が残り、完全な自動化の障壁となっていた。

 こうした課題を解決するため、出張・経費管理システムを手掛けるSAP Concurのエンジニアリングチームは、スキャン精度の向上ではなく、AI(人工知能)モデルの推論によるデータの補完という手法を取り入れた。具体的には、経費管理システム「Concur Expense」の領収書読み取り機能である「ExpenseIt」に、GoogleのAIモデル「Gemini」を組み込んだ。これによって従業員が撮影した不鮮明な領収書であっても、AIモデルが文脈から不足情報を推論し、経費項目の入力を完了させることが可能になった。

 これは単なる読み取り精度の向上ではなく、AIモデルが「領収書に記載されていない情報」を推論し、エラーを防いでいる。SAP ConcurはGoogleのサービスを用いて、どのように「自律的に思考するAIエージェント」を開発したのか。

読めない文字はAIに推測してもらう

 SAP ConcurがGoogleと協力して構築したのは、Geminiを中核とする「Receipt Analysis Agent」(領収書分析エージェント)だ。標準的な経費の自動化システムは、領収書に「記載されている内容」を把握することには長けているが、「記載されていない情報」を把握することはできない。これに対してReceipt Analysis Agentは自ら推論し、判断を下し、アクションを実施する能力を備えている。

 「メインストリートカフェ」という店名と「パリ」という都市名のみが印字され、詳細な住所の記載がない領収書がアップロードされたとする。従来であれば自動化プロセスが中断する場面だが、Receipt Analysis Agentは、その取引が「テキサス州ダラス行きのフライトとテキサス州グリーンビルのホテル」を予約している出張日程と一致していることをコンテキストから分析する。その結果、「この店舗はフランスのパリではなく、出張先であるテキサス州内に実在する『パリ』という同名の都市にあるレストランである可能性が高い」と推論し、不足情報を補完する。

 この仕組みは、以下の5つのステップで構成されている。

  1. 取り込み
    • 従業員がSAP Concurのモバイルアプリケーションを通じて領収書の写真をアップロードしたり、スキャンデータをアップロードしたり、デジタル領収書をメールで転送したりする。
  2. OCRによるデータ抽出
    • 従来のOCR技術を用いて、領収書から確実に読み取れるテキスト情報を抽出する。
  3. AIエージェントへの自動振り分け
    • 抽出されたデータに不足がある場合のみ、Geminiで構築されたAIエージェントに処理を転送(ルーティング)する。
  4. コンテキストに沿った推論
    • AIエージェントが出張日程などの事実データと領収書を照らし合わせ、不足情報を推論する。
  5. 推論の検証と実行
    • Receipt Analysis Agentが、ロケーション履歴などの情報と照らし合わせて推論が正しいかどうかを検証し、正確性を保証した上で経費入力を完了させる。

 このAIエージェントを成功に導いたのは、Googleのシニアエンジニアであるアントニオ・グリ氏の実践的ガイド『Agentic Design Patterns』に基づく「3つの設計パターン」の導入だ。

 第一に「ルーティングパターン」だ。全ての領収書をAIエージェントに処理させるのではなく、OCRの信頼スコアが高い領収書は従来のOCR処理に回し、スコアが低いものだけをAIエージェントに振り分けるアーキテクチャを採用した。これによって、計算処理にかかる費用と推論の両方を最適化している。

 第二に「自己検証パターン」だ。AIモデルは基本的なチャットbotのように単に回答を生成するのではなく、内部で「ジェネレーター」と「評価者」(検証者)のループを回す。AIモデルが仮説を生成した後、評価者として確立されている事実と照らし合わせて確認することで、正確な判断を下す。

 第三に「ツール使用パターン」だ。Receipt Analysis Agentが出張予約・管理ツール「Concur Travel」から得られる出張日程などの情報にAPI経由でアクセスできるようにしている。これによって、Receipt Analysis Agentは事実に基づかない推測を排除し、正しい情報を取得できる事実確認ツールとして機能している。

 このプロジェクトのポイントは、Geminiを単なる「生成ツール」として活用するのではなく、「ロジックエンジン」として活用したことだ。SAP Concurは、AIの最大の価値が「手元にあるデータの処理」ではなく、「不足データの推論による取得」であることを証明した。今回採用されたルーティング、自己検証、ツール使用のアーキテクチャパターンは、Google Agent Development Kit(ADK)にすでに組み込まれている。

 今後は、「Googleマップ」のデータと領収書を照合した店舗の実在確認や、「Googleウォレット」と連携した取引タイムスタンプの瞬時照合といった機能の拡張を計画している。軽量AIモデル「Gemini Nano」や、AIモデルを「Android」搭載デバイスで稼働させる実行環境「Android AICore」などの技術を活用し、機密性の高い処理をデバイスで実行することで、プライバシーを確保しながら迅速に操作できる未来も描いている。

Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。

アイティメディアからのお知らせ

From Informa TechTarget

瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓

瞬時にM365が乗っ取られる――全社員に周知すべき“新フィッシング”の教訓
MFA(多要素認証)を入れたから安心という常識が崩れ去っている。フィッシング集団「Tycoon2FA」が摘発されたが、脅威が完全になくなったというわけではない。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...