次世代型のRPAとして注目を集める「大規模アクションモデル」(LAM)とは一体何なのか。ユーザー企業の事例と、評価するポイントを解説する。
テキストや画像を自動で生成するAI(人工知能)技術生成AIを用いて、従来の「RPA」(ロボティックプロセスオートメーション)よりも迅速かつ安価なプロセス自動化を目指す動きがある。その取り組みを進める一社であるOrby AIのツールは、「大規模言語モデル」(LLM)ではなく「大規模アクションモデル」(LAM)を採用している。これによって何が可能なのか。
2022年、大手RPAベンダーUiPathの元プロジェクト管理担当ディレクターであるベラ・リウ氏と、Googleの元エンジニアリング責任者ウィリアム・ルー氏は、ビジネスプロセス自動化ツールのベンダーOrby AIを設立した。
リウ氏によると、LAMを採用した同社のツールは「観察」「学習」「自動化」の仕組みに基づいて動作する。つまり、ツールがエンドユーザーのPC操作を観察して作業プロセスを理解し、作業プロセスのスクリプトやソースコードを自動生成してエンドユーザーに提示する。エンドユーザーは内容を確認し、自動化するか拒否するかを選ぶといった具合だ。「エンドユーザーはコーディングの知識を求められることはなく、普段通りに仕事をして、そのプロセスを見せるだけでよい」とリウ氏は説明する。
LAMは、テキストだけでなく画像も扱えるマルチモダールモデルだ。ユーザーの画面、HTML、URLといった、アクションデータを入力情報として利用できる。そうした入力情報から作業の目的と具体的な手順を理解し、それに基づいて解決策を見つけ出すのがLAMの特徴だ。「LAMは、エンドユーザーの代わりに作業をするためのアクションを生成しているに過ぎない」とリウ氏は補足する。
不動産サービス企業Jones Lang LaSalle IP(JLL)は、2024年初頭からOrby AIのツールを試験的に運用しており、各種プロセスの自動化に取り組んでいる。
例えば請求処理プロセスでは、請求書を発注書と照合し、内容が一致した場合に支払い処理を進める。請求書には「Microsoft Word」文書や電子メールといったテキストデータ(非構造化データ)が含まれる上に、ページ数が多いため、処理が複雑化しやすい。
JLLでエンタープライズシステムの最高情報責任者(CIO)を務めるブルース・ベック氏は、「複数ページにまたがる請求書は、従来の光学文字認識(OCR)やRPAでは読み取ることが難しかった」と話す。Orby AIのツールは、これらの文書を読み取り、取得したデータに基づいて、次のアクションを決めることができるという。
JLLは、大手RPAベンダーAutomation AnywhereのRPAツールをメインで使用し、一部の業務には、同じく大手RPAベンダーUiPathのプラットフォームを活用している。「これら老舗RPAベンダーのサ−ビスに組み込まれる生成AIは、Orby AIのものほど先進的ではない」とベック氏は評価する。
Orby AIのツールを試した際に印象的だったのが、文書管理機能だったとベック氏は話す。「必要なデータを正確に取得し、ソースコードを自動生成してくれるため、RPA開発者が不要になった」(ベック氏)
JLLがOrby AIと正式契約を締結するかは2024年8月時点でまだ決定していないが、ベック氏は「採用の可能性は高い」とコメントする。ただし、Orby AIに全面的に移行するとしても、しばらくの間はAutomation Anywhereの使用を継続する可能性がある。
次回は、LAMの将来性について解説する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...
SEOを強化するサイトの9割超が表示速度を重視 で、対策にいくら投資している?
Reproが「Webサイトの表示速度改善についての実態調査 2024」レポートを公開。表示速度改...