検索
特集/連載

現場で本当に使える「実用的なAI」とは? AIベンダー2社が語る設計のリアルAIの実用性を再考する【後編】

AIエージェントへの期待が高まる中で、その実用性に対しては懐疑的な意見も少なくない。現場で成果を上げるAIシステム設計のポイントを、ベンダー2社に聞いた。

Share
Tweet
LINE
Hatena

 AI(人工知能)市場では、自律的にタスクを遂行できる「AIエージェント」がトレンドだ。マサチューセッツ工科大学(MIT:Massachusetts Institute of Technology)の技術誌MIT Technology Reviewが2025年5月に主催したカンファレンス「EmTech AI 2025」でも、この潮流が色濃く示されていた。

 一方、現場で求められているのは「何でもこなせるAIエージェント」ではなく、「特定の業務に特化したAIシステム」だという意見もある。カンファレンスでは、リーガルテック企業LuminanceとAIスタートアップPoolsideが自社の事例を基に、真に実用的なAIシステム設計のポイントについて語った。

現場で本当に求められる「実用的なAI」とは?

 Luminanceが提供する法律業務向けのAIシステムは、契約交渉やコンプライアンスチェックの自動化に役立つ。その中では、単一の大規模言語モデル(LLM)に依存するのではなく、独自開発モデルやオープンソースモデル、基盤モデルに加え、従来型の機械学習手法も組み合わせている。

 同社のCEOエレノア・ライトボディー氏は、次のように話す。「当社は社内に“AIモデルのリーダーボード”を設けており、各モデルが異なるタスクに対してどれだけの精度を発揮できるかを常に評価している。精度が95%を下回るAIモデルは採用しない」

 Luminanceは「オーケストレーションレイヤー」と呼ばれる統制層を用いて、タスクに応じて最適なAIモデルやツールを選択する構成を採用している。LLMは「どのツールをいつ使うべきか」という判断が得意ではないからだ。

 システム全体を貫く設計思想として重視されているのが、トレーサビリティー(説明可能性)、オブザーバビリティ(観測性)、制御性だ。法務のようにリスクが高く、かつ厳格な規制が求められる分野では、これらの観点が欠かせない。「システムが下した判断全てに証拠を添える必要がある。AIを“信頼できる形”で活用するにはどうすればよいかが常に課題となる」。Luminanceの共同創設者でAIディレクターを務めるグラハム・シルズ氏はこう話す。

 大半の法律業務は標準化された手順に沿って繰り返されるという性質を持ち、AIエージェントとの相性が良い。「法律業務では業務フローを明文化し、関係者全員が同じ手順に従う必要がある。それはAIにとって理想的な環境と言える」(シルズ氏)

 法律業務には煩雑で反復的な作業も多く、こうした業務をAIに任せたいというニーズも根強い。「実際、AIが最も効果を発揮するのは、人がやりたがらない“退屈な仕事”だ。誰もが情熱を注ぎたいと思うような仕事にAIを使う必要はない」。シルズ氏はそう付け加える。

ソースコード生成に特化した独自モデルを構築

 AIコーディングツールを開発するPoolsideは、ソースコード生成に特化した独自の基盤モデルをゼロから構築している。このモデルを企業ごとのコードベースや技術ドキュメントでファインチューニング(追加学習)することで、各社の開発環境に最適化されたAIとして活用できるようにしている。こうした設計により、「Visual Studio Code」や「IntelliJ」などの統合開発環境(IDE)とシームレスに連携できる点も特徴だ。

 汎用(はんよう)的なLLMのほとんどはコード生成が可能だが、それは学習データにソースコードが含まれていたことによる“副産物”に過ぎない。言い換えれば、コード生成を主目的として設計されたわけではないため、プログラミング支援に特化した能力には限界がある。

 Poolsideは、オープンソースのソースコードに依存せず、自社開発したコード実行シミュレーターを用いて合成データを生成し、AIモデルの学習に活用している。同社はこのアプローチを「コード実行からのフィードバックによる強化学習」(reinforcement learning from code execution feedback)と呼ぶ。

 「ソースコードは決定論的であるという特性を持つため、データセットとして優れている」とガルシア氏は説明する。ソースコードは“動くか動かないか”が明確で、コンピュータに通せばすぐにその成否を判別できる。そのため合成データの生成も比較的容易だという。

 ソフトウェア開発は、テストや修正、リファクタリングを繰り返す反復的なプロセスだ。そうした特性が、強化学習との親和性が高い理由でもある。「ソースコードを書くという行為は非常に反復的だ。まず動かしてみて、うまくいかなければ戻って修正し、さらに改善する。基本的にはその繰り返しと言える。だからこそ、ソフトウェア開発の領域では強化学習が非常に効果的だ」(ガルシア氏)

 PoolsideのAIモデルは、複数ファイルにまたがるソースコードの記述やデバッグ、テストの支援が可能であり、特に文脈の把握が難しいエンタープライズ開発環境において高い成果を挙げているという。

 一方で、現行のAIシステムには依然として限界があるとガルシア氏は率直に認めている。現状、AIモデルが得意とするのは、数時間で完結するような小規模の開発タスクにとどまり、システム全体の設計や開発ライフサイクルの完全な自動化にはまだ至っていないという。

関連キーワード

人工知能


Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る