生成AIを用いたソフトウェア開発の効率化を目指す三菱電機だが、PoC(概念実証)で生成AIの技術的な限界に直面したという。どのような方法で課題を克服したのか。プロジェクトの成果や展望を紹介する。
生成AI(人工知能)をビジネスに生かす動きが盛んだ。一方で、その導入には業界特有の課題もある。例えば、製造業では図面を扱うことが欠かせないが、生成AIにとって、こうした複雑で視覚的な情報を理解することは難しい。
この課題に直面したのが、総合電機メーカーの三菱電機だ。開発プロセスへの生成AI活用を試みた同社は、PoC(概念実証)で技術的な壁にぶつかる。PoCで期待する成果を出せず、本格導入に至らない「PoC倒れ」も危ぶまれた中で、どのように課題を克服したのか。
2000年代初頭からソフトウェア開発のプロセス改善に取り組んできた三菱電機は、2024年、業務における生成AI活用を検討開始。開発現場へのヒアリングを基にユースケースを吟味した結果、「ソフトウェア改修の影響範囲の特定」に生成AIを活用することにした。
従来ソフトウェア開発部門は、製品開発部門から改修依頼を受領した際、仕様書の確認から修正対象のソフトウェアの列挙、ソースコードの確認、影響範囲の特定までを人手で進めていた。このプロセスを生成AIに置き換えることにした。
具体的には、開発者がソフトウェアの変更要求を入力すると、影響のある設計書と該当箇所を生成AIがリストアップしてくれるシステムの構築を目指した。ツールにはAmazon Web Services(AWS)の生成AIアプリケーション構築サービス「Amazon Bedrock」(以下、Bedrock)を選定。AIモデルにはAnthropicの「Claude 2.1」を使い、「RAG」(検索拡張生成)によって設計書のテキストデータを検索させることにした。RAGは、学習データ以外に外部のデータベースから情報を検索、取得し、LLMが事前学習していない情報も回答できるように補う手法。
PoCを進める中で、三菱電機はある課題に直面する。設計書のテキストデータを基に検索するやり方では、設計書の大部分を占める図表データが欠落してしまうため、思ったような検索ができなかったのだ。
設計書には、テキスト以外にも図表やインデントといった視覚的な情報が多用されている。特に図表は各製作所独自のフォーマットで記載されることもあり、読み解くには“社内の暗黙知”が必要だ。これまで開発者の見やすさを重視してきた構成が、生成AIにとっては理解しづらいものになっていた。「この課題が見つかったとき、『世間は生成AIで盛り上がっているが、組み込み系開発では使えないのではないか』と感じました」。こう話すのは、三菱電機の生産システム本部でソフトウェアの改善活動を進める長峯 基氏だ。
2024年7月、状況に変化の兆しが見え始める。「Claude 2.1」の次世代モデル「Claude 3」がBedrockで使えるようになったのだ。Claude 3はマルチモーダルモデルであり、テキストだけでなく画像も扱える。
しかし、単にClaude 3に図表を使うだけでは目指す精度が出せなかった。そこで三菱電機は、「RAGの検索精度を高めるために、検索対象となる設計書にメタデータを付与する」というアプローチを採った。メタデータをベクトル形式(数値型の構造体)のデータとして保存し、そのキーワードを基に検索する仕組みだ。
過去数十年で蓄積されたドキュメントに、手動でメタデータを付与するのは現実的ではない。そこでメタデータの付与には「Claude 3 Sonnet」を使った。設計書を画像としてClaude 3 Sonnetに読み込ませ、内容をテキストで要約してもらう。その内容を基に、設計書に対してメタデータを付与した。
内容を詳細に説明させるとハルシネーション(LLMが不正確な回答を出力する幻覚)が起きやすいため、必要最低限の説明にとどめるような工夫も必要だったという。
メタデータ付与後、システムの検索精度は60〜70%向上した。ソフトウェア改修における影響範囲の特定や、設計書や仕様に関する問い合わせの応対に生成AIを活用すれば、開発工数を20〜40%削減できる見込みだ。従来はこれらのプロセスに、改修依頼1件当たり約1カ月のリードタイムを要していた。これは他のタスクと並行した場合の数字のため、さらに短縮できる可能性もある。
開発現場からは、システムに対する肯定的な意見が寄せられているという。特に、複数のファイルに格納してある仕様書やマニュアルをまとめて検索し、提示してくれる点が好評だ。一方で、システムは検索漏れを最優先で回避するように設計されているため、無関係なファイルが含まれることもある。この点については改善の余地があると長峯氏は話す。
今回のアプローチは、改修依頼全体の約8割で有効となる見込みだ。改修の影響が広範に及ぶといった特殊なケースも約2割あり、こうしたケースにも同じ手法が使えるかどうかは、今後検証を進めていく。2024年9月時点ではまだPoCの段階だが、長峯氏は「稼働まで持っていけるはず」と確信に近いものを持っている。2024年11月ごろの社内展開を目指し、ソフトウェア開発部門はもちろんハードウェア設計部門や品証部門とも連携し、環境整備を進めているさなかだ。
Copyright © ITmedia, Inc. All Rights Reserved.
なぜ料理の失敗写真がパッケージに? クノールが展開する「ジレニアル世代」向けキャンペーンの真意
調味料ブランドのKnorr(クノール)は季節限定のホリデーマーケティングキャンペーン「#E...
業界トップランナーが語る「イベントDX」 リアルもオンラインも、もっと変われる
コロナ禍を経て、イベントの在り方は大きく変わった。データを駆使してイベントの体験価...
SEOを強化するサイトの9割超が表示速度を重視 で、対策にいくら投資している?
Reproが「Webサイトの表示速度改善についての実態調査 2024」レポートを公開。表示速度改...