生成AIの知識を補う「RAG」の魅力とは? 企業はどう使っている?組織の変革に欠かせない

「RAG」(検索拡張生成)は大規模言語モデル(LLM)に外部知識を組み合わせ、より精度の高いアウトプットを可能にする技術だ。RAGを導入し、成果を上げる企業の取り組みを紹介する。

2025年07月07日 05時00分 公開
[雨輝ITラボ(リーフレイン)TechTargetジャパン]

 「RAG」(検索拡張生成)の主な利点は、大規模言語モデル(LLM)が本来は「知らないこと」にも対処できるようになる点にある。LLMは通常、学習時点までに蓄積されたデータしか知らず、それ以降の最新情報や、特定分野の専門性の高い知識には対応できないことがある。RAGはそうした情報のギャップを補完する技術だ。

 ただし、RAGはただ導入すればいいというものではない。事例も参照しながらRAGの必要性と導入のポイントを解説する。

RAGとは何か? なぜ重要視されているのか

 RAGとは、LLMの出力精度を向上させるための手法だ。LLMは事前学習済みのデータに基づいて回答を生成するが、学習データに含まれない情報や最新情報には適切に対応できないことがある。RAGはLLMの知識を補うために、外部の知識ベースから情報を取得し、回答時にそれを参照することでより信頼性の高い回答の生成を可能にする。

 今RAGが注目されているのは、より精度が良い回答の出力と、業務に最適化した柔軟な運用を両立できるからだ。RAGは、ハルシネーション(事実とは異なる情報の生成)を抑えつつ最新情報を反映できることに加え、LLMの再学習なしに回答のソースとなる知識の更新ができる。企業固有のナレッジを組み込めるため、特定業務に適合した回答を生成し、回答の根拠も提示できることから、監査が求められる業界でも導入が進んでいる。

RAGの4つの利点

 RAGを活用することで主に次の利点が期待できる。

1.手間をかけずに社内データを更新できる

 RAGはモデルの再学習をせずに、新しい知識を反映できるため、保守性と運用効率を両立できる。これはスピードが求められる業務環境においても役立つ特性だ。

2.回答の精度を高められる

 汎用(はんよう)LLMは、参照する情報が古かったり、ハルシネーションを引き起こしたりするリスクがある。RAGは、外部のデータソースの情報を参照することで、こうしたリスクを軽減する。

 RAGは応答生成時に参照した文書情報をメタデータとして返す設計が可能なため、出力のトレーサビリティや説明責任の確保がしやすい。

3.非公開の情報を使った独自の回答を生成できる

 RAGの大きな利点は、社内文書、ナレッジベース、顧客データなど、事前学習モデルには含まれない非公開情報を組み込めることだ。特定業務に特化したFAQや社内ポリシーに即すなど、回答のカスタマイズができる。

4.費用対効果を高められる

 既存のデータベースや文書から必要な情報を検索して回答を生成するRAGの仕組みを使えば、LLMを訓練し直す必要がない。これによって初期投資を削減できる。再学習をすることなくデータを更新できるため、運用コストも抑制できるため、企業にとって費用対効果の高いAIモデル活用手法だと言える。

RAGの活用事例

 RAGの導入は、単なる業務支援を超え、組織の情報活用基盤を再構築する鍵となり得る存在だ。組織は情報流通とナレッジ共有の仕組みを見直し、技術資産を組織全体で生かす体制づくりが可能となる。既に以下のような先行事例も出ている。

1.LINEヤフー、年間70〜80万時間の業務効率化を目指す

 LINEヤフーでは、社内規定や技術スタック、問い合わせ履歴などの社内データを統合し、RAGを用いた情報検索ツール「SeekAI」(シークエーアイ)を開発し、全社に展開している。これによりエンジニアのコーディング支援では、使用するツール群や、開発ガイドラインに即した情報を迅速に提示し、工数を削減。広告事業部のサポート業務では、FAQや過去履歴から正確な回答候補を抽出し、約98%の高精度な回答率を実現した。同社はSeekAIをはじめとした生成AI活用により、年間70〜80万時間の業務効率化を目指している。

2.セゾンテクノロジー、データ基盤を“誰でも使える化”

 金融システムの開発と運用を担うセゾンテクノロジーは、RAGを活用した「全社統合データ基盤」を構築、導入している。従来、構造化データの利活用にはデータベース言語SQLを使用する必要があり、エンジニア以外では活用が困難だった。そこでMicrosoftの生成AIサービス群「 Azure OpenAI Service」を活用した生成AIと「ベクトル検索」を組み合わせ、自然言語からSQL文を自動生成し、データの検索や取得ができるRAGシステムを整備した。ベクトル検索とは、テキストや画像などのデータを数値ベクトルとして表現し、そのベクトル間の類似度を計算することで、関連性の高い情報を検索する検索方法だ。

 「7月の営業部門のテレワーク率を教えて」といった自然言語での問い合わせに対し、生成AIが最適なSQL文を自動生成し、データ分析プラットフォーム「Snowflake」のDWH(データウェアハウス)からデータを取得し、回答する。顧客管理、会計、人事など複数システムとも連携し、部門横断の高度なクエリ(問い合わせ)にも対応可能だ。同社はRAGによる自然言語インタフェースで全社データ基盤の“誰でも使える化”を実現し、ビジネス部門の自律的な意思決定を支援している。

3.ゆめみ、セルフオンボーディングを推進

 システム開発会社のゆめみは、新入社員教育においてRAGを活用した自社オリジナルシステムを構築。新入社員が自ら必要な社内情報にアクセスしてセルフオンボーディングを進められる業務環境を整備した。

 「全員CEO」「給与自己決定」など独自制度を導入する同社では、社内情報が頻繁に更新される中、新入社員が必要な情報にたどり着けない、質問処理が属人的で再利用性がないといった課題があった。その解決策として、ビジネスチャットツール「Slack」で稼働する生成AI型QAシステムを構築。社内の情報共有ツール「Notion」のドキュメント群を知識源として、RAG技術により自然言語の質問に対して関連情報を抽出し、LLMで応答を生成する。その結果、新入社員は自分のペースで正しい情報にアクセスでき、オンボーディングの早期完了とメンター負担軽減を実現した。

4.東洋建設、現場の安全確認を効率化

 東洋建設では、RAGと生成AIを組み合わせた「K-SAFE東洋 RAG適用Version」を導入し、現場の安全教育・情報共有の高度化を実現した。

 従来の危険予知ツール「K-SAFE」では、社内の災害防止基準や災害事例が別システムに散在し、必要な情報にすぐアクセスできない、テキスト中心の資料では認識齟齬(そご)が発生するといった課題があった。そこで社内安全データと外部災害データを統合し、AI技術ベンダーOpenAIのAIチャットbot「ChatGPT-4o」を搭載したRAGシステムを開発。自然言語による質問にイラスト付きで回答し、社内外の災害事例や施工資料の横断検索も可能となった。RAGシステムにより、現場での即時安全確認と判断の質の向上、教育効果向上を実現している。


 企業におけるデータ活用ニーズの高まりとともに、RAGは今後さらなる発展が期待される。検索技術の向上により精度が継続的に改善され、マルチモーダル対応で画像や動画も扱えるように進化している。リアルタイム検索機能の強化により、最新情報を参照できるようにもなる。RAGは、DX(デジタルトランスフォーメーション)推進の鍵となるAI活用基盤として、今後さらに重要性を増していくだろう。

関連キーワード

人工知能 | 事例 | チャットbot


Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...