「生成AI+RAG」の“鬼門”を突破するための基礎知識とはAI時代のデータベースの選び方【第4回】

RAGとベクトルデータベースが企業の注目を集める一方で、導入に伴う課題も顕在化している。本稿では、ベクトルデータベース導入の技術的課題を乗りこえるための取り組みや、今後のデータベース市場の動きを解説する。

2024年09月11日 07時00分 公開
[George LawtonTechTarget]

関連キーワード

人工知能 | データベース


 テキストや画像を自動生成するAI(人工知能)技術「生成AI」と、そのベースとなる大規模言語モデル(LLM)の業務利用が広がりつつある。中でも企業の関心を集めるのが、外部データベースからの情報を検索してLLMの回答精度を高める手法「RAG」(検索拡張生成)だ。

 RAGの実装では、テキストや文書、画像といった「非構造化データ」を効率的に扱える「ベクトルデータベース」を使う。ただ、ベクトルデータベースの導入においては幾つかの技術的ハードルが存在する。それは一体何なのか。

「RAG」の鬼門とは? 生成AIを使いこなすための基礎知識

 ベクトルデータベースは、ベクトル形式(数値のリストや配列)でデータを管理するデータベースだ。ベクトルデータベースは検索の際に、テキストや画像などのデータを数値に変換することで、数字を比較してデータ同士の類似性を計算し、検索できる。

 データ分析ベンダーDAS42で主任コンサルタントを務めるジェフ・スプリンガー氏は、「ベクトルデータベースにおけるデータの扱いは、リレーショナルデータベースやSQLとは大きく異なり、専門的な知識や技術が求められる」と説明する。ベクトルデータベースを使いこなせる人材はまだ少ないのが現状だ。

 コンサルティング企業PricewaterhouseCoopers(PwC)でデータおよびアナリティクスプリンシパルを務めるブレット・グリーンシュタイン氏は、ベクトルデータベースの技術的なハードルとして以下を挙げる。

  • システムによるデータの可読性
    • 非構造化データを扱う際は、ベクトル形式に変換して保存し、コンピュータなどの機械が効率的に検索処理できるようにインデックス化する必要がある。ベクトルは、データの種類や特性に応じて適切に管理する。
  • ツールの成熟度
    • ベクトルデータベースには、ロールベースでアクセス制御できるものもあるが、ツールや手法はまだ発展途上だ。利用可能な選択肢はあるものの、具体的な要件を検討し、適切なツールを選ぶことが重要だ。
  • 新しい検索手法
    • ベクトルデータベースでは、大規模な非構造化データを扱うことがあり、従来の検索手法では適切に処理できない場合もある。検索を最適化するためには、各ユースケースに合わせてインデックスを作成したり、データのチャンク化(小さな部分に分けて管理すること)をしたりする作業が必要だ。

 スプリンガー氏は今後、リレーショナルデータベースとベクトルデータベースが統合することで、ユーザーの技術習得が容易になると予測する。例えば2023年6月、クラウドデータウェアハウス(DWH)ベンダーSnowflakeはベクトルデータベースベンダーKXとのパートナーシップ締結を発表した。こうした取り組みは、新技術の導入における課題を軽減させる可能性がある。

 コンサルティング企業Nuvalence(2024年4月にErnst & Young Globalに統合)の共同設立者であるシンクレア・シュラー氏は、「複数のデータベースを併用することで、業務に適するツールを選べる」と話す。構造化データは多くのビジネスにとって欠かせないが、非構造化データを扱うベクトルデータベースやグラフデータベースも併せて活用することで、効果的で包括的なデータ管理と分析が可能になるだろう。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

髫エ�ス�ス�ー鬨セ�ケ�つ€驛「譎擾スク蜴・�。驛「�ァ�ス�、驛「譎冗樟�ス�ス驛「譎「�ス�シ驛「譏懶スサ�」�ス�ス

製品資料 サイボウズ株式会社

「ERP×ノーコードツール」のアプローチを推進するためのポイントとは?

DXが進み、レガシーシステムからの脱却が喫緊の課題となっている今。「ERP×ノーコードツール」のアプローチで基幹システムの刷新に取り組む企業が増えている。そのアプローチを推進するに当たってのポイントを解説する。

事例 サイボウズ株式会社

ローコード/ノーコード開発ツールで実現する、変化に強い組織の作り方

DXの本質は、デジタル技術を駆使して変化に適応する能力を身につけることにある。その手段の1つとして注目を集めているのが、ローコード/ノーコード開発ツールだ。京王グループなどの事例とともに、その特徴やメリットを紹介する。

事例 サイボウズ株式会社

ノーコードツールでDX人材を育成、京セラや日本航空などの事例に学ぶ効果の実態

DX人材の重要性が高まる中、ノーコードツールの活用によって業務改革と人材育成を両立しようとする動きが活発化している。年間約780時間の工数削減を実現した京セラをはじめとする5社の事例を基に、その実態を探る。

事例 アステリア株式会社

ものづくり現場で「足かせ」のアナログ業務、9社の事例に学ぶ業務改善の秘訣

急速に進化するデジタル技術は、製造業などのものづくりの現場にもさまざまな恩恵をもたらしている。しかし、設備点検業務や棚卸業務などの立ち仕事や移動が多い現場では、いまだにアナログ業務が残存し、効率化の妨げとなっているという。

事例 アステリア株式会社

工場・倉庫の「隙間業務」をデジタル化、11社の事例に学ぶ現場DX

あらゆる業界でDXの重要性が増しているが、工場や倉庫の中にはデジタル化が後回しにされている隙間業務が多数ある。その理由を明らかにした上で、それらの業務をモバイルアプリでデジタル化し、現場DXを推進する9社の事例を紹介する。

驛「譎冗函�趣スヲ驛「謨鳴€驛「譎「�ス�シ驛「�ァ�ス�ウ驛「譎「�ス�ウ驛「譎「�ソ�ス�趣スヲ驛「譎「�ソ�スPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

「生成AI+RAG」の“鬼門”を突破するための基礎知識とは:AI時代のデータベースの選び方【第4回】 - TechTargetジャパン システム開発 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

TechTarget驛「�ァ�ス�ク驛「譎「�ス�」驛「譏懶スサ�」�趣スヲ 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。