RAGとベクトルデータベースが企業の注目を集める一方で、導入に伴う課題も顕在化している。本稿では、ベクトルデータベース導入の技術的課題を乗りこえるための取り組みや、今後のデータベース市場の動きを解説する。
テキストや画像を自動生成するAI(人工知能)技術「生成AI」と、そのベースとなる大規模言語モデル(LLM)の業務利用が広がりつつある。中でも企業の関心を集めるのが、外部データベースからの情報を検索してLLMの回答精度を高める手法「RAG」(検索拡張生成)だ。
RAGの実装では、テキストや文書、画像といった「非構造化データ」を効率的に扱える「ベクトルデータベース」を使う。ただ、ベクトルデータベースの導入においては幾つかの技術的ハードルが存在する。それは一体何なのか。
ベクトルデータベースは、ベクトル形式(数値のリストや配列)でデータを管理するデータベースだ。ベクトルデータベースは検索の際に、テキストや画像などのデータを数値に変換することで、数字を比較してデータ同士の類似性を計算し、検索できる。
データ分析ベンダーDAS42で主任コンサルタントを務めるジェフ・スプリンガー氏は、「ベクトルデータベースにおけるデータの扱いは、リレーショナルデータベースやSQLとは大きく異なり、専門的な知識や技術が求められる」と説明する。ベクトルデータベースを使いこなせる人材はまだ少ないのが現状だ。
コンサルティング企業PricewaterhouseCoopers(PwC)でデータおよびアナリティクスプリンシパルを務めるブレット・グリーンシュタイン氏は、ベクトルデータベースの技術的なハードルとして以下を挙げる。
スプリンガー氏は今後、リレーショナルデータベースとベクトルデータベースが統合することで、ユーザーの技術習得が容易になると予測する。例えば2023年6月、クラウドデータウェアハウス(DWH)ベンダーSnowflakeはベクトルデータベースベンダーKXとのパートナーシップ締結を発表した。こうした取り組みは、新技術の導入における課題を軽減させる可能性がある。
コンサルティング企業Nuvalence(2024年4月にErnst & Young Globalに統合)の共同設立者であるシンクレア・シュラー氏は、「複数のデータベースを併用することで、業務に適するツールを選べる」と話す。構造化データは多くのビジネスにとって欠かせないが、非構造化データを扱うベクトルデータベースやグラフデータベースも併せて活用することで、効果的で包括的なデータ管理と分析が可能になるだろう。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
テレビ派? 有料動画配信派? おすすめの作品は? アニメに関する調査(2024年)
クロス・マーケティングは、国民的メジャーコンテンツに成長したアニメの視聴状況につい...
広告収入稼ぎの低品質サイト「MFA」を排除するため、マーケターにできることとは?
MFA(Made For Advertising)サイトの本質的な問題点とは何か。マーケターはMFA排除のた...
“なんちゃってマック”で「チキンビッグマック」体験etc. 米マクドナルドのマルチチャネル過ぎるキャンペーン
McDonald’sは米国での「チキンビッグマック」新発売に当たり、若年層とのつながりを強化...