RAGとベクトルデータベースが企業の注目を集める一方で、導入に伴う課題も顕在化している。本稿では、ベクトルデータベース導入の技術的課題を乗りこえるための取り組みや、今後のデータベース市場の動きを解説する。
テキストや画像を自動生成するAI(人工知能)技術「生成AI」と、そのベースとなる大規模言語モデル(LLM)の業務利用が広がりつつある。中でも企業の関心を集めるのが、外部データベースからの情報を検索してLLMの回答精度を高める手法「RAG」(検索拡張生成)だ。
RAGの実装では、テキストや文書、画像といった「非構造化データ」を効率的に扱える「ベクトルデータベース」を使う。ただ、ベクトルデータベースの導入においては幾つかの技術的ハードルが存在する。それは一体何なのか。
ベクトルデータベースは、ベクトル形式(数値のリストや配列)でデータを管理するデータベースだ。ベクトルデータベースは検索の際に、テキストや画像などのデータを数値に変換することで、数字を比較してデータ同士の類似性を計算し、検索できる。
データ分析ベンダーDAS42で主任コンサルタントを務めるジェフ・スプリンガー氏は、「ベクトルデータベースにおけるデータの扱いは、リレーショナルデータベースやSQLとは大きく異なり、専門的な知識や技術が求められる」と説明する。ベクトルデータベースを使いこなせる人材はまだ少ないのが現状だ。
コンサルティング企業PricewaterhouseCoopers(PwC)でデータおよびアナリティクスプリンシパルを務めるブレット・グリーンシュタイン氏は、ベクトルデータベースの技術的なハードルとして以下を挙げる。
スプリンガー氏は今後、リレーショナルデータベースとベクトルデータベースが統合することで、ユーザーの技術習得が容易になると予測する。例えば2023年6月、クラウドデータウェアハウス(DWH)ベンダーSnowflakeはベクトルデータベースベンダーKXとのパートナーシップ締結を発表した。こうした取り組みは、新技術の導入における課題を軽減させる可能性がある。
コンサルティング企業Nuvalence(2024年4月にErnst & Young Globalに統合)の共同設立者であるシンクレア・シュラー氏は、「複数のデータベースを併用することで、業務に適するツールを選べる」と話す。構造化データは多くのビジネスにとって欠かせないが、非構造化データを扱うベクトルデータベースやグラフデータベースも併せて活用することで、効果的で包括的なデータ管理と分析が可能になるだろう。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
2025年のバレンタインのトレンドを購買実態から分析 「カカオショック」の影響は?
読売広告社は、ショッパーインサイトの食品ID-POS購買行動データベース「real shopper SM...
生成AIへの期待値の変化 DeepSeek台頭がマーケターに突きつける課題とは?
AI 生成の広告に対する反発が続いた1年を経て、マーケターはパフォーマンス結果重視で非...
2024年に視聴者が検索したテレビCM 2位は中国のあのEVメーカー、1位は?
2024年にテレビCMを通して視聴者が気になりWeb検索したものは何だったのか。ノバセルが発...