RAGにも役立つ「ベクトルデータベース」とは? RDB、グラフDBとの違いは?AI時代のデータベースの選び方【第2回】

RAG(検索拡張生成)実装にも使われる「ベクトルデータベース」は、AI技術の活用が広がる中で企業の関心を集めている。他のデータベースとの違いを交えて、ベクトルデータベースがなぜ必要なのかを解説する。

2024年08月28日 07時00分 公開
[George LawtonTechTarget]

関連キーワード

人工知能 | データベース


 テキストや画像を自動生成するAI(人工知能)技術「生成AI」や、そのベースとなる大規模言語モデル(LLM)のビジネス活用が進む中で、生成AIで扱うデータの効率的な管理と検索が企業にとっての大きな課題になりつつある。このような背景から、企業は「ベクトルデータベース」に関心を寄せている。ベクトルデータベースは、生成AIの活用において重要性を増している「RAG」(検索拡張生成)にも使われる。

 生成AIの活用においてベクトルデータベースが必要になるのはなぜなのか。「リレーショナルデータベース」「グラフデータベース」の仕組みや用途と比較しながら解説する。

RAGにも役立つ「ベクトルデータベース」とは? 他DBとの違いは?

 各データベースの特徴と適する用途は、それぞれ以下の通りだ。

ベクトルデータベース

 ベクトルデータベースは、非構造化データを数値化して扱えるベクトル形式でデータを管理する、類似検索に特化したデータベース。類似検索は、クエリ(問い合わせや命令)との類似性を指標に検索結果を順位付けるもの。テキストや画像などのデータを数値に変換することで、数字を比較してデータ同士の類似性を計算し、検索する。

 データ分析ベンダーDAS42でプリンシパルコンサルタントを務めるジェフ・スプリンガー氏は、ベクトルデータベースの用途として自然言語処理(NLP)や大規模言語モデル(LLM)、レコメンデーションエンジンなどで利用されるセマンティック検索 (エンドユーザーの意図をくみ取って情報を探す検索手法)を挙げる。

 他にもベクトルデータベースは、外部データベースからの情報を検索してLLMの回答精度を高める手法であるRAGにも使用される。

リレーショナルデータベース

 リレーショナルデータベース(RDB)は、データを行と列で構成されたテーブルでデータを管理するデータベース。エンティティ(データベースで扱う対象や概念を定義するもの)とその相互関係を保持しており、関係に基づくクエリを実行できる。

 リレーショナルデータベースは幅広い用途に適する。企業が販売や財務、人事、サプライチェーン部門を有する場合、顧客や商品の情報を整理して保管するためにリレーショナルデータベースが必要となる。

グラフデータベース

 グラフデータベース(グラフDB)は、データの関係性をノード(点)とエッジ(線)で表現し、複雑なネットワークや関係性のクエリ処理に優れるデータベース。

 グラフデータベースは、複雑に関連したデータ間のモデリング(データの関連性を定義すること)や分析に適している。例えば、ソーシャルネットワーク 内のインフルエンサー、コミュニティーを特定したり、不正な行動やデータの異常などを検出したりする用途に使用される。

 グラフデータベースは以下の2種類に分類される。

  • プロパティグラフ
    • グラフデータベースで用いられる一般的なモデル。複雑なデータの関係を効率的に管理できる。
    • SNSや不正検出、レコメンデーションシステムなどに使用される。
  • ナレッジグラフ
    • 知識の管理と検索に焦点を当てたモデルで、複雑な知識を体系化するのに役立つ。
    • 検索エンジン、FAQシステムなどに使用される。

なぜ「ベクトルデータベース」を選ぶのか?

 リレーショナルデータベースやグラフデータベースではなくベクトルデータベースが必要となる大きな理由は、テキストや文書、画像といった「非構造化データ」の扱いにある。

 ベクトルデータベースは、非構造化データをベクトル形式に変換することに優れている。ベクトルデータベースの導入によって、非構造化データから貴重な洞察を引き出せるようになる。

 ベクトルデータベースのアーキテクチャは、他のデータベースと根本的に異なる。データモデリングだけでなく、データの保存やインデックス作成、クエリ処理などを異なる方法で実施する。ベクトルデータベースは通常、複数のサーバにデータを分散させることでシステム全体の処理能力を向上させる「水平スケーリング」を採用する。

 一方、リレーショナルデータベースは、既存のサーバやコンピュータにCPUやメモリなどのリソースを追加する「垂直スケーリング」を採用することが一般的だ。


 次回は、ベクトルデータベースがLLMの性能向上にどう役立つのかを解説する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

ITmedia マーケティング新着記事

news036.jpg

「缶入りのただの水」を評価額14億ドルのビジネスに育てたLiquid Deathのヤバいマーケティング戦略
「渇きを殺せ(Murder Your Thirst)」という刺激的なメッセージにエッジの利いた商品デ...

news064.jpg

「日本の食料自給率38%」への不安感は8割越え
クロス・マーケティングは、大気中の二酸化炭素濃度や紫外線量の増加による地球温暖化の...

news066.jpg

「マツキヨココカラ公式アプリ」が「Temu」超えの初登場1位 2024年のEコマースアプリトレンド
AdjustとSensor Towerが共同で発表した「モバイルアプリトレンドレポート 2024 :日本版...