RAGにも役立つ「ベクトルデータベース」とは? RDB、グラフDBとの違いは?AI時代のデータベースの選び方【第2回】

RAG(検索拡張生成)実装にも使われる「ベクトルデータベース」は、AI技術の活用が広がる中で企業の関心を集めている。他のデータベースとの違いを交えて、ベクトルデータベースがなぜ必要なのかを解説する。

2024年08月28日 07時00分 公開
[George LawtonTechTarget]

関連キーワード

人工知能 | データベース


 テキストや画像を自動生成するAI(人工知能)技術「生成AI」や、そのベースとなる大規模言語モデル(LLM)のビジネス活用が進む中で、生成AIで扱うデータの効率的な管理と検索が企業にとっての大きな課題になりつつある。このような背景から、企業は「ベクトルデータベース」に関心を寄せている。ベクトルデータベースは、生成AIの活用において重要性を増している「RAG」(検索拡張生成)にも使われる。

 生成AIの活用においてベクトルデータベースが必要になるのはなぜなのか。「リレーショナルデータベース」「グラフデータベース」の仕組みや用途と比較しながら解説する。

RAGにも役立つ「ベクトルデータベース」とは? 他DBとの違いは?

 各データベースの特徴と適する用途は、それぞれ以下の通りだ。

ベクトルデータベース

 ベクトルデータベースは、非構造化データを数値化して扱えるベクトル形式でデータを管理する、類似検索に特化したデータベース。類似検索は、クエリ(問い合わせや命令)との類似性を指標に検索結果を順位付けるもの。テキストや画像などのデータを数値に変換することで、数字を比較してデータ同士の類似性を計算し、検索する。

 データ分析ベンダーDAS42でプリンシパルコンサルタントを務めるジェフ・スプリンガー氏は、ベクトルデータベースの用途として自然言語処理(NLP)や大規模言語モデル(LLM)、レコメンデーションエンジンなどで利用されるセマンティック検索 (エンドユーザーの意図をくみ取って情報を探す検索手法)を挙げる。

 他にもベクトルデータベースは、外部データベースからの情報を検索してLLMの回答精度を高める手法であるRAGにも使用される。

リレーショナルデータベース

 リレーショナルデータベース(RDB)は、データを行と列で構成されたテーブルでデータを管理するデータベース。エンティティ(データベースで扱う対象や概念を定義するもの)とその相互関係を保持しており、関係に基づくクエリを実行できる。

 リレーショナルデータベースは幅広い用途に適する。企業が販売や財務、人事、サプライチェーン部門を有する場合、顧客や商品の情報を整理して保管するためにリレーショナルデータベースが必要となる。

グラフデータベース

 グラフデータベース(グラフDB)は、データの関係性をノード(点)とエッジ(線)で表現し、複雑なネットワークや関係性のクエリ処理に優れるデータベース。

 グラフデータベースは、複雑に関連したデータ間のモデリング(データの関連性を定義すること)や分析に適している。例えば、ソーシャルネットワーク 内のインフルエンサー、コミュニティーを特定したり、不正な行動やデータの異常などを検出したりする用途に使用される。

 グラフデータベースは以下の2種類に分類される。

  • プロパティグラフ
    • グラフデータベースで用いられる一般的なモデル。複雑なデータの関係を効率的に管理できる。
    • SNSや不正検出、レコメンデーションシステムなどに使用される。
  • ナレッジグラフ
    • 知識の管理と検索に焦点を当てたモデルで、複雑な知識を体系化するのに役立つ。
    • 検索エンジン、FAQシステムなどに使用される。

なぜ「ベクトルデータベース」を選ぶのか?

 リレーショナルデータベースやグラフデータベースではなくベクトルデータベースが必要となる大きな理由は、テキストや文書、画像といった「非構造化データ」の扱いにある。

 ベクトルデータベースは、非構造化データをベクトル形式に変換することに優れている。ベクトルデータベースの導入によって、非構造化データから貴重な洞察を引き出せるようになる。

 ベクトルデータベースのアーキテクチャは、他のデータベースと根本的に異なる。データモデリングだけでなく、データの保存やインデックス作成、クエリ処理などを異なる方法で実施する。ベクトルデータベースは通常、複数のサーバにデータを分散させることでシステム全体の処理能力を向上させる「水平スケーリング」を採用する。

 一方、リレーショナルデータベースは、既存のサーバやコンピュータにCPUやメモリなどのリソースを追加する「垂直スケーリング」を採用することが一般的だ。


 次回は、ベクトルデータベースがLLMの性能向上にどう役立つのかを解説する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

髫エ�ス�ス�ー鬨セ�ケ�つ€驛「譎擾スク蜴・�。驛「�ァ�ス�、驛「譎冗樟�ス�ス驛「譎「�ス�シ驛「譏懶スサ�」�ス�ス

製品資料 株式会社ジャストシステム

ノーコードで基幹システム運用を改善、解決できる課題やツール選びのコツを解説

基幹システム運用の課題を解消すべく、ノーコード開発ツールを導入する動きが加速している。数あるツールの中からどのようにツール選定を進めたらよいのか、またどのような課題を解決できるのか、具体的なツールも含めて解説する。

事例 株式会社ジャストシステム

ベンダーに依存しないシステムを自社で開発、東亜建設工業に学ぶその推進方法

老朽化したシステムの刷新に向けノーコード開発ツールを導入した「東亜建設工業」。その活用により、ベンダーに依存することなく柔軟性と持続可能性の高いシステムの構築を推進できる体制を実現している。同社の取り組みを詳しく紹介する。

事例 株式会社ジャストシステム

ノーコード開発で大幅な業務効率化を実現、「八千代工業」の取り組みとは?

社内業務の徹底的な効率化を目指す「八千代工業」。最初に導入したRPAでは、紙に依存した業務への対応は難しかったが、これらをデジタル化するためにノーコード開発ツールを使ってアプリを開発し、大きな成果を挙げている。

製品資料 株式会社ジャストシステム

IT人材不足を補うノーコード開発、全社DXにつながるツール選定の4つのポイント

IT技術の重要性が高まる一方、IT人材不足が加速している。その不足を埋めるため、自社の業務システムをノーコードで開発する動きが広がっているが、ノーコード開発を導入する際には、将来的な全社DXを考慮してツールを選ぶ必要がある。

製品資料 株式会社ジャストシステム

プロコード/ローコード開発による業務のシステム化、作業の属人化をどうする?

業務効率化に有効なシステム化だが、プロコードやローコードによる開発では場合によって複雑なコーディングが必要となり、かえって新たな課題を生みかねない。そこで登場したのが、スキル不要で使えるノーコード開発ソリューションだ。

驛「譎冗函�趣スヲ驛「謨鳴€驛「譎「�ス�シ驛「�ァ�ス�ウ驛「譎「�ス�ウ驛「譎「�ソ�ス�趣スヲ驛「譎「�ソ�スPR

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

RAGにも役立つ「ベクトルデータベース」とは? RDB、グラフDBとの違いは?:AI時代のデータベースの選び方【第2回】 - TechTargetジャパン システム開発 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

TechTarget驛「�ァ�ス�ク驛「譎「�ス�」驛「譏懶スサ�」�趣スヲ 髫エ�ス�ス�ー鬨セ�ケ�つ€鬮ォ�ェ陋滂ソス�ス�コ�ス�ス

ITmedia マーケティング新着記事

news026.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...

news130.jpg

Cookieを超える「マルチリターゲティング」 広告効果に及ぼす影響は?
Cookieレスの課題解決の鍵となる「マルチリターゲティング」を題材に、AI技術によるROI向...

news040.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年4月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。