検索
特集/連載

生成AIの“ポンコツ回答”を「グラフデータベース」で解消しようNeo4jの活用事例を紹介

「グラフデータベース」を活用し、生成AIツールの課題を解消しようとする動きがある。グラフデータベースによって、具体的に何が可能になるのか。オーストラリアでの事例を交えて見ていこう。

Share
Tweet
LINE
Hatena

関連キーワード

人工知能 | データベース


 オーストラリアの銀行、鉱業会社、警察組織などの間で、生成AI(人工知能)ツールの回答を改善するために「グラフデータベース」を導入し、実験段階から本格運用へ移行させる動きがある。グラフデータベースは、データ同士のつながりを構造的に整理することで、生成AIツールがコンテキスト(文脈)を理解し、根拠のある答えを返すための仕組みとして機能する。

 大手銀行であるAustralia and New Zealand Banking Group(ANZ)やCommonwealth Bank of Australia(CommBank)は、現実世界の設備やシステムを仮想空間に再現したモデルである「デジタルツイン」の構築や、データの生成、加工、移動経路を追跡する「データリネージ管理」といった用途にグラフデータベースを活用。オーストラリア連邦警察(AFP:Australian Federal Police)は、捜査支援にグラフデータベースを生かしている。

「グラフデータベース」が生成AIツールの課題を解消

 グラフデータベースベンダーNeo4jのオーストラリア・ニュージーランド担当ゼネラルマネジャーであるピーター・フィリップ氏によると、グラフデータベースはトランザクション処理用のデータベースやデータウェアハウス(DWH)の代替ではない。むしろ大規模データの中からデータ同士の関係性を見つけ出す目的に役立ち、複雑なデータの調査や、ユーザーの好みや行動履歴に応じて最適な候補を提示する「レコメンデーション」システムなどに適している。

 単語や項目の間の意味的な距離を示す「ベクトル」とは異なり、グラフデータベースのデータモデル(表現形式)である「グラフ」は、エンティティ(人、場所、製品など、データとして識別・参照できる実体)同士の関係を明示できる。そのためグラフデータベースは回答の生成過程や根拠を示すのに向いており「より説明可能で正確なレコメンデーションにつながる」とフィリップ氏は述べる。

 グラフデータベースは、ユーザーやグループ単位でのアクセス制御を細かく設定できる。例えば人事担当者には給与データのみを表示し、IT管理担当には生年月日を非表示にするといった、役割に応じた権限管理を可能にする。エンティティ同士の「つながりがある」という事実だけを表示し、その内容の詳細には踏み込まない形で関係性を共有できるため、機密データの保護にも役立つ。

 「GraphRAG」を活用すると、生成AIツールの回答にコンテキストや根拠を補足できる。GraphRAGは、グラフ構造を取り入れたRAG(Retrieval Augmented Generation:外部情報を検索して生成AIツールの回答に活用する仕組み)の一手法だ。社内データや業務知識など、一般の生成AIツールでは参照できない情報をプロンプト(指示)経由で回答に結び付け、内容の正確性や根拠を補強する「グラウンディング」という仕組みを備える。

事例で見るグラフデータベースの用途

 FinTech(金融とITの融合)ベンダーのKlarnaは、複数のSaaS(Software as a Service)や社内システムに分散していたデータをNeo4jに集約し、相互の関係を定義して活用できるようにした。こうして整理したデータを、生成AIベンダーOpenAIのLLM(大規模言語モデル)を用いる社内チャットbot「Kiki」で利用している。

 中小企業向けローン業者Prospa AdvanceもNeo4jを採用している。同社は当初、企業グループ内での出資関係や役員のつながりを素早く把握する目的で、グラフデータベースを導入した。リレーショナルデータベースでは、こうした多段階の関係を追跡する際に、かなりの数のテーブルを組み合わせる必要があり、照会や分析に時間がかかるためだ。Neo4jは同社の「Systems of Record」(SoR:業務の基盤となるデータ管理システム)として機能し、複数アプリケーションとの連携やMicrosoftの生成AIツール「Copilot」を介したセルフサービス分析を支えている。

 ある銀行は生成AIツールの回答内容に対する説明可能性を高めるため、社内の規定や方針同士の関連性を可視化する仕組みとして、グラフデータベースを活用している。具体的にはNeo4jのナレッジグラフ(文書やデータの関係性をグラフ構造で整理したデータモデル)構築ツールである「Neo4j LLM Knowledge Graph Builder」を使い、関連文書からナレッジグラフを生成。LLMを介して自然言語で検索・参照できる形にしている。

 ある鉱業会社は、膨大な非構造化データから社内ポリシーや文書のグラフを構築し、それを検索可能にする対話型検索ツール(チャット形式の問い合わせツール)を導入した。こうしたツールの目的は「よく使われるデータを探すこと」ではなく、「その場に適したデータを正確に返すこと」だ。グラフデータベースは「質問者がどの部門の誰であり、どのような権限を持つのか」といった前提情報を踏まえて結果を提示することに役立つと、フィリップ氏は指摘する。

関心は生成AIからエージェント型AIへ

 企業の関心は、人を支援する生成AIツールの利用から、人手を介さずにタスクを実行できる「エージェント型AI」ツールへと移りつつある。エージェント型AIツールは通常、タスクを複数の小さな処理に分割し、それぞれを適切な「AIエージェント」(役割や機能を持つ自律的なプログラム単位)に割り当てる。

 「グラフはデータの意味や関係性を踏まえて、エージェント型AIツールに必要なコンテキストを与える直感的な方法だ」とフィリップ氏は述べる。グラフは、エージェント型AIツールが精度の高い回答をしたり、複数のAIエージェント間でデータの受け渡しを円滑にしたりするのに役立つという。

 デジタルツインは、グラフデータベースの活用が進む分野だ。ロジスティクスやITネットワークなど、現実の構造自体がノード(エンティティを表す点)とリンク(ノード同士を結ぶ関係線)から成り立つ領域では「グラフとの親和性が高い」とフィリップ氏は述べる。こうした構造をグラフとして保持することで、ポリシー違反や異常な挙動の検知といった処理を自動化しやすくなる。

 エージェント型AIツールは、将来的に人の介在なしで判断・実行を担う可能性がある。ただし「現時点では精度が十分ではなく、完全自律化には至っていない」とフィリップ氏は注意を促す。GraphRAGは精度向上に寄与するものの、金融や医療などエージェント型AIツールに関心を向ける業界は、同時に厳格な規制の対象でもある。


 企業データは競争力の源泉になり得る資産だ。その価値を生かすには「データ同士のつながりを整理し、生成AIツールが参照できる形で保持することが重要だ」とフィリップ氏は述べる。生成AIツールに適切なコンテキストを与えるには、データを整備し、関連付けるためのシステム構築が欠かせない。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る