数あるNoSQLデータベースの中で特異な位置を占めるのが、複数のデータモデルをサポートする「ArangoDB」だ。
ArangoDBはネイティブマルチモデルデータベースだ。「ArangoDB Community Edition」はC++でコーディングされており、オープンソースライセンス(Apache License 2.0)で利用できる。本稿では、開発者向けトランザクションデータベースとしてのコアバージョン3.4に注目する。このリリースは開発者にとってどのようなものなのか。
このソフトウェアエンジニアリングの役割は、1つのテクノロジーと1つのクエリ言語を使って「複数のデータモデル」を操作する手段を提供することだ。
「ArangoDB 3.4」で強化されたのが「ArangoSearch」だ。ArangoDB独自のクエリ言語「AQL」を使って、この機能をトラバーサルや結合(join)と組み合わせると、ArangoDBが「データ」の取得ツールから「情報」の取得ツールへと変わる。
では、マルチモデルデータベースとは一体何だろう。
TechTargetは以下のように説明している。
「マルチモデルデータベースはスコープを広げたデータ処理プラットフォームで、データベース内の情報を編成して並べ替える方法についてのパラメーターを定義できる。複数のモデルを1つのデータベースに組み込めるため、複数のデータベースシステムを導入する必要なく、アプリケーションのさまざまな要件を満たせる」(訳注)
訳注:ArangoDBに限定すると、3つのデータモデル(ドキュメント、キーバリュー、グラフ)をサポートするNoSQLデータベースであるという意味。「MongoDB」ならドキュメント、「Neo4j」ならグラフのように、NoSQLデータベースは一般的に単一のデータモデルに特化している。
ArangoSearchは、ブール型の検索モデルと汎用(はんよう)ランキング検索モデル(ベクトル空間モデルなど)を組み合わせる。ArangoSearchは、検索エンジンと統合レイヤーの2つのコンポーネントで構成されている。検索エンジンはインデックスの管理、クエリ、スコアリングを担当する。統合レイヤーはエンドユーザーに使いやすい検索機能を提供する。
開発元によると、ArangoSearchはArangoDBの3つのデータモデル全てと組み合わせることができるという。グラフデータベース機能と連携して使用すると、検索結果を利用して、例えば詐欺防止の強化、個人に合わせたレコメンデーション、精密医療の簡素化などが可能になる。
このソフトウェアのリリースノートには次のように記載されている。「特殊な実体化ビューを使用して、複数のコレクションに対する全文検索を一度に実行できる。ビュー定義内では、コレクション全体または個別のフィールドを指定できる。こうした指定は、一般的なテキストアナライザーを一つまたは複数使って転置インデックスで対応する必要がある。AQLで表現する検索クエリは、複数のスコアラー(TFIDFやBM25)を組み合わせて結果をランク付けできる」
ユーザーは、関連性に基づくマッチング、フレーズとプレフィックスによるマッチング、複雑なブール式による検索、クエリ時間関連のチューニングを実行し、複雑なトラバーサル、ジオクエリなどのアクセスパターンを情報検索技法と組み合わせることができる。
ArangoDB 3.4は、「GeoJSON」と非空間属性をフルサポートする。GeoJSONとは、シンプルな地理機能を表すために設計されたオープンスタンダードフォーマットだ。このサポートには、マルチポリゴンやマルチラインストリングなど、全てのジオプリミティブが含まれている。
Copyright © ITmedia, Inc. All Rights Reserved.
ゼンリンマーケティングソリューションズでは、地図情報によるデータ分析作業を効率化するため、プログラミング不要のデータ分析ツールを導入した。同社はどのような製品を採用し、課題解決につなげていったのだろう。
データ活用におけるさまざまな課題を解決するBIツール。近年は、その枠を超え、さらなるデータ活用を促進するデータ分析プラットフォームへの注目度が高まっている。3社の事例を基に、同製品の魅力と実力に迫る。
データの可視化/分析をサポートするツールとして定評のあるBIツールだが、導入したものの活用できていない企業は意外と多い。その理由を確認するとともに、解決策として注目したい「チャットBI」の機能やメリットを詳しく解説する。
SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?
多くの企業で「情報の分断」や「手作業によるデータ処理への依存」が課題となり、迅速な経営判断を阻害している。本資料では、クラウドとBIツールを活用した分析基盤を構築し、これらの課題を解決した2社の事例を紹介する。
「人の動き」で見えない価値を見つけ出す 人流データが切り開く都市開発の未来 (2025/5/2)
導入の壁を突破してMicrosoft 365 Copilotを活用する方法 (2025/3/12)
クラウドの利便性とオンプレの制御性を両立、AI環境構築の新たな選択肢とは? (2025/3/6)
データ活用やAIで不良原因も発見 全員参加の現場伴走型で挑むトヨタ車体のDX (2025/2/21)
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...