マルチモデルデータベース「ArangoDB」に要注目ArangoSearchとGeoJSONサポート

数あるNoSQLデータベースの中で特異な位置を占めるのが、複数のデータモデルをサポートする「ArangoDB」だ。

2019年03月19日 08時00分 公開
[Adrian BridgwaterComputer Weekly]

 ArangoDBはネイティブマルチモデルデータベースだ。「ArangoDB Community Edition」はC++でコーディングされており、オープンソースライセンス(Apache License 2.0)で利用できる。本稿では、開発者向けトランザクションデータベースとしてのコアバージョン3.4に注目する。このリリースは開発者にとってどのようなものなのか。

 このソフトウェアエンジニアリングの役割は、1つのテクノロジーと1つのクエリ言語を使って「複数のデータモデル」を操作する手段を提供することだ。

 「ArangoDB 3.4」で強化されたのが「ArangoSearch」だ。ArangoDB独自のクエリ言語「AQL」を使って、この機能をトラバーサルや結合(join)と組み合わせると、ArangoDBが「データ」の取得ツールから「情報」の取得ツールへと変わる。

 では、マルチモデルデータベースとは一体何だろう。

会員登録(無料)が必要です

 TechTargetは以下のように説明している。

 「マルチモデルデータベースはスコープを広げたデータ処理プラットフォームで、データベース内の情報を編成して並べ替える方法についてのパラメーターを定義できる。複数のモデルを1つのデータベースに組み込めるため、複数のデータベースシステムを導入する必要なく、アプリケーションのさまざまな要件を満たせる」(訳注)

訳注:ArangoDBに限定すると、3つのデータモデル(ドキュメント、キーバリュー、グラフ)をサポートするNoSQLデータベースであるという意味。「MongoDB」ならドキュメント、「Neo4j」ならグラフのように、NoSQLデータベースは一般的に単一のデータモデルに特化している。

 ArangoSearchは、ブール型の検索モデルと汎用(はんよう)ランキング検索モデル(ベクトル空間モデルなど)を組み合わせる。ArangoSearchは、検索エンジンと統合レイヤーの2つのコンポーネントで構成されている。検索エンジンはインデックスの管理、クエリ、スコアリングを担当する。統合レイヤーはエンドユーザーに使いやすい検索機能を提供する。

 開発元によると、ArangoSearchはArangoDBの3つのデータモデル全てと組み合わせることができるという。グラフデータベース機能と連携して使用すると、検索結果を利用して、例えば詐欺防止の強化、個人に合わせたレコメンデーション、精密医療の簡素化などが可能になる。

 このソフトウェアのリリースノートには次のように記載されている。「特殊な実体化ビューを使用して、複数のコレクションに対する全文検索を一度に実行できる。ビュー定義内では、コレクション全体または個別のフィールドを指定できる。こうした指定は、一般的なテキストアナライザーを一つまたは複数使って転置インデックスで対応する必要がある。AQLで表現する検索クエリは、複数のスコアラー(TFIDFやBM25)を組み合わせて結果をランク付けできる」

 ユーザーは、関連性に基づくマッチング、フレーズとプレフィックスによるマッチング、複雑なブール式による検索、クエリ時間関連のチューニングを実行し、複雑なトラバーサル、ジオクエリなどのアクセスパターンを情報検索技法と組み合わせることができる。

 ArangoDB 3.4は、「GeoJSON」と非空間属性をフルサポートする。GeoJSONとは、シンプルな地理機能を表すために設計されたオープンスタンダードフォーマットだ。このサポートには、マルチポリゴンやマルチラインストリングなど、全てのジオプリミティブが含まれている。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

事例 アルテリックス・ジャパン合同会社

データ処理の効率化に成功、ゼンリンマーケティングソリューションズの取り組み

ゼンリンマーケティングソリューションズでは、地図情報によるデータ分析作業を効率化するため、プログラミング不要のデータ分析ツールを導入した。同社はどのような製品を採用し、課題解決につなげていったのだろう。

事例 株式会社サムライズ

3社の事例に学ぶ、BIツールの枠を超えたデータ分析プラットフォームの実力とは

データ活用におけるさまざまな課題を解決するBIツール。近年は、その枠を超え、さらなるデータ活用を促進するデータ分析プラットフォームへの注目度が高まっている。3社の事例を基に、同製品の魅力と実力に迫る。

製品資料 株式会社ライトウェル

チャットBIの登場でさらに便利に 新時代のBIツールでデータ活用はどう変わる?

データの可視化/分析をサポートするツールとして定評のあるBIツールだが、導入したものの活用できていない企業は意外と多い。その理由を確認するとともに、解決策として注目したい「チャットBI」の機能やメリットを詳しく解説する。

事例 プリサイスリー・ソフトウェア株式会社

SAPデータの処理時間を4分の1に短縮、ロクシタンはどうやって実現した?

SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?

製品資料 テンスピン・マネジメント・コンサルタンツ合同会社

クラウドとBIツールで「情報の分断」を解消、2社に学ぶ分析基盤構築事例

多くの企業で「情報の分断」や「手作業によるデータ処理への依存」が課題となり、迅速な経営判断を阻害している。本資料では、クラウドとBIツールを活用した分析基盤を構築し、これらの課題を解決した2社の事例を紹介する。

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...