AWSの2大検索サービス「Amazon Elasticsearch Service」「Amazon Kendra」とは「Amazon Elasticsearch Service」「Amazon Kendra」を比較する【前編】

AWSの主な検索サービスには「Amazon Kendra」と「Amazon Elasticsearch Service」がある。それぞれの機能と特徴、利用方法を説明する。

2021年03月17日 05時00分 公開
[Ernesto MarquezTechTarget]

 明確な構造定義を持たない「半構造化データ」や構造そのものがない「非構造化データ」を検索したい――。Amazon Web Services(AWS)はこのニーズに応える2つの検索サービス「Amazon Elasticsearch Service」と「Amazon Kendra」を用意する。どちらのサービスも複数のデータソースにまたがってデータを検索できるが、用途は異なる。それぞれの概要と特徴を説明する。

Amazon Elasticsearch Serviceとは

 Amazon Elasticsearch Serviceは、検索と分析のためのオープンソースソフトウェア(OSS)「Elasticsearch」のマネージドサービスだ。AWSの仮想マシンサービス「Amazon Elastic Compute Cloud」(Amazon EC2)のインスタンス(仮想サーバ)で稼働する。

会員登録(無料)が必要です

 検索にはElasticsearch固有のJSON形式クエリ言語を使う。このクエリ言語は論理演算子(AND、OR、NOTなど)やワイルドカード、正規表現などを使った検索を実行できる。クエリの送信には、Amazon Elasticsearch ServiceのGUI(グラフィカルユーザーインタフェース)を利用する。システム連携の標準的な設計思想「REST」準拠のAPI(アプリケーションプログラミングインタフェース)を介したクエリの送信も可能だ。

 データは分析前にElasticsearchに取り込む必要がある。データの取り込みはストリームデータ(連続的に発生し続けるデータ)処理サービス「Amazon Kinesis Data Firehose」やログ監視サービス「Amazon CloudWatch Logs」、IoT(モノのインターネット)データ収集サービス「AWS IoT」などのAWSサービスとの連携を通じて実行できる。データ処理OSSの「Logstash」を使ったデータ取り込みも可能だ。REST準拠のAPI経由でデータを取り込む方法もある。

Amazon Kendraとは

 Amazon Kendraは機械学習を利用して、複数のデータソースに保存されたデータを検索する。開発者がAmazon Kendraをアプリケーションに組み込めば、データアナリストなどのエンドユーザーは半構造化データや非構造化データを自然言語で検索できるようになる。Amazon Kendraは、今までの検索パターンを基に検索結果の精度を微調整する機能を持つ。インデックス機能を使用することで、複数のデータソースに分散したドキュメントやよくある質問をグループ化し、一元管理できる。

 エンドユーザーはデータをAmazon Kendraに直接取り込んだり、AWSのオブジェクトストレージサービス「Amazon Simple Storage Service」(Amazon S3)に配置したりすることで、Amazon Kendraを使ってデータを検索できるようになる。コネクターを使用することで他のデータソースも検索対象にできる。例えばSalesforce(salesforce.com)の同名CRM(顧客関係管理)やMicrosoftの「OneDrive」やGoogleの「Google Drive」といったファイル同期サービス向けにコネクターを用意している。

 AWSは、ユーザー企業がアプリケーションにAmazon Kendraの機能を組み込むためのサンプルコード(ソースコードのサンプル)を用意している。Amazon Kendraの操作方法に加えて、独自のユーザーインタフェースからクエリを発行するためのサンプルコードも提供している。


 後編は、Amazon Elasticsearch ServiceとAmazon Kendraのどちらを選択すればよいかを考えるときのポイントを説明する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

製品資料 株式会社AIT

国際間の映像データ配信や拠点間での動画共有も高速で、ファイル転送の注目手法

大容量データの送受信には、通信遅延や帯域制限の課題がある。本資料では、高速で安全なデータ送信を実現できるファイル転送プラットフォームを紹介する。導入時に気になるポイントとともに、料金プランも分かりやすく解説している。

製品資料 発注ナビ株式会社

リードが商談化できない? SaaS導入のベンダー側と企業側の悩みを一掃する方法

SaaSの利用が拡大する中、ベンダー側と企業側の両方がさまざまな課題を抱えている。ベンダー側は商談につながるリードが獲得しにくいと感じており、企業側は製品の選定に困難さを感じているという。双方の課題を一掃する方法とは?

製品資料 NTTドコモビジネス株式会社

多様なデータを一元管理、次世代のコンテンツ管理基盤とは?

従来のファイルサーバで対応できない多様なデータを、効率的に管理・共有できる「全てのコンテンツ保管庫」として、クラウド型コンテンツ管理基盤にVPN接続機能を組み合わせたサービスが注目されている。その特徴をマンガ形式で紹介する。

製品資料 株式会社マヒト

3分で分かる、「名刺発注業務」を効率化するポイント

従業員の自己紹介に加えて、企業間の関係構築においても重要な役割を担う名刺だが、その発注業務は意外と手間がかかる。名刺の作成から注文まで、ミスを発生させずに効率化するにはどうすればよいのか。本資料では、その解決策を紹介する。

製品資料 株式会社MONO-X

IBM i の資産を生かし、着実にDXへとつなげるモダナイゼーションの進め方

IBM i 基幹システムを運用する企業でモダナイゼーションが喫緊の課題となる中、推進の課題も多い。そこで、「クラウド」「ノーコード開発」「API」「AI」を主軸とするIBM i ユーザー向けモダナイゼーションサービスを紹介する。

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...