AWSの主な検索サービスには「Amazon Kendra」と「Amazon Elasticsearch Service」がある。それぞれの機能と特徴、利用方法を説明する。
明確な構造定義を持たない「半構造化データ」や構造そのものがない「非構造化データ」を検索したい――。Amazon Web Services(AWS)はこのニーズに応える2つの検索サービス「Amazon Elasticsearch Service」と「Amazon Kendra」を用意する。どちらのサービスも複数のデータソースにまたがってデータを検索できるが、用途は異なる。それぞれの概要と特徴を説明する。
Amazon Elasticsearch Serviceは、検索と分析のためのオープンソースソフトウェア(OSS)「Elasticsearch」のマネージドサービスだ。AWSの仮想マシンサービス「Amazon Elastic Compute Cloud」(Amazon EC2)のインスタンス(仮想サーバ)で稼働する。
検索にはElasticsearch固有のJSON形式クエリ言語を使う。このクエリ言語は論理演算子(AND、OR、NOTなど)やワイルドカード、正規表現などを使った検索を実行できる。クエリの送信には、Amazon Elasticsearch ServiceのGUI(グラフィカルユーザーインタフェース)を利用する。システム連携の標準的な設計思想「REST」準拠のAPI(アプリケーションプログラミングインタフェース)を介したクエリの送信も可能だ。
データは分析前にElasticsearchに取り込む必要がある。データの取り込みはストリームデータ(連続的に発生し続けるデータ)処理サービス「Amazon Kinesis Data Firehose」やログ監視サービス「Amazon CloudWatch Logs」、IoT(モノのインターネット)データ収集サービス「AWS IoT」などのAWSサービスとの連携を通じて実行できる。データ処理OSSの「Logstash」を使ったデータ取り込みも可能だ。REST準拠のAPI経由でデータを取り込む方法もある。
Amazon Kendraは機械学習を利用して、複数のデータソースに保存されたデータを検索する。開発者がAmazon Kendraをアプリケーションに組み込めば、データアナリストなどのエンドユーザーは半構造化データや非構造化データを自然言語で検索できるようになる。Amazon Kendraは、今までの検索パターンを基に検索結果の精度を微調整する機能を持つ。インデックス機能を使用することで、複数のデータソースに分散したドキュメントやよくある質問をグループ化し、一元管理できる。
エンドユーザーはデータをAmazon Kendraに直接取り込んだり、AWSのオブジェクトストレージサービス「Amazon Simple Storage Service」(Amazon S3)に配置したりすることで、Amazon Kendraを使ってデータを検索できるようになる。コネクターを使用することで他のデータソースも検索対象にできる。例えばSalesforce(salesforce.com)の同名CRM(顧客関係管理)やMicrosoftの「OneDrive」やGoogleの「Google Drive」といったファイル同期サービス向けにコネクターを用意している。
AWSは、ユーザー企業がアプリケーションにAmazon Kendraの機能を組み込むためのサンプルコード(ソースコードのサンプル)を用意している。Amazon Kendraの操作方法に加えて、独自のユーザーインタフェースからクエリを発行するためのサンプルコードも提供している。
後編は、Amazon Elasticsearch ServiceとAmazon Kendraのどちらを選択すればよいかを考えるときのポイントを説明する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
クラウド利用が拡大しSaaSサービスの導入が進む中で、製品の多様化がベンダー側と企業側にさまざまな課題を生み出している。双方の課題を解決する方法として注目したいのが、商談を効率的に獲得できるマッチングサービスだ。
アジャイル開発に取り組む企業は増加しているが、思うような成果を挙げられていないと悩む担当者も少なくない。そこで、セゾンテクノロジーをはじめとした3社の取り組みを基に、実践の方法と成功のポイントを解説する。
「2025年の崖」「2026年問題」がいよいよ間近に迫り、多くの組織が既存のITインフラのクラウド移行に活路を見いだそうとしている。しかし、クラウドの専門家は、移行そのものが目的となってしまっている現状に対して警鐘を鳴らしている。
初期負担を抑えながら、迅速な展開が可能なSaaSの利用は増加傾向にあるが、それに伴いクラウド環境でのデータの分散、サイロ化も進んでいる。この状況から脱却しなければ、データがもたらす価値を最大化することはできない。
多くの組織で仮想化環境のハイブリッドクラウド化が進んでいるものの、オンプレミスとクラウドの二重管理が負担になりがちだ。市場変化やコストの変動に伴いオンプレミスの仮想化基盤を見直しする機会に改めて検討したい選択肢を紹介する。
KDDIの通信品質と事業成長を支える“共通インフラデータ基盤”構築の舞台裏 (2025/3/12)
高まるSaaSバックアップ需要で「ストック収益」を拡大するには (2025/1/22)
大和総研に聞く、基幹システムのモダナイズ推進を成功に導いた四つのポイント (2024/12/23)
「オンプレミス仮想化基盤」のモダナイゼーションに最適なクラウド移行の進め方 (2024/11/11)
コストや効率の課題解消、ITとOTの統合運用管理を実現する理想的なインフラとは (2024/10/18)
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年4月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「AIエージェント」はデジタルマーケティングをどう高度化するのか
電通デジタルはAIを活用したマーケティングソリューションブランド「∞AI」の大型アップ...
「政府」「メディア」への信頼度は日本が最低 どうしてこうなった?
「信頼」に関する年次消費者意識調査の結果から、日本においても社会的な不満・憤りが大...