AWSの主な検索サービスには「Amazon Kendra」と「Amazon Elasticsearch Service」がある。それぞれの機能と特徴、利用方法を説明する。
明確な構造定義を持たない「半構造化データ」や構造そのものがない「非構造化データ」を検索したい――。Amazon Web Services(AWS)はこのニーズに応える2つの検索サービス「Amazon Elasticsearch Service」と「Amazon Kendra」を用意する。どちらのサービスも複数のデータソースにまたがってデータを検索できるが、用途は異なる。それぞれの概要と特徴を説明する。
Amazon Elasticsearch Serviceは、検索と分析のためのオープンソースソフトウェア(OSS)「Elasticsearch」のマネージドサービスだ。AWSの仮想マシンサービス「Amazon Elastic Compute Cloud」(Amazon EC2)のインスタンス(仮想サーバ)で稼働する。
検索にはElasticsearch固有のJSON形式クエリ言語を使う。このクエリ言語は論理演算子(AND、OR、NOTなど)やワイルドカード、正規表現などを使った検索を実行できる。クエリの送信には、Amazon Elasticsearch ServiceのGUI(グラフィカルユーザーインタフェース)を利用する。システム連携の標準的な設計思想「REST」準拠のAPI(アプリケーションプログラミングインタフェース)を介したクエリの送信も可能だ。
データは分析前にElasticsearchに取り込む必要がある。データの取り込みはストリームデータ(連続的に発生し続けるデータ)処理サービス「Amazon Kinesis Data Firehose」やログ監視サービス「Amazon CloudWatch Logs」、IoT(モノのインターネット)データ収集サービス「AWS IoT」などのAWSサービスとの連携を通じて実行できる。データ処理OSSの「Logstash」を使ったデータ取り込みも可能だ。REST準拠のAPI経由でデータを取り込む方法もある。
Amazon Kendraは機械学習を利用して、複数のデータソースに保存されたデータを検索する。開発者がAmazon Kendraをアプリケーションに組み込めば、データアナリストなどのエンドユーザーは半構造化データや非構造化データを自然言語で検索できるようになる。Amazon Kendraは、今までの検索パターンを基に検索結果の精度を微調整する機能を持つ。インデックス機能を使用することで、複数のデータソースに分散したドキュメントやよくある質問をグループ化し、一元管理できる。
エンドユーザーはデータをAmazon Kendraに直接取り込んだり、AWSのオブジェクトストレージサービス「Amazon Simple Storage Service」(Amazon S3)に配置したりすることで、Amazon Kendraを使ってデータを検索できるようになる。コネクターを使用することで他のデータソースも検索対象にできる。例えばSalesforce(salesforce.com)の同名CRM(顧客関係管理)やMicrosoftの「OneDrive」やGoogleの「Google Drive」といったファイル同期サービス向けにコネクターを用意している。
AWSは、ユーザー企業がアプリケーションにAmazon Kendraの機能を組み込むためのサンプルコード(ソースコードのサンプル)を用意している。Amazon Kendraの操作方法に加えて、独自のユーザーインタフェースからクエリを発行するためのサンプルコードも提供している。
後編は、Amazon Elasticsearch ServiceとAmazon Kendraのどちらを選択すればよいかを考えるときのポイントを説明する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
大容量データの送受信には、通信遅延や帯域制限の課題がある。本資料では、高速で安全なデータ送信を実現できるファイル転送プラットフォームを紹介する。導入時に気になるポイントとともに、料金プランも分かりやすく解説している。
SaaSの利用が拡大する中、ベンダー側と企業側の両方がさまざまな課題を抱えている。ベンダー側は商談につながるリードが獲得しにくいと感じており、企業側は製品の選定に困難さを感じているという。双方の課題を一掃する方法とは?
従来のファイルサーバで対応できない多様なデータを、効率的に管理・共有できる「全てのコンテンツ保管庫」として、クラウド型コンテンツ管理基盤にVPN接続機能を組み合わせたサービスが注目されている。その特徴をマンガ形式で紹介する。
従業員の自己紹介に加えて、企業間の関係構築においても重要な役割を担う名刺だが、その発注業務は意外と手間がかかる。名刺の作成から注文まで、ミスを発生させずに効率化するにはどうすればよいのか。本資料では、その解決策を紹介する。
IBM i 基幹システムを運用する企業でモダナイゼーションが喫緊の課題となる中、推進の課題も多い。そこで、「クラウド」「ノーコード開発」「API」「AI」を主軸とするIBM i ユーザー向けモダナイゼーションサービスを紹介する。
「IBM i の脱レガシー=ERP移行」に逃げない、モダナイズのアプローチとは? (2025/6/27)
「秘伝のExcel」がリスクに? クラウドコスト最適化はどこでつまずくのか (2025/5/30)
生成AIの本格利用でコスト急増も 「クラウド3大課題」にどう対処する? (2025/5/9)
KDDIの通信品質と事業成長を支える“共通インフラデータ基盤”構築の舞台裏 (2025/3/12)
高まるSaaSバックアップ需要で「ストック収益」を拡大するには (2025/1/22)
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...