ビッグデータを高速分散処理するSparkをAWSで動かすと何がすごいのかHadoopとの使い分けは?(1/2 ページ)

「Amazon Web Services」(AWS)のHadoopサービスとして特に魅力的なのが「Apache Spark」である。「Amazon Elastic MapReduce」と連係して高速処理や多用途性を実現する。

2016年09月12日 15時00分 公開
[Kurt MarkoTechTarget]
Amazon EMRで動かすApache Spark(出典:Amazon Web Services)《クリックで拡大》

 「Amazon Web Services」(AWS)のユーザーが利用できるアプリケーションサービスのラインアップは続々と増えている。特に多いのがデータ分析に関連するサービスだ。多くの企業がデータの海におぼれ、処理に困っている。そんな中AWSは、複雑なシステムをシンプルかつコスト効率よく構築できるようにするビッグデータツールとして重要な地位を確立した。例えば、AWSでは「Apache Spark」(Spark)が実行可能だ。

 AWSは多種多様なニーズに合わせて多くのデータベースを用意している。例えば「Amazon DynamoDB」でNoSQLデータベース、「Amazon RDS」と「Amazon Aurora」でリレーショナルデータベース(RDB)、「Amazon ElastiCache」でインメモリキャッシュ機能を提供したり、「Amazon Redshift」などのデータウェアハウスサービスを提供したりしている。またHadoopは、新種のデータ分析問題に対処する。これらの問題で使用されている極めて大きなデータセットを多くのシステム間で分散し、Hadoopクラスタを形成する。それでも、複数のソフトウェアコンポーネントが必要なスタックによって多数のシステムを導入するのはコストがかさむ上に複雑である。そのため、ほとんどの企業にとってHadoopの使用は現実的ではない。

Copyright © ITmedia, Inc. All Rights Reserved.

       1|2 次のページへ

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news175.png

製造業の8割が既存顧客深耕に注力 最もリソースを割いている施策は?
ラクスは、製造業の営業・マーケティング担当者500人を対象に、新規開拓や既存深耕におけ...

news105.jpg

「生成AIで作った広告」が物議 そのとき、コカ・コーラはどう動いた?
生成AIを広告制作に活用し、議論を呼んだCoca-Cola。この経験から何を学んだのか。

news028.jpg

新規顧客獲得と既存顧客のLTV向上、それぞれのCRO(コンバージョン率最適化)について
連載第4回の今回は、新規顧客の獲得と既存顧客のLTV(顧客生涯価値)、それぞれのCRO(コ...