2016年09月12日 15時00分 UPDATE
特集/連載

Hadoopとの使い分けは?ビッグデータを高速分散処理するSparkをAWSで動かすと何がすごいのか (1/2)

「Amazon Web Services」(AWS)のHadoopサービスとして特に魅力的なのが「Apache Spark」である。「Amazon Elastic MapReduce」と連係して高速処理や多用途性を実現する。

[Kurt Marko,TechTarget]
Amazon EMRで動かすApache Spark(出典:Amazon Web Services)《クリックで拡大》

 「Amazon Web Services」(AWS)のユーザーが利用できるアプリケーションサービスのラインアップは続々と増えている。特に多いのがデータ分析に関連するサービスだ。多くの企業がデータの海におぼれ、処理に困っている。そんな中AWSは、複雑なシステムをシンプルかつコスト効率よく構築できるようにするビッグデータツールとして重要な地位を確立した。例えば、AWSでは「Apache Spark」(Spark)が実行可能だ。

 AWSは多種多様なニーズに合わせて多くのデータベースを用意している。例えば「Amazon DynamoDB」でNoSQLデータベース、「Amazon RDS」と「Amazon Aurora」でリレーショナルデータベース(RDB)、「Amazon ElastiCache」でインメモリキャッシュ機能を提供したり、「Amazon Redshift」などのデータウェアハウスサービスを提供したりしている。またHadoopは、新種のデータ分析問題に対処する。これらの問題で使用されている極めて大きなデータセットを多くのシステム間で分散し、Hadoopクラスタを形成する。それでも、複数のソフトウェアコンポーネントが必要なスタックによって多数のシステムを導入するのはコストがかさむ上に複雑である。そのため、ほとんどの企業にとってHadoopの使用は現実的ではない。

       1|2 次のページへ

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news113.jpg

Sansan 石野真吾氏がMarketo主催アワードで「Marketer of the Year」を受賞
庭山一郎氏が相棒であるミミズクの「ノヤン先生」とともに米国へ出張。ITmedia マーケテ...

news091.jpg

国内通販市場は2017年に10兆円超え、ECが8割を占める
富士経済は、ECへ集約しながら成長を続ける国内の通販市場(B2Cの物販)を調査、分析した...

news015.jpg

デジタルマーケティングを構築するための定石(後編)
デジタルマーケティングの課題に対して解決策とヒントを教える書籍『デジタルマーケティ...