ビッグデータを高速分散処理するSparkをAWSで動かすと何がすごいのか：Hadoopとの使い分けは？（1/2 ページ）

「Amazon Web Services」（AWS）のHadoopサービスとして特に魅力的なのが「Apache Spark」である。「Amazon Elastic MapReduce」と連係して高速処理や多用途性を実現する。

≫ 2016年09月12日 15時00分公開

[Kurt Marko，TechTarget]

関連キーワード

Hadoop | Amazon Web Services | API | クラスタ | Amazon DynamoDB | BI（ビジネスインテリジェンス） | ビッグデータ | データ分析 | データベース

Amazon EMRで動かすApache Spark（出典：Amazon Web Services）《クリックで拡大》

　「Amazon Web Services」（AWS）のユーザーが利用できるアプリケーションサービスのラインアップは続々と増えている。特に多いのがデータ分析に関連するサービスだ。多くの企業がデータの海におぼれ、処理に困っている。そんな中AWSは、複雑なシステムをシンプルかつコスト効率よく構築できるようにするビッグデータツールとして重要な地位を確立した。例えば、AWSでは「Apache Spark」（Spark）が実行可能だ。

　AWSは多種多様なニーズに合わせて多くのデータベースを用意している。例えば「Amazon DynamoDB」でNoSQLデータベース、「Amazon RDS」と「Amazon Aurora」でリレーショナルデータベース（RDB）、「Amazon ElastiCache」でインメモリキャッシュ機能を提供したり、「Amazon Redshift」などのデータウェアハウスサービスを提供したりしている。またHadoopは、新種のデータ分析問題に対処する。これらの問題で使用されている極めて大きなデータセットを多くのシステム間で分散し、Hadoopクラスタを形成する。それでも、複数のソフトウェアコンポーネントが必要なスタックによって多数のシステムを導入するのはコストがかさむ上に複雑である。そのため、ほとんどの企業にとってHadoopの使用は現実的ではない。

併せて読みたいお勧めの記事

Hadoop事例

【事例】じゃらん、ゼクシィにも活用、リクルートはなぜ「Hadoop」を使う？

クラウドサービスのHadoopを比較

Hadoopディストリビューション選定

企業向け機能とサポートが充実の「商用Hadoopディストリビューション」6選

IT部門のためのアナリティクス入門

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(https://image.itmedia.co.jp/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}

続きを閲覧するには、ブラウザの JavaScript の設定を有効にする必要があります。

　　　　　　 1|2 次のページへ

TechTargetジャパントップデータ分析

ビッグデータを高速分散処理するSparkをAWSで動かすと何がすごいのか：Hadoopとの使い分けは？（1/2 ページ）

関連キーワード

Hadoop | Amazon Web Services | API | クラスタ | Amazon DynamoDB | BI（ビジネスインテリジェンス） | ビッグデータ | データ分析 | データベース

併せて読みたいお勧めの記事

Hadoop事例

クラウドサービスのHadoopを比較

Hadoopディストリビューション選定

IT部門のためのアナリティクス入門

関連記事

アイティメディアからのお知らせ

From Informa TechTarget

プレミアムコンテンツ

ITmedia マーケティング新着記事