ビッグデータでも負けられない戦い AWS、Azure、Googleの関連サービスを比較する:検索では有利なGoogleに意外な弱点(1/2 ページ)
クラウドプロバイダー大手3社Amazon Web Services(Amazon)、Microsoft、Googleのビッグデータサービスを比較した。共通点も多いが、詳しく掘り下げると違いが見えてきた。
関連キーワード
Amazon Web Services | Google Compute Engine | Hadoop | BI(ビジネスインテリジェンス) | クラウドストレージ | クラウドコンピューティング
クラウド市場は、絶え間なく変化する一連のビッグデータサービスとともに急速な発展を遂げている。そのため、クラウドベンダーを比較するのは容易でないが、やってみる価値はある。なぜならクラウドプロバイダー大手3社のAmazon Web Services(Amazon)、Microsoft、Googleのサービスが同じように形成されているわけではないからだ。
クラウドのビッグデータは、Googleが検索分野における膨大な経験によって利益を得ている市場領域だ。一方、AmazonとMicrosoftは、新興企業の関心を集めることで自社サービスの価値を高めている。
その結果、ビッグデータサービスは、機能性と経済的な観点の両面でますます魅力的になり、活気に満ちた領域になっている。この3社によるビッグデータの競争は、最終的にクラウドユーザーにメリットをもたらすだろう。この競争は、今後数年間続くことが予想される。
本稿では、Amazon、Microsoft、Googleが提供するビッグデータサービスについて詳しく見ていきたい。
関連記事
クラウドBIを理解する
クラウド×データ分析の事例
- “宝の山”を有効活用できるのはオンプレミスだった――広告データ分析基盤をAWSから移行したワケ
- 【事例】じゃらん、ゼクシィにも活用、リクルートはなぜ「Hadoop」を使う?
- ゼンリンデータコムのビッグデータチームが指南、AWSマネージドHadoopの勘所とは?
Amazon
Amazonは幅広いビッグデータサービスを提供している。例えば、「Amazon Elastic MapReduce」(Amazon EMR)は、「Hadoop」と「Spark」を実行している。一方、「Amazon Kinesis Firehose」と「Amazon Kinesis Streams」は、大量のデータセットを「Amazon Web Services」(AWS)に読み込む方法を提供する。また、ユーザーはコスト削減のためにデータを圧縮した状態で、PB級のデータウェアハウスである「Amazon Redshift」にデータを保存ができる。それから、「Amazon Elasticsearch Service」は、クリック操作やログ監視などの分析のために、オープンソースの「Elasticsearch」ツールをAWSに導入するサービスで、データストリームを分析する「Amazon Kinesis Analytics」が補完する。
AWSは、「Google Compute Engine」(GCE)よりデータストレージの選択肢が豊富だ。AWSには、広大な「AWS Simple Storage Service」(Amazon S3)ファームに加えて、待機時間の少ないNoSQLデータベースの「Amazon DynamoDB」、Titanのグラフデータベースにストレージを提供する「DynamoDB Storage Backend for Titan」、PB級のNoSQLデータベースである「Apache HBase」、リレーショナルデータベースもある。
AWSは、ビジネスインテリジェンス(BI)サービスの「Amazon QuickSight」も提供しており、QuickSightは高速処理を実現するために、並列のメモリ内処理を採用している。QuickSightは、「Amazon Machine Learning」と、「AWS IoT」(AWS Internet of Things)プラットフォームに補完されている。AWS IoTは、デバイスをクラウドに接続し、数十億台のデバイスと数兆件のメッセージをサポートできる。
GCEは検索と分析エンジンを強みとしているが、AWSはBI、グラフィックス処理装置(GPU)インスタンスなど、幅広いサービスを提供している。
Microsoft
分析に関して言うと、「Microsoft Azure」(Azure)は、「Azure Data Lake Analytics」を備えている。Data Lake Analyticsは、SQLとC++で独自のU-SQLを使用し、Hadoopベースのサービスである「HDInsight」も使用している。また、Azureには、「Azure Stream Analytics」、グローバルなメタデータシステムを使ってデータ資産を特定する「Data Catalog」、オンプレミスとクラウドのデータソースを連結し、データパイプラインを管理する「Data Factory」もある。
Azureのビッグデータストレージサービスは、「Data Lake Store」というHadoopファイルシステムだ。Azureは、「StorSimple」、SQLデータベース、NoSQLデータベース、BOLBストレージを含む汎用目的のストレージサービスも展開している。
また、AWSと同様にAzureは「Power BI」、機械学習、「IoT Hub」を装備している。また、クラウドプラットフォームには検索エンジンも含まれる。Microsoftの「Cortana Analytics Suite」と「Cognitive Services」は、より高度なインテリジェンス機能を備えている。
Copyright © ITmedia, Inc. All Rights Reserved.