最強クラウドETLは? 「AWS Glue」「Azure Data Factory」を料金とコネクターで比較:「AWS Glue」と「Azure Data Factory」を徹底比較【後編】
「AWS Glue」と「Azure Data Factory」はよく似たクラウドETLだが、重要な違いがある。自社の要件にどちらが適しているのか。料金体系やデータコネクターの種類から比較する。
Amazon Web Services(AWS)の「AWS Glue」とMicrosoftの「Azure Data Factory」はどちらもETL(データの抽出、変換、読み込み)のクラウドサービス(以下、クラウドETL)だ。両者はよく似た機能を提供しており、データパイプライン(さまざまなデータソースからデータを取り込むシステム)の構築に利用できる点は変わらない。ただし異なる特徴もある。両者の機能や料金の違いを比較する。
AWS GlueとAzure Data Factoryを「料金」で比較
併せて読みたいお薦め記事
連載:「AWS Glue」と「Azure Data Factory」を徹底比較
- 前編:クラウドETLの2大巨頭「AWS Glue」「Azure Data Factory」をざっくり理解する
- 中編:クラウドETL「AWS Glue」「Azure Data Factory」でデータパイプラインを構築する方法
料金体系は、AWS Glueの方がAzure Data Factoryよりも比較的、標準化が進んでいる。コストはAWS Glueの方が予測しやすい傾向にある。
AWS Glueの料金は主に、データ処理に必要なCPUとメモリ、ネットワークを組み合わせた単位であるデータ処理単位(DPU)の数と、利用時間を基に計算する。AWS Glueのほとんどの機能で、DPU利用料金は一律だ。2022年11月時点では、米国東部(オハイオ)リージョンのDPU当たりの金額は、1秒につき0.44ドル。データソースからデータを抽出したり、AWS Glueに取り込んだオブジェクトデータを保存するデータカタログ機能を利用したりする場合には、追加料金が発生する場合がある。データパイプラインの実行時間に対する利用料金は発生しない。
Azure Data Factoryのコストは、AWS Glueよりも不確定な要素が多めだ。Azure Data Factoryは、利用料金の計算にデータ統合単位(DIU)という単位を利用する。DIUはDPUと同様の単位だ。米国東部リージョンの場合、DIU当たりの金額は、1時間につき0.25ドル。データパイプラインにおけるデータ検索やメタデータの取得などのアクティビティーとデータの読み取り・書き込み、データパイプラインの総実行時間などに追加料金が発生する。
AWS GlueとAzure Data Factoryを「データコネクターの種類」で比較
AWS GlueとAzure Data Factoryは、データソースとETLを接続するための複数のデータコネクターを用意する。両者でデータコネクターを使用すると、データソースとして機能するデータストアに接続できる。ただし両者で利用可能なデータストアは異なる。
Azure Data FactoryはMicrosoft製品からデータを収集するためのデータコネクターを用意している。AWS GlueもMicrosoftのドキュメント管理ツール「SharePoint」といった一部のMicrosoft製品と連携できるものの、2022年10月時点ではMicrosoftのデータベースソフトウェア「Access」などのMicrosoft製品にはデータコネクターを用意していない。
AWS Glueの場合は、AWSの公式アプリケーションストア「AWS Marketplace」で検索することで、データコネクターを確認できる。Azure Data Factoryの場合は、Microsoftの公式ドキュメントで確認できる。
SSIS(SQL Server Integration Services)の関連機能
「SQL Server Integration Services」(SSIS)はMicrosoftのデータベース管理システム(DBMS)「SQL Server」の機能の一つで、さまざまな形式のデータの抽出や変換を実行する。SSISは一般的に、オンプレミスインフラでデータパイプラインを構築するときに使用する機能だ。データパイプラインのクラウドサービスへの移行後にSSISを利用したいと考えるユーザー企業に向けて、AWS GlueとAzure Data FactoryはどちらもSSISのパッケージをインポートする機能を備える。
AWS GlueにSSISパッケージをインポートするときは、Azure Data Factoryにインポートする場合よりも多くの手順を踏む必要がある。AWS GlueはSSISパッケージを変換する作業が必要だが、Azure Data FactoryではオンプレミスのSSISパッケージをクラウドサービスへ移行する際に変換作業が必要なく、そのまま実行できる。
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.