クラウドデータレイクには、オンプレミスのデータレイクにはない利点と欠点がある。どのような場面で役に立つのか。利用可能なサービスにはどのようなものがあるのか。
企業が膨大なデータを扱う現代において、データレイクをクラウドサービスで運用する「クラウドデータレイク」を活用することにはさまざまなメリットがある。データウェアハウス(DWH)や業務アプリケーション、人工知能(AI)ツールでのデータ利用を見据え、クラウドデータレイクを運用する上では、どのようなメリットとデメリットを享受できるのか。
拡張性や管理の容易さといった、主要クラウドベンダーが提供するクラウドストレージの長所のほとんどは、クラウドデータレイクにも当てはまる。初期費用を抑えたり、データセンターの構築やハードウェアの設置を回避したりできるメリットもある。
一方で料金には注意が必要だ。クラウドストレージは容量を適時で変更できるため、データレイクの容量が想定以上に拡大すると、料金が増大する可能性がある。データをデータベースやアプリケーションに転送する際は、エグレス料金(クラウドサービスから外部のインフラにデータを送信するときにかかる料金)や通信回線の料金も考慮しなければならない。
一部の企業は、セキュリティ、機密保持、データ主権の観点で、クラウドサービスにデータを保管することが困難だ。そうした企業は、規制によってデータを保管する場所が制限されており、未加工のデータは機密度が非常に高い場合がある。主要クラウドベンダーは、顧客データの保管場所をアベイラビリティゾーン(同一リージョン内のデータセンター)に設定したり、地理的制限を課したりしている。企業の最高情報責任者(CIO)や最高データ責任者(CDO)は、こうした制限がビジネス要件を満たすことを確認することが欠かせない。
ただし大規模なデータレイクは、負荷の高い処理を後工程で実施するため、データレイクの処理性能が障壁になることはあまりない。そうした問題が発生するのは、主にクラウドサービスまたはオンプレミスのブロックストレージにあるDWHだ。
クラウドサービスでデータレイクを構築する企業向けに、主要クラウドベンダーが提供しているデータレイクを紹介する。
Microsoftは、データストレージ用のデータレイクとして「Azure Data Lake Storage」(ADLS)を提供している。現行のバージョン「ADLS Gen2」は、「ADLS Gen1」とオブジェクトストレージ「Azure Blob Storage」を組み合わせたものだ。分析機能とDWHを組み合わせた「Azure Synapse Analytics」で、データレイクとDWHを組み合わせた「データレイクハウス」を構築できる。構造化データと非構造化データの両方を対象とした保管や分析が可能だ。統合データガバナンス製品「Microsoft Purview」を使うことで、データガバナンスを実現できる。
AWSは、オブジェクトストレージ「Amazon Simple Storage Service」(Amazon S3)にデータレイクを構築するための「AWS Lake Formation」を提供している。クエリ実行サービス「Amazon Athena」「Amazon Redshift Spectrum」、AIモデル構築サービス「Amazon SageMaker」と組み合わせれば、データへのアクセスと分析、AIモデルの構築を実行可能だ。
Googleは、他の2社とは異なるアプローチを採用している。オブジェクトストレージ「Cloud Storage」を、クラウドDWH「BigQuery」とAIモデル構築サービス「Vertex AI」と組み合わせる方式だ。データレイクとDWHを組み合わせたストレージ「BigLake」も提供している。具体的には、BigQueryやAmazon S3、Microsoft Azureのストレージを組み合わせることができる他、データレイクとDWHを統合したデータ管理アーキテクチャ「Open Format Data Lakehouse」を作成できる。
米国Informa TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
主戦場は「テレビ画面」へ YouTube20周年でCEOが公開書簡を公開
20周年を迎えるYouTubeが、クリエイターとユーザーの双方にとってより魅力的で革新的なプ...
都道府県別ライフスタイル調査 「推し活好き」「ラーメン好き」最多は?
明治安田総合研究所が公表した都道府県別「ライフスタイルに関するアンケート調査」の結...
Metaの広告はますますAI中心に 新たなツール「最適化スコア」とは?
Metaの2025年ビジネス注力領域とAIを活用したツールをはじめとした広告ソリューションの...