クラウドデータレイクには、オンプレミスのデータレイクにはない利点と欠点がある。どのような場面で役に立つのか。利用可能なサービスにはどのようなものがあるのか。
企業が膨大なデータを扱う現代において、データレイクをクラウドサービスで運用する「クラウドデータレイク」を活用することにはさまざまなメリットがある。データウェアハウス(DWH)や業務アプリケーション、人工知能(AI)ツールでのデータ利用を見据え、クラウドデータレイクを運用する上では、どのようなメリットとデメリットを享受できるのか。
拡張性や管理の容易さといった、主要クラウドベンダーが提供するクラウドストレージの長所のほとんどは、クラウドデータレイクにも当てはまる。初期費用を抑えたり、データセンターの構築やハードウェアの設置を回避したりできるメリットもある。
一方で料金には注意が必要だ。クラウドストレージは容量を適時で変更できるため、データレイクの容量が想定以上に拡大すると、料金が増大する可能性がある。データをデータベースやアプリケーションに転送する際は、エグレス料金(クラウドサービスから外部のインフラにデータを送信するときにかかる料金)や通信回線の料金も考慮しなければならない。
一部の企業は、セキュリティ、機密保持、データ主権の観点で、クラウドサービスにデータを保管することが困難だ。そうした企業は、規制によってデータを保管する場所が制限されており、未加工のデータは機密度が非常に高い場合がある。主要クラウドベンダーは、顧客データの保管場所をアベイラビリティゾーン(同一リージョン内のデータセンター)に設定したり、地理的制限を課したりしている。企業の最高情報責任者(CIO)や最高データ責任者(CDO)は、こうした制限がビジネス要件を満たすことを確認することが欠かせない。
ただし大規模なデータレイクは、負荷の高い処理を後工程で実施するため、データレイクの処理性能が障壁になることはあまりない。そうした問題が発生するのは、主にクラウドサービスまたはオンプレミスのブロックストレージにあるDWHだ。
クラウドサービスでデータレイクを構築する企業向けに、主要クラウドベンダーが提供しているデータレイクを紹介する。
Microsoftは、データストレージ用のデータレイクとして「Azure Data Lake Storage」(ADLS)を提供している。現行のバージョン「ADLS Gen2」は、「ADLS Gen1」とオブジェクトストレージ「Azure Blob Storage」を組み合わせたものだ。分析機能とDWHを組み合わせた「Azure Synapse Analytics」で、データレイクとDWHを組み合わせた「データレイクハウス」を構築できる。構造化データと非構造化データの両方を対象とした保管や分析が可能だ。統合データガバナンス製品「Microsoft Purview」を使うことで、データガバナンスを実現できる。
AWSは、オブジェクトストレージ「Amazon Simple Storage Service」(Amazon S3)にデータレイクを構築するための「AWS Lake Formation」を提供している。クエリ実行サービス「Amazon Athena」「Amazon Redshift Spectrum」、AIモデル構築サービス「Amazon SageMaker」と組み合わせれば、データへのアクセスと分析、AIモデルの構築を実行可能だ。
Googleは、他の2社とは異なるアプローチを採用している。オブジェクトストレージ「Cloud Storage」を、クラウドDWH「BigQuery」とAIモデル構築サービス「Vertex AI」と組み合わせる方式だ。データレイクとDWHを組み合わせたストレージ「BigLake」も提供している。具体的には、BigQueryやAmazon S3、Microsoft Azureのストレージを組み合わせることができる他、データレイクとDWHを統合したデータ管理アーキテクチャ「Open Format Data Lakehouse」を作成できる。
米国Informa TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
DXが進み、レガシーシステムからの脱却が喫緊の課題となっている今。「ERP×ノーコードツール」のアプローチで基幹システムの刷新に取り組む企業が増えている。そのアプローチを推進するに当たってのポイントを解説する。
DXの本質は、デジタル技術を駆使して変化に適応する能力を身につけることにある。その手段の1つとして注目を集めているのが、ローコード/ノーコード開発ツールだ。京王グループなどの事例とともに、その特徴やメリットを紹介する。
DX人材の重要性が高まる中、ノーコードツールの活用によって業務改革と人材育成を両立しようとする動きが活発化している。年間約780時間の工数削減を実現した京セラをはじめとする5社の事例を基に、その実態を探る。
急速に進化するデジタル技術は、製造業などのものづくりの現場にもさまざまな恩恵をもたらしている。しかし、設備点検業務や棚卸業務などの立ち仕事や移動が多い現場では、いまだにアナログ業務が残存し、効率化の妨げとなっているという。
あらゆる業界でDXの重要性が増しているが、工場や倉庫の中にはデジタル化が後回しにされている隙間業務が多数ある。その理由を明らかにした上で、それらの業務をモバイルアプリでデジタル化し、現場DXを推進する9社の事例を紹介する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。