ビジネスにおけるデータ活用が求められる中、クラウドデータレイクへの注目が高まっている。なぜデータレイクをオンプレミスシステムではなくクラウドサービスで運用する必要性があるのか。
増え続けるデータを効率的に管理するための仕組みとして「データレイク」の活用が広がっている。データレイクという大規模なデータリポジトリを活用することで、企業は構造化データと非構造化データを収集し、保存できる。それらのデータをデータウェアハウス(DWH)やデータベース、業務アプリケーションに送ったり、データサイエンティストや分析ツール、人工知能(AI)ツールに渡したりすることで、さらなるデータの活用が可能になる。
膨大な量のデータの蓄積や、ビジネスの成長に合わせたデータレイクの拡大を見据えると、クラウドサービスにデータレイクを配置することが視野に入る。そうした「クラウドデータレイク」にはどのようなメリットやデメリットがあるのかを知る前に、まずはデータレイクの概要を学ぼう。
データレイクは、データを加工せずに保存する保管庫だ。保存したデータは、必要に応じて追加処理をしたり、データベースや業務アプリケーションに送ったりする。データレイクには、以下をはじめビジネスに関するさまざまなデータが集まる。
データレイクには、構造化データ、非構造化データ、半構造化データのいずれも格納可能だ。データを検索する際は、メタデータを使ったタグ付け機能を利用する。格納したデータは、専用アプリケーションで処理するか、データサイエンティストや開発者が加工することになる。従業員や業務アプリケーションが使用できるよう、データを整形して保存するDWHとは対照的だ。
クラウドサービス群「Amazon Web Services」(AWS)は、データレイクを以下のように定義している。
データレイクは、規模にかかわらず、すべての構造化データと非構造化データを保存できる一元化されたリポジトリです。データをそのままの形で保存できるため、データを構造化しておく必要がありません。
クラウドデータレイクの特徴は、保存容量の拡張性と管理のしやすさだ。主要クラウドベンダーが提供するクラウドデータレイクはオブジェクトストレージで稼働し、事実上容量の制限がない。
他のクラウドストレージと同様、クラウドデータレイクも容量を増減できる。企業はビジネス要件に応じて容量を調整し、料金を抑えることが可能だ。容量の増減、ハードウェアとソフトウェアの保守、冗長化、セキュリティ対策をクラウドベンダーが担当するため、企業の負担軽減につながる。コンサルティング企業PA Consulting Groupでデータエキスパートを務めるスリバッツァ・ノリ氏は、「企業のデータエンジニアリングチームはビジネスの分析に専念できるようになり、オンプレミスインフラのメンテナンスから解放される」と説明する。
「信頼性と可用性を備え、最新技術を取り入れたデータレイクは、安定したパフォーマンスと最小限のダウンタイム(停止時間)を実現する」(ノリ氏)
クラウドベンダーは、アクセス制御と監査機能だけではなく、クラウドリソースへのタグ付けによる効率的な管理方法も提供している。
これまで企業やベンダーはデータレイクとDWHを別々の仕組みとして扱っていたが、最近は同一システムで運用したり、「データレイクハウス」として統合したりするようになった。「最新のデータ管理において、データレイクとDWHは互いに補完し合っており、クラウドサービスはこれら2つを効果的に統合する」とノリ氏は述べる。
次回は、クラウドデータレイクの長所と短所、具体的なクラウドデータレイクを解説する。
米国Informa TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
多くの企業でオフィスDXが進む一方、現場にはアナログ業務が多く残りDXが進んでいない。現場DXを推進し、オフィスと現場のデータを活用するためにはどうしたらよいか。本資料では、ノーコード開発ツールを活用した解決策を紹介する。
工場や倉庫などの現場では、紙中心の業務が今も多く残っている。だが現場DXを進めようにも、人材や予算の不足、システム選定の難しさが障壁となっているケースは多い。この問題を解消する、モバイルアプリ作成ツールの実力とは?
ビジネスに生成AIを利用するのが当たり前になりつつある中、ローコード開発への活用を模索している組織も少なくない。開発者不足の解消や開発コストの削減など、さまざまな問題を解消するために、生成AIをどう活用すればよいのか。
急速に変化する顧客ニーズに応えるような適切な製品を継続的に提供するためには、より多くのアプリを生み出す必要があるが、そのための開発者が不足している。そこで注目されているのが、生成AIやローコード開発プラットフォームだ。
あらゆる組織は、従業員と消費者の双方に良質なエクスペリエンスを提供する義務を負っている。アプリ開発と高度な自動化は、この目的を達成するための有効策の1つだが、それぞれを適切に実装できなければ、むしろリスク要因ともなり得る。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。