2021年08月27日 08時00分 公開
特集/連載

データレイクハウス=データレイク+データウェアハウスデータレイクハウスとは

「データレイクハウス」という新たな考え方が登場した。名前から概要は想像が付くが、具体的にどのような特徴があるのだろうか。

[Antony Adshead,Computer Weekly]
iStock.com/kanawatvector

 データレイクハウスとは、データウェアハウスとデータレイクのギャップを埋めるという考え方だ。言い換えると、データレイクの比較的低コストの柔軟性とデータウェアハウスのアクセス性を結び付けることがデータレイクハウスの目的だ。

データレイクとデータウェアハウス

 まずデータレイクとデータウェアハウスの主な機能をまとめ、データレイクハウスという考え方がそのどこに落ち着くかを考えてみよう。

 データレイクはデータ管理の最も上流に位置する。データレイクには企業の全てのデータが流れ込む。XMLやJSONなどを介して非構造化データ、構造化データ、画像ファイル、PDF、データベースなどさまざまな形式のデータがそのままの形式で存在する。データレイクにはメタデータを使った検索機能があり、データサイエンティストがアドホックな分析を実行できる。

ITmedia マーケティング新着記事

news018.jpg

アフリカFinTech事情 初のキャッシュレス大陸への勢いが止まらない
FinTechのユニコーンが続々と生まれるアフリカ大陸。砂漠の南が燃えています。

news162.jpg

テレビと広告とTwitterと人間の脳の関係について、いま分かっていること(無料eBook)
「ITmedia マーケティング」では、気になるマーケティングトレンドをeBookにまとめて不定...

news029.jpg

P&Gが「ショッパー」のニーズを満たすために全社横断でやっていること
「LINE BIZ DAY BREAKOUT BRAND&DIRECT」で発表された事例の中から、P&Gが実施したデジタ...