特集/連載
徹底比較:データウェアハウス、データレイク、データマート、ODSの違いは?:ビッグデータ活用法を考える
データウェアハウス、データレイク、データマートなど、ビッグデータを収容する方法は少なくない。とはいえ、どの方法を選ぶかはデータの使用目的や使用者によって変わる。本稿では、これらの違いを考える。
企業はさまざまなソースから膨大な量のデータを収集する。その量は従来のリレーショナルデータベース(RDB)では処理しきれない。これがデータウェアハウスとデータレイクを比較する背景にあるものだ。データウェアハウスとデータレイクを使うのはそれぞれどういった場合で、何に適しているのか、またデータマート、オペレーショナルデータストア(ODS)、RDBとどう違うのか、などについても考える必要がある。
以上で挙げたデータリポジトリは、いずれも核となる機能が似ている。ビジネスに関するレポートと分析のためにデータを収容するという点だ。違いは、目的、格納するデータの種類、データの取得元、データにアクセスするユーザーなどにある。
一般に、こうしたデータリポジトリに収容されるデータは、CRM、ERP、HRや財務関連のシステムで生成される。このようなシステムが生成したデータレコードは、ビジネスルールに準拠しているかどうかが検証された後、データウェアハウスやデータレイクなどのデータストレージに送られる。
併せて読みたいお薦め記事
データ活用法を考える
- いまさら聞けない、「ビッグデータ分析」と“普通の分析”との違いとは
- 63.2%の企業がアナリティクスにクラウドDWHを積極利用 IDC Japanが発表
- IoT時代のビッグデータアナリティクスは今までと何が違うのか?
Hadoop関連の動き
さまざまなビジネスアプリケーションで生成されたデータを1つのデータプラットフォームに集め、それらのデータをビジネス分析ツールで使用する。これによりトレンドを見極めたり洞察を得たりして、ビジネス判断を下すことが可能になる。
データウェアハウス vs. データレイク
Copyright © ITmedia, Inc. All Rights Reserved.