2011年09月29日 09時00分 UPDATE
特集/連載

ビッグデータのためのDWH基盤【第1回】読めば分かる! ビッグデータのためのデータウェアハウス(DWH)とは?

BI/DWH分野でバズワードとなっている「ビッグデータ」。ビッグデータとはどのようなデータを指す言葉なのか。そしてビッグデータを格納するDWH製品の代表的な3つのアプローチを紹介する。

[平井明夫,アイエイエフコンサルティング]

変化するビッグデータの定義

 「ビッグデータ」という言葉は、ここ1年ほどで急速に取り上げられるようになったが、定義は今もって曖昧なようである。筆者が理解しているもともとのビッグデータの定義は、Twitter、Facebookといったソーシャルネットワーキングサービス(SNS)に、1日当たり数Tバイトといった莫大な単位で蓄積されるデータのことである。これらは、文字や映像を中心としたいわゆるマルチメディアデータであるため、一般的なデータウェアハウス(DWH)とは直接の関連はなかった。

 しかし、ここのところDWH分野でもビッグデータという言葉が頻繁に登場するようになった。これは、ビッグデータという言葉で表されるデータの種類が、マルチメディアデータだけでなく、大量に蓄積される(されている)定型的なデータも含むようになったためと考えられる。ここで言う定型的なデータとは、行(レコード)と列(カラム)で表現されるデータのことであり、別の言い方をすると、リレーショナルデータベース(RDB)で格納可能なデータということができる。

昔から存在するビッグデータ

 DWH分野におけるビッグデータの定義が、大量に発生する定型的なデータを含むとするならば、ビッグデータは昔から存在する。それは、例えばPOSデータであり、eコマースサイトのデータである。もともとDWHは比較的大量なデータを蓄積するためのIT基盤ではあるが、その中でもこれらは「日々刻々と膨大な量の明細データが発生する」という意味で立派にビッグデータの資格を満たしている。

 POSデータは、店舗小売業のレジで発生する販売データである。販売管理アプリケーションでは、1つのレシートが1件のトランザクションとなるが、DWHに格納される際は、購入商品アイテムごとに明細レコードとして格納するため、データ量はさらに莫大なものになる(関連記事:あるスーパーマーケットに見るPOSデータ分析の実践)。

 eコマースサイトのデータは、基本的な属性はPOSデータと同じであるが、一般的に会員制を取るため、購買者の個人属性(年齢、性別など)がデータに追加され、結果としてデータ量をさらに増大させる。

この記事が気に入ったらTechTargetジャパンに「いいね!」しよう

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news055.jpg

訪日中国人向けマーケティング、出発前から帰国後までの施策をアライドアーキテクツとSnSnapがパッケージ化
アライドアーキテクツはSnSnapと共同で、訪日中国人観光客に対するインバウンドプロモー...

news034.png

Twitterにおけるユーザー投稿を動画広告に反映、サイバーエージェント子会社がサービス提供
サイバーエージェント子会社のCyberBullはTwitterと連携し、ユーザー投稿を動画に反映で...

news044.jpg

B2Bでもやはり「動画」、日本HPとHDEのマーケティング責任者が語る活用事例
「PLAY 2017 Tokyo」から、「B2B 動画マーケティング最前線」と題したパネルディスカッシ...