2011年11月29日 09時00分 UPDATE
特集/連載

ビッグデータのためのDWH基盤【第3回】列単位格納でビッグデータの高速処理を実現するカラム型データベース

ビッグデータの高速処理基盤として注目されているカラム型データベース。代表製品は近年大手ベンダーが買収した製品が目立つ。カラム型データベースの特徴と、どのような場合に利用が適しているかを解説する。

[平井明夫,アイエイエフコンサルティング]

カラム型データベース登場の背景

 一般的なリレーショナルデータベース管理システム(RDBMS)は、もともと業務系アプリケーションの構築を想定して機能を進化させてきたが、1990年ごろから情報系アプリケーション、すなわちデータウェアハウス(DWH)の構築にも利用されるようになる。それに伴い、DWH構築に必要な機能、つまり、スタースキーマで実装されたデータベース検索性能を向上させる機能も積極的に強化されるようになった。

 このようなDWH向けに実装された機能の代表的なものに、ファクトテーブルを分割してスキャンできるパーティション機能や、特定の列に沿って集約したテーブルを自動的にメンテナンスするサマリーテーブル機能などがある。しかし、DWHにおいて頻繁に発生する全件検索のような処理は大量のディスクI/O処理を必要とするため、RDBMSでDWHを構築する際の一番のボトルネックとなっていた。

 このようなDWH特有の問題を解決するために登場したのが「カラム型データベース」である。一般的なRDBMSではディスクへのデータ格納が行単位で行われるのに対して、カラム型データベースでは列(カラム)単位で行われる。カラム型データベースは、カラム(列)指向データベース、カラムストア型データベース、カラムナデータベースなどと呼ばれることもある。

この記事を読んだ人にお薦めのホワイトペーパー

この記事を読んだ人にお薦めの関連記事

Loading

注目テーマ

ITmedia マーケティング新着記事

news102.jpg

企業の社会課題への解決姿勢は商品の継続利用や他者への推奨意向に影響――メンバーズ調査
メンバーズが実施した「エンゲージメント・サーベイ」によると、Webサイトで本業による社...

news087.jpg

サイバーエージェントとアイリッジ、位置情報分析や行動分析ターゲティングに基づく広告配信で連携
サイバーエージェントのアドテクノロジー商品の開発を行うアドテクスタジオとアイリッジ...

news020.jpg

表示されている? 見られている? 結局リーチしている?――「質的視点」からの新たな効果指標について
脱PV至上主義を叫ぶのはいいとして、具体的には何を目指すのか。戦略コンサルが提案する...