インメモリデータベースで高速処理化が進む最新OLAP分析ツール:BIツール最前線:OLAP分析ツール編
OLAP分析ツールの基本機能を解説するとともに、代表製品を紹介。最新製品ではインメモリデータベースの採用により、分析処理の高速化が進んでいる。
OLAP分析ツールに求められる機能
ビジネスインテリジェンス(BI)ツールの中で、意思決定プロセスにおける「問題の要因を検証するため」に利用されるのがOLAP(online analytical processing)分析ツールだ。リポーティングツールの利用目的が「問題の兆候を発見すること」までであったのに対し(参考:コマーシャルOSSが注目を集めるリポーティングツールの最新動向)、OLAP分析ツールには捉えた現象をより掘り下げていく機能が求められる。結果に至った要因がどこにあるのか当たりを付け、本当にそれが問題の要因なのかを検証することがOLAP分析ツール導入の目的となるのだ(参考:読めば分かる! BI(ビジネスインテリジェンス)ツールの種類と必要な機能)。
OLAP分析ツールでは、3次元以上の多次元データベースから2次元のクロス集計表としてデータを取り出し、「ドリルダウン」「スライシング」「ダイシング」という3つのデータ分析操作でデータの多次元的な分析を行う。多次元データベースとOLAP分析操作を模式化したのが下図だ。
上図のサイコロが多次元データベースを表している。図の例では、「期間」「製品」「地域」という3次元のデータベースになっている。これらの次元は、それぞれ階層を持っている。一方、サイコロの中には、「販売金額」という数値が入っている。ただしこの数値は、3つの次元と階層の全ての組み合わせについての集計値になっている。
従って、サイコロの手前の面を2次元の表として見ると、図の左下のように横軸が「期間」で縦軸が「地域」の表になっており、表の中には「期間」と「地域」の組み合わせ(この場合9通り)の集計値が含まれていることになる。
このように、多次元データベースの中には、次元(ディメンション)とその次元を構成する項目(メンバー)をキーとして、非常にたくさんの集計値(メジャー)が含まれている。リレーショナルデータベース(RDB)ではSQLを使用してレコードの単位でデータを取り出すが、多次元データベースでは集計値を2次元の表の単位で扱い、ある1つの2次元表に対してドリルダウン、スライシング、ダイシングの3つの操作を行うことにより、特定の表を取り出すことになる。
ドリルダウン
ドリルダウンは、次元の階層に従ってデータを掘り下げる操作だ。図の例では、「期間」次元の「年」階層から「月」階層にドリルダウンしている。なお、ドリルダウンの反対で、より上位の階層に戻る操作をドリルアップと呼ぶ。
スライシング
スライシングは、多次元データベースの目に見えていない奥行きになっている次元に沿って切れ目を入れて(スライスして)データの対象を絞り込む操作だ。図の例では、「製品」次元に沿ってスライスして、製品Aだけを対象としたデータに絞り込んでいる。
ダイシング
ダイシングは、多次元データベースをサイコロ(ダイス)に見立て、それを転がす(ダイシングする)ことによって、目に見える面を取り換える操作だ。図の例では、「地域」次元と「製品」次元をダイシングにより取り換えている。
関連ホワイトペーパー
データベース | BI(ビジネスインテリジェンス) | SQL | SQL Server | Excel | Microsoft(マイクロソフト) | IBM(アイ・ビー・エム) | Oracle(オラクル) | 検索 | データウェアハウス
Copyright © ITmedia, Inc. All Rights Reserved.