検索
特集/連載

ビッグデータ活用のための分析基盤が分かる3つのホワイトペーパーホワイトペーパーレビュー

ビッグデータ活用のための分析基盤のアプローチは幾つか存在する。リアルタイムデータ活用の課題に対するエグゼクティブへの調査結果や、Hadoop、DWHアプライアンスなどの技術解説のホワイトペーパーを紹介する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 TwitterやFacebookなどのソーシャルネットワーキングサービス(SNS)に、1日当たり数Tバイトといった莫大な単位で蓄積されるマルチメディアデータ。それだけでなくRFIDなどの各種センサーデータやモバイル機器が生成するデータ、POSデータやeコマースサイトのデータなど、大量かつ多様な「ビッグデータ」が注目を集めている。

 それら通常のデータベース管理システム(DBMS)では取り扱うことが難しいとされているビッグデータを分析・活用し、ビジネスに生かそうという企業の取り組みが見られるようになってきた。そこで、TechTargetジャパンのホワイトペーパーダウンロードセンターに登録されているホワイトペーパーの中から、ビッグデータの分析基盤構築を考える企業に役立つと思われるホワイトペーパーを幾つか紹介したい。なお、ビッグデータのためのデータウェアハウス(DWH)基盤の基礎解説については、「読めば分かる! ビッグデータのためのデータウェアハウス(DWH)とは?」を参照してほしい。

ビッグデータ活用のキーワードは「リアルタイム」

なぜ企業は超リアルタイムビジネスへの移行に踏み切れないのか? その採用障壁とは

画像
提供:SAPジャパン(21ページ)

 ビッグデータが注目されるようになってより重要視されているのが、扱うデータの「リアルタイム性」だろう。ソーシャルメディアや携帯電話、スマートフォンがこれほど普及したことに加え、アクセス可能な情報は爆発的に増加している。そのような状況で、世界の企業のリーダーたちはどのような課題を抱えているのだろうか。

 本ホワイトペーパーは、コンサルティング企業のオックスフォード・エコノミクスが世界13カ国525人のビジネスリーダーを対象に実施した、「リアルタイムな事業運営・業務遂行」(リアルタイムオペレーション)についての調査結果をまとめたものである(調査実施時期は2011年3月)。回答者がリアルタイムオペレーションのための主要な障壁として挙げているのは、「テクノロジーの欠如」を筆頭に、「リアルタイムシステムに関するサプライヤーの経験不足」「社内における専門知識の欠如」などだ。このことから、リアルタイムオペレーションの成功のためには周到な計画と戦略が必要だとホワイトペーパーでは説いている。その他、リアルタイムオペレーションの採用を先行している業種、業務領域、採用の理由などをまとめている。

汎用RDBMSの課題、そしてHadoopが求められるわけ

ビッグデータ活用のためのDWH/Hadoop基盤構築 Greenplum DB/Greenplum MR徹底解説書

画像
EMCジャパン(12ページ)

 ビッグデータ活用のための分析基盤として注目されるHadoop。もともとはGoogle Labで生み出された考え方をベースに、Javaで実装したオープンソースソフトウェア(OSS)として提供されているのがApache Hadoopだ。超大容量の非構造、構造化含めたデータの高速処理を可能にしている。米Yahoo、米Facebookなどの有名Web企業が先進ユーザーとなっていることでも有名だ(関連記事:Hadoopがビッグデータの分析基盤として注目されるわけ)。

 本ホワイトペーパーでは、ビッグデータ時代のDWHシステムのために設計されたデータベース「Greenplum DB」と、Hadoopディストリビューション「Greenplum MR」の解説書だ。バッチ処理・データ解析における汎用RDBMSの課題や、それを解決するのに適したデータベース構造について解説するとともに、非構造化データを対象にしたHadoopディストリビューションの全容を紹介している。OSSであるが故のHadoopの注意点を踏まえて、今データベース技術者が押さえておくべきポイントをまとめている。

最新DWHアプライアンス比較に役立つ資料

DWHアプライアンスの真実 Oracle Exadata と IBM Netezza 1000(TwinFin) の比較

画像
提供:日本アイ・ビー・エム(31ページ)

 DWHベンダーのアプライアンス製品が進化を続けている。標準的なRDBMSとハードウェアレベルでの高速化技術を組み合わせることで、DWHのボトルネックを解消しているDWHアプライアンス。その先鞭をつけたといえるのが、創業当初から一貫してDWHに特化したアプライアンス製品作りを追求してきたNetezzaだ。2010年11月のIBMによる買収後も、それまでと全く変わらぬコンセプトを踏襲しつつ、さらなる機能強化が進められている(関連記事:高速は当たり前、DWHアプライアンス「Netezza」は「簡単」にこだわり続ける)。

 一方、DWH業界で一躍注目を集めたのが、日本オラクルが2009年に国内販売を開始した「Oracle Exadata」だ。他のDWHアプライアンスの多くがシェアードナッシングアーキテクチャを採用する中、Oracle Exadataは複数のサーバノードでディスクを共有する「シェアードディスクアーキテクチャ」を採用するなど、独自技術で高速化を実現している。

 その他にも複数ベンダーがDWHアプライアンスを提供しているが(関連記事:ビッグデータ対応のために進化するDWHアプライアンス)、ユーザー企業にとって悩ましいのは各製品を横並びで比較することが難しいことだ。このホワイトペーパーはOracle ExadataとIBM Netezza 1000(TwinFin)を、Netezza側の視点で比較した資料だ(信頼性を確保するためにブロアリサーチおよびモナッシュリサーチのアドバイスを受けて製作している)。オンライントランザクション処理とDWHのクエリおよび分析処理の相違について説明するとともに、クエリのパフォーマンス、操作の簡易性および価値の視点でOracle ExadataとTwinFinについて比較を論じている。

 今回紹介したホワイトペーパー以外にも、ホワイトペーパーダウンロードセンターでは、技術文書や製品資料、事例紹介などDWHに関するホワイトペーパーを掲載している。ぜひダウンロードしてご活用いただきたい。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る