他社アプライアンス製品とは一線を画すEMCのデータ分析ソリューション「Greenplum」。ソフトウェア型DWH用データベース「Greenplum Database」とHadoopディストリビューション「Greenplum MR」を紹介する。
2000年代後半からビジネスインテリジェンス(BI)やデータウェアハウス(DWH)のソリューションが脚光を浴びる中、大手ベンダーによる独立系DWHベンダーの買収が相次いだ。IBMによるネティーザの買収、HPによるバーティカの買収などがその代表だが、中でもEMCによるGreenplumの買収は、ストレージベンダー最大手のEMCが本格的にDWH市場に参入することで、市場競争の一層の激化を予感させる動きとして注目を集めた。
2003年に米国で創業したGreenplumは、当時DWHの世界でトレンドになりつつあったアプライアンスには目をくれず、あくまでもソフトウェアによるDWHソリューションを志向し、独自の技術を詰め込んだDWHソフトウェア製品「Greenplum Database」の提供を続けていた。2010年にEMCに買収された後も、同製品は「EMC Greenplum Database」として変わらず提供されており、2011年1月にはこれをあらかじめハードウェアにセットアップしたアプライアンス製品「EMC Greenplum Data Computing Appliance」(以下、Greenplum DCA)の提供も開始している(関連記事:ビッグデータ対応のために進化するDWHアプライアンス)。
このように、現在ではソフトウェアとアプライアンスの2つの形態で提供されているGreenplum Databaseだが、あくまでもソフトウェアの技術だけでその機能を実現するという設計理念は今も変わっていない。逆に言えば、ハードウェアの種類は問わないということでもある。EMCジャパン データコンピューティング事業本部 テクノロジー&プロフェッショナルサービス部 テクニカル・コンサルタント 中村 完氏は、Greenplum Databaseの特徴について次のように説明する。
「サーバやCPU、メモリ、ディスクから通信機器に至るまで、コンポーネントは全てコモディティハードウェアで構成される。従って、専用ハードウェアを購入しなくても手持ちのハードウェアリソースを組み合わせて簡単にDWHシステムを構築できる」
ただし、専用ハードウェアを使わないとはいっても、システム全体のアーキテクチャはアプライアンス製品とほぼ変わらない。つまり、データ処理を複数ノードに分散して並列実行させるMPP(大規模並列処理)方式が取られている。これを、独自技術によりソフトウェアとコモディティハードウェアだけで実現しているのが、Greenplum Databaseの大変ユニークな点だ。アプライアンス製品であるGreenplum DCAにおいても同様で、システムを構成するハードウェアには全てコモディティ製品が採用されている。
ちなみにGreenplum DCAは、2012年2月時点では2機種が日本国内で提供されている。1つが標準グレードである「Greenplum DCA」。フルラック構成で144Tバイトのデータ容量と、1時間当たり10Tバイトのデータロード性能を持つ。もう1つが、大容量のディスク装置を採用した「Greenplum High Capacity DCA」で、最大496Tバイトのデータを格納可能となっている。さらに2012年中には、Greenplum DCAにSAS Instituteが提供する分析ソフトウェアの機能を組み込んだ「SAS High-Performance Analytics on Greenplum DCA」の提供が予定されているという。
Copyright © ITmedia, Inc. All Rights Reserved.
TikTok売却義務化に合憲判決 これからのシナリオを左右しそうなトランプ氏と「あの人」の意向
米連邦控訴裁判所は、TikTokが米政府による強制売却法案の無効を求めるTikTokの申し立て...
「TikTok禁止」は結局、誰得? どうするトランプ氏――2025年のSNS大予測(TikTok編)
米国での存続を巡る議論が続く一方で、アプリ内ショッピングやAI機能の拡大など、TikTok...
ネットの口コミを参考に8割超が商品を購入 最も参考にした口コミの掲載先は?
ホットリンクは、口コミ投稿の経験や購買への影響を調査した結果を発表した。