検索
特集/連載

「Greenplum」でEMCが目指すビッグデータ時代の「UAPコンセプト」DWH製品紹介:EMCジャパン

他社アプライアンス製品とは一線を画すEMCのデータ分析ソリューション「Greenplum」。ソフトウェア型DWH用データベース「Greenplum Database」とHadoopディストリビューション「Greenplum MR」を紹介する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

ソフトウェア技術だけでDWHを実現する「EMC Greenplum Database」

 2000年代後半からビジネスインテリジェンス(BI)データウェアハウス(DWH)のソリューションが脚光を浴びる中、大手ベンダーによる独立系DWHベンダーの買収が相次いだ。IBMによるネティーザの買収、HPによるバーティカの買収などがその代表だが、中でもEMCによるGreenplumの買収は、ストレージベンダー最大手のEMCが本格的にDWH市場に参入することで、市場競争の一層の激化を予感させる動きとして注目を集めた。

 2003年に米国で創業したGreenplumは、当時DWHの世界でトレンドになりつつあったアプライアンスには目をくれず、あくまでもソフトウェアによるDWHソリューションを志向し、独自の技術を詰め込んだDWHソフトウェア製品「Greenplum Database」の提供を続けていた。2010年にEMCに買収された後も、同製品は「EMC Greenplum Database」として変わらず提供されており、2011年1月にはこれをあらかじめハードウェアにセットアップしたアプライアンス製品「EMC Greenplum Data Computing Appliance」(以下、Greenplum DCA)の提供も開始している(関連記事:ビッグデータ対応のために進化するDWHアプライアンス)。

画像
Greenplum Database

 このように、現在ではソフトウェアとアプライアンスの2つの形態で提供されているGreenplum Databaseだが、あくまでもソフトウェアの技術だけでその機能を実現するという設計理念は今も変わっていない。逆に言えば、ハードウェアの種類は問わないということでもある。EMCジャパン データコンピューティング事業本部 テクノロジー&プロフェッショナルサービス部 テクニカル・コンサルタント 中村 完氏は、Greenplum Databaseの特徴について次のように説明する。

画像
EMCジャパンの中村氏

 「サーバやCPU、メモリ、ディスクから通信機器に至るまで、コンポーネントは全てコモディティハードウェアで構成される。従って、専用ハードウェアを購入しなくても手持ちのハードウェアリソースを組み合わせて簡単にDWHシステムを構築できる」

 ただし、専用ハードウェアを使わないとはいっても、システム全体のアーキテクチャはアプライアンス製品とほぼ変わらない。つまり、データ処理を複数ノードに分散して並列実行させるMPP(大規模並列処理)方式が取られている。これを、独自技術によりソフトウェアとコモディティハードウェアだけで実現しているのが、Greenplum Databaseの大変ユニークな点だ。アプライアンス製品であるGreenplum DCAにおいても同様で、システムを構成するハードウェアには全てコモディティ製品が採用されている。

 ちなみにGreenplum DCAは、2012年2月時点では2機種が日本国内で提供されている。1つが標準グレードである「Greenplum DCA」。フルラック構成で144Tバイトのデータ容量と、1時間当たり10Tバイトのデータロード性能を持つ。もう1つが、大容量のディスク装置を採用した「Greenplum High Capacity DCA」で、最大496Tバイトのデータを格納可能となっている。さらに2012年中には、Greenplum DCAにSAS Instituteが提供する分析ソフトウェアの機能を組み込んだ「SAS High-Performance Analytics on Greenplum DCA」の提供が予定されているという。

画像
豊富な選択肢を提供するGreenplum DCA

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る