他社アプライアンス製品とは一線を画すEMCのデータ分析ソリューション「Greenplum」。ソフトウェア型DWH用データベース「Greenplum Database」とHadoopディストリビューション「Greenplum MR」を紹介する。
2000年代後半からビジネスインテリジェンス(BI)やデータウェアハウス(DWH)のソリューションが脚光を浴びる中、大手ベンダーによる独立系DWHベンダーの買収が相次いだ。IBMによるネティーザの買収、HPによるバーティカの買収などがその代表だが、中でもEMCによるGreenplumの買収は、ストレージベンダー最大手のEMCが本格的にDWH市場に参入することで、市場競争の一層の激化を予感させる動きとして注目を集めた。
2003年に米国で創業したGreenplumは、当時DWHの世界でトレンドになりつつあったアプライアンスには目をくれず、あくまでもソフトウェアによるDWHソリューションを志向し、独自の技術を詰め込んだDWHソフトウェア製品「Greenplum Database」の提供を続けていた。2010年にEMCに買収された後も、同製品は「EMC Greenplum Database」として変わらず提供されており、2011年1月にはこれをあらかじめハードウェアにセットアップしたアプライアンス製品「EMC Greenplum Data Computing Appliance」(以下、Greenplum DCA)の提供も開始している(関連記事:ビッグデータ対応のために進化するDWHアプライアンス)。
このように、現在ではソフトウェアとアプライアンスの2つの形態で提供されているGreenplum Databaseだが、あくまでもソフトウェアの技術だけでその機能を実現するという設計理念は今も変わっていない。逆に言えば、ハードウェアの種類は問わないということでもある。EMCジャパン データコンピューティング事業本部 テクノロジー&プロフェッショナルサービス部 テクニカル・コンサルタント 中村 完氏は、Greenplum Databaseの特徴について次のように説明する。
「サーバやCPU、メモリ、ディスクから通信機器に至るまで、コンポーネントは全てコモディティハードウェアで構成される。従って、専用ハードウェアを購入しなくても手持ちのハードウェアリソースを組み合わせて簡単にDWHシステムを構築できる」
ただし、専用ハードウェアを使わないとはいっても、システム全体のアーキテクチャはアプライアンス製品とほぼ変わらない。つまり、データ処理を複数ノードに分散して並列実行させるMPP(大規模並列処理)方式が取られている。これを、独自技術によりソフトウェアとコモディティハードウェアだけで実現しているのが、Greenplum Databaseの大変ユニークな点だ。アプライアンス製品であるGreenplum DCAにおいても同様で、システムを構成するハードウェアには全てコモディティ製品が採用されている。
ちなみにGreenplum DCAは、2012年2月時点では2機種が日本国内で提供されている。1つが標準グレードである「Greenplum DCA」。フルラック構成で144Tバイトのデータ容量と、1時間当たり10Tバイトのデータロード性能を持つ。もう1つが、大容量のディスク装置を採用した「Greenplum High Capacity DCA」で、最大496Tバイトのデータを格納可能となっている。さらに2012年中には、Greenplum DCAにSAS Instituteが提供する分析ソフトウェアの機能を組み込んだ「SAS High-Performance Analytics on Greenplum DCA」の提供が予定されているという。
Copyright © ITmedia, Inc. All Rights Reserved.
ゼンリンマーケティングソリューションズでは、地図情報によるデータ分析作業を効率化するため、プログラミング不要のデータ分析ツールを導入した。同社はどのような製品を採用し、課題解決につなげていったのだろう。
データ活用におけるさまざまな課題を解決するBIツール。近年は、その枠を超え、さらなるデータ活用を促進するデータ分析プラットフォームへの注目度が高まっている。3社の事例を基に、同製品の魅力と実力に迫る。
データの可視化/分析をサポートするツールとして定評のあるBIツールだが、導入したものの活用できていない企業は意外と多い。その理由を確認するとともに、解決策として注目したい「チャットBI」の機能やメリットを詳しく解説する。
SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?
多くの企業で「情報の分断」や「手作業によるデータ処理への依存」が課題となり、迅速な経営判断を阻害している。本資料では、クラウドとBIツールを活用した分析基盤を構築し、これらの課題を解決した2社の事例を紹介する。
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...