Apache Hadoopを利用すれば、ビッグデータを高速に処理可能だ。だがその導入は決して容易ではない。そこで頼りになるのが、企業向けに機能やサポートが強化された商用ディストリビューションである。注目の6種を紹介する。
今回紹介する商用Hadoopディストリビューション6種の基本情報を見やすくまとめた一覧表をPDFファイルで提供しています。「商用Hadoopディストリビューション一覧表」からダウンロードしてください。
企業の取り扱うデータが増大し、多様化を続けている。その大量のデータ、いわゆるビッグデータをビジネスに活用するには、いかに高速に処理するかがカギを握っている。さらに、そこから有益な情報を得られるとは限らないため、できるだけ安価に済ませたいという思惑もある。
そうした背景からオープンソースの分散処理基盤「Apache Hadoop」に注目が集まった。Hadoop自体が基本的に無償で利用できる点と、安価なサーバを用いてビッグデータの高速な分散処理システムを構築できる点にメリットがあった。
だが、HadoopはOSS(オープンソースソフトウェア)であるために、ベンダーからのサポートはなく、コミュニティーなどを通じて自分自身で使い方を学ぶ必要があった。技術力の高いIT系企業であれば、自力でHadoop環境を構築・運用することも不可能ではないかもしれないが、多くの一般企業における導入のハードルは決して低くはない。
その課題を解決する有力な手段の1つが、商用のHadoopディストリビューションを導入することである。さまざまなベンダーが、企業向けの機能拡張を施すとともに、導入支援や技術サポートのサービスを提供している。
本稿では、Hadoopフレームワークの企業導入に役立つ、商用ディストリビューション6種を取り上げる。
ソーシャルメディア利用年齢規制でMetaより損をするのは?
ソーシャルメディアの利用は16歳以上に制限されるべきなのだろうか。そうだとしたら、実...
台湾の旅行者の77.4%、米国の旅行者の53.6%は1年以内に日本を再訪したい――JTB総合研究所調査
訪日インバウンド旅行者の中にはリピーターとなる人も少なくありません。そこで、次回の...
電通グループがRobloxと組んで次世代コンテンツクリエイターを支援 その背景は?
電通グループがゲームプラットフォーム「Roblox」を活用した次世代クリエイター支援プロ...