特集/連載
HDFSの落とし穴を回避する商用「Hadoop」ディストリビューション3選:Hortonworks、Cloudera、MapR
HDFSで一般的なデータ保護とパフォーマンスの問題を回避する代替策となる3つの商用Hadoopディストリビューションを紹介する。
「Apache Hadoop」とそれに関連する「Hadoop Distributed File System」(HDFS)は、ビッグデータ環境におけるストレージと分析に広く使われている。だが、HDFSには、データ保護機能の弱さ、必要なリソースや学習すべき物事の多さなど、幾つかの制限がある。
企業がHDFSの落とし穴を回避するのに役立つ主要な商用Hadoopディストリビューションには、Hortonworksの「Hortonworks」、Clouderaの「Cloudera」、MapRの「MapR」の3つがある。Hortonworksはこの3つのディストリビューションの中で、HDFSに最も密接に実装できる。Clouderaは、Hadoopのプロジェクトカタログに追加できるプロジェクトという形で機能を強化する。MapRは早い時期から、HDFSが企業のデータセンターの実装で問題を起こす荷物を抱えていることを特定した。その結果、MapRはHDFSから手を引き、独自の対称ファイルシステムを採用している。
関連記事
Hadoopディストリビューション比較
Hadoopのメリット/デメリット
Hadoop事例
- Hadoopで年間6000症例を分析、帝京大学のBI事例
- 【事例】じゃらん、ゼクシィにも活用、リクルートはなぜ「Hadoop」を使う?
- 医療分野のビッグデータ事例 「Hadoop」を採用した徳島大学病院
Hortonworks:100%オープンソースのプラットフォーム
Copyright © ITmedia, Inc. All Rights Reserved.