HDFSで一般的なデータ保護とパフォーマンスの問題を回避する代替策となる3つの商用Hadoopディストリビューションを紹介する。
「Apache Hadoop」とそれに関連する「Hadoop Distributed File System」(HDFS)は、ビッグデータ環境におけるストレージと分析に広く使われている。だが、HDFSには、データ保護機能の弱さ、必要なリソースや学習すべき物事の多さなど、幾つかの制限がある。
企業がHDFSの落とし穴を回避するのに役立つ主要な商用Hadoopディストリビューションには、Hortonworksの「Hortonworks」、Clouderaの「Cloudera」、MapRの「MapR」の3つがある。Hortonworksはこの3つのディストリビューションの中で、HDFSに最も密接に実装できる。Clouderaは、Hadoopのプロジェクトカタログに追加できるプロジェクトという形で機能を強化する。MapRは早い時期から、HDFSが企業のデータセンターの実装で問題を起こす荷物を抱えていることを特定した。その結果、MapRはHDFSから手を引き、独自の対称ファイルシステムを採用している。
Copyright © ITmedia, Inc. All Rights Reserved.
「TikTok禁止」は結局、誰得? どうするトランプ氏――2025年のSNS大予測(TikTok編)
米国での存続を巡る議論が続く一方で、アプリ内ショッピングやAI機能の拡大など、TikTok...
ネットの口コミを参考に8割超が商品を購入 最も参考にした口コミの掲載先は?
ホットリンクは、口コミ投稿の経験や購買への影響を調査した結果を発表した。
「生成AIの普及でSEOはオワコン」説は本当か?
生成AIの普及によりSEOが「オワコン」化するという言説を頻繁に耳にするようになりました...