HDFSで一般的なデータ保護とパフォーマンスの問題を回避する代替策となる3つの商用Hadoopディストリビューションを紹介する。
「Apache Hadoop」とそれに関連する「Hadoop Distributed File System」(HDFS)は、ビッグデータ環境におけるストレージと分析に広く使われている。だが、HDFSには、データ保護機能の弱さ、必要なリソースや学習すべき物事の多さなど、幾つかの制限がある。
企業がHDFSの落とし穴を回避するのに役立つ主要な商用Hadoopディストリビューションには、Hortonworksの「Hortonworks」、Clouderaの「Cloudera」、MapRの「MapR」の3つがある。Hortonworksはこの3つのディストリビューションの中で、HDFSに最も密接に実装できる。Clouderaは、Hadoopのプロジェクトカタログに追加できるプロジェクトという形で機能を強化する。MapRは早い時期から、HDFSが企業のデータセンターの実装で問題を起こす荷物を抱えていることを特定した。その結果、MapRはHDFSから手を引き、独自の対称ファイルシステムを採用している。
ネスプレッソ幹部に聞く「マーケティングとサステナビリティーは両立可能か?」
Marketing DiveはNespresso USAでマーケティング担当バイスプレジデント兼サステナビリテ...
生成AI活用の成否を決める「プロンプトエンジニアリング」 知っておくべきポイントとは?
マーケティング領域で進む「AIシフト」に取り残されないため、どうすればいいのか。今回...
マーケティングを「リアルタイム」に進化させるために何から始めればいい?
2024年9月に米ラスベガスで開催されたBrazeの年次イベント「Forge 2024」の会場で、同社...