大量データを使用するアプリケーションの増加やクラウドの普及により、多くの企業で注目されているHadoop。その技術を詳しく解説するとともに、導入・運用を支援するベンダーの動向を紹介する。
オープンソースの「Hadoop」は、多数のサーバを使った“ビッグデータ”アプリケーションの分散データ処理を可能にする。この技術は、クラウドでの分散並列処理によって冗長性と強力なアプリケーションパフォーマンスを実現し、障害を防止するという考え方に基づいている。
HadoopはApache Software Foundationのオープンソースプロジェクトの1つであり、米Google、米Yahoo!、米AOL、米Facebookといった企業のニーズから生まれた。こうした企業は、分散されたサーバ上の膨大なデータセットへのアクセスを日々サポートする必要がある。
しかし、2つの要因から、Hadoopは多くの企業で必要かつ利用可能なものになっている。その1つは、非常に大規模なデータセットを使用するアプリケーションが増えていること。もう1つは、搭載プロセッサ数が合計数百あるいは数千個に上る分散サーバをほぼ無尽蔵のストレージとともに提供するクラウドが利用できるようになってきたことだ。
Hadoopはクラウド上で、こうした多数のサーバによる分散並列処理を実現し、ジョブを迅速に完了させる。Hadoopを使えば、小売りチェーンが店頭での数百万件の購入からトレンドを探るために行うデータマイニングや、情報機関が幅広いソースから公安情報を収集して行うテロリストの行動パターン分析など、さまざまなシナリオにおけるデータの探索や処理のパフォーマンスを大幅に向上させることができる。
狙うは「銀髪経済」 中国でアクティブシニア事業を展開する企業とマイクロアドが合弁会社を設立
マイクロアドは中国の上海東犁と合弁会社を設立。中国ビジネスの拡大を狙う日本企業のプ...
社会人1年目と2年目の意識調査2024 「出世したいと思わない」社会人1年生は44%、2年生は53%
ソニー生命保険が毎年実施している「社会人1年目と2年目の意識調査」の2024年版の結果です。
KARTEに欲しい機能をAIの支援の下で開発 プレイドが「KARTE Craft」の一般提供を開始
サーバレスでKARTEに欲しい機能を、AIの支援の下で開発できる。