2012年02月01日 09時00分 UPDATE
特集/連載

クラウドでビッグデータ分散処理も可能Hadoop技術解説 注目の背景にはクラウドの普及

大量データを使用するアプリケーションの増加やクラウドの普及により、多くの企業で注目されているHadoop。その技術を詳しく解説するとともに、導入・運用を支援するベンダーの動向を紹介する。

[David Jacobs,TechTarget]

 オープンソースの「Hadoop」は、多数のサーバを使った“ビッグデータ”アプリケーションの分散データ処理を可能にする。この技術は、クラウドでの分散並列処理によって冗長性と強力なアプリケーションパフォーマンスを実現し、障害を防止するという考え方に基づいている。

 HadoopはApache Software Foundationのオープンソースプロジェクトの1つであり、米Google、米Yahoo!、米AOL、米Facebookといった企業のニーズから生まれた。こうした企業は、分散されたサーバ上の膨大なデータセットへのアクセスを日々サポートする必要がある。

 しかし、2つの要因から、Hadoopは多くの企業で必要かつ利用可能なものになっている。その1つは、非常に大規模なデータセットを使用するアプリケーションが増えていること。もう1つは、搭載プロセッサ数が合計数百あるいは数千個に上る分散サーバをほぼ無尽蔵のストレージとともに提供するクラウドが利用できるようになってきたことだ。

 Hadoopはクラウド上で、こうした多数のサーバによる分散並列処理を実現し、ジョブを迅速に完了させる。Hadoopを使えば、小売りチェーンが店頭での数百万件の購入からトレンドを探るために行うデータマイニングや、情報機関が幅広いソースから公安情報を収集して行うテロリストの行動パターン分析など、さまざまなシナリオにおけるデータの探索や処理のパフォーマンスを大幅に向上させることができる。

この記事を読んだ人にお薦めの関連記事

注目テーマ

ITmedia マーケティング新着記事

news061.jpg

世界の広告費成長率、デジタルが2桁成長でテレビ超え――電通イージス・ネットワーク予測
電通イージス・ネットワークは、世界59カ国・地域から収集したデータに基づき、「世界の...

news050.jpg

ふくおかFG、ブロックチェーンを活用した地域ポイントプラットフォーム提供へ
ふくおかフィナンシャルグループ傘下のiBankマーケティングは、ブロックチェーン関連技術...

news043.jpg

Quora共同創業者兼CEOに聞く、知識共有コミュニティーのビジネスモデルに必要なたった1つのこと
日本国内でも本格的にサービスを展開し始めた「Quora」。知識共有コミュティーの未来とそ...