2012年05月07日 09時00分 公開
特集/連載

Wikipediaのビッグデータ分析を支えるITインフラビッグデータ分析基盤の構築事例(後編)

多くの企業がビッグデータ分析のためにデータセンターインフラの見直しを進めている。その中には、新しいデータ分析プロジェクトを進めるに当たり、既存のインフラを見直したWikimedia Foundationも含まれている。

[Beth Pariseau,TechTarget]

 前回の「ビッグデータ分析に必要な性能を満たすインフラの条件とは?」に続き、ビッグデータの分析基盤を構築した企業を紹介する。ビッグデータが大規模な検索エンジンや巨大なソーシャルネットワークというルーツから離れて新たな展開を見せるのに伴い、多くの企業でビッグデータを支えるデータセンターインフラを見直す必要に迫られている。

ビッグデータの浸透効果:eHarmony

 オンラインデートサイトの米eHarmonyでは、会員同士の出会いを支援するのに「Apache Hadoop」(以下、Hadoop)を利用している。ベースとなるデータ量は64Tバイトと比較的少ないものの、これに対応するために斬新なサーバインフラを追加したという。

 eHarmonyは2011年6月まで、米Amazonのクラウドサービスである「Elastic MapReduc」上でHadoopを運用していたが、毎月の利用料金が高額になったために、再び社内のデータセンターで運用することにした。

 しかしeHarmonyはHadoopを社内に戻すに当たり、CPUに大きな負荷を与えるワークロードを処理するための電力・冷却要件(256台のデュアルコアサーバのファームを運用)に対処する必要があったという。x86ベースの「Intel Xeon」サーバでは、電力と冷却に掛かるコストが膨大な金額になる可能性があった。

ITmedia マーケティング新着記事

news161.jpg

コロナ禍で縮小したマーケティング施策 1位は「オフラインのセミナー/展示会」――ベーシック調査
B2Bマーケターを対象にした調査で8割以上が「コロナ禍で実施/検討しているマーケティン...

news110.jpg

メルカリ調査 フリマアプリで売れる価格は新品の購買意思決定にどれほど影響する?
フリマプリ出品経験者は、フリマアプリでの再販価格が10%上昇すると、新品に支払える上...

news024.jpg

Google検索における2020年上半期の動向 新型コロナの影響でSEOはどう変わる?
新型コロナウイルスの影響が大きかった2020年の上半期ですが、Google検索の動向において...