Wikipediaのビッグデータ分析を支えるITインフラ：ビッグデータ分析基盤の構築事例（後編）

多くの企業がビッグデータ分析のためにデータセンターインフラの見直しを進めている。その中には、新しいデータ分析プロジェクトを進めるに当たり、既存のインフラを見直したWikimedia Foundationも含まれている。

[Beth Pariseau，TechTarget] PC用表示関連情報

LINE

Hatena

　前回の「ビッグデータ分析に必要な性能を満たすインフラの条件とは？」に続き、ビッグデータの分析基盤を構築した企業を紹介する。ビッグデータが大規模な検索エンジンや巨大なソーシャルネットワークというルーツから離れて新たな展開を見せるのに伴い、多くの企業でビッグデータを支えるデータセンターインフラを見直す必要に迫られている。

ビッグデータの浸透効果：eHarmony

　オンラインデートサイトの米eHarmonyでは、会員同士の出会いを支援するのに「Apache Hadoop」（以下、Hadoop）を利用している。ベースとなるデータ量は64Tバイトと比較的少ないものの、これに対応するために斬新なサーバインフラを追加したという。

　eHarmonyは2011年6月まで、米Amazonのクラウドサービスである「Elastic MapReduc」上でHadoopを運用していたが、毎月の利用料金が高額になったために、再び社内のデータセンターで運用することにした。

　しかしeHarmonyはHadoopを社内に戻すに当たり、CPUに大きな負荷を与えるワークロードを処理するための電力・冷却要件（256台のデュアルコアサーバのファームを運用）に対処する必要があったという。x86ベースの「Intel Xeon」サーバでは、電力と冷却に掛かるコストが膨大な金額になる可能性があった。

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}

続きを閲覧するには、ブラウザの JavaScript の設定を有効にする必要があります。

Wikipediaのビッグデータ分析を支えるITインフラ：ビッグデータ分析基盤の構築事例（後編）

ビッグデータの浸透効果：eHarmony

関連記事