1カ月で1億時間分のデータが生成されるeBayのアナリティクス環境構築記「何から始めればいいのかすら分からない」

コンピュータが生成するデータ量は1日に50Tバイト。全社では100Pバイトを処理しなければならない。米eBayはこのような、膨大な量のデータ処理という課題に直面している。

2014年06月20日 08時00分 公開
[Cliff Saran,Computer Weekly]
Computer Weekly

 米eBayは、データの洪水を業務に役立てている。同社の顧客がかつては地元の商店のオーナーから得ていた小売業のノウハウを、eBayはこのデータを使ってエミュレートしている。地元の商店との唯一の違いは、小さい店で買い物をするときの行動スタイルを世界規模のオークションサイト全体で実現しようとしていることだ。

Computer Weekly日本語版 6月18日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 6月18日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。


 eBayでグローバルビジネスアナリティクス部門の責任者を務めるデイビッド・スティーブンソン氏は、2014年4月に英国ロンドンで開かれたカンファレンス「Gartner CRM Summit」で講演を行った。その際、同氏が携わっているオークションサイトの目標は、顧客に楽しい買い物をしてもらうことだと語った。

 市場を提供する立場として、eBayの事業の成功は品物の買い手および売り手の視点で見たときに円滑な取引ができているかどうかに懸っていると同氏は話す。

 同社はアナリティクスを実施して、顧客への理解を深めることに努めている。スティーブンソン氏が目指しているのは、小さい店で見られるような一種のパーソナル化を可能な限り進めて、eBayのネットオークションの世界でそれを展開することだ。「小さな店では、それぞれの客の好みを把握したり既存の顧客からの要望に応えたりした上で、客の品選びを手伝ったりお勧め品を提案したりする、きめ細かい接客が肝要だ」と同氏は語る。

Webの評価指標

 Webサイトに対する評価指標のデータは、スティーブンソン氏が自らの裁量で意思決定を下す際の根拠となるものだ。同社が運営するオークションサイトからは、膨大な数のWebアナリティクスのデータが生み出される。スティーブンソン氏はこれを「顧客の旅の記録」と呼ぶ。顧客がeBay上でどんな行動を取り、そのサイトをどのように利用しているか、データを見れば分かるからだ。

 「Webサイトでも(地元の商店と)同じ体験を提供できる。それに顧客に比較データを提供することもできる」とスティーブンソン氏は話す。「われわれには顧客の行動の意図を学ぶ手段がある」(スティーブンソン氏)。このような知見の全てが、eBayで展開されるテクノロジーの刷新につながっている。

 eBayにとっての課題は、Webアナリティクスだ。Webアナリティクスは、スーパーマーケットに来た買い物客全員の頭にビデオカメラを装着するようなものだとスティーブンソン氏は話す。顧客全員の行動をもれなく記録すると、顧客のやりとりの記録は1カ月で1億時間になる。さらに、同時に発生する顧客データは多すぎて、管理しきれないほどの量になる。「1億時間の記録に対する(Webアナリティクス)処理なんて、何から始めればいいのかすら分からない」と同氏は話す。

 「われわれは顧客を理解し、顧客から学び、データサイエンスのテクニックを応用して、さらに多くのデータや新しいタイプのデータを取得する必要がある」

 eBayでは、3万に及ぶカテゴリーに対して1億人の顧客が出品している。同サイトで処理される1秒当たりの取引額は数千ドルに上り、スティーブンソン氏はこの取引データを「ほんの氷山の一角」と呼ぶ。

 eBayは顧客の旅に関する全てのデータを処理することに苦慮していると、同氏は認めている。ビッグデータを処理する際の課題とは、例えば「昨日実行された検索の中で上位のキーワードは何か」のような、業務に関する簡単な問いを投げかけるだけでも、扱うデータが50億ページビューにわたることだ。「基本的な質問をする場面に限定しても、大きな問題に直面している」とスティーブンソン氏は実情を明かす。

 しかしeBayが実際に必要としているのは、単純な質問以上の複雑な問いに対する答えだ。「eBayで実現したいのは、感情の分析、ネットワーク分析、そして画像分析だ。しかしこれらは全て、従来のトランザクションデータベースでは処理できない」とスティーブンソン氏は語る。

 そこで同社は、データアナリティクス処理を3つのプラットフォームに分割した。

Copyright © ITmedia, Inc. All Rights Reserved.

髫エ�ス�ス�ー鬨セ�ケ�つ€驛「譎擾スク蜴・�。驛「�ァ�ス�、驛「譎冗樟�ス�ス驛「譎「�ス�シ驛「譏懶スサ�」�ス�ス

製品資料 株式会社ライトウェル

AIとの会話でデータを可視化/分析、現場主導の意思決定を加速させるチャットBI

データの可視化/分析をサポートするツールとして定評のあるBIツールだが、導入したものの活用できていない企業は意外と多い。その理由を確認するとともに、解決策として注目したい「チャットBI」の機能やメリットを詳しく解説する。

製品資料 株式会社ライトウェル

DXを阻む「データの3大課題」を解決、“可観測性”を高めるために必要なこと

データ活用が当たり前となる一方、データの品質を確保できておらず、「元データに問題があっても気付けない」「ユーザーが問題を解決できない」といった悩みを抱える企業は多い。これらを解決する鍵となる「可観測性」を高める秘訣とは?

技術文書・技術解説 株式会社ライトウェル

ビッグデータの価値は量ではなく「正しい意思決定」 引き出す方法は?

ビッグデータをビジネスの意思決定に生かすには、必要なデータを効果的に収集する仕組みが不可欠だ。ビッグデータ活用を失敗させないために、まずどのような点から着手すればいいのか。

製品レビュー 株式会社ライトウェル

専門知識は不要? データ分析で意思決定を迅速化する方法とは

あらゆる業種・業界でデータ活用の重要性が高まっている。しかし、スキルやリソースの不足により、全社的な分析に至らない企業も多い。そこで注目したいのが、専門知識がなくても迅速にデータを整理・分析できる、AIを活用したBIツールだ。

製品資料 ジオテクノロジーズ株式会社

基礎から解説:「人流データ」の特徴から活用におけるポイントまで

人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。

アイティメディアからのお知らせ

郢晏生ホヲ郢敖€郢晢スシ郢ァ�ウ郢晢スウ郢晢ソスホヲ郢晢ソスPR

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

TechTarget郢ァ�ク郢晢ス」郢昜サ」ホヲ 隴�スー騾ケツ€髫ェ蛟�スコ�ス

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...