【事例】じゃらん、ゼクシィにも活用、リクルートはなぜ「Hadoop」を使う?:エコシステムの充実が採用を後押し
Hadoopの活用を「ほぼ全事業」に広げる勢いのリクルートグループ。同グループは、Hadoopの何に魅力を感じたのか。システム構築を担うリクルートテクノロジーズの担当者に聞いた。
リクルートグループは、自社のサービスに分散データ処理技術の「Apache Hadoop」を徹底活用している。リクルートグループは、Hadoopをどう活用しているのか。Hadoop採用の理由とは。2012年10月に開催されたデータ活用関連イベント「第1回 ビッグデータ&データマネジメント展」で講演した、リクルートテクノロジーズ ITソリューショングループ ビッグデータグループの石川信行氏の話を基に紹介する。リクルートテクノロジーズは、2012年10月に持ち株会社制に移行したリクルートグループでシステム開発を担う。
関連記事
リクルートグループは現在、住宅情報や宿泊予約など全13事業と、「グループの全事業で利用しているといっても過言ではない」ほどにHadoopの利用を進めていると、石川氏は明かす。主要な活用事例を4つ見ていこう。
活用事例1:「カーセンサー」関連事業の基盤をHadoopで構築
リクルートグループでHadoopを商用サービスの基盤として初めて活用したのが、リクルートマーケティングパートナーズの中古車情報事業「カーセンサー」である。カーセンサーの関連サービスとして開始した、ショッピングセンターのカウンターで中古車をあっせんする「クルマなびカウンター」のサービス基盤として、Hadoopを活用している。
Hadoopを活用するのは、クルマの価格設定だ。中古車市場は「正価」がないため、価格算出は人の感覚に頼るしかなかった。「中古車は、走行距離が1キロ違ったり、販売地域が異なるだけでも価格が大きく変化する。こうした状況で、統計的に価格を算出するのは難しい」。
適切な価格算出のためには、「過去の算出価格を徹底的に集計、分析することが不可欠」だ。だが価格データが月間1億件のペースで増えていくカーセンサーの場合、全データを集計、分析しようとすると「数週間かかることもある」。分析対象を絞り込めば分析時間は短縮されるが、分析精度は当然ながら低くなる。
そこで白羽の矢を立てたのが、Hadoopである。既に他のシステムで、バッチ処理の高速化を実証済みだったことが、Hadoop採用を後押しした。Hadoopシステムの活用により、数週間かかっていた毎月950車種の価格分析が1時間30分に短縮。改良を進めた現在のHadoopシステムでは、さらに高速化して30分での分析が可能になったという。「従業員は、分析以外のコア業務に時間を割くことができるようになった」
活用事例2:「じゃらん」の予約・宿泊履歴から宿泊地の特性を分析
年間の延べ宿泊者・予約者数が6020万人泊超に及ぶ、国内最大級の宿泊予約サイト「じゃらんnet」。運営元であるリクルートライフスタイルは、じゃらんnetの膨大な宿泊・予約データから得た情報を地方自治体などに伝える事業を展開している。そこで宿泊・予約データの解析に利用しているのがHadoopである。
じゃらんnet開始時の2000年11月から2012年までの12年に蓄積された宿泊・予約データから、地域ごとの宿泊者の特性を分析。「例えば、南関東居住者が北海道に旅行した場合は本州に近い地域での転泊が多く、北海道居住者は道東や道北の転泊が多い、といった傾向を分析し、セミナーなどで自治体に開示している」
活用事例3:「ゼクシィ」の広告効果を分析
結婚情報サイト「ゼクシィnet」のユーザー行動解析や広告効果測定などに利用する「効果基盤システム」でも、Hadoopを利用する。
データが複数のデータベースに分散して管理が一元化できず、データ品質の低下していたり、大規模データを高速に処理できないといった課題を解決するために、システム刷新に伴いHadoopを導入した。Hadoopベースのシステムに移行したことで、データ処理時間が従来の14時間から15分へ短縮したといった効果があったという。
活用事例4:「SUUMO」の情報を基に提案資料やレコメンドを生成
住宅情報サイト「SUUMO」で用意する不動産会社向けの物件リポート作成ツール「オーナーレポート」にも、Hadoopを活用する。オーナーレポートは、不動産会社が物件のオーナーにリフォームなどを提案する際の参考資料を作成するツールだ。SUUMOに登録された物件情報や物件の検索率といったデータを基に、どういった設備を持つ物件が売れているか、といったことを分析できる。
この他、SUUMOのサイト閲覧者に対するレコメンドエリアの算出にも利用。検索条件間の関連性を分析し、「このエリアを探している人は他にこんなエリアも見ています」といったレコメンド情報を検索結果画面に表示したりする。
なぜリクルートはHadoopを選んだのか?
リクルートグループが、大規模データ処理システムとしてHadoopを選択したのはなぜか。
Copyright © ITmedia, Inc. All Rights Reserved.