Hadoopの活用を「ほぼ全事業」に広げる勢いのリクルートグループ。同グループは、Hadoopの何に魅力を感じたのか。システム構築を担うリクルートテクノロジーズの担当者に聞いた。
リクルートグループは、自社のサービスに分散データ処理技術の「Apache Hadoop」を徹底活用している。リクルートグループは、Hadoopをどう活用しているのか。Hadoop採用の理由とは。2012年10月に開催されたデータ活用関連イベント「第1回 ビッグデータ&データマネジメント展」で講演した、リクルートテクノロジーズ ITソリューショングループ ビッグデータグループの石川信行氏の話を基に紹介する。リクルートテクノロジーズは、2012年10月に持ち株会社制に移行したリクルートグループでシステム開発を担う。
リクルートグループは現在、住宅情報や宿泊予約など全13事業と、「グループの全事業で利用しているといっても過言ではない」ほどにHadoopの利用を進めていると、石川氏は明かす。主要な活用事例を4つ見ていこう。
リクルートグループでHadoopを商用サービスの基盤として初めて活用したのが、リクルートマーケティングパートナーズの中古車情報事業「カーセンサー」である。カーセンサーの関連サービスとして開始した、ショッピングセンターのカウンターで中古車をあっせんする「クルマなびカウンター」のサービス基盤として、Hadoopを活用している。
Hadoopを活用するのは、クルマの価格設定だ。中古車市場は「正価」がないため、価格算出は人の感覚に頼るしかなかった。「中古車は、走行距離が1キロ違ったり、販売地域が異なるだけでも価格が大きく変化する。こうした状況で、統計的に価格を算出するのは難しい」。
適切な価格算出のためには、「過去の算出価格を徹底的に集計、分析することが不可欠」だ。だが価格データが月間1億件のペースで増えていくカーセンサーの場合、全データを集計、分析しようとすると「数週間かかることもある」。分析対象を絞り込めば分析時間は短縮されるが、分析精度は当然ながら低くなる。
そこで白羽の矢を立てたのが、Hadoopである。既に他のシステムで、バッチ処理の高速化を実証済みだったことが、Hadoop採用を後押しした。Hadoopシステムの活用により、数週間かかっていた毎月950車種の価格分析が1時間30分に短縮。改良を進めた現在のHadoopシステムでは、さらに高速化して30分での分析が可能になったという。「従業員は、分析以外のコア業務に時間を割くことができるようになった」
年間の延べ宿泊者・予約者数が6020万人泊超に及ぶ、国内最大級の宿泊予約サイト「じゃらんnet」。運営元であるリクルートライフスタイルは、じゃらんnetの膨大な宿泊・予約データから得た情報を地方自治体などに伝える事業を展開している。そこで宿泊・予約データの解析に利用しているのがHadoopである。
じゃらんnet開始時の2000年11月から2012年までの12年に蓄積された宿泊・予約データから、地域ごとの宿泊者の特性を分析。「例えば、南関東居住者が北海道に旅行した場合は本州に近い地域での転泊が多く、北海道居住者は道東や道北の転泊が多い、といった傾向を分析し、セミナーなどで自治体に開示している」
結婚情報サイト「ゼクシィnet」のユーザー行動解析や広告効果測定などに利用する「効果基盤システム」でも、Hadoopを利用する。
データが複数のデータベースに分散して管理が一元化できず、データ品質の低下していたり、大規模データを高速に処理できないといった課題を解決するために、システム刷新に伴いHadoopを導入した。Hadoopベースのシステムに移行したことで、データ処理時間が従来の14時間から15分へ短縮したといった効果があったという。
住宅情報サイト「SUUMO」で用意する不動産会社向けの物件リポート作成ツール「オーナーレポート」にも、Hadoopを活用する。オーナーレポートは、不動産会社が物件のオーナーにリフォームなどを提案する際の参考資料を作成するツールだ。SUUMOに登録された物件情報や物件の検索率といったデータを基に、どういった設備を持つ物件が売れているか、といったことを分析できる。
この他、SUUMOのサイト閲覧者に対するレコメンドエリアの算出にも利用。検索条件間の関連性を分析し、「このエリアを探している人は他にこんなエリアも見ています」といったレコメンド情報を検索結果画面に表示したりする。
リクルートグループが、大規模データ処理システムとしてHadoopを選択したのはなぜか。
Copyright © ITmedia, Inc. All Rights Reserved.
広告や小売、観光振興、まちづくりなど、さまざまな領域で導入が進む「人流データ」。その活用でどのような施策が可能になり、どのような効果が期待できるのか。人流データ活用の6つのユースケースを紹介する。
人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。
多くの企業でデータ活用が模索されているが、データ処理の煩雑さや属人化が課題となっている企業は少なくない。そこで注目したいのが、データ分析ツールの活用で課題を一掃した「ゼンリンマーケティングソリューションズ」の取り組みだ。
複雑化を続けるITシステムの運用管理は、企業にとって大きな負担だ。そこで負担を軽減するものとして注目したいのが、クラウド上でさまざまな機能を利用できるマネージドサービスだ。本資料では、その詳細を解説する。
SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。