カナダのYellow Pagesは、印刷ベースの電話帳を編集していたころに収集したデータを再利用して、カナダで最も正確な業務用検索エンジンを構築しようとしている。
カナダのYellow Pages(以下YP)は、デジタル化プログラムに250万カナダドルを超える予算を投じ、Google、Facebook、Yellなどのグローバル規模の情報プロバイダーに対抗しようとしている。
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 2014年2月19日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
YPは印刷物として発行していたビジネスディレクトリ(職種別電話帳)のために収集したデータを再利用し、洗練されたデータ管理技術によって、最も正確で汎用的と自認するカナダのビジネス検索サービス「Yellow Pages」をWebで提供している。
「このプロジェクトは、Yellow Pagesの掲載情報の更新を、要求を受け取ってから数日ではなくて数秒で完了するようにするのが目標だ。プロジェクトが完了すれば、ネットで情報を検索する人はカナダの企業について常に最新の情報が得られる」と話すのは、YP Canadaの主任アーキテクト、アンドレ・ボワヴェール氏だ。
「当社のシステムは、印刷システムのついでのような形で構築されていた。従って、必然的に印刷業務がやりやすいようなシステムにしてあった。例えば、逐次処理とバッチ処理が非常に多かった。コンテンツは印刷物の作成のために最適化してあって、オンライン向きではなかった」(同氏)
YPが、オンライン検索サービスと真っ向から張り合える体制に変わるべく自社ITシステムの見直しを始めたのは1年半前のことだ。同社が、自社データベースの情報をソーシャルメディアなどの他社Webサービスと正しく連携させて、カナダの産業界について最も包括的で正確なデータを人々に提供していることを確認するためだった。
YPは、探している情報をユーザーが正確に特定しているか、同一の企業の情報を重複して掲示し、ユーザーを混乱させていないかどうかを確認する方法を見つけたいと考えていた。
2012年5月、同社はさまざまなソフトウェアメーカーが発売している多数のミドルウェアを評価し、その結果、米TIBCOの製品を採用した。YPは、2013年3月にTIBCOのマスターデータ管理(MDM)ソフトウェアの運用を始めた。その後、同年9月にシステムを本格稼働させた。採用の決め手となったのはTIBCO製品の処理速度だったと、ボワヴェール氏は語る。
YPでは、1日に数万件の情報更新要求を受信する。1件ごとに12種類のマッチング規則を使用して、1億6000万件のレコードが収められたデータベースと照合しなければならない。
TIBCOのテクノロジーはIBMのLinuxサーバをベースとしている。これによってYellow Pagesは、ユーザーが探している業界を特定し、その情報に正確に一致したデータをサードパーティーのサービスと自社のデータベースから引用することができるようになった。例えば、ユーザーが地元のピザレストランを探している場合、Yellow PagesはOpenTable(オンラインレストラン予約サービス)やTripAdvisor(旅行サイト)といったサードパーティーが提供しているレストランのレビュー情報、またはFoursquareなどのソーシャルメディアサービスに掲載されている情報を消費者に提供することができる。
「システムの洗練度を高めたので、探している店や会社の場所を正確に突き止められる。例えば誰かがソーシャルメディアで、『ピールストリートとセントキャサリン通りの角にあるレストランだ』と書き込んでいれば、それもYellow Pagesから参照できる」とボワヴェール氏は語る。
「店や企業の名前、住所、電話番号があれば、それを基にデータベースの情報を探し出すのは簡単そうに思えるだろう。ただし、手掛かりにする企業名が略称だったり、情報の一部が欠けていたり、つづりが間違っていたりすることは案外多い」と同氏は付け加える。
ボワヴェール氏によると、通常、MDMシステムは展開するまで1年半はかかるものだが、YPは計算済みのリスクをあえて負うことで、プロジェクトを半年で完了させたという。
本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。
■Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 2月5日号:仮想化コストを増大させる勘違い
Computer Weekly日本語版 1月22日号:Amazon Web Services vs. Google
Computer Weekly日本語版 1月8日号:オープンソースハードウェアになるデータセンター
Copyright © ITmedia, Inc. All Rights Reserved.
広告や小売、観光振興、まちづくりなど、さまざまな領域で導入が進む「人流データ」。その活用でどのような施策が可能になり、どのような効果が期待できるのか。人流データ活用の6つのユースケースを紹介する。
人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。
多くの企業でデータ活用が模索されているが、データ処理の煩雑さや属人化が課題となっている企業は少なくない。そこで注目したいのが、データ分析ツールの活用で課題を一掃した「ゼンリンマーケティングソリューションズ」の取り組みだ。
複雑化を続けるITシステムの運用管理は、企業にとって大きな負担だ。そこで負担を軽減するものとして注目したいのが、クラウド上でさまざまな機能を利用できるマネージドサービスだ。本資料では、その詳細を解説する。
SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。