カナダのYellow Pagesは、印刷ベースの電話帳を編集していたころに収集したデータを再利用して、カナダで最も正確な業務用検索エンジンを構築しようとしている。
カナダのYellow Pages(以下YP)は、デジタル化プログラムに250万カナダドルを超える予算を投じ、Google、Facebook、Yellなどのグローバル規模の情報プロバイダーに対抗しようとしている。
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 2014年2月19日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
YPは印刷物として発行していたビジネスディレクトリ(職種別電話帳)のために収集したデータを再利用し、洗練されたデータ管理技術によって、最も正確で汎用的と自認するカナダのビジネス検索サービス「Yellow Pages」をWebで提供している。
「このプロジェクトは、Yellow Pagesの掲載情報の更新を、要求を受け取ってから数日ではなくて数秒で完了するようにするのが目標だ。プロジェクトが完了すれば、ネットで情報を検索する人はカナダの企業について常に最新の情報が得られる」と話すのは、YP Canadaの主任アーキテクト、アンドレ・ボワヴェール氏だ。
「当社のシステムは、印刷システムのついでのような形で構築されていた。従って、必然的に印刷業務がやりやすいようなシステムにしてあった。例えば、逐次処理とバッチ処理が非常に多かった。コンテンツは印刷物の作成のために最適化してあって、オンライン向きではなかった」(同氏)
YPが、オンライン検索サービスと真っ向から張り合える体制に変わるべく自社ITシステムの見直しを始めたのは1年半前のことだ。同社が、自社データベースの情報をソーシャルメディアなどの他社Webサービスと正しく連携させて、カナダの産業界について最も包括的で正確なデータを人々に提供していることを確認するためだった。
YPは、探している情報をユーザーが正確に特定しているか、同一の企業の情報を重複して掲示し、ユーザーを混乱させていないかどうかを確認する方法を見つけたいと考えていた。
2012年5月、同社はさまざまなソフトウェアメーカーが発売している多数のミドルウェアを評価し、その結果、米TIBCOの製品を採用した。YPは、2013年3月にTIBCOのマスターデータ管理(MDM)ソフトウェアの運用を始めた。その後、同年9月にシステムを本格稼働させた。採用の決め手となったのはTIBCO製品の処理速度だったと、ボワヴェール氏は語る。
YPでは、1日に数万件の情報更新要求を受信する。1件ごとに12種類のマッチング規則を使用して、1億6000万件のレコードが収められたデータベースと照合しなければならない。
TIBCOのテクノロジーはIBMのLinuxサーバをベースとしている。これによってYellow Pagesは、ユーザーが探している業界を特定し、その情報に正確に一致したデータをサードパーティーのサービスと自社のデータベースから引用することができるようになった。例えば、ユーザーが地元のピザレストランを探している場合、Yellow PagesはOpenTable(オンラインレストラン予約サービス)やTripAdvisor(旅行サイト)といったサードパーティーが提供しているレストランのレビュー情報、またはFoursquareなどのソーシャルメディアサービスに掲載されている情報を消費者に提供することができる。
「システムの洗練度を高めたので、探している店や会社の場所を正確に突き止められる。例えば誰かがソーシャルメディアで、『ピールストリートとセントキャサリン通りの角にあるレストランだ』と書き込んでいれば、それもYellow Pagesから参照できる」とボワヴェール氏は語る。
「店や企業の名前、住所、電話番号があれば、それを基にデータベースの情報を探し出すのは簡単そうに思えるだろう。ただし、手掛かりにする企業名が略称だったり、情報の一部が欠けていたり、つづりが間違っていたりすることは案外多い」と同氏は付け加える。
ボワヴェール氏によると、通常、MDMシステムは展開するまで1年半はかかるものだが、YPは計算済みのリスクをあえて負うことで、プロジェクトを半年で完了させたという。
本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。
■Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 2月5日号:仮想化コストを増大させる勘違い
Computer Weekly日本語版 1月22日号:Amazon Web Services vs. Google
Computer Weekly日本語版 1月8日号:オープンソースハードウェアになるデータセンター
次世代生成AIで優位に立つのはMeta? Google? それともマスク氏のあの会社?
生成AI時代において、データは新たな金と言える。より人間らしい反応ができるようになる...
GoogleからTikTokへ 「検索」の主役が交代する日(無料eBook)
若年層はGoogle検索ではなくTikTokやInstagramを使って商品を探す傾向が強まっているとい...
B2B企業の市場開拓で検討すべきプロセスを定義 デジタルマーケティング研究機構がモデル公開
日本アドバタイザーズ協会 デジタルマーケティング研究機構は、B2B企業が新製品やサービ...