Googleでは実現しない特化型検索サービスの世界特定分野・用途向け検索サービス【前編】

Googleの検索エンジンがいかに優れていても、汎用的であるが故に限界がある。一方で特殊な用途や特定の業界に特化することによってしか実現しない検索サービスが存在する。

2020年01月20日 08時00分 公開
[SA MathiesonComputer Weekly]

 汎用検索エンジンにはプライバシーが損なわれるという欠点がある。特に市場を独占するGoogleはこの点が顕著だ。とはいえ、DuckDuckGoのようにプライバシーに配慮する検索エンジンもある。

 専門情報を探すユーザーはさらに差し迫った課題に直面する。例えば、特定種類の資料を探すのは難しい。検索用語の扱いが不適切なこともある。専門的に重要なパラメーターを設定できないことも、言語以外の資料を扱う方法がないこともある。こうした問題を解決するには、汎用検索エンジンを上回る、より重点を絞ったサービスが必要になる。

 Jiscは会員、英国の大学、高等教育機関、調査機関、それらが所有する図書館に技術サービスを提供する非営利団体だ。Jiscは2019年7月、さまざまな機関の133の図書目録を基にした4100万件のレコードを含むデータベース「National Bibliographic Knowledgebase」(NBK)の開発を完了した。

 Jiscのリソース検索責任者を務めるニール・グリンドリー氏は、学生が1つの検索ボックスを使い慣れていることに触れ、次のように語った。「Googleは万人が使いやすい検索だとされている。Library Hub Discoverの検索結果は全て、大学図書館や学術図書館が所有するコンテンツだ。非常に広大だが限られた範囲を検索する」

 同氏によると、これが重要だという。汎用検索エンジンはそうした資料を検索に含めることが不得意だからだ。「図書館はオープンなWebに対しては存在感を示せていない。当機関が切り込みたいのはこうした分野だ」と同氏は補足する。

 JiscはNBKに基づく独自のサービスを提供するだけでなく、基盤となるデータを公開し、検索エンジンがそのデータを使って機関の図書目録に直接リンクできるようにしている。

有料検索

 Jiscはオープンに検索できるコンテンツの質を強化しようとしている。一方、商用プロバイダーは一般に、ナレッジベース担当者の効率を向上させる検索と検出の有料システムを開発している。弁護士や会計士向け出版物など、購読者が限定される情報にアクセスできるようにしたり、機械学習を使ってキーワードに基づく検索を強化したりしている。

 英ロンドンを拠点とするSignal AIは、顧客向けに管理される資料に、有料無料を問わず何万もの「分類子」を適用する。この分類子は出版物やブログで使われるタグと同等のもので、ブランド、国、人、トピックをカバーする。分類子を選択するのは人ではなく、機械学習でトレーニングされたシステムだ。そのため分類子の適用には1分もかからない。顕著な特徴など、他の指標も考慮する。

 2019年夏、Signal AIはDeloitteとの契約締結を発表した。これによりDeloitteは、100を超える法域における規制関連情報や世界中のメディア情報を監視するサービスを顧客に提供できるようになった。このサービスは、Deloitteの支援によってトレーニングされた分類子を使うことで国別の用語の違いにかかわらず、特定種類の課税に関する資料をグループ化する。結果は通常のメールニュースレターとして送信される。

 Signal AIの当初の事業はメディアの監視だったが、コンプライアンス、リスク、上級管理に携わる企業に対するサービス提供へと事業を拡大している。同社で製品担当バイスプレジデントを務めるエイミー・コリンズ氏は、販売、製品管理、エンジニアリングの分野にさらなる可能性があると考えている。汎用検索エンジンでも洗練されたクエリを構築できるが、複雑になり信頼性が低下する恐れがあるという。

 「これを機械学習で解決している。検索の問題を非常にシンプルにした」(コリンズ氏)

 同社は「Vulcan」というシステムによって、ユーザーが独自の分類子をトレーニングすることも可能にする。同氏はこのシステムを「AI向けの火口」と呼んでいる。ユーザーが出力を受け入れるか拒否することで検索を改善できるためだ。

後編(Computer Weekly日本語版 1月22日号掲載予定)では、報道機関向けなどの特定業種に特化した検索サービスや文字情報以外のデータ(画像、位置情報)の検索サービスを紹介する。

ITmedia マーケティング新着記事

news141.jpg

2度あることは3度あった GoogleのサードパーティーCookie廃止再延期にアドテク各社がコメント
Googleは2024年末までに完了する予定だったWebブラウザ「Chrome」でのサードパーティーCo...

news148.jpg

天候と位置情報を活用 ルグランとジオロジックが新たな広告サービスを共同開発
ルグランとジオロジックが新たな「天気連動型広告」を共同開発した。ルグランが気象デー...

news130.jpg

“AI美女”を広告に起用しない ユニリーバ「Dove」はなぜそう決めたのか
Unilever傘下の美容ケアブランド「Dove」は、「Real Beauty」の20周年を機に、生成AIツー...