データの検索性を低下させる「表記ゆれ」、解決に役立つ同義語辞書の作り方株式会社SCREENアドバンストシステムソリューションズ提供Webキャスト

データは今やビジネスの推進に欠かせない存在となっているが、「社内データベースやサーバを検索しても、あるはずの情報が見つからない」という声はよく聞かれる。この問題の原因となる「表記ゆれ」に対応するには、何が必要か。

2022年11月16日 10時00分 公開
[ITmedia]

 社内に蓄積されたデータを検索する際、大きな阻害要因となる「表記ゆれ」。例えば「トラブル」という言葉1つ取っても、不具合や欠陥、障害など、多くの同義語が存在するため、社内データベースやサーバを検索しても、あるはずの情報が見つからないという問題が発生する。

 そのため検索システムには、社内特有の専門用語に対応した同義語辞書の適用が欠かせないが、その作成は容易ではなく、3〜6カ月という膨大な時間がかかる。そこで注目したいのが、AIを活用した同義語辞書・用語集作成システムだ。大量の文書を読み込ませることで同義語辞書のひな型を自動生成する点が特徴で、それを人の手で編集すれば、より精度の高い同義語辞書を1〜2週間で作成できる。

 また英文にも対応しており、複合語や略称も同義語として判定が可能だという。本動画では、同システムの特徴や処理の流れをより詳しく解説する他、実際の操作画面を見ながら使い方を紹介していく。表記ゆれへの対応や検索精度の向上、辞書作成の工数削減などを目指す企業は、ぜひ参考にしてほしい。

Copyright © ITmedia, Inc. All Rights Reserved.