ビジネスにデータを活用する上で、高いデータクオリティーを確保することは重要だ。何がデータクオリティーを左右するのか。なぜデータの質が悪くなってしまうのか。それらに対する答えを提示する。
データクオリティー(データ品質)は重要だ。「低品質のデータは、資金の投入先を誤るなどの間違った意思決定につながることがある」と、データ分析ツールベンダー1010dataのCTO(最高技術責任者)であるテリー・セージ氏は言う。不正確もしくは無効なデータは、セキュリティインシデントの誤検出を招くなど、業務に悪影響を与える可能性がある。
正しい視点を持ってデータの重複排除や修正、検証ができたかどうか、どの程度うまく実行できたかでデータクオリティーの高低が決まる。高品質のデータは、使用目的に適合していれば、より良い意思決定と成果をもたらす。低品質のデータは、顧客や消費者の信頼を低下させる恐れがある。データが誤りだらけだと、修正に時間と人手を浪費する。
「低品質なデータによって、企業はビジネス判断を誤り、販売機会や顧客を喪失しかねない」。ITコンサルティング企業Mindtreeのテクノロジーサービス部門グローバルヘッドであるラーダークリシュナン・ラジャゴパラン氏は、そう述べる。
データパイプライン(さまざまなデータソースからデータを取り込む手段)がデータクオリティーに与える影響はさまざまだ。データを集約する経路が増えるほど、次の2つの要因によってデータクオリティーを保つのが難しくなる。
1つ目は、データソースからデータレイクやデータウェアハウスにデータを転送する際に、データが失われたり、重複したりする可能性があることだ。例えばクラウドサービスからデータを送信する際、システムの問題により、しばしばデータの送信漏れが発生する恐れがある。
2つ目は、データソースのシステムにおけるデータに想定外のばらつきがあり、転送先のシステムにおいてデータクオリティーの問題が発生することだ。データタイプ変更といったデータモデルのわずかな変更でも、転送先システムにデータの大きなばらつきをもたらす可能性がある。
第3回からは、データクオリティーを確保するための7つのベストプラクティスを紹介する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
OpenAI、Google、etc. 第59回スーパーボウルで賛否が分かれた“微妙”CMたち
スーパーパーボウルLIXでは、有名人やユーモア、政治を前面に押し出した広告について、賛...
「単なるスポーツ広告ではない」 Nikeの27年ぶりスーパーボウルCMは何がすごかった?
Nikeが27年ぶりにスーパーボウルCMに復帰し、注目を集めた。
Z世代と上の世代で利用率の差が大きいSNSトップ3 1位「TikTok」、2位「Instagram」、3位は?
サイバーエージェント次世代生活研究所が実施した「2024年Z世代SNS利用率調査」の結果が...