検索
特集/連載

“考えなしのデータ集め”は無価値どころか害悪 専門家が語る納得の理由データクオリティーを保つ7つのベストプラクティス【第1回】

いまやビジネスにデータは欠かせない。ただし「データは最も価値がある資産だ」という考え方は、必ずしも正しいとは言えないとの声がある。それはなぜなのか。

Share
Tweet
LINE
Hatena

関連キーワード

データ | データ分析


 さまざまなデータを分析したり、ビジネスインテリジェンス(BI)ツールを活用したりするには、データクオリティー(データ品質)を高めることが不可欠だ。本連載はデータクオリティーを向上させ、データパイプライン(さまざまなデータソースからデータを取り込む手段)を構築するためベストプラクティスを紹介する。

“データは最も価値のある資産”ではない?

 データの増加や、データ処理に関する自動化技術の発展は、データパイプラインを滞らせる問題の要因になり得る。軽微に見えた問題が、後に重大な問題につながることがある。

 調査会社Nucleus Researchのアナリストであるアレクサンダー・ウルム氏によると、企業はしばしばデータを「最も価値のある資産」と見なす。これは「必ずしも正しい見方ではない」とウルム氏は述べる。

 データクオリティーが低いと、不正確な情報がビジネスの成果を低下させる恐れがある。「データが業務を改善するどころか、悪影響を及ぼす可能性さえある」(ウルム氏)。企業はデータリネージ(データの出自や変更履歴)を追跡し、データクオリティーを確保し、無駄なデータを排除するための手順を設定すべきだ。

データクオリティーを確かめる指標

 高いデータクオリティーを確保するためには、さまざまな課題に取り組まなければならない。データ分析ツールベンダー1010dataのCTO(最高技術責任者)であるテリー・セージ氏は、「データクオリティーの高低を判断することから始めるべきだ」と述べる。その判断には、データの

  • 有効性
  • 正確性
  • 完全性
  • 関連性
  • 均一性
  • 一貫性

などの特性を考慮する必要がある。

 これらの指標を自動で計測できるようになれば、自社の取り組みがもたらす効果を判断しやすくなる。これらの指標は、データクオリティーを高めるプロセスと、それに必要なツールに関する、コストや効果の把握に役立つ。


 第2回は、データクオリティーを取り巻く問題を整理する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る