“考えなしのデータ集め”は無価値どころか害悪 専門家が語る納得の理由:データクオリティーを保つ7つのベストプラクティス【第1回】
いまやビジネスにデータは欠かせない。ただし「データは最も価値がある資産だ」という考え方は、必ずしも正しいとは言えないとの声がある。それはなぜなのか。
さまざまなデータを分析したり、ビジネスインテリジェンス(BI)ツールを活用したりするには、データクオリティー(データ品質)を高めることが不可欠だ。本連載はデータクオリティーを向上させ、データパイプライン(さまざまなデータソースからデータを取り込む手段)を構築するためベストプラクティスを紹介する。
“データは最も価値のある資産”ではない?
併せて読みたいお薦め記事
企業のデータマネジメント戦略
データの増加や、データ処理に関する自動化技術の発展は、データパイプラインを滞らせる問題の要因になり得る。軽微に見えた問題が、後に重大な問題につながることがある。
調査会社Nucleus Researchのアナリストであるアレクサンダー・ウルム氏によると、企業はしばしばデータを「最も価値のある資産」と見なす。これは「必ずしも正しい見方ではない」とウルム氏は述べる。
データクオリティーが低いと、不正確な情報がビジネスの成果を低下させる恐れがある。「データが業務を改善するどころか、悪影響を及ぼす可能性さえある」(ウルム氏)。企業はデータリネージ(データの出自や変更履歴)を追跡し、データクオリティーを確保し、無駄なデータを排除するための手順を設定すべきだ。
データクオリティーを確かめる指標
高いデータクオリティーを確保するためには、さまざまな課題に取り組まなければならない。データ分析ツールベンダー1010dataのCTO(最高技術責任者)であるテリー・セージ氏は、「データクオリティーの高低を判断することから始めるべきだ」と述べる。その判断には、データの
- 有効性
- 正確性
- 完全性
- 関連性
- 均一性
- 一貫性
などの特性を考慮する必要がある。
これらの指標を自動で計測できるようになれば、自社の取り組みがもたらす効果を判断しやすくなる。これらの指標は、データクオリティーを高めるプロセスと、それに必要なツールに関する、コストや効果の把握に役立つ。
第2回は、データクオリティーを取り巻く問題を整理する。
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.