検索
特集/連載

データの出どころを即答できないなら「データリネージ」を明確にしようデータクオリティーを保つ7つのベストプラクティス【第3回】

データに基づく意思決定を実現するためには、高いデータクオリティーが必要だ。データクオリティーの向上に「データリネージ」がどう役立つのかを紹介する。

Share
Tweet
LINE
Hatena

関連キーワード

データ | データ分析


 企業がデータを活用する上で注意したいのがデータクオリティー(データ品質)だ。誤りを含んでいたり、欠損要素があったりする低品質なデータは、データに基づく判断に支障を来す。データを高品質に保つための7つのベストプラクティスのうち、2つを紹介する。

1.データリネージの明確化

 IT製品管理ソフトウェアベンダーQuest Softwareのプロダクトマーケティングディレクターであるダニー・サンドウェル氏は、データリネージ(データの出自や変更履歴)を正確かつ分かりやすい形で明確にする必要があると指摘する。

 データリネージの明確化により、企業はデータがどこから来て、転送中にどう変化する可能性があるのかを特定できる。明確化には「データカタログ」が役立つ。データカタログはデータのメタデータ管理やデータリネージの分析を可能にする。

2.データリネージの継続的な追跡

 企業のデータパイプライン(さまざまなデータソースからデータを取り込む手段)は、複数のデータソース、変換方法、技術が複雑に絡み合っている。データクオリティーに問題があった場合、企業はその原因を特定するために、時間を浪費してしまう。この問題を解消するために役立つのが、データリネージ分析ツールだ。企業はデータリネージ分析ツールを使うことで、データクオリティー低下の根本的な原因と影響を迅速に特定しやすくなる。

 調査会社Nucleus Researchのアナリストであるアレクサンダー・ウルム氏によると、データクオリティーを確保するためのデータリネージの重要性が、企業の間に広がりつつある。企業はデータリネージ分析ツールを導入する前の段階で、データ活用プロセスの初期フェーズにおいて将来的な課題に対処できるよう、データリネージのロードマップ策定を優先すべきだ。


 第4回は、3つ目のベストプラクティスを紹介する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る