検索
特集/連載

データは何の価値も生まない――そう嘆く前に「データガバナンス」を見直そうデータクオリティーを保つ7つのベストプラクティス【第5回】

企業がデータを有効活用する際に重要になるのがデータクオリティーだ。「データガバナンス」がデータクオリティーの維持に有用な理由と、効果的なデータガバナンスの実践方法を解説する。

Share
Tweet
LINE
Hatena

関連キーワード

データ | データ分析


 企業がさまざまなデータソースから集めたデータを有効に活用するには、データクオリティー(データ品質)を高く保ち続けることが不可欠だ。データクオリティーを確保する7つのベストプラクティスのうち、4つ目と5つ目を紹介する。

4.データガバナンスの確保

 ITコンサルティング企業Mindtreeのテクノロジーサービス部門グローバルヘッドであるラーダークリシュナン・ラジャゴパラン氏は、「データガバナンスが非常に重要だ」と述べる。さまざまなデータソースから、さまざまなフォーマットのデータをリアルタイムで重複なく取り込み、データクオリティーを維持できるようにすることが、優れたデータガバナンスのスタート地点だ。

 従業員が簡単にデータを見つけられるようにするための、メタデータの保存方法についての戦略も欠かせない。個人情報保護法を順守するために、個人を特定できるデータを保護する必要もある。

 ラジャゴパラン氏によると、適切なデータガバナンスの仕組みを導入せずに、データレイクをいっぱいにしてしまったさまざまな企業で、データクオリティーが低下している。その結果「データレイクハウス」への関心が高まっているという。

 データレイクハウスは、データウェアハウスの長所である優れたデータガバナンス機能と、データレイクの長所である高い費用対効果を併せ持つデータ保管システムだ。「データレイクを使用している企業は、データクオリティーを低下させていないかどうか、データレイクハウスが本当に正しい手段なのかどうかを判断しなければならない」と同氏は助言する。

5.データガバナンスの自動化

 データマネジメントツールベンダーFlureeのCEO兼共同創業者であるブライアン・プラッツ氏は、「データインベントリ(データ一覧)の作成とデータの修正を手作業に依存している場合、データガバナンスに失敗する」と述べる。データが増加した際、手作業では適切な規模と速度でデータを整理できない恐れがあるからだ。

 企業はデータガバナンスを自動化することで、データにおける誤りの発生リスクを軽減しながら、分析プロセスを高速化することが望ましい。これには機械学習を活用できる。データガバナンスの自動化は、IT部門の余計な作業を大幅に削減し、データが大規模になってもデータクオリティーを高く保つことに役立つ。


 第6回は、6つ目と7つ目のベストプラクティスを紹介する。

TechTarget発 先取りITトレンド

米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る