データは何の価値も生まない――そう嘆く前に「データガバナンス」を見直そう:データクオリティーを保つ7つのベストプラクティス【第5回】
企業がデータを有効活用する際に重要になるのがデータクオリティーだ。「データガバナンス」がデータクオリティーの維持に有用な理由と、効果的なデータガバナンスの実践方法を解説する。
企業がさまざまなデータソースから集めたデータを有効に活用するには、データクオリティー(データ品質)を高く保ち続けることが不可欠だ。データクオリティーを確保する7つのベストプラクティスのうち、4つ目と5つ目を紹介する。
4.データガバナンスの確保
併せて読みたいお薦め記事
連載:データクオリティーを保つ7つのベストプラクティス
- 第1回:考えなしのデータ集め”は無価値どころか害悪 専門家が語る納得の理由
- 第2回:何の役にも立たない“低品質データ”はこうして生まれる
- 第3回:データの出どころを即答できないなら「データリネージ」を明確にしよう
- 第4回:“低品質データ”を垂れ流し続けないための「SLA」とは
企業のデータマネジメント戦略
ITコンサルティング企業Mindtreeのテクノロジーサービス部門グローバルヘッドであるラーダークリシュナン・ラジャゴパラン氏は、「データガバナンスが非常に重要だ」と述べる。さまざまなデータソースから、さまざまなフォーマットのデータをリアルタイムで重複なく取り込み、データクオリティーを維持できるようにすることが、優れたデータガバナンスのスタート地点だ。
従業員が簡単にデータを見つけられるようにするための、メタデータの保存方法についての戦略も欠かせない。個人情報保護法を順守するために、個人を特定できるデータを保護する必要もある。
ラジャゴパラン氏によると、適切なデータガバナンスの仕組みを導入せずに、データレイクをいっぱいにしてしまったさまざまな企業で、データクオリティーが低下している。その結果「データレイクハウス」への関心が高まっているという。
データレイクハウスは、データウェアハウスの長所である優れたデータガバナンス機能と、データレイクの長所である高い費用対効果を併せ持つデータ保管システムだ。「データレイクを使用している企業は、データクオリティーを低下させていないかどうか、データレイクハウスが本当に正しい手段なのかどうかを判断しなければならない」と同氏は助言する。
5.データガバナンスの自動化
データマネジメントツールベンダーFlureeのCEO兼共同創業者であるブライアン・プラッツ氏は、「データインベントリ(データ一覧)の作成とデータの修正を手作業に依存している場合、データガバナンスに失敗する」と述べる。データが増加した際、手作業では適切な規模と速度でデータを整理できない恐れがあるからだ。
企業はデータガバナンスを自動化することで、データにおける誤りの発生リスクを軽減しながら、分析プロセスを高速化することが望ましい。これには機械学習を活用できる。データガバナンスの自動化は、IT部門の余計な作業を大幅に削減し、データが大規模になってもデータクオリティーを高く保つことに役立つ。
第6回は、6つ目と7つ目のベストプラクティスを紹介する。
TechTarget発 先取りITトレンド
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.