企業がデータを有効活用する際に重要になるのがデータクオリティーだ。「データガバナンス」がデータクオリティーの維持に有用な理由と、効果的なデータガバナンスの実践方法を解説する。
企業がさまざまなデータソースから集めたデータを有効に活用するには、データクオリティー(データ品質)を高く保ち続けることが不可欠だ。データクオリティーを確保する7つのベストプラクティスのうち、4つ目と5つ目を紹介する。
ITコンサルティング企業Mindtreeのテクノロジーサービス部門グローバルヘッドであるラーダークリシュナン・ラジャゴパラン氏は、「データガバナンスが非常に重要だ」と述べる。さまざまなデータソースから、さまざまなフォーマットのデータをリアルタイムで重複なく取り込み、データクオリティーを維持できるようにすることが、優れたデータガバナンスのスタート地点だ。
従業員が簡単にデータを見つけられるようにするための、メタデータの保存方法についての戦略も欠かせない。個人情報保護法を順守するために、個人を特定できるデータを保護する必要もある。
ラジャゴパラン氏によると、適切なデータガバナンスの仕組みを導入せずに、データレイクをいっぱいにしてしまったさまざまな企業で、データクオリティーが低下している。その結果「データレイクハウス」への関心が高まっているという。
データレイクハウスは、データウェアハウスの長所である優れたデータガバナンス機能と、データレイクの長所である高い費用対効果を併せ持つデータ保管システムだ。「データレイクを使用している企業は、データクオリティーを低下させていないかどうか、データレイクハウスが本当に正しい手段なのかどうかを判断しなければならない」と同氏は助言する。
データマネジメントツールベンダーFlureeのCEO兼共同創業者であるブライアン・プラッツ氏は、「データインベントリ(データ一覧)の作成とデータの修正を手作業に依存している場合、データガバナンスに失敗する」と述べる。データが増加した際、手作業では適切な規模と速度でデータを整理できない恐れがあるからだ。
企業はデータガバナンスを自動化することで、データにおける誤りの発生リスクを軽減しながら、分析プロセスを高速化することが望ましい。これには機械学習を活用できる。データガバナンスの自動化は、IT部門の余計な作業を大幅に削減し、データが大規模になってもデータクオリティーを高く保つことに役立つ。
第6回は、6つ目と7つ目のベストプラクティスを紹介する。
米国TechTargetの豊富な記事の中から、最新技術解説や注目分野の製品比較、海外企業のIT製品導入事例などを厳選してお届けします。
Copyright © ITmedia, Inc. All Rights Reserved.
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...