AIを活用したデータ分析の品質を高めるには、品質や整合性に問題がなく、すぐに分析に利用できるデータをそろえておくことが欠かせない。そこで課題となるのが、データの連携やアクセス、検索性や準備・加工といったステップの効率化だ。
AIを使った高度なデータ分析に取り組む企業の悩みで、人材/予算不足とともに多いのが、データの品質や整合性の問題だ。ある調査によれば、すぐに分析に利用できる“AI Ready”な顧客データは、30%にも満たないことが多いという。これは、プロジェクトごとに分析基盤がバラバラなことに一因があるようだ。
この課題を解消するには、適切なステップを踏んで環境整備を進めることが必要だが、特に改善を急ぎたいのが、ワークロード全体の8割を占める「データ連携・アクセス」「データの検索・信頼性確認」「データの準備・加工」の3つだ。これらの工程に工数がかかる理由としては、データの所在が不明、正確性の欠如、加工処理の複雑さといった要因がある。
そこで本コンテンツでは、そうしたデータの準備を効率化する方法として、ユーザー自身が分析目的に合うデータを探索してアクセスできる「データカタログ」の仕組みを採用した次世代データプラットフォームを紹介する。クラウド/オンプレミスを問わずメタデータを統合管理でき、ビジネス用語からデータを逆引きすることも可能だという、このプラットフォームの全貌を詳しく見ていこう。